Окремі випадки задач оптимального стохастичного керування

Поняття та властивості зовнішнього інтегралу. Математичні сподівання випадкової величини. Припущення монотонності. Аналіз основних задач послідовної оптимізації, що становлять практичний інтерес. Детерміноване оптимальне керування, його функції.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид реферат
Язык украинский
Дата добавления 25.11.2010
Размер файла 133,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

ОКРЕМІ ВИПАДКИ ЗАДАЧ ОПТИМАЛЬНОГО СТОХАСТИЧНОГО КЕРУВАННЯ

1. Зовнішній інтеграл

Функції і можуть бути довільними, а математичні сподівання можна обчислювати, якщо як функція від є вимірною.

Якщо ж оптимальна стратегія, отримана в результаті оптимізації, виявиться невимірною, то і функція може виявитися невимірною. У цьому випадку математичне сподівання невизначено.

Для розв'язання цієї проблеми застосовують два підходи. Перший полягає в накладенні на функції і таких обмежень, які забезпечували б вимірність підінтегральної функції на кожному кроці оптимізації : функції і , , повинні бути неперервними по своїх аргументах і повинна існувати щільність імовірності розподілу випадкової величини , а множини значень припустимих стратегій повинні бути компактними.

На жаль, на практиці ці вимоги не завжди виконуються. Тому другий підхід пов'язаний з використанням зовнішнього інтеграла.

Позначимо через простір елементарних подій, що є довільною множиною, а - деяка система підмножин множини .

Математичним сподіванням випадкової величини , заданої на імовірнісному просторі , називається число , якщо інтеграл з правої частини існує.

Нехай і - борелівські простори, , є -алгеброю в . Функція називається -вимірною, якщо для будь-якої множини . Тут - борелівська -алгебра простору .

Для функції , () зовнішній інтеграл за мірою визначається як нижня грань інтегралів від всіх вимірних функцій (), що мажорують , тобто

, .

Тут - функція розподілу випадкової величини , що відповідає ймовірнісній мірі .

Для довільної функції має місце співвідношення:

,

де , , і вважають, що .

Оскільки зовнішній інтеграл визначений для будь-якої функції, як для вимірної, так і для невимірної, то ніяких додаткових обмежень на функції і накладати не треба.

Для вимірних функцій обидва види математичних сподівань співпадають. Отже, у постановках задач можна замінити звичайне математичне сподівання на зовнішнє, і навіть якщо знайдена при цьому функція виявиться вимірною, то отримана стратегія керування не перестане бути оптимальною.

Зовнішня міра множини визначається співвідношенням .

Для будь-якої множини

,

де - це індикатор множини , що визначається як

а) якщо , то ;

б) якщо і , то ;

в) якщо або , то ;

г) якщо задовольняє рівності , то для будь-якої функції має місце рівність ;

д) якщо , то для будь-якої функції ;

е) якщо і , то . Якщо при цьому хоча б одна з функцій або -вимірна, то останнє співвідношення вірно зі знаком рівності.

Позначимо через дійсну пряму, а через - розширену дійсну пряму і надалі у всіх висновках замість дійсної прямої використовуватимемо поняття розширеної дійсної прямої.

Вважатимемо, що для розширеної дійсної прямої мають місце всі співвідношення порядку додавання і множення, які було введено для , і припустимо, що і .

Позначимо через множину всіх дійсних у розширеному розумінні функцій , де - простір станів.

- банахів простір всіх обмежених дійсних функцій з нормою, що визначається за формулою

, .

Позначатимемо , якщо , , і , якщо , , .

Для будь-якої функції і будь-якого числа позначимо через функцію, що приймає значення в кожній точці , так, що

, .

Припущення монотонності. Для будь-яких станів , керування і функцій мають місце нерівності

якщо і ;

, якщо і ;

, якщо , і .

Для будь-якого стратегія називається -оптимальною при горизонті , якщо

і -оптимальною, якщо

Багато задач послідовної оптимізації, що становлять практичний інтерес, можуть розглядатися як окремі випадки задач загального виду. Розглянемо деякі з них:

· задачі детермінованого оптимального керування;

· задачі стохастичного керування зі зліченним простором збурень;

· задачі стохастичного керування із зовнішнім інтегралом;

· задачі стохастичного керування з мультиплікативним функціоналом витрат;

· задачі мінімаксного стохастичного керування.

2. Детерміноване оптимальне керування

Розглянемо відображення , що задане формулою

, , , (1)

за таких припущень:

функції і відображають множину відповідно в множини і , тобто , ; скаляр додатний.

За цих умов відображення задовольняє припущенню монотонності. Якщо функція дорівнює нулю, тобто , , то відповідна -крокова задача оптимізації (1) набуває вигляду:

, (2)

. (3)

Ця задача є задачею детермінованого оптимального керування зі скінченним горизонтом. Задача з нескінченним горизонтом має наступний вигляд:

, (4)

. (5)

Границя в (4) існує, якщо має місце хоча б одна з наступних умов:

· , , ;

· , , ;

· , , , і деякого .

У задачі (4) - (5) може бути уведене додаткове обмеження на стан системи , . У такому разі, якщо , позначатимемо .

3. Оптимальне стохастичне керування: зліченний простір збурень

Розглянемо відображення , що задане формулою

, (6)

за таких припущень:

параметр приймає значення зі зліченної множини з заданим розподілом ймовірностей , що залежать від і ; функції і відображають множину відповідно в множини і , тобто , ; скаляр додатний.

Якщо , , - елементи множини , - довільний розподіл ймовірностей на , а - деяка функція, то математичне сподівання визначається за формулою

,

де ,

,

.

Оскільки , то математичне сподівання визначене для будь-якої функції і будь-якого розподілу ймовірностей на множині .

Зокрема, якщо , ,… - розподіл ймовірностей на множині , то формулу (6) можна переписати так:

При використанні цього співвідношення треба пам'ятати, що для двох функцій , рівність має місце, якщо виконується хоча б одна з трьох умов:

та ;

та ;

та .

Відображення задовольняє припущенню монотонності. Якщо функція - тотожний нуль, тобто , , то за умови , , функцію витрат за кроків можна подати у вигляді:

(7)

де , .

Ця умова означає, що математичне сподівання обчислюється послідовно по всіх випадкових величинах .

При цьому зміна порядку операцій додавання і узяття математичного сподівання припустима, тому що , , і для довільних простору з мірою , вимірної функції і числа має місце рівність .

Якщо виконується одна з двох нерівностей

або

,

то функцію витрат за кроків можна записати у вигляді:

,

де математичне сподівання обчислюється на добутку мір на , а стани , , виражаються через за допомогою рівняння .

Якщо функція допускає подання у такому вигляді для будь-якого початкового стану та будь-якої стратегії , то -крокова задача може бути сформульована так:

, (8)

. (9)

Відповідна задача з нескінченним горизонтом формулюється так:

, (10)

. (11)

Границя в (10) існує при виконанні будь-якої з трьох наступних умов:

· , , , ;

· , , , ;

· , , , , і деякого .

Математичне сподівання визначається і як звичайний інтеграл, і як зовнішній інтеграл з -алгеброю в множині , що складається із всіх підмножин , в залежності від вимірності або невимірності функцій.

Для багатьох практичних задач виконується припущення про зліченність множини .

Якщо ж множина незліченна, то справа ускладнюється необхідністю обчислення математичного сподівання

для будь-якої функції . Подолання цих труднощів і пов'язане з використанням зовнішнього інтеграла.


Подобные документы

  • Задача оптимального керування системою. Критерії якості в детермінованих дискретних задачах. Види функцій керування стохастичною системою. Еволюція стохастичної системи. Марковські та напівмарковські позиційні стратегії. Алгоритм розв’язання задачі.

    реферат [130,8 K], добавлен 28.11.2010

  • Визначення залежності від часу закону руху у випадку неавтономної системи. Дослідження поведінки функції Понтрягіна в режимі оптимального керування та оптимальної швидкодії. Застосування умов трансверсальності для розв'язку задач із рухомими кінцями.

    реферат [73,2 K], добавлен 04.12.2010

  • Теорія оптимального керування; об’єкт як система, що функціонує під впливом певного фактора, здатного регулювати її еволюцію. Крайові умови задачі оптимального детермінованого керування. Числові характеристики критеріїв якості. Задачі з дискретним часом.

    реферат [107,8 K], добавлен 25.11.2010

  • Обґрунтування вибору функціональної схеми системи підпорядкованого керування електроприводом. Призначення і склад приводу ЕТ-6. Розрахунок основних параметрів електродвигуна. Аналіз статичних характеристик. Моделювання контуру швидкості електропривода.

    курсовая работа [2,3 M], добавлен 10.04.2013

  • Основні властивості й функціональне призначення елементів системи автоматичного керування (САК). Принцип дії та структурна схема САК. Дослідження стійкості початкової САК. Синтез коректувального пристрою методом логарифмічних частотних характеристик.

    контрольная работа [937,5 K], добавлен 19.05.2014

  • Огляд математичних моделей для системи керування мобільними об'єктами. Постановка задачі керування радіокерованим візком. Розробка структури нечіткої системи керування рухом та алгоритму програмного модуля. Аналіз результатів тестування програми.

    курсовая работа [903,9 K], добавлен 03.07.2014

  • Функції чутливості системи за параметром адаптації. Синтез блоку адаптації, який забезпечив би відповідну корекцію коефіцієнта зворотного зв'язку з метою компенсації зміни вихідної величини. Моделювання адаптивної системи керування градієнтним методом.

    контрольная работа [3,1 M], добавлен 31.03.2014

  • Розробка схем розпізнавання бінарних та напівтонових зображень, електро-функціонального блоку керування, аналізатора симетричності та алгоритму блока первинного центрування з метою оптимізації пристрою керування для системи ідентифікації зображень.

    курсовая работа [1,0 M], добавлен 19.01.2010

  • Автоматична система як сукупність пристроїв, що забезпечують процес керування; основні елементи: об'єкт, керуючий пристрій. Класифікація систем радіоавтоматики, математичний опис, диференціальні рівняння елементів АС, статичні і динамічні властивості.

    реферат [209,4 K], добавлен 25.11.2010

  • Функції розподілу ймовірностей вищих порядків та випадкових процесів, статистичний зв'язок між ними; кореляційні моменти. Стаціонарні та ергодичні випадкові процеси, їх реалізація з однаковими часовими залежностями математичного сподівання та дисперсії.

    реферат [140,7 K], добавлен 10.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.