Задачи управления безопасным движением при встрече с препятствием и выбор метода решения

Особенности управления безопасным движением при встрече с препятствием. Анализ оптимального регулятора при переменной и заданной функции штрафов без контроля безопасности движения. Место безопасности движения в реконфигурации процесса обхода препятствия.

Рубрика Транспорт
Вид дипломная работа
Язык русский
Дата добавления 07.02.2013
Размер файла 1,8 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

При управлении подвижными объектами различного класса, такими как наземный городской транспорт, летательные аппараты при маловысотном полете, речные и морские суда, возникает проблема обеспечения безопасности движения при встрече с различными препятствиями. Существующие методы автоматического управления позволяют синтезировать структуры линейных регуляторов в аналитической форме, однако они не дают оценки степени риска при опасном сближении с препятствием.

Между тем при ручном управлении человек испытывает реальные ощущения нарастания тревоги в случае недопустимого снижения безопасности движения, что вызывает последующую перестройку способа обхода препятствий. Поэтому целью настоящей работы являет воспроизведения поведения человека путем количественной оценки текущего риска в движении с помощью предложенной системы контроля и, главное, последующей перестройки системы управления на примере обхода препятствий при встречном движении.

1. Постановка задачи управления безопасным движением при встрече с препятствием и выбор метода решения

1.1 Динамическое программирование

Метод динамического программирования, разработанный в 50-х годах американским математиком Р.Беллманом, представляет собой новый подход к решению вариационных задач. Идея этого подхода состоит в том, что оптимальное поведение рассматривается как функция состояния системы, описываемого с помощью значения фазовых координат в текущий момент времени t. Беллман очень точно подметил связь между причинностью и оптимальностью для динамических систем в том смысле, что если изменение состояния любой динамической системы под воздействием входного управляющего сигнала можно описать функциональным уравнением, характеризующим причинность

то у оптимальной системы для описания изменения ее состояния, характеризуемого некоторой функцией как степень достижения подавленной цели, существует по аналогии такого же типа функциональной уравнение лишь с той разницей, что достигается минимум или максимум целевой функции при выборе управления :

При этом выбор управления на отдельном шаге производится с точки зрения интересов не только данного шага, но и всего процесса в целом, как на текущем, так и на всех последующих шагах.

Исходя из этого, Беллманом был сформулирован принцип оптимальности: каковы бы ни были начальное состояние и начальное управление, последующие управления должны быть оптимальными относительно состояния, являющегося результатом применения первого управления. Принцип оптимальности можно также сформулировать следующим образом: оптимальное поведение не зависит от предыстории системы, а определяется только начальным (к данному моменту времени) условием и конечной целью, и текущее управление должно выбираться с учетом последствий в будущем. Классическим примером оптимального поведения является стратегия бегуна на дальнюю дистанцию. На старте бегун составляет график своего бега так, чтобы пройти дистанцию за минимальное время. Это не значит, что каждый участок он должен бежать как можно быстрее. Наоборот, находясь на дистанции, он в каждый момент времени должен распределять свои силы так, чтобы с учетом своего состояния пробежать оставшийся участок за минимальное время, чему может соответствовать и бурный финиш в конце дистанции.

Динамическому программированию органически присуще решение задач, дискретных по своей природе в силу рекуррентности последовательного выбора управления в многошаговой процедуре оптимизации. Заметим, что принцип оптимальности справедлив как для непрерывных детерминированных, так и для стохастических процессов управления, благодаря чему динамическое программирование может широко применяться в ряде кибернетических задач.

Несмотря на кажущуюся простоту принципа оптимальности из него можно вывести ряд нетривиальных условий оптимальной траектории.

1.1.1 Дискретная форма динамического программирования

Изучение метода начнем с решения одномерной задачи, когда управляемый автономный одномерный объект описывается либо в дискретной форме

либо в дифференциальной форме

которой соответствует разностное уравнение

где u -- ограниченное в общем случае управление, т.е. ; Дt -- дискрет времени, равный .

При заданном начальном состояний объекта и свободном правом конце необходимо за фиксированное время обеспечить минимум заданного функционала

или в виде аддитивной целевой функции

Таким образом, J есть функция (к + 1) выбираемых переменных , присутствующих в (к +1) уравнениях связи, т.е. можно попытаться решить задачу с помощью множителей Лагранжа. Однако это сложно из-за большой размерности задачи, поэтому применим иной подход.

Выведем сначала функциональное уравнение Беллмана, рассуждая следующим образом. Пусть минимизируемое значение функционала J в начальный момент времени определенным образом зависит от начального состояния системы, т.е. от t0 и x(t0). Обозначим эту зависимость через , называемую функцией Беллмана, понимая под этим не любое значение функционала, а его минимум при оптимальном поведении системы.

Представим теперь, что система функционировала некоторое время , в результате чего к моменту она пришла в новое состояние . Тогда, согласно принципу оптимальности, оставшееся значение минимизируемого функционала

как результат последующих оптимальных действий есть также функция Беллмана , но уже зависящая от новых значений x(t1) и t1. Теперь осталось связать функции и друг с другом, представив последствия от выбираемого управления в промежуток времени в виде двух слагаемых -- потерь внутри данного шага и потерь на всех последующих шагах вплоть до конца решения задачи, зависящих от , потому что последствия в будущем определяются новым состоянием , которое описывается выражением

Поэтому, преследуя цель минимизации суммарных потерь, как текущих так и последующих, можно записать:

Рассуждая аналогичным образом при переходе к следующему шагу от момента к моменту и т.д. к моменту , можно записать следующее функциональное уравнение:

Развивая этот же подход применительно к многомерному неавтономному объекту, можно получить функциональное уравнение Беллмана:

Пошаговый выбор управления с помощью уравнения (1.5) удобен для расчетов на ЭВМ. В этом случае численное решение обычно осуществляют с правого конца задачи. Поскольку краевые условия на правом конце не определены однозначно, то расчеты начинают, задавшись множеством значений вектора , разбивая, например, диапазон возможных значений на R- 1 участков. В результате для каждого из Rn вариантов конечного состояния определяется единственное управление на последнем шаге (в предположении, что управления на остальных шагах будут найдены позже), поскольку при заданном только от него зависит последнее слагаемое в функции (1.3):

Эта операция проводится также численно, например путем разбиения каждого из диапазонов возможных значений и на ( М -1 ) участков, что образует вариантов управления. Результаты наилучшего варианта запоминаются, а именно для каждого из вариантов фиксируются три величины -- вектор состояния , оптимальное управление и минимум целевой функции . Таким образом, в памяти ЭВМ хранится чисел.

На следующем шаге, являющемся уже типичным для расчетов, снова формируются варианты состояния , а затем для каждого из них численно определяется управление , но уже исходя из минимума суммы двух слагаемых, причем второе слагаемое отыскивается в памяти ЭВМ в соответствии с переходом из B ;

Где

Результаты расчета для нового шага также запоминаются в ЭВМ. Эта процедура повторяется, двигаясь от конца к началу для всех шагов,
кроме первого. При этом необходимый объем памяти непрерывно растет. Наконец на первом шаге, воспользовавшись единственным вариантом заданного начального состояния, численно определяют оптимальное управление , но именно ради этого необходимо было запомнить итоги оптимизации на втором шаге, а это приводит к необходимости помнить результаты на предыдущих шагах.

Теперь, поскольку управление найдено и, значит, определено значение , представляющее собой минимизируемое значение функционала, осталось выявить конкретные значения , соответствующие данной оптимальной траектории. Для этого на основании уравнения (1.7) и известного управления определяется состояние , которому соответствует свое запомненное управление . Продолжая теперь движение слева направо, последовательно восстанавливают всю программу управления и оптимальную траекторию за все к шагов.

Рис 1.1 Иллюстрация численного решения с правого конца задачи при дискретной форме динамического программирования

Рассмотренным методом решаются задачи, когда на правом конце часть фазовых координат закреплена. Например, на рис. (1.1) представлен случай перехода из точки А в точку В с произвольной конечной скоростью; Тогда движение справа налево, как это показано на рис. (1.1), при к = 3 требует переменного объема запоминаемых результатов, поскольку по координатам x1 и x2 вначале оценивается малое число вариантов, а потом число растет, вплоть до момента достижения точки А. При этом основное содержание расчета на каждом шаге остается прежним.

Нужно отметить, что, несмотря на определенную утомительность рассмотренной вычислительной процедуры, метод динамического программирования сводит задачу минимизации функции переменных отдельным шагам расчетами минимизации функции Беллмана, зависящей только от г переменных. Это экономит время расчета, требуя, правда, значительного объема памяти ЭВМ. Достоинством метода при численных расчетах является также и снижение объема вычислений при сужении области допустимых управлений или допустимого множества значений . Однако с увеличением размерности задачи дискретизация увеличивает число вариантов расчета запоминаемых результатов в степени n, что известно как «проклятие размерности», и требует иных подходов к применению динамического программирования.

1.1.2 Непрерывная форма динамического программирования

Принцип оптимальности Беллмана дает достаточно общее условие, которое можно применять как для дискретных, так и для непрерывных систем управления.

Рассмотрим следующий предельный случай, когда дискрет времени бесконечно мал, т.е. . Обратимся к функциональному уравнению Беллмана для одномерного объекта, заменив в нем дискретный момент времени ( на текущее время ) и согласно (1.2) и (1.3) функции и соответственно на и . Тогда можно получить выражение

При этом функция S во втором слагаемом правой части уравнения также имеет бесконечно малые приращения. Допустим, что функция Беллмана S непрерывна и, кроме того, существуют частные производные . Тогда можно разложить функцию ряд Тейлора в точке (х,t) и, пренебрегая членами второго порядка малости, получить

Заметим, что последнее слагаемое может быть учтено, если переменная х (t) есть случайный процесс, в котором присутствует составляющая типа белого шума с бесконечно большой дисперсией D, равной где -- коэффициент диффузии. Подставим полученный результат в правую часть уравнения (1.8). С учетом того, что функции и от управления на зависят как результаты уже проведенной оптимизации и могут быть вынесены за фигурные скобки, уравнение (3.8) можно представить в виде

Перенеся первые два члена в левую часть, разделим уравнение на :

Последними двумя слагаемыми при можно пренебречь из-за их малости. Тогда с учетом случайного характера оптимизируемого процесса получим уравнение.

.

Если рассматривать детерминированный случай при и, наконец, исследовать поведение системы с п координатами и r управлениями ,то можно получить известное уравнение Беллмана в частных производных

Очень важно подчеркнуть, что уравнение Беллмана (1.10) является нелинейным дифференциальным уравнением, поскольку в нем присутствует операция минимизации. В векторной форме его можно записать так:

Где,

Поясним теперь смысл слагаемых, входящих в правую часть уравнения (1.10). Первое слагаемое характеризует потери на текущем шаге, второе слагаемое в виде суммы членов оценивает последствия от принятого решения в будущем. Причем каждый член учитывает изменение текущего состояния по координате xi, возникающее за счет управления , с помощью производной , которая умножается на свой весовой коэффициент . Таким образом, производные есть своего рода «коэффициенты чувствительности» оставшегося значения минимизируемого функционала к изменениям текущих значений фазовых координат . Это соображение иллюстрирует дальновидность метода и оживляет представление о функции Беллмана как о некоторой функции отклика критерия оптимальности на измененные вектора состояния . Часто в технических задачах можно физически уяснить себе характер зависимости функции S от фазовых координат системы. Поэтому удается найти управление в функции от состояния фазовых координата , что позволяет прийти к замкнутой системе управления с обратной связью и тем самым ускорить решение задачи, что будет показано ниже в примерах.

С помощью динамического программирования можно решать задачи и с незакрепленным временем управления . В частности, для автономных систем можно получить уравнение Беллмана в виде

где функция от времени не зависит. Для задач максимального быстродействия в уравнении (1.11) нужно ввести замену .

В заключение отметим, что вывод уравнений (1.10) и (1.11) требовал дифференцируемости функции S. Однако существуют задачи, где эта функция не является дифференцируемой, а оптимальное управление существует. Поясним на примере, что на линии переключения функция S всегда недифференцируема.

1.1.3 Связь динамического программирования с вариационным исчислением и принципом максимума

Метод динамического программирования носит более универсальный характер, чем методы, основанные на принципе максимума и вариационном исчислении, поскольку он был разработан для оптимального управления процессами, не обязательно описываемыми системой дифференциальных уравнений. Вместе с тем этот метод не имеет строгого обоснования в ряде случаев по сравнению с принципом максимума и вариационным исчислением, хотя и тесно связан с ними.

Связь метода динамического программирования с вариационным исчислением. Пусть целевая функция зависит от скорости изменения фазовых координат. Тогда уравнение (1.10) можно записать в виде

Продифференцируем уравнение (1.12) по с учетом того, что функция Беллмана от не зависит:

Затем запишем полную производную по t:

Продифференцируем теперь уравнение (1.14) по ;

Вычитая из полученного результата предыдущее уравнение, приходим к уравнению Эйлера в вариационном исчислении

Заметим, это соотношение было получено в предположении о непрерывности частных производных второго порядка.

Пусть теперь граничное условие задачи в конечный момент времени есть соотношение

Тогда с учетом равенства (1.13) получим из (1.12) следующее соотношение, идентичное условию задачи с подвижным концом в вариационном исчислении:

Кроме того, можно убедиться, что уравнение (1.13) есть необходимое условие минимума для выражения в правой части (1.13), поскольку, во-первых, уравнение (1.13) есть частная производная от этого выражения по , приравненная к нулю. Во-вторых, дифференцируя по уравнение (1.13) вторично и учитывая равенство нулю производной от первого слагаемого, получаем еще одно необходимое условие минимума, состоящее в положительной определенности матрицы частных производных второго порядка, что совпадает с условием Лежандра в вариационном исчислении.

Можно также показать, что если экстремум в точке совпадает с абсолютным минимумом, т.е.

то это соответствует известному условию Вейерштрасса.

Связь метода динамического программирования с принципом максимума. Геометрическая интерпретация динамического программирования. Связь с функцией Ляпунова. Классическое описание данной взаимосвязи строится на том, что из уравнений динамического программирования при определенных допущениях выводятся результат ты, соответствующие принципу максимума. Основной смысл этих сопоставлений состоит в том, чтобы показать, что для применения динамического программирования нужны излишне жесткие требования, связанные с существованием непрерывных частных производных . Действительно, если для задачи с закрепленным временем ввести (n + 2)-мерную вектор-функцию

то уравнение Беллмана (1.10) можно записать в виде:

или так , что соответствует принципу максимума, если ввести функцию .

Если рассмотреть задачу максимального быстродействия, то, воспользовавшись уравнением (1.14) для автономных систем и продифференцировав его по , получим

Первое слагаемое можно преобразовать, учитывая очевидное соотношение

откуда получаем следующий результат:

Видно, что в оба слагаемых входят одни и те же функции которые мы теперь «обозначим через . Тогда условие (1.14) для оптимального процесса приобретет вид,

что сразу же позволяет левую часть этого равенства обозначить через
гамильтониан Н, а из соотношения (1.15) получить используемую в
принципе максимума систему дифференциальных уравнений относи
тельно вспомогательных переменных

Таким образом, результаты динамического программирования и принципа максимума совпадают, если ввести обозначения

или в векторной форме .

Рис. 1.2. Геометрическая интерпретация динамического программирования в задаче максимального быстродействия.

Это позволяет дать следующую геометрическую интерпретацию динамического программирования. На рис. 1.2 представлены поверхности изохрон S = const для задачи максимального быстродействия, причем величина S, по смыслу равная оставшемуся минимизируемому времени убывает по мере приближения к конечной точке, т.е.

При этом движение должно осуществляться в направлении убывания функции S, т.е. в направлении, противоположном ее градиенту внутрь изоповерхностей S = const. Из физических соображений очевидно, что движение вдоль нормали -- самое быстрое по времени, так как движение вдоль изоповерхности не дает приближения к конечной точке.

С помощью функции Беллмана S можно дать и другую трактовку процессу ее убывания, связав ее с функцией Ляпунова. Действительно, если целевая функция положительно определена,

то, выразив уравнение (1.12) в виде

или

видим, что функция S есть функция Ляпунова.

Значит, если функция S положительно определена, то оптимальная система обладает еще одним замечательным свойством -- она асимптотически устойчива, что особенно важно для нелинейных систем.

Отличие динамического программирования от других методов состоит в том, что если принцип максимума есть необходимое условие оптимальности, то уравнения динамического программирования при соблюдении всех требуемых допущений понимаются как достаточное условие. Необходимо также подчеркнуть, что в принципе максимума переменные мыслятся как функции времени, а в динамическом программировании это функции от фазовых координат, характеризующие чувствительность минимизируемого значения функционала к изменению текущего состояния .

Формально это требует решения нелинейных дифференциальных уравнений вида (1.9) или (1.10) в частных производных, что так же сложно, как и решение краевых задач в принципе максимума.

1.2 Аналитическое конструирование регуляторов и применение для их синтеза динамического программирования

Поскольку динамическое программирование наиболее близко к получению оптимального управления в замкнутой форме, нужно подробнее остановиться на задаче синтеза систем автоматического управления, удовлетворяющего при существующих ограничениях требуемому качеству. Одним из направлений в этой области является разработанный у нас в стране А.М. Летовым подход, названный аналитическим конструированием регуляторов, когда алгоритм управляющего устройства замкнутой системы находится аналитически в соответствии с определенным функционалом качества, соответствующим квадратическому критерию вида

Минимизация функционала (1.16) соответствует задаче о регуляторе состояния, когда важно удерживать около нуля все компоненты вектора состояния. Возможны другие варианты удержания около нуля некоторой ошибки, представляющей собой разность между желаемым и выходным сигналами в задачах слежения, но смысловое содержание структуры критерия остается неизменным. Первое слагаемое характеризует терминальную ошибку в конечный момент, второе слагаемое преследует цель обеспечить малость ошибки при удерживании системы в заданном положении. Последнее слагаемое представляет «штраф за большие управления» и оценивает затрачиваемую на управление энергию.

Соответственно положительно полуопределенные матрицы М, Р и положительно определенная матрица R выбираются с учетом значимости указанных факторов, преимущественно с ненулевыми диагональными элементами, либо, по желанию проектировщика, можно положить некоторые из матриц нулевыми. При этом, как правило, рассматривается линейный нестационарный объект, описываемый уравнениями

где на управление никаких прямых ограничений не наложено. В связи с этим для аналитического решения можно применять как вариационное исчисление, так и принцип максимума, но для получения решения в замкнутой форме воспользуемся методом динамического программирования. С учетом терминального члена функцией Беллмана S является функция

которая при не равна нулю.

С учетом (1.16) и (1.17) уравнение Беллмана имеет вид

При отсутствии ограничений на оптимальное управление вычислим производную от выражения в фигурных скобках и, приравняв ее нулю, получим

Поскольку матрица Д положительно определена, можно найти, во-первых, оптимальное управление

и, во-вторых, записать уравнение Беллмана без операции минимизации:

Уравнение (3.20) можно решить при условии .Можно показать [31], что уравнение (3.20) имеет точное аналитическое решение, которое представляет собой квадратичную форму

где К(t) -- симметричная нестационарная матрица с искомыми элементами.

Вычислив частные производные

подставим их в уравнение (1.20):

Учитывая, что , уравнение (1.22) можно преобразовать к виду

что соответствует равенству нулю выражения в квадратных скобках, имеющего вид системы линейных неоднородных дифференциальных уравнений с граничным условием :

Уравнение (1.23) называется матричным уравнением Риккати, решение которого обычно находят численно на ЭВМ до начала работы системы. Оптимальному управлению соответствует в общем случае линейный закон управления с переменным коэффициентом передачи

И снова, возникает закономерный вопрос: при каких условиях структура и параметры регулятора будут неизменны. В работах Калмана доказывается, что при М= 0 и для стационарных объектов, т.е. при постоянных матрицах А, В, К и Р, решение уравнения Риккати есть постоянная матрица К, соответствующая уравнению

В этом случае оптимальная замкнутая система является стационарной

и асимптотически устойчивой вследствие установившегося поведения
при , несмотря на то, что объект управления может быть неустойчив.

Проведенный анализ известных методов управления позволяет сделать следующие выводы:

1. Среди существующих методов синтеза регуляторов, учитывающих динамику объекта управления, наиболее подходящим является динамическое программирование, поскольку структура регулятора находится в пространстве вектора состояния объекта, что соответствует замкнутой форме системы управления;

2. Метод АКОР обладает возможностью аналитически определить закон линейного управления объектом в квадратурах, что удобно, однако функцию штрафов в интегральном функционале нужно свести как минимум к квадратичной форме, учитывая при необходимости степенные функции более высокого порядка.

2. Синтез оптимального регулятора при заданной постоянной функции штрафов без контроля безопасности движения

2.1 Синтез оптимального линейного регулятора для стабилизации бокового движения без встречи с препятствием

Постановка задачи в рассматриваемом случае может быть формулирована следующим образом на примере управления речным транспортом:

Дано:

1. Заданы дифференциального уравнения движения транспорта, описываемого динамической системой второго порядка

(2.1)

где - координата бокового отклонения судна от заданной траектории (фарватер), - координата боковой скорости судна.

2. Поступательное движение транспорта происходит с заданной постоянной скоростью , в результате чего меняется длина y пройденного пути.

3. Задан интегральный критерий качества (2.2) где (2.3)- подынтегральное выражение функционала J, учитывающего постоянный штраф за отклонение от фарватера, штраф за боковую скорость и штраф за потраченную мощность при управлении;

- штраф за квадрат управления рулём ;

- штраф за отклонение от фарватера ;

- штраф за боковую скорость ;

- удаление от фарватера или боковой путь ;

- боковая скорость судна;

- параметры объекта управления;

- боковая скорость течения.

Требуется решить прямую задачу динамического программирования. В прямой задаче нужно найти функцию управления

4. Решение прямой задачи методом динамического программирования может быть получена следующим образом

Функция Беллмана записывается таким образом:

5. Запишем уравнение Беллмана и представим функцию Беллмана степенным полиномом:

6. Оптимизируем функцию Беллмана по параметру u , получаем таким образом:

(2.6)

Отсюда получим: (2.7)

Подставим (2.7) в выражение (2.6) получим :

Подставим функцию (2.8) в уравнение Беллмана (2.5) и представив правую часть уравнения Беллмана степенным рядом:

7. Приравнивая сомножители при одинаковых степенях, группируем их по степеням и получим систему дифференциальных уравнений

8. Заменим дифференциальные уравнения алгебраическими при:

После преобразования всех уравнений, если пренебрежем составным элементом в четвёртом уравнении системы (2.11), окончательно найдём нижеследующее решение:

Подставим два коэффициента решения (2.12) в выражение и получим :

(2.13)

Подставив полученную функцию в выражение (2.1), получим:

(2.14)

Проведем моделирование на ЭВМ движения судна на примере стабилизации бокового пути вблизи фарватера при условиях:

После подстановки всех вышеуказанных параметров в выражение (2.13) и (2.14) получим: ,

Рис. 2.1 Процесс стабилизации бокового движения судна при его возвращения слева на фарватер

Рис. 2.2 Процесс стабилизации бокового движения судна при его возвращении справа на фарватер

2.2 Синтез оптимального линейного регулятора при встрече с протяженным неподвижным препятствием

Постановка задачи в рассматриваемом случае может быть формулирована следующим образом на примере управления речным транспортом:

Дано:

1. Заданы уравнения движения транспорта

2. Поступательное движение транспорта происходит с заданной постоянной скоростью v1, в результате чего меняется длина y пройденного пути.

3. Задан интегральный критерий качества (2.16) где (2.17)- подынтегральное выражение функционала J, учитывающего теперь штраф r3 за приближение к неподвижному препятствию;

- штраф за квадрат управления рулём ;

- штраф за отклонение от фарватера ;

- штраф за боковую скорость ;

- штраф за приближение к препятствию ;

- расстояние от фарватера до острова ;

- дистанция от управляемого объекта до острова;

- удаление от фарватера или боковой путь ;

- боковая скорость судна;

- параметры объекта управления;

- боковая скорость течения.

Требуется решить прямую задачу динамического программирования. В прямой задаче нужно найти функцию управления

4. Решение прямой задачи методом динамического программирования может быть получена следующим образом

Функция Беллмана записывается таким образом:

5. Запишем уравнение Беллмана и представив функцию Беллмана степенным полиномом:

(2.19)

6. Оптимизируем функцию Беллмана по параметру u , получаем таким образом:

(2.20)

Отсюда получим: (2.21)

Подставим (2.21) в выражение (2.20) получим :

Подставим функцию (2.22) в уравнение Беллмана (2.19) и представив правую часть уравнения Беллмана степенным рядом:

7. Приравнивая сомножители при одинаковых степенях, группируем их по степеням и получим систему дифференциальных уравнений

8. Заменим дифференциальные уравнения алгебраическими при:

После преобразования всех уравнений, если пренебрежем составным элементом в четвёртом уравнении системы (2.25), окончательно найдём нижеследующее решение:

Подставим два коэффициента решения (2.26) в выражение и получим :

Подставив полученную функцию в выражение (2.15), получим :

Проведем моделирование на ЭВМ движения судна на примере стабилизации бокового пути вблизи фарватера при условиях:

После подстановки всех вышеуказанных параметров в выражение (2.27) и уравнения (2.28) получим (см. рис.2.3 и рис.2.4)

Проведенные исследования позволяют сделать следующие выводы:

1. Моделирование на ЭВМ показало, что при постоянной функции штрафов боковое движение успешно стабилизируется относительно заданного постоянного значения и удовлетворяет процессу в отсутствии мешающего препятствия, либо в случае его значительной протяженности;

2. Если препятствие имеет ограниченные размеры, то для возвращения на заданный путь синтезируемый регулятор должен строиться с помощью переменной функции штрафов, учитывающей сближение с препятствием.

3.Синтез оптимального регулятора при переменной функции штрафов, учитывающей сближение с неподвижным препятствием, без контроля безопасности встречного движения

3.1 Синтез регулятора без учета динамики сближения с препятствием в математической модели объекта

Рассмотрим другой случай синтеза закона управления транспортом малоразмерного неподвижного препятствия, когда штраф за приближение к препятствию растет, а при удалении уменьшается.

Постановка задачи оптимального управления может быть сформулирована следующим образом.

Дано:

1. Заданы уравнения движения транспорта (3.1)

Где, - скорость продольного движения управляемого объекта, - величина дистанции между судном и препятствием.

2. Задан интегральный критерий в виде:

, (3.2)

Где - выбранная новая штрафная функция удаления от препятствия.

3. Требуется найти решение прямой задачи методом динамического программирования. В этом случае функция Беллмана была представлена прежней формулой (2.17), в которую координата пока не входит.

4. Решение задачи получено следующим образом. Заменяем в уравнении Беллмана вместо и после преобразования выше изложенных выражений получим:

5. С помощью найденных коэффициентов определим закон оптимального управления в квадратурах

6.

,

или более детально передаточное число линейного регулятора имеют вид

7. Полученный результат позволяет промоделировать движение судна, если к уравнению (3.4) присоединить уравнения (3.5) модели объекта

(3.5)

8. Моделирование обхода малого препятствия на приведенном ниже примере подтвердило факт возвращения судна на фарватер после обхода препятствия при следующих условиях:

После подстановки всех вышеуказанных параметров в выражение (3.4) и уравнения (3.5) получим:

=

=

Построение графиков обхода препятствия слева и справа при отсутствии боковой скорости течения (м/сек) проиллюстрировано на рисунке (3.1) и (3.2)

Рис.3.1 График обхода малоразмерного неподвижного препятствия слева при возвращении на фарватер при y1(0)=100 m

Рис. 3.2 График обхода малоразмерного неподвижного препятствия справа при возвращении на фарватер при y1(0)=100 m

9. Кроме того, получены графики для различных начальных дистанций y1(0) при маневрировании

Рис.3.3 Процесс маневрирования для бокового движения судна при y1(0)=10m

Рис.3.4 Процесс маневрирования для бокового движения судна при y1(0)=25 m

Рис.3.5 Процесс маневрирования для бокового движения судна при y1(0)=50 m

Рис.3.6 Процесс маневрирования для бокового движения судна при y1(0)=100 m

Эти графики показывают, что на малых дистанциях при y1(0) < 20 м судно не успевает безопасно обойти препятствия. Это впервые наводит на мысль проанализировать значение функции риска в виде правой части уравнения Беллмана F(x). Оказалось, что эта функция сильно увеличена при малых дистанциях маневрирования и поэтому может быть использована для контроля безопасности движения.

Также были получены результаты с новыми весовыми коэффициентами и при других условиях:

После подстановки всех вышеуказанных параметров в выражение (3.4) и уравнения (3.5) и получим:

Построение графиков при отсутствии боковой скорости течения (м/сек) проиллюстрировано на рисунках (3.7) и (3.8)

Рис.3.7 Процесс обхода препятствия при y1(0)=25 м, r3=25

Рис.3.8 Процесс обхода препятствия при y1(0)=50 м, r3=25

Также были промоделированы боковые маневры судна при условиях

После подстановки всех вышеуказанных параметров в выражение (3.4) и уравнения (3.5) получим:

Построение графиков при отсутствии боковой скорости течения (м/сек) показано на рисунках (3.9) и (3.10)

Рис.3.9 Процесс обхода препятствия при y1(0)=25 м, r3=125

Рис.3.10 Процесс обхода препятствия при y1(0)=50 м, r3=125

Полученные результаты показали, что наилучшие траектории обхода препятствия возникают, если , и все эти коэффициенты больше единицы, в то время как , а

Вместе с тем, найденный путь синтеза обладает тем недостатком, что при малых дистанциях, когда боковой маневр по обходу препятствия успеха не имеет, не возникает нужный сигнал тревоги для нужного торможения судна. Кроме того, в самом синтезе никак не учитывается скорость сближения транспорта с препятствием, и этот параметр не входит в правую часть уравнения Беллмана, определяющую функцию риска между тем с увеличением скорости сближения транспорта с препятствием опасность столкновения с ним растет, и это обстоятельство необходимо учитывать.

3.2 Синтез регулятора с учетом динамики сближения с препятствием как в функции штрафов так и в модели объекта

Постановка задачи оптимального управления, когда меняется и штраф за сближение с препятствием, и меняется вектор состояния учитывающий изменение дистанции, может быть сформулировано следующим образом:

1. Заданы уравнения бокового и поступательного движения

2. Задан переменный штраф за сближение препятствия

3. Представим в данном случае функция Беллмана по- новому - в неё входит координата y

4. Тогда частные производные равны

Это позволяет записать уравнение Беллмана в новом усложненном виде

5. Оптимизируем функцию риска в виде правой части уравнения Беллмана по параметру u1. Таким образом получаем оптимальное управление равным формула :

Подставив в найденное значение в уравнение (3.8), получим степенные полиномы в его левой и правой частях. Приравнивая сомножители при одинаковых степенях, получим следующую систему алгебраических линейных уравнений

Дополнительно заметим, что нужный вид полинома был найден при замене функции штрафов М(y) на следующее приближение :

6. В результате удается вычислить искомые коэффициенты функции Беллмана

; ;;

;; ; (3.10)

;;;

; ; ; ; ;

7. С помощью найденных коэффициентов можно определить закон управления u1 как явную функцию от пяти параметров x1,x2,y,Co,D. Полученные результаты позволят промоделировать движение судна. Моделирование показывает, что после обхода препятствия судно возвращается на фарватер.

Рис.3.11 Процесс обхода препятствия с учетом динамики сближения при

Проведенные исследования позволяют сделать следующие выводы:

1. При отсутствии контроля безопасности движения оптимальное управление боковым движением снижает риск столкновения с препятствием, однако в случае его обнаружения на малых дальностях жесткое соблюдение закона управления поступательным движением приведет к аварии;

2. С целью обеспечения необходимой безопасности следует использовать сигнал тревоги, сформированный в блоке контроля, для выработки команды на снижение скорости поступательного движения вплоть до полной остановки.

4.Контроль безопасности встречного движения и его место в реконфигурации процесса обхода препятствия

4.1 Зависимость функции текущего риска снижения безопасности движения от удаления от препятствия

До сих пор не было уделено достаточного внимания процессу изменения функции риска по мере приближения к препятствию. Поэтому с учетом сделанных в параграфе 3.2 уточнений модели интегрального критерия проведем дополнительный анализ поведения этой функции, представив их графиком.

Прежде всего проанализируем зависимость правой части уравнения Беллмана от начальной дистанции от маневрирующего судна до препятствия. Дело в том, что сама правая часть по определению является такой функцией текущего риска, которая при оптимальном управлении есть сумма текущего штрафа и спрогнозированных последствий в будущем. Иными словами, необходимый учет динамики изменения опасности ситуации в самом методе уже предусмотрен, нужно только оценить эту опасность количественно.

На рис.4.1, 4.2. показано изменение функции риска по мере приближения к препятствию.

Во-первых отчетливо видно, что это функция растет и максимальна в момент обхода препятствия, а затем величина ожидаемого риска снижается и стремится к нулю. Это полностью соответствует физическому смыслу тех ощущений человека-оператора, который осуществляет ручное управление при обходе препятствия.

Во-вторых, при увеличении начальной дистанции маневрирования величина ожидаемого риска снижается из-за увеличения располагаемого ресурса времени на маневрирование, что тоже верно.

Значит, предложенная математическая модель оптимизации адекватна с точки зрения ее зависимости от удаления судна от препятствия.

Рис.4.1 Функция риска при условиях

Рис.4.2 Функция риска при условиях, увеличенная по сравнению с функцией на рис.4.1

4.2 Зависимость функции текущего риска от скорости сближения с препятствием

Как видно из формулы (3.8) , в функцию риска входят члены, явно зависящие от скорости сближения с судном, а именно - последнее слагаемое, а в нем в первую очередь решающим является коэффициент , от которого однозначно зависит коэффициент (остальные члены с достаточно малы).

Согласно формуле (3.9) эти коэффициенты имеют в сумме отрицательный знак, а значит функция растет при увеличении скорости сближения с препятствием. Это также соответствует физическому смыслу- чем «быстрее» движение, тем это опаснее. Этот факт можно проиллюстрировать следующими графиками на рис. 4.3 и 4.4, которые подтверждают высказанное утверждение.

Рис.4.3 Функция риска при условиях

Рис.4.4 Увеличенная функция риска при условиях

4.3 Синтез оптимального регулятора с учетом динамики движения

До сих пор боковое движение самого препятствия не учитывалось - оно считалось неподвижным. Между тем встречное судно или любой другой плывущий предмет может представлять существенную угрозу безопасности.

Поэтому надо дополнить предыдущую модель новыми элементами. К ним относится в первую очередь дифференциальное уравнение движения препятствия, поэтому общая динамическая модель примет вид:

,

где - известная скорость движения препятствия, положение которого характеризуется меняющей координатой бокового движения.

Тогда уравнение Беллмана вместо (2.19) будет иметь в правой части новую функцию риска, имеющую вид:

Тогда решая задачу синтеза оптимального управления описанным выше способом, можно получить систему алгебраических уравнений, необходимых для вычисления новых коэффициентов функции Беллмана.

В этой формуле присутствует пять новых коэффициентов функции Беллмана. С их помощью получена новая система алгебраических уравнений, которые имеют вид

Решение этих уравнений позволяют найти в квадратурах новое оптимальное управление

В отличие от ранее найденного решения управления боковым движением судна дополнительно учитывает скорость движения препятствия. Это обеспечивает дополнительную безопасность обхода препятствия такого типа, представляющих наибольшую угрозу.

4.4 Регулирование скорости поступательного движения при опасном сближении с препятствием

После того, как стал ясен факт очевидного роста функции риска при сближении с препятствием, остается делать последний шаг - осуществить контроль этой функции риска и затем повлиять на скорость движения судна. А именно - в случае недопустимо в снижении безопасности бокового маневра необходимо дополнительно предпринять аварийное снижение скорости вплоть до полного торможения.

Для этого нужно сравнить контролируемую текущую функцию риска F с некоторым порогом , при котором экспериментально доказана успешность обхода препятствия на высокой скорости .тогда разность дает нужную команду на управление поступательным движением. Если положительна, то нужно снизить скорость хода судна до значения , если разность отрицательна, то - увеличить до заданного значения .

Этот способ повышения безопасности можно реализовать с помощью следующей динамической модели :

Рис. 4.5 Снижение скорости движения при сближении транспортных средств

Приведенные соображения можно отобразить в виде принципиально новой двухуровневые структуры управления и контроля безопасности встречного движения, представлены на рис. 4.6.

Рис. Двухуровневая структура контроля и управления безопасным встречным движением

На этом рисунке канал бокового движения нижнего уровня осуществляет управление обходом препятствия, но если он не исправляется задачи обеспечения безопасности, то верхний уровень контроля формирует сигнал тревоги, подающей команду на другой канал нижнего уровня управляющий поступательным движением.

В этом случае скорость хода судна снижается, а безопасность движения возрастает до нужной величины, и задача управления судном в целом будет успешно решена.

Проведенные исследования позволяют сделать следующие выводы:

1. Найденный объединенный способ контроля и управления объектом при встречном движении и неподвижном препятствии использует в качестве входных сигналов координаты бокового поступательного движения , и , а также меняющуюся скорость поступательного движения;

2. Найдена окончательная структура перестраиваемых регуляторов бокового и поступательного движения за счёт использования сигнала тревоги в процессе управления при встрече с подвижным препятствием. Эта структура имеет на своем входе координаты бокового движения судна и , координаты и поступательного движения судна и препятствия, а также скорости и объекта и препятствия;

3. Предложена двухуровневая система контроля и управления, обеспечивающая необходимую безопасность обхода препятствий при встречном движении.

5.Определение целесообразности разработки алгоритма

Целью дипломной работы является разработка системы контроля безопасности движения транспорта и отображение опасных ситуаций на экране. Для выполнения данной работы требуется провести математическое моделирование разработанного алгоритма на ЭВМ.

Для экономической эффективности разрабатываемых алгоритмов и программного продукта (ПП) необходимо:

· определить целесообразность разработки;

· определить трудоемкость и затраты на создание ПП;

· определить показатели экономической эффективности разработки ПП.

Для того чтобы обосновать целесообразность разработки ПП, дать оценку технической прогрессивности и качеству реализации, необходимо сравнить ее с одним из существующих аналогов, который принят в качестве базового. В качестве такого аналога будем рассматривать алгоритм ручного управления движением транспорта, используемый в настоящее время.

Анализируемые характеристики качества алгоритмов и программных продуктов представлены в таблице 1.

Таблица 1. Характеристики качества алгоритмов и программных продуктов.

Характеристики качества ПП

Единица измерения

Значения характеристик качества ПП

Значимость характеристик

аналог

новый вариант

1

Универсальность

Относительные единицы

1

4

0.4

2

Точность

1

2

0.3

3

Наглядность отображения входных данных и результатов расчета

1

3

0.2

4

Простота использования

1

4

0.1

Итого

1.0

Определим индекс технического уровня разработки по формуле:

,

где x, x - уровень i-ой функциональной характеристики соответственно нового и базового ПП;

мi - значимость i-ой функциональной характеристики;

n - количество рассматриваемых функциональных характеристик.

Значимость i-ой функциональной характеристики определяется экспертным путем, при этом учитывается условие:

Таким образом, индекс технического уровня равен:

Интегральный показатель качества разрабатываемого алгоритма и ПП определяется следующим образом:

J = JТУ ( Kв + 1 ) ,

где Kв - коэффициент влияния.

Значения коэффициента определяются экспертно. Общепринятым значением коэффициента Kв для техники, улучшающей характеристики системы управления, (именно к этому классу относится разрабатываемый алгоритм), является значение Kв= 0,25. Таким образом:

J = 3.2 (0.25+1) = 4

Полученное значение индекса позволяет сделать вывод о том, что разрабатываемый ПП является более прогрессивным по сравнению с рассматриваемым базовым аналогом.

5.1 Определение трудоемкости разработки алгоритма и ПП

В процессе планирования разработки ПП определяется трудоемкость его создания. При традиционном программировании каждый элемент ПП содержит все этапы решения задачи, начиная с ввода исходных данных и кончая выводом результатов. Для этого случая затраты труда в чел.-час определяются по формуле:

tПП = tО + tИ + tА + tК + tОТ + tД ,

где tО - затраты труда на подготовку описания задачи;

tИ - затраты труда на изучение описания задачи;

tА - затраты труда на разработку алгоритма решения задачи;

tК - затраты труда на составление программы;

tОТ - затраты труда на отладку программы;

tД - затраты труда на подготовку документации по ПП.

Условное количество команд в программе определяется следующим образом:

,

где q - предполагаемое количество команд;

КС - коэффициент сложности программ (КС=1.25 - 2.0);

КК - коэффициент коррекции программы при ее разработке

К= 0.05 - 0.1);

n - количество коррекций программы в ходе ее разработки. Примем:

q = 1000;

KC = 1.8;

KK = 0.08;

n = 7.

Таким образом, условное количество команд в разрабатываемой программе:

Составляющие затрат труда рассчитываются по формулам:

;

;

;

;

,

где В - коэффициент увеличения затрат труда на изучение и постановку задачи вследствие их сложности и новизны (В = 1.2 - 3.0);

К - коэффициент квалификации разработчиков (при стаже 2-3 года К=1).

Цифры, находящиеся в знаменателях формул, характеризуют среднюю производительность труда программистов (число команд или операторов в час). Таким образом, составляющие трудоемкости разрабатываемого ПП (чел.-час.):

;

;

;

;

Значение tO примем равным 7 чел.-час. Тогда общие затраты труда составляют:

tПП = 7 + 52.4 + 140.4 + 280.8 + 561.6 + 327.6 = 1369.8 чел.-час.

5.2 Календарное планирование

Календарное планирование создания ПП производится на основе данных о трудоемкости работ по его созданию. Производственный цикл каждого этапа определяется по формуле:

;

где ТЭ - трудоемкость этапа, чел.-час.;

tРД - продолжительность рабочего дня, ч. (tРД = 8ч.);

q - количество работников одновременно участвующих в выполнении работ, чел. Пересчет длительности производственного цикла, выраженной в человеко-часах, в календарные дни осуществляют умножением ее на коэффициент 1.4, т.е:

.

Произведем расчет длительности каждого этапа:

; ;

; ;

; ;

; ;

; ;

Результаты расчета и директивный график представлены в таблице 2.

Таблица 2 Календарное планирование

5.3 Расчет заработной платы основного персонала

Заработная плата разработчиков программы рассчитывается на основе трудоемкости стадий работ. Часовые ставки определяются на основе должностных окладов разработчиков и разрядов работ (часовых тарифных ставок). Расчет заработной платы представлен в таблице 3.

Таблица 3 Расчет заработной платы основного персонала

Стадии (этапы)

Трудоемкость стадий, чел.-дн.

Исполнители

Днев. ставка,

руб.

Сред. дневн. ставка, руб.

З/п,

руб.

З/п с уч.

премий, руб.

должность

числ.

1

Подготовка описания и изуч. задачи

7

программист

1

600

600

4600

5880

2

Разработка алгоритма

16

программист

1

600

1400

22400

31360

ведущий специалист

1

900

3

Программирование

23

программист

1

600

600

13800


Подобные документы

  • История "умных" светофоров. Функции назначение автоматизированных систем управления движением транспорта "Старт", "Спектр". Характеристика основных зарубежных ИТС. Архитектура интеллектуальных транспортных систем и ее блоки. Анализ и оценка рынка ИТС.

    курсовая работа [259,5 K], добавлен 14.01.2018

  • Организация движения городского пассажирского транспорта при работе адаптивной системы управления дорожным движением. Сравнение временно-зависимой и транспортно-зависимой стратегии. Разработка базы нечетких правил. Построение функции принадлежности.

    курсовая работа [828,0 K], добавлен 19.09.2014

  • Бортовая станция управления движением (СУД) для дистанционного управления судовыми силовыми средствами и задания различных режимов управления движением судна. Состав органов управления на панелях станции. Панель для управления курсом и траекторией.

    реферат [234,7 K], добавлен 02.09.2010

  • История воздушного транспорта России от истоков до наших дней. Развитие системы управления воздушным движением, основные этапы в формировании УВД. Обеспечение безопасности полетов гражданской авиации. Аэронавигационное обслуживание полетов самолетов.

    контрольная работа [22,4 K], добавлен 04.01.2015

  • Разработка автоматизированной системы координированного управления дорожным движением на дорожно-уличной сети. Характеристика функций управления, используемых методов и средств управления. Процесс функционирования АСУ координации дорожного движения.

    дипломная работа [544,1 K], добавлен 26.01.2014

  • Математическое описание продольного движения самолета, уравнения силы и моментов. Модель привода стабилизатора и датчика положения штурвала. Разработка алгоритма ручного управления продольным движением самолета, рекомендации к выбору желаемых значений.

    курсовая работа [581,4 K], добавлен 06.07.2009

  • Классификация методов управления дорожным движением. Автоматизированная система управления дорожным движением "Зеленая волна" в г. Барнауле. Принципы ее построения, структура, сравнительная характеристика. Кольцевая автодорога в г. Санкт-Петербурге.

    контрольная работа [888,8 K], добавлен 06.02.2015

  • Нормативно-правовое и техническое регулирование в области обеспечения безопасности движения поездов. Осторожность при производстве работ на путях. Анализ состояния безопасности движения на железных дорогах. Расчет допустимых скоростей движения состава.

    курсовая работа [66,4 K], добавлен 06.12.2014

  • История развития таксомоторных услуг. Автобусный транспорт как вид пассажирского транспорта. Общие правила и лицензирование перевозок пассажиров и багажа автомобильным транспортом. Организация диспетчерского управления движением автобусов на маршруте.

    дипломная работа [2,7 M], добавлен 29.05.2015

  • Состояние безопасности движения на железных дорогах России. Классификация нарушений безопасности движения в поездной и маневровой работе на железных дорогах. Выбор вида профиля и варианта уклонов. Нормы закрепления вагонов на пути с вогнутым профилем.

    практическая работа [154,7 K], добавлен 17.03.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.