Разработка единого системного подхода к решению задачи оптимального оценивания
Методы статистической обработки измерений информационных систем для задач с условиями сингулярных помех в радиотехнике. Адекватность моделей задачи оценивания, приближение и дифференцирование полезных сигналов в классе функций с финитным спектром.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 11.06.2012 |
Размер файла | 953,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
1
Размещено на http://www.allbest.ru/
Разработка единого системного подхода к решению задачи оптимального оценивания
Введение
При разработке перспективных и оптимизации существующих информационно-измерительных систем (ИИС) различного назначения, широко используемых в гражданских и военных сферах, особое внимание уделяется вопросам оптимизации обработки измерений, содержащих всевозможные помехи. Данные помехи могут иметь различную физическую природу и для уменьшения степени их влияния на работу ИИС используются известные методы статистической обработки измерений (метод наименьших квадратов (МНК), метод максимального правдоподобия, метод максимума апостериорной плотности вероятности, байесовские методы, квазиоптимальные методы, регуляризованные методы, робастные методы и другие).
Среди указанных методов наиболее широкое распространение на практике получил МНК и его различные модификации. Известно, что МНК дает зачастую приемлемые по точности результаты (в задачах линейного и нелинейного оценивания) при наличии в измерениях случайных флуктуационных ошибок. В ряде работ рассмотрен вопрос построения устойчивых МНК - оценок при наличии в измерениях как случайных, так и систематических ошибок различной физической природы. При этом используется традиционная процедура расширения пространства состояния, которая на практике зачастую приводит к известному эффекту «размазывания точности», росту объема вычислительных затрат и усложнению структур систем обработки измерений.
Более сложной является задача оценивания в условиях сингулярных помех (СП), математические модели которых предполагают задание некоторого конечного функционального базиса с точностью до вектора неизвестных коэффициентов. Зачастую, оптимальное решение такой задачи удается найти с использованием принципа инвариантности при соблюдении соответствующих условий регулярности и несмещенности. СП зачастую возникают в задачах, характеризующихся переходными процессами. Примером может служить доплеровский измеритель скорости инерциальной навигационной системы, у которой возникает задача распознавания полезного сигнала на фоне скачкообразно изменяющихся помех вследствие естественных и искусственных возмущений.
В дипломной работе развивается системный подход к решению указанной задачи в наиболее общей постановке, включающей в себя не только оценивание коэффициентов модели полезного сигнала, но и его производных различного порядка в условиях сингулярных помех (СП) и флуктуационных шумов (ФШ).
В работе принят широко используемый в радиотехнике подход к представлению полезных сигналов в классе функций с финитным спектром (ФФС). Поскольку реальные сигналы не обладают таким спектром, то в работе исследованы вопросы интерполяции, аппроксимации и дифференцирования на основе известной теоремы отсчетов с использованием ряда Котельникова, при этом учтены ограничения на полезный сигнал во временной и частотной областях.
Дипломная работа включает: список принятых сокращений, введение, три раздела, заключение, список литературы.
сингулярная помеха радиотехника оценивание финитный спектр
1. Системный подход к задаче оценивания
1.1 Общие положения
В работах отечественных и зарубежных ученых неоднократно поднималась проблема разработки единого системного подхода к решению задачи оптимального оценивания. Были сформулированы условия правильности (регулярности) математической постановки задач этого класса, которые могли бы гарантировать получение единственного решения с заданными оптимальными свойствами.
В рамках системного подхода можно получить комплексное решение вопросов выбора адекватных математических моделей и функционирования систем обработки измерительной информации; рационального критерия качества оценивания; оптимальной стратегии измерений и т.п. При декомпозиции исходной задачи оценивания на составные части (элементы) основное внимание уделяется их структурным взаимосвязям, влияющим на характер и качество ее решения.
В настоящее время для проверки условий регулярности постановки задачи оценивания в основном используется математический аппарат, базирующийся на теореме о неявных функциях и предполагающий вычисление рангов соответствующих функциональных матриц для проверки взаимной однозначности отображений. Однако исследование сложной задачи трудно осуществить в рамках какого-то одного раздела математики, одной теории или метода. Постоянное ужесточение требований к качеству и срокам проектирования систем обработки измерительной информации являются основной причиной активизации поиска адекватного математического аппарата, соответствующего основным принципам системного подхода.
В данной главе, опираясь на [2, 3, 16, 25, 27, 28, 30], в сжатой форме изложены основные принципы системного подхода к решению задач оценивания. Основное внимание уделено условиям правильности (регулярности) математической постановки задач этого класса, которые могли бы гарантировать получение единственного решения с заданными оптимальными свойствами. На базе известной из математического анализа теоремы о неявных функциях дается анализ структурных свойств задачи оценивания: адекватности используемых математических моделей, наблюдаемости измеряемых параметров, состоятельности критерия качества.
Следуя [16], введем понятие регулярности (правильности) математической постановки задачи оценивания. Задачу будем считать регулярной, если в рамках принятой математической постановки существует единственное решение этой задачи с требуемыми предельными свойствами по объему выборки измерений.
Рассмотрим математическую постановку задачи оценивания в рамках системного подхода, т.е. с учетом структурных взаимосвязей, существующих между элементами задачи.
1.2 Основные элементы задачи. Условия регулярности
Пусть известно, что оцениваемый процесс (вектор состояния) на отрезке времени [t0, T] характеризуется вектором . Для описания данного процесса воспользуемся приближенной математической моделью G. В отличие от вектор состояния, соответствующий модели G, будем обозначать через .
К модели G предъявляются следующие требования:
модель G должна однозначным образом описывать оцениваемый процесс;
модель G должна в некотором смысле наиболее точно описывать оцениваемый процесс (адекватность модели);
модель G должна быть достаточно простой в вычислительном отношении.
Функциональное соответствие между вектором состояния и вектором измеряемых параметров у задается математической моделью S. В большинстве случаев
(1.1)
Поскольку погрешности, возникающие при задании модели S, незначительны, то считаем, что вектор действительных измеряемых параметров определяется в соответствии с уравнением
. (1.2)
Для полного описания условий функционирования системы обработки измерительной информации, характеризующих способ комбинации ошибок измерений с измеряемыми параметрами и вероятностные характеристики ошибок измерений, используется модель Q. В простейшем случае данной модели отвечает следующее функциональное соответствие:
(1.3)
где - вектор результатов измерений; h - вектор ошибок измерений.
Измерения на отрезке времени могут производиться как в дискретные моменты времени ti, , так и непрерывно В первом случае qK-мерный вектор ошибок измерений
полностью характеризуется плотностью вероятности р(h). Если плотность вероятности р(h) является гауссовской, то будем писать
где - вектор математических ожиданий ошибок измерений и Kh - ковариационная матрица. Во втором случае (непрерывное наблюдение) случайный процесс h = h(t) характеризуется соответствующим функционалом плотности вероятности.
Следующим элементом задачи оценивания является критерий качества К. Наибольшее распространение в настоящее время получил критерий минимума среднего риска (байесов критерий). Данный критерий применяется в условиях полной априорной определенности. Если же априорное распределение неизвестно, используются другие критерии: минимума условного риска, максимального правдоподобия, минимаксный.
Полагаем, что система обработки измерительной информации характеризуется нерандомизированным решающим правилом когда устанавливается детерминированная функциональная связь между оценкой и вектором измерений .
Условным риском называют риск , усредненный по условному распределению т.е. по функции правдоподобия
(1.4)
Важным является понятие апостериорного риска, т.е. риска , усредненного по апостериорной плотности вероятности:
(1.5)
где k - нормировочный коэффициент.
Апостериорный риск определяется как
(1.6)
Средний риск, т.е. риск, усредненный по и , связан с апостериорным риском простой зависимостью
(1.7)
Отсюда следует, что байесов критерий оптимальности - критерий минимума среднего риска - эквивалентен критерию минимума апостериорного риска. Это означает, что оптимальный байесов алгоритм должен выбираться из условия минимизации функционала
(1.8)
т.е.
(1.9)
Конкретный алгоритм зависит от выбранной функции потерь , которая задает меру отклонения получаемого решения от истинного. Очевидно, что функция потерь и риск должны отвечать ряду свойств, при которых обеспечивается корректность применения байесова критерия оптимальности.
1.3 Адекватность моделей задачи оценивания
Условие адекватности определяет некоторое отношение на множестве математических моделей. Введем в рассмотрение метрическое пространство непрерывных на отрезке [t0, T] вектор-функций , расстояние в котором между элементами
и
некоторой неотрицательной действительной функцией . В практике оценивания наиболее распространено расстояние
(1.10)
которое, как известно, приводит к метрическому пространству, не являющемуся полным. Полное метрическое пространство получится в том случае, если в ввести расстояние по формуле
(1.11)
Предпочтение на практике отдается метрическому пространству с расстоянием (1.10), несмотря на то, что оно не является полным. Данное расстояние может использоваться в качестве меры близости между R и G (где R и G - соответственно реальное и модельное поведение сигнала). С его помощью вводятся важные понятия математической модели G, локально или глобально ?-адекватной реальному полезному сигналу. Величина ? представляет собой среднеквадратическое расстояние между реальным процессом и его моделью. Она может быть назначена из чисто физических соображений или получена путем расчета.
По аналогии с вводится метрическое пространство непрерывных на отрезке [t0, Т] вектор-функций у = у(t) с расстоянием , определяемым, например, выражениями типа (1.10) и (1.11). Это позволяет рассматривать элемент
(1.12)
как непрерывное отображение метрического пространства в метрическое пространство . При этом необходимое условие ?-адекватности (локальной и глобальной) в пространстве измеряемых параметров выглядит так:
, (1.13)
где ; L - постоянная Липшица для отображения , удовлетворяющая условию
(1.14)
Так, для случая квадратичной метрики и линейного преобразования
, (1.15)
где H - матрица соответствующей размерности, условие (1.14) имеет вид
(1.16)
В последнем выражении ?max - максимальное характеристическое число матрицы НТН.
Для получения необходимых и достаточных условий ?-адекватности в пространстве измеряемых параметров на отображение накладываются определенные ограничения. Так, если отображение является гемеоморфным, то для ?-адекватности математической модели G реальному движению R необходимо и достаточно, чтобы выполнялось неравенство
(1.17)
где
(1.18)
В случае изометрического отображения , например, когда задается матрицей ортогонального преобразования , адекватность обеспечивается при выполнении неравенства , где ? находится из условия .
Для использования приведенных выше критериев необходимо вычислить значение . Оно может быть найдено по результатам измерений, если ошибками измерений практически можно пренебречь. В противном случае условие адекватности приобретает статистический характер.
В пространстве выборок статистическое условие адекватности формулируется следующим образом: если отображение является гомеоморфным, то для ?-адекватности математической модели G с вероятностью (надежностью) Р0 реальному поведению R необходимо и достаточно, чтобы выполнялось неравенство
, (1.19)
где - верхняя граница доверительного интервала Iдов, накрывающего с вероятностью Р0 неизвестное значение ; - значение правой части одного из условий ?-адекватности, сформулированного ранее.
Будем полагать, что критерий качества K в случае эквивалентности модели G реальному поведению R(? = 0) обеспечивает получение решения , обладающего свойством сильной сходимости:
, (1.20)
где - оценка вектора , полученная по измерениям, выполненным в дискретные моменты времени
Сформулированное статистическое условие адекватности оказывается связанным с предположением о сильной сходимости оценок к своим действительным значениям. Сильная сходимость лежите основе понятия состоятельности критерия качества K. Состоятельность критерия качества является необходимым условием для однозначного вывода, получаемого с использованием статистического условия адекватности. В свою очередь состоятельный критерий качества обеспечивает сходимость оценок к их действительным значениям только с той точностью, которую гарантирует величина ? в условии адекватности.
Если условие состоятельности не выполняется, то результат проверки условия адекватности относится не только к вопросу близости модели G и реального поведения R, но и к отношению между критерием качества К и условиями опыта Q. Какое из этих двух отношений не удовлетворяет требованиям регулярности, в данном случае установить трудно.
Условие адекватности (1.19) не только служит показателем близости G и R, но и является качественным показателем точности получаемого решения . Последнее свойство статистического условия адекватности является очень важным, так как количественно оценить точность решения в сложных задачах оценивания практически не представляется возможным.
1.4 Состоятельность критерия качества
Полагая и учитывая, что оценка действительного значения вектора зависит от мощности выборки (т.е. ), введем в Rn расстояние с помощью нормы
. (1.21)
Рассмотрим известные статистические свойства оценок.
1. Состоятельность,
, (1.22)
где - любое положительное число; Р{Q)} - вероятность события Q.
2. Несмещенность,
. (1.23)
где М{·} - символ математического ожидания.
3. Эффективность (оценка называется эффективной, если по сравнению с любой другой она обладает наименьшим разбросом).
4. Достаточность (оценка называется достаточной, если она определяется через достаточные статистики как функция от них).
Опыт показывает, что в большинстве случаев невозможно найти такой критерий качества K, чтобы названные статистические свойства оценок удовлетворялись в совокупности, хотя они и не являются противоречащими друг другу. Данные свойства называются вторичными оптимальными свойствами оценок, поскольку первичное свойство определяется критерием качества.
Для решения вопроса о выборе критерия качества, обеспечивающего получение оценок, обладающих какими-то вторичными свойствами, необходимо из всех вторичных свойств выбрать одно или несколько свойств, чтобы множество методов оценивания было разбито на два класса. В первый класс должны войти методы, обеспечивающие выбранные свойства (множество состоятельных методов), во второй - все остальные (множество несостоятельных методов). Среди состоятельных методов оценивания (состоятельных критериев качества) далее можно искать метод, которому соответствует наиболее эффективная вычислительная процедура решения задачи.
Из перечисленных выше статических свойств оценок наименее ограничительными является свойство состоятельности. Однако условие (1.22) обеспечивает лишь слабую сходимость или сходимость по вероятности, что не является достаточной гарантией для получения желательной оценки. Поэтому на практике используются еще два вида сходимости [2, 3].
1. Сходимость сильная, или почти наверное,
. (1.24)
2. Сходимость в среднем квадратическом,
.(1.25)
Если выбрать в качестве оптимального свойства сильную сходимость, то получим следующее определение состоятельности критерия K. Критерий качества К называется состоятельным по отношению к паре G - S, если соответствующее ему решение является единственным и обладает свойством сильной сходимости к действительному значению .
В случае, когда модель G эквивалентна реальному поведению R, то . Если условие эквивалентности не выполняется, но выполняется условие ?-адекватности, то начальные условия могут не совпадать. Расстояние между ними будет
, (1.26)
где - некоторое число, зависящее от ? . В этом случае условие (1.24) в определении состоятельности критерия качества должно выполняться не для всякого ? > 0, а только для .
Если решение задачи оценивания получено в аналитическом виде и имеется плотность вероятности р(?) выборочного вектора ?, то появляется возможность использования необходимых или достаточных условий состоятельности, когда критерий K обеспечивает получение единственного решения .
Если учесть, что из сильной сходимости следует слабая сходимость, то имеем следующий критерий: для состоятельности критерия качества К по отношению к паре G - Q необходимо, чтобы оценка обладала свойством сходимости по вероятности
. (1.27)
Признаком слабой сходимости может быть выполнение следующего условия: для каждого ? > 0 существует такое натуральное число К, при котором для любого l > 0 справедливо неравенство
. (1.28)
Если все оценки ограничены в совокупности, то данный признак является также и необходимым.
Следующий критерий, отражающий достаточные условия состоятельности K, выглядит так: для состоятельности критерия качества K по отношению к паре G - Q достаточно, чтобы оценка обладала свойством сходимости в среднем квадратическом:
(1.29)
и чтобы
. (1.30)
Данным критерием можно пользоваться, если имеется выражение для математического ожидания квадрата нормы отклонения оценки от действительного значения в зависимости от числа К результатов измерений.
Сформулированные критерии задают некоторые границы состоятельности критерия качества К. С использованием неравенства Чебышева можно сформулировать следующие менее сложные с практической точки зрения критерии, выполнение которых гарантирует необходимое условие состоятельности K. Первый критерий: если оценка обладает свойством сходимости в среднем квадратическом
(1.31)
то она обладает свойством слабой сходимости. Второй критерий: если оценка обладает свойством асимптотической несмещенности
(1.32)
И
, (1.33)
то она обладает свойством слабой сходимости.
В [2, 3] дана характеристика наиболее распространенных на практике функций потерь, которые задают многообразие критериев качества, применяемых в задачах оценивания. Там же перечисляются основные свойства риска , непосредственно вытекающие из свойств применяемой функции потерь.
2. Приближение и дифференцирование полезных сигналов в классе функций с финитным спектром
2.1 Интерполяция функций с финитным спектром
В данном разделе в качестве моделей полезных сигналов используются функции с финитным спектром (ФФС) [29], для которых в соответствии с известной теоремой отсчетов справедливо представление в виде ряда Котельникова. На базе ФФС развивается метод косвенного оценивания локальных характеристик полезного сигнала, который в отличие от традиционных подходов в меньшей степени чувствителен к случайным ошибкам измерений и может быть применен для вычисления соответствующей производной в любой точке фиксированного интервала наблюдения.
Следует отметить, что необходимость оценивания локальных характеристик до N-гo порядка включительно возникает довольно часто при решении широкого круга прикладных задач. При этом на практике, как правило, используются достаточно простые в вычислительном плане косвенные методы оценивания, основанные на численном дифференцировании измеренных сигналов с использованием разностных шаблонов. Среди данных методов наиболее распространены методы скользящего дифференцирования [26, 27], предполагающие разложение дифференцируемой функции в соответствующий конечный ряд Тейлора и вычисление искомой производной только для одной (средней) точки выбранного интервала измерений. Основной недостаток указанных методов состоит в следующем. Для уменьшения остаточной (методической) погрешности требуется либо уменьшать шаг дискретизации по времени либо повышать порядок используемых разностей. Но и в том, и в другом случаях резко возрастают погрешности, вызываемые случайными ошибками измерений. Как показано в [26], численные методы, основанные на разностных представлениях, относятся к классу некорректных, поскольку теряют устойчивость при наличии случайных ошибок, которые неизбежно сопутствуют процессу измерений.
Метод N-кратного дифференцирования ФФС, предлагаемый в данном разделе, позволяет разрабатывать алгоритмы косвенного оценивания, которые в отличие от традиционных являются корректными в вычислительном плане.
Ниже обсуждаются отдельные результаты [4, 5, 12], касающиеся интерполяции и аппроксимации ФФС и функций с нефинитным спектром, которые будут использованы нами при изложении основного материала.
Пусть функция f(t), интегрируемая в квадрате на всей вещественной оси, представима в виде
(2.1)
где F(i?) - спектральная плотность функции f(t),
(2.2)
Согласно известной теореме Винера-Пэли-Шварца, для того чтобы f(t) была функцией с финитным интегрируемым в квадрате спектром F(i?), необходимо и достаточно, чтобы f(t) могла быть доопределена в комплексной плоскости как целая функция конечной степени, интегрируемая в квадрате на всей вещественной оси. Следуя [29], обозначим через класс функций f(t) с финитным интегрируемым в квадрате спектром F(i?), для которого справедливо представление (2.1).
Поскольку f(t) может быть доопределена как целая функция конечной степени, то можно воспользоваться следующей интерполяционной формулой Котельникова:
(2.3)
где - шаг между отсчетами fk = f(k?t) функции f(t); sincx = sinx/x.
Формула (2.3) показывает, что для восстановления ФФС f(t) на всей вещественной оси необходимо использовать лишь значения этой функции fk, называемые отсчетами, которые выбираются через равные интервалы . В разложении (2.3) можно воспользоваться отсчетами , взятыми в периодической последовательности точек при любом фиксированном t0, которое указывает лишь начало отсчета переменной t, и при любом . Последнее утверждение следует из того, что если спектр f(t) сосредоточен в интервале (-2?Fmax, 2?Fmax) = (-?, ?), то он подавно сосредоточен в большем интервале , где . Если функция f(t) принадлежит пространству , причем интервал (-?, ?) - это наименьший интервал, вне которого спектр F(i?) тождественно равен нулю, то величина ?t = ?/? = l/(2Fmax) указывает наибольший возможный интервал между отсчетами, при котором представление (2.3) еще справедливо.
Таким образом, формула (2.3) отражает замечательное свойство ФФС - свойство однозначной восстановимости значений функции на всей оси по ее значениям в дискретной (периодической) последовательности точек.
В формуле (2.3) предполагается использование неограниченного числа отсчетов функции f(t). Очевидно, что для конечного числа отсчетов применение формулы (2.3) без дополнительных ограничений приводит к неединственности решения интерполяционной задачи. Для того чтобы данное решение было единственным, обычно сужают класс функций, в котором решается интерполяционная задача. Укажем три известных способа введения указанных ограничений.
Первый способ состоит в специальном задании отсчетов вне того интервала, на котором определена функция. Второй способ заключается во введении дополнительного ограничения экстремального типа: из всех ФФС в интервале (-?, ?), обладающих заданными величинами отсчетов в конечном числе узлов, выбирается та, которая минимизирует некоторый функционал. Третий способ предполагает ограничение энергии функции вне заданного интервала и подбор минимального числа степеней свободы (свободных параметров), при котором достигается требуемая точность приближения функции.
Рассмотрим конкретные примеры применения этих различных подходов.
При первом подходе положим равными нулю все отсчеты функции f(t), кроме тех, которые заданы на отрезке [0, Т]. Отсчеты берутся в моменты
0 ? t0 < t1 < ... < tK ? Т. Такая интерполяционная задача имеет бесконечное множество решений, поскольку не заданы отсчеты функции f(t) вне отрезка [0,T].
Если же положить
f(tk) = 0 (2.4)
при k < 0 и k > К, т.е. считать, что все отсчеты вне отрезка [0, Т] равны нулю, то интерполяционная задача имеет единственное решение. Например, в случае равномерно следующих отсчетов из формулы (2.3) получаем общее представление для множества функций из класса , отсчеты которых равны нулю вне отрезка [0, T]:
(2.5)
Число отсчетов, которые берутся внутри отрезка [0, T], здесь равно К + 1 = 2FmaxT + 1, т.е. считаем, что на отрезке [0, T] укладывается целое число интервалов длительности ?t. Следует особо подчеркнуть, что если все отсчеты вне отрезка [0, T] равны нулю, то из этого вовсе не вытекает, что функция f(t) тождественно равна нулю вне отрезка [0, T].
Обратимся теперь ко второму из указанных подходов к ограничению класса функций. В качестве примера рассмотрим функции с минимальной энергией. Среди всех функций класса выделим ту, для которой полная энергия минимальна:
(2.6)
Нетрудно указать представление для этого класса функций с минимальной энергией, который мы обозначим через . Класс - это подмножество класса , следовательно, по теореме отсчетов для любой из функций имеем представление вида (2.3).
Члены ряда (2.3) попарно ортогональны на всей оси в силу соотношений
(2.7)
Поэтому, возводя обе части равенства (2.3) в квадрат, раскрывая скобки и интегрируя почленно, получаем
(2.8)
Предположим сначала, что отсчеты на отрезке [0, T] берутся в моменты Поскольку в правой части равенства (2.8) стоит ряд из неотрицательных величин, причем отсчеты fk, фиксированы, выражение (2.8) достигает минимума, когда все остальные отсчеты обращаются в нуль. Следовательно, в том случае, когда отсчеты на отрезке [0, T] берутся в моменты , ФФС и минимальной энергией задаются формулой (2.5).
Таким образом, для восстановления функции рассматриваемого класса достаточно знать лишь отсчеты fk, и в классе эта интерполяционная задача имеет единственное решение.
2.2 Аппроксимация функций с финитным спектром
Рассмотрим теперь возможность аппроксимации с заданной точностью
? > 0 на отрезке [0, T] функции при помощи конечного числа членов ряда Котельникова (2.3). Очевидно, что такая возможность существует, поскольку ряд (2.3) сходится равномерно в каждой ограниченной области. Таким образом, для каждого отрезка [0, T] и заданного ? > 0 можно указать такие числа i и т, что при 0 ? t ? T будет выполняться неравенство
(2.9)
Однако длительность m?t интервала времени, на котором в данном случае берутся отсчеты, может значительно превосходить величину Т. Поэтому возникает вопрос о том, с какой точностью приближается функция , задаваемая рядом (2.3), если воспользоваться лишь некоторым фиксированным числом членов этого ряда.
Рассмотрим частную сумму ряда (2.3) при нечетном числе отсчетов, равном 2K + 1:
(2.10)
Введем невязку
(2.11)
Из (2.11) следует, что отбрасывание «хвостов» ряда Котельникова приводит к среднеквадратической ошибке аппроксимации ФФС. Эта ошибка равна энергии «хвостов».
Для оценки погрешности, возникающей при замене ряда Котельникова частной суммой вида (2.10), целесообразно ввести определенные предположения относительно скорости убывания функции f(t) при |t| > ?.
Предположим, что
(2.12)
(для удобства вместо [0, Т] рассматривается отрезок [-T/2, T/2]).
Используя результаты работ [4, 12], не сложно показать, что ограничение (2.12) приводит к следующей оценке
(2.13)
Анализ функции ?K(t) показывает, что в точках она обращается в нуль, а ее максимумы растут по мере приближения к краям отрезка [-K?t, K?t].
Приведенные в данном подразделе результаты составляют основу аппроксимации функций, которые встречаются в задачах оценивания и могут быть отнесены к классу ФФС. Однако на практике у реальных функций спектр не может быть финитным. Таким образом, для построения адекватных моделей необходимо выяснить влияние отбрасываемых «хвостов» спектра функции на качество ее аппроксимаций.
2.3 Аппроксимация функций с нефинитным спектром
Прежде всего, рассмотрим задачу приближения произвольных функций с конечной полной энергией (т.е. интегрируемых в квадрате на всей оси) при помощи ФФС и конечной полной энергией.
Пусть ?(t) - произвольная функция, интегрируемая в квадрате на всей оси -? < t < ?, и пусть. Рассмотрим выражение
(2.14)
которое имеет смысл полной энергии разности этих функций и равно квадрату среднеквадратической погрешности при аппроксимацией функции ?(t) функцией f(t).
Поставим перед собой задачу: среди всех функций f(t) пространства найти ту, которая обращает в минимум величину , т.е. осуществляет наилучшие приближенные функции ?(t) в среднеквадратическом смысле.
Для решения задачи заметим, что разность ?(t) - f(t) также интегрируема в квадрате на всей оси. Поэтому, используя равенство Парсеваля имеем
(2.15)
где F?(i?) - спектральная плотность функции ?(t).
Представим себе теперь, что мы хотим применить метод, основанный на теореме отсчетов, для аппроксимации функции с нефинитным спектром. Если выбрать шаг между моментами отсчета равным ?t = ?/? и составить ряд Котельникова для функции ?(t), спектр которой не финитен, то получим новую функцию
(2.16)
где ?k = ?(k?t).
Для того чтобы ряд (2.16) сходился равномерно в каждой ограниченной области, а функция принадлежала пространству , нужно наложить определенные ограничения на поведение чисел ?k, т.е. сузить класс рассматриваемых функций ?(t). Будем для простоты предполагать функцию F?(i?) непрерывной на всей оси и убывающей при |?| > ? быстрее, чем при некоторых ? > 0, ? > 1. Эти условия обеспечивают интегрируемость в первой степени и в квадрате спектральной плотности F?(i?) на всей оси, и, следовательно, обеспечивают непрерывность функции и ее квадратичную интегрируемость.
Функция имеет финитный спектр в интервале (-?, ?). Оценка разности по абсолютной величине:
(2.17)
где
(2.18)
Таким образом, при анализе и синтезе моделей на основе рядов Котельникова необходимо учитывать результирующую погрешность приближения (аппроксимации), обусловленную ошибками двух типов. Ошибки первого типа обусловлены усечением в частотной области (т.е. осуществляется переход к функциям с финитным спектром из класса ), а ошибки второго типа - усечением в пространственной (временной) области (т.е. осуществляется ограничение числа отсчетов аппроксимируемой функции).
2.4 Дифференцирование функций с финитным спектром
Рассмотрим новый метод N-кратного дифференцирования, базирующийся на применении ряда Котельникова, который по сравнению с известными методами в большой степени ориентирован на решение конкретных задач оценивания.
Пусть задана функция f(t), принадлежащая к классу , для которой справедливо разложение в виде ряда Котельникова (2.3). Рассмотрим производную N-го порядка f(N)(t) от функции f(t), представимой рядом (2.3). Относительно функции f(N)(t) () можно утверждать, что она, так же как и функция f(t), может быть доопределена в комплексной плоскости как целая функция конечной степени, интегрируемая в квадрате на всей вещественной оси, и для нее справедливо представление
(2.19)
где
Таким образом, располагая совокупностью отсчетов , в соответствии с (2.19) можно однозначно восстановить всю функцию .
Поставим задачу найти точные аналитические выражения для отсчетов , позволяющие по заданной совокупности находить искомую совокупность , а на ее основе восстановить функцию .
Для случая произвольного N применительно к функциям , заданным бесконечной совокупностью отсчетов, можно воспользоваться следующим результатом.
Для класса ф ункций f(t) с финитным спектром производная N-гo порядка f(N)(t) в отсчетных точках вычисляется по таким формулам:
для четных
(2.20)
для нечетных
(2.21)
([х] - целая часть числа х).
Вывод данных формул (опущен в силу громоздкости) базируется на использовании формулы Лейбница для N-кратного дифференцирования произведения двух функций и раскрытии неопределенностей типа 0/0, появляющихся при переходе к отсчетным точкам.
Остановимся на вопросе дифференцирования функции fK(t), которая задается в виде конечного ряда Котельникова и интерполирует исходную функцию. Очевидно, что спектр функции fK(t) сосредоточен в интервале (-?, ?), и, следовательно, . Производная N-гo порядка от функции в отсчетных точках вычисляется по формулам:
для четных
(2.22)
для нечетных
(2.23)
Формулы (2.22), (2.23) непосредственно следуют из (2.20), (2.21), если в последних перейти от бесконечных сумм по индексу i к конечным суммам.
Формулы (2.22) и (2.23) также допускают векторно-матричную форму записи:
(2.24)
где
(2.25)
для четных
(2.26)
для нечетных
2.5 Погрешности дифференцирования функций с финитным спектром
Для оценки погрешностей дифференцирования введем ограничение на поведение функции при Положим, что для интегрируемой в квадрате функции , выполняется неравенство (2.12).
Введем теперь меру отклонения функций f(N)(t) и в отсчетных точках отрезка [-Т, Т]:
(2.27)
где
Рассмотрим первый случай, когда при фиксированных
и d > 1 последовательность монотонно убывает
(при i = - К - 1, - К - 2,... и i = K + 1, K + 2,...).
Если последовательность монотонно убывает
(при i = - К - 1, - К - 2,... и i = K + 1, K + 2,...) и, кроме того, выполняется условие (2.12), то для погрешности дифференцирования функции справедлива оценка
(2.28)
где
При получении оценки (2.28) был использован известный признак Лейбница для установления сходимости знакочередующихся рядов.
Поскольку для функций f(t) из класса величина является фиксированной, то в формуле (2.28) варьируемыми оказываются параметры Т и К. Значения данных параметров выбираются из условия обеспечения требуемой точности N-кратного дифференцирования.
Рассмотрим теперь более общий случай, когда последовательность может не являться монотонно убывающей, однако условие (2.12) выполняется.
Если выполняется условие (2.12), то для погрешности дифференцирования функции справедлива оценка
(2.29)
Введем теперь меру отклонения функций и :
(2.30)
где
Если выполняется условие (2.12), то для погрешности дифференцирования функции на отрезке [-Т, T] справедлива оценка
(2.31)
где в зависимости от характера поведения f(t) при удовлетворяет неравенствам (2.28) или (2.29),
(2.32)
При расчетах в соответствии с формулой (2.31) можно воспользоваться оценкой
(2.33)
которая показывает, что величина среднеквадратического отклонения не превосходит полной энергии функции . В этом случае
(2.34)
Если ввести ограничения на поведение функции :
(2.35)
то применительно к можно воспользоваться более строгой оценкой
(2.36)
2.6 Дифференцирование функций с нефинитным спектром
Рассмотрим возможность применения изложенного в предыдущих подразделах математического аппарата для N-кратного дифференцирования функций с нефинитным спектром.
Пусть ?(t) - произвольная функция, у которой производная абсолютно непрерывна на каждом конечном интервале и Для непрерывной на всей оси спектральной плотности функции ?(t) введем следующее ограничение
(2.37)
Допустим, что среди всех функций из класса выбрана та f(t), которая обращает в минимум выражение
(2.38)
где и - спектральные плотности функций ?(t) и f(t) соответственно.
Как указывалось в подразд. 2.3, минимум достигается тогда, когда
(2.39)
при этом
(2.40)
Отклонение функций и
(2.41)
при выполнении условий (2.37), (2.39) удовлетворяет неравенству
(2.42)
где .
Результирующую погрешность находится так
(2.43)
Таким образом, полученные формулы позволяют оценить результирующую погрешность N-кратного дифференцирования, возникающую при использовании ФФС к реальным сигналам.
2.7 Дифференцирование финитных функций
Обратимся теперь к наиболее распространенному в практике случаю, когда дифференцируемые функции являются финитными на временной оси, и, следовательно, не принадлежат классу ФФС.
Анализ приведенных ранее аналитических зависимостей показывает, что погрешность N-кратного дифференцирования на основе ряда Котельникова определяется уровнями усечения функции и ее спектра, а также скоростями их убывания соответственно в пространственной (временной) и частотной областях. Для функций, имеющих высокую скорость убывания в указанных областях, рассмотренный математический аппарат позволяет обеспечить требуемую точность N-кратного дифференцирования на заданном отрезке [-Т, Т], если уровни усечения не превышают некоторых заранее установленных значений. Рассмотрим возможность применения данного аппарата для вычисления производных соответствующего порядка от финитных функций имеющих «плохие» спектральные свойства и большие уровни усечения в пространственной (временной) области.
Первый подход к дифференцированию финитных функций, основанный на сплайн-продолжениях, состоит в следующем. Пусть - произвольная финитная функция (рис. 2.1), у которой производная непрерывна, а кусочно-непрерывна на отрезке [-Т, Т]. Используя операцию сплайн-продолжения, перейдем от функции заданной на отрезке [-Т, Т], к новой функции , заданной на всей вещественной оси (рис. 2.2):
Рисунок 2.1 Рисунок 2.2
(2.44)
где ?1(t) и ?2(t) - вспомогательные функции, у которых производные и непрерывны при и соответственно, и, кроме того, выполняются равенства (условия «стыковки»)
(2.45)
Таким образом, из исходной финитной функции получили сплайн-продолженную функцию ?(t), заданную на интервале (-?, ?), состоящем из основного информационного отрезка [-Т, Т] и двух вспомогательных неинформационных полуоткрытых интервалов и .
Далее, вводя оператор усечения в пространственной (временной) области перейдем от ?(t) к финитной функции , заданной на отрезке (рис. 2.3). При этом потребуем выполнения следующего условия:
(2.46)
где - уровни усечения функции ?(t) и ее производных , которые выбираются с учетом полученных в предыдущих подразделах аналитических зависимостей исходя из условия минимизации результирующей погрешности N-кратного дифференцирования (N < M).
Рисунок 2.3
Очевидно, что периодически (с периодом ) продолженная на всю числовую ось функция остается непрерывной на этой оси вместе со своими производными до (М - 1)-го порядка включительно. Вспомогательные функции ?1(t) и ?2(t), удовлетворяющие условиям (2.45), (2.46), могут быть достаточно произвольного вида. Однако полагаем, что независимо от вида финитной функции в качестве ?1(t) и ?2(t) используются функции, интегрируемые в квадрате, т.е. и . Каждая из функций ?1(t) и ?2(t) должна удовлетворять 2М условиям (2.45), (2.46) и поэтому имеет 2М подлежащих определению коэффициентов.
Необходимость введения условий (2.45), (2.46) можно обосновать из следующих соображений. Если финитную функцию периодически продолжить на всю числовую ось (обозначим полученную функцию через ), то коэффициенты соответствующего ряда Фурье можно определить по формуле
(2.47)
при этом скорость убывания коэффициентов ck с возрастанием определяется дифференциальными свойствами данной периодической функции.
Близким по своей сути к подходу, основанному на сплайн-продолжении, является известный метод Малиева разложения функций в быстросходящиеся ряды Фурье. Однако данный метод предполагает лишь одностороннее продолжение исходной финитной функции с обеспечением выполнения условия непрерывности соответствующей периодической функции и ее производных различных порядков.
Построение же функции ?(t) (2.44) требует двухстороннего продолжения , выполнения указанного условия непрерывности (2.45) и обеспечения требуемых уровней усечения функции ?(t) и ее производных
в пространственной (временной) области (см. (2.46)).
Второй подход к дифференцированию финитных функций, имеющих «плохие» спектральные свойства, состоит в домножении исходной функции заданной на отрезке [-Т, Т], на некоторую функцию-регуляризатор (где ? - вектор постоянных параметров), заданную на том же отрезке [-Т, T] или на расширенном отрезке :
(2.48)
где является продолжением функции с отрезка [-Т, T] на отрезок с сохранением свойства непрерывности. Для функции и ее производных различных порядков на краях отрезка можно задать соответствующие уровни усечения (по аналогии с (2.46)) исходя из условия минимизации результирующей погрешности N-кратного дифференцирования.
В качестве функции-регуляризатора можно рассматривать функцию вида
(2.49)
где при .
В простейшем случае в качестве можно рассматривать гауссовскую кривую, характеризующуюся двумя параметрами. Известно [29], что такая кривая имеет максимально возможную скорость убывания в пространственной и частотной областях и реализует знак равенства в известном «соотношении неопределенности». Выбор значений параметров гауссовской кривой, обеспечивающих требуемое поведение функции и ее спектра соответственно в пространственной (временной) и частотной областях, не представляет затруднений, поскольку известно, что убывает на бесконечности быстрее любой степени t при ? > 0.
Рисунок 2.4
Если найдена производная , то вычисление искомой производной осуществляется в соответствии с известной формулой [4], в которой необходимо заменить на на и на Для того чтобы избежать трудоемкой в вычислительном плане операции восстановления искомой производной в соответствии с указанной формулой, можно использовать в качестве функцию-регуляризатор срезывающего типа [4]. Данная функция является бесконечно дифференцируемой на всей вещественной оси (-?, ?) и вместе со своими производными тождественно равна нулю для всех Кроме того, функция-регуляризатор срезывающего типа на отрезке [-Т, T] тождественно равна единице, и, следовательно, составная функция на отрезке [-T, T] повторяет исходную функцию . Однако построение срезывающих функций сводится к вычислению соответствующих определенных интегралов, что создает определенные неудобства на практике по сравнению с функциями типа (2.49).
Ниже приводятся результаты численного эксперимента, направленного на вычисление первой и второй производных от финитных функций (рис. 2.4), (рис. 2.5) и (рис. 2.6), существующих на отрезке [-Т, T]. В качестве продолженных использовались соответственно функции , и , существующие на отрезке , а в качестве - функция-регуляризатор (2.49):
Рис. 2.5 Рис. 2.6
где (полагалось, что в векторе ? все параметры равны нулю, за исключением и , а параметр ),
где ,
Данные выражения позволяют находить приближенные значения производных и в отсчетных точках , отрезка . При практических расчетах необходимо помнить, что отрезку [-Т, Т] соответствует сетка интерполяции объемом 2К + 1, а отрезку - сетка объемом . При этом узлы отрезка образуются путем добавления к узлам , слева и справа соответствующего числа узлов.
Рисунок 2.7 Рисунок 2.8
На рис. 2.7 приведены зависимости относительной погрешности вычисления (для случая, когда )
от объема сетки аппроксимации для функций (кривая 1), (кривая 2) и (кривая 3) при следующих исходных данных:
T = 3, , Кривые 1,2 и 3 на рис. 2.8 показывают зависимость от для функций , и соответственно при Т = 3, К = К + 2 = 8, N = 1.
Анализ графиков (см. рис. 2.7 и 2.8) показывает: во-первых, высокая точность вычисления производных обеспечивается при достаточно малых объемах сетки интерполяции; во-вторых, точность расчетов существенно зависит от выбора значений параметров и , которые определяются исходя из условия минимизации результирующей погрешности дифференцирования с учетом формул, полученных в предыдущих подразделах.
Рисунок 2.9 Рисунок 2.10
На рис. 2.9 и 2.10 приведены аналогичные зависимости от параметров и для N = 2 (кривые 1, 2 - для функции , кривые 3, 4 - для функции ). Зависимости рассчитывались при следующих исходных данных: на рис. 2.9 кривые 1, 3 - = 4•10-4, Т = 3, кривые 2, 4 - = 4•10-5, Т = 3, на рис. 2.10 кривые 1, 3 -= К + 3 = 8, Т = 3; кривые 2, 4 - = К + 4 = 9, Т = 3.
Анализ графиков (см. рис. 2.9 и 2.10) показывает, что погрешности вычисления второй производной близки к погрешностям вычисления первой производной (по порядку и характеру поведения кривых). При этом лишь незначительно (4 и 6 точек) увеличивается объем сетки отрезка [-Т, Т], обеспечивающий требуемую точность вычислений.
Рисунок 2.11
На рис. 2.11 представлены зависимости от при следующих исходных данных: кривая , = 1•10-5, T = = 3, N = 1; кривая 2 - = 14, = 1•10-5, T = 3, N= 1; кривая , = 1•10-5, T = 3, N = 2; кривая , = =1•10-5, T = 3, N = 1.
Анализ графиков (см. рис. 2.11) показывает, что точность вычислений существенно зависит от числа дополнительных точек, причем с добавлением каждой новой пары точек погрешность дифференцирования уменьшается более чем на порядок и уже при дальнейшее приращение в точности становится практически незначительным.
2.8 Влияние погрешностей задания отсчетов функций на точность дифференцирования
При практической реализации численных алгоритмов дифференцирования на ЭВМ принципиальным является вопрос, связанный с устойчивостью разрабатываемых алгоритмов по отношению к методическим погрешностям и погрешностям задания отсчетов дифференцируемых функций. Последний вид погрешностей связан, например, с ошибками округления или измерения, которые необходимо учитывать при решении задачи оценивания.
Покажем, что математический аппарат N-кратного дифференцирования на основе ряда Котельникова в большинстве практически важных случаев является более устойчивым по отношению к случайным ошибкам задания отсчетов дифференцируемых функций по сравнению с традиционными методами, предполагающими использование конечно-разностных схем.
Пусть ?(t) - произвольная функция, методическая погрешность N-кратного дифференцирования которой не превышает величины . Считаем также заданным вектор отсчетов где - вектор-столбец отсчетов дифференцируемой функции ?(t); - вектор-столбец ошибок задания отсчетов исходной функции ?(t) на отрезке [-Т, Т]. Принимаем, что ошибка является векторной случайной величиной, имеющей нулевое математическое ожидание и соответствующую корреляционную матрицу где - дисперсия.
Учитывая, что модель отсчетов предполагает наличие гауссовских ошибок, а формулы N-кратного дифференцирования на основе ряда Котельникова соответствуют линейным преобразованиям над отсчетами исходной функции, корреляционную матрицу ошибок вычисления значений компонент вектора производных можно представить в следующем виде [2]:
(2.50)
где - матрица дифференцирования.
Если матрица является диагональной, причем
то элементы матрицы можно определить следующим образом:
(2.51)
для четных ;
(2.52)
для нечетных .
Анализ выражений (2.51) и (2.52) показывает, что степень устойчивости результатов дифференцирования к случайным ошибкам задания отсчетов функции ?(t) в основном определяется величиной Поскольку метод N-кратного дифференцирования на основе ряда Котельникова работоспособен при достаточно больших значениях ?t (для функций с «хорошими» спектральными свойствами), а традиционные (конечно-разностные) методы - лишь при малых значениях , то можно утверждать, что в большинстве практически важных случаев, встречающихся при решении задач оценивания, может быть достигнута более высокая устойчивость к указанным ошибкам. Очевидно, что чем «лучше» спектральные свойства функции ?(t) (уже ее спектр), тем больше ?t, и, следовательно, меньшие значения дисперсии
По аналогии с [2] в качестве величины, характеризующей суммарную ошибку алгоритма N-кратного дифференцирования, основанного на применении ряда Котельникова, можно взять сумму квадратов максимальной случайной ошибки и методической ошибки :
(2.53)
где
Поскольку за счет рационального выбора параметров методическая ошибка может быть сведена к сколь угодно малой величине, то очевидно, что результирующая ошибка N-кратного дифференцирования будет в основном определяться величиной .
Для снижения влияния случайных ошибок задания отсчетов на точность дифференцирования можно воспользоваться алгоритмом взвешенного суммирования единичных оценок. Очевидно, что для получения совокупности некоррелированных единичных оценок с помощью алгоритма (2.22), (2.23) необходимо на интервале [-Т, Т] задавать семейство сеток интерполяции, не имеющих общих узлов.
Рассмотрим следующий иллюстративный пример. Пусть требуется оценить радиальную скорость изменения дальности где а и b - некоторые константы. Данная формула соответствует движению летательного аппарата на постоянной высоте и с постоянной скоростью. Интервал отсчетов 2Т = 16 (здесь и далее все величины полагаем безразмерными), а = 104, b = 2,5•102, ошибки , взаимно не коррелированы, распределены по нормальному закону с нулевым математическим ожиданием и дисперсией . В качестве функции-регуляризатора использована функция вида
Рисунок 2.12
Проведенный анализ показал, что для обеспечения абсолютной методической погрешности вычисления искомых производных радиальной дальности R(t) на основе разработанного алгоритма (2.23) достаточно выбрать шаг ?t = 0,8. При расчетах же методом скользящего дифференцирования необходим шаг ?t = 0,1.
На рис. 2.12 изображены графики, иллюстрирующие зависимость относительной погрешности вычислений от :
Подобные документы
Фильтрация ошибок измерений при оценивании линейного преобразования полезного сигнала. Физическая природа помех, уменьшение степени их влияния на работу информационно-измерительных систем. Статистическая обработка измерений, метод наименьших квадратов.
дипломная работа [1,4 M], добавлен 18.05.2012Объединение проекционных регрессионных методов с методом простейшего интервального оценивания для решения задач многомерной калибровки. Использование компьютерной программы SIC для обработки наборов многоканальных сигналов и оценки точности калибровки.
курсовая работа [854,9 K], добавлен 24.09.2012Формальная классификация моделей. Математические модели измерительных приборов. Применение фильтра Калмана в обработке спутниковых сигналов. Ошибки измерений и их порядки. Свойства условных вероятностей. Оценивание по минимуму апостериорной дисперсии.
курсовая работа [1,9 M], добавлен 09.10.2013Методы цифровой обработки сигналов в радиотехнике. Информационные характеристики системы передачи дискретных сообщений. Выбор длительности и количества элементарных сигналов для формирования выходного сигнала. Разработка структурной схемы приемника.
курсовая работа [370,3 K], добавлен 10.08.2009Процесс приема сигналов на вход приемного устройства. Модели сигналов и помех. Вероятностные характеристики случайных процессов. Энергетические характеристики случайных процессов. Временные характеристики и особенности нестационарных случайных процессов.
дипломная работа [3,3 M], добавлен 30.03.2011Пример снижения уровня помех при улучшении заземления. Улучшение экранирования. Установка фильтров на шинах тактовых сигналов. Примеры осциллограмм передаваемых сигналов и эффективность подавления помех. Компоненты для подавления помех в телефонах.
курсовая работа [1,5 M], добавлен 25.11.2014Общие сведения о радиолокационных системах. Алгоритмы и устройства зашиты от комбинированных помех. Принципы статистического моделирования измерительных радиолокационных систем в условиях воздействия комбинированных помех. Структура затрат на элементы.
дипломная работа [894,7 K], добавлен 04.02.2013Тензометрический метод оценки состояния двигательных отделов центральной нервной системы. Структурная организация тензометрического треморографа. Основные задачи статистической обработки изометрических данных. Методы корреляции и главных компонент.
курсовая работа [757,7 K], добавлен 15.06.2014Характеристика видов и цифровых методов измерений. Анализ спектра сигналов с использованием оконных функций. Выбор оконных функций при цифровой обработке сигналов. Исследование спектра сигналов различной формы с помощью цифрового анализатора LESO4.
дипломная работа [2,5 M], добавлен 03.05.2018Радиотехнические системы передачи информации: методы передачи, регистрации и хранения двоичных сигналов. Неидентичность характеристик канала, действия помех, виды искажения сигналов. Общие принципы и закономерности построения РТС, техническая реализация.
реферат [92,1 K], добавлен 01.11.2011