Оптимальная линейная динамическая фильтрация. Оптимальный фильтр Калмана—Бьюси

Как известно, сущность фильтрации состоит в непрерывном оценивании изменяющихся во времени параметров случайного процесса. Если сообщение является скалярным марковским процессом (для стационарного гауссовского процесса это означает, что ковариационная функция имеет вид Aexp(-B|t-u|), то решение задачи может быть основано на следующих принципах, упрощающих достижение цели:

Описание интересующих нас процессов следует выполнять при помощи линейных систем с изменяющимися во времени параметрами, которые генерировали бы их при подаче на входы систем белого шума;

Линейную систему, генерирующую сообщение, следует описывать при помощи дифференциального уравнения, решением которого является искомое сообщение;

Оптимальную оценку как выходную величину линейной системы следует задавать как решение дифференциального уравнения, коэффициенты которого определяются статистикой процессов.

Линейные системы, построенные по указанным принципам, носят название фильтров Калмана-Бьюси, которым принадлежат оригинальные работы в этой области. В отличие от этих принципов в интегральной винеровской фильтрации описание процессов осуществляется с помощью ковариационных функций, линейных систем - с помощью импульсной переходной характеристики, оптимальных оценок - как решение интегрального уравнения Винера-Хопфа.

Дифференциальное уравнение оптимального фильтра Калмана в канонической форме имеет вид:

где -матричный коэффициент усиления оптимального фильтра.

Фильтр Калмана осуществляет динамическую оптимальную фильтрацию нестационарных случайных процессов. Решение задачи оптимальной фильтрации сводится к решению системы векторно-матричных дифференциальных (или разностных) уравнений. Этот метод позволяет оперировать замкнутой системой уравнений в рекуррентной форме, что является наиболее удобным при технической реализации. По существу, фильтр Калмана представляет собой вычислительный алгоритм обработки информации, использующий комплекс априорных сведений об исходной системе (структура, параметры, статистические характеристики шумов состояния и шумов измерения, сведения о начальных условиях и т.д.). Такой фильтр производит статистическую обработку информации наблюдения с учетом динамических свойств модели исходной системы. Структура калмановского фильтра представляет собой модель исходной динамической системы с коррекцией ошибки фильтрации корректирующим сигналом

где - корректирующий сигнал вида:

В этом случае оптимальный нестационарный динамический фильтр Калмана представляет собой замкнутую автоматическую систему регулирования, содержащую математическую модель исходной системы, причем на выходе модели вырабатывается оценка состояния, а на вход поступает сигнал коррекции с матричным нестационарным коэффициентом усиления K(t):

Следовательно, алгоритм динамической фильтрации основан на классическом принципе регулирования по отклонению с матричным коэффициентом усиления K(t), обеспечивающим минимальную среднюю квадратическую ошибку фильтрации. Корректирующий сигнал состоит из текущего сигнала наблюдения z(t) за состоянием исходной системы, дополненного текущим сигналом состояния модели исходной системы. Сигнал является сигналом коррекции ошибки фильтрации и характеризует дополнительную информацию между текущими измерениями z(t) и оценками состояния, полученными по результатам оценок , предшествующих текущим измерениям z(t). Матричная cxeма оптимального фильтра Калмана имеет вид, показанный на рис. 4.18. Эта схема реализует алгоритм динамической фильтрации, когда состояние исходной системы задается дифференциальными уравнениями, правая часть которых не зависит от наблюдения.

Оптимальная дискретная фильтрация Калмана получила особенно большое распространение в связи с развитием ем дискретных методов обработки информации. Она является распространением результатов непрерывной оптимальной динамической фильтрации на дискретные динамические системы, описываемые разностными векторно-матричными уравнениями.

Рис. 4.17 . Матричная схема оптимального фильтра Калмана

Уравнение оптимального линейного фильтра позволяет последовательно вычислять оценки. Для вычисления оценки используются только предыдущие значения оценки и номер параметра . Значение оценки в момент вычисляется из оценки в момент с добавлением взвешенной разности между измерением в момент и оценкой измерения в момент , Такой способ вычисления оценок называется рекурсивным. Таким образом, дискретный фильтр Калмана в рекуррентной форме осуществляет рекурсивную процедуру вычисления последовательных оценок, требующую запоминания на каждом шаге небольшого числа результатов вычислений.

Матричная схема дискретного фильтра Калмана показана на рис. 4.19 совместно с моделями исходной динамической системы и измерительной системы.

Рис. 4.18. Матричная схема дискретного фильтра Калмана

Основой для вывода уравнения фильтрации являются уравнения состояния динамической системы и уравнение наблюдения (измерения). Уравнение состояния линейной динамической системы описывается системой разностных уравнений в векторно-матричной форме:

где - переходная матрица состояния размерности , -мерный вектор состояния динамической системы; - матрица возмущения, или входного сигнала размерности ; - -мерный вектор случайной гауссовской последовательности.

Уравнение наблюдения (измерения) сигнала получаемого на выходе модели измерительной системы, описывается разностно-векторным уравнением:

где -мерный вектор наблюдения (измерения); -мерный вектор случайной гауссовской некоррелированной последовательности ошибок измерения, искажающих результат наблюдения за состоянием динамической системы; матрица измерений размерности

Предположим, что известны оценка состояния системы в момент и матрица переходов ). Тогда эту оценку можно принять за начальную и вычислить оценку на момент времени в соответствии с уравнением:

Эта оценка является предсказанной (экстраполированной) по результатам предыдущих наблюдений. При ее вычислении не использовалось последнее измерение состояния динамической системы, проведенное в момент . Это приведет к ошибкам в оценке вектора состояния системы. Погрешность оценки в момент через матрицу перехода распространяется на все последующие оценки в , и при длительном времени работы фильтра ошибки могут накопиться и привести к неудовлетворительным результатам. Оценку можно улучшить, если использовать измерения в момент времени и сформировать корректирующий сигнал: . Отсюда

Подставив в это выражение (9.14), получаем уравнение дискретного фильтра Калмана в канонической форме:

О птимальный коэффициент передачи такого фильтра должен обеспечить минимум средней квадратической ошибки фильтрации в соответствии с условием (4.152).

Контрольные вопросы к Главе 4

1. Какие критерии принятия решения применяются в ГАС НК?

2. В чём сходство и отличие критериев обнаружения «Идеального наблюдателя», «Неймана – Пирсона» и «Вальда»?

3. Какова физическая сущность вероятностей правильного обнаружения, правильного необнаружения, пропуска сигнала и ложной тревоги?

4. Как соотносится вероятность ложной тревоги «в точке» и многоканальной системы?

5. Как выбирается порог обнаружения при реализации критерия Неймана-Пирсона?

6. Как выбирается порог обнаружения при реализации критерия Котельникова-Зигерта?

7. Как выбирается порог обнаружения при реализации критерия обнаружения Вальда?

8. В чём адекватность и особенности корреляционного приёмника и согласованного фильтра?

9. В чём суть состоятельности оценки?

10. В чём суть эффективности оценки?

11. В чём суть несмещённости оценки?

12. Что представляет собой информационная матрица Фишера?

13. Как строится пеленгационная характеристика гидролокатора?

14. Как формируется словарь признаков и алфавит образов объектов гидролокации?

15. В чём адекватность и отличие понятий классификации и распознавания гидролокационных объектов?

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2011 Управление, вычислительная техника и информатика № 3(16) УДК 517.511 В.И. Смагин, С.В. Смагин ФИЛЬТРАЦИЯ В ЛИНЕЙНЫХ ДИСКРЕТНЫХ НЕСТАЦИОНАРНЫХ СИСТЕМАХ С НЕИЗВЕСТНЫМИ ВОЗМУЩЕНИЯМИ Рассматривается алгоритм синтеза оптимального фильтра, определяющего оценку вектора состояния дискретной линейной нестационарной динамической системы с аддитивными возмущениями, содержащими неизвестную постоянную составляющую. Приводятся результаты вычислительного эксперимента. Ключевые слова: линейные дискретные нестационарные системы, фильтр Калмана, неизвестные возмущения. В работах многих авторов большое внимание уделяется разработке алгоритмов калмановской фильтрации для класса систем с неизвестными аддитивными возмущениями и параметрами, которые могут использоваться в качестве моделей реальных физических систем, моделей объектов с неизвестными сбоями. Известные методы вычисления оценок вектора состояния базируются на алгоритмах, использующих оценки неизвестного возмущения . В работах рассматриваются алгоритмы расширения пространства состояний (к основной модели объекта добавляется модель ненаблюдаемого возмущения) и алгоритм двухэтапной фильтрации, уменьшающий вычислительные затраты за счет декомпозиции задачи. В работах изучены алгоритмы рекуррентной оптимальной фильтрации, использующие оценки неизвестного возмущения, имеющие достаточно жесткие условия их разрешимости. В настоящей работе для дискретного нестационарного объекта с неизвестной постоянной составляющей возмущений предлагается метод оптимальной фильтрации, не использующий оценки неизвестного возмущения. Метод базируется на преобразовании модели и сведении к задаче линейной калмановской фильтрации . В настоящей статье обобщаются результаты на случай решения задачи для нестационарного дискретного объекта. 1. Постановка задачи Рассматривается дискретная система, которая описывается следующими разностными уравнениями: x(k + 1) = A(k) x(k) + f + q (k), x(0) = x0 , (1) где x(k) ∈ R n – вектор состояния; A(k) – n×n-матрица; f – неизвестный постоянный вектор; q(k) – белая гауссовская случайная последовательность с характеристиками M {q (k)} = 0 , M{q(k)q Τ (j)} = Q(k)δk , j . (2) Канал наблюдений имеет вид y (k) = S (k) x(k) + v(k) , (3) y (k) ∈ R l – вектор измерений; S(k) – матрица размерности l × n ; v(k) – белая гаус- В.И. Смагин, С.В. Смагин 44 совская случайная последовательность ошибок измерений, с характеристиками: M{v(k)} = 0 , M{q (k)v Τ (j)} = 0 , M{v(k)v Τ (j)} = V (k)δi , j ; (4) для матриц (S(k), A(k)) выполняются условия наблюдаемости. Вектор x0 является случайным и не зависит от от процессов q(k) и v(k), при этом M{x(0)} = x0 , M {(x(0) − x0)(x(0) − x0)Τ } = P0 . Для системы (1) и канала наблюдений (3) требуется синтезировать фильтр, вычисляющий оценку вектора состояния, не использующий оценки неизвестной постоянной составляющей возмущений. 2. Синтез фильтра Преобразуем дискретную систему (1). Исключаем постоянную составляющую возмущений f из описания объекта посредством вычитания из уравнения (1) такого же уравнения, но со сдвигом на один такт: x(k) = A(k − 1) x(k − 1) + f + q(k − 1) . (5) В результате получаем следующее уравнение: x(k + 1) = (A(k) + En) x(k) − A(k − 1) x(k − 1) + q (k) − q(k − 1) . (6) Расширим пространство состояний системы путем добавления к уравнению (6) тождества x(k) = x(k) . Обозначим x(k) ⎞ ⎛ q(k) − q(k − 1) ⎞ . X (k) = ⎛⎜ ⎟ ⎟ , q (k) = ⎜ 0 ⎝ ⎠ ⎝ x(k − 1) ⎠ Систему (1) представим в векторно-матричной форме X (k + 1) = A(k) X (k) + q (k), X (0) = X 0 , (7) (8) где А(k) – 2n × 2n -матрица имеет следующую блочную структуру: ⎛ A(k) + En A(k) = ⎜ En ⎝ − A(k − 1) ⎞ ⎟. 0 ⎠ (9) Случайный вектор X 0 = (x0Τ x−Τ1)Τ имеет следующие характеристики: M{ X (0)} = X 0 , M {(X 0 − X 0)(X 0 − X 0)Τ } = P0 , (x0Τ (10) x−Τ1)Τ где X 0 = . Отметим, что здесь дополнительно вводится n-мерный вектор x−1 , который является независимым от q(k) и v(k) , а характеристики (10) могут быть получены по априорной информации об объекте (1). Отметим, что в рассмотренной модели (8) процесс q (k) не является белой гауссовской последовательностью, процессы q (k) и q (k − 1) будут коррелированны: если j = k, ⎧ Q (k), ⎪ M{q (k)q (j)} = ⎨Q (k − 1), если j = k − 1, ⎪ 0, если 0 ≤ j < k − 1, ⎩ (11) Q(k) + Q(k − 1) 0 ⎞ ⎛ −Q(k − 1) 0 ⎞ . Q(k) = ⎛⎜ ⎟ , Q (k − 1) = ⎜ 0 0 0 0 ⎟⎠ ⎝ ⎠ ⎝ (12) Τ где Фильтрация в линейных дискретных нестационарных системах 45 Представим канал наблюдений для расширенной системы (8) в виде y (k) = S (k) X (k) + v(k) , (13) где S (k) = (S (k) 0) , v(k) − случайная последовательность ошибок измерений с характеристиками (4). В качестве уравнения для вычисления оценки вектора состояния расширенной системы выберем уравнение, по своей структуре совпадающее с фильтром Калмана: Xˆ (k + 1) = A(k) Xˆ (k) + K (k)(y (k + 1) − S (k + 1) A(k) Xˆ (k)) , Xˆ (0) = X . (14) 0 Учитывая (8) и (14), получим следующее уравнение для ошибки e(k) = Xˆ (k) − X (k) : e(k + 1) = (A(k) − K (k) S (k + 1) A(k))e(k) + K (k)v(k + 1) + (K (k) S (k + 1) − E2 n)q (k) . (15) В силу (11) и (15), матрица P (k) = M{e(k)eΤ (k)} определится из следующего разностного уравнения: P (k + 1) = (A(k) − K (k) S (k + 1) A(k)) P (k)(A(k) − K (k) S (k + 1) A(k))Τ + +(K (k) S (k + 1) − E2 n)Q (k)(K (k) S (k + 1) − E2 n)Τ + K (k)V (k + 1) K Τ (k) + +(A(k) − K (k) S (k + 1) A(k))(K (k − 1) S (k) − E2 n) × ×Q (k − 1)(K (k) S (k + 1) − E2 n)Τ + (K (k) S (k + 1) − E2 n) × ×Q (k − 1)(K (k − 1) S (k) − E2 n)Τ (A(k) − K (k) S (k + 1) A(k))Τ , P (0) = P0 . (16) Оптимизируемый критерий зададим в виде J (k + 1) = trP (k + 1) . (17) Оптимальные коэффициенты передачи фильтра K(k) определяются из условия dJ (k + 1) =0. (18) dK (k) Учитывая (17) и правую часть уравнения (16), применяя правила матричного дифференцирования следа от матрицы , получим из условия (18) уравнение для определения матрицы K(k): − A(k) P (k) A(k)Τ S (k + 1)Τ + K (k) S (k + 1) A(k) P (k) A(k)Τ S (k + 1)Τ + + K (k) S (k + 1)Q (k) S (k)Τ − Q (k) S (k + 1)Τ − K (k) S (k + 1)Q (k − 1) × ×S (k)Τ K (k − 1)Τ A(k)Τ S (k + 1)Τ + K (k) S (k + 1)Q (k − 1) A(k)Τ S (k + 1)Τ − − K (k) S (k + 1) A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + + K (k) S (k + 1) A(k)Q (k − 1) S (k + 1)Τ + Q (k − 1) S (k)Τ K (k − 1)Τ × × A(k)Τ S (k + 1)Τ − Q (k − 1) A(k)Τ S (k + 1)Τ − A(k)Q (k − 1) S (k + 1)Τ + + A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + K (k)V (k + 1) = 0 . (19) Решение последнего уравнения относительно K(k) дает следующий результат: K (k) = P (k) S (k + 1)Τ (S (k + 1) P (k) S (k + 1)Τ + V (k + 1)) −1 , (20) 46 В.И. Смагин, С.В. Смагин где P (k) = A(k) P (k) A(k)Τ + Q (k − 1)(E2 n − S (k)Τ K (k − 1)Τ) A(k)Τ + + A(k)(E2 n − K (k − 1) S (k))Q (k − 1) + Q (k) . (21) Отметим, что для вычисления коэффициентов передачи (20), в силу (21), необходимо задать начальные значения коэффициентов K(−1). Подставив в уравнение (16) выражение для оптимального коэффициента передачи (20), получим уравнение P (k + 1) = (E2 n − K (k) S (k + 1)) P(k) , P (0) = P0 . (22) Основной результат сформулируем в виде теоремы, учитывая симметричность и блочное представление матриц P (k) и P (k) : ⎛ p (k) P(k) = ⎜ 1 ⎝ p2 (k) ⎛ p (k) p2Τ (k) ⎞ , P (k) = ⎜ 1 p3 (k) ⎟⎠ ⎝ p2 (k) p2Τ (k) ⎞ , p3 (k) ⎟⎠ (23) блочные структуры матриц A(k), Q(k), Q (k), S (k) и представление матрицы K (k) в виде ⎛ K (k) ⎞ K (k) = ⎜ 1 ⎟ . (24) ⎝ K 2 (k) ⎠ Теорема. Пусть процесс с неизвестным постоянным возмущением определяется уравнениями (1) и канал наблюдений имеет вид (3). Тогда оптимальный алгоритм фильтрации определится следующими разностными уравнениями: xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1)] (25) с начальными условиями xˆ(0) = x0 , xˆ(1) = M{x(1)} = x1 . Матрица K1 (k) в (25) определяется по формуле (26) K1 (k) = p1 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 , где матрица p1 (k) вычисляется из системы уравнений (27) p1 (k) = (A(k) + En) p1 (k)(A(k) + En)Τ − A(k − 1) p2 (k)(A(k) + En)Τ − −(A(k) + En) p2Τ (k) A(k − 1)Τ + A(k − 1) p3 (k) A(k − 1)Τ + Q(k − 1) S (k)Τ K1 (k − 1)Τ × ×(A(k) + En)Τ − Q(k − 1) S (k)Τ K 2 (k − 1)Τ AΤ (k − 1) + +(A(k) + En) K1 (k − 1) S (k)Q(k − 1) − A(k − 1) K 2 (k − 1) S (k) × ×Q(k − 1) − (A(k) + En)Q(k − 1) − Q(k − 1)(A(k) + En)Τ + Q(k) + Q(k − 1) , p2 (k) = p1 (k)(A(k) + En)Τ − p2Τ (k) A(k − 1)Τ + + K1 (k − 1) S (k)Q(k − 1) − Q(k − 1) , p3 (k) = p1 (k) , p1 (k + 1) = (En − K1 (k) S (k + 1)) p1 (k) , p1 (0) = p1,0 , p2 (k + 1) = − K 2 (k) S (k + 1) p1 (k) + p2 (k) , p2 (0) = p2,0 , p3 (k + 1) = − K 2 (k) S (k + 1) p2Τ (k) + p3 (k) , p3 (0) = p3,0 , K 2 (k) = p2 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 . (28) Фильтрация в линейных дискретных нестационарных системах 47 В (28) начальные условия p1,0 , p2,0 , p3,0 , являются соответствующими блоками матрицы P0 . Отметим, что для выполнения расчетов в (28) необходимо задать начальные условия для K1 (−1) и K 2 (−1) . Замечание. Управляемый объект x(k + 1) = A(k) x(k) + B(k)u (k) + f + q(k), x(0) = x0 , (29) при исключении неизвестного постоянного возмущения f объекта, необходимо преобразовать к виду, который будет отличаться от (8) одним слагаемым: X (k + 1) = A(k) X (k) + B (k)(u (k) − u (k − 1) + q (k), X (0) = X 0 , (30) где матрица A(k) приведена в формуле (9), q (k) имеет характеристики (11), (12). В (30) матрица B (k) имеет вид B (k) ⎞ B (k) = ⎛⎜ ⎟. ⎝ 0 ⎠ Тогда уравнения фильтра будут следующими: (31) xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1)) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1))] , (32) с начальными условиями (26), а матрица K1 (k) определяется в соответствии с (27) и (28). 3. Результаты вычислительного эксперимента Рассмотрим применение алгоритма фильтрации для модели второго порядка вида (1) и канала наблюдений (3) со следующими значениями параметров: 0 1 0 ⎞ ⎞ ; Q = ⎛ 0, 01 ; V = 0,9 ; A(k) = ⎛⎜ ⎟ ⎜ 0 0, 02 ⎟⎠ ⎝ ⎝ 0, 05 0,925 + 0,1sin(0, 01k) ⎠ 1, 0 1, 0 0 ⎞ S = (1 1) ; x0 = ⎛⎜ ⎞⎟ ; P0 = ⎛⎜ (33) ⎟. ⎝ 1,5 ⎠ ⎝ 0 1, 0 ⎠ Вычисление оценок вектора x(k) можно выполнить, используя двухэтапный алгоритм фильтрации . Модель измерений в этом случае с учетом (1) представляется в виде y (k + 1) = Sx(k + 1) + v(k + 1) = SA(k) x(k) + Sf + Sq(k) + v(k + 1) . (34) Рекуррентные уравнения оценивания неизвестного вектора f имеют вид fˆ (k + 1) = fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , fˆ (0) = f , 0 f Τ Τ Τ −1 K f (k) = Pf (k) S (SPf (k) S + SQS + V) , где Pf (k + 1) = (E2 − K f (k) S) Pf (k), Pf (0) = Pf0 , (35) M{ f } = f 0 , M{(f − f 0)(f − f 0)Τ } = Pf0 . (36) В.И. Смагин, С.В. Смагин 48 Оценка вектора состояния для объекта с неизвестным постоянным входом задается уравнением: xˆ (k + 1) = A(k) xˆ (k) + fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , (37) x где матрица K x (k) определяет коэффициенты передачи фильтра Калмана. При моделировании используем 0 1, 0 0 ⎞ f 0 = ⎛⎜ ⎞⎟ , Pf0 = ⎛⎜ (38) ⎟. ⎝0⎠ ⎝ 0 1, 0 ⎠ Применение расширенного фильтра Калмана для данного примера (в этом случае уравнение (1) расширяется путем добавления уравнения f(k+1) = f(k)) приводит к необходимости построения фильтра Калмана для дискретной системы со следующими матрицами динамики, канала наблюдений и интенсивностей аддитивных возмущений: Q 0⎞ ⎛ A(k) E2 ⎞ , (S 0) , ⎛⎜ (39) ⎟. ⎜ 0 E2 ⎟⎠ ⎝ 0 0⎠ ⎝ Использование в данном примере методов, описанных в работах , невозможно в силу невыполнения условий существования оптимальных оценок неизвестного входного вектора : n≥m и l≥m. (40) В неизвестное возмущение определяется в виде f = Gd , где d – неизвестный m-мерный вектор, G – n × m -известная матрица. В рассмотренном примере G = E2 , n = 2 , m = 2, l = 1 , а это означает, что условия (40) не выполняются. Применение алгоритма фильтрации исследовалось также для неизвестного переменного возмущения с тремя возможными значениями компонент вектора f: ⎧ 1, если 0 ≤ k ≤ 9, ⎪ f1 (k) = f 2 (k) = ⎨ −1, если 9 < k < 25, ⎪ 1, если 25 ≤ k ≤ 50. ⎩ На рис. 1 приведены реализации процессов и их оценок для трех сравниваемых фильтров. Отметим, что при реализации алгоритма фильтрации (25), начальные значения K1 (−1) и K 2 (−1) задавались нулевые. x1(k) x1(k) x2(k) x2(k) 2 10 0 –10 0 3 4 20 30 40 k –10 0 4 1 0 1 10 3 10 2 10 20 30 40 k Рис. 1. Реализации процессов и оценок (1 – реализация x(k); 2 – оценка, построенная по алгоритму (25); 3 – оценка, построенная по двухэтапному алгоритму; 4 – оценка для расширенного фильтра Калмана) Фильтрация в линейных дискретных нестационарных системах 49 На рис. 2 приведены ошибки оценивания компонент вектора состояния. e1(k) 4 2 e2(k) 4 3 1 0 –2 –4 –6 0 2 2 3 1 0 2 –2 10 20 30 40 k –4 0 10 20 30 40 k Рис. 2. Графики ошибок фильтрации (1 – ошибка для оценки, построенной по алгоритму (25); 2 – ошибка для оценки, построенной по двухэтапному алгоритму; 3 – ошибка для расширенного фильтра Калмана) Как видно из рисунков для рассмотренного примера, качество оценок, полученных с помощью фильтра (25), лучше, чем для двухэтапного алгоритма фильтрации и расширенного фильтра Калмана, использующих оценки неизвестного возмущения. Отметим также, что для алгоритма фильтрации (25) не нужно задавать априорную информацию о характеристиках распределения начальных значений f 0 и Pf0 . Ниже, в таблице, приведены средние значения среднеквадратических ошибок оценивания для трех рассматриваемых методов, рассчитанных по 50 реализациям. Как видно из таблицы, предложенный метод фильтрации (25) обеспечивает среднюю ошибку в 3 – 4 раза меньшую, чем другие методы. Средние значения среднеквадратических ошибок для компонент вектора состояния Алгоритм (25) e1,ср = 0,0912 Двухэтапный алгоритм e1,ср = 0,3128 Расширенный фильтр Калмана e1,ср = 0,4103 e2,ср = 0,0945 e2,ср = 0,2917 e2,ср = 0,4296 Заключение Разработан алгоритм синтеза дискретного оптимального нестационарного фильтра для объекта, возмущения которого содержат неизвестную постоянную составляющую. Алгоритм построен на основе расширения пространства состояния и исключения из модели неизвестной составляющей. В отличие от классического фильтра Калмана, предложенный фильтр использует рекуррентные оценки, построенные на двух предыдущих тактах. Как показали результаты вычислительного эксперимента, алгоритм может быть применен для кусочно-постоянной неизвестной аддитивной составляющей возмущений. ЛИТЕРАТУРА 1. Astrom K., Eykhoff P. System identification. A survey // Automatica. 1971. V. 7. P. 123−162. 2. Friedland B. Treatment of bias in recursive filtering // IEEE Trans. on Automat. Contr. 1969. V. AC-14. P. 359−367. 3. Chen J., Patton R. J. Optimal filtering and robust fault diagnosis of stochastic systems with unknown disturbances // IEE Proc. Control Theory Appl. 1996. V. 143. P. 31–36. 50 В.И. Смагин, С.В. Смагин 4. Darouach M., Zasadzinski M. Unbiased minimum variance estimation for systems with unknown exogenous inputs // Automatica. 1997. V. 33. P. 717–719. 5. Darouach M., Zasadzinski M., Xu S. J. Full-order observers for linear systems with unknown inputs // IEEE Trans. on Automat. Contr. 1999. V. AC-39. P. 606. 6. Gillijns S., Moor B. Unbiased minimum-variance input and state estimation for linear discrete-time systems // Automatica. 2007. V. 43. P. 111–116. 7. Hou M., Patton R. Optimal filtering for systems with unknown inputs // IEEE Trans. on Automat. Contr. 1998. V. AC-43. P. 445–449. 8. Hsieh C.-S. A unified solution to unbiased minimum-variance estimation for systems with unknown inputs // Proc.17th World Congress The International Federation of Automatic Control. Seoul. Korea. July 6 – 11, 2008. P. 14502–14509. 9. Hsieh C.-S. Robust two-stage Kalman filters for systems with unknown inputs // IEEE Trans. on Automat. Contr. 2000. V. AC-45. P. 2374–2378. 10. Hsieh C.-S. Extension of the optimal unbiased minimum-variance filter for systems with unknown inputs // Proc. 15th IEEE International Workshop on Nonlinear Dynamics of Electronic Systems. Tokushima. Japan. 2007. P. 217–220. 11. Hsieh C.-S. Robust parameterized minimum variance filtering for uncertain systems with unknown inputs // Proc. American control conference. New York. 2007. P. 5118–5123. 12. Kalman R.E., Busy R. A new results in linear filtering and prediction theory // Trans. ASME J. Basic Engr. 1961. V. 83. P. 95–108. 13. Браммер К., Зиффлинг Г. Фильтр Калмана – Бьюси. М.: Наука, 1972. 200 с. 14. Пугачев В.С., Синицин И.Н. Стохастические дифференциальные уравнения М.: Наука, 1990. 630 с. 15. Смагин С.В. Фильтрация в линейных дискретных системах с неизвестными возмущениями // Автометрия. 2009. Т. 45. № 6. C. 29−37. 16. Амосов А.А., Колпаков В.В. Скалярно-матричное дифференцирование и его применение к конструктивным задачам теории связи // Проблемы передачи информации. 1972. № 1. С. 3−15. Смагин Валерий Иванович Смагин Сергей Валерьевич Томский государственный университет E-mail: [email protected]; [email protected] Поступила в редакцию 6 декабря 2010 г.

480 руб. | 150 грн. | 7,5 долл. ", MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Диссертация - 480 руб., доставка 10 минут , круглосуточно, без выходных и праздников

Бирюков Руслан Сергеевич. Дискретное обобщенное H-оптимальное управление и фильтрация в линейных непрерывных объектах: диссертация... кандидата Физико-математических наук: 01.01.09 / Бирюков Руслан Сергеевич;[Место защиты: ФГАОУВО «Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского»], 2017

Введение

Глава 1. Обзор теории обобщенного -управления и фильтрации для линейных дискретных систем 8

1. Обобщенная -норма линейного объекта 8

2. Синтез обобщенного -управления 11

3. Синтез обобщенного -фильтра 13

Глава 2. Обобщенная -норма непрерывного объекта с дискретным целевым выходом 15

1. Уровень гашения возмущений в непрерывно-дискретном объекте 15

2. Наихудшие внешние возмущения и начальное состояние в непрерывно дискретном объекте 28

3. Уровень гашения возмущений в дискретно-дискретном объекте 32

4. Наихудшие внешние возмущения и начальное состояние в дискретно дискретном объекте 49

5. Уровень гашения возмущений в случае бесконечного горизонта 56

6. Характеризация уровня гашения возмущений в терминах LMI 61

7. Выводы 64

Глава 3. Дискретное обобщенное -оптимальное управление 66

1. Синтез оптимального управления по состоянию 66

2. Синтез оптимального управления по выходу 74

3. Управление электромагнитным подвесом 94

4. Выводы 101

Глава 4. Дискретная обобщенная -оптимальная фильтрация 102

1. Синтез оптимального фильтра 102

2. Фильтрация данных в задаче гашения колебаний зданий 108

3. Выводы 114

Заключение 115

Список литературы

Введение к работе

Актуальность темы исследования. Современные системы управления, как правило, реализуются в цифровом виде, в то время как большинство реальных объектов функционирует в непрерывном времени. Подобное разделение на аналоговую и цифровую части приводит к потере информации, поскольку значения непрерывного сигнала, поступающего с объекта на регулятор, известны только в фиксированные дискретные моменты времени. По этой причине становится важной задача анализа и синтеза дискретного регулятора, максимально полно учитывающего поведение исходного объекта в моменты времени между измерениями. В зависимости от классов внешних возмущений, действующих на объект, и конечных целей управления выделяют различные подходы к решению указанной задачи. Особый интерес представляет случай, когда на объект действуют внешние возмущения с ограниченной «энергией», а цель управления состоит в минимизации полной «энергии» целевого выхода объекта. В этом случае задача представляет собой задачу дискретного %00-оптимального управления непрерывным объектом по дискретным по времени измерениям.

Для решения указанной задачи были предложены различные подходы. Одним из первых был подход, основанный на представлении исходной непрерывной системы с дискретным выходом как непрерывно-дискретной, поведение которой описывается совокупностью дифференциальных и разностных уравнений (Sun W., Nagpal K.M., Poolla K.R., Khargonekar P.P., Sagfors M.F., Toivonen H.T. и др.). В этом случае процедура синтеза дискретных 7^^-оптимальных регуляторов и фильтров основывалась на дифференциальных уравнениях Риккати, решения которых испытывают скачки в моменты времени, соответствующие наблюдениям. Практическая реализация предложенных алгоритмов синтеза наталкивается на ряд трудностей, связанных с решением нелинейной краевой задачи для дифференциальных уравнений Риккати.

Похожий подход использовался в работах Basar T. и Bernhard P., где задача дискретного ^^-оптимального управления непрерывным объектом рассматривалась с точки зрения теории игр. Условия существования %^-оптимальных регуляторов были сформулированы в случае измеряемого состояния объекта в терминах разностных уравнений Риккати, а процедура синтеза таких регуляторов также основана на решении нелинейной краевой задачи.

Другой подход основан на использовании метода лифтинга, в котором исходная непрерывная система преобразуется в эквивалентную дискретную (Bamieh B.A., Pearson J.B., Chen T., Francis B.A., Tadmor G., Sagfors M.F., Toivonen H.T., Lall S., Dullerud G. и др.). При этом, поскольку между моментами наблюдения внешнее возмущение, как и целевой выход исходного объекта, представляют собой кусочно-непрерывные функции, то возмущение и целевой выход эквивалентной дискретной системы уже принадлежат бесконечно-

мерному пространству. В указанных работах синтез оптимальных регуляторов опирается на последовательное (итерационное) решение либо алгебраических, либо рекуррентных уравнений Риккати, зависящих от вспомогательного параметра, который требуется минимизировать. Практическая реализация данной процедуры приводит к вычислительным трудностям.

Наконец, в работах Михеева Ю.В., Соболева В.А., Фридман Э.М., Shaked U., Suplin V. был предложен подход при котором задача синтеза дискретного -управления непрерывным объектом формально заменялась задачей синтеза -регулятора с запаздыванием. Условия существования -управления были сформулированы в форме достаточных условий в терминах линейных матричных неравенств.

Одним из существенных недостатков теории -управления является предположение о том, что в начальный момент времени объект находится в покое, то есть его начальное состояние нулевое. Если это требование не выполняется, то синтезированные регуляторы хорошо подавляют внешние возмущения, но не всегда адекватно справляются с задачей гашения начальных возмущений, порожденных ненулевыми начальными условиями. В этом случае в качестве единого критерия, учитывающего влияние как внешних, так и начальных возмущений, была предложена обобщенная -норма (Khargonekar P.P., Nagpal K.M. и Poolla K.R.). Эта норма совпадает с классической -нормой, если в начальный момент времени объект находится в покое, а когда начальное состояние объекта ненулевое, а внешнее возмущение отсутствует, то обобщенная -норма совпадает с 0 -нормой, определенной в работах Баландина Д.В. и Когана М.М. Для непрерывных объектов с непрерывным измеряемым выходом были синтезированы непрерывные законы управления и фильтрации в работах Khargonekar P.P., Nagpal K.M., Баландин Д.В., Коган М.М. и др. В случае непрерывного объекта с дискретным выходом известна работа Sun W., Nagpal K.M. и Khargonekar P.P., в которой решение задачи дискретного обобщенного -управления было получено для объекта на бесконечном горизонте. При этом сформулированные законы управления и фильтрации основаны на решении нелинейного дифференциального уравнения Риккати, что затрудняет их использование. Таким образом, дальнейшее развитие теории дискретного обобщенного -управления непрерывными системами является весьма актуальной задачей теории управления.

Цель диссертационной работы. Основной целью работы является развитие теории дискретного обобщенного -управления и фильтрации для линейных непрерывных систем. В соответствии с поставленной целью диссертация направлена на решение следующих задач:

Для линейных нестационарных объектов на конечном интервале времени получить условия существования и уравнения дискретных обобщенных -оптимальных законов управления в классе линейных нестационарных обратных связей по состоянию и в классе линейных нестационарных динамических регуляторов полного порядка по выходу.

Для линейных стационарных объектов на бесконечном интервале времени получить условия существования и уравнения дискретных обобщенных -оптимальных законов управления в классе линейных стационарных обратных связей по состоянию и в классе линейных стационарных динамических регуляторов полного порядка по выходу.

Для линейных нестационарных объектов на конечном интервале времени получить условия существования и уравнения дискретных нестационарных обобщенных -оптимальных фильтров полного порядка в форме наблюдателя.

Для линейных стационарных объектов на конечном интервале времени получить условия существования и уравнения дискретных стационарных обобщенных -оптимальных фильтров полного порядка в форме наблюдателя.

Методы исследования. В работе применяются методы вариационного исчисления и оптимального управления, теории выпуклой оптимизации и, в частности, теории полуопределенного программирования.

Научная новизна и основные результаты. В диссертации получены следующие новые результаты по теории дискретного обобщенного -управления и фильтрации линейными непрерывными объектами:

Показано, что обобщенная -норма линейного нестационарного объекта на конечном интервале времени находится как решение нелинейной краевой задачи для матричного дифференциального или разностного уравнения Риккати, а также в терминах линейных матричных неравенств. В случае линейного устойчивого стационарного объекта на бесконечном интервале времени обобщенная -норма находится как решение дискретного алгебраического уравнения Риккати или в терминах линейных матричных неравенств (соответствует пункту 6 паспорта специальности 01.01.09).

Для линейных нестационарных объектов на конечном интервале времени получены необходимые и достаточные условия, а в случае неизмеряемого состояния только достаточные условия существования дискретных обобщенных -оптимальных законов управления. Эти законы управления синтезированы в классе линейных нестационарных обратных связей по состоянию и в классе линейных нестационарных динамических регуляторов по выходу (соответствует пункту 6 паспорта специальности 01.01.09).

Для линейных стационарных объектов на бесконечном интервале времени получены необходимые и достаточные условия существования дискретных обобщенных -оптимальных законов управления. Эти законы управления синтезированы в классе линейных стационарных обратных связей по состоянию и в классе линейных стационарных динамических регуляторов по выходу (соответствует пункту 6 паспорта специальности 01.01.09).

Для линейных нестационарных объектов на конечном (бесконечном) интервале времени получены необходимые и достаточные условия существования и осуществлен синтез нестационарных (стационарных) дискретных обобщенных "Н^ -оптимальных фильтров полного порядка в форме наблюдателя

В качестве приложений синтезированы дискретные обобщенные Ti^ -оптимальные регуляторы в задаче управления телом в электромагнитном подвесом и дискретные обобщенные ^-оптимальные фильтры в задаче гашения колебаний высотных зданий и сооружений (соответствует пункту 6 паспорта специальности 01.01.09).

Соответствие шифру специальности. Работа соответствует формуле специальности 01.01.09 - Дискретная математика и математическая кибернетика и охватывает следующие области исследования, входящие в специальность 01.01.09: п. 6. Математическая теория оптимального управления.

Теоретическая и практическая значимость. Работа носит теоретический характер и представляет собой развитие теории дискретного обобщенного "Н^-оптимального управления непрерывными объектами. Полученные в ней результаты доведены до конструктивных процедур, эффективность которых подтверждается синтезом регуляторов в задаче управления электромагнитным подвесом и синтезом фильтров в задаче гашения колебаний высотных зданий и сооружений.

Степень достоверности и апробация результатов исследования. Основные результаты диссертационной работы обсуждались на заседании Нижегородского научного семинара «Математическое моделирование динамики систем и процессов управления» в НИИ Прикладной математики и кибернетики, а также докладывались на следующих международных и всероссийских конференциях:

X Всероссийская научная конференция «Нелинейные колебания механических систем» им. Ю.И. Неймарка (Нижний Новгород, 2016);

XIII Международная конференция «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого) (Москва, 2016);

ХI Всероссийский съезд по фундаментальным проблемам теоретической и прикладной механики (Казань, 2015);

Международная конференция по математической теории управления и механике (Суздаль, 2015);

Шестая традиционная всероссийская молодежная летняя школа «Управление, информация и оптимизация» (Москва, 2014);

XII Всероссийское совещание по проблемам управления (Москва, 2014);

XIX Нижегородская сессия молодых ученых: Естественные, математические науки (Нижний Новгород, 2014).

В 2013-2014 гг. и 2014-2015 гг. исследования были поддержаны стипендией имени академика Г.А. Разуваева для аспирантов, а также стипендией Правительства Российской Федерации (2014-2015 гг).

Результаты первых трёх глав диссертации были получены при выполнении проекта № 14-01-31120 мол_а в 2014-2015 гг. (руководитель) и проектов № 12-01-31358 мол_а в 2012-2013 гг., № 14-01-00266 в 2014-2016 гг. (исполнитель), выполненных при финансовой поддержке Российского фонда фундаментальных исследований.

Результаты четвертой главы получены при финансовой поддержке Министерства образования и науки РФ в рамках Федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» (соглашение 14.578.21.0110 от 27.10.2015, уникальный идентификатор RFMEFI57815X0110).

Публикации. Основные результаты по теме диссертации изложены в 10 печатных работах, включая 4 публикации в ведущих научных журналах, рекомендованных ВАК Минобрнауки РФ -], трудах двух международных конференций и четырех тезисах докладов региональных и Всероссийских конференций [-. В совместной работе ] автору принадлежат результаты численного моделирования.

Личный вклад соискателя. Все исследования, изложенные в диссертационной работе, проведены лично соискателем в процессе научной деятельности. Из совместных публикаций в диссертацию включен лишь тот материал, который непосредственно принадлежит соискателю.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и списка литературы. Работа изложена на 123 страницах, содержит 11 иллюстраций. Библиография включает 81 наименование.

Синтез обобщенного -управления

В теории обобщенного %ос -управления рассматривается линейный управляемый объект, подверженный внешнему воздействию и начальному возмущению, порождаемому неизвестными начальными условиями. Если объект находится в начальный момент времени в покое, то есть начальное возмущение равно нулю, то в качестве меры влияния внешнего воздействия на рассматриваемый объект принимается уровень гашения внешнего возмущения, совпадающий с %оо-нормой, а задача синтеза управления, минимизирующего данный критерий, есть задача Н -оптимального управления . Напротив, когда начальное состояние ненулевое, а внешнее возмущение отсутствует, под мерой реакции системы понимается уровень гашения начального возмущения, равный 7о-норме. В этом случае, закон управления, оптимизирующий переходный процесс в наихудшем случае, известен как 7о-оптимальный . В общем случае указанные критерии противоречивы, поэтому основная цель обобщенного %ос-управления заключается в определении закона управления, который был бы компромиссным при оценке влияния как внешнего, так и начального возмущений .

Приведем теперь основные факты, относящиеся к обобщенной Ноо-норме, при этом в изложении будем следовать работам . Для определенности рассмотрим линейный дискретный нестационарный объект вида Xk+i = Акхк + Bkvk, k = 0,...,N-l, zk = Ckxk + Dkvk, где х Є Ж1 - состояние, z Є Е"-2 - целевой выход иие Rnv - внешнее возмущение, N-l т ограниченное по 2-норме: vk vk oo. fc=0

Предположим, что в общем случае начальное состояние х0 ненулевое и неизвестно, а его влияние на динамику объекта интерпретируется как начальное возмущение.

Управляемый выход объекта для фиксированного начального состояния х0 и последовательности возмущений v0,... , vN_ і будем характеризовать значением функционала N-1 j(x0,v0,..., vN_ij = \\z\\i2 + xNSxN = У zk zk-\- xNSxN, (1.2) fc=0 где S = S 0 - весовая матрица, задающая приоритет между качеством переходного процесса и конечным состоянием объекта.

Сначала рассмотрим отдельно два крайних случая: на объект действует только начальное или только внешнее возмущение. Пусть объект в начальный момент времени находился в покое, что соответствует случаю, когда отсутствует начальное возмущение. Следуя , определим показатель влияния внешнего возмущений на целевой выход (1.1) - уровень гашения внешнего возмущения - как относительное значение функционала (1.2) в наихудшем случае: J(0,VO,...,VN_1) 2 = sup 2 0 2

Отметим, что если объект (1.1) является стационарным и рассматривается на бесконечном интервале времени, то, используя равенство Парсеваля, можно показать, что выражение (1.3) совпадает с 7 -нормой рассматриваемого объекта . Следующее утверждение характеризует уровень гашения внешнего возмущения в терминах решений линейных матричных неравенств .

Утверждение 1.1. Уровень гашения внешнего возмущения в системе (1.1) на конечном интервале времени удовлетворяет неравенству 7оо 7 тогда и только тогда, когда линейные матричные неравенства /AlXk+1Ak - Xk AjXk+lBk Ck\ BTkXk+lAk BjXk+1Bk--f2I Dj Ck Dk -i) 0, (1.4) разрешимы относительно матриц Xk = Xk 0, k = 0,..., N - 1, при XN = S.

Из утверждения следует, что уровень гашения внешнего возмущения 7оо находится как точная нижняя грань множества всех 7, для которых система линейных матричных неравенств (1.4) разрешима относительно матриц Хк = Хк 0 и 7 .

В случае, если внешнее возмущение отсутствует, то влияние начального возмуще ния на качество переходного процесса в системе (1.1) может быть охарактеризовано величиной 2 J(x0,0,...,0) 70 = sup 2 (1.5) х0ф0 \Х0\ которая называется уровнем гашения начального возмущения . В показано, что эта величина может быть найдена как решение оптимизационной задачи с ограничениями, заданными линейными матричными неравенствами.

Утверждение 1.2. Уровень гашения начального возмущения в системе (1.1) на конечном интервале времени удовлетворяет неравенству 70 7 тогда и только тогда, когда линейные матричные неравенства ATkXk+1Ak -Xk + ClCk О, Х0 -f2I, (1.6) разрешимы относительно матриц Хк = Хк О, к = 0,..., N - 1, при XN = S. Чтобы описать совместное влияние внешнего и начального возмущений на выход объекта (1.1), определим уровень гашения возмущений как своеобразную свертку двух рассматриваемых факторов : 7W = sup

Jx0,v0,. . . ,VN_1 =F , (1.7) где R = R 0 - весовая матрица, предназначенная для задания приоритета между внешним возмущением и компонентами начального состояния. Введенный таким образом показатель называется обобщенной 7 -нормой. Нетрудно видеть, что в крайних случаях выражение (1.7) превращается либо в (1.3), либо в (1.5), то есть, при х0 = 0 имеем 7w = 7оо, а при v = 0 получим 7«, = 70/ тах(-). Оказывается , что уровень гашения возмущений может быть выражен в терминах линейных матричных неравенств, для этого достаточно потребовать существование общего решения неравенств (1.4) и (1.6), характеризующих в отдельности уровень гашения внешнего возмущения и уровень гашения начального возмущения с учетом весового коэффициента.

Уровень гашения возмущений в системе (1.1) на конечном интервале времени удовлетворяет неравенству 7w 7 тогда и только тогда, когда линейные матричные неравенства (A.

Наихудшие внешние возмущения и начальное состояние в непрерывно дискретном объекте

Отметим, что согласно сформулированной теореме, уровень гашения возмущений 7С при помощи соотношения (2.45) выражается через значение матричной функции X(t). Однако, в силу уравнения (2.6a), величина X(t) неявно зависит от гус. Вследствие этого, для определения уровня гашения возмущений возникает нелинейная краевая задача для матричного дифференциального уравнения Риккати: найти решение уравнения (2.6a) с граничными условиями (2.6b) и (2.45), а также условием (2.6d).

Обратимся теперь к доказательству теоремы.

Доказательство теоремы 2.2. Нетрудно показать, что соотношение (2.4) эквивалентно выполнению равенства sup J(xo,v,w) = 0. (2.48) Иі!2 +ІНІ2 2 + 0Д 0=і Согласно формуле (2.39) функционал J(x0,v,w) может быть записан следующим образом: J(x0,v,w) = xUcJC0 + X(t0) - %R)X0 %\\v - v \\l2 + N-l + J2(wk w k)T(AjX(tk)Ak - %l) (wk - w k) + fc=l + wN - w N (АдгбАдг - 7C- (wN - w N где v и w k определены соотношениями (2.46). В силу справедливости неравенств (2.6b), (2.6c) и (2.6e) первое слагаемое является неположительно определенной, а оставшиеся - отрицательно определенными квадратичными формами, поэтому максимальное значение функционала J(x0, v, w) обращается в ноль при v = v и wk = w k, k = 1,... , N, и соответствующем выборе х0. Следовательно, возмущения v иwl являются наихудшими внешними возмущениями относительно критерия 7с. Подставим v и w k в соотношение (2.48), тогда: sup J(x0,v ,w)= sup xUx(t0) + CjC0--fcR)x0. \\v \\L+\\v \\2+x0R 0=l ll« llL+lh ll2+ ftr0 = l Теперь заметим, что и, и зависят от 0 и справедливы соотношения: v (t) = ъ1В (t)X(t) b(t,t0)x0, / -г- \ -1 -г w k = - (AjX(tk)Ak - 7c Л AjX(t (tk - 0, t0)x0, здесь Ф(Мо) - фундаментальная матрица решений замкнутой системы (2.115). Следовательно, ограничение есть квадратичная форма от х0: \\v \\l2 + \\w \\l+xUxo = x Qx0 = l, где tN Q = R + 1-2 Фт(т,і0)Х(т)В(т)Вт(т)Х(т)Ф(т,і0)(іт + «о N + fc=l J2 фТ(- 0, t0)X{tk)Ak(AlX(tk)Ak - 7сЛ \іХ(ік)Ф(ік - 0, t0). Таким образом, задача (2.48) свелась к следующей: sup x0 ПІКО =1 Xo(x(t0) + C0TC0 - 7ci?W

Для решения последней задачи воспользуемся правилом множителей Лагранжа: точка максимума х0 должна удовлетворять системе уравнений: (x(to) + СоТС0 - jcR\x0 +»Пх0 = 0 и ж аго = 1, (2.49) параметр /і есть множитель Лагранжа. Перепишем первое уравнение как (X(t0) + CQ С0 + /іП)х0 = lcRxo, откуда находим хо = «emax (R 1 \x(t0) + CjC0 + ц Ы V 7с = Атах (і?-1 [х(0) + С0ТСо + /х fil V значение а находится из второго уравнения (2.49). Подставим найденные значения в квадратичную форму и упростим: Xo(x(t0) + Со Со - 1CR)XQ = -iixoflx о = Iі Заметим, что по условию точная верхняя грань равна нулю, следовательно /і = 0. Подставляя найденное значение /і в выражение для х0 приходим к соотношениям (2.45) и (2.46c).

Сформулируем и докажем несколько следствий, отвечающих на вопрос о наихудших о возмущениях, применительно к уровням гашения начального возмущения С, непрерывного внешнего возмущения с, дискретного внешнего возмущения Г и уровня гашения смешанных внешних возмущений с w .

Следствие 2.5. В объекте (2.1), (2.2) и (2.3) уровень гашения начальных возмущений с = тах (J0 + (0)) (2.50) достигается при наихудшем начальном состоянии = max (J0 + (0)] , (2.51) где () - решение системы (2.41), найденное при с. Доказательство. Поскольку на объект не действует ни непрерывное, ни дискретное внешнее возмущение, то соотношение (2.51) получается из соотношений (2.46), если положить в последних = , () = 0 и к = 0, = 1,... , . Ш Следствие 2.6. В объекте (2.1), (2.2) и (2.3) уровень гашения непрерывных внешних возмущений ї = max (J0 + (0)) (2.52) достигается при наихудшем внешнем возмущении () = ") 1T()()(), (2.53) где () - решение системы (2.42), найденное при с.

Доказательство. Соотношение (2.53) получается из соотношений (2.46), если положить в последних к = 0, = 1,... , что равносильно тому, что на объект не действует дискретное внешнее возмущение, а в силу отсутствия начального возмущения необходимо отбросить условие (2.46c) и положить = в соотношении (2.45).

Следствие 2.7. В объекте (2.1), (2.2) и (2.3) уровень гашения дискретных внешних возмущений с = max (j 0 + (0)) (2.54) достигается при наихудшем внешнем возмущении / -г- \ -1 -г k = - (j(k)k - с") j(k)(k - 0), (2.55) где () - решение уравнения (2.43) с условиями (2.6b) и (2.6d), найденное при с" . Доказательство. Так как на объект не действует непрерывное внешнее возмущение, то соотношение (2.55) получается из соотношений (2.46), если положить в послед них В {і) = О, а в силу отсутствия начального возмущения необходимо отбросить усло вие (2.46c) и положить R = І в соотношении (2.45). Следствие 2.8. В объекте (2.1), (2.2) и (2.3) уровень гашения смешанных внешних возмущений lT = Amax (cJC0 + X(t0)) (2.56) достигается при наихудших внешних возмущениях (т- \ -1 -г AjX(tk)Ak - fc wl\ AjX(tk)x(tk-0), (2.57a) v (t) = (w) 1BT(t)X(t)x(t), (2.57b) где X{i) - решение системы (2.6a), (2.6b) и (2.6d), найденное при % w. Доказательство. Поскольку на объект не действует начальное возмущение, то, отбрасывая в соотношениях (2.46) условие (2.46c) и полагая R = І в формуле (2.45), получаем соотношения (2.57).

Отметим еще раз, что теорема 2.2 и следствия из нее позволяют свести вычисление соответствующих уровней гашения возмущений к решению нелинейной краевой задачи. Последняя же может быть решена различными численными методами, например, методом простой итерации. Кратко опишем применение данного метода на примере вычисления уровня гашения возмущений 7с. Выберем некоторое достаточно большое начальное значение 7 и решим задачу (2.6b), (2.6a) и (2.6d). Далее, используя формулу (2.45), вычислим следующее приближение к 7с. Указанную процедуру будем повто-рять до тех пор, пока разность между двумя соседними найденными значениями не станет меньше некоторого наперед заданного малого положительного числа. Один из существенных недостатков упомянутого подхода, помимо возможного отсутствия сходимости генерируемой последовательности приближений, - необходимость решать на каждом шаге матричное дифференциальное уравнение. От этого можно избавиться, если перейти от непрерывно-дискретной модели к дискретной. Следующий раздел посвящен реализации этой идеи.

Синтез оптимального управления по выходу

Сгруппируем первое и второе слагаемые в (2.105) и упростим выражение для П2, для чего опять применим формулу Шермана-Моррисона-Вудбери, тогда: "Г 1 Г / 1 -г \-1 1 1 -г CTkGk+lWklx \l + Ek+lXk+l(І - Ек+1\к-ІгЕтк+1Хк+1) Ек+1]кЦ GTk+lCk = -г / -г \-1 -г = CTkGk+l(Wk+l - ETk+lXk+lEk+l) GTk+lCk и П2 = ATkXk+l l - Ek+l , формируется матрица S, например, по формуле

Теорема 3.4 также позволяет синтезировать и обобщенное ft -оптимальное управление по выходу на бесконечном интервале времени. Для этого достаточно найти решение задачи минимизации 7с() при ограничениях, задаваемых неравенствами (3.51), после чего оптимальный регулятор находится как решение (3.52).

Наконец, в заключение параграфа, приведем без доказательств следствия из тео-ремы 3.4, устанавливающие необходимые и достаточные условия существования 70- и Псе -управлений по выходу для стационарного объекта на бесконечном горизонте.

Следствие 3.13. Для стационарного объекта (3.21), (3.22) при заданном 7 0 существует дискретное -управление по выходу на бесконечном интервале времени тогда и только тогда, когда линейные матричные неравенства Ah,XAh 0, С1 AhYAl Y C1YAl (Wc2 0 0 II МТ X I C1YCj WC 0 0 I M 0, (3.53a) (3.53b) x l Y 0, X yl, (3.53c) разрешимы относительно X = X 0, Y = У 0, при этом столбцы матриц Wr KJ 2 и M образуют базисы ядер матриц соответственно.

Следствие 3.14. Для стационарного объекта (3.21), (3.22) на бесконечном интервале времени существует дискретное И -управление по выходу, обеспечивающее гашение непрерывных внешних возмущений с заданным 7 0, тогда и только тогда, когда линейные матричные неравенства и первое неравенство (3.51c) разрешимы относительно X = X О, Y = У О, а столбцы матриц Wr и М образуют базисы пространств кет Со и кет [В.. D-,) соответственно.

Следствие 3.15. Для стационарного объекта (3.21), (3.22) на бесконечном интервале времени существует дискретное И -управление по выходу, обеспечивающее гашение дискретных внешних возмущений с заданным 7 О, тогда и только тогда, когда существуют матрицы X = X О, Y = У О, удовлетворяющие линейным матричным неравенствам и первому неравенству (3.51c), при этом столбцы матриц N и М образуют базисы пространств ker (С2 D2j и ker [Ви Dx) соответственно. Следствие 3.16. Для стационарного объекта (3.21), (3.22) на бесконечном интервале времени существует дискретное И -управление по выходу, обеспечивающее гашение смешанных внешних возмущений с заданным 7 0, тогда и только тогда, когда линейные матричные неравенства (3.51а), (3.51Ь) и первое неравенство (3.51с) разрешимы относительно матриц ХТ = Х 0 и Y = У О, при этом столбцы мат риц N и М образуют базисы пространств кег С2 О D2 0 и кег ВІ Dj О О соответственно.

Из замечания к теореме 2.8 следует, что существует такая конечная матрица R , что при любом весовом коэффициенте R R обобщенный Я -оптимальный регулятор по выходу на бесконечном интервале времени совпадает с // -оптимальным регулятором по выходу синтезированным по следствию 3.16 и обеспечивающим гашение смешан-ных внешних возмущений. Следовательно, для получения действительного компромисса при учете влияний как начального, так и внешних возмущений весовая матрица R должна удовлетворять условию Атах(Л_1Л) І. Численно граничное значение R весовой матрицы определяется следующим образом: brx y1 , где через Х обозначена матрица, удовлетворяющая неравенствам (3.51a), (3.51b) и первому неравенству (3.51c) при минимальном значении 7с.

Рассмотрим изображенную на рис. 3.3 механическую систему, состоящую из выве-шиваемого тела массы т и электромагнита . Левитация тела обеспечивается изменением магнитного поля, происходящим за счет изменения напряжения U, подаваемого на обмотку электромагнита. Динамика такого простейшего магнитного подвеса подчиняется двум уравнениям: ті) = F - та, (3.56) V + RI=U. Первое уравнение (3.56) выражает второй закон Ньютона и определяет изменение ко-ординаты s вывешиваемого тела под действием силы тяжести тд и силы F со стороны электромагнита, а второе - определяет изменение силы тока / в цепи электромагнита сопротивлением R при изменении подаваемого на него напряжения U и представляет собой закон Кирхгофа для электрической цепи электромагнита. Через Ф обозначено потокосцепление обмотки электромагнита, Ф = пФ, где Ф - магнитный поток, проходящий через один виток, а п - число витков в обмотке.

Потокосцепление Ф и сила тока / в цепи электромагнита связаны соотношением: = L(s)/, L{s) = , CL = /i0n2A/2, (3.57) где L(s) - индуктивность электромагнита, CL - конструктивный параметр и 6 - величина номинального зазора между электромагнитом и вывешиваемым телом. Если обозначить номинальную индуктивность как L0 = L(0), то С = L05, и тогда

В данном параграфе мы рассмотрим дискретную форму линейного несмещенного алгоритма, обеспечивающего минимальную среднеквадратическую ошибку, предполагая, что модель сообщения задана линейным векторным разностным уравнением

где входной шум (или шум объекта) представляет собой белый шум с нулевым средним и ковариационной матрицей

Модель наблюдения или измерения задается линейным алгебраическим соотношением

. (7.3)

где шум измерения v представляет собой белый шум с нулевым средним и

. (7.4)

Ради простоты первоначальных выкладок предположим, что и некоррелированны, т. е.

Для всех , (7.5)

Начальное значение представляет случайную величину со средним значением и дисперсией , иначе говоря

; . (7.6)

Будем также полагать, что для всех .

Найдем оценку величины по совокупности последовательных наблюдений . Обозначим эту оценку через , а ошибку оценивания - через

В зависимости от соотношения между величинами и оценивание называется предсказанием или экстраполяцией , фильтрацией или сглаживанием и, наконец, интерполяцией . Подобное деление интуитивно вполне понятно, поскольку, например, предсказание означает оценку состояния в-й момент, основанную на всех наблюдениях вплоть до -го момента. В этой главе в основном будем рассматривать задачу фильтрации, а предсказание и интерполяция будут исследованы в следующей главе.

Оценка будет условно и безусловно несмещенной, т. е. и , а также будет линейной функцией последовательности наблюдений. Из множества возможных линейных несмещенных алгоритмов оценивания выберем лишь тот, который дает минимальную дисперсию ошибки, т. е. тот, для которого или минимальны.

В предыдущей главе мы установили, что оценка по критерию минимума среднеквадратической ошибки совпадает с условным средним значением величины при заданной совокупности наблюдений . Однако в общем случае, даже если модели сообщения и наблюдения являются линейными (а для сформулированной здесь задачи они являются именно такими), условное среднее не является линейной функцией наблюдений, следовательно, алгоритм оценивания не обладает желательным свойством линейности.

Чтобы получить линейный алгоритм оценивания, обеспечивающий минимальную дисперсию ошибки, мы должны использовать один из двух подходов. Один из них состоит в том, чтобы определить условное среднее, представляющее линейную форму, а затем найти наилучший вариант такой формы. Этот подход основан на использовании ортогонального проецирования. Другой подход основан на предположении, что случайные величины , и совместно нормальны. В силу доказанного в гл. 4 свойства линейных систем не изменять нормальный закон распределения точное условное среднее в этом случае будет линейной формой. Линейная оценка с минимальной дисперсией должна быть равна оценке с минимальной дисперсией, если последняя действительно является линейной. Это имеет место, если предполагать нормальные законы распределения.

Заметим, что если мы требуем, чтобы алгоритм оценивания был линейным, то фактический закон распределения величин , и не имеет значения. Однако, если распределения действительно являются нормальными, как это часто бывает, тогда условное среднее фактически является линейной формой. Иначе говоря, фильтр Калмана представляет собой наилучший (в смысле минимума дисперсии ошибки) линейный фильтр независимо от вида распределения и наилучший алгоритм из всех возможных линейных и нелинейных алгоритмов оценивания, если шумы объекта и измерения, а также начальное состояние имеют нормальные законы распределения.

При выводе уравнения для фильтра Калмана будем предполагать и требовать, чтобы наблюдения обрабатывались последовательно. Независимо от того, является ли алгоритм оценивания последовательным или нет, значения полученных оценок состояния не корректируются. Однако существенное значение имеет вычислительная реализуемость метода. Вероятно, наиболее значительный вклад Калмана и Бьюси состоит в том, что они впервые получили линейный алгоритм оценивания по критерию минимума дисперсии в последовательной форме, используя понятие переменных состояния. Проблема линейной последовательной фильтрации по критерию минимума дисперсии ошибки была давно уже решена Винером и другими авторами применительно к системам с одним входом и одним выходом. Главная заслуга Калмана состоит в том, что он обобщил теорию фильтрации Винера на случай нестационарных многомерных систем с нестационарными шумовыми реализациями конечной длительности и получил решение задачи фильтрации в рекуррентном виде.

Так как изложение существа проблемы несколько затянулось, перед тем, как непосредственно приступить к ее решению, подведем итоги. Мы хотим получить оптимальную по критерию минимума дисперсии ошибки линейную несмещенную оценку состояния линейной нестационарной динамической системы, на которую воздействует белый шум с нулевым средним и известной дисперсией.

Для получения оценки мы наблюдаем изменяющуюся во времени линейную функцию состояния на фоне аддитивного белого шума с нулевым средним и известной дисперсией. Начальное состояние процесса представляет собой случайную величину с известными средним значением и дисперсией. Корреляция между входным шумом и шумом измерения отсутствует и требуется найти алгоритм оценивания в рекуррентном виде. Алгоритм фильтрации Калмана представляет собой решение этой задачи. Применительно к дискретным системам рассмотрим два различных подхода к выводу уравнения фильтра Калмана, которые являются иллюстрацией двух идей, изложенных выше. В первом случае, когда используется подход, основанный на ортогональном проецировании, мы заранее выберем линейную форму алгоритма оценивания, а затем найдем наилучший алгоритм. Во втором случае, когда оценивание производится по максимуму апостериорной вероятности, будем предполагать, что случайные величины имеют нормальные законы распределения и найдем оптимальный алгоритм оценивания, который действительно окажется линейным. При выводе уравнения фильтрации Калманом использовался подход, основанный на методе ортогонального проецирования, поэтому изложение начнем с этого метода.

Ортогональное проецирование. Теория ортогонального проецирования вкратце была рассмотрена в § 6.6. Здесь без доказательства будут представлены некоторые обобщения приведенных там результатов; они нам понадобятся в дальнейшем. Линейная оценка величины по критерию минимума дисперсии ошибки при заданном линейном пространстве наблюдений задается ортогональной проекцией на , т. е. .

Здесь использован символ вместо , поскольку линейная оценка с минимальной дисперсией не совпадает в общем случае с условным математическим ожиданием. Если бы мы заранее предположили, что случайные величины имеют нормальные распределения, то просто совпало бы с ; однако мы сознательно выбрали другой подход, чтобы подчеркнуть, что предположение о нормальных распределениях не является необходимым, если помнить, что полученный при этом алгоритм оценивания может оказаться не абсолютно наилучшим, а наилучшим лишь в классе линейных алгоритмов. Если ортогональная последовательность образует базис для , то может быть представлена следующим образом

. (7.8)

Для получения решения в рекуррентной форме нам понадобится следующий результат. Если - вектор, ортогональный , т.е. , для , где - ортогональный базис для , тогда

Этот результат и представляет собой лемму об ортогональном проецировании. Хотя нас будет интересовать фильтрация , т. е. , рассмотрим сначала одношаговое предсказание, т. е. . Для того чтобы получить решение в требуемой рекуррентной форме, воспользуемся принципом математической индукции. Предположим, что известна и представим через и новое наблюдение . Однако , вообще говоря, не ортогонально и прежде, чем воспользоваться ур-нием (7.9), необходимо найти составляющую наблюдения , ортогональную . По существу, это сводится к выделению новой информации, содержащейся в .

Легко показать, что вектор

ортогонален . Заметим, что представляет собой «новую информацию», содержащуюся в , так как для получения наилучшая оценка величины при условии, что задан , а именно , вычитается из . Это другая форма утверждения о том, что ортогонален . Случайная величина известна под названием «обновляющей». Используя ур-ние (7.10), можно выразить через обновляющую случайную величину следующим образом:

Эти два выражения эквивалентны, так как содержится в пространстве наблюдений и, следовательно, не добавляется никакой дополнительной информации по сравнению с той, которая содержится в . Поскольку и ортогональны, можно воспользоваться ур-нием (7.9) и записать как . Так как , то это выражение можно представить в следующем виде:

Отсюда следует, что получается путем предсказания значения случайной величины по предыдущим наблюдениям с последующей коррекцией предсказанного значения в соответствии с новой информацией , содержащейся в текущем выборочном значении случайной величины . Концепция предсказания и коррекции является очень плодотворной и позволяет наглядно интерпретировать алгоритм Калмана. Поэтому при выводе алгоритма фильтрации будем использовать подход, опирающийся на идею предсказания и коррекции. Проанализируем в отдельности каждый из двух членов, стоящих в правой части ур-ния (7.11). Согласно выражению (7.1) задается как . Поэтому , которая по определению равна , теперь становится равной

Согласно определению и мы имеем

Так как зависит только от для и представляет собой белый шум, то математическое ожидание величины при заданном просто совпадает с безусловным математическим ожиданием . Таким образом, приведенный выше результат преобразуется в следующий:

Мы видим, что предсказанное значение , основанное на наблюдении , получается из как результат невозмущенного перехода на один шаг вперед, т. е. при . Этот вывод не является неожиданным, поскольку наилучшая оценка , основанная на наблюдении , как было показано выше, тождественно равна нулю. Из этого также следует

Это означает, что и при фильтрации, и при предсказании наилучшая оценка белого шума с нулевым средним тождественно равна нулю. Этот вывод крайне важен и будет весьма полезен, особенно при обсуждении понятия «обновляющего» процесса. Ниже аналогичным образом будет показано, что определяется как и что в действительности

Если подставить ур-ние (7.12) в (7.11), то получим

Рассмотрим второе слагаемое в правой части этого уравнения. Используя ур-ние (7.8), можно записать в следующем виде:

Теперь исследуем отдельно каждый член, стоящий в правой части этого уравнения. Подставив (7.1) для , получаем для первого члена уравнения

Теперь, используя определения величин и [см. ур-ния (7.3) и (7.10)], можно записать в следующем виде:

где . Поэтому ур-ние (7.17) принимает вид

а после перемножения соответствующих членов преобразуется к виду

Так как зависит только от , и , a и не коррелированны, то . Поскольку представляет собой белый шум, а зависит от только при , то и третий член в правой части приведенного выше уравнения должен быть равен нулю. Последний член в правой части уравнения также равен нулю, так как и - не коррелированны. Поэтому остается только первый член и в результате имеем

Полученное выражение можно еще более упростить, если учесть, что . При этом становится равным

Но первый член согласно лемме об ортогональном проецировании равен нулю. Поэтому ур-ние (7.18) можно записать в виде:

где Аналогичным образом можно показать, что

Если подставить уравнения (7.19), (7.20) и (7.10) в (7.16), то

Поэтому выражение для принимает вид

Этот результат можно представить в более удобной форме, если ввести обозначение

так что получаем окончательно

Величина называется коэффициентом усиления одношагового экстраполятора Калмана. Форма решения, представленного уравнениями (7.23) и (7.24), очень интересна и удобна с вычислительной точки зрения. Мы получили последовательный алгоритм вычисления по известной величине , вычисленной на предыдущем шаге, и новому наблюдению . Новая оценка здесь формируется как результат экстраполяции старой оценки и последующей коррекции при помощи взвешенного сигнала ошибки наблюдения Структурная схема экстраполятора Калмана показана на рис. 7.1б; для сравнения исходные модели сообщения и наблюдений показаны на рис. 7.1, а. Прежде чем воспользоваться полученным выше результатом, необходимо сначала найти выражение для , чтобы вычислить . Можно поступить иначе и найти . Для того чтобы определить , найдем сначала рекуррентное выражение для . Объединяя уравнения (7.1) и (7.24), получаем

Рис 7.1. Структурные схемы задачи одношагового предсказания: а) модели сообщения и наблюдений, б) устройство одношагового предсказания

Если теперь подставить выражение (7.3) для и выполнить ряд простых алгебраических преобразований, то приведенное выше выражение приводится к виду

Кроме того, что ур-ние (7.25) может быть использовано при вычислении , оно представляет также самостоятельный интерес, как закон изменения ошибки оценивания.

Так как среднее значение величины равно нулю (поскольку оценка является несмещенной), а величины , и - не коррелированы, то выражение для может быть получено непосредственно, исходя из определения этой величины и ур-ния (7.25), в виде

Если теперь подставить (7.23) для и упростить полученный результат, то получим следующее выражение для дисперсии ошибки:

Уравнение (7.26) совместно с (7.23) и (7.24) полностью определяют линейный последовательный одношаговый экстраполятор с минимальной дисперсией ошибки.

Прежде чем воспользоваться полученным выше результатом, необходимо в уравнениях для и задать соответствующие начальные условия. Очевидно, что наилучшей оценкой величины при условии, что не было произведено наблюдений, является и, следовательно, Поэтому

Итак, в качестве начальных условий для алгоритмов одношагового предсказания выбираем ; .

Все алгоритмы одношагового предсказания сведены в табл. 7.1.

Уравнение (7.26) можно переписать также в следующем виде:

Если задать начальные условия в ур-ниях (7.24) и (7.26), то можно последовательно использовать алгоритмы одношагового предсказания. Например, ур-ние (7.23) с начальным условием может быть использовано для нахождения , которое затем необходимо подставить в (7.24) для вычисления по первому наблюдению . Уравнение дисперсии (7.26) используется на следующем этапе при пересчете в . Полученное значение величины затем используется для вычисления и т. д. Обработка данных согласно уравнениям предсказания схематически показана на рис. 7.2. Внимательный анализ ур-ний (7.23) и (7.26) показывает, что вычисление величин и фактически выполняется без обращения к последовательности наблюдений . Можно заранее вычислить и запомнить матрицы коэффициентов усиления . Вероятно, мы могли бы не принимать этот метод предварительного вычисления матриц , если бы скорость поступления наблюдений на вход процессора не была такой высокой и не препятствовала бы выполнению вычислений согласно ур-ниям (7.23) и (7.26) в реальном масштабе времени или если бы возможность запоминания не являлась более доступной и дешевой по сравнению с возможностью вычислений в реальном времени.

Таблица 7.1. Дискретные алгоритмы одношагового предсказания

Модель сообщения

Модель наблюдений

Априорные данные

; ; ;

Алгоритм предсказания

Вычисление коэффициента усиления

Вычисление априорной дисперсии

Начальные условия

Главное преимущество алгоритмов фильтрации Калмана заключается не столько в том, что они дают решение задачи фильтрации (решение другими способами было получено гораздо раньше), сколько в том, что решение непосредственно определяет практическую реализацию результатов. При решении многих практических задач можно обеспечить реализуемость вычислений по ур-ниям (7.23) и (7.26) в реальном масштабе времени и, следовательно, реализовать последовательные алгоритмы фильтрации в реальном масштабе времени. Еще одна характерная особенность рассмотренного подхода заключается в том, что дисперсия ошибки вычисляется как составная часть оценки и поэтому может быть использована для контроля точности процедуры оценивания. Это основано на предположении о том, что модели сообщения и наблюдений, а также априорное распределение известны полностью.

Рис. 7.2. Структурная схема вычислений по алгоритмам предсказания

Пример 7.1 . Пусть модели сообщения и наблюдений заданы скалярными уравнениями:

; .

причем и или,. Здесь мы предполагаем, что шум является стационарным и белым, хотя, вообще говоря, не обязательно, чтобы он был стационарным. Предположим также, что начальное значение имеет нулевое среднее и единичную дисперсию, так что и .

Для этого примера уравнение оценивания (7.24) принимает вид

с коэффициентом усиления , определяемым из уравнения

Уравнение дисперсии имеет вид

Вычислим и в предположении, что у нас имеются наблюдения , . Вычисляем сначала коэффициент усиления , используя начальное условие :

; .

Используя начальное условие , получаем и . Дисперсию погрешности этой оценки определим из уравнения дисперсии следующим образом:

Теперь необходимо повторить все этапы вычислений, чтобы найти , оценку и, наконец, дисперсию . Хотя рассмотренный пример является чрезвычайно простым, но он достаточно наглядно иллюстрирует все этапы вычислений, которые необходимо выполнить в процессе применения алгоритмов одношагового предсказания Калмана.

Одной из практически важных задач, возникающих при использовании приведенных выше результатов и даже более трудной, чем нахождение среднего значения и дисперсии начального состояния, является определение дисперсии входного шума и шума измерения. Значения дисперсий и часто могут быть получены либо из анализа физической сущности задачи, либо путем непосредственного измерения с разумной точностью. Аналогичные замечания можно сделать относительно априорных моментов вектора состояния. Величина выбрана как наилучшая оценка среднего значения вектора состояния на нулевом шаге, т. е. до того, как были произведены наблюдения, a как характеристика степени неопределенности при выборе .

В чисто качественном смысле можно утверждать, что чем значительнее неопределенность относительно истинного значения , тем большие значения мы задаем.

Теперь обратимся к задаче фильтрации. Одношаговый зкстраполятор использовался как удобный этап решения этой основной задачи, и он часто имеет практическое значение. Мы убедимся, что решение проблемы фильтрации включает в себя одношаговое предсказание, результаты которого затем корректируются в соответствии с текущей информацией. Часто, но не всегда, решение проблемы фильтрации следует предпочесть решению проблемы одношаговой фильтрации.

Если оценка , полученная как результат фильтрации, а именно , известна, то может быть получена как

Так как и, следовательно, зависят от только для , то пространство наблюдений не содержит информации относительно , где - дискретный белый шум. Следовательно, для предсказания значения по наблюдениям достаточно предсказать значения на один шаг вперед, полагая . Такой подход позволил получить ур-ние (7.27), которое будет использовано в дальнейшем. Умышленно допуская нестрогую запись ради простоты обозначения, запишем как . За исключением специально оговариваемых случаев, как в , будем предполагать, что условия задаются пространстранством . В этих обозначениях ур-ние (7.27) перепишется в виде

Очевидно, что две оценки , основанные на наблюдении , должны быть эквивалентны. Следовательно, можно использовать ур-ние (7.28) для получения последовательного алгоритма оценивания из ур-ний (7.23), (7.24) и (7.26). Сначала подставим yp-н.ие (7.28) при в (7.24). В результате получим

Если умножить обе части этого уравнения на , которая в силу свойств переходной матрицы состояний равна , то получим

Чтобы упростить полученное выражение, введем , определяемую как , или

если использовать для определения ур-ние (7.23). Поэтому записывается в виде

Хотя ур-ние (7.30) представляет собой, вероятно, наиболее удобную форму записи уравнения оценивания для фильтра Калмана, в принципе можно получить несколько других форм записи. Две из них оказываются особенно полезными. Если воспользоваться соотношением, то ур-ние (7.30) можно переписать в следующем виде:

Это выражение можно еще более упростить, если ввести «обновляющую» величину , чтобы получить

Уравнения (7.29)-(7.31) или (7.32) совместно с ур-нием (7.26) полностью дают решение проблемы линейной фильтрации по критерию минимума среднеквадратической ошибки. Заданные начальные условия по , а именно и , используются для формирования начальных условий соответственно для и так же, как и в одношаговом экстраполяторе.

Алгоритмы фильтрации Калмана могут быть представлены в более удобной форме, если найти выражения для дисперсии ошибки фильтрации . К тому же дисперсия может быть использована как критерий качества процедуры оценивания. Дисперсию часто называют априорной дисперсией, так как она представляет собой дисперсию оценки до момента наблюдения , а дисперсию называют апостериорной дисперсией. Для того чтобы определить , сначала найдем выражение для . Опять возможно несколько форм представления . Одной из наиболее удобных для нашего случая является представление с помощью ур-ния (7.32). В этом случае определяется следующим образом:

Если теперь подставить ур-ния (7.29) для и (7.19) и (7.20) для и в это выражение, то получим

Если воспользоваться ур-нием (7.29) для , то последнее выражение может быть переписано в виде

Согласно этому уравнению дисперсия ошибки фильтрации достаточно просто выражается через дисперсию ошибки одношагового предсказания. Использование величины позволяет также значительно упростить ур-ние (7.26). Перепишем его в виде

Воспользовавшись ф-лой (7.29) для , можно записать это выражение как

Легко заметить, что величина, стоящая в фигурных скобках, представляет не что иное, как . Поэтому имеем

Это выражение могло быть получено обычным способом путем вычисления дисперсии случайной величины, задаваемой ур-нием (7.1) при заданном .

Уравнения (7.29), (7.30), (7.33) и (7.34) полностью определяют окончательный вариант дискретного фильтра Калмана. Эти уравнения сведены в табл. 7.2. Структурная схема вычислений согласно полученным алгоритмам приведена на рис. 7.3, а структурная схема дискретного фильтра Калмана - на рис. 7.4.

Обращаем еще раз внимание на то, что в уравнение для дисперсии и коэффициента усиления не входит последовательность наблюдений, поэтому при необходимости эти величины могут быть вычислены заранее. Эта возможность условно показана на рис. 7.3 пунктирной линией.

Таблица 7.2. Сводка дискретных алгоритмов фильтрации Калмана

Модель сообщения

Модель наблюдений

Априорные данные

Алгоритмы фильтрации

Вычисление коэффициента усиления

Вычисление априорной дисперсии

Уравнение для апостериорной дисперсии

Начальные условия

Анализ структурной схемы рис.7.4 показывает, что в фильтре Калмана реализуется идея предсказания - коррекции. Предыдущая оценка экстраполируется на один шаг вперед и затем используется для получения наилучшей оценки нового наблюдения , основанной на всех предыдущих наблюдениях. Ошибка между «наилучшей оценкой» текущего наблюдения и фактическим наблюдением а именно или , представляет собой новую информацию [компоненту , ортогональную ]. Ошибка взвешивается с весом учитывающим значение дисперсий входного процесса, измерения и ошибки оценивания для формирования сигнала коррекции. Сигнал коррекции складывается с предсказанной оценкой и в результате получается новая оценка.

Рис.7.3. Структурная схема вычислений по алгоритму фильтрации Калмана.

Рис. 7.4. Структурная схема дискретного фильтра Калмана.

Заметим, что структура фильтра Калмана, соответствующая ур-нию (7.30) и изображенная на рис. 7.4, очень напоминает структуру исходной модели сообщения, заданной ур-нием (7.1) и приведенной на рис. 7.1а. Алгоритм фильтрации строится на использовании «обновляющей» компоненты, которая содержит новую информацию, полученную в результате наблюдения.

Пример 7.2. Для иллюстрации применения алгоритма фильтрации Калмана рассмотрим двумерную модель сообщения, задаваемую уравнением

Наблюдение осуществляется согласно скалярной модели

Входной шум является стационарным с , а шум измерения - нестационарным с . Другими словами, измерения для четных индексов осуществляются менее точно, чем для нечетных. Предположим, что дисперсия начальных ошибок (или начального состояния) задается матрицей . Требуется вычислить значение для всех от 1 до 10.

Используя ур-ния (7.29) и (7.34), а также начальное условие , можно легко вычислить и , которые соответственно равны

Теперь с помощью ур-ния (7 23) можно вычислить апостериорную дисперсию

а также априорную дисперсию, которая изменяется для следующего шага согласно ур-нию (7.34) и становится равной

Рис. 7.5. Изменение коэффициентов усиления фильтра Калмана, рассмотренного в примере 7.2

Теперь можно вычислить и т.д. Компоненты вектора , при изменении от 1 до 10, показаны на рис 7.5. Отметим характерное увеличение коэффициента усиления для нечетных значений , в результате которого усиливаются относительно точные измерения. Можно заметить, что коэффициент усиления достигает своего установившегося периодически изменяющегося значения за несколько выборок. Вероятно, полезно вкратце и чисто качественно обсудить влияние соотношения величин и на , даже если трудно получить общие количественные результаты. Во-первых, здесь важны относительные значения, а не абсолютные. В частности, легко показать, что в том случае, когда , и умножаются на одну и ту же положительную скалярную постоянную, то не изменяется. Весьма приближенно можно лишь утверждать, что коэффициент усиления зависит от отношения сигнала к шуму . Элементы матрицы коэффициентов уменьшаются по мере уменьшения значений элементов матриц и [или только в ] или увеличения значений элементов матрицы . Этот результат представляется интуитивно вполне понятным, поскольку по мере уменьшения следует ожидать все меньших изменений в состоянии , а поэтому нет необходимости «отслеживать» наблюдения так точно. Аналогичным образом, если уменьшается, то повышается точность начальной оценки и потребность в информации, содержащейся в наблюдениях, снижается и, следовательно, коэффициент усиления уменьшается. С другой стороны, если будет возрастать, то коэффициент усиления снова уменьшается, препятствуя добавлению к оценке чрезмерного шума измерения. В пределе, когда стремится к нулю, как нетрудно показать, асимптотически приближается к нулю для больших значений . Когда стремится к нулю, дисперсии ошибок также стремятся к нулю и процедура оценивания становится не зависящей от наблюдения и входит в режим, известный под названием насыщения по входным данным. Этот режим может привести к серьезным проблемам расходимости. Методы коррекции расходимости подробно обсудим в разд. 8.5.

Оценивание по критерию максимума апостериорной вероятности. Получим линейный алгоритм оценивания, предположив, что , и имеют нормальные законы распределения. B этом случае нетрудно показать (см. § 4.2), что и - случайные величины с нормальным законом распределения для всех . Поэтому представляет собой линейную функцию наблюдения. Иначе говоря, линейный алгоритм оценивания по критерию минимума дисперсии ошибки является алгоритмом оценивания с минимальной дисперсией ошибки, причем дисперсия ошибки меньше или равна дисперсии ошибки любого другого линейного либо нелинейного алгоритма оценивания.

Чтобы получить алгоритм оценивания по критерию максимума апостериорной вероятности, требуется лишь определить условную плотность вероятности величины при заданном , а затем найти ее математическое ожидание. Так как условное распределение при заданном нормальное, то, как известно (см. §6.2), алгоритм оценивания, вычисляющий условное математическое ожидание, минимизирует не только средний квадрат ошибки, но также среднее значение абсолютной ошибки при простой и многих других функциях потерь.

Таким образом, можно поручить алгоритм оценивания с минимальной дисперсией, рассмотрев оценивание при любых других функциях потерь, например, оценивание по критерию максимума апостериорной вероятности (сокращенно МАВ-оценивание), когда функция потерь выбирается простой, а оценка совпадает с модой условной плотности.

Воспользуемся этим приемом и построим алгоритм МАВ-оценивания. Так как некоторые выражения, с которыми придется оперировать, могут оказаться слишком длинными, в процессе изложения иногда будем пользоваться упрощенной формой записи. Допуская незначительную нестрогость, откажемся от индексного обозначения для плотностей вероятности, а рассматриваемые случайные величины будем обозначать как аргументы этих плотностей. Например, значение плотности вероятности случайной величины в точке , записывается в этом случае как ; аналогично записывается как . И не надо пытаться трактовать эту упрощенную форму записи как вероятность того, что (это явная бессмыслица), вернее, плотность вероятности следует рассматривать как функцию, а не как значение этой функции, которое она принимает для конкретного наблюдения. К сожалению, в нестрогой математике, которой пользуются инженеры, часто недостаточно четко подчеркивается различие между функцией, как отображением одного множества в другое, и конкретным значением этой функции.

Функция плотности вероятности, рассматриваемая при оценивании на основе критерия максимума апостериорной вероятности либо на основе условного математического ожидания, представляет собой функцию случайной величины при заданной последовательности наблюдений и обозначается как . Алгоритм оценивания, основанный на условном математическом ожидании, определяется как

(7.35)

Оценка по критерию максимума апостериорной вероятности, которую будем обозначать как , находится как решение уравнения

. (7.36)

при условии, что

(7.37)

Если выполняется условие (7.37), которое требует, чтобы матрица вторых производных была отрицательно определенной, то решение ур-ния (7.36) соответствует максимуму условной плотности.

Чтобы найти выражение для , воспользуемся теоремой умножения и запишем как

Если рассматривать как объединение нового наблюдения и предыдущих наблюдений, то ур-ние (7.38) перепишется в виде

(7.39)

Рассмотрим числитель этого выражения. Применяя теорему умножения, можем записать

так как знание несомненно исключает необходимость сохранения . Если задана, то в случайной величиной является только и поскольку - белый шум, то никакой информации не содержится ни в , ни в . Если подставить выражение (7.40) в (7.39), то получим

Применяя теорему умножения к знаменателю, полученное выражение запишем в виде

После сокращения на общую скалярную функцию вероятности получаем

(7.41)

Теперь можно определить условную плотность вероятности случайной величины при заданном путем вычисления каждого выражения для вероятности, стоящего в правой части ур-ния (7.41). Рассмотрим каждый член в отдельности, доказывая, что каждая плотность вероятности, входящая в (7.41), нормальная, и определяя первые два момента, характеризующие нормальное распределение. Исследуем сначала . Так как задается уравнением , a - нормальный случайный процесс, то плотность вероятности несомненно является нормальной, поскольку есть сумма нормального случайного процесса и постоянной величины . Среднее значение процесса равно

поскольку - случайный процесс с нулевым средним значением. Дисперсия случайного процесса равна по определению

а в данном случае

Отсюда плотность вероятности можно записать в следующем виде:

Теперь рассмотрим знаменатель выражения (7.41), точнее, плотность вероятности величины три заданном . Используя уравнение для модели наблюдений, можно записать как

Согласно исходной постановке задачи известно, что имеет нормальный закон распределения и не зависит от . Если предположить, что - нормальная, то несомненно также является нормальной, так как представляет собой линейную функцию (сумму) двух случайных величин, имеющих нормальный закон распределения. Плотность вероятности случайной величины при заданном и- нормальная, так как она в этом случае просто совпадает с , которая согласно исходному предположению - нормальная. Ниже будет показана справедливость допущения о том, что , а следовательно, и являются нормальными для всех . Среднее значение с плотностью равно

где использовано ранее введенное обозначение ; равно нулю, так как - белый шум с нулевым средним. Дисперсия процесса по определению равна при заданном, так как дисперсия величины:, рассматриваемые в качестве начальных в этой цепи, являются нормальными. Следовательно, подтверждается предположение, что плотность нормальная.

Оценка состояния при заданном , основанная на условном математическом ожидании (оценка по критерию минимума дисперсии ошибки), определяется ур-нием (7.54) и согласуется с ранее полученными результатами [см. (7.30)]. Однако в этом случае оценка точно равна условному математическому ожиданию (поскольку здесь предполагалось нормальное распределение), а не является наилучшей только в классе линейных оценок. Конечно, для нормального распределения обе оценки совпадают, так как условное математическое ожидание - линейная функция наблюдения.

Чтобы определить МАВ-оценку, необходимо найти значение , которое максимизирует . Воспользуемся известным приемом и будем искать максимум не самой плотности

и в данном случае соблюдается в силу физических свойств матрицы дисперсий ошибок. Следовательно, МАВ-оценка совпадает с оценкой условного математического ожидания и оценкой по критерию минимума дисперсии ошибки. Совокупность величин является достаточной статистикой для оценивания в том смысле, что полностью определяют условную плотность .

Следует отметить, что можно было бы непосредственно воспользоваться исходной формой записи плотности [выражением (7.52)], а не компактной формой (7.53). Такой подход представляется более привлекательным, так как в этом случае не требуется знание более компактной формы, которая не является достаточно простой и очевидной. Если воспользоваться выражением (7.52) для , то в результате преобразования ур-ния (7.57) имеем

Если теперь сгруппировать члены, включающие в себя , то получим

решение которого относительно приводит к следующему результату:

Хотя это решение для оптимальной оценки представлено не в такой удобной форме, как предыдущее, оно легко может быть приведено к (7.62), если воспользоваться леммой об обращении матриц либо непосредственно выражениями (7.55) и (7.56).

Из алгоритмов фильтрации Калмана можно получить ряд интересных и полезных выражений для дисперсии. Вот некоторые из наиболее полезных, связанные с понятием «обновляющего процесса»:

С ур-нием (7.70), получаем [которое представляет собой также оптимальную оценку действует на выходе системы, т. е. когда модель наблюдения имеет следующий вид:

Они дают решение задачи линейной дискретной фильтрации в наиболее общей формулировке. В заключение отметим, что из общих результатов следуют, как частные, результаты, приведенные в табл. 7.2, если положить и равными нулю.