Биографии Характеристики Анализ

Оптимално линейно динамично филтриране. Оптимален филтър на Калман-Бюси

Както е известно, същността на филтрирането е непрекъснатото оценяване на променящите се във времето параметри на случаен процес. Ако съобщението е скаларен процес на Марков (за стационарен процес на Гаус това означава, че ковариационната функция има формата Aexp(-B|t-u|), тогава решението на проблема може да се основава на следните принципи, които опростяват постигането на целта:

Описанието на процесите, които ни интересуват, трябва да се извърши с помощта на линейни системи с променящи се във времето параметри, които биха ги генерирали, когато на входовете на системите се приложи бял шум;

Линейна система, генерираща съобщение, трябва да бъде описана с диференциално уравнение, чието решение е желаното съобщение;

Оптималната оценка като изходна стойност на линейна система трябва да се даде като решение на диференциално уравнение, чиито коефициенти се определят от статистиката на процесите.

Линейните системи, изградени според тези принципи, се наричат ​​филтри на Калман-Бюси, които притежават оригиналната работа в тази област. За разлика от тези принципи, при интегралното филтриране на Винер описанието на процесите се извършва с помощта на ковариационни функции, линейни системи - с помощта на импулсната характеристика, оптимални оценки - като решение на интегралното уравнение на Винер-Хопф.

Диференциалното уравнение на оптималния филтър на Калман в канонична форма е:

където е матричното усилване на оптималния филтър.

Филтърът на Калман извършва динамично оптимално филтриране на нестационарни случайни процеси. Решението на задачата за оптимално филтриране се свежда до решаване на система от векторно-матрични диференциални (или диференциални) уравнения. Този метод ви позволява да управлявате затворена система от уравнения в рекурентна форма, което е най-удобно за техническа реализация. По същество филтърът на Калман е алгоритъм за обработка на изчислителна информация, който използва набор от априорна информация за оригиналната система (структура, параметри, статистически характеристики на шума на състоянието и шума на измерване, информация за началните условия и др.). Такъв филтър извършва статистическа обработка на информацията от наблюдението, като взема предвид динамичните свойства на оригиналния модел на системата. Структурата на филтъра на Калман е модел на оригиналната динамична система с грешка при филтриране, коригирана от коригиращия сигнал

където е коригиращ сигнал от формата:

В този случай оптималният нестационарен динамичен филтър на Калман е затворена система за автоматично управление, съдържаща математически модел на оригиналната система, а на изхода на модела се генерира оценка на състоянието и коригиращ сигнал с нестационарна матрица печалбата е вход K(t):


Следователно алгоритъмът за динамично филтриране се основава на класическия принцип на контрол на отклонението с матрично усилване K(t), което осигурява минималната средноквадратична грешка на филтриране. Коригиращият сигнал се състои от текущия сигнал за наблюдение z(t) на състоянието на оригиналната система, допълнен от текущия сигнал на състоянието на модела на оригиналната система. Сигналът е сигнал за коригиране на грешки на филтъра и характеризира допълнителна информация между текущите измервания z(t) и оценките на състоянието, получени от резултатите от оценките преди текущите измервания z(t). Матричната схема на оптималния филтър на Калман има формата, показана на фиг. 4.18. Тази схема прилага алгоритъм за динамично филтриране, когато състоянието на оригиналната система е дадено от диференциални уравнения, чиято дясна страна не зависи от наблюдението.

Оптималното дискретно филтриране на Калман стана особено широко разпространено във връзка с развитието на дискретни методи за обработка на информация. Това е разширение на резултатите от непрекъснатото оптимално динамично филтриране към дискретни динамични системи, описани с разностни векторно-матрични уравнения.

Ориз. 4.17. Матрична схема на оптимален филтър на Калман

Оптималното уравнение на линейния филтър ви позволява последователно да изчислявате оценките. Само предишните стойности на резултата и номера на параметъра се използват за изчисляване на резултата. Стойността на резултата по време се изчислява от резултата по време, добавяйки претеглената разлика между измерването по време и резултата от измерването по време . Този начин за изчисляване на резултатите се нарича рекурсивен. По този начин дискретният филтър на Калман в рекурсивна форма изпълнява рекурсивна процедура за изчисляване на последователни оценки, което изисква съхраняване на малък брой резултати от изчислението на всяка стъпка.

Матричната схема на дискретния филтър на Калман е показана на фиг. 4.19 заедно с моделите на изходната динамична система и измервателната система.

Ориз. 4.18. Матрична верига на дискретния филтър на Калман

Основата за извеждане на уравнението на филтрацията са уравненията на състоянието на динамичната система и уравнението за наблюдение (измерване). Уравнението на състоянието на линейна динамична система се описва от система от диференциални уравнения във векторно-матрична форма:

където е преходната матрица на състоянието на измерението , -мерен вектор на състоянието на динамичната система; - матрица на смущението, или входен сигнал на размерност; - -размерен вектор на произволна Гаусова последователност.

Уравнението за наблюдение (измерване) на сигнала, получен на изхода на модела на измервателната система, се описва от уравнението на диференциалния вектор:




където е дименсионален вектор за наблюдение (измерване); -размерен вектор на произволна Гаусова некорелирана последователност от грешки на измерване, които изкривяват резултата от наблюдението на състоянието на динамична система; измерение матрица размери

Да приемем, че оценката на състоянието на системата в момента и матрицата на прехода ) са известни. Тогава тази оценка може да се приеме за първоначална и оценката към момента може да се изчисли в съответствие с уравнението:


Тази оценка е прогнозирана (екстраполирана) от резултатите от предишни наблюдения. При изчисляването му не е използвано последното измерване на състоянието на динамичната система, извършено към момента. Това ще доведе до грешки при оценката на вектора на състоянието на системата. Грешката на оценката в момента чрез матрицата на прехода се простира до всички следващи оценки в и при дълго време на работа на филтъра грешките могат да се натрупат и да доведат до незадоволителни резултати. Оценката може да бъде подобрена чрез използване на измервания в даден момент и генериране на коригиращ сигнал: . Оттук

Замествайки (9.14) в този израз, получаваме уравнението на дискретния филтър на Калман в каноничната форма:

Оптималният коефициент на предаване на такъв филтър трябва да осигурява минимална средна квадратична грешка при филтриране в съответствие с условие (4.152).

Контролен списък за глава 4

1. Какви критерии за вземане на решение се използват в GAS NC?

2. Какви са приликите и разликите между критериите за откриване на "Идеален наблюдател", "Нейман-Пиърсън" и "Уолд"?

3. Каква е физическата същност на вероятностите за правилно откриване, правилно неоткриване, пропуск на сигнала и фалшива аларма?

4. Как корелира вероятността от фалшива аларма "в точката" и многоканална система?

5. Как се избира прагът на откриване при прилагане на критерия на Neyman-Pearson?

6. Как се избира прагът на откриване при прилагане на критерия на Котелников-Зигерт?

7. Как се избира прагът на откриване при прилагане на критерия за откриване на Wald?

8. Какви са адекватността и характеристиките на корелационния приемник и съвпадащия филтър?

9. Каква е същността на последователността на оценката?

10. Каква е същността на ефективността на оценката?

11. Каква е същността на безпристрастната оценка?

12. Какво представлява информационната матрица на Fisher?

13. Как е изградена характеристиката за насочване на сонара?

14. Как се формира речникът на знаците и азбуката на изображенията на сонарни обекти?

15. Каква е адекватността и разликата между концепциите за класификация и разпознаване на сонарни обекти?

БЮЛЕТИН НА ТОМСКИЯ ДЪРЖАВЕН УНИВЕРСИТЕТ 2011 Управление, компютърна техника и информатика № 3(16) UDC 517.511 V.I. Смагин, С.В. Smagin ФИЛТРИРАНЕ В ЛИНЕЙНИ ДИСКРЕТНИ НЕСТАЦИОНАРНИ СИСТЕМИ С НЕИЗВЕСТНИ СМЪЩЕНИЯ Разглежда се алгоритъм за проектиране на оптимален филтър, който определя оценката на вектора на състоянието на дискретна линейна нестационарна динамична система с адитивни смущения, съдържащи неизвестен постоянен компонент. Представени са резултатите от изчислителен експеримент. Ключови думи: линейни дискретни нестационарни системи, филтър на Калман, неизвестни смущения. В трудовете на много автори се обръща много внимание на разработването на алгоритми за филтриране на Калман за клас системи с неизвестни адитивни смущения и параметри, които могат да се използват като модели на реални физически системи, модели на обекти с неизвестни грешки. Известните методи за изчисляване на оценки на вектора на състоянието се основават на алгоритми, които използват оценки на неизвестни смущения. Докладите разглеждат алгоритми за разширяване на пространството на състоянието (ненаблюдаем модел на смущения се добавя към основния модел на инсталацията) и двуетапен алгоритъм за филтриране, който намалява изчислителните разходи поради разлагането на проблема. В статиите се изследват алгоритми за повтарящо се оптимално филтриране, които използват оценки на неизвестно смущение, които имат доста строги условия за тяхната разрешимост. В тази статия, за дискретно нестационарно съоръжение с неизвестен постоянен компонент на смущенията, ние предлагаме оптимален метод за филтриране, който не използва оценки на неизвестното смущение. Методът се основава на трансформация на модела и свеждане до линейния проблем за филтриране на Калман. В тази статия резултатите са обобщени за случая на решаване на задачата за нестационарен дискретен обект. 1. Постановка на проблема Разглеждаме дискретна система, която се описва от следните диференциални уравнения: x(k + 1) = A(k) x(k) + f + q (k), x(0) = x0 , (1) където x( k) ∈ R n е векторът на състоянието; A(k) е n×n матрица; f е неизвестен постоянен вектор; q(k) е бяла Гаусова случайна последователност с характеристики M (q (k)) = 0, M(q(k)q Τ (j)) = Q(k)δk, j. (2) Каналът за наблюдение има формата y (k) = S (k) x(k) + v(k) , (3) y (k) ∈ R l е векторът на измерване; S(k) е l × n матрица; v(k) - бял гаус - V.I. Смагин, С.В. Smagin 44 съветска случайна последователност от грешки при измерване с характеристики: M(v(k)) = 0, M(q (k)v Τ (j)) = 0, M(v(k)v Τ (j)) = V (k)δi, j; (4) за матриците (S(k), A(k)) условията за наблюдаемост са изпълнени. Векторът x0 е случаен и не зависи от процесите q(k) и v(k), докато M(x(0)) = x0 , M ((x(0) − x0)(x(0) − x0 ) Τ ) = P0 . За система (1) и канал за наблюдение (3) се изисква да се синтезира филтър, който изчислява оценка на вектора на състоянието, който не използва оценки на неизвестния постоянен компонент на смущенията. 2. Синтез на филтър Нека трансформираме дискретната система (1). Изключваме постоянния компонент на смущенията f от описанието на обекта, като изваждаме същото уравнение от уравнение (1), но с изместване с един цикъл: x(k) = A(k − 1) x(k − 1 ) + f + q(k − едно) . (5) В резултат на това получаваме следното уравнение: x(k + 1) = (A(k) + En) x(k) − A(k − 1) x(k − 1) + q (k) − q(k − 1) . (6) Нека разширим пространството на състоянията на системата, като добавим към уравнение (6) идентичността x(k) = x(k) . Означаваме x(k) ⎞ ⎛ q(k) − q(k − 1) ⎞ . X (k) = ⎛⎜ ⎟ ⎟ , q (k) = ⎜ 0 ⎝ ⎠ ⎝ x(k − 1) ⎠ Представяме система (1) във векторно-матричната форма X (k + 1) = A(k) X ( k) + q (k), X (0) = X 0 , (7) (8) където A(k) е 2n × 2n матрица със следната блокова структура: ⎛ A(k) + En A( k) = ⎜ En ⎝ − A(k − 1) ⎞ ⎟. 0 ⎠ (9) Случайният вектор X 0 = (x0Τ x−Τ1)Τ има следните характеристики: M( X (0)) = X 0 , M ((X 0 − X 0)(X 0 − X 0) Τ ) = P0 , (x0Τ (10) x−Τ1)Τ където X 0 = . Забележете, че тук допълнително се въвежда n-мерен вектор x−1, който е независим от q(k) и v(k) и характеристики (10) могат да бъдат получени от априорна информация за обекта (1). Обърнете внимание, че в разглеждания модел (8) процесът q (k) не е бяла последователност на Гаус, процесите q (k) и q (k − 1) ще бъдат корелирани: ако j = k, ⎧ Q (k), ⎪ M(q (k)q (j)) = ⎨Q (k − 1) ако j = k − 1, ⎪ 0 ако 0 ≤ j< k − 1, ⎩ (11) Q(k) + Q(k − 1) 0 ⎞ ⎛ −Q(k − 1) 0 ⎞ . Q(k) = ⎛⎜ ⎟ , Q (k − 1) = ⎜ 0 0 0 0 ⎟⎠ ⎝ ⎠ ⎝ (12) Τ где Фильтрация в линейных дискретных нестационарных системах 45 Представим канал наблюдений для расширенной системы (8) в виде y (k) = S (k) X (k) + v(k) , (13) где S (k) = (S (k) 0) , v(k) − случайная последовательность ошибок измерений с характеристиками (4). В качестве уравнения для вычисления оценки вектора состояния расширенной системы выберем уравнение, по своей структуре совпадающее с фильтром Калмана: Xˆ (k + 1) = A(k) Xˆ (k) + K (k)(y (k + 1) − S (k + 1) A(k) Xˆ (k)) , Xˆ (0) = X . (14) 0 Учитывая (8) и (14), получим следующее уравнение для ошибки e(k) = Xˆ (k) − X (k) : e(k + 1) = (A(k) − K (k) S (k + 1) A(k))e(k) + K (k)v(k + 1) + (K (k) S (k + 1) − E2 n)q (k) . (15) В силу (11) и (15), матрица P (k) = M{e(k)eΤ (k)} определится из следующего разностного уравнения: P (k + 1) = (A(k) − K (k) S (k + 1) A(k)) P (k)(A(k) − K (k) S (k + 1) A(k))Τ + +(K (k) S (k + 1) − E2 n)Q (k)(K (k) S (k + 1) − E2 n)Τ + K (k)V (k + 1) K Τ (k) + +(A(k) − K (k) S (k + 1) A(k))(K (k − 1) S (k) − E2 n) × ×Q (k − 1)(K (k) S (k + 1) − E2 n)Τ + (K (k) S (k + 1) − E2 n) × ×Q (k − 1)(K (k − 1) S (k) − E2 n)Τ (A(k) − K (k) S (k + 1) A(k))Τ , P (0) = P0 . (16) Оптимизируемый критерий зададим в виде J (k + 1) = trP (k + 1) . (17) Оптимальные коэффициенты передачи фильтра K(k) определяются из условия dJ (k + 1) =0. (18) dK (k) Учитывая (17) и правую часть уравнения (16), применяя правила матричного дифференцирования следа от матрицы , получим из условия (18) уравнение для определения матрицы K(k): − A(k) P (k) A(k)Τ S (k + 1)Τ + K (k) S (k + 1) A(k) P (k) A(k)Τ S (k + 1)Τ + + K (k) S (k + 1)Q (k) S (k)Τ − Q (k) S (k + 1)Τ − K (k) S (k + 1)Q (k − 1) × ×S (k)Τ K (k − 1)Τ A(k)Τ S (k + 1)Τ + K (k) S (k + 1)Q (k − 1) A(k)Τ S (k + 1)Τ − − K (k) S (k + 1) A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + + K (k) S (k + 1) A(k)Q (k − 1) S (k + 1)Τ + Q (k − 1) S (k)Τ K (k − 1)Τ × × A(k)Τ S (k + 1)Τ − Q (k − 1) A(k)Τ S (k + 1)Τ − A(k)Q (k − 1) S (k + 1)Τ + + A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + K (k)V (k + 1) = 0 . (19) Решение последнего уравнения относительно K(k) дает следующий результат: K (k) = P (k) S (k + 1)Τ (S (k + 1) P (k) S (k + 1)Τ + V (k + 1)) −1 , (20) 46 В.И. Смагин, С.В. Смагин где P (k) = A(k) P (k) A(k)Τ + Q (k − 1)(E2 n − S (k)Τ K (k − 1)Τ) A(k)Τ + + A(k)(E2 n − K (k − 1) S (k))Q (k − 1) + Q (k) . (21) Отметим, что для вычисления коэффициентов передачи (20), в силу (21), необходимо задать начальные значения коэффициентов K(−1). Подставив в уравнение (16) выражение для оптимального коэффициента передачи (20), получим уравнение P (k + 1) = (E2 n − K (k) S (k + 1)) P(k) , P (0) = P0 . (22) Основной результат сформулируем в виде теоремы, учитывая симметричность и блочное представление матриц P (k) и P (k) : ⎛ p (k) P(k) = ⎜ 1 ⎝ p2 (k) ⎛ p (k) p2Τ (k) ⎞ , P (k) = ⎜ 1 p3 (k) ⎟⎠ ⎝ p2 (k) p2Τ (k) ⎞ , p3 (k) ⎟⎠ (23) блочные структуры матриц A(k), Q(k), Q (k), S (k) и представление матрицы K (k) в виде ⎛ K (k) ⎞ K (k) = ⎜ 1 ⎟ . (24) ⎝ K 2 (k) ⎠ Теорема. Пусть процесс с неизвестным постоянным возмущением определяется уравнениями (1) и канал наблюдений имеет вид (3). Тогда оптимальный алгоритм фильтрации определится следующими разностными уравнениями: xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1)] (25) с начальными условиями xˆ(0) = x0 , xˆ(1) = M{x(1)} = x1 . Матрица K1 (k) в (25) определяется по формуле (26) K1 (k) = p1 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 , где матрица p1 (k) вычисляется из системы уравнений (27) p1 (k) = (A(k) + En) p1 (k)(A(k) + En)Τ − A(k − 1) p2 (k)(A(k) + En)Τ − −(A(k) + En) p2Τ (k) A(k − 1)Τ + A(k − 1) p3 (k) A(k − 1)Τ + Q(k − 1) S (k)Τ K1 (k − 1)Τ × ×(A(k) + En)Τ − Q(k − 1) S (k)Τ K 2 (k − 1)Τ AΤ (k − 1) + +(A(k) + En) K1 (k − 1) S (k)Q(k − 1) − A(k − 1) K 2 (k − 1) S (k) × ×Q(k − 1) − (A(k) + En)Q(k − 1) − Q(k − 1)(A(k) + En)Τ + Q(k) + Q(k − 1) , p2 (k) = p1 (k)(A(k) + En)Τ − p2Τ (k) A(k − 1)Τ + + K1 (k − 1) S (k)Q(k − 1) − Q(k − 1) , p3 (k) = p1 (k) , p1 (k + 1) = (En − K1 (k) S (k + 1)) p1 (k) , p1 (0) = p1,0 , p2 (k + 1) = − K 2 (k) S (k + 1) p1 (k) + p2 (k) , p2 (0) = p2,0 , p3 (k + 1) = − K 2 (k) S (k + 1) p2Τ (k) + p3 (k) , p3 (0) = p3,0 , K 2 (k) = p2 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 . (28) Фильтрация в линейных дискретных нестационарных системах 47 В (28) начальные условия p1,0 , p2,0 , p3,0 , являются соответствующими блоками матрицы P0 . Отметим, что для выполнения расчетов в (28) необходимо задать начальные условия для K1 (−1) и K 2 (−1) . Замечание. Управляемый объект x(k + 1) = A(k) x(k) + B(k)u (k) + f + q(k), x(0) = x0 , (29) при исключении неизвестного постоянного возмущения f объекта, необходимо преобразовать к виду, который будет отличаться от (8) одним слагаемым: X (k + 1) = A(k) X (k) + B (k)(u (k) − u (k − 1) + q (k), X (0) = X 0 , (30) где матрица A(k) приведена в формуле (9), q (k) имеет характеристики (11), (12). В (30) матрица B (k) имеет вид B (k) ⎞ B (k) = ⎛⎜ ⎟. ⎝ 0 ⎠ Тогда уравнения фильтра будут следующими: (31) xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1)) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1))] , (32) с начальными условиями (26), а матрица K1 (k) определяется в соответствии с (27) и (28). 3. Результаты вычислительного эксперимента Рассмотрим применение алгоритма фильтрации для модели второго порядка вида (1) и канала наблюдений (3) со следующими значениями параметров: 0 1 0 ⎞ ⎞ ; Q = ⎛ 0, 01 ; V = 0,9 ; A(k) = ⎛⎜ ⎟ ⎜ 0 0, 02 ⎟⎠ ⎝ ⎝ 0, 05 0,925 + 0,1sin(0, 01k) ⎠ 1, 0 1, 0 0 ⎞ S = (1 1) ; x0 = ⎛⎜ ⎞⎟ ; P0 = ⎛⎜ (33) ⎟. ⎝ 1,5 ⎠ ⎝ 0 1, 0 ⎠ Вычисление оценок вектора x(k) можно выполнить, используя двухэтапный алгоритм фильтрации . Модель измерений в этом случае с учетом (1) представляется в виде y (k + 1) = Sx(k + 1) + v(k + 1) = SA(k) x(k) + Sf + Sq(k) + v(k + 1) . (34) Рекуррентные уравнения оценивания неизвестного вектора f имеют вид fˆ (k + 1) = fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , fˆ (0) = f , 0 f Τ Τ Τ −1 K f (k) = Pf (k) S (SPf (k) S + SQS + V) , где Pf (k + 1) = (E2 − K f (k) S) Pf (k), Pf (0) = Pf0 , (35) M{ f } = f 0 , M{(f − f 0)(f − f 0)Τ } = Pf0 . (36) В.И. Смагин, С.В. Смагин 48 Оценка вектора состояния для объекта с неизвестным постоянным входом задается уравнением: xˆ (k + 1) = A(k) xˆ (k) + fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , (37) x где матрица K x (k) определяет коэффициенты передачи фильтра Калмана. При моделировании используем 0 1, 0 0 ⎞ f 0 = ⎛⎜ ⎞⎟ , Pf0 = ⎛⎜ (38) ⎟. ⎝0⎠ ⎝ 0 1, 0 ⎠ Применение расширенного фильтра Калмана для данного примера (в этом случае уравнение (1) расширяется путем добавления уравнения f(k+1) = f(k)) приводит к необходимости построения фильтра Калмана для дискретной системы со следующими матрицами динамики, канала наблюдений и интенсивностей аддитивных возмущений: Q 0⎞ ⎛ A(k) E2 ⎞ , (S 0) , ⎛⎜ (39) ⎟. ⎜ 0 E2 ⎟⎠ ⎝ 0 0⎠ ⎝ Использование в данном примере методов, описанных в работах , невозможно в силу невыполнения условий существования оптимальных оценок неизвестного входного вектора : n≥m и l≥m. (40) В неизвестное возмущение определяется в виде f = Gd , где d – неизвестный m-мерный вектор, G – n × m -известная матрица. В рассмотренном примере G = E2 , n = 2 , m = 2, l = 1 , а это означает, что условия (40) не выполняются. Применение алгоритма фильтрации исследовалось также для неизвестного переменного возмущения с тремя возможными значениями компонент вектора f: ⎧ 1, если 0 ≤ k ≤ 9, ⎪ f1 (k) = f 2 (k) = ⎨ −1, если 9 < k < 25, ⎪ 1, если 25 ≤ k ≤ 50. ⎩ На рис. 1 приведены реализации процессов и их оценок для трех сравниваемых фильтров. Отметим, что при реализации алгоритма фильтрации (25), начальные значения K1 (−1) и K 2 (−1) задавались нулевые. x1(k) x1(k) x2(k) x2(k) 2 10 0 –10 0 3 4 20 30 40 k –10 0 4 1 0 1 10 3 10 2 10 20 30 40 k Рис. 1. Реализации процессов и оценок (1 – реализация x(k); 2 – оценка, построенная по алгоритму (25); 3 – оценка, построенная по двухэтапному алгоритму; 4 – оценка для расширенного фильтра Калмана) Фильтрация в линейных дискретных нестационарных системах 49 На рис. 2 приведены ошибки оценивания компонент вектора состояния. e1(k) 4 2 e2(k) 4 3 1 0 –2 –4 –6 0 2 2 3 1 0 2 –2 10 20 30 40 k –4 0 10 20 30 40 k Рис. 2. Графики ошибок фильтрации (1 – ошибка для оценки, построенной по алгоритму (25); 2 – ошибка для оценки, построенной по двухэтапному алгоритму; 3 – ошибка для расширенного фильтра Калмана) Как видно из рисунков для рассмотренного примера, качество оценок, полученных с помощью фильтра (25), лучше, чем для двухэтапного алгоритма фильтрации и расширенного фильтра Калмана, использующих оценки неизвестного возмущения. Отметим также, что для алгоритма фильтрации (25) не нужно задавать априорную информацию о характеристиках распределения начальных значений f 0 и Pf0 . Ниже, в таблице, приведены средние значения среднеквадратических ошибок оценивания для трех рассматриваемых методов, рассчитанных по 50 реализациям. Как видно из таблицы, предложенный метод фильтрации (25) обеспечивает среднюю ошибку в 3 – 4 раза меньшую, чем другие методы. Средние значения среднеквадратических ошибок для компонент вектора состояния Алгоритм (25) e1,ср = 0,0912 Двухэтапный алгоритм e1,ср = 0,3128 Расширенный фильтр Калмана e1,ср = 0,4103 e2,ср = 0,0945 e2,ср = 0,2917 e2,ср = 0,4296 Заключение Разработан алгоритм синтеза дискретного оптимального нестационарного фильтра для объекта, возмущения которого содержат неизвестную постоянную составляющую. Алгоритм построен на основе расширения пространства состояния и исключения из модели неизвестной составляющей. В отличие от классического фильтра Калмана, предложенный фильтр использует рекуррентные оценки, построенные на двух предыдущих тактах. Как показали результаты вычислительного эксперимента, алгоритм может быть применен для кусочно-постоянной неизвестной аддитивной составляющей возмущений. ЛИТЕРАТУРА 1. Astrom K., Eykhoff P. System identification. A survey // Automatica. 1971. V. 7. P. 123−162. 2. Friedland B. Treatment of bias in recursive filtering // IEEE Trans. on Automat. Contr. 1969. V. AC-14. P. 359−367. 3. Chen J., Patton R. J. Optimal filtering and robust fault diagnosis of stochastic systems with unknown disturbances // IEE Proc. Control Theory Appl. 1996. V. 143. P. 31–36. 50 В.И. Смагин, С.В. Смагин 4. Darouach M., Zasadzinski M. Unbiased minimum variance estimation for systems with unknown exogenous inputs // Automatica. 1997. V. 33. P. 717–719. 5. Darouach M., Zasadzinski M., Xu S. J. Full-order observers for linear systems with unknown inputs // IEEE Trans. on Automat. Contr. 1999. V. AC-39. P. 606. 6. Gillijns S., Moor B. Unbiased minimum-variance input and state estimation for linear discrete-time systems // Automatica. 2007. V. 43. P. 111–116. 7. Hou M., Patton R. Optimal filtering for systems with unknown inputs // IEEE Trans. on Automat. Contr. 1998. V. AC-43. P. 445–449. 8. Hsieh C.-S. A unified solution to unbiased minimum-variance estimation for systems with unknown inputs // Proc.17th World Congress The International Federation of Automatic Control. Seoul. Korea. July 6 – 11, 2008. P. 14502–14509. 9. Hsieh C.-S. Robust two-stage Kalman filters for systems with unknown inputs // IEEE Trans. on Automat. Contr. 2000. V. AC-45. P. 2374–2378. 10. Hsieh C.-S. Extension of the optimal unbiased minimum-variance filter for systems with unknown inputs // Proc. 15th IEEE International Workshop on Nonlinear Dynamics of Electronic Systems. Tokushima. Japan. 2007. P. 217–220. 11. Hsieh C.-S. Robust parameterized minimum variance filtering for uncertain systems with unknown inputs // Proc. American control conference. New York. 2007. P. 5118–5123. 12. Kalman R.E., Busy R. A new results in linear filtering and prediction theory // Trans. ASME J. Basic Engr. 1961. V. 83. P. 95–108. 13. Браммер К., Зиффлинг Г. Фильтр Калмана – Бьюси. М.: Наука, 1972. 200 с. 14. Пугачев В.С., Синицин И.Н. Стохастические дифференциальные уравнения М.: Наука, 1990. 630 с. 15. Смагин С.В. Фильтрация в линейных дискретных системах с неизвестными возмущениями // Автометрия. 2009. Т. 45. № 6. C. 29−37. 16. Амосов А.А., Колпаков В.В. Скалярно-матричное дифференцирование и его применение к конструктивным задачам теории связи // Проблемы передачи информации. 1972. № 1. С. 3−15. Смагин Валерий Иванович Смагин Сергей Валерьевич Томский государственный университет E-mail: [имейл защитен]; [имейл защитен]Получено на 06.12.2010 г

480 търкайте. | 150 UAH | $7,5 ", MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Теза - 480 рубли, доставка 10 минути 24 часа в денонощието, седем дни в седмицата и празници

Бирюков Руслан Сергеевич. Дискретно обобщено H-оптимално управление и филтриране в линейни непрекъснати обекти: дисертация... Кандидат на физико-математическите науки: 01.01.09 / Бирюков Руслан Сергеевич; Н.И. Лобачевски“], 2017 г

Въведение

Глава 1. Преглед на теорията на обобщеното управление и филтриране за линейни дискретни системи 8

1. Обобщена норма на линеен обект 8

2. Синтез на обобщено управление 11

3. Синтез на обобщения -филтър 13

Глава 2 Обобщена норма на непрекъснат обект с отделен целеви изход 15

1. Ниво на потискане на смущенията в непрекъснато-дискретна инсталация 15

2. Най-лошите външни смущения и първоначалното състояние в непрекъснато отделен обект 28

3. Нивото на потискане на смущенията в дискретно-дискретен обект 32

4. Най-лошите външни смущения и началното състояние в дискретно-дискретна инсталация 49

5. Нивото на потискане на смущенията в случай на безкраен хоризонт 56

6. Характеризиране на нивото на потискане на смущенията по отношение на LMI 61

7. Заключения 64

Глава 3 Дискретно обобщено-оптимално управление 66

1. Синтез на оптимално управление по състояние 66

2. Синтез на оптимално управление на изхода 74

3. Електромагнитно управление на окачването 94

4. Заключения 101

Глава 4 Дискретно обобщено-оптимално филтриране 102

1. Синтез на оптималния филтър 102

2. Филтриране на данни в проблема за затихване на вибрациите на сградата 108

3. Констатации 114

Заключение 115

Библиография

Въведение в работата

Съответствие на темата на изследването.Съвременните системи за управление, като правило, се изпълняват в цифрова форма, докато повечето реални обекти работят в непрекъснато време. Такова разделение на аналогови и цифрови части води до загуба на информация, тъй като стойностите на непрекъснатия сигнал, идващ от обекта към контролера, са известни само във фиксирани дискретни времена. Поради тази причина става важно да се анализира и синтезира дискретен контролер, който отчита възможно най-пълно поведението на оригиналния обект в моменти между измерванията. В зависимост от класовете външни смущения, действащи върху обекта, и крайните цели на управлението, има различни подходи за решаване на този проблем. От особен интерес е случаят, когато обектът е засегнат от външни смущения с ограничена "енергия", а целта на управлението е да се минимизира общата "енергия" на целевия изход на обекта. В този случай проблемът е дискретен %00-оптимален контролен проблем за непрекъсната инсталация на базата на времеви дискретни измервания.

Предложени са различни подходи за решаване на този проблем. Един от първите беше подход, основан на представянето на оригиналната непрекъсната система с дискретен изход като непрекъснато-дискретен, чието поведение се описва от набор от диференциални и диференциални уравнения (Sun W., Nagpal K.M., Poolla K.R., Khargonekar P.P., Sagfors M.F., Toivonen H.T. и др.). В този случай процедурата за проектиране на дискретни 7^^-оптимални контролери и филтри се основава на диференциални уравнения на Рикати, решенията на които изпитват скокове в моменти, съответстващи на наблюденията. Практическото прилагане на предложените алгоритми за синтез се сблъсква с редица трудности, свързани с решаването на нелинейна гранична задача за диференциални уравнения на Рикати.

Подобен подход е използван в работите на Басар Т. и Бернхард П., където проблемът за дискретно ^^-оптимално управление на непрекъснато предприятие се разглежда от гледна точка на теорията на игрите. Условията за съществуване на %^-оптимални регулатори бяха формулирани в случай на измерено състояние на обект по отношение на диференциалните уравнения на Рикати, а процедурата за синтезиране на такива регулатори също се основава на решаването на нелинейна гранична задача.

Друг подход се основава на използването на метода на повдигане, при който оригиналната непрекъсната система се преобразува в еквивалентна дискретна (Bamieh B.A., Pearson J.B., Chen T., Francis B.A., Tadmor G., Sagfors M.F., Toivonen H.T., Lall S., Dullerud G. и др.). В същото време, тъй като между моментите на наблюдение външното смущение, както и целевият изход на оригиналния обект, са частично непрекъснати функции, смущението и целевият изход на еквивалентната дискретна система вече принадлежат към безкрайност

дименсионално пространство. В тези работи синтезът на оптимални контролери се основава на последователно (итеративно) решение на алгебрични или рекурентни уравнения на Рикати, в зависимост от спомагателния параметър, който трябва да бъде минимизиран. Практическото прилагане на тази процедура води до изчислителни трудности.

И накрая, в произведенията на Ю.В. Условията за съществуване на -контрол бяха формулирани под формата на достатъчни условия по отношение на линейни матрични неравенства.

Един от съществените недостатъци на теорията за управление е предположението, че в началния момент от време обектът е в покой, т.е. първоначалното му състояние е нула. Ако това изискване не е изпълнено, тогава синтезираните регулатори потискат добре външните смущения, но не винаги се справят адекватно със задачата да потискат първоначалните смущения, генерирани от ненулеви начални условия. В този случай беше предложена обобщена норма като единствен критерий, който отчита влиянието както на външните, така и на първоначалните смущения (Khargonekar P.P., Nagpal K.M. и Poolla K.R.). Тази норма съвпада с класическата -норма, ако в началния момент от време обектът е в покой и когато първоначалното състояние на обекта е различно от нула и няма външно смущение, тогава обобщената -норма съвпада с 0 - норма, определена в произведенията на Баландин Д.В. и Коган М.М. За непрекъснати обекти с непрекъснат измерим изход законите за непрекъснат контрол и филтриране са синтезирани в трудовете на Khargonekar P.P., Nagpal K.M., Balandin D.V., Kogan M.M. и др.. В случай на непрекъснат обект с дискретен изход, работата на Sun W., Nagpal K.M. и Khargonekar P.P., в които е получено решението на дискретния обобщен контролен проблем за обект на безкраен хоризонт. В този случай формулираните закони за управление и филтриране се основават на решението на нелинейното диференциално уравнение на Рикати, което затруднява използването им. По този начин по-нататъшното развитие на теорията за дискретно обобщено управление на непрекъснати системи е много спешна задача на теорията на управлението.

Целта на дисертацията. Основната цел на работата е да се развие теорията на дискретното обобщено управление и филтриране за линейни непрекъснати системи. В съответствие с целта дисертацията е насочена към решаване на следните проблеми:

За линейни нестационарни обекти на краен интервал от време, получете условията за съществуването и уравненията на дискретни обобщено-оптимални закони за управление в класа на линейни нестационарни обратни връзки на състоянието и в класа на линейни нестационарни динамични пълен ред контролери в изхода.

За линейни стационарни обекти в безкраен интервал от време, получете условията за съществуването и уравненията на дискретни обобщено-оптимални закони за управление в класа на линейни стационарни обратни връзки на състоянието и в класа на линейни стационарни динамични контролери с пълен ред в изхода.

За линейни нестационарни обекти на краен интервал от време, получете условията за съществуването и уравненията на дискретни нестационарни обобщени оптимални филтри от пълен ред под формата на наблюдател.

За линейни стационарни обекти в краен интервал от време, получете условията за съществуване и уравненията за дискретни стационарни обобщени оптимални филтри от пълен ред под формата на наблюдател.

Изследователски методи. Статията използва методите на вариационното смятане и оптималното управление, теорията на изпъкналата оптимизация и по-специално теорията на полуопределеното програмиране.

Научна новост и основни резултати. В дисертацията са получени следните нови резултати от теорията на дискретното обобщено управление и филтриране чрез линейни непрекъснати обекти:

    Показано е, че обобщената -норма на линеен нестационарен обект на краен интервал от време се намира като решение на нелинейна гранична задача за матрично диференциално или диференциално уравнение на Рикати, както и по отношение на линейни матрични неравенства. В случай на линеен стабилен стационарен обект в безкраен интервал от време, обобщената -норма се намира като решение на дискретното алгебрично уравнение на Рикати или по отношение на линейни матрични неравенства (съответства на параграф 6 от паспорта на специалността 01.01.09) .

    За линейни нестационарни обекти на краен интервал от време се получават необходими и достатъчни условия, а в случай на неизмеримо състояние се получават само достатъчни условия за съществуването на дискретни обобщено-оптимални закони за управление. Тези закони за управление са синтезирани в класа на линейните нестационарни обратни връзки на състоянието и в класа на линейните нестационарни динамични изходни регулатори (съответства на параграф 6 от паспорта на специалността 01.01.09).

    За линейни стационарни обекти на безкраен интервал от време се получават необходимите и достатъчни условия за съществуването на дискретни обобщено-оптимални закони за управление. Тези закони за управление са синтезирани в класа на линейните стационарни обратни връзки на състоянието и в класа на линейните стационарни динамични изходни регулатори (съответства на параграф 6 от паспорта на специалността 01.01.09).

    За линейни нестационарни обекти на краен (безкраен) интервал от време се получават необходимите и достатъчни условия за съществуване и се извършва синтез на нестационарни (стационарни) дискретни обобщени „H^ -оптимални филтри от пълен ред под формата на провежда се наблюдател

    Като приложения, дискретни обобщени Ти^-оптимални регулатори в проблема за управление на тяло в електромагнитно окачване и дискретни обобщени ^-оптимални филтри в проблема за гасене на вибрации на високи сгради и конструкции (съответства на параграф 6 от паспорта на специалността 01.01.09).

Съответствие с кода на специалността.Работата отговаря на формулата на специалност 01.01.09 – Дискретна математика и математическа кибернетика и обхваща следните области на изследване, включени в специалността 01.01.09: стр. 6. Математическа теория на оптималното управление.

Теоретично и практическо значение.Работата има теоретичен характер и представлява развитие на теорията за дискретно обобщено "H^-оптимално управление на непрекъснати обекти. Получените в нея резултати са доведени до конструктивни процедури, чиято ефективност се потвърждава от синтеза на регулатори в проблем за управление на електромагнитно окачване и синтез на филтри в проблема за затихване на трептенията на високи сгради и конструкции.

Степента на надеждност и одобрение на резултатите от изследването.Основните резултати от дисертационната работа бяха обсъдени на срещата на Нижни Новгород научен семинар "Математическо моделиране на динамиката на системите и процесите на управление" в Научноизследователския институт по приложна математика и кибернетика и също бяха докладвани на следните международни и всички -Руски конференции:

X Всеруска научна конференция "Нелинейни колебания на механични системи" на името на V.I. Ю.И. Neimark (Нижни Новгород, 2016);

XIII Международна конференция "Устойчивост и колебания на нелинейни системи за управление" (конференция на Пятницки) (Москва, 2016);

XI Всеруски конгрес по фундаментални проблеми на теоретичната и приложна механика (Казан, 2015 г.);

Международна конференция по теория на математическото управление и механика (Суздал, 2015);

Шеста традиционна общоруска младежка лятна школа „Управление, информация и оптимизация“ (Москва, 2014 г.);

XII Всеруска конференция по проблемите на управлението (Москва, 2014 г.);

XIX Нижни Новгородска сесия на младите учени: Природни и математически науки (Нижни Новгород, 2014 г.).

През 2013-2014г и 2014-2015г Изследването е подкрепено от стипендия на името на академик G.A. Разуваев за аспиранти, както и стипендия от правителството на Руската федерация (2014-2015 г.).

Резултатите от първите три глави на дисертационния труд са получени по време на изпълнението на проект № 14-01-31120 mol_a през 2014-2015 г. (ръководител) и проекти № 12-01-31358 мол_а през 2012-2013 г., № 14-01-00266 през 2014-2016 г. (изпълнител), осъществен с финансовата подкрепа на Руската фондация за фундаментални изследвания.

Резултатите от четвърта глава са получени с финансовата подкрепа на Министерството на образованието и науката на Руската федерация в рамките на Федералната целева програма „Научноизследователска и развойна дейност в приоритетните области на развитие на научно-техническия комплекс на Русия за 2014 г. -2020" (споразумение 14.578.21.0110 от 27.10.2015 г., уникален идентификатор RFMEFI57815X0110) .

Публикации.Основните резултати по темата на дисертацията са представени в 10 публикации, включително 4 публикации във водещи научни списания, препоръчани от Висшата атестационна комисия на Министерството на образованието и науката на Руската федерация -], сборниците от две международни конференции и четири резюмета на доклади от регионални и общоруски конференции [-. В съвместната работа] авторът притежава резултатите от численото симулиране.

Личен принос на кандидата.Всички изследвания, представени в дисертационния труд, са извършени лично от кандидата в хода на научната дейност. От съвместните публикации в дисертацията са включени само материалите, които пряко принадлежат на кандидата.

Структура и обхват на работата.Дисертационният труд се състои от увод, четири глави, заключение и списък с използвана литература. Творбата е представена на 123 страници, съдържа 11 илюстрации. Библиографията включва 81 заглавия.

Синтез на обобщено управление

В теорията на обобщеното %oc-управление се разглежда линеен управляем обект, който е обект на външно въздействие и първоначално смущение, генерирано от неизвестни начални условия. Ако обектът е в покой в ​​началния момент от време, т.е. първоначалното смущение е равно на нула, тогава нивото на потискане на външното смущение, което съвпада с oo-нормата, се приема като мярка за влиянието на външно влияние върху разглеждания обект, а проблемът за проектиране на управление, което минимизира този критерий, е H-оптимален контролен проблем. Напротив, когато първоначалното състояние е различно от нула и няма външно смущение, мярката за реакция на системата се разбира като ниво на затихване на първоначалното смущение, което е равно на 70-норма. В този случай законът за управление, оптимизиращ преходния процес в най-лошия случай, е известен като 7o-оптимален. В общия случай тези критерии са противоречиви, поради което основната цел на обобщения %oc-контрол е да се определи законът за управление, който би бил компромис при оценката на влиянието както на външните, така и на първоначалните смущения.

Сега представяме основните факти, свързани с обобщената Hoo-норма, докато в презентацията ще проследим произведенията. За определеност, разгледайте линеен дискретен нестационарен обект от формата Xk+i = Axk + Bkvk, k = 0,...,N-l, zk = Ckxk + Dkvk, където - външно смущение, N-l t ограничено в 2-норма : vk vk oo.fc=0

Да приемем, че в общия случай началното състояние x0 е ненулево и неизвестно и влиянието му върху динамиката на обекта се интерпретира като първоначално смущение.

Контролираният изход на инсталацията за фиксирано начално състояние x0 и последователност от смущения v0,... , vN_ i ще се характеризира със стойността на функционала N-1 j(x0,v0,..., vN_ij = \ \z\\i2 + xNSxN = Y zk zk -\- xNSxN, (1.2) fc=0 където S = S 0 е тегловната матрица, която определя приоритета между качеството на преходния процес и крайното състояние на обекта.

Първо, разглеждаме поотделно два екстремни случая: върху обекта действа само първоначалното или само външното смущение. Нека обектът е в покой в ​​началния момент от време, което съответства на случая, когато няма първоначално смущение. Следвайки, ние определяме индикатора за влиянието на външните смущения върху целевия изход (1.1) - нивото на потискане на външните смущения - като относителната стойност на функционала (1.2) в най-лошия случай: J(0,VO,. ..,VN_1) 2 = sup 2 0 2

Обърнете внимание, че ако обектът (1.1) е неподвижен и се разглежда на безкраен интервал от време, тогава, използвайки равенството на Парсевал, можем да покажем, че изразът (1.3) съвпада със 7-нормата на разглеждания обект. Следното твърдение характеризира нивото на потискане на външните смущения по отношение на решенията на линейни матрични неравенства.

Твърдение 1.1. Нивото на потискане на външно смущение в системата (1.1) удовлетворява неравенството 7oo 7 на краен интервал от време тогава и само ако линейните матрични неравенства /AlXk+1Ak - Xk AjXk+lBk Ck\ i) 0, (1.4) са разрешими по отношение на матриците Xk = Xk 0, k = 0,..., N - 1, за XN = S.

От твърдението следва, че нивото на потискане на външното смущение 7oo се намира като най-малката ниска стойност от набора от всички 7, за които системата от линейни матрични неравенства (1.4) е разрешима по отношение на матриците Xk = Xk 0 и 7.

Ако няма външно смущение, тогава ефектът от първоначалното смущение върху качеството на преходния процес в системата (1.1) може да се характеризира с количеството 2 J(x0,0,...,0) 70 = sup 2 ( 1.5), което се нарича ниво на затихване на първоначалното смущение. B показва, че тази стойност може да бъде намерена като решение на оптимизационен проблем с ограничения, дадени от линейни матрични неравенства.

Твърдение 1.2. Нивото на потискане на първоначалното смущение в системата (1.1) на краен интервал от време удовлетворява неравенството 70 7 тогава и само ако линейните матрични неравенства ATkXk+1Ak -Xk + ClCk 0, X0 -f2I, (1.6) са разрешими с по отношение на матриците k = 0,..., N - 1, за XN = S. За да опишем съвместното влияние на външните и първоначалните смущения върху изхода на инсталацията (1.1), ние дефинираме нивото на потискане на смущенията като вид конволюция на двата разглеждани фактора: 7W = sup

Jx0,v0,. . . ,VN_1 =F , (1.7) където R = R 0 е тегловна матрица, предназначена да зададе приоритета между външното смущение и компонентите на първоначалното състояние. Така въведената експонента се нарича обобщена 7-норма. Лесно се вижда, че в екстремни случаи израз (1.7) става или (1.3), или (1.5), тоест за x0 = 0 имаме 7w = 7oo, а за v = 0 получаваме -). Оказва се, че нивото на потискане на смущенията може да бъде изразено чрез линейни матрични неравенства; за това е достатъчно да се изисква наличието на общо решение на неравенствата (1.4) и (1.6), характеризиращо отделно нивото на потискане на външното смущение и нивото на затихване на първоначалното смущение, като се вземе предвид коефициентът на тежест.

Нивото на затихване на смущението в системата (1.1) на краен интервал от време удовлетворява неравенството 7w 7 тогава и само ако линейните матрични неравенства (A.

Най-лошите външни смущения и начално състояние в непрекъснато дискретна инсталация

Отбелязваме, че съгласно формулираната теорема нивото на затихване на смущенията 7С с помощта на съотношението (2.45) се изразява чрез стойността на матричната функция X(t). Въпреки това, поради уравнение (2.6a), количеството X(t) имплицитно зависи от y. В резултат на това, за да се определи нивото на затихване на смущението, възниква нелинеен граничен проблем за матричното диференциално уравнение на Рикати: да се намери решение на уравнение (2.6a) с гранични условия (2.6b) и (2.45), както и състояние (2.6d).

Нека сега се обърнем към доказателството на теоремата.

Доказателство на теорема 2.2. Лесно се показва, че връзката (2.4) е еквивалентна на равенството sup J(xo,v,w) = 0. (2.48) Иі!2 +ІНІ2 2 + 0Д 0=і Съгласно формула (2.39) функционалът J(x0,v,w ) може да се запише по следния начин: J(x0,v,w) = xUcJC0 + X(t0) - %R)X0 %\\v - v \\l2 + N-l + J2(wk w k )T(AjX(tk) Ak - %l) (wk - w k) + fc=l + wN - w N (AdgbAdg - 7C- (wN - w N c) и (2.6e), първият член е не- положително определени, а останалите членове са отрицателно определени квадратични форми, така че максималната стойност на функционала J(x0, v, w) изчезва при v = v и wk = w k, k = 1,..., N, и съответстващ избор на x0. Следователно смущенията v и wl са най-лошите външни смущения по отношение на критерия 7c. Нека заместим v и w k във връзка (2.48), тогава: sup J(x0,v ,w)= sup xUx (t0) + CjC0--fcR)x0 \\v \\L+\\v \\2+x0R 0=l ll« llL+lh ll2+ ftr0 = l Сега отбелязваме, че и и зависят от 0 и отношенията отношения: v (t) = b1B (t)X(t) b(t,t0)x0, / -r- \ -1 -r w k = - (AjX(tk)Ak - 7c AjX(t (tk - 0, t0)x0, тук Ф(Mo) е фундаменталната матрица на решенията на затворената система (2.115). Следователно ограничението е квадратна форма в x0: \\v \\l2 + \\w \\l+xUxo = x Qx0 = l, където tN Q = R + 1-2 (t)W(t)X( t)F(t, i0)(it + "o N + fc=l J2 fT(- 0, t0)X(tk)Ak(AlX(tk)Ak - 7cL \іX (ik)Ф(ік - 0, Така задача (2.48) се свежда до следното: sup x0 PIKO =1 Xo(x(t0) + C0TC0 - 7ci?W

За да разрешим последния проблем, използваме правилото на множителя на Лагранж: точката на максимум x0 трябва да удовлетворява системата от уравнения: първото уравнение като (X(t0) + CQ С0 + /іП)х0 = lcRxo, откъдето намираме хо = «emax (R 1 \x(t0) + CjC0 + ц Ы V 7с = Амах (і?-1 [х( 0) + С0ТСo + /х fil V стойността на a се намира от второто уравнение (2.49) Заместител стойностите, намерени в квадратична форма и опростете: по условие точната горна граница е равна на нула, следователно /i = 0. Замествайки намерената стойност /i в израза за x0, стигаме до отношения (2.45) и (2.46c).

Нека формулираме и докажем няколко следствия, отговарящи на въпроса за най-лошите смущения, приложени към нивата на потискане на първоначалното смущение C, непрекъснатото външно смущение c, дискретното външно смущение G и нивото на потискане на смесените външни смущения c w .

Следствие 2.5. В инсталация (2.1), (2.2) и (2.3) нивото на затихване на първоначалните смущения c = max (J0 + (0)) (2.50) се постига при най-лошото начално състояние = max (J0 + (0) ] , (2.51) където ( ) е решението на система (2.41), намерено в c. Доказателство Тъй като инсталацията не е засегната нито от непрекъснато, нито от дискретно външно смущение, отношението (2.51) се получава от отношения (2.46), ако ние поставете последното = , () = 0 и k = 0, = 1,... , Следствие 2.6 В инсталацията (2.1), (2.2) и (2.3), нивото на потискане на непрекъснати външни смущения í = max (J0 + (0)) (2.52) се постига при най-лошото външно смущение () = ") 1T()()(), (2.53) където () е решението на система (2.42), намерено при s.

Доказателство. Съотношение (2.53) се получава от съотношения (2.46), ако зададем k = 0, = 1,... в последното, което е еквивалентно на факта, че дискретно външно смущение не действа върху обекта и поради липса на първоначално смущение е необходимо да се отхвърли условието (2.46 c) и да се постави = във връзка (2.45).

Следствие 2.7. В обект (2.1), (2.2) и (2.3) нивото на затихване на дискретни външни смущения c = max (j 0 + (0)) (2.54) се постига с най-лошото външно смущение / -r- \ -1 -r k = - ( j(k)k - c") j(k)(k - 0), (2.55) където () е решението на уравнение (2.43) с намерените условия (2.6b) и (2.6d) за в" Доказателство. Тъй като обектът не е засегнат от непрекъснато външно смущение, тогава връзката (2.55) се получава от отношения (2.46), ако зададем B(i) = 0 в последното, и поради липсата на първоначално смущение, условието (2.46 c) трябва да се изхвърли и поставяме R = I във връзка (2.45). Следствие 2.8. В инсталация (2.1), (2.2) и (2.3) нивото на затихване на смесени външни смущения lT = Amax (cJC0 + X(t0)) (2.56) се постига за най-лошите външни смущения - fc wl\ AjX(tk )x(tk-0), (2.57a) v (t) = (w) 1BT(t)X(t)x(t), (2.57b) където X(i) - решение на система (2.6a) , (2.6b) и (2.6d), намерени за % w Доказателство Тъй като инсталацията не е засегната от първоначалното смущение, тогава, отхвърляйки условието (2.46c) в отношенията (2.46) и задавайки R = І във формула (2.45), получаваме съотношения (2.57).

Отбелязваме още веднъж, че теорема 2.2 и нейните следствия ни позволяват да намалим изчисляването на съответните нива на затихване на смущението до решението на нелинеен граничен проблем. Последните могат да бъдат решени чрез различни числени методи, например чрез проста итерация. Нека опишем накратко приложението на този метод, като използваме примера за изчисляване на нивото на затихване на смущението 7c. Избираме някаква достатъчно голяма начална стойност 7 и решаваме задача (2.6b), (2.6a) и (2.6d). След това, използвайки формула (2.45), изчисляваме следващото приближение до 7c. Ще повтаряме тази процедура, докато разликата между две съседни намерени стойности стане по-малка от някакво предварително зададено малко положително число. Един от съществените недостатъци на споменатия подход, в допълнение към възможната липса на сходимост на генерираната последователност от приближения, е необходимостта от решаване на матрично диференциално уравнение на всяка стъпка. Това може да се елиминира чрез преминаване от непрекъснато-дискретен модел към дискретен. Следващият раздел е посветен на реализацията на тази идея.

Синтез на оптимално управление на изхода

Групираме първия и втория член в (2.105) и опростяваме израза за P2, за който отново прилагаме формулата на Sherman-Morrison-Woodbury, след което: +lXk+l(I - Ek+1\k-IgEtk+1Xk+ 1) Ek+1]kC GTk+lCk = -g / -g \-1 -g = CTkGk+l(Wk+l - ETk+lXk +lEk+l) GTk+lCk и P2 = ATkXk+l l - Ek+ l , матрицата S се формира, например, съгласно формулата

Теорема 3.4 също позволява да се синтезира обобщено ft -оптимално управление на изхода за безкраен интервал от време. За да направите това, достатъчно е да се намери решение на задачата за минимизиране 7c() при ограниченията, дадени от неравенствата (3.51), след което се намира оптималният регулатор като решение на (3.52).

И накрая, в заключение на раздела, представяме без доказателство следствията от теорема 3.4, които установяват необходимите и достатъчни условия за съществуването на 70- и Pse-управления по отношение на изхода за стационарна инсталация на безкраен хоризонт.

Следствие 3.13. За стационарна инсталация (3.21), (3.22), за дадено 7 0, съществува дискретно управление на изхода за безкраен интервал от време, ако и само ако линейните матрични неравенства Ah,XAh 0, С1 AhYAl Y C1YAl (Wc2 0 0 II MT X I C1YCj WC 0 0 I M 0, (3.53a) (3.53b) x l Y 0, X yl, (3.53c) са разрешими по отношение на X = X 0, Y = Y 0 и колоните на матриците Wr KJ 2 и M образуват съответно основите на матричните ядра.

Следствие 3.14. За стационарна инсталация (3.21), (3.22) в безкраен интервал от време съществува дискретно И-изходно управление, което осигурява затихване на непрекъснати външни смущения с дадено 7 0 тогава и само ако линейните матрични неравенства и първото неравенство ( 3.51c) са разрешими по отношение на X \u003d X O, Y \u003d Y O, а колоните на матриците Wr и M образуват основите на пространствата ket Co и ket [B.. D-,), съответно.

Следствие 3.15. За стационарна инсталация (3.21), (3.22) на безкраен интервал от време има дискретно И-изходно управление, което осигурява затихване на дискретни външни смущения с даден 7 O, ако и само ако има матрици X = X O, Y = Y O, удовлетворяващи линейните матрични неравенства и първото неравенство в (3.51c), докато колоните на матриците N и M образуват основите на пространствата ker (C2 D2j и ker [B и Dx), съответно. Следствие 3.16. За стационарна инсталация (3.21), (3.22) в безкраен интервал от време съществува дискретно И-управление на изхода, което осигурява затихването на смесени външни смущения с дадено 7 0 тогава и само ако линейните матрични неравенства ( 3.51a), (3.51b) и първото неравенство (3.51c) е разрешимо по отношение на матриците XT = X 0 и Y = Y 0, докато колоните на матриците N и M образуват основите на пространствата ker C2 0 D2 0 и ker B1 Dj 0 0, съответно.

От забележката към теорема 2.8 следва, че съществува крайна матрица R, така че за всеки тегловен коефициент R R обобщеният H-оптимален изходен регулатор на безкраен времеви интервал съвпада с //-оптималния изходен регулатор, синтезиран от следствие 3.16 и осигуряващи потискане на смесени външни смущения. Следователно, за да се получи реален компромис при отчитане на ефектите както от първоначалните, така и от външните смущения, тегловната матрица R трябва да отговаря на условието Atax(L_1L) І. Числено, граничната стойност R на матрицата на теглото се определя, както следва: brx y1 , където X означава матрица, която удовлетворява неравенствата (3.51a), (3.51b) и първото неравенство (3.51c) с минимална стойност от 7в.

Помислете за показаното на фиг. 3.3 механична система, състояща се от окачено тяло с маса m и електромагнит. Левитацията на тялото се осигурява от промяна в магнитното поле, което възниква поради промяна в напрежението U, приложено към намотката на електромагнита. Динамиката на такова просто магнитно окачване се подчинява на две уравнения: ti) = F - ta, (3.56) V + RI=U. Първото уравнение (3.56) изразява втория закон на Нютон и определя промяната в координатата s на окачено тяло под действието на гравитацията td и силата F от страната на електромагнита, а второто определя промяната в силата на тока / в електромагнитната верига със съпротивление R, когато приложеното към него напрежение U се променя и представлява закона на Кирхоф за електрическата верига на електромагнит. F означава връзката на потока на намотката на електромагнита, F = pF, където F е магнитният поток, преминаващ през един оборот, а n е броят на оборотите в намотката.

Поточната връзка Ф и силата на тока / в електромагнитната верига са свързани с: = L(s)/, L(s) = , CL = /i0n2A/2, (3.57) - стойността на номиналното разстояние между електромагнита и окачено тяло. Ако обозначим номиналната индуктивност като L0 \u003d L (0), тогава C \u003d L05 и след това

В този раздел разглеждаме дискретна форма на линеен безпристрастен алгоритъм, който осигурява минималната средна квадратична грешка, като се приеме, че моделът на съобщението е даден от линейно векторно диференциално уравнение

където входният шум (или шумът на растението) е бял шум с нулева средна стойност и ковариационна матрица

Моделът за наблюдение или измерване се дава чрез линейна алгебрична връзка

. (7.3)

където измервателният шум v е нулев среден бял шум и

. (7.4)

В името на простотата на първоначалните изчисления приемаме, че и са некорелирани, т.е.

За всички, (7.5)

Първоначалната стойност представлява случайна променлива със средна стойност и дисперсия, с други думи

; . (7.6)

Ще приемем също, че за всички .

Нека намерим оценка на количеството от множеството последователни наблюдения. Нека означим тази оценка с , а грешката на оценката - с

В зависимост от връзката между количествата и оценката се нарича прогнозиране или екстраполация, филтриране или изглаждане и накрая интерполация. Такова разделение е интуитивно разбираемо, тъй като, например, предсказанието означава оценка на състоянието в този момент, базирана на всички наблюдения до този момент. В тази глава ще разгледаме основно проблема с филтрирането, докато предвиждането и интерполацията ще бъдат разгледани в следващата глава.

Оценката ще бъде условно и безусловно безпристрастна, т.е. и , и също ще бъде линейна функция на последователността от наблюдения. От набора от възможни линейни безпристрастни алгоритми за оценка ние избираме само този, който дава минималната вариация на грешката, т.е. този, за който или минимален.

В предишната глава установихме, че оценката по критерия за минимална стандартна грешка съвпада с условната средна стойност на количеството за даден набор от наблюдения. Въпреки това, като цяло, дори ако моделите за отчитане и наблюдение са линейни (каквито са за проблема, формулиран тук), условната средна стойност не е линейна функция на наблюденията, следователно алгоритъмът за оценка няма желаното свойство за линейност.

За да получим линеен алгоритъм за оценка, който осигурява минималната вариация на грешката, трябва да използваме един от двата подхода. Единият е да се определи условна средна стойност, която представлява линейна форма, и след това да се намери най-подходящото за тази форма. Този подход се основава на използването на ортогонална проекция. Друг подход се основава на предположението, че случайните променливи , и са заедно нормални. По силата на доказаното в гл. 4 свойства на линейните системи не променят нормалния закон на разпределение, точната условна средна в този случай ще бъде линейна форма. Линейният оценител на минималната дисперсия трябва да бъде равен на оценителя на минималната дисперсия, ако последният наистина е линеен. Това се случва, ако приемем нормални закони за разпределение.

Имайте предвид, че ако изискваме алгоритъмът за оценка да бъде линеен, тогава действителният закон на разпределение на количествата и няма значение. Въпреки това, ако разпределенията наистина са нормални, както често са, тогава условната средна всъщност е линейна форма. С други думи, филтърът на Калман е най-добрият (от гледна точка на минималната вариация на грешката) линеен филтър, независимо от вида на разпределението, и най-добрият алгоритъм от всички възможни линейни и нелинейни алгоритми за оценка, ако обектът и шумовете от измерването, както и началното състояние, имат нормални закони на разпределение.

Когато извеждаме уравнението за филтъра на Калман, ще приемем и ще изискваме наблюденията да се обработват последователно. Независимо дали алгоритъмът за оценка е последователен или не, стойностите на получените оценки на състоянието не се коригират. Въпреки това, изчислителната осъществимост на метода е от съществено значение. Вероятно най-значимият принос на Калман и Бъси е, че те са първите, които извеждат линеен алгоритъм за оценка на минималната дисперсия в серийна форма, използвайки концепцията за променливи на състоянието. Проблемът с линейното последователно филтриране по критерия за минимална дисперсия на грешката е решен отдавна от Винер и други автори във връзка със системи с един вход и един изход. Основната заслуга на Калман е, че той обобщи теорията на филтрирането на Винер за случая на нестационарни многомерни системи с нестационарни шумови реализации с крайна продължителност и получи решение на проблема с филтрирането в рекурентна форма.

Тъй като представянето на същността на проблема е малко забавено, преди да пристъпим директно към неговото решение, нека обобщим. Искаме да получим линейна безпристрастна оценка на състоянието на линейна нестационарна динамична система, която е оптимална по отношение на критерия за минимална грешка на дисперсията и се влияе от бял шум с нулева средна стойност и известна дисперсия.

За да получим оценка, наблюдаваме променяща се във времето линейна функция на състоянието на фона на адитивен бял шум с нулева средна стойност и известна дисперсия. Началното състояние на процеса е случайна променлива с известна средна стойност и дисперсия. Няма корелация между входния шум и шума от измерването и е необходимо да се намери алгоритъм за оценка в повтаряща се форма. Алгоритъмът за филтриране на Калман е решение на този проблем. Приложено към дискретни системи, ние разглеждаме два различни подхода за извеждане на уравнението на филтъра на Калман, които са илюстрация на двете идеи, описани по-горе. В първия случай, когато се използва подход на ортогонална проекция, ние ще изберем предварително линейната форма на алгоритъма за оценка и след това ще намерим най-добрия алгоритъм. Във втория случай, когато оценката се извършва по максималната апостериорна вероятност, ще приемем, че случайните променливи имат нормални закони на разпределение и ще намерим оптималния алгоритъм за оценка, който наистина ще се окаже линеен. При извеждането на уравнението за филтриране Калман използва подход, базиран на метода на ортогоналната проекция, така че ще започнем презентацията с този метод.

ортогоналенпроекция.Теорията на ортогоналната проекция беше разгледана накратко в § 6.6. Тук, без доказателство, ще бъдат представени някои обобщения на представените там резултати; ще имаме нужда от тях в бъдеще. Линейната оценка на количеството по критерия за минимална дисперсия на грешката за дадено линейно пространство от наблюдения се дава чрез ортогоналната проекция върху , т.е.

Тук символът се използва вместо , тъй като линейната оценка с минималната дисперсия обикновено не съвпада с условното математическо очакване. Ако бяхме предположили предварително, че случайните променливи имат нормално разпределение, тогава то просто щеше да съвпадне с ; въпреки това, ние съзнателно избрахме различен подход, за да подчертаем, че допускането на нормални разпределения не е необходимо, ако помним, че полученият алгоритъм за оценка може да не е абсолютно най-добрият, а само най-добрият в класа на линейните алгоритми. Ако ортогонална последователност формира основа за , тогава тя може да бъде представена по следния начин

. (7.8)

За да получим решение в рекурентна форма, се нуждаем от следния резултат. Ако е вектор, ортогонален на , т.е. , за , където е ортогоналната основа за , тогава

Този резултат е лемата за ортогоналната проекция. Въпреки че ще се интересуваме от филтриране, т.е., първо ще разгледаме прогноза в една стъпка, т.е. За да получим решение в необходимата рекурентна форма, използваме принципа на математическата индукция. Да предположим, че е известно и представяме чрез ново наблюдение. Въпреки това, най-общо казано, не е ортогонален и преди да се използва уравнение (7.9), е необходимо да се намери компонентът на наблюдение, който е ортогонален на . По същество това се свежда до подчертаване на новата информация, съдържаща се в .

Лесно е да се покаже, че векторът

ортогонален. Имайте предвид, че представлява „новата информация“, съдържаща се в , тъй като за да се получи най-добрата оценка на количеството, при условие че е дадено, а именно , се изважда от . Това е друга форма на твърдението, която е ортогонална. Случайната променлива е известна като "актуализация". Използвайки уравнение (7.10), то може да бъде изразено по отношение на актуализираща случайна променлива, както следва:

.

Тези два израза са еквивалентни, защото се съдържа в пространството за наблюдение и следователно не се добавя допълнителна информация в сравнение с тази, съдържаща се в . Тъй като и са ортогонални, можем да използваме уравнение (7.9) и да го запишем като . Тъй като , тогава този израз може да бъде представен в следната форма:

От това следва, че се получава чрез прогнозиране на стойността на случайна променлива от предишни наблюдения и след това коригиране на прогнозираната стойност в съответствие с новата информация, съдържаща се в текущата примерна стойност на случайната променлива. Концепцията за прогнозиране и корекция е много плодотворна и ви позволява визуално да интерпретирате алгоритъма на Калман. Следователно, когато извличаме алгоритъма за филтриране, ще използваме подход, базиран на идеята за прогнозиране и корекция. Нека анализираме отделно всеки от двата члена от дясната страна на уравнение (7.11). Съгласно израз (7.1) се дава като . Следователно, което по дефиниция е равно на , сега става равно на

По дефиниция имаме

Тъй като зависи само от for и е бял шум, математическото очакване на стойността при дадена стойност просто съвпада с безусловното математическо очакване. Така горният резултат се преобразува в следното:

Виждаме, че предвидената стойност на , въз основа на наблюдението, се получава от като резултат от невъзмутим преход една стъпка напред, т.е. Това заключение не е неочаквано, тъй като най-добрата оценка на , базирана на наблюдението , както е показано по-горе, е идентична нула. От това също следва

Това означава, че както при филтриране, така и при прогнозиране, най-добрата оценка на белия шум с нулева средна стойност е идентично нула. Това заключение е изключително важно и ще бъде много полезно, особено когато се обсъжда концепцията за процес на „обновяване“. По-долу по подобен начин ще бъде показано какво се определя като и какво е всъщност

Ако заместим уравнение (7.12) в (7.11), получаваме

Помислете за втория член от дясната страна на това уравнение. Използвайки уравнение (7.8), може да се запише в следната форма:

Сега разглеждаме отделно всеки член от дясната страна на това уравнение. Замествайки (7.1) за , получаваме за първия член на уравнението

Сега, използвайки дефинициите на и [вж. уравнения (7.3) и (7.10)], могат да бъдат записани в следната форма:

където . Следователно уравнението (7.17) приема формата

и след умножаване на съответните членове, той се трансформира във формата

Тъй като зависи само от , и , a и не са корелирани, тогава . Тъй като е бял шум и зависи само от , тогава и третият член от дясната страна на горното уравнение трябва да бъде нула. Последният член от дясната страна на уравнението също е равен на нула, тъй като и - не са корелирани. Следователно остава само първият термин и в резултат имаме

Полученият израз може да бъде допълнително опростен, ако вземем предвид, че . При което става равен

Но първият член, според лемата за ортогоналната проекция, е равен на нула. Следователно уравнение (7.18) може да бъде написано като:

където По подобен начин може да се покаже, че

Ако заместим уравнения (7.19), (7.20) и (7.10) в (7.16), тогава

Следователно изразът за приема формата

Този резултат може да се изрази в по-удобна форма чрез въвеждане на нотацията

така че завършваме с

Количеството се нарича усилване на едностъпковия екстраполатор на Калман. Формата на решението, представено от уравнения (7.23) и (7.24), е много интересна и удобна от изчислителна гледна точка. Получихме алгоритъм за последователно изчисление от известната стойност, изчислена в предишната стъпка, и ново наблюдение. Новата оценка тук се формира в резултат на екстраполация на старата оценка и последваща корекция с помощта на претеглен сигнал за грешка при наблюдение. 7.1b; за сравнение оригиналното съобщение и моделите за наблюдение са показани на фиг. 7.1, а. Преди да използвате горния резултат, първо трябва да намерите израз за, за да изчислите . Можете да направите друго и да намерите. За да определим, първо намираме рекурсивен израз за. Комбинирайки уравнения (7.1) и (7.24), получаваме

Фигура 7.1. Блокови диаграми на проблема с прогнозиране в една стъпка: а) модели за отчитане и наблюдение, б) устройство за прогнозиране в една стъпка

Ако сега заместим израза (7.3) и извършим серия от прости алгебрични трансформации, тогава горният израз се редуцира до формата

В допълнение към факта, че уравнение (7.25) може да се използва при изчисляване, то също е от независим интерес, тъй като законът за промяна на грешката на оценката.

Тъй като средната стойност на количеството е равна на нула (тъй като оценката е безпристрастна) и количествата , и - не са корелирани, изразът за може да се получи директно от дефиницията на това количество и уравнение (7.25), в форма

Ако сега заместим (7.23) и опростим получения резултат, получаваме следния израз за дисперсията на грешката:

Уравнение (7.26), заедно с (7.23) и (7.24), напълно дефинира линеен последователен едностъпков екстраполатор с минимална вариация на грешката.

Преди да използвате получения по-горе резултат, е необходимо да зададете съответните начални условия в уравненията за и . Очевидно най-добрата оценка на количеството, при условие че не са направени наблюдения, е и следователно,

И така, като начални условия за едноетапни алгоритми за прогнозиране ние избираме ; .

Всички едноетапни алгоритми за прогнозиране са обобщени в таблица. 7.1.

Уравнение (7.26) може също да бъде пренаписано в следната форма:

Ако зададете началните условия в уравнения (7.24) и (7.26), тогава можете последователно да използвате едноетапни алгоритми за прогнозиране. Например, уравнение (7.23) с начално условие може да се използва за намиране, което след това трябва да се замести в (7.24), за да се изчисли от първото наблюдение. Дисперсионното уравнение (7.26) се използва в следващата стъпка, когато се преизчисли до . Получената стойност на количеството след това се използва за изчисление и т.н. Обработката на данните съгласно уравненията за прогнозиране е схематично показана на фиг. 7.2. Внимателен анализ на уравнения (7.23) и (7.26) показва, че изчисляването на количествата и всъщност се извършва без прибягване до последователността от наблюдения . Възможно е предварително изчисляване и съхраняване на матриците на усилването. Вероятно не бихме могли да приемем този метод за предварително изчисляване на матрици, ако скоростта на получаване на наблюдения на входа на процесора не беше толкова висока и нямаше да попречи на изпълнението на изчисленията съгласно уравнения (7.23) и (7.26) в реално време време или ако възможността за съхранение не е по-достъпна и по-евтина в сравнение с възможността за изчисления в реално време.

Таблица 7.1. Алгоритми за дискретно предсказване в една стъпка

Модел на съобщението

Модел на наблюдение

Предварителни данни

; ; ;

Алгоритъм за прогнозиране

Изчисляване на печалбата

Изчисляване на предишна вариация

Начални условия

Основното предимство на алгоритмите за филтриране на Калман е не толкова, че те дават решение на проблема с филтрирането (решението е получено много по-рано с други методи), а че решението директно определя практическото прилагане на резултатите. При решаването на много практически проблеми е възможно да се гарантира осъществимостта на изчисленията по уравнения (7.23) и (7.26) в реално време и следователно да се прилагат алгоритми за последователно филтриране в реално време. Друга характерна особеност на разглеждания подход е, че дисперсията на грешката се изчислява като неразделна част от оценката и следователно може да се използва за контрол на точността на процедурата за оценка. Това се основава на предположението, че моделите на докладване и наблюдение, както и предишното разпределение, са напълно известни.

Ориз. 7.2. Структурна диаграма на изчисления върху алгоритми за прогнозиране

Пример 7.1. Нека моделите на съобщението и наблюдението са дадени чрез скаларни уравнения:

; .

и и или,. Тук приемаме, че шумът е неподвижен и бял, въпреки че по принцип не е необходимо да е неподвижен. Нека приемем също, че първоначалната стойност има нулева средна стойност и единична дисперсия, така че и .

За този пример уравнението за оценка (7.24) става

с печалба, определена от уравнението

Дисперсионното уравнение има формата

Нека също изчислим при допускането, че имаме наблюдения, . Първо изчисляваме печалбата, като използваме първоначалното условие:

; .

Използвайки началното условие, получаваме и . Дисперсията на грешката на тази оценка се определя от уравнението на дисперсията, както следва:

Сега е необходимо да се повторят всички стъпки на изчисленията, за да се намери, оцени и накрая дисперсията. Въпреки че разглежданият пример е изключително прост, той ясно илюстрира всички стъпки от изчисленията, които трябва да бъдат извършени в процеса на прилагане на калманови едноетапни алгоритми за прогнозиране.

Един от практически важните проблеми, които възникват при използването на горните резултати и дори по-труден от намирането на средната стойност и дисперсията на първоначалното състояние, е да се определи дисперсията на входния шум и шума от измерването. Стойностите на дисперсиите често могат да бъдат получени или от анализа на физическата същност на проблема, или чрез директно измерване с разумна точност. Подобни забележки могат да бъдат направени за априорни моменти от вектора на състоянието. Стойността е избрана като най-добрата оценка на средната стойност на вектора на състоянието при нулевата стъпка, т.е. преди да бъдат направени наблюденията, като характеристика на степента на несигурност при избора.

В чисто качествен смисъл може да се твърди, че колкото по-голяма е несигурността относно истинската стойност на , толкова по-големи са стойностите, които задаваме.

Сега да се обърнем към проблема с филтрирането. Екстраполаторът с една стъпка се използва като удобна стъпка в тази основна задача и често има практическа стойност. Ще видим, че решението на проблема с филтрирането включва прогнозиране в една стъпка, резултатите от което след това се коригират според текущата информация. Често, но не винаги, решаването на проблема с филтрирането трябва да се предпочита пред решаването на проблема с филтрирането в една стъпка.

Ако оценката, получена в резултат на филтриране, а именно, е известна, тогава тя може да бъде получена като

Тъй като и, следователно, зависят само от за , пространството за наблюдение не съдържа информация за , където е дискретен бял шум. Следователно, за да се предвиди стойност от наблюдения, е достатъчно да се предвидят стойности една стъпка напред чрез настройка. Този подход направи възможно получаването на уравнение (7.27), което ще се използва по-нататък. Съзнателно допускайки нестрога нотация в името на простотата на нотацията, ние го записваме като . Освен в специални случаи, като в , ще приемем, че условията са дадени от пространството . В тази нотация уравнение (7.27) може да бъде пренаписано като

Очевидно двете оценки, базирани на наблюдението, трябва да са еквивалентни. Следователно може да се използва уравнение (7.28), за да се получи алгоритъм за последователна оценка от уравнения (7.23), (7.24) и (7.26). Първо заместваме yp-ne (7.28) с в (7.24). В резултат на това получаваме

Ако умножим двете части на това уравнение по , което поради свойствата на преходната матрица на състоянията е равно на , тогава получаваме

За да опростим получения израз, въвеждаме , дефиниран като , или

ако използвате уравнение (7.23), за да определите. Затова е написано във формуляра

Въпреки че уравнение (7.30) е вероятно най-удобната форма на уравнението за оценка на филтъра на Калман, по принцип могат да бъдат получени няколко други форми. Две от тях са особено полезни. Ако използваме връзката, тогава уравнение (7.30) може да бъде пренаписано в следната форма:

Този израз може да бъде допълнително опростен чрез въвеждане на "актуализираща" стойност за получаване

Уравнения (7.29)-(7.31) или (7.32), заедно с уравнение (7.26), напълно решават проблема с линейното филтриране по критерия за минимална средна квадратична грешка. Дадените начални условия за , а именно и , се използват за формиране на началните условия за и съответно по същия начин, както при едностъпковия екстраполатор.

Алгоритмите за филтриране на Калман могат да бъдат представени в по-удобна форма, ако намерим изрази за дисперсията на грешката при филтриране . В допълнение, дисперсията може да се използва като критерий за качеството на процедурата за оценка. Дисперсията често се нарича предишна дисперсия, защото е дисперсията на оценката до момента на наблюдение, а дисперсията се нарича последна дисперсия. За да определим, първо намираме израз за . Отново са възможни няколко форми на представяне. Едно от най-удобните за нашия случай е представянето чрез уравнение (7.32). В този случай се определя, както следва:

Ако сега заместим уравнения (7.29) за и (7.19) и (7.20) за и в този израз, получаваме

Ако използваме уравнение (7.29) за , тогава последният израз може да бъде пренаписан като

Съгласно това уравнение, дисперсията на грешката на филтриране е по-скоро просто изразена от гледна точка на дисперсията на грешката на прогнозиране в една стъпка. Използването на количеството също така прави възможно значително опростяване на уравнението (7.26). Нека го препишем във формата

Използвайки f-loy (7.29) за , можем да напишем този израз като

Лесно е да се види, че стойността във къдрави скоби не представлява нищо повече от. Следователно имаме

Този израз може да се получи по обичайния начин чрез изчисляване на дисперсията на случайна променлива, дадена от уравнение (7.1) за даден .

Уравнения (7.29), (7.30), (7.33) и (7.34) напълно дефинират крайната версия на дискретния филтър на Калман. Тези уравнения са обобщени в табл. 7.2. Блоковата схема на изчисленията по получените алгоритми е показана на фиг. 7.3, а блоковата схема на дискретния филтър на Калман - на фиг. 7.4.

Обърнете внимание още веднъж, че уравнението за дисперсия и усилване не включва последователност от наблюдения, така че тези количества могат да бъдат изчислени предварително, ако е необходимо. Тази възможност е условно показана на фиг. 7.3 пунктирана линия.

Таблица 7.2. Резюме на алгоритмите за дискретно филтриране на Калман

Модел на съобщението

Модел на наблюдение

Предварителни данни

Алгоритми за филтриране

Изчисляване на печалбата

Изчисляване на предишна вариация

Уравнение за задната дисперсия

Начални условия

Анализът на блоковата диаграма на фиг. 7.4 показва, че филтърът на Калман реализира идеята за прогнозиране-корекция. Предишната оценка се екстраполира една стъпка напред и след това се използва за получаване на най-добрата оценка на новото наблюдение въз основа на всички предишни наблюдения. Грешката между „най-добрата оценка“ на текущото наблюдение и действителното наблюдение, а именно или , е нова информация [на компонента, ортогонален на ]. Грешката се претегля с тегло, което отчита стойността на отклоненията на входния процес, измерванията и грешките при оценката, за да се формира коригиращ сигнал. Коригиращият сигнал се добавя към прогнозираната оценка и резултатът е нова оценка.

Фиг.7.3. Структурна диаграма на изчисленията по алгоритъма за филтриране на Калман.

Ориз. 7.4. Структурна схема на дискретен филтър на Калман.

Обърнете внимание, че структурата на филтъра на Калман, съответстваща на уравнение (7.30) и показана на фиг. 7.4 е много подобен на структурата на оригиналния модел на съобщение, даден от уравнение (7.1) и показан на фиг. 7.1а. Алгоритъмът за филтриране се основава на използването на "актуализиращ" компонент, който съдържа нова информация, получена в резултат на наблюдение.

Пример 7.2.За да илюстрирате приложението на алгоритъма за филтриране на Калман, помислете за двуизмерен модел на съобщение, даден от уравнението

Наблюдението се извършва по скаларния модел

Входният шум е стационарен с , а шумът от измерването е нестационарен с . С други думи, измерванията за четните индекси са по-малко точни от тези за нечетните. Да приемем, че дисперсията на първоначалните грешки (или първоначалното състояние) е дадена от матрицата . Изисква се да се изчисли стойността за всички от 1 до 10.

Използвайки уравнения (7.29) и (7.34), както и началното условие, лесно могат да се изчислят и , които са съответно равни на

Сега, използвайки уравнение (7 23), можете да изчислите постериорната дисперсия

както и предишната дисперсия, която се променя за следващата стъпка съгласно уравнение (7.34) и става равна на

Ориз. 7.5. Промяна на усилването на филтъра на Калман, разгледан в пример 7.2

Сега можете да изчислите и т.н. Компонентите на вектора, когато се променят от 1 до 10, са показани на фигура 7.5. Обърнете внимание на характерното увеличение на усилването за нечетни стойности на , в резултат на което се подобряват относително точни измервания. Може да се види, че усилването достига своето стабилно състояние, като периодично променя стойността си в няколко проби. Вероятно е полезно да се обсъди накратко и чисто качествено влиянието на съотношението на количествата и върху , дори ако е трудно да се получат общи количествени резултати. Първо, относителните стойности са важни тук, а не абсолютните. По-специално, лесно е да се покаже, че в случай, когато и са умножени по една и съща положителна скаларна константа, тогава не се променя. Много приблизително може да се каже само, че печалбата зависи от съотношението сигнал / шум. Елементите на матрицата на коефициентите намаляват, когато стойностите на елементите на матриците и [или само в ] намаляват или стойностите на елементите на матрицата се увеличават. Този резултат изглежда доста интуитивен, тъй като с намаляването му трябва да се очакват все по-малки промени в състоянието и следователно няма нужда да се „проследяват“ наблюденията толкова точно. По същия начин, ако намалява, тогава точността на първоначалната оценка се увеличава и необходимостта от информацията, съдържаща се в наблюденията, намалява, а оттам и печалбата намалява. От друга страна, ако се увеличи, усилването отново намалява, предотвратявайки добавянето на прекомерен шум от измерването към оценката. В границата, когато клони към нула, е лесно да се покаже, че асимптотично се доближава до нула за големи стойности на . Когато се приближи до нула, отклоненията на грешката също се доближават до нула и процедурата за оценка става независима от наблюдението и влиза в режим, известен като входно насищане. Този режим може да доведе до сериозни проблеми с разминаването. Методите за коригиране на дивергенцията ще бъдат обсъдени подробно в раздел. 8.5.

Оценка по критерия за максимална апостериорна вероятност.Получаваме линеен алгоритъм за оценка, като приемем, че и имаме нормални закони за разпределение. В този случай е лесно да се покаже (вижте § 4.2), че и са нормално разпределени случайни променливи за всички . Следователно е линейна наблюдателна функция. С други думи, линейният алгоритъм за оценка на дисперсията на минималната грешка е алгоритъм за оценка с минимална дисперсия на грешката и дисперсията на грешката е по-малка или равна на дисперсията на грешката на всеки друг линеен или нелинеен алгоритъм за оценка.

За да се получи алгоритъм за оценка по критерия за максимална апостериорна вероятност, е необходимо само да се определи условната плътност на вероятността на стойността за дадена и след това да се намери нейното математическо очакване. Тъй като условното разпределение е нормално, когато е дадено, известно е (вижте §6.2), че алгоритъмът за оценка, който изчислява условното очакване, минимизира не само средната квадратна грешка, но и средната абсолютна грешка за проста и много други функции на загуба.

По този начин може да се присвои алгоритъм за оценка на минималната вариация, като се вземе предвид оценката при всякакви други функции на загуба, например оценка на максималната последна вероятност (накратко оценка на MAP), когато функцията на загубата е избрана да бъде проста и оценката съвпада с режима на условна плътност .

Нека използваме тази техника и да конструираме алгоритъма за оценка на MAV. Тъй като някои изрази, с които ще трябва да работим, може да се окажат твърде дълги, в хода на представянето понякога ще използваме опростена форма на нотация. Ако приемем лека липса на строгост, ние ще се откажем от нотацията на индекса за плътностите на вероятностите и разглежданите случайни променливи ще бъдат обозначени като аргументи на тези плътности. Например, стойността на плътността на вероятността на случайна променлива в точка , се записва в този случай като ; подобно написано като . И човек не трябва да се опитва да тълкува тази опростена форма на нотация като вероятността, че (това е чиста глупост), или по-скоро, плътността на вероятността трябва да се разглежда като функция, а не като стойността на тази функция, която приема за конкретно наблюдение. За съжаление, в нестрогата математика, която инженерите използват, разграничението между функция, като преобразуване от един набор в друг, и конкретна стойност на тази функция често не се подчертава ясно.

Функцията на плътност на вероятността, разглеждана при оценка въз основа на критерия за максимална апостериорна вероятност или на базата на условното математическо очакване, е функция на случайна променлива за дадена последователност от наблюдения и се означава като . Алгоритъмът за оценка, базиран на условното очакване, се дефинира като

(7.35)

Оценката по критерия на максималната апостериорна вероятност, която ще означим като , се намира като решение на уравнението

. (7.36)

при условие че

(7.37)

Ако условието (7.37) е изпълнено, което изисква матрицата на вторите производни да бъде отрицателно определена, тогава решението на уравнение (7.36) съответства на максималната условна плътност.

Да намериш израз за , използваме теоремата за умножение и пишем как

Ако го разглеждаме като обединение на ново наблюдение и предишни наблюдения, тогава уравнението (7.38) ще бъде пренаписано във формата

(7.39)

Помислете за числителя на този израз. Използвайки теоремата за умножение, можем да напишем

защото знанието несъмнено изключва необходимостта от запазване. Ако е дадено, тогава in е само случайна променлива и тъй като е бял шум, тогава не се съдържа информация нито в , нито в . Ако заместим израз (7.40) в (7.39), получаваме

Прилагайки теоремата за умножение към знаменателя, записваме получения израз във формата

След редукция с обща скаларна вероятностна функция получаваме

(7.41)

Сега можете да определите условната плътност на вероятността на случайна променлива, дадена чрез изчисляване на всеки израз за вероятността от дясната страна на уравнение (7.41). Нека разгледаме всеки член поотделно, като докажем, че всяка вероятностна плътност в (7.41) е нормална и дефинираме първите два момента, които характеризират нормалното разпределение. Нека първо проучим. Тъй като е дадено от уравнението, a е нормален случаен процес, тогава плътността на вероятността несъмнено е нормална, тъй като има сума от нормален случаен процес и постоянна стойност. Средната стойност на процеса е

защото е случаен процес с нулева средна стойност. Дисперсията на случаен процес е по дефиниция

и в този случай

Следователно, плътността на вероятността може да бъде записана в следната форма:

Сега нека разгледаме знаменателя на израза (7.41), по-точно, плътността на вероятността на дадена стойност три. Използвайки уравнението за модела на наблюдение, може да се напише като

Според първоначалната формулировка на задачата е известно, че има нормален закон на разпределение и не зависи от . Ако приемем, че - нормално, без съмнение също е нормално, тъй като е линейна функция (сума) на две случайни променливи, които имат нормален закон на разпределение. Плътността на вероятността на случайна променлива за дадено u е нормална, тъй като в този случай тя просто съвпада с , което според първоначалното предположение е нормално. Следното ще покаже валидността на предположението, че , а оттам също са нормални за всички. Средна стойност с плътност се равнява

където се използва въведената по-рано нотация; е равно на нула, тъй като това е бял шум с нулева средна стойност. По дефиниция дисперсията на процеса е равна на дадената, тъй като дисперсиите на величините:, считани за изходни в тази верига, са нормални. Следователно се потвърждава предположението, че плътността нормално.

Оценката на състоянието за дадено , базирана на условното математическо очакване (оценка по критерия за минималната дисперсия на грешката), се определя от уравнение (7.54) и е в съответствие с предварително получените резултати [виж. (7.30)]. В този случай обаче оценката е точно равна на условното очакване (тъй като тук се приема нормално разпределение) и не е най-добрата само в класа на линейните оценки. Разбира се, за нормално разпределение и двете оценки са еднакви, тъй като условното очакване е линейна функция на наблюдение.

За да определите оценката на MAV, трябва да намерите стойността, която максимизира . Нека използваме добре познат трик и да търсим максимума, а не самата плътност

и в този случай се наблюдава поради физическите свойства на матрицата на дисперсията на грешката. Следователно оценката на MAV съвпада с оценката на условното очакване и оценката по критерия за минимална вариация на грешката. Наборът от стойности е достатъчна статистика за оценка в смисъл, че те напълно определят условната плътност.

Трябва да се отбележи, че може директно да се използва оригиналната форма на нотация за плътност [израз (7.52)], а не компактната форма (7.53). Този подход изглежда по-привлекателен, тъй като в този случай не се изисква познаване на по-компактна форма, която не е достатъчно проста и очевидна. Ако използваме израз (7.52) за , то в резултат на преобразуването на уравнение (7.57) имаме

Ако сега групираме условията, които включват, получаваме

чието решение по отношение води до следния резултат:

Въпреки че това решение за оптимална оценка не е представено в такава удобна форма като предишното, то може лесно да бъде сведено до (7.62), като се използва директно лемата за инверсия на матрицата или изрази (7.55) и (7.56).

Редица интересни и полезни изрази за дисперсията могат да бъдат извлечени от алгоритмите за филтриране на Калман. Ето някои от по-полезните, свързани с понятието „процес на обновяване“:

С уравнение (7.70) получаваме [което също е оптималната оценка, валидна на изхода на системата, т.е. когато моделът на наблюдение има следната форма:

Те дават решение на проблема с линейното дискретно филтриране в най-обща постановка. В заключение отбелязваме, че от общите резултати следват като частни резултатите, дадени в табл. 7.2, ако поставим и равно на нула.