Lọc động tuyến tính tối ưu. Bộ lọc Kalman-Bucy tối ưu

Như đã biết, bản chất của lọc là ước lượng liên tục các tham số thay đổi theo thời gian của một quá trình ngẫu nhiên. Nếu thông báo là một quá trình Markov vô hướng (đối với một quá trình Gaussian tĩnh, điều này có nghĩa là hàm hiệp phương sai có dạng Aexp (-B | t-u |), thì lời giải của bài toán có thể dựa trên các nguyên tắc sau đây để đơn giản hóa thành tích của mục tiêu:

Việc mô tả các quá trình mà chúng ta quan tâm nên được thực hiện bằng cách sử dụng các hệ thống tuyến tính với các tham số thay đổi theo thời gian sẽ tạo ra chúng khi nhiễu trắng được áp dụng cho các đầu vào của hệ thống;

Một hệ thống tuyến tính tạo ra một thông điệp nên được mô tả bằng một phương trình vi phân có nghiệm là thông báo mong muốn;

Ước lượng tối ưu làm giá trị đầu ra của một hệ thống tuyến tính phải được đưa ra dưới dạng một nghiệm cho một phương trình vi phân, các hệ số của chúng được xác định bởi thống kê của các quá trình.

Các hệ thống tuyến tính được xây dựng theo các nguyên tắc này được gọi là bộ lọc Kalman-Bucy, sở hữu công trình ban đầu trong lĩnh vực này. Ngược lại với những nguyên tắc này, trong phép lọc tích phân Wiener, việc mô tả các quá trình được thực hiện bằng cách sử dụng hàm hiệp phương sai, hệ thống tuyến tính - sử dụng đáp ứng xung, ước lượng tối ưu - như một lời giải cho phương trình tích phân Wiener-Hopf.

Phương trình vi phân của bộ lọc Kalman tối ưu ở dạng chuẩn là:

đâu là độ lợi ma trận của bộ lọc tối ưu.

Bộ lọc Kalman thực hiện lọc tối ưu động các quá trình ngẫu nhiên không cố định. Lời giải của bài toán lọc tối ưu được rút gọn thành giải hệ phương trình vi phân (hoặc hiệu) vectơ-ma trận. Phương pháp này cho phép bạn vận hành một hệ phương trình kín ở dạng tuần hoàn, thuận tiện nhất cho việc thực hiện kỹ thuật. Về bản chất, bộ lọc Kalman là một thuật toán xử lý thông tin tính toán sử dụng một tập hợp các thông tin tiên nghiệm về hệ thống ban đầu (cấu trúc, tham số, đặc điểm thống kê của nhiễu trạng thái và nhiễu đo lường, thông tin về các điều kiện ban đầu, v.v.). Một bộ lọc như vậy thực hiện xử lý thống kê thông tin quan sát, có tính đến các thuộc tính động của mô hình hệ thống ban đầu. Cấu trúc của bộ lọc Kalman là một mô hình của hệ thống động ban đầu với lỗi lọc được sửa chữa bằng tín hiệu hiệu chỉnh

đâu là tín hiệu điều chỉnh của biểu mẫu:

Trong trường hợp này, bộ lọc Kalman động không tĩnh tối ưu là một hệ thống điều khiển tự động khép kín có chứa mô hình toán học của hệ thống gốc và ở đầu ra của mô hình, ước tính trạng thái được tạo ra và tín hiệu hiệu chỉnh với ma trận không tĩnh thu được là đầu vào K (t):

Do đó, thuật toán lọc động dựa trên nguyên tắc cổ điển của điều khiển độ lệch với độ lợi ma trận K (t) đảm bảo sai số lọc bình phương trung bình nhỏ nhất. Tín hiệu hiệu chỉnh bao gồm tín hiệu hiện tại của quan sát z (t) trạng thái của hệ thống ban đầu, được bổ sung bởi tín hiệu hiện tại về trạng thái của mô hình của hệ thống ban đầu. Tín hiệu là một tín hiệu sửa lỗi bộ lọc và đặc trưng cho thông tin bổ sung giữa các phép đo hiện tại z (t) và các ước lượng trạng thái thu được từ kết quả của các ước lượng trước các phép đo hiện tại z (t). Sơ đồ ma trận của bộ lọc Kalman tối ưu có dạng như trong Hình. 4.18. Lược đồ này thực hiện một thuật toán lọc động khi trạng thái của hệ thống ban đầu được cho bởi các phương trình vi phân, vế phải của nó không phụ thuộc vào quan sát.

Phương pháp lọc Kalman rời rạc tối ưu đã trở nên đặc biệt phổ biến liên quan đến sự phát triển của các phương pháp xử lý thông tin rời rạc. Nó là phần mở rộng của các kết quả của lọc động tối ưu liên tục cho các hệ thống động rời rạc được mô tả bằng phương trình vectơ-ma trận khác biệt.

Cơm. 4.17. Lược đồ ma trận của bộ lọc Kalman tối ưu

Phương trình bộ lọc tuyến tính tối ưu cho phép bạn tính toán các ước tính một cách tuần tự. Chỉ các giá trị điểm trước đó và số tham số được sử dụng để tính điểm. Giá trị của điểm tại thời điểm được tính từ điểm tại thời điểm, cộng thêm sự khác biệt có trọng số giữa phép đo tại thời điểm và điểm của phép đo tại thời điểm. Cách tính điểm này được gọi là đệ quy. Do đó, bộ lọc Kalman rời rạc ở dạng đệ quy thực hiện một thủ tục đệ quy để tính các ước lượng liên tiếp, yêu cầu lưu trữ một số lượng nhỏ các kết quả tính toán ở mỗi bước.

Mạch ma trận của bộ lọc Kalman rời rạc được hiển thị trong hình. 4.19 cùng với các mô hình của hệ động lực ban đầu và hệ thống đo lường.

Cơm. 4.18. Mạch ma trận lọc Kalman rời rạc

Cơ sở để suy ra phương trình lọc là phương trình trạng thái của hệ thống động lực và phương trình quan sát (đo lường). Phương trình trạng thái của một hệ thống động lực học tuyến tính được mô tả bằng một hệ phương trình sai phân ở dạng vectơ-ma trận:

đâu là ma trận chuyển trạng thái của chiều, -vectơ không chiều của trạng thái của hệ động; - ma trận nhiễu loạn, hoặc tín hiệu đầu vào của thứ nguyên; - vectơ chiều của một dãy Gaussian ngẫu nhiên.

Phương trình quan sát (đo) tín hiệu thu được ở đầu ra của mô hình hệ thống đo được mô tả bằng phương trình vectơ sai khác:

một vectơ quan sát (đo lường) chiều ở đâu; -vectơ chiều của một chuỗi sai số đo ngẫu nhiên không tương quan Gaussian làm sai lệch kết quả giám sát trạng thái của một hệ thống động lực học; ma trận kích thước thứ nguyên

Giả sử rằng ước lượng trạng thái của hệ thống tại thời điểm hiện tại và ma trận chuyển tiếp) đã biết. Sau đó, ước tính này có thể được coi là ước tính ban đầu và ước tính tại thời điểm đó có thể được tính toán theo phương trình:

Ước tính này được dự đoán (ngoại suy) từ kết quả của các quan sát trước đó. Khi tính toán nó, phép đo cuối cùng về trạng thái của hệ động lực, được thực hiện tại thời điểm này, không được sử dụng. Điều này sẽ dẫn đến sai số trong việc ước lượng vector trạng thái hệ thống. Sai số ước lượng tại thời điểm hiện tại thông qua ma trận chuyển tiếp mở rộng đến tất cả các ước tính tiếp theo trong và với thời gian vận hành bộ lọc dài, các lỗi có thể tích lũy và dẫn đến kết quả không đạt yêu cầu. Ước tính có thể được cải thiện bằng cách sử dụng các phép đo tại một thời điểm và tạo ra một tín hiệu hiệu chỉnh:. Từ đây

Thay (9.14) vào biểu thức này, chúng ta thu được phương trình của bộ lọc Kalman rời rạc ở dạng chính tắc:

Hệ số truyền tối ưu của bộ lọc như vậy phải cung cấp tối thiểu sai số lọc bình phương trung bình phù hợp với điều kiện (4.152).

Danh sách kiểm tra cho Chương 4

1. Tiêu chí quyết định nào được sử dụng trong GAS NC?

2. Điểm giống và khác nhau giữa các tiêu chí phát hiện cho "Người quan sát lý tưởng", "Neyman-Pearson" và "Wald" là gì?

3. Bản chất vật lý của các xác suất phát hiện đúng, không phát hiện đúng, bỏ qua tín hiệu và báo động sai là gì?

4. Xác suất báo động giả "tại điểm" và hệ thống đa kênh tương quan như thế nào?

5. Ngưỡng phát hiện được chọn như thế nào khi thực hiện tiêu chí Neyman-Pearson?

6. Ngưỡng phát hiện được chọn như thế nào khi thực hiện tiêu chí Kotelnikov-Siegert?

7. Ngưỡng phát hiện được chọn như thế nào khi thực hiện tiêu chí phát hiện Wald?

8. Mức độ đầy đủ và các tính năng của bộ thu tương quan và bộ lọc phù hợp là gì?

9. Bản chất của tính nhất quán của đánh giá là gì?

10. Thực chất của hiệu quả của việc đánh giá là gì?

11. Thực chất của ước tính không chệch là gì?

12. Ma trận thông tin Fisher là gì?

13. Đặc tính tìm hướng của sóng siêu âm được cấu tạo như thế nào?

14. Từ điển dấu hiệu và bảng chữ cái hình ảnh của các vật thể sonar được hình thành như thế nào?

15. Cho biết sự đầy đủ và khác biệt giữa các khái niệm phân loại và nhận biết đối tượng sonar?

BULLETIN OF TOMSK STATE UNIVERSITY 2011 Quản lý, Kỹ thuật Máy tính và Tin học Số 3 (16) UDC 517.511 V.I. Smagin, S.V. BỘ LỌC Smagin TRONG HỆ THỐNG PHÂN TÍCH TUYẾN TÍNH VỚI CÁC CHỨNG NHẬN KHÔNG CẦN THIẾT Một thuật toán để thiết kế một bộ lọc tối ưu xác định ước lượng vectơ trạng thái của một hệ thống động lực học không tĩnh tuyến tính rời rạc với các nhiễu cộng có chứa thành phần hằng số chưa biết được xem xét. Kết quả của một thí nghiệm tính toán được trình bày. Từ khóa: hệ thống tĩnh rời rạc tuyến tính, bộ lọc Kalman, nhiễu loạn chưa biết. Trong các công trình của nhiều tác giả, người ta chú ý nhiều đến việc phát triển các thuật toán lọc Kalman cho một lớp hệ thống có nhiễu phụ gia chưa biết và các tham số có thể được sử dụng như mô hình của các hệ thống vật lý thực, mô hình của các đối tượng có lỗi chưa biết. Các phương pháp đã biết để tính toán ước lượng vectơ trạng thái dựa trên các thuật toán sử dụng các ước tính nhiễu loạn chưa biết. Các bài báo xem xét các thuật toán để mở rộng không gian trạng thái (một mô hình nhiễu loạn không thể quan sát được thêm vào mô hình nhà máy chính) và một thuật toán lọc hai giai đoạn giúp giảm chi phí tính toán do phân rã vấn đề. Trong bài báo, các thuật toán để lọc tối ưu lặp lại được nghiên cứu sử dụng các ước tính của một nhiễu không xác định có các điều kiện khá nghiêm ngặt về khả năng giải quyết của chúng. Trong bài báo này, đối với một nhà máy không cố định rời rạc có thành phần nhiễu loạn không đổi không xác định, chúng tôi đề xuất một phương pháp lọc tối ưu không sử dụng các ước tính của nhiễu chưa biết. Phương pháp này dựa trên sự biến đổi và rút gọn mô hình thành bài toán lọc Kalman tuyến tính. Trong bài này, các kết quả được khái quát cho trường hợp giải bài toán cho một vật thể rời rạc không đứng yên. 1. Phát biểu bài toán Ta xét một hệ rời rạc, được mô tả bằng các phương trình sai phân sau: x (k + 1) = A (k) x (k) + f + q (k), x (0) = x0 , (1) trong đó x (k) ∈ R n là vectơ trạng thái; A (k) là một ma trận n × n; f là một vectơ hằng số chưa biết; q (k) là một dãy ngẫu nhiên Gaussian trắng với các đặc điểm M (q (k)) = 0, M (q (k) q Τ (j)) = Q (k) δk, j. (2) Kênh quan sát có dạng y (k) = S (k) x (k) + v (k), (3) y (k) ∈ R l là vectơ đo; S (k) là một ma trận l × n; v (k) - gauss trắng - V.I. Smagin, S.V. Chuỗi sai số đo ngẫu nhiên của Smagin 44 Liên Xô, với các đặc điểm: M (v (k)) = 0, M (q (k) v Τ (j)) = 0, M (v (k) v Τ (j)) = V (k) δi, j; (4) đối với ma trận (S (k), A (k)) thỏa mãn các điều kiện quan sát. Vectơ x0 là ngẫu nhiên và không phụ thuộc vào các quá trình q (k) và v (k), trong khi M (x (0)) = x0, M ((x (0) - x0) (x (0) - x0 ) Τ) = P0. Đối với hệ thống (1) và kênh quan sát (3), yêu cầu tổng hợp một bộ lọc tính ước lượng vectơ trạng thái không sử dụng ước lượng thành phần không đổi chưa biết của nhiễu. 2. Lọc tổng hợp Chúng ta hãy biến đổi hệ thống rời rạc (1). Chúng tôi loại trừ thành phần hằng số của nhiễu f khỏi mô tả của đối tượng bằng cách trừ cùng một phương trình từ phương trình (1), nhưng với sự dịch chuyển theo một chu kỳ: x (k) = A (k - 1) x (k - 1 ) + f + q (k - một). (5) Kết quả là chúng ta thu được phương trình sau: x (k + 1) = (A (k) + En) x (k) - A (k - 1) x (k - 1) + q (k) - q (k - 1). (6) Hãy mở rộng không gian trạng thái của hệ bằng cách thêm vào phương trình (6) đồng dạng x (k) = x (k). Kí hiệu x (k) ⎞ ⎛ q (k) - q (k - 1) ⎞. X (k) = ⎛⎜ ⎟ ⎟, q (k) = ⎜ 0 ⎝ ⎠ ⎝ x (k - 1) ⎠ Chúng ta biểu diễn hệ (1) dưới dạng vectơ-ma trận X (k + 1) = A (k) X (k) + q (k), X (0) = X 0, (7) (8) trong đó A (k) là ma trận 2n × 2n với cấu trúc khối như sau: ⎛ A (k) + En A ( k) = ⎜ En ⎝ - A (k - 1) ⎞ ⎟. 0 ⎠ (9) Vectơ ngẫu nhiên X 0 = (x0Τ x − Τ1) Τ có các đặc điểm sau: M (X (0)) = X 0, M ((X 0 - X 0) (X 0 - X 0) Τ) = P0, (x0Τ (10) x − Τ1) Τ trong đó X 0 =. Lưu ý rằng ở đây một vectơ n-chiều x − 1 được giới thiệu thêm, không phụ thuộc vào q (k) và v (k), và các đặc điểm (10) có thể nhận được từ thông tin tiên nghiệm về đối tượng (1). Lưu ý rằng trong mô hình được xem xét (8), quá trình q (k) không phải là một chuỗi Gauss trắng, các quá trình q (k) và q (k - 1) sẽ có tương quan: nếu j = k, ⎧ Q (k), ⎪ M (q (k) q (j)) = ⎨Q (k - 1) nếu j = k - 1, ⎪ 0 nếu 0 ≤ j< k − 1, ⎩ (11) Q(k) + Q(k − 1) 0 ⎞ ⎛ −Q(k − 1) 0 ⎞ . Q(k) = ⎛⎜ ⎟ , Q (k − 1) = ⎜ 0 0 0 0 ⎟⎠ ⎝ ⎠ ⎝ (12) Τ где Фильтрация в линейных дискретных нестационарных системах 45 Представим канал наблюдений для расширенной системы (8) в виде y (k) = S (k) X (k) + v(k) , (13) где S (k) = (S (k) 0) , v(k) − случайная последовательность ошибок измерений с характеристиками (4). В качестве уравнения для вычисления оценки вектора состояния расширенной системы выберем уравнение, по своей структуре совпадающее с фильтром Калмана: Xˆ (k + 1) = A(k) Xˆ (k) + K (k)(y (k + 1) − S (k + 1) A(k) Xˆ (k)) , Xˆ (0) = X . (14) 0 Учитывая (8) и (14), получим следующее уравнение для ошибки e(k) = Xˆ (k) − X (k) : e(k + 1) = (A(k) − K (k) S (k + 1) A(k))e(k) + K (k)v(k + 1) + (K (k) S (k + 1) − E2 n)q (k) . (15) В силу (11) и (15), матрица P (k) = M{e(k)eΤ (k)} определится из следующего разностного уравнения: P (k + 1) = (A(k) − K (k) S (k + 1) A(k)) P (k)(A(k) − K (k) S (k + 1) A(k))Τ + +(K (k) S (k + 1) − E2 n)Q (k)(K (k) S (k + 1) − E2 n)Τ + K (k)V (k + 1) K Τ (k) + +(A(k) − K (k) S (k + 1) A(k))(K (k − 1) S (k) − E2 n) × ×Q (k − 1)(K (k) S (k + 1) − E2 n)Τ + (K (k) S (k + 1) − E2 n) × ×Q (k − 1)(K (k − 1) S (k) − E2 n)Τ (A(k) − K (k) S (k + 1) A(k))Τ , P (0) = P0 . (16) Оптимизируемый критерий зададим в виде J (k + 1) = trP (k + 1) . (17) Оптимальные коэффициенты передачи фильтра K(k) определяются из условия dJ (k + 1) =0. (18) dK (k) Учитывая (17) и правую часть уравнения (16), применяя правила матричного дифференцирования следа от матрицы , получим из условия (18) уравнение для определения матрицы K(k): − A(k) P (k) A(k)Τ S (k + 1)Τ + K (k) S (k + 1) A(k) P (k) A(k)Τ S (k + 1)Τ + + K (k) S (k + 1)Q (k) S (k)Τ − Q (k) S (k + 1)Τ − K (k) S (k + 1)Q (k − 1) × ×S (k)Τ K (k − 1)Τ A(k)Τ S (k + 1)Τ + K (k) S (k + 1)Q (k − 1) A(k)Τ S (k + 1)Τ − − K (k) S (k + 1) A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + + K (k) S (k + 1) A(k)Q (k − 1) S (k + 1)Τ + Q (k − 1) S (k)Τ K (k − 1)Τ × × A(k)Τ S (k + 1)Τ − Q (k − 1) A(k)Τ S (k + 1)Τ − A(k)Q (k − 1) S (k + 1)Τ + + A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + K (k)V (k + 1) = 0 . (19) Решение последнего уравнения относительно K(k) дает следующий результат: K (k) = P (k) S (k + 1)Τ (S (k + 1) P (k) S (k + 1)Τ + V (k + 1)) −1 , (20) 46 В.И. Смагин, С.В. Смагин где P (k) = A(k) P (k) A(k)Τ + Q (k − 1)(E2 n − S (k)Τ K (k − 1)Τ) A(k)Τ + + A(k)(E2 n − K (k − 1) S (k))Q (k − 1) + Q (k) . (21) Отметим, что для вычисления коэффициентов передачи (20), в силу (21), необходимо задать начальные значения коэффициентов K(−1). Подставив в уравнение (16) выражение для оптимального коэффициента передачи (20), получим уравнение P (k + 1) = (E2 n − K (k) S (k + 1)) P(k) , P (0) = P0 . (22) Основной результат сформулируем в виде теоремы, учитывая симметричность и блочное представление матриц P (k) и P (k) : ⎛ p (k) P(k) = ⎜ 1 ⎝ p2 (k) ⎛ p (k) p2Τ (k) ⎞ , P (k) = ⎜ 1 p3 (k) ⎟⎠ ⎝ p2 (k) p2Τ (k) ⎞ , p3 (k) ⎟⎠ (23) блочные структуры матриц A(k), Q(k), Q (k), S (k) и представление матрицы K (k) в виде ⎛ K (k) ⎞ K (k) = ⎜ 1 ⎟ . (24) ⎝ K 2 (k) ⎠ Теорема. Пусть процесс с неизвестным постоянным возмущением определяется уравнениями (1) и канал наблюдений имеет вид (3). Тогда оптимальный алгоритм фильтрации определится следующими разностными уравнениями: xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1)] (25) с начальными условиями xˆ(0) = x0 , xˆ(1) = M{x(1)} = x1 . Матрица K1 (k) в (25) определяется по формуле (26) K1 (k) = p1 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 , где матрица p1 (k) вычисляется из системы уравнений (27) p1 (k) = (A(k) + En) p1 (k)(A(k) + En)Τ − A(k − 1) p2 (k)(A(k) + En)Τ − −(A(k) + En) p2Τ (k) A(k − 1)Τ + A(k − 1) p3 (k) A(k − 1)Τ + Q(k − 1) S (k)Τ K1 (k − 1)Τ × ×(A(k) + En)Τ − Q(k − 1) S (k)Τ K 2 (k − 1)Τ AΤ (k − 1) + +(A(k) + En) K1 (k − 1) S (k)Q(k − 1) − A(k − 1) K 2 (k − 1) S (k) × ×Q(k − 1) − (A(k) + En)Q(k − 1) − Q(k − 1)(A(k) + En)Τ + Q(k) + Q(k − 1) , p2 (k) = p1 (k)(A(k) + En)Τ − p2Τ (k) A(k − 1)Τ + + K1 (k − 1) S (k)Q(k − 1) − Q(k − 1) , p3 (k) = p1 (k) , p1 (k + 1) = (En − K1 (k) S (k + 1)) p1 (k) , p1 (0) = p1,0 , p2 (k + 1) = − K 2 (k) S (k + 1) p1 (k) + p2 (k) , p2 (0) = p2,0 , p3 (k + 1) = − K 2 (k) S (k + 1) p2Τ (k) + p3 (k) , p3 (0) = p3,0 , K 2 (k) = p2 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 . (28) Фильтрация в линейных дискретных нестационарных системах 47 В (28) начальные условия p1,0 , p2,0 , p3,0 , являются соответствующими блоками матрицы P0 . Отметим, что для выполнения расчетов в (28) необходимо задать начальные условия для K1 (−1) и K 2 (−1) . Замечание. Управляемый объект x(k + 1) = A(k) x(k) + B(k)u (k) + f + q(k), x(0) = x0 , (29) при исключении неизвестного постоянного возмущения f объекта, необходимо преобразовать к виду, который будет отличаться от (8) одним слагаемым: X (k + 1) = A(k) X (k) + B (k)(u (k) − u (k − 1) + q (k), X (0) = X 0 , (30) где матрица A(k) приведена в формуле (9), q (k) имеет характеристики (11), (12). В (30) матрица B (k) имеет вид B (k) ⎞ B (k) = ⎛⎜ ⎟. ⎝ 0 ⎠ Тогда уравнения фильтра будут следующими: (31) xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1)) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1))] , (32) с начальными условиями (26), а матрица K1 (k) определяется в соответствии с (27) и (28). 3. Результаты вычислительного эксперимента Рассмотрим применение алгоритма фильтрации для модели второго порядка вида (1) и канала наблюдений (3) со следующими значениями параметров: 0 1 0 ⎞ ⎞ ; Q = ⎛ 0, 01 ; V = 0,9 ; A(k) = ⎛⎜ ⎟ ⎜ 0 0, 02 ⎟⎠ ⎝ ⎝ 0, 05 0,925 + 0,1sin(0, 01k) ⎠ 1, 0 1, 0 0 ⎞ S = (1 1) ; x0 = ⎛⎜ ⎞⎟ ; P0 = ⎛⎜ (33) ⎟. ⎝ 1,5 ⎠ ⎝ 0 1, 0 ⎠ Вычисление оценок вектора x(k) можно выполнить, используя двухэтапный алгоритм фильтрации . Модель измерений в этом случае с учетом (1) представляется в виде y (k + 1) = Sx(k + 1) + v(k + 1) = SA(k) x(k) + Sf + Sq(k) + v(k + 1) . (34) Рекуррентные уравнения оценивания неизвестного вектора f имеют вид fˆ (k + 1) = fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , fˆ (0) = f , 0 f Τ Τ Τ −1 K f (k) = Pf (k) S (SPf (k) S + SQS + V) , где Pf (k + 1) = (E2 − K f (k) S) Pf (k), Pf (0) = Pf0 , (35) M{ f } = f 0 , M{(f − f 0)(f − f 0)Τ } = Pf0 . (36) В.И. Смагин, С.В. Смагин 48 Оценка вектора состояния для объекта с неизвестным постоянным входом задается уравнением: xˆ (k + 1) = A(k) xˆ (k) + fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , (37) x где матрица K x (k) определяет коэффициенты передачи фильтра Калмана. При моделировании используем 0 1, 0 0 ⎞ f 0 = ⎛⎜ ⎞⎟ , Pf0 = ⎛⎜ (38) ⎟. ⎝0⎠ ⎝ 0 1, 0 ⎠ Применение расширенного фильтра Калмана для данного примера (в этом случае уравнение (1) расширяется путем добавления уравнения f(k+1) = f(k)) приводит к необходимости построения фильтра Калмана для дискретной системы со следующими матрицами динамики, канала наблюдений и интенсивностей аддитивных возмущений: Q 0⎞ ⎛ A(k) E2 ⎞ , (S 0) , ⎛⎜ (39) ⎟. ⎜ 0 E2 ⎟⎠ ⎝ 0 0⎠ ⎝ Использование в данном примере методов, описанных в работах , невозможно в силу невыполнения условий существования оптимальных оценок неизвестного входного вектора : n≥m и l≥m. (40) В неизвестное возмущение определяется в виде f = Gd , где d – неизвестный m-мерный вектор, G – n × m -известная матрица. В рассмотренном примере G = E2 , n = 2 , m = 2, l = 1 , а это означает, что условия (40) не выполняются. Применение алгоритма фильтрации исследовалось также для неизвестного переменного возмущения с тремя возможными значениями компонент вектора f: ⎧ 1, если 0 ≤ k ≤ 9, ⎪ f1 (k) = f 2 (k) = ⎨ −1, если 9 < k < 25, ⎪ 1, если 25 ≤ k ≤ 50. ⎩ На рис. 1 приведены реализации процессов и их оценок для трех сравниваемых фильтров. Отметим, что при реализации алгоритма фильтрации (25), начальные значения K1 (−1) и K 2 (−1) задавались нулевые. x1(k) x1(k) x2(k) x2(k) 2 10 0 –10 0 3 4 20 30 40 k –10 0 4 1 0 1 10 3 10 2 10 20 30 40 k Рис. 1. Реализации процессов и оценок (1 – реализация x(k); 2 – оценка, построенная по алгоритму (25); 3 – оценка, построенная по двухэтапному алгоритму; 4 – оценка для расширенного фильтра Калмана) Фильтрация в линейных дискретных нестационарных системах 49 На рис. 2 приведены ошибки оценивания компонент вектора состояния. e1(k) 4 2 e2(k) 4 3 1 0 –2 –4 –6 0 2 2 3 1 0 2 –2 10 20 30 40 k –4 0 10 20 30 40 k Рис. 2. Графики ошибок фильтрации (1 – ошибка для оценки, построенной по алгоритму (25); 2 – ошибка для оценки, построенной по двухэтапному алгоритму; 3 – ошибка для расширенного фильтра Калмана) Как видно из рисунков для рассмотренного примера, качество оценок, полученных с помощью фильтра (25), лучше, чем для двухэтапного алгоритма фильтрации и расширенного фильтра Калмана, использующих оценки неизвестного возмущения. Отметим также, что для алгоритма фильтрации (25) не нужно задавать априорную информацию о характеристиках распределения начальных значений f 0 и Pf0 . Ниже, в таблице, приведены средние значения среднеквадратических ошибок оценивания для трех рассматриваемых методов, рассчитанных по 50 реализациям. Как видно из таблицы, предложенный метод фильтрации (25) обеспечивает среднюю ошибку в 3 – 4 раза меньшую, чем другие методы. Средние значения среднеквадратических ошибок для компонент вектора состояния Алгоритм (25) e1,ср = 0,0912 Двухэтапный алгоритм e1,ср = 0,3128 Расширенный фильтр Калмана e1,ср = 0,4103 e2,ср = 0,0945 e2,ср = 0,2917 e2,ср = 0,4296 Заключение Разработан алгоритм синтеза дискретного оптимального нестационарного фильтра для объекта, возмущения которого содержат неизвестную постоянную составляющую. Алгоритм построен на основе расширения пространства состояния и исключения из модели неизвестной составляющей. В отличие от классического фильтра Калмана, предложенный фильтр использует рекуррентные оценки, построенные на двух предыдущих тактах. Как показали результаты вычислительного эксперимента, алгоритм может быть применен для кусочно-постоянной неизвестной аддитивной составляющей возмущений. ЛИТЕРАТУРА 1. Astrom K., Eykhoff P. System identification. A survey // Automatica. 1971. V. 7. P. 123−162. 2. Friedland B. Treatment of bias in recursive filtering // IEEE Trans. on Automat. Contr. 1969. V. AC-14. P. 359−367. 3. Chen J., Patton R. J. Optimal filtering and robust fault diagnosis of stochastic systems with unknown disturbances // IEE Proc. Control Theory Appl. 1996. V. 143. P. 31–36. 50 В.И. Смагин, С.В. Смагин 4. Darouach M., Zasadzinski M. Unbiased minimum variance estimation for systems with unknown exogenous inputs // Automatica. 1997. V. 33. P. 717–719. 5. Darouach M., Zasadzinski M., Xu S. J. Full-order observers for linear systems with unknown inputs // IEEE Trans. on Automat. Contr. 1999. V. AC-39. P. 606. 6. Gillijns S., Moor B. Unbiased minimum-variance input and state estimation for linear discrete-time systems // Automatica. 2007. V. 43. P. 111–116. 7. Hou M., Patton R. Optimal filtering for systems with unknown inputs // IEEE Trans. on Automat. Contr. 1998. V. AC-43. P. 445–449. 8. Hsieh C.-S. A unified solution to unbiased minimum-variance estimation for systems with unknown inputs // Proc.17th World Congress The International Federation of Automatic Control. Seoul. Korea. July 6 – 11, 2008. P. 14502–14509. 9. Hsieh C.-S. Robust two-stage Kalman filters for systems with unknown inputs // IEEE Trans. on Automat. Contr. 2000. V. AC-45. P. 2374–2378. 10. Hsieh C.-S. Extension of the optimal unbiased minimum-variance filter for systems with unknown inputs // Proc. 15th IEEE International Workshop on Nonlinear Dynamics of Electronic Systems. Tokushima. Japan. 2007. P. 217–220. 11. Hsieh C.-S. Robust parameterized minimum variance filtering for uncertain systems with unknown inputs // Proc. American control conference. New York. 2007. P. 5118–5123. 12. Kalman R.E., Busy R. A new results in linear filtering and prediction theory // Trans. ASME J. Basic Engr. 1961. V. 83. P. 95–108. 13. Браммер К., Зиффлинг Г. Фильтр Калмана – Бьюси. М.: Наука, 1972. 200 с. 14. Пугачев В.С., Синицин И.Н. Стохастические дифференциальные уравнения М.: Наука, 1990. 630 с. 15. Смагин С.В. Фильтрация в линейных дискретных системах с неизвестными возмущениями // Автометрия. 2009. Т. 45. № 6. C. 29−37. 16. Амосов А.А., Колпаков В.В. Скалярно-матричное дифференцирование и его применение к конструктивным задачам теории связи // Проблемы передачи информации. 1972. № 1. С. 3−15. Смагин Валерий Иванович Смагин Сергей Валерьевич Томский государственный университет E-mail: [email được bảo vệ]; [email được bảo vệ] Nhận ngày 6 tháng 12 năm 2010

480 chà. | 150 UAH | $ 7,5 ", MOUSEOFF, FGCOLOR," #FFFFCC ", BGCOLOR," # 393939 ");" onMouseOut = "return nd ();"> Thesis - 480 rúp, phí vận chuyển 10 phút 24 giờ một ngày, bảy ngày một tuần và các ngày lễ

Biryukov Ruslan Sergeevich. Điều khiển và lọc tối ưu H tổng quát rời rạc trong các đối tượng liên tục tuyến tính: luận văn ... Thí sinh Khoa học Vật lý và Toán học: 01.01.09 / Biryukov Ruslan Sergeevich; N.I. Lobachevsky "], 2017

Giới thiệu

Chương 1. Tổng quan về lý thuyết điều khiển tổng quát và lọc cho các hệ thống rời rạc tuyến tính 8

1. Tổng quát -norm của một đối tượng tuyến tính 8

2. Tổng hợp tổng hợp-kiểm tra tổng hợp 11

3. Tổng hợp bộ lọc tổng hợp 13

chương 2 -Norm tổng quát của một đối tượng liên tục với đầu ra mục tiêu rời rạc 15

1. Mức độ triệt tiêu nhiễu trong một nhà máy rời rạc liên tục 15

2. Các nhiễu động bên ngoài tồi tệ nhất và trạng thái ban đầu trong một nhà máy rời rạc liên tục 28

3. Mức độ triệt tiêu nhiễu loạn trong đối tượng rời rạc-rời rạc 32

4. Những nhiễu động bên ngoài tồi tệ nhất và trạng thái ban đầu trong một nhà máy rời rạc-rời rạc 49

5. Mức độ triệt tiêu nhiễu loạn trong trường hợp chân trời vô hạn 56

6. Đặc điểm của mức triệt nhiễu theo LMI 61

7. Kết luận 64

Chương 3 Kiểm soát tối ưu tổng quát rời rạc 66

1. Tổng hợp điều khiển tối ưu theo trạng thái 66

2. Tổng hợp điều khiển sản lượng tối ưu 74

3. Điều khiển hệ thống treo điện từ 94

4. Kết luận 101

Chương 4 Lọc tối ưu tổng quát rời rạc 102

1. Tổng hợp bộ lọc tối ưu 102

2. Lọc dữ liệu trong bài toán giảm rung chấn của tòa nhà 108

3. Kết quả 114

Kết luận 115

Thư mục

Giới thiệu công việc

Mức độ phù hợp của đề tài nghiên cứu. Các hệ thống điều khiển hiện đại, như một quy luật, được thực hiện dưới dạng kỹ thuật số, trong khi hầu hết các đối tượng thực hoạt động trong thời gian liên tục. Sự phân chia như vậy thành các phần tương tự và kỹ thuật số dẫn đến việc mất thông tin, vì các giá trị của tín hiệu liên tục đến từ đối tượng đến bộ điều khiển chỉ được biết đến tại các thời điểm rời rạc cố định. Vì lý do này, điều quan trọng là phải phân tích và tổng hợp một bộ điều khiển rời rạc có tính đến hành vi của đối tượng ban đầu một cách đầy đủ nhất có thể tại các thời điểm giữa các lần đo. Tùy thuộc vào các lớp nhiễu bên ngoài tác động lên đối tượng và mục tiêu cuối cùng của việc kiểm soát, có những cách tiếp cận khác nhau để giải quyết vấn đề này. Đặc biệt quan tâm là trường hợp đối tượng bị ảnh hưởng bởi các nhiễu động bên ngoài với "năng lượng" hạn chế, và mục tiêu của việc kiểm soát là giảm thiểu tổng "năng lượng" của đầu ra mục tiêu của đối tượng. Trong trường hợp này, vấn đề là một bài toán điều khiển tối ưu% 00 rời rạc cho một nhà máy liên tục dựa trên các phép đo rời rạc theo thời gian.

Nhiều cách tiếp cận khác nhau đã được đề xuất để giải quyết vấn đề này. Một trong những cách tiếp cận đầu tiên là cách tiếp cận dựa trên biểu diễn của hệ thống liên tục ban đầu với đầu ra rời rạc là rời rạc liên tục, hành vi của hệ thống này được mô tả bằng một tập các phương trình vi phân và sai phân (Sun W., Nagpal K.M., Poolla K.R., Khargonekar P.P., Sagfors M.F., Toivonen H.T., v.v.). Trong trường hợp này, quy trình thiết kế bộ điều khiển và bộ lọc 7 ^^ - tối ưu rời rạc dựa trên các phương trình Riccati vi phân, các nghiệm trong đó kinh nghiệm nhảy vào các thời điểm tương ứng với các quan sát. Việc triển khai thực tế các thuật toán tổng hợp được đề xuất gặp phải một số khó khăn liên quan đến việc giải bài toán giá trị biên phi tuyến cho phương trình vi phân Riccati.

Một cách tiếp cận tương tự đã được sử dụng trong các công trình của Basar T. và Bernhard P., trong đó vấn đề kiểm soát rời rạc - tối ưu của một nhà máy liên tục được xem xét theo quan điểm của lý thuyết trò chơi. Các điều kiện cho sự tồn tại của% ^ - bộ điều khiển tối ưu được xây dựng trong trường hợp trạng thái đo của một đối tượng theo phương trình Riccati khác biệt, và quy trình tổng hợp các bộ điều khiển đó cũng dựa trên việc giải một bài toán giá trị biên phi tuyến.

Một cách tiếp cận khác dựa trên việc sử dụng phương pháp nâng, trong đó hệ thống liên tục ban đầu được chuyển đổi thành một hệ thống rời rạc tương đương (Bamieh B.A., Pearson J.B., Chen T., Francis B.A., Tadmor G., Sagfors M.F., Toivonen H.T., Lall S., Dullerud G., v.v.). Đồng thời, vì giữa các thời điểm quan sát, nhiễu loạn bên ngoài, cũng như đầu ra mục tiêu của đối tượng ban đầu, là các hàm liên tục từng phần, nhiễu loạn và đầu ra mục tiêu của hệ thống rời rạc tương đương đã thuộc về vô hạn.

không gian chiều. Trong các công trình này, việc tổng hợp các bộ điều khiển tối ưu dựa trên giải pháp tuần tự (lặp lại) của phương trình Riccati đại số hoặc tuần hoàn, tùy thuộc vào tham số phụ được tối thiểu hóa. Việc thực hiện thủ tục này trong thực tế dẫn đến những khó khăn về tính toán.

Cuối cùng, trong các tác phẩm của Yu.V. Các điều kiện cho sự tồn tại của-điều khiển được xây dựng dưới dạng điều kiện đủ dưới dạng bất đẳng thức ma trận tuyến tính.

Một trong những thiếu sót đáng kể của lý thuyết-điều khiển là giả định rằng tại thời điểm ban đầu của thời gian đối tượng đang ở trạng thái nghỉ, tức là trạng thái ban đầu của nó bằng không. Nếu yêu cầu này không được đáp ứng, thì bộ điều khiển tổng hợp sẽ triệt tiêu tốt các nhiễu bên ngoài, nhưng không phải lúc nào cũng đáp ứng đầy đủ nhiệm vụ làm giảm các nhiễu ban đầu được tạo ra bởi các điều kiện ban đầu khác. Trong trường hợp này, một -norm tổng quát được đề xuất như một tiêu chí duy nhất có tính đến ảnh hưởng của cả những xáo trộn bên ngoài và ban đầu (Khargonekar P.P., Nagpal K.M. và Poolla K.R.). Chuẩn này trùng với -norm cổ điển, nếu tại thời điểm ban đầu của thời gian đối tượng ở trạng thái nghỉ và khi trạng thái ban đầu của đối tượng là khác không và không có nhiễu động bên ngoài, thì -norm tổng quát trùng với 0 - định mức được xác định trong các tác phẩm của Balandin D.V. và Kogan M.M. Đối với các đối tượng liên tục với đầu ra có thể đo liên tục, luật điều khiển và lọc liên tục được tổng hợp trong các công trình của Khargonekar P.P., Nagpal K.M., Balandin D.V., Kogan M.M. Trong trường hợp một đối tượng liên tục có đầu ra rời rạc, công trình của Sun W., Nagpal K.M. và Khargonekar P.P., trong đó lời giải của bài toán điều khiển tổng quát rời rạc đã thu được cho một vật thể trên đường chân trời vô hạn. Trong trường hợp này, các luật điều khiển và lọc được xây dựng dựa trên nghiệm của phương trình vi phân Riccati phi tuyến tính, điều này gây khó khăn cho việc sử dụng chúng. Vì vậy, việc phát triển thêm lý thuyết điều khiển tổng quát rời rạc của các hệ thống liên tục là một nhiệm vụ hết sức cấp thiết của lý thuyết điều khiển.

Mục đích của luận văn. Mục tiêu chính của công trình là phát triển lý thuyết về điều khiển và lọc tổng quát rời rạc cho các hệ thống liên tục tuyến tính. Phù hợp với mục tiêu, luận văn hướng tới giải quyết các vấn đề sau:

Đối với các vật thể không đứng yên tuyến tính trong một khoảng thời gian hữu hạn, nhận được các điều kiện để tồn tại và phương trình của luật điều khiển tối ưu tổng quát rời rạc trong loại phản hồi trạng thái không tĩnh tuyến tính và trong loại động lực toàn phần không đứng yên tuyến tính. bộ điều khiển ở đầu ra.

Đối với các đối tượng đứng yên tuyến tính trong một khoảng thời gian vô hạn, hãy thu thập các điều kiện tồn tại và phương trình của luật điều khiển tối ưu tổng quát rời rạc trong loại phản hồi trạng thái tĩnh tuyến tính và trong loại bộ điều khiển bậc đầy đủ động tĩnh tuyến tính ở đầu ra.

Đối với các vật thể không đứng yên tuyến tính trong một khoảng thời gian hữu hạn, hãy lấy các điều kiện để tồn tại và phương trình của các bộ lọc bậc đầy đủ tổng quát-tối ưu không cố định rời rạc dưới dạng một quan sát viên.

Đối với các vật thể đứng yên trong một khoảng thời gian hữu hạn, hãy thu thập các điều kiện tồn tại và phương trình cho các bộ lọc bậc đầy đủ tổng quát-tối ưu ở dạng đứng yên rời rạc dưới dạng một quan sát viên.

Phương pháp nghiên cứu. Bài báo sử dụng các phương pháp tính toán các biến thiên và điều khiển tối ưu, lý thuyết về tối ưu hóa lồi và đặc biệt là lý thuyết về lập trình bán xác định.

Tính mới khoa học và kết quả chính. Trong luận án, các kết quả mới sau đây về lý thuyết điều khiển và lọc tổng quát rời rạc bằng các đối tượng liên tục tuyến tính đã thu được:

Nó được chỉ ra rằng -norm tổng quát của một nhà máy tuyến tính không cố định trong một khoảng thời gian hữu hạn được tìm thấy như một lời giải cho bài toán giá trị biên phi tuyến đối với một phương trình Riccati vi phân hoặc sai phân ma trận, cũng như trong các bất đẳng thức ma trận tuyến tính. Trong trường hợp một đối tượng đứng yên tuyến tính trong một khoảng thời gian vô hạn, -norm tổng quát được tìm thấy như một nghiệm cho phương trình Riccati đại số rời rạc hoặc dưới dạng bất đẳng thức ma trận tuyến tính (tương ứng với đoạn 6 của hộ chiếu đặc biệt 01.01.09) .

Đối với các vật thể thẳng không đứng yên trong một khoảng thời gian hữu hạn thì cần có các điều kiện cần và đủ, còn đối với trạng thái không đo được thì chỉ cần các điều kiện đủ để tồn tại các luật điều khiển tối ưu tổng quát rời rạc. Các luật điều khiển này được tổng hợp trong loại phản hồi trạng thái không tĩnh tuyến tính và trong loại bộ điều khiển đầu ra động không tĩnh tuyến tính (tương ứng với đoạn 6 của hộ chiếu đặc biệt 01.01.09).

Đối với các vật thể đứng yên trong một khoảng thời gian vô hạn, các điều kiện cần và đủ cho sự tồn tại của luật điều khiển tối ưu tổng quát rời rạc. Các luật điều khiển này được tổng hợp trong loại phản hồi trạng thái tĩnh tuyến tính và trong loại bộ điều khiển đầu ra động tĩnh tuyến tính (tương ứng với đoạn 6 của hộ chiếu đặc biệt 01.01.09).

Đối với các vật thể không đứng yên tuyến tính trong một khoảng thời gian hữu hạn (vô hạn), các điều kiện cần và đủ cho sự tồn tại thu được và tổng hợp các bộ lọc tối ưu tổng quát "H ^-tối ưu có bậc đầy đủ ở dạng một người quan sát được thực hiện

Như các ứng dụng, khái quát rời rạc Ti ^- bộ điều khiển tối ưu trong bài toán điều khiển cơ thể trong hệ thống treo điện từ và bộ lọc tổng quát rời rạc ^ - bộ lọc tối ưu trong bài toán chống rung của các tòa nhà và công trình cao tầng (tương ứng với đoạn 6 của hộ chiếu chuyên khoa 01.01.09).

Tuân thủ mã của chuyên khoa. Công trình tương ứng với công thức của chuyên ngành 01.01.09 - Toán học rời rạc và Điều khiển học toán học và bao gồm các lĩnh vực nghiên cứu sau đây có trong chuyên ngành 01.01.09: trang 6. Lý thuyết toán học về điều khiển tối ưu.

Ý nghĩa lý luận và thực tiễn. Công việc này mang tính chất lý thuyết và đại diện cho sự phát triển của lý thuyết tổng quát hóa rời rạc "H ^ điều khiển tối ưu của các đối tượng liên tục. vấn đề điều khiển hệ thống treo điện từ và tổng hợp các bộ lọc trong bài toán dao động tắt dần của các tòa nhà và công trình cao tầng.

Mức độ tin cậy và tán thành kết quả của nghiên cứu. Các kết quả chính của luận án đã được thảo luận tại cuộc họp của hội thảo khoa học Nizhny Novgorod “Mô hình toán học về động lực học của các hệ thống và quá trình điều khiển” tại Viện Nghiên cứu Ứng dụng Toán học và Điều khiển học, đồng thời cũng được báo cáo tại các cuộc họp quốc tế sau đây và tất cả -Các hội nghị của Nga:

Hội nghị khoa học toàn Nga lần thứ X “Dao động phi tuyến của các hệ cơ” mang tên V.I. Yu.I. Neimark (Nizhny Novgorod, 2016);

Hội nghị quốc tế lần thứ XIII “Tính ổn định và dao động của các hệ thống điều khiển phi tuyến” (Pyatnitsky conference) (Moscow, 2016);

Đại hội toàn Nga lần thứ XI về các vấn đề cơ bản của cơ học lý thuyết và ứng dụng (Kazan, 2015);

Hội nghị quốc tế về lý thuyết và cơ học điều khiển toán học (Suzdal, 2015);

Trường hè dành cho thanh niên toàn Nga truyền thống lần thứ sáu "Quản lý, Thông tin và Tối ưu hóa" (Moscow, 2014);

Hội nghị toàn Nga lần thứ XII về các vấn đề quản lý (Moscow, 2014);

Phiên Nizhny Novgorod lần thứ XIX của các nhà khoa học trẻ: Khoa học tự nhiên và toán học (Nizhny Novgorod, 2014).

Trong năm 2013-2014 và 2014-2015 Nghiên cứu được hỗ trợ bởi một học bổng mang tên Viện sĩ G.A. Razuvaev dành cho nghiên cứu sinh, cũng như học bổng của Chính phủ Liên bang Nga (2014-2015).

Kết quả của 3 chương đầu của luận án thu được trong quá trình thực hiện đề tài số 14-01-31120 mol_a năm 2014-2015. (đứng đầu) và các dự án số 12-01-31358 mol_a năm 2012-2013, số 14-01-00266 năm 2014-2016. (người thực hiện), được thực hiện với sự hỗ trợ tài chính của Quỹ Nghiên cứu Cơ bản của Nga.

Kết quả của chương thứ tư thu được với sự hỗ trợ tài chính của Bộ Giáo dục và Khoa học Liên bang Nga trong khuôn khổ Chương trình Mục tiêu Liên bang "Nghiên cứu và Phát triển trong các lĩnh vực ưu tiên phát triển của Tổ hợp Khoa học và Công nghệ Nga cho năm 2014 -2020 "(thỏa thuận 14.578.21.0110 ngày 27/10/2015, định danh duy nhất RFMEFI57815X0110).

Các ấn phẩm. Các kết quả chính về chủ đề của luận án được trình bày trong 10 ấn phẩm, trong đó có 4 ấn phẩm trên các tạp chí khoa học hàng đầu do Ủy ban Chứng nhận cấp cao của Bộ Giáo dục và Khoa học Liên bang Nga giới thiệu -], kỷ yếu của hai hội thảo quốc tế và bốn tóm tắt các báo cáo của các hội nghị khu vực và toàn Nga [-. Trong công việc chung] tác giả sở hữu kết quả của mô phỏng số.

Đóng góp cá nhân của người nộp đơn. Tất cả các nghiên cứu trình bày trong luận án đều do cá nhân ứng viên thực hiện trong quá trình hoạt động khoa học. Trong số các ấn phẩm chung, chỉ tài liệu trực tiếp thuộc về người nộp đơn mới được đưa vào luận án.

Cơ cấu và phạm vi công việc. Luận án gồm có phần mở đầu, 4 chương, phần kết luận và danh mục tài liệu tham khảo. Tác phẩm được trình bày trên 123 trang, gồm 11 hình ảnh minh họa. Thư mục bao gồm 81 đầu sách.

Tổng hợp-kiểm soát tổng hợp

Trong lý thuyết về% oc-control tổng quát, một đối tượng có thể điều khiển tuyến tính được coi là đối tượng chịu tác động bên ngoài và nhiễu loạn ban đầu được tạo ra bởi các điều kiện ban đầu không xác định. Nếu đối tượng đang ở trạng thái nghỉ tại thời điểm ban đầu, tức là nhiễu loạn ban đầu bằng 0, thì mức độ triệt tiêu nhiễu loạn bên ngoài, trùng với chuẩn mực, được coi là thước đo ảnh hưởng. của ảnh hưởng bên ngoài đối với đối tượng đang được xem xét, và vấn đề thiết kế một điều khiển giảm thiểu tiêu chí này là bài toán điều khiển tối ưu H. Ngược lại, khi trạng thái ban đầu là khác 0 và không có nhiễu động bên ngoài, số đo phản ứng của hệ thống được hiểu là mức độ suy giảm của nhiễu loạn ban đầu, bằng với tiêu chuẩn 70. Trong trường hợp này, luật điều khiển tối ưu hóa quá trình nhất thời trong trường hợp xấu nhất được gọi là tối ưu 7o. Trong trường hợp chung, các tiêu chí này mâu thuẫn nhau; do đó, mục tiêu chính của% oc-control tổng quát là xác định luật kiểm soát, sẽ là một thỏa hiệp khi đánh giá ảnh hưởng của cả những nhiễu loạn bên ngoài và ban đầu.

Bây giờ chúng tôi trình bày các sự kiện chính liên quan đến Hoo-chuẩn khái quát, trong khi trong phần trình bày, chúng tôi sẽ theo dõi các tác phẩm. Để xác định tính xác định, hãy xem xét một vật thể không đứng yên rời rạc tuyến tính có dạng Xk + i = Axk + Bkvk, k = 0, ..., N-l, zk = Ckxk + Dkvk, trong đó - nhiễu loạn bên ngoài, N-l t giới hạn trong 2 chuẩn : vk vk oo.fc = 0

Chúng ta hãy giả sử rằng, trong trường hợp chung, trạng thái ban đầu x0 là khác không và không xác định, và ảnh hưởng của nó đối với động lực của đối tượng được hiểu là một nhiễu loạn ban đầu.

Đầu ra được kiểm soát của nhà máy đối với trạng thái ban đầu cố định x0 và chuỗi nhiễu loạn v0, ..., vN_ i sẽ được đặc trưng bởi giá trị của hàm N-1 j (x0, v0, ..., vN_ij = \ \ z \\ i2 + xNSxN = Y zk zk - \ - xNSxN, (1.2) fc = 0 trong đó S = S 0 là ma trận trọng số đặt mức độ ưu tiên giữa chất lượng của quá trình chuyển đổi và trạng thái cuối cùng của đối tượng.

Đầu tiên, chúng ta xem xét riêng biệt hai trường hợp cực đoan: chỉ có sự nhiễu loạn ban đầu hoặc duy nhất bên ngoài tác động lên đối tượng. Để đối tượng ở trạng thái nghỉ tại thời điểm ban đầu, tương ứng với trường hợp không có nhiễu động ban đầu. Sau đây, chúng tôi xác định chỉ số về ảnh hưởng của nhiễu bên ngoài đối với đầu ra mục tiêu (1.1) - mức độ triệt tiêu nhiễu bên ngoài - là giá trị tương đối của hàm (1.2) trong trường hợp xấu nhất: J (0, VO,. .., VN_1) 2 = sup 2 0 2

Lưu ý rằng nếu đối tượng (1.1) đứng yên và được xem xét trong một khoảng thời gian vô hạn, thì bằng cách sử dụng đẳng thức Parseval, chúng ta có thể chỉ ra rằng biểu thức (1.3) trùng với 7 chuẩn của đối tượng được xét. Phát biểu sau đây mô tả mức độ triệt tiêu của nhiễu bên ngoài về các nghiệm của bất phương trình ma trận tuyến tính.

Câu lệnh 1.1. Mức độ triệt tiêu nhiễu loạn bên ngoài trong hệ (1.1) thỏa mãn bất đẳng thức 7oo 7 trong một khoảng thời gian hữu hạn nếu và chỉ khi bất đẳng thức ma trận tuyến tính / AlXk + 1Ak - Xk AjXk + lBk Ck \ i) 0, (1.4) là có thể giải được đối với các ma trận Xk = Xk 0, k = 0, ..., N - 1, với XN = S.

Điều này xuất phát từ việc khẳng định rằng mức độ triệt tiêu nhiễu loạn bên ngoài 7oo được tìm thấy như là nguyên tố nhỏ nhất của tập hợp tất cả 7 mà hệ bất đẳng thức ma trận tuyến tính (1.4) có thể giải được đối với ma trận Xk = Xk 0 và 7.

Nếu không có nhiễu loạn bên ngoài, thì ảnh hưởng của nhiễu loạn ban đầu đến chất lượng của quá trình nhất thời trong hệ thống (1.1) có thể được đặc trưng bởi đại lượng 2 J (x0,0, ..., 0) 70 = sup 2 ( 1,5) được gọi là mức tắt dần của nhiễu động ban đầu. B cho thấy rằng giá trị này có thể được tìm thấy như một lời giải cho một bài toán tối ưu hóa với các ràng buộc được đưa ra bởi các bất đẳng thức ma trận tuyến tính.

Câu lệnh 1.2. Mức độ triệt tiêu nhiễu loạn ban đầu trong hệ (1.1) trong một khoảng thời gian hữu hạn thỏa mãn bất đẳng thức 70 7 nếu và chỉ khi các bất đẳng thức ma trận tuyến tính ATkXk + 1Ak -Xk + ClCk 0, X0 -f2I, (1.6) có thể giải được với đối với ma trận k = 0, ..., N - 1, cho XN = S. Để mô tả ảnh hưởng chung của nhiễu bên ngoài và nhiễu ban đầu đối với sản lượng của nhà máy (1.1), chúng tôi xác định mức triệt tiêu nhiễu như một loại tích của hai thừa số đã xét: 7W = sup

Jx0, v0,. . . , VN_1 = F, (1.7) trong đó R = R 0 là ma trận trọng số được thiết kế để đặt mức độ ưu tiên giữa nhiễu bên ngoài và các thành phần của trạng thái ban đầu. Số mũ được giới thiệu theo cách này được gọi là 7 định mức tổng quát. Dễ dàng thấy rằng trong các trường hợp cực đoan, biểu thức (1.7) trở thành (1.3) hoặc (1.5), nghĩa là, với x0 = 0, chúng ta có 7w = 7oo, và với v = 0, chúng ta nhận được -). Hóa ra mức độ triệt tiêu nhiễu loạn có thể được biểu thị dưới dạng bất đẳng thức ma trận tuyến tính; đối với điều này, nó đủ để yêu cầu sự tồn tại của một nghiệm tổng quát của các bất đẳng thức (1.4) và (1.6), đặc trưng riêng cho mức độ triệt tiêu của nhiễu loạn bên ngoài và mức độ suy giảm của nhiễu loạn ban đầu, có tính đến hệ số trọng lượng.

Mức độ nhiễu loạn tắt dần trong hệ (1.1) trong một khoảng thời gian hữu hạn thỏa mãn bất đẳng thức 7w 7 khi và chỉ khi bất đẳng thức ma trận tuyến tính (A.

Những xáo trộn bên ngoài tồi tệ nhất và trạng thái ban đầu trong một nhà máy liên tục rời rạc

Chúng ta lưu ý rằng, theo định lý đã xây dựng, mức độ tắt dần của nhiễu loạn 7С với sự trợ giúp của quan hệ (2.45) được biểu thị theo giá trị của hàm ma trận X (t). Tuy nhiên, do phương trình (2.6a), đại lượng X (t) mặc nhiên phụ thuộc vào y. Kết quả là, để xác định mức độ giảm nhiễu nhiễu, một vấn đề giá trị biên phi tuyến nảy sinh cho phương trình vi phân Riccati ma trận: tìm nghiệm cho phương trình (2.6a) với các điều kiện biên (2.6b) và (2.45), cũng như điều kiện (2.6d).

Bây giờ chúng ta hãy chuyển sang phần chứng minh của định lý.

Chứng minh Định lý 2.2. Dễ dàng chỉ ra rằng quan hệ (2.4) tương đương với đẳng thức sup J (xo, v, w) = 0. (2.48) Иі! 2 + ІНІ2 2 + 0Д 0 = і Theo công thức (2.39), hàm J (x0, v, w) có thể được viết như sau: J (x0, v, w) = xUcJC0 + X (t0) -% R) X0% \\ v - v \\ l2 + N-l + J2 (wk w k ) T (AjX (tk) Ak -% l) (wk - w k) + fc = l + wN - w N (AdgbAdg - 7C- (wN - w N c) và (2.6e), số hạng đầu tiên không phải là xác định dương, và các số hạng còn lại là dạng bậc hai xác định âm, vì vậy giá trị lớn nhất của hàm J (x0, v, w) biến mất tại v = v và wk = w k, k = 1, ..., N, và lựa chọn tương ứng của x0. Do đó, nhiễu loạn v và wl là nhiễu loạn bên ngoài tồi tệ nhất đối với tiêu chí 7c. Hãy thay v và w k vào quan hệ (2.48), sau đó: sup J (x0, v, w) = sup xUx (t0) + CjC0 - fcR) x0. \\ v \\ L + \\ v \\ 2 + x0R 0 = l ll «llL + lh ll2 + ftr0 = l Bây giờ chúng ta lưu ý rằng và và phụ thuộc vào 0 và các quan hệ quan hệ: v (t) = b1B (t) X (t) b (t, t0) x0, / -r- \ -1 -r w k = - (AjX (tk) Ak - 7c AjX (t (tk - 0, t0) x0, ở đây Ф (Mo) là ma trận cơ bản của các nghiệm của hệ đóng (2.115). Do đó, ràng buộc là dạng bậc hai trong x0: \\ v \\ l2 + \\ w \\ l + xUxo = x Qx0 = l, trong đó tN Q = R + 1-2 (t) W (t) X ( t) F (t, i0) (it + "o N + fc = l J2 fT (- 0, t0) X (tk) Ak (AlX (tk) Ak - 7cL \ іX (ik) Ф (ік - 0, t0) Như vậy, bài toán (2.48) được rút gọn như sau: sup x0 PIKO = 1 Xo (x (t0) + C0TC0 - 7ci? W

Để giải bài toán cuối cùng, chúng ta sử dụng quy tắc nhân Lagrange: điểm cực đại x0 phải thỏa mãn hệ phương trình: phương trình thứ nhất là (X (t0) + CQ С0 + / іП) х0 = lcRxo, khi đó ta tìm được хо = «Emax (R 1 \ x (t0) + CjC0 + ц Ы V 7с = Амах (і? -1 [х (0) + С0ТСo + / х fil V giá trị của a được tìm thấy từ phương trình thứ hai (2.49)) các giá trị được tìm thấy ở dạng bậc hai và đơn giản hóa: theo điều kiện, giới hạn trên chính xác bằng 0, do đó / i = 0. Thay giá trị tìm được / i vào biểu thức cho x0, chúng ta đi đến quan hệ (2.45) và (2,46c).

Chúng ta hãy xây dựng và chứng minh một số hệ quả trả lời cho câu hỏi về các nhiễu loạn tồi tệ nhất được áp dụng cho các mức độ triệt tiêu của nhiễu loạn ban đầu C, nhiễu loạn bên ngoài liên tục c, nhiễu loạn bên ngoài rời rạc Г và mức độ triệt tiêu các nhiễu loạn bên ngoài hỗn hợp c w.

Hệ quả 2.5. Ở nhà máy (2.1), (2.2) và (2.3), mức độ giảm nhiễu ban đầu c = max (J0 + (0)) (2.50) đạt được ở trạng thái ban đầu xấu nhất = max (J0 + (0) ], (2.51) trong đó () là nghiệm của hệ (2.41) được tìm thấy ở c. Chứng minh Vì cây không bị ảnh hưởng bởi nhiễu động bên ngoài liên tục hoặc rời rạc, quan hệ (2.51) nhận được từ quan hệ (2.46) nếu chúng ta đặt sau =, () = 0 và k = 0, = 1, ..., Hệ quả 2.6 Trong nhà máy (2.1), (2.2), và (2.3), mức độ ngăn chặn các nhiễu động liên tục bên ngoài ї = max (J0 + (0)) (2.52) đạt được tại nhiễu loạn bên ngoài tồi tệ nhất () = ") 1T () () (), (2.53) trong đó () là nghiệm của hệ (2.42) được tìm thấy tại s.

Bằng chứng. Quan hệ (2.53) thu được từ quan hệ (2.46) nếu chúng ta đặt k = 0, = 1, ... ở quan hệ sau, tương đương với thực tế là nhiễu loạn bên ngoài rời rạc không tác động lên đối tượng, và do không có nhiễu loạn ban đầu, cần phải loại bỏ điều kiện (2.46 c) và đặt = trong quan hệ (2.45).

Hệ quả 2.7. Trong đối tượng (2.1), (2.2) và (2.3), mức độ giảm thiểu nhiễu loạn bên ngoài rời rạc c = max (j 0 + (0)) (2.54) đạt được với nhiễu loạn bên ngoài tồi tệ nhất / -r- \ -1 -r k = - (j (k) k - c ") j (k) (k - 0), (2.55) trong đó () là nghiệm của phương trình (2.43) với các điều kiện (2.6b) và (2.6d) tìm được cho c " Bằng chứng. Vì đối tượng không bị ảnh hưởng bởi nhiễu động bên ngoài liên tục, nên quan hệ (2.55) nhận được từ quan hệ (2.46) nếu chúng ta đặt B (i) = 0 ở sau và do không có nhiễu ban đầu, điều kiện (2.46 c) phải được loại bỏ và chúng ta đặt R = I trong quan hệ (2.45). Hệ quả 2.8. Trong nhà máy (2.1), (2.2) và (2.3), mức độ giảm thiểu nhiễu loạn hỗn hợp bên ngoài lT = Amax (cJC0 + X (t0)) (2.56) đạt được đối với nhiễu loạn bên ngoài tồi tệ nhất - fc wl \ AjX (tk ) x (tk-0), (2.57a) v (t) = (w) 1BT (t) X (t) x (t), (2.57b) trong đó X (i) - nghiệm của hệ (2.6a) , (2.6b) và (2.6d) được tìm thấy cho% w Bằng chứng Vì cây trồng không bị ảnh hưởng bởi sự nhiễu loạn ban đầu, do đó, loại bỏ điều kiện (2.46c) trong quan hệ (2.46) và đặt R = І trong công thức (2.45), chúng ta thu được các quan hệ (2,57).

Chúng ta lưu ý một lần nữa rằng Định lý 2.2 và các hệ quả của nó cho phép chúng ta giảm việc tính toán các mức giảm nhiễu nhiễu tương ứng thành lời giải của bài toán giá trị biên phi tuyến. Sau đó có thể được giải quyết bằng các phương pháp số khác nhau, ví dụ, bằng cách lặp lại đơn giản. Hãy để chúng tôi mô tả ngắn gọn ứng dụng của phương pháp này bằng cách sử dụng ví dụ tính toán mức giảm nhiễu nhiễu loạn 7c. Chúng tôi chọn một số giá trị ban đầu đủ lớn 7 và giải bài toán (2.6b), (2.6a) và (2.6d). Tiếp theo, sử dụng công thức (2.45), chúng tôi tính giá trị gần đúng tiếp theo cho 7c. Chúng tôi sẽ lặp lại quy trình này cho đến khi sự khác biệt giữa hai giá trị tìm được liền kề trở nên nhỏ hơn một số dương nhỏ được chỉ định trước. Một trong những hạn chế đáng kể của phương pháp đã đề cập, ngoài việc có thể thiếu sự hội tụ của chuỗi các phép gần đúng được tạo ra, là sự cần thiết phải giải một phương trình vi phân ma trận ở mỗi bước. Điều này có thể được loại bỏ bằng cách chuyển từ mô hình rời rạc liên tục sang mô hình rời rạc. Phần tiếp theo được dành cho việc thực hiện ý tưởng này.

Tổng hợp kiểm soát đầu ra tối ưu

Chúng tôi nhóm các số hạng đầu tiên và thứ hai trong (2.105) và đơn giản hóa biểu thức cho P2, chúng tôi áp dụng lại công thức Sherman-Morrison-Woodbury, sau đó: + lXk + l (I - Ek + 1 \ k-IgEtk + 1Xk + 1) Ek + 1] kC GTk + lCk = -g / -g \ -1 -g = CTkGk + l (Wk + l - ETk + lXk + lEk + l) GTk + lCk và P2 = ATkXk + l l - Ek + l, ma trận S được tạo thành, ví dụ, theo công thức

Định lý 3.4 cũng cho phép người ta tổng hợp điều khiển đầu ra tối ưu ft tổng quát trong một khoảng thời gian vô hạn. Để làm được điều này, chỉ cần tìm một lời giải cho bài toán tối thiểu hóa 7c () theo các ràng buộc được đưa ra bởi các bất đẳng thức (3.51), sau đó bộ điều khiển tối ưu được tìm thấy như một lời giải cho (3.52).

Cuối cùng, trong phần kết luận của phần này, chúng tôi trình bày mà không có bằng chứng về các hệ quả từ Định lý 3.4, định lý này thiết lập các điều kiện cần và đủ cho sự tồn tại của điều khiển 70 và Pse đối với đầu ra của một nhà máy đứng yên trên một đường chân trời vô hạn.

Hệ quả 3.13. Đối với nhà máy tĩnh (3.21), (3.22), với 7 0 cho trước, tồn tại điều khiển đầu ra rời rạc trong khoảng thời gian vô hạn nếu và chỉ khi bất đẳng thức ma trận tuyến tính Ah, XAh 0, С1 AhYAl Y C1YAl (Wc2 0 0 II МТ X I C1YCj WC 0 0 I M 0, (3.53a) (3.53b) x l Y 0, X yl, (3.53c) có thể giải được đối với X = X 0, Y = Y 0 và các cột của ma trận Wr KJ 2 và M lần lượt tạo thành cơ sở của các nhân ma trận.

Hệ quả 3.14. Đối với một nhà máy tĩnh (3.21), (3.22) trong một khoảng thời gian vô hạn, tồn tại một điều khiển đầu ra AND rời rạc cung cấp khả năng ngăn chặn các nhiễu động bên ngoài liên tục với 7 0 cho trước nếu và chỉ khi các bất đẳng thức ma trận tuyến tính và bất đẳng thức thứ nhất ( 3.51c) có thể giải được đối với X \ u003d X O, Y \ u003d Y O và các cột của ma trận Wr và M tạo thành cơ sở của không gian ket Co và ket [B .. D-,), tương ứng.

Hệ quả 3.15. Đối với một nhà máy tĩnh (3.21), (3.22) trong một khoảng thời gian vô hạn, có một điều khiển đầu ra AND rời rạc cung cấp việc giảm nhiễu loạn bên ngoài rời rạc với 7 O cho trước, nếu và chỉ khi có ma trận X = X O, Y = Y O, thỏa mãn bất đẳng thức ma trận tuyến tính và bất đẳng thức thứ nhất trong (3.51c), trong khi các cột của ma trận N và M tạo thành cơ sở của không gian ker (C2 D2j và ker [B và Dx), tương ứng. Hệ quả 3.16. Đối với một nhà máy tĩnh (3.21), (3.22) trong một khoảng thời gian vô hạn, tồn tại một điều khiển AND rời rạc trên đầu ra, đảm bảo giảm thiểu các nhiễu loạn bên ngoài hỗn hợp với 7 0 cho trước nếu và chỉ khi bất đẳng thức ma trận tuyến tính ( 3.51a), (3.51b) và bất đẳng thức thứ nhất (3.51c) có thể giải được đối với các ma trận XT = X 0 và Y = Y 0, trong khi các cột của ma trận N và M tạo thành cơ sở của các khoảng trống ker C2 0 D2 0 và ker B1 Dj 0 0 tương ứng.

Theo nhận xét của Định lý 2.8 rằng tồn tại một ma trận hữu hạn R sao cho, với bất kỳ hệ số trọng số R R nào, bộ điều khiển đầu ra tối ưu H tổng quát trong một khoảng thời gian vô hạn trùng với // - bộ điều khiển đầu ra tối ưu được tổng hợp bởi Hệ quả 3.16 và cung cấp sự ngăn chặn các nhiễu bên ngoài hỗn hợp. Do đó, để có được một thỏa hiệp thực sự khi tính đến ảnh hưởng của cả nhiễu động ban đầu và bên ngoài, ma trận trọng số R phải thỏa mãn điều kiện Atax (L_1L) І. Về mặt số học, giá trị biên R của ma trận trọng số được xác định như sau: brx y1, trong đó X biểu thị ma trận thỏa mãn các bất đẳng thức (3.51a), (3.51b) và bất đẳng thức thứ nhất (3.51c) với giá trị nhỏ nhất là 7c.

Hãy xem xét một trong những hiển thị trong Hình. 3.3 một hệ thống cơ học bao gồm một vật thể lơ lửng khối lượng m và một nam châm điện. Sự bay của cơ thể được tạo ra bởi sự thay đổi trong từ trường, xảy ra do sự thay đổi điện áp U đặt vào cuộn dây của nam châm điện. Động lực học của một hệ thống treo từ trường đơn giản tuân theo hai phương trình: ti) = F - ta, (3.56) V + RI = U. Phương trình đầu tiên (3.56) biểu thị định luật thứ hai của Newton và xác định sự thay đổi tọa độ s của vật thể lơ lửng dưới tác dụng của trọng lực td và lực F từ mặt bên của nam châm điện, và phương trình thứ hai xác định sự thay đổi cường độ dòng điện / trong mạch nam châm điện có điện trở R khi hiệu điện thế U đặt vào nó thay đổi và biểu diễn định luật Kirchhoff đối với mạch điện của nam châm điện. F biểu thị liên kết từ thông của cuộn dây nam châm điện, F = pF, trong đó F là từ thông đi qua một vòng và n là số vòng trong cuộn dây.

Liên kết từ thông Ф và cường độ dòng điện / trong mạch nam châm điện có quan hệ với nhau bởi: = L (s) /, L (s) =, CL = / i0n2A / 2, (3.57) - giá trị của khe hở danh nghĩa giữa nam châm điện và cơ thể lơ lửng. Nếu chúng ta biểu thị điện cảm danh định là L0 \ u003d L (0), thì C \ u003d L05, sau đó

Trong phần này, chúng tôi xem xét một dạng rời rạc của thuật toán không chệch tuyến tính cung cấp sai số bình phương trung bình tối thiểu, giả sử rằng mô hình thông báo được đưa ra bởi một phương trình sai lệch vectơ tuyến tính

trong đó tiếng ồn đầu vào (hoặc tiếng ồn thực vật) là tiếng ồn trắng với ma trận hiệp phương sai và giá trị trung bình bằng 0

Mô hình quan sát hoặc đo lường được đưa ra bởi một quan hệ đại số tuyến tính

. (7.3)

trong đó tiếng ồn đo v bằng 0 có nghĩa là tiếng ồn trắng và

. (7.4)

Để đơn giản hóa các tính toán ban đầu, chúng tôi giả định rằng và không có liên quan, tức là

Đối với tất cả, (7,5)

Giá trị ban đầu đại diện cho một biến ngẫu nhiên có giá trị trung bình và phương sai, nói cách khác

; . (7.6)

Chúng tôi cũng sẽ giả định điều đó cho tất cả.

Hãy tìm một ước lượng của đại lượng từ tập hợp các quan sát liên tiếp. Hãy biểu thị ước tính này bằng và sai số ước tính - bằng

Tùy thuộc vào mối quan hệ giữa các đại lượng và ước lượng được gọi là dự đoán hoặc ngoại suy, lọc hoặc làm mịn và cuối cùng là nội suy. Sự phân chia như vậy có thể hiểu được bằng trực giác, vì, ví dụ, dự đoán có nghĩa là ước tính trạng thái ở thời điểm thứ, dựa trên tất cả các quan sát cho đến thời điểm thứ. Trong chương này, chúng ta sẽ chủ yếu xem xét vấn đề lọc, trong khi dự đoán và nội suy sẽ được tìm hiểu trong chương tiếp theo.

Ước tính sẽ không thiên vị có điều kiện và vô điều kiện, tức là, và cũng sẽ là một hàm tuyến tính của chuỗi các quan sát. Từ tập hợp các thuật toán ước tính không chệch tuyến tính có thể có, chúng tôi chỉ chọn một thuật toán cung cấp phương sai sai số tối thiểu, tức là phương sai cho hoặc tối thiểu.

Trong chương trước, chúng tôi đã thiết lập rằng ước lượng theo tiêu chí sai số tiêu chuẩn tối thiểu trùng với giá trị trung bình có điều kiện của đại lượng đối với một tập hợp quan sát nhất định. Tuy nhiên, nói chung, ngay cả khi các mô hình báo cáo và quan sát là tuyến tính (chúng dành cho bài toán được xây dựng ở đây), giá trị trung bình có điều kiện không phải là một hàm tuyến tính của các quan sát, do đó thuật toán ước lượng không có thuộc tính tuyến tính mong muốn.

Để có được một thuật toán ước lượng tuyến tính cung cấp phương sai sai số tối thiểu, chúng ta phải sử dụng một trong hai cách tiếp cận. Một là xác định giá trị trung bình có điều kiện đại diện cho một hình dạng tuyến tính và sau đó tìm sự phù hợp nhất cho hình dạng đó. Cách tiếp cận này dựa trên việc sử dụng phép chiếu trực giao. Một cách tiếp cận khác dựa trên giả định rằng các biến ngẫu nhiên và đều bình thường. Bằng những gì đã được chứng minh trong Chap. 4 tính chất của hệ tuyến tính không thay đổi luật phân phối chuẩn, trung bình có điều kiện chính xác trong trường hợp này sẽ là dạng tuyến tính. Công cụ ước lượng tuyến tính phương sai tối thiểu phải bằng công cụ ước lượng phương sai tối thiểu nếu công cụ này thực sự là tuyến tính. Điều này xảy ra nếu chúng ta giả định luật phân phối chuẩn.

Lưu ý rằng nếu chúng ta yêu cầu thuật toán ước lượng là tuyến tính, thì luật phân phối thực tế của các đại lượng, và không quan trọng. Tuy nhiên, nếu các phân phối thực sự là bình thường, như chúng thường xảy ra, thì giá trị trung bình có điều kiện trên thực tế là một dạng tuyến tính. Nói cách khác, bộ lọc Kalman là bộ lọc tuyến tính tốt nhất (xét về phương sai sai số tối thiểu), bất kể loại phân phối là gì và là thuật toán tốt nhất trong số tất cả các thuật toán ước lượng tuyến tính và phi tuyến có thể có, nếu đối tượng và phép đo gây ồn, cũng như trạng thái ban đầu, có luật phân phối chuẩn.

Khi suy ra phương trình cho bộ lọc Kalman, chúng tôi sẽ giả định và yêu cầu rằng các quan sát được xử lý tuần tự. Bất kể thuật toán ước lượng có tuần tự hay không, các giá trị của ước lượng trạng thái thu được không được điều chỉnh. Tuy nhiên, tính khả thi về mặt tính toán của phương pháp là rất cần thiết. Có lẽ đóng góp đáng kể nhất của Kalman và Bucy là họ là những người đầu tiên đưa ra thuật toán ước lượng phương sai tối thiểu tuyến tính ở dạng nối tiếp bằng cách sử dụng khái niệm biến trạng thái. Vấn đề lọc tuần tự tuyến tính theo tiêu chí phương sai sai số tối thiểu đã được Wiener và các tác giả khác giải quyết từ lâu trong mối quan hệ với các hệ thống có một đầu vào và một đầu ra. Công lao chính của Kalman là ông đã khái quát hóa lý thuyết lọc Wiener cho trường hợp hệ thống đa chiều không tĩnh với các nhận thức nhiễu không tĩnh trong thời gian hữu hạn và thu được lời giải cho bài toán lọc ở dạng lặp lại.

Vì việc trình bày bản chất của vấn đề có phần hơi bị trì hoãn, trước khi tiến hành trực tiếp giải pháp của nó, chúng ta hãy tóm tắt. Chúng ta muốn có được một ước lượng không chệch tuyến tính về trạng thái của một hệ thống động lực học tuyến tính không đứng yên tối ưu về tiêu chí phương sai sai số tối thiểu và bị ảnh hưởng bởi nhiễu trắng với giá trị trung bình bằng 0 và phương sai đã biết.

Để có được một ước tính, chúng tôi quan sát một hàm trạng thái tuyến tính thay đổi theo thời gian dựa trên nền của nhiễu trắng cộng với giá trị trung bình bằng 0 và phương sai đã biết. Trạng thái ban đầu của quá trình là một biến ngẫu nhiên với giá trị trung bình và phương sai đã biết. Không có mối tương quan giữa nhiễu đầu vào và nhiễu đo lường, và bắt buộc phải tìm một thuật toán ước lượng ở dạng lặp lại. Thuật toán lọc Kalman là một giải pháp cho vấn đề này. Khi áp dụng cho các hệ thống rời rạc, chúng tôi xem xét hai cách tiếp cận khác nhau để lấy ra phương trình bộ lọc Kalman, là một minh họa cho hai ý tưởng nêu trên. Trong trường hợp đầu tiên, khi sử dụng phương pháp chiếu trực giao, chúng ta sẽ chọn trước dạng tuyến tính của thuật toán ước lượng và sau đó tìm thuật toán tốt nhất. Trong trường hợp thứ hai, khi ước lượng được thực hiện bởi xác suất posteriori lớn nhất, chúng ta sẽ giả định rằng các biến ngẫu nhiên có luật phân phối chuẩn và tìm ra thuật toán ước lượng tối ưu, thuật toán này thực sự sẽ là tuyến tính. Khi suy ra phương trình lọc, Kalman đã sử dụng một cách tiếp cận dựa trên phương pháp chiếu trực giao, vì vậy chúng ta sẽ bắt đầu phần trình bày với phương pháp này.

trực giaohình chiếu. Lý thuyết về phép chiếu trực giao đã được thảo luận ngắn gọn trong § 6.6. Ở đây, không cần chứng minh, một số khái quát của các kết quả được trình bày ở đó sẽ được trình bày; chúng ta sẽ cần chúng trong tương lai. Ước lượng tuyến tính của đại lượng theo tiêu chí của phương sai sai số tối thiểu cho một không gian tuyến tính nhất định của các quan sát được đưa ra bởi phép chiếu trực giao lên, tức là.

Ở đây, ký hiệu được sử dụng thay vì ước lượng tuyến tính với phương sai nhỏ nhất thường không trùng với kỳ vọng toán học có điều kiện. Nếu chúng ta đã giả định trước rằng các biến ngẫu nhiên có phân phối chuẩn, thì nó sẽ chỉ đơn giản là trùng với; tuy nhiên, chúng tôi đã cố ý chọn một cách tiếp cận khác để nhấn mạnh rằng giả định về phân phối chuẩn là không cần thiết, nếu chúng ta nhớ rằng thuật toán ước lượng kết quả có thể không hoàn toàn là tốt nhất, mà chỉ là tốt nhất trong loại thuật toán tuyến tính. Nếu một chuỗi trực giao tạo thành cơ sở, thì nó có thể được biểu diễn như sau

. (7.8)

Để có được một giải pháp ở dạng lặp lại, chúng ta cần kết quả sau. Nếu là một vector trực giao với, tức là , vì, đâu là cơ sở trực giao, thì

Kết quả này là bổ đề phép chiếu trực giao. Mặc dù chúng tôi sẽ quan tâm đến việc lọc, tức là trước tiên chúng tôi sẽ xem xét dự đoán một bước, tức là. Để có được một nghiệm ở dạng truy hồi yêu cầu, chúng tôi sử dụng nguyên tắc quy nạp toán học. Giả sử điều đó đã biết và đại diện cho thông qua và một quan sát mới. Tuy nhiên, nói chung, không phải là trực giao, và trước khi sử dụng phương trình (7.9), cần phải tìm thành phần quan sát, là thành phần trực giao với. Về cơ bản, nó tập trung vào việc làm nổi bật thông tin mới có trong.

Dễ dàng chỉ ra rằng vectơ

trực giao. Lưu ý rằng đại diện cho "thông tin mới" có trong, vì để có được ước tính tốt nhất về số lượng, miễn là được cung cấp, cụ thể là , được trừ khỏi. Đây là một dạng khác của yêu cầu trực giao. Biến ngẫu nhiên được gọi là "đang cập nhật". Sử dụng phương trình (7.10), nó có thể được biểu thị dưới dạng một biến ngẫu nhiên cập nhật như sau:

Hai biểu thức này tương đương vì được chứa trong không gian quan sát và do đó, không có thông tin bổ sung nào được thêm vào so với thông tin được chứa trong. Vì và là trực giao nên chúng ta có thể sử dụng phương trình (7.9) và viết nó dưới dạng. Do đó, biểu thức này có thể được biểu diễn dưới dạng sau:

Sau đó, điều này thu được bằng cách dự đoán giá trị của một biến ngẫu nhiên từ các quan sát trước đó và sau đó hiệu chỉnh giá trị dự đoán cho phù hợp với thông tin mới có trong giá trị mẫu hiện tại của biến ngẫu nhiên. Khái niệm dự đoán và hiệu chỉnh rất hiệu quả và cho phép bạn diễn giải thuật toán Kalman một cách trực quan. Do đó, khi suy ra thuật toán lọc, chúng ta sẽ sử dụng cách tiếp cận dựa trên ý tưởng dự đoán và hiệu chỉnh. Chúng ta hãy phân tích riêng từng số hạng trong hai số hạng ở vế phải của phương trình (7.11). Theo biểu thức (7.1) được cho là. Do đó, theo định nghĩa thì bằng , bây giờ trở thành bằng

Theo định nghĩa, chúng tôi có

Vì nó chỉ phụ thuộc vào for và là nhiễu trắng, kỳ vọng toán học của giá trị tại một giá trị nhất định chỉ đơn giản là trùng với kỳ vọng toán học vô điều kiện. Vì vậy, kết quả trên được chuyển đổi thành như sau:

Chúng tôi thấy rằng giá trị dự đoán của, dựa trên quan sát, có được từ kết quả của quá trình chuyển đổi không bị xáo trộn trước một bước, tức là lúc. Kết luận này không nằm ngoài dự đoán, vì ước tính tốt nhất dựa trên quan sát, như được trình bày ở trên, về bản chất là không. Nó cũng theo sau từ này

Điều này có nghĩa là trong cả lọc và dự đoán, ước tính nhiễu trắng tốt nhất với giá trị trung bình bằng 0 về bản chất là 0. Kết luận này cực kỳ quan trọng và sẽ rất hữu ích, đặc biệt khi thảo luận về khái niệm của một quá trình "đổi mới". Dưới đây, theo cách tương tự, nó sẽ được hiển thị những gì được định nghĩa là và những gì thực sự là

Nếu chúng ta thay phương trình (7.12) vào (7.11), chúng ta nhận được

Xét số hạng thứ hai ở vế phải của phương trình này. Sử dụng phương trình (7.8), có thể được viết dưới dạng sau:

Bây giờ chúng ta kiểm tra riêng từng số hạng ở vế phải của phương trình này. Thay (7.1) cho, chúng ta thu được số hạng đầu tiên của phương trình

Bây giờ, bằng cách sử dụng các định nghĩa của và [cf. phương trình (7.3) và (7.10)], có thể được viết dưới dạng sau:

ở đâu . Do đó, phương trình (7.17) có dạng

và sau khi nhân các số hạng tương ứng, nó chuyển thành dạng

Vì nó chỉ phụ thuộc vào và, a và không tương quan, nên . Vì là tiếng ồn trắng và chỉ phụ thuộc vào và số hạng thứ ba ở vế phải của phương trình trên phải bằng không. Số hạng cuối cùng ở vế phải của phương trình cũng bằng 0, vì và - không tương quan với nhau. Do đó, chỉ còn lại thuật ngữ đầu tiên và kết quả là chúng ta có

Biểu thức kết quả có thể được đơn giản hóa hơn nữa nếu chúng ta tính đến điều đó. Trong đó trở nên bình đẳng

Nhưng số hạng đầu tiên, theo bổ đề chiếu trực giao, bằng không. Do đó, phương trình (7.18) có thể được viết thành:

nơi Theo cách tương tự, nó có thể được chỉ ra rằng

Nếu chúng ta thay thế các phương trình (7.19), (7.20) và (7.10) thành (7.16), thì

Do đó, biểu thức cho có dạng

Kết quả này có thể được thể hiện dưới dạng thuận tiện hơn bằng cách giới thiệu ký hiệu

vì vậy chúng tôi kết thúc với

Đại lượng được gọi là độ lợi của bộ ngoại suy Kalman một bước. Dạng của lời giải được biểu diễn bởi các phương trình (7.23) và (7.24) là rất thú vị và thuận tiện theo quan điểm tính toán. Chúng tôi đã có được một thuật toán tính toán tuần tự từ giá trị đã biết được tính toán ở bước trước và một quan sát mới. Ước tính mới ở đây được hình thành là kết quả của việc ngoại suy ước tính cũ và hiệu chỉnh sau đó bằng cách sử dụng tín hiệu lỗi quan sát có trọng số. 7,1b; để so sánh, thông điệp ban đầu và mô hình quan sát được hiển thị trong Hình. 7.1, a. Trước khi sử dụng kết quả trên, trước tiên bạn phải tìm một biểu thức cho để tính toán. Bạn có thể làm khác và tìm. Để xác định, trước tiên chúng ta tìm một biểu thức đệ quy cho. Kết hợp các phương trình (7.1) và (7.24), chúng ta thu được

Hình 7.1. Sơ đồ khối của bài toán dự đoán một bước: a) mô hình báo cáo và quan sát, b) thiết bị dự đoán một bước

Nếu bây giờ chúng ta thay thế biểu thức (7.3) cho và thực hiện một loạt các phép biến đổi đại số đơn giản, thì biểu thức trên được rút gọn về dạng

Ngoài thực tế là phương trình (7.25) có thể được sử dụng trong tính toán, nó cũng được quan tâm độc lập, vì quy luật thay đổi trong sai số ước lượng.

Vì giá trị trung bình của đại lượng bằng 0 (vì ước lượng là không chệch), và các đại lượng, và - không có tương quan, biểu thức cho có thể thu được trực tiếp từ định nghĩa của đại lượng này và phương trình (7.25), trong hình thức

Nếu bây giờ chúng ta thay thế (7.23) cho và đơn giản hóa kết quả thu được, chúng ta sẽ có được biểu thức sau cho phương sai lỗi:

Phương trình (7.26), cùng với (7.23) và (7.24), xác định hoàn toàn bộ ngoại suy một bước tuần tự tuyến tính với phương sai sai số tối thiểu.

Trước khi sử dụng kết quả thu được ở trên, cần thiết lập các điều kiện ban đầu tương ứng trong các phương trình cho và. Rõ ràng, ước tính tốt nhất về số lượng, với điều kiện là không có quan sát nào được thực hiện, và do đó,

Vì vậy, là điều kiện ban đầu cho các thuật toán dự đoán một bước, chúng tôi chọn ; .

Tất cả các thuật toán dự đoán một bước được tóm tắt trong Bảng. 7.1.

Phương trình (7.26) cũng có thể được viết lại ở dạng sau:

Nếu bạn đặt các điều kiện ban đầu trong các phương trình (7.24) và (7.26), thì bạn có thể sử dụng các thuật toán dự đoán một bước một cách nhất quán. Ví dụ, phương trình (7.23) với điều kiện ban đầu có thể được sử dụng để tìm, sau đó cần thay điều kiện này vào (7.24) để tính toán từ lần quan sát đầu tiên. Phương trình phân tán (7.26) được sử dụng trong bước tiếp theo khi được tính toán lại. Giá trị thu được của đại lượng sau đó được sử dụng để tính toán, v.v. Xử lý dữ liệu theo các phương trình dự đoán được thể hiện dưới dạng giản đồ trong hình. 7.2. Phân tích cẩn thận các phương trình (7.23) và (7.26) cho thấy rằng việc tính toán các đại lượng và thực tế được thực hiện mà không cần đến trình tự quan sát . Có thể tính toán trước và lưu trữ các ma trận khuếch đại. Có thể, chúng tôi không thể chấp nhận phương pháp tính toán sơ bộ ma trận này nếu tỷ lệ nhận các quan sát ở đầu vào của bộ xử lý không quá cao và sẽ không ngăn cản việc thực hiện các phép tính theo các phương trình (7.23) và (7.26) trong thực tế. thời gian, hoặc nếu khả năng lưu trữ không thể truy cập hơn và rẻ hơn so với khả năng tính toán thời gian thực.

Bảng 7.1. Các thuật toán dự đoán một bước rời rạc

Mô hình tin nhắn

Mô hình quan sát

Dữ liệu trước đó

; ; ;

Thuật toán dự đoán

Tính toán đạt được

Tính toán phương sai trước

Điều kiện ban đầu

Ưu điểm chính của thuật toán lọc Kalman không phải là chúng đưa ra giải pháp cho vấn đề lọc (giải pháp thu được sớm hơn nhiều bằng các phương pháp khác), mà là giải pháp quyết định trực tiếp đến việc thực hiện kết quả trong thực tế. Khi giải quyết nhiều vấn đề thực tế, có thể đảm bảo tính khả thi của các phép tính theo phương trình (7.23) và (7.26) trong thời gian thực và do đó, thực hiện các thuật toán lọc tuần tự trong thời gian thực. Một tính năng đặc trưng khác của cách tiếp cận được xem xét là phương sai sai số được tính như một phần không thể thiếu của ước tính và do đó, có thể được sử dụng để kiểm soát độ chính xác của thủ tục ước lượng. Điều này dựa trên giả định rằng các mẫu báo cáo và quan sát, cũng như phân phối trước, đã được biết đầy đủ.

Cơm. 7.2. Sơ đồ cấu trúc các phép tính trên các thuật toán dự đoán

Ví dụ 7.1. Cho thông báo và mô hình quan sát được đưa ra bằng phương trình vô hướng:

; .

và và hoặc,. Ở đây chúng tôi giả định rằng tiếng ồn là tĩnh và trắng, mặc dù nói chung nó không cần phải đứng yên. Chúng ta cũng giả sử rằng giá trị ban đầu không có phương sai đơn vị và giá trị trung bình bằng 0, do đó và.

Đối với ví dụ này, phương trình ước lượng (7.24) trở thành

với lợi ích được xác định từ phương trình

Phương trình phân tán có dạng

Chúng ta cũng hãy tính toán theo giả định rằng chúng ta có các quan sát ,. Đầu tiên, chúng tôi tính toán độ lợi bằng cách sử dụng điều kiện ban đầu:

; .

Sử dụng điều kiện ban đầu, chúng tôi thu được và . Phương sai của sai số của ước lượng này được xác định từ phương trình phương sai như sau:

Bây giờ cần phải lặp lại tất cả các bước của phép tính để tìm, ước lượng và cuối cùng là phương sai. Mặc dù ví dụ được coi là cực kỳ đơn giản, nó minh họa rõ ràng tất cả các bước của các phép tính phải được thực hiện trong quá trình áp dụng các thuật toán dự đoán một bước của Kalman.

Một trong những vấn đề thực tế quan trọng nảy sinh khi sử dụng các kết quả trên, và thậm chí còn khó hơn việc tìm giá trị trung bình và phương sai của trạng thái ban đầu, là xác định phương sai của nhiễu đầu vào và nhiễu đo. Các giá trị của độ phân tán và thường có thể thu được từ việc phân tích bản chất vật lý của vấn đề, hoặc bằng phép đo trực tiếp với độ chính xác hợp lý. Các nhận xét tương tự có thể được thực hiện về các mômen tiên nghiệm của vectơ trạng thái. Giá trị được chọn làm ước lượng tốt nhất về giá trị trung bình của vectơ trạng thái ở bước 0, tức là trước khi thực hiện các quan sát, a là đặc trưng của mức độ không chắc chắn khi chọn.

Theo nghĩa thuần túy định tính, có thể lập luận rằng độ không chắc chắn về giá trị thực của giá trị thực càng lớn thì giá trị mà chúng ta đặt ra càng lớn.

Bây giờ chúng ta hãy chuyển sang vấn đề lọc. Bộ ngoại suy một bước đã được sử dụng như một bước thuận tiện trong công việc cơ bản này và thường có giá trị thực tế. Chúng ta sẽ thấy rằng giải pháp cho vấn đề lọc liên quan đến dự đoán một bước, kết quả của chúng sau đó được hiệu chỉnh theo thông tin hiện tại. Thông thường, nhưng không phải luôn luôn, giải quyết vấn đề lọc nên được ưu tiên hơn giải quyết vấn đề lọc một bước.

Nếu ước tính thu được là kết quả của quá trình lọc, cụ thể là, được biết, thì nó có thể thu được là

Vì và do đó, chỉ phụ thuộc vào for, không gian quan sát không chứa thông tin về đâu là nhiễu trắng rời rạc. Do đó, để dự đoán một giá trị từ các quan sát, chỉ cần thiết lập các giá trị trước một bước là đủ. Cách tiếp cận này có thể thu được phương trình (7.27), phương trình này sẽ được sử dụng trong những điều sau đây. Cố ý cho phép một ký hiệu không nghiêm ngặt vì lợi ích của ký hiệu đơn giản, chúng tôi viết nó là. Trừ những trường hợp đặc biệt, như trong, chúng tôi sẽ giả định rằng các điều kiện được đưa ra bởi không gian. Theo ký hiệu này, phương trình (7.27) có thể được viết lại thành

Rõ ràng, hai ước lượng dựa trên quan sát phải tương đương. Do đó, người ta có thể sử dụng phương trình (7.28) để thu được thuật toán ước lượng tuần tự từ các phương trình (7.23), (7.24) và (7.26). Đầu tiên, chúng ta thay thế yp-ne (7.28) thành (7.24). Kết quả là, chúng tôi nhận được

Nếu chúng ta nhân cả hai phần của phương trình này với, do các thuộc tính của ma trận chuyển trạng thái, bằng, thì chúng ta nhận được

Để đơn giản hóa biểu thức kết quả, chúng tôi giới thiệu, được định nghĩa là hoặc

nếu bạn sử dụng phương trình (7.23) để xác định. Do đó, nó được viết dưới dạng

Mặc dù phương trình (7.30) có lẽ là dạng thuận tiện nhất của phương trình ước lượng bộ lọc Kalman, về nguyên tắc có thể thu được một số dạng khác. Hai trong số chúng đặc biệt hữu ích. Nếu chúng ta sử dụng quan hệ, thì phương trình (7.30) có thể được viết lại ở dạng sau:

Biểu thức này có thể được đơn giản hóa hơn nữa bằng cách giới thiệu một giá trị "đang cập nhật" để nhận được

Phương trình (7.29) - (7.31) hoặc (7.32) cùng với phương trình (7.26) giải quyết triệt để vấn đề lọc tuyến tính theo tiêu chí sai số bình phương trung bình nhỏ nhất. Các điều kiện ban đầu đã cho, cụ thể là và, được sử dụng để tạo thành các điều kiện ban đầu cho và, tương ứng, theo cách tương tự như trong bộ ngoại suy một bước.

Các thuật toán lọc Kalman có thể được trình bày dưới dạng thuận tiện hơn nếu chúng ta tìm thấy các biểu thức cho phương sai của lỗi lọc . Ngoài ra, phương sai có thể được sử dụng như một tiêu chí cho chất lượng của thủ tục ước lượng. Phương sai thường được gọi là phương sai trước vì nó là phương sai của ước tính cho đến thời điểm quan sát, và phương sai được gọi là phương sai sau. Để xác định, trước tiên chúng ta tìm một biểu thức cho. Một lần nữa, có thể có một số hình thức trình bày. Một trong những điều thuận tiện nhất cho trường hợp của chúng tôi là biểu diễn sử dụng phương trình (7.32). Trong trường hợp này, nó được định nghĩa như sau:

Nếu bây giờ chúng ta thay thế các phương trình (7.29) cho và (7.19) và (7.20) cho và vào biểu thức này, chúng tôi nhận được

Nếu chúng ta sử dụng phương trình (7.29) cho, thì biểu thức cuối cùng có thể được viết lại thành

Theo phương trình này, phương sai của lỗi lọc được thể hiện khá đơn giản dưới dạng phương sai của sai số dự đoán một bước. Việc sử dụng đại lượng cũng giúp đơn giản hóa đáng kể phương trình (7.26). Hãy viết lại nó dưới dạng

Sử dụng f-loy (7.29) cho, chúng ta có thể viết biểu thức này dưới dạng

Dễ dàng nhận thấy rằng giá trị trong dấu ngoặc nhọn không đại diện gì hơn. Do đó chúng tôi có

Biểu thức này có thể nhận được theo cách thông thường bằng cách tính phương sai của một biến ngẫu nhiên được đưa ra bởi phương trình (7.1) cho một biến nhất định.

Các phương trình (7.29), (7.30), (7.33) và (7.34) hoàn toàn xác định phiên bản cuối cùng của bộ lọc Kalman rời rạc. Các phương trình này được tóm tắt trong Bảng. 7.2. Sơ đồ khối của các phép tính theo các thuật toán thu được được trình bày trong hình. 7.3, và sơ đồ khối của bộ lọc Kalman rời rạc - trong hình. 7.4.

Lưu ý một lần nữa rằng phương trình phân tán và độ lợi không bao gồm một chuỗi các quan sát, vì vậy những đại lượng này có thể được tính toán trước nếu cần thiết. Khả năng này được quy ước trong Hình. 7.3 nét đứt.

Bảng 7.2. Tóm tắt các thuật toán lọc Kalman rời rạc

Mô hình tin nhắn

Mô hình quan sát

Dữ liệu trước đó

Các thuật toán lọc

Tính toán đạt được

Tính toán phương sai trước

Phương trình cho phương sai sau

Điều kiện ban đầu

Phân tích sơ đồ khối trong Hình 7.4 cho thấy rằng bộ lọc Kalman thực hiện ý tưởng dự đoán-hiệu chỉnh. Ước tính trước đó được ngoại suy về phía trước một bước và sau đó được sử dụng để có được ước tính tốt nhất về quan sát mới dựa trên tất cả các quan sát trước đó. Sai số giữa "ước tính tốt nhất" của quan sát hiện tại và quan sát thực tế, cụ thể là hoặc, là thông tin mới [đối với thành phần trực giao với]. Sai số được tính trọng số có tính đến giá trị của các phương sai của quá trình đầu vào, các phép đo và sai số ước lượng để tạo thành tín hiệu hiệu chỉnh. Tín hiệu hiệu chỉnh được thêm vào ước lượng dự đoán và kết quả là ước tính mới.

Hình.7.3. Sơ đồ cấu trúc các phép tính bằng thuật toán lọc Kalman.

Cơm. 7.4. Sơ đồ cấu trúc của một bộ lọc Kalman rời rạc.

Lưu ý rằng cấu trúc của bộ lọc Kalman tương ứng với phương trình (7.30) và được thể hiện trong Hình. 7.4 rất giống với cấu trúc của mô hình thông báo ban đầu được đưa ra bởi phương trình (7.1) và được trình bày trong hình. 7.1a. Thuật toán lọc dựa trên việc sử dụng thành phần "cập nhật", thành phần này chứa thông tin mới thu được do quan sát.

Ví dụ 7.2.Để minh họa ứng dụng của thuật toán lọc Kalman, hãy xem xét một mô hình thông báo hai chiều được đưa ra bởi phương trình

Việc quan sát được thực hiện theo mô hình vô hướng

Tiếng ồn đầu vào là cố định với , và tiếng ồn đo là không cố định với . Nói cách khác, các phép đo cho các chỉ số chẵn kém chính xác hơn các phép đo cho các chỉ số lẻ. Giả sử rằng phương sai của sai số ban đầu (hoặc trạng thái ban đầu) được đưa ra bởi ma trận . Bắt buộc phải tính giá trị cho tất cả từ 1 đến 10.

Sử dụng các phương trình (7.29) và (7.34), cũng như điều kiện ban đầu, người ta có thể dễ dàng tính toán và tương ứng bằng

Bây giờ, sử dụng phương trình (7 23), bạn có thể tính toán phương sai sau

cũng như phương sai trước đó, thay đổi cho bước tiếp theo theo phương trình (7.34) và trở thành bằng

Cơm. 7,5. Thay đổi lợi ích của bộ lọc Kalman được xem xét trong ví dụ 7.2

Bây giờ bạn có thể tính toán, v.v. Các thành phần của vectơ, khi thay đổi từ 1 đến 10, được thể hiện trong Hình 7.5. Lưu ý sự gia tăng đặc tính của độ lợi đối với các giá trị lẻ, do đó các phép đo tương đối chính xác được tăng cường. Có thể thấy rằng độ lợi đạt đến trạng thái ổn định giá trị thay đổi định kỳ trong một số mẫu. Có thể hữu ích nếu thảo luận ngắn gọn và thuần túy về mặt định tính ảnh hưởng của tỷ lệ giữa các đại lượng và trên, ngay cả khi khó có được kết quả định lượng chung. Đầu tiên, giá trị tương đối quan trọng ở đây, không phải giá trị tuyệt đối. Đặc biệt, dễ dàng chỉ ra rằng trong trường hợp khi, và được nhân với cùng một hằng số vô hướng dương, thì không thay đổi. Rất gần đúng, người ta chỉ có thể nói rằng độ lợi phụ thuộc vào tỷ lệ tín hiệu trên nhiễu. Các phần tử của ma trận hệ số giảm khi giá trị của các phần tử của ma trận và [hoặc chỉ bằng] giảm hoặc giá trị của các phần tử của ma trận tăng lên. Kết quả này có vẻ khá trực quan, bởi vì khi nó giảm, những thay đổi nhỏ hơn và nhỏ hơn về trạng thái sẽ được mong đợi, và do đó không cần phải "theo dõi" các quan sát một cách chính xác như vậy. Tương tự, nếu nó giảm, thì độ chính xác của ước tính ban đầu tăng lên và nhu cầu về thông tin chứa trong các quan sát giảm, và do đó độ lợi giảm. Mặt khác, nếu nó tăng lên, thì độ lợi lại giảm xuống, ngăn nhiễu phép đo quá mức được thêm vào ước lượng. Trong giới hạn, khi nó có xu hướng về 0, dễ dàng cho thấy rằng nó tiệm cận 0 đối với các giá trị lớn của. Khi nó tiến gần đến 0, các phương sai sai số cũng tiếp cận 0 và quy trình ước lượng trở nên độc lập với quan sát và đi vào một chế độ được gọi là bão hòa đầu vào. Chế độ này có thể dẫn đến các vấn đề phân kỳ nghiêm trọng. Các phương pháp hiệu chỉnh phân kỳ sẽ được thảo luận chi tiết trong Phần. 8,5.

Ước tính theo tiêu chí xác suất hậu kỳ tối đa. Chúng tôi nhận được một thuật toán ước lượng tuyến tính, giả sử rằng, và có luật phân phối chuẩn. Trong trường hợp này, có thể dễ dàng chỉ ra (xem § 4.2) đó là các biến ngẫu nhiên có phân phối chuẩn cho tất cả mọi người. Do đó là một hàm quan sát tuyến tính. Nói cách khác, thuật toán ước lượng phương sai sai số tối thiểu tuyến tính là một thuật toán ước lượng với phương sai sai số tối thiểu và phương sai sai số nhỏ hơn hoặc bằng phương sai sai số của bất kỳ thuật toán ước lượng tuyến tính hoặc phi tuyến tính nào khác.

Để có được một thuật toán ước tính theo tiêu chí của xác suất hậu kỳ tối đa, chỉ cần xác định mật độ xác suất có điều kiện của giá trị cho một giá trị nhất định, và sau đó tìm kỳ vọng toán học của nó. Vì phân phối có điều kiện là chuẩn khi cho trước, nên (xem §6.2) được biết rằng thuật toán ước lượng tính kỳ vọng có điều kiện giảm thiểu không chỉ sai số trung bình bình phương mà còn cả sai số tuyệt đối trung bình đối với một hàm mất mát đơn giản và nhiều hàm khác.

Do đó, người ta có thể chỉ định một thuật toán ước lượng phương sai tối thiểu bằng cách xem xét ước lượng dưới bất kỳ hàm tổn thất nào khác, ví dụ, ước tính xác suất hậu nghiệm tối đa (viết tắt là ước tính MAP) khi hàm tổn thất được chọn là đơn giản và ước lượng trùng với chế độ mật độ có điều kiện .

Hãy sử dụng kỹ thuật này và xây dựng thuật toán ước lượng MAV. Vì một số biểu thức mà chúng ta sẽ phải thao tác có thể quá dài, nên trong quá trình trình bày, đôi khi chúng ta sẽ sử dụng một dạng ký hiệu đơn giản hóa. Giả sử có một chút thiếu chặt chẽ, chúng tôi sẽ bỏ ký hiệu chỉ số cho mật độ xác suất và các biến ngẫu nhiên đang được xem xét sẽ được ký hiệu là đối số của các mật độ này. Ví dụ, giá trị của mật độ xác suất của một biến ngẫu nhiên tại điểm, được viết trong trường hợp này là; tương tự được viết như. Và người ta không nên cố gắng giải thích dạng ký hiệu đơn giản này là xác suất (điều này hoàn toàn vô nghĩa), hay đúng hơn, mật độ xác suất nên được coi là một hàm, chứ không phải là giá trị của hàm này, mà nó cần cho một quan sát cụ thể. Thật không may, trong toán học không nghiêm ngặt mà các kỹ sư sử dụng, sự phân biệt giữa một hàm, như một ánh xạ từ tập hợp này sang tập hợp khác, và giá trị cụ thể của hàm này thường không được nhấn mạnh rõ ràng.

Hàm mật độ xác suất, được xem xét khi ước lượng dựa trên tiêu chí của xác suất tối đa sau xác suất hoặc trên cơ sở kỳ vọng toán học có điều kiện, là một hàm của một biến ngẫu nhiên đối với một chuỗi quan sát nhất định và được ký hiệu là . Thuật toán ước tính dựa trên kỳ vọng có điều kiện được định nghĩa là

(7.35)

Ước tính theo tiêu chí của xác suất hậu quá lớn nhất, sẽ được ký hiệu là, được tìm thấy dưới dạng một nghiệm của phương trình

. (7.36)

miễn là

(7.37)

Nếu điều kiện (7.37) được thỏa mãn, yêu cầu ma trận của đạo hàm cấp hai là âm xác định, thì nghiệm của phương trình (7.36) tương ứng với mật độ điều kiện lớn nhất.

Để tìm một biểu thức cho , chúng tôi sử dụng định lý nhân và viết thế nào

Nếu chúng ta coi nó là sự kết hợp của một quan sát mới và các quan sát trước đó, thì phương trình (7.38) sẽ được viết lại dưới dạng

(7.39)

Hãy xem xét tử số của biểu thức này. Sử dụng định lý nhân, chúng ta có thể viết

đối với kiến thức chắc chắn loại trừ nhu cầu bảo quản. Nếu nó được đưa ra, thì trong chỉ là một biến ngẫu nhiên và vì là nhiễu trắng nên không có thông tin nào được chứa trong hoặc hoặc. Nếu chúng ta thay thế biểu thức (7.40) thành (7.39), chúng ta nhận được

Áp dụng định lý nhân mẫu số ta viết biểu thức thu được dưới dạng

Sau khi giảm bởi một hàm xác suất vô hướng chung, chúng ta thu được

(7.41)

Bây giờ bạn có thể xác định mật độ xác suất có điều kiện của một biến ngẫu nhiên được đưa ra bằng cách tính toán từng biểu thức cho xác suất ở vế phải của phương trình (7.41). Hãy xem xét từng số hạng riêng biệt, chứng minh rằng mỗi mật độ xác suất trong (7.41) là chuẩn và xác định hai thời điểm đầu tiên đặc trưng cho phân phối chuẩn. Hãy cùng khám phá trước. Vì nó được cho bởi phương trình, a là một quá trình ngẫu nhiên bình thường, thì mật độ xác suất chắc chắn là bình thường, vì có một tổng của một quá trình ngẫu nhiên bình thường và một giá trị không đổi. Giá trị trung bình của quá trình là

bởi vì là một quá trình ngẫu nhiên với giá trị trung bình bằng không. Phương sai của một quá trình ngẫu nhiên là theo định nghĩa

và trong trường hợp này

Do đó, mật độ xác suất có thể được viết dưới dạng sau:

Bây giờ chúng ta hãy xem xét mẫu số của biểu thức (7.41), chính xác hơn là mật độ xác suất của ba giá trị đã cho. Sử dụng phương trình cho mô hình quan sát, có thể được viết như

Theo công thức ban đầu của bài toán, biết rằng có luật phân phối chuẩn và không phụ thuộc vào. Nếu chúng ta giả định rằng - bình thường, không nghi ngờ gì nữa cũng bình thường, vì nó là một hàm tuyến tính (tổng) của hai biến ngẫu nhiên có luật phân phối chuẩn. Mật độ xác suất của một biến ngẫu nhiên đối với một u nhất định là bình thường, vì trong trường hợp này, nó chỉ đơn giản là trùng với, theo giả thiết ban đầu, là bình thường. Điều sau đây sẽ cho thấy tính hợp lệ của giả định rằng , và do đó cũng là bình thường đối với tất cả mọi người. Giá trị trung bình với mật độ bằng

nơi ký hiệu được giới thiệu trước đó được sử dụng; bằng 0, vì nó là nhiễu trắng với giá trị trung bình bằng 0. Theo định nghĩa, sự phân tán của quá trình bằng với giá trị đã cho, vì sự phân tán của các đại lượng:, được coi là những đại lượng ban đầu trong chuỗi này, là bình thường. Do đó, giả thiết được khẳng định rằng mật độ thông thường.

Ước lượng trạng thái cho một giá trị nhất định, dựa trên kỳ vọng toán học có điều kiện (ước lượng theo tiêu chí của phương sai sai số tối thiểu), được xác định bằng phương trình (7.54) và phù hợp với kết quả thu được trước đó [xem. (7.30)]. Tuy nhiên, trong trường hợp này, ước tính chính xác bằng kỳ vọng có điều kiện (vì phân phối chuẩn được giả định ở đây) và không phải là ước tính tốt nhất chỉ trong loại ước lượng tuyến tính. Tất nhiên, đối với phân phối chuẩn, cả hai ước lượng đều giống nhau, vì kỳ vọng có điều kiện là một hàm quan sát tuyến tính.

Để xác định ước tính MAV, bạn cần tìm giá trị tối đa hóa . Hãy sử dụng một thủ thuật nổi tiếng và tìm kiếm mật độ tối đa của chính nó

và trong trường hợp này được quan sát do các tính chất vật lý của ma trận phân tán lỗi. Do đó, ước tính MAV trùng với ước lượng của kỳ vọng có điều kiện và ước lượng theo tiêu chí của phương sai sai số tối thiểu. Tập hợp các giá trị là một thống kê đủ để ước tính theo nghĩa là chúng hoàn toàn xác định mật độ có điều kiện.

Cần lưu ý rằng người ta có thể sử dụng trực tiếp dạng ký hiệu mật độ ban đầu [biểu thức (7,52)] chứ không phải dạng thu gọn (7,53). Cách tiếp cận này có vẻ hấp dẫn hơn, vì trong trường hợp này, kiến thức về một dạng nhỏ gọn hơn, không đủ đơn giản và rõ ràng, là không cần thiết. Nếu chúng ta sử dụng biểu thức (7,52) cho , sau đó theo kết quả của việc biến đổi phương trình (7.57), chúng ta có

Nếu bây giờ chúng tôi nhóm các điều khoản bao gồm, chúng tôi nhận được

mà giải pháp liên quan đến kết quả sau:

Mặc dù giải pháp cho ước lượng tối ưu này không được trình bày dưới dạng thuận tiện như giải pháp trước, nhưng nó có thể dễ dàng được rút gọn thành (7.62) bằng cách sử dụng bổ đề nghịch đảo ma trận hoặc các biểu thức (7.55) và (7.56) trực tiếp.

Một số biểu thức thú vị và hữu ích cho phương sai có thể được rút ra từ các thuật toán lọc Kalman. Dưới đây là một số hữu ích hơn liên quan đến khái niệm "quá trình đổi mới":

Với phương trình (7.70), chúng ta nhận được [cũng là ước lượng tối ưu hợp lệ ở đầu ra của hệ thống, tức là khi mô hình quan sát có dạng sau:

Họ đưa ra giải pháp cho vấn đề lọc rời rạc tuyến tính trong công thức tổng quát nhất. Kết luận, chúng tôi lưu ý rằng từ các kết quả chung, cụ thể là các kết quả được đưa ra trong Bảng. 7.2, nếu chúng ta đặt và bằng không.