السير الذاتية صفات التحليلات

الترشيح الديناميكي الخطي الأمثل. مرشح Optimal Kalman-Bucy

كما هو معروف ، فإن جوهر التصفية هو التقدير المستمر للمعلمات المتغيرة بمرور الوقت لعملية عشوائية. إذا كانت الرسالة عبارة عن عملية ماركوف العددية (لعملية غاوسي ثابتة ، فهذا يعني أن دالة التغاير لها الشكل Aexp (-B | t-u |) ، فإن حل المشكلة يمكن أن يعتمد على المبادئ التالية التي تبسط الإنجاز الهدف:

يجب أن يتم وصف العمليات التي تهمنا باستخدام أنظمة خطية ذات معلمات متغيرة بمرور الوقت من شأنها أن تولدها عند تطبيق ضوضاء بيضاء على مدخلات الأنظمة ؛

يجب وصف النظام الخطي الذي يولد رسالة بمعادلة تفاضلية يكون حلها هو الرسالة المرغوبة ؛

يجب إعطاء التقدير الأمثل كقيمة خرج لنظام خطي كحل لمعادلة تفاضلية ، يتم تحديد معاملاتها بواسطة إحصائيات العمليات.

تسمى الأنظمة الخطية التي تم إنشاؤها وفقًا لهذه المبادئ مرشحات Kalman-Bucy ، والتي تمتلك العمل الأصلي في هذا المجال. على عكس هذه المبادئ ، في تصفية Wiener المتكاملة ، يتم تنفيذ وصف العمليات باستخدام وظائف التباين المشترك ، والأنظمة الخطية - باستخدام استجابة النبضة ، والتقديرات المثلى - كحل لمعادلة Wiener-Hopf المتكاملة.

المعادلة التفاضلية لمرشح كالمان الأمثل في الشكل الأساسي هي:

أين هو كسب المصفوفة للمرشح الأمثل.

يقوم مرشح كالمان بإجراء ترشيح ديناميكي مثالي للعمليات العشوائية غير الثابتة. يتم تقليل حل مشكلة التصفية المثلى إلى حل نظام من المعادلات التفاضلية (أو الفرق) المتجهية. تتيح لك هذه الطريقة تشغيل نظام مغلق من المعادلات في شكل متكرر ، وهو الأكثر ملاءمة للتنفيذ الفني. في جوهره ، مرشح كالمان هو خوارزمية معالجة المعلومات الحسابية التي تستخدم مجموعة من المعلومات المسبقة حول النظام الأصلي (الهيكل ، المعلمات ، الخصائص الإحصائية لضوضاء الحالة وضوضاء القياس ، معلومات حول الظروف الأولية ، إلخ). يقوم هذا المرشح بمعالجة إحصائية لمعلومات المراقبة ، مع مراعاة الخصائص الديناميكية لنموذج النظام الأصلي. هيكل مرشح كالمان هو نموذج للنظام الديناميكي الأصلي مع تصحيح خطأ الترشيح بواسطة الإشارة التصحيحية

أين هي إشارة تصحيحية للشكل:

في هذه الحالة ، فإن مرشح كالمان الديناميكي الأمثل غير الثابت هو نظام تحكم أوتوماتيكي مغلق يحتوي على نموذج رياضي للنظام الأصلي ، وعند إخراج النموذج يتم إنشاء تقدير حالة ، وإشارة تصحيح مع مصفوفة غير ثابتة الكسب هو المدخلات ك (ر):


لذلك ، تعتمد خوارزمية الترشيح الديناميكي على المبدأ الكلاسيكي للتحكم في الانحراف مع كسب مصفوفة K (t) الذي يضمن الحد الأدنى لمتوسط ​​خطأ ترشيح المربع. تتكون الإشارة التصحيحية من الإشارة الحالية للملاحظة z (t) لحالة النظام الأصلي ، تكملها الإشارة الحالية لحالة نموذج النظام الأصلي. الإشارة هي إشارة تصحيح خطأ المرشح وتميز المعلومات الإضافية بين القياسات الحالية z (t) وتقديرات الحالة التي تم الحصول عليها من نتائج التقديرات السابقة للقياسات الحالية z (t). مخطط المصفوفة لمرشح كالمان الأمثل له الشكل الموضح في الشكل. 4.18 يطبق هذا المخطط خوارزمية ترشيح ديناميكي عندما يتم إعطاء حالة النظام الأصلي بواسطة معادلات تفاضلية ، لا يعتمد الجانب الأيمن منها على الملاحظة.

أصبح ترشيح كالمان المنفصل الأمثل واسع الانتشار بشكل خاص فيما يتعلق بتطوير طرق منفصلة لمعالجة المعلومات. إنه امتداد لنتائج الترشيح الديناميكي الأمثل المستمر للأنظمة الديناميكية المنفصلة الموصوفة بواسطة معادلات مصفوفة متجهية مختلفة.

أرز. 4.17. مخطط مصفوفة لمرشح كالمان الأمثل

تسمح لك معادلة المرشح الخطي المثلى بحساب التقديرات بالتسلسل. يتم استخدام قيم النقاط السابقة ورقم المعلمة فقط لحساب الدرجة. يتم حساب قيمة الدرجة في الوقت المحدد من الدرجة في الوقت المحدد ، مع إضافة الفرق المرجح بين القياس في الوقت ودرجة القياس في الوقت المناسب. تسمى طريقة حساب الدرجات هذه بالتكرار. وبالتالي ، فإن مرشح كالمان المنفصل في شكل تعاودي يقوم بإجراء تكراري لحساب التقديرات المتتالية ، الأمر الذي يتطلب تخزين عدد صغير من نتائج الحساب في كل خطوة.

تظهر دائرة المصفوفة لمرشح كالمان المنفصل في الشكل. 4.19 مع نماذج النظام الديناميكي الأولي ونظام القياس.

أرز. 4.18 دائرة مصفوفة مرشح كالمان المنفصلة

أساس اشتقاق معادلة الترشيح هي معادلات حالة النظام الديناميكي ومعادلة الملاحظة (القياس). يتم وصف معادلة حالة النظام الديناميكي الخطي بواسطة نظام معادلات الاختلاف في شكل مصفوفة متجهة:

أين هي مصفوفة الانتقال لحالة البعد ، متجه الأبعاد لحالة النظام الديناميكي ؛ - مصفوفة الاضطراب ، أو إشارة الإدخال ذات البعد ؛ - متجه الأبعاد لتسلسل غاوسي عشوائي.

يتم وصف معادلة الملاحظة (القياس) للإشارة التي تم الحصول عليها عند خرج نموذج نظام القياس بواسطة معادلة متجه الفرق:




أين هو ناقل مراقبة الأبعاد (القياس) ؛ متجه الأبعاد لتسلسل عشوائي غير مرتبط بأخطاء القياس التي تشوه نتيجة مراقبة حالة النظام الديناميكي ؛ مصفوفة البعد

لنفترض أن تقدير حالة النظام في الوقت الحالي ومصفوفة الانتقال) معروفان. ثم يمكن اعتبار هذا التقدير بمثابة التقدير الأولي ويمكن حساب التقدير في الوقت المناسب وفقًا للمعادلة:


هذا التقدير متوقع (استقراء) من نتائج الملاحظات السابقة. عند حسابه ، لم يتم استخدام القياس الأخير لحالة النظام الديناميكي ، الذي تم إجراؤه في الوقت الحالي. سيؤدي ذلك إلى أخطاء في تقدير متجه حالة النظام. يمتد خطأ التقدير في الوقت الحالي من خلال مصفوفة الانتقال إلى جميع التقديرات اللاحقة في ، ومع وقت تشغيل المرشح الطويل ، يمكن أن تتراكم الأخطاء وتؤدي إلى نتائج غير مرضية. يمكن تحسين التقدير باستخدام القياسات في نقطة زمنية معينة وتوليد إشارة تصحيحية:. من هنا

بالتعويض (9.14) في هذا التعبير ، نحصل على معادلة مرشح كالمان المنفصل في الشكل المتعارف عليه:

يجب أن يوفر معامل الإرسال الأمثل لمثل هذا المرشح حدًا أدنى من متوسط ​​خطأ الترشيح التربيعي وفقًا للشرط (4.152).

قائمة التحقق للفصل 4

1. ما هي معايير القرار المستخدمة في GAS NC؟

2. ما هي أوجه التشابه والاختلاف بين معايير الكشف لـ "المراقب المثالي" و "نيمان بيرسون" و "والد"؟

3. ما هو الجوهر المادي لاحتمالات الكشف الصحيح وعدم الكشف الصحيح وتخطي الإشارة والإنذار الكاذب؟

4. كيف يرتبط احتمال وجود إنذار كاذب "عند النقطة" ونظام متعدد القنوات؟

5. كيف يتم اختيار عتبة الكشف عند تطبيق معيار Neyman-Pearson؟

6. كيف يتم اختيار عتبة الكشف عند تطبيق معيار Kotelnikov-Siegert؟

7. كيف يتم اختيار عتبة الكشف عند تطبيق معيار الكشف عن والد؟

8. ما هي كفاية وخصائص مستقبل الارتباط والمرشح المطابق؟

9. ما هو جوهر اتساق التقييم؟

10. ما هو جوهر فعالية التقييم؟

11. ما هو جوهر التقدير غير المتحيز؟

12. ما هي مصفوفة معلومات فيشر؟

13. كيف يتم بناء خاصية تحديد الاتجاه للسونار؟

14. كيف يتم تكوين قاموس الإشارات وأبجدية صور أجسام السونار؟

15. ما مدى الكفاية والاختلاف بين مفهومي التصنيف والتعرف على أجسام السونار؟

نشرة جامعة ولاية تومسك 2011 الإدارة وهندسة الكمبيوتر والمعلوماتية رقم 3 (16) UDC 517.511 V.I. سماجين ، S.V. تصفية Smagin في الأنظمة غير الثابتة الخطية ذات الاختلالات غير المعروفة يتم النظر في خوارزمية لتصميم مرشح مثالي يحدد تقدير متجه الحالة لنظام ديناميكي خطي غير ثابت مع اضطرابات مضافة تحتوي على مكون ثابت غير معروف. يتم عرض نتائج تجربة حسابية. الكلمات المفتاحية: أنظمة خطية منفصلة غير ثابتة ، مرشح كالمان ، اضطرابات غير معروفة. في أعمال العديد من المؤلفين ، تم إيلاء الكثير من الاهتمام لتطوير خوارزميات ترشيح كالمان لفئة من الأنظمة ذات الاضطرابات المضافة غير المعروفة والمعلمات التي يمكن استخدامها كنماذج لأنظمة فيزيائية حقيقية ، ونماذج لأشياء ذات أخطاء غير معروفة. تعتمد الطرق المعروفة لحساب تقديرات متجه الحالة على الخوارزميات التي تستخدم تقديرات اضطراب غير معروفة. تنظر الأوراق في خوارزميات لتوسيع مساحة الحالة (تمت إضافة نموذج اضطراب غير قابل للملاحظة إلى نموذج المصنع الرئيسي) وخوارزمية ترشيح من مرحلتين تقلل من التكاليف الحسابية بسبب تحلل المشكلة. في الأوراق البحثية ، تمت دراسة خوارزميات التصفية المثلى المتكررة التي تستخدم تقديرات اضطراب غير معروف لها شروط صارمة إلى حد ما لإمكانية حلها. في هذا البحث ، بالنسبة لمحطة منفصلة غير ثابتة ذات مكون ثابت غير معروف من الاضطرابات ، نقترح طريقة ترشيح مثالية لا تستخدم تقديرات الاضطراب غير المعروف. تعتمد الطريقة على تحويل النموذج واختزاله إلى مشكلة ترشيح كالمان الخطية. في هذه المقالة ، يتم تعميم النتائج على حالة حل المشكلة لكائن منفصل غير ثابت. 1. بيان المشكلة نحن نعتبر نظامًا منفصلاً ، والذي يتم وصفه بواسطة معادلات الفرق التالية: x (k + 1) = A (k) x (k) + f + q (k)، x (0) = x0 ، (1) حيث x (k) ∈ R n هو متجه الحالة ؛ A (k) عبارة عن مصفوفة n × n ؛ f هو ناقل ثابت غير معروف ؛ q (k) هو تسلسل عشوائي غاوسي أبيض مع الخصائص M (q (k)) = 0، M (q (k) q Τ (j)) = Q (k) δk، j. (2) قناة المراقبة لها الشكل y (k) = S (k) x (k) + v (k) ، (3) y (k) ∈ R l هو متجه القياس ؛ S (k) هي مصفوفة l × n ؛ ت (ك) - غاوس أبيض - V. سماجين ، S.V. Smagin 44 التسلسل العشوائي لأخطاء القياس السوفيتية ، مع الخصائص: M (v (k)) = 0، M (q (k) v Τ (j)) = 0، M (v (k) v Τ (j)) = الخامس (ك) δi ، j ؛ (4) بالنسبة للمصفوفات (S (k)، A (k)) يتم استيفاء شروط الملاحظة. المتجه x0 عشوائي ولا يعتمد على العمليات q (k) و v (k) ، بينما M (x (0)) = x0، M ((x (0) - x0) (x (0) - x0 ) Τ) = P0. بالنسبة للنظام (1) وقناة المراقبة (3) ، يلزم توليف مرشح يحسب تقديرًا لمتجه الحالة الذي لا يستخدم تقديرات للمكون الثابت غير المعروف للاضطرابات. 2. تركيب المرشح دعونا نحول النظام المنفصل (1). نستبعد المكون الثابت للاضطرابات f من وصف الكائن بطرح نفس المعادلة من المعادلة (1) ، ولكن مع التحول بدورة واحدة: x (k) = A (k - 1) x (k - 1 ) + f + q (ك - واحد). (5) نتيجة لذلك ، نحصل على المعادلة التالية: x (k + 1) = (A (k) + En) x (k) - A (k - 1) x (k - 1) + q (k) - ف (ك - 1). (6) دعنا نوسع مساحة الحالة للنظام بإضافة المعادلة (6) الهوية x (k) = x (k). دلالة x (k) ⎞ ⎛ q (k) - q (k - 1) ⎞. X (k) = ⎛⎜ ⎟ ⎟، q (k) = ⎜ 0 ⎝ ⎠ ⎝ x (k - 1) ⎠ نحن نمثل النظام (1) في شكل مصفوفة المتجهات X (k + 1) = A (k) X (k) + q (k)، X (0) = X 0، (7) (8) حيث A (k) هي مصفوفة 2n × 2n ببنية الكتلة التالية: ⎛ A (k) + En A ( ك) = ⎜ En ⎝ - A (ك - 1) ⎞ ⎟. 0 ⎠ (9) المتجه العشوائي X 0 = (x0Τ x − Τ1) له الخصائص التالية: M (X (0)) = X 0، M ((X 0 - X 0) (X 0 - X 0) Τ) = P0 ، (x0Τ (10) x − Τ1) Τ حيث X 0 =. لاحظ أنه هنا يتم إضافة متجه n-dimensional x − 1 بالإضافة إلى ذلك ، والذي يكون مستقلاً عن q (k) و v (k) ، ويمكن الحصول على الخصائص (10) من معلومات أولية حول الكائن (1). لاحظ أنه في النموذج المدروس (8) العملية q (k) ليست تسلسلًا غاوسيًا أبيض ، فإن العمليات q (k) و q (k - 1) ستكون مترابطة: إذا كان j = k ، ⎧ Q (k) ، ⎪ M (q (k) q (j)) = Q (k - 1) إذا كان j = k - 1 ، ⎪ 0 إذا كان 0 ≤ j< k − 1, ⎩ (11) Q(k) + Q(k − 1) 0 ⎞ ⎛ −Q(k − 1) 0 ⎞ . Q(k) = ⎛⎜ ⎟ , Q (k − 1) = ⎜ 0 0 0 0 ⎟⎠ ⎝ ⎠ ⎝ (12) Τ где Фильтрация в линейных дискретных нестационарных системах 45 Представим канал наблюдений для расширенной системы (8) в виде y (k) = S (k) X (k) + v(k) , (13) где S (k) = (S (k) 0) , v(k) − случайная последовательность ошибок измерений с характеристиками (4). В качестве уравнения для вычисления оценки вектора состояния расширенной системы выберем уравнение, по своей структуре совпадающее с фильтром Калмана: Xˆ (k + 1) = A(k) Xˆ (k) + K (k)(y (k + 1) − S (k + 1) A(k) Xˆ (k)) , Xˆ (0) = X . (14) 0 Учитывая (8) и (14), получим следующее уравнение для ошибки e(k) = Xˆ (k) − X (k) : e(k + 1) = (A(k) − K (k) S (k + 1) A(k))e(k) + K (k)v(k + 1) + (K (k) S (k + 1) − E2 n)q (k) . (15) В силу (11) и (15), матрица P (k) = M{e(k)eΤ (k)} определится из следующего разностного уравнения: P (k + 1) = (A(k) − K (k) S (k + 1) A(k)) P (k)(A(k) − K (k) S (k + 1) A(k))Τ + +(K (k) S (k + 1) − E2 n)Q (k)(K (k) S (k + 1) − E2 n)Τ + K (k)V (k + 1) K Τ (k) + +(A(k) − K (k) S (k + 1) A(k))(K (k − 1) S (k) − E2 n) × ×Q (k − 1)(K (k) S (k + 1) − E2 n)Τ + (K (k) S (k + 1) − E2 n) × ×Q (k − 1)(K (k − 1) S (k) − E2 n)Τ (A(k) − K (k) S (k + 1) A(k))Τ , P (0) = P0 . (16) Оптимизируемый критерий зададим в виде J (k + 1) = trP (k + 1) . (17) Оптимальные коэффициенты передачи фильтра K(k) определяются из условия dJ (k + 1) =0. (18) dK (k) Учитывая (17) и правую часть уравнения (16), применяя правила матричного дифференцирования следа от матрицы , получим из условия (18) уравнение для определения матрицы K(k): − A(k) P (k) A(k)Τ S (k + 1)Τ + K (k) S (k + 1) A(k) P (k) A(k)Τ S (k + 1)Τ + + K (k) S (k + 1)Q (k) S (k)Τ − Q (k) S (k + 1)Τ − K (k) S (k + 1)Q (k − 1) × ×S (k)Τ K (k − 1)Τ A(k)Τ S (k + 1)Τ + K (k) S (k + 1)Q (k − 1) A(k)Τ S (k + 1)Τ − − K (k) S (k + 1) A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + + K (k) S (k + 1) A(k)Q (k − 1) S (k + 1)Τ + Q (k − 1) S (k)Τ K (k − 1)Τ × × A(k)Τ S (k + 1)Τ − Q (k − 1) A(k)Τ S (k + 1)Τ − A(k)Q (k − 1) S (k + 1)Τ + + A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + K (k)V (k + 1) = 0 . (19) Решение последнего уравнения относительно K(k) дает следующий результат: K (k) = P (k) S (k + 1)Τ (S (k + 1) P (k) S (k + 1)Τ + V (k + 1)) −1 , (20) 46 В.И. Смагин, С.В. Смагин где P (k) = A(k) P (k) A(k)Τ + Q (k − 1)(E2 n − S (k)Τ K (k − 1)Τ) A(k)Τ + + A(k)(E2 n − K (k − 1) S (k))Q (k − 1) + Q (k) . (21) Отметим, что для вычисления коэффициентов передачи (20), в силу (21), необходимо задать начальные значения коэффициентов K(−1). Подставив в уравнение (16) выражение для оптимального коэффициента передачи (20), получим уравнение P (k + 1) = (E2 n − K (k) S (k + 1)) P(k) , P (0) = P0 . (22) Основной результат сформулируем в виде теоремы, учитывая симметричность и блочное представление матриц P (k) и P (k) : ⎛ p (k) P(k) = ⎜ 1 ⎝ p2 (k) ⎛ p (k) p2Τ (k) ⎞ , P (k) = ⎜ 1 p3 (k) ⎟⎠ ⎝ p2 (k) p2Τ (k) ⎞ , p3 (k) ⎟⎠ (23) блочные структуры матриц A(k), Q(k), Q (k), S (k) и представление матрицы K (k) в виде ⎛ K (k) ⎞ K (k) = ⎜ 1 ⎟ . (24) ⎝ K 2 (k) ⎠ Теорема. Пусть процесс с неизвестным постоянным возмущением определяется уравнениями (1) и канал наблюдений имеет вид (3). Тогда оптимальный алгоритм фильтрации определится следующими разностными уравнениями: xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1)] (25) с начальными условиями xˆ(0) = x0 , xˆ(1) = M{x(1)} = x1 . Матрица K1 (k) в (25) определяется по формуле (26) K1 (k) = p1 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 , где матрица p1 (k) вычисляется из системы уравнений (27) p1 (k) = (A(k) + En) p1 (k)(A(k) + En)Τ − A(k − 1) p2 (k)(A(k) + En)Τ − −(A(k) + En) p2Τ (k) A(k − 1)Τ + A(k − 1) p3 (k) A(k − 1)Τ + Q(k − 1) S (k)Τ K1 (k − 1)Τ × ×(A(k) + En)Τ − Q(k − 1) S (k)Τ K 2 (k − 1)Τ AΤ (k − 1) + +(A(k) + En) K1 (k − 1) S (k)Q(k − 1) − A(k − 1) K 2 (k − 1) S (k) × ×Q(k − 1) − (A(k) + En)Q(k − 1) − Q(k − 1)(A(k) + En)Τ + Q(k) + Q(k − 1) , p2 (k) = p1 (k)(A(k) + En)Τ − p2Τ (k) A(k − 1)Τ + + K1 (k − 1) S (k)Q(k − 1) − Q(k − 1) , p3 (k) = p1 (k) , p1 (k + 1) = (En − K1 (k) S (k + 1)) p1 (k) , p1 (0) = p1,0 , p2 (k + 1) = − K 2 (k) S (k + 1) p1 (k) + p2 (k) , p2 (0) = p2,0 , p3 (k + 1) = − K 2 (k) S (k + 1) p2Τ (k) + p3 (k) , p3 (0) = p3,0 , K 2 (k) = p2 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)Τ + V (k + 1)) −1 . (28) Фильтрация в линейных дискретных нестационарных системах 47 В (28) начальные условия p1,0 , p2,0 , p3,0 , являются соответствующими блоками матрицы P0 . Отметим, что для выполнения расчетов в (28) необходимо задать начальные условия для K1 (−1) и K 2 (−1) . Замечание. Управляемый объект x(k + 1) = A(k) x(k) + B(k)u (k) + f + q(k), x(0) = x0 , (29) при исключении неизвестного постоянного возмущения f объекта, необходимо преобразовать к виду, который будет отличаться от (8) одним слагаемым: X (k + 1) = A(k) X (k) + B (k)(u (k) − u (k − 1) + q (k), X (0) = X 0 , (30) где матрица A(k) приведена в формуле (9), q (k) имеет характеристики (11), (12). В (30) матрица B (k) имеет вид B (k) ⎞ B (k) = ⎛⎜ ⎟. ⎝ 0 ⎠ Тогда уравнения фильтра будут следующими: (31) xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1)) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1))] , (32) с начальными условиями (26), а матрица K1 (k) определяется в соответствии с (27) и (28). 3. Результаты вычислительного эксперимента Рассмотрим применение алгоритма фильтрации для модели второго порядка вида (1) и канала наблюдений (3) со следующими значениями параметров: 0 1 0 ⎞ ⎞ ; Q = ⎛ 0, 01 ; V = 0,9 ; A(k) = ⎛⎜ ⎟ ⎜ 0 0, 02 ⎟⎠ ⎝ ⎝ 0, 05 0,925 + 0,1sin(0, 01k) ⎠ 1, 0 1, 0 0 ⎞ S = (1 1) ; x0 = ⎛⎜ ⎞⎟ ; P0 = ⎛⎜ (33) ⎟. ⎝ 1,5 ⎠ ⎝ 0 1, 0 ⎠ Вычисление оценок вектора x(k) можно выполнить, используя двухэтапный алгоритм фильтрации . Модель измерений в этом случае с учетом (1) представляется в виде y (k + 1) = Sx(k + 1) + v(k + 1) = SA(k) x(k) + Sf + Sq(k) + v(k + 1) . (34) Рекуррентные уравнения оценивания неизвестного вектора f имеют вид fˆ (k + 1) = fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , fˆ (0) = f , 0 f Τ Τ Τ −1 K f (k) = Pf (k) S (SPf (k) S + SQS + V) , где Pf (k + 1) = (E2 − K f (k) S) Pf (k), Pf (0) = Pf0 , (35) M{ f } = f 0 , M{(f − f 0)(f − f 0)Τ } = Pf0 . (36) В.И. Смагин, С.В. Смагин 48 Оценка вектора состояния для объекта с неизвестным постоянным входом задается уравнением: xˆ (k + 1) = A(k) xˆ (k) + fˆ (k) + K (k)(y (k + 1) − SA(k) xˆ (k) − Sfˆ (k)) , (37) x где матрица K x (k) определяет коэффициенты передачи фильтра Калмана. При моделировании используем 0 1, 0 0 ⎞ f 0 = ⎛⎜ ⎞⎟ , Pf0 = ⎛⎜ (38) ⎟. ⎝0⎠ ⎝ 0 1, 0 ⎠ Применение расширенного фильтра Калмана для данного примера (в этом случае уравнение (1) расширяется путем добавления уравнения f(k+1) = f(k)) приводит к необходимости построения фильтра Калмана для дискретной системы со следующими матрицами динамики, канала наблюдений и интенсивностей аддитивных возмущений: Q 0⎞ ⎛ A(k) E2 ⎞ , (S 0) , ⎛⎜ (39) ⎟. ⎜ 0 E2 ⎟⎠ ⎝ 0 0⎠ ⎝ Использование в данном примере методов, описанных в работах , невозможно в силу невыполнения условий существования оптимальных оценок неизвестного входного вектора : n≥m и l≥m. (40) В неизвестное возмущение определяется в виде f = Gd , где d – неизвестный m-мерный вектор, G – n × m -известная матрица. В рассмотренном примере G = E2 , n = 2 , m = 2, l = 1 , а это означает, что условия (40) не выполняются. Применение алгоритма фильтрации исследовалось также для неизвестного переменного возмущения с тремя возможными значениями компонент вектора f: ⎧ 1, если 0 ≤ k ≤ 9, ⎪ f1 (k) = f 2 (k) = ⎨ −1, если 9 < k < 25, ⎪ 1, если 25 ≤ k ≤ 50. ⎩ На рис. 1 приведены реализации процессов и их оценок для трех сравниваемых фильтров. Отметим, что при реализации алгоритма фильтрации (25), начальные значения K1 (−1) и K 2 (−1) задавались нулевые. x1(k) x1(k) x2(k) x2(k) 2 10 0 –10 0 3 4 20 30 40 k –10 0 4 1 0 1 10 3 10 2 10 20 30 40 k Рис. 1. Реализации процессов и оценок (1 – реализация x(k); 2 – оценка, построенная по алгоритму (25); 3 – оценка, построенная по двухэтапному алгоритму; 4 – оценка для расширенного фильтра Калмана) Фильтрация в линейных дискретных нестационарных системах 49 На рис. 2 приведены ошибки оценивания компонент вектора состояния. e1(k) 4 2 e2(k) 4 3 1 0 –2 –4 –6 0 2 2 3 1 0 2 –2 10 20 30 40 k –4 0 10 20 30 40 k Рис. 2. Графики ошибок фильтрации (1 – ошибка для оценки, построенной по алгоритму (25); 2 – ошибка для оценки, построенной по двухэтапному алгоритму; 3 – ошибка для расширенного фильтра Калмана) Как видно из рисунков для рассмотренного примера, качество оценок, полученных с помощью фильтра (25), лучше, чем для двухэтапного алгоритма фильтрации и расширенного фильтра Калмана, использующих оценки неизвестного возмущения. Отметим также, что для алгоритма фильтрации (25) не нужно задавать априорную информацию о характеристиках распределения начальных значений f 0 и Pf0 . Ниже, в таблице, приведены средние значения среднеквадратических ошибок оценивания для трех рассматриваемых методов, рассчитанных по 50 реализациям. Как видно из таблицы, предложенный метод фильтрации (25) обеспечивает среднюю ошибку в 3 – 4 раза меньшую, чем другие методы. Средние значения среднеквадратических ошибок для компонент вектора состояния Алгоритм (25) e1,ср = 0,0912 Двухэтапный алгоритм e1,ср = 0,3128 Расширенный фильтр Калмана e1,ср = 0,4103 e2,ср = 0,0945 e2,ср = 0,2917 e2,ср = 0,4296 Заключение Разработан алгоритм синтеза дискретного оптимального нестационарного фильтра для объекта, возмущения которого содержат неизвестную постоянную составляющую. Алгоритм построен на основе расширения пространства состояния и исключения из модели неизвестной составляющей. В отличие от классического фильтра Калмана, предложенный фильтр использует рекуррентные оценки, построенные на двух предыдущих тактах. Как показали результаты вычислительного эксперимента, алгоритм может быть применен для кусочно-постоянной неизвестной аддитивной составляющей возмущений. ЛИТЕРАТУРА 1. Astrom K., Eykhoff P. System identification. A survey // Automatica. 1971. V. 7. P. 123−162. 2. Friedland B. Treatment of bias in recursive filtering // IEEE Trans. on Automat. Contr. 1969. V. AC-14. P. 359−367. 3. Chen J., Patton R. J. Optimal filtering and robust fault diagnosis of stochastic systems with unknown disturbances // IEE Proc. Control Theory Appl. 1996. V. 143. P. 31–36. 50 В.И. Смагин, С.В. Смагин 4. Darouach M., Zasadzinski M. Unbiased minimum variance estimation for systems with unknown exogenous inputs // Automatica. 1997. V. 33. P. 717–719. 5. Darouach M., Zasadzinski M., Xu S. J. Full-order observers for linear systems with unknown inputs // IEEE Trans. on Automat. Contr. 1999. V. AC-39. P. 606. 6. Gillijns S., Moor B. Unbiased minimum-variance input and state estimation for linear discrete-time systems // Automatica. 2007. V. 43. P. 111–116. 7. Hou M., Patton R. Optimal filtering for systems with unknown inputs // IEEE Trans. on Automat. Contr. 1998. V. AC-43. P. 445–449. 8. Hsieh C.-S. A unified solution to unbiased minimum-variance estimation for systems with unknown inputs // Proc.17th World Congress The International Federation of Automatic Control. Seoul. Korea. July 6 – 11, 2008. P. 14502–14509. 9. Hsieh C.-S. Robust two-stage Kalman filters for systems with unknown inputs // IEEE Trans. on Automat. Contr. 2000. V. AC-45. P. 2374–2378. 10. Hsieh C.-S. Extension of the optimal unbiased minimum-variance filter for systems with unknown inputs // Proc. 15th IEEE International Workshop on Nonlinear Dynamics of Electronic Systems. Tokushima. Japan. 2007. P. 217–220. 11. Hsieh C.-S. Robust parameterized minimum variance filtering for uncertain systems with unknown inputs // Proc. American control conference. New York. 2007. P. 5118–5123. 12. Kalman R.E., Busy R. A new results in linear filtering and prediction theory // Trans. ASME J. Basic Engr. 1961. V. 83. P. 95–108. 13. Браммер К., Зиффлинг Г. Фильтр Калмана – Бьюси. М.: Наука, 1972. 200 с. 14. Пугачев В.С., Синицин И.Н. Стохастические дифференциальные уравнения М.: Наука, 1990. 630 с. 15. Смагин С.В. Фильтрация в линейных дискретных системах с неизвестными возмущениями // Автометрия. 2009. Т. 45. № 6. C. 29−37. 16. Амосов А.А., Колпаков В.В. Скалярно-матричное дифференцирование и его применение к конструктивным задачам теории связи // Проблемы передачи информации. 1972. № 1. С. 3−15. Смагин Валерий Иванович Смагин Сергей Валерьевич Томский государственный университет E-mail: [بريد إلكتروني محمي]; [بريد إلكتروني محمي]تم استلامه في 6 ديسمبر 2010

480 فرك. | 150 غريفنا | 7.5 دولارات أمريكية ، MOUSEOFF ، FGCOLOR ، "#FFFFCC" ، BGCOLOR ، "# 393939") ؛ " onMouseOut = "return nd ()؛"> الرسالة - 480 روبل ، الشحن 10 دقائق 24 ساعة في اليوم وسبعة أيام في الأسبوع وأيام العطل

بيريوكوف رسلان سيرجيفيتش. تحكم وترشيح H-الأمثل المعمم المنفصل في الأجسام الخطية المستمرة: أطروحة ... مرشح العلوم الفيزيائية والرياضية: 01.01.09 / Biryukov Ruslan Sergeevich؛ ن. Lobachevsky "] ، 2017

مقدمة

الفصل 1. نظرة عامة على نظرية التحكم والتصفية المعممة للأنظمة الخطية المنفصلة 8

1. معمم - عادي لجسم خطي 8

2. توليف التحكم المعمم 11

3. توليف عامل التصفية المعمم 13

الفصل 2 معمم - عادي لكائن مستمر مع إخراج هدف منفصل 15

1. مستوى قمع الاضطراب في مصنع مستمر منفصل 15

2. أسوأ الاضطرابات الخارجية والحالة الأولية في كائن منفصل باستمرار 28

3. مستوى قمع الاضطرابات في كائن منفصل منفصل 32

4. أسوأ الاضطرابات الخارجية والحالة الأولية في منشأة منفصلة منفصلة 49

5. مستوى قمع الاضطرابات في حالة الأفق اللامتناهي 56

6. توصيف مستوى قمع الاضطراب من حيث LMI 61

7- الاستنتاجات 64

الفصل 3 معمم منفصل - التحكم الأمثل 66

1. توليف السيطرة المثلى من قبل الدولة 66

2. توليف التحكم الأمثل في الإخراج 74

3. التحكم في التعليق الكهرومغناطيسي 94

4- الاستنتاجات 101

الفصل 4 الترشيح الأمثل المعمم المنفصل 102

1. تركيب المرشح الأمثل 102

2. ترشيح البيانات في مشكلة تخميد اهتزازات المبنى 108

3. النتائج 114

الخلاصة 115

فهرس

مقدمة في العمل

أهمية موضوع البحث.يتم تنفيذ أنظمة التحكم الحديثة ، كقاعدة عامة ، في شكل رقمي ، بينما تعمل معظم الكائنات الحقيقية في وقت مستمر. يؤدي هذا التقسيم إلى أجزاء تمثيلية ورقمية إلى فقدان المعلومات ، نظرًا لأن قيم الإشارة المستمرة القادمة من الكائن إلى وحدة التحكم لا تُعرف إلا في أوقات منفصلة ثابتة. لهذا السبب ، يصبح من المهم تحليل وتوليف وحدة تحكم منفصلة تأخذ في الاعتبار سلوك الكائن الأصلي قدر الإمكان في بعض الأحيان بين القياسات. اعتمادًا على فئات الاضطرابات الخارجية التي تعمل على الكائن ، والأهداف النهائية للتحكم ، هناك طرق مختلفة لحل هذه المشكلة. من الأمور ذات الأهمية الخاصة الحالة التي يتأثر فيها الجسم باضطرابات خارجية ذات "طاقة" محدودة ، والهدف من التحكم هو تقليل "الطاقة" الإجمالية للخرج المستهدف للكائن. في هذه الحالة ، تكمن المشكلة في مشكلة تحكم أمثل٪ 00 منفصلة لمحطة مستمرة تعتمد على قياسات متقطعة زمنيًا.

تم اقتراح طرق مختلفة لحل هذه المشكلة. كان أحد أولهما نهجًا يعتمد على تمثيل النظام المستمر الأصلي مع خرج منفصل على أنه منفصل مستمر ، يتم وصف سلوكه بواسطة مجموعة من المعادلات التفاضلية والفرق (Sun W. ، Nagpal K.M. ، Poolla K.R. ، Khargonekar P.P. ، Sagfors M.F. ، Toivonen HT ، إلخ). في هذه الحالة ، استند الإجراء الخاص بتصميم 7 ^ ^ - وحدات التحكم والمرشحات المثلى على معادلات Riccati التفاضلية ، والتي تقفز حلولها في بعض الأحيان مع الملاحظات. يواجه التنفيذ العملي لخوارزميات التوليف المقترحة عددًا من الصعوبات المرتبطة بحل مشكلة القيمة الحدودية غير الخطية لمعادلات Riccati التفاضلية.

تم استخدام نهج مماثل في أعمال Basar T. و Bernhard P. ، حيث تم النظر في مشكلة المنفصلة ^ ^ - التحكم الأمثل في مصنع مستمر من وجهة نظر نظرية اللعبة. تمت صياغة شروط وجود٪ ^ - المتحكمات المثلى في حالة الحالة المقاسة للكائن من حيث معادلات ريكاتي ، كما أن الإجراء الخاص بتركيب وحدات التحكم هذه يعتمد أيضًا على حل مشكلة القيمة الحدودية غير الخطية.

يعتمد نهج آخر على استخدام طريقة الرفع ، حيث يتم تحويل النظام المستمر الأصلي إلى نظام منفصل مكافئ (Bamieh B.A.، Pearson J.B.، Chen T.، Francis B.A.، Tadmor G.، Sagfors M.F.، Toivonen H.T.، Lall S. ، Dullerud G. ، إلخ.). في الوقت نفسه ، نظرًا لأنه بين لحظات المراقبة ، فإن الاضطراب الخارجي ، وكذلك الناتج المستهدف للكائن الأصلي ، عبارة عن وظائف متواصلة متعددة المستويات ، والاضطراب والإخراج المستهدف للنظام المنفصل المكافئ ينتمي بالفعل إلى لانهائي

مساحة الأبعاد. في هذه الأعمال ، يعتمد توليف وحدات التحكم المثلى على حل متسلسل (تكراري) لمعادلات Riccati الجبرية أو المتكررة ، اعتمادًا على المعلمة المساعدة المطلوب تصغيرها. يؤدي التنفيذ العملي لهذا الإجراء إلى صعوبات حسابية.

أخيرًا ، في أعمال Yu.V. تمت صياغة شروط وجود -control في شكل شروط كافية من حيث عدم مساواة المصفوفة الخطية.

أحد أوجه القصور المهمة في نظرية -control هو افتراض أنه في اللحظة الأولى من الوقت يكون الجسم في حالة سكون ، أي أن حالته الأولية هي صفر. إذا لم يتم استيفاء هذا المطلب ، فإن وحدات التحكم المركبة تمنع الاضطرابات الخارجية جيدًا ، ولكنها لا تتعامل دائمًا بشكل مناسب مع مهمة إخماد الاضطرابات الأولية الناتجة عن الظروف الأولية غير الصفرية. في هذه الحالة ، تم اقتراح معيار عام كمعيار واحد يأخذ في الاعتبار تأثير كل من الاضطرابات الخارجية والأولية (Khargonekar P.P. ، Nagpal K.M. و Poolla K.R.). يتزامن هذا المعيار مع الوضع الكلاسيكي ، إذا كان الكائن في حالة راحة في اللحظة الأولى من الوقت ، وعندما تكون الحالة الأولية للكائن غير صفرية ، ولا يوجد اضطراب خارجي ، فإن الحالة الطبيعية العامة تتزامن مع 0 - القاعدة المحددة في أعمال Balandin D.V. وكوجان م. بالنسبة للكائنات المستمرة ذات الإخراج القابل للقياس المستمر ، تم تصنيع قوانين التحكم والتصفية المستمرة في أعمال Khargonekar P.P. ، Nagpal K.M. ، Balandin D.V. ، Kogan M.M. وآخرون.في حالة وجود كائن مستمر مع خرج منفصل ، فإن عمل Sun W. ، Nagpal K.M. و Khargonekar P.P. ، حيث تم الحصول على حل لمشكلة التحكم المعممة المنفصلة لكائن في أفق لا نهائي. في هذه الحالة ، تستند قوانين التحكم والتصفية المصاغة إلى حل معادلة Riccati التفاضلية غير الخطية ، مما يجعل استخدامها صعبًا. وبالتالي ، فإن التطوير الإضافي لنظرية التحكم العام المنفصل للأنظمة المستمرة هي مهمة ملحة للغاية لنظرية التحكم.

الغرض من الرسالة. الهدف الرئيسي من العمل هو تطوير نظرية التحكم والترشيح المعمم المنفصل للأنظمة الخطية المستمرة. وفقًا للهدف ، تهدف الرسالة إلى حل المشكلات التالية:

بالنسبة للكائنات الخطية غير الثابتة في فترة زمنية محدودة ، احصل على شروط وجود ومعادلات قوانين التحكم المثلى المعممة المنفصلة في فئة ردود الفعل الخطية غير الثابتة وفي فئة الديناميكية الكاملة غير الثابتة الخطية تحكم في الإخراج.

بالنسبة للكائنات الخطية الثابتة في فترة زمنية غير محدودة ، احصل على شروط وجود ومعادلات قوانين التحكم المثلى المعممة المنفصلة في فئة ردود الفعل الخطية للحالة الثابتة وفي فئة وحدات التحكم الديناميكية الخطية الثابتة ذات الترتيب الكامل في المخرجات.

بالنسبة للكائنات الخطية غير الثابتة في فترة زمنية محدودة ، احصل على شروط وجود ومعادلات المرشحات الكاملة غير الثابتة المعممة والمثالية في شكل مراقب.

بالنسبة للكائنات المستقرة الخطية في فترة زمنية محدودة ، احصل على شروط الوجود والمعادلات الخاصة بالمرشحات الثابتة المعممة والمثلى كاملة الترتيب في شكل مراقب.

طرق البحث. تستخدم الورقة طرق حساب التباينات والتحكم الأمثل ، ونظرية التحسين المحدب ، وعلى وجه الخصوص ، نظرية البرمجة شبه المحددة.

الجدة العلمية والنتائج الرئيسية. في الأطروحة ، تم الحصول على النتائج الجديدة التالية حول نظرية التحكم والتصفية المعممة المنفصلة بواسطة كائنات خطية متصلة:

    يتضح أن الحالة الطبيعية المعممة لنبات خطي غير ثابت على فترة زمنية محدودة تم العثور عليها كحل لمشكلة قيمة حدية غير خطية لتفاضل مصفوفة أو معادلة ريكاتي ، وكذلك من حيث متباينات المصفوفة الخطية. في حالة وجود جسم ثابت خطي ثابت في فترة زمنية غير محدودة ، يتم العثور على العادي-العادي كحل لمعادلة Riccati الجبرية المنفصلة أو من حيث عدم المساواة في المصفوفة الخطية (يتوافق مع الفقرة 6 من جواز السفر التخصصي 01.01.09) .

    بالنسبة للأشياء الخطية غير الثابتة على فترة زمنية محددة ، يتم الحصول على الشروط الضرورية والكافية ، وفي حالة الحالة غير القابلة للقياس ، يتم الحصول فقط على الشروط الكافية لوجود قوانين تحكم معممة منفصلة. يتم تجميع قوانين التحكم هذه في فئة ردود الفعل الخطية غير الثابتة وفي فئة وحدات التحكم في الإخراج الديناميكي الخطية غير الثابتة (يتوافق مع الفقرة 6 من جواز السفر التخصصي 01.01.09).

    بالنسبة للأجسام الثابتة الخطية في فترة زمنية غير محدودة ، يتم الحصول على الشروط الضرورية والكافية لوجود قوانين تحكم معممة منفصلة. يتم تجميع قوانين التحكم هذه في فئة ردود الفعل الخطية الثابتة وفي فئة وحدات التحكم في الإخراج الديناميكي الخطي الثابت (يتوافق مع الفقرة 6 من جواز السفر التخصصي 01.01.09).

    بالنسبة للأجسام الخطية غير الثابتة على فاصل زمني محدد (لانهائي) ، يتم الحصول على الشروط الضرورية والكافية للوجود وتوليف غير ثابت (ثابت) متقطع معمم "H ^ - المرشحات المثلى بترتيب كامل في شكل يتم تنفيذ مراقب

    كتطبيقات منفصلة المعممة تي ^- أدوات التحكم المثلى في مشكلة التحكم في الجسم في نظام التعليق الكهرومغناطيسي والمرشحات المثلى المعممة المنفصلة في مشكلة التخميد الاهتزازي للمباني والمنشآت الشاهقة (يتوافق مع الفقرة 6 من جواز السفر التخصصي 01.01.09).

الالتزام بقانون التخصص.يتوافق العمل مع صيغة التخصص 01.01.09 - الرياضيات المنفصلة وعلم التحكم الآلي الرياضي ويغطي مجالات البحث التالية المدرجة في التخصص 01.01.09: p. 6. النظرية الرياضية للتحكم الأمثل.

الأهمية النظرية والعملية.العمل نظري بطبيعته ويمثل تطوير نظرية "H ^ - التحكم الأمثل للأشياء المستمرة. يتم إحضار النتائج التي تم الحصول عليها فيها إلى الإجراءات البناءة ، والتي يتم تأكيد فعاليتها من خلال توليف المنظمين في مشكلة التحكم في نظام التعليق الكهرومغناطيسي وتركيب المرشحات في مشكلة تخميد التذبذبات للمباني والمنشآت الشاهقة.

درجة المصداقية والاستحسان لنتائج الدراسة.تمت مناقشة النتائج الرئيسية لأعمال الأطروحة في اجتماع ندوة نيجني نوفغورود العلمية "النمذجة الرياضية لديناميات النظم وعمليات التحكم" في معهد أبحاث الرياضيات التطبيقية وعلم التحكم الآلي ، كما تم الإبلاغ عنها في الندوة الدولية والجميع التالية -المؤتمرات الروسية:

المؤتمر العلمي لعموم روسيا "التذبذبات غير الخطية للأنظمة الميكانيكية" الذي يحمل اسم V.I. يو. نيمارك (نيجني نوفغورود ، 2016) ؛

المؤتمر الدولي الثالث عشر "استقرار وتذبذبات أنظمة التحكم غير الخطية" (مؤتمر بياتنيتسكي) (موسكو ، 2016) ؛

المؤتمر الحادي عشر لعموم روسيا حول المشكلات الأساسية للميكانيكا النظرية والتطبيقية (كازان ، 2015) ؛

المؤتمر الدولي حول نظرية وميكانيكا التحكم الرياضي (سوزدال ، 2015) ؛

المدرسة الصيفية السادسة للشباب في عموم روسيا التقليدية "الإدارة والمعلومات والتحسين" (موسكو ، 2014) ؛

المؤتمر الثاني عشر لعموم روسيا حول مشاكل الإدارة (موسكو ، 2014) ؛

الدورة التاسعة عشرة في نيجني نوفغورود للعلماء الشباب: العلوم الطبيعية والرياضية (نيجني نوفغورود ، 2014).

في 2013-2014 و 2014-2015 تم دعم البحث بمنحة تحمل اسم الأكاديمي ج. Razuvaev لطلاب الدراسات العليا ، وكذلك منحة من حكومة الاتحاد الروسي (2014-2015).

تم الحصول على نتائج الفصول الثلاثة الأولى من الرسالة خلال تنفيذ المشروع رقم 14-01-31120 mol_a في 2014-2015. (رئيس) والمشاريع رقم 12-01-31358 mol_a في 2012-2013 ، رقم 14-01-00266 في 2014-2016. (المنفذ) ، بدعم مالي من المؤسسة الروسية للأبحاث الأساسية.

تم الحصول على نتائج الفصل الرابع بدعم مالي من وزارة التعليم والعلوم في الاتحاد الروسي في إطار برنامج الهدف الفيدرالي "البحث والتطوير في المجالات ذات الأولوية لتطوير المجمع العلمي والتكنولوجي لروسيا لعام 2014 -2020 "(الاتفاقية 14.578.21.0110 بتاريخ 10/27/2015 ، المعرف الفريد RFMEFI57815X0110).

المنشورات.يتم تقديم النتائج الرئيسية حول موضوع الرسالة في 10 منشورات ، بما في ذلك 4 منشورات في المجلات العلمية الرائدة التي أوصت بها لجنة التصديق العليا التابعة لوزارة التعليم والعلوم في الاتحاد الروسي -] ، وقائع مؤتمرين دوليين وأربعة ملخصات تقارير المؤتمرات الإقليمية وكل روسيا [-. في العمل المشترك] يمتلك المؤلف نتائج المحاكاة العددية.

المساهمة الشخصية لمقدم الطلب.تم إجراء جميع الدراسات المقدمة في عمل الأطروحة شخصيًا من قبل مقدم الطلب في سياق النشاط العلمي. من بين المنشورات المشتركة ، يتم تضمين المواد التي تنتمي مباشرة إلى مقدم الطلب فقط في الرسالة.

هيكل ونطاق العمل.تتكون الرسالة من مقدمة وأربعة فصول وخاتمة وقائمة مراجع. يتكون العمل من 123 صفحة ، ويحتوي على 11 رسماً إيضاحياً. تضم قائمة المراجع 81 عنوانا.

توليف التحكم المعمم

في نظرية٪ oc-control المعمم ، يتم اعتبار كائن خطي يمكن التحكم فيه ، والذي يخضع لعمل خارجي واضطراب أولي ناتج عن ظروف أولية غير معروفة. إذا كان الكائن في حالة سكون في اللحظة الأولى من الوقت ، أي أن الاضطراب الأولي يساوي صفرًا ، فإن مستوى قمع الاضطراب الخارجي ، الذي يتزامن مع القاعدة ، يؤخذ كمقياس للتأثير التأثير الخارجي على الكائن قيد الدراسة ، ومشكلة تصميم عنصر تحكم يقلل من هذا المعيار هي مشكلة التحكم الأمثل H. على العكس من ذلك ، عندما تكون الحالة الأولية غير صفرية ولا يوجد اضطراب خارجي ، يُفهم مقياس استجابة النظام على أنه مستوى التخميد للاضطراب الأولي ، والذي يساوي القاعدة 70. في هذه الحالة ، يُعرف قانون التحكم الذي يعمل على تحسين العملية المؤقتة في أسوأ الحالات بـ 7o-Optimal. في الحالة العامة ، تكون هذه المعايير متناقضة ؛ لذلك ، فإن الهدف الرئيسي للسيطرة على٪ oc العامة هو تحديد قانون التحكم ، والذي سيكون بمثابة حل وسط عند تقييم تأثير كل من الاضطرابات الخارجية والأولية.

نقدم الآن الحقائق الرئيسية المتعلقة بمعيار Hoo المعمم ، بينما في العرض التقديمي سنتابع الأعمال. من أجل التحديد ، ضع في اعتبارك كائنًا خطيًا منفصلًا غير ثابت بالشكل Xk + i = Axk + Bkvk ، k = 0 ، ... ، N-l ، zk = Ckxk + Dkvk ، حيث - اضطراب خارجي ، N-l t محدود في 2-معيارية : vk vk oo.fc = 0

لنفترض أنه في الحالة العامة ، تكون الحالة الأولية x0 غير صفرية وغير معروفة ، ويتم تفسير تأثيرها على ديناميكيات الكائن على أنه اضطراب أولي.

سيتم تمييز الناتج المتحكم فيه من المصنع لحالة أولية ثابتة x0 وتسلسل الاضطرابات v0 ، ... ، vN_ i بقيمة الوظيفة N-1 j (x0 ، v0 ، ... ، vN_ij = \ \ z \\ i2 + xNSxN = Y zk zk - \ - xNSxN، (1.2) fc = 0 حيث S = S 0 هي مصفوفة الوزن التي تحدد الأولوية بين جودة عملية الانتقال والحالة النهائية للكائن.

أولاً ، نأخذ في الاعتبار حالتين متطرفتين بشكل منفصل: الاضطراب الأولي فقط أو الاضطراب الخارجي الوحيد الذي يعمل على الكائن. دع الجسم يكون في وضع الراحة في اللحظة الأولى من الزمن ، وهو ما يتوافق مع الحالة عندما لا يكون هناك اضطراب أولي. بعد ذلك ، نحدد مؤشر تأثير الاضطرابات الخارجية على الناتج المستهدف (1.1) - مستوى قمع الاضطرابات الخارجية - كالقيمة النسبية للوظيفة (1.2) في أسوأ الحالات: J (0 ، VO ،. ..، VN_1) 2 = sup 2 0 2

لاحظ أنه إذا كان الكائن (1.1) ثابتًا وتم اعتباره في فترة زمنية غير محدودة ، فعندئذٍ ، باستخدام مساواة بارسيفال ، يمكننا إظهار أن التعبير (1.3) يتطابق مع المعيار 7 للكائن المدروس. يصف البيان التالي مستوى قمع الاضطراب الخارجي من حيث حلول عدم المساواة في المصفوفة الخطية.

البيان 1.1. مستوى قمع الاضطراب الخارجي في النظام (1.1) يلبي المتباينة 7oo 7 على فترة زمنية محدودة إذا وفقط إذا كانت متباينات المصفوفة الخطية / AlXk + 1Ak - Xk AjXk + lBk Ck \ i) 0 ، (1.4) هي قابل للحل فيما يتعلق بالمصفوفات Xk = Xk 0 ، k = 0 ، ... ، N - 1 ، لـ XN = S.

ويترتب على ذلك التأكيد على أن مستوى قمع الاضطراب الخارجي 7oo تم العثور عليه على أنه أقل حد لمجموعة من جميع السبعة التي يكون نظام متباينات المصفوفة الخطية (1.4) قابلاً للحل فيما يتعلق بالمصفوفات Xk = Xk 0 و 7.

إذا لم يكن هناك اضطراب خارجي ، فإن تأثير الاضطراب الأولي على جودة العملية المؤقتة في النظام (1.1) يمكن تمييزه بالكمية 2 J (x0،0، ...، 0) 70 = sup 2 ( 1.5) وهو ما يسمى مستوى التخميد للاضطراب الأولي. يوضح B أنه يمكن إيجاد هذه القيمة كحل لمشكلة التحسين مع القيود المعطاة بواسطة متباينات المصفوفة الخطية.

البيان 1.2. مستوى قمع الاضطراب الأولي في النظام (1.1) على فترة زمنية محددة يلبي عدم المساواة 70 7 إذا وفقط إذا كانت متباينات المصفوفة الخطية ATkXk + 1Ak -Xk + ClCk 0، X0 -f2I، (1.6) قابلة للحل باستخدام فيما يتعلق بالمصفوفات k = 0 ، ... ، N - 1 ، لـ XN = S. لوصف التأثير المشترك للاضطرابات الخارجية والأولية على ناتج المصنع (1.1) ، نحدد مستوى قمع الاضطراب كنوع من تلافيف العاملين المدروسين: 7W = sup

Jx0 ، v0 ،. . . ، VN_1 = F ، (1.7) حيث R = R 0 عبارة عن مصفوفة وزن مصممة لتعيين الأولوية بين الاضطراب الخارجي ومكونات الحالة الأولية. يُطلق على الأس الذي تم تقديمه بهذه الطريقة اسم المعيار 7 المعمم. من السهل أن نرى أنه في الحالات القصوى ، يصبح التعبير (1.7) إما (1.3) أو (1.5) ، أي بالنسبة إلى x0 = 0 لدينا 7w = 7oo ، وبالنسبة لـ v = 0 نحصل على -). اتضح أن مستوى قمع الاضطرابات يمكن التعبير عنه من حيث عدم مساواة المصفوفة الخطية ؛ لهذا ، يكفي أن يتطلب وجود حل عام لعدم المساواة (1.4) و (1.6) ، يميز بشكل منفصل مستوى قمع الاضطراب الخارجي ومستوى التخميد للاضطراب الأولي ، مع مراعاة معامل الوزن.

مستوى التخميد المضطرب في النظام (1.1) على فترة زمنية محددة يفي بالمتباينة 7w 7 إذا وفقط إذا كانت متباينات المصفوفة الخطية (A.

أسوأ الاضطرابات الخارجية والحالة الأولية في مصنع منفصل باستمرار

نلاحظ أنه وفقًا للنظرية المصاغة ، يتم التعبير عن مستوى التخميد للاضطرابات 7C بمساعدة العلاقة (2.45) من حيث قيمة دالة المصفوفة X (t). ومع ذلك ، بسبب المعادلة (2.6a) ، فإن الكمية X (t) تعتمد ضمنيًا على y. نتيجة لذلك ، لتحديد مستوى التخميد المضطرب ، تنشأ مشكلة قيمة حدية غير خطية لمعادلة Riccati التفاضلية: لإيجاد حل للمعادلة (2.6a) بشروط حدية (2.6b) و (2.45) ، وكذلك الحالة (2.6 د).

دعونا ننتقل الآن إلى إثبات النظرية.

إثبات النظرية 2.2. من السهل إظهار أن العلاقة (2.4) تعادل المساواة sup J (xo، v، w) = 0. (2.48) Иі! 2 + ІНІ2 2 + 0Д 0 = і وفقًا للصيغة (2.39) ، الوظيفة الوظيفية يمكن كتابة J (x0، v، w) على النحو التالي: J (x0، v، w) = xUcJC0 + X (t0) -٪ R) X0٪ \\ v - v \\ l2 + N-l + J2 (wk w k ) T (AjX (tk) Ak -٪ l) (wk - w k) + fc = l + wN - w N (AdgbAdg - 7C- (wN - w N c) و (2.6e) ، المصطلح الأول ليس- موجب محدد ، والمصطلحات المتبقية عبارة عن أشكال تربيعية محددة سالبة ، لذلك تختفي القيمة القصوى للدالة J (x0 ، v ، w) عند v = v و wk = w k ، k = 1 ، .. ، N ، و الاختيار المقابل لـ x0. لذلك ، فإن الاضطرابات v و ​​wl هي أسوأ الاضطرابات الخارجية فيما يتعلق بالمعيار 7c. دعونا نستبدل v و w k في العلاقة (2.48) ، ثم: sup J (x0، v، w) = sup xUx (t0) + CjC0 - fcR) x0. \\ v \\ L + \\ v \\ 2 + x0R 0 = l ll «llL + lh ll2 + ftr0 = l الآن نلاحظ ذلك ، ونعتمد على 0 والعلاقات العلاقات: v (t) = b1B (t) X (t) b (t، t0) x0، / -r- \ -1 -r w k = - (AjX (tk) Ak - 7c AjX (t (tk - 0، t0) x0 ، هنا Ф (Mo) هي المصفوفة الأساسية لحلول النظام المغلق (2.115). لذلك ، القيد هو شكل تربيعي في x0: \\ v \\ l2 + \\ w \\ l + xUxo = x Qx0 = l ، حيث tN Q = R + 1-2 (t) W (t) X ( t) F (t، i0) (it + "o N + fc = l J2 fT (- 0، t0) X (tk) Ak (AlX (tk) Ak - 7cL \ іX (ik) Ф (ік - 0 ، t0) وهكذا يتم تقليل المشكلة (2.48) إلى ما يلي: sup x0 PIKO = 1 Xo (x (t0) + C0TC0 - 7ci؟ W

لحل المشكلة الأخيرة ، نستخدم قاعدة مضاعف Lagrange: يجب أن تفي نقطة الحد الأقصى x0 بنظام المعادلات: المعادلة الأولى كـ (X (t0) + CQ С0 + / іП) х0 = lcRxo ، حيث نجد хо = «emax (R 1 \ x (t0) + CjC0 + ц Ы V 7с = Амах (і؟ -1 [х (0) + С0ТСo + / х fil V تم العثور على قيمة a من المعادلة الثانية (2.49)) القيم الموجودة في الشكل التربيعي وتبسيطها: حسب الشرط ، الحد الأعلى الدقيق يساوي صفرًا ، وبالتالي / i = 0. استبدال القيمة التي تم العثور عليها / i في التعبير عن x0 ، نصل إلى العلاقات (2.45) و (2.46 ج).

دعونا نصيغ ونثبت عدة نتائج طبيعية تجيب على السؤال حول أسوأ الاضطرابات المطبقة على مستويات قمع الاضطراب الأولي C ، والاضطراب الخارجي المستمر ج ، والاضطراب الخارجي المنفصل Г ، ومستوى قمع الاضطرابات الخارجية المختلطة ج ث.

النتيجة الطبيعية 2.5. في المصنع (2.1) و (2.2) و (2.3) ، يتم تحقيق مستوى التخميد للاضطرابات الأولية c = max (J0 + (0)) (2.50) في أسوأ حالة ابتدائية = max (J0 + (0) ] ، (2.51) حيث () هو حل النظام (2.41) الموجود في c. إثبات نظرًا لأن المصنع لا يتأثر باضطراب خارجي مستمر أو منفصل ، يتم الحصول على العلاقة (2.51) من العلاقات (2.46) إذا ضع الأخير = ، () = 0 و k = 0 ، = 1 ، ... ، النتيجة الطبيعية 2.6 في المصنع (2.1) ، (2.2) ، و (2.3) ، مستوى قمع الاضطرابات الخارجية المستمرة ї = الحد الأقصى (J0 + (0)) (2.52) يتحقق في أسوأ اضطراب خارجي () = ") 1T () () () ، (2.53) حيث () هو حل النظام (2.42) الموجود في s.

دليل - إثبات. يتم الحصول على العلاقة (2.53) من العلاقات (2.46) إذا قمنا بتعيين k = 0 ، = 1 ، ... في الأخير ، وهو ما يعادل حقيقة أن الاضطراب الخارجي المنفصل لا يعمل على الكائن ، وبسبب في حالة عدم وجود اضطراب أولي ، من الضروري تجاهل الشرط (2.46 ج) ووضع = في العلاقة (2.45).

النتيجة الطبيعية 2.7. في الشكل (2.1) و (2.2) و (2.3) ، يتحقق مستوى التخميد للاضطرابات الخارجية المنفصلة c = max (j 0 + (0)) (2.54) مع أسوأ اضطراب خارجي / -r- \ -1 -r k = - (j (k) k - c ") j (k) (k - 0) ، (2.55) حيث () هو حل المعادلة (2.43) مع وجود الشروط (2.6b) و (2.6d) ل ج " دليل - إثبات. نظرًا لأن الكائن لا يتأثر باضطراب خارجي مستمر ، يتم الحصول على العلاقة (2.55) من العلاقات (2.46) إذا حددنا B (i) = 0 في الأخير ، وبسبب عدم وجود اضطراب أولي ، الشرط (2.46) ج) يجب التخلص منها ووضعنا R = I بالنسبة (2.45). النتيجة الطبيعية 2.8. في المصنع (2.1) و (2.2) و (2.3) ، تم تحقيق مستوى التخميد للاضطرابات الخارجية المختلطة lT = Amax (cJC0 + X (t0)) (2.56) لأسوأ الاضطرابات الخارجية - fc wl \ AjX (tk ) x (tk-0) ، (2.57a) v (t) = (w) 1BT (t) X (t) x (t) ، (2.57b) حيث X (i) - حل النظام (2.6a) تم العثور على (2.6 ب) و (2.6 د) بالنسبة لـ٪ w إثبات نظرًا لأن المصنع لا يتأثر بالاضطراب الأولي ، إذن ، تجاهل الحالة (2.46 ج) في العلاقات (2.46) وتحديد R = І في الصيغة (2.45) ، نحصل على العلاقات (2.57).

نلاحظ مرة أخرى أن نظرية 2.2 ونتائجه تسمح لنا بتقليل حساب مستويات التخميد للاضطراب المقابلة لحل مشكلة القيمة الحدودية غير الخطية. يمكن حل هذا الأخير بطرق عددية مختلفة ، على سبيل المثال ، عن طريق التكرار البسيط. دعونا نصف بإيجاز تطبيق هذه الطريقة باستخدام مثال حساب مستوى التخميد المضطرب 7 ج. نختار قيمة أولية كبيرة بما يكفي 7 ونحل المشكلة (2.6b) و (2.6a) و (2.6d). بعد ذلك ، باستخدام الصيغة (2.45) ، نحسب التقريب التالي لـ 7 ج. سنكرر هذا الإجراء حتى يصبح الفرق بين قيمتين متجاورتين أقل من بعض الأرقام الموجبة الصغيرة المعينة مسبقًا. أحد العوائق المهمة للنهج المذكور ، بالإضافة إلى النقص المحتمل في تقارب تسلسل التقريب المتولد ، هو الحاجة إلى حل معادلة تفاضلية مصفوفة في كل خطوة. يمكن القضاء على هذا عن طريق الانتقال من نموذج منفصل مستمر إلى نموذج منفصل. القسم التالي مخصص لتنفيذ هذه الفكرة.

توليف التحكم الأمثل في الإخراج

نقوم بتجميع المصطلحين الأول والثاني في (2.105) وتبسيط تعبير P2 ، والذي نطبق عليه مرة أخرى صيغة Sherman-Morrison-Woodbury ، ثم: + lXk + l (I - Ek + 1 \ k-IgEtk + 1Xk + 1) Ek + 1] kC GTk + lCk = -g / -g \ -1 -g = CTkGk + l (Wk + l - ETk + lXk + lEk + l) GTk + lCk و P2 = ATkXk + l l - Ek + ل ، يتم تشكيل المصفوفة S ، على سبيل المثال ، وفقًا للصيغة

تسمح النظرية 3.4 أيضًا للفرد بتوليف التحكم الأمثل بالقدم في الإخراج خلال فترة زمنية غير محدودة. للقيام بذلك ، يكفي إيجاد حل لمشكلة التصغير 7 ج () في ظل القيود التي قدمتها المتباينات (3.51) ، وبعد ذلك يتم إيجاد المتحكم الأمثل كحل لـ (3.52).

أخيرًا ، في ختام القسم ، نقدم بدون دليل النتائج الطبيعية من النظرية 3.4 ، والتي تحدد الشروط اللازمة والكافية لوجود ضوابط 70- و Pse فيما يتعلق بإخراج مصنع ثابت في أفق غير محدود.

النتيجة الطبيعية 3.13. بالنسبة لمصنع ثابت (3.21) ، (3.22) ، ل 7 0 معين ، يوجد تحكم منفصل في الإخراج على فترة زمنية غير محدودة إذا وفقط إذا كانت متباينات المصفوفة الخطية Ah ، XAh 0 ، С1 AhYAl Y C1YAl (Wc2 0 0 II МТ X I C1YCj WC 0 0 I M 0، (3.53a) (3.53b) x l Y 0، X yl، (3.53c) قابلة للحل فيما يتعلق X = X 0، Y = Y 0 وأعمدة المصفوفات يشكل Wr KJ 2 و M أساس حبات المصفوفة على التوالي.

النتيجة الطبيعية 3.14. بالنسبة لمحطة ثابتة (3.21) ، (3.22) في فترة زمنية لانهائية ، يوجد عنصر تحكم منفصل في الإخراج AND يوفر التخميد للاضطرابات الخارجية المستمرة مع 7 0 إذا وفقط إذا كانت متباينات المصفوفة الخطية وأول عدم المساواة ( 3.51c) قابلة للحل فيما يتعلق X \ u003d X O ، Y \ u003d Y O ، وتشكل أعمدة المصفوفات Wr و M قواعد المسافات ket Co و ket [B .. D- ،) ، على التوالي.

النتيجة الطبيعية 3.15. بالنسبة لمحطة ثابتة (3.21) ، (3.22) في فترة زمنية لانهائية ، هناك عنصر تحكم منفصل في الإخراج AND يوفر التخميد للاضطرابات الخارجية المنفصلة مع 7 O ، إذا وفقط إذا كانت هناك مصفوفات X = X O ، Y = Y O ، تحقق متباينات المصفوفة الخطية والمتباينة الأولى في (3.51c) ، بينما تشكل أعمدة المصفوفات N و M قواعد مسافات ker (C2 D2j و ker [B و Dx) ، على التوالي. النتيجة الطبيعية 3.16. بالنسبة لمحطة ثابتة (3.21) ، (3.22) في فترة زمنية لانهائية ، يوجد تحكم AND منفصل على المخرجات ، مما يضمن تخميد الاضطرابات الخارجية المختلطة بـ 7 0 معينة إذا وفقط إذا كانت متباينات المصفوفة الخطية ( 3.51a) و (3.51b) والمتباينة الأولى (3.51c) قابلة للحل فيما يتعلق بالمصفوفات XT = X 0 و Y = Y 0 ، بينما تشكل أعمدة المصفوفات N و M قواعد المسافات ker C2 0 D2 0 و ker B1 Dj 0 0 على التوالي.

ويترتب على الملاحظة إلى النظرية 2.8 أن هناك مصفوفة محدودة R بحيث ، لأي معامل وزن R R ، يتزامن جهاز التحكم في الإخراج H-الأمثل المعمم على فاصل زمني لانهائي مع // - جهاز التحكم في الإخراج الأمثل المركب بواسطة Corollary 3.16 و توفير قمع الاضطرابات الخارجية المختلطة. لذلك ، للحصول على حل وسط حقيقي عند الأخذ في الاعتبار تأثيرات الاضطرابات الأولية والخارجية ، يجب أن تفي مصفوفة الوزن R بشرط Atax (L_1L) І. عدديًا ، يتم تحديد القيمة الحدودية R لمصفوفة الوزن على النحو التالي: brx y1 ، حيث تشير X إلى المصفوفة التي تفي بعدم المساواة (3.51a) ، (3.51b) وأول عدم المساواة (3.51c) بحد أدنى لقيمة 7 ج.

خذ بعين الاعتبار ما هو مبين في الشكل. 3.3 نظام ميكانيكي يتكون من جسم معلق كتلته م ومغناطيس كهربائي. يتم توفير ارتفاع الجسم من خلال تغيير في المجال المغناطيسي ، والذي يحدث بسبب تغيير في الجهد U المطبق على لف المغناطيس الكهربائي. تخضع ديناميكيات هذا التعليق المغناطيسي البسيط لمعادلتين: ti) = F - ta ، (3.56) V + RI = U. المعادلة الأولى (3.56) تعبر عن قانون نيوتن الثاني وتحدد التغيير في إحداثيات الجسم المعلق تحت تأثير الجاذبية td والقوة F من جانب المغناطيس الكهربائي ، والثانية تحدد التغيير في القوة الحالية / في دائرة المغناطيس الكهربائي مع المقاومة R عندما يتغير الجهد U المطبق عليها ويمثل قانون كيرشوف للدائرة الكهربائية للمغناطيس الكهربائي. يشير F إلى ارتباط التدفق للملف الكهرومغناطيسي ، F = pF ، حيث F هو التدفق المغناطيسي الذي يمر عبر دورة واحدة ، و n هو عدد الدورات في الملف.

ارتباط التدفق Ф والقوة الحالية / في الدائرة الكهربائية المغناطيسية مرتبطة بـ: = L (s) / ، L (s) = ، CL = / i0n2A / 2 ، (3.57) - قيمة الفجوة الاسمية بين المغناطيس الكهربائي و الجسم المعلق. إذا أشرنا إلى الحث الاسمي على أنه L0 \ u003d L (0) ، ثم C \ u003d L05 ، ثم

في هذا القسم ، نعتبر نموذجًا منفصلاً لخوارزمية خطية غير متحيزة توفر الحد الأدنى لمتوسط ​​الخطأ التربيعي ، بافتراض أن نموذج الرسالة يُعطى بواسطة معادلة فرق متجه خطي

حيث تكون ضوضاء الإدخال (أو ضوضاء النبات) عبارة عن ضوضاء بيضاء مع مصفوفة متوسط ​​صفر وتغاير

يتم إعطاء نموذج الملاحظة أو القياس من خلال علاقة جبرية خطية

. (7.3)

حيث تكون ضوضاء القياس v تساوي صفراً تعني الضوضاء البيضاء و

. (7.4)

من أجل بساطة الحسابات الأولية ، نفترض ذلك وغير مترابط ، أي

للجميع (7.5)

تمثل القيمة الأولية متغيرًا عشوائيًا بمتوسط ​​وتباين ، بمعنى آخر

; . (7.6)

سوف نفترض ذلك أيضًا للجميع.

لنجد تقديرًا للكمية من مجموعة الملاحظات المتتالية. دعنا نشير إلى هذا التقدير بواسطة ، وخطأ التقدير - بواسطة

اعتمادًا على العلاقة بين الكميات والتقدير يسمى التنبؤ أو الاستقراء ، التصفية أو التسوية ، وأخيراً الاستيفاء. هذا التقسيم مفهوم بشكل حدسي ، لأن التنبؤ ، على سبيل المثال ، يعني تقديرًا للحالة في الوقت الحالي ، بناءً على جميع الملاحظات حتى اللحظة. في هذا الفصل ، سننظر بشكل أساسي في مشكلة التصفية ، بينما سيتم استكشاف التنبؤ والاستيفاء في الفصل التالي.

سيكون التقدير غير متحيز بشكل مشروط وغير مشروط ، أي ، وسيكون أيضًا دالة خطية لتسلسل الملاحظات. من مجموعة خوارزميات التقدير الخطية غير المتحيزة المحتملة ، نختار فقط الخوارزميات التي تعطي الحد الأدنى من تباين الخطأ ، أي الذي من أجله أو الحد الأدنى.

في الفصل السابق ، أثبتنا أن التقدير بمعيار الحد الأدنى للخطأ القياسي يتطابق مع القيمة المتوسطة الشرطية للكمية لمجموعة معينة من الملاحظات. ومع ذلك ، بشكل عام ، حتى لو كانت نماذج الإبلاغ والمراقبة خطية (وهي مخصصة للمشكلة المصاغة هنا) ، فإن المتوسط ​​الشرطي ليس دالة خطية للملاحظات ، وبالتالي لا تحتوي خوارزمية التقدير على خاصية الخطية المرغوبة.

للحصول على خوارزمية تقدير خطية توفر الحد الأدنى من تباين الخطأ ، يجب علينا استخدام أحد الطريقتين. الأول هو تحديد الوسط الشرطي الذي يمثل الشكل الخطي ثم إيجاد أفضل ملاءمة لذلك الشكل. يعتمد هذا النهج على استخدام الإسقاط المتعامد. يعتمد نهج آخر على افتراض أن المتغيرات العشوائية طبيعية بشكل مشترك. بحكم ما تم إثباته في الفصل. 4 خصائص للأنظمة الخطية لا تغير قانون التوزيع العادي ، فإن المتوسط ​​الشرطي الدقيق في هذه الحالة سيكون شكلًا خطيًا. يجب أن يكون الحد الأدنى لمقدر التباين الخطي مساويًا لمقدر التباين الأدنى إذا كان الأخير خطيًا بالفعل. يحدث هذا إذا افترضنا قوانين التوزيع العادية.

لاحظ أنه إذا طلبنا أن تكون خوارزمية التقدير خطية ، فإن القانون الفعلي لتوزيع الكميات لا يهم. ومع ذلك ، إذا كانت التوزيعات طبيعية بالفعل ، كما هي غالبًا ، فإن المتوسط ​​الشرطي هو في الواقع شكل خطي. بمعنى آخر ، مرشح كالمان هو أفضل مرشح خطي (من حيث الحد الأدنى لتباين الخطأ) ، بغض النظر عن نوع التوزيع ، وأفضل خوارزمية من جميع خوارزميات التقدير الخطية وغير الخطية الممكنة ، إذا كان الكائن وضوضاء القياس ، بالإضافة إلى الحالة الأولية ، لديها قوانين التوزيع العادية.

عند اشتقاق معادلة مرشح كالمان ، سنفترض ونتطلب معالجة الملاحظات بالتتابع. بغض النظر عما إذا كانت خوارزمية التقدير متسلسلة أم لا ، لا يتم تعديل قيم تقديرات الحالة التي تم الحصول عليها. ومع ذلك ، فإن الجدوى الحسابية للطريقة ضرورية. ربما تكون أهم مساهمة لـ Kalman و Bucy هي أنهم كانوا أول من اشتق خوارزمية تقدير الحد الأدنى من التباين الخطي في شكل تسلسلي باستخدام مفهوم متغيرات الحالة. تم حل مشكلة التصفية المتسلسلة الخطية بمعيار الحد الأدنى من تباين الخطأ منذ فترة طويلة بواسطة وينر وغيره من المؤلفين فيما يتعلق بأنظمة ذات مدخل واحد ومخرج واحد. الميزة الرئيسية لـ Kalman هي أنه عمم نظرية ترشيح Wiener في حالة الأنظمة متعددة الأبعاد غير الثابتة مع تحقيق ضوضاء غير ثابتة لمدة محدودة وحصل على حل لمشكلة التصفية في شكل متكرر.

نظرًا لأن عرض جوهر المشكلة قد تأخر إلى حد ما ، قبل الانتقال مباشرة إلى حلها ، دعنا نلخص. نريد الحصول على تقدير خطي غير متحيز لحالة نظام ديناميكي خطي غير ثابت يكون مثالياً من حيث الحد الأدنى لمعيار تباين الخطأ ويتأثر بالضوضاء البيضاء بمتوسط ​​صفر وتباين معروف.

للحصول على تقدير ، نلاحظ وظيفة الحالة الخطية المتغيرة بمرور الوقت على خلفية الضوضاء البيضاء المضافة مع صفر متوسط ​​وتباين معروف. الحالة الأولية للعملية هي متغير عشوائي بمتوسط ​​وتباين معروفين. لا يوجد ارتباط بين ضوضاء الإدخال وضوضاء القياس ، ويلزم إيجاد خوارزمية تقدير في شكل متكرر. تعد خوارزمية ترشيح كالمان حلاً لهذه المشكلة. كما هو مطبق على الأنظمة المنفصلة ، فإننا نأخذ في الاعتبار طريقتين مختلفتين لاشتقاق معادلة مرشح كالمان ، والتي تعد توضيحًا للفكرتين الموضحتين أعلاه. في الحالة الأولى ، عند استخدام نهج الإسقاط المتعامد ، سنحدد مسبقًا الشكل الخطي لخوارزمية التقدير ثم نعثر على أفضل خوارزمية. في الحالة الثانية ، عندما يتم إجراء التقدير بأقصى احتمالية لاحقة ، سنفترض أن المتغيرات العشوائية لها قوانين توزيع عادية ونجد خوارزمية التقدير الأمثل ، والتي ستتحول بالفعل إلى خطية. عند اشتقاق معادلة الترشيح ، استخدم كالمان نهجًا يعتمد على طريقة الإسقاط المتعامد ، لذلك سنبدأ العرض التقديمي بهذه الطريقة.

متعامدتنبؤ.تمت مناقشة نظرية الإسقاط المتعامد بإيجاز في الفقرة 6.6. هنا ، بدون دليل ، سيتم عرض بعض التعميمات على النتائج المعروضة هناك ؛ سنحتاجهم في المستقبل. يتم إعطاء التقدير الخطي للكمية بمعيار الحد الأدنى من تباين الخطأ لمساحة خطية معينة من الملاحظات من خلال الإسقاط المتعامد على ، أي.

هنا ، يتم استخدام الرمز بدلاً من ، نظرًا لأن التقدير الخطي مع الحد الأدنى من التباين لا يتطابق عمومًا مع التوقع الرياضي الشرطي. إذا افترضنا مقدمًا أن المتغيرات العشوائية لها توزيعات عادية ، فستتوافق ببساطة مع ؛ ومع ذلك ، فقد اخترنا عمدًا نهجًا مختلفًا للتأكيد على أن افتراض التوزيعات العادية ليس ضروريًا ، إذا تذكرنا أن خوارزمية التقدير الناتجة قد لا تكون الأفضل تمامًا ، ولكنها الأفضل فقط في فئة الخوارزميات الخطية. إذا كان التسلسل المتعامد يشكل أساسًا ، فيمكن تمثيله على النحو التالي

. (7.8)

للحصول على حل في شكل متكرر ، نحتاج إلى النتيجة التالية. إذا كان متجهًا متعامدًا لـ ، أي ، لأين هو الأساس المتعامد ، إذن

هذه النتيجة هي lemma الإسقاط المتعامد. على الرغم من أننا سنهتم بالتصفية ، أي أننا سننظر أولاً في التنبؤ بخطوة واحدة ، أي. من أجل الحصول على حل بالشكل المتكرر المطلوب ، نستخدم مبدأ الاستقراء الرياضي. افترض أن هذا معروف ويمثل من خلال ملاحظة جديدة. ومع ذلك ، بشكل عام ، ليس متعامدًا ، وقبل استخدام المعادلة (7.9) ، من الضروري إيجاد مكون الملاحظة ، وهو متعامد مع. يتلخص الأمر بشكل أساسي في إبراز المعلومات الجديدة الواردة في ملف.

من السهل إظهار أن المتجه

متعامد. لاحظ أن هذا يمثل "المعلومات الجديدة" الواردة في ، وذلك للحصول على أفضل تقدير للكمية ، بشرط أن يتم تقديمها ، وهي ، مطروح من. هذا شكل آخر من أشكال الادعاء المتعامد. يُعرف المتغير العشوائي باسم "Updating". باستخدام المعادلة (7.10) ، يمكن التعبير عنها من حيث تحديث المتغير العشوائي على النحو التالي:

.

هذان التعبيران متكافئان لأن موجود في مساحة المراقبة ، وبالتالي ، لا تتم إضافة أي معلومات إضافية مقارنة بالمعلومات الواردة في. نظرًا لأنه متعامد ، يمكننا استخدام المعادلة (7.9) وكتابتها على شكل. منذ ذلك الحين ، يمكن تمثيل هذا التعبير بالشكل التالي:

ويترتب على ذلك أن يتم الحصول عليه من خلال التنبؤ بقيمة متغير عشوائي من الملاحظات السابقة ثم تصحيح القيمة المتوقعة وفقًا للمعلومات الجديدة الواردة في قيمة العينة الحالية للمتغير العشوائي. يعتبر مفهوم التنبؤ والتصحيح مثمرًا للغاية ويسمح لك بتفسير خوارزمية كالمان بصريًا. لذلك ، عند اشتقاق خوارزمية التصفية ، سنستخدم نهجًا يعتمد على فكرة التنبؤ والتصحيح. دعونا نحلل بشكل منفصل كل من المصطلحين على الجانب الأيمن من المعادلة (7.11). وفقًا للتعبير (7.1) يُعطى كـ. لذلك ، الذي بحكم التعريف يساوي ، يصبح الآن يساوي

بحكم التعريف ، لدينا

نظرًا لأنه يعتمد فقط على الضوضاء البيضاء وهي الضوضاء البيضاء ، فإن التوقع الرياضي للقيمة عند قيمة معينة يتطابق ببساطة مع التوقعات الرياضية غير المشروطة. لذلك يتم تحويل النتيجة أعلاه إلى ما يلي:

نرى أن القيمة المتوقعة ، بناءً على الملاحظة ، يتم الحصول عليها من نتيجة انتقال غير مضطرب للأمام بخطوة واحدة ، أي في. هذا الاستنتاج ليس غير متوقع ، لأن أفضل تقدير ، بناءً على الملاحظة ، كما هو موضح أعلاه ، هو صفر تمامًا. كما أنه يتبع من هذا

وهذا يعني أنه في كل من الترشيح والتنبؤ ، فإن أفضل تقدير للضوضاء البيضاء بمتوسط ​​صفري هو صفر بشكل مماثل. هذا الاستنتاج مهم للغاية وسيكون مفيدًا جدًا ، خاصة عند مناقشة مفهوم عملية "التجديد". أدناه ، بطريقة مماثلة ، سيتم عرض ما تم تعريفه وما هو في الواقع

إذا استبدلنا المعادلة (7.12) في (7.11) ، نحصل عليها

ضع في اعتبارك الحد الثاني على الجانب الأيمن من هذه المعادلة. باستخدام المعادلة (7.8) ، يمكن كتابتها بالصيغة التالية:

الآن نقوم بفحص كل حد في الجانب الأيمن من هذه المعادلة بشكل منفصل. بالتعويض عن (7.1) ، نحصل على المصطلح الأول من المعادلة

الآن ، باستخدام تعريفات و [cf. المعادلتان (7.3) و (7.10)] ، يمكن كتابتها بالشكل التالي:

أين . لذلك ، تأخذ المعادلة (7.17) الشكل

وبعد ضرب المصطلحات المقابلة ، فإنه يتحول إلى النموذج

نظرًا لأنه يعتمد فقط على ، و ، ولا يرتبط ، إذن . منذ الضوضاء البيضاء ، ويعتمد على فقط في ، إذن والحد الثالث على الجانب الأيمن من المعادلة أعلاه يجب أن يكون صفرًا. المصطلح الأخير على الجانب الأيمن من المعادلة يساوي أيضًا صفرًا ، نظرًا لأن و- غير مترابطين. لذلك ، يبقى المصطلح الأول فقط ، ونتيجة لذلك لدينا

يمكن تبسيط التعبير الناتج بشكل أكبر إذا أخذنا ذلك في الاعتبار. حيث يصبح متساويا

لكن المصطلح الأول ، وفقًا للإسقاط المتعامد lemma ، يساوي صفرًا. لذلك ، يمكن كتابة المعادلة (7.18) على النحو التالي:

حيث يمكن إظهار ذلك بطريقة مماثلة

إذا استبدلنا المعادلات (7.19) و (7.20) و (7.10) في (7.16) ، إذن

لذلك ، يأخذ التعبير عن الشكل

يمكن التعبير عن هذه النتيجة بشكل أكثر ملاءمة من خلال تقديم الترميز

لذلك ننتهي مع

الكمية تسمى مكسب من خطوة واحدة استقراء كالمان. شكل الحل الذي تمثله المعادلتان (7.23) و (7.24) ممتع للغاية وملائم من وجهة نظر حسابية. لقد حصلنا على خوارزمية حساب متسلسلة من القيمة المعروفة المحسوبة في الخطوة السابقة وملاحظة جديدة. يتكون التقدير الجديد هنا نتيجة لاستقراء التقدير القديم والتصحيح اللاحق باستخدام إشارة خطأ ملاحظة مرجحة. 7.1 ب ؛ للمقارنة ، تظهر الرسالة الأصلية ونماذج المراقبة في التين. 7.1 ، أ. قبل استخدام النتيجة أعلاه ، يجب عليك أولاً العثور على تعبير لـ من أجل الحساب. يمكنك أن تفعل خلاف ذلك وتجد. من أجل التحديد ، نجد أولًا تعبيرًا تعاوديًا لـ. بدمج المعادلتين (7.1) و (7.24) نحصل عليها

الشكل 7.1. مخططات الكتلة لمشكلة التنبؤ من خطوة واحدة: أ) نماذج الإبلاغ والمراقبة ، ب) جهاز التنبؤ بخطوة واحدة

إذا استبدلنا الآن التعبير (7.3) وأجرينا سلسلة من التحويلات الجبرية البسيطة ، فسيتم تقليل التعبير أعلاه إلى النموذج

بالإضافة إلى حقيقة أن المعادلة (7.25) يمكن استخدامها في الحساب ، فهي أيضًا ذات فائدة مستقلة ، مثل قانون التغيير في خطأ التقدير.

نظرًا لأن القيمة المتوسطة للكمية تساوي صفرًا (نظرًا لأن التقدير غير متحيز) ، والكميات ، و- غير مترابطة ، يمكن الحصول على التعبير عن مباشرة من تعريف هذه الكمية والمعادلة (7.25) ، في شكل

إذا قمنا الآن باستبدال (7.23) وتبسيط النتيجة التي تم الحصول عليها ، نحصل على التعبير التالي لتباين الخطأ:

تُعرّف المعادلة (7.26) ، جنبًا إلى جنب مع (7.23) و (7.24) تمامًا أداة استقراء خطية متسلسلة من خطوة واحدة مع الحد الأدنى من تباين الخطأ.

قبل استخدام النتيجة التي تم الحصول عليها أعلاه ، من الضروري تعيين الشروط الأولية المقابلة في المعادلات من أجل و. من الواضح أن أفضل تقدير للكمية ، بشرط عدم إجراء أي ملاحظات ، هو ، وبالتالي ،

لذلك ، كشروط أولية لخوارزميات التنبؤ بخطوة واحدة ، نختار ; .

يتم تلخيص جميع خوارزميات التنبؤ من خطوة واحدة في الجدول. 7.1

يمكن أيضًا إعادة كتابة المعادلة (7.26) بالشكل التالي:

إذا قمت بتعيين الشروط الأولية في المعادلتين (7.24) و (7.26) ، فيمكنك استخدام خوارزميات التنبؤ ذات الخطوة الواحدة باستمرار. على سبيل المثال ، يمكن استخدام المعادلة (7.23) ذات الشرط الأولي لإيجاد ، والتي يجب استبدالها بعد ذلك في (7.24) للحساب من الملاحظة الأولى. يتم استخدام معادلة التشتت (7.26) في الخطوة التالية عند إعادة الحساب. ثم يتم استخدام القيمة التي تم الحصول عليها للكمية للحساب ، إلخ. معالجة البيانات وفقًا لمعادلات التنبؤ تظهر بشكل تخطيطي في الشكل. 7.2 تحليل دقيق للمعادلتين (7.23) و (7.26) يوضح أن حساب الكميات يتم تنفيذه بالفعل دون اللجوء إلى تسلسل الملاحظات . من الممكن حساب مصفوفات الكسب مسبقًا وتخزينها. ربما لم نتمكن من قبول هذه الطريقة في الحساب الأولي للمصفوفات إذا لم يكن معدل استلام الملاحظات عند إدخال المعالج مرتفعًا جدًا ولن يمنع تنفيذ الحسابات وفقًا للمعادلتين (7.23) و (7.26) في الواقع الوقت ، أو إذا لم تكن إمكانية التخزين أسهل وأرخص مقارنة بإمكانية الحوسبة في الوقت الفعلي.

الجدول 7.1. خوارزميات التنبؤ بخطوة واحدة منفصلة

نموذج الرسالة

نموذج المراقبة

البيانات السابقة

; ; ;

خوارزمية التنبؤ

حساب الربح

حساب التباين السابق

الشروط الأولية

لا تكمن الميزة الرئيسية لخوارزميات ترشيح كالمان في أنها تعطي حلاً لمشكلة التصفية (تم الحصول على الحل قبل ذلك بكثير من خلال طرق أخرى) ، ولكن الحل يحدد بشكل مباشر التنفيذ العملي للنتائج. عند حل العديد من المشكلات العملية ، من الممكن التأكد من جدوى العمليات الحسابية بواسطة المعادلتين (7.23) و (7.26) في الوقت الفعلي ، وبالتالي تنفيذ خوارزميات التصفية المتسلسلة في الوقت الفعلي. ومن السمات المميزة الأخرى للنهج المدروس أن تباين الخطأ يُحسب كجزء لا يتجزأ من التقدير ، وبالتالي يمكن استخدامه للتحكم في دقة إجراء التقدير. يعتمد هذا على افتراض أن أنماط الإبلاغ والمراقبة ، وكذلك التوزيع السابق ، معروفة تمامًا.

أرز. 7.2 رسم تخطيطي لحسابات خوارزميات التنبؤ

مثال 7.1. دع الرسالة ونماذج الملاحظة تُعطى بواسطة المعادلات العددية:

; .

و و أو،. هنا نفترض أن الضوضاء ثابتة وبيضاء ، على الرغم من أنها بشكل عام لا تحتاج إلى أن تكون ثابتة. لنفترض أيضًا أن القيمة الأولية لها متوسط ​​صفري وتباين الوحدة ، لذلك و.

في هذا المثال ، تصبح معادلة التقدير (7.24)

مع تحديد الكسب من المعادلة

معادلة التشتت لها الشكل

دعونا نحسب أيضًا على افتراض أن لدينا ملاحظات ،. نحسب أولاً الكسب باستخدام الشرط الأولي:

; .

باستخدام الشرط الأولي ، نحصل عليه و . يتم تحديد تباين الخطأ في هذا التقدير من معادلة التباين على النحو التالي:

من الضروري الآن تكرار جميع خطوات الحسابات من أجل العثور على التباين وتقديره وأخيرًا. على الرغم من أن المثال المدروس بسيط للغاية ، إلا أنه يوضح بوضوح جميع خطوات الحسابات التي يجب إجراؤها في عملية تطبيق خوارزميات التنبؤ بخطوة واحدة كالمان.

من المشكلات المهمة عمليًا التي تنشأ عند استخدام النتائج المذكورة أعلاه ، وحتى أكثر صعوبة من العثور على متوسط ​​القيمة والتباين للحالة الأولية ، تحديد التباين في ضوضاء الإدخال وضوضاء القياس. يمكن الحصول على قيم التشتت في كثير من الأحيان إما من تحليل الجوهر المادي للمشكلة ، أو عن طريق القياس المباشر بدقة معقولة. يمكن إبداء ملاحظات مماثلة حول لحظات بدائية لناقل الحالة. يتم اختيار القيمة كأفضل تقدير للقيمة المتوسطة لمتجه الحالة عند الخطوة الصفرية ، أي قبل إجراء الملاحظات ، كخاصية لدرجة عدم اليقين عند الاختيار.

بالمعنى النوعي البحت ، يمكن القول أنه كلما زاد عدم اليقين بشأن القيمة الحقيقية ، زادت القيم التي نضعها.

الآن دعنا ننتقل إلى مشكلة التصفية. تم استخدام أداة الاستقراء ذات الخطوة الواحدة كخطوة ملائمة في هذه المهمة الأساسية وغالبًا ما تكون ذات قيمة عملية. سنرى أن حل مشكلة التصفية يتضمن تنبؤًا من خطوة واحدة ، ثم يتم تصحيح النتائج وفقًا للمعلومات الحالية. في كثير من الأحيان ، ولكن ليس دائمًا ، يجب تفضيل حل مشكلة التصفية على حل مشكلة التصفية من خطوة واحدة.

إذا كان التقدير الذي تم الحصول عليه نتيجة الترشيح معروفًا ، فيمكن الحصول عليه على أنه

نظرًا لأنه ، وبالتالي ، يعتمد على فقط من أجل ، لا تحتوي مساحة المراقبة على معلومات حول مكان الضوضاء البيضاء المنفصلة. لذلك ، للتنبؤ بقيمة من الملاحظات ، يكفي التنبؤ بالقيم خطوة للأمام عن طريق الإعداد. أتاح هذا الأسلوب الحصول على المعادلة (7.27) ، والتي سيتم استخدامها فيما يلي. السماح عمدًا بتدوين غير صارم من أجل بساطة التدوين ، نكتبه على هذا النحو. باستثناء الحالات الخاصة ، كما هو الحال في ، سنفترض أن الشروط يتم توفيرها بواسطة المساحة. في هذا الترميز ، يمكن إعادة كتابة المعادلة (7.27) كـ

من الواضح أن التقديرين المعتمدين على الملاحظة يجب أن يكونا متكافئين. لذلك ، يمكن استخدام المعادلة (7.28) للحصول على خوارزمية تقدير متسلسلة من المعادلات (7.23) و (7.24) و (7.26). نعوض أولًا بـ yp-ne (7.28) في (7.24). نتيجة لذلك ، نحصل عليه

إذا قمنا بضرب كلا الجزأين من هذه المعادلة في ، والتي ، نظرًا لخصائص مصفوفة الانتقال للحالات ، تساوي ، عندئذٍ نحصل على

لتبسيط التعبير الناتج ، نقدم أو نُعرّف على أنه أو

إذا كنت تستخدم المعادلة (7.23) لتحديد. لذلك ، هو مكتوب في النموذج

على الرغم من أن المعادلة (7.30) هي على الأرجح الشكل الأكثر ملاءمة لمعادلة تقدير مرشح كالمان ، يمكن من حيث المبدأ الحصول على عدة أشكال أخرى. اثنان منهم مفيد بشكل خاص. إذا استخدمنا العلاقة ، فيمكن إعادة كتابة المعادلة (7.30) بالشكل التالي:

يمكن تبسيط هذا التعبير بشكل أكبر من خلال إدخال قيمة "تحديث" للحصول عليها

المعادلات (7.29) - (7.31) أو (7.32) ، مع المعادلة (7.26) ، تحل تمامًا مشكلة التصفية الخطية بمعيار الحد الأدنى لمتوسط ​​الخطأ التربيعي. تُستخدم الشروط الأولية المعطاة لـ ، وبالتحديد و ، لتشكيل الشروط الأولية لـ و ، على التوالي ، بنفس الطريقة كما في الاستقراء من خطوة واحدة.

يمكن تقديم خوارزميات ترشيح كالمان بشكل أكثر ملاءمة إذا وجدنا تعبيرات عن تباين خطأ التصفية . بالإضافة إلى ذلك ، يمكن استخدام التباين كمعيار لجودة إجراء التقدير. غالبًا ما يُطلق على التباين اسم التباين السابق لأنه تباين التقدير حتى وقت الملاحظة ، ويسمى التباين التباين اللاحق. للتحديد ، نجد أولًا تعبيرًا عن. مرة أخرى ، يمكن تقديم عدة أشكال من العرض. يعتبر التمثيل باستخدام المعادلة (7.32) من أكثر الأمور ملاءمةً لحالتنا. في هذه الحالة ، يتم تعريفها على النحو التالي:

إذا استبدلنا الآن المعادلتين (7.29) عن و (7.19) و (7.20) عن و في هذا التعبير ، نحصل عليه

إذا استخدمنا المعادلة (7.29) من أجل ، فيمكن إعادة كتابة التعبير الأخير كـ

وفقًا لهذه المعادلة ، يتم التعبير عن تباين خطأ التصفية بدلاً من ذلك ببساطة من حيث التباين في خطأ التنبؤ بخطوة واحدة. يتيح استخدام الكمية أيضًا تبسيط المعادلة (7.26) بشكل ملحوظ. دعنا نعيد كتابتها بالشكل

باستخدام f-loy (7.29) ، يمكننا كتابة هذا التعبير بالصيغة

من السهل أن ترى أن القيمة الموجودة بين الأقواس المتعرجة لا تمثل أكثر من. لذلك لدينا

يمكن الحصول على هذا التعبير بالطريقة المعتادة عن طريق حساب التباين في متغير عشوائي معطى بالمعادلة (7.1) لمعطى.

تحدد المعادلات (7.29) و (7.30) و (7.33) و (7.34) تمامًا الإصدار النهائي لمرشح كالمان المنفصل. تم تلخيص هذه المعادلات في الجدول. 7.2 يظهر الرسم التخطيطي للحسابات وفقًا للخوارزميات التي تم الحصول عليها في الشكل. 7.3 ، ومخطط كتلة مرشح كالمان المنفصل - في الشكل. 7.4.

لاحظ مرة أخرى أن معادلة التشتت والكسب لا تتضمن سلسلة من الملاحظات ، لذلك يمكن حساب هذه الكميات مسبقًا إذا لزم الأمر. يظهر هذا الاحتمال تقليديًا في الشكل. 7.3 خط متقطع.

الجدول 7.2. ملخص خوارزميات التصفية المنفصلة كالمان

نموذج الرسالة

نموذج المراقبة

البيانات السابقة

خوارزميات التصفية

حساب الربح

حساب التباين السابق

معادلة التباين اللاحق

الشروط الأولية

يوضح تحليل مخطط الكتلة في الشكل 7.4 أن مرشح كالمان يطبق فكرة تصحيح التنبؤ. يتم استقراء التقدير السابق خطوة واحدة للأمام ثم استخدامها للحصول على أفضل تقدير للملاحظة الجديدة بناءً على جميع الملاحظات السابقة. الخطأ بين "أفضل تقدير" للملاحظة الحالية والملاحظة الفعلية ، أي أو ، هو معلومات جديدة [للمكون متعامد مع]. يتم ترجيح الخطأ بوزن يأخذ في الاعتبار قيمة الفروق في عملية الإدخال والقياسات وأخطاء التقدير لتشكيل إشارة تصحيح. تضاف إشارة التصحيح إلى التقدير المتوقع والنتيجة هي تقدير جديد.

الشكل 7.3. مخطط هيكلي للحسابات بواسطة خوارزمية ترشيح كالمان.

أرز. 7.4. رسم تخطيطي هيكلي لمرشح كالمان المنفصل.

لاحظ أن بنية مرشح كالمان تقابل المعادلة (7.30) والموضحة في الشكل. 7.4 مشابه جدًا لهيكل نموذج الرسالة الأصلي المعطى بالمعادلة (7.1) والموضح في الشكل. 7.1 أ. تعتمد خوارزمية التصفية على استخدام مكون "تحديث" ، والذي يحتوي على معلومات جديدة تم الحصول عليها نتيجة للملاحظة.

مثال 7.2.لتوضيح تطبيق خوارزمية ترشيح كالمان ، ضع في اعتبارك نموذج رسالة ثنائي الأبعاد تقدمه المعادلة

تتم المراقبة وفقًا للنموذج العددي

ضوضاء الإدخال ثابتة مع ، وضوضاء القياس غير ثابتة مع . بعبارة أخرى ، تكون قياسات المؤشرات الزوجية أقل دقة من القياسات الفردية. افترض أن تباين الأخطاء الأولية (أو الحالة الأولية) يتم توفيره بواسطة المصفوفة . مطلوب لحساب القيمة للجميع من 1 إلى 10.

باستخدام المعادلتين (7.29) و (7.34) ، بالإضافة إلى الشرط الأولي ، يمكن للمرء بسهولة حساب و ، والتي تساوي على التوالي

الآن ، باستخدام المعادلة (7 23) ، يمكنك حساب التباين اللاحق

بالإضافة إلى التباين السابق الذي يتغير للخطوة التالية وفقًا للمعادلة (7.34) ويصبح مساويًا لـ

أرز. 7.5 تم اعتبار تغيير مكاسب مرشح كالمان في مثال 7.2

الآن يمكنك الحساب ، وما إلى ذلك. تظهر مكونات المتجه ، عند التغيير من 1 إلى 10 ، في الشكل 7.5. لاحظ الزيادة المميزة في الكسب للقيم الفردية ، ونتيجة لذلك تم تحسين القياسات الدقيقة نسبيًا. يمكن ملاحظة أن الكسب يصل إلى حالته الثابتة المتغيرة بشكل دوري في عدة عينات. ربما يكون من المفيد مناقشة تأثير نسبة الكميات وما إلى ذلك باختصار ونوعية خالصة ، حتى لو كان من الصعب الحصول على نتائج كمية عامة. أولاً ، القيم النسبية مهمة هنا ، وليست مطلقة. على وجه الخصوص ، من السهل إظهار أنه في حالة ضرب نفس الثابت القياسي الموجب ، وضربه بنفسه ، عندئذٍ لا يتغير. تقريبًا جدًا ، يمكن للمرء فقط أن يذكر أن الكسب يعتمد على نسبة الإشارة إلى الضوضاء. تنخفض عناصر مصفوفة المعاملات مع انخفاض قيم عناصر المصفوفات [أو فقط في] أو زيادة قيم عناصر المصفوفة. تبدو هذه النتيجة بديهية تمامًا ، لأنه كلما تناقصت ، يجب توقع تغييرات أصغر وأصغر في الحالة ، وبالتالي ليست هناك حاجة "لتتبع" الملاحظات بهذه الدقة. وبالمثل ، إذا انخفض ، تزداد دقة التقدير الأولي وتقل الحاجة إلى المعلومات الواردة في الملاحظات ، وبالتالي ينخفض ​​الكسب. من ناحية أخرى ، إذا زاد ، يتناقص الكسب مرة أخرى ، مما يمنع إضافة ضوضاء القياس المفرطة إلى التقدير. في النهاية ، عندما تميل إلى الصفر ، من السهل إظهار أنها تقترب من الصفر لقيم كبيرة من. مع اقترابها من الصفر ، تقترب تباينات الخطأ أيضًا من الصفر ويصبح إجراء التقدير مستقلًا عن الملاحظة ويدخل في وضع يُعرف باسم تشبع الإدخال. يمكن أن يؤدي هذا الوضع إلى مشاكل تباعد خطيرة. ستتم مناقشة طرق تصحيح الاختلاف بالتفصيل في ثانية. 8.5

التقدير بمعيار الاحتمال الأقصى لاحتمال لاحق.نحصل على خوارزمية تقدير خطي ، بافتراض ذلك ، ولدينا قوانين توزيع عادية. في هذه الحالة ، من السهل إثبات (انظر الفقرة 2.4) أن المتغيرات العشوائية الموزعة عادة للجميع. لذلك هي وظيفة مراقبة خطية. وبعبارة أخرى ، فإن خوارزمية تقدير الحد الأدنى من تباين الخطأ الخطي هي خوارزمية تقدير مع الحد الأدنى من تباين الخطأ ، وتباين الخطأ أقل من أو يساوي تباين الخطأ لأي خوارزمية تقدير خطية أو غير خطية أخرى.

للحصول على خوارزمية للتقدير بمعيار الحد الأقصى لاحتمال لاحق ، من الضروري فقط تحديد كثافة الاحتمال الشرطي لقيمة معينة ، ثم إيجاد توقعها الرياضي. نظرًا لأن التوزيع الشرطي طبيعي عند إعطائه ، فمن المعروف (انظر الفقرة 2.2) أن خوارزمية التقدير التي تحسب التوقع الشرطي لا تقلل فقط من متوسط ​​الخطأ التربيعي ، بل تقلل أيضًا متوسط ​​الخطأ المطلق لوظائف بسيطة والعديد من وظائف الخسارة الأخرى.

وبالتالي ، يمكن للمرء تعيين خوارزمية تقدير التباين الأدنى من خلال النظر في التقدير تحت أي وظائف خسارة أخرى ، على سبيل المثال ، تقدير الاحتمال الخلفي الأقصى (تقدير MAP للاختصار) عندما يتم اختيار وظيفة الخسارة لتكون بسيطة ويتزامن التقدير مع وضع الكثافة الشرطية .

دعنا نستخدم هذه التقنية ونبني خوارزمية تقدير مركبة الصعود من المريخ. نظرًا لأن بعض التعبيرات التي سيتعين علينا العمل بها قد تكون طويلة جدًا ، فسنستخدم أحيانًا أثناء العرض التقديمي شكلاً مبسطًا من التدوين. بافتراض وجود نقص طفيف في الصرامة ، سنتخلى عن تدوين الفهرس لكثافة الاحتمال ، وسيتم الإشارة إلى المتغيرات العشوائية قيد الدراسة على أنها حجج لهذه الكثافات. على سبيل المثال ، يتم كتابة قيمة الكثافة الاحتمالية لمتغير عشوائي عند النقطة ، في هذه الحالة على النحو التالي ؛ كتب بالمثل. ولا ينبغي للمرء أن يحاول تفسير هذا الشكل المبسط للتدوين على أنه احتمال (هذا محض هراء) ، أو بالأحرى ، يجب اعتبار كثافة الاحتمال كدالة ، وليس كقيمة لهذه الوظيفة ، التي تتطلبها ملاحظة خاصة. لسوء الحظ ، في الرياضيات غير الصارمة التي يستخدمها المهندسون ، غالبًا ما لا يتم التأكيد بوضوح على التمييز بين وظيفة ، كتخطيط من مجموعة إلى أخرى ، وقيمة محددة لهذه الوظيفة.

تعتبر دالة كثافة الاحتمال ، التي تؤخذ في الاعتبار عند التقدير بناءً على معيار الحد الأقصى لاحتمال لاحق أو على أساس التوقع الرياضي الشرطي ، دالة لمتغير عشوائي لسلسلة معينة من الملاحظات ويشار إليها على أنها . يتم تعريف خوارزمية التقدير على أساس التوقع الشرطي على أنها

(7.35)

تم العثور على التقدير بمعيار الحد الأقصى للاحتمال اللاحق ، والذي سيتم الإشارة إليه على أنه ، كحل للمعادلة

. (7.36)

بشرط

(7.37)

إذا تم استيفاء الشرط (7.37) ، والذي يتطلب أن تكون مصفوفة المشتقات الثانية سالبة محددة ، فإن حل المعادلة (7.36) يتوافق مع أقصى كثافة شرطية.

للعثور على تعبير عن ، نستخدم نظرية الضرب ونكتب كيف

إذا اعتبرناها اتحادًا لملاحظة جديدة وملاحظات سابقة ، فستتم إعادة كتابة المعادلة (7.38) بالشكل

(7.39)

ضع في اعتبارك بسط هذا التعبير. باستخدام نظرية الضرب ، يمكننا الكتابة

للمعرفة بلا شك تستبعد الحاجة إلى الحفظ. إذا تم تقديمه ، فسيكون في متغير عشوائي فقط وبما أنه ضوضاء بيضاء ، فلا توجد معلومات في أي منهما ، أو. إذا استبدلنا التعبير (7.40) في (7.39) ، نحصل على

بتطبيق نظرية الضرب على المقام ، نكتب التعبير الناتج في الصورة

بعد التخفيض بواسطة دالة احتمالية قياسية مشتركة ، نحصل عليها

(7.41)

الآن يمكنك تحديد كثافة الاحتمال الشرطي لمتغير عشوائي معطى بحساب كل تعبير للاحتمال على الجانب الأيمن من المعادلة (7.41). دعونا نفكر في كل مصطلح على حدة ، لإثبات أن كل كثافة احتمالية في (7.41) طبيعية ، وتحديد اللحظتين الأوليين اللتين تميز التوزيع الطبيعي. دعنا نستكشف أولاً. نظرًا لأنه معطى بواسطة المعادلة ، فإن a عملية عشوائية عادية ، وبالتالي فإن كثافة الاحتمال طبيعية بلا شك ، نظرًا لوجود مجموع عملية عشوائية عادية وقيمة ثابتة. القيمة المتوسطة للعملية هي

لأنها عملية عشوائية بمتوسط ​​صفر. تباين العملية العشوائية هو بالتعريف

وفي هذه الحالة

ومن ثم ، يمكن كتابة كثافة الاحتمال بالشكل التالي:

لننظر الآن إلى مقام التعبير (7.41) ، وبصورة أدق ، كثافة الاحتمال للقيمة الثلاثة المعطاة. باستخدام معادلة نموذج المراقبة ، يمكن كتابتها كـ

وفقًا للصياغة الأصلية للمشكلة ، من المعروف أن لديه قانون توزيع عادي ولا يعتمد عليه. إذا افترضنا ذلك - طبيعي بلا شك طبيعي أيضًا ، نظرًا لأنه دالة خطية (مجموع) لمتغيرين عشوائيين لهما قانون توزيع عادي. كثافة احتمالية المتغير العشوائي لـ u معين أمر طبيعي ، لأنه في هذه الحالة يتطابق ببساطة مع ، وهو أمر طبيعي وفقًا للافتراض الأولي. سيظهر ما يلي صحة الافتراض أن ، وبالتالي أيضًا أمر طبيعي للجميع. متوسط ​​القيمة مع الكثافة يساوي

حيث يتم استخدام الترميز الذي تم تقديمه مسبقًا ؛ يساوي الصفر ، لأنه ضوضاء بيضاء مع صفر متوسط. بحكم التعريف ، فإن تشتت العملية يساوي المعطى ، لأن تشتت الكميات: تعتبر كميات أولية في هذه السلسلة ، أمر طبيعي. لذلك ، يتم تأكيد الافتراض بأن الكثافة عادي.

يتم تحديد تقدير حالة ما ، بناءً على التوقع الرياضي الشرطي (التقدير بمعيار الحد الأدنى لتباين الخطأ) ، بواسطة المعادلة (7.54) ويتوافق مع النتائج التي تم الحصول عليها مسبقًا [انظر. (7.30)]. ومع ذلك ، في هذه الحالة ، يكون التقدير مساويًا تمامًا للتوقع المشروط (لأنه تم افتراض التوزيع الطبيعي هنا) ، وليس الأفضل فقط في فئة التقديرات الخطية. بالطبع ، بالنسبة للتوزيع الطبيعي ، كلا التقديرين متماثلان ، لأن التوقع الشرطي هو دالة مراقبة خطية.

لتحديد تقدير MAV ، تحتاج إلى إيجاد القيمة التي تزيد . دعنا نستخدم خدعة معروفة ونبحث عن الحد الأقصى وليس الكثافة نفسها

ويلاحظ في هذه الحالة بسبب الخصائص الفيزيائية لمصفوفة تشتت الخطأ. لذلك ، يتطابق تقدير MAV مع تقدير التوقع المشروط والتقدير بمعيار الحد الأدنى لتباين الخطأ. تعد مجموعة القيم إحصائية كافية للتقدير بمعنى أنها تحدد الكثافة الشرطية تمامًا.

وتجدر الإشارة إلى أنه يمكن استخدام الشكل الأصلي لترميز الكثافة مباشرة [تعبير (7.52)] بدلاً من الشكل المضغوط (7.53). يبدو أن هذا النهج أكثر جاذبية ، لأنه في هذه الحالة ، لا يلزم معرفة شكل أكثر إحكاما ، وهو ليس بسيطًا وواضحًا بما فيه الكفاية. إذا استخدمنا التعبير (7.52) من أجل ، ثم نتيجة تحويل المعادلة (7.57) لدينا

إذا قمنا الآن بتجميع المصطلحات التي تتضمن ، فسنحصل على

الذي يؤدي حله فيما يتعلق إلى النتيجة التالية:

على الرغم من أن هذا الحل للتقدير الأمثل لم يتم تقديمه بالشكل المناسب مثل السابق ، إلا أنه يمكن اختزاله بسهولة إلى (7.62) باستخدام انعكاس المصفوفة lemma أو التعبيرات (7.55) و (7.56) مباشرةً.

يمكن اشتقاق عدد من التعبيرات الشيقة والمفيدة للتباين من خوارزميات ترشيح كالمان. فيما يلي بعض أكثرها فائدة تتعلق بمفهوم "عملية التجديد":

باستخدام المعادلة (7.70) ، نحصل على [وهو أيضًا التقدير الأمثل الصالح عند إخراج النظام ، أي عندما يكون نموذج الملاحظة بالشكل التالي:

إنها تعطي حلاً لمشكلة الترشيح الخطي المنفصل في الصيغة الأكثر عمومية. في الختام ، نلاحظ أنه من النتائج العامة تتبع ، على وجه الخصوص ، النتائج الواردة في الجدول. 7.2 ، إذا قمنا بتعيين الصفر.