السير الذاتية صفات التحليلات

تحليل الانحدار الخطي. طرق الإحصاء الرياضي

النتائج

الجدول 8.3 أ. إحصائيات الانحدار
إحصائيات الانحدار
متعددة R 0,998364
R- سكوير 0,99673
تطبيع R- مربع 0,996321
خطأ تقليدي 0,42405
ملاحظات 10

لنلقِ نظرة أولاً على الجزء العلوي من الحسابات الواردة في الجدول 8.3 أ ، إحصائيات الانحدار.

قيمة R-square ، التي تسمى أيضًا مقياس اليقين ، تميز جودة خط الانحدار الناتج. يتم التعبير عن هذه الجودة من خلال درجة التطابق بين البيانات الأصلية ونموذج الانحدار (البيانات المحسوبة). يكون مقياس اليقين دائمًا ضمن الفترة الزمنية.

في معظم الحالات ، تكون قيمة R التربيعية بين هذه القيم ، وتسمى القيم المتطرفة ، أي بين صفر وواحد.

إذا كانت قيمة R-square قريبة من واحد ، فهذا يعني أن النموذج المُنشأ يشرح تقريبًا كل متغيرات المتغيرات المقابلة. على العكس من ذلك ، فإن قيمة R التربيعية القريبة من الصفر تعني جودة رديئة للنموذج المركب.

في مثالنا ، مقياس اليقين هو 0.99673 ، مما يشير إلى توافق جيد جدًا لخط الانحدار مع البيانات الأصلية.

متعددة R- معامل الارتباط المتعدد R - يعبر عن درجة الاعتماد على المتغيرات المستقلة (X) والمتغير التابع (Y).

مضاعف R يساوي الجذر التربيعي لمعامل التحديد ، تأخذ هذه القيمة قيمًا في النطاق من صفر إلى واحد.

في تحليل الانحدار الخطي البسيط ، فإن المضاعف R يساوي معامل ارتباط بيرسون. في الواقع ، مضاعف R في حالتنا يساوي معامل ارتباط بيرسون من المثال السابق (0.998364).

الجدول 8.3 ب. معاملات الانحدار
احتمال خطأ تقليدي t- الإحصاء
تقاطع ص 2,694545455 0,33176878 8,121757129
متغير × 1 2,305454545 0,04668634 49,38177965
* تم تقديم نسخة مبتورة من الحسابات

الآن ضع في اعتبارك الجزء الأوسط من الحسابات الواردة في الجدول 8.3 ب. هنا ، يتم إعطاء معامل الانحدار ب (2.305454545) والإزاحة على طول المحور ص ، أي ثابت أ (2.694545455).

بناءً على الحسابات ، يمكننا كتابة معادلة الانحدار على النحو التالي:

ص = س * 2.305454545 + 2.694545455

يتم تحديد اتجاه العلاقة بين المتغيرات بناءً على العلامات (سلبية أو إيجابية) معاملات الانحدار(المعامل ب).

إذا كانت العلامة في معامل الانحدار- موجب ، تكون علاقة المتغير التابع بالمستقل إيجابية. في حالتنا ، علامة معامل الانحدار موجبة ، وبالتالي فإن العلاقة موجبة أيضًا.

إذا كانت العلامة في معامل الانحدار- سالب ، العلاقة بين المتغير التابع والمتغير المستقل سالبة (معكوسة).

في الجدول 8.3 ج. يتم عرض نتائج مخرجات القيم المتبقية. لكي تظهر هذه النتائج في التقرير ، من الضروري تنشيط مربع الاختيار "المتبقية" عند تشغيل أداة "الانحدار".

ما تبقى من الانسحاب

الجدول 8.3 ج. بقايا
الملاحظة توقع Y بقايا الموازين القياسية
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

باستخدام هذا الجزء من التقرير ، يمكننا رؤية انحرافات كل نقطة عن خط الانحدار المُنشأ. أعظم قيمة مطلقة

محاضرة 3

تحليل الانحدار.

1) الخصائص العددية للانحدار

2) الانحدار الخطي

3) الانحدار غير الخطي

4) الانحدار المتعدد

5) استخدام MS EXCEL لإجراء تحليل الانحدار

أداة المراقبة والتقييم - مهام الاختبار

1. الخصائص العددية للانحدار

تحليل الانحدار هو طريقة إحصائية لدراسة تأثير واحد أو أكثر من المتغيرات المستقلة على متغير تابع. تُسمى المتغيرات المستقلة بـ Regressors أو المتنبئين ، وتسمى المتغيرات التابعة المعايير. تعكس مصطلحات المتغيرات التابعة والمستقلة فقط الاعتماد الرياضي للمتغيرات ، وليس العلاقة بين السبب والنتيجة.

أهداف تحليل الانحدار

  • تحديد درجة حتمية اختلاف المعيار (التابع) المتغير بواسطة المتنبئين (المتغيرات المستقلة).
  • توقع قيمة المتغير التابع باستخدام المتغير المستقل.
  • تحديد مساهمة المتغيرات المستقلة الفردية في تباين المتغير التابع.

لا يمكن استخدام تحليل الانحدار لتحديد ما إذا كانت هناك علاقة بين المتغيرات ، لأن وجود مثل هذه العلاقة يعد شرطًا أساسيًا لتطبيق التحليل.

لإجراء تحليل الانحدار ، تحتاج أولاً إلى التعرف على المفاهيم الأساسية للإحصاء ونظرية الاحتمالات.

الخصائص العددية الأساسية للمتغيرات العشوائية المنفصلة والمستمرة: التوقع الرياضي ، التباين والانحراف المعياري.

المتغيرات العشوائية تنقسم إلى نوعين:

  • منفصلة ، والتي يمكن أن تأخذ فقط قيمًا محددة ومحددة مسبقًا (على سبيل المثال ، قيم الأرقام على الوجه العلوي لحجر النرد أو القيم الترتيبية للشهر الحالي) ؛
  • · مستمر (في أغلب الأحيان - قيم بعض الكميات الفيزيائية: الأوزان ، والمسافات ، ودرجات الحرارة ، وما إلى ذلك) ، والتي ، وفقًا لقوانين الطبيعة ، يمكن أن تأخذ أي قيم ، على الأقل في فترة زمنية معينة.

قانون توزيع المتغير العشوائي هو المراسلات بين القيم المحتملة لمتغير عشوائي منفصل واحتمالاته ، وعادة ما يتم كتابتها في جدول:

يتم التعبير عن التعريف الإحصائي للاحتمال من حيث التكرار النسبي لحدث عشوائي ، أي أنه يوجد كنسبة من عدد المتغيرات العشوائية إلى العدد الإجمالي للمتغيرات العشوائية.

التوقع الرياضي لمتغير عشوائي منفصلXيسمى مجموع حاصل ضرب قيم الكمية Xعلى احتمال هذه القيم. يتم الإشارة إلى التوقع الرياضي بواسطة أو م(X) .

ن

= م(X) = x 1 ص 1 + x 2 ص 2 +… + x ن ص ن = س س ط بي

أنا=1

يتم تحديد تشتت المتغير العشوائي فيما يتعلق بتوقعه الرياضي باستخدام خاصية عددية تسمى التشتت. ببساطة ، التباين هو انتشار متغير عشوائي حول المتوسط. لفهم جوهر التشتت ، خذ مثالاً. متوسط ​​الراتب في البلاد حوالي 25 ألف روبل. من أين يأتي هذا الرقم؟ على الأرجح ، يتم إضافة جميع الرواتب وقسمتها على عدد الموظفين. في هذه الحالة ، يوجد تشتت كبير جدًا (الحد الأدنى للراتب حوالي 4 آلاف روبل ، والحد الأقصى حوالي 100 ألف روبل). إذا كان لكل فرد نفس الراتب ، فسيكون التشتت صفراً ، ولن يكون هناك فارق.

تشتت متغير عشوائي منفصلXيسمى التوقع الرياضي لمربع فرق المتغير العشوائي وتوقعه الرياضي:

D = M [((X - M (X)) 2]

باستخدام تعريف التوقع الرياضي لحساب التباين ، نحصل على الصيغة:

D \ u003d S (x i - M (X)) 2 ص ط

التباين له أبعاد مربع المتغير العشوائي. في الحالات التي يكون فيها من الضروري وجود خاصية عددية لتشتت القيم المحتملة في نفس البعد مثل المتغير العشوائي نفسه ، يتم استخدام الانحراف المعياري.

الانحراف المعيارييسمى المتغير العشوائي الجذر التربيعي لتباينه.

متوسط ​​الانحراف التربيعي هو مقياس لتشتت قيم متغير عشوائي حول توقعه الرياضي.

مثال.

يوضح الجدول التالي قانون توزيع المتغير العشوائي X:

ابحث عن توقعها الرياضي وتباينها وانحرافها المعياري .

نستخدم الصيغ أعلاه:

M (X) \ u003d 1 0.1 + 2 0.4 + 4 0.4 + 5 0.1 \ u003d 3

د = (1-3) 2 0.1 + (2-3) 2 0.4 + (4 - 3) 2 0.4 + (5 - 3) 2 0.1 \ u003d 1.6

مثال.

في اليانصيب النقدي ، يتم لعب فوز واحد بقيمة 1000 روبل ، و 10 انتصارات بقيمة 100 روبل و 100 فوز بقيمة 1 روبل لكل منها مع إجمالي عدد التذاكر 10000. ضع قانون توزيع للفوز العشوائي X لمالك تذكرة يانصيب واحدة وتحديد التوقع الرياضي والتباين والانحراف المعياري لمتغير عشوائي.

X 1 \ u003d 1000 ، X 2 \ u003d 100 ، X 3 \ u003d 1 ، X 4 \ u003d 0 ،

P 1 = 1/10000 = 0.0001 ، P 2 = 10/10000 = 0.001 ، P 3 = 100/10000 = 0.01 ، P 4 = 1 - (P 1 + P 2 + P 3) = 0.9889.

نضع النتائج في جدول:

التوقع الرياضي - مجموع حاصل الضرب المزدوجة لقيمة متغير عشوائي حسب احتمالها. بالنسبة لهذه المشكلة ، من المستحسن حسابها بالصيغة

1000 0.0001 + 100 0.001 + 1 0.01 + 0 0.9889 = 0.21 روبل.

لقد حصلنا على سعر تذكرة حقيقي "عادل".

D \ u003d S (x i - M (X)) 2 ص أنا \ u003d (1000 - 0.21) 2 0.0001 + (100 - 0.21) 2 0.001 +

+ (1 - 0,21) 2 0,01 + (0 - 0,21) 2 0,9889 ≈ 109,97

دالة توزيع المتغيرات العشوائية المستمرة

تسمى القيمة ، التي ستأخذ قيمة واحدة محتملة نتيجة للاختبار (من غير المعروف مسبقًا أيها) ، متغير عشوائي. كما ذكر أعلاه ، فإن المتغيرات العشوائية منفصلة (غير متصلة) ومستمرة.

المتغير المنفصل هو متغير عشوائي يأخذ قيمًا ممكنة منفصلة باحتمالات معينة يمكن ترقيمها.

المتغير المستمر هو متغير عشوائي يمكن أن يأخذ جميع القيم من فاصل زمني محدد أو لانهائي.

حتى هذه النقطة ، اقتصرنا على "مجموعة" واحدة فقط من المتغيرات العشوائية - المنفصلة ، أي أخذ القيم المحدودة.

لكن نظرية وممارسة الإحصاء تتطلب استخدام مفهوم المتغير العشوائي المستمر - السماح بأي قيم عددية من أي فترة زمنية.

يتم تحديد قانون توزيع المتغير العشوائي المستمر بشكل ملائم باستخدام ما يسمى بدالة كثافة الاحتمال. و (خ). الاحتمالية P (a< X < b) того, что значение, принятое случайной величиной Х, попадет в промежуток (a; b), определяется равенством

ص (أ< X < b) = ∫ F(x) dx

يسمى الرسم البياني للوظيفة f (x) بمنحنى التوزيع. هندسيًا ، يكون احتمال سقوط متغير عشوائي في الفاصل الزمني (أ ؛ ب) مساويًا لمساحة شبه منحني منحني الشكل ، يحده منحنى التوزيع ومحور الثور والخطوط المستقيمة س = أ ، س = ب .

P (a £ X

إذا تم طرح مجموعة محدودة أو قابلة للعد من حدث معقد ، فسيظل احتمال وقوع حدث جديد دون تغيير.

الوظيفة f (x) - تسمى الدالة العددية العددية للوسيطة الحقيقية x بكثافة الاحتمال ، وتوجد عند النقطة x إذا كان هناك حد عند هذه النقطة:

خصائص الكثافة الاحتمالية:

  1. كثافة الاحتمال هي دالة غير سالبة ، أي f (x) ≥ 0

(إذا كانت جميع قيم المتغير العشوائي X في الفاصل الزمني (أ ؛ ب) ، فإن الأخير

يمكن كتابة المساواة كـ ∫ f (x) dx = 1).

ضع في اعتبارك الآن الوظيفة F (x) = P (X< х). Эта функция называется функцией распределения вероятности случайной величины Х. Функция F(х) существует как для дискретных, так и для непрерывных случайных величин. Если f (x) - функция плотности распределения вероятности

المتغير العشوائي المستمر X ، ثم F (x) = ∫ f (x) dx = 1).

ويترتب على المساواة الأخيرة أن f (x) = F "(x)

في بعض الأحيان تسمى الوظيفة f (x) دالة توزيع الاحتمالات التفاضلية ، وتسمى الوظيفة F (x) دالة توزيع الاحتمالية التراكمية.

نلاحظ أهم خصائص دالة التوزيع الاحتمالي:

  1. F (x) هي دالة غير متناقصة.
  2. F (-) = 0.
  3. F (+ ∞) = 1.

يعتبر مفهوم دالة التوزيع مركزيًا لنظرية الاحتمال. باستخدام هذا المفهوم ، يمكن للمرء أن يعطي تعريفًا آخر لمتغير عشوائي مستمر. يسمى المتغير العشوائي المستمر إذا كانت دالة التوزيع المتكاملة F (x) مستمرة.

الخصائص العددية للمتغيرات العشوائية المستمرة

يتم دائمًا حساب التوقع الرياضي والتباين والمعلمات الأخرى لأي متغيرات عشوائية باستخدام الصيغ التي تتبع قانون التوزيع.

بالنسبة للمتغير العشوائي المستمر ، يتم حساب التوقع الرياضي بالصيغة:

م (س) = x و (x) dx

تشتت:

د (س) = ( س-م (X)) 2 F(x) dx أو D (X) = ∫ x 2 F(x) dx - (م (X)) 2

2. الانحدار الخطي

اجعل المكونين X و Y لمتغير عشوائي ثنائي الأبعاد (X ، Y) تابعين. سنفترض أن أحدهما يمكن تمثيله تقريبًا كدالة خطية للآخر ، على سبيل المثال

Y ≈ g (X) = α + βX ، وحدد المعلمتين α و باستخدام طريقة المربعات الصغرى.

تعريف. الوظيفة g (X) = α + βX تسمى أفضل تقريب Y بمعنى طريقة المربعات الصغرى ، إذا كان التوقع الرياضي M (Y - g (X)) 2 يأخذ أصغر قيمة ممكنة ؛ الوظيفة g (X) تسمى يعني الانحدار التربيعيمن Y إلى X.

نظريةانحدار متوسط ​​التربيع الخطي لـ Y على X هو:

أين هو معامل الارتباط X و Y.

معاملات المعادلة.

يمكن للمرء التحقق من أن الوظيفة F (α ، β) لهذه القيم

F(α, β ) = م(Y - α - βX) ² له حد أدنى ، مما يثبت تأكيد النظرية.

تعريف. المعامل يسمى معامل الانحدار Y على X، والخط المستقيم - - الانحدار التربيعي المتوسط ​​المباشر لـ Y على X.

استبدال إحداثيات النقطة الثابتة في المساواة ، يمكننا العثور على الحد الأدنى لقيمة الوظيفة F (α ، β) تساوي هذه القيمة تسمى التشتت المتبقي Y بالنسبة إلى X وتميز مقدار الخطأ المسموح به عند استبدال Y بـ

ز (X) = α + βX. عند ، يكون التباين المتبقي 0 ، أي أن المساواة ليست تقريبية ، ولكنها دقيقة. لذلك ، عندما يتم توصيل Y و X بواسطة اعتماد وظيفي خطي. وبالمثل ، يمكنك الحصول على خط مستقيم لانحدار الجذر التربيعي لـ X على Y:

والتباين المتبقي لـ X فيما يتعلق بـ Y. يتطابق كلا الانحدار المباشر. بمقارنة معادلات الانحدار Y على X و X على Y وحل نظام المعادلات ، يمكنك العثور على نقطة تقاطع خطوط الانحدار - نقطة ذات إحداثيات (t x ، t y) ، تسمى مركز التوزيع المشترك لقيم X و Y.

سننظر في الخوارزمية الخاصة بتجميع معادلات الانحدار من الكتاب المدرسي لـ V.E.Gmurman "نظرية الاحتمالات والإحصاءات الرياضية" ص .256.

1) قم بتجميع جدول حساب يتم فيه تسجيل عدد عناصر العينة وخيارات العينة ومربعاتها ومنتجها.

2) احسب المجموع على جميع الأعمدة باستثناء الرقم.

3) حساب متوسط ​​القيم لكل كمية وتشتت وانحرافات معيارية.

5) اختبر الفرضية حول وجود علاقة بين X و Y.

6) قم بتكوين معادلات كل من خطوط الانحدار ورسم الرسوم البيانية لهذه المعادلات.

منحدر انحدار الخط المستقيم Y على X هو معامل انحدار العينة

المعامل ب =

نحصل على المعادلة المرغوبة لخط الانحدار Y على X:

ص \ u003d 0.202 × + 1.024

وبالمثل ، فإن معادلة الانحدار X على Y:

منحدر انحدار الخط المستقيم Y على X هو معامل انحدار العينة pxy:

المعامل ب =

س = 4.119 ص - 3.714

3. الانحدار غير الخطي

إذا كانت هناك علاقات غير خطية بين الظواهر الاقتصادية ، فسيتم التعبير عنها باستخدام الوظائف غير الخطية المقابلة.

هناك فئتان من الانحدارات غير الخطية:

1. الانحدارات غير الخطية فيما يتعلق بالمتغيرات التوضيحية المدرجة في التحليل ، ولكنها خطية فيما يتعلق بالمعلمات المقدرة ، على سبيل المثال:

كثيرات الحدود من درجات مختلفة

غلو متساوي الأضلاع - ؛

دالة شبه لوغاريتمية -.

2 - الانحدارات غير الخطية من حيث البارامترات المقدرة ، على سبيل المثال:

قوة - ؛

إيضاحي -؛

متسارع - .

يتم تقليل الانحدار غير الخطي على المتغيرات المضمنة إلى شكل خطي عن طريق تغيير بسيط في المتغيرات ، ويتم إجراء تقدير إضافي للمعلمات باستخدام طريقة المربعات الصغرى. دعنا نفكر في بعض الوظائف.

يتم تقليل القطع المكافئ من الدرجة الثانية إلى شكل خطي باستخدام البديل:. نتيجة لذلك ، نصل إلى معادلة ذات عاملين ، يؤدي تقدير معلماتها باستخدام طريقة المربعات الصغرى إلى نظام المعادلات:

عادةً ما يتم استخدام القطع المكافئ من الدرجة الثانية في الحالات التي تتغير فيها طبيعة العلاقة بين السمات قيد الدراسة لفترة معينة من قيم العوامل: تتغير العلاقة المباشرة إلى واحدة معكوسة أو واحدة معكوسة إلى واحدة مباشرة.

يمكن استخدام القطع الزائد المتساوي الأضلاع لتوصيف العلاقة بين التكاليف المحددة للمواد الخام والمواد والوقود وحجم الإنتاج ووقت تداول البضائع وقيمة الدوران. مثاله الكلاسيكي هو منحنى فيليبس ، الذي يميز العلاقة غير الخطية بين معدل البطالة xونسبة الزيادة في الأجور ذ.

يتم تقليل القطع الزائد إلى معادلة خطية باستبدال بسيط:. يمكنك أيضًا استخدام طريقة المربعات الصغرى لبناء نظام معادلات خطية.

بطريقة مماثلة ، يتم تقليل التبعيات إلى شكل خطي: ​​، وغيرها.

يتم استخدام القطع الزائد المتساوي الأضلاع والمنحنى شبه اللوغاريتمي لوصف منحنى إنجل (وصف رياضي للعلاقة بين حصة الإنفاق على السلع المعمرة وإجمالي الإنفاق (أو الدخل)). يتم استخدام المعادلات التي يتم تضمينها في دراسات الإنتاجية وكثافة العمالة للإنتاج الزراعي.

4. الانحدار المتعدد

الانحدار المتعدد - معادلة ارتباط بمتغيرات مستقلة متعددة:

أين المتغير التابع (العلامة الناتجة) ؛

المتغيرات المستقلة (العوامل).

لإنشاء معادلة انحدار متعددة ، غالبًا ما يتم استخدام الوظائف التالية:

خطي -

قوة -

عارض -

مقارنة مبالغ فيها - .

يمكنك استخدام وظائف أخرى يمكن اختزالها إلى شكل خطي.

لتقدير معاملات معادلة الانحدار المتعدد ، يتم استخدام طريقة المربعات الصغرى (LSM). بالنسبة للمعادلات الخطية والمعادلات غير الخطية التي يمكن اختزالها إلى المعادلات الخطية ، يتم إنشاء نظام المعادلات العادية التالي ، والذي يتيح حله الحصول على تقديرات لمعاملات الانحدار:

لحلها يمكن تطبيق طريقة المحددات:

أين هو محدد النظام ؛

المحددات الخاصة والتي يتم الحصول عليها عن طريق استبدال العمود المقابل لمصفوفة محدد النظام ببيانات الجانب الأيسر من النظام.

نوع آخر من معادلات الانحدار المتعدد هو معادلة انحدار المقياس المعياري ، LSM قابلة للتطبيق على معادلة الانحدار المتعدد على مقياس موحد.

5. الاستعمالالسيدةاكسللإجراء تحليل الانحدار

يحدد تحليل الانحدار شكل العلاقة بين المتغير العشوائي Y (التابع) وقيم متغير واحد أو أكثر (مستقل) ، وتعتبر قيم هذا الأخير معطاة بالضبط. عادة ما يتم تحديد هذا الاعتماد من خلال بعض النماذج الرياضية (معادلة الانحدار) التي تحتوي على العديد من المعلمات غير المعروفة. في سياق تحليل الانحدار ، على أساس بيانات العينة ، يتم العثور على تقديرات لهذه المعلمات ، ويتم تحديد الأخطاء الإحصائية للتقديرات أو حدود فترات الثقة ، ويتم التحقق من توافق (كفاية) النموذج الرياضي المقبول مع البيانات التجريبية.

في تحليل الانحدار الخطي ، يفترض أن تكون العلاقة بين المتغيرات العشوائية خطية. في أبسط الحالات ، في نموذج الانحدار الخطي المقترن ، يوجد متغيرين X و Y. وهو مطلوب لـ n أزواج من الملاحظات (X1 ، Y1) ، (X2 ، Y2) ، ... ، (Xn ، Yn) لبناء (تحديد) خط مستقيم ، يسمى خط الانحدار ، والذي يقارب "أفضل" القيم الملاحظة. معادلة هذا الخط y = ax + b هي معادلة انحدار. باستخدام معادلة الانحدار ، يمكنك التنبؤ بالقيمة المتوقعة للمتغير التابع y المقابل لقيمة معينة للمتغير المستقل x. في حالة الاعتماد بين متغير تابع واحد Y والعديد من المتغيرات المستقلة X1 ، X2 ، ... ، Xm ، يتحدث المرء عن الانحدار الخطي المتعدد.

في هذه الحالة ، يكون لمعادلة الانحدار الشكل

ص = أ 0 + أ 1 × 1 + أ 2 × 2 + ... + أ م × م ،

حيث a0، a1، a2،…، am هي معاملات الانحدار التي يتعين تحديدها.

يتم تحديد معاملات معادلة الانحدار باستخدام طريقة المربعات الصغرى ، وتحقيق الحد الأدنى من مجموع الفروق التربيعية الممكنة بين القيم الحقيقية للمتغير Y وتلك المحسوبة باستخدام معادلة الانحدار. وبالتالي ، على سبيل المثال ، يمكن إنشاء معادلة الانحدار الخطي حتى في حالة عدم وجود ارتباط خطي.

مقياس فعالية نموذج الانحدار هو معامل التحديد R2 (R-square). يمكن أن يأخذ معامل التحديد القيم بين 0 و 1 التي تحدد درجة الدقة التي تصفها معادلة الانحدار الناتجة (تقارب) البيانات الأصلية. يتم أيضًا التحقق من أهمية نموذج الانحدار باستخدام معيار F (فيشر) ويتم التحقق من موثوقية الفرق بين المعاملات a0 ، a1 ، a2 ، ... ، am من الصفر باستخدام اختبار الطالب t.

في Excel ، يتم تقريب البيانات التجريبية بمعادلة خطية حتى الترتيب السادس عشر:

y = a0 + a1x1 + a2x2 +… + a16x16

للحصول على معاملات الانحدار الخطي ، يمكن استخدام إجراء "الانحدار" من حزمة التحليل. توفر الدالة LINEST أيضًا معلومات كاملة حول معادلة الانحدار الخطي. بالإضافة إلى ذلك ، يمكن استخدام دالتي SLOPE و INTERCEPT للحصول على معلمات معادلة الانحدار ، ويمكن استخدام دالتي TREND و FORECAST للحصول على قيم Y المتوقعة عند النقاط المطلوبة (للانحدار الزوجي).

دعونا نفكر بالتفصيل في تطبيق دالة LINEST (known_y، [known_x]، [ثابت]، [الإحصائيات]): known_y - نطاق القيم المعروفة للمعامل التابع Y. في تحليل الانحدار الزوجي ، يمكن أن يكون لها اي نموذج؛ في صيغة الجمع ، يجب أن يكون إما صفًا أو عمودًا ؛ known_x هو نطاق القيم المعروفة لواحد أو أكثر من المعلمات المستقلة. يجب أن يكون له نفس شكل النطاق Y (لمعلمات متعددة ، أو عدة أعمدة أو صفوف ، على التوالي) ؛ ثابت - حجة منطقية. إذا كان من الضروري ، بناءً على المعنى العملي لمهمة تحليل الانحدار ، أن يمر خط الانحدار عبر الأصل ، أي أن المعامل الحر يساوي 0 ، فيجب تعيين قيمة هذه الوسيطة على 0 (أو " خاطئة"). إذا تم ضبط القيمة على 1 (أو "صواب") أو حذفها ، فسيتم حساب المعامل الحر بالطريقة المعتادة ؛ الإحصاء حجة منطقية. إذا تم تعيين القيمة على 1 (أو "صواب") ، فسيتم إرجاع إحصائية انحدار إضافية (انظر الجدول) ، تُستخدم لتقييم فعالية النموذج وأهميته. في الحالة العامة ، بالنسبة للانحدار الزوجي y = ax + b ، تبدو نتيجة تطبيق دالة LINEST كما يلي:

الطاولة. نطاق الإخراج من LINEST لتحليل الانحدار الزوجي

في حالة تحليل الانحدار المتعدد للمعادلة y = a0 + a1x1 + a2x2 + ... + amxm ، يتم عرض المعاملات am ، ... ، a1 ، a0 في السطر الأول ، ويتم عرض الأخطاء القياسية لهذه المعاملات في السطر الثاني . الصفوف 3-5 ، باستثناء أول عمودين مملوءين بإحصائيات الانحدار ، ستنتج # N / A.

يجب إدخال دالة LINEST كصيغة صفيف ، وتحديد صفيف بالحجم المطلوب أولاً للنتيجة (m + 1 عمود و 5 صفوف إذا كانت إحصاءات الانحدار مطلوبة) وإكمال إدخال الصيغة بالضغط على CTRL + SHIFT + ENTER.

نتيجة مثالنا:

بالإضافة إلى ذلك ، يحتوي البرنامج على وظيفة مضمنة - تحليل البيانات في علامة التبويب البيانات.

يمكن استخدامه أيضًا لإجراء تحليل الانحدار:

على الشريحة - نتيجة تحليل الانحدار باستخدام تحليل البيانات.

النتائج

إحصائيات الانحدار

متعددة R

R- سكوير

تطبيع R- مربع

خطأ تقليدي

ملاحظات

تحليل التباين

أهمية F

تراجع

احتمال

خطأ تقليدي

t- الإحصاء

P- القيمة

أسفل 95٪

أعلى 95٪

95.0٪ أقل

أعلى 95.0٪

تقاطع ص

متغير × 1

معادلات الانحدار التي نظرنا إليها سابقًا مبنية أيضًا في MS Excel. لتنفيذها ، يتم أولاً إنشاء مخطط مبعثر ، ثم من خلال قائمة السياق ، حدد - إضافة خط الاتجاه. في النافذة الجديدة ، حدد المربعات - اعرض المعادلة على الرسم التخطيطي وضع قيمة موثوقية التقريب (R ^ 2) على الرسم التخطيطي.

المؤلفات:

  1. نظرية الاحتمالية والإحصاء الرياضي. Gmurman V. E. كتاب مدرسي للجامعات. - إد. العاشر ، ريال. - م: العالي. المدرسة ، 2010. - 479 ثانية.
  2. الرياضيات العليا في التمارين والمهام. كتاب مدرسي للجامعات / Danko P. E.، Popov A. G.، Kozhevnikova T. Ya.، Danko S. P. In 2 hours - Ed. السادس ، ريال. - م: Oniks Publishing House LLC: Mir and Education Publishing House LLC، 2007. - 416 p.
    1. 3. http://www.machinelearning.ru/wiki/index.php؟title=٪D0٪A0٪D0٪B5٪D0٪B3٪D1٪80٪D0٪B5٪D1٪81٪D1٪81٪D0٪B8 ٪ D1٪ 8F - بعض المعلومات حول تحليل الانحدار

مفهوم الانحدار. العلاقة بين المتغيرات xو ذيمكن وصفها بطرق مختلفة. على وجه الخصوص ، يمكن التعبير عن أي شكل من أشكال الاتصال بمعادلة عامة ، حيث ذتعامل كمتغير تابع ، أو المهاممن آخر - متغير مستقل x يسمى جدال. يمكن إعطاء التطابق بين وسيطة ودالة من خلال جدول ، وصيغة ، ورسم بياني ، وما إلى ذلك. يسمى تغيير دالة بناءً على تغيير في وسيطة واحدة أو أكثر تراجع. المحتوى هو كل الوسائل المستخدمة لوصف الارتباطات تحليل الانحدار.

معادلات الارتباط ، أو معادلات الانحدار ، وسلسلة الانحدار التجريبية والمحسوبة نظريًا ، والرسوم البيانية الخاصة بهم ، والتي تسمى خطوط الانحدار ، وكذلك معاملات الانحدار الخطي وغير الخطي ، تعمل على التعبير عن الانحدار.

تعبر مؤشرات الانحدار عن الارتباط ثنائي الاتجاه ، مع مراعاة التغيير في متوسط ​​قيم السمة صعند تغيير القيم x أناإشارة X، والعكس بالعكس ، إظهار التغيير في متوسط ​​القيم للميزة Xبالقيم المتغيرة ذ أناإشارة ص. الاستثناء هو السلاسل الزمنية ، أو سلسلة الديناميكيات ، التي تظهر التغيير في العلامات بمرور الوقت. انحدار هذه السلسلة من جانب واحد.

هناك العديد من الأشكال والأنواع المختلفة للارتباطات. يتم تقليل المهمة إلى تحديد شكل الاتصال في كل حالة محددة والتعبير عنها من خلال معادلة الارتباط المقابلة ، مما يسمح لنا بالتنبؤ بالتغييرات المحتملة في علامة واحدة صبناءً على التغييرات المعروفة X، المرتبطة بالارتباط الأول.

12.1 الانحدار الخطي

معادلة الانحدار.نتائج الملاحظات التي أجريت على كائن بيولوجي معين وفقًا لخصائص مرتبطة xو ذ، يمكن تمثيلها بنقاط على مستوى من خلال بناء نظام إحداثيات مستطيلة. نتيجة لذلك ، يتم الحصول على مخطط مبعثر معين ، مما يجعل من الممكن الحكم على شكل وضيق العلاقة بين الميزات المختلفة. غالبًا ما تبدو هذه العلاقة كخط مستقيم أو يمكن تقريبها بخط مستقيم.

العلاقة الخطية بين المتغيرات xو ذيوصف بمعادلة عامة ، حيث ا ب ت ث،... هي معلمات المعادلة التي تحدد العلاقة بين الوسيطات x 1 ، س 2 ، س 3 ، ... ، x موالوظائف.

في الممارسة العملية ، لا يتم أخذ جميع الحجج الممكنة في الاعتبار ، ولكن فقط بعض الحجج ، في أبسط الحالات ، واحدة فقط:

في معادلة الانحدار الخطي (1) أهو مصطلح مجاني ، والمعلمة بيحدد ميل خط الانحدار فيما يتعلق بمحاور الإحداثيات المستطيلة. في الهندسة التحليلية ، تسمى هذه المعلمة عامل الانحدار، وفي القياسات الحيوية - معامل الانحدار. تمثيل مرئي لهذه المعلمة وموضع خطوط الانحدار صعلى Xو Xعلى صفي نظام الإحداثيات المستطيلة يعطي الشكل 1.

أرز. 1 Y بواسطة X و X بواسطة خطوط الانحدار Y في النظام

الإحداثيات المستطيلة

تتقاطع خطوط الانحدار ، كما هو موضح في الشكل 1 ، عند النقطة O (،) ، المقابلة لقيم المتوسط ​​الحسابي للعلامات المرتبطة ببعضها البعض صو X. عند رسم الرسوم البيانية للانحدار ، يتم رسم قيم المتغير المستقل X على طول الإحداثي ، ويتم رسم قيم المتغير التابع ، أو الوظيفة Y ، على طول الإحداثي. ويمر الخط AB عبر النقطة O (، ) يتوافق مع العلاقة (الوظيفية) الكاملة بين المتغيرات صو Xعندما يكون معامل الارتباط. أقوى العلاقة بين صو Xفكلما اقتربت خطوط الانحدار من AB ، وبالعكس ، كلما كانت العلاقة بين هذه القيم أضعف ، كلما كانت خطوط الانحدار بعيدة عن AB. في حالة عدم وجود اتصال بين الميزات ، تكون خطوط الانحدار في زوايا قائمة مع بعضها البعض و.

نظرًا لأن مؤشرات الانحدار تعبر عن الارتباط ثنائي الاتجاه ، فيجب كتابة معادلة الانحدار (1) على النحو التالي:

وفقًا للصيغة الأولى ، يتم تحديد متوسط ​​القيم عندما تتغير العلامة Xلكل وحدة قياس ، في الثانية - القيم المتوسطة عند تغيير الميزة لكل وحدة قياس ص.

معامل الانحدار.يوضح معامل الانحدار كيف ، في المتوسط ​​، قيمة معلم واحد ذيتغير عندما ترتبط وحدة قياس أخرى بـ صإشارة X. يتم تحديد هذا المؤشر من خلال الصيغة

هنا القيم ساضرب في حجم فترات الفصل الدراسي λ إذا تم العثور عليها من خلال سلسلة التباينات أو جداول الارتباط.

يمكن حساب معامل الانحدار بتجاوز حساب الانحرافات المعيارية س ذو س xحسب الصيغة

إذا كان معامل الارتباط غير معروف ، يتم تحديد معامل الانحدار على النحو التالي:

العلاقة بين معاملات الانحدار والارتباط.بمقارنة الصيغ (11.1) (الموضوع 11) و (12.5) ، نرى أن البسط يحتوي على نفس القيمة ، مما يشير إلى وجود صلة بين هذه المؤشرات. يتم التعبير عن هذه العلاقة من خلال المساواة

وبالتالي ، فإن معامل الارتباط يساوي المتوسط ​​الهندسي للمعاملات ب yxو ب س ص. تسمح الصيغة (6) ، أولاً ، من القيم المعروفة لمعاملات الانحدار ب yxو ب س صتحديد معامل الانحدار ص س صوثانياً للتحقق من صحة حساب مؤشر الارتباط هذا ص س صبين سمات متفاوتة Xو ص.

مثل معامل الارتباط ، فإن معامل الانحدار يميز فقط العلاقة الخطية ويرافقه علامة زائد للعلاقة الإيجابية وعلامة ناقص للعلاقة السلبية.

تحديد معاملات الانحدار الخطي.من المعروف أن مجموع الانحرافات التربيعية للمتغير x أنامن المتوسط ​​توجد أصغر قيمة ، أي أن هذه النظرية تشكل أساس طريقة المربعات الصغرى. فيما يتعلق بالانحدار الخطي [انظر الصيغة (1)] ، يتم استيفاء متطلبات هذه النظرية من خلال نظام معين من المعادلات يسمى عادي:

حل مشترك لهذه المعادلات فيما يتعلق بالمعلمات أو بيؤدي إلى النتائج التالية:

;

;

ومن أين أنا.

بالنظر إلى الطبيعة ذات الاتجاهين للعلاقة بين المتغيرات صو X، صيغة تحديد المعلمة أيجب التعبير عنها على النحو التالي:

و . (7)

معامل ب، أو معامل الانحدار ، بواسطة الصيغ التالية:

بناء سلسلة الانحدار التجريبي.في ظل وجود عدد كبير من الملاحظات ، يبدأ تحليل الانحدار ببناء سلسلة الانحدار التجريبي. سلسلة الانحدار التجريبييتم تشكيلها عن طريق حساب قيم سمة متغيرة واحدة Xمتوسط ​​قيم الآخر ، المرتبطة Xإشارة ص. بعبارة أخرى ، فإن بناء سلسلة الانحدار التجريبي يأتي لإيجاد المجموعة تعني u من القيم المقابلة للعلامات Y و X.

سلسلة الانحدار التجريبي هي سلسلة مزدوجة من الأرقام التي يمكن تمثيلها بنقاط على مستوى ، وبعد ذلك ، من خلال ربط هذه النقاط بمقاطع مستقيمة ، يمكن الحصول على خط انحدار تجريبي. تسمى سلسلة الانحدار التجريبي ، وخاصة مؤامراتهم خطوط الانحدار، إعطاء تمثيل مرئي لشكل وضيق ارتباط الارتباط بين الميزات المختلفة.

معادلة سلسلة الانحدار التجريبي.الرسوم البيانية لسلسلة الانحدار التجريبي ، كقاعدة عامة ، هي خطوط متقطعة وليست خطوط ناعمة. ويفسر ذلك حقيقة أنه ، إلى جانب الأسباب الرئيسية التي تحدد النمط العام في تنوع السمات المرتبطة ، تتأثر قيمتها بتأثير العديد من الأسباب الثانوية التي تسبب تقلبات عشوائية في النقاط العقدية للانحدار. لتحديد الاتجاه الرئيسي (الاتجاه) للتباين المقترن للسمات المترابطة ، تحتاج إلى استبدال الخطوط المكسورة بخطوط انحدار سلسة تعمل بسلاسة. تسمى عملية استبدال الخطوط المكسورة بخطوط ناعمة محاذاة السلاسل التجريبيةو خطوط الانحدار.

طريقة المحاذاة الرسومية.هذه هي أبسط طريقة لا تتطلب عملاً حسابيًا. جوهرها على النحو التالي. يتم رسم سلسلة الانحدار التجريبي كرسم بياني في نظام إحداثيات مستطيل. بعد ذلك ، يتم تحديد نقاط منتصف الانحدار بصريًا ، حيث يتم رسم خط متصل باستخدام مسطرة أو نمط. عيب هذه الطريقة واضح: فهي لا تستبعد تأثير الخصائص الفردية للباحث على نتائج محاذاة خطوط الانحدار التجريبية. لذلك ، في الحالات التي تتطلب دقة أعلى عند استبدال خطوط الانحدار المكسورة بخطوط ناعمة ، يتم استخدام طرق أخرى لمحاذاة السلسلة التجريبية.

طريقة المتوسط ​​المتحرك.يتم تقليل جوهر هذه الطريقة إلى الحساب المتسلسل للمتوسط ​​الحسابي لعضوين أو ثلاثة أعضاء متجاورين في السلسلة التجريبية. هذه الطريقة مناسبة بشكل خاص في الحالات التي يتم فيها تمثيل السلسلة التجريبية بعدد كبير من المصطلحات ، بحيث لا يؤثر فقدان اثنين منها - المتطرفين ، وهو أمر لا مفر منه مع طريقة المعادلة هذه ، بشكل ملحوظ على هيكلها.

طريقة المربعات الصغرى.تم اقتراح هذه الطريقة في بداية القرن التاسع عشر بواسطة A.M. ليجيندر ، وبصرف النظر عنه ، ك.جاوس. يسمح لك بمحاذاة السلسلة التجريبية بدقة أكبر. تعتمد هذه الطريقة ، كما هو موضح أعلاه ، على افتراض أن مجموع الانحرافات التربيعية للمتغير x أنا من متوسطها ، يوجد حد أدنى للقيمة ، أي من هنا اسم الطريقة ، والتي لا تستخدم فقط في البيئة ، ولكن أيضًا في التكنولوجيا. طريقة المربعات الصغرى موضوعية وعالمية ، يتم استخدامها في مجموعة متنوعة من الحالات عند إيجاد المعادلات التجريبية لسلسلة الانحدار وتحديد معاملاتها.

مطلب طريقة المربعات الصغرى هو أنه يجب الحصول على النقاط النظرية لخط الانحدار بطريقة تجعل مجموع الانحرافات التربيعية من هذه النقاط من أجل الملاحظات التجريبية ذ أناكان ضئيلاً ، أي

بحساب الحد الأدنى من هذا التعبير وفقًا لمبادئ التحليل الرياضي وتحويله بطريقة معينة ، يمكن للمرء الحصول على نظام يسمى المعادلات العادية، حيث تكون القيم غير المعروفة هي المعلمات المرغوبة لمعادلة الانحدار ، ويتم تحديد المعاملات المعروفة من خلال القيم التجريبية للسمات ، وعادةً ما تكون مجموع قيمها ونواتجها المتقاطعة.

الانحدار الخطي المتعدد.عادة ما يتم التعبير عن العلاقة بين العديد من المتغيرات بواسطة معادلة انحدار متعددة ، والتي يمكن أن تكون كذلك خطيو غير خطي. في أبسط صوره ، يتم التعبير عن الانحدار المتعدد بمعادلة ذات متغيرين مستقلين ( x, ض):

أين أهو المصطلح المجاني للمعادلة ؛ بو جهي معلمات المعادلة. لإيجاد معاملات المعادلة (10) (بطريقة المربعات الصغرى) ، يتم استخدام نظام المعادلات العادية التالي:

صفوف من الديناميكيات. محاذاة الصف.يشكل التغيير في العلامات بمرور الوقت ما يسمى ب السلاسل الزمنيةأو صفوف من الديناميات. السمة المميزة لهذه السلسلة هي أن عامل الوقت يعمل دائمًا هنا كمتغير مستقل X ، وعلامة التغيير هي المتغير التابع Y. اعتمادًا على سلسلة الانحدار ، تكون العلاقة بين المتغيرين X و Y من جانب واحد ، نظرًا لأن عامل الوقت لا يعتمد على تنوع الميزات. على الرغم من هذه الميزات ، يمكن تشبيه السلاسل الزمنية بسلسلة الانحدار ومعالجتها بنفس الطرق.

مثل سلسلة الانحدار ، تتأثر السلاسل الزمنية التجريبية ليس فقط بالعوامل الرئيسية ، ولكن أيضًا بالعديد من العوامل الثانوية (العشوائية) التي تحجب الاتجاه الرئيسي في تنوع السمات ، والتي تسمى في لغة الإحصاء اتجاه.

يبدأ تحليل السلاسل الزمنية بتحديد شكل الاتجاه. للقيام بذلك ، يتم تصوير السلسلة الزمنية كرسم بياني خطي في نظام إحداثيات مستطيل. في الوقت نفسه ، يتم رسم النقاط الزمنية (السنوات والشهور والوحدات الزمنية الأخرى) على طول محور الإحداثي ، ويتم رسم قيم المتغير التابع Y على طول المحور الإحداثي.هي معادلة الانحدار في شكل انحرافات شروط سلسلة المتغير التابع Y عن المتوسط ​​الحسابي لسلسلة المتغير المستقل X:

هنا ، هو معامل الانحدار الخطي.

الخصائص العددية لسلسلة الديناميات.تشمل الخصائص العددية الرئيسية المعممة لسلسلة الديناميكيات الوسط الهندسيووسط حسابي قريب منه. يميزون متوسط ​​المعدل الذي تتغير فيه قيمة المتغير التابع خلال فترات زمنية معينة:

تقدير تباين شروط سلسلة الديناميكيات هو الانحراف المعياري. عند اختيار معادلات الانحدار لوصف السلاسل الزمنية ، يتم أخذ شكل الاتجاه في الاعتبار ، والذي يمكن أن يكون خطيًا (أو مختزلًا إلى خطي) وغير خطي. عادة ما يتم الحكم على صحة اختيار معادلة الانحدار من خلال تشابه القيم الملاحظة والمحسوبة تجريبياً للمتغير التابع. الأكثر دقة في حل هذه المشكلة هي طريقة تحليل التباين بانحدار (الموضوع 12 ص 4).

ارتباط سلسلة الديناميات.غالبًا ما يكون من الضروري مقارنة ديناميكيات السلاسل الزمنية المتوازية التي ترتبط ببعضها البعض ببعض الشروط العامة ، على سبيل المثال ، لمعرفة العلاقة بين الإنتاج الزراعي ونمو الثروة الحيوانية خلال فترة زمنية معينة. في مثل هذه الحالات ، تتميز العلاقة بين المتغيرين X و Y بـ معامل الارتباط R xy (في وجود اتجاه خطي).

من المعروف أن اتجاه سلسلة الديناميكيات ، كقاعدة عامة ، تحجبه التقلبات في شروط سلسلة المتغير التابع Y. ومن ثم ، تنشأ مشكلة ذات شقين: قياس التبعية بين السلاسل المقارنة ، دون استبعاد الاتجاه ، وقياس الاعتماد بين الأعضاء المتجاورين من نفس السلسلة ، باستثناء الاتجاه. في الحالة الأولى ، يكون مؤشر تقارب العلاقة بين سلسلة الديناميكيات المقارنة معامل الارتباط(إذا كانت العلاقة خطية) ، في الثانية - معامل الارتباط الذاتي. هذه المؤشرات لها قيم مختلفة ، على الرغم من حسابها باستخدام نفس الصيغ (انظر الموضوع 11).

من السهل ملاحظة أن قيمة معامل الارتباط التلقائي تتأثر بتغير أعضاء سلسلة المتغير التابع: فكلما قل انحراف أعضاء السلسلة عن الاتجاه ، زاد معامل الارتباط التلقائي ، والعكس صحيح.

في حالة وجود ارتباط بين العامل والعلامات الناتجة ، يتعين على الأطباء في كثير من الأحيان تحديد المبلغ الذي يمكن أن تتغير به قيمة علامة واحدة عندما يتم تغيير أخرى بواسطة وحدة قياس مقبولة بشكل عام أو أنشأها الباحث نفسه.

على سبيل المثال ، كيف سيتغير وزن جسم تلاميذ الصف الأول (بنات أو بنين) إذا زاد طولهم بمقدار 1 سم ، ولهذا الغرض يتم استخدام طريقة تحليل الانحدار.

في أغلب الأحيان ، يتم استخدام طريقة تحليل الانحدار لتطوير المقاييس والمعايير المعيارية للتطور البدني.

  1. تعريف الانحدار. الانحدار هو وظيفة تسمح ، بناءً على متوسط ​​قيمة سمة واحدة ، بتحديد القيمة المتوسطة لسمة أخرى مرتبطة بالسمة الأولى.

    لهذا الغرض ، يتم استخدام معامل الانحدار وعدد من المعلمات الأخرى. على سبيل المثال ، يمكنك حساب عدد نزلات البرد في المتوسط ​​بقيم معينة لمتوسط ​​درجة حرارة الهواء الشهرية في فترة الخريف والشتاء.

  2. تعريف معامل الانحدار. معامل الانحدار هو القيمة المطلقة التي تتغير بها قيمة سمة واحدة في المتوسط ​​عندما تتغير سمة أخرى مرتبطة بها بواسطة وحدة القياس المحددة.
  3. صيغة معامل الانحدار. ص ص / س \ u003d ص س ص س (σ ص / σ س)
    حيث R y / x - معامل الانحدار ؛
    r xy - معامل الارتباط بين السمات x و y ؛
    (σ y و σ x) - الانحرافات المعيارية للميزات x و y.

    في مثالنا ؛
    σ x = 4.6 (الانحراف المعياري لدرجة حرارة الهواء في فترة الخريف والشتاء ؛
    σ ص = 8.65 (الانحراف المعياري لعدد نزلات البرد المعدية).
    وبالتالي ، R y / x هو معامل الانحدار.
    ص ص / س \ u003d -0.96 × (4.6 / 8.65) \ u003d 1.8 ، أي مع انخفاض متوسط ​​درجة حرارة الهواء الشهرية (x) بمقدار درجة واحدة ، سيتغير متوسط ​​عدد نزلات البرد المعدية (y) في فترة الخريف والشتاء بمقدار 1.8 حالة.

  4. معادلة الانحدار. ص \ u003d م ص + ص ص / س (س - م س)
    حيث y هي متوسط ​​قيمة السمة ، والتي يجب تحديدها عندما يتغير متوسط ​​قيمة سمة أخرى (x) ؛
    x - القيمة المتوسطة المعروفة لميزة أخرى ؛
    R y / x - معامل الانحدار ؛
    M x و M y - القيم المتوسطة المعروفة للميزات x و y.

    على سبيل المثال ، يمكن تحديد متوسط ​​عدد نزلات البرد المعدية (ص) بدون قياسات خاصة بأي قيمة متوسطة لمتوسط ​​درجة حرارة الهواء الشهرية (x). لذلك ، إذا كانت x \ u003d - 9 ° ، R y / x \ u003d 1.8 مرض ، M x \ u003d -7 ° ، M y \ u003d 20 مرضًا ، ثم y \ u003d 20 + 1.8 x (9-7) \ u003d 20 + 3 .6 = 23.6 مرض.
    يتم تطبيق هذه المعادلة في حالة وجود علاقة خط مستقيم بين ميزتين (x و y).

  5. الغرض من معادلة الانحدار. تُستخدم معادلة الانحدار لرسم خط الانحدار. يسمح الأخير ، بدون قياسات خاصة ، بتحديد أي قيمة متوسطة (ص) لسمة واحدة ، إذا تغيرت القيمة (س) لسمة أخرى. بناءً على هذه البيانات ، تم إنشاء رسم بياني - خط الانحدار، والتي يمكن استخدامها لتحديد متوسط ​​عدد نزلات البرد بأي قيمة لمتوسط ​​درجة الحرارة الشهرية ضمن النطاق بين القيم المحسوبة لعدد نزلات البرد.
  6. الانحدار سيجما (صيغة).
    حيث σ Ru / x - سيجما (الانحراف المعياري) للانحدار ؛
    σ y هو الانحراف المعياري للميزة y ؛
    r xy - معامل الارتباط بين السمات x و y.

    لذلك ، إذا كانت σ ص هي الانحراف المعياري لعدد نزلات البرد = 8.65 ؛ r xy - معامل الارتباط بين عدد نزلات البرد (y) ومتوسط ​​درجة حرارة الهواء الشهرية في فترة الخريف والشتاء (x) هو 0.96 ، إذن

  7. الغرض من انحدار سيجما. يعطي خاصية مقياس تنوع السمة الناتجة (y).

    على سبيل المثال ، يميز تنوع عدد نزلات البرد بقيمة معينة من متوسط ​​درجة حرارة الهواء الشهرية في فترة الخريف والشتاء. لذلك ، يمكن أن يتراوح متوسط ​​عدد نزلات البرد عند درجة حرارة الهواء × 1 \ u003d -6 ° من 15.78 مرضًا إلى 20.62 مرضًا.
    عند x 2 = -9 ° ، يمكن أن يتراوح متوسط ​​عدد نزلات البرد من 21.18 مرضًا إلى 26.02 مرضًا ، إلخ.

    يتم استخدام سيغما الانحدار في بناء مقياس الانحدار ، والذي يعكس انحراف قيم السمة الفعالة عن متوسط ​​قيمتها المرسومة على خط الانحدار.

  8. البيانات المطلوبة لحساب مقياس الانحدار ورسمه
    • معامل الانحدار - Ry / x ؛
    • معادلة الانحدار - y \ u003d M y + R y / x (x-M x) ؛
    • انحدار سيجما - σ Rx / y
  9. تسلسل الحسابات والتمثيل البياني لمقياس الانحدار.
    • تحديد معامل الانحدار بواسطة الصيغة (انظر الفقرة 3). على سبيل المثال ، يجب على المرء تحديد مقدار تغير وزن الجسم في المتوسط ​​(في عمر معين حسب الجنس) إذا تغير متوسط ​​الطول بمقدار 1 سم.
    • وفقًا لصيغة معادلة الانحدار (انظر الفقرة 4) ، حدد المتوسط ​​، على سبيل المثال ، وزن الجسم (ص ، ص 2 ، ص 3 ...) * لقيمة نمو معينة (س ، س 2 ، × 3 ...).
      ________________
      * يجب حساب قيمة "y" لثلاث قيم معروفة على الأقل لـ "x".

      في الوقت نفسه ، يُعرف متوسط ​​قيم وزن الجسم وطوله (M x و M y) لعمر وجنس معين

    • احسب سيجما للانحدار ، مع معرفة القيم المقابلة لـ y و r xy واستبدال قيمها في الصيغة (انظر الفقرة 6).
    • بناءً على القيم المعروفة x 1 و x 2 و x 3 والقيم المتوسطة المقابلة لها y 1 و y 2 y 3 وكذلك الأصغر (y - σ ru / x) والأكبر (y + σ ru / x) قيم (y) تنشئ مقياس انحدار.

      للحصول على تمثيل رسومي لمقياس الانحدار ، يتم تمييز القيم x ، x 2 ، x 3 (المحور y) أولاً على الرسم البياني ، أي يتم بناء خط الانحدار ، على سبيل المثال ، اعتماد وزن الجسم (ص) على الارتفاع (س).

      ثم ، عند النقاط المقابلة y 1 ، y 2 ، y 3 يتم وضع علامة على القيم الرقمية لانحدار سيجما ، أي أوجد على الرسم البياني أصغر وأكبر قيم y 1 و y 2 و y 3.

  10. الاستخدام العملي لمقياس الانحدار. يتم تطوير المقاييس والمقاييس المعيارية ، ولا سيما من أجل التطور البدني. وفقًا للمقياس القياسي ، من الممكن إعطاء تقييم فردي لتطور الأطفال. في الوقت نفسه ، يتم تقييم النمو البدني على أنه متناغم إذا ، على سبيل المثال ، عند ارتفاع معين ، يكون وزن جسم الطفل ضمن سيغما انحدار واحد إلى متوسط ​​الوحدة المحسوبة لوزن الجسم - (ص) لارتفاع معين (س) ( y ± 1 σ Ry / x).

    يعتبر التطور البدني غير منسجم من حيث وزن الجسم إذا كان وزن جسم الطفل لارتفاع معين ضمن سيغما الانحدار الثاني: (y ± 2 σ Ry / x)

    سيكون التطور البدني غير منسجم بشكل حاد بسبب وزن الجسم الزائد وغير الكافي إذا كان وزن الجسم لارتفاع معين ضمن سيجما الثالث للانحدار (y ± 3 σ Ry / x).

حسب نتائج دراسة احصائية عن النمو البدني للاولاد بعمر 5 سنوات فمن المعروف ان متوسط ​​طولهم (س) 109 سم ومتوسط ​​وزن جسمهم (ص) 19 كغم. معامل الارتباط بين الطول ووزن الجسم هو +0.9 ، وتظهر الانحرافات المعيارية في الجدول.

مطلوب:

  • حساب معامل الانحدار.
  • باستخدام معادلة الانحدار ، حدد وزن الجسم المتوقع للأولاد البالغين من العمر 5 سنوات بارتفاع يساوي x1 = 100 سم ، x2 = 110 سم ، x3 = 120 سم ؛
  • حساب سيغما الانحدار ، وبناء مقياس الانحدار ، وتقديم نتائج الحل بيانيا ؛
  • استخلص الاستنتاجات المناسبة.

يعرض الجدول الموجز حالة المشكلة ونتائج حلها.

الجدول 1

شروط المشكلة نتائج حل المشكلة
معادلة الانحدار انحدار سيجما مقياس الانحدار (وزن الجسم المتوقع (بالكيلو جرام))
م σ ص س ص ص ص / س X في σRx / y ص - σ Rу / х y + σ Rу / х
1 2 3 4 5 6 7 8 9 10
الارتفاع (x) 109 سم ± 4.4 سم +0,9 0,16 100 سم 17.56 كغم ± 0.35 كجم 17.21 كجم 17.91 كجم
وزن الجسم (ص) 19 كجم ± 0.8 كجم 110 سم 19.16 كجم 18.81 كجم 19.51 كجم
120 سم 20.76 كجم 20.41 كجم 21.11 كجم

المحلول.

استنتاج.وبالتالي ، فإن مقياس الانحدار ضمن القيم المحسوبة لوزن الجسم يسمح لك بتحديده لأي قيمة أخرى للنمو أو لتقييم التطور الفردي للطفل. للقيام بذلك ، قم باستعادة الخط العمودي على خط الانحدار.

  1. فلاسوف ف. علم الأوبئة. - م: GEOTAR-MED، 2004. - 464 ص.
  2. ليسيتسين يو. الصحة العامة والرعاية الصحية. كتاب مدرسي للمدارس الثانوية. - م: GEOTAR-MED، 2007. - 512 ص.
  3. Medik V.A.، Yuriev V.K. دورة محاضرات عن الصحة العامة والرعاية الصحية: الجزء الأول. الصحة العامة. - م: الطب 2003. - 368 ص.
  4. Minyaev V.A. ، Vishnyakov N.I. منظمة الطب الاجتماعي والرعاية الصحية (الدليل في مجلدين). - سان بطرسبرج ، 1998. -528 ص.
  5. Kucherenko V.Z. ، Agarkov N.M. وغيرها النظافة الاجتماعية وتنظيم الرعاية الصحية (دروس) - موسكو ، 2000. - 432 ص.
  6. S. غلانتز. الإحصاء الطبي البيولوجي. لكل من الإنجليزية. - م ، ممارسة ، 1998. - 459 ص.

في النمذجة الإحصائية ، تحليل الانحدار هو دراسة تستخدم لتقييم العلاقة بين المتغيرات. تتضمن هذه الطريقة الرياضية العديد من الطرق الأخرى لنمذجة وتحليل المتغيرات المتعددة عندما يكون التركيز على العلاقة بين متغير تابع ومتغير واحد أو أكثر من المتغيرات المستقلة. وبشكل أكثر تحديدًا ، يساعدك تحليل الانحدار على فهم كيفية تغير القيمة النموذجية للمتغير التابع إذا تغير أحد المتغيرات المستقلة بينما تظل المتغيرات المستقلة الأخرى ثابتة.

في جميع الحالات ، فإن الدرجة المستهدفة هي دالة للمتغيرات المستقلة وتسمى وظيفة الانحدار. في تحليل الانحدار ، من المهم أيضًا وصف التغيير في المتغير التابع كدالة للانحدار ، والتي يمكن وصفها باستخدام توزيع الاحتمالية.

مهام تحليل الانحدار

تُستخدم طريقة البحث الإحصائي هذه على نطاق واسع للتنبؤ ، حيث يكون لاستخدامها ميزة كبيرة ، ولكن في بعض الأحيان يمكن أن تؤدي إلى وهم أو علاقات خاطئة ، لذلك يوصى باستخدامها بعناية في هذا السؤال ، حيث لا يعني الارتباط ، على سبيل المثال ، التسبب بالشىء.

تم تطوير عدد كبير من الطرق لإجراء تحليل الانحدار ، مثل انحدار المربعات الصغرى الخطي والعادي ، والتي تعتبر معلمية. جوهرها هو أن وظيفة الانحدار يتم تعريفها من حيث عدد محدود من المعلمات غير المعروفة التي يتم تقديرها من البيانات. يسمح الانحدار اللامعلمي لوظيفته بأن تكمن في مجموعة معينة من الوظائف ، والتي يمكن أن تكون ذات أبعاد لا نهائية.

كطريقة بحث إحصائية ، يعتمد تحليل الانحدار في الممارسة العملية على شكل عملية توليد البيانات ومدى ارتباطها بنهج الانحدار. نظرًا لأن الشكل الحقيقي لتوليد عملية البيانات عادةً ما يكون رقمًا غير معروف ، فإن تحليل انحدار البيانات غالبًا ما يعتمد إلى حد ما على افتراضات حول العملية. هذه الافتراضات قابلة للاختبار في بعض الأحيان إذا كان هناك ما يكفي من البيانات المتاحة. غالبًا ما تكون نماذج الانحدار مفيدة حتى عندما يتم انتهاك الافتراضات بشكل معتدل ، على الرغم من أنها قد لا تؤدي أفضل أداء لها.

بمعنى أضيق ، يمكن أن يشير الانحدار على وجه التحديد إلى تقدير متغيرات الاستجابة المستمرة ، على عكس متغيرات الاستجابة المنفصلة المستخدمة في التصنيف. تسمى حالة متغير الإخراج المستمر أيضًا الانحدار المتري لتمييزه عن المشكلات ذات الصلة.

قصة

أقدم شكل من أشكال الانحدار هو الطريقة المعروفة للمربعات الصغرى. تم نشره بواسطة Legendre في 1805 و Gauss في 1809. طبق Legendre و Gauss الطريقة على مشكلة تحديد مدارات الأجسام حول الشمس من الملاحظات الفلكية (المذنبات بشكل أساسي ، ولكن أيضًا الكواكب الصغيرة المكتشفة حديثًا). نشر جاوس تطورًا إضافيًا لنظرية المربعات الصغرى في عام 1821 ، بما في ذلك متغير من نظرية جاوس ماركوف.

مصطلح "الانحدار" ابتكره فرانسيس جالتون في القرن التاسع عشر لوصف ظاهرة بيولوجية. كان المحصلة النهائية أن نمو الأحفاد من نمو الأجداد ، كقاعدة عامة ، يتراجع إلى المتوسط ​​الطبيعي. بالنسبة لجالتون ، كان للانحدار هذا المعنى البيولوجي فقط ، ولكن لاحقًا تم تناول عمله من قبل أودي يولي وكارل بيرسون ونقله إلى سياق إحصائي أكثر عمومية. في عمل Yule و Pearson ، يعتبر التوزيع المشترك للاستجابة والمتغيرات التفسيرية غاوسيًا. رفض فيشر هذا الافتراض في أوراق عامي 1922 و 1925. اقترح فيشر أن التوزيع الشرطي لمتغير الاستجابة هو غاوسي ، لكن التوزيع المشترك لا يلزم أن يكون كذلك. في هذا الصدد ، فإن اقتراح فيشر أقرب إلى صياغة غاوس لعام 1821. قبل عام 1970 ، كان الأمر يستغرق أحيانًا ما يصل إلى 24 ساعة للحصول على نتيجة تحليل الانحدار.

لا تزال طرق تحليل الانحدار مجالًا للبحث النشط. في العقود الأخيرة ، تم تطوير طرق جديدة لانحدار قوي. الانحدارات التي تنطوي على استجابات مترابطة ؛ طرق الانحدار التي تستوعب أنواعًا مختلفة من البيانات المفقودة ؛ انحدار غير معلمي طرق الانحدار البايزي الانحدارات التي يتم فيها قياس متغيرات التوقع بالخطأ ؛ الانحدار مع تنبؤات أكثر من الملاحظات ؛ والاستنتاجات السببية مع الانحدار.

نماذج الانحدار

تتضمن نماذج تحليل الانحدار المتغيرات التالية:

  • معلمات غير معروفة ، يُشار إليها باسم بيتا ، والتي يمكن أن تكون عدديًا أو متجهًا.
  • المتغيرات المستقلة ، X.
  • المتغيرات التابعة ، Y.

في مختلف مجالات العلوم حيث يتم تطبيق تحليل الانحدار ، يتم استخدام مصطلحات مختلفة بدلاً من المتغيرات التابعة والمستقلة ، ولكن في جميع الحالات ، يرتبط نموذج الانحدار Y بدالة X و.

عادة ما تتم صياغة التقريب كـ E (Y | X) = F (X، β). لإجراء تحليل الانحدار ، يجب تحديد شكل الوظيفة f. نادرًا ما يعتمد على المعرفة حول العلاقة بين Y و X التي لا تعتمد على البيانات. في حالة عدم توفر هذه المعرفة ، يتم اختيار نموذج F مرن أو مناسب.

المتغير المعتمد Y

لنفترض الآن أن متجه المعلمات غير المعروفة β له طول ك. لإجراء تحليل الانحدار ، يجب على المستخدم تقديم معلومات حول المتغير التابع Y:

  • إذا لوحظت N نقاط بيانات من النموذج (Y ، X) ، حيث N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • إذا تمت ملاحظة N = K بالضبط ، وكانت الوظيفة F خطية ، فيمكن حل المعادلة Y = F (X ، β) تمامًا ، وليس تقريبًا. يتلخص هذا في حل مجموعة من معادلات N مع N-unknowns (عناصر β) التي لها حل فريد طالما أن X مستقلة خطيًا. إذا كانت F غير خطية ، فقد لا يوجد حل ، أو قد يكون هناك العديد من الحلول.
  • الموقف الأكثر شيوعًا هو حيث توجد N> نقاط للبيانات. في هذه الحالة ، توجد معلومات كافية في البيانات لتقدير القيمة الفريدة لـ التي تناسب البيانات بشكل أفضل ، ويمكن اعتبار نموذج الانحدار عند تطبيقه على البيانات كنظام تم تجاوزه في β.

في الحالة الأخيرة ، يوفر تحليل الانحدار أدوات من أجل:

  • إيجاد حل للمعلمات غير المعروفة β ، والتي ستقلل ، على سبيل المثال ، المسافة بين القيمة المقاسة والمتوقعة لـ Y.
  • في ظل افتراضات إحصائية معينة ، يستخدم تحليل الانحدار المعلومات الزائدة لتوفير معلومات إحصائية حول المعلمات غير المعروفة β والقيم المتوقعة للمتغير التابع Y.

العدد المطلوب من القياسات المستقلة

ضع في اعتبارك نموذج الانحدار الذي يحتوي على ثلاث معاملات غير معروفة: β 0 و β 1 و β 2. لنفترض أن المجرب قام بإجراء 10 قياسات بنفس قيمة المتغير المستقل للمتجه X. في هذه الحالة ، لا يعطي تحليل الانحدار مجموعة فريدة من القيم. أفضل ما يمكنك فعله هو تقدير المتوسط ​​والانحراف المعياري للمتغير التابع Y. وبالمثل ، من خلال قياس قيمتين مختلفتين لـ X ، يمكنك الحصول على بيانات كافية لانحدار مع مجهولين ، ولكن ليس لثلاثة مجاهيل أو أكثر.

إذا تم أخذ قياسات المجرب بثلاث قيم مختلفة لمتغير المتجه المستقل X ، فإن تحليل الانحدار سيوفر مجموعة فريدة من التقديرات للمعلمات الثلاثة غير المعروفة في β.

في حالة الانحدار الخطي العام ، تكون العبارة أعلاه مكافئة لمتطلبات المصفوفة X T X قابلة للعكس.

الافتراضات الإحصائية

عندما يكون عدد القياسات N أكبر من عدد المعلمات غير المعروفة k وأخطاء القياس ε i ، عندئذٍ ، كقاعدة عامة ، يتم توزيع المعلومات الزائدة الواردة في القياسات واستخدامها للتنبؤات الإحصائية المتعلقة بالمعلمات غير المعروفة. يسمى هذا الفائض من المعلومات بدرجة حرية الانحدار.

الافتراضات المتضمنة

تشمل الافتراضات الكلاسيكية لتحليل الانحدار ما يلي:

  • أخذ العينات هو ممثل لتوقع الاستدلال.
  • الخطأ متغير عشوائي بمتوسط ​​قيمة صفر ، وهو مشروط بالمتغيرات التوضيحية.
  • يتم قياس المتغيرات المستقلة دون أخطاء.
  • كمتغيرات مستقلة (تنبؤات) ، فهي مستقلة خطيًا ، أي أنه لا يمكن التعبير عن أي متنبئ كمجموعة خطية من المتغيرات الأخرى.
  • الأخطاء غير مرتبطة ، أي مصفوفة تغاير الخطأ للأقطار وكل عنصر غير صفري هو تباين الخطأ.
  • تباين الخطأ ثابت عبر الملاحظات (المثلية الجنسية). إذا لم يكن الأمر كذلك ، فيمكن استخدام المربعات الصغرى الموزونة أو طرق أخرى.

هذه الشروط الكافية لتقدير المربعات الصغرى لها الخصائص المطلوبة ، ولا سيما هذه الافتراضات تعني أن تقديرات المعلمات ستكون موضوعية ومتسقة وفعالة ، لا سيما عند أخذها في الاعتبار في فئة التقديرات الخطية. من المهم ملاحظة أن البيانات الفعلية نادراً ما تفي بالشروط. بمعنى ، يتم استخدام الطريقة حتى لو كانت الافتراضات غير صحيحة. يمكن أحيانًا استخدام الاختلاف عن الافتراضات كمقياس لمدى فائدة النموذج. يمكن تخفيف العديد من هذه الافتراضات بطرق أكثر تقدمًا. تتضمن تقارير التحليل الإحصائي عادةً تحليل الاختبارات مقابل بيانات العينة والمنهجية لفائدة النموذج.

بالإضافة إلى ذلك ، تشير المتغيرات في بعض الحالات إلى القيم المقاسة في مواقع النقطة. قد تكون هناك اتجاهات مكانية وارتباطات مكانية ذاتية في المتغيرات التي تنتهك الافتراضات الإحصائية. الانحدار الجغرافي الموزون هو الطريقة الوحيدة التي تتعامل مع مثل هذه البيانات.

في الانحدار الخطي ، الميزة هي أن المتغير التابع ، وهو Y i ، هو مزيج خطي من المعلمات. على سبيل المثال ، في الانحدار الخطي البسيط ، تستخدم نمذجة النقطة n متغيرًا مستقلاً واحدًا ، x i ، ومعلمتين ، β 0 و 1.

في الانحدار الخطي المتعدد ، هناك العديد من المتغيرات المستقلة أو وظائفها.

عند أخذ عينات عشوائية من السكان ، فإن معلماتها تجعل من الممكن الحصول على عينة من نموذج الانحدار الخطي.

في هذا الجانب ، تعتبر طريقة المربعات الصغرى هي الأكثر شيوعًا. يوفر تقديرات المعلمات التي تقلل من مجموع مربعات القيم المتبقية. هذا النوع من التصغير (وهو نموذجي للانحدار الخطي) لهذه الوظيفة يؤدي إلى مجموعة من المعادلات العادية ومجموعة من المعادلات الخطية مع المعلمات ، والتي يتم حلها للحصول على تقديرات المعلمات.

بافتراض أن الخطأ السكاني ينتشر بشكل عام ، يمكن للباحث استخدام هذه التقديرات للأخطاء المعيارية لإنشاء فترات ثقة وإجراء اختبار الفرضيات حول معلماتها.

تحليل الانحدار غير الخطي

مثال عندما تكون الوظيفة غير خطية فيما يتعلق بالمعلمات يشير إلى أنه يجب تصغير مجموع المربعات بإجراء تكراري. يقدم هذا العديد من التعقيدات التي تحدد الاختلافات بين طرق المربعات الصغرى الخطية وغير الخطية. وبالتالي ، فإن نتائج تحليل الانحدار عند استخدام طريقة غير خطية تكون أحيانًا غير متوقعة.

حساب القوة وحجم العينة

هنا ، كقاعدة عامة ، لا توجد طرق متسقة فيما يتعلق بعدد الملاحظات مقارنة بعدد المتغيرات المستقلة في النموذج. تم اقتراح القاعدة الأولى من قبل Dobra و Hardin وتبدو مثل N = t ^ n ، حيث N هو حجم العينة ، و n هو عدد المتغيرات التوضيحية ، و t هو عدد الملاحظات اللازمة لتحقيق الدقة المطلوبة إذا كان النموذج يحتوي متغير توضيحي واحد فقط. على سبيل المثال ، يقوم الباحث ببناء نموذج انحدار خطي باستخدام مجموعة بيانات تحتوي على 1000 مريض (N). إذا قرر الباحث أن هناك حاجة إلى خمس ملاحظات لتحديد الخط بدقة (م) ، فإن الحد الأقصى لعدد المتغيرات التوضيحية التي يمكن أن يدعمها النموذج هو 4.

أساليب أخرى

على الرغم من أن معلمات نموذج الانحدار يتم تقديرها عادةً باستخدام طريقة المربعات الصغرى ، إلا أن هناك طرقًا أخرى يتم استخدامها بشكل أقل. على سبيل المثال ، هذه هي الطرق التالية:

  • طرق بايزي (على سبيل المثال ، طريقة بايز للانحدار الخطي).
  • نسبة انحدار تستخدم للحالات التي يعتبر فيها تقليل نسبة الأخطاء أكثر ملاءمة.
  • أصغر الانحرافات المطلقة ، والتي تكون أكثر قوة في وجود القيم المتطرفة التي تؤدي إلى الانحدار الكمي.
  • يتطلب الانحدار اللامعلمي عددًا كبيرًا من الملاحظات والحسابات.
  • مسافة مقياس التعلم التي يتم تعلمها بحثًا عن مقياس مسافة ذي معنى في مساحة الإدخال المحددة.

برمجة

يتم تنفيذ جميع حزم البرامج الإحصائية الرئيسية باستخدام تحليل انحدار المربعات الصغرى. يمكن استخدام الانحدار الخطي البسيط وتحليل الانحدار المتعدد في بعض تطبيقات جداول البيانات بالإضافة إلى بعض الآلات الحاسبة. في حين أن العديد من حزم البرامج الإحصائية يمكن أن تؤدي أنواعًا مختلفة من الانحدار اللامعلمي والقوي ، فإن هذه الأساليب أقل توحيدًا ؛ تستخدم حزم البرامج المختلفة طرقًا مختلفة. تم تطوير برامج الانحدار المتخصصة لاستخدامها في مجالات مثل تحليل المسح وتصوير الأعصاب.