السير الذاتية صفات التحليلات

تعريف الانحدار المتعدد. نموذج مواصفات


محاضرة 3 الانحدار المتعدد

    شروط تطبيق الطريقة وقيودها

يمكن أن يعطي انحدار الزوج نتيجة جيدة في النمذجة إذا كان من الممكن إهمال تأثير العوامل الأخرى التي تؤثر على موضوع الدراسة. لا يمكن التحكم في سلوك المتغيرات الاقتصادية الفردية ؛ ليس من الممكن ضمان المساواة بين جميع الشروط الأخرى لتقييم تأثير عامل واحد قيد الدراسة. في هذه الحالة ، يجب أن يحاول المرء تحديد تأثير العوامل الأخرى من خلال إدخالها في النموذج ، أي بناء معادلة انحدار متعددة:

الهدف الرئيسي من الانحدار المتعدد هو بناء نموذج مع عدد كبير من العوامل ، مع تحديد تأثير كل منها على حدة ، وكذلك تأثيرها التراكمي على المؤشر النموذجي. تتضمن مواصفات النموذج مجالين من الأسئلة: اختيار العوامل واختيار نوع معادلة الانحدار.

متطلبات العامل:

    يجب أن تكون قابلة للقياس الكمي. إذا لزم الأمر ، قم بتضمين النموذج عنصر الجودة، التي لا تحتوي على قياس كمي ، يجب إعطاؤها اليقين الكمي (على سبيل المثال ، في نموذج الغلة ، يتم إعطاء جودة التربة في شكل نقاط).

    لا ينبغي أن يكونوا مترابطين ، بل يجب أن يكونوا في علاقة وظيفية دقيقة. التضمين في نموذج العوامل ذات الترابط العالي عندما

للإدمان

يمكن أن يؤدي إلى عواقب غير مرغوب فيها ، يؤدي إلى عدم استقرار وعدم موثوقية تقديرات معاملات الانحدار. إذا كان هناك ارتباط كبير بين العوامل ، فمن المستحيل تحديد تأثيرها المعزول على مؤشر الأداء ، لذلك يتبين أن معلمات معادلة الانحدار غير مفسرة.

    متعدد الخطية

إن شرطًا محددًا للأنظمة متعددة العوامل هو عدم مقبولية الارتباط الوثيق جدًا بين خصائص العامل. غالبًا ما يشار إلى هذه الحالة باسم مشكلة العلاقة الخطية المتداخلة. العلاقة الخطية المتداخلة تعني ارتباط خطي غير عشوائي وثيق إلى حد ما لبعض العوامل مع عوامل أخرى. يوصى غالبًا باستبعاد عامل مرتبط بعامل آخر في. من الاثنين عن كثب صديق مقيدمع عوامل أخرى ، فمن المنطقي استبعاد العامل الأضعف المرتبط بالميزة الفعالة.

مطلوب أسلوب أكثر تعقيدًا لإيجاد واستبعاد عامل ليس له علاقة وثيقة مع أي عامل فردي ، ولكن له علاقة وثيقة متعددة العوامل مع مجموعة معقدة من العوامل الأخرى. يسمى هذا الموقف الخطية المتعددة. لقياسه ، يجب على المرء أن يحسب بالتتابع معاملات الارتباط المتعدد (أو تحديد) لكل عامل (في دور النتيجة) مع جميع العوامل الأخرى (في دور المتغيرات التفسيرية). بعد اكتشاف عامل متعدد الخطوط أو العديد منها ، ينبغي للمرء أن يفكر في إمكانية استبعاد الأكثر اعتمادًا على مجموعة العوامل المتبقية ، إذا لم يؤد ذلك إلى فقدان المعنى الاقتصادي للنموذج.

العلاقة الخطية المتداخلة ومتعددة الخطية للعوامل في الأنظمة الاقتصادية لا تنشأ بالصدفة. في مجموعة من المؤسسات أو المناطق المتجانسة ، كقاعدة عامة ، بسبب قوانين الاقتصاد ، ينشأ اختلاف موازٍ لخصائص العوامل: تلك المؤسسات التي لديها أفضل القيم لبعض العوامل ، على سبيل المثال ، الأفضل الظروف الطبيعية، في نفس الوقت لديها نسبة رأس مال أعلى ونسبة قوة إلى وزن أعلى ، ومؤهلات أعلى للموظفين ، وتكنولوجيا أفضل ، وما إلى ذلك. ومن ثم فإن العلاقة الخطية المتداخلة الحتمية الأكبر أو الأقل لجميع عوامل الإنتاج أو الظروف الاجتماعية والاقتصادية للحياة.

يؤدي وجود العلاقة الخطية المتداخلة في النظام إلى تفاقم الصفات الرياضية للنموذج ، ويمكن أن يؤدي إلى عدم استقرار المعلمات الناتجة ، والتي تتغير بشكل كبير مع تغيير بسيط في قيم العوامل.

تتمثل إحدى المشكلات المحددة للتحليل متعدد المتغيرات في مسألة إمكانية استبدال عامل لا توجد معلومات عنه بعامل آخر وعواقب هذا الاستبدال.

يجب عليك ، إن أمكن ، العثور على متغير آخر معروف قيمه ويكون في نطاق كافٍ اغلق الاتصالمع العامل المفقود. على سبيل المثال ، إذا لم تكن هناك بيانات للمنطقة حول متوسط ​​الأجور ، فيمكن استبدالها بقيمة الناتج المحلي الإجمالي للفرد ، مع الأخذ في الاعتبار أنه يجب أن تكون هناك علاقة وثيقة (وإن لم تكن معروفة تمامًا) بين هذه العلاقات الاقتصادية. المؤشرات.

من المهم النظر في الغرض الذي يتم بناء النموذج من أجله. إذا كان الهدف هو توقع ميزة فعالة فقط ، فإن استبدال العامل بمتغير آخر ، إذا كان وثيق الصلة بالعامل المستبدل ، لن يؤدي إلى أخطاء كبيرة. ولكن إذا كان الهدف من النموذج هو اتخاذ قرارات بشأن سياسته الاقتصادية من قبل المدير ، فإن استبدال العامل الخاضع للرقابة بعامل بديل وثيق الصلة ، ولكن غير مُدار ، يحرم النموذج من المعنى ، على الرغم من التحديد العالي.

    تحديد نوع النموذج متعدد العوامل وميزات العامل

علاقة السمة الفعالة ذ مع العوامل x 1 , x 2 , …, x ك يتم التعبير عنها بالمعادلة:

(22)

أين أهو المصطلح المجاني للمعادلة ؛

ك- عدد العوامل ؛

ي- رقم العامل ؛

أناهو عدد الوحدات السكانية ؛

ب يهو معامل الانحدار النقي المشروط مع العامل x ي، والتي تقيس التغيير في النتيجة عندما يتغير العامل حسب وحدته ، ومع ثبات العوامل الأخرى المدرجة في النموذج ؛

ε أنا- الاختلاف عشوائية ذ أنا، لا يشرحها النموذج.

النموذج بالشكل (22) مضاف. هذا يعني أن النموذج يعتمد على الفرضية القائلة بأن كل عامل يضيف أو يطرح شيئًا من قيمة السمة الناتجة. تعكس هذه الفرضية حول نوع الارتباط بين الأسباب والتأثيرات بشكل كامل عددًا من الأنظمة الاقتصادية ذات السمات المترابطة. على سبيل المثال ، إذا ذهو غلة المحصول ، و x 1 , x 2 , …, x ك- العوامل الزراعية التقنية: جرعات من أنواع مختلفة من الأسمدة ، وعدد الحشائش ، والري ، ونسبة الفاقد أثناء الحصاد ، ثم في الواقع ، كل من هذه العوامل إما يزيد أو يقلل من المحصول ، ويمكن أن توجد النتيجة بدون أي من هذه العوامل.

ومع ذلك ، فإن النموذج الإضافي غير مناسب لجميع العلاقات في الاقتصاد. إذا تمت دراسة هذه العلاقة على أنها تبعية لحجم إنتاج المؤسسة ذمن المنطقة المحتلة x 1 ، عدد الموظفين x 2 ، تكلفة الأصول الثابتة x 3 (أو رأس المال الإجمالي) ، فإن كل عامل من العوامل ضروري لوجود النتيجة ، وليس إضافة إليها. في مثل هذه الحالات ، يجب على المرء أن ينطلق من فرضية الشكل المضاعف للنموذج:

(23)

مثل هذا النموذج ، وفقًا لمنشئيه الأوائل ، كان يسمى "نموذج كوب دوغلاس".

من الممكن أيضًا وجود شكل مختلط من النموذج ، حيث ستدخل بعض العوامل بشكل إضافي ، بينما تدخل عوامل أخرى بشكل مضاعف.

عند اختيار خصائص العامل ، ينبغي للمرء أن ينطلق من الأحكام التالية.

    يجب أن تكون العوامل هي الأسباب ، ويجب أن تكون العلامة الناتجة هي عواقبها. من غير المقبول أن يُدرج في عدد العوامل ميزة تشغل مكانًا في الاقتصاد الحقيقي في "ناتج" النظام ، أي يعتمد على النموذج. على سبيل المثال ، يتم بناء نموذج لتكلفة المائة من الحبوب. العوامل المأخوذة هي محصول محاصيل الحبوب وكثافة اليد العاملة في المائة ، لكن معامل التحديد صغير ، والنموذج ضعيف. من أجل "تحسينه" ، تمت إضافة ربحية إنتاج الحبوب إلى عدد من العوامل. قفز معامل التحديد على الفور إلى 0.88. لكن النموذج لم يصبح أفضل ، فقد أصبح بلا معنى ، لأن الربحية تعتمد على سعر التكلفة ، وليس العكس.

    لا ينبغي أن تكون علامات العوامل من مكونات العلامة الناتجة. في نفس نموذج التكلفة ، لا يمكن تقديم الأجور في المائة من الحبوب ، وتكلفة نقل نسبة مئوية من الحبوب ، وما إلى ذلك ، كعوامل. اتصال الكل مع الأجزاء الهيكليةلا ينبغي تحليلها باستخدام تحليل الارتباط، ولكن بمساعدة أنظمة الفهرسة.

    يجب تجنب ازدواجية العوامل. يجب تمثيل كل عامل حقيقي بمؤشر واحد. على سبيل المثال ، يمكن تمثيل عامل العمل في نموذج حجم الإنتاج إما بمتوسط ​​عدد الموظفين ، أو بتكلفة أيام العمل (ساعات العمل) للإنتاج ، ولكن ليس بكلا المؤشرين. يؤدي ازدواجية العوامل إلى التجزئة تأثير العامل، وقد يكون غير موثوق بسبب هذا التجزئة.

    يجب تجنب العوامل التي ترتبط ارتباطًا وثيقًا بالآخرين كلما أمكن ذلك.

    يجب تضمين عوامل مستوى واحد من التسلسل الهرمي ؛ لا ينبغي تضمين عوامل المستوى الأعلى وعواملها الفرعية. على سبيل المثال ، في نموذج تكلفة الحبوب ، نقوم بتضمين المحصول وكثافة العمالة ، لكننا لا نضيف درجة الخصوبة ، وجرعة الأسمدة ، وإمدادات الطاقة للعمال ، أي العوامل الفرعية - الأسباب التي تؤثر على المحصول وكثافة العمالة. يعتبر إدراج العوامل الفرعية أيضًا تكرارًا لعامل.

    هناك منطق في مثل هذا البناء للنموذج ، حيث يتم تخصيص جميع العلامات لنفس الوحدة من السكان ، كل من الإشارة الفعالة والعوامل. على سبيل المثال ، إذا تم تصميم حجم إنتاج مؤسسة ما ، فيجب أن تشير العوامل أيضًا إلى المؤسسة: عدد الموظفين ، ومساحة الأرض ، والأصول الثابتة ، وما إلى ذلك. إذا تم بناء نموذج أجورالموظف ، يجب أن تنطبق العوامل أيضًا على الموظف: طول خدمته ، وعمره ، وتعليمه ، وفئة مقياس التعريفة (المقياس) ، وإمدادات الطاقة ، وما إلى ذلك.

    مبدأ بساطة النموذج ينطبق. إذا كان من الممكن بناء نموذج جيدمع خمسة عوامل ، لا يجب أن تطاردها النموذج المثاليمع عشرة عوامل ، عادة ما تؤدي العوامل الإضافية إلى تفاقم النموذج.

    بطاقات الارتباطات والانحدار متعدد المتغيرات

دعونا ننظر في نظام المؤشرات هذا على مثال العلاقة بين إنتاجية محاصيل الحبوب في 51 شركة زراعية في منطقة أوريول. في البداية ، تم اختيار 8 سمات عامل يمكن أن تؤثر على تباين العائد:

x 1 - حجم المنطقة المزروعة من الحبوب ، هكتار ؛

x 2 جاذبية معينةالحبوب في المساحة الإجمالية ،٪ ؛

x 3 - تكلفة هكتار واحد من محاصيل الحبوب ألف روبل / هكتار ؛

x 4 - تكاليف العمالة لكل هكتار واحد ، ساعة عمل ؛.

x 5 - مستوى الأجر ، فرك / شخص- ساعة ؛

x 6 - إمدادات الطاقة ، حصان / 100 هكتار من الأراضي الصالحة للزراعة ؛

x 7 - عدد الحصادات لكل 1000 هكتار من الحبوب ، قطعة ؛

x 8 - عدد سائقي الجرارات لكل 100 هكتار من الأراضي الصالحة للزراعة ، الناس.

معادلة الانحدار الأصلية هي:

ومع ذلك ، فقط المعاملات عند x 3 (ر- المعيار يساوي 10.5) ومتى x 8 (ر- المعيار يساوي 2.72). موثوقية أكبر من العوامل الأخرى و x 5 .

بعد تصفية العوامل غير الموثوقة ، أي إزالتها من المعادلة ، معادلة الانحدار النهائية هي:

وهكذا ، فإن الاختلاف في الغلات في بيانات 51 شركة زراعية تأثر بقوة وبشكل موثوق بالاختلافات بين الشركات في التكاليف لكل هكتار واحد ، في مستوى الأجور وفي توافر العمال المهرة.

يتم تفسير كل من المعاملات ، التي تسمى معاملات الانحدار الخالص ، على أنها مقدار التغيير في العائد ، بشرط أن يتم تغيير هذا العامل بوحدة القياس المقبولة ، ويظل العاملان الآخران ثابتان عند المستويات المتوسطة. فمثلا، ب 3 يعني أنه مع زيادة التكاليف لكل هكتار واحد من محاصيل الحبوب وبنفس الأجور وتوافر سائقي الجرارات ، زاد متوسط ​​العائد بمعدل 4.6 سنت لكل هكتار. مصطلح "الانحدار النقي المشروط" يعني أن تأثير عامل واحد قد تم مسحه من التباين المصاحب فقط لتلك العوامل التي تدخل المعادلة ، ولكن لم يتم مسحها من الاختلاف المصاحب المحتمل للعوامل الأخرى.

تعتمد قيمة معاملات الانحدار الصافي المشروط على وحدات القياس المقبولة. إذا كان العامل x 3 تم قياسه ليس بآلاف الروبلات للهكتار ، ولكن بالروبل للهكتار ، ثم المعامل ب 3 سيساوي 0.00461 روبل / هكتار. لذلك ، من المستحيل مقارنة معاملات الانحدار الشرطي النقي فيما بينها. من أجل الحصول على معاملات قابلة للمقارنة لتأثير تباين العوامل على تباين النتيجة ، يجب على المرء التخلص من وحدات القياس ، وإحضارها إلى وحدة تقليدية واحدة. يمكن تطبيق طريقتين لهذا.

الطريقة الأولى تسمى التقييس. نشأ هذا المصطلح من الاسم الانجليزيالانحراف المعياري. يتم التعبير عن معاملات الانحدار المعيارية في كسور أو قيم ، إذا كانت تتجاوز واحدًا - من حيث σ ذ. يُشار إلى المعاملات المعيارية بالحرف اليوناني β وتسمى معاملات بيتا. صيغتهم هي:

في مثالنا ، نحصل على:

β 3 = 0,772;

β 5 = 0,147;

β 8 = 0,223.

يكون تفسير معاملات بيتا كما يلي: عندما يتغير العامل x 3 بالنسبة لأحد انحرافاتها المعيارية عن متوسط ​​القيمة ومع ثبات العوامل الأخرى ، فإن السمة الفعالة (العائد) ستنحرف عن مستوى متوسطها بمقدار 0.772 من انحرافها المعياري. نظرًا لأنه يتم التعبير عن جميع المعاملات الموحدة في نفس الوحدات ، في σ ذ , إنها قابلة للمقارنة مع بعضها البعض ، ويمكن أن نستنتج أن التباين في الغلات قد تأثر بشدة في مجموعة المؤسسات المدروسة من خلال التباين في التكاليف لكل هكتار من البذر.

هناك طريقة أخرى لإحضار معاملات الانحدار إلى شكل مماثل وهي تحويلها إلى معاملات مرونة. صيغة معامل المرونة ℓ ي :

(25)

يتم تفسير معامل المرونة على النحو التالي: عندما يتغير العامل x يعليه متوسط ​​القيمةومع ثبات العوامل الأخرى المضمنة في المعادلة ، ستتغير الميزة الناتجة في المتوسط ​​بمقدار ℓ يأجزاء من وسطه (أو ℓ ي متوسط ​​إذا ي> 1 ، وهو ما يحدث في كثير من الأحيان). غالبًا ما يُقال ، "سيتغير إلى ℓ يفي المئة لكل 1٪ تغيير في العامل.

في مثالنا لدينا:

تكون معاملات المرونة واضحة مثل β ي، في نفس الوحدات وقابلة للمقارنة مع بعضها البعض. إنها أكثر ملاءمة من معاملات لاستخدامها في التخطيط والتنبؤ. من غير المحتمل أن يخطط المدير لزيادة عامل الاستثمار ، على سبيل المثال ، بمقدار 0.6 سيجما. عادة ما يخططون لتغيير العوامل ، إذا كان من الممكن إدارتها ، بنسبة كبيرة جدًا من المستوى الذي تم تحقيقه. على سبيل المثال ، إذا كنا نخطط لزيادة تكلفة الهكتار الواحد لمحاصيل الحبوب بنسبة 10٪ ، والأجور بنسبة 30٪ ، وتوافر سائقي الجرارات المؤهلين بنسبة 20٪ ، فيمكننا توقع حدوث تغيير في المحصول بمقدار
، أين ك ي- معدلات النمو المخطط لها للعوامل.

فكر الآن في نظام مؤشرات ضيق العلاقات متعددة العوامل. بادئ ذي بدء ، يتم إنشاء مصفوفة من معاملات الارتباط المزدوجة (الجدول 1).

الجدول 1. مصفوفة معاملات الارتباط المزدوجة

علامات

x 3

x 5

x 8

x 3

x 5

x 8

توفر مصفوفة معاملات الارتباط الزوجي مدخلات لمؤشرات أخرى لضيق الاتصال وللتحقق الأساسي من العلاقة الخطية المتداخلة. في هذه القضيةجميع العلاقات بين العوامل ضعيفة ، والعلاقة الخطية المتداخلة لن تفسد النموذج.

إن أهم مؤشر على تقارب الاتصال في نظام متعدد العوامل هو معامل التحديد المتعدد ص 2 . يقيس الضيق العام لعلاقة تباين السمة الناتجة ذمع تباين في نظام العوامل بأكمله المتضمن في النموذج. يمكن حساب قيمة معامل التحديد المتعدد بعدة طرق.

1. الحساب على أساس مصفوفة معاملات الارتباط المزدوجة

,

حيث Δ * - محدد المصفوفة ؛

, (26)

و هو محدد المصفوفة التي لا تتضمن الصف الأول Δ * والعمود الأخير ، أي:

مع عاملين ، يتم الحصول على صيغة حسابية مبسطة:

(27)

يستنتج من (27) أنه إذا كانت العوامل مستقلة عن بعضها البعض ، أي ، ، معامل التحديد المتعدد هو مجموع معاملات تحديد الزوج.

باستخدام الصيغة (27) ، يمكننا حساب ثلاثة معاملات ممكنة لتحديد عاملين:

2 - الحساب على أساس معاملات الارتباط المزدوجة ومعاملات β:

في المثال: ص 2 = 0.86 0.772 + 0.35 0.147 + 0.433 0.223 = 0.8119.

3. الحساب كعلاقة ارتباط ، أي نسبة تباين السمة الناتجة ذ، المرتبط بتغير نظام العوامل المتضمنة في النموذج (في معادلة الانحدار) ، إلى التباين العام الكامل للسمة الناتجة:

. (30)

بسط الصيغة (30) هو مجموع الانحرافات التربيعية للقيم الفردية المحسوبة للسمة الفعالة من متوسطها ، والمقام هو مجموع مربعات القيم الفعلية للسمة الفعالة من المتوسط ​​لجميع وحدات السكان.

معاملات التحديد الجزئية هي مؤشرات تقيس حسب النسبة التي يتم تقليل التباين غير المبرر بواسطة العوامل الموجودة بالفعل في النموذج عندما يتم تضمين هذا العامل في النموذج. x م. صيغة المعامل الجزئي للتحديد هي كما يلي:

في مثالنا:

التفسير كالتالي: التضمين في نموذج العامل x 3 بعد، بعدما x 5 و x 8 ذبنسبة 74٪ عامل التضمين x 5 بعد، بعدما x 3 و x 8 يقلل من الاختلاف غير المبرر ذعلى 10٪ ؛ عامل التضمين x 8 بعد، بعدما x 3 و x 5 يقلل من الاختلاف غير المبرر ذبنسبة 20٪.

معاملات التحديد الخاص لا يمكن مقارنتها فيما بينها ، لأن هذه كسور من قيم مقامات مختلفة.

باستخراج الجذر التربيعي لأي معامل تحديد ، يحصل المرء على معامل الارتباط المقابل: مضاعف أو زوج أو خاص.

5. إدراج العوامل غير الكمية في النموذج متعدد العوامل

العوامل غير الكمية للإنتاج الزراعي هي مثل منطقة طبيعية، شكل ملكية الشركات ، اتجاه الإنتاج السائد (الصناعة) وغيرها. يفضل عدم خلط المؤسسات أو المناطق التي تختلف في هذه الخصائص النوعية في السكان الأصليين. ولكن قد يكون من الضروري أيضًا بناء نموذج بوحدات غير متجانسة من السكان ، على سبيل المثال ، إذا كان عدد الوحدات المتجانسة من حيث الجودة صغيرًا جدًا لاتصال موثوق. قد يكون الهدف في بعض الأحيان هو قياس التأثير الصافي لعامل غير كمي ، مثل الملكية ، على ناتج الإنتاج ، وهذا يتطلب إدراج عامل نوعي في نموذج متعدد العوامل.

في مثل هذه الحالات ، يمكن ترميز التدرجات النوعية لميزة بواسطة متغيرات خاصة ، تسمى غالبًا متغيرات "وهمية" أو "هيكلية". إنها تعكس عدم تجانس البنية النوعية للسكان. لنفترض أنه من الضروري بناء نموذج انحدار لربحية منتجات الشركات ، وفي المنطقة يوجد 16 مؤسسة مملوكة للدولة ، و 28 خاصًا ، و 13 شكلًا تعاونيًا للملكية.

إذا تجاهلنا الاختلافات المرتبطة بشكل الملكية ، فإنها إما ستدخل في تباين متبقي ، مما يؤدي إلى تدهور نموذج الربحية ، أو أنها ستختلط مع تأثير بعض العوامل النوعية بنسب غير معروفة ، مما يؤدي إلى تشويه مقياس تأثيرها.

ضروري ل م العوامل غير الكمية أو التدرجات لهذا العامل لإدخالها م-1 المتغير الهيكلي ، يُشار إليه بالرمز يو ي. ستبدو بيانات الحساب كما يلي: م=3 (الجدول 2).

الجدول 2. البيانات الأولية مع المتغيرات الهيكلية

نوع الملكية

وحدة السكان

السمات الكمية

المتغيرات الهيكلية

X 1

X 2

X ك

يو 1

يو 2

حالة

معاني هذه العلامات

معاني هذه العلامات

تعاوني

معاني هذه العلامات

نتيجة للحل ، سيتم الحصول على نموذج للنموذج:

أين x ك +1 تتوافق مع المتغير يو 1 ، أ x ك +2 - عامل يو 2 .

دعنا نعيد كتابة النموذج بترميز خاص:

معنى معاملات المتغيرات الهيكلية كما يلي: المعامل ج 1 يعني أن المؤسسات الخاصة لها نفس قيم العوامل الكمية x 1 x كلديها ربحية ج 1 أكثر من الشركات المملوكة للدولة ، والتي يتم أخذها كأساس للمقارنة (ليس لها متغيرات هيكلية يو 1 و يو 2 ). الشركات ذات الشكل التعاوني للملكية لديها الربحية ج 2 أكبر من الدولة. كميات ج 1 و ج 2 يمكن أن تكون إيجابية وسلبية.

بدلاً من النموذج العام ، يمكنك كتابة ثلاثة نماذج خاصة للمؤسسات مجموعات فرديةعن طريق الملكية ، بإضافة معامل المتغير الهيكلي إلى المصطلح الحر للمعادلة:

أ) لمؤسسات القطاع العام

ب) لمنشآت القطاع الخاص

ج) لمؤسسات القطاع التعاوني

6. تطبيق متعدد العوامل نماذج الانحدارلتحليل أنشطة المؤسسات والتنبؤ

يوفر تقييم الأداء بناءً على نموذج الانحدار ، مقارنةً بأبسط طريقة لمثل هذا التقييم - مقارنة النتيجة التي حققتها مؤسسة معينة بمتوسط ​​النتيجة لمجموعة سكانية متجانسة - مزايا إضافية.

وفقًا لمثالنا ، كان متوسط ​​إنتاج 51 شركة زراعية 22.9 سم مكعب / هكتار من الحبوب.

تلقى Agrofirm 1 17.6 ف / هكتار. لذلك ، هذه الشركة متخلفة عن الركب. لكن السؤال الذي يطرح نفسه: ربما كانت ظروف إنتاج هذه الشركة أسوأ من المتوسط؟ تتجاهل المقارنة مع متوسط ​​السكان تمامًا الاختلاف في "عامل العرض" للمؤسسات ، وفي الواقع لا تكون المؤسسات دائمًا في نفس الظروف.

يشمل تقييم الأنشطة على أساس نموذج الانحدار مراعاة عدم المساواة في ظروف الإنتاج ، على سبيل المثال ، خصوبة التربة ، والوضع المالي ، وتوافر الموظفين المؤهلين ، وغيرها. من المستحيل مراعاة الاختلاف في ظروف الإنتاج بين المؤسسات تمامًا ، لأن أي نموذج لا يأخذ في الاعتبار جميع عوامل اختلاف العائد. يتم إجراء التقييم المستند إلى النموذج من خلال مقارنة النتيجة الفعلية (العائد) بالنتيجة التي ستحققها المؤسسة مع العوامل الفعلية والمتوسط ​​على إجمالي كفاءتها ، معبراً عنها بمعاملات الانحدار الخالصة المشروطة. ضع في اعتبارك نتائج حساب عائد شركتين (الجدول 3).

الجدول 3. النتيجة الفعلية والمقدرة للإنتاج

أغروفيرما

علامات العامل

الإنتاجية ، ج / هكتار

x 3

x 5

x 8

فِعلي

مُقدَّر

متوسط ​​العينة

كلتا الشركتين لديهما أسوأ من المتوسط ​​في العينة ، قيم العوامل الرئيسية x 3 و x 8 ، وبالتالي ، فإن قيم العائد المحسوب أقل من المتوسط. ولكن في الوقت نفسه ، تمتلك الشركة 1 عمليًا نفس العائد المقدر الذي تم الحصول عليه بالفعل. لا يوجد سبب لاعتبار هذه الشركة متخلفة عن الركب. الشركة 2 لديها عائد فعلي أقل من العائد المحسوب بناءً على العوامل المتاحة. هذا يعني إما أن العوامل غير المعروفة غير المدرجة في النموذج تبين أنها أسوأ من المتوسط ​​لهذه الشركة ، أو درجة استخدام العوامل الرئيسية - التكاليف لكل هكتار وتوافر العمال المهرة أقل من المتوسط.

يعتمد التنبؤ على أساس نموذج الانحدار على افتراض أن العوامل يمكن التحكم فيها ويمكن أن تأخذ قيمة مخططة أو أخرى متوقعة ، وستظل الظروف غير المعروفة الأخرى عند المستوى المتوسط ​​في المجتمع. لا تعني إمكانية التحكم في العوامل أنه يمكن استبدال أي من قيمها في النموذج عند التنبؤ. تعكس معادلة الانحدار الشروط التي كانت موجودة في المجموع ، والتي بموجبها تم الحصول على المعادلة. إذا كانت قيم علامات العوامل أعلى بمقدار 2-3 مرات ، فلا يمكن المجادلة بأن معاملات الانحدار النقي المشروط ستبقى كما هي.

لذلك ، يوصى ، عند التنبؤ باستخدام معادلة الانحدار ، بعدم تجاوز حدود القيم الفعلية الملاحظة للعوامل في المجموع ، أو تجاوز هذه الحدود بما لا يزيد عن 10-15٪ من المتوسط القيم. من المتطلبات التي لا تقل أهمية في التنبؤ شرط أن تكون القيم المتوقعة للعوامل متسقة. من الضروري مراعاة علامة وقرب العلاقة بين العوامل. على سبيل المثال ، إذا كان من المتوقع زيادة درجة توفير العمال المؤهلين ، فمن المستحيل ترك القيمة المتوقعة لمستوى الأجور دون تغيير ، ناهيك عن تقليلها. عند التخطيط لنمو نسبة القوة إلى الوزن ، من الضروري زيادة نسبة رأس المال إلى العمل تقريبًا بنفس النسبة.

بالتركيز على قيم العوامل الموضحة في الجدول 3 ، نفترض أنه عند توقع العائد ، فإننا نخطط للتكاليف لكل هكتار ( x 3 ) عند مستوى 3 آلاف روبل ، فإن وجود سائقي الجرارات لكل 100 هكتار من الأراضي الصالحة للزراعة 0.8 ؛ أجر الساعة 20 روبل. في ساعة. باستبدال هذه القيم في نموذج الانحدار ، نحصل على توقعات نقطية لإنتاج محاصيل الحبوب:

التنبؤ النقطي هو التوقع الرياضي (المتوسط) للقيم المحتملة للسمة المتوقعة ذات الاحتمالات المختلفة. من الضروري استكمال التنبؤ بالنقطة بحساب حدود الثقة باحتمالية عالية بدرجة كافية. للقيام بذلك ، استخدم قيمة متوسط ​​خطأ تقريب المربع ، والذي يتم حسابه بواسطة الصيغة:

(33)

بسط التعبير الجذري هو المتبقي ، غير مفسر بالنموذج ، مجموع الانحرافات التربيعية للميزة الناتجة ، والمقام هو عدد درجات الحرية للتغير المتبقي. في مثالنا ، المجموع المتبقي للانحرافات التربيعية هو 814.3. نملك:

لذلك ، مع موثوقية 0.95 ، سيكون العائد المتوقع 25.4 ± 4.16 · 2 ، أو من 17.8 إلى 33.72 ج / هكتار. تشير كل هذه الحسابات إلى توقعات الغلة للشركات الزراعية الفردية. اذا كان نحن نتكلمحول متوسط ​​العائد لمجموع 51 شركة زراعية ، إذن يعني الخطأالمتوسط ​​الحسابي يساوي الانحراف المعياري مقسومًا على الجذر التربيعي لحجم العينة ن، بمعنى آخر. سوف يكون:

تفسير هذه القيمة لمتوسط ​​الخطأ المتوقع هو كما يلي: إذا تم تزويد 51 شركة زراعية بالعوامل x 3 , x 5 , x 8 عند المستويات 3 ، 20 ، 0.8 ، على التوالي ، سيتم الحصول على متوسط ​​الإنتاج الكلي 25.4 ± 0.583 ج / هكتار. مع احتمال 0.95 ، سيكون متوسط ​​إجمالي العائد المتوقع 25.4 ± 0.583 · 2 ، أو من 23.7 إلى 27.1 ج / هكتار.

نموذج الارتباط-الانحدار الاقتصادي القياسي لنظام السمات المترابطة للسكان المدروس هو معادلة الانحدار التي تتضمن العوامل الرئيسية التي تؤثر على تباين السمة الناتجة في المجتمع ، قيمة عاليةمعامل التحديد (لا يقل عن 0.5) ، موثوق ومفسر بشكل صحيح وفقًا (في الإشارة وترتيب الحجم) مع نظرية النظام قيد الدراسة بواسطة معاملات الانحدار ، وبسبب هذه الخصائص ، فهي مناسبة لتقييم نشاط الوحدات السكانية وللتنبؤ.

مضاعف تراجع (2)الملخص >> التسويق

إدخالهم في النموذج ، أي إنشاء المعادلة مضاعف تراجع. مضاعف تراجعتستخدم على نطاق واسع في حل مشاكل الطلب ...

أثناء دراستهم ، غالبًا ما يواجه الطلاب مجموعة متنوعة من المعادلات. يتم النظر في إحداها - معادلة الانحدار - في هذه المقالة. يستخدم هذا النوع من المعادلات تحديدًا لوصف خصائص العلاقة بين المعلمات الرياضية. يستخدم هذا النوع من المساواة في الإحصاء والاقتصاد القياسي.

تعريف الانحدار

في الرياضيات ، يُفهم الانحدار على أنه كمية معينة تصف اعتماد متوسط ​​قيمة مجموعة بيانات على قيم كمية أخرى. تُظهر معادلة الانحدار ، كدالة لميزة معينة ، متوسط ​​قيمة ميزة أخرى. دالة الانحدار لها الشكل معادلة بسيطة y \ u003d x ، حيث y هو المتغير التابع ، و x هو المتغير المستقل (عامل الميزة). في الواقع ، يتم التعبير عن الانحدار بالصيغة y = f (x).

ما هي أنواع العلاقات بين المتغيرات

بشكل عام ، يتم تمييز نوعين متعارضين من العلاقات: الارتباط والانحدار.

الأول يتميز بالمساواة في المتغيرات الشرطية. في هذه الحالة ، ليس معروفًا على وجه اليقين أي متغير يعتمد على الآخر.

إذا لم تكن هناك مساواة بين المتغيرات وكانت الشروط تقول أي متغير توضيحي وأي متغير تابع ، فيمكننا التحدث عن وجود اتصال من النوع الثاني. من أجل بناء معادلة الانحدارالخطي، سيكون من الضروري معرفة نوع الاتصال الذي يتم ملاحظته.

أنواع الانحدار

حتى الآن ، هناك 7 أنواع مختلفة من الانحدار: الزائدي ، الخطي ، المتعدد ، غير الخطي ، الزوجي ، العكسي ، الخطي اللوغاريتمي.

الزائدية والخطية واللوغاريتمية

تُستخدم معادلة الانحدار الخطي في الإحصاء لشرح معلمات المعادلة بوضوح. يبدو أن y = c + m * x + E. المعادلة الزائدية لها شكل القطع الزائد y \ u003d c + m / x + E. لوغاريتميًا معادلة خط مستقيميعبر عن علاقة مع دالة لوغاريتمية: في y \ u003d In c + t * In x + In E.

متعددة وغير خطية

اثنين اخرين أنواع معقدةالانحدارات متعددة وغير خطية. يتم التعبير عن معادلة الانحدار المتعدد بواسطة الوظيفة y \ u003d f (x 1، x 2 ... x c) + E. في هذه الحالة ، y هو المتغير التابع و x هو المتغير التوضيحي. المتغير E عشوائي ويتضمن تأثير العوامل الأخرى في المعادلة. معادلة غير خطيةالانحدار غير متسق بعض الشيء. من ناحية ، فيما يتعلق بالمؤشرات التي تؤخذ في الاعتبار ، فهي ليست خطية ، ومن ناحية أخرى ، في دور تقييم المؤشرات ، فهي خطية.

الانحدار العكسي والزوجي

المعكوس هو نوع من الدالة التي يجب التحويل إليها عرض خطي. في معظم برامج التطبيق التقليدية ، يكون لها شكل دالة y \ u003d 1 / c + m * x + E. تُظهر معادلة الانحدار المزدوج العلاقة بين البيانات كدالة لـ y = f (x) + E. تمامًا مثل المعادلات الأخرى ، تعتمد y على x و E هي معلمة عشوائية.

مفهوم الارتباط

هذا مؤشر يوضح وجود علاقة بين ظاهرتين أو عمليتين. يتم التعبير عن قوة العلاقة كمعامل ارتباط. تتقلب قيمته خلال الفترة [-1 ؛ +1]. مؤشر سلبييتحدث عن الوجود استجابة، إيجابي - حول خط مستقيم. إذا أخذ المعامل قيمة تساوي 0 ، فلا توجد علاقة. كلما كانت القيمة أقرب إلى 1 ، فإن اتصال أقوىبين المعلمات ، كلما اقتربنا من 0 - أضعف.

طُرق

يمكن للطرق البارامترية للارتباط تقدير مدى ضيق العلاقة. يتم استخدامها على أساس تقديرات التوزيع لدراسة المعلمات التي تخضع لقانون التوزيع العادي.

تعد معلمات معادلة الانحدار الخطي ضرورية لتحديد نوع الاعتماد ، ووظيفة معادلة الانحدار وتقييم مؤشرات صيغة العلاقة المختارة. يتم استخدام حقل الارتباط كطريقة لتحديد العلاقة. للقيام بذلك ، يجب تمثيل جميع البيانات الموجودة بيانياً. في نظام إحداثيات مستطيل ثنائي الأبعاد ، يجب رسم جميع البيانات المعروفة. هذه هي الطريقة التي يتشكل بها مجال الارتباط. يتم تمييز قيمة عامل الوصف على طول الإحداثي ، بينما يتم تمييز قيم العامل التابع على طول الإحداثي. إذا كانت هناك علاقة وظيفية بين المعلمات ، فإنها تصطف في شكل خط.

إذا كان معامل الارتباط لهذه البيانات أقل من 30٪ ، فيمكننا التحدث عن الغياب شبه الكامل للاتصال. إذا كانت بين 30٪ و 70٪ ، فهذا يدل على وجود روابط ذات إحكام متوسط. مؤشر 100٪ هو دليل على وجود اتصال وظيفي.

يجب استكمال معادلة الانحدار غير الخطي ، تمامًا مثل المعادلة الخطية ، بمؤشر الارتباط (R).

الارتباط للانحدار المتعدد

معامل التحديد هو مؤشر للمربع ارتباط متعدد. يتحدث عن ضيق العلاقة بين مجموعة المؤشرات المقدمة والسمة قيد الدراسة. يمكن أن يتحدث أيضًا عن طبيعة تأثير المعلمات على النتيجة. يتم تقييم معادلة الانحدار المتعدد باستخدام هذا المؤشر.

من أجل حساب مؤشر الارتباط المتعدد ، من الضروري حساب مؤشره.

طريقة المربعات الصغرى

هذه الطريقة هي طريقة لتقدير عوامل الانحدار. يكمن جوهرها في تقليل مجموع الانحرافات التربيعية التي تم الحصول عليها بسبب اعتماد العامل على الوظيفة.

يمكن تقدير معادلة الانحدار الخطي المزدوجة باستخدام هذه الطريقة. يستخدم هذا النوع من المعادلات في حالة الكشف بين مؤشرات العلاقة الخطية المزدوجة.

خيارات المعادلة

كل معلمة لوظيفة الانحدار الخطي لها معنى محدد. تحتوي معادلة الانحدار الخطي المقترن على معلمتين: c و m يوضح المعامل t متوسط ​​التغيير في المؤشر النهائي للدالة y ، مع مراعاة انخفاض (زيادة) في المتغير x بمقدار وحدة تقليدية واحدة. إذا كان المتغير x يساوي صفرًا ، فإن الوظيفة تساوي المعلمة c. إذا لم يكن المتغير x صفرًا ، فلن يحمل العامل c من الناحية الاقتصادية. التأثير الوحيد على الوظيفة هو الإشارة أمام العامل ج. إذا كان هناك سالب ، فيمكننا القول عن تغيير بطيء في النتيجة مقارنة بالعامل. إذا كان هناك علامة زائد ، فهذا يشير إلى تغيير متسارع في النتيجة.

يمكن التعبير عن كل معلمة تغير قيمة معادلة الانحدار من حيث المعادلة. على سبيل المثال ، يكون للعامل c الصيغة c = y - mx.

البيانات المجمعة

توجد مثل هذه الشروط للمشكلة حيث يتم تجميع جميع المعلومات وفقًا للسمة x ، ولكن في نفس الوقت لـ مجموعة معينةيشار إلى متوسط ​​القيم المقابلة للمؤشر التابع. في هذه الحالة ، تصف القيم المتوسطة كيف يعتمد المؤشر على x. وبالتالي ، فإن المعلومات المجمعة تساعد في إيجاد معادلة الانحدار. يتم استخدامه كتحليل العلاقة. ومع ذلك ، فإن هذه الطريقة لها عيوبها. لسوء الحظ ، غالبًا ما تخضع المعدلات لتقلبات خارجية. هذه التقلبات ليست انعكاسًا لأنماط العلاقة ، إنها تخفي فقط "ضجيجها". تظهر المتوسطات أنماط العلاقة أسوأ بكثير من معادلة الانحدار الخطي. ومع ذلك ، يمكن استخدامها كأساس لإيجاد معادلة. بضرب حجم مجتمع معين في المتوسط ​​المقابل ، يمكنك الحصول على مجموع ص داخل المجموعة. بعد ذلك ، تحتاج إلى إخراج جميع المبالغ المستلمة والعثور على المؤشر النهائي y. من الأصعب قليلاً إجراء الحسابات باستخدام مؤشر المجموع س ص. في حالة ما إذا كانت الفترات الزمنية صغيرة ، يمكننا أن نأخذ المؤشر x بشكل مشروط لجميع الوحدات (داخل المجموعة) كما هو. اضربها في مجموع y لإيجاد مجموع حاصل ضرب x و y. علاوة على ذلك ، يتم تجميع جميع المبالغ معًا ويتضح المبلغ الإجماليهو.

انحدار معادلة الأزواج المتعددة: تقييم أهمية العلاقة

كما تمت مناقشته سابقًا ، فإن الانحدار المتعدد له وظيفة بالشكل y \ u003d f (x 1 ، x 2 ، ... ، x m) + E. في أغلب الأحيان ، يتم استخدام مثل هذه المعادلة لحل مشكلة العرض والطلب على السلع ، ودخل الفائدة على الأسهم المعاد شراؤها ، ودراسة أسباب ونوع دالة تكلفة الإنتاج. كما أنها تستخدم بنشاط في مجموعة متنوعة من دراسات وحسابات الاقتصاد الكلي ، ولكن على مستوى الاقتصاد الجزئي ، يتم استخدام هذه المعادلة بشكل أقل قليلاً.

تتمثل المهمة الرئيسية للانحدار المتعدد في بناء نموذج بيانات يحتوي على كمية هائلة من المعلومات من أجل مزيد من تحديد ما الذي يؤثر على كل عامل من العوامل على حدة وفي مجملها على المؤشر الذي سيتم نمذجته ومعاملاته. يمكن أن تأخذ معادلة الانحدار مجموعة متنوعة من القيم. في هذه الحالة ، عادة ما يتم استخدام نوعين من الوظائف لتقييم العلاقة: الخطية وغير الخطية.

يتم تصوير دالة خطية في شكل مثل هذه العلاقة: y \ u003d a 0 + a 1 x 1 + a 2 x 2، + ... + a m x m. في هذه الحالة ، a2 ، a m ، تعتبر معاملات الانحدار "الخالص". إنها ضرورية لتوصيف متوسط ​​التغيير في المعلمة y مع تغيير (نقصان أو زيادة) في كل معلمة مقابلة x بواسطة وحدة واحدة ، مع حالة القيمة الثابتة للمؤشرات الأخرى.

المعادلات غير الخطية لها ، على سبيل المثال ، الشكل وظيفة الطاقة y = ax 1 b1 x 2 b2 ... x m bm. في هذه الحالة ، تسمى المؤشرات ب 1 ، ب 2 ..... ب م - معاملات المرونة ، وهي توضح كيف ستتغير النتيجة (بمقدار النسبة المئوية) مع زيادة (نقص) في المؤشر المقابل x بنسبة 1٪ وبمؤشر ثابت لعوامل أخرى.

ما هي العوامل التي يجب مراعاتها عند بناء الانحدار المتعدد

من أجل بناء الانحدار المتعدد بشكل صحيح ، من الضروري معرفة العوامل التي يجب إيلاء اهتمام خاص لها.

من الضروري أن يكون لديك بعض الفهم لطبيعة العلاقة بين عوامل اقتصاديةونمذجة. يجب أن تستوفي العوامل المراد تضمينها المعايير التالية:

  • يجب أن تكون قابلة للقياس. من أجل استخدام عامل يصف جودة كائن ما ، في أي حال ، يجب إعطاؤه شكلًا كميًا.
  • يجب ألا يكون هناك ارتباط بين عامل ، أو علاقة وظيفية. غالبًا ما تؤدي مثل هذه الإجراءات إلى عواقب لا رجعة فيها - النظام معادلات عاديةيصبح غير مشروط ، وهذا يستلزم عدم موثوقيتها وتقييماتها الضبابية.
  • في حالة وجود مؤشر ارتباط ضخم ، لا توجد طريقة لمعرفة التأثير المعزول للعوامل على النتيجة النهائيةوبالتالي ، تصبح المعاملات غير قابلة للتفسير.

طرق البناء

موجود كمية كبيرةالأساليب والتقنيات التي تشرح كيف يمكنك اختيار عوامل المعادلة. ومع ذلك ، فإن كل هذه الطرق تعتمد على اختيار المعاملات باستخدام مؤشر الارتباط. من بين هؤلاء:

  • طريقة الاستبعاد.
  • قم بتشغيل الطريقة.
  • تحليل الانحدار التدريجي.

تتضمن الطريقة الأولى غربلة جميع المعاملات من المجموعة الكلية. الطريقة الثانية تتضمن تقديم مجموعة عوامل إضافية. حسنًا ، العامل الثالث هو حذف العوامل التي سبق تطبيقها على المعادلة. كل من هذه الأساليب لها الحق في الوجود. لديهم إيجابيات وسلبيات ، لكن يمكنهم حل مشكلة فرز المؤشرات غير الضرورية بطريقتهم الخاصة. كقاعدة عامة ، النتائج التي حصل عليها كل طريقة منفصلةقريبة بما فيه الكفاية.

طرق التحليل متعدد المتغيرات

تستند هذه الطرق لتحديد العوامل على اعتبار المجموعات الفردية للسمات المترابطة. وتشمل هذه التحليل التمييزي ، والتعرف على الأنماط ، وتحليل المكونات الرئيسية ، وتحليل الكتلة. بالإضافة إلى ذلك ، هناك أيضًا تحليل عامل ، ومع ذلك ، فقد ظهر نتيجة لتطوير طريقة المكون. يتم تطبيق كل منهم في ظروف معينة ، في ظل ظروف وعوامل معينة.

في الواقع ، يتم تحديد كل ظاهرة من خلال عمل ليس سببًا واحدًا ، بل عدة أسباب ، وحتى مجموعة معقدة من الأسباب. هم العمل المشتركقد يكون لها آثار مختلفة على النتيجة. "يتم إنشاء التأثير من خلال الإجراء التراكمي للعديد من الأسباب. مجموعة معقدة من الأسباب تؤدي إلى نتائج مختلفة. بناءً على النتيجة في نفس الاتجاه ، فإنهم يقوون تأثير بعضهم البعض. إذا كان لبعض الأسباب الاتجاه المعاكس فيما يتعلق بموضوع العمل ، فإن تأثيرها المشترك على التأثير يضعف أو حتى يُبطل. قد ينشأ الموقف حتى عندما لا يكون لسبب واضح المعالم بالفعل تأثير واضح. هذا يعني أنه إلى جانب هذا السبب ، هناك شخص آخر يعمل ، ويمتص فعل الأول. لذلك ، من الضروري دراسة التأثير أسباب مختلفة، أي للتحقيق في اعتماد ظاهرة واحدة على عدد من الظواهر الأخرى التي تسبب الأولى.

من الواضح تمامًا أنه لا يمكن التحقيق في جميع الأسباب والعوامل التي تؤثر إلى حد ما على الظاهرة قيد الدراسة. نحن مجبرون على حصر أنفسنا في الأسباب الأساسية.

يتم تحديد ظاهرة اقتصادية من قبل الجمهور في وقت واحد وجماعية. أسباب التشغيل. لذلك ، فإننا نواجه مهمة دراسة اعتماد متغير تابع واحد على عدة متغيرات تفسيرية في ظل ظروف مكان معين ووقت محدد. يمكن حل هذه المشكلة باستخدام تحليل الانحدار متعدد المتغيرات. في هذه الحالة ، نقصر أنفسنا مرة أخرى على التفكير في علاقة خطية بين المتغير التابع y والمتغيرات التوضيحية xm. سنناقش أيضًا استخدام تحليل الانحدار بعلاقة غير خطية بين المتغيرات ، ولكن فقط للحالة التي يكون فيها التقريب الخطي ممكنًا.

لذلك ، إذا كانت هناك علاقة خطية بين المتغيرات ، فإن التعبير العام لمعادلة الانحدار المتعدد (2.1) مكتوب على النحو التالي

المتغيرات التوضيحية لها تأثير متزامن مشترك على المتغير التابع y.

كما قيل ، لا يمكننا تغطية مجموعة الأسباب برمتها وأن نأخذ في الاعتبار العشوائية المتأصلة بدرجة أو بأخرى في الفعل السببي والتأثير الذي يحدده. لذلك ، نقصر أنفسنا على أهم المتغيرات التوضيحية ، نقدم مكونًا إضافيًا للمتغير المربك u في التعبير عن دالة الانحدار ، والذي يعطي التأثير الكلي لتأثير جميع العوامل والحوادث غير المحسوبة. لذلك يمكن تمثيل القيم التجريبية لـ y على النحو التالي:

لذلك ، يتم تفسير المتغير المزعج بنفس الطريقة كما هو الحال في الانحدار الخطي البسيط.

في تعبير دالة ، القيم المحسوبة للانحدار. تشير إلى متوسط ​​قيم المتغير y عند نقطة ما للقيم الثابتة للمتغيرات التوضيحية ، على افتراض أن هذه المتغيرات فقط هي التي تسبب تغيير المتغير y. قيم y هي تقديرات لمتوسط ​​قيم y للقيم الثابتة للمتغيرات عند النقطة

المعاملات هي معاملات الانحدار (2.42). يؤدي الانحدار المستمر مرة أخرى وظيفة التعادل في معادلة الانحدار. يحدد نقطة تقاطع السطح العلوي للانحدار مع المحور الصادي.

القيم هي تقديرات لمعاملات الانحدار. المؤشر عند المعامل يتوافق مع مؤشر المتغير التوضيحي. لذلك ، يشير إلى متوسط ​​التغيير في y عند التغيير بوحدة واحدة ، بشرط أن تظل المتغيرات الأخرى دون تغيير ؛ يوضح من خلال عدد الوحدات التي يمكن أن تتغير y في المتوسط ​​إذا تغير المتغير بواحد ، بافتراض أن المتغيرات ظلت دون تغيير ، وما إلى ذلك. متوسط ​​التأثيرات الجزئية للمتغيرات ، على افتراض أن المتغيرات التوضيحية الأخرى تظل ثابتة. من وجهة نظر المنهجية الإحصائيةوبالتالي لا يوجد تمييز بين الانحدار المتعدد والجزئي. (سوف ندخل في مزيد من التفاصيل حول هذا في القسم التالي.) لهذا السبب ، في الأدبيات ، يشار إلى المعلمات على أنها معاملات الانحدار المتعددة والجزئية.

مثل هذا التفسير الهادف لمعاملات الانحدار يمكن أن يؤدي إلى استنتاج خاطئ بأنه يكفي تحديد العديد من الانحدارات الخطية البسيطة للمتغير y على المتغيرات الفردية. ولكن ، كما ذكرنا سابقًا وكما سنرى في المثال ، الانحدار المتعدد ، على الرغم من أنه يغطي الإجراء المتزامن للمتغيرات التوضيحية ، إلا أن معامل الانحدار يستبعد تأثير المتغيرات التوضيحية الأخرى ،

في حالة الانحدار الخطي البسيط ، يختلف الوضع. في الانحدار الخطي البسيط ، ينعكس تأثير المتغيرات التفسيرية الأخرى جزئيًا في معامل الانحدار ، والذي يمكن تفسيره بالعلاقة ثنائية الجانب للمتغيرات التفسيرية في كثير من الأحيان. لذلك ، إذا كان لديك معلومات كافية ومواد عددية تجريبية لعدة أسباب - عوامل للمتغير y ، فمن المناسب والمبرر نظريًا بناء انحدار متعدد. في القسم 2.5 ، أشرنا بالفعل إلى أنه نظرًا لتشتت قيم المتغيرات الفردية ، فإن وظيفة الانحدار لا يمكن عكسها حتى عندما تكون مبررة منطقيًا ومبررة من خلال الاعتبارات المهنية. اللارجعة هي أيضا سمة من سمات الانحدار المتعدد. إذا كنت مهتمًا ليس فقط باعتماد المتغير y على ولكن أيضًا في اعتماد المتغير على y ، فيجب عليك تحديد دالة أخرى (الانحدار x على y ومن الناحية النظرية ، هناك انحدارات مقترنة أو بديلة. هنا بالفعل نولي اهتمامًا لحقيقة أن الاعتماد متعدد الأطراف بين المتغيرات y وينتهك المتطلبات الأساسية لتطبيق الطريقة المربعات الصغرى. سنناقش هذا بمزيد من التفصيل في الفصل 12.

سننظر في إجراء بناء انحدار متعدد باستخدام مثال الانحدار مع متغيرين توضيحيين. تتم كتابة وظيفة الانحدار الخطي المتعدد في هذه الحالة على شكل

تتمثل المهمة في تقدير معلمات الانحدار بناءً على نتائج ملاحظات العينة على المتغيرات المدرجة في التحليل. لهذا الغرض ، نستخدم طريقة المربعات الصغرى مرة أخرى. دعونا نضع شرطًا يجب أن يتوافق بموجبه الانحدار مع البيانات التجريبية قدر الإمكان. لذلك ، للأسباب نفسها الواردة في القسم 2.4 ، سنطرح شرط أن يكون مجموع الانحرافات التربيعية لجميع القيم المرصودة للمتغير التابع من القيم المحسوبة بواسطة معادلة الانحدار (أي مجموع تربيع بقايا) يجب أن تكون ضئيلة. لذلك يجب تلبية الشرط

استبدال التعبير (2.43) بدلاً من ذلك ، نحصل عليها

كما هو الحال في القسم 2.4 ، 5 هي دالة لمعلمات الانحدار غير المعروفة. شرط ضروريتحقيق (2.45) هو انعكاس المشتقات الجزئية الصفرية للدالة فيما يتعلق بكل من المعلمات.

الحسابات التي نحصل عليها النظام القادمالمعادلات العادية:

إذا قارنا هذه المعادلات مع المعادلات العادية للانحدار الخطي البسيط ، فسنرى تشابهًا كبيرًا. وهي تختلف فقط في المصطلح الذي يأخذ في الاعتبار المتغير الجديد ، لذلك فإن إدراج المتغيرات الجديدة في التحليل لا يمثل صعوبات كبيرة.

بقسمة طرفي المعادلة (2.46) نحصل على التعبير التالي للانحدار المستمر

بالتعويض عن (2.49) بـ (2.43) ، بعد بعض التحولات البسيطة نحصل على تعبير مشابه لـ (2.25):

حل نظام المعادلات العادية لمعلمات غير معروفة ، نحصل عليها

بالقياس مع الصيغة (2.27) للانحدار البسيط ، يمكن تمثيل معاملات الانحدار المتعدد أو الجزئي من خلال التباينات والتغايرات.

أولاً قسمة طرفي المعادلة العادية (2.46) وضربهما بطرحهما على التوالي من اليسار و الأجزاء الصحيحةالمعادلات (2.47). نتيجة لذلك ، نحصل عليه

ثم نقوم بضرب طرفي المعادلة العادية (2.46) بقسمةهما مسبقًا وطرحهما من الجانبين الأيسر والأيمن للمعادلة (2.48) على التوالي. نتيجة لذلك ، نحصل عليه

يمكننا تمثيل كلا المساواة على النحو التالي:

وبقسمة جزأي المساواة (2.53) و (2.54) نجد ، مع مراعاة تعريفات التباين والتغاير ، التعبيرات الخاصة بمعاملات الانحدار:

باستخدام بيانات المثال من القسم 2.4 ، نكملها بنتائج الملاحظات على المتغير التوضيحي الثاني - متوسط ​​عمر العمال. سيتم الآن الإشارة إلى المتغير x المستخدم في مثال القسم 2.4 بواسطة. في الجدول. 7 يوضح القيم التي يأخذها المتغير و نتائج متوسطةالحسابات المطلوبة لإيجاد تقديرات لمعاملات الانحدار.

الجدول 7. متوسط ​​عمر الموظفين ، ومتوسط ​​النسبة المئوية للامتثال للمعيار في 14 مؤسسة والنتائج الوسيطة اللازمة للعثور على تقديرات لمعاملات الانحدار (انظر المسح)

يعني المتغير

باستخدام النتائج الوسيطة من الجدول. 3 و 7 ، باستخدام الصيغتين (2.51) و (2.52) نحسب معاملات الانحدار:

يتم الحصول على ثابت الانحدار بواسطة الصيغة (2.49):

لذلك ، وفقًا لصيغة دالة الانحدار (2.43) ، يمكن كتابة معادلة الانحدار كـ

إذا أخذنا في الاعتبار اعتماد الإنتاجية على كل من مستوى ميكنة العمل ومتوسط ​​عمر العمال ، فإن إنتاجية العمل ستتغير في المتوسط ​​، بشرط أن يتغير مستوى ميكنة العمل بنسبة واحد بالمائة ، باستثناء تأثير المتوسط عمر العمال. إذا استبعدنا تأثير مستوى ميكنة العمل ، فإن إنتاجية العمل ستتغير في المتوسط ​​بتغيير في متوسط ​​عمر العمال بمقدار عام واحد.

بالمقارنة مع معامل الانحدار في المعادلة بمتغير توضيحي واحد ، انخفض معامل الانحدار الجزئي بشكل طفيف. وذلك لأن المتغير يرتبط بما سنراه بالمؤشر الكمي. ولهذا السبب فإن المتغير يؤثر على المتغير y الذي من خلاله تضعف قوة اعتماد y على المتغير ، ووجود الاعتماد بين المتغيرات التفسيرية يخالف أحد الافتراضات الأساسية للنموذج الخطي لتحليل الانحدار والذي يستلزم مشاكل خاصة. سنناقش هذه القضايا بمزيد من التفصيل في الفصل 9.

بالتعويض عن قيم المتغيرات على التوالي في المعادلة الناتجة ، نجد القيم المحسوبة للانحدار. بطرحها من القيم المرصودة للمتغير y ، نحصل على الباقي:

من حجم هذه القيم المتبقية ، يمكن للمرء أن يستخلص استنتاجًا مشابهًا للاستنتاج الوارد في القسم 2.4 للانحدار الخطي البسيط.

بمقارنة الصيغتين (2.51) و (2.52) مع (2.22) و (2.23) وكذلك إجراءات الحساب ، نرى أن إدراج متغيرات تفسيرية جديدة في الانحدار يعقد التعبيرات التحليلية للصيغ ومعها الحسابات. يتطلب تعميم نموذج الانحدار المتعدد على المتغيرات التفسيرية استخدام تدوين المصفوفة ومعرفة تقنيات جبر المصفوفة. بالإضافة إلى ذلك ، يعد هذا ضروريًا لاكتناز العرض التقديمي وتطبيق بعض الإجراءات الحسابية القياسية ، والتي تسهل بشكل كبير وتسريع تحليل القيم المرصودة للحجج ؛
ب- متجه - عمود البعد [ (ك + 1) × 1] معلمات غير معروفة (معاملات الانحدار) للنموذج المراد تقديرها ؛
ه- متجه عشوائي - عمود البعد (ن × 1)أخطاء الملاحظة (المخلفات).

مهام تحليل الانحدار
المهمة الرئيسية لتحليل الانحدار هي العثور على حجم العينة نتقديرات معاملات الانحدار غير المعروفة ب 0 ، ب 1 ، ... ، ب ك. تتمثل مهام تحليل الانحدار في استخدام البيانات الإحصائية المتاحة للمتغيرات X طو ص:

  • الحصول على أفضل التقديرات للمعلمات غير المعروفة ب 0 ، ب 1 ، ... ، ب ك;
  • تحقق الفرضيات الإحصائيةحول معلمات النموذج ؛
  • تحقق مما إذا كان النموذج يتوافق جيدًا مع البيانات الإحصائية (مدى ملاءمة النموذج لبيانات المراقبة).

يتكون بناء نماذج انحدار متعددة من الخطوات التالية:

  1. اختيار شكل الاتصال (معادلات الانحدار) ؛
  2. تحديد معلمات المعادلة المختارة ؛
  3. تحليل جودة المعادلة والتحقق من كفاية المعادلة للبيانات التجريبية وتحسين المعادلة.
  • الانحدار المتعدد بمتغير واحد
  • الانحدار المتعدد مع ثلاثة متغيرات

تعليمات. حدد مقدار البيانات (عدد الصفوف) ، عدد المتغيرات x ، انقر فوق التالي.

عدد العوامل (x) 1 2 3 4 5 6 7 8 9 10 عدد الخطوط
.");">

مثال على حل لإيجاد نموذج الانحدار المتعدد

الانحدار المتعدد بمتغيرين

نموذج الانحدار المتعددمن النموذج Y \ u003d b 0 + b 1 X 1 + b 2 X 2 ؛
1) يمكنك إيجاد المجهول ب 0 ، ب 1 ، ب 2 ، فنحن نحل نظام معادلات ثلاثية الخطية بثلاثة مجاهيل ب 0 ، ب 1 ، ب 2:

لحل النظام ، يمكنك استخدام
2) أو باستخدام الصيغ


للقيام بذلك ، نقوم ببناء جدول بالنموذج:

ص × 1 x2 (متوسط ​​ص ص) 2 (x 1 -x 1sr) 2 (x 2 -x 2sr) 2 (ص-ص س) (س 1-س 1 س) (ص ص ص) (س 2-س 2 ص) (x 1 -x 1sr) (x 2 -x 2sr)

يمكن تحديد الفروق النموذجية لمعاملات الانحدار المتعددة التجريبية على النحو التالي:

هنا z "jj هو العنصر القطري j للمصفوفة Z -1 = (X T X) -1.

حيث:

حيث m هو عدد المتغيرات التوضيحية في النموذج.
على وجه الخصوص ، بالنسبة لمعادلة الانحدار المتعدد Y = b 0 + b 1 X 1 + b 2 X 2 مع متغيرين توضيحيين ، يتم استخدام الصيغ التالية:


أو

أو
,,.
هنا r 12 - معامل ارتباط العينة بين المتغيرات التوضيحية X 1 و X 2 ؛ Sbj- خطأ تقليديمعامل الانحدار؛ S هو الخطأ المعياري للانحدار المتعدد (تقدير غير متحيز).
عن طريق القياس مع الانحدار الزوجي بعد تحديد تقديرات النقطة b j للمعاملات β j (j = 1،2 ، ... ، m) معادلة نظريةيمكن حساب الانحدار المتعدد تقديرات الفاصلمعاملات محددة.

تغطية فاصل الثقة بموثوقية (1-α) قيمة غير معروفةيتم تعريف المعلمة β j على أنها

الانحدار المتعدد في Excel

للعثور على معامِلات انحدار متعددة باستخدام برنامج Excel، يتم استخدام دالة LINEST (Y ؛ X ؛ 0 ؛ 1) ،
حيث Y عبارة عن صفيف لقيم Y.
حيث X عبارة عن صفيف لقيم X (محدد كمصفوفة واحدة لجميع قيم X أنا)

التحقق من الدلالة الإحصائية لمعاملات معادلة الانحدار المتعدد

كما في حالة الانحدار المتعدد ، يتم اختبار الدلالة الإحصائية لمعاملات الانحدار المتعدد مع المتغيرات التوضيحية m بناءً على إحصاء t:

وجود توزيع الطالب في هذه الحالة مع عدد درجات الحرية v = n-m-1. عند مستوى الأهمية المطلوب ، تتم مقارنة القيمة المرصودة لإحصاء t بتوزيع Student الدقيق الدقيق.
إذا تم تأكيد الأهمية الإحصائية لمعامل الانحدار المتعدد المقابل. هذا يعني أن العامل Xj يرتبط خطيًا بالمتغير التابع Y. إذا ثبت أن المعامل b j غير مهم ، فمن المستحسن استبعاد المتغير Xj من المعادلة. لن يؤدي ذلك إلى خسارة كبيرة في جودة النموذج ، ولكنه سيجعله أكثر تحديدًا.

لهذا الغرض ، كما في حالة الانحدار المتعدد ، يتم استخدام معامل التحديد R 2:

النسبة 0<=R2<=1. Чем ближе этот коэффициент к единице, тем المزيد من المعادلةالانحدار المتعدد يوضح سلوك Y.
إلى عن على الانحدار المتعددمعامل التحديد هو دالة غير متناقصة لعدد المتغيرات التفسيرية. إن إضافة متغير توضيحي جديد لا يقلل أبدًا من قيمة R 2 ، لأن كل متغير لاحق يمكن أن يضيف فقط ، ولكن لا يقلل ، المعلومات التي تشرح سلوك المتغير التابع.

يمكن تمثيل النسبة بـ النموذج التالي:

لم> 1. كقيمة م


المؤشرات F و R2 تساوي أو لا تساوي الصفر في نفس الوقت. إذا كانت F = 0 ، فإن R 2 = 0 ، وبالتالي ، فإن قيمة Y تكون مستقلة خطيًا عن X1 ، X2 ، ... ، Xm .. تتم مقارنة القيمة المحسوبة لـ F مع Fcr الحرجة. يتم تحديد Fcr ، بناءً على مستوى الأهمية المطلوب α وعدد درجات الحرية v1 = m و v2 = n - m - 1 ، بناءً على توزيع Fisher. إذا كانت F> Fcr ، فإن R 2 تكون ذات دلالة إحصائية.

التحقق من جدوى افتراضات الانحدار المتعدد OLS. إحصائيات دوربين واتسون للانحدار المتعدد

لا تضمن الدلالة الإحصائية لمعاملات الانحدار المتعددة وقيمة معامل التحديد R 2 القريبة من الواحد الجودة العالية لمعادلة الانحدار المتعدد. لذلك ، فإن الخطوة التالية في التحقق من جودة معادلة الانحدار المتعدد هي التحقق من جدوى افتراضات LSM. سيتم النظر في أسباب وعواقب استحالة هذه المتطلبات الأساسية ، وطرق تصحيح نماذج الانحدار في الفصول اللاحقة. في هذا القسم ، سننظر في الشعبية تحليل الانحدارإحصائيات دوربين واتسون.
في تحليل احصائيتشغيل معادلات الانحدار المرحلة الأوليةغالبًا ما يتحققون من جدوى فرضية واحدة: شروط الاستقلال الإحصائي للانحرافات عن بعضها البعض.

في هذه الحالة ، يتم التحقق من عدم ارتباط الكميات المجاورة ه ط، أنا = 1،2 ، ... ن ..
لتحليل ارتباط الانحرافات ، يتم استخدام إحصائيات Durbin-Watson:

القيم الحرجة د 1و د 2تحدد على أساس جداول خاصة لمستوى الأهمية المطلوب α ، عدد الملاحظات نوعدد المتغيرات التفسيرية م.

معاملات الارتباط الجزئي في الانحدار المتعدد

يتم تحديد معاملات الارتباط الجزئي (أو المؤشرات) التي تقيس التأثير على y للعامل x i مع مستوى العوامل الأخرى دون تغيير بواسطة الصيغة القياسية معامل خطيالارتباطات ، أي يتم أخذ أزواج yx 1 و yx 2 و ... و x 1 x 2 و x 1 x 3 وما إلى ذلك بشكل تسلسلي ولكل زوج تم العثور على معامل الارتباط
الحسابات في MS Excel. يمكن حساب مصفوفة معاملات الارتباط الزوجي للمتغيرات باستخدام أداة تحليل بيانات الارتباط. لهذا:
1) أمر التشغيل الخدمة / تحليل البيانات / الارتباط.
2) تحديد نطاق البيانات ؛

التحقق من الجودة الشاملة لمعادلة الانحدار المتعدد

لهذا الغرض ، كما في حالة الانحدار المتعدد ، يتم استخدام معامل التحديد R2:

نسبة عادلة 0 < =R 2 < = 1 . كلما اقترب هذا المعامل من واحد ، زادت معادلة الانحدار المتعدد التي توضح السلوك ص.
إلى عن على الانحدار المتعددمعامل التحديد هو دالة غير متناقصة لعدد المتغيرات التفسيرية. لا تؤدي إضافة متغير توضيحي جديد إلى خفض القيمة أبدًا R2، نظرًا لأن كل متغير لاحق يمكن أن يكمل فقط ، ولكن لا يقلل بأي حال من الأحوال المعلومات التي تشرح سلوك المتغير التابع.
في بعض الأحيان ، عند حساب معامل التحديد للحصول على تقديرات غير متحيزة في البسط والمقام للكسر المطروح من الوحدة ، يتم إجراء تصحيح لعدد درجات الحرية ، أي يتم تقديم ما يسمى بمعامل التحديد المعدل (المصحح):

يمكن تمثيل النسبة على النحو التالي:

لم> 1. كقيمة م معامل التحديد المعدلينمو بشكل أبطأ من المعتاد ، ومن الواضح أنه فقط عندما يكون R 2 = 1. يمكن أن يأخذ القيم السالبة.
لقد ثبت أن الزيادة مع إضافة متغير توضيحي جديد إذا وفقط إذا كانت إحصائية t الخاصة بهذا المتغير أكبر من واحد. لذلك ، تتم إضافة متغيرات توضيحية جديدة إلى النموذج طالما أن معامل التحديد المعدل ينمو.
يوصى ، بعد التحقق من الجودة الكلية لمعادلة الانحدار ، بتحليل أهميتها الإحصائية. لهذا ، يتم استخدام إحصاء F:
المؤشرات Fو R2يساوي أو لا يساوي الصفر في نفس الوقت. اذا كان F = 0، ثم R 2 \ u003d 0 ، وبالتالي القيمة صمستقل خطيًا عن × 1 ، × 2 ، ... ، × م.القيمة المحسوبة Fمقارنة بالحرجة Fcr. Fcr، بناءً على مستوى الأهمية المطلوب α وأعداد درجات الحرية الخامس 1 = مو الخامس 2 \ u003d ن - م - 1، على أساس توزيع فيشر. اذا كان F> Fcr، ومن بعد R2ذات دلالة إحصائية.

الغرض: معرفة كيفية تحديد معاملات معادلة الانحدار الخطي المتعدد بطريقة المربعات الصغرى وتحليل المعادلة المركبة.

القواعد الارشادية

كل شيء في هذا الفصل مهم. قبل الدراسة ، من الضروري مراجعة المواد التالية من تحليل المصفوفة: ضرب المصفوفة ، معكوس المصفوفة ، حل نظام المعادلات الخطية بالطريقة مصفوفة معكوسة. في هذا الفصل ، يتم تعميم كل ما يتعلق بالانحدار الخطي الزوجي على النموذج الخطي المتعدد. الفصل الأول يوضح وظائف البرنامج مايكروسوفت أوفيسبرنامج Excel يسمح لك بإجراء عمليات باستخدام المصفوفات. لاحظ أنه ، مقارنة بالفصل السابق ، يعد غياب العلاقة الخطية المتعددة (علاقة خطية قوية) لهذه المتغيرات مهمًا لتحديد المعنى الاجتماعي والاقتصادي لمعاملات المتغيرات التفسيرية. تذكر أن صيغة حساب معاملات المعادلة تأتي أيضًا من تطبيق طريقة المربعات الصغرى. يجب عليك دراسة المثال أدناه. انتبه لعلاقة النموذج في المتغيرات الأصلية وفي المتغيرات الموحدة.

§ 1. تحديد معاملات معادلة الانحدار

لأي المؤشر الاقتصاديفي أغلب الأحيان ، لا يؤثر عامل واحد ، ولكن هناك عدة عوامل. في هذه الحالة ، بدلاً من التسجيل المزدوج

م (ص س) = و (س) يعتبرالانحدار المتعدد:

x1، x2، ...، xm) = f (x1، x2، ...، xm).

مهمة تقييم العلاقة الإحصائية

المتغيرات

Y و X = (X 1، X 2، ...، X m) تمت صياغتهما بالمثل

بمناسبة الازواج

نوح الانحدار. معادلة الانحدار المتعدد يمكن تمثيلها على النحو التالي:

ص = و (، س) + ε ،

حيث Y و X = (X 1 ، X 2 ، ... ، X m) - متجه للمتغيرات المستقلة (التفسيرية) ؛ β = (β 0 ، β 1 ، β 2 ، ... ، β م) - متجه المعلمات

(يتم تحديدها)؛ ε- خطأ عشوائي(الانحراف) ؛ Y - متغير تابع (موضح). من المفترض أن لهذا تعداد السكانإنها الوظيفة f التي تربط المتغير Y الذي تم التحقيق فيه مع متجه المتغيرات المستقلة

Y و X = (X1، X2، ...، Xm).

فكر في أكثر نماذج الانحدار المتعددة استخدامًا وأبسطها - نموذج الانحدار الخطي المتعدد.

معادلة الانحدار الخطي النظرية لها الشكل:

هنا β = (β 0 ، β 1 ، β 2 ، ... ، β م) هو متجه للأبعاد (م +1) لمعلمات غير معروفة. β ي ، ي = (1 ، 2 ، ... ، م) يسمى j - m نظريا

معامل الانحدار المقشود (معامل الانحدار الجزئي). يميز حساسية Y للتغيير في X j. بمعنى آخر ، يعكس التأثير على الرياضيات الشرطية

يوضح التوقع المنطقي M (Y x 1، x 2، ...، x m) للمتغير التابع Y

قدم المتغير X j أن جميع التفسيرات الأخرى متغيرات النموذجتبقى ثابتة ، β 0 مصطلح مجاني ،

التي تحدد قيمة Y في الحالة التي تكون فيها جميع المتغيرات التوضيحية X j مساوية للصفر.

بعد الاختيار دالة خطيةكنموذج تبعية ، من الضروري تقدير معاملات الانحدار.

يجب أن يكون هناك n ملاحظات لمتجه المتغيرات التوضيحية X = (X 1، X 2، ...، X m) والمتغير التابع Y:

(xi 1، xi 2، ...، xim، yi)، i = 1، 2، ...، n.

لحل مشكلة إيجاد المعلمات β 0، β 1، β 2، ...، β m ، المتباينة بشكل فريد

ن ≥ م + 1. إذا كانت n = m + 1 ، فإن تقديرات معاملات المتجه β

محسوبة بطريقة فريدة.

إذا كان عدد الملاحظات أكبر من الحد الأدنى المطلوب: n> m + 1 ، فهناك حاجة إلى التحسين والتقدير

المعلمات β 0 ، β 1 ، β 2 ، ... ، β m ، التي تعطي الصيغة الأفضل لها

تقريبي للملاحظات المتاحة.

في هذه الحالة ، يتم استدعاء الرقم ν = n - m - 1 عدد درجات الحرية. الطريقة الأكثر شيوعًا لتقدير معلمات معادلة الانحدار الخطي المتعددة هي طريقة التربيع الصغرى(MNK). تذكر أن جوهرها هو تقليل مجموع الانحرافات التربيعية للقيم المرصودة

المتغير التابع Y على قيمه Y التي تم الحصول عليها بواسطة معادلة الانحدار.

لاحظ أن المتطلبات الأساسية للمربعات الصغرى الموضحة مسبقًا تسمح لنا بالتحليل في إطار نموذج الانحدار الخطي الكلاسيكي.

كما في حالة الانحدار الزوجي ، القيم الحقيقيةلا يمكن الحصول على المعلمات β j من العينة. في هذه الحالة ، بدلاً من

تقدر معادلة الانحدار النظري (3.3) بما يسمى ب

بالنظر إلى معادلة الانحدار التجريبية:

ص = b0 + b1 X1 + b2 X2 + ... + bm Xm + e.

ب 0 ، ب 1 ، ... ، ب م - تقديرات نظرية

القيم

β 0 ، β 1 ، ... ، β م

معاملات الانحدار (المعاملات التجريبية

الانحدار ، ه -تقدير الانحراف العشوائي ε). للملاحظات الفردية لدينا:

yi = b0 + b1 xi 1 + b2 xi 2 + ... + bm xim + ei، (i = 1، 2، ...، n) (3.6)

يجب أن تصف المعادلة المقدرة أولاً الاتجاه العام (الاتجاه) للتغير في المتغير التابع Y. في هذه الحالة ، من الضروري أن تكون قادرًا على حساب الانحرافات عن الاتجاه المحدد.

حسب حجم العينة n: (xi 1، xi 2، ...، xim، yi)، i = 1، 2، ...، n

مطلوب تقدير قيم المعلمات β j للمتجه β ، أي لتحديد النموذج المختار (هنا x ij ، j = 1 ، 2 ، ... ، m

قيمة المتغير X j في الملاحظة i).

عندما يتم استيفاء المتطلبات الأساسية لـ LSM فيما يتعلق بالانحرافات العشوائية ε i ، تقدر b 0 ، b 1 ، ... ، b m من المعلمات β 0 ، β 1 ، ... ، β م

الانحدارات الخطية ذات المربعات الصغرى غير متحيزة وفعالة ومتسقة.

بناءً على (3.6) ، الانحراف e i لقيمة y i للمتغير التابع عن قيمة النموذج ˆy i ، المقابلة للمعادلةيتم حساب الانحدار والملاحظة i = 1 ، 2 ، ... ، n ، بواسطة الصيغة:

ei = yi - ˆyi = yi - b0 - b1 xi 1 - b2 xi 2 - ...− bm xim. (3.7)

§ 2. حساب معاملات الانحدار الخطي المتعدد

نقدم بيانات المراقبة والمعاملات المقابلة في شكل مصفوفة.

xn 1

xn 2

× 1 م

x2 م

هنا Y عبارة عن متجه عمود ذو أبعاد n لملاحظات المتغير التابع Y ؛ X هو مصفوفة n × (m + 1) حيث يمثل الصف الأول i = 1 ، 2 ، ... ، n يمثل i- الملاحظة رقم متجه قيم المتغيرات المستقلة X 1 ، X 2 ، ... ، X m ، واحد يتوافق مع متغير مع عضو حر b 0 ؛

(م + 1) معلمات معادلة الانحدار (3.5) ؛

معادلة الانحدار:

أنا = 1

حيث e T \ u003d (e 1، e 2، ...، e n) ، أي الحرف المرتفع T يعني trans-

قدمت المصفوفة.

يمكن إظهار أن الشرط (3.10) مستوفى إذا تم العثور على متجه العمود للمعاملات B بالصيغة:

ب = (XTX) - 1XTY.

هنا X T هي المصفوفة المنقولة إلى المصفوفة X ،

(X T X) - 1 هو معكوس المصفوفة لـ (X T X). العلاقة (3.11)

صالحة لمعادلات الانحدار مع عدد عشوائي م من المتغيرات التوضيحية.

مثال 3.1. دع حجم العرض لسلعة معينة Y للشركة تعتمد خطيًا على السعر X 1 والأجور X 2 للموظفين الذين ينتجون هذه السلعة (الجدول 3.1). دعونا نحدد معاملات معادلة الانحدار الخطي. (هذا يفترض معرفة جبر المصفوفة).

الجدول 3.1

بيانات الانحدار الخطي المتعدد

تبدو المصفوفات كما يلي:

X T X = 318

7, 310816

− 0, 10049

− 0, 53537

−1

0, 001593

، (XTX)

= − 0, 10049

− 0, 006644,

− 0, 53537

− 0, 006644

0, 043213

X T Y = 23818 ،