السير الذاتية صفات التحليلات

مقاييس التشتت. حساب المجموعة ، بين المجموعات والتباين الكلي (وفقًا لقاعدة إضافة الفروق)

للبيانات المجمعة التشتت المتبقي- متوسط ​​التشتت داخل المجموعة:

حيث σ 2 j هو التباين داخل المجموعة للمجموعة j.

للبيانات غير المبوبة التشتت المتبقيهو مقياس لدقة التقريب ، أي تقريب خط الانحدار إلى البيانات الأصلية:
حيث y (t) هو التنبؤ وفقًا لمعادلة الاتجاه ؛ y t - سلسلة أولية من الديناميكيات ؛ ن هو عدد النقاط ؛ p هو عدد معاملات معادلة الانحدار (عدد المتغيرات التفسيرية).
في هذا المثال يسمى تقدير غير متحيز للتباين.

مثال 1. يتميز توزيع عمال ثلاث مؤسسات تابعة لنقابة واحدة حسب فئات التعريفة بالبيانات التالية:

فئة أجر العاملعدد العاملين في المنشأة
المؤسسة 1المؤسسة 2المؤسسة 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

حدد:
1. التشتت لكل مشروع (التشتت داخل المجموعة) ؛
2. متوسط ​​التشتت داخل المجموعة.
3. التشتت بين المجموعات.
4. مجموع التباين.

المحلول.
قبل الشروع في حل المشكلة ، من الضروري معرفة الميزة الفعالة وأيها عاملي. في المثال قيد النظر ، الميزة الفعالة هي "فئة التعريفة" ، وميزة العامل هي "رقم (اسم) المؤسسة".
ثم لدينا ثلاث مجموعات (مؤسسات) والتي من الضروري حساب متوسط ​​المجموعة والتباينات داخل المجموعة:


شركةمتوسط ​​المجموعة ،التباين داخل المجموعة ،
1 4 1,8

متوسط ​​الفروق داخل المجموعة ( التشتت المتبقي) محسوبة بالصيغة:


حيث يمكنك حساب:
أو:


ومن بعد:
سيكون التشتت الكلي مساوياً لـ: s 2 \ u003d 1.6 + 0 \ u003d 1.6.
يمكن أيضًا حساب التباين الإجمالي باستخدام إحدى الصيغتين التاليتين:

عند حل المشكلات العملية ، غالبًا ما يتعين على المرء التعامل مع علامة تأخذ قيمتين بديلتين فقط. في هذه الحالة ، لا يتحدثون عن وزن قيمة معينة للميزة ، ولكن عن حصتها في الإجمالي. إذا تم الإشارة إلى نسبة الوحدات السكانية التي تحتوي على السمة قيد الدراسة بـ " ص"، وعدم امتلاك - من خلال" ف"، ثم يمكن حساب التشتت بالصيغة:
ق 2 = ص × ف

المثال رقم 2. وفقًا للبيانات الخاصة بتطوير ستة عمال من اللواء ، حدد التباين بين المجموعات وقم بتقييم تأثير وردية العمل على إنتاجية العمل الخاصة بهم إذا كان التباين الكلي هو 12.2.

رقم لواء العملإخراج العمل ، أجهزة الكمبيوتر.
في النوبة الأولىفي الوردية الثانية
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

المحلول. بيانات أولية

Xو 1f2و 3f4f5و 6المجموع
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
المجموع 31 33 37 37 40 38

ثم لدينا 6 مجموعات من الضروري حساب متوسط ​​المجموعة والتباينات داخل المجموعة.
1. أوجد متوسط ​​قيم كل مجموعة.







2. أوجد متوسط ​​مربع كل مجموعة.







نلخص نتائج الحساب في جدول:
رقم المجموعةمتوسط ​​المجموعةالتباين داخل المجموعة
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. التباين داخل المجموعةيميز تغيير (تباين) السمة المدروسة (الناتجة) داخل المجموعة تحت تأثير جميع العوامل ، باستثناء العامل الكامن وراء التجميع:
نحسب متوسط ​​التشتت داخل المجموعة باستخدام الصيغة:


4. التباين بين المجموعاتيميز التغيير (التباين) للسمة المدروسة (الناتجة) تحت تأثير عامل (سمة عاملية) الكامن وراء التجميع.
يتم تعريف التشتت بين المجموعات على النحو التالي:

أين


ثم

التباين الكلييميز التغيير (الاختلاف) في السمة المدروسة (الناتجة) تحت تأثير جميع العوامل (السمات العاملية) دون استثناء. حسب حالة المشكلة ، فهي تساوي 12.2.
علاقة الارتباط التجريبيةيقيس مقدار التذبذب الكلي للخاصية الناتجة الناجم عن العامل المدروس. هذه هي نسبة التباين العامل إلى التباين الكلي:

نحدد علاقة الارتباط التجريبية:

يمكن أن تكون العلاقات بين الميزات ضعيفة أو قوية (قريبة). يتم تقييم معاييرهم على مقياس تشادوك:
0.1 0.3 0.5 0.7 0.9 في مثالنا ، العلاقة بين السمة Y العامل X ضعيفة
معامل التحديد.

دعنا نحدد معامل التحديد:

وبالتالي ، فإن 0.67٪ من التباين يرجع إلى الاختلافات بين السمات ، و 99.37٪ بسبب عوامل أخرى.
استنتاج: في هذه الحالة ، لا يعتمد ناتج العمال على العمل في وردية معينة ، أي إن تأثير وردية العمل على إنتاجية عملهم ليس كبيرًا ويعود إلى عوامل أخرى.

المثال رقم 3. بناءً على بيانات متوسط ​​الأجر والانحرافات التربيعية عن قيمته لمجموعتين من العمال ، أوجد التباين الكلي بتطبيق قاعدة إضافة التباين:

المحلول:
متوسط ​​الفروق داخل المجموعة

يتم تعريف التشتت بين المجموعات على النحو التالي:


سيكون التباين الكلي: 480 + 13824 = 14304

تصف هذه الصفحة مثالًا قياسيًا للعثور على التباين ، ويمكنك أيضًا إلقاء نظرة على المهام الأخرى للعثور عليه

مثال 1. تحديد المجموعة ، ومتوسط ​​المجموعة ، والتباين الكلي بين المجموعة

مثال 2. إيجاد التباين ومعامل التباين في جدول تجميع

مثال 3. إيجاد التباين في سلسلة منفصلة

مثال 4. لدينا البيانات التالية لمجموعة مكونة من 20 طالبًا بالمراسلة. من الضروري إنشاء سلسلة فاصلة لتوزيع الميزات ، وحساب القيمة المتوسطة للميزة ودراسة تباينها

دعونا نبني مجموعة الفترات. دعنا نحدد نطاق الفترة الزمنية بالصيغة:

حيث X max هي القيمة القصوى لميزة التجميع ؛
X min هي القيمة الدنيا لميزة التجميع ؛
n هو عدد الفواصل الزمنية:

نحن نقبل n = 5. الخطوة هي: h \ u003d (192-159) / 5 \ u003d 6.6

لنقم بتجميع الفترات

لمزيد من العمليات الحسابية ، سنقوم ببناء جدول إضافي:

X "i - منتصف الفاصل الزمني. (على سبيل المثال ، منتصف الفترة 159 - 165.6 \ u003d 162.3)

يتم تحديد متوسط ​​نمو الطلاب من خلال معادلة المتوسط ​​الحسابي المرجح:

نحدد التشتت بالصيغة:

يمكن تحويل الصيغة على النحو التالي:

من هذه الصيغة يتبع ذلك الفرق هو الفرق بين متوسط ​​مربعات الخيارات والمربع والمتوسط.

التباين في سلسلة التباينمع فترات متساوية وفقًا لطريقة اللحظات يمكن حسابها بالطريقة التالية باستخدام خاصية التشتت الثانية (قسمة جميع الخيارات على قيمة الفاصل الزمني). تعريف التباين، محسوبة بطريقة اللحظات ، وفقًا للصيغة التالية ، فهي تستغرق وقتًا أقل:

أين أنا هي قيمة الفاصل الزمني ؛
أ - الصفر المشروط ، وهو مناسب لاستخدام منتصف الفاصل الزمني بأعلى تردد ؛
m1 هو مربع اللحظة من الدرجة الأولى ؛
m2 - لحظة من الدرجة الثانية

تباين الميزة (إذا تغيرت السمة في المجتمع الإحصائي بحيث لا يوجد سوى خيارين متنافيين ، فإن هذا التباين يسمى بديل) يمكن حسابه بواسطة الصيغة:

بالتعويض في صيغة التشتت هذه q = 1- p ، نحصل على:

أنواع التشتت

التباين الكلييقيس تباين سمة على السكان ككل تحت تأثير جميع العوامل التي تسبب هذا الاختلاف. إنه يساوي متوسط ​​مربع انحرافات القيم الفردية للسمة x من إجمالي متوسط ​​القيمة x ويمكن تعريفه على أنه تباين بسيط أو تباين مرجح.

التباين داخل المجموعة يميز الاختلاف العشوائي ، أي جزء من التباين ، والذي يرجع إلى تأثير العوامل غير المحسوبة ولا يعتمد على عامل الإشارة الكامن وراء التجميع. هذا التباين يساوي متوسط ​​مربع انحرافات القيم الفردية للسمة داخل المجموعة X عن المتوسط ​​الحسابي للمجموعة ويمكن حسابه كتباين بسيط أو تباين مرجح.



في هذا الطريق، مقاييس التباين داخل المجموعةتباين سمة داخل مجموعة وتحددها الصيغة:

حيث xi - متوسط ​​المجموعة ؛
ni هو عدد الوحدات في المجموعة.

على سبيل المثال ، تظهر الفروق داخل المجموعة التي يجب تحديدها في مهمة دراسة تأثير مؤهلات العمال على مستوى إنتاجية العمل في متجر الاختلافات في الإنتاج في كل مجموعة بسبب جميع العوامل الممكنة (الحالة الفنية للمعدات ، توافر الأدوات والمواد ، وعمر العمال ، وكثافة العمالة ، وما إلى ذلك) ، باستثناء الاختلافات في فئة المؤهلات (داخل المجموعة ، جميع العمال لديهم نفس المؤهلات).

التوقع والتباين الرياضي هما أكثر الخصائص الرقمية استخدامًا للمتغير العشوائي. وهي تميز أهم سمات التوزيع: موقعه ودرجة تشتته. في العديد من مشاكل الممارسة ، لا يمكن الحصول على وصف كامل وشامل لمتغير عشوائي - قانون التوزيع - على الإطلاق ، أو أنه ليس ضروريًا على الإطلاق. في هذه الحالات ، تقتصر على وصف تقريبي لمتغير عشوائي باستخدام الخصائص العددية.

غالبًا ما يشار إلى التوقع الرياضي ببساطة على أنه متوسط ​​قيمة متغير عشوائي. تشتت المتغير العشوائي هو خاصية تشتت متغير عشوائي حول توقعه الرياضي.

التوقع الرياضي لمتغير عشوائي منفصل

دعونا نقترب من مفهوم التوقع الرياضي ، أولاً من التفسير الميكانيكي لتوزيع متغير عشوائي منفصل. دع كتلة الوحدة توزع بين نقاط المحور السيني x1 , x 2 , ..., xن، ولكل نقطة مادية كتلة مناظرة لها ص1 , ص 2 , ..., صن. من الضروري اختيار نقطة واحدة على المحور السيني ، والتي تحدد موضع نظام النقاط المادية بالكامل ، مع مراعاة كتلها. من الطبيعي أن نأخذ مركز كتلة نظام النقاط المادية كنقطة كهذه. هذا هو المتوسط ​​المرجح للمتغير العشوائي X، حيث يوجد حد أقصى لكل نقطة xأنايدخل "بوزن" يساوي الاحتمال المقابل. وهكذا تم الحصول على متوسط ​​قيمة المتغير العشوائي Xيسمى توقعه الرياضي.

التوقع الرياضي للمتغير العشوائي المنفصل هو مجموع منتجات جميع قيمه المحتملة واحتمالات هذه القيم:

مثال 1نظمت يانصيب الفوز. هناك 1000 ربح ، 400 منها 10 روبل لكل منها. 300 - 20 روبل لكل منهما 200-100 روبل لكل منهما. و 100 - 200 روبل لكل منهما. ما هو متوسط ​​أرباح الشخص الذي يشتري تذكرة واحدة؟

المحلول. سنجد متوسط ​​الفوز إذا تم تقسيم المبلغ الإجمالي للمكاسب ، والذي يساوي 10 * 400 + 20 * 300 + 100 * 200 + 200 * 100 = 50000 روبل ، على 1000 (المبلغ الإجمالي للمكاسب). ثم نحصل على 50000/1000 = 50 روبل. ولكن يمكن أيضًا تمثيل التعبير الخاص بحساب متوسط ​​الربح بالشكل التالي:

من ناحية أخرى ، في ظل هذه الظروف ، يكون مقدار المكاسب متغيرًا عشوائيًا يمكن أن يأخذ قيم 10 و 20 و 100 و 200 روبل. باحتمالات تساوي 0.4 على التوالي ؛ 0.3 ؛ 0.2 ؛ 0.1. لذلك ، فإن متوسط ​​العائد المتوقع يساوي مجموع المنتجات بحجم المكاسب واحتمال الحصول عليها.

مثال 2قرر الناشر نشر كتاب جديد. سيبيع الكتاب مقابل 280 روبل ، منها 200 روبل ، و 50 إلى المكتبة ، و 30 للمؤلف. يقدم الجدول معلومات حول تكلفة نشر الكتاب واحتمالية بيع عدد معين من نسخ الكتاب.

ابحث عن الربح المتوقع للناشر.

المحلول. المتغير العشوائي "الربح" يساوي الفرق بين الدخل من البيع وتكلفة التكاليف. على سبيل المثال ، إذا تم بيع 500 نسخة من كتاب ، فإن الدخل من البيع هو 200 * 500 = 100000 ، وتكلفة النشر 225000 روبل. وبالتالي ، يواجه الناشر خسارة 125000 روبل. يلخص الجدول التالي القيم المتوقعة للمتغير العشوائي - الربح:

رقمربح xأنا احتمالا صأنا xأنا صأنا
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
المجموع: 1,00 25000

وبالتالي ، نحصل على التوقع الرياضي لأرباح الناشر:

.

مثال 3فرصة لضرب طلقة واحدة ص= 0.2. حدد استهلاك الأصداف التي توفر توقعًا رياضيًا لعدد الزيارات التي تساوي 5.

المحلول. من نفس صيغة التوقع التي استخدمناها حتى الآن ، نعبر عنها x- استهلاك القذائف:

.

مثال 4تحديد التوقع الرياضي لمتغير عشوائي xعدد الضربات بثلاث طلقات ، إذا كان احتمال الضربات مع كل طلقة ص = 0,4 .

تلميح: أوجد احتمالية قيم متغير عشوائي بواسطة صيغة برنولي .

خصائص التوقع

تأمل في خصائص التوقع الرياضي.

خاصية 1.التوقع الرياضي للقيمة الثابتة يساوي هذا الثابت:

خاصية 2.يمكن إخراج العامل الثابت من علامة التوقع:

الملكية 3.التوقع الرياضي لمجموع (فرق) المتغيرات العشوائية يساوي مجموع (فرق) توقعاتهم الرياضية:

الملكية 4.التوقع الرياضي لمنتج المتغيرات العشوائية يساوي ناتج توقعاتهم الرياضية:

الملكية 5.إذا كانت جميع قيم المتغير العشوائي Xإنقاص (زيادة) بنفس العدد من، ثم سينخفض ​​توقعه الرياضي (يزداد) بنفس العدد:

عندما لا يمكنك أن تقتصر فقط على التوقعات الرياضية

في معظم الحالات ، لا يمكن إلا للتوقع الرياضي أن يميز متغيرًا عشوائيًا بشكل مناسب.

دع المتغيرات العشوائية Xو صيتم تقديمها بموجب قوانين التوزيع التالية:

المعنى X احتمالا
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
المعنى ص احتمالا
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

التوقعات الرياضية لهذه الكميات هي نفسها - تساوي الصفر:

ومع ذلك ، فإن توزيعها مختلف. قيمة عشوائية Xيمكن أن تأخذ فقط قيمًا تختلف قليلاً عن التوقع الرياضي والمتغير العشوائي صيمكن أن تأخذ قيمًا تنحرف بشكل كبير عن التوقع الرياضي. مثال مشابه: متوسط ​​الأجر لا يجعل من الممكن الحكم على نسبة العمال ذوي الأجور المرتفعة والمنخفضة. بعبارة أخرى ، من خلال التوقع الرياضي ، لا يمكن للمرء أن يحكم على الانحرافات الممكنة عنه ، على الأقل في المتوسط. للقيام بذلك ، تحتاج إلى إيجاد تباين المتغير العشوائي.

تشتت متغير عشوائي منفصل

تشتتالمتغير العشوائي المنفصل Xيسمى التوقع الرياضي لمربع انحرافه عن التوقع الرياضي:

الانحراف المعياري لمتغير عشوائي Xهي القيمة الحسابية للجذر التربيعي لتباينها:

.

مثال 5حساب الفروق والانحرافات المعيارية للمتغيرات العشوائية Xو ص، التي ترد قوانين التوزيع الخاصة بها في الجداول أعلاه.

المحلول. التوقعات الرياضية للمتغيرات العشوائية Xو ص، كما هو موضح أعلاه ، تساوي الصفر. وفقًا لصيغة التشتت لـ ه(X)=ه(ذ) = 0 نحصل على:

ثم الانحرافات المعيارية للمتغيرات العشوائية Xو صتشكل

.

وهكذا ، مع نفس التوقعات الرياضية ، تباين المتغير العشوائي Xصغير جدًا وعشوائي ص- هام. هذا نتيجة للاختلاف في توزيعها.

مثال 6المستثمر لديه 4 مشاريع استثمارية بديلة. يلخص الجدول البيانات الخاصة بالربح المتوقع في هذه المشاريع مع الاحتمال المقابل.

مشروع 1المشروع 2المشروع 3المشروع 4
500, ص=1 1000, ص=0,5 500, ص=0,5 500, ص=0,5
0, ص=0,5 1000, ص=0,25 10500, ص=0,25
0, ص=0,25 9500, ص=0,25

ابحث عن التوقع الرياضي والتباين والانحراف المعياري لكل بديل.

المحلول. دعونا نوضح كيف يتم حساب هذه الكميات للبديل الثالث:

يلخص الجدول القيم التي تم العثور عليها لجميع البدائل.

جميع البدائل لها نفس التوقعات الرياضية. هذا يعني أن كل شخص يحصل على نفس الدخل على المدى الطويل. يمكن تفسير الانحراف المعياري على أنه مقياس للمخاطر - فكلما زاد حجمه ، زادت مخاطر الاستثمار. المستثمر الذي لا يريد الكثير من المخاطرة سيختار المشروع 1 لأنه يحتوي على أصغر انحراف معياري (0). إذا كان المستثمر يفضل المخاطرة والعوائد المرتفعة في فترة قصيرة ، فسيختار المشروع الذي يحتوي على أكبر انحراف معياري - المشروع 4.

خصائص التشتت

دعونا نقدم خصائص التشتت.

خاصية 1.تشتت قيمة ثابتة صفر:

خاصية 2.يمكن إخراج العامل الثابت من علامة التشتت بتربيعها:

.

الملكية 3.يساوي التباين في المتغير العشوائي التوقع الرياضي لمربع هذه القيمة ، والذي يُطرح منه مربع التوقع الرياضي للقيمة نفسها:

,

أين .

الملكية 4.التباين في مجموع (فرق) المتغيرات العشوائية يساوي مجموع (فرق) الفروق الخاصة بهم:

مثال 7من المعروف أن متغير عشوائي منفصل Xتأخذ قيمتين فقط: 3 و 7. بالإضافة إلى ذلك ، فإن التوقع الرياضي معروف: ه(X) = 4. أوجد تباين المتغير العشوائي المنفصل.

المحلول. للدلالة به صالاحتمالية التي يأخذ بها المتغير العشوائي قيمة x1 = −3 . ثم احتمالية القيمة x2 = 7 سيكون 1 - ص. لنشتق معادلة التوقع الرياضي:

ه(X) = x 1 ص + x 2 (1 − ص) = −3ص + 7(1 − ص) = 4 ,

من أين نحصل على الاحتمالات: ص= 0.3 و 1 - ص = 0,7 .

قانون توزيع المتغير العشوائي:

X −3 7
ص 0,3 0,7

نحسب تباين هذا المتغير العشوائي باستخدام الصيغة من الخاصية 3 للتباين:

د(X) = 2,7 + 34,3 − 16 = 21 .

ابحث عن التوقع الرياضي لمتغير عشوائي بنفسك ، ثم انظر إلى الحل

المثال 8المتغير العشوائي المنفصل Xيأخذ قيمتين فقط. يأخذ القيمة الأكبر 3 مع احتمال 0.4. بالإضافة إلى ذلك ، فإن تباين المتغير العشوائي معروف د(X) = 6. أوجد التوقع الرياضي لمتغير عشوائي.

المثال 9تحتوي الجرة على 6 كرات بيضاء و 4 كرات سوداء. 3 كرات مأخوذة من الجرة. عدد الكرات البيضاء بين الكرات المسحوبة هو متغير عشوائي منفصل X. أوجد التوقع الرياضي والتباين لهذا المتغير العشوائي.

المحلول. قيمة عشوائية Xيمكن أن تأخذ القيم 0 ، 1 ، 2 ، 3. يمكن حساب الاحتمالات المقابلة من قاعدة ضرب الاحتمالات. قانون توزيع المتغير العشوائي:

X 0 1 2 3
ص 1/30 3/10 1/2 1/6

ومن هنا جاء التوقع الرياضي لهذا المتغير العشوائي:

م(X) = 3/10 + 1 + 1/2 = 1,8 .

تباين متغير عشوائي معين هو:

د(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

التوقع الرياضي والتشتت لمتغير عشوائي مستمر

بالنسبة للمتغير العشوائي المستمر ، سيحتفظ التفسير الميكانيكي للتوقع الرياضي بنفس المعنى: مركز الكتلة لوحدة الكتلة الموزعة بشكل مستمر على المحور السيني بكثافة F(x). على النقيض من المتغير العشوائي المنفصل ، والذي تستخدم فيه وسيطة الوظيفة xأنايتغير فجأة ، لمتغير عشوائي مستمر ، تتغير الوسيطة باستمرار. لكن التوقع الرياضي لمتغير عشوائي مستمر يرتبط أيضًا بقيمته المتوسطة.

لإيجاد التوقع الرياضي والتباين لمتغير عشوائي مستمر ، تحتاج إلى إيجاد تكاملات محددة . إذا تم إعطاء دالة كثافة لمتغير عشوائي مستمر ، فإنها تدخل مباشرة في التكامل. إذا تم إعطاء دالة توزيع احتمالية ، فعند تمييزها ، تحتاج إلى إيجاد دالة الكثافة.

يُطلق على المتوسط ​​الحسابي لجميع القيم الممكنة لمتغير عشوائي مستمر اسمها توقع رياضي، يُشار إليها بواسطة أو.

تشتت المتغير العشوائي هو مقياس لانتشار قيم هذا المتغير. يعني التباين الصغير أن القيم مجمعة بالقرب من بعضها البعض. يشير التباين الكبير إلى تشتت قوي للقيم. يستخدم مفهوم تشتت المتغير العشوائي في الإحصاء. على سبيل المثال ، إذا قارنت تباين قيم كميتين (مثل نتائج ملاحظات المرضى الذكور والإناث) ، يمكنك اختبار أهمية بعض المتغيرات. يستخدم التباين أيضًا عند بناء النماذج الإحصائية ، حيث يمكن أن يكون التباين الصغير علامة على أنك تقوم بتخصيص القيم.

خطوات

نموذج حساب التباين

  1. سجل قيم العينة.في معظم الحالات ، تتوفر فقط عينات من مجموعات سكانية معينة للإحصائيين. على سبيل المثال ، كقاعدة عامة ، لا يحلل الإحصائيون تكلفة الحفاظ على عدد سكان جميع السيارات في روسيا - فهم يحللون عينة عشوائية من عدة آلاف من السيارات. ستساعد هذه العينة في تحديد متوسط ​​التكلفة لكل سيارة ، ولكن على الأرجح ، ستكون القيمة الناتجة بعيدة عن القيمة الحقيقية.

    • على سبيل المثال ، دعنا نحلل عدد الكعك المباع في المقهى في 6 أيام ، بترتيب عشوائي. تحتوي العينة على الشكل التالي: 17 ، 15 ، 23 ، 7 ، 9 ، 13. هذه عينة وليست مجموعة سكانية ، لأننا لا نملك بيانات عن الكعك المباع لكل يوم يفتح فيه المقهى.
    • إذا تم إعطاؤك مجتمعًا وليس عينة من القيم ، فانتقل إلى القسم التالي.
  2. اكتب معادلة حساب تباين العينة.التشتت هو مقياس لانتشار قيم بعض الكمية. كلما اقتربت قيمة التشتت من الصفر ، كلما اقترب تجميع القيم معًا. عند العمل باستخدام عينة من القيم ، استخدم الصيغة التالية لحساب التباين:

    • ث 2 (displaystyle s ^ (2)) = ∑[(س i (displaystyle x_ (i))-x̅) 2 (displaystyle ^ (2))] / (ن - 1)
    • ث 2 (displaystyle s ^ (2))هو التشتت. يقاس التشتت بالوحدات المربعة.
    • س i (displaystyle x_ (i))- كل قيمة في العينة.
    • س i (displaystyle x_ (i))عليك أن تطرح x̅ وتربيعها ثم تضيف النتائج.
    • x̅ - متوسط ​​العينة (متوسط ​​العينة).
    • n هو عدد القيم في العينة.
  3. احسب متوسط ​​العينة.يشار إليه على أنه x̅. يتم حساب متوسط ​​العينة كمتوسط ​​حسابي عادي: اجمع جميع القيم في العينة ، ثم اقسم النتيجة على عدد القيم في العينة.

    • في مثالنا ، أضف القيم الموجودة في العينة: 15 + 17 + 23 + 7 + 9 + 13 = 84
      الآن قسّم النتيجة على عدد القيم في العينة (في مثالنا هناك 6): 84 6 = 14.
      متوسط ​​العينة x̅ = 14.
    • متوسط ​​العينة هو القيمة المركزية التي يتم حولها توزيع القيم في العينة. إذا كانت القيم في مجموعة العينة حول متوسط ​​العينة ، يكون التباين صغيرًا ؛ خلاف ذلك ، فإن التشتت كبير.
  4. اطرح متوسط ​​العينة من كل قيمة في العينة.الآن احسب الفرق س i (displaystyle x_ (i))- x̅ ، أين س i (displaystyle x_ (i))- كل قيمة في العينة. تشير كل نتيجة تم الحصول عليها إلى مدى انحراف قيمة معينة عن متوسط ​​العينة ، أي مدى بُعد هذه القيمة عن متوسط ​​العينة.

    • في مثالنا:
      x 1 (displaystyle x_ (1))- س̅ = 17-14 = 3
      x 2 (displaystyle x_ (2))- س̅ = 15-14 = 1
      x 3 (displaystyle x_ (3))- س̅ = 23-14 = 9
      x 4 (\ displaystyle x_ (4))- س̅ = 7-14 = -7
      x 5 (displaystyle x_ (5))- س̅ = 9-14 = -5
      x 6 (\ displaystyle x_ (6))- س̅ = 13-14 = -1
    • من السهل التحقق من صحة النتائج التي تم الحصول عليها ، حيث يجب أن يكون مجموعها مساويًا للصفر. يرتبط هذا بتحديد متوسط ​​القيمة ، نظرًا لأن القيم السالبة (المسافات من متوسط ​​القيمة إلى القيم الأصغر) يتم تعويضها تمامًا بالقيم الموجبة (المسافات من متوسط ​​القيمة إلى القيم الأكبر).
  5. كما هو مذكور أعلاه ، مجموع الاختلافات س i (displaystyle x_ (i))- يجب أن تكون x̅ مساوية للصفر. هذا يعني أن متوسط ​​التباين هو دائمًا صفر ، وهذا لا يعطي أي فكرة عن انتشار قيم بعض الكمية. لحل هذه المشكلة ، قم بتربيع كل فرق س i (displaystyle x_ (i))- x̅. سيؤدي ذلك إلى حصولك على أرقام موجبة فقط والتي ، عند جمعها معًا ، لن تضيف أبدًا ما يصل إلى 0.

    • في مثالنا:
      (x 1 (displaystyle x_ (1))-x̅) 2 = 3 2 = 9 (\ displaystyle ^ (2) = 3 ^ (2) = 9)
      (x 2 (displaystyle (x_ (2))-x̅) 2 = 1 2 = 1 (\ displaystyle ^ (2) = 1 ^ (2) = 1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • لقد وجدت مربع الفرق - x̅) 2 (displaystyle ^ (2))لكل قيمة في العينة.
  6. احسب مجموع تربيع الفروق.بمعنى ، ابحث عن جزء الصيغة المكتوب على النحو التالي: ∑ [( س i (displaystyle x_ (i))-x̅) 2 (displaystyle ^ (2))]. هنا العلامة Σ تعني مجموع تربيع الفروق لكل قيمة س i (displaystyle x_ (i))في العينة. لقد وجدت بالفعل الفروق التربيعية (x i (\ displaystyle (x_ (i))-x̅) 2 (displaystyle ^ (2))لكل قيمة س i (displaystyle x_ (i))في العينة الآن فقط أضف هذه المربعات.

    • في مثالنا: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. قسّم النتيجة على n - 1 ، حيث n هي عدد القيم في العينة.منذ بعض الوقت ، لحساب تباين العينة ، قسّم الإحصائيون النتيجة ببساطة على n ؛ في هذه الحالة ، ستحصل على متوسط ​​التباين التربيعي ، وهو مثالي لوصف التباين لعينة معينة. لكن تذكر أن أي عينة ليست سوى جزء صغير من مجموعة القيم العامة. إذا أخذت عينة مختلفة وقمت بنفس الحسابات ، فستحصل على نتيجة مختلفة. كما اتضح ، فإن القسمة على n - 1 (بدلاً من n فقط) تعطي تقديرًا أفضل للتباين السكاني ، وهو ما تبحث عنه. أصبحت القسمة على n - 1 شائعة ، لذلك تم تضمينها في معادلة حساب تباين العينة.

    • في مثالنا ، تشتمل العينة على 6 قيم ، أي ن = 6.
      تباين العينة = الصورة 2 = 166 6 - 1 = (displaystyle s ^ (2) = (frac (166) (6-1)) =) 33,2
  8. الفرق بين التباين والانحراف المعياري.لاحظ أن الصيغة تحتوي على الأس ، لذلك يتم قياس التباين بالوحدات المربعة للقيمة التي تم تحليلها. في بعض الأحيان يكون من الصعب جدًا تشغيل هذه القيمة ؛ في مثل هذه الحالات ، يتم استخدام الانحراف المعياري ، والذي يساوي الجذر التربيعي للتباين. هذا هو السبب في أن تباين العينة يشار إليه على أنه ث 2 (displaystyle s ^ (2))، والانحراف المعياري للعينة مثل ث (displaystyle s).

    • في مثالنا ، نموذج الانحراف المعياري هو: s = √33.2 = 5.76.

    حساب التباين السكاني

    1. حلل مجموعة من القيم.تتضمن المجموعة جميع قيم الكمية قيد النظر. على سبيل المثال ، إذا كنت تدرس عمر سكان منطقة لينينغراد ، فإن السكان يشملون عمر جميع سكان هذه المنطقة. في حالة العمل بمجموع ، يوصى بإنشاء جدول وإدخال قيم التجميع فيه. خذ بعين الاعتبار المثال التالي:

      • يوجد 6 أحواض مائية في غرفة معينة. يحتوي كل حوض مائي على العدد التالي من الأسماك:
        س 1 = 5 (displaystyle x_ (1) = 5)
        س 2 = 5 (displaystyle x_ (2) = 5)
        س 3 = 8 (displaystyle x_ (3) = 8)
        س 4 = 12 (displaystyle x_ (4) = 12)
        س 5 = 15 (displaystyle x_ (5) = 15)
        س 6 = 18 (displaystyle x_ (6) = 18)
    2. اكتب معادلة حساب تباين السكان.نظرًا لأن المحتوى يتضمن جميع قيم كمية معينة ، تسمح لك الصيغة التالية بالحصول على القيمة الدقيقة لتباين المحتوى. للتمييز بين تباين المجتمع وتباين العينة (وهو مجرد تقدير) ، يستخدم الإحصائيون متغيرات مختلفة:

      • σ 2 (displaystyle ^ (2)) = (∑(س i (displaystyle x_ (i)) - μ) 2 (displaystyle ^ (2))) / ن
      • σ 2 (displaystyle ^ (2))- التباين السكاني (يقرأ ب "سيغما تربيع"). يقاس التشتت بالوحدات المربعة.
      • س i (displaystyle x_ (i))- كل قيمة في المجموع.
      • Σ هي علامة المجموع. هذا هو ، لكل قيمة س i (displaystyle x_ (i))اطرح μ ، وقم بتربيعها ، ثم اجمع النتائج.
      • μ هو متوسط ​​السكان.
      • n هو عدد القيم في عموم السكان.
    3. احسب متوسط ​​السكان.عند العمل مع عامة السكان ، يُشار إلى متوسط ​​قيمته بـ μ (mu). يُحسب متوسط ​​المحتوى على أنه المتوسط ​​الحسابي المعتاد: اجمع كل القيم في المجتمع ، ثم اقسم النتيجة على عدد القيم في المجتمع.

      • ضع في اعتبارك أن المتوسطات لا تُحسب دائمًا على أنها المتوسط ​​الحسابي.
      • في مثالنا ، يعني السكان: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\ displaystyle (\ frac (5 + 5 + 8 + 12 + 15 + 18) (6))) = 10,5
    4. اطرح متوسط ​​المحتوى من كل قيمة في المجتمع.كلما اقتربت قيمة الفرق من الصفر ، كلما اقتربت القيمة الخاصة من متوسط ​​المحتوى. أوجد الفرق بين كل قيمة في المجتمع ومتوسطها ، وستلقي نظرة أولية على توزيع القيم.

      • في مثالنا:
        x 1 (displaystyle x_ (1))- μ = 5 - 10.5 = -5.5
        x 2 (displaystyle x_ (2))- μ = 5 - 10.5 = -5.5
        x 3 (displaystyle x_ (3))- μ = 8 - 10.5 = -2.5
        x 4 (\ displaystyle x_ (4))- μ = 12 - 10.5 = 1.5
        x 5 (displaystyle x_ (5))- μ = 15 - 10.5 = 4.5
        x 6 (\ displaystyle x_ (6))- μ = 18 - 10.5 = 7.5
    5. ربّع كل نتيجة تحصل عليها.ستكون قيم الفرق موجبة وسالبة ؛ إذا وضعت هذه القيم على خط الأعداد ، فسوف تقع على يمين ويسار وسط السكان. هذا ليس جيدًا لحساب التباين ، لأن الأرقام الموجبة والسالبة تلغي بعضها البعض. لذلك ، قم بتربيع كل فرق للحصول على أرقام موجبة حصريًا.

      • في مثالنا:
        (س i (displaystyle x_ (i)) - μ) 2 (displaystyle ^ (2))لكل قيمة سكانية (من i = 1 إلى i = 6):
        (-5,5)2 (displaystyle ^ (2)) = 30,25
        (-5,5)2 (displaystyle ^ (2))، أين س n (displaystyle x_ (n))هي القيمة الأخيرة في عدد السكان.
      • لحساب متوسط ​​قيمة النتائج التي تم الحصول عليها ، تحتاج إلى إيجاد مجموعها وقسمته على n: (( x 1 (displaystyle x_ (1)) - μ) 2 (displaystyle ^ (2)) + (x 2 (displaystyle x_ (2)) - μ) 2 (displaystyle ^ (2)) + ... + (س n (displaystyle x_ (n)) - μ) 2 (displaystyle ^ (2))) / ن
      • لنكتب الآن الشرح أعلاه باستخدام المتغيرات: (∑ ( س i (displaystyle x_ (i)) - μ) 2 (displaystyle ^ (2))) / n والحصول على صيغة لحساب تباين المحتوى.

التشتت في الإحصاءتم العثور عليها كقيم فردية للميزة في مربع. اعتمادًا على البيانات الأولية ، يتم تحديدها من خلال معادلات التباين البسيطة والمرجحة:

1. (للبيانات غير المبوبة) تحسب بالصيغة:

2. التباين الموزون (لسلسلة التباينات):

أين ن هو التردد (عامل التكرار X)

مثال على إيجاد التباين

تصف هذه الصفحة مثالًا قياسيًا للعثور على التباين ، ويمكنك أيضًا إلقاء نظرة على المهام الأخرى للعثور عليه

مثال 1. لدينا البيانات التالية لمجموعة مكونة من 20 طالبًا بالمراسلة. من الضروري إنشاء سلسلة فاصلة لتوزيع الميزات ، وحساب القيمة المتوسطة للميزة ودراسة تباينها

دعونا نبني مجموعة الفترات. دعنا نحدد نطاق الفترة الزمنية بالصيغة:

حيث X max هي القيمة القصوى لميزة التجميع ؛
X min هي القيمة الدنيا لميزة التجميع ؛
n هو عدد الفواصل الزمنية:

نحن نقبل n = 5. الخطوة هي: h \ u003d (192-159) / 5 \ u003d 6.6

لنقم بتجميع الفترات

لمزيد من العمليات الحسابية ، سنقوم ببناء جدول إضافي:

Xi هو منتصف الفترة الزمنية. (على سبيل المثال ، منتصف الفترة 159 - 165.6 = 162.3)

يتم تحديد متوسط ​​نمو الطلاب من خلال معادلة المتوسط ​​الحسابي المرجح:

نحدد التشتت بالصيغة:

يمكن تحويل صيغة التباين على النحو التالي:

من هذه الصيغة يتبع ذلك الفرق هو الفرق بين متوسط ​​مربعات الخيارات والمربع والمتوسط.

التباين في سلسلة التباينمع فترات متساوية وفقًا لطريقة اللحظات يمكن حسابها بالطريقة التالية باستخدام خاصية التشتت الثانية (قسمة جميع الخيارات على قيمة الفاصل الزمني). تعريف التباين، محسوبة بطريقة اللحظات ، وفقًا للصيغة التالية ، فهي تستغرق وقتًا أقل:

أين أنا هي قيمة الفاصل الزمني ؛
أ - الصفر المشروط ، وهو مناسب لاستخدام منتصف الفاصل الزمني بأعلى تردد ؛
m1 هو مربع اللحظة من الدرجة الأولى ؛
m2 - لحظة من الدرجة الثانية

(إذا تغيرت السمة في المجتمع الإحصائي بحيث لا يوجد سوى خيارين متنافيين ، فإن هذا التباين يسمى بديل) يمكن حسابه بواسطة الصيغة:

بالتعويض في صيغة التشتت هذه q = 1- p ، نحصل على:

أنواع التشتت

التباين الكلييقيس تباين سمة على السكان ككل تحت تأثير جميع العوامل التي تسبب هذا الاختلاف. إنه يساوي متوسط ​​مربع انحرافات القيم الفردية للسمة x من إجمالي متوسط ​​القيمة x ويمكن تعريفه على أنه تباين بسيط أو تباين مرجح.

يميز الاختلاف العشوائي ، أي جزء من التباين ، والذي يرجع إلى تأثير العوامل غير المحسوبة ولا يعتمد على عامل الإشارة الكامن وراء التجميع. هذا التباين يساوي متوسط ​​مربع انحرافات القيم الفردية للسمة داخل المجموعة X عن المتوسط ​​الحسابي للمجموعة ويمكن حسابه كتباين بسيط أو تباين مرجح.

في هذا الطريق، مقاييس التباين داخل المجموعةتباين سمة داخل مجموعة وتحددها الصيغة:

حيث xi - متوسط ​​المجموعة ؛
ni هو عدد الوحدات في المجموعة.

على سبيل المثال ، تظهر الفروق داخل المجموعة التي يجب تحديدها في مهمة دراسة تأثير مؤهلات العمال على مستوى إنتاجية العمل في متجر الاختلافات في الإنتاج في كل مجموعة بسبب جميع العوامل الممكنة (الحالة الفنية للمعدات ، توافر الأدوات والمواد ، وعمر العمال ، وكثافة العمالة ، وما إلى ذلك) ، باستثناء الاختلافات في فئة المؤهلات (داخل المجموعة ، جميع العمال لديهم نفس المؤهلات).

يعكس متوسط ​​الفروق داخل المجموعة العشوائية ، أي ذلك الجزء من التباين الذي حدث تحت تأثير جميع العوامل الأخرى ، باستثناء عامل التجميع. يتم حسابه بالصيغة:

إنه يميز التباين المنهجي للسمة الناتجة ، والذي يرجع إلى تأثير عامل السمة الكامن وراء التجميع. وهو يساوي متوسط ​​مربع انحرافات وسيلة المجموعة عن المتوسط ​​العام. يتم حساب التباين بين المجموعات بالصيغة:

قاعدة إضافة التباين في الإحصاء

وفق قاعدة إضافة التباينإجمالي التباين يساوي مجموع متوسط ​​الفروق بين المجموعات وداخل المجموعات:

معنى هذه القاعدةهو أن التباين الكلي الذي يحدث تحت تأثير جميع العوامل يساوي مجموع الفروق التي تنشأ تحت تأثير جميع العوامل الأخرى ، والتباين الذي ينشأ بسبب عامل التجميع.

باستخدام صيغة إضافة التباينات ، من الممكن تحديد المجهول الثالث من تباينين ​​معروفين ، وأيضًا للحكم على قوة تأثير سمة التجميع.

خصائص التشتت

1. إذا تم تقليل (زيادة) جميع قيم السمة بنفس القيمة الثابتة ، فلن يتغير التباين عن هذا.
2. إذا تم تقليل (زيادة) جميع قيم السمة بنفس عدد مرات n ، فسيقل التباين وفقًا لذلك (زيادة) بمقدار n ^ 2 مرة.