السير الذاتية صفات التحليلات

خصائص التوزيع ذي الحدين. قم بحل المشكلة بنفسك ثم انظر إلى الحل

ضع في اعتبارك التوزيع ذي الحدين ، واحسب توقعاته الرياضية ، والتباين ، والوضع. باستخدام دالة MS EXCEL BINOM.DIST () ، سنرسم دالة التوزيع والرسوم البيانية لكثافة الاحتمال. دعونا نقدر معامل التوزيع p ، والتوقع الرياضي للتوزيع ، والانحراف المعياري. ضع في اعتبارك أيضًا توزيع برنولي.

تعريف. دعهم يعقدون نالاختبارات ، يمكن أن يحدث في كل منها حدثان فقط: حدث "نجاح" مع احتمال ص أو حدث "فشل" مع الاحتمال ف = 1-p (ما يسمى ب مخطط برنولي ،برنوليمحاكمات).

احتمالية الحصول بالضبط x النجاح في هذه ن الاختبارات تساوي:

عدد النجاحات في العينة x هو متغير عشوائي له توزيع ثنائي(إنجليزي) ذات الحدينتوزيع) صو نمعلمات هذا التوزيع.

أذكر ذلك من أجل التقديم مخططات برنوليوفي المقابل توزيع ثنائي،يجب استيفاء الشروط التالية:

  • يجب أن يكون لكل تجربة نتيجتان بالضبط ، يطلق عليهما "نجاح" و "فشل".
  • يجب ألا تعتمد نتيجة كل اختبار على نتائج الاختبارات السابقة (اختبار الاستقلال).
  • معدل النجاح ص يجب أن تكون ثابتة لجميع الاختبارات.

التوزيع ذو الحدين في MS EXCEL

في MS EXCEL ، بدءًا من الإصدار 2010 ، لـ توزيع ثنائيهناك وظيفة BINOM.DIST () ، الاسم الانجليزي- BINOM.DIST () ، والذي يسمح لك بحساب احتمال أن تكون العينة بالضبط X"النجاحات" (أي دالة كثافة الاحتمال p (x) ، انظر الصيغة أعلاه) ، و دالة التوزيع المتكاملة(احتمال وجود العينة xأو أقل "نجاحات" ، بما في ذلك 0).

قبل MS EXCEL 2010 ، كان لدى EXCEL وظيفة BINOMDIST () ، والتي تتيح لك أيضًا حساب دالة التوزيعو كثافة الاحتمالص (خ). تم ترك BINOMDIST () في MS EXCEL 2010 للتوافق.

يحتوي ملف المثال على رسوم بيانية كثافة التوزيع الاحتماليةو .

توزيع ثنائيلديه التعيين ب(ن; ص) .

ملحوظة: للبناء دالة التوزيع المتكاملةنوع مخطط مناسب تمامًا برنامج، إلى عن على كثافة التوزيعرسم بياني مع التجميع. لمزيد من المعلومات حول إنشاء المخططات ، اقرأ مقال الأنواع الرئيسية للمخططات.

ملحوظة: لتسهيل كتابة المعادلات في ملف المثال ، تم إنشاء أسماء للمعلمات توزيع ثنائي: ن و ص.

يُظهر ملف المثال حسابات احتمالية مختلفة باستخدام وظائف MS EXCEL:

كما هو موضح في الصورة أعلاه ، من المفترض أن:

  • تحتوي المجموعة اللانهائية التي تتكون منها العينة على 10٪ (أو 0.1) عناصر جيدة (معلمة ص، وسيطة الوظيفة الثالثة = BINOM.DIST ())
  • لحساب احتمال أن عينة من 10 عناصر (المعلمة ن، الوسيطة الثانية للدالة) سيكون هناك بالضبط 5 عناصر صالحة (الوسيطة الأولى) ، تحتاج إلى كتابة الصيغة: = BINOM.DIST (5، 10، 0.1، FALSE)
  • تم تعيين العنصر الأخير الرابع = FALSE ، أي يتم إرجاع قيمة الوظيفة كثافة التوزيع.

إذا كانت قيمة الوسيطة الرابعة = TRUE ، فتُرجع الدالة BINOM.DIST () القيمة دالة التوزيع المتكاملةأو ببساطة دالة التوزيع. في هذه الحالة ، يمكننا حساب احتمال أن يكون عدد العناصر الجيدة في العينة نطاق معين، على سبيل المثال ، 2 أو أقل (بما في ذلك 0).

للقيام بذلك ، تحتاج إلى كتابة الصيغة:
= قائمة BINOM.DIST (2، 10، 0.1، TRUE)

ملحوظة: للحصول على قيمة غير صحيحة لـ x،. على سبيل المثال ، ستُرجع الصيغ التالية نفس القيمة:
= BINOM.DIST ( 2 ؛ عشرة؛ 0.1 ؛ صحيح)
= BINOM.DIST ( 2,9 ؛ عشرة؛ 0.1 ؛ صحيح)

ملحوظة: في ملف المثال كثافة الاحتمالو دالة التوزيعتم حسابها أيضًا باستخدام التعريف ووظيفة COMBIN ().

مؤشرات التوزيع

في مثال على ورقة مثالتوجد معادلات لحساب بعض مؤشرات التوزيع:

  • = ن * ع ؛
  • (الانحراف المعياري التربيعي) = n * p * (1-p) ؛
  • = (ن + 1) * ص ؛
  • = (1-2 * p) * ROOT (n * p * (1-p)).

نشتق الصيغة توقع رياضي توزيع ثنائياستخدام مخطط برنولي.

بحكم التعريف ، متغير عشوائي X في مخطط برنولي(متغير برنولي العشوائي) له دالة التوزيع:

هذا التوزيع يسمى توزيع برنولي.

ملحوظة: توزيع برنوليحالة خاصة توزيع ثنائيمع المعلمة ن = 1.

دعونا ننشئ 3 مصفوفات من 100 رقم باستخدام احتمالات مختلفةالنجاح: 0.1 ؛ 0.5 و 0.9. للقيام بذلك ، في النافذة جيل أرقام عشوائية تعيين الخيارات التاليةلكل احتمال ص:

ملحوظة: إذا قمت بتعيين الخيار نثر عشوائي (البذور عشوائي) ، ثم يمكنك اختيار ملف مجموعة عشوائيةالأرقام المولدة. على سبيل المثال ، من خلال تعيين هذا الخيار = 25 ، يمكنك إنشاء نفس مجموعات الأرقام العشوائية على أجهزة كمبيوتر مختلفة (إذا كانت ، بالطبع ، معلمات التوزيع الأخرى هي نفسها). يمكن أن تأخذ قيمة الخيار قيم عدد صحيح من 1 إلى 32767. اسم الخيار نثر عشوائييمكن أن تربك. سيكون من الأفضل ترجمتها كـ قم بتعيين رقم بأرقام عشوائية.

نتيجة لذلك ، سيكون لدينا 3 أعمدة من 100 رقم ، بناءً على ذلك ، على سبيل المثال ، يمكننا تقدير احتمالية النجاح صحسب الصيغة: عدد النجاحات / 100(سم. مثال على ورقة ملف توليد برنولي).

ملحوظة: إلى عن على توزيعات برنوليمع p = 0.5 ، يمكنك استخدام الصيغة = RANDBETWEEN (0 ؛ 1) ، والتي تتوافق مع.

توليد عدد عشوائي. توزيع ثنائي

افترض أن هناك 7 عناصر معيبة في العينة. وهذا يعني أنه من "المحتمل جدًا" أن تكون نسبة المنتجات المعيبة قد تغيرت. ص، وهي سمة من سمات عملية الإنتاج لدينا. على الرغم من أن هذا الموقف "محتمل جدًا" ، إلا أن هناك احتمالًا (خطر ألفا ، خطأ من النوع 1 ، "إنذار كاذب") صبقيت على حالها ، وكان العدد المتزايد من المنتجات المعيبة بسبب أخذ العينات العشوائية.

كما يتضح من الشكل أدناه ، 7 هو عدد المنتجات المعيبة المقبولة لعملية مع p = 0.21 بنفس القيمة ألفا. يوضح هذا أنه عند تجاوز عتبة العناصر المعيبة في العينة ، صزاد "على الأرجح". تعني عبارة "على الأرجح" أن هناك فرصة بنسبة 10٪ فقط (100٪ -90٪) أن الانحراف في النسبة المئوية للمنتجات المعيبة التي تتجاوز الحد الأدنى يرجع إلى أسباب عشوائية فقط.

وبالتالي ، فإن تجاوز الحد الأدنى لعدد المنتجات المعيبة في العينة قد يكون بمثابة إشارة إلى أن العملية قد أصبحت مضطربة وبدأت في إنتاج ب حولنسبة أعلى من المنتجات المعيبة.

ملحوظة: قبل MS EXCEL 2010 ، كان لدى EXCEL وظيفة CRITBINOM () ، والتي تعادل BINOM.INV (). تم ترك CRITBINOM () في MS EXCEL 2010 والإصدارات الأحدث للتوافق.

علاقة التوزيع ذي الحدين بالتوزيعات الأخرى

إذا كانت المعلمة ن توزيع ثنائييميل إلى اللانهاية و صيميل إلى 0 ، ثم في هذه الحالة توزيع ثنائييمكن تقريبه.
من الممكن صياغة الشروط عند التقريب توزيع السميعمل بشكل جيد:

  • ص<0,1 (الأقل صو اكثر ن، كلما كان التقريب أكثر دقة) ؛
  • ص>0,9 (معتبرا أن ف=1- ص، يجب إجراء الحسابات في هذه الحالة باستخدام فXيحتاج إلى استبداله بـ ن- x). لذلك ، أقل فو اكثر ن، كلما كان التقريب أكثر دقة).

عند 0.1<=p<=0,9 и n*p>10 توزيع ثنائييمكن تقريبه.

بدوره ، توزيع ثنائييمكن أن يكون بمثابة تقدير تقريبي جيد عندما يكون حجم السكان هو N التوزيع الهندسي المفرطأكبر بكثير من حجم العينة n (أي N >> n أو n / N<<1).

يمكنك قراءة المزيد حول علاقة التوزيعات المذكورة أعلاه في المقالة. هناك أيضًا أمثلة على التقريب ، ويتم شرح الشروط عندما يكون ذلك ممكنًا وبأي دقة.

النصيحة: يمكنك أن تقرأ عن التوزيعات الأخرى لـ MS EXCEL في المقالة.

على عكس التوزيعات العادية والموحدة التي تصف سلوك متغير في عينة المدروسة من الموضوعات ، توزيع ثنائيتستخدم لأغراض أخرى. إنه يعمل على التنبؤ باحتمالية حدوث حدثين متنافيين في عدد معين من التجارب المستقلة. المثال الكلاسيكي للتوزيع ذي الحدين هو رمي عملة معدنية تسقط على سطح صلب. نتيجتان (حدثان) محتملان بشكل متساوٍ: 1) سقوط العملة "النسر" (الاحتمال يساوي ص) أو 2) سقوط العملة المعدنية "ذيول" (الاحتمال يساوي ف). إذا لم يتم إعطاء نتيجة ثالثة ، إذن ص = ف= 0.5 و ص + ف= 1. باستخدام معادلة التوزيع ذي الحدين ، يمكنك تحديد ، على سبيل المثال ، ما هو احتمال أن يسقط آخر مرة ، على سبيل المثال ، 25 مرة في 50 تجربة (عدد رميات العملة).

لمزيد من التفكير ، نقدم الترميز المقبول عمومًا:

نهو العدد الإجمالي للملاحظات ؛

أنا- عدد الأحداث (النتائج) التي تهمنا ؛

نأنا- عدد الأحداث البديلة ؛

ص- احتمالية محددة تجريبياً (في بعض الأحيان - مفترضة) لحدث يهمنا ؛

فهو احتمال وقوع حدث بديل ؛

صن ( أنا) هو الاحتمال المتوقع للحدث الذي يهمنا أنالعدد معين من الملاحظات ن.

صيغة التوزيع ذات الحدين:

في حالة النتائج المتوازنة للأحداث ( ع = ف) يمكنك استخدام الصيغة المبسطة:

(6.8)

دعونا ننظر في ثلاثة أمثلة توضح استخدام صيغ التوزيع ذات الحدين في البحث النفسي.

مثال 1

افترض أن 3 طلاب يقومون بحل مشكلة متزايدة التعقيد. لكل منهما نتيجتان متساويتان في الاحتمال: (+) - الحل و (-) - عدم حل المشكلة. في المجموع ، 8 نتائج مختلفة ممكنة (2 3 = 8).

احتمال ألا يتعامل أي طالب مع المهمة هو 1/8 (الخيار 8) ؛ سيكمل طالب واحد المهمة: ص= 3/8 (الخيارات 4 ، 6 ، 7) ؛ 2 طلاب - ص= 3/8 (الخيارات 2 ، 3 ، 5) و 3 طلاب - ص= 1/8 (الخيار 1).

من الضروري تحديد احتمال أن يتعامل ثلاثة من كل خمسة طلاب بنجاح مع هذه المهمة.

المحلول

إجمالي النتائج الممكنة: 2 5 = 32.

العدد الإجمالي للخيارين 3 (+) و 2 (-) هو

لذلك ، فإن احتمال النتيجة المتوقعة هو 10/32 »0.31.

مثال 3

ممارسه الرياضه

أوجد احتمال وجود 5 منفتحين في مجموعة من 10 أشخاص عشوائيين.

المحلول

1. أدخل الترميز: ع = ف = 0,5; ن= 10; أنا = 5 ؛ ف 10 (5) = ?

2. نستخدم صيغة مبسطة (انظر أعلاه):

استنتاج

احتمال وجود 5 منفتحين بين 10 مواضيع عشوائية هو 0.246.

ملحوظات

1. الحساب باستخدام الصيغة التي تحتوي على عدد كبير من التجارب أمر شاق للغاية ، لذلك ، في هذه الحالات ، يوصى باستخدام جداول التوزيع ذات الحدين.

2. في بعض الحالات ، القيم صو فيمكن ضبطه في البداية ، ولكن ليس دائمًا. كقاعدة عامة ، يتم حسابها بناءً على نتائج الاختبارات الأولية (الدراسات التجريبية).

3. في صورة بيانية (في الإحداثيات ص ن(أنا) = F(أنا)) يمكن أن يكون للتوزيع ذي الحدين شكل مختلف: في هذه الحالة ع = فالتوزيع متماثل ويشبه التوزيع الطبيعي الغاوسي ؛ كلما زاد انحراف التوزيع ، زاد الفرق بين الاحتمالات صو ف.

توزيع السم

توزيع بواسون هو حالة خاصة للتوزيع ذي الحدين ، يستخدم عندما يكون احتمال الأحداث ذات الأهمية منخفضًا جدًا. بعبارة أخرى ، يصف هذا التوزيع احتمالية وقوع أحداث نادرة. يمكن استخدام صيغة بواسون ص < 0,01 и ف ≥ 0,99.

معادلة بواسون تقريبية ويتم وصفها بالصيغة التالية:

(6.9)

حيث μ هو ناتج متوسط ​​احتمالية الحدث وعدد المشاهدات.

كمثال ، ضع في اعتبارك الخوارزمية لحل المشكلة التالية.

المهمة

لعدة سنوات في 21 عيادة كبيرة في روسيا ، تم إجراء فحص جماعي لحديثي الولادة بحثًا عن مرض الرضع المصابين بمرض داون (كانت العينة في المتوسط ​​1000 مولود جديد في كل عيادة). تم استلام البيانات التالية:

ممارسه الرياضه

1. تحديد متوسط ​​احتمالية الإصابة بالمرض (من حيث عدد المواليد الجدد).

2. تحديد متوسط ​​عدد المواليد المصابين بمرض واحد.

3. حدد احتمال وجود طفلين مصابين بمرض داون من بين 100 مولود تم اختيارهم عشوائيًا.

المحلول

1. تحديد متوسط ​​احتمالية الإصابة بالمرض. عند القيام بذلك ، يجب أن نسترشد بالمنطق التالي. تم تسجيل مرض داون فقط في 10 عيادة من اصل 21. لم يتم تسجيل اي امراض في 11 عيادة ، تم تسجيل حالة واحدة في 6 عيادات ، حالتان في عيادتين ، 3 في العيادة الاولى و 4 حالات في العيادة الاولى. 5 حالات لم يتم العثور عليها في اي عيادة. من أجل تحديد متوسط ​​احتمال الإصابة بالمرض ، من الضروري تقسيم إجمالي عدد الحالات (6 1 + 2 2 + 1 3 + 1 4 = 17) على إجمالي عدد الأطفال حديثي الولادة (21000):

2 - إن عدد المواليد الذين يتسببون في مرض واحد هو مقلوب متوسط ​​الاحتمال ، أي يساوي إجمالي عدد المواليد مقسومًا على عدد الحالات المسجلة:

3. استبدل القيم ص = 0,00081, ن= 100 و أنا= 2 في صيغة بواسون:

إجابه

احتمال العثور على رضيعين مصابين بمرض داون من بين 100 مولود تم اختيارهم عشوائياً هو 0.003 (0.3٪).

المهام ذات الصلة

المهمة 6.1

ممارسه الرياضه

باستخدام بيانات المشكلة 5.1 في وقت رد الفعل الحسي الحركي ، احسب عدم التناسق والتفرطح لتوزيع الواقع الافتراضي.

المهمة 6. 2

تم اختبار 200 طالب دراسات عليا لمستوى الذكاء ( معدل الذكاء). بعد تطبيع التوزيع الناتج معدل الذكاءوفقًا للانحراف المعياري ، تم الحصول على النتائج التالية:

ممارسه الرياضه

باستخدام اختبارات Kolmogorov و chi-square ، حدد ما إذا كان التوزيع الناتج للمؤشرات يتوافق مع ذلك معدل الذكاءعادي.

المهمة 6. 3

في موضوع بالغ (رجل يبلغ من العمر 25 عامًا) ، تمت دراسة وقت رد الفعل الحسي البسيط (SR) استجابةً لمحفز صوتي بتردد ثابت قدره 1 كيلو هرتز وشدة 40 ديسيبل. تم تقديم المنبه مائة مرة على فترات من 3-5 ثوان. تم توزيع قيم VR الفردية لـ 100 تكرار على النحو التالي:

ممارسه الرياضه

1. إنشاء مخطط تكراري لتوزيع VR ؛ تحديد متوسط ​​قيمة VR وقيمة الانحراف المعياري.

2. حساب معامل عدم التناسق وتفرطح توزيع BP. بناءً على القيم المستلمة كماو السابقالتوصل إلى استنتاج حول مطابقة أو عدم امتثال هذا التوزيع للتوزيع العادي.

المهمة 6.4

في عام 1998 ، تخرج 14 شخصًا (5 فتيان و 9 فتيات) من المدارس في نيجني تاجيل بميداليات ذهبية ، 26 شخصًا (8 أولاد و 18 فتاة) بميداليات فضية.

سؤال

هل يمكن القول إن الفتيات يحصلن على ميداليات أكثر من الأولاد؟

ملحوظة

تعتبر نسبة عدد الفتيان والفتيات في عموم السكان متساوية.

المهمة 6.5

يُعتقد أن عدد المنفتحين والانطوائيين في مجموعة متجانسة من الموضوعات هو نفسه تقريبًا.

ممارسه الرياضه

حدد احتمال العثور على 10 أشخاص منفتحين في مجموعة مكونة من 10 أشخاص تم اختيارهم عشوائيًا. أنشئ تعبيرًا رسوميًا للتوزيع الاحتمالي لإيجاد 0 ، 1 ، 2 ، ... ، 10 منفتحين في مجموعة معينة.

المهمة 6.6

ممارسه الرياضه

احسب الاحتمالية ص ن(ط) وظائف التوزيع ذات الحدين لـ ص= 0.3 و ف= 0.7 للقيم ن= 5 و أنا= 0، 1، 2، ...، 5. أنشئ تعبيرًا رسوميًا عن التبعية ص ن(أنا) = و(أنا) .

المهمة 6.7

في السنوات الأخيرة ، أصبح الإيمان بالتنبؤات الفلكية راسخًا بين جزء معين من السكان. وفقًا لنتائج المسوحات الأولية ، وجد أن حوالي 15٪ من السكان يؤمنون بعلم التنجيم.

ممارسه الرياضه

حدد احتمال أنه من بين 10 مشاركين تم اختيارهم عشوائيًا سيكون هناك 1 أو 2 أو 3 أشخاص يؤمنون بالتنبؤات الفلكية.

المهمة 6.8

المهمة

في 42 مدرسة ثانوية في مدينة يكاترينبورغ ومنطقة سفيردلوفسك (يبلغ إجمالي عدد الطلاب 12،260) ، تم الكشف عن العدد التالي من حالات الأمراض العقلية بين أطفال المدارس على مدى عدة سنوات:

ممارسه الرياضه

السماح للفحص العشوائي لألف تلميذ. احسب ما هو احتمال تحديد طفل أو طفلين أو ثلاثة أطفال مصابين بأمراض عقلية من بين هؤلاء الأطفال الألف؟


القسم 7. تدابير الاختلاف

صياغة المشكلة

افترض أن لدينا عينتين مستقلتين من الموضوعات Xو في. لا يعتمديتم عد العينات عندما يظهر نفس الموضوع (الموضوع) في عينة واحدة فقط. المهمة هي مقارنة هذه العينات (مجموعتان من المتغيرات) مع بعضها البعض لاختلافها. بطبيعة الحال ، بغض النظر عن مدى قرب قيم المتغيرات في العينة الأولى والثانية ، سيتم الكشف عن بعض الاختلافات ، حتى لو كانت غير مهمة. من نفس وجهة النظر الإحصاء الرياضينحن مهتمون بمسألة ما إذا كانت الفروق بين هذه العينات ذات دلالة إحصائية (ذات دلالة إحصائية) أم غير ذات دلالة (عشوائية).

المعايير الأكثر شيوعًا لأهمية الاختلافات بين العينات هي المقاييس البارامترية للاختلافات - معيار الطالبو معيار فيشر. في بعض الحالات ، يتم استخدام معايير غير حدودية - اختبار Rosenbaum's Q ، اختبار Mann-Whitney U-testو اخرين. تحويل فيشر الزاوي φ *، مما يسمح لك بمقارنة القيم المعبر عنها كنسب مئوية (نسب مئوية) مع بعضها البعض. وأخيرًا ، كحالة خاصة ، لمقارنة العينات ، يمكن استخدام المعايير التي تميز شكل توزيعات العينة - المعيار χ 2 بيرسونو المعيار λ كولموغوروف - سميرنوف.

من أجل فهم هذا الموضوع بشكل أفضل ، سنمضي على النحو التالي. سنحل المشكلة نفسها بأربع طرق باستخدام أربعة معايير مختلفة - Rosenbaum و Mann-Whitney و Student و Fisher.

المهمة

تم اختبار 30 طالبًا (14 ولادًا و 16 فتاة) أثناء جلسة الامتحان وفقًا لاختبار سبيلبرجر لمستوى القلق التفاعلي. تم الحصول على النتائج التالية (الجدول 7.1):

الجدول 7.1

المواضيع مستوى القلق التفاعلي
الشباب
فتيات

ممارسه الرياضه

لتحديد ما إذا كانت الفروق في مستوى القلق التفاعلي لدى الأولاد والبنات ذات دلالة إحصائية.

تبدو المهمة نموذجية تمامًا لطبيب نفساني متخصص في مجال علم النفس التربوي: من يعاني من إجهاد الامتحان بشكل أكثر حدة - بنين أم بنات؟ إذا كانت الفروق بين العينات ذات دلالة إحصائية ، فهناك اختلافات كبيرة بين الجنسين في هذا الجانب ؛ إذا كانت الفروق عشوائية (ليست ذات دلالة إحصائية) ، يجب تجاهل هذا الافتراض.

7. 2. اختبار اللامعلمية سروزنباوم

س-يعتمد معيار Rozenbaum على مقارنة "متراكب" على سلسلة قيم مرتبة أخرى لمتغيرين مستقلين. في الوقت نفسه ، لا يتم تحليل طبيعة توزيع السمة داخل كل صف - في هذه القضيةفقط عرض الأقسام غير المتداخلة للصفين المصنفين مهم. عند مقارنة سلسلتين مصنفتين من المتغيرات مع بعضهما البعض ، هناك 3 خيارات ممكنة:

1. الرتب المصنفة xو ذلا تحتوي على منطقة تداخل ، أي جميع قيم السلسلة المرتبة الأولى ( x) أكبر من جميع قيم السلسلة المرتبة الثانية ( ذ):

في هذه الحالة ، الاختلافات بين العينات ، التي يحددها أي معيار إحصائي ، هي بالتأكيد كبيرة ، واستخدام معيار Rosenbaum غير مطلوب. ومع ذلك ، فإن هذا الخيار نادر للغاية من الناحية العملية.

2. تتداخل الصفوف المصنفة تمامًا مع بعضها البعض (كقاعدة عامة ، يوجد أحد الصفوف داخل الآخر) ، ولا توجد مناطق غير متداخلة. في هذه الحالة ، لا ينطبق معيار Rosenbaum.

3. هناك مساحة متداخلة للصفوف ، بالإضافة إلى منطقتين غير متداخلتين ( العدد 1و العدد 2) متعلق ب مختلفسلسلة مرتبة (نشير X- تحول صف باتجاه كبير ، ذ- في اتجاه القيم الأدنى):

هذه الحالة نموذجية لاستخدام معيار Rosenbaum ، عند استخدامه يجب مراعاة الشروط التالية:

1. يجب ألا يقل حجم كل عينة عن 11.

2. يجب ألا تختلف أحجام العينات بشكل كبير عن بعضها البعض.

معيار سيتوافق Rosenbaum مع عدد القيم غير المتداخلة: س = ن 1 +ن 2 . يتم الاستنتاج حول موثوقية الاختلافات بين العينات إذا س> سكرونة . في نفس الوقت ، القيم س cr في جداول خاصة (انظر الملحق ، الجدول الثامن).

دعنا نعود إلى مهمتنا. دعونا نقدم التدوين: X- مجموعة مختارة من الفتيات ، ذ- مختارات من الأولاد. لكل عينة ، نبني سلسلة مرتبة:

X: 28 30 34 34 35 36 37 39 40 41 42 42 43 44 45 46

ذ: 26 28 32 32 33 34 35 38 39 40 41 42 43 44

نحسب عدد القيم في المناطق غير المتداخلة في السلسلة المرتبة. في صف واحد Xالقيم 45 و 46 غير متداخلة ، أي ن 1 = 2 ؛ على التوالي ذفقط قيمة واحدة غير متداخلة 26 أي ن 2 = 1. ومن ثم ، س = ن 1 +ن 2 = 1 + 2 = 3.

في الجدول. الملحق الثامن نجد ذلك سكرونة . = 7 (لمستوى أهمية 0.95) و س cr = 9 (لمستوى أهمية 0.99).

استنتاج

بسبب ال س<س cr ، إذن وفقًا لمعيار Rosenbaum ، فإن الاختلافات بين العينات ليست ذات دلالة إحصائية.

ملحوظة

يمكن استخدام اختبار Rosenbaum بغض النظر عن طبيعة توزيع المتغيرات ، أي في هذه الحالة ، ليست هناك حاجة لاستخدام اختبارات Pearson χ 2 و Kolmogorov لتحديد نوع التوزيعات في كلتا العينتين.

7. 3. يو- اختبار مان ويتني

على عكس معيار Rosenbaum ، يويعتمد اختبار Mann-Whitney على تحديد منطقة التداخل بين صفين مصنّفين ، أي كلما كانت منطقة التداخل أصغر ، زادت أهمية الاختلافات بين العينات. لهذا ، يتم استخدام إجراء خاص لتحويل المقاييس الفاصلة إلى جداول مرتبة.

دعونا ننظر في الخوارزمية الحسابية لـ يو-معيار على مثال المهمة السابقة.

الجدول 7.2

س ، ص صس ص صس ص * ص x صذ
26 28 32 32 33 34 35 38 39 40 41 42 43 44 2,5 2,5 5,5 5,5 11,5 11,5 16,5 16,5 18,5 18,5 20,5 20,5 25,5 25,5 27,5 27,5 2,5 11,5 16,5 18,5 20,5 25,5 27,5 1 2,5 5,5 5,5 7 9 11,5 15 16,5 18,5 20,5 23 25,5 27,5
Σ 276,5 188,5

1. نبني سلسلة مرتبة واحدة من عينتين مستقلتين. في هذه الحالة ، يتم خلط قيم كلتا العينتين ، العمود 1 ( x, ذ). من أجل تبسيط العمل الإضافي (بما في ذلك إصدار الكمبيوتر) ، يجب تمييز قيم العينات المختلفة بخطوط مختلفة (أو ألوان مختلفة) ، مع مراعاة حقيقة أننا سننشرها في المستقبل في أعمدة مختلفة.

2. قم بتحويل مقياس الفاصل الزمني للقيم إلى مقياس ترتيبي (للقيام بذلك ، نعيد تصميم جميع القيم بأرقام الرتب من 1 إلى 30 ، العمود 2 ( صس ص)).

3. نقدم تصحيحات للرتب ذات الصلة (يُشار إلى نفس قيم المتغير بنفس الرتبة ، بشرط ألا يتغير مجموع الرتب ، العمود 3 ( ص xy *). في هذه المرحلة ، يوصى بحساب مجموع الرتب في العمودين الثاني والثالث (إذا كانت جميع التصحيحات صحيحة ، فيجب أن تكون هذه المبالغ متساوية).

4. ننشر أرقام الرتب وفقًا لانتمائها لعينة معينة (العمودين 4 و 5 ( ص x و صذ)).

5. نجري العمليات الحسابية وفقًا للصيغة:

(7.1)

أين تي x هي أكبر مجموع مراتب الرتب ; ن x و ن y ، على التوالي ، أحجام العينة. في هذه الحالة ، ضع في اعتبارك أنه إذا كان تي x< تي y ثم التدوين xو ذيجب عكسها.

6. قارن القيمة التي تم الحصول عليها بالقيمة المجدولة (انظر الملاحق ، الجدول التاسع). يوإكسب.< يوسجل تجاري. .

في مثالنا يوإكسب. = 83.5> يو كر. = 71.

استنتاج

الاختلافات بين العينتين وفقًا لاختبار مان ويتني ليست ذات دلالة إحصائية.

ملحوظات

1. لا توجد قيود عمليًا على اختبار Mann-Whitney ؛ الحد الأدنى لأحجام العينات التي تمت مقارنتها هو 2 و 5 أشخاص (انظر الجدول التاسع من الملحق).

2. على غرار اختبار Rosenbaum ، يمكن استخدام اختبار Mann-Whitney لأي عينات ، بغض النظر عن طبيعة التوزيع.

معيار الطالب

على عكس معايير Rosenbaum و Mann-Whitney ، فإن المعيار رطريقة الطالب معلمية ، أي تستند إلى تحديد المؤشرات الإحصائية الرئيسية - متوسط ​​القيم في كل عينة (و) وتبايناتها (s 2 x و s 2 y) ، محسوبة باستخدام الصيغ القياسية (انظر القسم 5).

يتضمن استخدام معيار الطالب الشروط التالية:

1. يجب أن تتبع توزيعات القيم لكلتا العينتين قانون التوزيع العادي (انظر القسم 6).

2. يجب أن يكون الحجم الإجمالي للعينة 30 على الأقل (لـ β 1 = 0.95) و 100 على الأقل (لـ 2 = 0.99).

3. يجب ألا يختلف حجم عينتين بشكل كبير عن بعضهما البعض (لا يزيد عن 1.5 × 2 مرة).

فكرة معيار الطالب بسيطة للغاية. لنفترض أن قيم المتغيرات في كل عينة يتم توزيعها وفقًا للقانون العادي ، أي أننا نتعامل مع توزيعين عاديين يختلفان عن بعضهما البعض في القيم المتوسطة والتباين (على التوالي ، و ، وانظر الشكل 7.1).

س xس ذ

أرز. 7.1 تقدير الفروق بين عينتين مستقلتين: و - متوسط ​​قيم العينات xو ذ؛ s x و s y - الانحرافات المعيارية

من السهل أن نفهم أن الاختلافات بين عينتين ستكون أكبر ، وكلما زاد الفرق بين الوسيلة وصغر الفروق (أو الانحرافات المعيارية).

في حالة العينات المستقلة ، يتم تحديد معامل الطالب بالصيغة:

(7.2)

أين ن x و نص - على التوالي ، عدد العينات xو ذ.

بعد حساب معامل الطالب في جدول القيم المعيارية (الحرجة) ر(انظر الملحق ، الجدول X) ابحث عن القيمة المقابلة لعدد درجات الحرية ن = ن x + ن y - 2 ، وقارنها مع تلك التي تحسبها الصيغة. اذا كان رإكسب. جنيه استرليني رسجل تجاري. ، ثم يتم رفض الفرضية حول موثوقية الاختلافات بين العينات ، إذا رإكسب. > رسجل تجاري. ، ثم يتم قبوله. بمعنى آخر ، تختلف العينات اختلافًا كبيرًا عن بعضها البعض إذا كان معامل الطالب المحسوب بواسطة الصيغة أكبر من القيمة المجدولة لمستوى الأهمية المقابل.

في المشكلة التي درسناها سابقًا ، يعطي حساب متوسط ​​القيم والتباينات القيم التالية: xراجع = 38.5 ؛ σ × 2 = 28.40 ؛ فيراجع = 36.2 ؛ σ ص 2 = 31.72.

يمكن ملاحظة أن متوسط ​​قيمة القلق في مجموعة الفتيات أعلى منه في مجموعة الأولاد. ومع ذلك ، فإن هذه الاختلافات صغيرة جدًا لدرجة أنه من غير المحتمل أن تكون ذات دلالة إحصائية. على العكس من ذلك ، فإن تشتت القيم عند الأولاد أعلى قليلاً منه عند الفتيات ، لكن الفروق بين الفروق صغيرة أيضًا.

استنتاج

رإكسب. = 1.14< رسجل تجاري. = 2.05 (1 = 0.95). الفروق بين العينتين المقارنتين ليست ذات دلالة إحصائية. يتوافق هذا الاستنتاج تمامًا مع النتيجة التي تم الحصول عليها باستخدام معايير Rosenbaum و Mann-Whitney.

هناك طريقة أخرى لتحديد الاختلافات بين عينتين باستخدام اختبار t للطالب وهي حساب فاصل الثقة للانحرافات المعيارية. فاصل الثقة هو متوسط ​​الانحراف التربيعي (القياسي) مقسومًا على الجذر التربيعي لحجم العينة ومضروبًا في القيمة القياسية لمعامل الطالب لـ ن- درجة واحدة من الحرية (على التوالي ، و).

ملحوظة

القيمة = مكسيسمى جذر متوسط ​​مربع الخطأ (انظر القسم 5). لذلك ، فاصل الثقة هو الخطأ القياسي مضروبًا في معامل الطالب لحجم عينة معين ، حيث عدد درجات الحرية ν = ن- 1 ولأجل مستوى معينالدلالة.

تعتبر عينتان مستقلتان عن بعضهما مختلفين اختلافًا كبيرًا إذا فترات الثقةلهذه العينات لا تتداخل مع بعضها البعض. في حالتنا ، لدينا 38.5 ± 2.84 للعينة الأولى و 36.2 ± 3.38 للعينة الثانية.

لذلك ، اختلافات عشوائية س طتقع في النطاق 35.66 ¸ 41.34 ، والاختلافات ذ أنا- في النطاق 32.82 39.58. وبناءً على ذلك يمكن القول بأن الفروق بين العينات xو ذغير موثوق بها إحصائيًا (نطاقات الاختلافات تتداخل مع بعضها البعض). في هذه الحالة ، يجب ألا يغيب عن البال أن عرض منطقة التداخل في هذه الحالة لا يهم (فقط حقيقة تداخل فترات الثقة مهمة).

نادرًا ما يتم استخدام طريقة الطالب للعينات المترابطة (على سبيل المثال ، لمقارنة النتائج التي تم الحصول عليها من الاختبار المتكرر على نفس العينة من الموضوعات) ، نظرًا لوجود تقنيات إحصائية أخرى أكثر إفادة لهذه الأغراض (انظر القسم 10). ومع ذلك ، لهذا الغرض ، كأول تقدير تقريبي ، يمكنك استخدام صيغة الطالب النوع التالي:

(7.3)

تتم مقارنة النتيجة التي تم الحصول عليها مع قيمة الجدولإلى عن على ن- 1 درجات الحرية أين ن- عدد أزواج القيم xو ذ. يتم تفسير نتائج المقارنة بنفس الطريقة تمامًا كما في حالة حساب الفروق بين عينتين مستقلتين.

معيار فيشر

معيار فيشر ( F) على نفس مبدأ اختبار t للطالب ، أي أنه يتضمن حساب القيم المتوسطة والتباينات في العينات المقارنة. يتم استخدامه غالبًا عند مقارنة العينات غير المتكافئة في الحجم (مختلفة في الحجم) مع بعضها البعض. يعد اختبار فيشر أكثر صرامة إلى حد ما من اختبار الطالب ، وبالتالي يكون أكثر تفضيلاً في الحالات التي توجد فيها شكوك حول موثوقية الاختلافات (على سبيل المثال ، إذا كانت الاختلافات كبيرة ، وفقًا لاختبار الطالب ، عند الصفر وليست مهمة عند الأهمية الأولى مستوى).

تبدو صيغة فيشر كما يلي:

(7.4)

اين و (7.5, 7.6)

في مشكلتنا د 2= 5.29 ؛ σz 2 = 29.94.

استبدل القيم الموجودة في الصيغة:

في الجدول. تطبيقات XI ، نجد ذلك لمستوى الأهمية β 1 = 0.95 و = ن x + ن y - 2 = 28 القيمة الحرجة هي 4.20.

استنتاج

F = 1,32 < F كر.= 4.20. الفروق بين العينات ليست ذات دلالة إحصائية.

ملحوظة

عند استخدام اختبار Fisher ، يجب استيفاء نفس الشروط الخاصة باختبار الطالب (انظر القسم الفرعي 7.4). ومع ذلك ، يُسمح بالاختلاف في عدد العينات بأكثر من مرتين.

وهكذا ، عند حل نفس المشكلة مع أربعة أساليب مختلفةباستخدام معيارين غير حدوديين ومعيارين حدوديين ، توصلنا إلى استنتاج لا لبس فيه مفاده أن الاختلافات بين مجموعة الفتيات ومجموعة الأولاد من حيث مستوى القلق التفاعلي غير موثوقة (أي أنها تقع ضمن نطاق الاختلافات العشوائية ). ومع ذلك ، قد تكون هناك حالات لا يمكن فيها التوصل إلى نتيجة لا لبس فيها: بعض المعايير تعطي موثوقية ، والبعض الآخر - اختلافات لا يمكن الاعتماد عليها. في هذه الحالات ، تعطى الأولوية للمعايير البارامترية (حسب كفاية حجم العينة والتوزيع الطبيعي للقيم قيد الدراسة).

7. 6. المعيار j * - التحول الزاوي لفيشر

تم تصميم معيار ي * فيشر لمقارنة عينتين حسب تكرار حدوث التأثير الذي يهم الباحث. يقوم بتقييم أهمية الفروق بين النسب المئوية لعينتين حيث يتم تسجيل تأثير الفائدة. من الممكن أيضا المقارنة النسب المئويةوضمن نفس العينة.

جوهر التحول الزاوييتكون فيشر من تحويل النسب المئوية إلى كميات الزاوية المركزية، والتي تُقاس بالراديان. نسبة أكبر تتوافق مع زاوية أكبر ي، وحصة أصغر - زاوية أصغر ، لكن العلاقة هنا غير خطية:

أين ص- النسبة المئوية ، معبرًا عنها في كسور الوحدة.

مع زيادة التناقض بين الزاويتين j 1 و j 2 وزيادة عدد العينات ، تزداد قيمة المعيار.

يتم حساب معيار فيشر بالصيغة التالية:


حيث j 1 هي الزاوية المقابلة للنسبة المئوية الأكبر ؛ ي 2 - الزاوية المقابلة لنسبة مئوية أصغر ؛ ن 1 و ن 2 - حجم العينة الأولى والثانية على التوالي.

تتم مقارنة القيمة المحسوبة بالصيغة بالقيمة القياسية (j * st = 1.64 لـ b 1 = 0.95 و j * st = 2.31 لـ b 2 = 0.99. تعتبر الاختلافات بين العينتين ذات دلالة إحصائية إذا كانت j *> j * st لمستوى معين من الأهمية.

مثال

نحن مهتمون بما إذا كانت مجموعتا الطلاب تختلفان عن بعضهما البعض من حيث نجاح الأداء الكافي مهمة تحدي. في المجموعة الأولى المكونة من 20 شخصًا ، تعامل معها 12 طالبًا ، وفي المجموعة الثانية - 10 أشخاص من 25.

المحلول

1. أدخل الترميز: ن 1 = 20, ن 2 = 25.

2. حساب النسب المئوية ص 1 و ص 2: ص 1 = 12 / 20 = 0,6 (60%), ص 2 = 10 / 25 = 0,4 (40%).

3. في الجدول. تطبيقات الثاني عشر نجد المقابلة النسب المئويةφ القيم: j 1 = 1.772 ، j 2 = 1.369.


من هنا:

استنتاج

الاختلافات بين المجموعات ليست ذات دلالة إحصائية لأن j *< j* ст для 1-го и тем более для 2-го уровня значимости.

7.7 استخدام اختبار بيرسون χ2 واختبار كولموغوروف λ

توزيع ثنائي

التوزيع الاحتمالي لعدد تكرارات بعض الأحداث أثناء تكرارها اختبارات مستقلة. إذا كان احتمال وقوع حدث لكل تجربة هو R ،و 0 ≤ ص≤ 1 ، ثم عدد تكرارات هذا الحدث لـ نمحاكمات مستقلة ، هناك متغير عشوائي يأخذ القيم م = 1, 2,.., نمع الاحتمالات

أين ف= 1 - صأ - المعاملات ذات الحدين (ومن هنا جاء اسم B. r.). تسمى الصيغة أعلاه أحيانًا صيغة برنولي. التوقع الرياضي والتباين في الكمية μ ، التي لها B. R. ، تساوي م(μ) = npو د(μ) = npq، على التوالى. ككل ن،بحكم نظرية لابلاس (انظر نظرية لابلاس) ، ص. بالقرب من التوزيع الطبيعي (انظر التوزيع الطبيعي) ، وهو ما يستخدم في الممارسة. على مستوى صغير نمن الضروري استخدام الجداول B. r.

أشعل.: Bolshev L. N.، Smirnov N.V، جداول الإحصاء الرياضي، M.، 1965.


كبير الموسوعة السوفيتية. - م: الموسوعة السوفيتية. 1969-1978 .

شاهد ما هو "التوزيع ذو الحدين" في القواميس الأخرى:

    دالة الاحتمال ... ويكيبيديا

    - (التوزيع ذو الحدين) التوزيع الذي يسمح لك بحساب احتمالية حدوث أي منها حدث عشوائيتم الحصول عليها نتيجة ملاحظات السلسلة أحداث مستقلة، إذا كان احتمال حدوث عنصرها الأساسي ... ... القاموس الاقتصادي

    - (توزيع برنولي) التوزيع الاحتمالي لعدد تكرارات حدث ما في تجارب مستقلة متكررة ، إذا كان احتمال حدوث هذا الحدث في كل تجربة يساوي p (0 ص 1). بالضبط ، الرقم؟ هناك تكرارات لهذا الحدث ... ... قاموس موسوعي كبير

    توزيع ثنائي- - موضوعات الاتصالات والمفاهيم الأساسية EN التوزيع ذي الحدين ...

    - (توزيع برنولي) ، التوزيع الاحتمالي لعدد تكرارات حدث ما في تجارب مستقلة متكررة ، إذا كان احتمال حدوث هذا الحدث في كل تجربة هو p (0≤p≤1). وهي عدد تكرارات هذا الحدث ... ... قاموس موسوعي

    توزيع ثنائي- 1.49. التوزيع ذو الحدين التوزيع الاحتمالي لعنصر منفصل متغير عشوائي X ، والتي تأخذ أي قيم عدد صحيح من 0 إلى n ، مثل أن x = 0 ، 1 ، 2 ، ... ، n والمعلمات n = 1 ، 2 ، ... و 0< p < 1, где Источник … قاموس - كتاب مرجعي للمصطلحات المعيارية والتقنية

    توزيع برنولي ، التوزيع الاحتمالي لمتغير عشوائي X يأخذ قيمًا صحيحة مع الاحتمالات على التوالي ( معامل ذي الحدين؛ p المعلمة B. r. ، naz. احتمالية النتيجة الإيجابية التي تأخذ القيم ... موسوعة رياضية

    - (توزيع برنولي) ، التوزيع الاحتمالي لعدد تكرارات حدث معين في التجارب المستقلة المتكررة ، إذا كان احتمال حدوث هذا الحدث في كل تجربة هو p (0<или = p < или = 1). Именно, число м появлений … علم الطبيعة. قاموس موسوعي

    التوزيع الاحتمالي ذي الحدين- (التوزيع ذو الحدين) التوزيع الملاحظ في الحالات التي تأخذ فيها نتيجة كل تجربة مستقلة (ملاحظة إحصائية) إحدى القيمتين المحتملتين: النصر أو الهزيمة ، التضمين أو الاستبعاد ، زائد أو ... القاموس الاقتصادي والرياضي

    التوزيع الاحتمالي ذي الحدين- التوزيع الذي يتم ملاحظته في الحالات التي تكون فيها نتيجة كل تجربة مستقلة (ملاحظة إحصائية) تأخذ إحدى القيمتين المحتملتين: النصر أو الهزيمة ، التضمين أو الاستبعاد ، زائد أو ناقص ، 0 أو 1. أي ... ... دليل المترجم الفني

كتب

  • نظرية الاحتمالات والإحصاء الرياضي في المسائل. أكثر من 360 مهمة وتمرين ، د. أ. بورزيخ. يحتوي الدليل المقترح على مهام بمستويات مختلفة من التعقيد. ومع ذلك ، يتم التركيز بشكل رئيسي على المهام ذات التعقيد المتوسط. يتم القيام بذلك عن قصد لتشجيع الطلاب على ...
  • نظرية الاحتمالات والإحصاء الرياضي في المسائل: أكثر من 360 مشكلة وتمرين ، بورزيخ د. يحتوي الدليل المقترح على مشاكل ذات مستويات مختلفة من التعقيد. ومع ذلك ، يتم التركيز بشكل رئيسي على المهام ذات التعقيد المتوسط. يتم القيام بذلك عن قصد لتشجيع الطلاب على ...

مرحبًا! نحن نعلم بالفعل ما هو التوزيع الاحتمالي. يمكن أن تكون منفصلة أو مستمرة ، وقد تعلمنا أنها تسمى توزيع الكثافة الاحتمالية. لنستكشف الآن توزيعتين أكثر شيوعًا. لنفترض أن لدي عملة معدنية ، والعملة الصحيحة ، وسأقوم بقلبها 5 مرات. سأحدد أيضًا متغيرًا عشوائيًا X ، وأشير إليه بحرف كبير X ، وسيكون مساويًا لعدد "النسور" في 5 رميات. ربما لدي 5 عملات معدنية ، سأرميهم جميعًا مرة واحدة وأحسب عدد الرؤوس التي حصلت عليها. أو يمكنني الحصول على عملة واحدة ، يمكنني قلبها 5 مرات وإحصاء عدد المرات التي حصلت فيها على صورة. لا يهم حقًا. ولكن لنفترض أن لدي عملة واحدة وقلبتها 5 مرات. ثم لن يكون لدينا عدم اليقين. إذن هذا هو تعريف المتغير العشوائي الخاص بي. كما نعلم ، يختلف المتغير العشوائي قليلاً عن المتغير العادي ، فهو أشبه بالدالة. يخصص بعض القيمة للتجربة. وهذا المتغير العشوائي بسيط للغاية. نحن فقط نحسب عدد المرات التي سقط فيها "النسر" بعد 5 رميات - هذا هو المتغير العشوائي X. دعونا نفكر في ما قد تكون عليه احتمالات القيم المختلفة في حالتنا؟ إذن ، ما هو احتمال أن تكون X (كبيرة X) تساوي 0؟ أولئك. ما هو احتمال أنه بعد 5 رميات لن يظهر رأسه أبدًا؟ حسنًا ، هذا ، في الواقع ، هو نفس احتمال الحصول على بعض "ذيول" (هذا صحيح ، نظرة عامة صغيرة على نظرية الاحتمالات). يجب أن تحصل على بعض "ذيول". ما هو احتمال كل من هذه "ذيول"؟ هذا 1/2. أولئك. يجب أن يكون 1/2 مرة 1/2 و 1/2 و 1/2 و 1/2 مرة أخرى. أولئك. (1/2) ⁵. 1⁵ = 1 ، اقسم على 2⁵ ، أي في 32. منطقي تماما. لذا ... سأكرر قليلاً ما مررنا به في نظرية الاحتمال. هذا مهم لفهم أين نتحرك الآن وكيف ، في الواقع ، يتم تشكيل التوزيع الاحتمالي المنفصل. إذن ، ما هو احتمال أن نحصل على الرؤوس مرة واحدة بالضبط؟ حسنًا ، ربما تكون الرؤوس قد ظهرت عند أول رمى. أولئك. يمكن أن يكون مثل هذا: "نسر" ، "ذيول" ، "ذيول" ، "ذيول" ، "ذيول". أو يمكن أن تظهر الرؤوس في القرعة الثانية. أولئك. يمكن أن يكون هناك مثل هذا المزيج: "ذيول" ، "رؤوس" ، "ذيول" ، "ذيول" ، "ذيول" وما إلى ذلك. يمكن أن يسقط "نسر" واحد بعد أي من القذفات الخمس. ما هو احتمال كل من هذه المواقف؟ احتمال الحصول على رؤوس هو 1/2. ثم يتم ضرب احتمال الحصول على "ذيول" ، التي تساوي 1/2 ، في 1/2 ، في 1/2 ، في 1/2. أولئك. احتمال كل من هذه المواقف هو 1/32. فضلا عن احتمال الموقف حيث X = 0. في الواقع ، فإن احتمال أي ترتيب خاص للرؤوس والذيل سيكون 1/32. لذا فإن احتمال هذا هو 1/32. واحتمال هذا هو 1/32. وتحدث مثل هذه المواقف لأن "النسر" يمكن أن يسقط على أي من الرميات الخمس. لذلك ، فإن احتمال سقوط "نسر" واحد بالضبط يساوي 5 * 1/32 ، أي 5/32. منطقي تماما. الآن يبدأ الأمر المثير للاهتمام. ما هو الاحتمال ... (سأكتب كل مثال بلون مختلف) ... ما هو احتمال أن يكون المتغير العشوائي 2؟ أولئك. سأرمى قطعة نقود 5 مرات ، وما هو احتمال أن تهبط وجهًا لوجه مرتين؟ هذا أكثر إثارة للاهتمام ، أليس كذلك؟ ما هي المجموعات الممكنة؟ يمكن أن تكون رؤوسًا ، رؤوسًا ، ذيولاً ، ذيولاً ، وذيولاً. يمكن أن يكون أيضًا رؤوسًا ، وذيولًا ، ورؤوسًا ، وذيولًا ، وذيولًا. وإذا كنت تعتقد أن هذين "النسران" يمكنهما الوقوف في أماكن مختلفة من المجموعة ، عندها يمكنك الخلط قليلاً. لم يعد بإمكانك التفكير في المواضع بالطريقة التي فعلناها هنا أعلاه. على الرغم من ... يمكنك ذلك ، فأنت تخاطر فقط بالارتباك. يجب أن تفهم شيئًا واحدًا. لكل من هذه المجموعات ، يكون الاحتمال 1/32. ½ * ½ * ½ * ½ * ½. أولئك. احتمال كل من هذه المجموعات هو 1/32. وعلينا أن نفكر في عدد هذه التركيبات الموجودة التي ترضي حالتنا (2 "نسور")؟ أولئك. في الواقع ، عليك أن تتخيل أن هناك 5 رميات للقطع النقدية ، وتحتاج إلى اختيار 2 منهم ، حيث يسقط "النسر". لنتخيل أن رمياتنا الخمس في دائرة ، تخيل أيضًا أن لدينا كرسيين فقط. ونقول: "حسنًا ، أي واحد منكم سيجلس على هذه الكراسي من أجل النسور؟ أولئك. من منكم سيكون "النسر"؟ ولسنا مهتمين بالترتيب الذي يجلسون به. أعطي مثل هذا المثال ، آمل أن يكون أوضح لك. وقد ترغب في مشاهدة بعض دروس نظرية الاحتمالات حول هذا الموضوع عندما أتحدث عن نيوتن ذات الحدين. لأنني هناك سوف أتعمق في كل هذا بمزيد من التفصيل. لكن إذا فكرت بهذه الطريقة ، فسوف تفهم ما هو المعامل ذي الحدين. لأنه إذا كنت تفكر على هذا النحو: حسنًا ، لدي 5 رميات ، أي رمية ستهبط بالرؤوس الأولى؟ حسنًا ، إليك 5 احتمالات والتي من خلالها سيصيب الوجه الرؤوس الأولى. وكم عدد فرص "النسر" الثاني؟ حسنًا ، القرعة الأولى التي استخدمناها بالفعل سلبت فرصة واحدة للرؤوس. أولئك. موقع رأس واحد في التحرير والسرد مشغول بالفعل بإحدى الرميات. الآن هناك 4 رميات متبقية ، مما يعني أن "النسر" الثاني يمكن أن يسقط على واحدة من 4 رميات. ورأيته هنا. لقد اخترت أن يكون رأسي في الرمية الأولى ، وافترضت أنه في واحدة من 4 رميات متبقية ، يجب أن تظهر الرؤوس أيضًا. لذلك هناك 4 احتمالات فقط هنا. كل ما أقوله هو أنه بالنسبة للرأس الأول لديك 5 مواقع مختلفة يمكنه الهبوط عليها. وللحالة الثانية ، لم يتبق سوى 4 وظائف. فكر في الأمر. عندما نحسب مثل هذا ، يتم أخذ الترتيب في الاعتبار. لكن بالنسبة لنا الآن ، لا يهم بأي ترتيب تتساقط "الرؤوس" و "الذيل". لا نقول إنه "نسر 1" أو "نسر 2". في كلتا الحالتين ، إنه مجرد "نسر". يمكننا أن نفترض أن هذا هو الرأس 1 وهذا هو الرأس 2. أو يمكن أن يكون العكس: يمكن أن يكون "النسر" الثاني ، وهذا هو "الأول". وأقول هذا لأنه من المهم فهم مكان استخدام المواضع وأين يتم استخدام المجموعات. نحن لسنا مهتمين بالتسلسل. لذلك ، في الواقع ، هناك طريقتان فقط لأصل حدثنا. لذلك دعونا نقسم ذلك على 2. وكما سترى لاحقًا ، فهو 2! طرق منشأ حدثنا. إذا كان هناك 3 رؤوس ، فسيكون هناك 3! وسأوضح لك السبب. سيكون ذلك ... 5 * 4 = 20 مقسومًا على 2 يساوي 10. لذلك هناك 10 مجموعات مختلفة من 32 حيث سيكون لديك رأسان بالتأكيد. إذن 10 * (1/32) تساوي 10/32 ، فماذا يساوي ذلك؟ 5/16. سأكتب من خلال معامل ذات الحدين. هذه هي القيمة الموجودة هنا في الأعلى. إذا فكرت في الأمر ، فهذا هو نفس 5! مقسومًا على ... ماذا يعني هذا 5 * 4؟ 5! هو 5 * 4 * 3 * 2 * 1. أولئك. إذا كنت بحاجة فقط إلى 5 * 4 هنا ، فيمكنني تقسيم 5! ل 3! هذا يساوي 5 * 4 * 3 * 2 * 1 مقسومًا على 3 * 2 * 1. ويبقى 5 * 4 فقط. إذن فهو نفس هذا البسط. وبعد ذلك بسبب لسنا مهتمين بالتسلسل ، نحتاج هنا 2. في الواقع ، 2 !. اضرب ب 1/32. سيكون هذا هو احتمال ضرب رأسين بالضبط. ما هو احتمال أن نحصل على رؤوس بالضبط 3 مرات؟ أولئك. احتمال أن x = 3. لذلك ، وفقًا لنفس المنطق ، قد يحدث الظهور الأول للرؤوس في 1 من 5 تقلبات. قد يحدث التكرار الثاني للرؤوس في 1 من 4 رميات متبقية. وقد يحدث التكرار الثالث للرؤوس في 1 من 3 رميات متبقية. كم عدد الطرق المختلفة المتوفرة لترتيب 3 رميات؟ بشكل عام ، كم عدد الطرق المتاحة لترتيب 3 أشياء في أماكنها؟ إنها 3! ويمكنك معرفة ذلك ، أو قد ترغب في إعادة زيارة البرامج التعليمية حيث شرحتها بمزيد من التفصيل. ولكن إذا أخذت الحروف A و B و C ، على سبيل المثال ، فهناك 6 طرق يمكنك من خلالها ترتيبها. يمكنك التفكير في هذه كعناوين. هنا يمكن أن يكون ACB ، CAB. يمكن أن يكون BAC و BCA و ... ما هو الخيار الأخير الذي لم أسميه؟ CBA. هناك 6 طرق لترتيب 3 عناصر مختلفة. نقسم على 6 لأننا لا نريد حساب هذه الطرق الست المختلفة مرة أخرى لأننا نتعامل معها على أنها متكافئة. نحن هنا لسنا مهتمين بعدد الرميات التي ستؤدي إلى ظهور الرؤوس. 5 * 4 * 3 ... يمكن إعادة كتابة هذا كـ 5! / 2 !. وقسمها على 3 أكثر !. هذا ما هو عليه. 3! يساوي 3 * 2 * 1. الثلاثيات تتقلص. يصبح هذا 2. هذا يصبح 1. مرة أخرى ، 5 * 2 ، أي هي 10. لكل حالة احتمال 1/32 ، لذلك هذا مرة أخرى 5/16. وهذا مثير للاهتمام. احتمال حصولك على 3 رؤوس هو نفس احتمال حصولك على رأسين. والسبب في ذلك ... حسنًا ، هناك العديد من الأسباب لحدوث ذلك. ولكن إذا فكرت في الأمر ، فإن احتمال الحصول على 3 رؤوس هو نفس احتمال الحصول على ذيولتين. ويجب أن يكون احتمال الحصول على 3 ذيول هو نفسه احتمال الحصول على رأسين. ومن الجيد أن تعمل القيم على هذا النحو. جيد. ما هو احتمال أن X = 4؟ يمكننا استخدام نفس الصيغة التي استخدمناها من قبل. يمكن أن يكون 5 * 4 * 3 * 2. إذن ، نكتب هنا 5 * 4 * 3 * 2 ... كم عدد الطرق المختلفة الموجودة لترتيب 4 كائنات؟ إنها 4 !. أربعة! - هذا ، في الواقع ، هذا الجزء ، هنا. هذا 4 * 3 * 2 * 1. إذن ، هذا يلغي ، مع ترك 5. ثم ، كل مجموعة لها احتمال 1/32. أولئك. هذا يساوي 5/32. مرة أخرى ، لاحظ أن احتمال ظهور الصورة 4 مرات يساوي احتمال ظهور الرؤوس مرة واحدة. وهذا منطقي ، لأن. 4 رؤوس هي نفس ذيول واحدة. ستقول: حسنًا ، وفي أي نوع من القذف سيسقط هذا "ذيول"؟ نعم ، هناك 5 مجموعات مختلفة لذلك. ولكل منهم احتمال 1/32. وأخيرًا ، ما هو احتمال أن X = 5؟ أولئك. يرأس 5 مرات على التوالي. يجب أن يكون مثل هذا: "نسر" ، "نسر" ، "نسر" ، "نسر" ، "نسر". كل رأس لديه احتمال 1/2. اضربهم لتحصل على 1/32. يمكنك الذهاب في الاتجاه الآخر. إذا كانت هناك 32 طريقة يمكنك من خلالها الحصول على الرؤوس والذيل في هذه التجارب ، فهذه واحدة منها فقط. يوجد هنا 5 طرق من 32. هنا - 10 من 32. ومع ذلك ، قمنا بإجراء الحسابات ، والآن نحن على استعداد لرسم توزيع الاحتمالات. لكن وقتي انتهى. دعني أكمل الدرس التالي. وإذا كنت في حالة مزاجية ، فربما ترسم قبل مشاهدة الدرس التالي؟ اراك قريبا!

التوزيعات الاحتمالية للمتغيرات العشوائية المنفصلة. توزيع ثنائي. توزيع السم. التوزيع الهندسي. توليد وظيفة.

6. التوزيعات الاحتمالية للمتغيرات العشوائية المنفصلة

6.1 توزيع ثنائي

دعها تنتج نمحاكمات مستقلة ، في كل منها حدث أقد تظهر أو لا تظهر. احتمالا صوقوع حدث أفي جميع الاختبارات ثابت ولا يتغير من اختبار إلى آخر. ضع في اعتبارك متغير عشوائي X عدد تكرارات الحدث أفي هذه الاختبارات. صيغة لإيجاد احتمال وقوع حدث أناعم كمرة نالاختبارات ، كما هو معروف ، موصوفة صيغة برنولي

يسمى توزيع الاحتمالات المحدد بواسطة صيغة برنولي ذات الحدين .

يسمى هذا القانون "ذي الحدين" لأن الجانب الأيمن يمكن اعتباره مصطلحًا شائعًا في توسيع نيوتن ذي الحدين

نكتب قانون الحدين على شكل جدول

ص ن

np ن –1 ف

ف ن

دعونا نجد الخصائص العددية لهذا التوزيع.

من خلال تعريف التوقع الرياضي لـ DSW ، لدينا

.

دعونا نكتب المساواة ، وهي نيوتن بن

.

ونفرقها فيما يتعلق بـ p. نتيجة لذلك ، نحصل عليه

.

اضرب الجانبين الأيمن والأيسر في ص:

.

بشرط ص+ ف= 1 ، لدينا

(6.2)

لذا، التوقع الرياضي لعدد تكرارات الأحداث فينالمحاكمات المستقلة تساوي ناتج عدد المحاولاتنعلى الاحتمالصوقوع حدث في كل تجربة.

نحسب التشتت بالصيغة

.

لهذا نجد

.

أولًا ، اشتقنا صيغة نيوتن ذات الحدين مرتين بالنسبة إلى ص:

واضرب طرفي المعادلة في ص 2:

بالتالي،

لذا فإن تباين التوزيع ذي الحدين هو

. (6.3)

يمكن الحصول على هذه النتائج أيضًا من التفكير النوعي البحت. يتم إضافة إجمالي عدد مرات حدوث الحدث A في جميع التجارب إلى عدد مرات حدوث الحدث في التجارب الفردية. لذلك ، إذا كان X 1 هو عدد تكرارات الحدث في التجربة الأولى ، X 2 في الثانية ، وما إلى ذلك ، فإن إجمالي عدد تكرارات الحدث A في جميع التجارب هو X = X 1 + X 2 + ... X ن. وفقًا لخاصية التوقع الرياضي:

كل من المصطلحات الموجودة على الجانب الأيمن من المساواة هو التوقع الرياضي لعدد الأحداث في اختبار واحد ، وهو ما يعادل احتمال وقوع الحدث. في هذا الطريق،

حسب خاصية التشتت:

منذ ، والتوقع الرياضي لمتغير عشوائي ، والتي يمكن أن تأخذ قيمتين فقط ، وهما 1 2 مع احتمال صو 0 2 مع الاحتمال ف، ومن بعد
. في هذا الطريق،
نتيجة لذلك ، نحصل عليه

باستخدام مفهوم اللحظات الأولية والمركزية ، يمكن للمرء الحصول على صيغ للانحراف والتفرطح:

. (6.4)

أرز. 6.1

الشكل التالي لمضلع التوزيع ذي الحدين (انظر الشكل 6.1). الاحتمال ص ن (ك) أولاً يزيد مع الزيادة كيصل إلى قيمته القصوى ثم يبدأ في الانخفاض. التوزيع ذي الحدين منحرف باستثناء الحالة ص= 0.5. لاحظ أنه لعدد كبير من الاختبارات نالتوزيع ذو الحدين قريب جدًا من الطبيعي. (يرتبط تبرير هذا الاقتراح بنظرية Moivre-Laplace المحلية.)

رقمم 0 يسمى وقوع الحدثعلى الأرجح ، إذا كان احتمال وقوع الحدث لعدد معين من المرات في سلسلة التجارب هذه هو الأكبر (الحد الأقصى في مضلع التوزيع). للتوزيع ذي الحدين

تعليق. يمكن إثبات عدم المساواة هذه باستخدام الصيغة المتكررة للاحتمالات ذات الحدين:

(6.6)

مثال 6.1.حصة المنتجات المتميزة في هذه المؤسسة هي 31٪. ما هو المتوسط ​​والتباين ، وأيضًا العدد الأكثر احتمالًا للعناصر المميزة في مجموعة مختارة عشوائيًا تتكون من 75 عنصرًا؟

المحلول. بسبب ال ص=0,31, ف=0,69, ن= 75 إذن

م [ X] = np= 750.31 = 23.25 ؛ د[ X] = npq = 750,310,69 = 16,04.

للعثور على الرقم الأكثر احتمالا م 0 ، نؤلف متباينة مزدوجة

ومن ثم يتبع ذلك م 0 = 23.