السير الذاتية صفات التحليلات

اختبار الفرضية القائلة بأن المتوسط ​​يساوي قيمة معينة. اختبار الفرضية القائلة بأن المتوسط ​​يساوي قيمة معينة أ

8.1 مفهوم العينات المستقلة والمستقلة.

اختيار معيار لاختبار الفرضية

يتم تحديدها بشكل أساسي من خلال ما إذا كانت العينات قيد الدراسة تابعة أم مستقلة. دعونا نقدم التعاريف المقابلة.

ديف.يتم استدعاء العينات لا يعتمد، إذا كان إجراء اختيار الوحدات في العينة الأولى لا يرتبط بأي شكل من الأشكال بإجراء اختيار الوحدات في العينة الثانية.

من الأمثلة على عينتين مستقلتين العينات المذكورة أعلاه لرجال ونساء يعملون في نفس المؤسسة (في نفس الصناعة ، وما إلى ذلك).

لاحظ أن استقلالية عينتين لا يعني أنه لا يوجد شرط لنوع معين من التشابه بين هذه العينات (تجانسها). وبالتالي ، عند دراسة مستوى دخل الرجال والنساء ، من غير المرجح أن نسمح بمثل هذا الوضع عندما يتم اختيار الرجال من بيئة رجال الأعمال في موسكو والنساء من السكان الأصليين في أستراليا. يجب أن تكون المرأة أيضًا من سكان موسكو ، علاوة على ذلك ، "سيدات أعمال". لكننا هنا لا نتحدث عن اعتماد العينات ، ولكن عن متطلبات التجانس لمجموعة الأشياء المدروسة ، والتي يجب أن تكون راضية في كل من جمع وتحليل البيانات الاجتماعية.

ديف.يتم استدعاء العينات تابع ، أو مزدوج ،إذا كانت كل وحدة من عينة واحدة "مرتبطة" بوحدة معينة من العينة الثانية.

من المحتمل أن يصبح التعريف الأخير أكثر وضوحًا إذا قدمنا ​​مثالاً على عينات تابعة.

لنفترض أننا نريد معرفة ما إذا كانت الحالة الاجتماعية للأب في المتوسط ​​أقل من الحالة الاجتماعيةابن (نعتقد أنه يمكننا قياس هذا التعقيد والغموض السمة الاجتماعيةشخص). يبدو واضحًا أنه في مثل هذه الحالة يكون من المناسب اختيار أزواج من المستجيبين (الأب ، الابن) وافتراض أن كل عنصر من عناصر العينة الأولى (أحد الآباء) "مرتبط" بعنصر معين من العينة الثانية ( ابن). ستسمى هاتان العيّنتان التابعتان.

8.2 اختبار الفرضيات للعينات المستقلة

إلى عن على لا يعتمداختيار المعايير يعتمد على ما إذا كنا نعرف الفروق العامة s 1 2 و s 2 2 من السمة قيد الدراسة للعينات المدروسة. نحن نعتبر أن هذه المشكلة قد تم حلها ، بافتراض ذلك عينة الفروقتطابق العامة. في هذه الحالة ، المعيار هو القيمة:

قبل الشروع في مناقشة الموقف عندما تكون الفروق العامة (أو واحدة منها على الأقل) غير معروفة لنا ، نلاحظ ما يلي.

إن منطق استخدام المعيار (8.1) مشابه لما وصفناه عند النظر إلى معيار "Chi-square" (7.2). هناك اختلاف أساسي واحد فقط. عند الحديث عن معنى المعيار (7.2) ، أخذنا في الاعتبار عددًا لا حصر له من العينات ذات الحجم n ، "التي تم جمعها" من عامة السكان لدينا. هنا ، بتحليل معنى المعيار (8.1) ، ننتقل إلى النظر في عدد لا حصر له بخارعينات من الحجم n 1 و n 2. لكل زوج إحصائية بالشكل (8.1). مجموع القيم التي تم الحصول عليها من هذه الإحصاءات ، وفقًا لتدويننا ، يتوافق مع التوزيع الطبيعي(كما اتفقنا ، يستخدم الحرف z لتعيين مثل هذا المعيار ، والذي يتوافق مع التوزيع الطبيعي).

لذلك ، إذا كانت الفروق العامة غير معروفة لنا ، فنحن مضطرون لاستخدامها بدلاً من ذلك. تقديرات العينةق 1 2 و ق 2 2. ومع ذلك ، في هذه الحالة ، يجب استبدال التوزيع الطبيعي بتوزيع Student - يجب استبدال z بـ t (كما كان الحال في موقف مشابه عند إنشاء فاصل الثقةللتوقعات الرياضية). ومع ذلك ، بالنسبة لأحجام العينات الكبيرة بدرجة كافية (ن 1 ، ن 2 × 30) ، كما نعلم بالفعل ، يتطابق توزيع الطالب عمليًا مع التوزيع الطبيعي. بمعنى آخر ، باستخدام العينات الكبيرة ، يمكننا الاستمرار في استخدام المعيار:

يكون الموقف أكثر تعقيدًا عندما يكون كل من الفروق غير معروف ويكون حجم عينة واحدة على الأقل صغيرًا. ثم يأتي دور عامل آخر. يعتمد نوع المعيار على ما إذا كان يمكننا اعتبار الفروق غير المعروفة للميزة المدروسة في العينتين اللتين تم تحليلهما متساوية. لمعرفة ذلك ، نحتاج إلى اختبار الفرضية:

H 0: s 1 2 = s 2 2. (8.3)

لاختبار هذه الفرضية ، يتم استخدام المعيار

حول تفاصيل استخدام هذا المعيار سيتم مناقشتهاأدناه ، والآن سنستمر في مناقشة الخوارزمية لاختيار معيار يستخدم لاختبار الفرضيات حول تكافؤ التوقعات الرياضية.

إذا تم رفض الفرضية (8.3) ، فإن معيار الاهتمام بالنسبة لنا يأخذ الشكل:

(8.5)

(أي أنه يختلف عن الاختبار (8.2) المستخدم للعينات الكبيرة حيث أن الإحصاء المقابل ليس له توزيع طبيعي ، ولكن توزيع الطالب). إذا تم قبول الفرضية (8.3) ، فإن نوع المعيار المستخدم يتغير:

(8.6)

دعونا نلخص كيفية اختيار المعيار لاختبار فرضية المساواة في التوقعات الرياضية العامة بناءً على تحليل عينتين مستقلتين.

معروف

مجهول

حجم العينة كبير

H 0: s 1 = s 2 مرفوض

وافقت

8.3 اختبار الفرضيات للعينات التابعة

دعنا ننتقل إلى النظر في العينات التابعة. دع تسلسل الأرقام

X 1 ، X 2 ، ... ، X n ؛

Y 1 ، Y 2 ، ... ، Y n -

هذه هي قيم العشوائية المدروسة لعناصر عينتين معتمدين. دعنا نقدم الترميز:

D i = X i - Y i، i = 1، ...، n.

إلى عن على يعتمدمعيار أخذ العينات الذي يسمح لك باختبار الفرضية

كالآتي:

لاحظ أن التعبير المعطى للتو لـ s D ليس سوى تعبير جديد لـ الصيغة المعروفةمعربا عن الانحراف المعياري. في هذه القضية نحن نتكلمحول الانحراف المعياري للقيم D i. صيغة مماثلةغالبًا ما يتم استخدامه عمليًا كأسلوب أبسط (مقارنة بالحساب "المباشر" لمجموع الانحرافات التربيعية لقيم الكمية قيد النظر من المتوسط ​​الحسابي المقابل) لحساب التباين.

إذا قارنا الصيغ أعلاه بتلك التي استخدمناها عند مناقشة مبادئ إنشاء فاصل ثقة ، فمن السهل أن نرى أن اختبار الفرضية حول تكافؤ الوسائل في حالة العينات التابعة هو في الأساس اختبار المساواة إلى الصفر من التوقع الرياضي للقيم D i. قيمة

هو الانحراف المعياري لـ D i. لذلك ، فإن قيمة المعيار t n -1 الموصوف للتو تساوي أساسًا قيمة D i معبرًا عنها في كسور من المتوسط الانحراف المعياري. كما قلنا أعلاه (عند مناقشة طرق بناء فترات الثقة) ، يمكن استخدام هذا المؤشر للحكم على احتمالية القيمة المدروسة D i. الفرق هو أننا كنا نتحدث أعلاه عن متوسط ​​حسابي بسيط ، يتم توزيعه بشكل طبيعي ، وها نحن نتحدث عن متوسط ​​الفروق ، مثل هذه المتوسطات لها توزيع الطالب. لكن الحجج حول العلاقة بين احتمال انحراف المتوسط ​​الحسابي للعينة من الصفر (مع توقع رياضي يساوي الصفر) وعدد وحدات s التي يظل هذا الانحراف صالحًا.

مقارنة وسائل اثنين من السكان مهم قيمة عملية. في الممارسة العملية ، غالبًا ما تكون هناك حالة نتيجة متوسطةسلسلة واحدة من التجارب تختلف عن متوسط ​​نتيجة سلسلة أخرى. يثير هذا السؤال عما إذا كان من الممكن تفسير التناقض الملحوظ بين المتوسطات بما لا مفر منه أخطاء عشوائيةالتجربة أو بسبب بعض الأنماط. في الصناعة ، غالبًا ما تنشأ مهمة مقارنة المتوسطات عند أخذ عينات من جودة المنتجات المصنعة في منشآت مختلفة أو في ظل أنظمة تكنولوجية مختلفة ، في التحليل المالي - عند مقارنة مستوى ربحية الأصول المختلفة ، إلخ.

لنقم بصياغة المهمة. يجب ألا يكون هناك مجموعتان تتميزان بالوسائل العامة و و الفروق المعروفةو. من الضروري اختبار الفرضية حول مساواة المتوسطات العامة ، أي : =. لاختبار الفرضية ، تم أخذ عينتين مستقلتين من الأحجام من هذه المجموعات السكانية ، حيث تم العثور على الوسائل الحسابية وتفاوتات العينة. مع وجود أحجام عينة كبيرة بما فيه الكفاية ، فإن العينة تعني ولها قانون توزيع طبيعي تقريبًا ، على التوالي ، و إذا كانت الفرضية صحيحة ، فإن الاختلاف - له قانون توزيع عادي مع توقع رياضي وتشتت.

لذلك ، عندما يتم استيفاء الفرضية ، فإن الإحصائيات

له توزيع طبيعي قياسي N (0 ؛ 1).

اختبار الفرضيات حول القيم العدديةالمعلمات

تحدث الفرضيات حول القيم العددية في مسائل مختلفة. يجب أن تكون قيم بعض معلمات المنتجات التي تنتجها آلة الخط الأوتوماتيكي ، وليكن القيمة الاسمية المعطاة لهذه المعلمة. كل قيمة منفصلةيمكن ، بالطبع ، أن تحيد بطريقة ما عن القيمة الاسمية المعطاة. من الواضح ، من أجل التحقق من الإعدادات الصحيحة لهذا الجهاز ، تحتاج إلى التأكد من أن متوسط ​​قيمة المعلمة للمنتجات المنتجة عليها يتوافق مع القيمة الاسمية ، أي اختبار فرضية مقابل بديل ، أو ، أو

مع الإعداد التعسفي للجهاز ، قد يكون من الضروري اختبار الفرضية القائلة بأن دقة تصنيع المنتجات لمعامل معين ، معطى من خلال التشتت ، تساوي قيمة معينة، بمعنى آخر. أو ، على سبيل المثال ، حقيقة أن نسبة المنتجات المعيبة التي تنتجها الآلة تساوي القيمة المعطاة p 0 ، أي إلخ.

قد تنشأ مشاكل مماثلة ، على سبيل المثال ، في التحليل المالي ، عندما يكون من الضروري ، وفقًا لبيانات العينة ، تحديد ما إذا كان من الممكن حساب العائد على الأصل نوع معينأو محفظة أوراق مالية ، أو مخاطرها تساوي عددًا معينًا ؛ أو ، بناءً على نتائج التدقيق الانتقائي لوثائق مماثلة ، تحتاج إلى التأكد مما إذا كانت النسبة المئوية للأخطاء التي ارتكبت يمكن اعتبارها مساوية للقيمة الاسمية ، وما إلى ذلك.

في الحالة العامةالفرضيات هذا النوعلها الشكل ، حيث تكون معلمة معينة للتوزيع قيد الدراسة ، وهي منطقة قيمها المحددة ، والتي تتكون في حالة معينة ذات قيمة واحدة.

5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012 محاضرة 6. مقارنة بين عينتين 6-1. فرضية المساواة في الوسائل. العينات المزدوجة 6-2 فترة الثقة لفرق المتوسط. العينات المقترنة 6-3. فرضية التباين المتساوي 6-4. فرضية المساواة في الأسهم 6-5. فاصل الثقة للفرق في الأسهم


2 Ivanov O.V.، 2005 في هذه المحاضرة ... في المحاضرة السابقة قمنا باختبار الفرضية حول المساواة بين وسائل مجموعتين من السكان بشكل عام وقمنا ببناء فاصل ثقة لاختلاف الوسائل في حالة العينات المستقلة. الآن نحن نعتبر معيار اختبار فرضية المساواة في الوسائل وإنشاء فاصل ثقة للاختلاف في الوسائل في حالة العينات المزدوجة (التابعة). بعد ذلك ، في القسم 6-3 ، سيتم اختبار فرضية المساواة في الفروق ، في القسم 6-4 ، فرضية المساواة في الحصص. أخيرًا ، نقوم ببناء فاصل ثقة للفرق في الأسهم.


5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012 فرضية المساواة في الوسائل. نماذج مقترنة بيان المشكلة الفرضيات والإحصاءات تسلسل الإجراءات مثال


4 Ivanov O.V. ، 2005 عينات مقترنة. وصف المشكلة ما لدينا 1. اثنان بسيط عينات عشوائيةتم الحصول عليها من مجموعتين. العينات مقترنة (تابعة). 2. حجم كلتا العينتين n 30. إذا لم يكن الأمر كذلك ، فسيتم أخذ العينات من مجموعات سكانية موزعة بشكل طبيعي. ما نريد اختبار الفرضية حول الفرق بين متوسطات مجموعتين من السكان:


5 Ivanov O.V. ، 2005 إحصائيات للعينات المزدوجة لاختبار فرضية ، يتم استخدام الإحصائيات: أين - الفرق بين قيمتين في زوج واحد - المتوسط ​​العام للاختلافات المزدوجة - متوسط ​​العينة للاختلافات المزدوجة - الانحراف المعياريالاختلافات للعينة - عدد الأزواج


6 Ivanov O.V. ، 2005 مثال. تدريب الطلاب قامت مجموعة من 15 طالبًا بإجراء الاختبار قبل التدريب وبعده. نتائج الاختبار في الجدول. دعنا نتحقق من فرضية العينات المزدوجة لغياب تأثير التدريب على إعداد الطلاب عند مستوى دلالة 0.05. المحلول. دعونا نحسب الفروق ومربعاتها. StudentBeforeAfter Σ = 21 Σ = 145


7 Ivanov O.V. ، 2005 الحل الخطوة 1. الفرضيات الرئيسية والبديلة: الخطوة 2. مستوى الأهمية = 0.05 تم تعيينه. الخطوة 3. وفقًا لجدول df = 15 - 1 = 14 ، نجد القيمة الحرجة t = 2.145 ونكتب المنطقة الحرجة: t> 2.145. 2.145. "> 2.145."> 2.145. "title =" (! LANG: 7 Ivanov O.V. ، 2005 الحل الخطوة 1. الفرضيات الرئيسية والبديلة: الخطوة 2. تم تعيين مستوى الأهمية = 0.05. الخطوة 3. في الجدول لـ df = 15-1 = 14 نجد القيمة الحرجة t = 2.145 ونكتب المنطقة الحرجة: t> 2.145."> title="7 Ivanov O.V. ، 2005 الحل الخطوة 1. الفرضيات الرئيسية والبديلة: الخطوة 2. مستوى الأهمية = 0.05 تم تعيينه. الخطوة 3. وفقًا لجدول df = 15 - 1 = 14 ، نجد القيمة الحرجة t = 2.145 ونكتب المنطقة الحرجة: t> 2.145."> !}




9 Ivanov O.V. ، 2005 إحصائيات الحل تأخذ القيمة: الخطوة 5. لنقارن القيمة التي تم الحصول عليها مع المنطقة الحرجة. 1.889


5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012 فاصل الثقة لفرق المتوسط. عينات مقترنة بيان المشكلة طريقة تكوين مثال فترة الثقة


11 Ivanov OV، 2005 وصف المشكلة ما لدينا لدينا عينتان عشوائيتان (غير تابعتان) بحجم n من مجموعتين عموميتين. السكان لديهم توزيع طبيعي مع المعلمات 1 ، 1 و 2 ، 2 ، أو كلا حجم العينة هو 30. ما نريده لتقدير القيمة المتوسطة للاختلافات الزوجية لمجموعتين. للقيام بذلك ، قم بإنشاء فاصل ثقة للمتوسط ​​في النموذج:






5 تشرين الثاني (نوفمبر) 2012 5 تشرين الثاني (نوفمبر) 2012 5 تشرين الثاني (نوفمبر) 2012 5 تشرين الثاني (نوفمبر) 2012 بيان مشكلة فرضية التباين المتساوي الفرضيات والإحصاءات تسلسل الإجراءات مثال


15 Ivanov O.V. ، 2005 في سياق الدراسة ... قد يحتاج الباحث إلى التحقق من الافتراض بأن الفروق بين المجموعتين المدروستين متساوية. في الحالة التي يكون فيها التوزيع الطبيعي لهذه المجموعات السكانية العامة ، هناك اختبار F لهذا ، ويسمى أيضًا اختبار فيشر. على عكس الطالب ، لم يعمل فيشر في مصنع الجعة.


16 Ivanov OV، 2005 وصف المشكلة ما لدينا 1. عينتان عشوائيتان بسيطتان تم الحصول عليها من مجموعتين من السكان الموزعين بشكل طبيعي. 2. عينات مستقلة. هذا يعني أنه لا توجد علاقة بين موضوعات العينات. ما نريد اختبار فرضية المساواة في التباينات السكانية:














23 Ivanov OV ، 2005 مثال يريد باحث طبي التحقق مما إذا كان هناك فرق بين معدل ضربات القلب للمدخنين وغير المدخنين (عدد النبضات في الدقيقة). يتم عرض نتائج مجموعتين تم اختيارهما عشوائيًا أدناه. باستخدام α = 0.05 ، اكتشف ما إذا كان الطبيب على حق. المدخنون


24 Ivanov O.V. ، 2005 الحل الخطوة 1. الفرضيات الرئيسية والبديلة: الخطوة 2. مستوى الأهمية = 0.05 تم تعيينه. الخطوة 3. وفقًا للجدول الخاص بعدد درجات الحرية للبسط 25 والمقام 17 ، نجد القيمة الحرجة f = 2.19 والمنطقة الحرجة: f> 2.19. الخطوة 4. بناءً على العينة ، نحسب قيمة الإحصائيات: 2.19. الخطوة 4. بناءً على العينة ، نحسب قيمة الإحصائيات: ">




5 تشرين الثاني (نوفمبر) 2012 5 تشرين الثاني (نوفمبر) 2012 5 تشرين الثاني (نوفمبر) 2012 5 تشرين الثاني (نوفمبر) 2012 فرضية المساواة في الأسهم بيان المشكلة الفرضيات والإحصاءات تسلسل الإجراءات مثال


27 Ivanov OV، 2005 سؤال من بين 100 طالب تم اختيارهم عشوائيًا من كلية علم الاجتماع ، يحضر 43 منهم دورات خاصة. من بين 200 من طلاب الاقتصاد الذين تم اختيارهم عشوائيًا ، 90 منهم يحضرون دورات خاصة. هل تختلف نسبة الطلاب الملتحقين بدورات خاصة في أقسام علم الاجتماع والاقتصاد؟ لا يبدو أن الأمر مختلف بشكل كبير. كيف تتحقق منه؟ حصة أولئك الذين يحضرون دورات خاصة هي حصة الميزة. 43- عدد "النجاحات". 43/100 - نصيب من النجاح. المصطلحات هي نفسها المستخدمة في مخطط برنولي.


28 Ivanov OV، 2005 وصف المشكلة ما لدينا 1. عينتان عشوائيتان بسيطتان تم الحصول عليهما من مجموعتين من السكان الموزعين بشكل طبيعي. العينات مستقلة. 2. بالنسبة للعينات ، يتم استيفاء np 5 و nq 5. وهذا يعني أن ما لا يقل عن 5 عناصر من العينة لها قيمة الميزة قيد الدراسة ، و 5 على الأقل ليست كذلك. ماذا نريد اختبار الفرضية حول المساواة في حصص السمة في مجموعتين عامتين:






31 Ivanov O.V.، 2005 مثال. دورات خاصة لكليتين من بين 100 طالب تم اختيارهم عشوائيًا من كلية علم الاجتماع ، يحضر 43 منهم دورات خاصة. من بين 200 طالب اقتصاد ، 90 منهم يحضرون دورات خاصة. عند مستوى الدلالة = 0.05 ، اختبر الفرضية القائلة بعدم وجود فرق بين حصة حضور دورات خاصة في هاتين الكليتين. 33 Ivanov O.V.، 2005 الحل الخطوة 1. الفرضيات الرئيسية والبديلة: الخطوة 2. مستوى الأهمية = 0.05 تم تعيينه. الخطوة 3. وفقًا لجدول التوزيع الطبيعي ، نجد القيم الحرجة z = - 1.96 و z = 1.96 ونبني المنطقة الحرجة: z 1.96. الخطوة 4. بناءً على العينة ، نحسب قيمة الإحصائيات.


34 Ivanov O.V. ، 2005 الحل الخطوة 5. لنقارن القيمة التي تم الحصول عليها مع المنطقة الحرجة. القيمة الإحصائية الناتجة لم تقع في المنطقة الحرجة. الخطوة 6. نصوغ الاستنتاج. لا يوجد سبب لرفض الفرضية الرئيسية. لا تختلف نسبة الملتحقين بدورات خاصة بشكل كبير من الناحية الإحصائية.


5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012 5 نوفمبر 2012





يتم إجراء التحقق من تجانس عينتين باستخدام اختبار الطالب (أو ر- معايير). ضع في اعتبارك بيان مشكلة التحقق من تجانس عينتين. يجب أن يكون هناك عينتان من الحجم و. بحاجة للتأكد فرضية العدمأن الوسائل العامة للعينتين متساوية. هذا هو و. ن 1

قبل التفكير في منهجية حل المشكلة ، ضع في اعتبارك البعض الأحكام النظريةتستخدم لحل المشكلة. عالم الرياضيات الشهير دبليو. أثبت Gosset (الذي نشر عددًا من أعماله تحت اسم مستعار Student) هذه الإحصائيات ر(6.4) يخضع لقانون توزيع معين ، والذي سُمي لاحقًا بقانون توزيع الطلاب (الاسم الثاني للقانون هو " ر- توزيع").

يعني قيمة متغير عشوائي X;

القيمة المتوقعةمتغير عشوائي X;

الانحراف المعياري لمتوسط ​​حجم العينة ن.

صف دراسي الانحراف المعيارييتم حساب المتوسط ​​بالصيغة (6.5):

الانحراف المعياري لمتغير عشوائي X.

يحتوي توزيع الطلاب على معلمة واحدة - عدد درجات الحرية.

لنعد الآن إلى الصياغة الأصلية لمشكلة العينة المزدوجة وننظر فيها متغير عشوائييساوي الفرق بين متوسطي عينتين (6.6):

(6.6)

بشرط استيفاء فرضية المساواة في المعدلات العامة ، يكون (6.7) صحيحًا:

(6.7)

دعونا نعيد كتابة العلاقة (6.4) لحالتنا:

يمكن التعبير عن تقدير الانحراف المعياري من حيث تقدير الانحراف المعياري المجمع للسكان (6.9):

(6.9)

يمكن التعبير عن تقدير التباين في المجتمع المجمع من حيث تقديرات التباين المحسوبة من عينتين و:

(6.10)

مع الأخذ بعين الاعتبار الصيغة (6.10) ، يمكن إعادة كتابة العلاقة (6.9) بالشكل (6.11). العلاقة (6.9) هي الأساس صيغة الحسابيعني مشاكل المقارنة:

عند استبدال القيمة في الصيغة (6.8) ، سيكون لدينا قيمة عينة ر-معايير . حسب جداول توزيع الطالب مع عدد درجات الحرية ويمكن تحديد مستوى معين من الأهمية. الآن ، إذا ، فسيتم رفض الفرضية حول المساواة بين الوسيلتين.

ضع في اعتبارك مثالًا لإجراء العمليات الحسابية لاختبار فرضية المساواة بين متوسطين في EXCEL. دعونا نشكل جدول بيانات (الشكل 6.22). سنقوم بتوليد البيانات باستخدام برنامج التوليد أرقام عشوائيةحزمة "تحليل البيانات":

عينة X1 من التوزيع الطبيعي مع المعلمات الصوت ؛

X2 هي عينة من التوزيع الطبيعي مع معلمات الحجم ؛

عينة X3 من التوزيع الطبيعي مع المعلمات الصوت ؛

عينة X4 من التوزيع الطبيعي مع المعلمات الصوت.


دعنا نتحقق من فرضية المساواة بين وسيلتين (X1-X2) ، (X1-X3) ، (X1-X4). في البداية ، نحسب معلمات عينات الميزة X1-X4 (الشكل 6.23). ثم نحسب القيمة ر- معايير. سيتم إجراء الحسابات باستخدام الصيغ (6.6) - (6.9) في EXCEL. نلخص نتائج الحسابات في جدول (الشكل 6.24).

أرز. 6.22. جدول البيانات

أرز. 6.23. معلمات اختيار الميزة X1-X4

أرز. 6.24 جدول ملخص لحساب القيم ر- معايير أزواج الميزات (X1-X2) ، (X1-X3) ، (X1-X4)

حسب النتائج الواردة في الجدول في الشكل. 6.24 ، يمكننا أن نستنتج أنه بالنسبة لزوج من الميزات (X1-X2) ، يتم رفض فرضية المساواة في متوسطات ميزتين ، وبالنسبة لأزواج الميزات (X1-X3) ، (X1-X4) ، يمكن للفرضية تعتبر عادلة.

يمكن الحصول على نفس النتائج باستخدام برنامج "Two-sample ر-اختبار بنفس الفروق "لحزمة تحليل البيانات. تظهر واجهة البرنامج في الشكل. 6.25.

أرز. 6.25. معلمات برنامج "عينتان ر- اختبار مع تباينات متساوية "

تظهر في الشكل نتائج الحسابات الخاصة باختبار فرضيات المساواة لزوجين متوسطين من الميزات (X1-X2) ، (X1-X3) ، (X1-X4) ، التي تم الحصول عليها باستخدام البرنامج. 6.26-6.28.

أرز. 6.26. حساب القيمة ر- معيار زوج من الميزات (X1-X2)

أرز. 6.27. حساب القيمة ر- معيار زوج من الميزات (X1-X3)

أرز. 6.28 حساب القيمة ر- معيار زوج من الميزات (X1-X4)

عينتان راختبار مع تباينات متساوية يسمى أيضا ر- اختبار مع عينات مستقلة. توزيع رائعتلقى أيضا ر- الاختبار مع العينات التابعة. تنشأ الحالة عندما يكون من الضروري تطبيق هذا المعيار عندما يتم قياس نفس المتغير العشوائي مرتين. عدد الملاحظات في كلتا الحالتين هو نفسه. دعونا نقدم تدوين قياسين متتاليين لبعض خصائص نفس الكائنات و ، ونشير إلى الفرق بين قياسين متتاليين على النحو التالي:

في هذه الحالة ، تأخذ صيغة قيمة العينة للمعيار الشكل:

, (6.13)

(6.15)

في هذه الحالة ، يكون عدد درجات الحرية. يمكن إجراء اختبار الفرضيات باستخدام برنامج "عينتان مزدوجتان" ر-اختبار "حزمة تحليل البيانات (الشكل 6.29).

أرز. 6.29 معلمات البرنامج "نموذجين مزدوجين ر-اختبار"

6.5. تحليل التباين - التصنيف حسب سمة واحدة (F- المعيار)

في تحليل التباين ، يتم اختبار الفرضية ، وهي تعميم لفرضية المساواة بين وسيلتين للحالة عند اختبار فرضية المساواة بين عدة وسائل في نفس الوقت. في تحليل التباين ، تتم دراسة درجة تأثير واحد أو أكثر من علامات العوامل على العلامة الفعالة. فكرة تحليل التباينينتمي إلى R. Fischer. استخدمها لمعالجة نتائج التجارب الزراعية. يستخدم تحليل التباين لتحديد أهمية التأثير عوامل الجودةللقيمة قيد الدراسة. الاختصار الإنجليزي لتحليل التباين هو ANOVA (اختلاف التحليل).

الشكل العاميعرض الجدول 6.1 عرض البيانات مع تصنيفها وفقًا لخاصية واحدة.

الجدول 6.1. شكل عرض البيانات مع التصنيف حسب صفة واحدة

ضع في اعتبارك عينتين مستقلتين x 1 ، x 2 ، ... .. ، x n و y 1 ، y 2 ، ... ، y n المستخرجة من مجموعات عامة عادية لها نفس التباينات ، وأحجام العينة n و m ، على التوالي ، والمتوسطات μ x و μ y والتباين σ 2 غير معروفين. مطلوب للتحقق من الفرضية الرئيسية Н 0: μ x = μ y مع الفرضية المنافسة Н 1: μ x μ y.

كما هو معروف ، فإن العينة تعني وستكون لها الخصائص التالية: ~ N (μ x ، σ 2 / n) ، ~ N (μ y ، σ 2 / m).

الفرق بينهما هو قيمة طبيعية بمتوسط والتباين ، لذلك

~ (23).

لنفترض لبعض الوقت أن الفرضية الرئيسية H 0 صحيحة: μ x –μ y = 0. ثم وقسمة القيمة على انحرافها المعياري ، نحصل على sl العادي القياسي. القيمة ~ ن (0،1).

سابقا لوحظ أن ضخامة وزعت وفق القانون بدرجة (ن -1) من الحرية أ - وفق القانون بدرجة حرية (م -1). مع الأخذ في الاعتبار استقلالية هذين المبلغين ، نحصل على ذلك المبلغ الإجمالي وزعت حسب القانون بدرجة حرية n + m-2.

بتذكر البند 7 نرى أن الكسر يخضع لتوزيع t (الطالب) بدرجات = m + n-2 من الحرية: Z = t. تحدث هذه الحقيقة فقط عندما تكون الفرضية H 0 صحيحة.

باستبدال ξ و Q بتعبيراتهما ، نحصل على الصيغة الموسعة لـ Z:

(24)

تسمح لك القيمة التالية Z ، التي تسمى إحصائيات المعيار ، باتخاذ قرار بالتسلسل التالي من الإجراءات:

1. تم إنشاء المنطقة D = [- t β، ν، + t β، ν] ، وتحتوي على مناطق β = 1 α تحت توزيع المنحنى t ν (الجدول 10).

2. يتم حساب القيمة التجريبية Z على الإحصاء Z بالصيغة (24) ، والتي بدلاً من X 1 و Y 1 يتم استبدال القيمتين x 1 و y 1 لعينات محددة ، وكذلك متوسطات العينة و.

3. إذا كانت Z على D ، فإن الفرضية H 0 لا تتعارض مع البيانات التجريبية ويتم قبولها.

إذا كانت Z على D ، فإن الفرضية H 1 مقبولة.

إذا كانت الفرضية H 0 صحيحة ، فإن Z تخضع للتوزيع المعروف t ν بمتوسط ​​صفر ومع احتمال كبير β = 1 – α يقع في المجال D لقبول الفرضية H 0. عندما لوحظ ، فإن القيمة التجريبية Z على تقع في D. نحن نعتبر هذا كدليل لصالح الفرضية H 0.

عندما تقع Z 0 n خارج D (كما يقولون ، تقع في المنطقة الحرجة K) ، وهو أمر طبيعي إذا كانت الفرضية H 1 صحيحة ، ولكن من غير المحتمل ، إذا كانت H 0 صحيحة ، فعلينا رفض الفرضية H 0 بواسطة قبول H 1.

المثال 31.

تمت مقارنة علامتين تجاريتين للبنزين: A و B. في 11 سيارة من نفس القوة ، تم اختبار البنزين من الدرجتين A و B مرة واحدة على الطريق السريع الدائري. تعطلت سيارة واحدة في الطريق ولا توجد بيانات للبنزين B لها .

استهلاك البنزين من حيث 100 كيلومتر

الجدول 12

أنا
X ط 10,51 11,86 10,5 9,1 9,21 10,74 10,75 10,3 11,3 11,8 10,9 ن = 11
أنا 13,22 13,0 11,5 10,4 11,8 11,6 10,64 12,3 11,1 11,6 - م = 10

تشتت استهلاك الدرجتين A و B غير معروف ويفترض أنهما متماثلان. هل من الممكن ، عند مستوى أهمية α = 0.05 ، قبول الفرضية القائلة بأن متوسط ​​التكاليف الحقيقية μ A و μ B لهذين النوعين من البنزين متماثلان؟

المحلول. اختبار الفرضية H 0: μ A -μ B \ u003d 0 مع فرضية منافسة. H 1: μ 1 μ 2 قم بالنقاط التالية:

1. ابحث عن متوسط ​​العينة ومجموع الانحرافات التربيعية Q.

;

;

2. احسب القيمة التجريبية لإحصاء Z

3. أوجد الحد t β ، ν من الجدول 10 لتوزيع t ، لعدد درجات الحرية ν = m + n – 2 = 19 و β = 1 – α = 0.95. الجدول 10 يحتوي على t 0.95.20 = 2.09 و t 0.95.15 = 2.13 ولكن لا يوجد t 0.95.19. نجد من خلال الاستيفاء t 0.95.19 = 2.09 + = 2.10.

4. تحقق من أي من المنطقتين D أو K يحتوي على الرقم Z على. المنطقة = -2.7 D = [- 2.10 ؛ -2.10].

نظرًا لأن القيمة الملحوظة لـ Z on تقع في المنطقة الحرجة ، K = R \ D ، فإننا نتجاهلها. H 0 ويقبل الفرضية H 1. في هذه الحالة ، المؤيد ويقال أن لديهم فرق كبير. إذا ، في ظل جميع ظروف هذا المثال ، إذا تم تغيير Q فقط ، على سبيل المثال ، تضاعف Q ، فإن استنتاجنا سيتغير أيضًا. ستؤدي مضاعفة Q إلى انخفاض قيمة Z في بعض المرات ، ثم يقع الرقم Zon فيها المنطقة المسموح بها D ، بحيث تجتاز الفرضية H 0 الاختبار ويتم قبولها. في هذه الحالة ، يمكن تفسير التناقض بين الانتثار الطبيعي للبيانات ، وليس بحقيقة أن μ A μ B.

تعتبر نظرية اختبار الفرضيات شاملة للغاية ، ويمكن أن تكون الفرضيات حول شكل قانون التوزيع ، حول تجانس العينات ، حول استقلالية القيمة العشوائية ، إلخ.

المعيار ج 2 (بيرسون)

المعيار الأكثر شيوعًا لاختبار فرضية بسيطة في الممارسة. يطبق عندما يكون قانون التوزيع غير معروف. ضع في اعتبارك متغير عشوائي X الذي عليه n اختبارات مستقلة. يتم الحصول على الإدراك x 1 ، x 2 ، ... ، x n. من الضروري اختبار الفرضية حول قانون توزيع هذا المتغير العشوائي.

تأمل حالة فرضية بسيطة. تقوم فرضية بسيطة باختبار مدى ملاءمة العينة مع عامه السكانالتي لها توزيع طبيعي (معروف). بالعينات نبني سلسلة الاختلاف x (1) ، x (2) ، ... ، x (n). يتم تقسيم الفاصل الزمني إلى فترات فرعية. دع هذه الفترات تكون r. ثم نجد احتمال أن يقع X في الفاصل الزمني Di ، i = 1 ، ... ، r نتيجة للاختبار ، إذا كانت الفرضية التي يتم اختبارها صحيحة.

لا يتحقق المعيار من حقيقة كثافة الاحتمال ، بل يتحقق من حقيقة الأرقام

مع كل فترة دي نربطها حدث عشوائيأ - ضرب في هذا الفاصل الزمني (ضرب نتيجة اختبار أكثر من X من نتيجة تنفيذه في دي). نقدم متغيرات عشوائية. m i - عدد التجارب من n التي تم إجراؤها ، والتي وقع فيها الحدث A i. أنا موزعة وفقًا للقانون ذي الحدين وفي حالة حقيقة الفرضية

Dm i = np i (1-p i)

المعيار ج 2 له الشكل

ص 1 + ص 2 + ... + ص ص = 1

م 1 + م 2 + ... + م ص = ن

إذا كانت الفرضية التي يتم اختبارها صحيحة ، فإن m i تمثل تكرار حدوث حدث له احتمال p i في كل اختبار من الاختبارات n التي تم إجراؤها ، لذلك يمكننا اعتبار m i متغيرًا عشوائيًا يخضع لقانون ذي الحدين المتمركز في النقطة np أنا. عندما يكون n كبيرًا ، يمكننا أن نفترض أن التردد يتم توزيعه بشكل مقارب بشكل طبيعي باستخدام نفس المعلمات. إذا كانت الفرضية صحيحة ، يجب أن نتوقع أنه سيكون هناك توزيع مقارب بشكل طبيعي

ترتبط مع بعضها البعض

دعونا نفكر في القيمة

ج 2 - مجموع المربعات مقارب القيم العاديةذات صلة الاعتماد الخطي. سبق أن التقينا بحالة مماثلة ونعلم بوجودها اتصال خطيأدى إلى انخفاض بمقدار واحد في عدد درجات الحرية.

إذا كانت الفرضية التي يتم اختبارها صحيحة ، فإن المعيار c 2 له توزيع يميل عند n® ¥ إلى التوزيع c 2 مع r-1 درجات الحرية.

لنفترض أن الفرضية خاطئة. ثم هناك ميل لزيادة الشروط في المجموع ، أي إذا كانت الفرضية خاطئة ، فسيقع هذا المجموع في منطقة معينة قيم كبيرةج 2. كمنطقة حرجة ، نأخذ المنطقة القيم الإيجابيةمعايير


في حالة معلمات التوزيع غير المعروفة ، تقلل كل معلمة عدد درجات الحرية لمعيار بيرسون بمقدار واحد