السير الذاتية صفات التحليلات

أوجد الانحراف المعياري. تشتت

الانحراف المعياري هو مؤشر كلاسيكي للتباين من الإحصاء الوصفي.

الانحراف المعياري، الانحراف المعياري ، RMS ، نموذج الانحراف المعياري (الانحراف المعياري الإنجليزي ، STD ، STDev) هو مقياس شائع جدًا للتشتت في الإحصاء الوصفي. ولكن التحليل الفني شبيه بالإحصاءات ، ويمكن (ويجب) استخدام هذا المؤشر في التحليل الفني لاكتشاف درجة تشتت سعر الأداة التي تم تحليلها بمرور الوقت. يشار إليها بالرمز اليوناني سيجما "σ".

بفضل Karl Gauss و Pearson لحقيقة أن لدينا فرصة لاستخدام الانحراف المعياري.

استخدام الانحراف المعياري في التحليل الفني، ندير هذا "مؤشر التشتت" في "مؤشر التقلب"حفظ المعنى مع تغيير المصطلحات.

ما هو الانحراف المعياري

ولكن بالإضافة إلى الحسابات المساعدة الوسيطة ، الانحراف المعياري مقبول تمامًا للحساب الذاتيوالتطبيقات في التحليل الفني. كما لاحظ أحد القراء النشطين لمجلة الأرقطيون ، " ما زلت لا أفهم سبب عدم تضمين RMS في مجموعة المؤشرات القياسية لمراكز التعامل المحلية«.

حقًا، يمكن للانحراف المعياري بطريقة كلاسيكية و "خالصة" قياس تنوع الأداة. لكن لسوء الحظ ، هذا المؤشر ليس شائعًا جدًا في تحليل الأوراق المالية.

تطبيق الانحراف المعياري

لا يعد حساب الانحراف المعياري يدويًا أمرًا مثيرًا للاهتمام.لكنها مفيدة للتجربة. يمكن التعبير عن الانحراف المعياريالصيغة STD = √ [(∑ (x-x) 2) / n] ، والتي تبدو مثل المجموع الجذري للاختلافات التربيعية بين عناصر العينة والمتوسط ​​، مقسومًا على عدد العناصر في العينة.

إذا تجاوز عدد العناصر في العينة 30 ، فإن مقام الكسر تحت الجذر يأخذ القيمة n-1. خلاف ذلك ، يتم استخدام n.

خطوة بخطوة حساب الانحراف المعياري:

  1. حساب المتوسط ​​الحسابي لعينة البيانات
  2. اطرح هذا المتوسط ​​من كل عنصر من عناصر العينة
  3. يتم تربيع جميع الفروق الناتجة
  4. اجمع كل المربعات الناتجة
  5. قسّم المجموع الناتج على عدد العناصر في العينة (أو على n-1 إذا كانت n> 30)
  6. احسب الجذر التربيعي للحاصل الناتج (يسمى تشتت)

وفقًا لمسح العينة ، تم تصنيف المودعين وفقًا لحجم الوديعة في سبيربنك بالمدينة:

حدد:

1) مدى التباين ؛

2) متوسط ​​مبلغ الإيداع ؛

3) متوسط ​​الانحراف الخطي.

4) التشتت.

5) الانحراف المعياري.

6) معامل التباين في الاشتراكات.

المحلول:

تحتوي سلسلة التوزيع هذه على فترات زمنية مفتوحة. في مثل هذه السلسلة ، يُفترض تقليديًا أن تكون قيمة الفاصل الزمني للمجموعة الأولى مساوية لقيمة الفاصل الزمني للمجموعة التالية ، وقيمة الفاصل الزمني للمجموعة الأخيرة تساوي قيمة الفترة السابقة واحد.

قيمة الفاصل الزمني للمجموعة الثانية هي 200 ، وبالتالي فإن قيمة المجموعة الأولى هي أيضًا 200. قيمة الفاصل الزمني للمجموعة قبل الأخيرة هي 200 ، مما يعني أن الفترة الأخيرة ستكون لها أيضًا قيمة تساوي 200.

1) حدد نطاق التباين على أنه الفرق بين أكبر وأصغر قيمة للسمة:

نطاق التباين في حجم المساهمة هو 1000 روبل.

2) يتم تحديد متوسط ​​حجم المساهمة بواسطة معادلة المتوسط ​​الحسابي المرجح.

دعونا نحدد بشكل مبدئي القيمة المنفصلة للسمة في كل فترة. للقيام بذلك ، باستخدام صيغة المتوسط ​​الحسابي البسيط ، نجد نقاط المنتصف للفترات.

سيكون متوسط ​​قيمة الفترة الزمنية الأولى مساويًا لـ:

الثاني - 500 ، إلخ.

لنضع نتائج العمليات الحسابية في الجدول:

مبلغ الإيداع ، فرك.عدد المساهمين ، ومنتصف الفترة xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
المجموع 400 - 312000

سيكون متوسط ​​الإيداع في سبيربنك بالمدينة 780 روبل:

3) متوسط ​​الانحراف الخطي هو المتوسط ​​الحسابي للانحرافات المطلقة للقيم الفردية للسمة عن المتوسط ​​الكلي:

يكون الإجراء الخاص بحساب متوسط ​​الانحراف الخطي في سلسلة التوزيع الفاصل كما يلي:

1. يتم حساب المتوسط ​​المرجح الحسابي ، كما هو موضح في الفقرة 2).

2. يتم تحديد الانحرافات المطلقة للمتغير عن المتوسط:

3. يتم ضرب الانحرافات التي تم الحصول عليها في الترددات:

4. تم إيجاد مجموع الانحرافات الموزونة دون مراعاة العلامة:

5. مجموع الانحرافات الموزونة مقسومًا على مجموع التكرارات:

من الملائم استخدام جدول البيانات المحسوبة:

مبلغ الإيداع ، فرك.عدد المساهمين ، ومنتصف الفترة x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
المجموع 400 - - - 81280

متوسط ​​الانحراف الخطي لحجم إيداع عملاء سبيربنك هو 203.2 روبل.

4) التشتت هو المتوسط ​​الحسابي للانحرافات التربيعية لكل قيمة خاصية عن الوسط الحسابي.

يتم حساب التباين في سلسلة التوزيع الفاصل وفقًا للصيغة:

يكون إجراء حساب التباين في هذه الحالة كما يلي:

1. تحديد المتوسط ​​المرجح الحسابي ، كما هو موضح في الفقرة 2).

2. ابحث عن الانحرافات عن المتوسط:

3. تربيع انحراف كل خيار عن المتوسط:

4. ضرب الانحرافات التربيعية بالأوزان (الترددات):

5. تلخيص الأعمال الواردة:

6. يتم قسمة المبلغ الناتج على مجموع الأوزان (الترددات):

لنضع الحسابات في جدول:

مبلغ الإيداع ، فرك.عدد المساهمين ، ومنتصف الفترة x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
المجموع 400 - - - 23040000

الدرس رقم 4

الموضوع: "الإحصاء الوصفي. مؤشرات تنوع السمة في المجموع "

المعايير الرئيسية لتنوع سمة في المجتمع الإحصائي هي: الحد ، والسعة ، والانحراف المعياري ، ومعامل التذبذب ، ومعامل التباين. في الدرس السابق ، تمت مناقشة أن القيم المتوسطة تعطي فقط خاصية عامة للسمة المدروسة في المجموع ولا تأخذ في الاعتبار قيم متغيراتها الفردية: القيم الدنيا والقصوى ، فوق المتوسط ، أقل من المتوسط ​​، إلخ.

مثال. متوسط ​​قيم تسلسلين عدديين مختلفين: -100 ؛ - عشرين. 100 ؛ 20 و 0.1 ؛ -0.2 ؛ 0.1 متطابقان تمامًا ومتساويانس.ومع ذلك ، فإن نطاقات تشتت البيانات لهذه التسلسلات المتوسطة النسبية مختلفة تمامًا.

يتم تنفيذ تعريف المعايير المدرجة لتنوع سمة في المقام الأول مع الأخذ في الاعتبار قيمتها للعناصر الفردية من المجتمع الإحصائي.

مؤشرات قياس اختلاف سمة هي مطلقو نسبيا. تشمل المؤشرات المطلقة للتباين: نطاق التباين ، والحد ، والانحراف المعياري ، والتباين. يشير معامل الاختلاف ومعامل التذبذب إلى مقاييس التباين النسبية.

الحد (محدود) -هذا هو المعيار الذي تحدده القيم القصوى للمتغير في سلسلة التباين. بمعنى آخر ، هذا المعيار مقيد بالحد الأدنى والحد الأقصى لقيم السمة:

السعة (Am)أو نطاق الاختلاف -هذا هو الفرق بين النقيضين. يتم حساب هذا المعيار عن طريق طرح الحد الأدنى لقيمته من الحد الأقصى لقيمة السمة ، مما يجعل من الممكن تقدير درجة تشتت المتغير:

عيب الحد والسعة كمعيارين للتغير هو أنهما يعتمدان كليًا على القيم القصوى للسمة في سلسلة التباين. في هذه الحالة ، لا تؤخذ في الاعتبار التقلبات في قيم السمة داخل السلسلة.

يتم تقديم التوصيف الأكثر اكتمالا لتنوع سمة في مجتمع إحصائي بواسطة الانحراف المعياري(سيغما) ، وهو مقياس عام لانحراف متغير عن قيمته المتوسطة. غالبًا ما يشار إلى الانحراف المعياري باسم الانحراف المعياري.

أساس الانحراف المعياري هو مقارنة كل خيار بالمتوسط ​​الحسابي لهذا المجتمع. نظرًا لأنه في المجموع ، ستكون هناك دائمًا خيارات أقل وأكبر منها ، فسيتم سداد مجموع الانحرافات التي تحمل علامة "" بمجموع الانحرافات التي تحمل العلامة "" ، أي مجموع كل الانحرافات صفر. من أجل تجنب تأثير علامات الفروق ، يتم أخذ انحرافات المتغير عن مربع الوسط الحسابي ، أي . مجموع الانحرافات التربيعية لا يساوي الصفر. للحصول على معامل قادر على قياس التباين ، خذ متوسط ​​مجموع المربعات - تسمى هذه القيمة تشتت:

حسب التعريف ، التباين هو متوسط ​​مربع انحرافات القيم الفردية للميزة عن قيمتها المتوسطة. تشتت مربع الانحراف المعياري.

التشتت هو كمية الأبعاد (المسماة). لذلك ، إذا تم التعبير عن متغيرات سلسلة الأرقام بالأمتار ، فإن التشتت يعطي مترًا مربعًا ؛ إذا تم التعبير عن المتغيرات بالكيلوجرام ، فإن التباين يعطي مربع هذا المقياس (كجم 2) ، وهكذا.

الانحراف المعياريهو الجذر التربيعي للتباين:

، ثم عند حساب التباين والانحراف المعياري في مقام الكسر ، بدلاً منمن الضروري أن تضع.

يمكن تقسيم حساب الانحراف المعياري إلى ست مراحل ، والتي يجب تنفيذها في تسلسل معين:

تطبيق الانحراف المعياري:

أ) للحكم على تذبذب السلاسل المتغيرة وتقييم مقارن للنمطية (التمثيلية) للوسائل الحسابية. هذا ضروري في التشخيص التفريقي عند تحديد ثبات العلامات.

ب) لإعادة بناء السلسلة المتغيرة ، أي استعادة استجابة التردد على أساس ثلاث قواعد سيجما. في الفاصل الزمني (М ± 3σ) يوجد 99.7٪ من جميع متغيرات السلسلة في الفاصل الزمني (М ± 2σ) - 95.5٪ وفي الفترة (М ± 1σ) - خيار الصف 68.3٪(رسم بياني 1).

ج) لتحديد الخيارات "المنبثقة"

د) لتحديد معايير القاعدة وعلم الأمراض باستخدام تقديرات سيجما

ه) لحساب معامل الاختلاف

هـ) لحساب متوسط ​​الخطأ للمتوسط ​​الحسابي.

لتوصيف أي مجموعة عامة لديهانوع التوزيع الطبيعي ، يكفي معرفة معلمتين: المتوسط ​​الحسابي والانحراف المعياري.

الشكل 1. ثلاثة سيغما القاعدة

مثال.

في طب الأطفال ، يتم استخدام الانحراف المعياري لتقييم التطور البدني للأطفال من خلال مقارنة بيانات طفل معين مع المؤشرات القياسية المقابلة. تؤخذ المؤشرات الحسابية للتطور البدني للأطفال الأصحاء كمعيار. تتم مقارنة المؤشرات بالمعايير وفقًا لجداول خاصة ، حيث يتم تقديم المعايير جنبًا إلى جنب مع مقاييس سيجما المقابلة لها. يُعتقد أنه إذا كان مؤشر التطور البدني للطفل ضمن المعيار (المتوسط ​​الحسابي) ± σ ، فإن النمو البدني للطفل (وفقًا لهذا المؤشر) يتوافق مع القاعدة. إذا كان المؤشر ضمن المعيار ± 2σ ، فهناك انحراف طفيف عن القاعدة. إذا تجاوز المؤشر هذه الحدود ، فإن النمو البدني للطفل يختلف بشكل حاد عن القاعدة (علم الأمراض ممكن).

بالإضافة إلى مؤشرات التباين المعبر عنها بالقيم المطلقة ، يستخدم البحث الإحصائي مؤشرات التباين المعبر عنها بالقيم النسبية. معامل التذبذب -هذه هي نسبة نطاق التباين إلى متوسط ​​قيمة السمة. معامل الاختلاف -هذه هي نسبة الانحراف المعياري إلى متوسط ​​قيمة الميزة. عادة ، يتم التعبير عن هذه القيم كنسبة مئوية.

الصيغ لحساب المؤشرات النسبية للتباين:

من الصيغ أعلاه يمكن ملاحظة أنه كلما زاد المعامل الخامس بالقرب من الصفر ، كلما كان تباين قيم السمات أصغر. الاكثر الخامس، كلما كانت العلامة أكثر تغيرًا.

في الممارسة الإحصائية ، غالبًا ما يستخدم معامل الاختلاف. يتم استخدامه ليس فقط لإجراء تقييم مقارن للتباين ، ولكن أيضًا لتوصيف تجانس السكان. تعتبر المجموعة متجانسة إذا كان معامل الاختلاف لا يتجاوز 33٪ (للتوزيعات القريبة من الوضع الطبيعي). من الناحية الحسابية ، تلغي نسبة σ والمتوسط ​​الحسابي تأثير القيمة المطلقة لهذه الخصائص ، وتجعل نسبة النسبة المئوية معامل التباين قيمة بلا أبعاد (غير مسماة).

يتم تقدير القيمة التي تم الحصول عليها لمعامل الاختلاف وفقًا للتدرجات التقريبية لدرجة تنوع السمة:

ضعيف - حتى 10٪

متوسط ​​- 10-20٪

قوي - أكثر من 20٪

يُنصح باستخدام معامل الاختلاف في الحالات التي يكون فيها من الضروري مقارنة الميزات المختلفة في الحجم والأبعاد.

يتم توضيح الفرق بين معامل التباين ومعايير التشتت الأخرى بوضوح بواسطة مثال.

الجدول 1

تكوين العاملين في مؤسسة صناعية

بناءً على الخصائص الإحصائية الواردة في المثال ، يمكن استنتاج أن التركيب العمري والمستوى التعليمي لموظفي المؤسسة متجانسين نسبيًا ، مع انخفاض الاستقرار المهني للوحدة التي شملتها الدراسة. من السهل أن نرى أن محاولة الحكم على هذه الاتجاهات الاجتماعية من خلال الانحراف المعياري ستؤدي إلى نتيجة خاطئة ، ومحاولة مقارنة السمات المحاسبية "خبرة العمل" و "العمر" مع السمة المحاسبية "التعليم" ستكون بشكل عام غير صحيح بسبب عدم تجانس هذه الميزات.

الوسيط والنسب المئوية

بالنسبة إلى التوزيعات الترتيبية (المرتبة) ، حيث يكون معيار منتصف السلسلة هو الوسيط ، لا يمكن أن يعمل الانحراف المعياري والتباين كخصائص تشتت المتغير.

نفس الشيء صحيح بالنسبة للسلسلة المتغيرة المفتوحة. يرجع هذا الظرف إلى حقيقة أن الانحرافات ، التي يتم بموجبها حساب التشتت و ، يتم حسابها من المتوسط ​​الحسابي ، الذي لا يتم حسابه في سلسلة متغيرات مفتوحة وفي سلسلة توزيعات السمات النوعية. لذلك ، لوصف مضغوط للتوزيعات ، يتم استخدام معلمة تبعثر أخرى - كمية(مرادف - "النسبة المئوية") ، مناسبة لوصف الخصائص النوعية والكمية في أي شكل من أشكال توزيعها. يمكن أيضًا استخدام هذه المعلمة لتحويل السمات الكمية إلى سمات نوعية. في هذه الحالة ، يتم تعيين مثل هذه الدرجات اعتمادًا على أي ترتيب للكمية يتوافق مع خيار معين أو آخر.

في ممارسة البحوث الطبية الحيوية ، غالبًا ما تستخدم الكميات التالية:

- الوسيط؛

، هي أرباع (أرباع) ، أين الربع السفلي ، الربع الأعلى.

تقسم الكميات مساحة التغييرات المحتملة في سلسلة متغيرة إلى فترات زمنية معينة. الوسيط (الكمي) هو المتغير الموجود في منتصف سلسلة التباين ويقسم هذه السلسلة إلى نصفين ، إلى جزأين متساويين ( 0,5 و 0,5 ). يقسم الربيع السلسلة إلى أربعة أجزاء: الجزء الأول (الربيع الأدنى) هو خيار فصل الخيارات التي لا تتجاوز قيمها العددية 25٪ من الحد الأقصى الممكن في هذه السلسلة ، والربيع يفصل الخيارات بقيمة عددية تصل إلى 50 ٪ من الحد الأقصى الممكن. يفصل الربيع الأعلى () الخيارات حتى 75٪ من القيم القصوى الممكنة.

في حالة التوزيع غير المتماثل متغير بالنسبة إلى المتوسط ​​الحسابي ، يتم استخدام الوسيط والربيع لتوصيفه.في هذه الحالة ، يتم استخدام الشكل التالي لعرض متوسط ​​القيمة - أنا (;). فمثلا، السمة قيد الدراسة - "الفترة التي بدأ فيها الطفل المشي بشكل مستقل" - في مجموعة الدراسة لها توزيع غير متماثل. في الوقت نفسه ، يتوافق الربع السفلي () مع بداية المشي - 9.5 شهرًا ، والوسيط - 11 شهرًا ، والربيع الأعلى () - 12 شهرًا. وفقًا لذلك ، سيتم تقديم خاصية متوسط ​​الاتجاه للسمة المحددة على أنها 11 (9.5 ، 12) شهرًا.

تقييم الدلالة الإحصائية لنتائج الدراسة

تُفهم الأهمية الإحصائية للبيانات على أنها درجة تطابقها مع الواقع المعروض ، أي البيانات ذات الدلالة الإحصائية هي تلك التي لا تشوه وتعكس الواقع الموضوعي بشكل صحيح.

لتقييم الأهمية الإحصائية لنتائج دراسة ما يعني تحديد الاحتمالية التي يمكن أن تنقل النتائج التي تم الحصول عليها على عينة من السكان إلى المجتمع بأكمله. تقييم الأهمية الإحصائية ضروري لفهم إلى أي مدى يمكن استخدام جزء من الظاهرة للحكم على الظاهرة ككل وأنماطها.

يتكون تقييم الدلالة الإحصائية لنتائج الدراسة من:

1. أخطاء التمثيل (أخطاء المتوسط ​​والقيم النسبية) - م;

2. حدود الثقة للمتوسط ​​أو القيم النسبية.

3. موثوقية الاختلاف بين القيم المتوسطة أو النسبية حسب المعيار ر.

الخطأ المعياري للمتوسط ​​الحسابيأو خطأ في التمثيليميز التقلبات في المتوسط. وتجدر الإشارة إلى أنه كلما زاد حجم العينة ، قل انتشار القيم المتوسطة. يتم حساب الخطأ المعياري للمتوسط ​​بواسطة الصيغة:

في الأدبيات العلمية الحديثة ، تتم كتابة المتوسط ​​الحسابي مع الخطأ التمثيلي:

أو مع الانحراف المعياري:

كمثال ، ضع في اعتبارك بيانات 1500 عيادة حضرية في الدولة (عامة السكان). متوسط ​​عدد المرضى الذين يتم خدمتهم في العيادة هو 18150 شخصًا. يعطي الاختيار العشوائي لـ 10٪ من الأشياء (150 مستوصفًا) عددًا متوسطًا من المرضى يساوي 20051 شخصًا. خطأ أخذ العينات ، المرتبط بشكل واضح بحقيقة أنه لم يتم تضمين جميع العيادات البالغ عددها 1500 مجمع في العينة ، يساوي الفرق بين هذه المتوسطات - المعدل العام ( مالجين) ومتوسط ​​العينة ( م sb). إذا شكلنا عينة أخرى من نفس الحجم من تعدادنا ، فستعطي قدرًا مختلفًا من الخطأ. يتم عادةً توزيع كل هذه العينات ، مع عينات كبيرة بما فيه الكفاية ، حول المتوسط ​​العام مع عدد كبير من التكرارات لعينة من نفس العدد من الكائنات من عامة السكان. الخطأ المعياري للمتوسط مهو حتمية انتشار العينة حول المتوسط ​​العام.

في حالة تمثيل نتائج الدراسة بقيم نسبية (على سبيل المثال ، النسب المئوية) ، فإن مشاركة الخطأ المعياري:

حيث P هو المؤشر في ٪ ، ن هو عدد المشاهدات.

يتم عرض النتيجة على شكل (ف ± م)٪. فمثلا،كانت نسبة الشفاء بين المرضى (95.2 ± 2.5)٪.

إذا كان عدد العناصر في السكان، ثم عند حساب الأخطاء المعيارية للمتوسط ​​والحصة في مقام الكسر ، بدلاً منمن الضروري أن تضع.

بالنسبة للتوزيع الطبيعي (توزيع متوسط ​​العينة أمر طبيعي) ، من المعروف كم من السكان يقع ضمن أي فاصل زمني حول المتوسط. خاصه:

في الممارسة العملية ، تكمن المشكلة في حقيقة أن خصائص عامة السكان غير معروفة لنا ، وأن العينة مصنوعة على وجه التحديد لغرض تقييمها. هذا يعني أننا إذا أخذنا عينات من نفس الحجم نمن عامة السكان ، ثم في 68.3٪ من الحالات ، سيحتوي الفاصل الزمني على القيمة م(سيكون في الفترة الزمنية في 95.5٪ من الحالات وفي الفترة الزمنية في 99.7٪ من الحالات).

نظرًا لأن عينة واحدة فقط تم إجراؤها فعليًا ، فقد تمت صياغة هذا البيان من حيث الاحتمالية: مع احتمال 68.3 ٪ ، يتم احتواء متوسط ​​قيمة السمة في المجتمع العام في الفاصل الزمني ، مع احتمال 95.5 ٪ - في الفاصل الزمني ، إلخ.

من الناحية العملية ، يتم بناء مثل هذا الفاصل الزمني حول قيمة العينة ، والتي من شأنها ، مع وجود احتمال (مرتفع بما يكفي) - احتمالية الثقة -من شأنه أن "يغطي" القيمة الحقيقية لهذه المعلمة في عموم السكان. هذا الفاصل يسمى فاصل الثقة.

احتمال الثقةص هي درجة الثقة في أن فاصل الثقة سيحتوي بالفعل على القيمة الحقيقية (غير المعروفة) للمعامل في المجتمع.

على سبيل المثال ، إذا كان مستوى الثقة صيساوي 90٪ ، وهذا يعني أن 90 عينة من 100 ستعطي تقديرًا صحيحًا للمعامل في عموم السكان. وفقًا لذلك ، فإن احتمال الخطأ ، أي تقدير غير صحيح للمعدلات العامة للعينة ، يساوي النسبة المئوية:. في هذا المثال ، هذا يعني أن 10 عينات من 100 ستعطي تقديرًا غير صحيح.

من الواضح أن درجة الثقة (احتمالية الثقة) تعتمد على حجم الفاصل الزمني: فكلما اتسعت الفترة ، زادت الثقة في أن قيمة غير معروفة لعامة السكان ستقع فيه. في الممارسة العملية ، يتم أخذ ضعف خطأ أخذ العينات على الأقل لإنشاء فاصل ثقة لتوفير ثقة بنسبة 95.5٪ على الأقل.

يسمح لنا تحديد حدود الثقة للقيم المتوسطة والقيم النسبية بالعثور على قيمتين متطرفتين - الحد الأدنى الممكن والحد الأقصى الممكن ، والذي يمكن أن يحدث من خلاله المؤشر قيد الدراسة في عموم السكان. بناء على هذا، حدود الثقة (أو فترة الثقة)- هذه هي حدود القيم المتوسطة أو النسبية ، والتي تجاوزها بسبب التقلبات العشوائية لها احتمال ضئيل.

يمكن إعادة كتابة فاصل الثقة على النحو التالي: ، أين رهو معيار الثقة.

يتم تحديد حدود الثقة للمتوسط ​​الحسابي في عموم السكان من خلال الصيغة:

م الجين = م تحديد + تم م

للقيمة النسبية:

ص الجين = ص تحديد + ر م ص

أين م الجينو ص الجين- قيم المتوسط ​​والقيم النسبية لعامة السكان ؛ م تحديدو ص تحديد- قيم المتوسط ​​والقيم النسبية التي تم الحصول عليها من عينة المجتمع ؛ م مو م ص- أخطاء القيم المتوسطة والنسبية ؛ ر- معيار الثقة (معيار الدقة ، الذي يتم تحديده عند التخطيط للدراسة ويمكن أن يكون مساوياً لـ 2 أو 3) ؛ ر م- هذه هي فترة الثقة أو - الخطأ الهامشي للمؤشر الذي تم الحصول عليه في دراسة العينة.

وتجدر الإشارة إلى أن قيمة المعيار رإلى حد ما ، يتعلق الأمر باحتمالية التنبؤ الخالي من الأخطاء (p) ، معبرًا عنه في المائة. يتم اختياره من قبل الباحث نفسه مسترشداً بضرورة الحصول على نتيجة بالدرجة المطلوبة من الدقة. لذلك ، بالنسبة لاحتمال التنبؤ الخالي من الأخطاء بنسبة 95.5 ٪ ، فإن قيمة المعيار رهي 2 مقابل 99.7٪ -3.

التقديرات المعطاة لفاصل الثقة مقبولة فقط للمجموعات الإحصائية التي لديها أكثر من 30 ملاحظة. مع حجم سكان أصغر (عينات صغيرة) ، يتم استخدام جداول خاصة لتحديد المعيار t. في هذه الجداول ، تكون القيمة المطلوبة عند تقاطع الخط المقابل لحجم السكان (ن -1)، وعمود مطابق لمستوى احتمال التنبؤ الخالي من الأخطاء (95.5٪ ؛ 99.7٪) الذي اختاره الباحث. في البحث الطبي ، عند تحديد حدود الثقة لأي مؤشر ، يكون احتمال التنبؤ الخالي من الأخطاء 95.5٪ أو أكثر. هذا يعني أنه يجب العثور على قيمة المؤشر التي تم الحصول عليها على عينة السكان في عموم السكان في 95.5٪ على الأقل من الحالات.

    أسئلة حول موضوع الدرس:

    أهمية مؤشرات تنوع سمة في المجتمع الإحصائي.

    الخصائص العامة للمؤشرات المطلقة للتباين.

    الانحراف المعياري ، الحساب ، التطبيق.

    المؤشرات النسبية للاختلاف.

    الوسيط ، الدرجة الربعية.

    تقويم الدلالة الإحصائية لنتائج الدراسة.

    الخطأ المعياري للمتوسط ​​الحسابي ، صيغة الحساب ، مثال على الاستخدام.

    حساب الحصة وخطأها المعياري.

    مفهوم احتمالية الثقة مثال على الاستخدام.

10. مفهوم فترة الثقة وتطبيقها.

    اختبار المهام على الموضوع باستخدام نماذج الإجابات:

1. المؤشرات المطلقة للتغير

1) معامل الاختلاف

2) معامل التذبذب

4) الوسيط

2. المؤشرات النسبية للتغير

1) التشتت

4) معامل الاختلاف

3. معيار تحدده القيم القصوى لمتغير في سلسلة متنوعة

2) السعة

3) التشتت

4) معامل الاختلاف

4. اختلاف الخيار المتطرف هو

2) السعة

3) الانحراف المعياري

4) معامل الاختلاف

5. يعني مربع انحرافات القيم الفردية الهامة عن متوسط ​​قيمته

1) معامل التذبذب

2) الوسيط

3) التشتت

6. نسبة مدى التباين إلى القيمة المتوسطة للميزة هي

1) معامل الاختلاف

2) الانحراف المعياري

4) معامل التذبذب

7. نسبة انحراف المربع إلى متوسط ​​قيمة الميزة هي

1) التشتت

2) معامل الاختلاف

3) معامل التذبذب

4) السعة

8. المتغير الموجود في منتصف سلسلة التباين ويقسمه إلى جزأين متساويين هو

1) الوسيط

3) السعة

9. في البحث الطبي ، عند وضع حدود الثقة لأي مؤشر ، يتم قبول احتمالية خلو التوقعات من الأخطاء

10. إذا أعطت 90 عينة من 100 تقديرًا صحيحًا لمعامل في فئة سكانية عامة ، فهذا يعني أن احتمال الثقة صمساو

11. في حالة ما إذا أعطت 10 عينات من أصل 100 تقديرًا غير صحيح ، فإن احتمالية حدوث خطأ هو

12. حدود القيم المتوسطة أو النسبية ، هناك احتمال ضئيل لتجاوز الحدود بسبب التذبذبات العشوائية - هذا

1) فاصل الثقة

2) السعة

4) معامل الاختلاف

13. تعتبر عينة صغيرة أن السكان في أي

1) n أقل من أو يساوي 100

2) n أقل من أو يساوي 30

3) n أقل من أو يساوي 40

4) n قريبة من 0

14. لاحتمال خلو 95٪ من قيمة المعيار للتنبؤ رالتراكيب

15. لاحتمالية خلو من الأخطاء بنسبة 99٪ من قيمة المعيار رالتراكيب

16. بالنسبة للتوزيعات القريبة من الوضع الطبيعي ، يعتبر السكان متجانسين إذا لم يتجاوز معامل التباين

17. فصل المتغيرات التي لا تتجاوز قيمها العددية 25٪ من الحد الأقصى الممكن في هذا الصف هو

2) الربع الأدنى

3) الربع العلوي

4) الربع

18. البيانات التي لا تشوه وتعكس بشكل صحيح يتم استدعاء الواقع الهدف

1) مستحيل

2) ممكن بالتساوي

3) موثوقة

4) عشوائي

19. وفقًا لقاعدة الثلاث سيج ، مع التوزيع الطبيعي للإشارة الداخلية
سوف يتم تحديد موقعه

1) 68.3٪ خيار

توصل علماء الرياضيات والإحصائيون الحكيمون إلى مؤشر أكثر موثوقية ، على الرغم من أن الغرض مختلف قليلاً - يعني الانحراف الخطي. يميز هذا المؤشر قياس انتشار قيم مجموعة البيانات حول متوسط ​​قيمتها.

لإظهار مقياس انتشار البيانات ، يجب عليك أولاً تحديد ما سيتم اعتباره نسبيًا بالنسبة له - عادةً ما يكون هذا هو متوسط ​​القيمة. بعد ذلك ، تحتاج إلى حساب مدى بُعد قيم مجموعة البيانات التي تم تحليلها عن المتوسط. من الواضح أن كل قيمة تتوافق مع قدر معين من الانحراف ، لكننا مهتمون أيضًا بتقدير عام يغطي المجتمع بأكمله. لذلك ، يتم حساب متوسط ​​الانحراف باستخدام صيغة المتوسط ​​الحسابي المعتاد. ولكن! ولكن من أجل حساب متوسط ​​الانحرافات ، يجب إضافتها أولاً. وإذا أضفنا أعدادًا موجبة وسالبة ، فسيلغي أحدهما الآخر وسيميل مجموعهما إلى الصفر. لتجنب ذلك ، يتم أخذ جميع الانحرافات بطريقة معيارية ، أي أن جميع الأرقام السالبة تصبح موجبة. الآن سيظهر متوسط ​​الانحراف مقياسًا عامًا لانتشار القيم. نتيجة لذلك ، سيتم حساب متوسط ​​الانحراف الخطي بالصيغة:

أهو متوسط ​​الانحراف الخطي ،

x- المؤشر الذي تم تحليله ، مع وجود شرطة في الأعلى - متوسط ​​قيمة المؤشر ،

نهو عدد القيم في مجموعة البيانات التي تم تحليلها ،

آمل ألا يخيف عامل الجمع أحداً.

يعكس متوسط ​​الانحراف الخطي المحسوب باستخدام الصيغة المحددة متوسط ​​الانحراف المطلق عن متوسط ​​القيمة لهذا المجتمع.

الخط الأحمر في الصورة هو متوسط ​​القيمة. يشار إلى انحرافات كل ملاحظة عن المتوسط ​​بواسطة أسهم صغيرة. يتم أخذها modulo وتلخيصها. ثم يتم تقسيم كل شيء على عدد القيم.

لإكمال الصورة ، يجب إعطاء مثال آخر. لنفترض أن هناك شركة تصنع قصاصات للمجارف. يجب أن يبلغ طول كل عملية قطع 1.5 متر ، ولكن الأهم من ذلك ، يجب أن تكون جميعها متماثلة ، أو على الأقل زائد أو ناقص 5 سم ، ومع ذلك ، فإن العمال المهملين سيقطعون 1.2 مترًا ، ثم 1.8 مترًا. قرر مدير الشركة إجراء تحليل إحصائي لطول القطع. اخترت 10 قطع وقمت بقياس طولها ، ووجدت المتوسط ​​وحسبت متوسط ​​الانحراف الخطي. تبين أن المتوسط ​​كان صحيحًا تمامًا - 1.5 متر. لكن متوسط ​​الانحراف الخطي تبين أنه 0.16 متر. لذلك اتضح أن كل قطع أطول أو أقصر من اللازم بمتوسط ​​16 سم. هناك شيء نتحدث عنه مع العمال. في الواقع ، لم أر الاستخدام الحقيقي لهذا المؤشر ، لذلك توصلت إلى مثال بنفسي. ومع ذلك ، هناك مثل هذا المؤشر في الإحصاءات.

تشتت

مثل متوسط ​​الانحراف الخطي ، يعكس التباين أيضًا مدى انتشار البيانات حول المتوسط.

تبدو صيغة حساب التباين كما يلي:

(لسلسلة التباين (التباين الموزون))

(للبيانات غير المبوبة (تباين بسيط))

حيث: σ 2 - تشتت شي- نقوم بتحليل مؤشر المربع (قيمة الميزة) ، - متوسط ​​قيمة المؤشر ، f i - عدد القيم في مجموعة البيانات التي تم تحليلها.

التباين هو متوسط ​​مربع الانحرافات.

أولاً ، يُحسب المتوسط ​​، ثم يُؤخذ الفرق بين كل خط أساس ومتوسط ​​، تربيعًا ، مضروبًا في تكرار قيمة الميزة المقابلة ، مضافًا ، ثم مقسومًا على عدد القيم في المجتمع.

ومع ذلك ، في شكله النقي ، مثل ، على سبيل المثال ، المتوسط ​​الحسابي ، أو الفهرس ، لا يتم استخدام التشتت. إنه بالأحرى مؤشر مساعد ومتوسط ​​يستخدم لأنواع أخرى من التحليل الإحصائي.

طريقة مبسطة لحساب التباين

الانحراف المعياري

لاستخدام التباين في تحليل البيانات ، يتم أخذ جذر تربيعي منه. اتضح أن ما يسمى ب الانحراف المعياري.

بالمناسبة ، يُطلق على الانحراف المعياري أيضًا اسم سيجما - من الحرف اليوناني الذي يشير إليه.

من الواضح أيضًا أن الانحراف المعياري يميز مقياس تشتت البيانات ، ولكن الآن (على عكس التشتت) يمكن مقارنته بالبيانات الأصلية. كقاعدة عامة ، تعطي مؤشرات المربع المتوسط ​​في الإحصاء نتائج أكثر دقة من النتائج الخطية. لذلك ، يعد الانحراف المعياري مقياسًا أكثر دقة لتشتت البيانات من متوسط ​​الانحراف الخطي.

التوقع والتباين الرياضي

دعونا نقيس متغير عشوائي نمرات ، على سبيل المثال ، نقيس سرعة الرياح عشر مرات ونريد إيجاد القيمة المتوسطة. كيف ترتبط القيمة المتوسطة بدالة التوزيع؟

سنقوم برمي النرد عددًا كبيرًا من المرات. عدد النقاط التي ستسقط على النرد أثناء كل رمية هو متغير عشوائي ويمكن أن يأخذ أي قيم طبيعية من 1 إلى 6. نتميل إلى رقم محدد للغاية - التوقع الرياضي مكس. في هذه الحالة مكس = 3,5.

كيف نشأت هذه القيمة؟ اتركه نسقطت الاختبارات مرة واحدة نقطة واحدة ، مرة واحدة - نقطتان وهكذا. ثم ن→ ∞ عدد النتائج التي سقطت فيها نقطة واحدة ، وبالمثل ، من هنا

نموذج 4.5. حجر النرد

لنفترض الآن أننا نعرف قانون توزيع المتغير العشوائي xأي أننا نعلم أن المتغير العشوائي xيمكن أن تأخذ القيم x 1 , x 2 , ..., س كمع الاحتمالات ص 1 , ص 2 , ..., ص ك.

القيمة المتوقعة مكسمتغير عشوائي xيساوي:

إجابه. 2,8.

التوقع الرياضي ليس دائمًا تقديرًا معقولًا لبعض المتغيرات العشوائية. لذلك ، لتقدير متوسط ​​الأجر ، من المعقول أكثر استخدام مفهوم الوسيط ، أي أن عدد الأشخاص الذين يتقاضون أقل من متوسط ​​الراتب وأكثر متماثلًا.

الوسيطالمتغير العشوائي يسمى رقم x 1/2 من هذا القبيل ص (x < x 1/2) = 1/2.

بمعنى آخر ، الاحتمال ص 1 أن المتغير العشوائي xسيكون أقل x 1/2 والاحتمال ص 2 أن متغير عشوائي xسيكون أكبر x 1/2 هي نفسها وتساوي 1/2. لم يتم تحديد الوسيط بشكل فريد لجميع التوزيعات.

العودة إلى المتغير العشوائي x، والتي يمكن أن تأخذ القيم x 1 , x 2 , ..., س كمع الاحتمالات ص 1 , ص 2 , ..., ص ك.

تشتتمتغير عشوائي xهي القيمة المتوسطة للانحراف التربيعي لمتغير عشوائي عن توقعه الرياضي:

مثال 2

في ظل ظروف المثال السابق ، احسب التباين والانحراف المعياري لمتغير عشوائي x.

إجابه. 0,16, 0,4.

نموذج 4.6. الهدف

مثال 3

أوجد التوزيع الاحتمالي لعدد النقاط التي تم تدحرجها على القالب من الرمية الأولى والوسيط والتوقع الرياضي والتباين والانحراف المعياري.

إسقاط أي وجه أمر محتمل بنفس القدر ، لذا سيبدو التوزيع كما يلي:

الانحراف المعياري يمكن ملاحظة أن انحراف القيمة عن القيمة المتوسطة كبير جدًا.

خصائص التوقع الرياضي:

  • التوقع الرياضي لمجموع المتغيرات العشوائية المستقلة يساوي مجموع توقعاتهم الرياضية:

مثال 4

أوجد التوقع الرياضي لمجموع وحاصل ضرب النقاط الملفوفة على نردتين.

في المثال 3 ، وجدنا ذلك لمكعب واحد م (x) = 3.5. لذلك لمكعبين

خصائص التشتت:

  • التباين في مجموع المتغيرات العشوائية المستقلة يساوي مجموع الفروق:

DX + ذ = DX + دى.

اسمحوا ل نلفات النرد ذنقاط. ثم

هذه النتيجة ليست صحيحة فقط لفات النرد. في كثير من الحالات ، تحدد دقة قياس التوقع الرياضي تجريبياً. يمكن ملاحظة ذلك مع زيادة عدد القياسات نانتشار القيم حول المتوسط ​​، أي الانحراف المعياري ، يتناقص بشكل متناسب

يرتبط تباين المتغير العشوائي بالتوقع الرياضي لمربع هذا المتغير العشوائي بالعلاقة التالية:

دعونا نجد التوقعات الرياضية لكلا الجزأين من هذه المساواة. حسب التعريف،

التوقع الرياضي للجانب الصحيح من المساواة ، وفقًا لخاصية التوقعات الرياضية ، يساوي

الانحراف المعياري

الانحراف المعيارييساوي الجذر التربيعي للتباين:
عند تحديد الانحراف المعياري لحجم كبير بدرجة كافية من السكان المدروسين (ن> 30) ، يتم استخدام الصيغ التالية:

معلومات مماثلة.