السير الذاتية صفات التحليلات

صيغة الانحراف المعياري. كيف تحسب الانحراف المعياري؟ تشتت

أكثر خصائص التباين مثالية هو الانحراف المعياري ، والذي يسمى الانحراف المعياري (أو الانحراف المعياري). الانحراف المعياري() يساوي الجذر التربيعي للمربع المتوسط ​​لانحرافات قيم السمات الفردية عن الوسط الحسابي:

الانحراف المعياري بسيط:

يتم تطبيق الانحراف المعياري المرجح على البيانات المجمعة:

بين متوسط ​​المربع والانحرافات الخطية المتوسطة في ظل ظروف التوزيع الطبيعي ، تحدث العلاقة التالية: ~ 1.25.

يتم استخدام الانحراف المعياري ، باعتباره المقياس الرئيسي المطلق للتغير ، في تحديد قيم إحداثيات منحنى التوزيع الطبيعي ، في الحسابات المتعلقة بتنظيم مراقبة العينة وتحديد دقة خصائص العينة ، وكذلك في تقييم حدود تباين سمة في مجموعة سكانية متجانسة.

التشتت ، أنواعه ، الانحراف المعياري.

تباين المتغير العشوائي- قياس انتشار متغير عشوائي معين ، أي انحرافه عن التوقع الرياضي. في الإحصاء ، يتم استخدام التسمية أو غالبًا. يسمى الجذر التربيعي للتباين الانحراف المعياري أو الانحراف المعياري أو الانتشار القياسي.

التباين الكلي (σ2) يقيس تباين سمة في جميع السكان تحت تأثير جميع العوامل التي تسببت في هذا الاختلاف. في الوقت نفسه ، بفضل طريقة التجميع ، من الممكن عزل وقياس التباين بسبب ميزة التجميع ، والتباين الذي يحدث تحت تأثير العوامل غير المحسوبة.

التباين بين المجموعات (σ 2 مليون غرام) يميز التباين المنهجي ، أي الاختلافات في حجم السمة المدروسة الناشئة تحت تأثير السمة - العامل الكامن وراء التجميع.

الانحراف المعياري(المرادفات: الانحراف المعياري ، الانحراف المعياري ، الانحراف المعياري ؛ مصطلحات مماثلة: الانحراف المعياري ، الانتشار القياسي) - في نظرية الاحتمالات والإحصاءات ، المؤشر الأكثر شيوعًا لتشتت قيم المتغير العشوائي بالنسبة لتوقعاته الرياضية. باستخدام المصفوفات المحدودة لعينات القيم ، بدلاً من التوقع الرياضي ، يتم استخدام المتوسط ​​الحسابي لمجموعة العينات.

يقاس الانحراف المعياري بوحدات المتغير العشوائي نفسه ويستخدم في حساب الخطأ المعياري للمتوسط ​​الحسابي ، وفي بناء فترات الثقة ، وفي الاختبار الإحصائي للفرضيات ، وفي قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.


الانحراف المعياري:

الانحراف المعياري(تقدير الانحراف المعياري لمتغير عشوائي xبالنسبة لتوقعاتها الرياضية بناءً على تقدير غير متحيز لتباينها):

اين هو التشتت - أنا- عنصر العينة - حجم العينة؛ - المتوسط ​​الحسابي للعينة:

وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة ، من المستحيل بناء تقدير غير متحيز. ومع ذلك ، فإن التقدير المستند إلى تقدير التباين غير المتحيز متسق.

جوهر ونطاق وإجراءات تحديد الوضع والوسيط.

بالإضافة إلى متوسطات قانون القوة في الإحصاء ، بالنسبة للخاصية النسبية لحجم سمة متغيرة والهيكل الداخلي لسلسلة التوزيع ، يتم استخدام المتوسطات الهيكلية ، والتي يتم تمثيلها بشكل أساسي بواسطة الوضع والوسيط.

موضة- هذا هو البديل الأكثر شيوعًا للسلسلة. تُستخدم الموضة ، على سبيل المثال ، في تحديد حجم الملابس والأحذية الأكثر طلبًا بين المشترين. يعد الوضع الخاص بالسلسلة المنفصلة هو البديل ذي التردد الأعلى. عند حساب الوضع لسلسلة تباين الفاصل الزمني ، يجب عليك أولاً تحديد الفاصل الزمني الشرطي (حسب التردد الأقصى) ، ثم قيمة القيمة المشروطة للسمة وفقًا للصيغة:

- - قيمة الموضة

- - الحد الأدنى للفاصل الزمني الشرطي

- - قيمة الفاصل

- - تردد الفاصل المشروط

- - تكرار الفاصل الزمني السابق للوضع

- - تواتر الفاصل الزمني بعد النموذج

الوسيط -هذه هي قيمة الميزة التي تكمن وراء السلسلة المرتبة وتقسم هذه السلسلة إلى جزأين متساويين في العدد.

لتحديد الوسيط في سلسلة منفصلة في وجود الترددات ، احسب أولاً نصف مجموع الترددات ، ثم حدد قيمة المتغير التي تقع عليها. (إذا كان الصف الذي تم فرزه يحتوي على عدد فردي من الميزات ، فسيتم حساب الرقم المتوسط ​​بالصيغة:

M e \ u003d (n (عدد الميزات في المجموع) + 1) / 2 ،

في حالة وجود عدد زوجي من المعالم ، فإن الوسيط سيكون مساويًا لمتوسط ​​السمتين في منتصف الصف).

عند حساب متوسطاتبالنسبة لسلسلة تباين الفاصل الزمني ، حدد أولاً الفاصل الزمني الوسيط الذي يقع خلاله الوسيط ، ثم قيمة الوسيط وفقًا للصيغة:

- هو الوسيط المطلوب

- هو الحد الأدنى للفترة التي تحتوي على الوسيط

- - قيمة الفاصل

- - مجموع الترددات أو عدد أعضاء المسلسل

مجموع الترددات المتراكمة للفترات التي تسبق الوسيط

- هو تكرار الفاصل الزمني الوسيط

مثال. ابحث عن الوضع والوسيط.

المحلول:
في هذا المثال ، يقع الفاصل الزمني المعياري ضمن الفئة العمرية من 25 إلى 30 عامًا ، نظرًا لأن هذا الفاصل يمثل أعلى تردد (1054).

دعنا نحسب قيمة الوضع:

هذا يعني أن العمر النموذجي للطلاب هو 27 عامًا.

احسب الوسيط. يقع الفاصل الزمني الوسيط في الفئة العمرية 25-30 عامًا ، حيث يوجد خلال هذه الفترة متغير يقسم السكان إلى قسمين متساويين (Σf i / 2 = 3462/2 = 1731). بعد ذلك ، نستبدل البيانات العددية الضرورية في الصيغة ونحصل على قيمة الوسيط:

هذا يعني أن نصف الطلاب أقل من 27.4 عامًا ، والنصف الآخر أكبر من 27.4 عامًا.

بالإضافة إلى الوضع والوسيط ، يمكن استخدام مؤشرات مثل الربعية ، وتقسيم السلسلة المصنفة إلى 4 أجزاء متساوية ، عشري- 10 أجزاء ونسب مئوية - لكل 100 جزء.

مفهوم الملاحظة الانتقائية ونطاقها.

الملاحظة الانتقائيةينطبق عند تطبيق المراقبة المستمرة مستحيل جسديابسبب كمية كبيرة من البيانات أو غير عملي اقتصاديًا. تحدث الاستحالة المادية ، على سبيل المثال ، عند دراسة تدفقات الركاب وأسعار السوق وميزانيات الأسرة. تحدث عدم الكفاءة الاقتصادية عند تقييم جودة السلع المرتبطة بتدميرها ، على سبيل المثال ، تذوق واختبار الطوب من أجل القوة ، إلخ.

تشكل الوحدات الإحصائية المختارة للمراقبة عينة أو عينة ، ومصفوفتها بأكملها - عامة السكان (GS). في هذه الحالة ، يشير عدد الوحدات في العينة ن، وفي النظام المنسق بأكمله - ن. موقف سلوك ن / نيسمى الحجم النسبي أو نسبة العينة.

تعتمد جودة نتائج أخذ العينات على تمثيل العينة ، أي مدى تمثيلها في النظام المنسق. لضمان تمثيل العينة ، من الضروري المراقبة مبدأ الاختيار العشوائي للوحدات، والذي يفترض أن إدراج وحدة النظام المنسق في العينة لا يمكن أن يتأثر بأي عامل آخر غير الصدفة.

موجود 4 طرق للاختيار العشوائيلأخذ عينات:

  1. في الواقع عشوائياختيار أو "طريقة لوتو" ، عندما يتم تخصيص الأرقام التسلسلية لقيم إحصائية ، يتم إدخالها على كائنات معينة (على سبيل المثال ، البراميل) ، والتي يتم خلطها بعد ذلك في بعض الحاويات (على سبيل المثال ، في كيس) واختيارها عشوائيًا. في الممارسة العملية ، يتم تنفيذ هذه الطريقة باستخدام مولد أرقام عشوائي أو جداول رياضية للأرقام العشوائية.
  2. ميكانيكيالاختيار ، وفقًا لكل منهما ( غير متاح) -th لعموم السكان. على سبيل المثال ، إذا كانت تحتوي على 100000 قيمة ، وتريد تحديد 1000 ، فإن كل 100000/1000 = 100 ستقع في العينة. علاوة على ذلك ، إذا لم يتم ترتيبهم ، فسيتم اختيار الأول عشوائيًا من المائة الأولى ، وسيكون عدد الآخرين مائة أكثر. على سبيل المثال ، إذا كانت الوحدة رقم 19 هي الأولى ، فيجب أن يكون الرقم 119 هو التالي ، ثم الرقم 219 ، ثم الرقم 319 ، وهكذا. إذا تم ترتيب الوحدات السكانية ، فسيتم تحديد # 50 أولاً ، ثم # 150 ، ثم # 250 ، وهكذا.
  3. يتم اختيار القيم من مصفوفة بيانات غير متجانسة طبقيةالطريقة (الطبقية) ، عندما يتم تقسيم عموم السكان سابقًا إلى مجموعات متجانسة ، يتم تطبيق الاختيار العشوائي أو الميكانيكي عليها.
  4. طريقة أخذ العينات الخاصة هي مسلسلالاختيار ، حيث لا يتم اختيار الكميات الفردية بشكل عشوائي أو ميكانيكي ، ولكن يتم اختيار متسلسلاتهم (تسلسلات من عدد ما إلى البعض في صف واحد) ، والتي يتم خلالها إجراء المراقبة المستمرة.

تعتمد جودة ملاحظات العينة أيضًا على نوع أخذ العينات: معادأو غير مكرر.

في إعادة الاختياريتم إرجاع القيم الإحصائية أو سلاسلها التي وقعت في العينة إلى عامة السكان بعد الاستخدام ، مع وجود فرصة للدخول في عينة جديدة. في الوقت نفسه ، تتمتع جميع قيم عامة السكان بنفس احتمالية تضمينها في العينة.

اختيار غير مكرريعني أن القيم الإحصائية أو سلسلتها المضمنة في العينة لا تُعاد إلى عامة السكان بعد الاستخدام ، وبالتالي يزداد احتمال الدخول في العينة التالية للقيم المتبقية من الأخيرة.

يعطي أخذ العينات غير المتكرر نتائج أكثر دقة ، لذلك يتم استخدامه في كثير من الأحيان. ولكن هناك حالات لا يمكن فيها تطبيقها (دراسة تدفقات الركاب ، طلب المستهلك ، وما إلى ذلك) ثم يتم إجراء إعادة الاختيار.

الخطأ الهامشي لعينة الملاحظة ، متوسط ​​خطأ العينة ، ترتيب حسابها.

دعونا نفكر بالتفصيل في الأساليب المذكورة أعلاه لتشكيل عينة من السكان والأخطاء التي تنشأ في هذه الحالة. التمثيلية .
في الواقع عشوائيتعتمد العينة على اختيار الوحدات من عامة السكان بشكل عشوائي دون أي عناصر اتساق. من الناحية الفنية ، يتم إجراء الاختيار العشوائي المناسب عن طريق سحب القرعة (على سبيل المثال ، اليانصيب) أو عن طريق جدول أرقام عشوائية.

في الواقع ، نادراً ما يستخدم الاختيار العشوائي "في شكله النقي" في ممارسة الملاحظة الانتقائية ، ولكنه الاختيار الأولي من بين أنواع الاختيار الأخرى ، فهو يطبق المبادئ الأساسية للملاحظة الانتقائية. دعونا نفكر في بعض أسئلة نظرية طريقة أخذ العينات ومعادلة الخطأ لعينة عشوائية بسيطة.

خطأ المعاينه- هذا هو الفرق بين قيمة المعلمة في عموم السكان ، وقيمتها المحسوبة من نتائج ملاحظة العينة. بالنسبة للخاصية الكمية المتوسطة ، يتم تحديد خطأ أخذ العينات بواسطة

يسمى المؤشر خطأ أخذ العينات الهامشي.
متوسط ​​العينة هو متغير عشوائي يمكن أن يأخذ قيمًا مختلفة اعتمادًا على الوحدات الموجودة في العينة. لذلك ، فإن أخطاء أخذ العينات هي أيضًا متغيرات عشوائية ويمكن أن تأخذ قيمًا مختلفة. لذلك ، حدد متوسط ​​الأخطاء المحتملة - يعني خطأ أخذ العيناتالتي تعتمد على:

حجم العينة: كلما زاد العدد ، كان متوسط ​​الخطأ أصغر ؛

درجة تغيير السمة المدروسة: كلما كان تباين السمة أصغر ، وبالتالي التباين ، كلما كان متوسط ​​خطأ أخذ العينات أصغر.

في إعادة اختيار عشوائييتم حساب متوسط ​​الخطأ:
.
من الناحية العملية ، فإن التباين العام غير معروف تمامًا ، ولكن في نظرية الاحتمالاتأثبت أن
.
نظرًا لأن قيمة n الكبيرة بما يكفي قريبة من 1 ، يمكننا افتراض ذلك. ثم يمكن حساب متوسط ​​خطأ أخذ العينات:
.
ولكن في حالات عينة صغيرة (لـ n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

في أخذ العينات العشوائيةيتم تصحيح الصيغ المعطاة بالقيمة. ثم يكون متوسط ​​الخطأ في عدم أخذ العينات هو:
و .
لان دائمًا ما يكون أقل من ، فعندئذٍ يكون العامل () دائمًا أقل من 1. وهذا يعني أن متوسط ​​الخطأ في الاختيار غير المتكرر يكون دائمًا أقل منه في التحديد المتكرر.
أخذ العينات الميكانيكيةيستخدم عندما يتم ترتيب عموم السكان بطريقة ما (على سبيل المثال ، قوائم الناخبين بالترتيب الأبجدي ، وأرقام الهواتف ، وأرقام المنازل ، والشقق). يتم اختيار الوحدات في فترة زمنية معينة ، والتي تساوي مقلوب النسبة المئوية للعينة. لذلك ، مع عينة 2٪ ، يتم اختيار كل 50 وحدة = 1 / 0.02 ، مع 5٪ ، كل 1 / 0.05 = 20 وحدة من عموم السكان.

يتم اختيار الأصل بطرق مختلفة: عشوائيًا ، من منتصف الفترة الزمنية ، مع تغيير الأصل. الشيء الرئيسي هو تجنب الخطأ المنهجي. على سبيل المثال ، مع عينة 5٪ ، إذا تم اختيار رقم 13 كوحدة أولى ، فسيكون التالي 33 ، 53 ، 73 ، إلخ.

من حيث الدقة ، فإن الاختيار الميكانيكي قريب من أخذ العينات العشوائية المناسبة. لذلك ، لتحديد متوسط ​​الخطأ في أخذ العينات الميكانيكية ، يتم استخدام صيغ الاختيار العشوائي المناسب.

في اختيار نموذجي يتم تقسيم السكان الذين تم مسحهم مبدئيًا إلى مجموعات متجانسة من نوع واحد. على سبيل المثال ، عند إجراء مسح للمؤسسات ، يمكن أن تكون هذه الصناعات أو القطاعات الفرعية ، أثناء دراسة السكان - المناطق أو الفئات الاجتماعية أو الفئات العمرية. ثم يتم اختيار مستقل من كل مجموعة بطريقة ميكانيكية أو عشوائية مناسبة.

يعطي أخذ العينات النموذجي نتائج أكثر دقة من الطرق الأخرى. يضمن تصنيف المجتمع العام تمثيل كل مجموعة نمطية في العينة ، مما يجعل من الممكن استبعاد تأثير التباين بين المجموعات على متوسط ​​خطأ العينة. لذلك ، عند العثور على خطأ في عينة نموذجية وفقًا لقاعدة إضافة التباينات () ، من الضروري مراعاة متوسط ​​تباينات المجموعة فقط. ثم يعني خطأ أخذ العينات:
في إعادة الاختيار
,
مع اختيار غير متكرر
,
أين هو متوسط ​​الفروق داخل المجموعة في العينة.

تحديد تسلسلي (أو متداخل) تُستخدم عند تقسيم السكان إلى سلاسل أو مجموعات قبل بدء مسح العينة. يمكن أن تكون هذه السلسلة عبارة عن حزم من المنتجات النهائية ، ومجموعات الطلاب ، والفرق. يتم اختيار سلسلة الفحص آليًا أو عشوائيًا ، ويتم إجراء مسح كامل للوحدات ضمن السلسلة. لذلك ، يعتمد متوسط ​​خطأ أخذ العينات فقط على التباين بين المجموعات (بين المجموعات) ، والذي يتم حسابه بواسطة الصيغة:

حيث r هو عدد السلاسل المختارة ؛
- متوسط ​​السلسلة i.

يتم حساب متوسط ​​خطأ أخذ العينات التسلسلي:

عند إعادة التحديد:
,
مع اختيار غير متكرر:
,
حيث R هو العدد الإجمالي للسلسلة.

مجموعاختيارهو مزيج من طرق الاختيار المدروسة.

يعتمد متوسط ​​خطأ أخذ العينات لأي طريقة اختيار بشكل أساسي على الحجم المطلق للعينة ، وبدرجة أقل ، على النسبة المئوية للعينة. لنفترض أنه تم إجراء 225 ملاحظة في الحالة الأولى من بين 4500 وحدة وفي الحالة الثانية من 225000 وحدة. الفروق في كلتا الحالتين تساوي 25. ثم ، في الحالة الأولى ، مع اختيار 5٪ ، سيكون خطأ أخذ العينات:

في الحالة الثانية ، مع تحديد 0.1٪ ، ستكون مساوية لـ:


في هذا الطريق، مع انخفاض النسبة المئوية للعينة بمقدار 50 مرة ، زاد خطأ العينة بشكل طفيف ، حيث لم يتغير حجم العينة.
افترض أن حجم العينة قد زاد إلى 625 ملاحظة. في هذه الحالة ، يكون خطأ أخذ العينات هو:

تؤدي الزيادة في العينة بمقدار 2.8 مرة مع نفس الحجم من عامة السكان إلى تقليل حجم خطأ أخذ العينات بأكثر من 1.6 مرة.

طرق ووسائل تكوين عينة سكانية.

في الإحصاء ، يتم استخدام طرق مختلفة لتشكيل مجموعات العينات ، والتي تحددها أهداف الدراسة وتعتمد على تفاصيل موضوع الدراسة.

الشرط الرئيسي لإجراء مسح العينة هو منع حدوث أخطاء منهجية ناشئة عن انتهاك مبدأ تكافؤ الفرص لكل وحدة من عموم السكان لدخول العينة. يتم تحقيق الوقاية من الأخطاء المنهجية نتيجة لاستخدام الأساليب القائمة على أساس علمي لتشكيل عينة من السكان.

هناك الطرق التالية لاختيار الوحدات من عامة السكان:

1) الاختيار الفردي - يتم اختيار الوحدات الفردية في العينة ؛

2) اختيار المجموعة - تقع المجموعات المتجانسة نوعياً أو سلسلة الوحدات قيد الدراسة في العينة ؛

3) الاختيار المشترك هو مزيج من الاختيار الفردي والجماعي.
يتم تحديد طرق الاختيار من خلال قواعد تكوين مجتمع أخذ العينات.

يمكن أن تكون العينة:

  • عشوائي مناسبيتكون من حقيقة أن العينة تتكون نتيجة الاختيار العشوائي (غير المقصود) للوحدات الفردية من عامة السكان. في هذه الحالة ، عادةً ما يتم تحديد عدد الوحدات المختارة في مجموعة العينات بناءً على النسبة المقبولة للعينة. حصة العينة هي نسبة عدد الوحدات في عينة السكان n إلى عدد الوحدات في عموم السكان N ، أي
  • ميكانيكييتكون من حقيقة أن اختيار الوحدات في العينة يتم من عامة السكان ، مقسمًا إلى فترات متساوية (مجموعات). في هذه الحالة ، فإن حجم الفاصل الزمني في عموم السكان يساوي مقلوب نسبة العينة. لذلك ، مع عينة 2٪ ، يتم اختيار كل 50 وحدة (1: 0.02) ، مع عينة 5٪ ، كل 20 وحدة (1: 0.05) ، إلخ. وبالتالي ، وفقًا لنسبة الاختيار المقبولة ، يتم تقسيم عموم السكان ميكانيكيًا إلى مجموعات متساوية. يتم اختيار وحدة واحدة فقط من كل مجموعة في العينة.
  • عادي -حيث ينقسم عامة السكان أولاً إلى مجموعات نموذجية متجانسة. ثم ، من كل مجموعة نموذجية ، يتم الاختيار الفردي للوحدات في العينة بواسطة عينة عشوائية أو ميكانيكية. من السمات المهمة للعينة النموذجية أنها تعطي نتائج أكثر دقة مقارنة بالطرق الأخرى لاختيار الوحدات في العينة ؛
  • مسلسل- حيث ينقسم عامة السكان إلى مجموعات من نفس الحجم - سلسلة. يتم تحديد السلسلة في مجموعة العينات. ضمن السلسلة ، يتم إجراء مراقبة مستمرة للوحدات التي تندرج في السلسلة ؛
  • مجموع- يمكن أن يكون أخذ العينات على مرحلتين. في هذه الحالة ، يتم تقسيم عامة السكان أولاً إلى مجموعات. ثم يتم اختيار المجموعات ، وداخل الأخير ، يتم اختيار الوحدات الفردية.

في الإحصاء ، يتم تمييز الطرق التالية لاختيار الوحدات في العينة::

  • مرحلة واحدةعينة - تخضع كل وحدة مختارة على الفور للدراسة على أساس معين (في الواقع عينات عشوائية ومتسلسلة) ؛
  • متعدد المراحلأخذ العينات - يتم الاختيار من عامة السكان للمجموعات الفردية ، ويتم اختيار الوحدات الفردية من المجموعات (عينة نموذجية مع طريقة ميكانيكية لاختيار الوحدات في عينة السكان).

بالإضافة إلى ذلك ، هناك:

  • إعادة الانتخاب- حسب مخطط الكرة المعادة. في هذه الحالة ، يتم إرجاع كل وحدة أو سلسلة سقطت في العينة إلى عامة السكان ، وبالتالي يكون لها فرصة لإدراجها في العينة مرة أخرى ؛
  • اختيار غير متكرر- حسب مخطط الكرة غير المعادة. لديها نتائج أكثر دقة لنفس حجم العينة.

تحديد حجم العينة المطلوب (باستخدام جدول الطالب).

أحد المبادئ العلمية في نظرية أخذ العينات هو ضمان اختيار عدد كافٍ من الوحدات. من الناحية النظرية ، يتم تقديم الحاجة إلى الامتثال لهذا المبدأ في البراهين على نظريات الحد لنظرية الاحتمالات ، والتي تسمح لك بتحديد عدد الوحدات التي يجب اختيارها من عامة السكان بحيث تكون كافية وتضمن تمثيل العينة.

دائمًا ما يرتبط انخفاض الخطأ المعياري للعينة ، وبالتالي زيادة دقة التقدير ، بزيادة حجم العينة ، لذلك ، بالفعل في مرحلة تنظيم ملاحظة العينة ، من الضروري اتخاذ قرار ما يجب أن يكون عليه حجم العينة لضمان الدقة المطلوبة لنتائج الملاحظة. يتم حساب حجم العينة المطلوب باستخدام الصيغ المشتقة من الصيغ الخاصة بأخطاء أخذ العينات الهامشية (أ) ، المقابلة لنوع أو آخر وطريقة الاختيار. لذلك ، بالنسبة لحجم العينة المتكرر العشوائي (ن) ، لدينا:

جوهر هذه الصيغة هو أنه مع إعادة الاختيار العشوائي للعدد المطلوب ، يتناسب حجم العينة بشكل مباشر مع مربع معامل الثقة (ر 2)والتباين في خاصية التباين (؟ 2) ويتناسب عكسياً مع مربع الخطأ الهامشي لأخذ العينات (؟ 2). على وجه الخصوص ، من خلال مضاعفة الخطأ الهامشي ، يمكن تقليل حجم العينة المطلوب بمقدار أربعة أضعاف. من بين المعلمات الثلاثة ، تم تعيين اثنين (t و؟) من قبل الباحث.

في نفس الوقت الباحثلأغراض مسح العينة ، يجب تحديد السؤال: في أي تركيبة كمية من الأفضل تضمين هذه المعلمات من أجل توفير البديل الأمثل؟ في إحدى الحالات ، قد يكون أكثر رضىً عن موثوقية النتائج التي تم الحصول عليها (t) مقارنةً بمقياس الدقة (؟) ، في الحالة الأخرى - والعكس صحيح. من الصعب حل المشكلة المتعلقة بقيمة خطأ أخذ العينات الهامشي ، نظرًا لأن الباحث ليس لديه هذا المؤشر في مرحلة تصميم ملاحظة عينة ، لذلك ، من الناحية العملية ، من المعتاد تعيين خطأ أخذ العينات الهامشي ، مثل قاعدة ، في حدود 10٪ من المستوى المتوسط ​​المتوقع للسمة. يمكن التعامل مع إنشاء مستوى متوسط ​​مفترض بطرق مختلفة: استخدام بيانات من مسوح سابقة مماثلة ، أو استخدام بيانات من إطار أخذ العينات وأخذ عينة تجريبية صغيرة.

أصعب شيء يمكن تحديده عند تصميم ملاحظة عينة هو المعلمة الثالثة في الصيغة (5.2) - تباين مجتمع العينة. في هذه الحالة ، من الضروري استخدام جميع المعلومات المتاحة للمحقق ، والتي تم الحصول عليها من الدراسات الاستقصائية المماثلة والتجريبية السابقة.

سؤال التعريفيصبح حجم العينة المطلوب أكثر تعقيدًا إذا اشتمل مسح العينة على دراسة العديد من ميزات وحدات المعاينة. في هذه الحالة ، يختلف متوسط ​​مستويات كل من الخصائص وتنوعها ، كقاعدة عامة ، وبالتالي من الممكن تحديد تشتت أي من الخصائص لإعطاء الأفضلية لمراعاة غرض وأهداف المسح.

عند تصميم ملاحظة عينة ، يتم افتراض القيمة المحددة مسبقًا لخطأ أخذ العينات المسموح به وفقًا لأهداف دراسة معينة واحتمال الاستنتاجات بناءً على نتائج الملاحظة.

بشكل عام ، تسمح لك صيغة الخطأ الهامشي للقيمة المتوسطة للعينة بتحديد:

حجم الانحرافات المحتملة لمؤشرات عامة السكان عن مؤشرات مجتمع العينة ؛

حجم العينة المطلوب ، مع توفير الدقة المطلوبة ، بحيث لا تتجاوز حدود الخطأ المحتمل قيمة معينة محددة ؛

احتمال أن يكون للخطأ في العينة حد معين.

توزيع الطلابفي نظرية الاحتمالات ، إنها عائلة ذات معلمة واحدة من التوزيعات المستمرة تمامًا.

سلسلة من الديناميكيات (فاصل زمني ، لحظة) ، إغلاق سلسلة من الديناميكيات.

سلسلة من الديناميات- هذه هي قيم المؤشرات الإحصائية التي يتم تقديمها في تسلسل زمني معين.

تحتوي كل سلسلة زمنية على عنصرين:

1) مؤشرات الفترات الزمنية (السنوات ، أرباع السنة ، الأشهر ، الأيام أو التواريخ) ؛

2) المؤشرات التي تميز الكائن قيد الدراسة لفترات زمنية أو في التواريخ المقابلة ، والتي تسمى مستويات السلسلة.

يتم التعبير عن مستويات السلسلةالقيم المطلقة والمتوسط ​​أو النسبية. اعتمادًا على طبيعة المؤشرات ، يتم إنشاء سلسلة ديناميكية من القيم المطلقة والنسبية والمتوسطة. يتم إنشاء السلاسل الديناميكية للقيم النسبية والمتوسطة على أساس سلسلة مشتقة من القيم المطلقة. هناك سلسلة من الديناميكيات الفاصلة واللحظة.

سلسلة الفواصل الديناميكيةيحتوي على قيم المؤشرات لفترات زمنية معينة. في سلسلة الفترات ، يمكن تلخيص المستويات ، والحصول على حجم الظاهرة لفترة أطول ، أو ما يسمى بالمجاميع المتراكمة.

سلسلة لحظة ديناميكيةيعكس قيم المؤشرات في وقت معين (تاريخ الوقت). في السلسلة اللحظية ، قد يهتم الباحث فقط باختلاف الظواهر ، مما يعكس التغير في مستوى السلسلة بين تواريخ معينة ، حيث أن مجموع المستويات هنا ليس له محتوى حقيقي. لا يتم احتساب المجاميع التراكمية هنا.

الشرط الأكثر أهمية للبناء الصحيح للسلسلة الديناميكية هو قابلية المقارنة بين مستويات السلاسل المتعلقة بفترات مختلفة. يجب تقديم المستويات بكميات متجانسة ، يجب أن يكون هناك نفس اكتمال تغطية أجزاء مختلفة من الظاهرة.

إلىلتجنب تشويه الديناميكيات الحقيقية ، يتم إجراء حسابات أولية في الدراسة الإحصائية (إغلاق السلاسل الزمنية) ، والتي تسبق التحليل الإحصائي للسلسلة الزمنية. يُفهم إغلاق السلاسل الزمنية على أنه مزيج من سلسلتين أو أكثر في سلسلة واحدة ، يتم حساب مستوياتها وفقًا لمنهجية مختلفة أو لا تتوافق مع الحدود الإقليمية ، إلخ. قد يعني إغلاق سلسلة الديناميكيات أيضًا تقليل المستويات المطلقة لسلسلة الديناميات إلى أساس مشترك ، مما يلغي عدم توافق مستويات سلسلة الديناميكيات.

مفهوم المقارنة بين السلاسل الزمنية والمعاملات ومعدلات النمو والنمو.

سلسلة من الديناميات- هذه سلسلة من المؤشرات الإحصائية التي تميز تطور الظواهر الطبيعية والاجتماعية في الوقت المناسب. تحتوي المجموعات الإحصائية التي نشرتها لجنة الإحصاء الحكومية في روسيا على عدد كبير من السلاسل الزمنية في شكل جدول. تسمح سلسلة الديناميكيات بالكشف عن أنماط تطور الظواهر المدروسة.

تحتوي السلاسل الزمنية على نوعين من المؤشرات. مؤشرات الوقت(سنوات ، أرباع السنة ، شهور ، إلخ.) أو نقاط زمنية (في بداية العام ، في بداية كل شهر ، إلخ). مؤشرات مستوى الصف. يمكن التعبير عن مؤشرات مستويات السلاسل الزمنية بالقيم المطلقة (إنتاج المنتج بالأطنان أو الروبل) ، والقيم النسبية (حصة سكان الحضر بالنسبة المئوية) ومتوسط ​​القيم (متوسط ​​أجور عمال الصناعة بالسنوات ، وما إلى ذلك). في شكل جدولي ، تحتوي السلسلة الزمنية على عمودين أو صفين.

يتضمن البناء الصحيح للسلاسل الزمنية استيفاء عدد من المتطلبات:

  1. يجب أن تكون جميع مؤشرات سلسلة الديناميات مدعومة علميًا وموثوقة ؛
  2. يجب أن تكون مؤشرات سلسلة الديناميات قابلة للمقارنة في الوقت المناسب ، أي يجب أن تحسب لنفس الفترات الزمنية أو في نفس التواريخ ؛
  3. يجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة عبر الإقليم ؛
  4. يجب أن تكون مؤشرات سلسلة الديناميات قابلة للمقارنة في المحتوى ، أي محسوبة وفق منهجية واحدة وبنفس الطريقة ؛
  5. يجب أن تكون مؤشرات سلسلة الديناميكيات قابلة للمقارنة عبر مجموعة المزارع التي تم النظر فيها. يجب إعطاء جميع مؤشرات سلسلة الديناميات في نفس وحدات القياس.

المؤشرات الإحصائيةيمكن أن يميز إما نتائج العملية قيد الدراسة على مدى فترة زمنية ، أو حالة الظاهرة قيد الدراسة في وقت معين ، أي يمكن أن تكون المؤشرات فاصلة (دورية) وفورية. وفقًا لذلك ، يمكن أن تكون سلسلة الديناميكيات في البداية إما فاصلًا أو لحظة. يمكن أن تكون سلسلة الديناميكيات اللحظية بدورها بفواصل زمنية متساوية وغير متكافئة.

يمكن تحويل السلسلة الأولية من الديناميكيات إلى سلسلة من القيم المتوسطة وسلسلة من القيم النسبية (السلسلة والقاعدة). تسمى هذه السلاسل الزمنية المتسلسلات الزمنية المشتقة.

تختلف طريقة حساب المستوى المتوسط ​​في سلسلة الديناميكيات ، بسبب نوع سلسلة الديناميكيات. باستخدام الأمثلة ، ضع في اعتبارك أنواع السلاسل الزمنية والمعادلات لحساب المستوى المتوسط.

مكاسب مطلقة (Δy) يوضح عدد الوحدات التي تغير فيها المستوى التالي من السلسلة مقارنة بالمستوى السابق (العمود 3. - سلسلة الزيادات المطلقة) أو مقارنة بالمستوى الأولي (العمود 4. - الزيادات المطلقة الأساسية). يمكن كتابة معادلات الحساب على النحو التالي:

مع انخفاض القيم المطلقة للسلسلة ، سيكون هناك "انخفاض" ، "انخفاض" ، على التوالي.

وتشير مؤشرات النمو المطلق ، على سبيل المثال ، في عام 1998 إلى زيادة إنتاج المنتج "أ" بمقدار 4000 طن مقارنة بعام 1997 ، وبمقدار 34 ألف طن مقارنة بعام 1994 ؛ لسنوات أخرى ، انظر الجدول. 11.5 غرام 3 و 4.

عامل النمويوضح عدد المرات التي تغير فيها مستوى السلسلة مقارنة بالمستوى السابق (العمود 5 - نمو السلسلة أو عوامل التراجع) أو مقارنة بالمستوى الأولي (العمود 6 - عوامل النمو أو الانخفاض الأساسية). يمكن كتابة معادلات الحساب على النحو التالي:

معدلات النموعرض عدد النسبة المئوية التي تمت مقارنة المستوى التالي من السلسلة بالمستوى السابق (العمود 7 - معدلات نمو السلسلة) أو مقارنته بالمستوى الأولي (العمود 8 - معدلات النمو الأساسية). يمكن كتابة معادلات الحساب على النحو التالي:

لذلك ، على سبيل المثال ، في عام 1997 ، كان حجم إنتاج المنتج "أ" مقارنة بعام 1996 هو 105.5٪ (

معدل النموتبين عدد النسبة المئوية التي زاد مستوى فترة التقرير عنها مقارنة بالمستوى السابق (العمود 9 - معدلات نمو السلسلة) أو مقارنة بالمستوى الأولي (العمود 10 - معدلات النمو الأساسية). يمكن كتابة معادلات الحساب على النحو التالي:

T pr \ u003d T p - 100٪ أو T pr \ u003d زيادة / مستوى مطلق للفترة السابقة * 100٪

لذلك ، على سبيل المثال ، في عام 1996 ، مقارنة بعام 1995 ، تم إنتاج المنتج "أ" بنسبة 3.8٪ (103.8٪ - 100٪) أو (8: 210) × 100٪ ، ومقارنة بعام 1994. - بنسبة 9٪ ( 109٪ - 100٪).

إذا انخفضت المستويات المطلقة في السلسلة ، فسيكون المعدل أقل من 100٪ ، وبالتالي سيكون هناك معدل تراجع (معدل النمو بعلامة ناقص).

زيادة القيمة المطلقة بنسبة 1٪(العمود 11) يوضح عدد الوحدات التي يجب إنتاجها في فترة معينة من أجل زيادة مستوى الفترة السابقة بنسبة 1٪. في مثالنا ، في عام 1995 كان من الضروري إنتاج 2.0 ألف طن ، وفي عام 1998 - 2.3 ألف طن ، أي أكبر بكثير.

هناك طريقتان لتحديد حجم القيمة المطلقة لنمو 1٪:

قسّم مستوى الفترة السابقة على 100 ؛

قسّم معدلات نمو السلسلة المطلقة على معدلات نمو السلسلة المقابلة.

زيادة القيمة المطلقة بنسبة 1٪ =

في الديناميكيات ، خاصة على مدى فترة طويلة ، من المهم تحليل معدل النمو بشكل مشترك مع محتوى كل نسبة زيادة أو نقصان.

لاحظ أن المنهجية المدروسة لتحليل السلاسل الزمنية قابلة للتطبيق على السلاسل الزمنية ، والتي يتم التعبير عن مستوياتها بالقيم المطلقة (t ، ألف روبل ، عدد الموظفين ، إلخ) ، وبالنسبة للسلاسل الزمنية ، مستويات التي يتم التعبير عنها في مؤشرات نسبية (٪ من الخردة ،٪ محتوى رماد الفحم ، إلخ) أو متوسط ​​القيم (متوسط ​​العائد في c / ha ، متوسط ​​الأجور ، إلخ).

جنبا إلى جنب مع المؤشرات التحليلية المدروسة المحسوبة لكل سنة مقارنة بالمستوى السابق أو الأولي ، عند تحليل السلاسل الزمنية ، من الضروري حساب متوسط ​​المؤشرات التحليلية للفترة: متوسط ​​مستوى السلسلة ، متوسط ​​الزيادة السنوية المطلقة (انخفاض) ومتوسط ​​معدل النمو السنوي ومعدل النمو.

تمت مناقشة طرق حساب المستوى المتوسط ​​لسلسلة من الديناميكيات أعلاه. في سلسلة الديناميكيات الفاصلة التي ندرسها ، يتم حساب المستوى المتوسط ​​للسلسلة بواسطة صيغة المتوسط ​​الحسابي البسيط:

متوسط ​​الإنتاج السنوي للمنتج لعام 1994-1998. بلغت 218.4 ألف طن.

يتم أيضًا حساب متوسط ​​الزيادة السنوية المطلقة بواسطة معادلة المتوسط ​​الحسابي البسيط:

تفاوتت الزيادات السنوية المطلقة على مدى السنوات من 4 إلى 12 ألف طن (انظر غرام 3) ، ومتوسط ​​الزيادة السنوية في الإنتاج للفترة 1995 - 1998. بلغت 8.5 ألف طن.

تتطلب طرق حساب متوسط ​​معدل النمو ومتوسط ​​معدل النمو مزيدًا من الدراسة التفصيلية. دعنا نأخذها في الاعتبار في مثال المؤشرات السنوية لمستوى السلسلة الوارد في الجدول.

المستوى المتوسط ​​لمجموعة الديناميات.

سلسلة من الديناميكيات (أو سلاسل زمنية)- هذه هي القيم العددية لمؤشر إحصائي معين في لحظات أو فترات زمنية متتالية (أي مرتبة ترتيبًا زمنيًا).

يتم استدعاء القيم العددية لمؤشر إحصائي معين يتكون من سلسلة من الديناميكيات مستويات العددوعادة ما يشار إليها بالحرف ذ. أول عضو في السلسلة ص 1يسمى الأولي أو حدود، وآخر ذ ن - نهائي. اللحظات أو الفترات الزمنية التي تشير إليها المستويات ر.

يتم تقديم السلاسل الديناميكية ، كقاعدة عامة ، في شكل جدول أو رسم بياني ، ويتم إنشاء مقياس زمني على طول المحور السيني ر، وعلى طول الإحداثي - مقياس مستويات السلسلة ذ.

متوسط ​​مؤشرات سلسلة من الديناميكيات

يمكن اعتبار كل سلسلة من الديناميكيات كمجموعة معينة نمؤشرات متغيرة بمرور الوقت يمكن تلخيصها كمتوسطات. هذه المؤشرات (المتوسط) المعممة ضرورية بشكل خاص عند مقارنة التغييرات في مؤشر أو آخر في فترات مختلفة ، في بلدان مختلفة ، إلخ.

يمكن أن تكون السمة المعممة لسلسلة من الديناميكيات ، أولاً وقبل كل شيء ، متوسط ​​مستوى الصف. تعتمد طريقة حساب المستوى المتوسط ​​على ما إذا كانت سلسلة لحظة أم سلسلة فاصلة (فترة).

متي فترةالمتسلسلة ، يتم تحديد مستواها المتوسط ​​بواسطة معادلة المتوسط ​​الحسابي البسيط لمستويات السلسلة ، أي

=
إذا كان ذلك متاحًا لحظةصف يحتوي على نالمستويات ( y1، y2،…، yn) بفواصل زمنية متساوية بين التواريخ (نقاط زمنية) ، يمكن تحويل هذه السلسلة بسهولة إلى سلسلة من القيم المتوسطة. في نفس الوقت ، فإن المؤشر (المستوى) في بداية كل فترة هو في نفس الوقت المؤشر في نهاية الفترة السابقة. ثم يمكن حساب متوسط ​​قيمة المؤشر لكل فترة (الفترة الفاصلة بين التواريخ) كنصف مجموع القيم فيفي بداية ونهاية الفترة ، أي كيف . سيكون عدد هذه المتوسطات. كما ذكرنا سابقًا ، بالنسبة لسلسلة من المتوسطات ، يتم حساب المستوى المتوسط ​​من المتوسط ​​الحسابي.

لذلك يمكننا أن نكتب:
.
بعد تحويل البسط نحصل على:
,

أين Y1و ي- المستويات الأولى والأخيرة من السلسلة ؛ يي- المستويات المتوسطة.

يُعرف هذا المتوسط ​​في الإحصائيات باسم متوسط ​​التسلسل الزمنيلسلسلة اللحظة. حصلت على هذا الاسم من كلمة "cronos" (الوقت ، خطوط الطول) ، حيث يتم حسابها من المؤشرات التي تتغير بمرور الوقت.

في حالة عدم المساواةالفواصل الزمنية بين التواريخ ، يمكن حساب المتوسط ​​الزمني للسلسلة اللحظية كمتوسط ​​حسابي لمتوسط ​​قيم المستويات لكل زوج من اللحظات ، مرجحًا بالمسافات (الفواصل الزمنية) بين التواريخ ، أي
.
في هذه الحالةمن المفترض أنه في الفترات الفاصلة بين التواريخ ، اتخذت المستويات قيمًا مختلفة ، ونحن من اثنين من المعروفين ( ييو يي + 1) نحدد المتوسطات ، ومن ثم نحسب المتوسط ​​العام للفترة التي تم تحليلها بأكملها.
إذا افترض أن كل قيمة يييبقى دون تغيير حتى اليوم التالي (أنا + 1)- اللحظة ، أي التاريخ الدقيق للتغيير في المستويات معروف ، ثم يمكن إجراء الحساب باستخدام معادلة المتوسط ​​الحسابي المرجح:
,

أين هو الوقت الذي ظل فيه المستوى دون تغيير.

بالإضافة إلى المستوى المتوسط ​​في سلسلة الديناميكيات ، يتم أيضًا حساب متوسط ​​المؤشرات الأخرى - متوسط ​​التغيير في مستويات السلسلة (الطرق الأساسية وسلسلة) ، متوسط ​​معدل التغيير.

خط الأساس يعني التغيير المطلقهو حاصل قسمة آخر تغيير أساسي مطلق مقسومًا على عدد التغييرات. هذا هو

السلسلة تعني التغيير المطلق مستويات السلسلة هي حاصل قسمة مجموع كل التغييرات المطلقة في السلسلة على عدد التغييرات ، أي

من خلال علامة متوسط ​​التغيرات المطلقة ، يتم أيضًا الحكم على طبيعة التغيير في الظاهرة في المتوسط: النمو أو التراجع أو الاستقرار.

من قاعدة التحكم في التغييرات الأساسية والسلسلة المطلقة ، يترتب على ذلك أن التغييرات الأساسية ومتوسط ​​السلسلة يجب أن تكون متساوية.

جنبًا إلى جنب مع متوسط ​​التغيير المطلق ، يُحسب متوسط ​​النسبي أيضًا باستخدام الطريقتين الأساسية والسلسلة.

متوسط ​​خط الأساس للتغيير النسبييتم تحديده من خلال الصيغة:

السلسلة تعني التغيير النسبييتم تحديده من خلال الصيغة:

بطبيعة الحال ، يجب أن تكون التغييرات النسبية الأساسية والمتوسط ​​التسلسلي هي نفسها ، ومن خلال مقارنتها مع القيمة المعيارية 1 ، يتم التوصل إلى استنتاج حول طبيعة التغيير في الظاهرة في المتوسط: النمو ، أو التدهور ، أو الاستقرار.
بطرح 1 من متوسط ​​التغيير النسبي الأساسي أو المتسلسل ، يكون المقابل متوسط ​​معدل التغيير، من خلال العلامة التي يمكن للمرء أن يحكم عليها أيضًا على طبيعة التغيير في الظاهرة قيد الدراسة ، والتي تعكسها هذه السلسلة من الديناميكيات.

التقلبات الموسمية ومؤشرات الموسمية.

التقلبات الموسمية هي تقلبات ثابتة داخل السنة.

المبدأ الأساسي للإدارة للحصول على أقصى تأثير هو تعظيم الدخل وتقليل التكاليف. من خلال دراسة التقلبات الموسمية ، يتم حل مشكلة المعادلة القصوى في كل مستوى من مستويات السنة.

عند دراسة التقلبات الموسمية ، يتم حل مهمتين مترابطتين:

1 - تحديد خصوصيات تطور الظاهرة في الديناميكيات السنوية ؛

2. قياس التقلبات الموسمية مع بناء نموذج الموجة الموسمية.

عادة ما يتم حساب الديوك الرومية الموسمية لقياس الموسمية. بشكل عام ، يتم تحديدها من خلال نسبة المعادلات الأصلية لسلسلة من الديناميكيات إلى المعادلات النظرية التي تعمل كأساس للمقارنة.

نظرًا لأن الانحرافات العشوائية يتم فرضها على التقلبات الموسمية ، يتم حساب متوسط ​​مؤشرات الموسمية للقضاء عليها.

في هذه الحالة ، لكل فترة من الدورة السنوية ، يتم تحديد المؤشرات المعممة في شكل متوسط ​​المؤشرات الموسمية:

مؤشرات متوسط ​​التقلبات الموسمية خالية من تأثير الانحرافات العشوائية لاتجاه التنمية الرئيسي.

اعتمادًا على طبيعة الاتجاه ، يمكن أن تتخذ صيغة مؤشر متوسط ​​الموسمية الأشكال التالية:

1.بالنسبة لسلسلة من الديناميكيات السنوية ذات الاتجاه التنموي الرئيسي الواضح:

2 - بالنسبة لسلسلة الديناميات خلال السنة التي لا يوجد فيها اتجاه تصاعدي أو تنازلي ، أو ليس لها أهمية:

أين العوارية العامة؟

طرق تحليل الاتجاه الرئيسي.

يتأثر تطور الظواهر بمرور الوقت بعوامل مختلفة في الطبيعة وقوة التأثير. بعضها عشوائي بطبيعته ، والبعض الآخر له تأثير شبه ثابت ويشكل اتجاهًا تنمويًا معينًا في سلسلة الديناميكيات.

تتمثل إحدى المهام المهمة للإحصاءات في تحديد اتجاه في سلسلة الديناميكيات ، متحررًا من تأثير العوامل العشوائية المختلفة. لهذا الغرض ، تتم معالجة السلاسل الزمنية بطرق تكبير الفاصل الزمني والمتوسط ​​المتحرك والمحاذاة التحليلية ، إلخ.

طريقة التخشين الفاصليعتمد على توسيع الفترات الزمنية ، والتي تشمل مستويات سلسلة من الديناميكيات ، أي هو استبدال البيانات المتعلقة بفترات زمنية صغيرة ببيانات من فترات زمنية أكبر. إنه فعال بشكل خاص عندما تكون المستويات الأولية للسلسلة لفترات زمنية قصيرة. على سبيل المثال ، يتم استبدال سلسلة المؤشرات المتعلقة بالأحداث اليومية بسلسلة مرتبطة بالأسبوعية والشهرية وما إلى ذلك. سيظهر هذا بشكل أكثر وضوحا "محور تطور الظاهرة". المتوسط ​​، المحسوب على أساس الفترات الموسعة ، يجعل من الممكن تحديد الاتجاه والشخصية (تسارع أو تباطؤ النمو) لاتجاه التنمية الرئيسي.

طريقة المتوسط ​​المتحركعلى غرار المستوى السابق ، ولكن في هذه الحالة ، يتم استبدال المستويات الفعلية بمتوسط ​​المستويات المحسوبة على فترات متتالية تتحرك (انزلاق) موسعة تغطي ممستويات الصف.

فمثلاإذا قبلت م = 3 ،ثم ، أولاً ، يتم حساب متوسط ​​المستويات الثلاثة الأولى من السلسلة ، ثم - من نفس العدد من المستويات ، ولكن بدءًا من المستوى الثاني على التوالي ، ثم - بدءًا من المستوى الثالث ، إلخ. وهكذا ، فإن المتوسط ​​، إذا جاز التعبير ، "ينزلق" على طول سلسلة الديناميكيات ، متحركًا لفترة واحدة. محسوب من ميشير أعضاء المتوسطات المتحركة إلى الوسط (الوسط) لكل فترة زمنية.

هذه الطريقة تقضي فقط على التقلبات العشوائية. إذا كانت السلسلة تحتوي على موجة موسمية ، فإنها ستبقى بعد التنعيم بطريقة المتوسط ​​المتحرك.

محاذاة تحليلية. من أجل القضاء على التقلبات العشوائية وتحديد الاتجاه ، يتم محاذاة مستويات السلسلة وفقًا للصيغ التحليلية (أو المحاذاة التحليلية). جوهرها هو استبدال المستويات التجريبية (الفعلية) بمستويات نظرية ، والتي يتم حسابها وفقًا لمعادلة معينة ، تؤخذ كنموذج رياضي للاتجاه ، حيث يتم اعتبار المستويات النظرية كدالة للوقت:. في هذه الحالة ، يعتبر كل مستوى فعلي كمجموع مكونين: ، حيث يكون مكونًا منهجيًا ويتم التعبير عنه بمعادلة معينة ، وهو متغير عشوائي يسبب تقلبات حول الاتجاه.

مهمة المحاذاة التحليلية هي كما يلي:

1. التحديد على أساس البيانات الفعلية نوع الوظيفة الافتراضية التي يمكن أن تعكس بشكل ملائم اتجاه تطور المؤشر قيد الدراسة.

2. إيجاد معاملات الوظيفة المحددة (المعادلة) من البيانات التجريبية

3. الحساب على أساس المعادلة التي تم إيجادها للمستويات النظرية (المستوية).

يتم اختيار وظيفة معينة ، كقاعدة عامة ، على أساس تمثيل رسومي للبيانات التجريبية.

النماذج هي معادلات انحدار ، وتحسب معاملاتها بطريقة المربعات الصغرى

فيما يلي معادلات الانحدار الأكثر استخدامًا لتسوية السلاسل الزمنية ، مع الإشارة إلى اتجاهات التنمية الأكثر ملاءمة لعكسها.

للعثور على معلمات المعادلات أعلاه ، هناك خوارزميات وبرامج كمبيوتر خاصة. على وجه الخصوص ، للعثور على معلمات معادلة الخط المستقيم ، يمكن استخدام الخوارزمية التالية:

إذا تم ترقيم الفترات أو اللحظات الزمنية بحيث يتم الحصول على St = 0 ، فسيتم تبسيط الخوارزميات المذكورة أعلاه بشكل كبير وتتحول إلى

ستكون المستويات المحاذية على الرسم البياني موجودة على خط مستقيم واحد يمر على أقرب مسافة من المستويات الفعلية لهذه السلسلة الديناميكية. مجموع الانحرافات التربيعية هو انعكاس لتأثير العوامل العشوائية.

بمساعدتها ، نحسب متوسط ​​الخطأ (القياسي) للمعادلة:

هنا n هو عدد المشاهدات ، و m هو عدد المعلمات في المعادلة (لدينا اثنان منهم - b 1 و b 0).

يوضح الاتجاه الرئيسي (الاتجاه) كيف تؤثر العوامل المنهجية على مستويات سلسلة من الديناميكيات ، ويعمل تذبذب المستويات حول الاتجاه () كمقياس لتأثير العوامل المتبقية.

لتقييم جودة نموذج السلاسل الزمنية المستخدم ، يتم استخدامه أيضًا اختبار فيشر F. هي نسبة تباينين ​​، وهما نسبة التباين الناتج عن الانحدار ، أي العامل المدروس ، إلى التشتت الناتج عن أسباب عشوائية ، أي التباين المتبقي:

في شكل موسع ، يمكن تمثيل صيغة هذا المعيار على النحو التالي:

حيث n هو عدد الملاحظات ، أي عدد مستويات الصف ،

م هو عدد المعلمات في المعادلة ، ص هو المستوى الفعلي للسلسلة ،

المستوى المحاذي للصف - المستوى المتوسط ​​للصف.

أكثر نجاحًا من غيره ، قد لا يكون النموذج دائمًا مرضيًا بدرجة كافية. لا يمكن التعرف عليه على هذا النحو إلا إذا تجاوز المعيار F له حدًا حرجًا معينًا. يتم تعيين هذه الحدود باستخدام جداول التوزيع F.

جوهر وتصنيف المؤشرات.

يُفهم مؤشر الإحصاء على أنه مؤشر نسبي يميز التغيير في حجم ظاهرة في الزمان أو المكان أو بالمقارنة مع أي معيار.

العنصر الرئيسي لعلاقة المؤشر هو القيمة المفهرسة. تُفهم القيمة المفهرسة على أنها قيمة علامة لمجتمع إحصائي ، وتغييرها هو موضوع الدراسة.

تخدم الفهارس ثلاثة أغراض رئيسية:

1) تقييم التغيرات في ظاهرة معقدة ؛

2) تحديد تأثير العوامل الفردية على تغيير ظاهرة معقدة ؛

3) مقارنة حجم ظاهرة ما بحجم الفترة الماضية ، وحجم إقليم آخر ، وكذلك مع المعايير والخطط والتنبؤات.

تصنف المؤشرات وفق 3 معايير:

2) حسب درجة تغطية عناصر السكان ؛

3) عن طريق طرق حساب المؤشرات العامة.

حسب المحتوىمن القيم المفهرسة ، تنقسم المؤشرات إلى مؤشرات كمية (حجمية) ومؤشرات مؤشرات نوعية. مؤشرات المؤشرات الكمية - مؤشرات الحجم المادي للإنتاج الصناعي ، الحجم المادي للمبيعات ، العدد ، إلخ. مؤشرات المؤشرات النوعية - مؤشرات الأسعار ، التكاليف ، إنتاجية العمالة ، متوسط ​​الأجور ، إلخ.

حسب درجة تغطية الوحدات السكانية ، تنقسم المؤشرات إلى فئتين: فردية وعامة. لتوصيفها ، نقدم الاصطلاحات التالية المعتمدة في ممارسة تطبيق طريقة الفهرس:

ف- الكمية (الحجم) من أي منتج عيني ؛ ص- سعر وحدة الإنتاج ؛ ض- تكلفة وحدة الإنتاج ؛ ر- الوقت الذي يقضيه في إنتاج وحدة الإنتاج (كثافة اليد العاملة) ؛ ث- ناتج الإنتاج من حيث القيمة لكل وحدة زمنية ؛ الخامس- الناتج من الناحية المادية لكل وحدة زمنية ؛ تي- إجمالي الوقت المستغرق أو عدد الموظفين.

من أجل التمييز بين الفترة أو العنصر الذي تنتمي إليه القيم المفهرسة ، من المعتاد وضع الرموز بعد الرمز المقابل في أسفل اليمين. لذلك ، على سبيل المثال ، في فهارس الديناميكيات ، كقاعدة عامة ، بالنسبة للفترات المقارنة (الحالية ، التقارير) ، يتم استخدام الرمز 1 وللفترات التي يتم إجراء المقارنة معها ،

المؤشرات الفرديةتعمل على وصف التغيير في العناصر الفردية لظاهرة معقدة (على سبيل المثال ، تغيير في حجم إنتاج نوع واحد من المنتجات). أنها تمثل القيم النسبية للديناميات ، والوفاء بالالتزامات ، ومقارنة القيم المفهرسة.

يتم تحديد المؤشر الفردي للحجم المادي للإنتاج

من وجهة نظر تحليلية ، تتشابه مؤشرات الديناميكيات الفردية المعطاة مع معاملات (معدلات) النمو وتميز التغيير في القيمة المفهرسة في الفترة الحالية مقارنة بالقيمة الأساسية ، أي إظهار عدد مرات زيادة (انخفاض) ) أو كم نسبة النمو (نقصان). يتم التعبير عن قيم الفهرس بالمعاملات أو النسب المئوية.

المؤشر العام (المركب)يعكس التغيير في جميع عناصر ظاهرة معقدة.

الفهرس الإجماليهو الشكل الأساسي للفهرس. يطلق عليه التجميع لأن البسط والمقام عبارة عن مجموعة من "التجميع"

متوسط ​​المؤشرات وتعريفها.

بالإضافة إلى المؤشرات المجمعة ، يتم استخدام شكل آخر منها في الإحصائيات - مؤشرات المتوسط ​​المرجح. يتم اللجوء إلى حسابها عندما لا تسمح المعلومات المتاحة بحساب مؤشر التجميع العام. لذلك ، إذا لم تكن هناك بيانات عن الأسعار ، ولكن هناك معلومات عن تكلفة المنتجات في الفترة الحالية وكانت مؤشرات الأسعار الفردية لكل منتج معروفة ، فلا يمكن تحديد مؤشر الأسعار العام كمؤشر إجمالي ، ولكن هذا ممكن لحسابه كمتوسط ​​عدد الأفراد. بالطريقة نفسها ، إذا كانت كميات المنتجات الفردية المنتجة غير معروفة ، ولكن المؤشرات الفردية وتكلفة الإنتاج لفترة الأساس معروفة ، فيمكن تحديد المؤشر العام للحجم المادي للإنتاج كمتوسط ​​مرجح.

متوسط ​​المؤشر -هذا هومؤشر محسوب كمتوسط ​​للمؤشرات الفردية. الفهرس التجميعي هو الشكل الأساسي للفهرس العام ، لذلك يجب أن يكون المؤشر المتوسط ​​مطابقًا للفهرس التجميعي. عند حساب متوسط ​​المؤشرات ، يتم استخدام شكلين من المتوسطات: الحساب والتناسق.

يكون مؤشر المتوسط ​​الحسابي مطابقًا للمؤشر التجميعي إذا كانت أوزان المؤشرات الفردية هي شروط مقام الفهرس التجميعي. فقط في هذه الحالة ستكون قيمة المؤشر المحسوبة بواسطة صيغة المتوسط ​​الحسابي مساوية للفهرس التجميعي.

يتم تعريفها على أنها خاصية معممة لحجم تباين سمة في المجموع. إنه يساوي الجذر التربيعي لمتوسط ​​مربع انحرافات القيم الفردية للميزة عن الوسط الحسابي ، أي يمكن العثور على جذر ويمكن العثور عليه مثل هذا:

1. للصف الأساسي:

2. بالنسبة لسلسلة التباينات:

يؤدي تحويل معادلة الانحراف المعياري إلى شكل أكثر ملاءمة للحسابات العملية:

الانحراف المعيارييحدد مقدار انحراف الخيارات المحددة ، في المتوسط ​​، عن متوسط ​​قيمتها ، بالإضافة إلى أنه مقياس مطلق لتقلب السمة ويتم التعبير عنه في نفس الوحدات مثل الخيارات ، وبالتالي يتم تفسيره جيدًا.

أمثلة على إيجاد الانحراف المعياري: ,

بالنسبة إلى الميزات البديلة ، تبدو صيغة الانحراف المعياري كما يلي:

حيث p هي نسبة الوحدات السكانية التي لها سمة معينة ؛

ف - نسبة الوحدات التي لا تمتلك هذه الميزة.

مفهوم متوسط ​​الانحراف الخطي

متوسط ​​الانحراف الخطييُعرَّف بأنه الوسط الحسابي للقيم المطلقة لانحرافات الخيارات الفردية عن.

1. للصف الأساسي:

2. بالنسبة لسلسلة التباينات:

حيث مجموع n هو مجموع ترددات سلسلة التباين.

مثال على إيجاد متوسط ​​الانحراف الخطي:

إن ميزة متوسط ​​الانحراف المطلق كمقياس للتشتت على مدى التباين واضحة ، لأن هذا المقياس يعتمد على مراعاة جميع الانحرافات المحتملة. لكن هذا المؤشر له عيوب كبيرة. يمكن أن يؤدي الرفض التعسفي لعلامات الانحرافات الجبرية إلى حقيقة أن الخصائص الرياضية لهذا المؤشر بعيدة كل البعد عن أن تكون أولية. هذا يعقد بشكل كبير استخدام متوسط ​​الانحراف المطلق في حل المشكلات المتعلقة بالحسابات الاحتمالية.

لذلك ، نادرًا ما يتم استخدام متوسط ​​الانحراف الخطي كمقياس لتغير الميزة في الممارسة الإحصائية ، أي عندما يكون تجميع المؤشرات دون مراعاة العلامات منطقيًا من الناحية الاقتصادية. بمساعدتها ، على سبيل المثال ، يتم تحليل معدل دوران التجارة الخارجية ، وتكوين الموظفين ، وإيقاع الإنتاج ، وما إلى ذلك.

معدل الجذر التربيعي

تم تطبيق RMS، على سبيل المثال ، لحساب متوسط ​​حجم جوانب n من المقاطع المربعة ، ومتوسط ​​أقطار الجذوع ، والأنابيب ، وما إلى ذلك ، وهي مقسمة إلى نوعين.

جذر متوسط ​​التربيع بسيط. إذا كان من الضروري ، عند استبدال القيم الفردية لسمة بقيمة متوسطة ، الاحتفاظ بمجموع مربعات القيم الأصلية دون تغيير ، فسيكون المتوسط ​​متوسطًا تربيعيًا.

إنه الجذر التربيعي لحاصل مجموع مربعات قيم السمات الفردية مقسومًا على عددها:

يتم حساب متوسط ​​المربع المرجح بالصيغة:

حيث f هي علامة على الوزن.

متوسط ​​مكعب

تم تطبيق متوسط ​​مكعب، على سبيل المثال ، عند تحديد متوسط ​​طول الضلع والمكعبات. وهي مقسمة إلى نوعين.
متوسط ​​مكعب بسيط:

عند حساب القيم المتوسطة والتشتت في سلسلة التوزيع الفاصل ، يتم استبدال القيم الحقيقية للسمة بالقيم المركزية للفواصل الزمنية ، والتي تختلف عن المتوسط ​​الحسابي للقيم المدرجة في فترة. هذا يؤدي إلى خطأ منهجي في حساب التباين. ف. قرر شيبارد ذلك خطأ في حساب التباين، الناتج عن تطبيق البيانات المجمعة ، هو 1/12 من مربع قيمة الفاصل ، سواء لأعلى أو لأسفل في حجم التباين.

تعديل شيبارديجب استخدامه إذا كان التوزيع قريبًا من العادي ، ويشير إلى ميزة ذات طبيعة مستمرة من التباين ، مبنية على كمية كبيرة من البيانات الأولية (n> 500). ومع ذلك ، بناءً على حقيقة أنه في عدد من الحالات ، فإن كلا الخطأين ، اللذين يعملان في اتجاهات مختلفة ، يعوضان بعضهما البعض ، فمن الممكن أحيانًا رفض إدخال تعديلات.

كلما كان التباين والانحراف المعياري أصغر ، زاد تجانس السكان وكلما كان المتوسط ​​أكثر نموذجية.
في ممارسة الإحصاء ، غالبًا ما يكون من الضروري مقارنة الاختلافات في الميزات المختلفة. على سبيل المثال ، من المهم مقارنة الاختلافات في عمر العمال ومؤهلاتهم ، ومدة الخدمة والأجور ، والتكلفة والربح ، ومدة الخدمة وإنتاجية العمل ، إلخ. بالنسبة لمثل هذه المقارنات ، فإن مؤشرات التباين المطلق للخصائص غير مناسبة: من المستحيل مقارنة تباين خبرة العمل ، معبراً عنه بالسنوات ، مع اختلاف الأجور ، معبراً عنه بالروبل.

لإجراء مثل هذه المقارنات ، بالإضافة إلى مقارنات تذبذب نفس السمة في عدة مجموعات سكانية ذات متوسط ​​حسابي مختلف ، يتم استخدام مؤشر نسبي للتباين - معامل التباين.

المتوسطات الهيكلية

لتوصيف الاتجاه المركزي في التوزيعات الإحصائية ، غالبًا ما يكون من المنطقي استخدام قيمة معينة للسمة X ، جنبًا إلى جنب مع المتوسط ​​الحسابي ، والتي يمكن ، بسبب بعض ميزات موقعها في سلسلة التوزيع ، أن تميز مستواها.

هذا مهم بشكل خاص عندما يكون للقيم القصوى للمعلم في سلسلة التوزيع حدود غير واضحة. في هذا الصدد ، فإن التحديد الدقيق للوسيلة الحسابية ، كقاعدة عامة ، مستحيل أو صعب للغاية. في مثل هذه الحالات ، يمكن تحديد المستوى المتوسط ​​بأخذ ، على سبيل المثال ، قيمة الميزة الموجودة في منتصف سلسلة التردد أو التي تحدث غالبًا في السلسلة الحالية.

تعتمد هذه القيم فقط على طبيعة الترددات ، أي على هيكل التوزيع. إنها نموذجية من حيث الموقع في سلسلة التردد ، لذلك تعتبر هذه القيم من خصائص مركز التوزيع وبالتالي تم تعريفها على أنها متوسطات هيكلية. يتم استخدامها لدراسة الهيكل الداخلي وهيكل سلسلة توزيع قيم السمة. تشمل هذه المؤشرات.

الانحراف المعياري هو مؤشر كلاسيكي للتباين من الإحصاء الوصفي.

الانحراف المعياري، الانحراف المعياري ، RMS ، نموذج الانحراف المعياري (الانحراف المعياري الإنجليزي ، STD ، STDev) هو مقياس شائع جدًا للتشتت في الإحصاء الوصفي. ولكن التحليل الفني شبيه بالإحصاءات ، ويمكن (ويجب) استخدام هذا المؤشر في التحليل الفني لاكتشاف درجة تشتت سعر الأداة التي تم تحليلها بمرور الوقت. يشار إليها بالرمز اليوناني سيجما "σ".

بفضل Karl Gauss و Pearson لحقيقة أن لدينا فرصة لاستخدام الانحراف المعياري.

استخدام الانحراف المعياري في التحليل الفني، ندير هذا "مؤشر التشتت" في "مؤشر التقلب"حفظ المعنى مع تغيير المصطلحات.

ما هو الانحراف المعياري

ولكن بالإضافة إلى الحسابات المساعدة الوسيطة ، الانحراف المعياري مقبول تمامًا للحساب الذاتيوالتطبيقات في التحليل الفني. كما لاحظ أحد القراء النشطين لمجلة الأرقطيون ، " ما زلت لا أفهم سبب عدم تضمين RMS في مجموعة المؤشرات القياسية لمراكز التعامل المحلية«.

حقًا، يمكن للانحراف المعياري بطريقة كلاسيكية و "خالصة" قياس تنوع الأداة. لكن لسوء الحظ ، هذا المؤشر ليس شائعًا جدًا في تحليل الأوراق المالية.

تطبيق الانحراف المعياري

لا يعد حساب الانحراف المعياري يدويًا أمرًا مثيرًا للاهتمام.لكنها مفيدة للتجربة. يمكن التعبير عن الانحراف المعياريالصيغة STD = √ [(∑ (x-x) 2) / n] ، والتي تبدو مثل المجموع الجذري للاختلافات التربيعية بين عناصر العينة والمتوسط ​​، مقسومًا على عدد العناصر في العينة.

إذا تجاوز عدد العناصر في العينة 30 ، فإن مقام الكسر تحت الجذر يأخذ القيمة n-1. خلاف ذلك ، يتم استخدام n.

خطوة بخطوة حساب الانحراف المعياري:

  1. حساب المتوسط ​​الحسابي لعينة البيانات
  2. اطرح هذا المتوسط ​​من كل عنصر من عناصر العينة
  3. يتم تربيع جميع الفروق الناتجة
  4. اجمع كل المربعات الناتجة
  5. قسّم المجموع الناتج على عدد العناصر في العينة (أو على n-1 إذا كانت n> 30)
  6. احسب الجذر التربيعي للحاصل الناتج (يسمى تشتت)

لحساب المتوسط ​​الهندسي البسيط ، يتم استخدام الصيغة:

مرجح هندسي

لتحديد المتوسط ​​المرجح الهندسي ، يتم استخدام الصيغة:

يتم تحديد متوسط ​​أقطار العجلات والأنابيب ومتوسط ​​جوانب المربعات باستخدام جذر متوسط ​​المربع.

تستخدم قيم RMS لحساب بعض المؤشرات ، مثل معامل التباين ، الذي يميز إيقاع المخرجات. هنا ، يتم تحديد الانحراف المعياري عن الناتج المخطط له لفترة معينة من خلال الصيغة التالية:

هذه القيم تميز بدقة التغير في المؤشرات الاقتصادية مقارنة بقيمتها الأساسية ، مأخوذة في متوسط ​​قيمتها.

تربيعي بسيط

يتم حساب متوسط ​​المربع البسيط بالصيغة:

مرجح من الدرجة الثانية

جذر متوسط ​​التربيع المرجح هو:

22- تشمل مقاييس التغيير المطلقة ما يلي:

نطاق الاختلاف

يعني الانحراف الخطي

تشتت

الانحراف المعياري

نطاق التباين (ص)

اختلاف المدىهو الفرق بين الحد الأقصى والحد الأدنى لقيم السمة

يوضح الحدود التي تتغير فيها قيمة السمة في المجتمع المدروس.

خبرة العمل لخمسة متقدمين في الوظيفة السابقة هي: 2،3،4،7 و 9 سنوات. الحل: مدى التباين = 9-2 = 7 سنوات.

للحصول على خاصية معممة للاختلافات في قيم السمة ، يتم حساب متوسط ​​مؤشرات الاختلاف بناءً على بدل الانحرافات عن المتوسط ​​الحسابي. يتم أخذ الفرق على أنه الانحراف عن المتوسط.

في الوقت نفسه ، من أجل تجنب التحول إلى صفر في مجموع انحرافات خيارات السمات عن المتوسط ​​(خاصية الصفر للمتوسط) ، يتعين على المرء إما تجاهل علامات الانحراف ، أي أخذ مقياس المجموع هذا ، أو تربيع قيم الانحراف

يعني الانحراف الخطي والمربع

متوسط ​​الانحراف الخطيهو المتوسط ​​الحسابي للانحرافات المطلقة للقيم الفردية للسمة عن المتوسط.

متوسط ​​الانحراف الخطي بسيط:

خبرة العمل لخمسة متقدمين في الوظيفة السابقة هي: 2،3،4،7 و 9 سنوات.

في مثالنا: سنوات ؛

الجواب: 2.4 سنة.

وزن متوسط ​​الانحراف الخطيينطبق على البيانات المجمعة:

نادرًا ما يستخدم متوسط ​​الانحراف الخطي ، نظرًا لاتباعه التقليدي ، في الممارسة العملية (على وجه الخصوص ، لوصف الوفاء بالالتزامات التعاقدية من حيث توحيد التسليم ؛ في تحليل جودة المنتج ، مع مراعاة السمات التكنولوجية للإنتاج ).

الانحراف المعياري

أكثر خصائص التباين مثالية هو الانحراف المعياري ، والذي يسمى الانحراف المعياري (أو الانحراف المعياري). الانحراف المعياري() يساوي الجذر التربيعي للمربع المتوسط ​​لانحرافات القيم الفردية للميزة عن الوسط الحسابي:

الانحراف المعياري بسيط:

يتم تطبيق الانحراف المعياري المرجح على البيانات المجمعة:

بين متوسط ​​المربع والانحرافات الخطية المتوسطة في ظل ظروف التوزيع الطبيعي ، تحدث العلاقة التالية: ~ 1.25.

يتم استخدام الانحراف المعياري ، باعتباره المقياس الرئيسي المطلق للتغير ، في تحديد قيم إحداثيات منحنى التوزيع الطبيعي ، في الحسابات المتعلقة بتنظيم مراقبة العينة وتحديد دقة خصائص العينة ، وكذلك في تقييم حدود تباين سمة في مجموعة سكانية متجانسة.

عند الاختبار الإحصائي للفرضيات ، عند قياس العلاقة الخطية بين المتغيرات العشوائية.

الانحراف المعياري:

الانحراف المعياري(تقدير الانحراف المعياري للأرضيات المتغيرة العشوائية والجدران من حولنا والسقف ، xبالنسبة لتوقعاتها الرياضية بناءً على تقدير غير متحيز لتباينها):

أين - التباين - الأرضية والجدران من حولنا والسقف ، أنا- عنصر العينة - حجم العينة؛ - المتوسط ​​الحسابي للعينة:

وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة ، من المستحيل بناء تقدير غير متحيز. ومع ذلك ، فإن التقدير المستند إلى تقدير التباين غير المتحيز متسق.

ثلاثة حكم سيجما

ثلاثة حكم سيجما() - تقع جميع قيم المتغير العشوائي الموزع بشكل طبيعي تقريبًا في الفاصل الزمني. بشكل أكثر صرامة - مع ما لا يقل عن 99.7 ٪ من اليقين ، تكمن قيمة المتغير العشوائي الموزع بشكل طبيعي في الفاصل الزمني المحدد (بشرط أن تكون القيمة صحيحة ، ولم يتم الحصول عليها نتيجة معالجة العينة).

إذا كانت القيمة الحقيقية غير معروفة ، فلا داعي لاستخدام الأرضية والجدران من حولنا والسقف ، س. وهكذا تترجم قاعدة الثلاث سيجما إلى قاعدة الثلاثة طوابق والجدران من حولنا والسقف ، س .

تفسير قيمة الانحراف المعياري

تُظهر القيمة الكبيرة للانحراف المعياري انتشارًا كبيرًا للقيم في المجموعة المقدمة بمتوسط ​​قيمة المجموعة ؛ تشير القيمة الصغيرة ، على التوالي ، إلى أن القيم الموجودة في المجموعة مجمعة حول القيمة المتوسطة.

على سبيل المثال ، لدينا ثلاث مجموعات أرقام: (0 ، 0 ، 14 ، 14) ، (0 ، 6 ، 8 ، 14) و (6 ، 6 ، 8 ، 8). تحتوي جميع المجموعات الثلاث على قيم متوسطة 7 وانحرافات معيارية 7 و 5 و 1. المجموعة الأخيرة لها انحراف معياري صغير لأن القيم الموجودة في المجموعة تتجمع حول المتوسط ​​؛ المجموعة الأولى لها أكبر قيمة للانحراف المعياري - القيم داخل المجموعة تتباعد بشدة عن القيمة المتوسطة.

بشكل عام ، يمكن اعتبار الانحراف المعياري مقياسًا لعدم اليقين. على سبيل المثال ، في الفيزياء ، يتم استخدام الانحراف المعياري لتحديد خطأ سلسلة من القياسات المتتالية لبعض الكمية. هذه القيمة مهمة جدًا لتحديد معقولية الظاهرة قيد الدراسة مقارنة بالقيمة التي تنبأت بها النظرية: إذا كانت القيمة المتوسطة للقياسات مختلفة تمامًا عن القيم التي تنبأت بها النظرية (الانحراف المعياري الكبير) ، إذن يجب إعادة فحص القيم التي تم الحصول عليها أو طريقة الحصول عليها.

الاستخدام العملي

في الممارسة العملية ، يسمح لك الانحراف المعياري بتحديد مدى اختلاف القيم في المجموعة عن متوسط ​​القيمة.

مناخ

لنفترض أن هناك مدينتين لهما نفس متوسط ​​درجة الحرارة اليومية القصوى ، لكن إحداهما تقع على الساحل والأخرى داخلية. من المعروف أن المدن الساحلية بها درجات حرارة قصوى يومية مختلفة أقل من المدن الداخلية. لذلك فإن الانحراف المعياري للحد الأقصى لدرجات الحرارة اليومية في المدينة الساحلية سيكون أقل مما هو عليه في المدينة الثانية ، على الرغم من حقيقة أن لديهم نفس متوسط ​​قيمة هذه القيمة ، مما يعني عمليًا أن احتمال أن تكون درجة حرارة الهواء القصوى من سيكون كل يوم معين من أيام السنة أقوى يختلف عن متوسط ​​القيمة ، أعلى بالنسبة لمدينة تقع داخل القارة.

رياضة

لنفترض أن هناك العديد من فرق كرة القدم التي تم تصنيفها وفقًا لمجموعة من المعايير ، على سبيل المثال ، عدد الأهداف التي تم تسجيلها وتسجيلها في شباكها ، وفرص التسجيل ، وما إلى ذلك. في مزيد من المعلمات. كلما كان الانحراف المعياري للفريق أصغر لكل من المعلمات المقدمة ، كانت نتيجة الفريق أكثر قابلية للتنبؤ ، وكانت هذه الفرق متوازنة. من ناحية أخرى ، يواجه الفريق ذو الانحراف المعياري الكبير صعوبة في التنبؤ بالنتيجة ، وهو ما يفسر بدوره باختلال التوازن ، على سبيل المثال ، دفاع قوي ولكن هجوم ضعيف.

يسمح استخدام الانحراف المعياري لمعايير الفريق بالتنبؤ بنتيجة المباراة بين فريقين إلى حد ما ، وتقييم نقاط القوة والضعف في الفريقين ، وبالتالي طرق النضال المختارة.

التحليل الفني

أنظر أيضا

المؤلفات

* بوروفيكوف ، ف.الإحصاء. فن تحليل بيانات الكمبيوتر: للمحترفين / ف. بوروفيكوف. - سان بطرسبرج. : بيتر ، 2003. - 688 ص. - ردمك 5-272-00078-1.