متوسط الخطأ التربيعي للعينة أكبر من. متوسط عينة مربع تفسير الخطأ المعياري ل

يوضح متوسط خطأ العينة مدى انحراف المعلمة في المتوسط إطار أخذ العيناتمن المعلمة العامة المقابلة. إذا قمنا بحساب متوسط الأخطاء لجميع العينات الممكنة نوع معينحجم معين ( ن) مستخرجة من نفس عامة السكان ، ثم نحصل على خاصية التعميم الخاصة بهم - يعني خطأ أخذ العينات ().

في نظرية الملاحظة الانتقائية ، صيغ التحديد ، والتي تعتبر فردية طرق مختلفةالاختيار (مكرر وغير متكرر) وأنواع العينات المستخدمة وأنواع المؤشرات الإحصائية التقديرية.

على سبيل المثال ، إذا تم استخدام أخذ العينات العشوائية المتكررة ، فسيتم تعريفها على النحو التالي:

عند تقدير القيمة المتوسطة للميزة ؛

إذا كانت العلامة بديلة ، وقدرت الحصة.

في حالة الاختيار العشوائي غير المتكرر ، يتم تعديل الصيغ (1 - n / N):

- لمتوسط قيمة السمة ؛

- للمشاركة.

دائمًا ما يكون احتمال الحصول على قيمة خطأ كهذه يساوي 0.683. من الناحية العملية ، من الأفضل الحصول على بيانات ذات احتمالية أعلى ، ولكن هذا يؤدي إلى زيادة حجم خطأ العينة.

خطأ أخذ العينات الهامشي () يساوي t من عدد متوسط أخطاء أخذ العينات (في نظرية أخذ العينات ، من المعتاد تسمية المعامل t معامل الثقة):

إذا تضاعف خطأ أخذ العينات (t = 2) ، فسنحصل على احتمال أكبر بكثير ألا يتجاوز حدًا معينًا (في حالتنا ، ضعف متوسط الخطأ) - 0.954. إذا أخذنا t = 3 ، إذن مستوى الثقةسيكون 0.997 - يقين عمليا.

مستوى خطأ هامشييعتمد أخذ العينات على العوامل التالية:

درجة تباين وحدات عامة السكان ؛
حجم العينة؛
مخططات الاختيار المحددة (الاختيار غير المتكرر يعطي قيمة خطأ أصغر) ؛
مستوى الثقة.

إذا كان حجم العينة أكثر من 30 ، فسيتم تحديد قيمة t من جدول التوزيع العادي ، إذا كان أقل - من جدول توزيع الطالب.

فيما يلي بعض قيم معامل الثقة من جدول التوزيع العادي.

يتم تعيين فاصل الثقة للقيمة المتوسطة للسمة وللنسبة في المجتمع العام على النحو التالي:

لذلك فإن تعريف حدود العوارية العامة ونصيبها يتكون من الخطوات التالية:

أخطاء أخذ العينات في أنواع مختلفةاختيار

في الواقع أخذ العينات العشوائية والميكانيكية. تم العثور على متوسط الخطأ لأخذ العينات العشوائية والميكانيكية الفعلية باستخدام الصيغ الواردة في الجدول. 11.3.

مثال 11.2. لدراسة مستوى العائد على الأصول ، تم إجراء مسح بالعينة من 90 مؤسسة من 225 باستخدام العشوائية جارى الاختزال، مما أدى إلى البيانات المعروضة في الجدول.

في هذا المثال ، لدينا عينة 40٪ (90: 225 = 0.4 ، أو 40٪). دعونا نحدد الخطأ الهامشي وحدود القيمة المتوسطة للميزة في عموم السكان من خلال خطوات الخوارزمية:

بناءً على نتائج مسح العينة ، نحسب متوسط القيمة والتباين في عينة السكان:

الجدول 11.5.

نتائج المراقبة			القيم المقدرة
العائد على الأصول ، فرك ، س ط	عدد الشركات ، و ط	منتصف الفترة الزمنية ، x i \ xb4	س ط \ xb4 و ط	x i \ xb4 2 و i
ما يصل إلى 1.4	13	1,3	16,9	21,97
1,4-1,6	15	1,5	22,5	33,75
1,6-1,8	17	1,7	28,9	49,13
1,8-2,0	15	1,9	28,5	54,15
2,0-2,2	16	2,1	33,6	70,56
2.2 وما فوق	14	2,3	32,2	74,06
المجموع	90	-	162,6	303,62

متوسط العينة

تباين العينة في السمة قيد الدراسة

بالنسبة لبياناتنا ، نحدد خطأ أخذ العينات الهامشي ، على سبيل المثال ، مع احتمال 0.954. وفقًا لجدول القيم الاحتمالية لدالة التوزيع العادية (انظر مقتطفًا منها الوارد في الملحق 1) ، نجد قيمة معامل الثقة t المقابل لاحتمال 0.954. مع احتمال 0.954 ، يكون المعامل t هو 2.

وبالتالي ، في 954 حالة من أصل 1000 ، لن يتجاوز متوسط العائد على الأصول 1.88 روبل. وما لا يقل عن 1.74 روبل.

أعلاه ، تم استخدام نظام اختيار عشوائي متكرر. دعونا نرى ما إذا كانت نتائج الاستطلاع قد تغيرت إذا افترضنا أن الاختيار قد تم وفقًا لنظام الاختيار غير المتكرر. في هذه الحالة ، يتم حساب متوسط الخطأ باستخدام الصيغة

بعد ذلك ، مع وجود احتمال يساوي 0.954 ، سيكون الخطأ الهامشي في أخذ العينات كما يلي:

حدود الثقة للقيمة المتوسطة للميزة في حالة الاختيار العشوائي غير المتكرر سيكون لها القيم التالية:

بمقارنة نتائج مخططي الاختيار ، يمكننا أن نستنتج أن استخدام العينات العشوائية غير المتكررة يعطي نتائج أكثر دقة مقارنة باستخدام الاختيار المتكرر بنفس مستوى الثقة. في الوقت نفسه ، كلما كان حجم العينة أكبر ، كلما كانت حدود القيم المتوسطة ضيقة بشكل أكبر عند الانتقال من مخطط اختيار إلى آخر.

وفقًا للمثال ، نحدد حدود حصة الشركات بعائد على الأصول لا يتجاوز قيمة 2.0 روبل في عموم السكان:

دعونا نحسب معدل العينة.

عدد الشركات في العينة التي لا يتجاوز عائدها على الأصول 2.0 روبل 60 وحدة. ثم

م = 60 ، ن = 90 ، ث = م / ن = 60: 90 = 0.667 ؛

احسب تباين الحصة في عينة السكان

متوسط خطأ أخذ العينات عند الاستخدام إعادة التخطيطسيكون الاختيار

إذا افترضنا أنه تم استخدام مخطط اختيار غير متكرر ، فسيكون متوسط خطأ أخذ العينات ، مع الأخذ في الاعتبار تصحيح محدودية السكان.

نحدد احتمالية الثقة ونحدد الخطأ الهامشي في أخذ العينات.

بقيمة احتمالية P = 0.997 ، وفقًا لجدول التوزيع العادي ، نحصل على قيمة معامل الثقة t = 3 (انظر مقتطفًا منه الوارد في الملحق 1):

وبالتالي ، مع احتمال 0.997 ، يمكن القول أنه في عموم السكان ، لا تقل حصة الشركات التي لا يتجاوز عائد الأصول فيها 2.0 روبل عن 54.7 ٪ ولا تزيد عن 78.7 ٪.

عينة نموذجية. مع عينة نموذجية تعداد السكانتنقسم الأشياء إلى مجموعات k ، إذن

N 1 + N 2 + ... + N i + ... + N k = N.

يعتمد حجم الوحدات المستخرجة من كل مجموعة نموذجية على طريقة الاختيار المعتمدة ؛ هم المجموعتشكل حجم العينة المطلوب

ن 1 + ن 2 + ... + ن أنا + ... + ن ك = ن.

توجد الطريقتان التاليتان لتنظيم الاختيار ضمن مجموعة نموذجية: بما يتناسب مع حجم المجموعات النموذجية ويتناسب مع درجة تذبذب قيم السمة في وحدات المراقبة في مجموعات. ضع في اعتبارك أولها ، الأكثر استخدامًا.

يفترض الاختيار المتناسب مع حجم المجموعات النموذجية أنه سيتم تحديد كل منها الرقم القادمالوحدات السكانية:

ن = ن أنا لا أنا / ن

حيث n i عدد الوحدات القابلة للاستخراج لعينة من المجموعة النموذجية i ؛

n هو الحجم الإجمالي للعينة ؛

N i - عدد الوحدات من عامة السكان التي تكون المجموعة النموذجية من الدرجة الأولى ؛

N هو العدد الإجمالي للوحدات في عموم السكان.

يحدث اختيار الوحدات داخل المجموعات في شكل أخذ عينات عشوائي أو ميكانيكي.

يتم عرض الصيغ لتقدير متوسط خطأ أخذ العينات للمتوسط والحصة في الجدول. 11.6.

هنا ، هو متوسط الفروق الجماعية للمجموعات النموذجية.

مثال 11.3. تم إجراء مسح عينة للطلاب في إحدى جامعات موسكو من أجل تحديد مؤشر متوسط الحضور لمكتبة الجامعة من قبل طالب واحد في الفصل الدراسي. لهذا الغرض ، تم استخدام عينة نموذجية غير متكررة بنسبة 5 ٪ ، وتتوافق مجموعاتها النموذجية مع رقم الدورة التدريبية. عند الاختيار ، بما يتناسب مع حجم المجموعات النموذجية ، تم الحصول على البيانات التالية:

الجدول 11.7.

رقم الدورة	مجموع الطلاب ، الأشخاص ، لا	تم فحصه نتيجة الملاحظة الانتقائية ، الناس ، n i	متوسط عدد زيارات المكتبة لكل طالب لكل فصل دراسي ، x i	تباين العينة داخل المجموعة ،
1	650	33	11	6
2	610	31	8	15
3	580	29	5	18
4	360	18	6	24
5	350	17	10	12
المجموع	2 550	128	8	-

يحسب عدد الطلاب المراد فحصهم في كل مقرر على النحو التالي:

مماثلة لمجموعات أخرى:

يعني توزيع قيم العينة دائمًا قانون توزيع عادي (أو يقترب منه) لـ n> 100 ، بغض النظر عن طبيعة توزيع عموم السكان. ومع ذلك ، في حالة العينات الصغيرة ، يتم تطبيق قانون توزيع مختلف - توزيع الطلاب. في هذه الحالة ، يتم العثور على معامل الثقة وفقًا لجدول توزيع t للطالب ، اعتمادًا على قيمة احتمال الثقة P وحجم العينة ن. يوفر الملحق 1 جزءًا من جدول توزيع t للطالب ، مقدمًا على أنه تبعية من احتمالية الثقة في حجم العينة ومعامل الثقة t.

مثال 11.4. لنفترض أن مسحًا عينة لثمانية طلاب من الأكاديمية أظهر ذلك قيد الإعداد مراقبة العملوفقًا للإحصاءات ، أمضوا الساعات التالية: 8.5 ؛ 8.0 ؛ 7.8 ؛ 9.0 ؛ 7.2 ؛ 6.2 ؛ 8.4 ؛ 6.6.

مثال 11.5. لنحسب كم العدد 507 المؤسسات الصناعيةيجب فحص مكتب الضرائب لتحديد حصة الشركات التي لديها انتهاكات ضريبية مع احتمال 0.997. وفقًا للمسح السابق المماثل ، كانت قيمة الانحراف المعياري 0.15 ؛ من المتوقع ألا يزيد حجم خطأ العينة عن 0.05.

عند استخدام التحديد العشوائي المتكرر ، تحقق

في الاختيار العشوائي غير المتكرر ، سيكون من الضروري التحقق

كما ترى ، يسمح لك استخدام أخذ العينات غير المتكرر بإجراء مسح كثيرًا أقلأشياء.

مثال 11.6. مسح مخطط أجورفي مؤسسات الصناعة بطريقة الاختيار العشوائي غير المتكرر. ما هو حجم العينة إذا كان عدد العاملين في الصناعة وقت إجراء المسح 100000 شخص؟ يجب ألا يتجاوز الخطأ الهامشي في أخذ العينات 100 روبل. باحتمال 0.954. من المسوحات السابقة للأجور في الصناعة ، من المعروف أن المتوسط الانحراف المعياريهو 500 روبل.

لذلك ، لحل المشكلة ، من الضروري تضمين 100 شخص على الأقل في العينة.

يسمى التناقض بين قيم المؤشرات التي تم الحصول عليها من العينة والمعلمات المقابلة لعامة السكان خطأ في التمثيل. يميز بين المنهجية و أخطاء عشوائيةعينات.

البق عشوائي لم يشرح بما فيه الكفاية تمثيل موحدفي مجموعة عينة من فئات مختلفة من وحدات عامة السكان.

أخطاء منهجية قد يترافق مع انتهاك لقواعد الاختيار أو شروط تنفيذ العينة.

وبالتالي ، عند مسح ميزانيات الأسرة ، تم بناء إطار أخذ العينات لأكثر من 40 عامًا على أساس مبدأ الاختيار القطاعي الإقليمي ، والذي كان بسبب الهدف الرئيسي لمسح الميزانية - لتوصيف مستوى معيشة العمال والموظفين والمزارعون الجماعيون. تم توزيع العينة على مناطق وقطاعات الاقتصاد في روسيا الاتحادية الاشتراكية السوفياتية بنسبة القوة الكليةموظف؛ لإنشاء عينة صناعية ، تم استخدام عينة نموذجية مع اختيار ميكانيكي للوحدات داخل المجموعات.

كان معيار الاختيار الرئيسي هو متوسط الراتب الشهري. كفل مبدأ الاختيار التمثيل النسبي في مجموعة عينة من العمال بمستويات مختلفة من الأجور.

مع ظهور الجديد مجموعات اجتماعية(رواد أعمال ، مزارعون ، عاطلون عن العمل) ، تم انتهاك تمثيل العينة ليس فقط بسبب الاختلافات مع بنية عامة السكان ، ولكن أيضًا بسبب خطأ منهجي نشأ بسبب عدم التوافق بين وحدة أخذ العينات (الموظف) و وحدة المراقبة (منزلية). كان من المرجح أيضًا أن يتم اختيار الأسرة التي تضم أكثر من فرد عامل واحد من الأسرة التي بها عامل واحد. تندرج العائلات غير العاملة في القطاعات التي شملها المسح خارج نطاق الوحدات المختارة (أسر المتقاعدين ، والأسر التي تعمل لحسابها الخاص ، وما إلى ذلك). كان من الصعب تقييم دقة النتائج التي تم الحصول عليها (حدود فترات الثقة ، أخطاء أخذ العينات) ، حيث لم يتم استخدام النماذج الاحتمالية في بناء العينة.

في 1996-1997 تم تقديمه بشكل أساسي نهج جديدلأخذ عينات من الأسر. استُخدمت بيانات التعداد السكاني الصغير لعام 1994 كأساس لتنفيذه ، وتكوّن عموم السكان في الاختيار من جميع أنواع الأسر ، باستثناء الأسر الجماعية. وبدأ تنظيم مجموعة العينات مع الأخذ في الاعتبار تمثيل تكوين وأنواع الأسر داخل كل موضوع من موضوعات الاتحاد الروسي.

يعتمد قياس الأخطاء في تمثيل مؤشرات العينة على افتراض الطبيعة العشوائية لتوزيعها بشكل لا نهائي. أعداد كبيرةعينات.

يتم استخدام قياس موثوقية مؤشر العينة للحصول على فكرة عن الخاصية العامة. يتم تنفيذ ذلك إما على أساس مؤشر العينة ، مع الأخذ في الاعتبار خطأه العشوائي ، أو على أساس فرضية معينة (حول القيمة تباين متوسطوطبيعة التوزيع والاتصال) فيما يتعلق بخصائص عامة السكان.

لاختبار الفرضية ، يتم تقييم مدى اتساق البيانات التجريبية مع البيانات الافتراضية.

يعتمد حجم خطأ التمثيل العشوائي على:

1) على حجم العينة ؛
2) درجة اختلاف الصفة المدروسة في عموم السكان ؛
3) الطريقة المقبولة لتكوين عينة من المجتمع.

توجد أخطاء متوسطة (قياسية) وهامشية في أخذ العينات.

متوسط الخطأ يميز قياس انحرافات مؤشرات العينة عن المؤشرات المماثلة لعامة السكان.

خطأ هامشي من المعتاد مراعاة أقصى قدر ممكن من التناقض بين العينة والخصائص العامة ، أي أقصى خطأ لاحتمال معين لحدوثه.

وفقًا لعينة السكان ، من الممكن تقييم المؤشرات (المعلمات) المختلفة لعامة السكان. الدرجات الأكثر استخدامًا هي:

- جنرال لواء مقاس متوسطمن السمة قيد الدراسة (للحصول على قيمة متعددة السمة الكمية);
- حصة عامة (لعلامة بديلة).

المبدأ الأساسي لتطبيق طريقة أخذ العينات هو ضمان تكافؤ الفرص لجميع الوحدات من عامة السكان ليتم اختيارها في عينة السكان. مع هذا النهج ، يتم ملاحظة متطلبات الاختيار العشوائي والموضوعي ، وبالتالي ، يتم تحديد خطأ أخذ العينات بشكل أساسي من خلال حجمه ( ص ). مع زيادة في الأخير ، تنخفض قيمة متوسط الخطأ ، وتقترب خصائص عينة السكان من خصائص عامة السكان.

مع نفس عدد مجموعات أخذ العينات وغيرها شروط متساويةسيكون خطأ أخذ العينات أصغر في goy منهم ، والذي يتم اختياره من عامة السكان مع اختلاف أقل في الصفة المدروسة. الانخفاض في تباين سمة يعني انخفاض قيمة التباين (لسمة كمية أو سمة بديلة).

يتم تحديد اعتماد حجم خطأ أخذ العينات على طرق تكوين مجتمع العينة بواسطة الصيغ لمتوسط خطأ أخذ العينات (الجدول 5.2).

دعنا نكمل مؤشرات الجدول. 5.2 مع التفسيرات التالية.

تباين العينة أقل قليلاً من التباين العام. الإحصاء الرياضيأثبت أن

الجدول 5.2

صيغ لحساب متوسط خطأ العينة mri طرق مختلفةاختيار

نوع العينة
	يتكرر ل	لا تتكرر ل

في الحقيقة عشوائي (بسيط)
مسلسل (بالتساوي
نموذجي (بما يتناسب مع حجم المجموعات)

إذا كانت العينة كبيرة (أي ص كبير بما يكفي) ، ثم تقترب النسبة من الوحدة ويتزامن تباين العينة عمليًا مع التباين العام.

تعتبر العينة كبيرة دون قيد أو شرط عندما ن> 100 وصغيرة بشكل غير مشروط في ص < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

يمكن حسابها باستخدام الصيغ التالية:

أين هو المتوسط أنا السلسلة ال هو المتوسط العام للعينة بأكملها ؛

أين هي نسبة الوحدات من فئة معينة في أنا السلسلة ال - حصة وحدات هذه الفئة في العينة بأكملها ؛ ص- عدد الحلقات المختارة.

4. لتحديد متوسط الخطأ لعينة نموذجية في حالة اختيار الوحدات بما يتناسب مع حجم كل مجموعة ، ومتوسط الفروق داخل المجموعة(- لخاصية كمية ، لخاصية بديلة). وفقًا لقاعدة إضافة التباينات ، تكون قيمة متوسط الفروق داخل المجموعة أقل من القيمة التباين الكلي. قيمة متوسط خطأ محتملأخذ العينات النموذجي أقل من الخطأ في أخذ عينة عشوائية بسيطة ومناسبة.

غالبًا ما يتم استخدام الاختيار المجمع: يتم الجمع بين الاختيار الفردي للوحدات واختيار المجموعة ، ويتم الجمع بين الاختيار النموذجي والاختيار في سلسلة. مع أي طريقة اختيار ، مع وجود احتمال معين ، يمكن القول بأن انحراف متوسط العينة (أو المشاركة) عن المتوسط العام (أو المشاركة) لن يتجاوز قيمة معينة ، وهو ما يسمى خطأ هامشي عينات.

النسبة بين حد خطأ العينة () مضمونة ببعض الاحتمالات F (ر) ، ويكون لخطأ أخذ العينات المتوسط الشكل: أو ، أين ر - مُعامل ثقة مُحدد بناءً على مستوى الاحتمال F (ر).

قيم الوظيفة F (ر) و ر يتم تحديدها على أساس جداول رياضية مجمعة خصيصًا. فيما يلي بعض أكثرها شيوعًا:


ر

وبالتالي ، فإن الخطأ الهامشي في أخذ العينات يجيب على سؤال دقة أخذ العينات باحتمال معين ، وتعتمد قيمته على قيمة معامل الثقة ر. نعم ، في ر = احتمال واحد F (ر ) انحراف خصائص العينة عن الخصائص العامة بقيمة خطأ متوسط واحد هو 0.683. وبالتالي ، في المتوسط ، من بين كل 1000 عينة ، سيعطي 683 مؤشرات عامة (متوسط ، حصة) ، والتي ستختلف عن المؤشرات العامة بما لا يزيد عن متوسط خطأ واحد. في ر = 2 الاحتمال F (ر) يساوي 0.954 ، مما يعني أنه من بين كل 1000 عينة ، سيعطي 954 مؤشرات عامة ستختلف عن المؤشرات العامة بما لا يزيد عن ضعف متوسط خطأ العينة ، إلخ.

جنبا إلى جنب مع قيمه مطلقهيتم حساب الخطأ الهامشي في أخذ العينات و خطأ نسبي, والذي يعرف بأنه النسبة المئويةخطأ هامشي في أخذ العينات للخاصية المقابلة لمجتمع أخذ العينات:

من الناحية العملية ، من المعتاد تعيين قيمة ∆ ، كقاعدة عامة ، في حدود 10٪ من المستوى المتوسط المتوقع للسمة.

يسمح لك حساب متوسط وأخطاء أخذ العينات الهامشية بتحديد الحدود التي ستكون فيها خصائص عامة السكان:

تسمى الحدود التي يتم فيها احتواء قيمة غير معروفة للمؤشر قيد الدراسة في عموم السكان ، بدرجة معينة من الاحتمال فاصل الثقة، والاحتمال F (ر) – احتمال الثقة. كلما زادت قيمة ∆ ، زادت القيمة فاصل الثقةوبالتالي دقة تقدير أقل.

تأمل المثال التالي. لتحديد متوسط حجم الإيداع في أحد البنوك ، تم اختيار 200 حساب بالعملات الأجنبية للمودعين باستخدام طريقة أخذ العينات العشوائية المتكررة. نتيجة لذلك ، وجد أن متوسط الحجمإيداع - 60 ألف روبل ، كان التشتت 32. وفي الوقت نفسه ، تبين أن 40 حسابًا عند الطلب. من الضروري ، مع احتمال 0.954 ، تحديد الحدود التي يقع ضمنها متوسط مبلغ الإيداع في حسابات العملات الأجنبية في البنك وحصة الحسابات تحت الطلب.

احسب متوسط الخطأ لمتوسط العينة باستخدام صيغة إعادة الاختيار

سيكون الخطأ الهامشي للعينة مع احتمال 0.954

وبالتالي ، فإن متوسط الإيداع في الحسابات المصرفية بالعملات الأجنبية يكون في حدود ألف روبل:

مع احتمال 0.954 ، يمكن القول أن متوسط الإيداع في الحسابات المصرفية بالعملات الأجنبية يتراوح من 59200 إلى 60800 روبل.

دعونا نحدد حصة الودائع تحت الطلب في عينة السكان:

حصة العينة تعني الخطأ

سيكون الخطأ الهامشي للحصة مع احتمال 0.954

وبالتالي ، فإن حصة حسابات الطلب في عموم السكان هي في الداخل ث :

مع احتمال 0.954 ، يمكن القول أن حصة حسابات الطلب في العدد الإجمالي لحسابات العملات الأجنبية في البنك تتراوح من 14.4 إلى 25.6٪.

في دراسات الحالةمن المهم تحديد النسبة المثلى بين قياس موثوقية النتائج التي تم الحصول عليها وحجم خطأ أخذ العينات المقبول. في هذا الصدد ، عند تنظيم عينة الملاحظة ، يطرح السؤال المتعلق بتحديد حجم العينة اللازم للحصول على الدقة المطلوبة للنتائج مع احتمال معين. يتم حساب حجم العينة المطلوب على أساس الصيغ الخاصة بخطأ أخذ العينات الهامشي وفقًا لنوع وطريقة الاختيار (الجدول 5.3).

الجدول 5.3

معادلات لحساب حجم العينة بطريقة اختيار عشوائية مناسبة

دعنا نواصل المثال ، الذي يعرض نتائج مسح عينة للحسابات الشخصية للمودعين في البنوك.

مطلوب تحديد عدد الحسابات التي يجب فحصها بحيث لا يتجاوز الخطأ في تحديد متوسط مبلغ الإيداع 1.5 ألف روبل مع احتمال 0.977. دعونا نعبر من صيغة الخطأ الهامشي لأخذ العينات لإعادة اختيار مؤشر حجم العينة:

عند تحديد حجم العينة المطلوب باستخدام الصيغ أعلاه ، يصبح من الصعب العثور على قيم σ2 ونعم ، حيث لا يمكن الحصول على هذه القيم إلا بعد مسح العينة. في هذا الصدد ، بدلاً من القيم الفعلية لهذه المؤشرات ، يتم استبدال القيم التقريبية ، والتي يمكن تحديدها على أساس أي تجربة عينة من الملاحظاتأو من المسوحات التحليلية السابقة.

في الحالات التي يعرف فيها الإحصائي متوسط قيمة الخصائص التي تتم دراستها (على سبيل المثال ، من التعليمات والأفعال التشريعية وما إلى ذلك) أو الحدود التي تختلف فيها هذه الخاصية ، يمكن تطبيق الحساب التالي باستخدام الصيغ التقريبية:

ويجب استبدال المنتج w (1 - w) بالقيمة 0.25 (w = 0.5).

للحصول على المزيد النتيجة الدقيقة، خذ أقصى قيمة ممكنة لهذه المؤشرات. إذا كان توزيع سمة في عموم السكان يطيع القانون العادي، فإن نطاق التباين يساوي تقريبًا 6σ ( القيم المتطرفةمفصولة في كلا الاتجاهين عن المتوسط على مسافة 3 درجات). ومن ثم ، ولكن إذا كان التوزيع غير متماثل بشكل واضح ، إذن.

مع أي نوع من العينات ، يبدأ حجمها في حسابه وفقًا لصيغة إعادة أخذ العينات

إذا ، نتيجة الحساب ، إذا كانت حصة التحديد ( ن ) يتجاوز 5٪ ، ثم يتم الحساب وفقًا لمعادلة الاختيار غير المتكرر.

بالنسبة لعينة نموذجية ، من الضروري تقسيم الحجم الإجمالي لعينة السكان بين أنواع الوحدات المختارة. يعتمد حساب عدد الملاحظات من كل مجموعة على ما تم تسميته مسبقًا الأشكال التنظيميةعينة نموذجية.

في الاختيار النموذجي للوحدات بشكل غير متناسب مع عدد المجموعات ، يتم تقسيم العدد الإجمالي للوحدات المحددة على عدد المجموعات ، وتعطي القيمة الناتجة عدد التحديد من كل مجموعة نموذجية:

أين ك هو عدد المجموعات النموذجية المميزة.

عند اختيار الوحدات بما يتناسب مع عدد المجموعات النموذجية ، يتم تحديد عدد الملاحظات لكل مجموعة بواسطة الصيغة

من أين حجم العينة أنا المجموعة الرابعة - الصوت أنا المجموعة الرابعة.

عند الاختيار ، مع مراعاة تباين السمة ، يجب أن تكون النسبة المئوية للعينة من كل مجموعة متناسبة مع الانحراف المعياري في هذه المجموعة (). يتم حساب الرقم () وفقًا للصيغ

في التحديد التسلسلي ، يتم تحديد العدد المطلوب للسلسلة المحددة بنفس الطريقة كما في الاختيار العشوائي المناسب:

إعادة الانتخاب

اختيار غير مكرر

في هذه الحالة ، يمكن حساب الفروق وأخطاء أخذ العينات لمتوسط قيمة أو نسبة السمة.

عند استخدام الملاحظة الانتقائية ، تكون خصائص نتائجها ممكنة على أساس مقارنة حدود الخطأ التي تم الحصول عليها للمؤشرات الانتقائية مع قيمة الخطأ المسموح به.

في هذا الصدد ، تنشأ مشكلة تحديد احتمال ألا يتجاوز خطأ أخذ العينات الخطأ المسموح به. يتم تقليل حل هذه المشكلة إلى الحساب بناءً على صيغة الخطأ الهامشي لأخذ العينات للكمية ر.

استمرارًا في النظر في مثال على مسح عينة للحسابات الشخصية لعملاء البنوك ، سنجد الاحتمال الذي يمكن من خلاله القول بأن الخطأ في تحديد متوسط حجم الإيداع لن يتجاوز 785 روبل:

مستوى الثقة المقابل هو 0.95.

في الوقت الحاضر ، تشمل ممارسات أخذ العينات الملاحظات الإحصائيةتم تنفيذها:

- جثث Rosstat ؛
- الوزارات والإدارات الأخرى (على سبيل المثال ، مراقبة الشركات في نظام بنك روسيا).

يتم تقديم تعميم معروف للخبرة في تنظيم مسوحات عينة للمؤسسات الصغيرة والسكان والأسر في الأحكام المنهجية للإحصاءات. يعطون أكثر مفهوم واسععينة من الملاحظة المذكورة أعلاه (الجدول 5.4).

في الممارسة الإحصائية ، يتم استخدام جميع أنواع العينات الأربعة ، المعروضة في الجدول. 5.4. ومع ذلك ، عادةً ما يتم إعطاء الأفضلية للعينات الاحتمالية (العشوائية) الموصوفة أعلاه ، والتي تعد الأكثر موضوعية ، حيث يمكن استخدامها لتقييم دقة النتائج التي تم الحصول عليها من بيانات العينة نفسها.

الجدول 5.4

أنواع العينات

في العينات نوع شبه عشوائي يُفترض الاختيار الاحتمالي على أساس أن الخبير الذي يعتبر العينة يعتبرها مقبولة. مثال على استخدام أخذ العينات شبه العشوائي في الممارسة الإحصائية هو "مسح أخذ العينات للمؤسسات الصغيرة للدراسة العمليات الاجتماعيةفي الأعمال التجارية الصغيرة "، الذي أجري في عام 1996 في بعض مناطق روسيا. تم اختيار وحدات المراقبة (الشركات الصغيرة) بخبرة ، مع مراعاة تمثيل القطاعات الاقتصادية من العينة التي تم تشكيلها بالفعل من مسح الأنشطة المالية والاقتصادية للصغار المؤسسات (نموذج "معلومات عن المؤشرات الرئيسية للنشاط المالي والاقتصادي للمنشآت الصغيرة"). عند تلخيص بيانات العينة ، افترض أن العينة تشكلت بطريقة الاختيار العشوائي البسيط.

مباشرة استخدام حكم الخبراء هو الأكثر الطريقة العامةالإدراج المتعمد للوحدات في العينة. مثال على طريقة الاختيار هذه طريقة مونوغرافية، والتي تنطوي على الحصول على معلومات من وحدة مراقبة واحدة فقط ، وهو أمر نموذجي ، وفقًا لمنظم المسح - خبير.

عينات على أساس اختيار الاتجاه ، يتم تنفيذها باستخدام إجراء موضوعي ، ولكن دون استخدام آلية احتمالية. طريقة المصفوفة الرئيسية معروفة على نطاق واسع ، حيث تشتمل العينة على أكبر وحدات المراقبة (الأساسية) التي توفر المساهمة الرئيسية في المؤشر ، على سبيل المثال القيمة الإجماليةميزة تمثل الغرض الرئيسي من المسح.

في الممارسة الإحصائية ، غالبًا ما يتم استخدامه طريقة مشتركة للملاحظة الإحصائية. إن الجمع بين طرق المراقبة المستمرة والانتقائية له جانبان:

التناوب في الوقت
استخدامها المتزامن (تتم ملاحظة جزء من السكان على أساس مستمر ، وجزء - بشكل انتقائي).

التناوب أخذ العينات الدورية مع المسوحات أو التعدادات المستمرة النادرة نسبيًا أمر ضروري لتوضيح تركيبة السكان المدروسة. ثم يتم استخدام هذه المعلومات على أنها أساس إحصائيملاحظة انتقائية. ومن الأمثلة على ذلك تعدادات السكان ومسوحات العينة الأسرية فيما بينهما.

في هذه القضيةالمهام التالية مطلوبة:

- تحديد تكوين علامات المراقبة المستمرة ، التي تضمن تنظيم العينة ؛
- إثبات فترات التناوب ، أي عندما تصبح البيانات المستمرة غير ذات صلة وتكون هناك حاجة إلى تكاليف لتحديثها.

الاستخدام المتزامن في إطار مسح واحد من الملاحظات المستمرة والعينة يرجع إلى عدم تجانس السكان الذين تمت مواجهتهم في الممارسة الإحصائية. ينطبق هذا بشكل خاص على الدراسات الاستقصائية للنشاط الاقتصادي لمجموعة من المؤسسات ، والتي تتميز بتوزيعات منحرفة للخصائص قيد الدراسة ، عندما يكون لعدد معين من الوحدات خصائص تختلف اختلافًا كبيرًا عن معظم القيم. في هذه الحالة ، تتم ملاحظة هذه الوحدات على أساس مستمر ، ويتم ملاحظة الجزء الآخر من السكان بشكل انتقائي.

مع هذا التنظيم للملاحظات ، فإن المهام الرئيسية هي:

- تحديد نسبتهم المثلى ؛
- تطوير طرق تقييم دقة النتائج.

مثال نموذجي يوضح هذا الجانب من التطبيق طريقة مجتمعة، هو المبدأ العامإجراء دراسات استقصائية لسكان المؤسسات ، والتي بموجبها يتم إجراء استقصاءات لسكان المؤسسات الكبيرة والمتوسطة الحجم بشكل أساسي من خلال طريقة مستمرة ، والشركات الصغيرة بطريقة العينة.

يتم إجراء مزيد من التطوير لمنهجية أخذ العينات بالاقتران مع تنظيم المراقبة المستمرة ، ومن خلال تنظيم المسوحات الخاصة ، والتي تملي إجراءها بالحاجة إلى الحصول على معلومات إضافيةلحل مشاكل محددة. وبالتالي ، فإن تنظيم المسوح في مجال ظروف السكان ومستوياتهم المعيشية يتم توفيره في جانبين:

- مكونات إلزامية ؛
- وحدات إضافية داخل نظام متكاملالمؤشرات.

قد تكون المكونات الإلزامية عبارة عن مسوح سنوية للدخل والإنفاق والاستهلاك (على غرار مسوح ميزانية الأسرة) ، والتي تشمل أيضًا المؤشرات الأساسية للظروف المعيشية للسكان. في كل عام ، وفقًا لخطة خاصة ، يجب استكمال المكونات الإلزامية بمسوحات (وحدات) لمرة واحدة للظروف المعيشية للسكان ، والتي تهدف إلى دراسة متعمقةأي مختار موضوع اجتماعيمنهم الرقم الإجمالي(مثل الأصول المنزلية ، الصحة ، التغذية ، التعليم ، ظروف العمل ، الإسكان ، أوقات الفراغ ، الحراك الاجتماعي، والسلامة ، وما إلى ذلك) بتواتر مختلف ، تحددها الحاجة إلى المؤشرات وقدرات الموارد.

مفهوم وحساب خطأ أخذ العينات.

تتمثل مهمة الملاحظة الانتقائية في إعطاء أفكار صحيحة حول المؤشرات الموجزة لجميع السكان بناءً على جزء منهم خاضع للملاحظة. يسمى الانحراف المحتمل لحصة العينة ومتوسط العينة عن الحصة والمتوسط في عموم السكان خطأ المعاينه أو خطأ في التمثيل. كلما زادت قيمة هذا الخطأ ، زادت مؤشرات ملاحظة العينة عن تلك الخاصة بعامة السكان.

اختلف:

أخطاء أخذ العينات

أخطاء التسجيل.

أخطاء التسجيلتحدث عندما يتم إثبات حقيقة بشكل غير صحيح في عملية الملاحظة. إنها مميزة لكل من الملاحظة المستمرة والمراقبة الانتقائية ، لكنها أقل في الملاحظة الانتقائية.

طبيعة الخطأ هي:

متقلب - متعمد ، أي تم اختيار أفضل أو أسوأ وحدات من السكان. في هذه الحالة ، تفقد الملاحظات معناها ؛

عشوائي - المبدأ التنظيمي الرئيسي للمراقبة الانتقائية هو منع الاختيار المتعمد ، أي ضمان الالتزام الصارم بمبدأ الاختيار العشوائي.

قاعدة عامةاختيار عشوائيهو: يجب أن تتمتع الوحدات الفردية من عامة السكان بنفس الشروط والفرص بالضبط لتقع في عدد الوحدات المدرجة في العينة. هذا يميز استقلالية نتيجة العينة عن إرادة المراقب. إرادة المراقب تولد أخطاء مغرضة. خطأ أخذ العينات في الاختيار العشوائي هو شخصية عشوائية. يميز حجم انحرافات الخصائص العامة عن العينة.

نظرًا لحقيقة أن الخصائص في المجتمع المدروس تختلف ، قد لا يتطابق تكوين الوحدات في العينة مع تكوين وحدات المجتمع بأكمله. هذا يعني انه صولا تتطابق مع دبليوو . يتم تحديد التناقض المحتمل بين هذه الخصائص من خلال خطأ أخذ العينات ، والذي تحدده الصيغة:

أين - التباين العام.

أين تباين العينة.

هذا يوضح أين يختلف الاختلاف العام تباين العينةفي الوقت المناسب.

هناك اختيار متكرر وغير متكرر. جوهر إعادة الاختيار هو أن كل وحدة في العينة ، بعد الملاحظة ، تعود إلى عامة السكان ويمكن إعادة فحصها. عند إعادة التشكيل ، يتم حساب متوسط خطأ أخذ العينات:

بالنسبة لمؤشر حصة السمة البديلة ، يتم تحديد تباين العينة بواسطة الصيغة:

من الناحية العملية ، نادرًا ما يتم استخدام إعادة الاختيار. في لا إعادة الاختيار، حجم السكان نينخفض أثناء أخذ العينات ، فإن صيغة متوسط خطأ أخذ العينات للسمة الكمية هي:

، ومن بعد

إحدى القيم المحتملة التي يمكن أن تكون فيها حصة السمة المدروسة تساوي:

أين هو خطأ أخذ العينات للميزة البديلة.

مثال.

في عينة تفتيش 10٪ من منتجات دفعة المنتجات النهائية وفقًا للطريقة دون إعادة الاختيار تلقت البيانات التالية عن محتوى الرطوبة في العينات.

أوجد متوسط نسبة الرطوبة ، التباين ، الانحراف المعياري مع احتمال 0.954 الحدود الممكنة، والتي نتوقع فيها cf. ٪ رطوبة لجميع المنتجات النهائية ، مع احتمال 0.987 من الحدود الممكنة جاذبية معينةالمنتجات القياسية ، بشرط أن تشتمل الكمية غير القياسية على منتجات ذات محتوى رطوبة يصل إلى 13٪ وأكثر من 19٪.

فقط مع وجود احتمال معين ، يمكن القول بأن الحصة العامة لنصيب العينة والمتوسط العام لمتوسط العينة ينحرفان في رذات مرة.

في الإحصاء ، تسمى هذه الانحرافات أخطاء أخذ العينات الهامشية ويتم تمييزها.

يمكن زيادة احتمالية الأحكام أو إنقاصها في رذات مرة. مع احتمال 0.683 ، مع 0.954 ، مع 0.987 ، ثم يتم تحديد مؤشرات عامة السكان من خلال مؤشرات العينة.

كما نعلم بالفعل ، فإن التمثيل هو خاصية لعينة من السكان لتمثيل سمة من سمات عامة السكان. إذا لم يكن هناك تطابق ، فإنهم يتحدثون عن خطأ تمثيلي - مقياس انحراف الهيكل الإحصائي للعينة عن هيكل السكان العام المقابل. لنفترض أن متوسط دخل الأسرة الشهري للمتقاعدين في عموم السكان هو 2000 روبل ، وفي العينة - 6 آلاف روبل. هذا يعني أن عالم الاجتماع أجرى مقابلات مع الجزء الميسور من أصحاب المعاشات ، وتسلل خطأ تمثيلي إلى دراسته. بمعنى آخر ، الخطأ التمثيلي هو التناقض بين مجموعتين - المجموعة العامة ، التي يتم توجيه الاهتمام النظري لعالم الاجتماع إليها وفكرة الخصائص التي يريد الحصول عليها في النهاية ، والمجموعة الانتقائية ، والتي يتم توجيه الاهتمام العملي لعلم الاجتماع إليها ، والتي تعمل ككائن للفحص ووسيلة للحصول على معلومات حول عامة السكان.

جنبًا إلى جنب مع مصطلح "خطأ تمثيلي" في الأدبيات المحلية ، يمكنك أن تجد - "خطأ في أخذ العينات". في بعض الأحيان يتم استخدامها بالتبادل ، وأحيانًا يتم استخدام "خطأ أخذ العينات" بدلاً من "خطأ التمثيل" كمفهوم أكثر دقة من الناحية الكمية.

خطأ أخذ العينات هو انحراف متوسط خصائص مجتمع العينة عن متوسط خصائص المجتمع العام.

في الممارسة العملية ، يتم تحديد خطأ أخذ العينات من خلال مقارنة الخصائص المعروفة للسكان مع وسائل العينة. في علم الاجتماع ، غالبًا ما تستخدم الدراسات الاستقصائية للسكان البالغين البيانات من التعدادات السكانية والسجلات الإحصائية الحالية ونتائج المسوحات السابقة. عادة ما تستخدم الخصائص الاجتماعية والديموغرافية كمعلمات تحكم. المقارنة بين المتوسطات العامة وعينة السكان ، على أساس ذلك ، فإن تحديد خطأ أخذ العينات والحد منه يسمى التحكم التمثيلي. نظرًا لأنه يمكن إجراء مقارنة بين بيانات الفرد وبيانات الأشخاص الآخرين في نهاية الدراسة ، فإن طريقة التحكم هذه تسمى اللاحقة ، أي. نفذت بعد التجربة.

في استطلاعات رأي جالوب ، يتم التحكم في التمثيل من خلال البيانات المتوفرة في التعدادات الوطنية حول توزيع السكان حسب الجنس والعمر والتعليم والدخل والمهنة والعرق ومكان الإقامة والحجم مكان. مركز أبحاث عموم روسيا الرأي العام(VTsIOM) يستخدم لأغراض مثل الجنس والعمر والتعليم ونوع التسوية ، الحالة الزوجية، مجال التوظيف ، الوضع الرسمي للمدعى عليه ، والتي يتم استعارتها من لجنة الدولة للإحصاءات في الاتحاد الروسي. في كلتا الحالتين ، السكان معروفون. لا يمكن تحديد خطأ أخذ العينات إذا كانت قيم المتغير في العينة والسكان غير معروفة.

أثناء تحليل البيانات ، يضمن متخصصو VTsIOM إصلاحًا شاملاً للعينة من أجل تقليل الانحرافات التي حدثت أثناء العمل الميداني. لوحظت تحولات قوية بشكل خاص من حيث الجنس والعمر. ويفسر ذلك حقيقة أن النساء والناس مع تعليم عالىقضاء المزيد من الوقت في المنزل والتواصل مع المحاور بسهولة أكبر ؛ مجموعة يسهل الوصول إليها مقارنة بالرجال والأشخاص "غير المتعلمين" 35.

يرجع خطأ أخذ العينات إلى عاملين: طريقة أخذ العينات وحجم العينة.

تنقسم أخطاء أخذ العينات إلى نوعين - عشوائي ومنهجي. الخطأ العشوائي هو احتمال تجاوز متوسط العينة (أو عدم تجاوزه) الفاصل الزمني المحدد. تتضمن الأخطاء العشوائية أخطاء إحصائية متأصلة في طريقة أخذ العينات نفسها. تتناقص مع زيادة حجم العينة.

النوع الثاني من أخطاء أخذ العينات هو الخطأ المنهجي. إذا قرر عالم اجتماع معرفة رأي جميع سكان المدينة حول المستمر السلطات المحليةالسلطات في السياسة الاجتماعية ، وأجروا مقابلات مع من لديهم هاتف فقط ، فهناك تحيز متعمد في العينة لصالح الطبقات الثرية ، أي. خطأ منهجي.

وبالتالي ، فإن الأخطاء المنهجية هي نتيجة نشاط الباحث نفسه. إنها الأكثر خطورة ، لأنها تؤدي إلى تحيزات كبيرة في نتائج الدراسة. تعتبر الأخطاء المنهجية أسوأ من الأخطاء العشوائية أيضًا لأنه لا يمكن التحكم فيها وقياسها.

تنشأ عندما ، على سبيل المثال: 1) العينة لا تفي بأهداف الدراسة (قرر عالم الاجتماع دراسة المتقاعدين العاملين فقط ، لكنه أجرى مقابلات مع الجميع على التوالي) ؛ 2) هناك جهل بطبيعة عامة السكان (اعتقد عالم الاجتماع أن 70٪ من جميع المتقاعدين لا يعملون ، لكن اتضح أن 10٪ فقط لا يعملون) ؛ 3) يتم اختيار العناصر "الفائزة" فقط من عامة السكان (على سبيل المثال ، المتقاعدون الأثرياء فقط).

انتباه! على عكس الأخطاء العشوائية ، لا تقل الأخطاء المنهجية مع زيادة حجم العينة.

تلخيصًا لجميع الحالات التي تحدث فيها أخطاء منهجية ، قام أخصائيو المنهجية بتجميع سجل لها. وهم يعتقدون أن مصدر التحيزات غير المنضبطة في توزيع عينة الملاحظات قد يكون العوامل التالية:
♦ قواعد منهجية ومنهجية لإجراء البحث الاجتماعي;
تم اختيار طرق غير مناسبة لأخذ العينات وجمع البيانات وطرق الحساب ؛
كان هناك استبدال لوحدات المراقبة المطلوبة بوحدات أخرى يسهل الوصول إليها ؛
لوحظ عدم اكتمال تغطية مجتمع المعاينة (نقص الاستبيانات وعدم اكتمال ملء الاستبيانات وعدم إمكانية الوصول إلى وحدات المراقبة).

نادرا ما يرتكب علماء الاجتماع أخطاء متعمدة. في كثير من الأحيان ، تظهر الأخطاء لأن عالم الاجتماع ليس على دراية جيدة ببنية عامة السكان: توزيع الناس حسب العمر ، والمهنة ، والدخل ، وما إلى ذلك.

من الأسهل منع الأخطاء المنهجية (مقارنة بالأخطاء العشوائية) ، لكن من الصعب جدًا القضاء عليها. من الأفضل منع الأخطاء المنهجية من خلال توقع مصادرها بدقة مسبقًا - في بداية الدراسة.

فيما يلي بعض الطرق لتجنب أخطاء أخذ العينات:
♦ يجب أن يكون لكل وحدة من عموم السكان احتمالية متساوية لتضمينها في العينة ؛
♦ من المرغوب فيه الاختيار من بين مجموعات سكانية متجانسة ؛
♦ تحتاج إلى معرفة خصائص عامة السكان ؛
يجب مراعاة الأخطاء العشوائية والمنهجية عند تجميع العينة.

إذا تم أخذ العينة (أو العينة فقط) بشكل صحيح ، فسيحصل عالم الاجتماع على نتائج موثوقة تميز جميع السكان. إذا تم تجميعها بشكل غير صحيح ، فإن الخطأ الذي حدث في مرحلة أخذ العينات يتضاعف في كل مرحلة لاحقة من البحث الاجتماعي ويصل في النهاية إلى قيمة تفوق قيمة الدراسة. يقال أن مثل هذا البحث يضر أكثر مما ينفع.

يمكن أن تحدث مثل هذه الأخطاء فقط مع عينة من السكان. لتجنب أو تقليل احتمال الخطأ ، فإن أسهل طريقة هي زيادة أحجام العينة (من الناحية المثالية حتى حجم السكان: عندما يتطابق كلا المجموعتين ، سيختفي خطأ العينة تمامًا). اقتصاديا ، هذه الطريقة مستحيلة. هناك طريقة أخرى - للتحسين الطرق الرياضيةأخذ العينات. يتم تطبيقها في الممارسة العملية. هذه هي القناة الأولى للتغلغل في علم اجتماع الرياضيات. القناة الثانية - المعالجة الرياضيةبيانات.

خاصة امر هامتصبح الأخطاء في أبحاث التسويق ، حيث لا يتم استخدام عينات كبيرة جدًا. عادة ما يشكلون عدة مئات ، أقل في كثير من الأحيان - ألف مستجيب. هنا ، نقطة البداية لحساب العينة هي مسألة تحديد حجم عينة السكان. يعتمد حجم العينة على عاملين: 1) تكلفة جمع المعلومات و 2) السعي للحصول على درجة معينة الصلاحية الإحصائيةالنتائج التي يأمل الباحث الحصول عليها. بالطبع ، حتى الأشخاص الذين ليس لديهم خبرة في الإحصاء وعلم الاجتماع يفهمون حدسيًا أنه كلما زاد حجم العينة ، أي وكلما اقتربت من حجم عموم السكان ككل ، زادت موثوقية وموثوقية البيانات التي تم الحصول عليها. ومع ذلك ، فقد تحدثنا بالفعل أعلاه عن الاستحالة العملية للمسوحات الكاملة في تلك الحالات عندما يتم إجراؤها على أشياء يتجاوز عددها عشرات ومئات الآلاف وحتى الملايين. من الواضح أن تكلفة جمع المعلومات (بما في ذلك الدفع مقابل تكرار الأدوات ، وعمل الاستبيانات ، والمديرين الميدانيين ومشغلي إدخال الكمبيوتر) تعتمد على المبلغ الذي يرغب العميل في تخصيصه ، ولا يعتمد كثيرًا على الباحثين. أما بالنسبة للعامل الثاني ، فسنتناوله بمزيد من التفصيل.

لذلك ، كلما كان حجم العينة أكبر ، كلما كان الخطأ المحتمل أصغر. على الرغم من أنه يجب ملاحظة أنه إذا كنت ترغب في مضاعفة الدقة ، فسيتعين عليك زيادة العينة ليس مرتين ، ولكن بمقدار أربع مرات. على سبيل المثال ، أن تفعل ضعف ذلك تقدير دقيقالبيانات التي تم الحصول عليها من خلال مقابلة 400 شخص ، لا تحتاج إلى مقابلة 800 شخص ، ولكن 1600 شخص. ومع ذلك ، فمن غير المحتمل أن تحتاج أبحاث التسويق إلى دقة بنسبة 100٪. إذا احتاج صانع الجعة إلى معرفة نسبة مستهلكي البيرة الذين يفضلون علامته التجارية ، وليس تنوع منافسه - 60٪ أو 40٪ ، فإن الفرق بين 57٪ أو 60 أو 63٪ لن يؤثر على خططه.

قد يعتمد خطأ أخذ العينات ليس فقط على حجمها ، ولكن أيضًا على درجة الاختلافات بين الوحدات الفردية داخل عموم السكان الذين ندرسهم. على سبيل المثال ، إذا أردنا معرفة كمية الجعة التي يتم استهلاكها ، فسنجد ذلك بين السكان لدينا ، معدلات الاستهلاك لـ مختلف الناستختلف اختلافا كبيرا (عامة السكان غير متجانسة). في حالة أخرى ، سوف ندرس استهلاك الخبز ونجد ذلك أناس مختلفونيختلف بشكل أقل بكثير (عدد سكان متجانس). كلما زاد الاختلاف (أو عدم التجانس) بين السكان ، زاد مقدار الخطأ المحتمل في أخذ العينات. هذا الانتظام يؤكد فقط ما هو بسيط الفطرة السليمة. وهكذا ، كما يقول V. Yadov بحق ، "يعتمد حجم (حجم) العينة على مستوى التجانس أو عدم تجانس الكائنات قيد الدراسة. كلما كانت أكثر تجانسا ، كلما قل العدد الذي يمكن أن يوفر استنتاجات موثوقة إحصائيا.

يعتمد تحديد حجم العينة أيضًا على مستوى فاصل الثقة للخطأ الإحصائي المسموح به. هنا نعني ما يسمى بالأخطاء العشوائية ، والتي ترتبط بطبيعة أي أخطاء إحصائية. في و. يعطي بانيوتو الحسابات التالية عينة تمثيليةبافتراض وجود خطأ بنسبة 5٪:
هذا يعني أنك إذا قابلت ، على سبيل المثال ، 400 شخص في منطقة المدينة ، حيث يبلغ عدد السكان البالغين من المذيبات 100 ألف شخص ، وجدت أن 33 ٪ من المشترين الذين شملهم الاستطلاع يفضلون منتجات مصنع معالجة اللحوم المحلي ، ثم مع 95 النسبة المئوية للاحتمالية ، يمكنك القول أن 33 + 5٪ (أي من 28 إلى 38٪) من سكان هذه المدينة هم من المشترين المنتظمين لهذه المنتجات.

يمكنك أيضًا استخدام حسابات Gallup لتقدير نسبة أحجام العينة وخطأ أخذ العينات.

متوسط ​​الخطأ التربيعي للعينة أكبر من. متوسط ​​عينة مربع تفسير الخطأ المعياري ل

متوسط الخطأ التربيعي للعينة أكبر من. متوسط عينة مربع تفسير الخطأ المعياري ل