السير الذاتية صفات التحليلات

كيف تحسب عينة الدراسة. السكان العام وطريقة أخذ العينات

الصيغة أدناه لحساب حجم العينةيتم استخدامه في الحالات التي يتم فيها طرح سؤال واحد فقط على المستجيبين (المستجيبين) ، حيث توجد إجابتان محتملتان فقط. على سبيل المثال ، "نعم" و "لا" ؛ "أنا أستخدم" و "أنا لا أستعمل". بالطبع، هذه الصيغةيمكن استخدامها فقط للبحث البسيط. إذا كنت بحاجة إلى تحديد حجم العينة لأكثر من بحث واسع النطاق، على سبيل المثال ، الاستبيانات ، ثم يجب استخدام الصيغ الأخرى.

معادلة بسيطة لحساب حجم العينة

أين: ن- حجم العينة؛

ضهو الانحراف المعياري الذي تم تحديده بناءً على مستوى الثقة المحدد. يميز هذا المؤشر إمكانية واحتمال الحصول على إجابات في فترة ثقة خاصة. في الممارسة العملية ، غالبًا ما يؤخذ مستوى الثقة على أنه 95٪ أو 99٪. ثم ستكون قيم z 1.96 و 2.58 على التوالي ؛

ص- تباين العينة في الحصص. في الأساس ، p هو احتمال أن يختار المستجيبون خيارًا واحدًا أو آخر للإجابة. لنفترض أنه إذا اعتقدنا أن ربع المستجيبين سيختارون الإجابة "نعم" ، فإن p ستكون 25٪ ، أي p = 0.25 ؛

ف= (1 - ع) ؛

ه- الخطأ الجائز في الكسور.

مثال على حساب حجم العينة

تخطط الشركة ل البحث الاجتماعيبهدف التعرف على نسبة المدخنين في عدد سكان المدينة. للقيام بذلك ، سيسأل موظفو الشركة سؤالاً واحداً للمارة: "هل تدخن؟" الخيارات الممكنةوبالتالي ، هناك إجابتان فقط: "نعم" و "لا".

يتم حساب حجم العينة في هذه الحالة على النحو التالي. يتم أخذ مستوى الثقة على أنه 95٪ ، ثم الانحراف الطبيعي ض = 1.96. نحن نقبل الاختلاف على أنه 50٪ ، أي أننا نعتقد بشكل مشروط أن نصف المستجيبين يمكنهم الإجابة على سؤال عما إذا كانوا يدخنون - "نعم". ثم ص = 0.5. من هنا نجد ف = 1 - ص = 1 - 0.5 = 0,5 . يتم أخذ خطأ أخذ العينات المقبول بنسبة 10 ٪ ، أي ه = 0.1.

نستبدل هذه البيانات في الصيغة ونحسب:

الحصول على حجم العينة ن = 96 شخصًا.

نطاق هذه الصيغة

عند إجراء بحث بسيطعندما تحتاج إلى الحصول على إجابة لسؤال واحد بسيط. في هذه الحالة ، يكون مقياس الردود ، كقاعدة عامة ، ذا طبيعة ثنائية التفرع. أي ، يتم تقديم إجابات (أو ضمنية) من النوع "نعم" - "لا" ، "أسود" - "أبيض" ، إلخ.

ميزات هذه الصيغة لحساب حجم العينة

جاليوتدينوف ر.


© يُسمح بنسخ المواد فقط في حالة تحديد ارتباط تشعبي مباشر بـ

يجب تحديد حجم العينة قبل البدء بمعظم الدراسات الكمية. تحديد حجم العينة غير مطلوب من أجل البحث النوعى(لاحظ أن هذا يشير إلى الأساليب الكمية رسميًا مثل تحليل المحتوى ؛ والمشاريع الوصفية البسيطة هي كمية.) قد لا يتم حساب حجم العينة قبل إجراء دراسات تجريبية أولية (ومع ذلك ، يتم إجراء مثل هذه الدراسات عادة قبل التخطيط الفعلي بحث علمي). إذا كنت في شك ، فتأكد من الاتصال بالمؤسسة التي تمول الدراسة أو تضمينها في خطة البحث الخاصة بهم - يعد نقص البيانات حول حجم العينة أحد أكثرها الأسباب الشائعةرفض الموافقة على الموضوع

لماذا حجم العينة مهم للباحث؟

عند إجراء الدراسات التي تحدد مدى انتشار خاصية ما في مجموعة سكانية ما (على سبيل المثال ، انتشار الربو عند الأطفال) ، فإن حسابات حجم العينة ضرورية لضمان أن التقديرات الناتجة لها الدرجة المطلوبة من الدقة. على سبيل المثال ، انتشار مرض بنسبة 10٪ تم الحصول عليه من حجم عينة 20 سيكون له فاصل ثقة 95٪ من 1٪ إلى 31٪ ، وهو ليس دقيقًا ولا مفيدًا. من ناحية أخرى ، فإن معدل انتشار المرض بنسبة 10٪ الذي تم الحصول عليه من عينة من 400 شخص سيكون له فاصل ثقة بنسبة 95٪ من 7٪ إلى 13٪ ، وهو ما يمكن اعتباره نتيجة دقيقة إلى حد ما. يؤدي تقدير أحجام العينة إلى تجنب أول هذين الخيارين.

في الدراسات المصممة لاكتشاف التأثير (على سبيل المثال ، الاختلاف في الفعالية بين علاجين ، والمخاطر النسبية للمرض مع أو بدون عامل خطر) ، فإن تقدير حجم العينة مهم لضمان أنه إذا كان سريريًا أو بيولوجيًا تأثير مهمموجود ، إذن بدرجة عاليةسيتم الكشف عن الاحتمالية ، بمعنى آخر ، سيعطي التحليل نتائج ذات دلالة إحصائية. إذا كان حجم العينة صغيرًا ، فحتى لو فروق ذات دلالة إحصائيةبين المجموعات ، سيكون من المستحيل إثبات أنها نتيجة لشيء آخر غير تباين العينة.

المعلومات اللازمة لحساب حجم العينة

طرق تقدير حجم العينة موصوفة في عدد من الكتب المدرسية حول الإحصاء ، بما في ذلك Altman، 1991؛ بلاند ، 2000 ؛ Armitage، Berry and Matthews، 2002. كتابان متخصصان في وصف طرق تقدير أحجام العينات في حالات مختلفة. بالنسبة للمعايير النوعية ، يجب استشارة عمل Manchin وآخرون. (1998) للجودة - Lemeshow et al. (1996). يوفر كلا الكتابين جداول للمساعدة في حساب أحجام العينات. في حالة التجارب المتسلسلة ، يجب الإشارة إلى Whitehead (1997) ، ويمكن إجراء حسابات حجم العينة الفعلية باستخدام أحد برامج الكمبيوتر العديدة. على سبيل المثال ، يسمح لك برنامج Stata بتحليل حجم العينة المطلوب لمقارنة الوسائل والنسب ، بالإضافة إلى تحليل الانتشار. كثير كمية كبيرةتقدم الخيارات حزمًا متخصصة مثل nQuery Advisor أو UnifyPow.

يعتمد حساب حجم العينة على العوامل التالية، والتي سوف تحتاج إلى إبلاغ خبير الإحصاء:

  • المتغيرات المدروسة في الدراسة بما في ذلك أنواعها
  • القوة البحثية المطلوبة
  • المستوى المطلوب دلالة إحصائية
  • حجم التأثير المناسب سريريا
  • الانحراف المعياري لمتغيرات المقياس
  • ما إذا كان سيتم استخدام اختبار أهمية أحادي الطرف أو ثنائي الطرف
  • تصميم الدراسة ، بمعنى آخر ، هو الدراسة:
    • تجربة معشاة ذات شواهد
    • مجموعة التجارب العشوائية
    • بحث التكافؤ
    • دراسة التدخل غير العشوائي
    • دراسة مبنية على المشاهدة
    • دراسة انتشار
    • دراسة حساسية وخصوصية الاختبار

سيتطلب هذا الرد على عدد من اسئلة اضافية:

  • هل تم تضمين البيانات المزدوجة في الدراسة؟
  • هل ستقيس الدراسة نفس المتغيرات بشكل متكرر في نفس الشخص؟
  • هل المجموعات المشمولة في الدراسة متساوية في الحجم؟
  • هل البيانات هرمية؟

يجب أن يؤخذ في الاعتبار أن الدراسات غير العشوائية للاختلافات أو العلاقات تتطلب عادة حجم عينة أكبر بكثير من أجل مراعاة تأثير المتغيرات الثالثة في التحليل. في الوقت نفسه ، يهتم الباحث بالحجم المطلق للعينة ، وليس النسبة المئوية التي تتكون منها من السكان ككل.

ما هي المصطلحات الإحصائية المستخدمة لوصف عملية تخطيط حجم العينة

الفرضيات الباطلة والبديلة

أنواع عديدة تحليل احصائيتهدف إلى مقارنة اثنين أنواع العلاجأو الإجراءات أو مجموعات المرضى. تسمى القيمة العددية التي تلخص الاختلافات التي تهم الباحث التأثير. في دراسات أخرى ، قد يكون التأثير هو معامل الارتباط ، أو نسبة الأرجحية ، أو المخاطر النسبية. ثم نطرح الفرضيات الفارغة والبديلة. عادةً ما تنص الفرضية الصفرية على عدم وجود تأثير (الاختلافات بين المجموعات صفرية ، خطر نسبي يساوي واحد، معامل الارتباط هو صفر) ، تشير الفرضية البديلة إلى وجود تأثير.

احتمالية الثقة (درجة P)

القيمة p هي احتمال ملاحظة نفس التأثير أو تأثير أكبر في دراسة ، بالنظر إلى صحة الفرضية الصفرية. عادة ما يتم التعبير عنها كنسبة (على سبيل المثال ، p = 0.03)

مستوى الأهمية

مستوى الأهمية هو القيمة الحدية للدرجة p التي يجب رفض الفرضية الصفرية التي تحتها ، وخلص إلى وجود دليل على وجود تأثير. عادةً ما يتم تعيين مستوى الأهمية بقيمة 5٪ (يتم التعبير عن مستوى الأهمية ، على الرغم من العلاقة المباشرة مع الدرجة p ، كنسبة مئوية: مستوى الأهمية 5٪ يعادل p = 0.05). إذا كانت القيمة المرصودة أقل من 5٪ ، فهناك احتمال ضئيل أن تكون الدراسة قد حصلت على مثل هذه النتائج إذا لم يكن هناك تأثير حقيقي. لذلك ، يتم قبول فرضية وجود التأثير.

يعني مستوى الأهمية البالغ 5٪ أيضًا أن هناك فرصة بنسبة 5٪ تقريبًا للوصول إلى استنتاج أن هناك تأثيرًا ، بينما في الواقع لا يوجد أي تأثير. في بعض الأحيان يكون من الأنسب استخدام مستوى أهمية بنسبة 1٪ ، خاصة إذا كان من المهم للغاية تجنب استنتاج أن التأثير موجود بينما في الحقيقة غير موجود.

قوة

القوة هي احتمال أن فرضية العدمسيتم رفضه بشكل كاف ، بمعنى آخر ، عندما يكون هناك بالفعل دليل على وجود اختلافات أو علاقات حقيقية. يمكن اعتباره "100 بالمائة ناقص فرصة فقدان التأثير الحقيقي". لذلك ، كلما زادت القوة ، قل احتمال فقدان التأثير الحقيقي. عادة ما تكون الطاقة ثابتة عند 80٪ أو 90٪ أو 95٪. يجب ألا تقل الطاقة عن 80٪. إذا كان من الأهمية بمكان ألا تفوت الدراسة أي تأثير موجود ، فيجب على المرء أن يهدف إلى الحصول على قوة بنسبة 90٪ أو أكثر.

حجم تأثير مهم سريريا

هذه هي أصغر الاختلافات بين متوسطات المجموعة أو النسب المئوية للأحداث داخلها (نسب الأرجحية الأقرب إلى خطر الوحدة) التي لا يزال من الممكن اعتبارها ذات أهمية بيولوجية أو سريرية. يجب أن يكون حجم العينة بحيث في حالة وجود مثل هذه الاختلافات ، فإن الدراسة ستنتج نتائج ذات دلالة إحصائية.

اختبار الأهمية أحادي الطرف أو ثنائي الطرف

في الاختبار ثنائي الطرف ، فإن الفرضية الصفرية هي أنه لا يوجد فرق ، والفرضية البديلة هي أن الاختلافات بين المجموعات يمكن أن تذهب في أي اتجاه. في الاختبار أحادي الطرف ، تحدد الفرضية البديلة الاتجاه المقصود للاختلاف ، مثل أن العلاج أفضل من العلاج الوهمي ، وتشمل الفرضية الصفرية المواقف التي يكون فيها تأثير الدواء والعلاج الوهمي متماثلًا وحيث تكون نتائج الدواء في نتيجة أسوأ من العلاج الوهمي.

ان لم أسباب جديةمن أجل عدم القيام بذلك ، يجب على المرء أن يستخدم فرضية ذات وجهين. إن توقع أن تسير الاختلافات في اتجاه أو آخر ليس سببًا كافيًا لاستخدام اختبار أحادي الطرف. غالبًا ما يتفاجأ الباحثون الطبيون إذا كانت النتيجة غير متوقعة ، وغالبًا ما يكون لمثل هذا الاكتشاف عواقب أخرى غير عدم وجود فرق ، وبالتالي يجب وصفها بشكل مناسب. الاختبار أحادي الجانب لا يسمح بذلك. للحصول على أمثلة عن المواقف التي قد يكون فيها الاختبار أحادي الطرف مقبولاً ، انظر Bland and Altman (1994).

ما هي المتغيرات التي يجب مراعاتها عند حساب حجم العينة

يجب أن يعتمد حساب حجم العينة على تحليل متغير النتيجة الرئيسي في هذه الدراسة.

إذا تم تضمين متغيرات إضافية في الدراسة ، والتي تعتبر أيضًا مهمة الأهمية العلمية، إذًا يجب أن يكون حجم العينة بالشكل الذي يسمح بتحليل كافٍ لهذه المتغيرات. لكل المهم علميايجب تنفيذ المتغيرات وحساب حجم العينة.

النسبة المئوية لمحاسبة فقدان الاستجابة والمراقبة

يشير حجم العينة المقدر إلى عدد المرضى في المجموعة النهائية التي تم تحليلها في نهاية الدراسة. لذلك ، يجب زيادة عدد الأفراد المراد تسجيلهم في الدراسة وفقًا للاستجابة المتوقعة ، وفقدان المتابعة ، وعدم اتباع البروتوكول ، والأسباب الأخرى المحتملة لفقدان الموضوعات التجريبية. يجب وصف العلاقة بين العدد المتوقع للمشاركين وحجم العينة المراد تشكيلها بوضوح.

الالتزام بأهداف الدراسة وطرق التحليل الإحصائي

يجب أيضًا تقييم مدى كفاية حجم العينة وفقًا للغرض من الدراسة. على سبيل المثال ، إذا كان الهدف من الدراسة هو إثبات أن عقارًا جديدًا أفضل من الدواء الحالي ، فمن الضروري التأكد من أن حجم العينة يسمح باكتشاف الاختلافات المهمة سريريًا بين العلاجين. ومع ذلك ، في بعض الأحيان يكون مطلوبًا إثبات أن عقارين متكافئين سريريًا. غالبًا ما يشار إلى هذا النوع من الدراسة باسم اختبار التكافؤ أو الاختبار "السلبي". تم تفصيل قضايا حجم العينة لهذه الدراسات في Pocock (1983). حجم العينة في الدراسات التي تهدف إلى إثبات تكافؤ الدواء أكبر مما هو عليه في الدراسات التي تهدف إلى تحديد الاختلافات في الفعالية. من الضروري التأكد من أن حسابات حجم العينة مرتبطة بأهداف الدراسة وأهدافها وتستند إلى بيانات حول متغير النتيجة الأولية.

يجب أن تكون أحجام العينات مناسبة أيضًا لطرق التحليل المستخدمة في الدراسة ، حيث يعتمد حجم العينة والتحليل على تصميم الدراسة المختار. من الضروري التأكد من أن طرق التحليل المقصودة وحسابات حجم العينة متوافقة مع بعضها البعض.

أمثلة على حساب حجم العينة.

إذا كانت الدراسة المقصودة تتطلب تقديرًا فرديًا للتردد ، أو مقارنة بين وسيلتين ، أو مقارنة بين تكررين ، فإن حسابات حجم العينة (عادةً) تكون بسيطة نسبيًا وبالتالي معروضة أدناه. ومع ذلك ، نوصيك دائمًا باستشارة خبير إحصائي حول حسابات حجم العينة.

تقدير تردد واحد

ملاحظة: تعتمد الصيغة أدناه على ما يسمى ب. "تقريبي التوزيع الطبيعي"وما لم يكن مخططًا لإنشاء عينة كبيرة جدًا ، لا يوصى بتقدير الترددات القريبة من 0 أو 1 (0: أو 100٪. في مثل هذه الحالات ، يجب استخدام طرق" دقيقة ". حالة مماثلةيمكن ملاحظتها عند دراسة حساسية ونوعية طريقة التشخيص الجديدة ، حيث يتوقع وجود ترددات قريبة من 1 (100٪). في هذه القضيةيجب استشارة إحصائي ، أو على الأقل يجب استخدام برامج كمبيوتر متخصصة.

السيناريو: استخدم استبيانًا عبر البريد لتقييم مدى انتشار مشاكل الجهاز التنفسي لدى مرضى الربو القصبي تحت إشراف طبي. ممارسة عامة(توماس وآخرون ، 2001)

معلومات مطلوبة:

  • متغير النتيجة الأولية = وجود أو عدم وجود فشل تنفسي
  • الوتيرة المقدرة للانتهاكات = 30٪ (0.3)
  • عرض فاصل الثقة المطلوب 95٪ = 10٪ (أي +/- 5٪ أو 25٪ إلى 35٪)

صيغة تقدير حجم العينة لتردد واحد هي:

ن = 15.4 * ف * (1-ع) / W2

حيث n هو حجم العينة المطلوب ، p هو التكرار المتوقع للنتيجة (في هذه الحالة 0.3) و W هو عرض فاصل الثقة (في هذه الحالة 0.1)

باستبدال القيم في الصيغة ، نحصل على:

العدد = 15.4 * 0.3 * (1-0.3) /0.1 2 = 324

"للحصول على فاصل ثقة +/- 5٪ حول تقدير انتشار يبلغ 30٪ ، ستكون هناك حاجة لعينة من 324 شخصًا. نظرًا لمعدل استجابة 70٪ لعرض المشاركة في الدراسة ، سيتم توزيع 480 استبيانًا"

مقارنة بين ترددين

السيناريو: تم التخطيط لتجربة عشوائية مضبوطة بالغفل لفعالية عامل تحفيز المستعمرة في إنقاص اختطار الإنتان عند الخدج. أظهرت دراسة سابقة أن نسبة حدوث الإنتان لدى هؤلاء الأطفال تصل إلى 50٪ في غضون أسبوعين بعد الولادة ، ويعتقد الباحثون أن خفض هذا التكرار إلى 34٪ سيكون ذا أهمية إكلينيكية.

معلومات مطلوبة:

  • متغير النتيجة الأولية = وجود أو عدم وجود تعفن الدم عند الولدان بعد 14 يومًا من الولادة (يتم إعطاء العلاج لمدة أقصاها 72 ساعة بعد الولادة). هذا متغير نوعي يمثله الترددات.
  • فرق كبير = 16٪ أو 0.16 (أي 50٪ -34٪)
  • مستوى الأهمية = 5٪
  • القوة = 80٪
  • اختبار = على الوجهين

صيغة حساب حجم العينة عند مقارنة ترددين هي:

n = 2 * [(p 1 * (1-p 1) + (p 2 * (1-p 2)))] / 2

حيث n = حجم العينة لكل مجموعة ( الحجم الكليضعف عدد العينات)

ع 1 = التردد الأول - في هذه الحالة 0.50

ص 2 = التردد الثاني - في هذه الحالة 0.34

p 1 -p 2 = فرق مهم سريريًا ، في هذه الحالة 0.16

جدول قيم A و B

مستوى الأهمية

قوة

باستبدال القيم في الصيغة ، نحصل على:

العدد = 2 * [(0.5 * 0.5 + (0.34 * 0.66)] / 2 = 146

وبالتالي ، نحصل على عدد الملاحظات المطلوب تضمينها في كل مجموعة. مجموع السكانستكون العينة أكبر بمرتين ، أي 292 طفلاً

قد يبدو وصف نتائج حساب حجم العينة على النحو التالي:

"عينة من 292 من حديثي الولادة (146 في مجموعتي العلاج والعلاج الوهمي) ستكون كافية لاكتشاف اختلاف في معدل الإنتان بنسبة 16٪ مع قوة 80٪ عند مستوى ثقة 5٪. الفرق 16٪ يساوي الفرق بين 50٪ تعفن الدم المعدل في اليوم 14 في مجموعة الدواء الوهمي و 34٪ في مجموعة العلاج ".

مقارنة بين متوسطين

ملاحظة: العمليات الحسابية أدناه صالحة فقط عندما تكون المجموعتان بالحجم نفسه.

السيناريو: تجربة معشاة ذات شواهد تقارن العلاج النفسي قصير الأمد مقابل العلاج التقليدي لمكافحة الميول الانتحارية في المرضى الذين يدخلون المستشفى بعد محاولة الانتحار مخطط لها. يتم قياس الميول الانتحارية باستخدام مقياس بيك. الانحراف المعياري للدرجات على هذا المقياس هو 7.7 (بيانات من الدراسات السابقة) ، وتعتبر الاختلافات البالغة 5 نقاط على مقياس بيك مهمة سريريًا. من المتوقع أن يترك ما يصل إلى ثلث المرضى مجموعة العلاج (Guthrie et al. ، 2001)

معلومات ضرورية:

  • متغير النتيجة الأولية = مقياس بيك الانتحاري. المتغير المستمر الموصوف بالوسائل
  • الانحراف المعياري = 7.7 نقطة
  • حجم التأثير المهم سريريًا = 5 نقاط
  • مستوى الأهمية = 5٪
  • القوة = 80٪
  • اختبار = على الوجهين

معادلة حساب حجم العينة عند المقارنة بين وسيلتين هي كما يلي:

ن = 2 * 2 * SD 2 / DIFF 2

حيث n = حجم العينة لكل مجموعة (حجم العينة الإجمالي ضعف حجم العينة)

SD = الانحراف المعياري لمتغير النتيجة الأولية ، في هذه الحالة 7.7

DIFF = تأثير مهم سريريًا ، في هذه الحالة 5.0

أ- يعتمد على مستوى الأهمية (انظر الجدول) - في هذه الحالة 1.96

ب - يعتمد على الطاقة (انظر الجدول) - في هذه الحالة 0.84

جدول قيم A و B

مستوى الأهمية

قوة

أستعاض القيم المطلوبةفي الصيغة نحصل على:

العدد = 2 * 2 * 7.7 2 /5.0 2 = 38

وبالتالي ، نحصل على عدد الملاحظات المطلوب تضمينها في كل مجموعة. سيكون حجم العينة الإجمالي ضعف حجم العينة ، أي 76 شخصا.

سيكون الوصف المناسب لتقدير حجم العينة كما يلي:

"لاكتشاف فرق قدره 5 نقاط على مقياس Beck للميل الانتحاري عند مستوى أهمية 5٪ مع قوة 80٪ ، بافتراض انحراف معياري قدره 7.7 نقطة ، سيتطلب 38 شخصًا في مجموعة التدخل والمراقبة. تمت زيادة هذا الرقم إلى 60 في المجموعة ( المجموعالملاحظات 120) ، من أجل التعويض عن الخسارة في الملاحظة ، والتي عادة ما تكون حوالي ثلث الأشخاص "

هناك حاجة إلى أمثلة على الأوصاف غير الكافية لأحجام العينات المقدرة

مثال 1

"الدراسة السابقة في هذا المجال استخدمت عينة من 150 شخصًا وحصلت على نتائج موثوقة للغاية (ع = 0.014) ، لذلك تم تضمين عدد مماثل من المرضى في هذه الدراسة"

قد تكون الدراسات السابقة ببساطة "محظوظة" بمعنى أن النتائج المهمة التي توصلوا إليها ترجع إلى اختلاف عشوائي في متوسط ​​العينة. يجب حساب حجم العينة هذه الدراسة- بما في ذلك تفاصيل مثل قوة الدراسة ، ومستوى الأهمية ، والمتغير الرئيسي المدروس ، وحجم التأثير المهم سريريًا ، والانحراف المعياري (للمتغيرات الكمية) وحجم كل مجموعة إذا كانت هناك مجموعات متعددة في الدراسة

مثال 2

"لم يتم حساب حجم العينة لعدم وجود معلومات أولية لتقديرها"

يجب مراجعة الأدبيات بعناية للعثور على المعلومات اللازمة لحساب حجم العينة. في حالة عدم توفر هذه المعلومات ، يمكن تنظيم دراسة أولية صغيرة لجمع هذه المعلومات.

إذا لم تكن هناك معلومات عن القيمة الانحراف المعياري، يمكن إعطاء حسابات حجم العينة في أكثر نظرة عامة، على سبيل المثال ، قد لا يتم وصف الاختلافات الفعالة سريريًا في القيم المطلقة، ولكن بوحدات الانحراف المعياري.

ومع ذلك ، إذا تمت كتابة مقترح منحة لتمويل دراسة تجريبية لجمع المعلومات اللازمة لحساب حجم عينة دراسة كبيرة لاحقة ، فلن يتم تنفيذ حساب حجم العينة في مثل هذا الاقتراح.

"تستقبل العيادة 50 مريضا بهذا المرض خلال العام. وقد يرفض حوالي 10٪ منهم المشاركة في الدراسة. لذلك ، في غضون عامين سيكون من الممكن تجنيد عينة من 90 شخصا"

على الرغم من أن معظم الدراسات يجب أن توازن بين تصميمها والقوة ، لا ينبغي تحديد حجم العينة فقط على أساس عدد المرضى المتاحين للدراسة.

في الحالات التي يكون فيها عدد المرضى عاملاً مقيدًا في حجم العينة ، يجب الاستمرار في إجراء الحسابات لتحديد أ) قوة الدراسة مع عدد معين من المرضى بالنسبة للاختلافات المهمة سريريًا ، أو ب) حجم التأثير التي يمكن العثور عليها في دراسة بحجم معين (مع الأخذ في الاعتبار قوتها).

في الحالات التي يكون فيها عدد المرضى المتاح صغيرًا جدًا بحيث لا يمكن الكشف عن الاختلافات ذات الصلة سريريًا ، يمكن النظر في تمديد مدة الدراسة أو إجراء تجربة تعاونية متعددة المراكز مع محققين متعددين.

المؤلفات

  1. ألتمان د. (1991) الإحصاء العملي للبحوث الطبية. تشابمان آند هول ، لندن.
  2. أرميتاج ف ، بيري جي ، ماثيوز جي إن إس. (2002) الأساليب الإحصائية في البحث الطبي ، الطبعة الرابعة. بلاكويل ، أكسفورد.
  3. بلاند جي إم وألتمان دي جي. (1994). اختبارات من جانب واحد أو من جانبين ذات أهمية. المجلة الطبية البريطانية 309248.
  4. بلاند إم (2000) مقدمة للإحصاءات الطبية ، 3. إد. مطبعة جامعة أكسفورد ، أكسفورد.
  5. Elashoff دينار. (2000) دليل مستخدم nQuery Advisor الإصدار 4.0 ، لوس أنجلوس ، كاليفورنيا.
  6. Guthrie E و Kapur N و Mackway-Jones K و Chew-Graham C و Moorey J و Mendel E و Marino-Francis F و Sanderson S و Turpin C و Boddy G و Tomenson B. (2001) تجربة عشوائية محكومة للتدخل النفسي القصير بعد التسمم الذاتي المتعمد. المجلة الطبية البريطانية 323 ، 135-138.
  7. Lemeshow S و Hosmer DW و Klar J و Lwanga SK. (1996) كفاية حجم العينة في الدراسات الصحية. جون وايلي وأولاده ، تشيتشستر.
  8. Machin D، Campbell MJ، Fayers P، Pinol، A. (1998) جداول إحصائية لتصميم الدراسات السريرية ، الإصدار الثاني من بلاكويل ، أكسفورد.
  9. بوكوك SJ. (1983) التجارب السريرية: نهج عملي. جون وايلي وأولاده ، تشيتشستر.
  10. Thomas M ، McKinley RK ، Freeman E ، Foy C. (2001) انتشار اختلال التنفس في المرضى الذين عولجوا من الربو في الرعاية الأولية: مسح مقطعي. المجلة الطبية البريطانية 322 ، 1098-1100.
  11. وايتهيد ، ج. (1997) تصميم وتحليل التجارب السريرية المتتابعة ، المنقح الثاني. إد. شيشستر ، وايلي.
الآلات الحاسبة

سكان

العدد الإجمالي لأشياء المراقبة (الأشخاص ، والأسر ، والمؤسسات ، المستوطناتإلخ) ، والتي لها مجموعة معينة من الخصائص (الجنس ، والعمر ، والدخل ، والعدد ، والدوران ، وما إلى ذلك) ، ومحدودة في المكان والزمان. أمثلة على السكان: - جميع سكان موسكو (10.6 مليون نسمة وفقًا لتعداد عام 2002) - سكان موسكو الذكور (4.9 مليون نسمة وفقًا لتعداد عام 2002) - الكيانات القانونيةروسيا (2.2 مليون في بداية 2005) - منافذ البيع بالتجزئة التي تبيع المنتجات الغذائية (20 ألف في بداية 2008) ، إلخ.

عينة (عينة من السكان)

تم اختيار جزء من الكائنات من السكان للدراسة من أجل استخلاص استنتاج حول السكان بالكامل. من أجل توسيع الاستنتاج الذي تم الحصول عليه من خلال دراسة العينة ليشمل جميع السكان ، يجب أن يكون للعينة خاصية كونها تمثيلية.

عينة تمثيلية

خاصية العينة لتعكس بشكل صحيح عامة السكان. قد تكون نفس العينة ممثلة أو لا تمثل مجموعات سكانية مختلفة. مثال: - عينة تتكون بالكامل من سكان موسكو الذين يمتلكون سيارة لا تمثل جميع سكان موسكو. - عينة من الشركات الروسية تصل إلى 100 شخص لا تمثل جميع الشركات في روسيا. - لا تمثل عينة من سكان موسكو الذين يجرون عمليات شراء في السوق السلوك الشرائي لجميع سكان موسكو. وفي نفس الوقت ، فإن هذه العينات (تخضع لمعايير أخرى) الظروف) يمكن أن تمثل سكان موسكو تمامًا - أصحاب السيارات والشركات الروسية الصغيرة والمتوسطة والمشترين الذين يتسوقون في الأسواق ، على التوالي. ومن المهم أن نفهم أن تمثيل العينة وخطأ أخذ العينات هما ظاهرتان مختلفتان. التمثيلية ، على عكس الخطأ ، لا تعتمد على حجم العينة بأي شكل من الأشكال.مثال: بغض النظر عن مدى زيادة عدد أصحاب السيارات في موسكو الذين تمت مقابلتهم ، فلن نتمكن من تمثيل جميع سكان موسكو بهذه العينة.

خطأ في أخذ العينات (فاصل الثقة)

رفض النتائج التي تم الحصول عليها باستخدام ملاحظة انتقائيةمن البيانات الحقيقية لعامة السكان هناك نوعان من أخطاء أخذ العينات - إحصائية ومنهجية. يعتمد الخطأ الإحصائي على حجم العينة. كلما كان حجم العينة أكبر ، كلما انخفض .. مثال: من أجل بسيط عينة عشوائيةبحجم 400 وحدة ، الحد الأقصى للخطأ الإحصائي (مع احتمال ثقة 95٪) هو 5٪ ، لعينة من 600 وحدة - 4٪ ، لعينة من 1100 وحدة - 3٪ من عوامل مختلفةالتي لها تأثير دائم على الدراسة وتحيز نتائج الدراسة في اتجاه معين. الصورة النشطةالحياة. يحدث هذا بسبب حقيقة أنه من الصعب العثور على هؤلاء الأشخاص في أي مكان معين (على سبيل المثال ، في المنزل). 80٪) في بعض الحالات ، عندما تكون التوزيعات الحقيقية معروفة ، خطأ منهجييمكن موازاة ذلك من خلال إدخال نظام الحصص أو إعادة ترجيح البيانات ، ولكن في معظم الدراسات الحقيقية ، حتى تقييمها يمكن أن يكون مشكلة كبيرة.

أنواع العينات

العينات مقسمة إلى نوعين:
- احتمالية
- اللااحتمالية

1. عينات الاحتمالية
1.1 أخذ العينات العشوائية (اختيار عشوائي بسيط)
تفترض هذه العينة تجانس عموم السكان ، ونفس احتمال توفر جميع العناصر ، ووجود قائمة كاملةكل العناصر. عند اختيار العناصر ، كقاعدة عامة ، يتم استخدام جدول أرقام عشوائية.
1.2 أخذ العينات الميكانيكية (المنهجية)
نوع من العينة العشوائية ، مرتبة حسب بعض السمات (الترتيب الأبجدي ، رقم الهاتف ، تاريخ الميلاد ، إلخ). يتم تحديد العنصر الأول بشكل عشوائي ، ثم يتم تحديد كل عنصر "k" بزيادات من "n". حجم السكان عامة ، بينما - N = n * k
1.3 طبقية (مقسمة إلى مناطق)
يتم استخدامه في حالة عدم التجانس بين عامة السكان. سكانمقسمة إلى مجموعات (طبقات). في كل طبقة ، يتم الاختيار بشكل عشوائي أو ميكانيكي.
1.4 أخذ العينات التسلسلية (المتداخلة أو العنقودية)
في أخذ العينات التسلسليوحدات الاختيار ليست الكائنات نفسها ، ولكنها مجموعات (عناقيد أو أعشاش). يتم اختيار المجموعات بشكل عشوائي. يتم مسح الكائنات داخل المجموعات في كل مكان.

2. عينات لا تصدق
لا يتم الاختيار في مثل هذه العينة وفقًا لمبادئ الصدفة ، ولكن وفقًا لمعايير ذاتية - إمكانية الوصول ، والنموذجية ، والتمثيل المتساوي ، إلخ.
2.1. أخذ العينات الحصص
في البداية ، يتم تخصيص عدد معين من مجموعات الأشياء (على سبيل المثال ، الرجال الذين تتراوح أعمارهم بين 20-30 سنة ، 31-45 سنة و 46-60 سنة ؛ الأشخاص الذين يصل دخلهم إلى 30 ألف روبل ، مع دخل من 30 إلى 60 ألف روبل وبدخل يزيد عن 60 ألف روبل) لكل مجموعة ، يتم تحديد عدد الأشياء المراد مسحها. يتم تحديد عدد العناصر التي يجب أن تقع في كل مجموعة ، في أغلب الأحيان ، إما بما يتناسب مع الحصة المعروفة سابقًا للمجموعة في عموم السكان ، أو نفس الشيء لكل مجموعة. ضمن المجموعات ، يتم اختيار الكائنات بشكل عشوائي. تستخدم عينات الحصص في كثير من الأحيان في أبحاث التسويق.
2.2. طريقة كرة الثلج
العينة مبنية على النحو التالي. يُطلب من كل مستجيب ، بدءًا من الأول ، الاتصال بأصدقائه وزملائه ومعارفه الذين يتناسبون مع شروط الاختيار ويمكنهم المشاركة في الدراسة. وهكذا ، باستثناء الخطوة الأولى ، يتم تشكيل العينة بمشاركة كائنات الدراسة نفسها. غالبًا ما تُستخدم الطريقة عندما يكون من الضروري العثور على مجموعات من المستجيبين يصعب الوصول إليهم وإجراء مقابلات معهم (على سبيل المثال ، المستجيبون ذوو الدخل المرتفع ، والمستجيبون الذين ينتمون إلى نفس المجموعة المهنية ، والمستجيبين الذين لديهم بعض الهوايات / المشاعر المماثلة ، إلخ. )
2.3 أخذ العينات العفوي
يتم استطلاع آراء المستجيبين الأكثر سهولة. أمثلة نموذجيةعينات عفوية - استطلاعات في الصحف / المجلات ، استبيانات تُعطى للمستجيبين للإكمال الذاتي ، معظم استطلاعات الإنترنت. لا يُعرف حجم العينات العفوية وتكوينها مسبقًا ، ويتم تحديدها بمعلمة واحدة فقط - نشاط المستجيبين.
2.4 عينة من الحالات النموذجية
يتم تحديد وحدات عامة السكان ذات القيمة المتوسطة (النموذجية) للسمة. هذا يثير مشكلة اختيار الميزة وتحديد قيمتها النموذجية.

الخطأ وحساب حجم العينة

(لعينة عشوائية بسيطة)

شروحات للحقول:

احتمال الثقة
احتمالية أن تغطي فترة الثقة المجهول قيمة حقيقيةتم تقدير المعلمة من بيانات العينة. في الممارسة البحثية ، غالبًا ما يتم استخدام مستوى الثقة 95٪.

خطأ في أخذ العينات (فاصل الثقة)
فترة محسوبة من بيانات العينة التي ، مع وجود احتمال معين (ثقة) ، تغطي القيمة الحقيقية غير المعروفة لمعلمة التوزيع المقدرة.

مشاركة الميزة

الحصة المتوقعة للميزة التي تم حساب الخطأ من أجلها. إذا لم تكن هناك بيانات عن حصة الخاصية ، فمن الضروري استخدام قيمة تساوي 50 ، حيث يتم الوصول إلى الحد الأقصى للخطأ.

أحد المكونات الرئيسية لدراسة جيدة التصميم هو تعريف العينة وما هي العينة التمثيلية. إنه مثل مثال الكعكة. بعد كل شيء ، ليس من الضروري تناول الحلوى كاملة لفهم مذاقها؟ جزء صغير يكفي.

إذن ، الكعكة تعداد السكان (أي جميع المستجيبين المؤهلين للاستطلاع). يمكن التعبير عنها إقليمياً ، على سبيل المثال ، سكان منطقة موسكو فقط. الجنس - النساء فقط. أو لديك قيود عمرية - الروس تزيد أعمارهم عن 65 عامًا.

من الصعب حساب عدد السكان: تحتاج إلى بيانات من التعداد السكاني أو مسوح التقييم الأولية. لذلك ، عادةً ما يتم "تقدير" عدد السكان بشكل عام ، ومن العدد الناتج يتم حسابهم إطار أخذ العينات أو أخذ العينات.

ما هي العينة التمثيلية؟

عينةهو عدد محدد جيدًا من المستجيبين. يجب أن يتطابق هيكلها قدر الإمكان مع بنية عامة السكان من حيث الخصائص الرئيسية للاختيار.

على سبيل المثال ، إذا كان المستجيبون المحتملون هم جميع سكان روسيا ، حيث تمثل النساء 54٪ و 46٪ من الرجال ، فيجب أن تحتوي العينة على نفس النسبة تمامًا النسبة المئوية. إذا كانت المعلمات متطابقة ، فيمكن تسمية العينة بالممثل. هذا يعني أنه يتم تقليل عدم الدقة والأخطاء في الدراسة.

يتم تحديد حجم العينة مع مراعاة متطلبات الدقة والاقتصاد. هذه المتطلبات تتناسب عكسيا مع بعضها البعض: كلما زاد حجم العينة ، فإن بمزيد من الدقة النتيجة. علاوة على ذلك ، كلما زادت الدقة ، زادت التكاليف المقابلة المطلوبة للدراسة. والعكس صحيح ، فكلما كانت العينة أصغر ، قل تكلفتها ، كلما قلت الدقة والعشوائية في إعادة إنتاج خصائص عامة السكان.

لذلك ، لحساب مقدار الاختيار ، اخترع علماء الاجتماع صيغة وخلقت آلة حاسبة خاصة:

احتمال الثقةو خطأ في الثقة

ماذا تعني الشروط " مستوى الثقة" و " خطأ في الثقة"؟ مستوى الثقة هو مقياس دقة القياسات. وخطأ الثقة هو خطأ محتملنتائج البحث. على سبيل المثال ، مع وجود عدد عام يزيد عن 500،00 شخص (على سبيل المثال ، الذين يعيشون في نوفوكوزنتسك) ، ستكون العينة 384 شخصًا مع مستوى الثقة 95٪ والأخطاء 5٪ أو (مع فاصل الثقة 95 ± 5٪).

ماذا يتبع من هذا؟ عند إجراء 100 دراسة مع مثل هذه العينة (384 شخصًا) ، في 95 بالمائة من الحالات ، ستكون الإجابات الواردة ، وفقًا لقوانين الإحصاء ، في حدود ± 5 ٪ من الأصل. وسوف نحصل عليها عينة تمثيليةمع الحد الأدنى من احتمال الخطأ الإحصائي.

بعد الانتهاء من حساب حجم العينة ، يمكنك معرفة ما إذا كان هناك عدد كافٍ من المشاركين في النسخة التجريبية من لوحة الاستبيان. يمكنك معرفة المزيد حول كيفية إجراء استطلاع رأي.

عندما تطرح السؤال ، "كم عدد المستجيبين الذين أحتاجهم لإجراء استطلاع؟" ، فأنت تسأل حقًا ، "ما حجم العينة التي يجب أن تكون لتقدير عدد السكان بدقة؟" نظرًا لتعقيد هذه المفاهيم ، قمنا بتقسيم العملية إلى 5 خطوات ، مما يسهل عليك حساب حجم العينة المثالي وضمان دقة نتائج الاستطلاع.

5 خطوات للتأكد من أن عينتك تقدر عدد السكان بدقة:

الخطوة 1

ما هو عموم السكان لديك؟

نعني بمصطلح "عموم السكان" المجموعة الكاملة من الأشخاص الذين ستسأل عن آرائهم (ستتألف العينة من أفراد هذا المجتمع الذين سيشاركون بالفعل في الاستطلاع).

على سبيل المثال ، إذا كنت تريد فهم كيفية العثور على سوق لمعجون الأسنان في فرنسا ، فسيكون سكانك هم شعب فرنسا. وإذا كنت تحاول تحديد عدد أيام الإجازة التي يرغب الأشخاص الذين يعملون في شركة معجون الأسنان في الحصول عليها ، فإن سكانك هم موظفو تلك الشركة.

سواء كانت دولة أو شركة ، فإن تكوين السكان هو خطوة أولى مهمة. بمجرد أن تقرر عدد السكان ، حدد حجمه (تقريبًا). على سبيل المثال ، يوجد في فرنسا حوالي 65 مليون شخص ، لكن من المحتمل أن يكون لدى شركة معجون الأسنان عدد أقل بكثير من الموظفين.

هل حصلت على الرقم الصحيح؟ حسنًا ، دعنا ننتقل ...

الخطوة 2

ما هي الدقة المطلوبة؟

هذه الخطوة هي نوع من التقييم لمدى المخاطرة الذي أنت على استعداد لتحمله فيما يتعلق باحتمالية وجود ردود غير دقيقة على الاستبيان بسبب حقيقة أنك لا تقوم باستطلاع الرأي العام بأكمله. لذلك يجب الإجابة عن سؤالين:

  1. ما مدى الثقة التي تحتاجها لتكون واثقًا من أن الردود التي تتلقاها تعكس آراء عامة السكان؟
    هذا هو هامش الخطأ الخاص بك. لنفترض أن 90٪ من العينة يحبون العلكة بنكهة العنب. هامش الخطأ 5٪ يضيف 5٪ على كل جانب من هذا الرقم ، مما يعني أن 85-95٪ من العينة تحب العلكة بنكهة العنب. 5٪ هو هامش الخطأ الأكثر استخدامًا ، ولكن يمكنك ضبطه على ما بين 1٪ و 10٪ اعتمادًا على الاستطلاع. لا يوصى برفع هذا الرقم فوق 10٪.
  2. ما مدى الثقة التي تحتاجها لتكون على ثقة من أن العينة تمثل السكان بدقة؟

    هذا هو مستوى ثقتك. مستوى الثقة هو احتمال أن تكون العينة مهمة بالنسبة للنتائج التي تم الحصول عليها. عادة ما يتم الحساب على النحو التالي. إذا اخترت عشوائياً 30 عينة أخرى من هذه المجموعة ، فكم مرة ستختلف نتيجة عينة واحدة بشكل كبير عن نتائج العينات الثلاثين الأخرى؟ مستوى الثقة 95٪ يعني أن 95٪ من الوقت ستكون النتائج متطابقة. 95٪ هي القيمة الأكثر استخدامًا ، ولكن يمكنك تعيينها على 90٪ أو 99٪ اعتمادًا على الاستطلاع. لا ينصح بتخفيض قيمة مستوى الثقة إلى أقل من 90٪.

الخطوه 3

ما هو حجم العينة الذي أحتاجه؟

في الجدول أدناه ، حدد حجمًا تقريبيًا للسكان المستهدفين وهامشًا للخطأ لتحديد عدد المقابلات المكتملة المطلوبة.

الآن بعد أن أصبح لديك قيم الخطوة 1 والخطوة 2 ، استخدم الجدول المفيد أدناه لتحديد حجم العينة المطلوبة ...

سكان هامش الخطأ مستوى الثقة
10% 5% 1% 90% 95% 99%
100 50 80 99 74 80 88
500 81 218 476 176 218 286
1000 88 278 906 215 278 400
10 000 96 370 4900 264 370 623
100 000 96 383 8763 270 383 660
1 000 000+ 97 384 9513 271 384 664

ملحوظة. يتم توفير البيانات كدليل إرشادي فقط. أيضًا ، بالنسبة للسكان الذين يزيد عددهم عن مليون نسمة ، يمكن تقريب الأرقام إلى أقرب مائة.

الخطوة 4

ما مدى استجابة الناس؟

لسوء الحظ ، لن يتلقى كل شخص ترسل إليه استطلاعًا ردًا.

يشار إلى النسبة المئوية للأشخاص الذين يكملون نموذج الاستطلاع الذي يتلقونه باسم "معدل الاستجابة". سيساعدك تحديد النسبة المئوية للمشاركين في الاستطلاع على التحديد الرقم الإجماليحالات الاستطلاع التي يجب إرسالها لتلقي العدد المطلوب من الردود.

تعتمد النسبة المئوية للاستجابات بشكل مباشر على عدد من العوامل ، مثل العلاقات مع الجمهور المستهدفوطول وتعقيد المسح والحوافز المقدمة وموضوع المسح. للاستطلاعات عبر الإنترنت حيث لم يتم إنشاء علاقة مسبقًا مع المستلمين ، النسبة المئويةتعتبر معدلات الاستجابة من 20-30٪ عالية جدا. القيمة الأكثر تحفظًا والأرجح هي 10-14٪ ، إذا لم تكن قد أجريت مسحًا سابقًا في هذه الفئة من السكان.

الخطوة الخامسة

إذن كم عدد الأشخاص الذين يجب أن ترسل إليهم الاستطلاع؟

هذه خطوة سهلة!

ببساطة قسّم الرقم الذي حصلت عليه في الخطوة 3 على الرقم الذي حصلت عليه في الخطوة 4. هذا هو رقمك السحري.

على سبيل المثال ، إذا كنت تريد أن تقوم 100 امرأة تستخدم الشامبو بإكمال استطلاع وتعتقد أن 10٪ من النساء اللاتي ترسلن الاستطلاع لإكماله ، فأنت بحاجة إلى إرسال الاستبيان إلى 1000 امرأة (100/10٪)!