السير الذاتية صفات التحليلات

موثوقية صيغة البيانات الإحصائية. مفهوم الدلالة الإحصائية

اليوم الأمر سهل جدًا حقًا: يمكنك الذهاب إلى جهاز كمبيوتر مع معرفة قليلة أو معدومة بما تفعله ، وخلق هراء عقلانيًا وبسرعة مذهلة حقًا. (جيه بوكس)

المصطلحات والمفاهيم الأساسية للإحصاء الطبي

في هذه المقالة ، نقدم بعض المفاهيم الأساسية للإحصاء ذات الصلة بالبحث الطبي. تمت مناقشة المصطلحات بمزيد من التفصيل في المقالات ذات الصلة.

تفاوت

تعريف.درجة تشتت البيانات (قيم الإشارة) على مدى القيم

احتمالا

تعريف. الاحتمال هو الدرجة التي يمكن أن يحدث بها حدث معين في ظل ظروف معينة.

مثال. دعونا نشرح تعريف المصطلح في الجملة "احتمال الشفاء عند استخدام عقار Arimidex هو 70٪". الحدث هو "شفاء المريض" ، الحالة "المريض يأخذ Arimidex" ، درجة الاحتمال هي 70٪ (تقريبًا ، من بين 100 شخص يتناولون Arimidex ، يتعافى 70).

الاحتمال التراكمي

تعريف.الاحتمال التراكمي للبقاء على قيد الحياة في الوقت t هو نفس نسبة المرضى الذين نجوا في ذلك الوقت.

مثال. إذا قيل إن الاحتمال التراكمي للبقاء على قيد الحياة بعد دورة علاج مدتها خمس سنوات هو 0.7 ، فهذا يعني أنه من بين مجموعة المرضى المعتبرين ، ظل 70 ٪ من العدد الأولي على قيد الحياة ، ومات 30 ٪. بعبارة أخرى ، من بين كل مائة شخص ، مات 30 خلال السنوات الخمس الأولى.

حان وقت الحدث

تعريف.الوقت للحدث - هذا هو الوقت ، المعبر عنه في بعض الوحدات ، المنقضي من بعض الوقت الأولي حتى وقوع حدث ما.

تفسير. الوحدات الزمنية في البحث الطبي هي الأيام والشهور والسنوات.

أمثلة نموذجية للأوقات الأولية:

    بدء متابعة المريض

    العلاج الجراحي

أمثلة نموذجية للأحداث المدروسة:

    تطور المرض

    تكرار

    موت المريض

عينة

تعريف.تم الحصول على جزء من السكان عن طريق الاختيار.

بناءً على نتائج تحليل العينة ، يتم استخلاص استنتاجات حول المجتمع بأكمله ، وهو أمر صالح فقط إذا كان الاختيار عشوائيًا. نظرًا لأن الاختيار العشوائي من مجموعة سكانية أمر مستحيل عمليًا ، يجب على المرء أن يسعى للتأكد من أن العينة تمثل السكان على الأقل.

العينات التابعة والمستقلة

تعريف.العينات التي تم فيها تجنيد كائنات الدراسة بشكل مستقل عن بعضها البعض. بديل للعينات المستقلة هو عينات معتمدة (متصلة ، مقترنة).

فرضية

الفرضيات الثنائية والأحادية الجانب

دعونا أولاً نشرح استخدام مصطلح الفرضية في الإحصاء.

الهدف من معظم الأبحاث هو اختبار حقيقة بعض العبارات. غالبًا ما يكون الغرض من اختبار الدواء هو اختبار الفرضية القائلة بأن أحد الأدوية أكثر فعالية من عقار آخر (على سبيل المثال ، Arimidex أكثر فعالية من عقار تاموكسيفين Tamoxifen).

للتعبير عن صرامة الدراسة ، يتم التعبير عن العبارة التي يتم التحقق منها رياضيًا. على سبيل المثال ، إذا كان A هو عدد السنوات التي سيعيشها المريض في Arimidex و T هو عدد السنوات التي سيعيشها المريض على عقار Tamoxifen ، فيمكن كتابة الفرضية التي سيتم اختبارها على أنها A> T.

تعريف.تسمى الفرضية ذات الوجهين إذا كانت تتكون من مساواة كميتين.

مثال على فرضية ذات وجهين: أ = ت.

تعريف. تسمى الفرضية أحادية الجانب (من جانب واحد) إذا كانت تتكون من عدم المساواة بين كميتين.

أمثلة على الفرضيات أحادية الجانب:

بيانات ثنائية التفرع (ثنائية)

تعريف.يتم التعبير عن البيانات بواسطة قيمتين بديلتين صالحتين فقط

مثال: المريض "سليم" - "مريض". الوذمة "هي" - "غير موجودة".

فاصل الثقة

تعريف.فاصل الثقة لبعض الكمية هو النطاق حول قيمة الكمية التي تحتوي على القيمة الحقيقية لتلك الكمية (بمستوى معين من الثقة).

مثال. دع الكمية قيد الدراسة تكون عدد المرضى في السنة. في المتوسط ​​، يبلغ عددهم 500 ، ومجال الثقة 95٪ هو (350 ، 900). هذا يعني أنه ، على الأرجح (مع احتمال 95٪) ، سيتصل بالعيادة 350 شخصًا على الأقل ولا يزيد عن 900 شخصًا خلال العام.

تعيين. الاختصار الشائع جدًا هو: 95٪ CI (95٪ CI) هو فاصل ثقة بمستوى ثقة 95٪.

الموثوقية ، الدلالة الإحصائية (P - المستوى)

تعريف.الأهمية الإحصائية لنتيجة هي مقياس للثقة في "حقيقتها".

أي بحث يعتمد فقط على جزء من الأشياء. لا يتم إجراء دراسة فعالية الدواء على أساس جميع المرضى على هذا الكوكب بشكل عام ، ولكن فقط على مجموعة معينة من المرضى (من المستحيل ببساطة إجراء تحليل على أساس جميع المرضى).

لنفترض أنه تم التوصل إلى بعض الاستنتاجات كنتيجة للتحليل (على سبيل المثال ، استخدام Arimidex كعلاج مناسب أكثر فعالية مرتين من عقار تاموكسيفين).

السؤال الذي يجب طرحه هو: "إلى أي مدى يمكنك الوثوق بهذه النتيجة؟".

تخيل أننا كنا نجري دراسة على مريضين فقط. بالطبع ، في هذه الحالة ، يجب التعامل مع النتائج بقلق. إذا تم فحص عدد كبير من المرضى (تعتمد القيمة العددية لـ "عدد كبير" على الموقف) ، فيمكن الوثوق بالفعل في الاستنتاجات المستخلصة.

لذلك ، يتم تحديد درجة الثقة من خلال قيمة المستوى p (القيمة p).

يتوافق المستوى p الأعلى مع مستوى أدنى من الثقة في النتائج التي تم الحصول عليها من تحليل العينة. على سبيل المثال ، يُظهر المستوى p الذي يساوي 0.05 (5٪) أن النتيجة التي تم التوصل إليها أثناء تحليل مجموعة معينة ليست سوى ميزة عشوائية لهذه الكائنات مع احتمال 5٪ فقط.

بمعنى آخر ، مع وجود احتمال كبير جدًا (95٪) ، يمكن تمديد الاستنتاج إلى جميع الكائنات.

في العديد من الدراسات ، تعتبر 5٪ قيمة احتمالية مقبولة. هذا يعني أنه إذا كانت p = 0.01 ، على سبيل المثال ، فيمكن الوثوق في النتائج ، ولكن إذا كانت p = 0.06 ، فهذا مستحيل.

يذاكر

دراسة مستقبليةهي دراسة يتم فيها اختيار العينات بناءً على عامل الإدخال ، ويتم تحليل بعض العوامل الناتجة في العينات.

دراسة مرجعيةهي دراسة يتم فيها اختيار العينات بناءً على العامل الناتج ، ويتم تحليل بعض عوامل الإدخال في العينات.

مثال. العامل الأولي هو أن تكون المرأة الحامل أصغر / أكبر من 20 عامًا. العامل الناتج هو أن الطفل أخف / أثقل من 2.5 كجم. نقوم بتحليل ما إذا كان وزن الطفل يعتمد على عمر الأم.

إذا أخذنا عينتين ، واحدة مع أمهات تقل أعمارهن عن 20 عامًا ، والأخرى بأخرى أكبر سناً ، ثم قمنا بتحليل كتلة الأطفال في كل مجموعة ، فهذه دراسة مستقبلية.

إذا جمعنا عينتين ، في واحدة - أمهات أنجبن أطفالًا أخف وزنًا من 2.5 كجم ، والأخرى - أثقل ، ثم قمنا بتحليل عمر الأمهات في كل مجموعة ، فهذه دراسة بأثر رجعي (بطبيعة الحال ، مثل هذه الدراسة يمكن إجراؤها فقط عند اكتمال التجربة ، أي ولادة جميع الأطفال).

نزوح

تعريف.حدث مهم سريريًا أو قيمة معملية أو علامة تهم الباحث. في التجارب السريرية ، تعمل النتائج كمعايير لتقييم فعالية التدخل العلاجي أو الوقائي.

علم الأوبئة السريرية

تعريف.العلم الذي يسمح بالتنبؤ بنتيجة معينة لكل مريض على حدة بناءً على دراسة المسار السريري للمرض في حالات مماثلة ، باستخدام طرق علمية صارمة لدراسة المرضى لضمان دقة التنبؤات.

مجموعة

تعريف.مجموعة من المشاركين في دراسة ، توحدهم بعض السمات المشتركة في وقت تكوينها ودرسوا على مدى فترة طويلة من الزمن.

مراقبة

السيطرة التاريخية

تعريف.تشكلت المجموعة الضابطة وفحصت في الفترة السابقة للدراسة.

التحكم الموازي

تعريف.تشكلت المجموعة الضابطة بالتزامن مع تشكيل المجموعة الرئيسية.

علاقه مترابطه

تعريف.علاقة إحصائية بين علامتين (كمية أو ترتيبية) ، تُظهر أن القيمة الأكبر لعلامة واحدة في جزء معين من الحالات تتوافق مع قيمة أكبر - في حالة وجود ارتباط موجب (مباشر) - قيمة علامة أخرى أو قيمة أصغر - في حالة وجود ارتباط سلبي (عكسي).

مثال. تم العثور على ارتباط معنوي بين مستوى الصفائح الدموية والكريات البيض في دم المريض. معامل الارتباط 0.76.

نسبة المخاطر (CR)

تعريف.نسبة المخاطرة (نسبة الخطر) هي نسبة احتمال وقوع حدث معين ("سيئ") للمجموعة الأولى من الكائنات إلى احتمال وقوع نفس الحدث للمجموعة الثانية من الكائنات.

مثال. إذا كان لدى غير المدخنين فرصة بنسبة 20٪ للإصابة بسرطان الرئة وفرصة 100٪ للإصابة بسرطان الرئة لدى المدخنين ، فإن CR سيكون الخمس. في هذا المثال ، المجموعة الأولى من الأشياء هي من غير المدخنين ، والمجموعة الثانية من المدخنين ، ويعتبر حدوث سرطان الرئة حدثًا "سيئًا".

من الواضح أن:

1) إذا كانت КР = 1 ، فإن احتمال وقوع الحدث في المجموعات هو نفسه

2) إذا كانت КР> 1 ، فإن الحدث يحدث في كثير من الأحيان مع كائنات من المجموعة الأولى مقارنة بالمجموعة الثانية

3) إذا كان CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

التحليل البعدي

تعريف. منتحليل إحصائي يلخص نتائج العديد من الدراسات التي تبحث في نفس المشكلة (عادة فعالية طرق العلاج والوقاية والتشخيص). توفر دراسات التجميع عينة أكبر للتحليل وقوة إحصائية أكبر للدراسات المجمعة. تستخدم لزيادة الدليل أو الثقة في الاستنتاج حول فعالية طريقة الدراسة.

طريقة كابلان ماير (تقديرات كابلان ماير المتعددة)

تم اختراع هذه الطريقة من قبل الإحصائيين E.L.Kaplan و Paul Meyer.

تستخدم الطريقة لحساب الكميات المختلفة المتعلقة بوقت ملاحظة المريض. أمثلة على هذه القيم:

    فرصة الشفاء خلال عام واحد عند استخدام الدواء

    فرصة التكرار بعد الجراحة في غضون ثلاث سنوات بعد الجراحة

    الاحتمال التراكمي للبقاء على قيد الحياة بعد خمس سنوات بين مرضى سرطان البروستاتا بعد بتر الأعضاء

دعونا نشرح مزايا استخدام طريقة كابلان ماير.

يتم حساب قيمة القيم في التحليل "العادي" (وليس باستخدام طريقة Kaplan-Meier) على أساس تقسيم الفاصل الزمني المدروس إلى فترات.

على سبيل المثال ، إذا فحصنا احتمال وفاة مريض في غضون 5 سنوات ، فيمكن تقسيم الفترة الزمنية إلى 5 أجزاء (أقل من سنة واحدة ، 1-2 سنوات ، 2-3 سنوات ، 3-4 سنوات ، 4- 5 سنوات) ، لذا و 10 (نصف سنة لكل منهما) ، أو عدد آخر من الفواصل الزمنية. ستكون النتائج مختلفة لأقسام مختلفة.

اختيار القسم الأنسب ليس بالمهمة السهلة.

لا تعتمد تقديرات قيم الكميات التي تم الحصول عليها بواسطة طريقة كابلان ماير على تقسيم وقت المراقبة إلى فترات زمنية ، ولكنها تعتمد فقط على عمر كل مريض على حدة.

لذلك ، يسهل على الباحث إجراء التحليل ، وغالبًا ما تكون النتائج ذات جودة أعلى من نتائج التحليل "العادي".

منحنى Kaplan-Meier هو رسم بياني لمنحنى البقاء الذي تم الحصول عليه باستخدام طريقة Kaplan-Meier.

نموذج كوكس

اخترع هذا النموذج السير ديفيد روكسبي كوكس (مواليد 1924) ، وهو إحصائي إنجليزي شهير ، ومؤلف أكثر من 300 مقالة وكتاب.

يستخدم نموذج كوكس في المواقف التي تعتمد فيها الكميات المدروسة في تحليل البقاء على وظائف الوقت. على سبيل المثال ، قد يعتمد احتمال التكرار بعد t سنوات (t = 1.2 ، ...) على لوغاريتم الوقت log (t).

من المزايا المهمة للطريقة التي اقترحها كوكس إمكانية تطبيق هذه الطريقة في عدد كبير من المواقف (لا يفرض النموذج قيودًا صارمة على طبيعة أو شكل توزيع الاحتمالات).

استنادًا إلى نموذج كوكس ، يمكن إجراء تحليل (يسمى تحليل كوكس) ، والذي ينتج عنه قيمة نسبة المخاطرة وفاصل الثقة لنسبة المخاطر.

طرق الإحصاء اللامعلمية

تعريف.فئة من الأساليب الإحصائية المستخدمة في المقام الأول لتحليل البيانات الكمية الموزعة غير العادية ، وكذلك لتحليل البيانات النوعية.

مثال. لتحديد أهمية الاختلافات في الضغط الانقباضي للمرضى اعتمادًا على نوع العلاج ، سنستخدم اختبار مان ويتني اللامعلمي.

الميزة (متغير)

تعريف. Xخصائص موضوع الدراسة (الملاحظة). هناك خصائص نوعية وكمية.

العشوائية

تعريف.طريقة التوزيع العشوائي لأشياء البحث في المجموعات الرئيسية والضابطة باستخدام وسائل خاصة (جداول أو عداد أرقام عشوائي ، ورمي عملة معدنية ، وطرق أخرى لتخصيص رقم مجموعة عشوائيًا لملاحظة مدرجة). تقلل العشوائية الاختلافات بين المجموعات من حيث السمات المعروفة وغير المعروفة التي قد تؤثر على النتيجة قيد الدراسة.

مخاطرة

عزوي- خطر إضافي لنتيجة غير مواتية (على سبيل المثال ، مرض) بسبب وجود خاصية معينة (عامل خطر) في موضوع الدراسة. هذا هو جزء من خطر الإصابة بمرض مرتبط بعامل الخطر هذا ، ويتم تفسيره من خلاله ويمكن القضاء عليه إذا تم القضاء على عامل الخطر هذا.

المخاطر النسبية- نسبة خطر حدوث حالة غير مواتية في مجموعة إلى مخاطر هذه الحالة في مجموعة أخرى. يتم استخدامه في الدراسات المستقبلية والرصدية عندما يتم تشكيل المجموعات مسبقًا ، ولم يحدث بعد حدوث الحالة المدروسة.

امتحان المتداول

تعريف.طريقة للتحقق من استقرار وموثوقية وأداء (صحة) نموذج إحصائي عن طريق حذف الملاحظات وإعادة حساب النموذج على التوالي. كلما كانت النماذج الناتجة أكثر تشابهًا ، كان النموذج أكثر استقرارًا وموثوقية.

حدث

تعريف.النتيجة السريرية التي لوحظت في الدراسة مثل حدوث مضاعفات ، انتكاس ، شفاء ، موت.

التقسيم الطبقي

تعريف. مطريقة أخذ العينات التي يتم فيها تقسيم مجتمع جميع المشاركين الذين يستوفون معايير التضمين في دراسة ما أولاً إلى مجموعات (طبقات) بناءً على خاصية واحدة أو أكثر (عادةً الجنس والعمر) التي من المحتمل أن تؤثر على النتيجة قيد الدراسة ، ثم من كل من هذه المجموعات (الطبقة) ، يتم تجنيد المشاركين بشكل مستقل في المجموعات التجريبية والضابطة. يسمح هذا للباحث بموازنة الخصائص المهمة بين المجموعتين التجريبية والضابطة.

طاولة الطوارئ

تعريف.جدول للترددات المطلقة (أرقام) للملاحظات ، تتوافق أعمدتها مع قيم سمة واحدة ، والصفوف لقيم سمة أخرى (في حالة جدول طوارئ ثنائي الأبعاد). توجد قيم الترددات المطلقة في الخلايا عند تقاطع الصفوف والأعمدة.

دعونا نعطي مثالا لجدول الطوارئ. تم إجراء جراحة تمدد الأوعية الدموية في 194 مريضاً. مؤشر معروف لشدة الوذمة لدى المرضى قبل الجراحة.

الوذمة / النتيجة

لا وذمة 20 6 26
تورم معتدل 27 15 42
وذمة واضحة 8 21 29
إم جي 55 42 194

وهكذا ، من بين 26 مريضًا بدون وذمة ، نجا 20 مريضًا بعد العملية ، وتوفي 6 مرضى. من بين 42 مريضًا يعانون من وذمة متوسطة ، نجا 27 مريضًا ، وتوفي 15 ، وما إلى ذلك.

اختبار Chi-Square لجداول الطوارئ

لتحديد أهمية (موثوقية) الاختلافات في علامة واحدة اعتمادًا على أخرى (على سبيل المثال ، نتيجة عملية اعتمادًا على شدة الوذمة) ، يتم استخدام اختبار خي مربع لجداول الطوارئ:


صدفة

دع احتمالية حدوث حدث ما تساوي p. عندئذٍ يكون احتمال عدم وقوع الحدث هو 1-p.

على سبيل المثال ، إذا كان احتمال بقاء المريض على قيد الحياة بعد خمس سنوات هو 0.8 (80٪) ، فإن احتمال وفاته خلال هذه الفترة الزمنية هو 0.2 (20٪).

تعريف.الفرصة هي نسبة احتمال وقوع حدث ما إلى احتمال عدم وقوع الحدث.

مثال. في مثالنا (عن المريض) ، تكون الفرصة 4 ، لأن 0.8 / 0.2 = 4

وبالتالي ، فإن احتمال الشفاء هو 4 أضعاف احتمال الوفاة.

تفسير قيمة الكمية.

1) إذا كانت الفرصة = 1 ، فإن احتمال وقوع الحدث يساوي احتمال عدم وقوع الحدث ؛

2) إذا كانت الفرصة> 1 ، فإن احتمال وقوع الحدث أكبر من احتمال عدم وقوع الحدث ؛

3) إذا فرصة<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

نسبة الاحتمالات

تعريف.نسبة الأرجحية هي نسبة احتمالات المجموعة الأولى من الكائنات إلى نسبة الأرجحية للمجموعة الثانية من الكائنات.

مثال. لنفترض أن كلا من الرجال والنساء يخضعون لبعض العلاج.

احتمال بقاء المريض الذكر على قيد الحياة بعد خمس سنوات هو 0.6 (60٪) ؛ احتمال وفاته خلال هذه الفترة الزمنية هو 0.4 (40٪).

الاحتمالات المماثلة للنساء هي 0.8 و 0.2.

نسبة الأرجحية في هذا المثال هي

تفسير قيمة الكمية.

1) إذا كانت نسبة الأرجحية = 1 ، فإن فرصة المجموعة الأولى تساوي فرصة المجموعة الثانية

2) إذا كانت نسبة الأرجحية> 1 ، فإن فرصة المجموعة الأولى أكبر من فرصة المجموعة الثانية

3) إذا كانت نسبة الأرجحية<1, то шанс для первой группы меньше шанса для второй группы

فكر في مثال نموذجي لتطبيق الأساليب الإحصائية في الطب. يقترح مبتكرو الدواء أنه يزيد من إدرار البول بما يتناسب مع الجرعة المأخوذة. لاختبار هذا الافتراض ، أعطوا خمسة متطوعين جرعات مختلفة من الدواء.

وفقًا لنتائج الملاحظات ، تم رسم مخطط لإدرار البول مقابل الجرعة (الشكل 1.2 أ). الاعتماد مرئي للعين المجردة. الباحثون يهنئون بعضهم البعض على هذا الاكتشاف ، ويهنئ العالم على مدرات البول الجديدة.

في الواقع ، تسمح لنا البيانات بأن نقول بشكل موثوق فقط أن اعتماد إدرار البول على الجرعة لوحظ في هؤلاء المتطوعين الخمسة. حقيقة أن هذا الاعتماد سيظهر في جميع الأشخاص الذين سيتعاطون الدواء ليس أكثر من تخمين.
WJ

مع

زيني. لا يمكن القول أنه لا أساس له - وإلا فلماذا التجربة؟

لكن الدواء الآن معروض في السوق. المزيد والمزيد من الناس يأخذونها على أمل زيادة إدرار البول. وماذا نرى؟ نرى الشكل 1.2 ب ، والذي يشير إلى عدم وجود أي علاقة بين جرعة الدواء وإدرار البول. تمثل الدوائر السوداء بيانات من الدراسة الأصلية. الإحصائيات لديها طرق لتقدير احتمالية الحصول على مثل هذه العينة "غير التمثيلية" ، علاوة على أنها مربكة. اتضح أنه في حالة عدم وجود علاقة بين إدرار البول وجرعة الدواء ، فإن "الاعتماد" الناتج سيلاحظ في حوالي 5 تجارب من كل 1000 تجربة. لذلك ، في هذه الحالة ، كان الباحثون محظوظين. حتى لو طبقوا حتى أكثر الأساليب الإحصائية مثالية ، فلن ينقذهم ذلك من الخطأ.

هذا خيالي ، ولكن ليس بعيدًا عن الواقع على الإطلاق ، مثال ، استشهدنا به ليس للإشارة إلى عدم جدوى
الإحصاء. يتحدث عن شيء آخر ، عن الطبيعة الاحتمالية لاستنتاجاتها. نتيجة لتطبيق الطريقة الإحصائية ، لا نحصل على الحقيقة المطلقة ، ولكن فقط تقدير لاحتمال افتراض معين. بالإضافة إلى ذلك ، تعتمد كل طريقة إحصائية على نموذجها الرياضي الخاص ونتائجها صحيحة إلى الحد الذي يتوافق معه هذا النموذج مع الواقع.

المزيد عن الموثوقية والأهمية الإحصائية:

  1. فروق ذات دلالة إحصائية في مؤشرات جودة الحياة
  2. المجموع الإحصائي. علامات الحساب. مفهوم البحث المستمر والانتقائي. متطلبات المجتمع الإحصائي واستخدام وثائق المحاسبة وإعداد التقارير
  3. مقال. دراسة موثوقية قراءات مقياس الضغط لقياس الضغط داخل العين 2018، 2018

في أي حالة علمية وعملية للتجربة (المسح) ، لا يمكن للباحثين دراسة جميع الناس (عامة السكان ، السكان) ، ولكن فقط عينة معينة. على سبيل المثال ، حتى لو كنا نفحص مجموعة صغيرة نسبيًا من الأشخاص ، مثل أولئك الذين يعانون من مرض معين ، فمن غير المرجح أن تكون لدينا الموارد أو نحتاج إلى اختبار كل مريض. بدلاً من ذلك ، عادةً ما يتم اختبار عينة من السكان لأنها أكثر ملاءمة وتستغرق وقتًا أقل. في هذه الحالة ، كيف نعرف أن النتائج التي تم الحصول عليها من العينة تمثل المجموعة بأكملها؟ أو ، لاستخدام المصطلحات المهنية ، هل يمكننا التأكد من أن دراستنا تصف الكل بشكل صحيح تعداد السكان، العينة التي استخدمنا منها؟

للإجابة على هذا السؤال ، من الضروري تحديد الأهمية الإحصائية لنتائج الاختبار. دلالة إحصائية (مستوى كبير، مختصر سيج.) ،أو / 7-مستوى الأهمية (مستوى ع) -هو احتمال أن تمثل نتيجة معينة بشكل صحيح المجتمع الذي درست منه العينة. لاحظ أن هذا فقط احتمالا- من المستحيل أن نقول على وجه اليقين المطلق أن هذه الدراسة تصف بشكل صحيح جميع السكان. في أحسن الأحوال ، يمكن للمرء أن يستنتج فقط من مستوى الأهمية أن هذا أمر محتمل للغاية. وبالتالي ، فإن السؤال التالي الذي يطرح نفسه لا محالة: ما هو مستوى الأهمية الذي يجب أن يكون من أجل اعتبار هذه النتيجة توصيفًا صحيحًا للسكان؟

على سبيل المثال ، ما هي قيمة الاحتمالية التي تريد أن تقول إن مثل هذه الاحتمالات كافية للمخاطرة؟ إذا كانت الفرص 10 من 100 أو 50 من 100؟ ولكن ماذا لو كان هذا الاحتمال أعلى؟ ماذا عن احتمالات مثل 90 من 100 أو 95 من 100 أو 98 من 100؟ بالنسبة للموقف المرتبط بالمخاطر ، يعد هذا الاختيار مشكلة كبيرة ، لأنه يعتمد على الخصائص الشخصية للشخص.

في علم النفس ، يُعتقد تقليديًا أن 95 فرصة أو أكثر من 100 تعني أن احتمالية صحة النتائج عالية بما يكفي لتعميمها على جميع السكان. تم إنشاء هذا الرقم في عملية النشاط العلمي والعملي - لا يوجد قانون يجب بموجبه اختياره كمبدأ توجيهي (وفي الواقع ، في العلوم الأخرى ، يتم أحيانًا اختيار قيم أخرى لمستوى الأهمية).

في علم النفس ، يتم التعامل مع هذا الاحتمال بطريقة غير عادية إلى حد ما. بدلاً من احتمال أن العينة تمثل مجتمعًا ، احتمالية أن تكون العينة لا يمثلتعداد السكان. بمعنى آخر ، هو احتمال أن تكون العلاقة أو الاختلافات المكتشفة عشوائية وليست خاصية للمجتمع. وبالتالي ، بدلاً من القول إن نتائج الدراسة صحيحة مع احتمال 95 من 100 ، يقول علماء النفس أن هناك فرصة 5 من 100 أن النتائج خاطئة (وبالمثل ، 40 من 100 فرصة لصالح صحة النتائج تعني 60 فرصة من أصل 100 لصالح خطأهم). يتم التعبير عن قيمة الاحتمال أحيانًا كنسبة مئوية ، ولكن غالبًا ما يتم كتابتها ككسر عشري. على سبيل المثال ، يتم تمثيل 10 فرص من 100 على أنها كسر عشري 0.1 ؛ 5 من 100 مكتوبة على شكل 0.05 ؛ 1 في 100 - 0.01. مع هذا الشكل من التسجيل ، تكون القيمة الحدية 0.05. لكي يتم اعتبار النتيجة صحيحة ، يجب أن يكون مستوى أهميتها أقلهذا الرقم (تذكر أن هذا هو احتمال أن تكون النتيجة ليس تمامايصف السكان. للتخلص من المصطلحات ، نضيف أن "احتمال نتيجة خاطئة" (وهو الاسم الصحيح أكثر مستوى الأهمية)عادة ما يشار إليها بالحرف اللاتيني تم العثور على R.عادة ما يتضمن وصف نتائج التجربة خلاصة موجزة ، مثل "كانت النتائج مهمة على مستوى الأهمية (ع) أقل من 0.05 (أي أقل من 5٪).

وهكذا ، فإن مستوى الدلالة ( ص) يشير إلى احتمال أن تكون النتائج ليستمثل السكان. حسب التقاليد في علم النفس ، يُعتقد أن النتائج تعكس بشكل موثوق الصورة العامة ، إذا كانت القيمة صأقل من 0.05 (أي 5٪). ومع ذلك ، هذا مجرد بيان احتمالي ، وليس ضمانًا غير مشروط على الإطلاق. في بعض الحالات ، قد يكون هذا الاستنتاج غير صحيح. في الواقع ، يمكننا حساب عدد المرات التي يمكن أن يحدث فيها هذا إذا نظرنا إلى حجم مستوى الأهمية. عند مستوى دلالة 0.05 ، في 5 حالات من أصل 100 ، ربما تكون النتائج غير صحيحة. 11 أ للوهلة الأولى يبدو أن هذا ليس كثيرًا ، ولكن إذا فكرت في الأمر ، فإن 5 فرص من أصل 100 هي نفسها 1 من 20. بمعنى آخر ، في حالة واحدة من كل 20 حالة ستظهر النتيجة من الخطأ. لا تبدو مثل هذه الاحتمالات مواتية بشكل خاص ، ويجب على الباحثين الحذر من ارتكابها أخطاء من النوع الأول.هذا هو اسم الخطأ الذي يحدث عندما يعتقد الباحثون أنهم توصلوا إلى نتائج حقيقية ، لكن في الحقيقة لا توجد نتائج. تسمى الأخطاء المعاكسة ، المتمثلة في حقيقة أن الباحثين يعتقدون أنهم لم يعثروا على نتيجة ، ولكن في الحقيقة هناك واحدة ، أخطاء من النوع الثاني.

تنشأ هذه الأخطاء لأنه لا يمكن استبعاد احتمال التحليل الإحصائي غير الصحيح. يعتمد احتمال الخطأ على مستوى الدلالة الإحصائية للنتائج. لقد لاحظنا بالفعل أنه من أجل اعتبار النتيجة صحيحة ، يجب أن يكون مستوى الأهمية أقل من 0.05. بالطبع ، تكون بعض النتائج أقل ، وليس من غير المألوف العثور على نتائج منخفضة تصل إلى 0.001 (تشير القيمة 0.001 إلى احتمال خطأ واحد من كل 1000). كلما كانت قيمة p أصغر ، زادت ثقتنا في صحة النتائج.

في الجدول. يوضح 7.2 التفسير التقليدي لمستويات الأهمية حول إمكانية الاستدلال الإحصائي وتبرير القرار بشأن وجود اتصال (الاختلافات).

الجدول 7.2

التفسير التقليدي لمستويات الأهمية المستخدمة في علم النفس

بناءً على تجربة البحث العملي ، يوصى ، من أجل تجنب أخطاء النوعين الأول والثاني ، عند إجراء استنتاجات مسؤولة ، يجب اتخاذ قرارات بشأن وجود اختلافات (اتصالات) ، مع التركيز على المستوى صعلامة ن.

اختبار إحصائي(الاختبار الإحصائي -إنها أداة لتحديد مستوى الأهمية الإحصائية. هذه قاعدة قرار تضمن قبول فرضية صحيحة ورفض فرضية خاطئة باحتمالية عالية.

تشير المعايير الإحصائية أيضًا إلى طريقة حساب رقم معين وهذا الرقم نفسه. يتم استخدام جميع المعايير بهدف رئيسي واحد: التحديد مستوى الأهميةالبيانات التي يقومون بتحليلها (أي احتمال أن تعكس البيانات التأثير الحقيقي الذي يمثل بشكل صحيح المجتمع الذي تم سحب العينة منه).

يمكن استخدام بعض المعايير فقط للبيانات الموزعة بشكل طبيعي (وإذا تم قياس الميزة على مقياس فاصل) - تسمى هذه المعايير عادةً حدودي.بمساعدة معايير أخرى ، يمكنك تحليل البيانات باستخدام أي قانون توزيع تقريبًا - يتم استدعاؤها غير معلمية.

المعايير البارامترية - المعايير التي تتضمن معلمات التوزيع في صيغة الحساب ، أي الوسائل والتباينات (اختبار الطالب ، اختبار فيشر F ، إلخ).

المعايير غير المعلمية - المعايير التي لا تتضمن معلمات التوزيع في صيغة حساب التوزيعات وتعتمد على ترددات التشغيل أو الرتب (المعيار سروزنباوم ، المعيار يومانا - ويتني

على سبيل المثال ، عندما نقول أن أهمية الاختلافات تم تحديدها بواسطة اختبار الطالب t ، فإننا نعني أنه تم استخدام طريقة اختبار t للطالب لحساب القيمة التجريبية ، والتي تتم مقارنتها بعد ذلك بالقيمة الجدولية (الحرجة).

وفقًا لنسبة القيم التجريبية (التي حسبناها) والقيم الحرجة للمعيار (الجدول) ، يمكننا الحكم على ما إذا كانت فرضيتنا قد تم تأكيدها أو دحضها. في معظم الحالات ، من أجل التعرف على الاختلافات على أنها كبيرة ، من الضروري أن تتجاوز القيمة التجريبية للمعيار القيمة الحرجة ، على الرغم من وجود معايير (على سبيل المثال ، اختبار Mann-Whitney أو اختبار الإشارة) التي يجب أن نلتزم بالقاعدة المعاكسة.

في بعض الحالات ، تتضمن صيغة الحساب للمعيار عدد الملاحظات في عينة الدراسة ، والمشار إليها بالرمز ص. باستخدام جدول خاص ، نحدد مستوى الأهمية الإحصائية للاختلافات الذي يتوافق مع قيمة تجريبية معينة. في معظم الحالات ، قد تكون نفس القيمة التجريبية للمعيار مهمة أو غير مهمة ، اعتمادًا على عدد الملاحظات في عينة الدراسة ( ص ) أو من ما يسمى ب عدد درجات الحرية ، والتي يشار إليها باسم الخامس (ز>) أو كليهما مدافع (بعض الأحيان د).

معرفة صأو عدد درجات الحرية ، يمكننا استخدام جداول خاصة (ترد الجداول الرئيسية في الملحق 5) لتحديد القيم الحرجة للمعيار ومقارنة القيمة التجريبية التي تم الحصول عليها معهم. عادة ما يتم كتابتها على النحو التالي: ن = 22 القيم الحرجة للمعيار هي tSt = 2.07 "أو" في الخامس (د) = 2 ، القيم الحرجة لمعيار الطالب هي = 4.30 "وما يسمى.

ومع ذلك ، عادة ما يتم إعطاء الأفضلية للمعايير البارامترية ، ونحن نلتزم بهذا الموقف. تعتبر أكثر موثوقية ويمكن أن توفر المزيد من المعلومات والتحليل الأعمق. بالنسبة إلى تعقيد الحسابات الرياضية ، عند استخدام برامج الكمبيوتر ، يختفي هذا التعقيد (لكن البعض الآخر يبدو أنه يمكن التغلب عليه تمامًا).

  • في هذا الكتاب المدرسي ، لا نتعامل بالتفصيل مع مشكلة الإحصاء
  • الفرضيات (صفر - R0 والبديل - Hj) والقرارات الإحصائية ، حيث يدرس طلاب علم النفس هذا بشكل منفصل في تخصص "الطرق الرياضية في علم النفس". بالإضافة إلى ذلك ، تجدر الإشارة إلى أنه عند إعداد تقرير بحثي (ورقة مصطلح أو أطروحة ، منشور) ، لا يتم تقديم الفرضيات الإحصائية والحلول الإحصائية ، كقاعدة عامة. عادة ، عند وصف النتائج ، يتم الإشارة إلى معيار ، يتم إعطاء الإحصائيات الوصفية اللازمة (الوسائل ، سيجما ، معاملات الارتباط ، إلخ) ، والقيم التجريبية للمعايير ، ودرجات الحرية ، ومستوى الأهمية p بالضرورة. ثم يتم صياغة استنتاج ذي مغزى فيما يتعلق بالفرضية التي يتم اختبارها ، مما يشير (عادةً في شكل عدم المساواة) إلى مستوى الأهمية المحقق أو الذي لم يتم تحقيقه.

إحصائية موثوقية

- إنجليزيمصداقية / صحة إحصائية؛ ألمانية Validitat ، statistische. الاتساق والموضوعية وعدم الغموض في الاختبار الإحصائي أو في C.L. مجموعة من القياسات. د. يمكن اختبارها عن طريق تكرار نفس الاختبار (أو الاستبيان) على نفس الموضوع لمعرفة ما إذا كان قد تم الحصول على نفس النتائج ؛ أو بمقارنة أجزاء مختلفة من الاختبار من المفترض أن تقيس نفس الشيء.

أنتينازي. موسوعة علم الاجتماع, 2009

تعرف على "الموثوقية الإحصائية" في القواميس الأخرى:

    إحصائية موثوقية- إنجليزي. مصداقية / صحة إحصائية؛ ألمانية Validitat ، statistische. الاتساق والموضوعية وعدم الغموض في الاختبار الإحصائي أو في s. مجموعة من القياسات. د. يمكن التحقق من خلال تكرار نفس الاختبار (أو ... القاموس التوضيحي لعلم الاجتماع

    في الإحصاء ، تسمى القيمة ذات دلالة إحصائية إذا كان احتمال حدوثها بالصدفة أو حتى القيم المتطرفة صغيرًا. هنا ، يُفهم الحد الأقصى على أنه درجة انحراف إحصائيات الاختبار عن الفرضية الصفرية. الفرق يسمى ...... ويكيبيديا

    الظاهرة الفيزيائية للاستقرار الإحصائي هي أنه مع زيادة حجم العينة ، فإن تكرار حدث عشوائي أو متوسط ​​القيمة المادية للكمية المادية يميل إلى بعض الأرقام الثابتة. ظاهرة إحصائية ...... ويكيبيديا

    موثوقية الاختلاف (التشابه)- إجراء تحليلي وإحصائي لتحديد مستوى دلالة الفروق أو التشابه بين العينات حسب المؤشرات المدروسة (المتغيرات) ... العملية التربوية الحديثة: مفاهيم ومصطلحات أساسية

    الإبلاغ والإحصاء قاموس محاسبة كبير

    الإبلاغ والإحصاء- شكل من أشكال المراقبة الإحصائية الحكومية ، حيث تتلقى السلطات المعنية من الشركات (المنظمات والمؤسسات) المعلومات التي تحتاجها في شكل وثائق إبلاغ مقررة قانونًا (تقارير إحصائية) لـ ... قاموس اقتصادي كبير

    علم يدرس طرق المراقبة المنهجية للظواهر الجماعية للحياة الاجتماعية البشرية ، وتجميع أوصافها العددية والمعالجة العلمية لهذه الأوصاف. وهكذا فإن الإحصاء النظري هو علم ... ... القاموس الموسوعي F.A. Brockhaus و I.A. إيفرون

    معامل الارتباط- (معامل الارتباط) معامل الارتباط هو مؤشر إحصائي لاعتماد متغيرين عشوائيين تعريف معامل الارتباط ، أنواع معاملات الارتباط ، خصائص معامل الارتباط ، الحساب والتطبيق ... ... موسوعة المستثمر

    إحصائيات- (الإحصاء) الإحصاء علم نظري عام يدرس التغيرات الكمية في الظواهر والعمليات. إحصائيات الدولة ، خدمات الإحصاء ، Rosstat (Goskomstat) ، البيانات الإحصائية ، إحصائيات الطلب ، إحصائيات المبيعات ، ... ... موسوعة المستثمر

    علاقه مترابطه- (الارتباط) الارتباط هو علاقة إحصائية لمتغيرين عشوائيين أو أكثر مفهوم الارتباط ، أنواع الارتباط ، معامل الارتباط ، تحليل الارتباط ، ارتباط السعر ، ارتباط أزواج العملات بمحتويات الفوركس ... ... موسوعة المستثمر

كتب

  • البحث في الرياضيات والرياضيات في البحث: مجموعة منهجية حول الأنشطة البحثية للطلاب ، Borzenko V.I. تقدم المجموعة التطورات المنهجية المطبقة في تنظيم الأنشطة البحثية للطلاب. الجزء الأول من المجموعة مخصص لتطبيق نهج البحث في ...

مفهوم الدلالة الإحصائية

الصلاحية الإحصائية ضرورية في ممارسة الحساب للجنة الاتصالات الفيدرالية. لوحظ سابقًا أنه يمكن اختيار العديد من العينات من نفس السكان:

إذا تم اختيارهم بشكل صحيح ، فإن متوسط ​​مؤشراتهم ومؤشراتهم تختلف قليلاً عن بعضها البعض في حجم خطأ التمثيل ، مع مراعاة الموثوقية المقبولة ؛

إذا تم اختيارهم من مجموعات سكانية مختلفة ، فسيكون الفرق بينهم كبيرًا. تعتبر المقارنة بين العينات شائعة في الإحصاء ؛

إذا كانوا يختلفون بشكل ضئيل ، غير مهم ، غير مهم ، أي أنهم ينتمون في الواقع إلى نفس عامة السكان ، فإن الفرق بينهما يسمى غير موثوق به إحصائيًا.

ذات دلالة إحصائيةاختلاف العينة هو عينة تختلف اختلافًا كبيرًا وأساسيًا ، أي تنتمي إلى مجموعات سكانية مختلفة.

في لجنة الاتصالات الفيدرالية (FCC) ، فإن تقييم الأهمية الإحصائية للاختلافات في العينة يعني حل العديد من المشكلات العملية. على سبيل المثال ، يرتبط إدخال طرق تدريس وبرامج ومجموعات من التمارين والاختبارات وتمارين التحكم الجديدة بالتحقق التجريبي منها ، والذي يجب أن يُظهر أن مجموعة الاختبار تختلف اختلافًا جوهريًا عن المجموعة الضابطة. لذلك ، يتم استخدام طرق إحصائية خاصة تسمى معايير الدلالة الإحصائية ،السماح باكتشاف وجود أو عدم وجود فرق ذي دلالة إحصائية بين العينات.

تنقسم جميع المعايير إلى مجموعتين: حدودي وغير حدودي. المعايير البارامتريةتنص على الوجود الإلزامي لقانون التوزيع العادي ، أي يشير هذا إلى التحديد الإلزامي للمؤشرات الرئيسية للقانون العادي - المتوسط ​​الحسابي Xوالانحراف المعياري عنه. المعايير البارامترية هي الأكثر دقة وصحة. الاختبارات اللامعلميةتستند إلى اختلافات الترتيب (الترتيبي) بين عناصر العينات.

فيما يلي معايير الأهمية الإحصائية الرئيسية المستخدمة في ممارسة لجنة الاتصالات الفيدرالية: اختبار الطالب ، واختبار فيشر ، واختبار ويلكوكسون ، واختبار وايت ، واختبار فان دير وايردن (اختبار الإشارة).

معيار الطالبسميت على اسم العالم الإنجليزي C. Gosset (الطالب هو اسم مستعار) ، الذي اكتشف هذه الطريقة. معيار الطالب هو حدوديتستخدم لمقارنة القيم المطلقة للعينات. قد تختلف العينات في الحجم.

يتم تعريف معيار الطالب على النحو التالي.

1. ابحث عن معيار الطالب روفق الصيغة التالية:

أين الحادي عشر× 2 - المتوسط ​​الحسابي للعينات المقارنة ؛ / i b w 2 - أخطاء التمثيل التي تم تحديدها على أساس مؤشرات العينات المقارنة.

2. أظهرت الممارسة في لجنة الاتصالات الفيدرالية (FCC) أنه بالنسبة للعمل الرياضي يكفي قبول موثوقية النتيجة ص= 0,95.

63 لمصداقية الحساب: ف = 0.95 (أ = 0.05) مع عدد الدرجات ؛ الحريه ك= «! + ن 2 - 2 وفقًا لجدول التطبيق 4 نجد القيمة \ حسنًا ، القيمة الحدية للمعيار (^ غرام).

3. بناءً على خصائص قانون التوزيع العادي ، يتم إجراء مقارنة في اختبار الطالب رو ر ^.

4. استخلاص النتائج:

اذا كان ر> ftp ، فإن الاختلاف بين العينات التي تمت مقارنتها له دلالة إحصائية ؛

اذا كان ر< 7 F ، فإن الفرق ليس ذا دلالة إحصائية.

بالنسبة للباحثين في مجال FCC ، فإن تقييم الأهمية الإحصائية هو الخطوة الأولى في حل مشكلة معينة: تختلف اختلافًا جوهريًا أو غير أساسي بين ؛ عينات مماثلة. الخطوة التالية هي ؛ تقييم هذا الاختلاف من وجهة نظر تربوية ، والتي تحددها حالة المشكلة.