السير الذاتية صفات التحليلات

ما المصطلح يشير إلى موثوقية المعلومات الإحصائية. انظر ما هي "الموثوقية الإحصائية" في القواميس الأخرى

الملامح الرئيسية لأي علاقة بين المتغيرات.

يمكن ملاحظة اثنين من أبسط خصائص العلاقة بين المتغيرات: (أ) حجم العلاقة و (ب) موثوقية العلاقة.

- قيمة . حجم التبعية أسهل في الفهم والقياس من الموثوقية. على سبيل المثال ، إذا كان لدى أي ذكر في العينة عدد خلايا دم بيضاء أعلى من أي أنثى ، فيمكنك القول إن العلاقة بين المتغيرين (الجنس و WCC) عالية جدًا. بمعنى آخر ، يمكنك توقع قيم متغير واحد من قيم متغير آخر.

- مصداقية ("حقيقة"). إن مصداقية الترابط هو مفهوم مرئي أقل من حجم الاعتماد ، لكنه مهم للغاية. ترتبط موثوقية الاعتماد ارتباطًا مباشرًا بتمثيل عينة معينة ، على أساس استخلاص النتائج. بمعنى آخر ، تشير الموثوقية إلى مدى احتمالية إعادة اكتشاف العلاقة (بمعنى آخر ، تأكيدها) على بيانات من عينة أخرى مأخوذة من نفس المجتمع.

يجب أن نتذكر أن الهدف النهائي هو تقريبًا دراسة هذه العينة المعينة من القيم ؛ العينة مهمة فقط بقدر ما توفر معلومات حول السكان بالكامل. إذا استوفت الدراسة بعض المعايير الخاصة ، فيمكن قياس موثوقية العلاقات الموجودة بين متغيرات العينة وتقديمها باستخدام مقياس إحصائي قياسي.

يمثل حجم التبعية والموثوقية سمتين مختلفتين من التبعيات بين المتغيرات. ومع ذلك ، لا يمكن القول إنهم مستقلون تمامًا. كلما كانت العلاقة (العلاقة) بين المتغيرات في عينة بالحجم الطبيعي أكبر ، زادت موثوقيتها (انظر القسم التالي).

الأهمية الإحصائية لنتيجة (مستوى p) هي مقياس تقديري للثقة في "صحتها" (بمعنى "تمثيل العينة"). بشكل أكثر تقنيًا ، تعتبر القيمة p مقياسًا له علاقة متناقصة مع موثوقية النتيجة. يتوافق المستوى p الأعلى مع مستوى أدنى من الثقة في العلاقة بين المتغيرات الموجودة في العينة. على وجه التحديد ، يمثل المستوى p احتمال الخطأ المرتبط بتوزيع النتيجة المرصودة على المجتمع بأكمله.

فمثلا، مستوى p = 0.05(أي 1/20) يظهر أن هناك فرصة بنسبة 5٪ أن العلاقة بين المتغيرات الموجودة في العينة ليست سوى ميزة عشوائية لهذه العينة. في العديد من الدراسات ، يعتبر المستوى p البالغ 0.05 "حدًا مقبولًا" لمستوى الخطأ.

لا توجد طريقة لتجنب التعسف في تحديد مستوى الأهمية الذي يجب اعتباره حقًا "مهمًا". إن اختيار مستوى معين من الأهمية والذي يتم أعلاه رفض النتائج على أنها خاطئة هو اختيار تعسفي إلى حد ما.



من الناحية العملية ، يعتمد القرار النهائي عادةً على ما إذا كانت النتيجة قد تم توقعها مسبقًا (أي قبل إجراء التجربة) أو اكتشافها لاحقًا نتيجة للعديد من التحليلات والمقارنات التي تم إجراؤها باستخدام الكثير من البيانات ، وكذلك على التقليد الموجود في هذا المجال من البحث.

عادةً ، في العديد من المناطق ، تكون نتيجة p .05 حدًا مقبولاً للدلالة الإحصائية ، ومع ذلك ، يجب أن نتذكر أن هذا المستوى لا يزال يتضمن احتمال خطأ كبير (5٪).

النتائج المهمة في p .01 تعتبر عادة ذات دلالة إحصائية ، بينما النتائج في p .005 أو p. 001 ذات دلالة كبيرة. ومع ذلك ، يجب أن يكون مفهوماً أن هذا التصنيف لمستويات الأهمية تعسفي تمامًا وهو مجرد اتفاقية غير رسمية تستند إلى الخبرة العملية. في مجال معين من الدراسة.

من الواضح أنه كلما زاد عدد التحليلات التي سيتم إجراؤها باستخدام مجموعة البيانات التي تم جمعها ، كلما زاد عدد النتائج المهمة (على المستوى المختار) بالصدفة البحتة.

تقوم بعض الطرق الإحصائية التي تتضمن العديد من المقارنات ، وبالتالي لديها فرصة كبيرة لتكرار هذا النوع من الأخطاء ، بإجراء تعديل أو تصحيح خاص لإجمالي عدد المقارنات. ومع ذلك ، فإن العديد من الأساليب الإحصائية (خاصة طرق تحليل البيانات الاستكشافية البسيطة) لا تقدم أي طريقة لحل هذه المشكلة.

إذا كانت العلاقة بين المتغيرات ضعيفة "بشكل موضوعي" ، فلا توجد طريقة أخرى لاختبار هذه العلاقة إلا بفحص عينة كبيرة. حتى لو كانت العينة ممثلة تمامًا ، فلن يكون التأثير ذا دلالة إحصائية إذا كانت العينة صغيرة. وبالمثل ، إذا كانت العلاقة قوية جدًا "بشكل موضوعي" ، فيمكن العثور عليها بدرجة عالية من الأهمية حتى في عينة صغيرة جدًا.

كلما كانت العلاقة بين المتغيرات أضعف ، زادت العينة المطلوبة لاكتشافها بشكل كبير.

العديد من الاختلافات الروابط بين المتغيرات. يعتمد اختيار مقياس معين في دراسة معينة على عدد المتغيرات ، ومقاييس القياس المستخدمة ، وطبيعة التبعيات ، وما إلى ذلك.

ومع ذلك ، فإن معظم هذه المقاييس تتبع مبدأ مشتركًا: فهي تحاول تقدير العلاقة الملحوظة من خلال مقارنتها بـ "الحد الأقصى للعلاقة التي يمكن تصورها" بين المتغيرات قيد الدراسة. من الناحية الفنية ، فإن الطريقة المعتادة لإجراء مثل هذه التقديرات هي النظر في كيفية اختلاف قيم المتغيرات ثم حساب مقدار التباين الإجمالي الموجود الذي يمكن تفسيره من خلال وجود تباين "مشترك" ("مشترك") في متغيرين (أو أكثر).

تعتمد الأهمية بشكل أساسي على حجم العينة. كما أوضحنا سابقًا ، في العينات الكبيرة جدًا ، حتى العلاقات الضعيفة جدًا بين المتغيرات ستكون مهمة ، بينما في العينات الصغيرة ، حتى العلاقات القوية جدًا لا يمكن الاعتماد عليها.

وبالتالي ، من أجل تحديد مستوى الأهمية الإحصائية ، هناك حاجة إلى وظيفة من شأنها أن تمثل العلاقة بين "حجم" و "أهمية" العلاقة بين المتغيرات لكل حجم عينة.

تشير هذه الوظيفة بالضبط إلى "مدى احتمالية الحصول على تبعية لقيمة معينة (أو أكثر) في عينة بحجم معين ، بافتراض عدم وجود مثل هذا الاعتماد في المجتمع." بمعنى آخر ، ستعطي هذه الوظيفة مستوى أهمية
(المستوى p) ، وبالتالي احتمال الرفض الخاطئ لافتراض أن هذه العلاقة غير موجودة في المجتمع.

عادة ما تسمى هذه الفرضية "البديلة" (أنه لا يوجد تبعية بين السكان) فرضية العدم.

سيكون مثاليًا إذا كانت الوظيفة التي تحسب احتمال الخطأ خطية وكان لها فقط منحدرات مختلفة لأحجام عينات مختلفة. لسوء الحظ ، هذه الوظيفة أكثر تعقيدًا وليست هي نفسها دائمًا. ومع ذلك ، في معظم الحالات ، يكون شكله معروفًا ويمكن استخدامه لتحديد مستويات الأهمية عند فحص عينات ذات حجم معين. ترتبط معظم هذه الوظائف بفئة توزيعات تسمى عادي .

عند تبرير الاستدلال الإحصائي ، يجب على المرء أن يقرر أين يقع الخط الفاصل بين قبول الفرضية الصفرية ورفضها؟ نظرًا لوجود تأثيرات عشوائية في التجربة ، لا يمكن رسم هذه الحدود تمامًا. إنه يقوم على المفهوم مستوى الأهمية. مستوى الأهمية هو احتمال رفض فرضية العدم بشكل غير صحيح. أو بعبارة أخرى ، مستوى الأهمية - هو احتمال حدوث خطأ من النوع الأول في اتخاذ القرار. للدلالة على هذا الاحتمال ، كقاعدة عامة ، يستخدمون إما الحرف اليوناني α أو الحرف اللاتيني تم العثور على R.فيما يلي سوف نستخدم الحرف تم العثور على R.

تاريخيًا ، في العلوم التطبيقية التي تستخدم الإحصاء ، وخاصة في علم النفس ، يُعتبر المستوى الأدنى للدلالة الإحصائية هو المستوى ع = 0.05 ؛ كاف - المستوى ص= 0.01 وأعلى مستوى ع = 0.001. لذلك ، في الجداول الإحصائية الواردة في ملحق الكتب المدرسية حول الإحصاء ، عادةً ما تُعطى القيم الجدولية للمستويات ع = 0,05, ع = 0.01 و ص= 0.001. في بعض الأحيان يتم إعطاء القيم الجدولية للمستويات ص - 0.025 و ع = 0,005.

القيم 0.05 و 0.01 و 0.001 هي ما يسمى بالمستويات المعيارية ذات الأهمية الإحصائية. في التحليل الإحصائي للبيانات التجريبية ، يجب على عالم النفس ، اعتمادًا على أهداف الدراسة وفرضياتها ، اختيار مستوى الأهمية المطلوب. كما ترى ، هنا القيمة الأكبر ، أو الحد الأدنى لمستوى الدلالة الإحصائية ، هو 0.05 - وهذا يعني أنه يُسمح بخمسة أخطاء في عينة من مائة عنصر (حالات ، موضوعات) أو خطأ واحد من عشرين عنصرًا (حالات ، مواضيع). يُعتقد أنه لا ست ولا سبع مرات ولا أكثر من مائة ، يمكننا أن نخطئ. تكلفة مثل هذه الأخطاء ستكون باهظة للغاية.

لاحظ أنه في حزم البرامج الإحصائية الحديثة على أجهزة الكمبيوتر ، لا يتم استخدام مستويات الأهمية القياسية ، ولكن يتم حساب المستويات مباشرة في عملية العمل بالطريقة الإحصائية المقابلة. هذه المستويات ، يشار إليها بالحرف R ،يمكن أن يكون لها تعبير رقمي مختلف في النطاق من 0 إلى 1 ، على سبيل المثال ، ع = 0,7, ص= 0.23 أو ص= 0.012. من الواضح أنه في الحالتين الأوليين ، تكون مستويات الأهمية التي تم الحصول عليها مرتفعة للغاية ومن المستحيل القول أن النتيجة مهمة. في الوقت نفسه ، في الحالة الأخيرة ، كانت النتائج مهمة على مستوى 12 جزءًا من الألف. هذا مستوى صالح.

قاعدة قبول الاستنتاج الإحصائي هي كما يلي: على أساس البيانات التجريبية التي تم الحصول عليها ، يحسب عالم النفس ما يسمى بالإحصاءات التجريبية ، أو القيمة التجريبية ، باستخدام الطريقة الإحصائية التي اختارها. من الملائم الإشارة إلى هذه القيمة على أنها ح إمبراطورية . ثم الإحصاءات التجريبية ح إمبراطورية مقارنة بقيمتين حرجتين تتوافقان مع مستويات الأهمية البالغة 5٪ و 1٪ للطريقة الإحصائية المختارة والتي يشار إليها على أنها ح كرونة . كميات ح كرونة تم العثور عليها لطريقة إحصائية معينة وفقًا للجداول المقابلة الواردة في ملحق أي كتاب مدرسي عن الإحصاء. هذه الكميات ، كقاعدة عامة ، مختلفة دائمًا ، وللتيسير ، يمكن الإشارة إليها أيضًا باسم ح cr1و ح كرون 2 . تم العثور على القيم الحرجة من الجداول ح cr1و ح كرون 2من الملائم التمثيل في الترميز القياسي التالي:

نؤكد ، مع ذلك ، أننا استخدمنا الترميز ح إمبراطورية و ح كرونة كاختصار لكلمة "رقم". في جميع الطرق الإحصائية ، يتم قبول تسمياتها الرمزية لجميع هذه الكميات: كل من القيمة التجريبية المحسوبة بالطريقة الإحصائية المقابلة ، والقيم الحرجة التي تم العثور عليها من الجداول المقابلة. على سبيل المثال ، عند حساب معامل ارتباط رتبة سبيرمان من جدول القيم الحرجة لهذا المعامل ، تم العثور على القيم التالية للقيم الحرجة ، والتي يُشار إليها في هذه الطريقة بالحرف اليوناني ρ ("ro") . وذلك ل ع =تم العثور على قيمة 0.05 وفقًا للجدول ρ كرونة 1 = 0.61 ومن أجل ع =قيمة 0.01 ρ كرونة 2 = 0,76.

في الترميز القياسي المعتمد أدناه ، يبدو كما يلي:

نحتاج الآن إلى مقارنة القيمة التجريبية مع القيمتين الحرجتين الموجودتين في الجداول. وأفضل طريقة للقيام بذلك هي وضع جميع الأرقام الثلاثة على ما يسمى "محور الأهمية". "محور الأهمية" هو خط مستقيم ، في نهايته اليسرى تساوي 0 ، على الرغم من أنه ، كقاعدة عامة ، لم يتم تحديده على هذا الخط المستقيم نفسه ، وتزداد سلسلة الأرقام من اليسار إلى اليمين. في الواقع ، هذا هو المحور السيني المعتاد للمدرسة أوهنظام الإحداثيات الديكارتية. ومع ذلك ، فإن خصوصية هذا المحور هي أنه يتم تمييز ثلاثة أقسام ، "مناطق". تسمى منطقة متطرفة واحدة منطقة عدم الأهمية ، وتسمى المنطقة المتطرفة الثانية منطقة الأهمية ، وتسمى المنطقة الوسيطة منطقة عدم اليقين. حدود المناطق الثلاث هي ح cr1إلى عن على ع = 0.05 و ح كرون 2 إلى عن على ع = 0.01 ، كما هو موضح في الشكل.

اعتمادًا على قاعدة القرار (قاعدة الاستدلال) المنصوص عليها في هذه الطريقة الإحصائية ، هناك خياران ممكنان.

الخيار 1: يتم قبول الفرضية البديلة إذا ح إمبراطوريةح كرونة .

أو الخيار الثاني: يتم قبول الفرضية البديلة إذا ح إمبراطوريةح كرونة .

محسوب ح إمبراطورية وفقًا لبعض الأساليب الإحصائية ، يجب أن يقع بالضرورة في إحدى المناطق الثلاث.

إذا كانت القيمة التجريبية تقع في منطقة عدم الأهمية ، يتم قبول الفرضية H 0 حول عدم وجود اختلافات.

اذا كان ح إمبراطورية في منطقة الأهمية ، تم قبول الفرضية البديلة H 1 حول هناك اختلافات ، والفرضية H 0 مرفوضة.

اذا كان ح إمبراطورية يقع في منطقة عدم اليقين ، ويواجه الباحث معضلة. لذلك ، اعتمادًا على أهمية المشكلة التي يتم حلها ، يمكنه اعتبار التقدير الإحصائي الذي تم الحصول عليه موثوقًا عند مستوى 5 ٪ ، وبالتالي قبول الفرضية H 1 ، ورفض الفرضية H 0 , أو - لا يمكن الاعتماد عليها عند مستوى 1٪ ، وبالتالي قبول الفرضية H 0. ومع ذلك ، نؤكد أن هذا هو الحال تمامًا عندما يمكن لطبيب نفساني ارتكاب أخطاء من النوع الأول أو الثاني. كما نوقش أعلاه ، من الأفضل في هذه الظروف زيادة حجم العينة.

كما نؤكد أن القيمة ح إمبراطورية يمكن أن تتطابق تمامًا أيضًا ح cr1أو ح كرون 2 . في الحالة الأولى ، يمكننا أن نفترض أن التقدير موثوق تمامًا عند مستوى 5٪ وقبول الفرضية H 1 ، أو على العكس ، نقبل الفرضية H 0. في الحالة الثانية ، كقاعدة عامة ، يتم قبول الفرضية البديلة H 1 حول وجود الاختلافات ، ويتم رفض الفرضية H 0.

مفهوم الدلالة الإحصائية

الصلاحية الإحصائية ضرورية في ممارسة الحساب للجنة الاتصالات الفيدرالية. لوحظ سابقًا أنه يمكن اختيار العديد من العينات من نفس السكان:

إذا تم اختيارهم بشكل صحيح ، فإن متوسط ​​مؤشراتهم ومؤشراتهم تختلف قليلاً عن بعضها البعض في حجم خطأ التمثيل ، مع مراعاة الموثوقية المقبولة ؛

إذا تم اختيارهم من مجموعات سكانية مختلفة ، فسيكون الفرق بينهم كبيرًا. تعتبر المقارنة بين العينات شائعة في الإحصاء ؛

إذا كانوا يختلفون بشكل ضئيل ، غير مهم ، غير مهم ، أي أنهم ينتمون في الواقع إلى نفس عامة السكان ، فإن الفرق بينهما يسمى غير موثوق به إحصائيًا.

ذات دلالة إحصائيةاختلاف العينة هو عينة تختلف اختلافًا كبيرًا وأساسيًا ، أي تنتمي إلى مجموعات سكانية مختلفة.

في لجنة الاتصالات الفيدرالية (FCC) ، فإن تقييم الأهمية الإحصائية للاختلافات في العينة يعني حل العديد من المشكلات العملية. على سبيل المثال ، يرتبط إدخال طرق تدريس وبرامج ومجموعات من التمارين والاختبارات وتمارين التحكم الجديدة بالتحقق التجريبي منها ، والذي يجب أن يُظهر أن مجموعة الاختبار تختلف اختلافًا جوهريًا عن المجموعة الضابطة. لذلك ، يتم استخدام طرق إحصائية خاصة تسمى معايير الدلالة الإحصائية ،السماح باكتشاف وجود أو عدم وجود فرق ذي دلالة إحصائية بين العينات.

تنقسم جميع المعايير إلى مجموعتين: حدودي وغير حدودي. المعايير البارامتريةتنص على الوجود الإلزامي لقانون التوزيع العادي ، أي يشير هذا إلى التحديد الإلزامي للمؤشرات الرئيسية للقانون العادي - المتوسط ​​الحسابي Xوالانحراف المعياري عنه. المعايير البارامترية هي الأكثر دقة وصحة. الاختبارات اللامعلميةتستند إلى اختلافات الترتيب (الترتيبي) بين عناصر العينات.

فيما يلي معايير الأهمية الإحصائية الرئيسية المستخدمة في ممارسة لجنة الاتصالات الفيدرالية: اختبار الطالب ، واختبار فيشر ، واختبار ويلكوكسون ، واختبار وايت ، واختبار فان دير وايردن (اختبار الإشارة).

معيار الطالبسميت على اسم العالم الإنجليزي C. Gosset (الطالب هو اسم مستعار) ، الذي اكتشف هذه الطريقة. معيار الطالب هو حدوديتستخدم لمقارنة القيم المطلقة للعينات. قد تختلف العينات في الحجم.

يتم تعريف معيار الطالب على النحو التالي.

1. ابحث عن معيار الطالب روفق الصيغة التالية:

أين الحادي عشر× 2 - المتوسط ​​الحسابي للعينات المقارنة ؛ / i b w 2 - أخطاء التمثيل التي تم تحديدها على أساس مؤشرات العينات المقارنة.

2. أظهرت الممارسة في لجنة الاتصالات الفيدرالية (FCC) أنه بالنسبة للعمل الرياضي يكفي قبول موثوقية النتيجة ص= 0,95.

63 لمصداقية الحساب: ف = 0.95 (أ = 0.05) مع عدد الدرجات ؛ الحريه ك= «! + ن 2 - 2 وفقًا لجدول التطبيق 4 نجد القيمة \ حسنًا ، القيمة الحدية للمعيار (^ غرام).

3. بناءً على خصائص قانون التوزيع العادي ، يتم إجراء مقارنة في اختبار الطالب رو ر ^.

4. استخلاص النتائج:

اذا كان ر> ftp ، فإن الاختلاف بين العينات التي تمت مقارنتها له دلالة إحصائية ؛

اذا كان ر< 7 F ، فإن الفرق ليس ذا دلالة إحصائية.

بالنسبة للباحثين في مجال FCC ، فإن تقييم الأهمية الإحصائية هو الخطوة الأولى في حل مشكلة معينة: تختلف اختلافًا جوهريًا أو غير أساسي بين ؛ عينات مماثلة. الخطوة التالية هي ؛ تقييم هذا الاختلاف من وجهة نظر تربوية ، والتي تحددها حالة المشكلة.

دلالة إحصائية

يتم استدعاء النتائج التي تم الحصول عليها باستخدام إجراء بحث معين ذات دلالة إحصائيةإذا كان احتمال حدوثها العشوائي صغيرًا جدًا. يمكن توضيح هذا المفهوم من خلال مثال رمي عملة معدنية. لنفترض أنه تم قلب عملة معدنية 30 مرة ؛ ظهرت 17 مرة في الرؤوس و 13 مرة في ذيول. فعلا ذو معنىهل هذا انحراف عن النتيجة المتوقعة (15 رأساً و 15 ذيلاً) أم ​​أنها مصادفة؟ للإجابة على هذا السؤال ، يمكنك ، على سبيل المثال ، رمي العملة نفسها عدة مرات 30 مرة متتالية ، وفي نفس الوقت تدوين عدد المرات التي تتكرر فيها نسبة الرأس وذيول ، التي تساوي 17:13. التحليل الإحصائي ينقذنا من هذه العملية الشاقة. بمساعدتها ، بعد أول 30 رمية للعملة ، من الممكن تقدير العدد المحتمل للتكرار العشوائي لـ 17 رأساً و 13 ذيلاً. يسمى هذا التقدير بيان احتمالي.

في الأدبيات العلمية حول علم النفس الصناعي التنظيمي ، يتم الإشارة إلى بيان احتمالي في شكل رياضي بواسطة التعبير ص(احتمالا)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (ر< 0.01). هذه الحقيقة مهمة لفهم الأدبيات ، ولكن لا ينبغي أن تؤخذ على أنها تعني أنه من غير المجدي تقديم ملاحظات لا تفي بهذه المعايير. ما يسمى نتائج البحث غير الهامة (الملاحظات التي يمكن الحصول عليها بالصدفة أكثرمرة أو خمس مرات من 100) يمكن أن تكون مفيدة جدًا لتحديد الاتجاهات وكدليل للبحث في المستقبل.

وتجدر الإشارة أيضًا إلى أنه لا يتفق جميع علماء النفس مع المعايير والإجراءات التقليدية (مثل Cohen، 1994؛ Sauley & Bedeian، 1989). تعتبر قضايا القياس في حد ذاتها محورًا رئيسيًا للعمل للعديد من الباحثين الذين يدرسون دقة طرق القياس والافتراضات التي تكمن وراء الأساليب والمعايير الحالية ، بالإضافة إلى تطوير أدوية وأدوات جديدة. ربما في وقت ما في المستقبل ، سيؤدي البحث في هذه القوة إلى تغيير في المعايير التقليدية لتقييم الأهمية الإحصائية ، وستحظى هذه التغييرات بقبول عالمي. (يجمع الفصل الخامس من جمعية علم النفس الأمريكية علماء النفس المتخصصين في دراسة التقييمات والقياسات والإحصاءات.)

في التقارير البحثية ، بيان احتمالي مثل ص< 0.05 ، ويرجع ذلك إلى بعض الإحصاءأي رقم يتم الحصول عليه نتيجة لمجموعة معينة من الإجراءات الحسابية الرياضية. يتم الحصول على تأكيد احتمالي من خلال مقارنة هذه الإحصائيات مع البيانات من الجداول الخاصة التي يتم نشرها لهذا الغرض. في البحث النفسي الصناعي التنظيمي ، الإحصائيات مثل r ، F ، t ، r>(اقرأ "مربع تشي") و ص(اقرأ "متعددة R ").في كل حالة ، يمكن مقارنة الإحصائيات (رقم واحد) التي تم الحصول عليها من تحليل سلسلة من الملاحظات مع الأرقام من الجدول المنشور. بعد ذلك ، من الممكن صياغة بيان احتمالي حول احتمال الحصول على هذا الرقم بشكل عشوائي ، أي لاستخلاص استنتاج حول أهمية الملاحظات.

لفهم الدراسات الموصوفة في هذا الكتاب ، يكفي أن يكون لديك فهم واضح لمفهوم الأهمية الإحصائية وليس بالضرورة معرفة كيفية حساب الإحصائيات المذكورة أعلاه. ومع ذلك ، سيكون من المفيد مناقشة افتراض واحد تكمن وراء كل هذه الإجراءات. هذا هو الافتراض بأن جميع المتغيرات المرصودة يتم توزيعها تقريبًا وفقًا للقانون العادي. بالإضافة إلى ذلك ، عند قراءة التقارير حول البحث النفسي الصناعي التنظيمي ، غالبًا ما يكون هناك ثلاثة مفاهيم أخرى تلعب دورًا مهمًا - أولاً ، الارتباط والارتباط ، ثانيًا ، المتغير المحدد / المتنبئ و "ANOVA" (تحليل التباين) ، في ثالثًا ، مجموعة من الأساليب الإحصائية تحت الاسم العام "التحليل التلوي".

فكر في مثال نموذجي لتطبيق الأساليب الإحصائية في الطب. يقترح مبتكرو الدواء أنه يزيد من إدرار البول بما يتناسب مع الجرعة المأخوذة. لاختبار هذا الافتراض ، أعطوا خمسة متطوعين جرعات مختلفة من الدواء.

وفقًا لنتائج الملاحظات ، تم رسم مخطط لإدرار البول مقابل الجرعة (الشكل 1.2 أ). الاعتماد مرئي للعين المجردة. الباحثون يهنئون بعضهم البعض على هذا الاكتشاف ، ويهنئ العالم على مدرات البول الجديدة.

في الواقع ، تسمح لنا البيانات بأن نقول بشكل موثوق فقط أن اعتماد إدرار البول على الجرعة لوحظ في هؤلاء المتطوعين الخمسة. حقيقة أن هذا الاعتماد سيظهر في جميع الأشخاص الذين سيتعاطون الدواء ليس أكثر من تخمين.
WJ

مع

زيني. لا يمكن القول أنه لا أساس له - وإلا فلماذا التجربة؟

لكن الدواء الآن معروض في السوق. المزيد والمزيد من الناس يأخذونها على أمل زيادة إدرار البول. وماذا نرى؟ نرى الشكل 1.2 ب ، والذي يشير إلى عدم وجود أي علاقة بين جرعة الدواء وإدرار البول. تمثل الدوائر السوداء بيانات من الدراسة الأصلية. الإحصائيات لديها طرق لتقدير احتمالية الحصول على مثل هذه العينة "غير التمثيلية" ، علاوة على أنها مربكة. اتضح أنه في حالة عدم وجود علاقة بين إدرار البول وجرعة الدواء ، فإن "الاعتماد" الناتج سيلاحظ في حوالي 5 تجارب من كل 1000 تجربة. لذلك ، في هذه الحالة ، كان الباحثون محظوظين. حتى لو طبقوا حتى أكثر الأساليب الإحصائية مثالية ، فلن ينقذهم ذلك من الخطأ.

هذا خيالي ، ولكن ليس بعيدًا عن الواقع على الإطلاق ، مثال ، استشهدنا به ليس للإشارة إلى عدم جدوى
الإحصاء. يتحدث عن شيء آخر ، عن الطبيعة الاحتمالية لاستنتاجاتها. نتيجة لتطبيق الطريقة الإحصائية ، لا نحصل على الحقيقة المطلقة ، ولكن فقط تقدير لاحتمال افتراض معين. بالإضافة إلى ذلك ، تعتمد كل طريقة إحصائية على نموذجها الرياضي الخاص ونتائجها صحيحة إلى الحد الذي يتوافق معه هذا النموذج مع الواقع.

المزيد عن الموثوقية والأهمية الإحصائية:

  1. فروق ذات دلالة إحصائية في مؤشرات جودة الحياة
  2. المجموع الإحصائي. علامات الحساب. مفهوم البحث المستمر والانتقائي. متطلبات المجتمع الإحصائي واستخدام وثائق المحاسبة وإعداد التقارير
  3. مقال. دراسة موثوقية قراءات مقياس الضغط لقياس الضغط داخل العين 2018، 2018