السير الذاتية صفات التحليلات

صدق المنهجية ، أنواع صدقها. تحليل الارتباط كإحدى طرق تحديد الموثوقية والصلاحية

يستخدم الشخص طرقًا وأدوات مختلفة لفحص أو قياس نوع من الجودة. يشير مدى قدرة هذه التقنية والأداة على إنتاج نتائج نوعياً إلى صحتها. ماذا يعني هذا المفهوم في علم النفس؟ ما هي أنواع الصلاحية؟ في علم النفس ، هذه الخاصية تنطبق عادة على الاختبارات والأساليب المستخدمة من قبل المتخصصين.

ما هي الصلاحية؟

المفهوم قيد النظر له العديد من التعريفات. ما هي الصلاحية؟ هذا هو مدى ملاءمة وصلاحية تطبيق بعض التقنيات أو ينتج عنه موقف معين. المعنى المطبق لهذه الكلمة هو درجة توافق النتائج والأساليب مع مجموعة المهام.

الصلاحية هي مقياس آخر يقيس الصفات المحددة. وبالتالي ، تهدف التقنية إلى قياس جودة معينة ، مثل الذكاء ، ويجب أن تشير صحتها إلى مدى جودة هذه التقنية في الحصول على النتائج.

بمعنى آخر ، يمكن تسمية الصلاحية بالموثوقية. يقيس تلك الاختبارات والأساليب التي تقيس بعض الصفات النفسية. كلما قاموا بقياس الصفات التي يقيسونها بشكل أفضل ، زادت صحتها.

تصبح الصلاحية مهمة في حالتين:

  1. عندما يتم تطوير تقنية معينة.
  2. عندما تُظهر تقنية معينة النتائج ، فمن الضروري تحديد مدى جودة هذه النتائج.

وبالتالي ، فإن الصلاحية هي خاصية تشير إلى ملاءمة تقنية معينة لقياس بعض الجودة وفائدة وجودة وفعالية هذه التقنية.

عادة ، يتم استخدام عدة أنواع من الصلاحية للتحقق من صحة اختبار أو تقنية معينة. كما يقارن المؤشرات التي توفرها الأدوات المختلفة. هناك طرق عديدة لقياس صفة أو خاصية نفسية معينة. في كثير من الأحيان ، يستخدم علماء النفس الطريقة التي تعطي نتائج أكثر موثوقية. هذا سيظهر صلاحيته العالية.

إلى جانب الصلاحية ، غالبًا ما يتم النظر في مفهوم مثل الموثوقية. يجب أن تكون الأساليب والاختبارات موثوقة ، أي يجب أن تكون ثابتة وموثوقة. يجب أن يتأكد المجرب من أنه يفكر بالضبط في الجودة التي يريد وضعها في الاعتبار. هذا هو السبب في أن الموثوقية قد لا تكون دائمًا صالحة ، ولكن يجب أن تكون الصلاحية دائمًا موثوقة.

الصلاحية في علم النفس

يتم استخدام الصلاحية في العديد من مجالات الحياة ، حيث يتم قياس مؤشرات مختلفة. في علم النفس ، تصبح الصلاحية ضرورية أيضًا ، خاصة في علم النفس التجريبي. الصلاحية في علم النفس هي:

  • ثقة المجرب في أنه يقيس الجودة التي يحتاجها ؛
  • موثوقية المؤشرات التي تقيس هذه الجودة.

إذا كان القارئ قد اجتاز اختبارات نفسية في أي وقت ، فهو يعرف الرغبة الداخلية في الحصول على إجابة محددة للسؤال المطروح. تبين صحة الاختبار للمختبر النتيجة المحددة التي حققها من خلال الاختبار. هذه مهمة محددة ، الإجابة التي يجب أن يتلقاها بعد القيام بجميع الإجراءات اللازمة.

يجب أن تكون الطرق والاختبارات مفيدة وصحيحة ، وتقاس بصلاحيتها.

هناك ثلاث طرق للتحقق من الصلاحية:

  1. تقدير صلاحية المحتوى هو تطابق نتائج تقييم الموضوع مع الصفات الحقيقية التي تظهر في الواقع. هنا يتم استخدام مفهوم مثل صلاحية الوجه - يجب أن يرى الشخص علاقة حقيقية بين محتوى المنهجية نفسها ونتائجها والواقع ، حيث تتجلى الجودة المقاسة.
  2. تقييم صلاحية البناء هو تحديد أن التقنية تحسب البنيات المستندة إلى الأدلة والمحددة مسبقًا. يسمح التحقق المتقارب باستخدام العديد من التقنيات التي تأخذ في الاعتبار خصائص متشابهة وتعطي نتائج أكثر دقة للجودة المدروسة. يستثني التحقق من صحة التمييز التقنيات الأخرى التي تأخذ في الاعتبار الصفات التي لا ترتبط بالجودة المرغوبة.
  3. تقييم صلاحية المعيار هو تطابق النتائج مع المؤشرات المتوقعة ، والتي يتم الكشف عنها بطرق أخرى. هنا يتم استخدام الصلاحية التنبؤية ، مما يساعد على التنبؤ بالسلوك المستقبلي.

أنواع الصلاحية

هناك عدة أنواع من الصلاحية ، والتي سنناقشها أدناه:

  1. الصلاحية الخارجية هي تعميم لاستنتاج الحالة ، والسكان ، والمتغيرات المستقلة. وهي مقسمة إلى:
  • الصلاحية التشغيلية.
  • بناء الصلاحية - شرح لسلوك الشخص في وقت اجتياز الاختبار.
  1. الصلاحية الداخلية - التغيير أثناء التجربة تحت تأثير العوامل غير المتغيرة.
  2. الصلاحية التفاضلية.
  3. الصلاحية المتزايدة.
  4. الصلاحية البيئية هي مؤشر على أن الشخص قادر على القيام بأعمال مختلفة قد تكون ناجحة في موقف ما ، ولكن ليس في موقف آخر.

يستخدم هذا التصنيف من قبل علم النفس التجريبي. يستخدم علم النفس التنظيمي والتشخيص النفسي تصنيفًا مختلفًا:

  1. بناء صلاحية. وهي مقسمة إلى:
  • صحة متقاربة.
  • صلاحية متباينة.
  1. صحة المعايير (التجريبية) - حساب الارتباط حسب الدرجة في اختبار المعلمة الخارجية التي تم اختيارها كمؤشر صالح. وهي مقسمة إلى:
  • الصلاحية الحالية - دراسة المعلمة في الوقت الحاضر.
  • الصلاحية بأثر رجعي - حالة أو حدث حدث في الماضي.
  • الصلاحية التنبؤية - التنبؤ بالسلوك والجودة.
  1. صلاحية المحتوى - تُستخدم في التجارب حيث يتم أخذ بعض التفاعل والنشاط في الاعتبار. لها نوع فرعي:
  • صدق واضح.

أنواع أخرى من الصلاحية هي:

  • بداهة.
  • تتطابق.
  • متعلق ب.
  • بناء.
  • إجماع.
  • عاملي.
  • النظرية ، إلخ.

ما هو اختبار الصلاحية؟

يتم اختبار الكثير من الناس. هناك اختبارات نفسية خاصة يستخدمها علماء النفس ، واختبارات صحفية أخرى. ما هي صحة الاختبار وما هو معياره المهم؟ هذا مؤشر على تطابق خاصية وجودة وخاصية للاختبار الذي يقيسها.

الاختبارات مختلفة. يتم استخدامها لقياس المعلمات النفسية الفسيولوجية للشخص. أعلى صلاحية تبقى 80٪. تصبح فائدة استخدام الاختبارات عندما تسمح لك بالحصول على بيانات دقيقة حول خصائص معينة. هناك عدة طرق لدراسة صلاحية الاختبار:

  1. الصلاحية البناءة ، والتي تسمح لك بدراسة أعمق لصفات الشخص في موقف أو نشاط أو نظام.
  2. الصلاحية بالمعيار - دراسة المعلمة في الوقت الحاضر والتنبؤ بها في المستقبل.
  3. صحة المحتوى هي مراسلات التركيبات النفسية وتنوعها.
  4. الصلاحية التنبؤية - تتنبأ بتطوير جودة معينة في المستقبل ، وهو أمر صعب لأنه يمكن أن يتطور بشكل مختلف في الأشخاص المختلفين.

حتى يتم تحديد موثوقية وصلاحية الاختبار ، لا يتم استخدامه في الممارسة النفسية. يعتمد الكثير على المناطق التي يتم فيها تطبيق الاختبارات. هناك اختبارات تعليمية ومهنية وغيرها يتم استخدامها في المؤسسات الفردية للتنبؤ بخصائص المتقدمين وتحديدها.

في موقع المساعدة النفسية ، يمكنك أيضًا إجراء اختبارات لها بالفعل صلاحية عالية وتظهر نتائج موثوقة.

ما هي صلاحية الطريقة؟

ما هي صلاحية الطريقة؟ هذا مؤشر يشير إلى ما إذا كانت التقنية قيد الدراسة تدرس الجودة والسمات المخصصة لها. في الوقت نفسه ، يتم التركيز على حقيقة أن الموضوع الذي يتم اختباره قد يرى نفسه ويميز نفسه بشكل مختلف. هذا هو السبب في أن النتائج لا تأخذ دائمًا في الاعتبار رأي الأشخاص الذين قد لا يلاحظون خصائص معينة في أنفسهم.

المصادقة هي التحقق من صحة المنهجية. لتحديد الفعالية والكفاءة والتطبيق العملي للمنهجية المستخدمة ، يتم استخدام مؤشر خارجي مستقل - وهي الجودة التي يتم ملاحظتها في الحياة اليومية. هناك 4 أنواع من المؤشرات الخارجية:

  1. معيار الأداء هو الوقت المستغرق ، وكمية العمل ، ومستوى الأداء الأكاديمي ، ونمو المهارات المهنية ، وما إلى ذلك.
  2. المعايير الذاتية - الرأي ، الآراء ، التفضيل ، موقف الموضوع تجاه شخص ما أو شيء ما. تستخدم الاستبيانات والمقابلات والاستبيانات هنا.
  3. المعايير الفسيولوجية - تأثير العالم الخارجي على النفس والجسم البشري. يقيس النبض ومعدل التنفس وأعراض التعب وما إلى ذلك.
  4. معيار العشوائية - هل من الممكن ، على سبيل المثال ، اختيار الأشخاص غير المعرضين للحوادث؟ دراسة تأثير حالة معينة.

يتيح لنا النهج النظري في قياس صحة الأساليب التعرف على ما إذا كانت التكنولوجيا تدرس حقًا الجودة التي تم تصميمها من أجلها.

يتم تحديد الصلاحية أيضًا من خلال حدوث الجودة المدروسة. من الجيد أن تكون شائعة ، مما يجعل التقنية ضرورية ومفيدة. التغييرات الأخلاقية والثقافية في المجتمع تصبح مهمة أيضًا.

حصيلة

في الممارسة النفسية ، غالبًا ما تُستخدم الاختبارات والتقنيات للمساعدة في دراسة شخصية الشخص. نحن هنا نتحدث بشكل خاص عن المعايير الداخلية غير المرئية للعين. صفات الشخصية والسلوك والتنبؤ المحتمل للمستقبل وما سيكون عليه الشخص وما ستكون حياته - كل هذا يتم دراسته من خلال العديد من الاختبارات والأساليب التي تتبع نتيجة واحدة - دراسة الشخص.

نتيجة التحديد الناجح لصلاحية أداة معينة هي المعرفة الناجحة لكل شخص ، بغض النظر عن كيفية نظره إلى نفسه. غالبًا لا يلاحظ الناس صفات معينة في أنفسهم ، ونادرًا ما ينظرون إلى أنفسهم بنظرة رصينة. تسمح لك الاختبارات والتقنيات بالكشف عن المعلمات الفردية.

توقع الاختبارات والطرق الصحيحة هو معرفة سريعة وعالية الجودة لشخص آخر مع القدرة على مساعدته في حل أي مشكلة نفسية. لم يتحقق ذلك قريبًا ، لكن الأدوات المتاحة أظهرت فعاليتها بالفعل. عادةً ما يكون هذا السؤال مهمًا فقط لأولئك الأشخاص الذين يشاركون في تحديد جودة الاختبارات والأساليب. ومع ذلك ، سيكون من المفيد أيضًا للأشخاص العاديين معرفة التمارين التي يجب الوثوق بها وأيها لا يجب الوثوق به.

رقم التذكرة 9

استبيانات الدوافع وخصائصها.

استبيانات الدوافع - مجموعة من الاستبيانات المصممة لتشخيص مجال الحاجة التحفيزية للشخص ، والتي تسمح لك بتحديد ما هو نشاط الفرد الموجه إليه (الدوافع كأسباب تحدد اختيار اتجاه السلوك). بالإضافة إلى ذلك ، فإن مسألة كيفية تنظيم ديناميكيات السلوك لها أهمية كبيرة. في هذه الحالة ، غالبًا ما يلجأ المرء إلى قياس المواقف. يرتبط تطوير استبيانات الدوافع في التشخيص النفسي إلى حد كبير بالحاجة إلى تقييم تأثير عامل "الرغبة الاجتماعية" ، والذي له طبيعة سلوكية ويقلل من موثوقية البيانات التي تم الحصول عليها باستخدام استبيانات الشخصية. تشمل أشهر استبيانات الدوافع "قائمة التفضيلات الشخصية" التي طورها أ. إدواردز (1954) ، وهي مصممة لقياس "قوة" الاحتياجات المستعارة من القائمة التي اقترحها جي موراي لاختبار الإدراك الموضوعي. تشمل هذه الاحتياجات ، على سبيل المثال ، الحاجة إلى النجاح ، والاحترام ، والقيادة ، وما إلى ذلك. يتم التعبير عن "قوة" كل حاجة ليس بعبارات مطلقة ، ولكن بالنسبة إلى "قوة" الاحتياجات الأخرى ، أي يتم استخدام المؤشرات الشخصية. لدراسة دور عامل "الرغبة الاجتماعية" ، اقترح أ. إدواردز (1957) استبيانًا خاصًا. تُستخدم أيضًا استبيانات أخرى للدوافع على نطاق واسع ، على سبيل المثال ، نموذج دراسة شخصية د. جاكسون (1967) ، استبيانات أ. مهرابيان (1970) ، إلخ.

بعد الموثوقية ، هناك معيار رئيسي آخر لتقييم جودة الأساليب وهو الصلاحية. يتم تحديد مسألة صحة المنهجية فقط بعد إثبات موثوقيتها الكافية ، حيث لا يمكن أن تكون المنهجية غير الموثوقة صالحة. لكن الأسلوب الأكثر موثوقية دون معرفة صلاحيتها هو عملياً عديم الفائدة.

وتجدر الإشارة إلى أن مسألة الصلاحية تبدو حتى وقت قريب من أكثر القضايا صعوبة. إن التعريف الأكثر جذرًا لهذا المفهوم هو ذلك الوارد في كتاب A. Anastasi: "صحة الاختبار هي مفهوم يخبرنا بما يقيسه الاختبار ومدى نجاحه."

لهذا السبب ، لا يوجد نهج عالمي واحد لتحديد الصلاحية. اعتمادًا على جانب الصلاحية الذي يريد الباحث مراعاته ، يتم أيضًا استخدام طرق مختلفة للإثبات. بعبارة أخرى ، يشمل مفهوم الصلاحية أنواعه المختلفة التي لها معانيها الخاصة. التحقق من صحة تقنية ما يسمى التحقق من الصحة.



ترتبط الصلاحية بمعناها الأول بالمنهجية نفسها ، أي صلاحية أداة القياس. هذا الفحص يسمى التحقق النظري. لا تشير الصلاحية بالمعنى الثاني بالفعل إلى المنهجية بقدر ما تشير إلى الغرض من استخدامها. هذا هو التحقق الواقعي.

بإيجاز ، يمكننا أن نقول ما يلي:

في التحقق النظري ، يهتم الباحث بالخاصية التي يتم قياسها بواسطة التقنية. هذا ، في جوهره ، يعني أن التحقق النفسي الفعلي يتم تنفيذه ؛

مع التحقق الواقعي ، يكون جوهر موضوع القياس (الخاصية النفسية) بعيدًا عن الأنظار. ينصب التركيز الرئيسي على إثبات أن شيئًا ما يتم قياسه بالمنهجية له صلة بمجالات معينة من الممارسة.

إن إجراء التحقق النظري ، على عكس التحقق الواقعي ، يكون أحيانًا أكثر صعوبة. دون الخوض في تفاصيل محددة في الوقت الحالي ، دعنا نتحدث بعبارات عامة عن كيفية التحقق من الصلاحية الواقعية: يتم اختيار بعض المعايير الخارجية المستقلة عن المنهجية التي تحدد النجاح في نشاط معين (تعليمي ، مهني ، إلخ) ، ومعها تتم مقارنة نتائج تقنية التشخيص. إذا تم التعرف على العلاقة بينهما على أنها مرضية ، فسيتم التوصل إلى استنتاج حول الأهمية العملية والكفاءة والفعالية لتقنية التشخيص.

لتحديد الصلاحية النظرية ، من الصعب العثور على أي معيار مستقل يقع خارج المنهجية. لذلك ، في المراحل الأولى من تطور علم الخصية ، عندما كان مفهوم الصلاحية يتشكل للتو ، كانت هناك فكرة بديهية مفادها أن الاختبار يقيس:

1) سميت التقنية بأنها صالحة ، لأن ما تقيسه واضح بكل بساطة ؛

2) استند إثبات الصحة إلى ثقة الباحث في أن طريقته تجعل من الممكن فهم الموضوع ؛

3) تم اعتبار المنهجية صحيحة (أي ، تم قبول البيان بأن كذا وكذا اختبار يقيس كذا وكذا الجودة) فقط لأن النظرية التي بنيت على أساسها المنهجية جيدة جدًا.

لا يمكن أن يستمر قبول الادعاءات حول صحة المنهجية على أساس الإيمان لفترة طويلة. فضحت المظاهر الأولى للنقد العلمي حقًا هذا النهج: بدأ البحث عن أدلة سليمة علميًا.

وبالتالي ، فإن إجراء التحقق النظري لمنهجية ما هو إثبات أن المنهجية تقيس الخاصية بالضبط ، والجودة التي يجب قياسها وفقًا لنية الباحث.

لذلك ، على سبيل المثال ، إذا تم تطوير اختبار من أجل تشخيص التطور العقلي للأطفال ، فمن الضروري تحليل ما إذا كان يقيس هذا التطور حقًا ، وليس بعض الميزات الأخرى (على سبيل المثال ، الشخصية ، الشخصية ، إلخ). وبالتالي ، من أجل التحقق النظري ، فإن المشكلة الأساسية هي العلاقة بين الظواهر النفسية ومؤشراتها ، والتي من خلالها تحاول هذه الظواهر النفسية أن تعرف. يوضح هذا مدى توافق نية المؤلف ونتائج المنهجية.

ليس من الصعب للغاية التحقق من صحة طريقة جديدة نظريًا إذا كانت هناك بالفعل طريقة مثبتة صلاحيتها لقياس خاصية معينة. يشير وجود ارتباط بين الطريقة الجديدة والمماثلة التي تم اختبارها بالفعل إلى أن الطريقة المطورة تقيس نفس الجودة النفسية مثل الطريقة المرجعية. وإذا تبين أن الطريقة الجديدة في نفس الوقت أكثر إحكاما واقتصادية في تنفيذ النتائج ومعالجتها ، فإن التشخيص النفسي يحصل على فرصة لاستخدام الأداة الجديدة بدلاً من الأداة القديمة.

ولكن تم إثبات الصلاحية النظرية ليس فقط من خلال المقارنة مع المؤشرات ذات الصلة ، ولكن أيضًا مع تلك التي ، بناءً على الفرضية ، لا ينبغي أن تكون هناك علاقات ذات دلالة. وبالتالي ، لاختبار الصلاحية النظرية ، من المهم ، من ناحية ، تحديد درجة الارتباط بتقنية ذات صلة (الصلاحية المتقاربة) وغياب هذه العلاقة بالطرق التي لها أساس نظري مختلف (الصلاحية التمييزية).

يكون إجراء التحقق النظري للطريقة أكثر صعوبة عندما تكون طريقة التحقق هذه مستحيلة. في أغلب الأحيان ، هذا هو الموقف الذي يواجهه الباحث. في مثل هذه الظروف ، فإن التراكم التدريجي للمعلومات المختلفة حول العقار قيد الدراسة ، وتحليل المقدمات النظرية والبيانات التجريبية ، والخبرة الكبيرة في التعامل مع التقنية تجعل من الممكن الكشف عن معناها النفسي.

دور مهم في فهم ماهية مقاييس المنهجية تلعبه مقارنة مؤشراتها بالأشكال العملية للنشاط. ولكن من المهم بشكل خاص هنا أن يتم وضع المنهجية بدقة من الناحية النظرية ، أي أن يكون هناك أساس علمي متين وراسخ. بعد ذلك ، عند مقارنة المنهجية بمعيار خارجي مأخوذ من الممارسة اليومية ، بما يتوافق مع ما تقيسه ، يمكن الحصول على معلومات تعزز الأفكار النظرية حول جوهرها.

من المهم أن نتذكر أنه إذا تم إثبات الصلاحية النظرية ، فإن تفسير المؤشرات التي تم الحصول عليها يصبح أكثر وضوحًا ولا لبس فيه ، ويتوافق اسم المنهجية مع نطاق تطبيقها. أما بالنسبة للتحقق العملي ، فإنه يعني اختبار المنهجية من حيث فعاليتها العملية ، وأهميتها ، وفائدتها ، لأنه من المنطقي استخدام تقنية تشخيصية فقط عندما يتم إثبات أن الخاصية التي يتم قياسها تتجلى في مواقف حياتية معينة ، في أنواع معينة من النشاط. يتم إعطاء أهمية كبيرة ، خاصة عندما تنشأ مسألة الاختيار.

إذا عدنا مرة أخرى إلى تاريخ تطور علم الخصية ، فيمكننا التمييز بين فترة (20-30 من القرن العشرين) كان فيها المحتوى العلمي للاختبارات وأمتعتهم النظرية أقل أهمية. كان من المهم أن نجح الاختبار وساعد في تحديد الأشخاص الأكثر استعدادًا بسرعة. يعتبر المعيار التجريبي لتقييم عناصر الاختبار هو الدليل الحقيقي الوحيد في حل المشكلات العلمية والتطبيقية.

غالبًا ما أدى استخدام طرق التشخيص ذات التبرير التجريبي البحت ، دون أساس نظري واضح ، إلى استنتاجات علمية زائفة وتوصيات عملية غير مبررة. كان من المستحيل تحديد تلك الميزات بدقة ، الصفات التي كشفت عنها الاختبارات. في الأساس ، كانت محاكمات عمياء.

كان هذا النهج لمشكلة صلاحية الاختبار نموذجيًا حتى أوائل الخمسينيات من القرن الماضي. القرن ال 20 ليس فقط في الولايات المتحدة ، ولكن أيضًا في بلدان أخرى. لا يمكن للضعف النظري لأساليب التحقق التجريبية إلا أن يسبب انتقادات من هؤلاء العلماء الذين طالبوا ، أثناء تطوير الاختبارات ، بالاعتماد ليس فقط على التجريبية والممارسة ، ولكن أيضًا على المفهوم النظري. الممارسة بدون نظرية عمياء ، والنظرية بدون ممارسة ميتة. حاليًا ، يُنظر إلى التقييم النظري والعملي لصحة الأساليب على أنه الأكثر إنتاجية.

لإجراء التحقق العملي من المنهجية ، أي لتقييم فعاليتها وكفاءتها وأهميتها العملية ، يتم عادةً استخدام معيار خارجي مستقل - وهو مؤشر على مظاهر الخاصية المدروسة في الحياة اليومية. يمكن أن يكون هذا المعيار هو الأداء الأكاديمي (لاختبارات القدرة على التعلم ، واختبارات التحصيل ، واختبارات الذكاء) ، وإنجازات الإنتاج (لأساليب التوجيه المهني) ، وفعالية النشاط الحقيقي - الرسم ، والنمذجة ، وما إلى ذلك (لاختبارات القدرات الخاصة) ، التقييمات الذاتية (لاختبارات الشخصية).

يميز الباحثان الأمريكيان د. تيفين وإي ماكورميك ، بعد تحليل المعايير الخارجية المستخدمة لإثبات الصدق ، أربعة أنواع منها [وفقًا لـ 31):

1) معايير الأداء (قد تشمل مثل مقدار العمل المنجز ، والأداء الأكاديمي ، والوقت الذي يقضيه في التدريب ، ومعدل نمو المؤهلات ، وما إلى ذلك) ؛

2) المعايير الذاتية (تشمل أنواعًا مختلفة من الإجابات التي تعكس موقف الشخص تجاه شيء ما أو شخص ما ، ورأيه ، وآرائه ، وتفضيلاته ؛ وعادة ما يتم الحصول على المعايير الشخصية من خلال المقابلات والاستبيانات والاستبيانات) ؛

3) المعايير الفسيولوجية (تُستخدم في دراسة تأثير البيئة والمتغيرات الظرفية الأخرى على جسم الإنسان والنفسية ؛ يتم قياس معدل النبض وضغط الدم ومقاومة الجلد الكهربائية وأعراض التعب وما إلى ذلك) ؛

4) معايير العشوائية (تُطبق عندما يتعلق الغرض من الدراسة ، على سبيل المثال ، بمشكلة اختيار الأشخاص الأقل عرضة للحوادث للعمل).

يجب أن يستوفي المعيار الخارجي ثلاثة متطلبات أساسية:

يجب أن تكون ذات صلة ؛

خالية من التدخل

موثوق بها.

تشير الصلة إلى المراسلات الدلالية لأداة تشخيصية مع معيار حيوي مستقل. بعبارة أخرى ، يجب أن تكون هناك ثقة في أن المعايير تشمل على وجه التحديد تلك السمات الخاصة بالنفسية الفردية التي يتم قياسها أيضًا بواسطة تقنية التشخيص. يجب أن يكون المعيار الخارجي وأسلوب التشخيص في المراسلات الدلالية الداخلية مع بعضهما البعض ، وأن يكونا متجانسين نوعياً في الجوهر النفسي. إذا كان الاختبار ، على سبيل المثال ، يقيس الخصائص الفردية للتفكير ، والقدرة على أداء أفعال منطقية بأشياء ومفاهيم معينة ، فعندئذ في المعيار ينبغي على المرء أن يبحث عن مظهر من مظاهر هذه المهارات على وجه التحديد. هذا ينطبق بالتساوي على الأنشطة المهنية. ليس له هدف واحد ، بل عدة أهداف ومهام ، كل منها محدد ويفرض شروطه الخاصة للتنفيذ. هذا يعني وجود عدة معايير لأداء الأنشطة المهنية. لذلك ، لا ينبغي مقارنة نجاح طرق التشخيص بكفاءة الإنتاج بشكل عام. من الضروري إيجاد معيار ، بحكم طبيعة العمليات المنجزة ، يمكن مقارنته بالمنهجية.

إذا لم يكن معروفًا فيما يتعلق بالمعيار الخارجي ما إذا كان مناسبًا للخاصية المقاسة أم لا ، فإن مقارنة نتائج تقنية التشخيص النفسي بها تصبح عديمة الفائدة عمليًا. لا يسمح بالتوصل إلى أي استنتاجات يمكن أن تقيم صحة المنهجية.

تنجم متطلبات التحرر من التدخل عن حقيقة أن النجاح التعليمي أو الصناعي ، على سبيل المثال ، يعتمد على متغيرين: على الشخص نفسه ، وخصائصه الفردية ، مقاسة بالطرق ، والحالة ، وظروف الدراسة ، والعمل ، والتي يمكن أن يؤدي إلى تداخل ، "تلويث" المعيار المطبق. من أجل تجنب هذا إلى حد ما ، يجب اختيار مجموعات من الأشخاص الذين هم في نفس الظروف تقريبًا أو أقل للبحث. يمكنك أيضًا استخدام طريقة أخرى. يتكون في تصحيح تأثير التدخل. عادة ما يكون هذا التعديل إحصائيًا بطبيعته. لذلك ، على سبيل المثال ، لا ينبغي أن تؤخذ الإنتاجية من حيث القيمة المطلقة ، ولكن فيما يتعلق بمتوسط ​​إنتاجية العمال الذين يعملون في ظروف مماثلة.

عندما يقال أن المعيار يجب أن يكون له موثوقية ذات دلالة إحصائية ، فهذا يعني أنه يجب أن يعكس ثبات واستقرار الوظيفة قيد الدراسة.

يعد البحث عن معيار مناسب يسهل التعرف عليه أحد أهم مهام التحقق من الصحة وأكثرها صعوبة. في علم الخصية الغربي ، العديد من الطرق غير مؤهلة فقط لأنها لم تجد معيارًا مناسبًا لاختبارها. على سبيل المثال ، بالنسبة لمعظم الاستبيانات ، فإن البيانات المتعلقة بصحتها مشكوك فيها ، لأنه من الصعب العثور على معيار خارجي مناسب يتوافق مع ما يقيسونه.

يمكن أن يكون تقييم صحة الأساليب كميًا ونوعيًا.

لحساب مؤشر كمي - معامل الصلاحية - تتم مقارنة النتائج التي تم الحصول عليها باستخدام تقنية التشخيص مع البيانات التي تم الحصول عليها بواسطة المعيار الخارجي لنفس الأشخاص. يتم استخدام أنواع مختلفة من الارتباط الخطي (وفقًا لسبيرمان ، وفقًا لبيرسون).

كم عدد المواد اللازمة لحساب الصلاحية؟

أثبتت الممارسة أنه لا ينبغي أن يكون هناك أقل من 50 منهم ، ولكن أكثر من 200 هو الأفضل.ويظهر السؤال غالبًا ، ما هي قيمة معامل الصلاحية حتى يعتبر مقبولاً؟ بشكل عام ، يلاحظ أنه يكفي أن يكون معامل الصلاحية ذا دلالة إحصائية. معامل الصلاحية حوالي 0.20-0.30 يتم التعرف عليه على أنه منخفض ، 0.30-0.50 متوسط ​​، وأكثر من 0.60 مرتفع.

ولكن ، كما يؤكد A. Anastasi و K.M.Gurevich وآخرون ، ليس من الصواب دائمًا استخدام الارتباط الخطي لحساب معامل الصلاحية. هذه التقنية لها ما يبررها فقط عندما يثبت أن النجاح في بعض الأنشطة يتناسب طرديًا مع النجاح في إجراء اختبار تشخيصي. غالبًا ما يرجع منصب علماء الاختبارات الأجانب ، وخاصة أولئك الذين يشاركون في الملاءمة المهنية والاختيار المهني ، إلى الاعتراف غير المشروط بأن الشخص الذي أكمل معظم المهام في الاختبار هو أكثر ملاءمة للمهنة. ولكن قد يكون أيضًا أنه من أجل النجاح في نشاط ما ، من الضروري أن يكون لديك خاصية عند مستوى 40٪ من حل الاختبار. المزيد من النجاح في الاختبار لم يعد مهمًا للمهنة. مثال توضيحي من دراسة كتبها K.M Gurevich: يجب أن يكون ساعي البريد قادرًا على القراءة ، ولكن ما إذا كان يقرأ بسرعة عادية أو بسرعة عالية جدًا لم يعد ذا أهمية مهنية. مع مثل هذا الارتباط بين مؤشرات المنهجية والمعيار الخارجي ، قد تكون الطريقة الأكثر ملاءمة لإثبات الصلاحية هي معيار الاختلافات.

هناك حالة أخرى ممكنة أيضًا: مستوى أعلى من الملكية مما تتطلبه المهنة يتعارض مع النجاح المهني. لذلك ، في فجر القرن العشرين. وجد الباحث الأمريكي ف. تايلور أن أكثر العمال تقدمًا في الإنتاج لديهم إنتاجية عمالية منخفضة. أي أن المستوى العالي لنموهم العقلي منعهم من العمل بإنتاجية عالية. في هذه الحالة ، سيكون تحليل التباين أو حساب نسب الارتباط أكثر ملاءمة لحساب معامل الصلاحية.

كما أظهرت تجربة علماء الاختبارات الأجانب ، لا يوجد إجراء إحصائي واحد قادر على أن يعكس تنوع التقييمات الفردية بشكل كامل. لذلك ، غالبًا ما يتم استخدام نموذج آخر لإثبات صحة الأساليب - التقييمات السريرية. هذا ليس أكثر من وصف نوعي لجوهر الخاصية المدروسة. في هذه الحالة ، نتحدث عن استخدام تقنيات لا تعتمد على المعالجة الإحصائية.

أنواع الصلاحية

الصلاحية في جوهرها هي خاصية معقدة ، بما في ذلك ، من ناحية ، معلومات حول ما إذا كانت التقنية مناسبة لقياس ما تم إنشاؤه من أجله ، ومن ناحية أخرى ، ما هي فعاليتها وكفاءتها وفائدتها العملية.

التحقق من صحة تقنية ما يسمى التحقق من الصحة.

لإجراء التحقق العملي من المنهجية ، أي لتقييم فعاليتها وكفاءتها وأهميتها العملية ، يتم عادةً استخدام معيار خارجي مستقل - وهو مؤشر على مظاهر الخاصية المدروسة في الحياة اليومية. يمكن أن يكون هذا المعيار هو الأداء الأكاديمي (لاختبارات القدرة على التعلم ، واختبارات التحصيل ، واختبارات الذكاء) ، وإنجازات الإنتاج (لأساليب التوجيه المهني) ، وفعالية النشاط الحقيقي - الرسم ، والنمذجة ، وما إلى ذلك (لاختبارات القدرات الخاصة) ، التقييمات الذاتية (لاختبارات الشخصية).

4 أنواع من المعايير الخارجية:

معايير الأداء (قد تشمل هذه مثل حجم العمل المنجز ، والأداء الأكاديمي ، والوقت الذي يقضيه في التدريب ، ومعدل نمو المؤهلات ، وما إلى ذلك) ؛

المعايير الذاتية (تشمل أنواعًا مختلفة من الإجابات التي تعكس موقف الشخص تجاه شيء ما أو شخص ما ، ورأيه ، وآرائه ، وتفضيلاته ؛ وعادة ما يتم الحصول على المعايير الشخصية من خلال المقابلات والاستبيانات والاستبيانات) ؛

المعايير الفسيولوجية (تُستخدم في دراسة تأثير البيئة والمتغيرات الظرفية الأخرى على جسم الإنسان والنفسية ؛ يتم قياس معدل النبض وضغط الدم ومقاومة الجلد الكهربائية وأعراض التعب وما إلى ذلك) ؛

معايير العشوائية (تُطبق عندما يتعلق الغرض من الدراسة ، على سبيل المثال ، بمشكلة اختيار الأشخاص الأقل عرضة للحوادث للعمل).

الصلاحية التجريبية.

في حالة صحة المحتوى ، إذا تم تقييم الاختبار من قبل خبراء (الذين يحددون مطابقة عناصر الاختبار لمحتوى موضوع القياس) ، يتم قياس الصلاحية التجريبية دائمًا باستخدام الارتباط الإحصائي: الارتباط بين سلسلتين من القيم يتم حسابها - درجات الاختبار والمؤشرات لمعامل خارجي يتم اختياره كمعيار للصلاحية.

بناء صلاحية.

ترتبط صلاحية البناء بالبناء النظري نفسه ويتضمن البحث عن العوامل التي تفسر السلوك عند إجراء الاختبار. كنوع خاص ، تم تدوين صلاحية الإنشاء في مقال بقلم كرونباخ وميل (1955). قيم المؤلفون بهذا النوع من المصداقية جميع دراسات الاختبار التي لم تكن تهدف بشكل مباشر إلى التنبؤ ببعض المعايير المهمة. احتوت الدراسة على معلومات حول التركيبات النفسية.

الصلاحية "حسب المحتوى".

تتطلب صلاحية المحتوى أن يكون لكل عنصر أو مشكلة أو سؤال ينتمي إلى منطقة معينة فرصة متساوية ليكون عنصر اختبار. تقيم صلاحية المحتوى مدى توافق محتوى الاختبار (المهام والأسئلة) مع مجال السلوك المقاس. يتم إجراء الاختبارات التي قام بجمعها فريقان من فرق التطوير على عينة من الموضوعات. يتم حساب موثوقية الاختبارات عن طريق تقسيم العناصر إلى جزأين ، مما ينتج عنه فهرس لصلاحية المحتوى.

الصلاحية "النذير".

يتم تحديد الصلاحية "التنبؤية" أيضًا من خلال معيار خارجي موثوق به إلى حد ما ، ولكن يتم جمع المعلومات عنه في وقت ما بعد الاختبار. عادة ما يكون المعيار الخارجي هو قدرة الشخص ، المعبر عنها في بعض التقييمات ، على نوع النشاط الذي تم اختياره من أجله بناءً على نتائج الاختبارات التشخيصية. على الرغم من أن هذه التقنية هي الأنسب لمهمة تقنيات التشخيص - التنبؤ بالنجاح في المستقبل ، إلا أنه من الصعب جدًا تطبيقها. ترتبط دقة التنبؤ بشكل عكسي بالوقت الممنوح لمثل هذا التنبؤ. كلما مر الوقت بعد القياس ، يجب أخذ المزيد من العوامل في الاعتبار عند تقييم الأهمية التنبؤية للتقنية. ومع ذلك ، يكاد يكون من المستحيل مراعاة جميع العوامل التي تؤثر على التنبؤ.

الصلاحية "بأثر رجعي".

يتم تحديده على أساس معيار يعكس الأحداث أو حالة الجودة في الماضي. يمكن استخدامه للحصول بسرعة على معلومات حول القدرات التنبؤية للتقنية. وبالتالي ، لاختبار مدى توافق الدرجات الجيدة في اختبار القدرات مع التعلم السريع ، يمكن للمرء مقارنة الدرجات السابقة وآراء الخبراء السابقين وما إلى ذلك. في الأفراد ذوي المؤشرات التشخيصية العالية والمنخفضة في الوقت الحالي.

صلاحية متقاربة ومميزة.

تحدد الطريقة التي يحدد بها عالم النفس البنية التشخيصية استراتيجية تضمين عناصر معينة في الاختبار. إذا كان إيسينك يعرّف خاصية "العصابية" على أنها مستقلة عن الانبساط-الانطوائية ، فهذا يعني أنه في استبيانه يجب أن يكون هناك عدد متساوٍ تقريبًا من العناصر التي يتفق معها الانطوائيون العصابيون والمنفتحون العصابيون. إذا اتضح عمليًا أن الاختبار سيهيمن عليه عناصر من رباعي "العصابية - الانطوائية" ، إذن ، من وجهة نظر نظرية إيسنك ، فإن هذا يعني أن عامل "العصابية" قد تم تحميله بعوامل غير ذات صلة عامل - "الانطواء". (يحدث نفس التأثير بالضبط إذا كان هناك تحيز في العينة - إذا كان هناك انطوائيون عصابيون أكثر من المنفتحين العصابيين).

من أجل عدم مواجهة مثل هذه الصعوبات ، يود علماء النفس التعامل مع مثل هذه المؤشرات التجريبية (النقاط) التي تخبر بشكل لا لبس فيه عن عامل واحد فقط. لكن هذا المطلب لم يتم الوفاء به حقًا: أي مؤشر تجريبي يتضح أنه يتحدد ليس فقط من خلال العامل الذي نحتاجه ، ولكن أيضًا بواسطة الآخرين - غير ذي صلة بمهمة القياس.

وبالتالي ، فيما يتعلق بالعوامل التي يتم تعريفها من الناحية المفاهيمية على أنها متعامدة مع المقاس (التي تحدث معها في جميع التوليفات) ، يجب على مترجم الاختبار تطبيق استراتيجية موازنة مصطنعة عند اختيار العناصر.

تضمن مطابقة العناصر للعامل المقاس صحة تقارب الاختبار. يوفر توازن العناصر فيما يتعلق بالعوامل غير ذات الصلة صلاحية تمييزية. تجريبيًا ، يتم التعبير عنه في حالة عدم وجود ارتباط كبير مع اختبار يقيس خاصية مستقلة من الناحية المفاهيمية.

أنواع الصلاحية

هناك عدة أنواع من الصلاحية بسبب خصائص طرق التشخيص ، فضلاً عن الوضع المؤقت للمعيار الخارجي. ؛ في Cherny ، 1983 ؛ "التشخيص النفسي العام" ، 1987 ، وما إلى ذلك) غالبًا ما يُطلق على ما يلي:

1. الصلاحية "حسب المحتوى". تستخدم هذه التقنية بشكل أساسي في اختبارات التحصيل. عادةً لا تتضمن اختبارات التحصيل جميع المواد التي اجتازها الطلاب ، ولكن جزءًا صغيرًا منها (3-4 أسئلة). هل من الممكن التأكد من أن الإجابات الصحيحة على هذه الأسئلة القليلة تشهد على استيعاب جميع المواد. هذا ما يجب أن يجيب عليه فحص صلاحية المحتوى. للقيام بذلك ، يتم إجراء مقارنة بين النجاح في الاختبار مع تقييمات الخبراء للمعلمين (لهذه المادة). تنطبق الصلاحية "حسب المحتوى" أيضًا على الاختبارات المستندة إلى المعايير. تسمى هذه التقنية أحيانًا بالصلاحية المنطقية.

2. يتم تحديد صلاحية "التواؤم" ، أو الصلاحية الحالية ، من خلال معيار خارجي يتم من خلاله جمع المعلومات في نفس وقت تجارب طريقة الاختبار. بمعنى آخر ، يتم جمع البيانات المتعلقة بأداء الوقت الحالي في فترة الاختبار ، والأداء في نفس الفترة ، وما إلى ذلك. ترتبط نتائج النجاح في الاختبار به.

3. الصلاحية "التنبؤية" (اسم آخر هو الصلاحية "التنبؤية"). يتم تحديده أيضًا من خلال معيار خارجي موثوق به إلى حد ما ، ولكن يتم جمع المعلومات عنه في وقت ما بعد الاختبار. عادة ما يكون المعيار الخارجي هو قدرة الشخص ، المعبر عنها في بعض التقييمات ، على نوع النشاط الذي تم اختياره من أجله بناءً على نتائج الاختبارات التشخيصية. على الرغم من أن هذه التقنية هي الأنسب لمهمة تقنيات التشخيص - التنبؤ بالنجاح في المستقبل ، إلا أنه من الصعب جدًا تطبيقها. ترتبط دقة التنبؤ بشكل عكسي بالوقت الممنوح لمثل هذا التنبؤ. كلما مر الوقت بعد القياس ، يجب أخذ المزيد من العوامل في الاعتبار عند تقييم الأهمية التنبؤية للتقنية. ومع ذلك ، يكاد يكون من المستحيل مراعاة جميع العوامل التي تؤثر على التنبؤ.

4. الصلاحية "بأثر رجعي". يتم تحديده على أساس معيار يعكس الأحداث أو حالة الجودة في الماضي. يمكن استخدامه للحصول بسرعة على معلومات حول القدرات التنبؤية للتقنية. وبالتالي ، لاختبار مدى توافق الدرجات الجيدة في اختبار القدرات مع التعلم السريع ، يمكن للمرء مقارنة الدرجات السابقة وآراء الخبراء السابقين وما إلى ذلك. في الأفراد ذوي المؤشرات التشخيصية العالية والمنخفضة في الوقت الحالي.

علاقه مترابطه

الارتباط (اعتماد الارتباط) - علاقة إحصائية بين متغيرين عشوائيين أو أكثر (أو متغيرات يمكن اعتبارها كذلك بدرجة مقبولة من الدقة). في الوقت نفسه ، تؤدي التغييرات في قيم واحدة أو أكثر من هذه الكميات إلى تغيير منهجي في قيم كميات أخرى أو كميات أخرى. المقياس الرياضي للارتباط بين متغيرين عشوائيين هو نسبة الارتباط ، أو معامل الارتباط (أو). إذا كان التغيير في متغير عشوائي واحد لا يؤدي إلى تغيير منتظم في متغير عشوائي آخر ، ولكنه يؤدي إلى تغيير في خاصية إحصائية أخرى لهذا المتغير العشوائي ، فإن هذه العلاقة لا تعتبر ارتباطًا ، على الرغم من أنها إحصائية.

لأول مرة ، تم إدخال مصطلح "الارتباط" في التداول العلمي من قبل عالم الحفريات الفرنسي جورج كوفييه في القرن الثامن عشر. لقد طور "قانون الارتباط" لأجزاء وأعضاء الكائنات الحية ، والتي من خلالها يمكن استعادة مظهر حيوان متحجر ، مع وجود جزء فقط من بقاياه تحت تصرفه. في الإحصاء ، استخدم عالم الأحياء والإحصائي الإنجليزي فرانسيس جالتون كلمة "ارتباط" لأول مرة في نهاية القرن التاسع عشر.

يمكن أن تكون بعض أنواع معاملات الارتباط موجبة أو سلبية (من الممكن أيضًا عدم وجود علاقة إحصائية - على سبيل المثال ، للمتغيرات العشوائية المستقلة). إذا كان من المفترض أن يتم تحديد علاقة ترتيب صارمة على قيم المتغيرات ، فإن الارتباط السلبي هو ارتباط ترتبط فيه الزيادة في متغير واحد بانخفاض في متغير آخر ، بينما يمكن أن يكون معامل الارتباط سالبًا ؛ الارتباط الإيجابي في مثل هذه الظروف - ارتباط ترتبط فيه الزيادة في متغير واحد بزيادة متغير آخر ، بينما يمكن أن يكون معامل الارتباط موجبًا.

الصلاحية (من اللغة الإنجليزية صالحة - "صالحة ، مناسبة ، صالحة") هي خاصية معقدة لمنهجية (اختبار) ، بما في ذلك معلومات حول مجال الظواهر المدروسة وتمثيل إجراء التشخيص فيما يتعلق هم.

في أبسط صيغه وأكثرها عمومية ، فإن صلاحية الاختبار هي "مفهوم يخبرنا بما يقيسه الاختبار ومدى نجاحه". في المتطلبات القياسية للاختبارات النفسية والتعليمية ، يتم تعريف الصلاحية على أنها مجموعة من المعلومات حول مجموعات الخصائص النفسية للشخص التي يمكن استنتاجها باستخدام المنهجية ، وكذلك درجة صحة الاستنتاجات عند استخدام درجات اختبار محددة أو أشكال أخرى من التقييم. في التشخيص النفسي ، تعد الصلاحية جزءًا إلزاميًا وأهم جزء من المعلومات حول المنهجية ، بما في ذلك (جنبًا إلى جنب مع ما سبق) البيانات حول درجة اتساق نتائج الاختبار مع المعلومات الأخرى حول الشخص قيد الدراسة ، والتي تم الحصول عليها من مصادر مختلفة (التوقعات النظرية ، والملاحظات ، وتقييمات الخبراء ، ونتائج الأساليب الأخرى ، التي تم إثبات موثوقيتها ، وما إلى ذلك) ، حكم حول صحة التوقعات لتطوير الجودة قيد الدراسة ، وربط مجال السلوك المدروس أو السمات الشخصية مع بعض التراكيب النفسية. تصف الصلاحية أيضًا التوجه المحدد للمنهجية (مجموعة الموضوعات حسب العمر ، ومستوى التعليم ، والانتماء الاجتماعي والثقافي ، وما إلى ذلك) ودرجة صحة الاستنتاجات في الظروف المحددة لاستخدام الاختبار. تحتوي مجمل المعلومات التي تميز صحة الاختبار على معلومات حول مدى كفاية نموذج النشاط المطبق من حيث عكس الخصائص النفسية المدروسة فيه ، وحول درجة تجانس المهام (الاختبارات الفرعية) المدرجة في الاختبار ، وقابليتها للمقارنة في التقييم الكمي لنتائج الاختبار ككل.

إن أهم مكون للصدق - تحديد منطقة الخصائص المدروسة - له أهمية نظرية وعملية أساسية في اختيار منهجية البحث وتفسير بياناته. المعلومات الواردة في اسم الاختبار ، كقاعدة عامة ، غير كافية للحكم على نطاق تطبيقه. هذا مجرد تسمية ، "اسم" إجراء بحث معين.

أنواع صلاحية الاختبار. طرق تحديد الصلاحية

وفقًا لتعريف عالم النصوص الأمريكي أ. أناستاسي ، فإن "صلاحية الاختبار هي مفهوم يخبرنا بما يقيسه الاختبار ومدى نجاحه". تشير الصلاحية إلى ما إذا كانت التقنية مناسبة لقياس صفات وميزات معينة ومدى فعالية ذلك. الطريقة الأكثر شيوعًا للعثور على الصلاحية النظرية للاختبار (الطريقة) هي الصلاحية المتقاربة ، أي مقارنة تقنية معينة بالطرق ذات الصلة الموثوقة وإثبات وجود روابط مهمة معها.

المقارنة مع الأساليب التي لها أساس نظري مختلف ، والافتقار المستمر للعلاقات الهامة معهم يسمى الصلاحية التمييزية. نوع آخر من المصداقية - الصلاحية البراغماتية - اختبار المنهجية من حيث أهميتها العملية ، وكفاءتها ، وفائدتها. لإجراء مثل هذا الاختبار ، كقاعدة عامة ، يتم استخدام ما يسمى بالمعايير الخارجية المستقلة ، أي يتم استخدام مصدر خارجي للمعلومات المستقلة عن الاختبار حول التظاهر في الحياة الواقعية وأنشطة الأشخاص من الممتلكات العقلية المقاسة. من بين هذه المعايير الخارجية قد يكون الأداء الأكاديمي ، والإنجازات المهنية ، والنجاح في الأنشطة المختلفة ، والتقييمات الذاتية (أو التقييمات الذاتية). إذا كانت المنهجية ، على سبيل المثال ، تقيس ميزات تطوير الصفات المهمة مهنيًا ، فمن الضروري بالنسبة للمعيار العثور على مثل هذا النشاط أو العمليات الفردية حيث تتحقق هذه الصفات.

للتحقق من صحة الاختبار ، يمكنك استخدام طريقة المجموعات المعروفة ، عندما تتم دعوة الأشخاص حول من يُعرف أي مجموعة وفقًا للمعيار الذي ينتمون إليه (على سبيل المثال ، مجموعة من "الطلاب الناجحين للغاية والمنضبطين" - معيار عالي ومجموعة من "الطلاب الفقراء غير المنضبطين" - معيار منخفض ، والطلاب ذوو القيم المتوسطة لا يشاركون في الاختبار) ، وإجراء الاختبار وإيجاد علاقة بين نتائج الاختبار والمعيار.

هنا هو عدد الأشخاص الذين وقعوا في المجموعة العالية وفقًا للاختبار ووفقًا للمعيار ، c هو عدد الأشخاص الذين وقعوا في المجموعة العالية وفقًا للمعيار ولديهم نتائج اختبار منخفضة. إذا كان الاختبار صالحًا تمامًا ، فيجب أن يكون العنصران ب وج يساوي صفرًا. يتم تقييم مقياس المصادفة والارتباط بين المجموعات المتطرفة وفقًا للاختبار والمعيار باستخدام معامل Guilford phi. هناك العديد من الطرق المختلفة لإثبات صحة الاختبار. يُقال إن الاختبار يكون صالحًا إذا كان يقيس ما يُقصد قياسه. الصلاحية الخارجية - فيما يتعلق بأساليب التشخيص النفسي تعني مطابقة نتائج التشخيص النفسي المنفذة بواسطة هذه الطريقة مع العلامات الخارجية ، بغض النظر عن الطريقة ، المنسوبة إلى موضوع المسح. إنه يعني تقريبًا نفس الشيء مثل الصلاحية التجريبية ، مع اختلاف أننا نتحدث هنا عن العلاقة بين مؤشرات المنهجية وأهم السمات الخارجية الرئيسية المتعلقة بسلوك الموضوع. يعتبر أسلوب التشخيص النفسي صالحًا خارجيًا إذا كان ، على سبيل المثال ، يقيّم سمات شخصية الفرد ويتوافق سلوكه الملاحظ خارجيًا مع نتائج الاختبار.

الصلاحية داخلية - فيما يتعلق بأساليب التشخيص النفسي ، فهي تعني تطابق المهام والاختبارات الفرعية الواردة فيها ؛ مطابقة نتائج التشخيص النفسي المنفذة بواسطة هذه التقنية مع تعريف الخاصية النفسية المقيمة المستخدمة في التقنية نفسها. تعتبر المنهجية غير صالحة داخليًا أو غير صالحة بشكل كافٍ عندما لا تقيس كل أو جزء من الأسئلة والمهام والاختبارات الفرعية المضمنة فيها ما هو مطلوب بواسطة هذه المنهجية. الصلاحية الظاهرية - تصف تصور الاختبار الذي تطور في الموضوع. يجب أن ينظر الموضوع إلى الاختبار كأداة جادة لفهم شخصيته. تعتبر الصلاحية الواضحة ذات أهمية خاصة في الظروف الحديثة ، عندما تتشكل فكرة الاختبارات في العقل العام من خلال العديد من المنشورات في الصحف والمجلات الشعبية لما يمكن أن يسمى شبه الاختبارات ، والتي بمساعدة القارئ تحديد أي شيء: من الذكاء إلى التوافق مع الزوج المستقبلي.

يتم تقييم الصلاحية التنافسية من خلال ارتباط الاختبار المطور بالآخرين ، والتي تم إثبات صحتها فيما يتعلق بالمعلمة المقاسة. يلاحظ P. Kline أن البيانات الخاصة بالصلاحية التنافسية مفيدة عندما تكون هناك اختبارات غير مرضية لقياس بعض المتغيرات ، ويتم إنشاء متغيرات جديدة من أجل تحسين جودة القياس. لكن السؤال الذي يطرح نفسه: إذا كان هناك اختبار فعال بالفعل ، فلماذا نحتاج إلى نفس الاختبار الجديد؟ يتم تحديد الصلاحية التنبؤية من خلال الارتباط بين درجات الاختبار وبعض المعايير التي تميز الخاصية التي يتم قياسها ، ولكن في وقت لاحق. على سبيل المثال ، يمكن إظهار الصلاحية التنبؤية لاختبار الذكاء من خلال ربط درجاته التي تم الحصول عليها من مادة في سن العاشرة مع الأداء الأكاديمي خلال فترة التخرج من المدرسة الثانوية. يعتبر L.Cronbach الصلاحية التنبؤية هي الدليل الأكثر إقناعًا على أن الاختبار يقيس بالضبط الغرض المقصود منه. المشكلة الرئيسية التي يواجهها الباحث الذي يحاول إثبات الصلاحية التنبؤية لاختباره هي اختيار معيار خارجي. على وجه الخصوص ، يتعلق هذا في الغالب بقياس متغيرات الشخصية ، حيث يكون اختيار معيار خارجي مهمة صعبة للغاية ، يتطلب حلها قدرًا كبيرًا من البراعة. يكون الموقف أبسط إلى حد ما عند تحديد معيار خارجي للاختبارات المعرفية ، ومع ذلك ، حتى في هذه الحالة ، يتعين على الباحث "غض الطرف" عن العديد من المشكلات. وبالتالي ، يتم استخدام الأداء الأكاديمي تقليديًا كمعيار خارجي للتحقق من صحة اختبارات الذكاء ، ولكن في نفس الوقت من المعروف جيدًا أن التحصيل الأكاديمي بعيد كل البعد عن الدليل الوحيد على الذكاء العالي. الصلاحية المتزايدة ذات قيمة محدودة وتشير إلى الحالة التي قد يكون فيها اختبار واحد من مجموعة من الاختبارات ذات علاقة منخفضة مع معيار ، ولكن لا يتداخل مع اختبارات أخرى من البطارية. في هذه الحالة ، يكون للاختبار صلاحية تدريجية. يمكن أن يكون هذا مفيدًا عند إجراء الاختيار المهني باستخدام الاختبارات النفسية. يمكن توضيح الصلاحية التفاضلية باستخدام اختبارات الفائدة. عادةً ما ترتبط اختبارات الاهتمام بالأداء الأكاديمي ، ولكن بطرق مختلفة باختلاف التخصصات. قيمة الصلاحية التفاضلية ، وكذلك الصلاحية المتزايدة ، محدودة.

يتم تعريف صلاحية المحتوى على أنها تأكيد على أن عناصر الاختبار تعكس جميع جوانب مجال السلوك قيد الدراسة. عادة ما يتم تحديده في اختبارات التحصيل (معنى المعلمة المقاسة واضح تمامًا) ، والتي ، كما ذكرنا سابقًا ، ليست في الواقع اختبارات نفسية. في الممارسة العملية ، لتحديد صلاحية المحتوى ، يتم اختيار الخبراء الذين يشيرون إلى مجال السلوك الأكثر أهمية ، على سبيل المثال ، للقدرات الموسيقية ، وبعد ذلك ، بناءً على ذلك ، يتم إنشاء عناصر الاختبار ، والتي يتم تقييمها مرة أخرى من قبل الخبراء. يتم إثبات صحة بناء الاختبار على أكمل وجه ممكن من خلال وصف المتغير الذي يهدف الاختبار إلى قياسه. في الواقع ، تتضمن صلاحية الإنشاء جميع الأساليب لتحديد الصلاحية المذكورة أعلاه. حاول كرونباخ وميهل ، اللذان أدخلا مفهوم صلاحية البناء في التشخيص النفسي ، حل مشكلة اختيار معايير التحقق من صحة الاختبار. وشددوا على أنه في كثير من الحالات لا يوجد معيار واحد يمكن أن يخدم التحقق من صحة اختبار واحد. يمكننا أن نفترض أن حل مسألة صلاحية بناء الاختبار هو البحث عن إجابة لسؤالين: 1) هل توجد خاصية معينة بالفعل ؛ 2) ما إذا كان هذا الاختبار يقيس بشكل موثوق الفروق الفردية في هذه الخاصية. من الواضح تمامًا أن مشكلة الموضوعية في تفسير نتائج دراسة صحة البناء مرتبطة بصحة البناء ، لكن هذه المشكلة نفسية عامة وتتجاوز الصلاحية.

من أجل أن تكون التجربة النفسية والتربوية وسيلة بحث موثوقة بدرجة كافية وتسمح بالحصول على نتائج موثوقة تمامًا يمكن الوثوق بها وعلى أساسها يمكن استخلاص استنتاجات عملية صحيحة ، من الضروري أن تكون طرق التشخيص النفسي المستخدمة فيها أن تكون مثبتة علميًا. وتعتبر هذه طرقًا تفي بالمتطلبات التالية: الصلاحية والموثوقية وعدم الغموض والدقة.

شرط "صلاحية" تعني حرفياً: "كامل" ، "مناسب" ، "مطابق". الصلاحية بطبيعتها هذه خاصية معقدة ، بما في ذلك ، من ناحية ، معلومات حول ما إذا كانت التقنية مناسبة لقياس ما تم إنشاؤه من أجله ، ومن ناحية أخرى ، ما هي فعاليتها وكفاءتها. يسمى اختبار صلاحية التقنية تصديق.

هناك عدة أنواع من الصلاحية ، يجب النظر في كل منها وتقييمه بشكل منفصل عندما يتعلق الأمر بتحديد صلاحية تقنية التشخيص النفسي. قد تكون الصلاحية نظري وعملي (تجريبي) ، داخلي وخارجي.

الصلاحية النظريةيتم تحديده من خلال تطابق مؤشرات الجودة قيد الدراسة ، التي تم الحصول عليها باستخدام هذه الطريقة ، مع المؤشرات التي تم الحصول عليها من خلال طرق أخرى - تلك التي تحتوي على مؤشرات يجب أن يكون لها تبعية مبررة نظريًا. يتم التحقق من الصلاحية النظرية من خلال ارتباطات مؤشرات نفس الخاصية التي تم الحصول عليها باستخدام طرق مختلفة تستند إلى نفس النظرية أو تنطلق منها.

الصلاحية التجريبيةيتم التحقق من خلال مراسلة المؤشرات التشخيصية للسلوك الحقيقي ، والإجراءات الملاحظة وردود الفعل للموضوع. إذا قمنا ، على سبيل المثال ، بمساعدة بعض المنهجيات ، بتقييم سمات الشخصية لموضوع معين ، فسيتم اعتبار المنهجية المطبقة صالحة عمليًا أو تجريبيًا عندما نثبت أن هذا الشخص يتصرف في الحياة تمامًا كما تتوقع المنهجية ، أي حسب صفاته الشخصية. وفقًا لمعيار الصلاحية التجريبية ، يتم فحص المنهجية من خلال مقارنة مؤشراتها بسلوك الحياة الواقعية أو نتائج الأنشطة العملية للناس.

الصلاحية داخليةتعني امتثال المهام والاختبارات الفرعية والأحكام وما إلى ذلك الواردة في المنهجية. الهدف العام وتصميم المنهجية ككل. يعتبر غير صالح داخليًا أو غير صالح داخليًا بشكل كافٍ عندما لا تقيس كل أو جزء من الأسئلة أو المهام أو الاختبارات الفرعية المضمنة فيه ما هو مطلوب من هذه المنهجية.

صلاحية خارجية - هذا هو نفس الصلاحية التجريبية تقريبًا ، مع الاختلاف الوحيد الذي نتحدث عنه في هذه الحالة عن العلاقة بين مؤشرات المنهجية وأهم السمات الخارجية الرئيسية المتعلقة بسلوك الموضوع.


عند إنشاء منهجية ، من الصعب تقييم صحتها على الفور. عادة ، يتم التحقق من صحة المنهجية وتنقيحها في سياق استخدامها الطويل إلى حد ما ، خاصة وأننا نتحدث عن التحقق من الجوانب الأربعة الموضحة أعلاه على الأقل.

لا يوجد نهج عالمي واحد لتعريف الصلاحية. اعتمادًا على جانب الصلاحية الذي يريد الباحث مراعاته ، يتم أيضًا استخدام طرق مختلفة للإثبات. بعبارة أخرى ، يشمل مفهوم الصلاحية أنواعه المختلفة التي لها معانيها الخاصة.

هناك أربعة أنواع المعايير الخارجية تستخدم لإثبات الصلاحية:

1) معايير الأداء (قد يشمل ذلك حجم العمل المنجز ، والأداء الأكاديمي ، والوقت الذي يقضيه في التدريب ، ومعدل نمو المؤهلات ؛

2) معايير ذاتية (تشمل أنواعًا مختلفة من الردود التي
تعكس موقف الشخص تجاه شيء ما أو شخص ما ، ورأيه ، وآرائه ،
التفضيلات عادة ما يتم الحصول على المعايير الشخصية باستخدام المقابلات والاستبيانات والاستبيانات) ؛

3) المعايير الفسيولوجية (تُستخدم في دراسة تأثير البيئة والمتغيرات الظرفية الأخرى على جسم الإنسان والنفسية ؛ يتم قياس معدل النبض ، وضغط الدم ، ومقاومة الجلد الكهربائية ، وأعراض التعب ، وما إلى ذلك) ؛

4) معايير العشوائية (تُستخدم عندما يتعلق الغرض من الدراسة ، على سبيل المثال ، بمشكلة اختيار الأشخاص الأقل عرضة للحوادث للعمل).

يعد البحث عن معيار مناسب يسهل التعرف عليه أحد أهم مهام التحقق من الصحة وأكثرها صعوبة.

هناك العديد أنواع الصلاحية, نظرًا لخصائص طرق التشخيص ، فضلاً عن الوضع المؤقت لمعيار خارجي:

1) الصلاحية "حسب المحتوى". تستخدم هذه التقنية بشكل أساسي في اختبارات التحصيل. عادةً لا تتضمن اختبارات التحصيل جميع المواد التي اجتازها الطلاب ، ولكن جزءًا صغيرًا منها (3-4 أسئلة). هل من الممكن التأكد من أن الإجابات الصحيحة على هذه الأسئلة القليلة تشهد على استيعاب جميع المواد. هذا ما يجب أن يجيب عليه فحص صلاحية المحتوى. للقيام بذلك ، يتم إجراء مقارنة بين النجاح في الاختبار مع تقييمات الخبراء للمعلمين (لهذه المادة). تنطبق الصلاحية "حسب المحتوى" أيضًا على الاختبارات المستندة إلى المعايير. في بعض الأحيان تسمى هذه التقنية الصلاحية المنطقية.

2) الصلاحية "بالتزامن" ، أو الصلاحية الحالية ، يتم تحديدها من خلال معيار خارجي ، يتم بموجبه جمع المعلومات في وقت واحد
التجارب حسب الطريقة المختبرة. بمعنى آخر ، يتم جمع البيانات المتعلقة بالحاضر (التقدم خلال الفترة التجريبية ، والأداء خلال نفس الفترة ، وما إلى ذلك). ترتبط بنتائج النجاح في الاختبار.

3) "صحة التنبؤية . يتم تحديده أيضًا من خلال معيار خارجي موثوق به إلى حد ما ، ولكن يتم جمع المعلومات عنه في وقت ما بعد الاختبار. عادة ما يكون المعيار الخارجي هو قدرة الشخص ، المعبر عنها في بعض التقييمات ، على نوع النشاط الذي تم اختياره من أجله بناءً على نتائج الاختبارات التشخيصية. على الرغم من أن هذه التقنية هي الأنسب لمهمة تقنيات التشخيص - التنبؤ بالنجاح في المستقبل ، إلا أنه من الصعب جدًا تطبيقها. ترتبط دقة التنبؤ بشكل عكسي بالوقت الممنوح لمثل هذا التنبؤ. كلما مر الوقت بعد القياس ، يجب أخذ المزيد من العوامل في الاعتبار عند تقييم الأهمية التنبؤية للتقنية. ومع ذلك ، يكاد يكون من المستحيل مراعاة جميع العوامل التي تؤثر على التنبؤ.

4) الصلاحية "بأثر رجعي". يتم تحديده على أساس المعايير
تعكس حدثًا أو حالة من الجودة في الماضي. يمكن استخدامه للحصول بسرعة على معلومات حول القدرات التنبؤية للتقنية. وبالتالي ، لاختبار مدى توافق الدرجات الجيدة في اختبار القدرات مع التعلم السريع ، يمكن للمرء مقارنة الدرجات السابقة وآراء الخبراء السابقين وما إلى ذلك. في الأفراد ذوي المؤشرات التشخيصية العالية والمنخفضة في الوقت الحالي.

عند تقديم بيانات عن صلاحية المنهجية المطورة ، من المهم تحديد نوع الصلاحية المقصود بالضبط (بالمحتوى ، بالتزامن ، إلخ). من المستحسن أيضًا الإبلاغ عن معلومات عن عدد وخصائص الأفراد الذين تم التحقق من صحتهم. تسمح هذه المعلومات للباحث باستخدام التقنية لتحديد مدى صلاحية هذه التقنية للمجموعة التي تنتمي إليها
الذي ينوي استخدامه. كما هو الحال مع الموثوقية ، يجب أن نتذكر أن التقنية قد يكون لها صلاحية عالية في عينة واحدة وصلاحية منخفضة في أخرى. لذلك ، إذا كان الباحث يخطط لاستخدام المنهجية على عينة من الموضوعات تختلف اختلافًا كبيرًا عن تلك التي تم إجراء اختبار الصلاحية عليها ، فإنه يحتاج إلى إعادة إجراء مثل هذا الاختبار.

بالإضافة إلى أنواع الصلاحية ، من المهم أن تعرف معايير الصلاحية . هذه هي العلامات الرئيسية التي يمكن من خلالها الحكم عمليًا على ما إذا كانت هذه التقنية صالحة أم لا. يمكن أن تكون هذه المعايير كما يلي:

1. المؤشرات السلوكية - ردود الفعل والأفعال والأفعال للموضوع في مواقف الحياة المختلفة.

2. إنجازات المادة في الأنشطة المختلفة: التربوية والعمالية والإبداعية وغيرها.

3. بيانات تدل على أداء عينات ومهام الرقابة المختلفة.

4. البيانات التي تم الحصول عليها باستخدام طرق أخرى ، والتي تعتبر صحتها أو علاقتها بالطريقة المختبرة مؤكدة بشكل موثوق.

12. مفهوم الصلاحية والموثوقية والموثوقية في التشخيص النفسي.

مصداقية- أحد معايير طرق الاختبار. ساهم أ. أناستاسي ، كرونباخ ، ثورندايك في تطوير هذا المعيار.

الموثوقية هي الثبات النسبي ، والاستقرار ، واتساق نتائج الاختبار أثناء القياسات الأولية والمتكررة على نفس الموضوعات. من الضروري تكرار القياس على نفس العينة. الاختلافات ممكنة ، لكنها يجب أن تكون طفيفة. وبالتالي ، تتحدث الموثوقية عن دقة واستقرار نتائج عمل العوامل العشوائية.

يمكن أن يكون الانتشار الكلي نتيجة مجموعتين من الأسباب:

    التباين المتأصل في السمة نفسها.

    العوامل البيئية التي قد تؤثر

إجراءات حساب الموثوقية:

    إجراء نفس النموذج من الاختبار. (موثوقية إعادة الاختبار) ، حساب معامل الارتباط. الفترة الفاصلة بين الاختبار من شهر إلى عدة أشهر.

    إجراء اختبارات متوازية. عند إجراء دراسة باستخدام نموذج مكافئ للاختبار ، يكون الاختصاصي مقتنعًا بصحة الميزة المختارة. لكي يتم اعتبار نماذج الاختبار معادلة ، يجب أن يكون نفس عدد المهام في كلا الاختبارين هو نفسه ، ويجب أن تكون المهام موحدة ، ويجب ترتيب المهام بنفس درجة التعقيد ، ويجب أن يكون هناك نفس المتوسط ​​والمعيار انحراف. يتم استخدام طريقتين لحساب الموثوقية باستخدام أشكال متوازية من الاختبارات:

    يتم فحص نفس الموضوعات باستخدام نفس الاختبار. ثم آخر ، وإذا كان معامل الارتباط أكبر من 0.7 ، فإن الموثوقية تكون عالية.

    يتم تقسيم الموضوعات إلى مجموعتين ، إحداهما تجتاز الاختبار A ، والأخرى تجتاز الاختبار B ، بعد أسبوع - والعكس صحيح.

    تجزئة الاختبار وحساب معامل الارتباط. يقوم المشاركون بإجراء جزأين من الاختبار متكافئين. تقع جميع المهام ذات الأرقام الزوجية في جزء واحد ، بينما المهام المرقمة بأرقام فردية في الجزء الآخر. يوضح هذا الإجراء تسلسل الاختبار في حد ذاته ، ومقياس كفاية اختيار الأسئلة. يتم حساب معامل الارتباط.

معامل الموثوقية يتوافق مع معامل ارتباط سبيرمان أو بيسرون.

عامل الموثوقية - تشتت - طريقة لتحديد الموثوقية ، بناءً على تحليل التباين في نتائج الاختبار. تتوافق موثوقية الاختبار مع نسبة التباين الحقيقي (أي تباين العامل قيد الدراسة) إلى التباين التجريبي الذي تم الحصول عليه بالفعل. الأخير هو مجموع التباين الحقيقي والتباين في خطأ القياس. النهج التحليلي العامل لتعريف الموثوقية يزيل بالإضافة إلى ذلك تشتت المؤشر الحقيقي (ج. جيلفورد ، 1956).

قد يتكون تباين المؤشر الحقيقي ، بدوره ، من تباين العامل المشترك لمجموعات من الاختبارات المتشابهة ، وعوامل محددة توفر اختبارات لتركيز معين ، وتباين العوامل المتأصلة في طريقة اختبار معينة. لذلك ، فإن التباين الكلي للاختبار يساوي مجموع الفروق للعوامل العامة والخاصة وعوامل الوحدة بالإضافة إلى تباين الخطأ

تعد طريقة تباين العوامل لتحديد الموثوقية مناسبة لتقييم اختبار تم تحليله إلى عوامل بالفعل ، ولكن ليس للاختبارات التي تقيس نطاقًا واسعًا من المعلمات المختلفة ، نظرًا لأن بعضها قد لا يتم تضمينه في مجال صلاحية المنهجية المحددة.

الموثوقية وخطأ القياس المسموح به:

يتم تحديد الموثوقية من خلال معيار خطأ القياس. الخطأ هو إحصاء يميز درجة دقة القياسات الفردية. من المفترض أنه بالنسبة لأي سمة ، يكون لكل فرد درجة حقيقية. يختلف أي مؤشر تم الحصول عليه في الاختبار عن قيمته الحقيقية ببعض الأخطاء العشوائية. وإذا اختبرت شخصًا عدة مرات ، فستحصل على انتشار للمؤشر حول القيمة الحقيقية. تتقلب هذه القيمة ضمن حدود معينة. قد يعتمد تذبذب هذه القيمة على أخطاء منهجية وأخطاء عشوائية. قد تكون أسباب الأخطاء المنهجية هي الاختبار غير الصحيح ، وعدم الامتثال للإجراء ، وعدم الدقة في المعالجة ، وانخفاض صلاحية الطريقة. من المحتمل أيضًا حدوث أخطاء عشوائية مرتبطة بالعامل البشري. إذا لم يتم تضمين هذه الإخفاقات في المنهجية ، فلا يمكن اعتبارها دقيقة. مع وجود عدد كبير من الملاحظات ، تشكل التقديرات الفردية نوعًا معينًا من توزيع الإحصاء ، والذي سيكشف عن أخطاء القياس. يتم تحديد خطأ القياس بالطرق الإحصائية - قيمة الانحراف التربيعي المرتبط بتشتت توزيع القياسات الفردية. يجب ألا يتجاوز الخطأ 5٪.

صلاحية:

الصلاحية هي قدرة الاختبار على قياس ما يُقصد قياسه. لم يعد هذا المفهوم يشير إلى الاختبار ، بل يشير إلى الغرض منه. قد يكون الاختبار موثوقًا ولكنه غير صالح. ولكن إذا كان الاختبار صحيحًا ، فإنه يمكن الاعتماد عليه.

مصادر صحة الأفكار:

    ظهرت الأفكار الأولى حتى قبل إنشاء الاختبارات. في كثير من الأحيان ، ربط الباحثون نتائج الأبحاث بالنجاحات المستقبلية. على سبيل المثال ، ربط فيثاغورس التفكير والكلام بمساعدة الحدس.

    فكرة ضرورة التحقق العملي من ملاءمة الاختبار. خارج الممارسة ، لا يمكن أن توجد مشكلة الصحة.

    الأفكار الفلسفية: الحقيقة هي تطابق الفكر مع الواقع. معيار الحقيقة هو المنفعة.

    القياسات التي نجريها ليست واضحة ، فهي تتطلب أساسًا نظريًا. النظرية = الصلاحية التجريبية.

    تطوير العلوم الإحصائية - الارتباط وتحليل العوامل.

خمسة مصادر أدت إلى خمسة أنواع من الصلاحية.

في أوائل القرن العشرين ، لعب الحدس دورًا رائدًا. إذا كان مبتكر الاختبار شخصًا مشهورًا ، فإن الإيمان بالصلاحية قد أخذ في كلامه.

في عشرينيات وثلاثينيات القرن الماضي ، نمت متطلبات الممارسة ، وبدأ إنشاء الاختبارات بناءً على المصادر التجريبية. تم تطوير ثلاثة مناهج تجريبية:

    يتم اختبار جميع المتقدمين للعمل. بمرور الوقت ، يتم قياس إنتاجيتها وكفاءتها. ثم جاء ارتباط المؤشرات. لذلك تم استخدام الاختبارات من أجل المنفعة.

    أولاً ، يتم اختبار أولئك الذين يعملون بالفعل بنجاح ، ثم ترتبط نتائج هذا الاختبار بنتائج المرشحين. إذا كانت هناك علاقة ، فإن الاختبار صالح.

    يعمل بواسطة Binet و Simon. للتأكد من أن الاختبار يقيس الذكاء. تم إجراء جميع مهام الاختبار على مجموعتين ، لم يتم اختيارهما من قبل علماء النفس ، ولكن من قبل المعلمين. في المجموعة 1 كان هناك أطفال لديهم قدرات عقلية عالية ، في المجموعة 2 - مع قدرات غير معبر عنها.كانت هذه الطريقة تسمى "الخبير". تم إجراء مزيد من الاختبارات. وإذا أجابت الأغلبية في كلتا المجموعتين وفقًا لتوقعات المؤلفين ، فسيتم الاعتراف بصحة الاختبار.

وهكذا ، كانت الأساليب التجريبية لإثبات الصلاحية موجودة حتى الخمسينيات من القرن الماضي. بدأوا يعتقدون أنه من الممكن إثبات الصحة ليس فقط بمساعدة الممارسة. التحليل والمراسلات بين النظرية والتطبيق. صدق المحتوى ومقارنته ببرنامج الدراسة ومحتوى الاختبار. يتم تسهيل المقارنة عندما يسلط البرنامج الضوء على المشكلة والغرض والمفاهيم الأساسية. الصلاحية المفاهيمية ، حيث يهتم علماء النفس بربط المفاهيم العلمية بالحقائق الملاحظة تجريبياً.

في الأساليب التجريبية لإثبات الصلاحية ، تلعب المعايير الخارجية دورًا خاصًا كدليل على الصلاحية. حلل علماء النفس الأمريكيان تيفاني وماكورميك استخدام المعايير الخارجية وحددوا 4 أنواع منها:

    معيار الأداء - مقدار العمل المنجز ، معدل نمو المهارة

    المعيار الذاتي - إدراج أنواع مختلفة من الإجابات التي تعكس الموقف تجاه شيء ما.

    المعيار الفسيولوجي - يستخدم في دراسة البيئة.

    معيار العشوائية هو النظر في العديد من العوامل.

يجب أن تفي المعايير الخارجية بمتطلبات الملاءمة ، والتحرر من التداخل ، والموثوقية. الصلة هي المراسلات الدلالية بين اختبار ومعيار حيوي مستقل عنه. يعتبر التحرر من التدخل (التلوث) مهمًا لأن النشاط يتأثر بالشخص نفسه وظروف عمله. الموثوقية - اتساق النتائج

التشخيص (تنافسي) ب. يعكس قدرة الاختبار على التفريق بين الموضوعات وفقًا للسمة التي تتم دراستها. يرتبط تحليل V التشخيصية بتأسيس التطابق بين مؤشرات الاختبار والحالة الحقيقية للخصائص النفسية للموضوع في وقت الفحص. مثال على تعريف هذا النوع من V. يمكن أن يكون دراسة باستخدام طريقة مجموعات التباين. يمكن أن يؤدي إجراء اختبار ذكاء في الأطفال الذين يتطورون بشكل طبيعي وأقرانهم من ذوي الإعاقات الذهنية إلى الكشف عن اختلافات كمية ونوعية عميقة في أداء المهام من قبل المجموعات المقارنة. ستكون درجة موثوقية التمايز بين أطفال المجموعتين الأولى والثانية وفقًا لبيانات الاختبار سمة من سمات التقييم التشخيصي الخامس للتطور العقلي الذي تم الحصول عليه باستخدام هذه التقنية.

صلاحية المحتوى(داخلي ، منطقي) - مجموعة من المعلومات حول تمثيل عناصر الاختبار فيما يتعلق بالخصائص والميزات المقاسة. أحد المتطلبات الرئيسية للتحقق من صحة المنهجية في هذا الاتجاه هو التفكير في محتوى اختبار الجوانب الرئيسية للظاهرة النفسية المدروسة. إذا كان مجال السلوك أو الميزة معقدًا للغاية ، فإن الحرف V. ذي المعنى يتطلب العرض التقديمي في مهام الاختبار لجميع العناصر المكونة الأكثر أهمية للظاهرة قيد الدراسة.

التفاضليه في. - الصلاحية ، وهي تراعي العلاقات الداخلية بين العوامل النفسية التي تم تشخيصها باستخدام تقنية التشخيص النفسي. المحتوى D.V. يمكن توضيح ذلك من خلال مثال الاختبارات ذات الأهمية ، والتي عادةً ما تكون مرتبطة بشكل معتدل بمؤشرات الأداء الأكاديمي الكلي ، ولكنها مرتبطة بدرجات متفاوتة مع الأداء في التخصصات الفردية. V. d. مهم بشكل خاص كمؤشر على القيمة التشخيصية للتقنيات المستخدمة في الاختيار المهني.

وهمي ب.(خطأ) - وهم مطابقة الاستنتاج بناءً على نتائج الاختبار للخصائص الشخصية للموضوع. ينشأ نتيجة لاستخدام عام للغاية ، وبالتالي ينطبق على جميع الصيغ التي تم مسحها تقريبًا ، مثل ، على سبيل المثال ، "معقول في اختيار هدف" ، "يسعى إلى حياة أفضل" ، وما إلى ذلك. يتم قبول هذه العبارات من قبل كل الناس تقريبًا بوصفهم وصفًا دقيقًا لشخصياتهم ، مما يخلق الأساس لأنشطة أنواع مختلفة من الكهان والكهان.

تدريجي في. - (زيادة اللغة الإنجليزية - الزيادة ، الربح) - أحد مكونات صحة المعيار ، الصلاحية التنبؤية للاختبار ، مما يعكس القيمة العملية للمنهجية في الاختيار. في و. يمكن قياسها من حيث صحة المعامل.

إجماع ب. (الصلاحية التوافقية) - نوع من الصلاحية يعتمد على إنشاء اتصال (ارتباط) لبيانات الاختبار بالبيانات الواردة من الخبراء الخارجيين الذين هم على دراية جيدة بالأفراد الذين تم اختبارهم. تم تقديم مفهوم وإجراءات V. to. من قبل R.

تعتبر V. البنائية أحد الأنواع الرئيسية للصلاحية ، حيث تعكس درجة تمثيل التركيب النفسي المدروس في نتائج الاختبار. يمكن أن يكون الذكاء العملي أو اللفظي ، وعدم الاستقرار العاطفي ، والانطواء ، وفهم الكلام ، وتحول الانتباه ، وما إلى ذلك بمثابة بناء. وبعبارة أخرى ، يحدد V. to. منطقة البنية النظرية للظواهر النفسية المقاسة بالاختبار .

ومع ذلك ، تجدر الإشارة إلى أنه ، على عكس التحقق من صحة المعيار ، لا يتطلب تحليل V. to. درجة عالية من الارتباط بين نتائج الاختبارين. إذا اتضح أن الاختبارات الجديدة والمرجعية متطابقة تقريبًا في المحتوى والنتائج ، وأن المنهجية المطورة لا تتمتع بمزايا الإيجاز أو سهولة التطبيق ، فهذا يعني فقط ازدواجية الاختبار ، مبررة فقط من وجهة النظر. إنشاء نموذج اختبار مواز. معنى إجراء V. to. هو إثبات التشابه والاختلاف في الظواهر النفسية المقاسة بالاختبار الجديد مقارنة بالاختبار المعروف.

يتمثل أحد الجوانب المهمة لـ V. to. في الاتساق الداخلي ، مما يعكس كيف تخضع بعض العناصر (المهام والأسئلة) التي تشكل مادة الاختبار للاتجاه الرئيسي للاختبار ككل ، مع التركيز على دراسة نفس البنى. يتم إجراء تحليل الاتساق الداخلي من خلال ربط الإجابات لكل مهمة بنتيجة الاختبار الإجمالية. عند تحديد V. إلى .. مكان مهم ينتمي إلى دراسة ديناميات البناء المقاس. في الوقت نفسه ، يمكننا الاعتماد على فرضيات حول تطورها العمري ، وتأثير التدريب ، والتدريب ، وإتقان مهنة ، وما إلى ذلك.

المعايير الخامسة - مجموعة من الخصائص ، بما في ذلك صحة الطرق الحالية والتنبؤية وتعكس امتثال التشخيص والتشخيص مع مجموعة معينة من المعايير للظاهرة التي يتم قياسها. التحقق من صحة المعيار مستقل عن نتائج الاختبار والمقاييس المباشرة للجودة المدروسة ، مثل مستوى الإنجاز في أي نشاط ، ودرجة تطور القدرة ، وشدة سمة شخصية معينة ، وما إلى ذلك. عند التحقق من صحة الإنجاز الاختبارات ، تتم مقارنة نتيجة القياس مع رأي المعلمين حول المعرفة التي تم فحصها في منطقة معينة ، مع التقييمات الأكاديمية ، واختبارات التحكم ، وما إلى ذلك. تقييمات خبراء المديرين ومع مؤشرات موضوعية للإنجازات في المجال المهني.

واضح V. - فكرة عن الاختبار ونطاقه وفعاليته وقيمته التنبؤية ، والتي تحدث في الموضوع أو شخص آخر ليس لديه معلومات خاصة حول طبيعة الاستخدام وأهداف المنهجية. V. o. ليس أحد مكونات الصلاحية الموضوعية. في نفس الوقت مرتفع حول V. في معظم الحالات مرغوب فيه للغاية. إنه يعمل كعامل يشجع الأشخاص على الفحص ، ويساهم في اتخاذ موقف أكثر جدية ومسؤولية تجاه عمل إكمال مهام الاختبار والاستنتاجات التي صاغها عالم النفس.

مستوى كافٍ من V. حوالي. مهم بشكل خاص لطرق فحص البالغين. تمثيلات الأشخاص ومستخدمي معلومات التشخيص النفسي حول V. o. يتم تحديده إلى حد كبير من خلال اسم التقنية ، لأن هذا الجزء من المعلومات حول الاختبار يمكن الوصول إليه بشكل أكبر لغير المتخصصين. V. o. يحسن بشكل كبير استخدام الصيغ والمصطلحات المفهومة ، بالإضافة إلى المهام الأكثر طبيعية في المحتوى ، مع مراعاة العمر والجنس والخصائص المهنية للموضوعات. المبالغة في تقدير V. about. يساهم في توضيح أكثر وضوحا لتأثير تلوث المعيار.

V. o. تسمى أحيانًا الخارجية (صلاحية الوجه) ، أو "الثقة" (صحة الإيمان) ، الصلاحية.

V. من خلال التمايز العمري هو أحد مكونات صلاحية البناء ، المرتبط بديناميات العمر للتغيرات في الجودة قيد الدراسة. يتكون توصيف صلاحية الإنشاء هنا من تحديد مدى توافق نتائج الاختبار مع التغييرات المتوقعة نظريًا والملاحظة عمليًا المرتبطة بالعمر في بناء أو خاصية معينة.

النذير الخامس - تسمح لك المعلومات حول درجة دقة وصحة التقنية (الاختبار) بالحكم على الجودة النفسية المشخصة بعد فترة زمنية معينة بعد القياس. V. p. تعكس الفاصل الزمني الذي يمتد إليه الأساس المنطقي لهذا الحكم. ترتبط المعلومات حول V.P بشكل مباشر بالكشف عن القدرة التنبؤية للتقنية ، وتوضيح درجة صحة التنبؤ الفوري والأبعد الذي تم صياغته على أساسه ، وتحليل أهمية المؤشرات التي تم الحصول عليها في الاختبار مع ما يسمى ب. استقراء النتائج للمستقبل.

كمعيار للتحقق من صحة المعايير ، لا يمكن لمؤشرات السلوك الفعلي فقط أن تعمل ، ولكن أيضًا النتائج المتوقعة للنشاط ، والعلاج ، والتدريب ، وما إلى ذلك ، نتيجة العلاج ، وما إلى ذلك. لا يرتبط فقط بالحدود الزمنية لمقارنات المعايير. الصلاحية الحالية و V. ص.تطوير الجودة أو النجاح في النشاط - من ناحية أخرى.

يتم التأكيد على أهمية مؤشرات V. p. في تحليل إجراءات الاختبار التي تهدف إلى الاختيار من خلال إدخال مفهوم خاص للصلاحية المتزايدة. يوفر مؤشر V. p. معلومات حول مدى تحسين إجراء الاختيار باستخدام هذا الاختبار مقارنةً بالاختبار التقليدي (يعتمد فقط على المعلومات الرسمية حول الأنشطة السابقة ، وتحليل الملفات الشخصية ، والمحادثات).

معقد المعلومات مع. عادةً ما يكون لها أكبر قيمة للاختبارات التي تفحص الأنشطة القريبة أو المتوافقة مع الأنشطة الحقيقية (غالبًا ما تكون تعليمية أو مهنية). النشاط الذي تتم دراسته ، كقاعدة عامة ، اصطناعي بطبيعته ، ويتكون من العديد من العوامل غير المتجانسة في بعض الأحيان (مظاهر الخصائص الشخصية ، ومجموعة من المعارف والمهارات اللازمة ، وقدرات محددة ، وما إلى ذلك). لذلك ، فإن من أهم المهام في إنشاء نموذج مناسب للنشاط المختبَر اختيار المهام التي ستغطي الجوانب الرئيسية للظاهرة قيد الدراسة بالتناسب الصحيح مع النشاط الحقيقي ككل.

الحالي V. (تشخيصي ، تنافسي) - سمة من سمات الاختبار ، تعكس قدرته على التمييز بين الموضوعات على أساس ميزة التشخيص التي هي موضوع الدراسة في هذه التقنية. مستويات القدرات العامة ، والادعاءات ، والذكاء اللفظي ، والقلق ، وما إلى ذلك يمكن أن تكون بمثابة علامات. بمعنى أضيق ، Vt هو إنشاء امتثال نتائج اختبار التحقق من صحته بمعيار مستقل يعكس حالة الجودة قيد الدراسة بالاختبار وقت الدراسة.

نوع من مؤشرات V. t. عبارة عن مجموعة من المعلومات حول مدى ملاءمة الاختبار واقتصادياته مقارنة بالحصول على معلومات حول الجودة التي يتم دراستها من مصادر أخرى (الملاحظة ، تحليل البيانات الموضوعية ، مراجعة الأقران ، إلخ).

بيئي V. - صحة الاختبار فيما يتعلق بالممتلكات المقاسة في سياق حالة معينة. V. ه. هي خاصية للاختبار ، تتجلى في حقيقة أن استخدامه في حل المشكلات العملية المختلفة يؤدي إلى تفسير مختلف نوعيًا لنتائج الاختبار (V.N. Druzhinin ، 1990).

تجريبي ب- مجموعة من خصائص صدق الاختبار تم الحصول عليها بطريقة التقييم الإحصائي المقارن. يتعلق بشكل أساسي بمجال صلاحية المعيار وأنواعه: الصلاحية الحالية والصلاحية التنبؤية. إذا ، عند تحديد صلاحية اختبار ذي مغزى ، يتم إجراء تقييم الاختبار باستخدام إجراءات نوعية مختلفة للحصول على المعلومات بالطرق الوصفية باستخدام تقييمات الخبراء ومصادر المعلومات الأخرى (لإصدار حكم حول امتثال مهام الاختبار مع محتوى موضوع القياس) ، ثم V. ه. يقاس دائمًا بالارتباط الإحصائي. يتم إجراء تحليل ارتباط للعلاقة بين سلسلتين من القيم - درجات الاختبار والمؤشرات للمعلمة الخارجية للممتلكات قيد الدراسة (أو نتائج اختبار آخر ، والتي تُعرف صحتها).