السير الذاتية صفات التحليلات

نظرية الاختبارات واختبارات اللياقة البدنية للطلاب. المفاهيم الأساسية لنظرية الاختبار

أساسيات نظرية الاختبار 1. المفاهيم الأساسية لنظرية الاختبار 2. موثوقية الاختبارات وطرق تحديدها

أسئلة الاختبار 1. ما يسمى الاختبار؟ 2. ما هي متطلبات الاختبار؟ 3. ما هي الاختبارات التي تسمى أصلية؟ 4. ما يسمى موثوقية الاختبار؟ 5. اذكر الأسباب التي تؤدي إلى اختلاف النتائج عند إعادة الاختبار. 6. ما هو الفرق بين الاختلاف داخل الفصل والاختلاف بين الطبقات؟ 7. كيف تحدد عمليا موثوقية الاختبار؟ 8. ما هو الفرق بين اختبار الاتساق والثبات؟ 9. ما هو معادلة الاختبارات؟ 10. ما هي مجموعة الاختبار المتجانسة؟ 11. ما هي مجموعة الاختبار غير المتجانسة؟ 12. طرق تحسين موثوقية الاختبارات.

الاختبار هو قياس أو اختبار يتم إجراؤه لتحديد حالة الشخص أو قدراته. لا يمكن استخدام جميع القياسات كاختبارات ، ولكن يمكن استخدام القياسات التي تفي بالمتطلبات الخاصة فقط. وتشمل هذه: 1. التوحيد (يجب أن تكون الإجراءات وظروف الاختبار هي نفسها في جميع حالات تطبيق الاختبار) ؛ 2. الموثوقية. 3. مفيدة. 4. توافر نظام التصنيف.

متطلبات الاختبار: إعلامي - درجة الدقة التي يقيس بها الخاصية (الجودة ، والقدرة ، والخصائص) التي يتم استخدامها من أجلها. الموثوقية n - درجة التوافق بين النتائج عندما يتم اختبار نفس الأشخاص بشكل متكرر في ظل نفس الظروف. الاتساق - (أشخاص مختلفون ، لكن نفس الأجهزة ونفس الشروط). n n الشروط القياسية - (نفس الشروط للقياسات المتكررة). n وجود نظام الدرجات - (التحويل إلى نظام الدرجات. كما في المدرسة 5 -4 -3..).

تسمى الاختبارات التي تفي بمتطلبات الموثوقية والمعلوماتية بأنها جيدة أو أصلية (أصلية يونانية - بطريقة موثوقة)

تسمى عملية الاختبار الاختبار ؛ القياس الناتج قيمة عددية- نتيجة الاختبار (أو نتيجة الاختبار). على سبيل المثال ، يعد الجري لمسافة 100 متر بمثابة اختبار ، ويتم اختبار إجراء السباقات والتوقيت ، ووقت التشغيل هو نتيجة الاختبار.

تسمى الاختبارات القائمة على المهام الحركية اختبارات المحرك أو المحرك. يمكن أن تكون نتائجهم إما إنجازات حركية (وقت مرور المسافة ، عدد التكرارات ، المسافة المقطوعة ، إلخ) ، أو مؤشرات فسيولوجية وكيميائية حيوية.

في بعض الأحيان ، لا يتم استخدام اختبار واحد ، ولكن يتم استخدام عدة اختبارات لها هدف نهائي واحد (على سبيل المثال ، تقييم حالة الرياضي في فترة التدريب التنافسية). تسمى هذه المجموعة من الاختبارات مجموعة معقدة أو مجموعة من الاختبارات.

يجب أن يعطي نفس الاختبار ، المطبق على نفس الأشخاص ، نتائج متطابقة في ظل نفس الظروف (ما لم يتغير الأشخاص أنفسهم). ومع ذلك ، مع التوحيد الصارم والمعدات الدقيقة ، تختلف نتائج الاختبار دائمًا إلى حد ما. على سبيل المثال ، الباحث ، الذي أظهر للتو نتيجة 215 k.G في اختبار قياس دينامومتر العمود الفقري ، عند التكرار ، أظهر فقط 190 k.

موثوقية الاختبارات وطرق تحديدها موثوقية الاختبار هي درجة الاتفاق بين النتائج عند إعادة اختبار نفس الأشخاص (أو كائنات أخرى) في نفس الظروف.

يسمى التباين في النتائج أثناء الاختبار المتكرر داخل الفرد أو داخل المجموعة أو داخل الفصل. هناك أربعة أسباب رئيسية وراء هذا الاختلاف: 1. التغيرات في حالة الموضوعات (التعب ، التمرين ، "التعلم" ، التغيرات في الحافز ، التركيز ، إلخ). 2. التغيرات غير المنضبطة في الظروف الخارجية والمعدات (درجة الحرارة ، الرياح ، الرطوبة ، الفولتية في التيار الكهربائي ، وجود أشخاص غير مصرح لهم ، إلخ) ، أي كل شيء يتم دمجه مع مصطلح "خطأ قياس عشوائي".

هناك أربعة أسباب رئيسية وراء هذا الاختلاف: 3. تغيير في حالة الشخص الذي يدير الاختبار أو يقيمه (وبالطبع استبدال مجرب أو قاض بآخر). 4. النقص في الاختبار (هناك اختبارات من الواضح أنها لا يمكن الاعتماد عليها. على سبيل المثال ، إذا أجرى المشاركون رميات حرة في سلة كرة السلة ، فحتى لاعب كرة السلة الذي حصل على نسبة عالية من الضربات يمكن أن يرتكب خطأً بالخطأ في الرميات الأولى) .

مفهوم نتيجة الاختبار الحقيقية هو تجريد (لا يمكن قياسه من خلال التجربة). لذلك ، يجب استخدام الطرق غير المباشرة. يعتبر تحليل التباين مع الحساب اللاحق لمعاملات الارتباط داخل الطبقة هو الأفضل لتقييم الموثوقية. يسمح لك تحليل التباين بتحليل التباين في نتائج الاختبار المسجلة في التجربة إلى مكونات بسبب تأثير العوامل الفردية.

إذا قمت بتسجيل نتائج مواضيع الاختبار في أي اختبار ، وكرر هذا الاختبار في أيام مختلفة ، وقمت بعدة محاولات كل يوم ، وتغيير المجربين بشكل دوري ، فستكون هناك اختلافات: أ) من موضوع الاختبار إلى موضوع الاختبار ؛ ن ب) من يوم لآخر ؛ ن ج) من المجرب إلى المجرب ؛ ن د) من محاولة المحاولة. يتيح تحليل التباين عزل هذه الاختلافات وتقييمها. ن

وبالتالي ، من أجل تقييم موثوقية الاختبار عمليًا ، من الضروري ، n أولاً ، إجراء تحليل التباين ، n ثانيًا ، لحساب معامل الارتباط داخل الصف (معامل الموثوقية).

عند الحديث عن موثوقية الاختبارات ، من الضروري التمييز بين ثباتها (قابلية التكاثر) ، والاتساق ، والتكافؤ. n n يشير ثبات الاختبار إلى إمكانية تكرار النتائج عند تكراره بعد ذلك وقت محددتحت نفس الظروف. يشار إلى إعادة الاختبار عادة باسم إعادة الاختبار. يتسم اتساق الاختبار باستقلالية نتائج الاختبار عن الصفات الشخصية للشخص الذي يجري الاختبار أو يقيمه.

إذا كانت جميع الاختبارات المضمنة في أي مجموعة اختبار متكافئة للغاية ، فيُطلق عليها اسم متجانسة. يقيس هذا المجمع بأكمله خاصية واحدة من المهارات الحركية البشرية (على سبيل المثال ، مجمع يتكون من قفزات من مكان في الطول ، صعودًا وثلاثة أضعاف ؛ يتم تقييم مستوى تطوير صفات قوة السرعة). إذا لم تكن هناك اختبارات مكافئة في المجمع ، أي أن الاختبارات المضمنة فيه تقيس خصائص مختلفة ، فيُطلق عليها اسم غير متجانسة (على سبيل المثال ، مجمع يتكون من قياس ديناميكي قائم ، قفزة Abalakov ، مسافة 100 متر).

يمكن تحسين موثوقية الاختبارات إلى حد ما عن طريق: n n n a) توحيد معايير أكثر صرامة للاختبار ؛ ب) زيادة عدد المحاولات ؛ ج) زيادة عدد المقيّمين (قضاة ، تجارب) وزيادة اتساق آرائهم ؛ د) زيادة عدد الاختبارات المعادلة ؛ هـ) تحفيز أفضل للمواضيع.

يسمى القياس أو الاختبار الذي يتم إجراؤه لتحديد حالة أو قدرة الرياضي اختبار. لا يمكن استخدام جميع القياسات كاختبارات ، ولكن فقط تلك التي تفي بالمتطلبات الخاصة: التوحيد القياسي ، وتوافر نظام التصنيف ، والموثوقية ، ومحتوى المعلومات ، والموضوعية. تسمى الاختبارات التي تفي بمتطلبات الموثوقية والمعلوماتية والموضوعية يبدو.

تسمى عملية الاختبار اختبارات، والقيم العددية التي تم الحصول عليها نتيجة القياس هي نتيجة الاختبار.

تسمى الاختبارات على أساس المهام الحركية محركأو محرك. يتم تمييز ثلاث مجموعات من الاختبارات الحركية حسب المهمة التي يواجهها الباحث.

أنواع مختلفة من الاختبارات الحركية

اسم الاختبار

مهمة للرياضي

نتيجة الاختبار

ممارسة السيطرة

الإنجازات الحركية

وقت تشغيل 1500 متر

الاختبارات الوظيفية القياسية

نفس الشيء بالنسبة للجميع ، بجرعات: 1) حسب حجم العمل المنجز ؛ 2) حسب حجم التغيرات الفسيولوجية

المعلمات الفسيولوجية أو البيوكيميائية أثناء العمل القياسي خلال المعلمات الحركية قيمة قياسيةالتغيرات الفسيولوجية

تسجيل معدل ضربات القلب عند العمل القياسي 1000 كجم / دقيقة سرعة الجري بمعدل ضربات القلب 160 نبضة / دقيقة

التجارب الوظيفية القصوى

تظهر النتيجة القصوى

المعلمات الفسيولوجية أو البيوكيميائية

تحديد الحد الأقصى لدين الأكسجين أو الحد الأقصى لاستهلاك الأكسجين

في بعض الأحيان لا يتم استخدام اختبار واحد ، ولكن يتم استخدام عدة اختبارات لها هدف نهائي واحد. تسمى هذه المجموعة من الاختبارات مجموعة من الاختبارات.

من المعروف أنه حتى مع التقييس الأكثر صرامة والأجهزة الدقيقة ، فإن نتائج الاختبار تختلف دائمًا إلى حد ما. لذلك ، فإن أحد الشروط المهمة لاختيار الاختبارات الجيدة هو موثوقيتها.

موثوقية الاختبارهي درجة التوافق بين النتائج عندما يتم اختبار نفس الأشخاص مرارًا وتكرارًا في ظل نفس الظروف. هناك أربعة أسباب رئيسية تسبب الاختلاف داخل الفرد أو داخل المجموعة في نتائج الاختبار:

    تغيير في حالة الأشخاص (الإرهاق ، التغيير في الدافع ، إلخ) ؛ التغييرات غير المنضبط في الظروف والمعدات الخارجية ؛

    تغيير في حالة الشخص الذي يجري الاختبار أو يقيمه (الصحة ، استبدال المجرب ، إلخ) ؛

    عيب في الاختبار (على سبيل المثال ، من الواضح أن الاختبارات غير كاملة وغير موثوقة - رميات حرة في سلة كرة السلة قبل الخطأ الأول ، وما إلى ذلك).

يمكن أن يكون معيار موثوقية الاختبار عامل الموثوقيةمحسوبة كنسبة التباين الحقيقي إلى التباين المسجل في التجربة: r = true s 2 / s 2 المسجل ، حيث يُفهم أن القيمة الحقيقية هي التباين الذي تم الحصول عليه بعدد لا حصر له من الملاحظات في ظل نفس الظروف ؛ التباين المبلغ عنه مشتق من الدراسات التجريبية. وبعبارة أخرى ، فإن معامل الموثوقية هو ببساطة نسبة الاختلاف الحقيقي في التباين المسجل في التجربة.

بالإضافة إلى هذا المعامل ، نستخدم أيضًا مؤشر الموثوقية، والذي يعتبر معاملًا نظريًا للارتباط أو الارتباط بين القيم المسجلة والحقيقية لنفس الاختبار. هذه الطريقة هي الأكثر شيوعًا كمعيار لتقييم جودة (موثوقية) الاختبار.

واحدة من خصائص موثوقية الاختبار هي التكافؤ، والتي تعكس درجة التوافق بين نتائج الاختبار من نفس الجودة (على سبيل المثال ، المادية) من خلال اختبارات مختلفة. يعتمد الموقف تجاه معادلة الاختبار على المهمة المحددة. من ناحية ، إذا كان اختباران أو أكثر متكافئين ، فإن استخدامهما المشترك يزيد من موثوقية التقديرات ؛ من ناحية أخرى ، يبدو أنه من الممكن تطبيق اختبار مكافئ واحد فقط ، والذي من شأنه تبسيط الاختبار.

إذا كانت جميع الاختبارات في مجموعة الاختبارات متكافئة للغاية ، يتم استدعاؤها متجانس(على سبيل المثال ، لتقييم جودة القدرة على القفز ، متجانسة ، يفترض ، ستكون هناك قفزات من مكان في الطول ، أعلى ، ثلاثية). على العكس من ذلك ، إذا لم يكن هناك اختبارات مكافئة في المجمع (على سبيل المثال ، لتقييم اللياقة البدنية العامة) ، فإن جميع الاختبارات المدرجة فيه تقيس خصائص مختلفة ، أي في جوهره المجمع غير متجانسة.

يمكن تحسين موثوقية الاختبارات إلى حد معين من خلال:

    توحيد أكثر صرامة للاختبار ؛

    زيادة عدد المحاولات

    زيادة عدد المقيّمين وزيادة اتساق آرائهم ؛

    زيادة عدد الاختبارات المعادلة ؛

    تحفيز أفضل للأشخاص الخاضعين للاختبار.

اختبار الموضوعيةهناك حالة خاصة من الموثوقية ، أي استقلالية نتائج الاختبار عن الشخص الذي يجري الاختبار.

المعلوماتية للاختبارهي درجة الدقة التي تقيس بها الخاصية (جودة الرياضي) التي تستخدم من أجلها. في حالات مختلفة ، قد يكون لنفس الاختبارات معلوماتية مختلفة. يتم تقسيم مسألة المحتوى المعلوماتي للاختبار إلى سؤالين محددين:

ماذا يتغير هذا الاختبار؟ ما مدى دقة القياس؟

على سبيل المثال ، هل من الممكن استخدام مؤشر مثل MOC للحكم على مدى استعداد العدائين لمسافات طويلة ، وإذا كان الأمر كذلك ، فما درجة الدقة؟ هل يمكن استخدام هذا الاختبار في عملية التحكم؟

إذا تم استخدام الاختبار لتحديد حالة الرياضي وقت الفحص ، فيقولون عنه التشخيصالمعلوماتية للاختبار. إذا أرادوا ، بناءً على نتائج الاختبار ، التوصل إلى استنتاج حول الأداء المستقبلي المحتمل للرياضي ، فإنهم يتحدثون عن تنبؤيغنيا بالمعلومات. قد يكون الاختبار مفيدًا من الناحية التشخيصية ، ولكنه ليس تنبؤيًا والعكس صحيح.

يمكن وصف درجة المعلوماتية من الناحية الكمية - على أساس البيانات التجريبية (ما يسمى ب تجريبيإعلامي) ونوعي - بناءً على تحليل ذي مغزى للوضع ( منطقيغنيا بالمعلومات). على الرغم من أنه في العمل العملي ، يجب أن يسبق التحليل المنطقي أو الهادف دائمًا التحليل الرياضي. مؤشر محتوى المعلومات للاختبار هو معامل الارتباط المحسوب لاعتماد المعيار على النتيجة في الاختبار ، والعكس صحيح (مؤشر يعكس بوضوح الخاصية التي سيتم قياسها باستخدام الاختبار يؤخذ على أنه معيار).

في حالة عدم كفاية محتوى المعلومات لأي اختبار ، يتم استخدام مجموعة من الاختبارات. ومع ذلك ، فإن هذا الأخير ، حتى في ظل وجود معايير منفصلة عالية للمعلوماتية (إذا حكمنا من خلال معاملات الارتباط) ، لا يسمح للشخص بالحصول على رقم واحد. مزيد من المساعدة يمكن أن تأتي هنا. طريقة معقدةالإحصاء الرياضي - تحليل العوامل.مما يسمح لك بتحديد عدد الاختبارات التي تعمل معًا على عامل معين وما هي درجة مساهمتها في كل عامل وأيها. وبعد ذلك يكون من السهل اختيار الاختبارات (أو مجموعات منها) التي تقيِّم العوامل الفردية بدقة أكبر.

1 ما هو الاختبار؟

2 ما هو الاختبار؟

القياس الكمي لنوعية أو حالة رياضي قياس أو اختبار يتم إجراؤه لتحديد حالة أو قدرة رياضي عملية اختبار يتم فيها تحديد جودة أو حالة رياضي كميًا لا يلزم تعريف

3 ما هي نتيجة الاختبار؟

القياس الكمي لنوعية أو حالة رياضي قياس أو اختبار يتم إجراؤه لتحديد حالة أو قدرة رياضي عملية اختبار يتم فيها تحديد جودة أو حالة رياضي كميًا لا يلزم تعريف

4 ما هو نوع الاختبار 100 متر المدى?

5 ما هو نوع الاختبار قياس الدينامومتر الرسغي?

تمرين التحكم اختبار وظيفي أقصى اختبار وظيفي

6 ما نوع الاختبارات التي تنتمي إليها العينة؟ IPC?

تمرين التحكم اختبار وظيفي أقصى اختبار وظيفي

7 ما هو نوع الاختبار 3 دقائق المسرع تشغيل?

تمرين التحكم اختبار وظيفي أقصى اختبار وظيفي

8 ما هو نوع الاختبار أقصى عدد من عمليات السحب على الشريط?

تمرين التحكم اختبار وظيفي أقصى اختبار وظيفي

9 متى يعتبر الاختبار مفيدًا؟

10 متى يعتبر الاختبار موثوقًا به؟

قدرة الاختبار على تكرار النتائج عند إعادة الاختبار قدرة الاختبار على قياس جودة اهتمام الرياضي استقلالية نتائج الاختبار عن الشخص الذي يجري الاختبار

11 متى يعتبر الاختبار موضوعيًا؟

قدرة الاختبار على تكرار النتائج عند إعادة الاختبار قدرة الاختبار على قياس جودة اهتمام الرياضي استقلالية نتائج الاختبار عن الشخص الذي يجري الاختبار

12 ما هو المعيار المطلوب عند تقييم اختبار المعلوماتية؟

13 ما هو المعيار المطلوب عند تقييم اختبار الموثوقية؟

اختبار الطالب T- اختبار F-Fisher معامل الارتباط تحديد معامل التباين

14 ما هو المعيار المطلوب عند تقييم اختبار الموضوعية؟

اختبار الطالب T- اختبار F-Fisher معامل الارتباط تحديد معامل التباين

15 ما هي المعلوماتية التي يطلق عليها الاختبار إذا تم استخدامه لتقييم درجة لياقة الرياضي؟

16 ما هو محتوى المعلومات في تمارين التحكم الذي يوجهه المدرب ، عند اختيار الأطفال في قسمه الرياضي؟

التشخيص التجريبي المنطقي التنبئي

17 هل تحليل الارتباط ضروري لتقييم محتوى المعلومات في الاختبارات؟

18 هل تحليل العوامل ضروري لتقييم محتوى المعلومات في الاختبارات؟

19 هل يمكن لتحليل الارتباط تقييم موثوقية الاختبار؟

20 هل يمكن تقييم موضوعية الاختبار باستخدام تحليل الارتباط؟

21 هل الاختبارات المصممة لتقييم اللياقة العامة ستكون مكافئة؟

22 عند قياس نفس الجودة باختبارات مختلفة ، يتم استخدام الاختبارات ...

مصممة لقياس نفس الجودة وجود علاقة ارتباط عالية بين بعضها البعض وجود علاقة منخفضة بين بعضها البعض

أساسيات نظرية التقييم

لتقييم النتائج الرياضية ، غالبًا ما تستخدم جداول النتائج الخاصة. الغرض من هذه الجداول هو تحويل النتيجة الرياضية الموضحة (المعبر عنها في مقاييس موضوعية) إلى نقاط شرطية. يسمى قانون تحويل النتائج الرياضية إلى نقاط مقياس التصنيف. يمكن تحديد المقياس كتعبير رياضي أو جدول أو رسم بياني. هناك 4 أنواع رئيسية من المقاييس المستخدمة في الرياضة والتربية البدنية.

المقاييس النسبية

مقاييس الانحدار

المقاييس التقدمية.

المقاييس النسبيةافترض تراكم نفس عدد النقاط لزيادة متساوية في النتائج (على سبيل المثال ، لكل 0.1 ثانية من التحسين في النتيجة في 100 متر ، يتم منح 20 نقطة). تُستخدم هذه المقاييس في الخماسي الحديث ، والتزلج السريع ، والتزلج الريفي على الثلج ، ورياضة الشمال مجتمعة ، والبيثلون وغيرها من الرياضات.

مقاييس الانحداريعني الاستحقاق ، لنفس الزيادة في النتيجة مع زيادة الإنجازات الرياضية ، الكل عدد أقلنقاط (على سبيل المثال ، لتحسين النتيجة في مسافة 100 متر من 15.0 إلى 14.9 ثانية ، تتم إضافة 20 نقطة ، ولمدة 0.1 ثانية في نطاق 10.0-9.9 ثانية - 15 نقطة فقط).

المقاييس التقدمية.هنا ، كلما زادت النتيجة الرياضية ، زادت الزيادة في النقاط لتحسينها (على سبيل المثال ، لتحسين وقت الجري من 15.0 إلى 14.9 ثانية ، تتم إضافة 10 نقاط ، ومن 10.0 إلى 9.9 ثانية ، تتم إضافة 100 نقطة). تستخدم المقاييس التقدمية في السباحة وأنواع معينة من ألعاب القوى ورفع الأثقال.

المقاييس السينيةنادرًا ما تستخدم في الرياضة ، ولكنها تستخدم على نطاق واسع في تقييم اللياقة البدنية (على سبيل المثال ، هذا هو الشكل الذي يبدو عليه مقياس معايير اللياقة البدنية لسكان الولايات المتحدة). في هذه المقاييس ، يتم تشجيع التحسين في مجالات الأداء المنخفضة جدًا والعالية جدًا ؛ يتم اكتساب معظم النقاط من خلال الزيادة في النتائج في المنطقة الوسطى من الإنجازات.

المهام الرئيسية للتقييم هي:

    مقارنة الإنجازات المختلفة في نفس المهمة ؛

    مقارنة الإنجازات في المهام المختلفة ؛

    تحديد المعايير.

نورمافي علم القياس الرياضي ، يتم استدعاء القيمة الحدودية للنتيجة ، والتي تعمل كأساس لتعيين رياضي إلى إحدى مجموعات التصنيف. هناك ثلاثة أنواع من القواعد: المقارنة ، الفردية ، المستحقة.

المعايير المقارنةتستند إلى مقارنة الأشخاص الذين ينتمون إلى نفس السكان. على سبيل المثال ، تقسيم الأشخاص إلى مجموعات فرعية وفقًا لدرجة المقاومة (عالية ، متوسطة ، منخفضة) أو التفاعل (مفرط التفاعل ، رد الفعل المعياري ، ناقص التفاعل) لنقص الأكسجة.

التدرجات المختلفة للتقييمات والمعايير

نسبة الخاضعين للاختبار

المعايير في المقاييس

لفظي

بالنقاط

النسبة المئوية

منخفظ جدا

أقل من M - 2

من M - 2 إلى M - 1

أقل من المتوسط

من M-1 إلى M-0.5

من М –0.5 إلى + 0.5

فوق المتوسط

من М + 0.5 إلى + 1

من M + 1 إلى M + 2

عالي جدا

فوق M + 2

تميز هذه المعايير فقط النجاح المقارن للمواضيع في مجموعة سكانية معينة ، لكن لا تقول أي شيء عن السكان ككل (أو في المتوسط). لذلك ، يجب مقارنة المعايير المقارنة بالبيانات التي تم الحصول عليها من مجموعات سكانية أخرى واستخدامها جنبًا إلى جنب مع المعايير الفردية والمعايير الواجبة.

القواعد الفرديةبناءً على مقارنة أداء نفس الرياضي في حالات مختلفة. على سبيل المثال ، في العديد من الرياضات لا توجد علاقة بين وزن الجسم والأداء الرياضي. يتمتع كل رياضي بوزن أمثل فرديًا يتوافق مع حالة الشكل الرياضي. يمكن التحكم في هذا المعدل في مراحل مختلفة من التدريب الرياضي.

المعايير الواجبةبناءً على تحليل لما يجب أن يكون الشخص قادرًا على التعامل بنجاح مع المهام التي تحددها الحياة أمامه. مثال على ذلك يمكن أن يكون معايير المجمعات الفردية للتدريب البدني ، والقيم المناسبة لـ VC ، والتمثيل الغذائي الأساسي ، ووزن الجسم والطول ، إلخ.

1 هل من الممكن قياس جودة التحمل بشكل مباشر؟

2 هل من الممكن قياس جودة السرعة بشكل مباشر؟

3 هل من الممكن قياس جودة البراعة مباشرة؟

4 هل يمكن قياس جودة المرونة بطريقة مباشرة؟

5 هل من الممكن قياس قوة العضلات الفردية بشكل مباشر؟

6 هل يمكن التعبير عن التقييم بخاصية نوعية (جيد ، مرض ، سيئ ، ناجح ، إلخ)؟

7 هل هناك فرق بين مقياس القياس ومقياس التصنيف؟

8 ما هو مقياس التصنيف؟

نظام قياس النتائج الرياضية قانون تحويل النتائج الرياضية إلى نقاط نظام تقييم المعايير

9 المقياس يتضمن الاستحقاق نفس العددنقاط لزيادة متساوية في النتائج. هو - هي …

10 للحصول على نفس الزيادة في النتيجة ، مع زيادة الإنجازات الرياضية ، يتم منح عدد أقل من النقاط. هو - هي …

المقياس التدريجي المقياس الانحداري المقياس النسبي المقياس السيني

11 كلما زادت النتيجة الرياضية ، زادت الزيادة في النقاط لتقييم تحسنها. هو - هي …

المقياس التدريجي المقياس الانحداري المقياس النسبي المقياس السيني

12 التحسن في مجالات الأداء المنخفض جدًا والعالي جدًا يكافأ بشكل ضئيل ؛ يتم اكتساب معظم النقاط من خلال الزيادة في النتائج في المنطقة الوسطى من الإنجازات. هو - هي …

المقياس التدريجي المقياس الانحداري المقياس النسبي المقياس السيني

13 تسمى القواعد المستندة إلى مقارنة الأشخاص الذين ينتمون إلى نفس السكان ...

14 قاعدة على أساس مقارنة أداء نفس الرياضي في دول مختلفةوتسمى...

المعايير الفردية المعايير الواجبة المعايير المقارنة

15 القواعد المستندة إلى تحليل ما يجب أن يكون الشخص قادرًا على القيام به من أجل التعامل مع المهام الموكلة إليه تسمى ...

المعايير الفردية المعايير الواجبة المعايير المقارنة

المفاهيم الأساسية للجودة

قياس الجودةدراسات (خطوط الطول - الجودة ، المترون - القياس) وتطويرها الأساليب الكميةتقييم السمات النوعية.

يعتمد Qualimetry على عدة نقاط انطلاق:

يمكن قياس أي جودة ؛

تعتمد الجودة على عدد من الخصائص التي تشكل "شجرة الجودة" (على سبيل المثال ، تتكون شجرة الجودة للتمارين في التزلج على الجليد من ثلاثة مستويات - مرتفع ، متوسط ​​، منخفض) ؛

يتم تحديد كل خاصية برقمين: المؤشر النسبي والوزن ؛ مجموع أوزان الخصائص في كل مستوى يساوي واحدًا (أو 100٪).

تنقسم الأساليب المنهجية للقياس إلى مجموعتين:

إرشادية (حدسية) ، بناءً على تقييمات الخبراء واستبياناتهم ؛

مفيدة.

خبيريسمى التقييم الذي تم الحصول عليه من خلال طلب آراء المتخصصين. أمثلة نموذجية للخبرة: الحكم في الجمباز والتزلج على الجليد ، المنافسة على الأفضل عمل علميإلخ.

يشمل إجراء الفحص المراحل الرئيسية التالية: تشكيل هدفه ، واختيار الخبراء ، واختيار المنهجية ، وإجراء مسح ومعالجة المعلومات الواردة ، بما في ذلك تقييم اتساق تقييمات الخبراء الفردية. أثناء الفحص ، درجة توافق آراء الخبراء مقدرة بالقيمة معامل ارتباط الرتبة(في حالة وجود عدة خبراء). وتجدر الإشارة إلى أن ارتباط الرتب يكمن وراء حل العديد من مشاكل القياس النوعي ، لأنه يسمح بالحسابات الرياضية بسمات نوعية.

من الناحية العملية ، غالبًا ما يكون مؤشر مؤهل الخبير هو انحراف تقديراته عن متوسط ​​تقديرات مجموعة الخبراء.

استجوابتسمى طريقة جمع الآراء بملء الاستبيانات. يشير طرح الأسئلة ، جنبًا إلى جنب مع المقابلات والمحادثات ، إلى طرق المسح. على عكس المقابلات والمحادثات ، يتضمن طرح الأسئلة إجابات مكتوبة من الشخص الذي يملأ الاستبيان - المستفتى - لنظام الأسئلة الموحدة. يسمح لك بدراسة دوافع السلوك والنوايا والآراء وما إلى ذلك.

يمكن استخدام الاستبيانات لحل العديد من المشكلات العملية في الرياضة: تقييم الحالة النفسية للرياضي ؛ موقفه من طبيعة وتوجيه الدورات التدريبية ؛ العلاقات الشخصية في الفريق ؛ التقييم الخاص للجاهزية الفنية والتكتيكية ؛ تقييم التغذية وغيرها الكثير.

1 ما الذي يدرسه القياس؟

يدرس جودة الاختبارات ويدرس الخصائص النوعية للميزة ويطور الأساليب الكمية لتقييم الجودة

2 الأساليب الرياضية المستخدمة في القياس؟

الارتباط الزوجي تحليل التباين ارتباط الرتبة

3 ما هي الأساليب المستخدمة لتقييم مستوى الأداء؟

4 ما هي الأساليب المستخدمة لتقييم تنوع العناصر التقنية؟

طريقة الاستبيان طريقة تقييم الخبراء الطريقة غير محددة

5 ما هي الأساليب المستخدمة لتقييم تعقيد العناصر التقنية؟

طريقة الاستبيان طريقة تقييم الخبراء الطريقة غير محددة

6 ما هي الأساليب المستخدمة للتقييم حالة نفسيةرياضي؟

طريقة الاستبيان طريقة تقييم الخبراء الطريقة غير محددة

تطورت مشكلة اختبار اللياقة البدنية للفرد في نظرية ومنهجية التربية البدنية ، والمقاييس الرياضية ، وعلم الحركة البشرية ، والميكانيكا الحيوية ، والطب الرياضي وغيرها من العلوم. على مدار حوالي 130-140 عامًا من تاريخ هذه المشكلة ، تراكمت مادة ضخمة وأكثرها تنوعًا ، والتي كانت دائمًا تثير ولا تزال تثير اهتمامًا كبيرًا ليس فقط من العلماء ، ولكن أيضًا من معلمي التربية البدنية والمدربين والطلاب ومهاراتهم. الآباء والأمهات.

المقال الأول المخصص للمشكلة قيد النظر هو مقال تمهيدي. ويكشف عن أساسيات نظرية الاختبارات والاختبارات ، دون الإلمام بها والتي يصعب على المعلم حل مشاكل تطبيق الاختبارات في ممارسة عمله. دعونا نذكر على الأقل بعض الأسئلة التي تظهر. ما هو "الاختبار"؟ ما هو تصنيف الاختبارات؟ لماذا ومن الضروري اختبار اللياقة البدنية للطلاب؟ كيف نحدد المستوى (عالي ، متوسط ​​، منخفض) لتنمية الصفات البدنية واللياقة البدنية؟ ما هو المعيار عند الاختبار وكيفية ضبطه؟ إذا توصل المعلم إلى اختبار حركي جديد أو مجموعة من الاختبارات لتحديد اللياقة البدنية للأطفال ، فما الذي يجب عليه الانتباه إليه أو ما هي الشروط الضرورية (المتطلبات والمعايير) التي يجب تلبيتها؟ يتضمن اختبار الحالة البدنية للطلاب التعرف الإجباري للمعلم على الأساليب الأولية الإحصاء الرياضي. مع أي منهم؟

في مقالاتنا ، سنقدم أيضًا معلومات تاريخية حول ظهور الاختبارات ونظرية اختبار اللياقة البدنية للشخص. دعنا نقول متى وأين ظهرت الاختبارات الأولى ، بما في ذلك بطاريات الاختبارات لتقييم اللياقة البدنية. ما هي الاختبارات الأكثر شيوعًا لتحديد التكييف (القوة ، السرعة ، التحمل ، المرونة) وقدرات التنسيق لدى الأطفال سن الدراسة؟ ما هي بطاريات (برامج) الاختبارات لتقييم اللياقة البدنية للأطفال والمراهقين الأكثر شيوعًا فيها دول مختلفة؟ سنناقش أيضًا مشكلة عملية مهمة مثل نسبة نتائج الاختبار والدرجات (العلامات) في الموضوع " الثقافة البدنية". وبشكل أكثر تحديدًا ، إذا كان الطالب يحصل باستمرار على درجات عالية في الاختبارات ، فهل هذا يعني تلقائيًا تقييم ممتازفي موضوعنا؟ وهلم جرا.

في هذه المقالة سوف نناقش: 1) مهام الاختبار. 2) مفهوم "الاختبار" وتصنيف اختبارات المحركات (المحركات) ؛ 3) معايير عامل الجودة لاختبارات المحرك ؛ 4) تنظيم اختبارات اللياقة البدنية لأطفال المدارس.

1. مهام الاختبار. يعد اختبار القدرات الحركية البشرية أحد أكثرها اتجاهات مهمةأنشطة العلماء والمعلمين في مجال التربية البدنية والرياضة. يساعد على حل عدد من المشاكل التربوية المعقدة في تحديد مستويات تطوير القدرات الشرطية والتنسيقية ، وتقييم جودة الاستعداد الفني والتكتيكي. بناءً على نتائج الاختبار ، من الممكن مقارنة استعداد كل من الطلاب الفرديين ومجموعات كاملة من الطلاب الذين يعيشون في مناطق ودول مختلفة ؛ إجراء الاختيار المناسب لممارسة رياضة معينة ، للمشاركة في المسابقات ؛ لإجراء رقابة موضوعية إلى حد ما على تعليم (تدريب) أطفال المدارس والرياضيين الشباب ؛ التعرف على مزايا وعيوب الوسائل المستخدمة وطرق التدريس وأشكال تنظيم الفصول ؛ أخيرًا ، لإثبات المعايير (العمر ، الفرد) للياقة البدنية للأطفال والمراهقين.



أ) تعليم تلاميذ المدارس أنفسهم كيفية تحديد مستوى لياقتهم البدنية وتخطيط مجمعات التمارين البدنية اللازمة لأنفسهم ؛

ب) تشجيع الطلاب على تحسين حالتهم البدنية بشكل أكبر
(الأشكال) ؛

ج) لا تعرف المستوى الأولي لتنمية القدرة الحركية بقدر ما تعرفه عن تغيرها خلال فترة زمنية معينة ؛

د) لتحفيز الطلاب الذين حققوا نتائج عالية ، ولكن ليس بدرجة كبيرة لتحقيق مستوى عالٍ من اللياقة البدنية ، ولكن من أجل تنفيذ الزيادة المخطط لها في النتائج الشخصية.



يؤكد الخبراء أن النهج التقليدي للاختبار ، عند مقارنة بيانات الاختبارات والمعايير الموحدة بالنتيجة المعروضة ، يجعل العديد من الطلاب ، وخاصة أولئك الذين يتمتعون بمستويات منخفضة ومتوسطة من اللياقة البدنية ، لديهم موقف سلبي. من ناحية أخرى ، يجب أن يزيد الاختبار من الاهتمام بين أطفال المدارس ، ويجلب لهم السعادة ، ولا يؤدي إلى تطوير عقدة النقص. في هذا الصدد ، نقترح الأساليب التالية:

1) لا يتم تحديد نتائج اختبارات الطالب على أساس المقارنة مع المعايير ، ولكن على أساس التغييرات التي حدثت خلال فترة زمنية معينة ؛

2) يتم تعديل جميع مكونات الاختبار ، ويتم استخدام إصدارات أخف من التمارين (يجب أن تكون المهام التي يتكون منها محتوى الاختبار سهلة بدرجة كافية بحيث يكون احتمال إكمالها بنجاح مرتفعًا) ؛

3) يتم استبعاد صفر درجة أو بعلامة ناقص ، فقط النتائج الإيجابية مؤهلة.

لذلك ، عند الاختبار ، من المهم الجمع بين المهام العلمية (النظرية) والدوافع الإيجابية ذات الأهمية الشخصية للطالب للمشاركة في هذا الإجراء.

2. مفهوم "الاختبار" وتصنيف الاختبارات الحركية.مصطلح الاختبار المترجم من اللغة الإنجليزيةيعني الاختبار. تستخدم الاختبارات لحل العديد من المشكلات العلمية والعملية. من بين طرق تقييم الحالة الجسدية للشخص (الملاحظة ، آراء الخبراء) طريقة الاختبار (في حالتنا - المحرك ، أو المحرك) هي الطريقة الرئيسية المستخدمة في المقاييس الرياضية وغيرها التخصصات العلمية- "عقيدة الحركات" نظرية ومنهجية التربية الرياضية.

اختبارهو قياس أو اختبار يتم إجراؤه لتحديد قدرة الشخص أو حالته. يمكن أن يكون هناك الكثير من هذه القياسات ، بما في ذلك تلك التي تعتمد على استخدام مجموعة متنوعة من التمارين البدنية. ومع ذلك ، لا يمكن اعتبار كل تمرين أو اختبار جسدي بمثابة اختبار. كاختبارات ، فقط تلك الاختبارات (العينات) التي تفي بالمتطلبات الخاصة والتي يجب أن تكون وفقًا لها:

أ) تحديد الغرض من أي اختبار (أو اختبارات) ؛

ب) تم تطوير منهجية موحدة لقياس نتائج الاختبارات وإجراء اختبار ؛

ج) تم تحديد موثوقية الاختبارات وطابعها الإعلامي ؛

د) تم تنفيذ إمكانية عرض نتائج الاختبار في نظام التقييم المقابل.

يسمى نظام استخدام الاختبارات فيما يتعلق بالمهمة وتنظيم الشروط وأداء الاختبارات من قبل الموضوعات وتقييم وتحليل النتائج اختبارات.القيمة العددية التي تم الحصول عليها أثناء القياسات - نتيجة الاختبار (الاختبار).

على سبيل المثال ، الوثب الطويل هو اختبار ؛ إجراء القفزات وقياس النتائج - الاختبار ؛ طول القفزة - نتيجة الاختبار.

تعتمد الاختبارات المستخدمة في التربية البدنية على الإجراءات الحركية (التمارين البدنية ، المهام الحركية). تسمى هذه الاختبارات المحرك أو المحرك.

حاليًا ، لا يوجد تصنيف واحد لاختبارات المحركات. يُعرف تصنيف الاختبارات وفقًا لهيكلها والمؤشرات السائدة (انظر الجدول 1).

يميز وحدةو مركبالاختبارات. اختبار الوحدةيعمل على قياس وتقييم سمة واحدة (قدرة التنسيق أو التكييف). نظرًا لأن بنية كل تنسيق أو قدرة تكييف معقدة ، فعادةً ما يتم تقييم مكون واحد فقط من هذه القدرة بمساعدة مثل هذا الاختبار (على سبيل المثال ، القدرة على التوازن ، وسرعة رد الفعل البسيط ، وقوة عضلات الايدى).

باستخدام التعليميةيقيس الاختبار القدرة على التعلم الحركي (بالفرق بين العلامات النهائية والأولية لفترة معينة من التدريب على تقنية الحركات).

سلسلة الاختباريجعل من الممكن استخدام نفس الاختبار لفترة طويلة ، عندما تتحسن القدرة المقاسة بشكل كبير. في الوقت نفسه ، تتزايد مهام الاختبار باستمرار في الصعوبة. لسوء الحظ ، لم يتم استخدام هذا النوع من اختبار الوحدة على نطاق واسع في كل من العلم والممارسة.

باستخدام اختبار معقدتقييم عدة علامات أو مكونات لقدرات مختلفة أو نفس القدرة (على سبيل المثال ، القفز من مكان - بموجة من الأيدي ، بدون موجة من الأيدي ، إلى ارتفاع معين). على أساس مثل هذا الاختبار ، يمكن للمرء الحصول على معلومات حول مستوى قدرات قوة السرعة (حسب ارتفاع القفزة) ، وقدرات التنسيق (من خلال دقة التمايز بين جهود القوة ، من خلال الاختلاف في ارتفاع القفزة مع وبدون موجة من الأسلحة).

ملف الاختباريتكون من عدة اختبارات منفصلة يتم على أساسها تقييم أو عدة قدرات جسدية مختلفة (غير متجانسةملف الاختبار) ، أو عدة مظاهر لنفس القدرة البدنية (متجانسملف الاختبار). يمكن تقديم نتائج الاختبار في شكل ملف تعريف ، مما يجعل من الممكن

نماذج الاختبارات وإمكانية تطبيقها (حسب D.-D Blume ، 1987)


الجدول 1


نوع من القدرة المقاسة علامة الهيكل مثال
اختبار الوحدة
اختبار أولي يحتوي على مهمة حركية واحدة مهمة اختبار واحدة ، درجة اختبار نهائي واحدة اختبار التوازن ، قياس الاهتزاز ، اختبار الاتصال ، اختبار الإيقاع ، القفز على دقة الهبوط
اختبار الممارسة قدرة واحدة أو جانب (مكون) القدرة سؤال اختبار واحد أو أكثر. درجة اختبار نهائي واحدة (فترة تربوية) اختبار الممارسة العامة
سلسلة الاختبار قدرة واحدة أو جانب (مكون) القدرة مهمة اختبار واحدة مع متغيرات أو عدة مهام ذات صعوبة متزايدة اختبار الاتصال
اختبار شامل
اختبار معقد يحتوي على مهمة واحدة عدة قدرات أو جوانب (مكونات) لقدرة واحدة مهمة اختبار واحدة ، عدة درجات نهائية اختبار القفز
اختبار المهام التي يعاد استخدامها مهام اختبار متعددة تعمل بالتسلسل ، تقييمات نهائية متعددة اختبار رد الفعل القابل لإعادة الاستخدام
ملف الاختبار قدرات أو جوانب متعددة لنفس القدرة اختبارات متعددة ، درجات نهائية متعددة نجم منسق
اختبار البطارية قدرات أو جوانب متعددة لنفس القدرة عدة اختبارات ، واحد نتيجة اختبار اختبار البطارية لتقييم القدرة على تعلم الحركات

مقارنة النتائج الفردية والجماعية بسرعة.

اختبار البطاريةيتكون أيضًا من عدة اختبارات منفصلة ، يتم تلخيص نتائجها في تقييم نهائي واحد ، يتم النظر فيه في أحد مقاييس التصنيف (المزيد حول هذا في المقالة الثانية). كما هو الحال في ملف تعريف الاختبار ، يتم التمييز هنا متجانسو غير متجانسةالبطاريات.

بطارية متجانسةأو ملف تعريف متجانس يستخدم في تقييم جميع مكونات القدرة المعقدة (على سبيل المثال ، الاستجابة). في هذه الحالة ، يجب أن تكون نتائج الاختبارات الفردية مترابطة (مترابطة).

يعمل ملف الاختبار غير المتجانس أو البطارية غير المتجانسة على تقييم مجمع (مجموعة) القدرات الحركية المختلفة. على سبيل المثال ، تُستخدم بطاريات الاختبار هذه لتقييم قدرات القوة والسرعة والتحمل - هذه هي بطاريات اختبارات اللياقة البدنية.

في الاختبارات المهام التي يعاد استخدامهايقوم الأشخاص بأداء المهام الحركية بالتتابع ويحصلون على علامات منفصلة لكل حل من حل المهمة الحركية. قد تكون هذه التقديرات اغلق الاتصالمع بعض. من خلال الحسابات الإحصائية المناسبة ، يمكن الحصول على معلومات إضافية حول القدرات التي يتم تقييمها. ومن الأمثلة على ذلك مهام اختبار الانتقال التي يتم تنفيذها بالتسلسل (الجدول 2).

يشير تعريف الاختبارات الحركية إلى أنها تعمل على تقييم القدرات الحركية والمهارات الحركية جزئيًا. لذلك ، في غاية نظرة عامةتخصيص اختبارات تكييف واختبارات التنسيق والاختبارات لتقييم المهارات والقدرات الحركية (تقنيات الحركة). ومع ذلك ، فإن مثل هذا التنظيم لا يزال عامًا للغاية.

تصنيف الاختبارات الحركية حسب مؤشراتهم السائدةيتبع من منهجية القدرات الجسدية (الحركية). في هذا الصدد ، تميز اختبارات الحالة(لتقييم القوة: الحد الأقصى ، السرعة ، القدرة على التحمل ؛ لتقييم القدرة على التحمل ؛ لتقييم قدرات السرعة ؛ لتقييم المرونة: النشطة والسلبية) و اختبارات التنسيق(لتقدير كور

القدرات الحركية المتعلقة بالفرد مجموعات مستقلةالإجراءات الحركية التي تقيس قدرات التنسيق الخاصة ؛ لتقييم قدرات التنسيق المحددة - قدرات التوازن ، والتوجيه في الفضاء ، والاستجابة ، والتمايز بين معلمات الحركة ، والإيقاع ، وإعادة هيكلة الحركات الحركية ، والتنسيق (الاتصال) ، والاستقرار الدهليزي ، واسترخاء العضلات الطوعي.

متطور رقم ضخماختبارات لتقييم المهارات الحركية في الرياضات المختلفة. يتم تقديمها في الكتب المدرسية والأدلة ذات الصلة ولا يتم تناولها في هذه المقالة.

وبالتالي ، يعمل كل تصنيف كنوع من المبادئ التوجيهية لاختيار (أو إنشاء) نوع الاختبارات التي تناسب مهام الاختبار على أفضل وجه.

3. معايير عامل الجودة لاختبارات المحرك. كما هو مذكور أعلاه ، فإن مفهوم "اختبار المحرك" يفي بالغرض منه إذا كان الاختبار يفي بالمعايير الأساسية ذات الصلة: الموثوقية ، والاستقرار ، والتكافؤ ، والموضوعية ، ومحتوى المعلومات ، فضلاً عن المعايير الإضافية: التطبيع ، والمقارنة ، والاقتصاد.

تسمى الاختبارات التي تفي بمتطلبات الموثوقية والمعلوماتية بأنها جيدة أو موثوقة (موثوقة).

تُفهم موثوقية الاختبار على أنها درجة الدقة التي يقيم بها قدرة حركية معينة ، بغض النظر عن متطلبات الشخص الذي يقيمها. تتجلى الموثوقية في درجة الاتفاق بين النتائج عند إعادة اختبار نفس الأشخاص في ظل نفس الظروف ؛ هو استقرار أو استمرار نتيجة اختبار الفرد على الأداء المتكرر لتمرين التحكم. بعبارة أخرى ، يحتفظ تلميذ في مجموعة الأشخاص الذين شملهم الاستطلاع وفقًا لنتائج الاختبار المتكرر (على سبيل المثال ، مؤشرات القفزات ووقت الجري ومسافة الرمي) بمكانته في الترتيب.

يتم تحديد مصداقية الاختبار باستخدام تحليل الارتباط الإحصائي عن طريق حساب معامل الموثوقية. في هذه الحالة ، يتم استخدام طرق مختلفة ، على أساسها يتم الحكم على موثوقية الاختبار.

يعتمد استقرار الاختبار على العلاقة بين المحاولات الأولى والثانية المتكررة بعد فترة زمنية معينة في نفس الظروف من قبل نفس المجرب. تسمى طريقة الاختبار المتكرر لتحديد الموثوقية بإعادة الاختبار. يعتمد استقرار الاختبار على نوع الاختبار ، وعمر وجنس الأشخاص ، والفاصل الزمني بين الاختبار وإعادة الاختبار. على سبيل المثال ، تكون مؤشرات الاختبارات الشرطية أو السمات المورفولوجية على فترات زمنية قصيرة أكثر ثباتًا من نتائج اختبارات التنسيق ؛ في الطلاب الأكبر سنًا - تكون النتائج أكثر ثباتًا من الطلاب الأصغر سنًا. عادة ما يتم إجراء إعادة الاختبار في موعد لا يتجاوز أسبوع واحد. على فترات أطول (على سبيل المثال ، بعد شهر) ، يصبح استقرار الاختبارات المتساوية مثل الجري لمسافة 1000 متر أو الوثب الطويل الدائم أقل بشكل ملحوظ.

معادلة الاختبار هي ارتباط نتيجة الاختبار بنتائج الاختبارات الأخرى من نفس النوع. على سبيل المثال ، يتم استخدام معيار التكافؤ عندما يكون من الضروري اختيار الاختبار الذي يعكس بشكل أكثر ملاءمة قدرات السرعة: الجري 30 أو 50 أو 60 أو 100 متر.

يعتمد هذا الموقف أو ذاك تجاه الاختبارات المكافئة (المتجانسة) على عدة أسباب. إذا كان من الضروري زيادة موثوقية تقديرات أو استنتاجات الدراسة ، فمن المستحسن استخدام اختبارين أو أكثر معادلين. وإذا كانت المهمة هي إنشاء بطارية تحتوي على حد أدنى من الاختبارات ، فيجب استخدام اختبار واحد فقط من الاختبارات المكافئة.


الجدول 2 مهام اختبار القفز التي يتم إجراؤها بالتتابع (وفقًا لـ D.-D Blume ، 1987)

رقم ص / ص مهمة الاختبار تقييم النتيجة قدرة
اقفز إلى أقصى ارتفاع بدون تأرجح الذراعين الطول (سم قفز القوة
اقفز إلى أقصى ارتفاع بموجة من اليدين الطول (سم قفز القوة والقدرة على الاتصال (السندات)
اقفز إلى أقصى ارتفاع بموجة من اليدين والقفز الطول (سم الاتصال (الروابط) وقوة القفز
10 يقفز بموجة من الأذرع لمسافة تساوي 2/3 من أقصى ارتفاع للقفز ، كما في المشكلة 2 مجموع الانحرافات عن علامة معينة القدرة على التفريق بين معلمات قوة الحركات
الفرق بين نتائج حل مشكلة واحدة ومشكلتين ... سم القدرة على الاتصال (الاتصال)

هذه البطارية ، كما لوحظ ، غير متجانسة ، لأن الاختبارات المدرجة فيها تقيس القدرات الحركية المختلفة. مثال على بطارية غير متجانسة من الاختبارات هو تشغيل 30 مترًا ، سحب على الشريط ، منحنى أمامي ، تشغيل 1000 متر. سيتم تقديم أمثلة أخرى لمثل هذه المجمعات في منشور منفصل.

يتم تحديد موثوقية الاختبارات أيضًا من خلال مقارنة متوسط ​​درجات المحاولات الفردية والزوجية المدرجة في الاختبار. على سبيل المثال ، متوسط ​​دقة تسديدات الكرة من 1 و 3 و 5 و 7 و 9 محاولات تتم مقارنتها بمتوسط ​​دقة التسديدات من 2 و 4 و 6 و 8 و 10 محاولات. تسمى هذه الطريقة في تقييم الموثوقية طريقة المضاعفة أو الانقسام ، وتستخدم بشكل أساسي عند تقييم قدرات التنسيق وإذا كان عدد المحاولات التي تشكل نتيجة الاختبار ستة على الأقل.

تحت الموضوعية(تناسق) الاختبار فهم درجة اتساق النتائج التي تم الحصول عليها على نفس الموضوعات من قبل مجربين مختلفين (مدرسون ، قضاة ، خبراء).

أ) وقت الاختبار ، المكان ، طقس;

ب) دعم موحد للمواد والأجهزة ؛

ج) العوامل النفسية (حجم وشدة الحمل ، الدافع) ؛

د) عرض المعلومات (بيان شفهي دقيق لمهمة الاختبار والشرح والشرح).

الامتثال لهذه الشروط يخلق ما يسمى ب موضوعية الاختبار.يتحدثون أكثر عن الموضوعية التفسيريةفيما يتعلق بدرجة استقلالية تفسير نتائج الاختبار من قبل مجربين مختلفين.

بشكل عام ، كما يلاحظ الخبراء ، يمكن تحسين موثوقية الاختبارات بطرق مختلفة: توحيد معايير أكثر صرامة للاختبار (انظر أعلاه) ، وزيادة في عدد المحاولات ، وتحفيز أفضل للموضوعات ، وزيادة في عدد المقيّمين ( القضاة والخبراء) ، وزيادة في اتساق آرائهم ، وزيادة في عدد الاختبارات المعادلة.

لا توجد قيم ثابتة لمؤشرات موثوقية الاختبار. في معظم الحالات ، يتم استخدام التوصيات التالية: 0.95-0.99 - موثوقية ممتازة ؛ 0.90-0.94 - جيد ؛ 0.80-0.89 - مقبول ؛ 0.70-0.79 - سيء ؛ 0.60-0.69 - مشكوك فيه بالنسبة للتقييمات الفردية ، الاختبار مناسب فقط لتوصيف مجموعة من الموضوعات. غنيا بالمعلوماتالاختبار هو درجة الدقة التي يقيس بها القدرة أو المهارة الحركية المقدرة. في الأدبيات الأجنبية والمحلية ، يتم استخدام مصطلح "الصلاحية" بدلاً من كلمة "المعلوماتية" (من الصلاحية الإنجليزية - الصلاحية والصلاحية والشرعية). في الواقع ، فيما يتعلق بمحتوى المعلومات ، يجيب الباحث على سؤالين: ما الذي يقيسه هذا الاختبار المحدد (بطارية الاختبار) وما هي درجة دقة القياس.

يميز صلاحيةمنطقي (هادف) وتجريبي (يعتمد على بيانات تجريبية) وتنبؤية. مزيد من المعلومات التفصيلية حول هذا الموضوع موجودة في الكتب المدرسية التي أصبحت بالفعل كلاسيكيات لطلاب جامعات التربية البدنية (قياس الرياضة / تم تحريره بواسطة V.M. Zatsiorsky. - M: FiS، 1982. - S. 73-80؛ Godik M.A. Sportivnaya metrology - م: FiS ، 1988) ، وكذلك في عدد من الكتيبات الحديثة.

معايير الاختبار الإضافية الهامة ، كما لوحظ ، هي التنظيم والمقارنة والاقتصاد.

جوهر تقنينهو أنه ، بناءً على نتائج الاختبار ، من الممكن إنشاء معايير ذات أهمية خاصة للممارسة (سيتم مناقشة هذا في مقال منفصل).

المقارنةيكمن الاختبار في القدرة على مقارنة النتائج التي تم الحصول عليها في اختبار واحد أو عدة أشكال من الاختبارات المتوازية (المتجانسة). من الناحية العملية ، فإن استخدام الاختبارات الحركية المماثلة يقلل من احتمالية أنه نتيجة للاستخدام المنتظم لنفس الاختبار ، لا يتم تقييم مستوى القدرة فحسب ، بل يتم تقييم درجة المهارة. نتائج الاختبار القابلة للمقارنة في نفس الوقت تزيد من موثوقية الاستنتاجات.

جوهر اقتصادكمعيار جودة الاختبار هو أن الاختبار لا يتطلب وقتًا طويلاً ، وتكاليف مادية كبيرة ومشاركة العديد من المساعدين. على سبيل المثال ، مجموعة من ستة اختبارات لتحديد اللياقة البدنية ، موصى بها في "البرنامج الشامل للتربية البدنية للطلاب في الصفوف من الأول إلى الحادي عشر" (M.: Prosveshchenie ، 2005-2006) ، يمكن للمدرس مع اثنين من مساعديه إجراء اختبار واحد درس فحص 25-30 طفل.

تنظيم اختبار الاستعداد البدني لأطفال المدارس: المشكلة الثانية المهمة لاختبار القدرات الحركية (تذكر أن المشكلة الأولى - اختيار الاختبارات التثقيفية - تم النظر فيها مسبقًا) هي تنظيم تطبيقها.

يجب أن يحدد مدرس الثقافة البدنية: ما هي الشروط الأفضل لتنظيم الاختبار ، وكيفية إجراؤه في الفصل ، وكم مرة يجب إجراء الاختبار.

وقت الاختبارتم إعداده وفقًا للبرنامج المدرسي ، والذي ينص على إجراء اختبار إلزامي لمرتين للياقة البدنية للطلاب. يُنصح بإجراء الاختبار الأول في الأسبوع الثاني أو الثالث من شهر سبتمبر (بعد دراسة عمليةيعود إلى طبيعته) ، والثاني - أسبوعين قبل نهاية العام الدراسي (في تاريخ لاحق ، قد تكون هناك صعوبات تنظيمية بسبب الامتحانات والعطلات القادمة).

تسمح معرفة التغييرات السنوية في تنمية القدرات الحركية لأطفال المدارس للمعلم بإجراء التعديلات المناسبة على عملية التربية البدنية للخطوة التالية السنة الأكاديمية. ومع ذلك ، يمكن للمعلم ويجب عليه إجراء المزيد من الاختبارات المتكررة ، لممارسة ما يسمى التحكم التشغيلي. من المناسب تنفيذ هذا الإجراء ، على سبيل المثال ، من أجل تحديد التغيير في مستوى السرعة وقدرات القوة والقدرة على التحمل تحت تأثير دروس ألعاب القوى خلال الربع الأول ، إلخ. تحقيقا لهذه الغاية ، يمكن للمعلم تطبيق اختبارات لتقييم القدرات التنسيقية للأطفال في بداية ونهاية إتقان المواد التعليمية. المناهج الدراسية، على سبيل المثال ، في الألعاب الرياضية ، لتحديد التغييرات في تطوير هذه القدرات.

يجب أن يؤخذ في الاعتبار أن تنوع المهام التربويةلا يزود المعلم بمنهجية اختبار موحدة ، ونفس القواعد لإجراء الاختبارات وتقييم نتائج الاختبار. وهذا يتطلب من المجربين (المعلمين) إظهار الاستقلال في حل القضايا النظرية والمنهجية والتنظيمية للاختبار.

الاختبار في الفصليجب أن تكون مرتبطة بمحتواها. بمعنى آخر ، يجب (ينبغي) تضمين الاختبار التطبيقي (أو الاختبارات) ، الخاضع للمتطلبات ذات الصلة كأسلوب بحث ، بشكل عضوي في التمارين البدنية المخطط لها. على سبيل المثال ، إذا احتاج تلاميذ المدارس إلى تحديد مستوى تطور قدرات السرعة أو التحمل ، فيجب التخطيط للاختبارات اللازمة في ذلك الجزء من الدرس الذي سيتم فيه حل مهام تطوير القدرات البدنية المقابلة.

اختبار القدراتيتم تحديده إلى حد كبير من خلال معدل تطور القدرات البدنية المحددة والعمر والجنس و السمات الفرديةتطورهم.

على سبيل المثال ، لتحقيق زيادة كبيرة في السرعة أو التحمل أو القوة ، يتطلب الأمر عدة أشهر من التدريب المنتظم (التدريب). في الوقت نفسه ، للحصول على زيادة كبيرة في المرونة أو قدرات التنسيق الفردي ، يلزم فقط 4-12 تمرينًا. من الممكن تحقيق تحسن في نوعية مادية واحدة أو أخرى ، إذا بدأت من الصفر ، في وقت أقصر. ولكن من أجل تحسين نفس الجودة ، عندما تصل إلى مستوى عالٍ في تلميذ المدرسة ، فإن الأمر يتطلب مزيدًا من الوقت. في هذا الصدد ، يجب على المعلم أن يدرس بشكل أعمق ملامح تطور وتحسين القدرات الحركية المختلفة لدى الأطفال في فترات العمر والجنس المختلفة.

عند تقييم اللياقة البدنية العامة للطلاب ، كما هو مذكور ، يمكنك استخدام مجموعة متنوعة من اختبارات البطارية ، والتي يعتمد اختيارها على المهام المحددة للاختبار وتوافر الشروط اللازمة. ومع ذلك ، نظرًا لحقيقة أنه لا يمكن تقييم نتائج الاختبار إلا عن طريق المقارنة ، فمن المستحسن اختيار الاختبارات التي يتم تمثيلها على نطاق واسع في نظرية وممارسة التربية البدنية للأطفال. على سبيل المثال ، اعتمد على تلك الموصى بها في "البرنامج الشامل للتربية البدنية للطلاب في الصفوف من الأول إلى الحادي عشر من مدرسة التعليم العام" (M: Prosveshchenie ، 2004-2006).

لمقارنة المستوى العام للياقة البدنية لطالب أو مجموعة من الطلاب باستخدام مجموعة من الاختبارات ، يلجأون إلى تحويل نتائج الاختبار إلى نقاط أو نقاط (سنتحدث عن هذا بمزيد من التفصيل في المقالة التالية). يتيح تغيير مجموع النقاط أثناء الاختبار المتكرر إمكانية الحكم على تقدم كل من الطفل ومجموعة الأطفال.

- التربية البدنية بالمدرسة 2007 العدد 6


مقدمة

ملاءمة. تعد مشكلة اختبار اللياقة البدنية للفرد واحدة من أكثر المشاكل تطورًا في نظرية ومنهجية التربية البدنية. لكل العقود الاخيرةتراكمت مادة ضخمة ومتنوعة: تعريف مهام الاختبار ؛ شروط نتائج الاختبار حسب عوامل مختلفة ؛ تطوير الاختبارات لتقييم التكييف الفردي وقدرات التنسيق ؛ برامج الاختبار التي تميز اللياقة البدنية للأطفال والمراهقين من 11 إلى 15 عامًا ، المعتمدة في الاتحاد الروسي ، وفي بلدان رابطة الدول المستقلة الأخرى وفي العديد من البلدان الأجنبية.

يعد اختبار الصفات الحركية لأطفال المدارس من أهم وأساسيات التحكم التربوي.

يساعد في حل عدد من المهام التربوية المعقدة: تحديد مستويات تطوير القدرات الشرطية والتنسيقية ، لتقييم جودة الاستعداد الفني والتكتيكي. بناءً على نتائج الاختبار ، يمكنك:

مقارنة جاهزية كل من الطلاب الفرديين والمجموعات بأكملها التي تعيش في مناطق ودول مختلفة ؛

إجراء اختيار رياضي لممارسة رياضة معينة ، للمشاركة في المسابقات ؛

ممارسة الرقابة الموضوعية على تعليم (تدريب) أطفال المدارس والرياضيين الشباب إلى حد كبير ؛

التعرف على مزايا وعيوب الوسائل المستخدمة وطرق التدريس وأشكال تنظيم الفصول ؛

أخيرًا ، لإثبات المعايير (العمر ، الفرد) للياقة البدنية للأطفال والمراهقين.

إلى جانب المهام العلمية في ممارسة الدول المختلفة ، فإن مهام الاختبار هي كما يلي:

لتعليم تلاميذ المدارس أنفسهم لتحديد مستوى لياقتهم البدنية وتخطيط مجمعات التمارين البدنية اللازمة لأنفسهم ؛

تشجيع الطلاب على تحسين حالتهم البدنية (الشكل) ؛

عدم معرفة المستوى الأولي لتطور القدرة الحركية بقدر ما يعرف تغيرها خلال فترة زمنية معينة ؛

لتحفيز الطلاب الذين حققوا نتائج عالية ، ولكن ليس كثيرًا من أجل مستوى عالٍ ، ولكن من أجل الزيادة المخطط لها في النتائج الشخصية.

في هذا العمل ، سوف نعتمد على تلك الاختبارات الموصى بها في "البرنامج الشامل للتربية البدنية للطلاب في الصفوف 1-11 من مدرسة شاملة" الذي أعده V. لياخ و ج. ماكسون.

الغرض من الدراسة: إثبات منهجية اختبار الصفات البدنية لطلاب المرحلة الابتدائية.

فرضية البحث: يعد استخدام الاختبار طريقة إعلامية دقيقة لتحديد تطور الصفات البدنية.

موضوع الدراسة: الاختبار كأسلوب للتحكم التربوي.

موضوع البحث: اختبار صفات الطلاب.


الفصل 1. مفاهيم نظرية اختبارات اللياقة البدنية

1.1 موجز معلومات تاريخيةحول نظرية اختبار القدرة الحركية

كان الناس مهتمين بقياس الإنجازات الحركية البشرية لفترة طويلة. تعود المعلومات الأولى حول قياس المسافة التي تم خلالها القيام بالقفزات الطويلة إلى عام 664 قبل الميلاد. ه. في الألعاب الأولمبية التاسعة والعشرين للعصور القديمة في أولمبيا ، قفز Chionis of Sparta مسافة 52 قدمًا ، أي ما يقرب من 16.66 مترًا. ومن الواضح أن هنا في السؤالحول القفزات المتعددة.

من المعروف أن أحد مؤسسي التربية البدنية - Guts-Muts (J. Ch. F. Guts-Muts ، 1759--1839) قاس الإنجازات الحركية لطلابه وقام بعمل سجلات دقيقة لنتائجهم. ولتحسين الإنجازات ، منحهم "جوائز" - أكاليل البلوط (G. Sorm ، 1977). في الثلاثينات تسعة عشر عامافي. قام Eiselen (E. Eiselen) ، موظف في المعلم الألماني الشهير Jan (F.L Yahn) ، بناءً على القياسات التي تم إجراؤها ، بتجميع جدول لتحديد الإنجازات في القفز. كما ترى ، تحتوي على ثلاثة تدرجات (الجدول 1).

الجدول 1. النتائج في القفزات (بالسنتيمتر) للرجال (المصدر: K. Mekota، P. Blahus، 1983)

ابتدائي

من خلال الماعز


لاحظ أنه بالفعل في منتصف القرن التاسع عشر. في ألمانيا ، عند تحديد طول أو ارتفاع القفزة ، يوصى بمراعاة معلمات الجسم.

تم إجراء قياسات دقيقة للإنجازات الرياضية ، بما في ذلك الإنجازات القياسية ، منذ منتصف القرن التاسع عشر ، وبشكل منتظم منذ عام 1896 ، من الألعاب الأولمبية الحديثة.

لفترة طويلة ، كان الناس يحاولون قياس قدرات القوة. تعود أول معلومات غريبة عن هذا الأمر إلى عام 1741 ، عندما كان من الممكن ، باستخدام أدوات بسيطة ، قياس قوة المصارع توماس توبهام. رفع وزنًا يتجاوز 830 كجم (G. Sorm ، 1977). تم بالفعل قياس قدرات قوة الطلاب بواسطة Guts-Muts و Jan ، باستخدام مقاييس قوة بسيطة لهذا الغرض. لكن أول مقياس دينامومتر ، وهو سلف مقياس الدينامومتر الحديث ، صممه راينيجر في فرنسا عام 1807. في ممارسة التربية البدنية لطلاب الصالة الرياضية في باريس ، استخدمه ف. أموروس في عام 1821. في القرن التاسع عشر. لقياس القوة ، استخدموا أيضًا رفع الجذع في وضع معلق على العارضة ، وثني الذراعين وفكهما في الدعم ، ورفع الأثقال.

نذر البطاريات الحديثة لاختبارات تحديد اللياقة البدنية هي الرياضة والجمباز في كل مكان. كأول ، تم تمييز الخماسي القديم ، الذي تم وضعه موضع التنفيذ في الألعاب الأولمبية الثامنة عشرة في العصور القديمة في 708 قبل الميلاد. ه. كانت تتألف من رمي القرص ورمي الرمح والقفز والجري والمصارعة. تم تضمين العشاري الذي نعرفه لأول مرة في برنامج المنافسة في الألعاب الأولمبية الثالثة (سانت لويس ، الولايات المتحدة الأمريكية ، 1904) ، وخماسي الحديث في دورة الألعاب الأولمبية الخامسة (ستوكهولم ، السويد ، 1912). تكوين التدريبات في هذه المسابقات غير متجانس. يحتاج الرياضي إلى إظهار الاستعداد في مختلف التخصصات. لذلك ، يجب أن يكون متنوعًا ومستعدًا جسديًا.

ربما ، مع الأخذ في الاعتبار هذه الفكرة ، في نفس الوقت تقريبًا (بداية القرن العشرين) ، للأطفال والشباب والبالغين ، تم وضع مجموعات من التمارين في الممارسة التي تحدد اللياقة البدنية بشكل شامل للشخص. لأول مرة تم تقديم مثل هذه الاختبارات المعقدة في السويد (1906) ، ثم في ألمانيا (1913) وحتى في وقت لاحق - في النمسا والاتحاد السوفيتي (روسيا) - مجمع جاهز للعمل والدفاع (1931).

نشأ رواد اختبارات المحركات الحديثة في أواخر القرن التاسع عشر وأوائل القرن العشرين. على وجه الخصوص ، قدم د. سارجنت في ممارسة جامعة هارفارد "اختبار القوة" ، والذي تضمن ، بالإضافة إلى قياس الدينامومتر وقياس التنفس ، تمارين الضغط ورفع وخفض الجذع. منذ عام 1890 ، تم استخدام هذا الاختبار في 15 جامعة أمريكية. ابتكر الفرنسي جي هيبرت اختبارًا ظهر نشره في عام 1911. ويتضمن 12 مهمة حركية: الركض على مسافات مختلفة ، والقفز من مكان ما والركض ، والرمي ، ورفع مقذوف وزنه 40 كيلوغرامًا (الوزن) بشكل متكرر ، والسباحة و الغوص.

دعونا نتناول بإيجاز مصادر المعلومات التي تدرس نتائج البحث العلمي من قبل الأطباء وعلماء النفس. البحث الطبي حتى أواخر التاسع عشرفي. ركزوا في أغلب الأحيان على تغيير البيانات المورفولوجية الخارجية ، وكذلك على تحديد التباينات. واكبت القياسات البشرية المستخدمة لهذا الغرض استخدام قياس الدينامومتر. لذلك ، نشر الطبيب البلجيكي A. Quetelet (A. Quetelet) ، بعد إجراء بحث مكثف ، في عام 1838 عملاً يفيد بأن متوسط ​​نتائج قوة العمود الفقري (العمود الفقري) للنساء والرجال البالغين من العمر 25 عامًا هو 53 و 82. كجم على التوالي. في عام 1884 ، قام الإيطالي A. Mosso (A. Mosso) بفحص قدرة العضلات على التحمل. للقيام بذلك ، استخدم ergograph ، مما سمح له بمراقبة تطور التعب مع الانثناء المتكرر للإصبع.

يعود تاريخ الهندسة البشرية الحديثة إلى عام 1707. ثم تم إنشاء جهاز بالفعل جعل من الممكن قياس النبض في الدقيقة. تم تصميم النموذج الأولي لمقياس العمل اليوم بواسطة G.A. هيم في عام 1858. تم إنشاء أجهزة قياس درجة الحرارة وأجهزة المشي في وقت لاحق ، في 1889-1913.

في نهاية القرن التاسع عشر - بداية القرن العشرين. يبدأ البحث المنهجي لعلماء النفس. يتم دراسة وقت رد الفعل ، ويتم تطوير الاختبارات لتحديد تنسيق الحركات والإيقاع. تم إدخال مفهوم "وقت رد الفعل" إلى العلم من قبل عالم الفسيولوجيا النمساوي S. Exner (S. Exner) في عام 1873. تلاميذ المؤسس علم النفس التجريبيأجرى دبليو وندت في المختبر الذي أنشئ عام 1879 في لايبزيغ قياسات مكثفة لوقت التفاعلات البسيطة والمعقدة. تضمنت الاختبارات الأولى للتنسيق الحركي التنصت وأنواع مختلفة من التصويب. واحدة من أولى المحاولات لدراسة الهدف هو اختبار X. Frenkel (N. "للرعاش الساكن والديناميكي".

في محاولة لتحديد الموهبة الموسيقية ، في عام 1915 ، قام Seashore (S. E. Seashore) بالتحقيق في القدرة على الإيقاع.

تعود نظرية الاختبار ، مع ذلك ، من نهاية القرن التاسع عشر إلى بداية القرن العشرين. عندها تم وضع أسس الإحصاء الرياضي ، والتي بدونها النظرية الحديثةلا يمكن إجراء الاختبارات. في هذا المسار ، تعود المزايا التي لا شك فيها إلى عالم الوراثة والأنثروبولوجيا ف. كان هؤلاء العلماء هم من أنشأ فرعًا جديدًا لعلم الأحياء - القياسات الحيوية ، الذي يعتمد على القياسات والأساليب الإحصائية ، مثل الارتباط والانحدار وما إلى ذلك. أنشأه بيرسون (1901) وسبيرمان (1904) ، وهي طريقة رياضية ثابتة معقدة - تحليل العوامل - أتاح للعالم الإنجليزي بارت (S. Burt) تطبيقه عام 1925 لتحليل نتائج الاختبارات الحركية للطلاب في مدارس لندن. ونتيجة لذلك ، تم تحديد القدرات البدنية مثل القوة والسرعة وخفة الحركة والقدرة على التحمل. برز أيضًا عامل يسمى "اللياقة البدنية العامة". بعد ذلك بقليل ، نُشر أحد أشهر أعمال العالم الأمريكي مكوي (S.N. McCloy ، 1934) - "قياس القدرات الحركية العامة". بحلول بداية الأربعينيات. توصل العلماء إلى استنتاج مفاده أن بنية معقدةالقدرات الحركية البشرية. باستخدام اختبارات المحرك المختلفة مع استخدام النماذج الرياضية المطورة بالتوازي (التحليل الفردي والمتعدد المتغيرات) ، دخل مفهوم القدرات الحركية الخمس بحزم في نظرية الاختبار: القوة والسرعة وتنسيق الحركات والتحمل والمرونة.

اختبارات المحرك في اتحاد الجمهوريات الاشتراكية السوفياتية السابقتم استخدامها لتطوير معايير التحكم لمجمع جاهز للعمل والدفاع (1931). هناك اختبار معروف جيدًا للقدرات الحركية (تنسيق الحركات بشكل أساسي) ، والذي اقترحه NI Ozeretsky (1923) للأطفال والشباب. ظهرت أعمال قياس القدرات الحركية للأطفال والشباب في ألمانيا وبولندا وتشيكوسلوفاكيا ودول أخرى في نفس الوقت تقريبًا.

يقع تقدم كبير في تطوير نظرية اختبار اللياقة البدنية للشخص في نهاية الخمسينيات والستينيات. القرن ال 20 مؤسس هذه النظرية ، على الأرجح ، هو الأمريكي ماكلوي ، الذي نشر ، بالتعاون مع إم جونغ (إم دي يونغ) في عام 1954 ، دراسة بعنوان "الاختبارات والقياس في الرعاية الصحية والتربية البدنية" ، والتي اعتمدت لاحقًا على العديد من المؤلفين من أعمال مماثلة.

كان ولا يزال كتاب "هيكل وقياس القدرات البدنية" ذا أهمية نظرية كبيرة للباحث الأمريكي الشهير أ. فليشمان (1964). لا يعكس الكتاب القضايا النظرية والمنهجية لمشكلة اختبار هذه القدرات فحسب ، بل يوضح أيضًا نتائج محددة ، وخيارات للنهج ، ودراسات الموثوقية ، والمعلوماتية (صحة) الاختبارات ، كما يقدم مادة واقعية مهمة حول التركيب الضريبي لـ الاختبارات الحركية للقدرات الحركية المختلفة.

أهمية عظيمةلنظرية اختبار القدرات الجسدية لها كتب من تأليف V.M. Zatsiorsky "الصفات البدنية للرياضي" (1966) و "علم التحكم الآلي والرياضيات والرياضة" (1969).

يمكن العثور على معلومات تاريخية موجزة عن اختبار اللياقة البدنية في الاتحاد السوفياتي السابق في منشورات E.Ya. Bondarevsky ، V.V. Kudryavtsev ، Yu.I. سبرويفا ، في. بانايفا ، ب. فاديفا ، ب. فينوغرادوفا وغيرها.

من الممكن بشكل مشروط التمييز بين ثلاث مراحل للاختبار في الاتحاد السوفياتي (روسيا):

المرحلة 1 - 1920-1940 - فترة المسوح الجماعية لدراسة المؤشرات الرئيسية التطور البدنيوعلى مستوى اللياقة الحركية ، نشأ على هذا الأساس معايير مجمع "جاهز للعمل والدفاع".

المرحلة الثانية - 1946-1960 - دراسة اللياقة الحركية اعتمادًا على الميزات الشكلية الوظيفية من أجل خلق متطلبات مسبقة لإثبات علاقتهما علميًا ونظريًا.

المرحلة الثالثة - من عام 1961 حتى الوقت الحاضر بحث متكاملالحالة المادية للسكان ، اعتمادًا على السمات المناخية والجغرافية لمناطق البلد.

تظهر الدراسات التي أجريت خلال هذه الفترة أن مؤشرات التطور البدني واللياقة الحركية للأشخاص الذين يعيشون في مناطق مختلفة من البلاد ترجع إلى تأثير العوامل البيولوجية والمناخية والجغرافية والاجتماعية والاقتصادية وغيرها من العوامل الثابتة والمتغيرة. وفق البرنامج الشامل الموحد المطور والمكون من أربعة أقسام (لياقة بدنية ، تنمية بدنية ، الحالة الوظيفيةالنظم الأساسية للجسم ، والمعلومات الاجتماعية) ، في عام 1981 تم إجراء مسح شامل للحالة المادية للسكان أعمار مختلفةوالجنس في مناطق مختلفة من الاتحاد السوفياتي.

بعد ذلك بقليل ، لاحظ المتخصصون لدينا أنه على مدار أكثر من 100 عام ، تمت دراسة مستوى النمو الجسدي والاستعداد للشخص. ومع ذلك ، على الرغم من العدد الكبير نسبيًا من الأعمال في هذا الاتجاه ، فإن القيام بعمل عميق و تحليل شاملالبيانات التي تم الحصول عليها غير ممكنة ، حيث أجريت الدراسات مع مجموعات مختلفة ، في فترات موسمية مختلفة ، باستخدام طرق مختلفة ، وبرامج الاختبار والمعالجة الرياضية والإحصائية للمعلومات الواردة.

في هذا الصدد ، تم التركيز بشكل رئيسي على تطوير منهجية وتنظيم نظام موحد لجمع البيانات ، مع مراعاة المتطلبات المترولوجية والمنهجية ، وإنشاء بنك بيانات على الكمبيوتر.

في منتصف الثمانينيات. في القرن الماضي ، تم إجراء مسح شامل لجميع الاتحادات لحوالي 200000 شخص من سن 6 إلى 60 عامًا ، مما أكد استنتاجات الدراسة السابقة.

منذ بداية ظهور الأساليب العلمية لاختبار اللياقة البدنية للإنسان ، سعى الباحثون للإجابة على سؤالين رئيسيين:

ما الاختبارات التي يجب اختيارها لتقييم مستوى تطور قدرة حركية (جسدية) معينة ومستوى اللياقة البدنية للأطفال والمراهقين والبالغين ؛

كم عدد الاختبارات التي تحتاجها للحصول على الحد الأدنى وفي نفس الوقت معلومات كافية حول الحالة الجسدية للشخص؟

الأفكار الموحدة في العالم حول هذه القضايا لم يتم تطويرها بعد. في الوقت نفسه ، تتقارب بشكل متزايد الأفكار حول برامج (بطاريات) الاختبارات التي تميز اللياقة البدنية للأطفال والمراهقين من سن 6 إلى 17 عامًا ، والتي تم تبنيها في بلدان مختلفة.

1.2 مفهوم "الاختبار" وتصنيف اختبارات المحرك (المحرك)

مصطلح اختبار في الترجمة من اللغة الإنجليزية يعني "اختبار ، اختبار".

تستخدم الاختبارات لحل العديد من المشكلات العلمية والعملية. من بين الطرق الأخرى لتقييم الحالة الجسدية للشخص (الملاحظة ، وتقييمات الخبراء) ، فإن طريقة الاختبار (في حالتنا ، الحركية أو الحركية) هي الطريقة الرئيسية المستخدمة في علم القياس الرياضي والتخصصات العلمية الأخرى ("عقيدة الحركات" ، نظرية ومنهجية التربية البدنية).

الاختبار هو قياس أو اختبار يتم إجراؤه لتحديد قدرة الشخص أو حالته. يمكن أن يكون هناك الكثير من هذه القياسات ، بما في ذلك تلك التي تعتمد على استخدام مجموعة متنوعة من التمارين البدنية. ومع ذلك ، لا يمكن اعتبار كل تمرين أو اختبار جسدي بمثابة اختبار. يمكن فقط استخدام الاختبارات (العينات) التي تفي بالمتطلبات الخاصة كاختبارات:

يجب تحديد الغرض من أي اختبار (أو اختبارات) ؛

ينبغي تطوير منهجية قياس معيارية وإجراء اختبار ؛

من الضروري تحديد موثوقية الاختبارات والمعلوماتية ؛

يمكن تقديم نتائج الاختبار في نظام تسجيل مناسب.

يسمى نظام استخدام الاختبارات وفقًا للمهمة ، وتنظيم الشروط ، وأداء الاختبارات من قبل الموضوعات ، وتقييم وتحليل النتائج ، والقيمة العددية التي يتم الحصول عليها أثناء القياسات هي نتيجة الاختبار (اختبار ). على سبيل المثال ، الوثب الطويل هو اختبار ؛ إجراء القفزات وقياس النتائج - الاختبار ؛ طول القفزة - نتيجة الاختبار.

تعتمد الاختبارات المستخدمة في التربية البدنية على الإجراءات الحركية (التمارين البدنية ، المهام الحركية). تسمى هذه الاختبارات باختبارات الحركة أو المحركات.

حاليًا ، لا يوجد تصنيف واحد لاختبارات المحركات. يُعرف تصنيف الاختبارات وفقًا لهيكلها ووفقًا لمؤشراتها السائدة (الجدول 2).

على النحو التالي من الجدول ، هناك اختبارات فردية ومعقدة. يعمل اختبار الوحدة على قياس وتقييم سمة واحدة (قدرة التنسيق أو التكييف). نظرًا لأنه ، كما نرى ، فإن بنية كل قدرة تنسيق أو تكييف معقدة ، إذن ، كقاعدة عامة ، يتم تقييم عنصر واحد فقط من هذه القدرة بمساعدة مثل هذا الاختبار (على سبيل المثال ، القدرة على التوازن ، رد فعل بسيط ، قوة عضلات اليدين).

الجدول 2. - نماذج الاختبارات وإمكانيات تطبيقها (وفقًا لـ D.D. Blume ، 1987)

القدرة المقاسة

علامة الهيكل

اختبار الوحدة

اختبار أولي يحتوي على مهمة حركية واحدة

قدرة واحدة أو جانب (مكون) القدرة

مهمة اختبار واحدة ، درجة اختبار نهائي واحدة

اختبار التوازن ، قياس الاهتزاز ، اختبار الاتصال ، اختبار الإيقاع

اختبار الممارسة

سؤال اختبار واحد أو أكثر. نتيجة اختبار نهائي واحدة

اختبار الممارسة العامة

سلسلة الاختبار

مهمة واحدة من الاختبارات مع المتغيرات أو عدة مهام ذات صعوبة متزايدة

اختبار الاتصال

اختبار شامل

اختبار معقد يحتوي على مهمة واحدة

عدة قدرات أو جوانب (مكونات) لقدرة واحدة

مهمة اختبار واحدة ، عدة درجات نهائية

اختبار القفز

اختبار المهام التي يعاد استخدامها

مهام اختبار متعددة تعمل بالتسلسل ، تقييمات نهائية متعددة

اختبار رد الفعل القابل لإعادة الاستخدام

ملف الاختبار

اختبارات متعددة ، درجات نهائية متعددة

مهمة التنسيق

اختبار البطارية

اختبارات متعددة ، درجة اختبار واحدة

اختبار البطارية لتقييم القدرة على تعلم الحركة


بمساعدة اختبار تدريبي ، يتم تقييم القدرة على التعلم الحركي (من خلال الفرق بين العلامات النهائية والأولية لفترة معينة من التدريب على تقنية الحركات).

تتيح سلسلة الاختبار استخدام نفس الاختبار لفترة طويلة ، عندما تتحسن القدرة المقاسة بشكل كبير. في الوقت نفسه ، تتزايد مهام الاختبار باستمرار في الصعوبة. لسوء الحظ ، لم يتم استخدام هذا النوع من الاختبارات بشكل كافٍ في كل من العلم والممارسة.

بمساعدة اختبار معقد ، يتم تقييم العديد من العلامات أو المكونات ذات القدرة المختلفة أو نفسها ، على سبيل المثال ، قفزة من مكان (بموجة من الأيدي ، بدون موجة من الأيدي ، إلى ارتفاع معين). بناءً على هذا الاختبار ، يمكنك الحصول على معلومات حول مستوى قدرات قوة السرعة (حسب ارتفاع القفزة) ، وقدرات التنسيق (من خلال دقة التمايز بين جهود القوة ، بالاختلاف في ارتفاع القفزة مع وبدون موجة من الأسلحة).

يتكون ملف الاختبار من اختبارات فردية يتم من خلالها تقييم عدة قدرات بدنية مختلفة (ملف تعريف اختبار غير متجانس) ، أو مظاهر مختلفةنفس القدرة الجسدية (ملف اختبار متجانس). يمكن تقديم نتائج الاختبار في شكل ملف تعريف ، مما يجعل من الممكن مقارنة النتائج الفردية والجماعية.

تتكون بطارية الاختبار أيضًا من عدة اختبارات منفصلة ، يتم تلخيص نتائجها في درجة نهائية واحدة ، يتم أخذها في الاعتبار في أحد مقاييس التصنيف (انظر الفصل 2). كما هو الحال في ملف الاختبار ، يتم التمييز بين البطاريات المتجانسة وغير المتجانسة. يتم استخدام بطارية متجانسة ، أو ملف تعريف متجانس ، في تقييم جميع مكونات سعة معقدة (على سبيل المثال ، التفاعلية). في الوقت نفسه ، يجب أن تكون نتائج الاختبارات الفردية مترابطة بشكل وثيق (يجب أن ترتبط).

في اختبارات المهام القابلة لإعادة الاستخدام ، يقوم الأشخاص بأداء المهام الحركية بشكل تسلسلي ويحصلون على علامات منفصلة لكل حل من حل المهمة الحركية. قد تكون هذه التقديرات وثيقة الصلة ببعضها البعض. من خلال الحسابات الإحصائية المناسبة ، يمكن الحصول على معلومات إضافية حول القدرات التي يتم تقييمها. مثال على ذلك هو مهام اختبار القفز التي تم حلها بالتسلسل (الجدول 3).

الجدول 3. مهام اختبار القفز التي تم حلها بالتتابع

مهمة الاختبار

تقييم النتيجة

قدرة

أقصى قفزة بدون تأرجح للذراع

قفز القوة

القفز الأقصى مع موجة من اليدين

قفز القوة والقدرة على الاتصال (السندات)

الحد الأقصى للقفز مع موجة من اليدين والقفز

الاتصال (الروابط) وقوة القفز

10 يقفز بموجة من اليدين لمسافة تساوي 2/3 من أقصى ارتفاعالقفز ، كما في المشكلة 2

مجموع الانحرافات عن علامة معينة

القدرة على التفريق بين معلمات قوة الحركات

الفرق بين نتائج حل مشكلة واحدة ومشكلتين

القدرة على الاتصال (الاتصال)

(حسب دي دي بلوم ، 1987)

يشير تعريف الاختبارات الحركية إلى أنها تعمل على تقييم القدرات الحركية والمهارات الحركية جزئيًا. في الشكل الأكثر عمومية ، توجد اختبارات تكييف واختبارات تنسيق واختبارات لتقييم المهارات والقدرات الحركية (تقنيات الحركة). ومع ذلك ، فإن مثل هذا التنظيم لا يزال عامًا للغاية. يأتي تصنيف الاختبارات الحركية وفقًا لمؤشراتها السائدة من تنظيم القدرات الفيزيائية (الحركية).

في هذا الصدد ، هناك:

1) اختبارات الحالة:

لتقييم القوة: الحد الأقصى والسرعة والقدرة على التحمل ؛

لتقييم القدرة على التحمل.

لتقييم قدرات السرعة ؛

لتقييم المرونة - الإيجابي والسلبي ؛

2) اختبارات التنسيق:

لتقييم قدرات التنسيق المتعلقة بمجموعات فردية مستقلة من الإجراءات الحركية ، والتي تقيس قدرات التنسيق الخاصة ؛

لتقييم قدرات التنسيق المحددة - القدرة على التوازن ، والتوجيه في الفضاء ، والاستجابة ، والتمييز بين معلمات الحركة ، والإيقاع ، وإعادة هيكلة الحركات الحركية ، والتنسيق (الاتصال) ،

الاستقرار الدهليزي ، استرخاء العضلات الطوعي.

لم يتم النظر في مفهوم "اختبارات تقييم المهارات الحركية" في هذا العمل. يتم إعطاء أمثلة على الاختبارات في الملحق 2.

وبالتالي ، فإن كل تصنيف هو نوع من المبادئ التوجيهية لاختيار (أو إنشاء) نوع الاختبارات الأكثر صلة بمهام الاختبار.

1.3 معايير عامل الجودة لاختبارات المحرك

يخدم مفهوم "اختبار المحرك" غرضه عندما يفي الاختبار بالمتطلبات ذات الصلة.

تسمى الاختبارات التي تفي بمتطلبات الموثوقية والمعلوماتية بأنها جيدة أو موثوقة (موثوقة).

تُفهم موثوقية الاختبار على أنها درجة الدقة التي يقيم بها قدرة حركية معينة ، بغض النظر عن متطلبات الشخص الذي يقيمها. تتجلى الموثوقية في درجة الاتفاق بين النتائج عندما يتم اختبار نفس الأشخاص مرارًا وتكرارًا في ظل نفس الظروف ؛ إنه استقرار أو استقرار نتيجة اختبار الفرد عند تكرار تمرين التحكم. بمعنى آخر ، يحتفظ الطفل في مجموعة الأشخاص الذين شملهم الاستطلاع وفقًا لنتائج الاختبار المتكرر (على سبيل المثال ، أداء القفز ، ووقت الجري ، ومسافة الرمي) بثبات في مكانه في الترتيب.

يتم تحديد مصداقية الاختبار باستخدام تحليل الارتباط الإحصائي عن طريق حساب معامل الموثوقية. في هذه الحالة ، يتم استخدام طرق مختلفة ، على أساسها يتم الحكم على موثوقية الاختبار.

يعتمد استقرار الاختبار على العلاقة بين المحاولات الأولى والثانية ، التي تتكرر بعد فترة زمنية معينة في نفس الظروف بواسطة نفس المجرب. تسمى طريقة الاختبار المتكرر لتحديد الموثوقية بإعادة الاختبار. يعتمد استقرار الاختبار على نوع الاختبار ، وعمر وجنس الأشخاص ، والفاصل الزمني بين الاختبار وإعادة الاختبار. على سبيل المثال ، تكون مؤشرات الاختبارات الشرطية أو السمات المورفولوجية على فترات زمنية قصيرة أكثر ثباتًا من نتائج اختبارات التنسيق ؛ في الأطفال الأكبر سنًا ، تكون النتائج أكثر استقرارًا من الأطفال الأصغر سنًا. عادة ما يتم إجراء إعادة الاختبار في موعد لا يتجاوز أسبوع بعد. على فترات أطول (على سبيل المثال ، بعد شهر) ، يصبح استقرار الاختبارات المتساوية مثل الجري لمسافة 1000 متر أو الوثب الطويل الدائم أقل بشكل ملحوظ.

يتكون معادلة الاختبار من ارتباط نتيجة الاختبار بنتائج الاختبارات الأخرى من نفس النوع (على سبيل المثال ، عندما يكون من الضروري اختيار الاختبار الذي يعكس بشكل أكثر ملاءمة قدرات السرعة: تشغيل 30 أو 50 أو 60 أو 100 متر).

يعتمد الموقف تجاه الاختبارات المكافئة (المتجانسة) على العديد من العوامل. إذا كان من الضروري زيادة موثوقية تقديرات أو استنتاجات الدراسة ، فمن المستحسن استخدام اختبارين أو أكثر معادلين. وإذا كانت المهمة هي إنشاء بطارية تحتوي على حد أدنى من الاختبارات ، فيجب استخدام اختبار واحد فقط من الاختبارات المكافئة. هذه البطارية ، كما لوحظ ، غير متجانسة ، لأن الاختبارات المدرجة فيها تقيس القدرات الحركية المختلفة. مثال على بطارية اختبار غير متجانسة هو تشغيل 30 مترًا ، وسحبًا ، وانحناءًا أماميًا ، وتشغيل 1000 متر.

يتم تحديد موثوقية الاختبارات أيضًا من خلال مقارنة متوسط ​​درجات المحاولات الفردية والزوجية المدرجة في الاختبار. على سبيل المثال ، تتم مقارنة متوسط ​​دقة الهدف البالغة 1 و 3 و 5 و 7 و 9 محاولات بمتوسط ​​دقة اللقطات 2 و 4 و 6 و 8 و 10 محاولات. تسمى هذه الطريقة لتقييم الموثوقية طريقة المضاعفة أو الانقسام. يتم استخدامه بشكل أساسي عند تقييم قدرات التنسيق وإذا كان عدد المحاولات التي تشكل نتيجة اختبار لا يقل عن 6.

في ظل موضوعية (اتساق) الاختبار ، فهم درجة اتساق النتائج التي تم الحصول عليها على نفس الموضوعات من قبل مجربين مختلفين (مدرسون ، قضاة ، خبراء).

لزيادة موضوعية الاختبار ، من الضروري الامتثال لشروط الاختبار القياسية:

اختبار الوقت والموقع والظروف الجوية ؛

دعم موحد للمواد والأجهزة ؛

العوامل النفسية (حجم وشدة الحمل ، الدافع) ؛

تقديم المعلومات (بيان شفهي دقيق لمهمة الاختبار ، الشرح والشرح).

هذا هو ما يسمى بموضوعية الاختبار. يتحدثون أيضًا عن الموضوعية التفسيرية ، والتي تشير إلى درجة استقلالية تفسير نتائج الاختبار من قبل مجربين مختلفين.

بشكل عام ، كما يلاحظ الخبراء ، يمكن تحسين موثوقية الاختبارات بطرق مختلفة: توحيد معايير أكثر صرامة للاختبار (انظر أعلاه) ، وزيادة في عدد المحاولات ، وتحفيز أفضل للموضوعات ، وزيادة في عدد المقيّمين ( القضاة والخبراء) ، وزيادة في اتساق آرائهم ، وزيادة في عدد الاختبارات المعادلة.

لا توجد قيم ثابتة لمؤشرات موثوقية الاختبار. في معظم الحالات ، يتم استخدام التوصيات التالية: 0.95 - 0.99 - موثوقية ممتازة ؛ 0.90–0.94 - جيد ؛ 0.80 - 0.89 - مقبول ؛ 0.70 - 0.79 - سيء ؛ 0.60 - 0.69 - مشكوك فيه بالنسبة للتقييمات الفردية ، الاختبار مناسب فقط لتوصيف مجموعة من الموضوعات.

المعلوماتية للاختبار هي درجة الدقة التي يقيس بها القدرة أو المهارة الحركية المقدرة. في الأدبيات الأجنبية (والمحلية) ، بدلاً من كلمة "المعلوماتية" ، يتم استخدام مصطلح "الصلاحية" (من الصلاحية الإنجليزية - الصلاحية ، الصلاحية ، الشرعية). في الواقع ، عند الحديث عن المعلوماتية ، يجيب الباحث على سؤالين: ما الذي يقيسه هذا الاختبار بالذات (بطارية الاختبار) وما هي درجة دقة القياس؟

هناك عدة أنواع من المصداقية: منطقية (ذات مغزى) وتجريبي (بناءً على بيانات تجريبية) وتنبؤية (2)

معايير الاختبار الإضافية المهمة هي التوحيد القياسي وقابلية المقارنة والاقتصاد.

جوهر التطبيع هو أنه ، بناءً على نتائج الاختبار ، من الممكن إنشاء معايير ذات أهمية خاصة للممارسة.

قابلية المقارنة للاختبار هي القدرة على مقارنة النتائج التي تم الحصول عليها من شكل واحد أو أكثر من الاختبارات المتوازية (المتجانسة). من الناحية العملية ، فإن استخدام الاختبارات الحركية المماثلة يقلل من احتمالية أنه نتيجة للاستخدام المنتظم لنفس الاختبار ، لا يتم تقييم مستوى القدرة فحسب ، بل يتم تقييم درجة المهارة. نتائج الاختبار القابلة للمقارنة في نفس الوقت تزيد من موثوقية الاستنتاجات.

يتمثل جوهر الاقتصاد كمعيار لجودة الاختبار في أن الاختبار لا يتطلب وقتًا طويلاً وتكاليف مادية كبيرة ومشاركة العديد من المساعدين.


استنتاج

نشأ رواد اختبارات المحركات الحديثة في أواخر القرن التاسع عشر وأوائل القرن العشرين. منذ عام 1920 ، تم إجراء مسوحات جماعية في بلدنا من أجل دراسة المؤشرات الرئيسية للتطور البدني ومستوى اللياقة الحركية. على هذا الأساس من هذه البيانات ، تم تطوير معايير مجمع جاهز للعمل والدفاع.

دخل مفهوم القدرات الحركية الخمس بقوة في نظرية الاختبار: القوة والسرعة وتنسيق الحركات والتحمل والمرونة. لتقييمها ، أ سطر كاملبطاريات اختبار مختلفة.

من بين طرق تقييم الحالة الجسدية للشخص ، فإن طريقة الاختبار هي الطريقة الرئيسية. هناك اختبارات فردية ومعقدة. أيضًا ، فيما يتعلق بتنظيم القدرات البدنية (الحركية) ، يتم تصنيف الاختبارات إلى اختبارات شرطية وتنسيقية.

يجب أن تفي جميع الاختبارات بالمتطلبات الخاصة. تشمل المعايير الرئيسية: الموثوقية ، الاستقرار ، التكافؤ ، الموضوعية ، المعلوماتية (الصلاحية). تشمل المعايير الإضافية: التطبيع وقابلية المقارنة والاقتصاد.

لذلك ، عند اختيار اختبارات معينة ، من الضروري الامتثال لجميع هذه المتطلبات. لزيادة موضوعية الاختبارات ، يجب على المرء الالتزام بمعايير أكثر صرامة للاختبار ، وزيادة عدد المحاولات ، وتحفيز أفضل للموضوعات ، وزيادة عدد المقيّمين (القضاة ، الخبراء) ، زيادة في اتساق آرائهم ، وزيادة في عدد الاختبارات المكافئة.


الفصل الثاني: مهام البحث وطرقه وتنظيمه

2.1 أهداف البحث:

1. دراسة المعلومات حول نظرية الاختبار حسب المصادر الأدبية.

2. تحليل منهجية اختبار الصفات البدنية.

3. قارن مؤشرات الاستعداد الحركي لطلاب الصفين 7 أ و 7 ب.

2.2 طرق البحث:

1. تحليل وتعميم المصادر الأدبية.

أجريت طوال فترة الدراسة. على حل هذه المشاكل المستوى النظرييتم إجراؤه على دراسة الأدب حول: نظرية ومنهجية التربية البدنية والرياضة ، وتعليم الصفات البدنية ، والمقاييس الرياضية. تم تحليل 20 مصدرًا أدبيًا.

2. التأثير اللفظي.

كان هناك إيجاز عن تسلسل إجراء الاختبارات الحركية ومحادثة تحفيزية لضبط الحالة المزاجية لتحقيق أفضل نتيجة.

3. اختبار الصفات الجسدية.

تشغيل 30 مترًا (من بداية عالية) ،

تشغيل المكوك 3 × 10 أمتار ،

قفزة طويلة ،

تشغيل لمدة 6 دقائق (م) ،

الانحناء الأمامي من وضعية الجلوس (سم) ،

سحب المنبثقة على العارضة (الفتيات في الأسفل).

4. طرق الإحصاء الرياضي.

تُستخدم لإجراء العمليات الحسابية التي تم استخدامها في تحليل مقارنالطلاب في الصفين 7 أ و 7 ب.

2.3 تنظيم الدراسة

في المرحلة الأولى ، في أبريل 2009 ، تم تحليل المؤلفات العلمية والمنهجية:

دراسة محتوى برامج التربية الرياضية لطلبة التربية العامة

تتنوع مجالات التطبيق والأهداف والغايات الخاصة باختبار البرمجيات ، لذلك يتم تقييم الاختبار وشرحه بطرق مختلفة. أحيانًا يكون من الصعب على المختبرين أن يشرحوا ماهية اختبار البرامج "كما هو". هناك ارتباك.

لحل هذا الالتباس ، يسبق أليكسي بارانتسيف (ممارس ومدرب ومستشار في اختبار البرمجيات ؛ وهو مواطن من معهد برمجة النظام التابع لأكاديمية العلوم الروسية) تدريباته الاختبارية بفيديو تمهيدي حول النقاط الرئيسية للاختبار.

يبدو لي أن المحاضر كان قادرًا في هذا التقرير على شرح "ما الذي يتم اختباره" بشكل ملائم ومتوازن من وجهة نظر عالم ومبرمج. من الغريب أن هذا النص لم يظهر بعد على حبري.

هنا إعادة سرد مكثفة لهذا التقرير. في نهاية النص توجد روابط ل النسخة الكاملةوكذلك الفيديو المذكور.

الأحكام الأساسية للاختبار

زملائي الاعزاء،

أولاً ، دعنا نحاول فهم ما لا يعنيه الاختبار.

الاختبار ليس تطويرًا,

حتى لو كان المختبرين يعرفون كيفية البرمجة ، بما في ذلك الاختبارات (أتمتة الاختبار = البرمجة) ، يمكنهم تطوير نوع من البرامج المساعدة (لأنفسهم).

ومع ذلك ، فإن الاختبار ليس نشاطًا لتطوير البرامج.

الاختبار ليس تحليلاً,

وليس نشاط جمع وتحليل المتطلبات.

على الرغم من أنه في عملية الاختبار ، يتعين عليك أحيانًا توضيح المتطلبات ، وفي بعض الأحيان يتعين عليك تحليلها. لكن هذا النشاط ليس هو النشاط الرئيسي ، بل يجب أن يتم ببساطة بدافع الضرورة.

الاختبار ليس إدارة,

على الرغم من حقيقة أنه يوجد في العديد من المنظمات دور مثل "مدير الاختبار". بالطبع ، يجب إدارة المختبرين. لكن الاختبار في حد ذاته ليس إدارة.

الاختبار ليس كتابة فنية,

ومع ذلك ، يجب على المختبرين توثيق اختباراتهم وعملهم.

لا يمكن اعتبار الاختبار أحد هذه الأنشطة لمجرد أنه أثناء عملية التطوير (أو تحليل المتطلبات ، أو كتابة التوثيق لاختباراتهم) ، يتم تنفيذ كل هذا العمل بواسطة المختبرين. لنفسيوليس لشخص آخر.

النشاط مهم فقط عندما يكون مطلوبًا ، أي أنه يجب على المختبرين إنتاج شيء "للتصدير". ماذا يفعلون "للتصدير"؟

العيوب ، أوصاف العيوب ، أو تقارير الاختبار؟ هذا صحيح جزئيا.

لكن هذه ليست الحقيقة الكاملة.

النشاط الرئيسي للمختبرين

هو أنهم يزودون المشاركين في مشروع البرنامج بتعليقات سلبية حول جودة منتج البرنامج.

لا تحمل "التعليقات السلبية" أي دلالة سلبية ، ولا تعني أن المختبرين يفعلون شيئًا سيئًا ، أو أنهم يفعلون شيئًا سيئًا. إنه مجرد مصطلح تقني يعني شيئًا بسيطًا إلى حد ما.

لكن هذا الشيء مهم جدًا ، وربما العنصر الوحيد الأكثر أهمية في نشاط المختبرين.

هناك علم - "نظرية النظم". يحدد مفهوم "ردود الفعل".

"التعليقات" هي بعض البيانات التي تعود إلى المدخلات من المخرجات ، أو جزء من البيانات يعود إلى المدخلات من المخرجات. يمكن أن تكون هذه التعليقات إيجابية أو سلبية.

كلا النوعين من التغذية الراجعة لهما نفس القدر من الأهمية.

في تطوير أنظمة البرمجيات ، بالطبع ، التعليقات الإيجابية هي نوع من المعلومات التي نتلقاها من المستخدمين النهائيين. هذه طلبات لبعض الوظائف الجديدة ، وهذه زيادة في المبيعات (إذا أصدرنا منتجًا عالي الجودة).

يمكن أن تأتي التعليقات السلبية أيضًا من المستخدمين النهائيين في شكل نوع من التعليقات السلبية. أو يمكن أن يأتي من المختبرين.

كلما تم توفير ردود الفعل السلبية المبكرة ، كلما قلت الطاقة اللازمة لتعديل تلك الإشارة. لهذا السبب تحتاج إلى بدء الاختبار في أقرب وقت ممكن ، في المراحل الأولى من المشروع ، وتقديم هذه التعليقات في مرحلة التصميم ، وربما حتى قبل ذلك ، حتى في مرحلة جمع المتطلبات وتحليلها.

بالمناسبة ، هذا هو المكان الذي يأتي منه فهم أن المختبرين ليسوا مسؤولين عن الجودة. إنهم يساعدون المسؤولين عن ذلك.

مرادفات لكلمة "اختبار"

من وجهة نظر أن الاختبار هو توفير ردود فعل سلبية ، فإن الاختصار المشهور عالميًا QA (ضمان الجودة) ليس بالتأكيد مرادفًا لمصطلح "اختبار".

لا يمكنك التفكير في ضمان الجودة على أنه مجرد تقديم ملاحظات سلبية ، لأن التأكيد هو عمل إيجابي. من المفهوم أننا في هذه الحالة نقدم الجودة ، ونتخذ التدابير في الوقت المناسب لتحسين جودة تطوير البرمجيات.

لكن "مراقبة الجودة" - مراقبة الجودة ، يمكن اعتبارها بالمعنى الواسع مرادفًا لمصطلح "الاختبار" ، لأن مراقبة الجودة هي توفير التغذية الراجعة بأشكالها الأكثر تنوعًا ، في مراحل مختلفة من مشروع البرمجيات.

في بعض الأحيان ، يُقصد بالاختبار أن يكون شكلاً منفصلاً من أشكال مراقبة الجودة.

يأتي الارتباك من تاريخ تطوير الاختبار. في وقت مختلفمصطلح "اختبار" يعني نشاطات متنوعة، والتي يمكن تقسيمها إلى فئتين كبيرتين: خارجي وداخلي.

التعاريف الخارجية

التعريفات التي قدمها مايرز وبيزر وكانر في أوقات مختلفة تصف الاختبار بدقة من وجهة نظر أهميته الخارجية. أي ، من وجهة نظرهم ، الاختبار هو نشاط مخصص لشيء ما ، ولا يتكون من شيء ما. يمكن تلخيص كل هذه التعريفات الثلاثة على أنها تقدم ملاحظات سلبية.

التعاريف الداخلية

هذه هي التعريفات الواردة في معيار المصطلحات المستخدم في هندسة البرمجيات ، مثل المعيار الفعلي المسمى SWEBOK.

تشرح هذه التعريفات بشكل بناء ماهية نشاط الاختبار ، لكنها لا تعطي أدنى فكرة عن الغرض من الاختبار ، حيث سيتم بعد ذلك استخدام جميع نتائج التحقق من التطابق بين السلوك الفعلي للبرنامج وسلوكه المتوقع .

الاختبار

  • التحقق من امتثال البرنامج للمتطلبات ،
  • من خلال مراقبة عملها
  • في مواقف خاصة ، مصطنعة ، يتم اختيارها بطريقة معينة.
من الآن فصاعدًا ، سوف نعتبر هذا تعريفًا عمليًا "للاختبار".

المخطط العام للاختبار هو ما يلي تقريبًا:

  1. يتلقى المختبر البرنامج و / أو المتطلبات عند الإدخال.
  2. يفعل شيئًا معهم ، ويلاحظ عمل البرنامج في مواقف معينة أنشأها بشكل مصطنع.
  3. عند الإخراج ، يتلقى معلومات حول التطابقات والتناقضات.
  4. ثم يتم استخدام هذه المعلومات لتحسين البرنامج الحالي. أو لتغيير متطلبات برنامج لا يزال قيد التطوير.

ما هو الاختبار

  • هذا موقف خاص ، تم إنشاؤه بشكل مصطنع ، تم اختياره بطريقة معينة ،
  • ووصف ما هي ملاحظات تشغيل البرنامج التي يجب إجراؤها
  • للتحقق مما إذا كان يفي ببعض المتطلبات.
ليس من الضروري افتراض أن الموقف يحدث لمرة واحدة. يمكن أن يكون الاختبار طويلًا جدًا ، على سبيل المثال ، عند اختبار الأداء ، يمكن أن يكون هذا الوضع المصطنع عبئًا على النظام يستمر لفترة طويلة جدًا. والملاحظات التي يجب إجراؤها في هذه الحالة هي مجموعة من الرسوم البيانية أو المقاييس المختلفة التي نقيسها في عملية إجراء هذا الاختبار.

ينخرط مطور الاختبار في حقيقة أنه يختار مجموعة محدودة من مجموعة اختبارات ضخمة لا حصر لها.

حسنًا ، يمكننا أن نستنتج أن المختبر يقوم بأمرين في عملية الاختبار.

1. أولاً ، يتحكم في تنفيذ البرنامج ويخلق مواقف مصطنعة للغاية سنقوم فيها بفحص سلوك البرنامج.

2. وثانيًا ، يراقب سلوك البرنامج ويقارن ما يراه بما هو متوقع.

إذا قام أحد المختبرين بأتمتة الاختبارات ، فإنه لا يلاحظ بنفسه سلوك البرنامج - فهو يفوض هذه المهمة إلى أداة خاصة أو برنامج خاص كتبه بنفسه. هي التي تراقب وتقارن السلوك المرصود بالسلوك المتوقع ، وتعطي المختبر فقط بعض النتائج النهائية - سواء كان السلوك الملاحظ يتطابق مع السلوك المتوقع أم لا.

أي برنامج هو آلية لمعالجة المعلومات. المدخلات عبارة عن معلومات في شكل واحد ، والمخرجات هي معلومات في شكل آخر. في الوقت نفسه ، يمكن أن يحتوي البرنامج على العديد من المدخلات والمخرجات ، ويمكن أن تكون مختلفة ، أي يمكن أن يكون للبرنامج عدة واجهات مختلفة ، ويمكن أن يكون لهذه الواجهات أنواع مختلفة:

  • واجهة المستخدم (UI)
  • واجهة البرمجة (API)
  • بروتوكول الشبكة
  • نظام الملفات
  • حالة البيئة
  • التطورات
أكثر الواجهات شيوعًا هي
  • العادة،
  • الرسم
  • نص،
  • ناتئ
  • والكلام.
باستخدام كل هذه الواجهات ، يقوم المختبر بما يلي:
  • بطريقة ما يخلق مواقف مصطنعة ،
  • ويتحقق في هذه المواقف من سلوك البرنامج.

هذا هو الاختبار.

التصنيفات الأخرى لأنواع الاختبارات

التقسيم الأكثر استخدامًا إلى ثلاثة مستويات هو
  1. وحدة التجارب،
  2. اختبار التكامل،
  3. اختبار النظام.
عادةً ما يعني اختبار الوحدة الاختبار على مستوى منخفض نسبيًا ، أي اختبار العمليات والأساليب والوظائف الفردية.

يشير اختبار النظام إلى الاختبار على مستوى واجهة المستخدم.

أحيانًا يتم استخدام بعض المصطلحات الأخرى أيضًا ، مثل "اختبار المكونات" ، لكنني أفضل تحديد هذه المصطلحات الثلاثة ، لأن التقسيم التكنولوجي إلى اختبار الوحدة والنظام ليس له معنى كبير. على مستويات مختلفة ، نفس الأدوات ، يمكن استخدام نفس الأساليب. التقسيم مشروط.

تُظهر الممارسة أن الأدوات التي وضعتها الشركة المصنعة كأدوات اختبار وحدة يمكن استخدامها بنجاح متساوٍ على مستوى اختبار التطبيق بأكمله ككل.

والأدوات التي تختبر التطبيق بأكمله ككل على مستوى واجهة المستخدم تريد أحيانًا البحث ، على سبيل المثال ، في قاعدة بيانات أو استدعاء بعض الإجراءات المخزنة المنفصلة هناك.

أي أن التقسيم إلى اختبار النظام والوحدة يكون عمومًا مشروطًا بحتًا ، ويتحدث من وجهة نظر فنية.

يتم استخدام نفس الأدوات ، وهذا أمر طبيعي ، يتم استخدام نفس الأساليب ، في كل مستوى يمكننا التحدث عن اختبار من نوع مختلف.

نحن نجمع:

أي يمكننا التحدث عن اختبار الوحدة للوظائف.

يمكننا التحدث عن اختبار النظام للوظائف.

يمكنك التحدث عن اختبار الوحدة ، على سبيل المثال ، الكفاءة.

يمكننا التحدث عن اختبار النظام للفعالية.

إما أن ننظر في كفاءة خوارزمية واحدة ، أو ننظر في كفاءة النظام بأكمله ككل. أي أن التقسيم التكنولوجي إلى اختبار الوحدة والنظام ليس له معنى كبير. لأن نفس الأدوات ، يمكن استخدام نفس الأساليب على مستويات مختلفة.

أخيرًا ، أثناء اختبار التكامل ، نتحقق مما إذا كانت الوحدات النمطية تتفاعل مع بعضها البعض بشكل صحيح ضمن نظام معين. أي أننا نجري في الواقع نفس الاختبارات كما هو الحال في اختبار النظام ، فقط نحن نولي اهتمامًا إضافيًا لكيفية تفاعل الوحدات مع بعضها البعض. لنقم ببعض الفحوصات الإضافية. هذا هو الاختلاف الوحيد.

دعنا نحاول مرة أخرى فهم الفرق بين اختبار النظام واختبار الوحدة. نظرًا لأن هذا التقسيم يحدث في كثير من الأحيان ، يجب أن يكون هذا الاختلاف.

ويتجلى هذا الاختلاف عندما لا نقوم بتصنيف تكنولوجي ، بل تصنيف بالأهدافاختبارات.

يتم تصنيف الهدف بسهولة باستخدام "المربع السحري" ، الذي اخترعه في الأصل بريان ماريك ثم تم تحسينه لاحقًا بواسطة إيري تينين.

في هذا المربع السحري ، توجد جميع أنواع الاختبارات في أربعة أرباع ، اعتمادًا على ما يتم إيلاء المزيد من الاهتمام له في هذه الاختبارات.

عموديًا - كلما زاد نوع الاختبار ، زاد الاهتمام بالبعض المظاهر الخارجيةسلوك البرنامج ، كلما انخفض ، زاد الاهتمام الذي نوليه لهيكله التكنولوجي الداخلي للبرنامج.

أفقيًا - كلما زادت اختباراتنا على اليسار ، زاد اهتمامنا ببرمجتها ، إلى اليمين ، زاد اهتمامنا بالاختبار اليدوي وبحوث البرامج البشرية.

على وجه الخصوص ، يمكن إدخال مصطلحات مثل اختبار القبول واختبار القبول واختبار الوحدة بسهولة في هذا المربع بالمعنى الذي يتم استخدامه غالبًا في الأدبيات. هذا اختبار منخفض المستوى مع الكثير ، مع حصة ساحقة من البرمجة. أي أن جميع الاختبارات مبرمجة ، ويتم إجراؤها تلقائيًا بالكامل ، ويتم الاهتمام بها في المقام الأول جهاز داخليالبرنامج ، وهي ميزاته التكنولوجية.

في الزاوية اليمنى العليا ، سيكون لدينا اختبارات يدوية تهدف إلى بعض السلوك الخارجي للبرنامج ، على وجه الخصوص ، اختبار قابلية الاستخدام ، وفي الزاوية اليمنى السفلية من المرجح أن نجري اختبارات لمختلف الخصائص غير الوظيفية: الأداء ، والأمان ، وما إلى ذلك. على.

لذلك ، بناءً على التصنيف حسب الأهداف ، لدينا اختبار وحدة في الربع السفلي الأيسر ، وجميع الأرباع الأخرى هي اختبار النظام.

شكرا لاهتمامكم.


الأسئلة الرئيسية: اختبار كأداة قياس. نظريات الاختبار الأساسية. وظائف وإمكانيات وقيود الاختبار. استخدام الاختبارات في تقييم الموظفين. مزايا وعيوب استخدام الاختبارات. أشكال وأنواع عناصر الاختبار. تكنولوجيا بناء المهام. تقييم جودة الاختبار. الموثوقية والصلاحية. برنامج تطوير الاختبار. 2




الاختبار كأداة قياس المفاهيم الأساسية في علم الاختبار: القياس والاختبار والمحتوى وشكل المهام وموثوقية وصحة نتائج القياس. بالإضافة إلى ذلك ، يستخدم علم الاختبارات مفاهيم العلوم الإحصائية مثل أخذ العينات و تعداد السكان، المتوسطات ، التباين ، الارتباط ، الانحدار ، إلخ. 4




مهمة الاختبار هي وحدة فعالة تعليميًا وتقنيًا لمواد التحكم ، وهي جزء من الاختبار الذي يفي بمتطلبات نقاء المحتوى (أو البعد الواحد) ، والمحتوى والصحة المنطقية ، وصحة الشكل ، وقبول الصورة الهندسية لـ المهمة. 6




الاختبار التقليدي هو طريقة معيارية لتشخيص مستوى وهيكل التأهب. في مثل هذا الاختبار ، يجيب جميع الأشخاص على نفس المهام ، وفي نفس الوقت ، وفي ظل نفس الشروط وبنفس القواعد لتقييم الإجابات. لتحقيق هدف الاختبار ، يمكنك إنشاء لا يحصىالاختبارات ، ويمكن أن تتوافق جميعها مع إنجاز المهمة. ثمانية


برنامج Professiogram (من Lat. Professio Speciality + Gramma Record) هو نظام من الميزات التي تصف مهنة معينة ، ويتضمن أيضًا قائمة بالمعايير والمتطلبات للموظف في هذه المهنة أو التخصص. على وجه الخصوص ، قد يتضمن المخطط الاحترافي قائمة بالخصائص النفسية التي يجب أن يلتقي بها ممثلو مجموعات مهنية معينة. 9


نظرية الاختبار الأساسية ظهرت الأعمال العلمية الأولى حول نظرية الاختبار في بداية القرن العشرين ، عند تقاطع علم النفس وعلم الاجتماع وعلم التربية وما يسمى بالعلوم السلوكية. يسمي علماء النفس الأجانب هذا العلم بالقياسات النفسية (Psychometrika) ، والمدرسون - القياس التربوي (القياس التربوي). إن تفسير اسم "testology" غير محاط بالأيديولوجيا والسياسة ، بسيط وشفاف: علم الاختبارات. عشرة


المرحلة الأولى - عصور ما قبل التاريخ - من العصور القديمة إلى نهاية القرن التاسع عشر ، عندما انتشرت أشكال ما قبل العلم للتحكم في المعرفة والقدرات ؛ الفترة الثانية ، الكلاسيكية ، استمرت من بداية العشرينات حتى نهاية الستينيات ، حيث تم إنشاء النظرية الكلاسيكية للاختبارات ؛ الفترة الثالثة - التكنولوجية - التي بدأت في السبعينيات - وقت تطوير أساليب الاختبار والتعلم التكيفي ، ومنهجية التطوير الفعال للاختبارات ومهام الاختبار للتقييم المعياري للمواضيع من حيث الجودة الكامنة المقاسة. أحد عشر


وظائف وإمكانيات وقيود الاختبار تم تصميم الاختبارات المستخدمة في الاختيار للحصول على صورة نفسية للمرشح ، وتقييم قدراته ، وكذلك المعرفة والمهارات المهنية. تسمح لك الاختبارات بمقارنة المرشحين مع بعضهم البعض أو مع المعايير ، أي المرشح المثالي. تُستخدم الاختبارات لقياس صفات الشخص اللازمة للأداء الفعال للوظيفة. تم تصميم بعض الاختبارات بحيث يدير صاحب العمل الاختبار بنفسه ويحسب النتائج. يحتاج البعض الآخر إلى خدمات استشاريين ذوي خبرة لضمان التطبيق الصحيح. 12


ترتبط قيود استخدام الاختبارات - بتكلفة إدارتها ؛ - مع الملاءمة لتقييم قدرات الشخص ؛ - الاختبارات أكثر نجاحًا في توقع النجاح في العمل الذي يحتوي على مهام مهنية قصيرة المدى ، وليست مريحة جدًا في الحالات التي تستغرق فيها المهام التي يتم حلها في العمل عدة أيام أو أسابيع. 13








2. يجب اختيار المصطلحات المستخدمة على أساس جمهور مستهدف محدد. يجب أيضًا استبعاد المقالات أو المقالات الزائدة التي تتضمن سؤالين أو أكثر ، لأنها أحيانًا تربك المستفتى وتجعل التفسير صعبًا. 17


3. للوفاء بكل هذه المتطلبات ، يجب عليك مراجعة بنك الأسئلة بالكامل مقالة بمقالة وتحليل الغرض الذي يخدمه كل منهم. على سبيل المثال ، إذا تم تطوير اختبار لقياس المهارات التحليلية للمتدربين في مجال المحاسبة ، يجدر النظر في مصطلح " مهارات تحليلية". الثامنة عشر




5. عند اختيار الأسئلة وتنسيقات الدرجات ، يجب تحويلها إلى تنسيق سهل الاستخدام ، مع تعليمات مكتوبة بوضوح وأسئلة نموذجية ؛ حتى يفهم المتقدمون للاختبار تمامًا ما هو مطلوب منهم. عشرين


6. في كثير من الأحيان ، في هذه المرحلة من التطوير ، يتم تضمين المزيد من الأسئلة في الاختبار أكثر من اللازم. حسب بعض التقديرات ، سيبقى ثلاثة أضعاف ما تبقى في الاختبار النهائي أو نظام القياس. ستكون نقطة البداية عندئذ هي اختبار الاختبار الذي يتم تطويره على عينة كبيرة نسبيًا من العمال الحاليين لضمان فهم جميع الأسئلة بسهولة. 21


7. عادة ما تبدأ اختبارات المعرفة بـ أسئلة بسيطةتزداد صعوبة تدريجياً مع اقتراب النهاية. عندما يكون من المفترض أن يتم قياس الاختبارات المواقف الاجتماعيةو الخصائص الشخصيةقد يكون من المفيد التبديل بين المقالات ذات الصياغة السلبية والإيجابية لتجنب الردود الخاطئة. 22


8. المرحلة الأخيرة هي تطبيق الاختبار على نطاق واسع عينة تمثيليةلوضع معايير الأداء والصلاحية والصلاحية حتى قبل استخدامها كأداة اختيار. بالإضافة إلى ذلك ، يجب تحديد عدالة الاختبار للتأكد من أنه لا يميز ضد أي مجموعات فرعية من السكان (على سبيل المثال ، الاختلافات العرقية). 23


تقييم جودة الاختبار لكي تكون طرق الاختيار فعالة بدرجة كافية ، يجب أن تكون موثوقة وصحيحة وموثوقة. تتميز موثوقية طريقة الاختيار بعدم قابليتها للتأثر أخطاء منهجيةعند القياس ، وهذا هو اتساقها عندما ظروف مختلفة. 24


في الممارسة العملية ، تتحقق الموثوقية في إصدار الأحكام من خلال مقارنة نتائج اختبارين أو أكثر من الاختبارات المماثلة التي أجريت في أيام مختلفة. هناك طريقة أخرى لزيادة الموثوقية وهي مقارنة نتائج العديد من طرق الاختيار البديلة (مثل الاختبار والمقابلة). إذا كانت النتائج متشابهة أو متشابهة ، فيمكن اعتبارها صحيحة. 25


الموثوقية تعني أن القياسات المأخوذة ستعطي نفس النتيجة مثل القياسات السابقة ، أي أن نتائج التقييم لا تتأثر بالعوامل الخارجية. تعني الصلاحية أن الطريقة تقيس بالضبط ما تنوي القيام به. أقصى دقة ممكنة للمعلومات التي تم الحصول عليها من خلال طرق مطورة خصيصًا في بحث علمي، مقيد بالعوامل الفنية ولا يتجاوز 0.8. 26


في ممارسة اختيار الموظفين ، لوحظ أن الموثوقية أساليب مختلفةالتقديرات تقع في فترات زمنية: 0.1 - 0.2 - المقابلة التقليدية ؛ 0.2 - 0.3 - توصيات ؛ 0.3 - 0.5 - اختبارات مهنية ؛ 0.5 - 0.6 - مقابلة منظمة ، مقابلة على أساس الكفاءة ؛ 0.5 - 0.7 - الاختبارات المعرفية والشخصية ؛ 0.6 - 0.7 - النهج القائم على الكفاءة (التقييم - المركز). 27


تشير الصلاحية إلى درجة الدقة نتيجة معينةأو الطريقة أو المعيار "يتنبأ" بالأداء المستقبلي للشخص الذي يجري اختباره. تشير صلاحية الطرق إلى الاستنتاجات المستخلصة من الإجراء ، وليس الإجراء نفسه. بمعنى ، قد تكون طريقة الاختيار نفسها موثوقة ، ولكنها لا تتوافق مع مهمة محددة: ألا تقيس ما هو مطلوب فيه هذه القضية. 28


برمجيات لتطوير الاختبارات في الممارسة المحلية ، يتم تقديم العديد من البرامج المتكاملة مع وحدة "التشخيص النفسي" ، على سبيل المثال ، البرنامج "1 C: إدارة الرواتب وشؤون الموظفين 8.0" مع وحدة "التشخيص النفسي" ، تم تطويره بالاشتراك مع مجموعة من معلمي قسم علم نفس الشخصية وعلم النفس العام في كلية علم النفس جامعة موسكو الحكومية م في لومونوسوف تحت إشراف د. العلوم ، أ. أ. ن. جوسيفا. جهاز محاكاة للتدريب لتطوير أنظمة تقييم الموظفين وتكييف طرق الاختبار لكلية علم النفس بجامعة TSU ، تم تطويره أيضًا على أساس "1 C: Enterprise 8.2" بواسطة Personnel Soft. 29


المراجع: الاختيار والتوظيف: تقنيات الاختبار والتقييم / دومينيك كوبر ، إيفان ت. روبرتسون ، جوردون تينلاين. - م، دار النشر "فيرشينا"، - 156 ص. الدعم النفسي النشاط المهني: النظرية والتطبيق / إد. أ. جي إس نيكيفوروفا. - سانت بطرسبرغ: الكلام ، - 816 ص. ثلاثين