Біографії Характеристики Аналіз

Теорія тестів та тестування фізичної підготовленості учнів. Основні поняття теорії тестів

Основи теорії тестів 1. Основні поняття теорії тестів 2. Надійність тестів та шляхи її визначення

Контрольні питання 1. Що називається тестом? 2. Які вимоги висуваються до тесту? 3. Які тести називаються автентичними? 4. Що називається надійністю тесту? 5. Перелічити причини, що викликають варіацію результатів під час повторного тестування. 6. У чому відмінність внутрішньокласової варіації від міжкласової? 7. Як практично визначити надійність тесту? 8. У чому відмінність узгодженості тестів від стабільності? 9. У чому полягає еквівалентність тестів? 10. Що таке гомогенний комплекс тестів? 11. Що таке гетерогенний комплекс тестів? 12. Шляхи підвищення надійності тестів.

Тест - це вимір чи випробування, яке з метою визначення стану чи здібностей людини. Не всякі виміри можна використовувати як тести, лише ті, які відповідають спеціальним вимогам. До них належать: 1. стандартизованість (процедура та умови тестування повинні бути однаковими у всіх випадках застосування тесту); 2. надійність; 3. інформативність; 4. наявність системи оцінок.

Вимоги тестів: Інформативність - ступінь точності, з якою він вимірює властивість (якість, здатність, характеристику), з метою оцінки якої використовується. n Надійність - ступінь збігу результатів при повторному тестуванні тих самих людей за однакових умов. Узгодженість - (різні люди, але однакові прилади та однакові умови). n n Стандартність умов - (однакові умови при повторних вимірах). n Наявність системи оцінок - (переведення в систему оцінок. Як у школі 5 -4 -3...).

Тести, що задовольняють вимогам надійності та інформативності, називають добротними або автентичними (грец. автентико - достовірним чином)

Процес випробувань називається тестуванням; отримане в результаті виміру числове значення- результат тестування (або результат тесту). Наприклад, біг 100 м – це тест, процедура проведення забігів та хронометражу – тестування, час забігу – результат тесту.

Тести, основу яких лежать рухові завдання, називають руховими чи моторними. Результатами їх можуть бути або рухові досягнення (час проходження дистанції, кількість повторень, пройдена відстань тощо), або фізіологічні та біохімічні показники.

Іноді використовується не один, а кілька тестів, що мають єдину кінцеву мету (наприклад, оцінку стану спортсмена у періоді змагання тренування). Така група тестів називається комплексом чи батареєю тестів.

Один і той же тест, застосований до тих самих досліджуваних, повинен дати в однакових умовах збігаються результати (якщо тільки не змінилися самі досліджувані). Однак при найсуворішій стандартизації та точної апаратури результати тестування завжди дещо варіюють. Наприклад, досліджуваний, що щойно показав у тесті станової динамометрії результат 215 к. р, при повторному виконанні показує лише 190 к. р.

Надійність тестів та шляхи її визначення Надійністю тесту називається ступінь збігу результатів при повторному тестуванні тих самих людей (або інших об'єктів) в однакових умовах.

Варіацію результатів при повторному тестуванні називають усередині індивідуальної, або усередині групової, або внутрішньокласової. Чотири основні причини викликають цю варіацію: 1. Зміна стану досліджуваних (втома, впрацьовування, «навчання», зміна мотивації, концентрації уваги тощо). 2. Неконтрольовані зміни зовнішніх умов та апаратури (температура, вітер, вологість, напруга в електромережі, присутність сторонніх осіб тощо), тобто все те, що поєднується терміном “випадкова помилка вимірювання”.

Чотири основні причини викликають цю варіацію: 3. Зміна стану людини, яка проводить або оцінює тест (і, звичайно, заміна одного експериментатора чи судді іншим). 4. Недосконалість тесту (є такі тести, які свідомо малонадійні. Наприклад, якщо досліджувані виконують штрафні кидки в баскетбольний кошик, то навіть баскетболіст, який має високий відсоток влучень, може випадково помилитися при перших кидках).

Поняття справжній результат тесту є абстракцією (в досвіді виміряти не можна). Тому доводиться використовувати непрямі методи. Найбільш переважний для оцінки надійності дисперсійний аналіз із подальшим розрахунком внутрішньокласових коефіцієнтів кореляції. Дисперсійний аналіз дозволяє розкласти зареєстровану у досвіді варіацію результатів тесту на складові, що зумовлені впливом окремих факторів.

Якщо зареєструвати в досліджуваних їх результати в якомусь тесті, повторюючи цей тест у різні дні, причому кожен день робити по кілька спроб, періодично змінюючи експериментаторів, то будуть варіації: а) від випробуваного до випробуваного; n б) від дня до дня; n в) від експериментатора до експериментатора; г) від спроби до спроби. Дисперсійний аналіз дає можливість виділити та оцінити ці варіації. n

Таким чином, щоб оцінити практично надійність тесту, треба, n по-перше, виконати дисперсійний аналіз, n по-друге, розрахувати внутрішньокласовий коефіцієнт кореляції (коефіцієнт надійності).

Говорячи про надійність тестів, необхідно розрізняти їхню стабільність (відтворюваність), узгодженість, еквівалентність. n n Під стабільністю тесту розуміють відтворюваність результатів при його повторенні через певний часза однакових умов. Повторне тестування зазвичай називають ретестом. Узгодженість тесту характеризується незалежністю результатів тестування від особистих якостей особи, яка проводить або оцінює тест.

Якщо всі тести, що входять до якогось комплексу тестів, високо еквівалентні, він називається гомогенним. Весь цей комплекс вимірює одну якусь властивість моторики людини (наприклад, комплекс, що складається зі стрибків з місця в довжину, вгору та потрійного; оцінюється рівень розвитку швидкісно-силових якостей). Якщо в комплексі немає еквівалентних тестів, тобто тести, що входять до нього, вимірюють різні властивості, то він називається гетерогенним (наприклад, комплекс, що складається зі станової динамометрії, стрибка вгору по Абалакову, бігу на 100 м).

Надійність тестів може бути підвищена до певної міри шляхом: n n n а) суворішої стандартизації тестування; б) збільшення кількості спроб; в) збільшення числа оцінювачів (суддів, експериментів) та підвищення узгодженості їх думок; г) збільшення кількості еквівалентних тестів; буд) кращої мотивації досліджуваних.

Вимірювання чи випробування, проведене з метою визначення стану чи здібностей спортсмена, називається тестом. Не всякі виміри можна використовувати як тести, лише ті, які відповідають спеціальним вимогам: стандартність, наявність системи оцінок, надійність, інформативність, об'єктивність. Тести, що задовольняють вимогам надійності, інформативності та об'єктивності, називають добротними.

Процес випробування називається тестуванням, а отримані результаті вимірювання числові значення – результатом тестування.

Тести, в основі яких лежать рухові завдання, називають руховимиабо моторними. Залежно від завдання, яке постає перед досліджуваним, розрізняють три групи рухових тестів.

Різновиди рухових тестів

Назва тесту

Завдання спортсмену

Результат тесту

Контрольна вправа

Двигуни

Біг на 1500 м, час бігу

Стандартні функціональні проби

Однакове для всіх, дозується: 1) за величиною виконаної роботи; 2) за величиною фізіологічних зрушень

Фізіологічні або біохімічні показники при стандартній роботі. стандартної величинифізіологічних зрушень

Реєстрація ЧСС при стандартній роботі 1000 кгм/хв Швидкість бігу при ЧСС 160 уд/хв

Максимальні функціональні проби

Показати максимальний результат

Фізіологічні чи біохімічні показники

Визначення максимального кисневого боргу чи максимального споживання кисню

Іноді використовується не один, а кілька тестів, що мають єдину кінцеву мету. Така група тестів називається батареєю тестів.

Відомо, що навіть за найсуворішої стандартизації та точної апаратури результати тестування завжди дещо варіюють. Тому однією з важливих умов підбору добротних тестів є їх надійність.

Надійністю тестуназивається ступінь збігу результатів при повторному тестуванні тих самих людей в однакових умовах. Розрізняють чотири основні причини, що викликають внутрішньоіндивідуальну або внутрішньогрупову варіацію результатів тестування:

    зміна стану випробуваних (втома, зміна мотивації тощо); неконтрольовані зміни зовнішніх умов та апаратури;

    зміна стану людини, яка проводить або оцінює тест (самопочуття, заміна експериментатора тощо);

    недосконалість тесту (наприклад, свідомо недосконалі та малонадійні тести – штрафні кидки до баскетбольного кошика до першого промаху тощо).

Критерієм надійності тесту може бути коефіцієнт надійності,розрахований як відношення істинної дисперсії до дисперсії, зареєстрованої в досвіді: r = істинна s 2 / зареєстрована s 2 де під істинним значенням розуміють дисперсію, отриману при нескінченно великому числі спостережень в однакових умовах; реєстрована дисперсія виводиться з дослідних досліджень. Іншими словами, коефіцієнт надійності є просто частка справжньої варіації у тій варіації, яка зареєстрована у досвіді.

Крім цього коефіцієнта використовують ще індекс надійності, Який розглядають як теоретичний коефіцієнт кореляції або зв'язку між зареєстрованим та істинним значеннями одного і того ж тесту. Цей метод найпоширеніший як критерій оцінки якості (надійності) тесту.

Однією з характеристик надійності тесту є його еквівалентність, що відбиває ступінь збігу результатів тестування однієї й тієї ж якості (наприклад, фізичного) різними тестами. Ставлення до еквівалентності тестів залежить від конкретного завдання. З одного боку, якщо два або більше тестів еквівалентні, їхнє спільне застосування підвищує надійність оцінок; з іншого – можна застосувати лише один еквівалентний тест, що спростить тестування.

Якщо всі тести, що входять до будь-якої батареї тестів, високоеквівалентні, вони називаються гомогенними(наприклад, для оцінки якості стрибучості гомогенними, мабуть, будуть стрибки з місця в довжину, вгору, потрійним). Навпаки, якщо в комплексі немає еквівалентних тестів (як, наприклад, з метою оцінки загальної фізичної підготовленості), всі тести що входять до нього, вимірюють різні властивості, тобто. по суті комплекс є гетерогенним.

Надійність тестів може бути підвищена до певної міри шляхом:

    суворішою стандартизацією тестування;

    збільшення числа спроб;

    збільшення числа оцінювачів та підвищення узгодженості їх думок;

    збільшення кількості еквівалентних тестів;

    найкращої мотивації піддослідних.

Об'єктивність тестує окремий випадок надійності, тобто. незалежність результатів тестування від особи, яка проводить тест.

Інформативність тесту- Це ступінь точності, з якою він вимірює якість (якість спортсмена), для оцінки якого використовується. У різних випадках одні й самі тести можуть мати різну інформативність. Питання про інформативність тесту розпадається на два окремі питання:

Що змінює цей тест? Як він вимірює?

Наприклад, чи можна за таким показником, як МПК, судити про підготовленість бігунів-стаєрів, і якщо можна, то з яким ступенем точності? Чи можна використовувати цей тест у процесі контролю?

Якщо тест використовується визначення стану спортсмена в останній момент обстеження, то говорять про діагностичноїінформативність тесту. Якщо ж на основі результатів тестування хочуть зробити висновок про можливі майбутні показники спортсмена, говорять про прогностичноїінформативність. Тест може бути діагностично інформативним, а прогностично немає і навпаки.

Ступінь інформативності може характеризуватись кількісно – на основі досвідчених даних (так звана емпіричнаінформативність) та якісно – на основі змістовного аналізу ситуації ( логічнаінформативність). Хоча у практичній роботі логічний, чи змістовний аналіз завжди має передувати математичному. Показником інформативності тесту служить коефіцієнт кореляції, розрахований для залежності - критерію від результату в тесті, і навпаки (як критерій береться показник, що свідомо відображає те властивість, яке збираються вимірювати за допомогою тесту).

У разі недостатності інформативності будь-якого тесту вдаються до використання батареї тестів. Однак останнє, навіть за наявності високих роздільних критеріїв інформативності (судячи з коефіцієнтів кореляції), не дозволяє отримати однину. Тут на допомогу може прийти більше складний методматематичної статистики - факторний аналіз.Який дозволяє визначити, скільки і які тести спільно діють на окремий фактор і який ступінь їхнього вкладу в кожен фактор. А потім вже легко вибрати тести (або їх комбінації), які найточніше оцінюють окремі фактори.

1 Що називається тестом?

2 Що називається тестуванням?

Кількісна оцінка будь-якої якості або стану спортсмена Вимірювання або випробування, що проводиться з метою визначення стану або здібностей спортсмена Процес випробування, під час якого кількісно оцінюється якась якість або стан спортсмена

3 Що називається результатом тесту?

Кількісна оцінка будь-якої якості або стану спортсмена Вимірювання або випробування, що проводиться з метою визначення стану або здібностей спортсмена Процес випробування, під час якого кількісно оцінюється якась якість або стан спортсмена

4 До якого різновиду тестів відноситься біг на 100 м?

5 До якого різновиду тестів відноситься кистьова динамометрія?

Контрольна вправа Функціональна пробаМаксимальний функціональний тест

6 До якого різновиду тестів відноситься проба МПК?

Контрольна вправа Функціональна пробаМаксимальний функціональний тест

7 До якого різновиду тестів відноситься трихвилинний біг під метроном?

Контрольна вправа Функціональна пробаМаксимальний функціональний тест

8 До якого різновиду тестів відноситься максимальна кількість підтягувань на перекладині?

Контрольна вправа Функціональна пробаМаксимальний функціональний тест

9 У якому разі вважається тест інформативним?

10 У якому випадку тест вважається надійним?

Здатність тесту до відтворення результатів при повторному випробуванні Здатність тесту вимірювати цікаву якість спортсмена Незалежність результатів тестування від особи, яка проводить тест

11 У якому випадку вважається об'єктивним тест?

Здатність тесту до відтворення результатів при повторному випробуванні Здатність тесту вимірювати цікаву якість спортсмена Незалежність результатів тестування від особи, яка проводить тест

12 Який критерій необхідний оцінки тесту на інформативність?

13 Який критерій потрібний при оцінці тесту на надійність?

Критерій Т-Стьюдента Критерій F-ФішераКоефіцієнт кореляціїКоефіцієнт детермінаціїДисперсія

14 Який критерій необхідний оцінці тесту на об'єктивність?

Критерій Т-Стьюдента Критерій F-ФішераКоефіцієнт кореляціїКоефіцієнт детермінаціїДисперсія

15 Як називають інформативність тесту, якщо з його допомогою оцінюють ступінь тренованості спортсмена?

16 Якою інформативністю контрольних вправ керується тренер, відбираючи дітей у спортивну секцію?

Логічної Прогностичної Емпіричної Діагностичної

17 Чи потрібний кореляційний аналіз для оцінки інформативності тестів?

18 Чи потрібний факторний аналіз для оцінки інформативності тестів?

19 Чи можна оцінити за допомогою кореляційного аналізу надійність тесту?

20 Чи можна оцінити з допомогою кореляційного аналізу об'єктивність тесту?

21 Чи еквівалентні тести, призначені для оцінки загальної фізичної підготовленості?

22 При вимірі однієї й тієї ж якості різними тестами використовують тести …

Призначені для вимірювання однієї і тієї ж якості, що мають високий кореляційний зв'язок між собою

ОСНОВИ ТЕОРІЇ ОЦІНОК

Для оцінювання спортивних результатів часто вдаються до спеціальних таблиць очок. Ціль таких таблиць - перетворення показаного спортивного результату (вираженого в об'єктивних заходах) в умовні окуляри. Закон перетворення спортивних результатів на окуляри називається шкалою оцінок. Шкала може бути задана у вигляді математичного виразу, таблиці чи графіка. Розрізняють 4 основні типи шкал, що використовуються у спорті та фізичному вихованні.

Пропорційні шкали

Регресуючі шкали

Прогресують шкали.

Пропорційні шкалипередбачають нарахування однакового числа очок за рівний приріст результатів (наприклад, за кожні 0,1 з покращення результату у бігу на 100 м нараховується 20 очок). Такі шкали використовуються в сучасному п'ятиборстві, ковзанярському спорті, гонках на лижах, лижному двоборстві, біатлоні та інших видах спорту.

Регресуючі шкалиприпускають нарахування, за той самий приріст результату зі зростанням спортивних досягнень, все менша кількістьочок (наприклад, за покращення результату в бігу на 100 м з 15, 0 до 14.9 с додають 20 очок, а за 0,1 с у діапазоні 10,0-9,9 с – лише 15 очок).

Прогресують шкали.Тут чим вище спортивний результат, тим більшим збільшенням очок оцінюється його поліпшення (наприклад, за поліпшення часу в бігу від 15,0 до 14,9 с додають 10 очок, а від 10,0 до 9,9 с - 100 очок). Прогресуючі шкали застосовуються у плаванні, окремих видах легкої атлетики, важкій атлетиці.

Сигмоподібні шкалирідко використовуються у спорті, але широко застосовуються в оцінці фізичної підготовленості (наприклад, так виглядає шкала стандартів фізичної підготовленості населення США). У цих шкалах покращення результатів у зоні дуже низьких та дуже високих досягнень заохочуються скупо; найбільше очок приносить приріст результатів у середній зоні досягнень.

Основними завданнями оцінювання є:

    зіставити різні досягнення в тому самому завданні;

    зіставити досягнення у різних завданнях;

    визначити норми.

Нормоюу спортивної метрології називається гранична величина результату, яка є основою для віднесення спортсмена до однієї з класифікаційних груп. Існує три види норм: порівняльні, індивідуальні, належні.

Порівняльні нормимають у своїй основі порівняння людей, що належать до однієї й тієї самої сукупності. Наприклад, розбиття людей на підгрупи за рівнем стійкості (високої, середньої, низької) або реактивності (гіперреактивні, нормореактивні, гіпореактивні) до гіпоксії.

Різні градації оцінок та норм

Відсоток випробуваних

Норми у шкалах

Словесна

у балах

Перцентильна

Дуже низька

Нижче М - 2

Від М - 2 до М - 1

нижче середньої

Від М-1 до М–0,5

Від М–0,5 до М+0,5

Вище середньої

Від М+0,5 до М+1

Від М+1 до М+2

Дуже висока

Вище М+2

Ці норми характеризують лише порівняльні успіхи досліджуваних у цій сукупності, але нічого не говорять про сукупність загалом (або в середньому). Тому порівняльні норми повинні порівнюватися з даними, отриманими на інших сукупностях, та використовуватися у поєднанні з індивідуальними та належними нормами.

Індивідуальні нормизасновані на порівнянні показників одного й того спортсмена в різних станах. Наприклад, у багатьох видах спорту немає залежності між власною вагою тіла та спортивним результатом. Кожен спортсмен має індивідуально оптимальну вагу, що відповідає стану спортивної форми. Цю норму можна контролювати різних етапах спортивної підготовки.

Належні нормизасновані на аналізі того, що має вміти людина, щоб успішно справлятися із завданнями, які перед нею ставить життя. Прикладом цього можуть бути нормативи окремих комплексів з фізичної підготовки, належні величини ЖЕЛ, основного обміну, маси та зростання тіла, тощо.

1 Чи можна прямим методом виміряти якість витривалості?

2 Чи можна прямим методом виміряти якість швидкості?

3 Чи можна прямим методом виміряти якість спритності?

4 Чи можна прямим методом виміряти якість гнучкості?

5 Чи можна прямим методом виміряти силу окремих м'язів?

6 Чи може оцінка виражатися в якісній характеристиці (добре, задовільно, погано, залік тощо)?

7 Чи є різниця між шкалою вимірювань та шкалою оцінок?

8 Що називається шкалою оцінок?

Система вимірювання спортивного результату Закон перетворення спортивних результатів на окуляриСистема оцінювання норм

9 Шкала передбачає нарахування однакового числаочок за рівний приріст результатів. Це …

10 За той самий приріст результату нараховують у міру зростання спортивних досягнень дедалі менше очок. Це …

Прогресуюча шкала Регресуюча шкалаПропорційна шкалаСигмоподібна шкала

11 Чим вище спортивний результат, тим більшим збільшенням очок оцінюється його поліпшення. Це …

Прогресуюча шкала Регресуюча шкалаПропорційна шкалаСигмоподібна шкала

12 Поліпшення результатів у зонах дуже низьких і дуже високих досягнень заохочується скупо; найбільше очок приносить приріст результатів у середній зоні досягнень. Це …

Прогресуюча шкала Регресуюча шкалаПропорційна шкалаСигмоподібна шкала

13 Норми, які мають у своїй основі порівняння людей, що належать до однієї і тієї ж сукупності, називаються …

14 Норми, засновані на порівнянні показників одного і того ж спортсмена різних станах, називаються …

Індивідуальними нормами Посадовими нормамиСпорівнювальними нормами

15 Норми, засновані на аналізі того, що має вміти робити людина, щоб справлятися з поставленими перед нею завданнями, називаються …

Індивідуальними нормами Посадовими нормамиСпорівнювальними нормами

ОСНОВНІ ПОНЯТТЯ КВАЛІМЕТРІЇ

Кваліметрія(лат. qualitas – якість, metron – міра) вивчає та розробляє кількісні методиоцінки якісних ознак

В основі кваліметрії лежить кілька вихідних положень:

Будь-яку якість можна виміряти;

Якість залежить від низки властивостей, що утворюють "дерево якості" (наприклад, дерево якості виконання вправ у фігурному катанні складається з трьох рівнів – вищого, середнього, нижчого);

Кожна властивість визначається двома числами: відносним показником та вагомістю; сума вагомостей властивостей кожному рівні дорівнює одиниці (чи 100%).

Методичні прийоми кваліметрії поділяються на дві групи:

Евристичні (інтуїтивні), засновані на експертних оцінках та анкетуванні;

Інструментальні.

Експертноїназивається оцінка, одержувана шляхом з'ясування думок спеціалістів. Характерні приклади експертизи: суддівство в гімнастиці та фігурному катанні на ковзанах, конкурс на найкращу наукову роботуі т.п.

Проведення експертизи включає такі основні етапи: формування її мети, підбір експертів, вибір методики, проведення опитування та опрацювання отриманої інформації, у тому числі оцінку узгодженості індивідуальних експертних оцінок. При експертизі велике значення має ступінь узгодженості думок експертів, що оцінюється за величиною рангового коефіцієнта кореляції(у разі кількох експертів). Слід зазначити, що рангова кореляція є основою вирішення багатьох завдань кваліметрії, оскільки дозволяє здійснювати математичні розрахунки з якісними ознаками.

На практиці показником кваліфікації експерта часто є відхилення його оцінок від середніх оцінок групи експертів.

Анкетуваннямназивається метод збирання думок у вигляді заповнення анкет. Анкетування поряд з інтерв'ю та бесідою відноситься до методів опитування. На відміну від інтерв'ю та розмови анкетування передбачає письмові відповіді особи, яка заповнює анкету – респондента, – на систему стандартизованих питань. Воно дозволяє вивчати мотиви поведінки, наміри, думки тощо.

За допомогою анкетування можна вирішувати багато практичних завдань у спорті: оцінка психологічного статусу спортсмена; його ставлення до характеру та спрямованості тренувальних занять; міжособистісні стосунки у команді; власна оцінка техніко-тактичної підготовленості; оцінка раціону харчування та багато інших.

1 Що вивчає кваліметрія?

Вивчає якості тестів Вивчає якісні властивості ознакиВивчає та розробляє кількісні методи оцінки якості

2 Математичні методи, що застосовуються у кваліметрії?

Парна кореляція Рангова кореляція Дисперсійний аналіз

3 За допомогою яких методів оцінюється рівень працездатності?

4 За допомогою яких методів оцінюється різноманітність технічних елементів?

Метод анкетування Метод експертних оцінокМетод не вказано

5 За допомогою яких методів оцінюється складність технічних елементів?

Метод анкетування Метод експертних оцінокМетод не вказано

6 За допомогою яких методів оцінюється психологічний станспортсмена?

Метод анкетування Метод експертних оцінокМетод не вказано

Проблема тестування фізичної підготовленості людини розроблена в теорії та методиці фізичного виховання, спортивної метрології, антропомоторики, біомеханіки, спортивної медицини та інших наук. За приблизно 130-140 років історії цієї проблеми накопичено величезний та найрізноманітніший матеріал, який завжди викликав і продовжує викликати до себе великий інтерес не лише з боку науковців, а й вчителів фізичної культури, тренерів, учнів, їхніх батьків.

Перша стаття, присвячена даній проблемі, - вступна. У ній розкриваються основи теорії тестів та тестування, без ознайомлення з якими вчителю важко вирішувати завдання застосування тестів у практиці своєї роботи. Назвемо хоча б деякі з питань, що виникають. Що таке тест? Яка класифікація тестів? Навіщо і чи потрібно проводити тестування фізичної підготовленості учнів? Як визначити рівень (високий, середній, низький) розвитку фізичних якостей та підготовленості? Що вважати нормою при тестуванні та як її встановлювати? Якщо вчитель вигадав новий руховий тест або батарею тестів для визначення фізичної підготовленості дітей, то на що він повинен звернути увагу чи які необхідні умови (вимоги, критерії) при цьому виконати? Тестування фізичного стану учнів передбачає обов'язкове ознайомлення вчителя з елементарними методами математичної статистики. З яким із них?

У наших статтях ми надамо також історичні відомості про виникнення тестів та теорію тестування фізичної підготовленості людини. Скажімо, коли і де з'явилися перші тести, у тому числі батареї тестів щодо оцінки фізичної підготовленості. Які найбільш поширені тести для визначення кондиційних (силових, швидкісних, витривалості, гнучкості) та координаційних здібностей дітей шкільного віку? Які батареї (програми) тестів для оцінки фізичної підготовленості дітей та підлітків є найбільш популярними у різних країнах? Ми обговоримо і таку важливу практичну проблему, як співвідношення результатів тестування та оцінок (позначок) з предмета « Фізична культура». Говорячи конкретніше, якщо учень під час виконання тестів незмінно показує високий рівень, чи це автоматично означає відмінну оцінкуз нашого предмета? І так далі.

У цій статті ми обговоримо: 1) завдання тестування; 2) поняття «тест» та класифікацію рухових (моторних) тестів; 3) критерії добротності рухових тестів; 4) організацію тестування фізичної підготовленості дітей шкільного віку.

1. Завдання тестування. Тестування рухових можливостей людини є одним з найбільш важливих напрямівдіяльності науковців та педагогів у галузі фізичної культури та спорту. Воно допомагає вирішенню низки складних педагогічних завдань щодо виявлення рівнів розвитку кондиційних та координаційних здібностей, оцінювання якості технічної та тактичної підготовленості. На основі результатів тестування можна порівнювати підготовленість як окремих учнів, так і цілих груп учнів, які мешкають у різних регіонах та країнах; проводити відповідний відбір для занять тим чи іншим видом спорту, для участі у змаганнях; здійснювати досить об'єктивний контроль за навчанням (тренуванням) школярів та юних спортсменів; виявляти переваги та недоліки застосовуваних засобів, методів навчання та форм організації занять; нарешті, обґрунтовувати норми (вікові, індивідуальні) фізичної підготовленості дітей та підлітків.



а) навчити самих школярів визначати рівень своєї фізичної підготовленості та планувати необхідні для себе комплекси фізичних вправ;

б) стимулювати учнів до подальшого покращення свого фізичного стану
(форми);

в) знати не так вихідний рівень розвитку рухової здатності, скільки його зміна за певний час;

г) стимулювати учнів, які досягли високих результатів, але не так за досягнутий високий рівень фізичної підготовленості, як за реалізацію запланованого підвищення особистих результатів.



Фахівці наголошують, що традиційний підхід до тестування, коли дані стандартизованих тестів та нормативів порівнюються із наведеним результатом, викликає у багатьох учнів, особливо з низьким та середнім рівнями фізичної підготовленості, негативне ставлення. Тестування має сприяти підвищенню інтересу у школярів, приносити їм радість, а не вести до розвитку комплексу неповноцінності. У зв'язку з цим пропонуємо наступні підходи:

1) результати тестів учня визначають не виходячи з порівняння з нормативами, а на підставі змін, що відбулися за певний період;

2) всі компоненти тесту модифікуються, використовуються полегшені варіанти вправ (завдання, що становлять зміст тесту, повинні бути досить легкими, щоб ймовірність їх успішного виконання була великою);

3) нульову оцінку або зі знаком «мінус» виключено, правомочно лише отримання позитивних результатів.

Отже, під час тестування важливим є зближення наукових (теоретичних) завдань та особисто значущих, позитивних для школяра мотивів участі у цій процедурі.

2. Поняття «тест» та класифікація рухових (моторних) тестів.Термін тест у перекладі з англійської мовиозначає проба, випробування. Тести застосовуються для вирішення багатьох наукових та практичних завдань. Серед способів оцінки фізичного стану людини (спостереження, експертні оцінки) метод тестів (у нашому випадку - рухових, або моторних) є головним методом, що використовується в спортивній метрології та інших наукових дисциплінах- «вчення про рухи», теорію та методику фізичного виховання.

Тест- це вимір чи випробування, проведене визначення здібностей чи стану людини. Таких вимірів може бути дуже багато, у тому числі на основі використання найрізноманітніших фізичних вправ. Однак далеко не кожну фізичну вправу чи випробування можна розглядати як тест. Як тести слід використовувати лише ті випробування (проби), які відповідають спеціальним вимогам і відповідно до яких повинні бути:

а) визначено мету застосування будь-якого тесту (або тестів);

б) розроблено стандартизовану методику вимірювання результатів у тестах та процедуру тестування;

в) визначено надійність та інформативність тестів;

г) реалізовано можливість подання результатів тестів у відповідній системі оцінки.

Система використання тестів у зв'язку з поставленим завданням, організацією умов, виконанням тестів випробуваними, оцінка та аналіз результатів називається тестуванням.Отримане під час вимірювань числове значення - результатом тестування (тесту).

Наприклад, стрибок у довжину з місця – це тест; процедура проведення стрибків та вимірювання результатів – тестування; Довжина стрибка – результат тесту.

У основі тестів, які у фізичному вихованні, лежать рухові дії (фізичні вправи, рухові завдання). Такі тести називаються руховими, чи моторними.

Нині ще немає єдиної класифікації рухових тестів. Відома класифікація тестів за їхньою структурою та переважними показаннями (див. таблицю 1).

Розрізняють одиничнийі комплекснийвипробування. Одиничний тестслужить для вимірювання та оцінки однієї ознаки (координаційної або кондиційної здатності). Оскільки структура кожної координаційної чи кондиційної здатності є складною, то за допомогою такого тесту оцінюється зазвичай лише один компонент даної здатності (наприклад, здатність до рівноваги, швидкість простої реакції, сила м'язів рук).

За допомогою навчальноготесту оцінюють здатність до рухового навчання (за різницею остаточної та початкової оцінок за певний період навчання техніці рухів).

Тестова серіядає можливість один і той же тест використовувати протягом тривалого часу, коли здатність вимірювання суттєво покращується. При цьому завдання тесту за своєю трудністю послідовно підвищуються. На жаль, цей різновид одиничного тесту поки що недостатньо широко використовують як у науці, так і на практиці.

За допомогою комплексного тестуоцінюють кілька ознак чи компонентів різних здібностей чи однієї й тієї ж здібності (наприклад, стрибок вгору з місця - зі змахом рук, без помаху рук, задану висоту). На підставі такого тесту можна отримати інформацію про рівень швидкісно-силових здібностей (по висоті стрибка), координаційних здібностей (за точністю диференціювання силових зусиль, по різниці висоти стрибка зі змахом та без помаху рук).

Тестовий профільскладається з кількох окремих тестів, на підставі яких оцінюють або кілька різних фізичних здібностей (гетерогеннийтестовий профіль), або кілька проявів однієї і тієї ж фізичної здатності (Гомогеннийтестовий профіль). Результати тесту можуть бути представлені у формі профілю, що дає можливість

Форми тестів та можливості їх застосування (за Д.-Д.Блюме, 1987)


Таблиця 1


Тип Вимірювана здатність Ознака структури приклад
Одиничний тест
Елементарний тест, що містить одну рухову задачу Одна задача тесту, одна остаточна оцінка тесту Тест на рівновагу, тремометрія, тест для оцінки здатності до з'єднання, тест на оцінку ритму, стрибок на точність приземлення
Навчальний тест Одна здатність або аспект (компонент) здатності Одна чи кілька завдань тесту. Остаточна оцінка тесту (педагогічний період) Загальний навчальний тест
Тестова серія Одна здатність або аспект (компонент) здатності Одна задача тестів з варіантами або кілька завдань, що підвищується труднощі Тест для оцінки здатності до з'єднання (зв'язку)
Комплексний тест
Комплексний тест, що містить одне завдання Декілька здібностей або аспектів (компонентів) однієї здібності Одна задача тесту, кілька остаточних оцінок Стрибковий тест
Тест багаторазових завдань Декілька тестових завдань, що виконуються послідовно, кілька остаточних оцінок Тест багаторазових реакцій
Тестовий профіль Декілька здібностей або аспектів однієї здібності Декілька тестів, кілька остаточних оцінок Координаційна зірка
Тестова батарея Декілька здібностей або аспектів однієї здібності Декілька тестів, одна тестова оцінка Тестова батарея для оцінки здатності вчитися рухам

швидко порівняти індивідуальні та групові результати.

Тестова батареяскладається з кількох окремих тестів, результати яких зводяться в одну остаточну оцінку, що розглядається в одній з оціночних шкал (докладніше про це у другій статті). Як і в тестовому профілі, тут розрізняють гомогеннуі гетерогеннубатареї.

Гомогенна батарея,або гомогенний профіль знаходять застосування в оцінці всіх компонентів комплексної здатності (наприклад, здатності до реагування). При цьому результати окремих тестів мають бути тісно взаємопов'язані (корелювати).

Гетерогенний тестовий профіль або гетерогенна батарея є оцінкою комплексу (сукупності) різних рухових здібностей. Наприклад, такі батареї тестів використовують для оцінки силових, швидкісних здібностей та здібностей до витривалості – це батареї тестів фізичної підготовленості.

У тестах багаторазових завданьвипробувані послідовно виконують рухові завдання і кожне рішення рухової завдання отримують окремі оцінки. Ці оцінки можуть полягати в тісного зв'язкуодин з одним. За допомогою відповідних статистичних розрахунків можна отримати додаткову інформацію про здібності, що оцінюються. Прикладом можуть бути послідовно виконувані завдання стрибкового тесту (таблиця 2).

У визначенні рухових тестів вказується, що вони є оцінкою рухових здібностей і частково моторних навичок. Тому в самому загальному виглядівиділяють кондиційні тести, координаційні тести та тести для оцінки рухових умінь та навичок (техніки рухів). Така систематизація є, проте, занадто загальної.

Класифікація рухових тестів з переважним їх показаннямвипливає із систематизації фізичних (рухових) здібностей. У зв'язку з цим розрізняють кондиційні тести(для оцінки сили: максимальної, швидкісної, силової витривалості; для оцінки витривалості; для оцінки швидкісних здібностей; для оцінки гнучкості: активної та пасивної) та координаційні тести(Для оцінки коор

динаційних здібностей, що належать до окремих самостійним групамрухових дій, що вимірюють спеціальні координаційні здібності; для оцінки специфічних координаційних здібностей - здібностей до рівноваги, орієнтування у просторі, реагування, диференціювання параметрів рухів, ритму, перебудови рухових дій, узгодження (зв'язку), вестибулярної стійкості, довільного розслаблення м'язів.

Розроблено велике числотестів з метою оцінки рухових навичок у різних видах спорту. Вони наведені у відповідних підручниках та посібниках та у цій статті не розглядаються.

Таким чином, кожна класифікація є своєрідним орієнтиром для вибору (або створення) того типу тестів, який більшою мірою відповідає завданням тестування.

3. Критерії добротності рухових тестів. Як зазначалося вище, поняття «руховий тест» відповідає своєму призначенню, якщо тест задовольняє відповідним основним критеріям: надійності, стабільності, еквівалентності, об'єктивності, інформативності, а також додатковим критеріям: нормуванню, сумісності та економічності.

Тести, що відповідають вимогам надійності та інформативності, називають добротними або автентичними (достовірними).

Під надійністю тесту розуміють ступінь точності, з якою він оцінює певну рухову здатність незалежно від вимог того, хто її оцінює. Надійність проявляється у ступеня збігу результатів при повторному тестуванні тих самих людей за однакових умов; це стабільність чи стійкість результату тесту індивіда за повторного виконання контрольного вправи. Інакше кажучи, школяр у групі обстежуваних за результатами повторних тестувань (наприклад, показниками стрибків, часу бігу, дальності метання) стійко зберігає своє рангове місце.

Надійність тесту визначається за допомогою кореляційно-статистичного аналізу шляхом розрахунку коефіцієнта надійності. При цьому використовують різні способи, на підставі яких судять про надійність тесту.

Стабільність тесту ґрунтується на залежності між першою та другою спробами, повтореними через певний час в однакових умовах одним і тим самим експериментатором. Спосіб повторного тестування визначення надійності називається ретестом. Стабільність тесту залежить від виду тесту, віку та статі піддослідних, часового інтервалу між тестом та ретестом. Наприклад, показники кондиційних тестів або морфологічних ознак при невеликих часових інтервалах стабільніші, ніж результати координаційних тестів; у старших школярів - результати стабільніше, ніж у молодших. Ретест зазвичай проводять пізніше, як за тиждень. При триваліших інтервалах (наприклад, через місяць) стабільність навіть таких тестів, як біг на 1000 м або стрибок у довжину з місця, стає вже помітно нижчою.

Еквівалентність тесту полягає у кореляції результату тесту з результатами інших однотипних тестів. Наприклад, критерій еквівалентності застосовують, коли треба вибрати, який тест більш адекватно відображає швидкісні здібності: біг на 30, 50, 60 чи 100 м.

Те чи інше ставлення до еквівалентних (гомогенних) тестів залежить від багатьох причин. Якщо треба підвищити надійність оцінок чи висновків дослідження, тоді доцільно використати два і більше еквівалентні тести. А якщо стоїть завдання створити батарею, що містить мінімум тестів, слід використовувати тільки один з еквівалентних тестів.


Таблиця 2 Послідовно виконувані завдання стрибкового тесту (Д.-Д.Блюме, 1987)

№№ п/п Завдання тесту Оцінка результату Здатність
Стрибок на максимальну висоту без помаху рук Висота, см Стрибкова сила
Стрибок на максимальну висоту зі змахом рук Висота, см Стрибкова сила та здатність до з'єднання (зв'язку)
Стрибок на максимальну висоту зі змахом рук та підскоком Висота, см Здатність до з'єднання (зв'язку) та стрибкова сила
10 стрибків зі змахом рук на відстань, що дорівнює 2/3 від максимальної висоти стрибка, як у задачі 2 Сума відхилень від заданої позначки Здатність до диференціювання силових параметрів рухів
Різниця між результатами рішень одного завдання та двох завдань ... див Здатність до з'єднання (зв'язку)

Така батарея, як зазначалося, є гетерогенною, оскільки тести, що входять до неї, вимірюють різні рухові здібності. Прикладом гетерогенної батареї тестів є біг на 30 м, підтягування на перекладині, нахил уперед, біг на 1000 м. Інші приклади таких комплексів будуть представлені в окремій публікації.

Надійність тестів визначають також у порівнянні середніх оцінок парних і непарних спроб, які входять у тест. Наприклад, середню точність кидків м'яча з 1, 3, 5, 7 і 9 спроб порівнюють із середньою точністю кидків з 2, 4, 6, 8 і 10 спроб. Такий метод оцінки надійності називається методом подвоєння, або розщепленням, і він застосовується переважно при оцінці координаційних здібностей і в тому випадку, якщо кількість спроб, що утворюють тестовий результат, не менше шести.

Під об'єктивністю(узгодженістю) тесту розуміють ступінь узгодженості результатів, одержуваних на тих самих випробуваних різними експериментаторами (учителями, суддями, експертами).

а) час тестування, місце, погодні умови;

б) єдине матеріальне та апаратурне забезпечення;

в) психофізіологічні чинники (обсяг та інтенсивність навантаження, мотивація);

г) подання інформації (точна словесна постановка завдання тесту, пояснення та демонстрація).

Дотримання цих умов створює так звану об'єктивність проведення тесту.Говорять ще про інтерпретаційної об'єктивності,щодо ступеня незалежності інтерпретації результатів тестування різними експериментаторами.

Загалом, як зазначають фахівці, надійність тестів можна підвищити різними шляхами: суворішою стандартизацією тестування (див. вище), збільшенням кількості спроб, кращою мотивацією піддослідних, збільшенням кількості оцінювачів (суддів, експертів), підвищенням узгодженості їх думок, збільшенням кількості еквівалентних тестів .

Фіксованих значень показників надійності тесту немає. Найчастіше користуються такими рекомендаціями: 0,95-0,99 - відмінна надійність; 0,90-0,94 – хороша; 0,80-0,89 - прийнятна; 0,70-0,79 – погана; 0,60-0,69 - для індивідуальних оцінок сумнівна, тест придатний лише характеристики групи піддослідних. ІнформативністьТіста - це ступінь точності, з якою він вимірює оцінювану рухову здатність або навичку. В іноземній та вітчизняній літературі використовують замість слова «інформативність» термін «валідність» (від англ. validity – обґрунтованість, дійсність, законність). Фактично, стосовно інформативності, дослідник відповідає на два питання: що вимірює даний конкретний тест (батарея тестів) і який при цьому ступінь точності вимірювання.

Розрізняють валідністьлогічну (змістовну), емпіричну (на підставі досвідчених даних) та передбачувану. Більш детальна інформація на цю тему міститься в підручниках, що стали вже класичними, для студентів фізкультурних вузів (Спортивна метрологія / За ред. В.М.Заціорського. - М.: ФіС, 1982. - С. 73-80; Годик М.А. Спортивна метрологія.- М.: ФіС, 1988), а також у ряді сучасних посібників.

Важливими додатковими критеріями тестів, як зазначалося, є нормування, порівнянність та економічність.

Суть нормуванняполягає в тому, що на основі результатів тестування можна створити норми, що мають особливе значення для практики (про це йтиметься в окремій статті).

Порівнянністьтесту полягає у можливості порівнювати результати, отримані по одному тесту або кільком формам паралельних (гомогенних) тестів. У практичному плані застосування зіставних моторних тестів знижує ймовірність того, що в результаті регулярного застосування одного й того тесту оцінюється не тільки і не стільки рівень здатності, скільки ступінь навички. Одночасно порівняні результати тестів підвищують достовірність висновків.

Суть економічностіяк критерій добротності тесту у тому, що проведення тесту вимагає тривалого часу, великих матеріальних витрат і багатьох помічників. Наприклад, батарею із шести тестів для визначення фізичної підготовленості, рекомендовану в «Комплексній програмі фізичного виховання учнів І-ХІ класів» (М.: Просвітництво, 2005-2006), вчитель із двома помічниками може провести за один урок, обстеживши 25-30 дітей .

Організація тестування фізичної підготовленості дітей шкільного віку. Другою важливою проблемою тестування рухових здібностей (нагадаємо, що перша – відбір інформативних тестів – розглянута раніше) є організація їх застосування.

Вчитель фізичної культури повинен визначити: у які терміни краще організувати тестування, як здійснювати його на уроці та як часто слід проводити тестування.

Строні тестуваннявстановлюють відповідно до шкільної програми, яка передбачає обов'язкове дворазове тестування фізичної підготовленості учнів. Перше тестування доцільно проводити у другий-третій тиждень вересня (після того як навчальний процесувійде в нормальне русло), а друге - за два тижні до закінчення навчального року (у пізніші терміни можуть мати місце організаційні труднощі, викликані іспитами і канікулами, що наближаються).

Знання річних змін у розвитку рухових здібностей школярів дозволяє вчителю вносити відповідні корективи у процес фізичного виховання на наступний навчальний рік. Проте вчитель може і повинен проводити більш часте тестування, здійснювати так званий оперативний контроль. Цю процедуру доцільно виконувати, наприклад, щоб визначити зміна рівня швидкісних, силових здібностей і витривалості під впливом уроків легкої атлетики протягом І чверті тощо. З цією метою вчитель може застосувати тести для оцінки координаційних здібностей дітей на початку та наприкінці освоєння навчального матеріалу шкільної програми, наприклад, по спортивним іграм, виявлення зміни показників розвитку цих здібностей.

Слід враховувати, що різноманітність розв'язуваних педагогічних завданьне дає можливості надати вчителеві уніфіковану методику тестування, однакових правил проведення тестів та оцінки результатів тестування. Це вимагає від експериментаторів (вчителів) прояву самостійності у вирішенні теоретико-методологічних та організаційних питань тестування.

Тестування на уроцінеобхідно ув'язати з його змістом. Іншими словами, застосований тест (або тести) за дотримання відповідних вимог щодо нього як до методу дослідження повинен (мають) органічно входити до складу запланованих фізичних вправ. Якщо, припустимо, у школярів потрібно визначити рівень розвитку швидкісних здібностей чи витривалості, необхідні тести слід запланувати у частину уроку, у якій вирішуватимуться завдання розвитку відповідних фізичних здібностей.

Частота проведення тестуваннябагато в чому визначається темпами розвитку конкретних фізичних здібностей, віково-статевими та індивідуальними особливостямиїх розвитку.

Наприклад, щоб досягти суттєвого приросту швидкості, витривалості чи сили, потрібно кілька місяців регулярних занять (тренувань). У той самий час, щоб отримати достовірний приріст гнучкості чи окремих координаційних здібностей, потрібно лише 4-12 тренувань. Досягти поліпшення тієї чи іншої фізичної якості, якщо починати з нуля, можна і за більш короткий термін. А ось щоб покращити цю ж якість, коли вона у школяра досягає високого рівня, потрібно більше часу. У цьому вчитель повинен глибше вивчити особливості розвитку та вдосконалення різних рухових здібностей в дітей віком різні вікностатеві періоди.

При оцінці загальної фізичної підготовленості учнів, як зазначалося, можна використовувати найрізноманітніші батареї тестів, вибір яких залежить від конкретних завдань тестування та наявності необхідних умов. Однак у зв'язку з тим, що отримані результати тестування можна оцінювати лише шляхом порівняння, доцільно вибирати тести, які широко представлені в теорії та практиці фізичного виховання дітей. Наприклад, спиратися тих, які рекомендовані в «Комплексної програмі фізичного виховання учнів I-XI класів загальноосвітньої школи» (М.: Просвітництво, 2004-2006).

Для порівняння загального рівня фізичної підготовленості учня чи групи учнів за допомогою комплексу тестів вдаються до переведення результатів тестування в очки чи бали (про це докладніше поговоримо у черговій статті). Зміна суми очок при повторних тестуваннях дозволяє судити про прогрес як окремої дитини, так і групи дітей.

Фізична культура в школі, 2007, №6


Вступ

Актуальність. Проблема тестування фізичної підготовленості людини - одна з найбільш розроблених у теорії та методиці фізичного виховання. За останні десятиліттянакопичений величезний та найрізноманітніший матеріал: визначення завдань тестування; обумовленість результатів тестування різними факторами; розробка тестів для оцінки окремих кондиційних та координаційних здібностей; програми тестів, що характеризують фізичну підготовленість дітей та підлітків від 11 до 15 років, прийняті в Російській Федерації, в інших країнах СНД та у багатьох зарубіжних країнах.

Тестування рухових якостей школярів одна із найважливіших і основних методів педагогічного контролю.

Воно допомагає вирішенню низки складних педагогічних завдань: виявляти рівні розвитку кондиційних та координаційних здібностей, оцінювати якість технічної та тактичної підготовленості. На основі результатів тестування можна:

порівнювати підготовленість як окремих учнів, і цілих груп, що у різних регіонах і країнах;

проводити спортивний відбір для занять тим чи іншим видом спорту, для участі у змаганнях;

здійснювати значною мірою об'єктивний контроль за навчанням (тренуванням) школярів та юних спортсменів;

виявляти перевагу та недоліки застосовуваних засобів, методів навчання та форм організації занять;

нарешті, обґрунтовувати норми (вікові, індивідуальні) фізичної підготовленості дітей та підлітків.

Поряд із науковими завданнями у практиці різних країн завдання тестування зводяться до наступного:

навчити самих школярів визначати рівень своєї фізичної підготовленості та планувати необхідні для себе комплекси фізичних вправ;

стимулювати учнів до подальшого підвищення свого фізичного стану (форми);

знати не так вихідний рівень розвитку рухової здатності, скільки його зміна за певний час;

стимулювати учнів, які досягли високих результатів, але не стільки за високий рівень, скільки за заплановане підвищення особистих результатів.

У цій роботі ми спиратимемося на ті тести, які рекомендовані в «Комплексній програмі фізичного виховання учнів 1 - 11 класів загальноосвітньої школи», підготовлені В.І. Ляхом та Г.Б. Мейксон.

Мета дослідження: обґрунтувати методику тестування фізичних якостей учнів основної школи.

Гіпотеза дослідження використання тестування є точним, інформативним методом визначення розвитку фізичних якостей.

Об'єкт дослідження: Тестування як метод педагогічного контролю.

Предмет дослідження: тестування якостей учнів.


Глава 1. Уявлення про теорію тестів фізичної підготовки

1.1 Короткі історичні відомостіпро теорію тестування рухових здібностей

Вимірами рухових досягнень людини люди цікавляться з давніх-давен. Перші відомості про вимір відстані, на яку робили стрибки в довжину, відносяться до 664 р. до н. е. На XXIX Олімпійських іграх давнини в Олімпії Хіоніс зі Спарти стрибнув на відстань у 52 стопи, що дорівнює приблизно 16,66 м. Зрозуміло, що тут йде мовапро неодноразовий стрибок.

Відомо, що один із родоначальників фізичного виховання - Гутс-Мутс (J. Ch. F. Guts-Muts, 1759-1839) вимірював моторні досягнення своїх учнів і здійснював точні записи їх результатів. А за покращення досягнень нагороджував їх «преміями» - дубовими вінками (G. Sorm, 1977). У тридцяті роки XIXв. Ейселен (Е. Eiselen), співробітник відомого німецького педагога Яна (F. L. Yahn), на підставі виконаних вимірів склав таблицю для визначення досягнень у стрибках. Як видно, вона містить три градації (табл. 1).

Таблиця 1. - Результати в стрибках (см) чоловіків (джерело: К. Mekota, P. Blahus, 1983)

початковий

Через козла


Зауважимо, що у середині ХІХ ст. у Німеччині щодо довжини чи висоти стрибка рекомендували враховувати параметри тіла.

Точні виміри спортивних досягнень, зокрема рекордних, ведуться з середини в XIX ст., а регулярно - з 1896 р., з Олімпійських ігор сучасності.

Досить давно люди намагаються виміряти й силові здібності. Перша цікава інформація з цього приводу відноситься до 1741, коли, використовуючи прості прилади, вдалося виміряти силу борця Томаса Тофама. Він підняв вагу, маса якого перевищувала 830 кг (G. Sorm, 1977). Силові можливості учнів вимірювали вже Гутс-Мутс та Ян, використовуючи для цього прості силоміри. І це перший динамометр, прабатько сучасного динамометра, сконструював Райнігер мови у Франції 1807 р. У практиці фізичного виховання учнів гімназії у Парижі його застосував Ф. Аморос (F. Amoros) в 1821 р. XIX в. для вимірювання сили використовували також піднімання тулуба у висі на поперечині, згинання та розгинання рук в упорі, піднімання ваг.

Провісниками сучасних батарей тестів визначення фізичної підготовленості є спортивно-гімнастичні багатоборства. Як перший виділяють античне п'ятиборство, введене в практику на XVIII Олімпійських іграх давнини 708 р. до н. е. До його складу входило метання диска, списи, стрибок, біг та боротьба. Десятиборство, яке ми знаємо, вперше було включено до програми змагань на III Олімпійських іграх (Сент-Луїс, США, 1904), а сучасне п'ятиборство - на V Олімпійських іграх (Стокгольм, Швеція, 1912). Склад вправ у цих конкуренціях гетерогенний; спортсмену потрібно виявити підготовленість у різних дисциплінах. Отже, він має бути різнобічно фізично підготовлений.

Ймовірно, з урахуванням цієї ідеї приблизно в ці ж терміни (початок XX ст.) для дітей, молоді та дорослих запровадили в практику комплекси вправ, які всебічно визначають фізичну підготовленість людини. Вперше такі комплексні випробування були введені в Швеції (1906), потім у Німеччині (1913) і ще пізніше – в Австрії та СРСР (Росії) – комплекс «Готів до праці та оборони» (1931).

Попередники сучасних рухових тестів з'явилися наприкінці XIX - початку XX в. Зокрема, Д. Саржент (D. A. Sargent) ввів у практику Гарвардського університету «силовий тест», який, крім динамометрії та спірометрії, включав віджимання рук в упорі, піднімання і опускання тулуба. Вже з 1890 р. цей тест став використовуватись у 15 університетах США. Француз Г.Хеберт (G. Hebert) створив тест, публікація про який з'явилася в 1911 р. До його складу входить 12 рухових завдань: біг на різні дистанції, стрибок з місця та з розбігу, кидок, багаторазове піднімання 40-кілограмового снаряда (ваги ), плавання та пірнання.

Стисло зупинимося ще на джерелах інформації, в яких розглядаються результати наукових досліджень лікарів та психологів. Дослідження лікарів до кінця XIXв. були орієнтовані найчастіше зміну зовнішніх морфологічних даних, і навіть на ідентифікацію асиметрії. Антропометрія, що використовується в цих цілях, йшла в ногу із застосуванням динамометрії. Так, бельгійський лікар А. Кветелет (A. Quetelet), провівши великі дослідження, в 1838 р. опублікував роботу, згідно з якою середні результати станової сили (хребта) 25-річних жінок та чоловіків рівні відповідно 53 та 82 кг. У 1884 р. італієць А. Моссо (A. Mosso) досліджував м'язову витривалість. І тому він застосував ергограф, який дозволив йому спостерігати розвиток втоми при багаторазовому згинанні пальця.

Сучасна ергометрія бере свій початок з 1707 р. Тоді вже було створено прилад, що дозволяв виміряти пульс за хвилину. Прототип сьогоднішнього ергометра сконструював Хірн (G. A. Him) в 1858 р. Циклоергометри і бігові доріжки були створені пізніше, в 1889-1913 рр.

Наприкінці XIX - на початку XX ст. розпочинаються систематичні дослідження психологів. Вивчається час реакції, розробляються тести визначення координації рухів і ритму. Поняття «час реакції» ввів у науку австрійський фізіолог С. Екс-нер (S. Ехпег) у 1873 р. Учні засновника експериментальної психологіїВ. Вундта (W. Wundt) у створеній у 1879 р. лабораторії в Лейпцигу провели великі виміри часу простої та складної реакцій. Перші випробування координації рухів включали тепінг і різні види прицілювання. Однією з перших спроб вивчення прицілювання є тест X. Френкеля (Н. S. Frenkel), запропонований ним у 1900 р. Суть його полягала в тому, щоб утримувати вказівний палець у будь-яких отворах, кільцях і т. п. Це прототип сучасних тестів «на статичний та динамічний тремор».

Намагаючись визначити музичний талант, 1915 р. Сішор (С. Е. Seashore) досліджував здатність до ритму.

Теорія тестування веде свій відлік, проте, з кінця XIX - початку XX ст. Саме тоді було закладено основи математичної статистики, без якої сучасна теоріятестів обійтися не може. На цьому шляху безперечні заслуги належать генетику та антропологу Ф. Гальтону (F. Galton), математикам Пірсону (Pearson) та У. Йолі (U. Youle), математику-психологу Спірмену (С. Spearman). Саме ці вчені створили нову галузь біології - біометрію, в основі якої виміри та статистичні методи, такі, як кореляція, регресія та ін. Створений Пірсоном (1901) і Спірменом (1904) англійському вченому Барту (С. Burt) застосувати його в 1925 до аналізу результатів моторних тестів учнів лондонських шкіл. В результаті були ідентифіковані такі фізичні здібності, як сила, швидкість, спритність та витривалість. Виділився також фактор, названий "загальна фізична підготовленість". Дещо пізніше побачила світ одна з найвідоміших робіт американського вченого Мак Клоя (С.Н.McCloy, 1934)-- «Вимір загальних рухових здібностей». На початку 40-х років. вчені приходять до висновку про складній структурірухових здібностей людини. Використовуючи різні моторні тести у поєднанні із застосуванням паралельно розроблюваних математичних моделей (одно- і багатофакторний аналіз), в теорію тестування міцно увійшли поняття про п'ять рухових здібностей: силу, швидкість, координацію рухів, витривалість і гнучкість.

Двигуни в колишньому СРСРбули використані розробки контрольних нормативів комплексу «Готов до праці та обороні» (1931). Відомий тест рухових здібностей (головним чином координації рухів), який для дітей та молоді запропонував М. І. Озерецький (1923). Роботи щодо вимірювання рухових здібностей дітей, молоді приблизно в ці ж терміни з'явилися в Німеччині, Польщі, Чехословаччині та інших країнах.

Значні успіхи у розвитку теорії тестування фізичної підготовленості людини припадають на кінець 50-х та 60-х рр. н. XX ст. Основоположником цієї теорії, найімовірніше, є американець Мак Клой, який випустив у співавторстві з М. Юнгом (М. D. Young) у 1954 р. монографію «Тести та вимір у охороні здоров'я та фізичному вихованні», на яку згодом спиралися багато авторів подібних робіт .

Велике теоретичне значення мала і досі має книга "Структура та вимір фізичних здібностей" відомого американського дослідника Є.А. Флейшмана (1964). У книзі не лише відображені теоретичні та методологічні питання проблеми тестування даних здібностей, а й викладено конкретні результати, варіанти підходів, дослідження надійності, інформативності (валідності) тестів, а також представлено важливий фактичний матеріал щодо факторної структури рухових тестів різних рухових здібностей.

Велике значеннядля теорії тестування фізичних навичок мають книги В.М. Заціорського «Фізичні якості спортсмена» (1966) та «Кібернетика, математика, спорт» (1969).

Короткі історичні відомості щодо тестування фізичної підготовленості в колишньому СРСР можна знайти у публікаціях Є.Я. Бондаревського, В. В. Кудрявцева, Ю.І. Сбруєва, В.Г. Панаєва, Б.Г. Фадєєва, П.А. Виноградова та ін.

Умовно можна виділити три етапи тестування в СРСР (Росії):

1-й етап - 1920-1940 рр.. - період масових обстежень з метою вивчення основних показників фізичного розвиткута рівня рухової підготовленості, поява на цій основі нормативів комплексу «Готовий до праці та оборони».

2-й етап - 1946-1960 рр.-- вивчення рухової підготовленості залежно від морфофункціональних особливостей з метою створення передумов для науково-теоретичного обґрунтування їх взаємозв'язку.

3-й етап - з 1961 р. по теперішній час - період комплексних дослідженьфізичного стану населення, залежно від кліматогеографічних особливостей регіонів країни.

Дослідження, виконані у період, показують, що показники фізичного розвитку та рухової підготовленості людей, які у різних регіонах країни, зумовлені впливом біологічних, кліматогеографічних, соціально-економічних та інших як постійних, і змінних чинників. За розробленою єдиною комплексною програмою, що складається з чотирьох розділів (фізична підготовленість, фізичний розвиток, функціональний станосновних систем організму, соціологічна інформація), у 1981 р. було проведено комплексне обстеження фізичного стану населення різного вікута статі різних регіонів СРСР.

Дещо пізніше наші фахівці зазначили, що вже понад 100 років вивчається рівень фізичного розвитку та підготовленості людини. Однак, незважаючи на відносно велику кількість робіт у цьому напрямку, провести глибокий і всебічний аналізотриманих даних неможливо, оскільки дослідження проводилися з різними контингентами, в різні сезонні періоди, з використанням різних методик, програм тестування та математико-статистичної обробки отриманої інформації.

У зв'язку з цим основний наголос було зроблено на розробку методології та організації уніфікованої системи збору даних з урахуванням метрологічних та методичних вимог та створення банку даних на ЕОМ.

У середині 80-х років. минулого століття було проведено масове всесоюзне обстеження близько 200 000 осіб від 6 до 60 років, яке підтвердило висновки попереднього дослідження.

З самого початку виникнення наукових підходів до тестування фізичної підготовленості людини дослідники прагнули отримати відповіді на два основні питання:

які тести мають бути відібрані для оцінки рівня розвитку конкретної рухової (фізичної) здатності та рівня фізичної підготовленості дітей, підлітків та дорослих;

скільки потрібно тестів, щоб отримати мінімальну та водночас достатню інформацію про фізичний стан людини?

Єдиних уявлень у світі з цих питань поки що не вироблено. Водночас уявлення про програми (батареї) тестів, що характеризують фізичну підготовленість дітей та підлітків від 6 до 17 років, прийняті в різних країнах, дедалі більше зближуються.

1.2 Поняття «тест» та класифікація рухових (моторних) тестів

Термін тест у перекладі з англійської означає «проба, випробування».

Тести застосовуються для вирішення багатьох наукових та практичних завдань. Серед інших способів оцінки фізичного стану людини (спостереження, експертні оцінки) метод тестів (у нашому випадку - рухових або моторних) є головним методом, який використовується в спортивній метрології та інших наукових дисциплінах («вчення про рухи», теорію та методику фізичного виховання) .

Тест - це вимір чи випробування, проведене визначення здібностей чи стану людини. Таких вимірів може бути дуже багато, у тому числі на основі використання найрізноманітніших фізичних вправ. Однак далеко не кожну фізичну вправу чи випробування можна розглядати як тест. Як тести можуть використовуватися лише ті випробування (проби), які відповідають спеціальним вимогам:

має бути визначено мету застосування будь-якого тесту (або тестів);

слід розробити стандартизовану методику вимірювання результатів у тестах та процедуру тестування;

необхідно визначити надійність та інформативність тестів;

результати тестів можуть бути представлені у відповідній системі оцінки.

Система використання тестів відповідно до поставленої завданням, організацією умов, виконанням тестів випробуваними, оцінка та аналіз результатів називаються тестуванням, а отримане під час вимірювань числове значення - результатом тестування (тесту). Наприклад, стрибок у довжину з місця – це тест; процедура проведення стрибків та вимірювання результатів - тестування; Довжина стрибка - результат тесту.

У основі тестів, які у фізичному вихованні, лежать рухові дії (фізичні вправи, рухові завдання). Такі випробування називаються руховими або моторними.

Нині ще немає єдиної класифікації рухових тестів. Відома класифікація тестів за їхньою структурою та за їх переважними показаннями (табл. 2).

Відповідно до таблиці, розрізняють одиничний і комплексний випробування. Одиничний тест служить для вимірювання та оцінки однієї ознаки (координаційної чи кондиційної здатності). Оскільки, як бачимо, структура кожної координаційної чи кондиційної здатності є складною, то за допомогою такого тесту оцінюється, як правило, лише один компонент такої здатності (наприклад, здатність до рівноваги, швидкість простої реакції, сила м'язів рук).

Таблиця 2. - Форми тестів та можливості їх застосування (за Д.Д. Блюме, 1987)

Вимірювана здатність

Ознака структури

Одиничний тест

Елементарний тест, що містить одну рухову задачу

Одна здатність або аспект (компонент) здатності

Одна задача тесту, одна остаточна оцінка тесту

Тест на рівновагу, тремометрія, тест на оцінку здатності до з'єднання, тест на оцінку ритму

Навчальний тест

Одна чи кілька завдань тесту. Остаточна оцінка тесту

Загальний навчальний тест

Тестова серія

Одне завдання тестів з варіантами або кілька завдань підвищеної складності

Тест для оцінки здатності до з'єднання (зв'язку)

Комплексний тест

Комплексний тест, що містить одне завдання

Декілька здібностей або аспектів (компонентів) однієї здібності

Одна задача тесту, кілька остаточних оцінок

Стрибковий тест

Тест багаторазових завдань

Декілька тестових завдань, що виконуються послідовно, кілька остаточних оцінок

Тест багаторазових реакцій

Тестовий профіль

Декілька тестів, кілька остаточних оцінок

Координаційне завдання

Тестова батарея

Декілька тестів, одна тестова оцінка

Тестова батарея для оцінки здатності вчитися руху


За допомогою навчального тесту оцінюється здатність до рухового навчання (за різницею остаточної та початкової оцінок за певний період навчання техніці рухів).

Тестова серія дає можливість один і той же тест використовувати протягом тривалого часу, коли здатність, що вимірюється, істотно покращується. При цьому завдання тесту за своєю трудністю послідовно підвищуються. На жаль, цей різновид тесту поки що недостатньо використовується як у науці, так і на практиці.

За допомогою комплексного тесту оцінюється кілька ознак або компонентів різних або однієї і тієї ж здібності, наприклад, стрибок вгору з місця (з помахом рук, без помаху рук, на задану висоту). На підставі цього тесту можна отримати інформацію про рівень швидкісно-силових здібностей (по висоті стрибка), координаційних здібностей (за точністю диференціювання силових зусиль, по різниці висоти стрибка зі змахом та без помаху рук).

Тестовий профіль складається з окремих тестів, на підставі яких оцінюються або декілька різних фізичних здібностей (гетерогенний тестовий профіль), або різні проявиоднієї і тієї ж фізичної здатності (гомогенний тестовий профіль). Результати тесту можуть бути представлені у формі профілю, що дає змогу порівнювати індивідуальні та групові результати.

Тестова батарея складається з кількох окремих тестів, результати яких зводяться в одну остаточну оцінку, що розглядається в одній з оціночних шкал (див. розділ 2). Як і в тестовому профілі, розрізняють гомогенну та гетерогенну батареї. Гомогенна батарея або гомогенний профіль знаходить застосування в оцінці всіх компонентів комплексної здатності (наприклад, здатності до реакції). При цьому результати окремих тестів мають бути тісно взаємопов'язані (мають корелювати).

У тестах багаторазових завдань випробувані послідовно виконують рухові завдання і кожне рішення рухової завдання отримують окремі оцінки. Ці оцінки можуть полягати в тісному зв'язку один з одним. За допомогою відповідних статистичних розрахунків можна отримати додаткову інформацію про здібності, що оцінюються. Прикладом можуть бути завдання, що послідовно вирішуються, стрибкового тесту (табл. 3).

Таблиця 3. - Послідовно розв'язувані завдання стрибкового тесту

Завдання тесту

Оцінка результату

Здатність

Максимальний стрибок без помаху рук

Стрибкова сила

Максимальний стрибок вгору зі змахом рук

Стрибкова сила та здатність до з'єднання (зв'язку)

Максимальний стрибок вгору зі змахом рук та підскоком

Здатність до з'єднання (зв'язку) та стрибкова сила

10 стрибків зі змахом рук на відстань, що дорівнює 2/3 від максимальної висотистрибка, як у завданні 2

Сума відхилень від заданої позначки

Здатність до диференціювання силових параметрів рухів

Різниця між результатами за вирішення одного завдання та двох завдань

Здатність до з'єднання (зв'язку)

(за Д.Д. Блюме, 1987)

У визначенні рухових тестів вказується, що вони є оцінкою рухових здібностей і частково моторних навичок. У найзагальнішому вигляді виділяють кондиційні тести, координаційні тести та тести з метою оцінки рухових умінь і навиків (техніки рухів). Така систематизація є, однак, ще надто загальною. Класифікація рухових тестів за переважними їх показаннями випливає із систематизації фізичних (рухових) здібностей.

У зв'язку з цим розрізняють:

1) кондиційні випробування:

для оцінки сили: максимальної, швидкісної, силової витривалості;

для оцінки витривалості;

з метою оцінки швидкісних здібностей;

для оцінки гнучкості - активної та пасивної;

2) координаційні тести:

для оцінки координаційних здібностей, що належать до окремих самостійних груп рухових дій, що вимірюють спеціальні координаційні здібності;

для оцінки специфічних координаційних здібностей - здібностей до рівноваги, орієнтування в просторі, реагування, диференціювання параметрів рухів, ритму, перебудови рухових дій, узгодження (зв'язку),

вестибулярної стійкості, довільного розслаблення м'язів.

Поняття «тести з оцінки рухових навичок» у роботі не розглядаються. Приклади тестів наведено у Додатку 2.

Таким чином, кожна класифікація – це своєрідні орієнтири для вибору (або створення) того типу тестів, які більшою мірою відповідають завданням тестування.

1.3 Критерії добротності рухових тестів

Поняття "руховий тест" відповідає своєму призначенню тоді, коли тест задовольняє відповідним вимогам.

Тести, що відповідають вимогам надійності та інформативності, називають добротними або автентичними (достовірними).

Під надійністю тесту розуміють ступінь точності, з якою він оцінює певну рухову здатність незалежно від вимог того, хто її оцінює. Надійність проявляється у ступеня збігу результатів при повторному тестуванні тих самих людей за однакових умов; це стабільність чи стійкість результату тесту індивіда під час повторного проведення контрольного вправи. Інакше кажучи, дитина у групі обстежуваних за результатами повторних тестувань (наприклад, показників стрибків, часу бігу, дальності метання) стійко зберігає своє рангове місце.

Надійність тесту визначається за допомогою кореляційно статистичного аналізу шляхом розрахунку коефіцієнта надійності. У цьому використовують різні способи, виходячи з яких судять про надійності тесту.

Стабільність тесту ґрунтується на залежності між першою та другою спробами, повтореними через певний час в однакових умовах одним і тим самим експериментатором. Спосіб повторного тестування визначення надійності називається ретестом. Стабільність тесту залежить від виду тесту, віку та статі піддослідних, часового інтервалу між тестом та ретестом. Наприклад, показники кондиційних тестів або морфологічних ознак при невеликих часових інтервалах стабільніші, ніж результати координаційних тестів; у старших дітей результати стабільніші, ніж у молодших. Ретест зазвичай проводиться пізніше як за тиждень. При триваліших інтервалах (наприклад, через місяць) стабільність навіть таких тестів, як біг на 1000 м або стрибок у довжину з місця, стає вже помітно нижчою.

Еквівалентність тесту полягає в кореляції результату тесту з результатами інших однотипних тестів (наприклад, коли треба вибрати, який тест адекватніше відображає швидкісні здібності: біг на 30, 50, 60 або 100 м).

Ставлення до еквівалентних (гомогенні) тестів залежить від багатьох причин. Якщо треба підвищити надійність оцінок чи висновків дослідження, доцільно використовувати два і більше еквівалентних тесту. А якщо стоїть завдання створити батарею, що містить мінімум тестів, слід застосовувати лише один із еквівалентних тестів. Така батарея, як зазначалося, є гетерогенною, тому що тести, що входять до неї, вимірюють різні рухові здібності. Прикладом гетерогенної батареї тестів є біг на 30 м, підтягування на перекладині, нахил уперед, біг на 1000 м.

Надійність тестів визначають також у порівнянні середніх оцінок парних і непарних спроб, які входять у тест. Наприклад, середню точність кидків у мету з 1, 3, 5, 7 і 9 спроб порівнюють із середньою точністю кидків з 2, 4, 6, 8 і 10 спроб. Такий метод оцінки надійності називається методом подвоєння чи розщепленням. Він використовується переважно при оцінці координаційних здібностей і в тому випадку, якщо кількість спроб, що утворюють тестовий результат, не менше ніж 6.

Під об'єктивністю (узгодженістю) тесту розуміють ступінь узгодженості результатів, одержуваних на тих самих випробуваних різними експериментаторами (учителями, суддями, експертами).

Для підвищення об'єктивності тестування потрібне дотримання стандартних умов проведення тесту:

час тестування, місце, погодні умови;

єдине матеріальне та апаратурне забезпечення;

психофізіологічні фактори (обсяг та інтенсивність навантаження, мотивація);

подача інформації (точна словесна постановка завдання тесту, пояснення та демонстрація).

Це так звана об'єктивність проведення тесту. Говорять ще про інтерпретаційну об'єктивність щодо ступеня незалежності інтерпретації результатів тестування різними експериментаторами.

Загалом, як зазначають фахівці, надійність тестів можна підвищити різними шляхами: суворішою стандартизацією тестування (див. вище), збільшенням кількості спроб, кращою мотивацією піддослідних, збільшенням кількості оцінювачів (суддів, експертів), підвищенням узгодженості їх думок, збільшенням кількості еквівалентних тестів .

Фіксованих значень показників надійності тесту немає. Найчастіше користуються такими рекомендаціями: 0,95--0,99 - відмінна надійність; 0,90-0,94 - хороша; 0,80-0,89 - прийнятна; 0,70-0,79 - погана; 0,60-0,69 - для індивідуальних оцінок сумнівна, тест придатний тільки для характеристики групи піддослідних.

Інформативність тесту - це ступінь точності, з якою він вимірює рухову здатність, що оцінюється, або навик. В іноземній (і вітчизняній) літературі використовують замість слова "інформативність" термін "валідність" (від англ. validity - обґрунтованість, дійсність, законність). Фактично, говорячи про інформативність, дослідник відповідає на два питання: що вимірює даний конкретний тест (батарея тестів) і який при цьому ступінь точності виміру?

Розрізняють декілька видів валідності: логічну (змістовну), емпіричну (на підставі дослідних даних) та передбачальну (2)

Важливими додатковими критеріями тестів є нормування, порівнянність та економічність.

Суть нормування у тому, що з урахуванням результатів тестування можна створити норми, мають особливе значення для практики.

Зіставність тесту полягає в можливості порівнювати результати, отримані за однією або декількома формами паралельних (гомогенних) тестів. У практичному плані застосування зіставних моторних тестів знижує ймовірність того, що в результаті регулярного застосування одного й того тесту оцінюється не тільки і не стільки рівень здатності, скільки ступінь навички. Одночасно порівняні результати тестів підвищують достовірність висновків.

Суть економічності як критерію добротності тесту полягає в тому, що проведення тесту не потребує тривалого часу, великих матеріальних витрат та участі багатьох помічників.


Висновок

Попередники сучасних рухових тестів з'явилися наприкінці XIX - початку XX в. З 1920 року у нашій країні проводилися масові обстеження з вивчення основних показників фізичного розвитку та рівня рухової підготовленості. На цій основі цих даних було розроблено нормативи комплексу «Готов до праці та оборони».

У теорію тестування міцно увійшли поняття про п'ять рухових здібностей: силу, швидкість, координацію рухів, витривалість і гнучкість. Для їх оцінки розроблено цілий рядрізних тестових батарей.

Серед методів оцінки фізичного стану людини спосіб тестів є основним. Розрізняють одиничний та комплексний тести. Також у зв'язку із систематизацією фізичних (рухових) здібностей тести класифікують на кондиційні та координаційні.

Усі тести мають відповідати спеціальним вимогам. До основних критеріїв належать: надійність, стабільність, еквівалентність, об'єктивність, інформативність (валідність). До додаткових критеріїв відносяться: нормування, сумісність та економічність.

Тому при виборі певних тестів необхідно дотримуватися всіх цих вимог. Для підвищення об'єктивності тестів слід дотримуватися суворішою стандартизацією тестування, збільшенням кількості спроб, кращою мотивацією піддослідних, збільшенням кількості оцінювачів (суддів, експертів), підвищенням узгодженості їх думок, збільшенням кількості еквівалентних тестів.


Глава 2. Завдання, методи та організація дослідження

2.1 Завдання дослідження:

1. Вивчити відомості про теорію тестування за даними літературних джерел;

2. Проаналізувати методику тестування фізичних якостей;

3. Порівняти показники рухової підготовленості учнів 7а та 7б класів.

2.2 Методи дослідження:

1. Аналіз та узагальнення літературних джерел.

Здійснювався протягом усього дослідження. Розв'язання даних завдань на теоретичному рівніздійснюється на вивченні літератури з: теорії та методики фізичного виховання та спорту, виховання фізичних якостей, спортивної метрології. Було проаналізовано 20 літературних джерел.

2. Словесна дія.

Проводився інструктаж про послідовність виконання рухових тестів та мотиваційна бесіда для настрою на досягнення кращого результату.

3. Тестування фізичних аспектів.

біг 30 метрів (з високого старту),

човниковий біг 3 х 10 метрів,

стрибки в довжину з місця,

6-хвилинний біг (м),

нахил вперед із положення сидячи (см),

підтягування на перекладині (дівчинки на низькій).

4. Методи математичної статистики.

Використовувалися для проведення розрахунків, які використовувалися при порівняльному аналізіучнів 7а та 7б класів.

2.3 Організація дослідження

На першому етапі, у квітні 2009 року, проводився аналіз науково-методичної літератури:

· Вивчення змісту програм з фізичного виховання учнів загальноосвіт

Області застосування, цілі та завдання тестування ПЗ різноманітні, тому тестування оцінюється та пояснюється по-різному. Іноді й самим тестувальникам буває складно пояснити, що таке тестування "as is". Виникає плутанина.

Для розплутування цієї плутанини Олексій Баранцев (практик, тренер і консалтер у тестуванні ПЗ; виходець з Інституту системного програмування Російської академії наук) передує свої тренінги з тестування вступним відео про основні положення тестування.

Мені здається, що в цій доповіді лектор зміг найбільш адекватно та виважено пояснити «що таке тестування» з погляду вченого та програміста. Дивно, що цей текст ще не з'являвся на хабрі.

Наводжу тут стислий переказ цієї доповіді. Наприкінці тексту є лінки на повну версію, а також на згадане відео.

Основні положення тестування

Шановні колеги,

Спочатку спробуємо зрозуміти, чим тестування не є.

Тестування не розробка,

Навіть якщо тестувальники вміють програмувати, у тому числі й тести (автоматизація тестування = програмування), можуть розробляти якісь допоміжні програми (для себе).

Проте, тестування - це діяльність з розробки програмного забезпечення.

Тестування не аналіз,

І не діяльність зі збирання та аналізу вимог.

Хоча, у процесі тестування іноді доводиться уточнювати вимоги, інколи ж доводиться їх аналізувати. Але ця діяльність не основна, скоріше, це доводиться робити просто за потребою.

Тестування не керування,

Незважаючи на те, що в багатьох організаціях є така роль, як тест-менеджер. Звісно ж, тестувальниками треба керувати. Але саме собою тестування управлінням не є.

Тестування не техписництво,

Проте тестувальникам доводиться документувати свої тести та свою роботу.

Тестування не можна вважати жодною з цих діяльностей просто тому, що в процесі розробки (або аналізу вимог або написання документації для своїх тестів) всю цю роботу тестувальники роблять для себе, а не для когось іншого.

Діяльність значуща лише тоді, коли вона затребувана, тобто тестувальники мають щось робити «на експорт». Що вони роблять "на експорт"?

Дефекти, описи дефектів чи звіти про тестування? Частково це правда.

Але це не вся правда.

Головна діяльність тестувальників

полягає в тому, що вони надають учасникам проекту з розробки програмного забезпечення негативний зворотний зв'язок якості програмного продукту.

"Негативний зворотний зв'язок" не несе якийсь негативний відтінок, і не означає, що тестувальники роблять щось погане, або що вони роблять щось погано. Це просто технічний термін, який означає досить просту річ.

Але ця річ дуже значуща, і, напевно, єдина найважливіша складова діяльності тестувальників.

Існує наука – «теорія систем». У ньому визначається таке поняття як «зворотний зв'язок».

«Зворотний зв'язок» – це деякі дані, які з виходу потрапляють назад на вхід, або якась частина даних, які з виходу потрапляють назад на вхід. Цей зворотний зв'язок може бути позитивним та негативним.

І той, і інший різновид зворотного зв'язку рівноцінно важливі.

У розробці програмних систем позитивним зворотним зв'язком, звичайно, є якась інформація, яку ми отримуємо від кінцевих користувачів. Це запити на якусь нову функціональність, це збільшення обсягів продажу (якщо ми випускаємо якісний продукт).

Негативний зворотний зв'язок також може надходити від кінцевих користувачів як якихось негативних відгуків. Або вона може надходити від тестувальників.

Що раніше надається негативний зворотний зв'язок, то менше енергії необхідно для модифікації цього сигналу. Саме тому тестувати потрібно починати якомога раніше, на ранніх стадіях проекту, і надавати цей зворотний зв'язок і на етапі проектування, і ще, можливо, раніше, ще на етапі збору та аналізу вимог.

До речі, звідси зростає розуміння того, що тестувальники не відповідають за якість. Вони допомагають тим, хто відповідає за нього.

Синоніми терміна "тестування"

З точки зору того, що тестування - це надання негативного зворотного зв'язку, всесвітньо відома абревіатура QA (англ. Quality Assurance - Забезпечення якості) синонімом терміна "тестування" вже точно не є.

Не можна вважати забезпеченням якості просте надання негативного зворотного зв'язку, адже Забезпечення – це деякі позитивні заходи. Мається на увазі, що в цьому випадку ми саме забезпечуємо якість, вчасно вживаємо якихось заходів для того, щоб якість розробки програмного забезпечення підвищилася.

А ось «контроль якості» - Quality Control, можна вважати в широкому сенсі синонімом для терміну «тестування», тому що контроль якості це і є надання зворотного зв'язку в різних її різновидах, на різних етапах програмного проекту.

Іноді тестування мається на увазі як окрема форма контролю якості.

Плутанина приходить з історії розвитку тестування. У різний часпід терміном «тестування» малися на увазі різні дії, які можна розділити на 2 великі класи: зовнішні та внутрішні.

Зовнішні визначення

Визначення, які у різний час дали Майєрс, Бейзер, Канер, описують тестування саме з погляду його ЗОВНІШНЬОЇ значущості. Тобто, з їхньої точки зору, тестування - це діяльність, яка призначена для чогось, а не складається з чогось. Усі ці визначення можна узагальнити як надання негативної зворотний зв'язок.

Внутрішні визначення

Це визначення, які наведені в стандарті термінології, що використовується в програмній інженерії, наприклад, стандарт де-факто, який називається SWEBOK.

Такі визначення конструктивно пояснюють, ЩО являє собою діяльність із тестування, але не дають жодного уявлення про те, ДЛЯ ЧОГО потрібне тестування, для чого потім будуть використовуватися всі отримані результати перевірки відповідності між реальною поведінкою програми та її очікуваною поведінкою.

тестування – це

  • перевірка відповідності програми вимогам,
  • що здійснюється шляхом спостереження за її роботою
  • у спеціальних, штучно створених ситуаціях, обраних певним чином.
Звідси й надалі вважатимемо це робочим визначенням тестування.

Загальна схема тестування приблизно така:

  1. Тестувальник на вході отримує програму та/або вимоги.
  2. Він із ними щось робить, спостерігає за роботою програми у певних, штучно створених ним ситуаціях.
  3. На виході він отримує інформацію про відповідності та невідповідності.
  4. Далі ця інформація використовується для покращення вже існуючої програми. Або для того, щоб змінити вимоги до програми, що ще тільки розробляється.

Що таке тест

  • Це спеціальна, штучно створена ситуація, обрана певним чином,
  • та опис того, які спостереження за роботою програми потрібно зробити
  • для перевірки її відповідності деяким вимогам.
Не треба вважати, що ситуація – це щось миттєве. Тест може бути досить довгим, наприклад, при тестуванні продуктивності ця штучно створена ситуація це може бути триває протягом досить тривалого часу навантаження на систему. А спостереження, які потрібно при цьому робити, це набір різних графіків чи метрик, які ми вимірюємо під час виконання цього тесту.

Розробник тестів займається тим, що з величезного потенційно нескінченного набору тестів вибирає певний обмежений набір.

Ну і таким чином ми можемо зробити висновок, що тестувальник робить у процесі тестування дві речі.

1.По-перше, він керує виконанням програми та створює ці самі штучні ситуації, в яких ми збираємося перевіряти поведінку програми.

2.І, по-друге, він спостерігає за поведінкою програми та порівнює те, що він бачить з тим, що очікується.

Якщо тестувальник автоматизує тести, він не сам спостерігає за поведінкою програми - він делегує це завдання спеціальному інструменту чи спеціальної програмі, що він сам написав. Саме вона спостерігає, вона порівнює поведінку, що спостерігається, з очікуваним, а тестувальнику видає тільки деякий кінцевий результат - чи збігається спостерігається поведінка з очікуваним, або не збігається.

Будь-яка програма є механізмом з переробки інформації. На вхід надходить інформація в якомусь одному вигляді, на виході інформація в іншому вигляді. При цьому входів та виходів у програми може бути багато, вони можуть бути різними, тобто у програми може бути декілька різних інтерфейсів, і ці інтерфейси можуть мати різні види:

  • Інтерфейс користувача (UI)
  • Програмний інтерфейс (API)
  • Мережевий протокол
  • Файлова система
  • Стан оточення
  • Події
Найбільш поширені інтерфейси це
  • користувальницький,
  • графічний,
  • текстовий,
  • консольний,
  • та мовленнєвий.
Використовуючи всі ці інтерфейси, тестувальник:
  • якимось чином створює штучні ситуації,
  • і перевіряє в цих ситуаціях як програма поводиться.

Ось це і є тестування.

Інші класифікації видів тестування

Найчастіше використовується розбиття на три рівні, це
  1. модульне тестування,
  2. інтеграційне тестування,
  3. системне тестування
Під модульним тестуванням зазвичай мається на увазі тестування досить низькому рівні, тобто тестування окремих операцій, методів, функцій.

Під системним тестуванням мається на увазі тестування на рівні інтерфейсу користувача.

Іноді використовуються також деякі інші терміни, такі, як «компонентне тестування», але я волію виділяти саме ці три, тому що технологічний поділ на модульне та системне тестування не має великого сенсу. На різних рівнях можуть використовуватися одні й самі інструменти, одні й самі техніки. Поділ умовний.

Практика показує, що інструменти, які позиціонуються виробником як інструменти модульного тестування, з рівним успіхом можуть застосовуватись і на рівні тестування всього додатку в цілому.

А інструменти, які тестують всю програму в цілому на рівні інтерфейсу користувача іноді хочуть заглядати, наприклад, в базу даних або викликати там якусь окрему процедуру, що зберігається.

Тобто поділ на системне та модульне тестування взагалі кажучи суто умовне, якщо говорити з технічної точки зору.

Використовуються одні й самі інструменти, і це нормально, використовуються одні й самі техніки, кожному рівні можна говорити про тестуванні різного виду.

Комбінуємо:

Тобто можна говорити про модульне тестування функціональності.

Можна говорити про системне тестування функціональності.

Можна говорити про модульне тестування, наприклад, ефективність.

Можна говорити про системне тестування ефективності.

Або ми розглядаємо ефективність якогось окремого алгоритму, або ми розглядаємо ефективність всієї системи в цілому. Тобто технологічний поділ на модульне та системне тестування не має великого сенсу. Тому що на різних рівнях можуть використовуватися ті самі інструменти, ті самі техніки.

Зрештою, при інтеграційному тестуванні ми перевіряємо, якщо в рамках якоїсь системи модулі взаємодіють один з одним коректно. Тобто ми фактично виконуємо ті самі тести, що і при системному тестуванні, тільки ще додатково звертаємо увагу на те, як саме модулі взаємодіють між собою. Виконуємо деякі додаткові перевірки. Це єдина різниця.

Давайте ще раз спробуємо зрозуміти різницю між системним та модульним тестуванням. Оскільки такий поділ зустрічається досить часто, ця різниця має бути.

І ця різниця проявляється тоді, коли ми виконуємо не технологічну класифікацію, а класифікацію за цілямитестування.

Класифікацію за цілями зручно виконувати з використанням магічного квадрата, який був спочатку придуманий Браяном Маріком і потім покращений Ері Тенненом.

У цьому магічному квадраті всі види тестування розташовуються по чотирьох квадрантах залежно від того, чому в цих тестах більше уваги.

По вертикалі - що вище розташовується вид тестування, то більше уваги приділяється деяким зовнішнім проявамповедінки програми, що нижче він перебуває, тим більше уваги приділяємо її внутрішньому технологічному устрою програми.

По горизонталі - чим лівіше знаходяться наші тести, тим більше уваги ми приділяємо їх програмуванню, чим правіше вони знаходяться, тим більше уваги ми приділяємо ручному тестуванню та дослідженню програми людиною.

Зокрема, у цей квадрат можна легко вписати такі терміни як приймальне тестування, Acceptance Testing, модульне тестування саме в тому розумінні, в якому воно найчастіше вживається у літературі. Це низькорівневе тестування з великою, з переважною часткою програмування. Тобто це всі тести програмуються, повністю автоматично виконуються та увага приділяється насамперед саме внутрішнього пристроюпрограми, саме її технологічним особливостям.

У правому верхньому кутку у нас виявляться ручні тести, націлені на зовнішню якусь поведінку програми, зокрема, тестування зручності використання, а у правому нижньому кутку у нас, швидше за все, виявляться перевірки різних нефункціональних властивостей: продуктивності, захищеності тощо.

Так ось, виходячи з класифікації за цілями, модульне тестування у нас виявляється у лівому нижньому квадранті, а всі інші квадранти – це системне тестування.

Спасибі за увагу.


Основні питання: Тест як інструмент виміру. Основні теорії тестування. Функції, можливості та обмеження тестування. Застосування тестів щодо оцінки персоналу. Переваги та недоліки використання тестів. Форми та види тестових завдань. Технологія побудови завдання. Оцінка якості тесту. Достовірність та валідність. Програмне забезпечення розробки тестів. 2




Тест як інструмент виміру Основні поняття у тестології: вимір, тест, зміст та форма завдань, надійність та валідність результатів виміру. Крім того, у тестології використовуються такі поняття статистичної науки, як вибіркова та Генеральна сукупність, Середні показники, варіація, кореляція, регресія та ін.




Тестове завдання - це дидактично та технологічно ефективна одиниця контрольного матеріалу, частина тесту, яка відповідає вимогам предметної чистоти змісту (або одномірності), змістовної та логічної правильності, правильності форми, прийнятності геометричного образу завдання. 6




Традиційний тест є стандартизованим методом діагностики рівня та структури підготовленості. У такому тесті всі випробувані відповідають на одні й самі завдання, в однаковий час, в однакових умовах і з однаковими правилами оцінювання відповідей. Для досягнення мети тестування можна створити незліченну кількістьтестів, і всі вони можуть відповідати досягненню поставленого завдання. 8


Професіограма (від лат. Professio спеціальність + Gramma запис) система ознак, що описують ту чи іншу професію, а також включає перелік норм і вимог, що пред'являються цією професією або спеціальністю до працівника. Зокрема, професіограма може включати перелік психологічних характеристик, яким повинні відповідати представники конкретних професійних груп. 9


Основні теорії тестування Перші наукові праці з теорії тестів з'явилися на початку ХХ століття, на стику психології, соціології, педагогіки та інших, про поведінкових наук. Зарубіжні психологи називають цю науку психометрикою (Psychometrika), а педагоги – педагогічним виміром (Educational measurement). Незамутнена ідеологією та політикою, інтерпретація назви «тестологія» проста та прозора: наука про тести. 10


Перший етап - передісторія - з давніх-давен до кінця XIX століття, коли були поширені донаукові форми контролю знань і здібностей; другий період, класичний, продовжувався з початку 20-х до кінця 60-х років, протягом якого створювалася класична теорія тестів; третій період - технологічний - що розпочався з 70-х років - час розробки методів адаптивного тестування та навчання, методологію ефективної розробки тестів та тестових завдань для параметричної оцінки піддослідних за вимірюваною латентною якістю. 11


Функції, можливості та обмеження тестування Тести, що застосовуються при відборі, призначені для того, щоб отримати психологічний портрет кандидата, оцінити його здібності, а також професійні знання та навички. Тести дозволяють порівнювати кандидатів між собою чи з еталонами, тобто ідеальним кандидатом. Тести використовуються для вимірювання якостей людини, необхідні результативного виконання роботи. Деякі тести влаштовані таким чином, щоб роботодавець сам адміністрував тестування та підраховував результати. Інші вимагають послуг досвідчених консультантів, щоб забезпечити їхнє правильне застосування. 12


Обмеження використання тестів пов'язані з їх дорогим адмініструванням; - З придатністю для оцінки здібностей людини; - Тести більш успішні для прогнозування успішності в роботі, яка містить короткі за часом професійні завдання, і не дуже зручні у випадках, коли завдання, які вирішуються на роботі, займають кілька днів або тижнів. 13








2. Використовувана термінологія має бути підібрана для конкретну цільову аудиторію. Також потрібно виключити зайві статті або статті, що включають два або більше запитань, оскільки вони іноді спантеличують респондента і ускладнюють інтерпретацію. 17


3. Щоб задовольнити всім цим вимогам, слід переглянути весь банк питань статтю за статтею та проаналізувати, якою метою є кожна з них. Наприклад, якщо тест розробляється для вимірювання аналітичних здібностей стажистів – бухгалтерів, варто подумати, що в цьому випадку означає поняття « аналітичні здібності». 18




5. Коли питання та формати підрахунку результатів обрані, їх потрібно перетворити на зручний для користувача формат, з чітко написаними інструкціями та питаннями - прикладами; так, щоб кандидати, які виконують тест, повністю розуміли, що від них вимагається. 20


6. Дуже часто на цьому етапі розробки тест включають більше питань, ніж потрібно. За деякими оцінками, втричі більше, ніж залишиться в остаточному тесті чи системі виміру. Тоді вихідним заходом стане перевірка тесту, що розробляється на відносно широкій вибірці з числа існуючих працівників, щоб переконатися в тому, що всі питання легко зрозумілі. 21


7. Тести на визначення знань зазвичай починаються з простих питань, що поступово ускладнюються до кінця. Коли тести призначаються для вимірювання соціальних установокі особистісних характеристикможливо, буде корисним чергувати негативно і позитивно сформульовані статті, щоб уникнути непродуманих відповідей. 22


8. Останній етап є застосування тесту на широкій репрезентативної вибірки, щоб встановити норми виконання, достовірності та валідності ще до початку його використання як інструмент відбору. Крім того, необхідно визначити справедливість тесту, щоб переконатися, що він не дискримінує жодних підгруп населення (наприклад, етнічних відмінностей). 23


Оцінка якості тесту Щоб методи відбору були достатньо результативними, вони повинні бути надійними, валідними та достовірними. Достовірність методу відбору характеризується його несхильністю систематичним помилкампри вимірі, тобто його спроможності при різних умовах. 24


Насправді достовірність при винесенні суджень досягається порівнянням результатів двох і більше аналогічних тестів, проведених у різні дні. Інший шлях підвищення достовірності – порівняння результатів кількох альтернативних методів відбору (наприклад, тест та розмова). Якщо результати подібні чи однакові, вважатимуться їх правильними. 25


Надійність означає, що проведені виміри дадуть той самий результат, що й попередні, тобто результати оцінки не впливають сторонні чинники. Валідність означає, що цей метод вимірює саме те, навіщо він призначений. Максимально можлива точність інформації, одержуваної спеціально розробленими методиками наукових дослідженнях, обмежена технічними факторами та не перевищує 0,8. 26


У практиці відбору персоналу зазначається, що надійність різних методівоцінки розміщується в інтервалах: 0,1 - 0,2 - традиційне інтерв'ю; 0,2 – 0,3 – рекомендації; 0,3 – 0,5 – професійні випробування; 0,5 – 0,6 – структуроване інтерв'ю, інтерв'ю з компетенцій; 0,5 – 0,7 – когнітивні та особистісні тести; 0,6 – 0,7 – компетентнісний підхід (асесмент – центр). 27


Під обґрунтованістю розуміється те, з яким ступенем точності даний результат, метод або критерій «передбачає» майбутню результативність людини, що тестується. Обгрунтованість методів відноситься до висновків, зроблених на основі тієї чи іншої процедури, а не самої процедури. Тобто метод відбору може сам бути достовірним, але не відповідати конкретному завданню: вимірювати не те, що потрібно в даному випадку. 28


Програмне забезпечення для розробки тестів У вітчизняній практиці представлені різні комплексні програми з модулем «Психодіагностика», наприклад, програма «1 С: Зарплата та Управління Персоналом 8.0» з модулем «Психодіагностика», розроблена спільно з групою викладачів кафедри психології особистості та загальної психології факультету психології МДУ ім. М. Ст Ломоносова під керівництвом д. псих. наук, проф. А. Н. Гусєва. Навчальний тренажер для розробки систем оцінки персоналу та адаптації тестових методик факультету психології ТГУ, розроблений також на базі «1С:Підприємство 8.2» фірмою Персонал Софт. 29


Література: Відбір та найм персоналу: технології тестування та оцінки / Домінік Купер, Іван Т. Робертсон, Гордон Тінлайн. - М., вид-во «Вершина, - 156 с. Психологічне забезпечення професійної діяльності: теорія та практика / За ред. Проф. Г. С. Нікіфорова. - СПб.: Мова, - 816 с. 30