Биографии Характеристики Анализ

Презентация основы теории тестов по физической культуре. Основные положения тестирования

Описание презентации по отдельным слайдам:

1 слайд

Описание слайда:

2 слайд

Описание слайда:

Физическими качествам принято называть врожденные (генетически унаследованные) морфофункциональные качества, благодаря которым возможна физическая (материально выраженная) активность человека, получающая свое полное проявление в целесообразной двигательной деятельности. К основным физическим качествам относят силу, быстроту, выносливость, гибкость, ловкость.

3 слайд

Описание слайда:

Двигательные способности- это индивидуальные особенности, определяющие уровень двигательных возможностей человека (В. И. Лях, 1996). Основу двигательных способностей человека составляют физические качества, а форму проявления - двигательные умения и навыки. К двигательным способностям относят силовые, скоростные, скоростно-силовые, двигательно-координационные способности, общую и специфическую выносливость

4 слайд

Описание слайда:

Схема систематизации физических (двигательных) способностей Физические (двигательные) способности Кондиционные (энергетические) Силовые Сочетания кондиционных способностей Выносливость Скоростные Гибкость Координационные (информационные) КС, относящиеся к отдельным группам двигательных действий, специальные КС Специфические КС Сочетания координационных способностей Сочетания кондиционных и координационных способностей

5 слайд

Описание слайда:

ПОЛУЧИТЬ ТОЧНУЮ ИНФОРМАЦИЮ ОБ УРОВНЕ РАЗВИТИЯ ДВИГАТЕЛЬНЫХ СПОСОБНОСТЕЙ /высокий, средний, низкий/ МОЖНО С ПОМОЩЬЮ ТЕСТОВ /или контрольных упражнений/.

6 слайд

Описание слайда:

С помощью контрольных испытаний (тестов) можно выявить абсолютные (явные) и относительные (скрытые, латентные) показатели этих способностей. Абсолютные показатели характеризуют уровень развития тех или иных двигательных способностей без учета их влияния друг на друга. Относительные показатели позволяют судить о проявлении двигательных способностей с учетом этого влияния.

7 слайд

Описание слайда:

Вышеназванные физические способности можно представить как существующие потенциально, т. е. до начала выполнения какой-либо двигательной деятельности или деятельностей (их можно называть потенциальными способностями) и как проявляющиеся реально в начале (в том числе при выполнении моторных тестов) и в процессе выполнения этой деятельности (актуальные физические способности).

8 слайд

Описание слайда:

С определенной долей условности можно говорить об ЭЛЕМЕНТАРНЫХ и физических способностях СЛОЖНЫХ физических способностях

9 слайд

Описание слайда:

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ ПОЗВОЛЯЮТ РАЗЛИЧАТЬ СЛЕДУЮЩИЕ ФИЗИЧЕСКИЕ СПОСОБНОСТИ СПЕЦИАЛЬНЫЕ СПЕЦИФИЧЕСКИЕ ОБЩИЕ КС

10 слайд

Описание слайда:

Специальные физические способности относятся к однородным группам целостных двигательных действий или деятельностей: бегу, акробатическим и гимнастическим упражнениям на снарядах, метательным двигательным действиям, спортивным играм (баскетболу, волейболу).

11 слайд

Описание слайда:

О специфических проявлениях физических способностей можно говорить как о компонентах, составляющих их внутреннюю структуру.

12 слайд

Описание слайда:

Так, основными компонентами координационных способностей человека являются: способности к ориентированию, равновесию, реагированию, дифференцированию параметров движений; способности к ритму, перестроению двигательных действий, вестибулярной устойчивости, произвольному расслаблению мышц. Эти способности являются специфичными.

13 слайд

Описание слайда:

Основными компонентами структуры скоростных способностей считают быстроту реагирования, скорость одиночного движения, частоту движений и скорость, проявляемую в целостных двигательных действиях.

14 слайд

Описание слайда:

К проявлениям силовых способностей относят: статическую (изометрическую) силу, динамическую (изотоническую) силу - взрывную, амортизационную силу.

15 слайд

Описание слайда:

Большой сложностью отличается структура выносливости: аэробная, требующая для своего проявления кислородных источников расщепления энергии; анаэробная (гликолитический, креатинфосфатный источники энергии - без участия кислорода); выносливость различных мышечных групп в статических позах - статическая выносливость; выносливость в динамических упражнениях, выполняемых со скоростью 20-90% от максимальной.

16 слайд

Описание слайда:

Менее сложными являются проявления (формы) гибкости, где выделяют активную и пассивную гибкость.

17 слайд

Описание слайда:

Под общими физическими способностями следует понимать потенциальные и реализованные возможности человека, определяющие его готовность к успешному осуществлению различных по происхождению и смыслу двигательных действий. Специальные физические способности - это возможности человека, определяющие его готовность к успешному осуществлению сходных по происхож­дению и смыслу двигательных действий. Поэтому тесты дают информацию прежде всего о степени сформированности специальных и специфических физических (скоростных, координационных, силовых, выносливости, гибкости) способностей.

18 слайд

Описание слайда:

Специальные физические способности - это возможности человека, определяющие его готовность к успешному осуществлению сходных по происхождению и смыслу двигательных действий. Поэтому тесты дают информацию прежде всего о степени сформированности специальных и специфических физических (скоростных, координационных, силовых, выносливости, гибкости) способностей.

19 слайд

Описание слайда:

Задачи тестирования выявлять уровни развития кондиционных и координационных способностей, оценивать качество технической и тактической подготовленности. На основе результатов тестирования можно: сравнивать подготовленность как отдельных учащихся, так и целых групп, проживающих в разных регионах и странах; проводить спортивный отбор для занятий тем или иным видом спорта, для участия в соревнованиях; осуществлять в значительной степени объективный контроль за обучением (тренировкой) школьников и юных спортсменов; выявлять преимущество и недостатки применяемых средств, методов обучения и форм организации занятий; наконец, обосновывать нормы (возрастные, индивидуальные) физической подготовленности детей и подростков.

20 слайд

Описание слайда:

Наряду с вышеназванными задачами в практике разных стран задачи тестирования сводятся к следующему: научить самих школьников определять уровень своей физической подготовленности и планировать необходимые для себя комплексы физических упражнений; стимулировать учащихся к дальнейшему повышению своего физического состояния (формы); знать не столько исходный уровень развития двигательной способности, сколько его изменение за определенное время; стимулировать учащихся, добившихся высоких результатов, но не столько за высокий уровень, сколько за запланированное повышение личных результатов.

21 слайд

Описание слайда:

Тест - это измерение или испытание, проводимое для определения способностей или состояния человека.

22 слайд

Описание слайда:

В качестве тестов могут использоваться лишь те испытания (пробы), которые отвечают специальным требованиям: должна быть определена цель применения любого теста (или тестов); следует разработать стандартизированную методику измерения результатов в тестах и процедуру тестирования; необходимо определить надежность и информативность тестов; результаты тестов могут быть представлены в соответствующей системе оценки

23 слайд

Описание слайда:

Тест. Тестирование. Результат тестирования Система использования тестов в соответствии с поставленной задачей, организацией условий, выполнением тестов испытуемыми, оценка и анализ результатов называется тестированием. Полученное в ходе измерений числовое значение - результатом тестирования (теста).

24 слайд

Описание слайда:

В основе тестов, используемых в физической культуре, лежат двигательные действия (физические упражнения, двигательные задания). Такие тесты называются двигательными или моторными.

25 слайд

Описание слайда:

Известна классификация тестов по их структуре и по их преимущественным показаниям различают единичный и комплексный тесты. Единичный тест служит для измерения и оценки одного признака (координационной или кондиционной способности).

26 слайд

Описание слайда:

27 слайд

Описание слайда:

С помощью комплексного теста оценивается несколько признаков или компонентов разных или одной и той же способности. например, прыжок вверх с места (со взмахом рук, без взмаха рук, на заданную высоту).

28 слайд

Описание слайда:

29 слайд

Описание слайда:

ТЕСТЫ могут быть кондиционные тесты для оценки силовых способностей для оценки выносливости; для оценки скоростных способностей; для оценки гибкости координационные тесты для оценки координационных способностей, относящихся к отдельным самостоятельным группам двигательных действий, которые измеряют специальные координационные способности; для оценки специфических координационных способностей - способностей к равновесию, ориентированию в пространстве, реагированию, дифференцированию параметров движений, ритму, перестроению двигательных действий, согласованию (связи), вестибулярной устойчивости, произвольному расслаблению мышц).

30 слайд

Описание слайда:

Каждая классификация – это своеобразные ориентиры для выбора (или создания) того типа тестов, которые в большей мере соответствуют задачам тестирования.

31 слайд

Описание слайда:

КРИТЕРИИ ДОБРОТНОСТИ ДВИГАТЕЛЬНЫХ ТЕСТОВ понятие «двигательный тест» отвечает своему назначению тогда, когда тест удовлетворяет соответствующим основным критериям: надежности, стабильности, эквивалентности, объективности, информативности (валидности), а также дополнительным критериям: нормированию, сопоставляемости и экономичности. Тесты, удовлетворяющие требованиям надежности и информативности, называют добротными, или аутентичными (достоверными).

32 слайд

Описание слайда:

Под надежностью теста понимают степень точности, с которой он оценивает определенную двигательную способность независимо от требований того, кто ее оценивает. Надежность проявляется в степени совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях; это стабильность или устойчивость результата теста индивида при повторном проведении контрольного упражнения. Другими словами, ребенок в группе обследуемых по результатам повторных тестирований (например, показа­телей прыжков, времени бега, дальности метания) устойчиво сохраняет свое ранговое место. Надежность теста определяется с помощью корреляционно-статистического анализа путем расчета коэффициента надежности. При этом используют различные способы, на основании которых судят о надежности теста.

33 слайд

Описание слайда:

Стабильность теста основывается на зависимости между первой и второй попытками, повторенными через определенное время в одинаковых условиях одним и тем же экспериментатором. Способ повторного тестирования на определение надежности называется ретестом. Стабильность теста зависит от вида теста, возраста и пола испытуемых, временного интервала между тестом и ретестом. Например, показатели кондиционных тестов или морфологических признаков при небольших временных интервалах более стабильны, чем результаты координационных тестов; у более старших детей - результаты стабильнее, чем у более младших. Ретест обычно проводится не позднее, чем через неделю. При более длительных интервалах (например, через месяц) стабильность даже таких тестов, как бег на 1000 м или прыжок в длину с места, становится уже заметно ниже.

34 слайд

Описание слайда:

Эквивалентность теста Эквивалентность теста заключается в корреляции результата теста с результатами других однотипных тестов. Например, когда надо выбрать, какой тест более адекватно отражает скоростные способности: бег на 30, 50, 60 или 100 м. Отношение к эквивалентным (гомогенным) тестам зависит от многих причин. Если надо повысить надежность оценок или выводов исследования, тогда целесообразно использовать два и больше эквивалентных теста. А если стоит задача создать батарею, содержащую минимум тестов, тогда следует применять только один из эквивалентных тестов. Такая батарея, как отмечалось, является гетерогенной, так как входящие в нее тесты измеряют разные двигательные способности. Примером гетерогенной батареи тестов является бег на 30 м, подтягивание на перекладине, наклон вперед, бег на 1000 м.

35 слайд

Описание слайда:

Надежность тестов определяют также по сопоставлению средних оценок четных и нечетных попыток, входящих в тест. Например, среднюю точность бросков в цель из 1, 3, 5, 7 и 9 попыток сравнивают со средней точностью бросков из 2, 4, 6, 8 и 10 попыток. Такой метод оценки надежности называется методом удвоения, или расщеплением. Он используется преимущественно при оценке координационных способностей и в том случае, если число попыток, образующих тестовый результат, не меньше шести.

36 слайд

Описание слайда:

Под объективностью (согласованностью) теста Под объективностью (согласованностью) теста понимают степень согласованности результатов, получаемых на одних и тех же испытуемых разными экспериментаторами (учителями, судьями, экспертами). Для повышения объективности тестирования необходимо соблюдение стандартных условий проведения теста: время тестирования, место, погодные условия; единое материальное и аппаратурное обеспечение; психофизиологические факторы (объем и интенсивность нагрузки, мотивация); подача информации (точная словесная постановка задачи теста, объяснение и демонстрация). Это так называемая объективность проведения теста. Говорят еще об интерпретационной объективности, касающейся степени независимости интерпретации результатов тестирования разными экспериментаторами.

37 слайд

Описание слайда:

В целом, как отмечают специалисты, надежность тестов можно повысить различными путями: более строгой стандартизацией тестирования, увеличением числа попыток, лучшей мотивацией испытуемых, увеличением числа оценщиков (судей, экспертов), повышением согласованности их мнений, увеличением числа эквивалентных тестов. Фиксированных значений показателей надежности теста не имеется. В большинстве случаев пользуются следующими рекомендациями: 0,95 - 0,99 - отличная надежность; 0,90 -- 0,94 -- хорошая; 0,80 -- 0,89 -- приемлемая; 0,70 - 0,79 - плохая; 0,60 - 0,69 - для индивидуальных оценок сомнительная, тест пригоден только для характеристики группы испытуемых.

38 слайд

Описание слайда:

Информативность теста это степень точности, с какой он измеряет оцениваемую двигательную способность или навык. В иностранной (и отечественной) литературе используют вместо слова «информативность» термин «валидность» (от англ. validity-обоснованность, действительность, законность). Фактически, говоря об информативности, исследователь отвечает на два вопроса: что измеряет данный конкретный тест (батарея тестов) и какова при этом степень точности измерения. Различают несколько видов валидности: логическую (содержательную), эмпирическую (на основании опытных данных) и предсказательную.

39 слайд

Описание слайда:

Важными дополнительными критериями тестов, как отмечалось, являются нормирование, сопоставляемостъ и экономичность. Суть нормирования состоит в том, что на основе результатов тестирования можно создать нормы, имеющие особое значение для практики. Сопоставляемостъ теста заключается в возможности сравнивать результаты, полученные по одному или нескольким формам параллельных (гомогенных) тестов. В практическом плане применение сопоставляемых моторных тестов снижает вероятность того, что в результате регулярного применения одного и того же теста оценивается не только и не столько уровень способности, сколько степень навыка. Одновременно сопоставляемые результаты тестов повышают достоверность выводов. Суть экономичности как критерия добротности теста состоит в том, что проведение теста не требует длительного времени, больших материальных затрат и участия многих помощников.

40 слайд

Описание слайда:

ОРГАНИЗАЦИЯ ТЕСТИРОВАНИЯ ПОДГОТОВЛЕННОСТИ ДЕТЕЙ ШКОЛЬНОГО ВОЗРАСТА Второй важной проблемой тестирования двигательных способностей (напомним, что первая - отбор информативных тестов, является организация их применения. Учитель физической культуры должен определить: в какие сроки лучше организовать тестирование, как осуществлять его на уроке и как часто следует проводить тестирование. Сроки тестирования согласуются со школьной программой, которая предусматривает обязательное двухразовое тестирование физической подготовленности учащихся.

41 слайд

Описание слайда:

Знание годичных изменений в развитии двигательных способностей детей позволяет учителю вносить соответствующие коррективы в процесс физической культуры на следующий учебный год. Однако учитель должен и может проводить более частое тестирование, вести так называемый оперативный контроль. Это целесообразно делать для того, чтобы определить, например, изменение уровня скоростных, силовых способностей и выносливости под влиянием уроков легкой атлетики в течение первой четверти. С этой целью учитель может применить тесты для оценки координационных способностей детей в начале и в конце освоения материала программы, например, по спортивным играм, для выявления изменения показателей развития этих способностей.

42 слайд

Описание слайда:

Следует учитывать, что разнообразие решаемых педагогических задач не позволяет предоставить учителю унифицированную методику тестирования, одинаковых правил проведения тестов и оценки результатов тестирования. Это требует от экспериментаторов (учителей) проявления самостоятельности в решении теоретико-методологических и организационных вопросов тестирования. Тестирование на уроке необходимо увязать с его содержанием. Другими словами, примененный тест или тесты при соблюдении соответствующих требований (как к методу исследования) должны органически входить в состав запланированных физических упражнений. Если, допустим, у детей требуется определить уровень развития скоростных способностей или выносливости, то необходимые тесты следует запланировать в ту часть урока, в которой будут решаться задачи развития соответствующих физических способностей.

43 слайд

Описание слайда:

Частота проведения тестирования во многом определяется темпами развития конкретных физических способностей, возрастно-половыми и индивидуальными особенностями их развития. Например, чтобы добиться существенного прироста быстроты, выносливости или силы, требуется несколько месяцев регулярных занятий (тренировок). В то же время для того, чтобы получить достоверный прирост гибкости или отдельных координационных способностей, требуется всего 4-12 тренировок. Достичь улучшения физического качества, если начинать «с нуля», можно и за более короткий срок. А для того, чтобы улучшить это же качество, когда оно у ребенка высокого уровня, требуется больше времени. В этой связи учитель должен глубже изучить особенности развития и совершенствования разных двигательных способностей у детей в разные возрастно-половые периоды.

44 слайд

Описание слайда:

При оценке общей физической подготовленности детей можно использовать самые разнообразные батареи тестов, выбор которых зависит от конкретных задач тестирования и наличия необходимых условий. Однако в связи с тем, что полученные результаты тестирования можно оценивать лишь путем сравнения, целесообразно выбирать тесты, которые широко представлены в теории и практике физического воспитания детей. Например, опираться на те, которые рекомендованы в программе по ФК. Для сравнения общего уровня физической подготовленности ученика или группы учащихся с помощью комплекса тестов прибегают к переводу результатов тестирования в очки или баллы. Изменение суммы очков при повторных тестированиях позволяет судить о прогрессе как отдельного ребенка, так и группы детей.

49 слайд

Описание слайда:

Важной стороной тестирования является проблема выбора теста для оценки конкретной физической способности и общей физической подготовленности.

50 слайд

Описание слайда:

Практические рекомендации и советы. ВАЖНО: Определить (выбрать) батарею (или совокупность) необходимых тестов с подробным изложением всех деталей их проведения; Установить сроки тестирования (лучше - 2-3 недели сентября - 1-е тестирование, 2-3 недели мая - 2-е тестирование); В соответствии с рекомендацией точно определить возраст детей на день тестирования и их пол; Разработать единые протоколы регистрации данных (возможно на основе использования ИКТ); Определить круг помощников и осуществить саму процедуру тестирования; Сразу провести математическую обработку данных тестирования - вычисление основных статистических параметров (средняя арифметическая, ошибка средней арифметической, стандартное отклонение, коэффициент вариации и оценки достоверности различий между средними арифметическими показателями, например параллель классов одной и той же и разных школ детей такого-то возраста и пола); Одним из значительных этапов работы может быть перевод результатов тестирования в очки или баллы. При регулярном тестировании (2 раза в год, в течение нескольких лет) это позволит учителю иметь представление о прогрессе результатов.

51 слайд

Описание слайда:

Москва «Просвещение» 2007 Книга содержит наиболее распространённые двигательные тесты по оценке кондиционных и координационных способностей учащихся. Пособие предусматривает индивидуальный подход учителя физической культуры к каждому конкретному ученику с учётом его возраста и телосложения.

Проблема тестирования физической подготовленности человека разработанных в теории и методике физического воспитания, спортивной метроло­гии, антропомоторике, биомеханике, спортивной медицине и других науках. За примерно 130-140 лет истории этой проблемы накоплен огромный и самый разнообразный материал, который всег­да вызывал и продолжает вызывать к себе боль­шой интерес не только со стороны научных работ­ников, но и учителей физической культуры, трене­ров, учащихся, их родителей.

Первая статья, посвященная рассматривае­мой проблеме, - вводная. В ней раскрываются основы теории тестов и тестирования, без озна­комления с которыми учителю трудно решать за­дачи применения тестов в практике своей рабо­ты. Назовём хотя бы некоторые из возникающих вопросов. Что такое «тест»? Какова классифика­ция тестов? Зачем и нужно ли проводить тестиро­вание физической подготовленности учащихся? Как определить уровень (высокий, средний, низ­кий) развития физических качеств и подготов­ленности? Что считать нормой при тестировании и как её устанавливать? Если учитель придумал новый двигательный тест или батарею тестов для определения физической подготовленности де­тей, то на что он должен обратить внимание или какие необходимые условия (требования, крите­рии) при этом выполнить? Тестирование физи­ческого состояния учащихся предполагает обя­зательное ознакомление учителя с элементар­ными методами математической статистики. С какими из них?

В наших статьях мы представим также истори­ческие сведения о возникновении тестов и тео­рии тестирования физической подготовленнос­ти человека. Скажем, когда и где появились пер­вые тесты, в том числе батареи тестов по оценке физической подготовленности. Каковы наиболее распространенные тесты для определения кон­диционных (силовых, скоростных, выносливос­ти, гибкости) и координационных способностей детей школьного возраста? Какие батареи (про­граммы) тестов для оценки физической подготовленности детей и подростков являются наиболее популярными в разных странах? Мы обсудим и такую важную практическую проблему, как со­отношение результатов тестирования и оценок (отметок) по предмету «Физическая культура». Говоря конкретнее, если ученик при выполнении тестов неизменно показывает высокий уровень, означает ли это автоматически отличную оценку по нашему предмету? И так далее.

В данной статье мы обсудим: 1) задачи тестиро­вания; 2) понятие «тест» и классификацию двига­тельных (моторных) тестов; 3) критерии добро­тности двигательных тестов; 4) организацию тестирования физической подготовленности де­тей школьного возраста.

1. Задачи тестирования. Тестирование дви­гательных возможностей человека является од­ним из наиболее важных направлений деятель­ности научных работников и педагогов в облас­ти физической культуры и спорта. Оно помога­ет решению ряда сложных педагогических за­дач по выявлению уровней развития кондици­онных и координационных способностей, оце­ниванию качества технической и тактической подготовленности. На основе результатов тес­тирования можно сравнивать подготовленность как отдельных учащихся, так и целых групп уче­ников, проживающих в разных регионах и стра­нах; проводить соответствующий отбор для за­нятий тем или иным видом спорта, для участия в соревнованиях; осуществлять достаточно объ­ективный контроль за обучением (тренировкой) школьников и юных спортсменов; выявлять пре­имущества и недостатки применяемых средств, методов обучения и форм организации занятий; наконец, обосновывать нормы (возрастные, ин­дивидуальные) физической подготовленности детей и подростков.



а) научить самих школьников определять уровень своей физической подготовленности и пла­нировать необходимые для себя комплексы фи­зических упражнений;

б) стимулировать учащихся к дальнейше­му улучшению своего физического состояния
(формы);

в) знать не столько исходный уровень разви­тия двигательной способности, сколько его из­менение за определённое время;

г) стимулировать учащихся, добившихся вы­соких результатов, но не столько за достигнутый высокий уровень физической подготовленнос­ти, сколько за реализацию запланированного повышения личных результатов.



Специалисты подчеркивают, что традицион­ный подход к тестированию, когда данные стандартизированных тестов и нормативов сравниваются с показанным результатом, вызывает у многих учеников, особенно с низким и средним уровнями физической подготовленности, нега­тивное отношение. Тестирование же должно способствовать повышению интереса у школь­ников, приносить им радость, а не вести к раз­витию комплекса неполноценности. В этой свя­зи предлагаем следующие подходы:

1) результаты тестов ученика определяют не исходя из сравнения с нормативами, а на осно­вании изменений, произошедших за определён­ный период времени;

2) все компоненты теста модифицируются, используются облегчённые варианты упражне­ний (задания, составляющие содержание теста, должны быть достаточно лёгкими, чтобы вероят­ность их успешного выполнения была велика);

3) нулевая оценка или со знаком «минус» ис­ключены, правомочно только получение поло­жительных результатов.

Итак, при тестировании важно сближение на­учных (теоретических) задач и лично значимых, положительных для школьника мотивов участия в данной процедуре.

2. Понятие «тест» и классификация двига­тельных (моторных) тестов. Термин тест в пе­реводе с английского языка означает проба, ис­пытание. Тесты применяются для решения мно­гих научных и практических задач. Среди спо­собов оценки физического состояния челове­ка (наблюдение, экспертные оценки) метод тес­тов (в нашем случае - двигательных, или мо­торных) является главным методом, используе­мым в спортивной метрологии и других научных дисциплинах - «учении о движениях», теории и методике физического воспитания.

Тест - это измерение или испытание, про­водимое для определения способностей или со­стояния человека. Таких измерений может быть очень много, в том числе на основе использо­вания самых разнообразных физических уп­ражнений. Однако далеко не каждое физичес­кое упражнение или испытание можно рассмат­ривать как тест. В качестве тестов следует ис­пользовать лишь те испытания (пробы), которые отвечают специальным требованиям и в соот­ветствии с которыми должны быть:

а) определена цель применения любого теста (или тестов);

б) разработаны стандартизированная методика измерения результатов в тестах и процедура тестирования;

в) определена надёжность и информатив­ность тестов;

г) реализована возможность представления результатов тестов в соответствующей систе­ме оценки.

Система использования тестов в связи с пос­тавленной задачей, организацией условий, выполнением тестов испытуемыми, оценка и ана­лиз результатов называется тестированием. Полученное в ходе измерений числовое зна­чение - результатом тестирования (теста).

Например, прыжок в длину с места - это тест; процедура проведения прыжков и измерение результатов - тестирование; длина прыжка - результат теста.

В основе тестов, используемых в физичес­ком воспитании, лежат двигательные действия (физические упражнения, двигательные зада­ния). Такие тесты называются двигательными, или моторными.

В настоящее время еще не существует единой классификации двигательных тестов. Известна классификация тестов по их структуре и преиму­щественным показаниям (см. таблицу 1).

Различают единичный и комплексный тесты. Единичный тест служит для измерения и оцен­ки одного признака(координационной или кон­диционной способности). Поскольку структура каждой координационной или кондиционной способности является сложной, то с помощью такого теста оценивается обычно только один компонент данной способности (например, спо­собность к равновесию, быстрота простой ре­акции, сила мышц рук).

С помощью учебного теста оценивают способ­ность к двигательному обучению (по разности окончательной и начальной оценок за опреде­ленный период обучения технике движений).

Тестовая серия даёт возможность один и тот же тест использовать в течение длительного времени, когда измеряемая способность сущес­твенно улучшается. При этом задачи теста по своей трудности последовательно повышаются. К сожалению, данную разновидность единично­го теста пока недостаточно широко используют как в науке, так и на практике.

С помощью комплексного теста оцени­вают несколько признаков или компонентов разных способностей или одной и той же спо­собности (например, прыжок вверх с места - со взмахом рук, без взмаха рук, на заданную высоту). На основании такого теста можно получить информацию об уровне скоростно-силовых способностей (по высоте прыжка), координационных способностей (по точнос­ти дифференцирования силовых усилий, по разности высоты прыжка со взмахом и без взмаха рук).

Тестовый профиль состоит из нескольких от­дельных тестов, на основании которых оцени­вают или несколько различных физических спо­собностей (гетерогенный тестовый профиль), или несколько проявлений одной и той же фи­зической способности (гомогенный тестовый профиль). Результаты теста могут быть пред­ставлены в форме профиля, что даёт возможность

Формы тестов и возможности их применения (по Д.-Д.Блюме, 1987)


Таблица 1


Тип Измеряемая способность Признак структуры Пример
Единичный тест
Элементарный тест, содержащий одну двигательную задачу Одна задача теста, одна окончательная оценка теста Тест на равновесие, тре-мометрия, тест для оцен­ки способности к соеди­нению, тест на оценку ритма, прыжок на точ­ность приземления
Учебный тест Одна способность или аспект (компонент) способности Одна или несколько за­дач теста. Одна оконча­тельная оценка теста (педагогический период) Общий учебный тест
Тестовая серия Одна способность или ас­пект (компонент) способ­ности Одна задача тестов с ва­риантами или несколь­ко задач повышающейся трудности Тест для оценки способ­ности к соединению (связи)
Комплексный тест
Комплексный тест, содер­жащий одну задачу Несколько способностей или аспектов (компонен­тов) одной способности Одна задача теста, не­сколько окончательных оценок Прыжковый тест
Тест многоразовых задач Несколько тестовых за­дач, выполняющихся пос­ледовательно, несколько окончательных оценок Тест многоразовых реакций
Тестовый профиль Несколько способностей или аспектов одной спо­собности Несколько тестов, несколько окончательных оценок Координационная звезда
Тестовая батарея Несколько способностей или аспектов одной спо­собности Несколько тестов, одна тестовая оценка Тестовая батарея для оценки способности обучаться движениям

быстро сравнить индивидуальные и груп­повые результаты.

Тестовая батарея состоит также из несколь­ких отдельных тестов, результаты которых сво­дятся в одну окончательную оценку, рассмат­риваемую в одной из оценочных шкал (подроб­нее об этом во второй статье). Как и в тестовом профиле, здесь различают гомогенную и гете­рогенную батареи.

Гомогенная батарея, или гомогенный про­филь находят применение в оценке всех ком­понентов комплексной способности (например, способности к реагированию). При этом резуль­таты отдельных тестов должны быть тесно вза­имосвязаны (коррелировать).

Гетерогенный тестовый профиль или гетеро­генная батарея служат оценке комплекса (сово­купности) различных двигательных способнос­тей. Например, такие батареи тестов использу­ют для оценки силовых, скоростных способнос­тей и способностей к выносливости - это бата­реи тестов физической подготовленности.

В тестах многоразовых задач испытуемые последовательно выполняют двигательные за­дания и за каждое решение двигательной задачи получают отдельные оценки. Эти оцен­ки могут состоять в тесной связи друг с дру­гом. Посредством соответствующих статисти­ческих расчетов можно получить дополнитель­ную информацию об оцениваемых способнос­тях. Примером могут служить последователь­но выполняемые задания прыжкового теста (таблица 2).

В определении двигательных тестов указы­вается, что они служат оценке двигательных способностей и частично моторных навыков. Поэтому в самом общем виде выделяют конди­ционные тесты, координационные тесты и тес­ты для оценки двигательных умений и навыков (техники движений). Такая систематизация яв­ляется, однако, ещё слишком общей.

Классификация двигательных тестов по пре­имущественным их показаниям вытекает из сис­тематизации физических (двигательных) способ­ностей. В этой связи различают кондиционные тесты (для оценки силы: максимальной, скоро­стной, силовой выносливости; для оценки вы­носливости; для оценки скоростных способнос­тей; для оценки гибкости: активной и пассивной) и координационные тесты (для оценки коор

динационных способностей, относящихся к от­дельным самостоятельным группам двигатель­ных действий, которые измеряют специальные координационные способности; для оценки специфических координационных способностей - способностей к равновесию, ориентированию в пространстве, реагированию, дифференци­рованию параметров движений, ритму, перестроению двигательных действий, согласова­нию (связи), вестибулярной устойчивости, произвольному расслаблению мышц.

Разработано большое число тестов для оцен­ки двигательных навыков в разных видах спор­та. Они приведены в соответствующих учебни­ках и пособиях и в настоящей статье не рассматриваются.

Таким образом, каждая классификация слу­жит своеобразным ориентиром для выбора (или создания) того типа тестов, который в большей мере соответствует задачам тестирования.

3. Критерии добротности двигательных тестов. Как отмечалось выше, понятие «двигательный тест» отвечает своему назначению, если тест удовлетворяет соответствующим основным критериям: надежности, стабильнос­ти, эквивалентности, объективности, информативности, а также дополнительным критери­ям: нормированию, сопоставляемости и эко­номичности.

Тесты, удовлетворяющие требованиям надёж­ности и информативности, называют добротны­ми или аутентичными (достоверными).

Под надёжностью теста понимают степень точности, с которой он оценивает определён­ную двигательную способность независимо от требований того, кто её оценивает. Надёжность проявляется в степени совпадения результа­тов при повторном тестировании одних и тех же людей в одинаковых условиях; это стабиль­ность или устойчивость результата теста инди­вида при повторном выполнении контрольно­го упражнения. Другими словами, школьник в группе обследуемых по результатам повторных тестирований (например, показателям прыж­ков, времени бега, дальности метания) устой­чиво сохраняет своё ранговое место.

Надёжность теста определяется с помощью корреляционно-статистического анализа путем расчёта коэффициента надёжности. При этом используют различные способы, на основании которых судят о надёжности теста.

Стабильность теста основывается на зависи­мости между первой и второй попытками, пов­торенными через определённое время в одина­ковых условиях одним и тем же эксперимента­тором. Способ повторного тестирования на оп­ределение надёжности называется ретестом. Стабильность теста зависит от вида теста, воз­раста и пола испытуемых, временного интерва­ла между тестом и ретестом. Например, показа­тели кондиционных тестов или морфологических признаков при небольших временных интерва­лах более стабильны, чем результаты координационных тестов; у более старших школьников - результаты стабильнее, чем у более младших. Ретест обычно проводят не позднее, чем через одну неделю. При более длительных интервалах (например, через месяц) стабильность даже та­ких тестов, как бег на 1000 м или прыжок в дли­ну с места, становится уже заметно ниже.

Эквивалентность теста заключается в корре­ляции результата теста с результатами других однотипных тестов. Например, критерий эквива­лентности применяют, когда надо выбрать, ка­кой тест более адекватно отражает скоростные способности: бег на 30, 50, 60 или 100 м.

То или иное отношение к эквивалентным (го­могенным) тестам зависит от многих причин. Если надо повысить надёжность оценок или выводов исследования, тогда целесообразно использовать два и более эквивалентных тес­та. А если стоит задача создать батарею, содержащую минимум тестов, то следует исполь­зовать только один из эквивалентных тестов.


Таблица 2 Последовательно выполняемые задания прыжкового теста (по Д.-Д.Блюме, 1987)

№№ п/п Задача теста Оценка результата Способность
Прыжок на максимальную высоту без взмаха рук Высота, см Прыжковая сила
Прыжок на максимальную высоту со взмахом рук Высота, см Прыжковая сила и способность к соединению (связи)
Прыжок на максимальную высоту со взмахом рук и подскоком Высота, см Способность к соединению (связи) и прыжковая сила
10 прыжков со взмахом рук на рас­стояние, равное 2/3 от максималь­ной высоты прыжка, как в задаче 2 Сумма отклонений от задан­ной отметки Способность к дифференци­рованию силовых параметров движений
Разность между результатами реше­ний одной задачи и двух задач ... см Способность к соединению (связи)

Такая батарея, как отмечалось, является ге­терогенной, поскольку входящие в неё тесты измеряют разные двигательные способности. Примером гетерогенной батареи тестов явля­ются бег на 30 м, подтягивание на переклади­не, наклон вперед, бег на 1000 м. Другие при­меры подобных комплексов будут представле­ны в отдельной публикации.

Надёжность тестов определяют также по со­поставлению средних оценок чётных и нечёт­ных попыток, входящих в тест. Например, сред­нюю точность бросков мяча в цель из 1, 3, 5, 7 и 9 попыток сравнивают со средней точнос­тью бросков из 2, 4, 6, 8 и 10 попыток. Такой метод оценки надёжности называется мето­дом удвоения, или расщеплением, и применя­ется он преимущественно при оценке коорди­национных способностей и в том случае, если число попыток, образующих тестовый резуль­тат, не менее шести.

Под объективностью (согласованностью) тес­та понимают степень согласованности резуль­татов, получаемых на одних и тех же испытуе­мых разными экспериментаторами (учителями, судьями, экспертами).

а) время тестирования, место, погодные условия;

б) единое материальное и аппаратурное обеспечение;

в) психофизиологические факторы (объем и интенсивность нагрузки, мотивация);

г) подача информации (точная словесная постановка задачи теста, объяснение и демонстрация).

Соблюдение данных условий создаёт так на­зываемую объективность проведения теста. Говорят ещё об интерпретационной объектив­ности, касающейся степени независимости интерпретации результатов тестирования разны­ми экспериментаторами.

В целом, как отмечают специалисты, надёж­ность тестов можно повысить различными пу­тями: более строгой стандартизацией тестиро­вания (см. выше), увеличением числа попыток, лучшей мотивацией испытуемых, увеличением числа оценщиков (судей, экспертов), повыше­нием согласованности их мнений, увеличени­ем числа эквивалентных тестов.

Фиксированных значений показателей надёж­ности теста не имеется. В большинстве случаев пользуются следующими рекомендациями: 0,95-0,99 - отличная надёжность; 0,90-0,94 - хорошая; 0,80-0,89 - приемлемая; 0,70-0,79 - плохая; 0,60-0,69 - для индивидуальных оце­нок сомнительная, тест пригоден только для ха­рактеристики группы испытуемых. Информативность теста - это степень точ­ности, с какой он измеряет оцениваемую двига­тельную способность или навык. В иностранной и отечественной литературе используют вместо слова «информативность» термин «валидность» (от англ. validity - обоснованность, действи­тельность, законность). Фактически, примени­тельно к информативности, исследователь от­вечает на два вопроса: что измеряет данный конкретный тест (батарея тестов) и какова при этом степень точности измерения.

Различают валидность логическую (содержа­тельную), эмпирическую (на основании опыт­ных данных) и предсказательную. Более под­робная информация на эту тему содержится в ставших уже классическими учебниках для сту­дентов физкультурных вузов (Спортивная метро­логия / Под ред. В.М.Зациорского. - М.: ФиС, 1982. - С. 73-80; Годик М.А. Спортивная мет­рология.- М.: ФиС, 1988), а также в ряде сов­ременных пособий.

Важными дополнительными критериями тес­тов, как отмечалось, являются нормирование, сопоставляемость и экономичность.

Суть нормирования состоит в том, что на ос­нове результатов тестирования можно создать нормы, имеющие особое значение для практики (об этом речь пойдёт в отдельной статье).

Сопоставляемость теста заключается в воз­можности сравнивать результаты, полученные по одному тесту или нескольким формам парал­лельных (гомогенных) тестов. В практическом плане применение сопоставляемых моторных тестов снижает вероятность того, что в резуль­тате регулярного применения одного и того же теста оценивается не только и не столько уро­вень способности, сколько степень навыка. Одновременно сопоставляемые результаты тес­тов повышают достоверность выводов.

Суть экономичности как критерия добротнос­ти теста состоит в том, что проведение теста не требует длительного времени, больших матери­альных затрат и участия многих помощников. Например, батарею из шести тестов для опре­деления физической подготовленности, рекомендованную в «Комплексной программе фи­зического воспитания учащихся I-XI классов» (М.: Просвещение, 2005-2006), учитель с дву­мя помощниками может провести за один урок, обследовав 25-30 детей.

Организация тестирования физичес­кой подготовленности детей школьного воз­раста.Второй важной проблемой тестирова­ния двигательных способностей (напомним, что первая - отбор информативных тестов - рассмотрена ранее) является организация их применения.

Учитель физической культуры должен опре­делить: в какие сроки лучше организовать тестирование, как осуществлять его на уроке и как часто следует проводить тестирование.

Срони тестирования устанавливают в соответс­твии со школьной программой, которая предусматривает обязательное двухразовое тестиро­вание физической подготовленности учащихся. Первое тестирование целесообразно проводить во вторую-третью неделю сентября (после того как учебный процесс войдёт в нормальное русло), а второе - за две недели до окончания учебного года (в более поздние сроки могут иметь место ор­ганизационные трудности, вызванные приближа­ющимися экзаменами и каникулами).

Знание годичных изменений в развитии дви­гательных способностей школьников позволяет учителю вносить соответствующие коррективы в процесс физического воспитания на следую­щий учебный год. Однако учитель может и дол­жен проводить более частое тестирование, осу­ществлять так называемый оперативный конт­роль. Данную процедуру целесообразно выпол­нять, например, для того, чтобы определить из­менение уровня скоростных, силовых способ­ностей и выносливости под влиянием уроков лёгкой атлетики в течение I четверти и т.п. С этой целью учитель может применить тесты для оценки координационных способностей детей в начале и в конце освоения учебного матери­ала школьной программы, например, по спор­тивным играм, для выявления изменения пока­зателей развития этих способностей.

Следует учитывать, что разнообразие решае­мых педагогических задач не даёт возможнос­ти предоставить учителю унифицированную ме­тодику тестирования, одинаковых правил про­ведения тестов и оценки результатов тестиро­вания. Это требует от экспериментаторов (учи­телей) проявления самостоятельности в реше­нии теоретико-методологических и организаци­онных вопросов тестирования.

Тестирование на уроке необходимо увя­зать с его содержанием. Другими словами, при­менённый тест (или тесты) при соблюдении со­ответствующих требований к нему как к мето­ду исследования должен (должны) органически входить в состав запланированных физических упражнений. Если, допустим, у школьников тре­буется определить уровень развития скоростных способностей или выносливости, то необходи­мые тесты следует запланировать в ту часть уро­ка, в которой будут решаться задачи развития соответствующих физических способностей.

Частота проведения тестирования во многом определяется темпами развития конкретных физических способностей, возрастно-половыми и индивидуальными особенностями их развития.

Например, чтобы добиться существенного при­роста быстроты, выносливости или силы, требует­ся несколько месяцев регулярных занятий (тренировок). В то же время, чтобы получить достовер­ный прирост гибкости или отдельных координаци­онных способностей, требуется всего 4-12 трени­ровок. Достичь улучшения того или иного физи­ческого качества, если начинать «с нуля», можно и за более короткий срок. А вот чтобы улучшить это же качество, когда оно у школьника достига­ет высокого уровня, требуется больше времени. В данной связи учитель должен глубже изучить осо­бенности развития и совершенствования различ­ных двигательных способностей у детей в разные возрастнополовые периоды.

При оценке общей физической подготовлен­ности учащихся, как отмечалось, можно исполь­зовать самые разнообразные батареи тестов, выбор которых зависит от конкретных задач тестирования и наличия необходимых условий. Однако в связи с тем, что полученные результа­ты тестирования можно оценивать лишь путем сравнения, целесообразно выбирать тесты, ко­торые широко представлены в теории и практике физического воспитания детей. Например, опи­раться на те из них, которые рекомендованы в «Комплексной программе физического воспита­ния учащихся I-XI классов общеобразовательной школы» (М.: Просвещение, 2004-2006).

Для сравнения общего уровня физической подготовленности ученика или группы учащихся с помощью комплекса тестов прибегают к пере­воду результатов тестирования в очки или бал­лы (об этом подробнее поговорим в очередной статье). Изменение суммы очков при повторных тестированиях позволяет судить о прогрессе как отдельного ребенка, так и группы детей.

Физическая культура в школе,2007,№6


Введение

Актуальность. Проблема тестирования физической подготовленности человека - одна из наиболее разработанных в теории и методике физического воспитания. За последние десятилетия накоплен огромный и самый разнообразный материал: определение задач тестирования; обусловленность результатов тестирования разными факторами; разработка тестов для оценки отдельных кондиционных и координационных способностей; программы тестов, характеризующие физическую подготовленность детей и подростков от 11 до 15 лет, принятые в Российской Федерации, в других странах СНГ и во многих зарубежных странах.

Тестирование двигательных качеств школьников является одним из наиболее важных и основных методов педагогического контроля.

Оно помогает решению ряда сложных педагогических задач: выявлять уровни развития кондиционных и координационных способностей, оценивать качество технической и тактической подготовленности. На основе результатов тестирования можно:

сравнивать подготовленность как отдельных учащихся, так и целых групп, проживающих в разных регионах и странах;

проводить спортивный отбор для занятий тем или иным видом спорта, для участия в соревнованиях;

осуществлять в значительной степени объективный контроль за обучением (тренировкой) школьников и юных спортсменов;

выявлять преимущество и недостатки применяемых средств, методов обучения и форм организации занятий;

наконец, обосновывать нормы (возрастные, индивидуальные) физической подготовленности детей и подростков.

Наряду с научными задачами в практике разных стран задачи тестирования сводятся к следующему:

научить самих школьников определять уровень своей физической подготовленности и планировать необходимые для себя комплексы физических упражнений;

стимулировать учащихся к дальнейшему повышению своего физического состояния (формы);

знать не столько исходный уровень развития двигательной способности, сколько его изменение за определенное время;

стимулировать учащихся, добившихся высоких результатов, но не столько за высокий уровень, сколько за запланированное повышение личных результатов.

В данной работе мы будем опираться на те тесты, которые рекомендованы в «Комплексной программе физического воспитания учащихся 1 -- 11 классов общеобразовательной школы» подготовленные В.И. Ляхом и Г.Б. Мейксоном.

Цель исследования: обосновать методику тестирования физических качеств учащихся основной школы.

Гипотеза исследования: использование тестирования является точным, информативным методом определения развития физических качеств.

Объект исследования: тестирование как метод педагогического контроля.

Предмет исследования: тестирование качеств учащихся.


Глава 1. ПРЕДСТАВЛЕНИЯ О ТЕОРИИ ТЕСТОВ ФИЗИЧЕСКОЙ ПОДГОТОВЛЕННОСТИ

1.1 Краткие исторические сведения о теории тестирования двигательных способностей

Измерениями двигательных достижений человека люди интересуются с давних пор. Первые сведения об измерении расстояния, на которое совершали прыжки в длину, относятся к 664 г. до н. э. На XXIX Олимпийских играх древности в Олимпии Хионис из Спарты прыгнул на расстояние в 52 стопы, что равно примерно 16,66 м. Ясно, что здесь идет речь о неоднократном прыжке.

Известно, что один из родоначальников физического воспитания -- Гутс-Мутс (J. Ch. F. Guts-Muts, 1759--1839) измерял моторные достижения своих учеников и осуществлял точные записи их результатов. А за улучшение достижений награждал их «премиями» -- дубовыми венками (G. Sorm, 1977). В тридцатые годы XIX в. Эйселен (Е. Eiselen), сотрудник известного немецкого педагога Яна (F. L. Yahn), на основании выполненных измерений составил таблицу для определения достижений в прыжках. Как видно, она содержит три градации (табл. 1).

Таблица 1. - Результаты в прыжках (в см) мужчин (источник: К. Mekota, P. Blahus, 1983)

начальный

Через козла


Заметим, что уже в середине XIX в. в Германии при определении длины или высоты прыжка рекомендовали учитывать параметры тела.

Точные измерения спортивных достижений, в том числе рекордных, ведутся с середины XIX в., а регулярно -- с 1896 г., с Олимпийских игр современности.

Достаточно давно люди пытаются измерить и силовые способности. Первая любопытная информация по этому поводу относится к 1741 г., когда, используя простые приборы, удалось измерить силу борца Томаса Тофама. Он поднял вес, масса которого превышала 830 кг (G. Sorm, 1977). Силовые возможности учеников измеряли уже Гутс-Мутс и Ян, используя для этого простые силомеры. А вот первый динамометр, прародитель современного динамометра, сконструировал Райнигер во Франции в 1807 г. В практике физического воспитания учащихся гимназии в Париже его применил Ф. Аморос (F. Amoros) в 1821 г. В XIX в. для измерения силы использовали также поднимание туловища в висе на перекладине, сгибание и разгибание рук в упоре, поднимание тяжестей.

Предвестниками современных батарей тестов для определения физической подготовленности являются спортивно-гимнастические многоборья. В качестве первого выделяют античное пятиборье, введенное в практику на XVIII Олимпийских играх древности в 708 г. до н. э. В его состав входило метание диска, копья, прыжок, бег и борьба. Десятиборье, которое мы знаем, впервые было включено в программу соревнований на III Олимпийских играх (Сент-Луис, США, 1904), а современное пятиборье -- на V Олимпийских играх (Стокгольм, Швеция, 1912). Состав упражнений в этих конкуренциях гетерогенен; спортсмену нужно проявить подготовленность в разных дисциплинах. Итак, он должен быть разносторонне физически подготовлен.

Вероятно, с учетом этой идеи примерно в эти же сроки (начало XX в.) для детей, молодежи и взрослых ввели в практику комплексы упражнений, всесторонне определяющие физическую подготовленность человека. Впервые такие комплексные испытания были введены в Швеции (1906), затем в Германии (1913) и еще позднее -- в Австрии и СССР (России) -- комплекс «Готов к труду и обороне» (1931).

Предшественники современных двигательных тестов возникли в конце XIX -- начале XX в. В частности, Д. Саржент (D. A. Sargent) ввел в практику Гарвардского университета «силовой тест», который, кроме динамометрии и спирометрии, включал в себя отжимание рук в упоре, поднимание и опускание туловища. Уже с 1890 г. этот тест стал использоваться в 15 университетах США. Француз Г.Хеберт (G. Hebert) создал тест, публикация о котором появилась в 1911 г. В его состав входит 12 двигательных заданий: бег на разные дистанции, прыжок с места и с разбега, бросок, многократное поднимание 40-килограммового снаряда (веса), плавание и ныряние.

Кратко остановимся еще на источниках информации, в которых рассматриваются результаты научных исследований врачей и психологов. Исследования врачей вплоть до конца XIX в. были ориентированы чаще всего на изменение внешних морфологических данных, а также на идентификацию асимметрии. Используемая в этих целях антропометрия шла в ногу с применением динамометрии. Так, бельгийский врач А. Кветелет (A. Quetelet), проведя обширные исследования, в 1838 г. опубликовал работу, согласно которой средние результаты становой силы (позвоночника) 25-летних женщин и мужчин равны соответственно 53 и 82 кг. В 1884 г. итальянец А. Моссо (A. Mosso) исследовал мышечную выносливость. Для этого он применил эргограф, который позволил ему наблюдать развитие утомления при многократном сгибании пальца.

Современная эргометрия берет свое начало с 1707 г. Тогда уже был создан прибор, позволявший измерить пульс в минуту. Прототип сегодняшнего эргометра сконструировал Хирн (G. A. Him) в 1858 г. Циклоэргометры и беговые дорожки были созданы позднее, в 1889--1913 гг.

В конце XIX -- начале XX в. начинаются систематические исследования психологов. Изучается время реакции, разрабатываются тесты для определения координации движений и ритма. Понятие «время реакции» ввел в науку австрийский физиолог С. Экс-нер (S. Ехпег) в 1873 г. Ученики основателя экспериментальной психологии В. Вундта (W. Wundt) в созданной в 1879 г. лаборатории в Лейпциге провели обширные измерения времени простой и сложной реакций. Первые испытания координации движений включали в себя теппинг и разные виды прицеливания. Одной из первых попыток изучения прицеливания является тест X. Френкеля (Н. S. Frenkel), предложенный им в 1900 г. Суть его состояла в том, чтобы удерживать указательный палец во всякого рода отверстиях, кольцах и т. п. Это прототип современных тестов «на статический и динамический тремор».

Пытаясь определить музыкальный талант, в 1915 г. Сишор (С. Е. Seashore) исследовал способность к ритму.

Теория тестирования ведет свой отсчет, однако, с конца XIX -- начала XX в. Именно тогда были заложены основы математической статистики, без которой современная теория тестов обойтись не может. На этом пути несомненные заслуги принадлежат генетику и антропологу Ф. Гальтону (F. Galton), математикам Пирсону (Pearson) и У. Йоле (U. Youle), математику-психологу Спирмену (С. Spearman). Именно эти ученые создали новую ветвь биологии -- биометрию, в основе которой измерения и статистические методы, такие, как корреляция, регрессия и др. Созданный Пирсоном (1901) и Спирменом (1904) сложный математико-статический метод -- факторный анализ -- позволил английскому ученому Барту (С. Burt) применить его в 1925 г. к анализу результатов моторных тестов учащихся лондонских школ. В результате были идентифицированы такие физические способности, как сила, быстрота, ловкость и выносливость. Выделился также фактор, названный «общая физическая подготовленность». Несколько позднее вышла в свет одна из наиболее известных работ американского ученого Мак Клоя (С.Н.McCloy, 1934)-- «Измерение общих двигательных способностей». К началу 40-х гг. ученые приходят к выводу о сложной структуре двигательных способностей человека. Используя разные моторные тесты в сочетании с применением параллельно разрабатываемых математических моделей (одно- и многофакторный анализ), в теорию тестирования прочно вошли понятия о пяти двигательных способностях: силе, быстроте, координации движений, выносливости и гибкости.

Двигательные тесты в бывшем СССР были использованы для разработки контрольных нормативов комплекса «Готов к труду и обороне» (1931). Известен тест двигательных способностей (главным образом координации движений), который для детей и молодежи предложил Н. И. Озерецкий (1923). Работы по измерению двигательных способностей детей, молодежи примерно в эти же сроки появились в Германии, Польше, Чехословакии и других странах.

Значительные успехи в развитии теории тестирования физической подготовленности человека приходятся на конец 50-х и 60-е гг. XX в. Основоположником этой теории, вероятнее всего, является американец Мак Клой, выпустивший в соавторстве с М. Юнгом (М. D. Young) в 1954 г. монографию «Тесты и измерение в здравоохранении и физическом воспитании», на которую впоследствии опирались многие авторы подобных работ.

Большое теоретическое значение имела и до сих пор имеет книга «Структура и измерение физических способностей» известного американского исследователя Е.А. Флейшмана (1964). В книге не только отражены теоретические и методологические вопросы проблемы тестирования данных способностей, но и изложены конкретные результаты, варианты подходов, исследования надежности, информативности (валидности) тестов, а также представлен важный фактический материал по факторной структуре двигательных тестов различных двигательных способностей.

Большое значение для теории тестирования физических способностей имеют книги В.М. Зациорского «Физические качества спортсмена» (1966) и «Кибернетика, математика, спорт» (1969).

Краткие исторические сведения по тестированию физической подготовленности в бывшем СССР можно найти в публикациях Е.Я. Бондаревского, В. В. Кудрявцева, Ю.И. Сбруева, В.Г. Панаева, Б.Г. Фадеева, П.А. Виноградова и др.

Условно можно выделить три этапа тестирования в СССР (России):

1-й этап -- 1920--1940 гг.-- период массовых обследований с целью изучения основных показателей физического развития и уровня двигательной подготовленности, появление на этой основе нормативов комплекса «Готов к труду и обороне».

2-й этап -- 1946--1960 гг.-- изучение двигательной подготовленности в зависимости от морфофункциональных особенностей с целью создания предпосылок для научно-теоретического обоснования их взаимосвязи.

3-й этап -- с 1961 г. по настоящее время -- период комплексных исследований физического состояния населения в зависимости от климатогеографических особенностей регионов страны.

Исследования, выполненные в этот период, показывают, что показатели физического развития и двигательной подготовленности людей, проживающих в различных регионах страны, обусловлены влиянием биологических, климатогеографических, социально-экономических и других как постоянных, так и переменных факторов. По разработанной единой комплексной программе, состоящей из четырех разделов (физическая подготовленность, физическое развитие, функциональное состояние основных систем организма, социологическая информация), в 1981 г. было проведено комплексное обследование физического состояния населения разного возраста и пола различных регионов СССР.

Несколько позже наши специалисты отметили, что уже более 100 лет изучается уровень физического развития и подготовленности человека. Однако, несмотря на относительно большое число работ в этом направлении, провести глубокий и всесторонний анализ полученных данных не представляется возможным, так как исследования проводились с различными контингентами, в разные сезонные периоды, с использованием различных методик, программ тестирования и математико-статистической обработки полученной информации.

В этой связи основной упор был сделан на разработку методологии и организации унифицированной системы сбора данных с учетом метрологических и методических требований и создание банка данных на ЭВМ.

В середине 80-х гг. прошлого века было проведено массовое всесоюзное обследование около 200000 человек от 6 до 60 лет, которое подтвердило выводы предыдущего исследования.

С самого начала возникновения научных подходов к тестированию физической подготовленности человека исследователи стремились получить ответы на два основных вопроса:

какие тесты должны быть отобраны для оценки уровня развития конкретной двигательной (физической) способности и уровня физической подготовленности детей, подростков и взрослых;

сколько нужно тестов, чтобы получить минимальную и вместе с тем достаточную информацию о физическом состоянии человека?

Единых представлений в мире по этим вопросам пока не выработано. Вместе с тем представления о программах (батареях) тестов, характеризующих физическую подготовленность детей и подростков от 6 до 17 лет, принятые в разных странах, все более сближаются.

1.2 Понятие «тест» и классификация двигательных (моторных) тестов

Термин тест в переводе с английского языка означает «проба, испытание».

Тесты применяются для решения многих научных и практических задач. Среди других способов оценки физического состояния человека (наблюдение, экспертные оценки) метод тестов (в нашем случае -- двигательных или моторных) является главным методом, используемым в спортивной метрологии и других научных дисциплинах («учении о движениях», теории и методике физического воспитания).

Тест -- это измерение или испытание, проводимое для определения способностей или состояния человека. Таких измерений может быть очень много, в том числе на основе использования самых разнообразных физических упражнений. Однако далеко не каждое физическое упражнение или испытание можно рассматривать как тест. В качестве тестов могут использоваться лишь те испытания (пробы), которые отвечают специальным требованиям:

должна быть определена цель применения любого теста (или тестов);

следует разработать стандартизированную методику измерения результатов в тестах и процедуру тестирования;

необходимо определить надежность и информативность тестов;

результаты тестов могут быть представлены в соответствующей системе оценки.

Система использования тестов в соответствии с поставленной задачей, организацией условий, выполнением тестов испытуемыми, оценка и анализ результатов называются тестированием, а полученное в ходе измерений числовое значение -- результатом тестирования (теста). Например, прыжок в длину с места -- это тест; процедура проведения прыжков и измерение результатов -- тестирование; длина прыжка -- результат теста.

В основе тестов, используемых в физическом воспитании, лежат двигательные действия (физические упражнения, двигательные задания). Такие тесты называются двигательными или моторными.

В настоящее время еще не существует единой классификации двигательных тестов. Известна классификация тестов по их структуре и по их преимущественным показаниям (табл. 2).

Как следует из таблицы, различают единичный и комплексный тесты. Единичный тест служит для измерения и оценки одного признака (координационной или кондиционной способности). Поскольку, как видим, структура каждой координационной или кондиционной способности является сложной, то с помощью такого теста оценивается, как правило, только один компонент такой способности (например, способность к равновесию, быстрота простой реакции, сила мышц рук).

Таблица 2. - Формы тестов и возможности их применения (по Д.Д. Блюме, 1987)

Измеряемая способность

Признак структуры

Единичный тест

Элементарный тест, содержащий одну двигательную задачу

Одна способность или аспект (компонент) способности

Одна задача теста, одна окончательная оценка теста

Тест на равновесие, тремометрия, тест для оценки способности к соединению, тест на оценку ритма

Учебный тест

Одна или несколько задач теста. Одна окончательная оценка теста

Общий учебный тест

Тестовая серия

Одна задача тестов с вариантами или несколько задач повышенной трудности

Тест для оценки способности к соединению (связи)

Комплексный тест

Комплексный тест, содержащий одну задачу

Несколько способностей или аспектов (компонентов) одной способности

Одна задача теста, несколько окончательных оценок

Прыжковый тест

Тест многоразовых задач

Несколько тестовых задач, выполняющихся последовательно, несколько окончательных оценок

Тест многоразовых реакций

Тестовый профиль

Несколько тестов, несколько окончательных оценок

Координационная задача

Тестовая батарея

Несколько тестов, одна тестовая оценка

Тестовая батарея для оценки способности обучаться движения


С помощью учебного теста оценивается способность к двигательному обучению (по разности окончательной и начальной оценок за определенный период обучения технике движений).

Тестовая серия дает возможность один и тот же тест использовать в течение длительного времени, когда измеряемая способность существенно улучшается. При этом задачи теста по своей трудности последовательно повышаются. К сожалению, эта разновидность теста пока недостаточно используется как в науке, так и на практике.

С помощью комплексного теста оценивается несколько признаков или компонентов разных или одной и той же способности, например прыжок вверх с места (со взмахом рук, без взмаха рук, на заданную высоту). На основании этого теста можно получить информацию об уровне скоростно-силовых способностей (по высоте прыжка), координационных способностей (по точности дифференцирования силовых усилий, по разности высоты прыжка со взмахом и без взмаха рук).

Тестовый профиль состоит из отдельных тестов, на основании которых оцениваются или несколько различных физических способностей (гетерогенный тестовый профиль), или разные проявления одной и той же физической способности (гомогенный тестовый профиль). Результаты теста могут быть представлены в форме профиля, что дает возможность сравнивать индивидуальные и групповые результаты.

Тестовая батарея состоит также из нескольких отдельных тестов, результаты которых сводятся в одну окончательную оценку, рассматриваемую в одной из оценочных шкал (см. главу 2). Как и в тестовом профиле, различают гомогенную и гетерогенную батареи. Гомогенная батарея, или гомогенный профиль, находит применение в оценке всех компонентов комплексной способности (например, способности к реакции). При этом результаты отдельных тестов должны быть тесно взаимосвязаны (должны коррелировать).

В тестах многоразовых задач испытуемые последовательно выполняют двигательные задания и за каждое решение двигательной задачи получают отдельные оценки. Эти оценки могут состоять в тесной связи друг с другом. Посредством соответствующих статистических расчетов можно получить дополнительную информацию об оцениваемых способностях. Примером могут служить последовательно решаемые задания прыжкового теста (табл. 3).

Таблица 3. - Последовательно решаемые задания прыжкового теста

Задача теста

Оценка результата

Способность

Максимальный прыжок без взмаха рук

Прыжковая сила

Максимальный прыжок вверх со взмахом рук

Прыжковая сила и способность к соединению (связи)

Максимальный прыжок вверх со взмахом рук и подскоком

Способность к соединению (связи) и прыжковая сила

10 прыжков со взмахом рук на расстояние, равное 2/3 от максимальной высоты прыжка, как в задаче 2

Сумма отклонений от заданной отметки

Способность к дифференцированию силовых параметров движений

Разность между результатами за решение одной задачи и двух задач

Способность к соединению (связи)

(по Д.Д. Блюме, 1987)

В определении двигательных тестов указывается, что они служат оценке двигательных способностей и частично моторных навыков. В самом общем виде выделяют кондиционные тесты, координационные тесты и тесты для оценки двигательных умений и навыков (техники движений). Такая систематизация является, однако, еще слишком общей. Классификация двигательных тестов по преимущественным их показаниям вытекает из систематизации физических (двигательных) способностей.

В этой связи различают:

1) кондиционные тесты:

для оценки силы: максимальной, скоростной, силовой выносливости;

для оценки выносливости;

для оценки скоростных способностей;

для оценки гибкости -- активной и пассивной;

2) координационные тесты:

для оценки координационных способностей, относящихся к отдельным самостоятельным группам двигательных действий, которые измеряют специальные координационные способности;

для оценки специфических координационных способностей -- способностей к равновесию, ориентированию в пространстве, реагированию, дифференцированию параметров движений, ритму, перестроению двигательных действий, согласованию (связи),

вестибулярной устойчивости, произвольному расслаблению мышц.

Понятие «тесты для оценки двигательных навыков» в настоящей работе не рассматриваются. Примеры тестов приведены в Приложении 2.

Таким образом, каждая классификация -- это своеобразные ориентиры для выбора (или создания) того типа тестов, которые в большей мере соответствуют задачам тестирования.

1.3 Критерии добротности двигательных тестов

Понятие «двигательный тест» отвечает своему назначению тогда, когда тест удовлетворяет соответствующим требованиям.

Тесты, удовлетворяющие требованиям надежности и информативности, называют добротными или аутентичными (достоверными).

Под надежностью теста понимают степень точности, с которой он оценивает определенную двигательную способность независимо от требований того, кто ее оценивает. Надежность проявляется в степени совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях; это стабильность или устойчивость результата теста индивида при повторном проведении контрольного упражнения. Другими словами, ребенок в группе обследуемых по результатам повторных тестирований (например, показателей прыжков, времени бега, дальности метания) устойчиво сохраняет свое ранговое место.

Надежность теста определяется с помощью корреляционно-статистического анализа путем расчета коэффициента надежности. При этом используют различные способы, на основании которых судят о надежности теста.

Стабильность теста основывается на зависимости между первой и второй попытками, повторенными через определенное время в одинаковых условиях одним и тем же экспериментатором. Способ повторного тестирования на определение надежности называется ретестом. Стабильность теста зависит от вида теста, возраста и пола испытуемых, временного интервала между тестом и ретестом. Например, показатели кондиционных тестов или морфологических признаков при небольших временных интервалах более стабильны, чем результаты координационных тестов; у более старших детей результаты стабильнее, чем у более младших. Ретест обычно проводится не позднее чем через неделю. При более длительных интервалах (например, через месяц) стабильность даже таких тестов, как бег на 1000 м или прыжок в длину с места, становится уже заметно ниже.

Эквивалентность теста заключается в корреляции результата теста с результатами других однотипных тестов (например, когда надо выбрать, какой тест более адекватно отражает скоростные способности: бег на 30, 50, 60 или 100 м).

Отношение к эквивалентным (гомогенным) тестам зависит от многих причин. Если надо повысить надежность оценок или выводов исследования, то целесообразно использовать два и больше эквивалентных теста. А если стоит задача создать батарею, содержащую минимум тестов, следует применять только один из эквивалентных тестов. Такая батарея, как отмечалось, является гетерогенной, так как входящие в нее тесты измеряют разные двигательные способности. Примером гетерогенной батареи тестов является бег на 30 м, подтягивание на перекладине, наклон вперед, бег на 1000 м.

Надежность тестов определяют также по сопоставлению средних оценок четных и нечетных попыток, входящих в тест. Например, среднюю точность бросков в цель из 1, 3, 5, 7 и 9 попыток сравнивают со средней точностью бросков из 2, 4, 6, 8 и 10 попыток. Такой метод оценки надежности называется методом удвоения или расщеплением. Он используется преимущественно при оценке координационных способностей и в том случае, если количество попыток, образующих тестовый результат, не меньше 6.

Под объективностью (согласованностью) теста понимают степень согласованности результатов, получаемых на одних и тех же испытуемых разными экспериментаторами (учителями, судьями, экспертами).

Для повышения объективности тестирования необходимо соблюдение стандартных условий проведения теста:

время тестирования, место, погодные условия;

единое материальное и аппаратурное обеспечение;

психофизиологические факторы (объем и интенсивность нагрузки, мотивация);

подача информации (точная словесная постановка задачи теста, объяснение и демонстрация).

Это так называемая объективность проведения теста. Говорят еще об интерпретационной объективности, касающейся степени независимости интерпретации результатов тестирования разными экспериментаторами.

В целом, как отмечают специалисты, надежность тестов можно повысить различными путями: более строгой стандартизацией тестирования (см. выше), увеличением числа попыток, лучшей мотивацией испытуемых, увеличением числа оценщиков (судей, экспертов), повышением согласованности их мнений, увеличением числа эквивалентных тестов.

Фиксированных значений показателей надежности теста не имеется. В большинстве случаев пользуются следующими рекомендациями: 0,95--0,99 -- отличная надежность; 0,90--0,94 -- хорошая; 0,80--0,89 -- приемлемая; 0,70--0,79 -- плохая; 0,60-- 0,69 -- для индивидуальных оценок сомнительная, тест пригоден только для характеристики группы испытуемых.

Информативность теста -- это степень точности, с какой он измеряет оцениваемую двигательную способность или навык. В иностранной (и отечественной) литературе используют вместо слова «информативность» термин «валидность» (от англ. validity -- обоснованность, действительность, законность). Фактически, говоря об информативности, исследователь отвечает на два вопроса: что измеряет данный конкретный тест (батарея тестов) и какова при этом степень точности измерения?

Различают несколько видов валидности: логическую (содержательную), эмпирическую (на основании опытных данных) и предсказательную (2)

Важными дополнительными критериями тестов, являются нормирование, сопоставляемость и экономичность.

Суть нормирования состоит в том, что на основе результатов тестирования можно создать нормы, имеющие особое значение для практики.

Сопоставляемость теста заключается в возможности сравнивать результаты, полученные по одной или нескольким формам параллельных (гомогенных) тестов. В практическом плане применение сопоставляемых моторных тестов снижает вероятность того, что в результате регулярного применения одного и того же теста оценивается не только и не столько уровень способности, сколько степень навыка. Одновременно сопоставляемые результаты тестов повышают достоверность выводов.

Суть экономичности как критерия добротности теста состоит в том, что проведение теста не требует длительного времени, больших материальных затрат и участия многих помощников.


Заключение

Предшественники современных двигательных тестов возникли в конце XIX -- начале XX в. С 1920 года в нашей стране проводились массовые обследования с целью изучения основных показателей физического развития и уровня двигательной подготовленности. На этой основе этих данных были разработаны нормативы комплекса «Готов к труду и обороне».

В теорию тестирования прочно вошли понятия о пяти двигательных способностях: силе, быстроте, координации движений, выносливости и гибкости. Для их оценки разработан целый ряд различных тестовых батарей.

Среди способов оценки физического состояния человека метод тестов является главным. Различают единичный и комплексный тесты. Также в связи со систематизацией физических (двигательных) способностей тесты классифицируют на кондиционные и координационные.

Все тесты должны отвечать специальным требованиям. К основным критериям относятся: надежность, стабильность, эквивалентность, объективность, информативность (валидность). К дополнительным критериям относятся: нормирование, сопоставляемость и экономичность.

Поэтому при выборе определенных тестов необходимо соблюдать все эти требования. Для повышения объективности тестов следует придерживаться более строгой стандартизацией тестирования, увеличением числа попыток, лучшей мотивацией испытуемых, увеличением числа оценщиков (судей, экспертов), повышением согласованности их мнений, увеличением числа эквивалентных тестов.


Глава 2. Задачи, методы и организация исследования

2.1 Задачи исследования:

1. Изучить сведения о теории тестирования по данным литературных источников;

2. Проанализировать методику тестирования физических качеств;

3. Сравнить показатели двигательной подготовленности учащихся 7а и 7б классов.

2.2 Методы исследования:

1. Анализ и обобщение литературных источников.

Осуществлялся на протяжении всего исследования. Решение данных задач на теоретическом уровне осуществляется на изучении литературы по: теории и методики физического воспитания и спорта, воспитанию физических качеств, спортивной метрологии. Было проанализировано 20 литературных источников.

2. Словесное воздействие.

Проводился инструктаж о последовательности выполнения двигательных тестов и мотивационная беседа для настроя на достижение лучшего результата.

3. Тестирование физических качеств.

бег 30 метров (с высокого старта),

челночный бег 3 х 10 метров,

прыжки в длину с места,

6-минутный бег (м),

наклон вперёд из положения сидя (см),

подтягивания на перекладине (девочки на низкой).

4. Методы математической статистики.

Использовались для проведения расчетов, которые использовались при сравнительном анализе учащихся 7а и 7б классов.

2.3 Организация исследования

На первом этапе, в апреле 2009 года, производился анализ научно-методической литературы:

· изучение содержания программ по физическому воспитанию учащихся общеобразоват

ОТЧЕТ

студента 137 гр. Иванова И.

о проверке эффективности методики тренировки
с применением методов математической статистики

Разделы отчета оформляются в соответствии с образцами, приведенными в настоящем пособии в конце каждого этапа игры. Зачтенные отчеты хранятся на кафедре биомеханики до консультации перед экзаменом. Студенты, не отчитавшиеся за проделанную работу и не сдавшие тетрадь с отчетом преподавателю, к экзамену по спортивной метрологии не допускаются.


I этап деловой игры
Контроль и измерения в спорте

Цель:

1. Ознакомиться с теоретическими основами контроля и измерений в спорте и физическом воспитании.

2. Приобрести навыки измерения показателей скоростных качеств у спортсменов.

1. Контроль в физическом
воспитании и спорте

Физическое воспитание и спортивная тренировка – не стихийный, а управляемый процесс. В каждый момент времени человек находится в определенном физическом состоянии, которое определяется, главным образом, здоровьем (соответствием показателей жизнедеятельности норме, степенью устойчивости организма к неблагоприятным внезапным воздействиям), телосложением и состоянием физических функций.

Физическим состоянием человека целесообразно управлять, изменяя его в нужном направлении. Это управление осуществляется средствами физического воспитания и спорта, к которым, в частности, относятся физические упражнения.

Это только кажется, что преподаватель (или тренер) управляет физическим состоянием, воздействуя на поведение спортсмена, т.е. предлагая определенные физические упражнения, а также контролируя правильность их выполнения и получаемые при этом результаты. В действительности же поведением спортсмена управляет не тренер, а сам спортсмен. В ходе спортивной тренировки оказывается воздействие на самоуправляемую систему (организм человека). Индивидуальные различия в состоянии спортсменов не дают уверенности в том, что одно и то же воздействие вызовет одинаковую ответную реакцию. Поэтому актуален вопрос об обратной связи: информации о состоянии спортсмена, поступающей тренеру в ходе контроля тренировочного процесса.

Контроль в физическом воспитании и спорте базируется на измерениях показателей, отборе наиболее существенных и их математической обработке.

Управление учебно-тренировочным процессом включает в себя три стадии:

1) сбор информации;

2) ее анализ;

3) принятие решений (планирование).

Сбор информации обычно осуществляется во время комплексного контроля, объектами которого являются:

1) соревновательная деятельность;

2) тренировочные нагрузки;

3) состояние спортсмена.



Различают (В.А. Запорожанов) три типа состояний спортсмена в зависимости от длительности промежутка, необходимого для перехода из одного состояния в другое.

1. Этапное (перманентное) состояние. Сохраняется относительно долго – недели или месяцы. Комплексная характеристика этапного состояния спортсмена, отражающая его возможности к демонстрации спортивных достижений, называется подготовленностью, а состояние оптимальной (наилучшей для данного цикла тренировки) подготовленности – спортивной формой . Очевидно, что в течение одного или нескольких дней нельзя достигнуть состояния спортивной формы или утратить его.

2. Текущее состояние. Изменяется под влиянием одного или нескольких занятий . Нередко последствия участия в соревнованиях или выполненной на одном из занятий тренировочной работы затягиваются на несколько дней. В этом случае спортсмен обычно отмечает явления как неблагоприятного характера (например, мышечные боли), так и позитивного (например, состояние повышенной работоспособности). Такие изменения называют отставленным тренировочным эффектом .

Текущее состояние спортсмена определяет характер ближайших тренировочных занятий и величину нагрузок в них. Частный случай текущего состояния, характеризующийся готовностью к выполнению в ближайшие дни соревновательного упражнения с результатом, близким к максимальному, называется текущей готовностью .

3. Оперативное состояние. Изменяется под влиянием однократного выполнения физических упражнений и является временным (например, утомление, вызванное однократным пробеганием дистанции; временное повышение работоспособности после разминки). Оперативное состояние спортсмена изменяется в ходе тренировочного занятия и должно учитываться при планировании интервалов отдыха между подходами, повторными забегами, при решении вопроса о целесообразности дополнительной разминки и т.п. Частный случай оперативного состояния, характеризующийся немедленной готовностью к выполнению соревновательного упражнения с результатом, близким к максимальному, называется оперативной готовностью .

В соответствии с приведенной классификацией выделяют три основных вида контроля состояния спортсмена:

1) этапный контроль . Его цель – оценить этапное состояние (подготовленность) спортсмена;

2) текущий контроль . Его основная задача – определить повседневные (текущие) колебания в состоянии спортсмена;

3) оперативный контроль . Его цель – экспресс-оценка состояния спортсмена в данный момент.

Измерение или испытание, проводимое с целью определения состояния или способностей спортсмена, называется тестом . Процедура измерений или испытаний называется тестированием.

Любой тест включает в себя измерение. Но не всякое измерение служит тестом. В качестве тестов могут быть использованы лишь те, которые удовлетворяют следующим метрологическим требованиям :

2) стандартизация;

3) наличие системы оценок;

4) надёжность и информативность (добротность) тестов;

5) вид контроля (этапный, текущий или оперативный).

Тест, в основе которого лежат двигательные задания, называется двигательным. Существует три группы двигательных тестов:

1. Контрольные упражнения, выполняя которые спортсмен получает задание показать максимальный результат. Результатом теста является двигательное достижение. Например, время, за которое спортсмен пробегает дистанцию 100 м.

2. Стандартные функциональные пробы, в ходе которых задание, одинаковое для всех, дозируется либо по величине выполненной работы, либо по величине физиологических сдвигов. Результатом теста являются физиологические или биохимические показатели при стандартной работе либо двигательные достижения при стандартной величине физиологических сдвигов. Например, процент увеличения ЧСС после 20 приседаний или скорость, с которой бежит спортсмен при фиксируемой величине ЧСС 160 ударов в минуту.

3. Максимальные функциональные пробы, в ходе которых спортсмен должен показать максимальный результат. Результатом теста являются физиологические или биохимические показатели при максимальной работе. Например, максимальное потребление кислорода или максимальная величина кислородного долга.

Высококачественное тестирование предполагает знание теории измерений.


Основные вопросы: Тест как инструмент измерения. Основные теории тестирования. Функции, возможности и ограничения тестирования. Применение тестов в оценке персонала. Преимущества и недостатки использования тестов. Формы и виды тестовых заданий. Технология построения задания. Оценка качества теста. Достоверность и валидность. Программное обеспечение для разработки тестов. 2




Тест как инструмент измерения Основные понятия в тестологии: измерение, тест, содержание и форма заданий, надежность и валидность результатов измерения. Кроме того, в тестологии используются такие понятия статистической науки, как выборочная и генеральная совокупность, средние показатели, вариация, корреляция, регрессия и др. 4




Тестовое задание - это дидактически и технологически эффективная единица контрольного материала, часть теста, которая отвечает требованиям предметной чистоты содержания (или одномерности), содержательной и логической правильности, правильности формы, приемлемости геометрического образа задания. 6




Традиционный тест представляет собой стандартизованный метод диагностики уровня и структуры подготовленности. В таком тесте все испытуемые отвечают на одни и те же задания, в одинаковое время, в одинаковых условиях и с одинаковыми правилами оценивания ответов. Для достижения цели тестирования можно создать бесчисленное количество тестов, и все они могут соответствовать достижению поставленной задаче. 8


Профессиограмма (от лат. Professio специальность + Gramma запись) система признаков, описывающих ту или иную профессию, а также включающая в себя перечень норм и требований, предъявляемых этой профессией или специальностью к работнику. В частности, профессиограмма может включать в себя перечень психологических характеристик, которым должны соответствовать представители конкретных профессиональных групп. 9


Основные теории тестирования Первые научные труды по теории тестов появилась в начале ХХ века, на стыке психологии, социологии, педагогики и других, так называемых поведенческих наук. Зарубежные психологи называют эту науку психометрикой (Psychometrika), а педагоги - педагогическим измерением (Educational measurement). Незамутненная идеологией и политикой, интерпретация названия « тестология » проста и прозрачна: наука о тестах. 10


Первый этап - предыстория - с древности до конца XIX века, когда были распространены донаучные формы контроля знаний и способностей; второй период, классический, продолжался с начала 20- х до конца 60- х годов, в течение которого создавалась классическая теория тестов; третий период - технологический - начавшийся с 70- х годов - время разработки методов адаптивного тестирования и обучения, методологию эффективной разработки тестов и тестовых заданий для параметрической оценки испытуемых по измеряемому латентному качеству. 11


Функции, возможности и ограничения тестирования Применяемые при отборе тесты предназначены для того, чтобы получить психологический портрет кандидата, оценить его способности, а также профессиональные знания и навыки. Тесты позволяют сравнивать кандидатов между собой или с эталонами, то есть идеальным кандидатом. Тесты используются для измерения качеств человека, необходимых для результативного выполнения работы. Некоторые тесты устроены таким образом, чтобы работодатель сам администрировал тестирование и подсчитывал результаты. Другие требуют услуг опытных консультантов, чтобы обеспечить их правильное применение. 12


Ограничения использования тестов связаны - с их дорогим администрированием; - с пригодностью для оценки способностей человека; - тесты более успешны для прогнозирования успешности в работе, которая содержит короткие по времени профессиональные задачи, и не очень удобны в случаях, когда задачи, решаемые на работе, занимают несколько дней или недель. 13








2. Используемая терминология должна быть подобрана в расчете на конкретную целевую аудиторию. Также нужно исключить излишние статьи или статьи, включающие два или более вопроса, так как они иногда сбивают с толку респондента и затрудняют интерпретацию. 17


3. Чтобы удовлетворить всем этим требованиям, следует просмотреть весь банк вопросов статью за статьей и проанализировать, какой цели служит каждая из них. Например, если тест разрабатывается для измерения аналитических способностей стажеров - бухгалтеров, стоит подумать, что в этом случае означает понятие « аналитические способности ». 18




5. Когда вопросы и форматы подсчета результатов выбраны, их нужно преобразовать в удобный для пользователя формат, с ясно написанными инструкциями и вопросами - примерами; так, чтобы выполняющие тест кандидаты полностью понимали, что от них требуется. 20


6. Очень часто на этом этапе разработки в тест включают больше вопросов, чем нужно. По некоторым оценкам, в три раза больше, чем останется в окончательном тесте или системе измерения. Тогда исходной мерой станет проверка разрабатываемого теста на относительно широкой выборке из числа существующих работников, чтобы убедиться в том, что все вопросы легко понятны. 21


7. Тесты на определение знаний обычно начинаются с простых вопросов, постепенно усложняющихся к концу. Когда тесты предназначаются для измерения социальных установок и личностных характеристик, возможно, будет полезным чередовать негативно и позитивно сформулированные статьи, чтобы избежать непродуманных ответов. 22


8. Последний этап представляет собой применение теста на широкой репрезентативной выборке, чтобы установить нормы выполнения, достоверности и валидности еще до начала его использования в качестве инструмента отбора. Кроме того, необходимо определить справедливость теста, чтобы убедиться, что он не дискриминирует никакие подгруппы населения (например, этническим отличиям). 23


Оценка качества теста Чтобы методы отбора были достаточно результативными они должны быть надежными, валидными и достоверными. Достоверность метода отбора характеризуется его неподверженностью систематическим ошибкам при измерении, то есть его состоятельности при разных условиях. 24


На практике достоверность при вынесении суждений достигается сравнением результатов двух и более аналогичных тестов, проведенных в разные дни. Другой путь повышения достоверности – сравнение результатов нескольких альтернативных методов отбора (например, тест и беседа). Если результаты сходны или одинаковы, можно считать их верными. 25


Надежность означает, что проведенные замеры дадут тот же результат, что и предыдущие, то есть на результаты оценки не влияют сторонние факторы. Валидность означает, что этот метод измеряет именно то, для чего он предназначен. Максимально возможная точность информации, получаемой специально разработанными методиками в научных исследованиях, ограничена техническими факторами и не превышает 0,8. 26


В практике отбора персонала отмечается, что надежность различных методов оценки располагается в интервалах: 0,1 – 0,2 – традиционное интервью; 0,2 – 0,3 – рекомендации; 0,3 – 0,5 – профессиональные тесты; 0,5 – 0,6 – структурированное интервью, интервью по компетенциям; 0,5 – 0,7 – когнитивные и личностные тесты; 0,6 – 0,7 – компетентностный подход (ассессмент - центр). 27


Под обоснованностью понимается то, с какой степенью точности данный результат, метод или критерий « предсказывает » будущую результативность тестируемого человека. Обоснованность методов относится к выводам, сделанным на основе той или иной процедуры, а не к самой процедуре. То есть метод отбора может сам по себе быть достоверным, но не соответствовать конкретной задаче: измерять не то, что требуется в данном случае. 28


Программное обеспечение для разработки тестов В отечественной практике представлены различные комплексные программы с модулем « Психодиагностика », например, программа «1 С: Зарплата и Управление Персоналом 8.0» с модулем « Психодиагностика », разработанная совместно с группой преподавателей кафедры психологии личности и общей психологии факультета психологии МГУ им. М. В. Ломоносова под руководством д. псих. наук, проф. А. Н. Гусева. Учебный тренажер для разработки систем оценки персонала и адаптации тестовых методик факультета психологии ТГУ, разработанный также на базе «1 С: Предприятие 8.2» фирмой Персонал Софт. 29


Литература: Отбор и найм персонала: технологии тестирования и оценки / Доминик Купер, Иван Т. Робертсон, Гордон Тинлайн. – М., изд - во « Вершина, – 156 с. Психологическое обеспечение профессиональной деятельности: теория и практика / Под ред. Проф. Г. С. Никифорова. – СПб.: Речь, – 816 с. 30

Первый компонент, теория тестов, содержит описание статистических моделей обработки диагностических дан­ных. Здесь содержатся модели анализа ответов в тестовых заданиях и модели подсчета суммарных результатов теста. Мелленберг (1980, 1990) назвал это «психометрией». Клас­сическая теория тестов, современная теория тестов (или модель анализа ответов на задания тестов - IRT) и модель


выборки заданий составляют три наиболее важных типа моделей теории тестов. Предметом рассмотрения психоди­агностики являются первые две модели.

Классическая теория тестов. На основе этой теории раз­работано большинство интеллектуальных и личностных те­стов. Центральным понятием этой теории является понятие «надежности». Под надежностью понимается согласован­ность результатов при повторном оценивании. В справоч­ных пособиях это понятие обычно представляется очень кратко, а затем дается подробное описание аппарата мате­матической статистики. В этой, вводной, главе мы предста­вим сжатое описание основного значения отмеченного понятия. В классической теории тестов под надежностью понимается повторяемость результатов нескольких проце­дур измерения (преимущественно измерений при помощи тестов). Понятие надежности предполагает вычисление ошибки измерения. Результаты, полученные в процессе тестирования, могут быть представлены как сумма истин­ного результата и ошибки измерения:

Xi = Ti + Еj

где Xi - оценка полученных результатов, Ti - истин­ный результат, а Еj - ошибка измерения.

Оценка полученных результатов - это, как правило, количество правильных ответов на задания теста. Истин­ный результат можно рассматривать как истинную оценку в платоновском смысле (Gulliksen, 1950). Широко распро­страненным является понятие ожидаемых результатов, т.е. представлений о баллах, которые могут быть получены в результате большого числа повторений процедур измере­ния (Lord & Novich, 1968). Но проведение одной и той же процедуры оценивания с одним человеком не представля­ется возможным. Поэтому необходим поиск других вариан­тов решения проблемы (Witlman, 1988).

В рамках этой концепции делаются некоторые допуще­ния относительно истинных результатов и ошибок измере­ния. Последние принимаются в качестве независимого фактора, что, конечно, является вполне обоснованным предположением, так как случайные колебания результа­тов не дают ковариаций: r ЕЕ =0.

Предполагается, что корреляции между истинными бал­лами и ошибками измерения не существует: r EE =0.


Суммарная ошибка равна 0, т.к. в качестве истинной оценки берется среднее арифметическое значение:

Эти допущения приводят нас в итоге к известному опре­делению надежности как отношения истинного результата к общей дисперсии или выражению: 1 минус отношение, в числителе которого ошибка измерения, а в знаменателе - общая дисперсия:


, ИЛИ

Из этой формулы определения надежности получаем, что дисперсия ошибки S 2 (E) равна общей дисперсии в числе случаев (1 – r XX "); таким образом, стандартная ошибка из­мерения определяется по формуле:

После теоретического обоснования надежности и его производных необходимо определить индекс надежности того или иного теста. Существуют практические процедуры оценивания надежности тестов, такие как использование взаимозаменяемых форм (параллельные тесты), расщепле­ние заданий на две части, повторное тестирование и изме­рение внутренней согласованности. Каждый справочник содержит индексы постоянства тестовых результатов:

r XX ’ =r(x 1 , x 2)

где r XX ’ - коэффициент стабильности, а x 1 и x 2 - результаты двух измерений.

Понятие надежности взаимозаменяемых форм введено и разработано Гулликсеном (1950). Данная процедура до­статочно трудоемка, поскольку связана с необходимостью создания параллельной серии заданий

r XX ’ =r(x 1 , x 2)

где r XX ’ - коэффициент эквивалентности, а x 1 и x 2 - два параллельных теста.

Следующая процедура - расщепление основного теста на две части А и В - более проста в использовании. Пока­затели, полученные по обеим частям теста, коррелируются. С помощью формулы Спирмена-Брауна оценивается на­дежность теста в целом:

где А и В - две параллельные части теста.

Следующий метод - определение внутренней согласо­ванности выполнения заданий теста. Этот метод основан на определении ковариаций отдельных заданий. Sg - диспер­сия произвольно выбранного задания, и Sgh - ковариация двух произвольно выбранных заданий. Наиболее часто ис­пользуемый коэффициент для определения внутренней со­гласованности - это «коэффициент альфа» Кронбаха. Используются также формула КР20 и λ-2 (лямбда-2).

В классической концепции надежности определяются ошибки измерения, возникающие как в процессе тестиро­вания, так и в процессе наблюдений. Источники этих оши­бок различны: это могут быть и личностные особенности, и особенности условий тестирования, и сами тестовые зада­ния. Существуют конкретные методы вычисления ошибок. Мы знаем, что наши наблюдения могут оказаться ошибоч­ными, наши методические инструменты несовершенны так же, как несовершенны и сами люди. (Как не вспомнить Шекспира: «Ненадежен ты, чье имя человек»). То, что в классической теории тестов ошибки измерения эксплици­руются и объясняются, является важным положительным моментом.

Классическая теория тестов имеет ряд существенных особенностей, которые можно рассматривать и как ее недо­статки. Некоторые из этих характеристик отмечаются в справочниках, но их значение (с житейской точки зрения) подчеркивается нечасто, как не отмечается и то, что с тео­ретической или методической точки зрения их следует счи­тать недостатками.

Первое. Классическая теория тестов и понятие надежно­сти ориентированы на подсчет суммарных тестовых пока­зателей, представляющих собой результат сложения оценок, полученных в отдельных заданиях. Так, при работе


Второе. Коэффициент надежности предполагает оценку величины разброса измеряемых показателей. Отсюда сле­дует, что коэффициент надежности будет ниже, если (при равенстве других показателей) выборка является более од­нородной. Не существует единого коэффициента внутрен­ней согласованности заданий теста, этот коэффициент всегда «контекстуален». Крокер и Альджина (1986), напри­мер, предлагают специальную формулу «коррекции для гомогенной выборки», предназначенную для самых высо­ких и самых низких результатов, полученных проходящи­ми тестирование. Для диагноста важно знать характеристики вариаций в выборочной совокупности, иначе он не сможет использовать коэффициенты внутрен­ней согласованности, указанные в руководстве к данному тесту.

Третье. Феномен сведения к показателю среднего ариф­метического является логическим следствием классической концепции надежности. Если оценка в тесте колеблется (т.е. она недостаточно надежна), то вполне возможно, что при повторении процедуры субъекты, имеющие низкие по­казатели, получат более высокие баллы, и наоборот, субъ­екты с высокими показателями - низкие. Этот артефакт процедуры измерения нельзя ошибочно принять за истин­ное изменение или проявление процессов развития. Но в то же время разграничить их нелегко, т.к. никогда нельзя исключить возможность изменения в ходе развития. Для полной уверенности необходимо"сравнение с контрольной группой.

Четвертая характеристика тестов, разработанных в со­ответствии с принципами классической теории,- это на­личие нормативных данных. Знание тестовых норм позволяет исследователю адекватно интерпретировать ре­зультаты тестируемых. Вне норм тестовые оценки лишены смысла. Выработка тестовых норм - это достаточно доро­гостоящее предприятие, поскольку психолог должен пол­учить результаты тестирования на репрезентативной выборке.

2 Я. тер Лаак

Если говорить о недостатках классической концепции надежности, то здесь уместно привести высказывание Сий-тсма (1992, р. 123-125). Он отмечает, что первое и главное предположение классической теории тестов состоит в том, что тестовые результаты подчиняются интервальному принципу. Однако никаких исследований, подтверждаю­щих это предположение, нет. По сути, это «измерение по произвольно установленному правилу». Данная особен­ность ставит классическую теорию тестов в менее выгодное положение по сравнению со шкалами измерения установок и, конечно же, по сравнению с современной теорией тестов. Многие методы анализа данных (дисперсионный анализ. регрессионный анализ, корреляционный и факторный ана­лиз) основаны на допущении существования интервальной шкалы. Однако оно не имеет твердого обоснования. Рас­сматривать шкалу истинных результатов как шкалу значе­ний психологических характеристик (например, арифметических способностей, интеллекта, нейротизма) можно только предположительно.

Второе замечание касается того, что результаты выпол­нения теста - это не абсолютные показатели той или иной психологической характеристики тестируемого, их необхо­димо рассматривать лишь как результаты выполнения того или иного теста. Два теста могут претендовать на изучение одних и тех же психологических характеристик (например, интеллекта, вербальных способностей, экстраверсии), но это не означает, что эти два теста равноценны и обладают одинаковыми возможностями. Сравнение показателей двух людей, прошедших тестирование разными тестами, некорректно. То же относится и к заполнению двух разных тестов одним испытуемым. Третье замечание относится к предположению, что стандартная ошибка измерения оди­накова применительно к любому уровню измеряемых спо­собностей индивида. Однако не существует эмпирической проверки этого предположения. Так, например, нет гаран­тии того, что тестируемый с хорошими математическими способностями при работе с относительно простым арифме­тическим тестом получит высокие баллы. В этом случае высокую оценку скорее получит человек с низкими или средними способностями.

В рамках современной теории тестов или теории анализа ответов в заданиях теста содержится описание большого


количества моделей возможных ответов респондентов. Эти модели различаются положенными в их основу допущени­ями, а также требованиями по отношению к получаемым данным. Модель Раша часто рассматривается в качестве синонима теорий анализа ответов в заданиях теста (1RT). На самом деле это только одна из моделей. Представленная в ней формула для описания характеристической кривой задания g выглядит следующим образом:

где g - отдельное задание теста; ехр - функция экспо­ненты (нелинейная зависимость); δ («дельта») - уровень трудности теста.

Другие задания теста, например h, также получают соб­ственные характеристические кривые. Выполнение условия δ h >δ g (g означает, что h - более трудное задание. Следовательно, для любого значения показателя Θ («тета» - латентные свойства способностей тестируемых) вероят­ность успешного выполнения задания h меньше. Эта модель называется строгой, поскольку очевидно, что при низкой степени выраженности черты вероятность выполнения за­дания близка к нулю. В этой модели нет места угадыванию и предположениям. Для заданий с вариантами выбора нет необходимости делать предположения о вероятности успе­ха. Кроме того, эта модель строга в том смысле, что все задания теста должны иметь одинаковую дискриминатив-ную способность (высокая дискриминативность отражается в крутизне кривой; здесь возможно построение шкалы Гут-тмана, согласно которой в каждой точке характеристиче­ской кривой вероятность выполнения задания меняется от О до 1). Из-за этого условия не все задания могут быть включены в тесты, созданные на основе модели Раша.

Существует несколько вариантов этой модели (напри­мер, Birnbaura, 1968, См. Lord & Novik). Она допускает существование заданий с различной дискриминативной

способностью.

Голландский исследователь Моккен (1971) разработал две модели анализа ответов в заданиях теста, требования которых не так строги, как в модели Раша, и поэтому, возможно, более реалистичны. В качестве основного усло-

вия Моккен выдвигает положение о том, что характеристи­ческая кривая задания должна следовать монотонно, без обрывов. Все задания теста при этом направлены на изуче­ние одной и той же психологической характеристики, из­мерять которую должна в. Допускается любая форма этой зависимости, пока она не прервется. Следовательно, форма характеристической кривой не определяется какой-либо специфической функцией. Такая «свобода» позволяет ис­пользовать больше заданий теста, и уровень оценивания при этом оказывается не выше, чем обычный.

Методология моделей ответов на задания теста (IRT) отличается от методологии большинства эксперименталь­ных и корреляционных исследований. Математическая мо­дель предназначена для изучения поведенческих, когнитивных, эмоциональных характеристик, а также фе­номенов развития. Эти рассматриваемые феномены часто ограничиваются ответами на задания, что позволило Мел-ленбергу (1990) назвать теорию IRT «мини-теорией о ми­ни-поведении». Результаты исследования могут быть в определенной степени представлены как кривые согласо­ванности, особенно в тех случаях, когда теоретические представления об изучаемых характеристиках отсутству­ют. До сих пор в нашем распоряжении имеются лишь еди­ницы тестов интеллекта, способностей и личностных тестов, созданных на основе многочисленных моделей тео­рии IRT. Варианты модели Раша чаще используются при разработке тестов достижений (Verhelst, 1993), а модели Моккена больше подходят для феноменов развития (см. также гл. 6).

Ответ тестируемого на задания теста является основной единицей моделей IRT. Тип ответа определяется степенью выраженности у человека изучаемой характеристики. Та­кой характеристикой могут быть, например, арифметиче­ские или пространственные способности. В большинстве случаев это тот или иной аспект интеллекта, характеристи­ки достижений или личностные особенности. Предполага­ется, что между положением данного конкретного человека в некотором диапазоне изучаемой характеристики и веро­ятностью успешного выполнения того или иного задания существует нелинейная зависимость. Нелинейность этой зависимости в определенном смысле интуитивно понятна. Известные фразы «Всякое начало трудно» (медленный не-


линейный старт) и «Стать святым не так просто», означают что дальнейшее совершенствование после достижения оп­ределенного уровня идет трудно. Кривая медленно прибли­жается, но почти никогда не достигает 100%-го уровня успеха.

Некоторые модели скорее противоречат нашему интуи­тивному пониманию. Возьмем такой пример. Человек с ин­дексом выраженности произвольной характеристики равным 1,5 имеет 60-процентную вероятность успеха при выполнении задания. Это противоречит нашему интуитив­ному пониманию такой ситуации, ведь можно либо успеш­но справиться с заданием, либо не справиться с ним вообще. Возьмем такой пример: 100 раз человек пытается взять высоту 1м 50 см. Успех сопутствует ему 60 раз, т.е. он имеет 60-процентную вероятность успеха.

Для оценки степени выраженности характеристики не­обходимо, по крайней мере, два задания. Модель Раша предполагает определение выраженности характеристик вне зависимости от трудности задания. Это также противо­речит нашему интуитивному пониманию: предположим, что человек имеет 80-процентную вероятность прыгнуть выше 1,30 м. Если это так, то в соответствии с характери­стической кривой заданий он имеет 60-процентную веро­ятность прыгнуть выше 1,50 м и 40-процентную вероятность прыгнуть выше 1,70 м. Следовательно, вне за­висимости от значения независимой переменной (высоты) можно оценить способность человека прыгать в высоту.

Существует около 50 моделей IRT (Goldstein & Wood, 1989).Имеется множество нелинейных функций, описыва­ющих (объясняющих) вероятность успеха в выполнении задания или группы заданий. Требования и ограничения этих моделей различны, и эти различия могут быть обнару­жены при сопоставлении модели Раша и шкалы Моккена. К требованиям этих моделей можно отнести:

1) необходимость определения исследуемой характеристи­ки и оценку позиции человека в диапазоне этой черты;

2) оценку последовательности заданий;

3) проверку конкретных моделей. В психометрии разрабо­тано множество процедур для проверки модели.

В некоторых справочных пособиях теория IRT рассмат­ривается как форма анализа заданий теста (см., например,

Croker& Algina, J 986). Можно, однако, отстаивать ту точку зрения, что теория IRT - это «мини-теория о мини-пове­дении». Сторонники теории IRT замечают, что если-несо­вершенны концепции (модели) среднего уровня, то что же можно сказать о более сложных конструктах в психологии?

Классическая и современная теории тестов. Люди не мо­гут не сравнивать вещи, которые выглядят почти одинако­во. (Возможно, житейский эквивалент психометрии и состоит, главным образом, в сравнении людей по значимым характеристикам и выборе между ними). Каждая из пред­ставленных теорий - и теория измерения ошибок оцени­вания, и математическая модель ответов на задания теста - имеет своих сторонников (Goldstein & Wood, 1986).

Модели IRT не вызывают упреков в том, что это «оцени­вание по правилам», в отличие от классической теории те­стов. Модель IRT ориентирована на анализ оцениваемых характеристик. Характеристики личности и характеристи­ки заданий оцениваются с помощью шкал (порядковых или интервальных). Более того, возможно сопоставление пока­зателей выполнения разных тестов, направленных на изу­чение сходных характеристик. Наконец, надежность неодинакова для каждого значения на шкале, а средние показатели обычно являются более надежными, чем пока­затели, расположенные в начале и в конце шкалы. Таким образом, модели IRT в теоретическом отношении представ­ляются более совершенными. Существует и различия в практическом использовании современной теории тестов и классической теории (Sijstma, 1992, стр. 127-130). Совре­менная теория тестов более сложна по сравнению с класси­ческой, поэтому она реже используется неспециалистами. Более того, IRT предъявляет особые требования к задани­ям. Это означает, что задания должны быть исключены из теста, если они не удовлетворяют требованиям модели. Данное правило относится далее к тем заданиям, которые входили в состав широко используемых тестов, построен­ных по принципам классической теории. Тест становится короче, и, следовательно, надежность его снижается.

IRT предлагает математические модели для изучения реальных феноменов. Модели должны помочь нам понять ключевые аспекты этих феноменов. Однако здесь кроется основной теоретический вопрос. Модели можно рассматри-


ватькак подход к изучению сложной реальности, в которой мы живем. Но модель и реальность - не одно и то же. Согласно пессимистическому взгляду, возможно моделиро­вание лишь единичных (и притом не самых интересных) типов поведения. Также можно встретить утверждение, что реальность вообще не подлежит моделированию, т.к. она подчиняется не одним лишь причинно-следственным зако­нам. В лучшем случае возможно моделирование отдельных (идеальных) поведенческих феноменов. Существует и дру­гой, более оптимистичный, взгляд на возможности модели-рования. Приведенная выше позиция блокирует возможность глубокого постижения природы феноменов человеческого поведения. Применение той или иной моде­ли поднимает некоторые обшие, фундаментальные вопро­сы. На наш взгляд, не подлежит сомнению, что IRT является концепцией теоретически и технически превосхо­дящей классическую теорию тестов.

Практическим назначением тестов, на какой бы теоре­тической основе они не создавались, является определение значимых критериев и установление на их основе характе­ристик тех или иных психологических конструктов. Имеет ли модель IRT преимущества и в этом отношении? Вполне возможно, что тесты, созданные на основе этой модели, не дают более точного прогноза по сравнению с тестами, со­зданными на основе классической теории, и возможно, что их вклад в разработку психологических конструктов не яв­ляется более весомым. Диагносты предпочитают такие кри­терии, которые непосредственно относятся к отдельному человеку, институту или сообществу. Модель, более совер­шенная в научном отношении, «ipso facto»* не определяет более подходящий критерий и в определенной степени ог­раничена в объяснении научных конструктов. Очевидно, что разработка тестов на основе классической теории будет продолжаться, но вместе с тем будут создаваться и новые модели IRT, распространяющиеся на изучение большего числа психологических феноменов.

В классической теории тестов различаются понятия «на­дежности» и «валидности». Тестовхяе результаты должны быть надежны, т.е. результаты первоначального и повтор­ного тестировании должны согласовываться. Кроме того,

* ipso facto (лак) - сама по себе (прим. перев.).

результаты должны быть свободны (насколько это возмож­но) от ошибок оценивания. Наличие валидности - одно из требований, предъявляемых к полученным результатам. При этом надежность рассматривается как необходимое, но еще не достаточное условие валидности теста.

Понятие валидности предполагает, что полученные ре­зультаты относятся к чему-либо важному в практическом или теоретическом отношении. Выводы, сделанные на ос­нове тестовых оценок, должны быть валидными. Наиболее часто говорят о двух видах валидности: прогностической (критериальной) и конструктной. Существуют также и другие виды валидности (см. гл. 3). Кроме того, валидность может быть определена и в случае квазиэкспериментов (Cook & Campbell, 1976, Cook & Shadish, 1994). Однако основным видом валидности все же является прогностиче­ская валидность, под которой понимается возможность предсказывать по тестовому результату нечто существен­ное о поведении в будущем, а также возможность более глубокого понимания того или иного психологического свойства или качества.

Представленные типы валидности обсуждаются в каж­дом справочнике и сопровождаются описанием методов анализа валидности теста. Факторный анализ более подхо­дит для определения конструктной валидизации, а уравне­ния линейной регрессии используются для анализа прогностической валидности. Те или иные характеристики (успеваемость, эффективность терапии) могут быть пред­сказаны на основе одного или нескольких показателей, пол-ученных при работе с интеллектуальными или личностными тестами. Такие техники обработки данных, как корреляционный, регрессионный, дисперсионный ана­лиз, анализ частичных корреляций и дисперсий, служат для определения прогностической валидности теста.

Также часто описывается содержательная валидность. Предполагается, что все задачи и задания теста должны принадлежать специфической области (психических свойств, поведения и т.д.). Понятие содержательной валид­ности характеризует соответствие каждого задания теста измеряемой области. Содержательная валидность иногда рассматривается как часть надежности или «обобщаемость» (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Однако при


выборе заданий для тестов достижений в конкретной пред­метной области важно также обращать внимание на прави­ла включения заданий в тест.

В классической теории тестов надежность и валидность рассматриваются относительно независимо друг от друга. Но существует и другое понимание соотношения этих по­нятий. Современная теория тестов основывается на приме­нении моделей. Параметры оцениваются внутри некоторой модели. Если задание не соответствует требованиям моде­ли, то в рамках этой модели оно признается невалидным. Конструктная валидизации представляет собой часть про­верки самой модели. Эта валидизации относится главным образом к проверке существования одномерной латентной исследуемой черты с известными шкальными характери­стиками. Шкальные оценки, несомненно, могут быть ис­пользованы для определения соответствующих критериев, и возможна их корреляция с показателями других конст­руктов для сбора информации о конвергентной и диверген­тной валидности конструкта.

Психодиагностика аналогична языку, описываемому как единство четырех компонентов, представленных на трех уровнях. Первый компонент, теория тестов, аналогичен синтаксису, грамматике языка. Порождающая (генератив­ная) грамматика - это, с одной стороны, остроумная мо­дель, с другой - система, подчиняющаяся правилам. С помощью этих правил на основе простых утвердительных предложений строятся сложные. При этом, однако, данная модель оставляет в стороне описание того, как организован процесс коммуникации (что передается и что воспринима­ется), и с какими целями он осуществляется. Для понима­ния этого требуются дополнительные знания. То же можно сказать и о теории тестов: она является необходимой в пси­ходиагностике, но она не способна объяснить, что психоди­агност делает и каковы его цели.

1.3.2. Психологические теории и психологические конструкты

Психодиагностика - это всегда диагностика чего-то конкретного: личностных характеристик, поведения, мыш­ления, эмоций. Тесты предназначены оценивать индивиду­альные различия. Существует несколько концепций

индивидуальных различий, каждая из которых имеет свои отличительные особенности. Если признается, что психо­диагностика не ограничивается только оценкой индивиду­альных различий, то тогда и другие теории приобретают существенное значение для психодиагностики. Примером является оценка различий процессов психического разви­тия и различий в социальном окружении. Хотя оценка ин­дивидуальных различий не является непременным атрибутом психодиагностики, тем не менее существуют оп­ределенные традиции исследования в этой области. Психо­диагностика начиналась с оценки различий интеллекта. Основной задачей тестов было «определение наследствен­ной передачи гениальности» (Gallon) или отбор детей для обучения (Binet, Simon). Измерение коэффициента интел­лектуальности получило теоретическое осмысление и прак-тическую разработку в трудах Спирмена (Великобритания) и Терстоуна (США). Раймонд Б.Кеттел сделал подобное для оценки личностных характеристик. Психодиагностика становится неразрывно связанной с тео­риями и представлениями об индивидуальных различиях в достижениях (оценка предельных возможностей) и формах поведения (уровень типичного функционирования). Эта традиция продолжает оставаться эффективной и сегодня. В учебных пособиях по психодиагностике гораздо реже оце­ниваются различия в социальном окружении по сравнению с рассмотрением особенностей самих процессов развития. Для этого не существует каких-либо разумных объяснений. С одной стороны, диагностика не ограничивается опреде­ленными теориями и понятиями. С другой стороны, она нуждается в теориях, поскольку именно в них определяется диагностируемое содержание (т.е. «что» диагностируется). Так, например, интеллект может рассматриваться и как общая характеристика, и как основание для множества не­зависимых друг от друга способностей. Если психодиагно­стика пытается «уйти» от той или иной теории, то тогда основой психодиагностического процесса становятся пред­ставления здравого смысла. В исследованиях применяются различные способы анализа данных, и общая логика иссле­дований определяет выбор той или иной математической модели и определяет структуру используемых психологи­ческих понятий. Такие методы математической статисти-


ки, как дисперсионный анализ, регрессионный анализ, факторный анализ, подсчет корреляций предполагают су­ществование линейных зависимостей. В случае некоррект­ного применения этих методов они «привносят» свою структуру в полученные данные и используемые конструк­ты.

Представления о различиях в социальном окружении и о развитии личности почти не оказали влияния на психоди­агностику. В учебных пособиях (см., например, Murphy & Davidshofer, 1988) рассматривается классическая теория тестов и обсуждаются соответствующие методы статисти­ческой обработки, описываются известные тесты, рассмат­риваются вопросы использования психодиагностики в практике: в психологии управления, при отборе персонала, при оценке психологических характеристик человека.

Теории индивидуальных различий (а также представле­ния о различиях между социальным окружением и о психи­ческом развитии) аналогичны изучению семантики языка. Это изучение и сущности, и содержания, и значения. Зна­чения структурируются определенным образом (подобно психологическим конструктам), например, по сходству или контрасту (аналогия, конвергенция, дивергенция).

1.3.3. Психологические тесты и другие методические средства

Третий компонент предложенной схемы - тесты, про­цедуры и методические средства, с помощью которых про­исходит сбор информации о характеристиках личности. Дрене и Сийтсма (1990, стр. 31) дают следующее определе­ние тестам: «Психологический тест рассматривается как классификация согласно определенной системе или как процедура измерения, которая позволяет вынести опреде­ленное суждение об одной или нескольких эмпирически выделенных или теоретически обоснованных характери­стиках конкретной стороны поведения человека (за рамка­ми тестовой ситуации). При этом рассматривается реакция респондентов на определенное число тщательно подобран­ных стимулов, а полученные ответы сравниваются с тесто­выми нормами».

Диагностике необходимы тесты и методики для сбора надежной, точной и валидной информации об особенностях

и характерных чертах личности, о мышлении, эмоциях и поведении человека. Помимо разработки тестовых проце­дур в этот компонент входят также следующие вопросы: как создаются тесты, как формулируются и отбираются зада­ния, как протекает процесс тестирования, каковы требова­ния к условиям проведения тестирования, как учитываются ошибки измерения, как подсчитываются и интерпретиру­ются тестовые результаты.

В процессе разработки тестов различаются рациональ­ная и эмпирическая стратегии. Применение рациональной стратегии начинается с определения основных понятий (на­пример, понятия интеллекта, экстраверсии), и в соответст­вии с этими представлениями формулируются задания теста. Примером такой стратегии может служить концеп­ция аспектного анализа (the facet theory) Гуттмана (1957, 1968, 1978). Сначала определяются различные аспекты ос­новных конструктов, затем подбираются задачи и задания таким образом, чтобы был учтен каждый из этих аспектов. Вторая стратегия состоит в том, что задания подбираются на эмпирической основе. Например, если исследователь попытается создать тест профессиональных интересов, ко­торый бы позволял дифференцировать медиков от инжене­ров, то процедура должна быть такой. Обе группы респондентов должны ответить на все задания теста, и те пункты, в ответах на которые обнаружены статистически значимые различия, входят в окончательный вариант тес­та. Если, например, между группами существуют различия в ответах на утверждение «Я люблю ловить рыбу», то это утверждение становится элементом теста. Основным поло­жением этой книги является то, что тест связан с концеп­туальной или таксономической теорией, определяющей эти характеристики.

Назначение теста обычно определено в инструкции по его применению. Тест должен быть стандартизирован для того, чтобы с его помощью можно было оценить различия между людьми, а не между условиями тестирования. Суще­ствуют, однако, отклонения от стандартизации в процеду­рах, называемых «тестированием границ возможностей» (testing the limits) и «тесты оценки потенциальных возмож­ностей в обучении» (learning potential tests). В этих услови­ях респонденту оказывается помощь в процессе


тестирования и затем оценивается влияние такой процеду­ры на результат. Подсчет баллов за ответы на задания объ­ективен, т.е. осуществляется в соответствии со стандартной процедурой. Интерпретация полученных результатов так­же строго определена и осуществляется на основе тестовых норм.

Третий компонент психодиагностики - психологиче­ские тесты, инструменты, процедуры - содержит опреде­ленные задания, которые являются наименьшими единицами психодиагностики и в этом смысле задания ана­логичны фонемам языка. Число возможных сочетаний фо­нем ограничено. Лишь определенные фонематические структуры могут образовывать слова и предложения, обес­печивающие доведение информации до слушателя. Также и тестовые задания: лишь в определенном сочетании друг с другом они могут стать эффективным средством оценки соответствующего конструкта.