Біографії Характеристики Аналіз

Оцінка валідності методики може мати кількісний і якісний характер. Валідність методики, види валідності

Іншим після надійності ключовим критерієм оцінки якості методик є валідність. Питання про валідність методики вирішується лише після того, як встановлено достатню її надійність, оскільки ненадійна методика не може бути валідною. Але найнадійніша методика без знання її валідності є практично марною.

Слід зазначити, що питання про валідність досі є одним із найскладніших. Найбільш укоріненим визначенням цього поняття є те, що наведено в книзі А. Анастазі: «Валідність тесту - поняття, що вказує нам, що тест вимірює і наскільки добре він це робить» .

Валідність за своєю суттю - це комплексна характеристика, що включає, з одного боку, відомості про те, чи придатна методика для вимірювання того, для чого вона була створена, а з іншого боку, якою є її дієвість, ефективність, практична корисність.

З цієї причини не існує єдиного універсального підходу до визначення валідності. Залежно від цього, яку бік валідності хоче розглянути дослідник, використовуються різні способи докази. Іншими словами, поняття валідності включає різні її види, що мають свій особливий зміст. Перевірка валідності методики називається валідизацією.

Валідність у першому її розумінні має відношення до самої методики, тобто це валідність вимірювального інструменту. Така перевірка називається теоретичною валідизацією. Валідність у другому розумінні вже відноситься не так до методики, як до мети її використання. Це прагматична валідизація.

Узагальнюючи, можна сказати:

» при теоретичній валідизації дослідника цікавить сама властивість, що вимірюється методикою. Це, сутнісно, ​​означає, що проводиться власне психологічна валідизація;

» при прагматичній валідизації суть предмета виміру (психологічної властивості) виявляється поза увагою. Головний акцент зроблено на те, щоб довести, що щось, що вимірюється методикою, має зв'язок з певними областями практики.

Провести теоретичну валідизацію, на відміну прагматичної, часом виявляється значно важче. Не вдаючись поки в конкретні деталі, зупинимося в загальних рисах на тому, як перевіряється прагматична валідність: вибирається якийсь незалежний від методики зовнішній критерій, що визначає успіх у тій чи іншій діяльності (навчальній, професійній тощо), і з ним порівнюються результати діагностичної методики. Якщо зв'язок між ними визнається задовільним, то робиться висновок про практичну значущість, ефективність, дієвість діагностичної методики.

Для визначення теоретичної валідності визначити будь-який незалежний критерій, що лежить поза методикою, набагато складніше. Тому на ранніх стадіях розвитку тестології, коли концепція валідності тільки складалася, існувало інтуїтивне уявлення про те, що саме цей тест вимірює:

1) методика називалася валідною, тому що те, що вона вимірює, просто «очевидно»;

2) доказ валідності ґрунтувався на впевненості дослідника в тому, що його метод дозволяє «зрозуміти випробуваного»;

3) методика розглядалася як валідна (тобто приймалося твердження, що такий тест вимірює таку якість) тільки тому, що теорія, на підставі якої будувалася методика, «дуже хороша».

Прийняття на віру голослівних тверджень про валідність методики не могло тривати тривалий час. Перші прояви справді наукової критики розвінчали такий підхід: розпочалися пошуки науково обґрунтованих доказів.

Таким чином, провести теоретичну валідизацію методики – це довести, що методика вимірює саме ту властивість, якість, яку вона за задумом дослідника має вимірювати.

Так, наприклад, якщо якийсь тест розроблявся для того, щоб діагностувати розумовий розвиток дітей, треба проаналізувати, чи справді він вимірює саме цей розвиток, а не якісь інші особливості (наприклад, особистість, характер тощо). Отже, для теоретичної валідизації кардинальною проблемою є ставлення між психологічними явищами та його показниками, з яких ці психологічні явища намагаються пізнати. Така перевірка показує, наскільки задум автора та результати методики збігаються.

Не так складно провести теоретичну валідизацію нової методики, якщо для вимірювання цієї властивості вже є методика з доведеною валідністю. Наявність кореляції між новою та аналогічною, вже перевіреною методикою вказує на те, що розроблена методика вимірює ту саму психологічну якість, що й еталонна. І якщо новий метод одночасно виявляється компактнішим і економічнішим у проведенні та обробці результатів, то психодіагности отримують можливість використовувати новий інструмент замість старого. Такий прийом особливо часто застосовується у диференціальній психофізіології при створенні методик діагностики основних властивостей нервової системи людини (див. гл. 16).

Але теоретична валідність доводиться шляхом зіставлення як із спорідненими показниками, а й з тими, де, з гіпотези, значних зв'язків повинно бути. Таким чином, для перевірки теоретичної валідності важливо, з одного боку, встановити ступінь зв'язку з спорідненою методикою (конвергентна валідність), а з іншого - відсутність зв'язку з методиками, що мають іншу теоретичну основу (дискримінантна валідність).

Набагато важче провести теоретичну валідизацію методики тоді, коли такий шлях перевірки неможливий. Найчастіше саме з такою ситуацією стикається дослідник. У таких обставинах лише поступове накопичення різноманітної інформації про досліджувану властивість, аналіз теоретичних передумов і експериментальних даних, значний досвід роботи з методикою дозволяють розкрити її психологічний зміст.

Важливу роль розуміння те, що методика вимірює, грає зіставлення її показників із практичними формами діяльності. Але тут особливо важливо, щоб методика була ретельно опрацьована в теоретичному плані, тобто, щоб була міцна, обґрунтована наукова база. Тоді при зіставленні методики із взятим із повсякденної практики зовнішнім критерієм, що відповідає тому, що вона вимірює, може бути отримана інформація, що підкріплює теоретичні уявлення про її сутність.

Важливо пам'ятати, що якщо доведено теоретичну валідність, то інтерпретація отриманих показників стає більш ясною та однозначною, а назва методики відповідає сфері її застосування.

Що ж до прагматичної валідизації, вона передбачає перевірку методики з погляду її практичної ефективності, значущості, корисності, оскільки діагностичною методикою має сенс користуватися лише тоді, коли доведено, що вимірюване властивість проявляється у певних життєвих ситуаціях, у певних видах діяльності. Їй надають великого значення особливо там, де постає питання відбору.

Якщо знову звернутися до історії розвитку тестології, можна виділити такий період (20-30-ті рр.), коли науковий зміст тестів та його теоретичний «багаж» цікавили меншою мірою. Важливо було, щоб тест працював, допомагав швидко відбирати найпідготовленіших людей. Емпіричний критерій оцінки тестових завдань вважався єдино вірним орієнтиром у вирішенні наукових та прикладних завдань.

Використання діагностичних методик із суто емпіричним обґрунтуванням, без чіткої теоретичної бази нерідко призводило до псевдонаукових висновків, до невиправданих практичних рекомендацій. Не можна було назвати ті особливості, якості, які тести виявляли. Б. М. Теплов, аналізуючи тести періоду, назвав їх «сліпими пробами».

Такий підхід до проблеми валідності тестів був характерний аж до початку 50-х років. у США, а й у інших країнах. Теоретична слабкість емпіричних методів валідизації не могла не викликати критики з боку вчених, які в розробці тестів закликали спиратися не тільки на «голу» емпірику та практику, а й на теоретичну концепцію. Практика без теорії, як відомо, сліпа, а теорія без практики мертва. Нині теоретико-прагматична оцінка валідності методик сприймається як найбільш продуктивна.

Для проведення прагматичної валідизації методики, т. е. з метою оцінки її ефективності, дієвості, практичної значущості, зазвичай використовується незалежний зовнішній критерій - показник прояви досліджуваної якості у повсякденному житті. Такими критеріями можуть бути:

1) успішність (для тестів здібностей до навчання, тестів досягнень, тестів інтелекту);

2) виробничі досягнення (для методик професійної спрямованості);

3) ефективність реальної діяльності - малювання, моделювання і т. д. (для тестів спеціальних здібностей);

4) суб'єктивні оцінки (для тестів особистості). Американські дослідники Д. Тіфін і Е. Маккормік, провівши

аналіз використовуваних для доказу валідності зовнішніх критеріїв, виділили чотири їх типи:

1) критерії виконання (до них можуть входити такі, як кількість виконаної роботи, успішність, час, витрачений на навчання, темп зростання кваліфікації тощо);

2) суб'єктивні критерії (вони включають різні види відповідей, які відображають ставлення людини до чогось або до когось, її думку, погляди, переваги; зазвичай суб'єктивні критерії отримують за допомогою інтерв'ю, опитувальників, анкет);

3) фізіологічні критерії (вони використовуються щодо впливу навколишнього середовища та інших ситуаційних змінних на організм і психіку людини; заміряється частота пульсу, тиск крові, електроопір шкіри, симптоми втоми і т. д.);

4) критерії випадковостей (застосовуються, коли мета дослідження стосується, наприклад, проблеми відбору для роботи таких осіб, які менш схильні до нещасних випадків).

Зовнішній критерій має відповідати трьом основним вимогам:

1) він має бути релевантним;

2) вільним від перешкод (контамінації);

3) надійним].

Під релевантністю мають на увазі смислове відповідність діагностичного інструменту незалежному життєво важливому критерію. Інакше кажучи, має бути упевненість у цьому, що у критерії задіяні саме особливості індивідуальної психіки, які вимірюються і діагностичною методикою. Зовнішній критерій та діагностична методика повинні перебувати між собою у внутрішній смисловій відповідності, бути якісно однорідними за психологічною сутністю.

Якщо, наприклад, тест вимірює індивідуальні особливості мислення, вміння виконувати логічні дії з певними об'єктами, поняттями, то й у критерії слід шукати прояв саме цих умінь. Це однаково відноситься і до професійної діяльності. Вона має не одну, а кілька цілей, завдань, кожна з яких специфічна і ставить свої умови до виконання. Із цього випливає існування кількох критеріїв виконання професійної діяльності. Тому не слід проводити зіставлення успішності за діагностичними методиками з виробничою ефективністю загалом. Необхідно знайти такий критерій, який характером виконуваних операцій співвідносний з методикою.

Якщо щодо зовнішнього критерію невідомо, чи релевантний він вимірюваній властивості чи ні, то зіставлення з ним результатів психодіагностичної методики стає практично марним. Воно не дозволяє дійти будь-яких висновків, які б дати оцінку валідності методики.

Вимоги волі від перешкод (контамінації) викликаються тим, що, наприклад, навчальна чи виробнича успішність залежить від двох змінних: від самої людини, її індивідуальних особливостей, що вимірюються методиками, та від ситуації, умов навчання, праці, які можуть привнести перешкоди, «забруднити » застосовуваний критерій. Щоб певною мірою уникнути цього, слід відбирати для дослідження такі групи людей, які перебувають у більш менш однакових умовах. Можна використовувати інший метод. Він полягає у коригуванні впливу перешкод. Це коригування носить зазвичай статистичний характер. Так, наприклад, продуктивність слід брати не за абсолютними значеннями, а щодо середньої продуктивності робітників, що мають аналогічні умови праці.

Коли кажуть, що критерій повинен мати статистично достовірну надійність, це означає, що він повинен відображати постійність та стійкість досліджуваної функції.

Пошуки адекватного критерію, що легко виявляється, відносяться до дуже важливих і складних завдань валідизації. У західній тестології багато методик дискваліфіковано тільки тому, що не вдалося знайти відповідного критерію для їх перевірки. Зокрема, у більшості анкет дані щодо їх валідності сумнівні, тому що важко знайти адекватний зовнішній критерій, що відповідає тому, що вони вимірюють.

Оцінка валідності методик може мати кількісний і якісний характер.

Для обчислення кількісного показника – коефіцієнта валідності – зіставляються результати, отримані при застосуванні діагностичної методики, з даними, отриманими за зовнішнім критерієм тих самих осіб. Використовуються різні види лінійної кореляції (за Спірменом, за Пірсоном).

Скільки досліджуваних необхідно для розрахунку валідності?

Практика показала, що їх не повинно бути менше 50, проте найкраще понад 200. Часто виникає питання, якою має бути величина коефіцієнта валідності, щоб вона вважалася прийнятною? Загалом зазначається, що достатньо того, щоб коефіцієнт валідності був статистично значущим. Низьким визнається коефіцієнт валідності порядку 0,2-0,3, середнім – 0,3-0,5 та високим – понад 0,6.

Але, як підкреслюють А. Анастазі, К. М. Гуревич та інших., який завжди для обчислення коефіцієнта валідності правомірно використовувати лінійну кореляцію. Цей прийом виправданий лише тоді, коли доведено, що успіх у якійсь діяльності прямо пропорційний до успіху у виконанні діагностичної проби. Позиція зарубіжних тестологів, особливо тих, хто займається профпридатністю та профвідбором, найчастіше зводиться до беззастережного визнання того, що для професії більше підійде той, хто виконав завдання в тесті. Але може бути і так, що для успіху в діяльності потрібно мати властивість на рівні 40% рішення тесту. Вищий показник у тесті не має жодного значення для професії. Наочний приклад із монографії К. М. Гуревича: листоноша має вміти читати, але чи читає він зі звичайною швидкістю або з дуже великою швидкістю - це вже не має професійного значення. При такому співвідношенні показників методики та зовнішнього критерію найбільш адекватним способом встановлення валідності може бути критерій відмінностей.

Можливий і інший випадок: більш високий рівень якості, ніж це вимагає професія, є на заваді професійному успіху. Так, ще на зорі XX ст. американський дослідник Ф. Тейлор виявив, що найрозвиненіші робітниці виробництва мають невисоку продуктивність праці. Тобто високий рівень їхнього розумового розвитку заважав їм високопродуктивно працювати. І тут для обчислення коефіцієнта валідності більше підійшли б дисперсійний аналіз чи обчислення кореляційних відносин.

Як показав досвід роботи зарубіжних тестологів, жодна статистична процедура не в змозі повністю відобразити різноманітність індивідуальних оцінок. Тому часто для доказу валідності методик використовують іншу модель – клінічні оцінки. Це не що інше, як якісний опис сутності якості, що вивчається. У цьому випадку йдеться про використання прийомів, що не спираються на статистичну обробку.

Існує кілька видів валідності, зумовлених особливостями діагностичних методик, а також тимчасовим статусом зовнішнього критерію. Проте найчастіше називаються такі.

1. Валидність «за змістом». Цей прийом використовується, наприклад, у тестах досягнень. Зазвичай до тестів досягнень включається не весь матеріал, який пройшли учні, а якась його невелика частина (3-4 питання). Чи можна бути впевненим у тому, що правильні відповіді на ці питання свідчать про засвоєння всього матеріалу? На це має відповісти перевірка валідності за змістом. Для цього проводиться зіставлення успішності тесту з експертними оцінками вчителів (за даним матеріалом). Валідність «за змістом» також підходить до критеріально-орієнтованих тестів. Іноді цей прийом називають логічною валідністю.

2. Валідність «за одночасністю», або поточна валідність, визначається за допомогою зовнішнього критерію, за яким інформація збирається одночасно з експериментами за методикою, що перевіряється. Іншими словами, збираються дані, що відносяться до цього часу: успішність у період випробування,

продуктивність у цей період і т. буд. З ними зіставляють результати успішності по тесту.

3. «Пророча» валідність (інша назва - «прогностична» валідність). Визначається також за зовнішнім критерієм, але інформація щодо нього збирається через деякий час після випробування. Зовнішнім критерієм зазвичай буває виражена у будь-яких оцінках здатність людини до виду діяльності, на яку він оцінювався за результатами діагностичних випробувань. Хоча цей прийом найбільше відповідає задачі діагностичних методик – передбаченню майбутньої успішності, – застосовувати його дуже важко. Точність діагнозу залежить від часу, заданого для такого прогнозування. Чим більше проходить часу після виміру, тим більше факторів потрібно враховувати в оцінці прогностичної значущості методики. Проте врахувати всі чинники, які впливають пророцтво, практично неможливо.

4. «Ретроспективна» валідність. Вона визначається з урахуванням критерію, що відбиває події чи стан якості у минулому. Може бути використана для швидкого отримання відомостей про передбачувальні можливості методики. Так, для перевірки того, якою мірою хороші результати тесту здібностей відповідають швидкому навчанню, можна зіставити попередні оцінки успішності, минулі експертні висновки і т. д. у осіб з високими та низькими на даний момент діагностичними показниками.

При наведенні даних про валідність розробленої методики важливо темно вказати, який вид валідності мають на увазі (за змістом, одночасності і т. д.). Бажано також повідомляти відомості про чисельність та особливості індивідів, на яких проводилася валідизація. Така інформація дозволяє досліднику, що користується методикою, вирішити, наскільки валідний цей прийом для тієї групи, до якої він збирається його застосовувати. Як і у випадку з надійністю, необхідно пам'ятати, що в одній вибірці методика може мати високу валндність, а в іншій - низьку. Тому, якщо дослідник планує використовувати методику на вибірці піддослідних, яка істотно відрізняється від тієї, на якій проводилася перевірка валідності, йому необхідно провести таку перевірку. Коефіцієнт валідності, що наводиться в керівництві, застосовний тільки до груп піддослідних, подібних тим, на яких він визначався.

Питання валідності вирішується по тому, як встановлено надійність, оскільки ненадійна методика може бути валідною.

Валідність тесту - поняття, що вказує нам, що тест вимірює і наскільки добре це робить (А. Анастази). Валідність за своєю суттю - це комплексна характеристика, що включає, з одного боку, відомості про те, чи придатна методика для вимірювання того, для чого вона була створена, а з іншого боку, якою є її дієвість, ефективність, практична корисність.

З цієї причини не існує єдиного універсального підходу до визначення валідності. Залежно від цього, яку бік валідності хоче розглянути дослідник, використовуються різні способи докази. Іншими словами, поняття валідності включає різні її види, що мають свій особливий зміст. Перевірка валідності методики називається валідизацією.

Валідність – відповідність конкретного дослідження прийнятим стандартам (бездоганному експерименту).

Валідність у її розумінні має відношення до самої методики, тобто. це валідність вимірювального інструменту. Така перевірка називається теоретичною валідизацією. Валідність у другому її розумінні вже відноситься не так до методики, як до мети її використання. Це прагматична валідизація.

При теоретичній валідизації дослідника цікавить сама властивість, що вимірюється методикою.

Тому що для визначення теоретичної валідизації важко знайти якийсь незалежний критерій, що лежить поза методикою, і тому раніше приймалися на віру голослівні твердження про валідність цієї методики. Так як теоретична валідизація спрямована на доказ того, що методика вимірює саме властивість, яку вона має виміряти. Для теоретичної валідизації кардинальною проблемою є відношення між психологічними явищами та їх показниками, за допомогою яких ці психологічні явища намагаються пізнати. Вона показує, що задум автора та результати методики збігаються.

Не так складно здійснити теоретичну валідизацію нової методики, якщо для вимірювання цієї властивості вже є методика з відомою, доведеною валідністю. Наявність кореляції між новою та аналогічною старою методиками вказує на те, що розроблена методика вимірює ту саму психологічну якість, що й еталонна.

Для перевірки теоретичної валідності важливо, з одного боку, встановити ступінь зв'язку з спорідненою методикою (конвергентна валідність), а з іншого - відсутність цього зв'язку з методиками, що мають іншу теоретичну основу (дискримінантна валідність).

Важливу роль розуміння те, що методика вимірює, грає зіставлення її показників із практичними формами діяльності. Важливо, щоб методика була опрацьована в теоретичному плані.

Прагматична валідизація

Перевіряється практична ефективність, значимість, корисність методики, оскільки методикою можна скористатися лише тоді, коли доведено, що вимірюване властивість проявляється у певних видах діяльності.

Для перевірки прагматичної валідності використовується незалежний зовнішній критерій – показник прояву досліджуваної якості у повсякденному житті. Як такий критерій можуть виступати успішність (для тестів здібностей до навчання, тестів досягнень, тестів інтелекту), виробничі досягнення (для методик професійної спрямованості), ефективність реальної діяльності - малювання, моделювання і так далі (для тестів спеціальних здібностей), суб'єктивні оцінки ( для тестів Особи).

Американські дослідники Тіфін і Маккормік виділили 4 типи зовнішнього критерію:

  • 1) Критерій виконання (кількість виконуваної роботи, успішність, час, темпи зростання кваліфікації).
  • 2) Суб'єктивні критерії (включають різні види відповідей, які відображають ставлення людини до чогось, її думки, погляди).
  • 3)Фізіологічний критерій (використовується щодо впливу довкілля, що впливає організм і психіку).
  • 4) Критерій випадковості (наприклад, коли мета стосується проблеми відбору для роботи таких осіб, які менш схильні до нещасних випадків).

Зовнішній критерій повинен мати 3 основні вимоги: 1) Має бути релевантним, тобто має бути впевненість, що в критерії задіяні саме ті особливості індивідуальної психіки, які вимірює діагностична методика. Зовнішній критерій та діагностична модель повинні перебувати у внутрішній змістовній відповідності. 2) Має бути вільним від перешкод (контамінації). Слід відбирати для дослідження такі групи людей, які перебувають у більш-менш однакових умовах. 3) Має бути надійним. Постійність та стійкість досліджуваної функції.

Оцінка валідності методики може мати кількісний і якісний характер.

Для обчислення кількісного показника (коефіцієнта валідності) зіставляються результати, отримані при застосуванні діагностичних методик, з даними тих осіб, отримані за зовнішнім критерієм. Використовуються різні види лінійної кореляції (за Спірменом, за Пірсеном).

Якісний опис сутності вимірюваної якості. Тут не використовують статистичну обробку. Існують кілька видів валідності, зумовлених особливостями діагностичної методики, а також тимчасовим статусом зовнішнього критерію: 1) Валидність «за змістом» (використовується в тестах досягнення): 3 – 4 питання з великої теми можуть показати справжні знання учня. Для цього результати діагностики порівнюють із експертними оцінками вчителя. 2)Валідність «по одночасності» або поточна валідність - збираються дані, що належать до теперішнього часу: успішність, продуктивність і т.п. З ними корелюють результати успішності тесту. 3) «передбачувана» валідність («прогностична»). Визначається за надійним зовнішнім критерієм, але інформація по ньому збирається через деякий час після випробування. Точність прогнозу залежить від часу, заданого для такого прогнозування. 4) «Ретроспективна» валідність. Визначається з урахуванням критерію, що відбиває події чи стан якості у минулому. Може бути використана для швидкого отримання відомостей про передбачувальні можливості методики.

Перш ніж психодіагностичні методики можуть бути використані для практичних цілей, вони повинні пройти перевірку за рядом формальних критеріїв, що доводять їхню високу якість та ефективність. До основних критеріїв оцінки психодіагностичних методик відносяться надійність і валідність.

Великий внесок у розробку цих понять зробили зарубіжні психологи (А. Анастазі, Е. Гізеллі, Дж. Гілфорд, Л. Кронбах, Р. Торндайк, Е. Хаген та ін.). Ними були розроблені формально-логічний та математико-статистичний апарат (насамперед кореляційний метод та фактичний аналіз) обґрунтування ступеня відповідності методик зазначеним критеріям.

У традиційній тестології термін «надійність»означає відносну сталість, стійкість, узгодженість результатів тесту при первинному та повторному його застосуванні на тих самих випробуваних.

Надійність методики- Це критерій, який говорить про точність психологічних вимірювань, тобто дозволяє судити про те, наскільки вселяють довіру отримані результати.

Це узгодженість результатів тестування випробуваних у різні моменти часу, при первинному та вторинному тестуванні та з використанням різних за еквівалентністю, за змістом завдань. Надійність характеризує тести властивостей, але з станів. Властивості:

  1. Відтворюваність результатів дослідження.
  2. Точність виміру.
  3. Стійкість результатів.

Ступінь надійності методик залежить багатьох причин. Серед негативних факторівнайчастіше називаються такі:

  1. нестабільність діагностованої властивості;
  2. недосконалість діагностичних методик (недбало складено інструкцію, завдання за своїм характером різнорідні, нечітко сформульовані вказівки щодо пред'явлення методики випробуваним тощо);
  3. мінлива ситуація обстеження (різна пора дня, коли проводяться експерименти, різна освітленість приміщення, наявність чи відсутність сторонніх шумів тощо.);
  4. відмінності в манері поведінки експериментатора (від досвіду до досвіду по-різному висуває інструкції, по-різному стимулює виконання завдань тощо);
  5. коливання у функціональному стані випробуваного (в одному експерименті відзначається гарне самопочуття, в іншому – стомлення тощо);
  6. елементи суб'єктивності у способах оцінки та інтерпретації результатів (коли ведеться протоколювання відповідей піддослідних, оцінюють відповіді за рівнем повноти, оригінальності тощо).

Одним з найважливіших засобів підвищення надійності методики є однаковість процедури обстеження, його строга регламентація: однакова обстановка, однотипний характер інструкцій, однакові всім тимчасові обмеження, способи та особливості контакту з випробуваними тощо.

На характеристику надійності методик великий вплив має досліджувана вибірка. Вона може, як знижувати, і завищувати цей показник, наприклад, надійність, може бути штучно завищена, якщо у вибірці невеликий розкид результатів, тобто. якщо результати за своїми значеннями близькі один до одного. Тому у посібнику зазвичай робиться опис вибірки, у якому визначалася надійність методики.

Нині надійність дедалі частіше визначається найбільш однорідних вибірках, тобто. на вибірках, схожих за статтю, віком, рівнем освіти, професійної підготовки тощо.

Різновидів надійності методик так само багато, як і умов, що впливають на результати діагностичних випробувань. Оскільки всі види надійності відбивають ступінь узгодженості двох незалежно отриманих рядів показників, то математико-статистичний прийом, з допомогою якого встановлюється надійність методики, - це кореляції (Пірсоном чи Спирмену). Надійність тим вища, що більше отриманий коефіцієнт кореляції наближається до одиниці, і навпаки.

К.М. Гуревичзапропонував тлумачити надійність як:

  1. надійність самого вимірювального інструмента (коефіцієнт надійності);
  2. стабільність досліджуваної ознаки (коефіцієнт стабільності);
  3. константність, тобто. відносну незалежність результатів від Особи експериментатора (коефіцієнт константності).

Показник, що характеризує вимірювальний інструмент, пропонується називати коефіцієнтом надійності; показник, що характеризує стабільність вимірюваної якості, - коефіцієнтом стабільності; а показник оцінки впливу Особи експериментатора – коефіцієнт константності. Саме такому порядку рекомендується здійснювати перевірку методики: доцільно спочатку перевірити інструмент виміру. Якщо отримані дані задовільні, можна переходити до встановлення міри стабільності вимірюваної властивості, а вже після цього при необхідності зайнятися критерієм константності. (Надійність: ретестова, паралельних форм, частин тіла, за внутрішньою узгодженістю, факторно-дисперсійна).

Визначення надійності вимірювального інструменту.Від того як складено методику, наскільки правильно підібрано завдання, наскільки вона однорідна залежить точність, об'єктивність виміру.

Для перевірки надійності вимірювального інструменту, що говорить про його однорідність (гомогенні) використовують метод розщеплення. Завдання ділять на парні та непарні (необхідне виконання всіх завдань), а потім результати корелюються між собою. Якщо методика однорідна, то великої різниці в успішності за цими половинами не буде, коефіцієнт буде високим. Можна порівнювати частинами, але краще по парних і непарних, т.к. цей спосіб залежить від тренування, втоми тощо.

Методика надійна, якщо коефіцієнт не нижчий 0,75 – 0,85, краще 0,90 та вище.

Визначення стабільності досліджуваної ознаки.Також необхідно встановити наскільки стійка, стабільна ознака, яку дослідник має намір вимірювати. Ознака з часом може змінюватись, але коливання її не повинні мати непередбачуваного характеру.

Для перевірки використовується прийом, який називається тест-ретест. Він полягає у повторному обстеженні піддослідних за допомогою цієї методики. Про стабільність судять за коефіцієнтом кореляції між результатами першого та другого обстеження. Він свідчить про збереження чи не збереження кожним випробуваним свого порядкового номера у вибірці.

На ступінь стійкості впливає різноманітність чинника. Необхідно дотримуватись одноманітності процедури обстеження.

При визначенні стабільності ознаки значення має проміжок часу між 1 і 2 обстеженнями. Чим коротше цей проміжок, тим більше шансів, що ця ознака зберігає рівень першого випробування. Доцільно проводити повторне тестування за короткий термін після тестування. Експериментатор сам встановлює цей термін, але частіше в психологічній літературі вказують на інтервал від кількох місяців (але не більше як півроку). Питання стабільності вимірюваного якості вирішується який завжди одноманітно. Рішення залежить від сутності ознаки, що діагностується.

Якщо вимірюване властивість вже сформовано, то коефіцієнт має бути не нижче 0,80.

Визначення константності, тобто. відносна незалежність результатів від Особи експериментатора. Так як методика розробляється для подальшого використання її іншими психодіагностами, необхідно визначити якою мірою її результати піддаються впливу особистості експериментатора. Коефіцієнт константності визначається шляхом кореляції результатів двох дослідів, що проводяться на одній і тій же вибірці, але різними експериментаторами. Коефіцієнт кореляції не повинен бути нижчим за 0,80.

Питання валідності вирішується по тому, як встановлено надійність, оскільки ненадійна методика може бути валідною.

Валідністьтесту - поняття, що вказує нам, що тест вимірює і наскільки добре він це робить (А. Анастазі). Валідністьза своєю суттю – це комплексна характеристика, що включає, з одного боку, відомості про те, чи придатна методика для вимірювання того, для чого вона була створена, а з іншого боку, якою є її дієвість, ефективність, практична корисність.

З цієї причини не існує єдиного універсального підходу до визначення валідності. Залежно від цього, яку бік валідності хоче розглянути дослідник, використовуються різні способи докази. Іншими словами, поняття валідності включає різні її види, що мають свій особливий зміст. Перевірка валідності методики називається валідизацією.

Валідність - відповідність конкретного дослідження прийнятим стандартам (бездоганному експерименту).

Валідність у її розумінні має відношення до самої методики, тобто. це валідність вимірювального інструменту. Така перевірка називається теоретичною валідизацією. Валідність у другому її розумінні вже відноситься не так до методики, як до мети її використання. Це прагматична валідизація.

При теоретичній валідизації дослідника цікавить сама властивість, що вимірюється методикою.

Тому що для визначення теоретичної валідизації важко знайти якийсь незалежний критерій, що лежить поза методикою, і тому раніше приймалися на віру голослівні твердження про валідність цієї методики. Так як теоретична валідизація спрямована на доказ того, що методика вимірює саме властивість, яку вона має виміряти. Для теоретичної валідизації кардинальною проблемою є відношення між психологічними явищами та їх показниками, за допомогою яких ці психологічні явища намагаються пізнати. Вона показує, що задум автора та результати методики збігаються.

Не так складно здійснити теоретичну валідизацію нової методики, якщо для вимірювання цієї властивості вже є методика з відомою, доведеною валідністю. Наявність кореляції між новою та аналогічною старою методиками вказує на те, що розроблена методика вимірює ту саму психологічну якість, що й еталонна.

Для перевірки теоретичної валідності важливо, з одного боку, встановити ступінь зв'язку з спорідненою методикою (конвергентна валідність), а з іншого – відсутність цього зв'язку з методиками, що мають іншу теоретичну основу (дискримінаційна валідність).

Важливу роль розуміння те, що методика вимірює, грає зіставлення її показників із практичними формами діяльності. Важливо, щоб методика була опрацьована в теоретичному плані.

Прагматична валідизація

Перевіряється практична ефективність, значимість, корисність методики, оскільки методикою можна скористатися лише тоді, коли доведено, що вимірюване властивість проявляється у певних видах діяльності.

Для перевірки прагматичної валідності використовується незалежний зовнішній критерій – показник прояву досліджуваної якості у повсякденному житті. В якості такого критерію можуть виступати успішність (для тестів здібностей до навчання, тестів досягнень, тестів інтелекту), виробничі досягнення (для методик професійної спрямованості), ефективність реальної діяльності - малювання, моделювання і так далі (для тестів спеціальних здібностей), суб'єктивні оцінки ( для тестів Особи).

Американські дослідники Тіфін і Маккормік виділили 4 типи зовнішнього критерію:

  1. Критерій виконання (кількість виконуваної роботи, успішність, час, темпи зростання кваліфікації).
  2. Суб'єктивні критерії (включають різні види відповідей, які відображають ставлення людини до чогось, її думки, погляди).
  3. Фізіологічний критерій (використовується щодо впливу довкілля, що впливає організм і психіку).
  4. Критерій випадковості (наприклад, коли мета стосується проблеми відбору для роботи таких осіб, які менш схильні до нещасних випадків).

Зовнішній критерій повинен мати три основні вимоги:

  1. Має бути релевантним, тобто має бути впевненість, що в критерії задіяні саме ті особливості індивідуальної психіки, які вимірює діагностична методика. Зовнішній критерій та діагностична модель повинні перебувати у внутрішній змістовній відповідності.
  2. Має бути вільним від перешкод (контамінації). Слід відбирати для дослідження такі групи людей, які перебувають у більш менш однакових умовах.
  3. Має бути надійним. Постійність та стійкість досліджуваної функції.

Оцінка валідності методики може мати кількісний і якісний характер.

Для обчислення кількісного показника (коефіцієнта валідності) зіставляються результати, отримані при застосуванні діагностичних методик, з даними тих осіб, отримані за зовнішнім критерієм. Використовуються різні види лінійної кореляції (за Спірменом, за Пірсеном).

Якісний опис сутності вимірюваної якості. Тут не використовують статистичну обробку.

Існує декілька видів валідності, обумовлених особливостями діагностичної методики, а також тимчасовим статусом зовнішнього критерію:

  1. Валідність "за змістом" (використовується в тестах досягнення): 3 - 4 питання з великої теми можуть показати справжні знання учня. Для цього результати діагностики порівнюють із експертними оцінками вчителя.
  2. Валідність «за одночасністю» чи поточна валідність – збираються дані, які стосуються теперішнього часу: успішність, продуктивність тощо. З ними корелюють результати успішності тесту.
  3. «Пророча» валідність («прогностична»). Визначається за надійним зовнішнім критерієм, але інформація по ньому збирається через деякий час після випробування. Точність прогнозу залежить від часу, заданого для такого прогнозування.
  4. "Ретроспективна" валідність. Визначається з урахуванням критерію, що відбиває події чи стан якості у минулому. Може бути використана для швидкого отримання відомостей про передбачувальні можливості методики.

Валідність (від англ. valid - «дійсний, придатний, що має силу») - комплексна характеристика методики (тесту), що включає відомості про область досліджуваних явищ та репрезентативність діагностичної процедури по відношенню до них.

У найпростішому та загальному формулюванні валідність тесту - це «поняття, що вказує нам, що тест вимірює і наскільки добре він це робить». У стандартних вимогах до психологічних та освітніх тестів валідність визначається як комплекс відомостей про те, щодо яких груп психологічних властивостей особистості можуть бути зроблені висновки за допомогою методики, а також про ступінь обґрунтованості висновків під час використання конкретних тестових оцінок чи інших форм оцінювання. У психодіагностиці валідність - обов'язкова та найважливіша частина відомостей про методику, що включає (поряд із зазначеними вище) дані про ступінь узгодженості результатів тесту з іншими відомостями про досліджувану особу, отриманими з різних джерел (теоретичних очікувань, спостережень, експертних оцінок, результатів інших методик, достовірність яких встановлено і т. д.), судження про обґрунтованість прогнозу розвитку досліджуваної якості, зв'язок галузі поведінки, що вивчається, або особливості особистості з певними психологічними конструктами. Валідність визначає також конкретну спрямованість методики (контингент піддослідних за віком, рівнем освіти, соціально-культурної власності тощо.) і ступінь обгрунтованості висновків у умовах використання тесту. У сукупності відомостей, що характеризують валідність тесту, міститься інформація про адекватність застосовуваної моделі діяльності з точки зору відображення в ній психологічної особливості, що вивчається, про ступінь однорідності завдань (субтестів), включених у тест, їх сумісності при кількісній оцінці результатів тесту в цілому.

Найважливіша складова валідності - визначення галузі досліджуваних якостей - має важливе теоретичне і практичного значення під час виборів методики дослідження та інтерпретації її даних. Інформація, що міститься в назві тесту, як правило, недостатня для судження про сферу його застосування. Це лише позначення, ім'я конкретної процедури дослідження.

Види валідності тіста. Способи визначення валідності

За визначенням американського текстолога А. Анастазі, "валідність тесту - поняття, що вказує нам, що тест вимірює і наскільки добре він це робить". Валідність свідчить про те, чи придатна методика для вимірювання певних якостей, особливостей та наскільки ефективно вона це робить. Найбільш поширеним способом знаходження теоретичної валідності тесту (методики) є конвергентна валідність, тобто зіставлення даної методики з авторитетними спорідненими методиками та доказ значимих зв'язків із ними.

Зіставлення з методиками, що мають іншу теоретичну основу, та констанція відсутності значних зв'язків з ними називається дискримінантною валідністю. Інший вид валідності – прагматична валідність – перевірка методики з погляду її практичної значущості, ефективності, корисності. Для проведення такої перевірки зазвичай використовуються так звані незалежні зовнішні критерії, тобто використовується незалежне від тесту, зовнішнє джерело інформації про прояви в реальному житті та діяльності людей вимірюваної психічної властивості. Серед таких зовнішніх критеріїв можуть бути успішність, професійні досягнення, успіхи у різних видах діяльності, суб'єктивні оцінки (або самооцінки). Якщо, наприклад, методика вимірює особливості розвитку професійно важливих якостей, то критерію необхідно знайти таку діяльність чи окремі операції, де саме ці якості реалізуються.

Для перевірки валідності тесту можна використовувати метод відомих груп, коли запрошуються люди, про яких відомо, до якої групи за критерієм вони належать (наприклад, група «високоуспішних, дисциплінованих студентів» – високий критерій та група «неуспішних, недисциплінованих студентів» – низький критерій, а студенти із середніми значеннями не беруть участь у тестуванні), проводять тестування та знаходять кореляцію між результатами тесту та критерієм.

Тут a - число піддослідних, що потрапили у високу групу за тестом і критерієм, c - число піддослідних, що потрапили у високу групу за критерієм і мають низькі результати тесту. При повній валідності тесту елементи b і c повинні дорівнювати нулю. Міру збігу, кореляції між крайніми групами за тестом та критерієм оцінюють за допомогою фі-коефіцієнта Гілфорда. Існує досить багато різних способів доказу валідності тесту. Тест називається валідним, якщо він вимірює те, для виміру чого призначений. Валідність зовнішня - стосовно психодіагностичних методик означає відповідність результатів психодіагностики, що проводиться за допомогою даної методики, незалежним від методики зовнішнім ознакам, що належать до суб'єкта обстеження. Означає приблизно те саме, що валідність емпірична, з тією різницею, що йдеться про зв'язок між показниками методики і найважливішими, ключовими зовнішніми ознаками, що відносяться до поведінки випробуваного. Психодіагностична методика вважається зовні валідною, якщо, наприклад, її за допомогою оцінюються риси характеру індивіда та його зовні спостерігається поведінка узгоджується з результатами проведеного тестування.

Валідність внутрішня - стосовно психодіагностичних методик означає відповідність завдань, що містять у ній, субтестів; відповідність результатів психодіагностики, проведеної у вигляді даної методики, визначенню оцінюваного психологічного властивості, використаному у самій методиці. Методика вважається внутрішньо не валідною або недостатньо валідною, коли всі або частина включених до неї питань, завдань та субтестів вимірюють не те, що потрібно цією методикою. Очевидна валідність - визначає уявлення про тесті, що склалися у випробуваного. Тест має сприйматися обстежуваним як серйозний інструмент пізнання його особистості. Очевидна валідність набуває особливого значення в сучасних умовах, коли уявлення про тести у суспільній свідомості формується численними публікаціями в популярних газетах та журналах того, що можна назвати квазітестами, за допомогою яких читачеві пропонується визначити все, що завгодно: від інтелекту до сумісності з майбутнім чоловіком.

Конкурентна валідність оцінюється за кореляцією розробленого тесту з іншими, валідність яких щодо параметра встановлено. П. Клайн зазначає, що дані про конкурентну валідність корисні тоді, коли є тести, що незадовільно працюють, для вимірювання деяких змінних, а нові створюються для того, щоб поліпшити якість вимірювання. Але виникає питання: якщо вже існує ефективний тест, то навіщо потрібен такий самий новий? Прогностична валідність встановлюється за допомогою кореляції між показниками тесту і деяким критерієм, що характеризує властивість, що вимірюється, але в більш пізній час. Наприклад, прогностична валідність будь-якого тесту інтелекту може бути показана кореляцією його показників, отриманих у випробуваного віком 10 років, з академічною успішністю в період закінчення середньої школи. Л. Кронбах вважає прогностичну валідність найбільш переконливим доказом того, що тест вимірює саме те, для чого він був призначений. Основна проблема, з якою стикається дослідник, який намагається встановити прогностичну валідність свого тесту, полягає у виборі зовнішнього критерію. Особливо це стосується вимірювання особистісних змінних, де підбір зовнішнього критерію - надзвичайно складне завдання, вирішення якої потребує чималої винахідливості. Дещо простіше ситуація при визначенні зовнішнього критерію для когнітивних тестів, однак і в цьому випадку досліднику доводиться «закривати очі» на багато проблем. Так, академічна успішність традиційно використовується як зовнішній критерій при валідизації тестів інтелекту, але в той же час добре відомо, що успіхи в навчанні далеко не єдине свідчення високого інтелекту. Інкрементна валідність має обмежене значення і стосується випадку, коли один тест із батареї тестів може мати низьку кореляцію з критерієм, але не перекриватися іншими тестами з цієї батареї. У цьому випадку даний тест має інкрементну валідність. Це може бути корисним при проведенні профвідбору за допомогою психологічних тестів. Диференційна валідність може бути проілюстрована з прикладу тестів інтересів. Тести інтересів зазвичай корелюють із академічною успішністю, але по-різному для різних дисциплін. Значення диференціальної валідності, як і інкрементної, обмежено .

Змістовна валідність визначається через підтвердження того, що завдання тесту відображають усі аспекти області поведінки, що вивчається. Зазвичай вона визначається у тестів досягнень (сенс вимірюваного параметра повністю зрозумілий), які, як говорилося, тестами, власне психологічними є. Насправді визначення змістовної валідності підбираються експерти, які вказують, яка область поведінки найважливіша, наприклад, для музичних здібностей, та був, виходячи з цього, генеруються завдання тесту, які знову оцінюють експерти. Конструктна валідність тесту демонструється повним наскільки це можливо описом змінної, для вимірювання якої призначається тест. По суті, конструктна валідність включає всі підходи до визначення валідності, які були перераховані вище. Кронбах і Міл, які запровадили у психодіагностику поняття конструктної валідності, намагалися вирішити проблему відбору критеріїв під час валідизації тесту. Вони підкреслювали, що у багатьох випадках жоден окремо взятий критерій неспроможна служити для валідизації окремого тесту. Можна вважати, що вирішення питання про конструктну валідність тесту є пошуком відповіді на два питання:1) чи існує реально деяка властивість; 2) чи надійно вимірює даний тест індивідуальні відмінності у цій властивості. Цілком зрозуміло, що з конструктною валідністю пов'язана проблема об'єктивності в інтерпретації результатів вивчення конструктної валідності, проте ця проблема загальнопсихологічна і виходить за рамки валідності.

Валідність(від англ. valid - «дійсний, придатний, що має силу») - комплексна характеристика методики (тесту), що включає відомості про область досліджуваних явищ та репрезентативність діагностичної процедури по відношенню до них.

У найпростішому та загальному формулюванні валідність тесту – це «поняття, що вказує нам, що тест вимірює і наскільки добре він це робить» А. Анастазі , 1982). У стандартних вимогах до психологічних та освітніх тестів валідність визначається як комплекс відомостей про те, щодо яких груп психологічних властивостей особистості можуть бути зроблені висновки за допомогою методики, а також про рівень обґрунтованості висновків при використанні конкретних тестових оцінок чи інших форм оцінювання. У психодіагностиці валідність – обов'язкова та найважливіша частина відомостей про методику, що включає (поряд із зазначеними вище) дані про ступінь узгодженості результатів тесту з іншими відомостями про досліджувану особу, отриманими з різних джерел (теоретичних очікувань, спостережень, експертних оцінок, результатів інших методик, достовірність яких встановлено і т. д.), судження про обґрунтованість прогнозу розвитку досліджуваної якості, зв'язок галузі поведінки, що вивчається, або особливості особистості з певними психологічними конструктами. Валідність визначає також конкретну спрямованість методики (контингент піддослідних за віком, рівнем освіти, соціально-культурної власності тощо. буд.) і рівень обгрунтованості висновків у конкретних умовах використання тесту. У сукупності відомостей, що характеризують валідність тесту, міститься інформація про адекватність застосовуваної моделі діяльності з точки зору відображення в ній психологічної особливості, що вивчається, про ступінь однорідності завдань (субтестів), включених у тест, їх сумісності при кількісній оцінці результатів тесту в цілому.

2. Найважливіші складові валідності

Найважливіша складова валідності – визначення галузі досліджуваних властивостей – має важливе теоретичне і практичного значення під час виборів методики дослідження та інтерпретації її даних. Інформація, що міститься в назві тесту, як правило, недостатня для судження про сферу його застосування. Це лише позначення, ім'я конкретної процедури дослідження. Як приклад можна навести широко відому коректурну пробу. Область досліджуваних властивостей особистості включає стійкість та концентрацію уваги, психомоторну рухливість. Дана методика дозволяє отримувати оцінки виразності цих психологічних якостей у випробуваного, добре узгоджується з показниками, отриманими іншими методами, і, отже, має високу валідність. Поряд з цим результати виконання коректурної проби схильні до впливу великої кількості інших факторів (нейродинамічних особливостей, характеристик короткочасної та оперативної пам'яті, індивідуальної переносимості монотонії, розвитку навички читання, особливостей зору і т. д.), стосовно яких методика не є специфічною. У разі застосування коректурної проби для їх вимірювання валідність буде невеликою або сумнівною.

Таким чином, окреслюючи сферу застосування методики, валідність відображає рівень обґрунтованості результатів вимірювання. Очевидно, що при невеликій кількості супутніх факторів, що впливають на результат дослідження, а значить, при їх незначному впливі на результат тесту достовірність тестових оцінок буде вищою. Ще більшою мірою достовірність даних тесту визначається набором вимірюваних властивостей, їх значимістю для здійснення складної діяльності, що діагностується, повнотою і суттєвістю відображення в матеріалі тесту предмета вимірювання. Так, щоб задовольнити вимогам валідності, діагностична методика, призначена для профвідбору, повинна включати аналіз широкого кола нерідко різних за своєю природою показників, найбільш важливих для досягнення успіху в даній професії (збільшення уваги, особливостей пам'яті, психомоторики, емоційної стійкості, інтересів, нахилів та т. д.). Як видно з вищевикладеного, до поняття валідності входить велика кількість різноманітної інформації про тест. Різні категорії цих відомостей та способи їх отримання утворюють типи валідності.

Діагностична (конкурентна) валідністьвідображає здатність тесту диференціювати випробуваних за ознакою, що вивчається. Аналіз діагностичної валідності має відношення до встановлення відповідності показників тесту реальному стану психологічних особливостей випробуваного на момент обстеження. Прикладом визначення цього валідності може бути дослідження за методом контрастних груп. Проведення тесту інтелекту у дітей, що нормально розвиваються, та їх однолітків з порушеннями в інтелектуальному розвитку може виявити глибокі кількісні та якісні відмінності у виконанні завдань порівнюваними групами. Ступінь надійності диференціації дітей першої та другої груп за даними тесту буде характеристикою діагностичної валідності оцінки розумового розвитку, яка отримується за допомогою даної методики.

Відомості, що характеризують ступеня обґрунтованості та статистичної надійності розвитку досліджуваної психологічної особливості у майбутньому, становлять прогностичну валідністьметодики Висновок про цей тип валідності може бути отримано, наприклад, шляхом порівняння тестових оцінок в одній і тій же групі випробуваних через певний час. Основою прогностичної валідності є визначення того, наскільки важлива досліджувана ознака з точки зору діяльності випробуваного в майбутньому з урахуванням обставин, що змінюються закономірно, переходу на інший рівень розвитку.

Більшість методик, особливо тестів здібностей та інтелекту, досліджується щодо діагностичної та прогностичної валідності. Два цих типи валідності нерідко поєднують у поняття емпіричної валідності.Тут підкреслюється спільність підходу до їх визначення, який здійснюється шляхом статистичного корелювання балів (оцінок) за тестом та показниками за зовнішнім параметром, обраним як валідизація критерію (див. валідність критерійна). Критерій валідності виступає як міра, показник досліджуваних психологічних особливостей. Так, тести спеціальних здібностей перевіряються шляхом зіставлення з результатами навчання з інших предметів, досягненнями в музиці, малюванні тощо. буд. Критерій валідності є незалежним від тесту показником, що має безпосередню цінність для певних областей практичної діяльності. Наприклад, у галузі педагогічної психології це успішність, у психології праці – продуктивність, у медичній психології – стан здоров'я тощо. буд. .

У багатьох випадках буває складно чи неможливо підібрати адекватний критерій валідизації. При цьому особливої ​​важливості набуває комплекс характеристик, що входять до типу теоретичної валідності. При розробці та використанні тесту може бути сформульований ряд гіпотез про те, як корелюватиме досліджуваний тест з іншим тестом, що вимірює споріднені або протилежні психологічні характеристики піддослідних. Ці гіпотези висуваються на підставі теоретичних уявлень про вимірювані властивості як про психологічний конструкт. Підтвердження гіпотез свідчить про теоретичну обґрунтованість методики, тобто про ступінь її конструктної валідності. Цей тип валідності є найбільш складним та комплексним. Для підтвердження відповідності одержуваних за допомогою тесту результатів теоретичним очікуванням та закономірностям використовується найрізноманітніша інформація, у тому числі що стосується інших типів валідності.

Валідність змістовна (внутрішня, логічна)– комплекс відомостей про репрезентативність завдань тесту по відношенню до вимірюваних властивостей та особливостей. Однією з основних вимог при валідизації методики у цьому напрямі є відображення у змісті тесту ключових сторін психологічного феномену, що вивчається. Якщо область поведінки чи особливість дуже складна, то змістовна валідність вимагає подання у завданнях тесту всіх найважливіших складових елементів досліджуваного явища. Так, при розробці тесту вербального інтелекту необхідно запровадити групи завдань (субтестів) для перевірки досить різнорідних за своїм операційним складом навичок письма та читання.

Поряд з перерахованими основними типами валідності (змістовної, критеріальної та конструктної) на практиці виділяють факторну, перехресну (конвергентну)і дискримінантнувалідності.

3. Основні типи валідності (діагностична, прогностична, емпірична, критеріальна, конструктна, змістовна). Класифікація типів валідності

Класифікація типів валідності достатньо умовна, оскільки, з одного боку, нерідко для різних критеріїв валідності застосовуються загальні методи визначення, – а сторони, одні й самі вихідні дані можуть інтерпретуватися з погляду різних типів валідності.

Класифікація типів валідності:

1) конструктна;

2) диференціальна;

3) конвергентна;

4) дискримінативна (дискримінантна);

5) факторна;

6) валідність за віковою диференціацією;

7) критеріальна;

8) діагностична (конкурентна);

9) поточна;

10) прогностична;

11) інкрементна;

12) синтетична;

13) ретроспективна;

14) емпірична;

16) лицьова (очевидна).

Інші види валідності:

1) ілюзорна;

2) екологічна.

4. Відносність поділу валідності на типи. Концепція комплексу валідності. Обґрунтування необхідності періодичної валідизації психодіагностичних методик

У психологічній діагностиці немає універсального підходи до характеристики валідності. Для валідизації кожного виду психодіагностичних процедур та окремих тестів можуть застосовуватись різні типи валідності. Відомості, що входять до комплексу валідності, можна оцінити якісно та кількісно (за допомогою коефіцієнта валідності), нерідко їх можна описати. Однак через складність, комплексність, ситуативність по відношенню до конкретних умов застосування методики валідність в цілому неможливо виміряти, про неї можна лише судити.

Реальна валідність розкривається лише внаслідок накопичення значного досвіду роботи з тестами. Отримання нових, розширених даних про валідність може радикально змінити уявлення про сферу застосування та ефективність методики. Так, деякі методики, розроблені для діагностики вербальних факторів інтелекту, з достатньою валідністю відображають лише рівень обізнаності. Сфера застосування тесту в ході тривалої валідизації може бути, навпаки, розширена. Як приклад можна навести прогресивні матриці Равена, розроблені для вивчення певних сторін перцептивної діяльності, проте виявилися значною мірою насичені фактором, загальним для тестів інтелекту (див. фактор G). Реальна валідність низки психодіагностичних методик, особливо тестів інтелекту, досягнень у навчанні, професійної придатності, особистісних опитувальників змінюється з часом. Це пояснюється старінням вікових статистичних норм, зміною соціальних норм та зразків поведінки, методів навчання та змісту завдань, вимог до професій. Ця обставина створює необхідність періодичного контролю валідності методик.