Penilaian kesahan metodologi boleh berbentuk kuantitatif dan kualitatif. Kesahan kaedah, jenis kesahan

Selepas kebolehpercayaan, satu lagi kriteria utama untuk menilai kualiti kaedah ialah kesahan. Persoalan kesahihan metodologi diputuskan hanya selepas kebolehpercayaan yang mencukupi telah ditetapkan, kerana metodologi yang tidak boleh dipercayai tidak boleh sah. Tetapi teknik yang paling boleh dipercayai tanpa mengetahui kesahihannya boleh dikatakan tidak berguna.

Perlu diingatkan bahawa persoalan kesahihan masih merupakan salah satu yang paling sukar. Takrifan yang paling berakar dari konsep ini adalah yang diberikan dalam buku oleh A. Anastasi: "Kesahihan ujian ialah konsep yang memberitahu kita apa yang diukur oleh ujian dan sejauh mana ia melakukannya."

Kesahan pada dasarnya adalah ciri yang kompleks, termasuk, dalam satu pihak, maklumat tentang sama ada teknik itu sesuai untuk mengukur untuk tujuan ia dicipta, dan sebaliknya, apakah keberkesanan, kecekapan, dan kegunaan praktikalnya.

Atas sebab ini, tidak ada pendekatan universal tunggal untuk menentukan kesahihan. Bergantung pada sisi kesahihan yang ingin dipertimbangkan oleh penyelidik, kaedah pembuktian yang berbeza juga digunakan. Dalam erti kata lain, konsep kesahan merangkumi jenisnya yang berbeza, yang mempunyai makna tersendiri. Menyemak kesahihan sesuatu teknik dipanggil pengesahan.

Kesahan dalam pengertian pertama adalah berkaitan dengan metodologi itu sendiri, iaitu, ia adalah kesahihan alat pengukur. Semakan ini dipanggil pengesahan teori. Kesahan dalam erti kata kedua sudah merujuk tidak begitu banyak kepada metodologi mengenai tujuan penggunaannya. Ini adalah pengesahan pragmatik.

Sebagai kesimpulan, kita boleh mengatakan perkara berikut:

» dalam pengesahan teori, penyelidik berminat dengan sifat yang diukur dengan teknik. Ini, pada dasarnya, bermakna pengesahan psikologi sebenar sedang dijalankan;

» dengan pengesahan pragmatik, intipati subjek pengukuran (harta psikologi) tidak dapat dilihat. Penekanan utama adalah untuk membuktikan bahawa "sesuatu" yang diukur oleh metodologi mempunyai hubungan dengan bidang amalan tertentu.

Menjalankan pengesahan teori, berbeza dengan pengesahan pragmatik, kadangkala jauh lebih sukar. Tanpa pergi ke butiran khusus buat masa ini, marilah kita memikirkan secara umum tentang bagaimana kesahan pragmatik diperiksa: beberapa kriteria luaran yang bebas daripada metodologi dipilih yang menentukan kejayaan dalam aktiviti tertentu (pendidikan, profesional, dll.), dan dengannya keputusan teknik diagnostik dibandingkan. Jika perkaitan antara mereka diiktiraf sebagai memuaskan, maka kesimpulan dibuat tentang kepentingan praktikal, kecekapan, dan keberkesanan teknik diagnostik.

Untuk menentukan kesahan teori, adalah lebih sukar untuk mencari mana-mana kriteria bebas yang terletak di luar metodologi. Oleh itu, pada peringkat awal perkembangan testologi, apabila konsep kesahan baru sahaja terbentuk, terdapat idea intuitif tentang apa sebenarnya ukuran ujian ini:

1) teknik itu dipanggil sah, kerana apa yang diukur hanya "jelas";

2) bukti kesahihan adalah berdasarkan keyakinan penyelidik bahawa kaedahnya membolehkan "memahami subjek";

3) metodologi itu dianggap sah (iaitu, pernyataan diterima bahawa ujian ini dan ini mengukur kualiti ini dan itu) hanya kerana teori yang berasaskan metodologi itu dibina adalah "sangat baik".

Penerimaan atas kepercayaan terhadap dakwaan tentang kesahihan metodologi tidak dapat bertahan lama. Manifestasi pertama kritikan yang benar-benar saintifik menafikan pendekatan ini: pencarian bukti kukuh secara saintifik bermula.

Oleh itu, untuk menjalankan pengesahan teori metodologi adalah untuk membuktikan bahawa metodologi mengukur dengan tepat sifat, kualiti yang, mengikut niat penyelidik, harus diukur.

Jadi, sebagai contoh, jika ujian dibangunkan untuk mendiagnosis perkembangan mental kanak-kanak, adalah perlu untuk menganalisis sama ada ia benar-benar mengukur perkembangan ini, dan bukan beberapa ciri lain (contohnya, keperibadian, watak, dll.). Oleh itu, untuk pengesahan teori, masalah utama ialah hubungan antara fenomena psikologi dan penunjuknya, di mana fenomena psikologi ini cuba diketahui. Semakan sedemikian menunjukkan bagaimana niat penulis dan hasil metodologi bertepatan.

Ia tidak begitu sukar untuk mengesahkan kaedah baru secara teori jika sudah ada kaedah dengan kesahihan yang terbukti untuk mengukur harta yang diberikan. Kehadiran korelasi antara kaedah baru dan serupa, yang telah terbukti menunjukkan bahawa kaedah yang dibangunkan mengukur kualiti psikologi yang sama dengan kaedah rujukan. Dan jika kaedah baru pada masa yang sama ternyata lebih padat dan menjimatkan dalam melaksanakan dan memproses hasilnya, maka psikodiagnostik mendapat peluang untuk menggunakan alat baru dan bukannya yang lama. Teknik ini sering digunakan dalam psikofisiologi pembezaan apabila mencipta kaedah untuk mendiagnosis sifat asas sistem saraf manusia (lihat Bab 16).

Tetapi kesahan teori dibuktikan dengan membandingkan bukan sahaja dengan penunjuk yang berkaitan, tetapi juga dengan penunjuk yang, berdasarkan hipotesis, tidak sepatutnya ada hubungan yang signifikan. Oleh itu, untuk menguji kesahan teori, adalah penting, dalam satu pihak, untuk mewujudkan tahap sambungan dengan teknik yang berkaitan (convergent validity), dan sebaliknya, ketiadaan hubungan ini dengan kaedah yang mempunyai teori yang berbeza. asas (kesahihan diskriminasi).

Adalah lebih sukar untuk menjalankan pengesahan teori kaedah apabila cara pengesahan sedemikian adalah mustahil. Selalunya, ini adalah situasi yang dihadapi oleh penyelidik. Dalam keadaan sedemikian, hanya pengumpulan beransur-ansur pelbagai maklumat tentang harta yang dikaji, analisis premis teori dan data eksperimen, dan pengalaman penting dalam bekerja dengan teknik yang memungkinkan untuk mendedahkan makna psikologinya.

Peranan penting dalam memahami apa ukuran metodologi dimainkan oleh perbandingan penunjuknya dengan bentuk aktiviti praktikal. Tetapi di sini adalah amat penting bahawa metodologi diusahakan secara menyeluruh dari segi teori, iaitu, wujud asas saintifik yang kukuh dan berasas. Kemudian, apabila membandingkan metodologi dengan kriteria luaran yang diambil daripada amalan harian, sepadan dengan apa yang diukur, maklumat boleh diperolehi yang mengukuhkan idea teori tentang intipatinya.

Adalah penting untuk diingat bahawa jika kesahihan teori terbukti, maka tafsiran penunjuk yang diperolehi menjadi lebih jelas dan lebih jelas, dan nama metodologi sepadan dengan skop penggunaannya.

Bagi pengesahan pragmatik, ia membayangkan ujian metodologi dari segi keberkesanan praktikal, kepentingan, kegunaannya, kerana masuk akal untuk menggunakan teknik diagnostik hanya apabila terbukti bahawa harta yang diukur ditunjukkan dalam situasi kehidupan tertentu, dalam jenis tertentu. daripada aktiviti. Ia amat dititikberatkan terutamanya di mana timbul persoalan pemilihan.

Jika kita kembali kepada sejarah perkembangan testologi, kita boleh membezakan tempoh (20-30s) apabila kandungan saintifik ujian dan "bagasi" teori mereka kurang menarik. Adalah penting bahawa ujian itu berfungsi dan membantu memilih orang yang paling bersedia dengan cepat. Kriteria empirikal untuk menilai item ujian dianggap sebagai satu-satunya garis panduan yang benar dalam menyelesaikan masalah saintifik dan gunaan.

Penggunaan kaedah diagnostik dengan justifikasi empirikal semata-mata, tanpa asas teori yang jelas, sering membawa kepada kesimpulan pseudoscientific dan cadangan praktikal yang tidak wajar. Adalah mustahil untuk menamakan ciri tersebut dengan tepat, kualiti yang ditunjukkan oleh ujian. B. M. Teplov, menganalisis ujian tempoh itu, memanggil mereka "ujian buta."

Pendekatan kepada masalah kesahan ujian ini adalah tipikal sehingga awal 1950-an. bukan sahaja di USA, malah di negara lain. Kelemahan teori kaedah pengesahan empirikal tidak boleh tetapi menyebabkan kritikan daripada para saintis yang, dalam pembangunan ujian, meminta untuk bergantung bukan sahaja pada empirisme dan amalan "telanjang", tetapi juga pada konsep teori. Amalan tanpa teori adalah buta, dan teori tanpa amalan adalah mati. Pada masa ini, penilaian secara teori dan pragmatik terhadap kesahihan kaedah dianggap sebagai yang paling produktif.

Untuk menjalankan pengesahan pragmatik metodologi, iaitu, untuk menilai keberkesanan, kecekapan, kepentingan praktikalnya, kriteria luaran bebas biasanya digunakan - penunjuk manifestasi harta yang dikaji dalam kehidupan seharian. Kriteria ini boleh:

1) prestasi (untuk ujian kebolehan belajar, ujian pencapaian, ujian kecerdasan);

2) pencapaian pengeluaran (untuk kaedah orientasi profesional);

3) keberkesanan aktiviti sebenar - lukisan, pemodelan, dll. (untuk ujian kebolehan khas);

4) penilaian subjektif (untuk ujian personaliti). Penyelidik Amerika D. Tiffin dan E. McCormick, selepas

analisis kriteria luaran yang digunakan untuk membuktikan kesahihan, mengenal pasti empat jenis daripadanya:

1) kriteria prestasi (ia mungkin termasuk seperti jumlah kerja yang dilakukan, prestasi akademik, masa yang dihabiskan untuk latihan, kadar pertumbuhan kelayakan, dsb.);

2) kriteria subjektif (ia termasuk pelbagai jenis jawapan yang mencerminkan sikap seseorang terhadap sesuatu atau seseorang, pendapat, pandangan, keutamaannya; biasanya kriteria subjektif diperoleh melalui temu bual, soal selidik, soal selidik);

3) kriteria fisiologi (ia digunakan dalam mengkaji pengaruh persekitaran dan pembolehubah situasi lain pada tubuh dan jiwa manusia; kadar nadi, tekanan darah, rintangan elektrik kulit, gejala keletihan, dll. diukur);

4) kriteria rawak (digunakan apabila tujuan kajian berkenaan, contohnya, masalah memilih untuk bekerja mereka yang kurang terdedah kepada kemalangan).

Kriteria luaran mesti memenuhi tiga keperluan asas:

1) ia mestilah relevan;

2) bebas daripada gangguan (kontaminasi);

3) boleh dipercayai].

Perkaitan merujuk kepada korespondensi semantik alat diagnostik kepada kriteria penting bebas. Dalam erti kata lain, mesti ada keyakinan bahawa kriteria melibatkan tepat ciri-ciri jiwa individu yang juga diukur dengan teknik diagnostik. Kriteria luaran dan teknik diagnostik mestilah dalam korespondensi semantik dalaman antara satu sama lain, secara kualitatif homogen dalam intipati psikologi.

Jika, sebagai contoh, ujian mengukur ciri-ciri individu pemikiran, keupayaan untuk melakukan tindakan logik dengan objek, konsep tertentu, maka dalam kriteria seseorang harus mencari manifestasi kemahiran ini dengan tepat. Ini terpakai sama rata untuk aktiviti profesional. Ia tidak mempunyai satu, tetapi beberapa matlamat, tugas, masing-masing khusus dan mengenakan syarat sendiri untuk pelaksanaan. Ini membayangkan wujudnya beberapa kriteria untuk melaksanakan aktiviti profesional. Oleh itu, seseorang tidak seharusnya membandingkan kejayaan kaedah diagnostik dengan kecekapan pengeluaran secara umum. Ia adalah perlu untuk mencari kriteria yang, mengikut sifat operasi yang dilakukan, adalah setanding dengan metodologi.

Jika ia tidak diketahui berkenaan dengan kriteria luaran sama ada ia berkaitan dengan harta yang diukur atau tidak, maka membandingkan keputusan teknik psikodiagnostik dengannya menjadi tidak berguna. Ia tidak membenarkan untuk membuat sebarang kesimpulan yang boleh menilai kesahihan metodologi.

Keperluan untuk bebas daripada gangguan (pencemaran) disebabkan oleh fakta bahawa, sebagai contoh, kejayaan pendidikan atau industri bergantung pada dua pembolehubah: pada orang itu sendiri, ciri-ciri individunya, diukur dengan kaedah, dan pada situasi, keadaan pengajian, kerja, yang boleh membawa gangguan, “mencemarkan » kriteria yang digunakan. Untuk mengelakkan ini sedikit sebanyak, kumpulan orang yang berada dalam keadaan yang lebih kurang sama harus dipilih untuk penyelidikan. Anda juga boleh menggunakan kaedah lain. Ia terdiri daripada membetulkan pengaruh gangguan. Pelarasan ini biasanya bersifat statistik. Jadi, sebagai contoh, produktiviti tidak boleh diambil secara mutlak, tetapi berkaitan dengan produktiviti purata pekerja dengan keadaan kerja yang serupa.

Apabila dikatakan bahawa kriteria mesti mempunyai kebolehpercayaan yang ketara secara statistik, ini bermakna ia mesti mencerminkan ketekalan dan kestabilan fungsi yang dikaji.

Pencarian untuk kriteria yang mencukupi dan mudah dikenal pasti adalah salah satu tugas pengesahan yang paling penting dan sukar. Dalam testologi Barat, banyak kaedah dibatalkan kelayakan hanya kerana tidak mungkin untuk mencari kriteria yang sesuai untuk pengesahan mereka. Khususnya, bagi kebanyakan soal selidik, data tentang kesahihannya boleh dipersoalkan, kerana sukar untuk mencari kriteria luaran yang mencukupi yang sepadan dengan apa yang mereka ukur.

Penilaian kesahan kaedah boleh berbentuk kuantitatif dan kualitatif.

Untuk mengira penunjuk kuantitatif - pekali kesahan - keputusan yang diperoleh menggunakan teknik diagnostik dibandingkan dengan data yang diperoleh oleh kriteria luaran orang yang sama. Jenis korelasi linear yang berbeza digunakan (menurut Spearman, menurut Pearson).

Berapa banyak subjek yang diperlukan untuk mengira kesahan?

Amalan telah menunjukkan bahawa tidak boleh kurang daripada 50 daripadanya, tetapi lebih daripada 200 adalah yang terbaik. Persoalan yang sering timbul, apakah nilai pekali kesahan yang sepatutnya untuk dianggap boleh diterima? Secara amnya, diambil perhatian bahawa pekali kesahan adalah mencukupi secara statistik. Pekali kesahan kira-kira 0.2-0.3 diiktiraf sebagai rendah, 0.3-0.5 sebagai sederhana, dan lebih 0.6 sebagai tinggi.

Tetapi, seperti yang ditekankan oleh A. Anastasi, K. M. Gurevich dan lain-lain, tidak selalu betul untuk menggunakan korelasi linear untuk mengira pekali kesahan. Teknik ini dibenarkan hanya apabila terbukti bahawa kejayaan dalam beberapa aktiviti adalah berkadar terus dengan kejayaan dalam melaksanakan ujian diagnostik. Kedudukan ahli ujian asing, terutamanya mereka yang terlibat dalam kesesuaian profesional dan pemilihan profesional, selalunya datang kepada pengiktirafan tanpa syarat bahawa orang yang menyelesaikan paling banyak tugas dalam ujian adalah lebih sesuai untuk profesion. Tetapi mungkin juga untuk berjaya dalam aktiviti, perlu mempunyai harta pada tahap 40% daripada penyelesaian ujian. Skor yang lebih tinggi pada ujian tidak lagi memberi sebarang perbezaan kepada profesion. Contoh ilustrasi dari monograf oleh K. M. Gurevich: seorang posmen mesti boleh membaca, tetapi sama ada dia membaca pada kelajuan biasa atau pada kelajuan yang sangat tinggi tidak lagi menjadi kepentingan profesional. Dengan korelasi sedemikian antara penunjuk metodologi dan kriteria luaran, cara yang paling mencukupi untuk mewujudkan kesahan mungkin adalah kriteria perbezaan.

Kes lain juga mungkin: tahap harta yang lebih tinggi daripada yang diperlukan oleh profesion mengganggu kejayaan profesional. Jadi, pada awal abad ke-20. penyelidik Amerika F. Taylor mendapati bahawa pekerja yang paling maju dalam pengeluaran mempunyai produktiviti buruh yang rendah. Iaitu, tahap perkembangan mental mereka yang tinggi menghalang mereka daripada bekerja dengan sangat produktif. Dalam kes ini, analisis varians atau pengiraan nisbah korelasi akan lebih sesuai untuk mengira pekali kesahan.

Seperti yang ditunjukkan oleh pengalaman ahli testologi asing, tidak ada satu pun prosedur statistik yang dapat mencerminkan sepenuhnya kepelbagaian penilaian individu. Oleh itu, model lain sering digunakan untuk membuktikan kesahihan kaedah - penilaian klinikal. Ini tidak lebih daripada penerangan kualitatif tentang intipati harta yang dikaji. Dalam kes ini, kita bercakap tentang penggunaan teknik yang tidak berdasarkan pemprosesan statistik.

Terdapat beberapa jenis kesahihan, disebabkan oleh keanehan kaedah diagnostik, serta status sementara kriteria luaran. Walau bagaimanapun, berikut adalah yang paling biasa.

1. Kesahan "mengikut kandungan". Teknik ini digunakan, contohnya, dalam ujian pencapaian. Biasanya, ujian pencapaian tidak merangkumi semua bahan yang telah dilalui oleh pelajar, tetapi sebahagian kecil daripadanya (3-4 soalan). Adakah mungkin untuk memastikan bahawa jawapan yang betul kepada beberapa soalan ini menunjukkan asimilasi semua bahan? Inilah yang harus dijawab oleh semakan kesahan kandungan. Untuk melakukan ini, perbandingan kejayaan pada ujian dengan penilaian pakar guru (untuk bahan ini) dijalankan. Kesahan "mengikut kandungan" juga digunakan pada ujian berasaskan kriteria. Teknik ini kadangkala dipanggil kesahan logik.

2. Kesahan "dengan serentak", atau kesahan semasa, ditentukan menggunakan kriteria luaran yang mana maklumat dikumpulkan serentak dengan eksperimen mengikut kaedah yang diuji. Dengan kata lain, data terkini dikumpul: prestasi akademik semasa tempoh percubaan,

prestasi dalam tempoh yang sama, dsb. Mereka dibandingkan dengan keputusan kejayaan dalam ujian.

3. Kesahan "ramalan" (nama lain ialah kesahan "ramalan"). Ia juga ditentukan oleh kriteria luaran, tetapi maklumat mengenainya dikumpulkan beberapa lama selepas ujian. Kriteria luaran biasanya keupayaan seseorang, dinyatakan dalam beberapa penilaian, kepada jenis aktiviti yang dia dinilai mengikut keputusan ujian diagnostik. Walaupun teknik ini paling sesuai untuk tugas teknik diagnostik - ramalan kejayaan masa depan - adalah sangat sukar untuk menerapkannya. Ketepatan diagnosis adalah berkait songsang dengan masa yang diberikan untuk ramalan tersebut. Lebih banyak masa berlalu selepas pengukuran, lebih banyak faktor mesti diambil kira semasa menilai kepentingan prognostik teknik. Walau bagaimanapun, hampir mustahil untuk mengambil kira semua faktor yang mempengaruhi ramalan.

4. Kesahan "retrospektif". Ia ditentukan berdasarkan kriteria yang mencerminkan peristiwa atau keadaan kualiti pada masa lalu. Ia boleh digunakan untuk mendapatkan maklumat dengan cepat tentang keupayaan ramalan teknik. Oleh itu, untuk menguji sejauh mana markah yang baik pada ujian bakat sepadan dengan pembelajaran pesat, seseorang boleh membandingkan gred lalu, pendapat pakar lepas, dan lain-lain dalam individu yang mempunyai penunjuk diagnostik tinggi dan rendah pada masa ini.

Apabila membentangkan data tentang kesahihan metodologi yang dibangunkan, adalah penting untuk menunjukkan dengan jelas jenis kesahan yang dimaksudkan (mengikut kandungan, dengan serentak, dsb.). Adalah juga wajar untuk melaporkan maklumat tentang bilangan dan ciri-ciri individu yang pengesahan telah dijalankan. Maklumat sedemikian membolehkan pengkaji menggunakan teknik tersebut untuk menentukan sejauh mana kesahihan teknik ini untuk kumpulan yang dia ingin mengaplikasikannya. Seperti dalam kes kebolehpercayaan, perlu diingat bahawa sesuatu teknik mungkin mempunyai kesahan yang tinggi dalam satu sampel dan kesahan rendah dalam yang lain. Oleh itu, sekiranya pengkaji bercadang untuk menggunakan metodologi ke atas sampel subjek yang berbeza secara signifikan daripada ujian kesahan dijalankan, beliau perlu melaksanakan semula ujian tersebut. Pekali kesahan yang diberikan dalam manual hanya terpakai kepada kumpulan subjek yang serupa dengan subjek yang ditentukan.

Isu kesahan diputuskan selepas kebolehpercayaan telah diwujudkan, kerana kaedah yang tidak boleh dipercayai tidak boleh sah.

Kesahan ujian ialah konsep yang memberitahu kita apa yang diukur oleh ujian dan sejauh mana ia melakukannya (A. Anastasi). Kesahan pada dasarnya adalah ciri yang kompleks, termasuk, dalam satu pihak, maklumat tentang sama ada teknik itu sesuai untuk mengukur untuk tujuan ia dicipta, dan sebaliknya, apakah keberkesanan, kecekapan, dan kegunaan praktikalnya.

Kesahan - pematuhan kajian tertentu dengan piawaian yang diterima (percubaan yang sempurna).

Kesahan dalam pengertian pertama adalah berkaitan dengan metodologi itu sendiri, i.e. ialah kesahan alat pengukur. Semakan ini dipanggil pengesahan teori. Kesahan dalam erti kata kedua sudah merujuk tidak begitu banyak kepada metodologi tetapi kepada tujuan penggunaannya. Ini adalah pengesahan pragmatik.

Dalam pengesahan teori, penyelidik berminat dengan sifat yang diukur dengan teknik.

Memandangkan sukar untuk mencari mana-mana kriteria bebas yang terletak di luar metodologi untuk menentukan pengesahan teori, dan oleh itu kenyataan yang tidak berasas tentang kesahihan metodologi ini sebelum ini diambil mudah. Oleh kerana pengesahan teori bertujuan untuk membuktikan bahawa teknik mengukur dengan tepat sifat yang sepatutnya diukur. Untuk pengesahan teori, masalah utama ialah hubungan antara fenomena psikologi dan penunjuknya, yang mana fenomena psikologi ini cuba diketahui. Ia menunjukkan bahawa niat penulis dan hasil teknik itu bertepatan.

Ia tidak begitu sukar untuk mengesahkan teknik baru secara teori jika sudah ada teknik dengan kesahihan yang diketahui dan terbukti untuk mengukur sifat yang diberikan. Kehadiran korelasi antara kaedah baru dan kaedah lama yang serupa menunjukkan bahawa kaedah yang dibangunkan mengukur kualiti psikologi yang sama dengan kaedah rujukan.

Untuk menguji kesahan teori, adalah penting, dalam satu pihak, untuk mewujudkan tahap sambungan dengan teknik yang berkaitan (convergent validity), dan sebaliknya, ketiadaan hubungan ini dengan kaedah yang mempunyai asas teori yang berbeza ( kesahan diskriminasi).

Peranan penting dalam memahami apa ukuran metodologi dimainkan oleh perbandingan penunjuknya dengan bentuk aktiviti praktikal. Adalah penting bahawa metodologi diusahakan dari segi teori.

Pengesahan Pragmatik

Keberkesanan praktikal, kepentingan, kegunaan metodologi disemak, kerana metodologi hanya boleh digunakan apabila terbukti bahawa sifat yang diukur ditunjukkan dalam jenis Aktiviti tertentu.

Untuk menguji kesahan pragmatik, kriteria luaran bebas digunakan - penunjuk manifestasi harta yang dikaji dalam kehidupan seharian. Kriteria sedemikian boleh menjadi prestasi akademik (untuk ujian keupayaan pembelajaran, ujian pencapaian, ujian kecerdasan), pencapaian pengeluaran (untuk kaedah orientasi profesional), keberkesanan Aktiviti sebenar - lukisan, pemodelan, dan sebagainya (untuk ujian kebolehan khas), penilaian subjektif ( untuk ujian personaliti).

Penyelidik Amerika Tiffin dan McCormick mengenal pasti 4 jenis kriteria luaran:

1) Kriteria prestasi (jumlah kerja yang dilakukan, prestasi akademik, masa, kadar pertumbuhan kelayakan).
2) Kriteria subjektif (termasuk pelbagai jenis jawapan yang mencerminkan sikap seseorang terhadap sesuatu, pendapatnya, pandangannya).
3) Kriteria fisiologi (digunakan dalam kajian pengaruh persekitaran luaran yang mempengaruhi badan dan jiwa).
4) Kriteria rawak (contohnya, apabila matlamat berkenaan dengan masalah memilih untuk bekerja orang yang kurang terdedah kepada kemalangan).

Kriteria luaran mesti mempunyai 3 keperluan utama: 1) Mesti relevan, iaitu, mesti ada keyakinan bahawa kriteria itu melibatkan dengan tepat ciri-ciri jiwa individu yang diukur dengan teknik diagnostik. Kriteria luaran dan model diagnostik mestilah dalam korespondensi semantik dalaman. 2) Mesti bebas daripada gangguan (kontaminasi). Adalah perlu untuk memilih untuk menyelidik kumpulan orang yang berada dalam keadaan yang lebih kurang sama 3) Mesti boleh dipercayai. Ketekalan dan kestabilan fungsi yang disiasat.

Penilaian kesahan metodologi boleh berbentuk kuantitatif dan kualitatif.

Untuk mengira penunjuk kuantitatif (pekali kesahan), keputusan yang diperoleh menggunakan kaedah diagnostik dibandingkan dengan data orang yang sama yang diperolehi oleh kriteria luaran. Jenis korelasi linear yang berbeza digunakan (menurut Spearman, menurut Pearsen).

Penerangan kualitatif tentang intipati harta yang diukur. Tiada pemprosesan statistik digunakan di sini. Terdapat beberapa jenis kesahan, disebabkan oleh keanehan teknik diagnostik, serta status sementara kriteria luaran: 1) Kesahan "mengikut kandungan" (digunakan dalam ujian pencapaian): 3-4 soalan dari topik besar boleh menunjukkan pengetahuan sebenar murid. Untuk melakukan ini, keputusan diagnostik dibandingkan dengan penilaian pakar guru. 2) Kesahan "dengan serentak" atau kesahan semasa - data yang berkaitan dengan masa sekarang dikumpul: prestasi akademik, produktiviti, dsb. Mereka mengaitkan dengan keputusan kejayaan dalam ujian. 3) Kesahan "ramalan" ("ramalan"). Ditentukan oleh kriteria luaran yang boleh dipercayai, tetapi maklumat mengenainya dikumpulkan beberapa lama selepas ujian. Ketepatan ramalan adalah berkait songsang dengan masa yang diberikan untuk ramalan tersebut. 4) Kesahan "retrospektif". Ia ditentukan berdasarkan kriteria yang mencerminkan peristiwa atau keadaan kualiti pada masa lalu. Ia boleh digunakan untuk mendapatkan maklumat dengan cepat tentang keupayaan ramalan teknik.

Sebelum kaedah psikodiagnostik boleh digunakan untuk tujuan praktikal, ia mesti diuji mengikut beberapa kriteria formal yang membuktikan kualiti dan keberkesanannya yang tinggi. Kriteria utama untuk menilai kaedah psikodiagnostik adalah kebolehpercayaan dan kesahan.

Sumbangan besar kepada pembangunan konsep ini telah dibuat oleh ahli psikologi asing (A. Anastasi, E. Ghiselli, J. Gilford, L. Cronbach, R. Thorndike, E. Hagen, dan lain-lain). Mereka membangunkan radas formal-logik dan matematik-statistik (pertama sekali, kaedah korelasi dan analisis sebenar) untuk membuktikan tahap pematuhan kaedah dengan kriteria di atas.

Dalam testologi tradisional, istilah "kebolehpercayaan" bermaksud ketekalan relatif, kestabilan, ketekalan keputusan ujian semasa penggunaan awal dan berulang pada subjek yang sama.

Kebolehpercayaan teknik- ini adalah kriteria yang menunjukkan ketepatan pengukuran psikologi, iaitu, ia membolehkan anda menilai betapa boleh dipercayai hasilnya.

Ini ialah ketekalan keputusan ujian subjek pada titik masa yang berbeza, semasa ujian rendah dan menengah dan menggunakan tugasan yang berbeza dari segi kesetaraan dan kandungan. Kebolehpercayaan mencirikan ujian sifat, tetapi bukan keadaan. sifat:

Kebolehulangan hasil penyelidikan.
Ketepatan pengukuran.
Kestabilan keputusan.

Tahap kebolehpercayaan kaedah bergantung kepada banyak faktor. Antara faktor negatif perkara berikut paling kerap disebut:

ketidakstabilan harta yang didiagnosis;
ketidaksempurnaan kaedah diagnostik (arahan disediakan secara sembarangan, tugas bersifat heterogen, arahan untuk menyampaikan metodologi kepada subjek tidak dirumus dengan jelas, dsb.);
keadaan peperiksaan yang berubah-ubah (masa yang berbeza dalam sehari apabila eksperimen dijalankan, pencahayaan bilik yang berbeza, kehadiran atau ketiadaan bunyi luar, dll.);
perbezaan dalam tingkah laku penguji (dari pengalaman kepada pengalaman menyampaikan arahan dengan cara yang berbeza, merangsang prestasi tugas dengan cara yang berbeza, dsb.);
turun naik dalam keadaan berfungsi subjek (dalam satu eksperimen, kesihatan yang baik diperhatikan, dalam yang lain - keletihan, dll.);
unsur subjektiviti dalam kaedah menilai dan mentafsir keputusan (apabila jawapan subjek direkodkan, jawapan dinilai mengikut tahap kesempurnaan, keaslian, dll.).

Salah satu cara yang paling penting untuk meningkatkan kebolehpercayaan metodologi ialah keseragaman prosedur peperiksaan, peraturan ketatnya: persekitaran yang sama, jenis arahan yang sama, had masa yang sama untuk semua orang, kaedah dan ciri hubungan dengan mata pelajaran, dan sebagainya.

Sampel yang dikaji mempunyai pengaruh yang besar terhadap ciri-ciri kebolehpercayaan kaedah. Ia boleh mengurangkan dan melebihkan penunjuk ini, contohnya, kebolehpercayaan boleh menjadi tinggi secara buatan jika terdapat serakan kecil hasil dalam sampel, i.e. jika keputusan adalah dekat antara satu sama lain dalam nilai mereka. Oleh itu, manual biasanya menerangkan sampel yang mana kebolehpercayaan metodologi ditentukan.

Pada masa ini, kebolehpercayaan semakin ditentukan pada sampel yang paling homogen, i.e. pada sampel yang serupa dalam jantina, umur, tahap pendidikan, latihan profesional, dsb.

Terdapat banyak jenis kebolehpercayaan kaedah kerana terdapat keadaan yang mempengaruhi keputusan ujian diagnostik. Memandangkan semua jenis kebolehpercayaan mencerminkan tahap ketekalan dua siri penunjuk yang diperoleh secara bebas, kaedah matematik dan statistik di mana kebolehpercayaan teknik diwujudkan ialah korelasi (mengikut Pearson atau Spearman). Kebolehpercayaan adalah lebih tinggi, lebih banyak pekali korelasi yang diperolehi mendekati perpaduan, dan sebaliknya.

K.M. Gurevich dicadangkan untuk mentafsirkan kebolehpercayaan sebagai:

kebolehpercayaan alat pengukur itu sendiri (faktor kebolehpercayaan);
kestabilan sifat yang dikaji (pekali kestabilan);
keteguhan, i.e. kebebasan relatif hasil daripada keperibadian penguji (pekali ketekalan).

Penunjuk yang mencirikan alat pengukur dicadangkan dipanggil pekali kebolehpercayaan; penunjuk yang mencirikan kestabilan harta yang diukur - pekali kestabilan; dan penunjuk menilai pengaruh keperibadian penguji - dengan pekali ketekalan. Dalam susunan ini, disyorkan untuk menyemak metodologi: adalah dinasihatkan untuk menyemak alat pengukur terlebih dahulu. Jika data yang diperolehi adalah memuaskan, maka adalah mungkin untuk meneruskan untuk mewujudkan ukuran kestabilan harta yang diukur, dan selepas itu, jika perlu, untuk menangani kriteria kemantapan. (Kebolehpercayaan: ujian semula, bentuk selari, bahagian badan, ketekalan dalaman, penyebaran faktor).

Penentuan kebolehpercayaan alat pengukur. Ketepatan dan keobjektifan pengukuran bergantung pada cara metodologi disusun, seberapa betul tugasan dipilih, betapa homogennya.

Untuk memeriksa kebolehpercayaan alat pengukur, yang menunjukkan keseragamannya (homogeniti), kaedah pemisahan digunakan. Tugasan dibahagikan kepada genap dan ganjil (semua tugas mesti diselesaikan), dan kemudian hasilnya dikorelasi antara satu sama lain. Jika metodologi adalah homogen, maka tidak akan ada perbezaan besar dalam kejayaan untuk separuh ini, pekalinya akan tinggi. Anda boleh membandingkan mengikut bahagian, tetapi genap dan ganjil adalah lebih baik, kerana kaedah ini tidak bergantung pada latihan, keletihan, dll.

Teknik ini boleh dipercayai jika pekali tidak lebih rendah daripada 0,75 – 0,85, lebih baik daripada 0.90 dan ke atas.

Penentuan kestabilan sifat yang dikaji. Ia juga perlu untuk menentukan bagaimana stabil, stabil sifat yang penyelidik ingin ukur. Tanda itu mungkin berubah dari semasa ke semasa, tetapi turun naiknya tidak sepatutnya tidak dapat diramalkan.

Untuk pengesahan, teknik yang dipanggil ujian semula ujian digunakan. Ia terdiri daripada memeriksa semula subjek menggunakan teknik yang sama. Kestabilan dinilai oleh pekali korelasi antara keputusan tinjauan pertama dan kedua. Ia akan menunjukkan sama ada setiap subjek mengekalkan nombor sirinya dalam sampel atau tidak.

Tahap kestabilan dipengaruhi oleh kepelbagaian faktor. Ia adalah perlu untuk memerhatikan keseragaman prosedur peperiksaan.

Apabila menentukan kestabilan sifat, selang masa antara peperiksaan pertama dan kedua adalah sangat penting. Semakin pendek selang ini, semakin besar peluang sifat ini mengekalkan tahap ujian pertama. Adalah dinasihatkan untuk menguji semula dalam masa yang singkat selepas ujian. Penguji sendiri menetapkan tempoh ini, tetapi lebih kerap dalam kesusasteraan psikologi mereka menunjukkan selang beberapa bulan (tetapi tidak lebih daripada enam bulan). Persoalan tentang kestabilan harta yang diukur tidak selalu diselesaikan secara seragam. Keputusan bergantung pada sifat gejala yang didiagnosis.

Sekiranya sifat yang diukur sudah terbentuk, maka pekali mestilah sekurang-kurangnya 0.80.

Definisi ketekalan, iaitu kebebasan relatif hasil daripada keperibadian penguji. Memandangkan teknik ini sedang dibangunkan untuk kegunaan selanjutnya oleh psikodiagnostik lain, adalah perlu untuk menentukan sejauh mana keputusannya dipengaruhi oleh keperibadian penguji. Pekali ketekalan ditentukan dengan mengaitkan keputusan dua eksperimen yang dijalankan pada sampel yang sama, tetapi oleh penguji yang berbeza. Pekali korelasi tidak boleh lebih rendah daripada 0.80.

Isu kesahan diputuskan selepas kebolehpercayaan telah diwujudkan, kerana kaedah yang tidak boleh dipercayai tidak boleh sah.

Kesahan ujian - konsep yang memberitahu kita apa yang diukur oleh ujian dan sejauh mana ia melakukannya (A. Anastasi). Kesahan pada dasarnya, ia adalah ciri yang kompleks, termasuk, dalam satu pihak, maklumat tentang sama ada teknik itu sesuai untuk mengukur untuk tujuan ia dicipta, dan sebaliknya, apakah keberkesanan, kecekapan dan kegunaan praktikalnya.

Kesahan ialah pematuhan kajian tertentu dengan piawaian yang diterima (percubaan yang sempurna).

Kesahan dalam pengertian pertama adalah berkaitan dengan metodologi itu sendiri, i.e. ialah kesahan alat pengukur. Pengesahan ini dipanggil pengesahan teori. Kesahan dalam erti kata kedua sudah merujuk tidak begitu banyak kepada metodologi tetapi kepada tujuan penggunaannya. Ini adalah pengesahan pragmatik.

Dalam pengesahan teori, penyelidik berminat dengan sifat yang diukur dengan teknik.

Peranan penting dalam memahami apa ukuran metodologi dimainkan oleh perbandingan penunjuknya dengan bentuk aktiviti praktikal. Adalah penting bahawa metodologi diusahakan dari segi teori.

Pengesahan Pragmatik

Keberkesanan praktikal, kepentingan, kegunaan metodologi disemak, kerana metodologi hanya boleh digunakan apabila terbukti bahawa sifat yang diukur ditunjukkan dalam jenis Aktiviti tertentu.

Untuk menguji kesahan pragmatik, kriteria luaran bebas digunakan - penunjuk manifestasi harta yang dikaji dalam kehidupan seharian. Kriteria sedemikian boleh menjadi prestasi (untuk ujian keupayaan pembelajaran, ujian pencapaian, ujian kecerdasan), pencapaian pengeluaran (untuk kaedah orientasi profesional), keberkesanan Aktiviti sebenar - lukisan, pemodelan, dan sebagainya (untuk ujian kebolehan khas), subjektif. penilaian (untuk ujian personaliti).

Penyelidik Amerika Tiffin dan McCormick mengenal pasti 4 jenis kriteria luaran:

Kriteria prestasi (jumlah kerja yang dilakukan, prestasi akademik, masa, kadar pertumbuhan kelayakan).
Kriteria subjektif (termasuk pelbagai jenis jawapan yang mencerminkan sikap seseorang terhadap sesuatu, pendapatnya, pandangannya).
Kriteria fisiologi (digunakan dalam kajian pengaruh persekitaran luaran yang mempengaruhi badan dan jiwa).
Kriteria rawak (contohnya, apabila matlamat melibatkan masalah memilih untuk bekerja orang yang kurang terdedah kepada kemalangan).

Kriteria luaran mesti mempunyai 3 keperluan utama:

Ia mesti relevan, iaitu, mesti ada keyakinan bahawa kriteria melibatkan tepat ciri-ciri jiwa individu yang diukur dengan teknik diagnostik. Kriteria luaran dan model diagnostik mestilah dalam korespondensi semantik dalaman.
Mesti bebas daripada gangguan (kontaminasi). Kumpulan orang yang berada dalam keadaan yang lebih kurang sama harus dipilih untuk penyelidikan.
Mesti boleh dipercayai. Ketekalan dan kestabilan fungsi yang disiasat.

Penilaian kesahan metodologi boleh berbentuk kuantitatif dan kualitatif.

Penerangan kualitatif tentang intipati harta yang diukur. Tiada pemprosesan statistik digunakan di sini.

Terdapat beberapa jenis kesahan, disebabkan oleh keanehan teknik diagnostik, serta status sementara kriteria luaran:

Kesahan "mengikut kandungan" (digunakan dalam ujian pencapaian): 3 - 4 soalan daripada topik besar boleh menunjukkan pengetahuan sebenar pelajar. Untuk melakukan ini, keputusan diagnostik dibandingkan dengan penilaian pakar guru.
Kesahan Serentak atau Semasa – Mengumpul data yang berkaitan dengan masa kini: prestasi akademik, prestasi, dsb. Mereka mengaitkan dengan keputusan kejayaan dalam ujian.
Kesahan "ramalan" ("ramalan"). Ditentukan oleh kriteria luaran yang boleh dipercayai, tetapi maklumat mengenainya dikumpulkan beberapa lama selepas ujian. Ketepatan ramalan adalah berkait songsang dengan masa yang diberikan untuk ramalan tersebut.
kesahan retrospektif. Ia ditentukan berdasarkan kriteria yang mencerminkan peristiwa atau keadaan kualiti pada masa lalu. Ia boleh digunakan untuk mendapatkan maklumat dengan cepat tentang keupayaan ramalan teknik.

Kesahan (dari bahasa Inggeris sah - "sah, sesuai, sah") adalah ciri kompleks metodologi (ujian), termasuk maklumat mengenai kawasan fenomena yang dikaji dan keterwakilan prosedur diagnostik berhubung dengan mereka.

Dalam rumusannya yang paling mudah dan paling umum, kesahihan ujian ialah "konsep yang memberitahu kita apa yang diukur oleh ujian dan sejauh mana ujian itu melakukannya." Dalam keperluan standard untuk ujian psikologi dan pendidikan, kesahan ditakrifkan sebagai satu set maklumat mengenai kumpulan sifat psikologi seseorang yang boleh disimpulkan menggunakan metodologi, serta tahap kesahihan kesimpulan apabila menggunakan skor ujian tertentu atau lain-lain bentuk penilaian. Dalam psikodiagnostik, kesahihan adalah bahagian wajib dan paling penting dalam maklumat mengenai metodologi, termasuk (bersama-sama dengan di atas) data mengenai tahap ketekalan keputusan ujian dengan maklumat lain tentang orang yang sedang dikaji, diperoleh daripada pelbagai sumber (jangkaan teoritikal). , pemerhatian, penilaian pakar, keputusan kaedah lain, kebolehpercayaan yang telah ditetapkan, dsb.), penilaian tentang kesahihan ramalan untuk pembangunan kualiti yang dikaji, sambungan kawasan tingkah laku yang dikaji atau ciri personaliti dengan konstruk psikologi tertentu. Kesahan juga menerangkan orientasi khusus metodologi (kontigen subjek mengikut umur, tahap pendidikan, gabungan sosio-budaya, dll.) dan tahap kesahihan kesimpulan dalam syarat khusus menggunakan ujian. Keseluruhan maklumat yang mencirikan kesahan ujian mengandungi maklumat tentang kecukupan model aktiviti yang diterapkan dari segi mencerminkan ciri psikologi yang dikaji di dalamnya, tentang tahap kehomogenan tugas (subujian) yang termasuk dalam ujian, perbandingannya dalam ujian. penilaian kuantitatif keputusan ujian secara keseluruhan.

Komponen kesahan yang paling penting - definisi kawasan sifat yang dikaji - adalah kepentingan teori dan praktikal asas dalam memilih metodologi penyelidikan dan mentafsir datanya. Maklumat yang terkandung dalam nama ujian, sebagai peraturan, tidak mencukupi untuk menilai skop penggunaannya. Ini hanyalah sebutan, "nama" prosedur penyelidikan tertentu.

Jenis kesahan ujian. Kaedah untuk menentukan kesahan

Menurut definisi ahli teks Amerika A. Anastasi, "kesahan sesuatu ujian ialah konsep yang memberitahu kita apa yang diukur oleh ujian dan sejauh mana ia melakukannya." Kesahan menunjukkan sama ada teknik itu sesuai untuk mengukur kualiti tertentu, ciri dan keberkesanan teknik ini. Cara yang paling biasa untuk mencari kesahan teori ujian (kaedah) ialah kesahan konvergen, iaitu membandingkan teknik yang diberikan dengan kaedah berkaitan yang berwibawa dan membuktikan hubungan yang signifikan dengannya.

Perbandingan dengan kaedah yang mempunyai asas teori yang berbeza, dan kekurangan berterusan hubungan yang signifikan dengan mereka dipanggil kesahan diskriminasi. Satu lagi jenis kesahan - kesahan pragmatik - menguji metodologi dari segi kepentingan praktikal, kecekapan, kegunaannya. Untuk menjalankan ujian sedemikian, sebagai peraturan, kriteria luaran bebas yang dipanggil digunakan, iaitu, sumber maklumat luaran yang bebas daripada ujian digunakan mengenai manifestasi dalam kehidupan sebenar dan aktiviti orang-orang harta mental yang diukur. Antara kriteria luaran tersebut mungkin prestasi akademik, pencapaian profesional, kejayaan dalam pelbagai aktiviti, penilaian subjektif (atau penilaian kendiri). Jika, sebagai contoh, metodologi mengukur ciri-ciri pembangunan kualiti penting secara profesional, maka untuk kriteria itu perlu untuk mencari aktiviti atau operasi individu sedemikian di mana kualiti ini direalisasikan.

Untuk menyemak kesahihan ujian, anda boleh menggunakan kaedah kumpulan yang diketahui, apabila orang dijemput tentang siapa yang diketahui kumpulan mana mengikut kriteria mereka tergolong (contohnya, kumpulan "pelajar yang sangat berjaya, berdisiplin" - kriteria tinggi dan sekumpulan "pelajar miskin, tidak berdisiplin" - kriteria rendah, dan pelajar dengan nilai purata tidak mengambil bahagian dalam ujian), menjalankan ujian dan mencari korelasi antara keputusan ujian dan kriteria.

Di sini a ialah bilangan subjek yang jatuh ke dalam kumpulan tinggi mengikut ujian dan mengikut kriteria, c ialah bilangan subjek yang jatuh ke dalam kumpulan tinggi mengikut kriteria dan mempunyai keputusan ujian yang rendah. Jika ujian itu sah sepenuhnya, elemen b dan c mestilah sama dengan sifar. Ukuran kebetulan, korelasi antara kumpulan ekstrem mengikut ujian dan kriteria dinilai menggunakan pekali phi Guilford. Terdapat pelbagai cara untuk membuktikan kesahihan sesuatu ujian. Sesuatu ujian dikatakan sah jika ia mengukur apa yang hendak diukur. Kesahan luaran - berhubung dengan kaedah psikodiagnostik bermaksud korespondensi keputusan psikodiagnostik yang dijalankan melalui kaedah ini kepada tanda luaran, bebas daripada kaedah, yang dikaitkan dengan subjek tinjauan. Ia bermaksud perkara yang lebih kurang sama dengan kesahan empirikal, dengan perbezaan di sini kita bercakap tentang hubungan antara penunjuk metodologi dan yang paling penting, ciri luaran utama yang berkaitan dengan tingkah laku subjek. Teknik psikodiagnostik dianggap sah secara luaran jika, sebagai contoh, ia menilai ciri-ciri perwatakan individu dan tingkah laku yang diperhatikan secara luaran adalah konsisten dengan keputusan ujian.

Kesahan adalah dalaman - berhubung dengan kaedah psikodiagnostik, ini bermakna korespondensi tugas, subujian yang terkandung di dalamnya; pematuhan hasil psikodiagnostik yang dijalankan melalui teknik ini dengan definisi harta psikologi yang dinilai yang digunakan dalam teknik itu sendiri. Sesuatu metodologi dianggap tidak sah secara dalaman atau tidak cukup sah apabila semua atau sebahagian daripada soalan, tugasan dan subujian yang disertakan di dalamnya tidak mengukur apa yang diperlukan oleh metodologi ini. Kesahan ketara - menerangkan persepsi ujian yang telah berkembang dalam subjek. Ujian harus dilihat oleh subjek sebagai alat yang serius untuk memahami keperibadiannya. Kesahan yang jelas adalah sangat penting dalam keadaan moden, apabila idea ujian dalam minda awam dibentuk oleh banyak penerbitan dalam akhbar dan majalah popular tentang apa yang boleh dipanggil ujian kuasi, dengan bantuan yang pembaca dijemput untuk tentukan apa sahaja: daripada kecerdasan kepada keserasian dengan pasangan masa depan.

Kesahan kompetitif dinilai oleh korelasi ujian yang dibangunkan dengan yang lain, kesahan yang berkaitan dengan parameter yang diukur telah ditetapkan. P. Kline menyatakan bahawa data tentang kesahan kompetitif adalah berguna apabila terdapat ujian yang tidak memuaskan untuk mengukur beberapa pembolehubah, dan yang baharu dicipta untuk meningkatkan kualiti pengukuran. Tetapi persoalannya timbul: jika ujian berkesan sudah wujud, mengapa kita memerlukan ujian baharu yang sama? Kesahan ramalan ditentukan oleh korelasi antara skor ujian dan beberapa kriteria yang mencirikan sifat yang diukur, tetapi pada masa yang akan datang. Sebagai contoh, kesahan ramalan ujian kecerdasan boleh ditunjukkan dengan mengaitkan markah yang diperoleh daripada subjek pada umur 10 tahun dengan prestasi akademik semasa tempoh tamat pengajian tinggi. L. Cronbach menganggap kesahan ramalan sebagai bukti yang paling meyakinkan bahawa ujian itu mengukur dengan tepat apa yang dimaksudkan. Masalah utama yang dihadapi oleh penyelidik yang cuba mewujudkan kesahan ramalan ujiannya ialah pemilihan kriteria luaran. Khususnya, ini paling kerap melibatkan pengukuran pembolehubah personaliti, di mana pemilihan kriteria luaran adalah tugas yang sangat sukar, penyelesaiannya memerlukan kepintaran yang besar. Keadaan ini agak mudah apabila menentukan kriteria luaran untuk ujian kognitif, bagaimanapun, walaupun dalam kes ini, penyelidik perlu "membutakan mata" kepada banyak masalah. Oleh itu, prestasi akademik secara tradisinya digunakan sebagai kriteria luaran untuk pengesahan ujian kecerdasan, tetapi pada masa yang sama diketahui umum bahawa pencapaian akademik jauh daripada satu-satunya bukti kecerdasan tinggi. Kesahan tambahan mempunyai nilai terhad dan merujuk kepada kes di mana satu ujian daripada bateri ujian mungkin mempunyai korelasi yang rendah dengan kriteria, tetapi tidak bertindih dengan ujian lain daripada bateri. Dalam kes ini, ujian mempunyai kesahan tambahan. Ini boleh berguna apabila menjalankan pemilihan profesional menggunakan ujian psikologi. Kesahan pembezaan boleh digambarkan menggunakan ujian minat. Ujian minat biasanya dikaitkan dengan prestasi akademik, tetapi dengan cara yang berbeza untuk disiplin yang berbeza. Nilai kesahan pembezaan, serta kesahan tambahan, adalah terhad.

Kesahan kandungan ditakrifkan sebagai pengesahan bahawa item ujian mencerminkan semua aspek bidang tingkah laku yang sedang dikaji. Biasanya ia ditentukan dalam ujian pencapaian (maksud parameter yang diukur benar-benar jelas), yang, seperti yang telah disebutkan, sebenarnya bukan ujian psikologi. Dalam praktiknya, untuk menentukan kesahihan kandungan, pakar dipilih yang menunjukkan bidang tingkah laku mana yang paling penting, contohnya, untuk kebolehan muzik, dan kemudian, berdasarkan ini, item ujian dihasilkan, yang dinilai sekali lagi oleh pakar. Kesahan konstruk sesuatu ujian ditunjukkan selengkap mungkin dengan menerangkan pembolehubah yang ingin diukur oleh ujian. Malah, kesahan konstruk merangkumi semua pendekatan untuk menentukan kesahan yang telah disenaraikan di atas. Cronbach dan Meehl, yang memperkenalkan konsep kesahan konstruk ke dalam psikodiagnostik, cuba menyelesaikan masalah pemilihan kriteria untuk pengesahan ujian. Mereka menekankan bahawa dalam banyak kes, tiada kriteria tunggal boleh digunakan untuk mengesahkan satu ujian. Kita boleh mengandaikan bahawa penyelesaian kepada soalan kesahan konstruk ujian adalah mencari jawapan kepada dua soalan: 1) adakah sifat tertentu benar-benar wujud; 2) sama ada ujian ini boleh mengukur perbezaan individu dalam sifat ini. Agak jelas bahawa masalah objektiviti dalam tafsiran hasil kajian kesahan konstruk dikaitkan dengan kesahan konstruk, tetapi masalah ini adalah psikologi umum dan melangkaui kesahan.

Kesahan(dari bahasa Inggeris yang sah - "sah, sesuai, sah") - penerangan menyeluruh tentang metodologi (ujian), termasuk maklumat mengenai kawasan fenomena yang dikaji dan keterwakilan prosedur diagnostik berhubung dengannya .

Dalam rumusannya yang paling mudah dan paling umum, kesahihan ujian ialah "konsep yang memberitahu kita apa yang diukur oleh ujian dan sejauh mana ia melakukannya." A. Anastasi , 1982). Dalam keperluan standard untuk ujian psikologi dan pendidikan, kesahan ditakrifkan sebagai satu set maklumat mengenai kumpulan sifat psikologi seseorang yang boleh disimpulkan menggunakan metodologi, serta tahap kesahihan kesimpulan apabila menggunakan skor ujian tertentu atau lain-lain bentuk penilaian. Dalam psikodiagnostik, kesahihan adalah bahagian wajib dan paling penting dalam maklumat mengenai metodologi, termasuk (bersama-sama dengan di atas) data mengenai tahap ketekalan keputusan ujian dengan maklumat lain tentang orang yang sedang dikaji, diperoleh daripada pelbagai sumber (jangkaan teoritikal). , pemerhatian, penilaian pakar, keputusan kaedah lain, kebolehpercayaan yang telah ditetapkan, dsb.), penilaian tentang kesahihan ramalan untuk pembangunan kualiti yang dikaji, sambungan kawasan tingkah laku yang dikaji atau ciri personaliti dengan konstruk psikologi tertentu. Kesahan juga menerangkan orientasi khusus metodologi (kontigen subjek mengikut umur, tahap pendidikan, gabungan sosio-budaya, dll.) dan tahap kesahihan kesimpulan dalam syarat khusus menggunakan ujian. Keseluruhan maklumat yang mencirikan kesahan ujian mengandungi maklumat tentang kecukupan model aktiviti yang diterapkan dari segi mencerminkan ciri psikologi yang dikaji di dalamnya, tentang tahap kehomogenan tugas (subujian) yang termasuk dalam ujian, perbandingannya dalam ujian. penilaian kuantitatif keputusan ujian secara keseluruhan.

2. Komponen kesahan yang paling penting

Komponen kesahan yang paling penting - definisi kawasan sifat yang dikaji - adalah kepentingan teori dan praktikal asas apabila memilih metodologi penyelidikan dan mentafsir datanya. Maklumat yang terkandung dalam nama ujian, sebagai peraturan, tidak mencukupi untuk menilai skop penggunaannya. Ini hanyalah sebutan, "nama" prosedur penyelidikan tertentu. Contohnya ialah ujian pembetulan yang terkenal. Bidang sifat personaliti yang dikaji termasuk kestabilan dan tumpuan perhatian, mobiliti psikomotor. Teknik ini membolehkan untuk mendapatkan anggaran keterukan kualiti psikologi ini dalam subjek, adalah dalam persetujuan yang baik dengan penunjuk yang diperolehi oleh kaedah lain, dan, oleh itu, mempunyai kesahan yang tinggi. Seiring dengan ini, keputusan ujian pembetulan dipengaruhi oleh sejumlah besar faktor lain (ciri neurodinamik, ciri ingatan jangka pendek dan operasi, toleransi individu terhadap monotoni, perkembangan kemahiran membaca, ciri visual, dll.), dalam hubungan dengan teknik yang tidak spesifik. Jika sampel pembetulan digunakan untuk mengukurnya, kesahihannya akan menjadi rendah atau diragui.

Justeru, menggariskan skop metodologi, kesahan juga mencerminkan tahap kesahan hasil pengukuran. Jelas sekali, dengan sebilangan kecil faktor bersamaan yang mempengaruhi keputusan kajian, dan oleh itu, dengan kesannya yang tidak ketara terhadap keputusan ujian, kebolehpercayaan markah ujian akan menjadi lebih tinggi. Pada tahap yang lebih besar lagi, kebolehpercayaan data ujian ditentukan oleh set sifat yang boleh diukur, kepentingan mereka untuk pelaksanaan aktiviti kompleks yang didiagnosis, kesempurnaan dan kepentingan refleksi dalam bahan ujian subjek pengukuran. Oleh itu, untuk memenuhi keperluan kesahihan, teknik diagnostik yang bertujuan untuk pemilihan profesional harus merangkumi analisis pelbagai petunjuk, selalunya berbeza sifatnya, yang paling penting untuk mencapai kejayaan dalam profesion tertentu (tahap perhatian, ciri ingatan, kemahiran psikomotor, kestabilan emosi, minat, kecenderungan dan lain-lain). Seperti yang dapat dilihat daripada di atas, konsep kesahan merangkumi sejumlah besar maklumat yang paling pelbagai tentang ujian. Pelbagai kategori maklumat ini dan cara bagaimana ia diperolehi jenis kesahan.

Kesahan diagnostik (berdaya saing). mencerminkan keupayaan ujian untuk membezakan subjek mengikut sifat yang dipelajari. Analisis kesahihan diagnostik adalah berkaitan dengan mewujudkan kesesuaian penunjuk ujian dengan keadaan sebenar ciri psikologi subjek pada masa peperiksaan. Contoh untuk menentukan jenis kesahan ini ialah kajian kumpulan kontras. Menjalankan ujian kecerdasan dalam kanak-kanak yang sedang membangun dan rakan sebaya mereka yang kurang upaya intelek boleh mendedahkan perbezaan kuantitatif dan kualitatif yang mendalam dalam pelaksanaan tugas oleh kumpulan yang dibandingkan. Tahap kebolehpercayaan pembezaan kanak-kanak kumpulan pertama dan kedua mengikut data ujian akan menjadi ciri kesahihan diagnostik penilaian perkembangan mental yang diperoleh menggunakan teknik ini.

Maklumat yang mencirikan tahap kesahan dan kebolehpercayaan statistik perkembangan ciri psikologi yang dikaji pada masa hadapan adalah kesahan ramalan kaedah. Kesimpulan tentang jenis kesahan ini boleh diperolehi, sebagai contoh, dengan membandingkan markah ujian dalam kumpulan subjek yang sama selepas masa tertentu. Asas kesahan ramalan adalah penentuan betapa pentingnya sifat yang dikaji dari sudut pandangan aktiviti subjek pada masa hadapan, dengan mengambil kira keadaan yang sentiasa berubah-ubah, peralihan ke tahap pembangunan yang lain.

Kebanyakan kaedah, terutamanya ujian kebolehan dan kecerdasan, sedang disiasat untuk kesahihan diagnostik dan ramalan. Kedua-dua jenis kesahan ini sering digabungkan di bawah konsep kesahan empirikal. Di sini keumuman pendekatan untuk penentuan mereka ditekankan, yang dijalankan oleh korelasi statistik skor (gred) pada ujian dan penunjuk pada parameter luaran yang dipilih sebagai pengesahan kriteria (lihat kesahan kriteria). Kriteria kesahan bertindak sebagai ukuran, penunjuk ciri psikologi yang dikaji. Sebagai contoh, ujian kebolehan khas diuji terhadap hasil pembelajaran dalam mata pelajaran lain, pencapaian dalam muzik, seni, dsb. Ujian keupayaan intelek umum disahkan terhadap ukuran pencapaian sekolah yang lebih luas (pencapaian umum, penguasaan sistem pengetahuan dan kemahiran yang kompleks ). Kriteria kesahan ialah ukuran bebas ujian bagi nilai segera untuk bidang amalan tertentu. Sebagai contoh, dalam bidang psikologi pendidikan ia adalah prestasi akademik, dalam psikologi buruh ia adalah produktiviti, dalam psikologi perubatan ia adalah keadaan kesihatan, dll. Sebagai kriteria langsung, penilaian pakar dan ciri-ciri orang yang diperiksa menggunakan ujian yang disahkan, diberikan oleh guru, pekerja, pengurus sering digunakan. .

Dalam kebanyakan kes, sukar atau mustahil untuk mencari kriteria pengesahan yang mencukupi. Pada masa yang sama, set ciri yang termasuk dalam jenis kesahan teori adalah amat penting. Apabila membangunkan dan menggunakan ujian, beberapa hipotesis boleh dirumuskan tentang bagaimana ujian yang dikaji akan dikaitkan dengan ujian lain yang mengukur ciri psikologi yang berkaitan atau bertentangan dengan subjek. Hipotesis ini dikemukakan berdasarkan idea teori tentang sifat yang diukur sebagai konstruk psikologi. Pengesahan hipotesis menunjukkan kesahan teori metodologi, iaitu, tahap membina kesahan. Jenis kesahan ini adalah yang paling kompleks dan kompleks. Pelbagai maklumat digunakan untuk mengesahkan pematuhan keputusan yang diperoleh dengan bantuan ujian dengan jangkaan dan corak teori, termasuk yang berkaitan dengan jenis kesahan yang lain.

Kesahan kandungan (dalaman, logik)- satu set maklumat tentang keterwakilan item ujian berhubung dengan sifat dan ciri yang diukur. Salah satu keperluan utama untuk pengesahan metodologi ke arah ini ialah refleksi dalam kandungan ujian aspek utama fenomena psikologi yang dikaji. Jika bidang tingkah laku atau ciri adalah sangat kompleks, maka kesahan yang bermakna memerlukan pembentangan dalam tugas ujian semua unsur konstituen terpenting fenomena yang dikaji. Oleh itu, apabila membangunkan ujian kecerdasan lisan, adalah perlu untuk memperkenalkan kumpulan tugasan (subujian) untuk menguji kemahiran menulis dan membaca yang agak heterogen dalam komposisi operasinya.

Bersama dengan jenis kesahan utama yang disenaraikan (bermakna, kriteria dan konstruktif) dalam amalan, terdapat faktorial, silang (konvergen) dan diskriminasi kesahan.

3. Jenis kesahan utama (diagnostik, prognostik, empirikal, kriteria, konstruktif, bermakna). Klasifikasi jenis kesahan

Klasifikasi jenis kesahan agak bersyarat, kerana, dalam satu pihak, kaedah penentuan biasa sering digunakan untuk kriteria kesahan yang berbeza, dan, sebaliknya, data sumber yang sama boleh ditafsirkan dari sudut pandangan jenis yang berbeza. kesahihan.

Klasifikasi jenis kesahan:

1) membina;

2) pembezaan;

3) penumpuan;

4) diskriminasi (diskriminatif);

5) faktor;

6) kesahan mengikut perbezaan umur;

7) kriteria;

8) diagnostik (berdaya saing);

9) semasa;

10) prognostik;

11) tambahan;

12) sintetik;

13) retrospektif;

14) empirikal;

16) hadapan (jelas).

Jenis kesahan lain:

1) khayalan;

2) ekologi.

4. Relativiti pembahagian kesahan kepada jenis. Konsep kompleks kesahan. Rasional untuk keperluan untuk pengesahan berkala kaedah psikodiagnostik

Dalam diagnostik psikologi, tidak ada pendekatan universal untuk pencirian kesahihan. Untuk pengesahan setiap jenis prosedur psikodiagnostik dan ujian individu, jenis kesahan yang berbeza boleh digunakan. Maklumat yang termasuk dalam kompleks kesahan boleh dinilai secara kualitatif dan kuantitatif (menggunakan pekali kesahan), selalunya ia boleh diterangkan. Walau bagaimanapun, disebabkan oleh kerumitan, kerumitan, situasi yang berkaitan dengan syarat khusus penggunaan metodologi, kesahihan secara keseluruhan tidak boleh diukur, ia hanya boleh dinilai.

Kesahan sebenar didedahkan hanya hasil daripada pengumpulan pengalaman penting dengan ujian. Mendapatkan data baru yang diperluas tentang kesahihan boleh mengubah idea skop dan keberkesanan metodologi secara radikal. Oleh itu, beberapa kaedah yang dibangunkan untuk mendiagnosis faktor kecerdasan lisan hanya mencerminkan tahap kesedaran dengan kesahan yang mencukupi. Skop ujian semasa pengesahan jangka panjangnya, sebaliknya, boleh diperluaskan. Contohnya ialah matriks progresif Raven, yang direka untuk mengkaji aspek tertentu aktiviti persepsi, tetapi ternyata sebahagian besarnya tepu dengan faktor yang biasa untuk ujian kecerdasan (lihat faktor G). Kesahan sebenar beberapa kaedah psikodiagnostik, terutamanya ujian kecerdasan, pencapaian pembelajaran, kesesuaian profesional, soal selidik personaliti, berubah dari semasa ke semasa. Ini disebabkan oleh keusangan norma statistik berkaitan usia, perubahan dalam norma sosial dan corak tingkah laku, kaedah pengajaran dan kandungan tugas, dan keperluan untuk profesion. Keadaan ini mewujudkan keperluan untuk kawalan berkala ke atas kesahihan kaedah.