Biograafiad Omadused Analüüs

Metoodika valiidsus, valiidsuse liigid. Korrelatsioonanalüüs kui üks usaldusväärsuse ja valiidsuse määramise meetodeid

Inimene kasutab mingisuguse kvaliteedi kontrollimiseks või mõõtmiseks erinevaid meetodeid ja vahendeid. See, mil määral see tehnika ja tööriist on võimelised tootma kvalitatiivseid tulemusi, näitab nende kehtivust. Mida see mõiste psühholoogias tähendab? Millised on kehtivuse tüübid? Psühholoogias on see omadus tavaliselt rakendatav spetsialistide kasutatavate testide ja meetodite puhul.

Mis on kehtivus?

Vaadeldaval mõistel on palju määratlusi. Mis on kehtivus? See on mõne tehnika või tulemuse rakendamise sobivus ja kehtivus konkreetses olukorras. Selle sõna rakenduslik tähendus on tulemuste ja meetodite vastavus seatud ülesannetele.

Kehtivus on veel üks mõõt, mis mõõdab konkreetseid omadusi. Seega on tehnika eesmärk mõõta konkreetset kvaliteeti, näiteks intelligentsust, ja selle kehtivus peaks näitama, kui hästi tehnika aitab tulemusi saavutada.

Teisisõnu võib kehtivust nimetada usaldusväärsuseks. See mõõdab neid teste ja meetodeid, mis mõõdavad teatud psühholoogilisi omadusi. Mida paremini nad mõõdavad omadusi, mida nad mõõdavad, seda suurem on nende kehtivus.

Kehtivus muutub oluliseks kahel juhul:

  1. Kui teatud tehnika on välja töötatud.
  2. Kui teatud tehnika näitab tulemusi, on vaja kindlaks teha, kui head need tulemused on.

Seega on kehtivus tunnus, mis näitab konkreetse tehnika sobivust mingi kvaliteedi mõõtmiseks ning selle tehnika kasulikkust, kvaliteeti ja efektiivsust.

Tavaliselt kasutatakse konkreetse testi või tehnika valideerimiseks mitut tüüpi kehtivust. Samuti võrreldakse erinevate vahenditega antud näitajaid. Teatud psühholoogilise kvaliteedi või tunnuse mõõtmiseks on palju viise. Sagedamini kasutavad psühholoogid meetodit, mis annab usaldusväärsemaid tulemusi. See näitab selle kõrget kehtivust.

Koos valiidsusega käsitletakse sageli sellist mõistet nagu usaldusväärsus. Meetodid ja testid peavad olema usaldusväärsed, st need peavad olema püsivad, usaldusväärsed. Eksperimenteerija peab olema kindel, et ta arvestab täpselt seda kvaliteeti, mida ta soovib. Seetõttu ei pruugi usaldusväärsus alati kehtida, kuid kehtivus peab alati olema usaldusväärne.

Kehtivus psühholoogias

Valiidsust kasutatakse paljudes eluvaldkondades, kus mõõdetakse erinevaid näitajaid. Psühholoogias muutub vajalikuks ka kehtivus, eriti eksperimentaalpsühholoogias. Kehtivus psühholoogias on:

  • katsetaja kindlustunne, et ta mõõdab vajalikku kvaliteeti;
  • seda kvaliteeti mõõtvate näitajate usaldusväärsus.

Kui lugeja on kunagi psühholoogilised testid läbinud, siis teab ta sisemist soovi saada püstitatud küsimusele konkreetne vastus. Testi kehtivus näitab eksperimenteerijale konkreetset tulemust, mille ta testimise kaudu saavutab. Siin on konkreetne ülesanne, millele ta peab saama vastuse pärast kõigi vajalike toimingute tegemist.

Meetodid ja testid peaksid olema kasulikud ja kehtivad, mida mõõdetakse nende kehtivuse järgi.

Kehtivuse kontrollimiseks on kolm võimalust:

  1. Sisu kehtivuse hindamine on subjekti hindamise tulemuste vastavus tegelikkuses ilmnevatele tegelikele omadustele. Siin kasutatakse sellist mõistet nagu näovaliditeet - inimene peab nägema reaalset seost metoodika enda sisu ja selle tulemuste ning reaalsuse vahel, milles mõõdetud kvaliteet avaldub.
  2. Konstruktsiooni kehtivuse hindamine on kindlaksmääramine, et meetod arvutab tõenduspõhised ja ettemääratud konstruktsioonid. Konvergentne valideerimine võimaldab kasutada mitmeid tehnikaid, mis arvestavad sarnaseid omadusi ja annavad vaadeldava kvaliteedi täpsemaid tulemusi. Diskrimineeriv valideerimine välistab muud meetodid, mis võtavad arvesse omadusi, mis ei ole korrelatsioonis soovitud kvaliteediga.
  3. Kriteeriumi kehtivuse hindamine on tulemuste vastavus eeldatavatele näitajatele, mis ilmnevad muul viisil. Siin kasutatakse ennustavat valiidsust, mis aitab ennustada tulevast käitumist.

Kehtivuse tüübid

Kehtivust on mitut tüüpi, mida käsitleme allpool:

  1. Väline kehtivus on olukorra, üldkogumi, sõltumatute muutujate järelduse üldistus. See jaguneb:
  • toimiv kehtivus.
  • Konstruktsiooni kehtivus – selgitus inimese käitumise kohta testi sooritamise hetkel.
  1. Sisemine kehtivus – muutus katse ajal muutumatute tegurite mõjul.
  2. diferentsiaalne kehtivus.
  3. inkrementaalne kehtivus.
  4. Ökoloogiline kehtivus on näitaja, mis näitab, et inimene on võimeline sooritama erinevaid toiminguid, mis ühes olukorras võivad olla edukad, teises aga mitte.

Seda klassifikatsiooni kasutab eksperimentaalpsühholoogia. Organisatsioonipsühholoogias ja psühhodiagnostikas kasutatakse erinevat klassifikatsiooni:

  1. konstruktsiooni kehtivus. See jaguneb:
  • konvergentne kehtivus.
  • lahknev kehtivus.
  1. Kriteeriumide (empiiriline) valiidsus – kehtivaks indikaatoriks valitud välise parameetri testi skoori korrelatsiooni arvutamine. See jaguneb:
  • Praegune kehtivus – parameetri uurimine praegusel ajal.
  • Retrospektiivne kehtivus – minevikus toimunud seisund või sündmus.
  • Ennustav valiidsus – käitumise, kvaliteedi ennustamine.
  1. Sisu kehtivus – kasutatakse katsetes, kus arvestatakse mingit interaktsiooni, tegevust. Sellel on alamliik:
  • ilmne kehtivus.

Muud kehtivuse tüübid on:

  • A priori.
  • Kongruentsed.
  • Seotud.
  • Konstruktiivne.
  • Konsensus.
  • Faktoriaalne.
  • teoreetiline jne.

Mis on testi kehtivus?

Paljud inimesed lähevad testile. On olemas spetsiaalsed psühholoogilised testid, mida kasutavad psühholoogid, ja muud tabloidtestid. Mis on testi kehtivus, mis on selle oluline kriteerium? See on näitaja, mis näitab omaduse, kvaliteedi, omaduse vastavust neid mõõdetavale testile.

Testid on erinevad. Neid kasutatakse inimese psühhofüsioloogiliste parameetrite mõõtmiseks. Kõrgeim kehtivusaeg jääb 80%. Testide kasutamise kasulikkus muutub siis, kui need võimaldavad saada täpseid andmeid teatud spetsiifiliste omaduste kohta. Testi kehtivuse uurimiseks on mitu lähenemisviisi:

  1. Konstruktiivne kehtivus, mis võimaldab teil sügavamalt uurida inimese omadusi olukorras, tegevuses, süsteemis.
  2. Valiidsus kriteeriumi järgi - parameetri uurimine praegusel ajal ja selle ennustamine tulevikus.
  3. Sisu kehtivus on psühholoogiliste konstruktsioonide vastavus, nende mitmekesisus.
  4. Ennustav kehtivus – ennustab teatud kvaliteedi kujunemist tulevikus, mis on keeruline, kuna see võib erinevatel inimestel areneda erinevalt.

Kuni testi usaldusväärsuse ja valiidsuse kindlaksmääramiseni seda psühholoogilises praktikas ei kasutata. Palju sõltub valdkondadest, kus teste rakendatakse. On olemas hariduslikud, erialased ja muud testid, mida kasutatakse üksikutes asutustes taotlejate omaduste ennustamiseks ja tuvastamiseks.

Psühholoogilise abi saidil saate teha ka teste, millel on juba kõrge kehtivus ja mis näitavad usaldusväärseid tulemusi.

Mis on meetodi kehtivus?

Mis on meetodi kehtivus? See on näitaja, mis näitab, kas vaadeldav tehnika uurib kvaliteeti ja omadusi, mille jaoks see on ette nähtud. Samas pannakse rõhku sellele, et testitav võib end erinevalt näha ja iseloomustada. Seetõttu ei võeta tulemustes alati arvesse nende inimeste arvamust, kes ei pruugi enda juures teatud omadusi märgata.

Valideerimine on metoodika kehtivuse kontrollimine. Kasutatava metoodika tõhususe, tõhususe ja praktilisuse määramiseks kasutatakse välist sõltumatut indikaatorit - kvaliteeti, mida jälgitakse igapäevaelus. Väliseid indikaatoreid on 4 tüüpi:

  1. Tulemuslikkuse kriteeriumiks on kulutatud aeg, töömaht, õppeedukuse tase, kutseoskuste kasv jne.
  2. Subjektiivsed kriteeriumid - arvamus, vaated, eelistus, subjekti suhtumine kellessegi või millessegi. Siin kasutatakse küsimustikke, intervjuusid, ankeete.
  3. Füsioloogilised kriteeriumid – välismaailma mõju psüühikale ja inimkehale. See mõõdab pulssi, hingamissagedust, väsimussümptomeid jne.
  4. Juhuslikkuse kriteerium - kas on võimalik valida näiteks isikuid, kes ei ole õnnetuste suhtes altid? Konkreetse juhtumi mõju uurimine.

Teoreetiline lähenemine meetodite paikapidavuse mõõtmisel võimaldab meil ära tunda, kas tehnoloogia tõesti uurib kvaliteeti, mille jaoks see oli mõeldud.

Kehtivuse määrab ka uuritava kvaliteedi esinemine. Hea, kui see on levinud, mis teeb tehnika vajalikuks ja kasulikuks. Oluliseks saavad ka eetilised ja kultuurilised muutused ühiskonnas.

Tulemus

Psühholoogilises praktikas kasutatakse sageli teste ja tehnikaid, mis aitavad inimese isiksuse uurimisel. Siin räägime eelkõige sisemistest parameetritest, mida silmaga ei näe. Iseloomu omadused, käitumine, võimalik tulevikuprognoos, milline inimene saab ja milline on tema elu - seda kõike uuritakse erinevate testide ja meetoditega, mis taotlevad ühte tulemust - inimese uurimist.

Konkreetse instrumendi kehtivuse eduka kindlaksmääramise tulemuseks on iga inimese edukad teadmised, olenemata sellest, kuidas ta ennast vaatab. Inimesed ei märka endas sageli teatud omadusi, harva vaatavad endale kaine pilguga otsa. Testid ja tehnikad võimaldavad paljastada üksikuid parameetreid.

Kehtivate testide ja meetodite prognoos on teise inimese kiire ja kvaliteetne teadmine, mis suudab teda aidata mis tahes psühholoogilise probleemi lahendamisel. Seda ei saavutata niipea, kuid olemasolevad vahendid on juba näidanud oma tõhusust. Tavaliselt huvitab see küsimus ainult neid inimesi, kes on seotud testide ja meetodite kvaliteedi määramisega. Kuid ka tavainimestele on kasulik teada, milliseid harjutusi tasub usaldada ja milliseid mitte.

Pileti number 9

Motivatsiooni ja nende tunnuste küsimustikud.

Motiivide küsimustikud - küsimustike rühm, mis on loodud inimese motivatsiooni-vajaduse sfääri diagnoosimiseks, mis võimaldab teil kindlaks teha, millele inimese tegevus on suunatud (motiivid kui põhjused, mis määravad käitumise suuna valiku). Lisaks on väga oluline küsimus, kuidas käitumise dünaamikat reguleeritakse. Sel juhul kasutatakse sageli hoiakute mõõtmist. Motiivide küsimustike väljatöötamine psühhodiagnostikas on suuresti seotud vajadusega hinnata “sotsiaalse ihaldusvõime” teguri mõju, millel on hoiakuline iseloom ja mis vähendab isiksuseankeetide abil saadud andmete usaldusväärsust. Tuntumate motiivide küsimustikud hõlmavad A. Edwardsi (1954) väljatöötatud “Isiklike eelistuste loendit”, mis on mõeldud G. Murray temaatilise appertseptsiooni testi jaoks välja pakutud nimekirjast laenatud vajaduste “tugevuse” mõõtmiseks. Nende vajaduste hulka kuuluvad näiteks eduvajadus, austus, juhtimine jne. Iga vajaduse “tugevus” ei väljendu mitte absoluutarvudes, vaid suhtena teiste vajaduste “tugevusega”, s.t. kasutatakse isikunäitajaid. “Sotsiaalse ihaldusvõime” teguri rolli uurimiseks pakkus A. Edwards (1957) välja spetsiaalse küsimustiku. Laialdaselt kasutatakse ka teisi motiivide küsimustikke, näiteks D. Jacksoni isiksuse uurimise vorm (1967), A. Mehrabyani küsimustikud (1970) jne.

Peale usaldusväärsuse on meetodite kvaliteedi hindamisel veel üks võtmekriteerium valiidsus. Metoodika kehtivuse küsimus otsustatakse alles pärast selle piisava usaldusväärsuse kindlakstegemist, kuna ebausaldusväärne metoodika ei saa kehtida. Kuid kõige usaldusväärsem tehnika selle kehtivust teadmata on praktiliselt kasutu.

Tuleb märkida, et kehtivuse küsimus tundub kuni viimase ajani olevat üks raskemaid. Selle kontseptsiooni kõige juurdunud määratlus on antud A. Anastasi raamatus: "Testi kehtivus on mõiste, mis ütleb meile, mida test mõõdab ja kui hästi see seda teeb."

Sel põhjusel ei ole kehtivuse määramiseks ühtset universaalset lähenemisviisi. Olenevalt sellest, millist valiidsuse poolt uurija kaaluda soovib, kasutatakse ka erinevaid tõestusmeetodeid. Teisisõnu hõlmab kehtivuse mõiste selle erinevaid tüüpe, millel on oma eriline tähendus. Metoodika kehtivuse kontrollimist nimetatakse valideerimiseks.



Valiidsus selle esimeses tähenduses on seotud metoodika endaga, see tähendab, et see on mõõtevahendi valiidsus. Seda kontrolli nimetatakse teoreetiliseks valideerimiseks. Kehtivus teises tähenduses viitab juba mitte niivõrd metoodikale, kuivõrd selle kasutamise eesmärgile. See on pragmaatiline kinnitamine.

Kokkuvõtteks võime öelda järgmist:

teoreetilise valideerimise puhul huvitab teadlast just tehnikaga mõõdetav omadus. Sisuliselt tähendab see, et tegelik psühholoogiline valideerimine viiakse läbi;

pragmaatilise valideerimisega jääb mõõtmisobjekti olemus (psühholoogiline omadus) silma alt ära. Põhirõhk on tõestamisel, et millelgi metoodikaga mõõdetaval on seos teatud praktikavaldkondadega.

Erinevalt pragmaatilisest valideerimisest on teoreetilise valideerimise läbiviimine mõnikord palju keerulisem. Laskumata praegu konkreetsetesse detailidesse, peatugem üldiselt pragmaatilise kehtivuse kontrollimisel: valitakse mõni metoodikast sõltumatu väline kriteerium, mis määrab edukuse konkreetses tegevuses (hariduslik, erialane jne) ja koos sellega võrreldakse diagnostilise tehnika tulemusi. Kui nendevaheline seos tunnistatakse rahuldavaks, tehakse järeldus diagnostilise tehnika praktilise tähtsuse, tõhususe ja tulemuslikkuse kohta.

Teoreetilise valiidsuse määramiseks on palju keerulisem leida sõltumatut kriteeriumi, mis jääb metoodikast väljapoole. Seetõttu oli testoloogia arendamise algfaasis, kui valiidsuse kontseptsioon alles kujunes, intuitiivne idee, et test mõõdab:

1) tehnikat nimetati kehtivaks, kuna see, mida see mõõdab, on lihtsalt ilmne;

2) kehtivuse tõendamise aluseks oli uurija kindlustunne, et tema meetod võimaldab subjektist aru saada;

3) metoodikat peeti kehtivaks (st aktsepteeriti väidet, et selline ja selline test mõõdab sellist ja sellist kvaliteeti) ainult seetõttu, et teooria, mille alusel metoodika üles ehitati, on väga hea.

Metoodika paikapidavust puudutavate väidete usuga nõustumine ei saanud kesta kaua. Tõeliselt teadusliku kriitika esimesed ilmingud lükkasid selle lähenemisviisi ümber: algas teaduslikult usaldusväärsete tõendite otsimine.

Seega tähendab metoodika teoreetilise valideerimise läbiviimine tõestamist, et metoodika mõõdab täpselt seda omadust, kvaliteeti, mida see vastavalt uurija kavatsusele peaks mõõtma.

Seega, kui näiteks laste vaimse arengu diagnoosimiseks töötati välja test, tuleb analüüsida, kas see mõõdab tõesti seda arengut, mitte mingeid muid tunnuseid (näiteks isiksus, iseloom jne). Seega on teoreetilise valideerimise jaoks kardinaalseks probleemiks psühholoogiliste nähtuste ja nende näitajate vaheline seos, mille kaudu neid psühholoogilisi nähtusi püütakse tundma õppida. See näitab, kui palju kattuvad autori kavatsus ja metoodika tulemused.

Uut meetodit polegi nii keeruline teoreetiliselt valideerida, kui antud omaduse mõõtmiseks on juba olemas tõestatud valiidsusega meetod. Korrelatsiooni olemasolu uue ja sarnase juba testitud meetodi vahel näitab, et väljatöötatud meetod mõõdab sama psühholoogilist kvaliteeti kui võrdlusmeetod. Ja kui uus meetod osutub samal ajal tulemuste läbiviimisel ja töötlemisel kompaktsemaks ja ökonoomsemaks, siis saab psühhodiagnostika võimaluse kasutada vana tööriista asemel uut.

Kuid teoreetilist paikapidavust ei tõesta mitte ainult võrdlus seotud näitajatega, vaid ka nendega, kus hüpoteesi põhjal ei tohiks olulisi seoseid olla. Seega on teoreetilise valiidsuse testimiseks oluline ühelt poolt tuvastada seose aste seotud tehnikaga (konvergentne valiidsus) ja selle seose puudumine meetoditega, millel on erinev teoreetiline alus (diskriminantne valiidsus).

Meetodi teoreetilist valideerimist on palju keerulisem läbi viia, kui selline kontrollimisviis on võimatu. Enamasti on see olukord, millega uurija silmitsi seisab. Sellistes oludes võimaldavad selle psühholoogilise tähenduse paljastada ainult mitmesuguse teabe järkjärguline kogumine uuritava vara kohta, teoreetiliste eelduste ja eksperimentaalsete andmete analüüs ning märkimisväärne kogemus tehnikaga töötamisel.

Metoodika mõõdikute mõistmisel mängib olulist rolli selle näitajate võrdlemine praktiliste tegevusvormidega. Kuid siin on eriti oluline, et metoodika oleks teoreetiliselt põhjalikult läbi töötatud, see tähendab, et sellel oleks kindel ja hästi põhjendatud teaduslik alus. Seejärel, kui võrrelda metoodikat igapäevasest praktikast võetud välise kriteeriumiga, mis vastab sellele, mida see mõõdab, võib saada teavet, mis kinnitab teoreetilisi ideid selle olemuse kohta.

Oluline on meeles pidada, et kui teoreetiline kehtivus on tõestatud, muutub saadud näitajate tõlgendus selgemaks ja üheselt mõistetavamaks ning metoodika nimetus vastab selle rakendusalale. Mis puudutab pragmaatilist valideerimist, siis see eeldab metoodika testimist selle praktilise tõhususe, olulisuse ja kasulikkuse seisukohalt, kuna diagnostilist tehnikat on mõtet kasutada ainult siis, kui on tõestatud, et mõõdetav omadus avaldub teatud elusituatsioonides, teatud tüüpides. tegevusest. Sellele omistatakse suurt tähtsust, eriti kui kerkib valiku küsimus.

Kui pöörduda uuesti testoloogia arenguloo poole, siis võib eristada perioodi (20. sajandi 20-30ndad), mil testide teaduslik sisu ja nende teoreetiline pagas pakkus vähem huvi. Oluline oli, et test toimis ja aitas kiiresti välja valida kõige ettevalmistatumad inimesed. Katseobjektide hindamise empiirilist kriteeriumi peeti ainsaks tõeseks juhiseks teaduslike ja rakenduslike probleemide lahendamisel.

Diagnostiliste meetodite kasutamine puhtalt empiirilise põhjendusega, ilma selge teoreetilise aluseta, viis sageli pseudoteaduslike järeldusteni ja põhjendamatute praktiliste soovitusteni. Neid omadusi, omadusi, mida testid näitasid, oli võimatu täpselt nimetada. Põhimõtteliselt olid need pimekatsed.

Selline lähenemine testi kehtivuse probleemile oli tüüpiline kuni 1950. aastate alguseni. 20. sajandil mitte ainult USA-s, vaid ka teistes riikides. Empiiriliste valideerimismeetodite teoreetiline nõrkus ei saanud tekitada kriitikat nende teadlaste poolt, kes testide väljatöötamisel kutsusid üles tuginema mitte ainult paljale empiiriale ja praktikale, vaid ka teoreetilisele kontseptsioonile. Praktika ilma teooriata on pime ja teooria ilma praktikata on surnud. Praegu peetakse kõige produktiivsemaks meetodite paikapidavuse teoreetilist ja praktilist hindamist.

Metoodika pragmaatilise valideerimise läbiviimiseks, st selle tõhususe, tõhususe, praktilise tähtsuse hindamiseks, kasutatakse tavaliselt sõltumatut välist kriteeriumi - uuritava omaduse igapäevaelus avaldumise näitajat. Selliseks kriteeriumiks võib olla õppeedukus (õpivõimetestide, saavutusteste, intelligentsuse testide puhul) ja tootmissaavutused (professionaalse orientatsiooni meetodite puhul) ning reaalse tegevuse – joonistamise, modelleerimise jms – efektiivsus (erivõimete testide puhul) , subjektiivsed hinnangud (isiksusetestide jaoks).

Ameerika teadlased D. Tiffin ja E. McCormick eristavad pärast paikapidavuse tõestamiseks kasutatud väliskriteeriumide analüüsimist nende nelja tüüpi [31 järgi):

1) tulemuslikkuse kriteeriumid (nende hulka võivad kuuluda näiteks tehtud töö maht, õppeedukus, koolitusele kulunud aeg, kvalifikatsiooni kasvutempo jne);

2) subjektiivsed kriteeriumid (nende hulka kuuluvad erinevat tüüpi vastused, mis kajastavad inimese suhtumist millessegi või kellessegi, tema arvamust, vaateid, eelistusi; tavaliselt saadakse subjektiivsed kriteeriumid intervjuude, ankeetide, ankeetidega);

3) füsioloogilised kriteeriumid (neid kasutatakse keskkonna ja muude olukorra muutujate mõju uurimisel inimkehale ja psüühikale; mõõdetakse pulsisagedust, vererõhku, naha elektritakistust, väsimussümptomeid jne);

4) juhuslikkuse kriteeriumid (rakendatud juhul, kui uuringu eesmärk puudutab näiteks selliste inimeste tööle valimist, kes on vähem altid õnnetustele).

Väline kriteerium peab vastama kolmele põhinõudele:

see peab olema asjakohane;

häireteta;

usaldusväärne.

Asjakohasus viitab diagnostikavahendi semantilisele vastavusele sõltumatule olulisele kriteeriumile. Teisisõnu peab olema kindlustunne, et kriteeriumid hõlmavad just neid individuaalse psüühika tunnuseid, mida mõõdetakse ka diagnostilise tehnikaga. Väline kriteerium ja diagnostikatehnika peavad olema omavahel semantilises vastavuses, olema psühholoogiliselt kvalitatiivselt homogeensed. Kui näiteks testiga mõõdetakse mõtlemise individuaalseid iseärasusi, võimet sooritada loogilisi toiminguid teatud objektide, mõistetega, siis tuleks kriteeriumist otsida just nende oskuste avaldumist. See kehtib ka kutsetegevuse kohta. Sellel pole mitte üks, vaid mitu eesmärki, ülesandeid, millest igaüks on spetsiifiline ja seab rakendamiseks oma tingimused. See eeldab mitme kutsetegevuse läbiviimise kriteeriumi olemasolu. Seetõttu ei tohiks võrrelda diagnostiliste meetodite edukust tootmise efektiivsusega üldiselt. Tuleb leida kriteerium, mis on teostatavate toimingute olemuselt võrreldav metoodikaga.

Kui välise kriteeriumi osas pole teada, kas see on mõõdetava omaduse jaoks asjakohane või mitte, siis psühhodiagnostilise tehnika tulemuste võrdlemine sellega muutub praktiliselt kasutuks. See ei võimalda teha järeldusi, mis võiksid hinnata metoodika paikapidavust.

Sekkumisvabaduse nõuded on tingitud asjaolust, et näiteks haridus- või tööedukus sõltub kahest muutujast: inimesest endast, tema individuaalsetest omadustest, mõõdetuna meetoditega, ning olukorrast, õppimis- ja töötingimustest, võib tekitada häireid, "saastada" rakendatavat kriteeriumi . Et seda mingilgi määral vältida, tuleks uurimistööks valida inimrühmad, kes on enam-vähem samades tingimustes. Võite kasutada ka teist meetodit. See seisneb häirete mõju korrigeerimises. See korrigeerimine on tavaliselt statistilise iseloomuga. Nii et näiteks tootlikkust ei tohiks võtta absoluutarvudes, vaid seoses sarnastes tingimustes töötavate töötajate keskmise tootlikkusega.

Kui öeldakse, et kriteerium peab olema statistiliselt olulise usaldusväärsusega, tähendab see, et see peab peegeldama uuritava funktsiooni püsivust ja stabiilsust.

Adekvaatse ja kergesti tuvastatava kriteeriumi otsimine on valideerimise üks olulisemaid ja raskemaid ülesandeid. Lääne testoloogias diskvalifitseeritakse paljud meetodid ainult seetõttu, et nad ei leidnud nende testimiseks sobivat kriteeriumi. Näiteks enamiku küsimustike puhul on nende kehtivuse andmed küsitavad, kuna on raske leida adekvaatset väliskriteeriumi, mis vastaks mõõdetule.

Meetodite kehtivuse hindamine võib olla kvantitatiivne ja kvalitatiivne.

Kvantitatiivse näitaja - kehtivuskoefitsiendi - arvutamiseks võrreldakse diagnostilise tehnika abil saadud tulemusi samade isikute välise kriteeriumi alusel saadud andmetega. Kasutatakse erinevat tüüpi lineaarset korrelatsiooni (Spearmani järgi, Pearsoni järgi).

Mitu ainet on valiidsuse arvutamiseks vaja?

Praktika on näidanud, et neid ei tohiks olla alla 50, aga kõige parem on üle 200. Tihti tekib küsimus, milline peaks olema kehtivuskordaja väärtus, et seda aktsepteeritaks pidada? Üldiselt märgitakse, et piisab, kui valiidsuskordaja on statistiliselt oluline. Validsuse koefitsient umbes 0,20–0,30 tunnistatakse madalaks, 0,30–0,50 keskmiseks ja üle 0,60 kõrgeks.

Kuid nagu rõhutavad A. Anastasi, K. M. Gurevitš jt, ei ole alati õige kasutada lineaarset korrelatsiooni valiidsuskoefitsiendi arvutamiseks. See tehnika on õigustatud ainult siis, kui on tõestatud, et mõne tegevuse edukus on otseselt võrdeline diagnostilise testi edukusega. Välismaiste, eriti kutsesobivuse ja kutsevalikuga tegelevate testoloogide positsioon taandub kõige sagedamini tingimusteta tõdemusele, et erialale sobib paremini see, kes täitis testis kõige rohkem ülesandeid. Aga võib ka juhtuda, et tegevuses edukaks saamiseks on vaja omada omadust 40% tasemel testlahendusest. Edasine edu testis ei loe enam selle elukutse jaoks. Illustreeriv näide K. M. Gurevitši monograafiast: postiljon peab oskama lugeda, aga see, kas ta loeb normaalse või väga suure kiirusega, ei oma enam erialast tähtsust. Sellise korrelatsiooni korral metoodika näitajate ja välise kriteeriumi vahel võib kõige adekvaatsem viis valiidsuse tuvastamiseks olla erinevuste kriteerium.

Võimalik on ka teine ​​juhtum: kutsealal nõutavast kõrgem vara segab ametialast edu. Niisiis, 20. sajandi koidikul. Ameerika teadlane F. Taylor leidis, et tootmises kõige arenenumatel töötajatel on madal tööviljakus. See tähendab, et nende kõrge vaimne areng ei võimaldanud neil väga produktiivselt töötada. Sel juhul sobiks valiidsuskordaja arvutamiseks pigem dispersioonanalüüs või korrelatsioonikordade arvutamine.

Nagu välismaiste testoloogide kogemus on näidanud, ei suuda ükski statistiline protseduur täielikult kajastada individuaalsete hinnangute mitmekesisust. Seetõttu kasutatakse meetodite paikapidavuse tõestamiseks sageli teist mudelit – kliinilisi hinnanguid. See pole midagi muud kui uuritava omaduse olemuse kvalitatiivne kirjeldus. Sel juhul räägime selliste tehnikate kasutamisest, mis ei põhine statistilisel töötlemisel.

Kehtivuse tüübid

Kehtivus on oma olemuselt kompleksne tunnus, mis sisaldab ühelt poolt teavet selle kohta, kas tehnika sobib selle mõõtmiseks, milleks see on loodud, ja teiselt poolt, milline on selle tõhusus, tõhusus ja praktiline kasulikkus.

Metoodika kehtivuse kontrollimist nimetatakse valideerimiseks.

Metoodika pragmaatilise valideerimise läbiviimiseks, st selle tõhususe, tõhususe, praktilise tähtsuse hindamiseks, kasutatakse tavaliselt sõltumatut välist kriteeriumi - uuritava omaduse igapäevaelus avaldumise näitajat. Selliseks kriteeriumiks võib olla õppeedukus (õpivõimetestide, saavutusteste, intelligentsuse testide puhul) ja tootmissaavutused (professionaalse orientatsiooni meetodite puhul) ning reaalse tegevuse – joonistamise, modelleerimise jms – efektiivsus (erivõimete testide puhul) , subjektiivsed hinnangud (isiksusetestide jaoks).

4 tüüpi väliseid kriteeriume:

tulemuslikkuse kriteeriumid (nende hulka võivad kuuluda näiteks tehtud töö maht, õppeedukus, koolitusele kulunud aeg, kvalifikatsiooni kasvutempo jne);

subjektiivsed kriteeriumid (nende hulka kuuluvad erinevat tüüpi vastused, mis kajastavad inimese suhtumist millessegi või kellessegi, tema arvamust, vaateid, eelistusi; tavaliselt saadakse subjektiivsed kriteeriumid intervjuude, ankeetide, ankeetidega);

füsioloogilised kriteeriumid (neid kasutatakse keskkonna ja muude olukorramuutujate mõju uurimisel inimkehale ja psüühikale; mõõdetakse pulsisagedust, vererõhku, naha elektritakistust, väsimussümptomeid jne);

juhuslikkuse kriteeriumid (rakendatud juhul, kui uuringu eesmärk puudutab näiteks selliste inimeste tööle valimise probleemi, kes on vähem altid õnnetustele).

empiiriline kehtivus.

Kui sisuvalidsuse puhul hindavad testi eksperdid (kes tuvastavad testitavate objektide vastavuse mõõtmisobjekti sisule), siis empiirilist valiidsust mõõdetakse alati statistilise korrelatsiooni abil: kahe väärtuste seeria korrelatsiooni. arvutatakse – kehtivuskriteeriumiks valitud välise parameetri testi hinded ja näitajad.

konstruktsiooni kehtivus.

Konstrukti kehtivus on seotud teoreetilise konstruktsiooni endaga ja hõlmab tegurite otsimist, mis selgitavad testi sooritamisel käitumist. Eritüübina on konstruktsiooni kehtivus kanoniseeritud Cronbachi ja Mili (1955) artiklis. Autorid hindasid seda tüüpi valiidsusega kõiki testuuringuid, mis ei olnud otseselt suunatud mõne olulise kriteeriumi ennustamisele. Uuring sisaldas teavet psühholoogiliste konstruktsioonide kohta.

Kehtivus "sisu järgi".

Sisu kehtivus eeldab, et igal konkreetsesse valdkonda kuuluval elemendil, probleemil või küsimusel on võrdne võimalus olla testobjektiks. Sisu kehtivus hindab testi sisu (ülesanded, küsimused) vastavust mõõdetavale käitumisvaldkonnale. Kahe arendusmeeskonna koostatud testid viiakse läbi ainete valimi põhjal. Testide usaldusväärsuse arvutamiseks jagatakse üksused kaheks osaks, mille tulemuseks on sisu kehtivuse indeks.

"Prognostiline" kehtivus.

"Ennustava" valiidsuse määrab ka üsna usaldusväärne väline kriteerium, kuid selle kohta kogutakse teavet mõni aeg pärast testi. Väliskriteeriumiks on tavaliselt inimese võime, mis väljendub mõnes hinnangus selle tegevuse liigi kohta, milleks ta diagnostiliste testide tulemuste põhjal välja valiti. Kuigi see tehnika sobib kõige paremini diagnostiliste meetodite ülesandeks - tulevase edu ennustamiseks, on seda väga raske rakendada. Prognoosi täpsus on pöördvõrdeline selliseks prognoosimiseks antud ajaga. Mida rohkem aega pärast mõõtmist möödub, seda rohkem tegureid tuleb tehnika prognostilise olulisuse hindamisel arvesse võtta. Kõiki ennustust mõjutavaid tegureid on aga peaaegu võimatu arvesse võtta.

"Tagasiulatuv" kehtivus.

See määratakse kindlaks kriteeriumi alusel, mis kajastab mineviku sündmusi või kvaliteediseisundit. Seda saab kasutada kiireks teabe saamiseks tehnika prognoosimisvõimaluste kohta. Seega, et testida, mil määral vastavad sobivustesti head hinded kiirele õppimisele, saab võrrelda varasemaid hindeid, varasemaid ekspertarvamusi jne. isikutel, kellel on hetkel kõrged ja madalad diagnostilised näitajad.

konvergentne ja diskrimineeriv kehtivus.

See, kuidas psühholoog diagnostilise konstruktsiooni määratleb, määrab teatud üksuste testi kaasamise strateegia. Kui Eysenck defineerib omadust "neurootilisus" ekstraversioonist-introvertsusest sõltumatuna, siis see tähendab, et tema küsimustikus peaks olema ligikaudu võrdne arv punkte, millega neurootilised introverdid ja neurootilised ekstraverdid nõustuvad. Kui praktikas selgub, et testis hakkavad domineerima "neurootilisuse-introvertsuse" kvadrandi üksused, siis Eysencki teooria seisukohalt tähendab see, et "neurootilisuse" faktor osutub koormatuks ebaolulisega. tegur - "introvertsus". (Täpselt sama efekt ilmneb ka siis, kui valimis on eelarvamus – kui selles on rohkem neurootilisi introverte kui neurootilisi ekstraverte.)

Et selliseid raskusi mitte kokku puutuda, tahaksid psühholoogid tegeleda selliste empiiriliste näitajatega (punktidega), mis annavad üheselt teada vaid ühest tegurist. Kuid seda nõuet ei täideta kunagi: kõik empiirilised näitajad ei ole määratud mitte ainult meile vajaliku teguriga, vaid ka teiste teguritega, mis ei ole mõõtmisülesande jaoks olulised.

Seega, seoses teguritega, mis on kontseptuaalselt määratletud mõõdetavaga ortogonaalsetena (esinevad sellega kõigis kombinatsioonides), peab testi koostaja üksuste valimisel rakendama kunstlikku tasakaalustamisstrateegiat.

Üksuste vastavus mõõdetud tegurile tagab testi konvergentse kehtivuse. Üksuste tasakaal ebaoluliste tegurite suhtes annab diskrimineeriva kehtivuse. Empiiriliselt väljendub see olulise korrelatsiooni puudumisel kontseptuaalselt sõltumatut omadust mõõtva testiga.

Kehtivuse tüübid

Diagnostikameetodite iseärasustest ja välise kriteeriumi ajutisest staatusest tulenevalt on mitut tüüpi kehtivust. ; Cherny, 1983; "Üldine psühhodiagnostika", 1987 jne) nimetatakse kõige sagedamini järgmisi:

1. Kehtivus "sisu järgi". Seda tehnikat kasutatakse peamiselt saavutustestides. Tavaliselt ei hõlma saavutustestid kogu materjali, mille õpilased on läbinud, vaid mõnda väikest osa sellest (3-4 küsimust). Kas saab olla kindel, et õiged vastused neile paarile küsimusele annavad tunnistust kogu materjali omastamisest. Sellele peaks sisu kehtivuse kontroll vastama. Selleks võrreldakse testi edukust õpetajate eksperthinnangutega (selle materjali jaoks). Kehtivus "sisu järgi" kehtib ka kriteeriumipõhiste testide puhul. Seda tehnikat nimetatakse mõnikord loogiliseks kehtivuseks.

2. "Samaaegsuse" kehtivus ehk praegune kehtivus määratakse välise kriteeriumi alusel, mille alusel kogutakse teavet katsemeetodi katsetega samal ajal. Teisisõnu kogutakse andmeid testperioodi hetkesoorituse, sama perioodi soorituse jms kohta. Testi edutulemused on sellega korrelatsioonis.

3. "Ennustav" kehtivus (teine ​​nimi on "ennustuslik" kehtivus). Selle määrab ka üsna usaldusväärne väline kriteerium, kuid selle kohta kogutakse teavet mõni aeg pärast testi. Väliskriteeriumiks on tavaliselt mõnes hinnangus väljendatud inimese võime sellele tegevusele, milleks ta diagnostiliste testide tulemuste põhjal välja valiti. Kuigi see tehnika sobib kõige paremini diagnostiliste meetodite ülesandeks - tulevase edu ennustamiseks, on seda väga raske rakendada. Prognoosi täpsus on pöördvõrdeline selliseks prognoosimiseks antud ajaga. Mida rohkem aega pärast mõõtmist möödub, seda rohkem tegureid tuleb tehnika prognostilise olulisuse hindamisel arvesse võtta. Kõiki ennustust mõjutavaid tegureid on aga peaaegu võimatu arvesse võtta.

4. "Tagasiulatuv" kehtivus. See määratakse kindlaks kriteeriumi alusel, mis kajastab mineviku sündmusi või kvaliteediseisundit. Seda saab kasutada kiireks teabe saamiseks tehnika prognoosimisvõimaluste kohta. Seega, et testida, mil määral vastavad sobivustesti head hinded kiirele õppimisele, saab võrrelda varasemaid hindeid, varasemaid ekspertarvamusi jne. isikutel, kellel on hetkel kõrged ja madalad diagnostilised näitajad.

Korrelatsioon

Korrelatsioon (korrelatsioonisõltuvus) - kahe või enama juhusliku muutuja (või muutujate, mida võib selliseks pidada teatud aktsepteeritava täpsusastmega) statistiline seos. Samal ajal põhjustavad muutused ühe või mitme sellise koguse väärtustes süstemaatilist muutust teise või muude suuruste väärtustes. Kahe juhusliku muutuja korrelatsiooni matemaatiline mõõt on korrelatsioonisuhe ehk korrelatsioonikordaja (või). Kui ühe juhusliku muutuja muutus ei too kaasa teise juhusliku suuruse regulaarset muutumist, vaid toob kaasa selle juhusliku suuruse mõne muu statistilise tunnuse muutumise, siis sellist seost ei peeta korrelatsiooniks, kuigi see on statistiline.

Esimest korda tõi termini "korrelatsioon" teaduskäibesse prantsuse paleontoloog Georges Cuvier 18. sajandil. Ta töötas välja elusolendite osade ja elundite "korrelatsiooniseaduse", mille abil on võimalik taastada fossiilse looma välimus, kelle käsutuses on vaid osa tema jäänustest. Statistikas kasutas sõna "korrelatsioon" esmakordselt inglise bioloog ja statistik Francis Galton 19. sajandi lõpus.

Teatud tüüpi korrelatsioonikordajad võivad olla positiivsed või negatiivsed (võimalik on ka, et statistiline seos puudub – näiteks sõltumatute juhuslike muutujate puhul). Kui eeldada, et muutujate väärtustel on määratud range järjekorra seos, siis negatiivne korrelatsioon on korrelatsioon, kus ühe muutuja suurenemine on seotud teise muutuja vähenemisega, samas kui korrelatsioonikordaja võib olla negatiivne. ; positiivne korrelatsioon sellistes tingimustes - korrelatsioon, kus ühe muutuja suurenemine on seotud teise muutuja suurenemisega, samas kui korrelatsioonikordaja võib olla positiivne.

Valiidsus (inglise keelest valid - "kehtiv, sobiv, kehtiv") on metoodika (testi) kompleksne omadus, mis sisaldab teavet uuritavate nähtuste piirkonna ja diagnostilise protseduuri representatiivsuse kohta. neid.

Kõige lihtsamas ja üldisemas sõnastuses on testi kehtivus "kontseptsioon, mis ütleb meile, mida test mõõdab ja kui hästi see seda teeb". Psühholoogiliste ja kasvatuslike testide standardnõuetes määratletakse kehtivus kui teabe kogum selle kohta, milliseid isiku psühholoogiliste omaduste rühmi saab metoodika abil järeldada, samuti järelduste kehtivusastet konkreetsete testiskooride kasutamisel või muud hindamisvormid. Psühhodiagnostikas on valiidsus kohustuslik ja kõige olulisem osa metoodikat puudutavast informatsioonist, sealhulgas (koos eeltooduga) andmed testitulemuste kooskõla astmest muu uuritava isiku kohta käiva teabega, mis on saadud erinevatest allikatest (teoreetilised ootused). , vaatlused, eksperthinnangud, muude meetodite tulemused, mille usaldusväärsus on kindlaks tehtud jne), hinnang uuritava kvaliteedi kujunemise prognoosi paikapidavuse kohta, uuritava käitumisvaldkonna seos või teatud psühholoogiliste konstruktsioonidega isiksuseomadusi. Valiidsus kirjeldab ka metoodika spetsiifilist suunitlust (ainete kontingent vanuse, haridustaseme, sotsiaal-kultuurilise kuuluvuse jne järgi) ja järelduste kehtivuse astet konkreetsetes testi kasutamise tingimustes. Testi kehtivust iseloomustava teabe kogum sisaldab teavet rakendatud tegevusmudeli adekvaatsuse kohta selles uuritud psühholoogiliste omaduste kajastamise osas, testis sisalduvate ülesannete (alatestide) homogeensuse astme kohta, nende võrreldavuse kohta testis. katsetulemuste kui terviku kvantitatiivne hindamine.

Validsuse kõige olulisem komponent - uuritavate omaduste ala määratlus - on uurimismetoodika valimisel ja selle andmete tõlgendamisel fundamentaalse teoreetilise ja praktilise tähtsusega. Testi nimes sisalduv teave on reeglina ebapiisav, et hinnata selle kohaldamisala. See on lihtsalt nimetus, konkreetse uurimisprotseduuri "nimi".

Testi kehtivuse tüübid. Valiidsuse määramise meetodid

Ameerika tekstiteadlase A. Anastasi definitsiooni kohaselt on "testi kehtivus mõiste, mis ütleb meile, mida test mõõdab ja kui hästi see seda teeb". Kehtivus näitab, kas tehnika sobib teatud omaduste, omaduste mõõtmiseks ja kui tõhusalt see seda teeb. Kõige tavalisem viis testi (meetodi) teoreetilise valiidsuse leidmiseks on konvergentne valiidsus, st antud tehnika võrdlemine autoriteetsete seotud meetoditega ja nendega oluliste seoste tõestamine.

Võrdlust meetoditega, millel on erinev teoreetiline alus, ja pidevat oluliste seoste puudumist nendega nimetatakse diskrimineerivaks valiidsuseks. Teist tüüpi valiidsus - pragmaatiline valiidsus - metoodika testimine selle praktilise tähtsuse, tõhususe, kasulikkuse aspektist. Sellise testi läbiviimiseks kasutatakse reeglina nn sõltumatuid väliskriteeriume, st testist sõltumatut välist teabeallikat mõõdetud vaimse omaduse tegeliku avaldumise ja inimeste tegevuse kohta. Sellisteks välisteks kriteeriumiteks võivad olla õppeedukus, ametialased saavutused, edu erinevates tegevustes, subjektiivsed hinnangud (või enesehinnangud). Kui metoodika mõõdab näiteks erialaselt oluliste omaduste kujunemise tunnuseid, siis kriteeriumi jaoks on vaja leida selline tegevus või üksikud toimingud, kus need omadused realiseeruvad.

Testi paikapidavuse kontrollimiseks saab kasutada tuntud rühmade meetodit, kui kutsutakse inimesi, kelle kohta on kriteeriumi järgi teada, millisesse gruppi nad kuuluvad (näiteks "väga edukate, distsiplineeritud õpilaste" rühm - kõrge kriteerium ja "vaeste, distsiplineerimata õpilaste" rühm - madal kriteerium ja keskmiste väärtustega õpilased testimisel ei osale), viivad testi läbi ja leiavad seose testitulemuste ja kriteeriumi vahel.

Siin a on testi järgi kõrgesse gruppi langenud katsealuste arv ja kriteeriumi järgi, c kriteeriumi järgi kõrgesse gruppi langenud ja madalate testitulemustega katsealuste arv. Kui test on täiesti kehtiv, peavad elemendid b ja c olema võrdsed nulliga. Kokkusattumusmõõtu, korrelatsiooni äärmusrühmade vahel vastavalt testile ja kriteeriumile hinnatakse Guilfordi phi koefitsiendi abil. Testi kehtivuse tõestamiseks on palju erinevaid viise. Testi peetakse kehtivaks, kui see mõõdab seda, mida see on mõeldud mõõtma. Väline kehtivus - psühhodiagnostika meetodite puhul tähendab selle meetodi abil läbiviidud psühhodiagnostika tulemuste vastavust meetodist sõltumatutele välistele tunnustele, mis on omistatavad uuringu subjektile. See tähendab ligikaudu sama, mis empiiriline kehtivus, selle erinevusega, et siin räägime metoodika näitajate ja subjekti käitumisega seotud olulisemate, võtmetähtsusega väliste tunnuste vahelisest suhtest. Psühhodiagnostilist tehnikat peetakse väliselt kehtivaks, kui see näiteks hindab indiviidi iseloomuomadusi ja tema väliselt vaadeldav käitumine on kooskõlas testimise tulemustega.

Valiidsus on sisemine - psühhodiagnostika meetodite suhtes tähendab see selles sisalduvate ülesannete, alamtestide vastavust; selle tehnika abil läbiviidud psühhodiagnostika tulemuste vastavus tehnikas endas kasutatava hinnatud psühholoogilise omaduse määratlusele. Metoodika loetakse sisemiselt mittekehtivaks või ebapiisavalt kehtivaks, kui kõik või osa selles sisalduvaid küsimusi, ülesandeid ja alamteste ei mõõda selle metoodika poolt nõutavat. Näiv valiidsus – kirjeldab katsealusel kujunenud tajumist testist. Uuritav peaks testi pidama tõsiseks vahendiks oma isiksuse mõistmiseks. Ilmselge kehtivus on eriti oluline tänapäevastes tingimustes, kui üldsuses teadvustatud testide idee moodustavad arvukad väljaanded populaarsetes ajalehtedes ja ajakirjades, mida võib nimetada kvaasitestideks, mille abil kutsutakse lugejat määrake midagi: intelligentsusest kuni tulevase abikaasaga ühilduvuseni.

Konkurentsivalidsust hinnatakse väljatöötatud testi korrelatsiooni järgi teistega, mille valiidsus mõõdetava parameetri suhtes on kindlaks tehtud. P. Kline märgib, et konkureeriva kehtivuse andmed on kasulikud siis, kui mõne muutuja mõõtmiseks on ebarahuldavad testid ning mõõtmise kvaliteedi parandamiseks luuakse uusi. Kuid tekib küsimus: kui tõhus test on juba olemas, siis milleks on vaja sama uut? Ennustav valiidsus määratakse korrelatsiooniga testi skooride ja mõne mõõdetavat omadust iseloomustava kriteeriumi vahel, kuid hiljem. Näiteks intelligentsustesti ennustavat kehtivust saab näidata, korreleerides selle 10-aastaselt ainelt saadud hinded õppeedukusega keskkooli lõpetamise perioodil. L. Cronbach peab ennustavat valiidsust kõige veenvamaks tõendiks selle kohta, et test mõõdab täpselt seda, milleks see mõeldud oli. Peamine probleem, millega uurija oma testi ennustavat valiidsust kindlaks teha püüab, on välise kriteeriumi valik. Eelkõige puudutab see kõige sagedamini isiksuse muutujate mõõtmist, kus välise kriteeriumi valimine on äärmiselt keeruline ülesanne, mille lahendamine nõuab märkimisväärset leidlikkust. Kognitiivsete testide välise kriteeriumi määramisel on olukord mõnevõrra lihtsam, kuid ka sel juhul peab uurija paljude probleemide ees „silm kinni pigistama“. Seega kasutatakse õppeedukust traditsiooniliselt intelligentsuse testide valideerimise välise kriteeriumina, kuid samas on üldteada, et õppeedukus pole kaugeltki ainus tõend kõrgest intelligentsusest. Täiendav kehtivus on piiratud väärtusega ja viitab juhtumile, kus üks test testide komplektist võib olla madala korrelatsiooniga kriteeriumiga, kuid mitte kattuda teiste aku testidega. Sel juhul on testil astmeline kehtivus. See võib olla kasulik psühholoogiliste testide abil professionaalse valiku tegemisel. Diferentsiaalset kehtivust saab illustreerida huvipakkuvate testide abil. Huvitestid on tavaliselt korrelatsioonis õppeedukusega, kuid erinevate erialade puhul erineval viisil. Diferentsiaalvalidsuse väärtus, nagu ka inkrementaalne kehtivus, on piiratud.

Sisu kehtivus on defineeritud kui kinnitus, et testelemendid kajastavad uuritava käitumisvaldkonna kõiki aspekte. Tavaliselt määratakse see saavutustestides (mõõdetud parameetri tähendus on täiesti selge), mis, nagu juba mainitud, ei ole tegelikult psühholoogilised testid. Praktikas valitakse sisu kehtivuse määramiseks välja eksperdid, kes näitavad, milline käitumisvaldkond on näiteks muusikaliste võimete jaoks kõige olulisem, ja seejärel genereeritakse selle põhjal testüksused, mida eksperdid jällegi hindavad. Testi konstruktsiooni kehtivust näidatakse võimalikult täielikuna, kirjeldades muutujat, mida test on mõeldud mõõtma. Tegelikult hõlmab konstruktsiooni kehtivus kõiki ülaltoodud lähenemisviise kehtivuse määramiseks. Cronbach ja Meehl, kes tõid psühhodiagnostikasse konstruktsiooni valiidsuse kontseptsiooni, püüdsid lahendada testide valideerimise kriteeriumide valimise probleemi. Nad rõhutasid, et paljudel juhtudel ei saa ükski kriteerium olla ühe testi valideerimiseks. Võime eeldada, et testi konstruktsiooni kehtivuse küsimuse lahenduseks on vastuse otsimine kahele küsimusele: 1) kas teatud omadus on tõesti olemas; 2) kas see test mõõdab usaldusväärselt selle omaduse individuaalseid erinevusi. On üsna selge, et objektiivsuse probleem konstruktsiooni valiidsuse uurimise tulemuste tõlgendamisel on seotud konstruktsiooni valiidsusega, kuid see probleem on üldpsühholoogiline ja ulatub kehtivuse piiridest.

Selleks, et psühholoogiline ja pedagoogiline eksperiment oleks piisavalt usaldusväärne uurimisvahend ning võimaldaks saada täiesti usaldusväärseid tulemusi, mida saab usaldada ja mille põhjal teha õigeid praktilisi järeldusi, on vajalik, et selles kasutatavad psühhodiagnostika meetodid olema teaduslikult põhjendatud. Neid peetakse meetoditeks, mis vastavad järgmistele nõuetele: kehtivus, usaldusväärsus, ühemõttelisus ja täpsus.

Tähtaeg "kehtivus" tähendab sõna-sõnalt: "täis", "sobiv", "vastav". Kehtivus on oma olemuselt see on keeruline omadus, mis sisaldab ühelt poolt teavet selle kohta, kas tehnika sobib mõõtmiseks, milleks see loodi, ja teisest küljest, milline on selle tõhusus, tõhusus. Tehnika kehtivuse testimist nimetatakse kinnitamine.

Valiidsust on mitut tüüpi, millest igaüks tuleks psühhodiagnostilise tehnika kehtivuse kindlaksmääramisel eraldi arvesse võtta ja hinnata. Kehtivus võib olla teoreetiline ja praktiline (empiiriline), sisemine ja väline.

Teoreetiline kehtivus määratakse selle meetodi abil saadud uuritava kvaliteedi näitajate vastavusega muude meetoditega saadud näitajatele - nendele, mille näitajate sõltuvus peaks olema teoreetiliselt põhjendatud. Teoreetilist paikapidavust kontrollitakse sama omaduse näitajate korrelatsioonidega, mis on saadud erinevatel meetoditel, mis põhinevad või lähtuvad samast teooriast.

Empiiriline kehtivus kontrollitakse diagnostiliste näitajate vastavuse järgi subjekti tegelikule käitumisele, vaadeldud tegevustele ja reaktsioonidele. Kui näiteks mingi metoodika abil hinnata antud subjekti iseloomuomadusi, siis loetakse rakendatud metoodika praktiliselt või empiiriliselt kehtivaks, kui tuvastame, et see inimene käitub elus täpselt nii, nagu metoodika ette näeb, s.t. tema isiksuseomaduste järgi. Empiirilise valiidsuse kriteeriumi kohaselt kontrollitakse metoodikat, võrreldes selle näitajaid tegeliku elukäitumise või inimeste praktilise tegevuse tulemustega.

Kehtivus on sisemine tähendab metoodikas sisalduvate ülesannete, alatestide, hinnangute jms vastavust. metoodika kui terviku üldine eesmärk ja ülesehitus. Seda peetakse sisemiselt kehtetuks või sisemiselt ebapiisavalt kehtivaks, kui kõik või osa selles sisalduvaid küsimusi, ülesandeid või alamteste ei mõõda sellest metoodikast nõutavat.

Väline kehtivus - see on ligikaudu sama mis empiiriline valiidsus, ainsa erinevusega, et antud juhul räägime metoodika näitajate ja subjekti käitumisega seotud olulisemate, võtmetähtsate välistunnuste vahelisest seosest.


Metoodikat luues on selle paikapidavust raske kohe hinnata. Tavaliselt kontrollitakse ja täpsustatakse metoodika kehtivust selle üsna pika kasutuse käigus, seda enam, et me räägime verifitseerimisest vähemalt eelpool kirjeldatud neljast küljest.

Validsuse definitsioonile pole ühtset universaalset lähenemist. Olenevalt sellest, millist valiidsuse poolt uurija kaaluda soovib, kasutatakse ka erinevaid tõestusmeetodeid. Teisisõnu hõlmab kehtivuse mõiste selle erinevaid tüüpe, millel on oma eriline tähendus.

Neid on neli tüüpi välised kriteeriumid Kasutatakse kehtivuse tõendamiseks:

1) tulemuslikkuse kriteeriumid (nende hulka võivad kuuluda näiteks tehtud töö maht, õppeedukus, koolitusele kulunud aeg, kvalifikatsiooni kasvutempo;

2) subjektiivsed kriteeriumid (need sisaldavad erinevat tüüpi vastuseid, mis
peegeldab inimese suhtumist millessegi või kellessegi, tema arvamust, vaateid,
eelistused; tavaliselt saadakse subjektiivsed kriteeriumid intervjuude, ankeetide, ankeetide abil);

3) füsioloogilised kriteeriumid (neid kasutatakse keskkonna ja muude situatsioonimuutujate mõju uurimisel inimkehale ja psüühikale; mõõdetakse pulsisagedust, vererõhku, naha elektritakistust, väsimusnähte jne);

4) juhuslikkuse kriteeriumid (kasutatakse siis, kui uuringu eesmärk puudutab näiteks selliste inimeste tööle valimise probleemi, kes on vähem altid õnnetustele).

Adekvaatse ja kergesti tuvastatava kriteeriumi otsimine on valideerimise üks olulisemaid ja raskemaid ülesandeid.

Neid on mitu kehtivuse tüübid, diagnostikameetodite iseärasuste ja välise kriteeriumi ajutise staatuse tõttu:

1) Kehtivus "sisu järgi". Seda tehnikat kasutatakse peamiselt saavutustestides. Tavaliselt ei hõlma saavutustestid kogu materjali, mille õpilased on läbinud, vaid mõnda väikest osa sellest (3-4 küsimust). Kas saab olla kindel, et õiged vastused neile paarile küsimusele annavad tunnistust kogu materjali omastamisest. Sellele peaks sisu kehtivuse kontroll vastama. Selleks võrreldakse testi edukust õpetajate eksperthinnangutega (selle materjali jaoks). Kehtivus "sisu järgi" kehtib ka kriteeriumipõhiste testide puhul. Mõnikord nimetatakse seda tehnikat loogiline kehtivus.

2) Kehtivus "samaaegselt", või praegune kehtivus, määratakse välise kriteeriumiga, mille järgi kogutakse teavet samaaegselt
katsed vastavalt testitud meetodile. Teisisõnu kogutakse andmeid, mis on seotud praegusega (prooviperioodi edusammud, sama perioodi jõudlus jne). Need on korrelatsioonis testi edukuse tulemustega.

3) "ennustav kehtivus . Selle määrab ka üsna usaldusväärne väline kriteerium, kuid selle kohta kogutakse teavet mõni aeg pärast testi. Väliskriteeriumiks on tavaliselt inimese võime, mis väljendub mõnes hinnangus selle tegevuse liigi kohta, milleks ta diagnostiliste testide tulemuste põhjal välja valiti. Kuigi see tehnika sobib kõige paremini diagnostiliste meetodite ülesandeks - tulevase edu ennustamiseks, on seda väga raske rakendada. Prognoosi täpsus on pöördvõrdeline selliseks prognoosimiseks antud ajaga. Mida rohkem aega pärast mõõtmist möödub, seda rohkem tegureid tuleb tehnika prognostilise olulisuse hindamisel arvesse võtta. Kõiki ennustust mõjutavaid tegureid on aga peaaegu võimatu arvesse võtta.

4) "Tagasiulatuv" kehtivus. See määratakse kriteeriumide alusel
mis peegeldab minevikusündmust või kvaliteediseisundit. Seda saab kasutada kiireks teabe saamiseks tehnika prognoosimisvõimaluste kohta. Seega, et testida, mil määral vastavad sobivustesti head hinded kiirele õppimisele, saab võrrelda varasemaid hindeid, varasemaid ekspertarvamusi jne. isikutel, kellel on hetkel kõrged ja madalad diagnostilised näitajad.

Väljatöötatud metoodika kehtivuse kohta andmete esitamisel on oluline täpselt täpsustada, millist tüüpi kehtivust mõeldakse (sisu, samaaegsuse vms järgi). Samuti on soovitav esitada teave nende isikute arvu ja omaduste kohta, kelle kohta valideerimine läbi viidi. Selline teave võimaldab tehnikat kasutaval teadlasel otsustada, kui kehtiv see meetod selle rühma jaoks on
mida ta kavatseb seda kasutada. Nagu usaldusväärsuse puhul, tuleb meeles pidada, et tehnikal võib olla kõrge valiidsus ühes proovis ja madal valiidsus teises. Seega, kui teadlane kavatseb metoodikat kasutada katsealuste valimi puhul, mis erineb oluliselt sellest, mille puhul valiidsustest tehti, peab ta sellise testi uuesti läbi viima.

Lisaks kehtivusliikidele on oluline teada kehtivuse kriteeriumid . Need on peamised märgid, mille järgi saab praktiliselt hinnata, kas see tehnika on kehtiv või mitte. Need kriteeriumid võivad olla järgmised:

1. Käitumisnäitajad - subjekti reaktsioonid, tegevused ja teod erinevates elusituatsioonides.

2. Õppeaine saavutused erinevates tegevustes: haridus-, töö-, loome- jm.

3. Andmed, mis näitavad erinevate kontrollnäidiste ja ülesannete täitmist.

4. Muude meetodite abil saadud andmed, mille kehtivus või seos testitava meetodiga loetakse usaldusväärselt tuvastatuks.

12. Validsuse, usaldusväärsuse, usaldusväärsuse mõiste psühhodiagnostikas.

Töökindlus– üks katsemeetodite kriteeriume. Selle kriteeriumi väljatöötamisele aitasid kaasa A. Anastasi, Kronbach, Thorndike.

Usaldusväärsus on katsetulemuste suhteline püsivus, stabiilsus, järjepidevus samadel katsealustel esmasel ja korduval mõõtmisel. Mõõtmist on vaja korrata sama prooviga. Erinevused on võimalikud, kuid need peaksid olema väikesed. Seega räägib usaldusväärsus tulemuste täpsusest ja stabiilsusest juhuslike tegurite mõjul.

Üldine levik võib olla tingitud kahest põhjuste rühmast:

    Tunnusele enesele omane varieeruvus.

    Keskkonnategurid, mis võivad mõjutada

Töökindluse arvutamise protseduurid:

    Sama testi läbiviimine. (kordustesti usaldusväärsus), korrelatsioonikordaja arvutamine. Testide vaheline intervall on üks kuni mitu kuud.

    Testide paralleelvormide läbiviimine. Samaväärse testivormiga uuringu läbiviimisel on spetsialist veendunud valitud tunnuse õigsuses. Testivormide samaväärseks käsitlemiseks peab mõlemas testis olema sama arv ülesandeid, ülesanded peavad olema ühtsed, ülesanded peavad olema järjestatud sama keerukusastmega, olema sama keskmine ja standard hälve. Usaldusväärsuse arvutamiseks paralleelsete testide abil kasutatakse kahte lähenemisviisi:

    Sama testiga uuritakse samu subjekte. Ja siis veel üks ja kui korrelatsioonikoefitsient on suurem kui 0,7, siis on usaldusväärsus kõrge.

    Katsealused jagunevad kahte gruppi, üks rühm läbib testi A, teine ​​testi B, nädal hiljem – vastupidi.

    Testi poolitamine ja korrelatsioonikordaja arvutamine. Katsealused sooritavad testi kaks osa, mis on samaväärsed. Kõik paarisarvulised ülesanded jagunevad ühte ossa, paaritu numbriga ülesanded teise. See protseduur näitab testi järjestust enda sees, küsimuste valiku adekvaatsuse mõõdikut. Arvutatakse korrelatsioonikordaja.

Usaldusväärsuse koefitsient vastab Spearmani või Pisroni korrelatsioonikoefitsiendile.

Usaldusväärsuse tegur-dispersioon - usaldusväärsuse määramise meetod, mis põhineb testitulemuste dispersioonanalüüsil. Testi usaldusväärsus vastab tõelise dispersiooni (st uuritava teguri dispersiooni) ja tegelikult saadud empiirilise dispersiooni suhtele. Viimane on tegeliku dispersiooni ja mõõtmisvea dispersiooni summa. Faktoranalüütiline lähenemine usaldusväärsuse määratlusele lahutab lisaks tõelise näitaja hajuvuse (J. Gilford, 1956).

Tõelise indikaatori dispersioon võib omakorda koosneda sarnaste testide rühmade ühisteguri dispersioonist, spetsiifilistest teguritest, mis pakuvad konkreetse fookusega teste, ja konkreetsele katsemeetodile omaste tegurite dispersioonist. Seetõttu on testi kogu dispersioon võrdne üldiste, spetsiifiliste ja ühiktegurite variatsioonide summaga pluss vea dispersioon

Usaldusväärsuse määramise tegur-variatsioonimeetod sobib juba faktoriseeritud testi hindamiseks, kuid mitte testide jaoks, mis mõõdavad laias valikus erinevaid parameetreid, kuna mõned neist ei pruugi olla metoodika kehtestatud kehtivusalaga hõlmatud.

Töökindlus ja lubatud mõõtmisviga:

Usaldusväärsuse määrab mõõtmisvea kriteerium. Viga on statistika, mis iseloomustab üksikute mõõtmiste täpsusastet. Eeldatakse, et mis tahes tunnuse puhul on igal indiviidil tõene skoor. Iga testis saadud indikaator erineb oma tegelikust väärtusest mõne juhusliku vea võrra. Ja kui testite inimest mitu korda, saate indikaatori hajutuse tegeliku väärtuse ümber. See väärtus kõigub teatud piirides. Selle väärtuse kõikumine võib sõltuda süstemaatilistest ja juhuslikest vigadest. Süstemaatiliste vigade põhjuseks võivad olla vale testimine, protseduurile mittevastavus, töötlemise ebatäpsus, meetodi madal kehtivus. Tõenäolised on ka inimfaktoriga seotud juhuslikud vead. Kui selliseid tõrkeid metoodikas ei ole, siis ei saa seda ka täpseks pidada. Suure hulga vaatluste korral moodustavad üksikud hinnangud teatud tüüpi statistika jaotuse, mis toob esile mõõtmisvead. Mõõtmisviga määratakse statistiliste meetoditega - üksikute mõõtmiste jaotuse hajutusega seotud ruuthälbe väärtus. Viga ei tohiks ületada 5%.

Kehtivus:

Valiidsus on testi võime mõõta seda, mida see on mõeldud mõõtma. See mõiste ei viita enam testile, vaid selle eesmärgile. Test võib olla usaldusväärne, kuid mitte kehtiv. Aga kui test on kehtiv, siis on see usaldusväärne.

Kehtivuse ideede allikad:

    Esimesed ideed tekkisid juba enne testide loomist. Sageli on teadlased seostanud uurimistulemusi tulevaste edusammudega. Näiteks Pythagoras ühendas mõtlemise ja kõne intuitsiooni abil.

    Mõte testi sobivuse praktilise kontrollimise vajadusest. Väljaspool praktikat ei saa kehtivuse probleem eksisteerida.

    Filosoofilised ideed: tõde on mõtte vastavus tegelikkusele. Tõe kriteerium on kasulikkus.

    Meie tehtud mõõtmised ei ole ilmsed, need nõuavad teoreetilist alust. Teoreetiline = empiiriline kehtivus.

    Statistikateaduse areng – korrelatsioon ja faktoranalüüs.

Viis allikat andsid alust viiele kehtivustüübile.

20. sajandi alguses mängis juhtivat rolli intuitsioon. Kui testi koostaja oli kuulus inimene, siis usk kehtivusse võeti nende sõna järgi.

1920. ja 1930. aastatel kasvasid praktika nõudmised, hakati looma empiirilistele allikatele tuginevaid teste. Välja on töötatud kolm empiirilist lähenemist:

    Kõiki tööle kandideerijaid testitakse. Aja jooksul mõõdetakse nende tootlikkust ja efektiivsust. Siis tuli näitajate korrelatsioon. Seega kasutati teste kasulikuks.

    Esiteks testitakse neid, kes juba edukalt töötavad, ja seejärel korreleeritakse selle testimise tulemused kandidaatide tulemustega. Kui on suhe, siis test on kehtiv.

    Bineti ja Simoni teosed. Veendumaks, et test mõõdab intelligentsust. Kõik testiülesanded viidi läbi kahes rühmas, mille valisid välja mitte psühholoogid, vaid õpetajad. 1. rühmas olid kõrgete vaimsete võimetega lapsed, 2. rühmas - väljendamata võimetega Seda meetodit nimetati "eksperdiks". Täiendavad testid viidi läbi. Ja kui mõlemas rühmas vastas enamus vastavalt autorite ootustele, siis tunnistati test kehtivaks.

Seega eksisteerisid empiirilised meetodid kehtivuse põhjendamiseks kuni 1950. aastateni. Nad hakkasid uskuma, et paikapidavust on võimalik tõestada mitte ainult praktika abil. Teooria ja praktika analüüs ja vastavus. Sisu kehtivus, võrdlus õppekava ja testi sisuga. Võrdlemist hõlbustab see, kui programm tõstab esile probleemi, eesmärgi ja põhimõisted. Kontseptuaalne kehtivus, kuna psühholoogid on huvitatud teaduslike mõistete seostamisest empiiriliselt vaadeldud faktidega.

Kehtivuse tõestamise empiirilistes meetodites mängivad erilist rolli välised kriteeriumid, mis on kehtivuse tõendid. Ameerika psühholoogid Tiffany ja McCormick analüüsisid väliste kriteeriumide kasutamist ja tuvastasid 4 tüüpi neid:

    Tulemuslikkuse kriteerium - tehtud töö maht, oskuste kasvutempo

    Subjektiivne kriteerium - erinevat tüüpi vastuste kaasamine, mis peegeldavad suhtumist millessegi.

    Füsioloogiline kriteerium – kasutatakse keskkonna uurimisel.

    Juhuslikkuse kriteeriumiks on paljude tegurite arvestamine.

Välised kriteeriumid peavad vastama asjakohasuse, häiretevabaduse ja töökindluse nõuetele. Asjakohasus on semantiline vastavus testi ja sellest sõltumatu elutähtsa kriteeriumi vahel. Sekkumisvabadust (saastumist) peetakse oluliseks, kuna tegevust mõjutavad inimene ise ja tema töötingimused. Usaldusväärsus – tulemuste järjepidevus

Diagnostika (konkurentsipõhine) B. peegeldab testi võimet eristada katsealuseid uuritava tunnuse järgi. Diagnostilise V. analüüs on seotud testinäitajate vastavuse väljaselgitamisega uuritava psühholoogiliste omaduste tegeliku seisundi vahel uuringu ajal. Seda tüüpi V. määratluse näide võib olla uuring kontrastrühmade meetodil. Intelligentsustesti läbiviimine normaalselt arenevatel intellektipuudega lastel ja nende eakaaslastel võib paljastada sügavaid kvantitatiivseid ja kvalitatiivseid erinevusi võrreldavate rühmade ülesannete täitmises. Esimese ja teise rühma laste diferentseerumise usaldusväärsuse aste vastavalt katseandmetele on selle tehnika abil saadud vaimse arengu diagnostilise V. hinnangu tunnuseks.

Sisu kehtivus(sisemine, loogiline) - teabe kogum katseobjektide esinduslikkuse kohta mõõdetud omaduste ja tunnuste suhtes. Sellesuunalise metoodika valideerimise üks peamisi nõudeid on uuritava psühholoogilise nähtuse võtmeaspektide kajastamine testi sisus. Kui käitumise või tunnuse valdkond on väga keeruline, siis tähenduslik V. nõuab testi ülesannetes uuritava nähtuse kõigi olulisemate koostisosade esitamist.

diferentsiaal IN. - valiidsus, mis käsitleb psühhodiagnostilise tehnika abil diagnoositud psühholoogiliste tegurite vahelisi sisemisi seoseid. Sisu D.V. Seda saab illustreerida huvipakkuvate testide näitega, mis enamasti on üldiselt mõõdukas korrelatsioonis üldise õppeedukuse näitajatega, kuid on erineval määral seotud üksikute erialade tulemustega. V. d. on eriti oluline professionaalses valikus kasutatavate tehnikate diagnostilise väärtuse näitajana.

illusoorne B.(vale) - illusioon testitulemuste põhjal tehtud järelduse vastavusest katsealuse isikuomadustele. Tekib äärmiselt üldiste ja seetõttu peaaegu kõigi küsitletud sõnastuste kasutamise tulemusena, nagu näiteks "eesmärgi valikul mõistlik", "püüdleb parema elu poole" jne. Selliseid väiteid aktsepteerivad peaaegu kõik inimesed kirjeldavad täpselt nende isiksust, mis loob aluse mitmesuguste ennustajate ja ennustajate tegevusele.

astmeline IN. - (inglise keeles incremental - increment, profit) - üks kriteeriumi kehtivuse komponente, testi ennustav valiidsus, peegeldades metoodika praktilist väärtust valikus. Aastal ja. saab kvantifitseerida koefitsiendi kehtivuse kaudu.

Konsensus B. (konsensuslik valiidsus) - valiidsuse tüüp, mis põhineb testiandmete seose (korrelatsiooni) loomisel välisekspertidelt saadud andmetega, kes on testitud isikutega hästi kursis. V. to. kontseptsiooni ja protseduuri tutvustas R. McCrae 1982. aastal, et tagada isiksuseankeetide valideerimine, mis on sageli keeruline (ja mõnikord võimatu) valiidsuse tuvastamiseks vajalike kriteeriumide puudumise tõttu.

Konstruktiivne V. on üks peamisi kehtivuse tüüpe, mis peegeldab uuritava psühholoogilise konstruktsiooni esindatuse astet testitulemustes. Konstruktsioonina võivad toimida praktiline või verbaalne intelligentsus, emotsionaalne ebastabiilsus, introvertsus, kõne mõistmine, tähelepanu ümberlülitumine jne. Teisisõnu määratleb V. kuni testiga mõõdetud psühholoogiliste nähtuste teoreetilise struktuuri ala. .

Siiski tuleb märkida, et erinevalt kriteeriumi valideerimisest ei nõua V. to. analüüs kahe testi tulemuste vahel suurt seost. Kui selgub, et uued ja võrdlustestid on sisult ja tulemustelt peaaegu identsed ning väljatöötatud metoodikal ei ole lühiduse ega rakenduslihtsuse eeliseid, tähendab see vaid testi dubleerimist, mis on põhjendatud vaid vaatenurgast. paralleelkatsevormi loomine. Protseduuri V. kuni mõte on tuvastada uue testiga mõõdetud psühholoogiliste nähtuste sarnasus ja erinevus võrreldes teadaolevaga.

V. to. oluline aspekt on sisemine järjepidevus, mis peegeldab seda, kuidas teatud testimaterjali moodustavad üksused (ülesanded, küsimused) on allutatud testi kui terviku põhisuunale, keskendudes samade konstruktsioonide uurimisele. Sisemise järjepidevuse analüüs viiakse läbi, korreleerides iga ülesande vastuseid testi üldtulemusega. V määramisel kuni. Oluline koht on mõõdetava konstruktsiooni dünaamika uurimisel. Samas saame toetuda hüpoteesidele selle vanuselise arengu, koolituse, koolituse, eriala valdamise jms mõju kohta.

Kriteerium V. - omaduste kogum, sealhulgas praeguste ja prognostiliste meetodite kehtivus ning mis peegeldab diagnoosi ja prognoosi vastavust mõõdetava nähtuse teatud kriteeriumitele. Kriteeriumi valideerimine ei sõltu testi tulemustest ja uuritava kvaliteedi otsestest mõõtmistest, nagu saavutuste tase mis tahes tegevuses, võimete arenguaste, teatud isiksuseomaduse raskusaste jne. Saavutuse valideerimisel testide puhul võrreldakse mõõtmistulemust õpetajate arvamusega mingis valdkonnas uuritud teadmiste kohta, akadeemiliste hinnangute, kontrolltestidega jm. Karjäärinõustamistestide ja -meetodite valideerimise puhul võrreldakse testide hinnanguid nii kaaslaste kui ka kaaslaste hinnangutega. juhtide eksperthinnangutega ja professionaalse valdkonna saavutuste objektiivsete näitajatega.

Ilmselge V. - ettekujutus testist, selle ulatusest, tõhususest ja ennustavast väärtusest, mis tekib katsealusel või muul isikul, kellel puudub eriline teave kasutamise olemuse ja metoodika eesmärkide kohta. V. o. ei ole objektiivselt kindlaks määratud kehtivuse komponent. Samal ajal kõrge V. umbes. enamikul juhtudel on see väga soovitav. See toimib tegurina, mis julgustab uuritavaid eksamineerima, aitab kaasa tõsisemale ja vastutustundlikumale suhtumisele testi ülesannete täitmise töösse ning psühholoogi sõnastatud järeldustesse.

Piisav tase V. umbes. eriti oluline täiskasvanute uurimismeetodite jaoks. Uuritavate ja psühhodiagnostilise teabe kasutajate esitused V. o. suurel määral määrab tehnika nimetus, kuna see osa testi kohta käivast teabest on kõige paremini kättesaadav mittespetsialistidele. V. o. parandab oluliselt arusaadavate sõnastuste ja terminite ning sisult kõige loomulikumate ülesannete kasutamist, arvestades ainete vanuse, soo ja erialast eripära. Ebaadekvaatselt ülehinnatud V. umbes. aitab kaasa kriteeriumi saastumise mõju selgemale avaldumisele.

V. o. mõnikord nimetatakse seda väliseks (näo kehtivus) või "usalduseks" (usu kehtivus), kehtivuseks.

V. vanuse järgi diferentseerimine on üks konstrukti kehtivuse komponente, mis on seotud uuritava kvaliteedi muutuste vanuselise dünaamikaga. Konstrukti kehtivuse iseloomustus seisneb siin selles, et määratakse testitulemuste vastavus teoreetiliselt eeldatavatele ja praktiliselt täheldatud vanusega seotud muutustele antud konstruktsioonis või omaduses.

Prognostiline V. - teave tehnika (testi) täpsuse ja kehtivuse astme kohta võimaldab teil teatud aja möödudes pärast mõõtmist hinnata diagnoositud psühholoogilist kvaliteeti. V. p peegeldab ajavahemikku, milleni sellise kohtuotsuse põhjendus ulatub. Info V. p kohta on kõige otsesemalt seotud tehnika ennustusjõu avalikustamisega, selle põhjal sõnastatud vahetu ja kaugema prognoosi kehtivusastme selgitamisega, testis saadud näitajate olulisuse analüüsiga. koos nn. tulemuste ekstrapoleerimine tuleviku jaoks.

Kriteeriumide valideerimisena ei saa toimida mitte ainult tegeliku käitumise näitajad, vaid ka tegevuse, ravi, koolituse jne oodatavad tulemused, ravitulemused jne. Samas on kahe kriteeriumi kehtivuse tüübi erinevus seotud mitte ainult kriteeriumide võrdluste ajapiirangutega.Praegune kehtivus ja V. lk kvaliteedi areng või tegevuse edukus - teisalt.

V. p indikaatorite olulisust valikule suunatud testiprotseduuride analüüsimisel rõhutab inkrementaalse valiidsuse erikontseptsiooni kasutuselevõtt. See V. p indikaator annab teavet selle kohta, kui palju on selle testi abil valikumenetlus paranenud võrreldes traditsioonilisega (põhineb ainult formaalsel teabel varasemate tegevuste kohta, isiklike toimikute analüüsil, vestlustel).

V. infokompleks koos. on traditsiooniliselt kõige suurem väärtus testide puhul, mis uurivad tegevusi, mis on lähedased või kattuvad reaalsega (enamasti haridusalane või erialane). Õpitav tegevus on reeglina sünteetiline, koosneb paljudest, mõnikord heterogeensetest teguritest (isiksuseomaduste ilmingud, vajalike teadmiste ja oskuste kogum, spetsiifilised võimed jne). Seetõttu on testitava tegevuse adekvaatse mudeli loomisel üks olulisemaid ülesandeid ülesannete valik, mis katavad uuritava nähtuse põhiaspekte õiges proportsioonis tegeliku tegevuse kui tervikuga.

Praegune V. (diagnostiline, konkureeriv) - testi omadus, mis peegeldab selle võimet eristada subjekte diagnostilise tunnuse alusel, mis on selle tehnika uurimise objektiks. Selliste märkidena võivad toimida üldvõimete tasemed, väited, verbaalne intelligentsus, ärevus jne. Kitsamas tähenduses on V.t valideeritud testi tulemuste vastavuse tuvastamine sõltumatule kriteeriumile, mis peegeldab kvaliteedi seisundit. mida uuritakse uuringu ajal testiga.

Omamoodi V. t. indikaator on teabe kogum selle kohta, kui mugav, ökonoomne on test võrreldes uuritava kvaliteedi kohta teabe hankimisega muudest allikatest (vaatlus, objektiivsete andmete analüüs, eksperthinnang jne).

Ökoloogiline V. - testi kehtivus mõõdetava omaduse suhtes konkreetse olukorra kontekstis. Ve. on testi omadus, mis väljendub selles, et selle kasutamine erinevate praktiliste probleemide lahendamisel toob kaasa testitulemuste kvalitatiivselt erineva tõlgendamise (V. N. Druzhinin, 1990).

Empiiriline B.-testi valiidsuse tunnuste kogum, mis on saadud võrdleva statistilise hindamismeetodiga. See on seotud peamiselt kriteeriumi kehtivuse valdkonnaga ja selle kahe tüübiga: praegune kehtivus ja ennustav kehtivus. Kui sisulise testi kehtivuse kindlakstegemisel viiakse testi hindamine läbi erinevate kvalitatiivsete protseduuride abil teabe hankimiseks kirjeldavate meetoditega, kasutades eksperthinnanguid ja muid teabeallikaid (otsuse andmiseks testiülesannete vastavuse kohta mõõtmisaine sisu), siis V. e. mõõdetakse alati statistilise korrelatsiooniga. Kahe väärtuste seeria vahelise seose korrelatsioonianalüüs viiakse läbi - uuritava vara välisparameetri testiskoorid ja näitajad (või mõne muu testi tulemused, mille kehtivus on teada).