Valjanost metodologije, vrste valjanosti. Korelacijska analiza kao jedna od metoda utvrđivanja pouzdanosti i valjanosti

Osoba koristi različite metode i alate za provjeru ili mjerenje neke vrste kvalitete. Mjera u kojoj ova tehnika i alat mogu proizvesti kvalitativne rezultate ukazuje na njihovu valjanost. Što ovaj koncept znači u psihologiji? Koje su vrste valjanosti? U psihologiji je ovo svojstvo obično primjenjivo na testove i metode koje koriste stručnjaci.

Što je valjanost?

Koncept koji se razmatra ima mnogo definicija. Što je valjanost? Ovo je prikladnost i valjanost primjene neke tehnike ili rezultata u određenoj situaciji. Primijenjeno značenje ove riječi je stupanj usklađenosti rezultata i metoda s postavljenim zadacima.

Valjanost je još jedna mjera koja mjeri specifične kvalitete. Dakle, tehnika ima za cilj izmjeriti određenu kvalitetu, kao što je inteligencija, a njezina valjanost trebala bi pokazati koliko dobro tehnika pomaže u dobivanju rezultata.

Drugim riječima, valjanost se može nazvati pouzdanošću. Mjeri one testove i metode kojima se mjere određene psihološke kvalitete. Što bolje mjere kvalitete koje mjere, to je njihova valjanost veća.

Valjanost postaje važna u dva slučaja:

Kada se razvije određena tehnika.
Kada određena tehnika daje rezultate, potrebno je utvrditi koliko su ti rezultati dobri.

Dakle, valjanost je karakteristika koja ukazuje na prikladnost određene tehnike za mjerenje neke kvalitete te na korisnost, kvalitetu i učinkovitost te tehnike.

Obično se nekoliko vrsta valjanosti koristi za provjeru valjanosti određenog testa ili tehnike. Također uspoređuje pokazatelje koje daju različiti alati. Postoji mnogo načina za mjerenje određene psihološke kvalitete ili karakteristike. Psiholozi će češće koristiti onu metodu koja daje pouzdanije rezultate. Time će se pokazati njegova visoka valjanost.

Zajedno s valjanošću često se razmatra i koncept pouzdanosti. Metode i ispitivanja moraju biti pouzdani, odnosno moraju biti stalni, pouzdani. Eksperimentator mora biti siguran da razmatra točno onu kvalitetu koju želi razmotriti. Zbog toga pouzdanost ne mora uvijek biti valjana, ali valjanost uvijek mora biti pouzdana.

Valjanost u psihologiji

Valjanost se koristi u mnogim područjima života, gdje se mjere različiti pokazatelji. U psihologiji valjanost također postaje neophodna, posebno u eksperimentalnoj psihologiji. Valjanost u psihologiji je:

eksperimentatorovo povjerenje da mjeri kvalitetu koja mu je potrebna;
pouzdanost pokazatelja koji mjere tu kvalitetu.

Ako je čitatelj ikada prošao psihološke testove, onda zna za unutarnju želju da dobije konkretan odgovor na postavljeno pitanje. Valjanost testa pokazuje eksperimentatoru konkretan rezultat koji postiže testiranjem. Ovdje je specifičan zadatak, odgovor na koji mora dobiti nakon obavljanja svih potrebnih radnji.

Metode i testovi trebaju biti korisni i valjani, što se mjeri njihovom valjanošću.

Postoje tri načina provjere valjanosti:

Procjena sadržajne valjanosti je podudarnost rezultata procjene subjekta sa stvarnim kvalitetama koje se pojavljuju u stvarnosti. Ovdje se koristi koncept kao što je valjanost lica - osoba mora vidjeti stvarnu vezu između sadržaja same metodologije i njezinih rezultata i stvarnosti, u kojoj se očituje izmjerena kvaliteta.
Procjena valjanosti konstrukta je utvrđivanje da tehnika izračunava konstrukte utemeljene na dokazima i unaprijed određene konstrukte. Konvergentna validacija omogućuje korištenje nekoliko tehnika koje razmatraju slične karakteristike i daju točnije rezultate razmatrane kvalitete. Diskriminantna provjera valjanosti isključuje druge tehnike koje razmatraju kvalitete koje nisu u korelaciji sa željenom kvalitetom.
Procjena valjanosti kriterija je podudarnost rezultata s očekivanim pokazateljima, koji se otkrivaju na druge načine. Ovdje se koristi prediktivna valjanost, koja pomaže u predviđanju budućeg ponašanja.

Vrste valjanosti

Postoji nekoliko vrsta valjanosti, o kojima ćemo govoriti u nastavku:

Vanjska valjanost je generalizacija zaključka situacije, populacije, nezavisnih varijabli. Dijeli se na:

operativna valjanost.
Konstruktna valjanost – objašnjenje ponašanja osobe u trenutku prolaska testa.

Interna valjanost – promjena tijekom eksperimenta pod utjecajem nepromjenjivih faktora.
diferencijalna valjanost.
inkrementalna valjanost.
Ekološka valjanost je pokazatelj da je osoba sposobna obavljati različite radnje koje u jednoj situaciji mogu biti uspješne, ali ne i u drugoj.

Ovu klasifikaciju koristi eksperimentalna psihologija. Organizacijska psihologija i psihodijagnostika koriste drugačiju klasifikaciju:

valjanost konstrukcije. Dijeli se na:

konvergentna valjanost.
divergentna valjanost.

Kriterijska (empirijska) valjanost - izračun korelacije rezultatom na testu vanjskog parametra koji je odabran kao valjani pokazatelj. Dijeli se na:

Trenutna valjanost - proučavanje parametra u sadašnjem vremenu.
Retrospektivna valjanost – stanje ili događaj koji se dogodio u prošlosti.
Prediktivna valjanost - predviđanje ponašanja, kvaliteta.

Valjanost sadržaja - koristi se u eksperimentima gdje se razmatra neka interakcija, aktivnost. Ima podvrstu:

očita valjanost.

Ostale vrste valjanosti su:

Apriorno.
Kongruentan.
Povezano.
Konstruktivno.
Konsenzus.
Faktorijel.
teorijski, itd.

Što je valjanost testa?

Mnogi ljudi se testiraju. Postoje posebni psihološki testovi koje koriste psiholozi, te drugi tabloidni testovi. Što je valjanost testa, koji je njegov važan kriterij? Ovo je pokazatelj korespondencije karakteristike, kvalitete, svojstva testu koji ih mjeri.

Testovi su različiti. Koriste se za mjerenje psihofizioloških parametara osobe. Najveća valjanost ostaje 80%. Korisnost korištenja testova postaje kada vam omogućuju dobivanje točnih podataka o određenim specifičnim karakteristikama. Postoji nekoliko pristupa proučavanju valjanosti testa:

Konstruktivna valjanost, koja vam omogućuje dublje proučavanje kvaliteta osobe u situaciji, aktivnosti, sustavu.
Valjanost prema kriteriju - proučavanje parametra u sadašnjem vremenu i predviđanje u budućnosti.
Valjanost sadržaja je korespondencija psiholoških konstrukata, njihova raznolikost.
Prediktivna valjanost – predviđa razvoj određene kvalitete u budućnosti, što je teško jer se može različito razviti kod različitih ljudi.

Dok se ne utvrdi pouzdanost i valjanost testa, ne koristi se u psihološkoj praksi. Mnogo ovisi o područjima u kojima se testovi primjenjuju. Postoje obrazovni, stručni i drugi testovi koji se koriste u pojedinim ustanovama za predviđanje i prepoznavanje karakteristika kandidata.

Na stranici psihološke pomoći također možete napraviti testove koji već imaju visoku valjanost i pokazuju pouzdane rezultate.

Što je valjanost metode?

Što je valjanost metode? Ovo je pokazatelj koji pokazuje proučava li tehnika koja se razmatra kvalitetu, karakteristike za koje je namijenjena. Pritom se naglasak stavlja na činjenicu da se ispitanik može drugačije vidjeti i karakterizirati. Zato rezultati ne uzimaju uvijek u obzir mišljenje ljudi koji možda ne primjećuju određene karakteristike kod sebe.

Validacija je provjera valjanosti metodologije. Za određivanje učinkovitosti, učinkovitosti, praktičnosti korištene metodologije koristi se vanjski neovisni pokazatelj - kvaliteta koja se promatra u svakodnevnom životu. Postoje 4 vrste vanjskih pokazatelja:

Kriterij uspješnosti je utrošeno vrijeme, količina posla, razina akademske uspješnosti, razvoj profesionalnih vještina itd.
Subjektivni kriteriji - mišljenje, stavovi, sklonosti, stav subjekta prema nekome ili nečemu. Ovdje se koriste upitnici, intervjui, upitnici.
Fiziološki kriteriji – utjecaj vanjskog svijeta na psihu i ljudski organizam. Mjeri puls, brzinu disanja, simptome umora itd.
Kriterij slučajnosti - je li moguće, na primjer, odabrati osobe koje nisu sklone nesrećama? Proučavanje utjecaja pojedinog slučaja.

Teorijski pristup u mjerenju valjanosti metoda omogućuje nam da prepoznamo da li tehnologija doista proučava kvalitetu za koju je namijenjena.

Valjanost je također određena pojavom proučavane kvalitete. Dobro je ako je uobičajena, što tehniku čini potrebnom i korisnom. Etičke i kulturne promjene u društvu također postaju važne.

Ishod

U psihološkoj praksi testovi i tehnike često se koriste kao pomoć u proučavanju nečije osobnosti. Ovdje posebno govorimo o unutarnjim parametrima koji nisu vidljivi oku. Osobine karaktera, ponašanja, moguće prognoze za budućnost, kakva će osoba biti i kakav će biti njen život - sve se to proučava raznim testovima i metodama koje teže jednom jedinom rezultatu - proučavanju osobe.

Rezultat uspješnog utvrđivanja valjanosti pojedinog instrumenta je uspješno poznavanje svake osobe, bez obzira kako na sebe gleda. Ljudi često ne primjećuju neke osobine u sebi, rijetko se promatraju trezvenim pogledom. Testovi i tehnike omogućuju otkrivanje pojedinačnih parametara.

Predviđanje valjanih testova i metoda je brzo i kvalitetno poznavanje druge osobe uz mogućnost pomoći u rješavanju bilo kojeg psihičkog problema. To se neće postići skoro, ali dostupni alati već su pokazali svoju učinkovitost. Obično je ovo pitanje od interesa samo za one ljude koji su uključeni u određivanje kvalitete testova i metoda. Međutim, običnim će ljudima također biti korisno znati kojim vježbama treba vjerovati, a kojima ne.

Ulaznica broj 9

Upitnici motivacije i njihove karakteristike.

Upitnici motiva - skupina upitnika dizajniranih za dijagnosticiranje motivacijsko-potrebne sfere osobe, koja vam omogućuje da utvrdite na što je usmjerena aktivnost pojedinca (motivi kao razlozi koji određuju izbor smjera ponašanja). Osim toga, od velike je važnosti pitanje kako je regulirana dinamika ponašanja. U ovom slučaju često se pribjegava mjerenju stavova. Razvoj upitnika motiva u psihodijagnostici uvelike je povezan s potrebom procjene utjecaja faktora „socijalne poželjnosti“ koji ima stavovnu prirodu i smanjuje pouzdanost podataka dobivenih pomoću upitnika ličnosti. Najpoznatiji upitnici motiva uključuju "List osobnih preferencija" koji je razvio A. Edwards (1954.), koji je dizajniran za mjerenje "snage" potreba posuđenih s popisa koji je predložio G. Murray za tematski test apercepcije. Te potrebe uključuju, na primjer, potrebu za uspjehom, poštovanjem, vodstvom, itd. "Snaga" svake potrebe nije izražena u apsolutnim iznosima, već relativno u odnosu na "snagu" drugih potreba, t.j. koriste se osobni pokazatelji. Za proučavanje uloge faktora “društvene poželjnosti” A. Edwards (1957.) predložio je poseban upitnik. Drugi upitnici motiva također su naširoko korišteni, na primjer, D. Jackson's Personality Study Form (1967), upitnici A. Mehrabyan (1970), itd.

Nakon pouzdanosti, drugi ključni kriterij za ocjenu kvalitete metoda je valjanost. O pitanju valjanosti metodologije odlučuje se tek nakon što se utvrdi njezina dostatna pouzdanost, jer nepouzdana metodologija ne može biti valjana. Ali najpouzdanija tehnika bez poznavanja njezine valjanosti praktički je beskorisna.

Valja napomenuti da se pitanje valjanosti donedavno činilo jednim od najtežih. Najukorijenjenija definicija ovog koncepta je ona dana u knjizi A. Anastasija: “Validnost testa je koncept koji nam govori što test mjeri i koliko dobro to radi.”

Iz tog razloga ne postoji jedinstveni univerzalni pristup određivanju valjanosti. Ovisno o tome koju stranu valjanosti istraživač želi razmotriti, koriste se i različite metode dokazivanja. Drugim riječima, pojam valjanosti uključuje njezine različite vrste, koje imaju svoje posebno značenje. Provjera valjanosti tehnike naziva se validacija.

Valjanost se u svom prvom smislu odnosi na samu metodologiju, odnosno valjanost mjernog alata. Ova provjera naziva se teorijska validacija. Valjanost se u drugom smislu već odnosi ne toliko na metodologiju koliko na svrhu njezine uporabe. Ovo je pragmatična potvrda.

Ukratko, možemo reći sljedeće:

u teoretskoj validaciji, istraživača zanima samo svojstvo koje se mjeri tehnikom. To, u biti, znači da se provodi stvarna psihološka validacija;

s pragmatičkom validacijom, bit subjekta mjerenja (psihološko svojstvo) je izvan vidokruga. Glavni naglasak je na dokazivanju da nešto što se metodologijom mjeri ima veze s određenim područjima prakse.

Provođenje teorijske validacije, za razliku od pragmatične, ponekad je mnogo teže. Ne ulazeći za sada u konkretne pojedinosti, zadržimo se općenito na tome kako se provjerava pragmatička valjanost: odabire se neki vanjski kriterij neovisan o metodologiji koji određuje uspjeh u pojedinoj djelatnosti (obrazovnoj, stručnoj itd.), a s njim i uspoređuju se rezultati dijagnostičke tehnike. Ako je povezanost između njih prepoznata kao zadovoljavajuća, tada se donosi zaključak o praktičnom značaju, učinkovitosti i djelotvornosti dijagnostičke tehnike.

Da bi se odredila teorijska valjanost, puno je teže pronaći bilo koji neovisni kriterij koji se nalazi izvan metodologije. Stoga je u ranim fazama razvoja testologije, kada je koncept valjanosti tek poprimio oblik, postojala intuitivna ideja da test mjeri:

1) tehnika je nazvana valjanom, budući da je ono što mjeri jednostavno očito;

2) dokaz valjanosti temeljio se na uvjerenju istraživača da njegova metoda omogućuje razumijevanje predmeta;

3) metodologija je smatrana valjanom (tj. prihvaćena je tvrdnja da taj i takav test mjeri tu i tu kvalitetu) samo zato što je teorija na temelju koje je metodologija izgrađena vrlo dobra.

Prihvaćanje na vjeru tvrdnji o valjanosti metodologije nije moglo trajati dugo. Prve manifestacije istinske znanstvene kritike razotkrile su ovaj pristup: započela je potraga za znanstveno valjanim dokazima.

Dakle, provesti teoretsku validaciju metodologije znači dokazati da metodologija mjeri upravo ono svojstvo, kvalitetu koju bi, prema namjeri istraživača, trebala mjeriti.

Tako, primjerice, ako je razvijen test za dijagnosticiranje mentalnog razvoja djece, potrebno je analizirati mjeri li on doista taj razvoj, a ne neka druga obilježja (primjerice, osobnost, karakter i sl.). Dakle, za teorijsku validaciju, kardinalni problem je odnos između psiholoških fenomena i njihovih pokazatelja, preko kojih se ti psihološki fenomeni pokušavaju spoznati. To pokazuje koliko se autorova namjera i rezultati metodologije poklapaju.

Nije tako teško teoretski potvrditi novu metodu ako već postoji metoda s dokazanom valjanošću za mjerenje određenog svojstva. Prisutnost korelacije između nove i slične već testirane metode ukazuje da razvijena metoda mjeri istu psihološku kvalitetu kao i referentna. A ako se nova metoda u isto vrijeme pokaže kompaktnijom i ekonomičnijom u izvođenju i obradi rezultata, tada psihodijagnostičari dobivaju priliku koristiti novi alat umjesto starog.

Ali teorijska se valjanost dokazuje ne samo usporedbom sa srodnim pokazateljima, već i s onima kod kojih, na temelju hipoteze, ne bi trebalo postojati značajne veze. Dakle, za testiranje teorijske valjanosti važno je, s jedne strane, utvrditi stupanj povezanosti sa srodnom tehnikom (konvergentna valjanost) i nepostojanje tog odnosa s metodama koje imaju drugačiju teorijsku osnovu (diskriminirajuća valjanost).

Mnogo je teže provesti teoretsku validaciju metode kada je takav način verifikacije nemoguć. Najčešće je to situacija s kojom se suočava istraživač. U takvim okolnostima tek postupno prikupljanje različitih informacija o svojstvu koje se proučava, analiza teorijskih premisa i eksperimentalnih podataka te značajno iskustvo u radu s tehnikom omogućuju otkrivanje njezina psihološkog značenja.

Važnu ulogu u razumijevanju onoga što metodologija mjeri ima usporedba njezinih pokazatelja s praktičnim oblicima aktivnosti. Ali ovdje je posebno važno da metodologija bude teorijski temeljito razrađena, odnosno da postoji čvrsta, dobro utemeljena znanstvena osnova. Tada se, uspoređujući metodologiju s vanjskim kriterijem preuzetim iz svakodnevne prakse, koji odgovara onome što ona mjeri, mogu dobiti informacije koje potkrepljuju teorijske ideje o njezinoj biti.

Važno je zapamtiti da ako se dokaže teorijska valjanost, tada tumačenje dobivenih pokazatelja postaje jasnije i nedvosmislenije, a naziv metodologije odgovara opsegu njezine primjene. Što se tiče pragmatičke validacije, ona podrazumijeva testiranje metodologije u smislu njene praktične učinkovitosti, značaja, korisnosti, budući da dijagnostičku tehniku ima smisla koristiti tek kada se dokaže da se svojstvo koje se mjeri očituje u određenim životnim situacijama, u određenim vrstama. aktivnosti. Pridaje mu se veliki značaj, posebno tamo gdje se postavlja pitanje selekcije.

Ako se ponovno okrenemo povijesti razvoja testologije, tada možemo razlikovati razdoblje (20-30-ih godina 20. stoljeća) kada su znanstveni sadržaj testova i njihova teorijska prtljaga bili od manjeg interesa. Bilo je važno da je test uspio i pomogao da se brzo izaberu najspremniji ljudi. Empirijski kriterij za vrednovanje ispitnih zadataka smatrao se jedinom pravom smjernicom u rješavanju znanstvenih i primijenjenih problema.

Korištenje dijagnostičkih metoda s isključivo empirijskim opravdanjem, bez jasne teorijske osnove, često je dovodilo do pseudoznanstvenih zaključaka i neopravdanih praktičnih preporuka. Bilo je nemoguće točno imenovati te značajke, kvalitete koje su testovi otkrili. U biti, bila su to slijepa suđenja.

Ovakav pristup problemu valjanosti testa bio je tipičan do ranih 1950-ih. 20. stoljeće ne samo u SAD-u, već iu drugim zemljama. Teorijska slabost empirijskih metoda validacije nije mogla ne izazvati kritike onih znanstvenika koji su u razvoju testova pozivali na oslanjanje ne samo na golu empiriju i praksu, već i na teorijski koncept. Praksa bez teorije je slijepa, a teorija bez prakse je mrtva. Trenutačno se teorijska i praktična procjena valjanosti metoda smatra najproduktivnijom.

Za provedbu pragmatičke validacije metodologije, odnosno za procjenu njezine učinkovitosti, učinkovitosti, praktičnog značaja, obično se koristi neovisni vanjski kriterij - pokazatelj manifestacije proučavanog svojstva u svakodnevnom životu. Takav kriterij može biti akademska uspješnost (za testove sposobnosti učenja, testove postignuća, testove inteligencije), i proizvodna postignuća (za metode profesionalne orijentacije), te učinkovitost stvarne aktivnosti - crtanje, modeliranje itd. (za testove posebnih sposobnosti) , subjektivne procjene (za testove osobnosti).

Američki istraživači D. Tiffin i E. McCormick, nakon analize vanjskih kriterija kojima se dokazuje valjanost, razlikuju četiri njihova tipa [prema 31.]:

1) kriteriji uspješnosti (mogu uključivati količinu obavljenog posla, akademski uspjeh, vrijeme provedeno na obuci, stopu rasta kvalifikacija itd.);

2) subjektivni kriteriji (obuhvaćaju različite vrste odgovora koji odražavaju stav osobe prema nečemu ili nekome, njegovo mišljenje, stavove, sklonosti; obično se subjektivni kriteriji dobivaju putem intervjua, upitnika, upitnika);

3) fiziološki kriteriji (koriste se u proučavanju utjecaja okoline i drugih situacijskih varijabli na ljudsko tijelo i psihu; mjere se puls, krvni tlak, električni otpor kože, simptomi umora i dr.);

4) kriteriji slučajnosti (primjenjuju se kada se svrha studije tiče, na primjer, problema odabira za rad osoba koje su manje sklone nezgodama).

Vanjski kriterij mora ispunjavati tri osnovna zahtjeva:

mora biti relevantan;

bez smetnji;

pouzdan.

Relevantnost se odnosi na semantičku podudarnost dijagnostičkog alata s neovisnim vitalnim kriterijem. Drugim riječima, mora postojati povjerenje da kriteriji uključuju upravo one osobine individualne psihe koje se također mjere dijagnostičkom tehnikom. Vanjski kriterij i dijagnostička tehnika moraju biti u unutarnjoj semantičkoj korespondenciji jedni s drugima, biti kvalitativno homogeni u psihološkoj biti. Ako, na primjer, test mjeri individualne karakteristike mišljenja, sposobnost izvođenja logičkih radnji s određenim predmetima, pojmovima, onda u kriteriju treba tražiti manifestaciju upravo tih vještina. To se jednako odnosi i na profesionalne aktivnosti. Ona nema jedan, već nekoliko ciljeva, zadataka, od kojih je svaki specifičan i nameće svoje uvjete za provedbu. To podrazumijeva postojanje više kriterija za obavljanje profesionalne djelatnosti. Stoga ne treba uspoređivati uspjeh dijagnostičkih metoda s učinkovitošću proizvodnje općenito. Potrebno je pronaći kriterij koji je po prirodi izvedenih operacija usporediv s metodologijom.

Ako se s obzirom na vanjski kriterij ne zna je li on relevantan za mjereno svojstvo ili ne, tada usporedba rezultata psihodijagnostičke tehnike s njim postaje praktički beskorisna. Ne dopušta donošenje zaključaka koji bi mogli ocijeniti valjanost metodologije.

Zahtjevi za slobodom od uplitanja uzrokovani su činjenicom da, na primjer, obrazovni ili industrijski uspjeh ovisi o dvije varijable: o samoj osobi, njezinim individualnim karakteristikama, mjereno metodama, i o situaciji, uvjetima studiranja, rada, koji može uvesti smetnje, "kontaminirati" primijenjeni kriterij . Kako bi se to donekle izbjeglo, za istraživanje treba odabrati skupine ljudi koji se nalaze u manje-više istim uvjetima. Također možete koristiti drugu metodu. Sastoji se u ispravljanju utjecaja smetnji. Ova prilagodba obično je statističke prirode. Tako, primjerice, produktivnost ne treba uzimati u apsolutnom iznosu, već u odnosu na prosječnu produktivnost radnika koji rade u sličnim uvjetima.

Kada se kaže da kriterij mora imati statistički značajnu pouzdanost, to znači da mora odražavati konstantnost i stabilnost funkcije koja se proučava.

Potraga za adekvatnim i lako prepoznatljivim kriterijem jedan je od najvažnijih i najtežih zadataka vrjednovanja. U zapadnoj testologiji mnoge su metode diskvalificirane samo zato što nisu mogli pronaći odgovarajući kriterij za njihovo testiranje. Primjerice, za većinu upitnika upitni su podaci o njihovoj valjanosti, jer je teško pronaći adekvatan vanjski kriterij koji odgovara onome što oni mjere.

Procjena valjanosti metoda može biti kvantitativna i kvalitativna.

Za izračun kvantitativnog pokazatelja - koeficijenta valjanosti - rezultati dobiveni dijagnostičkom tehnikom uspoređuju se s podacima dobivenim vanjskim kriterijem istih osoba. Koriste se različite vrste linearne korelacije (prema Spearmanu, prema Pearsonu).

Koliko je subjekata potrebno za izračunavanje valjanosti?

Praksa je pokazala da ih ne smije biti manje od 50, ali najbolje je više od 200. Često se postavlja pitanje kolika bi trebala biti vrijednost koeficijenta valjanosti da bi se smatrao prihvatljivim? Općenito, napominje se da je dovoljno da koeficijent valjanosti bude statistički značajan. Koeficijent valjanosti od oko 0,20-0,30 smatra se niskim, 0,30-0,50 srednjim, a preko 0,60 visokim.

No, kako naglašavaju A. Anastasi, K. M. Gurevich i drugi, nije uvijek ispravno koristiti linearnu korelaciju za izračun koeficijenta valjanosti. Ova tehnika je opravdana samo kada se dokaže da je uspjeh u nekoj aktivnosti izravno proporcionalan uspjehu u provođenju dijagnostičkog testa. Stav inozemnih testologa, posebice onih koji se bave stručnom podobnošću i stručnom selekcijom, najčešće se svodi na bezuvjetno priznanje da je za zvanje primjereniji onaj tko je riješio najviše zadataka u testu. Ali također može biti da je za uspjeh u nekoj aktivnosti potrebno imati svojstvo na razini od 40% rješenja testa. Daljnji uspjeh na ispitu više nije bitan za struku. Ilustrativan primjer iz monografije K. M. Gurevicha: poštar mora znati čitati, ali čita li on normalnom brzinom ili vrlo velikom brzinom, to više nije od profesionalne važnosti. Uz takvu korelaciju između pokazatelja metodologije i vanjskog kriterija, najprikladniji način utvrđivanja valjanosti može biti kriterij razlika.

Moguć je i drugi slučaj: viša razina imovine od one koju zahtijeva profesija ometa profesionalni uspjeh. Dakle, na početku 20. stoljeća. američki je istraživač F. Taylor utvrdio da najrazvijeniji radnici u proizvodnji imaju nisku produktivnost rada. To jest, visoka razina njihovog mentalnog razvoja spriječila ih je da rade visoko produktivno. U tom bi slučaju za izračun koeficijenta valjanosti bila prikladnija analiza varijance ili izračun omjera korelacije.

Kao što je pokazalo iskustvo stranih testologa, niti jedan statistički postupak ne može u potpunosti prikazati raznolikost pojedinačnih procjena. Stoga se često koristi još jedan model za dokazivanje valjanosti metoda – kliničke procjene. Ovo nije ništa više od kvalitativnog opisa suštine proučavanog svojstva. U ovom slučaju govorimo o korištenju tehnika koje se ne temelje na statističkoj obradi.

Vrste valjanosti

Valjanost je u svojoj biti kompleksna karakteristika koja uključuje, s jedne strane, informaciju o tome je li tehnika prikladna za mjerenje onoga za što je stvorena, as druge strane, kolika je njezina učinkovitost, učinkovitost i praktična korisnost.

Provjera valjanosti tehnike naziva se validacija.

4 vrste vanjskih kriterija:

kriteriji izvedbe (mogu uključivati količinu obavljenog posla, akademski uspjeh, vrijeme provedeno na obuci, stopu rasta kvalifikacija itd.);

subjektivni kriteriji (uključuju različite vrste odgovora koji odražavaju stav osobe prema nečemu ili nekome, njegovo mišljenje, stavove, sklonosti; obično se subjektivni kriteriji dobivaju intervjuima, upitnicima, upitnicima);

fiziološki kriteriji (koriste se u proučavanju utjecaja okoline i drugih situacijskih varijabli na ljudsko tijelo i psihu; mjere se puls, krvni tlak, električni otpor kože, simptomi umora i dr.);

kriteriji slučajnosti (primjenjuju se kada se svrha studije tiče, na primjer, problema odabira za rad osoba koje su manje sklone nesrećama).

empirijska valjanost.

Ako u slučaju sadržajne valjanosti test ocjenjuju eksperti (koji utvrđuju podudarnost ispitnih zadataka sa sadržajem predmeta mjerenja), tada se empirijska valjanost uvijek mjeri pomoću statističke korelacije: korelacije dva niza vrijednosti izračunava se - rezultati testa i pokazatelji za vanjski parametar odabran kao kriterij valjanosti.

valjanost konstrukcije.

Valjanost konstrukta ima veze sa samim teorijskim konstruktom i uključuje traženje čimbenika koji objašnjavaju ponašanje prilikom izvođenja testa. Kao posebna vrsta, konstruktna valjanost kanonizirana je u članku Cronbacha i Mila (1955). Autori su ovom vrstom valjanosti ocijenili sve testne studije koje nisu bile izravno usmjerene na predviđanje nekih značajnih kriterija. Studija je sadržavala informacije o psihološkim konstruktima.

Valjanost "po sadržaju".

Valjanost sadržaja zahtijeva da svaka stavka, problem ili pitanje koje pripada određenom području ima jednaku šansu da bude ispitna stavka. Sadržajnom valjanošću procjenjuje se usklađenost sadržaja testa (zadaci, pitanja) s mjerenim područjem ponašanja. Testovi koje sastavljaju dva razvojna tima provode se na uzorku ispitanika. Pouzdanost testova izračunava se dijeljenjem stavki u dva dijela, što rezultira indeksom valjanosti sadržaja.

"Prognostička" valjanost.

"Prediktivna" valjanost također je određena prilično pouzdanim vanjskim kriterijem, ali se informacije o njemu prikupljaju neko vrijeme nakon testa. Vanjski kriterij obično je sposobnost osobe, izražena u nekim procjenama, za vrstu aktivnosti za koju je odabrana na temelju rezultata dijagnostičkih testova. Iako je ova tehnika najprikladnija za zadatak dijagnostičkih tehnika - predviđanje budućeg uspjeha, vrlo ju je teško primijeniti. Točnost prognoze obrnuto je proporcionalna vremenu danom za takvu prognozu. Što više vremena prođe nakon mjerenja, to se više faktora mora uzeti u obzir pri procjeni prognostičkog značaja tehnike. Međutim, gotovo je nemoguće uzeti u obzir sve čimbenike koji utječu na predviđanje.

"Retrospektivna" valjanost.

Određuje se na temelju kriterija koji odražava događaje ili stanje kvalitete u prošlosti. Može se koristiti za brzo dobivanje informacija o prediktivnim mogućnostima tehnike. Stoga, da bi se testiralo u kojoj mjeri dobri rezultati na testu sposobnosti odgovaraju brzom učenju, može se usporediti prošle ocjene, prošla mišljenja stručnjaka i tako dalje. kod osoba s visokim i niskim dijagnostičkim pokazateljima u ovom trenutku.

konvergentna i diskriminirajuća valjanost.

Način na koji psiholog definira dijagnostički konstrukt određuje strategiju uključivanja određenih stavki u test. Ako Eysenck definira svojstvo "neuroticizam" kao neovisno o ekstravertnosti-introvertnosti, to znači da bi u njegovom upitniku trebao biti približno jednak broj stavki s kojima će se složiti neurotični introverti i neurotični ekstraverti. Ako se u praksi pokaže da će u testu dominirati čestice iz kvadranta "Neuroticizam-Introverzija", onda, sa stajališta Eysenckove teorije, to znači da se faktor "neuroticizam" pokazuje opterećenim irelevantnim faktor – „introvertiranost“. (Potpuno isti učinak događa se ako u uzorku postoji pristranost - ako u njemu ima više neurotičnih introverta nego neurotičnih ekstraverta.)

Kako ne bi nailazili na takve poteškoće, psiholozi bi željeli baratati takvim empirijskim pokazateljima (točkama) koji nedvosmisleno govore samo o jednom čimbeniku. Ali ovaj zahtjev nikada nije stvarno ispunjen: pokazalo se da je svaki empirijski pokazatelj određen ne samo čimbenikom koji nam je potreban, već i drugima - nebitnim za zadatak mjerenja.

Stoga, u odnosu na čimbenike koji su konceptualno definirani kao ortogonalni mjerenom (javljaju se s njim u svim kombinacijama), sastavljač testa mora pri odabiru stavki primijeniti strategiju umjetnog balansiranja.

Podudarnost čestica s izmjerenim faktorom osigurava konvergentnu valjanost testa. Ravnoteža stavki s obzirom na irelevantne čimbenike osigurava diskriminirajuću valjanost. Empirijski se izražava u nedostatku značajne korelacije s testom koji mjeri konceptualno neovisno svojstvo.

Vrste valjanosti

Postoji nekoliko vrsta valjanosti zbog osobitosti dijagnostičkih metoda, kao i privremenog statusa vanjskog kriterija. ; u Cherny, 1983; "Opća psihodijagnostika", 1987, itd.) najčešće se nazivaju sljedeće:

1. Valjanost "po sadržaju". Ova se tehnika uglavnom koristi u testovima postignuća. Testovi postignuća obično ne uključuju sve gradivo koje su učenici položili, već neki manji dio (3-4 pitanja). Je li moguće biti siguran da točni odgovori na ovih nekoliko pitanja svjedoče o asimilaciji cjelokupnog gradiva. Na to bi trebala odgovoriti provjera valjanosti sadržaja. U tu svrhu provodi se usporedba uspjeha na testu sa stručnim procjenama nastavnika (za ovaj materijal). Valjanost "po sadržaju" također se odnosi na testove temeljene na kriterijima. Ova tehnika se ponekad naziva logička valjanost.

2. Valjanost "simultanosti", ili trenutna valjanost, određena je vanjskim kriterijem prema kojem se podaci prikupljaju u isto vrijeme kad i eksperimenti s metodom ispitivanja. Drugim riječima, prikupljaju se podaci koji se odnose na trenutnu vremensku izvedbu u ispitnom razdoblju, izvedbu u istom razdoblju itd. Rezultati uspješnosti na testu su u korelaciji s tim.

3. "Prediktivna" valjanost (drugi naziv je "prediktivna" valjanost). Također se određuje prilično pouzdanim vanjskim kriterijem, ali informacije o njemu prikupljaju se neko vrijeme nakon testa. Vanjski kriterij obično je sposobnost osobe, izražena u nekim procjenama, za vrstu aktivnosti za koju je odabrana na temelju rezultata dijagnostičkih testova. Iako je ova tehnika najprikladnija za zadatak dijagnostičkih tehnika - predviđanje budućeg uspjeha, vrlo ju je teško primijeniti. Točnost prognoze obrnuto je proporcionalna vremenu danom za takvu prognozu. Što više vremena prođe nakon mjerenja, to se više faktora mora uzeti u obzir pri procjeni prognostičkog značaja tehnike. Međutim, gotovo je nemoguće uzeti u obzir sve čimbenike koji utječu na predviđanje.

4. "Retrospektivna" valjanost. Određuje se na temelju kriterija koji odražava događaje ili stanje kvalitete u prošlosti. Može se koristiti za brzo dobivanje informacija o prediktivnim mogućnostima tehnike. Stoga, da bi se testiralo u kojoj mjeri dobri rezultati na testu sposobnosti odgovaraju brzom učenju, može se usporediti prošle ocjene, prošla mišljenja stručnjaka i tako dalje. kod osoba s visokim i niskim dijagnostičkim pokazateljima u ovom trenutku.

Poveznica

Korelacija (korelacijska ovisnost) - statistički odnos dviju ili više slučajnih varijabli (ili varijabli koje se takvima mogu smatrati s nekim prihvatljivim stupnjem točnosti). Istodobno, promjene u vrijednostima jedne ili više ovih veličina dovode do sustavne promjene vrijednosti druge ili drugih veličina. Matematička mjera korelacije dviju slučajnih varijabli je korelacijski omjer ili koeficijent korelacije (ili). Ako promjena jedne slučajne varijable ne dovodi do pravilne promjene druge slučajne varijable, ali dovodi do promjene druge statističke karakteristike te slučajne varijable, tada se takav odnos ne smatra korelacijom, iako je statistički.

Prvi put je pojam "korelacija" u znanstveni promet uveo francuski paleontolog Georges Cuvier u 18. stoljeću. Razvio je "zakon korelacije" dijelova i organa živih bića, uz pomoć kojeg je moguće obnoviti izgled fosilne životinje, imajući na raspolaganju samo dio njezinih ostataka. U statistici riječ "korelacija" prvi je upotrijebio engleski biolog i statističar Francis Galton krajem 19. stoljeća.

Neke vrste korelacijskih koeficijenata mogu biti pozitivne ili negativne (također je moguće da ne postoji statistički odnos – npr. za nezavisne slučajne varijable). Ako se pretpostavi da je na vrijednostima varijabli određen strogi odnos reda, tada je negativna korelacija korelacija u kojoj je povećanje jedne varijable povezano s smanjenjem druge varijable, dok koeficijent korelacije može biti negativan ; pozitivna korelacija u takvim uvjetima - korelacija u kojoj je povećanje jedne varijable povezano s povećanjem druge varijable, dok koeficijent korelacije može biti pozitivan.

Valjanost (od engleskog valid - "valjan, prikladan, valjan") je složena karakteristika metodologije (testiranja), uključujući informacije o području proučavanih pojava i reprezentativnosti dijagnostičkog postupka u odnosu na ih.

U svojoj najjednostavnijoj i najopćenitijoj formulaciji, valjanost testa je "koncept koji nam govori što test mjeri i koliko dobro to radi." U standardnim zahtjevima za psihološko-edukacijske testove valjanost je definirana kao skup informacija o tome koje se skupine psiholoških svojstava osobe mogu zaključiti pomoću metodologije, kao i stupanj valjanosti zaključaka pri korištenju specifičnih rezultata testa ili drugi oblici ocjenjivanja. U psihodijagnostici valjanost je obvezan i najvažniji dio informacija o metodologiji, uključujući (uz gore navedeno) podatke o stupnju konzistentnosti rezultata testa s drugim informacijama o osobi koja se proučava, dobivenim iz različitih izvora (teorijska očekivanja , opažanja, stručne procjene, rezultati drugih metoda, čija je pouzdanost utvrđena, itd.), prosudbu o valjanosti prognoze za razvoj kvalitete koja se proučava, povezanost proučavanog područja ponašanja ili osobine ličnosti s određenim psihološkim konstruktima. Valjanost također opisuje specifično usmjerenje metodologije (kontingent ispitanika prema dobi, stupnju obrazovanja, sociokulturnoj pripadnosti itd.) i stupanj valjanosti zaključaka u specifičnim uvjetima korištenja testa. Cjelokupnost informacija koje karakteriziraju valjanost testa sadrži informacije o primjerenosti primijenjenog modela aktivnosti u smislu odražavanja proučavanih psiholoških karakteristika u njemu, o stupnju homogenosti zadataka (subtestova) uključenih u test, njihovoj usporedivosti u kvantitativna procjena rezultata ispitivanja u cjelini.

Najvažnija komponenta valjanosti - definiranje područja proučavanih svojstava - od temeljne je teorijske i praktične važnosti u odabiru metodologije istraživanja i interpretaciji njegovih podataka. Podaci sadržani u nazivu testa u pravilu su nedostatni za prosudbu opsega njegove primjene. Ovo je samo oznaka, "naziv" određenog istraživačkog postupka.

Vrste valjanosti testa. Metode utvrđivanja valjanosti

Prema definiciji američkog tekstologa A. Anastasija, "valjanost testa je pojam koji nam govori što test mjeri i koliko dobro to radi." Valjanost pokazuje je li tehnika prikladna za mjerenje određenih kvaliteta, značajki i koliko učinkovito to čini. Najčešći način utvrđivanja teorijske valjanosti testa (metode) je konvergentna valjanost, odnosno usporedba dane tehnike s mjerodavnim srodnim metodama i dokazivanje značajnih veza s njima.

Usporedba s metodama koje imaju drugačiju teorijsku osnovu i stalni nedostatak značajnih odnosa s njima naziva se diskriminirajuća valjanost. Druga vrsta valjanosti – pragmatička valjanost – testiranje metodologije u smislu njenog praktičnog značaja, učinkovitosti, korisnosti. Za provođenje takvog testa u pravilu se koriste takozvani neovisni vanjski kriteriji, odnosno koristi se vanjski izvor informacija neovisan o testu o manifestaciji u stvarnom životu i aktivnostima ljudi mjerenog mentalnog svojstva. Među takvim vanjskim kriterijima mogu biti akademski uspjeh, profesionalna postignuća, uspjeh u različitim aktivnostima, subjektivne procjene (ili samoprocjene). Ako se, primjerice, metodikom mjere značajke razvoja profesionalno važnih kvaliteta, tada je za kriterij potrebno pronaći takvu aktivnost ili pojedine radnje gdje se te kvalitete ostvaruju.

Za provjeru valjanosti testa možete koristiti metodu poznatih skupina, kada se pozivaju osobe za koje se zna kojoj skupini prema kriteriju pripadaju (npr. skupina "vrlo uspješni, disciplinirani studenti" - visoki kriterij i skupina "loših, nediscipliniranih učenika" - nizak kriterij, a učenici s prosječnim vrijednostima ne sudjeluju u testiranju), provesti testiranje i pronaći korelaciju između rezultata testa i kriterija.

Ovdje je a broj ispitanika koji su upali u visoku skupinu prema testu i prema kriteriju, c je broj ispitanika koji su upali u visoku skupinu prema kriteriju i imaju niske rezultate testa. Ako je test potpuno valjan, elementi b i c moraju biti jednaki nuli. Mjera koincidencije, korelacija između ekstremnih skupina prema testu i kriteriju ocjenjuje se pomoću Guilfordovog phi koeficijenta. Postoji mnogo različitih načina da se dokaže valjanost testa. Kaže se da je test valjan ako mjeri ono što je namijenjen mjerenju. Vanjska valjanost - u odnosu na psihodijagnostičke metode znači podudarnost rezultata psihodijagnostike provedene ovom metodom s vanjskim znakovima, neovisno o metodi, koji se mogu pripisati predmetu istraživanja. Znači približno isto što i empirijska valjanost, s tom razlikom što je ovdje riječ o odnosu pokazatelja metodologije i najvažnijih, ključnih vanjskih obilježja vezanih uz ponašanje ispitanika. Psihodijagnostička tehnika smatra se izvanjski valjanom ako, primjerice, procjenjuje karakterne osobine pojedinca i njegovo izvana promatrano ponašanje je u skladu s rezultatima testiranja.

Valjanost je unutarnja - u odnosu na psihodijagnostičke metode, znači korespondenciju zadataka, subtestova sadržanih u njemu; usklađenost rezultata psihodijagnostike provedene ovom tehnikom s definicijom procijenjenog psihološkog svojstva korištenog u samoj tehnici. Metodologija se smatra interno nevažećom ili nedovoljno valjanom kada sva ili dio pitanja, zadataka i podtestova uključenih u nju ne mjere ono što se zahtijeva ovom metodologijom. Prividna valjanost – opisuje percepciju testa koja se razvila kod ispitanika. Test bi ispitanik trebao shvatiti kao ozbiljan alat za razumijevanje svoje osobnosti. Očita valjanost od posebne je važnosti u suvremenim uvjetima, kada se ideja o testovima u svijesti javnosti oblikuje brojnim objavama u popularnim novinama i časopisima onoga što se može nazvati kvazi-testovima, uz pomoć kojih se čitatelj poziva na odrediti bilo što: od inteligencije do kompatibilnosti s budućim supružnikom.

Natjecateljska valjanost ocjenjuje se korelacijom razvijenog testa s ostalima čija je valjanost u odnosu na mjereni parametar utvrđena. P. Kline napominje da su podaci o konkurentskoj valjanosti korisni kada postoje nezadovoljavajući testovi za mjerenje nekih varijabli, te se stvaraju novi kako bi se poboljšala kvaliteta mjerenja. Ali postavlja se pitanje: ako učinkoviti test već postoji, zašto nam je potreban isti novi? Prediktivna valjanost utvrđuje se korelacijom između rezultata testa i nekog kriterija koji karakterizira svojstvo koje se mjeri, ali kasnije. Na primjer, prediktivna valjanost testa inteligencije može se pokazati korelacijom njegovih rezultata dobivenih od predmeta u dobi od 10 godina s akademskim uspjehom tijekom razdoblja mature. L. Cronbach smatra prediktivnu valjanost najuvjerljivijim dokazom da test mjeri upravo ono za što je bio namijenjen. Glavni problem s kojim se suočava istraživač pokušavajući utvrditi prediktivnu valjanost svog testa je izbor vanjskog kriterija. Konkretno, najčešće se radi o mjerenju varijabli osobnosti, pri čemu je odabir vanjskog kriterija iznimno težak zadatak čije rješavanje zahtijeva popriličnu domišljatost. Situacija je nešto jednostavnija kod određivanja vanjskog kriterija za kognitivne testove, no iu tom slučaju istraživač mora “zažmiriti” na mnoge probleme. Stoga se akademski uspjeh tradicionalno koristi kao vanjski kriterij za validaciju testova inteligencije, ali je u isto vrijeme dobro poznato da akademski uspjeh nije jedini dokaz visoke inteligencije. Inkrementalna valjanost ograničene je vrijednosti i odnosi se na slučaj kada jedan test iz niza testova može imati nisku korelaciju s kriterijem, ali se ne preklapati s drugim testovima iz niza. U ovom slučaju, test ima inkrementalnu valjanost. Ovo može biti korisno kada se provodi profesionalna selekcija pomoću psiholoških testova. Diferencijalna valjanost može se ilustrirati pomoću testova od interesa. Testovi interesa obično su u korelaciji s akademskim uspjehom, ali na različite načine za različite discipline. Vrijednost diferencijalne valjanosti, kao i inkrementalne valjanosti, je ograničena.

Valjanost sadržaja definirana je kao potvrda da ispitni predmeti odražavaju sve aspekte područja ponašanja koje se proučava. Obično se utvrđuje u testovima postignuća (potpuno je jasno značenje mjerenog parametra), koji, kao što je već spomenuto, zapravo i nisu psihološki testovi. U praksi se za utvrđivanje sadržajne valjanosti biraju eksperti koji označavaju koje je područje ponašanja najvažnije, primjerice, za glazbene sposobnosti, a zatim se na temelju toga generiraju ispitne stavke koje ponovno eksperti ocjenjuju. Konstruktivna valjanost testa demonstrira se što je potpunija moguće opisom varijable koju test treba mjeriti. Zapravo, konstruktna valjanost uključuje sve pristupe određivanju valjanosti koji su gore navedeni. Problem odabira kriterija za validaciju testa pokušali su riješiti Cronbach i Meehl, koji su u psihodijagnostiku uveli pojam konstruktne valjanosti. Naglasili su da u mnogim slučajevima nijedan pojedinačni kriterij ne može poslužiti za validaciju jednog testa. Možemo pretpostaviti da je rješenje pitanja konstruktne valjanosti testa potraga za odgovorom na dva pitanja: 1) postoji li određeno svojstvo doista; 2) mjeri li ovaj test pouzdano individualne razlike u ovom svojstvu. Sasvim je jasno da je problem objektivnosti u tumačenju rezultata istraživanja konstruktne valjanosti povezan s konstruktnom valjanošću, no taj je problem općepsihološki i nadilazi validnost.

Kako bi psihološko-pedagoški eksperiment bio dovoljno pouzdano sredstvo istraživanja i omogućio dobivanje potpuno pouzdanih rezultata u koje se može vjerovati i na temelju kojih se mogu izvoditi ispravni praktični zaključci, potrebno je da psihodijagnostičke metode koje se u njemu koriste biti znanstveno potkrijepljena. To su metode koje ispunjavaju sljedeće zahtjeve: valjanost, pouzdanost, jednoznačnost i točnost.

Termin "valjanost" doslovno znači: "pun", "prikladan", "odgovarajući". Valjanost je inherentna ovo je složena karakteristika, uključujući, s jedne strane, informacije o tome je li tehnika prikladna za mjerenje onoga za što je stvorena, a s druge strane, koja je njezina učinkovitost, učinkovitost. Ispitivanje valjanosti tehnike naziva se validacija.

Postoji nekoliko varijanti valjanosti, a svaku od njih treba posebno razmatrati i vrednovati kada se radi o utvrđivanju valjanosti psihodijagnostičke tehnike. Valjanost može biti teorijski i praktični (empirijski), unutarnji i vanjski.

Teorijska valjanost određuje se korespondencijom pokazatelja kvalitete koji se proučava, dobivenih ovom metodom, s pokazateljima dobivenim drugim metodama - onima s pokazateljima od kojih bi trebala postojati teoretski opravdana ovisnost. Teorijska valjanost provjerava se korelacijama pokazatelja istog svojstva dobivenih različitim metodama koje se temelje ili polaze od iste teorije.

Empirijska valjanost provjerava se podudarnošću dijagnostičkih pokazatelja sa stvarnim ponašanjem, promatranim radnjama i reakcijama subjekta. Ako, primjerice, uz pomoć neke metodologije procjenjujemo karakterne osobine određenog subjekta, tada ćemo primijenjenu metodologiju smatrati praktično ili empirijski valjanom kada utvrdimo da se ta osoba u životu ponaša upravo onako kako metodologija predviđa, tj. prema njegovoj osobini ličnosti. Prema kriteriju empirijske valjanosti metodologija se provjerava usporedbom njezinih pokazatelja s ponašanjem u stvarnom životu ili rezultatima praktičnih aktivnosti ljudi.

Valjanost je unutarnja znači usklađenost zadataka, podtestova, prosudbi itd. sadržanih u metodologiji. opći cilj i dizajn metodologije u cjelini. Smatra se interno nevažećim ili nedovoljno interno valjanim kada sva ili dio pitanja, zadataka ili podtestova uključenih u njega ne mjere ono što se zahtijeva od ove metodologije.

Vanjska valjanost - to je približno isto što i empirijska valjanost, s jedinom razlikom što je u ovom slučaju riječ o odnosu između pokazatelja metodologije i najvažnijih, ključnih vanjskih obilježja vezanih uz ponašanje ispitanika.

Pri izradi metodologije teško je odmah ocijeniti njezinu valjanost. Obično se valjanost neke metodologije provjerava i usavršava tijekom njezine prilično duge upotrebe, tim više što je riječ o provjeri s najmanje četiri gore opisane strane.

Ne postoji jedinstveni univerzalni pristup definiciji valjanosti. Ovisno o tome koju stranu valjanosti istraživač želi razmotriti, koriste se i različite metode dokazivanja. Drugim riječima, pojam valjanosti uključuje njezine različite vrste, koje imaju svoje posebno značenje.

Postoje četiri vrste vanjski kriteriji koristi se za dokazivanje valjanosti:

1) kriteriji izvedbe (to može uključivati količinu obavljenog posla, akademski uspjeh, vrijeme provedeno na obuci, stopu rasta kvalifikacija;

2) subjektivni kriteriji (oni uključuju različite vrste odgovora koji
odražavaju stav osobe prema nečemu ili nekome, njegovo mišljenje, poglede,
preferencije; obično se subjektivni kriteriji dobivaju pomoću intervjua, upitnika, upitnika);

3) fiziološki kriteriji (koriste se u proučavanju utjecaja okoline i drugih situacijskih varijabli na ljudsko tijelo i psihu; mjere se puls, krvni tlak, električni otpor kože, simptomi umora i sl.);

4) kriterij slučajnosti (koristi se kada se svrha studije tiče, na primjer, problema odabira za rad osoba koje su manje sklone nezgodama).

Potraga za adekvatnim i lako prepoznatljivim kriterijem jedan je od najvažnijih i najtežih zadataka vrjednovanja.

Ima ih nekoliko vrste valjanosti, zbog osobitosti dijagnostičkih metoda, kao i privremenog statusa vanjskog kriterija:

1) Valjanost "po sadržaju". Ova se tehnika uglavnom koristi u testovima postignuća. Testovi postignuća obično ne uključuju sve gradivo koje su učenici položili, već neki manji dio (3-4 pitanja). Je li moguće biti siguran da točni odgovori na ovih nekoliko pitanja svjedoče o asimilaciji cjelokupnog gradiva. Na to bi trebala odgovoriti provjera valjanosti sadržaja. U tu svrhu provodi se usporedba uspjeha na testu sa stručnim procjenama nastavnika (za ovaj materijal). Valjanost "po sadržaju" također se odnosi na testove temeljene na kriterijima. Ponekad se ova tehnika zove logička valjanost.

2) Valjanost "istodobno", ili trenutna valjanost, određena je vanjskim kriterijem, prema kojem se informacije prikupljaju istodobno s
pokuse prema ispitivanoj metodi. Drugim riječima, prikupljaju se podaci koji se odnose na sadašnjost (napredak tijekom probnog razdoblja, učinak tijekom istog razdoblja itd.). Koreliraju s rezultatima uspjeha na testu.

3) "prediktivna valjanost . Također se određuje prilično pouzdanim vanjskim kriterijem, ali informacije o njemu prikupljaju se neko vrijeme nakon testa. Vanjski kriterij obično je sposobnost osobe, izražena u nekim procjenama, za vrstu aktivnosti za koju je odabrana na temelju rezultata dijagnostičkih testova. Iako je ova tehnika najprikladnija za zadatak dijagnostičkih tehnika - predviđanje budućeg uspjeha, vrlo ju je teško primijeniti. Točnost prognoze obrnuto je proporcionalna vremenu danom za takvu prognozu. Što više vremena prođe nakon mjerenja, to se više faktora mora uzeti u obzir pri procjeni prognostičkog značaja tehnike. Međutim, gotovo je nemoguće uzeti u obzir sve čimbenike koji utječu na predviđanje.

4) "Retrospektivna" valjanost. Određuje se na temelju kriterija
odražavajući događaj ili stanje kvalitete u prošlosti. Može se koristiti za brzo dobivanje informacija o prediktivnim mogućnostima tehnike. Stoga, da bi se testiralo u kojoj mjeri dobri rezultati na testu sposobnosti odgovaraju brzom učenju, može se usporediti prošle ocjene, prošla mišljenja stručnjaka i tako dalje. kod osoba s visokim i niskim dijagnostičkim pokazateljima u ovom trenutku.

Prilikom iznošenja podataka o valjanosti izrađene metodologije važno je točno navesti o kojoj se vrsti valjanosti misli (po sadržaju, po istovremenosti i sl.). Također je poželjno prijaviti podatke o broju i karakteristikama pojedinaca na kojima je provedena validacija. Takve informacije omogućuju istraživaču koji koristi tehniku da odluči koliko je ta tehnika valjana za skupinu kojoj
kojim ga namjerava koristiti. Kao i kod pouzdanosti, mora se zapamtiti da tehnika može imati visoku valjanost u jednom uzorku i nisku valjanost u drugom. Stoga, ako istraživač planira koristiti metodologiju na uzorku ispitanika koji se značajno razlikuje od onog na kojem je proveden test valjanosti, mora ponovno provesti takav test.

Osim vrsta valjanosti važno je znati kriteriji valjanosti . Ovo su glavni znakovi po kojima se može praktično prosuditi je li ova tehnika valjana ili ne. Ti kriteriji mogu biti sljedeći:

1. Pokazatelji ponašanja - reakcije, akcije i postupci subjekta u različitim životnim situacijama.

2. Postignuća predmeta u različitim aktivnostima: obrazovnim, radnim, kreativnim i drugima.

3. Podaci koji pokazuju izvedbu različitih kontrolnih uzoraka i zadataka.

4. Podaci dobiveni drugim metodama čija se valjanost ili odnos s testiranom metodom smatra pouzdano utvrđenom.

12. Pojam valjanosti, pouzdanosti, pouzdanosti u psihodijagnostici.

Pouzdanost- jedan od kriterija za metode ispitivanja. A. Anastasi, Kronbach, Thorndike pridonijeli su razvoju ovog kriterija.

Pouzdanost je relativna postojanost, postojanost, dosljednost rezultata ispitivanja tijekom početnog i ponovljenog mjerenja na istim subjektima. Potrebno je ponoviti mjerenje na istom uzorku. Razlike su moguće, ali bi trebale biti male. Dakle, pouzdanost govori o točnosti i stabilnosti rezultata na djelovanje slučajnih čimbenika.

Ukupno širenje može biti posljedica dvije skupine uzroka:

Varijabilnost svojstvena samoj osobini.

Čimbenici okoliša koji mogu utjecati

Postupci proračuna pouzdanosti:

Provođenje istog oblika testa. (retest pouzdanosti), izračun koeficijenta korelacije. Razmak između testiranja je od jednog do nekoliko mjeseci.

Provođenje paralelnih oblika ispita. Prilikom provođenja studije koristeći ekvivalentni oblik testa, stručnjak je uvjeren u ispravnost odabrane značajke. Da bi se obrasci ispita smatrali ekvivalentnima, mora biti jednak broj zadataka u oba testa, zadaci moraju biti unificirani, zadaci moraju biti raspoređeni u istom stupnju složenosti, mora postojati isti prosjek i standard. odstupanje. Koriste se dva pristupa za izračunavanje pouzdanosti pomoću paralelnih oblika testova:

Isti ispitanici ispituju se istim testom. I onda još jedan, a ako je korelacijski koeficijent veći od 0,7, tada je pouzdanost velika.

Ispitanici su podijeljeni u dvije grupe, jedna grupa prolazi test A, druga test B, tjedan dana kasnije - obrnuto.

Podjela testa i izračun koeficijenta korelacije. Ispitanici rade dva dijela testa koji su ekvivalentni. Svi parni zadaci spadaju u jedan dio, neparni u drugi. Ovaj postupak pokazuje redoslijed testa unutar sebe, mjeru primjerenosti odabira pitanja. Izračunava se koeficijent korelacije.

Koeficijent pouzdanosti odgovara Spearmanovom ili Pisronovom koeficijentu korelacije.

Disperzija faktora pouzdanosti - metoda određivanja pouzdanosti, koja se temelji na analizi varijance rezultata ispitivanja. Pouzdanost testa odgovara omjeru stvarne varijance (tj. varijance faktora koji se proučava) i stvarno dobivene empirijske varijance. Potonji je zbroj stvarne varijance i varijance pogreške mjerenja. Faktorsko-analitički pristup definiranju pouzdanosti dodatno raščlanjuje disperziju pravog pokazatelja (J. Gilford, 1956).

Varijanca pravog pokazatelja, zauzvrat, može se sastojati od varijance zajedničkog faktora za grupe sličnih testova, specifičnih faktora koji daju testove specifičnog fokusa i varijance faktora svojstvenih određenoj metodi ispitivanja. Stoga je ukupna varijanca testa jednaka zbroju varijanci za opće, specifične i jedinične faktore plus varijanca pogreške

Metoda faktorske varijance za određivanje pouzdanosti prikladna je za ocjenu već faktoriziranog testa, ali ne i za testove koji mjere širok raspon različitih parametara, budući da neki od njih možda nisu uključeni u utvrđeno područje valjanosti metodologije.

Pouzdanost i dopuštena pogreška mjerenja:

Pouzdanost je određena kriterijem pogreške mjerenja. Pogreška je statistika koja karakterizira stupanj točnosti pojedinačnih mjerenja. Pretpostavlja se da za bilo koju osobinu svaki pojedinac ima pravi rezultat. Bilo koji pokazatelj dobiven u testu razlikuje se od svoje prave vrijednosti za neku slučajnu pogrešku. A ako testirate osobu nekoliko puta, dobit ćete raspon indikatora oko prave vrijednosti. Ova vrijednost varira unutar određenih granica. Fluktuacija ove vrijednosti može ovisiti o sustavnim i slučajnim pogreškama. Razlozi sustavnih pogrešaka mogu biti netočno testiranje, nepridržavanje procedure, nepreciznost obrade, niska valjanost metode. Također su moguće slučajne pogreške povezane s ljudskim faktorom. Ako takvi propusti nisu uključeni u metodologiju, onda se ona ne može smatrati točnom. S velikim brojem promatranja, pojedinačne procjene tvore određenu vrstu distribucije statistike, koja će otkriti pogreške mjerenja. Pogreška mjerenja utvrđuje se statističkim metodama - vrijednost kvadratnog odstupanja povezana s disperzijom distribucije pojedinih mjerenja. Greška ne smije biti veća od 5%.

Valjanost:

Valjanost je sposobnost testa da mjeri ono što mu je namjera mjeriti. Ovaj se koncept više ne odnosi na test, već na njegovu svrhu. Test može biti pouzdan, ali nije valjan. Ali ako je test valjan, onda je i pouzdan.

Izvori ideja o valjanosti:

Prve ideje pojavile su se i prije stvaranja testova. Istraživači su često povezivali nalaze istraživanja s budućim uspjesima. Na primjer, Pitagora je povezivao mišljenje i govor uz pomoć intuicije.

Ideja o potrebi praktične provjere prikladnosti testa. Izvan prakse, problem valjanosti ne može postojati.

Filozofske ideje: istina je korespondencija misli i stvarnosti. Kriterij istine je korisnost.

Mjerenja koja provodimo nisu očita, zahtijevaju teoretsku osnovu. Teorijska = empirijska valjanost.

Razvoj statističke znanosti - korelacijska i faktorska analiza.

Pet izvora dovelo je do pet vrsta valjanosti.

Početkom 20. stoljeća intuicija je igrala vodeću ulogu. Ako je tvorac testa bila poznata osoba, tada se vjeru u valjanost vjerovalo na riječ.

Dvadesetih i tridesetih godina 20. stoljeća rastu zahtjevi prakse, počinju se stvarati testovi temeljeni na empirijskim izvorima. Razvijena su tri empirijska pristupa:

Svi kandidati za posao se testiraju. S vremenom se mjeri njihova produktivnost i učinkovitost. Zatim je došla korelacija pokazatelja. Dakle, testovi su korišteni za korisnost.

Prvo se testiraju oni koji već uspješno rade, a zatim se rezultati tog testiranja uspoređuju s rezultatima kandidata. Ako postoji odnos, onda je test valjan.

Djela Bineta i Simona. Kako bismo bili sigurni da test mjeri inteligenciju. Svi testni zadaci provedeni su na dvije skupine, koje nisu odabrali psiholozi, već učitelji. U skupini 1 bila su djeca s visokim mentalnim sposobnostima, u skupini 2 - s neizraženim sposobnostima.Ova metoda nazvana je "ekspert". Provedena su daljnja ispitivanja. A ako je u obje skupine većina odgovorila u skladu s očekivanjima autora, tada je test priznat kao valjan.

Stoga su empirijske metode za potkrepljivanje valjanosti postojale sve do 1950-ih. Počeli su vjerovati da je valjanost moguće dokazati ne samo uz pomoć prakse. Analiza i podudarnost teorije i prakse. Valjanost sadržaja, usporedba sa studijskim programom i sadržajem ispita. Usporedba je olakšana kada program istakne problem, svrhu i ključne pojmove. Konceptualna valjanost, budući da su psiholozi zainteresirani za povezivanje znanstvenih koncepata s empirijski promatranim činjenicama.

U empirijskim metodama dokazivanja valjanosti posebnu ulogu imaju vanjski kriteriji koji služe kao dokaz valjanosti. Američki psiholozi Tiffany i McCormick analizirali su korištenje vanjskih kriterija i identificirali 4 njihova tipa:

Kriterij izvedbe - količina obavljenog posla, stopa rasta vještine

Subjektivni kriterij - uključivanje različitih vrsta odgovora koji odražavaju stav prema nečemu.

Fiziološki kriterij – koristi se u proučavanju okoliša.

Kriterij slučajnosti je razmatranje mnogih faktora.

Vanjski kriteriji moraju zadovoljiti zahtjeve relevantnosti, slobode od smetnji, pouzdanosti. Relevantnost je semantička podudarnost između testa i vitalnog kriterija neovisnog o njemu. Sloboda od smetnji (kontaminacije) smatra se važnom budući da je aktivnost pod utjecajem same osobe i njezinih radnih uvjeta. Pouzdanost - dosljednost rezultata

Dijagnostički (kompetitivni) B. odražava sposobnost testa da razlikuje subjekte prema svojstvu koje se proučava. Analiza dijagnostičke V. odnosi se na utvrđivanje korespondencije između testnih pokazatelja i stvarnog stanja psiholoških karakteristika subjekta u vrijeme ispitivanja. Primjer definicije ove vrste V. može biti studija pomoću metode kontrastnih skupina. Provođenjem testa inteligencije kod djece u normalnom razvoju i njihovih vršnjaka s intelektualnim teškoćama mogu se otkriti duboke kvantitativne i kvalitativne razlike u izvođenju zadataka uspoređivanih skupina. Stupanj pouzdanosti diferencijacije djece prve i druge skupine prema podacima ispitivanja bit će karakteristika dijagnostičke V. procjene mentalnog razvoja dobivene ovom tehnikom.

Valjanost sadržaja(interni, logički) - skup informacija o reprezentativnosti ispitnih čestica u odnosu na mjerena svojstva i značajke. Jedan od glavnih zahtjeva za validaciju metodologije u ovom smjeru je odraz ključnih aspekata proučavanog psihološkog fenomena u sadržaju testa. Ako je područje ponašanja ili značajke vrlo složeno, tada smisleni V. zahtijeva prezentaciju u zadacima testa svih najvažnijih sastavnih elemenata fenomena koji se proučava.

diferencijal NA. - valjanost, koja razmatra unutarnje odnose između psiholoških čimbenika dijagnosticiranih psihodijagnostičkom tehnikom. Sadržaj D.V. može se ilustrirati na primjeru testova od interesa koji su većinom umjereno povezani s pokazateljima ukupnog akademskog uspjeha, ali su u različitoj mjeri povezani s uspjehom u pojedinim disciplinama. V. d. posebno je važan kao pokazatelj dijagnostičke vrijednosti tehnika koje se koriste u profesionalnoj selekciji.

iluzorno B.(lažno) - iluzija sukladnosti zaključka na temelju rezultata testa s osobnim karakteristikama subjekta. Nastaje kao rezultat uporabe krajnje općenitih, te stoga primjenjivih na gotovo sve ispitane formulacije, kao što su, primjerice, „razuman u odabiru cilja“, „teži boljem životu“ itd. Takve izjave prihvaćaju gotovo svi ljudi kao točan opis njihove osobnosti, što stvara osnovu za djelovanje raznih vrsta proricatelja i proricatelja.

inkrementalni NA. - (engleski incremental - prirast, dobit) - jedna od komponenti valjanosti kriterija, prediktivna valjanost testa, koja odražava praktičnu vrijednost metodologije u odabiru. U i. može se kvantificirati u smislu valjanosti koeficijenta.

Konsenzus B. (konsenzualna valjanost) - vrsta valjanosti koja se temelji na uspostavljanju veze (korelacije) testnih podataka s podacima dobivenim od vanjskih stručnjaka koji dobro poznaju te pojedince koji su testirani. Koncept i postupak V. to. uveo je R. McCrae 1982. kako bi osigurao validaciju upitnika ličnosti, što je često teško (a ponekad i nemoguće) zbog nedostatka kriterija potrebnih za utvrđivanje valjanosti.

Konstruktivni V. je jedna od glavnih vrsta valjanosti, odražavajući stupanj zastupljenosti proučavanog psihološkog konstrukta u rezultatima testa. Kao konstrukt može djelovati praktična ili verbalna inteligencija, emocionalna nestabilnost, introvertiranost, razumijevanje govora, prebacivanje pažnje itd. Drugim riječima, V. to. definira područje teorijske strukture psiholoških fenomena mjerenih testom .

Međutim, treba napomenuti da, za razliku od validacije kriterija, analiza V. to. ne zahtijeva visok stupanj povezanosti između rezultata dva testa. Ako se pokaže da su novi i referentni testovi sadržajno i rezultatima gotovo identični, a razvijena metodologija nema prednosti kratkoće ili jednostavnosti primjene, to znači samo dupliranje testa, opravdano samo sa stajališta. stvaranje paralelnog testnog obrasca. Smisao postupka V. do. je utvrditi i sličnost i različitost psihičkih fenomena mjerenih novim testom u usporedbi s poznatim.

Važan aspekt V. to. je unutarnja dosljednost, koja odražava kako su određene stavke (zadaci, pitanja) koje čine ispitni materijal podređene glavnom smjeru testa u cjelini, usmjerenom na proučavanje istih konstrukata. Analiza unutarnje dosljednosti provodi se korelacijom odgovora na svaki zadatak s ukupnim rezultatom testa. Pri određivanju V. do. Važno mjesto pripada proučavanju dinamike mjerenog konstrukta. Pritom se možemo osloniti na hipoteze o njegovom dobnom razvoju, utjecaju osposobljavanja, usavršavanja, svladavanja profesije itd.

Kriteriji V. - skup karakteristika, uključujući valjanost trenutnih i prognostičkih metoda i odražava usklađenost dijagnoze i prognoze s određenim rasponom kriterija za pojavu koja se mjeri. Validacija kriterija neovisna je o rezultatima testa i izravnim mjerama proučavane kvalitete, kao što su razina postignuća u bilo kojoj aktivnosti, stupanj razvijenosti sposobnosti, izraženost određene crte ličnosti i sl. Kod validacije postignuća testovima, rezultat mjerenja se uspoređuje s mišljenjem nastavnika o ispitivanom znanju u određenom području, s akademskim procjenama, kontrolnim testovima itd. U slučaju vrjednovanja testova i metoda profesionalnog usmjeravanja, testne procjene se uspoređuju s kolegama i stručnim ocjenama menadžera i objektivnim pokazateljima postignuća u stručnom području.

Očito V. - ideja o testu, njegovom opsegu, učinkovitosti i prediktivnoj vrijednosti, koja se javlja kod ispitanika ili druge osobe koja nema posebne informacije o prirodi uporabe i ciljevima metodologije. V. o. nije sastavnica objektivno utvrđene valjanosti. U isto vrijeme visoka V. oko. u većini slučajeva vrlo poželjno. Djeluje kao čimbenik koji potiče ispitanike na ispitivanje, doprinosi ozbiljnijem i odgovornijem odnosu prema radu na ispunjavanju zadataka testa i zaključcima koje psiholog formulira.

Dovoljna razina V. o. posebno značajan za metode pregleda odraslih osoba. Predstave ispitanika i korisnika psihodijagnostičkih informacija o V. o. u velikoj mjeri određuje naziv tehnike, budući da je ovaj dio informacija o testu najdostupniji nestručnjacima. V. o. značajno unapređuje korištenje razumljivih formulacija i pojmova, kao i zadataka koji su sadržajno najprirodniji, uvažavajući dob, spol i stručne specifičnosti predmeta. Neadekvatno precijenjen V. o. pridonosi izraženijem ispoljavanju učinka kontaminacije kriterija.

V. o. ponekad se naziva vanjska (valjanost lica), ili "povjerenje" (valjanost vjere), valjanost.

V. prema dobi diferencijacija je jedna od komponenti valjanosti konstrukta, povezana s dobnom dinamikom promjena kvalitete koja se proučava. Karakterizacija valjanosti konstrukta ovdje se sastoji u određivanju usklađenosti rezultata ispitivanja s teorijski očekivanim i praktično uočenim promjenama vezanim uz dob u danom konstruktu ili svojstvu.

Prognostički V. - informacije o stupnju točnosti i valjanosti tehnike (test) omogućuju prosuđivanje dijagnosticirane psihološke kvalitete nakon određenog vremena nakon mjerenja. V. p. odražava vremenski interval na koji se proteže obrazloženje takve presude. Podaci o V. p. najizravnije su povezani s otkrivanjem prediktivne snage tehnike, razjašnjavanjem stupnja valjanosti neposredne i dalje prognoze formulirane na temelju nje, analizom značaja pokazatelja dobivenih u testu. uz tzv. ekstrapolacija rezultata za budućnost.

Kao validacija kriterija mogu djelovati ne samo pokazatelji stvarnog ponašanja, već i očekivani rezultati aktivnosti, tretmana, obuke itd., ishod tretmana itd. Istovremeno, razlika između dvije vrste validnosti kriterija je povezana ne samo s vremenskim ograničenjima kriterijskih usporedbi.Trenutna valjanost i V. p. razvoj kvalitete ili uspješnosti u djelatnosti – s druge.

Važnost pokazatelja V. p. u analizi ispitnih postupaka usmjerenih na selekciju naglašena je uvođenjem posebnog koncepta inkrementalne valjanosti. Ovaj pokazatelj V. p. daje informaciju o tome koliko je postupak selekcije poboljšan pomoću ovog testa u usporedbi s tradicionalnim (samo na temelju formalnih informacija o prethodnim aktivnostima, analizi osobnih dosjea, razgovorima).

V.-ov kompleks informacija sa. tradicionalno ima najveću vrijednost za testove koji ispituju aktivnosti koje su bliske ili podudarne sa stvarnim (najčešće obrazovnim ili profesionalnim). Aktivnost koja se proučava je u pravilu sintetičke prirode, sastoji se od mnogih, ponekad heterogenih čimbenika (manifestacije osobnih karakteristika, skup potrebnih znanja i vještina, specifične sposobnosti itd.). Stoga je jedan od najvažnijih zadataka u stvaranju adekvatnog modela testirane aktivnosti izbor zadataka koji će obuhvatiti glavne aspekte proučavane pojave u pravilnom omjeru prema stvarnoj aktivnosti u cjelini.

Trenutni V. (dijagnostički, natjecateljski) - karakteristika testa, koja odražava njegovu sposobnost razlikovanja između subjekata na temelju dijagnostičke značajke koja je predmet proučavanja u ovoj tehnici. Kao takvi znakovi mogu djelovati razine općih sposobnosti, tvrdnji, verbalne inteligencije, anksioznosti itd. U užem smislu, V.t. je utvrđivanje usklađenosti rezultata validiranog testa s neovisnim kriterijem koji odražava stanje kvalitete koje ispituje test u vrijeme studije.

Svojevrsni pokazatelj V. t. je skup informacija o tome koliko je test prikladan, ekonomičan u usporedbi s dobivanjem informacija o kvaliteti koja se proučava iz drugih izvora (promatranje, analiza objektivnih podataka, recenzija od strane kolega itd.).

Ekološka V. - valjanost testa u odnosu na izmjereno svojstvo u kontekstu određene situacije. V. e. je svojstvo testa, koje se očituje u činjenici da njegova uporaba u rješavanju različitih praktičnih problema dovodi do kvalitativno različite interpretacije rezultata testa (V. N. Družinin, 1990).

Empirijski B.-skup karakteristika valjanosti testa, dobivenih komparativnom statističkom metodom ocjenjivanja. Odnosi se uglavnom na polje kriterijske valjanosti i njezina dva tipa: trenutna valjanost i prediktivna valjanost. Ako se pri utvrđivanju valjanosti smislenog testa procjena testa provodi različitim kvalitativnim postupcima dobivanja informacija deskriptivnim metodama korištenjem stručnih procjena i drugih izvora informacija (za donošenje prosudbe o usklađenosti ispitnih zadataka s sadržaj predmeta mjerenja), zatim V. e. uvijek mjereno statističkom korelacijom. Provodi se korelacijska analiza odnosa između dva niza vrijednosti - rezultata testa i pokazatelja za vanjski parametar svojstva koje se proučava (ili rezultata drugog testa čija je valjanost poznata).