Obilježja kontrolnog testiranja u nastavi tjelesne i zdravstvene kulture. Osnovne odredbe ispitivanja

IZVJEŠĆE

učenica 137 gr. Ivanova I.

o provjeri učinkovitosti metodologije obuke
pomoću metoda matematička statistika

Dijelovi izvješća sastavljaju se u skladu s uzorcima danim u ovom priručniku na kraju svake faze igre. Položena izvješća pohranjuju se na Zavodu za biomehaniku do konzultacija prije ispita. Student koji se nije javio za obavljeni rad i nastavniku nije predao bilježnicu s izvješćem ne može pristupiti ispitu iz sportskog mjeriteljstva.

I faza poslovna igra
Kontrola i mjerenje u sportu

Cilj:

1. Upoznati teorijske osnove kontrole i mjerenja u sportu i tjelesnom odgoju.

2. Osposobiti se za mjerenje pokazatelja brzinskih svojstava kod sportaša.

1. Kontrola u fizičkom
obrazovanje i sport

Tjelesna i sportska priprema nije spontan, već kontroliran proces. U svakom trenutku osoba je u određenom fizičkom stanju, koje je uglavnom određeno zdravljem (podudarnost vitalnih znakova s normom, stupanj otpornosti tijela na štetne iznenadne učinke), tjelesnom građom i stanjem fizičkih funkcija .

Preporučljivo je kontrolirati fizičko stanje osobe mijenjajući ga pravom smjeru. To upravljanje provodi se sredstvima tjelesnog odgoja i sporta, koji posebice uključuju tjelesne vježbe.

Samo se čini da se učitelj (ili trener) snalazi fizičko stanje, utječući na ponašanje sportaša, tj. nuđenje određenih tjelesnih vježbi, kao i kontrola ispravnosti njihove provedbe i dobivenih rezultata. U stvarnosti, ponašanjem sportaša ne upravlja trener, već sam sportaš. U tijeku sportskog treninga djeluje se na samoupravni sustav (ljudsko tijelo). Individualne razlike u stanju sportaša ne daju pouzdanje da će isti utjecaj izazvati isti odgovor. Stoga je relevantno pitanje povratne informacije: informacije o stanju sportaša koje dobiva trener tijekom kontrole trenažnog procesa.

Kontrola u tjelesnom odgoju i sportu temelji se na mjerenju pokazatelja, odabiru najznačajnijih i njihovoj matematičkoj obradi.

Upravljanje procesom obuke uključuje tri faze:

1) prikupljanje informacija;

2) njegovu analizu;

3) odlučivanje (planiranje).

Prikupljanje informacija obično se provodi tijekom složene kontrole čiji su predmeti:

1) natjecateljska djelatnost;

2) trenažna opterećenja;

3) stanje sportaša.

Postoje (V.A. Zaporozhanov) tri vrste stanja sportaša, ovisno o trajanju intervala potrebnog za prijelaz iz jednog stanja u drugo.

1. prekretnica(trajno stanje. Spremljeno relativno dugo- tjednima ili mjesecima. Složena karakteristika Stadijsko stanje sportaša, koje odražava njegovu sposobnost da pokaže sportska postignuća, naziva se pripremljenost, a stanje optimalne (najbolje za određeni trenažni ciklus) pripremljenosti naziva se sportska odjeća. Očito je da je u roku od jednog ili nekoliko dana nemoguće postići stanje sportske forme ili je izgubiti.

2. Trenutno država. Promijenjen pod utjecajem jednog ili nekoliko razreda. Često su posljedice sudjelovanja na natjecanjima ili nastupa u nekom od razreda trenažni rad povući nekoliko dana. U tom slučaju sportaš obično bilježi i neželjene događaje (na primjer, bol u mišićima) i pozitivne (na primjer, stanje povećane izvedbe). Takve promjene nazivaju se odgođeni učinak treninga.

Trenutno stanje sportaša određuje prirodu sljedećih treninga i veličinu opterećenja u njima. poseban slučaj Trenutna država, koju karakterizira spremnost da u nadolazećim danima izvede natjecateljsku vježbu s rezultatom blizu maksimalnog, tzv trenutna spremnost.

3. Operativno država. Promijenjen pod utjecajem pojedinačno izvršenje tjelesne vježbe i privremena je (na primjer, umor uzrokovan jednom trčanjem udaljenosti; privremeno povećanje izvedbe nakon zagrijavanja). Operativno stanje sportaša mijenja se tijekom treninga i treba ga uzeti u obzir pri planiranju intervala odmora između serija, ponavljanja, pri odlučivanju je li prikladno dodatno zagrijavanje itd. Poseban slučaj operativnog stanja, karakteriziran trenutnom spremnošću za izvođenje natjecateljske vježbe s rezultatom blizu maksimalnog, naziva se operativna spremnost.

U skladu s gornjom klasifikacijom postoje tri glavne vrste kontrole stanja sportaša:

1) kontrola pozornice. Svrha mu je procijeniti fazno stanje (pripremljenost) sportaša;

2) trenutna kontrola. Njegova glavna zadaća je određivanje dnevnih (trenutnih) fluktuacija u stanju sportaša;

3) operativna kontrola. Njegova je svrha ekspresna procjena trenutnog stanja sportaša.

Mjerenje ili test koji se provodi kako bi se utvrdilo stanje ili sposobnost sportaša naziva se test. Postupak mjerenja ili ispitivanja naziva se ispitivanje.

Svaki test uključuje mjerenje. Ali ne služi svako mjerenje kao test. Samo oni koji zadovoljavaju sljedeće mjeriteljske kriterije mogu se koristiti kao ispitivanja. zahtjevi:

2) standardizacija;

3) dostupnost sustava ocjenjivanja;

4) pouzdanost i informativnost (faktor kvalitete) testova;

5) vrsta kontrole (postupna, tekuća ili pogonska).

Test koji se temelji na motoričkim zadacima naziva se motorički test. Postoje tri skupine motoričkih testova:

1. Kontrolne vježbe, izvodeći koje sportaš dobiva zadatak pokazati maksimalni rezultat. Rezultat testa je motoričko postignuće. Na primjer, vrijeme potrebno sportašu da istrči utrku na 100 metara.

2. Standardni funkcionalni testovi, tijekom kojih se zadatak, isti za sve, dozira bilo prema količini obavljenog rada, bilo prema veličini fizioloških promjena. Rezultat testa su fiziološki ili biokemijski parametri tijekom standardnog rada ili motorička postignuća tijekom standardna vrijednost fiziološki pomaci. Na primjer, postotak povećanja broja otkucaja srca nakon 20 čučnjeva ili brzina kojom sportaš trči s fiksnim otkucajima srca od 160 otkucaja u minuti.

3. Maksimalni funkcionalni testovi, tijekom kojih sportaš mora pokazati maksimalan rezultat. Rezultat testa su fiziološki ili biokemijski pokazatelji pri maksimalnom radu. Na primjer, maksimalna potrošnja kisika ili maksimalni kisikov dug.

Ispitivanje visoke kvalitete zahtijeva poznavanje teorije mjerenja.

Osnove teorije testova 1. Osnovni pojmovi teorije testova 2. Pouzdanost testova i načini njezinog utvrđivanja

Kontrolna pitanja 1. Što se zove test? 2. Koji su zahtjevi za test? 3. Koji se testovi nazivaju autentičnim? 4. Što se naziva pouzdanost testa? 5. Navedite razloge koji uzrokuju varijacije u rezultatima kod ponovnog testiranja. 6. Koja je razlika između unutarklasne varijacije i međuklasne varijacije? 7. Kako praktično utvrditi pouzdanost testa? 8. Koja je razlika između dosljednosti i stabilnosti testa? 9. Što je ekvivalentnost testova? 10. Što je homogeni skup testova? 11. Što je heterogeni skup testova? 12. Načini poboljšanja pouzdanosti testova.

Test je mjerenje ili test koji se provodi kako bi se utvrdilo stanje ili sposobnosti osobe. Ne mogu se sva mjerenja koristiti kao testovi, već samo ona koja zadovoljavaju posebne zahtjeve. Tu spadaju: 1. standardizacija (postupak i uvjeti ispitivanja moraju biti isti u svim slučajevima primjene ispitivanja); 2. pouzdanost; 3. informativni; 4. dostupnost sustava ocjenjivanja.

Zahtjevi testa: n Informativnost - stupanj točnosti kojim mjeri svojstvo (kvalitetu, sposobnost, karakteristiku) za koje se koristi. n Pouzdanost - stupanj slaganja između rezultata kada se isti ljudi više puta testiraju pod istim uvjetima. Dosljednost - ( razliciti ljudi, ali isti uređaji i isti uvjeti). n n Standardni uvjeti - (isti uvjeti za ponovljena mjerenja). n Prisutnost sustava ocjenjivanja - (prijelaz na sustav ocjenjivanja. Kao u školi 5 -4 -3. . .).

Testovi koji zadovoljavaju zahtjeve pouzdanosti i informativnosti nazivaju se dobrim ili autentičnim (grč. authentico - na pouzdan način).

Proces testiranja naziva se testiranjem; rezultirajuće mjerenje brojčana vrijednost- rezultat testa (ili rezultat testa). Na primjer, trčanje na 100 m je test, procedura za provođenje utrka i mjerenje vremena je testiranje, vrijeme trčanja je rezultat testa.

Testovi temeljeni na motoričkim zadacima nazivaju se motorički ili motorički testovi. Njihovi rezultati mogu biti ili motorička postignuća (vrijeme prijeđene udaljenosti, broj ponavljanja, prijeđena udaljenost itd.), ili fiziološki i biokemijski pokazatelji.

Ponekad se ne koristi jedan, nego nekoliko testova koji imaju jedan krajnji cilj (primjerice, procjena stanja sportaša u natjecateljskom razdoblju treninga). Takva skupina testova naziva se kompleks ili baterija testova.

Isti test, primijenjen na iste subjekte, trebao bi dati identične rezultate pod istim uvjetima (osim ako se sami subjekti nisu promijenili). Međutim, uz najstrožu standardizaciju i preciznu opremu, rezultati ispitivanja uvijek donekle variraju. Na primjer, istraživač koji je upravo pokazao rezultat od 215 k.G u testu dinamometrije kralježnice, kada se ponovi, pokazuje samo 190 k.G.

Pouzdanost testova i načini utvrđivanja Pouzdanost testa je stupanj slaganja između rezultata pri ponovnom testiranju istih ljudi (ili drugih objekata) pod istim uvjetima.

Varijacija rezultata tijekom ponovljenog testiranja naziva se intra-individualno, unutar-grupno ili unutar-razredno. Četiri glavna razloga uzrokuju ovu varijaciju: 1. Promjene u stanju ispitanika (umor, vježbanje, “učenje”, promjene u motivaciji, koncentraciji, itd.). 2. Nekontrolirane promjene vanjskih uvjeta i opreme (temperatura, vjetar, vlaga, napon u mreži, prisutnost neovlaštenih osoba i sl.), odnosno sve ono što se objedinjuje pojmom “ slučajna greška mjerenja".

Četiri glavna razloga uzrokuju ovu varijaciju: 3. Promjena u stanju osobe koja provodi ili ocjenjuje test (i, naravno, zamjena jednog eksperimentatora ili suca drugim). 4. Nesavršenost testa (postoje testovi koji su očito nepouzdani. Npr. ako ispitanici izvode slobodna bacanja u košarkaški koš, onda čak i košarkaš koji ima visok postotak pogodaka, može slučajno pogriješiti kod prvih bacanja).

Koncept pravog rezultata testa je apstrakcija (ne može se mjeriti iskustvom). Stoga se moraju koristiti neizravne metode. Najpoželjnije za ocjenu pouzdanosti analiza varijance nakon čega slijedi izračunavanje unutarrazrednih koeficijenata korelacije. Analiza varijance omogućuje rastavljanje varijacija rezultata ispitivanja zabilježenih u eksperimentu na komponente zbog utjecaja pojedinačnih čimbenika.

Ako registrirate rezultate proučavanja u bilo kojem testu, ponavljanje ovog testa u različiti dani, i svaki dan napraviti nekoliko pokušaja, povremeno mijenjajući eksperimentatore, tada će biti varijacija: a) od subjekta do subjekta; n b) iz dana u dan; n c) od eksperimentatora do eksperimentatora; n d) iz pokušaja u pokušaj. Analiza varijance omogućuje izolaciju i procjenu ovih varijacija. n

Dakle, za praktičnu procjenu pouzdanosti testa potrebno je, n prvo, izvršiti analizu varijance, n drugo, izračunati unutarrazredni koeficijent korelacije (koeficijent pouzdanosti).

Govoreći o pouzdanosti testova, potrebno je razlikovati njihovu stabilnost (reproducibilnost), konzistentnost i ekvivalentnost. n n Stabilnost testa odnosi se na ponovljivost rezultata nakon ponavljanja Određeno vrijeme pod istim uvjetima. Ponovno testiranje se obično naziva ponovni test. Dosljednost testa karakterizira neovisnost rezultata testa o osobnim kvalitetama osobe koja provodi ili ocjenjuje test.

Ako su svi testovi uključeni u bilo koji skup testova visoko ekvivalentni, naziva se homogenim. Cijeli ovaj kompleks mjeri jedno svojstvo motoričkih sposobnosti čovjeka (na primjer, kompleks koji se sastoji od skokova s mjesta u dužinu, gore i trostruko; procjenjuje se stupanj razvijenosti brzinsko-snažnih kvaliteta). Ako u kompleksu nema ekvivalentnih testova, odnosno testovi uključeni u njega mjere različita svojstva, tada se on naziva heterogenim (na primjer, kompleks koji se sastoji od dinamometrije u stojećem položaju, skoka uz Abalakova, trčanja na 100 metara).

Pouzdanost testova može se donekle poboljšati: n n n a) strožom standardizacijom testiranja; b) povećanje broja pokušaja; c) povećanje broja ocjenjivača (suaca, pokusa) i povećanje dosljednosti njihovih mišljenja; d) povećanje broja ekvivalentnih testova; e) bolju motivaciju istraživao.

Prva komponenta, teorija testa, sadrži opis statističkih modela za obradu dijagnostičkih podataka. Sadrži modele za analizu odgovora u ispitnim zadacima i modele za izračun ukupnih rezultata testa. Mellenberg (1980, 1990) je to nazvao "psihometrijom". Klasična teorija ispitivanja, moderna teorija ispitivanja (ili model analize odgovora na test - IRT) i model

uzorci zadataka sastoje se od tri najviše važna vrsta teorijski modeli testa. Predmet razmatranja psihodijagnostike su prva dva modela.

Klasična teorija ispitivanja. Na temelju te teorije razvijena je većina testova intelektualnosti i osobnosti. Središnji koncept Ova teorija je koncept "pouzdanosti". Pouzdanost se odnosi na dosljednost rezultata nakon ponovne procjene. U referentnim priručnicima ovaj se koncept obično predstavlja vrlo kratko, a zatim daje Detaljan opis aparat matematičke statistike. U ovom uvodnom poglavlju dat ćemo sažeti opis glavnog značenja navedenog pojma. U klasičnoj teoriji ispitivanja, pouzdanost se shvaća kao ponovljivost rezultata nekoliko mjernih postupaka (uglavnom mjerenja pomoću testova). Koncept pouzdanosti uključuje izračun pogreške mjerenja. Rezultati dobiveni tijekom procesa testiranja mogu se prikazati kao zbroj stvarnog rezultata i pogreške mjerenja:

Xi = Ti+ Ej

Gdje Xi je ocjena dobivenih rezultata, Ti je pravi rezultat, i Ej- pogreška mjerenja.

Ocjenjivanje dobivenih rezultata u pravilu je broj točnih odgovora na ispitne zadatke. Istinski rezultat može se promatrati kao prava procjena u platonskom smislu (Gulliksen, 1950). Raširen je koncept očekivanih rezultata, tj. ideje o rezultatima koji se mogu dobiti kao rezultat velikog broja ponavljanja mjernih postupaka (Lord & Novich, 1968). Ali provođenje istog postupka ocjenjivanja s jednom osobom nije moguće. Stoga je potrebno tražiti druga rješenja problema (Witlman, 1988).

Unutar ovog koncepta napravljene su neke pretpostavke o pravim rezultatima i pogreškama mjerenja. Potonji se prihvaćaju kao samostalan čimbenik, što je, naravno, prilično obrazovana pretpostavka, budući da nasumične fluktuacije u rezultatima ne daju kovarijance: r EE =0.

Pretpostavlja se da ne postoji korelacija između pravih rezultata i pogrešaka mjerenja: rEE=0.

Ukupna greška je 0, jer prosjek se uzima kao prava procjena aritmetička vrijednost:

Ove nas pretpostavke konačno dovode do dobro poznate definicije pouzdanosti kao omjera pravog rezultata i ukupna varijanca ili izraz: 1 minus omjer u čijem je brojniku pogreška mjerenja, a u nazivniku ukupna varijanca:

, ILI

Iz ove formule za određivanje pouzdanosti dobivamo da je varijanca pogreške S 2 (E) jednaka je ukupnoj varijanci u broju slučajeva (1 - r XX "); stoga se standardna pogreška mjerenja određuje formulom:

Nakon teorijska potkrijepljenost pouzdanosti i njezinih izvedenica, potrebno je odrediti indeks pouzdanosti pojedinog testa. Postoje praktični postupci za procjenu pouzdanosti testova, kao što je korištenje zamjenjivih obrazaca (paralelni testovi), dijeljenje predmeta u dva dijela, ponovno testiranje i mjerenje unutarnje dosljednosti. Svaki direktorij sadrži indekse dosljednosti rezultata ispitivanja:

r XX ’ \u003d r (x 1, x 2)

Gdje rXX' je koeficijent stabilnosti, i x 1 I x2 - rezultati dvaju mjerenja.

Koncept pouzdanosti izmjenjivih oblika uveo je i razvio Gulliksen (1950). Ovaj postupak je prilično naporan, jer je povezan s potrebom stvaranja paralelnog niza zadataka.

r XX ’ \u003d r (x 1, x 2)

Gdje rXX' je omjer ekvivalencije, i x 1 I x2 - dva paralelna testa.

Sljedeći postupak - dijeljenje glavnog testa na dva dijela A i B - lakši je za korištenje. Rezultati dobiveni iz oba dijela testa su u korelaciji. Koristeći Spearman-Brownovu formulu, procjenjuje se pouzdanost testa u cjelini:

gdje su A i B dva paralelna dijela testa.

Sljedeća metoda je određivanje unutarnje dosljednosti izvršenja testnih zadataka. Ova se metoda temelji na određivanju kovarijanci pojedinačnih stavki. Sg je varijanca nasumično odabrane stavke, a Sgh je kovarijanca dvije nasumično odabrane stavke. Najčešće korišteni koeficijent za određivanje unutarnje konzistencije je Cronbachov "alfa". Također se koristi formula KR20 i λ-2(lambda-2).

U klasičnom konceptu pouzdanosti definirane su pogreške mjerenja koje se javljaju kako u procesu ispitivanja tako iu procesu promatranja. Izvori ovih grešaka su različiti: mogu biti osobine ličnosti, te obilježja uvjeta testiranja i samih ispitnih zadataka. postojati specifične metode proračuni pogrešaka. Znamo da se naša zapažanja mogu pokazati pogrešnima, naši metodološki alati su nesavršeni na isti način na koji su nesavršeni i sami ljudi. (Kako se ne sjetiti Shakespearea: "Nepouzdan si ti, čije je ime čovjek"). Činjenica da su pogreške mjerenja eksplicirane i objašnjene u klasičnoj teoriji ispitivanja važna je pozitivna točka.

Klasična teorija testova ima niz značajnih obilježja koja se mogu smatrati njezinim nedostacima. Neke od ovih osobina se navode u literaturi, ali se rijetko ističe njihova važnost (sa svakodnevnog gledišta), niti se napominje da ih s teorijskog ili metodološkog gledišta treba smatrati nedostacima.

Prvi. Klasična teorija testova i koncept pouzdanosti usmjereni su na izračun ukupnih testnih pokazatelja, koji su rezultat zbrajanja ocjena dobivenih u pojedinim zadacima. Da, na poslu

Drugi. Faktor pouzdanosti uključuje procjenu veličine raspršenosti izmjerenih pokazatelja. Iz toga slijedi da će koeficijent pouzdanosti biti niži ako je (pod ostalim uvjetima) uzorak homogeniji. Ne postoji jedinstveni koeficijent unutarnje konzistentnosti ispitnih zadataka, ovaj koeficijent je uvijek "kontekstualan". Crocker i Algina (1986.), na primjer, nude posebnu formulu za "homogenu korekciju uzorka" dizajniranu za najviše i najniže rezultate koje su dobili ispitanici. Za dijagnostičara je važno znati karakteristike varijacija u okvir za uzorkovanje, inače neće moći koristiti koeficijente unutarnje konzistencije navedene u priručniku za ovaj test.

Treći. Fenomen svođenja na aritmetičku sredinu je logična posljedica klasičnog koncepta pouzdanosti. Ako rezultat na testu varira (tj. nije dovoljno pouzdan), tada je moguće da će pri ponavljanju postupka ispitanici s niskim rezultatima dobiti više visoki rezultati i obrnuto, subjekti s visokim rezultatima su niski. Ovaj artefakt postupka mjerenja ne može se zamijeniti za istinsku promjenu ili manifestaciju razvojnih procesa. Ali u isto vrijeme nije ih lako razlikovati jer nikada se ne može isključiti mogućnost promjene u tijeku razvoja. Za potpunu sigurnost nužna je usporedba s kontrolnom skupinom.

Četvrta karakteristika testova dizajniranih u skladu s načelima klasične teorije je prisutnost normativnih podataka. Poznavanje normi ispitivanja omogućuje istraživaču adekvatnu interpretaciju rezultata ispitivanja. Izvan normi rezultati testova su besmisleni. Izrada testnih normi prilično je skup pothvat, budući da psiholog mora dobiti rezultate testa na reprezentativnom uzorku.

2 Ya ter Laak

Ako govorimo o nedostacima klasičnog koncepta pouzdanosti, tada je prikladno navesti izjavu Si-tsme (1992., str. 123-125). On napominje da je prva i osnovna pretpostavka klasične teorije testa da rezultati testa slijede načelo intervala. Međutim, ne postoje studije koje bi poduprle ovu pretpostavku. Zapravo, ovo je "mjerenje prema proizvoljno utvrđenom pravilu". Ova značajka stavlja klasičnu teoriju testova u nepovoljniji položaj u usporedbi s ljestvicama mjerenja stava i, naravno, u usporedbi s modernom teorijom testova. Mnoge metode analize podataka (analiza varijance. regresijska analiza, korelacija i faktorska analiza) temelje se na pretpostavci postojanja intervalne ljestvice. Međutim, to nema čvrste temelje. Razmotrite ljestvicu pravih rezultata kao ljestvicu vrijednosti psihološke karakteristike(npr. aritmetičke sposobnosti, inteligencija, neuroticizam) mogu se samo pretpostaviti.

Druga primjedba odnosi se na činjenicu da rezultati testa nisu apsolutni pokazatelji jedne ili druge psihološke karakteristike testirane osobe, već se moraju promatrati samo kao rezultati izvedbe pojedinog testa. Dva testa mogu tvrditi da mjere iste psihološke karakteristike (npr. inteligenciju, verbalnu sposobnost, ekstravertnost), ali to ne znači da su ta dva testa ekvivalentna i da imaju iste mogućnosti. Usporedba učinka dviju osoba koje su testirane različitim testovima je netočna. Isto vrijedi i za polaganje dva različita testa od strane jednog predmeta. Treća primjedba odnosi se na pretpostavku da je standardna pogreška mjerenja ista za bilo koju razinu mjerljive sposobnosti pojedinca. Međutim, ne postoji empirijska potvrda ove pretpostavke. Tako, na primjer, nema jamstva da će ispitanik s dobrim matematičkim sposobnostima, kada radi s relativno jednostavnim aritmetičkim testom, dobiti visoke rezultate. U ovom slučaju, veća je vjerojatnost da će osoba s niskim ili prosječnim sposobnostima dobiti visoku ocjenu.

U okviru moderne teorije testova ili teorije analize odgovora, testni zadaci sadrže opis velikog

broj modela mogućih odgovora ispitanika. Ovi se modeli razlikuju po temeljnim pretpostavkama i zahtjevima za podacima. Raschov model često se smatra sinonimom za teorije analize odgovora na stavke (1RT). Zapravo, ovo je samo jedan od modela. Formula predstavljena u njemu za opisivanje karakteristične krivulje podešavanja g je sljedeća:

Gdje g- zaseban zadatak test; eksp- eksponencijalna funkcija (nelinearna ovisnost); δ ("delta") - razina težine testa.

Ostale ispitne stavke kao što su h, također dobivaju svoje karakteristične krivulje. Ispunjenje uvjeta δh >δg (g znači da h- više težak zadatak. Stoga, za bilo koju vrijednost indikatora Θ ("theta" - latentna svojstva sposobnosti testiranog) vjerojatnost uspješnog izvršenja zadatka h manje. Ovaj model se naziva strogim, jer je očito da je s niskim stupnjem izraženosti osobine vjerojatnost izvršenja zadatka blizu nule. U ovom modelu nema mjesta nagađanjima i pretpostavkama. Za stavke s izborom nema potrebe stvarati pretpostavke o vjerojatnosti uspjeha. Osim toga, ovaj je model strog u smislu da svi testni zadaci moraju imati istu diskriminirajuću sposobnost (visoka diskriminacija se ogleda u strmini krivulje; ovdje je moguće izgraditi Guttmannovu ljestvicu, prema kojoj se u svakoj točki karakteristična krivulja, vjerojatnost izvršenja zadatka varira od O do 1). Zbog ovog uvjeta ne mogu se svi zadaci uključiti u testove izrađene na temelju Raschovog modela.

Postoji nekoliko varijanti ovog modela (npr. Birnbaura, 1968, See Lord & Novik). Omogućuje postojanje zadataka s različitim diskriminativnim

sposobnost.

Nizozemski istraživač Mokken (1971.) razvio je dva modela za analizu odgovora na ispitne zadatke, čiji zahtjevi nisu toliko strogi kao u Raschovom modelu, pa su stoga možda i realističniji. Kao glavni uvjet

Viya Mokken zastupa stav da karakteristična krivulja zadatka treba slijediti monotono, bez prekida. Svi ispitni zadaci usmjereni su na proučavanje iste psihološke karakteristike, prema kojoj se treba mjeriti V. Svaki oblik ove ovisnosti je dopušten, sve dok ne prestane. Dakle, oblik karakteristične krivulje nije određen nikakvom specifičnom funkcijom. Ova "sloboda" vam omogućuje da koristite više ispitnih zadataka, a razina ocjenjivanja nije viša od normalne.

Metodologija modela odgovora na test (IRT) razlikuje se od većine eksperimentalnih i korelacijske studije. Matematički model dizajniran je za proučavanje bihevioralnih, kognitivnih, emocionalnih karakteristika, kao i razvojnih fenomena. Ovi fenomeni koji se razmatraju često su ograničeni na odgovore na zadatak, što je navelo Mellenberga (1990.) da nazove IRT teoriju "mini-teorijom o mini-ponašanju". Rezultati istraživanja mogu se u određenoj mjeri prikazati kao krivulje konzistencije, posebno u slučajevima kada ne postoje teorijske ideje o proučavanim karakteristikama. Do sada nam je na raspolaganju samo nekoliko testova inteligencije, sposobnosti i testova osobnosti kreiranih na temelju brojnih modela teorije IRT-a. Varijante Raschovog modela češće se koriste u razvoju testova postignuća (Verhelst, 1993), dok su Mokkenovi modeli prikladniji za razvojne fenomene (vidi također Poglavlje 6).

Odgovor ispitanika na ispitne čestice osnovna je jedinica IRT modela. Vrsta odgovora određena je stupnjem izraženosti proučavane karakteristike kod osobe. Takva karakteristika može biti, na primjer, aritmetička ili prostorna sposobnost. U većini slučajeva radi se o jednom ili drugom aspektu inteligencije, karakteristikama postignuća ili osobinama ličnosti. Pretpostavlja se da postoji nelinearni odnos između položaja te osobe u određenom rasponu proučavanih karakteristika i vjerojatnosti uspješnog izvršenja određenog zadatka. Nelinearnost ove ovisnosti je u određenom smislu intuitivna. Poznati izrazi "Svaki početak je težak" (sporo od-

početak linije) i "Postati svetac nije tako lako", znače da daljnje kultiviranje nakon dostizanja određene razina ide teško. Krivulja se polako približava, ali gotovo nikada ne doseže stopu uspješnosti od 100%.

Neki modeli prilično proturječe našem intuitivnom razumijevanju. Uzmimo ovaj primjer. Osoba s proizvoljnim karakterističnim indeksom težine jednakim 1,5 ima 60 posto vjerojatnosti uspjeha u izvršenju zadatka. To je u suprotnosti s našim intuitivnim razumijevanjem takve situacije, jer možete ili uspješno izvršiti zadatak, ili se uopće ne nositi s njim. Uzmimo ovaj primjer: 100 puta čovjek pokuša uzeti visinu od 1m 50 cm, 60 puta ga prati uspjeh, t.j. ima 60 posto uspješnosti.

Za procjenu ozbiljnosti neke karakteristike potrebna su najmanje dva zadatka. Raschov model uključuje određivanje ozbiljnosti karakteristika, bez obzira na težinu zadatka. Ovo se također protivi našoj intuiciji: pretpostavimo da osoba ima 80 posto šanse da skoči iznad 1,30 m. vjerojatnost da će skočiti iznad 1,70 m. Stoga, bez obzira na vrijednost nezavisne varijable (visina), može se procijeniti sposobnost osoba visoko skočiti.

Postoji oko 50 IRT modela (Goldstein & Wood, 1989.) Postoji mnogo nelinearnih funkcija koje opisuju (objašnjavaju) vjerojatnost uspjeha u izvršavanju zadatka ili skupine zadataka. Zahtjevi i ograničenja ovih modela su različiti, a te se razlike mogu pronaći usporedbom Raschovog modela i Mokkenove ljestvice. Zahtjevi za ove modele uključuju:

1) potreba za određivanjem karakteristike koja se proučava i procjenom položaja osobe u rasponu ove osobine;

2) procjena redoslijeda zadataka;

3) provjera specifičnih modela. U psihometriji su razvijeni mnogi postupci za testiranje modela.

Neke referentne knjige tretiraju IRT teoriju kao oblik analize ispitnih stavki (vidi, na primjer,

Croker & Algina, J 986). Može se, međutim, tvrditi da je IRT teorija "mini-teorija o mini-ponašanju". Zagovornici teorije IRT-a primjećuju da ako su koncepti (modeli) srednje razine nesavršeni, što onda reći o složenijim konstruktima u psihologiji?

Klasična i moderna teorija ispitivanja. Ljudi ne mogu a da ne uspoređuju stvari koje izgledaju gotovo isto. (Možda se svakodnevni ekvivalent psihometrije uglavnom sastoji u usporedbi ljudi prema značajnim karakteristikama i odabiru između njih). Svaka od predstavljenih teorija - i teorija mjerenja pogrešaka procjene i matematički model odgovora na ispitne zadatke - ima svoje pristaše (Goldstein & Wood, 1986).

IRT modeli ne izazivaju prigovore da se radi o "ocjenjivanju temeljenom na pravilima", za razliku od klasične teorije testova. IRT model je usmjeren na analizu procijenjenih karakteristika. Karakteristike ličnosti i karakteristike zadatka procjenjuju se skalama (ordinalnim ili intervalnim). Štoviše, moguće je usporediti pokazatelje uspješnosti različitih testova usmjerenih na proučavanje sličnih karakteristika. Konačno, pouzdanost nije ista za svaku vrijednost na ljestvici, a prosječne vrijednosti su obično pouzdanije od vrijednosti na početku i kraju ljestvice. Stoga su IRT modeli teoretski superiorniji. Postoje i razlike u praktičnu upotrebu moderna teorija testova i klasična teorija (Sijstma, 1992., str. 127-130). Moderna teorija testova složenija je od klasične teorije pa je rjeđe koriste nestručnjaci. Štoviše, IRT postavlja posebne zahtjeve za zadatke. To znači da stavke treba isključiti iz testa ako ne zadovoljavaju zahtjeve modela. Ovo pravilo vrijedi i za one zadatke koji su bili dio naširoko korištenih testova, izgrađenih na principima klasične teorije. Test postaje kraći i stoga manje pouzdan.

IRT nudi matematičke modele za proučavanje stvarnih pojava. Modeli bi nam trebali pomoći da razumijemo ključne aspekte ovih pojava. Međutim, ovdje postoji veliki teorijski problem. Modeli se mogu uzeti u obzir

kao pristup proučavanju složene stvarnosti u kojoj živimo. Ali model i stvarnost nisu isto. Prema pesimističkom gledištu, moguće je modelirati samo pojedinačne (i štoviše, ne najzanimljivije) tipove ponašanja. Također možete naići na tvrdnju da stvarnost uopće nije podložna modeliranju jer. ne pokorava se samo zakonima uzroka i posljedice. U najboljem slučaju, moguće je modelirati pojedinačne (idealne) fenomene ponašanja. Postoji i drugi, optimističniji pogled na mogućnosti modeliranja. Navedeno stajalište blokira mogućnost dubokog razumijevanja prirode fenomena ljudskog ponašanja. Primjena jednog ili drugog modela postavlja neka opća, temeljna pitanja. Po našem mišljenju, nema sumnje da je IRT koncept teorijski i tehnički superiorniji od klasične teorije testova.

Praktična svrha testova, na kojoj god teorijskoj osnovi bili kreirani, jest utvrditi značajne kriterije i na temelju njih utvrditi karakteristike određenih psiholoških konstrukata. Ima li IRT model prednosti iu tom pogledu? Moguće je da testovi temeljeni na ovom modelu ne daju točnije predviđanje od testova temeljenih na klasičnoj teoriji, a moguće je da njihov doprinos razvoju psiholoških konstrukata nije značajniji. Dijagnostičari preferiraju kriterije koji su izravno povezani s pojedinačna osoba, institucija ili zajednica. Znanstveno superiorniji model ne "ipso facto" definira prikladniji kriterij i donekle je ograničen u objašnjavanju znanstvenih konstrukata. Očito će se nastaviti razvoj testova temeljenih na klasičnoj teoriji, ali u isto vrijeme će se kreirati novi IRT modeli koji će se primjenjivati na studiju. više psihološki fenomeni.

U klasičnoj teoriji testova razlikuju se pojmovi "pouzdanosti" i "valjanosti". Rezultati ispitivanja moraju biti pouzdani, tj. rezultati inicijalnog i ponovnog testiranja trebaju biti dosljedni. Osim,

* ipso facto(lak) - sam po sebi (približno prev.).

rezultati ne bi trebali (koliko je to moguće) bez pogrešaka u procjeni. Prisutnost valjanosti jedan je od zahtjeva za dobivene rezultate. U isto vrijeme, pouzdanost se smatra neophodnom, ali ne još dovoljan uvjet valjanost testa.

Koncept valjanosti podrazumijeva da se dobiveni rezultati odnose na nešto važno u praktičnom ili teoretskom smislu. Zaključci izvučeni iz ispitne ocjene, mora biti važeća. Najčešće se govori o dvije vrste valjanosti: prediktivnoj (kriterijska) i konstruktivnoj. Postoje i druge vrste valjanosti (vidi Poglavlje 3). Osim toga, valjanost se također može odrediti u slučaju kvazieksperimenata (Cook & Campbell, 1976, Cook & Shadish, 1994). Međutim, glavna vrsta valjanosti još uvijek je prediktivna valjanost, koja se shvaća kao sposobnost predviđanja nečeg značajnog o budućem ponašanju iz rezultata testa, kao i mogućnost dubljeg razumijevanja jednog ili drugog psihološko svojstvo odnosno kvaliteta.

Predstavljene vrste valjanosti obrađene su u svakom priručniku i popraćene su opisom metoda za analizu valjanosti testa. Faktorska analiza je prikladnija za određivanje valjanosti konstrukta, dok se jednadžbe linearne regresije koriste za analizu prediktivne valjanosti. Određene karakteristike (uspjeh, učinkovitost terapije) mogu se predvidjeti na temelju jednog ili više pokazatelja, napola naučenih u radu s intelektualnim ili testovi osobnosti. Tehnike obrade podataka kao što su korelacija, regresija, analiza varijance, analiza parcijalnih korelacija i varijanci služe za utvrđivanje prediktivne valjanosti testa.

Često se opisuje i valjanost sadržaja. Pretpostavlja se da svi zadaci i zadaci testa trebaju pripadati određenom području (mentalne osobine, ponašanje i sl.). Pojam sadržajne valjanosti karakterizira usklađenost svakog ispitnog zadatka s mjerenim područjem. Valjanost sadržaja ponekad se vidi kao dio pouzdanosti ili "generalizabilnosti" (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Međutim, kada

Pri odabiru zadataka za provjeru postignuća u određenom predmetnom području također je važno obratiti pozornost na pravila uključivanja zadataka u test.

U klasičnoj teoriji ispitivanja, pouzdanost i valjanost smatraju se relativno neovisnima jedna o drugoj. Ali postoji još jedno razumijevanje odnosa između ovih pojmova. Moderna teorija testova temelji se na primjeni modela. Parametri se vrednuju unutar nekog modela. Ako zadatak ne ispunjava zahtjeve modela, tada se u okviru ovog modela prepoznaje kao nevažeći. Validacija konstrukta dio je validacije samog modela. Ova se validacija prvenstveno odnosi na testiranje postojanja jednodimenzionalnog latentnog obilježja od interesa s poznatim karakteristikama ljestvice. Rezultati na ljestvici mogu se, naravno, koristiti za definiranje odgovarajućih kriterija i mogu se povezati s rezultatima drugih konstrukata kako bi se pružile informacije o konvergentnoj i divergentnoj valjanosti konstrukta.

Psihodijagnostika je analogna jeziku, opisuje se kao jedinstvo četiri komponente prikazane na tri razine. Prva komponenta, teorija testa, analogna je sintaksi, gramatici jezika. Generirajuća (generativna) gramatika je s jedne strane duhovit model, s druge strane sustav koji poštuje pravila. Uz ova pravila temeljena na jednostavnim afirmativni prijedlozi izgrađeni su kompleksi. U isto vrijeme, međutim, ovaj model ostavlja po strani opis kako je komunikacijski proces organiziran (što se prenosi i što se percipira), te u koje svrhe se provodi. Da bi se to razumjelo potrebno je dodatno znanje. Isto se može reći i za teoriju testova: ona je neophodna u psihodijagnostici, ali ne može objasniti što psihodijagnostičar radi i koji su mu ciljevi.

1.3.2. Psihološke teorije i psihološki konstrukti

Psihodijagnostika je uvijek dijagnoza nečeg specifičnog: osobne karakteristike, ponašanje, razmišljanje, emocije. Testovi su osmišljeni za procjenu individualnih razlika. Postoji nekoliko koncepata

individualne razlike, od kojih svaki ima svoje karakteristične značajke. Ako se prizna da psihodijagnostika nije ograničena samo na procjenu individualnih razlika, onda druge teorije postaju bitne za psihodijagnostiku. Primjer je procjena razlika u procesima mentalnog razvoja i razlika u socijalnom okruženju. Iako procjena individualnih razlika nije neizostavan atribut psihodijagnostike, ipak postoje određene tradicije istraživanja u ovom području. Psihodijagnostika je započela procjenom razlika u inteligenciji. Glavni zadatak testova bio je "utvrđivanje nasljednog prijenosa genijalnosti" (Gallon) ili odabir djece za obuku (Binet, Simon). Mjerenje kvocijenta inteligencije dobilo je teoretsko razumijevanje i praktični razvoj u radovima Spearmana (Velika Britanija) i Thurstonea (SAD). Raymond B. Cattell učinio je sličnu stvar za procjenu karakteristika ličnosti. Psihodijagnostika postaje neraskidivo povezana s teorijama i idejama o individualnim razlikama u postignućima (procjena marginalnih sposobnosti) i oblicima ponašanja (razina tipičnog funkcioniranja). Ova tradicija je i danas na snazi. U nastavna sredstva U psihodijagnostici se mnogo rjeđe procjenjuju razlike u socijalnom okruženju u usporedbi s razmatranjem značajki samih razvojnih procesa. Za to nema razumnog objašnjenja. S jedne strane, dijagnostika nije ograničena na određene teorije i koncepte. S druge strane, potrebne su mu teorije, jer se u njima utvrđuje dijagnosticirani sadržaj (tj. "što" se dijagnosticira). Tako se, na primjer, inteligencija može smatrati opće karakteristike, i kao osnova za mnoštvo sposobnosti neovisnih jedna o drugoj. Ako psihodijagnostika pokušava "pobjeći" od jedne ili druge teorije, onda je osnova psihodijagnostičkog procesa predstava zdrav razum. Istraživanje koristi razne načine analiza podataka, i opća logika istraživanje određuje izbor određenog matematičkog modela i određuje strukturu korištenih psiholoških koncepata. Takve metode matematičke statistike

ki, poput analize varijance, regresijske analize, faktorska analiza, prebrojavanje korelacija sugerira postojanje linearne ovisnosti. U slučaju pogrešne primjene ovih metoda, one svoju strukturu "dovode" u primljene podatke i korištene konstrukte.

Ideje o razlikama u socijalnom okruženju io razvoju osobnosti nisu imale gotovo nikakvog utjecaja na psihodijagnostiku. Udžbenici (vidi, na primjer, Murphy & Davidshofer, 1988) raspravljaju klasična teorija ispituje i raspravlja o relevantnim metodama statističke obrade, opisuje poznati testovi, govori o primjeni psihodijagnostike u praksi: u psihologiji menadžmenta, u odabiru kadrova, u procjeni psihičkih karakteristika osobe.

Teorije individualnih razlika (kao i ideje o razlikama između društveno okruženje i o mentalnom razvoju) slični su proučavanju semantike jezika. Ovo je proučavanje i suštine, i sadržaja, i značenja. Značenja su strukturirana na određeni način (kao psihološki konstrukti), na primjer, sličnošću ili kontrastom (analogija, konvergencija, divergencija).

1.3.3. Psihološki testovi i druga metodička sredstva

Treća komponenta predložene sheme su testovi, postupci i metodološka sredstva kojima se prikupljaju informacije o karakteristikama ličnosti. Drene i Siitsma (1990., str. 31) definiraju testove na sljedeći način: „Psihološki test se smatra klasifikacijom prema određeni sustav ili kao postupak mjerenja koji vam omogućuje da donesete određeni sud o jednoj ili više empirijski identificiranih ili teorijski potkrijepljenih karakteristika određenog aspekta ljudskog ponašanja (izvan testne situacije). U ovom slučaju razmatra se odgovor ispitanika na određeni broj pažljivo odabranih podražaja, a dobiveni se odgovori uspoređuju s normama testa.

Dijagnostika zahtijeva testove i tehnike za prikupljanje pouzdanih, točnih i valjanih informacija o značajkama

i karakteristične osobine ličnosti, o razmišljanju, emocijama i ljudskom ponašanju. Osim razvoja ispitnih postupaka, ova komponenta također uključuje sljedeća pitanja: kako se izrađuju testovi, kako se formuliraju i odabiru zadaci, kako teče proces testiranja, koji su zahtjevi za uvjete testiranja, kako se uzimaju u obzir pogreške mjerenja, kako se izračunavaju i interpretiraju rezultati testa.

U procesu izrade testova razlikuju se racionalne i empirijske strategije. Primjena racionalne strategije započinje definiranjem temeljnih pojmova (primjerice, pojmova inteligencije, ekstraverzije), au skladu s tim idejama formuliraju se testni zadaci. Primjer takve strategije je koncept analize aspekata (teorija aspekta) Guttmana (1957, 1968, 1978). Prvo se određuju različiti aspekti glavnih konstrukata, zatim se odabiru zadaci i zadaci na način da se svaki od tih aspekata uzme u obzir. Druga strategija je da se zadaci biraju na empirijskoj osnovi. Na primjer, ako bi istraživač pokušao napraviti test profesionalnog interesa koji bi razlikovao medicinske stručnjake od inženjera, tada bi postupak bio ovakav. Obje skupine ispitanika moraju odgovoriti na sve čestice testa, a one čestice u odgovorima kod kojih su utvrđene statistički značajne razlike ulaze u konačnu verziju testa. Ako, primjerice, postoje razlike među skupinama u odgovorima na tvrdnju "Volim pecati", tada ta tvrdnja postaje element testa. Glavna poanta ove knjige je da je test povezan s konceptualnom ili taksonomskom teorijom koja definira te karakteristike.

Svrha testa obično je definirana u uputama za njegovu uporabu. Test bi trebao biti standardiziran tako da može mjeriti razlike među ljudima, a ne između uvjeta testiranja. Postoje, međutim, odstupanja od standardizacije u postupcima koji se nazivaju "ispitivanje granica" (testing the limits) i "testovi potencijala učenja" (learning potential tests). Pod tim uvjetima, ispitaniku se pomaže u procesu

testiranja i zatim ocijeniti učinak takvog postupka na rezultat. Obračun bodova za odgovore na zadatke je objektivan, tj. provodi u skladu sa standardnim postupkom. Tumačenje dobivenih rezultata također je strogo definirano i provodi se na temelju ispitnih normi.

Treća komponenta psihodijagnostike - psihološki testovi, alati, postupci - sadrži određene zadatke, koji su najmanje cjeline psihodijagnostike i u tom su smislu zadaci slični fonemima jezika. Broj mogućih kombinacija fonema je ograničen. Samo određene fonemske strukture mogu tvoriti riječi i rečenice koje slušatelju pružaju informacije. Također Iispitni zadaci: samo u određenoj međusobnoj kombinaciji mogu postati učinkovit alat procjene odgovarajućeg konstrukta.

Pošaljite svoj dobar rad u bazu znanja jednostavno je. Koristite obrazac u nastavku

Studenti, diplomanti, mladi znanstvenici koji koriste bazu znanja u svom studiju i radu bit će vam vrlo zahvalni.

Objavljeno na http://www.allbest.ru/

1. OSNOVNI POJMOVI

Test je mjerenje ili test koji se provodi kako bi se utvrdilo stanje ili sposobnost sportaša. Postupak ispitivanja naziva se ispitivanje: numerička vrijednost dobivena kao rezultat mjerenja je rezultat ispitivanja (ili rezultat ispitivanja). Na primjer, trčanje na 100 m je test, procedura za provođenje utrka i mjerenje vremena je testiranje, vrijeme trčanja je rezultat testa.

Testovi temeljeni na motoričkim zadacima nazivaju se motorički (ili motorički) testovi. U tim testovima kao rezultati mogu djelovati ili motorička postignuća (vrijeme prijeđene udaljenosti, broj ponavljanja, prijeđena udaljenost itd.) ili fiziološki i biokemijski pokazatelji. Ovisno o tome, kao io zadatku s kojim se ispitanik suočava, razlikuju se tri skupine motoričkih testova (Tablica A).

Tablica A. Vrste motoričkih testova.

Naziv testa	Zadatak za sportaša	Rezultati ispitivanja
Kontrolne vježbe		motoričko postignuće	Trčanje na 1500m, vrijeme trčanja
Standardna funkcionalna ispitivanja	Isti za sve, dozirano ili: a) prema količini obavljenog rada, ili: b) prema veličini fizioloških promjena	Fiziološki ili biokemijski pokazatelji pri standardnom radu Motorički pokazatelji pri standardnoj vrijednosti fizioloških pomaka	Registracija otkucaja srca pri standardnom radu od 1000 km/min Brzina trčanja pri pulsu od 160 otkucaja/min, PVC test (170)
Maksimalna funkcionalna ispitivanja	Prikaži maksimalan rezultat	Fiziološki ili biokemijski parametri	Određivanje maksimalnog kisikovog duga ili maksimalne potrošnje kisika

Ponekad se ne koristi jedan, nego nekoliko testova koji imaju jedan krajnji cilj (primjerice, procjena stanja sportaša u natjecateljskom razdoblju treninga). Takva skupina naziva se kompleks ili baterija testova. Ne mogu se sva mjerenja koristiti kao testovi. Da bi to učinili, moraju ispunjavati posebne zahtjeve. To uključuje: 1) pouzdanost testa; 2) informativnost testa; 3) prisutnost sustava ocjenjivanja (vidi - sljedeće poglavlje); 4) standardizacija - postupak i uvjeti ispitivanja trebaju biti isti u svim slučajevima primjene testa. Testovi koji zadovoljavaju zahtjeve pouzdanosti i informativnosti nazivaju se dobrim ili autentičnim testovima.

2. POUZDANOST TESTOVA

2.1 Pojam pouzdanosti testa

fizičko testiranje na traci za trčanje

Pouzdanost testova odnosi se na stupanj slaganja između rezultata pri ponovnom testiranju istih ljudi (ili drugih objekata) pod istim uvjetima. U idealnom slučaju, isti test, primijenjen na iste subjekte pod istim uvjetima, trebao bi dati iste rezultate. Međutim, čak i uz najstrožu standardizaciju testova i preciznu opremu, rezultati testova uvijek donekle variraju. Na primjer, sportaš koji je upravo stisnuo 55 kg na ručnom dinamometru će za nekoliko minuta pokazati samo 50 kg. Takva se varijacija naziva unutarindividualna ili (da upotrijebimo općenitiju terminologiju matematičke statistike) unutarklasna. Postoje četiri glavna razloga za to:

promjena stanja ispitanika (umor, vježbanje, učenje, promjena motivacije, koncentracije itd.);

nekontrolirane promjene vanjskih uvjeta i opreme (temperatura i vlaga, napon u elektroenergetskoj mreži, prisutnost neovlaštenih osoba, vjetar itd.);

promjena u stanju osobe koja provodi ili ocjenjuje test, zamjena jednog eksperimentatora ili suca drugim;

nesavršenost testa (postoje testovi koji su notorno nepouzdani, na primjer, slobodna bacanja na košarkaški koš prije prvog promašaja; čak i sportaš s visokim postotkom pogodaka može slučajno pogriješiti kod prvih bacanja).

Sljedeći pojednostavljeni primjer pomoći će razumjeti ideju metoda korištenih za procjenu pouzdanosti testova. Recimo da želimo usporediti rezultate skoka u dalj iz mjesta dvaju sportaša u dva pokušaja. Ako želite izvući točne zaključke, ne biste se trebali ograničiti samo na registraciju najbolje rezultate. Pretpostavimo da rezultati svakog od sportaša variraju unutar ± 10 cm od Srednja veličina i iznose 220 ± 10 cm (tj. 210 i 230 cm) i 320 ± 10 cm (tj. 310 i 330 cm). U ovom slučaju, zaključak će, naravno, biti potpuno nedvosmislen: drugi sportaš je bolji od prvog. Razlika između rezultata (320 cm - 220 cm = 100 cm) jasno je veća od slučajnih fluktuacija (±10 cm). Puno manje sigurno

Riža. 1. Omjer međuklasnih i unutarklasnih varijacija pri visokoj (gornjoj) i niskoj (donjoj) pouzdanosti.

Kratki okomiti potezi - podaci pojedinačnih pokušaja, X i A "2, X 3 - prosječni rezultati triju ispitanika

zaključak je hoće li, uz istu unutarrazrednu varijaciju (jednaku ±10 cm), razlika između subjekata (međurazredna varijacija) biti mala. Recimo da će prosječne vrijednosti biti jednake 220 cm (u jednom pokušaju 210 cm, u drugom 230 cm) i 222 (212 i 232 cm). Tada se može dogoditi, na primjer, da u prvom pokušaju prvi sportaš preskoči 230 cm, a drugi - samo 212, te se stvara dojam da je prvi znatno jači od drugog.

Iz primjera se vidi da nije unutarrazredna varijabilnost sama po sebi od primarne važnosti, već njezin odnos s međurazrednim razlikama. Ista varijacija unutar klase daje različitu pouzdanost kada različite razlike između razreda (u konkretnom slučaju predmeta, sl. 1).

Teorija pouzdanosti testa proizlazi iz činjenice da je rezultat bilo kojeg mjerenja provedenog na osobi X (- je zbroj dviju vrijednosti:

X^Xoo + Xe, (1)

gdje je X x takozvani pravi rezultat koji se želi popraviti;

X e je pogreška uzrokovana nekontroliranom varijacijom u stanju subjekta koju unosi mjerni uređaj itd.

Po definiciji, pravi rezultat se shvaća kao prosječna vrijednost X ^ u beskonačnosti veliki brojevi promatranja pod istim uvjetima (dakle, na X i staviti znak beskonačnosti oo).

Ako su pogreške slučajne (zbroj im je nula, au različitim pokušajima ne ovise jedna o drugoj), tada iz matematičke statistike slijedi:

O/ = Ooo T<З е,

tj. varijanca rezultata zabilježena u eksperimentu (st / 2) jednaka je zbroju varijanci pravih rezultata ((Xm 2) i pogrešaka (0 e 2).

Ooo 2 karakterizira idealiziranu (tj. bez grešaka) varijaciju među klasama, a e 2 karakterizira varijabilnost unutar klase. Utjecaj e 2 mijenja distribuciju rezultata ispitivanja (slika 2).

Prema definiciji, koeficijent pouzdanosti (Hz) jednak je omjeru stvarne varijance i varijance zabilježene u eksperimentu:

Drugim riječima, rn je jednostavno udio stvarne varijacije u varijaciji koja je registrirana u eksperimentu.

Uz koeficijent pouzdanosti koristi se i indeks pouzdanosti:

koji se smatra teorijskim koeficijentom korelacije zabilježenih ispitnih vrijednosti sa stvarnim. Oni također koriste koncept standardne pogreške pouzdanosti, koji se shvaća kao standardna devijacija snimljenih rezultata ispitivanja (X () od regresijske linije koja povezuje vrijednost X g s pravim rezultatima (X ") - sl. 3 .

2.2 Procjena pouzdanosti na temelju eksperimentalnih podataka

Koncept pravog rezultata testa je apstrakcija. Hoe se ne može mjeriti eksperimentalno (uostalom, u stvarnosti je nemoguće izvršiti beskonačno velik broj promatranja pod istim uvjetima). Stoga se moraju koristiti neizravne metode.

Za procjenu pouzdanosti najpoželjnija je analiza varijance s naknadnim izračunom takozvanih koeficijenata korelacije unutar klase.

Analiza varijance, kao što je poznato, omogućuje rastavljanje varijacija rezultata ispitivanja zabilježenih u eksperimentu na komponente zbog utjecaja pojedinih čimbenika. Na primjer, ako registrirate rezultate ispitivanih subjekata u bilo kojem testu, ponavljajući ovaj test u različite dane i čineći nekoliko pokušaja svaki dan, povremeno mijenjajući eksperimentatore, tada će postojati varijacija:

a) od subjekta do subjekta (interindividualne varijacije),

b) iz dana u dan

c) od eksperimentatora do eksperimentatora,

d) pokušaj za pokušajem.

Analiza varijance omogućuje izolaciju i procjenu varijacija uzrokovanih tim čimbenicima.

Pojednostavljeni primjer pokazuje kako se to radi. Pretpostavimo da je 5 ispitanika izmjerilo rezultate dva pokušaja (k = 5, n = 2)

Rezultati analize varijance (vidi kolegij matematičke statistike, kao i Prilog 1. prvom dijelu knjige) dani su u tradicionalnom obliku u tablici. 2.

tablica 2

Pouzdanost se procjenjuje korištenjem takozvanog koeficijenta korelacije unutar klase:

gdje je r "u koeficijent korelacije unutar klase (koeficijent pouzdanosti, koji se, da bi se razlikovao od uobičajenog koeficijenta korelacije (r), označava dodatnim slovom (r") \\

n je broj pokušaja korištenih u testu;

n" je broj pokušaja za koje se provodi procjena pouzdanosti.

Na primjer, ako želimo procijeniti pouzdanost prosjeka dva pokušaja iz navedenog primjera, tada

Ako se ograničimo na samo jedan pokušaj, tada će pouzdanost biti jednaka:

a ako povećate broj pokušaja na četiri, koeficijent pouzdanosti također će se malo povećati:

Dakle, za procjenu pouzdanosti potrebno je, prvo, izvršiti analizu varijance i, drugo, izračunati unutarrazredni koeficijent korelacije (koeficijent pouzdanosti).

Neke poteškoće nastaju kada postoji takozvani trend, tj. sustavno povećanje ili smanjenje rezultata iz pokušaja u pokušaj (slika 4). U ovom slučaju koriste se složenije metode procjene pouzdanosti (nisu opisane u ovoj knjizi).

Za slučaj dva pokušaja i nepostojanja trenda, vrijednosti unutarrazrednog koeficijenta korelacije praktički se podudaraju s vrijednostima uobičajenog koeficijenta korelacije između rezultata prvog i drugog pokušaja. Stoga se u takvim situacijama za ocjenu pouzdanosti može koristiti i uobičajeni koeficijent korelacije (u ovom slučaju ocjenjuje pouzdanost jednog, a ne dva pokušaja). Međutim, ako je broj ponovnih pokušaja u testu veći od dva, a posebno ako se koriste složeni testni uzorci,

Riža. 4. Niz od šest pokušaja, od kojih su prva tri (il. lijevo) ili zadnja tri (desno) u trendu

(na primjer, 2 pokušaja dnevno tijekom dva dana), potreban je izračun koeficijenta unutar razreda.

Koeficijent pouzdanosti nije apsolutni pokazatelj koji karakterizira test. Ovaj koeficijent može varirati ovisno o kontingentu ispitanika (na primjer, biti različit za početnike i kvalificirane sportaše), uvjetima testiranja (provode li se ponovljeni pokušaji jedan za drugim ili, recimo, s intervalom od tjedan dana) i drugim razloga. Stoga je uvijek potrebno opisati kako i na kome je testiranje provedeno.

2.3 Pouzdanost u praksi ispitivanja

Nepouzdanost eksperimentalnih podataka smanjuje veličinu procjena korelacijskih koeficijenata. Budući da nijedan test ne može korelirati s drugim testom više nego sam sa sobom, gornja granica koeficijenta korelacije ovdje više nije ±1,00, već indeks pouzdanosti

r (oo = Y~r i

Kako bi se prešlo s procjene korelacijskih koeficijenata između empirijskih podataka na procjenu korelacija između stvarnih vrijednosti, može se koristiti izraz

gdje je r xy korelacija između pravih vrijednosti X i Y;

1~xy -- korelacija između empirijskih podataka; HSI^--procjena pouzdanosti X i Y.

Na primjer, ako je r xy = 0,60, r xx = 0,80 i r yy = 0,90, tada je korelacija između pravih vrijednosti 0,707.

Gornja formula (6) naziva se redukcijska korekcija (ili Spearman-Brownova formula), stalno se koristi u praksi.

Ne postoji fiksna vrijednost pouzdanosti koja bi dopustila da se test smatra prihvatljivim. Sve ovisi o važnosti "zaključaka izvedenih iz primjene testa. Ipak, u većini slučajeva u sportu mogu se koristiti sljedeće približne smjernice: 0,95--0,99 --¦ izvrsna pouzdanost, 0,90-^0,94 - - dobro, 0,80 - 0,89 - prihvatljivo, 0,70 - 0,79 - loše, 0,60 - 0,69 - upitno za individualne procjene, test je prikladan samo za karakterizaciju grupe ispitanika.

Da biste postigli određeno povećanje pouzdanosti testa, možete povećati broj ponovnih pokušaja. Evo kako je, na primjer, u eksperimentu pouzdanost testa (bacanje granate od 350 g s trčanjem) rasla s povećanjem broja pokušaja: 1 pokušaj - 0,53, 2 pokušaja - 0,72, 3 pokušaja - 0,78, 4 pokušaja - 0,80, 5 pokušaja - 0,82, 6 pokušaja - 0,84. Iz primjera se može vidjeti da ako se u početku pouzdanost brzo povećava, onda se nakon 3-4 pokušaja povećanje značajno usporava.

S nekoliko ponovljenih pokušaja rezultati se mogu odrediti na različite načine: a) najboljim pokušajem, b) aritmetičkom sredinom, c) medijanom, d) prosjekom dva ili tri najbolja pokušaja, itd. Studije su pokazalo se da je u većini slučajeva najpouzdanija uporaba aritmetičke sredine, medijan je nešto manje pouzdan, a najbolji pokušaj je još manje pouzdan.

Govoreći o pouzdanosti testova, razlikuju se njihova stabilnost (ponovljivost), konzistentnost, ekvivalentnost.

2.4 Stabilnost ispitivanja

Pod stabilnošću testa podrazumijeva se ponovljivost rezultata kada se test ponavlja nakon određenog vremena pod istim uvjetima. Ponovno testiranje se obično naziva ponovni test. Shema za procjenu stabilnosti testa je sljedeća: 1

Ovdje se razlikuju 2 slučaja. Radi se jedan retest kako bi se dobili pouzdani podaci o stanju ispitanika tijekom cijelog vremenskog intervala između testa i retesta (npr. da bi se dobili pouzdani podaci o funkcionalnosti skijaša u lipnju, BMD se mjeri dva puta s intervalom od jednog tjedna). U ovom slučaju važni su točni rezultati ispitivanja, a pouzdanost treba procijeniti pomoću analize varijance.

U drugom slučaju može biti važno samo zadržati redoslijed ispitanika u skupini (ostaje li prvi prvi, zadnji među zadnjima). U ovom slučaju stabilnost se procjenjuje koeficijentom korelacije između testa i ponovnog testa.

Stabilnost testa ovisi o:

vrsta testa

testna populacija,

vremenski interval između testa i ponovnog testa. Na primjer, morfološke karakteristike s malim

vremenski intervali su vrlo stabilni; najmanje stabilni su testovi točnosti pokreta (npr. bacanja u metu).

U odraslih su rezultati ispitivanja stabilniji nego u djece; sportaši su stabilniji od nesportaša.

Povećanjem vremenskog intervala između testa i retestiranja stabilnost testa opada (tablica 3).

2.5 Konzistentnost testa

Konzistentnost testa karakterizira neovisnost rezultata testa o osobnim kvalitetama osobe koja provodi ili ocjenjuje test. "Konzistentnost je određena stupnjem slaganja između rezultata dobivenih na istim ispitanicima od strane različitih eksperimentatora, sudaca, stručnjaka. U ovome slučaju, moguće su dvije opcije:

Osoba koja provodi test samo ocjenjuje njegove rezultate, bez utjecaja na njegovu izvedbu. Na primjer, isti pisani rad različiti ispitivači mogu različito ocjenjivati. Često postoje razlike u procjenama sudaca u gimnastici, umjetničkom klizanju, boksu, ručnim mjerenjima vremena, procjenama elektrokardiograma ili radiografije od strane različitih liječnika itd.

Osoba koja provodi test utječe na rezultate. Na primjer, neki eksperimentatori su uporniji i zahtjevniji od drugih, bolje motiviraju ispitanike. To utječe na rezultate (koji se sami po sebi mogu sasvim objektivno mjeriti).

Dosljednost testa je, u biti, pouzdanost procjene njegovih rezultata kada test provode različite osobe.

1 Umjesto pojma „dosljednost“ često se koristi izraz „objektivnost“. Takva je upotreba riječi nesretna, jer podudarnost rezultata različitih eksperimentatora ili sudaca (stručnjaka) uopće ne ukazuje na njihovu objektivnost. Svi zajedno mogu svjesno ili nesvjesno griješiti, iskrivljujući objektivnu istinu.

2.6 Ekvivalencija ispitivanja

Često je test rezultat odabira iz određenog broja testova iste vrste.

Na primjer, košarkaška bacanja na koš mogu se izvoditi iz različitih kutova, sprintanje se može izvoditi na udaljenosti od recimo 50, 60 ili 100 metara, zgibovi se mogu izvoditi na karikama ili šipki, gornji ili donji hvat, itd.

U takvim slučajevima može se koristiti tzv. metoda paralelnih obrazaca, kada se od ispitanika traži da urade dvije verzije istog testa, a zatim se procjenjuje stupanj podudarnosti rezultata. Shema ispitivanja ovdje je sljedeća:

Koeficijent korelacije izračunat između rezultata ispitivanja naziva se koeficijent ekvivalencije. Stavovi prema ekvivalentnosti testa ovise o konkretnoj situaciji. S jedne strane, ako su dva ili više testova ekvivalentna, njihova kombinirana uporaba povećava pouzdanost procjena; s druge strane, može biti korisno ostaviti samo jedan ekvivalentni test u bateriji - to će pojednostaviti testiranje i samo malo smanjiti informativni sadržaj skupa testova. Rješenje ovog problema ovisi o razlozima kao što su složenost i glomaznost testova, stupanj potrebne točnosti testiranja itd.

Ako su svi testovi uključeni u bilo koji skup testova visoko ekvivalentni, naziva se homogenim. Cijeli ovaj kompleks mjeri jedno svojstvo ljudskih motoričkih sposobnosti. Recimo da je skup koji se sastoji od skokova u dalj iz mjesta, skokova uvis i troskoka vjerojatno homogen. Naprotiv, ako u kompleksu nema ekvivalentnih testova, tada svi testovi uključeni u njega mjere različita svojstva. Takav kompleks nazivamo heterogenim. Primjer heterogene baterije testova: povlačenje na šipci, pretklon (za provjeru fleksibilnosti), trčanje na 1500 m.

2.7 Načini poboljšanja pouzdanosti testa

Pouzdanost testova može se poboljšati do određene mjere:

a) stroža standardizacija testiranja,

b) povećanje broja pokušaja,

c) povećanje broja ocjenjivača (suaca, vještaka) i povećanje dosljednosti njihovih mišljenja,

d) povećanje broja ekvivalentnih testova,

e) bolja motivacija ispitanika.

3. INFORMATIVNI TESTOVI

3.1 Osnovni pojmovi

Informativnost testa je stupanj točnosti s kojim se njime mjeri svojstvo (kvaliteta, sposobnost, karakteristika itd.) za koje se koristi. Informativnost se često naziva i valjanost (od engleskog uaNaNu - valjanost, valjanost, zakonitost). Pretpostavimo da za određivanje razine posebne uvježbanosti snage sprintera – trkača i plivača – žele koristiti sljedeće pokazatelje: 1) karpalnu dinamometriju, 2) snagu plantarne fleksije stopala, 3) snagu ekstenzora ramenog zgloba (ovi mišići). nositi veliki teret pri plivanju kraul) , 4) snaga mišića ekstenzora vrata. Na temelju ovih testova predlaže se upravljanje trenažnim procesom, posebice pronalaženje slabih karika motoričkog aparata i njihovo ciljano jačanje. Jesu li odabrani dobri testovi? Jesu li informativni? Čak i bez provođenja posebnih eksperimenata, može se pretpostaviti da je drugi test vjerojatno informativan za sprintere, treći za plivače, a prvi i četvrti vjerojatno neće pokazati ništa zanimljivo ni za plivače ni za trkače (iako bi se moglo pokazati da biti vrlo koristan u drugim sportovima kao što je hrvanje). U različitim slučajevima, isti testovi mogu imati različitu informativnost.

Pitanje informacijskog sadržaja testa podijeljeno je na 2 posebna pitanja:

Što mjeri ovaj test?

Kako on to točno radi?

Na primjer, je li moguće procijeniti pripremljenost trkača na duge staze prema pokazatelju kao što je maksimalna potrošnja kisika (MOC), i ako jest, s kojim stupnjem točnosti. Drugim riječima, kakav je informativni sadržaj IPC-a među onima koji ostaju? Može li se ovaj test koristiti u postupku kontrole?

Ako se testom utvrđuje (dijagnosticira) stanje sportaša u trenutku pregleda, onda govore o dijagnostičkim informacijama. Ako se na temelju rezultata testiranja želi zaključiti o mogućoj budućoj izvedbi sportaša, test bi trebao imati prediktivne informacije. Test može biti dijagnostički informativan, ali ne i prognostički i obrnuto.

Stupanj informativnosti može se karakterizirati kvantitativno - na temelju eksperimentalnih podataka (tzv. empirijski informativni sadržaj) i kvalitativno - na temelju smislene analize situacije (smislen, odnosno logičan, informativni sadržaj).

3.2 Empirijska informativnost (prvi slučaj - postoji mjerljivi kriterij)

Ideja određivanja empirijske informativnosti je da se rezultati testa uspoređuju s nekim kriterijem. Da biste to učinili, izračunajte koeficijent korelacije između kriterija i testa (takav se koeficijent naziva koeficijent sadržaja informacija i označava se g gk, gdje je I prvo slovo u riječi "test", k - u riječi " kriterij").

Kao kriterij uzima se pokazatelj koji očito i nepobitno odražava svojstvo koje će se mjeriti testom.

Često se događa da postoji dobro definiran kriterij s kojim se predloženi test može usporediti. Primjerice, kada se ocjenjuje posebna pripremljenost sportaša u sportu s objektivno mjerljivim rezultatima, takav kriterij obično je sam rezultat: informativniji je test čija je korelacija sa sportskim rezultatom veća. U slučaju određivanja sadržaja prognostičke informacije, kriterij je pokazatelj čija se prognoza mora provesti (npr. ako se predviđa duljina tijela djeteta, kriterij je duljina njegova tijela u odraslim godinama) .

Najčešće u sportskom mjeriteljstvu kriteriji su:

Sportski rezultat.

Bilo koja kvantitativna karakteristika glavne sportske vježbe (na primjer, duljina koraka u trčanju, snaga odbijanja u skakanju, uspjeh u košarci ispod ploče, serviranje u tenisu ili odbojci, postotak točnih dugih dodavanja u nogometu).

Rezultati drugog testa čija je informativnost dokazana (ovo se radi ako je test-kriterij glomazan i težak i možete odabrati drugi test koji je jednako informativan, ali jednostavniji. Na primjer, umjesto izmjene plina, odredite otkucaji srca). Ovaj konkretan slučaj, kada je kriterij drugi test, naziva se natjecateljska informativnost.

Pripadnost određenoj skupini. Na primjer, možete usporediti članove reprezentacije zemlje, majstore sporta i prvoklasne sportaše; pripadanje jednoj od tih skupina je kriterij. U ovom slučaju koriste se posebne vrste korelacijske analize.

Takozvani kompozitni kriterij, na primjer, zbroj bodova u višeboju. Istodobno, tipovi višeboja i bodovnih tablica mogu biti ili općenito prihvaćeni ili novosastavljeni od strane eksperimentatora (za način na koji se tablice sastavljaju, vidi sljedeće poglavlje). Kompozitni kriterij koristi se kada ne postoji jedinstveni kriterij (npr. ako je zadatak procijeniti opću tjelesnu spremnost, vještinu igrača u sportskim igrama i sl., niti jedan pokazatelj uzet sam po sebi ne može poslužiti kao kriterij).

Primjer određivanja informativnosti istog testa ¦-- brzina trčanja od 30 m u trku za muškarce - prema različitim kriterijima prikazan je u tablici 4.

Pitanje odabira kriterija je, naime, najvažnije u određivanju stvarne vrijednosti i informativnosti testa. Na primjer, ako je zadatak odrediti informacijski sadržaj takvog testa kao što je skok u dalj iz mjesta za sprintere, tada možete odabrati različite kriterije: rezultat u trčanju na 100 metara, duljinu koraka, omjer duljine koraka i noge duljina ili visina itd. Informativnost testa će se u ovom slučaju promijeniti (u navedenom primjeru porasla je s 0,558 za brzinu trčanja na 0,781 za omjer “duljina koraka / duljina noge”).

U sportovima u kojima je nemoguće objektivno mjeriti sportski duh, tu se poteškoću pokušava zaobići uvođenjem umjetnih kriterija. Na primjer, u momčadskim sportovima stručnjaci slažu sve igrače prema njihovoj vještini određenim redoslijedom (tj. prave popise od 20, 50 ili, recimo, 100 najjačih igrača). Mjesto koje sportaš zauzima (kako kažu, njegov rang) smatra se kriterijem s kojim se uspoređuju rezultati testa kako bi se utvrdila njihova informativnost.

Postavlja se pitanje: zašto koristiti testove ako je kriterij poznat? Nije li, primjerice, lakše organizirati kontrolna natjecanja i utvrđivati sportske rezultate nego utvrđivati postignuća na kontrolnim vježbama? Korištenje testova ima sljedeće prednosti:

nije uvijek moguće ili svrhovito utvrditi sportski rezultat (npr. nije moguće često održavati natjecanja u maratonu, zimi je najčešće nemoguće prijaviti rezultat u bacanju koplja, a ljeti u skijaškom trčanju);

sportski rezultat ovisi o mnogim razlozima (čimbenicima), kao što su, na primjer, snaga sportaša, njegova izdržljivost, tehnika itd. Primjenom testova moguće je utvrditi snage i slabosti sportaša, ocijeniti svaki ovih faktora zasebno

3.3 Empirijska informativnost (drugi slučaj - nema jedinstvenog kriterija; faktorska informativnost)

Često se događa da ne postoji jedinstveni kriterij s kojim bi se mogli usporediti rezultati predloženih testova. Pretpostavimo da žele pronaći najinformativnije testove za procjenu snažne pripremljenosti mladih. Što vam je draže: zgibove na šipci ili sklekove na šipkama, čučnjeve s utegom, mrtvo dizanje s utegom ili prijelaz u čučanj iz ležećeg položaja? Što ovdje može biti kriterij za odabir pravog testa?

Ispitanicima možete ponuditi veliki niz različitih testova snage, a zatim među njima odabrati one koji daju najveću korelaciju s rezultatima cijelog kompleksa (uostalom, ne možete sustavno koristiti cijeli kompleks - previše je glomazan i nezgodan) . Ti će testovi biti najinformativniji: dat će informacije o mogućim rezultatima ispitanika za cijeli početni set testova. Ali rezultati u nizu testova nisu izraženi jednim brojem. Moguće je, naravno, oblikovati i nekakav kompozitni kriterij (primjerice, odrediti zbroj bodova na nekoj ljestvici). Međutim, puno je učinkovitiji drugi način koji se temelji na idejama faktorske analize.

Faktorska analiza jedna je od metoda multivarijantne statistike (riječ "multivarijanta" označava da se istovremeno proučava mnogo različitih pokazatelja, npr. rezultati ispitanika u mnogim testovima). Ovo je prilično komplicirana metoda, pa je ovdje preporučljivo ograničiti se na predstavljanje samo njezine glavne ideje.

Faktorska analiza polazi od činjenice da je rezultat bilo kojeg testa rezultat istovremenog djelovanja većeg broja izravno nevidljivih (kako se inače kaže - latentnih) čimbenika. Primjerice, rezultati u trčanju na 100, 800 i 5000 metara ovise o brzinskim osobinama sportaša, njegovoj snazi, izdržljivosti itd. Vrijednost ovih faktora za svaku od udaljenosti nije jednako važna. Ako odaberete dva testa na koja približno u istoj mjeri utječu isti čimbenici, tada će rezultati u tim testovima biti međusobno visoko korelirani (recimo, u trčanju na udaljenostima od 800 i 1000 m). Ako testovi nemaju zajedničke čimbenike ili imaju mali učinak na rezultate, korelacija između ovih testova bit će niska (na primjer, korelacija između rezultata na 100 i 5000 metara). Kada se uzme veliki broj različitih testova i izračunaju korelacijski koeficijenti među njima, tada se faktorskom analizom može utvrditi koliko faktora zajedno djeluje na te testove i koliki je stupanj njihovog doprinosa svakom testu. I tada je lako odabrati testove (ili njihove kombinacije) koji najpreciznije procjenjuju razinu pojedinih čimbenika. Ovo je ideja faktorske informativnosti testova. Sljedeći primjer specifičnog eksperimenta pokazuje kako se to radi.

Zadatak je bio pronaći najinformativnije testove za procjenu opće snažne pripremljenosti studenata sportaša treće – prve kategorije koji se bave različitim sportovima. U tu svrhu ispitano je (N.V. Averkovich, V.M. Zatsiorsky, 1966.) 108 ljudi na 15 testova. Kao rezultat faktorske analize identificirana su tri faktora: 1) snaga gornjih udova, 2) snaga donjih udova, 3) snaga trbušnih mišića i fleksora kuka. Najinformativniji testovi među ispitanima bili su: za prvi faktor - sklekovi, za drugi - skok u dalj iz mjesta, za treći - podizanje ravnih nogu u zgibu i maksimalan broj prijelaza u čučanj iz položaja. ležeći položaj 1 min . Ako se ograničimo na samo jedan test, tada je najinformativniji bio udar silom iz blizine na prečku (procijenjen je broj ponavljanja).

3.4 Empirijska informatizacija u praktičnom radu

U praktičnoj uporabi pokazatelja empirijske informativnosti treba imati na umu da oni vrijede samo u odnosu na one subjekte i uvjete za koje se izračunavaju. Test koji je informativan u skupini početnika može se pokazati potpuno neinformativan ako ga pokušate primijeniti u skupini majstora sporta.

Informativni sadržaj testa nije isti u različitim skupinama. Konkretno, u skupinama koje su homogenijeg sastava, test je obično manje informativan. Ako se odredi informativnost testa na bilo kojoj skupini, a zatim se najjači iz nje uvrste u reprezentaciju, onda će informativnost istog testa u reprezentaciji biti puno manja. Razlozi za to su jasni sa sl. 5: selekcija smanjuje ukupnu varijancu rezultata u skupini i smanjuje vrijednosti koeficijenta korelacije. Na primjer, ako odredimo informativnost takvog testa kao što je IPC kod plivača na 400 m, koji imaju oštro različite rezultate (recimo, od 3,55 do 6,30), tada će koeficijent informativnosti biti vrlo visok (Y 4 d > 0,90); ako ista mjerenja provedemo u skupini plivača s rezultatima od 3,55 do 4,30, broj g u apsolutnoj vrijednosti neće prelaziti 0,4-0,6; ako odredimo isti pokazatelj za najjače plivače na svijetu (3,53>, 5 \u003d 4,00), informativni koeficijent općenito "" može biti jednak nuli: koristeći samo ovaj test, neće biti moguće razlikovati plivače plivanje, recimo, 3,55 i 3,59: i oni i drugi imaju veličinu IPC-a. bit će visoka i otprilike ista.

Koeficijenti informativnosti uvelike ovise o pouzdanosti testa i kriterija. Test niske pouzdanosti uvijek nije jako informativan, stoga nema smisla provjeravati nepouzdane testove za informativni sadržaj. Nedovoljna pouzdanost kriterija također dovodi do smanjenja koeficijenata sadržaja informacija. Međutim, u ovom slučaju bilo bi pogrešno zanemariti test kao neinformativan - uostalom, gornja granica moguće korelacije testa nije ±1, već njegov indeks pouzdanosti. Stoga je potrebno usporediti koeficijent informativnosti s ovim indeksom. Stvarni sadržaj informacija (korigiran za nepouzdanost kriterija) izračunava se formulom:

Tako je u jednom od radova rang sportaša u vaterpolu (rang se smatrao kriterijem majstorstva) utvrđen na temelju ocjena 4 stručnjaka. Pouzdanost (konzistentnost) kriterija, određena pomoću unutarrazrednog koeficijenta korelacije, iznosila je 0,64. Koeficijent informativnosti iznosio je 0,56. Stvarni koeficijent informativnosti (korigiran za nepouzdanost kriterija) jednak je:

Pojam njegove distinktivne sposobnosti usko je povezan s informacijskim sadržajem i pouzdanošću testa, što se podrazumijeva kao minimalna razlika između ispitanika koja se pomoću testa dijagnosticira (ovaj koncept je po značenju sličan konceptu osjetljivosti testa). uređaj). Posebnost testa ovisi o:

Interindividualne varijacije u rezultatima. Na primjer, test kao što je "maksimalni broj ponovljenih bacanja košarkaške lopte u zid s udaljenosti od 4 m u 10 sekundi" dobar je za početnike, ali nije prikladan za kvalificirane košarkaše, jer svi pokazuju približno isti rezultat i postati nerazlučivi . U mnogim slučajevima međupredmetne varijacije (međurazredne varijacije) mogu se povećati povećanjem težine testa. Na primjer, ako se sportašima različitih kvalifikacija zada funkcionalni test koji im je lak (recimo, 20 čučnjeva ili rad na biciklističkom ergometru kapaciteta 200 kgm/min), tada će magnituda fizioloških promjena biti približno ista za sve i bit će nemoguće procijeniti stupanj pripremljenosti. Ako im ponudite težak zadatak, tada će razlike među sportašima postati velike, a prema rezultatima testiranja moći će se suditi o pripremljenosti sportaša.

Pouzdanost (tj. omjer inter- i intra-individualne varijacije) testa i kriterija. Ako rezultati istog ispitanika u skokovima u dalj iz mjesta variraju, recimo, u pre-

slučajeva ± 10 cm, tada, iako se duljina skoka može odrediti s točnošću od ± 1 cm, nemoguće je s uvjerenjem razlikovati subjekte čiji su “pravi” rezultati 315 i 316 cm.

Ne postoji fiksna vrijednost informativnog sadržaja testa, nakon čega se test može smatrati "prikladnim". Ovdje mnogo ovisi o specifičnoj situaciji: željenoj točnosti prognoze, potrebi dobivanja barem nekih dodatnih informacija o sportaš itd. U praksi se za dijagnostiku koriste testovi čija informativnost nije manja od 0,3 Za prognozu je u pravilu potrebna veća informativnost - najmanje 0,6.

Informativnost serije testova je naravno veća od informativnosti jednog testa. Često se događa da je informativni sadržaj jednog jedinog testa prenizak za korištenje ovog testa. Informativnost baterije testova može biti sasvim dovoljna.

Informativna vrijednost testa ne može se uvijek odrediti eksperimentom i matematičkom obradom njegovih rezultata. Na primjer, ako je zadatak izraditi ispitne karte ili teme za diplomske radove (ovo je također vrsta testiranja), potrebno je odabrati ona pitanja koja su najinformativnija, pomoću kojih je moguće najtočnije procijeniti znanja diplomanata i njihovu pripremljenost za praktični rad. Zasad se u takvim slučajevima oslanja samo na logičnu, smislenu analizu situacije.

Ponekad se dogodi da je informativnost testa jasna i bez ikakvih eksperimenata, pogotovo kada je test jednostavno dio radnji koje sportaš izvodi na natjecanju. Eksperimenti jedva da su potrebni da bi se dokazala informativnost takvih pokazatelja kao što su vrijeme okreta u plivanju, brzina na posljednjim koracima trčanja u skokovima u dalj, postotak pogodaka slobodnih bacanja u košarci, kvaliteta isporuke u tenisu ili odbojci.

Međutim, nisu svi takvi testovi jednako informativni. Primjerice, aut u nogometu, iako element igre, teško se može smatrati jednim od najvažnijih pokazatelja vještine nogometaša. Ako postoji mnogo takvih testova i potrebno je odabrati najinformativniji od njih, ne mogu se odreći matematičkih metoda teorije testova.

Svrsishodna analiza informativnog sadržaja testa i njegova eksperimentalna i matematička opravdanost trebaju se nadopunjavati. Nijedan od ovih pristupa, uzet zasebno, nije dovoljan. Konkretno, ako se kao rezultat eksperimenta utvrdi visok koeficijent informativnosti testa, potrebno je provjeriti je li to posljedica tzv. lažne korelacije. Poznato je da se lažne korelacije pojavljuju kada na rezultate oba korelirana obilježja utječe neki treći pokazatelj, koji sam po sebi ne predstavlja

interes. .Primjerice, srednjoškolci mogu pronaći značajnu korelaciju između rezultata u trčanju na 100m i znanja iz geometrije, budući da će oni u prosjeku pokazati veći učinak i u trčanju i u poznavanju geometrije u odnosu na učenike nižih razreda. Vanjski, treći znak koji je uzrokovao pojavu korelacije bila je dob ispitanika. Naravno, istraživač bi pogriješio kad to ne bi primijetio i preporučio ispit iz geometrije kao ispit za trkače na 100 metara.Da ne bi došlo do takvih pogrešaka potrebno je analizirati uzročno-posljedične veze koje uzrokovao korelaciju između kriterija i testa. Posebno je korisno zamisliti što bi se dogodilo kada bi se rezultati na testu poboljšali. Hoće li to dovesti do povećanja rezultata kriterija? U navedenom primjeru to znači: ako učenik bolje poznaje geometriju, hoće li trčati brže od 100 m? Očigledni negativan odgovor dovodi do prirodnog zaključka: poznavanje geometrije ne može poslužiti kao ispit sprinterima. Pronađena korelacija je lažna. Naravno, situacije u stvarnom životu mnogo su kompliciranije od ovog namjerno glupog primjera.

Poseban slučaj smislene informativnosti testova je informativni sadržaj po definiciji. U ovom slučaju, oni se jednostavno dogovore oko toga koje značenje treba staviti u određenu riječ (pojam). Na primjer, kažu: "skok uvis s mjesta karakterizira sposobnost skakanja." Točnije bi bilo reći ovako: "složimo se da skakačnošću nazivamo ono što se mjeri rezultatom skoka uvis s mjesta." Takav međusobni dogovor je nužan, jer sprječava nepotrebne nesporazume (uostalom, netko može razumjeti skačući rezultate u desetom skoku na jednoj nozi, a skok u vis s mjesta smatrati, recimo, testom “eksplozivne” snage nogu). ).

56.0 Standardizacija testova

Standardizacija fitness testova za procjenu ljudske aerobne izvedbe postiže se pridržavanjem sljedećih načela.

Metodologija testiranja trebala bi omogućiti izravno mjerenje ili neizravno izračunavanje maksimalne potrošnje kisika u tijelu (aerobni kapacitet), budući da je ovaj fiziološki pokazatelj kondicije čovjeka najvažniji. Označavat će se simbolom rpax1rrm y 0r i izražavati u mililitrima po kilogramu težine subjekta u minuti (ml/kg-min.).

U osnovi, postupak ispitivanja trebao bi biti isti i za laboratorijska i za terenska mjerenja, međutim:

1. U laboratorijskim uvjetima (u stacionarnim i mobilnim laboratorijima) ljudska aerobna produktivnost može se izravno odrediti pomoću prilično sofisticirane opreme i velikog broja mjerenja.

2. Na terenu se aerobna izvedba procjenjuje neizravno na temelju ograničenog broja fizioloških mjerenja.

Metodologija provođenja testova trebala bi omogućiti usporedbu njihovih rezultata.

Testiranje treba provesti jedan dan i po mogućnosti bez prekida. To će omogućiti primjerenu raspodjelu vremena, opreme, snaga tijekom početnog i ponovljenog testiranja.

Metodologija testiranja treba biti dovoljno fleksibilna da omogući ispitivanje skupina ljudi različitih fizičkih sposobnosti, različite dobi, spola, različitih razina aktivnosti itd.

57.0. Izbor opreme

Svi ovi principi fizioloških ispitivanja mogu se promatrati, prije svega, pod uvjetom pravilnog odabira sljedećih tehničkih sredstava:

ergometar,

biciklistički ergometar,

stepergometar,

potrebna pomoćna oprema koja se može koristiti u bilo kojoj vrsti ispitivanja.

57.1. Traka za trčanje može se koristiti u raznim studijama. Međutim, ovaj uređaj je najskuplji. Čak je i najmanja verzija previše glomazna da bi se široko koristila na terenu. Traka za trčanje mora biti sposobna mijenjati brzine od 3 do (barem) 8 km/h (2-5 mph) i nagib od 0 do 30%. Nagib trake za trčanje definiran je kao postotak okomitog uzgona podijeljen s horizontalnom prijeđenom udaljenosti.

Udaljenost i okomiti uzgon moraju biti izraženi u metrima, brzina u metrima u sekundi (m/s) ili kilometrima na sat (km/h).

57.2. Biciklistički ergometar. Ovaj instrument je jednostavan za korištenje u laboratoriju i na terenu. Prilično je svestran, može obavljati rad različitog intenziteta - od minimalne do maksimalne razine.

Biciklistički ergometar ima mehanički ili električni sustav kočenja. Električni kočioni sustav može se napajati iz vanjskog izvora i iz generatora koji se nalazi na ergometru.

Podesivi mehanički otpor izražava se u kilogramima u minuti (kgm/min) i u vatima. Kilogrami u metrima u minuti pretvaraju se u vate pomoću formule:

1 vat = 6 kgm/min. 2

Veloergometar mora imati pomično fiksirano sjedište tako da se visina njegovog položaja može prilagoditi za svaku pojedinu osobu. Prilikom testiranja sjedalo je postavljeno tako da osoba koja sjedi na njemu može dohvatiti donju pedalu s gotovo potpuno ispruženom nogom. U prosjeku, udaljenost između sjedala i pedale u maksimalno spuštenom položaju trebala bi biti 109% duljine noge ispitanika.

Postoje različiti dizajni biciklističkih ergometara. Međutim, vrsta ergometra ne utječe na rezultate eksperimenta ako naznačeni otpor u vatima ili kilogram metrima u minuti točno odgovara ukupnom vanjskom opterećenju.

Steppergometar. Ovo je relativno jeftin uređaj s podesivom visinom koraka od 0 do 50 cm. Poput biciklističkog ergometra, može se lako koristiti u laboratoriju i na terenu.

Usporedba tri opcije testa. Svaki od ovih instrumenata ima svoje prednosti i nedostatke (ovisno o tome koristi li se u laboratorijima ili na terenu). Obično je pri radu na traci za trčanje vrijednost max1min U 07 nešto veća nego pri radu na biciklističkom ergometru; zauzvrat, pokazatelji biciklističkog ergometra premašuju očitanja na stepergometru.

Razina potrošnje energije subjekata, koji miruju ili obavljaju zadatak svladavanja gravitacije, izravno je proporcionalna njihovoj težini. Stoga vježbe na traci za trčanje i stepergometru stvaraju za sve ispitanike isto relativno radno opterećenje za podizanje (svojeg tijela. - ur.) na zadanu visinu: pri zadanoj brzini i nagibu trake za trčanje, frekvenciji koraka i visini koraka na na stepergometru, visina dizanja tijela bit će - ista (a obavljeni rad je drugačiji. - Pribl. ur.). S druge strane, biciklistički ergometar s fiksnom vrijednošću zadanog opterećenja zahtijeva gotovo jednak utrošak energije, bez obzira na spol i dob ispitanika.

58.0, Opće napomene o metodama ispitivanja

Za primjenu testova na velikim skupinama ljudi potrebne su jednostavne i dugotrajne metode testiranja. Međutim, za detaljnije proučavanje fizioloških karakteristika subjekta potrebna su dublja i napornija ispitivanja. Kako biste dobili veću vrijednost od testova i njihovu fleksibilniju upotrebu, morate pronaći najbolji kompromis između ova dva zahtjeva.

58.1. Intenzitet rada. Testiranje treba započeti malim opterećenjem koje mogu podnijeti najslabiji ispitanici. Procjena adaptivnih sposobnosti kardiovaskularnog i dišnog sustava treba se provoditi u procesu rada s postupno rastućim opterećenjima. Stoga se funkcionalna ograničenja moraju postaviti dovoljno precizno. Praktična razmatranja sugeriraju da je osnovna brzina metabolizma (tj. stopa metabolizma u mirovanju) jedinica mjere za količinu energije potrebnu za izvođenje određene vježbe. Početno opterećenje i njegovi kasniji stupnjevi izraženi su u Meta, umnošcima brzine metabolizma kod osobe koja je u stanju potpunog mirovanja. Fiziološki pokazatelji na kojima se temelji Met su količina kisika (u mililitrima po minuti) koju osoba konzumira u mirovanju ili njegov kalorijski ekvivalent (u kilokalorijama po minuti).

Za kontrolu opterećenja u jedinicama Met ili u ekvivalentnim vrijednostima potrošnje kisika izravno tijekom ispitivanja potrebna je složena elektronička računalna oprema, koja je trenutno još uvijek relativno nedostupna. Stoga je pri određivanju količine kisika potrebne tijelu za izvođenje opterećenja određene vrste i intenziteta praktički zgodno koristiti se empirijskim formulama. Predviđene (temeljene na empirijskim formulama. - ur.) vrijednosti potrošnje kisika pri radu na traci za trčanje - u smislu brzine i nagiba, uz step test - u smislu visine i učestalosti koraka, dobro se slažu s rezultati izravnih mjerenja i mogu se koristiti kao fiziološki ekvivalent fizičkog napora, s kojim su u korelaciji svi fiziološki pokazatelji dobiveni tijekom testiranja.

58.2. Trajanje testova. Želja za skraćivanjem procesa testiranja ne smije biti nauštrb ciljeva i zadataka testa. Prekratki testovi neće dati dovoljno prepoznatljive rezultate, njihova moć razlikovanja bit će mala; predugi testovi aktiviraju u većoj mjeri termoregulacijske mehanizme, što onemogućuje uspostavljanje maksimalne aerobne izvedbe. U preporučenom postupku ispitivanja, svaka razina opterećenja održava se 2 minute. Prosječno vrijeme testa je 10 do 16 minuta.

58.3. Indikacije za prekid ispitivanja. Testiranje se mora prekinuti osim ako:

pulsni tlak stalno pada, unatoč povećanju opterećenja;

sistolički krvni tlak prelazi 240-250 mm Hg. Umjetnost.;

dijastolički krvni tlak raste iznad 125 mm Hg. Umjetnost.;

pojavljuju se simptomi malaksalosti, kao što je sve veća bol u prsima, teška zaduha, povremena klaudikacija;

pojavljuju se klinički znakovi anoksije: bljedilo ili cijanoza lica, vrtoglavica, psihotični fenomeni, nedostatak odgovora na iritaciju;

očitanja elektrokardiograma ukazuju na paroksizmalnu superventrikularnu ili ventrikularnu aritmiju, pojavu ventrikularnih ekstrasistoličkih kompleksa koji se javljaju prije kraja T vala, poremećaje provođenja, osim blage L U blokade, smanjenje /?-5G horizontalnog ili descendentnog tipa za više od 0,3 mV. .;";, -

58.4. Mjere opreza.

Zdravlje subjekta. Prije pregleda ispitanik mora proći liječničku komisiju i dobiti potvrdu da je zdrav. Vrlo je poželjno napraviti elektrokardiogram (barem jedan prsni odvod). Za muškarce starije od 40 godina uzimanje elektrokardiograma je obavezno. Redovito ponavljano mjerenje krvnog tlaka trebalo bi biti sastavni dio cjelokupnog postupka testiranja. Na kraju testiranja ispitanike treba upoznati s mjerama za sprječavanje opasnog nakupljanja krvi u donjim ekstremitetima.

Kontraindikacije. Ispitaniku nije dopušteno polaganje testova u sljedećim slučajevima:

nedostatak dopuštenja liječnika za sudjelovanje u testovima s maksimalnim opterećenjima;

oralna temperatura prelazi 37,5 ° C;

otkucaji srca nakon dugog odmora iznad 100 otkucaja / min;

jasan pad srčane aktivnosti;

slučaj infarkta miokarda ili miokarditisa u zadnja 3 mjeseca; simptomi i indikacije elektrokardiograma koji ukazuju na prisutnost ovih bolesti; znakovi angine;

zarazne bolesti, uključujući prehlade.

Menstruacija nije kontraindikacija za sudjelovanje u testovima. Međutim, u nekim slučajevima preporučljivo je promijeniti raspored njihovog održavanja.

B. STANDARDNI TESTOVI

59.0. Opis glavne metodologije za provođenje standarda

U sve tri vrste vježbi, bez obzira radi li se test s maksimalnim ili submaksimalnim opterećenjem, osnovni postupak testiranja je isti.

Ispitanik dolazi u laboratorij u laganoj sportskoj odjeći i mekim cipelama. U roku od 2 sata. prije početka testa ne smije jesti, piti kavu, pušiti.

Odmor. Testu prethodi odmor od 15 minuta. Za to vrijeme, dok se postavljaju fiziološki mjerni instrumenti, ispitanik udobno sjedi u stolcu.

razdoblje smještaja. Već prvi test bilo kojeg subjekta, kao i svi ponovljeni testovi, dat će prilično pouzdane rezultate ako glavnom testu prethodi kratko razdoblje vježbe s niskim učinkom - razdoblje akomodacije. Traje 3 minute. i služi u sljedeće svrhe:

upoznati ispitanika s opremom i vrstom poslova koje mora obavljati;

preliminarno proučite fiziološki odgovor subjekta na opterećenje od približno 4 Meta, što odgovara brzini otkucaja srca od približno 100 otkucaja / min;

ubrzati prilagodbu tijela na neposredno provođenje samog testa.

Odmor. Nakon razdoblja akomodacije slijedi kratko (2 min.) razdoblje odmora; ispitanik se udobno smjesti na stolcu dok eksperimentator obavlja potrebne tehničke pripreme.

Test. Na početku testa postavlja se opterećenje jednako opterećenju akomodacijskog perioda, a ispitanik izvodi vježbe bez prekida do kraja testa. Svake 2 min. radno opterećenje se povećava za 1 Met.

Testiranje se prekida pod jednim od sljedećih uvjeta:

ispitanik nije u stanju nastaviti zadatak;

postoje znakovi fiziološke dekompenzacije (vidi 58.3);

podaci dobiveni u posljednjoj fazi opterećenja omogućuju ekstrapolaciju maksimalnog aerobnog kapaciteta na temelju uzastopnih fizioloških mjerenja (obavljenih tijekom testiranja. - Pribl. ur.).

59.5. Mjerenja. Maksimalna potrošnja kisika u mililitrima po kilogramu u minuti mjeri se izravno ili izračunava. Metode određivanja potrošnje kisika vrlo su raznolike, kao i dodatne tehnike kojima se analiziraju fiziološke mogućnosti svakog pojedinca. Više o tome bit će riječi kasnije.

59.6. Oporavak. Na kraju eksperimenta, fiziološko promatranje se nastavlja najmanje 3 minute. Subjekt ponovno počiva na stolici, lagano podižući noge.

Bilješka. Opisana tehnika testiranja daje usporedive fiziološke podatke dobivene istim slijedom povećanja opterećenja na traci za trčanje, biciklergometru i stepergometru. Nadalje, postupak testiranja je opisan zasebno za svaki od tri uređaja.

60.0. test na traci za trčanje

Oprema. Traka za trčanje i potrebni dodaci.

Opis. Pažljivo se slijedi osnovna tehnika testiranja opisana u 59.0.

Brzina trake za trčanje s subjektom koji hoda po njoj je 80 m/min (4,8 km/h ili 3 mph). Pri ovoj brzini, energija potrebna za vodoravno kretanje je približno 3 Metha; svako povećanje nagiba od 2,5% dodaje jednu jedinicu početne metaboličke stope, tj. 1 Met utrošku energije. Na kraju prve 2 min. nagib trake za trčanje brzo se povećava na 5%, na kraju sljedeće 2 minute - do 7,5%, zatim na 10%, 12,5% itd. Potpuna shema dana je u tablici. 1.

Slični dokumenti

Provođenje kontrolnih testova pomoću kontrolnih vježbi ili testova radi utvrđivanja spremnosti za tjelesne vježbe. Problem standardizacije testa. Vanjska i unutarnja valjanost testova. Vođenje zapisnika o kontrolnom pregledu.

sažetak, dodan 12.11.2009

Obilježja motoričkih sposobnosti i metodika razvoja gipkosti, izdržljivosti, spretnosti, snage i brzine. Provjera motoričkih sposobnosti učenika na nastavi tjelesnog odgoja. Primjena motoričkih testova u praksi.

diplomski rad, dodan 25.02.2011

Procjena dinamike promjena antropometrijskih podataka kod učenika koji se sustavno bave atletikom i učenika koji se ne bave sportskim sekcijama. Izrada testova za utvrđivanje ukupne tjelesne spremnosti; analiza rezultata.

diplomski rad, dodan 07.07.2015

Glavni pravci korištenja testova, njihova klasifikacija. Testovi za selekciju u hrvanju. Metode ocjenjivanja sportskih postignuća. Iskušavanje posebne izdržljivosti hrvača. Međuodnos testnih pokazatelja s tehničkom vještinom hrvača slobodnog stila.

diplomski rad, dodan 03.03.2012

Procjena posebne izdržljivosti plivača pomoću kontrolnih vježbi. Prilagodljivost glavnih reakcija fizioloških sustava u uvjetima vodenog okoliša. Razvoj principa za ocjenu biomedicinskih pokazatelja koji se koriste u testiranju plivača.

članak, dodan 03.08.2009

Promatranje zdrave energije kao temeljnog principa zdravlja. Upoznavanje sa značajkama gimnastičkih vježbi prema qigong sustavu. Odabir skupa vježbi za domaću zadaću. Sastavljanje testova za dobivanje zaključaka o obavljenom poslu.

diplomski rad, dodan 07.07.2015

Sportsko mjeriteljstvo - proučavanje fizikalnih veličina u tjelesnom odgoju i sportu. Osnove mjerenja, teorija ispitivanja, ocjenjivanja i norme. Metode dobivanja informacija o kvantitativnoj ocjeni kvalitete pokazatelja; kvalimetrija. Elementi matematičke statistike.

prezentacija, dodano 12.02.2012

Bit i značenje kontrole u tjelesnom odgoju i njezine vrste. Provjera i vrednovanje motoričkih znanja i sposobnosti stečenih na nastavi tjelesne i zdravstvene kulture. Testiranje razine tjelesne spremnosti. Praćenje funkcionalnog stanja učenika.

seminarski rad, dodan 06.06.2014

Izračunavanje apsolutnih i relativnih pogrešaka mjerenja. Prevođenje rezultata testa u bodove pomoću regresijske i proporcionalne ljestvice. Rangiranje rezultata ispitivanja. Promjene mjesta u skupini u odnosu na prethodne procjene.

kontrolni rad, dodano 11.02.2013

Način motoričke aktivnosti. Uloga čimbenika koji određuju fizičku izvedbu nogometaša u različitim fazama dugotrajnog treninga. Vrste ergogenih sredstava. Metodologija provođenja testova za određivanje razine tjelesne sposobnosti.

Ključna pitanja: Test kao mjerni alat. Osnovne teorije ispitivanja. Funkcije, mogućnosti i ograničenja ispitivanja. Korištenje testova u ocjenjivanju osoblja. Prednosti i nedostaci korištenja testova. Oblici i vrste ispitnih zadataka. Tehnologija izrade zadataka. Procjena kvalitete testa. Pouzdanost i valjanost. Testirajte razvoj softvera. 2

Test kao mjerno sredstvo Osnovni pojmovi u testologiji: mjerenje, test, sadržaj i oblik zadataka, pouzdanost i valjanost rezultata mjerenja. Osim toga, testologija koristi koncepte statističke znanosti kao što su uzorkovanje i opća populacija, prosjeci, varijacije, korelacija, regresija itd. 4

Ispitni zadatak je didaktički i tehnološki djelotvorna jedinica kontrolnog gradiva, dio ispita koji udovoljava zahtjevima čistoće sadržaja (ili jednodimenzionalnosti), sadržajne i logičke ispravnosti, ispravnosti oblika, prihvatljivosti geometrijske slike predmeta. zadatak. 6

Tradicionalni test je standardizirana metoda za dijagnosticiranje razine i strukture pripremljenosti. U takvom testu svi ispitanici odgovaraju na iste zadatke, u isto vrijeme, pod istim uvjetima i uz ista pravila vrednovanja odgovora. Da biste postigli cilj testiranja, možete kreirati beskonačan broj testova, a svi oni mogu zadovoljiti postizanje zadatka. 8

Profesiogram (od lat. Professio specijalnost + Gramma record) sustav je obilježja koja opisuju određenu profesiju, a uključuje i popis normi i zahtjeva za zaposlenika po ovoj profesiji ili specijalnosti. Konkretno, profesiogram može sadržavati popis psiholoških karakteristika koje moraju ispunjavati predstavnici određenih profesionalnih skupina. 9

Osnovna teorija testiranja Prvi znanstveni radovi o teoriji testiranja pojavili su se početkom dvadesetog stoljeća, na razmeđi psihologije, sociologije, pedagogije i drugih tzv. bihevioralnih znanosti. Strani psiholozi ovu znanost nazivaju psihometrijom (Psychometrika), a učitelji – pedagoškim mjerenjem (Educational measurement). Nezamagljeno ideologijom i politikom, tumačenje naziva "testologija" jednostavno je i transparentno: znanost o testovima. 10

Prva faza - prapovijest - od antike do kraja 19. stoljeća, kada su rašireni predznanstveni oblici kontrole znanja i sposobnosti; drugo razdoblje, klasično, trajalo je od početka 20-ih do kraja 60-ih godina, tijekom kojeg je stvorena klasična teorija testova; treće razdoblje - tehnološko - koje počinje 70-ih godina prošlog stoljeća - vrijeme razvoja metoda za adaptivno testiranje i učenje, metodologije za učinkovitu izradu testova i testnih zadataka za parametarsko ocjenjivanje ispitanika u smislu izmjerene latentne kvalitete. jedanaest

Funkcije, mogućnosti i ograničenja testiranja Testovi koji se koriste u selekciji namijenjeni su dobivanju psihološkog portreta kandidata, procjeni njegovih sposobnosti, te stručnih znanja i vještina. Testovi omogućuju usporedbu kandidata međusobno ili sa standardima, odnosno idealnog kandidata. Testovi se koriste za mjerenje kvaliteta osobe nužnih za učinkovito obavljanje posla. Neki testovi su osmišljeni na način da poslodavac sam provodi test i izračunava rezultate. Drugi zahtijevaju usluge iskusnih konzultanata kako bi osigurali njihovu ispravnu primjenu. 12

Ograničenja korištenja testova vezana su - uz njihovu skupu primjenu; - s prikladnošću za procjenu sposobnosti osobe; - testovi su uspješniji u predviđanju uspjeha u radu koji sadrži kratkoročne profesionalne zadatke, a nisu baš zgodni u slučajevima kada zadaci koji se rješavaju na poslu traju nekoliko dana ili tjedana. 13

2. Korištenu terminologiju treba odabrati na temelju specifične ciljne publike. Suvišne članke ili članke koji sadrže dva ili više pitanja također treba isključiti, jer ponekad zbunjuju ispitanika i otežavaju tumačenje. 17

3. Da biste ispunili sve ove zahtjeve, trebali biste proći kroz cijelu banku pitanja članak po članak i analizirati svrhu svakog od njih. Na primjer, ako se razvija test za mjerenje analitičke sposobnosti računovođa pripravnika, vrijedi razmotriti što u tom slučaju znači "analitička sposobnost". 18

5. Kada se odaberu pitanja i formati bodovanja, treba ih pretvoriti u format prilagođen korisniku, s jasno napisanim uputama i uzorcima pitanja; tako da ispitanici u potpunosti razumiju što se od njih traži. 20

6. Vrlo često, u ovoj fazi razvoja, u test je uključeno više pitanja nego što je potrebno. Prema nekim procjenama, tri puta više nego što će ostati u konačnom testu ili sustavu mjerenja. Tada bi početna točka bila testiranje testa koji se razvija na relativno velikom uzorku postojećih radnika kako bi se osiguralo da su sva pitanja lako razumljiva. 21

7. Testovi za utvrđivanje znanja obično počinju jednostavnim pitanjima koja postupno postaju sve složenija prema kraju. Kada su testovi namijenjeni mjerenju društvenih stavova i karakteristika ličnosti, može biti korisno izmjenjivati negativno i pozitivno formulirane članke kako bi se izbjegli loše osmišljeni odgovori. 22

8. Posljednji korak je primjena testa na velikom reprezentativnom uzorku kako bi se utvrdila učinkovitost, valjanost i standardi valjanosti prije nego što se može koristiti kao alat za odabir. Nadalje, mora se utvrditi pravednost testa kako bi se osiguralo da ne diskriminira nijednu podskupinu stanovništva (npr. etničke razlike). 23

Procjena kvalitete testa Da bi metode selekcije bile dovoljno učinkovite, moraju biti pouzdane, valjane i pouzdane. Pouzdanost metode odabira karakterizira njezina nepodložnost sustavnim pogreškama u mjerenju, odnosno njezina dosljednost u različitim uvjetima. 24

U praksi se pouzdanost u donošenju prosudbi postiže usporedbom rezultata dva ili više sličnih testova provedenih u različite dane. Drugi način povećanja pouzdanosti je usporedba rezultata nekoliko alternativnih metoda odabira (npr. test i intervju). Ako su rezultati slični ili isti, mogu se smatrati točnima. 25

Pouzdanost znači da će provedena mjerenja dati isti rezultat kao i prethodna, odnosno da na rezultate procjene ne utječu vanjski čimbenici. Valjanost znači da metoda mjeri točno ono što je namijenjena učiniti. Najveća moguća točnost informacija dobivenih posebno razvijenim metodama u znanstvenim istraživanjima ograničena je tehničkim čimbenicima i ne prelazi 0,8. 26

U praksi odabira osoblja primjećuje se da se pouzdanost različitih metoda procjene nalazi u intervalima: 0,1 - 0,2 - tradicionalni intervju; 0,2 - 0,3 - preporuke; 0,3 - 0,5 - stručni testovi; 0,5 - 0,6 - strukturirani intervju, intervju temeljen na kompetencijama; 0,5 - 0,7 - kognitivni testovi i testovi osobnosti; 0,6 - 0,7 - pristup temeljen na kompetencijama (ocjenjivanje - centar). 27

Valjanost se odnosi na stupanj točnosti s kojim dati rezultat, metoda ili kriterij "predviđa" buduću izvedbu osobe koja se testira. Valjanost metoda odnosi se na zaključke izvedene iz postupka, a ne na sam postupak. To jest, metoda odabira može sama po sebi biti pouzdana, ali ne odgovara određenom zadatku: mjeriti ne ono što je potrebno u ovom slučaju. 28

Softver za izradu testova U domaćoj praksi predstavljeni su različiti integrirani programi s modulom "Psihodijagnostika", na primjer, program "1 C: Upravljanje plaćama i osobljem 8.0" s modulom "Psihodijagnostika", razvijen u suradnji sa skupinom nastavnika Odsjek za psihologiju ličnosti i opću psihologiju Psihološkog fakulteta Moskovskog državnog sveučilišta M. V. Lomonosova pod vodstvom dr. psih. znanosti, prof. A. N. Guseva. Simulator obuke za razvoj sustava za procjenu osoblja i prilagodbu metoda testiranja Psihološkog fakulteta TSU, također razvijen na temelju "1 C: Enterprise 8.2" od strane Personnel Soft. 29

Literatura: Odabir i zapošljavanje: tehnologije testiranja i evaluacije / Dominic Cooper, Ivan T. Robertson, Gordon Tinline. - M., izdavačka kuća "Vershina", - 156 str. Psihološka podrška profesionalnoj djelatnosti: teorija i praksa / Ed. prof. G. S. Nikiforova. - Sankt Peterburg: Govor, - 816 str. trideset