Biografije Karakteristike Analiza

Karakteristike kontrolnog testiranja u fizičkom vaspitanju. Osnovne odredbe ispitivanja

IZVJEŠTAJ

student 137 gr. Ivanova I.

o provjeri efikasnosti metodologije obuke
koristeći metode matematičke statistike

Odjeljci izvještaja se sastavljaju u skladu sa uzorcima datim u ovom priručniku na kraju svake faze igre. Položeni izvještaji se čuvaju na Odsjeku za biomehaniku do konsultacija prije ispita. Studenti koji se nisu prijavili za obavljeni rad i nisu predali svesku sa izvještajem nastavniku ne mogu pristupiti ispitu iz sportske metrologije.


I stage poslovna igra
Kontrola i mjerenje u sportu

Cilj:

1. Upoznati se sa teorijskim osnovama kontrole i mjerenja u sportu i fizičkom vaspitanju.

2. Steći veštine merenja pokazatelja brzinskih kvaliteta kod sportista.

1. Kontrola u fizičkom
obrazovanje i sport

Fizičko vaspitanje i sportski trening nije spontan, već kontrolisan proces. U svakom trenutku, osoba se nalazi u određenom fizičkom stanju, koje je determinisano uglavnom zdravstvenim stanjem (odgovaranje vitalnih znakova normi, stepenom otpornosti organizma na štetne iznenadne uticaje), građom i stanjem fizičkih funkcija. .

Preporučljivo je kontrolirati fizičko stanje osobe mijenjajući ga u pravom smjeru. Ovo upravljanje se provodi putem fizičkog vaspitanja i sporta, koji posebno uključuje fizičke vježbe.

Čini se samo da se učitelj (ili trener) snalazi psihičko stanje, utičući na ponašanje sportiste, tj. nuđenje određenih fizičkih vežbi, kao i kontrola ispravnosti njihovog izvođenja i dobijenih rezultata. U stvarnosti, ponašanje sportiste ne kontroliše trener, već sam sportista. U toku sportskog treninga vrši se uticaj na samoupravni sistem (ljudski organizam). Individualne razlike u stanju sportista ne daju poverenje da će isti uticaj izazvati isti odgovor. Stoga je relevantno pitanje povratnih informacija: informacije o stanju sportiste koje trener dobija tokom kontrole trenažnog procesa.

Kontrola u fizičkom vaspitanju i sportu zasniva se na mjerenju pokazatelja, izboru najznačajnijih i njihovoj matematičkoj obradi.

Upravljanje trenažnim procesom uključuje tri faze:

1) prikupljanje informacija;

2) njegovu analizu;

3) donošenje odluka (planiranje).

Prikupljanje informacija obično se vrši tokom složene kontrole, čiji su objekti:

1) takmičarska aktivnost;

2) trenažna opterećenja;

3) stanje sportiste.



Postoje (V.A. Zaporozhanov) tri tipa stanja sportiste, u zavisnosti od trajanja intervala potrebnog za prelazak iz jednog stanja u drugo.

1. prekretnica(trajno) stanje. Sačuvano relativno dugo- sedmicama ili mjesecima. Kompleksna karakteristika stadijumsko stanje sportiste, koje odražava njegovu sposobnost da pokaže sportska dostignuća, naziva se pripremljenost, a stanje optimalne (najbolje za dati ciklus treninga) pripremljenosti naziva se sportska odeća. Očigledno je da je u roku od jednog ili nekoliko dana nemoguće postići stanje sportske forme ili je izgubiti.

2. Current stanje. Promijenjen pod utjecajem jednog ili nekoliko klasa. Često su posledice učešća na takmičenjima ili nastupa u nekom od časova trenažni rad potrajati nekoliko dana. U ovom slučaju, sportaš obično bilježi i štetne događaje (na primjer, bol u mišićima) i pozitivne (na primjer, stanje povećane performanse). Takve promjene se nazivaju efekat odloženog treninga.

Trenutno stanje sportiste određuje prirodu narednih treninga i veličinu opterećenja u njima. poseban slučaj trenutna drzava, koju karakteriše spremnost za izvođenje takmičarske vežbe u narednim danima sa rezultatom blizu maksimalnog, tzv. trenutnu spremnost.

3. Operativni stanje. Promenjeno pod uticajem jedno izvođenje fizička vježba i privremena je (na primjer, umor uzrokovan jednim pretrčavanjem udaljenosti; privremeno povećanje performansi nakon zagrijavanja). Operativno stanje sportiste se menja tokom treninga i treba ga uzeti u obzir prilikom planiranja intervala odmora između serija, repriza, kada se odlučuje da li je dodatno zagrevanje prikladno, itd. Poseban slučaj operativnog stanja, koji karakteriše neposredna spremnost za izvođenje takmičarske vežbe sa rezultatom blizu maksimalnog, naziva se operativnu spremnost.

U skladu sa gornjom klasifikacijom postoje tri glavne vrste kontrole stanja sportiste:

1) scenska kontrola. Njegova svrha je da proceni fazno stanje (spremnost) sportiste;

2) kontrola struje. Njegov glavni zadatak je da utvrdi dnevne (trenutne) fluktuacije u stanju sportiste;

3) operativna kontrola. Njegova svrha je ekspresna procjena stanja sportiste u ovom trenutku.

Mjerenje ili ispitivanje koje se provodi radi utvrđivanja stanja ili sposobnosti sportiste naziva se test. Postupak mjerenja ili ispitivanja naziva se testiranje.

Svaki test uključuje mjerenje. Ali ne služi svako mjerenje kao test. Kao ispitivanja mogu se koristiti samo oni koji zadovoljavaju sljedeće metrološke kriterije. zahtjevi:

2) standardizacija;

3) dostupnost rejting sistema;

4) pouzdanost i informativnost (faktor kvaliteta) testova;

5) vrsta upravljanja (etapno, trenutno ili operativno).

Test zasnovan na motoričkim zadacima naziva se motorički test. Postoje tri grupe motoričkih testova:

1. Kontrolne vježbe, izvodeći koje sportista dobija zadatak da pokaže maksimalan rezultat. Rezultat testa je motoričko postignuće. Na primjer, vrijeme koje je potrebno sportisti da trči trku na 100 metara.

2. Standardni funkcionalni testovi, tokom kojih se zadatak, isti za sve, dozira ili prema količini obavljenog posla, ili prema veličini fizioloških promjena. Rezultat testa su fiziološki ili biohemijski parametri tokom standardnog rada ili motorička dostignuća tokom standardna vrijednost fiziološke promjene. Na primjer, postotak povećanja otkucaja srca nakon 20 čučnjeva ili brzina kojom sportista trči sa fiksnim otkucajem srca od 160 otkucaja u minuti.

3. Maksimalni funkcionalni testovi, tokom kojih sportista mora pokazati maksimalan rezultat. Rezultat testa su fiziološki ili biohemijski pokazatelji pri maksimalnom radu. Na primjer, maksimalna potrošnja kisika ili maksimalni dug kisika.

Visokokvalitetno testiranje zahtijeva poznavanje teorije mjerenja.

Osnove teorije testova 1. Osnovni koncepti teorije testova 2. Pouzdanost testova i načini za njeno određivanje

test pitanja 1. Šta se zove test? 2. Koji su zahtjevi za test? 3. Koji se testovi nazivaju autentičnim? 4. Šta se zove pouzdanost testa? 5. Navedite razloge koji uzrokuju varijacije u rezultatima prilikom ponovnog testiranja. 6. Koja je razlika između varijacije unutar razreda i varijacije među razredima? 7. Kako praktično utvrditi pouzdanost testa? 8. Koja je razlika između konzistentnosti testa i stabilnosti? 9. Koja je ekvivalencija testova? 10. Šta je homogeni skup testova? 11. Šta je heterogeni testni paket? 12. Načini poboljšanja pouzdanosti testova.

Test je mjerenje ili ispitivanje koje se provodi kako bi se utvrdilo stanje ili sposobnosti osobe. Ne mogu se sva mjerenja koristiti kao testovi, već samo ona koja ispunjavaju posebne zahtjeve. To uključuje: 1. standardizaciju (procedura i uslovi ispitivanja moraju biti isti u svim slučajevima primjene testa); 2. pouzdanost; 3. informativni; 4. dostupnost sistema rejtinga.

Zahtjevi testa: n Informativan - stepen tačnosti s kojim mjeri svojstvo (kvalitet, sposobnost, karakteristika) za koje se koristi. n Pouzdanost - stepen slaganja rezultata kada se isti ljudi više puta testiraju pod istim uslovima. Konzistentnost - ( različiti ljudi, ali isti uređaji i isti uslovi). n n Standardni uslovi - (isti uslovi za ponovljena merenja). n Prisustvo sistema ocjenjivanja - (prelazak na sistem ocjenjivanja. Kao u školi 5 -4 -3. . .).

Testovi koji ispunjavaju zahtjeve pouzdanosti i informativnosti nazivaju se dobrim ili autentičnim (grč. authentico - na pouzdan način)

Proces testiranja se naziva testiranje; rezultirajuće mjerenje numerička vrijednost- rezultat testa (ili rezultat testa). Na primjer, trčanje na 100 m je test, procedura za vođenje trka i mjerenje vremena je testiranje, vrijeme trčanja je rezultat testa.

Testovi zasnovani na motoričkim zadacima nazivaju se motorički ili motorički testovi. Njihovi rezultati mogu biti ili motorička postignuća (vrijeme prelaska udaljenosti, broj ponavljanja, pređena udaljenost, itd.), ili fiziološki i biohemijski pokazatelji.

Ponekad se koristi ne jedan, već više testova koji imaju jedan krajnji cilj (na primjer, procjena stanja sportiste u takmičarskom periodu treninga). Takva grupa testova naziva se kompleks ili baterija testova.

Isti test, primijenjen na iste subjekte, trebao bi dati identične rezultate pod istim uslovima (osim ako se sami subjekti nisu promijenili). Međutim, uz najstrožu standardizaciju i preciznu opremu, rezultati ispitivanja uvijek donekle variraju. Na primjer, istraživač, koji je upravo pokazao rezultat od 215 k. G u testu dinamometrije kičme, kada se ponovi, pokazuje samo 190 k. G.

Pouzdanost testova i načini njenog utvrđivanja Pouzdanost testa je stepen slaganja između rezultata pri ponovnom testiranju istih ljudi (ili drugih objekata) pod istim uslovima.

Varijacija rezultata tokom ponovljenog testiranja naziva se intra-individualno, ili unutar grupe, ili unutar klase. Četiri glavna razloga uzrokuju ovu varijaciju: 1. Promjene u stanju ispitanika (umor, vježbanje, „učenje“, promjene u motivaciji, koncentraciji, itd.). 2. Nekontrolisane promene spoljašnjih uslova i opreme (temperatura, vetar, vlažnost, napon u mreži, prisustvo neovlašćenih lica i sl.), odnosno sve ono što se kombinuje pod pojmom „ slučajna greška mjerenja“.

Četiri glavna razloga uzrokuju ovu varijaciju: 3. Promjena u stanju osobe koja provodi ili ocjenjuje test (i, naravno, zamjena jednog eksperimentatora ili sudije drugim). 4. Nesavršenost testa (postoje testovi koji su očigledno nepouzdani. Na primjer, ako ispitanici izvode slobodna bacanja u košarkaški koš, onda čak i košarkaš koji ima visok procenat pogađa, može slučajno pogriješiti pri prvim bacanjima).

Koncept pravog rezultata testa je apstrakcija (ne može se mjeriti iskustvom). Stoga se moraju koristiti indirektne metode. Najpoželjniji za procjenu pouzdanosti analiza varijanse nakon čega slijedi izračunavanje koeficijenata unutarklasne korelacije. Analiza varijanse vam omogućava da dekomponujete varijacije rezultata testa zabeleženih u eksperimentu na komponente zbog uticaja pojedinačnih faktora.

Ako registrujete rezultate proučavanog u bilo kojem testu, ponovite ovaj test u različitim danima, i svaki dan nekoliko pokušaja, periodično mijenjajući eksperimentatore, tada će biti varijacija: a) od subjekta do subjekta; n b) iz dana u dan; n c) od eksperimentatora do eksperimentatora; n d) od pokušaja do pokušaja. Analiza varijanse omogućava izolaciju i evaluaciju ovih varijacija. n

Dakle, da bi se praktično procijenila pouzdanost testa, potrebno je, n prvo, izvršiti analizu varijanse, n drugo, izračunati koeficijent unutarklasne korelacije (koeficijent pouzdanosti).

Govoreći o pouzdanosti testova, potrebno je razlikovati njihovu stabilnost (ponovljivost), konzistentnost i ekvivalentnost. n n Stabilnost testa se odnosi na ponovljivost rezultata kada se ponovi nakon toga određeno vrijeme pod istim uslovima. Ponovno testiranje se obično naziva ponovnim testiranjem. Konzistentnost testa karakteriše nezavisnost rezultata testa od ličnih kvaliteta osobe koja sprovodi ili ocenjuje test.

Ako su svi testovi uključeni u bilo koji skup testova visoko ekvivalentni, naziva se homogenim. Cijeli ovaj kompleks mjeri jedno svojstvo motoričkih sposobnosti čovjeka (npr. kompleks koji se sastoji od skokova sa mjesta u dužinu, gore i trostruko; procjenjuje se nivo razvijenosti brzinsko-snažnih kvaliteta). Ako u kompleksu ne postoje ekvivalentni testovi, odnosno testovi uključeni u njega mjere različita svojstva, onda se naziva heterogenim (na primjer, kompleks koji se sastoji od stojeće dinamometrije, skoka Abalakova, trčanja na 100 metara).

Pouzdanost testova može se donekle poboljšati: n n n a) strožom standardizacijom ispitivanja; b) povećanje broja pokušaja; c) povećanje broja ocjenjivača (sudija, eksperimenata) i povećanje konzistentnosti njihovih mišljenja; d) povećanje broja ekvivalentnih testova; e) bolja motivacija istraživao.

Prva komponenta, teorija testiranja, sadrži opis statističkih modela za obradu dijagnostičkih podataka. Sadrži modele za analizu odgovora u testnim stavkama i modele za izračunavanje ukupnih rezultata testa. Mellenberg (1980, 1990) je to nazvao "psihometrijom". Klasična teorija testa, moderna teorija testa (ili model analize odgovora na test - IRT) i model


uzorci zadataka čine tri najviše važan tip modeli teorije ispitivanja. Predmet razmatranja psihodijagnostike su prva dva modela.

Klasična teorija testa. Na osnovu ove teorije razvijena je većina intelektualnih testova i testova ličnosti. Centralni koncept Ova teorija je koncept "pouzdanosti". Pouzdanost se odnosi na konzistentnost rezultata kada se ponovo procijene. U referentnim priručnicima, ovaj koncept se obično predstavlja vrlo kratko, a zatim daje Detaljan opis aparat za matematičku statistiku. U ovom uvodnom poglavlju predstavićemo sažet opis glavnog značenja navedenog pojma. U klasičnoj teoriji ispitivanja, pouzdanost se podrazumijeva kao ponovljivost rezultata nekoliko mjernih postupaka (uglavnom mjerenja pomoću testova). Koncept pouzdanosti uključuje izračunavanje greške mjerenja. Rezultati dobijeni tokom procesa testiranja mogu se predstaviti kao zbir pravog rezultata i greške merenja:

Xi = Ti+ Ej

gdje Xi je procjena dobijenih rezultata, Ti je pravi rezultat, i Ej- greška mjerenja.

Ocjena dobijenih rezultata je, po pravilu, broj tačnih odgovora na testne zadatke. Pravi rezultat se može posmatrati kao prava procjena u platonističkom smislu (Gulliksen, 1950). Koncept očekivanih rezultata je široko rasprostranjen, tj. ideje o rezultatima koji se mogu dobiti kao rezultat velikog broja ponavljanja postupaka mjerenja (Lord & Novich, 1968). Ali provođenje istog postupka evaluacije sa jednom osobom nije moguće. Stoga je potrebno tražiti druga rješenja problema (Witlman, 1988).

U okviru ovog koncepta, napravljene su neke pretpostavke o pravim rezultatima i greškama mjerenja. Potonji su prihvaćeni kao nezavisni faktor, što je, naravno, sasvim obrazovana pretpostavka, budući da nasumične fluktuacije u rezultatima ne daju kovarijanse: r EE =0.

Pretpostavlja se da ne postoji korelacija između pravih rezultata i grešaka mjerenja: rEE=0.


Ukupna greška je 0, jer prosek se uzima kao prava procjena aritmetička vrijednost:

Ove pretpostavke nas konačno vode do dobro poznate definicije pouzdanosti kao omjera pravog rezultata i totalna varijansa ili izraz: 1 minus omjer u čijem je brojiocu greška mjerenja, a u nazivniku ukupna varijansa:


, OR

Iz ove formule za određivanje pouzdanosti dobijamo da je varijansa greške S 2 (E) jednaka je ukupnoj varijansi u broju slučajeva (1 - r XX"); tako se standardna greška mjerenja određuje formulom:

Poslije teorijsko utemeljenje pouzdanosti i njenih derivata, potrebno je odrediti indeks pouzdanosti pojedinog testa. Postoje praktične procedure za procenu pouzdanosti testova, kao što je korišćenje zamenljivih obrazaca (paralelni testovi), podela stavki na dva dela, ponovno testiranje i merenje unutrašnje konzistentnosti. Svaki direktorij sadrži indekse konzistentnosti rezultata testa:

r XX ’ \u003d r (x 1, x 2)

gdje rXX' je koeficijent stabilnosti, i x 1 i x2 - rezultati dva mjerenja.

Koncept pouzdanosti zamjenjivih oblika uveo je i razvio Gulliksen (1950). Ovaj postupak je prilično naporan, jer je povezan s potrebom za stvaranjem paralelnog niza zadataka.

r XX ’ \u003d r (x 1, x 2)

gdje rXX' je omjer ekvivalencije, i x 1 i x2 - dva paralelna testa.

Sljedeća procedura - podjela glavnog testa na dva dijela A i B - je lakša za korištenje. Rezultati dobijeni iz oba dijela testa su u korelaciji. Koristeći Spearman-Brown formulu, procjenjuje se pouzdanost testa u cjelini:

gdje su A i B dva paralelna dijela testa.

Sljedeća metoda je utvrđivanje interne konzistentnosti izvršavanja testnih zadataka. Ova metoda se zasniva na određivanju kovarijansi pojedinačnih stavki. Sg je varijansa nasumično odabrane stavke, a Sgh je kovarijansa dvije nasumično odabrane stavke. Koeficijent koji se najčešće koristi za određivanje interne konzistencije je Cronbachov "alfa". Formula se također koristi KR20 i λ-2(lambda-2).

U klasičnom konceptu pouzdanosti definisane su greške merenja koje se javljaju kako u procesu testiranja, tako iu procesu posmatranja. Izvori ovih grešaka su različiti: mogu biti osobine ličnosti i karakteristike uslova testiranja i samih zadataka testa. Postoji specifične metode proračuni greške. Znamo da se naša zapažanja mogu pokazati pogrešnim, naši metodološki alati su nesavršeni na isti način na koji su sami ljudi nesavršeni. (Kako se ne sjetiti Shakespearea: "Nepouzdan si ti koji se zoveš čovjek"). Činjenica da su greške mjerenja objašnjene i objašnjene u klasičnoj teoriji testa je važna pozitivna točka.

Klasična teorija testova ima niz značajnih karakteristika koje se mogu smatrati njenim nedostacima. Neke od ovih karakteristika su navedene u priručniku, ali se njihov značaj (sa svakodnevnog gledišta) rijetko ističe, niti se napominje da ih sa teorijske ili metodološke tačke gledišta treba smatrati nedostacima.

Prvo. Klasična teorija testova i koncept pouzdanosti fokusirani su na izračunavanje ukupnih indikatora testa, koji su rezultat zbrajanja ocjena dobijenih u pojedinačnim zadacima. Da, na poslu


Sekunda. Faktor pouzdanosti uključuje procjenu veličine raspršenosti mjerenih indikatora. Iz toga slijedi da će koeficijent pouzdanosti biti niži ako je (pod istim uvjetima) uzorak homogeniji. Ne postoji jedinstveni koeficijent interne konzistentnosti testnih zadataka, ovaj koeficijent je uvijek „kontekstualan“. Crocker i Algina (1986), na primjer, nude specijalnu formulu "ispravke homogenog uzorka" dizajniranu za najviše i najniže rezultate koje dobiju ispitanici. Za dijagnostičara je važno znati karakteristike varijacija okvir za uzorkovanje, inače neće moći koristiti interne koeficijente konzistentnosti navedene u priručniku za ovaj test.

Treće. Fenomen redukcije na aritmetičku sredinu logična je posljedica klasičnog koncepta pouzdanosti. Ako rezultat na testu varira (tj. nije dovoljno pouzdan), onda je moguće da će, kada se postupak ponovi, ispitanici sa niskim ocjenama dobiti više visoke rezultate i obrnuto, subjekti sa visokim rezultatom su niski. Ovaj artefakt postupka mjerenja ne može se zamijeniti za istinsku promjenu ili manifestaciju razvojnih procesa. Ali u isto vrijeme, nije ih lako razlikovati, jer mogućnost promjene u toku razvoja nikada se ne može isključiti. Za potpunu sigurnost potrebno je poređenje sa kontrolnom grupom.

Četvrta karakteristika testova dizajniranih u skladu sa principima klasične teorije je prisustvo normativnih podataka. Poznavanje normi testa omogućava istraživaču da adekvatno interpretira rezultate testa. Izvan normi, rezultati testova su besmisleni. Izrada testnih normi je prilično skup poduhvat, jer psiholog mora dobiti rezultate testa na reprezentativnom uzorku.

2 Ya ter Laak

Ako govorimo o nedostacima klasičnog koncepta pouzdanosti, onda je prikladno navesti izjavu Si-tsme (1992, str. 123-125). On napominje da je prva i glavna pretpostavka klasične teorije testa da se rezultati testa povinuju principu intervala. Međutim, ne postoje studije koje bi podržale ovu pretpostavku. U stvari, ovo je "mjerenje prema proizvoljno utvrđenom pravilu". Ova karakteristika stavlja klasičnu teoriju testa u nepovoljan položaj u poređenju sa skalama za merenje položaja i, naravno, u poređenju sa modernom teorijom ispitivanja. Mnoge metode analize podataka (analiza varijanse. regresiona analiza, korelacione i faktorske analize) zasnivaju se na pretpostavci postojanja intervalne skale. Međutim, nema čvrste temelje. Razmotrite skalu istinitih rezultata kao skalu vrijednosti psihološke karakteristike(npr. aritmetička sposobnost, inteligencija, neuroticizam) može se samo pretpostaviti.

Druga primjedba odnosi se na činjenicu da rezultati testa nisu apsolutni pokazatelji jedne ili druge psihološke karakteristike testirane osobe, već se moraju smatrati samo kao rezultati izvođenja određenog testa. Dva testa mogu tvrditi da mjere iste psihološke karakteristike (npr. inteligencija, verbalne sposobnosti, ekstraverzija), ali to ne znači da su ova dva testa ekvivalentna i da imaju iste sposobnosti. Poređenje performansi dvije osobe koje su testirane različitim testovima je netačno. Isto važi i za polaganje dva različita testa od strane jednog predmeta. Treća primjedba se odnosi na pretpostavku da je standardna greška mjerenja ista za bilo koji nivo mjerljive sposobnosti pojedinca. Međutim, ne postoji empirijska potvrda ove pretpostavke. Tako, na primjer, ne postoji garancija da će ispitanik sa dobrim matematičkim sposobnostima, kada radi sa relativno jednostavnim aritmetičkim testom, dobiti visoke ocjene. U ovom slučaju, veća je vjerovatnoća da će osoba sa niskim ili prosječnim sposobnostima dobiti visoku ocjenu.

U okviru savremene teorije testa ili teorije analize odgovora, testovi sadrže opis velikog


broj modela mogućih odgovora ispitanika. Ovi modeli se razlikuju po osnovnim pretpostavkama i zahtjevima za podacima. Rasch model se često smatra sinonimom za teorije analize odgovora na stavke (1RT). Zapravo, ovo je samo jedan od modela. Formula predstavljena u njoj za opisivanje karakteristične krivulje podešavanja g je sljedeća:

gdje g- zaseban zadatak test; exp- eksponencijalna funkcija (nelinearna zavisnost); δ ("delta") - nivo težine testa.

Druge testne stavke kao što su h, takođe dobijaju svoje karakteristične krive. Ispunjenost uslova δh >δg (g znači da h- više težak zadatak. Dakle, za bilo koju vrijednost indikatora Θ ("theta" - latentna svojstva sposobnosti testiranog) vjerovatnoća uspješnog završetka zadatka h manje. Ovaj model se naziva strogim, jer je očigledno da je sa niskim stepenom izraženosti osobine verovatnoća izvršenja zadatka blizu nule. U ovom modelu nema mjesta nagađanjima i pretpostavkama. Za stavke sa izborom, nema potrebe za pretpostavkama o vjerovatnoći uspjeha. Osim toga, ovaj model je strog u smislu da svi testni zadaci moraju imati istu diskriminativnu sposobnost (visoka diskriminacija se ogleda u strmini krivulje; ovdje je moguće izgraditi Guttmannu skalu prema kojoj u svakoj tački od karakteristična kriva, vjerovatnoća izvršenja zadatka varira od O do 1). Zbog ovog uslova ne mogu se svi zadaci uključiti u testove kreirane na osnovu Rasch modela.

Postoji nekoliko varijanti ovog modela (npr. Birnbaura, 1968, Vidi Lord & Novik). Omogućava postojanje zadataka sa različitim diskriminatornim

sposobnost.

Holandski istraživač Mokken (1971) razvio je dva modela za analizu odgovora na ispitne zadatke, čiji zahtjevi nisu tako strogi kao u Rasch modelu, pa su stoga možda i realističniji. Kao glavni uslov

Viya Mokken iznosi stav da karakteristična krivulja zadatka treba pratiti monotono, bez prekida. Svi testni zadaci imaju za cilj proučavanje istih psiholoških karakteristika koje treba mjeriti in. Svaki oblik ove zavisnosti je dozvoljen, sve dok se ne prekine. Dakle, oblik karakteristične krivulje nije određen nijednom specifičnom funkcijom. Ova "sloboda" vam omogućava da koristite više testnih zadataka, a nivo procene nije viši od normalnog.

Metodologija modela testnih odgovora (IRT) razlikuje se od većine eksperimentalnih i korelacione studije. Matematički model je dizajniran za proučavanje bihejvioralnih, kognitivnih, emocionalnih karakteristika, kao i razvojnih fenomena. Ovi fenomeni koji se razmatraju često su ograničeni na odgovore na zadatak, što je navelo Mellenberga (1990) da IRT teoriju nazove "mini-teorijom o mini-ponašanju". Rezultati istraživanja se u određenoj mjeri mogu predstaviti kao krive konzistentnosti, posebno u slučajevima kada ne postoje teorijske ideje o proučavanim karakteristikama. Do sada nam je na raspolaganju samo nekoliko testova inteligencije, sposobnosti i testova ličnosti kreiranih na osnovu brojnih modela teorije IRT-a. Varijante Rasch modela se češće koriste u razvoju testova postignuća (Verhelst, 1993), dok su Mokken modeli pogodniji za razvojne fenomene (vidi i Poglavlje 6).

Odgovor ispitanika na ispitne predmete je osnovna jedinica IRT modela. Vrsta odgovora određena je stepenom izraženosti proučavane karakteristike kod osobe. Takva karakteristika mogu biti, na primjer, aritmetičke ili prostorne sposobnosti. U većini slučajeva radi se o jednom ili drugom aspektu inteligencije, karakteristikama postignuća ili osobinama ličnosti. Pretpostavlja se da postoji nelinearna veza između položaja ove osobe u određenom rasponu proučavanih karakteristika i vjerovatnoće uspješnog izvršenja određenog zadatka. Nelinearnost ove zavisnosti je u izvesnom smislu intuitivna. Poznate fraze "Svaki početak je težak" (sporo ne-


početak linije) i "Postati svetac nije tako lako", znače da se dalja kultivacija nakon postizanja određenog nivo ide teško. Kriva se polako približava, ali gotovo nikada ne dostiže stopu uspješnosti od 100%.

Neki modeli prilično su u suprotnosti s našim intuitivnim razumijevanjem. Uzmimo ovaj primjer. Osoba sa proizvoljnim karakterističnim indeksom ozbiljnosti jednakim 1,5 ima 60 posto vjerovatnoće uspjeha u izvršenju zadatka. To je u suprotnosti s našim intuitivnim shvaćanjem takve situacije, jer možete ili uspješno završiti zadatak, ili se uopće ne nositi s njim. Uzmimo ovaj primjer: 100 puta osoba pokuša uzeti visinu od 1m 50 cm.Uspjeh ga prati 60 puta, tj. ima 60 posto uspješnosti.

Za procjenu ozbiljnosti neke karakteristike potrebna su najmanje dva zadatka. Rasch model uključuje određivanje ozbiljnosti karakteristika, bez obzira na težinu zadatka. Ovo je takođe protiv naše intuicije: pretpostavimo da osoba ima 80 posto šanse da skoči iznad 1,30 m, vjerovatnoća da će skočiti iznad 1,70 m. Dakle, bez obzira na vrijednost nezavisne varijable (visine), može se procijeniti sposobnost osoba da skoči visoko.

Postoji oko 50 IRT modela (Goldstein & Wood, 1989.) Postoje mnoge nelinearne funkcije koje opisuju (objašnjavaju) vjerovatnoću uspjeha u izvršavanju zadatka ili grupe zadataka. Zahtjevi i ograničenja ovih modela su različiti, a te se razlike mogu pronaći poređenjem Rasch modela i Mokken skale. Zahtjevi za ove modele uključuju:

1) potrebu da se odredi karakteristika koja se proučava i procijeni položaj osobe u opsegu ove osobine;

2) procenu redosleda zadataka;

3) provjera određenih modela. U psihometriji su razvijene mnoge procedure za testiranje modela.

Neke referentne knjige tretiraju IRT teoriju kao oblik analize ispitnih zadataka (vidi, na primjer,

Croker & Algina, J 986). Može se, međutim, tvrditi da je IRT teorija "mini teorija o mini ponašanju". Zagovornici teorije IRT primjećuju da ako su koncepti (modeli) srednjeg nivoa nesavršeni, šta se onda može reći o složenijim konstruktima u psihologiji?

Klasična i moderna teorija ispitivanja. Ljudi ne mogu a da ne upoređuju stvari koje izgledaju skoro isto. (Možda se svakodnevni ekvivalent psihometrije uglavnom sastoji u poređenju ljudi prema značajnim karakteristikama i izboru između njih). Svaka od predstavljenih teorija – i teorija mjerenja grešaka u procjeni i matematički model odgovora na ispitne stavke – ima svoje pristalice (Goldstein & Wood, 1986).

IRT modeli ne izazivaju zamjerke da se radi o "procjeni zasnovanoj na pravilima", za razliku od klasične teorije testova. IRT model je fokusiran na analizu procijenjenih karakteristika. Karakteristike ličnosti i karakteristike zadatka procjenjuju se pomoću skala (rednih ili intervalnih). Štaviše, moguće je uporediti pokazatelje učinka različitih testova koji imaju za cilj proučavanje sličnih karakteristika. Konačno, pouzdanost nije ista za svaku vrijednost na skali, a prosječne vrijednosti su obično pouzdanije od vrijednosti na početku i na kraju skale. Dakle, IRT modeli su teoretski superiorni. Postoje i razlike u praktična upotreba moderna teorija testa i klasična teorija (Sijstma, 1992, str. 127-130). Moderna teorija testova je složenija od klasične teorije, pa je rjeđe koriste nespecijalisti. Štaviše, IRT postavlja posebne zahtjeve za zadatke. To znači da stavke treba isključiti iz testa ako ne ispunjavaju zahtjeve modela. Ovo pravilo se dalje primjenjuje na one zadatke koji su bili dio široko korištenih testova, izgrađenih na principima klasične teorije. Test postaje kraći i stoga manje pouzdan.

IRT nudi matematičke modele za proučavanje stvarnih pojava. Modeli bi nam trebali pomoći da razumijemo ključne aspekte ovih pojava. Međutim, ovdje postoji veliki teorijski problem. Modeli se mogu uzeti u obzir


kao pristup proučavanju složene stvarnosti u kojoj živimo. Ali model i stvarnost nisu ista stvar. Prema pesimističkom gledištu, moguće je modelirati samo pojedinačne (i, štaviše, ne najzanimljivije) tipove ponašanja. Možete naići i na konstataciju da stvarnost uopće nije predmet modeliranja, jer. ne poštuje samo zakone uzroka i posledice. U najboljem slučaju, moguće je modelirati pojedinačne (idealne) fenomene ponašanja. Postoji još jedan, optimističniji, pogled na mogućnosti modeliranja. Gore navedeni stav blokira mogućnost dubokog razumijevanja prirode fenomena ljudskog ponašanja. Primjena jednog ili drugog modela otvara neka opća, fundamentalna pitanja. Po našem mišljenju, nema sumnje da je IRT koncept teorijski i tehnički superiorniji od klasične teorije testova.

Praktična svrha testova, bez obzira na teorijsku osnovu da su kreirani, jeste da se odrede značajni kriterijumi i na njihovoj osnovi utvrde karakteristike određenih psiholoških konstrukata. Ima li IRT model i u tom pogledu prednosti? Moguće je da testovi zasnovani na ovom modelu ne daju preciznije predviđanje od testova zasnovanih na klasičnoj teoriji, a moguće je da njihov doprinos razvoju psiholoških konstrukata nije značajniji. Dijagnostika preferira kriterije koji su direktno povezani pojedinac, institucija ili zajednica. Naučno superiorniji model ne „ipso facto” definiše prikladniji kriterijum i donekle je ograničen u objašnjavanju naučnih konstrukata. Očigledno će se nastaviti razvoj testova zasnovanih na klasičnoj teoriji, ali će se istovremeno kreirati novi IRT modeli koji se primjenjuju na studiju. više psiholoških fenomena.

U klasičnoj teoriji testova razlikuju se koncepti "pouzdanosti" i "valjanosti". Rezultati ispitivanja moraju biti pouzdani, tj. rezultati inicijalnog i ponovnog testiranja trebaju biti konzistentni. osim toga,

* ipso facto(lak) - samo po sebi (cca. prev.).

rezultati bi trebali biti bez (koliko je moguće) grešaka u procjeni. Prisustvo valjanosti je jedan od uslova za dobijene rezultate. Istovremeno, pouzdanost se smatra neophodnom, ali ne još dovoljno stanje validnost testa.

Koncept valjanosti podrazumijeva da se dobijeni rezultati odnose na nešto važno u praktičnom ili teorijskom smislu. Zaključci izvučeni iz test ocjene, mora biti važeći. Najčešće se govori o dvije vrste valjanosti: prediktivnoj (kriterijumskoj) i konstruktivnoj. Postoje i druge vrste valjanosti (vidi Poglavlje 3). Osim toga, valjanost se može odrediti iu slučaju kvazi-eksperimenata (Cook & Campbell, 1976, Cook & Shadish, 1994). Međutim, glavni tip valjanosti je i dalje prediktivna valjanost, koja se podrazumijeva kao sposobnost predviđanja nečeg značajnog o budućem ponašanju iz rezultata testa, kao i mogućnost dubljeg razumijevanja jednog ili drugog psihološka svojstva ili kvaliteta.

Prikazani tipovi validnosti razmatrani su u svakom priručniku i praćeni su opisom metoda za analizu validnosti testa. Faktorska analiza je pogodnija za određivanje validacije konstrukta, dok se jednačine linearne regresije koriste za analizu prediktivne valjanosti. Određene karakteristike (uspešnost, efikasnost terapije) mogu se predvideti na osnovu jednog ili više indikatora, napola naučenih u radu sa intelektualnim ili testove ličnosti. Tehnike obrade podataka kao što su korelacija, regresija, analiza varijanse, analiza parcijalnih korelacija i varijansi služe za određivanje prediktivne valjanosti testa.

Često se opisuje i validnost sadržaja. Pretpostavlja se da svi zadaci i zadaci testa treba da pripadaju određenoj oblasti (mentalna svojstva, ponašanje itd.). Koncept valjanosti sadržaja karakteriše usklađenost svakog testnog zadatka sa mjerenom površinom. Valjanost sadržaja se ponekad smatra dijelom pouzdanosti ili "generalizacije" (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Međutim, kada


Prilikom odabira zadataka za testove postignuća u određenoj predmetnoj oblasti važno je obratiti pažnju i na pravila za uključivanje zadataka u test.

U klasičnoj teoriji testova, pouzdanost i valjanost se smatraju relativno nezavisnim jedna od druge. Ali postoji još jedno razumijevanje odnosa između ovih pojmova. Moderna teorija testovi se zasnivaju na primeni modela. Parametri se procjenjuju unutar nekog modela. Ako zadatak ne ispunjava zahtjeve modela, tada se u okviru ovog modela prepoznaje kao nevažeći. Provjera valjanosti konstrukcije dio je validacije samog modela. Ova validacija se prvenstveno odnosi na testiranje postojanja jednodimenzionalne latentne osobine od interesa sa poznatim karakteristikama skale. Bodovi na skali se, naravno, mogu koristiti za definisanje odgovarajućih kriterijuma i mogu biti u korelaciji sa rezultatima iz drugih konstrukata kako bi se pružile informacije o konvergentnoj i divergentnoj validnosti konstrukta.

Psihodijagnostika je analogna jeziku, opisana kao jedinstvo četiri komponente predstavljene na tri nivoa. Prva komponenta, teorija testa, analogna je sintaksi, gramatici jezika. Generirajuća (generativna) gramatika je, s jedne strane, duhovit model, s druge strane, sistem koji poštuje pravila. Uz ova pravila zasnovana na jednostavnim afirmativni prijedlozi kompleks su izgrađeni. U isto vrijeme, međutim, ovaj model ostavlja po strani opis kako je organiziran komunikacijski proces (šta se prenosi, a šta percipira), te u koje svrhe se provodi. Da biste ovo razumjeli, potrebno je dodatno znanje. Isto se može reći i za teoriju testova: ona je neophodna u psihodijagnostici, ali nije u stanju da objasni šta psihodijagnostičar radi i koji su mu ciljevi.

1.3.2. Psihološke teorije i psihološke konstrukcije

Psihodijagnostika je uvijek dijagnoza nečeg specifičnog: lične karakteristike, ponašanje, razmišljanje, emocije. Testovi su dizajnirani da procijene individualne razlike. Postoji nekoliko koncepata

individualne razlike, od kojih svaka ima svoje karakteristične karakteristike. Ako se prizna da psihodijagnostika nije ograničena samo na procjenu individualnih razlika, onda druge teorije postaju bitne za psihodijagnostiku. Primjer je procjena razlika u procesima mentalnog razvoja i razlika u društvenom okruženju. Iako procjena individualnih razlika nije neizostavan atribut psihodijagnostike, ipak postoje određene tradicije istraživanja u ovoj oblasti. Psihodijagnostika je započela procjenom razlika u inteligenciji. Glavni zadatak testova bio je "utvrđivanje nasljednog prijenosa genija" (Gallon) ili odabir djece za obuku (Binet, Simon). Mjerenje IQ-a dobilo je teorijsko razumijevanje i praktični razvoj u radovima Spearmana (Velika Britanija) i Thurstonea (SAD). Raymond B. Cattell je učinio sličnu stvar za procjenu karakteristika ličnosti. Psihodijagnostika postaje neraskidivo povezana sa teorijama i idejama o individualnim razlikama u postignućima (procena marginalnih sposobnosti) i oblicima ponašanja (nivo tipičnog funkcionisanja). Ova tradicija je i danas na snazi. AT nastavna sredstva Razlike u socijalnom okruženju se u psihodijagnostici mnogo rjeđe procjenjuju u odnosu na razmatranje karakteristika samih razvojnih procesa. Ne postoji razumno objašnjenje za ovo. S jedne strane, dijagnostika nije ograničena na određene teorije i koncepte. S druge strane, njemu su potrebne teorije, jer se upravo u njima utvrđuje dijagnostički sadržaj (tj. "šta" se dijagnosticira). Tako se, na primjer, inteligencija može smatrati kao opšte karakteristike, i kao osnova za mnoštvo sposobnosti nezavisnih jedna od druge. Ako psihodijagnostika pokušava „pobjeći“ od jedne ili druge teorije, tada je osnova psihodijagnostičkog procesa predstavljanje zdrav razum. Istraživanje koristi razne načine analiza podataka, i opšta logika istraživanje određuje izbor određenog matematičkog modela i određuje strukturu korištenih psiholoških koncepata. Takve metode matematičke statistike


ki, poput analize varijanse, regresione analize, faktorska analiza, brojanje korelacija ukazuje na postojanje linearne zavisnosti. U slučaju pogrešne primjene ovih metoda, one "dovode" svoju strukturu do primljenih podataka i korištenih konstrukcija.

Ideje o razlikama u društvenom okruženju io razvoju ličnosti gotovo da nisu uticale na psihodijagnostiku. Udžbenici (vidjeti, na primjer, Murphy & Davidshofer, 1988) raspravljaju klasična teorija testira i razmatra relevantne metode statističke obrade, opisuje poznati testovi, govori o upotrebi psihodijagnostike u praksi: u psihologiji upravljanja, u odabiru kadrova, u procjeni psiholoških karakteristika osobe.

Teorije individualnih razlika (kao i ideje o razlikama između društvenom okruženju i o mentalnom razvoju) slični su proučavanju semantike jezika. Ovo je proučavanje i suštine, i sadržaja i značenja. Značenja su strukturirana na određeni način (kao psihološki konstrukti), na primjer, sličnošću ili kontrastom (analogija, konvergencija, divergencija).

1.3.3. Psihološki testovi i druga metodološka sredstva

Treća komponenta predložene šeme su testovi, procedure i metodološka sredstva pomoću kojih se prikupljaju informacije o karakteristikama ličnosti. Drene i Siitsma (1990, str. 31) definiraju testove na sljedeći način: „Psihološki test se smatra klasifikacijom prema određeni sistem ili kao postupak mjerenja koji vam omogućava da donesete određeni sud o jednoj ili više empirijski identificiranih ili teorijski potkrijepljenih karakteristika određenog aspekta ljudskog ponašanja (izvan situacije testiranja). U ovom slučaju se razmatra odgovor ispitanika na određeni broj pažljivo odabranih stimulusa, a dobijeni odgovori se upoređuju sa normama testa.

Dijagnostika zahtijeva testove i tehnike za prikupljanje pouzdanih, tačnih i valjanih informacija o funkcijama

i karakteristične osobine ličnosti, o razmišljanju, emocijama i ljudskom ponašanju. Pored razvoja testnih procedura, ova komponenta takođe uključuje sledeća pitanja: kako se kreiraju testovi, kako se formulišu i biraju zadaci, kako se odvija proces testiranja, koji su zahtevi za uslove testiranja, kako se greške merenja uzimaju u obzir, kako se izračunavaju i tumače rezultati testa.

U procesu izrade testova razlikuju se racionalne i empirijske strategije. Primena racionalne strategije počinje definisanjem osnovnih pojmova (npr. koncepti inteligencije, ekstraverzije), a u skladu sa tim idejama se formulišu test zadaci. Primjer takve strategije je koncept analize aspekta (teorija faseta) Guttman (1957, 1968, 1978). Prvo se određuju različiti aspekti glavnih konstrukcija, zatim se odabiru zadaci i zadaci na način da se svaki od ovih aspekata uzme u obzir. Druga strategija je da se zadaci biraju na empirijskoj osnovi. Na primjer, ako bi istraživač pokušao napraviti test profesionalnog interesa koji bi razlikovao medicinske stručnjake od inženjera, onda bi postupak bio ovakav. Obje grupe ispitanika moraju odgovoriti na sve stavke testa, a one stavke u odgovorima kod kojih su utvrđene statistički značajne razlike ulaze u konačnu verziju testa. Ako, na primjer, postoje razlike među grupama u odgovorima na izjavu „Volim da pecam“, onda ova izjava postaje element testa. Glavna poenta ove knjige je da je test povezan s konceptualnom ili taksonomskom teorijom koja definira ove karakteristike.

Svrha testa je obično definisana u uputstvima za njegovu upotrebu. Test bi trebao biti standardiziran tako da može mjeriti razlike između ljudi, a ne između uslova testiranja. Postoje, međutim, odstupanja od standardizacije u procedurama koje se nazivaju "testiranje granica" (testiranje granica) i "testovi potencijala učenja" (testovi potencijala učenja). Pod ovim uslovima, ispitaniku se pomaže u procesu


testiranje, a zatim procijeniti učinak takvog postupka na rezultat. Obračun bodova za odgovore na zadatke je objektivan, tj. izvršeno u skladu sa standardnom procedurom. Interpretacija dobijenih rezultata je takođe strogo definisana i vrši se na osnovu normi ispitivanja.

Treća komponenta psihodijagnostike – psihološki testovi, alati, procedure – sadrži određene zadatke, koji su najmanje jedinice psihodijagnostike iu tom smislu zadaci su slični fonemima jezika. Broj mogućih kombinacija fonema je ograničen. Samo određene fonemske strukture mogu formirati riječi i rečenice koje pružaju informacije slušaocu. Također itest zadataka: samo u određenoj kombinaciji jedno s drugim mogu postati efikasan alat procjene odgovarajućeg konstrukta.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Dobar posao na stranicu">

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

1. OSNOVNI POJMOVI

Test je mjerenje ili ispitivanje koje se provodi kako bi se utvrdilo stanje ili sposobnost sportiste. Proces testiranja se naziva testiranje: numerička vrijednost dobivena kao rezultat mjerenja je rezultat testa (ili rezultat testa). Na primjer, trčanje na 100m je test, procedura za vođenje trka i mjerenje vremena je testiranje, vrijeme trčanja je rezultat testa.

Testovi zasnovani na motoričkim zadacima nazivaju se motoričkim (ili motoričkim) testovima. U ovim testovima kao rezultati mogu djelovati ili motorička postignuća (vrijeme prelaska udaljenosti, broj ponavljanja, pređena udaljenost, itd.) ili fiziološki i biohemijski pokazatelji. U zavisnosti od toga, kao i od zadatka sa kojim se ispitanik suočava, razlikuju se tri grupe motoričkih testova (tabela A).

Tabela A. Vrste motoričkih testova.

Naziv testa

Zadatak za sportistu

Rezultati testa

Kontrolne vježbe

motoričko postignuće

Trčanje 1500m, vrijeme trčanja

Standardni funkcionalni testovi

Isto za sve, dozirano ili: a) količinom obavljenog posla, ili: b) veličinom fizioloških promjena

Fiziološki ili biohemijski indikatori pri standardnom radu Motorički indikatori pri standardnoj vrijednosti fizioloških pomaka

Registracija otkucaja srca pri standardnom radu od 1000 km/min Brzina trčanja pri pulsu od 160 otkucaja/min, PVC test (170)

Maksimalna funkcionalna ispitivanja

Prikaži maksimalan rezultat

Fiziološki ili biohemijski parametri

Određivanje maksimalnog duga kisika ili maksimalne potrošnje kisika

Ponekad se koristi ne jedan, već više testova koji imaju jedan krajnji cilj (na primjer, procjena stanja sportiste u takmičarskom periodu treninga). Takva grupa se zove kompleks ili baterija testova. Ne mogu se sva mjerenja koristiti kao testovi. Da bi to učinili, moraju ispuniti posebne zahtjeve. To uključuje: 1) pouzdanost testa; 2) informativnost testa; 3) prisustvo sistema ocenjivanja (videti - sledeće poglavlje); 4) standardizacija - postupak i uslovi ispitivanja treba da budu isti u svim slučajevima primene testa. Testovi koji ispunjavaju zahtjeve pouzdanosti i informativnosti nazivaju se dobri ili autentični testovi.

2. POUZDANOST TESTOVA

2.1 Koncept pouzdanosti ispitivanja

fizičko testiranje na traci za trčanje

Pouzdanost testova se odnosi na stepen slaganja rezultata pri ponovnom testiranju istih ljudi (ili drugih objekata) pod istim uslovima. U idealnom slučaju, isti test, primijenjen na iste subjekte pod istim uslovima, trebao bi dati iste rezultate. Međutim, čak i uz najstrožu standardizaciju testova i preciznu opremu, rezultati ispitivanja uvijek donekle variraju. Na primjer, sportista koji je upravo stisnuo 55 kg na ručnom dinamometru pokazat će samo 50 kg za nekoliko minuta. Takva varijacija se naziva intra-individualna ili (da koristimo opštiju terminologiju matematičke statistike) unutar klase. Za to postoje četiri glavna razloga:

promjena stanja ispitanika (umor, vježba, učenje, promjena motivacije, koncentracija itd.);

nekontrolisane promene spoljašnjih uslova i opreme (temperatura i vlažnost, napon u električnoj mreži, prisustvo neovlašćenih lica, vetar i sl.);

promjena u stanju osobe koja provodi ili ocjenjuje test, zamjena jednog eksperimentatora ili sudije drugim;

nesavršenost testa (postoje testovi koji su notorno nepouzdani, na primjer, slobodna bacanja na košarkaški koš prije prvog promašaja; čak i sportaš s visokim postotkom pogodaka može slučajno pogriješiti pri prvim bacanjima).

Sljedeći pojednostavljeni primjer pomoći će razumjeti ideju o metodama koje se koriste za procjenu pouzdanosti testova. Recimo da želimo da uporedimo rezultate u skoku u dalj iz mesta dva takmičara u dva pokušaja. Ako želite izvući tačne zaključke, ne biste trebali biti ograničeni samo na registraciju najbolji rezultati. Pretpostavimo da rezultati svakog od sportista variraju unutar ± 10 cm od srednja veličina i iznose 220 ± 10 cm (tj. 210 i 230 cm) i 320 ± 10 cm (tj. 310 i 330 cm). U ovom slučaju, zaključak će, naravno, biti potpuno nedvosmislen: drugi sportaš je superiorniji od prvog. Razlika između rezultata (320 cm - 220 cm = 100 cm) je jasno veća od slučajnih fluktuacija (±10 cm). Mnogo manje sigurno

Rice. 1. Omjer među- i unutar-klasne varijacije pri visokoj (vrh) i niskoj (donji) pouzdanosti.

Kratki vertikalni potezi - podaci pojedinačnih pokušaja, X i A"2, X 3 - prosječni rezultati tri ispitanika

zaključak je da li će, uz istu unutarrazrednu varijaciju (jednaku ±10 cm), razlika između ispitanika (međurazredna varijacija) biti mala. Recimo da će prosječne vrijednosti biti jednake 220 cm (u jednom pokušaju 210 cm, u drugom 230 cm) i 222 (212 i 232 cm). Tada se može dogoditi, na primjer, da u prvom pokušaju prvi atletičar skoči 230 cm, a drugi - samo 212, te se stvara utisak da je prvi znatno jači od drugog.

Iz primjera se može vidjeti da nije od primarnog značaja unutarklasna varijabilnost sama po sebi, već njen odnos sa međuklasnim razlikama. Ista varijacija unutar klase daje različitu pouzdanost kada različite razlike između razreda (u konkretnom slučaju predmeti, sl. 1).

Teorija pouzdanosti testa proizlazi iz činjenice da je rezultat bilo kojeg mjerenja izvršenog na osobi X (- je zbir dvije vrijednosti:

X^Xoo + Xe, (1)

gdje je X x takozvani pravi rezultat koji žele popraviti;

X e je greška uzrokovana nekontroliranom promjenom stanja subjekta, koju unosi mjerni uređaj, itd.

Po definiciji, pravi rezultat se shvata kao prosečna vrednost X ^ na beskonačno veliki brojevi posmatranja pod istim uslovima (dakle, na X i stavite znak beskonačnosti oo).

Ako su greške slučajne (njihov zbir je nula, a u različitim pokušajima ne zavise jedna od druge), onda iz matematičke statistike slijedi:

O/ = Ooo T<З е,

tj. varijansa rezultata registrovanih u eksperimentu (st / 2) jednaka je zbiru varijansi istinitih rezultata ((Xm 2) i grešaka (0 e 2).

Ooo 2 karakterizira idealiziranu (tj. bez grešaka) međuklasnu varijaciju, a e 2 karakterizira varijabilnost unutar klase. Uticaj e 2 mijenja distribuciju rezultata testa (slika 2).

Po definiciji, koeficijent pouzdanosti (Hz) jednak je omjeru prave varijanse i varijanse zabilježene u eksperimentu:

Drugim riječima, rn je jednostavno proporcija prave varijacije u varijaciji koja je registrirana u eksperimentu.

Osim koeficijenta pouzdanosti, koristi se i indeks pouzdanosti:

koji se smatra teorijskim koeficijentom korelacije snimljenih testnih vrijednosti sa pravim. Oni također koriste koncept standardne greške pouzdanosti, koja se podrazumijeva kao standardna devijacija snimljenih rezultata testa (X () od regresione linije koja povezuje vrijednost X g sa pravim rezultatima (X") - sl. 3 .

2.2 Procjena pouzdanosti na osnovu eksperimentalnih podataka

Koncept pravog rezultata testa je apstrakcija. Motika se ne može eksperimentalno izmjeriti (na kraju krajeva, nemoguće je u stvarnosti izvršiti beskonačno veliki broj promatranja pod istim uvjetima). Stoga se moraju koristiti indirektne metode.

Za ocjenu pouzdanosti najpoželjnija je analiza varijanse sa naknadnim izračunavanjem tzv. unutarklasnih koeficijenata korelacije.

Analiza varijanse, kao što je poznato, omogućava da se varijacija rezultata testa zabeleženih u eksperimentu razloži na komponente usled uticaja pojedinačnih faktora. Na primjer, ako registrujete rezultate testiranih subjekata u bilo kojem testu, ponavljajući ovaj test različitim danima, i svaki dan napravite nekoliko pokušaja, povremeno mijenjajući eksperimentatore, tada će doći do varijacija:

a) od subjekta do subjekta (interindividualne varijacije),

b) dan po dan

c) od eksperimentatora do eksperimentatora,

d) pokušaj za pokušajem.

Analiza varijanse omogućava da se izoluju i procijene varijacije uzrokovane ovim faktorima.

Pojednostavljeni primjer pokazuje kako se to radi. Pretpostavimo da je 5 ispitanika izmjerilo rezultate dva pokušaja (k = 5, n = 2)

Rezultati analize varijanse (vidjeti tok matematičke statistike, kao i Dodatak 1. prvom dijelu knjige) dati su u tradicionalnom obliku u tabeli. 2.

tabela 2

Pouzdanost se procjenjuje korištenjem tzv. unutarklasnog koeficijenta korelacije:

gdje je r "u koeficijent korelacije unutar klase (koeficijent pouzdanosti, koji je, da bi se razlikovao od uobičajenog koeficijenta korelacije (r), označen s dodatnim prostim (r") \\

n je broj pokušaja korištenih u testu;

n" je broj pokušaja za koje se vrši procjena pouzdanosti.

Na primjer, ako želimo procijeniti pouzdanost prosjeka dva pokušaja iz datog primjera, onda

Ako se ograničimo na samo jedan pokušaj, tada će pouzdanost biti jednaka:

a ako povećate broj pokušaja na četiri, koeficijent pouzdanosti će također blago porasti:

Dakle, za procjenu pouzdanosti potrebno je, prvo, izvršiti analizu varijanse i, drugo, izračunati unutarklasni koeficijent korelacije (koeficijent pouzdanosti).

Neke poteškoće nastaju kada postoji tzv. trend, tj. sistematsko povećanje ili smanjenje rezultata od pokušaja do pokušaja (slika 4). U ovom slučaju se koriste složenije metode procjene pouzdanosti (oni nisu opisani u ovoj knjizi).

U slučaju dva pokušaja i odsustva trenda, vrijednosti koeficijenta korelacije unutar klase praktički se poklapaju s vrijednostima uobičajenog koeficijenta korelacije između rezultata prvog i drugog pokušaja. Stoga se u takvim situacijama za procjenu pouzdanosti može koristiti i uobičajeni koeficijent korelacije (u ovom slučaju procjenjuje se pouzdanost jednog, a ne dva pokušaja). Međutim, ako je broj ponovnih pokušaja u testu veći od dva, a posebno ako se koriste složeni obrasci testa,

Rice. 4. Serija od šest pokušaja, od kojih su prva tri (sl. lijevo) ili posljednja tri (desno) u trendu

(na primjer, 2 pokušaja dnevno dva dana), potrebno je izračunati koeficijent unutar razreda.

Koeficijent pouzdanosti nije apsolutni pokazatelj koji karakterizira test. Ovaj koeficijent može varirati ovisno o kontingentu ispitanika (na primjer, biti različit za početnike i kvalifikovane sportiste), uvjetima testiranja (da li se ponovljeni pokušaji izvode jedan za drugim ili, recimo, u intervalu od jedne sedmice) i drugo razlozi. Stoga je uvijek potrebno opisati kako i na kome je test proveden.

2.3 Pouzdanost u praksi ispitivanja

Nepouzdanost eksperimentalnih podataka smanjuje veličinu procjena koeficijenata korelacije. Budući da nijedan test ne može korelirati s drugim testom više nego sa samim sobom, gornja granica koeficijenta korelacije ovdje više nije ±1,00, već indeks pouzdanosti

r (oo = Y~r i

Da bi se prešlo sa procene koeficijenata korelacije između empirijskih podataka na procenu korelacije između pravih vrednosti, može se koristiti izraz

gdje je r xy korelacija između pravih vrijednosti X i Y;

1~xy -- korelacija između empirijskih podataka; HSI^--procjena pouzdanosti X i Y.

Na primjer, ako je r xy = 0,60, r xx = 0,80 i r yy = 0,90, tada je korelacija između pravih vrijednosti 0,707.

Gornja formula (6) naziva se korekcija redukcije (ili Spearman-Brown formula), ona se stalno koristi u praksi.

Ne postoji fiksna vrijednost pouzdanosti koja bi omogućila da se test smatra prihvatljivim. Sve zavisi od važnosti "zaključaka izvučenih iz primene testa. Pa ipak, u većini slučajeva u sportu se mogu koristiti sledeće približne smernice: 0,95--0,99 --¦ odlična pouzdanost, 0,90-^0,94 - - dobro, 0,80 - 0,89 - prihvatljivo, 0,70 - 0,79 - loše, 0,60 - 0,69 - sumnjivo za pojedinačne ocjene, test je pogodan samo za karakterizaciju grupe subjekata.

Da biste postigli određeno povećanje pouzdanosti testa, možete povećati broj ponovnih pokušaja. Evo kako je, na primjer, u eksperimentu, pouzdanost testa (bacanje granate od 350 g uz trčanje) rasla kako se povećavao broj pokušaja: 1 pokušaj - 0,53, 2 pokušaja - 0,72, 3 pokušaja - 0,78, 4 pokušaja - 0,80, 5 pokušaja - 0,82, 6 pokušaja - 0,84. Iz primjera se može vidjeti da ako se u početku pouzdanost brzo povećava, onda se nakon 3-4 pokušaja povećanje značajno usporava.

Uz nekoliko ponovljenih pokušaja, rezultati se mogu odrediti na različite načine: a) najboljim pokušajem, b) aritmetičkom sredinom, c) medijanom, d) prosjekom dva ili tri najbolja pokušaja, itd. pokazalo je da je u većini slučajeva najpouzdanija upotreba aritmetičke sredine, medijana je nešto manje pouzdana, a najbolji pokušaj još manje pouzdan.

Govoreći o pouzdanosti testova, razlikuju se između njihove stabilnosti (ponovljivosti), konzistentnosti, ekvivalencije.

2.4 Stabilnost ispitivanja

Stabilnost testa se podrazumijeva kao ponovljivost rezultata kada se ponovi nakon određenog vremena pod istim uvjetima. Ponovno testiranje se obično naziva ponovnim testiranjem. Šema za procjenu stabilnosti testa je sljedeća: 1

Ovdje se razlikuju 2 slučaja. Jedno retestiranje se radi kako bi se dobili pouzdani podaci o stanju ispitanika tokom čitavog vremenskog intervala između testa i ponovnog testiranja (npr. da bi se dobili pouzdani podaci o funkcionalnosti skijaša u junu, oni mjere BMD dva puta sa intervalom od jedne sedmice). U ovom slučaju važni su tačni rezultati testa, a pouzdanost treba procijeniti analizom varijanse.

U drugom slučaju, može biti važno samo da se održi redosled subjekata u grupi (da li prvi ostaje prvi, poslednji među poslednjima). U ovom slučaju, stabilnost se procjenjuje koeficijentom korelacije između testa i ponovnog testiranja.

Stabilnost testa zavisi od:

vrsta testa

test populacija,

vremenski interval između testa i ponovnog testiranja. Na primjer, morfološke karakteristike s malim

vremenski intervali su veoma stabilni; najmanje stabilni su testovi tačnosti pokreta (na primjer, bacanja u metu).

Kod odraslih, rezultati testova su stabilniji nego kod djece; sportisti su stabilniji od nesportista.

Sa povećanjem vremenskog intervala između testa i ponovnog testiranja, stabilnost testa opada (tablica 3).

2.5 Testirajte konzistentnost

Konzistentnost testa karakteriše nezavisnost rezultata testa od ličnih kvaliteta osobe koja sprovodi ili vrednuje test. „Doslednost je određena stepenom slaganja rezultata dobijenih na istim subjektima od strane različitih eksperimentatora, sudija, stručnjaka. u slučaju, moguće su dvije opcije:

Osoba koja provodi test samo ocjenjuje njegove rezultate, bez utjecaja na njegov učinak. Na primjer, isti pisani rad mogu različito ocijeniti različiti ispitivači. Vrlo često postoje razlike u ocjenama sudija u gimnastici, umjetničkom klizanju, boksu, ručnom mjerenju vremena, procjeni elektrokardiograma ili radiografije od strane različitih doktora itd.

Osoba koja provodi test utiče na rezultate. Na primjer, neki eksperimentatori su uporniji i zahtjevniji od drugih, bolje motiviraju ispitanike. To utiče na rezultate (koji se sami po sebi mogu prilično objektivno izmjeriti).

Konzistentnost testa je, u suštini, pouzdanost procjene njegovih rezultata kada test administriraju različite osobe.

1 Umjesto pojma „dosljednost“, često se koristi termin „objektivnost“. Ovakva upotreba riječi je žalosna, jer podudarnost rezultata različitih eksperimentatora ili sudaca (stručnjaka) uopće ne ukazuje na njihovu objektivnost. Svi zajedno mogu svjesno ili nesvjesno pogriješiti, iskrivljujući objektivnu istinu.

2.6 Ekvivalencija testa

Često je test rezultat odabira iz određenog broja testova istog tipa.

Na primjer, bacanja košarkaškog koša mogu se izvoditi iz različitih uglova, sprintanje se može izvoditi na udaljenosti od, recimo, 50, 60 ili 100 metara, zgibovi se mogu izvoditi na obručima ili šipki, hvat iznad ili ispod ruke, itd.

U takvim slučajevima može se koristiti tzv. metoda paralelnih obrazaca, kada se od ispitanika traži da izvedu dvije verzije istog testa i tada se procjenjuje stepen podudarnosti rezultata. Šema testiranja ovdje je sljedeća:

Koeficijent korelacije izračunat između rezultata testa naziva se koeficijent ekvivalencije. Stavovi prema ekvivalentnosti testa zavise od konkretne situacije. S jedne strane, ako su dva ili više testova ekvivalentna, njihova kombinovana upotreba povećava pouzdanost procjena; s druge strane, može biti korisno ostaviti samo jedan ekvivalentan test u bateriji - to će pojednostaviti testiranje i samo malo smanjiti sadržaj informacija testnog paketa. Rješenje ovog problema ovisi o razlozima kao što su složenost i glomaznost testova, stepen potrebne točnosti testiranja itd.

Ako su svi testovi uključeni u bilo koji skup testova visoko ekvivalentni, naziva se homogenim. Cijeli ovaj kompleks mjeri jedno svojstvo ljudskih motoričkih sposobnosti. Recimo da će set koji se sastoji od skokova u dalj iz mjesta, skokova u vis i troskoka vjerovatno biti homogen. Naprotiv, ako u kompleksu ne postoje ekvivalentni testovi, onda svi testovi uključeni u njega mjere različita svojstva. Takav kompleks se naziva heterogen. Primjer heterogene baterije testova: zgibovi na šipki, nagib naprijed (za testiranje fleksibilnosti), trčanje na 1500 m.

2.7 Načini poboljšanja pouzdanosti testa

Pouzdanost testova može se u određenoj mjeri poboljšati:

a) stroža standardizacija testiranja,

b) povećanje broja pokušaja,

c) povećanje broja ocjenjivača (sudaca, stručnjaka) i povećanje konzistentnosti njihovih mišljenja,

d) povećanje broja ekvivalentnih testova,

e) bolja motivacija ispitanika.

3. INFORMATIVNI TESTOVI

3.1 Osnovni koncepti

Informativnost testa je stepen tačnosti sa kojim se mjeri svojstvo (kvalitet, sposobnost, karakteristika itd.) za koje se koristi. Informativnost se često naziva i validnost (od engleskog uaNaNu - valjanost, valjanost, zakonitost). Pretpostavimo da za utvrđivanje nivoa posebne obuke snage sprintera - trkača i plivača - žele koristiti sljedeće pokazatelje: 1) karpalnu dinamometriju, 2) snagu plantarne fleksije stopala, 3) snagu ekstenzora ramenog zgloba (ovi mišići nose veliko opterećenje pri plivanju kraul) , 4) snagu mišića ekstenzora vrata. Na osnovu ovih testova predlaže se upravljanje trenažnim procesom, posebno pronalaženje slabih karika motoričkog aparata i njihovo namjerno jačanje. Da li se biraju dobri testovi? Da li su informativni? Čak i bez provođenja posebnih eksperimenata, može se pretpostaviti da je drugi test vjerovatno informativan za trkače u sprintu, treći za plivače, a prvi i četvrti vjerovatno neće pokazati ništa zanimljivo ni za plivače ni za trkače (iako se može ispostaviti da biti vrlo koristan u drugim sportovima kao što je rvanje). U različitim slučajevima, isti testovi mogu imati različitu informativnost.

Pitanje informativnog sadržaja testa podijeljeno je na 2 posebna pitanja:

Šta ovaj test mjeri?

Kako to tačno radi?

Na primjer, da li je moguće procijeniti pripremljenost trkača na duge staze prema indikatoru kao što je maksimalna potrošnja kisika (MOC), i ako jeste, s kojim stupnjem tačnosti. Drugim riječima, kakav je informativni sadržaj IPC među onima koji ostaju? Može li se ovaj test koristiti u procesu kontrole?

Ako se test koristi za utvrđivanje (dijagnostiku) stanja sportiste u trenutku pregleda, onda govore o dijagnostičkim informacijama. Ako se na osnovu rezultata testa želi izvući zaključak o mogućim budućim performansama sportiste, test bi trebao imati prediktivne informacije. Test može biti dijagnostički informativan, ali ne i prognostički i obrnuto.

Stepen informativnog sadržaja može se okarakterisati kvantitativno - na osnovu eksperimentalnih podataka (tzv. empirijski informacioni sadržaj) i kvalitativno - na osnovu smislene analize situacije (smisleni, odnosno logički, informacioni sadržaj).

3.2 Empirijska informativnost (prvi slučaj - postoji mjerljiv kriterij)

Ideja određivanja empirijske informativnosti je da se rezultati testa uspoređuju s nekim kriterijem. Da biste to učinili, izračunajte koeficijent korelacije između kriterija i testa (takav koeficijent se naziva koeficijent sadržaja informacija i označava se sa g gk, gdje je I prvo slovo u riječi "test", k - u riječi " kriterijum").

Kao kriterijum se uzima indikator koji očigledno i neosporno odražava osobinu koja će se meriti testom.

Često se dešava da postoji dobro definisan kriterijum sa kojim se predloženi test može uporediti. Na primjer, kada se ocjenjuje posebna pripremljenost sportista u sportu sa objektivno mjerljivim rezultatima, takav kriterij obično je sam rezultat: informativniji je test čija je korelacija sa sportskim rezultatom veća. U slučaju određivanja prognostičkog sadržaja informacija, kriterij je indikator čija se prognoza mora izvršiti (na primjer, ako se predviđa dužina tijela djeteta, kriterij je dužina njegovog tijela u odraslim godinama) .

Najčešće u sportskoj metrologiji kriterijumi su:

Sportski rezultat.

Bilo koja kvantitativna karakteristika glavne sportske vežbe (na primer, dužina koraka u trčanju, odbojna snaga u skokovima, uspeh u košarci ispod table, serviranje u tenisu ili odbojci, procenat tačnih dugih dodavanja u fudbalu).

Rezultati drugog testa čiji je informativni sadržaj dokazan (ovo se radi ako je test-kriterijum glomazan i težak i možete odabrati drugi test koji je jednako informativan, ali jednostavniji. Na primjer, umjesto izmjene plina odredite otkucaja srca). Ovaj konkretan slučaj, kada je kriterijum još jedan test, naziva se konkurentska informativnost.

Pripadnost određenoj grupi. Na primjer, možete uporediti članove reprezentacije zemlje, majstore sporta i prvoklasne sportiste; pripadnost jednoj od ovih grupa je kriterijum. U ovom slučaju se koriste posebne varijante korelacione analize.

Takozvani kompozitni kriterij, na primjer, zbir bodova u višeboju. U isto vrijeme, tipovi sveobuhvatnih tablica i tabela za bodovanje mogu biti ili općenito prihvaćeni ili novosastavljeni od strane eksperimentatora (za način na koji se sastavljaju tabele, pogledajte sljedeće poglavlje). Kompozitni kriterijum se koristi kada ne postoji jedinstven kriterijum (na primer, ako je zadatak da se proceni opšta fizička spremnost, veština igrača u sportskim igrama itd., nijedan indikator koji se uzima sam po sebi ne može poslužiti kao kriterijum).

Primjer određivanja informativnog sadržaja istog testa ¦-- brzina trčanja od 30 m u trčanju za muškarce - po različitim kriterijima prikazan je u tabeli 4.

Pitanje izbora kriterija je, zapravo, najvažnije u određivanju stvarne vrijednosti i informativnosti testa. Na primjer, ako je zadatak odrediti informativni sadržaj takvog testa kao što je skok u dalj za sprintere, tada možete odabrati različite kriterije: rezultat u trčanju na 100 metara, dužinu koraka, omjer dužine koraka i nogu dužina ili visina itd. Informativnost testa će se u ovom slučaju promeniti (u datom primeru se povećao sa 0,558 za brzinu trčanja na 0,781 za odnos „dužina koraka/dužina noge“).

U sportovima u kojima je nemoguće objektivno izmjeriti sportski duh, pokušavaju zaobići ovu poteškoću uvođenjem umjetnih kriterija. Na primjer, u timskim sportovima stručnjaci raspoređuju sve igrače prema njihovoj vještini u određenom redoslijedu (tj. prave liste od 20, 50 ili recimo 100 najjačih igrača). Mjesto koje zauzima sportista (kako kažu, njegov rang) smatra se kriterijem s kojim se upoređuju rezultati testa kako bi se utvrdila njihova informativnost.

Postavlja se pitanje zašto koristiti testove ako je kriterij poznat? Na primjer, nije li lakše organizovati kontrolna takmičenja i utvrditi sportske rezultate nego utvrditi postignuća u kontrolnim vježbama? Upotreba testova ima sljedeće prednosti:

nije uvijek moguće ili svrsishodno odrediti sportski rezultat (na primjer, nije moguće često održavati maratonska takmičenja, zimi je obično nemoguće registrovati rezultat u bacanju koplja, a ljeti u skijaškom trčanju);

sportski rezultat zavisi od mnogo razloga (faktora), kao što su, na primer, snaga sportiste, njegova izdržljivost, tehnika itd. Upotreba testova omogućava da se utvrde snage i slabosti sportiste, da se proceni svaki ovih faktora odvojeno

3.3 Empirijska informativnost (drugi slučaj - ne postoji jedinstveni kriterij; faktorska informativnost)

Često se dešava da ne postoji jedinstveni kriterijum sa kojim bi se uporedili rezultati predloženih testova. Pretpostavimo da žele pronaći najinformativnije testove za procjenu snage pripremljenosti mladih ljudi. Šta više volite: zgibove na šipki ili sklekove na šipkama, čučnjeve sa utegom, mrtvo dizanje utegom ili prelazak na čučanj iz ležećeg položaja? Šta ovdje može biti kriterij za odabir pravog testa?

Možete ponuditi ispitanicima veliku bateriju različitih testova snage, a zatim među njima odabrati one koji daju najveću korelaciju s rezultatima cijelog kompleksa (na kraju krajeva, ne možete sustavno koristiti cijeli kompleks - previše je glomazan i nezgodan) . Ovi testovi će biti najinformativniji: oni će dati informacije o mogućim rezultatima ispitanika za cijeli početni set testova. Ali rezultati u setu testova nisu izraženi jednim brojem. Moguće je, naravno, formirati neku vrstu kompozitnog kriterija (na primjer, odrediti zbir bodova postignutih na nekoj skali). Međutim, mnogo je efikasniji drugi način zasnovan na idejama faktorske analize.

Faktorska analiza je jedna od metoda multivarijantne statistike (riječ "multivarijantna" označava da se istovremeno proučavaju mnogi različiti indikatori, na primjer rezultati ispitanika u mnogim testovima). Ovo je prilično komplicirana metoda, pa je ovdje preporučljivo da se ograničimo na predstavljanje samo njene glavne ideje.

Faktorska analiza polazi od činjenice da je rezultat bilo kojeg testa rezultat istovremenog djelovanja niza direktno neuočljivih (kako inače kažu - latentnih) faktora. Na primjer, rezultati u trčanju na 100, 800 i 5000 metara zavise od brzinskih kvaliteta sportiste, njegove snage, izdržljivosti itd. Vrijednost ovih faktora za svaku od distanci nije jednako važna. Ako odaberete dva testa na koja isti faktori utječu u približno istoj mjeri, tada će rezultati u ovim testovima biti u velikoj međusobnoj korelaciji (recimo, u trčanju na udaljenosti od 800 i 1000 m). Ako testovi nemaju zajedničke faktore ili imaju mali uticaj na rezultate, korelacija između ovih testova će biti niska (na primer, korelacija između rezultata na 100 i 5000 metara). Kada se uzme veliki broj različitih testova i izračunaju koeficijenti korelacije između njih, onda se faktorskom analizom može utvrditi koliko faktora zajedno djeluje na ove testove i koliki je stepen njihovog doprinosa svakom testu. A onda je lako odabrati testove (ili njihove kombinacije) koji najpreciznije procjenjuju nivo pojedinačnih faktora. Ovo je ideja faktorske informativnosti testova. Sljedeći primjer specifičnog eksperimenta pokazuje kako se to radi.

Zadatak je bio pronaći najinformativnije testove za procjenu opšte snažne pripremljenosti učenika-sportista treće - prve kategorije koji se bave različitim sportovima. U tu svrhu je ispitan (N.V. Averkovich, V.M. Zatsiorsky, 1966) 108 ljudi na 15 testova. Kao rezultat faktorske analize identifikovana su tri faktora: 1) snaga gornjih udova, 2) snaga donjih udova, 3) snaga trbušnih mišića i fleksora kuka. Najinformativniji testovi među testiranima bili su: za prvi faktor - sklekovi, za drugi - skok u dalj iz mjesta, za treći - podizanje ravnih nogu u vis i maksimalan broj prelazaka u čučanj iz ležeći položaj 1 min. Ako se ograničimo na samo jedan test, onda je najinformativniji bio udar silom iz blizine na prečku (procijenjen je broj ponavljanja).

3.4 Empirijska informatizacija u praktičnom radu

U praktičnoj upotrebi indikatora sadržaja empirijskih informacija treba imati na umu da oni važe samo u odnosu na one predmete i uslove za koje su izračunati. Test koji je informativan u grupi početnika može se pokazati potpuno neinformativnim ako ga pokušate primijeniti u grupi majstora sporta.

Informativni sadržaj testa nije isti u različitim grupama. Konkretno, u grupama koje su homogenije po sastavu, test je obično manje informativan. Ako se utvrdi informativnost testa na bilo kojoj grupi, a onda se najjači od njih uvrste u reprezentaciju, tada će informativnost istog testa u reprezentaciji biti znatno manja. Razlozi za to su jasni sa sl. 5: selekcija smanjuje ukupnu varijansu rezultata u grupi i smanjuje vrijednosti koeficijenta korelacije. Na primjer, ako odredimo informativnost takvog testa kao što je IPC kod plivača na 400 m, koji imaju oštro različite rezultate (recimo, od 3,55 do 6,30), tada će koeficijent informativnosti biti vrlo visok (Y 4 d > 0,90); ako ista mjerenja izvršimo u grupi plivača sa rezultatima od 3,55 do 4,30, g br. u apsolutnoj vrijednosti neće prelaziti 0,4-0,6; ako odredimo isti pokazatelj za najjače plivače na svijetu (3,53>, 5 = 4,00), informativni koeficijent općenito "" može biti jednak nuli: koristeći samo ovaj test, neće biti moguće razlikovati plivače plivanje, recimo, 3,55 i 3,59: i ovi i drugi imaju magnitudu IPC. će biti visoka i otprilike ista.

Koeficijenti informativnosti u velikoj mjeri zavise od pouzdanosti testa i kriterija. Test niske pouzdanosti uvijek nije previše informativan, tako da nema smisla provjeravati nepouzdane testove za informativni sadržaj. Nedovoljna pouzdanost kriterijuma takođe dovodi do smanjenja koeficijenata informacionog sadržaja. Međutim, u ovom slučaju bilo bi pogrešno zanemariti test kao neinformativan – na kraju krajeva, gornja granica moguće korelacije testa nije ±1, već njegov indeks pouzdanosti. Stoga je potrebno uporediti koeficijent informativnosti sa ovim indeksom. Stvarni sadržaj informacija (prilagođen za nepouzdanost kriterija) izračunava se po formuli:

Tako je u jednom od radova rang sportiste u vaterpolu (rang se smatrao kriterijumom majstorstva) utvrđen na osnovu ocjena 4 stručnjaka. Pouzdanost (konzistentnost) kriterija, određena korištenjem koeficijenta unutarklasne korelacije, iznosila je 0,64. Koeficijent informativnosti bio je jednak 0,56. Stvarni koeficijent informativnosti (prilagođen za nepouzdanost kriterija) je jednak:

Koncept njegove distinktivne sposobnosti usko je povezan sa sadržajem informacija i pouzdanošću testa, što se podrazumeva kao minimalna razlika između ispitanika koja se dijagnostikuje pomoću testa (ovaj koncept je po značenju sličan konceptu osetljivosti testa). uređaj). Posebnost testa zavisi od:

Interindividualne varijacije u rezultatima. Na primjer, test kao što je "maksimalni broj ponovljenih bacanja košarkaške lopte u zid sa udaljenosti od 4 m u 10 sekundi" je dobar za početnike, ali neprikladan za kvalifikovane košarkaše, jer svi pokazuju približno isti rezultat i postati nerazlučivi. U mnogim slučajevima, varijacije među predmetima (varijacije među razredima) mogu se povećati povećanjem težine testa. Na primjer, ako sportisti različitih kvalifikacija dobiju funkcionalni test koji im je lak (recimo, 20 čučnjeva ili rad na bicikl ergometru kapaciteta 200 kgm/min), tada će veličina fizioloških promjena biti približno ista za sve i biće nemoguće proceniti stepen pripremljenosti. Ako im ponudite težak zadatak, tada će razlike između sportaša postati velike, a prema rezultatima testa moći će se suditi o pripremljenosti sportaša.

Pouzdanost (tj. omjer inter- i intra-individualne varijacije) testa i kriterija. Ako se rezultati istog predmeta u skokovima u dalj iz mjesta razlikuju, recimo, u pre-

slučajevima od ± 10 cm, onda, iako se dužina skoka može odrediti sa tačnošću od ± 1 cm, nemoguće je sa uvjerenjem razlikovati subjekte čiji su “pravi” rezultati 315 i 316 cm.

Ne postoji fiksna vrijednost informativnog sadržaja testa, nakon čega se test može smatrati "prikladnim". Ovdje mnogo ovisi o konkretnoj situaciji: željena točnost prognoze, potreba da se pribave barem neke dodatne informacije o sportista, itd. U praksi se za dijagnostiku koriste testovi čiji informativni sadržaj nije manji od 0,3 Za prognozu je po pravilu potreban veći informacioni sadržaj - najmanje 0,6.

Informativnost baterije testova je prirodno veća od informativnosti jednog testa. Često se dešava da je informativni sadržaj jednog testa prenizak da bi se koristio ovaj test. Informativnost baterije testova može biti sasvim dovoljna.

Informativna vrijednost testa ne može se uvijek odrediti eksperimentom i matematičkom obradom njegovih rezultata. Na primjer, ako je zadatak razviti ulaznice za ispite ili teme za diplomske radove (ovo je također vrsta testiranja), potrebno je odabrati ona pitanja koja su najinformativnija, pomoću kojih je moguće najpreciznije ocijeniti znanja diplomaca i njihove pripremljenosti za praktičan rad. Zasad se u takvim slučajevima oslanjaju samo na logičnu, smislenu analizu situacije.

Ponekad se dešava da je informativnost testa jasna bez ikakvih eksperimenata, posebno kada je test jednostavno deo radnji koje sportista izvodi na takmičenju. Eksperimenti su jedva potrebni da bi se dokazala informativnost takvih pokazatelja kao što su vrijeme okreta u plivanju, brzina na posljednjim koracima trčanja u skokovima u dalj, postotak pogodaka iz slobodnih bacanja u košarci, kvaliteta izvođenja u tenisu ili odbojci.

Međutim, nisu svi takvi testovi podjednako informativni. Na primjer, ubacivanje u fudbalu, iako je element igre, teško se može smatrati jednim od najvažnijih pokazatelja umijeća fudbalera. Ako takvih testova ima mnogo i potrebno je odabrati najinformativniji od njih, matematičke metode teorije testova ne mogu se izostaviti.

Smislena analiza informativnog sadržaja testa i njegova eksperimentalna i matematička opravdanost treba da se dopunjuju. Nijedan od ovih pristupa, sam po sebi, nije dovoljan. Konkretno, ako se kao rezultat eksperimenta utvrdi visok koeficijent informativnosti testa, potrebno je provjeriti da li je to posljedica tzv. lažne korelacije. Poznato je da se lažne korelacije javljaju kada na rezultate oba korelirana svojstva utiče neki treći pokazatelj, koji sam po sebi ne predstavlja

interes. .Na primjer, srednjoškolci mogu pronaći značajnu korelaciju između rezultata u trčanju na 100 metara i znanja iz geometrije, jer će u prosjeku pokazati veći učinak i u trčanju i u znanju geometrije u odnosu na učenike nižih razreda. Vanjski, treći, znak koji je izazvao pojavu korelacije bila je starost ispitanika. Naravno, istraživač bi pogriješio da to nije uočio i preporučio ispit iz geometrije kao test za trkače na 100 metara.Da se takve greške ne bi napravile potrebno je analizirati uzročno-posljedične veze koje uzrokovao korelaciju između kriterija i testa. Korisno je, posebno, zamisliti šta bi se dogodilo ako bi se rezultati na testu poboljšali. Hoće li to dovesti do povećanja rezultata kriterija? U datom primjeru to znači: ako učenik bolje poznaje geometriju, hoće li trčati brže od 100 m? Očigledno negativan odgovor dovodi do prirodnog zaključka: poznavanje geometrije ne može poslužiti kao test za sprintere. Pronađena korelacija je lažna. Naravno, stvarne životne situacije su mnogo složenije od ovog namjerno glupog primjera.

Poseban slučaj smislene informativnosti testova je informativni sadržaj po definiciji. U ovom slučaju, oni se jednostavno slažu oko toga koje značenje treba staviti u određenu riječ (pojam). Na primjer, kažu: "skok uvis s mjesta karakterizira sposobnost skakanja." Preciznije bi bilo reći ovo: "složimo se da skakačkom sposobnošću nazovemo ono što se mjeri rezultatom skoka s mjesta." Takav međusobni dogovor je neophodan, jer sprečava nepotrebne nesporazume (uostalom, neko može shvatiti preskakanjem rezultata u desetom skoku na jednoj nozi, a skok u vis s mjesta smatrati, recimo, testom “eksplozivne” snage nogu ).

56.0 Standardizacija testova

Standardizacija testova fitnesa za procjenu ljudskih aerobnih performansi postiže se pridržavanjem sljedećih principa.

Metodologija testiranja treba da omogući direktno merenje ili indirektno izračunavanje maksimalne potrošnje kiseonika u organizmu (aerobni kapacitet), budući da je ovaj fiziološki pokazatelj ljudske kondicije najvažniji. To će biti označeno simbolom rpax1rrm y 0r i izraženo u mililitrima po kilogramu težine subjekta u minuti (ml/kg-min.).

U osnovi, postupak ispitivanja trebao bi biti isti za laboratorijska i terenska mjerenja, međutim:

1. U laboratorijskim uslovima (u stacionarnim i mobilnim laboratorijama), ljudska aerobna produktivnost se može direktno odrediti korišćenjem prilično sofisticirane opreme i velikog broja merenja.

2. Na terenu, aerobne performanse se procjenjuju indirektno na osnovu ograničenog broja fizioloških mjerenja.

Metodologija za provođenje testova treba da omogući poređenje njihovih rezultata.

Testiranje treba obaviti jedan dan i po mogućnosti bez prekida. Ovo će omogućiti odgovarajuću raspodjelu vremena, opreme, snaga tokom početnog i ponovljenog testiranja.

Metodologija testiranja treba da bude dovoljno fleksibilna da omogući ispitivanje grupa ljudi sa različitim fizičkim sposobnostima, različitim godinama, polovima, različitim nivoima aktivnosti itd.

57.0. Izbor opreme

Svi ovi principi fiziološkog ispitivanja mogu se poštovati, prije svega, pod uslovom pravilnog odabira sljedećih tehničkih sredstava:

traka za trčanje,

biciklistički ergometar,

stepgometar,

neophodna pomoćna oprema koja se može koristiti u bilo kojoj vrsti ispitivanja.

57.1. Traka za trčanje se može koristiti u raznim studijama. Međutim, ovaj uređaj je najskuplji. Čak i najmanja verzija je previše glomazna da bi se široko koristila na terenu. Traka za trčanje mora biti sposobna varirati brzine od 3 do (najmanje) 8 km/h (2-5 mph) i nagib od 0 do 30%. Nagib trake za trčanje definira se kao postotak vertikalnog podizanja podijeljen s horizontalnom pređenom udaljenosti.

Udaljenost i vertikalno podizanje moraju biti izraženi u metrima, brzina u metrima u sekundi (m/s) ili kilometrima na sat (km/h).

57.2. Biciklistički ergometar. Ovaj instrument je jednostavan za upotrebu kako u laboratoriji tako i na terenu. Prilično je svestran, može obavljati poslove različitog intenziteta - od minimalnog do maksimalnog nivoa.

Biciklistički ergometar ima mehanički ili električni sistem kočenja. Električni kočioni sistem može se napajati i iz vanjskog izvora i iz generatora koji se nalazi na ergometru.

Podesiva mehanička otpornost izražava se u kilogramima u minuti (kgm/min) i u vatima. Kilogram metri u minuti pretvaraju se u vatove pomoću formule:

1 vat = 6 kgm/min. 2

Biciklistički ergometar mora imati pokretno fiksirano sjedište tako da se visina njegovog položaja može podesiti za svaku osobu pojedinačno. Prilikom testiranja sjedište je postavljeno tako da osoba koja sjedi na njemu može dosegnuti donju pedalu sa skoro potpuno ispruženom nogom. U prosjeku, udaljenost između sjedišta i pedale u maksimalno spuštenom položaju treba biti 109% dužine noge subjekta.

Postoje različiti dizajni biciklističkog ergometra. Međutim, tip ergometra ne utiče na rezultate eksperimenta ako naznačeni otpor u vatima ili kilogram metrima u minuti tačno odgovara ukupnom vanjskom opterećenju.

Steppergometer. Ovo je relativno jeftin uređaj sa podesivom visinom koraka od 0 do 50 cm. Kao i biciklergometar, lako se može koristiti iu laboratoriji i na terenu.

Poređenje tri opcije testa. Svaki od ovih instrumenata ima svoje prednosti i nedostatke (u zavisnosti od toga da li se koristi u laboratorijama ili na terenu). Obično, kada radite na traci za trčanje, vrijednost max1min U 07 je nešto veća nego kod rada na bicikl ergometru; zauzvrat, indikatori biciklističkog ergometra premašuju očitanja na stepgometru.

Nivo utroška energije ispitanika, koji miruju ili obavljaju zadatak savladavanja gravitacije, direktno je proporcionalan njihovoj težini. Stoga vježbe na traci za trčanje i stepergometru stvaraju za sve subjekte isto relativno opterećenje za podizanje (njihovog tijela. - Uredba) do određene visine: pri datoj brzini i nagibu trake za trčanje, učestalosti koraka i visinama koraka na Steppergometar, visina podizanja tijela će biti - ista (a rad se razlikuje. - Pribl. ur.). S druge strane, biciklistički ergometar sa fiksnom vrijednošću datog opterećenja zahtijeva gotovo isti utrošak energije, bez obzira na spol i dob ispitanika.

58.0, Opšte napomene o metodama ispitivanja

Da bi se testovi primenili na velike grupe ljudi, potrebne su jednostavne i dugotrajne metode testiranja. Međutim, za detaljnije proučavanje fizioloških karakteristika subjekta potrebni su dublji i naporniji testovi. Da biste dobili veću vrijednost od testova i fleksibilnije ih koristili, morate pronaći najbolji kompromis između ova dva zahtjeva.

58.1. Intenzitet rada. Testiranje treba započeti s malim opterećenjima koja mogu podnijeti najslabiji ispitanici. Procjenu adaptivnih sposobnosti kardiovaskularnog i respiratornog sistema treba provoditi u procesu rada s postupno rastućim opterećenjima. Funkcionalne granice se stoga moraju postaviti s dovoljnom preciznošću. Praktična razmatranja sugeriraju da je osnovna brzina metabolizma (tj. brzina metabolizma u mirovanju) jedinica mjere za količinu energije potrebne za izvođenje određene vježbe. Početno opterećenje i njegove naredne faze izražene su u Meta, višekratnicima metaboličke brzine kod osobe koja je u stanju potpunog mirovanja. Fiziološki pokazatelji na kojima se temelji Met su količina kiseonika (u mililitrima u minuti) koju osoba troši u mirovanju ili njegov kalorijski ekvivalent (u kilokalorijama u minuti).

Za kontrolu opterećenja u jedinicama Met ili u ekvivalentnim vrijednostima potrošnje kisika direktno tokom ispitivanja potrebna je složena elektronička računarska oprema, koja je trenutno još uvijek relativno nedostupna. Stoga je pri određivanju količine kisika potrebnog tijelu za obavljanje opterećenja određene vrste i intenziteta praktično zgodno koristiti empirijske formule. Predviđene (zasnovane na empirijskim formulama. - Ed.) vrijednosti potrošnje kisika pri radu na traci za trčanje - u smislu brzine i nagiba, uz test koraka - u smislu visine i frekvencije koraka, dobro se slažu sa rezultati direktnih mjerenja i može se koristiti kao fiziološki ekvivalent fizičkog napora, sa kojim su u korelaciji svi fiziološki pokazatelji dobijeni tokom testiranja.

58.2. Trajanje testova. Želja da se skrati proces testiranja ne bi trebalo da bude na štetu ciljeva i zadataka testa. Prekratki testovi neće dati dovoljno uočljive rezultate, njihova moć razlikovanja će biti mala; predugi testovi u većoj mjeri aktiviraju mehanizme termoregulacije, što onemogućava uspostavljanje maksimalnih aerobnih performansi. U preporučenom postupku ispitivanja, svaki nivo opterećenja se održava 2 minute. Prosječno vrijeme testiranja je 10 do 16 minuta.

58.3. Indikacije za prekid testa. Testiranje se mora prekinuti osim ako:

pulsni pritisak stalno pada, uprkos povećanju opterećenja;

sistolni krvni pritisak prelazi 240-250 mm Hg. Art.;

dijastolni krvni pritisak raste iznad 125 mm Hg. Art.;

pojavljuju se simptomi malaksalosti, kao što su pojačani bol u grudima, jaka otežano disanje, intermitentna klaudikacija;

pojavljuju se klinički znakovi anoksije: bljedilo ili cijanoza lica, vrtoglavica, psihotični fenomeni, nedostatak odgovora na iritaciju;

očitanja elektrokardiograma ukazuju na paroksizmalnu superventrikularnu ili ventrikularnu aritmiju, pojavu ventrikularnih ekstrasistolnih kompleksa koji se javljaju prije kraja T talasa, poremećaje provodljivosti, osim blage blokade L U, smanjenje /? - 5G horizontalnog ili silaznog tipa za više od 0,3 mV . .;";, -

58.4. Mere predostrožnosti.

Zdravlje subjekta. Prije pregleda ispitanik mora proći ljekarsku komisiju i dobiti potvrdu da je zdrav. Vrlo je poželjno napraviti elektrokardiogram (najmanje jedan grudni provod). Za muškarce starije od 40 godina, uzimanje elektrokardiograma je obavezno. Redovno ponovljeno merenje krvnog pritiska trebalo bi da bude sastavni deo celokupne procedure testiranja. Na kraju testiranja ispitanike treba informisati o mjerama za sprječavanje opasnog nakupljanja krvi u donjim ekstremitetima.

Kontraindikacije. Ispitaniku nije dozvoljeno polaganje testova u sljedećim slučajevima:

nedostatak dozvole liječnika za sudjelovanje u testovima s maksimalnim opterećenjem;

oralna temperatura prelazi 37,5°C;

broj otkucaja srca nakon dugog odmora je iznad 100 otkucaja / min;

jasan pad srčane aktivnosti;

slučaj infarkta miokarda ili miokarditisa u posljednja 3 mjeseca; simptomi i indikacije elektrokardiograma koji ukazuju na prisutnost ovih bolesti; znaci angine;

zarazne bolesti, uključujući prehlade.

Menstruacija nije kontraindikacija za učešće u testovima. Međutim, u nekim slučajevima je preporučljivo promijeniti raspored njihovog održavanja.

B. STANDARDNI TESTOVI

59.0. Opis glavne metodologije za izvođenje standarda

U sve tri vrste vježbi, bez obzira da li se test izvodi sa maksimalnim ili submaksimalnim opterećenjem, osnovna procedura testiranja je ista.

Ispitanik dolazi u laboratoriju u laganoj sportskoj odjeći i mekanim cipelama. U roku od 2 sata. prije početka testa ne smije jesti, piti kafu, pušiti.

Opuštanje. Testu prethodi period odmora od 15 minuta. Za to vrijeme, dok se postavljaju fiziološki mjerni instrumenti, ispitanik udobno sjedi u stolici.

period smještaja. Prvi test bilo kog subjekta, kao i svi ponovljeni testovi, daće prilično pouzdane rezultate ako glavnom testu prethodi kratak period vežbe sa malim uticajem - period akomodacije. Traje 3 minute. i služi u sljedeće svrhe:

upoznaje ispitanika sa opremom i vrstom poslova koje mora da obavlja;

preliminarno proučiti fiziološki odgovor subjekta na opterećenje od približno 4 Meta, što odgovara pulsu od približno 100 otkucaja/min;

ubrzati adaptaciju tijela na direktno provođenje samog testa.

Opuštanje. Nakon perioda smještaja slijedi kratak (2 min.) period odmora; ispitanik udobno sjedi u stolici dok eksperimentator vrši potrebne tehničke pripreme.

Test. Na početku testa postavlja se opterećenje jednako opterećenju akomodacionog perioda, a ispitanik izvodi vježbe bez prekida do kraja testa. Svaka 2 min. radno opterećenje se povećava za 1 Met.

Testiranje se prekida pod jednim od sljedećih uslova:

subjekt nije u stanju da nastavi zadatak;

postoje znaci fiziološke dekompenzacije (vidjeti 58.3);

podaci dobijeni u poslednjoj fazi opterećenja omogućavaju ekstrapolaciju maksimalnog aerobnog kapaciteta na osnovu uzastopnih fizioloških merenja (izvršenih tokom testiranja. - Pribl. ur.).

59.5. Mjerenja. Maksimalna potrošnja kiseonika u mililitrima po kilogramu u minuti se meri direktno ili izračunava. Metode za određivanje potrošnje kiseonika su veoma raznolike, kao i dodatne tehnike koje se koriste za analizu fizioloških sposobnosti svakog pojedinca. Više o tome će biti riječi kasnije.

59.6. Oporavak. Na kraju eksperimenta, fiziološko promatranje se nastavlja najmanje 3 minute. Subjekt ponovo leži u stolici, lagano podižući noge.

Bilješka. Opisana tehnika testiranja daje uporedive fiziološke podatke dobijene istim redoslijedom povećanja opterećenja na traci za trčanje, bicikloergometru i stepergometru. Nadalje, postupak testiranja je opisan posebno za svaki od tri uređaja.

60.0. test na traci za trčanje

Oprema. Traka za trčanje i potrebni pribor.

Opis. Osnovna tehnika testiranja opisana u 59.0 se pažljivo prati.

Brzina trake za trčanje sa subjektom koji hoda po njoj je 80 m/min (4,8 km/h, ili 3 mph). Pri ovoj brzini, energija potrebna za horizontalno kretanje je približno 3 Meth; svako povećanje nagiba od 2,5% dodaje jednu jedinicu početne metaboličke brzine, tj. 1 Met potrošnji energije. Na kraju prve 2 min. nagib trake za trčanje se brzo povećava na 5%, na kraju naredne 2 minute - do 7,5%, zatim na 10%, 12,5% itd. Kompletna šema je data u tabeli. jedan.

Slični dokumenti

    Sprovođenje kontrolnih testova pomoću kontrolnih vežbi ili testova u cilju utvrđivanja spremnosti za fizičke vežbe. Problem standardizacije testa. Eksterna i interna validnost testova. Vođenje evidencije o kontrolnom pregledu.

    sažetak, dodan 12.11.2009

    Karakteristike motoričkih sposobnosti i metodika za razvoj fleksibilnosti, izdržljivosti, spretnosti, snage i brzine. Testiranje motoričkih sposobnosti učenika na časovima fizičkog vaspitanja. Upotreba motoričkih testova u praksi.

    disertacije, dodato 25.02.2011

    Procjena dinamike promjena antropometrijskih podataka kod školaraca koji se sistematski bave atletikom i školaraca koji se ne bave sportskim sekcijama. Razvoj testova za utvrđivanje ukupne fizičke spremnosti; analiza rezultata.

    rad, dodato 07.07.2015

    Glavni pravci upotrebe testova, njihova klasifikacija. Testovi za selekciju u hrvanju. Metode vrednovanja sportskih dostignuća. Testiranje posebne izdržljivosti rvača. Povezanost indikatora testa sa tehničkom vještinom rvača slobodnih stilova.

    rad, dodato 03.03.2012

    Procjena posebne izdržljivosti plivača pomoću kontrolnih vježbi. Prilagodljivost glavnih reakcija fizioloških sistema u uslovima vodene sredine. Razvoj principa za procjenu biomedicinskih indikatora koji se koriste u testiranju plivača.

    članak, dodan 03.08.2009

    Razmatranje zdrave energije kao temeljnog principa zdravlja. Upoznavanje sa karakteristikama gimnastičkih vežbi prema čigong sistemu. Odabir seta vježbi za domaći zadatak. Kompilacija testova za dobijanje zaključaka o obavljenom poslu.

    rad, dodato 07.07.2015

    Sportska metrologija - proučavanje fizičkih veličina u fizičkom vaspitanju i sportu. Osnove mjerenja, teorija ispitivanja, procjene i norme. Metode za dobijanje informacija o kvantitativnoj proceni kvaliteta indikatora; kvalimetrija. Elementi matematičke statistike.

    prezentacija, dodano 12.02.2012

    Suština i značenje kontrole u fizičkom vaspitanju i njene vrste. Provjera i vrednovanje motoričkih sposobnosti i sposobnosti stečenih na nastavi fizičkog vaspitanja. Testiranje nivoa fizičke spremnosti. Praćenje funkcionalnog stanja učenika.

    seminarski rad, dodan 06.06.2014

    Proračun apsolutnih i relativnih grešaka mjerenja. Prevođenje rezultata testa u bodove pomoću regresije i proporcionalne skale. Rangiranje rezultata testa. Promjene mjesta u grupi u odnosu na prethodne procjene.

    kontrolni rad, dodano 11.02.2013

    Način motoričke aktivnosti. Uloga faktora koji određuju fizičke performanse fudbalera u različitim fazama dugotrajnog treninga. Vrste ergogenih sredstava. Metodologija za provođenje testova za određivanje nivoa fizičke izvedbe.


Ključna pitanja: Test kao mjerni alat. Osnovne teorije testiranja. Funkcije, mogućnosti i ograničenja testiranja. Upotreba testova u procjeni osoblja. Prednosti i nedostaci korištenja testova. Oblici i vrste testnih zadataka. Tehnologija izgradnje zadataka. Procjena kvaliteta testa. Pouzdanost i valjanost. Softver za razvoj testova. 2




Test kao mjerni alat Osnovni pojmovi u testologiji: mjerenje, test, sadržaj i oblik zadataka, pouzdanost i valjanost rezultata mjerenja. Pored toga, testologija koristi koncepte statističke nauke kao što su uzorkovanje i opšta populacija, proseci, varijacija, korelacija, regresija, itd. 4




Testni zadatak je didaktički i tehnološki učinkovita jedinica kontrolnog materijala, dio testa koji ispunjava zahtjeve predmetne čistoće sadržaja (ili jednodimenzionalnosti), sadržajne i logičke ispravnosti, ispravnosti forme, prihvatljivosti geometrijske slike predmeta. zadatak. 6




Tradicionalni test je standardizirana metoda za dijagnosticiranje nivoa i strukture pripremljenosti. U takvom testu svi ispitanici odgovaraju na iste zadatke, u isto vrijeme, pod istim uslovima i uz ista pravila za vrednovanje odgovora. Da biste postigli cilj testiranja, možete kreirati beskonačan broj testova, i svi oni mogu ispuniti postizanje zadatka. osam


Profesiogram (od lat. Professio specijalnost + Gramma zapis) je sistem karakteristika koje opisuju određenu profesiju, a uključuje i listu normi i zahtjeva za zaposlenog po ovoj profesiji ili specijalnosti. Posebno, profesiogram može sadržavati listu psiholoških karakteristika koje moraju ispunjavati predstavnici određenih profesionalnih grupa. 9


Osnovna teorija testiranja Prvi naučni radovi o teoriji testova pojavili su se početkom dvadesetog veka, na razmeđu psihologije, sociologije, pedagogije i drugih takozvanih bihevioralnih nauka. Strani psiholozi ovu nauku nazivaju psihometrija (Psychometrika), a nastavnici - pedagoško mjerenje (Obrazovno mjerenje). Nezamućeno ideologijom i politikom, tumačenje naziva "testologija" je jednostavno i transparentno: nauka o testovima. deset


Prva faza - praistorija - od antike do kraja 19. veka, kada su bili rašireni prednaučni oblici kontrole znanja i sposobnosti; drugi period, klasični, trajao je od početka 20-ih do kraja 60-ih, tokom kojeg je nastala klasična teorija testova; treći period – tehnološki – koji je započeo 70-ih godina – vrijeme razvoja metoda za adaptivno testiranje i učenje, metodologije za efikasan razvoj testova i testnih zadataka za parametarsko ocjenjivanje predmeta u smislu mjerenog latentnog kvaliteta. jedanaest


Funkcije, mogućnosti i ograničenja testiranja Testovi koji se koriste u selekciji su dizajnirani da dobiju psihološki portret kandidata, procijene njegove sposobnosti, kao i profesionalna znanja i vještine. Testovi vam omogućavaju da uporedite kandidate međusobno ili sa standardima, odnosno idealnog kandidata. Testovi se koriste za mjerenje kvaliteta osobe neophodnih za efikasno obavljanje posla. Neki testovi su dizajnirani na način da poslodavac sam sprovodi test i izračunava rezultate. Drugi zahtijevaju usluge iskusnih konsultanata kako bi osigurali njihovu ispravnu primjenu. 12


Ograničenja upotrebe testova su povezana - sa njihovom skupom administracijom; - sa podobnošću za procjenu sposobnosti osobe; - testovi su uspješniji u predviđanju uspjeha u radu koji sadrži kratkoročne profesionalne zadatke, a nisu baš zgodni u slučajevima kada zadaci koji se rješavaju na poslu traju nekoliko dana ili sedmica. 13








2. Terminologiju koja se koristi treba odabrati na osnovu specifične ciljne publike. Suvišne članke ili članke koji uključuju dva ili više pitanja također treba isključiti, jer ponekad zbunjuju ispitanika i otežavaju tumačenje. 17


3. Da biste ispunili sve ove zahtjeve, trebali biste proći kroz cijelu banku pitanja članak po članak i analizirati kojoj svrsi svako od njih služi. Na primjer, ako se razvija test za mjerenje analitičke sposobnosti pripravnika računovođa, vrijedno je razmotriti što znači "analitička sposobnost" u tom slučaju. osamnaest




5. Kada se odaberu pitanja i formati za bodovanje, treba ih pretvoriti u format prilagođen korisniku, sa jasno napisanim uputstvima i uzorcima pitanja; tako da ispitanici u potpunosti razumiju šta se od njih traži. dvadeset


6. Vrlo često, u ovoj fazi razvoja, više pitanja je uključeno u test nego što je potrebno. Prema nekim procjenama, tri puta više nego što će ostati u konačnom testnom ili mjernom sistemu. Tada bi početna tačka bila testiranje testa koji se razvija na relativno velikom uzorku postojećih radnika kako bi se osiguralo da su sva pitanja lako razumljiva. 21


7. Testovi za utvrđivanje znanja obično počinju jednostavnim pitanjima, koji postepeno postaju složeniji prema kraju. Kada su testovi namijenjeni mjerenju društvenih stavova i karakteristika ličnosti, može biti korisno izmjenjivati ​​negativno i pozitivno formulirane članke kako bi se izbjegli loše osmišljeni odgovori. 22


8. Posljednji korak je primjena testa na velikom reprezentativnom uzorku kako bi se utvrdili standardi performansi, valjanosti i valjanosti prije nego što se može koristiti kao alat za odabir. Osim toga, pravičnost testa se mora utvrditi kako bi se osiguralo da on ne diskriminira bilo koju podgrupu stanovništva (npr. etničke razlike). 23


Evaluacija kvaliteta ispitivanja Da bi metode selekcije bile dovoljno efikasne, moraju biti pouzdane, valjane i pouzdane. Pouzdanost metode selekcije karakteriše njena nepodložnost sistematskim greškama u merenju, odnosno doslednost u različitim uslovima. 24


U praksi, pouzdanost u donošenju odluka postiže se poređenjem rezultata dva ili više sličnih testova sprovedenih u različitim danima. Drugi način da se poveća pouzdanost je upoređivanje rezultata nekoliko alternativnih metoda selekcije (npr. test i intervju). Ako su rezultati slični ili isti, mogu se smatrati ispravnim. 25


Pouzdanost znači da će obavljena mjerenja dati isti rezultat kao i prethodna, odnosno da na rezultate procjene ne utiču vanjski faktori. Valjanost znači da metoda mjeri tačno ono što je namijenjena. Maksimalna moguća tačnost informacija dobijenih posebno razvijenim metodama u naučnom istraživanju ograničena je tehničkim faktorima i ne prelazi 0,8. 26


U praksi selekcije kadrova primjećuje se da se pouzdanost različitih metoda ocjenjivanja nalazi u intervalima: 0,1 – 0,2 – tradicionalni intervju; 0,2 - 0,3 - preporuke; 0,3 - 0,5 - stručni testovi; 0,5 - 0,6 - strukturirani intervju, intervju zasnovan na kompetencijama; 0,5 - 0,7 - kognitivni testovi i testovi ličnosti; 0,6 - 0,7 - pristup zasnovan na kompetencijama (procjena - centar). 27


Validnost se odnosi na stepen tačnosti sa kojim dati rezultat, metod ili kriterijum „predviđa“ budući učinak osobe koja se testira. Valjanost metoda odnosi se na zaključke izvučene iz procedure, a ne na samu proceduru. Odnosno, sama metoda odabira može biti pouzdana, ali ne odgovara određenom zadatku: mjeriti ne ono što je potrebno u ovom slučaju. 28


Softver za izradu testova U domaćoj praksi predstavljeni su različiti integrisani programi sa modulom "Psihodijagnostika", na primer, program "1 C: Upravljanje platama i kadrovima 8.0" sa modulom "Psihodijagnostika", razvijen u saradnji sa grupom nastavnika Katedra za psihologiju ličnosti i opštu psihologiju Fakulteta psihologije Moskovskog državnog univerziteta M. V. Lomonosova pod rukovodstvom dr. psih. nauka, prof. A. N. Guseva. Simulator obuke za razvoj sistema procene osoblja i prilagođavanje metoda testiranja Fakulteta za psihologiju TSU, takođe razvijen na osnovu "1 C: Enterprise 8.2" od strane Personnel Soft. 29


Reference: Selekcija i zapošljavanje: tehnologije testiranja i evaluacije / Dominic Cooper, Ivan T. Robertson, Gordon Tinline. - M., izdavačka kuća "Veršina", - 156 str. Psihološka podrška profesionalne aktivnosti: teorija i praksa / Ed. Prof. G. S. Nikiforova. - Sankt Peterburg: Govor, - 816 str. trideset