Biograafiad Omadused Analüüs

Kontrolltesti tunnused kehalises kasvatuses. Testimise põhisätted

ARUANNE

õpilane 137 gr. Ivanova I.

koolitusmetoodika tõhususe kontrollimise kohta
meetodeid kasutades matemaatiline statistika

Aruande osad koostatakse vastavalt käesolevas juhendis toodud näidistele iga mänguetapi lõpus. Läbitud aruandeid säilitatakse biomehaanika osakonnas kuni eksamieelse konsultatsioonini. Spordimetroloogia eksamile ei lubata õpilasi, kes ei ole tehtud töö kohta aru andnud ega ole andnud õpetajale aruandega vihikut.


ma lavastan ärimäng
Kontroll ja mõõtmine spordis

Sihtmärk:

1. Tutvuda kontrolli ja mõõtmise teoreetiliste alustega spordis ja kehalises kasvatuses.

2. Omandada sportlaste kiirusomaduste näitajate mõõtmise oskused.

1. Kontroll füüsilises
haridus ja sport

Kehaline kasvatus ja sporditreening ei ole spontaanne, vaid kontrollitud protsess. Igal ajahetkel on inimene teatud füüsilises seisundis, mille määrab peamiselt tervis (elunäitajate vastavus normile, organismi vastupanuvõime ebasoodsatele äkkmõjudele), kehaehitus ja füüsiliste funktsioonide seisund. .

Inimese füüsilist seisundit on soovitatav kontrollida selle muutmisega õige suund. See juhtimine toimub kehalise kasvatuse ja spordi abil, mis hõlmab eelkõige füüsilisi harjutusi.

Ainult tundub, et õpetaja (või treener) saab hakkama füüsiline seisund, mõjutades sportlase käitumist, st. teatud füüsiliste harjutuste pakkumine, samuti nende teostamise õigsuse ja saadud tulemuste kontrollimine. Tegelikkuses ei kontrolli sportlase käitumist mitte treener, vaid sportlane ise. Sporditreeningu käigus avaldatakse mõju isejuhtivale süsteemile (inimkehale). Individuaalsed erinevused sportlaste seisundis ei anna kindlustunnet, et sama mõju põhjustab sama reaktsiooni. Seetõttu on aktuaalne tagasiside küsimus: teave sportlase seisundi kohta, mille treener saab treeningprotsessi kontrollimise käigus.

Kontroll kehalises kasvatuses ja spordis põhineb näitajate mõõtmisel, olulisemate valikul ja nende matemaatilisel töötlemisel.

Koolitusprotsessi juhtimine koosneb kolmest etapist:

1) teabe kogumine;

2) selle analüüs;

3) otsustamine (planeerimine).

Teabe kogumine toimub tavaliselt keeruka juhtimise käigus, mille objektid on:

1) võistlustegevus;

2) treeningkoormused;

3) sportlase seisund.



Sportlase seisundeid on (V.A. Zaporožanov) kolme tüüpi, olenevalt ühest olekust teise üleminekuks vajaliku intervalli kestusest.

1. verstapost(püsiv) olek. Salvestatud suhteliselt pikk- nädalaid või kuid. Kompleksne omadus sportlase etapiseisundit, mis peegeldab tema võimet näidata sportlikke saavutusi, nimetatakse valmisolekuks ja optimaalset (antud treeningtsükli jaoks parimat) valmisoleku seisundit nimetatakse nn. spordirõivad. On ilmne, et ühe või mitme päevaga pole võimalik sportlikku vormi saavutada ega kaotada.

2. Praegune tingimus. Muutunud ühe või mitu klassi. Sageli võistlustel osalemise või mõnes klassis esinemise tagajärjed koolitustöö venitage mitu päeva. Sel juhul märgib sportlane tavaliselt nii kõrvalnähte (nagu lihasvalu) kui ka positiivseid sündmusi (näiteks suurenenud sooritusvõime). Selliseid muutusi nimetatakse hilinenud treeningefekt.

Sportlase hetkeseis määrab järgmiste treeningute iseloomu ja nendel tehtavate koormuste suuruse. erijuhtum praegune olek, mida iseloomustab valmidus sooritada lähipäevadel võistlusharjutust maksimumilähedase tulemusega, kutsutakse praegune valmisolek.

3. Töökorras tingimus. Muutunud mõju all ühekordne hukkamine füüsiline koormus ja on ajutine (näiteks väsimus, mis on põhjustatud ühekordsest distantsi jooksust; ajutine sooritusvõime tõus pärast soojendust). Sportlase tööseisund muutub treeningu ajal ja seda tuleks arvestada seeriate vaheliste puhkeintervallide planeerimisel, korduvate jooksudega, otsustades, kas lisasoojendus on sobiv jne. Operatsiooniseisundi erijuhtu, mida iseloomustab kohene valmisolek sooritada võistlusharjutust maksimumilähedase tulemusega, nimetatakse operatiivvalmidus.

Vastavalt ülaltoodud klassifikatsioonile on olemas kolm peamist tüüpi sportlase seisundi kontrolli:

1) lavakontroll. Selle eesmärk on hinnata sportlase lavaseisundit (valmidust);

2) voolu juhtimine. Selle põhiülesanne on määrata sportlase seisundi igapäevased (hetkel) kõikumised;

3) operatiivjuhtimine. Selle eesmärk on selgelt hinnata sportlase hetkeseisundit.

Mõõtmist või testi, mis tehakse sportlase seisundi või võimekuse kindlakstegemiseks, nimetatakse katsetada. Mõõtmis- või katseprotseduuri nimetatakse testimiseks.

Iga test sisaldab mõõtmist. Kuid mitte iga mõõtmine ei ole testiks. Katsetena võib kasutada ainult neid, mis vastavad järgmistele metroloogilistele kriteeriumidele. nõuetele:

2) standardimine;

3) reitingusüsteemi olemasolu;

4) testide usaldusväärsus ja informatiivsus (kvaliteeditegur);

5) juhtimise tüüp (astmeline, voolu- või töökorras).

Motoorsetel ülesannetel põhinevat testi nimetatakse motoorika testiks. Motoorseid teste on kolm rühma:

1. Kontrollharjutused, mille sooritamisel saab sportlane ülesande näidata maksimaalset tulemust. Testi tulemuseks on motoorne saavutus. Näiteks aeg, mis kulub sportlasel 100 m jooksu läbimiseks.

2. Standardsed funktsionaalsed testid, mille käigus doseeritakse kõigile sama ülesannet kas tehtud töö mahu või füsioloogiliste muutuste suuruse järgi. Testi tulemuseks on füsioloogilised või biokeemilised parameetrid standardtöö ajal või motoorsed saavutused ajal standardväärtus füsioloogilised nihked. Näiteks pulsisageduse protsentuaalne tõus pärast 20 kükki või kiirus, millega sportlane jookseb fikseeritud pulsisagedusega 160 lööki minutis.

3. Maksimaalsed funktsionaalsed testid, mille käigus peab sportlane näitama maksimaalset tulemust. Testi tulemuseks on füsioloogilised või biokeemilised näitajad maksimaalsel tööl. Näiteks maksimaalne hapnikutarbimine või maksimaalne hapnikuvõlg.

Kvaliteetne testimine eeldab mõõtmisteooria tundmist.

Testiteooria alused 1. Testiteooria põhimõisted 2. Testide usaldusväärsus ja selle määramise viisid

testi küsimused 1. Mida nimetatakse testiks? 2. Millised on testile esitatavad nõuded? 3. Milliseid teste nimetatakse autentseteks? 4. Mida nimetatakse testi usaldusväärsuseks? 5. Loetlege põhjused, mis põhjustavad kordustestimisel tulemuste varieerumist. 6. Mis vahe on klassisisesel ja klassidevahelisel variatsioonil? 7. Kuidas testi usaldusväärsust praktiliselt kindlaks teha? 8. Mis vahe on testi järjepidevusel ja stabiilsusel? 9. Mis on testide samaväärsus? 10. Mis on homogeenne testkomplekt? 11. Mis on heterogeenne testkomplekt? 12. Testide usaldusväärsuse parandamise viisid.

Test on mõõtmine või test, mis tehakse inimese seisundi või võimete kindlakstegemiseks. Testidena ei saa kasutada kõiki mõõtmisi, vaid ainult neid, mis vastavad erinõuetele. Nende hulka kuuluvad: 1. standardimine (protseduur ja testimistingimused peavad olema kõigil testi rakendamise juhtudel samad); 2. töökindlus; 3. informatiivne; 4. hindamissüsteemi olemasolu.

Testi nõuded: n Informatiivne - täpsusaste, millega ta mõõdab omadust (kvaliteeti, võimekust, omadust), milleks seda kasutatakse. n Usaldusväärsus – tulemuste kokkulangevuse määr, kui samu inimesi testitakse korduvalt samadel tingimustel. Järjepidevus - ( erinevad inimesed, kuid samad seadmed ja samad tingimused). n n Standardtingimused – (sama tingimused korduvate mõõtmiste puhul). n Hindesüsteemi olemasolu - (üleminek hindamissüsteemi. Nagu koolis 5 -4 -3. . .).

Usaldusväärsuse ja informatiivsuse nõuetele vastavaid teste nimetatakse heaks või autentseks (kreeka keeles authentico - usaldusväärselt)

Testimisprotsessi nimetatakse testimiseks; saadud mõõtmine arvväärtus- testi tulemus (või testi tulemus). Näiteks 100 m jooks on proovikivi, jooksude läbiviimise kord ja ajavõtt on testimine, jooksuaeg on katse tulemus.

Motoorsetel ülesannetel põhinevaid teste nimetatakse mootori- või motoorikatestideks. Nende tulemused võivad olla kas motoorsed saavutused (kauguse läbimise aeg, korduste arv, läbitud vahemaa jne) või füsioloogilised ja biokeemilised näitajad.

Mõnikord kasutatakse mitte ühte, vaid mitut testi, millel on üks lõppeesmärk (näiteks sportlase seisundi hindamine treeningu võistlusperioodil). Sellist testide rühma nimetatakse testide kompleksiks või komplektiks.

Sama katse, mida rakendatakse samadele katsealustele, peaks andma samadel tingimustel identsed tulemused (välja arvatud juhul, kui katsealused ise on muutunud). Kuid kõige rangema standardimise ja täpse varustuse korral on katsetulemused alati mõnevõrra erinevad. Näiteks uurija, kes näitas äsja selgroo dünamomeetria testis tulemust 215 k. G, näitab kordamisel vaid 190 k. G.

Testide usaldusväärsus ja selle määramise viisid Testi usaldusväärsus on samade inimeste (või muude objektide) kordustestimisel samadel tingimustel tulemuste kokkulangevuse aste.

Tulemuste varieerumist korduva testimise ajal nimetatakse indiviidisiseseks ehk rühmasiseseks või klassisiseseks. Selle kõikumise põhjuseks on neli peamist põhjust: 1. Muutused katsealuste seisundis (väsimus, treenimine, “õppimine”, muutused motivatsioonis, keskendumisvõimes jne). 2. Kontrollimatud muutused välistingimustes ja seadmetes (temperatuur, tuul, õhuniiskus, pinge vooluvõrgus, kõrvaliste isikute kohalolek jne), st kõik, mis on ühendatud mõistega “ juhuslik viga mõõdud".

Selle erinevuse põhjustavad neli peamist põhjust: 3. Testi läbiviiva või hindava isiku seisundi muutumine (ja loomulikult ühe katsetaja või kohtuniku asendamine teisega). 4. Testi ebatäiuslikkus (on teste, mis on ilmselgelt ebausaldusväärsed. Näiteks kui katsealused sooritavad vabaviskeid korvpallikorvi, siis isegi korvpallur, kellel on kõrge protsent tabab, võib kogemata esimestel visetel eksida).

Tõelise testitulemuse mõiste on abstraktsioon (seda ei saa kogemusega mõõta). Seetõttu tuleb kasutada kaudseid meetodeid. Usaldusväärsuse hindamisel eelistatuim dispersioonanalüüs järgneb klassisiseste korrelatsioonikordajate arvutamine. Dispersioonanalüüs võimaldab jagada katses registreeritud testitulemuste variatsiooni komponentideks, mis on tingitud üksikute tegurite mõjust.

Kui registreerite uuritud tulemused mis tahes testis, korrake seda testi erinevad päevad, ja iga päev teha mitu katset, perioodiliselt vahetades katsetajaid, siis on variatsioone: a) subjektide lõikes; n b) päevast päeva; n c) katsetajalt katsetajale; n d) katsest katseni. Dispersioonanalüüs võimaldab neid variatsioone eraldada ja hinnata. n

Seega on testi reliaabluse praktiliseks hindamiseks vaja n esiteks teha dispersioonanalüüs, n teiseks arvutada klassisisene korrelatsioonikordaja (usaldusväärsuse koefitsient).

Rääkides testide usaldusväärsusest, on vaja eristada nende stabiilsust (reprodutseeritavust), järjepidevust ja samaväärsust. n n Testi stabiilsus viitab tulemuste reprodutseeritavusele, kui seda korratakse pärast seda kindel aeg samadel tingimustel. Kordustestimist nimetatakse tavaliselt kordustestiks. Testi järjepidevust iseloomustab testitulemuste sõltumatus testi läbiviija või hindaja isikuomadustest.

Kui kõik testikomplekti kuuluvad testid on väga samaväärsed, nimetatakse seda homogeenseks. Kogu see kompleks mõõdab inimese motoorsete oskuste üht omadust (näiteks kompleks, mis koosneb hüpetest kohast pikkuses, üles ja kolmikkohas; hinnatakse kiiruse-tugevuse omaduste arengutaset). Kui kompleksis puuduvad samaväärsed testid ehk selles sisalduvad testid mõõdavad erinevaid omadusi, siis nimetatakse seda heterogeenseks (näiteks seisudünamomeetriast koosnev kompleks, Abalakovist üleshüpe, 100 meetri jooks).

Testide usaldusväärsust saab mingil määral parandada: n n n a) testimise rangem standardiseerimine; b) katsete arvu suurendamine; c) hindajate (kohtunike, katsete) arvu suurendamine ja nende arvamuste järjepidevuse suurendamine; d) samaväärsete testide arvu suurendamine; e) parem motivatsioon uurinud.

Esimene komponent, testiteooria, sisaldab diagnostiliste andmete töötlemise statistiliste mudelite kirjeldust. See sisaldab mudeleid testüksuste vastuste analüüsimiseks ja mudeleid testi kogutulemuste arvutamiseks. Mellenberg (1980, 1990) nimetas seda "psühhomeetriaks". Klassikaline testiteooria, kaasaegne testiteooria (või testivastuse analüüsi mudel – IRT) ja mudel


ülesannete näidised hõlmavad kolme kõige rohkem oluline tüüp testiteooria mudelid. Psühhodiagnostika käsitlemise objektiks on kaks esimest mudelit.

Klassikaline testiteooria. Selle teooria põhjal on välja töötatud enamik intellektuaalseid ja isiksuse teste. Keskne kontseptsioon See teooria on "usaldusväärsuse" mõiste. Usaldusväärsus viitab tulemuste järjepidevusele, kui neid uuesti hinnata. Teatmeteoses esitatakse see mõiste tavaliselt väga lühidalt ja seejärel antakse Täpsem kirjeldus matemaatilise statistika aparaat. Selles sissejuhatavas peatükis kirjeldame kokkuvõtlikult märgitud mõiste peamist tähendust. Klassikalises testiteoorias mõistetakse usaldusväärsuse all mitmete mõõtmisprotseduuride (peamiselt teste kasutades mõõtmiste) tulemuste korratavust. Usaldusväärsuse mõiste hõlmab mõõtmisvea arvutamist. Testimisprotsessi käigus saadud tulemused võib esitada tõelise tulemuse ja mõõtmisvea summana:

Xi = Ti+ Еj

kus Xi on saadud tulemuste hindamine, Ti on tegelik tulemus ja Еj- mõõtmisviga.

Saadud tulemuste hindamine on reeglina testiülesannete õigete vastuste arv. Tõelist tulemust võib vaadelda tõelise hinnanguna platoonilises mõttes (Gulliksen, 1950). Levinud on eeldatavate tulemuste mõiste, s.t. ideid skooride kohta, mida on võimalik saada suure hulga mõõtmisprotseduuride korduste tulemusena (Issand & Novitš, 1968). Kuid sama hindamisprotseduuri läbiviimine ühe inimesega ei ole võimalik. Seetõttu on vaja probleemile otsida muid lahendusi (Witlman, 1988).

Selle kontseptsiooni raames tehakse mõned eeldused tegelike tulemuste ja mõõtmisvigade kohta. Viimaseid aktsepteeritakse iseseisva tegurina, mis on muidugi üsna haritud oletus, kuna tulemuste juhuslikud kõikumised ei anna kovariatsioone: r EE =0.

Eeldatakse, et tegelike skooride ja mõõtmisvigade vahel puudub seos: rEE=0.


Kogu viga on 0, sest keskmist võetakse tõese hinnanguna aritmeetiline väärtus:

Need eeldused viivad meid lõpuks hästi tuntud usaldusväärsuse määratluseni kui tõelise tulemuse ja kogu dispersioon või avaldis: 1 miinus suhe, mille lugejas on mõõtmisviga ja nimetajas on kogu dispersioon:


, VÕI

Sellest usaldusväärsuse määramise valemist saame vea dispersiooni S 2 (E) on võrdne juhtumite arvu summaarse dispersiooniga (1 - r XX "); seega määratakse mõõtmise standardviga valemiga:

Pärast teoreetiline põhjendus usaldusväärsus ja selle tuletised, on vaja kindlaks määrata konkreetse testi usaldusväärsuse indeks. Testide usaldusväärsuse hindamiseks on olemas praktilised protseduurid, näiteks vahetatavate vormide kasutamine (paralleeltestid), ülesannete jagamine kaheks osaks, kordustestimine ja sisemise järjepidevuse mõõtmine. Iga kataloog sisaldab testitulemuste järjepidevuse indekseid:

r XX \u003d r (x 1, x 2)

kus rXX' on stabiilsuskoefitsient ja x 1 ja x2 - kahe mõõtmise tulemused.

Vahetatavate vormide usaldusväärsuse kontseptsiooni võttis kasutusele ja arendas Gulliksen (1950). See protseduur on üsna töömahukas, kuna see on seotud vajadusega luua paralleelsed ülesanded.

r XX \u003d r (x 1, x 2)

kus rXX' on ekvivalentsussuhe ja x 1 ja x2 - kaks paralleelset testi.

Järgmist protseduuri – põhitesti jagamist kaheks osaks A ja B – on lihtsam kasutada. Testi mõlemast osast saadud hinded on korrelatsioonis. Spearmani-Browni valemi abil hinnatakse testi kui terviku usaldusväärsust:

kus A ja B on testi kaks paralleelset osa.

Järgmine meetod on testüksuste täitmise sisemise järjepidevuse määramine. See meetod põhineb üksikute üksuste kovariatsioonide määramisel. Sg on juhuslikult valitud üksuse dispersioon ja Sgh on kahe juhuslikult valitud elemendi kovariatsioon. Kõige sagedamini kasutatav koefitsient sisemise konsistentsi määramiseks on Cronbachi "alfa". Kasutatakse ka valemit КР20 ja λ-2(lambda-2).

Klassikalises usaldusväärsuse kontseptsioonis defineeritakse mõõtmisvead, mis esinevad nii testimisprotsessis kui ka vaatlusprotsessis. Nende vigade allikad on erinevad: need võivad olla isikuomadused, ja testimistingimuste funktsioonid ning testimisülesanded ise. Olemas spetsiifilisi meetodeid veaarvutused. Teame, et meie tähelepanekud võivad osutuda ekslikeks, meie metoodilised vahendid on ebatäiuslikud samamoodi nagu inimesed ise. (Kuidas mitte meeles pidada Shakespeare'i: "Ebausaldusväärne olete, kelle nimi on mees"). Asjaolu, et klassikalises testiteoorias selgitatakse ja selgitatakse mõõtmisvigu, on oluline positiivne punkt.

Klassikalisel testide teoorial on mitmeid olulisi tunnuseid, mida võib pidada selle puudusteks. Mõnda neist omadustest on teatmeteostes märgitud, kuid nende olulisust (igapäevasest vaatenurgast) sageli ei rõhutata ega ka seda, et teoreetilisest või metodoloogilisest vaatenurgast tuleks neid pidada puudusteks.

Esiteks. Klassikaline testide teooria ja usaldusväärsuse kontseptsioon on keskendunud testide summaarsete näitajate arvutamisele, mis on üksikülesannetes saadud hinnete liitmise tulemus. Jah, tööl


Teiseks. Usaldusväärsuse tegur hõlmab mõõdetud näitajate hajumise suuruse hindamist. Sellest järeldub, et usaldusväärsuse koefitsient on madalam, kui valim on homogeensem (muude väärtuste korral). Testüksuste sisemise ühtsuse koefitsienti ei ole olemas, see koefitsient on alati "kontekstuaalne". Näiteks Crocker ja Algina (1986) pakuvad spetsiaalset "homogeense valimi korrigeerimise" valemit, mis on loodud testijate kõrgeima ja madalaima punktisumma jaoks. Diagnostiku jaoks on oluline teada variatsioonide tunnuseid proovivõtu raam, vastasel juhul ei saa see kasutada selle testi juhendis määratud sisemisi konsistentsi koefitsiente.

Kolmandaks. Aritmeetilisele keskmisele taandamise nähtus on klassikalise usaldusväärsuse kontseptsiooni loogiline tagajärg. Kui testi tulemus kõigub (st see ei ole piisavalt usaldusväärne), on võimalik, et protseduuri kordamisel saavad madala punktisummaga katsealused rohkem kõrged tulemused ja vastupidi, kõrgete punktisummadega subjektid on madalad. Seda mõõtmisprotseduuri artefakti ei saa segi ajada arenguprotsesside tõelise muutuse või ilminguga. Kuid samas pole nende vahel lihtne vahet teha, sest kunagi ei saa välistada arengu käigus muutumise võimalust. Täieliku kindluse huvides on vajalik võrdlus kontrollrühmaga.

Klassikalise teooria põhimõtete järgi koostatud testide neljas omadus on normatiivsete andmete olemasolu. Testinormide tundmine võimaldab uurijal analüüsitulemusi adekvaatselt tõlgendada. Väljaspool norme on testide tulemused mõttetud. Testinormide väljatöötamine on üsna kulukas ettevõtmine, kuna psühholoog peab saama testitulemused esindusliku valimi pealt.

2 Ya ter Laak

Kui rääkida klassikalise usaldusväärsuse kontseptsiooni puudujääkidest, siis on paslik tsiteerida Si-tsma väidet (1992, lk 123-125). Ta märgib, et klassikalise testiteooria esimene ja peamine eeldus on, et testi tulemused järgivad intervalliprintsiipi. Siiski puuduvad uuringud, mis seda oletust toetaksid. Tegelikult on see "mõõtmine meelevaldselt kehtestatud reegli järgi". See funktsioon seab klassikalise testiteooria võrreldes hoiaku mõõtmise skaaladega ja loomulikult kaasaegse testiteooriaga võrreldes ebasoodsasse olukorda. Paljud andmeanalüüsi meetodid (dispersioonanalüüs. regressioonianalüüs, korrelatsiooni- ja faktoranalüüs) põhinevad intervallskaala olemasolu eeldusel. Sellel pole aga kindlat vundamenti. Võtke tõeliste tulemuste skaala väärtuste skaalana psühholoogilised omadused(nt aritmeetiline võime, intelligentsus, neurootilisus) saab ainult oletada.

Teine märkus puudutab asjaolu, et testi tulemused ei ole testitava ühe või teise psühholoogilise omaduse absoluutsed näitajad, neid tuleb käsitleda vaid ühe või teise testi sooritamise tulemustena. Kaks testi võivad väita, et mõõdavad samu psühholoogilisi omadusi (nt intelligentsus, verbaalne võime, ekstravertsus), kuid see ei tähenda, et need kaks testi on samaväärsed ja neil on samad võimalused. Kahe testitud inimese jõudluse võrdlemine erinevate testidega on vale. Sama kehtib ka kahe erineva testi sooritamise kohta ühe õppeaine poolt. Kolmas märkus on seotud eeldusega, et mõõtmise standardviga on indiviidi mis tahes mõõdetava võimekuse taseme puhul sama. Sellel eeldusel pole aga empiirilist kinnitust. Seega pole näiteks mingit garantiid, et heade matemaatiliste võimetega testi sooritaja saab suhteliselt lihtsa aritmeetilise testiga töötades kõrgeid punkte. Sel juhul on madalate või keskmiste võimetega inimene suurema tõenäosusega kõrge hinnangu saanud.

Moodsa testiteooria või vastuste analüüsi teooria raames sisaldavad testielemendid kirjeldust suure


vastajate võimalike vastuste mudelite arv. Need mudelid erinevad aluseks olevate eelduste ja andmenõuete poolest. Raschi mudelit peetakse sageli üksuste vastuse analüüsi (1RT) teooriate sünonüümiks. Tegelikult on see vaid üks mudelitest. Selles esitatud valem seadistuse g tunnuskõvera kirjeldamiseks on järgmine:

kus g- eraldi ülesanne test; eksp- eksponentsiaalfunktsioon (mittelineaarne sõltuvus); δ ("delta") - testi raskusaste.

Muud testitavad esemed nagu h, saavad ka oma iseloomulikud kõverad. Tingimuste täitmine δh > δg (g tähendab seda h- rohkem raske ülesanne. Seega indikaatori mis tahes väärtuse puhul Θ ("teeta" - testitava võimete varjatud omadused) ülesande eduka täitmise tõenäosus h väiksem. Seda mudelit nimetatakse rangeks, kuna on ilmne, et tunnuse madala väljendusastme korral on ülesande täitmise tõenäosus nullilähedane. Selles mudelis pole kohta oletustel ja oletustel. Valikuvõimalustega esemete puhul ei ole vaja teha eeldusi õnnestumise tõenäosuse kohta. Lisaks on see mudel range selles mõttes, et kõigil testitavatel objektidel peab olema sama eristusvõime (kõrge diskrimineerimine peegeldub kõvera järsuses; siin on võimalik ehitada Guttmani skaala, mille järgi igas punktis karakteristikukõver, eseme valmimise tõenäosus varieerub O kuni 1). Selle tingimuse tõttu ei saa kõiki ülesandeid kaasata Raschi mudeli alusel loodud testidesse.

Sellest mudelist on mitu varianti (nt Birnbaura, 1968, Vt Lord & Novik). See võimaldab erinevate diskrimineerivate ülesannete olemasolu

võime.

Hollandi teadlane Mokken (1971) on katseobjektide vastuste analüüsimiseks välja töötanud kaks mudelit, mille nõuded ei ole nii ranged kui Raschi mudelis ja seetõttu ehk realistlikumad. Peamise tingimusena

Viya Mokken esitab seisukoha, et ülesande tunnuskõver peaks järgnema monotoonselt, ilma pausideta. Kõik testiülesanded on suunatud ühe ja sama psühholoogilise omaduse uurimisele, millega tuleks mõõta sisse. Selle sõltuvuse mis tahes vorm on lubatud, kui see ei katke. Seetõttu ei määra tunnuskõvera kuju ükski konkreetne funktsioon. See "vabadus" võimaldab teil kasutada rohkem katseobjekte ja samal ajal ei ole ka hindamise tase tavapärasest kõrgem.

Testivastuse mudelite (IRT) metoodika erineb enamiku eksperimentaalsete ja korrelatsiooniuuringud. Matemaatiline mudel on mõeldud käitumuslike, kognitiivsete, emotsionaalsete omaduste, aga ka arengunähtuste uurimiseks. Need vaadeldavad nähtused piirduvad sageli ülesannete vastustega, mistõttu Mellenberg (1990) nimetas IRT teooriat "mini-käitumise miniteooriaks". Uuringu tulemusi saab teatud määral esitada järjepidevuskõveratena, eriti juhtudel, kui uuritavate tunnuste kohta puuduvad teoreetilised ideed. Seni on meie käsutuses vaid mõned intelligentsuse, võimete ja isiksusetestid, mis on loodud arvukate IRT teooria mudelite põhjal. Saavutustestide väljatöötamisel kasutatakse sagedamini Raschi mudeli variante (Verhelst, 1993), arengunähtuste puhul on aga sobivamad Mokkeni mudelid (vt ka ptk 6).

Testi sooritaja vastus testitavatele elementidele on IRT-mudelite põhiüksus. Reaktsiooni tüübi määrab uuritava tunnuse väljendusaste inimeses. Selliseks tunnuseks võivad olla näiteks aritmeetilised või ruumilised võimed. Enamasti on selleks intelligentsuse üks või teine ​​aspekt, saavutusomadused või isiksuseomadused. Eeldatakse, et selle konkreetse isiku positsiooni teatud uuritud omaduste vahemikus ja konkreetse ülesande eduka täitmise tõenäosuse vahel on mittelineaarne seos. Selle sõltuvuse mittelineaarsus on teatud mõttes intuitiivne. Kuulsad fraasid "Iga algus on raske" (aeglane un-


rea algus) ja "Pühakuks saamine pole nii lihtne" tähendab, et edasine kasvatamine pärast teatud tase läheb raske. Kõver läheneb aeglaselt, kuid peaaegu kunagi ei saavuta 100% edukuse määra.

Mõned mudelid on pigem vastuolus meie intuitiivse arusaamaga. Võtame selle näite. Inimesel, kelle suvalise iseloomuliku raskusastme indeks on võrdne 1,5-ga, on 60-protsendiline tõenäosus ülesande täitmisel õnnestuda. See on vastuolus meie intuitiivse arusaamaga sellisest olukorrast, sest saate ülesande edukalt täita või mitte sellega üldse toime tulla. Võtame selle näite: 100 korda püüab inimene võtta kõrgust 1m 50 cm Edu saadab teda 60 korda, s.o. selle õnnestumisprotsent on 60 protsenti.

Tunnuse tõsiduse hindamiseks on vaja vähemalt kahte ülesannet. Raschi mudel hõlmab tunnuste tõsiduse määramist, olenemata ülesande raskusest. See läheb vastuollu ka meie intuitsiooniga: oletame, et inimesel on 80-protsendiline tõenäosus hüpata kõrgemale 1,30 m, tõenäosus hüpata üle 1,70 m. Seetõttu on sõltumatu muutuja (kõrguse) väärtusest sõltumata võimalik hinnata võimet inimesest kõrgele hüppama.

IRT-mudeleid on umbes 50 (Goldstein & Wood, 1989.) On palju mittelineaarseid funktsioone, mis kirjeldavad (selgitavad) ülesande või ülesannete rühma õnnestumise tõenäosust. Nende mudelite nõuded ja piirangud on erinevad ning need erinevused leiate Raschi mudeli ja Mokkeni skaala võrdlemisel. Nende mudelite nõuded hõlmavad järgmist:

1) vajadus määrata uuritav tunnus ja hinnata isiku positsiooni selle tunnuse ulatuses;

2) ülesannete järjestuse hindamine;

3) konkreetsete mudelite kontrollimine. Psühhomeetrias on mudeli testimiseks välja töötatud palju protseduure.

Mõned teatmeteosed käsitlevad IRT-teooriat kui testobjektide analüüsi vormi (vt näiteks

Croker & Algina, J 986). Siiski võib väita, et IRT teooria on "miniteooria minikäitumise kohta". IRT teooria pooldajad panevad tähele, et kui kesktaseme mõisted (mudelid) on ebatäiuslikud, siis mida saab öelda psühholoogia keerulisemate konstruktsioonide kohta?

Klassikaline ja kaasaegne testiteooria. Inimesed ei saa jätta võrdlemata asju, mis näevad välja peaaegu ühesugused. (Võib-olla seisneb psühhomeetria igapäevane vaste peamiselt inimeste võrdlemises oluliste omaduste järgi ja nende vahel valiku tegemises). Igal esitatud teoorial – nii hinnanguvigade mõõtmise teoorial kui ka testüksuste vastuste matemaatilisel mudelil – on oma toetajad (Goldstein & Wood, 1986).

IRT mudelid ei tekita etteheiteid, et tegemist on "reeglipõhise hindamisega", erinevalt klassikalisest testide teooriast. IRT mudel on keskendunud hinnanguliste omaduste analüüsile. Isiksuseomadusi ja ülesandeomadusi hinnatakse skaalade (järg- või intervall) abil. Lisaks on võimalik võrrelda erinevate testide tulemusnäitajaid, mille eesmärk on uurida sarnaseid omadusi. Lõpuks ei ole skaala iga väärtuse usaldusväärsus sama ja keskmised väärtused on tavaliselt usaldusväärsemad kui skaala alguses ja lõpus olevad väärtused. Seega on IRT mudelid teoreetiliselt paremad. Samuti on erinevusi praktiline kasutamine kaasaegne katseteooria ja klassikaline teooria (Sijstma, 1992, lk 127-130). Kaasaegne testiteooria on keerulisem kui klassikaline teooria, mistõttu kasutavad seda harvemini mittespetsialistid. Lisaks esitab IRT ülesannetele erinõudeid. See tähendab, et üksused tuleks testist välja jätta, kui need ei vasta mudeli nõuetele. See reegel kehtib ka nende ülesannete kohta, mis olid osa laialt levinud klassikalise teooria põhimõtetel üles ehitatud testidest. Test muutub lühemaks ja seetõttu vähem usaldusväärseks.

IRT pakub matemaatilisi mudeleid reaalsete nähtuste uurimiseks. Mudelid peaksid aitama meil mõista nende nähtuste põhiaspekte. Siin on aga suur teoreetiline probleem. Võib kaaluda mudeleid


kui lähenemine selle keerulise reaalsuse uurimisele, milles me elame. Kuid mudel ja tegelikkus ei ole sama asi. Pessimistliku vaate kohaselt on võimalik modelleerida ainult üksikuid (ja pealegi mitte kõige huvitavamaid) käitumistüüpe. Samuti võib kohata väidet, et tegelikkus ei allu üldse modelleerimisele, sest. see ei allu ainult põhjuse ja tagajärje seadustele. Parimal juhul on võimalik modelleerida individuaalseid (ideaalseid) käitumisnähtusi. Modelleerimise võimalustele on veel üks, optimistlikum vaade. Ülaltoodud seisukoht blokeerib võimaluse sügavalt mõista inimkäitumise nähtuste olemust. Ühe või teise mudeli rakendamine tõstatab mõned üldised, põhimõttelised küsimused. Meie arvates pole kahtlust, et IRT on klassikalisest testide teooriast teoreetiliselt ja tehniliselt parem kontseptsioon.

Testide praktiline eesmärk, olenemata nende teoreetilisest alusest, on määrata kindlaks olulised kriteeriumid ja määrata nende põhjal kindlaks teatud psühholoogiliste konstruktsioonide omadused. Kas IRT mudelil on ka selles osas eeliseid? Võimalik, et sellel mudelil põhinevad testid ei anna täpsemaid ennustusi kui klassikalisel teoorial põhinevad testid ning on võimalik, et nende panus psühholoogiliste konstruktsioonide väljatöötamisse ei ole olulisem. Diagnostika eelistab kriteeriume, mis on otseselt seotud üksikisik, asutus või kogukond. Teaduslikult parem mudel ei määratle "ipso facto" sobivamat kriteeriumi ja on teaduslike konstruktsioonide selgitamisel mõnevõrra piiratud. Ilmselt jätkub klassikalisel teoorial põhinevate testide väljatöötamine, kuid samal ajal luuakse uusi IRT mudeleid, mis kehtivad uuringus. rohkem psühholoogilised nähtused.

Klassikalises testide teoorias eristatakse mõisteid "reliability" ja "validity". Katsetulemused peavad olema usaldusväärsed, s.t. esmaste ja kordustestide tulemused peaksid olema järjepidevad. Pealegi,

* ipso facto(lakk) - iseenesest (umbes tõlge).

tulemused peaksid olema vabad (nii palju kui võimalik) hindamisvigadest. Saadud tulemuste üks nõudeid on kehtivuse olemasolu. Samal ajal peetakse töökindlust vajalikuks, kuid mitte veel piisav seisukord testi kehtivus.

Kehtivuse mõiste viitab sellele, et saadud tulemused on praktilises või teoreetilises mõttes seotud millegi olulisega. Järeldused tehtud testi hinded, peab kehtima. Kõige sagedamini räägitakse kahest kehtivuse tüübist: ennustavast (kriteeriumid) ja konstruktiivsest. On ka teist tüüpi kehtivust (vt 3. peatükk). Lisaks saab kehtivust määrata ka kvaasieksperimentide puhul (Cook & Campbell, 1976, Cook & Shadish, 1994). Põhiline valiidsuse liik on aga ikkagi ennustav valiidsus, mille all mõistetakse nii võimet ennustada testitulemuse põhjal midagi olulist tulevase käitumise kohta kui ka võimalust üht või teist sügavamalt mõista. psühholoogilised omadused või kvaliteet.

Esitatud valiidsuse tüüpe käsitletakse igas käsiraamatus ja neile on lisatud testi valiidsuse analüüsi meetodite kirjeldus. Faktoranalüüs on sobivam konstruktsiooni valideerimise määramiseks, samas kui ennustava valiidsuse analüüsimiseks kasutatakse lineaarset regressioonivõrrandit. Teatud tunnuseid (edukust, teraapia efektiivsust) saab ennustada ühe või mitme näitaja põhjal, mis on pooleldi õpitud töötades intellektuaalse või isiksuse testid. Andmetöötlusmeetodid, nagu korrelatsioon, regressioon, dispersioonanalüüs, osakorrelatsioonide ja dispersioonide analüüs, aitavad määrata testi ennustavat kehtivust.

Sageli kirjeldatakse ka sisu kehtivust. Eeldatakse, et kõik testi ülesanded ja ülesanded peaksid kuuluma kindlasse valdkonda (vaimsed omadused, käitumine jne). Sisu kehtivuse mõiste iseloomustab iga testiülesande vastavust mõõdetavale alale. Sisu kehtivust peetakse mõnikord osaks usaldusväärsusest või "ülditatavusest" (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Siiski, millal


Konkreetse ainevaldkonna saavutustestide jaoks esemeid valides on oluline pöörata tähelepanu ka reeglitele, mis puudutavad punktide testi kaasamist.

Klassikalises testiteoorias peetakse usaldusväärsust ja valiidsust üksteisest suhteliselt sõltumatuks. Kuid on ka teine ​​arusaam nende mõistete suhetest. Kaasaegne teooria testid põhinevad mudelite rakendamisel. Parameetreid hinnatakse mõne mudeli raames. Kui ülesanne ei vasta mudeli nõuetele, siis selle mudeli raames tunnistatakse see kehtetuks. Konstruktsiooni valideerimine on osa mudeli enda valideerimisest. See valideerimine viitab peamiselt teadaolevate skaalaomadustega ühemõõtmelise varjatud huvipakkuva tunnuse olemasolu testimisele. Skaala hindeid saab loomulikult kasutada sobivate kriteeriumide määratlemiseks ja neid saab korreleerida teiste konstruktsioonide tulemustega, et anda teavet koonduvate ja lahknevate konstruktsioonide kehtivuse kohta.

Psühhodiagnostika on analoogne keelele, mida kirjeldatakse nelja komponendi ühtsusena, mis on esitatud kolmel tasandil. Esimene komponent, testiteooria, on analoogne süntaksiga, keele grammatikaga. Genereeriv (generatiivne) grammatika on ühelt poolt vaimukas mudel, teiselt poolt reeglitele alluv süsteem. Nende reeglitega põhinevad lihtsad positiivseid ettepanekuid kompleks on ehitatud. Samas jätab see mudel kõrvale kirjelduse, kuidas suhtlusprotsess on korraldatud (mida edastatakse ja mida tajutakse) ja mis eesmärkidel seda läbi viiakse. Selle mõistmiseks on vaja täiendavaid teadmisi. Sama võib öelda ka testide teooria kohta: see on psühhodiagnostikas vajalik, kuid see ei suuda selgitada, mida psühhodiagnostik teeb ja mis on tema eesmärgid.

1.3.2. Psühholoogilised teooriad ja psühholoogilised konstruktsioonid

Psühhodiagnostika on alati millegi konkreetse diagnoos: isikuomadused, käitumine, mõtlemine, emotsioonid. Testid on mõeldud individuaalsete erinevuste hindamiseks. On mitmeid mõisteid

individuaalsed erinevused, millest igaühel on oma eripärad. Kui tunnistatakse, et psühhodiagnostika ei piirdu ainult individuaalsete erinevuste hindamisega, muutuvad psühhodiagnostika jaoks hädavajalikud teised teooriad. Näitena võib tuua vaimse arengu protsesside erinevuste ja sotsiaalse keskkonna erinevuste hindamise. Kuigi individuaalsete erinevuste hindamine ei ole psühhodiagnostika hädavajalik atribuut, on selle valdkonna uurimisel siiski olemas teatud traditsioonid. Psühhodiagnostika sai alguse intelligentsuse erinevuste hindamisest. Testide põhiülesanne oli "geeniuse päriliku edasikandumise kindlakstegemine" (Gallon) või laste valimine treeninguteks (Binet, Simon). IQ mõõtmine sai teoreetilise arusaama ja praktilise arengu Spearmani (Suurbritannia) ja Thurstone'i (USA) töödes. Raymond B. Cattell tegi sarnast asja isiksuseomaduste hindamisel. Psühhodiagnostika seotakse lahutamatult teooriate ja ideedega individuaalsete erinevuste kohta saavutustes (marginaalsete võimete hindamine) ja käitumisvormides (tüüpilise funktsioneerimise tase). See traditsioon kehtib ka tänapäeval. AT õppevahendid Sotsiaalse keskkonna erinevusi hinnatakse psühhodiagnostikas palju harvemini, võrreldes arenguprotsesside endi iseärasustega. Sellele pole mõistlikku seletust. Ühest küljest ei piirdu diagnostika teatud teooriate ja kontseptsioonidega. Teisest küljest vajab see teooriaid, kuna nendes määratakse kindlaks diagnoositud sisu (st "mida" diagnoositakse). Nii võib näiteks intelligentsust käsitleda kui üldised omadused ja paljude üksteisest sõltumatute võimete aluseks. Kui psühhodiagnostika üritab ühest või teisest teooriast “ära pääseda”, siis psühhodiagnostilise protsessi aluseks on esitus terve mõistus. Uuringus kasutatakse erinevaid viise andmeanalüüs ja üldine loogika uurimistöö määrab konkreetse matemaatilise mudeli valiku ja määrab kasutatavate psühholoogiliste mõistete struktuuri. Sellised matemaatilise statistika meetodid


ki, nagu dispersioonanalüüs, regressioonanalüüs, faktoranalüüs, loenduskorrelatsioonid viitavad olemasolule lineaarsed sõltuvused. Nende meetodite ebaõige rakendamise korral "toovad" need saadud andmetele ja kasutatud konstruktsioonidele oma struktuuri.

Ideed sotsiaalse keskkonna erinevustest ja isiksuse arengust ei avaldanud psühhodiagnostikale peaaegu mingit mõju. Õpikud (vt nt Murphy & Davidshofer, 1988) arutlevad klassikaline teooria katsetab ja käsitleb statistilise töötlemise asjakohaseid meetodeid, kirjeldab kuulsad testid, käsitleb psühhodiagnostika kasutamist praktikas: juhtimispsühholoogias, personali valikul, inimese psühholoogiliste omaduste hindamisel.

Individuaalsete erinevuste teooriad (nagu ka ideed erinevuste kohta sotsiaalne keskkond ja vaimse arengu kohta) on sarnased keele semantika uurimisega. See on nii olemuse, sisu kui ka tähenduse uurimine. Tähendusi struktureeritakse teatud viisil (nagu psühholoogilised konstruktsioonid), näiteks sarnasuse või kontrasti (analoogia, lähenemine, lahknemine) kaudu.

1.3.3. Psühholoogilised testid ja muud metoodilised vahendid

Kavandatava skeemi kolmas komponent on testid, protseduurid ja metoodilised vahendid, mille abil kogutakse teavet isiksuseomaduste kohta. Drene ja Siitsma (1990, lk 31) defineerivad teste järgmiselt: „Psühholoogilise testi käsitletakse klassifikatsioonina vastavalt teatud süsteem või mõõtmisprotseduurina, mis võimaldab teha teatud hinnangu ühe või mitme empiiriliselt tuvastatud või teoreetiliselt põhjendatud tunnuse kohta, mis on inimkäitumise teatud aspektis (väljaspool testisituatsiooni). Sel juhul arvestatakse vastajate reaktsiooni teatud hulgale hoolikalt valitud stiimulitele ning saadud vastuseid võrreldakse testinormidega.

Diagnostika nõuab funktsioonide kohta usaldusväärse, täpse ja kehtiva teabe kogumiseks teste ja tehnikaid

ja iseloomulikud isiksuseomadused mõtlemise, emotsioonide ja inimkäitumise kohta. Lisaks katseprotseduuride väljatöötamisele hõlmab see komponent ka järgmised küsimused: kuidas luuakse teste, kuidas formuleeritakse ja valitakse ülesandeid, kuidas kulgeb testimisprotsess, millised on nõuded testimistingimustele, kuidas arvestatakse mõõtmisvigu, kuidas arvutatakse ja tõlgendatakse testi tulemusi.

Testide väljatöötamise käigus eristatakse ratsionaalseid ja empiirilisi strateegiaid. Ratsionaalse strateegia rakendamine algab põhimõistete määratlemisest (näiteks intelligentsuse, ekstravertsuse mõisted) ning nende ideede kohaselt formuleeritakse testülesanded. Sellise strateegia näide on aspektianalüüsi kontseptsioon (tahuteooria), Guttmann (1957, 1968, 1978). Esiteks määratakse peamiste konstruktsioonide erinevad aspektid, seejärel valitakse ülesanded ja ülesanded nii, et iga aspekti võetakse arvesse. Teine strateegia seisneb selles, et ülesanded valitakse empiiriliselt. Näiteks kui teadlane prooviks luua professionaalset huvi pakkuva testi, mis eristaks meditsiinitöötajaid inseneridest, siis oleks protseduur selline. Mõlemad vastajate grupid peavad vastama testi kõikidele punktidele ning need vastuste punktid, mille osas leiti statistiliselt olulisi erinevusi, kaasatakse testi lõppversiooni. Kui näiteks väite "Mulle meeldib kala püüda" vastustes on rühmade vahel erinevusi, siis saab sellest väitest testi element. Selle raamatu põhipunkt on see, et test on seotud kontseptuaalse või taksonoomilise teooriaga, mis määratleb need omadused.

Testi eesmärk on tavaliselt määratletud selle kasutusjuhendis. Test tuleks standardiseerida, et see saaks mõõta erinevusi inimeste, mitte katsetingimuste vahel. Siiski esineb standardiseerimisest kõrvalekaldeid protseduurides, mida nimetatakse "piiride testimiseks" (piiride testimiseks) ja "õppepotentsiaali testideks" (õppepotentsiaali testid). Nendel tingimustel abistatakse vastajat protsessis


testida ja seejärel hinnata sellise protseduuri mõju tulemusele. Ülesannete vastuste punktide arvestamine on objektiivne, s.o. teostatakse standardmenetluse kohaselt. Saadud tulemuste tõlgendamine on samuti rangelt määratletud ja toimub katsenormide alusel.

Psühhodiagnostika kolmas komponent - psühholoogilised testid, tööriistad, protseduurid - sisaldab teatud ülesandeid, mis on psühhodiagnostika väikseimad üksused ja selles mõttes on ülesanded sarnased keele foneemidega. Võimalike foneemide kombinatsioonide arv on piiratud. Ainult teatud foneemilised struktuurid võivad moodustada sõnu ja lauseid, mis annavad kuulajale teavet. Samuti jatestülesanded: ainult teatud kombinatsioonis üksteisega võivad nad saada tõhus vahend vastava konstruktsiooni hinnangud.

Saada oma head tööd teadmistebaasi on lihtne. Kasutage allolevat vormi

Hea töö saidile">

Üliõpilased, magistrandid, noored teadlased, kes kasutavad teadmistebaasi oma õpingutes ja töös, on teile väga tänulikud.

postitatud http://www.allbest.ru/

1. PÕHIMÕISTED

Test on mõõtmine või test, mis tehakse sportlase seisundi või võimete kindlakstegemiseks. Testimise protsessi nimetatakse testimiseks: mõõtmise tulemusena saadud arvväärtus on testi tulemus (või testi tulemus). Näiteks 100m jooks on proovikivi, jooksude läbiviimise kord ja ajavõtt on testimine, jooksuaeg on katse tulemus.

Motoorsetel ülesannetel põhinevaid teste nimetatakse mootori (või mootori) testideks. Nendes testides võivad tulemustena toimida kas motoorsed saavutused (vahemaa läbimise aeg, korduste arv, läbitud vahemaa jne) või füsioloogilised ja biokeemilised näitajad. Sõltuvalt sellest, aga ka ülesandest, millega katsealune silmitsi seisab, eristatakse kolme motoorsete testide rühma (tabel A).

Tabel A. Motoorsete testide variandid.

Testi nimi

Ülesanne sportlasele

Testi tulemused

Kontrollharjutused

motoorne saavutus

1500m jooks, jooksuaeg

Standardsed funktsionaalsed testid

Kõigile sama, doseerituna kas: a) tehtud töö mahu või: b) füsioloogiliste muutuste suuruse järgi

Füsioloogilised või biokeemilised näitajad standardtööl Motoorsed näitajad füsioloogiliste nihete standardväärtusel

Südame löögisageduse registreerimine standardtööl 1000 km/min Jooksukiirus pulsil 160 lööki/min, PVC test (170)

Maksimaalsed funktsionaalsed katsed

Kuva maksimaalne tulemus

Füsioloogilised või biokeemilised parameetrid

Maksimaalse hapnikuvõla või maksimaalse hapnikutarbimise määramine

Mõnikord kasutatakse mitte ühte, vaid mitut testi, millel on üks lõppeesmärk (näiteks sportlase seisundi hindamine treeningu võistlusperioodil). Sellist rühma nimetatakse kompleksiks või testide kogumiks. Kõiki mõõtmisi ei saa testidena kasutada. Selleks peavad nad vastama erinõuetele. Nende hulka kuuluvad: 1) testi usaldusväärsus; 2) testi informatiivsus; 3) reitingusüsteemi olemasolu (vt - järgmine peatükk); 4) standardimine - testimise kord ja tingimused peaksid olema kõigil testi rakendamise juhtudel samad. Usaldusväärsuse ja informatiivsuse nõuetele vastavaid teste nimetatakse headeks ehk autentseteks testideks.

2. TESTIDE USALDUSVÄÄRSUS

2.1 Testi usaldusväärsuse mõiste

füüsilise jooksulindi testimine

Testide usaldusväärsus on tulemuste kokkulangevusaste, kui samu inimesi (või muid objekte) testitakse korduvalt samadel tingimustel. Ideaalis peaks sama test samadel katsealustel samadel tingimustel andma samad tulemused. Kuid isegi kõige rangema testide standardimise ja täpse varustuse korral on katsetulemused alati mõnevõrra erinevad. Näiteks äsja käsidünamomeetril 55 kg pigistanud sportlane näitab mõne minutiga vaid 50 kg. Sellist varieerumist nimetatakse indiviidisiseseks või (kui kasutada matemaatilise statistika üldisemat terminoloogiat) klassisiseseks. Sellel on neli peamist põhjust:

katsealuste seisundi muutus (väsimus, treening, õppimine, motivatsiooni muutus, keskendumine jne);

kontrollimatud muutused välistingimustes ja seadmetes (temperatuur ja niiskus, pinge elektrivõrgus, kõrvaliste isikute kohalolek, tuul jne);

testi läbiviija või hindaja seisundi muutumine, ühe katsetaja või kohtuniku asendamine teisega;

testi ebatäiuslikkus (on testid, mis on kurikuulsalt ebausaldusväärsed, näiteks vabavisked korvpallikorvi pihta enne esimest möödalasku; isegi suure tabamusprotsendiga sportlane võib esimestel visetel kogemata eksida).

Järgmine lihtsustatud näide aitab mõista ideed testide usaldusväärsuse hindamiseks kasutatavate meetodite kohta. Oletame, et tahame võrrelda kahe sportlase püsti kaugushüppe tulemusi kahel katsel. Kui soovite teha täpseid järeldusi, ei tohiks te piirduda ainult registreerimisega parimad tulemused. Oletame, et iga sportlase tulemused erinevad ± 10 cm piires keskmise suurusega ja on vastavalt 220 ± 10 cm (st 210 ja 230 cm) ja 320 ± 10 cm (st 310 ja 330 cm). Sel juhul on järeldus muidugi täiesti ühemõtteline: teine ​​​​sportlane on esimesest parem. Tulemuste erinevus (320 cm - 220 cm = 100 cm) on selgelt suurem kui juhuslikud kõikumised (±10 cm). Palju vähem kindel

Riis. 1. Klassidevahelise ja -sisese variatsiooni suhe kõrge (ülemine) ja madala (alumine) töökindluse korral.

Lühikesed vertikaalsed löögid - üksikkatsete andmed, X ja A "2, X 3 - kolme katsealuse keskmised tulemused

Järeldus on, kui sama klassisisese variatsiooni korral (võrdne ±10 cm) on erinevus ainete vahel (klassidevaheline variatsioon) väike. Oletame, et keskmised väärtused on 220 cm (ühel katsel 210 cm, teisel 230 cm) ja 222 (212 ja 232 cm). Siis võib näiteks juhtuda, et esimesel katsel hüppab esimene sportlane 230 cm ja teine ​​- ainult 212 ning jääb mulje, et esimene on teisest oluliselt tugevam.

Näitest on näha, et esmatähtis pole mitte klassisisene varieeruvus iseeneses, vaid selle seos klassidevaheliste erinevustega. Sama klassisisene variatsioon annab erineva usaldusväärsuse, kui erinevad erinevused klasside vahel (konkreetsel juhul õppeained, joon. 1).

Testi usaldusväärsuse teooria tuleneb asjaolust, et mis tahes inimesel tehtud mõõtmise tulemus on X (- on kahe väärtuse summa:

X^Xoo + Xe, (1)

kus X x on nn tegelik tulemus, mida nad tahavad parandada;

X e on viga, mis on põhjustatud katsealuse seisundi kontrollimatust muutumisest, mis on põhjustatud mõõteseadmest jne.

Definitsiooni järgi mõistetakse tõelist tulemust kui X ^ keskmist väärtust lõpmatus suured numbrid vaatlused samadel tingimustel (seetõttu X juures ja pane lõpmatuse märk oo).

Kui vead on juhuslikud (nende summa on null ja erinevatel katsetel ei sõltu need üksteisest), siis matemaatilisest statistikast järeldub:

O/ = Ooo T<З е,

st katses registreeritud tulemuste dispersioon (st / 2) võrdub tõeste tulemuste ((Xm 2) ja vigade (0 e 2) dispersioonide summaga.

Ooo 2 iseloomustab idealiseeritud (st veavaba) klassidevahelist varieerumist ja e 2 klassisisest varieeruvust. E 2 mõju muudab katsetulemuste jaotust (joonis 2).

Definitsiooni järgi on usaldusväärsuse koefitsient (Hz) võrdne tegeliku dispersiooni ja katses registreeritud dispersiooni suhtega:

Teisisõnu, rn on lihtsalt katses registreeritud variatsiooni tõelise variatsiooni osakaal.

Lisaks usaldusväärsuse koefitsiendile kasutatakse ka usaldusväärsuse indeksit:

mida loetakse salvestatud testväärtuste ja tõeliste väärtuste teoreetiliseks korrelatsioonikordajaks. Nad kasutavad ka usaldusväärsuse standardvea mõistet, mille all mõistetakse registreeritud testitulemuste (X () standardhälvet regressioonijoonest, mis ühendab X g väärtust tegelike tulemustega (X ") - joonis 3 .

2.2 Usaldusväärsuse hindamine katseandmete põhjal

Tõelise testitulemuse kontseptsioon on abstraktsioon. Motikat ei saa eksperimentaalselt mõõta (reaalsuses on ju võimatu samadel tingimustel lõputult palju vaatlusi läbi viia). Seetõttu tuleb kasutada kaudseid meetodeid.

Usaldusväärsuse hindamisel on kõige eelistatavam dispersioonanalüüs koos järgneva nn klassisiseste korrelatsioonikordajate arvutamisega.

Dispersioonanalüüs võimaldab teatavasti eksperimendis registreeritud testitulemuste variatsiooni üksikute tegurite mõjul komponentideks lagundada. Näiteks kui registreerite katsealuste tulemused mis tahes testis, korrates seda testi erinevatel päevadel ja tehes igal päeval mitu katset, muutes perioodiliselt katsetajaid, siis on erinevus:

a) teemalt subjektile (individuaalne variatsioon),

b) päevast päeva

c) katsetajalt katsetajale,

d) proovi proovimise järel.

Dispersioonanalüüs võimaldab eraldada ja hinnata nende tegurite põhjustatud variatsioone.

Lihtsustatud näide näitab, kuidas seda tehakse. Oletame, et 5 katsealust mõõtsid kahe katse tulemusi (k = 5, n = 2)

Dispersioonanalüüsi tulemused (vt matemaatilise statistika käiku, samuti raamatu esimese osa lisa 1) on toodud traditsioonilisel kujul tabelis. 2.

tabel 2

Usaldusväärsust hinnatakse nn klassisisese korrelatsioonikordaja abil:

kus r "u on klassisisene korrelatsioonikordaja (usaldusväärsuse koefitsient, mis eristamiseks tavalisest korrelatsioonikoefitsiendist (r) on tähistatud täiendava algarvuga (r") \\

n on testis kasutatud katsete arv;

n" on katsete arv, mille jaoks usaldusväärsust hinnatakse.

Näiteks kui tahame antud näite põhjal hinnata kahe katse keskmise usaldusväärsust, siis

Kui piirdume ainult ühe katsega, on usaldusväärsus võrdne:

ja kui suurendate katsete arvu neljani, suureneb ka usaldusväärsuse koefitsient veidi:

Seega on usaldusväärsuse hindamiseks vajalik esiteks teha dispersioonanalüüs ja teiseks arvutada klassisisene korrelatsioonikordaja (usaldusväärsuse koefitsient).

Mõned raskused tekivad siis, kui esineb nn trend, st tulemuste süstemaatiline suurenemine või vähenemine katsest katseni (joonis 4). Sel juhul kasutatakse keerukamaid usaldusväärsuse hindamise meetodeid (neid selles raamatus ei kirjeldata).

Kahe katse korral ja trendi puudumisel langevad klassisisese korrelatsioonikordaja väärtused praktiliselt kokku tavalise korrelatsioonikordaja väärtustega esimese ja teise katse tulemuste vahel. Seetõttu saab sellistes olukordades usaldusväärsuse hindamiseks kasutada ka tavalist korrelatsioonikordajat (antud juhul hindab see ühe, mitte kahe katse usaldusväärsust). Kui aga katsete arv testis on suurem kui kaks ja eriti kui kasutatakse keerulisi testimustreid,

Riis. 4. Kuuest katsest koosnev seeria, millest esimesed kolm (ill. vasakul) või kolm viimast (paremal) on trendikad

(näiteks 2 katset päevas kahe päeva jooksul), on vajalik klassisisene koefitsiendi arvutamine.

Usaldusväärsuse koefitsient ei ole testi iseloomustav absoluutne näitaja. See koefitsient võib varieeruda olenevalt katsealuste kontingendist (näiteks algajate ja kvalifitseeritud sportlaste puhul erinev), testimistingimustest (kas korduvaid katseid tehakse üksteise järel või näiteks nädalase intervalliga) ja muud põhjused. Seetõttu on alati vaja kirjeldada, kuidas ja kelle peal test tehti.

2.3 Usaldusväärsus katsepraktikas

Eksperimentaalsete andmete ebausaldusväärsus vähendab korrelatsioonikoefitsientide hinnangute suurust. Kuna ükski test ei saa korreleerida teise testiga rohkem kui iseendaga, siis siin ei ole korrelatsioonikordaja ülempiir enam ±1,00, vaid usaldusväärsusindeks

r (oo = Y~r ja

Et liikuda empiiriliste andmete vaheliste korrelatsioonikordajate hindamiselt tõeliste väärtuste vaheliste korrelatsioonide hindamisele, võib kasutada avaldist

kus r xy on korrelatsioon X ja Y tegelike väärtuste vahel;

1~xy -- korrelatsioon empiiriliste andmete vahel; HSI^-- X ja Y usaldusväärsuse hinnang.

Näiteks kui r xy = 0,60, r xx = 0,80 ja r yy = 0,90, siis on tegelike väärtuste korrelatsioon 0,707.

Ülaltoodud valemit (6) nimetatakse reduktsiooniparanduseks (või Spearmani-Browni valemiks), seda kasutatakse praktikas pidevalt.

Puudub kindel usaldusväärsusväärtus, mis võimaldaks testi vastuvõetavaks pidada. Kõik sõltub "testi rakendamisest tehtud järelduste olulisusest. Enamasti võib spordis siiski kasutada järgmisi ligikaudseid juhiseid: 0,95--0,99 --¦ suurepärane töökindlus, 0,90-^0,94 - - hea, 0,80 - 0,89 - aktsepteeritav, 0,70 - 0,79 - halb, 0,60 - 0,69 - kaheldav individuaalhinnangute puhul, test sobib ainult katsealuste rühma iseloomustamiseks.

Testi usaldusväärsuse suurendamiseks võite suurendada korduskatsete arvu. Nii suurenes katsete arvu suurenedes näiteks katse usaldusväärsus (350 g granaadi viskamine jooksva stardiga): 1 katse - 0,53, 2 katset - 0,72, 3 katset - 0,78, 4 katset - 0,80, 5 katset - 0,82, 6 katset - 0,84. Näitest on näha, et kui algul tõuseb töökindlus kiiresti, siis peale 3-4 katset pidurdub tõus oluliselt.

Mitme korduva katsega saab tulemusi määrata erineval viisil: a) parima katse järgi, b) aritmeetilise keskmise, c) mediaani, d) kahe või kolme parima katse keskmise järgi jne. on näidatud, et enamikul juhtudel on kõige usaldusväärsem aritmeetilise keskmise kasutamine, mediaan on mõnevõrra vähem usaldusväärne ja parim katse on veelgi vähem usaldusväärne.

Rääkides testide usaldusväärsusest, eristavad nad nende stabiilsust (reprodutseeritavust), järjepidevust, samaväärsust.

2.4 Katse stabiilsus

Katse stabiilsuse all mõistetakse tulemuste reprodutseeritavust, kui seda korratakse teatud aja pärast samadel tingimustel. Kordustestimist nimetatakse tavaliselt kordustestiks. Katse stabiilsuse hindamise skeem on järgmine: 1

Siin eristatakse 2 juhtumit. Üks kordustest tehakse selleks, et kogu testi ja kordustesti vahelise aja jooksul saada usaldusväärseid andmeid katsealuse seisundi kohta (näiteks juunikuu suusatajate funktsionaalsuse kohta usaldusväärsete andmete saamiseks mõõdetakse BMD-d kaks korda intervalliga üks nädal). Sel juhul on täpsed testitulemused olulised ja usaldusväärsust tuleks hinnata dispersioonanalüüsi abil.

Teisel juhul võib osutuda oluliseks vaid grupis olevate uuritavate järjestuse säilitamine (kas esimene jääb esimeseks, viimane viimaste hulka). Sel juhul hinnatakse stabiilsust testi ja kordustesti vahelise korrelatsioonikoefitsiendiga.

Testi stabiilsus sõltub:

testi tüüp

testpopulatsioon,

ajavahemik testi ja kordustesti vahel. Näiteks morfoloogilised tunnused väikestega

ajaintervallid on väga stabiilsed; kõige vähem stabiilsed on liigutuste täpsuse testid (näiteks visked sihtmärki).

Täiskasvanutel on testi tulemused stabiilsemad kui lastel; sportlased on stabiilsemad kui mittesportlased.

Katse ja kordustesti vahelise ajaintervalli pikenemisega väheneb testi stabiilsus (tabel 3).

2.5 Testige järjepidevust

Testi järjepidevust iseloomustab testitulemuste sõltumatus testi läbiviija või hindaja isikuomadustest. "Järjepidevuse määrab erinevate eksperimenteerijate, kohtunike, ekspertide samadel katsealustel saadud tulemuste kokkulangevuse määr. kaks võimalust:

Testi läbiviija hindab ainult selle tulemusi, mõjutamata selle toimivust. Näiteks sama kirjalikku tööd võivad erinevad eksamineerijad hinnata erinevalt. Sageli on erinevusi kohtunike hinnangutes võimlemises, iluuisutamises, poksis, käsitsi ajavõtunäitajates, erinevate arstide elektrokardiogrammi või radiograafia hinnangutes jne.

Testi läbiviija mõjutab tulemusi. Näiteks mõned katsetajad on teistest püsivamad ja nõudlikumad, motiveerivad katsealuseid paremini. See mõjutab tulemusi (mida iseenesest saab üsna objektiivselt mõõta).

Testi järjepidevus on sisuliselt selle tulemuste hindamise usaldusväärsus, kui testi viivad läbi erinevad inimesed.

1 Mõiste “järjepidevus” asemel kasutatakse üsna sageli mõistet “objektiivsus”. Selline sõnakasutus on kahetsusväärne, kuna erinevate katsetajate või kohtunike (ekspertide) tulemuste kokkulangevus ei viita sugugi nende objektiivsusele. Nad võivad kõik koos teadlikult või alateadlikult teha vigu, moonutades objektiivset tõde.

2.6 Testi samaväärsus

Sageli on test teatud arvu sama tüüpi testide hulgast tehtud valiku tulemus.

Näiteks korvpallikorviviskeid saab sooritada erinevate nurkade alt, sprinte teha näiteks 50, 60 või 100 meetri kaugusel, jõutõmbeid saab teha rõngastel või kangil, üle- või althaardega. , jne.

Sellistel juhtudel saab kasutada nn paralleelvormide meetodit, kui katsealustel palutakse sooritada kaks versiooni ühest ja samast testist ning seejärel hinnatakse tulemuste kokkulangevuse astet. Siinne testiskeem on järgmine:

Katsetulemuste vahel arvutatud korrelatsioonikordajat nimetatakse ekvivalentsuskoefitsiendiks. Suhtumine testi samaväärsusesse oleneb konkreetsest olukorrast. Ühest küljest, kui kaks või enam testi on samaväärsed, suurendab nende kombineeritud kasutamine hinnangute usaldusväärsust; teisest küljest võib olla kasulik jätta akusse ainult üks samaväärne test – see lihtsustab testimist ja vähendab testikomplekti infosisu vaid veidi. Selle probleemi lahendus sõltub sellistest põhjustest nagu testide keerukus ja kohmakus, nõutava testimise täpsuse aste jne.

Kui kõik testikomplekti kuuluvad testid on väga samaväärsed, nimetatakse seda homogeenseks. Kogu see kompleks mõõdab ühte inimese motoorsete oskuste omadust. Oletame, et seisvatest kaugushüpetest, kõrgushüpetest ja kolmikhüpetest koosnev komplekt on tõenäoliselt homogeenne. Vastupidi, kui kompleksis puuduvad samaväärsed testid, siis kõik selles sisalduvad testid mõõdavad erinevaid omadusi. Sellist kompleksi nimetatakse heterogeenseks. Näide heterogeensest testide akust: jõutõmbed kangil, ettekõverdus (painduvuse testimiseks), 1500 m jooks.

2.7 Testi usaldusväärsuse parandamise viisid

Testide usaldusväärsust saab teatud määral parandada:

a) testimise rangem standardimine,

b) katsete arvu suurendamine,

c) hindajate (kohtunike, ekspertide) arvu suurendamine ja nende arvamuste järjepidevuse suurendamine;

d) samaväärsete testide arvu suurendamine,

e) õppeainete parem motivatsioon.

3. INFORMATIIVSED TESTID

3.1 Põhimõisted

Testi informatiivsus on täpsusaste, millega see mõõdab omadust (kvaliteeti, võimekust, omadust jne), milleks seda kasutatakse. Informatiivsust nimetatakse sageli ka kehtivuseks (inglise keelest uaNaNu - validity, validity, legality). Oletame, et sprinterite - jooksjate ja ujujate - erijõutreeningu taseme määramiseks tahetakse kasutada järgmisi näitajaid: 1) randme dünamomeetria, 2) jalalaba plantaarpainde tugevus, 3) õlaliigese sirutajate tugevus (need lihased). kandma suurt koormust krooli ujumisel) , 4) kaela sirutajalihaste tugevust. Nende testide põhjal tehakse ettepanek juhtida treeningprotsessi, eelkõige motoaparaadi nõrkade lülide leidmiseks ja nende sihipäraseks tugevdamiseks. Kas valitud on head testid? Kas need on informatiivsed? Isegi ilma spetsiaalseid katseid tegemata võib aimata, et teine ​​test on ilmselt informatiivne sprindijooksjatele, kolmas ujujatele ning esimene ja neljas ilmselt ei näita ei ujujad ega jooksjad midagi huvitavat (kuigi need võivad osutuda väga huvitavaks). kasulik muudel spordialadel nagu maadlus). Erinevatel juhtudel võivad samad testid olla erineva informatiivsusega.

Testi teabesisu küsimus on jagatud 2 konkreetseks küsimuseks:

Mida see test mõõdab?

Kuidas ta seda täpselt teeb?

Näiteks kas pikamaajooksjate valmisolekut saab hinnata sellise näitaja järgi nagu maksimaalne hapnikukulu (MOC) ja kui jah, siis millise täpsusega. Teisisõnu, milline on STK infosisu jääjate seas? Kas seda testi saab kasutada kontrolliprotsessis?

Kui testi kasutatakse sportlase seisundi määramiseks (diagnoosiks) uuringu ajal, siis räägitakse diagnostilisest teabest. Kui testitulemuste põhjal tahetakse teha järeldus sportlase võimaliku edasise soorituse kohta, peaks testil olema ennustav informatsioon. Test võib olla diagnostiliselt informatiivne, kuid mitte prognostiline ja vastupidi.

Infosisu astet saab iseloomustada kvantitatiivselt - eksperimentaalsete andmete alusel (nn empiiriline infosisu) ja kvalitatiivselt - sisulise olukorra analüüsi (tähenduslik ehk loogiline infosisu) põhjal.

3.2 Empiiriline informatiivsus (esimene juhtum – on mõõdetav kriteerium)

Empiirilise informatiivsuse määramise idee seisneb selles, et testi tulemusi võrreldakse mõne kriteeriumiga. Selleks arvutage kriteeriumi ja testi vaheline korrelatsioonikordaja (sellist koefitsienti nimetatakse teabesisalduse koefitsiendiks ja seda tähistatakse g gk-ga, kus I on sõna "test" esimene täht, k - sõnas " kriteerium").

Kriteeriumiks võetakse näitaja, mis ilmselgelt ja vaieldamatult peegeldab omadust, mida testiga mõõdetakse.

Sageli juhtub, et on olemas täpselt määratletud kriteerium, millega pakutavat testi võrrelda. Näiteks objektiivselt mõõdetavate tulemustega sportlaste erivalmiduse hindamisel on selliseks kriteeriumiks enamasti tulemus ise: informatiivsem on test, mille korrelatsioon sportliku tulemusega on suurem. Prognoosilise informatsiooni väärtuse määramise puhul on kriteeriumiks näitaja, mille prognoosimine tuleb läbi viia (näiteks kui ennustatakse lapse keha pikkust, siis on kriteeriumiks tema keha pikkus täiskasvanueas) .

Kõige sagedamini on spordimetroloogias kriteeriumid:

Sportlik tulemus.

Spordi põhiharjutuse mis tahes kvantitatiivne tunnus (näiteks sammu pikkus jooksmisel, tõukejõud hüppamisel, edu korvpallis tagalaua all, serveerimine tennises või võrkpallis, täpsete kaugsöötude protsent jalgpallis).

Teise testi tulemused, mille infosisu on tõestatud (seda tehakse juhul, kui test-kriteerium on tülikas ja keeruline ning saab valida mõne teise sama informatiivse, kuid lihtsama testi. Näiteks gaasivahetuse asemel südame löögisageduse määramine). Seda konkreetset juhtumit, kui kriteeriumiks on teine ​​test, nimetatakse konkureerivaks informatiivsuseks.

Teatud rühma kuulumine. Näiteks saate võrrelda riigi rahvusmeeskonna liikmeid, spordimeistreid ja esmaklassilisi sportlasi; kriteeriumiks on kuulumine mõnda neist rühmadest. Sel juhul kasutatakse korrelatsioonianalüüsi spetsiaalseid sorte.

Nn liitkriteerium, näiteks punktide summa kõikvõimalikus. Samas võib igakülgsete ja punktitabelite tüübid olla kas üldtunnustatud või katsetaja poolt äsja koostatud (tabelite koostamise kohta vaata järgmisest peatükist). Liitkriteeriumit kasutatakse siis, kui ühtset kriteeriumi pole (näiteks kui ülesandeks on hinnata üldfüüsilist vormi, mängija oskust sportmängudes vms, ei saa kriteeriumina olla ükski iseenesest võetud näitaja).

Tabelis 4 on näide sama testi infosisu määramisest ¦-- meeste jooksukiirus 30 m jooksus- erinevatel kriteeriumidel.

Kriteeriumi valiku küsimus on tegelikult testi tegeliku väärtuse ja informatiivsuse määramisel kõige olulisem. Näiteks kui ülesandeks on määrata sellise testi infosisu nagu kaugushüpe sprinterite paigalt, siis saab valida erinevaid kriteeriume: tulemus 100 meetri jooksus, sammu pikkus, sammu pikkuse suhe. sääre pikkusele või kõrgusele jne. Testi informatiivsus sel juhul muutub (antud näites tõusis see 0,558-lt jooksukiirusel 0,781-ni sammu pikkuse / jala pikkuse suhte korral).

Spordialadel, kus sportlikkust pole võimalik objektiivselt mõõta, püütakse sellest raskusest mööda saada kunstlike kriteeriumide kehtestamisega. Näiteks võistkondlikul spordialal järjestavad eksperdid kõik mängijad vastavalt nende oskustele kindlasse järjekorda (st koostavad nimekirjad 20, 50 või näiteks 100 tugevaimast mängijast). Sportlase hõivatud kohta (nagu öeldakse, tema auastet) peetakse kriteeriumiks, millega võrreldakse testi tulemusi, et määrata nende informatiivsus.

Tekib küsimus: milleks kasutada teste, kui kriteerium on teada? Kas pole näiteks lihtsam korraldada kontrollvõistlusi ja määrata sportlikku tulemust kui määrata saavutusi kontrollharjutustes? Testide kasutamisel on järgmised eelised:

alati ei ole võimalik ega otstarbekas sportlikku tulemust määrata (näiteks ei saa sageli läbi viia maratonivõistlusi, talvel ei saa enamasti tulemust registreerida odaviskes, suvel aga murdmaasuusatamises);

sporditulemus sõltub paljudest põhjustest (faktoritest), nagu näiteks sportlase jõud, vastupidavus, tehnika jne. Testide kasutamine võimaldab välja selgitada sportlase tugevad ja nõrgad küljed, igaüht hinnata. nendest teguritest eraldi

3.3 Empiiriline informatiivsus (teine ​​juhtum - pole ühtset kriteeriumi; faktoriaalne informatiivsus)

Tihti juhtub, et pole ühtset kriteeriumi, millega pakutud testide tulemusi võrrelda. Oletame, et nad tahavad leida kõige informatiivsemaid teste noorte jõuvalmiduse hindamiseks. Kumba eelistate: jõutõmbeid kangil või kätekõverdusi ebatasastel kangidel, kükki kangiga, jõutõmbeid kangiga või üleminek kükile seliliasendist? Mis võib olla siinkohal õige testi valiku kriteeriumiks?

Saate katsealustele pakkuda suurt hulka erinevaid tugevusteste ja seejärel valida nende hulgast need, mis annavad kogu kompleksi tulemustega suurima korrelatsiooni (lõppude lõpuks ei saa te kogu kompleksi süstemaatiliselt kasutada - see on liiga tülikas ja ebamugav) . Need testid on kõige informatiivsemad: need annavad teavet katsealuste võimalike tulemuste kohta kogu esialgse testide komplekti kohta. Kuid testide komplekti tulemusi ei väljendata ühe numbriga. Muidugi on võimalik moodustada mingi liitkriteerium (näiteks määrata mingil skaalal kogutud punktide summa). Märksa tõhusam on aga teine ​​faktoranalüüsi ideedel põhinev viis.

Faktoranalüüs on üks mitme muutujaga statistika meetoditest (sõna "mitme muutujaga" viitab sellele, et korraga uuritakse paljusid erinevaid näitajaid, näiteks katsealuste tulemusi paljudes testides). See on üsna keeruline meetod, seega on siinkohal soovitatav piirduda ainult selle põhiidee esitamisega.

Faktoranalüüs lähtub asjaolust, et mis tahes testi tulemus on mitme otseselt mittejälgitava (nagu öeldakse teisiti - varjatud) tegurite samaaegse toime tulemus. Näiteks 100, 800 ja 5000 meetri jooksu tulemused sõltuvad sportlase kiirusomadustest, jõust, vastupidavusest jne. Nende tegurite väärtus igal distantsil ei ole võrdselt oluline. Kui valite kaks testi, mida mõjutavad samad tegurid ligikaudu samal määral, siis on nende testide tulemused omavahel tugevas korrelatsioonis (näiteks 800 ja 1000 m distantsidel jooksmisel). Kui testidel pole ühiseid tegureid või need mõjutavad tulemusi vähe, on nende testide vaheline korrelatsioon madal (näiteks 100 ja 5000 meetri tulemuste korrelatsioon). Kui tehakse suur hulk erinevaid teste ja arvutatakse välja nendevahelised korrelatsioonikoefitsiendid, saab faktoranalüüsiga kindlaks teha, kui palju tegureid nendel testidel koos mõjuvad ja milline on nende panuse määr igasse testi. Ja siis on lihtne valida teste (või nende kombinatsioone), mis hindavad kõige täpsemalt üksikute tegurite taset. See on testide informatiivsuse idee. Järgmine konkreetse katse näide näitab, kuidas seda tehakse.

Ülesandeks oli leida kõige informatiivsemad testid erinevate spordialadega tegelevate kolmanda – esimese kategooria õpilassportlaste üldise jõuvalmiduse hindamiseks. Sel eesmärgil uuriti seda (N.V. Averkovich, V.M. Zatsiorsky, 1966) 108 inimest 15 testil. Faktoranalüüsi tulemusena tuvastati kolm tegurit: 1) ülajäsemete tugevus, 2) alajäsemete tugevus, 3) kõhulihaste ja puusa painutajate tugevus. Testitavate seas olid kõige informatiivsemad testid: esimese teguri puhul - surumised, teise jaoks - paigalt kaugushüpe, kolmanda jaoks - sirgete jalgade tõstmine rippus ja maksimaalne üleminekute arv kükiasendisse alates. lamavasse asendisse 1 min. Kui piirduda vaid ühe testiga, siis kõige informatiivsem oli jõupööre lähedalt põiktalale (korduste arv oli hinnanguline).

3.4 Empiiriline informatiseerimine praktilises töös

Empiirilise infosisu näitajate praktilisel kasutamisel tuleb silmas pidada, et need kehtivad ainult nende õppeainete ja tingimuste osas, mille jaoks neid arvutatakse. Algajate rühmas informatiivne test võib osutuda täiesti ebainformatiivseks, kui proovite seda rakendada spordimeistrite rühmas.

Testi infosisu ei ole erinevates rühmades ühesugune. Eelkõige koostiselt homogeensemate rühmade puhul on test tavaliselt vähem informatiivne. Kui määratakse testi informatiivsus mis tahes rühma kohta ja seejärel arvatakse nendest tugevamad koondisesse, siis on sama testi informatiivsus koondises palju madalam. Selle põhjused on selged jooniselt fig. 5: valik vähendab tulemuste üldist dispersiooni rühmas ja vähendab korrelatsioonikordaja väärtusi. Näiteks kui määrata sellise testi informatiivsus nagu IPC 400 m ujujatel, kelle tulemused on järsult erinevad (näiteks 3,55 kuni 6,30), siis on informatiivsuse koefitsient väga kõrge (Y 4 d > 0,90); kui teeme samad mõõtmised ujujate rühmas tulemustega 3,55–4,30, ei ületa g nr absoluutväärtuses 0,4–0,6; kui määrame sama näitaja maailma tugevaimate ujujate jaoks (3,53\u003e, 5 \u003d 4,00), võib informatiivne koefitsient üldiselt "" olla võrdne nulliga: ainult seda testi kasutades ei ole võimalik eristada Ujujad ujuvad näiteks 3.55 ja 3.59: ja neil ja teistel on IPC suurusjärk. on kõrge ja umbes sama.

Informatiivsuse koefitsiendid sõltuvad väga palju testi ja kriteeriumi usaldusväärsusest. Madala usaldusväärsusega test ei ole alati väga informatiivne, seega pole mõtet kontrollida ebausaldusväärseid teste teabe sisu osas. Kriteeriumi ebapiisav usaldusväärsus toob kaasa ka infosisu koefitsientide vähenemise. Ent sellisel juhul oleks vale jätta test ebainformatiivsena tähelepanuta - pole ju testi võimaliku korrelatsiooni ülempiir mitte ±1, vaid selle usaldusväärsusindeks. Seetõttu on vaja võrrelda informatiivsuse koefitsienti selle indeksiga. Tegelik teabesisaldus (korrigeeritud kriteeriumi ebausaldusväärsuse tõttu) arvutatakse järgmise valemi abil:

Nii et ühes töös pandi 4 eksperdi hinnangu põhjal kindlaks veepallisportlase auaste (auastet peeti meisterlikkuse kriteeriumiks). Klassisisese korrelatsioonikordaja abil määratud kriteeriumi usaldusväärsus (järjepidevus) oli 0,64. Informatiivsuse koefitsient oli 0,56. Tegelik informatiivsuse koefitsient (korrigeeritud kriteeriumi ebausaldusväärsusega) on võrdne:

Selle eristusvõime mõiste on tihedalt seotud testi infosisu ja usaldusväärsusega, mida mõistetakse kui testi abil diagnoositud katsealuste minimaalset erinevust (see mõiste on oma tähenduselt sarnane testi tundlikkuse kontseptsiooniga). seade). Testi eripära sõltub:

Individuaalne erinevus tulemustes. Näiteks selline test nagu "korvpalli maksimaalne korduvate visete arv 4 m kauguselt seina 10 sekundi jooksul" on hea algajatele, kuid ei sobi kvalifitseeritud korvpalluritele, kuna need kõik näitavad ligikaudu sama tulemust. ja muutuda eristamatuks. Paljudel juhtudel saab katsealuste vahelist varieerumist (klassidevahelist variatsiooni) suurendada, suurendades testi raskust. Näiteks kui teeme erineva kvalifikatsiooniga sportlastele neile lihtsa funktsionaalse testi (näiteks 20 kükki või töötame veloergomeetril võimsusega 200 kgm/min), siis on füsioloogiliste muutuste suurusjärk ligikaudu sama. kõigile ja valmisoleku taset on võimatu hinnata. Kui neile pakkuda raske ülesanne, siis vahed sportlaste vahel lähevad suureks ning testitulemuste järgi on võimalik hinnata sportlaste valmisolekut.

Testi ja kriteeriumi usaldusväärsus (st indiviididevahelise ja -sisese variatsiooni suhe). Kui sama subjekti tulemused seistes kaugushüpetes erinevad näiteks eel-

juhtudel ± 10 cm, siis kuigi hüppe pikkust saab määrata täpsusega ± 1 cm, on võimatu veendunult eristada katsealuseid, kelle “tõelised” tulemused on 315 ja 316 cm.

Testi infosisul ei ole fikseeritud väärtust, mille järel saab testi "sobivaks" lugeda. Siin oleneb palju konkreetsest olukorrast: prognoosi soovitav täpsus, vajadus hankida vähemalt veidi lisateavet sportlane jne. Praktikas kasutatakse diagnostikaks teste, mille infosisu ei ole väiksem kui 0,3 Ennustamiseks on reeglina vaja suuremat infosisaldust - vähemalt 0,6.

Testide komplekti informatiivsus on loomulikult suurem kui üksiku testi informatiivsus. Tihti juhtub, et ühe testi infosisu on selle testi kasutamiseks liiga madal. Testide kogumi informatiivsus võib olla täiesti piisav.

Testi informatiivset väärtust ei saa alati määrata katse ja selle tulemuste matemaatilise töötlemisega. Näiteks kui ülesandeks on välja töötada eksamipiletid või lõputööde teemad (see on ju ka testimise liik), tuleb valida sellised küsimused, mis on kõige informatiivsemad, mille abil saate kõige täpsemini hinnata lõpetajate teadmised ja valmisolek praktiliseks tööks. Seni tuginevad nad sellistel puhkudel vaid olukorra loogilisele, sisukale analüüsile.

Mõnikord juhtub, et testi informatiivsus on selge ilma igasuguste eksperimentideta, eriti kui test on lihtsalt osa tegevustest, mida sportlane võistlusel sooritab. Vaevalt on katseid vaja, et tõestada selliste näitajate informatiivsust nagu ujumises pöördeaeg, kiirus kaugushüppes jooksu viimastel sammudel, tabamusprotsent vabavisetest korvpallis, söötmise kvaliteet tennises või võrkpallis.

Kuid mitte kõik sellised testid ei ole võrdselt informatiivsed. Näiteks pealeviset jalgpallis, kuigi mängu element, võib vaevalt pidada üheks olulisemaks jalgpallurite oskuse näitajaks. Kui selliseid teste on palju ja neist on vaja valida kõige informatiivsem, ei saa testiteooria matemaatilistest meetoditest loobuda.

Testi infosisu sisukas analüüs ning selle eksperimentaalne ja matemaatiline põhjendus peaksid üksteist täiendama. Ükski neist lähenemisviisidest ei ole iseenesest piisav. Eelkõige juhul, kui katse tulemusena määratakse testi kõrge informatiivsuse koefitsient, tuleb kontrollida, kas see on nn valekorrelatsiooni tagajärg. Teatavasti ilmnevad valekorrelatsioonid, kui mõlema korrelatsioonitunnuse tulemusi mõjutab mõni kolmas näitaja, mis iseenesest ei esinda

huvi. .Näiteks võivad keskkooliõpilased leida olulise seose 100 m jooksu tulemuse ja geomeetria tundmise vahel, kuna nad näitavad keskmiselt paremaid tulemusi nii jooksmises kui ka geomeetria tundmises võrreldes madalamate klasside õpilastega. Väline, kolmas märk, mis põhjustas korrelatsiooni ilmnemise, oli katsealuste vanus. Muidugi oleks teadlane eksinud, kui ta poleks seda märganud ja geomeetriaeksamit 100 meetri jooksjatele testina soovitanud.Et selliseid vigu mitte teha, on vaja analüüsida põhjuse-tagajärje seoseid. mis põhjustas korrelatsiooni kriteeriumi ja testi vahel. Eelkõige on kasulik ette kujutada, mis juhtuks, kui testi tulemused paraneksid. Kas see toob kaasa kriteeriumi tulemuste suurenemise? Antud näites tähendab see: kui õpilane tunneb geomeetriat paremini, kas ta jookseb kiiremini kui 100 m? Ilmselge eitav vastus viib loomuliku järelduseni: geomeetria tundmine ei saa olla sprinteritele proovikiviks. Leitud korrelatsioon on vale. Muidugi on reaalsed olukorrad palju keerulisemad kui see teadlikult loll näide.

Testide sisuka informatiivsuse erijuht on definitsiooni järgi informatiivne sisu. Sel juhul lepivad nad lihtsalt kokku, mis tähendus konkreetsele sõnale (terminile) panna. Näiteks öeldakse: "kõrgushüpe kohast iseloomustab hüppevõimet." Õigem oleks öelda nii: "leime kokku, et nimetame hüppevõimeks seda, mida mõõdetakse kohast üleshüppe tulemusega." Selline vastastikune kokkulepe on vajalik, kuna see hoiab ära asjatute arusaamatuste (võib ju keegi ühel jalal kümnenda hüppe tulemusi mõista hüppevõimena ja kohast kõrgushüpet pidada näiteks "plahvatusohtliku" prooviks). jalgade tugevus).

56.0 Testide standardimine

Inimese aeroobse töövõime hindamiseks mõeldud sobivuse testide standardimine saavutatakse järgmiste põhimõtete järgimisega.

Testimismetoodika peaks võimaldama otseselt mõõta või kaudselt arvutada keha maksimaalset hapnikutarbimist (aeroobset võimekust), kuna see inimese sobivuse füsioloogiline näitaja on kõige olulisem. Seda tähistatakse sümboliga rpax1rrm y 0r ja seda väljendatakse milliliitrites subjekti kehakaalu kilogrammi kohta minutis (ml/kg-min.).

Põhimõtteliselt peaks katsemenetlus olema sama nii labori- kui ka välimõõtmiste puhul, kuid:

1. Laboritingimustes (statsionaarsetes ja mobiilsetes laborites) saab inimese aeroobset tootlikkust vahetult määrata, kasutades üsna keerukaid seadmeid ja suurt hulka mõõtmisi.

2. Põllul hinnatakse aeroobset töövõimet kaudselt piiratud arvu füsioloogiliste mõõtmiste põhjal.

Testide läbiviimise metoodika peaks võimaldama nende tulemusi võrrelda.

Testimine tuleks läbi viia ühel päeval ja eelistatavalt ilma katkestusteta. See võimaldab esialgse ja korduva testimise ajal õigesti jaotada aega, varustust ja jõudu.

Testimismetoodika peaks olema piisavalt paindlik, et võimaldada uurida erineva füüsilise võimekusega, erineva vanuse, soo, erineva aktiivsusega jne inimeste gruppe.

57,0. Seadmete valik

Kõiki neid füsioloogilise testimise põhimõtteid saab jälgida eelkõige järgmiste tehniliste vahendite õige valiku tingimusel:

jooksulint,

veloergomeeter,

steppergomeeter,

vajalikud abiseadmed, mida saab kasutada mis tahes testimisel.

57.1. Jooksurada saab kasutada väga erinevates uuringutes. See seade on aga kõige kallim. Isegi väikseim versioon on liiga mahukas, et seda põllul laialdaselt kasutada. Jooksulint peab olema võimeline muutma kiirust vahemikus 3 kuni (vähemalt) 8 km/h (2–5 mph) ja kallet 0 kuni 30%. Jooksuraja kalle on defineeritud kui vertikaalse tõste protsent jagatud horisontaalse läbitud vahemaaga.

Kaugus ja vertikaaltõus tuleb väljendada meetrites, kiirust meetrites sekundis (m/s) või kilomeetrites tunnis (km/h).

57.2. Jalgratta ergomeeter. Seda instrumenti on lihtne kasutada nii laboris kui ka välitingimustes. See on üsna mitmekülgne, see võib teha erineva intensiivsusega töid - minimaalsest kuni maksimaalse tasemeni.

Veloergomeetril on mehaaniline või elektriline pidurisüsteem. Elektrilist pidurisüsteemi saab toita nii välisest allikast kui ka ergomeetril asuvast generaatorist.

Reguleeritav mehaaniline takistus on väljendatud kilogrammides meetrites minutis (kgm/min) ja vattides. Kilogramm meetrit minutis teisendatakse vattideks järgmise valemi abil:

1 vatt = 6 kgm/min. 2

Veloergomeetril peab olema liikuvalt fikseeritud iste, et selle asendi kõrgust saaks iga inimese jaoks eraldi reguleerida. Testimisel seatakse iste nii, et sellel istuv inimene jõuaks peaaegu täielikult välja sirutatud jalaga alumise pedaalini. Keskmiselt peaks maksimaalselt langetatud asendis istme ja pedaali vaheline kaugus olema 109% katsealuse jala pikkusest.

Veloergomeetrit on erineva kujundusega. Samas ei mõjuta ergomeetri tüüp katse tulemusi, kui näidatud takistus vattides või kilogrammides meetrites minutis vastab täpselt kogu väliskoormusele.

Steppergomeeter. See on suhteliselt odav seade, mille astme kõrgused on reguleeritavad vahemikus 0 kuni 50 cm. Sarnaselt veloergomeetriga saab seda hõlpsasti kasutada nii laboris kui ka põllul.

Kolme testivaliku võrdlus. Igal neist instrumentidest on oma eelised ja puudused (olenevalt sellest, kas seda kasutatakse laboris või välitingimustes). Tavaliselt on jooksulindil töötades max1min U 07 väärtus veidi suurem kui veloergomeetril töötades; veloergomeetri näidikud omakorda ületavad steppergomeetri näitu.

Katsealuste energiakulu tase, kes on puhkeolekus või täidab gravitatsiooni ületamise ülesannet, on otseselt võrdeline nende kaaluga. Seetõttu loovad harjutused jooksulindil ja steppergomeetril kõikidele katsealustele ühesuguse suhtelise koormuse (oma kehale. - Ligikaudu toim.) tõstmiseks etteantud kõrgusele: etteantud kiiruse ja jooksulindi kalde, sammude sageduse ja sammukõrguste juures. steppergomeetril on keretõste kõrgus - on sama (ja tehtav töö on erinev. - Ligikaudu toim.). Seevastu etteantud koormuse fikseeritud väärtusega veloergomeeter nõuab peaaegu sama energiakulu, sõltumata uuritava soost ja vanusest.

58.0, Üldised märkused testimismeetodite kohta

Testide rakendamiseks suurtele inimrühmadele on vaja lihtsaid ja aeganõudvaid testimismeetodeid. Katsealuse füsioloogiliste omaduste üksikasjalikumaks uurimiseks on aga vaja sügavamaid ja töömahukamaid katseid. Testidest suurema väärtuse saamiseks ja nende paindlikumaks kasutamiseks peate leidma nende kahe nõude vahel parima kompromissi.

58.1. Töö intensiivsus. Testimine peaks algama väikeste koormustega, millega katsealustest nõrgemad hakkama saavad. Kardiovaskulaar- ja hingamissüsteemide kohanemisvõime hindamine tuleks läbi viia järk-järgult kasvavate koormustega töötamise protsessis. Seetõttu tuleb funktsionaalsed piirid määrata piisava täpsusega. Praktilised kaalutlused viitavad sellele, et algtaseme ainevahetuse kiirus (st puhkeoleku ainevahetuse kiirus) on antud treeningu sooritamiseks vajaliku energiahulga mõõtühik. Algkoormust ja selle järgnevaid staadiume väljendatakse metaboolse kiiruse kordades inimesel, kes on täielikus puhkeseisundis. Met-i aluseks olevad füsioloogilised näitajad on inimese puhkeolekus tarbitud hapniku hulk (milliliitrites minutis) või selle kaloriekvivalent (kilokalorites minutis).

Koormuste kontrollimiseks Met-i ühikutes või hapnikutarbimise samaväärsetes väärtustes vahetult katsetamise ajal on vaja keerulisi elektroonilisi arvutusseadmeid, mis on praegu veel suhteliselt kättesaamatud. Seetõttu on organismile teatud tüüpi ja intensiivsusega koormuste sooritamiseks vajaliku hapnikuhulga määramisel praktiliselt mugav kasutada empiirilisi valemeid. Prognoositavad (empiiriliste valemite alusel. - Toim.) hapnikutarbimise väärtused jooksulindil töötamisel - kiiruse ja kalde osas, sammutestiga - kõrguse ja sammusageduse osas on hästi kooskõlas otseste mõõtmiste tulemused ja seda saab kasutada füüsilise pingutuse füsioloogilise ekvivalendina, millega on korrelatsioonis kõik testimisel saadud füsioloogilised näitajad.

58.2. Testide kestus. Testimise protsessi lühendamise soov ei tohiks toimuda testi eesmärkide ja eesmärkide arvelt. Liiga lühikesed testid ei anna piisavalt eristatavaid tulemusi, nende eristusvõime on väike; liiga pikad testid aktiveerivad suuremal määral termoregulatsiooni mehhanisme, mis takistab maksimaalse aeroobse jõudluse saavutamist. Soovitatavas katseprotseduuris hoitakse iga koormuse taset 2 minutit. Keskmine katseaeg on 10–16 minutit.

58.3. Näidustused testi lõpetamiseks. Testimine tuleb lõpetada, välja arvatud juhul, kui:

pulsirõhk langeb pidevalt, hoolimata koormuse suurenemisest;

süstoolne vererõhk ületab 240-250 mm Hg. Art.;

diastoolne vererõhk tõuseb üle 125 mm Hg. Art.;

ilmnevad halva enesetunde sümptomid, nagu tugevnev valu rinnus, tugev õhupuudus, vahelduv lonkamine;

ilmnevad anoksia kliinilised tunnused: näo kahvatus või tsüanoos, pearinglus, psühhootilised nähtused, ärritusele reageerimise puudumine;

elektrokardiogrammi näidud näitavad paroksüsmaalset superventrikulaarset või ventrikulaarset arütmiat, ventrikulaarsete ekstrasüstoolsete komplekside ilmnemist enne T-laine lõppu, juhtivuse häireid, välja arvatud kerge L U blokaad, horisontaalse või kahaneva tüüpi /? - 5G vähenemist rohkem kui 0,3 mV. .;";, -

58.4. Ettevaatusabinõud.

Katsealuse tervis. Enne läbivaatust peab uuritav läbima arstliku komisjoni ja saama tõendi selle kohta, et ta on terve. Väga soovitav on teha elektrokardiogramm (vähemalt üks rindkere juhe). Üle 40-aastastele meestele on elektrokardiogrammi tegemine kohustuslik. Regulaarselt korduv vererõhu mõõtmine peaks olema kogu testimisprotseduuri lahutamatu osa. Testimise lõpus tuleb katsealuseid teavitada meetmetest, et vältida vere ohtlikku kogunemist alajäsemetesse.

Vastunäidustused. Katsealusel ei ole lubatud teste sooritada järgmistel juhtudel:

arsti loa puudumine maksimaalse koormusega testides osalemiseks;

suu temperatuur ületab 37,5 ° C;

südame löögisagedus pärast pikka puhkust on üle 100 löögi / min;

südame aktiivsuse selge langus;

müokardiinfarkti või müokardiidi juhtum viimase 3 kuu jooksul; sümptomid ja elektrokardiogrammi näidustused, mis näitavad nende haiguste esinemist; stenokardia nähud;

nakkushaigused, sealhulgas külmetushaigused.

Menstruatsioon ei ole testides osalemise vastunäidustuseks. Mõnel juhul on siiski soovitatav nende pidamise ajakava muuta.

B. STANDARDTESTID

59,0. Standardi läbiviimise peamise metoodika kirjeldus

Kõigi kolme tüüpi harjutuste puhul ja sõltumata sellest, kas test sooritatakse maksimaalse või submaksimaalse koormusega, on testimise põhiprotseduur sama.

Uuritav tuleb laborisse kerges spordiriietuses ja pehmetes jalanõudes. 2 tunni jooksul. enne testi alustamist ei tohiks ta süüa, juua kohvi, suitsetada.

Puhka. Testile eelneb 15-minutiline puhkeaeg. Sel ajal, kui füsioloogilised mõõteriistad paigaldatakse, istub uuritav mugavalt toolil.

majutusperiood. Ükskõik millise katsealuse kõige esimene test ja ka kõik kordustestid annavad piisavalt usaldusväärseid tulemusi, kui põhitestile eelneb lühike vähese mõjuga harjutus – majutusperiood. See kestab 3 minutit. ja teenib järgmisi eesmärke:

tutvustab uuritavat seadmestiku ja töö liigiga, mida ta peab tegema;

uurige eelnevalt subjekti füsioloogilist reaktsiooni ligikaudu 4 Meta koormusele, mis vastab umbes 100 löögile minutis;

kiirendada keha kohanemist testi enda otsese läbiviimisega.

Puhka. Majutusperioodile järgneb lühike (2 min.) puhkeperiood; katsealune istub mugavalt toolil, samal ajal kui katsetaja teeb vajalikke tehnilisi ettevalmistusi.

Test. Testi alguses seatakse kohanemisperioodi koormusega võrdne koormus ja katsealune sooritab harjutusi katkestusteta kuni testi lõpuni. Iga 2 min. töökoormus suureneb 1 Met.

Testimine lõpetatakse ühel järgmistest tingimustest:

katsealune ei suuda ülesannet jätkata;

esinevad füsioloogilise dekompensatsiooni tunnused (vt 58.3);

koormuse viimasel etapil saadud andmed võimaldavad ekstrapoleerida maksimaalset aeroobset võimekust järjestikuste füsioloogiliste mõõtmiste põhjal (teostatakse testimise käigus. - Ligikaudu toim.).

59.5. Mõõdud. Maksimaalset hapnikutarbimist milliliitrites kilogrammi kohta minutis mõõdetakse otse või arvutatakse. Hapnikutarbimise määramise meetodid on väga mitmekesised, nagu ka lisatehnikad, mida kasutatakse iga inimese füsioloogiliste võimete analüüsimiseks. Sellest tuleb pikemalt juttu hiljem.

59.6. Taastumine. Katse lõpus jätkub füsioloogiline vaatlus vähemalt 3 minutit. Katsealune puhkab jälle toolil, tõstes veidi jalgu.

Märge. Kirjeldatud testimistehnika annab võrreldavad füsioloogilised andmed, mis on saadud jooksulindi, veloergomeetri ja steppergomeetri sama koormuse suurendamise järjestusega. Lisaks kirjeldatakse iga kolme seadme testimisprotseduuri eraldi.

60,0. jooksulindi test

Varustus. Jooksurada ja vajalikud tarvikud.

Kirjeldus. Punktis 59.0 kirjeldatud põhilist testimistehnikat järgitakse hoolikalt.

Jooksuri kiirus, kui katsealune sellel kõnnib, on 80 m/min (4,8 km/h ehk 3 mph). Sellel kiirusel on horisontaalselt liikumiseks vajalik energia ligikaudu 3 Meths; iga 2,5% kalde suurenemine lisab energiakulule ühe algse ainevahetuse kiiruse ühiku, st 1 Met. Esimese 2 min lõpus. jooksulindi kalle tõuseb kiiresti 5%, järgmise 2 minuti lõpus - kuni 7,5%, seejärel 10%, 12,5% jne. Täielik skeem on toodud tabelis. üks.

Sarnased dokumendid

    Kontrolltestide läbiviimine kontrollharjutuste või -testide abil, et teha kindlaks valmisolek füüsilisteks harjutusteks. Testide standardimise probleem. Testide väline ja sisemine kehtivus. Kontrolluuringu üle arvestuse pidamine.

    abstraktne, lisatud 12.11.2009

    Motoorsete võimete tunnused ja metoodika painduvuse, vastupidavuse, osavuse, jõu ja kiiruse arendamiseks. Koolinoorte motoorsete võimete testimine kehalise kasvatuse tundides. Motoorsete testide kasutamine praktikas.

    lõputöö, lisatud 25.02.2011

    Antropomeetriliste andmete muutumise dünaamika hindamine süstemaatiliselt kergejõustikuga tegelevatel ja spordisektsioonidega mitteseotud koolilastel. Testide väljatöötamine üldise füüsilise vormi määramiseks; tulemuste analüüs.

    lõputöö, lisatud 07.07.2015

    Testide kasutamise põhisuunad, nende liigitus. Valikukatsed maadluses. Spordisaavutuste hindamise meetodid. Maadleja erilise vastupidavuse proovile panemine. Katsenäitajate omavaheline seos vabamaadlejate tehnilise oskusega.

    lõputöö, lisatud 03.03.2012

    Ujuja erivastupidavuse hindamine kontrollharjutuste abil. Füsioloogiliste süsteemide peamiste reaktsioonide kohanemisvõime veekeskkonna tingimustes. Ujuja testimisel kasutatavate biomeditsiiniliste näitajate hindamise põhimõtete väljatöötamine.

    artikkel, lisatud 03.08.2009

    Tervisliku energia käsitlemine kui tervise aluspõhimõte. Tutvumine võimlemisharjutuste omadustega qigongi süsteemi järgi. Kodutöödeks harjutuste komplekti valik. Testide koostamine tehtud töö kohta järelduste tegemiseks.

    lõputöö, lisatud 07.07.2015

    Spordimetroloogia – füüsiliste suuruste uurimine kehalises kasvatuses ja spordis. Mõõtmise alused, testide teooria, hinnangud ja normid. Näitajate kvaliteedi kvantitatiivse hindamise kohta teabe hankimise meetodid; kvaliteet. Matemaatilise statistika elemendid.

    esitlus, lisatud 12.02.2012

    Kontrolli olemus ja tähendus kehalises kasvatuses ja selle liigid. Kehalise kasvatuse tundides omandatud motoorsete oskuste ja vilumuste kontrollimine ja hindamine. Füüsilise vormi testimine. Õpilaste funktsionaalse seisundi jälgimine.

    kursusetöö, lisatud 06.06.2014

    Absoluutsete ja suhteliste mõõtmisvigade arvutamine. Testitulemuste tõlkimine punktideks, kasutades regressiooni- ja proportsionaalskaala. Testitulemuste järjestamine. Muutused kohtade grupis võrreldes varasemate hinnangutega.

    kontrolltööd, lisatud 11.02.2013

    Motoorse aktiivsuse režiim. Jalgpallurite füüsilist jõudlust määravate tegurite roll pikaajalise treeningu erinevatel etappidel. Ergogeensete ainete tüübid. Füüsilise töövõime taseme määramise testide läbiviimise metoodika.


Põhiküsimused: Test kui mõõtmisvahend. Põhilised testimise teooriad. Testimise funktsioonid, võimalused ja piirangud. Testide kasutamine personali hindamisel. Testide kasutamise eelised ja puudused. Testiülesannete vormid ja liigid. Ülesande ehitustehnoloogia. Testi kvaliteedi hindamine. Usaldusväärsus ja kehtivus. Testi arendustarkvara. 2




Test kui mõõtmisvahend Testoloogia põhimõisted: mõõtmine, test, ülesannete sisu ja vorm, mõõtmistulemuste usaldusväärsus ja kehtivus. Lisaks kasutatakse testoloogias selliseid statistikateaduse mõisteid nagu valim ja üldpopulatsioon, keskmised, variatsioon, korrelatsioon, regressioon jne.




Testülesanne on didaktiliselt ja tehnoloogiliselt efektiivne kontrollmaterjali ühik, testi osa, mis vastab aine sisu puhtuse (või ühemõõtmelisuse), sisu ja loogilise korrektsuse, vormi korrektsuse, geomeetrilise kujutise vastuvõetavuse nõuetele. ülesanne. 6




Traditsiooniline test on standardiseeritud meetod valmisoleku taseme ja struktuuri diagnoosimiseks. Sellises testis vastavad kõik katsealused samadele ülesannetele, samal ajal, samadel tingimustel ja samade vastuste hindamise reeglitega. Testimise eesmärgi saavutamiseks saate luua lõpmatu arvu teste ja kõik need võivad täita ülesande täitmise. kaheksa


Professiogramm (lad. Professio eriala + Gramma kanne) on tunnuste süsteem, mis kirjeldab konkreetset elukutset ning sisaldab ka selle elukutse või eriala järgi töötajale esitatavate normide ja nõuete loetelu. Eelkõige võib professiogramm sisaldada loetelu psühholoogilistest omadustest, millele konkreetsete kutserühmade esindajad peavad vastama. üheksa


Testimise põhiteooria Esimesed teaduslikud tööd testiteooria kohta ilmusid 20. sajandi alguses, psühholoogia, sotsioloogia, pedagoogika ja teiste nn käitumisteaduste ristumiskohas. Välismaised psühholoogid nimetavad seda teadust psühhomeetriaks (Psychometrika) ja õpetajad pedagoogiliseks mõõtmiseks (Educational mõõtmine). Ideoloogiast ja poliitikast varjutamata on nime "testoloogia" tõlgendus lihtne ja läbipaistev: testide teadus. kümme


Esimene etapp – eelajalugu – antiigist kuni 19. sajandi lõpuni, mil olid levinud teadmiste ja võimete kontrolli eelteaduslikud vormid; teine, klassikaline, periood kestis 20. aastate algusest 60. aastate lõpuni, mille käigus loodi klassikaline testide teooria; kolmas periood - tehnoloogiline -, mis algas 70ndatel - adaptiivse testimise ja õppimise meetodite väljatöötamise aeg, testide ja testimisülesannete tõhusa väljatöötamise metoodika katsealuste parameetriliseks hindamiseks mõõdetud latentse kvaliteedi järgi. üksteist


Testimise funktsioonid, võimalused ja piirangud Valikus kasutatavad testid on mõeldud kandidaadi psühholoogilise portree saamiseks, tema võimete, samuti erialaste teadmiste ja oskuste hindamiseks. Testid võimaldavad võrrelda kandidaate omavahel või standarditega ehk ideaalne kandidaat. Testidega mõõdetakse inimese omadusi, mis on vajalikud töö tulemuslikuks täitmiseks. Mõned testid on koostatud nii, et tööandja ise korraldab testi ja arvutab tulemused. Teised nõuavad nende õige rakendamise tagamiseks kogenud konsultantide teenuseid. 12


Testide kasutamise piirangud on seotud - nende kuluka administreerimisega; - isiku võimete hindamiseks sobivusega; - testid ennustavad edukamalt edu lühiajalisi erialaseid ülesandeid sisaldavas töös ega ole eriti kasulikud juhtudel, kui tööl lahendatavad ülesanded võtavad aega mitu päeva või nädalat. kolmteist








2. Kasutatav terminoloogia tuleks valida konkreetse sihtrühma põhjal. Samuti tuleks välja jätta üleliigsed artiklid või artiklid, mis sisaldavad kahte või enamat küsimust, kuna need ajavad vastaja mõnikord segadusse ja muudavad tõlgendamise keeruliseks. 17


3. Kõigi nende nõuete täitmiseks peaksite läbima artiklite kaupa kogu küsimuste panga ja analüüsima, millist eesmärki igaüks neist täidab. Näiteks kui töötatakse välja test, millega saab mõõta raamatupidamispraktikantide analüüsivõimet, tasub mõelda, mida antud juhul tähendab "analüütiline võimekus". kaheksateist




5. Kui on valitud küsimused ja hindamisvormingud, tuleks need teisendada kasutajasõbralikku vormingusse, koos selgelt kirjutatud juhiste ja näidisküsimustega; et testijad mõistaksid täielikult, mida neilt nõutakse. 20


6. Väga sageli kaasatakse selles arenguetapis testi rohkem küsimusi, kui vaja. Mõne hinnangu kohaselt kolm korda rohkem, kui jääb lõplikku katse- või mõõtmissüsteemi. Lähtepunktiks oleks testida väljatöötatavat testi suhteliselt suurel olemasolevatest töötajatest, et tagada kõigi küsimuste hõlpsasti mõistetavus. 21


7. Teadmiste määramise testid algavad tavaliselt lihtsate küsimustega, muutudes lõpupoole järk-järgult keerukamaks. Kui testid on mõeldud sotsiaalsete hoiakute ja isiksuseomaduste mõõtmiseks, võib olla kasulik vahetada negatiivselt ja positiivselt sõnastatud artikleid, et vältida halvasti läbimõeldud vastuseid. 22


8. Viimaseks sammuks on testi rakendamine suurele esinduslikule valimile, et määrata kindlaks toimivus-, kehtivus- ja kehtivusstandardid, enne kui seda saab valikuvahendina kasutada. Lisaks tuleb kindlaks teha testi õiglus tagamaks, et see ei diskrimineeriks ühtegi elanikkonna alarühma (nt etnilised erinevused). 23


Katse kvaliteedi hindamine Selleks, et valikumeetodid oleksid piisavalt tõhusad, peavad need olema usaldusväärsed, kehtivad ja usaldusväärsed. Valikumeetodi usaldusväärsust iseloomustab selle mittevastuvõtlikkus süstemaatiliste mõõtmisvigade suhtes, st selle järjepidevus erinevates tingimustes. 24


Praktikas saavutatakse otsuste tegemise usaldusväärsus kahe või enama erinevatel päevadel tehtud sarnase testi tulemuste võrdlemisel. Teine võimalus usaldusväärsust suurendada on mitme alternatiivse valikumeetodi (nt test ja intervjuu) tulemuste võrdlemine. Kui tulemused on sarnased või samad, võib neid õigeks lugeda. 25


Usaldusväärsus tähendab, et tehtud mõõtmised annavad sama tulemuse, mis eelnevad, st hindamise tulemusi ei mõjuta välistegurid. Kehtivus tähendab, et meetod mõõdab täpselt seda, mida see on ette nähtud. Teadusuuringutes spetsiaalselt väljatöötatud meetoditega saadud teabe maksimaalne võimalik täpsus on piiratud tehniliste teguritega ega ületa 0,8. 26


Personalivaliku praktikas on märgitud, et erinevate hindamismeetodite usaldusväärsus paikneb intervallides: 0,1 - 0,2 - traditsiooniline intervjuu; 0,2 - 0,3 - soovitused; 0,3 - 0,5 - professionaalsed testid; 0,5 - 0,6 - struktureeritud intervjuu, pädevuspõhine intervjuu; 0,5 - 0,7 - kognitiivsed ja isiksuse testid; 0,6 - 0,7 - kompetentsipõhine lähenemine (hindamine - keskus). 27


Kehtivus viitab täpsusele, millega antud tulemus, meetod või kriteerium "ennustab" testitava isiku tulevast sooritust. Meetodite kehtivus viitab protseduurist tehtud järeldustele, mitte protseduurile endale. See tähendab, et valikumeetod võib ise olla usaldusväärne, kuid mitte vastata konkreetsele ülesandele: mõõta mitte seda, mida sel juhul nõutakse. 28


Tarkvara testide arendamiseks Kodumaises praktikas esitletakse erinevaid mooduliga "Psühhodiagnostika" integreeritud programme, näiteks programmi "1 C: Palk ja personalijuhtimine 8.0" koos mooduliga "Psühhodiagnostika", mis on välja töötatud koostöös rühma õpetajate rühmaga. Moskva Riikliku Ülikooli psühholoogiateaduskonna isiksusepsühholoogia ja üldpsühholoogia osakond M. V. Lomonosov dr psych. teadused, prof. A. N. Guseva. TSU psühholoogiateaduskonna personali hindamissüsteemide arendamiseks ja testimismeetodite kohandamiseks mõeldud koolitussimulaator, mis on samuti "1 C: Enterprise 8.2" alusel välja töötatud Personal Softi poolt. 29


Kasutatud kirjandus: valik ja värbamine: testimis- ja hindamistehnoloogiad / Dominic Cooper, Ivan T. Robertson, Gordon Tinline. - M., kirjastus "Vershina", - 156 lk. Professionaalse tegevuse psühholoogiline tugi: teooria ja praktika / Toim. Prof. G. S. Nikiforova. - Peterburi: Kõne, - 816 lk. kolmkümmend