Biograafiad Omadused Analüüs

Statistiliste andmete valemi usaldusväärsus. Statistilise olulisuse mõiste

Tänapäeval on see tõesti liiga lihtne: võite kõndida arvuti juurde ja oma tegemistest vähe või teadmata luua mõistust ja jama tõeliselt hämmastava kiirusega. (J. Box)

Meditsiinistatistika põhimõisted ja mõisted

Selles artiklis tutvustame mõningaid statistika põhimõisteid, mis on meditsiiniuuringutes olulised. Tingimustest on täpsemalt juttu vastavates artiklites.

Variatsioon

Definitsioon. Andmete (märgiväärtuste) hajumise määr väärtusvahemikus

Tõenäosus

Definitsioon. Tõenäosus on määr, mil määral võib teatud sündmus teatud tingimustel aset leida.

Näide. Selgitagem mõiste määratlust lauses "Taastumise tõenäosus ravimi Arimidexi kasutamisel on 70%. Sündmus on "patsiendi paranemine", seisund "patsient võtab Arimidexi", tõenäosusaste on 70% (jämedalt öeldes, 100 Arimidexi võtvast inimesest paraneb 70).

Kumulatiivne tõenäosus

Definitsioon. Kumulatiivne ellujäämise tõenäosus ajahetkel t on sama, mis sel ajal ellu jäänud patsientide osakaal.

Näide. Kui öeldakse, et viieaastase ravikuuri järel on kumulatiivne ellujäämise tõenäosus 0,7, siis see tähendab, et vaadeldavast patsientide rühmast jäi ellu 70% esialgsest arvust ja 30% suri. Teisisõnu, igast sajast inimesest 30 suri esimese 5 aasta jooksul.

Aeg sündmuseni

Definitsioon. Sündmuseni kuluv aeg – see on aeg, mis on väljendatud mõnes ühikus, mis kulub mingist esialgsest ajast kuni sündmuse toimumiseni.

Selgitus. Meditsiiniuuringute ajaühikud on päevad, kuud ja aastad.

Tüüpilised näited algaegadest:

    patsiendi jälgimise algus

    kirurgiline ravi

Tüüpilised näited vaadeldavatest sündmustest:

    haiguse progresseerumine

    kordumine

    patsiendi surm

Näidis

Definitsioon. Valiku teel saadud populatsiooni osa.

Valimi analüüsi tulemuste põhjal tehakse järeldused kogu populatsiooni kohta, mis kehtivad ainult juhul, kui valik oli juhuslik. Kuna juhuslik valik populatsioonist on praktiliselt võimatu, tuleks püüda tagada, et valim oleks üldkogumi suhtes vähemalt esinduslik.

Sõltuvad ja sõltumatud proovid

Definitsioon. Proovid, milles uurimisobjektid värvati üksteisest sõltumatult. Sõltumatute valimite alternatiiviks on sõltuvad (ühendatud, paaritud) valimid.

Hüpotees

Kahepoolsed ja ühepoolsed hüpoteesid

Alustuseks selgitame termini hüpotees kasutamist statistikas.

Enamiku uuringute eesmärk on kontrollida mõne väite õigsust. Uimastitestide eesmärk on kõige sagedamini kontrollida hüpoteesi, et üks ravim on tõhusam kui teine ​​(näiteks Arimidex on tõhusam kui tamoksifeen).

Uuringu ranguse edasiandmiseks väljendatakse kontrollitavat väidet matemaatiliselt. Näiteks kui A on Arimidexi saanud patsiendi eluaastate arv ja T on patsiendi eluaastate arv tamoksifeeniga, siis saab testitava hüpoteesi kirjutada kujul A>T.

Definitsioon. Hüpoteesi nimetatakse kahepoolseks, kui see koosneb kahe suuruse võrdsusest.

Kahepoolse hüpoteesi näide: A=T.

Definitsioon. Hüpoteesi nimetatakse ühepoolseks (ühepoolseks), kui see koosneb kahe suuruse ebavõrdsusest.

Ühepoolsete hüpoteeside näited:

Dihhotoomsed (binaarsed) andmed

Definitsioon. Andmeid väljendatakse ainult kahe kehtiva alternatiivse väärtusega

Näide: patsient on "terve" - ​​"haige". Turse "on" - "ei ole olemas".

Usaldusvahemik

Definitsioon. Mõne suuruse usaldusvahemik on vahemik selle suuruse ümber, mis sisaldab selle suuruse tegelikku väärtust (teatud usaldustasemega).

Näide. Olgu uuritavaks koguseks patsientide arv aastas. Keskmiselt on nende arv 500 ja 95% usaldusvahemik on (350, 900). See tähendab, et suure tõenäosusega (tõenäosusega 95%) võtab aasta jooksul kliinikuga ühendust vähemalt 350 ja mitte rohkem kui 900 inimest.

Määramine. Väga levinud lühend on: 95% CI (95% CI) on usaldusvahemik, mille usaldusnivoo on 95%.

Usaldusväärsus, statistiline olulisus (P - tase)

Definitsioon. Tulemuse statistiline olulisus on selle "tõe" kindlustunde mõõdupuu.

Igasugune uurimus põhineb ainult osal objektidest. Ravimi efektiivsuse uuringut ei viida läbi kõigi planeedi patsientide põhjal üldiselt, vaid ainult teatud patsientide rühma kohta (kõikide patsientide põhjal on lihtsalt võimatu analüüsi teha).

Oletame, et analüüsi tulemusena tehti mingi järeldus (näiteks Arimidexi kasutamine adekvaatse ravina on 2 korda efektiivsem kui tamoksifeen).

Küsimus, mis tuleb esitada, on: "Kui palju saate seda tulemust usaldada?".

Kujutage ette, et viisime läbi uuringu, mis põhineb ainult kahel patsiendil. Loomulikult tuleks sel juhul tulemustesse suhtuda murega. Kui uuriti palju patsiente ("suur hulk" numbriline väärtus oleneb olukorrast), siis võib tehtud järeldusi juba usaldada.

Seega määrab usalduse taseme p-taseme väärtus (p-väärtus).

Kõrgem p-tase vastab proovi analüüsil saadud tulemuste madalamale usaldustasemele. Näiteks p-tase, mis on võrdne 0,05-ga (5%), näitab, et teatud grupi analüüsi käigus tehtud järeldus on ainult nende objektide juhuslik tunnus, mille tõenäosus on vaid 5%.

Ehk väga suure tõenäosusega (95%) saab järeldust laiendada kõikidele objektidele.

Paljudes uuringutes peetakse 5% vastuvõetavaks p-väärtuseks. See tähendab, et kui näiteks p=0,01, siis saab tulemusi usaldada, aga kui p=0,06, siis on see võimatu.

Uuring

perspektiivne uuring on uuring, kus valimid valitakse sisendteguri põhjal ja proovides analüüsitakse mõnda saadud tegurit.

Retrospektiivne uuring on uuring, mille käigus valitakse saadud teguri põhjal valimid ja proovides analüüsitakse mõnda sisendtegurit.

Näide. Esialgne tegur on noorem/vanem kui 20-aastane rase naine. Tulemuseks on see, et laps on kergem/raskem kui 2,5 kg. Analüüsime, kas lapse kaal sõltub ema vanusest.

Kui võtta 2 proovi, millest üks on alla 20-aastastest emadest, teine ​​vanematest ja seejärel analüüsitakse laste massi igas rühmas, siis on see perspektiivuuring.

Kui kogume 2 proovi, ühes - emad, kes sünnitasid kergemad kui 2,5 kg lapsed, teises - raskemad, ja seejärel analüüsime igas rühmas emade vanust, siis on tegemist retrospektiivse uuringuga (muidugi selline uuringut saab läbi viia alles siis, kui katse on lõppenud, st kõik lapsed on sündinud).

Exodus

Definitsioon. Kliiniliselt oluline sündmus, laboriväärtus või märk, mis pakub teadlasele huvi. Kliinilistes uuringutes on tulemused terapeutilise või profülaktilise sekkumise tõhususe hindamise kriteeriumid.

Kliiniline epidemioloogia

Definitsioon. Teadus, mis võimaldab prognoosida konkreetse patsiendi konkreetset tulemust, tuginedes haiguse kliinilise kulgemise uurimisele sarnastel juhtudel, kasutades patsientide uurimisel rangeid teaduslikke meetodeid, et tagada täpsed prognoosid.

Kohort

Definitsioon. Rühm uuringus osalejaid, keda ühendas selle moodustamise ajal mingi ühine joon ja mida uuriti pika aja jooksul.

Juhtimine

Ajalooline kontroll

Definitsioon. Kontrollrühm moodustati ja uuriti uuringule eelneval perioodil.

Paralleeljuhtimine

Definitsioon. Kontrollrühm, mis moodustati samaaegselt põhirühma moodustamisega.

Korrelatsioon

Definitsioon. Kahe märgi (kvantitatiivse või järgu) statistiline seos, mis näitab, et ühe märgi suurem väärtus teatud osal juhtudel vastab suuremale - positiivse (otse) korrelatsiooni korral - teise märgi väärtusele või väiksemale väärtusele. - negatiivse (pöörd)korrelatsiooni korral.

Näide. Leiti oluline korrelatsioon trombotsüütide ja leukotsüütide taseme vahel patsiendi veres. Korrelatsioonikordaja on 0,76.

Riskimäär (CR)

Definitsioon. Riskikordaja (hazard ratio) on teatud ("halva") sündmuse tõenäosuse suhe esimese objektirühma puhul sama sündmuse toimumise tõenäosusesse teise objektirühma puhul.

Näide. Kui mittesuitsetajatel on 20% tõenäosus haigestuda kopsuvähki ja suitsetajatel 100% tõenäosus haigestuda kopsuvähki, siis CR on üks viiendik. Selles näites on esimene rühm objekte mittesuitsetajad, teine ​​​​rühm on suitsetajad ja kopsuvähi esinemist peetakse "halvaks" sündmuseks.

On ilmne, et:

1) kui КР=1, siis on sündmuse toimumise tõenäosus rühmades sama

2) kui КР>1, siis toimub sündmus sagedamini esimese rühma objektidega kui teisest

3) kui CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Metaanalüüs

Definitsioon. Koos statistiline analüüs, mis võtab kokku mitme sama probleemi (tavaliselt ravi-, ennetus-, diagnoosimismeetodite tõhusust) uurinud uuringute tulemused. Uuringute ühendamine annab analüüsiks suurema valimi ja koondatud uuringute suurema statistilise võimsuse. Kasutatakse uuringumeetodi tõhususe kohta tehtud järelduste tõendite või kindlustunde suurendamiseks.

Kaplan-Meieri meetod (mitme Kaplani-Meieri hinnangut)

Selle meetodi leiutasid statistikud E. L. Kaplan ja Paul Meyer.

Meetodit kasutatakse erinevate suuruste arvutamiseks, mis on seotud patsiendi jälgimise ajaga. Selliste väärtuste näited:

    paranemise võimalus ühe aasta jooksul ravimi kasutamisel

    kordumise tõenäosus pärast operatsiooni kolme aasta jooksul pärast operatsiooni

    elulemuse kumulatiivne tõenäosus viie aasta pärast eesnäärmevähiga patsientide seas pärast elundi amputatsiooni

Selgitame välja Kaplan-Meieri meetodi kasutamise eelised.

Väärtuste väärtus "tavalises" analüüsis (mitte Kaplan-Meieri meetodit kasutades) arvutatakse vaadeldava ajavahemiku jagamise põhjal intervallideks.

Näiteks kui uurime patsiendi surma tõenäosust 5 aasta jooksul, siis võib ajaintervalli jagada 5 ossa (alla 1 aasta, 1-2 aastat, 2-3 aastat, 3-4 aastat, 4- 5 aastat), nii ja 10 (igaüks pool aastat) või muu arv intervalle. Tulemused on erinevate partitsioonide puhul erinevad.

Kõige sobivama partitsiooni valimine pole lihtne ülesanne.

Kaplan-Meieri meetodil saadud väärtuste väärtuste hinnangud ei sõltu vaatlusaja intervallideks jagamisest, vaid sõltuvad ainult iga üksiku patsiendi elueast.

Seetõttu on uurijal lihtsam analüüsi läbi viia ning tulemused osutuvad sageli kvaliteetsemaks kui “tavalise” analüüsi tulemused.

Kaplan-Meieri kõver on Kaplan-Meieri meetodil saadud ellujäämiskõvera graafik.

Cox mudel

Selle mudeli leiutas Sir David Roxby Cox (s. 1924), kuulus inglise statistik, üle 300 artikli ja raamatu autor.

Coxi mudelit kasutatakse olukordades, kus ellujäämisanalüüsis uuritavad suurused sõltuvad aja funktsioonidest. Näiteks võib kordumise tõenäosus t aasta pärast (t=1,2,…) sõltuda aja logaritmist (t).

Coxi pakutud meetodi oluliseks eeliseks on selle meetodi rakendatavus väga paljudes olukordades (mudel ei sea rangeid piiranguid tõenäosusjaotuse olemusele ega vormile).

Coxi mudeli alusel saab läbi viia analüüsi (nimetatakse Coxi analüüsiks), mille tulemuseks on riskisuhte väärtus ja riskisuhte usaldusvahemik.

Statistika mitteparameetrilised meetodid

Definitsioon. Statistiliste meetodite klass, mida kasutatakse eelkõige mittenormaalselt jaotunud kvantitatiivsete andmete analüüsiks, aga ka kvalitatiivsete andmete analüüsiks.

Näide. Patsientide süstoolse rõhu erinevuste olulisuse tuvastamiseks sõltuvalt ravi tüübist kasutame mitteparameetrilist Mann-Whitney testi.

Funktsioon (muutuv)

Definitsioon. X uurimisobjekti (vaatluse) omadused. On kvalitatiivseid ja kvantitatiivseid omadusi.

Randomiseerimine

Definitsioon. Meetod uurimisobjektide juhuslikuks jaotamiseks põhi- ja kontrollgruppidesse spetsiaalsete vahenditega (tabelid või juhuslike arvude loendur, mündi viskamine ja muud meetodid kaasatud vaatlusele rühmanumbri juhuslikuks määramiseks). Randomiseerimine minimeerib erinevused rühmade vahel teadaolevate ja tundmatute tunnuste osas, mis võivad mõjutada uuritavat tulemust.

Risk

Atributiivne- ebasoodsa tulemuse (näiteks haiguse) täiendav risk, mis on tingitud teatud tunnuse (riskifaktori) olemasolust uuringuobjektis. See on haiguse tekkeriski osa, mis on selle riskiteguriga seotud, on sellega seletatav ja selle riskifaktori kõrvaldamisel elimineeritav.

Suhteline risk- ebasoodsa seisundi riski suhe ühes rühmas selle seisundi riskiga teises rühmas. Seda kasutatakse prospektiivsetes ja vaatlusuuringutes, kui rühmad on eelnevalt moodustatud ja uuritava seisundi esinemine pole veel toimunud.

veerev eksam

Definitsioon. Meetod statistilise mudeli stabiilsuse, usaldusväärsuse, jõudluse (validsuse) kontrollimiseks vaatluste järjestikuse kustutamise ja mudeli ümberarvutamise teel. Mida sarnasemad on saadud mudelid, seda stabiilsem ja töökindlam on mudel.

Sündmus

Definitsioon. Uuringus täheldatud kliiniline tulemus, nagu tüsistuste esinemine, retsidiiv, taastumine, surm.

Kihistumine

Definitsioon. M valimi moodustamise meetod, mille puhul kõigi osalejate populatsioon, kes vastavad uuringu kaasamise kriteeriumidele, jagatakse esmalt rühmadesse (kihtidesse) ühe või mitme tunnuse (tavaliselt sugu, vanus) alusel, mis võivad mõjutada uuritavat tulemust, ja seejärel igast Nendes rühmades (kihis) värvatakse osalejad sõltumatult katse- ja kontrollrühmadesse. See võimaldab teadlasel tasakaalustada olulisi omadusi katse- ja kontrollrühmade vahel.

Ettenägematute olukordade tabel

Definitsioon. Vaatluste absoluutsete sageduste (arvude) tabel, mille veerud vastavad ühe tunnuse väärtustele ja read mõne teise tunnuse väärtustele (kahemõõtmelise situatsioonitabeli puhul). Absoluutsageduste väärtused asuvad ridade ja veergude ristumiskohas olevates lahtrites.

Toome näite situatsioonitabeli kohta. Aneurüsmi operatsioon tehti 194 patsiendile. Tuntud näitaja turse raskusastme kohta patsientidel enne operatsiooni.

Turse \ Tulemus

turset pole 20 6 26
mõõdukas turse 27 15 42
väljendunud turse 8 21 29
mj 55 42 194

Seega jäi 26 turseta patsiendist pärast operatsiooni ellu 20 patsienti, 6 patsienti suri. Mõõduka tursega 42 patsiendist jäi ellu 27, suri 15 jne.

Hii-ruut test situatsioonitabelite jaoks

Ühe märgi erinevuste olulisuse (usaldusväärsuse) määramiseks sõltuvalt teisest (näiteks operatsiooni tulemus sõltuvalt turse raskusastmest) kasutatakse kontingentsustabelite jaoks hii-ruut testi:


Juhus

Olgu mõne sündmuse tõenäosus võrdne p. Siis on tõenäosus, et sündmust ei toimu, 1-p.

Näiteks kui tõenäosus, et patsient on veel viie aasta pärast elus, on 0,8 (80%), siis tõenäosus, et ta selle aja jooksul sureb, on 0,2 (20%).

Definitsioon. Võimalus on sündmuse toimumise tõenäosuse ja sündmuse mittetoimumise tõenäosuse suhe.

Näide. Meie näites (patsiendi kohta) on tõenäosus 4, kuna 0,8/0,2=4

Seega on paranemise tõenäosus 4 korda suurem kui surma tõenäosus.

Koguse väärtuse tõlgendamine.

1) Kui Juhus=1, siis on sündmuse toimumise tõenäosus võrdne tõenäosusega, et sündmust ei toimu;

2) kui Juhus >1, siis on sündmuse toimumise tõenäosus suurem kui tõenäosus, et sündmust ei toimu;

3) kui võimalus<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

koefitsientide suhe

Definitsioon. Koefitsientide suhe on esimese objektirühma ja teise objektirühma koefitsientide suhe.

Näide. Oletame, et nii mehed kui naised läbivad teatud ravi.

Tõenäosus, et meespatsient on veel viie aasta pärast elus, on 0,6 (60%); tõenäosus, et ta selle aja jooksul sureb, on 0,4 (40%).

Naiste puhul on sarnased tõenäosused 0,8 ja 0,2.

Selle näite koefitsientide suhe on

Koguse väärtuse tõlgendamine.

1) Kui koefitsientide suhe = 1, siis on esimese grupi võimalus võrdne teise rühma võimalusega

2) Kui koefitsientide suhe on >1, on esimese grupi võimalus suurem kui teise grupi võimalus

3) Kui koefitsient<1, то шанс для первой группы меньше шанса для второй группы

Vaatleme tüüpilist näidet statistiliste meetodite rakendamisest meditsiinis. Ravimi loojad viitavad sellele, et see suurendab diureesi proportsionaalselt võetud annusega. Selle oletuse kontrollimiseks annavad nad viiele vabatahtlikule erinevad ravimiannused.

Vaatluste tulemuste kohaselt joonistatakse diureesi ja annuse graafik (joonis 1.2A). Sõltuvus on palja silmaga nähtav. Teadlased õnnitlevad üksteist avastuse puhul ja maailma uue diureetikumi puhul.

Tegelikult võimaldavad andmed usaldusväärselt väita ainult seda, et nendel viiel vabatahtlikul täheldati diureesi sõltuvust annusest. Asjaolu, et see sõltuvus avaldub kõigil inimestel, kes seda ravimit võtavad, pole midagi muud kui oletus.
WJ

koos

zhenie. Ei saa öelda, et see on alusetu – miks muidu katsetada?

Kuid nüüd on ravim turule jõudnud. Üha rohkem inimesi võtab seda lootuses suurendada oma diureesi. Ja mida me näeme? Näeme joonist 1.2B, mis näitab seose puudumist ravimi annuse ja diureesi vahel. Mustad ringid tähistavad esialgse uuringu andmeid. Statistikas on meetodid sellise "mitteesindusliku" saamise tõenäosuse hindamiseks, pealegi segane valim. Selgub, et diureesi ja ravimi annuse vahelise seose puudumisel täheldataks tekkivat "sõltuvust" umbes 5 katses 1000-st. Seega antud juhul teadlastel lihtsalt ei vedanud. Isegi kui nad rakendaksid isegi kõige täiuslikumaid statistilisi meetodeid, ei päästaks see neid ikkagi vigadest.

Seda fiktiivset, kuid tegelikkusest sugugi mitte kaugel näidet me ei toonud selleks, et osutada kasutule
statistika. Ta räägib millestki muust, tema järelduste tõenäosuslikkusest. Statistilise meetodi rakendamise tulemusena ei saa me lõplikku tõde, vaid ainult hinnangu konkreetse eelduse tõenäosusele. Lisaks põhineb iga statistiline meetod oma matemaatilisel mudelil ja selle tulemused on õiged niivõrd, kuivõrd see mudel vastab tegelikkusele.

Lisateavet USALDUSVÄÄRSUSE JA STATISTILISE OLUKSUSUUSE kohta:

  1. Statistiliselt olulised erinevused elukvaliteedi näitajates
  2. Statistiline agregaat. Konto märgid. Pideva ja valikulise uurimistöö kontseptsioon. Nõuded statistilisele üldkogumile ning raamatupidamis- ja aruandlusdokumentide kasutamisele
  3. ESSEE. TONOMEETRI näitude usaldusväärsuse UURING SILMA LAUE LÄBI MÕÕTMISEKS SILMISESE RÕHU MÕÕTMISEKS2018, 2018

Igas eksperimendi (uuringu) teaduslikus ja praktilises olukorras ei saa teadlased uurida kõiki inimesi (üldpopulatsiooni, populatsiooni), vaid ainult teatud valimit. Näiteks isegi kui me uurime suhteliselt väikest rühma inimesi, näiteks neid, kellel on teatud haigus, on väga ebatõenäoline, et meil on ressursse või vajadust iga patsiendi testimiseks. Selle asemel testitakse tavaliselt üldkogumi valimit, kuna see on mugavam ja võtab vähem aega. Kuidas me sel juhul teame, et valimi põhjal saadud tulemused esindavad kogu rühma? Või kui kasutada erialast terminoloogiat, kas võime olla kindlad, et meie uuring kirjeldab tervikut õigesti elanikkonnast, proov, millest me kasutasime?

Sellele küsimusele vastamiseks on vaja kindlaks teha testitulemuste statistiline olulisus. Statistiline olulisus (Märkimisväärne tase, lühendatult allkiri), või /7-olulisuse tase (p tase) - on tõenäosus, et antud tulemus esindab õigesti populatsiooni, millest valimit uuriti. Pange tähele, et see on ainult tõenäosus- ei saa täiesti kindlalt väita, et see uuring kirjeldab õigesti kogu elanikkonda. Parimal juhul saab olulisuse taseme põhjal järeldada, et see on väga tõenäoline. Seega tekib paratamatult järgmine küsimus: milline peaks olema olulisuse tase, et seda tulemust pidada populatsiooni õigeks iseloomustuseks?

Näiteks millise tõenäosuse väärtusega olete nõus väitma, et sellised koefitsiendid on riski võtmiseks piisavad? Kui tõenäosus on 10 100-st või 50 100-st? Aga mis siis, kui see tõenäosus on suurem? Kuidas on koefitsientidega nagu 90 100-st, 95 100-st või 98 100-st? Riskiga seotud olukorra puhul on see valik üsna problemaatiline, kuna see sõltub inimese isikuomadustest.

Psühholoogias arvatakse traditsiooniliselt, et 95 või enam võimalus 100-st tähendab, et tulemuste õigsuse tõenäosus on piisavalt suur, et seda üldistada kogu populatsioonile. See näitaja loodi teadusliku ja praktilise tegevuse käigus - pole seadust, mille järgi seda tuleks juhiseks valida (ja tõepoolest, teistes teadustes valitakse mõnikord ka muid olulisuse taseme väärtusi).

Psühholoogias käsitletakse seda tõenäosust mõnevõrra ebatavaliselt. Selle tõenäosuse asemel, et valim esindab populatsiooni, on tõenäosus, et valim on ei esinda elanikkonnast. Teisisõnu, see on tõenäosus, et avastatud seos või erinevused on juhuslikud, mitte üldkogumi omadused. Seega, selle asemel, et väita, et uuringu tulemused on 95-st 100-st õiged, väidavad psühholoogid, et tõenäosus, et tulemused on valed, on 5 100-st (sarnaselt tähendab 40 100-st võimalust, et tulemused on õiged, 60 100 võimalusest nende vääruse kasuks). Tõenäosuse väärtust väljendatakse mõnikord protsentides, kuid sagedamini kirjutatakse see kümnendmurruna. Näiteks 10 võimalust 100-st on esitatud kümnendmurruna 0,1; 5 100-st on kirjas 0,05; 1:100 – 0,01. Selle salvestusvormi puhul on piirväärtus 0,05. Et tulemust saaks pidada õigeks, peab selle olulisuse tase olema allpool see arv (pidage meeles, et see on tõenäosus, et tulemus pole õige kirjeldab elanikkonda. Terminoloogia kaotamiseks lisame, et "vale tulemuse tõenäosus" (mida õigemini nimetatakse olulisuse tase) tähistatakse tavaliselt ladina tähega R. Katse tulemuste kirjeldus sisaldab tavaliselt kokkuvõtvat järeldust, näiteks "tulemused olid olulised olulisuse tasemel (R p) vähem kui 0,05 (st vähem kui 5%).

Seega olulisuse tase ( R) näitab tõenäosust, et tulemused mitte esindavad elanikkonda. Psühholoogia traditsiooni kohaselt usutakse, et tulemused peegeldavad usaldusväärselt üldpilti, kui väärtus on R alla 0,05 (s.o 5%). See on aga vaid tõenäosuslik väide ja mitte sugugi tingimusteta garantii. Mõnel juhul võib see järeldus olla vale. Tegelikult saame arvutada, kui sageli see võib juhtuda, kui vaatame olulisuse taseme suurust. Olulisuse tasemel 0,05 on 5 juhul 100-st tulemused tõenäoliselt valed. 11a esmapilgul tundub, et seda ei juhtu liiga tihti, aga kui järele mõelda, siis 5 võimalust 100-st on sama, mis 1 20-st. Ehk siis ühel 20-st juhtumist muutub tulemus eksima. Sellised koefitsiendid ei tundu eriti soodsad ja teadlased peaksid pühendumise eest ettevaatlikud olema esimest tüüpi vead. See on vea nimi, mis ilmneb siis, kui teadlased arvavad, et on leidnud tõelisi tulemusi, kuid tegelikult neid pole. Vastupidiseid vigu, mis seisnevad selles, et teadlased usuvad, et nad pole tulemust leidnud, kuid tegelikult on see olemas, nimetatakse teist tüüpi vead.

Need vead tekivad seetõttu, et ei saa välistada ebaõige statistilise analüüsi võimalust. Vea tõenäosus sõltub tulemuste statistilise olulisuse tasemest. Oleme juba märkinud, et tulemuse õigeks lugemiseks peab olulisuse tase olema alla 0,05. Muidugi on mõned tulemused madalamad ja pole harvad tulemused, mis on nii madalad kui 0,001 (väärtus 0,001 näitab, et eksimise tõenäosus on 1:1000). Mida väiksem on p väärtus, seda tugevam on meie usaldus tulemuste õigsuses.

Tabelis. 7.2 näitab olulisuse tasemete traditsioonilist tõlgendust statistilise järelduse võimalikkuse ja seose (erinevuste) olemasolu otsuse põhjendatuse kohta.

Tabel 7.2

Psühholoogias kasutatavate olulisuse tasemete traditsiooniline tõlgendamine

Praktilise uurimistöö kogemuse põhjal on esimest ja teist tüüpi vigade vältimiseks soovitatav vastutustundlike järelduste tegemisel teha otsuseid erinevuste (seoste) olemasolu kohta, keskendudes tasemele. R n märk.

Statistiline test(Statistiline test – see on vahend statistilise olulisuse taseme määramiseks. See on otsustusreegel, mis tagab tõese hüpoteesi aktsepteerimise ja vale tagasilükkamise suure tõenäosusega.

Statistilised kriteeriumid näitavad ka teatud arvu arvutamise meetodit ja seda arvu ennast. Kõiki kriteeriume kasutatakse ühe peamise eesmärgiga: määrata olulisuse tase andmed, mida nad analüüsivad (st tõenäosus, et andmed peegeldavad tegelikku mõju, mis esindab õigesti populatsiooni, millest valim moodustati).

Mõnda kriteeriumi saab kasutada ainult normaalselt jaotatud andmete puhul (ja kui tunnust mõõdetakse intervallskaalal) – neid kriteeriume nimetatakse tavaliselt nn. parameetriline. Teiste kriteeriumide abil saate andmeid analüüsida peaaegu iga jaotusseadusega - neid nimetatakse mitteparameetriline.

Parameetrilised kriteeriumid - kriteeriumid, mis sisaldavad arvutusvalemis jaotusparameetreid, s.o. keskmised ja dispersioonid (õpilase t-test, Fisheri F-test jne).

Mitteparameetrilised kriteeriumid - kriteeriumid, mis ei sisalda jaotusparameetreid arvutamise valemis ja põhinevad töösagedustel või auastmetel (kriteerium K Rosenbaum, kriteerium U Manna - Whitney

Näiteks kui ütleme, et erinevuste olulisus määrati Studenti t-testiga, siis peame silmas seda, et empiirilise väärtuse arvutamiseks kasutati Studenti t-testi meetodit, mida seejärel võrreldakse tabeli (kriitilise) väärtusega.

Empiirilise (arvutasime) ja kriteeriumi kriitiliste väärtuste (tabel) suhte järgi saame hinnata, kas meie hüpotees on kinnitatud või ümber lükatud. Enamasti on selleks, et saaksime erinevusi olulisteks tunnistada, et kriteeriumi empiiriline väärtus ületaks kriitilist, kuigi on kriteeriume (näiteks Mann-Whitney test või märgitest). peame järgima vastupidist reeglit.

Mõnel juhul sisaldab kriteeriumi arvutusvalem uuringuvalimis vaatluste arvu, mida tähistatakse kui P. Spetsiaalse tabeli abil määrame, milline erinevuste statistilise olulisuse tase vastab antud empiirilisele väärtusele. Enamasti võib sama kriteeriumi empiiriline väärtus osutuda oluliseks või ebaoluliseks, olenevalt vaatluste arvust uuringuvalimis ( P ) või nn vabadusastmete arv , mis on tähistatud kui v (g>) või mõlemad df (mõnikord d).

Teades P või vabadusastmete arvu, saame määrata kriteeriumi kriitilised väärtused spetsiaalsete tabelite abil (peamised on toodud lisas 5) ja võrrelda saadud empiirilist väärtust nendega. Tavaliselt kirjutatakse see nii: n = Kriteeriumi 22 kriitilist väärtust on tSt = 2.07" või "at v (d) = 2, Studenti kriteeriumi kriitilised väärtused on = 4,30 "ja nn.

Tavaliselt eelistatakse siiski parameetrilisi kriteeriume ja me peame sellest seisukohast kinni. Neid peetakse usaldusväärsemateks ja need võivad anda rohkem teavet ja sügavamat analüüsi. Mis puudutab matemaatiliste arvutuste keerukust, siis arvutiprogrammide kasutamisel see keerukus kaob (kuid mõned teised tunduvad siiski üsna ületatavad).

  • Selles õpikus me statistika probleemi üksikasjalikult ei käsitle
  • hüpoteesid (null - R0 ja alternatiiv - Hj) ja statistilised otsused, kuna psühholoogiatudengid õpivad seda eraldi distsipliinis "Psühholoogia matemaatilised meetodid". Lisaks tuleb tähele panna, et uurimistöö aruande (kursitöö või lõputöö, publikatsiooni) koostamisel statistilisi hüpoteese ja statistilisi lahendusi reeglina ei esitata. Tavaliselt on tulemuste kirjeldamisel märgitud kriteerium, vajalik kirjeldav statistika (keskmised, sigma, korrelatsioonikordajad jne), kriteeriumide empiirilised väärtused, vabadusastmed ja tingimata p-olulisuse tase. Seejärel sõnastatakse testitava hüpoteesi kohta sisukas järeldus, mis näitab (tavaliselt ebavõrdsuse vormis) saavutatud või saavutamata olulisuse taset.

USALDUSVÄÄRSUS STATISTIKA

- Inglise usaldusväärsus/kehtivus, statistiline; saksa keel Validitat, statistische. Järjepidevus, objektiivsus ja mitmetähenduslikkuse puudumine statistilises testis või C.L. mõõtude komplekt. D. s. saab testida, korrates sama testi (või küsimustikku) samal teemal, et näha, kas saadakse samad tulemused; või võrreldes testi erinevaid osi, mis peaksid mõõtma sama objekti.

Antinazi. Sotsioloogia entsüklopeedia, 2009

Vaadake, mis on "STATISTILINE ULDUSVÄÄRSUS" teistes sõnaraamatutes:

    USALDUSVÄÄRSUS STATISTIKA- Inglise. usaldusväärsus/kehtivus, statistiline; saksa keel Validitat, statistische. Järjepidevus, objektiivsus ja ebaselgus statistilises testis või s. mõõtude komplekt. D. s. seda saab kontrollida sama testi kordamisega (või ... ... Sotsioloogia seletav sõnaraamat

    Statistikas nimetatakse väärtust statistiliselt oluliseks, kui selle juhusliku või isegi äärmuslikuma esinemise tõenäosus on väike. Siin mõistetakse äärmuse all teststatistika nullhüpoteesist kõrvalekaldumise astet. Erinevust nimetatakse ... ... Vikipeediaks

    Statistilise stabiilsuse füüsikaline nähtus seisneb selles, et valimi suuruse suurenemisega kaldub juhusliku sündmuse sagedus või füüsikalise suuruse keskmine väärtus mingi kindla numbrini. Statistilise ... ... Vikipeedia fenomen

    ERINEVUSE USKINDLUS (sarnasus)- analüütiline ja statistiline protseduur valimite erinevuste või sarnasuste olulisuse taseme kindlaksmääramiseks vastavalt uuritud näitajatele (muutujatele) ... Kaasaegne haridusprotsess: põhimõisted ja terminid

    ARUANDLUS, STATISTIKA Suur raamatupidamissõnastik

    ARUANDLUS, STATISTIKA- riikliku statistilise vaatluse vorm, mille käigus vastavad asutused saavad ettevõtetelt (organisatsioonidelt ja asutustelt) neile vajalikku teavet seadusega ettenähtud aruandlusdokumentide (statistiliste aruannete) kujul ... Suur majandussõnastik

    Teadus, mis uurib inimeste ühiskonnaelu massinähtuste süstemaatilise vaatluse meetodeid, nende numbriliste kirjelduste koostamist ja nende kirjelduste teaduslikku töötlemist. Seega on teoreetiline statistika teadus ...... Entsüklopeediline sõnaraamat F.A. Brockhaus ja I.A. Efron

    Korrelatsioonikordaja- (Korrelatsioonikordaja) Korrelatsioonikordaja on kahe juhusliku suuruse sõltuvuse statistiline näitaja Korrelatsioonikordaja definitsioon, korrelatsioonikordaja tüübid, korrelatsioonikordaja omadused, arvutamine ja rakendamine ... ... Investori entsüklopeedia

    Statistika- (Statistika) Statistika on üldteoreetiline teadus, mis uurib kvantitatiivseid muutusi nähtustes ja protsessides. Riigistatistika, statistikateenused, Rosstat (Goskomstat), statistilised andmed, päringustatistika, müügistatistika, ... ... Investori entsüklopeedia

    Korrelatsioon- (Korrelatsioon) Korrelatsioon on kahe või enama juhusliku muutuja statistiline seos. Korrelatsiooni mõiste, korrelatsioonitüübid, korrelatsioonikordaja, korrelatsioonianalüüs, hinnakorrelatsioon, valuutapaaride korrelatsioon Forexil Sisu ... ... Investori entsüklopeedia

Raamatud

  • Teadusuuringud matemaatikas ja matemaatika uurimistöös: õpilaste uurimistegevuse metoodiline kogumik, Borzenko V. I. Kogumik tutvustab õpilaste uurimistegevuse korraldamisel rakendatavaid metoodilisi arenguid. Kogumiku esimene osa on pühendatud uurimismeetodi rakendamisele…

Statistilise olulisuse mõiste

Statistiline kehtivus on FCC arvutuspraktikas oluline. Varem märgiti, et samast populatsioonist saab valida palju proove:

Kui need on õigesti valitud, siis nende keskmised näitajad ja üldkogumi näitajad erinevad üksteisest veidi representatiivsusvea suuruse poolest, võttes arvesse aktsepteeritud usaldusväärsust;

Kui need valitakse erinevatest üldpopulatsioonidest, osutub erinevus nende vahel oluliseks. Statistikas vaadeldakse tavaliselt valimite võrdlemist;

Kui nad erinevad ebaoluliselt, ebaoluliselt, ebaoluliselt, see tähendab, et nad kuuluvad tegelikult samasse üldpopulatsiooni, nimetatakse nendevahelist erinevust nn. statistiliselt ebausaldusväärne.

statistiliselt oluline valimi erinevus on valim, mis erineb oluliselt ja põhimõtteliselt, st kuulub erinevatesse üldkogumitesse.

FCC-s tähendab valimierinevuste statistilise olulisuse hindamine paljude praktiliste probleemide lahendamist. Näiteks uute õppemeetodite, programmide, harjutuste komplektide, testide, kontrollharjutuste juurutamine on seotud nende eksperimentaalse kontrollimisega, mis peaks näitama, et katserühm erineb põhimõtteliselt kontrollrühmast. Seetõttu kasutatakse spetsiaalseid statistilisi meetodeid, nn statistilise olulisuse kriteeriumid, mis võimaldab tuvastada proovide vahel statistiliselt olulise erinevuse olemasolu või puudumist.

Kõik kriteeriumid on jagatud kahte rühma: parameetrilised ja mitteparameetrilised. Parameetrilised kriteeriumid sätestama normaaljaotuse seaduse kohustuslik olemasolu, s.o. see viitab normaalseaduse põhinäitajate – aritmeetilise keskmise – kohustuslikule määramisele X ja standardhälve umbes. Parameetrilised kriteeriumid on kõige täpsemad ja õigemad. Mitteparameetrilised testid põhinevad valimite elementide auaste (järjekorra) erinevustel.

Siin on peamised statistilise olulisuse kriteeriumid, mida FCC praktikas kasutatakse: Studenti test, Fisheri test, Wilcoxoni test, White'i test, Van der Waerdeni test (märgi test).

Õpilase kriteerium nime saanud inglise teadlase C. Gosseti järgi (Student on pseudonüüm), kes selle meetodi avastas. Õpilase kriteerium on parameetriline, kasutatakse proovide absoluutväärtuste võrdlemiseks. Proovid võivad olla erineva suurusega.

Üliõpilase kriteerium on määratletud järgmiselt.

1. Leidke õpilase kriteerium t järgmise valemi järgi:

kus xi, x 2 - võrreldavate valimite aritmeetiline keskmine; /i b w 2 - võrreldavate valimite näitajate alusel tuvastatud esindusvead.

2. FCC praktika on näidanud, et sporditöö puhul piisab skoori usaldusväärsusega nõustumisest R= 0,95.

63 Konto usaldusväärsuse tagamiseks: P= 0,95 (a = 0,05), kraadide arvuga; vabadust k= «! + n 2 - 2 vastavalt rakendustabelile 4 leiame väärtuse \ noh, kriteeriumi piirväärtus (^gr).

3. Normaaljaotuse seaduse omadustest lähtuvalt tehakse võrdlus Studenti testis t ja t^.

4. Tehke järeldused:

Kui a t> ftp, siis on erinevus võrreldavate valimite vahel statistiliselt oluline;

Kui a t< 7 F, siis pole erinevus statistiliselt oluline.

FCC valdkonna teadlaste jaoks on statistilise olulisuse hindamine esimene samm konkreetse probleemi lahendamisel: põhimõtteliselt või mitte-põhimõtteliselt erineda; võrreldavad näidised. Järgmine samm on; selle erinevuse hindamine pedagoogilisest vaatenurgast, mille määrab probleemi olukord.