Biografije Karakteristike Analiza

Pouzdanost formule statističkih podataka. Koncept statističke značajnosti

Danas je to zaista prelako: možete prići kompjuteru i sa malo ili nimalo znanja o tome šta radite, stvarate razumne i besmislice zaista neverovatnom brzinom. (J. Box)

Osnovni pojmovi i pojmovi medicinske statistike

U ovom članku predstavljamo neke od ključnih koncepata statistike koji su relevantni za medicinska istraživanja. O terminima se detaljnije govori u relevantnim člancima.

Varijacija

Definicija. Stepen disperzije podataka (vrijednosti predznaka) u rasponu vrijednosti

Vjerovatnoća

Definicija. Vjerovatnoća je stepen u kojem se određeni događaj može dogoditi pod određenim uvjetima.

Primjer. Objasnimo definiciju pojma u rečenici "Vjerovatnoća oporavka pri upotrebi lijeka Arimidex je 70%". Događaj je „oporavak pacijenta“, stanje „pacijent uzima Arimidex“, stepen mogućnosti je 70% (grubo govoreći, od 100 ljudi koji uzimaju Arimidex, 70 se oporavi).

Kumulativna vjerovatnoća

Definicija. Kumulativna vjerovatnoća preživljavanja u trenutku t je ista kao i udio pacijenata koji su preživjeli u to vrijeme.

Primjer. Ako se kaže da je kumulativna vjerovatnoća preživljavanja nakon petogodišnjeg liječenja 0,7, to znači da je od razmatrane grupe pacijenata 70% od početnog broja ostalo živo, a 30% umrlo. Drugim riječima, od svakih sto ljudi, 30 je umrlo u prvih 5 godina.

Vrijeme je za događaj

Definicija. Vrijeme do događaja - ovo je vrijeme, izraženo u nekim jedinicama, proteklo od nekog početnog vremena do nastanka nekog događaja.

Objašnjenje. Jedinice vremena u medicinskom istraživanju su dani, mjeseci i godine.

Tipični primjeri početnih vremena:

    početak praćenja pacijenata

    hirurško lečenje

Tipični primjeri razmatranih događaja:

    progresija bolesti

    recidiv

    smrt pacijenta

Uzorak

Definicija. Dio populacije dobijen selekcijom.

Na osnovu rezultata analize uzorka donose se zaključci o cjelokupnoj populaciji, što vrijedi samo ako je odabir bio slučajan. Budući da je slučajni odabir iz populacije praktički nemoguć, treba nastojati osigurati da uzorak bude barem reprezentativan za populaciju.

Zavisni i nezavisni uzorci

Definicija. Uzorci u kojima su predmeti proučavanja regrutovani nezavisno jedan od drugog. Alternativa nezavisnim uzorcima su zavisni (povezani, upareni) uzorci.

Hipoteza

Bilateralne i jednostrane hipoteze

Hajde da prvo objasnimo upotrebu termina hipoteza u statistici.

Cilj većine istraživanja je provjeriti istinitost neke izjave. Svrha testiranja na lijekove najčešće je provjeriti hipotezu da je jedan lijek učinkovitiji od drugog (na primjer, Arimidex je efikasniji od tamoksifena).

Da bi se prenijela strogost studije, izjava koja se provjerava je izražena matematički. Na primjer, ako je A broj godina koje će živjeti pacijent na Arimidexu, a T broj godina koje će živjeti pacijent na Tamoxifenu, tada se hipoteza koju treba testirati može napisati kao A>T.

Definicija. Hipoteza se naziva dvostranom ako se sastoji u jednakosti dvije veličine.

Primjer dvostrane hipoteze: A=T.

Definicija. Hipoteza se naziva jednostranom (jednostranom) ako se sastoji u nejednakosti dvije veličine.

Primjeri jednostranih hipoteza:

Dihotomni (binarni) podaci

Definicija. Podaci izraženi sa samo dvije važeće alternativne vrijednosti

Primjer: Pacijent je "zdrav" - "bolestan". Edem "jeste" - "nije prisutan".

Interval povjerenja

Definicija. Interval pouzdanosti za neku količinu je raspon oko vrijednosti količine koja sadrži pravu vrijednost te količine (sa određenim nivoom povjerenja).

Primjer. Neka ispitivana količina bude broj pacijenata godišnje. U prosjeku, njihov broj je 500, a interval pouzdanosti od 95% je (350, 900). To znači da će, najvjerovatnije (sa vjerovatnoćom od 95%), najmanje 350 i ne više od 900 ljudi kontaktirati kliniku tokom godine.

Oznaka. Vrlo uobičajena skraćenica je: 95% CI (95% CI) je interval pouzdanosti sa nivoom pouzdanosti od 95%.

Pouzdanost, statistička značajnost (P - nivo)

Definicija. Statistički značaj rezultata je mjera povjerenja u njegovu "istinu".

Svako istraživanje se zasniva samo na dijelu objekata. Proučavanje djelotvornosti lijeka se ne provodi na osnovu svih pacijenata na planeti općenito, već samo na određenoj grupi pacijenata (jednostavno je nemoguće provesti analizu na osnovu svih pacijenata).

Pretpostavimo da je kao rezultat analize napravljen neki zaključak (npr. upotreba Arimidexa kao adekvatne terapije je 2 puta efikasnija od tamoksifena).

Pitanje koje treba postaviti je: "Koliko možete vjerovati ovom rezultatu?".

Zamislite da smo provodili studiju zasnovanu na samo dva pacijenta. Naravno, u ovom slučaju, rezultate treba tretirati sa zabrinutošću. Ako je pregledan veliki broj pacijenata (brojčana vrijednost "velikog broja" ovisi o situaciji), tada se već može vjerovati izvedenim zaključcima.

Dakle, stepen povjerenja je određen vrijednošću p-nivoa (p-vrijednosti).

Viši p-nivo odgovara nižem nivou povjerenja u rezultate dobijene analizom uzorka. Na primjer, p-nivo jednak 0,05 (5%) pokazuje da je zaključak donet tokom analize određene grupe samo slučajna karakteristika ovih objekata sa vjerovatnoćom od samo 5%.

Drugim riječima, sa vrlo velikom vjerovatnoćom (95%) zaključak se može proširiti na sve objekte.

U mnogim studijama, 5% se smatra prihvatljivom p-vrednošću. To znači da ako je, na primjer, p=0,01, onda se rezultatima može vjerovati, ali ako je p=0,06, onda je to nemoguće.

Studija

prospektivna studija je studija u kojoj se uzorci biraju na osnovu ulaznog faktora, a neki rezultujući faktor se analizira u uzorcima.

Retrospektivna studija je studija u kojoj se uzorci biraju na osnovu rezultirajućeg faktora, a neki ulazni faktor se analizira u uzorcima.

Primjer. Početni faktor je trudnica mlađa/starija od 20 godina. Rezultirajući faktor je da je dijete lakše/teže od 2,5 kg. Analiziramo da li težina djeteta zavisi od starosti majke.

Ako uzmemo 2 uzorka, jedan sa majkama mlađim od 20 godina, drugi sa starijim, pa analiziramo masu djece u svakoj grupi, onda je ovo prospektivno istraživanje.

Ako prikupimo 2 uzorka, u jednom - majke koje su rodile djecu lakšu od 2,5 kg, u drugom - težu, a zatim analiziramo starost majki u svakoj grupi, onda je ovo retrospektivna studija (naravno, takva studija može se izvesti tek kada je eksperiment završen, odnosno kada su sva djeca rođena).

Exodus

Definicija. Klinički značajan događaj, laboratorijska vrijednost ili znak koji je od interesa za istraživača. U kliničkim ispitivanjima, ishodi služe kao kriterijumi za procenu efikasnosti terapijske ili profilaktičke intervencije.

Clinical Epidemiology

Definicija. Nauka koja omogućava predviđanje određenog ishoda za svakog pojedinačnog pacijenta na osnovu proučavanja kliničkog toka bolesti u sličnim slučajevima, koristeći rigorozne naučne metode proučavanja pacijenata kako bi se osigurala tačnost prognoza.

Kohorta

Definicija. Grupa učesnika u studiji, ujedinjena nekom zajedničkom osobinom u trenutku njenog formiranja i proučavana tokom dužeg vremenskog perioda.

Kontrola

Historijska kontrola

Definicija. Kontrolna grupa formirana i ispitana u periodu koji je prethodio studiji.

Paralelno upravljanje

Definicija. Kontrolna grupa, formirana istovremeno sa formiranjem glavne grupe.

Korelacija

Definicija. Statistički odnos dva znaka (kvantitativni ili ordinalni), koji pokazuje da veća vrijednost jednog znaka u određenom dijelu slučajeva odgovara većoj - u slučaju pozitivne (direktne) korelacije - vrijednosti drugog znaka ili manjoj vrijednosti - u slučaju negativne (inverzne) korelacije.

Primjer. Utvrđena je značajna korelacija između nivoa trombocita i leukocita u krvi pacijenta. Koeficijent korelacije je 0,76.

Omjer rizika (CR)

Definicija. Omjer rizika (omjer opasnosti) je omjer vjerovatnoće određenog („lošeg“) događaja za prvu grupu objekata i vjerovatnoće da se isti događaj dogodi za drugu grupu objekata.

Primjer. Ako nepušači imaju 20% šanse da dobiju rak pluća i 100% šanse da dobiju rak pluća kod pušača, onda će CR biti jedna petina. U ovom primjeru, prva grupa objekata su nepušači, druga grupa su pušači, a pojava karcinoma pluća smatra se "lošim" događajem.

Očigledno je da:

1) ako je KR=1, onda je vjerovatnoća da se događaj desi u grupama ista

2) ako je KR>1, onda se događaj češće javlja kod objekata iz prve grupe nego iz druge

3) ako je CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analiza

Definicija. OD statistička analiza koja sumira rezultate nekoliko studija koje istražuju isti problem (obično efikasnost metoda liječenja, prevencije, dijagnoze). Objedinjavanje studija pruža veći uzorak za analizu i veću statističku moć združenih studija. Koristi se za povećanje dokaza ili povjerenja u zaključak o djelotvornosti metode istraživanja.

Kaplan-Meierova metoda (više Kaplan-Meierovih procjena)

Ovu metodu su izmislili statističari E. L. Kaplan i Paul Meyer.

Metoda se koristi za izračunavanje različitih veličina koje se odnose na vrijeme posmatranja pacijenta. Primjeri takvih vrijednosti:

    mogućnost oporavka u roku od godinu dana kada koristite lijek

    mogućnost recidiva nakon operacije u roku od tri godine nakon operacije

    kumulativna vjerovatnoća preživljavanja nakon pet godina kod pacijenata sa karcinomom prostate nakon amputacije organa

Objasnimo prednosti korištenja Kaplan-Meierove metode.

Vrijednost vrijednosti u "normalnoj" analizi (bez Kaplan-Meierove metode) izračunava se na osnovu dijeljenja razmatranog vremenskog intervala na intervale.

Na primjer, ako ispitamo vjerovatnoću smrti pacijenta unutar 5 godina, tada se vremenski interval može podijeliti na 5 dijelova (manje od 1 godine, 1-2 godine, 2-3 godine, 3-4 godine, 4- 5 godina), dakle i 10 (po pola godine) ili drugi broj intervala. Rezultati će biti različiti za različite particije.

Odabir najprikladnije particije nije lak zadatak.

Procjene vrijednosti veličina dobivene Kaplan-Meierovom metodom ne zavise od podjele vremena promatranja na intervale, već zavise samo od životnog vijeka svakog pojedinog pacijenta.

Stoga je istraživaču lakše izvršiti analizu, a rezultati se često ispostavljaju kvalitetnijima od rezultata „obične“ analize.

Kaplan-Meierova kriva je graf krivulje preživljavanja dobiven Kaplan-Meierovom metodom.

Cox model

Ovaj model je izmislio Sir David Roxby Cox (r. 1924), poznati engleski statističar, autor preko 300 članaka i knjiga.

Coxov model se koristi u situacijama kada veličine koje se proučavaju u analizi preživljavanja zavise od funkcija vremena. Na primjer, vjerovatnoća ponavljanja nakon t godina (t=1,2,…) može zavisiti od logaritma vremena log(t).

Važna prednost metode koju je predložio Cox je primjenjivost ove metode u velikom broju situacija (model ne nameće striktna ograničenja na prirodu ili oblik distribucije vjerovatnoće).

Na osnovu Cox modela, može se izvršiti analiza (nazvana Cox analiza) koja rezultira vrijednošću omjera rizika i intervalom povjerenja za omjer rizika.

Neparametarske metode statistike

Definicija. Klasa statističkih metoda koje se prvenstveno koriste za analizu nenormalno raspoređenih kvantitativnih podataka, kao i za analizu kvalitativnih podataka.

Primjer. Da bismo utvrdili značaj razlika u sistolnom tlaku pacijenata ovisno o vrsti liječenja, koristit ćemo neparametarski Mann-Whitney test.

Značajka (varijabilna)

Definicija. X karakteristike objekta proučavanja (posmatranja). Postoje kvalitativne i kvantitativne karakteristike.

Randomizacija

Definicija. Metoda nasumične distribucije istraživačkih objekata u glavne i kontrolne grupe pomoću posebnih sredstava (tabele ili brojač slučajnih brojeva, bacanje novčića i druge metode nasumične dodjele broja grupe uključenom opažanju). Randomizacija minimizira razlike između grupa u smislu poznatih i nepoznatih osobina koje potencijalno utiču na ishod koji se proučava.

Rizik

Atributivno- dodatni rizik od nepovoljnog ishoda (na primjer, bolesti) zbog prisustva određene karakteristike (faktora rizika) u objektu proučavanja. To je dio rizika od razvoja bolesti koji je povezan sa ovim faktorom rizika, objašnjava se njime i može se eliminisati ako se ovaj faktor rizika eliminiše.

Relativni rizik- odnos rizika od nepovoljnog stanja u jednoj grupi prema riziku od ovog stanja u drugoj grupi. Koristi se u prospektivnim i opservacijskim studijama kada se grupe formiraju unaprijed, a pojava proučavanog stanja još nije nastupila.

ispitni ispit

Definicija. Metoda za provjeru stabilnosti, pouzdanosti, performansi (valjanosti) statističkog modela sukcesivnim brisanjem opservacija i ponovnim izračunavanjem modela. Što su rezultirajući modeli sličniji, to je model stabilniji i pouzdaniji.

Događaj

Definicija. Klinički ishod uočen u studiji, poput pojave komplikacija, recidiva, oporavka, smrti.

Stratifikacija

Definicija. M metoda uzorkovanja u kojoj se populacija svih sudionika koji ispunjavaju kriterije uključivanja u studiju prvo podijeli u grupe (stratue) na osnovu jedne ili više karakteristika (obično spola, dobi) koje potencijalno utječu na ishod koji se proučava, a zatim iz svake od ove grupe (stratum), učesnici se nezavisno regrutuju u eksperimentalnu i kontrolnu grupu. Ovo omogućava istraživaču da uravnoteži važne karakteristike između eksperimentalne i kontrolne grupe.

Tabela za nepredviđene situacije

Definicija. Tabela apsolutnih frekvencija (broja) opažanja, čiji stupci odgovaraju vrijednostima jedne karakteristike, a redovi vrijednosti druge karakteristike (u slučaju dvodimenzionalne tabele kontingencije). Vrijednosti apsolutnih frekvencija nalaze se u ćelijama na sjecištu redova i stupaca.

Dajemo primjer tabele kontingencije. Operacija aneurizme urađena je kod 194 pacijenta. Poznati pokazatelj težine edema kod pacijenata prije operacije.

Edem \ Ishod

nema edema 20 6 26
umjereno oticanje 27 15 42
izražen edem 8 21 29
mj 55 42 194

Tako je od 26 pacijenata bez edema, 20 pacijenata preživjelo nakon operacije, 6 pacijenata je umrlo. Od 42 pacijenta sa umjerenim edemom, 27 pacijenata je preživjelo, 15 je umrlo itd.

Hi-kvadrat test za kontingentne tabele

Da bi se utvrdila značajnost (pouzdanost) razlika u jednom znaku ovisno o drugom (na primjer, ishod operacije u zavisnosti od težine edema), koristi se hi-kvadrat test za tabele kontingencije:


Šansa

Neka je vjerovatnoća nekog događaja jednaka p. Tada je vjerovatnoća da se događaj neće dogoditi je 1-p.

Na primjer, ako je vjerovatnoća da će pacijent i dalje biti živ nakon pet godina 0,8 (80%), onda je vjerovatnoća da će umrijeti u tom vremenskom periodu 0,2 (20%).

Definicija.Šansa je omjer vjerovatnoće da će se događaj dogoditi i vjerovatnoće da se događaj neće dogoditi.

Primjer. U našem primjeru (o pacijentu), šansa je 4, pošto je 0,8/0,2=4

Dakle, vjerovatnoća oporavka je 4 puta veća od vjerovatnoće smrti.

Tumačenje vrijednosti veličine.

1) Ako je Šansa=1, tada je vjerovatnoća da će se događaj dogoditi jednaka vjerovatnoći da se događaj neće dogoditi;

2) ako je šansa >1, onda je vjerovatnoća da će se događaj dogoditi veća od vjerovatnoće da se događaj neće dogoditi;

3) ako je slučaj<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

odds ratio

Definicija. Odnos šanse je omjer šanse za prvu grupu objekata prema omjeru šanse za drugu grupu objekata.

Primjer. Pretpostavimo da su i muškarci i žene podvrgnuti nekom tretmanu.

Vjerovatnoća da će muški pacijent ostati živ nakon pet godina je 0,6 (60%); vjerovatnoća da će umrijeti tokom ovog vremenskog perioda je 0,4 (40%).

Slične vjerovatnoće za žene su 0,8 i 0,2.

Omjer šansi u ovom primjeru je

Tumačenje vrijednosti veličine.

1) Ako je omjer šanse = 1, tada je šansa za prvu grupu jednaka šansi za drugu grupu

2) Ako je omjer šanse >1, onda je šansa za prvu grupu veća od šanse za drugu grupu

3) Ako je omjer šansi<1, то шанс для первой группы меньше шанса для второй группы

Razmotrimo tipičan primjer primjene statističkih metoda u medicini. Kreatori lijeka sugeriraju da povećava diurezu srazmjerno uzetoj dozi. Kako bi testirali ovu pretpostavku, petorici dobrovoljaca daju različite doze lijeka.

Prema rezultatima opservacija, crta se dijagram diureze u odnosu na dozu (slika 1.2A). Ovisnost je vidljiva golim okom. Istraživači čestitaju jedni drugima na otkriću, a svijetu na novom diuretiku.

Zapravo, podaci nam omogućavaju da pouzdano tvrdimo samo da je ovisnost diureze o dozi uočena kod ovih pet dobrovoljaca. Činjenica da će se ova ovisnost manifestirati kod svih ljudi koji će uzimati lijek nije ništa drugo do nagađanje.
WJ

With

zhenie. Ne može se reći da je neosnovano – inače, čemu eksperimentisati?

Ali sada je lijek na tržištu. Sve više ljudi ga uzima u nadi da će povećati diurezu. I šta vidimo? Vidimo sliku 1.2B, koja ukazuje na odsustvo bilo kakvog odnosa između doze lijeka i diureze. Crni krugovi predstavljaju podatke iz originalne studije. Statistika ima metode za procjenu vjerovatnoće dobijanja takvog "nereprezentativnog", štoviše, zbunjujućeg uzorka. Ispostavilo se da bi u nedostatku veze između diureze i doze lijeka, rezultirajuća "ovisnost" bila uočena u oko 5 od 1000 eksperimenata. Dakle, u ovom slučaju, istraživači jednostavno nisu imali sreće. Čak i kada bi primijenili čak i najsavršenije statističke metode, to ih ipak ne bi spasilo greške.

Ovaj izmišljeni, ali nimalo daleko od stvarnosti primjer, naveli smo ne da bismo ukazali na beskorisnost
statistika. On govori o nečem drugom, o vjerovatnoj prirodi njenih zaključaka. Kao rezultat primjene statističke metode, ne dobijamo konačnu istinu, već samo procjenu vjerovatnoće određene pretpostavke. Pored toga, svaka statistička metoda je zasnovana na sopstvenom matematičkom modelu i njeni rezultati su tačni u onoj meri u kojoj ovaj model odgovara stvarnosti.

Više o POUZDANOSTI I STATISTIČKOM ZNAČAJU:

  1. Statistički značajne razlike u pokazateljima kvaliteta života
  2. Statistički agregat. Znakovi računa. Koncept kontinuiranog i selektivnog istraživanja. Zahtjevi za statističku populaciju i korištenje računovodstvene i izvještajne dokumentacije
  3. ESSAY. PROUČAVANJE POUZDANOSTI OČITANJA TONOMETRA ZA MERENJE INTRAOKULARNOG PRITISKA KROZ KAPE 2018, 2018

U bilo kojoj naučnoj i praktičnoj situaciji eksperimenta (istraživanja), istraživači ne mogu proučavati sve ljude (opću populaciju, populaciju), već samo određeni uzorak. Na primjer, čak i ako pregledavamo relativno malu grupu ljudi, poput onih s određenom bolešću, malo je vjerovatno da imamo resurse ili potrebu da testiramo svakog pacijenta. Umjesto toga, obično se testira uzorak populacije jer je to praktičnije i oduzima manje vremena. U tom slučaju, kako možemo znati da rezultati dobijeni iz uzorka predstavljaju cijelu grupu? Ili, da se poslužimo stručnom terminologijom, možemo li biti sigurni da naša studija ispravno opisuje cjelinu stanovništva, uzorak iz kojeg smo koristili?

Za odgovor na ovo pitanje potrebno je utvrditi statističku značajnost rezultata testa. Statistički značaj (Značajan nivo, skraćeno potpis), ili /7-nivo značajnosti (p nivo) - je vjerovatnoća da dati rezultat ispravno predstavlja populaciju iz koje je uzorak proučavan. Imajte na umu da je ovo samo vjerovatnoća- nemoguće je sa apsolutnom sigurnošću reći da ova studija ispravno opisuje cjelokupnu populaciju. U najboljem slučaju, samo se na osnovu nivoa značaja može zaključiti da je to vrlo vjerovatno. Stoga se neminovno postavlja pitanje: koji bi trebao biti nivo značaja da bi se ovaj rezultat smatrao ispravnom karakterizacijom populacije?

Na primjer, pri kojoj vrijednosti vjerovatnoće ste spremni reći da su takve šanse dovoljne za preuzimanje rizika? Ako su šanse 10 od 100 ili 50 od 100? Ali šta ako je ta vjerovatnoća veća? Šta je sa kvotama kao što su 90 od 100, 95 od 100 ili 98 od 100? Za situaciju povezanu s rizikom, ovaj izbor je prilično problematičan, jer ovisi o ličnim karakteristikama osobe.

U psihologiji se tradicionalno vjeruje da 95 ili više šansi od 100 znači da je vjerovatnoća ispravnosti rezultata dovoljno visoka da se može generalizirati na cijelu populaciju. Ova cifra je ustanovljena u procesu naučne i praktične delatnosti - ne postoji zakon po kojem bi je trebalo izabrati kao smernicu (i zaista, u drugim naukama ponekad se biraju druge vrednosti nivoa značaja).

U psihologiji se ova vjerovatnoća rješava na pomalo neobičan način. Umjesto vjerovatnoće da uzorak predstavlja populaciju, vjerovatnoća da uzorak jeste ne predstavlja stanovništva. Drugim riječima, to je vjerovatnoća da su otkriveni odnos ili razlike slučajni, a ne svojstvo populacije. Stoga, umjesto da kažu da su rezultati studije tačni sa vjerovatnoćom 95 od 100, psiholozi kažu da postoji 5 od 100 šansi da su rezultati pogrešni (slično, 40 od ​​100 šansi u korist ispravnost rezultata znači 60 od 100 šansi u korist njihove pogrešnosti). Vrijednost vjerovatnoće se ponekad izražava u postocima, ali češće se piše kao decimalni razlomak. Na primjer, 10 šansi od 100 predstavljeno je kao decimalni razlomak od 0,1; 5 od 100 je zapisano kao 0,05; 1 u 100 - 0,01. Kod ovog oblika snimanja granična vrijednost je 0,05. Da bi se rezultat smatrao tačnim, njegov nivo značajnosti mora biti ispod ovaj broj (zapamtite da je to vjerovatnoća da će rezultat nije ispravno opisuje stanovništvo. Da bismo uklonili terminologiju, dodajemo da je "vjerovatnoća pogrešnog rezultata" (koja se pravilnije naziva nivo značaja) obično se označava latiničnim slovom R. Opis rezultata eksperimenta obično uključuje sažeti zaključak, kao što je "rezultati su bili značajni na nivou značajnosti (R(p) manje od 0,05 (tj. manje od 5%).

Dakle, nivo značajnosti ( R) označava vjerovatnoću da će rezultati ne predstavljaju stanovništvo. Po tradiciji u psihologiji, vjeruje se da rezultati pouzdano odražavaju cjelokupnu sliku, ako su vrijednosti R manje od 0,05 (tj. 5%). Međutim, ovo je samo probabilistička izjava, a nikako bezuslovna garancija. U nekim slučajevima ovaj zaključak može biti netačan. U stvari, možemo izračunati koliko često se to može dogoditi ako pogledamo veličinu nivoa značaja. Na nivou značajnosti od 0,05, u 5 od 100 slučajeva, rezultati su vjerovatno netačni. 11a na prvi pogled izgleda da to nije prečesto, ali ako razmislite, onda je 5 šansi od 100 isto kao 1 od 20. Drugim riječima, u jednom od svakih 20 slučajeva rezultat će se okrenuti da nije u pravu. Takve šanse ne izgledaju posebno povoljne, a istraživači bi se trebali paziti da ne počine greške prve vrste. Ovo je naziv greške koja se javlja kada istraživači misle da su pronašli prave rezultate, ali u stvari ih nema. Suprotne greške, koje se sastoje u činjenici da istraživači vjeruju da nisu pronašli rezultat, ali ga zapravo postoji, nazivaju se greške druge vrste.

Ove greške nastaju jer se ne može isključiti mogućnost pogrešne statističke analize. Verovatnoća greške zavisi od nivoa statističke značajnosti rezultata. Već smo napomenuli da da bi se rezultat smatrao tačnim, nivo značajnosti mora biti ispod 0,05. Naravno, neki rezultati su niži i nije neuobičajeno pronaći rezultate niže od 0,001 (vrijednost od 0,001 ukazuje na 1 od 1000 šanse da su pogrešni). Što je manja vrijednost p, to je jače naše povjerenje u ispravnost rezultata.

U tabeli. 7.2 prikazuje tradicionalno tumačenje nivoa značajnosti o mogućnosti statističkog zaključivanja i opravdanosti odluke o prisutnosti veze (razlike).

Tabela 7.2

Tradicionalna interpretacija nivoa značaja koji se koriste u psihologiji

Na osnovu iskustva iz praktičnih istraživanja, preporučuje se da se, kako bi se izbjegle greške prvog i drugog tipa, pri donošenju odgovornih zaključaka donose odluke o postojanju razlika (veza), fokusirajući se na nivo R n znak.

Statistički test(Statistički test - to je alat za određivanje nivoa statističke značajnosti. Ovo je pravilo odlučivanja koje osigurava da se istinita hipoteza prihvati, a lažna odbaci s velikom vjerovatnoćom.

Statistički kriterijumi ukazuju i na način izračunavanja određenog broja i samog ovog broja. Svi kriterijumi se koriste sa jednim glavnim ciljem: utvrditi nivo značajnosti podatke koje analiziraju (tj. vjerovatnoću da podaci odražavaju pravi efekat koji ispravno predstavlja populaciju iz koje je uzorak izvučen).

Neki kriterijumi se mogu koristiti samo za normalno raspoređene podatke (i ako se karakteristika meri na intervalnoj skali) - ovi kriterijumi se obično nazivaju parametarski. Uz pomoć drugih kriterija, možete analizirati podatke s gotovo bilo kojim zakonom o distribuciji - oni se nazivaju neparametarski.

Parametrijski kriterijumi - kriterijumi koji uključuju parametre distribucije u formuli za proračun, tj. sredine i varijanse (Studentov t-test, Fišerov F-test, itd.).

Neparametarski kriterijumi - kriterijumi koji ne uključuju parametre distribucije u formulu za izračunavanje distribucija i zasnovani su na radnim frekvencijama ili rangovima (kriterijum Q Rozenbaum, kriterijum U Manna - Whitney

Na primjer, kada kažemo da je značajnost razlika određena Studentovim t-testom, mislimo da je za izračunavanje empirijske vrijednosti korištena Studentova metoda t-testa, koja se zatim upoređuje sa tabelarnom (kritičnom) vrijednošću.

Prema omjeru empirijske (mi smo izračunali) i kritične vrijednosti kriterija (tabela), možemo ocijeniti da li je naša hipoteza potvrđena ili opovrgnuta. U većini slučajeva, da bismo prepoznali razlike kao značajne, potrebno je da empirijska vrijednost kriterija bude veća od kritične, iako postoje kriteriji (npr. Mann-Whitney test ili test znakova) u kojima moramo se pridržavati suprotnog pravila.

U nekim slučajevima, formula za izračunavanje kriterija uključuje broj opservacija u uzorku studije, označen kao P. Pomoću posebne tabele utvrđujemo koji nivo statističke značajnosti razlika odgovara datoj empirijskoj vrednosti. U većini slučajeva, ista empirijska vrijednost kriterija može se pokazati značajnom ili beznačajnom, ovisno o broju zapažanja u uzorku studije ( P ) ili iz tzv broj stepena slobode , što je označeno kao v (g>) ili oboje df (ponekad d).

Znajući P ili broja stupnjeva slobode, možemo koristiti posebne tablice (glavne su date u Dodatku 5) da odredimo kritične vrijednosti kriterija i uporedimo dobivenu empirijsku vrijednost s njima. Obično se piše ovako: n = 22 kritične vrijednosti kriterija su tSt = 2,07" ili "at v (d) = 2, kritične vrijednosti Studentovog kriterijuma su = 4,30“ i tzv.

Obično se, međutim, daje prednost parametarskim kriterijumima i mi se držimo ovog stava. Smatraju se pouzdanijima i mogu pružiti više informacija i dublju analizu. Što se tiče složenosti matematičkih proračuna, kada se koriste kompjuterski programi, ova složenost nestaje (ali se neke druge čine prilično premostivim).

  • U ovom udžbeniku se ne bavimo detaljno problemom statistike
  • hipoteze (nula - R0 i alternativa - Hj) i statističke odluke, budući da studenti psihologije to posebno proučavaju u disciplini "Matematičke metode u psihologiji". Osim toga, treba napomenuti da se prilikom izrade istraživačkog izvještaja (seminarni rad ili teza, publikacija) po pravilu ne daju statističke hipoteze i statistička rješenja. Obično se pri opisivanju rezultata naznači kriterij, daju se potrebne deskriptivne statistike (srednje vrijednosti, sigma, koeficijenti korelacije, itd.), empirijske vrijednosti kriterija, stupnjevi slobode i obavezno nivo p-značajnosti. Zatim se formuliše smisleni zaključak u odnosu na hipotezu koja se testira, ukazujući (obično u obliku nejednakosti) na postignuti ili nepostignut nivo značajnosti.

POUZDANOST STATISTIČKA

- engleski vjerodostojnost/valjanost, statistički; njemački Validitat, statistische. Dosljednost, objektivnost i nedostatak dvosmislenosti u statističkom testu ili u C.L. set mjerenja. D. s. može se testirati ponavljanjem istog testa (ili upitnika) na istu temu kako bi se vidjelo da li se dobijaju isti rezultati; ili upoređivanjem različitih dijelova testa koji bi trebali mjeriti isti predmet.

Antinazi. Enciklopedija sociologije, 2009

Pogledajte šta je "STATISTIČKA POUZDANOST" u drugim rječnicima:

    POUZDANOST STATISTIČKA- Engleski. vjerodostojnost/valjanost, statistički; njemački Validitat, statistische. Dosljednost, objektivnost i nedostatak dvosmislenosti u statističkom testu ili u s. set mjerenja. D. s. može se provjeriti ponavljanjem istog testa (ili ... ... Eksplanatorni rečnik sociologije

    U statistici se vrijednost naziva statistički značajnom ako je vjerojatnost njenog slučajnog ili čak ekstremnijeg pojavljivanja mala. Ovdje se pod ekstremom podrazumijeva stepen odstupanja statistike testa od nulte hipoteze. Razlika se zove ... ... Wikipedia

    Fizički fenomen statističke stabilnosti je da sa povećanjem veličine uzorka, učestalost slučajnog događaja ili prosječna vrijednost fizičke veličine teži nekom fiksnom broju. Fenomen statističke ... ... Wikipedia

    POUZDANOST RAZLIKE (sličnost)- analitičko-statistički postupak za utvrđivanje nivoa značajnosti razlika ili sličnosti između uzoraka prema proučavanim indikatorima (varijablama) ... Savremeni obrazovni proces: osnovni pojmovi i pojmovi

    IZVJEŠTAJ, STATISTIČKI Veliki računovodstveni rječnik

    IZVJEŠTAJ, STATISTIČKI- oblik državnog statističkog posmatranja, u kojem nadležni organi dobijaju od preduzeća (organizacija i institucija) potrebne informacije u vidu zakonom propisanih izveštajnih dokumenata (statističkih izveštaja) za ... Veliki ekonomski rječnik

    Nauka koja proučava metode sistematskog posmatranja masovnih pojava ljudskog društvenog života, sastavljanje njihovih numeričkih opisa i naučnu obradu ovih opisa. Dakle, teorijska statistika je nauka ... ... Enciklopedijski rječnik F.A. Brockhaus i I.A. Efron

    Koeficijent korelacije- (Koeficijent korelacije) Koeficijent korelacije je statistički pokazatelj zavisnosti dvije slučajne varijable Definicija koeficijenta korelacije, vrste koeficijenata korelacije, svojstva koeficijenta korelacije, proračun i primjena ... ... Enciklopedija investitora

    Statistika- (Statistika) Statistika je opća teorijska nauka koja proučava kvantitativne promjene pojava i procesa. Državna statistika, službe statistike, Rosstat (Goskomstat), statistički podaci, statistika zahtjeva, statistika prodaje, ... ... Enciklopedija investitora

    Korelacija- (Korelacija) Korelacija je statistički odnos dve ili više slučajnih varijabli Koncept korelacije, vrste korelacije, koeficijent korelacije, analiza korelacije, korelacija cena, korelacija valutnih parova na Forex sadržaju ... ... Enciklopedija investitora

Knjige

  • Istraživanja u matematici i matematika u istraživanju: Metodološki zbornik o istraživačkoj aktivnosti studenata, Borzenko V.I. Zbornik predstavlja metodološka dostignuća primenljiva u organizaciji istraživačkih aktivnosti studenata. Prvi dio zbirke posvećen je primjeni istraživačkog pristupa u…

Koncept statističke značajnosti

Statistička valjanost je od suštinskog značaja u praksi proračuna FCC-a. Ranije je napomenuto da se iz iste populacije može odabrati mnogo uzoraka:

Ako su pravilno odabrani, tada se njihovi prosječni pokazatelji i pokazatelji opće populacije neznatno razlikuju jedni od drugih po veličini greške reprezentativnosti, uzimajući u obzir prihvaćenu pouzdanost;

Ako se biraju iz različitih općih populacija, razlika između njih se ispostavlja značajnom. Poređenje uzoraka se obično razmatra u statistici;

Ako se razlikuju neznatno, nevažno, beznačajno, odnosno zapravo pripadaju istoj opštoj populaciji, razlika između njih se naziva statistički nepouzdan.

statistički značajno razlika u uzorku je uzorak koji se značajno i fundamentalno razlikuje, tj. pripada različitim općim populacijama.

U FCC-u, procjena statističke važnosti razlika u uzorcima znači rješavanje mnogih praktičnih problema. Na primjer, uvođenje novih nastavnih metoda, programa, sklopova vježbi, testova, kontrolnih vježbi povezano je sa njihovom eksperimentalnom verifikacijom, koja treba da pokaže da se test grupa suštinski razlikuje od kontrolne grupe. Stoga se koriste posebne statističke metode tzv kriterijume za statističku značajnost, omogućavajući otkrivanje prisutnosti ili odsustva statistički značajne razlike između uzoraka.

Svi kriterijumi su podeljeni u dve grupe: parametarski i neparametarski. Parametarski kriterijumi predvidjeti obavezno prisustvo normalnog zakona o raspodjeli, tj. ovo se odnosi na obavezno određivanje glavnih pokazatelja normalnog zakona – aritmetičke sredine X i standardna devijacija oko. Parametarski kriterijumi su najtačniji i najtačniji. Neparametarski testovi zasnivaju se na rangnim (rednim) razlikama između elemenata uzoraka.

Evo glavnih kriterijuma statističke značajnosti koji se koriste u praksi FCC-a: Studentov test, Fišerov test, Wilcoxonov test, Vajtov test, Van der Vaerdenov test (test znakova).

Studentov kriterijum nazvan po engleskom naučniku C. Gossetu (Student je pseudonim), koji je otkrio ovu metodu. Studentski kriterijum je parametarski, koristi se za poređenje apsolutnih vrijednosti uzoraka. Uzorci mogu varirati u veličini.

Studentov kriterijum je definisan na sledeći način.

1. Pronađite Studentov kriterij t prema sljedećoj formuli:

gdje xi, x 2 - aritmetička sredina upoređenih uzoraka; /i b w 2 - greške reprezentativnosti identifikovane na osnovu indikatora upoređenih uzoraka.

2. Praksa u FCC-u je pokazala da je za sportski rad dovoljno prihvatiti pouzdanost rezultata R= 0,95.

63 Za pouzdanost računa: P= 0,95 (a = 0,05), sa brojem stepeni; sloboda k= «! + n 2 - 2 prema tabeli aplikacije 4 nalazimo vrijednost \ pa, granična vrijednost kriterija (^gr).

3. Na osnovu svojstava zakona normalne distribucije, vrši se poređenje u Studentovom testu t i t^.

4. Izvucite zaključke:

Ako a t> ftp, onda je razlika između upoređenih uzoraka statistički značajna;

Ako a t< 7 F, onda razlika nije statistički značajna.

Za istraživače u oblasti FCC-a, procjena statističke značajnosti je prvi korak u rješavanju specifičnog problema: fundamentalno ili nefundamentalno se razlikuju; uporedivi uzorci. Sljedeći korak je; procjena ove razlike sa pedagoške tačke gledišta, koja je određena stanjem problema.