Biografije Karakteristike Analiza

Primjer je studentski kriterij u sociologiji. Osnovne statistike i Studentov t-test

Najčešće se u psihološkim istraživanjima promatraju zadaci identificiranja razlika između dvije ili više skupina znakova. Razjašnjenje takvih razlika na razini aritmetičkih sredina razmatra se u analizi primarne statistike. Međutim, postavlja se pitanje koliko su te razlike pouzdane i mogu li se proširiti (ekstrapolirati) na cjelokupnu populaciju. Za rješavanje ovog problema najčešće koriste (pod uvjetom normalne ili bliske normalnoj distribuciji) t - kriterij (Studentov kriterij), koji je osmišljen kako bi otkrili koliko se pokazatelji jednog uzorka ispitanika značajno razlikuju od drugog (za na primjer, kada ispitanici kao rezultat testiranja jedne skupine dobiju više bodova od predstavnika druge). Ovo je parametarski kriterij, ima dva glavna oblika:

1) nepovezani (neparni) t - kriterij osmišljen kako bi se utvrdilo postoje li razlike između rezultata dobivenih korištenjem istog testa za testiranje dvije skupine formirane od različitih ljudi. Na primjer, to može biti usporedba razine inteligencije ili neuropsihičke stabilnosti, anksioznosti uspješnih i neuspješnih učenika ili usporedba učenika različitih razreda, dobi, društvenih razina itd. po tim osnovama. U ispitivanim uzorcima mogu biti heteroseksualni, multinacionalni uzorci, kao i poduzorci, odabrani prema određenom atributu. Kriterij se naziva "nepovezanim" jer su uspoređene skupine formirane od različitih ljudi;

2) povezani (upareni) t - kriterij koji se koristi za usporedbu pokazatelja dviju skupina, između čijih elemenata postoji specifičan odnos. To znači da svaki element prve skupine odgovara elementu druge skupine, njemu sličan po određenom parametru od interesa za istraživača. Najčešće se uspoređuju parametri istih osoba prije i nakon određenog događaja ili radnje (na primjer, u procesu provođenja longitudinalne studije ili formativnog eksperimenta). Stoga se ovaj kriterij koristi za usporedbu učinka istih pojedinaca prije i nakon ispitivanja, eksperimenta ili prolaska određenog vremena.

Ako podaci nisu normalno raspoređeni, upotrijebite neparametarske testove koji su ekvivalentni t-testu: Mann-Whitneyjev test, ekvivalentan neparnom t-testu, i Wilcoxonov test s dva uzorka, ekvivalentan uparenom t-testu.

Uz pomoć t-testa i njihovih neparametarskih ekvivalenata moguće je usporediti samo rezultate dviju skupina dobivenih istim testom. Međutim, u nekim slučajevima postaje potrebno usporediti nekoliko skupina ili ocjena nekoliko vrsta. To se može učiniti u fazama dijeljenjem zadatka u nekoliko parova usporedbi (na primjer, ako trebate usporediti grupe A, B i Y prema rezultatima testova X i Y, zatim pomoću t-kriterija prvo usporedite grupe A i B prema rezultatima testa X, zatim A i B prema rezultatima testa C, A i C prema rezultatima testa X itd.). Međutim, ovo je vrlo dugotrajna metoda pa se pribjegava složenijoj metodi analize varijance.

Metoda za procjenu pouzdanosti razlika aritmetičkih sredina prilično učinkovitim parametarskim Studentovim testom osmišljena je za rješavanje jednog od problema koji se najčešće uočava u obradi podataka – utvrđivanje pouzdanosti razlika između dva ili više nizova vrijednosti. Takva je procjena često nužna u usporednoj analizi polarnih skupina. razlikuju se na temelju različite težine određene ciljne značajke (obilježja) proučavane pojave. Analiza u pravilu počinje izračunom primarne statistike odabranih skupina", a zatim se procjenjuje značajnost razlika. Studentov t-test izračunava se po formuli:

Vrijednost Studentovog testa za tri razine pouzdanosti (statističke) značajnosti (p) data je u priručniku iz matematičke statistike. Broj stupnjeva slobode određuje se formulom:

Sa smanjenjem veličine uzorka (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Odluka o pouzdanosti razlika donosi se ako izračunata vrijednost t premašuje tabličnu vrijednost za određeni broj stupnjeva slobode (d (v)). U publikacijama ili znanstvenim izvješćima naznačite najvišu razinu značaja od tri: str<0,05; р <0,01; р <0,001.

Za bilo koju brojčanu vrijednost kriterija za značajnost razlike između srednjih vrijednosti, ovaj pokazatelj ne ocjenjuje stupanj otkrivene razlike (ocjenjuje se samom razlikom između srednjih vrijednosti), već samo njezinu statističku značajnost, tj. pravo proširiti zaključak dobiven na temelju usporedbe uzoraka da postoji razlika na cjelokupni fenomen (cijeli proces) u cjelini. Kriterij niske izračunate razlike ne može poslužiti kao dokaz nepostojanja razlike između dvaju obilježja (fenomena), jer njegova značajnost (značajnost) ne ovisi samo o prosječnoj vrijednosti, već i o broju uspoređenih uzoraka. On ne ukazuje na nepostojanje razlike, već na činjenicu da je s takvom veličinom uzorka statistički nepouzdan: postoji vrlo velika šansa da je razlika u tim uvjetima slučajna, a vjerojatnost njezine pouzdanosti vrlo je mala.

Tablica 2.17. Granice povjerenja za Studentov t-test (t-test) za f stupnjeve slobode

prosječnog vremena izvršavanja zadatka u drugom pokušaju (u usporedbi s prvim pokušajem) nije pouzdan.

Ovaj izraz nije ekvivalentan tvrdnji o statističkoj homogenosti dvaju uzorka koji se uspoređuju. Osim toga, primjena Studentovog testa u slučaju ovakvih nejednakih uzoraka nije matematički sasvim ispravna i, naravno, utječe na konačni rezultat o nepouzdanosti razlika Xav = 9,1 i Xav = 8,5. Koristeći ovaj kriterij, ne ocjenjuje se stupanj bliskosti dvaju prosjeka, već se dodjela ili nošenje plivarice smatra slučajnim (na danoj razini značaja). .

Studentov kriterijza nezavisne uzorke

Studentov t-test ( t-Učenički test ili jednostavno" t-test") koristi se ako trebate usporediti samo dvije grupe kvantitativni znakovi s normalnom raspodjelom (poseban slučaj analize varijance). Napomena: ovaj se kriterij ne može koristiti pri usporedbi nekoliko skupina u paru, u tom slučaju se mora primijeniti analiza varijance. Pogrešna uporaba Studentovog t-testa povećava vjerojatnost "otkrivanja" nepostojećih razlika. Primjerice, umjesto da se nekoliko tretmana prizna kao jednako učinkovite (ili neučinkovite), jedan od njih se proglašava najboljim.

Dva događaja nazivaju se neovisnima ako pojava jednog od njih ni na koji način ne utječe na pojavu drugog. Slično, dvije zbirke mogu se nazvati neovisnim ako svojstva jedne od njih nisu ni na koji način povezana sa svojstvima druge.

Primjer izvršenja t-testiranje u programu STATISTICA.

Žene su u prosjeku niže od muškaraca, međutim, to nije rezultat činjenice da muškarci imaju ikakvog utjecaja na žene – ovdje je riječ o genetskim karakteristikama spola. Preko t- Testom je potrebno provjeriti postoji li statistički značajna razlika između prosječnih vrijednosti visine u skupinama muškaraca i žena. (U obrazovne svrhe pretpostavljamo da podaci o visini slijede normalnu distribuciju i stoga t- test primjenjiv).

Slika 1. Primjer formatiranja podataka za izvršenje t-

Obratite pažnju na to kako su podaci formatirani na slici 1. Kao i kod crtanja grafova kao što suBrkovina ili Kutija-brkovi, u tablici se nalaze dvije varijable: jedna od njih je grupiranje (varijabla grupiranja) ("Spol") - sadrži kodove (muža i žene) koji omogućuju programu da odredi koji od podataka o visini pripada kojoj skupini; drugi – tzv. zavisna varijabla (zavisna varijabla) ("Rast") - sadrži stvarne analizirane podatke. Međutim, prilikom izvođenjat-Test za nezavisne uzorke u programu STATISTICA moguć je i u drugoj opciji dizajna - podaci za svaku od skupina ("Muškarci" i "Žene") mogu se unijeti u zasebne stupce (slika 2).

Slika 2. Druga opcija za formatiranje podataka za izvršenje t- test za nezavisne uzorke

Za izvršenje t-test za neovisne uzorke, morate izvršiti sljedeće korake:

1-a. Pokreni modul t- test iz izbornika Statistika > Osnovne statistike/Tablice > t-test, neovisno, po skupinama(ako postoji varijabla grupiranja u tablici podataka, pogledajte sliku 3)​

ILI

1-b. Pokreni modul t- test iz izbornika Statistika > Osnovne statistike/Tablice > t-test, neovisno, po varijablama(ako se podaci unose u zasebne stupce, vidi sliku 4).

Sljedeće opisuje testni slučaj u kojem postoji varijabla grupiranja u tablici podataka.

2. U prozoru koji se otvori kliknite gumb Varijable i reci programu koja od varijabli tablice proračunska tablica je grupiranje, a koji je ovisan (Slike 5-6).

Slika 5. Odabir varijabli za uključivanje t-test

Slika 6. Prozor s in odabrane varijable za provedbu t-test

3. Pritisnite tipkuSažetak: T-testovi.

Slika 7. Rezultati t- ispitivanja neovisnih uzoraka

Kao rezultat toga, program će izdati radnu knjižicuRadna bilježnica, koji sadrži tablicu s rezultatimat-test (slika 7 ). Ova tablica ima nekoliko stupaca:

  • znači(muški) - prosječna vrijednost rasta u skupini "Muškarci";
  • znači(žene) - prosječna vrijednost rasta u skupini "Žene";
  • t- vrijednost: vrijednost izračunata programom t-Učenikov kriterij;
  • df- broj stupnjeva slobode;
  • P- vjerojatnost valjanosti hipoteze da se uspoređene prosječne vrijednosti ne razlikuju. Zapravo, to je najvažniji rezultat analize, budući da je vrijednost P govori je li hipoteza koja se testira istinita. U našem primjeru P > 0,05, iz čega možemo zaključiti da nema statistički značajnih razlika između visine muškaraca i žena.
  • Vrijedi N(muški) - veličina uzorka "Muškarci";
  • Vrijedi N(žene) - veličina uzorka "Žene";
  • Std. dev. (muški) - standardna devijacija uzorka "Muškarci";
  • Std. dev. (žene) - standardna devijacija uzorka "Žene";
  • F-omjer, odstupanja- vrijednost Fisherovog F-testa, koji se koristi za provjeru hipoteze o jednakosti varijansi u uspoređenim uzorcima;
  • P, Odstupanja- vjerojatnost valjanosti hipoteze da se varijance uspoređenih uzoraka ne razlikuju.

Došla je jesen, što znači da je vrijeme za pokretanje novog tematskog projekta „Statistička analiza s R“. U njemu ćemo razmotriti statističke metode sa stajališta njihove primjene u praksi: saznat ćemo koje metode postoje, u kojim slučajevima i kako ih primijeniti. Po mom mišljenju, Studentov t-test ili t-test (od engl. t-test) idealan je kao uvod u svijet statističke analize. Studentov test je prilično jednostavan i indikativan, a također zahtijeva minimalno osnovno znanje iz statistike, s čime se čitatelj može upoznati čitajući ovaj članak.

Napomena_1: ovdje i u drugim člancima nećete vidjeti formule i matematička objašnjenja, jer. informacija je namijenjena studentima prirodnih i humanitarnih smjerova koji tek prave prve korake u stat. analiza.

Što je t-test i kada ga treba koristiti

Na početku treba reći da u statistici često djeluje princip Occamove britve, koji kaže da nema smisla provoditi složenu statističku analizu ako se može primijeniti jednostavnija (ne biste trebali rezati kruh motornom pilom ako ste imati nož). Zato, unatoč svojoj jednostavnosti, t-test je ozbiljan alat ako znate što je i u kojim slučajevima ga treba koristiti.

Zanimljivo je da je ovu metodu stvorio William Gosset, kemičar pozvan da radi u tvornici Guinness. Test koji je razvio izvorno je korišten za procjenu kvalitete piva. No, tvorničkim kemičarima bilo je zabranjeno samostalno objavljivati ​​znanstvene radove pod svojim imenom. Stoga je William 1908. godine objavio svoj članak u časopisu "Biometrika" pod pseudonimom "Student". Kasnije je izvrsni matematičar i statističar Ronald Fisher finalizirao metodu, koja se tada proširila pod nazivom Studentov t-test.

Studentov t-test (t-test) je statistička metoda koja omogućuje usporedbu srednjih vrijednosti dvaju uzoraka i na temelju rezultata ispitivanja zaključiti razlikuju li se oni međusobno statistički ili ne. Ako želite znati razlikuje li se prosječni životni vijek u vašoj regiji od nacionalnog prosjeka; usporediti prinose krumpira u različitim područjima; ili mijenja li se krvni tlak prije i nakon uzimanja novog lijeka t-test može vam biti od koristi. Zašto možda? Jer da to izvedem, potrebno je da podaci uzoraka imaju distribuciju blisku normalnoj. Da biste to učinili, postoje metode procjene koje vam omogućuju da kažete je li u ovom slučaju dopušteno vjerovati da se podaci normalno distribuiraju ili ne. Razgovarajmo o tome detaljnije.

Normalna distribucija podataka i metode za njihovu procjenu qqplot i shapiro.test

Normalna raspodjela podataka karakteristična je za kvantitativne podatke na čiju distribuciju utječu mnogi čimbenici ili je slučajna. Normalnu distribuciju karakterizira nekoliko značajki:

  • Uvijek je simetričan i ima oblik zvona.
  • Srednja vrijednost i medijan su iste.
  • Unutar jedne standardne devijacije u oba smjera leži 68,2% svih podataka, unutar dva - 95,5%, unutar tri - 99,7%

Napravimo slučajni uzorak s normalnom distribucijom na , gdje je ukupan broj mjerenja = 100, aritmetička sredina = 5 i standardna devijacija = 1. Zatim ga nacrtajte kao histogram:

moji podaci<- rnorm(100, mean = 5, sd = 1) hist(mydata, col = "light green")

Vaš se grafikon može malo razlikovati od moje jer su brojevi generirani nasumično. Kao što možete vidjeti, podaci nisu savršeno simetrični, ali čini se da zadržavaju oblik normalne distribucije. Međutim, za određivanje normalnosti podataka koristit ćemo objektivnije metode.

Jedan od najjednostavnijih testova normalnosti je kvantilni grafikon (qqplot). Bit testa je jednostavna: ako podaci imaju normalnu distribuciju, onda ne bi trebali jako odstupati od linije teoretskih kvantila i ići izvan intervala povjerenja. Napravimo ovaj test u R.

paket "automobil" u R okruženje qqPlot(mydata) #pokreni test

Kao što je vidljivo iz grafikona, naši podaci nemaju veća odstupanja od teorijske normalne distribucije. Ali ponekad sa qqplot nemoguće je dati definitivan odgovor. U ovom slučaju, trebali biste koristiti Shapiro-Wilkov test , koji se temelji na nultoj hipotezi da su naši podaci normalno raspoređeni. Ako je P-vrijednost manja od 0,05 ( p-vrijednost < 0.05), то мы вынуждены отклонить нулевую гипотезу. P-значение в этом случае будет говорить о том, что вероятность ошибки при отклонении нулевой гипотезы будет равна менее 5%.

Provođenje Shapiro-Wilkovog testa u R je jednostavno. Da biste to učinili, samo trebate pozvati funkciju shapiro.test i umetnuti naziv svojih podataka u zagrade. U našem slučaju p-vrijednost mora biti znatno veća od 0,05, što nam ne dopušta da odbacimo nultu hipotezu da su naši podaci normalno raspoređeni.

Pokrenite Studentov t-test u R

Dakle, ako podaci iz uzoraka imaju normalnu distribuciju, možete sigurno nastaviti s usporedbom srednjih vrijednosti ovih uzoraka. Postoje tri glavne vrste t-testa koji se koriste u različitim situacijama. Pogledajmo svaki od njih koristeći ilustrativne primjere.

T-test jednog uzorka (t-test jednog uzorka)

Treba odabrati t-test jednog uzorka ako usporedite uzorak s dobro poznatom sredinom. Na primjer, razlikuje li se prosječna starost stanovnika Sjevernokavkaskog federalnog okruga od opće dobi u Rusiji. Postoji mišljenje da klima Kavkaza i kulturne karakteristike naroda koji ga nastanjuju pridonose produljenju života. Kako bismo provjerili ovu hipotezu, uzet ćemo podatke RosStat-a (tablice prosječnog očekivanog životnog vijeka po regijama Rusije) i primijeniti Studentov t-test jednog uzorka. Budući da se Studentov t-test temelji na testiranju statističkih hipoteza, prihvatit ćemo kao nultu hipotezu da nema razlika između prosječnog očekivanog trajanja u Rusiji i republikama Sjevernog Kavkaza. Ako razlike postoje, onda kako bi ih smatrali statistički značajnim p-vrijednost mora biti manji od 0,05 (logika je ista kao u gore opisanom Shapiro-Wilkovom testu).

Učitajmo podatke u R. Da bismo to učinili, stvorit ćemo vektor s prosječnim vrijednostima za republike Kavkaza (uključujući Adigeju). Zatim ćemo pokrenuti t-test jednog uzorka, navodeći u parametru mu Prosječni životni vijek u Rusiji je 70,93.

rosstat<-c(79.42, 75.83, 74.16, 73.91, 73.82, 73.06, 72.01) qqPlot(rosstat) shapiro.test(rosstat) t.test(rosstat, mu = 70,93)

Unatoč činjenici da u uzorku imamo samo 7 točaka, oni općenito prolaze testove normalnosti i na njih se možemo osloniti, budući da su ti podaci već u prosjeku u regiji.

Rezultati t-testa pokazuju da je prosječni životni vijek među stanovnicima Sjevernog Kavkaza (74,6 godina) doista veći od prosjeka Rusije (70,93 godine), a rezultati testa su statistički značajni (p< 0.05).

Dva uzorka za neovisne uzorke (t-test neovisnih dva uzorka)

Koristi se t-test dva uzorka, kada usporedite dva nezavisna uzorka. Recimo da želimo znati razlikuje li se prinos krumpira na sjeveru i jugu regije. Da bismo to učinili, prikupili smo podatke s 40 farmi, od kojih se 20 nalazilo na sjeveru i činilo uzorak "Sjever", a preostalih 20 nalazilo se na jugu, formirajući uzorak "Jug".

Učitajmo podatke u okruženje R. Osim provjere normalnosti podataka, bit će korisno izgraditi "ploču s brkovima" na kojoj se može vidjeti medijan i raspršenost podataka za oba uzorka.

Sjeverno<- c(122, 150, 136, 129, 169, 158, 132, 162, 143, 179, 139, 193, 155, 160, 165, 149, 173, 173, 141, 166) qqPlot (sjever) shapiro.test (sjever) Jug<- c(170, 163, 178, 150, 166, 142, 157, 149, 151, 164, 163, 161, 159, 139, 180, 155, 144, 139, 151, 160) qqPlot(sjever) shapiro.test(sjever) boxplot(sjever, jug)

Kao što se može vidjeti iz grafikona, medijani uzoraka se međusobno ne razlikuju mnogo, međutim, raspršivanje podataka je puno veće na sjeveru. Provjerimo jesu li srednje vrijednosti statistički različite pomoću funkcije t.test. Međutim, ovaj put umjesto parametra mu stavljamo naziv drugog uzorka. Rezultati ispitivanja, koje vidite na donjoj slici, pokazuju da se prosječni prinos krumpira na sjeveru statistički ne razlikuje od onog na jugu ( str = 0.6339).

Dva uzorka za ovisne uzorke ( ovisni dvouzorak t-test)

Treći tip t-testa koristi se kada ako elementi uzoraka ovise jedan o drugom. Idealan je za provjere ponovljivosti eksperiment: ako se podaci ponavljanja statistički ne razlikuju od izvornika, onda je ponovljivost podataka visoka. Također, t-test dva uzorka za ovisne uzorke se široko koristi. u medicinskim istraživanjima kada se proučava učinak lijeka na tijelo prije i nakon primjene.

Da biste ga pokrenuli u R, morate unijeti istu funkciju t.test. Međutim, u zagradama, nakon tablica podataka, morate unijeti dodatni argument paired = TRUE . Ovaj argument kaže da vaši podaci ovise jedni o drugima. Na primjer:

t.test(eksperiment, povtor.experimenta, upareno = TRUE) t.test(pritisak.do.priema, tlak.nakon.priema, upareno = TRUE)

Također postoje dva dodatna argumenta u funkciji t.test koji mogu poboljšati kvalitetu rezultata testa: var.equal i alternativa. Ako znate da je varijacija među uzorcima jednaka, umetnite argument var.equal = TRUE. Ako želite testirati hipotezu da je razlika između srednjih vrijednosti u uzorcima znatno manja ili veća od 0, tada unesite argument alternativa="manje" ili alternativa="veće" (prema zadanim postavkama, alternativna hipoteza kaže da su uzorci jednostavno se razlikuju jedan od drugog prijatelj: alternativa="dvostrani" ).

Zaključak

Članak se pokazao prilično dugim, ali sada znate: što je Studentov kriterij i normalna raspodjela; poput korištenja funkcija qqplot i shapiro.test provjeriti normalnost podataka u R; te također demontirao tri vrste t-testova i proveo ih u R okruženju.

Tema za one koji se tek počinju upoznavati sa statističkom analizom nije laka. Stoga slobodno postavljajte pitanja, rado ću na njih odgovoriti. Gurui statistike, ispravite me ako sam negdje pogriješio. Općenito, napišite svoje komentare, prijatelji!

Upareni Studentov t-test je jedna od modifikacija Studentove metode koja se koristi za određivanje statističke značajnosti razlika u parnim (ponovljenim) mjerenjima.

1. Povijest razvoja t-testa

razvijen je t-test William Gosset za procjenu kvalitete piva u Guinnessu. U vezi s obvezama tvrtke da ne odaju poslovne tajne, Gossetov je članak objavljen 1908. u časopisu Biometrics pod pseudonimom "Student" (Student).

2. Za što se koristi upareni Studentov t-test?

Upareni Studentov t-test koristi se za usporedbu dva zavisna (uparena) uzorka. Zavisna su mjerenja kod istih pacijenata, ali u različito vrijeme, na primjer, krvni tlak u bolesnika s hipertenzijom prije i poslije uzimanje antihipertenzivnog lijeka. Nul hipoteza kaže da nema razlika između uspoređenih uzoraka, dok alternativna hipoteza kaže da postoje statistički značajne razlike.

3. Kada se može koristiti upareni Studentov t-test?

Glavni uvjet je ovisnost o uzorku, odnosno uspoređene vrijednosti treba dobiti ponovljenim mjerenjima jednog parametra.

Kao i u slučaju usporedbe neovisnih uzoraka, za primjenu uparenog t-testa potrebno je da izvorni podaci imaju normalna distribucija. Ako ovaj uvjet nije zadovoljen, treba koristiti metode za usporedbu srednjih vrijednosti uzorka. neparametarske statistike, kao Znakovi G-testa i Wilcoxonov t-test.

Upareni t-test može se koristiti samo prilikom uspoređivanja dva uzorci. Ako trebate usporediti tri ili više ponovljena mjerenja, korištenje jednosmjerna analiza varijance za ponovljene mjere.

4. Kako izračunati upareni Studentov t-test?

Upareni Studentov t-test izračunava se pomoću sljedeće formule:

gdje M d - aritmetičku sredinu razlika između pokazatelja izmjerenih prije i poslije, σd - standardna devijacija razlika pokazatelja, n - broj predmeta.

5. Kako protumačiti vrijednost Studentovog t-testa?

Interpretacija dobivene vrijednosti uparenog Studentovog t-testa ne razlikuje se od evaluacije t-testa za nepovezane populacije. Prije svega, potrebno je pronaći broj stupnjeva slobode f prema sljedećoj formuli:

f = n - 1

Nakon toga određujemo kritičnu vrijednost Studentovog t-testa za traženu razinu značajnosti (npr. p<0,05) и при данном числе степеней свободы f prema tablici ( Pogledaj ispod).

Uspoređujemo kritične i izračunate vrijednosti kriterija:

  • Ako je izračunata vrijednost uparenog Studentovog t-testa jednaka ili veća kritične, pronađene u tablici, zaključujemo da su razlike između uspoređenih vrijednosti statistički značajne.
  • Ako je vrijednost izračunatog uparenog Studentovog t-testa manji tabelarni, što znači da razlike između uspoređenih vrijednosti nisu statistički značajne.

6. Primjer izračunavanja Studentovog t-testa

Kako bi se procijenila učinkovitost novog hipoglikemijskog sredstva, mjerene su razine glukoze u krvi u bolesnika s dijabetesom prije i nakon uzimanja lijeka. Kao rezultat, dobiveni su sljedeći podaci:

Odluka:

1. Izračunajte razliku svakog para vrijednosti ( d):

Pacijent N Razina glukoze u krvi, mmol/l Razlika vrijednosti (d)
prije uzimanja lijeka nakon uzimanja lijeka
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Pronađite aritmetičku sredinu razlika pomoću formule:

3. Pronađite standardnu ​​devijaciju razlika od prosjeka po formuli:

4. Izračunajte upareni Studentov t-test:

5. Usporedimo dobivenu vrijednost Studentovog t-testa 8.6 s tabličnom vrijednošću koja s brojem stupnjeva slobode f jednako 10 - 1 = 9, a razina značajnosti p=0,05 je 2,262. Budući da je dobivena vrijednost veća od kritične, zaključujemo da postoje statistički značajne razlike u razinama glukoze u krvi prije i nakon uzimanja novog lijeka.

/-Studentov kriterij se odnosi na parametarski, stoga je njegova uporaba moguća samo kada se rezultati pokusa prezentiraju u obliku mjerenja na posljednje dvije skale - interval i omjer. Ilustrirajmo mogućnosti Studentovog kriterija na konkretnom primjeru.

Pretpostavimo da trebate saznati učinkovitost treninga gađanja u određenoj tehnici. U tu svrhu provodi se usporedni pedagoški eksperiment, gdje se jedna skupina (eksperimentalna) od 8 ljudi bavi predloženom eksperimentalnom metodologijom, a druga (kontrolna) - prema tradicionalnoj, općeprihvaćenoj. Radna hipoteza je da će nova metoda koju predlažete biti učinkovitija. Rezultat pokusa je kontrolno ispaljivanje od pet hitaca, prema čijim je rezultatima (tablica 6) potrebno izračunati pouzdanost razlika i provjeriti točnost postavljene hipoteze.

Tablica 6

Što je potrebno učiniti da se izračuna značajnost razlika prema Studentovom /-testu?

1. Izračunajte srednje aritmetičke vrijednosti X za svaku grupu zasebno koristeći sljedeću formulu:

gdje xt- vrijednost pojedinog mjerenja; i je ukupan broj mjerenja u grupi.

Stavljanje u formulu stvarnih vrijednosti iz tablice. 6, dobivamo:

Usporedba aritmetičkih srednjih vrijednosti dokazuje da je u eksperimentalnoj skupini ova vrijednost (X, = 35) veća nego u kontrolnoj skupini. (Hk= 27). No, za konačnu tvrdnju da su ispitanici u eksperimentalnoj skupini bolje naučili pucati, treba se uvjeriti u statističku značajnost razlika (/) između izračunatih aritmetičkih srednjih vrijednosti.

2. U obje skupine izračunajte standardnu ​​devijaciju (5) koristeći sljedeću formulu:

:de Ximax-- najviši pokazatelj; ximm-- najmanji pokazatelj; Do-- tabelarni koeficijent. Redoslijed kojim se izračunava standardna devijacija (5) je: -- definirati Xitrax u obje skupine; -- definirati Ximia u tim skupinama; -- odrediti broj mjerenja u svakoj skupini (l); -- pronađite u posebnoj tablici (Prilog 12) vrijednost koeficijenta DO,što odgovara broju mjerenja u skupini (8). Da biste to učinili, u krajnjem lijevom stupcu ispod indeksa (i) nalazimo broj 0, budući da je broj dimenzija u našem primjeru manji od 10, au gornjem retku - broj 8; na sjecištu ovih linija - 2,85, što odgovara vrijednosti koeficijenta.

3. Izračunajte standardnu ​​pogrešku aritmetičke sredine (m) koristeći formulu:

Za naš primjer, prva formula je prikladna, budući da P< 30. Вычислим для каждой группы значения:

4. Izračunajte prosječnu pogrešku razlike koristeći formulu:

5. Pomoću posebne tablice (Prilog 13.) odredite značaj razlika. Za to, rezultirajuća vrijednost (t) u usporedbi s graničnom vrijednošću na razini značajnosti od 5%. (t0fi5) ZA broj stupnjeva slobode/= pe + kom- 2, gdje pakirati kom~ ukupan broj pojedinačnih rezultata u eksperimentalnoj i kontrolnoj skupini. Ako se pokaže da je eksperimentalno t veća od granične vrijednosti (/0)o5)> m0 razmatraju se razlike između aritmetičkih sredina dviju skupina vjerodostojan na razini značajnosti od 50%, i obrnuto, u slučaju kada je dobiveno t manje granična vrijednost t0<05, vjeruje se da su razlike nepouzdan a razlika u aritmetičkoj sredini skupina je slučajna. Granična vrijednost na razini značajnosti od 5% (G0>05) određuje se kako slijedi:

izračunaj broj stupnjeva slobode/= 8 + 8 - 2 = 14;

pronađite u tablici (Prilog 13) graničnu vrijednost tofi5 u /= 14.

U našem primjeru, vrijednost tablice tQ<05 = 2.15, usporedite ga s izračunatim G,što je jednako 1,7, tj. manje od granične vrijednosti (2.15). Stoga se razmatraju razlike između aritmetičkih srednjih vrijednosti dobivenih u eksperimentu nepouzdan,što znači da nema dovoljno razloga reći da se jedna metoda podučavanja gađanja pokazala učinkovitijom od druge. U ovom slučaju možemo napisati: / = 1,7 na /> ​​0,05, što znači da je u slučaju 100 sličnih eksperimenata vjerojatnost (R) dobivanje sličnih rezultata kada su aritmetičke srednje vrijednosti eksperimentalnih skupina veće od kontrolnih, više od 5% razine značajnosti ili manje od 95 slučajeva od 100. Konačni dizajn tablice, uzimajući u obzir dobivene proračune i s odgovarajućim parametrima, može izgledati ovako.

Uz relativno veliki broj mjerenja, uvjetno se pretpostavlja da ako je razlika između aritmetičkih sredina jednaka ili veća od tri njezine pogreške, razlike se smatraju značajnim. U ovom slučaju, pouzdanost razlika određena je sljedećom jednadžbom:

Kao što je spomenuto na početku ovog odjeljka, Studentov /-test se može primijeniti samo kada se mjerenja vrše na ljestvici intervala i omjera. Međutim, u pedagoškim istraživanjima često postoji potreba za utvrđivanjem pouzdanosti razlika između rezultata dobivenih na ljestvici imena ili reda. U takvim slučajevima koristite neparametarski kriterijima. Za razliku od parametarskih, neparametarski kriteriji ne zahtijevaju izračun određenih parametara dobivenih rezultata (aritmetička sredina, standardna devijacija i sl.), što je glavni razlog njihovog naziva. Razmotrimo sada dva neparametarska kriterija za određivanje značajnosti razlika između neovisnih rezultata dobivenih na ljestvici reda i imena.