Biografije Karakteristike Analiza

Matematička statistika online za psihologe. Statistika i obrada podataka u psihologiji

Kao što znate, odnos između psihologije i
matematika u posljednjih godina postaje
sve bliže i složenije.
Dosadašnja praksa to pokazuje
psiholog ne bi trebao samo operirati
metode matematička statistika, ali također
predstavljaju predmet vaše znanosti s gledišta
pogled "kraljice znanosti", inače
on će biti nositelj testova koji izdaju
gotovih rezultata bez njihovog razumijevanja.

Matematičke metode su
opći naziv kompleksa
matematičke discipline ujedinjene
proučavati društvene i
psihološki sustavi i procesi.

Glavni matematičke metode preporučuje se za
podučavanje studenata psihologije:
Metode matematičke statistike. Ovdje
su uključeni korelacijska analiza, jednofaktorski
analiza varijance, dvosmjerna analiza varijance, regresijska analiza i faktorijel
analiza.
Matematičko modeliranje.
Metode teorije informacija.
Sustavna metoda.

Psihološka mjerenja

U srcu primjene matematičkog
metode i modeli u bilo kojoj znanosti leži
mjerenje. U psihologiji objekti
mjerenja su svojstva sustava
psihe ili njezinih podsustava, kao npr
percepcija, pamćenje, smjer
osobnosti, sposobnosti itd.
Mjerenje je pripisivanje
objekti brojčane vrijednosti odražavajući
mjera prisutnosti svojstva ovaj objekt.

Navedimo tri najvažnija svojstva
psihološka mjerenja.
1. Postojanje obitelji ljestvica,
dopuštajući različitim grupama
transformacije.
2. Snažan utjecaj mjerni postupci za
vrijednost mjerene veličine.
3. Višedimenzionalnost mjerenog
psihološke količine, tj. bitne
njihova ovisnost o velikom broju
parametri.

STATISTIČKA ANALIZA EKSPERIMENTALNIH PODATAKA

Pitanja:
1. Metode primarne statistike

2. Metode sekundarne statistike
obrada rezultata pokusa

METODE PRIMARNE STATISTIČKE OBRADE EKSPERIMENTALNIH REZULTATA

Metode statistička obrada
eksperimentalni rezultati nazivaju se
matematički trikovi, formule,
metode kvantitativnih izračuna, sa
preko kojih pokazatelja
dobivenih tijekom eksperimenta,
generalizirati, dovesti u sustav, otkriti
uzorci skriveni u njima.

Neke od matematičkih metoda Statistička analiza dopustiti izračunati
takozvani elementarni
matematička statistika,
karakteriziraju distribuciju uzorkovanja
podataka, na primjer
*srednja vrijednost uzorka,
*varijanca uzorka,
*moda,
*medijan i niz drugih.

10.

Druge metode matematičke statistike,
na primjer:
analiza varijance,
regresijska analiza,
omogućuju prosudbu dinamike promjena
statistika pojedinačnih uzoraka.

11.

IZ
koristeći treću skupinu metoda:
korelacijska analiza,
faktorska analiza,
metode za usporedbu uzoraka podataka,
može pouzdano prosuditi
statističke veze koje postoje
između varijable, koji
istraživan u ovom eksperimentu.

12.

Sve metode matematičke i statističke analize su uvjetne
dijele na primarne i sekundarne
Metode se nazivaju primarnim, uz pomoć
koje možete dobiti indikatore
izravno reflektirajuće rezultate
mjerenja napravljena u eksperimentu.
Metode se nazivaju sekundarnim.
statistička obrada, korištenje
koji se identificiraju na temelju primarnih podataka
skriveni u njima statistički
uzorci.

13. Razmotriti metode za izračunavanje elementarne matematičke statistike

Srednja vrijednost uzorka kao
statistika predstavlja
sami Prosječna ocjena studirao u
eksperiment psihološke kvalitete.
Srednja vrijednost uzorka određena je pomoću
sljedeća formula:
n
1
x k
nk 1

14.

Primjer. Pretpostavimo da kao rezultat
primjena psihodijagnostičkih metoda
procijeniti neke psihološke
svojstva u deset predmeta smo dobili
sljedeći parcijalni eksponenti
razvoj danu imovinu pojedinac
ispitanici:
x1=5, x2=4, x3=5, x4=6, x5=7, x6=3, x7=6, x8=
2, x9=8, x10=4.
10
1
50
x xi
5.0
10k1
10

15.

Disperzija kao statistička veličina
karakterizira kako privatno
vrijednosti odstupaju od srednje vrijednosti
vrijednosti u ovom uzorku.
Što je veća disperzija, to više
odstupanja ili raspršenost podataka.
2
S
1
2
(xkx)
nk 1
n

16. STANDARDNO ODSTUPANJE

Ponekad umjesto varijance identificirati
raspršenost privatnih podataka u odnosu na
prosjek koristiti izvedenicu od
varijanca je veličina tzv
standardna devijacija. Jednako je
kvadratni korijen izvađen iz
disperzija, a označava se istim
isti znak kao disperzija, samo bez
kvadrat
n
S
S
2
2
x
kx)
k 1
n

17. MEDIJAN

Medijan je vrijednost proučavanog
obilježje koje dijeli uzorak, poredano
prema vrijednosti ovog znaka, na pola.
Desno i lijevo od medijana u uređenom nizu
ostaje isti broj znakova.
Na primjer, za uzorak 2, 3.4, 4, 5, 6, 8, 7, 9
medijan će biti 5, jer lijevo i desno
ostavlja četiri indikatora.
Ako serija uključuje Parni broj znakovi,
tada je medijan srednja vrijednost, uzeta kao polovica zbroja
vrijednosti dviju središnjih vrijednosti serije. Za
sljedeći red 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 sredina
bit će jednak 3,5.

18. MODA

Moda se zove kvantitativna
vrijednost osobine koja se proučava,
najčešće se nalaze u selekciji
Na primjer, u nizu vrijednosti
značajke 1, 2, 5, 2, 4, 2, 6, 7, 2 mode
je vrijednost 2, budući da je
javlja se češće od ostalih vrijednosti -
četiri puta.

19. INTERVAL

Interval je skupina poredanih po
vrijednost karakterističnih vrijednosti, zamijenjenih u procesu
izračuni prema prosjeku.
Primjer. Zamislimo sljedeći niz kvocijenata
znakovi: O, 1, 1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7,
7, 8, 8, 8, 9, 9, 9, 10, 10, 11, 11, 11. Ova serija uključuje
sebi 30 vrijednosti.
Razdvojimo prikazanu seriju u šest podskupina
po pet značajki
Izračunajte prosječne vrijednosti za svaku od pet
formirane podskupine brojeva. Oni su odnosno
bit će jednak 1,2; 3.4; 5.2; 6,8; 8,6; 10.6.

20. Kontrolni zadatak

Za sljedeće retke izračunajte prosjek,
mod, medijan, standardna devijacija:
1) {3, 4, 5, 4, 4, 4, 6, 2}
2) {10, 40, 30, 30, 30, 50, 60, 20}
3) {15, 15, 15, 15, 10, 10, 20, 5, 15}.

21. METODE SEKUNDARNE STATISTIČKE OBRADE EKSPERIMENTALNIH REZULTATA

Sa sekundarnim metodama
statistička obrada
izravno eksperimentalne podatke
ispitano, dokazano ili
hipoteze vezane uz
eksperiment.
Te su metode obično teže od
metode primarne statističke obrade,
a zahtijevaju od istraživača dobro
obuka u osnovnoj
matematike i statistike.

22.

regresijski račun -
je matematička metoda
statistika, dopuštajući
okupiti privatan, raznorodan
podaci nekima
linijski grafikon,
grubo reflektirajući
njihov međusobni odnos, i
dobiti priliku da
jedna od varijabli
približan
vjerojatno značenje drugog
varijabla.

Matematičke metode u psihologiji koriste se za obradu istraživačkih podataka i utvrđivanje obrazaca između proučavanih fenomena. Ni najjednostavnije istraživanje nije potpuno bez matematičke obrade podataka.

Obrada podataka može se vršiti ručno ili uz pomoć posebnog uređaja softver. Konačni rezultat može izgledati kao tablica; Metode u psihologiji također vam omogućuju grafički prikaz dobivenih podataka. Za različite (kvantitativne, kvalitativne i redne) koriste se različiti alati za ocjenjivanje.

Matematičke metode u psihologiji uključuju i metode koje omogućuju utvrđivanje numeričkih ovisnosti i metode statističke obrade. Pogledajmo pobliže najčešće od njih.

Za mjerenje podataka, prije svega, potrebno je odrediti mjerilo mjerenja. I ovdje se koriste takve matematičke metode u psihologiji kao registracija i skaliranje, koji se sastoji od izražavanja proučavanih pojava u numeričkim terminima. Postoji nekoliko vrsta ljestvica. Međutim, samo su neki od njih pogodni za matematičku obradu. Ovo je uglavnom kvantitativna ljestvica koja vam omogućuje mjerenje stupnja izraženosti određenih svojstava u predmetima koji se proučavaju i numerički izrazite razliku između njih. Najjednostavniji primjer- mjerenje IQ-a. Kvantitativna ljestvica vam omogućuje izvođenje operacije rangiranja podataka (vidi dolje). Rangiranje pretvara podatke iz kvantitativne ljestvice u nominalnu vrijednost (na primjer, niska, srednja ili visoka vrijednost indikator), dok obrnuti prijelaz više nije moguć.

Rangiranje je distribucija podataka u silaznom (uzlaznom) redoslijedu značajke koja se procjenjuje. U ovom slučaju koristi se kvantitativna ljestvica. Svakoj vrijednosti dodijeljen je određeni rang (indikator s minimalna vrijednost- rang 1, sljedeća vrijednost- rang 2, i tako dalje), nakon čega postaje moguće prenijeti vrijednosti s kvantitativne ljestvice na nominalnu. Primjerice, mjeren pokazatelj je razina anksioznosti. Testirano je 100 ljudi, rezultati se rangiraju, a istraživač vidi koliko ljudi ima nizak (visok ili prosječan) rezultat. Međutim, ovakav način prezentiranja podataka podrazumijeva djelomičan gubitak informacija za svakog ispitanika.

Korelacijska analiza je uspostavljanje odnosa među pojavama. Pritom se mjeri kako će se jedan pokazatelj promijeniti kada se promijeni pokazatelj u odnosu s kojim se mijenja. Korelacija se promatra u dva aspekta: u snazi ​​i u smjeru. Ona može biti pozitivna (s porastom jednog pokazatelja, raste i drugi) i negativna (s porastom prvog, drugi pokazatelj se smanjuje: npr. što je kod pojedinca viša razina anksioznosti, to je manja vjerojatnost da će preuzeti čelnu poziciju u grupi). Odnos može biti linearan ili, češće, zakrivljen. Veze koje pomažu u uspostavljanju možda neće biti očite na prvi pogled ako se koriste druge metode matematičke obrade u psihologiji. To je njegova glavna zasluga. Nedostaci uključuju veliki intenzitet rada zbog potrebe korištenja znatnog broja formula i pažljivih izračuna.

Faktorska analiza- ovo je još jedan koji vam omogućuje predviđanje vjerojatnog utjecaja razni faktori za proces koji se proučava. U isto vrijeme, svi čimbenici utjecaja su inicijalno prihvaćeni kao prisutni jednaka vrijednost, a stupanj njihovog utjecaja izračunava se matematički. Ova analiza omogućuje utvrđivanje zajednički uzrok varijabilnost nekoliko pojava odjednom.

Za prikaz primljenih podataka koriste se metode tabeliranja (izrada tablica) i grafička konstrukcija(dijagrami i grafikoni koji ne samo da daju vizualni prikaz dobivenih rezultata, već vam također omogućuju predviđanje tijeka procesa).

Glavni uvjeti pod kojima gore navedene matematičke metode u psihologiji osiguravaju pouzdanost studije su prisutnost dovoljnog uzorka, točnost mjerenja i ispravnost napravljenih izračuna.

Matematička statistika - Znanost o tome kako sistematizirati i koristiti statističke podatke u znanstvene i primijenjene svrhe.

Matematička statistika u psihologiji

U psihologiji kao znanosti matematička statistika ima vrlo široku primjenu. Različitim sredstvima, kao što su testiranje, različite značajke ljudsko se ponašanje uspoređuje s brojevima (skalira), a na tim se brojevima već radi metodama matematičke statistike. Primjenom ovih metoda dobivaju se novi podaci koje treba sagledati.

Bez korištenja matematičke statistike psihologija bi bila prilično plošna i neinformativna znanost utemeljena na spekulacijama i nagađanjima (kao što je to npr. slučaj u psihoanalizi). Naravno, korištenje matematičke statistike nije „protuotrov“ protiv špekulacija i špekulacija, ali predmet promišljanja postaje puno bogatiji.

Razmotrimo tipičan i jednostavan slučaj korištenja matematičke statistike. Recimo da je netko napravio studiju na grupi školaraca. Među ostalim, pronađeni su parametri kao što su ekstravertnost-introvertnost i razina inteligencije. Psihologa istraživača zanimalo je kako su ovi parametri međusobno povezani. Je li istina da su introverti u prosjeku pametniji od ekstroverta? Da bismo to učinili, skupina ispitanika (uzorak) može se podijeliti u dvije podskupine: ekstroverte i introverte. Zatim je za svaku podskupinu aritmetička sredina u smislu inteligencije. Ako, recimo, introverti imaju viši prosječni IQ, onda su pametniji od ekstroverta. Ovo je jedan pristup. Drugi bi mogao biti podijeliti subjekte u podskupine s visokim IQ (preko 100) i niskim IQ (ispod 100), a zatim izračunati prosjek ekstraverzije-introverzije u svakoj skupini. Treći pristup mogao bi biti korištenje više složena metoda– korelacijska analiza. Sve ove tri metode prikazat će istu vezu na različite načine.

Matematička statistika omogućuje vam da dođete do zanimljivih, ponekad iznenađujućih otkrića. Nastavimo s našim hipotetskim primjerom. Pretpostavimo da je psiholog pronašao paradoksalan rezultat koji je u suprotnosti s njegovim prošlim iskustvom i znanjem. Recimo, otkrio je da su u jednoj školi ekstroverti pametniji od introverta, iako je u svim ostalim školama bilo obrnuto. Zašto je to? Pedantan psiholog može započeti svoju istragu i ustanoviti da je to, primjerice, zbog toga što u ovoj školi ekstroverti idu na izborni predmet iz fizike (jer postoji "profesor sa satom") i razvijaju svoju inteligenciju, a introverti idu na izbornu književnost. (jer tamo " učitelj duše“), gdje razvijaju druge kvalitete svoje duše. Može li, primjerice, psihoanalitičar doći do takvog otkrića? Vrlo malo vjerojatno.

NA psihološka istraživanja ne uzimaju se u obzir samo takvi čisto psihološki parametri kao što su, recimo, inteligencija, ekstraverzija ili anksioznost. Podaci kao što su dob, spol, stupanj obrazovanja, visina, težina, fizička snaga, politički pogledi, radno iskustvo i još mnogo toga. Često se događa da upravo bez takvih nepsiholoških pokazatelja studije ispadnu nepotpune i neinformativne. Također se često događa da predstavnici drugih znanosti (primjerice, sociologije ili biologije) također koriste psihološke parametre u svojim istraživanjima.

Matematička statistika omogućuje mnoge stvari:

Praktični psiholozi u svom su radu obično ograničeni na pronalaženje aritmetičke sredine, uz podjelu na podskupine (kao u gornjem primjeru). Psiholozi koriste najraznovrsniji arsenal metoda matematičke statistike. Razmotrimo glavne.

Pronalaženje aritmetičke sredine

Najbanalnija i najjednostavnija metoda. Indikatori (na primjer, rast ispitanika) se zbrajaju, a zatim dijele s brojem ispitanika. Unatoč svojoj jednostavnosti, metoda je, naravno, vrlo informativna i vizualna. vidljivost - važna kvaliteta metoda za praktični psiholog. Kada rezultate svog istraživanja prezentira kupcu (na primjer, ravnatelju škole), daleko od toga da je uvijek u stanju razumjeti bit analize korelacije ili varijance. Podjela ispitanika u podskupine na proizvoljnoj osnovi povećava potencijal aritmetičke sredine, omogućujući vam da pokrijete većinu potreba istraživača.

Način nalaženja i medijan

Pretpostavimo da smo anketirali 1000 učenika - izmjerili njihovu visinu do najbližeg centimetra. Ti su podaci uneseni u tablicu. Ako je najčešća vrijednost u tablici, recimo, 172 centimetra, ovo je moda naš uzorak. Na sličan se način, inače, koristi riječ "moda" u svakodnevnom životu: ako su ove sezone najčešće crveni šeširi, onda je to moda, iako ti šeširi mogu činiti tek 20-30 posto.

U psihološkim istraživanjima modus je obično negdje blizu aritmetičke sredine. Ako je moda 172 cm, onda će prosjek biti otprilike toliki. Što je uzorak veći, mod i aritmetička sredina su bliži.

Unaprijediti. Pretpostavimo da smo naše učenike podijelili u dvije jednake skupine: u prvoj skupini je 500 slabih učenika, u drugoj skupini 500 srednjoškolci. Vrijednost rasta koja pada na 500. ili 501. učenika je medijan. Medijan je obično također blizu aritmetičke sredine.

Detekcija disperzije vrijednosti

Kao što je poznato, Prosječna temperatura bolnica nije toliko bitna. A u dobroj bolnici gdje se ljudi dobro liječe, prosječna temperatura može biti 36,6°C; a u lošem može biti isto: samo netko ima temperaturu od 40 °C, a netko je već umro, a ima 18 °C.

Najlakši način za procjenu raspršenosti uzorka je pronaći ga djelokrug(inače - raspršiti). Ako u našem uzorku najniži učenik ima visinu od 148 cm, a najviši učenik 205 cm, tada će raspon uzorka biti 205-148 = 57 cm.Ova vrijednost je prije svega važna za procjenu koliko na koje se ovaj parametar općenito mijenja.

Unaprijediti. Pretpostavimo ovu situaciju. Za dvadeset godina, po hiru nekog bogataša, imat će djecu klonova. Za sljedećih dvadeset godina ići će na sveučilište. I bit će uzorak od 1000 studenata na sveučilištu, od kojih 998 ima visinu od 177 cm, jedan - 148 cm, jedan - 205 cm. Što se tiče glavnih parametara - aritmetičke sredine, moda, medijana, raspona - ovo uzorak se ne smije razlikovati od drugog uzorka učenika (bit će iste vrijednosti). Ali u isto vrijeme, u drugom (normalnom) uzorku bit će određeni broj učenika visine 150-160 cm, neki 180-190 cm, itd. Dakle, ispada da su sa stajališta matematičke statistike te skupine iste?

Dovoljan je jedan pogled na ovu sliku da se shvati da se skupine razlikuju po disperziji vrijednosti. Stoga u statistici postoji točniji alat za procjenu disperzije − disperzija. Varijanca se izračunava na sljedeći način: nalazi se aritmetička sredina, zatim se za svaki slučaj pronalazi odstupanje od srednje vrijednosti, ta se vrijednost kvadrira i na kraju dijeli s ukupno slučajeva. Iz vrijednosti varijance je lako dobiti standardna devijacija: to je Korijen od disperzije. Standardna devijacija znači, razumljivo, standardna devijacija: to jest, mjera koliko, u prosjeku, vrijednosti općenito odstupaju.

Standardna devijacija se mjeri u istim jedinicama kao i sam parametar. U našoj prvoj hipotetskoj skupini, gdje su gotovo svi učenici isti, standardna će devijacija biti iznimno mala (manje od 1 cm). U drugoj skupini bit će mnogo više - 10-15 centimetara. Ako nam se kaže da je prosječna visina učenika 175 cm sa standardnom devijacijom od 12 cm, znat ćemo da je većina učenika (oko 2/3) u rasponu od 163 do 187 cm.

Studentov t-test

Pretpostavimo da odlučimo provesti eksperiment ove vrste. Uzeli smo grupu ispitanika. Prije početka eksperimenta testirana je, recimo, razina kreativnosti. Zatim su cijeli mjesec proveli crtajući po sat vremena dnevno. Na kraju eksperimenta ponovno smo ih testirali na njihovu razinu kreativnosti. Rezultat je bio zapažen, ali prilično mali, a skeptici su nam počeli govoriti da se razina kreativnosti nije povećala, blagi porast aritmetičke sredine samo je slučajnost.

Za takve situacije, oni različite kriterije. Jedan od njih - najpopularniji - je Studentov t-test. U brojniku ima razliku aritmetičkih sredina. Nazivnik je korijen zbroja kvadrata varijanci (što znači prvi i drugi slučaj testiranja). Kako veća razlika između aritmetičkih sredina, to bolje (naš rad nije bio uzaludan), a što je manji raspon vrijednosti u oba slučaja dijagnostike, to bolje: kada je raspon vrijednosti veći, onda su i slučajne fluktuacije veće .

Za primjenu ovog kriterija postoji značajno ograničenje – distribucija pokazatelja treba biti bliska tzv. normalan(u obliku zvona).

Postoje posebni kriteriji za određivanje stupnja normalnosti distribucije.

Poveznica

U psihologiji, kao vjerojatno ni u jednoj drugoj znanosti, vole pronalaziti koeficijente korelacije. Ima ih nekoliko različiti pristupi, uključujući normalne i nenormalne normalna distribucija. Svi oni pokazuju stupanj ovisnosti jednog parametra o drugom. Ako jedan parametar (na primjer, težina osobe) jako ovisi o drugom parametru (na primjer, visina osobe), tada će korelacijski koeficijent biti blizu +1. Ako je ovisnost obrnuta (na primjer, što je osoba viša, to je manje spretna), tada će korelacijski koeficijent težiti -1. Ako nema korelacije (recimo, sreća pri kartanju ne ovisi o visini osobe), tada će koeficijent korelacije biti oko 0.

Ako uzmemo skupinu ispitanika, fiksiramo njihovu visinu i težinu, a potom rezultate prenesemo na dvodimenzionalni graf, dobivamo nešto poput sljedeće slike, što ukazuje da je korelacija pozitivna, otprilike na razini +0,5.

Faktorska analiza

Možda najtajanstvenija analiza. Dio njegove misterije je zbog činjenice da je on sam namjeravao pronaći novi parametar, što mnogo objašnjava, ali nije proučavano izravno tijekom eksperimenta. U pravilu se tijekom faktorske analize pronalaze najutjecajniji parametri o kojima ovise manji, privatni.

Pretpostavimo da provodimo studiju sa školskom djecom. Između ostalih, bilo ih je sljedeće opcije: opći akademski uspjeh, akademski uspjeh iz egzaktnih predmeta, akademski uspjeh humanitarni predmeti, volumen kratkotrajno pamćenje, volumen i distribucija pažnje, aktivnost mišljenja, prostorna imaginacija, opća svijest, društvenost, anksioznost. Ako primijenimo korelacijsku analizu i sastavimo takozvanu korelacijsku matricu (koja odražava odnos svakog parametra sa svakim), tada možemo vidjeti da većina tih parametara međusobno dobro korelira. Izuzetak su posljednja dva, koja su slabo povezana s drugima. Već gledajući ovu matricu, možemo pretpostaviti da iza većine parametara postoji određeni zajednički (super-parametar) koji utječe na sve njih. Provodimo postupak faktorske analize, nakon čega se u našoj matrici pojavljuje još jedan stupac - stupac bez naziva. Ovaj misteriozni parametar vrlo dobro korelira sa svima (osim društvenosti i anksioznosti). Nakon malo kreativnog razmišljanja, psiholog ovdje dolazi do jedinog mogućeg tumačenja - misteriozni parametar je inteligencija. Utječe na sve ostalo, njegov utjecaj je jak, iako ne stopostotan.

Postoje metode faktorske analize koje pomažu identificirati ne jedan, već nekoliko čimbenika koji utječu na druge parametre. Često se, naravno, događa da se misteriozni parametar ispostavi da nije tako misteriozan, ali se potpuno podudara s jednim od onih parametara koji su bili fiksni. Ali ponekad se također dogodi da morate dugo razbijati glavu prije nego što uspijete protumačiti taj tajni faktor.

Faktorsku analizu koriste uglavnom znanstvenici za dublje razumijevanje predmeta istraživanja. U ovom slučaju treba imati na umu da je za točnost rezultata potrebno veliki broj subjekti: poželjno je da broj ispitanika višestruko premašuje broj parametara.

Faktorska analiza može se koristiti za proučavanje kvalitete psihološki testovi. Ako uzmemo npr. bilo koji upitnik osobnosti s nekoliko parametara, te parametre podvrgne faktorskoj analizi, tada se može pojaviti neki čudan zajednički faktor koji utječe na sve parametre. značajan psihološko značenje možda i nije - to je samo sklonost subjekta da odgovori na ovaj ili onaj način na formalnoj osnovi (netko odgovara promišljeno, netko je sklon odabrati prve stavke od ponuđenih opcija, netko zadnje). Veliki utjecaj ovoga zajednički faktor može biti pokazatelj loše kvalitete izrade.

Književnost

Ermolaev O. Yu. Matematička statistika za psihologe: Udžbenik. - 2. izd. ispraviti - M.: MPSI, Flinta, 2003. - 336 str.

O. A. ŠUŠERINA

matematička statistika

za psihologe

Tutorial

Krasnojarsk 2012

Dio 1. Deskriptivna statistika

Tema 1. Opća populacija. Uzorak. Izbor…………….....

Tema 2. Varijacijski i statistički nizovi………………………

Tema 3. Brojčane karakteristike uzorka……………………….....

2. dio. Statističke procjene parametri distribucije populacija

Tema 1. Bodovne procjene populacijski parametri...

Tema 2 Intervalne procjene parametri populacije…………………………………………………………………

Dio 3. Provjerite statističke hipoteze

Tema 1. Osnovni pojmovi teorije statističkog odlučivanja……………………………………………………………………….

Tema 2. Provjera hipoteza o razlici u razini izraženosti proučavanog svojstva (Mann-Whitneyev kriterij)…………………...

Tema 3. Provjera hipoteze o jednakosti općih sredina (neovisni uzorci)…………………………………………………….

Tema 4. Provjera hipoteze o jednakosti općih sredina (ovisni uzorci)…………………………………………….

Dio 4. Korelacijska analiza

Tema 1. Korelacija i njeno statističko proučavanje………………………………………………………………………

Tema 2. Značaj brzina uzorkovanja linearna korelacija……………………………………………………………………

Tema 3. Koeficijenti korelacija ranga i udruge………………………………………………………………………

Književnost……………………………………………………………

Prijave. stolovi …………………………………………….


Dio 1. Deskriptivna statistika

Tema 1. opća populacija. uzorak. izbor.

Matematička statistika - ovo je znanost koja razvija metode za bilježenje, opisivanje i analizu opažačkih i eksperimentalnih podataka u svrhu dobivanja vjerojatnosno-statističkih modela fenomena koji se proučavaju. Njegove su metode primjenjive na obradu opažanja i eksperimenata bilo koje prirode.

Metode i metode matematičke i statističke obrade studentima humanitarnih fakulteta, pa tako i psiholoških, uzrokuju značajne poteškoće i posljedično strah i predrasude u mogućnosti njihovog svladavanja. Međutim, kako praksa pokazuje, to su lažne zablude.

NA moderna psihologija, u praktične aktivnosti psihologa bilo koje razine, bez korištenja aparata matematičke statistike, svi se zaključci mogu percipirati s određenim stupnjem subjektivnosti.

1. Problemi matematičke statistike

Glavni svrha matematičke statistike- dobivanje i obrada podataka za statistički značajnu podršku procesu donošenja odluka, npr. pri rješavanju problema planiranja, upravljanja, predviđanja.

Zadatak matematičke statistike je studija masovne pojave u društvu, prirodi, tehnologiji metodama teorije vjerojatnosti i njihovom znanstvenom potkrijepljenošću.

NA teorija vjerojatnosti mi, poznavajući prirodu neke pojave, saznajemo kako će se ponašati određene karakteristike koje proučavamo, a koje se mogu promatrati u eksperimentima.

NA matematička statistika , naprotiv, početni podaci su eksperimentalni podaci (opažanja o slučajnim varijablama), i potrebno je donijeti jednu ili drugu prosudbu o prirodi fenomena koji se proučava.

Glavni zadaci matematičke statistike su:

§ Evaluacija numeričke karakteristike ili parametri distribucije nasumična varijabla prema eksperimentalnim podacima.

§ Testiranje statističkih hipoteza o svojstvima slučajne pojave koja se proučava.

§ Definicija empirijska ovisnost između varijabli koje opisuju slučajni fenomen na temelju eksperimentalnih podataka.

Smatrati tipični dizajn istraživanja prilikom rješavanja ovih problema. Ove studije se prirodno dijele na dva dijela.

1. dio. Prvo se promatranjem i pokusima prikupljaju, bilježe statistički podaci koji čine uzorak – to su brojevi, tzv. uzorak podataka . Zatim se slažu, prezentiraju u kompaktnom, vizualnom ili funkcionalnom obliku. Izračunavaju se različite vrste prosječnih vrijednosti koje karakteriziraju uzorak. Dio matematičke statistike koji omogućuje ovaj rad zove se opisne statistike .

2. dio. Drugi dio rada istraživača sastoji se u dobivanju, na temelju podataka o uzorku, dovoljno potkrijepljenih zaključaka o svojstvima slučajne pojave koja se proučava. Ovaj dio rada predviđen je statističkim metodama koje su izlazna statistika.

2. Metoda uzorkovanja istraživanje

Aktivnosti" href="/text/category/vidi_deyatelmznosti/" rel="bookmark">vrsta aktivnosti koja zahtijeva visoku profesionalna kompetencija a često i dovoljno vremena za rad sa svakim predmetom. Pomoć dolazi selektivna metoda istraživanja , u ovom slučaju, ograničeni broj objekata se nasumično bira iz cijele populacije i proučava.

Populacija je skup objekata (bilo koje skupine ljudi) koje psiholog proučava na temelju uzorka. Teoretski, vjeruje se da veličina opće populacije nije ograničena. U praksi se smatra da je taj volumen ograničen ovisno o predmetu promatranja i problemu koji se rješava.

Iz cjelokupne populacije ljudi, koja se naziva opća populacija, nasumično se odabire ograničeni broj osoba (subjekata, ispitanika). Poziva se skup nasumično odabranih objekata za proučavanje uzorak populacije , ili jednostavno uzorkovanje .

Volumen uzorci navedite broj ljudi u njemu. Veličina uzorka je označena slovom . Može biti različito, ali ne manje od dva ispitanika. Statistike su:

mali uzorak ();

prosječni uzorak ();

velik uzorkovanje ().

Proces uzorkovanja naziva se izbor.

Na uzorkovanje možete to učiniti na sljedeće načine:

1) nakon odabira i proučavanja subjekta, on se "vraća" u opću populaciju; takav se uzorak naziva ponovljeno. Psiholog često mora testirati iste subjekte nekoliko puta koristeći istu tehniku, ali će svaki put subjekti imati razlike zbog funkcionalne i dobne varijabilnosti svojstvene svakoj osobi;

2) nakon odabira i proučavanja subjekta ne vraća u opću populaciju; takav se uzorak naziva neponavljajuće .

Do uzorkovanje predstavljeni zahtjevi određena ciljevima i zadacima studija.

1. Organizirano uzorkovanje mora biti predstavnik kako bi to bilo ispravno predstaviti u istom omjeru i istoj učestalosti glavna su obilježja u općoj populaciji. Uzorak će biti reprezentativan ako se provede slučajno: svaki subjekt se odabire slučajnim odabirom iz opće populacije ako svi objekti imaju istu vjerojatnost da budu uključeni u uzorak. Reprezentativni uzorak je manji, ali točan populacijski model.

NA znanstveno istraživanje kad se radi o dijelu (odvojenom uzorku), nikada nije moguće potpuno okarakterizirati cjelinu (opću populaciju, populaciju). Takve se pogreške, kada se generaliziraju, prenose rezultati dobiveni proučavanjem zasebnog uzorka na cijelu populaciju pogreške reprezentativnosti .

2. Uzorak mora biti homogena , tj. svaki predmet mora imati one karakteristike koje su kriteriji za studij: dob, spol, obrazovanje i tako dalje. Uvjeti provođenja pokusa ne smiju se mijenjati, a uzorak treba dobiti iz jedne opće populacije.

Uzorci se nazivaju nezavisna (nesuvislo ), ako postupak pokusa i dobiveni rezultati mjerenja određenog svojstva kod ispitanika jednog uzorka ne utječu na značajke tijeka istog pokusa i rezultate mjerenja istog svojstva kod ispitanika drugog uzorka.

Uzorci se nazivaju ovisan (poveznica ) ako postupak pokusa i rezultati mjerenja određenog svojstva, provedeni na jednom uzorku, utječu na rezultate mjerenja istog svojstva u drugom pokusu. Napomenimo da ista grupa predmeta, gdje je psihološko ispitivanje provedeno dva puta (iako različito psihološke kvalitete, znakovi, značajke), razmatra se ovisni ili povezani uzorak.

Glavna faza u radu psihologa s uzorkom je identifikacija rezultata statističke analize i diseminacija nalaza na cjelokupnu populaciju.

Odabir najprikladnije veličine uzorka ovisi o:

1) stupanj homogenosti fenomena koji se proučava (što je fenomen homogeniji, to manji može biti uzorak);

2) statističke metode koristi psiholog. Neke metode zahtijevaju velik broj ispitanika (više od 100 osoba), druge dopuštaju mali broj (5-7 osoba).

Statistička studija

1. Prikupljanje empirijskih podataka Selektivna metoda istraživanja

2. Primarna obrada Varijacijski nizovi

rezultate zapažanja

Empirijska distribucija

Frekventni poligon Frekventni histogram

3. Matematička obrada

Statistički podaci Procjena parametara

distribucija

Korelacijske metode Faktorske metode Regresijske metode

analiza analiza analiza

Faze statističkog istraživanja

ispitna pitanja

1. Koji su glavni zadaci matematičke statistike?

2. Ono što se naziva općim i uzorak populacije za slučajnu varijablu koja se proučava?

3. U čemu je bit selektivne metode?

4. Koji se uzorak naziva reprezentativnim, homogenim?

1. Tablice grupiranih podataka

Obrada eksperimentalnog materijala započinje s sistematizacija i grupiranja rezultate za neki atribut.

stolovi. Glavni sadržaj tablice trebao bi se odražavati u titula.

jednostavan stol je popis, popis pojedinih ispitnih jedinica s kvantitativnim odn kvalitativna karakteristika. Koristi se grupiranje po jednom atributu (na primjer, po spolu).

složena tablica koristi se za razjašnjavanje uzročno-posljedičnih odnosa između znakova i omogućuje vam prepoznavanje trenda, otkrivanje različite aspekte između znakova.

Broj predmeta

Dobiveni bodovi za zadatak

2. Diskretni statistički nizovi

Niz podataka koji se nalazi u redoslijedom kojim su dobiveni u pokusu, Zove se statističke serije .

Rezultati promatranja, u opći slučaj mora biti poredan niz brojeva raspoređenih u neredu ( rang). Možete rangirati uzlaznim ili silaznim redoslijedom. Nakon operacije rangiranja, eksperimentalni podaci mogu se grupirati tako da u svakoj skupini značajka ima istu vrijednost, što se naziva opcija (označeno s ).

Broj elemenata u svakoj grupi naziva se mogućnosti frekvencije(). Frekvencija pokazuje, koliko se puta sastaje dana vrijednost u izvornoj populaciji. ukupni iznos frekvencija je jednaka veličini uzorka: .

Poziva se uređena serija distribucije u kojoj je naznačena učestalost varijante koja pripada određenoj populaciji varijacijski pokraj.

Varijante (karakteristične vrijednosti)

Statistika u psihologiji (statistika u psihologiji)

Prva uporaba S. u psihologiji često se povezuje s imenom Sir Francisa Galtona. U psihologiji, "statistika" se odnosi na primjenu kvantitativne mjere te metode za opisivanje i analizu rezultata psihol. istraživanje Psihologija kao znanost o S. potrebno je. Bilježenje, opis i analiza kvantitativnih podataka omogućuje valjane usporedbe temeljene na objektivnim kriterijima. S. koji se koristi u psihologiji obično se sastoji od dva dijela: deskriptivne (opisne) statistike i teorije statističkog zaključivanja.

Opisne statistike.

Deskriptivna S. uključuje metode organiziranja, sažimanja i opisivanja podataka. Deskriptivna metrika omogućuje brzo i učinkovito predstavljanje velikih skupova podataka. Najčešće korištene deskriptivne metode su distribucije frekvencija, mjere središnje tendencije i mjere relativnog položaja. Regresija i korelacije koriste se za opisivanje odnosa između varijabli.

Distribucija učestalosti pokazuje koliko se puta svaki kvalitativni ili kvantitativni pokazatelj (ili interval takvih pokazatelja) pojavljuje u nizu podataka. Osim toga, često se navode relativne učestalosti - postotak odgovora svake vrste. Frekvencijska distribucija omogućuje brzi uvid u strukturu podataka, što bi bilo teško postići izravnim radom s neobrađenim podacima. Za vizualna prezentacija podataka o frekvenciji, često se koriste različite vrste dijagrama.

Mjere središnje tendencije su završni S., koji opisuju što je tipično za distribuciju. Način je definiran kao opažanje koje se najčešće pojavljuje (vrijednost, kategorija itd.). Medijan je vrijednost koja raspolavlja distribuciju tako da jedna polovica uključuje sve vrijednosti iznad medijana, a druga polovica uključuje sve vrijednosti ispod medijana. Srednja vrijednost se izračunava kao aritmetička sredina svih promatranih vrijednosti. Koja će od mjera – mod, medijan ili srednja vrijednost – najbolje opisati distribuciju ovisi o njenom obliku. Ako je distribucija simetrična i unimodalna (s jednim modom), srednja sredina i mod jednostavno će biti isti. Na prosjek posebno utječu "outlieri", pomičući njegovu vrijednost prema ekstremne vrijednosti distribucije, što čini aritmetičku sredinu najmanje korisnom mjerom jako iskrivljenih (iskrivljenih) distribucija.

Dr. korisne deskriptivne karakteristike distribucija su mjere varijabilnosti, odnosno mjere u kojoj se vrijednosti varijable razlikuju u varijacijske serije. Dvije distribucije mogu imati iste srednje vrijednosti, medijane i moduse, ali se značajno razlikuju u stupnju varijabilnosti vrijednosti. Varijabilnost se procjenjuje pomoću dva S.: varijance i standardne devijacije.

Mjere relativne pozicije uključuju percentile i normalizirane rezultate koji se koriste za opisivanje lokacije određene vrijednosti varijable u odnosu na ostale njezine vrijednosti u distribuciji. Velkowitz et al definiraju percentil kao "broj koji pokazuje postotak slučajeva u određenoj referentnoj skupini s jednakim ili nižim rezultatima." Prema tome, percentil pruža točniju informaciju od jednostavnog izvješćivanja da određena distribucija ima vrijednost varijable iznad ili ispod srednje vrijednosti, medijana ili moda.

Normalizirani rezultati (koji se obično nazivaju z-rezultati) izražavaju odstupanje od srednje vrijednosti u jedinicama standardne devijacije (σ). Normalizirani rezultati korisni su jer se mogu tumačiti u odnosu na standardiziranu normalnu distribuciju (z-distribuciju), simetričnu krivulju u obliku zvona s poznatim svojstvima srednje vrijednosti 0 i standardne devijacije 1. Budući da z-rezultat ima predznak (+ ili -), odmah pokazuje je li promatrana vrijednost varijable iznad ili ispod srednje vrijednosti (m). A budući da normalizirana procjena izražava vrijednosti varijable u jedinicama standardne devijacije, pokazuje koliko je svaka vrijednost rijetka: približno 34% svih vrijednosti pada u interval od m do m + 1σ i 34% - u interval od m do m - 1σ; po 14% - u intervalima od m + 1σ do m + 2σ i od m - 1σ do m - 2σ; i to po 2% - u intervalima od m + 2σ do m + 3σ i od m - 2σ do m - 3σ.

Veze između varijabli. Regresija i korelacija su među metodama koje se najčešće koriste za opisivanje odnosa između varijabli. Dva različita mjerenja dobivena za svaki element uzorka mogu se prikazati kao točke Kartezijanski sustav koordinate (x, y) - dijagram raspršenja, koji je grafički prikaz veze između ovih dimenzija. Često te točke tvore gotovo ravnu liniju, pokazujući linearna veza između varijabli. Da biste dobili regresijsku liniju - mat. linijske jednadžbe koje najbolje odgovaraju skupu točaka dijagrama raspršenja – korištene numeričke metode. Nakon što se povuče regresijska linija, postaje moguće predvidjeti vrijednosti jedne varijable prema poznate vrijednosti drugi i, štoviše, ocijeniti točnost predviđanja.

Koeficijent korelacije (r) je kvantitativni pokazatelj čvrstoće linearnog odnosa između dviju varijabli. Metode za izračunavanje koeficijenata korelacije isključuju problem usporedbe različitih mjernih jedinica varijabli. Vrijednosti r variraju od -1 do +1. Znak odražava smjer veze. Negativna korelacija znači prisutnost obrnuti odnos kada s porastom vrijednosti od jedne varijabla vrijednosti druge varijable smanjenje. Pozitivna korelacija označava izravnu povezanost, kada s povećanjem vrijednosti jedne varijable rastu vrijednosti druge varijable. Apsolutna vrijednost r pokazuje snagu (tijesnost) odnosa: r = ±1 znači pravolinijski odnos, a r = 0 označava nepostojanje linearnog odnosa. Vrijednost r2 pokazuje postotak varijance u jednoj varijabli koji se može objasniti varijacijom u drugoj varijabli. Psiholozi koriste r2 za procjenu prediktivne korisnosti određene mjere.

Pearsonov koeficijent korelacije (r) je za intervalne podatke dobivene na navodno normalno distribuiranim varijablama. Za obradu ostalih vrsta podataka postoji cijela linija druge korelacijske mjere, npr. točkasti biserijalni koeficijent korelacije, koeficijent j i Spearmanov rang koeficijent korelacije (r). Korelacije se često koriste u psihologiji kao izvor informacija. za formuliranje hipoteza eksperim. istraživanje Višestruka regresija, faktorska analiza i kanonički korelacijski oblik srodna grupa više modernim metodama, koji su postali dostupni praktičarima zahvaljujući napretku računalne tehnologije. Ove metode omogućuju analizu odnosa između veliki broj varijable.

Teorija statističkog zaključivanja

Ovaj odjeljak C. uključuje sustav metoda za dobivanje zaključaka o velike skupine(zapravo populacije) na temelju opažanja u manjim skupinama koje se nazivaju uzorci. U psihologiji, statističko zaključivanje služi u dvije glavne svrhe: 1) procijeniti parametre opće populacije iz statistike uzorka; 2) procijeniti šanse za dobivanje određenog uzorka rezultata istraživanja sa zadanim karakteristikama uzoraka podataka.

Prosječna je populacijski parametar koji se najčešće procjenjuje. Zbog načina na koji se izračunava standardna pogreška, veći uzorci obično daju manje standardne pogreške, što statistiku izračunatu iz većih uzoraka čini nešto većom. precizne procjene populacijski parametri. Iskorištavati standardna pogreška prosječne i normalizirane (standardizirane) distribucije vjerojatnosti (kao što je t-distribucija), može se konstruirati intervali povjerenja- raspone vrijednosti s poznatim šansama da će pravi opći prosjek pasti u njih.

Evaluacija rezultata istraživanja. Teorija statističkog zaključivanja može se koristiti za procjenu vjerojatnosti da određeni uzorci pripadaju poznatoj populaciji. Proces statističkog zaključivanja počinje formulacijom Nulta hipoteza(H0), koji se sastoji u pretpostavci da uzorak statistike dobivenih od određene populacije. Nulta hipoteza se zadržava ili odbacuje, ovisno o tome koliko je vjerojatan rezultat. Ako su uočene razlike velike u odnosu na veličinu varijabilnosti uzorka, istraživač će obično odbaciti nultu hipotezu i zaključiti da postoji vrlo mala vjerojatnost da su uočene razlike posljedica slučajnosti: rezultat je statistički značajan. Izračunata kriterijska statistika s poznatim distribucijama vjerojatnosti izražava odnos između promatranih razlika i varijabilnosti (varijabilnosti).

Parametarska statistika. Parametarski S. može se koristiti u slučajevima kada su ispunjena dva zahtjeva: 1) varijabla koja se proučava je poznata ili se barem može pretpostaviti da ima normalnu distribuciju; 2) podaci su intervalna mjerenja ili mjerenja omjera.

Ako su srednja vrijednost populacije i standardna devijacija poznati (barem okvirno), moguće je odrediti točnu vjerojatnost dobivanja opažene razlike između poznatog parametra populacije i statistike uzorka. Normalizirano odstupanje (z-rezultat) može se pronaći usporedbom sa standardiziranom normalnom krivuljom (koja se naziva i z-distribucija).

Budući da istraživači često rade s malim uzorcima i jer su parametri populacije rijetko poznati, standardizirana Studentova t-distribucija općenito se koristi više od normalne distribucije. Točan oblik t-distribucije varira ovisno o veličini uzorka (točnije, o broju stupnjeva slobode, tj. broju vrijednosti koje se mogu slobodno mijenjati u danom uzorku). Obitelj t-distribucija može se koristiti za testiranje nulte hipoteze da su dva uzorka izvučena iz iste populacije. Ova nulta hipoteza tipična je za studije s dvije skupine ispitanika, npr. eksperimentalni i kontrolu.

Kada je u istraživanju uključeno je više od dvije skupine, može se primijeniti analiza varijance (F-test). F je univerzalni kriterij koji procjenjuje razlike između svih mogućih parova studijskih grupa istovremeno. U ovom slučaju uspoređuju se vrijednosti disperzije unutar grupa i između grupa. Postoje mnoge post hoc tehnike za identificiranje uparenog izvora značajnosti F-testa.

Neparametarska statistika. Kada nije moguće zadovoljiti uvjete za odgovarajuću primjenu parametarskih kriterija ili kada su prikupljeni podaci ordinalni (rang) ili nominalni (kategorički), koriste se neparametarske metode. Ove metode su po svojoj primjeni i namjeni paralelne parametarskim. Neparametarske alternative t-testu uključuju Mann-Whitneyjev U test, Wilcoxonov (W) test i c2 test za nominalne podatke. Neparametarske alternative analizi varijance uključuju Kruskal-Wallaceov, Friedmanov i c2 test. Logika iza svake neparametarski kriterij ostaje ista: odgovarajuća nulta hipoteza se odbacuje ako je procijenjena vrijednost statistike kriterija izvan navedenog kritičnog područja (tj. pokaže se da je manje vjerojatna od očekivane).

Budući da se svi statistički zaključci temelje na procjenama vjerojatnosti, moguća su dva pogrešna ishoda: pogreške tipa I, u kojima se istinita nulta hipoteza odbacuje, i pogreške tipa II, u kojima se zadržava lažna nulta hipoteza. Prvi rezultiraju pogrešnom potvrdom istraživačke hipoteze, dok drugi rezultiraju nemogućnošću prepoznavanja statistički značajnog rezultata.

Vidi također ANOVA, Mjere središnje tendencije, Faktorska analiza, Mjerenje, Metode multivarijatna analiza, Testiranje nulte hipoteze, Vjerojatnost, Statističko zaključivanje

A. Myers

Pogledajte što je "statistika u psihologiji" u drugim rječnicima:

    Sadržaj 1 Biomedicinske i životne znanosti (Biomedical and Life Sciences) 2 Z ... Wikipedia

    Ovaj članak sadrži nedovršeni prijevod s strani jezik. Projektu možete pomoći tako da ga prevedete do kraja. Ako znate na kojem je jeziku napisan fragment, naznačite ga u ovom predlošku ... Wikipedia