Biografije Karakteristike Analiza

Izračunajte korelaciju u excelu. Kako izračunati korelaciju u programu Microsoft Excel

Korelacijska analiza je popularna metoda statistička istraživanja, koji se koristi za prepoznavanje stupnja ovisnosti jednog pokazatelja o drugom. U Microsoft Excel postoji poseban alat namijenjen za obavljanje ove vrste analize. Saznajmo kako koristiti ovu značajku.

Suština korelacijske analize

Svrha korelacijska analiza je identificirati odnos između razni faktori. Odnosno, utvrđuje se utječe li smanjenje ili povećanje jednog pokazatelja na promjenu drugog.

Ako se utvrdi ovisnost, tada se određuje koeficijent korelacije. Za razliku od regresijska analiza, jedini je pokazatelj koji izračunava ovu metodu statistička istraživanja. Koeficijent korelacije kreće se od +1 do -1. Ako postoji pozitivna korelacija, povećanje jednog pokazatelja doprinosi povećanju drugog. Uz negativnu korelaciju, povećanje jednog pokazatelja povlači za sobom smanjenje drugog. Što je veći modul koeficijenta korelacije, to se promjena jednog pokazatelja uočljivije odražava na promjenu drugog. S koeficijentom jednakim 0, ovisnost između njih potpuno je odsutna.

Izračun koeficijenta korelacije

Sada pokušajmo izračunati koeficijent korelacije na konkretan primjer. Imamo tablicu u kojoj su troškovi oglašavanja i iznos prodaje mjesečno oslikani u zasebnim stupcima. Moramo otkriti stupanj ovisnosti broja prodaja o iznosu novca koji je potrošen na oglašavanje.

Metoda 1: Određivanje korelacije putem čarobnjaka za funkcije

Jedan od načina na koji možete provesti korelacijsku analizu je korištenje funkcije CORREL. Sama funkcija ima opći oblik CORREL(niz1, niz2).

  1. Odaberite ćeliju u kojoj bi trebao biti prikazan rezultat izračuna. Kliknite gumb "Umetni funkciju" koji se nalazi lijevo od trake formule.
  2. Na popisu koji se prikazuje u prozoru čarobnjaka za funkcije potražite i odaberite funkciju CORREL. Kliknite na gumb "OK".
  3. Otvara se prozor s argumentima funkcije. U polje "Array1" unesite koordinate raspona ćelija jedne od vrijednosti, čiju ovisnost treba odrediti. U našem slučaju, to će biti vrijednosti u stupcu "Iznos prodaje". Kako biste unijeli adresu niza u polje, jednostavno odaberite sve ćelije s podacima u gornjem stupcu.

    U polje "Array2" morate unijeti koordinate drugog stupca. Imamo troškove oglašavanja. Na isti način kao u prethodnom slučaju upisujemo podatke u polje.

    Kliknite na gumb "OK".

Kao što vidite, korelacijski koeficijent u obliku broja pojavljuje se u ćeliji koju smo prethodno odabrali. U ovaj slučaj jednak je 0,97, što je vrlo visoki znak ovisnost jedne veličine o drugoj.

Metoda 2: Izračunajte korelaciju pomoću paketa za analizu

Osim toga, korelacija se može izračunati pomoću jednog od alata koji se nalaze u paketu za analizu. Ali prvo moramo aktivirati ovaj alat.

  1. Idite na karticu "Datoteka".
  2. U prozoru koji se otvori prijeđite na odjeljak "Postavke".
  3. Zatim idite na stavku "Dodaci".
  4. Na dnu sljedećeg prozora, u odjeljku "Upravljanje", pomaknite prekidač na položaj "Excel dodaci", ako je u drugom položaju. Kliknite na gumb "OK".
  5. U prozoru dodataka potvrdite okvir pokraj stavke "Paket analize". Kliknite na gumb "OK".
  6. Nakon toga se aktivira paket analize. Idite na karticu "Podaci". Kao što vidite, ovdje se na vrpci pojavljuje novi blok alata - "Analiza". Kliknite na gumb "Analiza podataka", koji se nalazi u njemu.
  7. Popis se otvara s razne opcije Analiza podataka. Odaberite "Korelacija". Kliknite na gumb "OK".
  8. Otvara se prozor s parametrima korelacijske analize. Za razliku od prethodne metode, u polje "Interval unosa" upisujemo interval ne za svaki stupac posebno, već za sve stupce koji sudjeluju u analizi. U našem slučaju to su podaci u stupcima "Potrošnja oglasa" i "Prodaja".

    Parametar "Grupiranje" ostavljamo nepromijenjen - "Po stupcima", jer su naše grupe podataka podijeljene u dva stupca. Ako su izlomljeni redak po redak, tada prekidač treba pomaknuti u položaj "Po redovima".

    Prema zadanim postavkama opcije izlaza postavljene su na "Novi radni list", odnosno podaci će biti prikazani na drugom listu. Možete promijeniti mjesto pomicanjem prekidača. To može biti trenutni list (tada ćete morati odrediti koordinate izlaznih ćelija informacija) ili nova radna knjiga (datoteka).

    Kada su sve postavke postavljene, kliknite na gumb "OK".

Budući da je izlazna lokacija rezultata analize ostavljena prema zadanim postavkama, prelazimo na novi list. Kao što vidite, ovdje je koeficijent korelacije. Naravno, isti je kao i kod prve metode - 0,97. To je zato što obje opcije izvode iste izračune, samo se mogu napraviti na različite načine.

Kao što vidite, aplikacija Excel nudi dvije metode korelacijske analize odjednom. Rezultat izračuna, ako sve učinite kako treba, bit će potpuno identičan. No, svaki korisnik može odabrati prikladniju opciju izračuna za sebe.

Drago nam je što smo vam mogli pomoći riješiti problem.

Postavite svoje pitanje u komentarima, detaljno opisujući bit problema. Naši stručnjaci će pokušati odgovoriti što je brže moguće.

Je li vam ovaj članak pomogao?

Regresijska i korelacijska analiza - statističke metode istraživanje. Ovo su najčešći načini za prikaz ovisnosti parametra o jednoj ili više neovisnih varijabli.

U nastavku o određenim praktični primjeri Razmotrimo ove dvije vrlo popularne analize među ekonomistima. Također ćemo dati primjer dobivanja rezultata kada se oni kombiniraju.

Regresijska analiza u Excelu

Prikazuje utjecaj nekih vrijednosti (nezavisnih, neovisnih) na zavisnu varijablu. Primjerice, kako broj ekonomski aktivnog stanovništva ovisi o broju poduzeća, plaćama i drugim parametrima. Ili: kako strana ulaganja, cijene energenata i sl. utječu na razinu BDP-a.

Rezultat analize omogućuje vam određivanje prioriteta. I na temelju glavnih čimbenika, predvidjeti, planirati razvoj prioritetna područja donositi menadžerske odluke.

Regresija se događa:

  • linearno (y = a + bx);
  • parabolični (y = a + bx + cx2);
  • eksponencijalni (y = a * exp(bx));
  • snaga (y = a*x^b);
  • hiperbolički (y = b/x + a);
  • logaritamski (y = b * 1n(x) + a);
  • eksponencijalni (y = a * b^x).

Razmotrite primjer konstrukcije regresijski model u Excelu i tumačenje rezultata. Idemo uzeti linearni tip regresija.

Zadatak. Kod 6 poduzeća prosječna mj plaća te broj umirovljenih djelatnika. Potrebno je utvrditi ovisnost broja umirovljenih radnika o prosječnoj plaći.

Model linearne regresije ima sljedeći oblik:

Y \u003d a0 + a1x1 + ... + akhk.

Gdje su a regresijski koeficijenti, x su utjecajne varijable, a k je broj faktora.

U našem primjeru, Y je pokazatelj broja radnika koji su napustili posao. Faktor utjecaja je plaća (x).

Excel ima ugrađene funkcije koje se mogu koristiti za izračunavanje parametara modela linearne regresije. Ali dodatak Analysis ToolPak to će učiniti brže.

Aktivirajte moćan analitički alat:

  1. Pritisnite gumb "Office" i idite na karticu "Excel Options". "Dodaci".
  2. Na dnu, ispod padajućeg popisa, u polju "Upravljanje" nalazit će se natpis "Excel dodaci" (ako ga nema kliknite na potvrdni okvir s desne strane i odaberite). I gumb Idi. Klik.
  3. Otvara se popis dostupnih dodataka. Odaberite "Analysis Package" i kliknite OK.

Nakon aktivacije, dodatak će biti dostupan na kartici Podaci.

Sada ćemo se izravno pozabaviti regresijskom analizom.

  1. Otvorite izbornik alata za analizu podataka. Odaberite "Regresija".
  2. Otvorit će se izbornik za odabir ulaznih vrijednosti i izlaznih opcija (gdje prikazati rezultat). U poljima za početne podatke označavamo raspon opisanog parametra (Y) i faktor koji na njega utječe (X). Ostatak može, ali i ne mora biti dovršen.
  3. Nakon što kliknete OK, program će prikazati izračune na novom listu (možete odabrati interval za prikaz na trenutnom listu ili dodijeliti izlaz novoj radnoj knjizi).

Prije svega, obraćamo pozornost na R-kvadrat i koeficijente.

R-kvadrat je koeficijent determinacije. U našem primjeru to je 0,755, odnosno 75,5%. To znači da izračunati parametri modela objašnjavaju odnos između proučavanih parametara za 75,5%. Što je veći koeficijent determinacije, to je model bolji. Dobro - iznad 0,8. Loše - manje od 0,5 (takva se analiza teško može smatrati razumnom). U našem primjeru - "nije loše".

Koeficijent 64,1428 pokazuje koliki će biti Y ako su sve varijable u modelu koji se razmatra jednake 0. Odnosno, drugi faktori koji nisu opisani u modelu također utječu na vrijednost analiziranog parametra.

Koeficijent -0,16285 pokazuje težinu varijable X na Y. Odnosno, prosječna mjesečna plaća unutar ovog modela utječe na broj onih koji su odustali s težinom od -0,16285 (ovo je mali stupanj utjecaja). Znak "-" označava loš utjecaj: kako više plaćešto manje ljudi odustane. Što je pošteno.

Korelacijska analiza u Excelu

Korelacijska analiza pomaže utvrditi postoji li odnos između pokazatelja u jednom ili dva uzorka. Na primjer, između vremena rada stroja i troškova popravaka, cijene opreme i trajanja rada, visine i težine djece itd.

Ako postoji odnos, tada dovodi li povećanje jednog parametra do povećanja (pozitivna korelacija) ili do smanjenja (negativna) drugog. Korelacijska analiza pomaže analitičaru odrediti može li vrijednost jednog pokazatelja predvidjeti moguću vrijednost drugog.

Koeficijent korelacije označava se r. Varira od +1 do -1. Klasifikacija korelacija za različita područja bit će različita. S vrijednošću koeficijenta 0 linearna ovisnost ne postoji između uzoraka.

Pogledajmo kako koristiti Excel alati pronaći koeficijent korelacije.

Funkcija CORREL koristi se za pronalaženje uparenih koeficijenata.

Zadatak: Utvrditi postoji li veza između vremena rada tokarilice i troškova njenog održavanja.

Postavite kursor u bilo koju ćeliju i pritisnite gumb fx.

  1. U kategoriji "Statistika" odaberite funkciju CORREL.
  2. Argument "Niz 1" - prvi raspon vrijednosti - vrijeme stroja: A2: A14.
  3. Argument "Niz 2" - drugi raspon vrijednosti - trošak popravka: B2:B14. Pritisnite OK.

Da biste odredili vrstu veze, morate pogledati apsolutni broj koeficijent (svako polje aktivnosti ima svoju ljestvicu).

Za korelacijsku analizu nekoliko parametara (više od 2) prikladnije je koristiti "Analizu podataka" (dodatak "Analysis Package"). Na popisu trebate odabrati korelaciju i označiti niz. Svi.

Rezultirajući koeficijenti bit će prikazani u korelacijskoj matrici. Kao ova:

Korelacijska-regresijska analiza

U praksi se ove dvije tehnike često koriste zajedno.

  1. Gradimo korelacijsko polje: "Umetni" - "Dijagram" - "Raspršeni dijagram" (omogućuje vam usporedbu parova). Raspon vrijednosti su svi numerički podaci u tablici.
  2. Kliknite lijevom tipkom miša na bilo koju točku na dijagramu. Zatim desno. U izborniku koji se otvori odaberite "Dodaj liniju trenda".
  3. Dodijelite parametre za liniju. Tip - "Linearni". Na dnu - "Prikaži jednadžbu u dijagramu."
  4. Pritisnite "Zatvori".

Sada su vidljivi podaci regresijske analize.

1.Otvorite program Excel

2. Napravite stupce s podacima. U našem primjeru razmotrit ćemo odnos, odnosno korelaciju, između agresivnosti i sumnje u sebe kod učenika prvog razreda. U eksperimentu je sudjelovalo 30 djece, podaci su prikazani u Excel tablici:

1 stupac - broj predmeta

2. stupac - agresivnost u bodovima

3 stupac - sumnja u sebe u bodovima

3. Zatim je potrebno označiti praznu ćeliju pokraj tablice i kliknuti na ikonu f(x) u Excel ploči

4. Otvorit će se izbornik funkcija među kategorijama koje trebate odabrati Statistički, a zatim na popisu funkcija abecednim redom pronađite CORREL i kliknite OK

5. Zatim će se otvoriti izbornik argumenata funkcije, koji će nam omogućiti odabir stupaca podataka koji su nam potrebni. Za odabir prvog stupca Agresivnost potrebno je kliknuti na plavu tipku pored linije Niz1

6. Odaberimo podatke za niz1 iz stupca Agresivnost i kliknite na plavi gumb u dijaloškom okviru

7. Zatim, slično kao kod Niza 1, kliknite na plavu tipku pored linije Niz2

8. Odaberimo podatke za niz2- stupac Skromnost i ponovo pritisnite plavu tipku, zatim OK

9.Ovdje je r-Pearsonov koeficijent korelacije izračunat i upisan u odabranu ćeliju.U našem slučaju on je pozitivan i približno jednak. Ovo govori o umjereno pozitivno poveznice između agresivnosti i sumnje u sebe kod učenika prvog razreda

Tako, statističko zaključivanje eksperiment će biti: r = 0,225, otkriven je umjeren pozitivan odnos između varijabli agresivnost I skromnost.

U nekim studijama potrebno je navesti p-razinu značajnosti koeficijenta korelacije, međutim Excel program, za razliku od SPSS-a, ne pruža ovu mogućnost. U redu je, postoje tablice kritičnih vrijednosti korelacija (A.D. Nasledov).

Također možete izgraditi regresijsku liniju u Excelu i priložiti je rezultatima studije.

Koeficijent korelacije odražava stupanj povezanosti dvaju pokazatelja. Uvijek ima vrijednost od -1 do 1. Ako se koeficijent nalazi blizu 0, onda kažu da nema veze između varijabli.

Ako je vrijednost blizu jedan (od 0,9, na primjer), tada postoji jak izravni odnos između promatranih objekata. Ako je koeficijent blizu drugog krajnja točka raspon (-1), tada postoji jak inverzni odnos između varijabli. Kada je vrijednost negdje između 0 do 1 ili 0 do -1, tada pričamo O slaba veza(izravno ili obrnuto). Taj se odnos obično ne uzima u obzir: smatra se da ne postoji.

Izračun koeficijenta korelacije u Excelu

Razmotrimo, na primjer, metode za izračunavanje koeficijenta korelacije, značajke izravnog i obrnutog odnosa između varijabli.

Vrijednosti indikatora x i y:

Y je nezavisna varijabla, x je zavisna varijabla. Potrebno je pronaći snagu (jako/slabo) i smjer (naprijed/natrag) odnosa među njima. Formula za koeficijent korelacije izgleda ovako:


Kako bismo pojednostavili njegovo razumijevanje, raščlanit ćemo ga na nekoliko jednostavnih elemenata.

Između varijabli postoji jaka izravna povezanost.

Ugrađena funkcija CORREL izbjegava komplicirane izračune. Izračunajmo koeficijent korelacije para u Excelu pomoću njega. Nazivamo gospodarom funkcija. Nalazimo ono što nam treba. Argumenti funkcije su niz y vrijednosti i niz x vrijednosti:

Pokažimo vrijednosti varijabli na grafikonu:


Postoji jaka veza između y i x, jer Linije idu gotovo paralelno jedna s drugom. Veza je izravna: povećanje y - povećanje x, smanjenje y - smanjenje x.



Matrica parnih korelacijskih koeficijenata u Excelu

Korelacijska matrica je tablica u kojoj se na sjecištu redaka i stupaca nalaze koeficijenti korelacije između odgovarajućih vrijednosti. Ima smisla izgraditi ga za nekoliko varijabli.

Matrica koeficijenata korelacije u Excelu izgrađena je pomoću alata "Korelacija" iz paketa "Analiza podataka".


Između vrijednosti y i x1 pronađena je jaka izravna veza. Između x1 i x2 postoji jaka Povratne informacije. Praktično nema veze s vrijednostima u stupcu x3.

1.Otvorite program Excel

2. Napravite stupce s podacima. U našem primjeru razmotrit ćemo odnos, odnosno korelaciju, između agresivnosti i sumnje u sebe kod učenika prvog razreda. U eksperimentu je sudjelovalo 30 djece, podaci su prikazani u Excel tablici:

1 stupac - broj predmeta

2 stupac - agresivnost u bodovima

3 stupac - skromnost u bodovima

3. Zatim je potrebno označiti praznu ćeliju pokraj tablice i kliknuti na ikonu f(x) u Excel ploči

4. Otvorit će se izbornik funkcija među kategorijama koje trebate odabrati Statistički , a zatim na popisu funkcija abecednim redom pronađite CORREL i kliknite OK

5. Zatim će se otvoriti izbornik argumenata funkcije, koji će nam omogućiti odabir stupaca podataka koji su nam potrebni. Za odabir prvog stupca Agresivnost potrebno je kliknuti na plavu tipku pored linije Niz1

6. Odaberimo podatke za niz1 iz stupca Agresivnost i kliknite na plavi gumb u dijaloškom okviru

7. Zatim, slično kao kod Niza 1, kliknite na plavu tipku pored linije Niz2

8. Odaberimo podatke za niz2- stupac Skromnost i ponovo pritisnite plavu tipku, zatim OK

9. Ovdje je r-Pearsonov koeficijent korelacije izračunat i upisan u odabranu ćeliju.U našem slučaju on je pozitivan i približno jednak 0,225 . Ovo govori o umjereno pozitivno poveznice između agresivnosti i sumnje u sebe kod učenika prvog razreda

Tako, statističko zaključivanje eksperiment će biti: r = 0,225, otkriven je umjeren pozitivan odnos između varijabli agresivnost I skromnost.

U nekim studijama potrebno je navesti razinu p-značajnosti koeficijenta korelacije, ali Excel, za razliku od SPSS-a, ne pruža takvu mogućnost. U redu je, postoji (A.D. Nasledov).

Također ga možete priložiti uz rezultate studije.

Koeficijent korelacije (ili linearni koeficijent korelacija) označava se kao "r" (u rijetkim slučajevima kao "ρ") i karakterizira linearnu korelaciju (odnosno odnos koji je zadan nekom vrijednošću i smjerom) dviju ili više varijabli. Vrijednost koeficijenta je između -1 i +1, odnosno korelacija može biti pozitivna i negativna. Ako je koeficijent korelacije -1, postoji savršena negativna korelacija; ako je koeficijent korelacije +1, postoji savršena pozitivna korelacija. U drugim slučajevima postoji pozitivna korelacija, negativna korelacija ili nema korelacije između dviju varijabli. Koeficijent korelacije može se izračunati ručno, besplatnim mrežnim kalkulatorima ili dobrim grafičkim kalkulatorom.

Koraci

Ručno izračunavanje koeficijenta korelacije

    Prikupiti podatke. Prije nego počnete izračunavati koeficijent korelacije, proučite zadani par brojeva. Bolje ih je zapisati u tablicu koja se može poredati okomito ili vodoravno. Označite svaki redak ili stupac kao "x" i "y".

    • Na primjer, dana su četiri para vrijednosti (brojeva) varijabli "x" i "y". Možete izraditi sljedeću tablicu:
      • x || g
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Izračunajte aritmetičku sredinu "x". Da biste to učinili, zbrojite sve vrijednosti "x", a zatim rezultat podijelite s brojem vrijednosti.

    • U našem primjeru dane su nam četiri vrijednosti za varijablu "x". Da biste izračunali aritmetičku sredinu "x", zbrojite ove vrijednosti, a zatim podijelite zbroj s 4. Izračuni će biti napisani na sljedeći način:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Pronađite aritmetičku sredinu "y". Da biste to učinili, slijedite iste korake, odnosno zbrojite sve vrijednosti "y", a zatim podijelite zbroj s brojem vrijednosti.

    • U našem primjeru dane su nam četiri vrijednosti za varijablu "y". Dodajte ove vrijednosti, a zatim podijelite zbroj s 4. Izračuni će biti napisani na sljedeći način:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Izračunajte standardnu ​​devijaciju "x". Nakon izračunavanja prosjeka "x" i "y", pronađite standardne devijacije ove varijable. Standardna devijacija izračunava se pomoću sljedeće formule:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1 , 83 (\displaystyle \sigma _(x)=1,83)
  4. Izračunajte standardnu ​​devijaciju "y". Slijedite korake u prethodnom koraku. Upotrijebite istu formulu, ali u nju zamijenite vrijednosti "y".

    • U našem primjeru, izračuni će biti napisani na sljedeći način:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2 , 58 (\displaystyle \sigma _(y)=2,58)
  5. Zapiši osnovnu formulu za izračun koeficijenta korelacije. Ova formula uključuje srednje vrijednosti, standardna odstupanja i broj (n) parova brojeva obiju varijabli. Koeficijent korelacije označava se s "r" (u rijetkim slučajevima s "ρ"). Ovaj članak koristi formulu za izračun Pearsonovog koeficijenta korelacije.

    • Ovdje iu drugim izvorima količine se mogu označavati na različite načine. Na primjer, neke formule imaju "ρ" i "σ", dok druge imaju "r" i "s". Neki udžbenici daju druge formule, ali one jesu matematičke analogije gornju formulu.
  6. Izračunali ste srednje vrijednosti i standardne devijacije obiju varijabli, tako da možete koristiti formulu za izračun koeficijenta korelacije. Podsjetimo se da je "n" broj parova vrijednosti obje varijable. Vrijednosti ostalih veličina su prethodno izračunate.

    • U našem primjeru, izračuni će biti napisani na sljedeći način:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\lijevo((\frac (1)(n-1))\desno) \Sigma \lijevo((\frac (x-\mu _(x))(\sigma _(x)))\desno)*\lijevo((\frac (y-\mu _(y))(\sigma _(y)))\desno))
    • ρ = (1 3) ∗ (\displaystyle \rho =\lijevo((\frac (1)(3))\desno)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\desno)*\lijevo((\frac (1-4)(2,58))\desno)+\lijevo((\frac (2-3)(1,83))\desno) *\lijevo((\ frac (3-4)(2,58))\desno))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\desno)*\lijevo((\frac (5-4)(2,58))\desno)+\lijevo((\frac (5-3)(1,83))\ desno)*\lijevo( (\frac (7-4)(2,58))\desno))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6 +1+1+6)(4,721))\desno))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\lijevo((\frac (1)(3))\desno)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\lijevo((\frac (2,965)(3))\desno))
    • ρ = 0 , 988 (\displaystyle \rho =0,988)
  7. Analizirajte rezultat. U našem primjeru koeficijent korelacije je 0,988. Ova vrijednost na neki način karakterizira dati skup parova brojeva. Obratite pozornost na predznak i veličinu vrijednosti.

    • Budući da je vrijednost koeficijenta korelacije pozitivna, postoji pozitivna korelacija između varijabli "x" i "y". Odnosno, kada se povećava vrijednost "x", povećava se i vrijednost "y".
    • Budući da je vrijednost koeficijenta korelacije vrlo blizu +1, vrijednosti varijabli x i y su visoko korelirane. Ako stavite točkice koordinatna ravnina, nalazit će se blizu neke ravne linije.

    Korištenje online kalkulatora za izračun koeficijenta korelacije

    1. Pronađite na internetu kalkulator za izračun koeficijenta korelacije. Taj se koeficijent često računa u statistici. Ako postoji mnogo parova brojeva, praktički je nemoguće ručno izračunati koeficijent korelacije. Stoga postoje online kalkulatori za izračun koeficijenta korelacije. U tražilicu upišite "kalkulator koeficijenta korelacije" (bez navodnika).

    2. Unesite podatke. Pročitajte upute na stranici za točan unos podataka (parovi brojeva). Iznimno je važno unijeti odgovarajuće parove brojeva; inače ćete dobiti pogrešan rezultat. Imajte na umu da različite web stranice imaju različite formate unosa podataka.

      • Na primjer, na web mjestu http://ncalculators.com/statistics/correlation-coefficient-calculator.htm vrijednosti varijabli "x" i "y" unose se u dvije vodoravne linije. Vrijednosti su odvojene zarezima. To jest, u našem primjeru, vrijednosti "x" se unose ovako: 1,2,4,5, a vrijednosti "y" su ovako: 1,3,5,7.
      • Na drugom mjestu, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , podaci se unose okomito; u ovom slučaju nemojte brkati odgovarajuće parove brojeva.
    3. Izračunajte koeficijent korelacije. Nakon unosa podataka jednostavno kliknite na gumb "Izračunaj", "Izračunaj" ili sličan gumb kako biste dobili rezultat.

      Korištenje grafičkog kalkulatora

      1. Unesite podatke. Uzmite grafički kalkulator, prebacite se na način statističkog izračuna i odaberite naredbu Uredi.

        • Na različitim kalkulatorima morate pritisnuti različite tipke. Ovaj se članak fokusira na kalkulator Texas Instruments TI-86.
        • Za prebacivanje u način statističkog izračuna pritisnite - Stat (iznad tipke "+"). Zatim pritisnite F2 - Uredi (Uredi).
      2. Izbrišite prethodno spremljene podatke. Većina kalkulatora čuva vaše unesene statistike dok ih ne izbrišete. Kako biste izbjegli brkanje starih podataka s novim podacima, prvo izbrišite sve pohranjene podatke.

        • Koristite tipke sa strelicama za pomicanje kursora i označavanje naslova "xStat". Zatim pritisnite Clear i Enter za brisanje svih vrijednosti unesenih u stupac xStat.
        • Pomoću tipki sa strelicama označite naslov "yStat". Zatim pritisnite Clear i Enter za brisanje svih vrijednosti unesenih u stupac yStat.
      3. Unesite početne podatke. Pomoću tipki sa strelicama pomaknite kursor na prvu ćeliju pod naslovom "xStat". Unesite prvu vrijednost i pritisnite Enter. Na dnu ekrana ispisat će se "xStat (1) = __" s unesenom vrijednošću umjesto razmaka. Nakon što pritisnete Enter, unesena vrijednost će se pojaviti u tablici, a kursor će se pomaknuti u sljedeći redak; ovo će prikazati "xStat(2) = __" na dnu ekrana.

        • Unesite sve vrijednosti varijable "x".
        • Nakon što ste unijeli sve vrijednosti za varijablu x, koristite tipke sa strelicama za navigaciju do stupca yStat i unesite vrijednosti za varijablu y.
        • Nakon unosa svih parova brojeva, pritisnite Izlaz za brisanje zaslona i izlaz iz načina zbrajanja.
      4. Izračunajte koeficijent korelacije. Karakterizira koliko su podaci blizu neke ravne linije. Grafički kalkulator može brzo odrediti odgovarajuću ravnu liniju i izračunati koeficijent korelacije.

        • Pritisnite Statistika (statistika) - Calc (izračuni). Na TI-86 pritisnite - - .
        • Odaberite funkciju "Linearna regresija" ( Linearna regresija). Na TI-86 pritisnite , što je označeno kao "LinR". Redak "LinR _" bit će prikazan na zaslonu s trepćućim kursorom.
        • Sada unesite nazive dviju varijabli: xStat i yStat.
          • Na TI-86 otvorite popis imena; da biste to učinili pritisnite – – .
          • Dostupne varijable prikazane su u donjem retku zaslona. Odaberite (najvjerojatnije pritiskom na F1 ili F2), unesite zarez, a zatim odaberite .
          • Pritisnite Enter za obradu unesenih podataka.
      5. Analizirajte rezultate. Pritiskom na Enter na ekranu će se prikazati sljedeće informacije:

        • y = a + b x (\displaystyle y=a+bx): je funkcija koja opisuje ravnu liniju. Imajte na umu da funkcija nije napisana u standardnom obliku (y = kx + b).
        • a = (\displaystyle a=). Ovo je y-koordinata točke u kojoj se pravac siječe s y-osi.
        • b = (\displaystyle b=). Ovaj nagib ravno.
        • corr = (\displaystyle (\text(corr))=). Ovo je koeficijent korelacije.
        • n = (\displaystyle n=). Ovo je broj parova brojeva koji su korišteni u izračunima.

Gdje su x y, x, y srednje vrijednosti uzoraka; σ(x), σ(y) - standardna odstupanja.
Osim toga, koeficijent korelacije linearnog para može se odrediti preko regresijskog koeficijenta b: a+bx .

Ostale opcije formule:
ili

K xy - korelacijski moment (koeficijent kovarijance)

Linearni koeficijent korelacije ima vrijednosti od -1 do +1 (vidi Chaddockovu ljestvicu). Na primjer, kada se analizira čvrstoća linearne korelacije između dviju varijabli, dobiven je koeficijent linearne korelacije para jednak –1. To znači da postoji točan inverzni linearni odnos između varijabli.

Geometrijsko značenje koeficijenta korelacije: r xy pokazuje koliko se razlikuje nagib dviju regresijskih linija: y(x) i x(y), koliko se razlikuju rezultati minimiziranja odstupanja u x i u y. Što je veći kut između linija, to je veći r xy .
Predznak koeficijenta korelacije poklapa se s predznakom koeficijenta regresije i određuje nagib regresijske linije, tj. opća orijentacija ovisnosti (povećanje ili smanjenje). Apsolutna vrijednost koeficijenta korelacije određena je stupnjem blizine točaka regresijskoj liniji.

Svojstva koeficijenta korelacije

  1. |r xy | ≤ 1;
  2. ako su X i Y neovisni, tada je r xy =0, suprotno nije uvijek točno;
  3. ako je |r xy |=1, tada je Y=aX+b, |r xy (X,aX+b)|=1, gdje su a i b konstantni i ≠ 0;
  4. |r xy (X,Y)|=|r xy (a 1 X+b 1 , a 2 X+b 2)|, gdje su a 1 , a 2 , b 1 , b 2 konstante.

Uputa. Navedite količinu izvornih podataka. Dobiveno rješenje sprema se u Word datoteku (vidi Primjer pronalaženja regresijske jednadžbe). Predložak rješenja također se automatski generira u Excelu. .

Broj linija (početni podaci)
Date su konačne vrijednosti količina (∑x, ∑x 2 , ∑xy, ∑y, ∑y 2)