Beregn korrelasjon i excel. Hvordan beregne korrelasjon i Microsoft Excel

Korrelasjonsanalyse er en populær metode statistisk studie, som brukes til å identifisere graden av avhengighet til en indikator av en annen. PÅ Microsoft Excel det er et spesialverktøy utviklet for å utføre denne typen analyser. La oss finne ut hvordan du bruker denne funksjonen.

Essensen av korrelasjonsanalyse

hensikt korrelasjonsanalyse er å identifisere forholdet mellom ulike faktorer. Det vil si at det bestemmes om en reduksjon eller økning i en indikator påvirker endringen i en annen.

Hvis avhengigheten er etablert, bestemmes korrelasjonskoeffisienten. I motsetning til regresjonsanalyse, er den eneste indikatoren som beregner denne metoden statistisk forskning. Korrelasjonskoeffisienten varierer fra +1 til -1. Hvis det er en positiv korrelasjon, bidrar en økning i den ene indikatoren til en økning i den andre. Med en negativ korrelasjon innebærer en økning i den ene indikatoren en reduksjon i den andre. Jo større modulen til korrelasjonskoeffisienten er, jo mer merkbar er endringen i en indikator reflektert i endringen i den andre. Med en koeffisient lik 0, er avhengigheten mellom dem helt fraværende.

Beregning av korrelasjonskoeffisienten

La oss nå prøve å beregne korrelasjonskoeffisienten på spesifikt eksempel. Vi har en tabell der kostnadene for annonsering og salgsmengden er malt månedlig i separate kolonner. Vi må finne ut graden av avhengighet av antall salg på hvor mye penger som ble brukt på reklame.

Metode 1: Bestemme korrelasjon gjennom funksjonsveiviseren

En av måtene du kan utføre en korrelasjonsanalyse på er å bruke CORREL-funksjonen. Funksjonen i seg selv har generell form CORREL(matrise1; matrise2).

Velg cellen der resultatet av beregningen skal vises. Klikk på "Sett inn funksjon"-knappen, som er plassert til venstre for formellinjen.
I listen, som presenteres i funksjonsveiviser-vinduet, se etter og velg CORREL-funksjonen. Klikk på "OK"-knappen.
Funksjonsargumentvinduet åpnes. I feltet "Array1" skriver du inn koordinatene til celleområdet til en av verdiene, hvis avhengighet skal bestemmes. I vårt tilfelle vil disse være verdiene i kolonnen "Salgsbeløp". For å skrive inn adressen til matrisen i feltet, velg ganske enkelt alle cellene med data i kolonnen ovenfor.
I feltet "Array2" må du angi koordinatene til den andre kolonnen. Vi har annonseringskostnader. På samme måte som i forrige tilfelle legger vi inn dataene i feltet.

Klikk på "OK"-knappen.

Som du kan se, vises korrelasjonskoeffisienten i form av et tall i cellen vi tidligere har valgt. PÅ denne saken det er lik 0,97, som er veldig høyt tegn avhengighet av en mengde av en annen.

Metode 2: Beregn korrelasjonen ved hjelp av analysepakken

I tillegg kan korrelasjon beregnes ved hjelp av et av verktøyene i analysepakken. Men først må vi aktivere dette verktøyet.

Gå til "Fil"-fanen.
Gå til "Innstillinger"-delen i vinduet som åpnes.
Deretter går du til elementet "Tillegg".
Nederst i neste vindu, i «Administrasjon»-delen, flytt bryteren til «Excel-tillegg»-posisjonen, hvis den er i en annen posisjon. Klikk på "OK"-knappen.
I tilleggsvinduet merker du av i boksen ved siden av elementet "Analysepakke". Klikk på "OK"-knappen.
Etter det aktiveres analysepakken. Gå til "Data"-fanen. Som du kan se, her vises en ny blokk med verktøy på båndet - "Analyse". Klikk på "Dataanalyse"-knappen, som er plassert i den.
Listen åpnes med ulike alternativer dataanalyse. Velg "Korrelasjon". Klikk på "OK"-knappen.
Et vindu med korrelasjonsanalyseparametere åpnes. I motsetning til den forrige metoden, i "Input interval"-feltet, legger vi inn intervallet ikke for hver kolonne separat, men for alle kolonner som deltar i analysen. I vårt tilfelle er dette dataene i kolonnene "Annonseforbruk" og "Salg".
Vi lar parameteren "Gruppering" være uendret - "etter kolonner", siden datagruppene våre er delt inn i to kolonner. Hvis de ble brutt linje for linje, bør bryteren flyttes til posisjonen "By lines".

Som standard er utdataalternativene satt til "Nytt regneark", det vil si at dataene vises på et annet ark. Du kan endre plasseringen ved å flytte bryteren. Dette kan være gjeldende ark (da må du spesifisere koordinatene til informasjonsutdatacellene) eller en ny arbeidsbok (fil).

Når alle innstillinger er angitt, klikker du på "OK"-knappen.

Siden utdataplasseringen for analyseresultatene ble forlatt som standard, går vi til nytt løv. Som du kan se, her er korrelasjonskoeffisienten. Naturligvis er det det samme som når du bruker den første metoden - 0,97. Dette er fordi begge alternativene utfører de samme beregningene, de kan bare gjøres på forskjellige måter.

Som du kan se, tilbyr Excel-applikasjonen to metoder for korrelasjonsanalyse samtidig. Resultatet av beregningene, hvis du gjør alt riktig, vil være helt identisk. Men hver bruker kan velge et mer praktisk beregningsalternativ for ham.

Vi er glade for at vi kunne hjelpe deg med å løse problemet.

Still spørsmålet ditt i kommentarene, og beskriv i detalj essensen av problemet. Ekspertene våre vil prøve å svare så raskt som mulig.

Har denne artikkelen hjulpet deg?

Regresjons- og korrelasjonsanalyse - statistiske metoder undersøkelser. Dette er de vanligste måtene å vise avhengigheten til en parameter på en eller flere uavhengige variabler.

Nedenfor på spesifikke praktiske eksempler La oss vurdere disse to svært populære analysene blant økonomer. Vi vil også gi et eksempel på å oppnå resultater når de kombineres.

Regresjonsanalyse i Excel

Viser påvirkningen av noen verdier (uavhengig, uavhengig) på den avhengige variabelen. For eksempel hvordan antallet økonomisk aktive befolkning avhenger av antall bedrifter, lønn og andre parametere. Eller: hvordan påvirker utenlandske investeringer, energipriser osv. nivået på BNP.

Resultatet av analysen lar deg prioritere. Og basert på hovedfaktorene, for å forutsi, planlegge utviklingen prioriterte områderå ta ledelsesmessige beslutninger.

Regresjon skjer:

lineær (y = a + bx);
parabolsk (y = a + bx + cx2);
eksponentiell (y = a * exp(bx));
potens (y = a*x^b);
hyperbolsk (y = b/x + a);
logaritmisk (y = b * 1n(x) + a);
eksponentiell (y = a * b^x).

Tenk på eksempelet på konstruksjonen regresjonsmodell i Excel og tolke resultatene. La oss ta lineær type regresjon.

En oppgave. Ved 6 bedrifter er gjennomsnittlig månedlig lønn og antall pensjonerte ansatte. Det er nødvendig å bestemme avhengigheten av antall pensjonerte ansatte på gjennomsnittslønnen.

Den lineære regresjonsmodellen har følgende form:

Y \u003d a0 + a1x1 + ... + akhk.

Der a er regresjonskoeffisientene, x er de påvirkende variablene, og k er antall faktorer.

I vårt eksempel er Y indikatoren for sluttarbeidere. Påvirkningsfaktoren er lønn (x).

Excel har innebygde funksjoner som kan brukes til å beregne parametrene til en lineær regresjonsmodell. Men Analysis ToolPak-tillegget vil gjøre det raskere.

Aktiver et kraftig analyseverktøy:

Klikk på "Office"-knappen og gå til fanen "Excel-alternativer". "Tillegg".
Nederst, under rullegardinlisten, i "Administrer"-feltet, vil det være en inskripsjon "Excel-tillegg" (hvis den ikke er der, klikk på avkrysningsboksen til høyre og velg). Og en Go-knapp. Klikk.
En liste over tilgjengelige tillegg åpnes. Velg "Analysepakke" og klikk OK.

Når det er aktivert, vil tillegget være tilgjengelig under fanen Data.

Nå skal vi behandle regresjonsanalysen direkte.

Åpne verktøymenyen for dataanalyse. Velg "Regresjon".
En meny åpnes for å velge inngangsverdier og utdataalternativer (hvor resultatet skal vises). I feltene for de første dataene angir vi rekkevidden til den beskrevne parameteren (Y) og faktoren som påvirker den (X). Resten kan eller ikke kan fullføres.
Etter å ha klikket OK, vil programmet vise beregningene på et nytt ark (du kan velge intervallet som skal vises på gjeldende ark eller tilordne utdataene til en ny arbeidsbok).

Først av alt tar vi hensyn til R-kvadraten og koeffisientene.

R-kvadrat er bestemmelseskoeffisienten. I vårt eksempel er det 0,755, eller 75,5 %. Dette betyr at de beregnede parameterne til modellen forklarer sammenhengen mellom de studerte parameterne med 75,5 %. Jo høyere bestemmelseskoeffisient, jo bedre modell. Bra - over 0,8. Dårlig - mindre enn 0,5 (en slik analyse kan neppe anses som rimelig). I vårt eksempel - "ikke dårlig".

Koeffisienten 64.1428 viser hva Y vil være dersom alle variablene i modellen som vurderes er lik 0. Det vil si at andre faktorer som ikke er beskrevet i modellen også påvirker verdien av den analyserte parameteren.

Koeffisienten -0,16285 viser vekten av variabelen X på Y. Det vil si at gjennomsnittlig månedslønn innenfor denne modellen påvirker antall sluttere med en vekt på -0,16285 (dette er en liten grad av påvirkning). "-"-tegnet indikerer dårlig innflytelse: hvordan mer lønn jo færre som slutter. Som er rettferdig.

Korrelasjonsanalyse i Excel

Korrelasjonsanalyse bidrar til å fastslå om det er en sammenheng mellom indikatorer i ett eller to utvalg. For eksempel mellom driftstiden til maskinen og kostnadene for reparasjoner, prisen på utstyret og varigheten av driften, høyden og vekten til barn, etc.

Hvis det er en sammenheng, så om en økning i en parameter fører til en økning (positiv korrelasjon) eller en reduksjon (negativ) i den andre. Korrelasjonsanalyse hjelper analytikeren med å avgjøre om verdien av en indikator kan forutsi mulig verdi av en annen.

Korrelasjonskoeffisienten er betegnet r. Varierer fra +1 til -1. Klassifiseringen av korrelasjoner for ulike områder vil være forskjellig. Med en koeffisientverdi på 0 lineær avhengighet eksisterer ikke mellom prøvene.

La oss se hvordan du bruker Excel-verktøy finne korrelasjonskoeffisienten.

CORREL-funksjonen brukes til å finne de parede koeffisientene.

Oppgave: Finn ut om det er en sammenheng mellom driftstiden til en dreiebenk og kostnadene for vedlikehold.

Plasser markøren i en hvilken som helst celle og trykk på fx-knappen.

I kategorien "Statistisk" velger du CORREL-funksjonen.
Argument "Array 1" - det første verdiområdet - tiden til maskinen: A2: A14.
Argument "Array 2" - det andre verdiområdet - kostnadene for reparasjoner: B2:B14. Klikk OK.

For å bestemme typen tilkobling, må du se absolutt tall koeffisient (hvert aktivitetsfelt har sin egen skala).

For korrelasjonsanalyse av flere parametere (mer enn 2) er det mer praktisk å bruke "Data Analysis" ("Analysis Package"-tillegg). I listen må du velge en korrelasjon og angi en matrise. Alle.

De resulterende koeffisientene vil vises i korrelasjonsmatrisen. Som denne:

Korrelasjons-regresjonsanalyse

I praksis brukes disse to teknikkene ofte sammen.

Vi bygger et korrelasjonsfelt: "Sett inn" - "Diagram" - "Spredningsplott" (lar deg sammenligne par). Verdiområdet er alle de numeriske dataene i tabellen.
Venstreklikk på et hvilket som helst punkt på diagrammet. Så høyre. I menyen som åpnes velger du "Legg til trendlinje".
Tilordne parametere for linjen. Type - "Lineær". Nederst - "Vis ligningen i diagrammet."
Klikk "Lukk".

Nå er regresjonsanalysedataene synlige.

1. Åpne Excel-programmet

2. Lag kolonner med data. I vårt eksempel vil vi vurdere forholdet, eller korrelasjonen, mellom aggressivitet og selvtvil hos førsteklassinger. Eksperimentet involverte 30 barn, dataene er presentert i Excel-tabellen:

1 kolonne - nummer på emnet

2. kolonne - aggressivitet i poeng

3 kolonne - selvtvil i poeng

3. Deretter må du velge en tom celle ved siden av tabellen og klikke på ikonet f(x) i Excel-panelet

4. Menyen med funksjoner åpnes, blant kategoriene du må velge Statistisk, og deretter blant listen over funksjoner alfabetisk finne CORREL og klikk OK

5. Deretter åpnes funksjonsargumentmenyen, som lar oss velge datakolonnene vi trenger. For å velge den første kolonnen Aggressivitet du må klikke på den blå knappen ved siden av linjen Matrise1

6. La oss velge dataene for matrise1 fra en kolonne Aggressivitet og klikk på den blå knappen i dialogboksen

7. Klikk deretter på den blå knappen ved siden av linjen, på samme måte som Array 1 Matrise2

8. La oss velge dataene for array2- kolonne Mangel på selvtillit og trykk igjen på den blå knappen og deretter OK

9.Her beregnes r-Pearson korrelasjonskoeffisienten og skrives inn i den valgte cellen. I vårt tilfelle er den positiv og tilnærmet lik. Dette snakker om moderat positiv koblinger mellom aggressivitet og selvtillit hos førsteklassinger

På denne måten, statistisk slutning eksperimentet vil være: r = 0,225, en moderat positiv sammenheng mellom variablene ble avslørt aggressivitet og mangel på selvtillit.

I noen studier er det imidlertid nødvendig å angi p-nivået av signifikans for korrelasjonskoeffisienten Excel-program, i motsetning til SPSS, gir ikke denne muligheten. Det er greit, det er tabeller over kritiske verdier av korrelasjoner (A.D. Nasledov).

Du kan også bygge en regresjonslinje i Excel og legge den ved resultatene av studien.

Korrelasjonskoeffisienten gjenspeiler graden av sammenheng mellom to indikatorer. Tar alltid en verdi fra -1 til 1. Hvis koeffisienten er plassert nær 0, så sier de at det ikke er noen sammenheng mellom variablene.

Hvis verdien er nær én (fra 0,9, for eksempel), så er det en sterk direkte sammenheng mellom de observerte objektene. Hvis koeffisienten er nær en annen ekstreme punkt område (-1), så er det en sterk invers sammenheng mellom variablene. Når verdien er et sted mellom 0 til 1 eller 0 til -1, da vi snakker Om svak forbindelse(direkte eller omvendt). Dette forholdet tas vanligvis ikke i betraktning: det anses at det ikke eksisterer.

Beregning av korrelasjonskoeffisienten i Excel

Vurder for eksempel metoder for å beregne korrelasjonskoeffisienten, trekk ved det direkte og inverse forholdet mellom variabler.

Verdier av indikatorer x og y:

Y er den uavhengige variabelen, x er den avhengige variabelen. Det er nødvendig å finne styrken (sterk / svak) og retningen (fremover / bakover) av forholdet mellom dem. Formelen for korrelasjonskoeffisienten ser slik ut:

For å forenkle forståelsen vil vi dele den opp i flere enkle elementer.

Det er en sterk direkte sammenheng mellom variablene.

Den innebygde CORREL-funksjonen unngår kompliserte beregninger. La oss beregne parkorrelasjonskoeffisienten i Excel ved å bruke den. Vi kaller funksjonens mester. Vi finner det vi trenger. Funksjonsargumentene er en matrise med y-verdier og en matrise med x-verdier:

La oss vise verdiene til variablene på diagrammet:

Det er en sterk sammenheng mellom y og x, fordi Linjene går nesten parallelt med hverandre. Sammenhengen er direkte: økende y - økende x, minkende y - minkende x.

Matrise av parvise korrelasjonskoeffisienter i Excel

Korrelasjonsmatrisen er en tabell, i skjæringspunktet mellom rader og kolonner hvor det er korrelasjonskoeffisienter mellom de tilsvarende verdiene. Det er fornuftig å bygge det for flere variabler.

Matrisen av korrelasjonskoeffisienter i Excel bygges ved hjelp av "Correlation"-verktøyet fra "Data Analysis"-pakken.

En sterk direkte sammenheng ble funnet mellom verdiene til y og x1. Mellom x1 og x2 er det en sterk Tilbakemelding. Det er praktisk talt ingen sammenheng med verdiene i x3-kolonnen.

1. Åpne Excel-programmet

1 kolonne - nummer på emnet

2 kolonne - aggressivitet i poeng

3 kolonner - mangel på selvtillit i poeng

3. Deretter må du velge en tom celle ved siden av tabellen og klikke på ikonet f(x) i Excel-panelet

4. Menyen med funksjoner åpnes, blant kategoriene du må velge Statistisk , og deretter blant listen over funksjoner alfabetisk finne CORREL og klikk OK

6. La oss velge dataene for matrise1 fra en kolonne Aggressivitet og klikk på den blå knappen i dialogboksen

7. Klikk deretter på den blå knappen ved siden av linjen, på samme måte som Array 1 Matrise2

8. La oss velge dataene for array2- kolonne Mangel på selvtillit og trykk igjen på den blå knappen og deretter OK

9. Her beregnes r-Pearson korrelasjonskoeffisienten og skrives inn i den valgte cellen I vårt tilfelle er den positiv og tilnærmet lik 0,225 . Dette snakker om moderat positiv koblinger mellom aggressivitet og selvtillit hos førsteklassinger

På denne måten, statistisk slutning eksperimentet vil være: r = 0,225, en moderat positiv sammenheng mellom variablene ble avslørt aggressivitet og mangel på selvtillit.

I noen studier kreves det å angi p-signifikansnivået til korrelasjonskoeffisienten, men Excel, i motsetning til SPSS, gir ikke en slik mulighet. Det er greit, det er (A.D. Nasledov).

Du kan også legge det ved resultatene av studien.

Korrelasjonskoeffisient (eller lineær koeffisient korrelasjon) er betegnet som "r" (i sjeldne tilfeller som "ρ") og karakteriserer den lineære korrelasjonen (det vil si forholdet som er gitt av en verdi og retning) av to eller flere variabler. Verdien av koeffisienten ligger mellom -1 og +1, det vil si at korrelasjonen kan være både positiv og negativ. Hvis korrelasjonskoeffisienten er -1, er det en perfekt negativ korrelasjon; hvis korrelasjonskoeffisienten er +1, er det en perfekt positiv korrelasjon. I andre tilfeller er det en positiv korrelasjon, en negativ korrelasjon eller ingen korrelasjon mellom de to variablene. Korrelasjonskoeffisienten kan beregnes manuelt, med gratis online kalkulatorer, eller med en god grafisk kalkulator.

Trinn

Beregning av korrelasjonskoeffisienten manuelt

Samle data. Før du begynner å beregne korrelasjonskoeffisienten, undersøk det gitte tallparet. Det er bedre å skrive dem ned i en tabell som kan ordnes vertikalt eller horisontalt. Merk hver rad eller kolonne som en "x" og en "y".

For eksempel gitt fire par med verdier (tall) av variablene "x" og "y". Du kan lage følgende tabell:
- x || y
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7

Beregn det aritmetiske gjennomsnittet "x". For å gjøre dette, legg sammen alle verdiene til "x", og del deretter resultatet med antall verdier.
- I vårt eksempel får vi fire verdier for variabelen "x". For å beregne det aritmetiske gjennomsnittet "x", legg til disse verdiene, og del deretter summen med 4. Beregningene vil bli skrevet som følger:
- μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
- μ x = 12/4 (\displaystyle \mu _(x)=12/4)
- μ x = 3 (\displaystyle \mu _(x)=3)
Finn det aritmetiske gjennomsnittet "y". For å gjøre dette, følg de samme trinnene, det vil si legg sammen alle verdiene til "y", og del deretter summen med antall verdier.
- I vårt eksempel får vi fire verdier for variabelen "y". Legg til disse verdiene, og del deretter summen på 4. Beregningene vil bli skrevet som følger:
- μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
- μ y = 16/4 (\displaystyle \mu _(y)=16/4)
- μ y = 4 (\displaystyle \mu _(y)=4)
Beregn standardavviket til "x". Etter å ha beregnet gjennomsnittene av "x" og "y", finn standardavvik disse variablene. Standardavviket beregnes ved å bruke følgende formel:
- σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
- σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
- σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
- σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
- σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
- σ x = 1 , 83 (\displaystyle \sigma _(x)=1,83)
Beregn standardavviket "y". Følg trinnene i forrige trinn. Bruk samme formel, men bytt inn "y"-verdiene i den.
- I vårt eksempel vil beregningene bli skrevet som følger:
- σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
- σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
- σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
- σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
- σ y = 2 , 58 (\displaystyle \sigma _(y)=2,58)
Skriv ned den grunnleggende formelen for beregning av korrelasjonskoeffisienten. Denne formelen inkluderer gjennomsnitt, standardavvik og antall (n) tallpar for begge variablene. Korrelasjonskoeffisienten er betegnet som "r" (i sjeldne tilfeller som "ρ"). Denne artikkelen bruker formelen for å beregne Pearson-korrelasjonskoeffisienten.
- Her og i andre kilder kan mengder angis på ulike måter. For eksempel har noen formler "ρ" og "σ", mens andre har "r" og "s". Noen lærebøker gir andre formler, men det er de matematiske analoger formelen ovenfor.
Du har beregnet gjennomsnitt og standardavvik for begge variablene, så du kan bruke formelen til å beregne korrelasjonskoeffisienten. Husk at "n" er antall verdipar for begge variablene. Verdien av andre mengder er beregnet tidligere.
- I vårt eksempel vil beregningene bli skrevet som følger:
- ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \venstre((\frac (x-\mu _(x))(\sigma _(x)))\høyre)*\venstre((\frac (y-\mu _(y))(\sigma _(y)))\høyre))
- ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1, 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\høyre)*\venstre((\frac (1-4)(2.58))\høyre)+\venstre((\frac (2-3)(1.83))\høyre) *\venstre((\ frac (3-4)(2,58))\høyre))
  + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1, 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1.83))\right)*\left((\frac (5-4)(2.58))\right)+\left((\frac (5-3)(1.83))\ right)*\left( (\frac (7-4)(2,58))\høyre))]
- ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4721))\høyre))
- ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
- ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
- ρ = 0, 988 (\displaystyle \rho =0,988)
Analyser resultatet. I vårt eksempel er korrelasjonskoeffisienten 0,988. Denne verdien karakteriserer på en eller annen måte et gitt sett med tallpar. Vær oppmerksom på tegnet og størrelsen på verdien.
- Siden verdien av korrelasjonskoeffisienten er positiv, er det en positiv korrelasjon mellom variablene "x" og "y". Det vil si at når verdien av "x" øker, øker også verdien av "y".
- Siden verdien av korrelasjonskoeffisienten er veldig nær +1, er verdiene til x- og y-variablene sterkt korrelerte. Hvis du setter prikker på koordinatplan, vil de ligge nær en rett linje.
Bruke online kalkulatorer for å beregne korrelasjonskoeffisienten
1. Finn en kalkulator på Internett for å beregne korrelasjonskoeffisienten. Denne koeffisienten beregnes ofte i statistikk. Hvis det er mange tallpar, er det praktisk talt umulig å beregne korrelasjonskoeffisienten manuelt. Derfor finnes det online kalkulatorer for å beregne korrelasjonskoeffisienten. I søkemotoren skriver du inn "korrelasjonskoeffisientkalkulator" (uten anførselstegn).
2. Skriv inn data. Les instruksjonene på nettstedet for å legge inn dataene riktig (par med tall). Det er ekstremt viktig å legge inn de riktige tallparene; ellers får du feil resultat. Husk at forskjellige nettsteder har forskjellige dataregistreringsformater.
  - For eksempel, på nettstedet http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, er verdiene til variablene "x" og "y" lagt inn i to horisontale linjer. Verdier er atskilt med komma. Det vil si at i vårt eksempel er verdiene til "x" lagt inn slik: 1,2,4,5, og verdiene til "y" er slik: 1,3,5,7.
  - På et annet nettsted, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , legges data inn vertikalt; i dette tilfellet, ikke forveksle de tilsvarende tallparene.
3. Regn ut korrelasjonskoeffisienten. Etter å ha lagt inn dataene, klikker du ganske enkelt på knappen "Beregn", "Beregn" eller lignende for å få resultatet.
  
  Bruke en grafisk kalkulator
  1. Skriv inn data. Ta tak i en grafisk kalkulator, bytt til statistisk beregningsmodus og velg Rediger-kommandoen.
    - På forskjellige kalkulatorer må du trykke på forskjellige taster. Denne artikkelen fokuserer på Texas Instruments TI-86-kalkulatoren.
    - For å bytte til statistisk beregningsmodus, trykk - Stat (over "+"-tasten). Trykk deretter F2 - Rediger (Rediger).
  2. Slett tidligere lagrede data. De fleste kalkulatorer beholder den angitte statistikken til du sletter dem. For å unngå å forveksle gamle data med nye data, slett all lagret informasjon først.
    - Bruk piltastene til å flytte markøren og marker "xStat"-overskriften. Trykk deretter Clear og Enter for å slette alle verdier som er angitt i xStat-kolonnen.
    - Bruk piltastene for å markere "yStat"-overskriften. Trykk deretter Clear og Enter for å slette alle verdier som er angitt i yStat-kolonnen.
  3. Angi innledende data. Bruk piltastene til å flytte markøren til den første cellen under "xStat"-overskriften. Skriv inn den første verdien og trykk Enter. Nederst på skjermen vil "xStat (1) = __" vises, med den angitte verdien i stedet for et mellomrom. Etter at du har trykket på Enter, vil den angitte verdien vises i tabellen, og markøren vil flytte til neste linje; dette vil vise "xStat(2) = __" nederst på skjermen.
    - Skriv inn alle verdiene til variabelen "x".
    - Når du har lagt inn alle verdiene for x-variabelen, bruk piltastene for å navigere til yStat-kolonnen og angi verdiene for y-variabelen.
    - Etter å ha angitt alle tallpar, trykk Avslutt for å tømme skjermen og gå ut av aggregeringsmodus.
  4. Regn ut korrelasjonskoeffisienten. Det karakteriserer hvor nær dataene er en rett linje. Grafkalkulatoren kan raskt bestemme den rette rette linjen og beregne korrelasjonskoeffisienten.
    - Klikk Stat (Statistics) - Calc (Calculations). På TI-86, trykk - - .
    - Velg funksjonen "Lineær regresjon" ( Lineær regresjon). På TI-86 trykker du på , som er merket "LinR". Linjen "LinR _" vil vises på skjermen med en blinkende markør.
    - Skriv inn navnene på to variabler: xStat og yStat.
      - På TI-86 åpner du listen over navn; for å gjøre dette trykk – – .
      - De tilgjengelige variablene vises på den nederste linjen på skjermen. Velg (mest sannsynlig ved å trykke F1 eller F2), skriv inn et komma, og velg deretter .
      - Trykk Enter for å behandle de angitte dataene.
  5. Analyser resultatene. Ved å trykke Enter vil følgende informasjon vises på skjermen:
    - y = a + b x (\displaystyle y=a+bx): er en funksjon som beskriver en rett linje. Merk at funksjonen ikke er skrevet på standardform (y = kx + b).
    - a = (\displaystyle a=). Dette er y-koordinaten til punktet der linjen skjærer y-aksen.
    - b = (\displaystyle b=). den skråningen rett.
    - corr = (\displaystyle (\text(corr))=). Dette er korrelasjonskoeffisienten.
    - n = (\displaystyle n=). Dette er antallet tallpar som ble brukt i beregningen.

Hvor x y , x , y er gjennomsnittsverdiene til prøvene; σ(x), σ(y) - standardavvik.
I tillegg kan koeffisienten for lineær parkorrelasjon bestemmes gjennom regresjonskoeffisienten b: a+bx .

Andre formelalternativer:
eller

K xy - korrelasjonsmoment (kovarianskoeffisient)

Den lineære korrelasjonskoeffisienten tar verdier fra -1 til +1 (se Chaddock-skalaen). For eksempel, når man analyserte tettheten til en lineær korrelasjon mellom to variabler, ble en lineær korrelasjonskoeffisient lik –1 oppnådd. Dette betyr at det er en eksakt invers lineær sammenheng mellom variablene.

Den geometriske betydningen av korrelasjonskoeffisienten: r xy viser hvor mye helningen til de to regresjonslinjene: y(x) og x(y) er forskjellig, hvor mye resultatene av å minimere avvikene i x og i y er forskjellige. Jo større vinkelen mellom linjene, jo større r xy .
Korrelasjonskoeffisientens fortegn faller sammen med regresjonskoeffisientens fortegnet og bestemmer helningen til regresjonslinjen, dvs. generell orientering avhengigheter (øke eller redusere). Den absolutte verdien av korrelasjonskoeffisienten bestemmes av graden av nærhet av punktene til regresjonslinjen.

Egenskaper til korrelasjonskoeffisienten

|r xy | ≤ 1;
hvis X og Y er uavhengige, så er r xy =0, det motsatte er ikke alltid sant;
hvis |r xy |=1, så Y=aX+b, |rxy (X,aX+b)|=1, hvor a og b er konstante og ≠ 0;
|r xy (X,Y)|=|r xy (a 1 X+b 1 , a 2 X+b 2)|, hvor a 1 , a 2 , b 1 , b 2 er konstanter.

Instruksjon. Angi mengden kildedata. Den resulterende løsningen lagres i en Word-fil (se Eksempel på å finne en regresjonsligning). En løsningsmal genereres også automatisk i Excel. .