Biografije Karakteristike Analiza

Parametar a u uparenoj jednačini linearne regresije. Intervali povjerenja za zavisnu varijablu

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Dobar posao na stranicu">

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http:// www. sve najbolje. en/

Ministarstvo obrazovanja i nauke Ruske Federacije

budžet savezne države obrazovne ustanove više obrazovanje

"Državni tehnički univerzitet Komsomolsk na Amuru"

Fakultet za ekonomiju i menadžment

Departman za ekonomiju, finansije i računovodstvo

RAČUNSKI I GRAFIČKI ZADATAK

u disciplini "Ekonometrija"

grupni student

A.Yu. Zaichenko

Učitelju

I.I. Antonova

Tabela 1

Broj regije

Prosječni egzistencijalni minimum po glavi stanovnika dnevno za jednu radno sposobnu osobu, rub.,

Prosječna dnevna plata, rub.,

Obavezno:

1. Izgradite linearnu parnu regresijsku jednačinu.

3. Procijenite statističku značajnost parametara regresije i korelacije koristeći Fisherov t-test i Studentov t-test.

4. Pokrenite predviđanje plate sa predviđenom vrijednošću prosječnog egzistencijalnog minimuma po stanovniku, koji iznosi 107% prosječnog nivoa.

5. Procijenite tačnost prognoze tako što ćete izračunati grešku prognoze i njen interval pouzdanosti.

6. Nacrtajte početne podatke i teorijsku liniju na jednom grafikonu.

1. Za izračunavanje parametara jednačine linearna regresija izgraditi proračunsku tablicu 2. regresija aproksimacije linearne korelacije

tabela 2

Zlo

Dobivena regresijska jednadžba:

Uz povećanje životnog minimuma po glavi stanovnika za 1 rub. prosječna dnevna plata raste u prosjeku za 0,89 rubalja.

2. Zategnutost linearne veze će se procijeniti koeficijentom korelacije:

To znači da se 51% varijacije u plaćama () objašnjava varijacijom faktora – prosječnog egzistencijalnog minimuma po glavi stanovnika.

Kvalitet modela je određen prosječnom greškom aproksimacije:

Kvalitet izrađenog modela ocjenjuje se dobrim, jer ne prelazi 8-10%.

3. Procijenićemo značaj regresione jednadžbe u cjelini koristeći Fisherov -kriterijum. Stvarna vrijednost - kriteriji:

Tabelarna vrijednost kriterija na nivou značajnosti od pet posto i stupnjevima slobode i je. Budući da se jednačina regresije smatra statistički značajnom.

Procijenićemo statističku značajnost parametara regresije korištenjem Studentove t-statistike i izračunavanjem intervala povjerenja za svaki od indikatora.

Tabelarna vrijednost kriterija za broj stupnjeva slobode i bit će.

Hajde da definišemo slučajne greške:

Stvarne vrijednosti -statistice premašuju vrijednost tabele:

dakle, parametri i nisu nasumično različiti od nule, već su statistički značajni. Izračunajmo intervale povjerenja za parametre regresije i. Za ovo definišemo marginalna greška za svaki indikator:

Intervali pouzdanosti:

Analiza gornje i donje granice intervala pouzdanosti dovodi do zaključka da, sa vjerovatnoćom, parametri i, budući da su unutar navedenih granica, ne prihvataju nulte vrijednosti, tj. nisu statistički značajne i značajno se razlikuju od nule.

4. Dobijene procjene jednačine regresije nam omogućavaju da je koristimo za predviđanje. Ako je prognozirana vrijednost egzistencijalnog minimuma:

Tada će predviđena vrijednost plata biti:

Greška prognoze će biti:

Granična greška prognoze, koja u slučajevima neće biti prekoračena, bit će:

Interval pouzdanosti prognoze:

Ispunjena prognoza prosječne mjesečne plaće je pouzdana () i kreće se u rasponu od 131,66 rubalja. do 190,62 rubalja. U zaključku ćemo iscrtati početne podatke i teoretsku pravu liniju na isti grafikon (slika 1)

Slika 1

Hostirano na Allbest.ru

Slični dokumenti

    Zgrada linearna jednačina parna regresija, proračun linearni koeficijent korelacija parova i prosečna greška aproksimacije. Određivanje koeficijenata korelacije i elastičnosti, indeks korelacije, suština primjene Fisherovog kriterija u ekonometriji.

    test, dodano 05.05.2010

    Proračun parametara uparene linearne regresije. Procjena statističke značajnosti jednačine regresije i njenih parametara korištenjem Fisher-ovog i Studentovog testa. Izgradnja matrice parnih koeficijenata korelacije. Statistička analiza koristeći PPP MS EXCEL.

    test, dodano 14.05.2008

    Proračun linearnog koeficijenta para i parcijalne korelacije. Statistički značaj parametara regresije i korelacije. Analiza polja podataka o korelaciji. Preciznost prognoze, izračunavanje greške i interval pouzdanosti. Višestruki koeficijent determinacije.

    kontrolni rad, dodano 11.12.2010

    Ekonomska interpretacija koeficijenta regresije. Pronalaženje rezidualnog zbroja kvadrata i procjena varijanse reziduala. Provjera značajnosti parametara regresione jednačine pomoću Studentovog t-testa. Proračun prosječne relativne greške aproksimacije.

    test, dodano 23.03.2010

    Izgradnja intervala povjerenja za koeficijent regresije. Određivanje greške aproksimacije, indeksa korelacije i Fišerov F-test. Procjena elastičnosti promjena u potrošnji materijala proizvoda. Konstrukcija linearne jednadžbe višestruka regresija.

    test, dodano 04.11.2015

    Proračun parametara jednačine linearne regresije, procjena čvrstoće veze pomoću indikatora korelacije i determinacije. Određivanje prosječne greške aproksimacije. Statistička pouzdanost modeliranja korištenjem Fisherovog F-testa i Studentovog t-testa.

    test, dodano 17.10.2009

    Određivanje kvantitativne zavisnosti mase krznene životinje o njenoj starosti. Izrada uparene regresione jednadžbe, proračun njenih parametara i provjera adekvatnosti. Procjena statističke značajnosti regresijskih parametara, izračunavanje njihovog intervala povjerenja.

    laboratorijski rad, dodano 02.06.2014

    Izgradnja hipoteze o obliku veze između gotovinskog dohotka po glavi stanovnika i potrošačke potrošnje u uralskom i zapadnosibirskom regionu Ruske Federacije. Proračun parametara parnih regresionih jednačina, procjena njihovog kvaliteta korištenjem prosječne greške aproksimacije.

    test, dodano 05.11.2014

    Metodska analiza najmanjih kvadrata za parnu regresiju kao metodu za procjenu parametara linearne regresije. Razmatranje linearne jednadžbe regresije para. Studija višestruke linearne regresije. Proučavanje grešaka regresijskih koeficijenata.

    test, dodato 28.03.2018

    Konstrukcija korelacionog polja. Proračun parametara uparenih regresionih jednačina. Ovisnost prosječnog životnog vijeka od nekih faktora. Studija "Fišerovog kriterijuma". Procjena nepropusnosti veze pomoću indikatora korelacije i determinacije.

100 r bonus prve narudžbe

Odaberite vrstu posla Diplomski rad Rad na kursu Sažetak Magistarski rad Izvještaj o praksi Članak Pregled izvještaja Test Monografija Rješavanje problema Poslovni plan Odgovori na pitanja kreativni rad Esej Crtanje Kompozicije Prevod Prezentacije Tipkanje Ostalo Povećanje jedinstvenosti teksta Kandidatska teza Laboratorijski rad Pomoć na mreži

Pitajte za cijenu

Regresija para je jednačina odnosa dvije varijable

y i x Vrste y= f(x),

gdje je y - zavisna varijabla (rezultantni znak);

x je nezavisna varijabla koja objašnjava (znak-faktor).

Postoje linearne i nelinearne regresije.

Metoda najmanjih kvadrata

Za procjenu parametara regresije koji su linearni u ovim parametrima, koristi se metoda najmanjih kvadrata (LSM). . LSM omogućava da se dobiju takve procjene parametara pod kojima je zbir kvadrata odstupanja stvarnih vrijednosti efektivne karakteristike y od teoretskih vrijednosti ŷ x sa istim vrijednostima faktora x minimalno, tj.

5. Procjena statističke značajnosti korelacijskih indikatora, parametara uparene linearne regresione jednačine, regresione jednačine u cjelini.

6. Procjena stepena bliskosti odnosa između kvantitativnih varijabli. Koeficijent kovarijacije. Mere korelacije: linearni koeficijent korelacije, indeks korelacije (= teorijski korelacioni odnos).

koeficijent kovarijanse

Mch (y) - tj. dobijamo korelaciono zavisnost.

Prisustvo korelacione zavisnosti ne može odgovoriti na pitanje o uzroku veze. Korelacija uspostavlja samo meru ove veze, tj. mjera konzistentne varijacije.

Mjera odnosa između mu 2 varijabli može se naći pomoću kovarijanse.

, ,

Vrijednost eksponenta kovarijanse ovisi o jedinicama u γ varijabli koja se mjeri. Stoga se za procjenu stepena konzistentne varijacije koristi koeficijent korelacije - bezdimenzionalna karakteristika koja ima određene granice varijacije.

7. Koeficijent determinacije. Standardna greška regresione jednačine.

Koeficijent determinacije (rxy2) - karakterizira udio varijanse rezultirajuće karakteristike y, objašnjene varijansom, u totalna varijansa efektivan znak. Što je rxy2 bliži 1, to je bolji regresijski model, odnosno originalni model dobro aproksimira originalne podatke.

8. Procjena statističke značajnosti indikatora korekcije, parametara uparene linearne regresione jednačine, regresione jednačine u cjelini: t- studentski kriterijum, F- Fišerov kriterijum.

9. Modeli nelinearne regresije i njihova linearizacija.

Nelinearne regresije su podijeljene u dvije klase : regresije koje su nelinearne u odnosu na eksplanatorne varijable isključene iz analize, ali linearne u odnosu na procijenjene parametre, i regresije koje su nelinearne u odnosu na procijenjene parametre.

primjeri regresije, nelinearne u eksplanatornim varijablama, ali linearno u procijenjenim parametrima:


Nelinearni regresijski modeli i njihova linearizacija

Uz nelinearnu ovisnost karakteristika, svedeno na linearni oblik, parametri višestruke regresije su također određeni najmanjim kvadratima s jedinom razlikom što se ne koristi za pozadinske informacije, već na transformirane podatke. Dakle, s obzirom na funkciju snage

,

pretvaramo ga u linearni oblik:

gdje su varijable izražene u logaritmima.

Dalja obrada najmanjih kvadrata je ista: izgrađen je sistem normalne jednačine a određuju se nepoznati parametri. Potenciranjem vrijednosti nalazimo parametar a i, shodno tome, opšti oblik jednačine funkcije stepena.

Općenito govoreći, nelinearna regresija na uključenim varijablama ne kriju nikakve poteškoće u procjeni njegovih parametara. Ova procjena je određena, kao u linearnoj regresiji, najmanjim kvadratima. Dakle, u dvofaktorskoj jednačini nelinearne regresije

linearizacija se može izvesti uvođenjem novih varijabli u nju . Rezultat je jednačina linearne regresije sa četiri faktora

10.Multikolinearnost. Metode za eliminaciju multikolinearnosti.

Najveće poteškoće u korištenju aparata višestruke regresije nastaju u prisustvu multikolinearnosti faktora, kada su povezana više od dva faktora linearna zavisnost . Prisustvo multikolinearnosti faktora može značiti da će neki faktori uvijek djelovati unisono. Kao rezultat toga, varijacija u izvornim podacima više nije potpuno nezavisna i nemoguće je procijeniti utjecaj svakog faktora posebno.

Što je jača multikolinearnost faktora, manje je pouzdana procjena distribucije sume objašnjene varijacije po pojedinačnim faktorima korištenjem metode najmanjih kvadrata (LSM).

Uključivanje multikolinearnih faktora u model je nepoželjno iz sljedećih razloga:

ü teško interpretirati parametre višestruke regresije; parametri linearne regresije gube ekonomskom smislu;

ü procjene parametara su nepouzdane, pokazuju velike standardne greške i mijenjaju se s obimom opservacija, što model čini neprikladnim za analizu i predviđanje

Metode za eliminaciju multikolinearnosti

- isključivanje varijable(e) iz modela;

Međutim, potreban je određeni oprez prilikom primjene ovu metodu. U ovoj situaciji moguće su greške u specifikacijama.

- dobijanje dodatnih podataka ili konstruisanje novog uzorka;

Ponekad, da bi se smanjila multikolinearnost, dovoljno je povećati veličinu uzorka. Na primjer, ako koristite godišnje podatke, možete promijeniti na kvartalne podatke. Povećanje količine podataka smanjuje varijanse koeficijenata regresije i time povećava njihov statistički značaj. Međutim, dobivanje novog uzorka ili proširenje starog nije uvijek moguće ili uključuje značajne troškove. Štaviše, ovaj pristup se može povećati

autokorelacija.

- promjena specifikacije modela;

U nekim slučajevima, problem multikolinearnosti se može riješiti promjenom specifikacije modela: ili se mijenja oblik modela, ili se dodaju nove objašnjavajuće varijable koje se ne uzimaju u obzir u modelu.

- korištenje preliminarnih informacija o nekim parametrima;

11.Classic linearni model višestruki regr-ii (KLMMR). Određivanje parametara ur-I višestruke regresije metodom kvadrata.

Servisni zadatak. Uz pomoć servisa online modu može se naći:
  • parametri jednačine linearne regresije y=a+bx , koeficijent linearne korelacije sa testom njegove značajnosti;
  • bliskost veze korišćenjem indikatora korelacije i determinacije, procena najmanjih kvadrata, statička pouzdanost regresionog modeliranja korišćenjem Fišerovog F-testa i Studentovog t-testa, interval poverenja prognoze za nivo značajnosti α

Jednačina parne regresije se odnosi na regresiona jednadžba prvog reda. Ako ekonometrijski model sadrži samo jednu eksplanatornu varijablu, tada se naziva regresija u paru. Regresiona jednadžba drugog reda i regresiona jednačina trećeg reda odnose se na jednačine nelinearne regresije.

Primjer. Odaberite zavisnu (objašnjenu) i objašnjavajuću varijablu da biste izgradili upareni regresijski model. Daj. Odredite teorijska jednačina regresija para. Procijeniti adekvatnost izgrađenog modela (interpretirati R-kvadrat, t-statistiku, F-statistiku).
Rješenjeće se zasnivati ​​na proces ekonometrijskog modeliranja.
Faza 1 (etapiranje) – određivanje konačnih ciljeva modeliranja, skupa faktora i indikatora koji učestvuju u modelu i njihove uloge.
Specifikacija modela - definicija svrhe studije i izbor ekonomskih varijabli modela.
Situacijski (praktični) zadatak. Za 10 preduzeća u regionu, zavisnost proizvodnje po radniku y (hiljadu rubalja) od specifična gravitacija radnici visoko kvalifikovan in ukupna snaga radnika x (u %).
Faza 2 (a priori) - analiza pre modela ekonomska suština fenomena koji se proučava, formiranje i formalizacija apriornih informacija i početnih pretpostavki, posebno vezanih za prirodu i genezu početnih statističkih podataka i slučajnih rezidualnih komponenti u obliku niza hipoteza.
Već u ovoj fazi može se govoriti o jasnoj zavisnosti nivoa veštine radnika i njegovog učinka, jer što je radnik iskusniji, to je veća njegova produktivnost. Ali kako procijeniti ovu ovisnost?
Pair Regression je regresija između dvije varijable - y i x, tj. model oblika:

Gdje je y zavisna varijabla (rezultantni znak); x je nezavisna, ili objašnjavajuća, varijabla (znak-faktor). Znak "^" znači da ne postoji stroga funkcionalna zavisnost između varijabli x i y, dakle, u skoro svakom poseban slučaj vrijednost y sastoji se od dva člana:

gdje je y stvarna vrijednost efektivne karakteristike; y x je teorijska vrijednost efektivne karakteristike, koja se nalazi na osnovu jednačine regresije; ε je slučajna varijabla koja karakterizira odstupanja stvarne vrijednosti efektivne karakteristike od teorijske vrijednosti pronađene regresionom jednadžbom.
Grafički ćemo prikazati zavisnost regresije između učinka po radniku i udjela visokokvalificiranih radnika.


3. faza (parametrizacija) - stvarno modeliranje, tj. izbor opšti pogled model, uključujući sastav i oblik odnosa između varijabli uključenih u njega. Izbor tipa funkcionalne zavisnosti u regresijskoj jednačini naziva se parametrizacija modela. Izaberi jednadžba regresije para, tj. samo jedan faktor će uticati na konačni rezultat y.
4. faza (informativna) - prikupljanje potrebnog statističke informacije, tj. registracija vrijednosti faktora i indikatora koji učestvuju u modelu. Uzorak se sastoji od 10 industrijskih preduzeća.
Faza 5 (identifikacija modela) – procjena nepoznatih parametara modela korištenjem dostupnih statističkih podataka.
Za određivanje parametara modela koristimo se LSM - metoda najmanjih kvadrata. Sistem normalnih jednačina će izgledati ovako:
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Da bismo izračunali parametre regresije, napravićemo proračunsku tabelu (Tabela 1).
xyx2y2x y
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

Uzimamo podatke iz tabele 1 (zadnji red), kao rezultat imamo:
10a + 171b = 77
171 a + 3045 b = 1356
Ovaj SLAE se rješava Cramer metodom ili metodom inverzne matrice.
Dobijamo koeficijente empirijske regresije: b = 0,3251, a = 2,1414
Empirijska regresijska jednadžba ima oblik:
y = 0,3251 x + 2,1414
Faza 6 (verifikacija modela) - poređenje stvarnih i modelskih podataka, provjera adekvatnosti modela, procjena tačnosti podataka modela.
Analiza se vrši korišćenjem

1. Osnovne definicije i formule

Pair Regression- regresija (odnos) između dvije varijable, itd. pogledajte model:

gdje je zavisna varijabla (rezultantni znak);

- nezavisna eksplanatorna varijabla (znak-faktor);

Perturbacija ili stohastička varijabla, uključujući uticaj faktora koji nisu uzeti u obzir u modelu.

U gotovo svakom pojedinačnom slučaju vrijednost se sastoji od dva pojma:

gdje je stvarna vrijednost efektivne karakteristike;

Teorijska vrijednost rezultirajuće karakteristike, pronađena na osnovu jednadžbe regresije. Znak "^" znači da ne postoji strogi funkcionalni odnos između varijabli i.

Razlikovati linearno i nelinearne regresija.

Linearna regresija je opisana jednačinom prave linije

Nelinearne regresije dijele se u dvije klase:

1) regresija, nelinearne u objašnjavajućim varijablama, ali linearne u procijenjenim parametrima, na primjer:

Polinomi različitih stupnjeva

Jednakostranična hiperbola

2) regresije, nelinearne u procijenjenim parametrima, na primjer:

Snaga

Demonstracija

Eksponencijalno

Da bi se izgradila uparena linearna regresija, izračunavaju se pomoćne veličine ( - broj opservacija).

Uzorak znači: i

Kovarijansa uzorka između i

ili

kovarijansa- ovo je numerička karakteristika zajednička distribucija dvoje slučajne varijable.

Uzorak varijance za

ili

Uzorak varijance za

ili

Varijanca uzorka karakterizira stupanj širenja vrijednosti slučajne varijable oko srednje vrijednosti (varijabilnost, varijabilnost).

Bliskost veze između proučavanih fenomena ocjenjuje se po koeficijent korelacije uzorka između i

Koeficijent korelacije varira od -1 do +1. Što je modul bliži 1, to je bliže statistička zavisnost između i do linearne funkcionalne.

Ako je =0, onda linearna veza između i nedostaje;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

Pozitivna vrijednost koeficijenta ukazuje da je odnos između karakteristika direktan (vrijednost raste s rastom), negativna vrijednost ukazuje na inverznu vezu (vrijednost opada s rastom).

Izgradnja linearne regresije svodi se na procjenu njegovih parametara i Klasični pristup procjeni parametara linearne regresije zasniva se na najmanjih kvadrata(MNK). LSM omogućava da se dobiju takve procjene parametara za koje je zbir kvadrata odstupanja stvarnih vrijednosti rezultirajuće karakteristike od teorijskih minimalan, tj.

Za linearnu regresiju, parametri i se nalaze iz sistema normalnih jednačina:

Rješavanje sistema, nalazimo in na

i parametar

Koeficijent sa faktorskom varijablom pokazuje koliko će se vrijednost u prosjeku promijeniti kada se faktor promijeni po jedinici mjere.

Parametar kada If ne može biti jednak 0, onda nema ekonomskog smisla. Moguće je tumačiti samo predznak ako ako je onda relativna promjena rezultata sporija od promjene faktora, tj. varijansa rezultata je manja od varijanse faktora i obrnuto.

Za procjenu kvaliteta izgrađenog regresijskog modela možete koristiti koeficijent odlučnosti ili prosječna greška aproksimacije.

Tokoeficijent determinacije

Or

prikazuje udio varijanse objašnjene regresijom u ukupnoj varijansi rezultirajućeg atributa.Shodno tome, vrijednost karakteriše udio varijanse indikatora uzrokovanog utjecajem faktora koji nisu uzeti u obzir u modelu i drugih razloga.

Što je bliže 1, to je bolji regresijski model, tj. konstruisani model dobro aproksimira početne podatke.

Prosječna greška aproksimacije je prosječno relativno odstupanje teoretskih vrijednosti od stvarnih, tj.

Konstruisana regresiona jednačina se smatra zadovoljavajućom ako vrednost ne prelazi 10-12%.

Za linearnu regresiju prosječni koeficijent elastičnosti nalazi se prema formuli:

Prosječni koeficijent elastičnosti pokazuje za koliko će se procenata prosečno u populaciji rezultat promeniti u odnosu na svoju vrednost kada se faktor promeni za 1% od svoje vrednosti.

Grade hnachimostiregresijske jednačine se općenito daje korištenjem Fisher-testa, koji se sastoji u testiranju hipoteze o statističkoj beznačajnosti jednadžbe regresije . Za to se pravi poređenje stvarnienebo i kritičan(tabela) vrijednosti - Fišerov kriterijum .

određuje se iz omjera vrijednosti faktora i rezidualnih varijansi izračunatih za jedan stepen slobode, tj.

- maksimalna moguća vrijednost kriterijuma pod uticajem slučajnih faktora sa stepenom slobode =1, =-2 i nivoom značajnosti nalazi se iz tabele Fisher kriterijuma (tabela 1 u prilogu).

Nivo značaja- je vjerovatnoća odbacivanja tačne hipoteze, s obzirom da je tačna.

Ako a tada se odbacuje hipoteza o nepostojanju veze između proučavanog indikatora i faktora i zaključuje se o značajnosti ove veze sa nivoom značajnosti (tj. jednačina regresije je značajna).

Ako a tada se hipoteza prihvata i priznaje se statistička beznačajnost i nepouzdanost jednačine regresije.

Za linearnu regresiju značajkoeficijenti regresije evaluiran sa - Studentov kriterijum, prema kojem se postavlja hipoteza o slučajnoj prirodi indikatora, tj. o njihovoj neznatnoj razlici od nule. Zatim se izračunavaju stvarne vrijednosti kriterija za svaki od procijenjenih koeficijenata regresije, tj.

gdje i - standardne greške parametri linearne regresije određeni su formulama:

- maksimalna moguća vrednost Studentovog kriterijuma pod uticajem slučajnih faktora za dati stepen slobode = -2, a nivo značajnosti se nalazi iz tabele Studentovih kriterijuma (tabela 2 u prilogu).

Ako a tada se hipoteza o beznačajnosti koeficijenta regresije odbacuje sa nivoom značajnosti tj. koeficijent ( ili ) se slučajno ne razlikuje od nule i formiran je pod uticajem sistematski delujućeg faktora

Ako a tada se hipoteza ne odbacuje i prepoznaje se slučajna priroda formiranja parametra.

Značaj koeficijenta linearne korelacije također provjereno sa - Studentov kriterijum, tj.

Hipoteza o beznačajnosti koeficijenta korelacije se odbacuje sa nivoom značajnosti ako

Komentar. Za linearnu parnu regresiju, testiranje hipoteze o značaju koeficijenta i koeficijenta korelacije je ekvivalentno testiranju hipoteze o značaju regresione jednadžbe u cjelini, tj.

Da biste izračunali interval pouzdanosti, odredite marginalna greška za svaki indikator, tj.

Intervali pouzdanosti za koeficijente linearne regresije:

Ako nula spada u granice intervala povjerenja, tj. donja granica je negativna, a gornja pozitivna, tada se pretpostavlja da je procijenjeni parametar nula, jer ne može istovremeno poprimiti i pozitivne i negativne vrijednosti.

Predviđena vrijednost se određuje zamjenom odgovarajuće prediktivne vrijednosti u jednadžbu regresije. Zatim se izračunava prosječna standardna greška prognoze

gdje

i gradi se interval pouzdanosti prognoze

Interval može biti prilično širok zbog malog obima opažanja.

regresije, nelinearne u uključenim varijablama , se jednostavnom promjenom varijabli svode na linearni oblik, a daljnja procjena parametara se vrši metodom najmanjih kvadrata.

Ghyperballicna regresija:

R egresije , nelinearne e prema procijenjenim parametrima dijele se na dvije vrste: interno nelinearneitd. (nije svedeno na linearni oblik) i interno linearno(sveden na linearni oblik pomoću odgovarajućih transformacija), na primjer:

Eksponencijalna regresija:

Linearizirajuća transformacija:

Regresija snage:

Linearizirajuća transformacija:

Indeksnaya regresija:

Linearizirajuća transformacija:

logaritamskiregresija:

Linearizirajuća transformacija:

2. Rješenje tipičnih problema

Primjer9 .1 . Za 15 poljoprivrednih preduzeća (tabela 9.1) poznati su: - broj opreme po jedinici zasejane površine (jedinica/ha) i - obim uzgojenih proizvoda (hiljadu den. jedinica). potrebno:

1) odrediti zavisnost od

2) nacrtajte korelacione polja i nacrtajte jednačinu linearne regresije

3) izvući zaključak o kvalitetu modela i izračunati predviđenu vrijednost sa predviđenom vrijednošću od 112% prosječnog nivoa.

Tabela 9.1

Rješenje:

1) U Excelu ćemo sastaviti pomoćnu tabelu 9.2.

Tabela 9.2

Rice.9 .one. Tabela za izračunavanje međuvrijednosti

Izračunajte broj mjerenja Da biste to učinili, u ćeliji B19 stavi = COUNT(A2:A16 ) .

Korišćenje funkcije ∑ (AutoSum) na traci sa alatkama Standard t naya pronađite zbir svih (ćelija B17) i (ćelija C17).

Rice. 9.2. Izračunavanje zbira vrijednosti i prosjeka

Za izračunavanje prosječnih vrijednosti koristimo ugrađenu funkciju MS Excel AVERAGE(), raspon vrijednosti za određivanje prosjeka je naveden u zagradama. Tako je prosečan obim uzgojenih proizvoda za 15 farmi 210.833 hiljada den. jedinica, a prosječan broj vozila je 6.248 jedinica/ha.

Za popunjavanje kolona D, E, F unesite formulu za izračunavanje proizvoda: u ćeliju D2 stavi = B2*C2, zatim pritisnite ENTER na tastaturi. Kliknite levim tasterom miša na ćeliju D2 i, uhvativši donji desni ugao ove ćelije (crni plus), povucite prema dolje do ćelije D16 . Opseg će se automatski popuniti. D3 - D16 .

Za obračun u selektivnooh kovarijansa između i koristite formulu, tj. u ćeliju B21 stavi = D18- B18* C18 i dobijete 418.055 (slika 9.3).

Rice.9 .3. proračun

SelektivnowowdisperzijaYu za pronalaženje po formuli za ovo u ćeliji B22 stavi = E18-B18^2 (^- znak koji pokazuje eksponencijaciju ) i dobijete 11.337. Slično, određujemo \u003d 16745.05556 (slika 9.4)

Rice.9 .četiri. proračunVar(x) iVar (y)

Nadalje, koristeći standardnu ​​MS Excel funkciju “CORREL”, izračunavamo vrijednost koeficijenta linearne korelacije za naš zadatak, funkcija će izgledati kao “=CORREL(B2:B16;C2:C16)”, a vrijednost rxy=0,96 . Dobijena vrijednost koeficijenta korelacije ukazuje na direktnu i jaku vezu između raspoloživosti opreme i obima uzgojenih proizvoda.

Mi nalazimo inkoeficijent uzorka linearne regresije =36,87; parametar = -17,78. Dakle, uparena jednačina linearne regresije izgleda kao = -17,78 + 36,87

Koeficijent pokazuje da će sa povećanjem broja opreme za 1 jedinicu/ha, obim uzgojenih proizvoda porasti u proseku za 36.875 hiljada den. jedinice (Sl. 9.5)

Rice.9 .5. Proračun parametara regresione jednadžbe.

Dakle, jednadžba regresije će izgledati ovako: .

Zamjenjujemo stvarne vrijednosti u rezultirajuću jednadžbu x(broj opreme) nalazimo teorijske vrijednosti ​​volumena uzgojenih proizvoda (sl. 9.6).

Rice.9 .6. Proračun teoretskih vrijednosti volumena uzgojenih proizvoda

Koristeći Čarobnjak za karte gradimo korelaciona polja (odabirom stupaca sa vrijednostima i ) i jednadžbu linearne regresije (odabirom stupaca sa vrijednostima i ). Odaberite vrstu grafikona - T spektakl U rezultirajućem dijagramu popunite potrebne parametre (naslov, oznake za osi, legendu, itd.). Kao rezultat, dobijamo grafikon prikazan na Sl. 9.7.

Rice.9 .7. Grafikon zavisnosti zapremine uzgojenih proizvoda od broja opreme

Za procjenu kvaliteta izgrađenog regresijskog modela izračunavamo:

. tokoeficijent determinacije\u003d 0,92, što pokazuje da je promjena troškova proizvodnje 92% zbog promjene obima proizvedenih proizvoda, a 8% otpada na udio faktora koji nisu uzeti u obzir u modelu, što ukazuje na kvalitetu izvedenog regresijski model;

. Withrednyuyugreškaataproksimacije. Da biste to učinili, u koloni H izračunajte razliku između stvarne i teorijske vrijednosti a u koloni I- izraz . Imajte na umu da se standardna MS Excel funkcija "ABS" koristi za izračunavanje modulo vrijednosti. Prilikom množenja prosječne vrijednosti (ćelija I18 ) na 100% dobijamo 18,2%. Shodno tome, u prosjeku, teorijske vrijednosti odstupaju od stvarnih za 18,2% (Sl. 1.8).

Koristeći Fišerov kriterijum, vršimo procenu hnachimostbjednačineregreWithove uopšte: 150,74.

Na nivou značajnosti od 0,05 = 4,67, određujemo pomoću ugrađene statističke funkcije F DISTRIBUCIJA(Sl. 1.9). Istovremeno, treba imati na umu da je "Degrees_of_freedom1" nazivnik, a "Degrees_of_freedom2" je brojilac, gdje je broj parametara u jednadžbi regresije (imamo 2), n- broj početnih parova vrijednosti (imamo 15).

Jer tada je jednadžba regresije značajna na =0,05.

Rice.9 .8. Određivanje koeficijenta determinacije iprosječna greška aproksimacije

Rice. 9 . 9 . Prozor dijalogafunkcijeF DISTRIBUCIJA

Dalje, definišemo Withsrednji koeficijent elastičnosti prema formuli. Utvrđeno je da će se povećanjem obima proizvedenih proizvoda za 1% troškovi proizvodnje ovih proizvoda u prosjeku povećati za 1,093%.

Izračunati prognozirana vrijednost zamjenom predviđene vrijednosti faktora =1,12=6,248*1,12=6,9978 u regresionu jednačinu =-19,559+36,8746. Dobijamo =238,48. Sledstveno, sa brojem opreme u iznosu od 6,9978 jedinica/ha, obim proizvodnje će biti 238,48 hiljada den. jedinice

Pronađite zaostalu varijansu, za to izračunavamo zbir kvadrata razlike između stvarne i teorijske vrijednosti. =39.166 stavljanjem sljedeće formule = KORIJEN(J17/(B19-2)) u ćeliju H2 1 (Sl. 9.10).

Rice.9 .deset. Određivanje preostale varijanse

ODrednyastandardth errorprognoza:

Na nivou značajnosti =0,05 koristeći ugrađenu statističku funkciju STEUDRESPOBR definišemo =2,1604 i izračunamo graničnu grešku prognoze, koja u 95% slučajeva neće premašiti .

Dinterval pouzdanosti prognoze:

Or .

Prognoza troškova proizvodnje pokazala se pouzdanom (1-0,05=0,95), ali netačnom, jer je raspon gornje i donje granice intervala povjerenja puta. To se dogodilo zbog malog obima zapažanja.

Mora se poništiti da MS Excel ima ugrađene statističke funkcije koje mogu značajno smanjiti broj međukalkulacija, na primjer (slika 9.11.):

Da izračunam inselektivnoXprosjekX koristite funkciju PROSEK(broj1:brojN) iz kategorije Statistički .

Kovarijansa uzorka između i nalazi se pomoću funkcije COVAR(nizX;arrayY) iz kategorije Statistički .

Selektivnosdisperzijai određena statističkom funkcijom VARP(broj1:brojN) .

Rice.9 .eleven. Računarstvo nindeksira ugrađene funkcijeGOSPOĐAexcel

Pparametarslinearna regresija u Excel-u se može definirati na nekoliko načina.

1 način) Sa ugrađenom funkcijom LINEST. Procedura je sljedeća:

1. Odaberite područje praznih ćelija 5x2 (5 redaka, 2 kolone) za prikaz rezultata statistike regresije ili područje 1x2 - da dobijete samo regresijske koeficijente.

2. Korišćenje Čarobnjaci funkcija među statistički izaberite funkciju LINEST i popunite njegove argumente (slika 9.12):

Rice. 9 . 12 . Dijaloški okvir za unos argumenta funkcijeLINEST

poznate_vrijednosti_y

poznate_vrijednosti_x

Konst- logička vrijednost (1 ili 0), koja ukazuje na prisustvo ili odsustvo slobodnog člana u jednačini; staviti 1;

Statistika- logička vrijednost (1 ili 0) koja pokazuje da li treba prikazati dodatne informacije o regresionoj analizi ili ne; staviti 1.

3. Prvi broj tabele će se pojaviti u gornjoj lijevoj ćeliji odabranog područja. Pritisnite dugme da otvorite celu tabelu. < F2> , a zatim - na kombinaciju tipki < CTRL> + < SHIFT> + < ENTER> .

Dodatna statistika regresije će biti prikazana u obliku (Tabela 9.3):

Tabela 9.3

Vrijednost koeficijenta

Vrijednost koeficijenta

RMS
odstupanje

RMS
odstupanje

Koeficijent
određenja

RMS
odstupanje

Statistika

Broj stepeni slobode

Regresijski zbir kvadrata

Preostali zbir kvadrata

Kao rezultat primjene funkcije LINEST dobijamo:

( 2 način) Korištenje alata za analizu podataka Regresija možete dobiti rezultate statistike regresije, analiza varijanse, intervali povjerenja, reziduali, dijagrami uklapanja regresije, dijagrami reziduala i normalna verovatnoća. Procedura je sljedeća:

1. Morate provjeriti pristup Paket analiza. Da biste to uradili, u glavnom meniju (preko dugmeta microsoft office pristupiti opcijama MS Excel-a) u dijalogu Opcije. GOSPOĐAexcel» odaberite naredbu "Dodaci" i odaberite dodatak s desne strane Analiza paketa a zatim kliknite na dugme "Idi" (slika 9.13). U dijaloškom okviru koji se otvori, označite polje pored "Paket analize" i kliknite na "OK" (slika 9.14).

Na kartici "Podaci" u grupi "Analiza" imat ćete pristup instaliranom dodatku. (Sl. 9.15).

Rice.9 .13. Omogućite dodatke uGOSPOĐAexcel

Rice.9 .četrnaest. Dijaloški okvir za dodatke

Rice.9 .15. Dodatak za analizu podataka na traciGOSPOĐAexcel 2007 .

2. Odaberite "Podaci" u grupi "Analiza", odaberite naredbu Analiza da n nyh u dijaloškom okviru koji se otvori odaberite alat za analizu "Regresija" i kliknite "OK" (slika 9.16):

Rice.9 .16. Dijaloški okvir za analizu podataka

U dijaloškom okviru koji se pojavi (slika 9.17) popunite polja:

ulazni intervalY- opseg koji sadrži podatke efektivnog atributa Y;

ulazni intervalX- opseg koji sadrži podatke eksplanatornog atributa X;

Oznake- zastavicu koja pokazuje da li prvi red sadrži nazive kolona ili ne;

Konstant zero- zastavicu koja označava prisustvo ili odsustvo slobodnog člana u jednačini;

izlazni interval- dovoljno je naznačiti gornju lijevu ćeliju budućeg raspona;

Novi radni list- možete postaviti proizvoljan naziv za novi list na kojem će biti prikazani rezultati.

Rice.9 .17. Dijaloški okvir Regresija

Za preostale informacije, rezidualne dijagrame, uklapanje i normalnu vjerovatnoću, označite odgovarajuća polja za potvrdu u dijaloškom okviru.

Rice. 9 . 18 . Rezultati primjene alataRegresija

AT GOSPOĐAexcel linija trenda može se dodati na trakasti ili linijski grafikon. Za ovo:

1. Potrebno je odabrati područje izgradnje grafikona i na traci odabrati "Layout" i u grupi za analizu odabrati naredbu "Linija trenda" (Sl. 9.19.). U padajućem izborniku odaberite "Napredne opcije trenda".

Rice. 1.19.Ribbon

2. U dijaloškom okviru koji se pojavi odaberite stvarne vrijednosti, zatim će se otvoriti dijaloški okvir "Trend Line Format" (Sl. 9.20.) u kojem se bira tip linije trenda i postavljaju odgovarajući parametri.

Rice. 9 . 20 . Prozor dijaloga"Format linije trenda"

Za polinomski trend, morate specificirati stepen aproksimativnog polinoma, za linearno filtriranje- broj bodova usrednjavanja.

Izaberi Linearno da se napravi jednačina linearne regresije.

As Dodatne informacije mogu prikaži jednačinu na diagram i staviti vrijednost na dijagram(sl.9.21).

Rice. 9 . 21 . Linearni trend

Modeli nelinearne regresije su ilustrirani prilikom izračunavanja parametara jednadžbe pomoću statističke funkcije odabrane u Excelu LGRFPRIBL. Procedura izračuna je slična korištenju funkcije LINEST.

Najjednostavniji u smislu razumijevanja, interpretacije i tehnike izračunavanja je linearni oblik regresije.

Jednačina linearne regresije para , gdje

a 0 , a 1 - parametri modela, ε i - slučajna varijabla (preostala vrijednost).

Parametri modela i njihov sadržaj:


Jednačina regresije je dopunjena indikatorom nepropusnosti veze. Takav pokazatelj je koeficijent linearne korelacije, koji se izračunava po formuli:

ili .

Za procjenu kvaliteta selekcije linearna funkcija izračunava se kvadrat linearnog koeficijenta korelacije, tzv koeficijent determinacije. Koeficijent determinacije karakterizira udio varijanse rezultujućeg atributa, objašnjene regresijom, u ukupnoj varijansi rezultujućeg atributa:

,

gdje

.

Shodno tome, vrijednost karakterizira udio disperzije uzrokovane utjecajem drugih faktora koji nisu uzeti u obzir u modelu.

Nakon što je regresiona jednačina izgrađena, provjerava se njena adekvatnost i tačnost.Ova svojstva modela se proučavaju na osnovu analize većeg broja reziduala ε i (odstupanja izračunatih vrijednosti od stvarnih).

Nivo reda ostatka

Korelativ i regresiona analiza provodi se za ograničenu populaciju. U tom smislu, indikatori regresije, korelacije i determinacije mogu biti iskrivljeni djelovanjem slučajnih faktora. Da bismo provjerili koliko su ovi pokazatelji tipični za cjelokupnu populaciju, da li su rezultat spleta slučajnih okolnosti, potrebno je provjeriti adekvatnost konstruiranog modela.

Provjera adekvatnosti modela se sastoji u utvrđivanju značaja modela i utvrđivanju prisustva ili odsustva sistematska greška.

Vrijednosti 1 relevantne podatke X i na teorijske vrijednosti a 0 i a 1 , nasumično. Vrijednosti koeficijenata izračunatih iz njih također će biti nasumične. a 0 i a 1 .

Provjera značajnosti pojedinih regresijskih koeficijenata vrši se prema Studentov t-test testiranjem hipoteze da je svaki koeficijent regresije jednak nuli. Istovremeno se otkriva koliko su izračunati parametri karakteristični za prikazivanje skupa uslova: jesu li dobivene vrijednosti parametara rezultat djelovanja slučajnih varijabli. Koriste se odgovarajuće formule za odgovarajuće regresijske koeficijente.

Formule za određivanje Studentovog t-testa

gdje

S a 0 ,S a 1 - standardne devijacije slobodnog člana i koeficijenta regresije. Formule

gdje

S ε - standardna devijacija reziduali modela (standardna greška procjene), koji se određuje formulom

Izračunate vrijednosti t-kriterija se upoređuju sa tabelarnom vrijednošću kriterija tαγ , koji je određen za (n - k— 1) stepeni slobode i odgovarajući nivo značajnosti α. Ako izračunata vrijednost t-kriterijuma prelazi njegovu tabelarnu vrijednost tαγ , tada se parametar prepoznaje kao značajan. U ovom slučaju, gotovo je nevjerovatno da su pronađene vrijednosti parametara rezultat samo slučajnih podudarnosti.

Procjena značaja regresione jednačine u cjelini vrši se na osnovu - Fišerovog kriterija, kojem prethodi analiza varijanse.

Ukupan zbir kvadrata odstupanja varijable od srednje vrijednosti se dekomponuje na dva dijela - "objašnjeno" i "neobjašnjeno":

Ukupan zbroj kvadrata odstupanja;

Zbir kvadrata odstupanja objašnjenih regresijom (ili suma faktora kvadrata odstupanja);


- rezidualni zbir kvadrata odstupanja, koji karakteriše uticaj faktora koji nisu uzeti u obzir u modelu.

Shema analize disperzije ima oblik prikazan u tabeli 35 ( - broj opservacija, - broj parametara sa varijablom ).

Tabela 35 - Šema analize varijanse

Komponente varijanse Zbir kvadrata Broj stepeni slobode Disperzija po stepenu slobode
Generale
faktorijel
Ostatak

Određivanje disperzije po jednom stepenu slobode dovodi disperzije u uporediv oblik. Upoređujući faktorijalne i rezidualne varijanse po jednom stepenu slobode, dobijamo vrednost Fišerovog kriterijuma:

Da biste provjerili značaj regresione jednadžbe u cjelini, koristite Fisher F-test. U slučaju uparene linearne regresije, značaj regresijskog modela određuje se sljedećom formulom: .

Ako je, na datom nivou značajnosti, izračunata vrijednost F-kriterijuma sa γ 1 =k, γ 2 =( p-k- 1) stepeni slobode su veći od tabelarnog, tada se model smatra značajnim, hipoteza o slučajnoj prirodi procenjenih karakteristika se odbacuje i priznaje kao njihova statistički značaj i pouzdanost. Provjera prisustva ili odsustva sistematske greške (ispunjenost preduslova metode najmanjih kvadrata - LSM) vrši se na osnovu analize većeg broja reziduala. Proračun slučajnih grešaka parametara linearne regresije i koeficijenta korelacije vrši se prema formulama

,

Da biste testirali svojstvo slučajnosti niza reziduala, možete koristiti kriterij prekretnih tačaka (vrhova). Tačka se smatra prekretnicom ako sledećim uslovima: ε i -1< ε i >ε i +1 ili ε i -1 > ε i< ε i +1

Zatim se izračunava broj okretnih tačaka p. Test slučajnosti sa nivoom značajnosti od 5%, tj. With nivo samopouzdanja 95% je ispunjenje nejednakosti:

Uglaste zagrade znače da je uzeto cijeli dio broj u zagradama. Ako je nejednakost zadovoljena, tada se model smatra adekvatnim.

Za testiranje jednakosti matematičko očekivanje rezidualni niz nula, izračunava se prosječna vrijednost niza reziduala:

Ako je = 0, onda se smatra da model ne sadrži konstantnu sistematsku grešku i da je adekvatan prema kriteriju nulte srednje vrijednosti.

Ako je ≠ 0, tada se testira nulta hipoteza da je matematičko očekivanje jednako nuli. Da biste to učinili, izračunajte Studentov t-test prema formuli:

gdje je S ε standardna devijacija reziduala modela (standardna greška).

Vrijednost t-kriterijuma se upoređuje sa tablicom t αγ . Ako je nejednakost t > t αγ zadovoljena, onda je model neadekvatan prema ovom kriteriju

Varijanca nivoa niza ostataka mora biti ista za sve vrijednosti X(imovina homoskedastičnost) Ako ovaj uslov nije ispunjen, onda heteroskedastičnost .

Za procjenu heteroskedastičnosti s malom veličinom uzorka, može se koristiti Goldfeld–Quandt metoda, čija je suština da je neophodno:

Pronađite varijabilne vrijednosti X u rastućem redoslijedu;

Podijelite skup uređenih zapažanja u dvije grupe;

Za svaku grupu zapažanja konstruirajte regresijske jednačine;

Odredite preostale sume kvadrata za prvu i drugu grupu koristeći formule: ; , gdje

n 1 - broj zapažanja u prvoj grupi;

n 2 - broj zapažanja u drugoj grupi.

Izračunajte kriterij ili (brojnik mora sadržavati veliki zbir kvadrata). Dok radiš Nulta hipoteza o homoskedastičnosti, kriterijum F calc će zadovoljiti F-kriterijum sa stepenima slobode γ 1 =n 1 -m, γ 2 =n - n 1 - m) za svaki preostali iznos kvadrata (gde je m broj procijenjenih parametara u jednadžbi regresije). Što više vrijednost Fcalc premašuje tabelarnu vrijednost F-kriterijuma, to je više narušena premisa o jednakosti disperzija reziduala.

Provjera nezavisnosti niza ostataka (nedostatak autokorelacije) vrši se pomoću Durbin-Watsonovog d-testa. Određuje se formulom:

Izračunata vrijednost kriterija uspoređuje se sa donjom d 1 i gornjom d 2 kritičnim vrijednostima Durbin-Watsonove statistike. Mogući su sljedeći slučajevi:

1) ako d< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

2) ako je d 1 < d < d 2 (uključujući i same ove vrijednosti), smatra se da nema dovoljno osnova za izvođenje jednog ili drugog zaključka. Neophodno za upotrebu dodatni kriterijum, na primjer prvi koeficijent autokorelacije:

Ako je izračunata vrijednost koeficijenta po modulu manja od tabelarne vrijednosti r 1kr, tada se prihvaća hipoteza o odsustvu autokorelacije; u suprotnom, ova hipoteza se odbacuje;

3) ako je d 2 < d < 2, tada se prihvata hipoteza o nezavisnosti reziduala i model se priznaje kao adekvatan prema ovom kriterijumu;

4) ako je d> 2, to znači negativna autokorelacija ostaci. U tom slučaju, izračunata vrijednost kriterija mora se pretvoriti prema formuli d′= 4 - d i uporediti sa kritičnom vrijednošću d′ , ne d.

Provjera korespondencije distribucije zaostalog niza sa zakonom normalne distribucije može se provesti pomoću R / S - kriterija, koji se određuje formulom:

gdje je S ε standardna devijacija reziduala modela (standardna greška). Upoređuje se izračunata vrijednost R/S - kriterija tablične vrijednosti(donja i gornja granica dati odnos), a ako vrijednost ne spada u interval između kritičnih granica, tada se sa datim nivoom značaja hipoteza normalne distribucije odbacuje; u suprotnom hipoteza je prihvaćena

Za procjenu kvaliteta regresijski modeli takođe je preporučljivo koristiti indeks korelacije(višestruki koeficijent korelacije).

Formula za određivanje indeksa korelacije

gdje

Ukupan zbroj kvadrata odstupanja zavisne varijable od srednje vrednosti. Određeno formulom:

Zbir kvadrata odstupanja objašnjenih regresijom. Određeno formulom:

Preostali zbir kvadrata odstupanja. Izračunato prema formuli:

Jednačina može se predstaviti na sljedeći način:

Indeks korelacije ima vrijednost od 0 do 1. Što je veća vrijednost indeksa, to su izračunate vrijednosti rezultirajuće karakteristike bliže stvarnim. Indeks korelacije se koristi za bilo koji oblik povezivanja varijabli; sa uparenom linearnom regresijom, jednaka je koeficijent para korelacije.

Karakteristike tačnosti se koriste kao mjera tačnosti modela: Da bi se odredila mjera tačnosti modela, izračunava se sljedeće:

- maksimalna greška- odgovara odstupanju izračunatog odstupanja izračunatih vrijednosti od stvarnih

- prosjek apsolutna greška - greška pokazuje koliko stvarne vrijednosti u prosjeku odstupaju od modela

- varijansa niza reziduala (rezidualna disperzija)

gdje je prosječna vrijednost niza ostataka. Određeno formulom

- korijen srednje kvadratne greške. To je kvadratni korijen varijanse: , kako manje vrijednosti greške, to je model precizniji

- prosjek relativna greška aproksimacije.

Prosječna greška aproksimacije ne bi trebala prelaziti 8-10%.

Ako je regresijski model prepoznat kao adekvatan, a parametri modela su značajni, nastavite sa izradom prognoze .

predviđenu vrijednost varijabla at se dobija zamjenom očekivane vrijednosti nezavisne varijable u jednadžbu regresije X progn.

Ovo predviđanje se zove tačka. Vjerovatnoća implementacije tačkaste prognoze je skoro nula, tako da se interval povjerenja prognoze izračunava s velikom pouzdanošću.

Intervali pouzdanosti prognoze zavise od standardna greška, izbriši X pobjeći od svoje srednje vrijednosti , broj zapažanja n i nivo značajnosti prognoze α. Intervali pouzdanosti prognoze se izračunavaju po formuli: ili

gdje

t tabela - određena Studentovom tablicom distribucije za nivo značajnosti α i broj stepeni slobode γ=n-k-1.

Primjer 13.

Prema istraživanju osam grupa porodica poznati su podaci o odnosu potrošnje stanovništva na hranu i visine porodičnih prihoda (tabela 36).

Tabela 36 – Odnosi između potrošnje domaćinstava na hranu i porodičnih prihoda

Izdaci za hranu, tis. rub. 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
Porodični prihod, hiljada rubalja 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

Pretpostavimo da je odnos između porodičnih prihoda i izdataka za hranu linearan. Da bismo potvrdili našu pretpostavku, konstruišemo korelaciono polje (slika 8).

Grafikon pokazuje da se tačke postavljaju u neku pravu liniju.

Radi pogodnosti daljih proračuna sastavit ćemo tabelu 37.

Izračunajte parametre jednačine linearne regresije para . Da bismo to učinili, koristimo formule:

Slika 8 - Korelaciono polje.

Dobili smo jednačinu:

One. uz povećanje porodičnog prihoda za 1000 rubalja. troškovi hrane se povećavaju za 168 rubalja.

Proračun linearnog koeficijenta korelacije.