Biografije Karakteristike Analiza

Naći matricu koeficijenata parne korelacije uzorka. Određivanje koeficijenta višestruke korelacije u MS Excel-u

Z 1 (t)

Z 2 (t)

t

y(t)

Z 1 (t)

Z 2 (t)

t

y(t)

Osnovni zadatak pred odabirom faktora uključenih u model korelacije je da se u analizu uvedu svi glavni faktori koji utiču na nivo fenomena koji se proučava. Međutim, uvođenje velikog broja faktora u model je nepraktično; ispravnije je odabrati samo relativno mali broj glavnih faktora za koje se pretpostavlja da su u korelaciji sa odabranim funkcionalnim indikatorom.

To se može učiniti takozvanim dvostepenim odabirom. U skladu s tim, svi prethodno odabrani faktori su uključeni u model. Zatim se među njima, na osnovu posebne kvantitativne procjene i dodatne kvalitativne analize, identifikuju beznačajno utjecajni faktori, koji se postepeno odbacuju dok ne ostanu oni za koje se može tvrditi da je raspoloživa statistička građa u skladu s hipotezom o njihovom zajedničkom značajan uticaj na zavisnu varijablu sa izabranim oblikom veze.

Dvostepena selekcija dobila je najpotpuniji izraz u tehnici tzv. višestepene regresione analize, u kojoj se eliminacija nebitnih faktora dešava na osnovu pokazatelja njihove važnosti, posebno na osnovu vrednosti t f - izračunatu vrijednost Studentovog testa.

Izračunajmo t f koristeći pronađene koeficijente korelacije parova i uporedimo ih sa t kritičnim za nivo značajnosti od 5% (dvostrano) i 18 stepeni slobode (ν = n-2).

gdje je r vrijednost koeficijenta korelacije para;

n – broj zapažanja (n=20)

Kada se poredi t f za svaki koeficijent sa t cr = 2,101 nalazimo da se pronađeni koeficijenti smatraju značajnim, jer t f > t cr.

t f za r yx 1 = 2, 5599 ;

t f za r yx 2 = 7,064206 ;

t f za r yx 3 = 2,40218 ;

t f za r x1 x 2 = 4,338906 ;

t f za r x1 x 3 = 15,35065;

t f za r x2 x 3 = 4,749981

Prilikom odabira faktora koji će biti uključeni u analizu, na njih se postavljaju specifični zahtjevi. Prije svega, indikatori koji izražavaju ove faktore moraju biti kvantitativno mjerljivi.

Faktori uključeni u model ne bi trebali biti u funkcionalnom ili bliskom međusobnom odnosu. Prisustvo takvih odnosa karakteriše multikolinearnost.

Multikolinearnost ukazuje da neki faktori karakterišu jedan te isti aspekt fenomena koji se proučava. Stoga je njihovo istovremeno uključivanje u model neprikladno, jer se u određenoj mjeri dupliciraju. Ako ne postoje posebne pretpostavke govornika u korist jednog od ovih faktora, prednost treba dati onom koji karakteriše veliki parni (ili parcijalni) koeficijent korelacije.

Smatra se da je maksimalna vrijednost koeficijenta korelacije između dva faktora 0,8.

Multikolinearnost obično dovodi do degeneracije matrice varijabli i, posljedično, do činjenice da glavna determinanta smanjuje svoju vrijednost i u granici se približava nuli. Procjene koeficijenata regresijske jednadžbe postaju jako zavisne od tačnosti pronalaženja izvornih podataka i naglo mijenjaju njihove vrijednosti kada se promijeni broj opažanja.

Zadatak 2

1. Konstruirajte matricu koeficijenata korelacije parova. Provjerite multikolinearnost. Obrazložite izbor faktora u modelu.

2. Konstruirajte jednačinu višestruka regresija u linearnom obliku sa odabranim faktorima.

3. Rate statistički značaj jednadžba regresije i njeni parametri korištenjem Fisher i Student testova.

4. Konstruirajte regresionu jednačinu sa statistički značajnim faktorima. Procijenite kvalitet jednadžbe regresije koristeći koeficijent determinacije R2. Ocijeniti tačnost konstruisanog modela.

5. Procijeniti prognozu obima proizvodnje ako su prognozirane vrijednosti faktora 75% njihovih maksimalnih vrijednosti.

Problemski uslovi (opcija 21)

Prema podacima prikazanim u tabeli 1 (n = 17), proučavamo zavisnost obima proizvodnje Y (miliona rubalja) od sledeći faktori(varijable):

X 1 – broj zaposlenih u industrijskoj proizvodnji, ljudi.

X 2 – prosječni godišnji trošak osnovnih sredstava, miliona rubalja.

X 3 – amortizacija osnovnih sredstava, %

X 4 – napajanje, kWh.

X 5 – tehnička opremljenost jednog radnika, milion rubalja.

X 6 – proizvodnja tržišnih proizvoda po radniku, rub.

Tabela 1. Podaci o izdanju proizvoda

Y X 1 X 2 X 3 X 4 X 5 X 6
39,5 4,9 3,2
46,4 60,5 20,4
43,7 24,9 9,5
35,7 50,4 34,7
41,8 5,1 17,9
49,8 35,9 12,1
44,1 48,1 18,9
48,1 69,5 12,2
47,6 31,9 8,1
58,6 139,4 29,7
70,4 16,9 5,3
37,5 17,8 5,6
62,0 27,6 12,3
34,4 13,9 3,2
35,4 37,3 19,0
40,8 55,3 19,3
48,1 35,1 12,4


Konstruirajte matricu koeficijenata korelacije parova. Provjerite multikolinearnost. Obrazložite izbor faktora u modelu

Tabela 2 pokazuje matrica koeficijenta korelacije para za sve varijable uključene u razmatranje. Matrica se dobija pomoću alata Korelacija iz paketa Analiza podataka V Excel.

Tabela 2. Matrica koeficijenata korelacije parova

Y X1 X2 X3 X4 X5 X6
Y
X1 0,995634
X2 0,996949 0,994947
X3 -0,25446 -0,27074 -0,26264
X4 0,12291 0,07251 0,107572 0,248622
X5 0,222946 0,166919 0,219914 -0,07573 0,671386
X6 0,067685 -0,00273 0,041955 -0,28755 0,366382 0,600899

Vizuelna analiza matrice vam omogućava da utvrdite:

1) U ima prilično visoke parne korelacije sa varijablama X1, X2 (>0,5) i nizak sa varijablama X3,X4,X5,X6 (<0,5);

2) Analizne varijable X1, X2 pokazuju prilično visoke parne korelacije, što zahtijeva provjeru faktora za prisustvo multikolinearnosti između njih. Štaviše, jedan od uslova klasičnog regresijskog modela je pretpostavka nezavisnosti eksplanatornih varijabli.

Da bismo identifikovali multikolinearnost faktora, radimo Farrar-Glouberov test faktorima X1, X2, X3,X4,X5,X6.

Provjera Farrar-Glouber testa na multikolinearnost faktora uključuje nekoliko faza.

1) Provjera multikolinearnosti cijelog niza varijabli .

Jedan od uslova klasičnog regresijskog modela je pretpostavka nezavisnosti eksplanatornih varijabli. Da bi se identifikovala multikolinearnost između faktora, matrica međufaktorskih korelacija R se izračunava korišćenjem Paketa za analizu podataka (Tabela 3).

Tabela 3. Matrica međufaktorskih korelacija R

X1 X2 X3 X4 X5 X6
X1 0,994947 -0,27074 0,07251 0,166919 -0,00273
X2 0,994947 -0,26264 0,107572 0,219914 0,041955
X3 -0,27074 -0,26264 0,248622 -0,07573 -0,28755
X4 0,07251 0,107572 0,248622 0,671386 0,366382
X5 0,166919 0,219914 -0,07573 0,671386 0,600899
X6 -0,00273 0,041955 -0,28755 0,366382 0,600899

Postoji jaka zavisnost (>0,5) između faktora X1 i X2, X5 i X4, X6 i X5.

Determinanta det (R) = 0,001488 izračunava se pomoću funkcije MOPRED. Determinanta matrice R teži nuli, što nam omogućava da napravimo pretpostavku o opštoj multikolinearnosti faktora.

2) Provjera multikolinearnosti svake varijable s drugim varijablama:

· Izračunajmo inverznu matricu R -1 koristeći Excel funkciju MOBR (tabela 4):

Tabela 4. Inverzna matrica R -1

X1 X2 X3 X4 X5 X6
X1 150,1209 -149,95 3,415228 -1,70527 6,775768 4,236465
X2 -149,95 150,9583 -3,00988 1,591549 -7,10952 -3,91954
X3 3,415228 -3,00988 1,541199 -0,76909 0,325241 0,665121
X4 -1,70527 1,591549 -0,76909 2,218969 -1,4854 -0,213
X5 6,775768 -7,10952 0,325241 -1,4854 2,943718 -0,81434
X6 4,236465 -3,91954 0,665121 -0,213 -0,81434 1,934647

· Izračunavanje F-kriterija, gdje su dijagonalni elementi matrice, n=17, k = 6 (Tabela 5).

Tabela 5. Vrijednosti F-testa

F1 (X1) F2 (X2) F3 (X3) F4 (X4) F5 (X5) F6 (X6)
89,29396 89,79536 0,324071 0,729921 1,163903 0,559669

· Upoređuju se stvarne vrijednosti F-testa sa vrijednost tabele F tabela = 3,21(FDIST(0,05;6;10)) sa n1= 6 i n2 = n - k – 1=17-6-1=10 stepeni slobode i nivoom značajnosti α=0,05, gde je k broj faktora.

· Vrijednosti F-kriterija za faktore X1 i X2 su veće od tabelarnih, što ukazuje na prisustvo multikolinearnosti između ovih faktora. Faktor X3 ima najmanji uticaj na ukupnu multikolinearnost faktora.

3) Provjera multikolinearnosti svakog para varijabli

· Izračunajmo parcijalne koeficijente korelacije koristeći formulu , gdje su elementi matrice (Tabela 6)

Tabela 6. Matrica parcijalnih koeficijenata korelacije

X1 X2 X3 X4 X5 X6
X1
X2 0,996086
X3 -0,22453 0,197329
X4 0,093432 -0,08696 0,415882
X5 -0,32232 0,337259 -0,1527 0,581191
X6 -0,24859 0,229354 -0,38519 0,102801 0,341239

· Kalkulacija t-kriterijumi prema formuli (Tabela 7)

n - broj podataka = 17

K - broj faktora = 6

Tabela 7.t-testovi za parcijalne koeficijente korelacije

X1 X2 X3 X4 X5 X6
X1
X2 35,6355
X3 -0,72862 0,636526
X4 0,296756 -0,27604 1,446126
X5 -1,07674 1,13288 -0,4886 2,258495
X6 -0,81158 0,745143 -1,31991 0,326817 1,147999

t tabela = STUDARSOBR(0,05,10) = 2,23

Stvarne vrijednosti t-testa upoređuju se sa tabelarnom vrijednošću sa stupnjevima slobode n-k-1 = 17-6-1=10 i nivoom značajnosti α=0,05;

t21 > ttable

t54 > ttable

Iz tabela 6 i 7 jasno je da dva para faktora X1 i X2, X4 i X5 imaju visoku statistički značajnu parcijalnu korelaciju, odnosno da su multikolinearni. Da biste se riješili multikolinearnosti, možete isključiti jednu od varijabli kolinearnog para. U paru X1 i X2 ostavljamo X2, u paru X4 i X5 ostavljamo X5.

Dakle, kao rezultat provjere Farrar-Glouberovog testa ostaju sljedeći faktori: X2, X3, X5, X6.

Završavanje procedura korelacione analize, preporučljivo je pogledati parcijalne korelacije odabranih faktora sa rezultatom Y.

Izgradimo matricu parnih koeficijenata korelacije na osnovu podataka u tabeli 8.

Tablica 8. Podaci o izlazu proizvoda s odabranim faktorima X2, X3, X5, X6.

Zapažanje br. Y X 2 X 3 X 5 X 6
39,5 3,2
46,4 20,4
43,7 9,5
35,7 34,7
41,8 17,9
49,8 12,1
44,1 18,9
48,1 12,2
47,6 8,1
58,6 29,7
70,4 5,3
37,5 5,6
12,3
34,4 3,2
35,4
40,8 19,3
48,1 12,4

Posljednja kolona tabele 9 predstavlja vrijednosti t-testa za Y kolonu.

Tabela 9. Matrica parcijalnih koeficijenata korelacije sa rezultatom Y

Y X2 X3 X5 X6 t kriterijum (t tabela (0,05;11)= 2,200985
Y 0,996949 -0,25446 0,222946 0,067685
X2 0,996949 -0,26264 0,219914 0,041955 44,31676
X3 -0,25446 -0,26264 -0,07573 -0,28755 0,916144
X5 0,222946 0,219914 -0,07573 0,600899 -0,88721
X6 0,067685 0,041955 -0,28755 0,600899 1,645749

Iz tabele 9 je jasno da varijabla Y ima visoku i istovremeno statistički značajnu parcijalnu korelaciju sa faktor X2.

1. KONSTRUIRAJTE MATRICU KOEFICIJENATA UPARENE KORELACIJE.

Da bismo to učinili, izračunavamo koeficijente korelacije para koristeći formulu:

Potrebni proračuni su prikazani u tabeli 9.

-

veza između prihoda preduzeća Y i iznosa kapitalnih ulaganja X 1 je slaba i direktna;

-

praktično ne postoji veza između prihoda preduzeća Y i osnovnih proizvodnih sredstava X 2;

-

veza između obima kapitalnih investicija X 1 i osnovnih proizvodnih sredstava X 2 je bliska i direktna;

Tabela 9

Pomoćna tabela za izračunavanje koeficijenata parne korelacije

t Y X1 X2

(y-ysr)*
(x1-x1sr)

(y-ysr)*
(x2-x2sr)

(x1-x1sr)*
(x2-x2sr)

1998 3,0 1,1 0,4 0,0196 0,0484 0,0841 0,0308 0,0406 0,0638
1999 2,9 1,1 0,4 0,0576 0,0484 0,0841 0,0528 0,0696 0,0638
2000 3,0 1,2 0,7 0,0196 0,0144 1E-04 0,0168 -0,0014 -0,0012
2001 3,1 1,4 0,9 0,0016 0,0064 0,0441 -0,0032 -0,0084 0,0168
2002 3,2 1,4 0,9 0,0036 0,0064 0,0441 0,0048 0,0126 0,0168
2003 2,8 1,4 0,8 0,1156 0,0064 0,0121 -0,0272 -0,0374 0,0088
2004 2,9 1,3 0,8 0,0576 0,0004 0,0121 0,0048 -0,0264 -0,0022
2005 3,4 1,6 1,1 0,0676 0,0784 0,1681 0,0728 0,1066 0,1148
2006 3,5 1,3 0,4 0,1296 0,0004 0,0841 -0,0072 -0,1044 0,0058
2007 3,6 1,4 0,5 0,2116 0,0064 0,0361 0,0368 -0,0874 -0,0152
Σ 31,4 13,2 6,9 0,684 0,216 0,569 0,182 -0,036 0,272
Avg. 3,14 1,32 0,69

Također, matrica parnih koeficijenata korelacije može se pronaći u Excelu pomoću dodatka ANALIZA PODATAKA, alata KORELACIJA.

Matrica koeficijenata korelacije parova ima oblik:

Y X1 X2
Y 1
X1 0,4735 1
X2 -0,0577 0,7759 1

Matrica uparenih koeficijenata korelacije pokazuje da efektivni atribut y (prihod) ima slaba veza sa obimom kapitalnih ulaganja x 1, ali sa veličinom opšteg fonda praktično nema veze. Odnos između faktora u modelu ocjenjuje se bliskim, što ukazuje na njihov linearna zavisnost, multikolinearnost.

2. IZGRADITE LINEARNI VIŠE REGRESIJSKI MODEL

Pronaći ćemo parametre modela pomoću najmanjih kvadrata. Da bismo to uradili, napravimo sistem normalne jednačine.

Proračuni su prikazani u tabeli 10.

Rešimo sistem jednačina koristeći Cramerovu metodu:

Tabela 10

Pomoćni proračuni za pronalaženje parametara linearnog modela višestruke regresije

y
3,0 1,1 0,4 1,21 0,44 0,16 3,3 1,2
2,9 1,1 0,4 1,21 0,44 0,16 3,19 1,16
3,0 1,2 0,7 1,44 0,84 0,49 3,6 2,1
3,1 1,4 0,9 1,96 1,26 0,81 4,34 2,79
3,2 1,4 0,9 1,96 1,26 0,81 4,48 2,88
2,8 1,4 0,8 1,96 1,12 0,64 3,92 2,24
2,9 1,3 0,8 1,69 1,04 0,64 3,77 2,32
3,4 1,6 1,1 2,56 1,76 1,21 5,44 3,74
3,5 1,3 0,4 1,69 0,52 0,16 4,55 1,4
3,6 1,4 0,5 1,96 0,7 0,25 5,04 1,8
31,4 13,2 6,9 17,64 9,38 5,33 41,63 21,63

Model linearne višestruke regresije ima oblik:

Ako se obim kapitalnih ulaganja poveća za 1 milion rubalja, tada će se prihod kompanije povećati u prosjeku za 2,317 miliona rubalja. sa konstantnim veličinama osnovnih proizvodnih sredstava.

Ako se osnovna proizvodna sredstva povećaju za 1 milion rubalja, prihod preduzeća će se smanjiti u proseku za 1,171 milion rubalja. uz konstantan iznos kapitalnih ulaganja.

3. IZRAČUNAMO:

koeficijent determinacije:

67,82% promjene prihoda preduzeća je rezultat promjene obima kapitalnih ulaganja i osnovnih proizvodnih sredstava, a 32,18% je posljedica uticaja faktora koji nisu obuhvaćeni modelom.

F – Fišerov kriterijum

Provjerimo značaj jednačine

Tabelarna vrijednost F testa na nivou značajnosti α = 0,05 i broju stupnjeva slobode d.f. 1 = k = 2 (broj faktora), broj stepena slobode d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 će biti 4,74.

Pošto je F izračunao = 7.375 > F tab. = 4,74, onda se jednačina regresije u cjelini može smatrati statistički značajnom.

Izračunati indikatori se mogu pronaći u Excel okruženju pomoću dodatka ANALIZA PODATAKA, alata REGRESSION.


Tabela 11

Pomoćni proračuni za pronalaženje prosječne relativne greške aproksimacije

y A
3,0 1,1 0,4 2,97 0,03 0,010
2,9 1,1 0,4 2,97 -0,07 0,024
3,0 1,2 0,7 2,85 0,15 0,050
3,1 1,4 0,9 3,08 0,02 0,007
3,2 1,4 0,9 3,08 0,12 0,038
2,8 1,4 0,8 3,20 -0,40 0,142
2,9 1,3 0,8 2,96 -0,06 0,022
3,4 1,6 1,1 3,31 0,09 0,027
3,5 1,3 0,4 3,43 0,07 0,019
3,6 1,4 0,5 3,55 0,05 0,014
0,353

prosječna relativna greška aproksimacije

U prosjeku, izračunate vrijednosti se razlikuju od stvarnih za 3,53%. Greška je mala, model se može smatrati tačnim.

4. Konstruirajte model višestruke regresije po stepenu

Da bismo izgradili ovaj model, uzmimo logaritme obje strane jednakosti

log y = log a + β 1 ∙ log x 1 + β 2 ∙ log x 2 .

Napravimo zamjenu Y = log y, A = log a, X 1 = log x 1, X 2 = log x 2.

Tada je Y = A + β 1 ∙ X 1 + β 2 ∙ X 2 – linearni dvofaktorski regresijski model. Možete koristiti OLS.

Proračuni su prikazani u tabeli 12.

Tabela 12

Pomoćni proračuni za pronalaženje parametara modela višestruke regresije po stepenu

y lg y
3,0 1,1 0,4 0,041 -0,398 0,477 0,002 -0,016 0,020 0,158 -0,190
2,9 1,1 0,4 0,041 -0,398 0,462 0,002 -0,016 0,019 0,158 -0,184
3,0 1,2 0,7 0,079 -0,155 0,477 0,006 -0,012 0,038 0,024 -0,074
3,1 1,4 0,9 0,146 -0,046 0,491 0,021 -0,007 0,072 0,002 -0,022
3,2 1,4 0,9 0,146 -0,046 0,505 0,021 -0,007 0,074 0,002 -0,023
2,8 1,4 0,8 0,146 -0,097 0,447 0,021 -0,014 0,065 0,009 -0,043
2,9 1,3 0,8 0,114 -0,097 0,462 0,013 -0,011 0,053 0,009 -0,045
3,4 1,6 1,1 0,204 0,041 0,531 0,042 0,008 0,108 0,002 0,022
3,5 1,3 0,4 0,114 -0,398 0,544 0,013 -0,045 0,062 0,158 -0,217
3,6 1,4 0,5 0,146 -0,301 0,556 0,021 -0,044 0,081 0,091 -0,167
31,4 13,2 6,9 1,178 -1,894 4,955 0,163 -0,165 0,592 0,614 -0,943

Sistem jednačina rješavamo Cramerovom metodom.

Model višestruke regresije snage ima oblik:

IN funkcija snage koeficijenti faktora su koeficijenti elastičnosti. Koeficijent elastičnosti pokazuje za koji procenat će se promijeniti prosječna vrijednost efektivne karakteristike y ako se jedan od faktora poveća za 1%, dok vrijednosti ostalih faktora ostanu nepromijenjene.

Ako se obim kapitalnih ulaganja poveća za 1%, onda će prihod preduzeća porasti u proseku za 0,897% sa istom veličinom osnovnih proizvodnih sredstava.

Ako se stalna proizvodna sredstva povećaju za 1%, onda će se prihodi preduzeća smanjiti za 0,226% uz stalna kapitalna ulaganja.

5. IZRAČUNAMO:

koeficijent višestruke korelacije:

Veza između prihoda preduzeća i obima kapitalnih investicija i osnovnih proizvodnih sredstava je bliska.

Tabela 13

Pomoćni proračuni za pronalaženje koeficijenta višestruke korelacije, koeficijenta determinacije, prosječne relativne greške aproksimacije modela višestruke regresije

Y

(Y-Y kalc.) 2

A
3,0 1,1 0,4 2,978 0,000 0,020 0,007
2,9 1,1 0,4 2,978 0,006 0,058 0,027
3,0 1,2 0,7 2,838 0,026 0,020 0,054
3,1 1,4 0,9 3,079 0,000 0,002 0,007
3,2 1,4 0,9 3,079 0,015 0,004 0,038
2,8 1,4 0,8 3,162 0,131 0,116 0,129
2,9 1,3 0,8 2,959 0,003 0,058 0,020
3,4 1,6 1,1 3,317 0,007 0,068 0,024
3,5 1,3 0,4 3,460 0,002 0,130 0,012
3,6 1,4 0,5 3,516 0,007 0,212 0,023
31,4 13,2 6,9 0,198 0,684 0,342

koeficijent determinacije:

71,06% promjene prihoda preduzeća u elektroenergetskom modelu je uzrokovano promjenama u obimu kapitalnih ulaganja i stalnih proizvodnih sredstava, a 28,94% je posljedica uticaja faktora koji nisu obuhvaćeni modelom.

F – Fišerov kriterijum

Provjerimo značaj jednačine

Tabelarna vrijednost F testa na nivou značajnosti α = 0,05 i broju stupnjeva slobode d.f. 1 = k = 2, broj stupnjeva slobode d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 će biti 4,74.

Pošto je F izračunao = 8.592 > F tab. = 4,74, onda se jednačina regresije snage u cjelini može smatrati statistički značajnom.

Slijetanje je nemoguće, u kojem od mogućih slučajeva je potrošnja goriva manja. Preuzmite program optimalna kontrola, kada do određenog trenutka t1 nema regulacije u*=0, a počevši od t=t1, kontrola je jednaka njenoj maksimalnoj vrijednosti u*=umax, što odgovara minimalnoj potrošnji goriva. 6.) Rešiti kanonski sistem jednačina, uzimajući u obzir slučajeve kada je kontrola...

Ka kompilaciji matematičkih modela. Ako je matematički model dijagnoza bolesti, onda je algoritam metoda liječenja. Mogu se izdvojiti sljedeće glavne faze operativnog istraživanja: posmatranje fenomena i prikupljanje početnih podataka; izjava o problemu; izgradnja matematički model; proračun modela; testiranje modela i analiza izlaznih podataka. Ukoliko dobijeni rezultati nisu zadovoljavajući...

Matematičke konstrukcije po analogiji s otkriva u ravninskoj aproksimaciji longitudinalno-skalarno elektromagnetni talas sa električnim - (28) i magnetnim (29) komponentama u fazi. Matematički model irotacijske elektrodinamike karakterizira skalarno-vektorska struktura njegovih jednačina. Osnovne jednadžbe irotacijske elektrodinamike sumirane su u tabeli 1. Tabela 1, ...

OPCIJA 5

Ovisnost prosječnog životnog vijeka od nekoliko faktora proučavana je prema podacima za 1995. godinu, prikazanim u tabeli. 5.

Tabela 5

Mozambik

……………………………………………………………………………………..

Switzerland

Oznake korištene u tabeli:

· Y-- prosječni životni vijek pri rođenju, godine;

· X 1 -- BDP u paritetima kupovne moći;

· X 2 -- lanac tempo rast stanovništva, %;

· X 3 -- lanac stopa rasta radne snage, %;

· X 4 -- stopa smrtnosti novorođenčadi, % .

Obavezno:

1. Sastaviti matricu parnih koeficijenata korelacije između svih proučavanih varijabli i identificirati kolinearne faktore.

2. Konstruirajte jednadžbu regresije koja ne sadrži kolinearne faktore. Provjerite statističku značajnost jednačine i njenih koeficijenata.

3. Konstruirajte regresionu jednačinu koja sadrži samo statistički značajne i informativne faktore. Provjerite statističku značajnost jednačine i njenih koeficijenata.

Tačke 4 - 6 odnose se na jednadžbu regresije konstruisanu prilikom izvođenja tačke 3.

4. Procijeniti kvalitet i tačnost jednačine regresije.

5. Dajte ekonomsku interpretaciju koeficijenata regresione jednačine i uporednu procjenu jačine utjecaja faktora na varijablu ishoda Y.

6. Izračunajte predviđenu vrijednost varijable ishoda Y, ako su predviđene vrijednosti faktora 75% njihovih maksimalnih vrijednosti. Konstruirajte interval pouzdanosti za prognozu stvarne vrijednosti Y sa 80% pouzdanosti.

Rješenje. Za rješavanje problema se koristi stolni procesor EXCEL.

1. Koristeći dodatak “Analiza podataka… Korelacija” gradimo matricu uparenih koeficijenata korelacije između svih proučavanih varijabli (meni “Alati” “Analiza podataka…” “Korelacija”). Na sl. Slika 1 prikazuje panel za analizu korelacije sa popunjenim poljima Da biste kopirali snimak prozora u međuspremnik podataka WINDOWS, koristite kombinaciju tastera Alt+Print Screen (na nekim tastaturama - Alt+PrtSc). u dodatku. 2 i prebačen na sto. 1.

pirinač. 1. Panel za analizu korelacije

Tabela 1

Matrica koeficijenata korelacije parova

Analiza međufaktorski koeficijenti korelacije pokazuje da vrijednost od 0,8 premašuje u apsolutnoj vrijednosti koeficijent korelacije između para faktora X 2 -X 3 (istaknuto podebljano). Faktori X 2 -X 3 su stoga prepoznate kao kolinearne.

2. Kao što je pokazano u paragrafu 1, faktori X2-X3 su kolinearni, što znači da se zapravo dupliraju, a njihovo istovremeno uključivanje u model će dovesti do pogrešne interpretacije odgovarajućih koeficijenata regresije. Može se vidjeti da faktor X2 ima veći koeficijent korelacije sa rezultatom Y od faktora X3: ry,x2=0,72516; ry,x3=0,53397; |ry,x2|>|ry,x3| (vidi tabelu 1). Ovo ukazuje na više jak uticaj faktor X2 za promjenu Y. Faktor X3 je stoga isključen iz razmatranja.

Za konstruiranje regresijske jednadžbe koriste se vrijednosti varijabli ( Y,X 1 , X 2 , X 4) kopirajte na prazan radni list ( adj. 3). Regresionu jednačinu gradimo pomoću dodatka “ Analiza podataka...Regresija" (meni " usluga" « Analiza podataka...» « Regresija"). Prikazan je panel za regresijsku analizu sa popunjenim poljima pirinač. 2.

Dati su rezultati regresione analize adj. 4 i preselio se u sto 2. Jednačina regresije ima oblik (vidi “ Šanse" V sto 2):

y = 75,44 + 0,0447 ? x 1 - 0,0453 ? x 2 - 0,24 ? x 4

Jednačina regresije se smatra statistički značajnom, jer je vjerovatnoća njenog slučajnog formiranja u obliku u kojem je dobijena 1,04571?10 -45 (vidi. "Značaj F" V sto 2), što je značajno niže od prihvaćenog nivoa značajnosti =0,05.

Vjerojatnost slučajnog formiranja koeficijenata za faktor X 1 ispod prihvaćenog nivoa značajnosti =0,05 (vidi “ P-vrijednost" V sto 2), što ukazuje na statističku značajnost koeficijenata i značajan uticaj ovih faktora na promjenu godišnje dobiti Y.

Vjerovatnoća slučajnog formiranja koeficijenata za faktore X 2 i X 4 prelazi prihvaćeni nivo značajnosti =0,05 (vidi “ P-vrijednost" V sto 2), a ovi koeficijenti se ne smatraju statistički značajnim.

pirinač. 2. Panel za analizu regresije modela Y(X 1 ,X 2 ,X 4 )

Tabela 2

Y(X 1 , X 2 , X 4 )

Analiza varijanse

Značaj F

Regresija

Jednačina regresije

Odds

Standardna greška

t-statistika

P-vrijednost

donjih 95%

Top 95%

Donjih 95,0%

Top 95,0%

Y-raskrsnica

3. Na osnovu rezultata provjere statističke značajnosti koeficijenata regresijske jednačine obavljene u prethodnom pasusu, gradimo novi regresijski model koji sadrži samo informativne faktore, koji uključuju:

· faktori čiji su koeficijenti statistički značajni;

faktori čiji koeficijenti t _statistics premašuje jedan u apsolutnoj vrijednosti (drugim riječima, apsolutna vrijednost koeficijent je veći od njega standardna greška).

Prva grupa uključuje faktor X 1 do 2 je faktor X 4. Faktor X 2 je isključena iz razmatranja kao neinformativna, i konačno regresijski model sadržaće faktore X 1 , X 4 .

Da biste napravili jednadžbu regresije, kopirajte vrijednosti varijabli koje se koriste na prazan radni list ( adj. 5) i izvrši regresionu analizu ( pirinač. 3). Njegovi rezultati su dati u adj. 6 i preselio se u sto 3. Jednačina regresije je:

y = 75,38278 + 0,044918 ? x 1 - 0,24031 ? x 4

(cm." Šanse" V tabela 3).

pirinač. 3. Panel za analizu regresije modela Y(X 1 , X 4 )

Tabela 3

Rezultati regresione analize modela Y(X 1 , X 4 )

Statistika regresije

Množina R

R-kvadrat

Normalizirani R-kvadrat

Standardna greška

Zapažanja

Analiza varijanse

Značaj F

Regresija

Jednačina regresije

Odds

Standardna greška

t-statistika

P-vrijednost

Y-raskrsnica

Jednačina regresije je statistički značajna: vjerovatnoća njenog slučajnog formiranja je ispod prihvatljivog nivoa značajnosti = 0,05 (vidi “ Značaj F" V tabela 3).

Koeficijent za faktor se također smatra statistički značajnim X 1 vjerovatnoća njegovog slučajnog formiranja je ispod prihvatljivog nivoa značajnosti = 0,05 (vidi “ P-vrijednost" V sto 3). Ovo ukazuje na značajan uticaj BDP-a na paritete kupovne moći X 1 po promjeni godišnje dobiti Y.

Faktorski koeficijent X 4 (godišnja stopa smrtnosti novorođenčadi) nije statistički značajno. Međutim, ovaj faktor se i dalje može smatrati informativnim, jer t _statistika njegovog koeficijenta premašuje modulo jedinica, iako dalji zaključci u vezi sa faktorom X 4 treba tretirati sa određenim oprezom.

4. Procijenimo kvalitet i tačnost posljednje jednačine regresije koristeći neke statističke karakteristike dobijeno tokom regresione analize (vidi “ Statistika regresije» u tabeli. 3):

višestruki koeficijent determinacije

R2 = _ i=1 ____________ =0.946576

R 2 = pokazuje da regresijski model objašnjava 94,7% varijacija u prosječnom očekivanom životnom vijeku pri rođenju Y, a ova varijacija je posljedica promjena faktora uključenih u regresijski model X 1 , X 4 ;

standardna greška regresije

pokazuje da su vrijednosti prosječnog životnog vijeka pri rođenju predviđene regresijskom jednadžbom Y razlikuju se od stvarnih vrijednosti u prosjeku za 2,252208 godina.

Prosjek relativna greška aproksimacija je određena približnom formulom:

Erel?0.8 ? -- ? 100%=0,8 ? 2.252208/66.9 ? 100%?2.7

gdje hiljada rub. -- prosječan životni vijek (određen pomoću ugrađene funkcije " PROSJEČNO»; adj. 1).

E rel pokazuje da su vrijednosti godišnjeg profita predviđene regresionom jednadžbom Y razlikuju se od stvarnih vrijednosti u prosjeku za 2,7%. Model ima visoka tačnost(pri - tačnost modela je visoka, pri - dobra, pri - zadovoljavajuća, pri - nezadovoljavajuća).

5. Za ekonomsku interpretaciju koeficijenata regresione jednadžbe, tabelarno prikazujemo prosječne vrijednosti i standardne devijacije varijable u izvornim podacima (tabela 4). Prosječne vrijednosti određivane su pomoću ugrađene funkcije "PROSJEK", standardne devijacije - korištenjem ugrađene funkcije "STANDARDNA DEVIATION" (vidi Dodatak 1).

Prema teritorijama juga federalni okrug Ruska Federacija daje podatke za 2011

Teritorije federalnog okruga

Bruto regionalni proizvod, milijarda rubalja, Y

Ulaganja u osnovna sredstva, milijarde rubalja, X1

1. Rep. Adygea

2. Rep. Dagestan

3. Rep. Ingušetija

4. Kabardino-Balkarska Republika

5. Rep. Kalmykia

6. Karachay-Cherkess Republic

7. Rep. Sjeverna Osetija - Alanija

8. Krasnodarski kraj)

9. Stavropoljski kraj

10. Astrahanska oblast.

11. Volgogradska oblast.

12. Rostov region.

  • 1. Izračunati matricu koeficijenata korelacije parova; procijeniti statističku značajnost koeficijenata korelacije.
  • 2. Konstruisati polje korelacije između efektivne karakteristike i faktora koji je najbliži njoj.
  • 3. Izračunajte parametre linearne regresije para za svaki faktor X..
  • 4. Procijeniti kvalitet svakog modela kroz koeficijent determinacije, prosječnu grešku aproksimacije i Fišerov F test. Odaberite najbolji model.

biće 80% toga maksimalna vrijednost. Grafički predstaviti: stvarne i modelne vrijednosti, prognoze.

  • 6. Koristeći višestruku regresiju korak po korak (metod isključenja ili metoda uključivanja), izgraditi model formiranja cijene stana zbog značajnih faktora. Dajte ekonomsku interpretaciju koeficijenata regresijskog modela.
  • 7. Ocijeniti kvalitet izrađenog modela. Da li se kvalitet modela poboljšao u odnosu na jednofaktorski model? Procijenite utjecaj značajnih faktora na rezultat koristeći koeficijente elastičnosti, u - i -? koeficijenti

Prilikom rješavanja ovog problema, proračuni i konstrukcija grafikona i dijagrama vršit će se korištenjem postavke Excel Analysis podaci.

1. Izračunajte matricu koeficijenata korelacije parova i procijenite statističku značajnost koeficijenata korelacije

U dijaloškom okviru Korelacija, u polju Interval unosa, unesite raspon ćelija koje sadrže izvorne podatke. Pošto smo odabrali i naslove kolona, ​​čekiramo polje za potvrdu Labels u prvom redu.

Dobili smo sljedeće rezultate:

Tabela 1.1 Matrica koeficijenata korelacije parova

Analiza matrice koeficijenata parne korelacije pokazuje da zavisna varijabla Y, odnosno bruto regionalni proizvod, ima bližu vezu sa X1 (ulaganje u stalni kapital). Koeficijent korelacije je 0,936. To znači da 93,6% zavisne varijable Y (bruto regionalni proizvod) zavisi od indikatora X1 (ulaganje u stalni kapital).

Odredićemo statističku značajnost koeficijenata korelacije koristeći Studentov t-test. Upoređujemo tabličnu vrijednost sa izračunatim vrijednostima.

Izračunajmo vrijednost tablice pomoću funkcije STUDISCOVER.

t tabela = 0,129 at verovatnoća poverenja jednak 0,9 i stepen slobode (n-2).

Faktor X1 je statistički značajan.

2. Konstruirajmo polje korelacije između efektivnog atributa (bruto regionalnog proizvoda) i faktora koji je najbliži njemu (ulaganje u fiksni kapital)

Da bismo to učinili, koristit ćemo Excel alat za dijagram raspršenosti.

Kao rezultat, dobijamo korelaciono polje za cenu bruto regionalnog proizvoda, milijardu rubalja. i ulaganja u osnovna sredstva, milijarde rubalja. (Slika 1.1.).

Slika 1.1

3. Izračunajte parametre linearne regresije para za svaki faktor X

Za izračunavanje parametara linearne parne regresije koristit ćemo alat Regresija uključen u postavku Analiza podataka.

U dijaloškom okviru Regresija, u polje Input interval Y unesite adresu raspona ćelija koje zavisna varijabla predstavlja. Na terenu

Ulaznim intervalom X unosimo adresu opsega koji sadrži vrijednosti nezavisnih varijabli. Izračunajmo parametre uparene regresije za faktor X.

Za X1 smo dobili sljedeće podatke prikazane u tabeli 1.2:

Tabela 1.2

Regresiona jednadžba za ovisnost cijene bruto regionalnog proizvoda od ulaganja u fiksni kapital ima oblik:

4. Ocijenimo kvalitet svakog modela kroz koeficijent determinacije, prosječnu grešku aproksimacije i Fišerov F-test. Hajde da ustanovimo koji je model najbolji.

Koeficijent determinacije, prosječnu grešku aproksimacije, dobili smo kao rezultat proračuna izvedenih u paragrafu 3. Dobijeni podaci prikazani su u sljedećim tabelama:

X1 podaci:

Tabela 1.3a

Tabela 1.4b

A) Koeficijent determinacije određuje koji se udio varijacije u osobini Y uzima u obzir u modelu i nastaje zbog utjecaja faktora X na to više vrijednosti koeficijent determinacije, bliža veza između karakteristika u konstruisanom matematičkom modelu.

IN Excel program označava R-kvadrat.

Na osnovu ovog kriterijuma, najadekvatniji model je regresiona jednačina zavisnosti cene bruto regionalnog proizvoda od ulaganja u fiksni kapital (X1).

B) Izračunavamo prosečnu grešku aproksimacije koristeći formulu:

gdje je brojnik zbir kvadrata odstupanja izračunatih vrijednosti od stvarnih. U tabelama se nalazi u koloni SS, Remaining line.

Prosječnu cijenu stana izračunavamo u Excelu koristeći funkciju PROSJEČNO. = 24,18182 milijarde rubalja.

Prilikom izvođenja ekonomskih proračuna model se smatra dovoljno tačnim ako prosečna greška aproksimacija je manja od 5%, model se smatra prihvatljivim ako je prosječna greška aproksimacije manja od 15%.

Prema ovom kriterijumu, najadekvatniji je matematički model za regresionu jednačinu zavisnosti cene bruto regionalnog proizvoda od ulaganja u fiksni kapital (X1).

C) F-test se koristi za testiranje značajnosti regresijskog modela. Da bi se to postiglo, pravi se poređenje kritičnih (tabelarnih) vrijednosti Fisher F testa.

Izračunate vrijednosti su date u tabelama 1.4b (označene slovom F).

Izračunat ćemo tabelarnu vrijednost Fisherovog F testa u Excelu koristeći FDIST funkciju. Uzmimo vjerovatnoću jednaku 0,05. Primljeno: = 4,75

Izračunate vrijednosti Fisherovog F testa za svaki faktor su uporedive s vrijednostima u tabeli:

71,02 > = 4,75 model je adekvatan prema ovom kriteriju.

Analizirajući podatke prema sva tri kriterijuma, možemo zaključiti da je najbolji matematički model izgrađen za faktor bruto regionalnog proizvoda koji je opisan linearnom jednadžbom

5. Za odabrani model zavisnosti cijene bruto regionalnog proizvoda

Predvidjeti ćemo prosječnu vrijednost indikatora na nivou značajnosti ako je predviđena vrijednost faktora 80% njegove maksimalne vrijednosti. Predstavimo to grafički: stvarne i modelne vrijednosti, prognoze.

Izračunajmo predviđenu vrijednost X prema uvjetu, to će biti 80% maksimalne vrijednosti;

Izračunajmo X max u Excelu koristeći funkciju MAX.

0,8 *52,8 = 42,24

Da bismo dobili prediktivne procjene zavisne varijable, dobijenu vrijednost nezavisne varijable zamjenjujemo u linearnu jednačinu:

5,07+2,14*42,24 = 304,55 milijardi rubalja.

Odredimo interval pouzdanosti prognoze, koji će imati sljedeće granice:

Da izračunam interval poverenja za predviđenu vrijednost izračunavamo odstupanje od linije regresije.

Za upareni regresijski model izračunava se vrijednost odstupanja:

one. vrijednost standardne greške iz Tabele 1.5a.

(Pošto je broj stepeni slobode jednak jedan, imenilac će biti jednak n-2). prognoza regresije korelacionih parova

Za izračunavanje koeficijenta koristićemo se Excel funkcija STUDISPOSIB, uzmimo vjerovatnoću jednaku 0,1, broj stupnjeva slobode je 38.

Izračunat ćemo vrijednost sa koristeći Excel, dobijamo 12294.


Odredimo gornju i donju granicu intervala.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Dakle, prognozirana vrijednost = 304,55 hiljada dolara biće između donje granice jednake 277,078 hiljada dolara. i gornja granica od 332,022 milijarde. Rub.

Stvarne i modelne vrijednosti, tačke prognoze prikazane su grafički na slici 1.2.


Slika 1.2

6. Koristeći višestruku regresiju korak po korak (metod eliminacije) izgradićemo model formiranja cijene bruto regionalnog proizvoda zbog značajnih faktora

Da bismo izgradili višestruku regresiju, koristićemo funkciju regresije programa Excel, uključujući sve faktore. Kao rezultat, dobijamo tabele rezultata iz kojih nam je potreban Studentov t-test.

Tabela 1.8a

Tabela 1.8b

Tabela 1.8c.

Dobijamo model kao što je:

Pošto< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Odaberemo najmanju apsolutnu vrijednost Studentovog t-testa, jednaka je 8,427, uporedimo je sa vrijednošću tabele, koju izračunavamo u Excelu, uzmimo nivo značajnosti jednak 0,10, broj stupnjeva slobode n-m-1= 12-4=8: =1,8595

Od 8.427>1.8595 model treba smatrati adekvatnim.

7. Za procjenu značajnog faktora rezultirajućeg matematičkog modela izračunavamo koeficijente elastičnosti, i - koeficijente

Koeficijent elastičnosti pokazuje za koji procenat će se efektivni atribut promijeniti kada se atribut faktora promijeni za 1%:

E X4 = 2,137 * (10,69/24,182) = 0,94%

Odnosno, sa povećanjem ulaganja u fiksni kapital od 1%, trošak se u prosjeku povećava za 0,94%.

Koeficijent pokazuje za koji dio standardne devijacije se mijenja prosječna vrijednost zavisne varijable s promjenom nezavisne varijable za jednu standardnu ​​devijaciju.

2,137* (14.736/33,632) = 0,936.

Prosječni podaci kvadratna odstupanja preuzeto iz tabela dobijenih pomoću alata Deskriptivna statistika.

Tabela 1.11 Deskriptivna statistika (Y)

Tabela 1.12 Deskriptivna statistika (X4)

Koeficijent određuje udio utjecaja faktora u ukupnom utjecaju svih faktora:

Da bismo izračunali koeficijente korelacije parova, izračunavamo matricu koeficijenata korelacije para u Excelu koristeći alatku Korelacija postavki za analizu podataka.

Tabela 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Zaključak: Iz dobijenih proračuna možemo zaključiti da efektivni atribut Y (bruto regionalni proizvod) ima veliku zavisnost od faktora X1 (ulaganje u fiksni kapital) (za 100%).

Reference

  • 1. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ekonometrija. Početni kurs. Tutorial. 2nd ed. - M.: Delo, 1998. - str. 69 - 74.
  • 2. Radionica o ekonometriji: Udžbenik / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko i dr. 2002. - str. 49 - 105.
  • 3. Dougherty K. Uvod u ekonometriju: Transl. sa engleskog - M.: INFRA-M, 1999. - XIV, str. 262 - 285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Primijenjena matematika i osnove ekonometrije. -1998., str. 115-147.
  • 5. Kremer N.Sh., Putko B.A. Ekonometrija. -2007. od 175-251.