Biografije Karakteristike Analiza

Procjena značaja regresione jednačine se vrši na osnovu. Procjena statističke značajnosti regresione jednačine i njenih parametara

U socio-ekonomskim istraživanjima često se mora raditi u uslovima ograničene populacije, ili sa selektivnim podacima. Pa posle matematičkih parametara regresiona jednačina treba da ih i jednadžbu u cjelini procijeni na statističku značajnost, tj. potrebno je osigurati da se rezultirajuća jednačina i njeni parametri formiraju pod utjecajem neslučajnih faktora.

Prije svega, procjenjuje se statistička značajnost jednačine u cjelini. Evaluacija se obično provodi korištenjem Fisherovog F-testa. Proračun F-kriterijuma se zasniva na pravilu sabiranja varijansi. Naime, opći znak varijanse-rezultat = faktorska varijansa + rezidualna varijansa.

stvarna cijena

Teorijska cijena
Izgradnjom regresione jednačine moguće je izračunati teorijsku vrijednost predznaka-rezultata, tj. izračunato regresionom jednadžbom uzimajući u obzir njene parametre.

Ove vrijednosti će karakterizirati znak-rezultat formiran pod utjecajem faktora uključenih u analizu.

Uvijek postoje neslaganja (reziduali) između stvarnih vrijednosti atributa rezultata i onih izračunatih na osnovu jednadžbe regresije, zbog utjecaja drugih faktora koji nisu uključeni u analizu.

Razlika između teorijske i stvarne vrijednosti atributa-rezultata naziva se reziduali. Opšta varijacija znak rezultata:

Varijacija u osobini-rezultatu, zbog varijacije u osobinama faktora uključenih u analizu, procjenjuje se poređenjem teorijskih vrijednosti rezultata. karakteristika i njene srednje vrijednosti. Preostala varijacija kroz poređenje teoretskih i stvarnih vrijednosti rezultirajuće karakteristike. Ukupna varijansa, rezidualni i stvarni imaju različit broj stupnjeva slobode.

general, P- broj jedinica u proučavanoj populaciji

stvarni, P- broj faktora uključenih u analizu

Ostatak

Fisherov F-test se izračunava kao omjer prema , i izračunava se za jedan stepen slobode.

Upotreba Fišerovog F-testa kao procene statističkog značaja jednačine regresije je vrlo logična. je rezultat. osobina, zbog faktora uključenih u analizu, tj. ovo je proporcija objašnjenog rezultata. sign. - ovo je (varijacija) predznaka rezultata zbog faktora čiji se uticaj ne uzima u obzir, tj. nije uključeno u analizu.

To. F-kriterijum je dizajniran za evaluaciju značajan višak preko . Ako nije značajno niži od , a još više ako prelazi , dakle, analiza ne uključuje one faktore koji stvarno utiču na atribut rezultata.

Fisherov F-test je tabelarno, stvarna vrijednost se upoređuje sa tabelom. Ako je , tada se jednačina regresije smatra statistički značajnom. Ako, naprotiv, jednačina nije statistički značajna i ne može se koristiti u praksi, značajnost jednačine u cjelini ukazuje na statističku značajnost pokazatelja korelacije.

Nakon ocjene jednačine u cjelini, potrebno je ocijeniti statističku značajnost parametara jednačine. Ova procjena je napravljena korištenjem Studentove t-statistike. T-statistika se izračunava kao omjer parametara jednadžbe (modulo) i njihove standardne srednje kvadratne greške. Ako se evaluira jednofaktorski model, tada se izračunavaju 2 statistike.

U svemu kompjuterski programi izračunavanje standardne greške i t-statistike za parametre se vrši uz proračun samih parametara. T-statistika je tabelarno prikazana. Ako je vrijednost , tada se parametar smatra statistički značajnim, tj. nastala pod uticajem neslučajnih faktora.

Izračunavanje t-statistike u suštini znači testiranje nulte hipoteze da je parametar beznačajan, tj. njegova jednakost na nulu. Kod jednofaktorskog modela vrednuju se 2 hipoteze: i

Nivo značaja prihvatanja nulte hipoteze zavisi od nivoa prihvaćene nivo samopouzdanja. Dakle, ako istraživač specificira nivo vjerovatnoće od 95%, izračunat će se nivo značajnosti prihvatljivosti, dakle, ako je nivo značajnosti ≥ 0,05, onda je prihvaćen i parametri se smatraju statistički beznačajnim. Ako je , tada se alternativa odbija i prihvaća: i .

Statistički paketi aplikacija takođe pružaju nivo značaja prihvatanja nulte hipoteze. Procjena značaja jednačine regresije i njenih parametara može dati sljedeće rezultate:

Prvo, jednačina u cjelini je značajna (prema F-testu) i svi parametri jednačine su također statistički značajni. To znači da se rezultirajuća jednačina može koristiti i za izradu upravljačke odluke kao i za prognoziranje.

Drugo, prema F-kriterijumu, jednačina je statistički značajna, ali barem jedan od parametara jednačine nije značajan. Jednačina se može koristiti za donošenje upravljačkih odluka u vezi sa analiziranim faktorima, ali se ne može koristiti za predviđanje.

Treće, jednačina nije statistički značajna, ili je jednačina značajna prema F-kriterijumu, ali svi parametri rezultirajuće jednačine nisu značajni. Jednačina se ne može koristiti ni u koju svrhu.

Da bi se jednačina regresije prepoznala kao model odnosa između predznaka rezultata i predznaka faktora, potrebno je da svi kritični faktori, koji određuju rezultat, tako da smislena interpretacija parametara jednačine odgovara teorijski utemeljenim odnosima u fenomenu koji se proučava. Koeficijent determinacije R 2 mora biti > 0,5.

Prilikom izgradnje višestruka jednačina regresije, preporučljivo je izvršiti procjenu takozvanim prilagođenim koeficijentom determinacije (R 2). Vrijednost R2 (kao i korelacije) raste sa povećanjem broja faktora uključenih u analizu. Vrijednost koeficijenata je posebno precijenjena u uslovima male populacije. Da bi se isplatio negativan uticaj R 2 i korelacije se koriguju za broj stepena slobode, tj. broj slobodno promjenjivih elemenata kada su uključeni određeni faktori.

Prilagođeni koeficijent determinacije

P– postaviti veličinu/broj opažanja

k– broj faktora uključenih u analizu

n-1 je broj stepeni slobode

(1-R2)- vrijednost preostale/neobjašnjive varijanse rezultirajućeg atributa

Uvek manje R2. na osnovu, mogu se uporediti procjene jednačina sa drugačiji broj analiziranih faktora.

34. Problemi proučavanja vremenskih serija.

Nizovi dinamike se nazivaju vremenske serije ili vremenske serije. Dinamička serija je vremenski poređani niz indikatora koji karakterišu određenu pojavu (obim BDP-a od 90 do 98 godina). Svrha proučavanja niza dinamike je da se identifikuju obrasci u razvoju fenomena koji se proučava (glavni trend) i da se na osnovu toga prognozira. Iz definicije RD proizilazi da se svaka serija sastoji od dva elementa: vremena t i nivoa serije (one specifične vrijednosti indikatora na osnovu kojih se DR serija gradi). DR serije mogu biti 1) trenutne - serije čiji su indikatori fiksirani u određenom trenutku, u određeni datum, 2) interval - serije, čiji se indikatori dobijaju za određeni vremenski period (1. stanovništvo Sankt Peterburga, 2. BDP za period). Podjela serije na trenutne i intervalne je neophodna, jer to određuje specifičnosti izračunavanja nekih pokazatelja serije DR. Sumiranje nivoa intervalne serije daje smisleno interpretiran rezultat, što se ne može reći za zbir nivoa trenutnih serija, budući da potonji sadrže ponovljeno brojanje. Najvažniji problem u analizi vremenskih serija je problem uporedivosti nivoa serije. Ovaj koncept je veoma raznovrstan. Nivoi bi trebali biti uporedivi u smislu metoda obračuna iu pogledu teritorije i obuhvata populacijskih jedinica. Ako je serija DR izgrađena u smislu troškova, onda bi svi nivoi trebali biti prikazani ili izračunati u uporedivim cijenama. Prilikom konstruisanja intervalnih serija, nivoi treba da karakterišu iste vremenske periode. Prilikom izgradnje momenta serije D, nivoi moraju biti fiksirani na isti datum. Redovi mogu biti potpuni ili nepotpuni. Nepotpune serije se koriste u službenim publikacijama (1980,1985,1990,1995,1996,1997,1998,1999…). Kompleksna analiza RD uključuje proučavanje sljedećih tačaka:

1. izračunavanje indikatora promjena nivoa RD

2. obračun prosječnih pokazatelja RD

3. identifikacija glavnog trenda serije, izgradnja trend modela

4. Procjena autokorelacije u RD, konstrukcija autoregresivnih modela

5. korelacija RD

6. RD prognoza.

35. Indikatori promjene nivoa vremenskih serija .

AT opšti pogled Red se može predstaviti:

y je nivo DR, t je trenutak ili vremenski period na koji se nivo (indikator) odnosi, n je dužina DR serije (broj perioda). pri proučavanju niza dinamike računaju se sljedeći pokazatelji: 1. apsolutni rast, 2. faktor rasta (stopa rasta), 3. ubrzanje, 4. faktor rasta (stopa rasta), 5. apsolutna vrijednost povećanje od 1%. Izračunati indikatori mogu biti: 1. lančani - dobijeni poređenjem svakog nivoa serije sa prethodnim, 2. osnovni - dobijeni poređenjem sa nivoom odabranim kao baza za poređenje (osim ako nije drugačije naznačeno, 1. nivo serije se uzima kao osnova). 1. Lanac apsolutnih dobitaka:. Pokazuje koliko više ili manje. Lančana apsolutna povećanja nazivaju se indikatorima stope promjene nivoa dinamičke serije. Osnovni apsolutni rast: . Ako su nivoi serije relativne performanse, izraženo u %, tada se apsolutno povećanje izražava u tačkama promjene. 2. faktor rasta (stopa rasta): Izračunava se kao omjer nivoa serije prema prethodnim (lančani faktori rasta), ili prema nivou koji se uzima kao baza za poređenje (osnovni faktori rasta): . Karakterizira koliko puta svaki nivo serije > ili< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. na osnovu apsolutnog rasta izračunava se indikator - ubrzanje apsolutnog rasta: . Ubrzanje je apsolutni rast apsolutnih prirasta. Procjenjuje kako se sami priraštaji mijenjaju, jesu li stabilni ili se ubrzavaju (povećavaju). 4. stopa rasta je omjer rasta prema bazi poređenja. Izraženo u %: ; . Stopa rasta je stopa rasta minus 100%. Pokazuje koliko dati nivo red > ili< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Izračunavanje prosječnih pokazatelja RD Izračunajte prosječne nivoe serije, prosječne apsolutne dobitke, prosječnu stopu rasta i prosječnu stopu rasta. Prosječni indikatori se izračunavaju kako bi se sumirali podaci i kako bi se mogli uporediti nivoi i indikatori njihove promjene u različitim serijama. 1. srednji nivo red a) za intervalne vremenske serije izračunava se jednostavnom aritmetičkom sredinom: , gdje je n broj nivoa u vremenskoj seriji; b) za serije trenutaka, prosječni nivo se izračunava prema specifičnoj formuli, koja se naziva hronološki prosjek: . 2. prosječan apsolutni rast izračunava se na osnovu apsolutnih prirasta lanca prema jednostavnoj aritmetičkoj sredini:

. 3. Prosječni koeficijent rast izračunato na osnovu faktora rasta lanca koristeći formulu geometrijske sredine: . Kada se komentarišu prosječni pokazatelji serije DR, potrebno je naznačiti 2 tačke: period koji karakteriše analizirani indikator i vremenski interval za koji se DR serija gradi. 4. Prosječna stopa rasta: . 5. prosječna stopa rasta: .

Za procjenu značajnosti, značajnosti koeficijenta korelacije, koristi se Studentov t-test.

Prosječna greška koeficijenta korelacije nalazi se po formuli:

H
a na osnovu greške izračunava se t-test:

Izračunata vrijednost t-testa se upoređuje sa tabelarnom vrijednošću koja se nalazi u Studentovoj tabeli raspodjele na nivou značajnosti od 0,05 ili 0,01 i broju stupnjeva slobode n-1. Ako je izračunata vrijednost t-testa veća od tabelarne, tada se koeficijent korelacije prepoznaje kao značajan.

Kod krivolinijskog odnosa, F-kriterijum se koristi za procjenu značaja korelacijske veze i jednačine regresije. Izračunava se po formuli:

ili

gdje je η odnos korelacije; n je broj zapažanja; m je broj parametara u jednadžbi regresije.

Izračunata vrijednost F upoređuje se sa tabelarnom vrijednošću za prihvaćeni nivo značajnosti α (0,05 ili 0,01) i broj stupnjeva slobode k 1 =m-1 i k 2 =n-m. Ako izračunata vrijednost F premašuje vrijednost u tabeli, odnos se priznaje kao značajan.

Značajnost koeficijenta regresije utvrđuje se pomoću Studentovog t-testa, koji se izračunava po formuli:

gdje je σ 2 i i varijansa koeficijenta regresije.

Izračunava se po formuli:

gdje je k broj faktorskih karakteristika u jednadžbi regresije.

Koeficijent regresije se priznaje kao značajan ako je t a 1 ≥t cr. t cr se nalazi u tabeli kritičnih tačaka Studentove distribucije na prihvaćenom nivou značajnosti i broju stepena slobode k=n-1.

4.3 Korelaciono-regresiona analiza u Excel-u

Izvršimo korelaciono-regresijsku analizu odnosa između prinosa i troškova rada po 1 kvintalu zrna. Da biste to učinili, otvorite Excel list, u ćelije A1: A30 unesite vrijednosti atributa faktora produktivnost žitarica, u ćelijama B1: B30 vrijednosti efektivnog svojstva - troškovi rada po 1 kvintalu zrna. Iz menija Alati izaberite opciju Analiza podataka. Lijevim klikom na ovu stavku otvorit će se alat Regresija. Kliknite na dugme OK, dijaloški okvir Regresija se pojavljuje na ekranu. U polje Input interval Y unesite vrijednosti rezultirajućeg atributa (istaknute ćelije B1:B30), u polje Input interval X unesite vrijednosti atributa faktora (istaknute ćelije A1:A30). Označavamo nivo vjerovatnoće od 95%, izaberite Novi radni list. Kliknemo na dugme OK. Na radnom listu se pojavljuje tabela „RESULTS“ u kojoj su dati rezultati izračunavanja parametara regresione jednačine, koeficijenta korelacije i drugih pokazatelja, koji vam omogućavaju da odredite značaj koeficijenta korelacije i parametara regresione jednačine.

REZULTATI

Statistika regresije

Višestruki R

R-kvadrat

Normalizirani R-kvadrat

standardna greška

Zapažanja

Analiza varijanse

Značaj F

Regresija

Odds

standardna greška

t-statistika

P-vrijednost

donjih 95%

Top 95%

Donji 95,0%

Top 95,0%

Y-raskrsnica

Varijabla X 1

U ovoj tabeli, "Multiple R" je koeficijent korelacije, "R-squared" je koeficijent determinacije. "Koeficijenti: Y-presjek" - slobodni član regresione jednačine 2,836242; "Varijabla X1" - koeficijent regresije -0,06654. Postoje i vrijednosti Fišerovog F-testa 74,9876, Studentovog t-testa 14,18042, " standardna greška 0,112121”, koji su neophodni za procjenu značajnosti koeficijenta korelacije, parametara jednačine regresije i cijele jednačine.

Na osnovu podataka u tabeli, konstruišemo jednadžbu regresije: y x ​​= 2,836-0,067x. Koeficijent regresije a 1 = -0,067 znači da se povećanjem prinosa zrna za 1 kvintalu/ha troškovi rada po 1 kvintalu zrna smanjuju za 0,067 čovjek-sati.

Koeficijent korelacije r=0,85>0,7, dakle, veza između proučavanih karakteristika u ovoj populaciji je bliska. Koeficijent determinacije r 2 =0,73 pokazuje da je 73% varijacije efektivnog svojstva (troškovi rada po 1 centneru zrna) uzrokovano djelovanjem faktorskog svojstva (prinos zrna).

Table kritične tačke distribucije Fisher - Snedecor, nalazimo kritičnu vrijednost F-kriterijuma na nivou značajnosti od 0,05 i broju stupnjeva slobode k 1 =m-1=2-1=1 i k 2 =n-m=30-2 =28, jednako je 4,21. Budući da je izračunata vrijednost kriterija veća od vrijednosti u tabeli (F=74,9896>4,21), regresiona jednačina se prepoznaje kao značajna.

Da bismo procenili značaj koeficijenta korelacije, izračunavamo Studentov t-test:

AT
U tabeli kritičnih tačaka Studentove distribucije nalazimo kritičnu vrednost t-testa na nivou značajnosti 0,05 i broj stepena slobode n-1=30-1=29, jednak je 2,0452. Kako je izračunata vrijednost veća od tabelarne, koeficijent korelacije je značajan.

Da bi se provjerila značajnost, analizira se omjer koeficijenta regresije i njegove standardne devijacije. Ovaj odnos je Studentova distribucija, odnosno da bismo odredili značajnost koristimo t - kriterijum:

- SKO od rezidualne disperzije;

- zbir odstupanja od srednje vrijednosti

Ako t trke. >t tab. , tada je koeficijent b i značajan.

Interval pouzdanosti je određen formulom:

POSTUPAK RADA

    Početne podatke uzeti prema varijanti rada (prema broju učenika u časopisu). Naveden je statički kontrolni objekt sa dva ulaza X 1 , X 2 i jedan izlaz Y. Na objektu je izveden pasivni eksperiment i dobijen je uzorak od 30 tačaka koji sadrži vrijednosti X 1 , X 2 i Y za svaki eksperiment.

    Otvorite novu datoteku u programu Excel 2007. Unesite pozadinske informacije u kolone izvorne tabele - vrednosti ulaznih varijabli X 1 , X 2 i izlazna varijabla Y.

    Pripremite dodatne dvije kolone za unos izračunatih vrijednosti Y i ostaci.

    Pozovite program "Regresija": Podaci / Analiza podataka / Regresija.

Rice. 1. Dijaloški okvir "Analiza podataka".

    Unesite u dijaloški okvir "Regresija" adrese izvornih podataka:

    ulazni interval Y, ulazni interval X (2 kolone),

    postavite nivo pouzdanosti na 95%,

    u opciji "Izlazni interval, navedite gornju lijevu ćeliju mjesta gdje se izlaze podaci regresione analize (prva ćelija na radnom listu od 2 stranice),

    omogućite opcije "Ostaci" i "Graf ostataka",

    pritisnite dugme OK za pokretanje regresiona analiza.

Rice. 2. Dijaloški okvir "Regresija".

    Excel će prikazati 4 tabele i 2 grafikona reziduala naspram varijabli X1 i x2.

    Formatirajte tabelu "Izlaz ukupnih vrednosti" - proširite kolonu sa nazivima izlaznih podataka, napravite 3 značajne cifre iza decimalne tačke u drugoj koloni.

    Formatirajte tabelu "ANOVA" - olakšajte čitanje i razumevanje broja značajnih cifara iza zareza, skratite nazive varijabli i prilagodite širinu kolona.

    Formatirajte tabelu koeficijenata jednadžbe - skratite nazive varijabli i prilagodite širinu kolona ako je potrebno, učinite broj značajnih cifara pogodnim za čitanje i razumijevanje, izbrišite zadnje 2 kolone (vrijednosti ​​i tabelu markup).

    Prenesite podatke iz tabele "Izlaz ostataka" u pripremljene kolone izvorne tabele, a zatim obrišite tabelu "Izlaz ostataka" (opcija "Posebno umetanje").

    Unesite rezultirajuće procjene koeficijenata u originalnu tabelu.

    Povucite tabele rezultata na vrh stranice što je više moguće.

    Napravite grafikone ispod tabela Yexp, Ycalc i greške prognoze (rezidualne).

    Formatirajte rezidualne grafikone. Na osnovu dobijenih grafika proceniti ispravnost modela po ulazima X1, X2.

    Odštampajte rezultate regresione analize.

    Baviti se rezultatima regresione analize.

    Pripremite izvještaj o radu.

PRIMJER RADA

Metoda izvođenja regresione analize u EXCEL paketu prikazana je na slikama 3-5.

Rice. 3. Primjer regresione analize u EXCEL paketu.


Fig.4. Pločice varijabilnih reziduala X1, X2

Rice. 5. Grafovi Yexp,Ycalc i greške prognoze (rezidualne).

Prema regresionoj analizi možemo reći:

1. Jednačina regresije dobijena korištenjem Excela ima oblik:

    Koeficijent determinacije:

Varijacija rezultata od 46,5% objašnjava se varijacijom faktora.

    Opšti F-test testira hipotezu o statističkoj značajnosti regresione jednačine. Analiza se vrši upoređivanjem stvarnih i tabelarnih vrijednosti Fisherovog F-testa.

Pošto stvarna vrijednost premašuje tabelu
, onda zaključujemo da je rezultirajuća regresiona jednačina statistički značajna.

    Koeficijent višestruka korelacija:

    b 0 :

t tab. (29, 0,975)=2,05

b 0 :

Interval povjerenja:

    Odredite interval pouzdanosti za koeficijent b 1 :

Provjera značajnosti koeficijenta b 1 :

t races >t tab. , koeficijent b 1 je značajan

Interval povjerenja:

    Odredite interval pouzdanosti za koeficijent b 2 :

Test značajnosti za koeficijent b 2 :

Odredite interval pouzdanosti:

OPCIJE ZADATAKA

Tabela 2. Opcije zadatka

broj opcije

Efikasan znak Y i

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 2

Y 2

Y 2

Y 2

Y 2

faktor broj X i

faktor broj X i

Tabela 1 se nastavlja

broj opcije

Efikasan znak Y i

Y 2

Y 2

Y 2

Y 2

Y 2

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

faktor broj X i

faktor broj X i

Tabela 3. Početni podaci

Y 1

Y 2

Y 3

X 1

X 2

X 3

X 4

X 5

PITANJA ZA SAMOPROVERU

    Problemi regresione analize.

    Preduvjeti za regresijsku analizu.

    Osnovna jednačina analiza varijanse.

    Šta pokazuje Fisherov F-razmjer?

    Kako se utvrđuje vrijednost tabele Fišerov kriterijum?

    Šta pokazuje koeficijent determinacije?

    Kako odrediti značajnost koeficijenata regresije?

    Kako odrediti interval pouzdanosti koeficijenata regresije?

    Kako odrediti izračunatu vrijednost t-testa?

    Kako odrediti tabelarnu vrijednost t-testa?

    Formulirajte glavnu ideju analize varijanse, za koje je zadatke najefikasnija?

    Koje su glavne teorijske premise analize varijanse?

    Napravite dekompoziciju ukupan iznos kvadratne devijacije za komponente u analizi varijanse.

    Kako dobiti procjene varijanse iz zbira kvadrata odstupanja?

    Kako se dobijaju traženi stepeni slobode?

    Kako se utvrđuje standardna greška?

    Objasnite shemu dvosmjerne analize varijanse.

    Kako se unakrsna klasifikacija razlikuje od hijerarhijske klasifikacije?

    Kako se uravnoteženi podaci razlikuju?

Izvještaj je sastavljen u Word uređivaču teksta na papiru A4 GOST 6656-76 (210x297 mm) i sadrži:

    Naziv laboratorije.

    Cilj.

  1. Rezultati proračuna.

VRIJEME DOZVOLJENO ZA ZAVRŠETAK

LABORATORIJSKI RAD

Priprema za rad - 0,5 akad. sati.

Učinak radova - 0,5 akad. sati.

Računarski proračuni - 0,5 akad. sati.

Prijava rada - 0,5 akad. sati.

Književnost

    Identifikacija kontrolnih objekata. / A. D. Semenov, D. V. Artamonov, A. V. Bryukhachev. Tutorial. - Penza: PGU, 2003. - 211 str.

    Osnove Statistička analiza. Radionica na statističke metode i operativno istraživanje koristeći STATISTIC i EXCEL pakete. / Vukolov E.A. Tutorial. - M.: FORUM, 2008. - 464 str.

    Osnove teorije identifikacije objekata upravljanja. / AA. Ignatiev, S.A. Ignatiev. Tutorial. - Saratov: SGTU, 2008. - 44 str.

    Teorija vjerovatnoće i matematička statistika u primjerima i zadacima koristeći EXCEL. / G.V. Gorelova, I.A. Katsko. - Rostov n/a: Phoenix, 2006. - 475 str.

    Svrha rada 2

    Osnovni koncepti 2

    Radni nalog 6

    Primjer rada 9

    Pitanja za samokontrolu 13

    Vrijeme predviđeno za rad 14

    Možete provjeriti značaj parametara regresione jednadžbe koristeći t-statistiku.

    vježba:
    Za grupu preduzeća koja proizvode istu vrstu proizvoda, razmatraju se funkcije troškova:
    y = α + βx;
    y = α x β ;
    y = α β x ;
    y = α + β / x;
    gdje je y trošak proizvodnje, hiljada cu.
    x - izlaz, hiljada jedinica.

    Obavezno:
    1. Izgradite uparene regresione jednadžbe y iz x:

    • linearno;
    • snaga;
    • indikativno;
    • jednakostranična hiperbola.
    2. Izračunajte linearni koeficijent korelacija parova i koeficijent determinacije. Izvucite zaključke.
    3. Procijeniti statistički značaj regresione jednačine u cjelini.
    4. Procijeniti statistički značaj parametara regresije i korelacije.
    5. Izvršite prognozu troškova proizvodnje sa prognoziranim učinkom od 195% prosječnog nivoa.
    6. Procijenite tačnost prognoze, izračunajte grešku prognoze i njen interval pouzdanosti.
    7. Procijenite model do kraja prosečna greška aproksimacije.

    Odluka:

    1. Jednačina ima oblik y = α + βx
    1. Parametri regresione jednadžbe.
    Prosjeci

    Disperzija

    standardna devijacija

    Koeficijent korelacije

    Veza između faktora X osobine Y je jaka i direktna
    Regresijska jednačina

    Koeficijent determinacije
    R 2 = 0,94 2 = 0,89, tj. u 88,9774% slučajeva promjene x dovode do promjene y. Drugim riječima - tačnost odabira regresione jednačine je visoka

    x y x2 y2 x y y(x) (y-y cp) 2 (y-y(x)) 2 (x-x p) 2
    78 133 6084 17689 10374 142.16 115.98 83.83 1
    82 148 6724 21904 12136 148.61 17.9 0.37 9
    87 134 7569 17956 11658 156.68 95.44 514.26 64
    79 154 6241 23716 12166 143.77 104.67 104.67 0
    89 162 7921 26244 14418 159.9 332.36 4.39 100
    106 195 11236 38025 20670 187.33 2624.59 58.76 729
    67 139 4489 19321 9313 124.41 22.75 212.95 144
    88 158 7744 24964 13904 158.29 202.51 0.08 81
    73 152 5329 23104 11096 134.09 67.75 320.84 36
    87 162 7569 26244 14094 156.68 332.36 28.33 64
    76 159 5776 25281 12084 138.93 231.98 402.86 9
    115 173 13225 29929 19895 201.86 854.44 832.66 1296
    0 0 0 16.3 20669.59 265.73 6241
    1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

    Napomena: vrijednosti y(x) se nalaze iz rezultirajuće regresijske jednadžbe:
    y(1) = 4,01*1 + 99,18 = 103,19
    y(2) = 4,01*2 + 99,18 = 107,2
    ... ... ...

    2. Procjena parametara jednadžbe regresije
    Značaj koeficijenta korelacije

    Prema Studentovoj tabeli nalazimo Ttable
    T tablica (n-m-1; α / 2) = (11; 0,05 / 2) = 1,796
    Pošto je Tobs > Ttabl, odbacujemo hipotezu da je koeficijent korelacije jednak 0. Drugim riječima, koeficijent korelacije je statistički značajan.

    Analiza tačnosti određivanja procjena regresijskih koeficijenata





    Sa = 0,1712
    Intervali povjerenja za zavisnu varijablu

    Izračunajmo granice intervala u kojima će 95% mogućih vrijednosti Y biti koncentrisano neograničeno veliki brojevi zapažanja i X = 1
    (-20.41;56.24)
    Testiranje hipoteza o koeficijentima linearna jednačina regresija
    1) t-statistika


    Potvrđena je statistička značajnost koeficijenta regresije a

    Statistička značajnost koeficijenta regresije b nije potvrđena
    Interval povjerenja za koeficijente regresione jednadžbe
    Hajde da definišemo intervali povjerenja koeficijenti regresije, koji će sa pouzdanošću od 95% biti sljedeći:
    (a - t S a ; a + t S a)
    (1.306;1.921)
    (b - t b S b ; b + t b S b)
    (-9.2733;41.876)
    gdje je t = 1,796
    2) F-statistika


    fkp = 4,84
    Pošto je F > Fkp, koeficijent determinacije je statistički značajan