Biograafiad Omadused Analüüs

Regressioonivõrrandi olulisuse hindamine viiakse läbi selle alusel. Regressioonivõrrandi ja selle parameetrite statistilise olulisuse hindamine

Sotsiaal-majanduslikes uuringutes tuleb sageli töötada piiratud populatsioonis või valikuliste andmetega. Nii et pärast matemaatilised parameetrid regressioonivõrrand vajab neid ja võrrandit tervikuna statistilise olulisuse jaoks hindama, s.o. tuleb veenduda, et saadud võrrand ja selle parameetrid moodustuvad mittejuhuslike tegurite mõjul.

Kõigepealt hinnatakse võrrandi kui terviku statistilist olulisust. Hindamine viiakse tavaliselt läbi Fisheri F-testi abil. F-kriteeriumi arvutamine põhineb dispersioonide liitmise reeglil. Nimelt ülddispersiooni märk-tulemus = faktori dispersioon + jääkvariantsus.

tegelik hind

Teoreetiline hind
Olles koostanud regressioonivõrrandi, on võimalik arvutada märk-tulemuse teoreetiline väärtus, s.o. arvutatakse regressioonivõrrandiga, võttes arvesse selle parameetreid.

Need väärtused iseloomustavad analüüsis kaasatud tegurite mõjul moodustunud märk-tulemust.

Tulemuse atribuudi tegelike väärtuste ja regressioonivõrrandi alusel arvutatud väärtuste vahel on alati lahknevusi (jääknäitajad), mis on tingitud muude analüüsis mittekahjuvate tegurite mõjust.

Atribuudi-tulemuse teoreetiliste ja tegelike väärtuste erinevust nimetatakse jääkväärtusteks. Üldine variatsioon tulemus-märk:

Analüüsis kaasatud tegurite tunnuste varieerumisest tingitud tunnuse-tulemuse varieeruvust hinnatakse tulemuse teoreetiliste väärtuste võrdluse kaudu. omadus ja selle keskmised väärtused. Jääkvariatsioon saadud tunnuse teoreetiliste ja tegelike väärtuste võrdluse kaudu. Kogu dispersioon, jääk- ja tegelikul on erinev vabadusastmete arv.

üldine, P- ühikute arv uuritavas populatsioonis

tegelik, P- analüüsi kaasatud tegurite arv

Jääk

Fisheri F-test arvutatakse suhtena ja arvutatakse ühe vabadusastme jaoks.

Fisheri F-testi kasutamine regressioonivõrrandi statistilise olulisuse hinnanguna on väga loogiline. on tulemus. omadus, tulenevalt analüüsi kaasatud teguritest, s.o. see on seletatud tulemuse osakaal. märk. - see on tulemuse märgi (variatsioon) tingitud teguritest, mille mõju ei võeta arvesse, s.t. analüüsi ei kaasatud.

See. F-kriteerium on mõeldud hindamiseks märkimisväärne liig üle . Kui see ei ole oluliselt madalam kui , ja veelgi enam, kui see ületab , siis analüüs ei hõlma neid tegureid, mis tegelikult mõjutavad tulemuse atribuuti.

Fisheri F-test on tabelina toodud, tegelikku väärtust võrreldakse tabeliga. Kui , siis peetakse regressioonivõrrandit statistiliselt oluliseks. Kui võrrand ei ole vastupidi statistiliselt oluline ja seda ei saa praktikas kasutada, näitab võrrandi kui terviku olulisus korrelatsiooninäitajate statistilist olulisust.

Peale võrrandi kui terviku hindamist on vaja hinnata võrrandi parameetrite statistilist olulisust. See hinnang on tehtud Studenti t-statistika abil. T-statistika arvutatakse võrrandi parameetrite (mooduli) suhtena nende standardse keskmise ruutveaga. Kui hinnata ühefaktorilist mudelit, siis arvutatakse 2 statistikat.

Kõik arvutiprogrammid parameetrite standardvea ja t-statistika arvutamine toimub parameetrite endi arvutamisega. T-statistika on tabelina esitatud. Kui väärtus on , siis loetakse parameetrit statistiliselt oluliseks, s.t. moodustuvad mittejuhuslike tegurite mõjul.

T-statistika arvutamine tähendab sisuliselt nullhüpoteesi testimist, et parameeter on ebaoluline, s.t. selle võrdus nulliga. Ühefaktorilise mudeliga hinnatakse 2 hüpoteesi: ja

Nullhüpoteesi aktsepteerimise olulisuse tase sõltub aktsepteerimise tasemest usalduse tase. Seega, kui uurija määrab tõenäosustasemeks 95%, siis arvutatakse aktsepteeritav olulisuse tase, seega kui olulisuse tase ≥ 0,05, siis see aktsepteeritakse ja parameetrid loetakse statistiliselt ebaolulisteks. Kui , siis alternatiiv lükatakse tagasi ja aktsepteeritakse: ja .

Statistiliste rakenduste paketid annavad ka aktsepteerimise olulisuse taseme nullhüpoteesid. Regressioonivõrrandi ja selle parameetrite olulisuse hindamine võib anda järgmised tulemused:

Esiteks on võrrand tervikuna oluline (F-testi järgi) ja kõik võrrandi parameetrid on ka statistiliselt olulised. See tähendab, et saadud võrrandit saab kasutada mõlema tegemiseks juhtimisotsused samuti prognoosimiseks.

Teiseks, F-kriteeriumi järgi on võrrand statistiliselt oluline, kuid vähemalt üks võrrandi parameetritest ei ole oluline. Võrrandit saab kasutada analüüsitavate tegurite kohta juhtimisotsuste tegemiseks, kuid seda ei saa kasutada prognoosimiseks.

Kolmandaks, võrrand ei ole statistiliselt oluline või on võrrand F-kriteeriumi järgi oluline, kuid kõik saadud võrrandi parameetrid ei ole olulised. Võrrandit ei saa kasutada ühelgi eesmärgil.

Selleks et regressioonivõrrand oleks tunnistatav tulemusmärgi ja faktorimärkide vahelise seose mudeliks, on vajalik, et kõik kriitilised tegurid, mis määravad tulemuse, nii et võrrandi parameetrite mõtestatud tõlgendus vastab uuritava nähtuse teoreetiliselt põhjendatud seostele. Määramiskoefitsient R 2 peab olema > 0,5.

Ehitamisel mitmekordne võrrand regressiooni korral on soovitatav hinnata nn korrigeeritud determinatsioonikoefitsiendi (R 2) järgi. R 2 väärtus (nagu ka korrelatsioonid) suureneb koos analüüsis kaasatud tegurite arvu suurenemisega. Eriti ülehinnatakse koefitsientide väärtust väikeste populatsioonide tingimustes. Selleks, et end ära tasuks negatiivset mõju R 2 ja korrelatsioonid korrigeeritakse vabadusastmete arvu järgi, st. vabalt muutuvate elementide arv, kui teatud tegurid on kaasatud.

Kohandatud determinatsioonikoefitsient

P– määrata suurus/vaatluste arv

k– analüüsi kaasatud tegurite arv

n-1 on vabadusastmete arv

(1-R2)- saadud atribuudi jääk-/seletamatu dispersiooni väärtus

Alati vähem R2. põhjal saab võrrelda võrrandite hinnanguid erinev number analüüsitud tegurid.

34. Aegridade uurimise probleemid.

Dünaamika jadaid nimetatakse aegridadeks või aegridadeks. Dünaamiline jada on ajaliselt järjestatud näitajate jada, mis iseloomustab konkreetset nähtust (SKP maht 90–98 aastat). Dünaamika jada uurimise eesmärk on tuvastada uuritava nähtuse (peamise trendi) arengumustrid ja selle põhjal prognoosida. RD definitsioonist tuleneb, et mis tahes seeria koosneb kahest elemendist: ajast t ja seeria tasemest (need indikaatori konkreetsed väärtused, mille alusel DR-seeria koostatakse). DR-seeriad võivad olla 1) hetkelised - seeriad, mille näitajad on fikseeritud ajahetkel, kell teatud kuupäev, 2) intervall - jada, mille näitajad saadakse teatud perioodi kohta (1. Peterburi rahvaarv, 2. perioodi SKT). Seeriate jagamine hetke- ja intervallideks on vajalik, kuna see määrab DR-seeria mõne näitaja arvutamise eripära. Taseme summeerimine intervallide seeriad annab mõtestatult tõlgendatud tulemuse, mida ei saa öelda hetkeridade tasandite liitmise kohta, kuna viimased sisaldavad korduvat loendamist. Kõige olulisem probleem aegridade analüüsis on ridade tasemete võrreldavuse probleem. See kontseptsioon on väga mitmekülgne. Tasemed peaksid olema võrreldavad nii arvutusmeetodite kui ka territooriumi ja rahvastikuüksuste katvuse osas. Kui DR-seeria on ehitatud kulude järgi, siis tuleks kõik tasemed esitada või arvutada võrreldavate hindadega. Intervalljadade koostamisel peaksid tasemed iseloomustama samu ajaperioode. Momentide seeria D ehitamisel tuleb tasemed fikseerida samal kuupäeval. Read võivad olla täielikud või mittetäielikud. Mittetäielikke seeriaid kasutatakse ametlikes väljaannetes (1980, 1985, 1990, 1995, 1996, 1997, 1998, 1999…). Kompleksne analüüs RD sisaldab järgmiste punktide uurimist:

1. RD tasemete muutuste näitajate arvutamine

2. RD keskmiste näitajate arvutamine

3. sarja põhitrendi väljaselgitamine, trendimudelite koostamine

4. Autokorrelatsiooni hindamine RD-s, autoregressiivsete mudelite konstrueerimine

5. RD korrelatsioon

6. RD prognoosimine.

35. Aegridade tasemete muutumise näitajad .

AT üldine vaade RowD võib olla esindatud:

y on DR-tase, t on hetk või ajavahemik, millele tase (indikaator) viitab, n on DR-seeria pikkus (perioodide arv). dünaamika jada uurimisel arvutatakse järgmised näitajad: 1. absoluutne kasv, 2. kasvutegur (kasvukiirus), 3. kiirendus, 4. kasvutegur (kasvukiirus), 5. absoluutväärtus 1% tõus. Arvutatud näitajad võivad olla: 1. ahel - saadakse seeria iga taseme võrdlemisel vahetult eelnevaga, 2. põhiline - saadakse võrdlusaluseks valitud tasemega võrdlemisel (kui pole teisiti määratud, siis seeria 1. tase võetakse aluseks). 1. Ahela absoluutsed kasvud:. Näitab, kui palju rohkem või vähem. Ahela absoluutseid suurenemisi nimetatakse tasemete muutumise kiiruse näitajateks dünaamiline seeria. Baasi absoluutne kasv: . Kui sarja tasemed on suhteline jõudlus, väljendatuna %, siis absoluutset kasvu väljendatakse muutuspunktides. 2. kasvufaktor (kasvukiirus): See arvutatakse rea tasemete suhtena vahetult eelnevatesse (ahela kasvutegurid) või võrdlusaluseks võetud tasemesse (põhikasvutegurid): . Iseloomustab mitu korda seeria iga tase > või< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. absoluutse kasvu alusel arvutatakse näitaja - absoluutse kasvu kiirenemine: . Kiirendus on absoluutsete kasvude absoluutne kasv. Hindab, kuidas juurdekasvud ise muutuvad, kas need on stabiilsed või kiirenevad (kasvavad). 4. kasvutempo on kasvu ja võrdlusbaasi suhe. Väljendatuna %: ; . Kasvumäär on kasvutempo miinus 100%. Näitab kui palju antud tase rida > või< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. RD keskmiste näitajate arvutamine Arvutage seeria keskmised tasemed, keskmine absoluutkasv, keskmine kasvumäär ja keskmine kasvutempo. Keskmisi näitajaid arvutatakse teabe kokkuvõtmiseks ning nende muutumise tasemete ja näitajate võrdlemiseks erinevates seeriates. 1. keskmine tase rida a) intervall-aegridade jaoks arvutatakse see lihtsa aritmeetilise keskmisega: , kus n on aegrea tasemete arv; b) hetkeridade puhul arvutatakse keskmine tase kindla valemi järgi, mida nimetatakse kronoloogiliseks keskmiseks: . 2. keskmine absoluutne kasv arvutatakse ahela absoluutsete juurdekasvude alusel lihtsa aritmeetilise keskmise järgi:

. 3. Keskmine koefitsient kasvu arvutatakse ahela kasvutegurite alusel, kasutades geomeetrilise keskmise valemit: . DR-seeria keskmiste näitajate kommenteerimisel on vaja välja tuua 2 punkti: analüüsitavat näitajat iseloomustav periood ja ajavahemik, milleks DR-seeria on ehitatud. 4. Keskmine kasvumäär: . 5. keskmine kasvumäär: .

Korrelatsioonikordaja olulisuse, olulisuse hindamiseks kasutatakse Studenti t-testi.

Korrelatsioonikordaja keskmine viga leitakse järgmise valemi abil:

H
ja vea põhjal arvutatakse t-test:

Arvutatud t-testi väärtust võrreldakse Studenti jaotustabelist leitud tabeliväärtusega olulisuse tasemel 0,05 või 0,01 ja vabadusastmete arvuga n-1. Kui t-testi arvutuslik väärtus on suurem kui tabelina esitatud väärtus, loetakse korrelatsioonikordaja oluliseks.

Kõverjoonelise seose korral kasutatakse F-kriteeriumit korrelatsiooniseose ja regressioonivõrrandi olulisuse hindamiseks. See arvutatakse järgmise valemiga:

või

kus η on korrelatsioonisuhe; n on vaatluste arv; m on parameetrite arv regressioonivõrrandis.

F arvutatud väärtust võrreldakse tabeli väärtusega aktsepteeritud olulisuse taseme α (0,05 või 0,01) ja vabadusastmete arvu k 1 =m-1 ja k 2 =n-m jaoks. Kui F arvutatud väärtus ületab tabeli väärtuse, loetakse seos oluliseks.

Regressioonikordaja olulisus määratakse Studenti t-testi abil, mis arvutatakse valemiga:

kus σ 2 ja i on regressioonikordaja dispersioon.

See arvutatakse järgmise valemiga:

kus k on faktortunnuste arv regressioonivõrrandis.

Regressioonikordaja tunnistatakse oluliseks, kui t a 1 ≥t cr. t cr leitakse Studenti jaotuse kriitiliste punktide tabelist aktsepteeritud olulisuse ja vabadusastmete arvu k=n-1 juures.

4.3 Korrelatsioon-regressioonanalüüs Excelis

Teeme korrelatsioon-regressioonanalüüsi saagikuse ja tööjõukulude seose kohta 1 tsentneri teravilja kohta. Selleks avage Exceli leht, lahtritesse A1: A30 sisestage faktoriatribuudi väärtused teravilja tootlikkus, lahtrites B1: B30 efektiivse tunnuse väärtused - tööjõukulud 1 tsentneri teravilja kohta. Valige menüüst Tööriistad suvand Andmeanalüüs. Sellel üksusel vasakklõpsu avab regressioonitööriist. Klõpsake nuppu OK, ekraanile ilmub dialoogiboks Regressioon. Sisestage väljale Sisestusintervall Y saadud atribuudi väärtused (lahtrid B1:B30 esiletõstmine), väljale Sisestusintervall X teguri atribuudi väärtused (lahtrite A1:A30 esiletõstmine). Tõenäosustasemeks märgime 95%, vali Uus tööleht. Klõpsame nuppu OK. Töölehele ilmub tabel “TULEMUSED”, milles on toodud regressioonivõrrandi parameetrite, korrelatsioonikordaja ja muude näitajate arvutamise tulemused, mis võimaldab määrata korrelatsioonikordaja olulisuse ja regressioonivõrrandi parameetrid.

TULEMUSED

Regressioonistatistika

Mitu R

R-ruut

Normaliseeritud R-ruut

standardviga

Tähelepanekud

Dispersioonanalüüs

Tähtsus F

Regressioon

Koefitsiendid

standardviga

t-statistika

P-väärtus

alumine 95%

Top 95%

Madalam 95,0%

Top 95,0%

Y-ristmik

Muutuja X 1

Selles tabelis on "mitmekordne R" korrelatsioonikordaja, "R-ruut" on määramistegur. "Koefitsiendid: Y-lõikepunkt" - regressioonivõrrandi 2,836242 vaba liige; "Muutuja X1" - regressioonikordaja -0,06654. Samuti on Fisheri F-testi väärtused 74,9876, Studenti t-testi 14,18042, " standardviga 0,112121”, mis on vajalikud korrelatsioonikordaja, regressioonivõrrandi parameetrite ja kogu võrrandi olulisuse hindamiseks.

Tabeli andmete põhjal koostame regressioonivõrrandi: y x ​​​​\u003d 2,836-0,067x. Regressioonikoefitsient a 1 = -0,067 tähendab, et teraviljasaagi suurenemisel 1 tsentner/ha võrra vähenevad tööjõukulud 1 tsentneri teravilja kohta 0,067 töötundi.

Korrelatsioonikordaja r=0,85>0,7, mistõttu on selles populatsioonis uuritud tunnuste vaheline seos tihe. Determinatsioonikoefitsient r 2 =0,73 näitab, et 73% efektiivtunnuse (tööjõukulu 1 sentimeetri teravilja kohta) varieerumisest on põhjustatud faktortunnuse (teraviljasaagi) toimest.

Tabel kriitilised punktid Fisher - Snedecori jaotus, leiame F-kriteeriumi kriitilise väärtuse olulisuse tasemel 0,05 ja vabadusastmete arvu k 1 =m-1=2-1=1 ja k 2 =n-m=30-2 =28, see võrdub 4,21-ga. Kuna kriteeriumi arvutatud väärtus on suurem kui tabeli väärtus (F=74,9896>4,21), loetakse regressioonivõrrand oluliseks.

Korrelatsioonikordaja olulisuse hindamiseks arvutame Studenti t-testi:

AT
Studenti jaotuse kriitiliste punktide tabelist leiame t-testi kriitilise väärtuse olulisuse tasemel 0,05 ja vabadusastmete arvu n-1=30-1=29, see võrdub 2,0452-ga. Kuna arvutatud väärtus on suurem kui tabelina esitatud väärtus, on korrelatsioonikoefitsient oluline.

Olulisuse kontrollimiseks analüüsitakse regressioonikordaja ja selle standardhälbe suhet. See suhe on Studenti jaotus, st olulisuse määramiseks kasutame t - kriteeriumi:

- SKO jääkdispersioonist;

- keskväärtusest kõrvalekallete summa

Kui t rassid. >t vahekaart. , siis on koefitsient b i oluline.

Usaldusvahemik määratakse järgmise valemiga:

TÖÖKORD

    Võtke lähteandmed vastavalt töö variandile (õpilase numbri järgi päevikus). Määratud on kahe sisendiga staatiline juhtimisobjekt X 1 , X 2 ja üks väljapääs Y. Objektiga viidi läbi passiivne katse ja saadi 30-punktiline proov, mis sisaldas väärtusi X 1 , X 2 ja Y iga katse jaoks.

    Avage Excel 2007-s uus fail. Sisestage taustainfo lähtetabeli veergudesse - sisendmuutujate väärtused X 1 , X 2 ja väljundmuutuja Y.

    Arvutatud väärtuste sisestamiseks valmistage ette kaks täiendavat veergu Y ja ülejäägid.

    Kutsuge programm "Regressioon": andmed / andmete analüüs / regressioon.

Riis. 1. Dialoogiboks "Andmete analüüs".

    Sisestage dialoogiboksi "Regression" lähteandmete aadressid:

    sisestusintervall Y, sisestusintervall X (2 veergu),

    seadke töökindlustasemeks 95%

    suvandis "Väljundi intervall" määrake regressioonanalüüsi andmete väljundi asukoha ülemine vasak lahter (esimene lahter 2-leheküljelisel töölehel),

    lubage valikud "Jäänused" ja "Jäälmete graafik",

    käivitamiseks vajutage nuppu OK regressioonianalüüs.

Riis. 2. Dialoogiboks "Regressioon".

    Excel kuvab 4 tabelit ja 2 jääkide ja muutujate graafikut X1 ja X2.

    Vormindage tabel "Kokkusummade väljund" - laiendage veergu väljundandmete nimedega, tehke teise veergu koma järel 3 tähenduslikku numbrit.

    Vormindage tabel "ANOVA" – muutke komajärgsete tähenduslike numbrite arvu lugemine ja mõistmine lihtsaks, lühendage muutujate nimesid ja reguleerige veergude laiust.

    Vormindage võrrandi koefitsientide tabel - lühendage muutujate nimesid ja vajadusel kohandage veergude laiust, muutke tähenduslike numbrite arv lugemiseks ja mõistmiseks mugavaks, kustutage viimased 2 veergu (väärtused ja tabel juurdehindlus).

    Edastage andmed tabelist "Ülejäänud väljund" lähtetabeli ettevalmistatud veergudesse, seejärel kustutage tabel "Ülejäänud väljund" (valik "Eriline lisamine").

    Sisestage saadud koefitsientide hinnangud algsesse tabelisse.

    Tõmmake tulemuste tabelid lehe ülaossa nii palju kui võimalik.

    Koostage tabelite all diagrammid Yeksp, Yarvut ja prognoosivead (jääk).

    Jääkdiagrammide vormindamine. Saadud graafikute põhjal hinnata mudeli õigsust sisendite järgi X1, X2.

    Printige regressioonanalüüsi tulemused.

    Tegelege regressioonanalüüsi tulemustega.

    Koostage tööaruanne.

TÖÖNÄIDE

Regressioonanalüüsi teostamise meetod EXCELi paketis on näidatud joonistel 3-5.

Riis. 3. Regressioonanalüüsi näide EXCEL paketis.


Joonis 4. Muutuvate jääkide graafikud X1, X2

Riis. 5. Graafikud Yeksp,Yarvut ja prognoosivead (jääk).

Regressioonanalüüsi järgi võime öelda:

1. Exceli abil saadud regressioonivõrrand on kujul:

    Määramiskoefitsient:

Tulemuse kõikumine 46,5% on seletatav tegurite varieerumisega.

    Üldine F-test kontrollib hüpoteesi regressioonivõrrandi statistilise olulisuse kohta. Analüüs viiakse läbi Fisheri F-testi tegelike ja tabeliväärtuste võrdlemisel.

Kuna tegelik väärtus ületab tabeli
, siis järeldame, et saadud regressioonivõrrand on statistiliselt oluline.

    Koefitsient mitmekordne korrelatsioon:

    b 0 :

t vahekaart. (29, 0,975) = 2,05

b 0 :

Usaldusvahemik:

    Määrake koefitsiendi usaldusvahemik b 1 :

Koefitsiendi olulisuse kontroll b 1 :

t võistlused >t vahekaart. , koefitsient b 1 on oluline

Usaldusvahemik:

    Määrake koefitsiendi usaldusvahemik b 2 :

Koefitsiendi olulisuse test b 2 :

Määrake usaldusvahemik:

ÜLESANDE VÕIMALUSED

Tabel 2. Ülesande valikud

valiku number

Tõhus märk Y i

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 2

Y 2

Y 2

Y 2

Y 2

teguri number X i

teguri number X i

Tabel 1 jätkus

valiku number

Tõhus märk Y i

Y 2

Y 2

Y 2

Y 2

Y 2

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

teguri number X i

teguri number X i

Tabel 3. Algandmed

Y 1

Y 2

Y 3

X 1

X 2

X 3

X 4

X 5

KÜSIMUSED ENESEKONTROLLIKS

    Regressioonanalüüsi probleemid.

    Regressioonanalüüsi eeldused.

    Põhivõrrand dispersioonanalüüs.

    Mida näitab Fisheri F-suhe?

    Kuidas määratakse tabeli väärtus Fisheri kriteerium?

    Mida näitab määramiskoefitsient?

    Kuidas määrata regressioonikordajate olulisust?

    Kuidas määrata regressioonikoefitsientide usaldusvahemikku?

    Kuidas määrata t-testi arvutuslikku väärtust?

    Kuidas määrata t-testi tabeliväärtust?

    Sõnastage dispersioonanalüüsi põhiidee, milliste ülesannete jaoks on see kõige tõhusam?

    Millised on dispersioonanalüüsi peamised teoreetilised eeldused?

    Tehke lagunemine kogu summa dispersioonanalüüsi komponentide ruudus hälbed.

    Kuidas saada hälvete ruudu summadest dispersioonihinnanguid?

    Kuidas saadakse nõutavad vabadusastmed?

    Kuidas määratakse standardviga?

    Selgitage kahesuunalise dispersioonanalüüsi skeemi.

    Mille poolest erineb ristklassifikatsioon hierarhilisest klassifikatsioonist?

    Mille poolest erinevad tasakaalustatud andmed?

Aruanne on koostatud Wordi tekstiredaktoris A4 GOST 6656-76 paberil (210x297 mm) ja sisaldab:

    Labori nimi.

    Eesmärk.

  1. Arvutustulemused.

TÄITMISEKS LUBATUD AEG

LABORITÖÖD

Ettevalmistus tööks - 0,5 akad. tundi.

Töö sooritamine - 0,5 akad. tundi.

Arvutiarvutused - 0,5 akad. tundi.

Töö registreerimine - 0,5 akad. tundi.

Kirjandus

    Juhtimisobjektide tuvastamine. / A. D. Semenov, D. V. Artamonov, A. V. Brjuhhatšov. Õpetus. - Penza: PGU, 2003. - 211 lk.

    Põhitõed Statistiline analüüs. Töötuba käimas statistilised meetodid ja operatsioonide uurimine, kasutades STATISTIC ja EXCEL pakette. / Vukolov E.A. Õpetus. - M.: FOORUM, 2008. - 464 lk.

    Juhtimisobjektide tuvastamise teooria alused. / A.A. Ignatiev, S.A. Ignatjev. Õpetus. - Saratov: SGTU, 2008. - 44 lk.

    Tõenäosusteooria ja matemaatika statistika näidetes ja ülesannetes EXCELi abil. / G.V. Gorelova, I.A. Katsko. - Rostov n / a: Phoenix, 2006. - 475 lk.

    Töö eesmärk 2

    Põhimõisted 2

    Töökäsk 6

    Töönäide 9

    Küsimused enesekontrolliks 13

    Tööle määratud aeg 14

    Regressioonivõrrandi parameetrite olulisust saate kontrollida t-statistika abil.

    Harjutus:
    Sama tüüpi tooteid tootvate ettevõtete rühma puhul võetakse arvesse kulufunktsioone:
    y = α + βx;
    y = α x β;
    y = α β x;
    y = α + β/x;
    kus y on tootmismaksumus, tuhat cu.
    x - väljund, tuhat ühikut.

    Nõutud:
    1. Koostage paaris regressioonivõrrandid y-st x:

    • lineaarne;
    • võimsus;
    • soovituslik;
    • võrdkülgne hüperbool.
    2. Arvutage lineaarne koefitsient paaride korrelatsioon ja determinatsioonikordaja. Järeldusi tegema.
    3. Hinda regressioonivõrrandi kui terviku statistilist olulisust.
    4. Hinnake regressiooni- ja korrelatsiooniparameetrite statistilist olulisust.
    5. Tehke tootmiskulude prognoos prognoositava toodanguga 195% keskmisest tasemest.
    6. Hinnake prognoosi täpsust, arvutage prognoosiviga ja selle usaldusvahemik.
    7. Hinda mudelit läbi keskmine viga ligikaudsed.

    Otsus:

    1. Võrrand on kujul y = α + βx
    1. Regressioonivõrrandi parameetrid.
    Keskmised

    Dispersioon

    standardhälve

    Korrelatsioonikordaja

    Seos tunnuse Y teguri X vahel on tugev ja otsene
    Regressioonivõrrand

    Määramiskoefitsient
    R2 = 0,94 2 = 0,89, s.o. 88,9774% juhtudest põhjustavad x muutused y muutumise. Teisisõnu – regressioonivõrrandi valiku täpsus on kõrge

    x y x2 y2 x y y(x) (y-y cp) 2 (y-y(x)) 2 (x-x p) 2
    78 133 6084 17689 10374 142.16 115.98 83.83 1
    82 148 6724 21904 12136 148.61 17.9 0.37 9
    87 134 7569 17956 11658 156.68 95.44 514.26 64
    79 154 6241 23716 12166 143.77 104.67 104.67 0
    89 162 7921 26244 14418 159.9 332.36 4.39 100
    106 195 11236 38025 20670 187.33 2624.59 58.76 729
    67 139 4489 19321 9313 124.41 22.75 212.95 144
    88 158 7744 24964 13904 158.29 202.51 0.08 81
    73 152 5329 23104 11096 134.09 67.75 320.84 36
    87 162 7569 26244 14094 156.68 332.36 28.33 64
    76 159 5776 25281 12084 138.93 231.98 402.86 9
    115 173 13225 29929 19895 201.86 854.44 832.66 1296
    0 0 0 16.3 20669.59 265.73 6241
    1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

    Märkus: y(x) väärtused leitakse saadud regressioonivõrrandist:
    y(1) = 4,01*1 + 99,18 = 103,19
    y(2) = 4,01*2 + 99,18 = 107,2
    ... ... ...

    2. Regressioonivõrrandi parameetrite hindamine
    Korrelatsioonikordaja olulisus

    Õpilase tabeli järgi leiame Ttabeli
    T tabel (n-m-1; α / 2) \u003d (11; 0,05 / 2) \u003d 1,796
    Kuna Tobs > Ttabl, lükkame tagasi hüpoteesi, et korrelatsioonikordaja on 0. Teisisõnu, korrelatsioonikordaja on statistiliselt oluline.

    Regressioonikordajate hinnangute määramise täpsuse analüüs





    Sa = 0,1712
    Sõltuva muutuja usaldusvahemikud

    Arvutage selle intervalli piirid, millesse koondub 95% Y võimalikest väärtustest piiramatult suured numbrid tähelepanekud ja X = 1
    (-20.41;56.24)
    Koefitsientide hüpoteeside kontrollimine lineaarvõrrand regressioon
    1) t-statistika


    Regressioonikordaja a statistiline olulisus leiab kinnitust

    Regressioonikordaja b statistiline olulisus ei ole kinnitatud
    Regressioonivõrrandi kordajate usaldusvahemik
    Teeme kindlaks usaldusvahemikud regressioonikoefitsiendid, mis 95% usaldusväärsusega on järgmised:
    (a - t S a ; a + t S a)
    (1.306;1.921)
    (b - t b S b ; b + t b S b)
    (-9.2733;41.876)
    kus t = 1,796
    2) F-statistika


    fkp = 4,84
    Kuna F > Fkp, on determinatsioonikoefitsient statistiliselt oluline