Biograafiad Omadused Analüüs

Vähimruutude lahendus. LSM lineaarse mudeli korral

Näide.

Eksperimentaalsed andmed muutujate väärtuste kohta X ja juures on toodud tabelis.

Nende joondamise tulemusena funktsioon

Kasutades meetod vähimruudud , lähendage neid andmeid lineaarse sõltuvusega y=kirves+b(leidke valikud a ja b). Uurige välja, milline kahest joonest on parem (vähimruutude meetodi tähenduses), mis joondab katseandmeid. Tee joonis.

Vähimruutude meetodi (LSM) olemus.

Ülesanne on leida lineaarsed sõltuvuskoefitsiendid, mille puhul on kahe muutuja funktsioon a ja b võtab vastu väikseim väärtus. St andmeid arvestades a ja b katseandmete ruutude hälvete summa leitud sirgest on väikseim. See on kogu vähimruutude meetodi mõte.

Seega taandatakse näite lahendus kahe muutuja funktsiooni ekstreemumi leidmisele.

Valemite tuletamine koefitsientide leidmiseks.

Koostatakse ja lahendatakse kahest võrrandist koosnev süsteem kahe tundmatuga. Funktsioonide osatuletiste leidmine muutujate järgi a ja b, võrdsustame need tuletised nulliga.

Lahendame saadud võrrandisüsteemi mis tahes meetodiga (näiteks asendusmeetod või Crameri meetod) ja saada valemid koefitsientide leidmiseks vähimruutude meetodi (LSM) abil.

Andmetega a ja b funktsiooni võtab väikseima väärtuse. Selle fakti tõestus on esitatud lehe lõpus oleva teksti all.

See on kogu vähimruutude meetod. Valem parameetri leidmiseks a sisaldab summasid ,, ja parameetrit n- katseandmete hulk. Nende summade väärtused on soovitatav arvutada eraldi. Koefitsient b leitud pärast arvutamist a.

On aeg meenutada algset näidet.

Otsus.

Meie näites n = 5. Nõutavate koefitsientide valemites sisalduvate summade arvutamise mugavuse huvides täidame tabeli.

Tabeli neljanda rea ​​väärtused saadakse, korrutades iga numbri 2. rea väärtused 3. rea väärtustega i.

Tabeli viienda rea ​​väärtused saadakse iga numbri 2. rea väärtuste ruudustamisel i.

Tabeli viimase veeru väärtused on ridade väärtuste summad.

Koefitsientide leidmiseks kasutame vähimruutude meetodi valemeid a ja b. Asendame neis vastavad väärtused tabeli viimasest veerust:

Seega y=0,165x+2,184 on soovitud ligikaudne sirgjoon.

Jääb välja selgitada, milline ridadest y=0,165x+2,184 või lähendab paremini algandmeid, st teha hinnang vähimruutude meetodil.

Vähimruutude meetodi vea hindamine.

Selleks peate arvutama nendelt ridadelt algandmete ruuduhälbete summad ja , vastab väiksem väärtus joonele, mis lähendab paremini algandmeid vähimruutude meetodil.

Alates , siis rida y=0,165x+2,184 läheneb paremini algandmetele.

Vähimruutude meetodi (LSM) graafiline illustratsioon.

Tabelites näeb kõik suurepärane välja. Punane joon on leitud joon y=0,165x+2,184, sinine joon on , on roosad täpid algandmed.

Praktikas kasutatakse mitmesuguste protsesside - eriti majanduslike, füüsiliste, tehniliste, sotsiaalsete - modelleerimisel laialdaselt neid või neid meetodeid funktsioonide ligikaudsete väärtuste arvutamiseks nende teadaolevatest väärtustest teatud kindlates punktides.

Seda tüüpi funktsioonide lähendamisel tekivad sageli probleemid:

    ligikaudsete valemite koostamisel uuritava protsessi iseloomulike suuruste väärtuste arvutamiseks vastavalt katse tulemusel saadud tabeliandmetele;

    numbrilises integreerimises, eristamises, lahendamises diferentsiaalvõrrandid jne.;

    kui on vaja arvutada funktsioonide väärtused vaadeldava intervalli vahepunktides;

    protsessi iseloomulike suuruste väärtuste määramisel väljaspool vaadeldavat intervalli, eriti prognoosimisel.

Kui teatud tabeliga määratud protsessi modelleerimiseks konstrueeritakse funktsioon, mis seda protsessi ligikaudselt kirjeldab vähimruutude meetodil, nimetatakse seda lähendavaks funktsiooniks (regressioon) ja lähendavate funktsioonide konstrueerimise ülesanne ise olla ligikaudne probleem.

Käesolevas artiklis käsitletakse MS Exceli paketi võimalusi selliste ülesannete lahendamiseks, lisaks on toodud meetodid ja tehnikad regressioonide konstrueerimiseks (loomiseks) tabeliliselt etteantud funktsioonidele (mis on regressioonanalüüsi aluseks).

Excelis on regressioonide koostamiseks kaks võimalust.

    Valitud regressioonide lisamine ( trendijooned- trendijooned) uuritava protsessi karakteristiku andmetabeli alusel koostatud diagrammi (saadaval ainult diagrammi koostamisel);

    Exceli töölehe sisseehitatud statistiliste funktsioonide kasutamine, mis võimaldab teil saada regressioone (trendijooni) otse lähteandmete tabelist.

Trendijoonte lisamine diagrammile

Teatud protsessi kirjeldava ja diagrammiga kujutatud andmetabeli jaoks on Excelil tõhus regressioonianalüüsi tööriist, mis võimaldab teil:

    ehitada vähimruutude meetodil ja lisada diagrammile viis regressioonide tüübid, mis erineva täpsusega modelleerivad uuritavat protsessi;

    lisada diagrammile konstrueeritud regressiooni võrrand;

    määrata valitud regressiooni vastavuse aste diagrammil kuvatavatele andmetele.

Diagrammi andmete põhjal võimaldab Excel saada lineaarseid, polünoomilisi, logaritmilisi, eksponentsiaalseid ja eksponentsiaalseid regressioonitüüpe, mis on antud võrrandiga:

y = y(x)

kus x on sõltumatu muutuja, mis sageli võtab naturaalarvude jada (1; 2; 3; ...) väärtused ja annab näiteks uuritava protsessi aja loenduse (karakteristikud) .

1 . Lineaarne regressioon on hea konstantse kiirusega suurenevate või vähenevate tunnuste modelleerimiseks. See on uuritava protsessi lihtsaim mudel. See on ehitatud vastavalt võrrandile:

y=mx+b

kus m on kalde puutuja lineaarne regressioon x-teljele; b - lineaarse regressiooni ja y-telje lõikepunkti koordinaat.

2 . Polünoomiline trendijoon on kasulik selliste omaduste kirjeldamiseks, millel on mitu erinevat äärmust (kõrgemad ja madalad). Polünoomi astme valiku määrab uuritava tunnuse ekstreemide arv. Seega võib teise astme polünoom hästi kirjeldada protsessi, millel on ainult üks maksimum või miinimum; kolmanda astme polünoom - mitte rohkem kui kaks äärmust; neljanda astme polünoom - mitte rohkem kui kolm ekstreemi jne.

Sel juhul koostatakse trendijoon vastavalt võrrandile:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

kus koefitsiendid c0, c1, c2,...c6 on konstandid, mille väärtused määratakse ehituse käigus.

3 . Logaritmilist trendijoont kasutatakse edukalt karakteristikute modelleerimisel, mille väärtused muutuvad alguses kiiresti ja seejärel järk-järgult stabiliseeruvad.

y = c ln(x) + b

4 . Võimsuse trendijoon annab häid tulemusi, kui uuritud sõltuvuse väärtusi iseloomustab pidev kasvukiiruse muutus. Sellise sõltuvuse näide võib olla auto ühtlaselt kiirendatud liikumise graafik. Kui on null või negatiivsed väärtused, ei saa te kasutada jõutrendi joont.

See on ehitatud vastavalt võrrandile:

y = cxb

kus koefitsiendid b, c on konstandid.

5 . Kui andmete muutumise kiirus pidevalt kasvab, tuleks kasutada eksponentsiaalset trendijoont. Null- või negatiivseid väärtusi sisaldavate andmete puhul ei ole seda tüüpi lähendus samuti kohaldatav.

See on ehitatud vastavalt võrrandile:

y=cebx

kus koefitsiendid b, c on konstandid.

Trendijoone valimisel arvutab Excel automaatselt välja R2 väärtuse, mis iseloomustab lähenduse täpsust: mida lähemal on R2 väärtus ühele, seda usaldusväärsemalt läheneb trendijoon uuritavale protsessile. Vajadusel saab diagrammil alati kuvada R2 väärtuse.

Määratakse valemiga:

Andmeseeriale trendijoone lisamiseks tehke järgmist.

    aktiveerige andmeseeria põhjal koostatud diagramm, st klõpsake diagrammialal. Diagramm ilmub peamenüüsse;

    peale sellel üksusel klõpsamist ilmub ekraanile menüü, kus tuleb valida käsk Lisa trendijoon.

Samad toimingud on hõlpsasti rakendatavad, kui hõljutate kursorit ühele andmeseeriale vastava graafiku kohal ja paremklõpsate; valige kuvatavas kontekstimenüüs käsk Lisa trendijoon. Ekraanile ilmub dialoogiboks Trendline, kus on avatud vahekaart Tüüp (joonis 1).

Pärast seda vajate:

Valige vahekaardil Tüüp soovitud trendijoone tüüp (vaikimisi on valitud Lineaarne). Polünoomitüübi jaoks määrake väljal Degree valitud polünoomi aste.

1 . Väljal Built on Series on loetletud kõik kõnealuse diagrammi andmesarjad. Trendijoone lisamiseks kindlale andmeseeriale valige väljal Built on seeria selle nimi.

Vajadusel saate vahekaardile Parameetrid minnes (joonis 2) määrata trendijoonele järgmised parameetrid:

    muutke väljal Lähendava (silutud) kõvera nimi trendijoone nime.

    määrake väljale Prognoos prognoosi perioodide arv (edasi või tagasi);

    kuvada diagrammi alas trendijoone võrrandit, mille puhul tuleks lubada ruut näita võrrandit diagrammil;

    kuva diagrammi alas lähenduse usaldusväärsuse R2 väärtust, mille puhul tuleks lubada märkeruut pane diagrammile lähenduse usaldusväärsus (R^2);

    määrake trendijoone lõikepunkt Y-teljega, mille jaoks peaksite märkima linnukese Intersection of the curve with Y-telje punktis;

    dialoogiboksi sulgemiseks klõpsake nuppu OK.

Juba ehitatud trendijoone redigeerimise alustamiseks on kolm võimalust:

    pärast trendijoone valimist kasuta menüüst Vorming käsku Selected trend line;

    vali kontekstimenüüst käsk Format Trendline, mille kutsumiseks tehakse trendijoonel paremklõps;

    topeltklõpsuga trendijoonel.

Ekraanile ilmub Trendijoone vormindamise dialoogiboks (joonis 3), mis sisaldab kolme vahekaarti: Vaade, Tüüp, Parameetrid ja kahe viimase sisu kattub täielikult Trendline dialoogiboksi sarnaste vahekaartidega (joonis 1-2). ). Vahekaardil Vaade saate määrata joone tüübi, värvi ja paksuse.

Juba koostatud trendijoone kustutamiseks valige kustutatav trendijoon ja vajutage klahvi Kustuta.

Vaadeldava regressioonanalüüsi tööriista eelised on järgmised:

    trendijoone joonistamise suhteline lihtsus graafikutele ilma selle jaoks andmetabelit loomata;

    üsna lai nimekiri pakutud trendijoonte tüüpidest ja see loend sisaldab kõige sagedamini kasutatavaid regressioonitüüpe;

    võimalus ennustada uuritava protsessi käitumist meelevaldselt (sees terve mõistus) sammude arv nii edasi kui ka tagasi;

    trendijoone võrrandi analüütilise vormi saamise võimalus;

    vajaduse korral võimalus saada hinnang lähenduse usaldusväärsuse kohta.

Puuduste hulgas on järgmised punktid:

    trendijoone konstrueerimine toimub ainult siis, kui on olemas andmeseeriale üles ehitatud diagramm;

    uuritava karakteristiku andmeseeriate genereerimise protsess selle jaoks saadud trendijoone võrrandite põhjal on mõnevõrra segane: nõutavaid regressioonivõrrandeid uuendatakse iga algse andmerea väärtuste muutusega, kuid ainult diagrammi ala piires. , samas kui vana joonvõrrandi trendi alusel moodustatud andmeread jäävad muutumatuks;

    Kui muudate diagrammivaadet või sellega seotud PivotTable-liigendtabeli aruannet, siis olemasolevaid trendijooni ei säilitata PivotCharti aruannetes, mistõttu peate enne trendijoonte joonistamist või muul viisil PivotChart-liigenddiagrammi aruande vormindamist veenduma, et aruande paigutus vastab teie nõuetele.

Trendijooni saab lisada andmeseeriatele, mis on esitatud diagrammidel, nagu graafik, histogramm, lamedad normaliseerimata aladiagrammid, tulp-, hajuvus-, mull- ja aktsiadiagrammid.

Trendijooni ei saa lisada andmeseeriatele 3-D-, Standard-, Radar-, Pie- ja Donutdiagrammidel.

Sisseehitatud Exceli funktsioonide kasutamine

Excel pakub ka regressioonianalüüsi tööriista trendijoonte joonistamiseks väljaspool diagrammi ala. Sel eesmärgil saab kasutada mitmeid statistilise töölehe funktsioone, kuid kõik need võimaldavad koostada ainult lineaarseid või eksponentsiaalseid regressioone.

Excelil on lineaarse regressiooni loomiseks mitu funktsiooni, eelkõige:

    TREND;

  • KALVAD ja LÕIKAD.

Lisaks mitmed funktsioonid eksponentsiaalse trendijoone koostamiseks, eelkõige:

    LGRFPumbes.

Tuleb märkida, et TREND ja GROWTH funktsioonide abil regressioonide koostamise tehnikad on praktiliselt samad. Sama võib öelda ka funktsioonipaari LINEST ja LGRFPRIBL kohta. Nende nelja funktsiooni puhul kasutatakse väärtuste tabeli loomisel Exceli funktsioone, näiteks massiivi valemeid, mis segavad regressioonide koostamise protsessi mõnevõrra. Samuti märgime, et lineaarse regressiooni konstrueerimist on meie arvates kõige lihtsam teostada funktsioonide SLOPE ja INTERCEPT abil, kus esimene neist määrab lineaarse regressiooni kalde ja teine ​​regressiooniga ära lõigatud lõigu. y-teljel.

Regressioonanalüüsi sisseehitatud funktsioonide tööriista eelised on järgmised:

    üsna lihtne protsess uuritava tunnuse sama tüüpi andmeseeriate moodustamiseks kõigi trendijooni määravate sisseehitatud statistiliste funktsioonide jaoks;

    standardtehnika genereeritud andmeseeriate põhjal trendijoonte koostamiseks;

    võimalus ennustada uuritava protsessi käitumist nõutav summa sammud ette või taha.

Ning miinuste hulka kuulub asjaolu, et Excelis puuduvad sisseehitatud funktsioonid muud tüüpi (välja arvatud lineaarsed ja eksponentsiaalsed) trendijoonte loomiseks. See asjaolu ei võimalda sageli valida uuritava protsessi kohta piisavalt täpset mudelit, samuti saada reaalsusele lähedasi prognoose. Lisaks ei ole funktsioonide TREND ja GROW kasutamisel teada trendijoonte võrrandid.

Tuleb märkida, et autorid ei seadnud artikli eesmärgiks esitada regressioonanalüüsi käiku erineva täielikkuse astmega. Selle põhiülesanne on konkreetsete näidete abil näidata Exceli paketi võimalusi lähendusülesannete lahendamisel; demonstreerida, millised tõhusad tööriistad on Excelil regressioonide koostamiseks ja prognoosimiseks; illustreerida, kui suhteliselt lihtsalt saab selliseid probleeme lahendada isegi kasutaja, kes ei tunne regressioonanalüüsi põhjalikke teadmisi.

Näited konkreetsete probleemide lahendamisest

Mõelge konkreetsete probleemide lahendamisele Exceli paketi loetletud tööriistade abil.

1. ülesanne

Tabeliga autotranspordiettevõtte kasumi kohta aastatel 1995-2002. peate tegema järgmist.

    Koostage diagramm.

    Lisage diagrammile lineaarsed ja polünoomilised (ruut- ja kuup-) trendijooned.

    Trendijoone võrrandite abil hankige tabeliandmed ettevõtte kasumi kohta iga trendijoone kohta aastatel 1995–2004.

    Tehke ettevõtte kasumiprognoos aastateks 2003 ja 2004.

Probleemi lahendus

    Exceli töölehe lahtrite vahemikku A4:C11 sisestame joonisel fig. 4.

    Olles valinud lahtrite vahemiku B4:C11, koostame diagrammi.

    Aktiveerime koostatud diagrammi ja vastavalt ülalkirjeldatud meetodile peale trendijoone tüübi valimist Trend Line dialoogiaknas (vt joon. 1) lisame diagrammile vaheldumisi lineaarsed, ruut- ja kuuptrendijooned. Samas dialoogiboksis avage vahekaart Parameetrid (vt joonis 2), väljale Name of the lähendava (silutud) kõvera nimi sisestage lisatud trendi nimi ja väljale Forecast forward for: periods määrake väärtus. 2, kuna plaanitakse teha kasumiprognoos kaheks aastaks ette. Regressioonivõrrandi ja lähenduse usaldusväärsuse väärtuse R2 kuvamiseks diagrammialal lubage märkeruudud Kuva võrrand ekraanil ja asetage diagrammile lähenduse usaldusväärsusväärtus (R^2). Parema visuaalse tajumise huvides muudame joonistatud trendijoonte tüüpi, värvi ja paksust, mille jaoks kasutame dialoogiboksi Trend Line Format vahekaarti Vaade (vt joonis 3). Saadud diagramm koos lisatud trendijoontega on näidatud joonisel fig. 5.

    Saada tabeliandmeid ettevõtte kasumi kohta iga trendijoone kohta aastatel 1995-2004. Kasutame joonisel fig. 5. Selleks sisestage vahemiku D3:F3 lahtritesse tekstiline teave valitud trendijoone tüübi kohta: Lineaarne trend, Ruuttrend, Kuubitrend. Järgmisena sisestage lahtrisse D4 lineaarse regressiooni valem ja kopeerige see valem täitemarkeri abil koos suhteliste viidetega lahtrite vahemikule D5:D13. Tuleb märkida, et igas lahtris, millel on lineaarse regressioonivalem lahtrite vahemikust D4:D13, on argumendiks vastav lahter vahemikust A4:A13. Samamoodi täidetakse ruutregressiooni korral lahtrivahemik E4:E13 ja kuupregressiooni puhul lahtrivahemik F4:F13. Nii koostati ettevõtte kasumiprognoos 2003. ja 2004. aastaks. kolme trendiga. Saadud väärtuste tabel on näidatud joonisel fig. 6.

2. ülesanne

    Koostage diagramm.

    Lisage diagrammile logaritmilised, eksponentsiaalsed ja eksponentsiaalsed trendijooned.

    Tuletage saadud trendijoonte võrrandid, samuti nende kõigi jaoks lähenduskindluse R2 väärtused.

    Trendijoone võrrandite abil hankige tabeliandmed ettevõtte kasumi kohta iga trendijoone kohta aastatel 1995–2002.

    Tehke nende trendijoonte abil ettevõtte kasumiprognoos aastateks 2003 ja 2004.

Probleemi lahendus

Järgides ülesande 1 lahendamisel antud metoodikat, saame diagrammi, millele on lisatud logaritmilised, eksponentsiaalsed ja eksponentsiaalsed trendijooned (joonis 7). Lisaks täidame saadud trendijoone võrrandite abil ettevõtte kasumi väärtuste tabeli, sealhulgas 2003. ja 2004. aasta prognoositud väärtused. (joonis 8).

Joonisel fig. 5 ja fig. on näha, et logaritmilise trendiga mudel vastab lähenduse usaldusväärsuse madalaimale väärtusele

R2 = 0,8659

R2 suurimad väärtused vastavad polünoomilise trendiga mudelitele: ruut (R2 = 0,9263) ja kuup (R2 = 0,933).

3. ülesanne

Ülesandes 1 toodud autotranspordiettevõtte kasumi andmete tabeliga aastatel 1995-2002 peate tegema järgmised sammud.

    Hankige andmeseeriad lineaarsete ja eksponentsiaalsete trendijoonte jaoks, kasutades funktsioone TREND ja GROW.

    Funktsioonide TREND ja GROWTH abil koostage ettevõtte kasumiprognoos aastateks 2003 ja 2004.

    Algandmete ja vastuvõetud andmeseeriate jaoks koostage diagramm.

Probleemi lahendus

Kasutame ülesande 1 töölehte (vt joonis 4). Alustame sellest TREND funktsioonid:

    valige lahtrite vahemik D4:D11, mis tuleks täita funktsiooni TREND väärtustega, mis vastavad ettevõtte kasumi teadaolevatele andmetele;

    kutsuge menüüst Lisa käsk Funktsioon. Ilmuvas dialoogiboksis Funktsiooniviisard valige statistika kategooriast funktsioon TREND ja seejärel klõpsake nuppu OK. Sama toimingut saab teha vajutades nuppu (funktsioon Insert) standardsel tööriistaribal.

    Ilmuvas dialoogiboksis Funktsiooni argumendid sisestage väljale Known_values_y lahtrite vahemik C4:C11; väljal Known_values_x - lahtrite vahemik B4:B11;

    sisestatud valemi massiivivalemiks muutmiseks kasutage klahvikombinatsiooni + + .

Valemiribale sisestatud valem näeb välja selline: =(TREND(C4:C11;B4:B11)).

Selle tulemusena täidetakse lahtrite vahemik D4:D11 funktsiooni TREND vastavate väärtustega (joonis 9).

Teha ettevõtte 2003. ja 2004. aasta kasumiprognoos. vajalik:

    valige lahtrite vahemik D12:D13, kuhu sisestatakse funktsiooni TREND ennustatud väärtused.

    kutsuge välja funktsioon TREND ja ilmuvas dialoogiboksis Funktsiooni argumendid sisestage väljale Known_values_y - lahtrite vahemik C4:C11; väljal Known_values_x - lahtrite vahemik B4:B11; ja väljal Uued_väärtused_x - lahtrite vahemik B12:B13.

    muutke see valem massiivivalemiks, kasutades kiirklahvi Ctrl + Shift + Enter.

    Sisestatud valem näeb välja selline: =(TREND(C4:C11;B4:B11;B12:B13)) ja lahtrite vahemik D12:D13 täidetakse funktsiooni TREND prognoositud väärtustega (vt joonis 1). 9).

Samamoodi täidetakse andmeseeria funktsiooni GROWTH abil, mida kasutatakse mittelineaarsete sõltuvuste analüüsimisel ja mis töötab täpselt samamoodi nagu selle lineaarne vaste TREND.

Joonis 10 näitab tabelit valemi kuvamise režiimis.

Algandmete ja saadud andmeseeriate jaoks on joonisel fig. üksteist.

4. ülesanne

Autoveoettevõtte dispetšerteenistuse teenusetaotluste laekumise andmete tabeliga jooksva kuu 1. kuni 11. kuupäevani tuleb teha järgmised toimingud.

    Hankige andmeseeriad lineaarse regressiooni jaoks: funktsioonide SLOPE ja INTERCEPT abil; kasutades funktsiooni LINEST.

    Hankige eksponentsiaalse regressiooni andmeseeria funktsiooni LYFFPRIB abil.

    Kasutades ülaltoodud funktsioone, koosta prognoos avalduste laekumise kohta dispetšerteenistusse perioodiks jooksva kuu 12.-14.

    Algse ja vastuvõetud andmeseeria jaoks koostage diagramm.

Probleemi lahendus

Pange tähele, et erinevalt funktsioonidest TREND ja GROW ei ole ükski ülaltoodud funktsioonidest (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) regressioon. Need funktsioonid mängivad ainult abistavat rolli, määrates kindlaks vajalikud regressiooniparameetrid.

Funktsioonide SLOPE, INTERCEPT, LINEST, LGRFINB abil koostatud lineaarsete ja eksponentsiaalsete regressioonide puhul on nende võrrandite välimus alati teada, erinevalt funktsioonidele TREND ja GROWTH vastavatest lineaarsetest ja eksponentsiaalsetest regressioonidest.

1 . Koostame lineaarse regressiooni, millel on võrrand:

y=mx+b

kasutades funktsioone SLOPE ja INTERCEPT, kusjuures regressiooni kalde m määrab funktsioon SLOPE ja konstantne liige b - funktsiooni INTERCEPT abil.

Selleks teostame järgmised toimingud:

    sisestage lähtetabel lahtrite vahemikku A4:B14;

    parameetri m väärtus määratakse lahtris C19. Valige statistikakategooriast funktsioon Slope; sisestame lahtrite vahemiku B4:B14 väljale teadaolevad_väärtused_y ja lahtrite vahemiku A4:A14 väljale teadaolevad_väärtused_x. Valem sisestatakse lahtrisse C19: =SLOPE(B4:B14;A4:A14);

    sarnase meetodi abil määratakse parameetri b väärtus lahtris D19. Ja selle sisu näeb välja selline: = INTERCEPT(B4:B14;A4:A14). Seega salvestatakse lineaarse regressiooni koostamiseks vajalike parameetrite m ja b väärtused vastavalt lahtritesse C19, D19;

    siis sisestame lahtrisse C4 lineaarse regressiooni valemi kujul: = $ C * A4 + $ D. Selles valemis kirjutatakse lahtrid C19 ja D19 absoluutsete viidetega (lahtri aadress ei tohiks võimaliku kopeerimisega muutuda). Absoluutse viitemärgi $ saab sisestada kas klaviatuurilt või klahvi F4 abil pärast kursori viimist lahtri aadressi peale. Täitepideme abil kopeerige see valem lahtrite vahemikku C4:C17. Saame soovitud andmeread (joonis 12). Kuna päringute arv on täisarv, tuleks lahtri vormingu akna vahekaardil Number seada numbrivorminguks komakohtade arvuga 0.

2 . Nüüd koostame võrrandiga antud lineaarse regressiooni:

y=mx+b

kasutades funktsiooni LINEST.

Selle jaoks:

    sisestage funktsioon LINEST massiivivalemina lahtrite vahemikku C20:D20: =(LINEST(B4:B14;A4:A14)). Selle tulemusena saame parameetri m väärtuse lahtris C20 ja parameetri b väärtuse lahtris D20;

    sisesta lahtrisse D4 valem: =$C*A4+$D;

    kopeerige see valem täitemarkeri abil lahtrite vahemikku D4:D17 ja hankige soovitud andmeseeria.

3 . Koostame eksponentsiaalse regressiooni, millel on võrrand:

funktsiooni LGRFPRIBL abil teostatakse seda sarnaselt:

    lahtrite vahemikku C21:D21 sisestage massiivivalemina funktsioon LGRFPRIBL: =( LGRFPRIBL (B4:B14;A4:A14)). Sel juhul määratakse parameetri m väärtus lahtris C21 ja parameetri b väärtus lahtris D21;

    valem sisestatakse lahtrisse E4: =$D*$C^A4;

    täitemarkerit kasutades kopeeritakse see valem lahtrite vahemikku E4:E17, kus paiknevad eksponentsiaalse regressiooni andmeread (vt joonis 12).

Joonisel fig. 13 näitab tabelit, kus näeme funktsioone, mida kasutame koos vajalike lahtrivahemikega, ja ka valemeid.

Väärtus R 2 helistas määramiskoefitsient.

Regressioonisõltuvuse konstrueerimise ülesandeks on leida mudeli (1) koefitsientide vektor m, mille juures koefitsient R saab suurima väärtuse.

R-i olulisuse hindamiseks kasutatakse Fisheri F-testi, mis arvutatakse valemiga

kus n- valimi suurus (katsete arv);

k on mudeli koefitsientide arv.

Kui F ületab mõne andmete kriitilise väärtuse n ja k ja aktsepteeritud usaldusnivoo, siis loetakse R väärtus oluliseks. F kriitiliste väärtuste tabelid on toodud matemaatilise statistika teatmeteostes.

Seega määrab R olulisuse mitte ainult selle väärtus, vaid ka katsete arvu ja mudeli koefitsientide (parameetrite) arvu suhe. Tõepoolest, lihtsa lineaarse mudeli korrelatsioonisuhe n=2 on 1 (tasapinna kahe punkti kaudu saate alati tõmmata ühe sirge). Kui aga katseandmed on juhuslikud muutujad, tuleks sellist R väärtust väga hoolikalt usaldada. Tavaliselt on olulise R ja usaldusväärse regressiooni saamiseks suunatud sellele, et katsete arv ületaks oluliselt mudeli koefitsientide arvu (n>k).

Lineaarse regressioonimudeli koostamiseks peate:

1) koostage katseandmeid sisaldav loend n reast ja m veerust (väljundväärtust sisaldav veerg Y peab olema loendis esimene või viimane); Näiteks võtame eelmise ülesande andmed, lisades veeru nimega "perioodi number", nummerdades perioodide arvud vahemikus 1 kuni 12. (need on väärtused X)

2) minge menüüsse Andmed/Data Analysis/Regression

Kui menüüst "Tööriistad" on puudu "Andmete analüüs", siis tuleks minna sama menüü punkti "Lisandmoodulid" ja teha linnuke kasti "Analüüsipakett".

3) määrake dialoogiboksis "Regression":

sisestusintervall Y;

sisestusintervall X;

· väljundi intervall - intervalli ülemine vasakpoolne lahter, kuhu arvutustulemused paigutatakse (soovitav on paigutada uuele töölehel);

4) klõpsake "Ok" ja analüüsige tulemusi.

Sellel on palju kasutusvõimalusi, kuna see võimaldab ligikaudset esitust antud funktsioon teised on lihtsamad. LSM võib olla väga kasulik vaatluste töötlemisel ja seda kasutatakse aktiivselt teatud koguste hindamiseks teiste mõõtmistulemuste põhjal, mis sisaldavad juhuslikud vead. Sellest artiklist saate teada, kuidas Excelis vähimruutude arvutusi rakendada.

Probleemi avaldus konkreetsel näitel

Oletame, et on kaks indikaatorit X ja Y. Veelgi enam, Y sõltub X-st. Kuna OLS pakub meile huvi regressioonanalüüsi seisukohalt (Excelis on selle meetodid realiseeritud sisseehitatud funktsioonide abil), tuleks kohe edasi minna. konkreetse probleemi käsitlemiseks.

Nii et las X olla kaubanduspiirkond toidupood, mõõdetuna ruutmeetrit, ja Y on aastakäive, mis on defineeritud miljonites rublades.

Nõutav on teha prognoos, milline on kaupluse käive (Y), kui sellel on üks või teine ​​kaubanduspind. Ilmselgelt funktsioon Y = f (X) kasvab, kuna hüpermarket müüb rohkem kaupa kui müügilett.

Paar sõna ennustuseks kasutatud algandmete õigsusest

Oletame, et meil on n poe andmetest koostatud tabel.

Vastavalt matemaatiline statistika, on tulemused enam-vähem õiged, kui uurida vähemalt 5-6 objekti andmeid. Samuti ei saa kasutada "anomaaalseid" tulemusi. Eelkõige võib elitaarse väikese butiigi käive olla mitu korda suurem kui "masmarketi" klassi suurte kaupluste käive.

Meetodi olemus

Tabeli andmeid saab kuvada Descartes'i lennuk punktide kujul M 1 (x 1, y 1), ... M n (x n, y n). Nüüd taandatakse ülesande lahendus lähendava funktsiooni y = f (x) valikule, mille graafik läbib võimalikult lähedalt punktidele M 1, M 2, .. M n .

Muidugi võite kasutada polünoomi kõrge aste, kuid seda valikut pole mitte ainult raske rakendada, vaid see on lihtsalt vale, kuna see ei kajasta peamist suundumust, mida tuleb tuvastada. Kõige mõistlikum lahendus on otsida sirget y = ax + b, mis kõige paremini lähendab katseandmeid ja täpsemalt koefitsiente - a ja b.

Täpsusskoor

Mis tahes lähendamise puhul on selle täpsuse hindamine eriti oluline. Tähistage e i-ga punkti x i funktsionaalsete ja eksperimentaalsete väärtuste erinevus (hälve), st e i = y i - f (x i).

Ilmselt võite lähenduse täpsuse hindamiseks kasutada hälvete summat, st kui valite sirge X-i sõltuvuse Y-st ligikaudseks esitamiseks, tuleks eelistada seda, millel on väikseim väärtus summa e i kõigis vaadeldavates punktides. Kõik pole aga nii lihtne, kuna koos positiivsete kõrvalekalletega on praktiliselt ka negatiivseid.

Probleemi saate lahendada kõrvalekallete moodulite või nende ruutude abil. Kõige rohkem sai viimane meetod laialdane kasutamine. Seda kasutatakse paljudes valdkondades, sealhulgas regressioonanalüüsis (Excelis viiakse selle rakendamine läbi kahe sisseehitatud funktsiooni abil) ja selle tõhusus on juba ammu tõestatud.

Vähima ruudu meetod

Nagu teate, on Excelis sisseehitatud automaatse summa funktsioon, mis võimaldab teil arvutada kõigi valitud vahemikus asuvate väärtuste väärtused. Seega ei takista miski meil avaldise väärtust (e 1 2 + e 2 2 + e 3 2 + ... e n 2) arvutamast.

Matemaatilises tähistuses näeb see välja järgmine:

Kuna algselt otsustati ligikaudselt sirgjoont kasutada, on meil:

Seega, ülesanne leida sirgjoon, mis kõige paremini kirjeldab konkreetset seost X ja Y vahel, tähendab kahe muutuja funktsiooni miinimumi arvutamist:

Selleks tuleb uute muutujate a ja b osas võrdsustada osatuletistega null ning lahendada primitiivne süsteem, mis koosneb kahest võrrandist kahe tundmatu kujuga:

Pärast lihtsaid teisendusi, sealhulgas 2-ga jagamist ja summadega manipuleerimist, saame:

Lahendades selle näiteks Crameri meetodil, saame statsionaarne punkt mõne koefitsiendiga a * ja b * . See on miinimum, st ennustada, mis käivet kauplus millal teeb teatud ala, sobib sirgjoon y \u003d a * x + b *, mis on regressioonimudel kõnealuse näite jaoks. Muidugi ei lase ta sul leida täpne tulemus, kuid aitab teil saada aimu, kas konkreetse piirkonna jaoks poe laenu ostmine tasub end ära.

Kuidas rakendada Excelis vähimruutude meetodit

Excelis on funktsioon vähimruutude väärtuse arvutamiseks. Tal on järgmine vaade: "TREND" (teadaolevad Y väärtused; teadaolevad X väärtused; uued X väärtused; konstant). Rakendame oma tabelisse OLS-i arvutamise valemit Excelis.

Selleks sisestage lahtrisse, milles peaks kuvama Exceli vähimruutude meetodil arvutamise tulemus, märk “=” ja valige funktsioon “TREND”. Avanevas aknas täitke vastavad väljad, tõstes esile:

  • Y teadaolevate väärtuste vahemik (in sel juhul andmed kaubavahetuse käibe kohta);
  • vahemik x 1 , …x n , st kaubanduspinna suurus;
  • nii kuulus kui tundmatud väärtused x, mille jaoks tuleb välja selgitada käibe suurus (infot nende asukoha kohta töölehel vt altpoolt).

Lisaks on valemis loogiline muutuja "Const". Kui sisestate sellele vastavale väljale 1, tähendab see, et arvutused tuleks läbi viia, eeldades, et b \u003d 0.

Kui teil on vaja teada prognoosi rohkem kui ühe x väärtuse jaoks, siis pärast valemi sisestamist ei tohiks vajutada "Enter", vaid peate sisestama kombinatsiooni "Shift" + "Control" + "Enter" ("Sisesta" ) klaviatuuril.

Mõned funktsioonid

Regressioonanalüüs pääsevad ligi isegi mannekeenidega. Exceli valem tundmatute muutujate massiivi väärtuse ennustamiseks - "TREND" - saavad kasutada isegi need, kes pole vähimruutude meetodist kuulnudki. Piisab lihtsalt selle töö mõne funktsiooni tundmisest. Eriti:

  • Kui järjestame muutuja y teadaolevate väärtuste vahemiku ühte ritta või veergu, siis iga rida (veerg) teadaolevad väärtused x käsitleb programm eraldi muutujana.
  • Kui teadaoleva x-iga vahemikku pole aknas "TREND" määratud, siis funktsiooni in kasutamise korral Exceli programm käsitleb seda täisarvudest koosneva massiivina, mille arv vastab muutuja y antud väärtustega vahemikule.
  • "Prognoositud" väärtuste massiivi väljastamiseks tuleb trendi avaldis sisestada massiivivalemina.
  • Kui uusi x väärtusi pole määratud, loeb funktsioon TREND need võrdseks teadaolevatega. Kui neid ei täpsustata, võetakse argumendiks massiiv 1; 2; 3; 4;…, mis on proportsionaalne juba antud parameetritega y vahemikuga.
  • Uusi x väärtusi sisaldav vahemik peab koosnema samast või rohkem read või veerud antud y väärtustega vahemikuna. Teisisõnu peab see olema proportsionaalne sõltumatute muutujatega.
  • Teadaolevate x väärtustega massiiv võib sisaldada mitut muutujat. Kui aga me räägime ainult umbes üks, siis on nõutav, et antud x ja y väärtustega vahemikud oleksid proportsionaalsed. Mitme muutuja puhul on vajalik, et antud y väärtustega vahemik mahuks ühte veergu või ühte ritta.

PROGNOOS funktsioon

Seda rakendatakse mitme funktsiooni abil. Üks neist kannab nime "ENNUSTUS". See on sarnane TRENDiga, st annab vähimruutude meetodil tehtud arvutuste tulemuse. Kuid ainult ühe X puhul, mille Y väärtus on teadmata.

Nüüd teate mannekeenide Exceli valemeid, mis võimaldavad ennustada indikaatori tulevase väärtuse väärtust lineaarse trendi järgi.

Seda kasutatakse ökonomeetrias laialdaselt selle parameetrite selge majandusliku tõlgendamise vormis.

Lineaarne regressioon taandatakse vormi võrrandi leidmiseks

või

Tüüpvõrrand lubab seadke väärtused parameeter X neil on efektiivse tunnuse teoreetilised väärtused, asendades sellega teguri tegelikud väärtused X.

Lineaarse regressiooni loomine taandub selle parameetrite hindamisele − a ja sisse. Lineaarse regressiooni parameetrite hinnanguid saab leida erinevate meetoditega.

Klassikaline lähenemine lineaarse regressiooni parameetrite hindamisel põhineb vähimruudud(MNK).

LSM võimaldab selliseid parameetrite hinnanguid saada a ja sisse, mille all on resultanttunnuse tegelike väärtuste ruutude hälvete summa (y) arvutatud (teoreetilisest) minimaalne:

Funktsiooni miinimumi leidmiseks on vaja arvutada iga parameetri osatuletised a ja b ja võrdsusta need nulliga.

Tähistage läbi S, siis:

Valemit teisendades saame järgmine süsteem normaalvõrrandid parameetrite hindamiseks a ja sisse:

Normaalvõrrandisüsteemi (3.5) lahendamine kas meetodil järjestikune välistamine muutujad ehk determinantide meetodil leiame parameetritele vajalikud hinnangud a ja sisse.

Parameeter sisse nimetatakse regressioonikoefitsiendiks. Selle väärtus näitab tulemuse keskmist muutust teguri muutusega ühe ühiku võrra.

Regressioonivõrrandile lisandub alati seose tiheduse näitaja. Lineaarse regressiooni kasutamisel toimib sellise indikaatorina lineaarne korrelatsioonikordaja. Valemil on erinevaid versioone lineaarne koefitsient korrelatsioonid. Mõned neist on loetletud allpool:

Nagu teate, on lineaarne korrelatsioonikordaja piirides: -1 1.

Valiku kvaliteedi hindamiseks lineaarne funktsioon ruut arvutatakse

Lineaarne korrelatsioonikordaja, mida nimetatakse määramiskoefitsient . Determinatsioonikordaja iseloomustab efektiivtunnuse dispersiooni osakaalu y, seletatav regressiooniga kogu dispersioon tõhus märk:

Vastavalt sellele iseloomustab väärtus 1 - dispersiooni osakaalu y, põhjustatud muude tegurite mõjust, mida mudelis arvesse ei võeta.

Küsimused enesekontrolliks

1. Vähimruutude meetodi olemus?

2. Mitu muutujat annab paaripõhise regressiooni?

3. Milline koefitsient määrab muutustevahelise seose tiheduse?

4. Millistes piirides määratakse determinatsioonikoefitsient?

5. Parameetri b hindamine korrelatsioon-regressioonanalüüsis?

1. Christopher Dougherty. Sissejuhatus ökonomeetriasse. - M.: INFRA - M, 2001 - 402 lk.

2. S.A. Boroditš. Ökonomeetria. Minsk LLC "Uued teadmised" 2001.


3. R.U. Rahmetov Lühikursusökonomeetrias. Õpetus. Almatõ. 2004. -78s.

4. I.I. Eliseeva, ökonomeetria. - M.: "Finants ja statistika", 2002

5. Igakuine info- ja analüütiline ajakiri.

Mittelineaarsed majandusmudelid. Mittelineaarsed regressioonimudelid. Muutuv teisendus.

Mittelineaarne majandusmudelid..

Muutuv teisendus.

elastsuse koefitsient.

Kui vahel majandusnähtused on mittelineaarsed seosed, siis neid väljendatakse vastava abil mittelineaarsed funktsioonid: näiteks võrdkülgne hüperbool , teise astme paraboolid ja jne.

Mittelineaarseid regressioone on kahte klassi:

1. Regressioonid, mis on analüüsis sisalduvate selgitavate muutujate suhtes mittelineaarsed, kuid hinnanguliste parameetrite suhtes lineaarsed, näiteks:

Polünoomid erinevad kraadid - , ;

Võrdkülgne hüperbool - ;

Poollogaritmiline funktsioon - .

2. Regressioonid, mis on hinnangulistes parameetrites mittelineaarsed, näiteks:

Võimsus - ;

Demonstratiivne -;

Eksponentsiaalne - .

Hälvete ruudu summa individuaalsed väärtused tõhus funktsioon juures keskmisest väärtusest on põhjustatud paljude tegurite mõjust. Tinglikult jagame kogu põhjuste komplekti kahte rühma: uuritud faktorit x ja muud tegurid.

Kui tegur tulemust ei mõjuta, siis on graafikul olev regressioonisirge teljega paralleelne oh ja

Siis on efektiivse atribuudi kogu hajumine tingitud muude tegurite mõjust ja kogu summa ruudus hälbed langevad kokku jääkväärtusega. Kui muud tegurid tulemust ei mõjuta, siis sa sidusid koos X funktsionaalselt ja jääksumma ruudud on null. Sel juhul on regressiooniga seletatav ruutude hälvete summa võrdne ruutude kogusummaga.

Kuna kõik korrelatsioonivälja punktid ei asu regressioonisirgel, toimub nende hajumine alati nagu teguri mõjul. X, st regressioon juures peal X, ja põhjustatud muude põhjuste toimest (seletamatu variatsioon). Regressioonijoone sobivus prognoosimiseks sõltub sellest, millisest osast üldine varieeruvus märk juures seletatud variatsiooni

Ilmselgelt, kui regressioonist tingitud hälvete ruudu summa on suurem kui ruutude jääksumma, siis on regressioonivõrrand statistiliselt oluline ja tegur X mõjutab oluliselt tulemust. y.

, st tunnuse sõltumatu varieerumise vabaduse arvuga. Vabadusastmete arv on seotud üldkogumi n ühikute arvu ja sellest määratud konstantide arvuga. Seoses uuritava probleemiga peaks vabadusastmete arv näitama, kui palju on sõltumatuid kõrvalekaldeid P

Hinnang regressioonivõrrandi kui terviku olulisusele on antud abiga F- Fisheri kriteerium. Sel juhul esitatakse nullhüpotees, et regressioonikordaja on võrdne nulliga, s.o. b= 0 ja sellest ka tegur X tulemust ei mõjuta y.

F-kriteeriumi otsesele arvutamisele eelneb dispersioonianalüüs. Selle kesksel kohal on muutuja hälvete ruutude kogusumma laiendamine juures keskmisest väärtusest juures kaheks osaks - "seletatud" ja "seletamatu":

- hälvete ruudu summa;

- regressiooniga seletatavate hälvete ruudu summa;

on hälbe ruutude jääksumma.

Igasugune hälvete ruudu summa on seotud vabadusastmete arvuga , st tunnuse sõltumatu varieerumise vabaduse arvuga. Vabadusastmete arv on seotud rahvastikuühikute arvuga n ja sellest määratud konstantide arvuga. Seoses uuritava probleemiga peaks vabadusastmete arv näitama, kui palju on sõltumatuid kõrvalekaldeid P Võimalik on etteantud ruutude summa moodustamiseks.

Dispersioon vabadusastme kohtaD.

F-suhted (F-kriteerium):

Kui nullhüpotees on tõene, siis faktoriaal ja jääkdispersioon ei erine üksteisest. H 0 puhul on ümberlükkamine vajalik selleks, et teguri dispersioon ületaks jääki mitu korda. Inglise statistik Snedecor töötas välja kriitiliste väärtuste tabelid F-suhted erinevatel olulisuse tasanditel nullhüpotees ja erinevaid numbreid vabadusastmed. Tabeli väärtus F-kriteerium on dispersioonide suhte maksimaalne väärtus, mis võib toimuda nende juhusliku lahknemise korral antud tase nullhüpoteesi tekkimise tõenäosus. Arvutatud väärtus F-suhe tunnistatakse usaldusväärseks, kui o on suurem kui tabel.

Sel juhul lükatakse nullhüpotees tunnuste seose puudumise kohta tagasi ja tehakse järeldus selle seose olulisuse kohta: F fakt > F tabel H 0 lükatakse tagasi.

Kui väärtus on tabelist väiksem F fakt ‹, F tabel, siis on nullhüpoteesi tõenäosus suurem kui etteantud tase ja seda ei saa tagasi lükata ilma tõsise riskita teha suhte olemasolu kohta vale järeldus. Sel juhul peetakse regressioonivõrrandit statistiliselt ebaoluliseks. N o ei kaldu kõrvale.

Regressioonikordaja standardviga

Regressioonikordaja olulisuse hindamiseks võrreldakse selle väärtust selle väärtusega standardviga, st tegelik väärtus määratakse t- Üliõpilase kriteerium: millega siis võrreldakse tabeli väärtus teatud olulisuse ja vabadusastmete arvu juures ( n- 2).

Parameetri standardviga a:

Lineaarse korrelatsioonikordaja olulisust kontrollitakse vea suuruse alusel korrelatsioonikordaja r:

Funktsiooni täielik dispersioon X:

Mitmekordne lineaarne regressioon

Mudeli ehitamine

Mitmekordne regressioon on resultanttunnuse regressioon kahe ja suur hulk tegurid, st vaatemudel

regressioon võib anda hea tulemus modelleerimisel, kui teiste uurimisobjekti mõjutavate tegurite mõju võib tähelepanuta jätta. Üksikute majandusmuutujate käitumist ei saa kontrollida, st ei ole võimalik tagada kõigi muude tingimuste võrdsust ühe uuritava teguri mõju hindamiseks. Sel juhul peaksite proovima tuvastada teiste tegurite mõju, lisades need mudelisse, st koostama võrrandi mitmekordne regressioon: y = a+b 1 x 1 +b 2 +…+b p x p + .

Mitmekordse regressiooni põhieesmärk on luua suure hulga teguritega mudel, määrates samas igaühe mõju individuaalselt, aga ka kumulatiivset mõju modelleeritavale näitajale. Mudeli spetsifikatsioonis on kaks küsimuste valdkonda: tegurite valik ja regressioonivõrrandi tüübi valik.

Vähima ruudu meetod kasutatakse regressioonivõrrandi parameetrite hindamiseks.
Ridade arv (algandmed)

Üks tunnustevaheliste stohhastiliste seoste uurimise meetodeid on regressioonanalüüs.
Regressioonanalüüs on regressioonivõrrandi tuletamine, mida kasutatakse leidmiseks keskmine väärtus juhuslik muutuja (tunnus-tulemus), kui on teada mõne muu (või mõne muu) muutuja (tunnuse-teguri) väärtus. See sisaldab järgmisi samme.

  1. suhtlusvormi valik (tüüp analüütiline võrrand regressioon);
  2. võrrandi parameetrite hindamine;
  3. analüütilise regressioonivõrrandi kvaliteedi hindamine.
Kõige sagedamini kasutatakse tunnuste statistilise seose kirjeldamiseks lineaarset vormi. tähelepanu lineaarne ühendus on seletatav selle parameetrite selge majandusliku tõlgendusega, mis on piiratud muutujate varieerumisega, ja asjaoluga, et enamikul juhtudel teisendatakse mittelineaarsed suhtlusvormid (logaritmi võtmise või muutujate muutmise teel) lineaarseks vormiks. arvutused.
Lineaarse paarisuhte korral on regressioonivõrrand järgmine: y i =a+b·x i +u i . Valikud antud võrrand a ja b hinnatakse andmete põhjal statistiline vaatlus x ja y. Sellise hindamise tulemuseks on võrrand: , kus , - parameetrite a ja b hinnangud, - regressioonivõrrandiga saadud efektiivse tunnuse (muutuja) väärtus (arvutuslik väärtus).

Parameetrite hindamiseks kasutatakse kõige sagedamini vähimruutude meetod (LSM).
Vähimruutude meetod annab regressioonivõrrandi parameetrite parimad (järjekindlad, tõhusad ja erapooletud) hinnangud. Kuid ainult juhul, kui teatud eeldused juhusliku liikme (u) ja sõltumatu muutuja (x) kohta on täidetud (vt OLS-i eeldusi).

Lineaarse parameetrite hindamise probleem paari võrrand vähimruudud koosneb järgmisest: selliste parameetrite hinnangute saamiseks , mille puhul efektiivse tunnuse tegelike väärtuste y i ruutude kõrvalekallete summa arvutatud väärtustest on minimaalne.
Formaalselt OLS-i kriteerium võib kirjutada nii: .

Vähimruutude meetodite klassifikatsioon

  1. Vähima ruudu meetod.
  2. Maksimaalse tõenäosuse meetod (tavalise klassikalise lineaarse regressioonimudeli puhul eeldatakse regressioonijääkide normaalsust).
  3. GLSM-i üldistatud vähimruutude meetodit kasutatakse vea autokorrelatsiooni ja heteroskedastilisuse korral.
  4. Kaalutud vähimruudud ( erijuhtum GMS heteroskedastiliste jääkidega).

Illustreerige olemust klassikaline vähimruutude meetod graafiliselt. Selleks ehitame hajuvusdiagramm vaatluste järgi (x i , y i , i=1;n) sisse ristkülikukujuline süsteem koordinaadid (sellist hajuvusgraafikut nimetatakse korrelatsiooniväljaks). Proovime leida sirge, mis on korrelatsioonivälja punktidele kõige lähemal. Vähimruutude meetodi järgi valitakse sirge nii, et korrelatsioonivälja punktide ja selle sirge vahelise vertikaalkauguse ruudu summa oleks minimaalne.

Selle ülesande matemaatiline tähistus: .
Väärtused y i ja x i =1...n on meile teada, need on vaatlusandmed. Funktsioonis S on need konstandid. Selle funktsiooni muutujad on nõutavad hinnangud parameetritele - , . 2 muutuja funktsiooni miinimumi leidmiseks on vaja arvutada selle funktsiooni osatuletised iga parameetri suhtes ja võrdsustada need nulliga, s.o. .
Selle tulemusena saame süsteemi 2 normaalset lineaarvõrrandid:
Otsustades see süsteem, leiame vajalikud parameetrite hinnangud:

Regressioonivõrrandi parameetrite arvutamise õigsust saab kontrollida summade võrdlemisel (arvutuste ümardamise tõttu on võimalik mõningane ebakõla).
Parameetrite hinnangute arvutamiseks saate koostada tabeli 1.
Regressioonikordaja b märk näitab seose suunda (kui b > 0, on seos otsene, kui b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formaalselt on parameetri a väärtus y keskmine väärtus x puhul, mis võrdub nulliga. Kui märgiteguril ei ole ega saa olla nullväärtust, siis pole parameetri a ülaltoodud tõlgendusel mõtet.

Tunnustevahelise seose tiheduse hindamine tehakse lineaarse paari korrelatsiooni koefitsiendiga - r x,y . Seda saab arvutada järgmise valemi abil: . Lisaks saab lineaarse paari korrelatsiooni koefitsiendi määrata regressioonikordaja b kaudu: .
Paari korrelatsiooni lineaarse koefitsiendi lubatud väärtuste vahemik on –1 kuni +1. Korrelatsioonikordaja märk näitab seose suunda. Kui r x, y >0, siis on ühendus otsene; kui r x, y<0, то связь обратная.
Kui see koefitsient on moodulis ühtsuse lähedane, võib tunnuste vahelist seost tõlgendada üsna tiheda lineaarsena. Kui selle moodul on võrdne ühega ê r x , y ê =1, siis on tunnuste vaheline seos funktsionaalne lineaarne. Kui tunnused x ja y on lineaarselt sõltumatud, siis r x,y on nullilähedane.
Tabelit 1 saab kasutada ka r x,y arvutamiseks.

Tabel 1

N tähelepanekuidx iy ix i ∙ y i
1 x 1y 1x 1 a 1
2 x2y2x 2 a 2
...
nx ny nx n y n
Veeru summa∑x∑a∑x y
Tähendab
Saadud regressioonivõrrandi kvaliteedi hindamiseks arvutatakse teoreetiline määramiskordaja - R 2 yx:

,
kus d 2 on regressioonivõrrandiga seletatav dispersioon y;
e 2 - jääk (regressioonivõrrandiga seletamatu) dispersioon y ;
s 2 y - kogu (kogu) dispersioon y .
Determinantkoefitsient iseloomustab regressiooniga (ja järelikult faktoriga x) seletatava tulemuseks oleva tunnuse y variatsiooni (dispersiooni) osakaalu koguvariatsioonis (dispersioonis) y. Determinantkoefitsient R 2 yx võtab väärtused vahemikus 0 kuni 1. Vastavalt sellele iseloomustab väärtus 1-R 2 yx dispersiooni y osakaalu, mis on põhjustatud muude mudelis arvesse võtmata tegurite mõjust ja spetsifikatsioonivigadest.
Paaritud lineaarse regressiooniga R 2 yx =r 2 yx .

100 r esimese tellimuse boonus

Vali töö liik Lõputöö Kursusetöö Abstraktne Magistritöö Aruanne praktikast Artikkel Aruanne Arvustus Kontrolltöö Monograafia Probleemide lahendamine Äriplaan Vastused küsimustele Loovtöö Essee Joonistus Kompositsioonid Tõlge Esitlused Tippimine Muu Teksti unikaalsuse suurendamine Kandidaaditöö Laboritöö Abi on- rida

Küsi hinda

Vähimruutude meetod on matemaatiline (matemaatilis-statistiline) tehnika, mille eesmärk on aegridade võrdsustamine, juhuslike suuruste vahelise korrelatsiooni vormi tuvastamine jne. See seisneb selles, et seda nähtust kirjeldav funktsioon on ligikaudne lihtsama funktsiooniga. . Veelgi enam, viimane valitakse nii, et vaadeldavate punktide funktsiooni tegelike tasemete standardhälve (vt Variance) on tasandatud tasemetest väikseim.

Näiteks olemasolevate andmete kohaselt ( xi,yi) (i = 1, 2, ..., n) konstrueeritakse selline kõver y = a + bx, mille puhul saavutatakse hälvete ruudu summa miinimum

st funktsioon on minimeeritud, mis sõltub kahest parameetrist: a- segment y-teljel ja b- sirgjoone kalle.

Funktsiooni minimeerimiseks vajalikke tingimusi esitavad võrrandid S(a,b), kutsutakse normaalvõrrandid. Lähendavate funktsioonidena ei kasutata mitte ainult lineaarset (joondumine piki sirgjoont), vaid ka ruut-, parabool-, eksponentsiaalset jne. M.2, kus kauguste ruudu summa ( y 1 – ȳ 1)2 + (y 2 – ȳ 2)2 .... on väikseim ja saadud sirgjoon peegeldab kõige paremini mõne näitaja dünaamilise vaatlusseeria trendi ajas.

OLS-i hinnangute erapooletuse jaoks on vajalik ja piisav regressioonanalüüsi kõige olulisema tingimuse täitmine: teguritest sõltuva juhusliku vea matemaatiline ootus peab olema võrdne nulliga. Eelkõige on see tingimus täidetud, kui: 1.juhuslike vigade matemaatiline ootus on võrdne nulliga ja 2.tegurid ja juhuslikud vead on sõltumatud juhuslikud muutujad. Konstandiga mudelite puhul võib esimest tingimust lugeda alati täidetuks, kuna konstant võtab vigade suhtes nullist erineva matemaatilise ootuse. Teine tingimus - eksogeensete tegurite seisund - on fundamentaalne. Kui see omadus ei ole täidetud, siis võime eeldada, et peaaegu kõik hinnangud on äärmiselt ebarahuldavad: need pole isegi järjepidevad (st isegi väga suur hulk andmeid ei võimalda sel juhul kvalitatiivseid hinnanguid saada).

Regressioonivõrrandite parameetrite statistilise hindamise praktikas on kõige levinum vähimruutude meetod. See meetod põhineb mitmetel eeldustel andmete olemuse ja mudeli koostamise tulemuste kohta. Peamised neist on algmuutujate selge eraldamine sõltuvateks ja sõltumatuteks, võrrandites sisalduvate tegurite korrelatsioonitamatus, seose lineaarsus, jääkide autokorrelatsiooni puudumine, nende matemaatiliste ootuste võrdsus nulliga ja pidev dispersioon.

LSM-i üks peamisi hüpoteese on eeldus, et hälvete ei dispersioonid on võrdsed, s.t. nende jaotus rea keskmise (null) väärtuse ümber peaks olema stabiilne väärtus. Seda omadust nimetatakse homoskedastilisuseks. Praktikas ei ole hälvete variatsioonid üsna sageli samad, see tähendab, et täheldatakse heteroskedastilisust. Selle põhjuseks võivad olla erinevad põhjused. Näiteks võib algandmetes olla vigu. Juhuslikud ebatäpsused lähteteabes, näiteks vead numbrite järjekorras, võivad tulemusi oluliselt mõjutada. Sageli täheldatakse sõltuva muutuja (muutujate) suurte väärtuste korral kõrvalekallete єi suuremat levikut. Kui andmed sisaldavad olulist viga, siis loomulikult on ka ekslike andmete põhjal arvutatud mudeli väärtuse hälve suur. Sellest veast vabanemiseks peame vähendama nende andmete panust arvutustulemustesse, määrama neile väiksema kaalu kui kõigile ülejäänutele. Seda ideed rakendatakse kaalutud vähimruutudes.