Biografije Karakteristike Analiza

Kako funkcioniše eksponencijalno izglađivanje. Metoda eksponencijalnog izglađivanja

Zadaci predviđanja su izgrađeni na promjeni nekih podataka tokom vremena (prodaja, potražnja, ponuda, BDP, emisije ugljika, stanovništvo...) i projektovanju ovih promjena u budućnost. Nažalost, utvrđeni istorijskim podacima, trendovi mogu biti narušeni od strane mnogih nepredviđene okolnosti. Dakle, podaci u budućnosti mogu se značajno razlikovati od onih u prošlosti. Ovo je problem sa predviđanjem.

Međutim, postoje tehnike (zvane eksponencijalno izglađivanje) koje omogućavaju ne samo da se pokuša predvidjeti budućnost, već i numerički izraziti neizvjesnost svega što se odnosi na prognozu. Numerički izraz nesigurnosti kreiranjem intervala prognoze je zaista neprocjenjiv, ali se često zanemaruje u svijetu predviđanja.

Preuzmite bilješku u formatu ili, primjere u formatu

Početni podaci

Recimo da ste obožavatelj Gospodara prstenova i da pravite i prodajete mačeve tri godine (Slika 1). Pokažimo prodaju grafički (slika 2). Potražnja se udvostručila za tri godine – možda je to trend? Na ovu ideju ćemo se vratiti malo kasnije. Na grafikonu postoji nekoliko vrhova i dolina, što može biti znak sezonskog karaktera. Konkretno, vrhunci su u mjesecima 12, 24 i 36, koji su u decembru. Ali možda je to samo slučajnost? Saznajmo.

Jednostavno eksponencijalno izglađivanje

Metode eksponencijalno izglađivanje zasnivaju se na predviđanju budućnosti na osnovu podataka iz prošlosti, gdje su novija zapažanja teža od starijih. Takvo ponderisanje je moguće zahvaljujući konstantama glađenja. Prva metoda eksponencijalnog izglađivanja koju ćemo isprobati zove se jednostavno eksponencijalno izglađivanje (PES). eksponencijalno izglađivanje, SES). Koristi samo jednu konstantu izravnavanja.

Jednostavno eksponencijalno izglađivanje pretpostavlja da vaša vremenska serija podataka ima dvije komponente: nivo (ili srednju vrijednost) i neku grešku oko te vrijednosti. Nema trenda ili sezonskih fluktuacija – postoji samo nivo oko kojeg tražnja fluktuira, okružena malim greškama tu i tamo. Davanjem prednosti novijim zapažanjima, TEC može uzrokovati pomake na ovom nivou. Jezikom formula,

Potražnja u trenutku t = nivo + slučajna greška blizu nivoa u trenutku t

Kako onda pronaći približnu vrijednost nivoa? Ako prihvatimo da sve vremenske vrijednosti imaju istu vrijednost, onda bismo jednostavno trebali izračunati njihovu prosječnu vrijednost. Međutim, ovo je loša ideja. Nedavnim zapažanjima treba dati veću težinu.

Hajde da napravimo nekoliko nivoa. Izračunajte osnovnu liniju za prvu godinu:

nivo 0 = prosječna potražnja za prvu godinu (1-12 mjeseci)

Za potražnju za mačem, to je 163. Koristimo nivo 0 (163) kao prognozu potražnje za mjesec 1. Potražnja u mjesecu 1 je 165, što je 2 mača iznad nivoa 0. Vrijedi ažurirati osnovnu aproksimaciju. Jednostavna eksponencijalna jednačina za izglađivanje:

nivo 1 = nivo 0 + nekoliko procenata × (potražnja 1 - nivo 0)

nivo 2 = nivo 1 + nekoliko procenata × (potražnja 2 - nivo 1)

itd. "Nekoliko procenata" se naziva konstanta izglađivanja i označava se sa alfa. Može biti bilo koji broj od 0 do 100% (0 do 1). Kasnije ćete naučiti kako odabrati alfa vrijednost. AT opšti slučaj vrijednost za različite trenutke u vremenu:

Nivo tekućeg perioda = nivo prethodnog perioda +
alfa × (trenutni period potražnje - nivo prethodnog perioda)

Buduća potražnja je jednaka posljednjem izračunatom nivou (slika 3). Pošto ne znate šta je alfa, postavite ćeliju C2 na 0,5 za početak. Nakon što je model izgrađen, pronađite alfu takvu da je zbir kvadrata greške E2 (ili standardna devijacija– F2) bili su minimalni. Da biste to učinili, pokrenite opciju Pronalaženje rješenja. Da biste to učinili, prođite kroz meni PODACI –> Pronalaženje rješenja, i postavite u prozor Opcije pretraživanja rješenja tražene vrijednosti (slika 4). Da biste prikazali rezultate prognoze na grafikonu, prvo odaberite raspon A6:B41 i napravite jednostavan linijski grafikon. Zatim kliknite desnim tasterom miša na dijagram, odaberite opciju Odaberite podatke. U prozoru koji se otvori kreirajte drugi red i u njega umetnite predviđanja iz opsega A42:B53 (slika 5).

Možda imate trend

Da bismo testirali ovu pretpostavku, dovoljno je da se uklopi linearna regresija pod podacima o potražnji i izvršite t-test na porast ove linije trenda (kao u ). Ako je nagib prave različit od nule i statistički značajan (u Studentovom testu, vrijednost R manji od 0,05), podaci imaju trend (slika 6).

Koristili smo funkciju LINEST, koja vraća 10 deskriptivna statistika(ako do sada niste koristili ovu funkciju, preporučujem je) i funkciju INDEX koja vam omogućava da "izvučete" samo tri potrebne statistike, a ne cijeli skup. Ispostavilo se da je nagib 2,54, i značajan, budući da je Studentov test pokazao da je 0,000000012 značajno manje od 0,05. Dakle, trend postoji i ostaje da ga uključimo u prognozu.

Eksponencijalno Holt izglađivanje sa korekcijom trenda

Često se naziva dvostruko eksponencijalno izglađivanje jer ima dva parametra izglađivanja, alfa, a ne jedan. Ako vremenski niz ima linearni trend, tada:

potražnja tokom vremena t = nivo + t × trend + nasumično odstupanje nivo u trenutku t

Holt eksponencijalno izglađivanje s korekcijom trenda ima dvije nove jednadžbe, jednu za nivo dok se kreće naprijed u vremenu, a drugu za trend. Jednačina nivoa sadrži parametar glađenja alfa, a jednačina trenda gama. Evo kako izgleda nova jednačina nivoa:

nivo 1 = nivo 0 + trend 0 + alfa × (potražnja 1 - (nivo 0 + trend 0))

Zapiši to nivo 0 + trend 0 je samo prognoza u jednom koraku od originalnih vrijednosti do 1. mjeseca, dakle potražnja 1 – (nivo 0 + trend 0) je jednostepeno odstupanje. Dakle, jednačina aproksimacije osnovnog nivoa će biti sljedeća:

nivo tekućeg perioda = nivo prethodnog perioda + trend prethodnog perioda + alfa × (potražnja u tekućem periodu - (nivo prethodnog perioda) + trend prethodnog perioda))

Jednačina ažuriranja trenda:

trend tekućeg perioda = trend prethodnog perioda + gama × alfa × (trenutni period potražnje – (nivo prethodni period) + trend prethodni period))

Holt izglađivanje u Excel-u je slično jednostavnom izglađivanju (slika 7), a, kao i gore, cilj je pronaći dva koeficijenta uz minimiziranje sume grešaka na kvadrat (slika 8). Da biste dobili izvorni nivo i vrijednosti trenda (u ćelijama C5 i D5 na slici 7), napravite grafikon za prvih 18 mjeseci prodaje i dodajte mu liniju trenda s jednadžbom. Unesite početnu vrijednost trenda od 0,8369 i početni nivo od 155,88 u ćelije C5 i D5. Podaci o prognozi mogu se prikazati grafički (slika 9).

Rice. 7. Eksponencijalno Holt izglađivanje sa korekcijom trenda; Da biste uvećali sliku, kliknite desnim tasterom miša na nju i izaberite Otvorite sliku u novoj kartici

Pronalaženje obrazaca u podacima

Postoji način da se testira prediktivni model na snagu - da se uporede greške sa samim sobom, pomaknute za korak (ili nekoliko koraka). Ako su odstupanja slučajna, onda se model ne može poboljšati. Međutim, može postojati sezonski faktor u podacima o potražnji. Koncept greške koja je u korelaciji sa sopstvenom verzijom tokom različitog perioda naziva se autokorelacija (više o autokorelaciji pogledajte ). Da biste izračunali autokorelaciju, počnite sa podacima o grešci prognoze za svaki period (prenesite kolonu F na slici 7 u kolonu B na slici 10). Sljedeća definicija prosečna greška prognoza (Slika 10, ćelija B39; formula u ćeliji: =PROSEK(B3:B38)). U koloni C izračunajte odstupanje greške prognoze od srednje vrijednosti; formula u ćeliji C3: =B3-B$39. Zatim, uzastopno pomjerite kolonu C za kolonu udesno i za red dolje. Formule u ćelijama D39: =SUMPROIZVOD($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Šta može značiti "sinhrono kretanje" sa stupcem C za jedan od stupaca D: O. Na primjer, ako su stupci C i D sinhroni, onda broj koji je negativan u jednom od njih mora biti negativan u drugom, pozitivan u jednom , pozitivan u prijatelju. To znači da će zbir proizvoda dva stupca biti značajan (razlike se akumuliraju). Ili, što je isto, što je vrednost u opsegu D41:O41 bliža nuli, to je niža korelacija kolone (odnosno od D do O) sa kolonom C (slika 11).

Jedna autokorelacija je iznad kritične vrijednosti. Greška pomjerena za godinu korelira sama sa sobom. To znači 12-mjesečni sezonski ciklus. I to nije iznenađujuće. Ako pogledate grafikon potražnje (Slika 2), ispostavlja se da potražnja ima vrhunce svakog Božića i padove u aprilu-maju. Razmotrite tehniku ​​predviđanja koja uzima u obzir sezonalnost.

Multiplikativno eksponencijalno Holt-Winters izglađivanje

Metoda se naziva multiplikativnim (od multiplicate - umnožavati), jer koristi množenje za obračun sezonalnosti:

Potražnja u trenutku t = (nivo + t × trend) × sezonska prilagodba u vrijeme t × sva preostala nepravilna prilagođavanja koja ne možemo uzeti u obzir

Holt-Wintersovo izglađivanje se naziva i trostruko eksponencijalno izglađivanje jer ima tri parametra izglađivanja (alfa, gama i delta sezonski faktor). Na primjer, ako postoji sezonski ciklus od 12 mjeseci:

Mjesečna prognoza 39 = (nivo 36 + 3 × trend 36) x sezonalnost 27

Prilikom analize podataka potrebno je utvrditi koji je trend u nizu podataka, a koja sezonalnost. Da biste izvršili proračune pomoću Holt-Wintersove metode, morate:

  • Glatke historijske podatke koristeći metodu pokretnog prosjeka.
  • Uporedite uglađenu verziju vremenske serije s originalnom da biste dobili grubu procjenu sezonskosti.
  • Dobijte nove podatke bez sezonske komponente.
  • Pronađite aproksimacije nivoa i trenda na osnovu ovih novih podataka.

Počnite s originalnim podacima (kolone A i B na slici 12) i dodajte stupac C sa izglađenim vrijednostima na osnovu pokretnog prosjeka. Budući da sezonalnost ima ciklus od 12 mjeseci, ima smisla koristiti prosjek od 12 mjeseci. Postoji mali problem sa ovim prosjekom. 12 je paran broj. Ako izravnate potražnju za 7. mjesec, da li to treba smatrati prosječnom potražnjom od 1. do 12. ili od 2. do 13. mjeseca? Da bismo se izborili sa ovom poteškoćom, moramo da izgladimo potražnju koristeći "pokretni prosek 2x12". Odnosno, uzmite polovinu dva proseka od 1. do 12. i od 2. do 13. meseca. Formula u ćeliji C8 je: =(PROSEK(B3:B14)+PROSEK(B2:B13))/2.

Izglađeni podaci za mjesece 1–6 i 31–36 ne mogu se dobiti jer nema dovoljno prethodnih i narednih perioda. Radi jasnoće, originalni i izglađeni podaci mogu biti prikazani dijagramom (slika 13).

Sada, u koloni D, podijelite originalnu vrijednost sa izglađenom vrijednošću da biste dobili procjenu sezonskog prilagođavanja (kolona D na slici 12). Formula u ćeliji D8: =B8/C8. Obratite pažnju na skokove od 20% iznad normalne potražnje u 12. i 24. mjesecu (decembar), dok ima padova u proljeće. Ova tehnika zaglađivanja vam je dala dvoje bodovne procjene za svaki mjesec (ukupno 24 mjeseca). Kolona E je prosjek ova dva faktora. Formula u ćeliji E1 je: =PROSEK(D14,D26). Radi jasnoće, nivo sezonskih fluktuacija može se prikazati grafički (slika 14).

Sada možete prilagoditi podatke za sezonske fluktuacije. Formula u ćeliji G1: =B2/E2. Napravite grafikon na osnovu podataka u koloni G, dopunite ga linijom trenda, prikažite jednačinu trenda na grafikonu (slika 15) i koristite koeficijente u narednim proračunima.

formu novi list, kao što je prikazano na sl. 16. Zamijenite vrijednosti u opsegu E5:E16 sa sl. 12 oblasti E2:E13. Uzmite vrijednosti C16 i D16 iz jednadžbe linije trenda na sl. 15. Postavite vrijednosti konstanti izglađivanja da počnu od oko 0,5. Proširite vrijednosti u redu 17 u rasponu mjeseci od 1 do 36. Pokreni Pronalaženje rješenja za optimizaciju koeficijenata izglađivanja (slika 18). Formula u ćeliji B53: =(C$52+(A53-A$52)*D$52)*E41.

Sada u napravljenoj prognozi potrebno je provjeriti autokorelacije (slika 18). Budući da se sve vrijednosti nalaze između gornje i donje granice, shvatite da je model dobro razumio strukturu vrijednosti potražnje.

Izgradnja intervala povjerenja za prognozu

Dakle, imamo prilično radnu prognozu. Kako postaviti gornje i donje granice koje se mogu koristiti za realistična nagađanja? U tome će vam pomoći simulacija Monte Carla, u kojoj ste se već upoznali (vidi također ). Poenta je generirati buduće scenarije ponašanja potražnje i odrediti grupu u koju spada 95% njih.

Uklonite sa lista Excel prognoza iz ćelija B53:B64 (vidi sliku 17). Tamo ćete napisati potražnju na osnovu simulacije. Potonji se može generirati pomoću funkcije NORMINV. Za naredne mjesece, samo treba da ga snabdjete srednjom (0), standardnom distribucijom (10,37 iz ćelije $H$2) i slučajni broj od 0 do 1. Funkcija će vratiti odstupanje sa vjerovatnoćom koja odgovara zvonovoj krivulji. Stavite simulaciju greške u jednom koraku u ćeliju G53: =NORMINV(RAND();0;H$2). Proširivanje ove formule na G64 daje vam simulaciju greške prognoze za 12-mjesečnu prognozu u jednom koraku (Slika 19). Vaše simulacijske vrijednosti će se razlikovati od onih prikazanih na slici (zato je to simulacija!).

Uz grešku prognoze, imate sve što vam je potrebno za ažuriranje nivoa, trenda i sezonskog faktora. Dakle, odaberite ćelije C52:F52 i proširite ih na red 64. Kao rezultat, imate simuliranu grešku prognoze i samu prognozu. Idući od suprotnog, moguće je predvidjeti vrijednosti potražnje. Umetnite formulu u ćeliju B53: =F53+G53 i rastegnite je na B64 (slika 20, opseg B53:F64). Sada možete pritisnuti dugme F9, svaki put ažurirajući prognozu. Postavite rezultate 1000 simulacija u ćelije A71:L1070, svaki put transponujući vrednosti iz opsega B53:B64 u opseg A71:L71, A72:L72, ... A1070:L1070. Ako vam smeta, napišite VBA kod.

Sada imate 1000 scenarija za svaki mjesec i možete koristiti funkciju PERCENTIL da biste dobili gornje i donje granice u sredini intervala pouzdanosti od 95%. U ćeliji A66, formula je: =PERCENTIL(A71:A1070,0,975) a u ćeliji A67: =PERCENTIL(A71:A1070,0,025).

Kao i obično, radi jasnoće, podaci se mogu prikazati u grafički oblik(Sl. 21).

Postoje dvije zanimljive tačke na grafikonu:

  • Margina greške raste s vremenom. Ima smisla. Neizvjesnost se akumulira svakog mjeseca.
  • Na isti način, greška se povećava u dijelovima koji padaju na periode sezonskog porasta potražnje. Sa njegovim kasnijim padom, greška se smanjuje.

Zasnovan na materijalu iz knjige Johna Foremana. – M.: Alpina Publisher, 2016. – S. 329–381

Pokretni prosek vam omogućava da savršeno izgladite podatke. Ali njegov glavni nedostatak je što svaka vrijednost u izvornim podacima ima istu težinu. Na primjer, za pokretni prosjek koji koristi period od šest sedmica, svakoj vrijednosti za svaku sedmicu se daje 1/6 težine. Za neke prikupljene statistike, novijim vrijednostima se daje veća težina. Zbog toga se koristi eksponencijalno izglađivanje kako bi se najnovijim podacima dala veća težina. Time je ovaj statistički problem riješen.

Formula za izračunavanje metode eksponencijalnog izglađivanja u Excelu

Slika ispod prikazuje izvještaj o potražnji za određenim proizvodom za 26 sedmica. Kolona Potražnja sadrži podatke o količini prodate robe. U koloni "Prognoza" - formula:

Kolona "Pokretni prosek" definiše prognoziranu potražnju, izračunatu korišćenjem uobičajenog izračunavanja pokretnog proseka sa periodom od 6 nedelja:

U posljednjoj koloni "Prognoza", uz gore opisanu formulu, primjenjuje se metoda eksponencijalnog izglađivanja podataka u kojoj vrijednosti posljednjih sedmica imaju veću težinu od prethodnih.

U ćeliju G1 se upisuje koeficijent "Alpha:", što znači težinu dodjele najnovijim podacima. AT ovaj primjer ima vrijednost od 30%. Preostalih 70% težine se raspoređuje na ostatak podataka. Odnosno, druga vrijednost u smislu relevantnosti (s desna na lijevo) ima težinu jednaku 30% od preostalih 70% težine - ovo je 21%, treća vrijednost ima težinu jednaku 30% ostatka od 70% težine - 14,7% i tako dalje.



Eksponencijalni dijagram izravnavanja

Na slici ispod prikazan je graf potražnje, pokretni prosjek i prognoza eksponencijalnog izglađivanja, koja je izgrađena na osnovu originalnih vrijednosti:


Imajte na umu da je eksponencijalna prognoza izglađivanja osjetljivija na promjene u potražnji nego linija pokretnog prosjeka.

Podaci za uzastopne prethodne sedmice se množe sa alfa koeficijentom, a rezultat se dodaje ostatku težinskog procenta pomnoženog s prethodnom predviđenom vrijednošću.

9 5. Metoda eksponencijalnog izglađivanja. Odabir konstante izravnavanja

Kada koristite metodu najmanji kvadrati da bi se odredio prediktivni trend (trend), unaprijed se pretpostavlja da svi retrospektivni podaci (zapažanja) imaju isti sadržaj informacija. Očigledno bi bilo logičnije uzeti u obzir proces diskontiranja pozadinske informacije, odnosno disparitet ovih podataka za izradu prognoze. Ovo se postiže metodom eksponencijalnog izglađivanja davanjem posljednjih zapažanja vremenske serije (odnosno vrijednostima koje neposredno prethode početnom periodu prognoze) davanjem značajnijih "težina" u odnosu na početna zapažanja. Prednosti metode eksponencijalnog izglađivanja trebale bi uključiti i jednostavnost računskih operacija i fleksibilnost opisivanja različitih dinamika procesa. Metoda je našla najveću primjenu za implementaciju srednjoročnih prognoza.

5.1. Suština metode eksponencijalnog izglađivanja

Suština metode je u tome dinamičke serije je izglađen ponderisanim "pokretnim prosjekom" u kojem ponderi slijede eksponencijalni zakon. Drugim riječima, što je udaljenija od kraja vremenske serije tačka za koju se izračunava ponderisani pokretni prosek, to je manje „učešće potrebno“ u razvoju prognoze.

Neka se originalni dinamički niz sastoji od nivoa (komponenti serije) y t , t = 1 , 2 ,...,n . Za svaki m uzastopnih nivoa ove serije

(m

dinamički niz sa korakom jednakim jedan. Ako je m neparan broj, a poželjno je uzeti neparan broj nivoa, jer će u ovom slučaju izračunata vrijednost nivoa biti u središtu intervala izravnavanja i lako je njome zamijeniti stvarnu vrijednost, tada sljedeća formula se može napisati za određivanje pokretnog prosjeka:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t−ξ

i= t−ξ

2ξ + 1

gdje je y t vrijednost pokretnog prosjeka za trenutak t (t = 1 , 2 ,...,n ), y i je stvarna vrijednost nivoa u trenutku i ;

i je redni broj nivoa u intervalu izravnavanja.

Vrijednost ξ se određuje iz trajanja intervala ujednačavanja.

Ukoliko

m =2 ξ +1

za neparan m, onda

ξ = m 2 − 1 .

Izračunavanje pokretnog prosjeka za veliki broj nivoa može se pojednostaviti rekurzivnim definiranjem uzastopnih vrijednosti pokretnog prosjeka:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Ali s obzirom na činjenicu da je najnovijim zapažanjima potrebno dati više "težine", pokretni prosek treba drugačije tumačiti. Ona leži u činjenici da vrijednost dobijena usrednjavanjem ne zamjenjuje središnji član intervala usrednjavanja, već njegov posljednji član. Shodno tome, posljednji izraz se može prepisati kao

Mi = Mi + 1

y i− y i− m

Ovdje je pokretni prosjek, vezan za kraj intervala, označen novim simbolom M i . U suštini, M i je jednako y t pomaknutog ξ koraka udesno, odnosno M i = y t + ξ , gdje je i = t + ξ .

S obzirom da je M i − 1 procjena y i − m , izraz (5.1)

može se prepisati u formu

y i+ 1

M i − 1 ,

M i definisan izrazom (5.1).

gdje je M i procjena

Ako se proračuni (5.2) ponavljaju kako pristižu nove informacije

i prepišemo u drugom obliku, tada dobijamo izglađenu funkciju posmatranja:

Q i= α y i+ (1 − α ) Q i− 1 ,

ili u ekvivalentnom obliku

Q t= α y t+ (1 − α ) Q t− 1

Proračuni koji se izvode izrazom (5.3) sa svakim novim opažanjem nazivaju se eksponencijalno izglađivanje. U posljednjem izrazu, da bi se razlikovalo eksponencijalno izglađivanje od pokretnog prosjeka, uvedena je oznaka Q umjesto M. Vrijednost α , koja je

analog od m 1 naziva se konstanta glađenja. Vrijednosti α leže u

interval [ 0 , 1 ] . Ako je α predstavljen kao niz

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

lako je vidjeti da se "težine" eksponencijalno smanjuju tokom vremena. Na primjer, za α = 0 dobijamo 2

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Zbir niza teži jedinici, a članovi sume se s vremenom smanjuju.

Vrijednost Q t u izrazu (5.3) je eksponencijalni prosjek prvog reda, odnosno prosjek dobijen direktno iz

izglađivanje podataka posmatranja (primarno izglađivanje). Ponekad je pri razvoju statističkih modela korisno pribjeći izračunavanju eksponencijalnih prosjeka viših redova, odnosno prosjeka dobijenih ponovljenim eksponencijalnim izglađivanjem.

Opća notacija u rekurzivnom obliku eksponencijalne sredine reda k je

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Vrijednost k varira unutar 1, 2, …, p ,p+1, gdje je p red prediktivnog polinoma (linearnog, kvadratnog i tako dalje).

Na osnovu ove formule, za eksponencijalni prosjek prvog, drugog i trećeg reda, daju se izrazi

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Određivanje parametara prediktivnog modela korištenjem metode eksponencijalnog izglađivanja

Očigledno, da bi se razvile prediktivne vrijednosti bazirane na dinamičkom nizu korištenjem metode eksponencijalnog izglađivanja, potrebno je izračunati koeficijente jednadžbe trenda kroz eksponencijalne prosjeke. Procjene koeficijenata su određene temeljnom Brown-Meyerovom teoremom, koja povezuje koeficijente prediktivnog polinoma sa eksponencijalnim prosjekima odgovarajućih redova:

(− 1 )

aˆ str

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑ j

p=0

p! (k− 1 ) !j = 0

gdje su aˆ p procjene koeficijenata polinoma stepena p.

Koeficijenti se nalaze rješavanjem sistema (p + 1 ) jednadžbi sp + 1

nepoznato.

Dakle, za linearni model

aˆ 0 = 2 Q t (1 ) − Q t (2 ) ; aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

za kvadratni model

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Prognoza se implementira prema odabranom polinomu, odnosno za linearni model

ˆyt + τ = aˆ0 + aˆ1 τ ;

za kvadratni model

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

gdje je τ korak predviđanja.

Treba napomenuti da se eksponencijalni proseci Q t (k ) mogu izračunati samo sa poznatim (izabranim) parametrom, znajući početne uslove Q 0 (k ) .

Procjene početnih uslova, posebno za linearni model

Q(1)= a

1 − α

Q(2 ) = a − 2 (1 − α ) a

za kvadratni model

Q(1)= a

1 − α

+ (1 − α )(2 − α ) a

2(1−α )

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q(3)=a

3(1−α )

(1 − α )(4 − 3 α ) a

gdje su koeficijenti a 0 i a 1 izračunati metodom najmanjih kvadrata.

Vrijednost parametra izglađivanja α se približno izračunava po formuli

α ≈ m 2 + 1,

gdje je m broj zapažanja (vrijednosti) u intervalu izravnavanja. Redoslijed izračunavanja prediktivnih vrijednosti je prikazan u

Izračunavanje koeficijenata niza metodom najmanjih kvadrata

Određivanje intervala zaglađivanja

Proračun konstante glađenja

Proračun početnih uslova

Izračunavanje eksponencijalnih prosjeka

Izračunavanje procjena a 0 , a 1 itd.

Proračun prognostičkih vrijednosti serije

Rice. 5.1. Redoslijed izračunavanja vrijednosti prognoze

Kao primjer, razmotrite proceduru za dobivanje prediktivne vrijednosti radnog vremena proizvoda, izraženu vremenom između kvarova.

Početni podaci su sažeti u tabeli. 5.1.

Biramo model linearnog predviđanja u obliku y t = a 0 + a 1 τ

Rješenje je izvodljivo sa sljedećim početnim vrijednostima:

a 0 , 0 = 64, 2; a 1 , 0 = 31,5; α = 0,305.

Tabela 5.1. Početni podaci

Broj zapažanja, t

Dužina koraka, predviđanje, τ

MTBF, y (sat)

Za ove vrijednosti, izračunati "izglađeni" koeficijenti za

y 2 vrijednosti će biti jednake

= α Q (1 )− Q (2 )= 97 , 9 ;

[ Q (1 ) − Q (2 )

31, 9 ,

1−α

pod početnim uslovima

1 − α

A 0 , 0 −

a 1, 0

= −7 , 6

1 − α

= −79 , 4

i eksponencijalni prosjeci

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q(2)

= α Q (1 )

+ (1 −α ) Q (2 ) = −47 , 5 .

“Izglađena” vrijednost y 2 se tada izračunava po formuli

Q i (1 )

Q i (2 )

a 0 ,i

a 1 ,i

ˆyt

Dakle (Tabela 5.2), linearni prediktivni model ima oblik

ˆy t + τ = 224,5+ 32τ .

Izračunajmo predviđene vrijednosti za olovne periode od 2 godine (τ = 1), 4 godine (τ = 2) i tako dalje, vrijeme između kvarova proizvoda (tabela 5.3).

Tabela 5.3. Vrijednosti prognozeˆy t

Jednačina

t+2

t+4

t+6

t+8

t+20

regresija

(τ = 1)

(τ=2)

(τ = 3)

(τ=5)

τ =

ˆy t = 224,5+ 32τ

Treba napomenuti da se ukupna "težina" posljednjih m vrijednosti vremenske serije može izračunati po formuli

c = 1 − (m (− 1) m ) . m+ 1

Dakle, za posljednja dva opažanja serije (m = 2 ) vrijednost c = 1 − (2 2 − + 1 1 ) 2 = 0. 667 .

5.3. Izbor početnih uslova i određivanje konstante glađenja

Kao što slijedi iz izraza

Q t= α y t+ (1 − α ) Q t− 1 ,

pri izvođenju eksponencijalnog izglađivanja potrebno je znati početnu (prethodnu) vrijednost izglađene funkcije. U nekim slučajevima, prvo opažanje se može uzeti kao početna vrijednost, češće se početni uvjeti određuju prema izrazima (5.4) i (5.5). U ovom slučaju, vrijednosti a 0 , 0 , a 1 , 0

i a 2 , 0 određuju se metodom najmanjih kvadrata.

Ako zaista ne vjerujemo odabranoj početnoj vrijednosti, tada ćemo uzimanjem velike vrijednosti konstante glađenja α kroz k opservacija donijeti

"težinu" početne vrijednosti do vrijednosti (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Dakle, izbor konstante izglađivanja (ili broja posmatranja u pokretnom proseku) uključuje kompromis. Obično, kao što praksa pokazuje, vrijednost konstante izglađivanja leži u rasponu od 0,01 do 0,3.

Poznato je nekoliko prelaza koji omogućavaju pronalaženje približne procjene α . Prvi proizilazi iz uslova da su pokretni i eksponencijalni prosek jednaki

α \u003d m 2 + 1,

gdje je m broj opservacija u intervalu glađenja. Drugi pristupi su povezani sa tačnošću prognoze.

Dakle, moguće je odrediti α na osnovu Meyerove relacije:

α ≈ S y ,

gdje je S y standardna greška modela;

S 1 je srednja kvadratna greška originalne serije.

Međutim, korištenje posljednjeg omjera je komplikovano činjenicom da je vrlo teško pouzdano odrediti S y i S 1 iz početnih informacija.

Često parametar izglađivanja, a istovremeno i koeficijenti a 0 , 0 i a 0 , 1

se biraju kao optimalne u zavisnosti od kriterijuma

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j=0

rješavanjem algebarskog sistema jednadžbi, koji se dobija izjednačavanjem izvoda sa nulom

∂S2

∂S2

∂S2

∂a0, 0

∂ a 1, 0

∂a2, 0

Dakle, za model linearnog predviđanja, početni kriterijum je jednak

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j=0

Rješenje ovog sistema uz pomoć kompjutera ne predstavlja poteškoće.

Za razuman izbor α, možete koristiti i generaliziranu proceduru izglađivanja, koja vam omogućava da dobijete sljedeće odnose koji se odnose na varijansu prognoze i parametar izglađivanja za linearni model:

S p 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

za kvadratni model

S p 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

gdje je β = 1 α ;Sy– RMS aproksimacija početne dinamičke serije.

Tema 3. Izglađivanje i predviđanje vremenskih serija na osnovu trend modela

cilj proučavanje ove teme je stvaranje osnovne osnove za obuku menadžera u specijalnosti 080507 u oblasti izgradnje modela različitih zadataka iz oblasti ekonomije, formiranje sistematskog pristupa postavljanju i rešavanju problema prognoziranja među studentima. . Predloženi tečaj omogućit će stručnjacima da se brzo prilagode praktičnom radu, bolje snalaze u naučnim i tehničkim informacijama i literaturi u ovoj specijalnosti i donose sigurnije odluke koje se pojavljuju u radu.

Main zadataka Studije teme su: studenti sticanje dubinskih teorijskih znanja o primjeni prognostičkih modela, sticanje stabilnih vještina u izvođenju istraživačkog rada, sposobnost rješavanja složenih naučnih problema vezanih za izgradnju modela, uključujući i višedimenzionalne, sposobnost logičke analize dobijene rezultate i odrediti načine za pronalaženje prihvatljivih rješenja.

Prilično jednostavan metod za identifikaciju razvojnih trendova je izglađivanje vremenskih serija, tj. zamjena stvarnih nivoa izračunatim koji imaju manje varijacije od originalnih podataka. Odgovarajuća transformacija se zove filtriranje. Razmotrimo nekoliko metoda zaglađivanja.

3.1. jednostavni proseci

Cilj ujednačavanja je izgradnja modela prognoze za buduće periode na osnovu prošlih zapažanja. U metodi jednostavnih prosjeka, vrijednosti varijable se uzimaju kao početni podaci Y u trenucima vremena t, a vrijednost prognoze se utvrđuje kao jednostavan prosjek za naredni vremenski period. Formula za izračunavanje ima oblik

gdje n je broj zapažanja.

U slučaju kada novo zapažanje postane dostupno, novoprimljenu prognozu treba uzeti u obzir i za predviđanje za naredni period. Kada se koristi ova metoda, prognoza se vrši usrednjavanjem svih prethodnih podataka, međutim, nedostatak takvog predviđanja je teškoća njegove upotrebe u trend modelima.

3.2. Metoda pokretnog prosjeka

Ova metoda se zasniva na predstavljanju serije kao zbira prilično glatkog trenda i slučajne komponente. Metoda se temelji na ideji izračunavanja teorijske vrijednosti na temelju lokalne aproksimacije. Za izgradnju procjene trenda u određenoj tački t po vrijednostima serije iz vremenskog intervala izračunati teorijsku vrijednost serije. Najrasprostranjeniji u praksi izglađivanja nizova je slučaj kada su sve težine za elemente intervala su jednake jedna drugoj. Iz tog razloga se ova metoda naziva metoda pokretnog prosjeka, od kada se izvršava procedura, prozor širine od (2 m + 1) u celom redu. Širina prozora se obično uzima neparno, jer se teoretska vrijednost izračunava za centralnu vrijednost: broj pojmova k = 2m + 1 sa istim brojem nivoa lijevo i desno od trenutka t.

Formula za izračunavanje pokretnog prosjeka u ovom slučaju ima oblik:

Disperzija pokretnog prosjeka je definirana kao σ 2 /k, gde kroz σ2 označava varijansu originalnih termina serije, i k— interval izglađivanja, tako da što je veći interval izglađivanja, to je jače usrednjavanje podataka i manje promenljiv identifikovani trend. Najčešće se izglađivanje izvodi na tri, pet i sedam članova originalne serije. U ovom slučaju treba uzeti u obzir sljedeće karakteristike pokretnog prosjeka: ako uzmemo u obzir niz s periodičnim fluktuacijama konstantne dužine, onda kada se izglađuje na osnovu pokretnog prosjeka sa intervalom izravnavanja jednakim ili višekratnim od perioda , fluktuacije će biti potpuno eliminirane. Često, izglađivanje zasnovano na pokretnom prosjeku transformiše niz tako snažno da se identifikovani trend razvoja pojavljuje samo u najopštijim terminima, dok manji, ali važni za analizu detalji (talasi, krivine, itd.) nestaju; nakon zaglađivanja, mali valovi ponekad mogu promijeniti smjer u suprotan - umjesto "vrhova" pojavljuju se "jame" i obrnuto. Sve ovo zahtijeva oprez u korištenju jednostavnog pokretnog prosjeka i prisiljava nas da tražimo suptilnije metode opisa.

Metoda pokretnog prosjeka ne daje vrijednosti trenda za prvu i posljednju mčlanovi reda. Ovaj nedostatak je posebno uočljiv u slučaju kada je dužina reda mala.

3.3. Eksponencijalno izglađivanje

Eksponencijalni prosjek y t je primjer asimetričnog ponderiranog pokretnog prosjeka koji uzima u obzir stupanj starenja podataka: "starije" informacije s manjom težinom ulaze u formulu za izračunavanje izglađene vrijednosti nivoa serije

Evo — eksponencijalna sredina koja zamjenjuje promatranu vrijednost serije y t(izglađivanje uključuje sve podatke primljene do trenutnog trenutka t), α je parametar izravnavanja koji karakterizira težinu trenutnog (najnovijeg) opažanja;< α <1.

Metoda se koristi za predviđanje nestacionarnih vremenskih serija sa nasumičnim promjenama nivoa i nagiba. Kako se udaljavamo od trenutnog trenutka vremena u prošlost, težina odgovarajućeg člana serije brzo (eksponencijalno) opada i praktično prestaje da utiče na vrijednost .

Lako je vidjeti da nam posljednja relacija omogućava da damo sljedeću interpretaciju eksponencijalne sredine: ako — predviđanje vrijednosti serije y t, tada je razlika greška prognoze. Dakle, predviđanje za sljedeću tačku u vremenu t+1 uzima u obzir ono što je u ovom trenutku postalo poznato t greška prognoze.

Opcija zaglađivanja α je faktor težine. Ako α blizu jedinice, tada prognoza značajno uzima u obzir veličinu greške posljednje prognoze. Za male vrijednosti α predviđena vrijednost je bliska prethodnoj prognozi. Izbor parametra za izglađivanje je prilično komplikovan problem. Opća razmatranja su sljedeća: metoda je dobra za predviđanje dovoljno glatkih serija. U ovom slučaju, može se izabrati konstanta izglađivanja minimiziranjem greške predviđanja za jedan korak naprijed procijenjene iz posljednje trećine serije. Neki stručnjaci ne preporučuju korištenje velikih vrijednosti parametra za izravnavanje. Na sl. 3.1 prikazuje primjer izglađene serije koristeći metodu eksponencijalnog izglađivanja za α= 0,1.

Rice. 3.1. Rezultat eksponencijalnog izglađivanja na α =0,1
(1 - originalni red; 2 - zaglađeni red; 3 - ostaci)

3.4. Eksponencijalno izglađivanje
baziran na trendu (Holtova metoda)

Ova metoda uzima u obzir lokalni linearni trend koji postoji u vremenskoj seriji. Ako postoji uzlazni trend u vremenskoj seriji, tada je uz procjenu trenutnog nivoa neophodna i procjena nagiba. U Holt tehnici, vrijednosti nivoa i nagiba se izravnavaju korištenjem različitih konstanti za svaki od parametara. Konstante izglađivanja vam omogućavaju da procijenite trenutni nivo i nagib, prečišćavajući ih svaki put kada se vrše nova zapažanja.

Holtova metoda koristi tri formule za izračunavanje:

  1. Eksponencijalno izglađena serija (procjena trenutnog nivoa)

(3.2)

  1. Evaluacija trenda

(3.3)

  1. Prognoza za R periodi pred nama

(3.4)

gdje α, β su izglađujuće konstante iz intervala .

Jednačina (3.2) je slična jednačini (3.1) za jednostavno eksponencijalno izglađivanje osim za termin trenda. Konstantno β potrebno da se izgladi procjena trenda. U jednadžbi prognoze (3.3), procjena trenda se množi sa brojem perioda R, na kojem se zasniva prognoza, a zatim se ovaj proizvod dodaje trenutnom nivou izglađenih podataka.

Trajno α i β biraju se subjektivno ili minimiziranjem greške predviđanja. Što se uzimaju veće vrijednosti pondera, to će se brže reagirati na tekuće promjene i podaci će biti izglađeniji. Manje težine čine strukturu izglađenih vrijednosti manje ravnom.

Na sl. 3.2 pokazuje primjer izglađivanja niza pomoću Holt metode za vrijednosti α i β jednako 0,1.

Rice. 3.2. Holt rezultat zaglađivanja
at α = 0,1 i β = 0,1

3.5. Eksponencijalno izglađivanje s trendovima i sezonskim varijacijama (zimska metoda)

Ako postoje sezonske fluktuacije u strukturi podataka, troparametarski model eksponencijalnog izglađivanja koji je predložio Winters koristi se za smanjenje grešaka prognoze. Ovaj pristup je produžetak prethodnog Holt modela. Da bi se uzele u obzir sezonske varijacije, ovdje se koristi dodatna jednadžba, a ova metoda je u potpunosti opisana sa četiri jednačine:

  1. Eksponencijalno izglađena serija

(3.5)

  1. Evaluacija trenda

(3.6)

  1. Procjena sezonalnosti

.

(3.7)

  1. Prognoza za R periodi pred nama

(3.8)

gdje α, β, γ — stalno ujednačavanje za nivo, trend i sezonalnost, respektivno; s- trajanje perioda sezonske fluktuacije.

Jednačina (3.5) ispravlja izglađenu seriju. U ovoj jednadžbi, termin uzima u obzir sezonalnost u izvornim podacima. Nakon što se u jednačinama (3.6), (3.7) uzmu u obzir sezonalnost i trend, procjene se izglađuju i predviđa se u jednačini (3.8).

Kao iu prethodnoj metodi, utezi α, β, γ može se odabrati subjektivno ili minimiziranjem greške predviđanja. Prije primjene jednačine (3.5) potrebno je odrediti početne vrijednosti za izglađene serije L t, trend T t, sezonski koeficijenti S t. Obično se početna vrijednost izglađene serije uzima jednaka prvom opažanju, tada je trend nula, a sezonski koeficijenti su jednaki jedan.

Na sl. 3.3 prikazuje primjer izglađivanja niza korištenjem Wintersove metode.

Rice. 3.3. Rezultat zaglađivanja po Winters metodi
at α = 0,1 = 0,1; γ = 0,1(1 - originalni red; 2 - zaglađeni red; 3 - ostaci)

3.6. Predviđanje zasnovano na trend modelima

Vrlo često vremenske serije imaju linearni trend (trend). Uz pretpostavku linearnog trenda, potrebno je izgraditi pravu liniju koja bi najtačnije odražavala promjenu dinamike u periodu koji se razmatra. Postoji nekoliko metoda za konstruisanje prave linije, ali najobjektivnija sa formalne tačke gledišta biće konstrukcija zasnovana na minimiziranju zbira negativnih i pozitivnih odstupanja početnih vrednosti serije od prave.

Prava linija u dvokoordinatnom sistemu (x, y) može se definisati kao tačka preseka jedne od koordinata at i ugao nagiba prema osi X. Jednačina za takvu pravu liniju će izgledati ovako gdje a- tačka raskrsnice; b- ugao nagiba.

Da bi prava linija odražavala tok dinamike, potrebno je minimizirati zbir vertikalnih odstupanja. Kada se kao kriterij za procjenu minimizacije koristi jednostavan zbir odstupanja, rezultat neće biti dobar, jer se negativna i pozitivna odstupanja međusobno poništavaju. Minimiziranje zbira apsolutnih vrijednosti također ne dovodi do zadovoljavajućih rezultata, jer su procjene parametara u ovom slučaju nestabilne, a postoje i računske poteškoće u implementaciji takvog postupka procjene. Stoga je najčešće korištena procedura minimiziranje sume kvadrata odstupanja, odnosno metoda najmanjeg kvadrata(MNK).

Budući da niz početnih vrijednosti ima fluktuacije, model serije će sadržavati greške, čiji kvadrati moraju biti minimizirani

gdje je y i posmatrana vrijednost; y i * su teorijske vrijednosti modela; - broj zapažanja.

Prilikom modeliranja trenda originalne vremenske serije korištenjem linearnog trenda, to ćemo pretpostaviti

Dijeljenje prve jednadžbe sa n, dolazimo do sljedećeg

Zamjena dobijenog izraza u drugu jednačinu sistema (3.10), za koeficijent b* dobijamo:

3.7. Provjera uklapanja modela

Kao primjer, na sl. 3.4 prikazuje grafik linearne regresije između snage automobila X i njen trošak at.

Rice. 3.4. Dijagram linearne regresije

Jednačina za ovaj slučaj je: at=1455,3 + 13,4 X. Vizuelna analiza ove slike pokazuje da za brojna opažanja postoje značajna odstupanja od teorijske krive. Grafikon ostatka prikazan je na Sl. 3.5.

Rice. 3.5. Grafikon ostataka

Analiza reziduala regresijske linije može pružiti korisnu mjeru koliko dobro procijenjena regresija odražava stvarne podatke. Dobra regresija je ona koja objašnjava značajnu količinu varijanse i, obrnuto, loša regresija ne prati veliku količinu fluktuacije u izvornim podacima. Intuitivno je jasno da će svaka dodatna informacija poboljšati model, tj. smanjiti neobjašnjivi dio varijacije varijable at. Da bismo analizirali regresiju, dekomponovaćemo varijansu na komponente. Očigledno je da

Zadnji član će biti jednak nuli, jer je zbir ostataka, pa dolazimo do sljedećeg rezultata

gdje SS0, SS1, SS2 odrediti ukupni, regresijski i rezidualni zbir kvadrata, respektivno.

Regresijski zbir kvadrata mjeri dio varijanse objašnjen linearnim odnosom; rezidualni - dio disperzije, koji nije objašnjen linearnom ovisnošću.

Svaki od ovih zbroja karakterizira odgovarajući broj stupnjeva slobode (HR), koji određuje broj jedinica podataka koje su nezavisne jedna od druge. Drugim rečima, broj otkucaja srca je povezan sa brojem posmatranja n i broj parametara izračunat iz ukupnosti ovih parametara. U slučaju koji se razmatra, izračunati SS0 određuje se samo jedna konstanta (prosječna vrijednost), dakle broj otkucaja srca za SS0 bice (n1), otkucaji srca za SS 2 - (n - 2) i puls za SS 1 bice n - (n - 1)=1, budući da postoji n - 1 konstantna tačka u jednačini regresije. Baš kao i zbroji kvadrata, otkucaji srca su povezani

Zbroji kvadrata koji su povezani sa dekompozicijom varijanse, zajedno sa odgovarajućim otkucajima srca, mogu se staviti u tzv. analizu varijanse (ANOVA table - ANAlysis Of VARiance) (Tabela 3.1).

Tabela 3.1

ANOVA table

Izvor

Zbir kvadrata

Srednji kvadrat

Regresija

SS2/ (n-2)

Koristeći uvedenu skraćenicu za sume kvadrata, definiramo koeficijent odlučnosti kao omjer regresijskog zbira kvadrata i ukupnog zbira kvadrata kao

(3.13)

Koeficijent determinacije mjeri udio varijabilnosti u varijabli Y, što se može objasniti korištenjem informacija o varijabilnosti nezavisne varijable x. Koeficijent determinacije se mijenja od nule kada X ne utiče Y, na jedan kada se promijeni Y u potpunosti objašnjeno promjenom x.

3.8. Model regresijske prognoze

Najbolje predviđanje je ono sa najmanjom varijansom. U našem slučaju, konvencionalni najmanji kvadrati daju najbolje predviđanje od svih metoda koje daju nepristrasne procjene zasnovane na linearnim jednadžbama. Greška predviđanja povezana sa procedurom predviđanja može doći iz četiri izvora.

Prvo, slučajna priroda aditivnih grešaka kojima se upravlja linearnom regresijom osigurava da će prognoza odstupiti od pravih vrijednosti čak i ako je model ispravno specificiran i njegovi parametri su precizno poznati.

Drugo, sam proces procjene unosi grešku u procjenu parametara - oni rijetko mogu biti jednaki pravim vrijednostima, iako su im u prosjeku jednaki.

Treće, u slučaju uslovne prognoze (u slučaju nepoznatih tačnih vrednosti nezavisnih varijabli), greška se unosi sa prognozom varijabli objašnjenja.

Četvrto, greška se može pojaviti jer specifikacija modela nije tačna.

Kao rezultat toga, izvori grešaka se mogu klasificirati na sljedeći način:

  1. priroda varijable;
  2. priroda modela;
  3. greška koju donosi prognoza nezavisnih slučajnih varijabli;
  4. greška u specifikaciji.

Razmotrićemo bezuslovnu prognozu, kada se nezavisne varijable lako i tačno predviđaju. Započinjemo naše razmatranje problema kvaliteta prognoze sa uparenom regresijskom jednadžbom.

Iskaz problema u ovom slučaju može se formulirati na sljedeći način: koja će biti najbolja prognoza y T+1, pod uvjetom da je u modelu y = a + bx opcije a i b tačno procenjena i vrednost xT+1- poznato.

Tada se predviđena vrijednost može definirati kao

Greška prognoze će tada biti

.

Greška prognoze ima dva svojstva:

Rezultirajuća varijansa je minimalna među svim mogućim procjenama zasnovanim na linearnim jednačinama.

Iako a i b su poznati, greška prognoze se javlja zbog činjenice da na T+1 možda neće ležati na liniji regresije zbog greške ε T+1, poštujući normalnu distribuciju sa nultom srednjom vrijednosti i varijansom σ2. Da bismo provjerili kvalitet prognoze, uvodimo normaliziranu vrijednost

Interval pouzdanosti od 95% se tada može definirati na sljedeći način:

gdje β 0,05 su kvantili normalne distribucije.

Granice intervala od 95% mogu se definirati kao

Imajte na umu da je u ovom slučaju širina interval povjerenja ne zavisi od veličine X, a granice intervala su prave linije paralelne sa linijama regresije.

Češće je prilikom konstruisanja regresijske linije i provjere kvaliteta prognoze potrebno procijeniti ne samo parametre regresije, već i varijansu greške prognoze. Može se pokazati da u ovom slučaju varijansa greške zavisi od vrijednosti (), gdje je srednja vrijednost nezavisne varijable. Osim toga, što je serija duža, to je tačnija prognoza. Greška prognoze se smanjuje ako je vrijednost X T+1 blizu srednje vrijednosti nezavisne varijable, i obrnuto, kada se udalji od srednje vrijednosti, prognoza postaje manje tačna. Na sl. 3.6 prikazuje rezultate predviđanja korištenjem jednačine linearne regresije za 6 vremenskih intervala unaprijed zajedno sa intervalima povjerenja.

Rice. 3.6. Predviđanje linearne regresije

Kao što se može vidjeti sa sl. 3.6, ova linija regresije ne opisuje dobro originalne podatke: postoji velika varijacija u odnosu na liniju uklapanja. O kvalitetu modela se može suditi i po rezidualima, koji bi, uz zadovoljavajući model, trebali biti raspoređeni približno po normalnom zakonu. Na sl. 3.7 prikazuje grafik reziduala, izgrađen korištenjem skale vjerovatnoće.

Sl.3.7. Grafikon ostataka

Kada se koristi ovakva skala, podaci koji se pridržavaju normalnog zakona trebali bi ležati na pravoj liniji. Kao što proizilazi iz slike, tačke na početku i kraju perioda posmatranja donekle odstupaju od prave linije, što ukazuje na nedovoljno visok kvalitet odabranog modela u vidu jednačine linearne regresije.

U tabeli. Tabela 3.2 prikazuje rezultate prognoze (druga kolona) zajedno sa intervalima pouzdanosti od 95% (donja – treća i gornja – četvrta kolona, ​​respektivno).

Tabela 3.2

Rezultati prognoze

3.9. Multivarijantni regresijski model

U multivarijantnoj regresiji, podaci za svaki slučaj uključuju vrijednosti zavisne varijable i svake nezavisne varijable. Zavisna varijabla y je slučajna varijabla povezana sa nezavisnim varijablama sljedećim odnosom:

gdje su koeficijenti regresije koje treba odrediti; ε je komponenta greške koja odgovara odstupanju vrijednosti zavisne varijable od pravog omjera (pretpostavlja se da su greške nezavisne i da imaju normalnu distribuciju sa nultom srednjom i nepoznatom varijansom σ ).

Za dati skup podataka, procjene koeficijenata regresije mogu se naći korištenjem metode najmanjih kvadrata. Ako su OLS procjene označene sa , tada će odgovarajuća regresijska funkcija izgledati ovako:

Ostaci su procjene komponente greške i slični su rezidualima u slučaju jednostavne linearne regresije.

Statistička analiza multivarijantnog regresijskog modela provodi se slično kao i analiza jednostavne linearne regresije. Standardni paketi statističkih programa omogućavaju dobijanje procjena pomoću najmanjih kvadrata za parametre modela, procjene njihovih standardnih grešaka. Takođe, možete dobiti vrijednost t-statistiku za provjeru značaja pojedinih termina regresionog modela i vrijednosti F-statistiku za testiranje značajnosti regresijske zavisnosti.

Oblik dijeljenja zbira kvadrata u slučaju multivarijantne regresije sličan je izrazu (3.13), ali će omjer za otkucaje srca biti sljedeći

To još jednom naglašavamo n je obim zapažanja, i k je broj varijabli u modelu. Ukupna varijansa zavisne varijable sastoji se od dvije komponente: varijanse objašnjene nezavisnim varijablama kroz funkciju regresije i neobjašnjive varijanse.

Tabela ANOVA za slučaj multivarijantne regresije će imati oblik prikazan u tabeli. 3.3.

Tabela 3.3

ANOVA table

Izvor

Zbir kvadrata

Srednji kvadrat

Regresija

SS2/ (n-k-1)

Kao primjer multivarijantne regresije koristit ćemo podatke iz paketa Statistica (datoteka sa podacima Poverty.Sta) Prikazani podaci zasnovani su na poređenju rezultata popisa iz 1960. i 1970. godine. za slučajni uzorak od 30 zemalja. Imena zemalja su unesena kao nazivi nizova, a imena svih varijabli u ovoj datoteci su navedena ispod:

POP_CHNG — promjena stanovništva za 1960-1970;

N_EMPLD — broj zaposlenih u poljoprivredi;

PT_SIROMAŠTVO - procenat porodica koje žive ispod granice siromaštva;

TAX_RATE - poreska stopa;

PT_PHONE - postotak stanova sa telefonom;

PT_RURAL - procenat ruralnog stanovništva;

AGE je srednja dob.

Kao zavisnu varijablu biramo obilježje Pt_Poor, a kao nezavisni - sve ostalo. Izračunati koeficijenti regresije između odabranih varijabli dati su u tabeli. 3.4

Tabela 3.4

Koeficijenti regresije

Ova tabela prikazuje koeficijente regresije ( AT) i standardizirani koeficijenti regresije ( beta). Uz pomoć koeficijenata AT postavlja se oblik regresijske jednadžbe, koja u ovom slučaju ima oblik:

Uključivanje u desnu stranu samo ovih varijabli je zbog činjenice da samo ove karakteristike imaju vrijednost vjerovatnoće R manji od 0,05 (vidi četvrtu kolonu tabele 3.4).

Bibliografija

  1. Basovski L. E. Predviđanje i planiranje u tržišnim uslovima. - M.: Infra - M, 2003.
  2. Box J., Jenkins G. Analiza vremenskih serija. Izdanje 1. Prognoza i upravljanje. – M.: Mir, 1974.
  3. Borovikov V. P., Ivchenko G. I. Predviđanje u sistemu Statistica u Windows okruženju. - M.: Finansije i statistika, 1999.
  4. Vojvoda V. Obrada podataka na PC-u u primjerima. - Sankt Peterburg: Petar, 1997.
  5. Ivčenko B. P., Martiščenko L. A., Ivancov I. B. Informaciona mikroekonomija. Dio 1. Metode analize i predviđanja. - Sankt Peterburg: Nordmed-Izdat, 1997.
  6. Kričevski M. L. Uvod u umjetne neuronske mreže: Proc. dodatak. - Sankt Peterburg: St. Petersburg. stanje marine tech. un-t, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Multivarijantna statistička analiza u ekonomiji. – M.: Jedinstvo-Dana, 1999.

1. Osnovne metodološke odredbe.

Jednostavna metoda eksponencijalnog izglađivanja koristi ponderisani (eksponencijalno) pokretni prosek svih prethodnih posmatranja. Ovaj model se najčešće primjenjuje na podatke u kojima je potrebno ocijeniti postojanje veze između analiziranih indikatora (trend) ili ovisnost analiziranih podataka. Svrha eksponencijalnog izglađivanja je procjena trenutnog stanja, čiji će rezultati odrediti sva buduća predviđanja.

Eksponencijalno izglađivanje obezbeđuje stalno ažuriranje modela zbog najnovijih podataka. Ova metoda se zasniva na usrednjavanju (izglađivanju) vremenske serije prošlih zapažanja u silaznom (eksponencijalnom) smjeru. To jest, kasnijim događajima se pridaje veća težina. Težina se dodjeljuje na sljedeći način: za posljednje opažanje težina će biti vrijednost α, za pretposljednje - (1-α), za ono koje je bilo prije njega - (1-α) 2, itd.

U izglađenom obliku, nova prognoza (za vremenski period t + 1) može se predstaviti kao ponderisani prosjek posljednjeg opažanja količine u trenutku t i njene prethodne prognoze za isti period t. Štaviše, težina α se dodeljuje posmatranoj vrednosti, a težina (1- α) se dodeljuje prognozi; pretpostavlja se da je 0< α<1. Это правило в общем виде можно записать следующим образом.

Nova prognoza = [α*(poslednje zapažanje)]+[(1- α)*posljednja prognoza]

gdje je predviđena vrijednost za naredni period;

α je konstanta zaglađivanja;

Y t je promatranje vrijednosti za tekući period t;

Prethodna izglađena prognoza ove vrijednosti za period t.

Eksponencijalno izglađivanje je postupak za kontinuiranu reviziju rezultata prognoze u svjetlu najnovijih dešavanja.

Konstanta izglađivanja α je ponderisani faktor. Njegova stvarna vrijednost je određena mjerom do koje bi trenutno posmatranje trebalo da utiče na predviđenu vrijednost. Ako je α blizu 1, tada prognoza uzima u obzir vrijednost greške posljednje prognoze. Suprotno tome, za male vrijednosti α, predviđena vrijednost je najbliža prethodnoj prognozi. Može se smatrati ponderisanim prosjekom svih prošlih zapažanja s ponderima koji se eksponencijalno smanjuju sa "starošću" podataka.



Tabela 2.1

Poređenje uticaja različitih vrednosti konstanti glađenja

Konstanta α je ključ za analizu podataka. Ako je potrebno da predviđene vrijednosti budu stabilne i da se slučajna odstupanja izglade, potrebno je odabrati malu vrijednost α. Velika vrijednost konstante α ima smisla ako vam je potreban brz odgovor na promjene u spektru posmatranja.

2. Praktični primjer eksponencijalnog izglađivanja.

Prikazani su podaci kompanije u smislu obima prodaje (hiljada jedinica) za sedam godina, konstanta glađenja je uzeta jednaka 0,1 i 0,6. Testni dio čine podaci za 7 godina; na njima je potrebno procijeniti efikasnost svakog od modela. Za eksponencijalno izglađivanje serije, početna vrijednost se uzima jednaka 500 (prva vrijednost stvarnih podataka ili prosječna vrijednost za 3-5 perioda se bilježi u izglađenu vrijednost za 2. kvartal).

Tabela 2.2

Početni podaci

Vrijeme Stvarna vrijednost (stvarna) Izglađena vrijednost Greška prognoze
godine kvartal 0,1 0,1
excel prema formuli
#N / A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

Na sl. 2.1 prikazuje predviđanje zasnovano na eksponencijalnom izglađivanju sa konstantom izglađivanja od 0,1.



Rice. 2.1. Eksponencijalno izglađivanje

Rješenje u Excelu.

1. Odaberite meni "Alati" - "Analiza podataka". Sa liste Alati za analizu izaberite Eksponencijalno izglađivanje. Ako u meniju "Alati" nema analize podataka, potrebno je instalirati "Paket analize". Da biste to učinili, pronađite stavku "Postavke" u "Parametrima" i u dijaloškom okviru koji se pojavi označite polje za "Paket analize", kliknite na OK.

2. Okvir za dijalog prikazan na sl. 2.2.

3. U polje "input interval" unesite vrijednosti početnih podataka (plus jedna slobodna ćelija).

4. Označite polje za potvrdu "oznake" (ako raspon unosa sadrži nazive kolona).

5. Unesite vrijednost (1-α) u polje faktora prigušenja.

6. U polje "input interval" unesite vrijednost ćelije u kojoj želite da vidite primljene vrijednosti.

7. Označite okvir "Opcije" - "Izlaz grafikona" da biste ga automatski napravili.

Rice. 2.2. Dijaloški okvir za eksponencijalno izglađivanje

3. Zadatak laboratorijskog rada.

Postoje početni podaci o obimu proizvodnje preduzeća za proizvodnju nafte za 2 godine, prikazani u tabeli 2.3:

Tabela 2.3

Početni podaci

Izvršite eksponencijalno izravnavanje serije. Uzmite eksponencijalni koeficijent izglađivanja jednak 0,1; 0,2; 0.3. Komentirajte rezultate. Možete koristiti statistiku prikazanu u Dodatku 1.