Eksponentiell utjevningsmetodeformel. Glidende gjennomsnittlig eksponentiell utjevningsmetode i Excel

Prognoseoppgaver er bygget på endringen i enkelte data over tid (salg, etterspørsel, tilbud, BNP, karbonutslipp, befolkning ...) og projiserer disse endringene inn i fremtiden. Dessverre, identifisert på historiske data, kan trender brytes av mange uforutsette omstendigheter. Så dataene i fremtiden kan avvike betydelig fra det som skjedde i fortiden. Dette er problemet med prognoser.

Imidlertid er det teknikker (kalt eksponentiell utjevning) som ikke bare lar deg prøve å forutsi fremtiden, men også å uttrykke usikkerheten til alt relatert til prognosen numerisk. Numerisk uttrykk for usikkerhet ved å lage prognoseintervaller er virkelig uvurderlig, men ofte oversett i prognoseverdenen.

Last ned notat i eller format, eksempler i format

Innledende data

La oss si at du er en Ringenes Herre-fan og har laget og solgt sverd i tre år (Figur 1). La oss vise salg grafisk (fig. 2). Etterspørselen har doblet seg på tre år – kanskje dette er en trend? Vi kommer tilbake til denne ideen litt senere. Det er flere topper og daler på kartet, noe som kan være et tegn på sesongvariasjoner. Spesielt er toppene i månedene 12, 24 og 36, som tilfeldigvis er desember. Men det er kanskje bare en tilfeldighet? La oss finne det ut.

Enkel eksponentiell utjevning

Eksponentielle utjevningsmetoder er avhengige av å forutsi fremtiden fra data fra fortiden, der nyere observasjoner veier mer enn eldre. Slik vekting er mulig på grunn av utjevningskonstanter. Den første eksponentielle utjevningsmetoden vi skal prøve kalles enkel eksponensiell utjevning(PES, enkelt eksponensiell utjevning, SES). Den bruker bare én utjevningskonstant.

Enkel eksponentiell utjevning forutsetter at datatidsserien din har to komponenter: et nivå (eller gjennomsnitt) og en feil rundt den verdien. Det er ingen trend eller sesongmessige svingninger – det er bare et nivå som etterspørselen svinger rundt, omgitt av små feil her og der. Ved å gi preferanse til nyere observasjoner, kan TEC forårsake endringer i dette nivået. På formlenes språk,

Etterspørsel på tidspunkt t = nivå + tilfeldig feil nær nivået på tidspunktet t

Så hvordan finner du den omtrentlige verdien av nivået? Hvis vi aksepterer alle tidsverdier som har samme verdi, bør vi ganske enkelt beregne gjennomsnittsverdien deres. Dette er imidlertid en dårlig idé. Nyere observasjoner bør tillegges større vekt.

La oss lage noen nivåer. Beregn grunnlinjen for det første året:

nivå 0 = gjennomsnittlig etterspørsel for det første året (måned 1-12)

For sverdbehov er det 163. Vi bruker nivå 0 (163) som etterspørselsprognose for måned 1. Etterspørselen i måned 1 er 165, som er 2 sverd over nivå 0. Det er verdt å oppdatere grunnlinjetilnærmingen. Enkel eksponentiell utjevningsligning:

nivå 1 = nivå 0 + noen få prosent × (krav 1 - nivå 0)

nivå 2 = nivå 1 + noen få prosent × (krav 2 - nivå 1)

Etc. «Noen få prosent» kalles utjevningskonstanten, og betegnes med alfa. Det kan være et hvilket som helst tall fra 0 til 100 % (0 til 1). Du vil lære hvordan du velger en alfaverdi senere. PÅ generell sak verdi for forskjellige tidspunkter:

Nivå gjeldende periode = nivå forrige periode +
alfa × (etterspørsel gjeldende periode - nivå forrige periode)

Fremtidig etterspørsel er lik sist beregnede nivå (fig. 3). Siden du ikke vet hva alfa er, sett celle C2 til 0,5 til å begynne med. Etter at modellen er bygget, finn en alfa slik at summen av kvadrater av feilen er E2 (eller standardavvik– F2) var minimale. For å gjøre dette, kjør alternativet Å finne en løsning. For å gjøre dette, gå gjennom menyen DATA –> Å finne en løsning, og sett i vinduet Løsningssøkealternativer nødvendige verdier (fig. 4). For å vise resultatene av prognosen på diagrammet, velg først området A6:B41, og bygg et enkelt linjediagram. Høyreklikk deretter på diagrammet, velg alternativet Velg data. I vinduet som åpnes, lag en andre rad og sett inn prediksjoner fra A42:B53-området i den (fig. 5).

Kanskje du har en trend

For å teste denne antagelsen er det nok å passe lineær regresjon under etterspørselsdataene og utfør en t-test på økningen av denne trendlinjen (som i ). Hvis stigningstallet på linjen ikke er null og statistisk signifikant (i studentens test, verdien R mindre enn 0,05), har dataene en trend (fig. 6).

Vi brukte LINEST-funksjonen, som returnerer 10 beskrivende statistikk(hvis du ikke har brukt denne funksjonen før, anbefaler jeg den) og INDEX-funksjonen, som lar deg "trekke ut" kun de tre nødvendige statistikkene, og ikke hele settet. Det viste seg at helningen er 2,54, og den er signifikant, siden Studentens test viste at 0,000000012 er betydelig mindre enn 0,05. Så det er en trend, og det gjenstår å inkludere den i prognosen.

Eksponentiell Holt-utjevning med trendkorreksjon

Det blir ofte referert til som dobbel eksponentiell utjevning fordi det har to utjevningsparametere, alfa, i stedet for én. Hvis tidssekvensen har en lineær trend, så:

etterspørsel over tid t = nivå + t × trend + tilfeldig avvik nivå på tidspunkt t

Holt eksponentiell utjevning med trendkorreksjon har to nye ligninger, en for nivået når det beveger seg fremover i tid og den andre for trenden. Nivåligningen inneholder utjevningsparameteren alfa, og trendligningen inneholder gamma. Slik ser den nye nivåligningen ut:

nivå 1 = nivå 0 + trend 0 + alfa × (behov 1 - (nivå 0 + trend 0))

noter det nivå 0 + trend 0 er bare en ett-trinns prognose fra de opprinnelige verdiene til måned 1, så etterspørsel 1 – (nivå 0 + trend 0) er et ett-trinns avvik. Dermed vil den grunnleggende nivåtilnærmingsligningen være som følger:

nåværende periodenivå = forrige periodenivå + forrige periodetrend + alfa × (nåværende periodeetterspørsel - (forrige periodenivå) + forrige periodetrend))

Trendoppdateringsligning:

trend nåværende periode = trend forrige periode + gamma × alfa × (etterspørsel gjeldende periode – (nivå forrige periode) + trend forrige periode))

Holt-utjevning i Excel ligner på enkel utjevning (fig. 7), og som ovenfor er målet å finne to koeffisienter samtidig som summen av kvadrerte feil minimeres (fig. 8). For å få det opprinnelige nivået og trendverdiene (i cellene C5 og D5 i figur 7), bygg et diagram for de første 18 månedene med salg og legg til en trendlinje med en ligning. Skriv inn den innledende trendverdien på 0,8369 og startnivået på 155,88 i cellene C5 og D5. Prognosedata kan presenteres grafisk (fig. 9).

Ris. 7. Eksponentiell Holt-utjevning med trendkorreksjon; For å forstørre et bilde, høyreklikk på det og velg Åpne bildet i ny fane

Finne mønstre i data

Det er en måte å teste den prediktive modellen for styrke - å sammenligne feilene med seg selv, forskjøvet med et trinn (eller flere trinn). Hvis avvikene er tilfeldige, kan ikke modellen forbedres. Det kan imidlertid være en sesongmessig faktor i etterspørselsdataene. Konseptet med en feil som korrelerer med sin egen versjon over en annen periode kalles autokorrelasjon (for mer om autokorrelasjon, se ). For å beregne autokorrelasjon, start med prognosefeildata for hver periode (overfør kolonne F i figur 7 til kolonne B i figur 10). Definer neste gjennomsnittlig feil prognose (Figur 10, celle B39; formel i celle: =GJENNOMSNITT(B3:B38)). I kolonne C beregner du avviket til prognosefeilen fra gjennomsnittet; formel i celle C3: =B3-B$39. Deretter flytter du kolonne C sekvensielt en kolonne til høyre og en rad nedover. Formler i cellene D39: =SUMPRODUKT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Hva kan "synkron bevegelse" med kolonne C bety for en av kolonnene D: O. Hvis for eksempel kolonne C og D er synkrone, må et tall som er negativt i en av dem være negativt i den andre, positivt i den ene , positiv i venn. Dette betyr at summen av produktene til de to kolonnene vil være signifikant (forskjeller akkumuleres). Eller, som er det samme, jo nærmere verdien i området D41:O41 er null, desto lavere er korrelasjonen av kolonnen (henholdsvis fra D til O) med kolonne C (fig. 11).

Én autokorrelasjon er over den kritiske verdien. Årsforskjøvet feil korrelerer med seg selv. Dette betyr en 12-måneders sesongsyklus. Og dette er ikke overraskende. Ser man på etterspørselsgrafen (Figur 2), viser det seg at det er topper i etterspørselen hver jul og fall i april-mai. Vurder en prognoseteknikk som tar hensyn til sesongvariasjoner.

Multiplikativ eksponentiell Holt-Winters utjevning

Metoden kalles multiplikativ (fra multiplisere - multiplisere), fordi den bruker multiplikasjon for å ta høyde for sesongvariasjoner:

Etterspørsel på tidspunkt t = (nivå + t × trend) × sesongjustering på tidspunkt t × eventuelle gjenværende uregelmessige justeringer som vi ikke kan gjøre rede for

Holt-Winters utjevning kalles også trippel eksponentiell utjevning fordi den har tre utjevningsparametere (alfa, gamma og delta sesongfaktor). For eksempel, hvis det er en 12 måneders sesongsyklus:

Månedlig prognose 39 = (nivå 36 + 3 × trend 36) x sesongvariasjon 27

Når man analyserer dataene er det nødvendig å finne ut hva som er trenden i dataserien og hva som er sesongvariasjonen. For å utføre beregninger ved hjelp av Holt-Winters-metoden, må du:

Glatt historiske data ved å bruke glidende gjennomsnittsmetoden.
Sammenlign den glattede versjonen av tidsserien med originalen for å få et grovt estimat av sesongvariasjoner.
Få nye data uten sesongkomponenter.
Finn nivå- og trendtilnærmelser basert på disse nye dataene.

Start med de originale dataene (kolonne A og B i figur 12) og legg til kolonne C med utjevnede verdier basert på glidende gjennomsnitt. Siden sesongvariasjoner har 12-måneders sykluser, er det fornuftig å bruke et 12-måneders gjennomsnitt. Det er et lite problem med dette gjennomsnittet. 12 er et partall. Hvis du jevner ut etterspørselen for måned 7, bør det betraktes som gjennomsnittlig etterspørsel fra måned 1 til 12, eller fra 2 til 13? For å håndtere denne vanskeligheten må vi jevne ut etterspørselen ved å bruke et "bevegende gjennomsnitt 2x12". Det vil si, ta halvparten av de to gjennomsnittene fra måned 1 til 12 og fra 2 til 13. Formelen i celle C8 er: =(GJENNOMSNITT(B3:B14)+GJENNOMSNITT(B2:B13))/2.

Utjevnede data for månedene 1–6 og 31–36 kan ikke oppnås fordi det ikke er nok tidligere og påfølgende perioder. For klarhetens skyld kan de originale og glattede dataene vises i et diagram (fig. 13).

Nå, i kolonne D, del den opprinnelige verdien med den utjevnede verdien for å få et estimat av sesongjusteringen (kolonne D i figur 12). Formel i celle D8: =B8/C8. Legg merke til topper på 20 % over normal etterspørsel i månedene 12 og 24 (desember) mens det er fall om våren. Denne utjevningsteknikken har gitt deg to punktanslag for hver måned (totalt 24 måneder). Kolonne E er gjennomsnittet av disse to faktorene. Formelen i celle E1 er: =GJENNOMSNITT(D14,D26). For klarhetens skyld kan nivået av sesongsvingninger representeres grafisk (fig. 14).

Nå kan du få data justert for sesongmessige svingninger. Formel i celle G1: =B2/E2. Bygg en graf basert på dataene i kolonne G, fullfør den med en trendlinje, vis trendligningen på diagrammet (fig. 15), og bruk koeffisientene i påfølgende beregninger.

form nytt løv, som vist i fig. 16. Bytt ut verdiene i området E5:E16 fra fig. 12 områder E2:E13. Ta verdiene til C16 og D16 fra ligningen til trendlinjen i fig. 15. Sett verdiene til utjevningskonstantene til å starte på rundt 0,5. Utvid verdiene i rad 17 over månedene 1 til 36. Kjør Å finne en løsning for å optimalisere utjevningskoeffisienter (fig. 18). Formel i celle B53: =(C$52+(A53-A$52)*D$52)*E41.

Nå i prognosen som er laget, må du sjekke autokorrelasjonene (fig. 18). Siden alle verdier er plassert mellom øvre og nedre grenser, forstår du at modellen gjorde en god jobb med å forstå strukturen til etterspørselsverdier.

Bygge et konfidensintervall for prognosen

Så vi har en ganske fungerende prognose. Hvordan setter du øvre og nedre grenser som kan brukes til å gjøre realistiske gjetninger? Monte Carlo-simuleringen, som du allerede har møtt i (se også ), vil hjelpe deg med dette. Poenget er å generere fremtidige scenarier for etterspørselsatferd og bestemme gruppen som 95 % av dem faller inn i.

Fjern fra arket Excel-prognose fra cellene B53:B64 (se fig. 17). Der skal du skrive etterspørsel basert på simuleringen. Sistnevnte kan genereres ved hjelp av NORMINV-funksjonen. For fremtidige måneder trenger du bare å oppgi den med gjennomsnittet (0), standardfordelingen (10,37 fra celle $H$2), og tilfeldig tall fra 0 til 1. Funksjonen vil returnere avviket med en sannsynlighet som tilsvarer klokkekurven. Sett en simulering av ett-trinns feil i celle G53: =NORMINV(RAND();0;H$2). Å strekke denne formelen ned til G64 gir deg simuleringer av prognosefeilen for en 12 måneders ett-trinns prognose (Figur 19). Simuleringsverdiene dine vil avvike fra de som er vist på figuren (det er derfor det er en simulering!).

Med Forecast Error har du alt du trenger for å oppdatere nivået, trenden og sesongfaktoren. Så velg cellene C52:F52 og strekk dem til rad 64. Som et resultat har du en simulert prognosefeil og selve prognosen. Går fra det motsatte, er det mulig å forutsi verdiene av etterspørselen. Sett inn formelen i celle B53: =F53+G53 og strekk den til B64 (fig. 20, område B53:F64). Nå kan du trykke på F9-knappen, hver gang du oppdaterer prognosen. Plasser resultatene av 1000 simuleringer i cellene A71:L1070, hver gang du transponerer verdier fra området B53:B64 til området A71:L71, A72:L72, ... A1070:L1070. Hvis det plager deg, skriv VBA-koden.

Nå har du 1000 scenarier for hver måned, og du kan bruke PERSENTIL-funksjonen for å få øvre og nedre grenser i midten av 95 % konfidensintervallet. I celle A66 er formelen: =PERSENTIL(A71:A1070,0,975) og i celle A67: =PERSENTIL(A71:A1070,0,025).

Som vanlig, for klarhetens skyld, kan dataene presenteres i grafisk form(Fig. 21).

Det er to interessante punkter på diagrammet:

Feilmarginen øker med tiden. Det gir mening. Usikkerhet akkumuleres hver måned.
På samme måte øker feilen i delene som faller på perioder med sesongmessig økning i etterspørselen. Med påfølgende fall krymper feilen.

Basert på materiale fra en bok av John Foreman. – M.: Alpina Publisher, 2016. – S. 329–381

Eksponentiell utjevning - mer komplisert metode vektlagt gjennomsnitt. Hver ny prediksjon er basert på den forrige prediksjonen pluss den prosentvise forskjellen mellom den prediksjonen og den faktiske verdien av serien på det tidspunktet.

F t \u003d F t -1 + (A t -1 - F t -1) (2)

Hvor: F t – prognose for periode t

F t-1– prognose for periode t-1

- utjevningskonstant

En t - 1 – faktisk etterspørsel eller salg for perioden t-1

Utjevningskonstanten er en prosentandel av prediksjonsfeilen. Hver ny prediksjon er lik den forrige prediksjonen pluss en prosentandel av den forrige feilen.

Følsomheten til prognosekorrigeringen for feilen bestemmes av utjevningskonstanten, jo nærmere verdien er 0, jo langsommere vil prognosen tilpasse seg prognosefeil (dvs. mer grad utjevning). Omvendt, jo nærmere verdien er 1,0, jo høyere følsomhet og mindre utjevning.

Valget av utjevningskonstant er stort sett et spørsmål om fritt valg eller prøving og feiling. Målet er å velge en slik utjevningskonstant at prognosen på den ene siden forblir tilstrekkelig sensitiv for reell forandring tidsseriedata, og på den annen side jevnet det godt ut hoppene forårsaket av tilfeldige faktorer. Vanlig brukte verdier er i området 0,05 til 0,50.

Eksponentiell utjevning er en av de mest brukte prognosemetodene, dels på grunn av de minimale lagringskravene og enkel beregning, og dels på grunn av hvor enkelt boostfaktorsystemet kan endres. enkel endring verdier.

Tabell 3. Eksponentiell utjevning

Periode	Faktisk etterspørsel	α= 0,1	α = 0,4
prognose	feil	prognose	feil
	10 000	-	-	-	-
	11 200	10 000	11 200-10 000=1 200	10 000	11 200-10 000=1 200
	11 500	10 000+0,1(11 200-10 000)=10 120	11 500-10 120=1 380	10 000+0,4(11 200-10 000)=10 480	11 500-10 480=1 020
	13 200	10 120+0,1(11 500-10 120)=10 258	13 200-10 258=2 942	10 480+0,4(11 500-10 480)=10 888	13 200-10 888=2 312
	14 500	10 258+0,1(13 200-10 258)=10 552	14 500-10 552=3 948	10 888+0,4(13 200-10 888)=11 813	14 500-11 813=2 687
	-	10 552+0,1(14 500-10 552)=10 947	-	11 813+0,4(14 500-11 813)=12 888	-

Metoder for Trend

Det er to viktig metode, som kan brukes til å utvikle prognoser når en trend er tilstede. En av dem innebærer bruk av en trendligning; en annen er en eksponentiell utjevningsutvidelse.

Trendligning:

Lineær ligning trender har neste visning:

Y t = a + δ∙ t (3)

Hvor: t - et visst antall tidsperioder fra t=0;

Y t– periodeprognose t;

α - mening Y t på t=0

δ - linjehelling.

Direkte koeffisienter α og δ , kan beregnes fra statistiske data for viss periode, ved å bruke følgende to ligninger:

δ= , (4)

α = , (5)

Hvor: n - antall perioder,

y– tidsserieverdi

Tabell 3. Trendnivå.

Periode (t)	År	Salgsnivå (y)	t∙y	t2
		10 000	10 000
			11 200	22 400
			11 500	34 500
			13 200	52 800
			14 500	72 500
Total:		-	60 400	192 200

La oss beregne koeffisientene til trendlinjen:

δ=

Så trendlinjen Y t = α + δ ∙ t

I vårt tilfelle, Y t = 43 900+1 100 ∙t,

Hvor t = 0 for periode 0.

La oss lage en ligning for periode 6 (2015) og 7 (2016):

– prognose for 2015.

Y 7 \u003d 43 900 + 1 100 * 7 \u003d 51 600

La oss lage en graf:

Eksponentiell trendutjevning

En variant av enkel eksponentiell utjevning kan brukes når tidsserien viser en trend. Denne variasjonen kalles eksponentiell utjevning, trendbasert utjevning, eller noen ganger dobbel utjevning. Det skiller seg fra enkel eksponentiell utjevning, som bare brukes når dataene endrer seg rundt en gjennomsnittsverdi eller har hoppende eller gradvise endringer.

Hvis serien er trending og enkel eksponentiell utjevning brukes, vil alle prognoser ligge bak trenden. For eksempel, hvis dataene øker, vil hver prognose bli undervurdert. Omvendt gir reduksjon av dataene en overvurdert prognose. En grafisk visning av dataene kan vise når dobbel utjevning er å foretrekke fremfor enkel utjevning.

En trendjustert prognose (TAF) består av to elementer: en utjevnet feil og en trendfaktor.

TAF t +1 = S t + T t , (6)

Hvor: S t – jevnet prognose;

T t – vurdering av dagens trend

Og S t = TAF t + α 1 (A t - TAF t) , (7)

T t \u003d T t-1 + α 2 (TAF t -TAF t-1 - T t-1) (8)

Hvor α 1 , α 2 er utjevningskonstanter.

For å bruke denne metoden må du velge verdiene for α 1 , α 2 (ved vanlig tilpasning) og lage en innledende prognose og vurdering av trender.

Tabell 4. Eksponentiell trendutjevning.

Det glidende gjennomsnittet lar deg jevne ut dataene perfekt. Men dens største ulempe er at hver verdi i kildedataene har samme vekt. For eksempel, for et glidende gjennomsnitt som bruker en seksukers periode, gis hver verdi for hver uke 1/6 av vekten. For enkelte innsamlede statistikker tillegges nyere verdier mer vekt. Derfor brukes eksponentiell utjevning for å gi de nyeste dataene større vekt. Dermed er dette statistiske problemet løst.

Beregningsformel for eksponentiell utjevning i Excel

Figuren under viser en etterspørselsrapport for et bestemt produkt i 26 uker. Kolonnen Etterspørsel inneholder informasjon om antall solgte varer. I kolonnen "Værvarsel" - formelen:

Kolonnen "Glidende gjennomsnitt" definerer den anslåtte etterspørselen, beregnet ved å bruke den vanlige beregningen av det glidende gjennomsnittet med en periode på 6 uker:

I den siste kolonnen "Værvarsel", med formelen beskrevet ovenfor, brukes metoden for eksponentiell utjevning av data der verdiene for de siste ukene har mer vekt enn de foregående.

Koeffisienten "Alpha:" legges inn i celle G1, det betyr vekten av tildelingen til de nyeste dataene. PÅ dette eksemplet den har en verdi på 30 %. De resterende 70 % av vekten fordeles til resten av dataene. Det vil si at den andre verdien når det gjelder relevans (fra høyre til venstre) har en vekt lik 30% av de resterende 70% av vekten - dette er 21%, den tredje verdien har en vekt lik 30% av resten av de 70 % av vekten - 14,7 % og så videre .

Eksponentiell utjevningsplott

Figuren nedenfor viser etterspørselsgrafen, det glidende gjennomsnittet og den eksponentielle utjevningsprognosen, som er bygget på grunnlag av de opprinnelige verdiene:

Legg merke til at den eksponentielle utjevningsprognosen er mer responsiv på endringer i etterspørselen enn den glidende gjennomsnittslinjen.

Dataene for påfølgende foregående uker multipliseres med alfafaktoren, og resultatet legges til resten av vektprosenten multiplisert med den forrige predikerte verdien.

Tema 3. Utjevning og prognoser av tidsserier basert på trendmodeller

mål studiet av dette emnet er opprettelsen av et grunnleggende grunnlag for opplæring av ledere i spesialiteten 080507 innen bygging av modeller for ulike oppgaver innen økonomi, dannelsen av en systematisk tilnærming til å sette og løse prognoseproblemer blant studenter . Det foreslåtte kurset vil tillate spesialister å raskt tilpasse seg praktisk jobb, det er bedre å navigere i den vitenskapelige og tekniske informasjonen og litteraturen i spesialiteten, for å ta mer selvsikre beslutninger som oppstår i arbeidet.

Hoved oppgaver studietemaer er: å få studentene i dybden teoretisk kunnskap om anvendelse av prognosemodeller, deres tilegnelse av stabile ferdigheter i å utføre forskningsarbeid, evnen til å løse komplekse vitenskapelige problemer knyttet til konstruksjon av modeller, inkludert flerdimensjonale, evnen til å logisk analysere resultatene som er oppnådd og bestemme måter å finne akseptable løsninger på.

Nok enkel metodeå identifisere utviklingstrender er utjevningen av tidsseriene, dvs. erstatning av faktiske nivåer med beregnede som har mindre variasjoner enn de opprinnelige dataene. Den tilsvarende transformasjonen kalles filtrering. La oss vurdere flere metoder for utjevning.

3.1. enkle gjennomsnitt

Målet med utjevningen er å bygge en prognosemodell for fremtidige perioder basert på tidligere observasjoner. I metoden for enkle gjennomsnitt tas verdiene til variabelen som startdata Y på tidspunkter t, og prognoseverdien bestemmes som et enkelt gjennomsnitt for neste tidsperiode. Beregningsformel har formen

hvor n antall observasjoner.

I tilfelle når en ny observasjon blir tilgjengelig, bør den nylig mottatte prognosen også tas med i prognosen for neste periode. Når du bruker denne metoden, utføres prognosen ved å snitte alle tidligere data, men ulempen med slik prognose er vanskeligheten med å bruke den i trendmodeller.

3.2. Glidende gjennomsnittsmetode

Denne metoden er basert på å representere serien som summen av en ganske jevn trend og tilfeldig komponent. Metoden er basert på ideen om å beregne den teoretiske verdien basert på en lokal tilnærming. Å bygge et trendestimat på et punkt t med verdiene til serien fra tidsintervallet beregne den teoretiske verdien av serien. Mest utbredt i praksisen med utjevning serier, fikk jeg saken når alle vektene for elementene i intervallet er like med hverandre. Av denne grunn kalles denne metoden glidende gjennomsnittsmetode, siden når prosedyren utføres, et vindu med en bredde på (2 m + 1) gjennom hele rekken. Vindusbredden blir vanligvis tatt merkelig, siden den teoretiske verdien beregnes for den sentrale verdien: antall termer k = 2m + 1 Med samme nummer nivåer til venstre og høyre for øyeblikket t.

Formelen for å beregne det glidende gjennomsnittet i dette tilfellet har formen:

Spredningen av det glidende gjennomsnittet er definert som σ 2 /k, hvor gjennom σ2 angir variansen til de originale termene i serien, og k utjevningsintervall, så jo større utjevningsintervall, jo sterkere er gjennomsnittet av dataene og jo mindre foranderlig er trenden. Oftest utføres utjevning på tre, fem og syv medlemmer av den originale serien. Samtidig bør man ta hensyn følgende funksjoner glidende gjennomsnitt: hvis vi vurderer en serie med periodiske svingninger av konstant lengde, vil utjevning basert på det glidende gjennomsnittet med et utjevningsintervall lik eller et multiplum av perioden helt eliminere svingninger. Ofte forvandler utjevning basert på et glidende gjennomsnitt serien så sterkt at den identifiserte utviklingstrenden bare manifesteres i de fleste generelt, og mindre, men viktig for analysedetaljer (bølger, bøyninger, etc.) forsvinner; etter utjevning kan små bølger noen ganger endre retning til motsatte "groper" vises i stedet for "topper", og vice versa. Alt dette krever forsiktighet ved bruk av et enkelt glidende gjennomsnitt og tvinger en til å se etter mer subtile beskrivelsesmetoder.

Den glidende gjennomsnittsmetoden gir ikke trendverdier for den første og siste m radmedlemmer. Denne mangelen er spesielt merkbar i tilfellet når lengden på raden er liten.

3.3. Eksponensiell utjevning

Eksponentielt gjennomsnitt y t er et eksempel på et asymmetrisk vektet glidende gjennomsnitt som tar hensyn til graden av aldring av dataene: "eldre" informasjon med mindre vekt kommer inn i formelen for å beregne den utjevnede verdien av nivået til serien

Her eksponentielt middel som erstatter den observerte verdien av serien y t(utjevning involverer alle dataene som mottas til nåværende øyeblikk t), α utjevningsparameter som karakteriserer vekten til den nåværende (nyeste) observasjonen; 0< α <1.

Metoden brukes til å forutsi ikke-stasjonære tidsserier med tilfeldige endringer i nivå og helning. Når vi beveger oss bort fra det nåværende tidspunktet inn i fortiden, synker vekten av det tilsvarende leddet i serien raskt (eksponentielt) og slutter praktisk talt å ha noen effekt på verdien av .

Det er lett å se at den siste relasjonen lar oss gi følgende tolkning av det eksponentielle gjennomsnittet: if serieverdiprediksjon y t, så er forskjellen prognosefeilen. Så spådommen for neste tidspunkt t+1 tar hensyn til det som ble kjent i øyeblikket t prognosefeil.

Utjevningsalternativ α er en veiefaktor. Hvis α nær enhet, så tar prognosen betydelig hensyn til størrelsen på feilen til den siste prognosen. For små verdier α den anslåtte verdien er nær den forrige prognosen. Valget av utjevningsparameter er et ganske komplisert problem. Generelle betraktninger er som følger: Metoden er god for å forutsi tilstrekkelig jevne serier. I dette tilfellet kan man velge en utjevningskonstant ved å minimere prediksjonsfeilen ett steg frem estimert fra den siste tredjedelen av serien. Noen eksperter anbefaler ikke å bruke store verdier av utjevningsparameteren. På fig. 3.1 viser et eksempel på en utjevnet serie som bruker den eksponentielle utjevningsmetoden for α= 0,1.

Ris. 3.1. Resultatet av eksponentiell utjevning kl α =0,1
(1 originalserie; 2 glattede serier; 3 rester)

3.4. Eksponensiell utjevning
trendbasert (Holt-metoden)

Denne metoden tar hensyn til den lokale lineære trenden som eksisterer i tidsserien. Hvis det er en oppadgående trend i tidsserien, er det også nødvendig med et estimat av det nåværende nivået. I Holt-teknikken jevnes nivå- og helningsverdiene direkte ved å bruke forskjellige konstanter for hver av parameterne. Utjevningskonstanter lar deg estimere gjeldende nivå og helning, og avgrense dem hver gang nye observasjoner gjøres.

Holt-metoden bruker tre beregningsformler:

Eksponentielt jevnet serie (estimat for nåværende nivå)

(3.2)

Trendevaluering

(3.3)

Prognose for R perioder fremover

(3.4)

hvor α, β utjevningskonstanter fra intervallet.

Ligning (3.2) ligner på ligning (3.1) for enkel eksponentiell utjevning bortsett fra trendleddet. Konstant β nødvendig for å jevne ut trendanslaget. I prognoseligningen (3.3) multipliseres trendestimatet med antall perioder R, som prognosen er basert på, og deretter legges dette produktet til det gjeldende nivået av glattede data.

Fast α og β velges subjektivt eller ved å minimere prediksjonsfeilen. Jo større verdier av vektene tas, desto raskere vil responsen på pågående endringer finne sted, og dataene vil bli jevnere. Mindre vekter gjør strukturen til de utjevnede verdiene mindre flat.

På fig. 3.2 viser et eksempel på utjevning av en serie ved hjelp av Holt-metoden for verdier α og β lik 0,1.

Ris. 3.2. Holt utjevnende resultat
på α = 0,1 og β = 0,1

3.5. Eksponentiell utjevning med trend- og sesongvariasjoner (vintermetoden)

Hvis det er sesongmessige svingninger i datastrukturen, brukes den tre-parameter eksponentielle utjevningsmodellen foreslått av Winters for å redusere prognosefeil. Denne tilnærmingen er en forlengelse av den tidligere Holt-modellen. For å ta høyde for sesongvariasjoner, brukes en ekstra ligning her, og denne metoden er fullstendig beskrevet av fire ligninger:

Eksponentielt jevnet serie

(3.5)

Trendevaluering

(3.6)

Sesongvurdering

(3.7)

Prognose for R perioder fremover

(3.8)

hvor α, β, γ konstant utjevning for henholdsvis nivå, trend og sesongvariasjon; s- varigheten av perioden med sesongmessige svingninger.

Ligning (3.5) korrigerer den utjevnede serien. I denne ligningen tar begrepet hensyn til sesongvariasjonen i de opprinnelige dataene. Etter at sesongvariasjon og trend er tatt i betraktning i ligninger (3.6), (3.7), jevnes estimatene ut, og det lages en prognose i ligning (3.8).

Akkurat som i forrige metode, vektene α, β, γ kan velges subjektivt eller ved å minimere prediksjonsfeilen. Før du bruker ligning (3.5), er det nødvendig å bestemme startverdiene for den glattede serien L t, trend T t, sesongmessige koeffisienter S t. Vanligvis blir startverdien til den utjevnede serien tatt lik den første observasjonen, deretter er trenden null, og sesongkoeffisientene settes lik én.

På fig. 3.3 viser et eksempel på utjevning av en serie ved bruk av Winters-metoden.

Ris. 3.3. Resultatet av utjevning etter Winters-metoden
på α = 0,1 ;β = 0,1; y = 0,1(1- original rad; 2 glattede rader; 3 rester)

3.6. Prognoser basert på trendmodeller

Ganske ofte har tidsserier en lineær trend (trend). Forutsatt en lineær trend, må du bygge en rett linje som mest nøyaktig vil reflektere endringen i dynamikk i løpet av den aktuelle perioden. Det er flere metoder for å konstruere en rett linje, men den mest objektive fra et formelt synspunkt vil være en konstruksjon basert på å minimere summen av negative og positive avvik av seriens begynnelsesverdier fra en rett linje.

En rett linje i et to-koordinatsystem (x, y) kan defineres som skjæringspunktet for en av koordinatene på og helningsvinkelen til aksen X. Ligningen for en slik rett linje vil se ut hvor en- skjæringspunkt; b vippevinkel.

For at den rette linjen skal reflektere dynamikkens forløp, er det nødvendig å minimere summen av vertikale avvik. Når man bruker som kriterium for å estimere minimering av en enkel sum av avvik, vil resultatet ikke bli særlig godt, siden negative og positive avvik opphever hverandre. Minimering av summen av absolutte verdier fører heller ikke til tilfredsstillende resultater, siden parameterestimatene i dette tilfellet er ustabile, er det også beregningsvansker med å implementere en slik estimeringsprosedyre. Derfor er den mest brukte prosedyren å minimere summen av kvadrerte avvik, eller minste kvadrat-metoden(MNK).

Siden serien med startverdier har fluktuasjoner, vil modellen av serien inneholde feil, hvis kvadrater må minimeres

hvor y i observert verdi; y i * teoretiske verdier av modellen; observasjonsnummer.

Når vi modellerer trenden til den opprinnelige tidsserien ved å bruke en lineær trend, vil vi anta det

Å dele den første ligningen med n, kommer vi til neste

Sette inn koeffisienten med det resulterende uttrykket i den andre systemligningen (3.10). b* vi får:

3.7. Kontroll av modelltilpasning

Som et eksempel, i fig. 3.4 viser en graf over lineær regresjon mellom kraften til bilen X og dens kostnad på.

Ris. 3.4. Lineær regresjonsplott

Ligningen for dette tilfellet er: på=1455,3 + 13,4 X. Visuell analyse av denne figuren viser at det for en rekke observasjoner er betydelige avvik fra den teoretiske kurven. Restgrafen er vist i fig. 3.5.

Ris. 3.5. Restdiagram

Analyse av regresjonslinjeresidualene kan gi et nyttig mål på hvor godt den estimerte regresjonen reflekterer de virkelige dataene. En god regresjon er en som forklarer en betydelig mengde varians, og omvendt sporer ikke en dårlig regresjon en stor mengde fluktuasjoner i de opprinnelige dataene. Det er intuitivt klart at all tilleggsinformasjon vil forbedre modellen, dvs. redusere den uforklarlige brøkdelen av variasjonen til variabelen på. For å analysere regresjonen vil vi dekomponere variansen i komponenter. Det er åpenbart det

Det siste leddet vil være lik null, siden det er summen av restene, så vi kommer til følgende resultat

hvor SS0, SS1, SS2 bestemme summen av henholdsvis total, regresjon og restsum av kvadrater.

Regresjonssummen av kvadrater måler delen av variansen som er forklart av en lineær sammenheng; gjenværende del av dispersjonen, ikke forklart av en lineær avhengighet.

Hver av disse summene er preget av et tilsvarende antall frihetsgrader (HR), som bestemmer antall dataenheter som er uavhengige av hverandre. Med andre ord er hjertefrekvens relatert til antall observasjoner n og antall parametere beregnet fra totalen av disse parameterne. I saken under vurdering, å beregne SS0 kun én konstant (gjennomsnittsverdi) bestemmes, derfor hjertefrekvensen for SS0 vil være (n– 1), hjertefrekvens for SS 2 - (n - 2) og puls for SS 1 vil være n - (n - 1)=1, siden det er n - 1 konstante punkter i regresjonsligningen. Akkurat som summer av kvadrater, er hjertefrekvens relatert til

Summene av kvadrater knyttet til dekomponeringen av variansen, sammen med de tilsvarende hjertefrekvensene, kan plasseres i den såkalte variansanalysetabellen (ANOVA ANAlysis Of VARiance table) (tabell 3.1).

Tabell 3.1

ANOVA bord

Kilde	Summen av kvadrater		Middels firkantet
Regresjon			SS2/ (n-2)

Ved å bruke den introduserte forkortelsen for summer av kvadrater, definerer vi bestemmelseskoeffisient som forholdet mellom regresjonssummen av kvadrater og totalsummen av kvadrater som

(3.13)

Bestemmelseskoeffisienten måler andelen variabilitet i en variabel Y, som kan forklares ved hjelp av informasjon om variabiliteten til den uavhengige variabelen x. Bestemmelseskoeffisienten endres fra null når X påvirker ikke Y, til en når endringen Y fullstendig forklart av endringen x.

3.8. Regresjonsprognosemodell

Den beste prediksjonen er den med den minste variansen. I vårt tilfelle produserer konvensjonelle minste kvadrater den beste prediksjonen av alle metoder som gir objektive estimater basert på lineære ligninger. Prognosefeilen knyttet til prognoseprosedyren kan komme fra fire kilder.

For det første sikrer den tilfeldige karakteren av additive feil som håndteres av lineær regresjon at prognosen vil avvike fra de sanne verdiene selv om modellen er riktig spesifisert og dens parametere er nøyaktig kjent.

For det andre introduserer selve estimeringsprosessen en feil i estimeringen av parametere, de kan sjelden være lik de sanne verdiene, selv om de er lik dem i gjennomsnitt.

For det tredje, i tilfelle av en betinget prognose (i tilfelle av ukjente eksakte verdier av de uavhengige variablene), introduseres feilen med prognosen for de forklarende variablene.

For det fjerde kan feilen vises fordi modellspesifikasjonen er unøyaktig.

Som et resultat kan feilkilder klassifiseres som følger:

arten av variabelen;
modellens natur;
feilen introdusert av prognosen for uavhengige tilfeldige variabler;
spesifikasjonsfeil.

Vi vil vurdere en ubetinget prognose, når uavhengige variabler er lett og nøyaktig predikert. Vi begynner vår vurdering av prognosekvalitetsproblemet med den sammenkoblede regresjonsligningen.

Problemstillingen i dette tilfellet kan formuleres som følger: hva vil være den beste prognosen y T+1, forutsatt at i modellen y = a + bx alternativer en og b estimert nøyaktig, og verdien xT+1 kjent.

Da kan den predikerte verdien defineres som

Prognosefeilen blir da

Prognosefeil har to egenskaper:

Den resulterende variansen er minimal blant alle mulige estimater basert på lineære ligninger.

Selv om en og b er kjent, vises prognosefeilen på grunn av at ved T+1 kan ikke ligge på regresjonslinjen på grunn av en feil e T+1, som følger en normalfordeling med null gjennomsnitt og varians σ2. For å sjekke kvaliteten på prognosen introduserer vi den normaliserte verdien

95 % konfidensintervallet kan da defineres som følger:

hvor β 0,05 kvantiler av normalfordelingen.

Grensene for 95 %-intervallet kan defineres som

Merk at i dette tilfellet bredden konfidensintervall avhenger ikke av størrelsen X, og grensene til intervallet er rette linjer parallelle med regresjonslinjene.

Oftere, når du konstruerer en regresjonslinje og kontrollerer kvaliteten på prognosen, er det nødvendig å evaluere ikke bare regresjonsparametrene, men også variansen til prognosefeilen. Det kan vises at i dette tilfellet avhenger feilvariansen av verdien (), hvor er middelverdien til den uavhengige variabelen. I tillegg, jo lengre serie, jo mer nøyaktig er prognosen. Prognosefeilen reduseres hvis verdien av X T+1 er nær middelverdien til den uavhengige variabelen, og omvendt, når man beveger seg bort fra middelverdien, blir prognosen mindre nøyaktig. På fig. 3.6 viser resultatene av prediksjonen ved å bruke den lineære regresjonsligningen for 6 tidsintervaller fremover sammen med konfidensintervaller.

Ris. 3.6. Lineær regresjonsprediksjon

Som det fremgår av fig. 3.6, denne regresjonslinjen beskriver ikke de opprinnelige dataene godt: det er stor variasjon i forhold til tilpasningslinjen. Kvaliteten på modellen kan også bedømmes ut fra residualene, som med en tilfredsstillende modell bør fordeles tilnærmet etter normalloven. På fig. 3.7 viser en graf over residualer, bygget ved hjelp av en sannsynlighetsskala.

Fig.3.7. Restdiagram

Ved bruk av en slik skala bør data som følger normalloven ligge på en rett linje. Som det følger av figuren avviker punktene i begynnelsen og slutten av observasjonsperioden noe fra en rett linje, noe som indikerer en utilstrekkelig høy kvalitet på den valgte modellen i form av en lineær regresjonsligning.

I tabellen. Tabell 3.2 viser prognoseresultatene (andre kolonne) sammen med 95 % konfidensintervaller (henholdsvis nedre tredje og øvre fjerde kolonne).

Tabell 3.2

Prognoseresultater

3.9. Multivariat regresjonsmodell

I multivariat regresjon inkluderer dataene for hvert tilfelle verdiene til den avhengige variabelen og hver uavhengig variabel. Avhengig variabel y er en tilfeldig variabel relatert til de uavhengige variablene ved følgende relasjon:

hvor regresjonskoeffisienter skal bestemmes; ε feilkomponent som tilsvarer avviket til verdiene til den avhengige variabelen fra det sanne forholdet (det antas at feilene er uavhengige og har en normalfordeling med null gjennomsnitt og ukjent varians σ ).

For et gitt datasett kan estimater av regresjonskoeffisientene finnes ved å bruke minste kvadraters metode. Hvis OLS-estimatene er merket med , vil den tilsvarende regresjonsfunksjonen se slik ut:

Residualene er estimater av feilkomponenten og ligner residualene ved enkel lineær regresjon.

Statistisk analyse av en multivariat regresjonsmodell utføres på samme måte som analysen av en enkel lineær regresjon. Standardpakker med statistiske programmer gjør det mulig å få estimater ved minste kvadrater for modellparametere, estimater av deres standardfeil. Du kan også få verdien t-statistikk for å sjekke betydningen av individuelle termer i regresjonsmodellen og verdien F-statistikk for å teste betydningen av regresjonsavhengigheten.

Formen for å dele kvadratsummene ved multivariat regresjon ligner på uttrykk (3.13), men forholdet for hjertefrekvens vil være som følger

Det understreker vi igjen n er volumet av observasjoner, og k antall variabler i modellen. Den totale variansen til den avhengige variabelen består av to komponenter: variansen som forklares av de uavhengige variablene gjennom regresjonsfunksjonen og den uforklarlige variansen.

Tabell ANOVA for tilfellet med multivariat regresjon vil ha formen vist i Tabell. 3.3.

Tabell 3.3

ANOVA bord

Kilde	Summen av kvadrater		Middels firkantet
Regresjon			SS2/ (n-k-1)

Som et eksempel på multivariat regresjon vil vi bruke data fra Statistica-pakken (datafil Poverty.Sta) Dataene som presenteres er basert på en sammenligning av resultatene fra folketellingene fra 1960 og 1970. for et tilfeldig utvalg av 30 land. Landnavnene er lagt inn som strengnavn, og navnene på alle variablene i denne filen er oppført nedenfor:

POP_CHNG befolkningsendring for 1960-1970;

N_EMPLD antall personer sysselsatt i landbruket;

PT_DÅLIG prosentandel av familier som lever under fattigdomsgrensen;

TAX_RATE skattesats;

PT_PHONE prosentandel av leiligheter med telefon;

PT_RURAL prosentandel av befolkningen på landsbygda;

AGE middelalder.

Som en avhengig variabel velger vi funksjonen Pt_Dårlig, og som uavhengig - alle de andre. De beregnede regresjonskoeffisientene mellom de valgte variablene er gitt i tabell. 3.4

Tabell 3.4

Regresjonskoeffisienter

Denne tabellen viser regresjonskoeffisientene ( PÅ) og standardiserte regresjonskoeffisienter ( beta). Ved hjelp av koeffisienter PÅ formen til regresjonsligningen er satt, som i dette tilfellet har formen:

Inkluderingen på høyre side av bare disse variablene skyldes at bare disse funksjonene har en sannsynlighetsverdi R mindre enn 0,05 (se fjerde kolonne i tabell 3.4).

Bibliografi

Basovsky L. E. Prognosering og planlegging i markedsforhold. - M .: Infra - M, 2003.
Box J., Jenkins G. Tidsserieanalyse. Utgave 1. Prognose og styring. – M.: Mir, 1974.
Borovikov V. P., Ivchenko G. I. Prognoser i Statistica-systemet i Windows-miljøet. - M.: Finans og statistikk, 1999.
Duke V. Databehandling på PC i eksempler. - St. Petersburg: Peter, 1997.
Ivchenko B. P., Martyshchenko L. A., Ivantsov I. B. Informasjonsmikroøkonomi. Del 1. Metoder for analyse og prognoser. - St. Petersburg: Nordmed-Izdat, 1997.
Krichevsky M. L. Introduksjon til kunstige nevrale nettverk: Proc. godtgjørelse. - St. Petersburg: St. Petersburg. stat marin teknologi. un-t, 1999.
Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Multivariat statistisk analyse i økonomi. – M.: Unity-Dana, 1999.

Identifisering og analyse av trenden til en tidsserie gjøres ofte ved hjelp av justering eller utjevning. Eksponentiell utjevning er en av de enkleste og vanligste seriejusteringsteknikkene. Eksponentiell utjevning kan representeres som et filter, hvis inngang mottas sekvensielt av medlemmene i den opprinnelige serien, og de nåværende verdiene til det eksponentielle gjennomsnittet dannes ved utgangen.

La være en tidsserie.

Eksponentiell utjevning av serien utføres i henhold til den tilbakevendende formelen: , .

Jo mindre α, jo mer filtrerte, undertrykte fluktuasjoner i den originale serien og støy.

Hvis denne rekursive relasjonen brukes konsekvent, kan det eksponentielle gjennomsnittet uttrykkes i form av verdiene til tidsserien X.

Hvis tidligere data eksisterer når utjevningen starter, kan det aritmetiske gjennomsnittet av alle eller noen av de tilgjengelige dataene brukes som startverdi.

Etter utseendet til verkene til R. Brown, brukes ofte eksponentiell utjevning for å løse problemet med kortsiktige prognoser for tidsserier.

Formulering av problemet

La tidsserien gis: .

Det er nødvendig å løse problemet med tidsserieprognoser, dvs. finne

Prognosehorisont er det nødvendig at

For å ta hensyn til foreldelse av data, introduserer vi en ikke-økende sekvens av vekter, deretter

Brun modell

Anta at D er liten (kortsiktig prognose), så bruk for å løse et slikt problem brun modell.

Hvis vi vurderer prognosen et skritt foran, så - feilen i denne prognosen, og den nye prognosen er oppnådd som et resultat av å justere den forrige prognosen, tatt i betraktning dens feil - essensen av tilpasning.

I korttidsprognoser er det ønskelig å reflektere nye endringer så raskt som mulig og samtidig «rense» serien fra tilfeldige svingninger best mulig. At. øke vekten av nyere observasjoner: .

På den annen side, for å jevne ut tilfeldige avvik, må α reduseres: .

At. disse to kravene er i konflikt. Søket etter en kompromissverdi av α er problemet med modelloptimalisering. Vanligvis tas α fra intervallet (0,1/3).

Eksempler

Arbeid med eksponentiell utjevning ved α=0,2 på data fra månedlige rapporter om salg av et utenlandsk bilmerke i Russland for perioden fra januar 2007 til oktober 2008. Vi noterer oss kraftige fall i januar og februar, når salget tradisjonelt synker og øker tidlig sommer.

Problemer

Modellen fungerer kun med en liten prognosehorisont. Trend og sesongmessige endringer er ikke tatt i betraktning. For å ta hensyn til deres innflytelse, foreslås det å bruke følgende modeller: Holt (lineær trend er tatt i betraktning), Holt-Winters (multiplikativ eksponentiell trend og sesongvariasjon), Theil-Wage (additiv lineær trend og sesongvariasjon).