Biografier Kjennetegn Analyse

Hvordan eksponentiell utjevning fungerer. Eksponentiell utjevningsmetode

Prognoseoppgaver er bygget på endringen i enkelte data over tid (salg, etterspørsel, tilbud, BNP, karbonutslipp, befolkning ...) og projiserer disse endringene inn i fremtiden. Dessverre, identifisert på historiske data, kan trender brytes av mange uforutsette omstendigheter. Så dataene i fremtiden kan avvike betydelig fra det som skjedde i fortiden. Dette er problemet med prognoser.

Imidlertid er det teknikker (kalt eksponentiell utjevning) som ikke bare lar deg prøve å forutsi fremtiden, men også å uttrykke usikkerheten til alt relatert til prognosen numerisk. Numerisk uttrykk for usikkerhet ved å lage prognoseintervaller er virkelig uvurderlig, men ofte oversett i prognoseverdenen.

Last ned notat i eller format, eksempler i format

Innledende data

La oss si at du er en Ringenes Herre-fan og har laget og solgt sverd i tre år (Figur 1). La oss vise salg grafisk (fig. 2). Etterspørselen har doblet seg på tre år – kanskje dette er en trend? Vi kommer tilbake til denne ideen litt senere. Det er flere topper og daler på kartet, noe som kan være et tegn på sesongvariasjoner. Spesielt er toppene i månedene 12, 24 og 36, som tilfeldigvis er desember. Men det er kanskje bare en tilfeldighet? La oss finne det ut.

Enkel eksponentiell utjevning

Metoder eksponensiell utjevning er basert på å forutsi fremtiden fra data fra fortiden, hvor nyere observasjoner veier mer enn eldre. Slik vekting er mulig på grunn av utjevningskonstanter. Den første eksponentielle utjevningsmetoden vi skal prøve kalles enkel eksponentiell utjevning (PES). eksponensiell utjevning, SES). Den bruker bare én utjevningskonstant.

Enkel eksponentiell utjevning forutsetter at datatidsserien din har to komponenter: et nivå (eller gjennomsnitt) og en feil rundt den verdien. Det er ingen trend eller sesongmessige svingninger – det er bare et nivå som etterspørselen svinger rundt, omgitt av små feil her og der. Ved å gi preferanse til nyere observasjoner, kan TEC forårsake endringer i dette nivået. På formlenes språk,

Etterspørsel på tidspunkt t = nivå + tilfeldig feil nær nivået på tidspunktet t

Så hvordan finner du den omtrentlige verdien av nivået? Hvis vi aksepterer alle tidsverdier som har samme verdi, bør vi ganske enkelt beregne gjennomsnittsverdien deres. Dette er imidlertid en dårlig idé. Nyere observasjoner bør tillegges større vekt.

La oss lage noen nivåer. Beregn grunnlinjen for det første året:

nivå 0 = gjennomsnittlig etterspørsel for det første året (måned 1-12)

For sverdbehov er det 163. Vi bruker nivå 0 (163) som etterspørselsprognose for måned 1. Etterspørselen i måned 1 er 165, som er 2 sverd over nivå 0. Det er verdt å oppdatere grunnlinjetilnærmingen. Enkel eksponentiell utjevningsligning:

nivå 1 = nivå 0 + noen få prosent × (krav 1 - nivå 0)

nivå 2 = nivå 1 + noen få prosent × (krav 2 - nivå 1)

Etc. «Noen få prosent» kalles utjevningskonstanten, og betegnes med alfa. Det kan være et hvilket som helst tall fra 0 til 100 % (0 til 1). Du vil lære hvordan du velger en alfaverdi senere. PÅ generell sak verdi for forskjellige tidspunkter:

Nivå gjeldende periode = nivå forrige periode +
alfa × (etterspørsel gjeldende periode - nivå forrige periode)

Fremtidig etterspørsel er lik sist beregnede nivå (fig. 3). Siden du ikke vet hva alfa er, sett celle C2 til 0,5 til å begynne med. Etter at modellen er bygget, finn en alfa slik at summen av kvadrater av feilen er E2 (eller standardavvik– F2) var minimale. For å gjøre dette, kjør alternativet Finne en løsning. For å gjøre dette, gå gjennom menyen DATA –> Finne en løsning, og sett i vinduet Løsningssøkealternativer nødvendige verdier (fig. 4). For å vise resultatene av prognosen på diagrammet, velg først området A6:B41, og bygg et enkelt linjediagram. Høyreklikk deretter på diagrammet, velg alternativet Velg data. I vinduet som åpnes, lag en andre rad og sett inn prediksjoner fra A42:B53-området i den (fig. 5).

Kanskje du har en trend

For å teste denne antagelsen er det nok å passe lineær regresjon under etterspørselsdataene og utfør en t-test på økningen av denne trendlinjen (som i ). Hvis stigningstallet på linjen ikke er null og statistisk signifikant (i studentens test, verdien R mindre enn 0,05), har dataene en trend (fig. 6).

Vi brukte LINEST-funksjonen, som returnerer 10 beskrivende statistikk(hvis du ikke har brukt denne funksjonen før, anbefaler jeg den) og INDEX-funksjonen, som lar deg "trekke ut" kun de tre nødvendige statistikkene, og ikke hele settet. Det viste seg at helningen er 2,54, og den er signifikant, siden Studentens test viste at 0,000000012 er betydelig mindre enn 0,05. Så det er en trend, og det gjenstår å inkludere den i prognosen.

Eksponentiell Holt-utjevning med trendkorreksjon

Det blir ofte referert til som dobbel eksponentiell utjevning fordi det har to utjevningsparametere, alfa, i stedet for én. Hvis tidssekvensen har en lineær trend, så:

etterspørsel over tid t = nivå + t × trend + tilfeldig avvik nivå på tidspunkt t

Holt eksponentiell utjevning med trendkorreksjon har to nye ligninger, en for nivået når det beveger seg fremover i tid og den andre for trenden. Nivåligningen inneholder utjevningsparameteren alfa, og trendligningen inneholder gamma. Slik ser den nye nivåligningen ut:

nivå 1 = nivå 0 + trend 0 + alfa × (behov 1 - (nivå 0 + trend 0))

noter det nivå 0 + trend 0 er bare en ett-trinns prognose fra de opprinnelige verdiene til måned 1, så etterspørsel 1 – (nivå 0 + trend 0) er et ett-trinns avvik. Dermed vil den grunnleggende nivåtilnærmingsligningen være som følger:

nåværende periodenivå = forrige periodenivå + forrige periodetrend + alfa × (nåværende periodeetterspørsel - (forrige periodenivå) + forrige periodetrend))

Trendoppdateringsligning:

trend nåværende periode = trend forrige periode + gamma × alfa × (etterspørsel gjeldende periode – (nivå forrige periode) + trend forrige periode))

Holt-utjevning i Excel ligner på enkel utjevning (fig. 7), og som ovenfor er målet å finne to koeffisienter samtidig som summen av kvadrerte feil minimeres (fig. 8). For å få det opprinnelige nivået og trendverdiene (i cellene C5 og D5 i figur 7), bygg et diagram for de første 18 månedene med salg og legg til en trendlinje med en ligning. Skriv inn den innledende trendverdien på 0,8369 og startnivået på 155,88 i cellene C5 og D5. Prognosedata kan presenteres grafisk (fig. 9).

Ris. 7. Eksponentiell Holt-utjevning med trendkorreksjon; For å forstørre et bilde, høyreklikk på det og velg Åpne bildet i ny fane

Finne mønstre i data

Det er en måte å teste den prediktive modellen for styrke - å sammenligne feilene med seg selv, forskjøvet med et trinn (eller flere trinn). Hvis avvikene er tilfeldige, kan ikke modellen forbedres. Det kan imidlertid være en sesongmessig faktor i etterspørselsdataene. Konseptet med en feil som korrelerer med sin egen versjon over en annen periode kalles autokorrelasjon (for mer om autokorrelasjon, se ). For å beregne autokorrelasjon, start med prognosefeildata for hver periode (overfør kolonne F i figur 7 til kolonne B i figur 10). Definer neste gjennomsnittlig feil prognose (Figur 10, celle B39; formel i celle: =GJENNOMSNITT(B3:B38)). I kolonne C beregner du avviket til prognosefeilen fra gjennomsnittet; formel i celle C3: =B3-B$39. Deretter flytter du kolonne C sekvensielt en kolonne til høyre og en rad nedover. Formler i cellene D39: =SUMPRODUKT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Hva kan "synkron bevegelse" med kolonne C bety for en av kolonnene D: O. Hvis for eksempel kolonne C og D er synkrone, må et tall som er negativt i en av dem være negativt i den andre, positivt i den ene , positiv i venn. Dette betyr at summen av produktene til de to kolonnene vil være signifikant (forskjeller akkumuleres). Eller, som er det samme, jo nærmere verdien i området D41:O41 er null, desto lavere er korrelasjonen av kolonnen (henholdsvis fra D til O) med kolonne C (fig. 11).

Én autokorrelasjon er over den kritiske verdien. Årsforskjøvet feil korrelerer med seg selv. Dette betyr en 12-måneders sesongsyklus. Og dette er ikke overraskende. Ser man på etterspørselsgrafen (Figur 2), viser det seg at det er topper i etterspørselen hver jul og fall i april-mai. Vurder en prognoseteknikk som tar hensyn til sesongvariasjoner.

Multiplikativ eksponentiell Holt-Winters utjevning

Metoden kalles multiplikativ (fra multiplisere - multiplisere), fordi den bruker multiplikasjon for å ta høyde for sesongvariasjoner:

Etterspørsel på tidspunkt t = (nivå + t × trend) × sesongjustering på tidspunkt t × eventuelle gjenværende uregelmessige justeringer som vi ikke kan gjøre rede for

Holt-Winters utjevning kalles også trippel eksponentiell utjevning fordi den har tre utjevningsparametere (alfa, gamma og delta sesongfaktor). For eksempel, hvis det er en 12 måneders sesongsyklus:

Månedlig prognose 39 = (nivå 36 + 3 × trend 36) x sesongvariasjon 27

Når man analyserer dataene er det nødvendig å finne ut hva som er trenden i dataserien og hva som er sesongvariasjonen. For å utføre beregninger ved hjelp av Holt-Winters-metoden, må du:

  • Glatt historiske data ved å bruke glidende gjennomsnittsmetoden.
  • Sammenlign den glattede versjonen av tidsserien med originalen for å få et grovt estimat av sesongvariasjoner.
  • Få nye data uten sesongkomponenter.
  • Finn nivå- og trendtilnærmelser basert på disse nye dataene.

Start med de originale dataene (kolonne A og B i figur 12) og legg til kolonne C med utjevnede verdier basert på glidende gjennomsnitt. Siden sesongvariasjoner har 12-måneders sykluser, er det fornuftig å bruke et 12-måneders gjennomsnitt. Det er et lite problem med dette gjennomsnittet. 12 er et partall. Hvis du jevner ut etterspørselen for måned 7, bør det betraktes som gjennomsnittlig etterspørsel fra måned 1 til 12, eller fra 2 til 13? For å håndtere denne vanskeligheten må vi jevne ut etterspørselen ved å bruke et "bevegende gjennomsnitt 2x12". Det vil si, ta halvparten av de to gjennomsnittene fra måned 1 til 12 og fra 2 til 13. Formelen i celle C8 er: =(GJENNOMSNITT(B3:B14)+GJENNOMSNITT(B2:B13))/2.

Utjevnede data for månedene 1–6 og 31–36 kan ikke oppnås fordi det ikke er nok tidligere og påfølgende perioder. For klarhetens skyld kan de originale og glattede dataene vises i et diagram (fig. 13).

Nå, i kolonne D, del den opprinnelige verdien med den utjevnede verdien for å få et estimat av sesongjusteringen (kolonne D i figur 12). Formel i celle D8: =B8/C8. Legg merke til topper på 20 % over normal etterspørsel i månedene 12 og 24 (desember) mens det er fall om våren. Denne utjevningsteknikken har gitt deg to punktanslag for hver måned (totalt 24 måneder). Kolonne E er gjennomsnittet av disse to faktorene. Formelen i celle E1 er: =GJENNOMSNITT(D14,D26). For klarhetens skyld kan nivået av sesongsvingninger representeres grafisk (fig. 14).

Nå kan du få data justert for sesongmessige svingninger. Formel i celle G1: =B2/E2. Bygg en graf basert på dataene i kolonne G, fullfør den med en trendlinje, vis trendligningen på diagrammet (fig. 15), og bruk koeffisientene i påfølgende beregninger.

form nytt løv, som vist i fig. 16. Bytt ut verdiene i området E5:E16 fra fig. 12 områder E2:E13. Ta verdiene til C16 og D16 fra ligningen til trendlinjen i fig. 15. Sett verdiene til utjevningskonstantene til å starte på rundt 0,5. Utvid verdiene i rad 17 over månedene 1 til 36. Kjør Finne en løsning for å optimalisere utjevningskoeffisienter (fig. 18). Formel i celle B53: =(C$52+(A53-A$52)*D$52)*E41.

Nå i prognosen som er laget, må du sjekke autokorrelasjonene (fig. 18). Siden alle verdier er plassert mellom øvre og nedre grenser, forstår du at modellen gjorde en god jobb med å forstå strukturen til etterspørselsverdier.

Bygge et konfidensintervall for prognosen

Så vi har en ganske fungerende prognose. Hvordan setter du øvre og nedre grenser som kan brukes til å gjøre realistiske gjetninger? Monte Carlo-simuleringen, som du allerede har møtt i (se også ), vil hjelpe deg med dette. Poenget er å generere fremtidige scenarier for etterspørselsatferd og bestemme gruppen som 95 % av dem faller inn i.

Fjern fra arket Excel-prognose fra cellene B53:B64 (se fig. 17). Der skal du skrive etterspørsel basert på simuleringen. Sistnevnte kan genereres ved hjelp av NORMINV-funksjonen. For fremtidige måneder trenger du bare å oppgi den med gjennomsnittet (0), standardfordelingen (10,37 fra celle $H$2), og tilfeldig tall fra 0 til 1. Funksjonen vil returnere avviket med en sannsynlighet som tilsvarer klokkekurven. Sett en simulering av ett-trinns feil i celle G53: =NORMINV(RAND();0;H$2). Å strekke denne formelen ned til G64 gir deg simuleringer av prognosefeilen for en 12 måneders ett-trinns prognose (Figur 19). Simuleringsverdiene dine vil avvike fra de som er vist på figuren (det er derfor det er en simulering!).

Med Forecast Error har du alt du trenger for å oppdatere nivået, trenden og sesongfaktoren. Så velg cellene C52:F52 og strekk dem til rad 64. Som et resultat har du en simulert prognosefeil og selve prognosen. Går fra det motsatte, er det mulig å forutsi verdiene av etterspørselen. Sett inn formelen i celle B53: =F53+G53 og strekk den til B64 (fig. 20, område B53:F64). Nå kan du trykke på F9-knappen, hver gang du oppdaterer prognosen. Plasser resultatene av 1000 simuleringer i cellene A71:L1070, hver gang du transponerer verdier fra området B53:B64 til området A71:L71, A72:L72, ... A1070:L1070. Hvis det plager deg, skriv VBA-koden.

Nå har du 1000 scenarier for hver måned, og du kan bruke PERSENTIL-funksjonen for å få øvre og nedre grenser i midten av 95 % konfidensintervallet. I celle A66 er formelen: =PERSENTIL(A71:A1070,0,975) og i celle A67: =PERSENTIL(A71:A1070,0,025).

Som vanlig, for klarhetens skyld, kan dataene presenteres i grafisk form(Fig. 21).

Det er to interessante punkter på diagrammet:

  • Feilmarginen øker med tiden. Det gir mening. Usikkerhet akkumuleres hver måned.
  • På samme måte øker feilen i delene som faller på perioder med sesongmessig økning i etterspørselen. Med påfølgende fall krymper feilen.

Basert på materiale fra en bok av John Foreman. – M.: Alpina Publisher, 2016. – S. 329–381

Det glidende gjennomsnittet lar deg jevne ut dataene perfekt. Men dens største ulempe er at hver verdi i kildedataene har samme vekt. For eksempel, for et glidende gjennomsnitt som bruker en seksukers periode, gis hver verdi for hver uke 1/6 av vekten. For enkelte innsamlede statistikker tillegges nyere verdier mer vekt. Derfor brukes eksponentiell utjevning for å gi de nyeste dataene større vekt. Dermed er dette statistiske problemet løst.

Beregningsformel for eksponentiell utjevning i Excel

Figuren under viser en etterspørselsrapport for et bestemt produkt i 26 uker. Kolonnen Etterspørsel inneholder informasjon om antall solgte varer. I kolonnen "Værvarsel" - formelen:

Kolonnen "Glidende gjennomsnitt" definerer den anslåtte etterspørselen, beregnet ved å bruke den vanlige beregningen av det glidende gjennomsnittet med en periode på 6 uker:

I den siste kolonnen "Værvarsel", med formelen beskrevet ovenfor, brukes metoden for eksponentiell utjevning av data der verdiene for de siste ukene har mer vekt enn de foregående.

Koeffisienten "Alpha:" legges inn i celle G1, det betyr vekten av tildelingen til de nyeste dataene. PÅ dette eksemplet den har en verdi på 30 %. De resterende 70 % av vekten fordeles til resten av dataene. Det vil si at den andre verdien når det gjelder relevans (fra høyre til venstre) har en vekt lik 30% av de resterende 70% av vekten - dette er 21%, den tredje verdien har en vekt lik 30% av resten av de 70 % av vekten - 14,7 % og så videre .



Eksponentiell utjevningsplott

Figuren nedenfor viser etterspørselsgrafen, det glidende gjennomsnittet og den eksponentielle utjevningsprognosen, som er bygget på grunnlag av de opprinnelige verdiene:


Legg merke til at den eksponentielle utjevningsprognosen er mer responsiv på endringer i etterspørselen enn den glidende gjennomsnittslinjen.

Dataene for påfølgende foregående uker multipliseres med alfafaktoren, og resultatet legges til resten av vektprosenten multiplisert med den forrige predikerte verdien.

9 5. Metode for eksponentiell utjevning. Velge en utjevningskonstant

Ved bruk av metoden minste kvadrater for å bestemme den prediktive trenden (trenden), antas det på forhånd at alle retrospektive data (observasjoner) har samme informasjonsinnhold. Åpenbart ville det være mer logisk å ta hensyn til diskonteringsprosessen bakgrunnsinformasjon, det vil si ulikheten mellom disse dataene for utviklingen av en prognose. Dette oppnås i den eksponentielle utjevningsmetoden ved å gi de siste observasjonene av tidsserien (det vil si verdiene umiddelbart før prognoseperioden) mer signifikante "vekter" sammenlignet med de første observasjonene. Fordelene med den eksponentielle utjevningsmetoden bør også inkludere enkelheten til beregningsoperasjoner og fleksibiliteten til å beskrive ulike prosessdynamikker. Metoden har funnet størst anvendelse for implementering av mellomlangsiktige prognoser.

5.1. Essensen av den eksponentielle utjevningsmetoden

Essensen av metoden er det dynamisk serie jevnes ut med et vektet "bevegende gjennomsnitt" der vektene følger en eksponentiell lov. Med andre ord, jo lenger fra slutten av tidsserien er punktet som det vektede glidende gjennomsnittet beregnes for, jo mindre «deltakelse tar det» i utviklingen av prognosen.

La den originale dynamiske serien bestå av nivåer (seriekomponenter) y t , t = 1 , 2 ,...,n . For hvert m påfølgende nivå i denne serien

(m

dynamisk serie med trinn lik ett. Hvis m er et oddetall, og det er å foretrekke å ta et oddetall av nivåer, siden i dette tilfellet vil den beregnede nivåverdien være i midten av utjevningsintervallet og det er lett å erstatte den faktiske verdien med den, Følgende formel kan skrives for å bestemme det glidende gjennomsnittet:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t−ξ

i= t−ξ

2ξ + 1

hvor y t er verdien av det glidende gjennomsnittet for øyeblikket t (t = 1 , 2 ,...,n ), y i er den faktiske verdien av nivået i øyeblikket i ;

i er ordenstallet til nivået i utjevningsintervallet.

Verdien av ξ bestemmes fra varigheten av utjevningsintervallet.

Fordi det

m = 2 ξ +1

for oddetall, da

ξ = m 2 − 1 .

Beregningen av det glidende gjennomsnittet for et stort antall nivåer kan forenkles ved å definere påfølgende verdier av det glidende gjennomsnittet rekursivt:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Men gitt det faktum at de siste observasjonene må tillegges mer «vekt», må det glidende gjennomsnittet tolkes annerledes. Det ligger i det faktum at verdien oppnådd ved gjennomsnittsberegning ikke erstatter det sentrale leddet i gjennomsnittsintervallet, men dets siste ledd. Følgelig kan det siste uttrykket skrives om som

Mi = Mi + 1

y i− y i− m

Her er det glidende gjennomsnittet, relatert til slutten av intervallet, betegnet med det nye symbolet M i . I hovedsak er Mi lik y t forskjøvet ξ trinn til høyre, det vil si M i = y t + ξ , hvor i = t + ξ .

Tatt i betraktning at M i − 1 er et estimat av y i − m , uttrykk (5.1)

kan skrives om i skjemaet

y i+ 1

M i − 1 ,

M i definert ved uttrykk (5.1).

hvor M i er estimatet

Hvis beregninger (5.2) gjentas etter hvert som ny informasjon kommer inn

og omskriv i en annen form, så får vi en jevnet observasjonsfunksjon:

Q i= α y i+ (1 − α ) Q i− 1 ,

eller i tilsvarende form

Q t= α y t+ (1 − α ) Q t− 1

Beregninger utført ved uttrykk (5.3) med hver ny observasjon kalles eksponentiell utjevning. I det siste uttrykket, for å skille eksponentiell utjevning fra glidende gjennomsnitt, introduseres notasjonen Q i stedet for M . Verdien α , som er

analog til m 1 kalles utjevningskonstanten. Verdiene til α ligger i

intervall [0, 1]. Hvis α er representert som en serie

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

det er lett å se at "vektene" avtar eksponentielt over tid. For eksempel, for α = 0, 2 får vi

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Summen av serien har en tendens til enhet, og summen avtar med tiden.

Verdien av Q t i uttrykk (5.3) er det eksponentielle gjennomsnittet av første orden, det vil si gjennomsnittet hentet direkte fra

utjevning av observasjonsdata (primær utjevning). Noen ganger når man utvikler statistiske modeller, er det nyttig å ty til beregningen av eksponentielle gjennomsnitt av høyere ordre, det vil si gjennomsnitt oppnådd ved gjentatt eksponentiell utjevning.

Den generelle notasjonen i den rekursive formen av det eksponentielle gjennomsnittet av orden k er

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Verdien av k varierer innenfor 1, 2, …, p ,p+1, der p er rekkefølgen til det prediktive polynomet (lineært, kvadratisk, og så videre).

Basert på denne formelen, for det eksponentielle gjennomsnittet av første, andre og tredje orden, uttrykkene

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Bestemme parametrene til den prediktive modellen ved å bruke den eksponentielle utjevningsmetoden

Åpenbart, for å utvikle prediktive verdier basert på den dynamiske serien ved bruk av eksponentiell utjevningsmetode, er det nødvendig å beregne koeffisientene til trendligningen gjennom eksponentielle gjennomsnitt. Estimatene av koeffisientene bestemmes av det grunnleggende teoremet til Brown-Meyer, som relaterer koeffisientene til det prediktive polynomet til de eksponentielle gjennomsnittene av de tilsvarende ordenene:

(− 1 )

aˆ s

α (1 − α )∞

−α )

j (p − 1 + j) !

∑j

p=0

p! (k− 1 ) !j = 0

hvor aˆ p er estimater av koeffisientene til polynomet av grad p .

Koeffisientene er funnet ved å løse systemet (p + 1 ) av ligningene сp + 1

ukjent.

Så, for en lineær modell

aˆ 0 = 2 Q t (1) − Q t (2); aˆ 1 = 1 − α α (Q t (1 )− Q t (2 ));

for en kvadratisk modell

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [(6 −5 α) Q t (1) −2 (5 −4 α) Q t (2) +(4 −3 α) Q t (3)];

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Prognosen implementeres i henhold til henholdsvis valgt polynom for den lineære modellen

ˆyt + τ = aˆ0 + aˆ1 τ ;

for en kvadratisk modell

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

hvor τ er prediksjonstrinnet.

Det skal bemerkes at de eksponentielle gjennomsnittene Qt(k) bare kan beregnes med en kjent (valgt) parameter, med kjennskap til startbetingelsene Q0(k).

Estimater av startbetingelser, spesielt for en lineær modell

Q(1)=a

1 − α

Q(2) = a − 2 (1 − α ) a

for en kvadratisk modell

Q(1)=a

1 − α

+ (1 − α )(2 − α ) a

2(1−α)

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q(3)=a

3(1−α)

(1 − α )(4 − 3 α ) a

hvor koeffisientene a 0 og a 1 beregnes etter minste kvadraters metode.

Verdien av utjevningsparameteren α beregnes omtrentlig ved hjelp av formelen

α ≈ m 2 + 1,

hvor m er antall observasjoner (verdier) i utjevningsintervallet. Sekvensen for beregning av prediktive verdier er vist i

Beregning av koeffisienter for en serie ved hjelp av minste kvadraters metode

Bestemmelse av utjevningsintervallet

Beregning av utjevningskonstanten

Beregning av startbetingelser

Beregning av eksponentielle gjennomsnitt

Beregning av estimater a 0 , a 1 , etc.

Beregning av prognoseverdier for en serie

Ris. 5.1. Sekvensen for beregning av prognoseverdier

Som et eksempel kan du vurdere prosedyren for å oppnå den prediktive verdien av produktets oppetid, uttrykt ved tiden mellom feil.

De første dataene er oppsummert i tabell. 5.1.

Vi velger en lineær prognosemodell i formen y t = a 0 + a 1 τ

Løsningen er gjennomførbar med følgende startverdier:

a 0, 0 = 64, 2; a1, 0 = 31,5; a = 0,305.

Tabell 5.1. Innledende data

Observasjonsnummer, t

Trinnlengde, prediksjon, τ

MTBF, y (time)

For disse verdiene er de beregnede "utjevnede" koeffisientene for

y 2 verdier vil være like

= α Q (1)− Q (2)= 97, 9;

[ Q (1) − Q (2)

31, 9 ,

1−α

under opprinnelige forhold

1 − α

A 0 , 0 −

en 1, 0

= −7 , 6

1 − α

= −79 , 4

og eksponentielle gjennomsnitt

Q (1)= α y + (1 − α ) Q (1)

25, 2;

Q(2)

= α Q (1)

+ (1 −α) Q (2) = −47, 5.

Den "utjevnede" verdien y 2 beregnes deretter med formelen

Q i (1)

Q i (2)

a 0,i

a 1,i

ˆyt

Dermed (tabell 5.2) har den lineære prediktive modellen formen

ˆy t + τ = 224,5+ 32τ .

La oss beregne de predikerte verdiene for blyperioder på 2 år (τ = 1 ), 4 år (τ = 2 ) og så videre, tiden mellom feil på produktet (tabell 5.3).

Tabell 5.3. Prognoseverdierˆy t

Ligningen

t+2

t+4

t+6

t+8

t+20

regresjon

(τ = 1)

(τ=2)

(τ = 3)

(τ=5)

τ =

ˆy t = 224,5+ 32τ

Det skal bemerkes at den totale "vekten" av de siste m-verdiene i tidsserien kan beregnes med formelen

c = 1 − (m (− 1) m). m+ 1

For de to siste observasjonene av serien (m = 2 ) er altså verdien c = 1 − (2 2 − + 1 1 ) 2 = 0. 667 .

5.3. Valg av startbetingelser og bestemmelse av utjevningskonstanten

Som følger av uttrykket

Q t= α y t+ (1 − α ) Q t− 1 ,

når du utfører eksponentiell utjevning, er det nødvendig å kjenne den innledende (forrige) verdien av den utjevnede funksjonen. I noen tilfeller kan den første observasjonen tas som startverdi, oftere bestemmes startbetingelsene i henhold til uttrykk (5.4) og (5.5). I dette tilfellet er verdiene a 0 , 0 , a 1 , 0

og a 2, 0 bestemmes ved minste kvadraters metode.

Hvis vi ikke virkelig stoler på den valgte startverdien, vil vi ved å ta en stor verdi av utjevningskonstanten α til k observasjoner bringe

"vekt" av startverdien opp til verdien (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Dermed innebærer valget av utjevningskonstanten (eller antall observasjoner i det glidende gjennomsnittet) en avveining. Vanligvis, som praksis viser, ligger verdien av utjevningskonstanten i området fra 0,01 til 0,3.

Det er kjent flere overganger som gjør at man kan finne et omtrentlig estimat av α . Den første følger av betingelsen om at det glidende gjennomsnittet og det eksponentielle gjennomsnittet er like

α \u003d m 2 + 1,

hvor m er antall observasjoner i utjevningsintervallet. Andre tilnærminger er knyttet til nøyaktigheten av prognosen.

Så det er mulig å bestemme α basert på Meyer-relasjonen:

α ≈ S y ,

hvor S y er standardfeilen til modellen;

S 1 er den gjennomsnittlige kvadratfeilen til den opprinnelige serien.

Imidlertid er bruken av sistnevnte forhold komplisert av det faktum at det er svært vanskelig å pålitelig bestemme S y og S 1 fra den første informasjonen.

Ofte utjevningsparameteren, og samtidig koeffisientene a 0 , 0 og a 0 , 1

velges som optimale avhengig av kriteriet

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j=0

ved å løse det algebraiske ligningssystemet, som oppnås ved å likestille de deriverte til null

∂S2

∂S2

∂S2

∂a0, 0

∂ a 1, 0

∂a2, 0

Så for en lineær prognosemodell er startkriteriet lik

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j=0

Løsningen av dette systemet ved hjelp av en datamaskin byr ikke på noen vanskeligheter.

For et rimelig valg av α kan du også bruke den generaliserte utjevningsprosedyren, som lar deg få følgende relasjoner knyttet til prognosevariansen og utjevningsparameteren for en lineær modell:

S p 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

for en kvadratisk modell

S p 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

hvor β = 1 α ;Sy– RMS-tilnærming til den innledende dynamiske serien.

Tema 3. Utjevning og prognoser av tidsserier basert på trendmodeller

mål studiet av dette emnet er opprettelsen av et grunnleggende grunnlag for opplæring av ledere i spesialiteten 080507 innen bygging av modeller for ulike oppgaver innen økonomi, dannelsen av en systematisk tilnærming til å sette og løse prognoseproblemer blant studenter . Det foreslåtte kurset vil tillate spesialister å raskt tilpasse seg praktisk arbeid, bedre navigere i den vitenskapelige og tekniske informasjonen og litteraturen i deres spesialitet, og ta mer selvsikre beslutninger som oppstår i arbeidet deres.

Hoved oppgaver studiet av emnet er: studenter får dyptgående teoretisk kunnskap om anvendelse av prognosemodeller, tilegner seg stabile ferdigheter i å utføre forskningsarbeid, evnen til å løse komplekse vitenskapelige problemer knyttet til bygningsmodeller, inkludert flerdimensjonale, evnen til å logisk analysere oppnådde resultater og bestemme måter å finne akseptable løsninger på.

En ganske enkel metode for å identifisere utviklingstrender er utjevning av tidsseriene, det vil si å erstatte de faktiske nivåene med beregnede som har mindre variasjoner enn de opprinnelige dataene. Den tilsvarende transformasjonen kalles filtrering. La oss vurdere flere metoder for utjevning.

3.1. enkle gjennomsnitt

Målet med utjevningen er å bygge en prognosemodell for fremtidige perioder basert på tidligere observasjoner. I metoden for enkle gjennomsnitt tas verdiene til variabelen som startdata Y på tidspunkter t, og prognoseverdien bestemmes som et enkelt gjennomsnitt for neste tidsperiode. Beregningsformelen har formen

hvor n antall observasjoner.

I tilfelle når en ny observasjon blir tilgjengelig, bør den nylig mottatte prognosen også tas med i prognosen for neste periode. Når du bruker denne metoden, utføres prognosen ved å snitte alle tidligere data, men ulempen med slik prognose er vanskeligheten med å bruke den i trendmodeller.

3.2. Glidende gjennomsnittsmetode

Denne metoden er basert på å representere serien som en sum av en ganske jevn trend og en tilfeldig komponent. Metoden er basert på ideen om å beregne den teoretiske verdien basert på en lokal tilnærming. Å bygge et trendestimat på et punkt t med verdiene til serien fra tidsintervallet beregne den teoretiske verdien av serien. Den mest utbredte i praksisen med utjevningsserier er tilfellet når alle vektene for elementene i intervallet er like med hverandre. Av denne grunn kalles denne metoden glidende gjennomsnittsmetode, siden når prosedyren utføres, et vindu med en bredde på (2 m + 1) gjennom hele rekken. Vindusbredden blir vanligvis tatt merkelig, siden den teoretiske verdien beregnes for den sentrale verdien: antall termer k = 2m + 1 med samme antall nivåer til venstre og høyre for øyeblikket t.

Formelen for å beregne det glidende gjennomsnittet i dette tilfellet har formen:

Spredningen av det glidende gjennomsnittet er definert som σ 2 /k, hvor gjennom σ2 angir variansen til de originale termene i serien, og k utjevningsintervall, så jo større utjevningsintervall, jo sterkere er gjennomsnittet av dataene og jo mindre foranderlig er trenden. Oftest utføres utjevning på tre, fem og syv medlemmer av den originale serien. I dette tilfellet bør følgende trekk ved det glidende gjennomsnittet tas i betraktning: hvis vi tar i betraktning en serie med periodiske fluktuasjoner med konstant lengde, så ved utjevning basert på det glidende gjennomsnittet med et utjevningsintervall lik eller et multiplum av perioden , vil svingningene bli fullstendig eliminert. Ofte transformerer utjevning basert på et glidende gjennomsnitt serien så sterkt at den identifiserte utviklingstrenden bare vises i de mest generelle termene, mens mindre, men viktige for analysedetaljer (bølger, bøyninger, etc.) forsvinner; etter utjevning kan små bølger noen ganger endre retning til motsatte "groper" vises i stedet for "topper", og vice versa. Alt dette krever forsiktighet ved bruk av et enkelt glidende gjennomsnitt og tvinger en til å se etter mer subtile beskrivelsesmetoder.

Den glidende gjennomsnittsmetoden gir ikke trendverdier for den første og siste m radmedlemmer. Denne mangelen er spesielt merkbar i tilfellet når lengden på raden er liten.

3.3. Eksponensiell utjevning

Eksponentielt gjennomsnitt y t er et eksempel på et asymmetrisk vektet glidende gjennomsnitt som tar hensyn til graden av aldring av dataene: "eldre" informasjon med mindre vekt kommer inn i formelen for å beregne den utjevnede verdien av nivået til serien

Her — eksponentielt middel som erstatter den observerte verdien av serien y t(utjevning involverer alle dataene som er mottatt frem til det nåværende øyeblikket t), α utjevningsparameter som karakteriserer vekten til den nåværende (nyeste) observasjonen; 0< α <1.

Metoden brukes til å forutsi ikke-stasjonære tidsserier med tilfeldige endringer i nivå og helning. Når vi beveger oss bort fra det nåværende tidspunktet inn i fortiden, avtar vekten av det tilsvarende leddet i serien raskt (eksponentielt) og slutter praktisk talt å ha noen effekt på verdien av .

Det er lett å se at den siste relasjonen lar oss gi følgende tolkning av det eksponentielle gjennomsnittet: if — serieverdiprediksjon y t, så er forskjellen prognosefeilen. Så spådommen for neste tidspunkt t+1 tar hensyn til det som ble kjent i øyeblikket t prognosefeil.

Utjevningsalternativ α er en veiefaktor. Hvis α nær enhet, så tar prognosen betydelig hensyn til størrelsen på feilen til den siste prognosen. For små verdier α den anslåtte verdien er nær den forrige prognosen. Valget av utjevningsparameter er et ganske komplisert problem. Generelle betraktninger er som følger: Metoden er god for å forutsi tilstrekkelig jevne serier. I dette tilfellet kan man velge en utjevningskonstant ved å minimere prediksjonsfeilen ett steg frem estimert fra den siste tredjedelen av serien. Noen eksperter anbefaler ikke å bruke store verdier av utjevningsparameteren. På fig. 3.1 viser et eksempel på en utjevnet serie som bruker den eksponentielle utjevningsmetoden for α= 0,1.

Ris. 3.1. Resultatet av eksponentiell utjevning kl α =0,1
(1 originalserie; 2 glattede serier; 3 rester)

3.4. Eksponensiell utjevning
trendbasert (Holt-metoden)

Denne metoden tar hensyn til den lokale lineære trenden som eksisterer i tidsserien. Hvis det er en oppadgående trend i tidsserien, er det også nødvendig med et estimat av det nåværende nivået. I Holt-teknikken jevnes nivå- og helningsverdiene direkte ved å bruke forskjellige konstanter for hver av parameterne. Utjevningskonstanter lar deg estimere gjeldende nivå og helning, og avgrense dem hver gang nye observasjoner gjøres.

Holt-metoden bruker tre beregningsformler:

  1. Eksponentielt jevnet serie (estimat for nåværende nivå)

(3.2)

  1. Trendevaluering

(3.3)

  1. Prognose for R perioder fremover

(3.4)

hvor α, β utjevningskonstanter fra intervallet.

Ligning (3.2) ligner på ligning (3.1) for enkel eksponentiell utjevning bortsett fra trendleddet. Konstant β nødvendig for å jevne ut trendanslaget. I prognoseligningen (3.3) multipliseres trendestimatet med antall perioder R, som prognosen er basert på, og deretter legges dette produktet til det gjeldende nivået av glattede data.

Fast α og β velges subjektivt eller ved å minimere prediksjonsfeilen. Jo større verdier av vektene tas, desto raskere vil responsen på pågående endringer finne sted, og dataene vil bli jevnere. Mindre vekter gjør strukturen til de utjevnede verdiene mindre flat.

På fig. 3.2 viser et eksempel på utjevning av en serie ved hjelp av Holt-metoden for verdier α og β lik 0,1.

Ris. 3.2. Holt utjevnende resultat
α = 0,1 og β = 0,1

3.5. Eksponentiell utjevning med trend- og sesongvariasjoner (vintermetoden)

Hvis det er sesongmessige svingninger i datastrukturen, brukes den tre-parameter eksponentielle utjevningsmodellen foreslått av Winters for å redusere prognosefeil. Denne tilnærmingen er en forlengelse av den tidligere Holt-modellen. For å ta høyde for sesongvariasjoner, brukes en ekstra ligning her, og denne metoden er fullstendig beskrevet av fire ligninger:

  1. Eksponentielt jevnet serie

(3.5)

  1. Trendevaluering

(3.6)

  1. Sesongvurdering

.

(3.7)

  1. Prognose for R perioder fremover

(3.8)

hvor α, β, γ konstant utjevning for henholdsvis nivå, trend og sesongvariasjon; s- varigheten av perioden med sesongmessige svingninger.

Ligning (3.5) korrigerer den utjevnede serien. I denne ligningen tar begrepet hensyn til sesongvariasjonen i de opprinnelige dataene. Etter at sesongvariasjon og trend er tatt i betraktning i ligninger (3.6), (3.7), jevnes estimatene ut, og det lages en prognose i ligning (3.8).

Akkurat som i forrige metode, vektene α, β, γ kan velges subjektivt eller ved å minimere prediksjonsfeilen. Før du bruker ligning (3.5), er det nødvendig å bestemme startverdiene for den glattede serien L t, trend T t, sesongmessige koeffisienter S t. Vanligvis blir startverdien til den utjevnede serien tatt lik den første observasjonen, deretter er trenden null, og sesongkoeffisientene settes lik én.

På fig. 3.3 viser et eksempel på utjevning av en serie ved bruk av Winters-metoden.

Ris. 3.3. Resultatet av utjevning etter Winters-metoden
α = 0,1 = 0,1; y = 0,1(1- original rad; 2 glattede rader; 3 rester)

3.6. Prognoser basert på trendmodeller

Ganske ofte har tidsserier en lineær trend (trend). Forutsatt en lineær trend, må du bygge en rett linje som mest nøyaktig vil reflektere endringen i dynamikk i løpet av den aktuelle perioden. Det er flere metoder for å konstruere en rett linje, men den mest objektive fra et formelt synspunkt vil være en konstruksjon basert på å minimere summen av negative og positive avvik av seriens begynnelsesverdier fra en rett linje.

En rett linje i et to-koordinatsystem (x, y) kan defineres som skjæringspunktet for en av koordinatene og helningsvinkelen til aksen X. Ligningen for en slik rett linje vil se ut hvor en- skjæringspunkt; b vippevinkel.

For at den rette linjen skal reflektere dynamikkens forløp, er det nødvendig å minimere summen av vertikale avvik. Når man bruker som kriterium for å estimere minimering av en enkel sum av avvik, vil resultatet ikke bli særlig godt, siden negative og positive avvik opphever hverandre. Minimering av summen av absolutte verdier fører heller ikke til tilfredsstillende resultater, siden parameterestimatene i dette tilfellet er ustabile, er det også beregningsvansker med å implementere en slik estimeringsprosedyre. Derfor er den mest brukte prosedyren å minimere summen av kvadrerte avvik, eller minste kvadrat-metoden(MNK).

Siden serien med startverdier har fluktuasjoner, vil modellen av serien inneholde feil, hvis kvadrater må minimeres

hvor y i observert verdi; y i * teoretiske verdier av modellen; observasjonsnummer.

Når vi modellerer trenden til den opprinnelige tidsserien ved å bruke en lineær trend, vil vi anta det

Å dele den første ligningen med n, kommer vi til neste

Sette inn koeffisienten med det resulterende uttrykket i den andre systemligningen (3.10). b* vi får:

3.7. Kontroll av modelltilpasning

Som et eksempel, i fig. 3.4 viser en graf over lineær regresjon mellom kraften til bilen X og dens kostnad .

Ris. 3.4. Lineær regresjonsplott

Ligningen for dette tilfellet er: =1455,3 + 13,4 X. Visuell analyse av denne figuren viser at det for en rekke observasjoner er betydelige avvik fra den teoretiske kurven. Restgrafen er vist i fig. 3.5.

Ris. 3.5. Restdiagram

Analyse av regresjonslinjeresidualene kan gi et nyttig mål på hvor godt den estimerte regresjonen reflekterer de virkelige dataene. En god regresjon er en som forklarer en betydelig mengde varians, og omvendt sporer ikke en dårlig regresjon en stor mengde fluktuasjoner i de opprinnelige dataene. Det er intuitivt klart at all tilleggsinformasjon vil forbedre modellen, dvs. redusere den uforklarlige brøkdelen av variasjonen til variabelen . For å analysere regresjonen vil vi dekomponere variansen i komponenter. Det er åpenbart det

Det siste leddet vil være lik null, siden det er summen av restene, så vi kommer til følgende resultat

hvor SS0, SS1, SS2 bestemme summen av henholdsvis total, regresjon og restsum av kvadrater.

Regresjonssummen av kvadrater måler delen av variansen som er forklart av en lineær sammenheng; gjenværende del av dispersjonen, ikke forklart av en lineær avhengighet.

Hver av disse summene er preget av et tilsvarende antall frihetsgrader (HR), som bestemmer antall dataenheter som er uavhengige av hverandre. Med andre ord er hjertefrekvens relatert til antall observasjoner n og antall parametere beregnet fra totalen av disse parameterne. I saken under vurdering, å beregne SS0 kun én konstant (gjennomsnittsverdi) bestemmes, derfor hjertefrekvensen for SS0 vil være (n1), hjertefrekvens for SS 2 - (n - 2) og puls for SS 1 vil være n - (n - 1)=1, siden det er n - 1 konstante punkter i regresjonsligningen. Akkurat som summer av kvadrater, er hjertefrekvens relatert til

Summene av kvadrater knyttet til dekomponeringen av variansen, sammen med de tilsvarende hjertefrekvensene, kan plasseres i den såkalte variansanalysetabellen (ANOVA ANAlysis Of VARiance table) (tabell 3.1).

Tabell 3.1

ANOVA bord

Kilde

Summen av kvadrater

Middels firkantet

Regresjon

SS2/ (n-2)

Ved å bruke den introduserte forkortelsen for summer av kvadrater, definerer vi bestemmelseskoeffisient som forholdet mellom regresjonssummen av kvadrater og totalsummen av kvadrater som

(3.13)

Bestemmelseskoeffisienten måler andelen variabilitet i en variabel Y, som kan forklares ved hjelp av informasjon om variabiliteten til den uavhengige variabelen x. Bestemmelseskoeffisienten endres fra null når X påvirker ikke Y, til en når endringen Y fullstendig forklart av endringen x.

3.8. Regresjonsprognosemodell

Den beste prediksjonen er den med den minste variansen. I vårt tilfelle produserer konvensjonelle minste kvadrater den beste prediksjonen av alle metoder som gir objektive estimater basert på lineære ligninger. Prognosefeilen knyttet til prognoseprosedyren kan komme fra fire kilder.

For det første sikrer den tilfeldige karakteren av additive feil som håndteres av lineær regresjon at prognosen vil avvike fra de sanne verdiene selv om modellen er riktig spesifisert og dens parametere er nøyaktig kjent.

For det andre introduserer selve estimeringsprosessen en feil i estimeringen av parametere, de kan sjelden være lik de sanne verdiene, selv om de er lik dem i gjennomsnitt.

For det tredje, i tilfelle av en betinget prognose (i tilfelle av ukjente eksakte verdier av de uavhengige variablene), introduseres feilen med prognosen for de forklarende variablene.

For det fjerde kan feilen vises fordi modellspesifikasjonen er unøyaktig.

Som et resultat kan feilkilder klassifiseres som følger:

  1. arten av variabelen;
  2. modellens natur;
  3. feilen introdusert av prognosen for uavhengige tilfeldige variabler;
  4. spesifikasjonsfeil.

Vi vil vurdere en ubetinget prognose, når uavhengige variabler er lett og nøyaktig predikert. Vi begynner vår vurdering av prognosekvalitetsproblemet med den sammenkoblede regresjonsligningen.

Problemstillingen i dette tilfellet kan formuleres som følger: hva vil være den beste prognosen y T+1, forutsatt at i modellen y = a + bx alternativer en og b estimert nøyaktig, og verdien xT+1 kjent.

Da kan den predikerte verdien defineres som

Prognosefeilen blir da

.

Prognosefeil har to egenskaper:

Den resulterende variansen er minimal blant alle mulige estimater basert på lineære ligninger.

Selv om en og b er kjent, vises prognosefeilen på grunn av at ved T+1 kan ikke ligge på regresjonslinjen på grunn av en feil e T+1, som følger en normalfordeling med null gjennomsnitt og varians σ2. For å sjekke kvaliteten på prognosen introduserer vi den normaliserte verdien

95 % konfidensintervallet kan da defineres som følger:

hvor β 0,05 kvantiler av normalfordelingen.

Grensene for 95 %-intervallet kan defineres som

Merk at i dette tilfellet bredden konfidensintervall er ikke avhengig av størrelsen X, og grensene til intervallet er rette linjer parallelle med regresjonslinjene.

Oftere, når du konstruerer en regresjonslinje og kontrollerer kvaliteten på prognosen, er det nødvendig å evaluere ikke bare regresjonsparametrene, men også variansen til prognosefeilen. Det kan vises at i dette tilfellet avhenger feilvariansen av verdien (), hvor er middelverdien til den uavhengige variabelen. I tillegg, jo lengre serie, jo mer nøyaktig er prognosen. Prognosefeilen reduseres hvis verdien av X T+1 er nær middelverdien til den uavhengige variabelen, og omvendt, når man beveger seg bort fra middelverdien, blir prognosen mindre nøyaktig. På fig. 3.6 viser resultatene av prediksjonen ved å bruke den lineære regresjonsligningen for 6 tidsintervaller fremover sammen med konfidensintervaller.

Ris. 3.6. Lineær regresjonsprediksjon

Som det fremgår av fig. 3.6, denne regresjonslinjen beskriver ikke de opprinnelige dataene godt: det er stor variasjon i forhold til tilpasningslinjen. Kvaliteten på modellen kan også bedømmes ut fra residualene, som med en tilfredsstillende modell bør fordeles tilnærmet etter normalloven. På fig. 3.7 viser en graf over residualer, bygget ved hjelp av en sannsynlighetsskala.

Fig.3.7. Restdiagram

Ved bruk av en slik skala bør data som følger normalloven ligge på en rett linje. Som det følger av figuren avviker punktene i begynnelsen og slutten av observasjonsperioden noe fra en rett linje, noe som indikerer en utilstrekkelig høy kvalitet på den valgte modellen i form av en lineær regresjonsligning.

I tabellen. Tabell 3.2 viser prognoseresultatene (andre kolonne) sammen med 95 % konfidensintervaller (henholdsvis nedre tredje og øvre fjerde kolonne).

Tabell 3.2

Prognoseresultater

3.9. Multivariat regresjonsmodell

I multivariat regresjon inkluderer dataene for hvert tilfelle verdiene til den avhengige variabelen og hver uavhengig variabel. Avhengig variabel y er en tilfeldig variabel relatert til de uavhengige variablene ved følgende relasjon:

hvor regresjonskoeffisienter skal bestemmes; ε feilkomponent som tilsvarer avviket til verdiene til den avhengige variabelen fra det sanne forholdet (det antas at feilene er uavhengige og har en normalfordeling med null gjennomsnitt og ukjent varians σ ).

For et gitt datasett kan estimater av regresjonskoeffisientene finnes ved å bruke minste kvadraters metode. Hvis OLS-estimatene er merket med , vil den tilsvarende regresjonsfunksjonen se slik ut:

Residualene er estimater av feilkomponenten og ligner residualene ved enkel lineær regresjon.

Statistisk analyse av en multivariat regresjonsmodell utføres på samme måte som analysen av en enkel lineær regresjon. Standardpakker med statistiske programmer gjør det mulig å få estimater ved minste kvadrater for modellparametere, estimater av deres standardfeil. Du kan også få verdien t-statistikk for å sjekke betydningen av individuelle termer i regresjonsmodellen og verdien F-statistikk for å teste betydningen av regresjonsavhengigheten.

Formen for å dele kvadratsummene ved multivariat regresjon ligner på uttrykk (3.13), men forholdet for hjertefrekvens vil være som følger

Det understreker vi igjen n er volumet av observasjoner, og k antall variabler i modellen. Den totale variansen til den avhengige variabelen består av to komponenter: variansen som forklares av de uavhengige variablene gjennom regresjonsfunksjonen og den uforklarlige variansen.

Tabell ANOVA for tilfellet med multivariat regresjon vil ha formen vist i Tabell. 3.3.

Tabell 3.3

ANOVA bord

Kilde

Summen av kvadrater

Middels firkantet

Regresjon

SS2/ (n-k-1)

Som et eksempel på multivariat regresjon vil vi bruke data fra Statistica-pakken (datafil Poverty.Sta) Dataene som presenteres er basert på en sammenligning av resultatene fra folketellingene fra 1960 og 1970. for et tilfeldig utvalg av 30 land. Landnavnene er lagt inn som strengnavn, og navnene på alle variablene i denne filen er oppført nedenfor:

POP_CHNG befolkningsendring for 1960-1970;

N_EMPLD antall personer sysselsatt i landbruket;

PT_DÅLIG prosentandel av familier som lever under fattigdomsgrensen;

TAX_RATE skattesats;

PT_PHONE prosentandel av leiligheter med telefon;

PT_RURAL prosentandel av befolkningen på landsbygda;

AGE middelalder.

Som en avhengig variabel velger vi funksjonen Pt_Dårlig, og som uavhengig - alle de andre. De beregnede regresjonskoeffisientene mellom de valgte variablene er gitt i tabell. 3.4

Tabell 3.4

Regresjonskoeffisienter

Denne tabellen viser regresjonskoeffisientene ( ) og standardiserte regresjonskoeffisienter ( beta). Ved hjelp av koeffisienter formen til regresjonsligningen er satt, som i dette tilfellet har formen:

Inkluderingen på høyre side av bare disse variablene skyldes at bare disse funksjonene har en sannsynlighetsverdi R mindre enn 0,05 (se fjerde kolonne i tabell 3.4).

Bibliografi

  1. Basovsky L. E. Prognosering og planlegging i markedsforhold. - M .: Infra - M, 2003.
  2. Box J., Jenkins G. Tidsserieanalyse. Utgave 1. Prognose og styring. – M.: Mir, 1974.
  3. Borovikov V. P., Ivchenko G. I. Prognoser i Statistica-systemet i Windows-miljøet. - M.: Finans og statistikk, 1999.
  4. Duke W. Databehandling på PC i eksempler. - St. Petersburg: Peter, 1997.
  5. Ivchenko B. P., Martyshchenko L. A., Ivantsov I. B. Informasjonsmikroøkonomi. Del 1. Metoder for analyse og prognoser. - St. Petersburg: Nordmed-Izdat, 1997.
  6. Krichevsky M. L. Introduksjon til kunstige nevrale nettverk: Proc. godtgjørelse. - St. Petersburg: St. Petersburg. stat marin teknologi. un-t, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Multivariat statistisk analyse i økonomi. – M.: Unity-Dana, 1999.

1. Grunnleggende metodiske bestemmelser.

Den enkle eksponentielle utjevningsmetoden bruker et vektet (eksponentielt) glidende gjennomsnitt av alle tidligere observasjoner. Denne modellen brukes oftest på data der det er nødvendig å evaluere tilstedeværelsen av et forhold mellom de analyserte indikatorene (trend) eller avhengigheten av de analyserte dataene. Hensikten med eksponentiell utjevning er å estimere den nåværende tilstanden, hvis resultater vil bestemme alle fremtidige spådommer.

Eksponentiell utjevning gir konstant oppdatering av modellen på grunn av de nyeste dataene. Denne metoden er basert på gjennomsnitt (utjevning) av tidsserien av tidligere observasjoner i en nedadgående (eksponentiell) retning. Det vil si at senere hendelser tillegges større vekt. Vekten er tildelt som følger: for den siste observasjonen vil vekten være verdien α, for den nest siste - (1-α), for den som var før den - (1-α) 2, etc.

I en jevnet form kan den nye prognosen (for tidsperioden t + 1) representeres som et vektet gjennomsnitt av den siste observasjonen av en mengde på tidspunktet t og dens forrige prognose for samme periode t. Dessuten tildeles vekten α til den observerte verdien, og vekten (1- α) tilordnes prognosen; det antas at 0< α<1. Это правило в общем виде можно записать следующим образом.

Ny prognose = [α*(siste observasjon)]+[(1- α)*siste prognose]

hvor er den anslåtte verdien for neste periode;

α er utjevningskonstanten;

Y t er observasjonen av verdien for gjeldende periode t;

Den forrige jevnede prognosen for denne verdien for perioden t.

Eksponentiell utjevning er en prosedyre for kontinuerlig å revidere prognoseresultater i lys av den siste utviklingen.

Utjevningskonstanten α er en vektet faktor. Dens virkelige verdi bestemmes av i hvilken grad den nåværende observasjonen skal påvirke den predikerte verdien. Hvis α er nær 1, tar prognosen hensyn til verdien av feilen til den siste prognosen. Motsatt, for små verdier av α, er den anslåtte verdien nærmest den forrige prognosen. Kan tenkes på som et vektet gjennomsnitt av alle tidligere observasjoner med vekter som synker eksponentielt med "alderen" til dataene.



Tabell 2.1

Sammenligning av påvirkningen av forskjellige verdier av utjevningskonstanter

Konstanten α er nøkkelen til dataanalyse. Hvis det kreves at de predikerte verdiene er stabile og tilfeldige avvik jevnes ut, er det nødvendig å velge en liten verdi på α. En stor verdi av konstanten α gir mening hvis du trenger en rask respons på endringer i observasjonsspekteret.

2. Et praktisk eksempel på eksponentiell utjevning.

Dataene til selskapet når det gjelder salgsvolum (tusen enheter) i syv år presenteres, utjevningskonstanten tas lik 0,1 og 0,6. Data for 7 år utgjør testdelen; på dem er det nødvendig å evaluere effektiviteten til hver av modellene. For eksponentiell utjevning av serien tas startverdien lik 500 (den første verdien av de faktiske dataene eller gjennomsnittsverdien for 3-5 perioder registreres i den utjevnede verdien for 2. kvartal).

Tabell 2.2

Innledende data

Tid Faktisk verdi (faktisk) Utjevnet verdi Prognosefeil
år fjerdedel 0,1 0,1
utmerke i henhold til formelen
#N/A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

På fig. 2.1 viser en prediksjon basert på eksponentiell utjevning med en utjevningskonstant på 0,1.



Ris. 2.1. Eksponensiell utjevning

Løsning i Excel.

1. Velg menyen "Verktøy" - "Dataanalyse". Fra Analyseverktøy-listen velger du Eksponentiell utjevning. Hvis det ikke er noen dataanalyse i "Verktøy"-menyen, må du installere "Analysepakken". For å gjøre dette, finn elementet "Innstillinger" i "Parametere" og i dialogboksen som vises, merk av i boksen for "Analysepakke", klikk OK.

2. Dialogboksen vist i fig. 2.2.

3. I "inndataintervall"-feltet, skriv inn verdiene til de første dataene (pluss en ledig celle).

4. Merk av for "etiketter" (hvis inndataområdet inneholder kolonnenavn).

5. Angi en verdi (1-α) i dempningsfaktorfeltet.

6. I feltet "Input interval" skriver du inn verdien til cellen der du vil se de mottatte verdiene.

7. Merk av i boksen "Alternativer" - "Graph output" for å bygge den automatisk.

Ris. 2.2. Dialogboks for eksponentiell utjevning

3. Laboratoriearbeidets oppgave.

Det er innledende data om produksjonsvolumene til en oljeproduserende bedrift i 2 år, presentert i tabell 2.3:

Tabell 2.3

Innledende data

Utfør eksponentiell utjevning av serien. Ta den eksponentielle utjevningskoeffisienten lik 0,1; 0,2; 0,3. Kommenter resultatene. Du kan bruke statistikken presentert i vedlegg 1.