Biografier Kjennetegn Analyse

Eksponentiell gjennomsnittsmetode. Eksponentiell utjevning og tidsserieprognosemodeller

Prognoseoppgaver er bygget på endringen i enkelte data over tid (salg, etterspørsel, tilbud, BNP, karbonutslipp, befolkning ...) og projiserer disse endringene inn i fremtiden. Dessverre, identifisert på historiske data, kan trender brytes av mange uforutsette omstendigheter. Så dataene i fremtiden kan avvike betydelig fra det som skjedde i fortiden. Dette er problemet med prognoser.

Imidlertid er det teknikker (kalt eksponentiell utjevning) som ikke bare lar deg prøve å forutsi fremtiden, men også å uttrykke usikkerheten til alt relatert til prognosen numerisk. Numerisk uttrykk for usikkerhet ved å lage prognoseintervaller er virkelig uvurderlig, men ofte oversett i prognoseverdenen.

Last ned notat i eller format, eksempler i format

Innledende data

La oss si at du er en Ringenes Herre-fan og har laget og solgt sverd i tre år (Figur 1). La oss vise salg grafisk (fig. 2). Etterspørselen har doblet seg på tre år – kanskje dette er en trend? Vi kommer tilbake til denne ideen litt senere. Det er flere topper og daler på kartet, noe som kan være et tegn på sesongvariasjoner. Spesielt er toppene i månedene 12, 24 og 36, som tilfeldigvis er desember. Men det er kanskje bare en tilfeldighet? La oss finne det ut.

Enkel eksponentiell utjevning

Metoder eksponensiell utjevning er basert på å forutsi fremtiden fra data fra fortiden, hvor nyere observasjoner veier mer enn eldre. Slik vekting er mulig på grunn av utjevningskonstanter. Den første eksponentielle utjevningsmetoden vi skal prøve kalles enkel eksponentiell utjevning (SES). Den bruker bare én utjevningskonstant.

Enkel eksponentiell utjevning forutsetter at datatidsserien din har to komponenter: et nivå (eller gjennomsnitt) og en feil rundt den verdien. Det er ingen trend eller sesongmessige svingninger – det er bare et nivå som etterspørselen svinger rundt, omgitt av små feil her og der. Ved å gi preferanse til nyere observasjoner, kan TEC forårsake endringer i dette nivået. På formlenes språk,

Etterspørsel på tidspunkt t = nivå + tilfeldig feil rundt nivå på tidspunkt t

Så hvordan finner du den omtrentlige verdien av nivået? Hvis vi aksepterer alle tidsverdier som har samme verdi, bør vi ganske enkelt beregne gjennomsnittsverdien deres. Dette er imidlertid en dårlig idé. Nyere observasjoner bør tillegges større vekt.

La oss lage noen nivåer. Beregn grunnlinjen for det første året:

nivå 0 = gjennomsnittlig etterspørsel for det første året (måned 1-12)

For sverdbehov er det 163. Vi bruker nivå 0 (163) som etterspørselsprognose for måned 1. Etterspørselen i måned 1 er 165, som er 2 sverd over nivå 0. Det er verdt å oppdatere grunnlinjetilnærmingen. Enkel eksponentiell utjevningsligning:

nivå 1 = nivå 0 + noen få prosent × (krav 1 - nivå 0)

nivå 2 = nivå 1 + noen få prosent × (krav 2 - nivå 1)

Etc. «Noen få prosent» kalles utjevningskonstanten, og betegnes med alfa. Det kan være et hvilket som helst tall fra 0 til 100 % (0 til 1). Du vil lære hvordan du velger en alfaverdi senere. PÅ generell sak verdi for forskjellige tidspunkter:

Nivå gjeldende periode = nivå forrige periode +
alfa × (etterspørsel gjeldende periode - nivå forrige periode)

Fremtidig etterspørsel er lik sist beregnede nivå (fig. 3). Siden du ikke vet hva alfa er, sett celle C2 til 0,5 til å begynne med. Etter at modellen er bygget, finn en alfa slik at summen av kvadrater av feilen er E2 (eller standardavvik– F2) var minimale. For å gjøre dette, kjør alternativet Å finne en løsning. For å gjøre dette, gå gjennom menyen DATA –> Å finne en løsning, og sett i vinduet Løsningssøkealternativer nødvendige verdier (fig. 4). For å vise resultatene av prognosen på diagrammet, velg først området A6:B41, og bygg et enkelt linjediagram. Høyreklikk deretter på diagrammet, velg alternativet Velg data. I vinduet som åpnes, lag en andre rad og sett inn prediksjoner fra A42:B53-området i den (fig. 5).

Kanskje du har en trend

For å teste denne antagelsen er det nok å passe lineær regresjon under etterspørselsdataene og utfør en t-test på økningen av denne trendlinjen (som i ). Hvis stigningstallet på linjen ikke er null og statistisk signifikant (i studentens test, verdien R mindre enn 0,05), har dataene en trend (fig. 6).

Vi brukte LINEST-funksjonen, som returnerer 10 beskrivende statistikk(hvis du ikke har brukt denne funksjonen før, anbefaler jeg den) og INDEX-funksjonen, som lar deg "trekke ut" kun de tre nødvendige statistikkene, og ikke hele settet. Det viste seg at helningen er 2,54, og den er signifikant, siden Studentens test viste at 0,000000012 er betydelig mindre enn 0,05. Så det er en trend, og det gjenstår å inkludere den i prognosen.

Eksponentiell Holt-utjevning med trendkorreksjon

Det blir ofte referert til som dobbel eksponentiell utjevning fordi det har to utjevningsparametere, alfa, i stedet for én. Hvis tidssekvensen har en lineær trend, så:

etterspørsel over tid t = nivå + t × trend + tilfeldig avvik nivå på tidspunkt t

Holt eksponentiell utjevning med trendkorreksjon har to nye ligninger, en for nivået når det beveger seg fremover i tid og den andre for trenden. Nivåligningen inneholder utjevningsparameteren alfa, og trendligningen inneholder gamma. Slik ser den nye nivåligningen ut:

nivå 1 = nivå 0 + trend 0 + alfa × (behov 1 - (nivå 0 + trend 0))

noter det nivå 0 + trend 0 er bare en ett-trinns prognose fra de opprinnelige verdiene til måned 1, så etterspørsel 1 – (nivå 0 + trend 0) er et ett-trinns avvik. Dermed vil den grunnleggende nivåtilnærmingsligningen være som følger:

nåværende periodenivå = forrige periodenivå + forrige periodetrend + alfa × (nåværende periodeetterspørsel - (forrige periodenivå) + forrige periodetrend))

Trendoppdateringsligning:

trend nåværende periode = trend forrige periode + gamma × alfa × (etterspørsel gjeldende periode – (nivå forrige periode) + trend forrige periode))

Holt-utjevning i Excel ligner på enkel utjevning (fig. 7), og som ovenfor er målet å finne to koeffisienter samtidig som summen av kvadrerte feil minimeres (fig. 8). For å få det opprinnelige nivået og trendverdiene (i cellene C5 og D5 i figur 7), bygg et diagram for de første 18 månedene med salg og legg til en trendlinje med en ligning. Skriv inn den innledende trendverdien på 0,8369 og startnivået på 155,88 i cellene C5 og D5. Prognosedata kan presenteres grafisk (fig. 9).

Ris. 7. Eksponentiell Holt-utjevning med trendkorreksjon; For å forstørre et bilde, høyreklikk på det og velg Åpne bildet i ny fane

Finne mønstre i data

Det er en måte å teste den prediktive modellen for styrke - å sammenligne feilene med seg selv, forskjøvet med et trinn (eller flere trinn). Hvis avvikene er tilfeldige, kan ikke modellen forbedres. Det kan imidlertid være en sesongmessig faktor i etterspørselsdataene. Konseptet med en feil som korrelerer med sin egen versjon over en annen periode kalles autokorrelasjon (for mer om autokorrelasjon, se ). For å beregne autokorrelasjon, start med prognosefeildata for hver periode (overfør kolonne F i figur 7 til kolonne B i figur 10). Definer neste gjennomsnittlig feil prognose (Figur 10, celle B39; formel i celle: =GJENNOMSNITT(B3:B38)). I kolonne C beregner du avviket til prognosefeilen fra gjennomsnittet; formel i celle C3: =B3-B$39. Deretter flytter du kolonne C sekvensielt en kolonne til høyre og en rad nedover. Formler i cellene D39: =SUMPRODUKT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Hva kan "synkron bevegelse" med kolonne C bety for en av kolonnene D: O. Hvis for eksempel kolonne C og D er synkrone, må et tall som er negativt i en av dem være negativt i den andre, positivt i den ene , positiv i venn. Dette betyr at summen av produktene til de to kolonnene vil være signifikant (forskjeller akkumuleres). Eller, som er det samme, jo nærmere verdien i området D41:O41 er null, desto lavere er korrelasjonen av kolonnen (henholdsvis fra D til O) med kolonne C (fig. 11).

Én autokorrelasjon er over den kritiske verdien. Årsforskjøvet feil korrelerer med seg selv. Dette betyr en 12-måneders sesongsyklus. Og dette er ikke overraskende. Ser man på etterspørselsgrafen (Figur 2), viser det seg at det er topper i etterspørselen hver jul og fall i april-mai. Vurder en prognoseteknikk som tar hensyn til sesongvariasjoner.

Multiplikativ eksponentiell Holt-Winters utjevning

Metoden kalles multiplikativ (fra multiplisere - multiplisere), fordi den bruker multiplikasjon for å ta høyde for sesongvariasjoner:

Etterspørsel på tidspunkt t = (nivå + t × trend) × sesongjustering på tidspunkt t × eventuelle gjenværende uregelmessige justeringer som vi ikke kan gjøre rede for

Holt-Winters utjevning kalles også trippel eksponentiell utjevning fordi den har tre utjevningsparametere (alfa, gamma og delta sesongfaktor). For eksempel, hvis det er en 12 måneders sesongsyklus:

Månedlig prognose 39 = (nivå 36 + 3 × trend 36) x sesongvariasjon 27

Når man analyserer dataene er det nødvendig å finne ut hva som er trenden i dataserien og hva som er sesongvariasjonen. For å utføre beregninger ved hjelp av Holt-Winters-metoden, må du:

  • Glatt historiske data ved å bruke glidende gjennomsnittsmetoden.
  • Sammenlign den glattede versjonen av tidsserien med originalen for å få et grovt estimat av sesongvariasjoner.
  • Få nye data uten sesongkomponenter.
  • Finn nivå- og trendtilnærmelser basert på disse nye dataene.

Start med de originale dataene (kolonne A og B i figur 12) og legg til kolonne C med utjevnede verdier basert på glidende gjennomsnitt. Siden sesongvariasjoner har 12-måneders sykluser, er det fornuftig å bruke et 12-måneders gjennomsnitt. Det er et lite problem med dette gjennomsnittet. 12 er et partall. Hvis du jevner ut etterspørselen for måned 7, bør det betraktes som gjennomsnittlig etterspørsel fra måned 1 til 12, eller fra 2 til 13? For å håndtere denne vanskeligheten må vi jevne ut etterspørselen ved å bruke et "bevegende gjennomsnitt 2x12". Det vil si, ta halvparten av de to gjennomsnittene fra måned 1 til 12 og fra 2 til 13. Formelen i celle C8 er: =(GJENNOMSNITT(B3:B14)+GJENNOMSNITT(B2:B13))/2.

Utjevnede data for månedene 1–6 og 31–36 kan ikke oppnås fordi det ikke er nok tidligere og påfølgende perioder. For klarhetens skyld kan de originale og glattede dataene vises i et diagram (fig. 13).

Nå, i kolonne D, del den opprinnelige verdien med den utjevnede verdien for å få et estimat av sesongjusteringen (kolonne D i figur 12). Formel i celle D8: =B8/C8. Legg merke til topper på 20 % over normal etterspørsel i månedene 12 og 24 (desember) mens det er fall om våren. Denne utjevningsteknikken har gitt deg to punktanslag for hver måned (totalt 24 måneder). Kolonne E er gjennomsnittet av disse to faktorene. Formelen i celle E1 er: =GJENNOMSNITT(D14,D26). For klarhetens skyld kan nivået av sesongsvingninger representeres grafisk (fig. 14).

Du kan nå få sesongjusterte data. Formel i celle G1: =B2/E2. Bygg en graf basert på dataene i kolonne G, fullfør den med en trendlinje, vis trendligningen på diagrammet (fig. 15), og bruk koeffisientene i påfølgende beregninger.

form nytt løv, som vist i fig. 16. Bytt ut verdiene i området E5:E16 fra fig. 12 områder E2:E13. Ta verdiene til C16 og D16 fra ligningen til trendlinjen i fig. 15. Sett verdiene til utjevningskonstantene til å starte på rundt 0,5. Utvid verdiene i rad 17 over månedene 1 til 36. Kjør Å finne en løsning for å optimalisere utjevningskoeffisienter (fig. 18). Formel i celle B53: =(C$52+(A53-A$52)*D$52)*E41.

Nå i prognosen som er laget, må du sjekke autokorrelasjonene (fig. 18). Siden alle verdier er plassert mellom øvre og nedre grenser, forstår du at modellen gjorde en god jobb med å forstå strukturen til etterspørselsverdier.

Bygge et konfidensintervall for prognosen

Så vi har en ganske fungerende prognose. Hvordan setter du øvre og nedre grenser som kan brukes til å gjøre realistiske gjetninger? Monte Carlo-simuleringen, som du allerede har møtt i (se også ), vil hjelpe deg med dette. Poenget er å generere fremtidige scenarier for etterspørselsatferd og bestemme gruppen som 95 % av dem faller inn i.

Fjern fra arket Excel-prognose fra cellene B53:B64 (se fig. 17). Der skal du skrive etterspørsel basert på simuleringen. Sistnevnte kan genereres ved hjelp av NORMINV-funksjonen. For fremtidige måneder trenger du bare å oppgi den med gjennomsnittet (0), standardfordelingen (10,37 fra celle $H$2), og tilfeldig tall fra 0 til 1. Funksjonen vil returnere avviket med en sannsynlighet som tilsvarer klokkekurven. Sett en simulering av ett-trinns feil i celle G53: =NORMINV(RAND();0;H$2). Å strekke denne formelen ned til G64 gir deg simuleringer av prognosefeilen for en 12 måneders ett-trinns prognose (Figur 19). Simuleringsverdiene dine vil avvike fra de som er vist på figuren (det er derfor det er en simulering!).

Med Forecast Error har du alt du trenger for å oppdatere nivået, trenden og sesongfaktoren. Så velg cellene C52:F52 og strekk dem til rad 64. Som et resultat har du en simulert prognosefeil og selve prognosen. Går fra det motsatte, er det mulig å forutsi verdiene av etterspørselen. Sett inn formelen i celle B53: =F53+G53 og strekk den til B64 (fig. 20, område B53:F64). Nå kan du trykke på F9-knappen, hver gang du oppdaterer prognosen. Plasser resultatene av 1000 simuleringer i cellene A71:L1070, hver gang du transponerer verdier fra området B53:B64 til området A71:L71, A72:L72, ... A1070:L1070. Hvis det plager deg, skriv VBA-koden.

Nå har du 1000 scenarier for hver måned, og du kan bruke PERSENTIL-funksjonen for å få øvre og nedre grenser i midten av 95 % konfidensintervallet. I celle A66 er formelen: =PERSENTIL(A71:A1070,0,975) og i celle A67: =PERSENTIL(A71:A1070,0,025).

Som vanlig, for klarhetens skyld, kan dataene presenteres i grafisk form(Fig. 21).

Det er to interessante punkter på diagrammet:

  • Feilmarginen øker med tiden. Det gir mening. Usikkerhet akkumuleres hver måned.
  • På samme måte øker feilen i delene som faller på perioder med sesongmessig økning i etterspørselen. Med påfølgende fall krymper feilen.

Basert på materiale fra en bok av John Foreman. – M.: Alpina Publisher, 2016. – S. 329–381

Tema 3. Utjevning og prognoser av tidsserier basert på trendmodeller

mål studiet av dette emnet er opprettelsen av et grunnleggende grunnlag for opplæring av ledere i spesialiteten 080507 innen bygging av modeller for ulike oppgaver innen økonomi, dannelsen av en systematisk tilnærming til å sette og løse prognoseproblemer blant studenter . Det foreslåtte kurset vil tillate spesialister å raskt tilpasse seg praktisk jobb, det er bedre å navigere i den vitenskapelige og tekniske informasjonen og litteraturen i spesialiteten, for å ta mer selvsikre beslutninger som oppstår i arbeidet.

Hoved oppgaver studietemaer er: å få studentene i dybden teoretisk kunnskap om anvendelse av prognosemodeller, deres tilegnelse av stabile ferdigheter i å utføre forskningsarbeid, evnen til å løse komplekse vitenskapelige problemer knyttet til konstruksjon av modeller, inkludert flerdimensjonale, evnen til å logisk analysere resultatene som er oppnådd og bestemme måter å finne akseptable løsninger på.

Nok enkel metodeå identifisere utviklingstrender er utjevningen av tidsseriene, dvs. erstatning av faktiske nivåer med beregnede som har mindre variasjoner enn de opprinnelige dataene. Den tilsvarende transformasjonen kalles filtrering. La oss vurdere flere metoder for utjevning.

3.1. enkle gjennomsnitt

Målet med utjevningen er å bygge en prognosemodell for fremtidige perioder basert på tidligere observasjoner. I metoden for enkle gjennomsnitt tas verdiene til variabelen som startdata Y på tidspunkter t, og prognoseverdien bestemmes som et enkelt gjennomsnitt for neste tidsperiode. Beregningsformel har formen

hvor n antall observasjoner.

I tilfelle når en ny observasjon blir tilgjengelig, bør den nylig mottatte prognosen også tas med i prognosen for neste periode. Når du bruker denne metoden, utføres prognosen ved å snitte alle tidligere data, men ulempen med slik prognose er vanskeligheten med å bruke den i trendmodeller.

3.2. Glidende gjennomsnittsmetode

Denne metoden er basert på å representere serien som summen av en ganske jevn trend og tilfeldig komponent. Metoden er basert på ideen om å beregne den teoretiske verdien basert på en lokal tilnærming. Å bygge et trendestimat på et punkt t med verdiene til serien fra tidsintervallet beregne den teoretiske verdien av serien. Mest utbredt i praksisen med utjevning serier, fikk jeg saken når alle vektene for elementene i intervallet er like med hverandre. Av denne grunn kalles denne metoden glidende gjennomsnittsmetode, siden når prosedyren utføres, et vindu med en bredde på (2 m + 1) gjennom hele rekken. Vindusbredden blir vanligvis tatt merkelig, siden den teoretiske verdien beregnes for den sentrale verdien: antall termer k = 2m + 1 Med samme nummer nivåer til venstre og høyre for øyeblikket t.

Formelen for å beregne det glidende gjennomsnittet i dette tilfellet har formen:

Spredningen av det glidende gjennomsnittet er definert som σ 2 /k, hvor gjennom σ2 angir variansen til de originale termene i serien, og k utjevningsintervall, så jo større utjevningsintervall, jo sterkere er gjennomsnittet av dataene og jo mindre foranderlig er trenden. Oftest utføres utjevning på tre, fem og syv medlemmer av den originale serien. Samtidig bør man ta hensyn følgende funksjoner glidende gjennomsnitt: hvis vi vurderer en serie med periodiske svingninger av konstant lengde, vil utjevning basert på det glidende gjennomsnittet med et utjevningsintervall lik eller et multiplum av perioden helt eliminere svingninger. Ofte forvandler utjevning basert på et glidende gjennomsnitt serien så sterkt at den identifiserte utviklingstrenden bare manifesteres i de fleste generelt, og mindre, men viktig for analysedetaljer (bølger, bøyninger, etc.) forsvinner; etter utjevning kan små bølger noen ganger endre retning til motsatte "groper" vises i stedet for "topper", og vice versa. Alt dette krever forsiktighet ved bruk av et enkelt glidende gjennomsnitt og tvinger en til å se etter mer subtile beskrivelsesmetoder.

Den glidende gjennomsnittsmetoden gir ikke trendverdier for den første og siste m radmedlemmer. Denne mangelen er spesielt merkbar i tilfellet når lengden på raden er liten.

3.3. Eksponensiell utjevning

Eksponentielt gjennomsnitt y t er et eksempel på et asymmetrisk vektet glidende gjennomsnitt som tar hensyn til graden av aldring av dataene: "eldre" informasjon med mindre vekt kommer inn i formelen for å beregne den utjevnede verdien av nivået til serien

Her — eksponentielt middel som erstatter den observerte verdien av serien y t(utjevning involverer alle dataene som mottas til nåværende øyeblikk t), α utjevningsparameter som karakteriserer vekten til den nåværende (nyeste) observasjonen; 0< α <1.

Metoden brukes til å forutsi ikke-stasjonære tidsserier med tilfeldige endringer i nivå og helning. Når vi beveger oss bort fra det nåværende tidspunktet inn i fortiden, avtar vekten av det tilsvarende leddet i serien raskt (eksponentielt) og slutter praktisk talt å ha noen effekt på verdien av .

Det er lett å se at den siste relasjonen lar oss gi følgende tolkning av det eksponentielle gjennomsnittet: if — serieverdiprediksjon y t, så er forskjellen prognosefeilen. Så spådommen for neste tidspunkt t+1 tar hensyn til det som ble kjent i øyeblikket t prognosefeil.

Utjevningsalternativ α er en veiefaktor. Hvis α nær enhet, så tar prognosen betydelig hensyn til størrelsen på feilen til den siste prognosen. For små verdier α den anslåtte verdien er nær den forrige prognosen. Valget av utjevningsparameter er et ganske komplisert problem. Generelle betraktninger er som følger: Metoden er god for å forutsi tilstrekkelig jevne serier. I dette tilfellet kan man velge en utjevningskonstant ved å minimere prediksjonsfeilen ett steg frem estimert fra den siste tredjedelen av serien. Noen eksperter anbefaler ikke å bruke store verdier av utjevningsparameteren. På fig. 3.1 viser et eksempel på en utjevnet serie som bruker den eksponentielle utjevningsmetoden for α= 0,1.

Ris. 3.1. Resultatet av eksponentiell utjevning kl α =0,1
(1 originalserie; 2 glattede serier; 3 rester)

3.4. Eksponensiell utjevning
trendbasert (Holt-metoden)

Denne metoden tar hensyn til den lokale lineære trenden som eksisterer i tidsserien. Hvis det er en oppadgående trend i tidsserien, er det også nødvendig med et estimat av det nåværende nivået. I Holt-teknikken jevnes nivå- og helningsverdiene direkte ved å bruke forskjellige konstanter for hver av parameterne. Utjevningskonstanter lar deg estimere gjeldende nivå og helning, og avgrense dem hver gang nye observasjoner gjøres.

Holt-metoden bruker tre beregningsformler:

  1. Eksponentielt jevnet serie (estimat for nåværende nivå)

(3.2)

  1. Trendevaluering

(3.3)

  1. Prognose for R perioder fremover

(3.4)

hvor α, β utjevningskonstanter fra intervallet.

Ligning (3.2) ligner på ligning (3.1) for enkel eksponentiell utjevning bortsett fra trendleddet. Konstant β nødvendig for å jevne ut trendanslaget. I prognoseligningen (3.3) multipliseres trendestimatet med antall perioder R, som prognosen er basert på, og deretter legges dette produktet til det gjeldende nivået av glattede data.

Fast α og β velges subjektivt eller ved å minimere prediksjonsfeilen. Jo større verdier av vektene tas, desto raskere vil responsen på pågående endringer finne sted, og dataene vil bli jevnere. Mindre vekter gjør strukturen til de utjevnede verdiene mindre flat.

På fig. 3.2 viser et eksempel på utjevning av en serie ved hjelp av Holt-metoden for verdier α og β lik 0,1.

Ris. 3.2. Holt utjevnende resultat
α = 0,1 og β = 0,1

3.5. Eksponentiell utjevning med trend- og sesongvariasjoner (vintermetoden)

Hvis det er sesongmessige svingninger i datastrukturen, brukes den tre-parameter eksponentielle utjevningsmodellen foreslått av Winters for å redusere prognosefeil. Denne tilnærmingen er en forlengelse av den tidligere Holt-modellen. For å ta høyde for sesongvariasjoner, brukes en ekstra ligning her, og denne metoden er fullstendig beskrevet av fire ligninger:

  1. Eksponentielt jevnet serie

(3.5)

  1. Trendevaluering

(3.6)

  1. Sesongvurdering

.

(3.7)

  1. Prognose for R perioder fremover

(3.8)

hvor α, β, γ konstant utjevning for henholdsvis nivå, trend og sesongvariasjon; s- varigheten av perioden med sesongmessige svingninger.

Ligning (3.5) korrigerer den utjevnede serien. I denne ligningen tar begrepet hensyn til sesongvariasjonen i de opprinnelige dataene. Etter at sesongvariasjon og trend er tatt i betraktning i ligninger (3.6), (3.7), jevnes estimatene ut, og det lages en prognose i ligning (3.8).

Akkurat som i forrige metode, vektene α, β, γ kan velges subjektivt eller ved å minimere prediksjonsfeilen. Før du bruker ligning (3.5), er det nødvendig å bestemme startverdiene for den glattede serien L t, trend T t, sesongmessige koeffisienter S t. Vanligvis blir startverdien til den utjevnede serien tatt lik den første observasjonen, deretter er trenden null, og sesongkoeffisientene settes lik én.

På fig. 3.3 viser et eksempel på utjevning av en serie ved bruk av Winters-metoden.

Ris. 3.3. Resultatet av utjevning etter Winters-metoden
α = 0,1 = 0,1; y = 0,1(1- original rad; 2 glattede rader; 3 rester)

3.6. Prognoser basert på trendmodeller

Ganske ofte har tidsserier en lineær trend (trend). Forutsatt en lineær trend, må du bygge en rett linje som mest nøyaktig vil reflektere endringen i dynamikk i løpet av den aktuelle perioden. Det er flere metoder for å konstruere en rett linje, men den mest objektive fra et formelt synspunkt vil være en konstruksjon basert på å minimere summen av negative og positive avvik av seriens begynnelsesverdier fra en rett linje.

En rett linje i et to-koordinatsystem (x, y) kan defineres som skjæringspunktet for en av koordinatene og helningsvinkelen til aksen X. Ligningen for en slik rett linje vil se ut hvor en- skjæringspunkt; b vippevinkel.

For at den rette linjen skal reflektere dynamikkens forløp, er det nødvendig å minimere summen av vertikale avvik. Når man bruker som kriterium for å estimere minimering av en enkel sum av avvik, vil resultatet ikke bli særlig godt, siden negative og positive avvik opphever hverandre. Minimering av summen av absolutte verdier fører heller ikke til tilfredsstillende resultater, siden parameterestimatene i dette tilfellet er ustabile, er det også beregningsvansker med å implementere en slik estimeringsprosedyre. Derfor er den mest brukte prosedyren å minimere summen av kvadrerte avvik, eller minste kvadrat-metoden(MNK).

Siden serien med startverdier har fluktuasjoner, vil modellen av serien inneholde feil, hvis kvadrater må minimeres

hvor y i observert verdi; y i * teoretiske verdier av modellen; observasjonsnummer.

Når vi modellerer trenden til den opprinnelige tidsserien ved å bruke en lineær trend, vil vi anta det

Å dele den første ligningen med n, kommer vi til neste

Sette inn koeffisienten med det resulterende uttrykket i den andre systemligningen (3.10). b* vi får:

3.7. Kontroll av modelltilpasning

Som et eksempel, i fig. 3.4 viser en graf over lineær regresjon mellom kraften til bilen X og dens kostnad .

Ris. 3.4. Lineær regresjonsplott

Ligningen for dette tilfellet er: =1455,3 + 13,4 X. Visuell analyse av denne figuren viser at det for en rekke observasjoner er betydelige avvik fra den teoretiske kurven. Restgrafen er vist i fig. 3.5.

Ris. 3.5. Restdiagram

Analyse av regresjonslinjeresidualene kan gi et nyttig mål på hvor godt den estimerte regresjonen reflekterer de virkelige dataene. En god regresjon er en som forklarer en betydelig mengde varians, og omvendt sporer ikke en dårlig regresjon en stor mengde fluktuasjoner i de opprinnelige dataene. Det er intuitivt klart at all tilleggsinformasjon vil forbedre modellen, dvs. redusere den uforklarlige brøkdelen av variasjonen til variabelen . For å analysere regresjonen vil vi dekomponere variansen i komponenter. Det er åpenbart det

Det siste leddet vil være lik null, siden det er summen av restene, så vi kommer til følgende resultat

hvor SS0, SS1, SS2 bestemme summen av henholdsvis total, regresjon og restsum av kvadrater.

Regresjonssummen av kvadrater måler delen av variansen som er forklart av en lineær sammenheng; gjenværende del av dispersjonen, ikke forklart av en lineær avhengighet.

Hver av disse summene er preget av et tilsvarende antall frihetsgrader (HR), som bestemmer antall dataenheter som er uavhengige av hverandre. Med andre ord er hjertefrekvens relatert til antall observasjoner n og antall parametere beregnet fra totalen av disse parameterne. I saken under vurdering, å beregne SS0 kun én konstant (gjennomsnittsverdi) bestemmes, derfor hjertefrekvensen for SS0 vil være (n1), hjertefrekvens for SS 2 - (n - 2) og puls for SS 1 vil være n - (n - 1)=1, siden det er n - 1 konstante punkter i regresjonsligningen. Akkurat som summer av kvadrater, er hjertefrekvens relatert til

Summene av kvadrater knyttet til dekomponeringen av variansen, sammen med de tilsvarende hjertefrekvensene, kan plasseres i den såkalte variansanalysetabellen (ANOVA ANAlysis Of VARiance table) (tabell 3.1).

Tabell 3.1

ANOVA bord

Kilde

Summen av kvadrater

Middels firkantet

Regresjon

SS2/ (n-2)

Ved å bruke den introduserte forkortelsen for summer av kvadrater, definerer vi bestemmelseskoeffisient som forholdet mellom regresjonssummen av kvadrater og totalsummen av kvadrater som

(3.13)

Bestemmelseskoeffisienten måler andelen variabilitet i en variabel Y, som kan forklares ved hjelp av informasjon om variabiliteten til den uavhengige variabelen x. Bestemmelseskoeffisienten endres fra null når X påvirker ikke Y, til en når endringen Y fullstendig forklart av endringen x.

3.8. Regresjonsprognosemodell

Den beste prediksjonen er den med den minste variansen. I vårt tilfelle produserer konvensjonelle minste kvadrater den beste prediksjonen av alle metoder som gir objektive estimater basert på lineære ligninger. Prognosefeilen knyttet til prognoseprosedyren kan komme fra fire kilder.

For det første sikrer den tilfeldige karakteren av additive feil som håndteres av lineær regresjon at prognosen vil avvike fra de sanne verdiene selv om modellen er riktig spesifisert og dens parametere er nøyaktig kjent.

For det andre introduserer selve estimeringsprosessen en feil i estimeringen av parametere, de kan sjelden være lik de sanne verdiene, selv om de er lik dem i gjennomsnitt.

For det tredje, i tilfelle av en betinget prognose (i tilfelle av ukjente eksakte verdier av de uavhengige variablene), introduseres feilen med prognosen for de forklarende variablene.

For det fjerde kan feilen vises fordi modellspesifikasjonen er unøyaktig.

Som et resultat kan feilkilder klassifiseres som følger:

  1. arten av variabelen;
  2. modellens natur;
  3. feilen introdusert av prognosen for uavhengige tilfeldige variabler;
  4. spesifikasjonsfeil.

Vi vil vurdere en ubetinget prognose, når uavhengige variabler er lett og nøyaktig predikert. Vi begynner vår vurdering av prognosekvalitetsproblemet med den sammenkoblede regresjonsligningen.

Problemstillingen i dette tilfellet kan formuleres som følger: hva vil være den beste prognosen y T+1, forutsatt at i modellen y = a + bx alternativer en og b estimert nøyaktig, og verdien xT+1 kjent.

Da kan den predikerte verdien defineres som

Prognosefeilen blir da

.

Prognosefeil har to egenskaper:

Den resulterende variansen er minimal blant alle mulige estimater basert på lineære ligninger.

Selv om en og b er kjent, vises prognosefeilen på grunn av at ved T+1 kan ikke ligge på regresjonslinjen på grunn av en feil e T+1, som følger en normalfordeling med null gjennomsnitt og varians σ2. For å sjekke kvaliteten på prognosen introduserer vi den normaliserte verdien

95 % konfidensintervallet kan da defineres som følger:

hvor β 0,05 kvantiler av normalfordelingen.

Grensene for 95 %-intervallet kan defineres som

Merk at i dette tilfellet bredden konfidensintervall avhenger ikke av størrelsen X, og grensene til intervallet er rette linjer parallelle med regresjonslinjene.

Oftere, når du konstruerer en regresjonslinje og kontrollerer kvaliteten på prognosen, er det nødvendig å evaluere ikke bare regresjonsparametrene, men også variansen til prognosefeilen. Det kan vises at i dette tilfellet avhenger feilvariansen av verdien (), hvor er middelverdien til den uavhengige variabelen. I tillegg, jo lengre serie, jo mer nøyaktig er prognosen. Prognosefeilen reduseres hvis verdien av X T+1 er nær middelverdien til den uavhengige variabelen, og omvendt, når man beveger seg bort fra middelverdien, blir prognosen mindre nøyaktig. På fig. 3.6 viser resultatene av prediksjonen ved å bruke den lineære regresjonsligningen for 6 tidsintervaller fremover sammen med konfidensintervaller.

Ris. 3.6. Lineær regresjonsprediksjon

Som det fremgår av fig. 3.6, denne regresjonslinjen beskriver ikke de opprinnelige dataene godt: det er stor variasjon i forhold til tilpasningslinjen. Kvaliteten på modellen kan også bedømmes ut fra residualene, som med en tilfredsstillende modell bør fordeles tilnærmet etter normalloven. På fig. 3.7 viser en graf over residualer, bygget ved hjelp av en sannsynlighetsskala.

Fig.3.7. Restdiagram

Ved bruk av en slik skala bør data som følger normalloven ligge på en rett linje. Som det følger av figuren avviker punktene i begynnelsen og slutten av observasjonsperioden noe fra en rett linje, noe som indikerer en utilstrekkelig høy kvalitet på den valgte modellen i form av en lineær regresjonsligning.

I tabellen. Tabell 3.2 viser prognoseresultatene (andre kolonne) sammen med 95 % konfidensintervaller (henholdsvis nedre tredje og øvre fjerde kolonne).

Tabell 3.2

Prognoseresultater

3.9. Multivariat regresjonsmodell

I multivariat regresjon inkluderer dataene for hvert tilfelle verdiene til den avhengige variabelen og hver uavhengig variabel. Avhengig variabel y er en tilfeldig variabel relatert til de uavhengige variablene ved følgende relasjon:

hvor regresjonskoeffisienter skal bestemmes; ε feilkomponent som tilsvarer avviket til verdiene til den avhengige variabelen fra det sanne forholdet (det antas at feilene er uavhengige og har en normalfordeling med null gjennomsnitt og ukjent varians σ ).

For et gitt datasett kan estimater av regresjonskoeffisientene finnes ved å bruke minste kvadraters metode. Hvis OLS-estimatene er merket med , vil den tilsvarende regresjonsfunksjonen se slik ut:

Residualene er estimater av feilkomponenten og ligner residualene ved enkel lineær regresjon.

Statistisk analyse av en multivariat regresjonsmodell utføres på samme måte som analysen av en enkel lineær regresjon. Standardpakker med statistiske programmer gjør det mulig å få estimater ved minste kvadrater for modellparametere, estimater av deres standardfeil. Du kan også få verdien t-statistikk for å sjekke betydningen av individuelle termer i regresjonsmodellen og verdien F-statistikk for å teste betydningen av regresjonsavhengigheten.

Formen for å dele kvadratsummene ved multivariat regresjon ligner på uttrykk (3.13), men forholdet for hjertefrekvens vil være som følger

Det understreker vi igjen n er volumet av observasjoner, og k antall variabler i modellen. Den totale variansen til den avhengige variabelen består av to komponenter: variansen som forklares av de uavhengige variablene gjennom regresjonsfunksjonen og den uforklarlige variansen.

Tabell ANOVA for tilfellet med multivariat regresjon vil ha formen vist i Tabell. 3.3.

Tabell 3.3

ANOVA bord

Kilde

Summen av kvadrater

Middels firkantet

Regresjon

SS2/ (n-k-1)

Som et eksempel på multivariat regresjon vil vi bruke data fra Statistica-pakken (datafil Poverty.Sta) Dataene som presenteres er basert på en sammenligning av resultatene fra folketellingene fra 1960 og 1970. for et tilfeldig utvalg av 30 land. Landnavnene er lagt inn som strengnavn, og navnene på alle variablene i denne filen er oppført nedenfor:

POP_CHNG befolkningsendring for 1960-1970;

N_EMPLD antall personer sysselsatt i landbruket;

PT_DÅLIG prosentandel av familier som lever under fattigdomsgrensen;

TAX_RATE skattesats;

PT_PHONE prosentandel av leiligheter med telefon;

PT_RURAL prosentandel av befolkningen på landsbygda;

AGE middelalder.

Som en avhengig variabel velger vi funksjonen Pt_Dårlig, og som uavhengig - alle de andre. De beregnede regresjonskoeffisientene mellom de valgte variablene er gitt i tabell. 3.4

Tabell 3.4

Regresjonskoeffisienter

Denne tabellen viser regresjonskoeffisientene ( ) og standardiserte regresjonskoeffisienter ( beta). Ved hjelp av koeffisienter formen til regresjonsligningen etableres, som i denne saken ser ut som:

Inkluderingen på høyre side av bare disse variablene skyldes at bare disse funksjonene har en sannsynlighetsverdi R mindre enn 0,05 (se fjerde kolonne i tabell 3.4).

Bibliografi

  1. Basovsky L. E. Prognosering og planlegging i markedsforhold. - M .: Infra - M, 2003.
  2. Box J., Jenkins G. Tidsserieanalyse. Utgave 1. Prognose og styring. – M.: Mir, 1974.
  3. Borovikov V. P., Ivchenko G. I. Prognoser i Statistica-systemet i Windows-miljøet. - M.: Finans og statistikk, 1999.
  4. Duke W. Databehandling på PC i eksempler. - St. Petersburg: Peter, 1997.
  5. Ivchenko B. P., Martyshchenko L. A., Ivantsov I. B. Informasjonsmikroøkonomi. Del 1. Metoder for analyse og prognoser. - St. Petersburg: Nordmed-Izdat, 1997.
  6. Krichevsky M. L. Introduksjon til kunstige nevrale nettverk: Proc. godtgjørelse. - St. Petersburg: St. Petersburg. stat marin teknologi. un-t, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Multivariat statistisk analyse i økonomi. – M.: Unity-Dana, 1999.

Det glidende gjennomsnittet lar deg jevne ut dataene perfekt. Men dens største ulempe er at hver verdi i kildedataene har samme vekt. For eksempel, for et glidende gjennomsnitt som bruker en seksukers periode, gis hver verdi for hver uke 1/6 av vekten. For enkelte innsamlede statistikker tillegges nyere verdier mer vekt. Derfor brukes eksponentiell utjevning for å gi de nyeste dataene større vekt. Dermed er dette statistiske problemet løst.

Beregningsformel for eksponentiell utjevning i Excel

Figuren under viser en etterspørselsrapport for et bestemt produkt i 26 uker. Kolonnen Etterspørsel inneholder informasjon om antall solgte varer. I kolonnen "Værvarsel" - formelen:

Kolonnen "Glidende gjennomsnitt" definerer den anslåtte etterspørselen, beregnet ved å bruke den vanlige beregningen av det glidende gjennomsnittet med en periode på 6 uker:

I den siste kolonnen "Værvarsel", med formelen beskrevet ovenfor, brukes metoden for eksponentiell utjevning av data der verdiene for de siste ukene har mer vekt enn de foregående.

Koeffisienten "Alpha:" legges inn i celle G1, det betyr vekten av tildelingen til de nyeste dataene. I dette eksemplet har den en verdi på 30 %. De resterende 70 % av vekten fordeles til resten av dataene. Det vil si at den andre verdien når det gjelder relevans (fra høyre til venstre) har en vekt lik 30% av de resterende 70% av vekten - dette er 21%, den tredje verdien har en vekt lik 30% av resten av de 70 % av vekten - 14,7 % og så videre .



Eksponentiell utjevningsplott

Figuren nedenfor viser etterspørselsgrafen, det glidende gjennomsnittet og den eksponentielle utjevningsprognosen, som er bygget på grunnlag av de opprinnelige verdiene:


Legg merke til at den eksponentielle utjevningsprognosen er mer responsiv på endringer i etterspørselen enn den glidende gjennomsnittslinjen.

Dataene for påfølgende foregående uker multipliseres med alfafaktoren, og resultatet legges til resten av vektprosenten multiplisert med den forrige predikerte verdien.

En enkel og logisk oversiktlig tidsseriemodell har følgende form:

Y t = b + e t

y, = b + rn (11,5)

hvor b er en konstant, er e en tilfeldig feil. Konstanten b er relativt stabil over hvert tidsintervall, men kan også endre seg sakte over tid. En intuitiv måte å trekke ut verdien av b fra dataene er å bruke glidende gjennomsnittsutjevning, der de siste observasjonene vektes høyere enn de nest siste, de nest siste er mer vektet enn de nest siste, og så videre. Enkel eksponentiell utjevning er nettopp det. Her tildeles eksponentielt synkende vekter til eldre observasjoner, mens i motsetning til det glidende gjennomsnittet tas alle tidligere observasjoner av serien med i betraktningen, og ikke bare de som falt inn i et bestemt vindu. Den nøyaktige formelen for enkel eksponentiell utjevning er:

S t = a y t + (1 - a) S t -1

Når denne formelen brukes rekursivt, beregnes hver nye utjevnede verdi (som også er en prediksjon) som et vektet gjennomsnitt av gjeldende observasjon og den utjevnede serien. Selvfølgelig avhenger resultatet av utjevning av parameteren a . Hvis a er 1, ignoreres tidligere observasjoner fullstendig. Hvis a er 0, ignoreres gjeldende observasjoner. Verdier mellom 0 og 1 gir mellomresultater. Empiriske studier har vist at en enkel eksponentiell utjevning ofte gir en ganske nøyaktig prediksjon.

I praksis anbefales det vanligvis å ta mindre enn 0,30. Men å velge en større enn 0,30 gir noen ganger en mer nøyaktig prediksjon. Dette betyr at det fortsatt er bedre å estimere den optimale verdien av a fra reelle data enn å bruke generelle anbefalinger.

I praksis søkes den optimale utjevningsparameteren ofte ved hjelp av en rutenettsøkeprosedyre. Det mulige området av parameterverdier er delt av et rutenett med et bestemt trinn. Tenk for eksempel på et rutenett med verdier fra a = 0,1 til a = 0,9 med et trinn på 0,1. Verdien av a velges da for hvor summen av kvadrater (eller gjennomsnittlige kvadrater) av residualene (observerte verdier minus prediksjoner ett skritt foran) er minimal.

Microsoft Excel tilbyr funksjonen Eksponentiell utjevning, som vanligvis brukes til å jevne ut nivåene i en empirisk tidsserie basert på den enkle eksponentielle utjevningsmetoden. For å kalle denne funksjonen, velg Verktøy Þ Dataanalyse fra menylinjen. Dataanalyse-vinduet åpnes på skjermen, der du skal velge verdien Eksponentiell utjevning (eksponentiell utjevning). Som et resultat vil dialogboksen Eksponentiell utjevning vises.

I dialogboksen Eksponentiell utjevning er nesten de samme parameterne satt som i dialogboksen for glidende gjennomsnitt diskutert ovenfor.

1. Input Range (Input data) - i dette feltet legges det inn et celleområde som inneholder verdiene til parameteren som studeres.

2. Etiketter - denne avmerkingsboksen er merket hvis
den første raden (kolonnen) i inndataområdet inneholder en overskrift. Hvis overskriften mangler, bør avmerkingsboksen fjernes. I dette tilfellet vil standardnavn automatisk genereres for dataene for utdataområdet.

3. Dempingsfaktor - skriv inn verdien av den valgte eksponentielle utjevningsfaktoren a i dette feltet. Standardverdien er a = 0,3.

4. Utdataalternativer - i denne gruppen kan du, i tillegg til å spesifisere et celleområde for utdata i Output Range-feltet, også kreve å automatisk plotte en graf, som du må sjekke alternativet Chart Output for, og beregne standard feil, som du må sjekke alternativet Standardfeil (Standardfeil).

Oppgave 2. Ved å bruke Microsoft Excel-programmet, ved å bruke funksjonen Eksponentiell utjevning, basert på dataene om utgangsvolumet til oppgave 1, beregner du de utjevnede utmatingsnivåene og standardfeilene. Presenter deretter de faktiske og forutsagte dataene ved hjelp av et diagram. Hint: du bør få en tabell og graf som ligner på den som ble gjort i oppgave 1, men med forskjellige utjevnede nivåer og standardfeil.

Analytisk justering metode

hvor er de teoretiske verdiene for tidsserien beregnet i henhold til den tilsvarende analytiske ligningen på tidspunktet t.

Definisjonen av teoretiske (kalkulerte) verdier er laget på grunnlag av den såkalte tilstrekkelige matematiske modellen, som den beste måten viser hovedtrenden i utviklingen av tidsserien.

De enkleste modellene (formlene) som uttrykker utviklingstrenden er følgende:

Lineær funksjon hvis graf er en rett linje:

Eksponentiell funksjon:

Y t = a 0 * a 1 t

Potensfunksjon av andre orden, hvis graf er en parabel:

Y t = a 0 + a 1 * t + a 2 * t 2

Logaritmisk funksjon:

Y t = a 0 + a 1 * ln t

Funksjonsparametrene beregnes vanligvis ved hjelp av minste kvadraters metode, der minimumspunktet for summen av kvadrerte avvik mellom det teoretiske og empiriske nivået tas som en løsning:

hvor - justerte (kalkulerte) nivåer, og Yt - faktiske nivåer.

Ligningsparametere a i som tilfredsstiller denne betingelsen kan finnes ved å løse systemet med normale ligninger. Basert på den funnet trendligningen, beregnes de justerte nivåene.

rett linje justering brukes i tilfeller der absolutte gevinster er praktisk talt konstante, dvs. når nivåene endres i en aritmetisk progresjon (eller nær den).

Justering ved eksponentiell funksjon gjelder når serien reflekterer utviklingen i geometrifaget, d.v.s. kjedevekstfaktorer er praktisk talt konstante.

Strømfunksjonsjustering(parabel av andre orden) brukes når tidsserien endres med konstante kjedeveksthastigheter.

Utjevning med logaritmisk funksjon brukes når serien reflekterer utvikling med lavere vekst ved slutten av perioden, dvs. når økningen i de endelige nivåene i tidsserien har en tendens til null.

I henhold til de beregnede parametrene syntetiseres trendmodellen til funksjonen, dvs. oppnå verdier a 0 , a 1 , a ,2 og erstatte dem i den ønskede ligningen.

Riktigheten av beregningene av analytiske nivåer kan kontrolleres av følgende betingelse: summen av verdiene til den empiriske serien må samsvare med summen av de beregnede nivåene til den justerte serien. I dette tilfellet kan det oppstå en liten feil i beregningene på grunn av avrunding av de beregnede verdiene:

For å vurdere nøyaktigheten til trendmodellen, brukes bestemmelseskoeffisienten:

hvor er variansen til teoretiske data hentet fra trendmodellen, og er variansen til empiriske data.

Trendmodellen er tilstrekkelig til prosessen som studeres og reflekterer trenden i utviklingen ved verdier på R 2 nær 1.

Etter å ha valgt den mest passende modellen, kan du lage en prognose for hvilken som helst av periodene. Når de lager prognoser, opererer de ikke med et punkt, men med et intervallestimat, som bestemmer de såkalte konfidensintervallene til prognosen. Verdien av konfidensintervallet er definert i generelle termer som følger:

hvor er standardavviket fra trenden; ta- tabellverdi av Students t-test på signifikansnivå en, som avhenger av signifikansnivået en(%) og antall frihetsgrader k = n- t. Verdien - bestemmes av formelen:

hvor og er de faktiske og beregnede verdiene for nivåene til den dynamiske serien; P - antall radnivåer; t- antall parametere i trendligningen (for den rette linjelikningen t - 2, for 2. ordens parabelligning t = 3).

Etter de nødvendige beregningene bestemmes et intervall der den predikerte verdien vil bli lokalisert med en viss sannsynlighet.

Å bruke Microsoft Excel til å bygge trendmodeller er ganske enkelt. Først bør den empiriske tidsserien presenteres som et diagram av en av følgende typer: histogram, stolpediagram, graf, punktdiagram, områdediagram, og deretter høyreklikk på en av datamarkørene på diagrammet. Som et resultat vil selve tidsserien bli uthevet på diagrammet, og kontekstmenyen åpnes på skjermen. Fra denne menyen velger du kommandoen Legg til trendlinje. Dialogboksen Legg til trendlinje vil vises.

På kategorien Type i denne dialogboksen er den nødvendige trendtypen valgt:

1. lineær (Lineær);

2. logaritmisk (Logaritmisk);

3. polynom, fra 2. til 6. grad inklusive (polinomium);

4. kraft (Power);

5. eksponentiell (eksponentiell);

6. glidende gjennomsnitt, med en indikasjon på utjevningsperioden fra 2 til 15 (glidende gjennomsnitt).

På fanen Alternativer i denne dialogboksen er flere trendalternativer angitt.

1. Trendlinjenavn (Navn på den glattede kurven) - i denne gruppen er navnet valgt, som vil vises på diagrammet for å indikere funksjonen som brukes til å jevne ut tidsserien. Følgende alternativer er mulige:

♦ Automatisk - Når alternativknappen er satt til denne posisjonen, genererer Microsoft Excel automatisk navnet på trendutjevningsfunksjonen basert på den valgte trendtypen, for eksempel Lineær (Lineær funksjon).

♦ Egendefinert - Når alternativknappen er satt til denne posisjonen, kan du skrive inn ditt eget navn for trendfunksjonen i boksen til høyre, opptil 256 tegn.

2. Prognose (Forecast) - i denne gruppen kan du spesifisere hvor mange perioder fremover (felt Fremover) du vil projisere en trendlinje inn i fremtiden og hvor mange perioder tilbake (felt Bakover) du vil projisere en trendlinje inn i fortiden (disse feltene er ikke tilgjengelige i glidende gjennomsnittsmodus).

3. Angi avskjæring (Kurveavskjæring med Y-aksen i et punkt) - denne avmerkingsboksen og inndatafeltet til høyre lar deg spesifisere direkte punktet der trendlinjen skal skjære Y-aksen (disse feltene er ikke tilgjengelige for alle moduser).

4. Vis ligning på diagram - når dette alternativet er merket av, vil en ligning som beskriver utjevningstrendlinjen vises på diagrammet.

5. Vis R-kvadratverdi på diagrammet R2)- når denne avmerkingsboksen er merket, vil diagrammet vise verdien av bestemmelseskoeffisienten.

Feillinjer kan også vises sammen med en trendlinje på et tidsseriediagram. For å sette inn feillinjer, velg en dataserie, høyreklikk på den og velg kommandoen Formater dataserie fra hurtigmenyen. Dialogboksen Formater dataserier åpnes på skjermen, der du skal gå til kategorien Y-feillinjer (Y-feil).

På denne fanen, ved hjelp av feilmengde-bryteren, velger du typen søyler og alternativet for å beregne dem, avhengig av typen feil.

1. Fast verdi (Fast verdi) - når bryteren er satt til denne posisjonen, tas den konstante verdien angitt i tellerfeltet til høyre som tillatt feilverdi;

2. Prosent (Relativ verdi) - når bryteren er satt til denne posisjonen, beregnes det tillatte avviket for hvert datapunkt, basert på prosentverdien angitt i tellerfeltet til høyre;

3. Standardavvik(er) - når bryteren er satt til denne posisjonen, beregnes standardavviket for hvert datapunkt, som deretter multipliseres med tallet angitt i tellerfeltet til høyre (multiplikator);

4. Standardfeil - når bryteren er satt til denne posisjonen, antas standardfeilverdien, som er konstant for alle dataelementer;

5. Egendefinert (egendefinert) - når bryteren er satt til denne posisjonen, er en vilkårlig rekke av avviksverdier lagt inn i en positiv og / eller negativ retning (du kan legge inn koblinger til en rekke celler).

Feillinjer kan også formateres. For å gjøre dette, velg dem ved å klikke med høyre museknapp og velg kommandoen Formater feillinjer fra hurtigmenyen.

Oppgave 3. Ved å bruke Microsoft Excel-programmet, basert på dataene om volumet av utgaven av Oppgave 1, må du:

Presenter en tidsserie som en graf bygget ved hjelp av diagramveiviseren. Legg deretter til en trendlinje, velg den mest passende versjonen av ligningen.

Presenter resultatene i form av en tabell "Utvalg av trendligningen":

Tabell "Valg av trendligningen"

Presenter den valgte ligningen grafisk, plott dataene på navnet på den oppnådde funksjonen og verdien av tilnærmingsreliabiliteten (R 2).

Oppgave 4. Svar på følgende spørsmål:

1. Når man analyserte trenden for et bestemt datasett, viste det seg at bestemmelseskoeffisienten for den lineære modellen var 0,95, for den logaritmiske modellen - 0,8, og for polynomet av tredje grad - 0,9636. Hvilken trendmodell er mest passende for prosessen som studeres:

a) lineær;

b) logaritmisk;

c) polynom av 3. grad.

2. I følge dataene presentert i oppgave 1, forutsi volumet av produksjonen i 2003. Hvilken generell trend i oppførselen til den studerte mengden følger av resultatene av prognosen din:

a) det er en nedgang i produksjonen;

b) produksjonen forblir på samme nivå;

c) det er en økning i produksjonen.

I dette materialet ble hovedkarakteristikkene til tidsserien, modeller for dekomponering av tidsserien, samt hovedmetodene for å jevne ut serien - metoden for glidende gjennomsnitt, eksponentiell utjevning og analytisk justering vurdert. For å løse disse problemene tilbyr Microsoft Excel verktøy som Moving Average (Moving Average) og Eksponentiell utjevning (eksponentiell utjevning), som lar deg jevne ut nivåene til en empirisk tidsserie, samt kommandoen Legg til trendiine (Legg til en trendlinje). ), som lar deg bygge trendmodeller og lage en prognose basert på de tilgjengelige verdiene for tidsserien.

P.S. For å aktivere dataanalysepakken, velg Verktøy → Dataanalyse-kommandoen (Verktøy → Dataanalyse).

Hvis dataanalyse mangler, må du utføre følgende trinn:

1. Velg kommandoen Verktøy → Tillegg (tillegg).

2. Velg Analysis ToolPak fra den foreslåtte listen over innstillinger, og klikk deretter OK. Etter det vil dataanalyse-tilpasningspakken lastes ned og kobles til Excel. Den tilsvarende kommandoen vises i Verktøy-menyen.


©2015-2019 nettsted
Alle rettigheter tilhører deres forfattere. Dette nettstedet krever ikke forfatterskap, men tilbyr gratis bruk.
Opprettelsesdato for side: 2016-04-27

I metoden for vektet glidende gjennomsnitt er det åpenbart mange måter å sette vektene slik at summen deres er lik 1. En av disse metodene kalles eksponentiell utjevning. I dette skjemaet av metoden for vektet gjennomsnitt, for enhver t > 1, er prognoseverdien på tidspunktet t+1 den vektede summen av det faktiske salget, , i tidsperiode t, og det anslåtte salget, , i tidsperiode t I andre ord,

Eksponentiell utjevning har beregningsfordeler fremfor glidende gjennomsnitt. Her, for å beregne , er det bare nødvendig å kjenne verdiene til , og , (sammen med verdien av α). For eksempel, hvis et selskap trenger å forutsi etterspørselen etter 5 000 varer i hver tidsperiode, må det lagre 10 001 dataverdier (5 000 verdier av , 5 000 verdier av , og en α-verdi), mens lage en prognose basert på et glidende gjennomsnitt på 8 noder som kreves 40 000 dataverdier. Avhengig av oppførselen til dataene, kan det være nødvendig å lagre forskjellige verdier av α for hvert produkt, men selv i dette tilfellet er mengden informasjon som lagres mye mindre enn når du bruker et glidende gjennomsnitt. Det som er bra med eksponentiell utjevning er at ved å beholde α og den siste prediksjonen, blir alle tidligere prediksjoner også implisitt bevart.

La oss vurdere noen egenskaper ved den eksponentielle utjevningsmodellen. Til å begynne med merker vi at hvis t > 2, så i formel (1) kan t erstattes med t–1, dvs. Ved å erstatte dette uttrykket med den opprinnelige formelen (1), får vi

Ved å utføre suksessivt lignende erstatninger får vi følgende uttrykk til

Siden fra ulikheten 0< α < 1 следует, что 0 < 1 – α < 1, то Другими словами, наблюдение , имеет больший вес, чем наблюдение , которое, в свою очередь, имеет больший вес, чем . Это иллюстрирует основное свойство модели экспоненциального сглаживания - коэффициенты при убывают при уменьшении номера k. Также можно показать, что сумма всех коэффициентов (включая коэффициент при ), равна 1.

Det kan sees av formel (2) at verdien er den vektede summen av alle tidligere observasjoner (inkludert den siste observasjonen ). Det siste leddet i summen (2) er det ikke statistisk observasjon, men ved "antagelse" (vi kan for eksempel anta at ). Åpenbart, med økende t, avtar påvirkningen på prognosen, og i et visst øyeblikk kan den neglisjeres. Selv om verdien av α er liten nok (slik at (1 - α) er omtrent lik 1), vil verdien avta raskt.

Verdien av parameteren α påvirker i stor grad ytelsen til prediksjonsmodellen, siden α er vekten av den siste observasjonen. Dette betyr at man bør tildele større verdiα i tilfellet når den mest prediktive modellen er den siste observasjonen. Hvis α er nær 0, betyr dette nesten full tillit til forrige prognose og ignorering av siste observasjon.

Victor hadde et problem: hvordan velge verdien av α best. Igjen, Solver-verktøyet vil hjelpe deg med dette. For å finne den optimale verdien av α (dvs. den der den prediktive kurven vil avvike minst fra tidsserieverdikurven), gjør følgende.

  1. Velg kommandoen Verktøy -> Søk etter en løsning.
  2. I dialogboksen Finn løsning som åpnes, setter du målcellen til G16 (se Expo-arket) og spesifiserer at verdien skal være minimum.
  3. Spesifiser at cellen som skal endres er celle B1.
  4. Skriv inn begrensninger B1 > 0 og B1< 1
  5. Ved å klikke på Kjør-knappen får du resultatet vist i fig. åtte.

Igjen, som i metoden for vektet glidende gjennomsnitt, vil den beste forutsigelsen oppnås ved å tilordne full vekt til den siste observasjonen. Derfor er den optimale verdien av α 1, med gjennomsnittlige absolutte avvik på 6,82 (celle G16). Victor fikk en prognose som han allerede hadde sett før.

Den eksponentielle utjevningsmetoden fungerer godt i situasjoner der variabelen av interesse for oss oppfører seg stasjonær, og dens avvik fra en konstant verdi er forårsaket av tilfeldige faktorer og ikke er regelmessige. Men: uavhengig av verdien av parameteren α, vil metoden for eksponentiell utjevning ikke være i stand til å forutsi monotont økende eller monotont avtagende data (de predikerte verdiene vil alltid være henholdsvis mindre eller mer enn de observerte). Det kan også vises at det i en modell med sesongvariasjoner ikke vil være mulig å få tilfredsstillende prognoser ved denne metoden.

Hvis statistikken endres monotont eller er gjenstand for sesongmessige endringer, spesielle metoder spådommer, som vil bli diskutert nedenfor.

Holt-metoden (eksponentiell utjevning med en trend)

,

Holts metode tillater prognoser for k tidsperioder fremover. Metoden, som du kan se, bruker to parametere α og β. Verdiene til disse parameterne varierer fra 0 til 1. Variabelen L, indikerer det langsiktige nivået av verdier, eller den underliggende verdien av tidsseriedataene. Variabelen T indikerer mulig økning eller reduksjon i verdier over en periode.

La oss vurdere arbeidet med denne metoden på et nytt eksempel. Svetlana jobber som analytiker i et stort meglerfirma. Basert på kvartalsrapportene hun har for Startup Airlines, ønsker hun å forutsi selskapets inntjening for neste kvartal. De tilgjengelige dataene og diagrammet som er bygget på basis av dem er i Startup.xls-arbeidsboken (fig. 9). Det kan sees at dataene har en klar trend (nesten monotont økende). Svetlana ønsker å bruke Holt-metoden for å forutsi resultat per aksje for trettende kvartal. For å gjøre dette må du angi startverdiene for L og T. Det er flere valg: 1) L er lik verdien av inntjening per aksje for første kvartal og T = 0; 2) L er lik gjennomsnittsverdien av resultat per aksje i 12 kvartaler og T er lik gjennomsnittlig endring for alle 12 kvartaler. Det finnes andre alternativer startverdier for L og T, men Svetlana valgte det første alternativet.

Hun bestemte seg for å bruke verktøyet Finn løsning for å finne den optimale verdien av parameterne α og β, hvor verdien av gjennomsnittet absolutte feil prosentandelen vil være minimal. For å gjøre dette, må du følge disse trinnene.

Velg kommandoen Tjeneste -> Søk etter en løsning.

I dialogboksen Søk etter en løsning som åpnes, setter du celle F18 som målcellen og angir at verdien skal minimeres.

I feltet Endre celler skriver du inn celleområdet B1:B2. Legg til begrensninger B1:B2 > 0 og B1:B2< 1.

Klikk på Utfør-knappen.

Den resulterende prognosen er vist i fig. ti.

Som man kan se, viste de optimale verdiene seg å være α = 0,59 og β = 0,42, mens gjennomsnittlig absolutt feil i prosent er 38%.

Regnskap sesongmessige endringer

Sesongmessige endringer bør tas i betraktning når prognoser fra tidsseriedata Sesongmessige endringer er opp og ned svingninger med en konstant periode i verdiene til en variabel.

Hvis du for eksempel ser på issalg etter måned, kan du se inn varme måneder(juni til august på den nordlige halvkule) over høy level salg enn om vinteren, og så hvert år. Her har sesongsvingninger en periode på 12 måneder. Hvis ukentlige data brukes, vil mønsteret av sesongsvingninger gjentas hver 52. uke. Et annet eksempel er analysert ved ukentlige rapporter om antall gjester som overnattet på et hotell som ligger i et forretningssenter i byen. Vi kan antagelig si det stort antall kunder forventes tirsdag, onsdag og torsdag kveld, minst antall kunder vil være lørdag og søndag kveld, og gjennomsnittlig antall gjester forventes fredag ​​og mandag kveld. En slik datastruktur som viser antall kunder i forskjellige dager uker, gjentas hver syvende dag.

Prosedyren for å lage en sesongjustert prognose består av følgende fire trinn:

1) Basert på de første dataene bestemmes strukturen av sesongsvingninger og perioden for disse svingningene.

3) Basert på dataene som sesongkomponenten er ekskludert fra, lages en best mulig prognose.

4) Sesongkomponenten legges til mottatt prognose.

La oss illustrere denne tilnærmingen med kullsalgsdata (målt i tusenvis av tonn) i USA i løpet av ni år som leder ved Gillette Coal Mine, Frank trenger å forutsi kulletterspørselen for de neste to kvartalene. Han la inn data for hele kullindustrien i Coal.xls-arbeidsboken og plottet dataene (Figur 11). Grafen viser at salgsvolumet er over gjennomsnittet i første og fjerde kvartal ( vintertidår) og under gjennomsnittet i andre og tredje kvartal (vår-sommermånedene).

Utelukkelse av sesongkomponenten

Først må du beregne gjennomsnittet av alle avvik for en periode med sesongmessige endringer. For å ekskludere sesongkomponenten innen ett år, brukes data for fire perioder (kvartaler). Og for å ekskludere sesongkomponenten fra hele tidsserien, beregnes en sekvens av glidende gjennomsnitt over T-noder, der T er varigheten av sesongsvingninger. For å utføre de nødvendige beregningene brukte Frank kolonnene C og D, som vist i fig. under. Kolonne C inneholder 4-nodes glidende gjennomsnitt basert på dataene i kolonne B.

Nå må vi tilordne de resulterende glidende gjennomsnittsverdiene til midtpunktene i datasekvensen som disse verdiene ble beregnet fra. Denne operasjonen kalles sentrering verdier. Hvis T er oddetall, så er den første verdien av det glidende gjennomsnittet (gjennomsnittet av verdiene fra den første til T-punkt) skal tildeles (T + 1)/2 til punktet (for eksempel, hvis T = 7, vil det første glidende gjennomsnittet bli tildelt det fjerde punktet). På samme måte er gjennomsnittet av verdiene fra det andre til det (T + 1) punktet sentrert ved (T + 3)/2-punktet, osv. Sentrum av det n-te intervallet er ved punktet (T+ (2n-1))/2.

Hvis T er jevnt, som i det aktuelle tilfellet, blir problemet noe mer komplisert, siden de sentrale (midt) punktene her er plassert mellom punktene som den glidende gjennomsnittsverdien ble beregnet for. Derfor beregnes den sentrerte verdien for det tredje punktet som gjennomsnittet av den første og andre verdien av det glidende gjennomsnittet. For eksempel betyr det første tallet i kolonne D av det sentrerte i fig. 12, til venstre er (1613 + 1594)/2 = 1603. I fig. 13 viser plott av rådata og sentrerte gjennomsnitt.

Deretter finner vi forholdene mellom verdiene til datapunktene og de tilsvarende verdiene til de sentrerte midlene. Siden punktene på begynnelsen og slutten av datasekvensen ikke har tilsvarende sentrerte midler (se den første og siste verdier i kolonne D), gjelder ikke denne handlingen for disse punktene. Disse forholdstallene indikerer i hvilken grad dataverdiene avviker fra det typiske nivået definert av de sentrerte midlene. Merk at forholdsverdiene for tredje kvartal er mindre enn 1, og de for fjerde kvartaler er større enn 1.

Disse sammenhengene er grunnlaget for å lage sesongindekser. For å beregne dem, er de beregnede forholdstallene gruppert etter kvartaler, som vist i fig. 15 i kolonnene G-O.

Deretter finner man gjennomsnittsverdiene for forholdstallene for hvert kvartal (kolonne E i fig. 15). For eksempel er gjennomsnittet av alle forholdstall for første kvartal 1,108. Denne verdien er sesongindeksen for første kvartal, hvorfra det kan konkluderes at volumet av kullsalget for første kvartal i gjennomsnitt utgjør ca. 110,8 % av det relative gjennomsnittlige årlige salget.

Sesongindeks er det gjennomsnittlige forholdet mellom data knyttet til én sesong (i dette tilfellet er sesongen en fjerdedel) til alle data. Hvis en sesongindeks større enn 1 betyr at ytelsen for denne sesongen er over gjennomsnittet for året, på samme måte, hvis sesongindeksen er under 1, er sesongens ytelse under gjennomsnittet for året.

Til slutt, for å ekskludere sesongkomponenten fra de opprinnelige dataene, bør verdiene til de opprinnelige dataene deles på den tilsvarende sesongindeksen. Resultatene av denne operasjonen er vist i kolonnene F og G (fig. 16). Et plott av data som ikke lenger inneholder en sesongkomponent er vist i fig. 17.

Prognoser

Basert på dataene, som sesongkomponenten er ekskludert fra, bygges en prognose. For å gjøre dette brukes en hensiktsmessig metode som tar hensyn til arten av oppførselen til dataene (for eksempel har dataene en trend eller er relativt konstante). I dette eksemplet er prognosen laget ved hjelp av enkel eksponentiell utjevning. Den optimale verdien av parameteren α finner du ved å bruke Solver-verktøyet. Grafen over prognosen og reelle data med den ekskluderte sesongkomponenten er vist i fig. atten.

Regnskap for sesongstruktur

Nå må vi ta hensyn til sesongkomponenten i prognosen (1726,5). For å gjøre dette, multipliser 1726 med sesongindeksen for første kvartal på 1,108, noe som resulterer i en verdi på 1912. En lignende operasjon (multipliser 1726 med sesongindeksen på 0,784) vil gi en prognose for andre kvartal, lik 1353. Resultatet av å legge til sesongstrukturen til den resulterende prognosen er vist i fig. 19.

Oppgavealternativer:

Oppgave 1

Gitt en tidsserie

t
x

1. Plott avhengigheten x = x(t).

  1. Bruk et enkelt glidende gjennomsnitt over 4 noder, forutsi etterspørselen på det 11. tidspunktet.
  2. Er denne prognosemetoden egnet for disse dataene eller ikke? Hvorfor?
  3. Plukke opp lineær funksjon tilnærming av data ved hjelp av minste kvadraters metode.

Oppgave 2

Bruk Startup Airlines inntektsprognosemodell (Startup.xls), gjør følgende:

Oppgave 3

For tidsserier

t
x

løpe:

  1. Ved å bruke et vektet glidende gjennomsnitt over 4 noder, og tilordne vekter 4/10, 3/10, 2/10, 1/10, forutsi etterspørselen på det 11. tidspunktet. Mer vekt bør tillegges nyere observasjoner.
  2. Er denne tilnærmingen bedre enn et enkelt glidende gjennomsnitt over 4 noder? Hvorfor?
  3. Finn gjennomsnittet av absolutte avvik.
  4. Bruk Solver-verktøyet for å finne de optimale nodevektene. Hvor mye ble tilnærmingsfeilen redusert?
  5. Bruk eksponentiell utjevning for å forutsi. Hvilken av metodene som brukes gir best resultat?

Oppgave 4

Analyser tidsserier

Tid
Kreve
  1. Bruk et 4-nodes vektet glidende gjennomsnitt med vektene 4/10, 3/10, 2/10, 1/10 for å få en prognose på tidspunktene 5-13. Mer vekt bør tillegges nyere observasjoner.
  2. Finn gjennomsnittet av absolutte avvik.
  3. Tror du denne tilnærmingen er bedre enn den enkle glidende gjennomsnittsmodellen med 4 noder? Hvorfor?
  4. Bruk Solver-verktøyet for å finne de optimale nodevektene. Hvor mye klarte du å redusere feilverdien med?
  5. Bruk eksponentiell utjevning for å forutsi. Hvilken av metodene som brukes gir best resultat?

Oppgave 5

Gitt en tidsserie

Oppgave 7

Markedssjefen i et lite, voksende selskap som inneholder en kjede av dagligvarebutikker har informasjon om salgsvolum for hele eksistensen av den mest lønnsomme butikken (se tabell).

Bruk et enkelt glidende gjennomsnitt over 3 noder, forutsi verdiene ved nodene 4 til 11.

Bruk et vektet glidende gjennomsnitt over 3 noder, forutsi verdiene ved nodene 4 til 11. Bruk Solver-verktøyet til å bestemme de optimale vektene.

Bruk eksponentiell utjevning for å forutsi verdiene ved nodene 2-11. Bestem den optimale verdien av parameteren α ved hjelp av Solver-verktøyet.

Hvilken av prognosene som er oppnådd er den mest nøyaktige og hvorfor?

Oppgave 8

Gitt en tidsserie

  1. Tegn denne tidsserien. Koble punktene med rette linjer.
  2. Bruk et enkelt glidende gjennomsnitt over 4 noder, forutsi etterspørselen etter nodene 5-13.
  3. Finn gjennomsnittet av absolutte avvik.
  4. Er det tilrådelig å bruke denne metoden prediksjon for dataene som presenteres?
  5. Er denne tilnærmingen bedre enn et enkelt glidende gjennomsnitt over 3 noder? Hvorfor?
  6. Plott en lineær og kvadratisk trend fra dataene.
  7. Bruk eksponentiell utjevning for å forutsi. Hvilken av metodene som brukes gir best resultat?

Oppgave 10

Arbeidsboken Business_Week.xls viser data fra Business Week for 43 måneders månedlig bilsalg.

  1. Fjern sesongkomponenten fra disse dataene.
  2. Fastslå beste metoden prognoser for tilgjengelige data.
  3. Hva er prognosen for den 44. perioden?

Oppgave 11

  1. enkel krets prognose, når verdien for siste uke tas som prognose for neste uke.
  2. Glidende gjennomsnittsmetode (med antall noder du velger). Prøv å bruke flere forskjellige betydninger noder.

Oppgave 12

Bank.xls-arbeidsboken viser ytelsen til banken. Ta i betraktning følgende metoder forutsi verdiene for denne tidsserien.

Som prognose brukes gjennomsnittsverdien av indikatoren for alle foregående uker.

Metode for vektet glidende gjennomsnitt (med antall noder du velger). Prøv å bruke flere forskjellige nodeverdier. Bruk Solver-verktøyet til å bestemme de optimale vektene.

Eksponentiell utjevningsmetode. Finn den optimale verdien av parameteren α ved hjelp av Solver-verktøyet.

Hvilken av prognosemetodene foreslått ovenfor vil du anbefale for å forutsi verdiene til denne tidsserien?

Litteratur


Lignende informasjon.