Biograafiad Omadused Analüüs

Kuidas eksponentsiaalne silumine töötab. Eksponentsiaalne silumismeetod

Prognoosimisülesanded põhinevad teatud andmete muutumisel aja jooksul (müük, nõudlus, pakkumine, SKT, süsinikuheide, rahvaarv ...) ja nende muutuste prognoosimisel tulevikku. Kahjuks võivad paljud ajalooliste andmete põhjal suundumusi rikkuda ettenägematud asjaolud. Seega võivad andmed tulevikus oluliselt erineda minevikus toimunust. See on prognoosimise probleem.

Siiski on tehnikaid (nimetatakse eksponentsiaalseks silumiseks), mis võimaldavad mitte ainult proovida tulevikku ennustada, vaid ka arvuliselt väljendada kõige prognoosiga seonduva ebakindlust. Ebakindluse arvuline väljendamine prognoosivahemike loomise kaudu on tõesti hindamatu, kuid prognoosimaailmas sageli tähelepanuta jäetud.

Laadige alla märge vormingus või vormingus, näited vormingus

Esialgsed andmed

Oletame, et olete Sõrmuste isanda fänn ning olete mõõku valmistanud ja müünud ​​kolm aastat (joonis 1). Kuvame müüki graafiliselt (joonis 2). Kolme aastaga on nõudlus kahekordistunud – äkki on see trend? Selle idee juurde tuleme veidi hiljem tagasi. Diagrammil on mitu tippu ja orgu, mis võib olla märk hooajalisusest. Eelkõige on tipud 12., 24. ja 36. kuul, mis juhtub olema detsembris. Aga võib-olla on see lihtsalt juhus? Uurime välja.

Lihtne eksponentsiaalne silumine

meetodid eksponentsiaalne silumine põhinevad tuleviku ennustamisel mineviku andmete põhjal, kus uuemad vaatlused kaaluvad rohkem kui vanemad. Selline kaalumine on võimalik tänu silumiskonstantidele. Esimest eksponentsiaalset silumise meetodit, mida proovime, nimetatakse lihtsaks eksponentsiaalseks silumiseks (PES). eksponentsiaalne silumine, SES). See kasutab ainult ühte silumiskonstanti.

Lihtne eksponentsiaalne silumine eeldab, et teie andmete aegridal on kaks komponenti: tase (või keskmine) ja selle väärtuse ümber mõni viga. Ei ole trendi ega hooajalisi kõikumisi – on lihtsalt tase, mille ümber nõudlus kõigub, mida ümbritsevad siin-seal väikesed vead. Eelistades uuemaid vaatlusi, võib TEC põhjustada sellel tasemel nihkeid. valemite keeles,

Nõudlus ajahetkel t = tase + juhuslik viga taseme lähedal ajahetkel t

Kuidas siis leida taseme ligikaudne väärtus? Kui aktsepteerime kõiki ajaväärtusi sama väärtusega, siis peaksime lihtsalt arvutama nende keskmise väärtuse. See on aga halb mõte. Rohkem tuleks kaaluda hiljutisi tähelepanekuid.

Loome mõned tasemed. Arvutage esimese aasta lähtetase:

tase 0 = keskmine nõudlus esimesel aastal (1.-12. kuud)

Mõõganõudluse puhul on see 163. 1. kuu nõudluse prognoosina kasutame taset 0 (163). 1. kuu nõudlus on 165, mis on 2 mõõka võrra 0 tasemest kõrgem. Tasub värskendada algtaseme lähendust. Lihtne eksponentsiaalse silumise võrrand:

tase 1 = tase 0 + mõni protsent × (nõudlus 1 - tase 0)

tase 2 = tase 1 + mõni protsent × (nõudlus 2 - tase 1)

Jne. "Mõnda protsenti" nimetatakse silumiskonstandiks ja seda tähistatakse alfaga. See võib olla mis tahes arv vahemikus 0 kuni 100% (0 kuni 1). Hiljem saate teada, kuidas alfa väärtust valida. AT üldine juhtum väärtus erinevatel ajahetkedel:

Tase praegune periood = tase eelmine periood +
alfa × (nõudlik jooksev periood – eelmise perioodi tase)

Tulevane nõudlus on võrdne viimase arvutatud tasemega (joonis 3). Kuna te ei tea, mis on alfa, määrake lahtriks C2 alustuseks 0,5. Pärast mudeli koostamist leidke selline alfa, et vea ruutude summa on E2 (või standardhälve– F2) olid minimaalsed. Selleks käivitage valik Lahenduse leidmine. Selleks minge menüüst läbi ANDMED –> Lahenduse leidmine ja seadke aknasse Lahenduse otsingu valikud nõutavad väärtused (joonis 4). Prognoosi tulemuste diagrammil kuvamiseks valige esmalt vahemik A6:B41 ja koostage lihtne joondiagramm. Järgmisena paremklõpsake diagrammil ja valige suvand Valige andmed. Looge avanevas aknas teine ​​rida ja sisestage sinna ennustused vahemikust A42:B53 (joonis 5).

Võib-olla on teil trend

Selle eelduse kontrollimiseks piisab, kui see sobib lineaarne regressioon nõudluse andmete all ja viige läbi selle trendijoone tõusu t-test (nagu ). Kui sirge kalle on nullist erinev ja statistiliselt oluline (Student'i testis, siis väärtus R alla 0,05), on andmetel trend (joonis 6).

Kasutasime funktsiooni LINEST, mis tagastab 10 kirjeldav statistika(kui te pole seda funktsiooni varem kasutanud, siis soovitan) ja INDEX funktsioon, mis võimaldab "välja tõmmata" ainult kolm vajalikku statistikat, mitte kogu komplekti. Selgus, et kalle on 2,54 ja see on märkimisväärne, kuna Studenti test näitas, et 0,000000012 on oluliselt väiksem kui 0,05. Niisiis, trend on olemas ja see tuleb prognoosi lisada.

Eksponentsiaalne Holti silumine trendikorrektsiooniga

Seda nimetatakse sageli topelteksponentsiaalseks silumiseks, kuna sellel on kaks silumisparameetrit, alfa, mitte üks. Kui ajajada on lineaarse trendiga, siis:

nõudlus ajas t = tase + t × trend + juhuslik kõrvalekalle tase ajahetkel t

Trendikorrektsiooniga Holti eksponentsiaalsel silumisel on kaks uut võrrandit, üks ajas edasi liikuva taseme jaoks ja teine ​​trendi jaoks. Taseme võrrand sisaldab silumisparameetrit alfa ja trendivõrrand sisaldab gammat. Uus tasemevõrrand näeb välja järgmine:

tase 1 = tase 0 + trend 0 + alfa × (nõudlus 1 – (tase 0 + trend 0))

pane tähele seda tase 0 + trend 0 on vaid üheastmeline prognoos algväärtustest kuuni 1, seega nõudlus 1 – (tase 0 + trend 0) on üheastmeline kõrvalekalle. Seega on põhitaseme lähendusvõrrand järgmine:

jooksva perioodi tase = eelmise perioodi tase + eelmise perioodi trend + alfa × (käesoleva perioodi nõudlus - (eelmise perioodi tase) + eelmise perioodi trend))

Trendi värskenduse võrrand:

trend praegune periood = trend eelmine periood + gamma × alfa × (nõudlik praegune periood – (eelmise perioodi tase) + eelmine periood))

Holt-silumine Excelis sarnaneb lihtsale silumisele (joonis 7) ja, nagu eespool, on eesmärk leida kaks koefitsienti, minimeerides samas ruuduvigade summa (joonis 8). Algse taseme ja trendiväärtuste (joonisel 7 lahtrites C5 ja D5) saamiseks koostage esimese 18 müügikuu diagramm ja lisage sellele trendijoon koos võrrandiga. Sisestage lahtritesse C5 ja D5 algne trendi väärtus 0,8369 ja algtase 155,88. Prognoosiandmeid saab esitada graafiliselt (joonis 9).

Riis. 7. Eksponentsiaalne Holti silumine trendi korrigeerimisega; Pildi suurendamiseks paremklõpsake sellel ja valige Ava pilt uuel vahelehel

Andmetes mustrite leidmine

Ennustava mudeli tugevuse testimiseks on võimalus - võrrelda vigu iseendaga, nihutatuna sammu (või mitme sammu võrra). Kui kõrvalekalded on juhuslikud, siis mudelit parandada ei saa. Nõudlusandmetes võib siiski olla hooajaline tegur. Vea mõistet, mis korreleerub oma versiooniga erineva perioodi jooksul, nimetatakse autokorrelatsiooniks (autokorrelatsiooni kohta vt lisateavet ). Autokorrelatsiooni arvutamiseks alustage iga perioodi prognoosivigade andmetega (viige joonisel 7 kujutatud veerg F üle joonise 10 veergu B). Järgmisena määrake keskmine viga prognoos (joonis 10, lahter B39; valem lahtris: =AVERAGE(B3:B38)). Arvutage veerus C prognoosivea kõrvalekalle keskmisest; valem lahtris C3: =B3-B$39. Järgmisena nihutage veergu C järjestikku veeru võrra paremale ja rea ​​võrra allapoole. Valemid lahtrites D39: =SUMTO($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Mida võib “sünkroonne liikumine” veeruga C tähendada ühe veeru D puhul: O. Näiteks kui veerud C ja D on sünkroonsed, siis ühes neist negatiivne arv peab teises olema negatiivne, ühes positiivne , positiivne sõbras. See tähendab, et kahe veeru korrutiste summa on märkimisväärne (erinevused kogunevad). Või, mis on sama, mida lähemal on väärtus vahemikus D41:O41 nullile, seda madalam on veeru korrelatsioon (vastavalt D kuni O) veeruga C (joonis 11).

Üks autokorrelatsioon on üle kriitilise väärtuse. Aasta nihutatud viga korreleerub iseendaga. See tähendab 12-kuulist hooajalist tsüklit. Ja see pole üllatav. Kui vaadata nõudluse graafikut (joonis 2), siis selgub, et nõudluse tipud on igal jõuluajal ja langused aprillis-mais. Kaaluge prognoosimistehnikat, mis võtab arvesse hooajalisust.

Mitmekordne eksponentsiaalne Holt-Wintersi silumine

Meetodit nimetatakse korrutamiseks (korrutamisest - korrutamiseks), kuna see kasutab hooajalisuse arvessevõtmiseks korrutamist:

Nõudlus ajahetkel t = (tase + t × trend) × hooajaline korrigeerimine ajal t × kõik järelejäänud ebaregulaarsed kohandused, mida me ei saa arvesse võtta

Holt-Wintersi silumist nimetatakse ka kolmekordseks eksponentsiaalseks silumiseks, kuna sellel on kolm silumisparameetrit (alfa, gamma ja delta hooajaline tegur). Näiteks kui on 12-kuuline hooajaline tsükkel:

Kuuprognoos 39 = (tase 36 + 3 × trend 36) x hooajalisus 27

Andmete analüüsimisel tuleb välja selgitada, milline on andmerea trend ja milline on hooajalisus. Arvutuste tegemiseks Holt-Wintersi meetodi abil peate:

  • Sujuvad ajaloolised andmed libiseva keskmise meetodi abil.
  • Võrrelge aegrea silutud versiooni originaaliga, et saada hooajalisuse ligikaudne hinnang.
  • Hankige uusi andmeid ilma hooajalise komponendita.
  • Leidke nende uute andmete põhjal ligikaudsed tasemed ja trendid.

Alustage algandmetega (veerud A ja B joonisel 12) ning lisage veerg C, kus on liikuval keskmisel põhinevad silutud väärtused. Kuna hooajalisusel on 12-kuulised tsüklid, on mõttekas kasutada 12-kuulist keskmist. Selle keskmisega on väike probleem. 12 on paarisarv. Kui tasandada 7. kuu nõudlust, kas seda tuleks pidada keskmiseks nõudluseks kuudest 1 kuni 12 või kuuni 2 kuni 13? Selle raskusega toimetulemiseks peame nõudluse tasandamiseks kasutama "libisevat keskmist 2x12". See tähendab, et võtke pool kahest keskmisest kuudest 1 kuni 12 ja 2 kuni 13. Lahtris C8 olev valem on: =(KESKMINE(B3:B14)+KESKMINE(B2:B13))/2.

Silutud andmeid 1.–6. ja 31.–36. kuude kohta ei saa, kuna eelnevaid ja järgnevaid perioode pole piisavalt. Selguse huvides võib algsed ja silutud andmed näidata diagrammil (joonis 13).

Nüüd jagage veerus D algne väärtus silutud väärtusega, et saada hinnanguline hooajaline korrigeerimine (veerg D joonisel 12). Valem lahtris D8: =B8/C8. Pange tähele, et 12. ja 24. kuul (detsember) on tavapärasest nõudlusest 20% kõrgemaid hüppeid, samal ajal kui kevadel on langusi. See silumistehnika on andnud teile kaks punkthinnangud iga kuu kohta (kokku 24 kuud). Veerg E on nende kahe teguri keskmine. Lahtris E1 olev valem on: =KESKMINE(D14,D26). Selguse huvides võib hooajaliste kõikumiste taseme esitada graafiliselt (joonis 14).

Nüüd saate andmeid kohandada hooajalised kõikumised. Valem lahtris G1: =B2/E2. Koostage veeru G andmete põhjal graafik, täiendage seda trendijoonega, kuvage diagrammil trendi võrrand (joonis 15) ja kasutage koefitsiente järgmistes arvutustes.

vormi uus leht, nagu on näidatud joonisel fig. 16. Asendage väärtused vahemikus E5:E16 jooniselt fig. 12 ala E2:E13. Võtke C16 ja D16 väärtused trendijoone võrrandist joonisel fig. 15. Seadke silumiskonstantide väärtused algama umbes 0,5-st. Laiendage rea 17 väärtusi vahemikus 1 kuni 36 kuud. Käivitage Lahenduse leidmine silumiskoefitsientide optimeerimiseks (joon. 18). Valem lahtris B53: =(C$52+(A53-A$52)*D$52)*E41.

Nüüd tehtud prognoosis peate kontrollima autokorrelatsioone (joonis 18). Kuna kõik väärtused asuvad ülemise ja alumise piiri vahel, saate aru, et mudel tegi nõudlusväärtuste struktuuri mõistmisel head tööd.

Prognoosi usaldusvahemiku loomine

Seega on meil üsna toimiv prognoos. Kuidas määrata ülemine ja alumine piir, mida saab kasutada realistlike oletuste tegemiseks? Selles aitab teid Monte Carlo simulatsioon, mida olete juba kohanud (vt ka ). Eesmärk on luua nõudluse käitumise tulevikustsenaariumid ja määrata rühm, kuhu 95% neist langeb.

Eemalda lehelt Exceli prognoos rakkudest B53:B64 (vt joonis 17). Sinna kirjutad nõudluse simulatsiooni põhjal. Viimase saab genereerida funktsiooni NORMINV abil. Järgmiste kuude jaoks peate lihtsalt esitama selle keskmise (0), standardjaotuse (10,37 lahtrist $H$2) ja juhuslik arv 0 kuni 1. Funktsioon tagastab hälbe tõenäosusega, mis vastab kella kõverale. Pange lahtrisse G53 üheastmelise vea simulatsioon: =NORMINV(RAND();0;H$2). Selle valemi venitamine kuni G64-ni annab teile 12-kuulise üheastmelise prognoosi prognoosivea simulatsiooni (joonis 19). Teie simulatsiooni väärtused erinevad joonisel näidatud väärtustest (sellepärast on see simulatsioon!).

Forecast Error abil on teil kõik, mida vajate taseme, trendi ja hooajalise teguri värskendamiseks. Seega valige lahtrid C52:F52 ja venitage need reale 64. Selle tulemusena on teil simuleeritud prognoosiviga ja prognoos ise. Kui vastupidi, on võimalik ennustada nõudluse väärtusi. Sisestage valem lahtrisse B53: =F53+G53 ja venitage see kuni B64 (joonis 20, vahemik B53:F64). Nüüd saate iga kord prognoosi värskendamiseks vajutada nuppu F9. Asetage 1000 simulatsiooni tulemused lahtritesse A71:L1070, transponeerides iga kord väärtused vahemikust B53:B64 vahemikku A71:L71, A72:L72, ... A1070:L1070. Kui see teid häirib, kirjutage VBA kood.

Nüüd on teil iga kuu jaoks 1000 stsenaariumi ja saate kasutada funktsiooni PROTSENTIIL, et saada ülemine ja alumine piir 95% usaldusvahemiku keskel. Lahtris A66 on valem: =PROTSENTSIIL(A71:A1070,0,975) ja lahtris A67: =PROTSENTSIIL(A71:A1070,0,025).

Nagu tavaliselt, võib selguse huvides andmed esitada graafiline vorm(joonis 21).

Diagrammil on kaks huvitavat punkti:

  • Veapiir suureneb aja jooksul. See on loogiline. Ebakindlus koguneb iga kuu.
  • Samamoodi suureneb viga osades, mis langevad hooajalise nõudluse kasvu perioodidele. Selle järgneva kukkumisega viga väheneb.

Põhineb materjalil John Foremani raamatust. – M.: Kirjastus Alpina, 2016. – S. 329–381

Liikuv keskmine võimaldab teil andmeid täiuslikult siluda. Kuid selle peamine puudus on see, et igal lähteandmete väärtusel on selle jaoks sama kaal. Näiteks kuuenädalast perioodi kasutava libiseva keskmise puhul antakse iga nädala igale väärtusele 1/6 kaalust. Mõne kogutud statistika puhul on uuematel väärtustel suurem kaal. Seetõttu kasutatakse kõige värskematele andmetele suurema kaalu andmiseks eksponentsiaalset silumist. Seega on see statistiline probleem lahendatud.

Eksponentsiaalse silumismeetodi arvutamise valem Excelis

Alloleval joonisel on näha konkreetse toote nõudlusaruanne 26 nädala kohta. Veerg Nõudlus sisaldab teavet müüdud kaubakoguste kohta. Veerus "Prognoos" - valem:

Veerg "Liikuv keskmine" määratleb prognoositava nõudluse, mis arvutatakse tavapärase libiseva keskmise arvutuse abil 6-nädalase perioodiga:

Viimases veerus "Prognoos" rakendatakse ülalkirjeldatud valemiga andmete eksponentsiaalse silumise meetodit, milles viimaste nädalate väärtustel on suurem kaal kui eelmistel.

Koefitsient "Alpha:" sisestatakse lahtrisse G1, see tähendab kõige värskematele andmetele omistamise kaalu. AT see näide selle väärtus on 30%. Ülejäänud 70% kaalust jaotatakse ülejäänud andmetele. See tähendab, et teise asjakohasuse väärtuse (paremalt vasakule) kaal on 30% ülejäänud 70% kaalust - see on 21%, kolmanda väärtuse kaal on 30% ülejäänud osast. 70% massist - 14,7% ja nii edasi.



Eksponentsiaalne silumisgraafik

Alloleval joonisel on näidatud nõudluse graafik, liikuv keskmine ja eksponentsiaalse silumise prognoos, mis on koostatud algsete väärtuste alusel:


Pange tähele, et eksponentsiaalse silumise prognoos reageerib nõudluse muutustele paremini kui libiseva keskmise joon.

Järjestikuste eelmiste nädalate andmed korrutatakse alfakoefitsiendiga ja tulemus liidetakse ülejäänud kaaluprotsendile, mis on korrutatud eelmise prognoositud väärtusega.

9 5. Eksponentsiaalse silumise meetod. Silumiskonstandi valimine

Meetodi kasutamisel vähimruudud ennustava trendi (trendi) määramiseks eeldatakse eelnevalt, et kõik retrospektiivsed andmed (vaatlused) on sama infosisuga. Ilmselgelt oleks loogilisem võtta arvesse allahindlusprotsessi taustainfo st nende andmete erinevus prognoosi koostamiseks. See saavutatakse eksponentsiaalse silumise meetodil, andes aegrea viimastele vaatlustele (st vahetult prognoositavale perioodile eelnevatele väärtustele) esialgsete vaatlustega võrreldes olulisemad "kaalud". Eksponentsiaalse silumise meetodi eeliste hulka peaks kuuluma ka arvutustoimingute lihtsus ja erinevate protsesside dünaamika kirjeldamise paindlikkus. Meetod on leidnud suurima rakenduse keskpika perioodi prognooside rakendamisel.

5.1. Eksponentsiaalse silumise meetodi olemus

Meetodi olemus seisneb selles dünaamiline seeria on silutud kaalutud "libiseva keskmisega", milles kaalud järgivad eksponentsiaalset seadust. Teisisõnu, mida kaugemal aegrea lõpust on punkt, mille kohta kaalutud libisev keskmine arvutatakse, seda vähem "osalemist kulub" prognoosi väljatöötamisel.

Esialgne dünaamiline jada koosneb tasanditest (seeria komponentidest) y t , t = 1 , 2 ,...,n . Selle seeria iga m järjestikuse taseme kohta

(m

dünaamiline seeria, mille samm on võrdne ühega. Kui m on paaritu arv ja eelistatav on võtta paaritu arv tasemeid, kuna sel juhul on arvutatud taseme väärtus silumisvahemiku keskel ja tegelik väärtus on sellega lihtne asendada, siis Liikuva keskmise määramiseks saab kirjutada järgmise valemi:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t-ξ

i= t-ξ

2ξ + 1

kus y t on liikuva keskmise väärtus hetkel t (t = 1 , 2 ,...,n ), y i on taseme tegelik väärtus hetkel i ;

i on tasandusvahemiku taseme järgarv.

ξ väärtus määratakse silumisintervalli kestuse järgi.

Niivõrd kui

m =2 ξ +1

siis paaritu m puhul

ξ = m 2 − 1.

Liikuva keskmise arvutamist suure hulga tasemete jaoks saab lihtsustada, määrates rekursiivselt libiseva keskmise järjestikused väärtused:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Kuid arvestades asjaolu, et viimastele vaatlustele tuleb anda rohkem "kaalu", tuleb libisevat keskmist tõlgendada teisiti. See seisneb selles, et keskmistamisega saadud väärtus asendab mitte keskmistamisvahemiku keskmist, vaid selle viimast liiget. Vastavalt sellele saab viimase avaldise ümber kirjutada kujul

Mi = Mi + 1

y i− y i− m

Siin tähistatakse intervalli lõpuga seotud liikuvat keskmist uue sümboliga M i . Sisuliselt on M i võrdne y t nihutatud ξ sammu võrra paremale, st M i = y t + ξ , kus i = t + ξ .

Arvestades, et M i − 1 on y i − m hinnang, avaldis (5.1)

saab vormis ümber kirjutada

y i+ 1

M i - 1,

M i defineeritud avaldisega (5.1).

kus M i on hinnang

Kui arvutusi (5.2) korratakse uue teabe saabudes

ja kirjutage ümber teisel kujul, siis saame silutud vaatlusfunktsiooni:

Q i= α y i+ (1 − α ) Q i − 1,

või samaväärsel kujul

Q t= α y t+ (1 − α ) Q t− 1

Avaldise (5.3) abil tehtud arvutusi iga uue vaatlusega nimetatakse eksponentsiaalseks silumiseks. Viimases avaldises kasutatakse eksponentsiaalse silumise eristamiseks liikuvast keskmisest M asemel tähistus Q. Väärtus α , mis on

m 1 analoogi nimetatakse silumiskonstandiks. α väärtused asuvad

intervall [0, 1]. Kui α on esitatud seeriana

α + α(1 - α) + α(1 - α) 2 + α(1 - α) 3 + ... + α(1 - α) n ,

on lihtne näha, et "kaalud" vähenevad ajas plahvatuslikult. Näiteks α = 0 korral saame 2

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Seeriate summa kipub ühtlustuma ja summa liikmed aja jooksul vähenevad.

Q t väärtus avaldises (5.3) on esimest järku eksponentsiaalne keskmine, st keskmine, mis saadakse otse

vaatlusandmete silumine (esmane silumine). Mõnikord on statistiliste mudelite väljatöötamisel kasulik kasutada kõrgemate järkude eksponentsiaalseid keskmisi, st korduva eksponentsiaalse silumisega saadud keskmisi.

Järjekorra k eksponentsiaalse keskmise rekursiivsel kujul olev üldtähistus on

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

K väärtus varieerub vahemikus 1, 2, …, p ,p+1 , kus p on ennustava polünoomi järjekord (lineaarne, ruutsuurus jne).

Selle valemi alusel esimese, teise ja kolmanda järgu eksponentsiaalse keskmise jaoks avaldised

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Ennustava mudeli parameetrite määramine eksponentsiaalse silumise meetodil

Ilmselgelt on dünaamilistel seeriatel põhinevate ennustavate väärtuste väljatöötamiseks eksponentsiaalse silumise meetodil vaja arvutada trendi võrrandi koefitsiendid eksponentsiaalsete keskmiste kaudu. Koefitsientide hinnangud määratakse Brown-Meyeri põhiteoreemiga, mis seob ennustava polünoomi koefitsiendid vastavate järkude eksponentsiaalsete keskmiste väärtustega:

(− 1 )

aˆp

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑j

p=0

p! (k−1) !j = 0

kus aˆ p on p astme polünoomi kordajate hinnangud.

Koefitsiendid leitakse võrrandisüsteemi (p + 1 ) lahendamisel сp + 1

teadmata.

Niisiis, lineaarse mudeli jaoks

aˆ 0 = 2 Q t (1 ) − Q t (2 ) ; aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

ruutmudeli jaoks

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Prognoos realiseeritakse vastavalt valitud polünoomile lineaarse mudeli jaoks

ˆyt + τ = aˆ0 + aˆ1 τ ;

ruutmudeli jaoks

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2,

kus τ on ennustamise samm.

Tuleb märkida, et eksponentsiaalseid keskmisi Q t (k ) saab arvutada ainult teadaoleva (valitud) parameetriga, teades algtingimusi Q 0 (k ) .

Algtingimuste hinnangud, eelkõige lineaarse mudeli puhul

Q(1)= a

1 − α

Q(2 ) = a − 2 (1 − α ) a

ruutmudeli jaoks

Q(1)= a

1 − α

+ (1 − α )(2 − α ) a

2(1−α )

(1− α )(3− 2α )

Q 0(2) = a 0−

2α 2

Q(3)=a

3(1−α )

(1 − α )(4 − 3 α ) a

kus koefitsiendid a 0 ja a 1 arvutatakse vähimruutude meetodil.

Silumisparameetri α väärtus arvutatakse ligikaudselt valemiga

α ≈ m 2 + 1,

kus m on vaatluste (väärtuste) arv silumisvahemikus. Ennustavate väärtuste arvutamise järjekord on näidatud

Rea koefitsientide arvutamine vähimruutude meetodil

Silumisintervalli määramine

Silumiskonstandi arvutamine

Algtingimuste arvutamine

Eksponentkeskmiste arvutamine

Hinnangute arvutamine a 0 , a 1 jne.

Sarja prognoosiväärtuste arvutamine

Riis. 5.1. Prognoositavate väärtuste arvutamise järjekord

Vaatleme näiteks toote tööaja prognoositava väärtuse saamise protseduuri, mida väljendatakse tõrgete vahelise aja järgi.

Esialgsed andmed on kokku võetud tabelis. 5.1.

Valime lineaarse prognoosimudeli kujul y t = a 0 + a 1 τ

Lahendus on teostatav järgmiste algväärtustega:

a 0, 0 = 64, 2; a 1, 0 = 31,5; α = 0,305.

Tabel 5.1. Esialgsed andmed

Vaatluse number, t

Sammu pikkus, ennustus, τ

MTBF, y (tund)

Nende väärtuste jaoks arvutatakse "silutud" koefitsiendid

y 2 väärtused on võrdsed

= α Q (1 ) − Q (2 ) = 97, 9;

[ Q (1 ) − Q (2 )

31, 9 ,

1-α

esialgsetel tingimustel

1 − α

A 0 , 0 −

a 1, 0

= −7 , 6

1 − α

= −79 , 4

ja eksponentsiaalsed keskmised

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

K(2)

= α Q (1 )

+ (1 −α ) Q (2 ) = −47 , 5 .

Seejärel arvutatakse valemiga silutud väärtus y 2

Q i (1)

Q i (2)

a 0,i

a 1, i

ˆyt

Seega (tabel 5.2) on lineaarsel ennustusmudelil vorm

ˆy t + τ = 224,5+ 32τ .

Arvutagem eeldatavad väärtused 2-aastase (τ = 1), 4-aastase (τ = 2) ja nii edasi, toote rikete vahelise aja (tabel 5.3).

Tabel 5.3. Prognoosi väärtusedˆy t

Võrrand

t+2

t+4

t+6

t+8

t+20

regressioon

(τ = 1)

(τ=2)

(τ = 3)

(τ=5)

τ =

ˆy t = 224,5+ 32τ

Tuleb märkida, et aegrea viimaste m väärtuste kogu "kaalu" saab arvutada valemiga

c = 1 − (m (− 1 ) m ) . m+1

Seega on seeria kahe viimase vaatluse (m = 2) puhul väärtus c = 1 − (2 2 − + 1 1 ) 2 = 0. 667 .

5.3. Algtingimuste valik ja silumiskonstandi määramine

Nagu väljendist järeldub

Q t = α y t+ (1 - α ) Q t - 1,

eksponentsiaalse silumise teostamisel on vaja teada silutud funktsiooni alg (eelmist) väärtust. Mõnel juhul võib algväärtuseks võtta esimese vaatluse, sagedamini määratakse algtingimused avaldiste (5.4) ja (5.5) järgi. Sel juhul on väärtused a 0, 0, a 1, 0

ja a 2 , 0 määratakse vähimruutude meetodil.

Kui me valitud algväärtust väga ei usalda, siis võttes läbi k vaatluse silumiskonstandi α suure väärtuse, toome

algväärtuse "kaal" kuni väärtuseni (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Seega kaasneb silumiskonstandi (või libiseva keskmise vaatluste arvu) valikuga kompromiss. Tavaliselt, nagu praktika näitab, on silumiskonstandi väärtus vahemikus 0,01 kuni 0,3.

On teada mitmeid üleminekuid, mis võimaldavad leida ligikaudse hinnangu α . Esimene tuleneb tingimusest, et liikuv keskmine ja eksponentsiaalne keskmine on võrdsed

α \u003d m 2 + 1,

kus m on vaatluste arv silumisvahemikus. Muud lähenemisviisid on seotud prognoosi täpsusega.

Seega on Meyeri seose põhjal võimalik määrata α:

α ≈ S y ,

kus S y on mudeli standardviga;

S 1 on algseeria keskmine ruutviga.

Viimase suhte kasutamise teeb aga keeruliseks asjaolu, et S y ja S 1 on alginfo põhjal väga raske usaldusväärselt määrata.

Sageli silumisparameeter ja samal ajal koefitsiendid a 0 , 0 ja a 0 , 1

valitakse sõltuvalt kriteeriumist optimaalseks

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j=0

lahendades algebralise võrrandisüsteemi, mis saadakse tuletisi võrdsustades nulliga

∂S2

∂S2

∂S2

∂a0, 0

∂ a 1, 0

∂a2, 0

Seega on lineaarse prognoosimudeli puhul esialgne kriteerium võrdne

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0, 0 − a1, 0 τ] 2 → min.

j=0

Selle süsteemi lahendamine arvuti abil ei valmista raskusi.

Mõistlikuks α valikuks võite kasutada ka üldistatud silumisprotseduuri, mis võimaldab saada järgmised seosed prognoosi dispersiooni ja lineaarse mudeli silumisparameetri kohta:

S p 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

ruutmudeli jaoks

S p 2≈ [ 2 α + 3 α 3 + 3 α 2τ ] S y 2,

kus β = 1 α ;Sy– esialgse dünaamilise jada RMS-lähendus.

Teema 3. Aegridade silumine ja prognoosimine trendimudelite alusel

eesmärk selle teema uurimine on baasaluse loomine juhtide koolitamiseks erialal 080507 erinevate majandusvaldkonna ülesannete mudelite ehitamise alal, süstemaatilise lähenemise kujundamine prognoosiprobleemide püstitamisel ja lahendamisel üliõpilaste seas. . Kavandatav kursus võimaldab spetsialistidel kiiresti kohaneda praktilise tööga, paremini orienteeruda oma eriala teadus- ja tehnikainfos ja kirjanduses ning teha töös ettetulevaid otsuseid enesekindlamalt.

Peamine ülesandeid Teemaõpe on: üliõpilased, kes omandavad süvendatud teoreetilised teadmised prognoosimudelite rakendamisest, omandavad stabiilsed oskused uurimistöö tegemisel, oskus lahendada keerukaid ehitusmudelitega seotud teaduslikke probleeme, sh mitmedimensioonilisi, oskus loogiliselt analüüsida mudelit. saadud tulemusi ja leida viise vastuvõetavate lahenduste leidmiseks.

Üsna lihtne meetod arengutrendide tuvastamiseks on aegridade silumine, st tegelike tasemete asendamine arvestuslikega, mille kõikumised on algandmetest väiksemad. Nimetatakse vastavat teisendust filtreerimine. Vaatleme mitut silumismeetodit.

3.1. lihtsad keskmised

Silumise eesmärk on koostada varasemate vaatluste põhjal prognoosimudel tulevasteks perioodideks. Lihtsate keskmiste meetodil võetakse algandmeteks muutuja väärtused Y ajahetkedel t ja prognoositav väärtus määratakse järgmise ajaperioodi lihtsa keskmisena. Arvutusvalemil on vorm

kus n on vaatluste arv.

Uue vaatluse ilmnemisel tuleks järgmise perioodi prognoosimisel arvesse võtta ka värskelt saadud prognoosi. Selle meetodi kasutamisel toimub prognoos kõigi varasemate andmete keskmistamisega, kuid sellise prognoosimise miinuseks on selle kasutamise keerukus trendimudelites.

3.2. Liikuva keskmise meetod

See meetod põhineb seeria esitamisel üsna sujuva trendi ja juhusliku komponendi summana. Meetod põhineb ideel arvutada teoreetiline väärtus kohaliku lähenduse alusel. Trendihinnangu koostamiseks teatud punktis t seeria väärtuste järgi ajavahemikust arvutada seeria teoreetiline väärtus. Silumisseeriate praktikas on kõige levinum juhtum, kui kõik intervalli elementide kaalud on üksteisega võrdsed. Sel põhjusel nimetatakse seda meetodit liikuva keskmise meetod, kuna protseduuri teostamisel on aken laiusega (2 m + 1) kogu reas. Akna laiust peetakse tavaliselt paarituks, kuna teoreetiline väärtus arvutatakse keskväärtuse jaoks: terminite arv k = 2m + 1 sama arvu tasemetega hetkel vasakule ja paremale t.

Liikuva keskmise arvutamise valem on sel juhul järgmine:

Liikuva keskmise dispersioon on määratletud kui σ 2/k, kust läbi σ2 tähistab seeria algtingimuste dispersiooni ja k— silumisintervall, seega mida suurem on silumisvahemik, seda tugevam on andmete keskmistamine ja seda vähem muutlik on tuvastatud trend. Kõige sagedamini tehakse silumine kolme, viie ja seitsme algseeria liikme puhul. Sel juhul tuleks arvesse võtta järgmisi liikuva keskmise tunnuseid: kui arvestada püsiva pikkusega perioodiliste kõikumiste jada, siis libiseva keskmise alusel silumisel silumisintervalliga, mis on võrdne perioodiga või selle kordne. , on kõikumised täielikult kõrvaldatud. Tihtipeale muudab libiseval keskmisel põhinev silumine seeriat nii tugevasti ümber, et tuvastatud arengutrend ilmneb vaid kõige üldisemalt, samas kui väiksemad, kuid analüüsi jaoks olulised detailid (lained, kurvid jne) kaovad; pärast silumist võivad väikesed lained mõnikord muuta suunda vastupidiseks - "tippude" asemele ilmuvad "süvendid" ja vastupidi. Kõik see nõuab ettevaatust lihtsa libiseva keskmise kasutamisel ja sunnib otsima peenemaid kirjeldamismeetodeid.

Liikuva keskmise meetod ei anna esimese ja viimase jaoks trendiväärtusi m rea liikmed. See puudus on eriti märgatav juhul, kui rea pikkus on väike.

3.3. Eksponentsiaalne silumine

Eksponentsiaalne keskmine y t on näide asümmeetrilisest kaalutud libisevast keskmisest, mis võtab arvesse andmete vananemise astet: "vanem" teave väiksema kaaluga sisestatakse valemisse, et arvutada seeria taseme tasandatud väärtus

Siin — eksponentsiaalne keskmine, mis asendab seeria vaadeldava väärtuse y t(silumine hõlmab kõiki praeguse hetkeni saadud andmeid t), α on silumisparameeter, mis iseloomustab jooksva (uusima) vaatluse kaalu; 0< α <1.

Meetodit kasutatakse mittestatsionaarsete aegridade ennustamiseks juhuslike taseme ja kalde muutustega. Kui liigume praegusest ajahetkest minevikku, väheneb seeria vastava liikme kaal kiiresti (eksponentsiaalselt) ja praktiliselt lakkab avaldamast mingit mõju väärtusele.

On lihtne näha, et viimane seos võimaldab anda eksponentsiaalsele keskmisele järgmise tõlgenduse: kui — seeria väärtuse ennustamine y t, siis on erinevus prognoosiviga. Seega ennustus järgmiseks ajahetkeks t+1 võtab arvesse seda, mis hetkel teatavaks sai t prognoosi viga.

Silumisvõimalus α on kaalutegur. Kui α ühtsusele lähedane, siis arvestab prognoos oluliselt viimase prognoosi vea suurusjärku. Väikeste väärtuste jaoks α prognoositav väärtus on lähedane eelmisele prognoosile. Silumisparameetri valik on üsna keeruline probleem. Üldised kaalutlused on järgmised: meetod on hea piisavalt sujuvate seeriate ennustamiseks. Sel juhul saab silumiskonstandi valida, minimeerides seeria viimasest kolmandikust hinnanguliselt ühe sammu ette ennustusvea. Mõned eksperdid ei soovita kasutada silumisparameetri suuri väärtusi. Joonisel fig. 3.1 on näide silutud seeriast, mis kasutab eksponentsiaalset silumise meetodit α= 0,1.

Riis. 3.1. Eksponentsiaalse silumise tulemus at α =0,1
(1 - algne rida; 2 - silutud rida; 3 - jäägid)

3.4. Eksponentsiaalne silumine
trendipõhine (Holti meetod)

See meetod võtab arvesse aegreas esinevat kohalikku lineaarset trendi. Kui aegreas on tõusutrend, siis koos hetketaseme hinnanguga on vajalik ka kalde hinnang. Holti tehnikas tasandatakse taseme ja kalde väärtused otse, kasutades iga parameetri jaoks erinevaid konstante. Silumiskonstandid võimaldavad hinnata hetketaset ja kallet, täpsustades neid iga kord, kui tehakse uusi vaatlusi.

Holti meetod kasutab kolme arvutusvalemit:

  1. Eksponentsiaalselt silutud seeria (praegune taseme hinnang)

(3.2)

  1. Trendide hindamine

(3.3)

  1. Prognoos jaoks R perioodid ees

(3.4)

kus α, β on silumiskonstandid vahemikust .

Võrrand (3.2) on lihtsa eksponentsiaalse silumise jaoks sarnane võrrandiga (3.1), välja arvatud trendi liige. Püsiv β trendihinnangu tasandamiseks. Prognoosvõrrandis (3.3) korrutatakse trendihinnang perioodide arvuga R, millel prognoos põhineb, ja seejärel lisatakse see toode praegusele silutud andmete tasemele.

Alaline α ja β valitakse subjektiivselt või ennustusviga minimeerides. Mida suuremad kaalude väärtused võetakse, seda kiiremini reageeritakse käimasolevatele muudatustele ja andmed ühtlustuvad. Väiksemad kaalud muudavad silutud väärtuste struktuuri vähem tasaseks.

Joonisel fig. 3.2 on näide seeria silumisest, kasutades väärtuste jaoks Holti meetodit α ja β võrdne 0,1-ga.

Riis. 3.2. Holt silumine tulemus
juures α = 0,1 ja β = 0,1

3.5. Eksponentsiaalne silumine trendide ja hooajaliste variatsioonidega (talvemeetod)

Kui andmestruktuuris esineb hooajalisi kõikumisi, kasutatakse prognoosivigade vähendamiseks Wintersi pakutud kolmeparameetrilist eksponentsiaalset silumismudelit. See lähenemine on eelmise Holti mudeli laiendus. Hooajaliste kõikumiste arvessevõtmiseks kasutatakse siin täiendavat võrrandit ja seda meetodit kirjeldatakse täielikult nelja võrrandiga:

  1. Eksponentsiaalselt silutud seeria

(3.5)

  1. Trendide hindamine

(3.6)

  1. Hooajalisuse hindamine

.

(3.7)

  1. Prognoos jaoks R perioodid ees

(3.8)

kus α, β, γ — pidev tasandamine vastavalt tasemele, trendile ja hooajalisusele; s- hooajalise kõikumise perioodi kestus.

Võrrand (3.5) parandab silutud seeriat. Selles võrrandis võtab termin arvesse algandmete hooajalisust. Pärast hooajalisuse ja trendi arvestamist võrrandites (3.6), (3.7) silutakse hinnanguid ja koostatakse prognoos võrrandis (3.8).

Nii nagu eelmise meetodi puhul, kaalud α, β, γ saab valida subjektiivselt või ennustusviga minimeerides. Enne võrrandi (3.5) rakendamist on vaja kindlaks määrata silutud seeria algväärtused L t, trend T t, hooajalisuse koefitsiendid S t. Tavaliselt võetakse silutud seeria algväärtus võrdseks esimese vaatlusega, siis on trend null ja hooajalised koefitsiendid seatakse võrdseks ühega.

Joonisel fig. 3.3 on näide seeria silumisest Wintersi meetodil.

Riis. 3.3. Wintersi meetodil silumise tulemus
juures α = 0,1 = 0,1; γ = 0,1(1 - algne rida; 2 - silutud rida; 3 - jäägid)

3.6. Trendimudelite põhjal prognoosimine

Üsna sageli on aegridadel lineaarne trend (trend). Eeldades lineaarset trendi, peate koostama sirgjoone, mis kajastaks kõige täpsemalt dünaamika muutust vaadeldaval perioodil. Sirge konstrueerimiseks on mitu meetodit, kuid formaalsest vaatenurgast on kõige objektiivsem konstruktsioon, mis põhineb seeria algväärtuste negatiivsete ja positiivsete kõrvalekallete summa minimeerimisel sirgjoonest.

Sirge kahe koordinaadi süsteemis (x, y) saab määratleda ühe koordinaadi lõikepunktina juures ja kaldenurk telje suhtes X. Sellise sirgjoone võrrand näeb välja selline kus a- ristumispunkt; b- kaldenurk.

Selleks, et sirgjoon peegeldaks dünaamika kulgu, on vaja minimeerida vertikaalhälvete summa. Kui kasutada minimeerimise hindamise kriteeriumina hälbete lihtsat summat, siis tulemus ei ole kuigi hea, kuna negatiivsed ja positiivsed kõrvalekalded tühistavad teineteist. Absoluutväärtuste summa minimeerimine ei anna samuti rahuldavaid tulemusi, kuna antud juhul on parameetrite hinnangud ebastabiilsed, on ka arvutusraskusi sellise hindamisprotseduuri rakendamisel. Seetõttu on kõige sagedamini kasutatav protseduur hälvete ruudu summa minimeerimine või vähimruutude meetod(MNK).

Kuna algväärtuste seerias on kõikumised, sisaldab seeria mudel vigu, mille ruudud tuleb minimeerida

kus y i on vaadeldav väärtus; y i * on mudeli teoreetilised väärtused; - vaatlusnumber.

Algse aegrea trendi modelleerimisel lineaarse trendi abil eeldame seda

Esimese võrrandi jagamine arvuga n, jõuame järgmisele

Saadud avaldise asendamine koefitsiendiga süsteemi (3.10) teise võrrandiga b* saame:

3.7. Mudeli sobivuse kontroll

Näiteks joonisel fig. 3.4 näitab auto võimsuse vahelise lineaarse regressiooni graafikut X ja selle maksumus juures.

Riis. 3.4. Lineaarse regressiooni graafik

Selle juhtumi võrrand on järgmine: juures=1455,3 + 13,4 X. Selle joonise visuaalne analüüs näitab, et mitmete vaatluste puhul esineb teoreetilisest kõverast olulisi kõrvalekaldeid. Jääkgraafik on näidatud joonisel fig. 3.5.

Riis. 3.5. Jääkide tabel

Regressioonijoone jääkide analüüs võib anda kasuliku mõõdiku selle kohta, kui hästi hinnanguline regressioon tegelikke andmeid peegeldab. Hea regressioon on selline, mis selgitab märkimisväärset dispersiooni ja vastupidi, halb regressioon ei jälgi algandmete suurt kõikumist. On intuitiivselt selge, et igasugune lisateave parandab mudelit, st vähendab muutuja variatsiooni seletamatut osa juures. Regressiooni analüüsimiseks jagame dispersiooni komponentideks. See on ilmne

Viimane liige on võrdne nulliga, kuna see on jääkide summa, seega saame järgmise tulemuse

kus SS0, SS1, SS2 määrata vastavalt ruutude kogu-, regressiooni- ja jääksummad.

Ruudude regressioonisumma mõõdab lineaarse seosega seletatavat dispersiooni osa; jääk - dispersiooni osa, mida ei seletata lineaarse sõltuvusega.

Igaüht neist summadest iseloomustab vastav vabadusastmete arv (HR), mis määrab üksteisest sõltumatute andmeühikute arvu. Teisisõnu on pulss seotud vaatluste arvuga n ja nende parameetrite koguarvust arvutatud parameetrite arv. Vaadeldaval juhul arvutada SS0 määratakse ainult üks konstant (keskmine väärtus), seega südame löögisagedus SS0 saab (n1), pulsisageduse jaoks SS 2 – (n – 2) ja pulsisageduse jaoks SS 1 saab n - (n - 1) = 1, kuna regressioonivõrrandis on n - 1 konstantset punkti. Nii nagu ruutude summad, on ka südamelöögid seotud

Dispersiooni dekomponeerimisega seotud ruutude summad koos vastavate pulsisagedustega saab paigutada nn dispersioonanalüüsi tabelisse (ANOVA tabel – ANalysis Of Variance) (Tabel 3.1).

Tabel 3.1

ANOVA tabel

Allikas

Ruudude summa

Keskmine ruut

Regressioon

SS2/ (n-2)

Kasutades ruutude summade jaoks kasutusele võetud lühendit, defineerime määramiskoefitsient ruutude regressioonisumma ja ruutude kogusumma suhtena as

(3.13)

Determinatsioonikordaja mõõdab muutuja varieeruvuse osakaalu Y, mida saab selgitada sõltumatu muutuja varieeruvuse teabe abil x. Määramiskoefitsient muutub nullist, kui X ei mõjuta jahühele, kui muutus Y muudatusega täielikult seletatav x.

3.8. Regressiooniprognoosi mudel

Parim ennustus on väikseima dispersiooniga ennustus. Meie puhul annavad tavapärased vähimruutud parima prognoosi kõigist meetoditest, mis annavad lineaarsetel võrranditel põhinevaid erapooletuid hinnanguid. Prognoosimise protseduuriga seotud prognoosiviga võib pärineda neljast allikast.

Esiteks tagab lineaarse regressiooniga käsitletavate aditiivsete vigade juhuslikkus selle, et prognoos kaldub tegelikest väärtustest kõrvale, isegi kui mudel on õigesti määratud ja selle parameetrid on täpselt teada.

Teiseks toob hindamisprotsess ise parameetrite hindamisel sisse vea - need võivad harva olla võrdsed tegelike väärtustega, kuigi keskmiselt on nad nendega võrdsed.

Kolmandaks, tingimusliku prognoosi puhul (sõltumatute muutujate täpsete väärtuste teadmata korral) sisestatakse viga koos selgitavate muutujate prognoosiga.

Neljandaks võib viga ilmneda, kuna mudeli spetsifikatsioon on ebatäpne.

Selle tulemusena saab veaallikaid klassifitseerida järgmiselt:

  1. muutuja olemus;
  2. mudeli olemus;
  3. sõltumatute juhuslike muutujate prognoosist tulenev viga;
  4. spetsifikatsiooni viga.

Vaatleme tingimusteta prognoosi, kui sõltumatud muutujad on lihtsalt ja täpselt ennustatavad. Alustame prognoosi kvaliteediprobleemi käsitlemist paaris regressioonivõrrandiga.

Probleemi püstituse saab sel juhul sõnastada järgmiselt: milline on parim prognoos y T+1, eeldusel, et mudelis y = a + bx valikuid a ja b täpselt hinnatud ja väärtus xT+1- teatud.

Seejärel saab prognoositud väärtuse määratleda kui

Prognoosi viga on siis

.

Prognoosi veal on kaks omadust:

Saadud dispersioon on minimaalne kõigi võimalike lineaarsetel võrranditel põhinevate hinnangute hulgas.

Kuigi a ja b on teada, ilmneb prognoosiviga sellest, et kell T+1 ei pruugi vea tõttu regressioonisirgele asuda ε T+1, järgides normaaljaotust nullkeskmise ja dispersiooniga σ2. Prognoosi kvaliteedi kontrollimiseks võtame kasutusele normaliseeritud väärtuse

Seejärel saab 95% usaldusvahemikku määratleda järgmiselt:

kus β 0,05 on normaaljaotuse kvantilid.

95% intervalli piirid saab määratleda kui

Pange tähele, et antud juhul laius usaldusvahemik ei sõltu suurusest X, ja intervalli piirid on regressioonisirgetega paralleelsed sirged.

Sagedamini on regressioonijoone koostamisel ja prognoosi kvaliteedi kontrollimisel vaja hinnata mitte ainult regressiooniparameetreid, vaid ka prognoosivea dispersiooni. Võib näidata, et sel juhul sõltub vea dispersioon väärtusest (), kus on sõltumatu muutuja keskmine väärtus. Lisaks, mida pikem on seeria, seda täpsem on prognoos. Prognoosi viga väheneb, kui X T+1 väärtus on lähedane sõltumatu muutuja keskmisele väärtusele ja vastupidi, keskväärtusest eemaldudes muutub prognoos ebatäpsemaks. Joonisel fig. 3.6 näitab ennustuse tulemusi, kasutades lineaarse regressiooni võrrandit 6 ajavahemikku ette koos usaldusintervallidega.

Riis. 3.6. Lineaarse regressiooni ennustamine

Nagu näha jooniselt fig. 3.6, see regressioonisirge ei kirjelda hästi algandmeid: sobitusjoone suhtes on palju erinevusi. Mudeli kvaliteeti saab hinnata ka jääkide järgi, mis rahuldava mudeli korral peaksid jaotuma ligikaudu tavaseaduse järgi. Joonisel fig. 3.7 näitab jääkide graafikut, mis on koostatud tõenäosusskaala abil.

Joon.3.7. Jääkide tabel

Sellise skaala kasutamisel peaksid tavaseadusele alluvad andmed asetsema sirgel. Nagu jooniselt järeldub, kalduvad vaatlusperioodi alguse ja lõpu punktid mõnevõrra sirgest kõrvale, mis näitab valitud mudeli ebapiisavalt kõrget kvaliteeti lineaarse regressiooni võrrandi kujul.

Tabelis. Tabelis 3.2 on toodud prognoosi tulemused (teine ​​veerg) koos 95% usaldusvahemikuga (vastavalt alumine - kolmas ja ülemine - neljas veerg).

Tabel 3.2

Prognoosi tulemused

3.9. Mitme muutujaga regressioonimudel

Mitme muutujaga regressiooni korral sisaldavad andmed iga juhtumi kohta sõltuva muutuja ja iga sõltumatu muutuja väärtusi. Sõltuv muutuja y on juhuslik muutuja, mis on seotud sõltumatute muutujatega järgmise seosega:

kus on määratavad regressioonikoefitsiendid; ε on vea komponent, mis vastab sõltuva muutuja väärtuste hälbele tõelisest suhtest (eeldatakse, et vead on sõltumatud ja neil on normaaljaotus null keskmise ja tundmatu dispersiooniga σ ).

Antud andmekogumi puhul saab regressioonikoefitsientide hinnanguid leida vähimruutude meetodi abil. Kui OLS-i hinnangud on tähistatud tähega , näeb vastav regressioonifunktsioon välja järgmine:

Jäägid on veakomponendi hinnangud ja on sarnased lihtsa lineaarse regressiooni jääkidega.

Mitme muutujaga regressioonimudeli statistiline analüüs viiakse läbi sarnaselt lihtsa lineaarse regressiooni analüüsiga. Statistikaprogrammide standardpaketid võimaldavad saada mudeli parameetrite hinnanguid vähimruutude järgi, hinnanguid nende standardvigade kohta. Samuti saate väärtuse t-statistika regressioonimudeli üksikute terminite olulisuse ja väärtuse kontrollimiseks F-statistika regressioonisõltuvuse olulisuse testimiseks.

Ruudude summade jagamise vorm mitme muutujaga regressiooni korral on sarnane avaldisega (3.13), kuid pulsisageduse suhe on järgmine

Rõhutame veel kord seda n on vaatluste maht ja k on muutujate arv mudelis. Sõltuva muutuja üldine dispersioon koosneb kahest komponendist: sõltumatute muutujate poolt regressioonifunktsiooni kaudu seletatav dispersioon ja seletamatu dispersioon.

Tabel ANOVA mitme muutujaga regressiooni korral on tabelis näidatud kujul. 3.3.

Tabel 3.3

ANOVA tabel

Allikas

Ruudude summa

Keskmine ruut

Regressioon

SS2/ (n-k-1)

Mitme muutujaga regressiooni näitena kasutame Statistica paketi andmeid (andmefail Vaesus.Sta) Esitatud andmed põhinevad 1960. ja 1970. aasta rahvaloenduse tulemuste võrdlusel. 30 riigist koosneva juhusliku valimi jaoks. Riiginimed on sisestatud stringinimedena ja kõigi selles failis olevate muutujate nimed on loetletud allpool:

POP_CHNG — rahvaarvu muutus aastatel 1960–1970;

N_EMPLD — põllumajanduses töötavate inimeste arv;

PT_POOR – allpool vaesuspiiri elavate perede protsent;

TAX_RATE - maksumäär;

PT_PHONE - telefoniga korterite protsent;

PT_MAAL - protsent maarahvastikust;

VANUS on keskealine.

Sõltuva muutujana valime tunnuse Pt_Poor, ja sõltumatuna - kõik ülejäänud. Arvutatud regressioonikoefitsiendid valitud muutujate vahel on toodud tabelis. 3.4

Tabel 3.4

Regressioonikoefitsiendid

See tabel näitab regressioonikordajaid ( AT) ja standardiseeritud regressioonikoefitsiendid ( beeta). Koefitsientide abil AT seatakse regressioonivõrrandi vorm, mis antud juhul on kujul:

Ainult nende muutujate kaasamine paremale on tingitud asjaolust, et ainult nendel tunnustel on tõenäosusväärtus R alla 0,05 (vt tabeli 3.4 neljandat veergu).

Bibliograafia

  1. Basovsky L.E. Prognoosimine ja planeerimine turutingimustes. - M .: Infra - M, 2003.
  2. Box J., Jenkins G. Aegridade analüüs. 1. probleem. Prognoos ja juhtimine. – M.: Mir, 1974.
  3. Borovikov V. P., Ivchenko G. I. Prognoosimine Statistica süsteemis Windowsi keskkonnas. - M.: Rahandus ja statistika, 1999.
  4. Hertsog V. Andmetöötlus arvutis näidetes. - Peterburi: Peeter, 1997.
  5. Ivtšenko B. P., Martõštšenko L. A., Ivantsov I. B. Info mikroökonoomika. Osa 1. Analüüsi- ja prognoosimeetodid. - Peterburi: Nordmed-Izdat, 1997.
  6. Krichevsky M.L. Sissejuhatus tehisnärvivõrkudesse: Proc. toetust. - Peterburi: Peterburi. olek meretehnika. un-t, 1999.
  7. Soshnikova L. A., Tamaševitš V. N., Uebe G. jt. Mitmemõõtmeline statistiline analüüs majanduses. – M.: Ühtsus-Dana, 1999.

1. Põhilised metoodilised sätted.

Lihtne eksponentsiaalse silumise meetod kasutab kõigi eelnevate vaatluste kaalutud (eksponentsiaalselt) liikuvat keskmist. Seda mudelit rakendatakse kõige sagedamini andmetele, mille puhul on vaja hinnata analüüsitavate näitajate vahelise seose (trendi) olemasolu või analüüsitavate andmete sõltuvust. Eksponentsiaalse silumise eesmärk on hinnata hetkeseisu, mille tulemused määravad kõik tulevikuprognoosid.

Eksponentsiaalne silumine annab mudeli pidev uuendamine kõige värskemate andmete tõttu. See meetod põhineb varasemate vaatluste aegridade keskmistamisel (silumisel) allapoole (eksponentsiaalselt). See tähendab, et hilisemad sündmused saavad suurema kaalu. Kaal määratakse järgmiselt: viimase vaatluse puhul on kaal α, eelviimase puhul - (1-α), enne seda - (1-α) 2 jne.

Silutud kujul saab uut prognoosi (perioodiks t + 1) esitada kui suuruse viimase vaatluse kaalutud keskmist ajal t ja selle eelmise prognoosi sama perioodi kohta t. Peale selle määratakse vaadeldavale väärtusele kaal α ja prognoosile kaal (1- α); eeldatakse, et 0< α<1. Это правило в общем виде можно записать следующим образом.

Uus prognoos = [α*(viimane vaatlus)]+[(1- α)*viimane prognoos]

kus on järgmise perioodi prognoositav väärtus;

α on silumiskonstant;

Y t on jooksva perioodi t väärtuse vaatlus;

Selle väärtuse eelmine silutud prognoos perioodiks t.

Eksponentsiaalne silumine on protseduur prognoositulemuste pidevaks ülevaatamiseks, võttes arvesse uusimaid arenguid.

Silumiskonstant α on kaalutud tegur. Selle tegelik väärtus määratakse selle järgi, mil määral peaks praegune vaatlus ennustatavat väärtust mõjutama. Kui α on 1-le lähedane, siis arvestab prognoos viimase prognoosi vea väärtust. Vastupidi, α väikeste väärtuste puhul on ennustatud väärtus eelmisele prognoosile kõige lähemal. Seda võib pidada kõigi varasemate vaatluste kaalutud keskmiseks, mille kaalud vähenevad eksponentsiaalselt koos andmete "vanusega".



Tabel 2.1

Silumiskonstantide erinevate väärtuste mõju võrdlus

Konstant α on andmeanalüüsi võti. Kui eeldatakse, et prognoositud väärtused on stabiilsed ja juhuslikud kõrvalekalded on tasandatud, on vaja valida väike α väärtus. Konstandi α suur väärtus on mõttekas, kui vajate kiiret reageerimist vaatlusspektri muutustele.

2. Praktiline näide eksponentsiaalsest silumisest.

Esitatakse ettevõtte andmed müügimahus (tuhat ühikut) seitsme aasta kohta, tasanduskonstandiks on võetud 0,1 ja 0,6. Testiosa moodustavad andmed 7 aasta kohta; nende puhul on vaja hinnata iga mudeli tõhusust. Rea eksponentsiaalseks silumiseks võetakse algväärtuseks 500 (tegelike andmete esimene väärtus või 3-5 perioodi keskmine väärtus registreeritakse silutud väärtuses 2. kvartali kohta).

Tabel 2.2

Esialgsed andmed

Aeg Tegelik väärtus (tegelik) Silutud väärtus Prognoosi viga
aastal veerand 0,1 0,1
excel valemi järgi
#N/A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

Joonisel fig. 2.1 näitab ennustust, mis põhineb eksponentsiaalsel silumisel silumiskonstandiga 0,1.



Riis. 2.1. Eksponentsiaalne silumine

Lahendus Excelis.

1. Valige menüü "Tööriistad" - "Andmete analüüs". Analüüsitööriistade loendist valige Eksponentsiaalne silumine. Kui menüüs "Tööriistad" pole andmeanalüüsi, siis tuleb installida "Analüüsipakett". Selleks leidke "Parameetrite" alt üksus "Settings" ja ilmuvas dialoogiboksis märkige ruut "Analysis Package", klõpsake nuppu OK.

2. Joonisel fig. 2.2.

3. Sisestage väljale "sisestusintervall" algandmete väärtused (pluss üks vaba lahter).

4. Märkige ruut "sildid" (kui sisestusvahemik sisaldab veergude nimesid).

5. Sisestage väärtus (1-α) summutusteguri väljale.

6. Sisestage väljale "sisestusintervall" selle lahtri väärtus, milles soovite vastuvõetud väärtusi näha.

7. Märkige ruut "Valikud" - "Graafi väljund", et see automaatselt koostada.

Riis. 2.2. Dialoogiboks eksponentsiaalseks silumiseks

3. Laboratoorsete tööde ülesanne.

Naftatootmisettevõtte 2 aasta tootmismahtude kohta on esialgsed andmed toodud tabelis 2.3:

Tabel 2.3

Esialgsed andmed

Tehke seeria eksponentsiaalne silumine. Võtke eksponentsiaalne silumiskoefitsient 0,1; 0,2; 0.3. Kommenteerige tulemusi. Kasutada saab lisas 1 toodud statistikat.