Biografi Ciri-ciri Analisis

Formula kaedah pelicinan eksponen. Kaedah Melicinkan Eksponen Purata Bergerak dalam Excel

Tugas ramalan dibina berdasarkan perubahan dalam beberapa data dari semasa ke semasa (jualan, permintaan, penawaran, KDNK, pelepasan karbon, populasi ...) dan mengunjurkan perubahan ini ke masa hadapan. Malangnya, dikenal pasti pada data sejarah, trend boleh dilanggar oleh ramai keadaan yang tidak dijangka. Jadi data pada masa hadapan mungkin berbeza dengan ketara daripada apa yang berlaku pada masa lalu. Ini adalah masalah dengan ramalan.

Walau bagaimanapun, terdapat teknik (dipanggil pelicinan eksponen) yang membolehkan bukan sahaja untuk mencuba meramal masa depan, tetapi juga untuk menyatakan ketidakpastian secara berangka semua yang berkaitan dengan ramalan. Ungkapan berangka ketidakpastian dengan mencipta selang ramalan benar-benar tidak ternilai, tetapi sering diabaikan dalam dunia ramalan.

Muat turun nota dalam atau format, contoh dalam format

Data awal

Katakan anda peminat Lord of the Rings dan telah membuat dan menjual pedang selama tiga tahun (Rajah 1). Mari kita paparkan jualan secara grafik (Gamb. 2). Permintaan meningkat dua kali ganda dalam tempoh tiga tahun - mungkin ini trend? Kami akan kembali kepada idea ini sedikit kemudian. Terdapat beberapa puncak dan lembah pada carta, yang boleh menjadi tanda bermusim. Khususnya, kemuncaknya adalah pada bulan 12, 24, dan 36, iaitu pada bulan Disember. Tetapi mungkin ia hanya kebetulan? Mari kita ketahui.

Pelicinan eksponen mudah

Kaedah pelicinan eksponen bergantung pada meramalkan masa depan daripada data dari masa lalu, di mana pemerhatian yang lebih baru lebih berat daripada yang lebih lama. Pemberatan sedemikian mungkin disebabkan oleh pemalar pelicinan. Kaedah pelicinan eksponen pertama yang akan kita cuba dipanggil mudah pelicinan eksponen(PES, mudah pelicinan eksponen, SES). Ia hanya menggunakan satu pemalar pelicinan.

Pelicinan eksponen mudah mengandaikan bahawa siri masa data anda mempunyai dua komponen: tahap (atau min) dan beberapa ralat di sekitar nilai tersebut. Tiada trend atau turun naik bermusim - hanya terdapat tahap di mana permintaan turun naik, dikelilingi oleh ralat kecil di sana sini. Dengan memberi keutamaan kepada pemerhatian yang lebih baru, TEC boleh menyebabkan perubahan dalam tahap ini. Dalam bahasa formula,

Permintaan pada masa t = aras + ralat rawak berhampiran tahap pada masa t

Jadi bagaimana anda mencari nilai anggaran tahap? Jika kita menerima semua nilai masa sebagai mempunyai nilai yang sama, maka kita hanya perlu mengira nilai puratanya. Walau bagaimanapun, ini adalah idea yang tidak baik. Lebih berat harus diberikan kepada pemerhatian baru-baru ini.

Mari buat beberapa tahap. Kira garis dasar untuk tahun pertama:

tahap 0 = purata permintaan untuk tahun pertama (bulan 1-12)

Untuk permintaan pedang, ia adalah 163. Kami menggunakan tahap 0 (163) sebagai ramalan permintaan untuk bulan 1. Permintaan pada bulan 1 ialah 165, iaitu 2 pedang di atas tahap 0. Adalah wajar untuk mengemas kini anggaran garis dasar. Persamaan pelicinan eksponen mudah:

tahap 1 = tahap 0 + beberapa peratus × (permintaan 1 - tahap 0)

tahap 2 = tahap 1 + beberapa peratus × (permintaan 2 - tahap 1)

Dan lain-lain. "Beberapa peratus" dipanggil pemalar pelicinan, dan dilambangkan dengan alfa. Ia boleh menjadi sebarang nombor dari 0 hingga 100% (0 hingga 1). Anda akan belajar cara memilih nilai alfa kemudian. AT kes am nilai untuk titik masa yang berbeza:

Tahap tempoh semasa = tahap tempoh sebelumnya +
alpha × (tempoh semasa permintaan - peringkat tempoh sebelumnya)

Permintaan masa hadapan adalah sama dengan tahap pengiraan terakhir (Rajah 3). Memandangkan anda tidak tahu apa itu alpha, tetapkan sel C2 kepada 0.5 untuk bermula. Selepas model dibina, cari alfa supaya jumlah kuasa dua ralat itu ialah E2 (atau sisihan piawai– F2) adalah minimum. Untuk melakukan ini, jalankan pilihan Mencari Penyelesaian. Untuk melakukan ini, pergi melalui menu DATA –> Mencari Penyelesaian, dan tetapkan dalam tetingkap Pilihan Carian Penyelesaian nilai yang diperlukan (Rajah 4). Untuk menunjukkan hasil ramalan pada carta, mula-mula pilih julat A6:B41 dan bina carta garisan ringkas. Seterusnya, klik kanan pada rajah, pilih pilihan Pilih data. Dalam tetingkap yang terbuka, buat baris kedua dan masukkan ramalan daripada julat A42:B53 ke dalamnya (Gamb. 5).

Mungkin anda mempunyai trend

Untuk menguji andaian ini, ia sudah memadai regresi linear di bawah data permintaan dan lakukan ujian-t ke atas kenaikan garis aliran ini (seperti dalam ). Jika kecerunan garisan bukan sifar dan signifikan secara statistik (dalam ujian Pelajar, nilai R kurang daripada 0.05), data mempunyai arah aliran (Rajah 6).

Kami menggunakan fungsi LINEST, yang mengembalikan 10 Statistik deskriptif(jika anda tidak pernah menggunakan fungsi ini sebelum ini, saya mengesyorkannya) dan fungsi INDEX, yang membolehkan anda "menarik keluar" hanya tiga statistik yang diperlukan, dan bukan keseluruhan set. Ternyata cerun adalah 2.54, dan ia adalah signifikan, kerana ujian Pelajar menunjukkan bahawa 0.000000012 adalah kurang daripada 0.05. Jadi, terdapat trend, dan ia kekal untuk memasukkannya dalam ramalan.

Pelicinan Holt eksponen dengan pembetulan arah aliran

Ia sering dirujuk sebagai pelicinan eksponen berganda kerana ia mempunyai dua parameter pelicinan, alfa, bukannya satu. Jika jujukan masa mempunyai arah aliran linear, maka:

permintaan dari semasa ke semasa t = tahap + t × trend + sisihan rawak tahap pada masa t

Holt Exponential Smoothing dengan pembetulan arah aliran mempunyai dua persamaan baharu, satu untuk tahap apabila ia bergerak ke hadapan mengikut masa dan satu lagi untuk arah aliran. Persamaan tahap mengandungi alfa parameter pelicinan, dan persamaan arah aliran mengandungi gamma. Inilah rupa persamaan tahap baharu:

tahap 1 = tahap 0 + aliran 0 + alfa × (permintaan 1 - (tahap 0 + aliran 0))

ambil perhatian bahawa tahap 0 + trend 0 hanyalah ramalan satu langkah daripada nilai asal hingga bulan 1, jadi permintaan 1 – (tahap 0 + trend 0) adalah sisihan satu langkah. Oleh itu, persamaan penghampiran tahap asas adalah seperti berikut:

tahap tempoh semasa = tahap tempoh sebelumnya + arah aliran tempoh sebelumnya + alfa × (permintaan tempoh semasa - (tahap tempoh sebelumnya) + arah aliran tempoh sebelumnya))

Persamaan kemas kini trend:

aliran tempoh semasa = aliran tempoh sebelumnya + gamma × alfa × (tempoh semasa permintaan – (peringkat tempoh sebelumnya) + aliran tempoh sebelumnya))

Pelicinan holt dalam Excel adalah serupa dengan pelicinan mudah (Rajah 7), dan, seperti di atas, matlamatnya adalah untuk mencari dua pekali sambil meminimumkan jumlah ralat kuasa dua (Rajah 8). Untuk mendapatkan tahap asal dan nilai aliran (dalam sel C5 dan D5 dalam Rajah 7), bina carta untuk 18 bulan pertama jualan dan tambahkan garis aliran dengan persamaan padanya. Masukkan nilai aliran awal 0.8369 dan tahap awal 155.88 ke dalam sel C5 dan D5. Data ramalan boleh dipersembahkan secara grafik (Rajah 9).

nasi. 7. Pelicinan Holt eksponen dengan pembetulan arah aliran; Untuk membesarkan imej, klik kanan padanya dan pilih Buka imej dalam tab baharu

Mencari corak dalam data

Terdapat cara untuk menguji kekuatan model ramalan - untuk membandingkan ralat dengan diri mereka sendiri, dialihkan dengan satu langkah (atau beberapa langkah). Jika sisihan adalah rawak, maka model tidak boleh diperbaiki. Walau bagaimanapun, mungkin terdapat faktor bermusim dalam data permintaan. Konsep ralat yang berkorelasi dengan versinya sendiri dalam tempoh yang berbeza dipanggil autokorelasi (untuk lebih lanjut mengenai autokorelasi, lihat ). Untuk mengira autokorelasi, mulakan dengan data ralat ramalan untuk setiap tempoh (pindah lajur F dalam Rajah 7 ke lajur B dalam Rajah 10). Tentukan seterusnya ralat purata ramalan (Rajah 10, sel B39; formula dalam sel: =PURATA(B3:B38)). Dalam lajur C, hitung sisihan ralat ramalan daripada min; formula dalam sel C3: =B3-B$39. Seterusnya, alihkan lajur C satu lajur ke kanan secara berurutan dan satu baris ke bawah. Formula dalam sel D39: =SUMPRODUCT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Apakah maksud "pergerakan segerak" dengan lajur C untuk salah satu lajur D: O. Sebagai contoh, jika lajur C dan D adalah segerak, maka nombor yang negatif dalam salah satu daripadanya mestilah negatif dalam yang lain, positif dalam satu. , positif dalam kawan. Ini bermakna jumlah hasil darab dua lajur akan menjadi ketara (perbezaan terkumpul). Atau, yang sama, semakin hampir nilai dalam julat D41:O41 kepada sifar, semakin rendah korelasi lajur (masing-masing dari D ke O) dengan lajur C (Rajah 11).

Satu autokorelasi berada di atas nilai kritikal. Ralat peralihan tahun berkorelasi dengan dirinya sendiri. Ini bermakna kitaran bermusim 12 bulan. Dan ini tidak menghairankan. Jika anda melihat graf permintaan (Rajah 2), ternyata terdapat kemuncak permintaan setiap Krismas dan penurunan pada bulan April-Mei. Pertimbangkan teknik ramalan yang mengambil kira bermusim.

Pelicinan Holt-Winters eksponen berganda

Kaedah ini dipanggil darab (dari darab - darab), kerana ia menggunakan pendaraban untuk mengambil kira kemusim:

Permintaan pada masa t = (tahap + t × arah aliran) × pelarasan bermusim pada masa t × sebarang baki pelarasan tidak teratur yang tidak dapat kami ambil kira

Pelicinan Holt-Winters juga dipanggil pelicinan eksponen tiga kali ganda kerana ia mempunyai tiga parameter pelicinan (faktor bermusim alfa, gamma dan delta). Contohnya, jika terdapat kitaran bermusim 12 bulan:

Ramalan bulanan 39 = (tahap 36 + 3 × arah aliran 36) x bermusim 27

Apabila menganalisis data, adalah perlu untuk mengetahui apakah arah aliran dalam siri data dan apakah kemusimannya. Untuk melakukan pengiraan menggunakan kaedah Holt-Winters, anda mesti:

  • Data sejarah lancar menggunakan kaedah purata bergerak.
  • Bandingkan versi terlicin bagi siri masa dengan yang asal untuk mendapatkan anggaran kasar bermusim.
  • Dapatkan data baharu tanpa komponen bermusim.
  • Cari anggaran tahap dan arah aliran berdasarkan data baharu ini.

Mulakan dengan data asal (lajur A dan B dalam Rajah 12) dan tambah lajur C dengan nilai terlicin berdasarkan purata bergerak. Memandangkan musim bermusim mempunyai kitaran 12 bulan, masuk akal untuk menggunakan purata 12 bulan. Terdapat masalah kecil dengan purata ini. 12 ialah nombor genap. Jika anda melancarkan permintaan untuk bulan 7, adakah ia patut dianggap sebagai permintaan purata dari bulan 1 hingga 12, atau dari 2 hingga 13? Untuk menangani kesukaran ini, kita perlu melicinkan permintaan menggunakan "purata bergerak 2x12". Iaitu, ambil separuh daripada dua purata dari bulan 1 hingga 12 dan dari 2 hingga 13. Formula dalam sel C8 ialah: =(PURATA(B3:B14)+PURATA(B2:B13))/2.

Data lancar untuk bulan 1–6 dan 31–36 tidak boleh diperoleh kerana tidak cukup tempoh sebelumnya dan seterusnya. Untuk kejelasan, data asal dan terlicin boleh ditunjukkan dalam gambar rajah (Rajah 13).

Sekarang, dalam lajur D, bahagikan nilai asal dengan nilai terlicin untuk mendapatkan anggaran pelarasan bermusim (lajur D dalam Rajah 12). Formula dalam sel D8: =B8/C8. Perhatikan lonjakan 20% melebihi permintaan biasa pada bulan 12 dan 24 (Disember) sementara terdapat penurunan pada musim bunga. Teknik melicinkan ini telah memberi anda dua anggaran mata untuk setiap bulan (jumlah 24 bulan). Lajur E ialah purata bagi kedua-dua faktor ini. Formula dalam sel E1 ialah: =PURATA(D14,D26). Untuk kejelasan, tahap turun naik bermusim boleh diwakili secara grafik (Rajah 14).

Kini anda boleh mendapatkan data yang dilaraskan untuk turun naik bermusim. Formula dalam sel G1: =B2/E2. Bina graf berdasarkan data dalam lajur G, lengkapkannya dengan garis arah aliran, paparkan persamaan arah aliran pada carta (Rajah 15), dan gunakan pekali dalam pengiraan seterusnya.

bentuk daun baru, seperti yang ditunjukkan dalam rajah. 16. Gantikan nilai dalam julat E5:E16 daripada rajah. 12 kawasan E2:E13. Ambil nilai C16 dan D16 daripada persamaan garis arah aliran dalam rajah. 15. Tetapkan nilai pemalar pelicinan untuk bermula pada sekitar 0.5. Kembangkan nilai dalam baris 17 dalam julat bulan 1 hingga 36. Jalankan Mencari Penyelesaian untuk mengoptimumkan pekali pelicinan (Rajah 18). Formula dalam sel B53: =(C$52+(A53-A$52)*D$52)*E41.

Sekarang dalam ramalan yang dibuat, anda perlu menyemak autokorelasi (Gamb. 18). Memandangkan semua nilai terletak di antara sempadan atas dan bawah, anda faham bahawa model itu melakukan kerja yang baik untuk memahami struktur nilai permintaan.

Membina selang keyakinan untuk ramalan

Jadi, kami mempunyai ramalan yang agak berkesan. Bagaimanakah anda menetapkan sempadan atas dan bawah yang boleh digunakan untuk membuat tekaan yang realistik? Simulasi Monte Carlo, yang telah anda temui (lihat juga ), akan membantu anda dengan ini. Intinya adalah untuk menjana senario masa depan tingkah laku permintaan dan menentukan kumpulan yang 95% daripada mereka jatuh.

Alih keluar dari helaian Ramalan Excel daripada sel B53:B64 (lihat Rajah 17). Anda akan menulis permintaan di sana berdasarkan simulasi. Yang terakhir boleh dijana menggunakan fungsi NORMINV. Untuk bulan akan datang, anda hanya perlu membekalkannya dengan min (0), taburan standard (10.37 dari sel $H$2) dan nombor rawak dari 0 hingga 1. Fungsi akan mengembalikan sisihan dengan kebarangkalian sepadan dengan lengkung loceng. Letakkan simulasi ralat satu langkah dalam sel G53: =NORMINV(RAND();0;H$2). Meregangkan formula ini ke G64 memberikan anda simulasi ralat ramalan untuk ramalan satu langkah selama 12 bulan (Rajah 19). Nilai simulasi anda akan berbeza daripada yang ditunjukkan dalam rajah (sebab itu ia adalah simulasi!).

Dengan Ralat Ramalan, anda mempunyai semua yang anda perlukan untuk mengemas kini tahap, arah aliran dan faktor bermusim. Jadi pilih sel C52:F52 dan rentangkannya ke baris 64. Akibatnya, anda mempunyai ralat ramalan simulasi dan ramalan itu sendiri. Beralih dari sebaliknya, adalah mungkin untuk meramalkan nilai permintaan. Masukkan formula ke dalam sel B53: =F53+G53 dan rentangkannya ke B64 (Gamb. 20, julat B53:F64). Kini anda boleh menekan butang F9, setiap kali mengemas kini ramalan. Letakkan keputusan 1000 simulasi dalam sel A71:L1070, setiap kali menukar nilai daripada julat B53:B64 kepada julat A71:L71, A72:L72, ... A1070:L1070. Jika ia mengganggu anda, tulis kod VBA.

Kini anda mempunyai 1000 senario untuk setiap bulan dan anda boleh menggunakan fungsi PERCENTILE untuk mendapatkan sempadan atas dan bawah di tengah-tengah selang keyakinan 95%. Dalam sel A66, formulanya ialah: =PERCENTILE(A71:A1070,0.975) dan dalam sel A67: =PERCENTILE(A71:A1070,0.025).

Seperti biasa, untuk kejelasan, data boleh dibentangkan dalam bentuk grafik(Gamb. 21).

Terdapat dua perkara menarik pada carta:

  • Margin ralat meningkat dengan masa. Ia masuk akal. Ketidakpastian terkumpul setiap bulan.
  • Dengan cara yang sama, ralat meningkat pada bahagian yang jatuh pada tempoh peningkatan permintaan bermusim. Dengan kejatuhannya yang seterusnya, ralat mengecut.

Berdasarkan bahan daripada buku oleh John Foreman. – M.: Alpina Publisher, 2016. – S. 329–381

Pelicinan eksponen - banyak lagi kaedah yang rumit purata wajaran. Setiap ramalan baharu adalah berdasarkan ramalan sebelumnya ditambah perbezaan peratusan antara ramalan itu dan nilai sebenar siri pada ketika itu.

F t \u003d F t -1 + (A t -1 - F t -1) (2)

di mana: F t – ramalan untuk tempoh t

F t-1– ramalan untuk tempoh t-1

- pelicinan berterusan

A t - 1 – permintaan atau jualan sebenar untuk tempoh tersebut t-1

Pemalar pelicinan ialah peratusan ralat ramalan. Setiap ramalan baharu adalah sama dengan ramalan sebelumnya ditambah peratusan ralat sebelumnya.

Kepekaan pembetulan ramalan kepada ralat ditentukan oleh pemalar pelicinan, semakin hampir nilainya kepada 0, semakin perlahan ramalan akan menyesuaikan diri dengan ralat ramalan (iaitu, lebih ijazah melicinkan). Sebaliknya, semakin hampir nilainya kepada 1.0 , semakin tinggi kepekaan dan semakin kurang licin.

Pilihan pemalar pelicinan kebanyakannya adalah soal pilihan bebas atau percubaan dan kesilapan. Matlamatnya adalah untuk memilih pemalar pelicinan sedemikian yang, di satu pihak, ramalan kekal cukup sensitif terhadap perubahan sebenar data siri masa, dan sebaliknya, ia melancarkan dengan baik lompatan yang disebabkan oleh faktor rawak. Nilai yang biasa digunakan adalah dalam julat 0.05 hingga 0.50.

Pelicinan eksponen ialah salah satu kaedah ramalan yang paling banyak digunakan, sebahagiannya kerana keperluan penyimpanan minimum dan kemudahan pengiraan, dan sebahagian lagi kerana kemudahan sistem faktor rangsangan boleh diubah. perubahan mudah nilai-nilai.

Jadual 3. Pelicinan Eksponen

Tempoh Permintaan sebenar α= 0.1 α = 0.4
ramalan ralat ramalan ralat
10 000 - - - -
11 200 10 000 11 200-10 000=1 200 10 000 11 200-10 000=1 200
11 500 10 000+0,1(11 200-10 000)=10 120 11 500-10 120=1 380 10 000+0,4(11 200-10 000)=10 480 11 500-10 480=1 020
13 200 10 120+0,1(11 500-10 120)=10 258 13 200-10 258=2 942 10 480+0,4(11 500-10 480)=10 888 13 200-10 888=2 312
14 500 10 258+0,1(13 200-10 258)=10 552 14 500-10 552=3 948 10 888+0,4(13 200-10 888)=11 813 14 500-11 813=2 687
- 10 552+0,1(14 500-10 552)=10 947 - 11 813+0,4(14 500-11 813)=12 888 -



Kaedah untuk Trend

Terdapat dua kaedah penting, yang boleh digunakan untuk membangunkan ramalan apabila trend hadir. Salah satunya melibatkan penggunaan persamaan arah aliran; yang lain ialah lanjutan pelicinan eksponen.

Persamaan arah aliran:

Persamaan Linear trend mempunyai pandangan seterusnya:

Y t = a + δ∙ t (3)

di mana: t - beberapa tempoh masa tertentu dari t=0;

Y t– ramalan tempoh t;

α - maksudnya Y t di t=0

δ - cerun garisan.

Pekali langsung α dan δ , boleh dikira daripada data statistik untuk tempoh tertentu, menggunakan dua persamaan berikut:

δ= , (4)

α = , (5)

di mana: n - bilangan tempoh,

y– nilai siri masa

Jadual 3. Tahap trend.

Tempoh (t) tahun Tahap jualan (y) t∙y t2
10 000 10 000
11 200 22 400
11 500 34 500
13 200 52 800
14 500 72 500
Jumlah: - 60 400 192 200

Mari kita hitung pekali garis arah aliran:

δ=

Jadi garis trend Y t = α + δ ∙ t

Dalam kes kami, Y t = 43 900+1 100 ∙t,

di mana t = 0 untuk tempoh 0.

Mari kita buat persamaan untuk tempoh 6 (2015) dan 7 (2016):

– ramalan untuk 2015.

Y 7 \u003d 43,900 + 1,100 * 7 \u003d 51,600

Mari bina graf:

Melicinkan Aliran Eksponen

Satu variasi pada pelicinan eksponen mudah boleh digunakan apabila siri masa menunjukkan arah aliran. Variasi ini dipanggil pelicinan eksponen, pelicinan berasaskan arah aliran, atau kadangkala pelicinan berganda. Ia berbeza daripada pelicinan eksponen mudah, yang hanya digunakan apabila data berubah di sekitar beberapa nilai purata atau mempunyai perubahan gelisah atau beransur-ansur.

Jika siri ini menjadi arah aliran dan pelicinan eksponen mudah digunakan, maka semua ramalan akan ketinggalan di belakang arah aliran. Sebagai contoh, jika data meningkat, maka setiap ramalan akan dipandang remeh. Sebaliknya, mengurangkan data memberikan ramalan yang terlalu tinggi. Paparan grafik data boleh menunjukkan apabila pelicinan dua kali lebih baik daripada pelicinan ringkas.

Ramalan terlaras arah aliran (TAF) terdiri daripada dua elemen: ralat terlicin dan faktor arah aliran.

TAF t +1 = S t + T t , (6)

di mana: S t – ramalan terlicin;

T t – penilaian arah aliran semasa

Dan S t = TAF t + α 1 (A t - TAF t) , (7)

T t \u003d T t-1 + α 2 (TAF t -TAF t-1 - T t-1) (8)

di mana α 1 , α 2 adalah pemalar melicinkan.

Untuk menggunakan kaedah ini, anda perlu memilih nilai α 1 , α 2 (dengan cara pemasangan biasa) dan membuat ramalan awal dan penilaian arah aliran.

Jadual 4. Pelicinan aliran eksponen.

Purata bergerak membolehkan anda melicinkan data dengan sempurna. Tetapi kelemahan utamanya ialah setiap nilai dalam data sumber mempunyai berat yang sama untuknya. Sebagai contoh, untuk purata bergerak menggunakan tempoh enam minggu, setiap nilai untuk setiap minggu diberi 1/6 daripada berat. Untuk beberapa statistik yang dikumpul, nilai yang lebih terkini diberi lebih berat. Oleh itu, pelicinan eksponen digunakan untuk memberikan data terkini lebih berat. Oleh itu, masalah statistik ini diselesaikan.

Formula Pengiraan Kaedah Melicin Eksponen dalam Excel

Rajah di bawah menunjukkan laporan permintaan untuk produk tertentu selama 26 minggu. Lajur Permintaan mengandungi maklumat tentang kuantiti barang yang dijual. Dalam lajur "Ramalan" - formula:

Lajur "Purata Pergerakan" mentakrifkan permintaan yang diramalkan, dikira menggunakan pengiraan biasa purata bergerak dengan tempoh 6 minggu:

Dalam lajur terakhir "Ramalan", dengan formula yang diterangkan di atas, kaedah pelicinan eksponen data digunakan di mana nilai minggu terakhir mempunyai lebih berat daripada yang sebelumnya.

Pekali "Alpha:" dimasukkan dalam sel G1, ini bermakna berat tugasan kepada data terkini. AT contoh ini ia mempunyai nilai 30%. Baki 70% berat diedarkan ke seluruh data. Iaitu, nilai kedua dari segi perkaitan (dari kanan ke kiri) mempunyai berat yang sama dengan 30% daripada baki 70% berat - ini adalah 21%, nilai ketiga mempunyai berat yang sama dengan 30% daripada yang lain. daripada 70% berat - 14.7% dan seterusnya .



Plot pelicinan eksponen

Rajah di bawah menunjukkan graf permintaan, purata bergerak dan ramalan pelicinan eksponen, yang dibina berdasarkan nilai asal:


Ambil perhatian bahawa ramalan pelicinan eksponen lebih responsif kepada perubahan dalam permintaan berbanding garis purata bergerak.

Data untuk minggu sebelumnya berturut-turut didarab dengan faktor alfa, dan hasilnya ditambah kepada peratus berat yang lain didarab dengan nilai ramalan sebelumnya.

Topik 3. Melicinkan dan meramalkan siri masa berdasarkan model trend

matlamat kajian topik ini adalah penciptaan asas asas untuk latihan pengurus dalam kepakaran 080507 dalam bidang pembinaan model pelbagai tugas dalam bidang ekonomi, pembentukan pendekatan sistematik untuk menetapkan dan menyelesaikan masalah ramalan di kalangan pelajar . Kursus yang dicadangkan akan membolehkan pakar menyesuaikan diri dengan cepat kerja amali, adalah lebih baik untuk menavigasi dalam maklumat saintifik dan teknikal dan kesusasteraan dalam kepakaran, untuk membuat keputusan yang lebih yakin yang timbul dalam kerja.

Utama tugasan topik kajian ialah: mendapatkan pelajar secara mendalam pengetahuan teori mengenai aplikasi model ramalan, pemerolehan kemahiran yang stabil dalam melaksanakan kerja penyelidikan, keupayaan untuk menyelesaikan kompleks masalah saintifik dikaitkan dengan pembinaan model, termasuk yang multidimensi, keupayaan untuk menganalisis secara logik keputusan yang diperoleh dan menentukan cara untuk mencari penyelesaian yang boleh diterima.

Cukup kaedah mudah mengenal pasti arah aliran pembangunan ialah pelicinan siri masa, iaitu, penggantian tahap sebenar dengan tahap yang dikira yang mempunyai variasi yang lebih kecil daripada data asal. Transformasi yang sepadan dipanggil penapisan. Mari kita pertimbangkan beberapa kaedah melicinkan.

3.1. purata mudah

Matlamat pelicinan adalah untuk membina model ramalan untuk tempoh masa hadapan berdasarkan pemerhatian lepas. Dalam kaedah purata mudah, nilai pembolehubah diambil sebagai data awal Y pada titik masa t, dan nilai ramalan ditentukan sebagai purata mudah untuk tempoh masa seterusnya. Formula pengiraan mempunyai bentuk

di mana n bilangan pemerhatian.

Dalam kes apabila pemerhatian baharu tersedia, ramalan yang baru diterima juga harus diambil kira untuk ramalan untuk tempoh seterusnya. Apabila menggunakan kaedah ini, ramalan dijalankan dengan purata semua data sebelumnya, namun, kelemahan ramalan tersebut ialah kesukaran penggunaannya dalam model trend.

3.2. Kaedah purata bergerak

Kaedah ini adalah berdasarkan mewakili siri sebagai jumlah aliran yang agak lancar dan komponen rawak. Kaedah ini berdasarkan idea mengira nilai teori berdasarkan anggaran tempatan. Untuk membina anggaran trend pada satu titik t dengan nilai siri dari selang masa hitung nilai teori bagi siri itu. Paling meluas dalam amalan siri melicinkan, saya mendapat kes apabila semua pemberat untuk unsur-unsur selang adalah sama antara satu sama lain. Atas sebab ini, kaedah ini dipanggil kaedah purata bergerak, kerana apabila prosedur itu dilaksanakan, tetingkap dengan lebar (2 m + 1) sepanjang baris. Lebar tetingkap biasanya dianggap ganjil, kerana nilai teori dikira untuk nilai pusat: bilangan istilah k = 2m + 1 Dengan nombor yang sama tahap ke kiri dan kanan masa ini t.

Formula untuk mengira purata bergerak dalam kes ini mengambil bentuk:

Penyerakan purata bergerak ditakrifkan sebagai σ 2 /k, melalui mana σ2 menandakan varians istilah asal siri itu, dan k selang pelicinan, jadi semakin besar selang pelicinan, semakin kuat purata data dan semakin kurang arah alirannya. Selalunya, pelicinan dilakukan pada tiga, lima dan tujuh ahli siri asal. Pada masa yang sama, seseorang harus mengambil kira ciri-ciri berikut purata bergerak: jika kita mempertimbangkan siri dengan turun naik berkala dengan panjang malar, pelicinan berdasarkan purata bergerak dengan selang pelicinan sama dengan atau gandaan tempoh akan menghapuskan turun naik sepenuhnya. Selalunya, pelicinan berdasarkan purata bergerak mengubah siri ini dengan begitu kuat sehingga trend pembangunan yang dikenal pasti ditunjukkan hanya dalam kebanyakan masa. secara umum, dan lebih kecil, tetapi penting untuk butiran analisis (gelombang, selekoh, dll.) hilang; selepas melicinkan, gelombang kecil kadangkala boleh menukar arah ke "lubang" bertentangan muncul di tempat "puncak", dan sebaliknya. Semua ini memerlukan berhati-hati dalam penggunaan purata bergerak mudah dan memaksa seseorang untuk mencari kaedah penerangan yang lebih halus.

Kaedah purata bergerak tidak memberikan nilai trend untuk yang pertama dan terakhir m ahli baris. Kelemahan ini amat ketara dalam kes apabila panjang baris adalah kecil.

3.3. Pelicinan Eksponen

Purata Eksponen y t ialah contoh purata bergerak berwajaran asimetri yang mengambil kira tahap penuaan data: maklumat "lama" dengan berat kurang memasuki formula untuk mengira nilai terlicin tahap siri

Di sini — min eksponen menggantikan nilai siri yang diperhatikan y t(pelicinan melibatkan semua data yang diterima ke detik semasa t), α parameter pelicinan mencirikan berat pemerhatian semasa (terbaru); 0< α <1.

Kaedah ini digunakan untuk meramalkan siri masa tidak pegun dengan perubahan rawak pada aras dan cerun. Apabila kita beralih dari detik masa semasa ke masa lalu, berat sebutan siri yang sepadan dengan cepat (secara eksponen) berkurangan dan secara praktikalnya tidak lagi memberi kesan ke atas nilai .

Adalah mudah untuk melihat bahawa hubungan terakhir membolehkan kita memberikan tafsiran berikut bagi purata eksponen: jika — ramalan nilai siri y t, maka perbezaannya ialah ralat ramalan. Jadi ramalan untuk titik masa seterusnya t+1 mengambil kira apa yang diketahui pada masa ini t ralat ramalan.

Pilihan melicinkan α adalah faktor penimbang. Jika α dekat dengan perpaduan, maka ramalan dengan ketara mengambil kira magnitud ralat ramalan terakhir. Untuk nilai kecil α nilai ramalan adalah hampir dengan ramalan sebelumnya. Pilihan parameter pelicinan adalah masalah yang agak rumit. Pertimbangan umum adalah seperti berikut: kaedah ini bagus untuk meramalkan siri yang cukup lancar. Dalam kes ini, seseorang boleh memilih pemalar pelicinan dengan meminimumkan ralat ramalan selangkah ke hadapan yang dianggarkan daripada sepertiga terakhir siri. Sesetengah pakar tidak mengesyorkan menggunakan nilai besar parameter pelicinan. Pada rajah. 3.1 menunjukkan contoh siri terlicin menggunakan kaedah pelicinan eksponen untuk α= 0,1.

nasi. 3.1. Hasil pelicinan eksponen pada α =0,1
(1 siri asal; 2 siri terlicin; 3 sisa)

3.4. Pelicinan Eksponen
berasaskan trend (kaedah Holt)

Kaedah ini mengambil kira arah aliran linear tempatan yang wujud dalam siri masa. Jika terdapat aliran menaik dalam siri masa, maka bersama-sama dengan anggaran tahap semasa, anggaran cerun juga diperlukan. Dalam teknik Holt, paras dan nilai cerun diratakan secara langsung dengan menggunakan pemalar yang berbeza untuk setiap parameter. Pemalar pelicinan membolehkan anda menganggarkan paras dan cerun semasa, memperhalusinya setiap kali pemerhatian baharu dibuat.

Kaedah Holt menggunakan tiga formula pengiraan:

  1. Siri Diperlancar Secara Eksponen (Anggaran Tahap Semasa)

(3.2)

  1. Penilaian trend

(3.3)

  1. Ramalan untuk R tempoh hadapan

(3.4)

di mana α, β pemalar melicinkan daripada selang .

Persamaan (3.2) adalah serupa dengan Persamaan (3.1) untuk pelicinan eksponen mudah kecuali untuk istilah arah aliran. berterusan β diperlukan untuk melicinkan anggaran aliran. Dalam persamaan ramalan (3.3), anggaran arah aliran didarabkan dengan bilangan tempoh R, yang berdasarkan ramalan, dan kemudian produk ini ditambahkan pada tahap data terlicin semasa.

Kekal α dan β dipilih secara subjektif atau dengan meminimumkan ralat ramalan. Nilai pemberat yang lebih besar diambil, lebih cepat tindak balas terhadap perubahan yang berterusan akan berlaku dan data akan lebih lancar. Pemberat yang lebih kecil menjadikan struktur nilai terlicin kurang rata.

Pada rajah. 3.2 menunjukkan contoh pelicinan siri menggunakan kaedah Holt untuk nilai α dan β sama dengan 0.1.

nasi. 3.2. Hasil pelicinan Holt
di α = 0,1 dan β = 0,1

3.5. Pelicinan Eksponen dengan Trend dan Variasi Bermusim (Kaedah Musim Sejuk)

Jika terdapat turun naik bermusim dalam struktur data, model pelicinan eksponen tiga parameter yang dicadangkan oleh Winters digunakan untuk mengurangkan ralat ramalan. Pendekatan ini adalah lanjutan daripada model Holt sebelumnya. Untuk mengambil kira variasi bermusim, persamaan tambahan digunakan di sini, dan kaedah ini diterangkan sepenuhnya oleh empat persamaan:

  1. Siri Terlicin Secara Eksponen

(3.5)

  1. Penilaian trend

(3.6)

  1. Penilaian kemusim

.

(3.7)

  1. Ramalan untuk R tempoh hadapan

(3.8)

di mana α, β, γ pelicinan berterusan untuk tahap, arah aliran dan kemusim, masing-masing; s- tempoh tempoh turun naik bermusim.

Persamaan (3.5) membetulkan siri terlicin. Dalam persamaan ini, istilah ini mengambil kira kemusim dalam data asal. Selepas kemusim dan arah aliran diambil kira dalam persamaan (3.6), (3.7), anggaran diratakan, dan ramalan dibuat dalam persamaan (3.8).

Sama seperti dalam kaedah sebelumnya, pemberat α, β, γ boleh dipilih secara subjektif atau dengan meminimumkan ralat ramalan. Sebelum menggunakan persamaan (3.5), adalah perlu untuk menentukan nilai awal untuk siri terlicin L t, trend T t, pekali kemusim S t. Biasanya, nilai awal siri terlicin diambil sama dengan pemerhatian pertama, maka trend adalah sifar, dan pekali bermusim ditetapkan sama dengan satu.

Pada rajah. 3.3 menunjukkan contoh melicinkan siri menggunakan kaedah Winters.

nasi. 3.3. Hasil pelicinan dengan kaedah Winters
di α = 0,1 = 0.1; γ = 0.1(1- baris asal; 2 baris terlicin; 3 sisa)

3.6. Ramalan berdasarkan model trend

Selalunya siri masa mempunyai arah aliran linear (trend). Dengan mengandaikan arah aliran linear, anda perlu membina garis lurus yang paling tepat mencerminkan perubahan dalam dinamik sepanjang tempoh yang dipertimbangkan. Terdapat beberapa kaedah untuk membina garis lurus, tetapi yang paling objektif dari sudut pandangan formal adalah pembinaan berdasarkan meminimumkan jumlah sisihan negatif dan positif nilai awal siri dari garis lurus.

Garis lurus dalam sistem dua koordinat (x, y) boleh ditakrifkan sebagai titik persilangan salah satu koordinat di dan sudut kecondongan kepada paksi X. Persamaan untuk garis lurus sedemikian akan kelihatan seperti di mana a- titik persimpangan; b sudut kecondongan.

Agar garis lurus mencerminkan perjalanan dinamik, adalah perlu untuk meminimumkan jumlah sisihan menegak. Apabila digunakan sebagai kriteria untuk menganggarkan pengecilan jumlah sisihan yang mudah, hasilnya tidak akan menjadi sangat baik, kerana sisihan negatif dan positif membatalkan satu sama lain. Meminimumkan jumlah nilai mutlak juga tidak membawa kepada keputusan yang memuaskan, kerana anggaran parameter dalam kes ini tidak stabil, terdapat juga kesukaran pengiraan dalam melaksanakan prosedur anggaran sedemikian. Oleh itu, prosedur yang paling biasa digunakan adalah untuk meminimumkan jumlah sisihan kuasa dua, atau kaedah kuasa dua terkecil(MNK).

Oleh kerana siri nilai awal mempunyai turun naik, model siri akan mengandungi ralat, yang kuasa duanya mesti diminimumkan

di mana y i memerhati nilai; y i * nilai teori model; nombor pemerhatian.

Apabila memodelkan aliran siri masa asal menggunakan aliran linear, kami akan menganggapnya

Membahagikan persamaan pertama dengan n, kita tiba di seterusnya

Menggantikan ungkapan yang terhasil ke dalam persamaan kedua sistem (3.10), untuk pekali b* kita mendapatkan:

3.7. Semakan kesesuaian model

Sebagai contoh, dalam rajah. 3.4 menunjukkan graf regresi linear antara kuasa kereta itu X dan kosnya di.

nasi. 3.4. Plot regresi linear

Persamaan untuk kes ini ialah: di=1455,3 + 13,4 X. Analisis visual rajah ini menunjukkan bahawa untuk beberapa pemerhatian terdapat penyelewengan yang ketara daripada lengkung teori. Graf baki ditunjukkan dalam Rajah. 3.5.

nasi. 3.5. Carta sisa

Analisis baki garis regresi boleh memberikan ukuran berguna tentang sejauh mana regresi anggaran mencerminkan data sebenar. Regresi yang baik ialah yang menerangkan sejumlah besar varians dan, sebaliknya, regresi yang buruk tidak menjejaki sejumlah besar turun naik dalam data asal. Secara intuitif jelas bahawa sebarang maklumat tambahan akan menambah baik model, iaitu, mengurangkan pecahan yang tidak dapat dijelaskan bagi variasi pembolehubah di. Untuk menganalisis regresi, kami akan menguraikan varians kepada komponen. Ia adalah jelas bahawa

Sebutan terakhir akan sama dengan sifar, kerana ia adalah jumlah baki, jadi kita sampai pada keputusan berikut

di mana SS0, SS1, SS2 tentukan jumlah, regresi dan jumlah baki kuasa dua, masing-masing.

Jumlah regresi kuasa dua mengukur bahagian varians yang dijelaskan oleh hubungan linear; bahagian sisa penyebaran, tidak dijelaskan oleh pergantungan linear.

Setiap jumlah ini dicirikan oleh bilangan darjah kebebasan (HR) yang sepadan, yang menentukan bilangan unit data yang bebas antara satu sama lain. Dalam erti kata lain, kadar denyutan jantung adalah berkaitan dengan bilangan pemerhatian n dan bilangan parameter yang dikira daripada keseluruhan parameter ini. Dalam kes yang sedang dipertimbangkan, untuk mengira SS0 hanya satu pemalar (nilai purata) ditentukan, oleh itu kadar denyutan jantung untuk SS0 akan jadi (n1), kadar denyutan jantung untuk SS 2 - (n - 2) dan kadar denyutan jantung untuk SS 1 akan jadi n - (n - 1)=1, kerana terdapat n - 1 titik malar dalam persamaan regresi. Sama seperti jumlah kuasa dua, kadar denyutan jantung dikaitkan dengan

Jumlah kuasa dua yang dikaitkan dengan penguraian varians, bersama-sama dengan kadar denyutan jantung yang sepadan, boleh diletakkan dalam jadual analisis varians yang dipanggil (jadual ANOVA ANalysis Of VAriance) (Jadual 3.1).

Jadual 3.1

Jadual ANOVA

Sumber

Jumlah persegi

Segi empat sederhana

Regresi

SS2/ (n-2)

Menggunakan singkatan yang diperkenalkan untuk jumlah kuasa dua, kami mentakrifkan pekali penentuan sebagai nisbah jumlah regresi kuasa dua kepada jumlah jumlah kuasa dua sebagai

(3.13)

Pekali penentuan mengukur bahagian kebolehubahan dalam pembolehubah Y, yang boleh dijelaskan menggunakan maklumat tentang kebolehubahan pembolehubah bebas x. Pekali penentuan berubah daripada sifar apabila X tidak menjejaskan Y, kepada satu apabila perubahan Y dijelaskan sepenuhnya oleh perubahan itu x.

3.8. Model Ramalan Regresi

Ramalan terbaik ialah ramalan yang mempunyai varians terkecil. Dalam kes kami, kuasa dua terkecil konvensional menghasilkan ramalan terbaik bagi semua kaedah yang memberikan anggaran tidak berat sebelah berdasarkan persamaan linear. Ralat ramalan yang dikaitkan dengan prosedur ramalan boleh datang daripada empat sumber.

Pertama, sifat rawak ralat aditif yang dikendalikan oleh regresi linear memastikan ramalan akan menyimpang daripada nilai sebenar walaupun model dinyatakan dengan betul dan parameternya diketahui dengan tepat.

Kedua, proses anggaran itu sendiri memperkenalkan ralat dalam anggaran parameter yang jarang boleh sama dengan nilai sebenar, walaupun ia sama dengannya secara purata.

Ketiga, dalam kes ramalan bersyarat (dalam kes nilai tepat pembolehubah bebas yang tidak diketahui), ralat diperkenalkan dengan ramalan pembolehubah penjelasan.

Keempat, ralat mungkin muncul kerana spesifikasi model tidak tepat.

Akibatnya, sumber ralat boleh dikelaskan seperti berikut:

  1. sifat pembolehubah;
  2. sifat model;
  3. ralat yang diperkenalkan oleh ramalan pembolehubah rawak bebas;
  4. ralat spesifikasi.

Kami akan mempertimbangkan ramalan tanpa syarat, apabila pembolehubah bebas diramalkan dengan mudah dan tepat. Kami memulakan pertimbangan kami tentang masalah kualiti ramalan dengan persamaan regresi berpasangan.

Pernyataan masalah dalam kes ini boleh dirumuskan seperti berikut: apakah ramalan terbaik y T+1, dengan syarat dalam model y = a + bx pilihan a dan b dianggarkan dengan tepat, dan nilainya xT+1 diketahui.

Kemudian nilai yang diramalkan boleh ditakrifkan sebagai

Ralat ramalan kemudiannya

.

Ralat ramalan mempunyai dua sifat:

Varians yang terhasil adalah minimum di antara semua anggaran yang mungkin berdasarkan persamaan linear.

Walaupun a dan b diketahui, ralat ramalan muncul disebabkan oleh fakta bahawa pada T+1 mungkin tidak terletak pada garis regresi kerana ralat ε T+1, mematuhi taburan normal dengan min sifar dan varians σ2. Untuk menyemak kualiti ramalan, kami memperkenalkan nilai ternormal

Selang keyakinan 95% kemudiannya boleh ditakrifkan seperti berikut:

di mana β 0.05 kuantiti taburan normal.

Sempadan selang 95% boleh ditakrifkan sebagai

Perhatikan bahawa dalam kes ini lebar selang keyakinan tidak bergantung pada saiz X, dan sempadan selang adalah garis lurus selari dengan garis regresi.

Lebih kerap, apabila membina garis regresi dan menyemak kualiti ramalan, adalah perlu untuk menilai bukan sahaja parameter regresi, tetapi juga varians ralat ramalan. Ia boleh ditunjukkan bahawa dalam kes ini varians ralat bergantung kepada nilai (), di mana nilai min bagi pembolehubah bebas. Di samping itu, lebih panjang siri, lebih tepat ramalan. Ralat ramalan berkurangan jika nilai X T+1 hampir dengan nilai min pembolehubah tidak bersandar, dan, sebaliknya, apabila bergerak menjauhi nilai min, ramalan menjadi kurang tepat. Pada rajah. 3.6 menunjukkan keputusan ramalan menggunakan persamaan regresi linear untuk 6 selang masa ke hadapan bersama-sama dengan selang keyakinan.

nasi. 3.6. Ramalan Regresi Linear

Seperti yang dapat dilihat dari rajah. 3.6, garis regresi ini tidak menggambarkan data asal dengan baik: terdapat variasi yang besar berbanding dengan garis pemasangan. Kualiti model juga boleh dinilai dengan sisa, yang, dengan model yang memuaskan, harus diagihkan kira-kira mengikut undang-undang biasa. Pada rajah. 3.7 menunjukkan graf baki, dibina menggunakan skala kebarangkalian.

Rajah.3.7. Carta sisa

Apabila menggunakan skala sedemikian, data yang mematuhi hukum biasa harus terletak pada garis lurus. Seperti berikut dari rajah, titik-titik pada permulaan dan akhir tempoh pemerhatian agak menyimpang dari garis lurus, yang menunjukkan kualiti yang tidak mencukupi bagi model yang dipilih dalam bentuk persamaan regresi linear.

Dalam jadual. Jadual 3.2 menunjukkan keputusan ramalan (lajur kedua) bersama-sama dengan selang keyakinan 95% (masing-masing lajur ketiga bawah dan keempat atas).

Jadual 3.2

Hasil ramalan

3.9. Model regresi berbilang variasi

Dalam regresi multivariate, data untuk setiap kes termasuk nilai pembolehubah bersandar dan setiap pembolehubah bebas. Pembolehubah bersandar y ialah pembolehubah rawak yang berkaitan dengan pembolehubah bebas dengan hubungan berikut:

di mana pekali regresi akan ditentukan; ε komponen ralat sepadan dengan sisihan nilai pembolehubah bersandar daripada nisbah sebenar (diandaikan bahawa ralat adalah bebas dan mempunyai taburan normal dengan min sifar dan varians tidak diketahui σ ).

Untuk set data tertentu, anggaran pekali regresi boleh didapati menggunakan kaedah kuasa dua terkecil. Jika anggaran OLS dilambangkan dengan , maka fungsi regresi yang sepadan akan kelihatan seperti:

Baki adalah anggaran komponen ralat dan serupa dengan baki dalam kes regresi linear mudah.

Analisis statistik model regresi berbilang variasi dijalankan sama seperti analisis regresi linear mudah. Pakej standard program statistik membolehkan anda memperoleh anggaran dengan kuasa dua terkecil untuk parameter model, anggaran ralat piawainya. Juga, anda boleh mendapatkan nilainya t-statistik untuk menyemak kepentingan istilah individu model regresi dan nilai F-statistik untuk menguji kepentingan pergantungan regresi.

Bentuk pembahagian jumlah kuasa dua dalam kes regresi multivariate adalah serupa dengan ungkapan (3.13), tetapi nisbah untuk kadar denyutan jantung adalah seperti berikut

Kami menekankan sekali lagi bahawa n ialah isipadu pemerhatian, dan k bilangan pembolehubah dalam model. Varians keseluruhan pembolehubah bersandar terdiri daripada dua komponen: varians yang dijelaskan oleh pembolehubah bebas melalui fungsi regresi dan varians yang tidak dapat dijelaskan.

Jadual ANOVA untuk kes regresi multivariate akan mempunyai bentuk yang ditunjukkan dalam Jadual. 3.3.

Jadual 3.3

Jadual ANOVA

Sumber

Jumlah persegi

Segi empat sederhana

Regresi

SS2/ (n-k-1)

Sebagai contoh regresi multivariate, kami akan menggunakan data daripada pakej Statistica (data file Kemiskinan.Sta) Data yang dibentangkan adalah berdasarkan perbandingan hasil bancian 1960 dan 1970. untuk sampel rawak 30 negara. Nama negara telah dimasukkan sebagai nama rentetan, dan nama semua pembolehubah dalam fail ini disenaraikan di bawah:

POP_CHNG perubahan penduduk untuk 1960-1970;

N_EMPLD bilangan orang yang bekerja dalam pertanian;

PT_POOR peratusan keluarga yang hidup di bawah paras kemiskinan;

TAX_RATE kadar cukai;

PT_PHONE peratusan pangsapuri dengan telefon;

PT_LURAL peratusan penduduk luar bandar;

UMUR pertengahan umur.

Sebagai pembolehubah bersandar, kami memilih ciri Pt_Miskin, dan sebagai bebas - semua yang lain. Pekali regresi yang dikira antara pembolehubah yang dipilih diberikan dalam Jadual. 3.4

Jadual 3.4

Pekali Regresi

Jadual ini menunjukkan pekali regresi ( AT) dan pekali regresi piawai ( beta). Dengan bantuan pekali AT bentuk persamaan regresi ditetapkan, yang dalam kes ini mempunyai bentuk:

Kemasukan di sebelah kanan pembolehubah ini adalah disebabkan oleh fakta bahawa hanya ciri ini mempunyai nilai kebarangkalian R kurang daripada 0.05 (lihat lajur keempat Jadual 3.4).

Bibliografi

  1. Basovsky L. E. Ramalan dan perancangan dalam keadaan pasaran. - M .: Infra - M, 2003.
  2. Box J., Jenkins G. Analisis siri masa. Isu 1. Ramalan dan pengurusan. – M.: Mir, 1974.
  3. Borovikov V. P., Ivchenko G. I. Ramalan dalam sistem Statistica dalam persekitaran Windows. - M.: Kewangan dan perangkaan, 1999.
  4. Duke W. Pemprosesan data pada PC dalam contoh. - St. Petersburg: Peter, 1997.
  5. Ivchenko B. P., Martyshchenko L. A., Ivantsov I. B. Mikroekonomi maklumat. Bahagian 1. Kaedah analisis dan ramalan. - St. Petersburg: Nordmed-Izdat, 1997.
  6. Krichevsky M. L. Pengenalan kepada rangkaian neural buatan: Proc. elaun. - St. Petersburg: St. Petersburg. negeri teknologi marin. un-t, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Analisis statistik multivariate dalam ekonomi. – M.: Unity-Dana, 1999.

Pengenalpastian dan analisis arah aliran sesuatu siri masa sering dilakukan dengan bantuan penjajaran atau pelicinannya. Pelicinan eksponen ialah salah satu teknik penjajaran siri yang paling mudah dan paling biasa. Pelicinan eksponen boleh diwakili sebagai penapis, input yang diterima secara berurutan oleh ahli siri asal, dan nilai semasa purata eksponen terbentuk pada output.

Biar menjadi siri masa.

Pelicinan eksponen siri dijalankan mengikut formula berulang: , .

Lebih kecil α, lebih banyak ditapis, turun naik ditindas siri asal dan bunyi.

Jika hubungan rekursif ini digunakan secara konsisten, maka purata eksponen boleh dinyatakan dalam sebutan nilai siri masa X.

Jika data terdahulu wujud pada masa pelicinan bermula, maka purata aritmetik semua atau sebahagian daripada data yang tersedia boleh digunakan sebagai nilai awal.

Selepas kemunculan karya R. Brown, pelicinan eksponen sering digunakan untuk menyelesaikan masalah peramalan jangka pendek siri masa.

Perumusan masalah

Biarlah siri masa diberikan: .

Ia adalah perlu untuk menyelesaikan masalah ramalan siri masa, i.e. cari

Meramal ufuk, adalah perlu itu

Untuk mengambil kira keusangan data, kami memperkenalkan urutan pemberat yang tidak bertambah , kemudian

Model coklat

Katakan bahawa D adalah kecil (ramalan jangka pendek), maka untuk menyelesaikan masalah sedemikian, gunakan model coklat.

Jika kita mempertimbangkan ramalan selangkah ke hadapan, maka - ralat ramalan ini, dan ramalan baru diperoleh hasil daripada melaraskan ramalan sebelumnya, dengan mengambil kira kesilapannya - intipati penyesuaian.

Dalam ramalan jangka pendek, adalah wajar untuk mencerminkan perubahan baharu secepat mungkin dan pada masa yang sama "membersihkan" siri daripada turun naik rawak sebaik mungkin. Itu. meningkatkan berat pemerhatian yang lebih baru: .

Sebaliknya, untuk melicinkan sisihan rawak, α mesti dikurangkan: .

Itu. kedua-dua keperluan ini bercanggah. Pencarian nilai kompromi α ialah masalah pengoptimuman model. Biasanya, α diambil daripada selang (0.1/3).

Contoh

Kerja pelicinan eksponen pada α=0.2 pada data laporan bulanan mengenai jualan jenama kereta asing di Rusia untuk tempoh dari Januari 2007 hingga Oktober 2008. Kami mencatatkan penurunan mendadak pada Januari dan Februari, apabila jualan secara tradisinya menurun dan meningkat pada awal musim panas.

Masalah

Model ini hanya berfungsi dengan ufuk ramalan kecil. Trend dan perubahan bermusim tidak diambil kira. Untuk mengambil kira pengaruh mereka, adalah dicadangkan untuk menggunakan model berikut: Holt (trend linear diambil kira), Holt-Winters (trend eksponen berganda dan bermusim), Theil-Wage (trend linear tambahan dan bermusim).