Biografi Ciri-ciri Analisis

Cara pelicinan eksponen berfungsi. Kaedah pelicinan eksponen

Tugas ramalan dibina berdasarkan perubahan dalam beberapa data dari semasa ke semasa (jualan, permintaan, penawaran, KDNK, pelepasan karbon, populasi ...) dan mengunjurkan perubahan ini ke masa hadapan. Malangnya, dikenal pasti pada data sejarah, trend boleh dilanggar oleh ramai keadaan yang tidak dijangka. Jadi data pada masa hadapan mungkin berbeza dengan ketara daripada apa yang berlaku pada masa lalu. Ini adalah masalah dengan ramalan.

Walau bagaimanapun, terdapat teknik (dipanggil pelicinan eksponen) yang membolehkan bukan sahaja untuk mencuba meramal masa depan, tetapi juga untuk menyatakan ketidakpastian secara berangka semua yang berkaitan dengan ramalan. Ungkapan berangka ketidakpastian dengan mencipta selang ramalan benar-benar tidak ternilai, tetapi sering diabaikan dalam dunia ramalan.

Muat turun nota dalam atau format, contoh dalam format

Data awal

Katakan anda peminat Lord of the Rings dan telah membuat dan menjual pedang selama tiga tahun (Rajah 1). Mari kita paparkan jualan secara grafik (Gamb. 2). Permintaan meningkat dua kali ganda dalam tempoh tiga tahun - mungkin ini trend? Kami akan kembali kepada idea ini sedikit kemudian. Terdapat beberapa puncak dan lembah pada carta, yang boleh menjadi tanda bermusim. Khususnya, kemuncaknya adalah pada bulan 12, 24, dan 36, iaitu pada bulan Disember. Tetapi mungkin ia hanya kebetulan? Mari kita ketahui.

Pelicinan eksponen mudah

Kaedah pelicinan eksponen adalah berdasarkan meramalkan masa depan daripada data dari masa lalu, di mana pemerhatian yang lebih baru lebih berat daripada yang lebih lama. Pemberatan sedemikian mungkin disebabkan oleh pemalar pelicinan. Kaedah pelicinan eksponen pertama yang akan kita cuba dipanggil pelicinan eksponen mudah (PES). pelicinan eksponen, SES). Ia hanya menggunakan satu pemalar pelicinan.

Pelicinan eksponen mudah mengandaikan bahawa siri masa data anda mempunyai dua komponen: tahap (atau min) dan beberapa ralat di sekitar nilai tersebut. Tiada trend atau turun naik bermusim - hanya terdapat tahap di mana permintaan turun naik, dikelilingi oleh ralat kecil di sana sini. Dengan memberi keutamaan kepada pemerhatian yang lebih baru, TEC boleh menyebabkan perubahan dalam tahap ini. Dalam bahasa formula,

Permintaan pada masa t = aras + ralat rawak berhampiran tahap pada masa t

Jadi bagaimana anda mencari nilai anggaran tahap? Jika kita menerima semua nilai masa sebagai mempunyai nilai yang sama, maka kita hanya perlu mengira nilai puratanya. Walau bagaimanapun, ini adalah idea yang tidak baik. Lebih berat harus diberikan kepada pemerhatian baru-baru ini.

Mari buat beberapa tahap. Kira garis dasar untuk tahun pertama:

tahap 0 = purata permintaan untuk tahun pertama (bulan 1-12)

Untuk permintaan pedang, ia adalah 163. Kami menggunakan tahap 0 (163) sebagai ramalan permintaan untuk bulan 1. Permintaan pada bulan 1 ialah 165, iaitu 2 pedang di atas tahap 0. Adalah wajar untuk mengemas kini anggaran garis dasar. Persamaan pelicinan eksponen mudah:

tahap 1 = tahap 0 + beberapa peratus × (permintaan 1 - tahap 0)

tahap 2 = tahap 1 + beberapa peratus × (permintaan 2 - tahap 1)

Dan lain-lain. "Beberapa peratus" dipanggil pemalar pelicinan, dan dilambangkan dengan alfa. Ia boleh menjadi sebarang nombor dari 0 hingga 100% (0 hingga 1). Anda akan belajar cara memilih nilai alfa kemudian. AT kes am nilai untuk titik masa yang berbeza:

Tahap tempoh semasa = tahap tempoh sebelumnya +
alpha × (tempoh semasa permintaan - peringkat tempoh sebelumnya)

Permintaan masa hadapan adalah sama dengan tahap pengiraan terakhir (Rajah 3). Memandangkan anda tidak tahu apa itu alpha, tetapkan sel C2 kepada 0.5 untuk bermula. Selepas model dibina, cari alfa supaya jumlah kuasa dua ralat itu ialah E2 (atau sisihan piawai– F2) adalah minimum. Untuk melakukan ini, jalankan pilihan Mencari Penyelesaian. Untuk melakukan ini, pergi melalui menu DATA –> Mencari Penyelesaian, dan tetapkan dalam tetingkap Pilihan Carian Penyelesaian nilai yang diperlukan (Rajah 4). Untuk menunjukkan hasil ramalan pada carta, mula-mula pilih julat A6:B41 dan bina carta garisan ringkas. Seterusnya, klik kanan pada rajah, pilih pilihan Pilih data. Dalam tetingkap yang terbuka, buat baris kedua dan masukkan ramalan daripada julat A42:B53 ke dalamnya (Gamb. 5).

Mungkin anda mempunyai trend

Untuk menguji andaian ini, ia sudah memadai regresi linear di bawah data permintaan dan lakukan ujian-t ke atas peningkatan garis aliran ini (seperti dalam ). Jika kecerunan garisan bukan sifar dan signifikan secara statistik (dalam ujian Pelajar, nilai R kurang daripada 0.05), data mempunyai arah aliran (Rajah 6).

Kami menggunakan fungsi LINEST, yang mengembalikan 10 Statistik deskriptif(jika anda tidak menggunakan fungsi ini sebelum ini, saya mengesyorkannya) dan fungsi INDEX, yang membolehkan anda "menarik keluar" hanya tiga statistik yang diperlukan, dan bukan keseluruhan set. Ternyata cerun adalah 2.54, dan ia adalah signifikan, kerana ujian Pelajar menunjukkan bahawa 0.000000012 adalah kurang daripada 0.05. Jadi, terdapat trend, dan ia kekal untuk memasukkannya dalam ramalan.

Pelicinan Holt eksponen dengan pembetulan arah aliran

Ia sering dirujuk sebagai pelicinan eksponen berganda kerana ia mempunyai dua parameter pelicinan, alfa, bukannya satu. Jika jujukan masa mempunyai arah aliran linear, maka:

permintaan dari semasa ke semasa t = tahap + t × trend + sisihan rawak tahap pada masa t

Holt Exponential Smoothing dengan pembetulan arah aliran mempunyai dua persamaan baharu, satu untuk tahap apabila ia bergerak ke hadapan mengikut masa dan satu lagi untuk arah aliran. Persamaan tahap mengandungi alfa parameter pelicinan, dan persamaan arah aliran mengandungi gamma. Inilah rupa persamaan tahap baharu:

tahap 1 = tahap 0 + aliran 0 + alfa × (permintaan 1 - (tahap 0 + aliran 0))

ambil perhatian bahawa tahap 0 + trend 0 hanyalah ramalan satu langkah daripada nilai asal hingga bulan 1, jadi permintaan 1 – (tahap 0 + trend 0) adalah penyelewengan satu langkah. Oleh itu, persamaan penghampiran tahap asas adalah seperti berikut:

tahap tempoh semasa = tahap tempoh sebelumnya + arah aliran tempoh sebelumnya + alfa × (permintaan tempoh semasa - (tahap tempoh sebelumnya) + arah aliran tempoh sebelumnya))

Persamaan kemas kini trend:

aliran tempoh semasa = aliran tempoh sebelumnya + gamma × alfa × (tempoh semasa permintaan – (peringkat tempoh sebelumnya) + aliran tempoh sebelumnya))

Pelicinan holt dalam Excel adalah serupa dengan pelicinan mudah (Rajah 7), dan, seperti di atas, matlamatnya adalah untuk mencari dua pekali sambil meminimumkan jumlah ralat kuasa dua (Rajah 8). Untuk mendapatkan tahap asal dan nilai aliran (dalam sel C5 dan D5 dalam Rajah 7), bina carta untuk 18 bulan pertama jualan dan tambahkan garis arah aliran dengan persamaan padanya. Masukkan nilai aliran awal 0.8369 dan tahap awal 155.88 ke dalam sel C5 dan D5. Data ramalan boleh dipersembahkan secara grafik (Rajah 9).

nasi. 7. Pelicinan Holt eksponen dengan pembetulan arah aliran; Untuk membesarkan imej, klik kanan padanya dan pilih Buka imej dalam tab baharu

Mencari corak dalam data

Terdapat cara untuk menguji kekuatan model ramalan - untuk membandingkan ralat dengan diri mereka sendiri, dialihkan dengan satu langkah (atau beberapa langkah). Jika sisihan adalah rawak, maka model tidak boleh diperbaiki. Walau bagaimanapun, mungkin terdapat faktor bermusim dalam data permintaan. Konsep ralat yang berkorelasi dengan versinya sendiri dalam tempoh yang berbeza dipanggil autokorelasi (untuk lebih lanjut mengenai autokorelasi, lihat ). Untuk mengira autokorelasi, mulakan dengan data ralat ramalan untuk setiap tempoh (pindah lajur F dalam Rajah 7 ke lajur B dalam Rajah 10). Tentukan seterusnya ralat purata ramalan (Rajah 10, sel B39; formula dalam sel: =PURATA(B3:B38)). Dalam lajur C, hitung sisihan ralat ramalan daripada min; formula dalam sel C3: =B3-B$39. Seterusnya, alihkan lajur C satu lajur ke kanan secara berurutan dan satu baris ke bawah. Formula dalam sel D39: =SUMPRODUCT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Apakah maksud "pergerakan segerak" dengan lajur C untuk salah satu lajur D: O. Sebagai contoh, jika lajur C dan D adalah segerak, maka nombor yang negatif dalam salah satu daripadanya mestilah negatif dalam yang lain, positif dalam satu. , positif dalam kawan. Ini bermakna jumlah hasil darab dua lajur akan menjadi ketara (perbezaan terkumpul). Atau, yang sama, semakin hampir nilai dalam julat D41:O41 kepada sifar, semakin rendah korelasi lajur (masing-masing dari D ke O) dengan lajur C (Rajah 11).

Satu autokorelasi berada di atas nilai kritikal. Ralat peralihan tahun berkorelasi dengan dirinya sendiri. Ini bermakna kitaran bermusim 12 bulan. Dan ini tidak menghairankan. Jika anda melihat graf permintaan (Rajah 2), ternyata terdapat kemuncak permintaan setiap Krismas dan penurunan pada bulan April-Mei. Pertimbangkan teknik ramalan yang mengambil kira bermusim.

Pelicinan Holt-Winters eksponen berganda

Kaedah ini dipanggil darab (dari darab - darab), kerana ia menggunakan pendaraban untuk mengambil kira kemusim:

Permintaan pada masa t = (tahap + t × arah aliran) × pelarasan bermusim pada masa t × sebarang baki pelarasan tidak teratur yang tidak dapat kami ambil kira

Pelicinan Holt-Winters juga dipanggil pelicinan eksponen tiga kali ganda kerana ia mempunyai tiga parameter pelicinan (faktor bermusim alfa, gamma dan delta). Contohnya, jika terdapat kitaran bermusim 12 bulan:

Ramalan bulanan 39 = (tahap 36 + 3 × arah aliran 36) x bermusim 27

Apabila menganalisis data, adalah perlu untuk mengetahui apakah arah aliran dalam siri data dan apakah kemusimannya. Untuk melakukan pengiraan menggunakan kaedah Holt-Winters, anda mesti:

  • Data sejarah lancar menggunakan kaedah purata bergerak.
  • Bandingkan versi terlicin bagi siri masa dengan yang asal untuk mendapatkan anggaran kasar bermusim.
  • Dapatkan data baharu tanpa komponen bermusim.
  • Cari anggaran tahap dan arah aliran berdasarkan data baharu ini.

Mulakan dengan data asal (lajur A dan B dalam Rajah 12) dan tambah lajur C dengan nilai terlicin berdasarkan purata bergerak. Memandangkan musim bermusim mempunyai kitaran 12 bulan, masuk akal untuk menggunakan purata 12 bulan. Terdapat masalah kecil dengan purata ini. 12 ialah nombor genap. Jika anda melancarkan permintaan untuk bulan 7, adakah ia patut dianggap sebagai permintaan purata dari bulan 1 hingga 12, atau dari 2 hingga 13? Untuk menangani kesukaran ini, kita perlu melicinkan permintaan menggunakan "purata bergerak 2x12". Iaitu, ambil separuh daripada dua purata dari bulan 1 hingga 12 dan dari 2 hingga 13. Formula dalam sel C8 ialah: =(PURATA(B3:B14)+PURATA(B2:B13))/2.

Data lancar untuk bulan 1–6 dan 31–36 tidak boleh diperoleh kerana tidak cukup tempoh sebelumnya dan seterusnya. Untuk kejelasan, data asal dan terlicin boleh ditunjukkan dalam gambar rajah (Rajah 13).

Sekarang, dalam lajur D, bahagikan nilai asal dengan nilai terlicin untuk mendapatkan anggaran pelarasan bermusim (lajur D dalam Rajah 12). Formula dalam sel D8: =B8/C8. Perhatikan lonjakan 20% melebihi permintaan biasa pada bulan 12 dan 24 (Disember) sementara terdapat penurunan pada musim bunga. Teknik melicinkan ini telah memberi anda dua anggaran mata untuk setiap bulan (jumlah 24 bulan). Lajur E ialah purata bagi kedua-dua faktor ini. Formula dalam sel E1 ialah: =PURATA(D14,D26). Untuk kejelasan, tahap turun naik bermusim boleh diwakili secara grafik (Rajah 14).

Kini anda boleh mendapatkan data yang dilaraskan untuk turun naik bermusim. Formula dalam sel G1: =B2/E2. Bina graf berdasarkan data dalam lajur G, lengkapkannya dengan garis arah aliran, paparkan persamaan arah aliran pada carta (Rajah 15), dan gunakan pekali dalam pengiraan seterusnya.

bentuk daun baru, seperti yang ditunjukkan dalam rajah. 16. Gantikan nilai dalam julat E5:E16 daripada rajah. 12 kawasan E2:E13. Ambil nilai C16 dan D16 daripada persamaan garis arah aliran dalam rajah. 15. Tetapkan nilai pemalar pelicinan untuk bermula pada sekitar 0.5. Kembangkan nilai dalam baris 17 dalam julat bulan 1 hingga 36. Jalankan Mencari Penyelesaian untuk mengoptimumkan pekali pelicinan (Rajah 18). Formula dalam sel B53: =(C$52+(A53-A$52)*D$52)*E41.

Sekarang dalam ramalan yang dibuat, anda perlu menyemak autokorelasi (Gamb. 18). Memandangkan semua nilai terletak di antara sempadan atas dan bawah, anda faham bahawa model itu melakukan kerja yang baik untuk memahami struktur nilai permintaan.

Membina selang keyakinan untuk ramalan

Jadi, kami mempunyai ramalan yang agak berkesan. Bagaimanakah anda menetapkan sempadan atas dan bawah yang boleh digunakan untuk membuat tekaan yang realistik? Simulasi Monte Carlo, yang telah anda temui (lihat juga ), akan membantu anda dengan ini. Intinya adalah untuk menjana senario masa depan tingkah laku permintaan dan menentukan kumpulan yang 95% daripada mereka jatuh.

Alih keluar dari helaian Ramalan Excel daripada sel B53:B64 (lihat Rajah 17). Anda akan menulis permintaan di sana berdasarkan simulasi. Yang terakhir boleh dijana menggunakan fungsi NORMINV. Untuk bulan akan datang, anda hanya perlu membekalkannya dengan min (0), taburan standard (10.37 dari sel $H$2) dan nombor rawak dari 0 hingga 1. Fungsi akan mengembalikan sisihan dengan kebarangkalian sepadan dengan lengkung loceng. Letakkan simulasi ralat satu langkah dalam sel G53: =NORMINV(RAND();0;H$2). Meregangkan formula ini ke G64 memberikan anda simulasi ralat ramalan untuk ramalan satu langkah selama 12 bulan (Rajah 19). Nilai simulasi anda akan berbeza daripada yang ditunjukkan dalam rajah (sebab itu ia adalah simulasi!).

Dengan Ralat Ramalan, anda mempunyai semua yang anda perlukan untuk mengemas kini tahap, arah aliran dan faktor bermusim. Jadi pilih sel C52:F52 dan rentangkannya ke baris 64. Akibatnya, anda mempunyai ralat ramalan simulasi dan ramalan itu sendiri. Beralih dari sebaliknya, adalah mungkin untuk meramalkan nilai permintaan. Masukkan formula ke dalam sel B53: =F53+G53 dan rentangkannya ke B64 (Gamb. 20, julat B53:F64). Kini anda boleh menekan butang F9, setiap kali mengemas kini ramalan. Letakkan keputusan 1000 simulasi dalam sel A71:L1070, setiap kali menukar nilai daripada julat B53:B64 kepada julat A71:L71, A72:L72, ... A1070:L1070. Jika ia mengganggu anda, tulis kod VBA.

Kini anda mempunyai 1000 senario untuk setiap bulan dan anda boleh menggunakan fungsi PERCENTILE untuk mendapatkan sempadan atas dan bawah di tengah-tengah selang keyakinan 95%. Dalam sel A66, formulanya ialah: =PERCENTILE(A71:A1070,0.975) dan dalam sel A67: =PERCENTILE(A71:A1070,0.025).

Seperti biasa, untuk kejelasan, data boleh dibentangkan dalam bentuk grafik(Gamb. 21).

Terdapat dua perkara menarik pada carta:

  • Margin ralat meningkat dengan masa. Ia masuk akal. Ketidakpastian terkumpul setiap bulan.
  • Dengan cara yang sama, ralat meningkat pada bahagian yang jatuh pada tempoh peningkatan permintaan bermusim. Dengan kejatuhannya yang seterusnya, ralat mengecut.

Berdasarkan bahan daripada buku oleh John Foreman. – M.: Alpina Publisher, 2016. – S. 329–381

Purata bergerak membolehkan anda melicinkan data dengan sempurna. Tetapi kelemahan utamanya ialah setiap nilai dalam data sumber mempunyai berat yang sama untuknya. Sebagai contoh, untuk purata bergerak menggunakan tempoh enam minggu, setiap nilai untuk setiap minggu diberi 1/6 daripada berat. Untuk beberapa statistik yang dikumpul, nilai yang lebih terkini diberi lebih berat. Oleh itu, pelicinan eksponen digunakan untuk memberikan data terkini lebih berat. Oleh itu, masalah statistik ini diselesaikan.

Formula Pengiraan Kaedah Melicin Eksponen dalam Excel

Rajah di bawah menunjukkan laporan permintaan untuk produk tertentu selama 26 minggu. Lajur Permintaan mengandungi maklumat tentang kuantiti barang yang dijual. Dalam lajur "Ramalan" - formula:

Lajur "Purata Pergerakan" mentakrifkan permintaan yang diramalkan, dikira menggunakan pengiraan biasa purata bergerak dengan tempoh 6 minggu:

Dalam lajur terakhir "Ramalan", dengan formula yang diterangkan di atas, kaedah pelicinan eksponen data digunakan di mana nilai minggu terakhir mempunyai lebih berat daripada yang sebelumnya.

Pekali "Alpha:" dimasukkan dalam sel G1, ini bermakna berat tugasan kepada data terkini. AT contoh ini ia mempunyai nilai 30%. Baki 70% berat diedarkan ke seluruh data. Iaitu, nilai kedua dari segi perkaitan (dari kanan ke kiri) mempunyai berat yang sama dengan 30% daripada baki 70% berat - ini adalah 21%, nilai ketiga mempunyai berat yang sama dengan 30% daripada yang lain. daripada 70% berat - 14.7% dan seterusnya .



Plot pelicinan eksponen

Rajah di bawah menunjukkan graf permintaan, purata bergerak dan ramalan pelicinan eksponen, yang dibina berdasarkan nilai asal:


Ambil perhatian bahawa ramalan pelicinan eksponen lebih responsif kepada perubahan dalam permintaan berbanding garis purata bergerak.

Data untuk minggu sebelumnya berturut-turut didarab dengan faktor alfa, dan hasilnya ditambah kepada peratus berat yang lain didarab dengan nilai ramalan sebelumnya.

9 5. Kaedah pelicinan eksponen. Memilih pemalar pelicinan

Apabila menggunakan kaedah petak terkecil untuk menentukan arah aliran ramalan (trend), diandaikan terlebih dahulu bahawa semua data retrospektif (pemerhatian) mempunyai kandungan maklumat yang sama. Jelas sekali, adalah lebih logik untuk mengambil kira proses diskaun maklumat latar belakang, iaitu, perbezaan data ini untuk pembangunan ramalan. Ini dicapai dalam kaedah pelicinan eksponen dengan memberikan pemerhatian terakhir bagi siri masa (iaitu, nilai serta-merta sebelum tempoh petunjuk ramalan) lebih ketara "berat" berbanding dengan pemerhatian awal. Kelebihan kaedah pelicinan eksponen juga harus merangkumi kesederhanaan operasi pengiraan dan fleksibiliti untuk menerangkan pelbagai dinamik proses. Kaedah ini telah menemui aplikasi terbaik untuk pelaksanaan ramalan jangka sederhana.

5.1. Intipati kaedah pelicinan eksponen

Intipati kaedah itu ialah siri dinamik dilicinkan dengan "purata bergerak" berwajaran di mana pemberat mengikut undang-undang eksponen. Dalam erti kata lain, semakin jauh dari penghujung siri masa ialah titik di mana purata bergerak wajaran dikira, semakin kurang "penyertaan yang diperlukan" dalam pembangunan ramalan.

Biarkan siri dinamik asal terdiri daripada tahap (komponen siri) y t , t = 1 , 2 ,...,n . Bagi setiap m peringkat berturut-turut siri ini

(m

siri dinamik dengan langkah yang sama dengan satu. Jika m ialah nombor ganjil, dan adalah lebih baik untuk mengambil nombor ganjil peringkat, kerana dalam kes ini nilai aras yang dikira akan berada di tengah-tengah selang pelicinan dan mudah untuk menggantikan nilai sebenar dengannya, maka formula berikut boleh ditulis untuk menentukan purata bergerak:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t−ξ

i= t−ξ

2ξ + 1

dengan y t ialah nilai purata bergerak untuk momen t (t = 1 , 2 ,...,n ); y i ialah nilai sebenar aras pada saat i

i ialah nombor ordinal aras dalam selang pelicinan.

Nilai ξ ditentukan daripada tempoh selang pelicinan.

Kerana ia

m =2 ξ +1

untuk m ganjil, maka

ξ = m 2 − 1 .

Pengiraan purata bergerak untuk sejumlah besar tahap boleh dipermudahkan dengan mentakrifkan nilai berturut-turut purata bergerak secara rekursif:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Tetapi memandangkan fakta bahawa pemerhatian terkini perlu diberi lebih "berat", purata bergerak perlu ditafsirkan secara berbeza. Ia terletak pada fakta bahawa nilai yang diperolehi dengan purata menggantikan bukan istilah pusat selang purata, tetapi sebutan terakhirnya. Sehubungan itu, ungkapan terakhir boleh ditulis semula sebagai

Mi = Mi + 1

y i− y i− m

Di sini purata bergerak, berkaitan dengan penghujung selang, dilambangkan dengan simbol baru M i . Pada asasnya, M i adalah sama dengan y t dianjak ξ langkah ke kanan, iaitu, M i = y t + ξ , di mana i = t + ξ .

Memandangkan M i − 1 ialah anggaran y i − m , ungkapan (5.1)

boleh ditulis semula dalam bentuk

y i+ 1

M i − 1 ,

M i ditakrifkan dengan ungkapan (5.1).

di mana M i ialah anggaran

Jika pengiraan (5.2) diulang apabila maklumat baru tiba

dan tulis semula dalam bentuk yang berbeza, maka kita memperoleh fungsi pemerhatian terlicin:

Q i= α y i+ (1 − α ) Q i− 1 ,

atau dalam bentuk yang setara

Q t= α y t+ (1 − α ) Q t− 1

Pengiraan yang dilakukan dengan ungkapan (5.3) dengan setiap cerapan baharu dipanggil pelicinan eksponen. Dalam ungkapan terakhir, untuk membezakan pelicinan eksponen daripada purata bergerak, tatatanda Q diperkenalkan dan bukannya M . Nilai α , iaitu

analog m 1 dipanggil pemalar pelicinan. Nilai α terletak pada

selang [ 0 , 1 ] . Jika α diwakili sebagai satu siri

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

adalah mudah untuk melihat bahawa "berat" berkurangan secara eksponen dalam masa. Sebagai contoh, untuk α = 0 , 2 kita dapat

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Jumlah siri cenderung kepada perpaduan, dan syarat jumlah itu berkurangan dengan masa.

Nilai Q t dalam ungkapan (5.3) ialah purata eksponen bagi susunan pertama, iaitu purata yang diperoleh secara langsung daripada

melicinkan data pemerhatian (primary smoothing). Kadangkala apabila membangunkan model statistik adalah berguna untuk menggunakan pengiraan purata eksponen bagi pesanan yang lebih tinggi, iaitu purata yang diperolehi dengan pelicinan eksponen berulang.

Tatatanda umum dalam bentuk rekursif bagi min eksponen bagi susunan k ialah

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Nilai k berbeza dalam 1, 2, …, p ,p+1 , di mana p ialah susunan polinomial ramalan (linear, kuadratik dan seterusnya).

Berdasarkan formula ini, untuk purata eksponen bagi susunan pertama, kedua dan ketiga, ungkapan

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Menentukan parameter model ramalan menggunakan kaedah pelicinan eksponen

Jelas sekali, untuk membangunkan nilai ramalan berdasarkan siri dinamik menggunakan kaedah pelicinan eksponen, adalah perlu untuk mengira pekali persamaan arah aliran melalui purata eksponen. Anggaran pekali ditentukan oleh teorem asas Brown-Meyer, yang mengaitkan pekali polinomial ramalan dengan purata eksponen bagi susunan yang sepadan:

(− 1 )

aˆp

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑j

p=0

p! (k− 1 ) !j = 0

di mana aˆ p ialah anggaran pekali polinomial darjah p .

Pekali didapati dengan menyelesaikan sistem (p + 1 ) persamaan сp + 1

tidak diketahui.

Jadi, untuk model linear

aˆ 0 = 2 Q t (1 ) − Q t (2 ) ; aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

untuk model kuadratik

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Ramalan dilaksanakan mengikut polinomial yang dipilih, masing-masing, untuk model linear

ˆyt + τ = aˆ0 + aˆ1 τ ;

untuk model kuadratik

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

di mana τ ialah langkah ramalan.

Perlu diingat bahawa purata eksponen Q t (k ) boleh dikira hanya dengan parameter (dipilih) yang diketahui, mengetahui keadaan awal Q 0 (k ) .

Anggaran keadaan awal, khususnya, untuk model linear

Q(1)= a

1 − α

Q(2 ) = a − 2 (1 − α ) a

untuk model kuadratik

Q(1)= a

1 − α

+ (1 − α )(2 − α ) a

2(1−α )

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q(3)=a

3(1−α )

(1 − α )(4 − 3 α ) a

di mana pekali a 0 dan a 1 dikira dengan kaedah kuasa dua terkecil.

Nilai parameter pelicinan α adalah lebih kurang dikira oleh formula

α ≈ m 2 + 1,

di mana m ialah bilangan cerapan (nilai) dalam selang pelicinan. Urutan pengiraan nilai ramalan ditunjukkan dalam

Pengiraan pekali siri dengan kaedah kuasa dua terkecil

Penentuan selang pelicinan

Pengiraan pemalar pelicinan

Pengiraan keadaan awal

Mengira purata eksponen

Pengiraan anggaran a 0 , a 1 , dsb.

Pengiraan nilai ramalan bagi satu siri

nasi. 5.1. Urutan pengiraan nilai ramalan

Sebagai contoh, pertimbangkan prosedur untuk mendapatkan nilai ramalan masa beroperasi produk, yang dinyatakan mengikut masa antara kegagalan.

Data awal diringkaskan dalam jadual. 5.1.

Kami memilih model ramalan linear dalam bentuk y t = a 0 + a 1 τ

Penyelesaian boleh dilaksanakan dengan nilai awal berikut:

a 0 , 0 = 64, 2; a 1 , 0 = 31.5; α = 0.305.

Jadual 5.1. Data awal

Nombor pemerhatian, t

Panjang langkah, ramalan, τ

MTBF, y (jam)

Untuk nilai ini, pekali "terlicin" yang dikira untuk

y 2 nilai akan sama

= α Q (1 )− Q (2 )= 97 , 9 ;

[ Q (1 ) − Q (2 )

31, 9 ,

1−α

dalam keadaan awal

1 − α

A 0 , 0 −

a 1, 0

= −7 , 6

1 − α

= −79 , 4

dan purata eksponen

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q(2)

= α Q (1 )

+ (1 −α ) Q (2 ) = −47 , 5 .

Nilai "terlicin" y 2 kemudiannya dikira dengan formula

Q i (1 )

Q i (2 )

a 0,i

a 1,i

ˆyt

Oleh itu (Jadual 5.2), model ramalan linear mempunyai bentuk

ˆy t + τ = 224.5+ 32τ .

Mari kita mengira nilai ramalan untuk tempoh plumbum selama 2 tahun (τ = 1), 4 tahun (τ = 2 ) dan seterusnya, masa antara kegagalan produk (Jadual 5.3).

Jadual 5.3. Nilai ramalanˆy t

Persamaan

t+2

t+4

t+6

t+8

t+20

regresi

(τ = 1)

(τ=2)

(τ = 3)

(τ=5)

τ =

ˆy t = 224.5+ 32τ

Perlu diingatkan bahawa jumlah "berat" nilai m terakhir siri masa boleh dikira dengan formula

c = 1 − (m (− 1 ) m ) . m+ 1

Oleh itu, untuk dua pemerhatian terakhir siri (m = 2 ) nilai c = 1 − (2 2 − + 1 1 ) 2 = 0. 667 .

5.3. Pilihan keadaan awal dan penentuan pemalar pelicinan

Seperti berikut daripada ungkapan

Q t= α y t+ (1 − α ) Q t− 1 ,

apabila melakukan pelicinan eksponen, adalah perlu untuk mengetahui nilai awal (sebelumnya) bagi fungsi terlicin. Dalam sesetengah kes, pemerhatian pertama boleh diambil sebagai nilai awal; lebih kerap, keadaan awal ditentukan mengikut ungkapan (5.4) dan (5.5). Dalam kes ini, nilai a 0 , 0 , a 1 , 0

dan a 2 , 0 ditentukan dengan kaedah kuasa dua terkecil.

Jika kita tidak benar-benar mempercayai nilai awal yang dipilih, maka dengan mengambil nilai besar pemalar pelicinan α melalui pemerhatian k, kita akan membawa

"berat" nilai awal sehingga nilai (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Oleh itu, pilihan pemalar pelicinan (atau bilangan pemerhatian dalam purata bergerak) melibatkan pertukaran. Biasanya, seperti yang ditunjukkan oleh amalan, nilai pemalar pelicinan terletak dalam julat dari 0.01 hingga 0.3.

Beberapa peralihan diketahui yang membolehkan seseorang mencari anggaran anggaran α . Yang pertama mengikuti daripada syarat bahawa purata bergerak dan purata eksponen adalah sama

α \u003d m 2 + 1,

di mana m ialah bilangan cerapan dalam selang pelicinan. Pendekatan lain dikaitkan dengan ketepatan ramalan.

Jadi, adalah mungkin untuk menentukan α berdasarkan hubungan Meyer:

α ≈ S y ,

di mana S y ialah ralat piawai model;

S 1 ialah min ralat kuasa dua siri asal.

Walau bagaimanapun, penggunaan nisbah yang terakhir adalah rumit oleh fakta bahawa sangat sukar untuk menentukan S y dan S 1 dengan pasti daripada maklumat awal.

Selalunya parameter pelicinan, dan pada masa yang sama pekali a 0 , 0 dan a 0 , 1

dipilih sebagai optimum bergantung pada kriteria

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j=0

dengan menyelesaikan sistem persamaan algebra, yang diperoleh dengan menyamakan terbitan kepada sifar

∂S2

∂S2

∂S2

∂a0, 0

∂ a 1, 0

∂a2, 0

Jadi, untuk model ramalan linear, kriteria awal adalah sama dengan

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j=0

Penyelesaian sistem ini dengan bantuan komputer tidak menimbulkan sebarang kesulitan.

Untuk pilihan α yang munasabah, anda juga boleh menggunakan prosedur pelicinan umum, yang membolehkan anda mendapatkan perhubungan berikut yang berkaitan dengan varians ramalan dan parameter pelicinan untuk model linear:

S p 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

untuk model kuadratik

S p 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

di mana β = 1 α ;Sy– Anggaran RMS bagi siri dinamik awal.

Topik 3. Melicinkan dan meramalkan siri masa berdasarkan model trend

matlamat kajian topik ini adalah penciptaan asas asas untuk latihan pengurus dalam kepakaran 080507 dalam bidang pembinaan model pelbagai tugas dalam bidang ekonomi, pembentukan pendekatan sistematik untuk menetapkan dan menyelesaikan masalah ramalan di kalangan pelajar . Kursus yang dicadangkan akan membolehkan pakar untuk cepat menyesuaikan diri dengan kerja amali, menavigasi maklumat saintifik dan teknikal dengan lebih baik dan kesusasteraan dalam kepakaran mereka, dan membuat keputusan yang lebih yakin yang timbul dalam kerja mereka.

Utama tugasan kajian topik adalah: pelajar memperoleh pengetahuan teori yang mendalam tentang aplikasi model ramalan, memperoleh kemahiran yang stabil dalam melaksanakan kerja penyelidikan, keupayaan untuk menyelesaikan masalah saintifik yang kompleks yang berkaitan dengan model pembinaan, termasuk yang multidimensi, keupayaan untuk menganalisis secara logik keputusan yang diperoleh dan menentukan cara untuk mencari penyelesaian yang boleh diterima.

Kaedah yang agak mudah untuk mengenal pasti aliran pembangunan ialah pelicinan siri masa, iaitu, menggantikan tahap sebenar dengan tahap yang dikira yang mempunyai variasi yang lebih kecil daripada data asal. Transformasi yang sepadan dipanggil penapisan. Mari kita pertimbangkan beberapa kaedah melicinkan.

3.1. purata mudah

Matlamat pelicinan adalah untuk membina model ramalan untuk tempoh masa hadapan berdasarkan pemerhatian lepas. Dalam kaedah purata mudah, nilai pembolehubah diambil sebagai data awal Y pada titik masa t, dan nilai ramalan ditentukan sebagai purata mudah untuk tempoh masa seterusnya. Formula pengiraan mempunyai bentuk

di mana n bilangan pemerhatian.

Dalam kes apabila pemerhatian baharu tersedia, ramalan yang baru diterima juga harus diambil kira untuk ramalan untuk tempoh seterusnya. Apabila menggunakan kaedah ini, ramalan dijalankan dengan purata semua data sebelumnya, namun, kelemahan ramalan tersebut ialah kesukaran penggunaannya dalam model trend.

3.2. Kaedah purata bergerak

Kaedah ini berdasarkan mewakili siri sebagai jumlah aliran yang agak lancar dan komponen rawak. Kaedah ini berdasarkan idea mengira nilai teori berdasarkan anggaran tempatan. Untuk membina anggaran trend pada satu titik t dengan nilai siri dari selang masa hitung nilai teori bagi siri itu. Yang paling meluas dalam amalan siri melicinkan adalah kes apabila semua pemberat untuk unsur-unsur selang adalah sama antara satu sama lain. Atas sebab ini, kaedah ini dipanggil kaedah purata bergerak, kerana apabila prosedur itu dilaksanakan, tetingkap dengan lebar (2 m + 1) sepanjang baris. Lebar tetingkap biasanya dianggap ganjil, kerana nilai teori dikira untuk nilai pusat: bilangan istilah k = 2m + 1 dengan bilangan aras yang sama di kiri dan kanan masa ini t.

Formula untuk mengira purata bergerak dalam kes ini mengambil bentuk:

Penyerakan purata bergerak ditakrifkan sebagai σ 2 /k, melalui mana σ2 menandakan varians istilah asal siri itu, dan k selang pelicinan, jadi semakin besar selang pelicinan, semakin kuat purata data dan semakin kurang arah alirannya. Selalunya, pelicinan dilakukan pada tiga, lima dan tujuh ahli siri asal. Dalam kes ini, ciri berikut bagi purata bergerak perlu diambil kira: jika kita mempertimbangkan satu siri dengan turun naik berkala dengan panjang tetap, maka apabila melicinkan berdasarkan purata bergerak dengan selang pelicinan sama dengan atau gandaan tempoh , turun naik akan dihapuskan sepenuhnya. Selalunya, pelicinan berdasarkan purata bergerak mengubah siri dengan begitu kuat sehingga aliran pembangunan yang dikenal pasti muncul hanya dalam istilah yang paling umum, manakala lebih kecil, tetapi penting untuk butiran analisis (gelombang, selekoh, dll.) hilang; selepas melicinkan, gelombang kecil kadangkala boleh menukar arah ke "lubang" bertentangan muncul di tempat "puncak", dan sebaliknya. Semua ini memerlukan berhati-hati dalam penggunaan purata bergerak mudah dan memaksa seseorang untuk mencari kaedah penerangan yang lebih halus.

Kaedah purata bergerak tidak memberikan nilai trend untuk yang pertama dan terakhir m ahli baris. Kelemahan ini amat ketara dalam kes apabila panjang baris adalah kecil.

3.3. Pelicinan Eksponen

Purata Eksponen y t ialah contoh purata bergerak berwajaran asimetri yang mengambil kira tahap penuaan data: maklumat "lama" dengan berat kurang memasuki formula untuk mengira nilai terlicin tahap siri

Di sini — min eksponen menggantikan nilai siri yang diperhatikan y t(pelicinan melibatkan semua data yang diterima sehingga saat semasa t), α parameter pelicinan mencirikan berat pemerhatian semasa (terbaru); 0< α <1.

Kaedah ini digunakan untuk meramalkan siri masa tidak pegun dengan perubahan rawak pada aras dan cerun. Apabila kita beralih dari detik masa semasa ke masa lalu, berat sebutan siri yang sepadan dengan cepat (secara eksponen) berkurangan dan secara praktikalnya tidak lagi memberi kesan ke atas nilai .

Adalah mudah untuk melihat bahawa hubungan terakhir membolehkan kita memberikan tafsiran berikut bagi purata eksponen: jika — ramalan nilai siri y t, maka perbezaannya ialah ralat ramalan. Jadi ramalan untuk titik masa seterusnya t+1 mengambil kira apa yang diketahui pada masa ini t ralat ramalan.

Pilihan melicinkan α adalah faktor penimbang. Jika α dekat dengan perpaduan, maka ramalan dengan ketara mengambil kira magnitud ralat ramalan terakhir. Untuk nilai kecil α nilai ramalan adalah hampir dengan ramalan sebelumnya. Pilihan parameter pelicinan adalah masalah yang agak rumit. Pertimbangan umum adalah seperti berikut: kaedah ini bagus untuk meramalkan siri yang cukup lancar. Dalam kes ini, seseorang boleh memilih pemalar pelicinan dengan meminimumkan ralat ramalan selangkah ke hadapan yang dianggarkan daripada sepertiga terakhir siri. Sesetengah pakar tidak mengesyorkan menggunakan nilai besar parameter pelicinan. Pada rajah. 3.1 menunjukkan contoh siri terlicin menggunakan kaedah pelicinan eksponen untuk α= 0,1.

nasi. 3.1. Hasil pelicinan eksponen pada α =0,1
(1 siri asal; 2 siri terlicin; 3 sisa)

3.4. Pelicinan Eksponen
berasaskan trend (kaedah Holt)

Kaedah ini mengambil kira arah aliran linear tempatan yang wujud dalam siri masa. Jika terdapat aliran menaik dalam siri masa, maka bersama-sama dengan anggaran tahap semasa, anggaran cerun juga diperlukan. Dalam teknik Holt, paras dan nilai cerun diratakan secara langsung dengan menggunakan pemalar yang berbeza untuk setiap parameter. Pemalar pelicinan membolehkan anda menganggarkan paras dan cerun semasa, memperhalusinya setiap kali pemerhatian baharu dibuat.

Kaedah Holt menggunakan tiga formula pengiraan:

  1. Siri Diperlancar Secara Eksponen (Anggaran Tahap Semasa)

(3.2)

  1. Penilaian trend

(3.3)

  1. Ramalan untuk R tempoh hadapan

(3.4)

di mana α, β pemalar melicinkan daripada selang .

Persamaan (3.2) adalah serupa dengan Persamaan (3.1) untuk pelicinan eksponen mudah kecuali untuk istilah arah aliran. berterusan β diperlukan untuk melicinkan anggaran arah aliran. Dalam persamaan ramalan (3.3), anggaran arah aliran didarabkan dengan bilangan tempoh R, yang berdasarkan ramalan, dan kemudian produk ini ditambahkan pada tahap data terlicin semasa.

Kekal α dan β dipilih secara subjektif atau dengan meminimumkan ralat ramalan. Nilai pemberat yang lebih besar diambil, lebih cepat tindak balas terhadap perubahan yang berterusan akan berlaku dan data akan lebih lancar. Pemberat yang lebih kecil menjadikan struktur nilai terlicin kurang rata.

Pada rajah. 3.2 menunjukkan contoh pelicinan siri menggunakan kaedah Holt untuk nilai α dan β sama dengan 0.1.

nasi. 3.2. Hasil pelicinan Holt
di α = 0,1 dan β = 0,1

3.5. Pelicinan Eksponen dengan Trend dan Variasi Bermusim (Kaedah Musim Sejuk)

Jika terdapat turun naik bermusim dalam struktur data, model pelicinan eksponen tiga parameter yang dicadangkan oleh Winters digunakan untuk mengurangkan ralat ramalan. Pendekatan ini adalah lanjutan daripada model Holt sebelumnya. Untuk mengambil kira variasi bermusim, persamaan tambahan digunakan di sini, dan kaedah ini diterangkan sepenuhnya oleh empat persamaan:

  1. Siri Terlicin Secara Eksponen

(3.5)

  1. Penilaian trend

(3.6)

  1. Penilaian kemusim

.

(3.7)

  1. Ramalan untuk R tempoh hadapan

(3.8)

di mana α, β, γ pelicinan berterusan untuk tahap, arah aliran dan kemusim, masing-masing; s- tempoh tempoh turun naik bermusim.

Persamaan (3.5) membetulkan siri terlicin. Dalam persamaan ini, istilah ini mengambil kira kemusim dalam data asal. Selepas kemusim dan arah aliran diambil kira dalam persamaan (3.6), (3.7), anggaran diratakan, dan ramalan dibuat dalam persamaan (3.8).

Sama seperti dalam kaedah sebelumnya, pemberat α, β, γ boleh dipilih secara subjektif atau dengan meminimumkan ralat ramalan. Sebelum menggunakan persamaan (3.5), adalah perlu untuk menentukan nilai awal untuk siri terlicin L t, trend T t, pekali kemusim S t. Biasanya, nilai awal siri terlicin diambil sama dengan pemerhatian pertama, maka trend adalah sifar, dan pekali bermusim ditetapkan sama dengan satu.

Pada rajah. 3.3 menunjukkan contoh melicinkan siri menggunakan kaedah Winters.

nasi. 3.3. Hasil pelicinan dengan kaedah Winters
di α = 0,1 = 0.1; γ = 0.1(1- baris asal; 2 baris terlicin; 3 sisa)

3.6. Ramalan berdasarkan model trend

Selalunya siri masa mempunyai arah aliran linear (trend). Dengan mengandaikan arah aliran linear, anda perlu membina garis lurus yang paling tepat mencerminkan perubahan dalam dinamik sepanjang tempoh yang dipertimbangkan. Terdapat beberapa kaedah untuk membina garis lurus, tetapi yang paling objektif dari sudut pandangan formal adalah pembinaan berdasarkan meminimumkan jumlah sisihan negatif dan positif nilai awal siri dari garis lurus.

Garis lurus dalam sistem dua koordinat (x, y) boleh ditakrifkan sebagai titik persilangan salah satu koordinat di dan sudut kecondongan kepada paksi X. Persamaan untuk garis lurus sedemikian akan kelihatan seperti di mana a- titik persimpangan; b sudut kecondongan.

Agar garis lurus mencerminkan perjalanan dinamik, adalah perlu untuk meminimumkan jumlah sisihan menegak. Apabila digunakan sebagai kriteria untuk menganggarkan pengecilan jumlah sisihan yang mudah, hasilnya tidak akan menjadi sangat baik, kerana sisihan negatif dan positif membatalkan satu sama lain. Meminimumkan jumlah nilai mutlak juga tidak membawa kepada keputusan yang memuaskan, kerana anggaran parameter dalam kes ini tidak stabil, terdapat juga kesukaran pengiraan dalam melaksanakan prosedur anggaran sedemikian. Oleh itu, prosedur yang paling biasa digunakan adalah untuk meminimumkan jumlah sisihan kuasa dua, atau kaedah kuasa dua terkecil(MNK).

Oleh kerana siri nilai awal mempunyai turun naik, model siri akan mengandungi ralat, yang kuasa duanya mesti diminimumkan

di mana y i memerhati nilai; y i * nilai teori model; nombor pemerhatian.

Apabila memodelkan aliran siri masa asal menggunakan aliran linear, kami akan menganggapnya

Membahagikan persamaan pertama dengan n, kita tiba di seterusnya

Menggantikan ungkapan yang terhasil ke dalam persamaan kedua sistem (3.10), untuk pekali b* kita mendapatkan:

3.7. Semakan kesesuaian model

Sebagai contoh, dalam rajah. 3.4 menunjukkan graf regresi linear antara kuasa kereta itu X dan kosnya di.

nasi. 3.4. Plot regresi linear

Persamaan untuk kes ini ialah: di=1455,3 + 13,4 X. Analisis visual rajah ini menunjukkan bahawa untuk beberapa pemerhatian terdapat penyelewengan yang ketara daripada lengkung teori. Graf baki ditunjukkan dalam Rajah. 3.5.

nasi. 3.5. Carta sisa

Analisis baki garis regresi boleh memberikan ukuran berguna tentang sejauh mana regresi anggaran mencerminkan data sebenar. Regresi yang baik ialah yang menerangkan sejumlah besar varians dan, sebaliknya, regresi yang buruk tidak menjejaki sejumlah besar turun naik dalam data asal. Secara intuitif jelas bahawa sebarang maklumat tambahan akan menambah baik model, iaitu, mengurangkan pecahan yang tidak dapat dijelaskan bagi variasi pembolehubah di. Untuk menganalisis regresi, kami akan menguraikan varians kepada komponen. Ia adalah jelas bahawa

Sebutan terakhir akan sama dengan sifar, kerana ia adalah jumlah baki, jadi kita sampai pada keputusan berikut

di mana SS0, SS1, SS2 tentukan jumlah, regresi dan jumlah baki kuasa dua, masing-masing.

Jumlah regresi kuasa dua mengukur bahagian varians yang dijelaskan oleh hubungan linear; bahagian sisa penyebaran, tidak dijelaskan oleh pergantungan linear.

Setiap jumlah ini dicirikan oleh bilangan darjah kebebasan (HR) yang sepadan, yang menentukan bilangan unit data yang bebas antara satu sama lain. Dalam erti kata lain, kadar denyutan jantung adalah berkaitan dengan bilangan pemerhatian n dan bilangan parameter yang dikira daripada keseluruhan parameter ini. Dalam kes yang sedang dipertimbangkan, untuk mengira SS0 hanya satu pemalar (nilai purata) ditentukan, oleh itu kadar denyutan jantung untuk SS0 akan jadi (n1), kadar denyutan jantung untuk SS 2 - (n - 2) dan kadar denyutan jantung untuk SS 1 akan jadi n - (n - 1)=1, kerana terdapat n - 1 titik malar dalam persamaan regresi. Sama seperti jumlah kuasa dua, kadar denyutan jantung dikaitkan dengan

Jumlah kuasa dua yang dikaitkan dengan penguraian varians, bersama-sama dengan kadar denyutan jantung yang sepadan, boleh diletakkan dalam jadual analisis varians yang dipanggil (jadual ANOVA ANalysis Of VAriance) (Jadual 3.1).

Jadual 3.1

Jadual ANOVA

Sumber

Jumlah persegi

Segi empat sederhana

Regresi

SS2/ (n-2)

Menggunakan singkatan yang diperkenalkan untuk jumlah kuasa dua, kami mentakrifkan pekali penentuan sebagai nisbah jumlah regresi kuasa dua kepada jumlah jumlah kuasa dua sebagai

(3.13)

Pekali penentuan mengukur bahagian kebolehubahan dalam pembolehubah Y, yang boleh dijelaskan menggunakan maklumat tentang kebolehubahan pembolehubah bebas x. Pekali penentuan berubah daripada sifar apabila X tidak menjejaskan Y, kepada satu apabila perubahan Y dijelaskan sepenuhnya oleh perubahan itu x.

3.8. Model Ramalan Regresi

Ramalan terbaik ialah ramalan yang mempunyai varians terkecil. Dalam kes kami, kuasa dua terkecil konvensional menghasilkan ramalan terbaik bagi semua kaedah yang memberikan anggaran tidak berat sebelah berdasarkan persamaan linear. Ralat ramalan yang dikaitkan dengan prosedur ramalan boleh datang daripada empat sumber.

Pertama, sifat rawak ralat aditif yang dikendalikan oleh regresi linear memastikan ramalan akan menyimpang daripada nilai sebenar walaupun model dinyatakan dengan betul dan parameternya diketahui dengan tepat.

Kedua, proses anggaran itu sendiri memperkenalkan ralat dalam anggaran parameter yang jarang boleh sama dengan nilai sebenar, walaupun ia sama dengannya secara purata.

Ketiga, dalam kes ramalan bersyarat (dalam kes nilai tepat pembolehubah bebas yang tidak diketahui), ralat diperkenalkan dengan ramalan pembolehubah penjelasan.

Keempat, ralat mungkin muncul kerana spesifikasi model tidak tepat.

Akibatnya, sumber ralat boleh dikelaskan seperti berikut:

  1. sifat pembolehubah;
  2. sifat model;
  3. ralat yang diperkenalkan oleh ramalan pembolehubah rawak bebas;
  4. ralat spesifikasi.

Kami akan mempertimbangkan ramalan tanpa syarat, apabila pembolehubah bebas diramalkan dengan mudah dan tepat. Kami memulakan pertimbangan kami tentang masalah kualiti ramalan dengan persamaan regresi berpasangan.

Pernyataan masalah dalam kes ini boleh dirumuskan seperti berikut: apakah ramalan terbaik y T+1, dengan syarat dalam model y = a + bx pilihan a dan b dianggarkan dengan tepat, dan nilainya xT+1 diketahui.

Kemudian nilai ramalan boleh ditakrifkan sebagai

Ralat ramalan kemudiannya

.

Ralat ramalan mempunyai dua sifat:

Varians yang terhasil adalah minimum di antara semua anggaran yang mungkin berdasarkan persamaan linear.

Walaupun a dan b diketahui, ralat ramalan muncul disebabkan oleh fakta bahawa pada T+1 mungkin tidak terletak pada garis regresi kerana ralat ε T+1, mematuhi taburan normal dengan min sifar dan varians σ2. Untuk menyemak kualiti ramalan, kami memperkenalkan nilai ternormal

Selang keyakinan 95% kemudiannya boleh ditakrifkan seperti berikut:

di mana β 0.05 kuantiti taburan normal.

Sempadan selang 95% boleh ditakrifkan sebagai

Perhatikan bahawa dalam kes ini lebar selang keyakinan tidak bergantung pada saiz X, dan sempadan selang adalah garis lurus selari dengan garis regresi.

Lebih kerap, apabila membina garis regresi dan menyemak kualiti ramalan, adalah perlu untuk menilai bukan sahaja parameter regresi, tetapi juga varians ralat ramalan. Ia boleh ditunjukkan bahawa dalam kes ini varians ralat bergantung kepada nilai (), di mana nilai min bagi pembolehubah bebas. Di samping itu, lebih panjang siri, lebih tepat ramalan. Ralat ramalan berkurangan jika nilai X T+1 hampir dengan nilai min pembolehubah tidak bersandar, dan, sebaliknya, apabila bergerak menjauhi nilai min, ramalan menjadi kurang tepat. Pada rajah. 3.6 menunjukkan keputusan ramalan menggunakan persamaan regresi linear untuk 6 selang masa ke hadapan bersama-sama dengan selang keyakinan.

nasi. 3.6. Ramalan Regresi Linear

Seperti yang dapat dilihat dari rajah. 3.6, garis regresi ini tidak menggambarkan data asal dengan baik: terdapat variasi yang besar berbanding dengan garis pemasangan. Kualiti model juga boleh dinilai dengan sisa, yang, dengan model yang memuaskan, harus diagihkan kira-kira mengikut undang-undang biasa. Pada rajah. 3.7 menunjukkan graf baki, dibina menggunakan skala kebarangkalian.

Rajah.3.7. Carta sisa

Apabila menggunakan skala sedemikian, data yang mematuhi hukum biasa harus terletak pada garis lurus. Seperti berikut dari rajah, titik-titik pada permulaan dan akhir tempoh pemerhatian agak menyimpang dari garis lurus, yang menunjukkan kualiti yang tidak mencukupi bagi model yang dipilih dalam bentuk persamaan regresi linear.

Dalam jadual. Jadual 3.2 menunjukkan keputusan ramalan (lajur kedua) bersama-sama dengan selang keyakinan 95% (masing-masing lajur ketiga bawah dan keempat atas).

Jadual 3.2

Hasil ramalan

3.9. Model regresi berbilang variasi

Dalam regresi multivariate, data untuk setiap kes termasuk nilai pembolehubah bersandar dan setiap pembolehubah bebas. Pembolehubah bersandar y ialah pembolehubah rawak yang berkaitan dengan pembolehubah bebas dengan hubungan berikut:

di mana pekali regresi akan ditentukan; ε komponen ralat sepadan dengan sisihan nilai pembolehubah bersandar daripada nisbah sebenar (diandaikan bahawa ralat adalah bebas dan mempunyai taburan normal dengan min sifar dan varians tidak diketahui σ ).

Untuk set data tertentu, anggaran pekali regresi boleh didapati menggunakan kaedah kuasa dua terkecil. Jika anggaran OLS dilambangkan dengan , maka fungsi regresi yang sepadan akan kelihatan seperti:

Baki adalah anggaran komponen ralat dan serupa dengan baki dalam kes regresi linear mudah.

Analisis statistik model regresi berbilang variasi dijalankan sama seperti analisis regresi linear mudah. Pakej standard program statistik membolehkan anda memperoleh anggaran dengan kuasa dua terkecil untuk parameter model, anggaran ralat piawainya. Juga, anda boleh mendapatkan nilainya t-statistik untuk menyemak kepentingan istilah individu model regresi dan nilai F-statistik untuk menguji kepentingan pergantungan regresi.

Bentuk pembahagian jumlah kuasa dua dalam kes regresi multivariate adalah serupa dengan ungkapan (3.13), tetapi nisbah untuk kadar denyutan jantung adalah seperti berikut

Kami menekankan sekali lagi bahawa n ialah isipadu pemerhatian, dan k bilangan pembolehubah dalam model. Varians keseluruhan pembolehubah bersandar terdiri daripada dua komponen: varians yang dijelaskan oleh pembolehubah bebas melalui fungsi regresi dan varians yang tidak dapat dijelaskan.

Jadual ANOVA untuk kes regresi multivariate akan mempunyai bentuk yang ditunjukkan dalam Jadual. 3.3.

Jadual 3.3

Jadual ANOVA

Sumber

Jumlah persegi

Segi empat sederhana

Regresi

SS2/ (n-k-1)

Sebagai contoh regresi multivariate, kami akan menggunakan data daripada pakej Statistica (data file Kemiskinan.Sta) Data yang dibentangkan adalah berdasarkan perbandingan hasil bancian 1960 dan 1970. untuk sampel rawak 30 negara. Nama negara telah dimasukkan sebagai nama rentetan, dan nama semua pembolehubah dalam fail ini disenaraikan di bawah:

POP_CHNG perubahan penduduk untuk 1960-1970;

N_EMPLD bilangan orang yang bekerja dalam pertanian;

PT_POOR peratusan keluarga yang hidup di bawah paras kemiskinan;

TAX_RATE kadar cukai;

PT_PHONE peratusan pangsapuri dengan telefon;

PT_LURAL peratusan penduduk luar bandar;

UMUR pertengahan umur.

Sebagai pembolehubah bersandar, kami memilih ciri Pt_Miskin, dan sebagai bebas - semua yang lain. Pekali regresi yang dikira antara pembolehubah yang dipilih diberikan dalam Jadual. 3.4

Jadual 3.4

Pekali Regresi

Jadual ini menunjukkan pekali regresi ( AT) dan pekali regresi piawai ( beta). Dengan bantuan pekali AT bentuk persamaan regresi ditetapkan, yang dalam kes ini mempunyai bentuk:

Kemasukan di sebelah kanan pembolehubah ini adalah disebabkan oleh fakta bahawa hanya ciri ini mempunyai nilai kebarangkalian R kurang daripada 0.05 (lihat lajur keempat Jadual 3.4).

Bibliografi

  1. Basovsky L. E. Ramalan dan perancangan dalam keadaan pasaran. - M .: Infra - M, 2003.
  2. Box J., Jenkins G. Analisis siri masa. Isu 1. Ramalan dan pengurusan. – M.: Mir, 1974.
  3. Borovikov V. P., Ivchenko G. I. Ramalan dalam sistem Statistica dalam persekitaran Windows. - M.: Kewangan dan perangkaan, 1999.
  4. Duke V. Pemprosesan data pada PC dalam contoh. - St. Petersburg: Peter, 1997.
  5. Ivchenko B. P., Martyshchenko L. A., Ivantsov I. B. Mikroekonomi maklumat. Bahagian 1. Kaedah analisis dan ramalan. - St. Petersburg: Nordmed-Izdat, 1997.
  6. Krichevsky M. L. Pengenalan kepada rangkaian neural buatan: Proc. elaun. - St. Petersburg: St. Petersburg. negeri teknologi marin. un-t, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Analisis statistik multivariate dalam ekonomi. – M.: Unity-Dana, 1999.

1. Peruntukan metodologi asas.

Kaedah pelicinan eksponen mudah menggunakan purata bergerak berwajaran (eksponen) bagi semua pemerhatian sebelumnya. Model ini paling kerap digunakan untuk data di mana ia adalah perlu untuk menilai kehadiran hubungan antara penunjuk yang dianalisis (trend) atau pergantungan data yang dianalisis. Tujuan pelicinan eksponen adalah untuk menganggarkan keadaan semasa, yang hasilnya akan menentukan semua ramalan masa depan.

Pelicinan eksponen menyediakan pengemaskinian berterusan model kerana data terkini. Kaedah ini adalah berdasarkan purata (melicinkan) siri masa pemerhatian lalu dalam arah menurun (eksponen). Iaitu, peristiwa kemudian diberi lebih berat. Berat ditetapkan seperti berikut: untuk pemerhatian terakhir, berat akan menjadi nilai α, untuk yang terakhir - (1-α), untuk yang sebelum itu - (1-α) 2, dsb.

Dalam bentuk terlicin, ramalan baharu (untuk tempoh masa t + 1) boleh diwakili sebagai purata wajaran pemerhatian terakhir kuantiti pada masa t dan ramalan sebelumnya untuk tempoh yang sama t. Selain itu, berat α diberikan kepada nilai yang diperhatikan, dan berat (1- α) diberikan kepada ramalan; diandaikan bahawa 0< α<1. Это правило в общем виде можно записать следующим образом.

Ramalan baharu = [α*(pemerhatian terakhir)]+[(1- α)*ramalan terakhir]

di manakah nilai ramalan untuk tempoh seterusnya;

α ialah pemalar pelicinan;

Y t ialah cerapan nilai bagi tempoh semasa t;

Ramalan terlicin sebelumnya bagi nilai ini untuk tempoh t.

Pelicinan eksponen ialah prosedur untuk menyemak keputusan ramalan secara berterusan berdasarkan perkembangan terkini.

Pemalar pelicinan α ialah faktor berwajaran. Nilai sebenarnya ditentukan oleh sejauh mana pemerhatian semasa harus mempengaruhi nilai yang diramalkan. Jika α menghampiri 1, maka ramalan mengambil kira nilai ralat ramalan terakhir. Sebaliknya, untuk nilai kecil α, nilai ramalan adalah paling hampir dengan ramalan sebelumnya. Boleh dianggap sebagai purata wajaran semua pemerhatian lalu dengan pemberat menurun secara eksponen dengan "umur" data.



Jadual 2.1

Perbandingan pengaruh nilai yang berbeza bagi pemalar pelicinan

Pemalar α adalah kunci kepada analisis data. Sekiranya nilai yang diramalkan adalah stabil dan sisihan rawak diharuskan, adalah perlu untuk memilih nilai α yang kecil. Nilai pemalar α yang besar adalah masuk akal jika anda memerlukan tindak balas yang cepat terhadap perubahan dalam spektrum pemerhatian.

2. Contoh praktikal pelicinan eksponen.

Data syarikat dari segi jumlah jualan (ribu unit) selama tujuh tahun dibentangkan, pemalar pelicinan diambil bersamaan dengan 0.1 dan 0.6. Data selama 7 tahun membentuk bahagian ujian; pada mereka adalah perlu untuk menilai keberkesanan setiap model. Untuk pelicinan eksponen siri, nilai awal diambil bersamaan dengan 500 (nilai pertama data sebenar atau nilai purata untuk 3-5 tempoh direkodkan dalam nilai terlicin untuk suku ke-2).

Jadual 2.2

Data awal

Masa Nilai sebenar (sebenar) Nilai terlicin Ralat ramalan
tahun suku 0,1 0,1
cemerlang mengikut formula
#T/A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

Pada rajah. 2.1 menunjukkan ramalan berdasarkan pelicinan eksponen dengan pemalar pelicinan 0.1.



nasi. 2.1. Pelicinan Eksponen

Penyelesaian dalam Excel.

1. Pilih menu "Alat" - "Analisis Data". Daripada senarai Alat Analisis, pilih Pelicinan Eksponen. Jika tiada analisis data dalam menu "Alat", maka anda perlu memasang "Pakej Analisis". Untuk melakukan ini, cari item "Tetapan" dalam "Parameter" dan dalam kotak dialog yang muncul, tandai kotak untuk "Pakej Analisis", klik OK.

2. Kotak dialog yang ditunjukkan dalam rajah. 2.2.

3. Dalam medan "selang input", masukkan nilai data awal (tambah satu sel percuma).

4. Pilih kotak semak "label" (jika julat input mengandungi nama lajur).

5. Masukkan nilai (1-α) dalam medan faktor redaman.

6. Dalam medan "selang input", masukkan nilai sel di mana anda ingin melihat nilai yang diterima.

7. Tandakan kotak "Pilihan" - "Output graf" untuk membinanya secara automatik.

nasi. 2.2. Kotak dialog untuk pelicinan eksponen

3. Tugas kerja makmal.

Terdapat data awal tentang volum pengeluaran perusahaan pengeluar minyak selama 2 tahun, dibentangkan dalam Jadual 2.3:

Jadual 2.3

Data awal

Lakukan pelicinan eksponen siri. Ambil pekali pelicinan eksponen bersamaan dengan 0.1; 0.2; 0.3. Komen pada keputusan. Anda boleh menggunakan statistik yang dibentangkan dalam Lampiran 1.