Biografi Ciri-ciri Analisis

Penyelesaian kuasa dua terkecil. LSM dalam kes model linear

Contoh.

Data eksperimen tentang nilai pembolehubah X dan di diberikan dalam jadual.

Hasil daripada penjajaran mereka, fungsi

menggunakan kaedah petak terkecil , anggaran data ini dengan pergantungan linear y=ax+b(cari parameter a dan b). Ketahui yang mana antara dua baris yang lebih baik (dalam erti kata kaedah kuasa dua terkecil) menjajarkan data eksperimen. Buat lukisan.

Intipati kaedah kuasa dua terkecil (LSM).

Masalahnya ialah untuk mencari pekali pergantungan linear yang mana fungsi dua pembolehubah a dan b menerima nilai terkecil. Iaitu, diberikan data a dan b jumlah sisihan kuasa dua data eksperimen daripada garis lurus yang ditemui akan menjadi yang terkecil. Ini adalah titik keseluruhan kaedah kuasa dua terkecil.

Oleh itu, penyelesaian contoh dikurangkan kepada mencari ekstrem bagi fungsi dua pembolehubah.

Terbitan formula untuk mencari pekali.

Sistem dua persamaan dengan dua tidak diketahui disusun dan diselesaikan. Mencari terbitan separa bagi fungsi oleh pembolehubah a dan b, kita samakan derivatif ini kepada sifar.

Kami menyelesaikan sistem persamaan yang terhasil dengan sebarang kaedah (contohnya kaedah penggantian atau kaedah Cramer) dan dapatkan formula untuk mencari pekali menggunakan kaedah kuasa dua terkecil (LSM).

Dengan data a dan b fungsi mengambil nilai terkecil. Bukti fakta ini diberikan di bawah teks pada penghujung halaman.

Itulah keseluruhan kaedah kuasa dua terkecil. Formula untuk mencari parameter a mengandungi jumlah ,,, dan parameter n- jumlah data eksperimen. Nilai jumlah ini disyorkan untuk dikira secara berasingan. Pekali b ditemui selepas pengiraan a.

Sudah tiba masanya untuk mengingati contoh asal.

Penyelesaian.

Dalam contoh kita n=5. Kami mengisi jadual untuk kemudahan mengira jumlah yang termasuk dalam formula pekali yang diperlukan.

Nilai dalam baris keempat jadual diperoleh dengan mendarabkan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap nombor i.

Nilai dalam baris kelima jadual diperoleh dengan mengkuadratkan nilai baris ke-2 untuk setiap nombor i.

Nilai lajur terakhir jadual ialah jumlah nilai merentas baris.

Kami menggunakan formula kaedah kuasa dua terkecil untuk mencari pekali a dan b. Kami menggantikannya dengan nilai yang sepadan dari lajur terakhir jadual:

Akibatnya, y=0.165x+2.184 ialah garis lurus penghampiran yang dikehendaki.

Ia kekal untuk mengetahui yang mana satu baris y=0.165x+2.184 atau lebih baik menghampiri data asal, iaitu untuk membuat anggaran menggunakan kaedah kuasa dua terkecil.

Anggaran ralat kaedah kuasa dua terkecil.

Untuk melakukan ini, anda perlu mengira jumlah sisihan kuasa dua bagi data asal daripada baris ini dan , nilai yang lebih kecil sepadan dengan garis yang lebih baik menghampiri data asal dari segi kaedah kuasa dua terkecil.

Sejak , kemudian baris y=0.165x+2.184 menganggarkan data asal dengan lebih baik.

Ilustrasi grafik kaedah kuasa dua terkecil (LSM).

Semuanya kelihatan hebat pada carta. Garis merah ialah garisan yang ditemui y=0.165x+2.184, garis biru ialah , titik merah jambu adalah data asal.

Dalam amalan, apabila memodelkan pelbagai proses - khususnya, ekonomi, fizikal, teknikal, sosial - satu atau kaedah lain untuk mengira nilai anggaran fungsi dari nilai yang diketahui pada beberapa titik tetap digunakan secara meluas.

Masalah penghampiran fungsi seperti ini sering timbul:

    apabila membina formula anggaran untuk mengira nilai kuantiti ciri proses yang dikaji mengikut data jadual yang diperoleh hasil daripada eksperimen;

    dalam pengamiran berangka, pembezaan, penyelesaian persamaan pembezaan dan lain-lain.;

    jika perlu untuk mengira nilai fungsi pada titik perantaraan selang yang dipertimbangkan;

    apabila menentukan nilai kuantiti ciri proses di luar selang yang sedang dipertimbangkan, khususnya, semasa ramalan.

Jika, untuk memodelkan proses tertentu yang ditentukan oleh jadual, fungsi dibina yang menggambarkan proses ini lebih kurang berdasarkan kaedah kuasa dua terkecil, ia akan dipanggil fungsi penghampiran (regresi), dan tugas membina fungsi penghampiran itu sendiri akan menjadi masalah anggaran.

Artikel ini membincangkan kemungkinan pakej MS Excel untuk menyelesaikan masalah tersebut, di samping itu, kaedah dan teknik untuk membina (mencipta) regresi untuk fungsi yang diberikan secara jadual (yang merupakan asas analisis regresi) diberikan.

Terdapat dua pilihan untuk membina regresi dalam Excel.

    Menambah Regresi Terpilih ( garis trend- garis arah aliran) ke dalam carta yang dibina berdasarkan jadual data untuk ciri proses yang dikaji (hanya tersedia jika carta dibina);

    Menggunakan fungsi statistik terbina dalam lembaran kerja Excel, yang membolehkan anda mendapatkan regresi (garisan aliran) terus daripada jadual data sumber.

Menambah Garis Aliran pada Carta

Untuk jadual data yang menerangkan proses tertentu dan diwakili oleh gambar rajah, Excel mempunyai alat analisis regresi yang berkesan yang membolehkan anda:

    bina berdasarkan kaedah kuasa dua terkecil dan tambah lima pada rajah jenis regresi, yang, dengan tahap ketepatan yang berbeza-beza, memodelkan proses yang sedang dikaji;

    tambahkan persamaan regresi yang dibina pada rajah;

    tentukan tahap pematuhan regresi yang dipilih dengan data yang dipaparkan pada carta.

Berdasarkan data carta, Excel membolehkan anda mendapatkan jenis regresi linear, polinomial, logaritma, eksponen, eksponen, yang diberikan oleh persamaan:

y = y(x)

di mana x ialah pembolehubah bebas, yang selalunya mengambil nilai jujukan nombor asli (1; 2; 3; ...) dan menghasilkan, sebagai contoh, kira detik masa proses yang dikaji (ciri) .

1 . Regresi linear adalah baik dalam memodelkan ciri yang meningkat atau menurun pada kadar yang tetap. Ini adalah model paling mudah bagi proses yang sedang dikaji. Ia dibina mengikut persamaan:

y=mx+b

di mana m ialah tangen bagi cerun itu regresi linear kepada paksi-x; b - koordinat titik persilangan regresi linear dengan paksi-y.

2 . Garis arah aliran polinomial berguna untuk menerangkan ciri yang mempunyai beberapa ekstrem yang berbeza (tinggi dan rendah). Pilihan darjah polinomial ditentukan oleh bilangan ekstrem ciri yang dikaji. Oleh itu, polinomial darjah kedua boleh menggambarkan proses yang hanya mempunyai satu maksimum atau minimum; polinomial darjah ketiga - tidak lebih daripada dua ekstrem; polinomial darjah keempat - tidak lebih daripada tiga ekstrem, dsb.

Dalam kes ini, garis arah aliran dibina mengikut persamaan:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

di mana pekali c0, c1, c2,... c6 adalah pemalar yang nilainya ditentukan semasa pembinaan.

3 . Garis arah aliran logaritma berjaya digunakan dalam ciri pemodelan, nilai yang berubah dengan cepat pada mulanya, dan kemudian secara beransur-ansur stabil.

y = c ln(x) + b

4 . Garis aliran kuasa memberikan hasil yang baik jika nilai pergantungan yang dikaji dicirikan oleh perubahan berterusan dalam kadar pertumbuhan. Contoh pergantungan sedemikian boleh berfungsi sebagai graf pergerakan seragam dipercepatkan kereta. Jika terdapat sifar atau nilai negatif, anda tidak boleh menggunakan garis aliran kuasa.

Ia dibina mengikut persamaan:

y = cxb

di mana pekali b, c adalah pemalar.

5 . Garis arah aliran eksponen harus digunakan jika kadar perubahan dalam data terus meningkat. Untuk data yang mengandungi nilai sifar atau negatif, anggaran jenis ini juga tidak berkenaan.

Ia dibina mengikut persamaan:

y=cebx

di mana pekali b, c adalah pemalar.

Apabila memilih garis arah aliran, Excel secara automatik mengira nilai R2, yang mencirikan ketepatan anggaran: semakin hampir nilai R2 kepada satu, lebih pasti garis aliran menghampiri proses yang dikaji. Jika perlu, nilai R2 sentiasa boleh dipaparkan pada rajah.

Ditentukan oleh formula:

Untuk menambah garis arah aliran pada siri data:

    aktifkan carta yang dibina berdasarkan siri data, iaitu, klik dalam kawasan carta. Item Carta akan muncul dalam menu utama;

    selepas mengklik pada item ini, menu akan muncul pada skrin, di mana anda harus memilih arahan Tambah garis arah aliran.

Tindakan yang sama mudah dilaksanakan jika anda menuding pada graf yang sepadan dengan salah satu siri data dan klik kanan; dalam menu konteks yang muncul, pilih arahan Tambah garis arah aliran. Kotak dialog Trendline akan muncul pada skrin dengan tab Type dibuka (Gamb. 1).

Selepas itu anda perlukan:

Pada tab Jenis, pilih jenis garis arah aliran yang diperlukan (Linear dipilih secara lalai). Untuk jenis Polinomial, dalam medan Ijazah, nyatakan darjah polinomial yang dipilih.

1 . Medan Terbina pada Siri menyenaraikan semua siri data dalam carta yang dipersoalkan. Untuk menambah garis arah aliran pada siri data tertentu, pilih namanya dalam medan siri Terbina.

Jika perlu, dengan pergi ke tab Parameter (Gamb. 2), anda boleh menetapkan parameter berikut untuk garis arah aliran:

    tukar nama garis arah aliran dalam Nama medan lengkung yang hampir (dilicinkan).

    tetapkan bilangan tempoh (ke hadapan atau ke belakang) untuk ramalan dalam medan Ramalan;

    paparkan persamaan garis arah aliran dalam kawasan carta, yang mana anda harus membolehkan kotak semak menunjukkan persamaan pada carta;

    paparkan nilai kebolehpercayaan anggaran R2 dalam kawasan rajah, yang mana anda harus membolehkan kotak semak meletakkan nilai kebolehpercayaan anggaran (R^2) pada rajah;

    tetapkan titik persilangan garis arah aliran dengan paksi-Y, yang mana anda harus mendayakan kotak semak Persilangan lengkung dengan paksi-Y pada satu titik;

    klik butang OK untuk menutup kotak dialog.

Terdapat tiga cara untuk mula mengedit garis arah aliran yang telah dibina:

    gunakan arahan garis aliran Terpilih daripada menu Format, selepas memilih garis aliran;

    pilih arahan Format Trendline daripada menu konteks, yang dipanggil dengan mengklik kanan pada trendline;

    dengan mengklik dua kali pada garis arah aliran.

Kotak dialog Format Trendline akan muncul pada skrin (Gamb. 3), mengandungi tiga tab: Lihat, Jenis, Parameter dan kandungan dua yang terakhir bertepatan sepenuhnya dengan tab yang serupa pada kotak dialog Trendline (Gamb. 1-2 ). Pada tab Paparan, anda boleh menetapkan jenis garisan, warna dan ketebalannya.

Untuk memadam garis arah aliran yang telah dibina, pilih garis arah aliran untuk dipadamkan dan tekan kekunci Padam.

Kelebihan alat analisis regresi yang dipertimbangkan ialah:

    kemudahan relatif untuk memplot garis arah aliran pada carta tanpa membuat jadual data untuknya;

    senarai jenis garis aliran yang dicadangkan yang agak luas, dan senarai ini termasuk jenis regresi yang paling biasa digunakan;

    kemungkinan meramalkan kelakuan proses yang dikaji untuk sewenang-wenangnya (dalam akal) bilangan langkah ke hadapan dan juga ke belakang;

    kemungkinan mendapatkan persamaan garis arah aliran dalam bentuk analisis;

    kemungkinan, jika perlu, untuk mendapatkan penilaian kebolehpercayaan anggaran.

Kelemahan termasuk perkara berikut:

    pembinaan garis arah aliran dijalankan hanya jika terdapat carta yang dibina pada satu siri data;

    proses penjanaan siri data untuk ciri yang dikaji berdasarkan persamaan garis arah aliran yang diperolehi untuknya agak berantakan: persamaan regresi yang dikehendaki dikemas kini dengan setiap perubahan dalam nilai siri data asal, tetapi hanya dalam kawasan carta , manakala siri data yang dibentuk berdasarkan arah aliran persamaan garis lama, kekal tidak berubah;

    Dalam laporan Carta Pangsi, apabila anda menukar paparan carta atau laporan Jadual Pangsi yang berkaitan, garis arah aliran sedia ada tidak dikekalkan, jadi anda mesti memastikan reka letak laporan memenuhi keperluan anda sebelum anda melukis garis arah aliran atau sebaliknya memformat laporan Carta Pangsi.

Garis arah aliran boleh ditambah pada siri data yang dibentangkan pada carta seperti graf, histogram, carta kawasan tidak normal rata, bar, serakan, gelembung dan carta saham.

Anda tidak boleh menambah garis arah aliran pada siri data pada carta 3-D, Standard, Radar, Pai dan Donut.

Menggunakan Fungsi Excel Terbina dalam

Excel juga menyediakan alat analisis regresi untuk memplot garis arah aliran di luar kawasan carta. Beberapa fungsi lembaran kerja statistik boleh digunakan untuk tujuan ini, tetapi kesemuanya membenarkan anda membina regresi linear atau eksponen sahaja.

Excel mempunyai beberapa fungsi untuk membina regresi linear, khususnya:

    TREND;

  • CERUN dan POTONG.

Serta beberapa fungsi untuk membina garis aliran eksponen, khususnya:

    LGRFPaprox.

Perlu diingatkan bahawa teknik untuk membina regresi menggunakan fungsi TREND dan GROWTH secara praktikalnya sama. Perkara yang sama boleh dikatakan mengenai pasangan fungsi LINEST dan LGRFPRIBL. Untuk empat fungsi ini, apabila mencipta jadual nilai, ciri Excel seperti formula tatasusunan digunakan, yang agak mengacaukan proses membina regresi. Kami juga ambil perhatian bahawa pembinaan regresi linear, pada pendapat kami, adalah paling mudah untuk dilaksanakan menggunakan fungsi SLOPE dan INTERCEPT, di mana yang pertama menentukan kecerunan regresi linear, dan yang kedua menentukan segmen yang dipotong oleh regresi. pada paksi-y.

Kelebihan alat fungsi terbina dalam untuk analisis regresi ialah:

    proses yang agak mudah bagi jenis pembentukan siri data yang sama bagi ciri yang dikaji untuk semua fungsi statistik terbina dalam yang menetapkan garis aliran;

    teknik standard untuk membina garis arah aliran berdasarkan siri data yang dihasilkan;

    kemungkinan untuk meramalkan tingkah laku proses yang dikaji pada jumlah yang diperlukan langkah ke hadapan atau ke belakang.

Dan kelemahannya termasuk fakta bahawa Excel tidak mempunyai fungsi terbina dalam untuk mencipta jenis garis arah aliran yang lain (kecuali linear dan eksponen). Keadaan ini selalunya tidak membenarkan memilih model yang cukup tepat bagi proses yang dikaji, serta mendapatkan ramalan yang hampir dengan realiti. Di samping itu, apabila menggunakan fungsi TREND dan GROW, persamaan garis aliran tidak diketahui.

Perlu diingatkan bahawa penulis tidak menetapkan matlamat artikel untuk membentangkan perjalanan analisis regresi dengan tahap kesempurnaan yang berbeza-beza. Tugas utamanya adalah untuk menunjukkan keupayaan pakej Excel dalam menyelesaikan masalah anggaran menggunakan contoh khusus; tunjukkan alat berkesan yang ada pada Excel untuk membina regresi dan ramalan; menggambarkan betapa mudahnya masalah sedemikian boleh diselesaikan walaupun oleh pengguna yang tidak mempunyai pengetahuan mendalam tentang analisis regresi.

Contoh penyelesaian masalah tertentu

Pertimbangkan penyelesaian masalah khusus menggunakan alat tersenarai bagi pakej Excel.

Tugasan 1

Dengan jadual data mengenai keuntungan perusahaan pengangkutan motor untuk 1995-2002. anda perlu melakukan perkara berikut.

    Bina carta.

    Tambahkan garis arah aliran linear dan polinomial (kuadrat dan kubik) pada carta.

    Menggunakan persamaan garis arah aliran, dapatkan data jadual tentang keuntungan perusahaan bagi setiap garis arah aliran untuk 1995-2004.

    Buat ramalan keuntungan untuk perusahaan untuk tahun 2003 dan 2004.

Penyelesaian masalah

    Dalam julat sel A4:C11 lembaran kerja Excel, kami memasukkan lembaran kerja yang ditunjukkan dalam Rajah. empat.

    Setelah memilih julat sel B4:C11, kami membina carta.

    Kami mengaktifkan carta yang dibina dan, menggunakan kaedah yang diterangkan di atas, selepas memilih jenis garis arah aliran dalam kotak dialog Garis Aliran (lihat Rajah 1), kami menambah garis arah aliran linear, kuadratik dan kubik secara bergilir-gilir pada carta. Dalam kotak dialog yang sama, buka tab Parameter (lihat Rajah 2), dalam medan Nama lengkung yang menghampiri (dilicinkan), masukkan nama arah aliran yang akan ditambah dan dalam medan Ramalan ke hadapan untuk: tempoh, tetapkan nilai 2, kerana ia dirancang untuk membuat ramalan keuntungan untuk dua tahun akan datang. Untuk memaparkan persamaan regresi dan nilai kebolehpercayaan anggaran R2 dalam kawasan rajah, dayakan kotak semak Tunjukkan persamaan pada skrin dan letakkan nilai kebolehpercayaan anggaran (R^2) pada rajah. Untuk persepsi visual yang lebih baik, kami menukar jenis, warna dan ketebalan garis arah aliran yang diplot, yang mana kami menggunakan tab Paparan pada kotak dialog Format Garis Aliran (lihat Rajah 3). Carta yang terhasil dengan garis aliran tambahan ditunjukkan dalam rajah. 5.

    Untuk mendapatkan data jadual mengenai keuntungan perusahaan bagi setiap garis arah aliran untuk 1995-2004. Mari kita gunakan persamaan garis arah aliran yang dibentangkan dalam rajah. 5. Untuk melakukan ini, dalam sel julat D3:F3, masukkan maklumat teks mengenai jenis garis aliran yang dipilih: Aliran linear, Aliran kuadratik, Aliran padu. Seterusnya, masukkan formula regresi linear dalam sel D4 dan, menggunakan penanda isian, salin formula ini dengan rujukan relatif kepada julat sel D5:D13. Perlu diingat bahawa setiap sel dengan formula regresi linear daripada julat sel D4:D13 mempunyai sel yang sepadan daripada julat A4:A13 sebagai hujah. Begitu juga, untuk regresi kuadratik, julat sel E4:E13 diisi, dan untuk regresi kubik, julat sel F4:F13 diisi. Oleh itu, ramalan dibuat untuk keuntungan perusahaan untuk tahun 2003 dan 2004. dengan tiga trend. Jadual nilai yang terhasil ditunjukkan dalam rajah. 6.

Tugasan 2

    Bina carta.

    Tambahkan garis aliran logaritma, eksponen dan eksponen pada carta.

    Terbitkan persamaan garis aliran yang diperolehi, serta nilai kebolehpercayaan anggaran R2 untuk setiap satu daripadanya.

    Dengan menggunakan persamaan garis arah aliran, dapatkan data jadual tentang keuntungan perusahaan untuk setiap garis arah aliran untuk 1995-2002.

    Buat ramalan keuntungan untuk perniagaan untuk tahun 2003 dan 2004 menggunakan garis arah aliran ini.

Penyelesaian masalah

Mengikuti metodologi yang diberikan dalam menyelesaikan masalah 1, kami memperoleh gambar rajah dengan garis aliran logaritma, eksponen dan eksponen tambahan (Rajah 7). Selanjutnya, menggunakan persamaan garis arah aliran yang diperolehi, kami mengisi jadual nilai untuk keuntungan perusahaan, termasuk nilai ramalan untuk tahun 2003 dan 2004. (Gamb. 8).

Pada rajah. 5 dan rajah. dapat dilihat bahawa model dengan aliran logaritma sepadan dengan nilai kebolehpercayaan anggaran yang paling rendah.

R2 = 0.8659

Nilai tertinggi R2 sepadan dengan model dengan trend polinomial: kuadratik (R2 = 0.9263) dan padu (R2 = 0.933).

Tugasan 3

Dengan jadual data tentang keuntungan perusahaan pengangkutan motor untuk 1995-2002, diberikan dalam tugasan 1, anda mesti melakukan langkah berikut.

    Dapatkan siri data untuk garis arah aliran linear dan eksponen menggunakan fungsi TREND dan GROW.

    Menggunakan fungsi TREND dan GROWTH, buat ramalan keuntungan untuk perusahaan untuk tahun 2003 dan 2004.

    Untuk data awal dan siri data yang diterima, bina gambar rajah.

Penyelesaian masalah

Mari gunakan lembaran kerja tugasan 1 (lihat Rajah 4). Mari kita mulakan dengan fungsi TREND:

    pilih julat sel D4:D11, yang harus diisi dengan nilai-nilai fungsi TREND yang sepadan dengan data yang diketahui mengenai keuntungan perusahaan;

    panggil perintah Fungsi dari menu Sisipkan. Dalam kotak dialog Wizard Fungsi yang muncul, pilih fungsi TREND daripada kategori Statistik, dan kemudian klik butang OK. Operasi yang sama boleh dilakukan dengan menekan butang (fungsi Sisipkan) bar alat standard.

    Dalam kotak dialog Argumen Fungsi yang muncul, masukkan julat sel C4:C11 dalam medan Known_values_y; dalam medan Known_values_x - julat sel B4:B11;

    untuk menjadikan formula yang dimasukkan sebagai formula tatasusunan, gunakan kombinasi kekunci + + .

Formula yang kita masukkan dalam bar formula akan kelihatan seperti: =(TREND(C4:C11;B4:B11)).

Akibatnya, julat sel D4:D11 diisi dengan nilai yang sepadan bagi fungsi TREND (Rajah 9).

Untuk membuat ramalan keuntungan syarikat bagi tahun 2003 dan 2004. perlu:

    pilih julat sel D12:D13, di mana nilai yang diramalkan oleh fungsi TREND akan dimasukkan.

    panggil fungsi TREND dan dalam kotak dialog Fungsi Argumen yang muncul, masukkan dalam medan Known_values_y - julat sel C4:C11; dalam medan Known_values_x - julat sel B4:B11; dan dalam medan New_values_x - julat sel B12:B13.

    tukar formula ini menjadi formula tatasusunan menggunakan pintasan papan kekunci Ctrl + Shift + Enter.

    Formula yang dimasukkan akan kelihatan seperti: =(TREND(C4:C11;B4:B11;B12:B13)), dan julat sel D12:D13 akan diisi dengan nilai ramalan fungsi TREND (lihat Rajah. 9).

Begitu juga, siri data diisi menggunakan fungsi GROWTH, yang digunakan dalam analisis kebergantungan tak linear dan berfungsi sama seperti TREND rakan sejawatnya.

Rajah 10 menunjukkan jadual dalam mod paparan formula.

Untuk data awal dan siri data yang diperoleh, rajah ditunjukkan dalam rajah. sebelas.

Tugasan 4

Dengan jadual data mengenai penerimaan permohonan untuk perkhidmatan oleh perkhidmatan penghantaran perusahaan pengangkutan motor untuk tempoh dari 1 hingga 11 hari bulan semasa, tindakan berikut mesti dilakukan.

    Dapatkan siri data untuk regresi linear: menggunakan fungsi SLOPE dan INTERCEPT; menggunakan fungsi LINEST.

    Dapatkan semula siri data untuk regresi eksponen menggunakan fungsi LYFFPRIB.

    Menggunakan fungsi di atas, buat ramalan tentang penerimaan permohonan kepada perkhidmatan penghantaran untuk tempoh dari 12 hingga 14 hari bulan semasa.

    Untuk siri data asal dan diterima, bina gambar rajah.

Penyelesaian masalah

Ambil perhatian bahawa, tidak seperti fungsi TREND dan GROW, tiada satu pun fungsi yang disenaraikan di atas (CERUN, MINTASAN, LINEST, LGRFPRIB) adalah regresi. Fungsi ini hanya memainkan peranan tambahan, menentukan parameter regresi yang diperlukan.

Untuk regresi linear dan eksponen yang dibina menggunakan fungsi SLOPE, INTERCEPT, LINEST, LGRFPRIB, penampilan persamaannya sentiasa diketahui, berbeza dengan regresi linear dan eksponen yang sepadan dengan fungsi TREND dan GROWTH.

1 . Mari kita bina regresi linear yang mempunyai persamaan:

y=mx+b

menggunakan fungsi SLOPE dan INTERCEPT, dengan kecerunan regresi m ditentukan oleh fungsi SLOPE, dan istilah malar b - oleh fungsi INTERCEPT.

Untuk melakukan ini, kami melakukan tindakan berikut:

    masukkan jadual sumber dalam julat sel A4:B14;

    nilai parameter m akan ditentukan dalam sel C19. Pilih daripada kategori Statistik fungsi Cerun; masukkan julat sel B4:B14 dalam medan_values_y yang diketahui dan julat sel A4:A14 dalam medan_values_x yang diketahui. Formula akan dimasukkan ke dalam sel C19: =SLOPE(B4:B14;A4:A14);

    menggunakan kaedah yang sama, nilai parameter b dalam sel D19 ditentukan. Dan kandungannya akan kelihatan seperti ini: = INTERCEPT(B4:B14;A4:A14). Oleh itu, nilai-nilai parameter m dan b, yang diperlukan untuk membina regresi linear, akan disimpan, masing-masing, dalam sel C19, D19;

    kemudian kita masukkan formula regresi linear dalam sel C4 dalam bentuk: = $ C * A4 + $ D. Dalam formula ini, sel C19 dan D19 ditulis dengan rujukan mutlak (alamat sel tidak boleh berubah dengan kemungkinan penyalinan). Tanda rujukan mutlak $ boleh ditaip sama ada dari papan kekunci atau menggunakan kekunci F4, selepas meletakkan kursor pada alamat sel. Menggunakan pemegang isian, salin formula ini ke julat sel C4:C17. Kami mendapat siri data yang dikehendaki (Rajah 12). Oleh kerana bilangan permintaan ialah integer, anda harus menetapkan format nombor pada tab Nombor pada tetingkap Format Sel dengan bilangan tempat perpuluhan kepada 0.

2 . Sekarang mari kita bina regresi linear yang diberikan oleh persamaan:

y=mx+b

menggunakan fungsi LINEST.

Untuk ini:

    masukkan fungsi LINEST sebagai formula tatasusunan ke dalam julat sel C20:D20: =(LINEST(B4:B14;A4:A14)). Hasilnya, kita mendapat nilai parameter m dalam sel C20, dan nilai parameter b dalam sel D20;

    masukkan formula dalam sel D4: =$C*A4+$D;

    salin formula ini menggunakan penanda isian ke julat sel D4:D17 dan dapatkan siri data yang dikehendaki.

3 . Kami membina regresi eksponen yang mempunyai persamaan:

dengan bantuan fungsi LGRFPRIBL, ia dilakukan dengan cara yang sama:

    dalam julat sel C21:D21, masukkan fungsi LGRFPRIBL sebagai formula tatasusunan: =( LGRFPRIBL (B4:B14;A4:A14)). Dalam kes ini, nilai parameter m akan ditentukan dalam sel C21, dan nilai parameter b akan ditentukan dalam sel D21;

    formula dimasukkan ke dalam sel E4: =$D*$C^A4;

    menggunakan penanda isian, formula ini disalin ke julat sel E4:E17, di mana siri data untuk regresi eksponen akan ditempatkan (lihat Rajah 12).

Pada rajah. 13 menunjukkan jadual di mana kita boleh melihat fungsi yang kita gunakan dengan julat sel yang diperlukan, serta formula.

Nilai R 2 dipanggil pekali penentuan.

Tugas membina pergantungan regresi adalah untuk mencari vektor pekali m model (1) di mana pekali R mengambil nilai maksimum.

Untuk menilai kepentingan R, ujian F Fisher digunakan, dikira dengan formula

di mana n- saiz sampel (bilangan eksperimen);

k ialah bilangan pekali model.

Jika F melebihi beberapa nilai kritikal untuk data n dan k dan tahap keyakinan yang diterima, maka nilai R dianggap signifikan. Jadual nilai kritikal F diberikan dalam buku rujukan tentang statistik matematik.

Oleh itu, kepentingan R ditentukan bukan sahaja oleh nilainya, tetapi juga oleh nisbah antara bilangan eksperimen dan bilangan pekali (parameter) model. Sesungguhnya, nisbah korelasi untuk n=2 untuk model linear mudah ialah 1 (melalui 2 mata pada satah, anda sentiasa boleh melukis satu garis lurus). Walau bagaimanapun, jika data eksperimen adalah pembolehubah rawak, nilai R sedemikian harus dipercayai dengan berhati-hati. Biasanya, untuk mendapatkan R yang signifikan dan regresi yang boleh dipercayai, ia bertujuan untuk memastikan bilangan eksperimen melebihi jumlah pekali model (n>k) dengan ketara.

Untuk membina model regresi linear, anda mesti:

1) sediakan senarai n baris dan m lajur yang mengandungi data eksperimen (lajur yang mengandungi nilai output Y mestilah sama ada yang pertama atau yang terakhir dalam senarai); sebagai contoh, mari kita ambil data tugas sebelumnya, menambah lajur yang dipanggil "nombor tempoh", menomborkan nombor tempoh dari 1 hingga 12. (ini akan menjadi nilai X)

2) pergi ke menu Data/Analisis Data/Regression

Jika item "Analisis Data" dalam menu "Alat" tiada, maka anda harus pergi ke item "Tambahan" pada menu yang sama dan tandai kotak "Pakej Analisis".

3) dalam kotak dialog "Regression", tetapkan:

selang input Y;

selang input X;

selang keluaran - sel kiri atas selang di mana keputusan pengiraan akan diletakkan (disyorkan untuk meletakkannya pada lembaran kerja baharu);

4) klik "Ok" dan analisis keputusan.

Ia mempunyai banyak kegunaan kerana ia membenarkan perwakilan anggaran fungsi yang diberikan yang lain lebih mudah. LSM boleh menjadi sangat berguna dalam memproses pemerhatian, dan ia digunakan secara aktif untuk menganggar beberapa kuantiti daripada hasil pengukuran yang lain yang mengandungi ralat rawak. Dalam artikel ini, anda akan belajar cara melaksanakan pengiraan kuasa dua terkecil dalam Excel.

Pernyataan masalah pada contoh tertentu

Katakan terdapat dua penunjuk X dan Y. Lebih-lebih lagi, Y bergantung pada X. Oleh kerana OLS menarik minat kita dari sudut analisis regresi (dalam Excel, kaedahnya dilaksanakan menggunakan fungsi terbina dalam), kita harus segera meneruskan untuk mempertimbangkan masalah tertentu.

Jadi biarkan X kawasan perdagangan kedai runcit, diukur dalam meter persegi, dan Y ialah perolehan tahunan, ditakrifkan dalam berjuta-juta rubel.

Ia dikehendaki membuat ramalan tentang perolehan (Y) yang akan dimiliki oleh kedai jika ia mempunyai satu atau satu lagi ruang runcit. Jelas sekali, fungsi Y = f (X) semakin meningkat, kerana pasar raya besar menjual lebih banyak barangan daripada gerai.

Beberapa perkataan tentang ketepatan data awal yang digunakan untuk ramalan

Katakan kita mempunyai jadual yang dibina dengan data untuk n stor.

mengikut statistik matematik, keputusan akan lebih kurang betul jika data pada sekurang-kurangnya 5-6 objek diperiksa. Juga, hasil "anomali" tidak boleh digunakan. Khususnya, butik kecil elit boleh mempunyai perolehan berkali-kali lebih besar daripada perolehan kedai besar kelas "pasaran besar".

Intipati kaedah

Data jadual boleh ditunjukkan dalam Pesawat Cartesan dalam bentuk titik M 1 (x 1, y 1), ... M n (x n, y n). Sekarang penyelesaian masalah akan dikurangkan kepada pemilihan fungsi anggaran y = f (x), yang mempunyai graf yang melepasi sedekat mungkin ke titik M 1, M 2, .. M n .

Sudah tentu, anda boleh menggunakan polinomial darjat tinggi, tetapi pilihan ini bukan sahaja sukar untuk dilaksanakan, tetapi hanya tidak betul, kerana ia tidak akan mencerminkan arah aliran utama yang perlu dikesan. Penyelesaian yang paling munasabah ialah mencari garis lurus y = ax + b, yang paling sesuai menghampiri data eksperimen, dan lebih tepat lagi, pekali - a dan b.

Skor ketepatan

Untuk sebarang anggaran, penilaian ketepatannya adalah amat penting. Nyatakan dengan e i perbezaan (sisihan) antara nilai kefungsian dan eksperimen untuk titik x i , iaitu e i = y i - f (x i).

Jelas sekali, untuk menilai ketepatan anggaran, anda boleh menggunakan jumlah sisihan, iaitu, apabila memilih garis lurus untuk perwakilan anggaran pergantungan X pada Y, keutamaan harus diberikan kepada yang mempunyai nilai terkecil jumlah e i pada semua perkara yang dipertimbangkan. Walau bagaimanapun, tidak semuanya begitu mudah, kerana bersama-sama dengan sisihan positif, hampir akan ada yang negatif.

Anda boleh menyelesaikan masalah menggunakan modul sisihan atau petak mereka. Kaedah terakhir menerima paling banyak penggunaan yang meluas. Ia digunakan dalam banyak bidang, termasuk analisis regresi (dalam Excel, pelaksanaannya dijalankan menggunakan dua fungsi terbina dalam), dan telah lama terbukti berkesan.

Kaedah kuasa dua terkecil

Dalam Excel, seperti yang anda ketahui, terdapat fungsi autosum terbina dalam yang membolehkan anda mengira nilai semua nilai yang terletak dalam julat yang dipilih. Oleh itu, tiada apa yang akan menghalang kita daripada mengira nilai ungkapan (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Dalam tatatanda matematik, ini kelihatan seperti:

Oleh kerana keputusan pada mulanya dibuat untuk menganggar menggunakan garis lurus, kami mempunyai:

Oleh itu, tugas mencari garis lurus yang paling tepat menggambarkan hubungan khusus antara X dan Y berjumlah pengiraan minimum fungsi dua pembolehubah:

Ini memerlukan penyamaan kepada sifar terbitan separa berkenaan dengan pembolehubah baru a dan b, dan menyelesaikan sistem primitif yang terdiri daripada dua persamaan dengan 2 bentuk yang tidak diketahui:

Selepas transformasi mudah, termasuk membahagi dengan 2 dan memanipulasi jumlah, kita mendapat:

Menyelesaikannya, sebagai contoh, dengan kaedah Cramer, kami memperoleh titik pegun dengan beberapa pekali a * dan b * . Ini adalah minimum, iaitu, untuk meramalkan jumlah perolehan kedai itu bila kawasan tertentu, garis lurus y \u003d a * x + b * akan dilakukan, iaitu model regresi untuk contoh yang berkenaan. Sudah tentu dia tidak akan membenarkan anda mencari hasil yang tepat, tetapi akan membantu anda mendapatkan idea sama ada membeli kedai secara kredit untuk kawasan tertentu akan membuahkan hasil.

Bagaimana untuk melaksanakan kaedah kuasa dua terkecil dalam Excel

Excel mempunyai fungsi untuk mengira nilai kuasa dua terkecil. Dia mempunyai pandangan seterusnya: "TREND" (nilai Y diketahui; nilai X diketahui; nilai X baharu; pemalar). Mari gunakan formula untuk mengira OLS dalam Excel pada jadual kami.

Untuk melakukan ini, dalam sel di mana hasil pengiraan menggunakan kaedah kuasa dua terkecil dalam Excel harus dipaparkan, masukkan tanda "=" dan pilih fungsi "TREND". Dalam tetingkap yang terbuka, isikan medan yang sesuai, menyerlahkan:

  • julat nilai yang diketahui untuk Y (dalam kes ini data untuk perolehan dagangan);
  • julat x 1 , …x n , iaitu saiz ruang runcit;
  • kedua-duanya terkenal dan nilai yang tidak diketahui x, yang mana anda perlu mengetahui saiz perolehan (untuk maklumat tentang lokasi mereka pada lembaran kerja, lihat di bawah).

Di samping itu, terdapat pembolehubah logik "Const" dalam formula. Jika anda memasukkan 1 dalam medan yang sepadan dengannya, maka ini bermakna pengiraan harus dilakukan, dengan mengandaikan bahawa b \u003d 0.

Jika anda perlu mengetahui ramalan untuk lebih daripada satu nilai x, maka selepas memasukkan formula, anda tidak boleh menekan "Enter", tetapi anda perlu menaip gabungan "Shift" + "Control" + "Enter" ("Enter" ) pada papan kekunci.

Beberapa Ciri

Analisis regresi boleh diakses walaupun oleh dummies. Formula Excel untuk meramalkan nilai tatasusunan pembolehubah yang tidak diketahui - "TREND" - boleh digunakan walaupun oleh mereka yang tidak pernah mendengar kaedah kuasa dua terkecil. Cukup sekadar mengetahui beberapa ciri kerjanya. khususnya:

  • Jika kita menyusun julat nilai yang diketahui pembolehubah y dalam satu baris atau lajur, maka setiap baris (lajur) dengan nilai yang diketahui x akan dianggap oleh program sebagai pembolehubah yang berasingan.
  • Jika julat dengan x diketahui tidak dinyatakan dalam tetingkap "TREND", maka dalam hal menggunakan fungsi dalam program Excel akan menganggapnya sebagai tatasusunan yang terdiri daripada integer, bilangan yang sepadan dengan julat dengan nilai pembolehubah y yang diberikan.
  • Untuk mengeluarkan tatasusunan nilai "diramalkan", ungkapan aliran mesti dimasukkan sebagai formula tatasusunan.
  • Jika tiada nilai x baharu dinyatakan, maka fungsi TREND menganggapnya sama dengan yang diketahui. Jika ia tidak dinyatakan, maka tatasusunan 1 diambil sebagai hujah; 2; 3; 4;…, yang sepadan dengan julat dengan parameter y yang telah diberikan.
  • Julat yang mengandungi nilai x baharu mesti terdiri daripada yang sama atau lebih baris atau lajur, sebagai julat dengan nilai y yang diberikan. Dalam erti kata lain, ia mesti berkadar dengan pembolehubah bebas.
  • Tatasusunan dengan nilai x yang diketahui boleh mengandungi berbilang pembolehubah. Namun, jika kita bercakap hanya kira-kira satu, maka julat dengan nilai yang diberikan bagi x dan y perlu sepadan. Dalam kes beberapa pembolehubah, julat dengan nilai y yang diberikan perlu dimuatkan dalam satu lajur atau satu baris.

Fungsi RAMALAN

Ia dilaksanakan menggunakan beberapa fungsi. Salah satunya dipanggil "PREDICTION". Ia serupa dengan TREND, iaitu ia memberikan hasil pengiraan menggunakan kaedah kuasa dua terkecil. Walau bagaimanapun, hanya untuk satu X, yang mana nilai Y tidak diketahui.

Kini anda mengetahui formula Excel untuk boneka yang membolehkan anda meramalkan nilai nilai masa depan penunjuk mengikut arah aliran linear.

Ia digunakan secara meluas dalam ekonometrik dalam bentuk tafsiran ekonomi yang jelas tentang parameternya.

Regresi linear dikurangkan untuk mencari persamaan bentuk

atau

Taip persamaan membolehkan untuk tetapkan nilai parameter X mempunyai nilai teori ciri berkesan, menggantikan nilai sebenar faktor ke dalamnya X.

Membina regresi linear adalah untuk menganggar parameternya − a dan dalam. Anggaran parameter regresi linear boleh didapati dengan kaedah yang berbeza.

Pendekatan klasik untuk menganggar parameter regresi linear adalah berdasarkan petak terkecil(MNK).

LSM membenarkan seseorang untuk mendapatkan anggaran parameter tersebut a dan dalam, di mana jumlah sisihan kuasa dua bagi nilai sebenar sifat terhasil (y) daripada dikira (teoretikal) minimum mini:

Untuk mencari minimum fungsi, adalah perlu untuk mengira derivatif separa berkenaan dengan setiap parameter. a dan b dan samakan mereka dengan sifar.

Menandakan melalui S, maka:

Mengubah formula, kita dapat sistem seterusnya persamaan biasa untuk anggaran parameter a dan dalam:

Menyelesaikan sistem persamaan normal (3.5) sama ada dengan kaedah pengecualian berurutan pembolehubah, atau dengan kaedah penentu, kita dapati anggaran parameter yang diperlukan a dan dalam.

Parameter dalam dipanggil pekali regresi. Nilainya menunjukkan purata perubahan dalam hasil dengan perubahan dalam faktor sebanyak satu unit.

Persamaan regresi sentiasa ditambah dengan penunjuk ketat perhubungan. Apabila menggunakan regresi linear, pekali korelasi linear bertindak sebagai penunjuk sedemikian. Terdapat pelbagai versi formula pekali linear korelasi. Beberapa daripada mereka disenaraikan di bawah:

Seperti yang anda ketahui, pekali korelasi linear adalah dalam had: -1 1.

Untuk menilai kualiti pemilihan fungsi linear segi empat sama dikira

Pekali korelasi linear dipanggil pekali penentuan . Pekali penentuan mencirikan perkadaran varians ciri berkesan y, dijelaskan oleh regresi jumlah varians tanda berkesan:

Oleh itu, nilai 1 - mencirikan bahagian penyebaran y, disebabkan oleh pengaruh faktor lain yang tidak diambil kira dalam model.

Soalan untuk mengawal diri

1. Intipati kaedah kuasa dua terkecil?

2. Berapakah bilangan pembolehubah yang memberikan regresi berpasangan?

3. Apakah pekali yang menentukan ketat sambungan antara perubahan?

4. Dalam had apakah pekali penentuan ditentukan?

5. Anggaran parameter b dalam analisis korelasi-regresi?

1. Christopher Dougherty. Pengenalan kepada ekonometrik. - M.: INFRA - M, 2001 - 402 p.

2. S.A. Borodich. Ekonometrik. Minsk LLC "Pengetahuan Baru" 2001.


3. R.U. Rakhmetov Kursus pendek dalam ekonometrik. Tutorial. Almaty. 2004. -78s.

4. I.I. Eliseeva. Ekonometrik. - M.: "Kewangan dan statistik", 2002

5. Maklumat bulanan dan majalah analisis.

Model ekonomi tak linear. Model regresi bukan linear. Penukaran boleh ubah.

Tak linear model ekonomi..

Penukaran boleh ubah.

pekali keanjalan.

Jika antara fenomena ekonomi terdapat hubungan bukan linear, kemudian ia dinyatakan menggunakan yang sepadan fungsi tak linear: contohnya, hiperbola sama sisi , parabola darjah kedua dan lain-lain.

Terdapat dua kelas regresi bukan linear:

1. Regresi yang tidak linear berkenaan dengan pembolehubah penjelasan yang disertakan dalam analisis, tetapi linear berkenaan dengan parameter anggaran, contohnya:

Polinomial pelbagai darjat - , ;

Hiperbola sama sisi - ;

Fungsi semilogaritma - .

2. Regresi yang tidak linear dalam parameter anggaran, contohnya:

Kuasa - ;

Demonstratif -;

Eksponen - .

Jumlah jumlah sisihan kuasa dua nilai individu ciri yang berkesan di daripada nilai purata disebabkan oleh pengaruh banyak faktor. Kami secara bersyarat membahagikan keseluruhan set sebab kepada dua kumpulan: faktor x yang dikaji dan faktor lain.

Jika faktor tidak menjejaskan keputusan, maka garis regresi pada graf adalah selari dengan paksi oh dan

Kemudian keseluruhan penyebaran atribut berkesan adalah disebabkan oleh pengaruh faktor lain dan jumlah keseluruhan sisihan kuasa dua akan bertepatan dengan baki. Jika faktor lain tidak menjejaskan keputusan, maka awak terikat Dengan X secara fungsional dan jumlah baki segi empat sama adalah sifar. Dalam kes ini, jumlah sisihan kuasa dua yang dijelaskan oleh regresi adalah sama dengan jumlah jumlah kuasa dua.

Oleh kerana tidak semua titik medan korelasi terletak pada garis regresi, serakan mereka sentiasa berlaku kerana pengaruh faktor X, iaitu regresi di pada X, dan disebabkan oleh tindakan sebab lain (variasi yang tidak dapat dijelaskan). Kesesuaian garis regresi untuk peramalan bergantung pada bahagian mana variasi umum tanda di mengambil kira variasi yang dijelaskan

Jelas sekali, jika jumlah sisihan kuasa dua disebabkan oleh regresi adalah lebih besar daripada jumlah sisa kuasa dua, maka persamaan regresi adalah signifikan secara statistik dan faktor X mempunyai kesan yang besar terhadap hasil. y.

, iaitu dengan bilangan kebebasan variasi bebas ciri. Bilangan darjah kebebasan adalah berkaitan dengan bilangan unit populasi n dan bilangan pemalar yang ditentukan daripadanya. Berhubung dengan masalah yang dikaji, bilangan darjah kebebasan harus menunjukkan berapa banyak sisihan bebas daripada P

Penilaian kepentingan persamaan regresi secara keseluruhan diberikan dengan bantuan F- Kriteria Fisher. Dalam kes ini, hipotesis nol dikemukakan bahawa pekali regresi adalah sama dengan sifar, i.e. b= 0, dan oleh itu faktor X tidak menjejaskan hasilnya y.

Pengiraan langsung bagi kriteria F didahului dengan analisis varians. Intinya ialah pengembangan jumlah sisihan kuasa dua pembolehubah di daripada nilai purata di kepada dua bahagian - "dijelaskan" dan "tidak dijelaskan":

- jumlah jumlah sisihan kuasa dua;

- jumlah sisihan kuasa dua dijelaskan oleh regresi;

ialah jumlah baki bagi kuasa dua sisihan.

Sebarang jumlah sisihan kuasa dua adalah berkaitan dengan bilangan darjah kebebasan , iaitu dengan bilangan kebebasan variasi bebas ciri. Bilangan darjah kebebasan adalah berkaitan dengan bilangan unit populasi n dan dengan bilangan pemalar yang ditentukan daripadanya. Berhubung dengan masalah yang dikaji, bilangan darjah kebebasan harus menunjukkan berapa banyak sisihan bebas daripada P mungkin diperlukan untuk membentuk jumlah kuasa dua tertentu.

Penyerakan setiap darjah kebebasanD.

Nisbah-F (Kriteria-F):

Jika hipotesis nol adalah benar, maka faktorial dan serakan sisa tidak berbeza antara satu sama lain. Untuk H 0, penolakan diperlukan supaya varians faktor melebihi baki beberapa kali. Ahli statistik Inggeris Snedecor membangunkan jadual nilai kritikal F-hubungan pada tahap kebendaan yang berbeza hipotesis nol dan pelbagai nombor darjah kebebasan. Nilai jadual F-kriteria ialah nilai maksimum nisbah varians, yang boleh berlaku sekiranya berlaku perbezaan rawak untuk tahap yang diberikan kebarangkalian mempunyai hipotesis nol. Nilai dikira F-hubungan diiktiraf sebagai boleh dipercayai jika o lebih besar daripada jadual.

Dalam kes ini, hipotesis nol tentang ketiadaan hubungan ciri ditolak dan kesimpulan dibuat tentang kepentingan hubungan ini: F fakta > F jadual H 0 ditolak.

Jika nilainya kurang daripada jadual F fakta ‹, F jadual, maka kebarangkalian hipotesis nol adalah lebih tinggi daripada tahap tertentu dan ia tidak boleh ditolak tanpa risiko yang serius untuk membuat kesimpulan yang salah tentang kehadiran perhubungan. Dalam kes ini, persamaan regresi dianggap tidak signifikan secara statistik. N o tidak menyimpang.

Ralat piawai pekali regresi

Untuk menilai kepentingan pekali regresi, nilainya dibandingkan dengannya kesalahan biasa, iaitu nilai sebenar ditentukan t-Kriteria pelajar: yang kemudiannya dibandingkan dengan nilai jadual pada tahap kepentingan tertentu dan bilangan darjah kebebasan ( n- 2).

Ralat Piawai Parameter a:

Kepentingan pekali korelasi linear disemak berdasarkan magnitud ralat pekali korelasi r:

Jumlah varians ciri X:

Regresi Linear Berbilang

Bangunan model

Regresi berganda ialah regresi bagi ciri terhasil dengan dua dan sebilangan besar faktor, iaitu model pandangan

regresi boleh memberi hasil yang baik apabila pemodelan, jika pengaruh faktor lain yang mempengaruhi objek kajian boleh diabaikan. Tingkah laku pembolehubah ekonomi individu tidak boleh dikawal, iaitu, tidak mungkin untuk memastikan kesamaan semua syarat lain untuk menilai pengaruh satu faktor yang dikaji. Dalam kes ini, anda harus cuba mengenal pasti pengaruh faktor lain dengan memasukkannya ke dalam model, iaitu membina persamaan regresi berganda: y = a+b 1 x 1 +b 2 +…+b p x p + .

Matlamat utama regresi berganda adalah untuk membina model dengan sejumlah besar faktor, sambil menentukan pengaruh setiap daripada mereka secara individu, serta kesan kumulatifnya pada penunjuk yang dimodelkan. Spesifikasi model merangkumi dua bidang soalan: pemilihan faktor dan pilihan jenis persamaan regresi

Kaedah kuasa dua terkecil digunakan untuk menganggar parameter persamaan regresi.
Bilangan baris (data awal)

Salah satu kaedah untuk mengkaji hubungan stokastik antara ciri ialah analisis regresi.
Analisis regresi ialah terbitan persamaan regresi, yang digunakan untuk mencari nilai purata pembolehubah rawak (ciri-hasil), jika nilai pembolehubah lain (atau lain-lain) (faktor-ciri) diketahui. Ia termasuk langkah-langkah berikut:

  1. pilihan bentuk komunikasi (jenis persamaan analitikal regresi);
  2. anggaran parameter persamaan;
  3. penilaian kualiti persamaan regresi analitikal.
Selalunya, bentuk linear digunakan untuk menerangkan hubungan statistik ciri. perhatian kepada sambungan linear dijelaskan oleh tafsiran ekonomi yang jelas tentang parameternya, terhad oleh variasi pembolehubah, dan oleh fakta bahawa dalam kebanyakan kes, bentuk komunikasi bukan linear ditukar (dengan mengambil logaritma atau menukar pembolehubah) ke dalam bentuk linear untuk melaksanakan pengiraan.
Dalam kes perhubungan pasangan linear, persamaan regresi akan mengambil bentuk: y i =a+b·x i +u i . Pilihan persamaan yang diberikan a dan b dianggarkan daripada data pemerhatian statistik x dan y . Hasil daripada penilaian sedemikian ialah persamaan: , di mana , - anggaran parameter a dan b , - nilai ciri berkesan (pembolehubah) yang diperolehi oleh persamaan regresi (nilai yang dikira).

Yang paling biasa digunakan untuk anggaran parameter ialah kaedah kuasa dua terkecil (LSM).
Kaedah kuasa dua terkecil memberikan anggaran terbaik (konsisten, cekap dan tidak berat sebelah) bagi parameter persamaan regresi. Tetapi hanya jika andaian tertentu tentang istilah rawak (u) dan pembolehubah bebas (x) dipenuhi (lihat andaian OLS).

Masalah menganggar parameter linear persamaan pasangan petak terkecil terdiri daripada yang berikut: untuk mendapatkan anggaran parameter tersebut , , di mana jumlah sisihan kuasa dua bagi nilai sebenar ciri berkesan - y i daripada nilai yang dikira - adalah minimum.
Secara formal kriteria OLS boleh ditulis seperti ini: .

Pengelasan kaedah kuasa dua terkecil

  1. Kaedah kuasa dua terkecil.
  2. Kaedah kemungkinan maksimum (untuk model regresi linear klasik biasa, kenormalan sisa regresi didalilkan).
  3. Kaedah kuasa dua terkecil umum GLSM digunakan dalam kes autokorelasi ralat dan dalam kes heteroskedastisitas.
  4. Kuasa dua terkecil tertimbang ( kes istimewa GMS dengan residu heteroskedastik).

Menggambarkan intipati kaedah klasik kuasa dua terkecil secara grafik. Untuk melakukan ini, kami akan membina plot bersepah mengikut pemerhatian (x i , y i , i=1;n) dalam sistem segi empat tepat koordinat (plot serakan sedemikian dipanggil medan korelasi). Mari cuba cari garis lurus yang paling hampir dengan titik medan korelasi. Mengikut kaedah kuasa dua terkecil, garisan dipilih supaya jumlah jarak menegak kuasa dua antara titik medan korelasi dan garis ini adalah minimum.

Notasi matematik masalah ini: .
Nilai y i dan x i =1...n diketahui oleh kami, ini adalah data pemerhatian. Dalam fungsi S ia adalah pemalar. Pembolehubah dalam fungsi ini ialah anggaran yang diperlukan bagi parameter - , . Untuk mencari minimum fungsi 2 pembolehubah, adalah perlu untuk mengira derivatif separa fungsi ini berkenaan dengan setiap parameter dan menyamakannya dengan sifar, i.e. .
Akibatnya, kami memperoleh sistem 2 normal persamaan linear:
Memutuskan sistem ini, kami dapati anggaran parameter yang diperlukan:

Ketepatan pengiraan parameter persamaan regresi boleh disemak dengan membandingkan jumlah (sesetengah percanggahan mungkin disebabkan oleh pembundaran pengiraan).
Untuk mengira anggaran parameter, anda boleh membina Jadual 1.
Tanda pekali regresi b menunjukkan arah perhubungan (jika b > 0, perhubungan adalah langsung, jika b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Secara formal, nilai parameter a ialah nilai purata y untuk x sama dengan sifar. Jika faktor tanda tidak mempunyai dan tidak boleh mempunyai nilai sifar, maka tafsiran parameter a di atas tidak masuk akal.

Penilaian ketepatan hubungan antara ciri dijalankan menggunakan pekali korelasi pasangan linear - r x,y . Ia boleh dikira menggunakan formula: . Di samping itu, pekali korelasi pasangan linear boleh ditentukan dari segi pekali regresi b: .
Julat nilai yang boleh diterima bagi pekali linear korelasi pasangan adalah dari -1 hingga +1. Tanda pekali korelasi menunjukkan arah hubungan. Jika r x, y >0, maka sambungan adalah terus; jika r x, y<0, то связь обратная.
Jika pekali ini hampir dengan kesatuan dalam modulus, maka hubungan antara ciri boleh ditafsirkan sebagai satu linear yang agak rapat. Jika modulusnya adalah sama dengan satu ê r x , y ê =1, maka hubungan antara ciri adalah linear berfungsi. Jika ciri x dan y tidak bersandar secara linear, maka r x,y adalah hampir kepada 0.
Jadual 1 juga boleh digunakan untuk mengira r x,y.

Jadual 1

N pemerhatianx iy ix i ∙ y i
1 x 1y 1x 1 y 1
2 x2y2x 2 y 2
...
nx ny nx n y n
Jumlah Lajur∑x∑y∑x y
Min
Untuk menilai kualiti persamaan regresi yang diperoleh, pekali penentuan teori dikira - R 2 yx:

,
dengan d 2 ialah varians y yang dijelaskan oleh persamaan regresi;
e 2 - baki (tidak dijelaskan oleh persamaan regresi) varians y ;
s 2 y - jumlah (jumlah) varians y .
Pekali penentuan mencirikan bahagian variasi (serakan) ciri y yang terhasil, dijelaskan oleh regresi (dan, akibatnya, faktor x), dalam jumlah variasi (serakan) y. Pekali penentuan R 2 yx mengambil nilai dari 0 hingga 1. Sehubungan itu, nilai 1-R 2 yx mencirikan bahagian varians y yang disebabkan oleh pengaruh faktor lain yang tidak diambil kira dalam model dan ralat spesifikasi.
Dengan regresi linear berpasangan R 2 yx =r 2 yx .

100 r bonus pesanan pertama

Pilih jenis kerja Kerja tamat pengajian Kertas penggal Abstrak Tesis sarjana Laporan amalan Artikel Laporan Semakan Kerja ujian Monograf Penyelesaian masalah Rancangan perniagaan Jawapan kepada soalan Kerja kreatif Melukis Esei Gubahan Terjemahan Pembentangan Menaip Lain-lain Meningkatkan keunikan teks Tesis calon Kerja makmal Bantuan on- barisan

Minta harga

Kaedah kuasa dua terkecil ialah teknik matematik (matematik-statistik) yang berfungsi untuk menyamakan siri masa, mengenal pasti bentuk korelasi antara pembolehubah rawak, dll. Ia terdiri daripada fakta bahawa fungsi yang menggambarkan fenomena ini dianggarkan oleh fungsi yang lebih mudah. . Selain itu, yang terakhir dipilih sedemikian rupa sehingga sisihan piawai (lihat Varians) tahap sebenar fungsi pada titik yang diperhatikan daripada yang diratakan adalah yang paling kecil.

Contohnya, mengikut data yang ada ( xi,yi) (i = 1, 2, ..., n) lengkung sedemikian dibina y = a + bx, di mana jumlah minimum sisihan kuasa dua dicapai

iaitu, fungsi diminimumkan yang bergantung pada dua parameter: a- segmen pada paksi-y dan b- kecerunan garis lurus.

Persamaan memberikan syarat yang diperlukan untuk meminimumkan fungsi S(a,b), dipanggil persamaan biasa. Sebagai fungsi anggaran, bukan sahaja linear (penjajaran sepanjang garis lurus), tetapi juga kuadratik, parabola, eksponen, dll. digunakan. M.2, di mana jumlah jarak kuasa dua ( y 1 – ȳ 1)2 + (y 2 – ȳ 2)2 .... ialah yang terkecil, dan garis lurus yang terhasil menggambarkan paling baik arah aliran siri pemerhatian dinamik untuk beberapa penunjuk dari semasa ke semasa.

Untuk anggaran OLS yang tidak berat sebelah, adalah perlu dan mencukupi untuk memenuhi syarat analisis regresi yang paling penting: jangkaan matematik ralat rawak bersyarat pada faktor mestilah sama dengan sifar. Keadaan ini, khususnya, dipenuhi jika: 1. jangkaan matematik ralat rawak adalah sama dengan sifar, dan 2. faktor dan ralat rawak ialah pembolehubah rawak bebas. Syarat pertama boleh dianggap sentiasa berpuas hati untuk model dengan pemalar, kerana pemalar mengambil jangkaan matematik bukan sifar ralat. Syarat kedua - keadaan faktor eksogen - adalah asas. Jika harta ini tidak berpuas hati, maka kita boleh menganggap bahawa hampir mana-mana anggaran akan menjadi sangat tidak memuaskan: mereka tidak akan konsisten (iaitu, walaupun jumlah data yang sangat besar tidak membenarkan mendapatkan anggaran kualitatif dalam kes ini).

Yang paling biasa dalam amalan penganggaran statistik parameter persamaan regresi ialah kaedah kuasa dua terkecil. Kaedah ini adalah berdasarkan beberapa andaian tentang sifat data dan hasil pembinaan model. Yang utama ialah pemisahan yang jelas bagi pembolehubah awal kepada pembolehubah bersandar dan bebas, ketakkaitan faktor yang termasuk dalam persamaan, kelinearan perhubungan, ketiadaan autokorelasi baki, kesamaan jangkaan matematiknya kepada sifar dan penyebaran berterusan.

Salah satu hipotesis utama LSM ialah andaian bahawa serakan sisihan ei adalah sama, i.e. sebaran mereka di sekitar nilai purata (sifar) siri itu hendaklah nilai yang stabil. Sifat ini dipanggil homoskedastisitas. Dalam amalan, varians sisihan selalunya tidak sama, iaitu, heteroskedastisitas diperhatikan. Ini mungkin disebabkan oleh pelbagai sebab. Sebagai contoh, mungkin terdapat ralat dalam data asal. Ketidaktepatan rawak dalam maklumat sumber, seperti ralat dalam susunan nombor, boleh memberi kesan yang ketara pada keputusan. Selalunya penyebaran sisihan yang lebih besar єi diperhatikan pada nilai besar pembolehubah bersandar (pembolehubah). Jika data mengandungi ralat yang ketara, maka, secara semulajadi, sisihan nilai model yang dikira daripada data yang salah juga akan menjadi besar. Untuk menyingkirkan ralat ini, kita perlu mengurangkan sumbangan data ini kepada hasil pengiraan, menetapkan berat yang lebih rendah untuk mereka daripada semua yang lain. Idea ini dilaksanakan dalam petak terkecil berwajaran.