Biografi Spesifikasi Analisis

Definisi regresi berganda. Spesifikasi model


Kuliah 3 Regresi Berganda

    Syarat untuk menggunakan kaedah dan hadnya

Regresi pasangan boleh memberikan hasil yang baik dalam pemodelan jika pengaruh faktor lain yang mempengaruhi objek kajian boleh diabaikan. Tingkah laku pembolehubah ekonomi individu tidak boleh dikawal; adalah tidak mungkin untuk memastikan kesamaan semua syarat lain untuk menilai pengaruh satu faktor yang dikaji. Dalam kes ini, seseorang harus cuba mengenal pasti pengaruh faktor lain dengan memperkenalkannya ke dalam model, i.e. membina persamaan regresi berganda:

Matlamat utama regresi berganda adalah untuk membina model dengan sejumlah besar faktor, sambil menentukan pengaruh setiap daripada mereka secara individu, serta kesan kumulatifnya pada penunjuk yang dimodelkan. Spesifikasi model merangkumi dua bidang soalan: pemilihan faktor dan pilihan jenis persamaan regresi.

Keperluan Faktor:

    Harus boleh diukur. Jika perlu, masukkan dalam model faktor kualiti, yang tidak mempunyai ukuran kuantitatif, ia mesti diberi kepastian kuantitatif (contohnya, dalam model hasil, kualiti tanah diberikan dalam bentuk titik).

    Mereka tidak sepatutnya saling berkait dan lebih-lebih lagi berada dalam hubungan berfungsi yang tepat. Kemasukan dalam model faktor dengan interkorelasi tinggi apabila

untuk ketagihan

boleh membawa kepada akibat yang tidak diingini, membawa kepada ketidakstabilan dan ketidakbolehpercayaan anggaran pekali regresi. Sekiranya terdapat korelasi yang tinggi antara faktor, maka adalah mustahil untuk menentukan pengaruh terpencilnya pada penunjuk prestasi, jadi parameter persamaan regresi ternyata tidak ditafsirkan.

    Multikolineariti

Khusus untuk sistem multifaktorial ialah keadaan tidak boleh diterima hubungan yang terlalu rapat antara ciri faktor. Keadaan ini sering dirujuk sebagai masalah kolineariti faktor. Kolineariti bermaksud korelasi linear bukan rawak yang agak rapat bagi beberapa faktor dengan yang lain. Selalunya disyorkan untuk mengecualikan faktor yang dikaitkan dengan faktor lain di. Daripada kedua-duanya rapat kawan terikat dengan faktor lain, adalah rasional untuk mengecualikan faktor yang lebih lemah dikaitkan dengan ciri berkesan.

Teknik yang lebih kompleks diperlukan untuk mencari dan mengecualikan faktor yang tidak mempunyai hubungan rapat dengan mana-mana faktor individu, tetapi mempunyai hubungan multifaktorial yang rapat dengan kompleks faktor lain. Kedudukan ini dipanggil multikolineariti. Untuk mengukurnya, seseorang harus mengira secara berurutan pekali pelbagai korelasi (atau penentuan) setiap faktor (dalam peranan hasil) dengan semua faktor lain (dalam peranan pembolehubah penjelasan). Setelah menemui faktor multikolinear atau beberapa daripadanya, seseorang harus mempertimbangkan kemungkinan untuk mengecualikan faktor yang paling bergantung pada kompleks faktor yang tinggal, jika ini tidak membawa kepada kehilangan makna ekonomi model.

Kolineariti dan multikolineariti faktor dalam sistem ekonomi tidak timbul secara kebetulan. Dalam satu set perusahaan atau wilayah homogen, sebagai peraturan, disebabkan oleh undang-undang ekonomi, variasi selari ciri faktor timbul: perusahaan yang mempunyai nilai terbaik dari beberapa faktor, sebagai contoh, yang terbaik keadaan semula jadi, pada masa yang sama mempunyai nisbah modal dan kuasa-ke-berat yang lebih tinggi, kelayakan kakitangan yang lebih tinggi, teknologi yang lebih baik, dsb. Oleh itu kolineariti yang lebih besar atau lebih kecil yang tidak dapat dielakkan bagi semua faktor pengeluaran atau keadaan sosio-ekonomi kehidupan.

Kehadiran collinearity dalam sistem memburukkan kualiti matematik model, boleh menyebabkan ketidakstabilan parameter yang terhasil, yang berubah secara dramatik dengan perubahan kecil dalam nilai faktor.

Masalah khusus analisis multivariate ialah persoalan kemungkinan menggantikan faktor yang tidak ada maklumat dengan faktor lain dan akibat penggantian tersebut.

Anda harus, jika boleh, mencari pembolehubah lain yang nilainya diketahui dan yang berada dalam cukup sambungan rapat dengan faktor yang hilang. Sebagai contoh, jika tiada data gaji purata bagi rantau ini, maka data tersebut boleh digantikan dengan nilai keluaran serantau kasar per kapita, dengan mengambil kira bahawa perlu ada hubungan rapat (walaupun tidak diketahui secara tepat) antara ekonomi ini. penunjuk.

Adalah penting untuk mempertimbangkan tujuan model itu dibina. Jika matlamatnya hanya untuk meramalkan ciri yang berkesan, maka menggantikan faktor itu dengan pembolehubah lain, jika ia berkait rapat dengan faktor yang diganti, tidak akan membawa kepada ralat yang ketara. Tetapi jika matlamat model itu adalah untuk membuat keputusan tentang dasar ekonominya oleh pengurus, maka menggantikan faktor terkawal dengan faktor pengganti yang berkait rapat, tetapi tidak terurus menafikan model makna, walaupun keazaman yang tinggi.

    Memilih jenis model multifaktorial dan ciri faktor

Hubungan ciri berkesan y dengan faktor x 1 , x 2 , …, x k dinyatakan dengan persamaan:

(22)

di mana a ialah sebutan bebas bagi persamaan;

k– bilangan faktor;

j– nombor faktor;

i ialah bilangan unit penduduk;

b j ialah pekali regresi tulen bersyarat dengan faktor x j, yang mengukur perubahan dalam keputusan apabila faktor berubah mengikut unitnya, dan dengan ketekalan faktor lain yang disertakan dalam model;

ε i- variasi rawak y i, tidak dijelaskan oleh model.

Model dalam bentuk (22) adalah aditif. Ini bermakna model itu berdasarkan hipotesis bahawa setiap faktor menambah atau menolak sesuatu daripada nilai atribut yang terhasil. Hipotesis sedemikian tentang jenis hubungan antara sebab dan kesan mencerminkan sepenuhnya beberapa sistem ekonomi ciri yang saling berkaitan. Sebagai contoh, jika y ialah hasil tanaman, dan x 1 , x 2 , …, x k- faktor agroteknik: dos pelbagai jenis baja, bilangan rumpai, penyiraman, perkadaran kerugian semasa penuaian, maka sesungguhnya, setiap faktor ini sama ada meningkatkan atau mengurangkan hasil, dan hasilnya boleh wujud tanpa mana-mana faktor ini.

Walau bagaimanapun, model aditif tidak sesuai untuk semua hubungan dalam ekonomi. Jika perhubungan tersebut dikaji sebagai pergantungan kepada jumlah pengeluaran sesebuah perusahaan y dari kawasan yang diduduki x 1 , Bilangan Pekerja x 2 , kos aset tetap x 3 (atau jumlah modal), maka setiap faktor adalah perlu untuk kewujudan hasil, dan bukan tambahan kepadanya. Dalam situasi sedemikian, seseorang mesti meneruskan dari hipotesis bentuk pendaraban model:

(23)

Model sedemikian, menurut pencipta pertamanya, dipanggil "model Cobb-Douglas".

Bentuk campuran model juga mungkin, di mana beberapa faktor akan masuk secara tambahan, manakala yang lain akan masuk secara berganda.

Apabila memilih ciri faktor, seseorang harus meneruskan dari peruntukan berikut.

    Faktor harus menjadi punca, dan tanda yang terhasil harus menjadi akibatnya. Adalah tidak boleh diterima untuk memasukkan dalam bilangan faktor ciri yang menduduki tempat dalam ekonomi sebenar pada "output" sistem, i.e. bergantung kepada model. Sebagai contoh, model kos sesen bijirin sedang dibina. Faktor-faktor yang diambil ialah hasil tanaman bijirin dan keamatan buruh satu centner, tetapi pekali penentuan adalah kecil, modelnya kurang baik. Untuk "memperbaiki"nya, keuntungan pengeluaran bijirin telah ditambah kepada bilangan faktor. Pekali penentuan serta-merta melonjak kepada 0.88. Tetapi model itu tidak menjadi lebih baik, ia menjadi tidak bermakna, kerana keuntungan bergantung pada harga kos, dan bukan sebaliknya.

    Tanda faktor tidak seharusnya menjadi komponen tanda yang terhasil. Dalam model kos yang sama, upah peratus bijirin, kos pengangkutan sesen bijirin, dsb., tidak boleh diperkenalkan sebagai faktor. hubungan keseluruhan dengannya bahagian struktur tidak seharusnya dianalisis menggunakan analisis korelasi, tetapi dengan bantuan sistem indeks.

    Penduaan faktor harus dielakkan. Setiap faktor sebenar hendaklah diwakili oleh satu penunjuk. Sebagai contoh, faktor buruh dalam model volum pengeluaran boleh diwakili sama ada oleh purata bilangan pekerja, atau oleh kos hari bekerja (man-hours) untuk pengeluaran, tetapi bukan oleh kedua-dua penunjuk. Penduaan faktor membawa kepada pemecahan pengaruh faktor, dan ia mungkin tidak boleh dipercayai kerana pemecahan sedemikian.

    Faktor-faktor yang berkait rapat dengan orang lain harus dielakkan apabila boleh.

    Faktor satu tahap hierarki harus disertakan; faktor tahap yang lebih tinggi dan subfaktornya tidak harus disertakan. Sebagai contoh, dalam model kos bijirin kami memasukkan hasil, keamatan buruh, tetapi kami tidak menambah skor kesuburan, dos baja, bekalan kuasa pekerja, i.e. subfaktor - sebab yang mempengaruhi hasil dan intensiti buruh. Kemasukan subfaktor juga merupakan pertindihan faktor.

    Terdapat logik dalam pembinaan model sedemikian, di mana semua tanda diberikan kepada unit populasi yang sama, kedua-dua tanda berkesan dan faktor. Sebagai contoh, jika jumlah pengeluaran perusahaan dimodelkan, maka faktor-faktor juga harus merujuk kepada perusahaan: bilangan pekerja, keluasan tanah, aset tetap, dll. Jika model dibina upah pekerja, maka faktor-faktor juga harus digunakan untuk pekerja: tempoh perkhidmatannya, umur, pendidikan, kategori skala tarif (skala), bekalan kuasa, dll.

    Prinsip kesederhanaan model terpakai. Jika boleh dibina model yang bagus dengan lima faktor, anda tidak perlu mengejar model ideal dengan sepuluh faktor, biasanya faktor tambahan memburukkan model.

    Kad Skor Korelasi dan Regresi Multivariate

Mari kita pertimbangkan sistem penunjuk ini mengenai contoh hubungan antara hasil tanaman bijirin dalam 51 firma pertanian di rantau Oryol. Pada mulanya, 8 ciri faktor telah dipilih yang boleh mempengaruhi variasi hasil:

x 1 - saiz kawasan bijirin yang disemai, ha;

x 2 graviti tertentu bijirin dalam jumlah kawasan, %;

x 3 – kos setiap 1 ha tanaman bijirin, ribu rubel/ha;

x 4 - kos buruh setiap 1 ha, jam kerja;.

x 5 – tahap imbuhan, gosok./orang-jam;

x 6 – bekalan tenaga, hp/100 ha tanah pertanian;

x 7 - bilangan gabungan setiap 1000 hektar bijirin, pcs.;

x 8 - bilangan pemandu traktor setiap 100 hektar tanah pertanian, orang.

Persamaan regresi asal ialah:

Walau bagaimanapun, hanya pekali pada x 3 (t-kriteria adalah sama dengan 10.5) dan bila x 8 (t-kriteria adalah sama dengan 2.72). Kebolehpercayaan yang lebih tinggi daripada faktor lain yang mempunyai dan x 5 .

Selepas menapis faktor yang tidak boleh dipercayai, i.e. mengeluarkannya daripada persamaan, persamaan regresi terakhir ialah:

Oleh itu, perbezaan hasil dalam data 51 firma pertanian paling kuat dan boleh dipercayai dipengaruhi oleh perbezaan antara perusahaan dalam kos setiap 1 ha, dalam tahap gaji dan ketersediaan pekerja mahir.

Setiap pekali, dipanggil pekali regresi tulen, ditafsirkan sebagai jumlah perubahan dalam hasil, dengan syarat faktor ini diubah oleh unit ukuran yang diterima, dan dua faktor lain kekal malar pada tahap purata. Sebagai contoh, b 3 bermakna dengan peningkatan kos bagi setiap 1 hektar tanaman bijirin dan dengan gaji yang sama serta ketersediaan pemandu traktor, hasil purata meningkat sebanyak purata 4.6 sen sehektar. Istilah "regresi tulen bersyarat" bermaksud bahawa pengaruh faktor tunggal dibersihkan daripada variasi bersamaan hanya faktor-faktor yang memasuki persamaan, tetapi tidak dibersihkan daripada kemungkinan variasi bersamaan faktor lain.

Nilai pekali regresi tulen bersyarat bergantung pada unit ukuran yang diterima. Jika faktor x 3 diukur bukan dalam beribu-ribu rubel sehektar, tetapi dalam rubel sehektar, maka pekali b 3 akan bersamaan dengan 0.00461 rubel/ha. Oleh itu, adalah mustahil untuk membandingkan pekali regresi tulen bersyarat antara mereka. Untuk mendapatkan pekali setanding pengaruh variasi faktor pada variasi hasil, seseorang harus menyingkirkan unit ukuran, membawanya ke satu unit konvensional. Dua kaedah boleh digunakan untuk ini.

Cara pertama dipanggil standardisasi. Istilah ini berasal dari nama Inggeris sisihan piawai. Pekali regresi piawai dinyatakan dalam pecahan atau nilai, jika ia melebihi satu - dalam sebutan σ y. Pekali piawai dilambangkan dengan huruf Yunani β dan dipanggil pekali beta. Formula mereka ialah:

Dalam contoh kami, kami mendapat:

β 3 = 0,772;

β 5 = 0,147;

β 8 = 0,223.

Tafsiran pekali beta adalah seperti berikut: apabila faktor berubah x 3 untuk salah satu sisihan piawainya daripada nilai purata dan dengan keteguhan faktor lain, sifat berkesan (hasil) akan menyimpang daripada tahap puratanya sebanyak 0.772 sisihan piawainya. Oleh kerana semua pekali piawai dinyatakan dalam unit yang sama, dalam σ y , mereka adalah setanding antara satu sama lain, dan boleh disimpulkan bahawa variasi dalam hasil paling kuat dipengaruhi dalam set perusahaan yang dikaji oleh variasi dalam kos sehektar penanaman.

Satu lagi cara untuk membawa pekali regresi kepada bentuk yang setanding ialah menukarnya kepada pekali keanjalan. Formula pekali keanjalan ℓ j :

(25)

Pekali keanjalan ditafsirkan seperti berikut: apabila faktor berubah x j pada dia nilai purata dan dengan keteguhan faktor lain yang termasuk dalam persamaan, ciri yang terhasil akan berubah secara purata sebanyak ℓ j sebahagian daripada min (atau ℓ j purata jika ℓ j>1, yang jarang berlaku). Selalunya dikatakan, "akan berubah menjadi ℓ j peratus setiap 1% perubahan dalam faktor.

Dalam contoh kami, kami mempunyai:

Pekali keanjalan adalah seperti yang disebut sebagai β j, dalam unit yang sama dan setanding antara satu sama lain. Ia lebih mudah daripada pekali β untuk digunakan dalam perancangan dan peramalan. Tidak mungkin pengurus akan merancang untuk meningkatkan faktor, katakan, pelaburan sebanyak 0.6 sigma. Biasanya mereka bercadang untuk mengubah faktor, jika ia boleh diurus, dengan begitu banyak peratus daripada tahap yang dicapai. Sebagai contoh, jika kita bercadang untuk meningkatkan kos sehektar tanaman bijirin sebanyak 10%, upah sebanyak 30%, dan ketersediaan pemandu traktor yang berkelayakan sebanyak 20%, maka kita boleh menjangkakan perubahan dalam hasil sebanyak
, di mana k j– kadar pertumbuhan faktor yang dirancang.

Sekarang pertimbangkan sistem penunjuk ketat hubungan pelbagai faktor. Pertama sekali, matriks pekali korelasi berpasangan dibina (Jadual 1).

Jadual 1. Matriks pekali korelasi berpasangan

tanda-tanda

x 3

x 5

x 8

x 3

x 5

x 8

Matriks pekali korelasi berpasangan menyediakan input untuk penunjuk lain tentang kekencangan sambungan dan untuk pemeriksaan utama untuk kolineariti. AT kes ini semua hubungan antara faktor adalah lemah, kolineariti tidak akan merosakkan model.

Penunjuk yang paling penting bagi keakraban komunikasi dalam sistem multifaktorial ialah pekali penentuan berbilang. R 2 . Ia mengukur ketepatan keseluruhan hubungan variasi sifat yang terhasil y dengan variasi keseluruhan sistem faktor yang termasuk dalam model. Nilai pekali penentuan berbilang boleh dikira dalam beberapa cara.

1. Pengiraan berdasarkan matriks pekali korelasi berpasangan

,

di mana Δ * - penentu matriks;

, (26)

dan Δ ialah penentu matriks yang tidak termasuk baris pertama Δ * dan lajur terakhirnya, iaitu:

Dengan dua faktor, formula pengiraan yang dipermudahkan diperoleh:

(27)

Ia berikutan daripada (27) bahawa jika faktor-faktor adalah bebas antara satu sama lain, iaitu, , pekali penentuan berbilang ialah hasil tambah bagi pekali penentuan pasangan.

Dengan menggunakan formula (27), kita boleh mengira tiga kemungkinan pekali penentuan dua faktor:

2. Pengiraan berdasarkan pekali korelasi berpasangan dan pekali β:

Dalam contoh: R 2 \u003d 0.86 0.772 + 0.35 0.147 + 0.433 0.223 \u003d 0.8119.

3. Pengiraan sebagai hubungan korelasi, iaitu. nisbah variasi atribut terhasil y, dikaitkan dengan variasi sistem faktor yang termasuk dalam model (dalam persamaan regresi), kepada keseluruhan, umum, variasi atribut yang terhasil:

. (30)

Pengangka formula (30) ialah jumlah sisihan kuasa dua bagi nilai pengiraan individu bagi atribut berkesan daripada puratanya, dan penyebut ialah jumlah kuasa dua nilai sebenar atribut berkesan daripada purata, untuk semua unit penduduk.

Pekali penentuan separa ialah penunjuk yang mengukur dengan perkadaran berapa variasi yang tidak dapat dijelaskan dikurangkan oleh faktor-faktor yang sudah ada dalam model apabila faktor ini dimasukkan ke dalam model. x m. Formula bagi pekali penentuan separa adalah seperti berikut:

Dalam contoh kami:

Tafsiran adalah seperti berikut: kemasukan dalam model faktor x 3 selepas x 5 dan x 8 y sebanyak 74%; faktor kemasukan x 5 selepas x 3 dan x 8 mengurangkan variasi yang tidak dapat dijelaskan y pada 10%; faktor kemasukan x 8 selepas x 3 dan x 5 mengurangkan variasi yang tidak dapat dijelaskan y sebanyak 20%.

Pekali penentuan persendirian tidak dapat dibandingkan antara mereka sendiri, kerana ini adalah pecahan daripada nilai penyebut yang berbeza.

Mengekstrak punca kuasa dua mana-mana pekali penentuan, seseorang memperoleh pekali korelasi yang sepadan: berbilang, berpasangan atau persendirian.

5. Kemasukan faktor bukan kuantitatif dalam model multifaktorial

Faktor bukan kuantitatif pengeluaran pertanian adalah seperti kawasan semula jadi, bentuk pemilikan perusahaan, arah pengeluaran utama (industri) dan lain-lain. Adalah lebih baik untuk tidak mencampurkan perusahaan atau wilayah yang berbeza dalam ciri kualitatif ini dalam populasi awal. Tetapi mungkin juga perlu untuk membina model dengan unit heterogen populasi, sebagai contoh, jika bilangan unit yang homogen dari segi kualiti terlalu kecil untuk sambungan yang boleh dipercayai. Kadangkala matlamatnya mungkin untuk mengukur pengaruh bersih faktor bukan kuantitatif, seperti pemilikan, ke atas keluaran pengeluaran, dan ini memerlukan kemasukan faktor kualitatif dalam model berbilang faktor.

Dalam kes sedemikian, penggredan kualitatif sesuatu ciri boleh dikodkan oleh pembolehubah khas, selalunya dipanggil pembolehubah "dummy" atau "struktur". Mereka mencerminkan heterogeniti struktur kualitatif populasi. Katakan adalah perlu untuk membina model regresi keuntungan produk perusahaan, dan di rantau ini terdapat 16 perusahaan milik kerajaan, 28 swasta, 13 bentuk pemilikan koperasi.

Jika kita mengabaikan perbezaan yang berkaitan dengan bentuk pemilikan, maka ia sama ada akan memasuki variasi baki, memburukkan model keuntungan, atau ia akan bercampur dengan pengaruh faktor kualitatif tertentu dalam perkadaran yang tidak diketahui, memesongkan ukuran pengaruhnya.

Perlu untuk m faktor bukan kuantitatif atau penggredan faktor tersebut untuk diperkenalkan m-1 pembolehubah struktur, dilambangkan dengan U j. Data pengiraan akan kelihatan seperti ini: m=3 (Jadual 2).

Jadual 2. Data awal dengan pembolehubah struktur

Jenis pemilikan

Unit penduduk

Ciri kuantitatif

Pembolehubah struktur

X 1

X 2

X k

U 1

U 2

negeri

Maksud tanda-tanda ini

Maksud tanda-tanda ini

Koperasi

Maksud tanda-tanda ini

Hasil daripada penyelesaian, model borang akan diperoleh:

di mana x k +1 sepadan dengan pembolehubah U 1 , a x k +2 - pembolehubah U 2 .

Mari kita tulis semula model dalam notasi khas:

Maksud pekali bagi pembolehubah struktur adalah seperti berikut: pekali c 1 bermaksud bahawa perusahaan swasta dengan nilai faktor kuantitatif yang sama x 1 x k mempunyai keuntungan c 1 lebih daripada perusahaan milik kerajaan, yang diambil sebagai asas perbandingan (tidak mempunyai pembolehubah struktur U 1 dan U 2 ). Perusahaan bentuk pemilikan koperasi mempunyai keuntungan pada c 2 lebih besar daripada negeri. Kuantiti c 1 dan c 2 boleh menjadi positif dan negatif.

Daripada model umum, anda boleh menulis tiga model peribadi untuk perusahaan kumpulan individu dengan pemilikan, menambah pekali pembolehubah struktur kepada sebutan bebas persamaan:

a) untuk perusahaan sektor awam

b) untuk perusahaan sektor swasta

c) untuk perusahaan sektor koperasi

6. Penggunaan pelbagai faktor model regresi untuk menganalisis aktiviti perusahaan dan ramalan

Penilaian prestasi berdasarkan model regresi, berbanding dengan kaedah paling mudah bagi penilaian sedemikian - membandingkan hasil yang dicapai oleh perusahaan tertentu dengan hasil purata untuk populasi homogen - memberikan kelebihan tambahan.

Mengikut contoh kami, purata hasil bagi 51 firma pertanian ialah 22.9 c/ha bijirin.

Agrofirm 1 menerima 17.6 q/ha. Oleh itu, firma ini ketinggalan. Walau bagaimanapun, persoalan timbul: mungkin keadaan pengeluaran syarikat ini lebih buruk daripada purata? Perbandingan dengan purata populasi mengabaikan sama sekali perbezaan dalam "penawaran faktor" perusahaan, dan sebenarnya perusahaan sentiasa tidak berada dalam keadaan yang sama.

Penilaian aktiviti berdasarkan model regresi melibatkan mengambil kira ketidaksamaan keadaan pengeluaran, contohnya, kesuburan tanah, keadaan kewangan, ketersediaan kakitangan yang berkelayakan, dan lain-lain. Adalah mustahil untuk mengambil kira sepenuhnya perbezaan dalam keadaan pengeluaran antara perusahaan, kerana mana-mana model tidak mengambil kira semua faktor variasi hasil. Penilaian berdasarkan model dibuat dengan membandingkan hasil sebenar (hasil) dengan hasil yang akan dicapai oleh perusahaan dengan faktor sebenar dan purata ke atas keseluruhan kecekapannya, dinyatakan oleh pekali regresi tulen bersyarat. Pertimbangkan keputusan pengiraan hasil dua firma (Jadual 3).

Jadual 3. Hasil sebenar dan anggaran pengeluaran

Agrofirma

Tanda-tanda faktor

Produktiviti, c/ha

x 3

x 5

x 8

sebenar

dianggarkan

Purata sampel

Kedua-dua firma mempunyai lebih teruk daripada purata dalam sampel, nilai-nilai faktor utama x 3 dan x 8 , dan, dengan itu, nilai hasil yang dikira adalah lebih rendah daripada purata. Tetapi pada masa yang sama, firma 1 mempunyai anggaran hasil yang hampir sama seperti yang sebenarnya diperolehi. Tidak ada sebab untuk menganggap firma ini ketinggalan. Firma 2 mempunyai hasil sebenar lebih rendah daripada yang dikira berdasarkan faktor yang ada. Ini bermakna sama ada faktor yang tidak diketahui yang tidak termasuk dalam model ternyata lebih buruk daripada purata bagi firma ini, atau tahap penggunaan faktor utama - kos sehektar dan ketersediaan pekerja mahir adalah lebih rendah daripada purata.

Peramalan berdasarkan model regresi adalah berdasarkan andaian bahawa faktor-faktor boleh dikawal dan boleh mengambil satu atau satu lagi nilai yang dirancang, dijangka, dan keadaan lain yang tidak diketahui akan kekal pada tahap purata dalam populasi. Kebolehkawalan faktor tidak bermakna bahawa mana-mana nilainya boleh digantikan ke dalam model semasa meramal. Persamaan regresi mencerminkan keadaan yang wujud dalam agregat, mengikut mana persamaan itu diperolehi. Jika nilai tanda faktor adalah 2-3 kali lebih tinggi, maka tidak boleh dipertikaikan bahawa pekali regresi tulen bersyarat akan tetap sama.

Oleh itu, adalah disyorkan, apabila meramalkan menggunakan persamaan regresi, untuk tidak melampaui had nilai sebenar yang diperhatikan faktor dalam agregat, atau melampaui had ini dengan tidak lebih daripada 10-15% daripada purata. nilai. Keperluan yang sama penting dalam peramalan ialah keperluan bahawa nilai ramalan faktor adalah konsisten. Ia adalah perlu untuk mengambil kira tanda dan keakraban hubungan antara faktor. Sebagai contoh, jika ia diramalkan untuk meningkatkan tahap peruntukan dengan pekerja yang berkelayakan, maka adalah mustahil untuk meninggalkan tidak berubah, apalagi mengurangkan, nilai ramalan tahap upah. Apabila merancang pertumbuhan nisbah kuasa-kepada-berat, nisbah modal-buruh perlu ditingkatkan kira-kira dalam perkadaran yang sama.

Dengan memberi tumpuan kepada nilai faktor yang ditunjukkan dalam Jadual 3, kami menganggap bahawa apabila meramalkan hasil, kami merancang kos sehektar ( x 3 ) pada tahap 3 ribu rubel, kehadiran pemandu traktor setiap 100 hektar tanah pertanian 0.8; gaji setiap jam sebanyak 20 rubel. dalam jam. Menggantikan nilai ini ke dalam model regresi, kami memperoleh ramalan titik untuk hasil tanaman bijirin:

Ramalan titik ialah jangkaan matematik (purata) nilai kemungkinan atribut yang diramalkan dengan kebarangkalian yang berbeza. Ia adalah perlu untuk menambah ramalan mata dengan pengiraan had keyakinan dengan kebarangkalian yang cukup tinggi. Untuk melakukan ini, gunakan nilai ralat penghampiran kuasa dua min, yang dikira dengan formula:

(33)

Pengangka bagi ungkapan radikal ialah baki, tidak dijelaskan oleh model, jumlah sisihan kuasa dua bagi ciri yang terhasil, dan penyebut ialah bilangan darjah kebebasan variasi baki. Dalam contoh kami, jumlah baki sisihan kuasa dua ialah 814.3. Kami ada:

Oleh itu, dengan kebolehpercayaan 0.95, hasil yang diramalkan ialah 25.4±4.16·2, atau dari 17.8 hingga 33.72 c/ha. Semua pengiraan ini merujuk kepada ramalan hasil untuk firma pertanian individu. Jika kita bercakap kira-kira purata hasil bagi agregat 51 firma pertanian, maka kesalahan bermakna min aritmetik adalah sama dengan sisihan piawai dibahagikan dengan punca kuasa dua saiz sampel n, iaitu akan jadi:

Tafsiran nilai ralat ramalan purata ini adalah seperti berikut: jika 51 firma pertanian disediakan dengan faktor x 3 , x 5 , x 8 pada tahap 3, 20, 0.8, maka hasil purata agregat 25.4 ± 0.583 c/ha akan diperolehi. Dengan kebarangkalian 0.95, purata hasil jangkaan agregat ialah 25.4±0.583·2, atau dari 23.7 hingga 27.1 c/ha.

Model korelasi-regresi ekonometrik bagi sistem ciri yang saling berkaitan populasi yang dikaji ialah persamaan regresi yang merangkumi faktor utama yang mempengaruhi variasi ciri yang terhasil dalam populasi, mempunyai nilai tinggi pekali penentuan (tidak lebih rendah daripada 0.5), boleh dipercayai dan ditafsirkan dengan betul mengikut (dalam tanda dan susunan magnitud) dengan teori sistem yang dikaji oleh pekali regresi, dan disebabkan sifat ini, sesuai untuk menilai aktiviti unit populasi dan untuk ramalan.

pelbagai regresi (2)Abstrak >> Pemasaran

Memperkenalkan mereka ke dalam model, iaitu, membina persamaan pelbagai regresi. Pelbagai regresi digunakan secara meluas dalam menyelesaikan masalah permintaan...

Semasa pengajian mereka, pelajar sering menghadapi pelbagai persamaan. Salah satu daripadanya - persamaan regresi - dipertimbangkan dalam artikel ini. Persamaan jenis ini digunakan secara khusus untuk menerangkan ciri-ciri hubungan antara parameter matematik. Jenis kesamaan ini digunakan dalam statistik dan ekonometrik.

Definisi regresi

Dalam matematik, regresi difahami sebagai kuantiti tertentu yang menggambarkan pergantungan nilai purata set data pada nilai kuantiti lain. Persamaan regresi menunjukkan, sebagai fungsi ciri tertentu, nilai purata ciri lain. Fungsi regresi mempunyai bentuk persamaan mudah y \u003d x, di mana y ialah pembolehubah bersandar, dan x ialah pembolehubah tidak bersandar (faktor ciri). Malah, regresi dinyatakan sebagai y = f (x).

Apakah jenis hubungan antara pembolehubah

Secara umum, dua jenis hubungan yang bertentangan dibezakan: korelasi dan regresi.

Yang pertama dicirikan oleh kesamaan pembolehubah bersyarat. Dalam kes ini, tidak diketahui dengan pasti pembolehubah mana yang bergantung pada yang lain.

Jika tiada kesamaan antara pembolehubah dan syarat mengatakan pembolehubah mana yang menerangkan dan yang bergantung, maka kita boleh bercakap tentang kehadiran sambungan jenis kedua. Untuk membina persamaan regresi linear, adalah perlu untuk mengetahui jenis sambungan yang diperhatikan.

Jenis regresi

Sehingga kini, terdapat 7 jenis regresi yang berbeza: hiperbolik, linear, berbilang, bukan linear, berpasangan, songsang, linear logaritma.

Hiperbolik, linear dan logaritma

Persamaan regresi linear digunakan dalam statistik untuk menerangkan dengan jelas parameter persamaan. Ia kelihatan seperti y = c + m * x + E. Persamaan hiperbola mempunyai bentuk hiperbola sekata y \u003d c + m / x + E. Secara logaritma persamaan linear menyatakan hubungan dengan fungsi logaritma: Dalam y \u003d Dalam c + t * Dalam x + Dalam E.

Berbilang dan bukan linear

dua lagi jenis yang kompleks regresi adalah berbilang dan tidak linear. Persamaan regresi berganda dinyatakan oleh fungsi y \u003d f (x 1, x 2 ... x c) + E. Dalam keadaan ini, y ialah pembolehubah bersandar dan x ialah pembolehubah penjelasan. Pembolehubah E adalah stokastik dan termasuk pengaruh faktor lain dalam persamaan. Persamaan Tak Linear regresi agak tidak konsisten. Di satu pihak, berkenaan dengan penunjuk yang diambil kira, ia tidak linear, dan sebaliknya, dalam peranan menilai penunjuk, ia adalah linear.

Regresi Songsang dan Berpasangan

Songsang ialah sejenis fungsi yang perlu ditukar kepada pandangan linear. Dalam program aplikasi yang paling tradisional, ia mempunyai bentuk fungsi y \u003d 1 / c + m * x + E. Persamaan regresi berpasangan menunjukkan hubungan antara data sebagai fungsi y = f(x) + E. Sama seperti persamaan lain, y bergantung kepada x dan E ialah parameter stokastik.

Konsep korelasi

Ini adalah penunjuk yang menunjukkan kewujudan hubungan antara dua fenomena atau proses. Kekuatan hubungan dinyatakan sebagai pekali korelasi. Nilainya turun naik dalam selang [-1;+1]. Penunjuk negatif bercakap tentang kehadiran maklum balas, positif - tentang garis lurus. Jika pekali mengambil nilai yang sama dengan 0, maka tidak ada hubungan. Semakin hampir nilainya kepada 1, maka sambungan yang lebih kukuh antara parameter, semakin hampir kepada 0 - semakin lemah.

Kaedah

Kaedah parametrik korelasi boleh menganggarkan keketatan hubungan. Ia digunakan berdasarkan anggaran taburan untuk mengkaji parameter yang mematuhi undang-undang taburan normal.

Parameter persamaan regresi linear adalah perlu untuk mengenal pasti jenis pergantungan, fungsi persamaan regresi dan menilai penunjuk formula perhubungan yang dipilih. Medan korelasi digunakan sebagai kaedah untuk mengenal pasti hubungan. Untuk melakukan ini, semua data sedia ada mesti diwakili secara grafik. Dalam sistem koordinat dua dimensi segi empat tepat, semua data yang diketahui mesti diplot. Ini adalah bagaimana medan korelasi terbentuk. Nilai faktor penghuraian ditandakan di sepanjang absis, manakala nilai faktor bergantung ditandakan di sepanjang ordinat. Sekiranya terdapat hubungan fungsi antara parameter, ia berbaris dalam bentuk garis.

Jika pekali korelasi data tersebut kurang daripada 30%, kita boleh bercakap tentang ketiadaan sambungan yang hampir lengkap. Jika ia adalah antara 30% dan 70%, maka ini menunjukkan kehadiran pautan rapat sederhana. Penunjuk 100% adalah bukti sambungan berfungsi.

Persamaan regresi bukan linear, sama seperti persamaan linear, mesti ditambah dengan indeks korelasi (R).

Korelasi untuk Regresi Berganda

Pekali penentuan ialah penunjuk bagi segi empat sama pelbagai korelasi. Dia bercakap tentang ketatnya hubungan set penunjuk yang dibentangkan dengan sifat yang dikaji. Ia juga boleh bercakap tentang sifat pengaruh parameter pada hasilnya. Persamaan regresi berganda dinilai menggunakan penunjuk ini.

Untuk mengira indeks korelasi berganda, adalah perlu untuk mengira indeksnya.

Kaedah kuasa dua terkecil

Kaedah ini adalah cara untuk menganggar faktor regresi. Intipatinya terletak pada meminimumkan jumlah sisihan kuasa dua yang diperoleh kerana pergantungan faktor pada fungsi.

Persamaan regresi linear berpasangan boleh dianggarkan menggunakan kaedah sedemikian. Persamaan jenis ini digunakan dalam kes pengesanan antara penunjuk hubungan linear berpasangan.

Pilihan Persamaan

Setiap parameter fungsi regresi linear mempunyai makna tertentu. Persamaan regresi linear berpasangan mengandungi dua parameter: c dan m. Parameter t menunjukkan perubahan purata dalam penunjuk akhir fungsi y, tertakluk kepada penurunan (peningkatan) dalam pembolehubah x oleh satu unit konvensional. Jika pembolehubah x adalah sifar, maka fungsinya adalah sama dengan parameter c. Jika pembolehubah x bukan sifar, maka faktor c tidak dibawa pengertian ekonomi. Satu-satunya pengaruh pada fungsi ialah tanda di hadapan faktor c. Sekiranya terdapat tolak, maka kita boleh mengatakan tentang perubahan perlahan dalam keputusan berbanding dengan faktor. Sekiranya terdapat tambah, maka ini menunjukkan perubahan dipercepatkan dalam hasilnya.

Setiap parameter yang mengubah nilai persamaan regresi boleh dinyatakan dalam sebutan persamaan. Sebagai contoh, faktor c mempunyai bentuk c = y - mx.

Data berkumpulan

Terdapat keadaan masalah di mana semua maklumat dikumpulkan mengikut atribut x, tetapi pada masa yang sama untuk kumpulan tertentu nilai purata yang sepadan bagi penunjuk bergantung ditunjukkan. Dalam kes ini, nilai purata mencirikan bagaimana penunjuk bergantung pada x. Oleh itu, maklumat yang dikumpulkan membantu untuk mencari persamaan regresi. Ia digunakan sebagai analisis hubungan. Walau bagaimanapun, kaedah ini mempunyai kelemahannya. Malangnya, purata selalunya tertakluk kepada turun naik luaran. Turun naik ini bukan cerminan corak hubungan, ia hanya menutupi "bising"nya. Purata menunjukkan corak hubungan jauh lebih buruk daripada persamaan regresi linear. Walau bagaimanapun, ia boleh digunakan sebagai asas untuk mencari persamaan. Dengan mendarabkan saiz populasi tertentu dengan purata yang sepadan, anda boleh mendapatkan jumlah y dalam kumpulan itu. Seterusnya, anda perlu mengetuk keluar semua jumlah yang diterima dan mencari penunjuk akhir y. Ia adalah lebih sukar untuk membuat pengiraan dengan penunjuk jumlah xy. Sekiranya selang adalah kecil, kita boleh mengambil penunjuk x secara bersyarat untuk semua unit (dalam kumpulan) sama. Darabkannya dengan hasil tambah y untuk mencari hasil tambah bagi x dan y. Selanjutnya, semua jumlah disatukan dan ternyata jumlah keseluruhan hu.

Regresi Persamaan Pasangan Berganda: Menilai Kepentingan Perhubungan

Seperti yang dibincangkan sebelum ini, regresi berganda mempunyai fungsi dalam bentuk y \u003d f (x 1, x 2, ..., x m) + E. Selalunya, persamaan sedemikian digunakan untuk menyelesaikan masalah penawaran dan permintaan untuk barangan, pendapatan faedah ke atas saham yang dibeli semula, mengkaji punca dan jenis fungsi kos pengeluaran. Ia juga digunakan secara aktif dalam pelbagai jenis kajian dan pengiraan makroekonomi, tetapi pada peringkat mikroekonomi, persamaan ini digunakan agak kurang kerap.

Tugas utama regresi berganda adalah untuk membina model data yang mengandungi sejumlah besar maklumat untuk menentukan lebih lanjut apa yang mempengaruhi setiap faktor secara individu dan dalam keseluruhannya pada penunjuk yang akan dimodelkan dan pekalinya. Persamaan regresi boleh mengambil pelbagai nilai. Dalam kes ini, dua jenis fungsi biasanya digunakan untuk menilai hubungan: linear dan bukan linear.

Fungsi linear digambarkan dalam bentuk hubungan sedemikian: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Dalam kes ini, a2, a m , dianggap sebagai pekali regresi "tulen". Mereka adalah perlu untuk mencirikan perubahan purata dalam parameter y dengan perubahan (penurunan atau peningkatan) dalam setiap parameter x yang sepadan dengan satu unit, dengan keadaan nilai stabil penunjuk lain.

Persamaan tak linear mempunyai, sebagai contoh, bentuk fungsi kuasa y=ax 1 b1 x 2 b2 ...x m bm . Dalam kes ini, penunjuk b 1, b 2 ..... b m - dipanggil pekali keanjalan, mereka menunjukkan bagaimana hasilnya akan berubah (berapa banyak%) dengan peningkatan (penurunan) dalam penunjuk yang sepadan x sebanyak 1% dan dengan penunjuk stabil faktor lain.

Apakah faktor yang perlu dipertimbangkan semasa membina regresi berganda

Untuk membina regresi berganda dengan betul, adalah perlu untuk mengetahui faktor mana yang perlu diberi perhatian khusus.

Adalah perlu untuk mempunyai sedikit pemahaman tentang sifat hubungan antara faktor ekonomi dan dimodelkan. Faktor-faktor yang perlu disertakan mestilah memenuhi kriteria berikut:

  • Mesti boleh diukur. Untuk menggunakan faktor yang menggambarkan kualiti objek, dalam apa jua keadaan, ia harus diberikan bentuk kuantitatif.
  • Seharusnya tiada faktor saling korelasi, atau hubungan fungsi. Tindakan sedemikian paling kerap membawa kepada akibat yang tidak dapat dipulihkan - sistem persamaan biasa menjadi tidak bersyarat, dan ini melibatkan penilaian yang tidak boleh dipercayai dan kabur.
  • Dalam kes kewujudan indeks korelasi yang besar, tidak ada cara untuk mengetahui pengaruh terpencil faktor pada keputusan akhir penunjuk, oleh itu, pekali menjadi tidak dapat ditafsirkan.

Kaedah Pembinaan

wujud jumlah yang besar kaedah dan teknik yang menerangkan bagaimana anda boleh memilih faktor untuk persamaan. Walau bagaimanapun, semua kaedah ini adalah berdasarkan pemilihan pekali menggunakan indeks korelasi. Antaranya ialah:

  • Kaedah pengecualian.
  • Hidupkan kaedah.
  • Analisis regresi berperingkat.

Kaedah pertama melibatkan menapis semua pekali daripada set agregat. Kaedah kedua melibatkan memperkenalkan satu set faktor tambahan. Nah, yang ketiga ialah penghapusan faktor-faktor yang sebelum ini digunakan untuk persamaan. Setiap kaedah ini mempunyai hak untuk wujud. Mereka mempunyai kebaikan dan keburukan mereka, tetapi mereka boleh menyelesaikan isu menapis penunjuk yang tidak perlu dengan cara mereka sendiri. Sebagai peraturan, keputusan yang diperolehi oleh setiap kaedah berasingan cukup dekat.

Kaedah analisis multivariate

Kaedah sedemikian untuk menentukan faktor adalah berdasarkan pertimbangan gabungan individu ciri yang saling berkaitan. Ini termasuk analisis diskriminasi, pengecaman corak, analisis komponen utama dan analisis kelompok. Di samping itu, terdapat juga analisis faktor, bagaimanapun, ia muncul sebagai hasil daripada pembangunan kaedah komponen. Kesemuanya digunakan dalam keadaan tertentu, di bawah syarat dan faktor tertentu.

Pada hakikatnya, setiap fenomena ditentukan oleh tindakan bukan satu punca, tetapi beberapa, malah kompleks sebab. Mereka tindakan bersama mungkin mempunyai implikasi yang berbeza untuk hasilnya. “Kesannya dijana oleh tindakan kumulatif banyak sebab. Gabungan punca yang kompleks membawa kepada hasil yang berbeza. Bertindak atas akibat ke arah yang sama, mereka menguatkan pengaruh satu sama lain. Jika beberapa punca mempunyai arah yang bertentangan berhubung dengan objek tindakan, maka kesan gabungannya terhadap kesannya menjadi lemah atau bahkan dibatalkan. Situasi mungkin timbul apabila sebab yang jelas dan benar-benar bertindak tidak mempunyai kesan yang jelas. Ini bermakna bahawa bersama-sama dengan sebab ini, satu lagi bertindak, menyerap tindakan yang pertama. Jadi, adalah perlu untuk mengkaji kesannya pelbagai alasan, iaitu, untuk menyiasat pergantungan satu fenomena pada beberapa fenomena lain yang menyebabkan yang pertama.

Agak jelas bahawa tidak semua punca dan faktor yang sedikit sebanyak mempengaruhi fenomena yang dikaji boleh disiasat. Kami terpaksa menghadkan diri kepada sebab-sebab penting.

Fenomena ekonomi ditentukan oleh orang ramai secara serentak dan kolektif. punca operasi. Oleh itu, kita berhadapan dengan tugas untuk mengkaji pergantungan satu pembolehubah bersandar pada beberapa pembolehubah penjelasan di bawah keadaan tempat dan masa tertentu. Masalah ini boleh diselesaikan menggunakan analisis regresi berbilang, atau multivariat. Dalam kes ini, kita sekali lagi mengehadkan diri kita untuk mempertimbangkan hubungan linear antara pembolehubah bersandar y dan pembolehubah penjelasan xm. Kami juga akan membincangkan penggunaan analisis regresi dengan hubungan bukan linear antara pembolehubah, tetapi hanya untuk kes di mana penghampiran linear mungkin.

Jadi, jika terdapat hubungan linear antara pembolehubah, ungkapan umum untuk persamaan regresi berbilang (2.1) ditulis sebagai

Pembolehubah penerangan mempunyai kesan serentak bersama pada pembolehubah bersandar y.

Seperti yang dikatakan, kita tidak boleh merangkumi keseluruhan kompleks sebab dan mengambil kira kerawanan yang wujud dalam satu darjah atau yang lain dalam tindakan sebab akibat dan kesan yang ditentukan olehnya. Oleh itu, mengehadkan diri kita kepada pembolehubah penjelasan yang paling penting, kami memperkenalkan komponen tambahan pembolehubah mengganggu u ke dalam ungkapan fungsi regresi, yang memberikan kesan jumlah kesan semua faktor dan kemalangan yang tidak diambil kira. Oleh itu, nilai empirikal y boleh diwakili seperti berikut:

Jadi, pembolehubah yang mengganggu dan ditafsirkan dengan cara yang sama seperti dalam regresi linear mudah.

Dalam ungkapan fungsi, nilai yang dikira regresi. Mereka menunjukkan nilai purata pembolehubah y pada satu titik untuk nilai tetap pembolehubah penjelasan, dengan mengandaikan bahawa hanya pembolehubah ini menyebabkan pembolehubah y berubah. Nilai-y ialah anggaran nilai-y min untuk nilai tetap pembolehubah pada titik

Pekali ialah parameter regresi (2.42). Regresi malar sekali lagi melaksanakan fungsi penyamaan dalam persamaan regresi. Ia mentakrifkan titik persilangan hiperpermukaan regresi dengan paksi-y.

Nilai adalah anggaran pekali regresi. Indeks pada pekali sepadan dengan indeks pembolehubah penjelasan. Jadi, menunjukkan purata perubahan dalam y apabila menukar satu unit, dengan syarat pembolehubah lain kekal tidak berubah; menunjukkan dengan berapa banyak unit y akan berubah secara purata jika pembolehubah berubah sebanyak satu, dengan mengandaikan pembolehubah kekal tidak berubah, dan seterusnya.purata pengaruh separa pembolehubah, dengan mengandaikan bahawa pembolehubah penjelasan lain adalah tetap. Dari sudut pandangan metodologi statistik oleh itu tiada perbezaan antara regresi berbilang dan separa. (Kami akan pergi ke lebih terperinci mengenai perkara ini dalam bahagian seterusnya.) Atas sebab ini, dalam literatur, parameter dirujuk sebagai kedua-dua pekali regresi berbilang dan separa.

Tafsiran yang bermakna bagi pekali regresi boleh membawa kepada kesimpulan yang salah bahawa sudah cukup untuk mentakrifkan beberapa regresi linear mudah pembolehubah y pada pembolehubah individu. Tetapi, seperti yang kita nyatakan sebelum ini dan seperti yang akan kita lihat dalam contoh, regresi berganda, walaupun ia meliputi tindakan serentak pembolehubah penerangan, pekali regresi mengecualikan pengaruh pembolehubah penjelasan lain,

Dalam kes regresi linear mudah, keadaannya berbeza. Dalam regresi linear mudah, pengaruh pembolehubah penjelasan lain sebahagiannya dicerminkan dalam pekali regresi, yang boleh dijelaskan oleh hubungan dua belah pembolehubah penjelasan yang selalunya. Jadi, jika anda mempunyai maklumat yang mencukupi dan bahan berangka empirikal untuk beberapa sebab-faktor untuk pembolehubah y, maka adalah lebih suai manfaat dan secara teorinya wajar untuk membina regresi berganda. Dalam bahagian 2.5, kami telah menunjukkan bahawa, disebabkan oleh penyebaran nilai pembolehubah individu, fungsi regresi tidak boleh diterbalikkan walaupun ia secara logik dibenarkan dan dibenarkan oleh pertimbangan profesional. Ketakterbalikan juga merupakan ciri regresi berganda. Jika anda berminat bukan sahaja dalam kebergantungan pembolehubah y pada tetapi juga dalam pergantungan pembolehubah pada y, maka anda harus menentukan fungsi lain (regresi x pada y dan Secara teorinya, terdapat konjugat, atau alternatif, regresi. Sudah di sini kami memberi perhatian kepada fakta bahawa pergantungan pelbagai hala antara pembolehubah y dan melanggar prasyarat penting untuk penggunaan kaedah petak terkecil. Kami akan membincangkan perkara ini dengan lebih terperinci dalam Bab 12.

Kami akan mempertimbangkan prosedur untuk membina regresi berganda menggunakan contoh regresi dengan dua pembolehubah penjelasan. Fungsi regresi berbilang linear dalam kes ini ditulis sebagai

Tugasnya adalah untuk menganggar parameter regresi berdasarkan hasil pemerhatian sampel ke atas pembolehubah yang dimasukkan dalam analisis. Untuk tujuan ini, kami sekali lagi menggunakan kaedah kuasa dua terkecil. Mari kita tetapkan syarat mengikut mana regresi harus bersetuju sebaik mungkin dengan data Empirikal. Oleh itu, atas sebab yang sama seperti dalam Bahagian 2.4, kami akan mengemukakan keperluan bahawa jumlah sisihan kuasa dua semua nilai yang diperhatikan bagi pembolehubah bersandar daripada nilai yang dikira oleh persamaan regresi (iaitu, jumlah kuasa dua. sisa) hendaklah minimum. Jadi keperluan mesti dipenuhi

Menggantikan ungkapan (2.43) sebaliknya, kita memperoleh

Sama seperti dalam bahagian 2.4, 5 ialah fungsi parameter regresi yang tidak diketahui. Syarat yang perlu pemenuhan (2.45) ialah penyongsangan bagi terbitan separa sifar bagi fungsi berkenaan dengan setiap parameter. Selepas algebra yang sepadan

pengiraan yang kita dapat sistem seterusnya persamaan biasa:

Jika kita membandingkan persamaan ini dengan persamaan normal regresi linear mudah, kita akan melihat persamaan yang besar. Mereka berbeza hanya dalam istilah yang mengambil kira pembolehubah baharu.Oleh itu, kemasukan pembolehubah baharu dalam analisis tidak mendatangkan kesukaran yang besar.

Membahagikan kedua-dua belah persamaan (2.46) dengan kita mendapat ungkapan berikut untuk regresi malar

Menggantikan (2.49) kepada (2.43), selepas beberapa transformasi mudah, kita memperoleh ungkapan yang serupa dengan (2.25):

Menyelesaikan sistem persamaan normal untuk parameter yang tidak diketahui, kami perolehi

Dengan analogi dengan formula (2.27) untuk regresi mudah, pekali regresi berbilang atau separa boleh diwakili melalui varians dan kovarians.

Mula-mula membahagi kedua-dua belah persamaan normal (2.46) dengan dan mendarabnya dengan menolaknya masing-masing dari kiri dan bahagian yang betul persamaan (2.47). Hasilnya, kita dapat

Kemudian kita darabkan kedua-dua belah persamaan normal (2.46) dengan dibahagikan sebelumnya dengan dan tolaknya masing-masing dari sisi kiri dan kanan persamaan (2.48). Hasilnya, kita dapat

Kita boleh mewakili kedua-dua kesamaan seperti berikut:

Membahagikan kedua-dua bahagian kesamaan (2.53) dan (2.54) dengan kita dapati, dengan mengambil kira takrif varians dan kovarians, ungkapan untuk pekali regresi:

Menggunakan data contoh dari bahagian 2.4, kami menambah mereka dengan hasil pemerhatian pada pembolehubah penjelasan kedua - umur purata pekerja. Pembolehubah x yang digunakan dalam contoh Bahagian 2.4 kini akan dilambangkan dengan . Dalam jadual. 7 menunjukkan nilai yang pembolehubah mengambil dan keputusan pertengahan pengiraan yang diperlukan untuk mencari anggaran pekali regresi.

Jadual 7. Purata umur pekerja, purata peratusan pematuhan kepada norma di 14 perusahaan dan keputusan pertengahan yang diperlukan untuk mencari anggaran parameter regresi (lihat imbasan)

Min berubah-ubah

Menggunakan hasil perantaraan daripada jadual. 3 dan 7, menggunakan formula (2.51) dan (2.52) kita mengira pekali regresi:

Pemalar regresi diperoleh dengan formula (2.49):

Jadi, selaras dengan rumus fungsi regresi (2.43), persamaan regresi boleh ditulis sebagai

Jika kita menganggap pergantungan produktiviti pada kedua-dua tahap mekanisasi kerja dan umur purata pekerja, maka produktiviti buruh akan berubah secara purata sebanyak , dengan syarat tahap mekanisasi kerja berubah sebanyak satu peratus, tidak termasuk pengaruh purata. umur pekerja. Jika kita mengecualikan pengaruh tahap mekanisasi kerja, maka produktiviti buruh akan berubah secara purata dengan perubahan dalam purata umur pekerja sebanyak satu tahun.

Berbanding dengan pekali regresi dalam persamaan dengan satu pembolehubah penjelasan, pekali regresi separa menurun sedikit. Ini kerana pembolehubah berkorelasi dengan apa yang akan kita lihat dengan penunjuk kuantitatif. Atas sebab ini, pembolehubah mempengaruhi pembolehubah y yang melaluinya kekuatan pergantungan y pada lemah. Kehadiran pergantungan di kalangan pembolehubah penjelasan melanggar salah satu andaian asas model linear analisis regresi, yang melibatkan masalah khas. Kami akan membincangkan isu-isu ini dengan lebih terperinci dalam Bab 9.

Menggantikan nilai pembolehubah secara berturut-turut ke dalam persamaan yang terhasil, kita dapati nilai regresi yang dikira. Menolaknya daripada nilai yang diperhatikan pembolehubah y, kita mendapat baki:

Daripada magnitud baki ini, seseorang boleh membuat kesimpulan yang serupa dengan kesimpulan yang dibuat dalam bahagian 2.4 untuk regresi linear mudah.

Membandingkan formula (2.51) dan (2.52) dengan (2.22) dan (2.23), serta prosedur pengiraan, kita melihat bahawa kemasukan pembolehubah penjelasan baharu dalam regresi merumitkan ungkapan analisis formula, dan dengan itu pengiraan. Mengitlak model regresi berganda kepada pembolehubah penjelasan memerlukan penggunaan tatatanda matriks dan pengetahuan tentang teknik algebra matriks. Di samping itu, ini adalah perlu untuk kekompakan pembentangan dan penggunaan beberapa prosedur pengiraan standard, yang sangat memudahkan dan mempercepatkan analisis nilai yang diperhatikan bagi hujah;
b- vektor - lajur dimensi [ (k+1) x 1] parameter yang tidak diketahui (pekali regresi) model yang akan dianggarkan;
e- vektor rawak - lajur dimensi (n x 1) ralat pemerhatian (sisa).

Tugas analisis regresi
Tugas utama analisis regresi adalah untuk mencari saiz sampel n anggaran pekali regresi yang tidak diketahui b 0 , b 1 ,..., b k. Tugas analisis regresi adalah menggunakan data statistik yang tersedia untuk pembolehubah X i dan Y:

  • dapatkan anggaran terbaik bagi parameter yang tidak diketahui b 0 , b 1 ,..., b k;
  • mengesahkan hipotesis statistik mengenai parameter model;
  • semak sama ada model itu bersetuju dengan cukup baik dengan data statistik (kecukupan model kepada data pemerhatian).

Membina model regresi berbilang terdiri daripada langkah-langkah berikut:

  1. pilihan bentuk sambungan (persamaan regresi);
  2. penentuan parameter persamaan yang dipilih;
  3. analisis kualiti persamaan dan pengesahan kecukupan persamaan kepada data empirikal, penambahbaikan persamaan.
  • Regresi berbilang dengan satu pembolehubah
  • Regresi berbilang dengan tiga pembolehubah

Arahan. Tentukan jumlah data (bilangan baris), bilangan pembolehubah x, klik Seterusnya.

Bilangan faktor (x) 1 2 3 4 5 6 7 8 9 10 Bilangan baris
.");">

Contoh penyelesaian untuk mencari model regresi berganda

Regresi berbilang dengan dua pembolehubah

Model regresi berbilang daripada bentuk Y \u003d b 0 + b 1 X 1 + b 2 X 2;
1) Anda boleh mencari yang tidak diketahui b 0, b 1, b 2, kami menyelesaikan sistem persamaan tiga linear dengan tiga yang tidak diketahui b 0, b 1, b 2:

Untuk menyelesaikan sistem, anda boleh menggunakan
2) Atau menggunakan formula


Untuk melakukan ini, kami membina jadual borang:

Y x 1 x2 (purata y-y) 2 (x 1 -x 1sr) 2 (x 2 -x 2sr) 2 (y-y sr)(x 1 -x 1sr) (y-y sr)(x 2 -x 2sr) (x 1 -x 1sr)(x 2 -x 2sr)

Varians sampel bagi pekali regresi berbilang empirikal boleh ditentukan seperti berikut:

Di sini z" jj ialah unsur pepenjuru ke-j bagi matriks Z -1 =(X T X) -1 .

Di mana:

di mana m ialah bilangan pembolehubah penjelasan dalam model.
Khususnya, untuk persamaan regresi berganda Y = b 0 + b 1 X 1 + b 2 X 2 dengan dua pembolehubah penjelasan, formula berikut digunakan:


Ataupun

atau
,,.
Di sini r 12 - pekali korelasi sampel antara pembolehubah penjelasan X 1 dan X 2 ; Sbj- kesalahan biasa pekali regresi; S ialah ralat piawai regresi berganda (anggaran tidak berat sebelah).
Dengan analogi dengan regresi pasangan selepas menentukan anggaran titik b j bagi pekali β j (j=1,2,…,m) persamaan teori regresi berganda boleh dikira anggaran selang pekali yang ditentukan.

Selang keyakinan meliputi dengan kebolehpercayaan (1-α ) nilai yang tidak diketahui parameter β j ditakrifkan sebagai

Regresi Berbilang dalam Excel

Untuk mencari parameter regresi berbilang menggunakan Excel, fungsi LINEST(Y;X;0;1) digunakan,
di mana Y ialah tatasusunan untuk nilai Y
di mana X ialah tatasusunan untuk nilai X (dinyatakan sebagai tatasusunan tunggal untuk semua nilai X i)

Menyemak kepentingan statistik bagi pekali persamaan regresi berganda

Seperti dalam kes regresi berganda, kepentingan statistik bagi pekali regresi berbilang dengan pembolehubah penjelasan m diuji berdasarkan statistik-t:

mempunyai dalam kes ini taburan pelajar dengan bilangan darjah kebebasan v = n-m-1. Pada tahap keertian yang diperlukan, nilai pemerhatian bagi statistik-t dibandingkan dengan taburan Pelajar tepat kritikal.
Jika , maka kepentingan statistik bagi pekali regresi berganda sepadan disahkan. Ini bermakna faktor Xj berkait secara linear dengan pembolehubah bersandar Y. Jika dipastikan bahawa pekali b j adalah tidak signifikan, maka adalah disyorkan untuk mengecualikan pembolehubah Xj daripada persamaan. Ini tidak akan membawa kepada kehilangan yang ketara dalam kualiti model, tetapi akan menjadikannya lebih spesifik.

Untuk tujuan ini, seperti dalam kes regresi berganda, pekali penentuan R 2 digunakan:

Nisbah ialah 0<=R2<=1. Чем ближе этот коэффициент к единице, тем lebih banyak persamaan regresi berganda menerangkan tingkah laku Y.
Untuk regresi berganda pekali penentuan ialah fungsi tidak menurun bagi bilangan pembolehubah penjelasan. Penambahan pembolehubah penjelasan baharu tidak pernah mengurangkan nilai R 2 , kerana setiap pembolehubah berikutnya hanya boleh menambah, tetapi tidak mengurangkan, maklumat yang menerangkan kelakuan pembolehubah bersandar.

Nisbah boleh diwakili dalam borang berikut:

untuk m>1. Sebagai nilai m


Penunjuk F dan R2 adalah sama atau tidak sama dengan sifar pada masa yang sama. Jika F=0, maka R 2 =0, oleh itu, nilai Y adalah bebas linear daripada X1,X2,…,Xm.. Nilai pengiraan F dibandingkan dengan Fcr kritikal. Fcr, berdasarkan aras keertian α yang diperlukan dan bilangan darjah kebebasan v1 = m dan v2 = n - m - 1, ditentukan berdasarkan taburan Fisher. Jika F>Fcr, maka R 2 adalah signifikan secara statistik.

Menyemak kebolehlaksanaan andaian regresi berganda OLS. Statistik Durbin-Watson untuk regresi berbilang

Kepentingan statistik bagi pekali regresi berganda dan nilai pekali penentuan R 2 hampir dengan satu tidak menjamin kualiti tinggi persamaan regresi berganda. Oleh itu, langkah seterusnya dalam menyemak kualiti persamaan regresi berganda ialah menyemak kebolehlaksanaan andaian LSM. Punca dan akibat ketidakmungkinan prasyarat ini, kaedah untuk membetulkan model regresi akan dipertimbangkan dalam bab seterusnya. Dalam bahagian ini, kami akan mempertimbangkan yang popular analisis regresi Perangkaan Durbin-Watson.
Pada Analisis statistik persamaan regresi pada peringkat awal selalunya mereka menyemak kebolehlaksanaan satu premis: syarat untuk kebebasan statistik penyimpangan antara satu sama lain.

Dalam kes ini, ketidakterkaitan kuantiti jiran diperiksa e i,i=1,2,…n..
Untuk menganalisis korelasi sisihan, statistik Durbin-Watson digunakan:

Nilai kritikal d1 dan d2 ditentukan berdasarkan jadual khas untuk tahap kepentingan yang diperlukan α , bilangan pemerhatian n dan bilangan pembolehubah penjelasan m.

Pekali Korelasi Separa dalam Regresi Berganda

Pekali korelasi separa (atau indeks) yang mengukur kesan ke atas y faktor x i dengan tahap faktor lain yang tidak berubah ditentukan oleh formula piawai pekali linear korelasi, i.e. pasangan yx 1 ,yx 2 ,... , x 1 x 2 , x 1 x 3 dan seterusnya diambil secara berurutan dan bagi setiap pasangan pekali korelasi didapati
Pengiraan dalam MS Excel. Satu matriks pekali korelasi berpasangan bagi pembolehubah boleh dikira menggunakan alat analisis data Korelasi. Untuk ini:
1) Jalankan arahan Perkhidmatan / Analisis Data / Korelasi.
2) Nyatakan julat data;

Menyemak kualiti keseluruhan persamaan regresi berganda

Untuk tujuan ini, seperti dalam kes regresi berganda, pekali penentuan digunakan R2:

Nisbah adil 0 < =R 2 < = 1 . Semakin hampir pekali ini kepada satu, semakin banyak persamaan regresi berganda menerangkan tingkah laku Y.
Untuk regresi berganda pekali penentuan ialah fungsi tidak menurun bagi bilangan pembolehubah penjelasan. Menambah pembolehubah penjelasan baharu tidak pernah mengurangkan nilai R2, kerana setiap pembolehubah berikutnya hanya boleh menambah, tetapi sama sekali tidak mengurangkan maklumat yang menerangkan tingkah laku pembolehubah bersandar.
Kadangkala, apabila mengira pekali penentuan untuk mendapatkan anggaran tidak berat sebelah dalam pengangka dan penyebut pecahan yang ditolak daripada perpaduan, pembetulan dibuat untuk bilangan darjah kebebasan, i.e. apa yang dipanggil pekali penentuan diselaraskan (dibetulkan) diperkenalkan:

Nisbah boleh diwakili seperti berikut:

untuk m>1. Sebagai nilai m pekali penentuan terlaras tumbuh lebih perlahan daripada biasa. Ia adalah jelas bahawa hanya apabila R 2 = 1. boleh mengambil nilai negatif.
Telah terbukti bahawa peningkatan dengan penambahan pembolehubah penjelasan baharu jika dan hanya jika statistik modulo-t untuk pembolehubah ini lebih besar daripada satu. Oleh itu, penambahan pembolehubah penjelasan baharu kepada model dijalankan selagi pekali penentuan terlaras bertambah.
Adalah disyorkan, selepas menyemak kualiti keseluruhan persamaan regresi, untuk menganalisis kepentingan statistiknya. Untuk ini, statistik F digunakan:
Penunjuk F dan R2 sama atau tidak sama dengan sifar pada masa yang sama. Jika F=0, kemudian R 2 \u003d 0, oleh itu, nilai Y bebas secara linear daripada X 1 ,X 2 ,…,X m.Nilai yang dikira F berbanding kritikal Fcr. Fcr, berdasarkan tahap kepentingan yang diperlukan α dan bilangan darjah kebebasan v 1 = m dan v 2 \u003d n - m - 1, ditentukan berdasarkan taburan Fisher. Jika F > Fcr, kemudian R2 statistik yang signifikan.

Tujuan: untuk mengetahui cara menentukan parameter persamaan regresi linear berganda dengan kaedah kuasa dua terkecil dan menganalisis persamaan yang dibina.

Garis panduan

Semua dalam bab ini penting. Sebelum belajar, perlu menyemak bahan berikut dari analisis matriks: pendaraban matriks, matriks songsang, penyelesaian sistem persamaan linear dengan kaedah matriks songsang. Dalam bab ini, semua yang berkaitan dengan regresi linear berpasangan digeneralisasikan kepada model linear berbilang. Bab pertama menunjukkan fungsi program Microsoft Office Excel yang membolehkan anda melakukan operasi dengan matriks. Ambil perhatian bahawa, berbanding dengan bab sebelumnya, ketiadaan multikolineariti (hubungan linear yang kuat) pembolehubah ini adalah penting untuk menentukan makna sosioekonomi bagi pekali bagi pembolehubah penjelasan. Ingat bahawa formula untuk mengira pekali persamaan juga mengikuti daripada penggunaan kaedah kuasa dua terkecil. Anda harus mengkaji contoh di bawah. Beri perhatian kepada hubungan model dalam pembolehubah asal dan dalam pembolehubah piawai.

§ 1. Menentukan parameter persamaan regresi

Bagi apa apa penunjuk ekonomi Selalunya, bukan satu, tetapi beberapa faktor mempengaruhi. Dalam kes ini, bukannya reg-

M(Y x) = f(x) dipertimbangkan regresi berganda:

x1 ,x2 ,...,xm ) = f(x1 ,x2 ,...,xm ) .

Tugas menilai hubungan statistik

pembolehubah

Y dan X = (X 1 , X 2 , ..., X m ) dirumus secara serupa

majlis berpasangan

regresi noah. Persamaan regresi berbilang boleh diwakili sebagai:

Y = f(β ,X) + ε ,

dengan Y danX = (X 1 , X 2 , ..., X m ) - vektor pembolehubah bebas (penerangan); β= (β 0, β 1, β 2,..., β m ) - vektor parameter

(akan ditentukan); ε- ralat rawak(sisihan); Y - pembolehubah bersandar (diterangkan). Diandaikan bahawa untuk ini penduduk ia adalah fungsi f yang menghubungkan pembolehubah Y yang disiasat dengan vektor pembolehubah bebas

Y dan X= (X1 , X2 , ..., Xm ) .

Pertimbangkan model regresi berbilang yang paling banyak digunakan dan paling mudah - model regresi linear berbilang.

Persamaan regresi linear teori mempunyai bentuk:

Di sini β= (β 0 , β 1 , β 2 ,..., β m ) ialah vektor dimensi (m +1) bagi parameter yang tidak diketahui. β j , j = (1, 2, ..., m ) dipanggil j - m secara teorinya

pekali regresi skim (pekali regresi separa). Ia mencirikan sensitiviti Y kepada perubahan dalam X j . Dalam erti kata lain, ia mencerminkan kesan ke atas matematik bersyarat

jangkaan logik M (Y x 1 ,x 2 ,...,x m ) pembolehubah bersandar Y menerangkan

pembolehubah X j dengan syarat bahawa semua penjelasan lain pembolehubah model kekal malar, β 0 ialah sebutan bebas,

yang menentukan nilai Y dalam kes apabila semua pembolehubah penjelasan X j adalah sama dengan sifar.

Selepas pemilihan fungsi linear sebagai model pergantungan, adalah perlu untuk menganggarkan parameter regresi.

Biarkan terdapat n cerapan bagi vektor pembolehubah penerang X = (X 1 , X 2 , ...,X m ) dan pembolehubah bersandar Y :

( xi 1 , xi 2 , ..., xim , yi ) , i= 1 ,2 , ..., n.

Untuk menyelesaikan secara unik masalah mencari parameter β 0 , β 1 , β 2 ,..., β m , ketaksamaan

n ≥ m + 1 . Jika n = m + 1, maka anggaran pekali vektor β

dikira dengan cara yang unik.

Jika bilangan cerapan lebih besar daripada minimum yang diperlukan: n > m + 1, maka terdapat keperluan untuk pengoptimuman, anggaran

parameter β 0 , β 1 , β 2 ,..., β m , yang mana formula memberikan yang terbaik

anggaran untuk pemerhatian yang ada.

Dalam kes ini, nombor ν= n − m − 1 dipanggil bilangan darjah kebebasan. Kaedah yang paling biasa untuk menganggar parameter persamaan regresi linear berganda ialah kaedah kuasa dua terkecil(MNK). Ingat bahawa intipatinya adalah untuk meminimumkan jumlah sisihan kuasa dua bagi nilai yang diperhatikan

pembolehubah bersandar Y pada nilai Y yang diperolehi oleh persamaan regresi.

Ambil perhatian bahawa prasyarat kuasa dua terkecil yang dinyatakan sebelum ini membolehkan kita menganalisis dalam rangka kerja model regresi linear klasik.

Seperti dalam kes regresi berpasangan, nilai sebenar parameter β j tidak boleh diperolehi daripada sampel. Dalam kes ini, bukannya

persamaan regresi teoritis (3.3) dianggarkan oleh apa yang dipanggil

persamaan regresi empirikal yang diberikan:

Y = b0 + b1 X1 + b2 X2 + ...+ bm Xm + e.

b 0 , b 1 , ..., b m - anggaran teori

nilai

β 0 ,β 1 , ...,β m

pekali regresi (pekali empirikal

regresi ents, e - anggaran sisihan rawak ε ). Untuk pemerhatian individu kami mempunyai:

yi = b0 + b1 xi 1 + b2 xi 2 + ...+ bm xim + ei ,(i= 1 ,2 , ..., n) (3.6)

Persamaan anggaran harus terlebih dahulu menerangkan arah aliran umum (arah) perubahan dalam pembolehubah bersandar Y . Dalam kes ini, adalah perlu untuk dapat mengira sisihan dari arah aliran yang ditentukan.

Mengikut sampel isipadu n:(xi 1 , xi 2 , ..., xim , yi ) , i= 1 ,2 , ..., n

ia diperlukan untuk menganggarkan nilai parameter β j bagi vektor β , iaitu, untuk parametrize model yang dipilih (di sini x ij , j = 1, 2, ..., m

nilai pembolehubah X j dalam pemerhatian ke-i).

Apabila prasyarat LSM dipenuhi berkenaan dengan sisihan rawak ε i , anggaran b 0 , b 1 , ..., b m parameter β 0 , β 1 , ..., β m

Regresi linear kuasa dua terkecil adalah tidak berat sebelah, cekap dan konsisten.

Berdasarkan (3.6), sisihan e i nilai y i pembolehubah bersandar daripada nilai model ˆy i , sepadan dengan persamaan regresi dan i-pemerhatian i = 1, 2, ..., n , dikira dengan formula:

ei = yi − ˆyi = yi − b0 − b1 xi 1 − b2 xi 2 − ...− bm xim . (3.7)

§ 2. Pengiraan pekali regresi linear berbilang

Kami membentangkan data pemerhatian dan pekali yang sepadan dalam bentuk matriks.

xn 1

xn 2

x1 m

x2 m

Di sini Y ialah vektor lajur n-dimensi cerapan pembolehubah bersandar Y ;X ialah matriks n × (m + 1) di mana baris ke-i i = 1, 2, ..., n mewakili i- pemerhatian ke atas vektor nilai-nilai pembolehubah bebas X 1 ,X 2 , ...,X m , satu sepadan dengan pembolehubah dengan ahli bebas b 0 ;

(m + 1) parameter persamaan regresi (3.5);

persamaan regresi:

i=1

di mana e T \u003d (e 1, e 2, ..., e n) , iaitu superskrip T bermaksud trans-

matriks yang diberikan.

Ia boleh ditunjukkan bahawa keadaan (3.10) dipenuhi jika vektor lajur bagi pekali B ditemui oleh formula:

B = (XTX) − 1XTY.

Di sini X T ialah matriks yang ditukarkan kepada matriks X ,

(X T X ) − 1 ialah matriks songsang kepada (X T X ) . Perkaitan (3.11)

sah untuk persamaan regresi dengan nombor arbitrari m pembolehubah penjelasan.

Contoh 3.1. Biarkan isipadu bekalan sesuatu barang Y firma itu secara linear bergantung pada harga X 1 dan upah X 2 pekerja yang mengeluarkan barang ini (Jadual 3.1). Mari kita tentukan pekali bagi persamaan regresi linear. (Ini mengandaikan pengetahuan tentang algebra matriks).

Jadual 3.1

Data untuk Regresi Linear Berbilang

Matriks kelihatan seperti:

X T X= 318

7, 310816

− 0, 10049

− 0, 53537

−1

0, 001593

, (XTX)

= − 0, 10049

− 0, 006644,

− 0, 53537

− 0, 006644

0, 043213

X T Y = 23818,