Biografi Ciri-ciri Analisis

Bina garis regresi. Asas Regresi Linear

Untuk wilayah wilayah, data diberikan untuk 200X.

Nombor wilayah Purata sara hidup per kapita minimum sehari untuk seorang yang mampu, gosok., x Gaji harian purata, gosok., pada
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Senaman:

1. Bina medan korelasi dan rumuskan hipotesis tentang bentuk sambungan.

2. Kirakan parameter persamaan regresi linear

4. Dengan menggunakan pekali keanjalan purata (umum), berikan penilaian perbandingan kekuatan hubungan antara faktor dan hasil.

7. Kira nilai ramalan keputusan jika nilai ramalan faktor meningkat sebanyak 10% daripada paras puratanya. Tentukan selang keyakinan ramalan untuk aras keertian .

Penyelesaian:

Kami akan membuat keputusan tugasan ini menggunakan Excel.

1. Membandingkan data x dan y yang ada, sebagai contoh, menyusunnya dalam tertib menaik bagi faktor x, seseorang boleh melihat hubungan langsung antara tanda-tanda apabila peningkatan dalam sara hidup per kapita minimum meningkatkan purata gaji harian. Berdasarkan ini, boleh diandaikan bahawa hubungan antara tanda-tanda adalah langsung dan ia boleh digambarkan dengan persamaan garis lurus. Kesimpulan yang sama disahkan berdasarkan analisis grafik.

Untuk membina medan korelasi, anda boleh menggunakan Excel PPP. Masukkan data awal dalam urutan: pertama x, kemudian y.

Pilih kawasan sel yang mengandungi data.

Kemudian pilih: Masukkan / Tabur / Tabur dengan penanda seperti yang ditunjukkan dalam rajah 1.

Rajah 1 Pembinaan medan korelasi

Analisis medan korelasi menunjukkan kehadiran hampir kepada langsung pergantungan linear, kerana titik terletak hampir dalam garis lurus.

2. Untuk mengira parameter persamaan regresi linear
gunakan fungsi statistik terbina dalam LINEST.

Untuk ini:

1) Buka fail sedia ada yang mengandungi data yang akan dianalisis;
2) Pilih kawasan sel kosong 5x2 (5 baris, 2 lajur) untuk memaparkan hasil statistik regresi.
3) Aktifkan Wizard Fungsi: dalam menu utama, pilih Formula / Fungsi Sisipan.
4) Di tingkap kategori anda mengambil Statistik, dalam tetingkap fungsi - LINEST. Klik pada butang okey seperti yang ditunjukkan dalam Rajah 2;

Rajah 2 Kotak Dialog Wizard Fungsi

5) Isikan argumen fungsi:

Nilai yang diketahui

Nilai x yang diketahui

berterusan- nilai logik yang menunjukkan kehadiran atau ketiadaan istilah bebas dalam persamaan; jika Pemalar = 1, maka pintasan dikira dengan cara biasa, jika Malar = 0, maka pintasan ialah 0;

Perangkaan- nilai boolean yang menunjukkan sama ada untuk memaparkan maklumat tambahan mengenai analisis regresi atau tidak. Jika Statistik = 1, maka Maklumat tambahan dipaparkan, jika Statistik = 0, maka hanya anggaran parameter persamaan dipaparkan.

Klik pada butang okey;

Rajah 3 Kotak Dialog Argumen LINEST

6) Elemen pertama jadual akhir akan muncul di sel kiri atas kawasan yang dipilih. Untuk mengembangkan keseluruhan jadual, tekan butang dan kemudian pada pintasan papan kekunci ++ .

Statistik regresi tambahan akan dikeluarkan dalam susunan yang ditunjukkan dalam skema berikut:

Nilai pekali b Nilai pekali a
b ralat piawai ralat piawai a
ralat piawai y
F-statistik
Jumlah regresi kuasa dua

Rajah 4 Hasil pengiraan fungsi LINEST

Kami mendapat persamaan regresi:

Kami membuat kesimpulan: Dengan peningkatan dalam sara hidup per kapita minimum sebanyak 1 gosok. purata gaji harian meningkat dengan purata 0.92 rubel.

Bermakna 52% variasi upah(y) dijelaskan oleh variasi faktor x - purata sara hidup per kapita minimum, dan 48% - oleh tindakan faktor lain yang tidak termasuk dalam model.

Mengikut pekali penentuan yang dikira, adalah mungkin untuk mengira pekali korelasi: .

Hubungan itu dinilai sebagai rapat.

4. Menggunakan pekali keanjalan (umum) purata, kita menentukan kekuatan pengaruh faktor pada hasilnya.

Untuk persamaan garis lurus, pekali keanjalan purata (umum) ditentukan oleh formula:

Kami mencari nilai purata dengan memilih kawasan sel dengan nilai x, dan pilih Formula / AutoSum / Purata, dan lakukan perkara yang sama dengan nilai y.

Rajah 5 Pengiraan nilai min bagi fungsi dan hujah

Oleh itu, jika purata minimum sara hidup per kapita berubah sebanyak 1% daripada nilai puratanya, purata gaji harian akan berubah sebanyak purata 0.51%.

Menggunakan alat analisis data Regresi tersedia:
- keputusan statistik regresi,
- keputusan analisis varians,
- keputusan selang keyakinan,
- carta padanan garisan sisa dan regresi,
- sisa dan kebarangkalian normal.

Prosedurnya adalah seperti berikut:

1) semak akses kepada Pakej analisis. Dalam menu utama, pilih mengikut urutan: Fail/Tetapan/Tambah.

2) Jatuhkan Kawalan pilih barang Tambahan Excel dan tekan butang Pergi.

3) Di tingkap alat tambah semak kotak Pakej analisis, dan kemudian klik butang okey.

Jika Pakej analisis tiada dalam senarai medan Alat tambah yang tersedia, tekan butang Semakan untuk mencari.

Jika anda menerima mesej yang menyatakan bahawa pek analisis tidak dipasang pada komputer anda, klik ya untuk memasangnya.

4) Dalam menu utama, pilih mengikut urutan: Data / Analisis Data / Alat Analisis / Regresi, dan kemudian klik butang okey.

5) Isikan kotak dialog pilihan kemasukan data dan output:

Selang input Y- julat yang mengandungi data atribut berkesan;

Selang input X- julat yang mengandungi data atribut faktor;

Tag- bendera yang menunjukkan sama ada baris pertama mengandungi nama lajur atau tidak;

Malar - sifar- bendera yang menunjukkan ada atau tidaknya istilah bebas dalam persamaan;

selang keluaran- cukup untuk menunjukkan sel kiri atas julat masa depan;

6) Lembaran kerja baharu - anda boleh menetapkan nama sewenang-wenangnya untuk helaian baharu.

Kemudian tekan butang okey.

Rajah 6 Kotak dialog untuk memasukkan parameter alat Regresi

Keputusan analisis regresi bagi data masalah ditunjukkan dalam Rajah 7.

Rajah 7 Hasil penggunaan alat regresi

5. Anggaran menggunakan ralat purata kualiti penghampiran persamaan. Mari gunakan keputusan analisis regresi yang dibentangkan dalam Rajah 8.

Rajah 8 Hasil penggunaan alat regresi "Residual Inference"

Mari kita buat jadual baru seperti yang ditunjukkan dalam Rajah 9. Dalam lajur C, hitung ralat relatif anggaran mengikut formula:

Rajah 9 Pengiraan ralat anggaran purata

Ralat anggaran purata dikira dengan formula:

Kualiti model yang dibina dinilai sebagai baik, kerana ia tidak melebihi 8 - 10%.

6. Daripada jadual dengan statistik regresi (Rajah 4), kami menulis nilai sebenar ujian F Fisher:

Kerana ia pada aras keertian 5%, maka kita boleh membuat kesimpulan bahawa persamaan regresi adalah signifikan (hubungannya terbukti).

8. Anggaran kepentingan statistik parameter regresi akan dijalankan menggunakan statistik t Pelajar dan dengan mengira selang keyakinan bagi setiap penunjuk.

Kami mengemukakan hipotesis H 0 mengenai perbezaan penunjuk yang tidak ketara secara statistik daripada sifar:

.

untuk bilangan darjah kebebasan

Rajah 7 mempunyai nilai sebenar statistik-t:

Ujian-t untuk pekali korelasi boleh dikira dalam dua cara:

saya cara:

di mana - ralat rawak pekali korelasi.

Kami mengambil data untuk pengiraan daripada jadual dalam Rajah 7.

cara II:

Nilai t-statistik sebenar adalah lebih tinggi daripada nilai jadual:

Oleh itu, hipotesis H 0 ditolak, iaitu parameter regresi dan pekali korelasi tidak berbeza secara rawak daripada sifar, tetapi adalah signifikan secara statistik.

Selang keyakinan untuk parameter a ditakrifkan sebagai

Untuk parameter a, sempadan 95%, seperti yang ditunjukkan dalam Rajah 7, ialah:

Selang keyakinan untuk pekali regresi ditakrifkan sebagai

Bagi pekali regresi b, had 95% seperti yang ditunjukkan dalam Rajah 7 ialah:

Analisis batas atas dan bawah selang keyakinan membawa kepada kesimpulan bahawa dengan kebarangkalian parameter a dan b, berada dalam sempadan yang ditentukan, tidak menerima nilai sifar, iaitu tidak signifikan secara statistik dan jauh berbeza daripada sifar.

7. Anggaran persamaan regresi yang diperolehi membolehkan kita menggunakannya untuk peramalan. Jika nilai ramalan bagi sara hidup minimum ialah:

Maka nilai ramalan minimum sara hidup ialah:

Kami mengira ralat ramalan menggunakan formula:

di mana

Kami juga mengira varians menggunakan Excel PPP. Untuk ini:

1) Aktifkan Wizard Fungsi: dalam menu utama, pilih Formula / Fungsi Sisipan.

3) Isikan julat yang mengandungi data berangka bagi ciri faktor. klik okey.

Rajah 10 Pengiraan varians

Dapatkan nilai varians

Untuk mengira serakan sisa dengan satu darjah kebebasan, kami menggunakan keputusan analisis varians seperti yang ditunjukkan dalam Rajah 7.

Selang keyakinan untuk meramalkan nilai individu y at dengan kebarangkalian 0.95 ditentukan oleh ungkapan:

Selangnya agak luas, terutamanya disebabkan oleh jumlah pemerhatian yang kecil. Secara umum, ramalan gaji bulanan purata yang dipenuhi ternyata boleh dipercayai.

Keadaan masalah diambil daripada: Bengkel ekonometrik: Proc. elaun / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko dan lain-lain; Ed. I.I. Eliseeva. - M.: Kewangan dan statistik, 2003. - 192 p.: ill.

Menggunakan kaedah grafik.
Kaedah ini digunakan untuk menggambarkan bentuk komunikasi antara petunjuk ekonomi yang dikaji. Untuk ini dalam sistem segi empat tepat koordinat membina graf, plot sepanjang paksi-y nilai individu atribut Y terhasil, dan sepanjang abscissa - nilai individu atribut faktor X.
Set titik tanda berkesan dan faktor dipanggil medan korelasi.
Berdasarkan medan korelasi, hipotesis boleh dikemukakan (untuk penduduk) bahawa hubungan antara semua kemungkinan nilai X dan Y adalah linear.

Persamaan regresi linear mempunyai bentuk y = bx + a + ε
Di sini ε ialah ralat rawak (penyimpangan, gangguan).
Sebab kewujudan ralat rawak:
1. Tidak termasuk pembolehubah penjelasan yang signifikan dalam model regresi;
2. Pengagregatan pembolehubah. Sebagai contoh, jumlah fungsi penggunaan ialah percubaan pada ekspresi umum keseluruhan keputusan perbelanjaan individu individu. Ini hanyalah anggaran nisbah individu, yang mempunyai parameter yang berbeza.
3. Penerangan yang salah tentang struktur model;
4. Spesifikasi fungsi yang salah;
5. Ralat pengukuran.
Oleh kerana sisihan ε i untuk setiap pemerhatian tertentu i adalah rawak dan nilainya dalam sampel tidak diketahui, maka:
1) mengikut pemerhatian x i dan y i, hanya anggaran parameter α dan β boleh diperolehi
2) Anggaran parameter α dan β model regresi ialah, masing-masing, kuantiti a dan b, iaitu watak rawak, kerana sepadan dengan sampel rawak;
Kemudian anggaran persamaan regresi (dibina daripada data sampel) akan kelihatan seperti y = bx + a + ε, di mana e i ialah nilai yang diperhatikan (anggaran) ralat ε i , dan dan b, masing-masing, anggaran bagi parameter α dan β model regresi yang perlu ditemui.
Untuk menganggar parameter α dan β - gunakan LSM (kaedah petak terkecil).
Sistem persamaan normal.

Untuk data kami, sistem persamaan mempunyai bentuk:

10a + 356b = 49
356a + 2135b = 9485

Ungkapkan a daripada persamaan pertama dan gantikan kepada persamaan kedua
Kami mendapat b = 68.16, a = 11.17

Persamaan Regresi:
y = 68.16 x - 11.17

1. Parameter persamaan regresi.
Sampel bermakna.



Variasi sampel.


Sederhana sisihan piawai

1.1. Pekali korelasi
Kami mengira penunjuk kedekatan komunikasi. Penunjuk ini adalah sampel pekali linear korelasi, yang dikira dengan formula:

Pekali korelasi linear mengambil nilai dari -1 hingga +1.
Hubungan antara ciri boleh menjadi lemah atau kuat (dekat). Kriteria mereka dijaringkan pada Skala Chaddock:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Dalam contoh kami, hubungan antara ciri Y faktor X adalah sangat tinggi dan langsung.

1.2. Persamaan Regresi(penilaian persamaan regresi).

Persamaan regresi linear ialah y = 68.16 x -11.17
Pekali persamaan regresi linear boleh diberikan pengertian ekonomi. Pekali Persamaan Regresi menunjukkan berapa unit keputusan akan berubah apabila faktor berubah sebanyak 1 unit.
Pekali b = 68.16 menunjukkan purata perubahan dalam penunjuk berkesan (dalam unit y) dengan peningkatan atau penurunan nilai faktor x per unit ukurannya. AT contoh ini dengan peningkatan 1 unit, y meningkat dengan purata 68.16.
Pekali a = -11.17 secara rasmi menunjukkan tahap ramalan y, tetapi hanya jika x=0 adalah hampir dengan nilai sampel.
Tetapi jika x=0 jauh daripada nilai sampel x, maka tafsiran literal boleh membawa kepada keputusan yang salah, dan walaupun garis regresi menerangkan dengan tepat nilai sampel yang diperhatikan, tidak ada jaminan bahawa ini juga akan menjadi kes apabila mengekstrapolasi ke kiri atau ke kanan.
Dengan menggantikan nilai x yang sepadan ke dalam persamaan regresi, adalah mungkin untuk menentukan nilai sejajar (diramalkan) penunjuk berkesan y(x) untuk setiap pemerhatian.
Hubungan antara y dan x menentukan tanda pekali regresi b (jika > 0 - hubungan langsung, sebaliknya - songsang). Dalam contoh kami, sambungan adalah langsung.

1.3. pekali keanjalan.
Adalah tidak diingini untuk menggunakan pekali regresi (dalam contoh b) untuk penilaian langsung pengaruh faktor pada atribut berkesan sekiranya terdapat perbezaan dalam unit pengukuran penunjuk berkesan y dan atribut faktor x.
Untuk tujuan ini, pekali keanjalan dan pekali beta dikira. Pekali keanjalan didapati dengan formula:


Ia menunjukkan berapa peratus sifat berkesan y berubah secara purata apabila atribut faktor x berubah sebanyak 1%. Ia tidak mengambil kira tahap turun naik faktor.
Dalam contoh kami, pekali keanjalan lebih besar daripada 1. Oleh itu, jika X berubah sebanyak 1%, Y akan berubah lebih daripada 1%. Dalam erti kata lain, X memberi kesan ketara kepada Y.
Pekali beta menunjukkan dengan bahagian mana nilai sisihan piawainya nilai atribut berkesan akan berubah secara purata apabila atribut faktor berubah mengikut nilai sisihan piawainya dengan nilai pembolehubah bebas yang tinggal ditetapkan pada tahap malar:

Itu. peningkatan dalam x dengan nilai sisihan piawai penunjuk ini akan membawa kepada peningkatan dalam purata Y sebanyak 0.9796 sisihan piawai penunjuk ini.

1.4. Ralat anggaran.
Marilah kita menilai kualiti persamaan regresi menggunakan ralat penghampiran mutlak.


Oleh kerana ralat lebih besar daripada 15%, maka persamaan yang diberikan tidak wajar digunakan sebagai regresi.

1.6. Pekali penentuan.
Kuasa dua pekali korelasi (berbilang) dipanggil pekali penentuan, yang menunjukkan perkadaran variasi atribut terhasil yang dijelaskan oleh variasi atribut faktor.
Selalunya, memberikan tafsiran pekali penentuan, ia dinyatakan sebagai peratusan.
R2 = 0.982 = 0.9596
mereka. dalam 95.96% kes, perubahan dalam x membawa kepada perubahan dalam y. Dengan kata lain, ketepatan pemilihan persamaan regresi adalah tinggi. Baki 4.04% perubahan dalam Y adalah disebabkan oleh faktor yang tidak diambil kira dalam model.

x y x2 y2 x y y(x) (y i -y cp) 2 (y-y(x)) 2 (x i -x cp) 2 |y - y x |:y
0.371 15.6 0.1376 243.36 5.79 14.11 780.89 2.21 0.1864 0.0953
0.399 19.9 0.1592 396.01 7.94 16.02 559.06 15.04 0.163 0.1949
0.502 22.7 0.252 515.29 11.4 23.04 434.49 0.1176 0.0905 0.0151
0.572 34.2 0.3272 1169.64 19.56 27.81 87.32 40.78 0.0533 0.1867
0.607 44.5 .3684 1980.25 27.01 30.2 0.9131 204.49 0.0383 0.3214
0.655 26.8 0.429 718.24 17.55 33.47 280.38 44.51 0.0218 0.2489
0.763 35.7 0.5822 1274.49 27.24 40.83 61.54 26.35 0.0016 0.1438
0.873 30.6 0.7621 936.36 26.71 48.33 167.56 314.39 0.0049 0.5794
2.48 161.9 6.17 26211.61 402 158.07 14008.04 14.66 2.82 0.0236
7.23 391.9 9.18 33445.25 545.2 391.9 16380.18 662.54 3.38 1.81

2. Anggaran parameter persamaan regresi.
2.1. Kepentingan pekali korelasi.

Mengikut jadual Pelajar dengan aras keertian α=0.05 dan darjah kebebasan k=7 kita dapati t crit:
t krit = (7;0.05) = 1.895
di mana m = 1 ialah bilangan pembolehubah penjelasan.
Jika t obs > t kritikal, maka nilai pekali korelasi yang diperolehi diiktiraf sebagai signifikan ( hipotesis nol menyatakan bahawa pekali korelasi ialah sifar ditolak).
Oleh kerana t obl > t kritik, kami menolak hipotesis bahawa pekali korelasi adalah sama dengan 0. Dalam erti kata lain, pekali korelasi adalah signifikan secara statistik
Dalam regresi linear berpasangan, t 2 r = t 2 b dan kemudian menguji hipotesis tentang kepentingan regresi dan pekali korelasi adalah bersamaan dengan menguji hipotesis tentang keertian. persamaan linear regresi.

2.3. Analisis ketepatan menentukan anggaran pekali regresi.
Anggaran tidak berat sebelah bagi varians gangguan ialah nilai:


S 2 y = 94.6484 - varians yang tidak dapat dijelaskan (ukuran serakan pembolehubah bersandar di sekeliling garis regresi).
S y = 9.7287 - kesalahan biasa anggaran (ralat piawai regresi).
Sa- sisihan piawai pembolehubah rawak a.


S b - sisihan piawai pembolehubah rawak b.

2.4. Selang keyakinan untuk pembolehubah bersandar.
Ramalan ekonomi berdasarkan model yang dibina mengandaikan bahawa hubungan sedia ada pembolehubah dikekalkan untuk tempoh pendahuluan juga.
Untuk meramalkan pembolehubah bersandar bagi atribut yang terhasil, adalah perlu untuk mengetahui nilai ramalan semua faktor yang termasuk dalam model.
Nilai ramalan faktor digantikan ke dalam model dan anggaran ramalan titik penunjuk yang dikaji diperolehi. (a + bx p ± ε)
di mana

Mari kita hitung sempadan selang di mana 95% daripada kemungkinan nilai Y akan tertumpu dengan bilangan pemerhatian yang tidak terhad dan X p = 1 (-11.17 + 68.16*1 ± 6.4554)
(50.53;63.44)

individu selang keyakinan untukYpada nilai tertentuX.
(a + bx i ± ε)
di mana

x i y = -11.17 + 68.16x i ε i ymin ymax
0.371 14.11 19.91 -5.8 34.02
0.399 16.02 19.85 -3.83 35.87
0.502 23.04 19.67 3.38 42.71
0.572 27.81 19.57 8.24 47.38
0.607 30.2 19.53 10.67 49.73
0.655 33.47 19.49 13.98 52.96
0.763 40.83 19.44 21.4 60.27
0.873 48.33 19.45 28.88 67.78
2.48 158.07 25.72 132.36 183.79

Dengan kebarangkalian 95%, ia boleh dijamin bahawa nilai Y dengan bilangan cerapan yang tidak terhad tidak akan melebihi had selang yang ditemui.

2.5. Menguji hipotesis mengenai pekali persamaan regresi linear.
1) statistik-t. Kriteria pelajar.
Mari kita uji hipotesis H 0 tentang kesamaan pekali regresi individu kepada sifar (dengan alternatif H 1 tidak sama) pada aras keertian α=0.05.
t krit = (7;0.05) = 1.895


Sejak 12.8866 > 1.895, kepentingan statistik bagi pekali regresi b disahkan (kami menolak hipotesis bahawa pekali ini sama dengan sifar).


Sejak 2.0914 > 1.895, kepentingan statistik bagi pekali regresi a disahkan (kami menolak hipotesis bahawa pekali ini bersamaan dengan sifar).

Selang keyakinan untuk pekali persamaan regresi.
Mari kita tentukan selang keyakinan bagi pekali regresi, yang, dengan kebolehpercayaan 95%, adalah seperti berikut:
(b - t crit S b; b + t crit S b)
(68.1618 - 1.895 5.2894; 68.1618 + 1.895 5.2894)
(58.1385;78.1852)
Dengan kebarangkalian 95%, boleh dikatakan bahawa nilai parameter ini akan terletak pada selang yang dijumpai.
(a - t a)
(-11.1744 - 1.895 5.3429; -11.1744 + 1.895 5.3429)
(-21.2992;-1.0496)
Dengan kebarangkalian 95%, boleh dikatakan bahawa nilai parameter ini akan terletak pada selang yang dijumpai.

2) F-statistik. Kriteria Fisher.
Kepentingan model regresi disemak menggunakan ujian Fisher F, yang nilai pengiraannya didapati sebagai nisbah varians siri awal pemerhatian penunjuk yang dikaji dan anggaran tidak berat sebelah varians bagi jujukan baki bagi model ini.
Jika nilai yang dikira dengan lang=EN-US>n-m-1) darjah kebebasan adalah lebih besar daripada nilai yang dijadualkan pada tahap keertian tertentu, maka model itu dianggap signifikan.

di mana m ialah bilangan faktor dalam model.
Penilaian kepentingan statistik regresi linear berpasangan dijalankan mengikut algoritma berikut:
1. Hipotesis nol dikemukakan bahawa persamaan secara keseluruhan adalah tidak signifikan secara statistik: H 0: R 2 =0 pada aras keertian α.
2. Seterusnya, tentukan nilai sebenar bagi kriteria-F:


di mana m=1 untuk regresi berpasangan.
3. Nilai jadual ditentukan daripada jadual taburan Fisher untuk tahap kepentingan tertentu, dengan mengambil kira bilangan darjah kebebasan untuk jumlah keseluruhan kuasa dua (varian yang lebih tinggi) ialah 1 dan bilangan darjah kebebasan jumlah baki kuasa dua (varian yang lebih kecil) dalam regresi linear ialah n-2.
4. Jika nilai sebenar kriteria F adalah kurang daripada nilai jadual, maka mereka mengatakan bahawa tidak ada sebab untuk menolak hipotesis nol.
Jika tidak, hipotesis nol ditolak dan hipotesis alternatif tentang kepentingan statistik persamaan secara keseluruhan diterima dengan kebarangkalian (1-α).
Nilai jadual bagi kriteria dengan darjah kebebasan k1=1 dan k2=7, Fkp = 5.59
Oleh kerana nilai sebenar F > Fkp, pekali penentuan adalah signifikan secara statistik (Anggaran persamaan regresi yang ditemui adalah boleh dipercayai secara statistik).

Semak Autokorelasi Sisa.
Prasyarat penting untuk membina model regresi berkualiti tinggi untuk kuasa dua terkecil ialah kebebasan nilai sisihan rawak daripada nilai sisihan dalam semua pemerhatian lain. Ini memastikan bahawa tiada korelasi antara sebarang sisihan dan, khususnya, antara sisihan bersebelahan.
Autokorelasi (korelasi bersiri) ditakrifkan sebagai perkaitan antara ukuran yang diperhatikan yang disusun mengikut masa (siri masa) atau ruang (siri silang). Autokorelasi baki (outlier) biasanya ditemui dalam analisis regresi apabila menggunakan data siri masa dan sangat jarang apabila menggunakan data keratan rentas.
Dalam tugas ekonomi, ia lebih biasa autokorelasi positif daripada autokorelasi negatif. Dalam kebanyakan kes, autokorelasi positif disebabkan oleh pengaruh berterusan berarah beberapa faktor yang tidak diambil kira dalam model.
Autokorelasi negatif sebenarnya bermakna sisihan positif diikuti dengan sisihan negatif dan begitu juga sebaliknya. Keadaan sedemikian boleh berlaku jika hubungan yang sama antara permintaan untuk minuman ringan dan pendapatan dipertimbangkan mengikut data bermusim (musim sejuk-musim panas).
Antara punca utama yang menyebabkan autokorelasi, yang berikut boleh dibezakan:
1. Ralat spesifikasi. Kegagalan untuk mengambil kira sebarang pembolehubah penjelasan penting dalam model atau pilihan bentuk pergantungan yang salah biasanya membawa kepada sisihan sistemik titik cerapan dari garis regresi, yang boleh membawa kepada autokorelasi.
2. Inersia. banyak penunjuk ekonomi(inflasi, pengangguran, KNK, dll.) mempunyai kitaran tertentu yang dikaitkan dengan gelombang aktiviti perniagaan. Oleh itu, perubahan dalam penunjuk tidak berlaku serta-merta, tetapi mempunyai inersia tertentu.
3. Kesan web. Di banyak kawasan perindustrian dan lain-lain, penunjuk ekonomi bertindak balas terhadap perubahan keadaan ekonomi dengan kelewatan (selang masa).
4. Pelicinan data. Selalunya, data untuk tempoh masa yang panjang tertentu diperoleh dengan purata data pada selang konstituennya. Ini boleh membawa kepada pelicinan turun naik tertentu yang wujud dalam tempoh yang dipertimbangkan, yang seterusnya boleh menyebabkan autokorelasi.
Akibat autokorelasi adalah serupa dengan heteroskedastisitas: kesimpulan pada statistik t- dan F yang menentukan kepentingan pekali regresi dan pekali penentuan mungkin tidak betul.

Pengesanan autokorelasi

1. Kaedah grafik
Terdapat beberapa pilihan definisi grafik autokorelasi. Salah satunya mengaitkan penyimpangan e i dengan saat-saat penerimaan mereka i. Pada masa yang sama, abscissa menunjukkan sama ada masa mendapatkan data statistik, atau nombor siri cerapan, dan sepanjang paksi-y - sisihan e i (atau anggaran sisihan).
Adalah wajar untuk menganggap bahawa jika terdapat hubungan tertentu antara sisihan, maka autokorelasi berlaku. Ketiadaan pergantungan kemungkinan besar akan menunjukkan ketiadaan autokorelasi.
Autokorelasi menjadi lebih jelas jika anda plot e i versus e i-1 .

Ujian Durbin-Watson.
Kriteria ini adalah yang paling terkenal untuk mengesan autokorelasi.
Pada Analisis statistik persamaan regresi pada peringkat awal selalunya mereka menyemak kebolehlaksanaan satu premis: syarat untuk kebebasan statistik penyimpangan antara satu sama lain. Dalam kes ini, ketidakterkaitan nilai jiran e i diperiksa.

y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
15.6 14.11 1.49 2.21 0
19.9 16.02 3.88 15.04 5.72
22.7 23.04 -0.3429 0.1176 17.81
34.2 27.81 6.39 40.78 45.28
44.5 30.2 14.3 204.49 62.64
26.8 33.47 -6.67 44.51 439.82
35.7 40.83 -5.13 26.35 2.37
30.6 48.33 -17.73 314.39 158.7
161.9 158.07 3.83 14.66 464.81
662.54 1197.14

Untuk menganalisis korelasi sisihan, statistik Durbin-Watson digunakan:

Nilai kritikal d 1 dan d 2 ditentukan berdasarkan jadual khas untuk aras keertian α yang diperlukan, bilangan cerapan n = 9 dan bilangan pembolehubah penjelasan m=1.
Tiada autokorelasi jika keadaan berikut adalah benar:
d1< DW и d 2 < DW < 4 - d 2 .
Tanpa merujuk kepada jadual, kita boleh menggunakan peraturan anggaran dan menganggap bahawa tiada autokorelasi baki jika 1.5< DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.

Analisis regresi adalah salah satu kaedah yang paling popular penyelidikan statistik. Ia boleh digunakan untuk menentukan tahap pengaruh pembolehubah bebas kepada pembolehubah bersandar. Dalam kefungsian Microsoft Excel Terdapat alat yang tersedia untuk jenis analisis ini. Mari kita lihat apa itu dan cara menggunakannya.

Tetapi, untuk menggunakan fungsi yang membolehkan anda menjalankan analisis regresi, pertama sekali, anda perlu mengaktifkan Pakej Analisis. Hanya kemudian alat yang diperlukan untuk prosedur ini akan muncul pada reben Excel.


Sekarang apabila kita pergi ke tab "Data", pada reben dalam kotak alat "Analisis" kita akan melihat butang baharu - "Analisis data".

Jenis analisis regresi

Terdapat beberapa jenis regresi:

  • parabola;
  • kuasa;
  • logaritma;
  • eksponen;
  • demonstrasi;
  • hiperbola;
  • regresi linear.

Mengenai pemenuhan jenis terakhir analisis regresi dalam Excel, kita akan bercakap dengan lebih terperinci kemudian.

Regresi Linear dalam Excel

Di bawah, sebagai contoh, ialah jadual yang menunjukkan purata suhu udara harian di jalan dan bilangan pelanggan kedai untuk hari bekerja yang sepadan. Mari kita ketahui dengan bantuan analisis regresi dengan tepat bagaimana cuaca dalam bentuk suhu udara boleh menjejaskan kehadiran sesebuah pertubuhan perdagangan.

Persamaan regresi linear am kelihatan seperti ini: Y = a0 + a1x1 + ... + axk. Dalam formula ini Y bermaksud pembolehubah yang pengaruhnya kita cuba kaji. Dalam kes kami, ini ialah bilangan pembeli. Maknanya x- ini adalah pelbagai faktor yang mempengaruhi pembolehubah. Pilihan a ialah pekali regresi. Iaitu, mereka menentukan kepentingan faktor tertentu. Indeks k bermaksud jumlah faktor yang sama ini.


Analisis keputusan analisis

Hasil analisis regresi dipaparkan dalam bentuk jadual di tempat yang ditentukan dalam tetapan.

Salah satu petunjuk utama ialah R-segi empat. Ia menunjukkan kualiti model. Dalam kes kita diberi pekali ialah 0.705 atau kira-kira 70.5%. Ini adalah tahap kualiti yang boleh diterima. Hubungan kurang daripada 0.5 adalah buruk.

Satu lagi penunjuk penting terletak di dalam sel di persimpangan baris "persimpangan-Y" dan lajur "Pekali". Di sini ditunjukkan nilai Y yang akan ada, dan dalam kes kami, ini ialah bilangan pembeli, dengan semua faktor lain bersamaan dengan sifar. Dalam jadual ini nilai yang diberi bersamaan dengan 58.04.

Nilai pada persilangan graf "Pembolehubah X1" dan "Pekali" menunjukkan tahap pergantungan Y pada X. Dalam kes kami, ini ialah tahap pergantungan bilangan pelanggan kedai pada suhu. Pekali 1.31 dianggap sebagai penunjuk pengaruh yang agak tinggi.

Seperti yang kita dapat lihat, dengan program Microsoft Excel agak mudah untuk membuat jadual analisis regresi. Tetapi, hanya orang yang terlatih boleh bekerja dengan data yang diperoleh pada output, dan memahami intipatinya.

Konsep regresi. Hubungan antara pembolehubah x dan y boleh digambarkan dengan cara yang berbeza. Khususnya, sebarang bentuk sambungan boleh dinyatakan dengan persamaan am , di mana y dianggap sebagai pembolehubah bersandar, atau fungsi daripada yang lain - pembolehubah bebas x, dipanggil hujah. Korespondensi antara hujah dan fungsi boleh diberikan oleh jadual, formula, graf, dan sebagainya. Menukar fungsi bergantung pada perubahan dalam satu atau lebih argumen dipanggil regresi. Semua cara yang digunakan untuk menerangkan korelasi adalah kandungan analisis regresi.

Persamaan korelasi, atau persamaan regresi, siri regresi yang dikira secara empirik dan secara teori, grafnya, dipanggil garis regresi, serta pekali regresi linear dan bukan linear, berfungsi untuk menyatakan regresi.

Penunjuk regresi menyatakan korelasi dua hala, dengan mengambil kira perubahan dalam nilai purata atribut Y apabila menukar nilai x i tanda X, dan sebaliknya, tunjukkan perubahan dalam nilai min ciri tersebut X dengan nilai yang diubah y i tanda Y. Pengecualian ialah siri masa, atau siri dinamik, yang menunjukkan perubahan dalam tanda dari semasa ke semasa. Regresi siri sedemikian adalah berat sebelah.

Terdapat pelbagai bentuk dan jenis korelasi. Tugas dikurangkan kepada mengenal pasti bentuk sambungan dalam setiap kes tertentu dan menyatakannya dengan persamaan korelasi yang sepadan, yang membolehkan kita meramalkan kemungkinan perubahan dalam satu tanda Y berdasarkan perubahan yang diketahui X, dikaitkan dengan korelasi pertama.

12.1 Regresi linear

Persamaan regresi. Hasil pemerhatian yang dijalankan ke atas objek biologi tertentu mengikut ciri-ciri berkorelasi x dan y, boleh diwakili oleh titik pada satah dengan membina sistem koordinat segi empat tepat. Akibatnya, gambar rajah serakan tertentu diperolehi, yang memungkinkan untuk menilai bentuk dan ketat hubungan antara ciri yang berbeza-beza. Selalunya hubungan ini kelihatan seperti garis lurus atau boleh dianggarkan dengan garis lurus.

Hubungan linear antara pembolehubah x dan y diterangkan oleh persamaan am , di mana a, b, c, d,… ialah parameter persamaan yang menentukan hubungan antara hujah x 1 , x 2 , x 3 , …, x m dan fungsi.

Dalam amalan, tidak semua hujah yang mungkin diambil kira, tetapi hanya beberapa hujah, dalam kes paling mudah, hanya satu:

Dalam persamaan regresi linear (1) a ialah istilah bebas, dan parameter b menentukan kecerunan garis regresi berkenaan dengan paksi koordinat segi empat tepat. Dalam geometri analitik, parameter ini dipanggil faktor cerun, dan dalam biometrik - pekali regresi. Perwakilan visual parameter ini dan kedudukan garis regresi Y pada X dan X pada Y dalam sistem koordinat segi empat tepat memberikan Rajah.1.

nasi. 1 Y oleh X dan X oleh Y garis regresi dalam sistem

koordinat segi empat tepat

Garis regresi, seperti yang ditunjukkan dalam Rajah 1, bersilang pada titik O (,), sepadan dengan nilai min aritmetik tanda yang berkorelasi antara satu sama lain Y dan X. Apabila memplot graf regresi, nilai pembolehubah bebas X diplot di sepanjang absis, dan nilai pembolehubah bersandar, atau fungsi Y, diplot di sepanjang ordinat. Garis AB yang melalui titik O (, ) sepadan dengan hubungan lengkap (fungsional) antara pembolehubah Y dan X apabila pekali korelasi . Semakin kuat hubungan antara Y dan X, semakin hampir garis regresi dengan AB, dan sebaliknya, sambungan yang lebih lemah antara nilai ini, semakin jauh adalah garis regresi dari AB. Sekiranya tiada sambungan antara ciri, garis regresi berada pada sudut tepat antara satu sama lain dan .

Oleh kerana penunjuk regresi menyatakan korelasi dua hala, persamaan regresi (1) hendaklah ditulis seperti berikut:

Menurut formula pertama, nilai purata ditentukan apabila tanda berubah X setiap unit ukuran, pada nilai purata kedua apabila ciri diubah setiap unit ukuran Y.

Pekali regresi. Pekali regresi menunjukkan bagaimana, secara purata, nilai satu ciri y berubah apabila unit ukuran lain, dikaitkan dengan Y tanda X. Penunjuk ini ditentukan oleh formula

Di sini nilai s darab dengan saiz selang kelas λ jika ia ditemui oleh siri variasi atau jadual korelasi.

Pekali regresi boleh dikira memintas pengiraan purata sisihan piawai s y dan s x mengikut formula

Jika pekali korelasi tidak diketahui, pekali regresi ditentukan seperti berikut:

Hubungan antara regresi dan pekali korelasi. Membandingkan formula (11.1) (topik 11) dan (12.5), kita melihat bahawa pengangkanya mengandungi nilai yang sama , yang menunjukkan hubungan antara penunjuk ini. Hubungan ini dinyatakan oleh persamaan

Oleh itu, pekali korelasi adalah sama dengan min geometri bagi pekali b yx dan b xy. Formula (6) membenarkan, pertama, daripada nilai yang diketahui bagi pekali regresi b yx dan b xy tentukan pekali regresi R xy, dan kedua, untuk menyemak ketepatan pengiraan penunjuk korelasi ini R xy antara sifat yang berbeza-beza X dan Y.

Seperti pekali korelasi, pekali regresi hanya mencirikan hubungan linear dan disertakan dengan tanda tambah untuk hubungan positif dan tanda tolak untuk hubungan negatif.

Penentuan parameter regresi linear. Adalah diketahui bahawa jumlah sisihan kuasa dua bagi varian x i daripada purata terdapat nilai terkecil, iaitu teorem ini menjadi asas kepada kaedah kuasa dua terkecil. Berkenaan dengan regresi linear [lihat formula (1)], keperluan teorem ini dipenuhi oleh sistem persamaan tertentu yang dipanggil biasa:

Penyelesaian bersama persamaan ini berkenaan dengan parameter a dan b membawa kepada keputusan berikut:

;

;

, dari mana i.

Memandangkan sifat dua hala hubungan antara pembolehubah Y dan X, formula untuk menentukan parameter a harus dinyatakan seperti ini:

dan . (7)

Parameter b, atau pekali regresi, ditentukan oleh formula berikut:

Pembinaan siri regresi empirikal. Di hadapan sebilangan besar analisis regresi pemerhatian bermula dengan pembinaan siri regresi empirikal. Siri regresi empirikal dibentuk dengan mengira nilai satu atribut pembolehubah X nilai purata yang lain, berkorelasi dengan X tanda Y. Dalam erti kata lain, pembinaan siri regresi empirikal datang ke mencari kumpulan bermakna u daripada nilai sepadan tanda Y dan X.

Siri regresi empirikal ialah siri berganda nombor yang boleh diwakili oleh titik pada satah, dan kemudian, dengan menghubungkan titik-titik ini dengan segmen garis lurus, garis regresi empirikal boleh diperolehi. Siri regresi empirikal, terutamanya plot mereka, dipanggil garis regresi, beri perwakilan visual tentang bentuk dan ketat pergantungan korelasi antara ciri yang berbeza-beza.

Penyamaan siri regresi empirikal. Graf siri regresi empirikal ternyata, sebagai peraturan, tidak berjalan lancar, tetapi garis putus-putus. Ini dijelaskan oleh fakta bahawa, bersama-sama dengan sebab-sebab utama yang menentukan corak umum dalam kebolehubahan sifat berkorelasi, nilainya dipengaruhi oleh pengaruh pelbagai punca sekunder yang menyebabkan turun naik rawak pada titik nod regresi. Untuk mengenal pasti arah aliran utama (trend) variasi konjugat ciri berkorelasi, anda perlu menggantikan garis putus dengan garis regresi yang lancar dan lancar. Proses menggantikan garis putus dengan yang licin dipanggil penjajaran siri empirikal dan garis regresi.

Kaedah penjajaran grafik. Ini adalah kaedah paling mudah yang tidak memerlukan kerja pengiraan. Intipatinya adalah seperti berikut. Siri regresi empirikal diplot sebagai graf dalam sistem koordinat segi empat tepat. Kemudian, titik tengah regresi digariskan secara visual, di mana garis pepejal dilukis menggunakan pembaris atau corak. Kelemahan kaedah ini adalah jelas: ia tidak mengecualikan pengaruh ciri individu penyelidik terhadap hasil penjajaran garis regresi empirikal. Oleh itu, dalam kes di mana lebih ketepatan yang tinggi apabila menggantikan garis regresi yang rosak dengan yang licin, kaedah lain untuk menyelaraskan siri empirikal digunakan.

Kaedah purata bergerak. Intipati kaedah ini dikurangkan kepada pengiraan urutan min aritmetik bagi dua atau tiga ahli jiran siri empirikal. Kaedah ini amat sesuai dalam kes di mana siri empirikal diwakili oleh sejumlah besar istilah, supaya kehilangan dua daripadanya - yang melampau, yang tidak dapat dielakkan dengan kaedah penyamaan ini, tidak akan menjejaskan strukturnya dengan ketara.

Kaedah kuasa dua terkecil. Kaedah ini dicadangkan pada awal abad ke-19 oleh A.M. Legendre dan, secara bebas daripadanya, K. Gauss. Ia membolehkan anda menjajarkan siri empirikal dengan paling tepat. Kaedah ini, seperti yang ditunjukkan di atas, adalah berdasarkan andaian bahawa jumlah sisihan kuasa dua varian x i dari purata mereka terdapat nilai minimum, iaitu Oleh itu nama kaedah, yang digunakan bukan sahaja dalam ekologi, tetapi juga dalam teknologi. Kaedah kuasa dua terkecil adalah objektif dan universal, ia digunakan dalam pelbagai kes apabila mencari persamaan empirikal siri regresi dan menentukan parameternya.

Keperluan kaedah kuasa dua terkecil ialah titik teori garis regresi perlu diperolehi supaya jumlah sisihan kuasa dua daripada titik ini untuk pemerhatian empirikal y i adalah minimum, iaitu

Mengira minimum ungkapan ini mengikut prinsip analisis matematik dan mengubahnya dengan cara tertentu, seseorang boleh mendapatkan sistem yang dipanggil persamaan biasa, di mana nilai yang tidak diketahui adalah parameter yang dikehendaki bagi persamaan regresi, dan pekali yang diketahui ditentukan oleh nilai empirikal ciri, biasanya jumlah nilainya dan hasil silangnya.

Regresi linear berganda. Hubungan antara beberapa pembolehubah biasanya dinyatakan oleh persamaan regresi berganda, yang boleh linear dan bukan linear. Dalam bentuk yang paling mudah, regresi berganda dinyatakan oleh persamaan dengan dua pembolehubah bebas ( x, z):

di mana a ialah sebutan bebas bagi persamaan; b dan c ialah parameter persamaan. Untuk mencari parameter persamaan (10) (dengan kaedah kuasa dua terkecil), sistem persamaan normal berikut digunakan:

Barisan dinamik. Penjajaran baris. Perubahan dalam tanda-tanda dari masa ke masa membentuk apa yang dipanggil siri masa atau deretan dinamik. Ciri ciri siri sedemikian ialah faktor masa sentiasa bertindak di sini sebagai pembolehubah bebas X, dan tanda yang berubah ialah pembolehubah bersandar Y. Bergantung pada siri regresi, hubungan antara pembolehubah X dan Y adalah sebelah pihak, kerana faktor masa tidak bergantung pada kebolehubahan ciri. Walaupun ciri-ciri ini, siri masa boleh disamakan dengan siri regresi dan diproses dengan kaedah yang sama.

Seperti siri regresi, siri masa empirikal dipengaruhi bukan sahaja oleh utama, tetapi juga oleh banyak faktor sekunder (rawak) yang mengaburkan trend utama dalam kebolehubahan ciri, yang dalam bahasa statistik dipanggil trend.

Analisis siri masa bermula dengan mengenal pasti bentuk arah aliran. Untuk melakukan ini, siri masa diwakili sebagai graf garisan dalam sistem koordinat segi empat tepat. Pada masa yang sama, titik masa (tahun, bulan, dan unit masa lain) diplot di sepanjang paksi absis, dan nilai pembolehubah bersandar Y diplot di sepanjang paksi ordinat. ialah persamaan regresi dalam bentuk sisihan sebutan bagi siri pembolehubah bersandar Y daripada min aritmetik bagi siri pembolehubah bebas X:

Di sini, ialah parameter regresi linear.

Ciri berangka siri dinamik. Ciri-ciri generalisasi berangka siri dinamik termasuk min geometri dan min aritmetik yang hampir dengannya. Mereka mencirikan kadar purata di mana nilai pembolehubah bersandar berubah dalam tempoh masa tertentu:

Anggaran kebolehubahan sebutan bagi siri dinamik ialah sisihan piawai. Apabila memilih persamaan regresi untuk menerangkan siri masa, bentuk arah aliran diambil kira, yang boleh menjadi linear (atau dikurangkan kepada linear) dan bukan linear. Ketepatan pilihan persamaan regresi biasanya dinilai oleh kesamaan nilai pembolehubah bersandar yang diperhatikan dan dikira secara empirik. Lebih tepat dalam menyelesaikan masalah ini ialah kaedah analisis regresi varians (topik 12 p.4).

Korelasi siri dinamik. Selalunya perlu untuk membandingkan dinamik siri masa selari yang berkaitan antara satu sama lain oleh beberapa keadaan umum, sebagai contoh, untuk mengetahui hubungan antara pengeluaran pertanian dan pertumbuhan ternakan dalam tempoh masa tertentu. Dalam kes sedemikian, hubungan antara pembolehubah X dan Y dicirikan oleh pekali korelasi R xy (dengan kehadiran arah aliran linear).

Adalah diketahui bahawa arah aliran siri dinamik, sebagai peraturan, dikaburkan oleh turun naik dalam terma siri pembolehubah bersandar Y. Oleh itu, masalah dua kali ganda timbul: mengukur pergantungan antara siri yang dibandingkan, tanpa mengecualikan arah aliran, dan mengukur pergantungan antara ahli bersebelahan siri yang sama, tidak termasuk arah aliran. Dalam kes pertama, penunjuk keakraban sambungan antara siri dinamik yang dibandingkan ialah pekali korelasi(jika perhubungan adalah linear), dalam kedua - pekali autokorelasi. Penunjuk ini mempunyai nilai yang berbeza, walaupun ia dikira menggunakan formula yang sama (lihat topik 11).

Adalah mudah untuk melihat bahawa nilai pekali autokorelasi dipengaruhi oleh kebolehubahan ahli siri pembolehubah bersandar: semakin kurang ahli siri menyimpang daripada arah aliran, semakin tinggi pekali autokorelasi, dan sebaliknya.

Kerja makmal №5. Analisis regresi.

Makmal dilakukan dalam Excel 2007.

Tujuan kerja adalah untuk membina medan korelasi, mencari pekali regresi linear dan membina garis regresi punca-min-kuasa dua menggunakan Excel.

Jadual nilai pembolehubah terkawal ditetapkan X dan pembolehubah rawak Y . Bina medan korelasi. Cari parameter regresi rms linear. Bina garis regresi linear.

1. Buat jadual nilai pembolehubah terkawal X dan pembolehubah rawak Y , seperti yang ditunjukkan dalam rajah. 1 dan dalam laporan yang dilampirkan.

nasi. 1. Jadual data awal dan parameter persamaan regresi.

Panduan metodologi disertakan dengan laporan mengenai kerja makmal dalam excel/

2. Menggunakan data asal, bina medan korelasi (itulah namanya).

nasi. 2. Graf medan korelasi.

3. Persamaan regresi linear mempunyai bentuk:

- persamaan regresi linear;

Persamaan regresi linear, dikurangkan kepada bentuk persamaan dengan cerun;

Pekali regresi sampel;

- pemalar regresi sampel;

X ;

Sisihan piawai Y .

Pekali korelasi;

momen korelasi;

;

X ;

Jangkaan matematik pembolehubah rawak Y .

4. Buat jadual parameter persamaan regresi ,,,, (seperti ditunjukkan dalam Rajah 1):

Untuk mengira jangkaan matematik dan menggunakan fungsi PURATA daripada kategori Statistik(dan jangan tanya bagaimana untuk melakukannya);

Untuk mengira sisihan piawai dan gunakan fungsi STDEV daripada kategori Statistik(macam mana nak buat ni, boleh tanya cikgu kalau tak takut);

Untuk mengira pekali korelasi, gunakan fungsi CORREL dari kategori Statistik.

4. Dalam sel C2, masukkan formula , menggunakan keputusan pengiraan parameter,,, dan, seperti yang ditunjukkan dalam baris input formula dalam rajah. 1.

Salin formula ini dalam lajur sel berlabel C2:C6.

5. Pada plot medan korelasi, tambahkan garis regresi.

Excel mempunyai cara lain untuk mencari perhubungan linear yang melicinkan dan membina garis regresi.

6. Salin data asal ke dalam sel A20 . Cari parameter persamaan regresi linear seperti berikut:

Pekali regresi sampel didapati menggunakan fungsi SERING daripada kategori Statistik;

Pemalar regresi sampel didapati menggunakan fungsi SEGMEN BARIS daripada kategori Statistik;

Keputusan pengiraan ditunjukkan dalam rajah berikut:

nasi. 3. Jadual pengiraan parameter dan data y* untuk membina garis regresi

7. Plot plot gabungan medan korelasi dan garis regresi.

Satu lagi fungsi Excel untuk mencari regresi linear dan memplot garis arah aliran.

8. Pilih dalam menu utama penanda buku berturut-turut Data → Analisis Data → Regresi.

Isikan medan percuma dalam kotak dialog Regresi data yang sepadan seperti yang ditunjukkan dalam Rajah 4:

selang input y: data awal y;

selang input x: data awal x;

Selang Keluaran: A47

Letakkan tanda semak dalam kotak carta pemilihan. OKEY!!!

nasi. 4. Kotak dialog Regresi

Prosedur Regresi memaparkan graf data asal dan garis regresi melicinkan (graf mesti diformatkan).

AT ketiga meja KEPUTUSAN kita dapati parameter regresi yang menarik minat kita dan merupakan pekali Y-persimpangan dan pembolehubah X. Di samping itu, prosedur Regresi memaparkan sejumlah besar hasil lain dalam bentuk jadual yang kami perlukan pada masa hadapan apabila menyelesaikan masalah ekonometrik.

Terdapat dua lagi cara untuk melukis garis arah aliran dalam Excel.

Salin data X dan Y asal ke dalam blok, bermula dari sel A28, dan plot medan korelasi semula ( Sisipkan → Carta → Titik)

Dengan mengklik kanan pada penanda salah satu titik graf medan korelasi, dengan itu mengaktifkan kotak dialog pemformatan data siri. Memilih pilihan Tambah trendline... ( seperti yang ditunjukkan dalam rajah. lima)

Di tingkap yang dibuka Format Trendline pasang Pilihan Trendline:

- Linear

- tunjukkan persamaan pada rajah

- letakkan pada rajah nilai keyakinan penghampiran.

Apabila anda menyemak kotak - letakkan pada gambar rajah nilai kebolehpercayaan anggaran, nilai pekali penentuan dipaparkan pada rajah.

Lebih baik fungsi regresi dipilih dan semakin kecil perbezaan antara nilai yang diperhatikan dan dikira, semakin hampir kepada perpaduan.

nasi. 5. Kotak dialog Regresi

nasi. 6. Kotak dialog Regresi

Selepas melakukan prosedur Tambahkan garis aliran... graf medan korelasi akan mengambil bentuk:

nasi. 7. Graf medan korelasi dan garis arah aliran dengan persamaan regresi dan pekali penentuan.

Formatkan graf dan buat kesimpulan daripada kerja makmal.

Bentangkan hasil kerja kepada guru untuk digredkan.

Pilihan tugas.

Jadual nilai pembolehubah terkawal X dan pembolehubah rawak Y diperolehi. Cari persamaan regresi linear. Plot data awal pembolehubah rawak Y pada graf dan plot garis regresi.

Pilihan 1.

Pilihan 2.

Pilihan 3.

Pilihan 4.

Pilihan 5.

Pilihan 6.

Pilihan 7.

Pilihan 8.

Pilihan 9.

Pilihan 10.

Pilihan 11.

Pilihan 12.

Pilihan 13.

Pilihan 14.

Pilihan 15.

Pilihan 16.

Pilihan 17.

Pilihan 18.

Pilihan 19.