Biografi Ciri-ciri Analisis

Konsep heteroskedastisitas baki dalam model regresi. Heteroskedastisitas sisa rawak

Heteroskedastisitas

Ralat rawak ialah sisihan dalam model linear regresi berganda:

εi=yi–β0–β1x1i–…–βmxmi

Kerana hakikat bahawa nilai ralat rawak model regresi ialah kuantiti yang tidak diketahui, dikira penilaian sampel ralat rawak model regresi mengikut formula:

di mana ei ialah baki model regresi.

Istilah heteroskedastisitas dalam pengertian yang luas difahami sebagai andaian tentang varians ralat rawak model regresi.

Apabila membina model regresi linear biasa, kami mengambil kira syarat berikut berkenaan ralat rawak model regresi:

6) jangkaan matematik ralat rawak model regresi adalah sifar dalam semua pemerhatian:

7) varians ralat rawak model regresi adalah malar untuk semua pemerhatian:

8) tiada hubungan sistematik antara nilai ralat rawak model regresi dalam mana-mana dua pemerhatian, iaitu ralat rawak model regresi tidak berkorelasi antara satu sama lain (kovarian ralat rawak mana-mana dua pemerhatian berbeza ialah sifar):

Syarat kedua

bermakna homoskedastisitas (serakan homogen) bagi varians ralat rawak model regresi.

Hoscedasticity difahami sebagai andaian bahawa varians ralat rawak βi diketahui nilai tetap untuk semua pemerhatian.

Tetapi dalam amalan, andaian homoskedastisitas ralat rawak βi atau sisa model regresi ei tidak selalunya berpuas hati.

Di bawah heteroskedastisitas (heteroskedastisitas - serakan tidak seragam) difahami andaian bahawa varians ralat rawak adalah nilai yang berbeza untuk semua pemerhatian, yang bermaksud pelanggaran syarat kedua model linear normal regresi berganda:

Heteroskedastisitas boleh ditulis dari segi matriks kovarians ralat rawak model regresi:

Kemudian boleh dikatakan bahawa ralat rawak model regresi βi mematuhi hukum taburan normal dengan jangkaan matematik sifar dan varians G2Ω:

di mana Ω ialah matriks kovarians ralat rawak.

Jika varian ralat rawak

model regresi diketahui lebih awal, maka masalah heteroskedastisitas mudah dihapuskan. Walau bagaimanapun, dalam kebanyakan kes, bukan sahaja varians ralat rawak tidak diketahui, tetapi juga fungsi pergantungan regresi y=f(x), yang akan dibina dan dinilai.

Untuk mengesan heteroskedastisitas sisa model regresi, adalah perlu untuk menganalisisnya. Dalam kes ini, hipotesis berikut diuji.

Hipotesis utama H0 menganggap ketekalan varians ralat rawak model regresi, iaitu, kehadiran keadaan homoskedastisitas dalam model:

Hipotesis alternatif H1 menganggap kebolehubahan varians ralat rawak dalam pemerhatian yang berbeza, iaitu, kehadiran keadaan heterokedastisitas dalam model:

Heteroskedastisitas baki model regresi boleh membawa kepada akibat negatif:

1) anggaran pekali yang tidak diketahui model regresi linear normal adalah tidak berat sebelah dan konsisten, tetapi sifat kecekapan hilang;

2) terdapat kebarangkalian tinggi bahawa anggaran ralat piawai pekali model regresi akan dikira secara salah, yang akhirnya boleh membawa kepada penegasan hipotesis yang salah tentang kepentingan pekali regresi dan kepentingan model regresi sebagai satu keseluruhan.

Homoskedastisitas

Homoskedastisitas baki bermakna varians setiap varians adalah sama untuk semua nilai x. Jika syarat ini tidak dipenuhi, maka heteroskedastisitas berlaku. Kehadiran heteroskedastisitas dapat dilihat dengan jelas dari medan korelasi.

Kerana varians mencirikan sisihan, dapat dilihat dari angka bahawa dalam kes pertama, varians sisa meningkat apabila x meningkat, dan dalam kes kedua, varians sisa mencapai nilai maksimum pada nilai purata x dan berkurangan. pada nilai minimum dan maksimum x. Kehadiran heteroskedastisitas akan mempengaruhi penurunan kecekapan anggaran parameter persamaan regresi. Kehadiran homoskedastisitas atau heterokedastisitas juga boleh ditentukan daripada plot baki berbanding nilai teori.

Selaras dengan salah satu prasyarat kuasa dua terkecil, adalah perlu bahawa varians sisa adalah homoskedastik. Ini bermakna bagi setiap nilai faktor X, baki e, mempunyai varians yang sama. Jika syarat ini tidak dipenuhi, maka heteroskedastisitas berlaku. Kehadiran heteroskedastisitas boleh ditunjukkan dengan jelas dalam medan korelasi (lihat Rajah).

Homoskedastisitas baki bermakna varians baki adalah sama bagi setiap nilai X. Menggunakan imej 3D, plot berikut boleh diperolehi yang akan menggambarkan homo dan heterokedastisitas


Angka dengan homoskedastisitas menunjukkan bahawa bagi setiap nilai X, taburan sisa adalah sama, berbeza dengan heterokedastisitas.

Untuk regresi berbilang, jenis graf ialah cara paling visual untuk mengkaji homo- dan heteroskedastisitas.

Kehadiran heteroskedastisitas dalam beberapa kes boleh membawa kepada berat sebelah dalam anggaran pekali regresi, walaupun tidak berat sebelah anggaran pekali regresi, sebagai peraturan, bergantung pada pematuhan dengan premis kedua kuasa dua terkecil, iaitu, kebebasan sisa dan faktor nilai. Heteroskedastisitas akan mempengaruhi penurunan kecekapan anggaran b. Khususnya, menjadi sukar untuk menggunakan formula untuk ralat piawai bagi pekali regresi Sb, yang menganggap satu varians baki untuk sebarang nilai faktor.

Definisi heteroskedastisitas

Dengan saiz sampel yang kecil, yang tipikal untuk majoriti, kaedah Goldfeld-Quandt digunakan untuk menilai heteroskedastisitas, yang dibangunkan pada tahun 1965 oleh Goldfeld dan Quandt, di mana mereka menganggap satu faktor. model linear, yang mana varians baki bertambah mengikut perkadaran dengan kuasa dua faktor. Untuk menilai pelanggaran homoskedastisitas, mereka mencadangkan untuk melakukan operasi berikut.

  1. Isih pemerhatian apabila faktor X bertambah.
  2. Kecualikan daripada pertimbangan C cerapan pusat, dan (n - C): 2 > p, dengan p ialah bilangan parameter anggaran.
  3. Bahagikan set pemerhatian (n - C) kepada dua kumpulan (dengan kecil dan nilai yang besar faktor X).
  4. Tentukan jumlah baki kuasa dua bagi kumpulan pertama (S1) dan kedua (S2) dan cari nisbah: R = S1: S2.

Sambil buat hipotesis nol tentang homoskedastisitas, nisbah R akan memenuhi kriteria Fisher dengan (n - C - 2p): 2 darjah kebebasan untuk setiap jumlah baki segi empat sama. Semakin nilai R melebihi nilai jadual Ujian-F, topik dalam lebih andaian tentang kesamaan serakan sisa dilanggar.

Jawapan kepada tiket peperiksaan dalam ekonometrik Yakovleva Angelina Vitalievna

57. Heteroskedastisitas Sisa Model Regresi

Kesilapan rawak dipanggil varians dalam model regresi berbilang linear:

?i=yi–?0–?1x1i–…–?mxmi

Disebabkan fakta bahawa magnitud ralat rawak model regresi adalah nilai yang tidak diketahui, anggaran sampel ralat rawak model regresi dikira menggunakan formula:

di mana ei adalah baki model regresi.

Istilah heteroskedastisitas secara umum difahami sebagai andaian tentang varians ralat rawak model regresi.

Apabila membina model regresi linear biasa, syarat berikut diambil kira berkenaan ralat rawak model regresi:

6) nilai yang dijangkakan Ralat rawak model regresi adalah sifar dalam semua pemerhatian:

7) varians ralat rawak model regresi adalah malar untuk semua pemerhatian:

8) tiada hubungan sistematik antara nilai ralat rawak model regresi dalam mana-mana dua pemerhatian, iaitu ralat rawak model regresi tidak berkorelasi antara satu sama lain (kovarian ralat rawak mana-mana dua pemerhatian berbeza ialah sifar):

Syarat kedua

bermakna homoskedastisitas (serakan homogen) bagi varians ralat rawak model regresi.

Di bawah homoskedastisitas difahami sebagai andaian bahawa varians ralat rawak ?i ialah pemalar yang diketahui untuk semua pemerhatian.

Tetapi dalam amalan, andaian homoskedastisitas ralat rawak?i atau baki model regresi ei tidak selalu dilakukan.

Di bawah heteroskedastisitas(heteroskedastisitas - serakan heterogen) difahami sebagai andaian bahawa varians ralat rawak adalah nilai yang berbeza untuk semua pemerhatian, yang bermaksud pelanggaran syarat kedua model linear normal regresi berganda:

Heteroskedastisitas boleh ditulis dari segi matriks kovarians ralat rawak model regresi:

Kemudian boleh dikatakan bahawa ralat rawak model regresi ?i mematuhi undang-undang taburan normal dengan jangkaan dan varians matematik sifar G2?:

?i~N(0;G2?),

di mana ? ialah matriks kovarians ralat rawak.

Jika varian ralat rawak

model regresi diketahui lebih awal, maka masalah heteroskedastisitas mudah dihapuskan. Walau bagaimanapun, dalam kebanyakan kes, bukan sahaja varians ralat rawak tidak diketahui, tetapi juga fungsi pergantungan regresi itu sendiri. y=f(x), untuk dibina dan dinilai.

Untuk mengesan heteroskedastisitas sisa model regresi, adalah perlu untuk menganalisisnya. Dalam kes ini, hipotesis berikut diuji.

Hipotesis utama H0 membayangkan ketekalan varians ralat rawak model regresi, iaitu, kehadiran keadaan homoskedastisitas dalam model:

Hipotesis alternatif H1 menganggap kebolehubahan varians ralat rawak dalam pemerhatian yang berbeza, iaitu, kehadiran keadaan heterokedastisitas dalam model:

Heteroskedastisitas baki model regresi boleh membawa kepada akibat negatif:

1) anggaran pekali yang tidak diketahui model regresi linear normal adalah tidak berat sebelah dan konsisten, tetapi sifat kecekapan hilang;

2) terdapat kebarangkalian yang tinggi bahawa anggaran ralat piawai pekali model regresi akan dikira secara salah, yang akhirnya boleh membawa kepada penegasan hipotesis yang salah tentang kepentingan pekali regresi dan kepentingan model regresi secara keseluruhan.

Daripada buku Jawapan kepada Tiket Peperiksaan dalam Ekonometrik pengarang Yakovleva Angelina Vitalievna

14. Penilaian pekali model regresi berpasangan menggunakan kadar persampelan Regresi Melangkaui Kaedah petak terkecil, yang dalam kebanyakan kes menentukan parameter yang tidak diketahui bagi model regresi, dalam kes model regresi berpasangan linear

Dari buku pengarang

15. Anggaran varians ralat rawak model regresi analisis regresi kesukaran utama ialah varians umum ralat rawak ialah kuantiti yang tidak diketahui, yang menjadikannya perlu untuk mengiranya tidak berat sebelah

Dari buku pengarang

18. Ciri-ciri kualiti model regresi Kualiti model regresi ialah kecukupan model yang dibina kepada data awal (dicerap) Penunjuk khas digunakan untuk menilai kualiti model regresi Kualiti pasangan linear model regresi

Dari buku pengarang

35. Menguji hipotesis tentang kepentingan pekali regresi dan model regresi berganda secara keseluruhan Menguji kepentingan pekali regresi bermaksud menguji hipotesis utama tentang perbezaan ketaranya daripada sifar.

Dari buku pengarang

39. Model regresi bukan linear dalam pembolehubah faktor Apabila mengkaji fenomena dan proses sosio-ekonomi, tidak semua kebergantungan boleh diterangkan menggunakan sambungan linear. Oleh itu, dalam pemodelan ekonometrik, kelas tak linear

Dari buku pengarang

40. Model regresi yang tidak linear dari segi pekali anggaran

Dari buku pengarang

41. Model Regresi dengan Definisi Titik Putus. Model regresi dengan titik putus dipanggil model yang tidak boleh dikurangkan kepada bentuk linear, iaitu model regresi bukan linear dalaman. Model regresi dibahagikan kepada dua kelas: 1) model regresi linear sekeping; 2)

Dari buku pengarang

44. Kaedah untuk anggaran bukan linear bagi pekali model regresi Fungsi kehilangan atau ralat adalah fungsi bentuk. Juga, sebagai fungsi kerugian, jumlah modul sisihan nilai yang diperhatikan bagi ciri berkesan y daripada yang teori boleh digunakan

Dari buku pengarang

46. ​​Menguji hipotesis tentang kepentingan model regresi bukan linear. Menguji hipotesis tentang pergantungan linear antara pembolehubah model regresi Kepada model regresi bukan linear yang linear intrinsik, iaitu boleh dikurangkan kepada bentuk linear, semua tersebar

Dari buku pengarang

58. Ujian glaser untuk mengesan heterokedastisitas baki model regresi Terdapat beberapa ujian untuk mengesan heterokedastisitas baki model regresi.

Dari buku pengarang

59. Ujian Goldfeld-Quandt untuk mengesan heteroskedastisitas baki model regresi Syarat utama untuk ujian Goldfeld-Quandt ialah andaian bahawa undang-undang biasa taburan ralat rawak?i model regresi. Pertimbangkan aplikasi ini

Dari buku pengarang

60. Mengeluarkan heterokedastisitas baki model regresi Terdapat banyak kaedah untuk membuang heterokedastisitas baki model regresi. Mari kita lihat sebahagian daripada mereka. Kebanyakan kaedah mudah penghapusan heteroskedastisitas baki model regresi

Dari buku pengarang

61. Autokorelasi sisa model regresi. Akibat autokorelasi. Fungsi Autokorelasi Autokorelasi ialah korelasi yang berlaku antara tahap pembolehubah minat. Ia adalah korelasi yang muncul dari semasa ke semasa. Kehadiran autokorelasi paling kerap

Dari buku pengarang

62. Ujian Durbin-Watson untuk mengesan autokorelasi sisa model regresi Selain autokorelasi dan persendirian fungsi autokorelasi untuk mengesan autokorelasi sisa model regresi, ujian Durbin-Watson digunakan. Walau bagaimanapun, kriteria ini

Dari buku pengarang

63. Penyingkiran autokorelasi baki model regresi Disebabkan oleh fakta bahawa kehadiran dalam model regresi autokorelasi antara baki model boleh menyebabkan keputusan negatif daripada keseluruhan proses menganggar pekali model yang tidak diketahui, autokorelasi baki

Dari buku pengarang

67. Model regresi dengan struktur berubah-ubah. Pembolehubah dummy Apabila membina model regresi, situasi mungkin timbul apabila perlu memasukkan bukan sahaja pembolehubah kuantitatif, tetapi juga pembolehubah kualitatif (contohnya, umur, pendidikan, jantina, kaum

Penilaian ketepatan model regresi.

Untuk menilai ketepatan, dua penunjuk paling kerap digunakan, iaitu untuk linear dan untuk model tak linear seperti:

1. Ralat anggaran purata

2. Ralat anggaran RMS

8.1. Intipati dan punca heteroskedastisitas

Syarat Gauss-Markov kedua mengenai homoskedastisitas, iaitu, kebolehubahan sisa, adalah salah satu prasyarat yang paling penting untuk LSM.

Oleh kerana min bagi baki dalam setiap cerapan ialah sifar, kuasa dua baki boleh berfungsi sebagai anggaran variansnya.

Petak sisa ini termasuk dalam ESS(yang diminimumkan dalam LSM) dengan berat unit yang sama, dan ini tidak selalu wajar, kerana heteroskedastisitas tidak begitu jarang berlaku dalam amalan.

Sebagai contoh, dengan peningkatan pendapatan, bukan sahaja tahap purata penggunaan, tetapi juga variasi dalam penggunaan. Ia lebih wujud dalam entiti berpendapatan tinggi, kerana mereka mempunyai lebih banyak skop untuk pengagihan pendapatan. Masalah heteroskedastisitas adalah lebih tipikal untuk sampel spatial. Jelas sekali, dengan adanya heteroskedastisitas, pemerhatian dengan penyebaran yang lebih besar sepatutnya ESS kurangkan berat dan sebaliknya, dan tidak menganggapnya sama wajaran, seperti yang dilakukan dalam petak terkecil klasik.

Satu titik pada plot serakan yang diperoleh daripada pemerhatian dengan varians yang kurang menentukan arah garis regresi dengan lebih tepat daripada titik dari pemerhatian dengan lebih banyak varians.

Implikasi heteroskedastisitas adalah:

1. Anggaran parameter tidak akan cekap, iaitu, ia tidak akan mempunyai varians terkecil berbanding dengan anggaran lain; bagaimanapun, mereka akan kekal tidak berat sebelah.

2. Varians anggaran akan dianjak, kerana varians akan dianjakkan oleh satu darjah kebebasan, yang digunakan dalam mengira anggaran varians semua pekali.

3. Kesimpulan yang dibuat daripada melambung F dan t statistik, dan anggaran selang akan menjadi tidak boleh dipercayai.

8.2.Pengenalpastian heteroskedastisitas

Ini bukan satu tugas yang mudah; penyebaran σ 2 (ε i) biasanya tidak dapat ditentukan, kerana untuk nilai tertentu pembolehubah penjelasan x i atau nilai vektor tertentu x dalam regresi berganda, kita hanya mempunyai satu nilai pembolehubah bersandar i dan kita boleh mengira satu-satunya nilai model pembolehubah

Walau bagaimanapun, beberapa kaedah dan ujian kini telah dibangunkan untuk mengesan heteroskedastik:

1. Grafik- kami telah pun berkata demikian M(ε i)=0; ini bermakna varians baki boleh digantikan dengan anggarannya, dan nilai boleh diambil sebagai anggaran ini. Dalam kes ini, anda boleh membina graf dalam koordinat: terdapat fungsi x i dan menggunakannya untuk mengkaji sifat pergantungan ini. Jika terdapat beberapa pembolehubah penjelasan, maka pergantungan pada setiap pembolehubah diperiksa x j, iaitu, kita mengkaji pergantungan


Seseorang juga boleh meneroka kebergantungan, kerana pembolehubah di ialah gabungan linear semua pembolehubah penjelasan.

2. Ujian korelasi pangkat Spearman

Nilai x i dan ε i diisih dalam tertib menaik, dan untuk setiap pemerhatian dalam siri X dan berturut-turut ε pangkatnya (nombor) ditetapkan mengikut susunan ini. Beza d i antara pangkat x dan ε bagi setiap nombor cerapan dikira sebagai

Kemudian pekali korelasi pangkat dikira:

.

Adalah diketahui bahawa jika sisa tidak berkorelasi dengan pembolehubah penjelasan, maka statistik

mempunyai taburan Pelajar dengan bilangan darjah kebebasan

df = n−2.

Jika nilai yang dikira t– statistik melebihi nilai kritikal jadual pada tahap keertian yang ditetapkan γ hipotesis H 0 , maka hipotesis ketiadaan heterokedastisitas ditolak dan heterokedastisitas diiktiraf sebagai signifikan. nilai kritikal t– statistik ditentukan daripada jadual sebagai

Sekiranya model regresi adalah berbilang, ujian hipotesis H 0 dilakukan untuk setiap pembolehubah penjelasan.

3. Goldfeld--Ujian quandt

Diandaikan bahawa varians baki dalam setiap cerapan adalah berkadar atau berkadar songsang dengan regressor kepentingan, ia juga diandaikan bahawa baki bertaburan normal dan tiada autokorelasi dalam baki.

Dalam kes regresi berganda, adalah dinasihatkan untuk menjalankan ujian untuk setiap regresi secara berasingan.

Urutan ujian:

a) pemerhatian (baris jadual) disusun dalam tertib menaik bagi regressor yang menarik kepada kami;

b) sampel yang dipesan dengan cara ini dibahagikan kepada 3 subsampel dengan saiz , , nilai berikut: n= 30, k = 11; n= 60, k = 22; n= 100, k= 36…38; n= 300, k = 110 dan seterusnya (lihat Jadual 8.1).

Apabila menganggar parameter persamaan regresi, kami menggunakan kaedah kuasa dua terkecil. Pada masa yang sama, kami membuat andaian tertentu mengenai komponen rawak . Dalam model

di = a + b 1  x + 

komponen rawak  ialah kuantiti tidak boleh diperhatikan. Selepas parameter model dinilai, setelah mengira perbezaan antara nilai sebenar dan teori ciri berkesan di, kita boleh menentukan anggaran komponen rawak ( di). Apabila menukar spesifikasi model, menambah pemerhatian baru kepadanya, anggaran sampel baki i, mungkin berubah. Oleh itu, tugas analisis regresi merangkumi bukan sahaja pembinaan model itu sendiri, tetapi juga kajian sisihan rawak  i, iaitu nilai baki.

Bahagian sebelumnya mempertimbangkan ujian formal kesahan statistik regresi dan pekali korelasi menggunakan t-Kriteria pelajar dan F-kriteria. Apabila menggunakan kriteria ini, andaian dibuat tentang kelakuan baki  i. Baki adalah pembolehubah rawak bebas dan minnya ialah 0; mereka mempunyai varians yang sama (malar) dan mengikut taburan normal.

Anggaran parameter regresi mesti memenuhi kriteria tertentu: tidak berat sebelah, konsisten dan cekap.

Anggaran tidak berat sebelah bermakna jangkaan baki adalah sifar. Oleh itu, dengan bilangan anggaran sampel yang banyak, sisa tidak akan terkumpul dan parameter regresi yang ditemui b i boleh dianggap sebagai purata bagi sejumlah besar anggaran tidak berat sebelah yang mungkin.

Untuk tujuan praktikal, bukan sahaja tidak berat sebelah adalah penting, tetapi juga kecekapan anggaran. Penilaian dipertimbangkan berkesan jika mereka mempunyai varians terkecil.

Tahap realisme selang keyakinan parameter regresi dipastikan jika anggaran bukan sahaja tidak berat sebelah dan cekap, tetapi juga kaya raya. Ketekalan anggaran mencirikan peningkatan ketepatannya dengan peningkatan dalam saiz sampel.

Penyelidikan sisa  i melibatkan pemeriksaan kehadiran lima andaian LSM berikut (lihat syarat Gauss-Markov):

    Sifat rawak jenazah.

Untuk melakukan ini, plotkan pergantungan baki  i daripada nilai teori ciri berkesan .Jika tiada arah di lokasi titik pada carta  i, maka baki  i adalah pembolehubah rawak dan kuasa dua terkecil adalah wajar, nilai teori menganggarkan nilai sebenar dengan baik di.

    Sifar nilai purata sisa, bebas daripada X i .

Andaian OLS kedua mengenai min sifar baki bermakna ( di) = 0. Ini boleh dilaksanakan untuk model dan model linear yang tidak linear berkenaan dengan pembolehubah yang disertakan. Untuk model yang tidak linear dari segi parameter anggaran dan dikurangkan kepada bentuk linear dengan mengambil logaritma, kesalahan bermakna adalah sifar untuk logaritma data asal. Jadi, untuk model borang

    Homoskedastisitasvarians setiap sisihani sama untuk semua nilaiX.

Premis ketiga bagi kuasa dua terkecil menghendaki varians baki adalah homoskedastik. Ini bermakna bagi setiap nilai faktor X i sisa mempunyai varians yang sama. Sekiranya syarat untuk memohon LSM ini tidak dipenuhi, maka kita ada heteroskedastisitas(Rajah 1).

Homoskedastisitas baki bermakna varians baki  i sama untuk setiap nilai X.

Kehadiran heteroskedastisitas dalam kes individu boleh membawa kepada berat sebelah dalam anggaran pekali regresi, walaupun ketidakcondongan anggaran pekali regresi bergantung terutamanya pada pematuhan premis kedua LSM, i.e. kebebasan baki dan nilai faktor.

Heteroskedastisitas akan menjejaskan penurunan kecekapan anggaran b i. Khususnya, ia menjadi sukar untuk menggunakan formula untuk ralat piawai pekali regresi , yang menganggap satu varians sisa untuk sebarang nilai faktor.

Pertimbangkan ujian, yang membolehkan kami menganalisis model untuk homoskedastisitas.

Dengan saiz sampel yang kecil, yang paling tipikal untuk kajian ekonometrik, heteroskedastisitas boleh dinilai menggunakan Kaedah Goldfeld Quandta , dibangunkan pada tahun 1965 oleh Goldfeld dan Quandt, dianggap sebagai model linear satu faktor yang mana varians baki meningkat dengan kuasa dua faktor. Untuk menilai pelanggaran homoskedastisitas, mereka mencadangkan ujian parametrik yang merangkumi langkah-langkah berikut:

    memesan P pemerhatian apabila pembolehubah bertambah X.

    Pengecualian daripada pertimbangan DARI pemerhatian pusat; di mana ( P C)/2 > R, di mana R bilangan parameter anggaran.

Daripada pengiraan eksperimen yang dijalankan oleh pengarang kaedah untuk kes satu faktor, adalah disyorkan untuk P= 30 terima DARI= 8, manakala P= 60 - masing-masing DARI = 16.

    Membahagikan populasi daripada ( PDARI) pemerhatian kepada dua kumpulan (masing-masing, dengan nilai kecil dan besar faktor X) dan definisi bagi setiap kumpulan persamaan regresi.

    Penentuan jumlah baki kuasa dua untuk yang pertama ( S 1) dan kedua ( S 2) kumpulan dan mencari hubungan mereka: R = S 1 /S 2, di mana S 1 > S 2 .

Di bawah hipotesis nol homoskedastisitas, nisbah R akan memuaskan F-kriteria dengan ( PDARI2R)/2 darjah kebebasan bagi setiap jumlah baki kuasa dua. Semakin besar nilainya R melebihi nilai jadual F-kriteria, semakin banyak premis kesamaan penyebaran nilai sisa dilanggar.

Ujian Goldfeld-Quandt juga digunakan untuk menguji sisa regresi berbilang untuk heteroskedastisitas.

Kehadiran heteroskedastisitas dalam sisa regresi juga boleh disemak menggunakan Korelasi pangkat Spearman . Intipati cek ialah dalam kes heteroskedastisitas, baki mutlak  i dikaitkan dengan nilai faktor X i. Korelasi ini boleh diukur menggunakan pekali korelasi pangkat Spearman:

, (31)

di mana d perbezaan mutlak antara peringkat nilai X i dan | i |.

Kepentingan statistik  boleh dianggarkan menggunakan t-kriteria:

. (32)

Membandingkan nilai ini dengan nilai jadual pada  = 0.05 dan bilangan darjah kebebasan ( Pm). Diandaikan bahawa jika t  > t , maka perkaitan antara  i dan X i signifikan secara statistik, iaitu, terdapat heteroskedastisitas sisa. Jika tidak, hipotesis ketiadaan heteroskedastisitas baki diterima.

Kriteria yang dipertimbangkan tidak memberikan penilaian kuantitatif kebergantungan varians ralat regresi pada nilai yang sepadan dengan faktor yang termasuk dalam regresi. Mereka hanya membenarkan seseorang untuk menentukan kehadiran atau ketiadaan heteroskedastisitas sisa. Oleh itu, jika heteroskedastisitas sisa ditentukan, adalah mungkin untuk mengukur pergantungan varians ralat regresi pada nilai faktor. Untuk tujuan ini, ujian White, Park, Glaser, dan lain-lain boleh digunakan.

Ujian putih menganggap bahawa varians ralat regresi ialah fungsi kuadratik bagi nilai faktor, i.e. dengan adanya satu faktor  2 = a+ bx + cx 2 + u, atau jika terdapat faktor:

 2 = a + b 1 x 1 + b 11 +b 2 x 2 + b 22 +b 12 x 1 x 2 + … + b hlm x hlm + b hlm + + b 1 hlm x 1 x hlm + b 2 hlm x 2 x hlm + … + u.

Jadi model termasuk bukan sahaja nilai faktor, tetapi juga kuasa duanya, serta produk berpasangan. Oleh kerana setiap parameter model =f(X i) mesti dikira berdasarkan bilangan darjah kebebasan yang mencukupi, maka semakin kecil jumlah populasi yang dikaji, semakin kurang fungsi kuadratik akan dapat mengandungi hasil berpasangan faktor. Sebagai contoh, jika regresi dibina atas 30 pemerhatian sebagai y i = a + b 1 x +  i, maka fungsi kuadratik seterusnya untuk baki hanya boleh diwakili sebagai

 2 = a + b 1 x + b 11 X 2 + u,

kerana bagi setiap parameter X perlu ada sekurang-kurangnya 6-7 pemerhatian. Pada masa ini, ujian White disertakan dalam program analisis regresi standard dalam pakej Pandangan Ekonometrik. Kehadiran atau ketiadaan heteroskedastisitas sisa dinilai dengan nilai F- Kriteria Fisher untuk fungsi kuadratik regresi sisa. Jika nilai sebenar F-kriteria lebih tinggi daripada jadual, maka, oleh itu, terdapat korelasi yang jelas antara varians ralat dan nilai faktor yang termasuk dalam regresi, dan terdapat heteroskedastisitas baki. Jika tidak ( F fakta< F Jadual) menyimpulkan bahawa tiada heteroskedastisitas sisa regresi.

Ujian Taman juga merujuk kepada ujian heteroskedastisitas formal. Diandaikan bahawa varians baki adalah berkaitan dengan nilai faktor fungsi ln  2 = a + b ln X + dan. Regresi ini dibina untuk setiap faktor dalam keadaan model multifaktorial. Kepentingan pekali regresi disemak b pada t-Kriteria pelajar. Jika pekali regresi untuk persamaan ln 2 ternyata signifikan secara statistik, maka, oleh itu, terdapat pergantungan ln 2 pada ln X, iaitu sisa adalah heteroskedastik.

Jika ujian White and Park direka untuk menilai heteroskedastisitas bagi sisa kuasa dua  2 , maka Ujian glaser adalah berdasarkan regresi nilai mutlak sisa ||, i.e. fungsi | i | = a + b + dan i. Regresi | i| daripada X i dibina di makna yang berbeza parameter Dengan, dan kemudian fungsi dipilih yang mana pekali regresinya b ternyata menjadi yang paling ketara, i.e. mempunyai nilai tertinggi t-Kriteria pelajar atau F- Kriteria Fisher dan R 2 .

Apabila heteroskedastisitas sisa regresi dikesan, matlamatnya adalah untuk menghapuskannya, iaitu penggunaan kaedah kuasa dua terkecil umum (lihat di bawah).

    Tiada autokorelasi sisa. Nilai baki i , diedarkan secara bebas.

Autokorelasi baki bermaksud kehadiran korelasi antara baki pemerhatian semasa dan sebelumnya (seterusnya).

Apabila membina model regresi, adalah sangat penting untuk mematuhi syarat ini. Pekali korelasi antara  i dan  i-1 , di mana  i sisa cerapan semasa,  i-1  sisa pemerhatian terdahulu boleh ditakrifkan sebagai

, (33)

yang sepadan dengan formula pekali korelasi linear. Jika pekali ini ternyata berbeza dengan ketara daripada sifar, maka sisa adalah autokorelasi dan fungsi ketumpatan kebarangkalian F() bergantung kepada j titik cerapan ke dan pada taburan nilai baki di titik cerapan lain.

Ketiadaan autokorelasi sisa memastikan ketekalan dan kecekapan anggaran pekali regresi. Adalah amat penting untuk memerhatikan premis LSM ini apabila membina model regresi untuk siri masa, di mana, dengan kehadiran arah aliran, tahap berikutnya siri masa, sebagai peraturan, bergantung pada tahap sebelumnya.

    Sisa mengikut taburan normal.

Andaian taburan normal baki membenarkan ujian regresi dan parameter korelasi menggunakan kriteria t dan F. Pada masa yang sama, anggaran regresi yang didapati menggunakan kaedah kuasa dua terkecil mempunyai sifat yang baik walaupun tanpa taburan normal baki, i.e. apabila premis kelima kaedah kuasa dua terkecil dilanggar.

Bersama-sama dengan prasyarat kaedah kuasa dua terkecil sebagai kaedah untuk menganggar parameter regresi, apabila membina model regresi, keperluan tertentu mesti dipatuhi mengenai pembolehubah yang termasuk dalam model. Pertama sekali, bilangan pembolehubah t hendaklah tidak lebih daripada
. Jika tidak, parameter regresi adalah tidak penting secara statistik. AT Pandangan umum penggunaan kuasa dua terkecil adalah mungkin jika bilangan cerapan P melebihi bilangan parameter yang dianggarkan t, iaitu sistem persamaan biasa mempunyai penyelesaian hanya apabila P > t.

Sekiranya prasyarat asas tidak dipenuhi, LSM perlu membetulkan model dengan menukar spesifikasinya, menambah (tidak termasuk) beberapa faktor, mengubah data awal untuk mendapatkan anggaran pekali regresi yang mempunyai sifat tidak berat sebelah, mempunyai nilai yang lebih kecil. varians baki dan, oleh itu, menyediakan ujian statistik yang lebih cekap tentang kepentingan parameter regresi. Matlamat ini, seperti yang telah disebutkan, adalah penggunaan kaedah umum kuasa dua terkecil.