Biografi Ciri-ciri Analisis

Parameter persamaan regresi linear dikira berdasarkan. Persamaan Regresi

Topik:Unsur-unsur teori korelasi

Objek bersiri populasi mempunyai beberapa ciri X, Y, ... untuk dikaji, yang boleh ditafsirkan sebagai sistem kuantiti yang saling berkaitan. Contohnya ialah: berat haiwan dan jumlah hemoglobin dalam darah, ketinggian lelaki dan isipadu dada, peningkatan dalam pekerjaan di dalam rumah dan kejadian jangkitan virus, jumlah ubat yang diberikan dan kepekatannya. dalam darah, dsb.

Jelas sekali, terdapat hubungan antara kuantiti ini, tetapi ia tidak boleh menjadi pergantungan fungsi yang ketat, kerana perubahan dalam salah satu kuantiti dipengaruhi bukan sahaja oleh perubahan dalam kuantiti kedua, tetapi juga oleh faktor lain. Dalam kes sedemikian, kedua-dua kuantiti itu dikatakan berkaitan. stokastik(iaitu rawak) kebergantungan. Kami akan belajar kes istimewa pergantungan stokastik - pergantungan korelasi.

DEFINISI:stokastik jika perubahan dalam salah satu daripadanya dipengaruhi bukan sahaja oleh perubahan dalam nilai kedua, tetapi juga oleh faktor lain.

DEFINISI: Kebergantungan pembolehubah rawak dipanggil statistik, jika perubahan pada salah satu daripadanya membawa kepada perubahan dalam hukum pengagihan yang lain.

DEFINISI: Jika perubahan dalam salah satu pembolehubah rawak memerlukan perubahan dalam min pembolehubah rawak yang lain, maka pergantungan statistik dipanggil korelasi.

Contoh pergantungan korelasi adalah hubungan antara:

berat badan dan ketinggian;

    dos sinaran mengion dan bilangan mutasi;

    pigmen rambut manusia dan warna mata;

    penunjuk taraf hidup penduduk dan peratusan kematian;

    bilangan kuliah yang terlepas oleh pelajar dan gred peperiksaan, dsb.

Ia adalah pergantungan korelasi yang paling sering dijumpai di alam semula jadi kerana pengaruh bersama dan jalinan rapat pelbagai jenis faktor yang sangat berbeza yang menentukan nilai penunjuk yang dikaji.

Hasil pemerhatian yang dijalankan ke atas objek biologi tertentu mengikut tanda korelasi Y dan X boleh digambarkan sebagai titik pada satah dengan membina sistem koordinat segi empat tepat. Akibatnya, gambar rajah serakan tertentu diperolehi, yang memungkinkan untuk menilai bentuk dan ketat hubungan antara ciri yang berbeza-beza.

Jika hubungan ini boleh dianggarkan oleh beberapa lengkung, maka adalah mungkin untuk meramalkan perubahan dalam salah satu parameter dengan perubahan bertujuan dalam parameter lain.

pergantungan korelasi daripada
boleh diterangkan menggunakan persamaan bentuk

(1)

G
de
min bersyarat kuantiti sepadan dengan nilai kuantiti
, a
beberapa fungsi. Persamaan (1) dipanggil pada
.

Rajah 1. Regresi Linear ketara. Model
.

Fungsi
dipanggil regresi sampel pada
, dan grafnya ialah garis regresi sampel pada
.

Sepenuhnya serupa persamaan regresi sampel
pada ialah persamaan
.

Bergantung pada jenis persamaan regresi dan bentuk garis regresi yang sepadan, bentuk pergantungan korelasi antara nilai yang dipertimbangkan ditentukan - linear, kuadratik, eksponen, eksponen.

Yang paling penting ialah persoalan memilih jenis fungsi regresi
[atau
], seperti linear atau bukan linear (eksponen, logaritma, dsb.)

Dalam amalan, bentuk fungsi regresi boleh ditentukan dengan membina pada satah koordinat satu set titik sepadan dengan semua pasangan pemerhatian yang tersedia (
).

nasi. 2. Regresi linear tidak signifikan. Model
.

R
ialah. 3. Model tak linear
.

Sebagai contoh, dalam Rajah.1. terdapat aliran menaik dalam nilai dengan pertumbuhan
, manakala nilai purata terletak secara visual pada garis lurus. Masuk akal untuk menggunakan model linear (jenis pergantungan daripada
dipanggil model) kebergantungan daripada
.

Dalam Rajah.2. nilai purata jangan bergantung pada , oleh itu, regresi linear adalah tidak penting (fungsi regresi adalah malar dan sama dengan ).

Pada rajah. 3. terdapat kecenderungan untuk model tidak linear.

Contoh hubungan garis lurus:

    peningkatan dalam jumlah iodin yang digunakan dan penurunan dalam kejadian goiter,

    meningkatkan pengalaman pekerja dan meningkatkan produktiviti.

Contoh pergantungan lengkung:

    dengan peningkatan dalam kerpasan, hasil meningkat, tetapi ini berlaku sehingga had tertentu kerpasan. Selepas titik kritikal, hujan sudah berlebihan, tanah menjadi berair dan hasil berkurangan,

    hubungan antara dos klorin yang digunakan untuk membasmi kuman air dan bilangan bakteria dalam 1 ml. air. Dengan peningkatan dalam dos klorin, bilangan bakteria dalam air berkurangan, tetapi apabila titik kritikal dicapai, bilangan bakteria akan kekal malar (atau tidak hadir sepenuhnya), tidak kira bagaimana kita meningkatkan dos klorin.

Regresi Linear

Memilih jenis fungsi regresi, i.e. jenis model pergantungan yang sedang dipertimbangkan daripada X (atau X daripada Y), sebagai contoh, model linear
, adalah perlu untuk menentukan nilai khusus pekali model.

Untuk pelbagai nilai a dan
adalah mungkin untuk membina bilangan kebergantungan yang tidak terhingga bagi borang tersebut
iaitu pada satah koordinat terdapat bilangan baris yang tidak terhingga, tetapi kita memerlukan pergantungan sedemikian yang sepadan dengan nilai yang diperhatikan dengan cara yang terbaik. Oleh itu, masalah dikurangkan kepada pemilihan pekali terbaik.

Kuasa Dua Terkecil (LSM)

fungsi linear
kami mencari hanya berdasarkan beberapa pemerhatian yang tersedia. Untuk mencari fungsi yang paling sesuai dengan nilai yang diperhatikan, kami gunakan kaedah petak terkecil.

Rajah.4. Penjelasan anggaran pekali dengan kaedah kuasa dua terkecil

Nyatakan: - nilai dikira mengikut persamaan

- nilai yang diukur,

- perbezaan antara nilai yang diukur dan dikira,

.

AT petak terkecil diperlukan untuk , perbezaan antara yang diukur dan nilai yang dikira oleh persamaan , adalah minimum. Oleh itu, kami mendapati untuk memilih pekali a dan supaya jumlah sisihan kuasa dua nilai yang diperhatikan daripada nilai pada garis regresi lurus adalah yang terkecil:

Keadaan ini dicapai jika parameter a dan akan dikira mengikut formula:

dipanggil pekali regresi; dipanggil ahli percuma persamaan regresi.

Garis lurus yang terhasil adalah anggaran untuk garis regresi teori. Kami ada

Jadi,
ialah persamaan regresi linear.

Regresi boleh secara langsung
dan terbalik
.

DEFINISI: Regresi terbalik bermakna apabila satu parameter meningkat, nilai parameter lain berkurangan.

Regresi Linear Berpasangan

BENGKEL

Regresi Linear Berpasangan: Bengkel. -

Kajian ekonometrik melibatkan pelajar memperoleh pengalaman dalam membina model ekonometrik, membuat keputusan mengenai spesifikasi dan pengenalpastian model, memilih kaedah untuk menganggar parameter model, menilai kualitinya, mentafsir keputusan, mendapatkan anggaran ramalan, dll. Bengkel ini akan membantu pelajar memperoleh kemahiran praktikal dalam perkara ini.

Diluluskan oleh majlis editorial dan penerbitan

Disusun oleh: M.B. Perova, Doktor Ekonomi, Profesor

Peruntukan am

Penyelidikan ekonometrik bermula dengan teori yang mewujudkan hubungan antara fenomena. Daripada keseluruhan julat faktor yang mempengaruhi ciri berkesan, faktor yang paling penting dibezakan. Selepas kehadiran hubungan antara ciri-ciri yang dikaji telah dikenal pasti, bentuk sebenar hubungan ini ditentukan menggunakan analisis regresi.

Analisis regresi adalah untuk menentukan ungkapan analitikal (dalam definisi fungsi), di mana perubahan dalam satu nilai (ciri berkesan) adalah disebabkan oleh pengaruh nilai bebas(tanda faktor). Hubungan ini boleh dikira dengan membina persamaan regresi atau fungsi regresi.

Model regresi asas ialah model regresi berpasangan (satu faktor). Regresi Berpasangan– persamaan sambungan dua pembolehubah di dan X:

di mana - pembolehubah bersandar (tanda hasil);

– bebas, pembolehubah penjelasan (atribut faktor).

Bergantung kepada sifat perubahan di dengan perubahan X membezakan antara regresi linear dan bukan linear.

Regresi Linear

Fungsi regresi ini dipanggil polinomial darjah pertama dan digunakan untuk menerangkan proses yang berkembang secara seragam dalam masa.

Mempunyai ahli rawak (ralat regresi) dikaitkan dengan kesan ke atas pembolehubah bersandar faktor lain yang tidak diambil kira dalam persamaan, dengan kemungkinan ketidaklinearan model, ralat pengukuran, oleh itu, penampilan persamaan ralat rawak regresi mungkin disebabkan oleh objektif berikut sebab:

1) bukan kewakilan sampel. Model regresi berpasangan termasuk faktor yang tidak dapat menjelaskan sepenuhnya variasi dalam pembolehubah hasil, yang mungkin dipengaruhi oleh banyak faktor lain (pembolehubah hilang) pada tahap yang lebih besar. Pekerjaan, gaji mungkin bergantung, sebagai tambahan kepada kelayakan, pada tahap pendidikan, pengalaman kerja, jantina, dsb.;

2) terdapat kemungkinan pembolehubah yang terlibat dalam model mungkin diukur dalam kesilapan. Sebagai contoh, data tentang perbelanjaan makanan keluarga disusun daripada rekod peserta tinjauan, yang dijangka merekodkan perbelanjaan harian mereka dengan teliti. Sudah tentu, ini boleh membawa kepada kesilapan.

Berdasarkan pemerhatian sampel, persamaan regresi sampel dianggarkan ( garis regresi):

,

di mana
– anggaran parameter persamaan regresi (
).

Bentuk pergantungan analitikal antara pasangan ciri yang dikaji (fungsi regresi) ditentukan menggunakan perkara berikut kaedah:

    Berdasarkan analisis teori dan logik sifat fenomena yang dikaji, intipati sosio-ekonominya. Sebagai contoh, jika dikaji hubungan antara pendapatan penduduk dan saiz deposit penduduk di bank, maka jelaslah hubungan tersebut adalah secara langsung.

    Kaedah grafik apabila sifat perhubungan itu dinilai secara visual.

Kebergantungan ini boleh dilihat dengan jelas jika anda membina graf dengan memplot nilai atribut pada paksi-x X, dan pada paksi-y - nilai ciri di. Meletakkan pada graf mata yang sepadan dengan nilai X dan di, kita mendapatkan medan korelasi:

a) jika mata bertaburan secara rawak di seluruh medan, ini menunjukkan ketiadaan hubungan antara ciri-ciri ini;

b) jika titik tertumpu di sekitar paksi yang memanjang dari sudut kiri bawah ke kanan atas, maka terdapat hubungan langsung antara ciri;

c) jika titik tertumpu di sekeliling paksi yang berjalan dari sudut kiri atas ke kanan bawah, maka hubungan songsang antara tanda.

Jika pada medan korelasi kita menyambungkan titik dengan segmen garis, maka kita dapat garis putus dengan sedikit aliran menaik. Ini akan menjadi pautan empirikal atau garis regresi empirikal. Dengan penampilannya, seseorang boleh menilai bukan sahaja kehadiran, tetapi juga bentuk hubungan antara ciri yang dikaji.

Membina Persamaan Regresi Berpasangan

Pembinaan persamaan regresi dikurangkan untuk menganggar parameternya. Anggaran parameter ini boleh didapati dalam pelbagai cara. Salah satunya ialah kaedah kuasa dua terkecil (LSM). Intipati kaedah adalah seperti berikut. Setiap nilai sepadan dengan nilai empirikal (diperhatikan). . Dengan membina persamaan regresi, sebagai contoh, persamaan garis lurus, setiap nilai akan sepadan dengan nilai teori (dikira). . Nilai yang diperhatikan jangan terletak tepat pada garis regresi, i.e. tidak sepadan dengan . Perbezaan antara nilai sebenar dan dikira pembolehubah bersandar dipanggil baki:

LSM membolehkan anda mendapatkan anggaran parameter sedemikian, di mana jumlah sisihan kuasa dua nilai sebenar ciri berkesan di daripada teori , iaitu jumlah kuasa dua baki, minimum:

Untuk persamaan linear dan persamaan tak linear boleh dikurangkan kepada linear, sistem berikut diselesaikan berkenaan dengan a dan b:

di mana n- saiz sampel.

Menyelesaikan sistem persamaan, kita memperoleh nilai a dan b, yang membolehkan kita menulis persamaan regresi(persamaan regresi):

di mana ialah pembolehubah penjelasan (bebas);

–pembolehubah yang dijelaskan (bersandar);

Garis regresi melalui titik ( ,) dan persamaan dipenuhi:

Anda boleh menggunakan formula sedia yang mengikuti daripada sistem persamaan ini:

di mana - nilai purata ciri bergantung;

ialah nilai purata bagi ciri bebas;

ialah min aritmetik hasil darab ciri bersandar dan bebas;

ialah varians bagi ciri bebas;

ialah kovarians antara ciri bersandar dan bebas.

Kovarians sampel dua pembolehubah X, di dipanggil nilai purata hasil kali sisihan pembolehubah ini daripada caranya

Parameter b di X mempunyai hebat nilai praktikal dan dipanggil pekali regresi. Pekali regresi menunjukkan berapa banyak unit nilai berubah secara purata di X 1 unit ukurannya.

Tanda parameter b dalam persamaan regresi pasangan menunjukkan arah hubungan:

jika
, maka hubungan antara penunjuk yang dikaji adalah secara langsung, iaitu. dengan peningkatan sifat faktor X tanda terhasil bertambah di, dan begitu juga sebaliknya;

jika
, maka hubungan antara penunjuk yang dikaji adalah songsang, iaitu. dengan peningkatan tanda faktor X tanda berkesan di berkurangan dan sebaliknya.

Nilai parameter a dalam persamaan regresi pasangan dalam beberapa kes boleh ditafsirkan sebagai nilai awal ciri berkesan di. Tafsiran parameter ini a mungkin hanya jika nilai
mempunyai makna.

Selepas membina persamaan regresi, nilai yang diperhatikan y boleh dibayangkan sebagai:

Kekal , serta ralat , adalah pembolehubah rawak, tetapi mereka, berbeza dengan kesilapan , boleh diperhatikan. Selebihnya ialah bahagian pembolehubah bersandar y, yang tidak dapat dijelaskan oleh persamaan regresi.

Berdasarkan persamaan regresi, seseorang boleh mengira nilai teori X untuk sebarang nilai X.

Dalam analisis ekonomi, konsep keanjalan fungsi sering digunakan. Keanjalan fungsi
dikira sebagai perubahan relatif y kepada perubahan relatif x. Keanjalan menunjukkan betapa banyak perubahan fungsi
apabila pembolehubah bebas berubah sebanyak 1%.

Sejak keanjalan fungsi linear
tidak nilai tetap, tetapi bergantung kepada X, maka pekali keanjalan biasanya dikira sebagai indeks keanjalan purata.

Pekali keanjalan menunjukkan dengan berapa peratus nilai atribut berkesan akan berubah secara purata dalam agregat di apabila menukar tanda faktor X 1% daripada nilai puratanya:

di mana
– nilai purata pembolehubah X dan di dalam sampel.

Penilaian kualiti model regresi yang dibina

Kualiti model regresi– kecukupan model yang dibina kepada data awal (diperhatikan).

Untuk mengukur ketat sambungan, i.e. untuk mengukur seberapa hampir ia dengan fungsi, anda perlu menentukan varians yang mengukur sisihan di daripada di X dan mencirikan variasi baki disebabkan oleh faktor lain. Mereka mendasari penunjuk yang mencirikan kualiti model regresi.

Kualiti regresi berpasangan ditentukan menggunakan pencirian pekali

1) ketat sambungan - indeks korelasi, pekali korelasi linear berpasangan;

2) ralat anggaran;

3) kualiti persamaan regresi dan parameter individunya - ralat kuadrat min persamaan regresi secara keseluruhan dan parameter individunya.

Untuk persamaan regresi apa-apa jenis ditakrifkan indeks korelasi, yang mencirikan hanya ketat pergantungan korelasi, i.e. tahap penghampirannya kepada sambungan berfungsi:

,

di mana – varians faktorial (teori);

ialah jumlah varians.

Indeks korelasi mengambil nilai
, di mana,

jika

jika
ialah hubungan antara ciri X dan di berfungsi, lebih dekat hingga 1, semakin rapat hubungan antara sifat yang dikaji dipertimbangkan. Sekiranya
, maka hubungan itu boleh dianggap sebagai rapat

Varians yang diperlukan untuk mengira penunjuk keketatan sambungan dikira:

Jumlah varians, mengukur variasi biasa disebabkan oleh tindakan semua faktor:

Varians faktorial (teoretikal), mengukur variasi sifat yang terhasil di disebabkan oleh tindakan tanda faktor X:

Penyerakan sisa, yang mencirikan variasi sifat di disebabkan oleh semua faktor kecuali X(iaitu dengan yang dikecualikan X):

Kemudian, mengikut peraturan penambahan varians:

Kualiti bilik wap linear regresi boleh ditakrifkan juga menggunakan pekali korelasi linear berpasangan:

,

di mana
– kovarians pembolehubah X dan di;

– sisihan piawai bagi ciri bebas;

ialah sisihan piawai bagi ciri bergantung.

Pekali korelasi linear mencirikan keketatan dan arah hubungan antara ciri yang dikaji. Ia diukur dalam [-1; +1]:

jika
- maka hubungan antara tanda-tanda adalah langsung;

jika
- maka hubungan antara tanda adalah songsang;

jika
– maka tiada kaitan antara tanda-tanda itu;

jika
atau
- maka hubungan antara ciri adalah berfungsi, i.e. dicirikan oleh padanan sempurna antara X dan di. Lebih dekat hingga 1, semakin rapat hubungan antara sifat yang dikaji dipertimbangkan.

Jika indeks korelasi (pekali korelasi linear berpasangan) adalah kuasa dua, maka kita mendapat pekali penentuan.

Pekali penentuan- mewakili bahagian varians faktor dalam jumlah dan menunjukkan berapa peratus variasi atribut yang terhasil di dijelaskan oleh variasi sifat faktor X:

Ia tidak merangkumi semua variasi. di daripada sifat faktor X, tetapi hanya bahagian itu sahaja yang sepadan dengan persamaan regresi linear, i.e. menunjukkan graviti tertentu variasi sifat yang terhasil, secara linear berkaitan dengan variasi sifat faktor.

Nilai
- perkadaran variasi atribut yang terhasil, yang model regresi tidak dapat diambil kira.

Taburan mata dalam medan korelasi boleh menjadi sangat besar, dan persamaan regresi yang dikira boleh memberikan ralat yang besar dalam menganggar penunjuk yang dianalisis.

Ralat anggaran purata menunjukkan sisihan purata nilai yang dikira daripada yang sebenar:

Nilai maksimum yang dibenarkan ialah 12-15%.

Ralat piawai digunakan sebagai ukuran penyebaran pembolehubah bersandar di sekeliling garis regresi. Untuk keseluruhan set nilai yang diperhatikan, standard (rms) ralat persamaan regresi, iaitu sisihan piawai bagi nilai sebenar di relatif kepada nilai teori yang dikira oleh persamaan regresi di X .

,

di mana
ialah bilangan darjah kebebasan;

m ialah bilangan parameter persamaan regresi (untuk persamaan garis lurus m=2).

Anggarkan nilai purata ralat kuadratik anda boleh membandingkannya

a) dengan nilai purata ciri berkesan di;

b) dengan sisihan piawai ciri di:

jika
, maka penggunaan persamaan regresi ini adalah sesuai.

Dinilai secara berasingan standard (rms) ralat parameter persamaan dan indeks korelasi:

;
;
.

X- sisihan piawai X.

Menyemak kepentingan persamaan regresi dan penunjuk kekencangan sambungan

Agar model yang dibina dapat digunakan untuk pengiraan ekonomi selanjutnya, adalah tidak mencukupi untuk menyemak kualiti model yang dibina. Ia juga perlu untuk menyemak kepentingan (kepentingan) anggaran persamaan regresi dan penunjuk kedekatan sambungan yang diperoleh menggunakan kaedah kuasa dua terkecil, i.e. adalah perlu untuk memeriksa mereka untuk pematuhan dengan parameter sebenar perhubungan.

Ini disebabkan oleh fakta bahawa penunjuk yang dikira untuk populasi terhad mengekalkan unsur rawak yang wujud dalam nilai individu atribut. Oleh itu, ia hanya anggaran keteraturan statistik tertentu. Ia adalah perlu untuk menilai tahap ketepatan dan kepentingan (kebolehpercayaan, materialiti) parameter regresi. Di bawah kepentingan memahami kebarangkalian bahawa nilai parameter yang diperiksa tidak sama dengan sifar tidak termasuk nilai tanda bertentangan.

Ujian Kepentingan– menyemak andaian bahawa parameter berbeza daripada sifar.

Menilai Kepentingan Persamaan Regresi Berpasangan datang untuk menguji hipotesis tentang kepentingan persamaan regresi secara keseluruhan dan parameter individunya ( a, b), pekali penentuan pasangan atau indeks korelasi.

Dalam kes ini, perkara berikut boleh dikemukakan hipotesis utamaH 0 :

1)
– pekali regresi adalah tidak ketara dan persamaan regresi juga tidak ketara;

2)
– pekali penentuan pasangan adalah tidak signifikan dan persamaan regresi juga tidak signifikan.

Alternatif (atau terbalik) ialah hipotesis berikut:

1)
– pekali regresi berbeza dengan ketara daripada sifar, dan persamaan regresi yang dibina adalah signifikan;

2)
– pekali penentuan pasangan adalah berbeza secara signifikan daripada sifar dan persamaan regresi yang dibina adalah signifikan.

Menguji hipotesis tentang kepentingan persamaan regresi berpasangan

Untuk menguji hipotesis ketidaksignifikan statistik persamaan regresi secara keseluruhan dan pekali penentuan, kami menggunakan F-kriteria(Kriteria Fisher):

atau

di mana k 1 = m–1 ; k 2 = nm ialah bilangan darjah kebebasan;

n ialah bilangan unit penduduk;

m ialah bilangan parameter persamaan regresi;

– penyebaran faktor;

ialah varians baki.

Hipotesis diuji seperti berikut:

1) jika nilai sebenar (diperhatikan). F-kriteria lebih besar daripada nilai kritikal (jadual) kriteria ini
, kemudian dengan kebarangkalian
hipotesis utama tentang ketidaksignifikan persamaan regresi atau pekali penentuan pasangan ditolak, dan persamaan regresi diiktiraf sebagai signifikan;

2) jika nilai sebenar (pemerhatian) bagi kriteria F adalah kurang daripada nilai kritikal bagi kriteria ini
, kemudian dengan kebarangkalian (
) hipotesis utama tentang ketidaksignifikan persamaan regresi atau pekali penentuan pasangan diterima, dan persamaan regresi yang dibina diiktiraf sebagai tidak signifikan.

nilai kritikal F- kriteria ditemui mengikut jadual yang sepadan bergantung pada tahap keertian dan bilangan darjah kebebasan
.

Bilangan darjah kebebasan– penunjuk, yang ditakrifkan sebagai perbezaan antara saiz sampel ( n) dan bilangan parameter anggaran untuk sampel ini ( m). Untuk model regresi berpasangan, bilangan darjah kebebasan dikira sebagai
, kerana dua parameter dianggarkan daripada sampel (
).

Tahap keertian - nilai yang ditentukan
,

di mana ialah kebarangkalian keyakinan bahawa parameter yang dianggarkan berada dalam selang keyakinan. Biasanya 0.95 diambil. Dengan cara ini ialah kebarangkalian bahawa parameter anggaran tidak akan jatuh ke dalam selang keyakinan, bersamaan dengan 0.05 (5%) .

Kemudian, dalam kes menilai kepentingan persamaan regresi berpasangan, nilai kritikal bagi kriteria F dikira sebagai
:

.

Menguji hipotesis tentang kepentingan parameter persamaan regresi pasangan dan indeks korelasi

Apabila menyemak kepentingan parameter persamaan (andaian bahawa parameter berbeza daripada sifar), hipotesis utama dikemukakan tentang tidak pentingnya anggaran yang diperolehi (
. Sebagai alternatif (terbalik) hipotesis dikemukakan tentang kepentingan parameter persamaan (
).

Untuk menguji hipotesis yang dicadangkan, kami menggunakan t -kriteria (t-statistik) Pelajar. Nilai yang diperhatikan t-kriteria dibandingkan dengan nilai t-kriteria ditentukan oleh jadual taburan Pelajar (nilai kritikal). nilai kritikal t- kriteria
bergantung kepada dua parameter: aras keertian dan bilangan darjah kebebasan
.

Hipotesis yang dicadangkan diuji seperti berikut:

1) jika modulus nilai yang diperhatikan t-kriteria lebih besar daripada nilai kritikal t-kriteria, iaitu
, kemudian dengan kebarangkalian
hipotesis utama tentang tidak pentingnya parameter regresi ditolak, iaitu. parameter regresi tidak sama dengan 0;

2) jika modulus nilai yang diperhatikan t- kriteria adalah kurang daripada atau sama dengan nilai kritikal t-kriteria, iaitu
, kemudian dengan kebarangkalian
hipotesis utama tentang tidak pentingnya parameter regresi diterima, iaitu. parameter regresi hampir tidak berbeza daripada 0 atau sama dengan 0.

Penilaian kepentingan pekali regresi menggunakan ujian Pelajar dijalankan dengan membandingkan anggarannya dengan nilai ralat piawai:

;

Untuk menilai kepentingan statistik indeks (pekali linear) korelasi, ia juga digunakan t-Kriteria pelajar.

Semasa pengajian mereka, pelajar sering menghadapi pelbagai persamaan. Salah satu daripadanya - persamaan regresi - dipertimbangkan dalam artikel ini. Persamaan jenis ini digunakan secara khusus untuk menerangkan ciri-ciri hubungan antara parameter matematik. Jenis ini kesamaan digunakan dalam statistik dan ekonometrik.

Definisi regresi

Dalam matematik, regresi difahami sebagai kuantiti tertentu yang menggambarkan pergantungan nilai purata set data pada nilai kuantiti lain. Persamaan regresi menunjukkan, sebagai fungsi ciri tertentu, nilai purata ciri lain. Fungsi regresi mempunyai bentuk persamaan mudah y \u003d x, di mana y ialah pembolehubah bersandar, dan x ialah pembolehubah tidak bersandar (faktor ciri). Malah, regresi dinyatakan sebagai y = f (x).

Apakah jenis hubungan antara pembolehubah

Secara umum, dua jenis hubungan yang bertentangan dibezakan: korelasi dan regresi.

Yang pertama dicirikan oleh kesamaan pembolehubah bersyarat. AT kes ini tidak diketahui dengan pasti pembolehubah yang mana bergantung pada yang lain.

Jika tiada kesamaan antara pembolehubah dan syarat mengatakan pembolehubah mana yang menerangkan dan yang bergantung, maka kita boleh bercakap tentang kehadiran sambungan jenis kedua. Untuk membina persamaan regresi linear, adalah perlu untuk mengetahui jenis hubungan yang diperhatikan.

Jenis regresi

Sehingga kini, terdapat 7 jenis regresi yang berbeza: hiperbolik, linear, berbilang, bukan linear, berpasangan, songsang, linear logaritma.

Hiperbolik, linear dan logaritma

Persamaan regresi linear digunakan dalam statistik untuk menerangkan dengan jelas parameter persamaan. Ia kelihatan seperti y = c + m * x + E. Persamaan hiperbola mempunyai bentuk hiperbola sekata y \u003d c + m / x + E. Persamaan linear logaritma menyatakan hubungan menggunakan fungsi logaritma: Dalam y \u003d Dalam c + t * Dalam x + Dalam E.

Berbilang dan bukan linear

dua lagi jenis yang kompleks regresi adalah berbilang dan tidak linear. Persamaan regresi berganda dinyatakan oleh fungsi y \u003d f (x 1, x 2 ... x c) + E. Dalam keadaan ini, y ialah pembolehubah bersandar dan x ialah pembolehubah penjelasan. Pembolehubah E adalah stokastik dan termasuk pengaruh faktor lain dalam persamaan. Persamaan Tak Linear regresi agak tidak konsisten. Di satu pihak, berkenaan dengan penunjuk yang diambil kira, ia tidak linear, dan sebaliknya, dalam peranan menilai penunjuk, ia adalah linear.

Regresi Songsang dan Berpasangan

Songsang ialah sejenis fungsi yang perlu ditukar kepada pandangan linear. Dalam program aplikasi yang paling tradisional, ia mempunyai bentuk fungsi y \u003d 1 / c + m * x + E. Persamaan regresi berpasangan menunjukkan hubungan antara data sebagai fungsi y = f(x) + E. Sama seperti persamaan lain, y bergantung kepada x dan E ialah parameter stokastik.

Konsep korelasi

Ini adalah penunjuk yang menunjukkan kewujudan hubungan antara dua fenomena atau proses. Kekuatan hubungan dinyatakan sebagai pekali korelasi. Nilainya turun naik dalam selang [-1;+1]. Penunjuk negatif bercakap tentang kehadiran maklum balas, positif - tentang garis lurus. Jika pekali mengambil nilai yang sama dengan 0, maka tidak ada hubungan. Semakin dekat nilainya dengan 1 - semakin kuat hubungan antara parameter, semakin dekat dengan 0 - semakin lemah.

Kaedah

Kaedah parametrik korelasi boleh menganggarkan keketatan hubungan. Ia digunakan berdasarkan anggaran taburan untuk mengkaji parameter yang mematuhi undang-undang taburan normal.

Parameter persamaan regresi linear adalah perlu untuk mengenal pasti jenis pergantungan, fungsi persamaan regresi dan menilai penunjuk formula perhubungan yang dipilih. Medan korelasi digunakan sebagai kaedah untuk mengenal pasti hubungan. Untuk melakukan ini, semua data sedia ada mesti diwakili secara grafik. Dalam sistem koordinat dua dimensi segi empat tepat, semua data yang diketahui mesti diplot. Ini adalah bagaimana medan korelasi terbentuk. Nilai faktor penghuraian ditandakan di sepanjang absis, manakala nilai faktor bergantung ditandakan di sepanjang ordinat. Sekiranya terdapat hubungan fungsi antara parameter, ia berbaris dalam bentuk garis.

Jika pekali korelasi data tersebut kurang daripada 30%, kita boleh bercakap tentang ketiadaan sambungan yang hampir lengkap. Jika ia adalah antara 30% dan 70%, maka ini menunjukkan kehadiran pautan rapat sederhana. Penunjuk 100% adalah bukti sambungan berfungsi.

Persamaan regresi bukan linear, sama seperti persamaan linear, mesti ditambah dengan indeks korelasi (R).

Korelasi untuk Regresi Berganda

Pekali penentuan ialah penunjuk bagi segi empat sama pelbagai korelasi. Dia bercakap tentang ketatnya hubungan set penunjuk yang dibentangkan dengan sifat yang dikaji. Ia juga boleh bercakap tentang sifat pengaruh parameter pada hasilnya. Persamaan regresi berganda dinilai menggunakan penunjuk ini.

Untuk mengira indeks korelasi berganda, adalah perlu untuk mengira indeksnya.

Kaedah kuasa dua terkecil

Kaedah ini adalah cara untuk menganggar faktor regresi. Intipatinya terletak pada meminimumkan jumlah sisihan kuasa dua yang diperoleh kerana pergantungan faktor pada fungsi.

Persamaan regresi linear berpasangan boleh dianggarkan menggunakan kaedah sedemikian. Persamaan jenis ini digunakan dalam kes pengesanan antara penunjuk hubungan linear berpasangan.

Pilihan Persamaan

Setiap parameter fungsi regresi linear mempunyai makna tertentu. Persamaan regresi linear berpasangan mengandungi dua parameter: c dan m. Parameter t menunjukkan perubahan purata dalam penunjuk akhir fungsi y, tertakluk kepada penurunan (peningkatan) dalam pembolehubah x oleh satu unit konvensional. Jika pembolehubah x adalah sifar, maka fungsinya adalah sama dengan parameter c. Jika pembolehubah x bukan sifar, maka faktor c tidak dibawa pengertian ekonomi. Satu-satunya pengaruh pada fungsi ialah tanda di hadapan faktor c. Sekiranya terdapat tolak, maka kita boleh mengatakan tentang perubahan perlahan dalam keputusan berbanding dengan faktor. Sekiranya terdapat tambah, maka ini menunjukkan perubahan dipercepatkan dalam hasilnya.

Setiap parameter yang mengubah nilai persamaan regresi boleh dinyatakan dalam sebutan persamaan. Sebagai contoh, faktor c mempunyai bentuk c = y - mx.

Data berkumpulan

Terdapat keadaan masalah di mana semua maklumat dikumpulkan mengikut atribut x, tetapi pada masa yang sama untuk kumpulan tertentu nilai purata yang sepadan bagi penunjuk bergantung ditunjukkan. Dalam kes ini, nilai purata mencirikan bagaimana penunjuk bergantung pada x. Oleh itu, maklumat yang dikumpulkan membantu untuk mencari persamaan regresi. Ia digunakan sebagai analisis hubungan. Walau bagaimanapun, kaedah ini mempunyai kelemahannya. Malangnya, purata selalunya tertakluk kepada turun naik luaran. Turun naik ini bukan cerminan corak hubungan, ia hanya menutupi "bising"nya. Purata menunjukkan corak hubungan jauh lebih buruk daripada persamaan regresi linear. Walau bagaimanapun, ia boleh digunakan sebagai asas untuk mencari persamaan. Dengan mendarabkan saiz populasi tertentu dengan purata yang sepadan, anda boleh mendapatkan jumlah y dalam kumpulan itu. Seterusnya, anda perlu mengetuk keluar semua jumlah yang diterima dan mencari penunjuk akhir y. Ia adalah lebih sukar untuk membuat pengiraan dengan penunjuk jumlah xy. Sekiranya selang adalah kecil, kita boleh mengambil penunjuk x secara bersyarat untuk semua unit (dalam kumpulan) sama. Darabkannya dengan hasil tambah y untuk mencari hasil tambah bagi x dan y. Selanjutnya, semua jumlah disatukan dan ternyata jumlah keseluruhan hu.

Regresi Persamaan Pasangan Berganda: Menilai Kepentingan Perhubungan

Seperti yang dibincangkan sebelum ini, regresi berganda mempunyai fungsi dalam bentuk y \u003d f (x 1, x 2, ..., x m) + E. Selalunya, persamaan sedemikian digunakan untuk menyelesaikan masalah penawaran dan permintaan untuk barangan, pendapatan faedah ke atas saham yang dibeli semula, mengkaji punca dan jenis fungsi kos pengeluaran. Ia juga digunakan secara aktif dalam pelbagai jenis kajian dan pengiraan makroekonomi, tetapi pada peringkat mikroekonomi, persamaan ini digunakan agak kurang kerap.

Tugas utama regresi berganda adalah untuk membina model data yang mengandungi sejumlah besar maklumat untuk menentukan lebih lanjut apa yang mempengaruhi setiap faktor secara individu dan dalam keseluruhannya pada penunjuk yang akan dimodelkan dan pekalinya. Persamaan regresi boleh mengambil pelbagai nilai. Dalam kes ini, dua jenis fungsi biasanya digunakan untuk menilai hubungan: linear dan bukan linear.

Fungsi linear digambarkan dalam bentuk hubungan sedemikian: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Dalam kes ini, a2, a m , dianggap sebagai pekali regresi "tulen". Mereka adalah perlu untuk mencirikan perubahan purata dalam parameter y dengan perubahan (penurunan atau peningkatan) dalam setiap parameter x yang sepadan dengan satu unit, dengan keadaan nilai stabil penunjuk lain.

Persamaan tak linear mempunyai, sebagai contoh, bentuk fungsi kuasa y=ax 1 b1 x 2 b2 ...x m bm . Dalam kes ini, penunjuk b 1, b 2 ..... b m - dipanggil pekali keanjalan, mereka menunjukkan bagaimana hasilnya akan berubah (berapa banyak%) dengan peningkatan (penurunan) dalam penunjuk yang sepadan x sebanyak 1% dan dengan penunjuk stabil faktor lain.

Apakah faktor yang perlu dipertimbangkan semasa membina regresi berganda

Untuk membina regresi berganda dengan betul, adalah perlu untuk mengetahui faktor mana yang perlu diberi perhatian khusus.

Adalah perlu untuk mempunyai sedikit pemahaman tentang sifat hubungan antara faktor ekonomi dan dimodelkan. Faktor-faktor yang perlu disertakan mestilah memenuhi kriteria berikut:

  • Mesti boleh diukur. Untuk menggunakan faktor yang menggambarkan kualiti objek, dalam apa jua keadaan, ia harus diberikan bentuk kuantitatif.
  • Seharusnya tiada faktor saling korelasi, atau hubungan fungsi. Tindakan sedemikian paling kerap membawa kepada akibat yang tidak dapat dipulihkan - sistem persamaan biasa menjadi tidak bersyarat, dan ini melibatkan penilaian yang tidak boleh dipercayai dan kabur.
  • Dalam kes kewujudan indeks korelasi yang besar, tidak ada cara untuk mengetahui pengaruh terpencil faktor pada keputusan akhir penunjuk, oleh itu, pekali menjadi tidak dapat ditafsirkan.

Kaedah Pembinaan

wujud jumlah yang besar kaedah dan teknik yang menerangkan bagaimana anda boleh memilih faktor untuk persamaan. Walau bagaimanapun, semua kaedah ini adalah berdasarkan pemilihan pekali menggunakan indeks korelasi. Antaranya ialah:

  • Kaedah pengecualian.
  • Hidupkan kaedah.
  • Analisis regresi berperingkat.

Kaedah pertama melibatkan menapis semua pekali daripada set agregat. Kaedah kedua melibatkan memperkenalkan satu set faktor tambahan. Nah, yang ketiga ialah penghapusan faktor-faktor yang sebelum ini digunakan untuk persamaan. Setiap kaedah ini mempunyai hak untuk wujud. Mereka mempunyai kebaikan dan keburukan mereka, tetapi mereka boleh menyelesaikan isu menapis penunjuk yang tidak perlu dengan cara mereka sendiri. Sebagai peraturan, keputusan yang diperolehi oleh setiap kaedah berasingan cukup dekat.

Kaedah analisis multivariate

Kaedah sedemikian untuk menentukan faktor adalah berdasarkan pertimbangan gabungan individu ciri yang saling berkaitan. Ini termasuk analisis diskriminasi, pengecaman corak, analisis komponen utama dan analisis kelompok. Di samping itu, terdapat juga analisis faktor, bagaimanapun, ia muncul sebagai hasil daripada pembangunan kaedah komponen. Kesemuanya digunakan dalam keadaan tertentu, di bawah syarat dan faktor tertentu.

x - dipanggil peramal - pembolehubah bebas atau penjelasan.

Untuk kuantiti x tertentu, Y ialah nilai pembolehubah y (dipanggil pembolehubah bersandar, keluaran atau tindak balas) yang terletak pada garis anggaran. Ini ialah nilai yang kita jangkakan untuk y (secara purata) jika kita mengetahui nilai x, dan ini dipanggil "nilai ramalan y" (Rajah 5).

a - ahli bebas (melintasi) garisan penilaian; ialah nilai Y apabila x = 0.

b- cerun atau kecerunan garis anggaran; ia mewakili jumlah yang Y meningkat secara purata jika kita meningkatkan x sebanyak satu unit (Rajah 5). Pekali b dipanggil pekali regresi.

Sebagai contoh: dengan peningkatan suhu badan manusia sebanyak 1 ° C, kadar nadi meningkat dengan purata 10 denyutan seminit.

Rajah 5. Garis regresi linear yang menunjukkan pekali a dan cerun b(meningkatkan nilai Y dengan peningkatan X seunit)

Secara matematik, penyelesaian persamaan regresi linear dikurangkan untuk mengira parameter a dan b sedemikian rupa sehingga titik-titik data awal medan korelasi sedekat mungkin dengan regresi langsung .

Penggunaan statistik perkataan "regresi" berasal daripada fenomena yang dikenali sebagai regresi kepada min, dikaitkan dengan Francis Galton (1889). Dia menunjukkan bahawa walaupun bapa yang tinggi cenderung mempunyai anak lelaki yang tinggi, purata ketinggian anak lelaki adalah lebih kecil daripada bapa mereka yang tinggi. Purata ketinggian anak lelaki "berundur" atau "terbalik" ke arah ketinggian purata semua bapa dalam populasi. Oleh itu, secara purata, bapa yang tinggi mempunyai anak lelaki yang lebih pendek (tetapi masih tinggi), dan bapa yang pendek mempunyai anak lelaki yang lebih tinggi (tetapi masih agak pendek).

Kami melihat regresi min dalam saringan dan ujian klinikal di mana subkumpulan pesakit boleh dipilih untuk rawatan kerana tahap pembolehubah tertentu mereka, katakan kolesterol, adalah sangat tinggi (atau rendah). Jika ukuran ini diulang dari semasa ke semasa, min subkumpulan bacaan kedua biasanya kurang daripada bacaan pertama, cenderung (iaitu, mundur) ke arah min padanan umur dan jantina dalam populasi, tanpa mengira rawatan yang mungkin mereka terima. . Pesakit direkrut ke dalam percubaan klinikal berdasarkan tahap tinggi Oleh itu, paras kolesterol pada lawatan pertama mereka, mungkin menunjukkan penurunan purata paras kolesterol pada lawatan kedua mereka, walaupun mereka tidak dirawat dalam tempoh tersebut.

Selalunya kaedah analisis regresi digunakan untuk membangunkan skala normatif dan piawaian pembangunan fizikal.


Sejauh mana garis regresi sesuai dengan data boleh dinilai dengan mengira pekali R (biasanya dinyatakan sebagai peratusan dan dipanggil pekali penentuan), yang sama dengan kuasa dua pekali korelasi (r 2). Ia mewakili bahagian atau peratusan varians y yang boleh dijelaskan oleh hubungan dengan x, i.e. perkadaran variasi hasil-sifat yang telah berkembang di bawah pengaruh sifat bebas. Ia boleh mengambil nilai dalam julat dari 0 hingga 1, atau, masing-masing, dari 0 hingga 100%. Perbezaan (100% - R) ialah peratusan varians dalam y yang tidak dapat dijelaskan oleh interaksi ini.

Contoh

Hubungan antara ketinggian (diukur dalam cm) dan tekanan darah sistolik (SBP, diukur dalam mmHg) pada kanak-kanak. Kami melakukan analisis regresi linear berpasangan bagi SBP berbanding ketinggian (Rajah 6). Terdapat hubungan linear yang signifikan antara ketinggian dan SBP.

Rajah 6. Graf dua dimensi yang menunjukkan hubungan antara tekanan darah sistolik dan ketinggian. Ditunjukkan ialah anggaran garis regresi, tekanan darah sistolik.

Anggaran persamaan garis regresi adalah seperti berikut:

TAMAN \u003d 46.28 + 0.48 x tinggi.

Dalam contoh ini, pintasan tidak menarik (peningkatan sifar jelas di luar julat yang diperhatikan dalam kajian). Walau bagaimanapun, kita boleh mentafsir cerun; SBP diramalkan meningkat secara purata 0.48 mm Hg pada kanak-kanak ini. dengan peningkatan ketinggian sebanyak satu sentimeter

Kita boleh menggunakan persamaan regresi untuk meramalkan SBP yang kita jangkakan pada kanak-kanak pada ketinggian tertentu. Sebagai contoh, kanak-kanak berketinggian 115 cm mempunyai ramalan SBP sebanyak 46.28 + (0.48 x 115) = 101.48 mm Hg. Art., Kanak-kanak dengan ketinggian 130 mempunyai SBP yang diramalkan, 46.28 + (0.48 x 130) = 108.68 mm Hg. Seni.

Apabila mengira pekali korelasi, didapati ia adalah sama dengan 0.55, yang menunjukkan korelasi langsung kekuatan sederhana. Dalam kes ini, pekali penentuan r 2 \u003d 0.55 2 \u003d 0.3. Oleh itu, kita boleh mengatakan bahawa bahagian pengaruh pertumbuhan pada tahap tekanan darah pada kanak-kanak tidak melebihi 30%, masing-masing, 70% pengaruh jatuh pada bahagian faktor lain.

Regresi linear (mudah) terhad untuk mempertimbangkan hubungan antara pembolehubah bersandar dan hanya satu pembolehubah tidak bersandar. Jika terdapat lebih daripada satu pembolehubah bebas dalam hubungan, maka kita perlu beralih kepada regresi berganda. Persamaan untuk regresi sedemikian kelihatan seperti ini:

y = a + bx 1 + b 2 x 2 +.... + b n x n

Seseorang mungkin berminat dengan hasil pengaruh beberapa pembolehubah tidak bersandar x 1 , x 2 , .., x n pada pembolehubah bergerak balas y. Jika kita berpendapat bahawa x ini boleh saling bergantung, maka kita tidak boleh melihat secara berasingan pada kesan perubahan nilai satu x dengan y, tetapi pada masa yang sama mesti mengambil kira nilai semua x lain.

Contoh

Oleh kerana terdapat hubungan yang kuat antara ketinggian dan berat badan kanak-kanak, seseorang mungkin tertanya-tanya jika hubungan antara ketinggian dan tekanan darah sistolik juga berubah apabila berat badan dan jantina kanak-kanak itu juga diambil kira. Regresi linear berganda mengkaji kesan gabungan berbilang pembolehubah bebas ini pada y.

Persamaan regresi berganda dalam kes ini boleh kelihatan seperti ini:

GARDEN \u003d 79.44 - (0.03 x tinggi) + (1.18 x berat) + (4.23 x jantina) *

* - (untuk jantina, nilai 0 - lelaki, 1 - perempuan)

Mengikut persamaan ini, seorang gadis yang tingginya 115 cm dan berat 37 kg akan mempunyai SBP yang diramalkan:

GARDEN \u003d 79.44 - (0.03 x 115) + (1.18 x 37) + (4.23 x 1) \u003d 123.88 mm Hg.

Regresi logistik sangat serupa dengan regresi linear; ia digunakan apabila terdapat hasil binari yang diminati (iaitu kehadiran/ketiadaan gejala atau subjek yang mempunyai/tidak mempunyai penyakit) dan satu set peramal. Daripada persamaan regresi logistik, adalah mungkin untuk menentukan peramal yang mempengaruhi keputusan dan, menggunakan nilai peramal pesakit, menganggarkan kemungkinan dia akan mendapat hasil tertentu. Contohnya: komplikasi akan timbul atau tidak, rawatan akan berkesan atau tidak.

Mula mencipta pembolehubah binari untuk mewakili dua hasil (cth "mempunyai penyakit" = 1, "tidak mempunyai penyakit" = 0). Walau bagaimanapun, kita tidak boleh menggunakan kedua-dua nilai ini sebagai pembolehubah bersandar dalam analisis regresi linear kerana andaian normaliti dilanggar dan kita tidak boleh mentafsir nilai ramalan yang bukan sifar atau satu.

Malah, sebaliknya, kami mengambil kebarangkalian bahawa subjek itu diklasifikasikan ke dalam kategori terdekat (iaitu "mempunyai penyakit") bagi pembolehubah bersandar, dan untuk mengatasi kesukaran matematik, kami menggunakan transformasi logistik dalam persamaan regresi - logaritma semula jadi nisbah kebarangkalian "penyakit" (p) kepada kebarangkalian "tiada penyakit" (1-p).

Proses integratif yang dipanggil kaedah kemungkinan maksimum, dan bukannya regresi biasa (kerana kita tidak boleh menggunakan prosedur regresi linear) mencipta anggaran persamaan regresi logistik daripada data sampel

logit(p) = a + bx 1 + b 2 x 2 +.... + b n x n

logit (p) ialah anggaran nilai kebarangkalian sebenar bahawa pesakit dengan set nilai individu untuk x 1 ... x n mempunyai penyakit;

a - penilaian pemalar (jangka bebas, persimpangan);

b 1 , b 2 ,... ,b n — anggaran pekali regresi logistik.

1. Soalan mengenai topik pelajaran:

1. Berikan definisi fungsi dan perkaitan.

2. Berikan contoh korelasi langsung dan songsang.

3. Nyatakan saiz pekali korelasi untuk lemah, sederhana dan sambungan yang kuat antara tanda.

4. Dalam kes apakah ia terpakai kaedah pangkat mengira pekali korelasi?

5. Dalam kes apakah pengiraan pekali korelasi Pearson digunakan?

6. Apakah langkah utama dalam mengira pekali korelasi dengan kaedah pangkat?

7. Takrifkan "regresi". Apakah intipati kaedah regresi?

8. Huraikan formula bagi persamaan regresi linear mudah.

9. Tentukan pekali regresi.

10. Apakah kesimpulan yang boleh dibuat jika pekali regresi berat bagi ketinggian ialah 0.26 kg/cm?

11. Apakah formula persamaan regresi digunakan?

12. Apakah pekali penentuan?

13. Dalam kes apakah persamaan regresi berganda digunakan.

14. Apakah kaedah regresi logistik digunakan?

Kementerian Pendidikan dan Sains Persekutuan Rusia

Agensi Pendidikan Persekutuan

negeri institusi pendidikan pendidikan profesional yang lebih tinggi

Institut Persuratan Semua-Russian Kewangan dan Ekonomi

Cawangan di Tula

Ujian

dalam disiplin "Ekonometrik"

Tula - 2010

Tugasan 2 (a, b)

Bagi perusahaan industri ringan, maklumat diperolehi yang mencirikan pergantungan volum keluaran (Y, juta rubel) pada jumlah pelaburan modal (X, juta rubel) Jadual. satu.

X 33 17 23 17 36 25 39 20 13 12
Y 43 27 32 29 45 35 47 32 22 24

Diperlukan:

1. Cari parameter persamaan regresi linear, berikan tafsiran ekonomi bagi pekali regresi.

2. Kira baki; cari jumlah baki segi empat sama; menganggarkan varians baki

; plot baki.

3. Semak pemenuhan prasyarat LSM.

4. Semak kepentingan parameter persamaan regresi menggunakan ujian-t Pelajar (α=0.05).

5. Kira pekali penentuan, semak kepentingan persamaan regresi menggunakan ujian-F Fisher (α=0.05), cari purata ralat penghampiran relatif. Buat pertimbangan tentang kualiti model.

6. Ramalkan nilai purata penunjuk Y pada aras keertian α=0.1, jika nilai ramalan faktor X ialah 80% daripada nilai maksimumnya.

7. Bentangkan secara grafik: nilai sebenar dan model Y, mata ramalan.

8. Susun persamaan regresi bukan linear:

hiperbola;

kuasa;

indikatif.

Berikan graf bagi persamaan regresi yang dibina.

9. Bagi model ini, cari pekali penentuan dan purata kesilapan relatif anggaran. Bandingkan model mengikut ciri-ciri ini dan buat kesimpulan.

1. Model linear kelihatan seperti:

Parameter persamaan regresi linear boleh didapati menggunakan formula

Pengiraan nilai parameter dibentangkan dalam Jadual. 2.

t y x yx
1 43 33 1419 1089 42,236 0,764 0,584 90,25 88,36 0,018
2 27 17 459 289 27,692 -0,692 0,479 42,25 43,56 0,026
3 32 23 736 529 33,146 -1,146 1,313 0,25 2,56 0,036
4 29 17 493 289 27,692 1,308 1,711 42,25 21,16 0,045
5 45 36 1620 1296 44,963 0,037 0,001 156,25 129,96 0,001
6 35 25 875 625 34,964 0,036 0,001 2,25 1,96 0,001
7 47 39 1833 1521 47,69 -0,69 0,476 240,25 179,56 0,015
8 32 20 640 400 30,419 1,581 2,500 12,25 2,56 0,049
9 22 13 286 169 24,056 -2,056 4,227 110,25 134,56 0,093
10 24 12 288 144 23,147 0,853 0,728 132,25 92,16 0,036
336 235 8649 6351 12,020 828,5 696,4 0,32
Purata 33,6 23,5 864,9 635,1

Mari kita tentukan parameter model linear

Model linear mempunyai bentuk

Pekali regresi

menunjukkan bahawa output Y meningkat dengan purata 0.909 juta rubel. dengan peningkatan dalam jumlah pelaburan modal X sebanyak 1 juta rubel.

2. Kira bakinya

, jumlah baki kuasa dua, kita dapati serakan sisa mengikut formula:

Pengiraan dibentangkan dalam jadual. 2.


nasi. 1. Graf baki ε.

3. Mari kita semak pemenuhan prasyarat LSM berdasarkan kriteria Durbin-Watson.

0,584
2,120 0,479
0,206 1,313
6,022 1,711
1,615 0,001
0,000 0,001
0,527 0,476
5,157 2,500
13,228 4,227
2,462 0,728
31,337 12,020

d1=0.88; d2=1.32 untuk α=0.05, n=10, k=1.

,

Ini bermakna bahawa beberapa baki tidak berkorelasi.

4. Mari kita semak kepentingan parameter persamaan berdasarkan ujian-t Pelajar. (α=0.05).

untuk v=8; α=0.05.

Pengiraan Nilai

dihasilkan dalam Jadual. 2. Kami mendapat:
, maka kita boleh membuat kesimpulan bahawa pekali regresi a dan b adalah signifikan dengan kebarangkalian 0.95.

5. Cari pekali korelasi menggunakan formula

Pengiraan akan dibuat dalam jadual. 2.

. Itu. hubungan antara volum pelaburan X dan output Y boleh dianggap rapat, kerana .

Pekali penentuan didapati oleh formula