Biografi Ciri-ciri Analisis

Ujian kebaikan-kesesuaian Pearson χ2 (Chi-square). Ujian kesesuaian digunakan untuk menguji hipotesis statistik

hipotesis statistik. Kriteria Persetujuan.

batal(asas) panggil hipotesis yang dikemukakan tentang bentuk taburan yang tidak diketahui, atau tentang parameter taburan yang diketahui. bertanding (alternatif) dipanggil hipotesis yang bercanggah dengan nol.

Sebagai contoh, jika hipotesis nol adalah untuk menganggap bahawa pembolehubah rawak X diedarkan mengikut undang - undang , maka hipotesis bersaing mungkin terdiri dalam andaian bahawa pembolehubah rawak X diedarkan mengikut undang-undang yang berbeza.

Kriteria statistik(atau hanya kriteria) dipanggil beberapa pembolehubah rawak Kepada, yang berfungsi untuk menguji hipotesis nol.

Selepas memilih kriteria tertentu, contohnya kriteria , set semua nilai yang mungkin dibahagikan kepada dua subset tidak bertindih: satu daripadanya mengandungi nilai kriteria di mana hipotesis nol ditolak, dan satu lagi - di bawah yang ia diterima.

Kawasan kritikal ialah set nilai ujian yang mana hipotesis nol ditolak. Kawasan penerimaan hipotesis dipanggil set nilai kriteria di mana hipotesis diterima. titik kritikal titik yang memisahkan kawasan kritikal dari kawasan penerimaan hipotesis nol dipanggil.

Untuk contoh kami, dengan nilai , nilai yang dikira daripada sampel sepadan dengan kawasan penerimaan hipotesis: pembolehubah rawak diedarkan mengikut undang-undang. Jika nilai yang dikira , maka ia jatuh ke dalam kawasan kritikal, iaitu, hipotesis tentang taburan pembolehubah rawak mengikut undang-undang ditolak.

Dalam kes pengagihan, kawasan kritikal ditentukan oleh ketaksamaan, kawasan penerimaan hipotesis nol ditentukan oleh ketaksamaan.

2.6.3. Kriteria Kebaikan Pearson.

Salah satu tugas zootechnics dan genetik veterinar ialah pembiakan baka dan spesies baru dengan ciri-ciri yang diperlukan. Contohnya, peningkatan imuniti, rintangan penyakit, atau perubahan warna bulu.

Dalam amalan, apabila menganalisis keputusan, selalunya ternyata hasil sebenar lebih kurang sesuai dengan beberapa undang-undang pengedaran teori. Terdapat keperluan untuk menilai tahap kesesuaian antara data sebenar (empirikal) dan teori (hipotesis). Untuk melakukan ini, mengemukakan hipotesis nol: populasi yang terhasil diedarkan mengikut undang-undang "A". Pengesahan hipotesis mengenai undang-undang pengedaran yang dicadangkan dijalankan menggunakan pembolehubah rawak yang dipilih khas - kriteria kebaikan-kesesuaian.

Kriteria konkordans dipanggil kriteria untuk menguji hipotesis undang-undang yang didakwa bagi pengedaran yang tidak diketahui.

Terdapat beberapa kriteria kebaikan: Pearson, Kolmogorov, Smirnov, dll. Ujian kebaikan-kesesuaian Pearson adalah yang paling biasa digunakan.

Pertimbangkan penggunaan kriteria Pearson pada contoh menguji hipotesis hukum normal taburan populasi umum. Untuk tujuan ini, kita akan membandingkan frekuensi empirikal dan teori (dikira dalam kesinambungan taburan normal).

Biasanya terdapat beberapa perbezaan antara frekuensi teori dan empirikal. Sebagai contoh:

Kekerapan empirikal 7 15 41 93 113 84 25 13 5

Kekerapan teori 5 13 36 89 114 91 29 14 6

Pertimbangkan dua kes:

Percanggahan antara frekuensi teori dan empirikal adalah rawak (tidak signifikan), i.e. adalah mungkin untuk membuat cadangan tentang taburan frekuensi empirikal mengikut undang-undang biasa;

Percanggahan antara frekuensi teori dan empirikal adalah tidak sengaja (signifikan), i.e. frekuensi teori dikira berdasarkan hipotesis yang salah tentang taburan normal populasi umum.

Dengan bantuan kriteria kebaikan-kesesuaian Pearson, adalah mungkin untuk menentukan secara kebetulan atau tidak percanggahan antara frekuensi teori dan empirikal, i.e. dengan kebarangkalian keyakinan yang diberikan untuk menentukan sama ada populasi umum diagihkan mengikut undang-undang biasa atau tidak.

Jadi, biarkan taburan empirikal diperoleh untuk sampel saiz n:

Pilihan……

Frekuensi empirikal…….

Mari kita andaikan bahawa, di bawah andaian taburan normal, frekuensi teori dikira. Pada tahap keertian, ia diperlukan untuk menguji hipotesis nol: populasi taburan normal.

Sebagai kriteria untuk menguji hipotesis nol, kami mengambil pembolehubah rawak

(*)

Nilai ini adalah rawak, kerana dalam eksperimen yang berbeza ia mengambil nilai yang berbeza, yang sebelum ini tidak diketahui. Adalah jelas bahawa semakin kurang frekuensi empirikal dan teoritis berbeza, semakin kecil nilai kriteria dan, oleh itu, ia mencirikan pada tahap tertentu keakraban taburan empirikal dan teori.

Dibuktikan bahawa pada , undang-undang taburan pembolehubah rawak (*), tanpa mengira undang-undang taburan mana yang tertakluk kepada populasi umum, cenderung kepada undang-undang taburan dengan darjah kebebasan. Oleh itu, pembolehubah rawak (*) dilambangkan dengan , dan kriteria itu sendiri dipanggil ujian kebaikkan "khi kuasa dua".

Mari kita nyatakan nilai kriteria yang dikira daripada data pemerhatian sebagai . Nilai kritikal yang dijadualkan bagi kriteria untuk tahap kepentingan tertentu dan bilangan darjah kebebasan menandakan . Dalam kes ini, bilangan darjah kebebasan ditentukan daripada kesamaan , di mana bilangan kumpulan (selang separa) sampel atau kelas; - bilangan parameter pengedaran yang dicadangkan. Taburan normal mempunyai dua parameter - jangkaan matematik dan sisihan piawai. Oleh itu, bilangan darjah kebebasan untuk taburan normal didapati daripada kesamaan

Jika nilai yang dikira dan nilai jadual memenuhi ketaksamaan , hipotesis nol tentang taburan normal populasi umum diterima. Jika , hipotesis nol ditolak dan hipotesis alternatif untuknya diterima (populasi umum tidak diagihkan mengikut undang-undang biasa).

Komen. Apabila menggunakan ujian kesesuaian Pearson, saiz sampel mestilah sekurang-kurangnya 30. Setiap kumpulan mesti mengandungi sekurang-kurangnya 5 pilihan. Jika terdapat kurang daripada 5 frekuensi dalam kumpulan, ia digabungkan dengan kumpulan jiran.

Secara umum, bilangan darjah kebebasan untuk taburan khi kuasa dua ditakrifkan sebagai jumlah bilangan nilai yang mana ukuran yang sepadan dikira, tolak bilangan keadaan yang menghubungkan nilai ini, i.e. mengurangkan kemungkinan variasi antara mereka. Dalam kes paling mudah, apabila mengira, bilangan darjah kebebasan akan sama dengan bilangan kelas, dikurangkan dengan satu. Jadi, sebagai contoh, dengan pemisahan dihibrid, 4 kelas diperolehi, tetapi hanya kelas pertama yang diperoleh tidak berkaitan, yang berikutnya sudah dikaitkan dengan yang sebelumnya. Oleh itu, untuk pemisahan dihibrid, bilangan darjah kebebasan ialah .



Contoh 1 Tentukan tahap kesesuaian antara taburan sebenar kumpulan dari segi bilangan lembu dengan batuk kering dan yang dijangka secara teori, yang dikira apabila mempertimbangkan taburan normal. Data awal diringkaskan dalam jadual:

Keputusan.

Dengan tahap keertian dan bilangan darjah kebebasan daripada jadual titik taburan kritikal (lihat Lampiran 4), kita dapati nilai . Kerana ia , kita boleh membuat kesimpulan bahawa perbezaan antara frekuensi teori dan sebenar adalah rawak. Oleh itu, taburan sebenar kumpulan mengikut bilangan lembu yang menghidap batuk kering sepadan dengan jangkaan secara teori.

Contoh 2 Taburan teori mengikut fenotip individu yang diperolehi dalam generasi kedua oleh persilangan dihibrid arnab mengikut hukum Mendel ialah 9: 3: 3: 1. Ia diperlukan untuk mengira korespondensi taburan empirikal arnab daripada menyeberang individu hitam dengan rambut normal dengan haiwan berbulu halus - albino. Apabila menyilang pada generasi kedua, 120 ekor anak telah diperolehi, termasuk 45 ekor hitam berambut pendek, 30 berbulu hitam, 25 berbulu pendek, 20 arnab berbulu putih.

Keputusan. Pengasingan yang dijangka secara teori dalam anak harus sepadan dengan nisbah empat fenotip (9:3:3:1). Kira frekuensi teori (bilangan matlamat) untuk setiap kelas:

9+3+3+1=16, jadi kita boleh jangkakan rambut pendek hitam ; berbulu hitam - ; rambut pendek putih ; berbulu putih -.

Taburan fenotip empirikal (sebenar) adalah seperti berikut 45; tiga puluh; 25; 20.

Mari kita ringkaskan semua data ini dalam jadual berikut:

Menggunakan ujian kebaikan-kesesuaian Pearson, kami mengira nilai:

Bilangan darjah kebebasan dalam rentas dihibrid. Untuk tahap keertian cari nilai . Kerana ia , kita boleh menyimpulkan bahawa perbezaan antara frekuensi teori dan sebenar adalah tidak sengaja. Akibatnya, kumpulan arnab yang terhasil menyimpang dari segi taburan fenotip daripada hukum Mendel semasa persilangan dihibrid dan mencerminkan pengaruh faktor tertentu yang mengubah jenis pembelahan dalam fenotip dalam generasi kedua hibrid.

Ujian kebaikan-kesesuaian khi kuasa dua Pearson juga boleh digunakan untuk membandingkan dua taburan empirikal homogen antara satu sama lain, iaitu. mereka yang mempunyai sempadan kelas yang sama. Hipotesis nol ialah hipotesis bahawa dua fungsi taburan yang tidak diketahui adalah sama. Ujian khi kuasa dua dalam kes sedemikian ditentukan oleh formula

(**)

di mana dan adalah jumlah taburan yang dibandingkan; dan ialah frekuensi bagi kelas yang sepadan.

Pertimbangkan perbandingan dua taburan empirikal menggunakan contoh berikut.

Contoh 3 Panjang telur cuckoo diukur dalam dua zon wilayah. Dalam zon pertama, sampel 76 telur () telah diperiksa, dalam yang kedua daripada 54 (). Keputusan berikut diperoleh:

Panjang (mm)
Kekerapan
Kekerapan - - -

Pada tahap keertian, perlu menguji hipotesis nol bahawa kedua-dua sampel telur tergolong dalam populasi cuckoo yang sama.

KEMENTERIAN PENDIDIKAN DAN SAINS UKRAINE

INSTITUT PENGURUSAN WILAYAH AZOV

UNIVERSITI TEKNIKAL KEBANGSAAN ZAPORIZHIA

Jabatan Matematik

KERJA KURSUS

H disiplin "STATISTIK"

Mengenai topik: "KRITERIA PERSETUJUAN"

pelajar tahun 2

Kumpulan 207 Fakulti Pengurusan

Batura Tatyana Olegovna

penyelia

Profesor Madya Kosenkov O.I.

Berdyansk - 2009


PENGENALAN

1.2 Kebaikan kesesuaian χ 2 Pearson untuk hipotesis mudah

1.3 Kesesuaian untuk hipotesis kompleks

1.4 Ujian χ 2 kebaikan Fisher untuk hipotesis yang kompleks

1.5 Kriteria persetujuan lain. Kebaikan-sesuai untuk pengedaran Poisson

BAHAGIAN II. APLIKASI AMALI KRITERION PERSETUJUAN

APLIKASI

SENARAI LITERATUR TERGUNA


PENGENALAN

Kerja kursus ini menerangkan kriteria kesesuaian yang paling biasa - omega-square, chi-square, Kolmogorov dan Kolmogorov-Smirnov. Perhatian khusus diberikan kepada kes apabila perlu untuk memeriksa sama ada pengedaran data tergolong dalam beberapa keluarga parametrik, sebagai contoh, normal. Oleh kerana kerumitannya, keadaan ini, yang sangat biasa dalam amalan, belum dikaji sepenuhnya dan tidak dicerminkan sepenuhnya dalam literatur pendidikan dan rujukan.

Kriteria kesesuaian dipanggil ujian statistik yang direka untuk menguji persetujuan antara data eksperimen dan model teori. Soalan ini direka bentuk terbaik jika pemerhatian mewakili sampel rawak. Model teori dalam kes ini menerangkan undang-undang pengedaran.

Taburan teori ialah taburan kebarangkalian yang mengawal pemilihan rawak. Bukan teori sahaja boleh memberi idea mengenainya. Tradisi, pengalaman lalu, dan pemerhatian terdahulu boleh menjadi sumber pengetahuan di sini. Kami hanya perlu menekankan bahawa pengedaran ini mesti dipilih tanpa mengira data yang akan kami periksa. Dalam erti kata lain, adalah tidak boleh diterima untuk mula-mula "memastikan" undang-undang pengedaran tertentu pada sampel, dan kemudian cuba menyemak perjanjian dengan undang-undang yang diperoleh untuk sampel yang sama.

Hipotesis mudah dan kompleks. Bercakap tentang undang-undang teori pengedaran, yang unsur-unsur sampel tertentu harus mengikut hipotesis, kita mesti membezakan antara hipotesis mudah dan kompleks tentang undang-undang ini:

Hipotesis mudah secara langsung menunjukkan undang-undang tertentu kebarangkalian (taburan kebarangkalian) mengikut mana nilai sampel timbul;

Hipotesis kompleks menunjukkan taburan tunggal, dan sebahagian daripadanya (contohnya, keluarga parametrik).

Kriteria kesesuaian adalah berdasarkan penggunaan pelbagai ukuran jarak antara taburan empirikal yang dianalisis dan fungsi taburan sesuatu ciri dalam populasi umum.

Ujian bukan parametrik perjanjian Kolmogorov, Smirnov, omega persegi digunakan secara meluas. Walau bagaimanapun, ia juga dikaitkan dengan ralat yang meluas dalam penggunaan kaedah statistik.

Hakikatnya ialah kriteria yang disenaraikan telah dibangunkan untuk menguji perjanjian dengan pengedaran teori yang diketahui sepenuhnya. Formula pengiraan, jadual taburan dan nilai kritikal digunakan secara meluas. Idea utama Kolmogorov, omega persegi dan kriteria yang serupa adalah untuk mengukur jarak antara fungsi taburan empirikal dan fungsi taburan teori. Kriteria ini berbeza dalam bentuk jarak dalam ruang fungsi pengedaran.

Memulakan kerja kursus ini, saya menetapkan matlamat untuk mengetahui apakah kriteria persetujuan yang wujud, untuk mengetahui mengapa ia diperlukan. Untuk mencapai matlamat ini, anda mesti menyelesaikan tugas berikut:

1. Untuk mendedahkan intipati konsep "kriteria persetujuan";

2. Tentukan kriteria persetujuan yang wujud, kaji secara berasingan;

3. Membuat kesimpulan tentang kerja yang dilakukan.


BAHAGIAN I. PENEGASAN TEORI KRITERION PERSETUJUAN

1.1 Kriteria kesesuaian Kolmogorov dan segi empat sama omega dalam kes hipotesis mudah

Hipotesis mudah. Pertimbangkan situasi di mana data yang diukur adalah nombor, dengan kata lain, pembolehubah rawak satu dimensi. Taburan pembolehubah rawak satu dimensi boleh diterangkan sepenuhnya dengan menyatakan fungsi taburannya. Dan banyak ujian kebaikan-kesesuaian adalah berdasarkan pada memeriksa keakraban fungsi pengedaran teori dan empirikal (sampel).

Katakan kita mempunyai sampel n. Mari kita nyatakan fungsi taburan sebenar, yang mana pemerhatian tertakluk, G(x), fungsi taburan empirikal (sampel) - F n (x), dan fungsi taburan hipotesis - F(x). Kemudian hipotesis H bahawa fungsi taburan sebenar ialah F(x) ditulis sebagai H: G(·) = F(·).

Bagaimana untuk menguji hipotesis H? Jika H adalah benar, maka F n dan F harus menunjukkan persamaan tertentu, dan perbezaan antara mereka akan berkurang apabila n bertambah. Disebabkan teorem Bernoulli, F n (x) → F(x) sebagai n → ∞. Pelbagai kaedah digunakan untuk mengukur kesamaan fungsi F n dan F.

Untuk menyatakan persamaan fungsi, satu atau satu lagi jarak antara fungsi ini boleh digunakan. Sebagai contoh, seseorang boleh membandingkan F n dan F dalam metrik seragam, i.e. pertimbangkan nilai:

(1.1)

Statistik D n dipanggil statistik Kolmogorov.

Jelas sekali, D n ialah pembolehubah rawak, kerana nilainya bergantung pada objek rawak F n . Jika hipotesis H 0 adalah benar dan n → ∞, maka F n (x) → F(x) bagi sebarang x. Oleh itu, adalah wajar bahawa di bawah keadaan ini D n → 0. Jika hipotesis H 0 adalah palsu, maka F n → G dan G ≠ F, dan oleh itu sup -∞

Seperti biasa apabila menguji hipotesis, kami membuat alasan seolah-olah hipotesis itu benar. Adalah jelas bahawa H 0 mesti ditolak jika nilai statistik D n yang diperolehi dalam eksperimen kelihatan luar biasa besar. Tetapi untuk ini anda perlu tahu bagaimana statistik D n diedarkan di bawah hipotesis H: F= G untuk diberi n dan G.

Sifat luar biasa D n ialah jika G = F, i.e. jika taburan hipotesis dinyatakan dengan betul, maka hukum taburan statistik D n ternyata sama untuk semua fungsi selanjar G. Ia hanya bergantung kepada saiz sampel n.

Bukti fakta ini adalah berdasarkan fakta bahawa statistik tidak mengubah nilainya di bawah transformasi monotonik paksi-x. Dengan penjelmaan sedemikian, sebarang taburan berterusan G boleh ditukar menjadi taburan seragam pada selang . Dalam kes ini, F n (x) akan masuk ke dalam fungsi taburan sampel daripada taburan seragam ini.

Untuk n kecil, untuk statistik D n di bawah hipotesis H 0, jadual mata peratusan disusun. Untuk n besar, taburan D n (di bawah hipotesis H 0) ditunjukkan oleh teorem had yang ditemui pada tahun 1933 oleh A.N. Kolmogorov. Dia bercakap tentang statistik

(memandangkan nilai itu sendiri D n → 0 pada H 0 , adalah perlu untuk mendarabkannya dengan nilai yang semakin meningkat tidak terhingga agar taburan menjadi stabil). Teorem Kolmogorov menyatakan bahawa jika H 0 adalah benar dan jika G adalah selanjar:
(1.2)

Jumlah ini sangat mudah untuk dikira dalam Maple. Untuk menguji hipotesis mudah H 0: G = F, ia diperlukan untuk mengira nilai statistik D n daripada sampel awal. Formula mudah berfungsi untuk ini.

Definisi 51. Kriteria yang memungkinkan untuk menilai sama ada nilai bersetuju X 1 , X 2 ,…, x n pembolehubah rawak X dengan hipotesis tentang fungsi taburannya dipanggil kriteria persetujuan.

Idea untuk menggunakan kriteria kebaikan-kesesuaian

Biarkan, berdasarkan bahan statistik ini, adalah perlu untuk menguji hipotesis H, yang terdiri daripada fakta bahawa SW X mematuhi beberapa undang-undang pengedaran yang pasti. Undang-undang ini boleh diberikan sama ada sebagai fungsi pengagihan F(x), atau dalam bentuk ketumpatan pengedaran f(x), atau dalam bentuk satu set kebarangkalian pi. Oleh kerana semua bentuk ini, fungsi pengedaran F(x) adalah yang paling umum (ia wujud untuk kedua-dua DSW dan NSW) dan menentukan mana-mana yang lain, kami akan merumuskan hipotesis H, sebagai terdiri daripada fakta bahawa kuantiti X mempunyai fungsi pengedaran F(x).

Untuk menerima atau menolak hipotesis H, pertimbangkan beberapa kuantiti U mencirikan tahap percanggahan (sisihan) taburan teori dan statistik. NilaiU boleh dipilih dalam pelbagai cara: 1) jumlah sisihan kuasa dua bagi kebarangkalian teori pi daripada frekuensi yang sepadan, 2) jumlah kuasa dua yang sama dengan beberapa pekali (berat), 3) sisihan maksimum fungsi taburan statistik (empirikal) daripada teori F(x).

Biarkan nilai U dipilih dalam satu cara atau yang lain. Jelas sekali, ini adalah beberapa pembolehubah rawak. undang-undang pengedaran U bergantung kepada hukum taburan pembolehubah rawak X, di mana eksperimen dijalankan, dan pada bilangan eksperimen n. Jika hipotesis H adalah benar, maka hukum taburan kuantiti U ditentukan oleh undang-undang taburan kuantiti X(fungsi F(x)) dan nombor n.

Mari kita anggap bahawa undang-undang pengagihan ini diketahui. Hasil daripada siri eksperimen ini, didapati bahawa ukuran percanggahan yang dipilih U mengambil beberapa nilai u. Soalan: bolehkah ini dijelaskan secara rawak atau percanggahan ini juga adalah besar dan menunjukkan perbezaan yang ketara antara taburan teori dan statistik (empirikal) dan, oleh itu, ketidaksesuaian hipotesis H? Untuk menjawab soalan ini, andaikan bahawa hipotesis H adalah betul, dan di bawah andaian ini kita mengira kebarangkalian bahawa, disebabkan sebab rawak yang dikaitkan dengan jumlah bahan eksperimen yang tidak mencukupi, ukuran percanggahan U tidak akan kurang daripada nilai yang diperhatikan secara eksperimen u, iaitu, kita mengira kebarangkalian kejadian: .

Jika kebarangkalian ini kecil, maka hipotesisnya H harus ditolak sebagai hampir tidak munasabah, tetapi jika kebarangkalian ini penting, maka kami membuat kesimpulan bahawa data eksperimen tidak bercanggah dengan hipotesis H.

Timbul persoalan: bagaimanakah ukuran percanggahan (penyimpangan) harus dipilih? U? Ternyata untuk beberapa cara memilihnya, undang-undang pengedaran kuantiti U mempunyai sifat yang sangat mudah dan, untuk cukup besar n boleh dikatakan bebas daripada fungsi F(x). Ia adalah tepat ukuran percanggahan yang digunakan dalam statistik matematik sebagai kriteria untuk persetujuan.

Definisi 51 / . Kriteria kebaikan-kesesuaian ialah kriteria untuk menguji hipotesis tentang undang-undang yang sepatutnya bagi taburan yang tidak diketahui.

Untuk data kuantitatif dengan taburan hampir normal, gunakan parametrik kaedah berdasarkan penunjuk seperti jangkaan matematik dan sisihan piawai. Khususnya, untuk menentukan kebolehpercayaan perbezaan antara cara untuk dua sampel, kaedah Pelajar (kriteria) digunakan, dan untuk menilai perbezaan antara tiga atau lebih sampel, ujian F, atau analisis varians. Jika kita berurusan dengan data bukan kuantitatif atau sampel terlalu kecil untuk memastikan bahawa populasi dari mana ia diambil mengikut taburan normal, kemudian gunakan bukan parametrik kaedah - kriteria χ 2(chi-square) atau Pearson untuk data kualitatif dan kriteria untuk tanda, pangkat, Mann-Whitney, Wilcoxon, dll. untuk data ordinal.

Di samping itu, pilihan kaedah statistik bergantung kepada sama ada sampel yang dibandingkan adalah bebas(iaitu, sebagai contoh, diambil daripada dua kumpulan subjek yang berbeza) atau bergantung(iaitu mencerminkan keputusan kumpulan subjek yang sama sebelum dan selepas pendedahan atau selepas dua pendedahan berbeza).

Pp. 1. Ujian Pearson (- khi kuasa dua)

Biar dihasilkan n eksperimen bebas, di mana setiap pembolehubah rawak X mengambil nilai tertentu, iaitu, sampel pemerhatian pembolehubah rawak diberikan X(penduduk umum) volum n. Pertimbangkan masalah menyemak kehampiran fungsi taburan teori dan empirikal untuk taburan diskret, iaitu, ia diperlukan untuk menyemak sama ada data eksperimen adalah konsisten dengan hipotesis. H 0 menyatakan bahawa pembolehubah rawak X mempunyai undang-undang pengedaran F(x) pada aras keertian α . Mari kita panggil undang-undang ini "teori".

Apabila mendapatkan kriteria kesesuaian untuk menguji hipotesis, ukuran ditentukan D sisihan fungsi taburan empirikal sampel tertentu daripada fungsi taburan yang diandaikan (teoretikal). F(x).

Yang paling biasa digunakan ialah ukuran yang diperkenalkan oleh Pearson. Mari kita lihat langkah ini. Kami membahagikan set nilai pembolehubah rawak X pada r set - kumpulan S 1 , S 2 ,…, S r, tanpa titik persamaan. Dalam amalan, partition sedemikian dijalankan menggunakan ( r- 1) nombor c 1 < c 2 < … < r-1 . Dalam kes ini, penghujung setiap selang dikecualikan daripada set yang sepadan, dan yang kiri disertakan.

S 1 S 2 S 3 …. S r -1 S r

c 1 c 2 c 3 r -1

biarlah pi, , - kebarangkalian bahawa SW X tergolong dalam set Si(jelas). biarlah n i, , - bilangan nilai (varian) daripada bilangan pemerhatian kepunyaan set Si(frekuensi empirikal). Kemudian kekerapan relatif SW melanda X ramai Si di n pemerhatian. Jelas sekali bahawa , .

Untuk perpecahan di atas, pi ada kenaikan F(x) pada set Si, dan kenaikan adalah pada set yang sama. Kami membawa hasil eksperimen ke dalam jadual dalam bentuk siri statistik berkumpulan.

Sempadan kumpulan Frekuensi relatif
S 1:x 1 – x 2
S 2: x 2 – x 3
S r: x rx r +1

Mengetahui hukum taburan teori, seseorang boleh mencari kebarangkalian teori pembolehubah rawak yang jatuh ke dalam setiap kumpulan: R 1 , R 2 , …, p r. Menyemak ketekalan taburan teori dan empirikal (statistik), kita akan meneruskan daripada percanggahan antara kebarangkalian teori. pi dan frekuensi yang diperhatikan.

Untuk ukuran D percanggahan (penyimpangan) fungsi taburan empirikal daripada fungsi teori mengambil jumlah sisihan kuasa dua bagi kebarangkalian teori. pi daripada frekuensi masing-masing yang diambil dengan beberapa "berat" c i: .

Kemungkinan c i diperkenalkan kerana, dalam kes umum, sisihan yang berkaitan dengan kumpulan yang berbeza tidak boleh dianggap sama pentingnya: sisihan yang sama dalam nilai mutlak boleh menjadi sedikit signifikan jika kebarangkalian itu sendiri pi adalah besar, dan sangat ketara jika ia kecil. Oleh itu, secara semula jadi "berat" c i berkadar songsang dengan kebarangkalian. Bagaimana untuk memilih nisbah ini?

K. Pearson menunjukkan bahawa jika kita meletakkan , maka untuk besar n undang-undang pengagihan kuantiti U mempunyai sifat yang sangat mudah: ia boleh dikatakan bebas daripada fungsi pengedaran F(x) dan pada bilangan eksperimen n, tetapi hanya bergantung pada bilangan kumpulan r, iaitu, undang-undang ini dengan peningkatan n menghampiri apa yang dipanggil taburan khi kuasa dua .

Jika anda memerlukan bahan tambahan mengenai topik ini, atau anda tidak menemui apa yang anda cari, kami mengesyorkan menggunakan carian dalam pangkalan data kerja kami:

Apa yang akan kami lakukan dengan bahan yang diterima:

Jika bahan ini ternyata berguna untuk anda, anda boleh menyimpannya ke halaman anda di rangkaian sosial:

Untuk menguji hipotesis mengenai korespondensi pengedaran empirikal kepada undang-undang teori pengedaran, penunjuk statistik khas digunakan - kriteria kesesuaian (atau kriteria pematuhan). Ini termasuk kriteria Pearson, Kolmogorov, Romanovsky, Yastremsky, dll. Kebanyakan kriteria kebaikan kesesuaian adalah berdasarkan penggunaan sisihan frekuensi empirik daripada yang teori. Jelas sekali, lebih kecil sisihan ini, lebih baik taburan teori sepadan (atau menerangkan) yang empirikal.

Kriteria Persetujuan- ini adalah kriteria untuk menguji hipotesis tentang kesesuaian taburan empirikal dengan taburan kebarangkalian teori. Kriteria sedemikian dibahagikan kepada dua kelas: umum dan khas. Kriteria kesesuaian am digunakan pada rumusan paling umum hipotesis, iaitu, kepada hipotesis bahawa keputusan yang diperhatikan bersetuju dengan mana-mana taburan kebarangkalian yang diandaikan a priori. Ujian kesesuaian khas membayangkan hipotesis nol khas yang merumuskan persetujuan dengan bentuk taburan kebarangkalian tertentu.

Kriteria kebaikan kesesuaian, berdasarkan undang-undang pengedaran yang ditetapkan, memungkinkan untuk menentukan bila percanggahan antara frekuensi teori dan empirikal harus diiktiraf sebagai tidak signifikan (rawak), dan bila - signifikan (bukan rawak). Berikutan daripada ini bahawa kriteria kebaikan-kesesuaian membolehkan untuk menolak atau mengesahkan ketepatan hipotesis yang dikemukakan apabila meratakan siri tentang sifat taburan dalam siri empirikal dan untuk menjawab sama ada ia mungkin untuk menerima model yang dinyatakan oleh beberapa undang-undang taburan teori untuk taburan empirikal tertentu.

Ujian kesesuaian Pearson c 2 (chi-square) ialah salah satu kriteria kebaikan-kesesuaian utama. Dicadangkan oleh ahli matematik Inggeris Karl Pearson (1857-1936) untuk menilai rawak (kepentingan) percanggahan antara frekuensi taburan empirikal dan teori:

Skim untuk menggunakan kriteria c 2 untuk menilai ketekalan taburan teori dan empirikal adalah seperti berikut:

1. Ukuran percanggahan yang dikira ditentukan.

2. Bilangan darjah kebebasan ditentukan.

3. Bilangan darjah kebebasan n ditentukan menggunakan jadual khas.

4. Jika , maka untuk tahap keertian α tertentu dan bilangan darjah kebebasan n, hipotesis tidak signifikan (rawak) percanggahan ditolak. Jika tidak, hipotesis boleh diiktiraf sebagai tidak bercanggah dengan data eksperimen yang diperolehi, dan dengan kebarangkalian (1 – α) boleh dikatakan bahawa percanggahan antara frekuensi teori dan empirikal adalah rawak.

Tahap keertian ialah kebarangkalian penolakan yang salah terhadap hipotesis yang dikemukakan, i.e. kebarangkalian bahawa hipotesis yang betul akan ditolak. Dalam kajian statistik, bergantung kepada kepentingan dan tanggungjawab tugas yang diselesaikan, tiga tahap kepentingan berikut digunakan:

1) a = 0.1, maka R = 0,9;

2) a = 0.05, maka R = 0,95;

3) a = 0.01, maka R = 0,99.

Menggunakan kriteria kesesuaian c 2 , syarat berikut mesti dipenuhi:

1. Jumlah populasi yang dikaji hendaklah cukup besar ( N≥ 50), manakala kekerapan atau saiz kumpulan mestilah sekurang-kurangnya 5. Jika keadaan ini dilanggar, perlu terlebih dahulu menggabungkan frekuensi kecil (kurang daripada 5).

2. Taburan empirikal harus terdiri daripada data yang diperoleh hasil daripada pemilihan rawak, i.e. mereka mesti berdikari.

Kelemahan kriteria good-of-fit Pearson ialah kehilangan beberapa maklumat awal yang dikaitkan dengan keperluan untuk mengumpulkan hasil pemerhatian ke dalam selang dan menggabungkan selang individu dengan sebilangan kecil pemerhatian. Dalam hal ini, adalah disyorkan untuk menambah pengesahan surat-menyurat pengedaran mengikut kriteria dengan 2 kriteria lain. Ini amat diperlukan apabila saiz sampel agak kecil ( n ≈ 100).

Dalam statistik Ujian kesesuaian Kolmogorov(juga dikenali sebagai ujian kebaikan-kesesuaian Kolmogorov-Smirnov) digunakan untuk menentukan sama ada dua taburan empirikal mematuhi undang-undang yang sama, atau untuk menentukan sama ada taburan yang terhasil mematuhi model yang dicadangkan. Kriteria Kolmogorov adalah berdasarkan penentuan perbezaan maksimum antara frekuensi terkumpul atau frekuensi taburan empirikal atau teori. Kriteria Kolmogorov dikira mengikut formula berikut:

di mana D dan d- masing-masing, perbezaan maksimum antara frekuensi terkumpul ( ff¢) dan antara frekuensi terkumpul ( hlmhlm¢) siri taburan empirikal dan teori; N- bilangan unit dalam populasi.

Setelah mengira nilai λ, jadual khas menentukan kebarangkalian yang boleh dihujahkan bahawa sisihan frekuensi empirik daripada frekuensi teori adalah rawak. Jika tanda mengambil nilai sehingga 0.3, maka ini bermakna terdapat kebetulan frekuensi yang lengkap. Dengan sejumlah besar pemerhatian, ujian Kolmogorov dapat mengesan sebarang penyelewengan daripada hipotesis. Ini bermakna sebarang perbezaan dalam taburan sampel daripada yang teoritikal akan dapat dikesan dengan bantuannya jika terdapat banyak pemerhatian. Kepentingan praktikal sifat ini tidak penting, kerana dalam kebanyakan kes sukar untuk mengira untuk mendapatkan sejumlah besar pemerhatian dalam keadaan malar, idea teori undang-undang pengedaran yang mana sampel mesti mematuhi sentiasa anggaran, dan ketepatan semakan statistik tidak boleh melebihi ketepatan model yang dipilih.

Kriteria kesesuaian Romanovsky berdasarkan penggunaan kriteria Pearson, i.e. sudah menemui nilai c 2 , dan bilangan darjah kebebasan:

di mana n ialah bilangan darjah kebebasan variasi.

Kriteria Romanovsky adalah mudah jika tiada jadual untuk . Jika< 3, то расхождения распределений случайны, если же >3, maka mereka tidak rawak dan taburan teori tidak boleh berfungsi sebagai model untuk taburan empirikal yang dikaji.

B. S. Yastremsky digunakan dalam kriteria perjanjian bukan bilangan darjah kebebasan, tetapi bilangan kumpulan ( k), nilai khas q bergantung pada bilangan kumpulan, dan nilai khi kuasa dua. Kriteria persetujuan Yastremsky mempunyai makna yang sama dengan kriteria Romanovsky dan dinyatakan oleh formula

di mana c 2 - kriteria persetujuan Pearson; - bilangan kumpulan; q - pekali, untuk bilangan kumpulan kurang daripada 20 bersamaan dengan 0.6.

Jika L fakta > 3, percanggahan antara taburan teori dan empirikal tidak rawak, i.e. taburan empirikal tidak memenuhi keperluan taburan normal. Jika L fakta< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Hipotesis yang diuji biasanya dipanggil hipotesis nol. H0, peraturan yang membuat hipotesis diterima atau ditolak dipanggil kriteria statistik.Kriteria statistik yang berfungsi untuk menguji hipotesis tentang bentuk undang-undang pengedaran dipanggil kriteria kesesuaian. Itu. kriteria persetujuan ditetapkan apabila percanggahan sebenar antara pengagihan teori dan eksperimen yang sepatutnya adalah: tidak penting - rawak dan apabila ketara - bukan rawak.

Pertimbangkan pembolehubah rawak yang mencirikan jenis atau fungsi percanggahan antara taburan teori dan eksperimen sifat yang sepatutnya, kemudian, mengikut taburan percubaan sedia ada, anda boleh menentukan nilai a, yang mana pembolehubah rawak telah diambil, jika hukum taburannya diketahui, maka tidak sukar untuk mencari kebarangkalian bahawa pembolehubah rawak akan mengambil nilai tidak kurang daripada a. Jika nilai a diperoleh hasil daripada pemerhatian pembolehubah rawak x, iaitu apabila mengedarkan atribut yang sedang dipertimbangkan, mengikut undang-undang teori yang dicadangkan, maka kebarangkalian tidak seharusnya kecil. Sekiranya kebarangkalian ternyata kecil, maka ini disebabkan oleh fakta bahawa nilai sebenarnya yang diperolehi bukanlah pembolehubah rawak x, dan yang lain dengan undang-undang pengedaran yang berbeza, i.e. sifat yang dikaji tidak diagihkan mengikut undang-undang yang diharapkan. Oleh itu, dalam kes apabila percanggahan antara taburan empirikal dan teori tidak kecil, ia harus diiktiraf sebagai tidak signifikan - rawak, dan taburan eksperimen dan teori tidak bercanggah, i.e. konsisten antara satu sama lain.

Sekiranya kebarangkalian adalah rendah, maka percanggahan antara taburan eksperimen dan teori adalah ketara, ia tidak boleh dijelaskan secara kebetulan, dan hipotesis tentang taburan sifat mengikut undang-undang teori yang sepatutnya dianggap tidak disahkan, ia tidak bersetuju. dengan data eksperimen. Adalah perlu, setelah mengkaji data eksperimen dengan teliti, untuk cuba mencari undang-undang baru mengenai kualiti ciri yang dicadangkan, yang lebih baik, lebih mencerminkan ciri-ciri taburan eksperimen, kebarangkalian sedemikian dianggap kecil dan ia dianggap tidak. melebihi 0.1.

Kriteria atau kriteria kebaikan kesesuaian Pearsonc 2 .

Biarkan analisis data eksperimen membawa kepada pilihan undang-undang pengedaran tertentu sebagai yang diandaikan untuk ciri yang dipertimbangkan, dan menurut data eksperimen hasil daripada pemerhatian n, parameter ditemui (jika ia tidak diketahui lebih awal. ). Nyatakan dengan n i- frekuensi empirikal pembolehubah rawak x.

n×P i-frekuensi teori yang mewakili hasil darab bilangan cerapan n atas kebarangkalian Pi- dikira mengikut agihan teori yang diandaikan. Kriteria Persetujuan c 2 sebagai ukuran percanggahan antara siri frekuensi teori dan empirikal mengambil nilai


;

c 2- kuantiti yang dipanggil c 2 pengedaran atau pengedaran Pearson. Ia sama dengan 0 hanya apabila semua frekuensi empirikal dan teori bertepatan, dalam kes lain ia berbeza daripada 0 dan semakin besar, semakin besar percanggahan antara frekuensi yang ditunjukkan. Ia terbukti bahawa ciri yang dipilih c 2 atau statistik untuk n®¥ mempunyai taburan Pearson dengan darjah kebebasan

k=m-s- 1.

di mana m- bilangan selang taburan empirikal siri variasi atau bilangan kumpulan.

s- bilangan parameter taburan teori yang ditentukan daripada data eksperimen (contohnya, dalam kes taburan normal, bilangan parameter yang dianggarkan daripada sampel ialah 2).

Skim untuk menggunakan kriteria adalah seperti berikut:

1. Menurut data eksperimen, hukum taburan atribut dipilih sebagai yang dijangkakan dan parameternya ditemui.

2. Menggunakan taburan yang diperoleh, frekuensi teori yang sepadan dengan frekuensi eksperimen ditentukan.

3. Beberapa frekuensi eksperimen, jika ada, digabungkan dengan frekuensi yang berdekatan, maka nilainya ditentukan oleh formula c 2 .

4. Tentukan bilangan darjah kebebasan k .

5. Daripada jadual aplikasi untuk aras keertian yang dipilih a cari nilai kritikal apabila bilangan darjah kebebasan adalah sama dengan k .

6. Kami merumuskan kesimpulan, berpandukan prinsip umum untuk menggunakan kriteria kebaikan kesesuaian, iaitu, jika kebarangkalian ialah >0.01, maka percanggahan sedia ada antara frekuensi teori dan eksperimen dianggap tidak penting.

Jika nilai yang diperhatikan sebenarnya lebih besar daripada nilai kritikal, maka H0 ditolak jika hipotesis tidak bercanggah dengan data eksperimen. Kriteria c 2 memberikan keputusan yang memuaskan sekiranya terdapat bilangan cerapan yang mencukupi dalam setiap selang kumpulan n i .

Nota: Jika dalam beberapa selang bilangan cerapan<5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах n i adalah tidak kurang daripada 5. Dalam kes ini, apabila mengira bilangan darjah kebebasan k sebagai m- bilangan selang yang dikurangkan yang sepadan diambil.

Agihan berikut 100 pekerja kedai telah diterima untuk pengeluaran pada tahun laporan

(dalam % kepada tahun sebelumnya).