Biografi Ciri-ciri Analisis

Contoh pengedaran Pearson. Menguji hipotesis tentang taburan normal populasi umum mengikut kriteria Pearson

Pertimbangkan permohonan dalamCIKEXCELUjian khi kuasa dua Pearson untuk menguji hipotesis mudah.

Selepas menerima data eksperimen (iaitu apabila terdapat beberapa sampel) biasanya undang-undang taburan dipilih yang paling menggambarkan pembolehubah rawak yang diwakili oleh yang diberikan persampelan. Menyemak sejauh mana data eksperimen diterangkan oleh undang-undang taburan teori yang dipilih dijalankan menggunakan kriteria persetujuan. hipotesis nol, biasanya hipotesis kesamaan pengagihan pembolehubah rawak sebahagian undang-undang teori.

Mari kita lihat dahulu aplikasinya Ujian kesesuaian Pearson X 2 (chi-square) berhubung dengan hipotesis mudah (parameter taburan teori diandaikan diketahui). Kemudian - , apabila hanya borang pengedaran ditentukan, dan parameter pengedaran ini dan nilai perangkaan X 2 dianggarkan/dikira atas dasar yang sama sampel.

Catatan: Dalam kesusasteraan bahasa Inggeris, prosedur permohonan Ujian kebaikan-kesesuaian Pearson X 2 mempunyai nama Ujian khi kuasa dua kebaikan fit.

Ingat prosedur untuk menguji hipotesis:

  • berasaskan sampel nilai dikira perangkaan, yang sepadan dengan jenis hipotesis yang diuji. Sebagai contoh, untuk digunakan t-statistik(jika tidak diketahui);
  • tertakluk kepada kebenaran hipotesis nol, pengedaran ini perangkaan diketahui dan boleh digunakan untuk mengira kebarangkalian (contohnya, untuk t- perangkaan ini adalah );
  • dikira berdasarkan sampel maksudnya perangkaan dibandingkan dengan nilai kritikal untuk nilai yang diberikan ();
  • hipotesis nol ditolak jika nilai perangkaan lebih besar daripada kritikal (atau jika kebarangkalian mendapat nilai ini perangkaan() lebih kecil aras keertian, yang merupakan pendekatan yang setara).

Jom belanja ujian hipotesis untuk pengedaran yang berbeza.

Kes diskret

Katakan dua orang sedang bermain dadu. Setiap pemain mempunyai set dadu mereka sendiri. Pemain bergilir-gilir membaling 3 dadu sekali gus. Setiap pusingan dimenangi oleh orang yang melakukan lebih banyak enam pada satu masa. Keputusan direkodkan. Salah seorang pemain, selepas 100 pusingan, mempunyai syak wasangka bahawa tulang lawannya tidak simetri, kerana. dia sering menang (sering membaling enam). Dia memutuskan untuk menganalisis sejauh mana kemungkinan keputusan lawan sebegitu.

Catatan: Kerana 3 dadu, maka anda boleh membaling 0 pada satu masa; 1; 2 atau 3 enam, i.e. pembolehubah rawak boleh mengambil 4 nilai.

Daripada teori kebarangkalian, kita tahu bahawa jika kubus adalah simetri, maka kebarangkalian enam kejatuhan mematuhi. Oleh itu, selepas 100 pusingan, frekuensi enam boleh dikira menggunakan formula
=BINOM.DIST(A7,3,1/6,SALAH)*100

Formula menganggap bahawa sel A7 mengandungi bilangan enam yang tercicir dalam satu pusingan.

Catatan: Pengiraan diberikan dalam contoh fail pada helaian Diskret.

Sebagai perbandingan diperhatikan(Diperhatikan) dan frekuensi teori(Dijangka) mudah digunakan.

Dengan sisihan ketara frekuensi yang diperhatikan daripada taburan teori, hipotesis nol tentang taburan pembolehubah rawak mengikut undang-undang teori, harus ditolak. Iaitu, jika dadu lawan adalah tidak simetri, maka frekuensi yang diperhatikan akan "berbeza dengan ketara" daripada taburan binomial.

Dalam kes kami, pada pandangan pertama, frekuensinya agak rapat dan sukar untuk membuat kesimpulan yang tidak jelas tanpa pengiraan. Berkenaan Ujian kesesuaian Pearson X 2, supaya bukannya pernyataan subjektif "berbeza dengan ketara", yang boleh dibuat berdasarkan perbandingan histogram, gunakan pernyataan yang betul secara matematik.

Marilah kita menggunakan fakta itu undang-undang nombor besar kekerapan diperhatikan (Observed) dengan peningkatan isipadu sampel n cenderung kepada kebarangkalian yang sepadan dengan undang-undang teori (dalam kes kita, hukum binomial). Dalam kes kami, saiz sampel n ialah 100.

Mari kita perkenalkan ujian perangkaan, yang kita nyatakan dengan X 2:

di mana O l ialah kekerapan kejadian yang diperhatikan yang pembolehubah rawak telah mengambil tertentu nilai yang dibenarkan, El ialah kekerapan teori yang sepadan (Dijangka). L ialah bilangan nilai yang boleh diambil oleh pembolehubah rawak (dalam kes kami ia adalah sama dengan 4).

Seperti yang dapat dilihat dari formula, ini perangkaan ialah ukuran kedekatan frekuensi yang diperhatikan dengan yang teori, i.e. ia boleh digunakan untuk menganggarkan "jarak" antara frekuensi ini. Jika jumlah "jarak" ini adalah "terlalu besar", maka frekuensi ini "berbeza dengan ketara". Adalah jelas bahawa jika kubus kita adalah simetri (iaitu terpakai hukum binomial), maka kebarangkalian bahawa jumlah "jarak" akan menjadi "terlalu besar" akan menjadi kecil. Untuk mengira kebarangkalian ini, kita perlu mengetahui taburan perangkaan X 2 ( perangkaan X 2 dikira berdasarkan rawak sampel, jadi ia adalah pembolehubah rawak dan, oleh itu, mempunyai sendiri taburan kebarangkalian).

Daripada analog multidimensi teorem kamiran Moivre-Laplace diketahui bahawa untuk n->∞ pembolehubah rawak kami X 2 adalah tanpa gejala dengan L - 1 darjah kebebasan.

Jadi jika nilai dikira perangkaan X 2 (jumlah "jarak" antara frekuensi) akan lebih daripada nilai had tertentu, maka kita akan mempunyai sebab untuk menolak hipotesis nol. Seperti dalam menyemak hipotesis parametrik, nilai had ditetapkan melalui aras keertian. Jika kebarangkalian bahawa statistik X 2 akan mengambil nilai kurang daripada atau sama dengan yang dikira ( hlm-maksudnya) akan kurang aras keertian, kemudian hipotesis nol boleh ditolak.

Dalam kes kami, nilai statistik ialah 22.757. Kebarangkalian bahawa statistik X 2 akan mengambil nilai lebih besar daripada atau sama dengan 22.757 adalah sangat kecil (0.000045) dan boleh dikira menggunakan formula
=XI2.DIST.PX(22,757;4-1) atau
=XI2.UJIAN(Diperhatikan; Dijangka)

Catatan: Fungsi CH2.TEST() direka khusus untuk menguji hubungan antara dua pembolehubah kategori (lihat ).

Kebarangkalian 0.000045 adalah kurang daripada biasa aras keertian 0.05. Jadi, pemain mempunyai sebab untuk mengesyaki lawannya tidak jujur ​​( hipotesis nol tentang kejujurannya dinafikan).

Apabila digunakan kriteria X 2 penjagaan mesti diambil untuk memastikan bahawa isipadu sampel n adalah cukup besar, jika tidak, anggaran pengagihan akan menjadi tidak sah statistik X 2. Ia biasanya dianggap bahawa untuk ini adalah mencukupi bahawa frekuensi yang diperhatikan (Diperhatikan) adalah lebih besar daripada 5. Jika ini tidak berlaku, maka frekuensi rendah digabungkan menjadi satu atau disambungkan kepada frekuensi lain, dan nilai gabungan diberikan jumlah kebarangkalian dan, dengan itu, bilangan darjah kebebasan berkurangan X 2 -agihan.

Bagi meningkatkan kualiti aplikasi kriteria X 2(), adalah perlu untuk mengurangkan selang pembahagian (meningkatkan L dan, dengan itu, menambah bilangannya darjah kebebasan), walau bagaimanapun, ini dihalang oleh sekatan ke atas bilangan cerapan yang termasuk dalam setiap selang (d.b.>5).

kes berterusan

Ujian kesesuaian Pearson X 2 boleh digunakan dengan cara yang sama dalam kes .

Pertimbangkan beberapa persampelan, yang terdiri daripada 200 nilai. Hipotesis nol Nyatakan bahawa sampel dibuat daripada .

Catatan: Pembolehubah rawak dalam fail sampel pada helaian Berterusan dihasilkan menggunakan formula =NORM.ST.INV(RAND()). Oleh itu, nilai baru sampel dijana setiap kali helaian dikira semula.

Sama ada set data yang tersedia adalah mencukupi boleh dinilai secara visual.

Seperti yang anda lihat dari rajah, nilai sampel sesuai dengan baik di sepanjang garis lurus. Walau bagaimanapun, seperti dalam ujian hipotesis berkenaan Ujian kebaikan-kesesuaian Pearson X 2 .

Untuk melakukan ini, kami membahagikan julat variasi pembolehubah rawak kepada selang dengan langkah 0.5. Mari kita mengira frekuensi yang diperhatikan dan teori. Kami mengira frekuensi yang diperhatikan menggunakan fungsi FREQUENCY() dan yang teoritikal - menggunakan fungsi NORM.ST.DIST().

Catatan: Untuk kes diskret, adalah perlu untuk memastikan bahawa sampel adalah agak besar, dan lebih daripada 5 nilai jatuh ke dalam selang.

Kira statistik X 2 dan bandingkan dengan nilai kritikal bagi sesuatu yang diberi aras keertian(0.05). Kerana kita membahagikan julat variasi pembolehubah rawak kepada 10 selang, maka bilangan darjah kebebasan ialah 9. Nilai kritikal boleh dikira dengan formula
\u003d XI2.INV.RH (0.05; 9) atau
\u003d XI2.OBR (1-0.05; 9)

Carta di atas menunjukkan bahawa nilai statistik ialah 8.19, yang jauh lebih tinggi kritikalhipotesis nol tidak ditolak.

Di bawah adalah yang mana sampel menganggap nilai yang tidak mungkin, dan berdasarkan kriteria Persetujuan Pearson X 2 hipotesis nol telah ditolak (walaupun hakikatnya nilai rawak dihasilkan menggunakan formula =NORM.ST.INV(RAND()) menyediakan persampelan daripada taburan normal piawai).

Hipotesis nol ditolak, walaupun secara visual datanya agak hampir dengan garis lurus.

Sebagai contoh, mari kita ambil juga persampelan daripada U(-3; 3). Dalam kes ini, walaupun dari graf adalah jelas bahawa hipotesis nol mesti ditolak.

Kriteria Persetujuan Pearson X 2 juga mengesahkan bahawa hipotesis nol mesti ditolak.

ODA Kriteria untuk menguji hipotesis tentang undang-undang yang dicadangkan bagi taburan yang tidak diketahui dipanggil kriteria kebaikan-kesesuaian.

Terdapat beberapa kriteria kesesuaian: $\chi ^2$ (chi-square) oleh K. Pearson, Kolmogorov, Smirnov, dan lain-lain.

Biasanya frekuensi teori dan empirikal berbeza. Kes percanggahan mungkin tidak rawak, yang bermaksud bahawa ia dijelaskan oleh fakta bahawa hipotesis tidak dipilih dengan betul. Kriteria Pearson menjawab soalan, tetapi, seperti mana-mana kriteria, ia tidak membuktikan apa-apa, tetapi hanya menetapkan persetujuan atau ketidaksetujuannya dengan data pemerhatian pada tahap kepentingan yang diterima.

ODA Kebarangkalian yang cukup kecil di mana sesuatu peristiwa boleh dianggap hampir mustahil dipanggil tahap keertian.

Dalam amalan, adalah perkara biasa untuk mengambil tahap keertian antara 0.01 dan 0.05, $\alpha =0.05$ ialah tahap keertian $5 ( \%) $.

Sebagai kriteria untuk menguji hipotesis, kami mengambil nilai \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \ qquad (1) \ end(persamaan)

di sini $n_i -$ frekuensi empirikal yang diperolehi daripada sampel, $n_i" -$ frekuensi teori yang ditemui secara teori.

Dibuktikan bahawa untuk $n\to \infty $ hukum taburan pembolehubah rawak ( 1 ) tanpa mengira hukum taburan penduduk, cenderung kepada undang-undang $\chi ^2$ ( chi-square ) dengan $k$ darjah kebebasan.

ODA Bilangan darjah kebebasan ditemui oleh persamaan $k=S-1-r$ di mana $S-$ ialah bilangan kumpulan selang, $r-$ ialah bilangan parameter.

1) pengagihan seragam: $r=2, k=S-3 $

2) taburan normal: $r=2, k=S-3$

3) taburan eksponen: $r=1, k=S-2$.

peraturan . Menguji hipotesis dengan kriteria Pearson.

  1. Untuk menguji hipotesis, hitung frekuensi teori dan cari $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i"))^2 ) ( n_i" ) ) $
  2. Mengikut jadual titik kritikal$\chi ^2$ taburan mengikut aras keertian yang diberikan $\alpha $ dan bilangan darjah kebebasan $k$ didapati $\chi _ ( kr ) ^2 (( \alpha ,k ))$.
  3. Jika $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

Komen Untuk mengawal pengiraan, gunakan formula untuk $\chi ^2$ dalam bentuk $\chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i") -n ) $

Menguji Hipotesis Taburan Seragam

Fungsi ketumpatan taburan seragam $X$ mempunyai bentuk $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Untuk menguji hipotesis bahawa pembolehubah rawak berterusan diedarkan secara seragam pada tahap keertian $\alpha $, ia diperlukan:

1) Cari min sampel $\overline ( x_b ) $ dan $\sigma _b =\sqrt ( D_b ) $ daripada taburan empirikal yang diberikan. Ambil sebagai anggaran parameter $a$ dan $b$ kuantiti

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Cari kebarangkalian bahawa pembolehubah rawak $X$ jatuh ke dalam selang separa $(( x_i ,x_ ( i+1 ) ))$ menggunakan formula $ P_i =P(( x_i

3) Cari frekuensi teori (penyamaan) menggunakan formula $n_i" =np_i $.

4) Dengan mengandaikan bilangan darjah kebebasan $k=S-3$ dan aras keertian $\alpha =0.05$ daripada jadual $\chi ^2$, kita dapati $\chi _ ( cr ) ^2 $ daripada diberi $\alpha $ dan $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$.

5) Menggunakan formula $\chi _ ( obs ) ^2 =\sum ( \frac ((( n_i -n_i"))^2 ) ( n_i") ) $ dengan $n_i ialah $ frekuensi empirik, kita dapati yang diperhatikan nilai $\ chi _ ( obs ) ^2 $.

6) Jika $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Mari kita uji hipotesis pada contoh kita.

1) $\overline x _b =13.00\,\,\sigma _b =\sqrt ( D_b ) = 6.51$

2) $a=13.00-\sqrt 3 \cdot 6.51=13.00-1.732\cdot 6.51=1.72468$

$b=13.00+1.732\cdot 6.51=24.27532$

$b-a=24.27532-1.72468=22.55064$

3) $P_i =P((x_i

$P_2 =((3

$P_3 =((7

$P_4 =((11

$P_5 =((15

$P_6 =((19

Dalam taburan seragam, jika panjang selang adalah sama, maka $P_i -$ adalah sama.

4) Cari $n_i" =np_i $.

5) Cari $\sum ( \frac ( (( n_i -n_i"))^2 ) ( n_i") ) $ dan cari $\chi _ ( obs ) ^2 $.

Mari letakkan semua nilai yang diperolehi dalam jadual

\mulakan(tatasusunan) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i")^2 ) ( n_i" ) & Kawalan~ \frac ( n_i^2 ) ( n_i") \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659898& 0.22551 \&\ 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 4& 3& 4 .43438& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 5& 6& 4.43438& . 2 =\jumlah ( \frac ( n_i^2 ) ( n_i") -n ) =3.63985 \\ \hline \end(array)

$\chi _ ( cr ) ^2 (( 0.05.3 ))=7.8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Kesimpulan tidak ada sebab untuk menolak hipotesis.

Tujuan kriteria χ 2 - Kriteria Pearson Kriteria χ 2 digunakan untuk dua tujuan: 1) untuk membandingkan taburan empirikal sesuatu ciri dengan satu teori - seragam, normal atau lain-lain; 2) untuk membandingkan dua, tiga atau lebih taburan empirikal bagi ciri yang sama. Penerangan tentang kriteria Kriteria χ 2 menjawab persoalan sama ada nilai yang berbeza bagi sesuatu ciri berlaku dengan kekerapan yang sama dalam taburan empirikal dan teori atau dalam dua atau lebih taburan empirikal. Kelebihan kaedah ini ialah ia membolehkan membandingkan taburan ciri yang dibentangkan dalam mana-mana skala, bermula dari skala nama. Dalam kes paling mudah pengagihan alternatif "ya - tidak", "perkahwinan yang dibenarkan - tidak membenarkan perkahwinan", "menyelesaikan masalah - tidak menyelesaikan masalah", dan lain-lain, kita sudah boleh menggunakan kriteria χ 2 . Lebih besar percanggahan antara dua taburan sebanding, lebih besar nilai empirikal χ 2 . Pengiraan automatik χ 2 - Kriteria Pearson Untuk mengira secara automatik χ 2 - Kriteria Pearson, perlu melakukan dua langkah: Langkah 1. Nyatakan bilangan taburan empirikal (dari 1 hingga 10); Langkah 2. Masukkan frekuensi empirikal dalam jadual; Langkah 3. Dapatkan jawapan.

Kelebihan kriteria Pearson ialah kesejagatannya: ia boleh digunakan untuk menguji hipotesis tentang pelbagai undang-undang pengedaran.

1. Menguji hipotesis taburan normal.

Biarkan sampel yang bersaiz cukup besar diperolehi P dengan banyak nilai varian yang berbeza. Untuk kemudahan pemprosesannya, kami membahagikan selang dari yang terkecil kepada yang terbesar daripada nilai varian dengan s bahagian yang sama dan kami akan menganggap bahawa nilai pilihan yang jatuh ke dalam setiap selang adalah lebih kurang sama dengan nombor yang menentukan pertengahan selang. Setelah mengira bilangan pilihan yang jatuh ke dalam setiap selang, kami akan membuat apa yang dipanggil sampel berkumpulan:

pilihan……….. X 1 X 2 … x s

frekuensi…………. P 1 P 2 … NS ,

di mana x i ialah nilai titik tengah selang, dan n i ialah bilangan pilihan yang disertakan dalam i selang ke- (frekuensi empirikal).



Berdasarkan data yang diperoleh, adalah mungkin untuk mengira min sampel dan sisihan piawai sampel σ B. Mari kita semak andaian bahawa populasi umum diedarkan mengikut undang-undang biasa dengan parameter M(X) = , D(X) = . Kemudian anda boleh mencari bilangan nombor daripada sampel volum P, yang sepatutnya dalam setiap selang di bawah andaian ini (iaitu, frekuensi teori). Untuk melakukan ini, menggunakan jadual nilai fungsi Laplace, kita dapati kebarangkalian untuk memukul i- selang ke-:

,

di mana a i dan b i- sempadan i-selang ke-. Mendarabkan kebarangkalian yang terhasil dengan saiz sampel n, kita dapati frekuensi teori: p i =n p i.Matlamat kami adalah untuk membandingkan frekuensi empirikal dan teori, yang, sudah tentu, berbeza antara satu sama lain, dan mengetahui sama ada perbezaan ini tidak penting, tidak menyangkal hipotesis taburan normal pembolehubah rawak yang sedang dikaji, atau adakah ia begitu besar bahawa mereka bercanggah dengan hipotesis ini. Untuk ini, kriteria digunakan dalam bentuk pembolehubah rawak

. (20.1)

Maknanya jelas: bahagian-bahagiannya diringkaskan, yang merupakan kuasa dua sisihan frekuensi empirik daripada yang teori daripada frekuensi teori yang sepadan. Ia boleh dibuktikan bahawa, tanpa mengira undang-undang taburan sebenar populasi umum, hukum taburan pembolehubah rawak (20.1) at cenderung kepada undang-undang taburan (lihat syarahan 12) dengan bilangan darjah kebebasan k = s - 1 – r, di mana r ialah bilangan parameter anggaran pengagihan yang dianggarkan daripada data sampel. Taburan normal dicirikan oleh dua parameter, jadi k = s - 3. Untuk kriteria yang dipilih, kawasan kritikal tangan kanan dibina, ditentukan oleh keadaan

(20.2)

di mana α - aras keertian. Oleh itu, kawasan kritikal diberikan oleh ketidaksamaan dan kawasan penerimaan hipotesis ialah .

Jadi, untuk menguji hipotesis nol H 0: populasi diedarkan secara normal - anda perlu mengira nilai yang diperhatikan bagi kriteria daripada sampel:

, (20.1`)

dan mengikut jadual titik genting taburan χ 2 cari titik genting menggunakan nilai α dan k = s - 3. Jika - hipotesis nol diterima, jika ditolak.

2. Menguji hipotesis taburan seragam.

Apabila menggunakan ujian Pearson untuk menguji hipotesis taburan seragam populasi umum dengan ketumpatan kebarangkalian yang diandaikan

adalah perlu, setelah mengira nilai daripada sampel yang tersedia, untuk menganggarkan parameter a dan b mengikut formula:

di mana a* dan b*- anggaran a dan b. Memang untuk agihan seragam M(X) = , , dari mana anda boleh mendapatkan sistem untuk menentukan a* dan b*: , yang penyelesaiannya ialah ungkapan (20.3).

Kemudian, andaikan itu , anda boleh mencari frekuensi teori menggunakan formula

Di sini s ialah bilangan selang di mana sampel dibahagikan.

Nilai cerapan bagi kriteria Pearson dikira dengan formula (20.1`), dan nilai kritikal dikira daripada jadual, dengan mengambil kira fakta bahawa bilangan darjah kebebasan k = s - 3. Selepas itu, sempadan kawasan kritikal ditentukan dengan cara yang sama seperti untuk menguji hipotesis taburan normal.

3. Menguji hipotesis tentang taburan eksponen.

Dalam kes ini, membahagikan sampel sedia ada kepada selang yang sama panjang, kami mempertimbangkan urutan pilihan yang sama jarak antara satu sama lain (kami menganggap bahawa semua pilihan yang termasuk dalam i selang ke-, ambil nilai yang bertepatan dengan tengahnya), dan frekuensi yang sepadan n i(bilangan pilihan sampel termasuk dalam i– selang ke-). Kami mengira daripada data ini dan mengambil sebagai anggaran parameter λ nilai . Kemudian frekuensi teori dikira dengan formula

Kemudian, nilai yang diperhatikan dan kritikal bagi kriteria Pearson dibandingkan, dengan mengambil kira bahawa bilangan darjah kebebasan k = s - 2.

Ujian kesesuaian Pearson:

Contoh 1. Dengan menggunakan ujian Pearson, pada aras keertian 0.05, semak sama ada hipotesis taburan normal populasi umum X adalah konsisten dengan taburan empirikal saiz sampel n = 200.

Keputusan cari dengan kalkulator.

x iKuantiti, fix i * f iKekerapan kumulatif, S(x - x sr) * f(x - x sr) 2 * f(x - x sr) 3 * fKekerapan, f i /n
5 15 75 15 114.45 873.25 -6662.92 0.075
7 26 182 41 146.38 824.12 -4639.79 0.13
9 25 225 66 90.75 329.42 -1195.8 0.13
11 30 330 96 48.9 79.71 -129.92 0.15
13 26 338 122 9.62 3.56 1.32 0.13
15 21 315 143 49.77 117.95 279.55 0.11
17 24 408 167 104.88 458.33 2002.88 0.12
19 20 380 187 127.4 811.54 5169.5 0.1
21 13 273 200 108.81 910.74 7622.89 0.065
200 2526 800.96 4408.62 2447.7 1

.
purata wajaran


Penunjuk variasi.
.

R = X maks - X min
R=21 - 5=16
Penyerakan


Penganggar varians tidak berat sebelah


Sisihan piawai .

Setiap nilai siri berbeza daripada nilai purata 12.63 tidak lebih daripada 4.7
.

.
undang-undang biasa




n = 200, h=2 (lebar selang), σ = 4.7, xav = 12.63

ix iu iφin*i
1 5 -1.63 0,1057 9.01
2 7 -1.2 0,1942 16.55
3 9 -0.77 0,2943 25.07
4 11 -0.35 0,3752 31.97
5 13 0.0788 0,3977 33.88
6 15 0.5 0,3503 29.84
7 17 0.93 0,2565 21.85
8 19 1.36 0,1582 13.48
9 21 1.78 0,0804 6.85
in in*in i -n* i(n i -n* i) 2(n i -n* i) 2 /n* i
1 15 9.01 -5.99 35.94 3.99
2 26 16.55 -9.45 89.39 5.4
3 25 25.07 0.0734 0.00539 0.000215
4 30 31.97 1.97 3.86 0.12
5 26 33.88 7.88 62.14 1.83
6 21 29.84 8.84 78.22 2.62
7 24 21.85 -2.15 4.61 0.21
8 20 13.48 -6.52 42.53 3.16
9 13 6.85 -6.15 37.82 5.52
200 200 22.86



Sempadannya K kp = χ 2 (k-r-1;α) didapati daripada jadual taburan khi kuasa dua dan nilai yang diberikan σ, k = 9, r=2 (parameter x cp dan σ dianggarkan daripada sampel ).
Kkp(0.05;6) = 12.59159; Kobs = 22.86
Nilai pemerhatian statistik Pearson jatuh ke dalam kawasan kritikal: Knable > Kkp, jadi ada sebab untuk menolak hipotesis utama. Data sampel diedarkan tidak mengikut undang-undang biasa. Dalam erti kata lain, frekuensi empirikal dan teori berbeza dengan ketara.

Contoh 2. Menggunakan ujian Pearson, pada aras keertian 0.05, semak sama ada hipotesis taburan normal populasi umum X adalah konsisten dengan taburan empirikal saiz sampel n = 200.
Keputusan.
Jadual untuk mengira penunjuk.

x iKuantiti, fix i * f iKekerapan kumulatif, S(x - x sr) * f(x - x sr) 2 * f(x - x sr) 3 * fKekerapan, f i /n
0.3 6 1.8 6 5.77 5.55 -5.34 0.03
0.5 9 4.5 15 6.86 5.23 -3.98 0.045
0.7 26 18.2 41 14.61 8.21 -4.62 0.13
0.9 25 22.5 66 9.05 3.28 -1.19 0.13
1.1 30 33 96 4.86 0.79 -0.13 0.15
1.3 26 33.8 122 0.99 0.0375 0.00143 0.13
1.5 21 31.5 143 5 1.19 0.28 0.11
1.7 24 40.8 167 10.51 4.6 2.02 0.12
1.9 20 38 187 12.76 8.14 5.19 0.1
2.1 8 16.8 195 6.7 5.62 4.71 0.04
2.3 5 11.5 200 5.19 5.39 5.59 0.025
200 252.4 82.3 48.03 2.54 1

Metrik Pusat Pengedaran.
purata wajaran


Penunjuk variasi.
Kadar Variasi Mutlak.
Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.
R = X maks - X min
R = 2.3 - 0.3 = 2
Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).


Penganggar varians tidak berat sebelah adalah anggaran yang konsisten bagi varians.


Sisihan piawai.

Setiap nilai siri berbeza daripada nilai purata 1.26 tidak lebih daripada 0.49
Menganggar sisihan piawai.

Menguji hipotesis tentang jenis taburan.
1. Mari kita uji hipotesis bahawa X diedarkan undang-undang biasa menggunakan ujian kebaikan-kesesuaian Pearson.

di mana n* i - frekuensi teori:

Kami mengira frekuensi teori, memandangkan:
n = 200, h=0.2 (lebar selang), σ = 0.49, xav = 1.26

ix iu iφin*i
1 0.3 -1.96 0,0573 4.68
2 0.5 -1.55 0,1182 9.65
3 0.7 -1.15 0,2059 16.81
4 0.9 -0.74 0,3034 24.76
5 1.1 -0.33 0,3765 30.73
6 1.3 0.0775 0,3977 32.46
7 1.5 0.49 0,3538 28.88
8 1.7 0.89 0,2661 21.72
9 1.9 1.3 0,1691 13.8
10 2.1 1.71 0,0909 7.42
11 2.3 2.12 0,0422 3.44

Mari kita bandingkan frekuensi empirikal dan teori. Mari kita buat jadual pengiraan, dari mana kita akan dapati nilai kriteria yang diperhatikan:

21.72 -2.28 5.2 0.24 9 20 13.8 -6.2 38.41 2.78 10 8 7.42 -0.58 0.34 0.0454 11 5 3.44 -1.56 2.42 0.7 ∑ 200 200 12.67

Mari kita tentukan sempadan kawasan kritikal. Oleh kerana statistik Pearson mengukur perbezaan antara taburan empirikal dan teori, lebih besar nilai pemerhatiannya bagi K obs, lebih kuat hujah terhadap hipotesis utama.
Oleh itu, kawasan kritikal untuk statistik ini sentiasa di tangan kanan :)