Biografi Ciri-ciri Analisis

Menguji hipotesis tentang parameter taburan. Menguji hipotesis tentang parameter taburan normal

Sekarang mari kita memikirkan contoh ujian statistik, manakala kriteria penting yang berkaitan dengan analisis korelasi-regresi akan dibincangkan dalam bahagian yang berkaitan. Di sini kami menerangkan beberapa contoh ujian statistik yang direka untuk menguji hipotesis statistik mudah tentang parameter berangka undang-undang taburan kebarangkalian yang dianalisis.

Skim umum semakan statistik hipotesis :

  1. Yang utama H 1 dan alternatif H 1 hipotesis.
  2. Aras keertian a yang sesuai dipilih.
  3. Saiz sampel ditentukan n.
  4. Kriteria K dipilih untuk ujian H 0 .
  5. Kawasan kritikal dan kawasan penerimaan hipotesis dibina (mengikut hipotesis alternatif yang dipilih).
  6. Nilai pemerhatian bagi kriteria K dikira obs(mengikut sampel).
  7. diterima penyelesaian statistik(jika K obs jatuh ke dalam bidang membuat keputusan, maka tidak ada sebab untuk menolak hipotesis utama, i.e. diterima jika K obs jatuh ke kawasan kritikal, maka hipotesis utama ditolak).

Kriteria untuk menguji hipotesis tentang nilai berangka parameter taburan normal ditunjukkan dalam jadual 3.

Jadual 3.7

H 0 Andaian Statistik kriteria H 1 Bidang keputusan
a=a 0 s 2 diketahui a¹ a 0
a>a 0
a<a 0
s 2 tidak diketahui a¹ a 0
a>a 0
a<a 0
a tidak diketahui

Menguji hipotesis statistik menggunakan ujian keertian boleh dijalankan berdasarkan selang keyakinan. Untuk semua hipotesis parametrik Untuk semua hipotesis parametrik kawasan penerimaan hipotesis H 0: q=q 0 pada aras keertian a bertepatan dengan selang keyakinan untuk parameter q pada tahap keyakinan 1–a. Dalam kes ini, ujian keertian satu sisi sepadan dengan selang keyakinan satu sisi, dan ujian keertian dua sisi sepadan dengan selang keyakinan dua sisi. Hipotesis H 0 diterima jika nilai q 0 diliputi oleh selang keyakinan yang sepadan; sebaliknya hipotesis H 0 ditolak.



Jika hipotesis diuji H 0:q = q 0 , maka selang keyakinan bagi perbezaan q 1 –q 2 dipertimbangkan. Hipotesis diterima jika selang keyakinan bagi perbezaan antara parameter q 1 –q 2 meliputi nilai sifar. Untuk menguji hipotesis bahawa dua varians adalah sama H 0: Selang keyakinan diplot untuk nisbah varians. Dalam kes ini, hipotesis H 0 diterima jika selang keyakinan meliputi nilai yang sama dengan satu.

Contoh 3.11. Dinyatakan bahawa bola yang dihasilkan oleh mesin automatik mempunyai diameter purata d 0 =10 mm. Dalam sampel daripada n=16 bola diameter purata ternyata sama dengan mm. Sahkan hipotesis nol H 0: , dengan mengandaikan bahawa varians diketahui dan sama dengan s 2 =1 mm 2. Kira aras keertian a=0.05.

Penyelesaian. Mari kita perkenalkan ujian statistik:

yang, di bawah kesahan hipotesis nol H 0 , mempunyai taburan normal piawai N(0;1). Biarkan hipotesis alternatif H 1: , maka kawasan kritikal akan mempunyai bentuk dua belah: (–¥;– Z crit)È( Z crit;+¥), di mana Z crit ditentukan daripada syarat

,

Kerana ia

tidak jatuh ke dalam kawasan kritikal, maka tidak ada sebab untuk menolak hipotesis nol, i.e. bahawa bola yang dibuat oleh mesin automatik mempunyai diameter purata 10 mm.

Masalah ini juga boleh diselesaikan menggunakan selang keyakinan. Kami telah membincangkan bahawa selang keyakinan untuk pembolehubah rawak normal dengan s yang diketahui mempunyai bentuk

.

Kerana ia t 0.95 \u003d 1.96, kemudian

Kerana d 0 =10н(9.84; 10.76), maka hipotesis H 0 diterima. a

Contoh 3.12. Pendapatan yang dianalisis X firma dalam industri dengan taburan normal. Diandaikan bahawa pendapatan purata dalam industri ini adalah sekurang-kurangnya $1 juta. Berdasarkan sampel 49 firma, data berikut diperoleh: $ juta dan s = $0.15 juta. Adakah keputusan ini bercanggah dengan hipotesis yang dikemukakan pada aras keertian a=0.01?

Penyelesaian. Kami merumuskan hipotesis utama dan alternatif:

Untuk menguji hipotesis H 0 membina kriteria

.

Kawasan kritikal akan menjadi kidal, jadi

.

Kerana ia T obs=–4,67<–2,404=T kritik, kemudian H 0 harus ditolak memihak H 1, yang memberikan alasan untuk mempercayai bahawa purata pendapatan dalam industri adalah kurang daripada $1 juta. a

Contoh 3.13. Ketepatan mesin automatik yang mengisi bungkusan dengan serbuk ditentukan oleh kebetulan berat bungkusan. Penyerakan berat tidak boleh melebihi 25 G 2. Berdasarkan sampel 20 pakej, varians ditentukan s 2 =30 G 2. Tentukan sama ada pelarasan segera mesin diperlukan pada aras keertian a=0.05.

Penyelesaian.

Kira nilai yang diperhatikan bagi kriteria tersebut

.

Cari nilai kritikal bagi kriteria tersebut

.

Kerana , maka tidak ada sebab untuk menolak hipotesis utama H 0 , iaitu data yang tersedia tidak memberikan alasan untuk mempercayai bahawa mesin memerlukan pelarasan segera. a

3.5.3. Menguji hipotesis tentang perbandingan parameter
penduduk

Apabila menganalisis banyak penunjuk ekonomi, seseorang perlu membandingkan dua populasi umum. Sebagai contoh, seseorang boleh membandingkan taraf hidup di dua negara dari segi pendapatan per kapita; anda boleh membandingkan dua pilihan pelaburan dari segi purata dividen; kualiti pengetahuan pelajar dua universiti - mengikut markah purata pada peperiksaan ujian komprehensif. Dalam kes ini, adalah logik untuk membuat perbandingan mengikut skema menganalisis kesamaan jangkaan matematik dua populasi umum. X dan Y.

Pertimbangkan dua pembolehubah rawak X~N(a 1 ,s 1) dan Y~ N(a 2 ,s 2), yang setiap satunya mematuhi undang-undang taburan normal. Biarkan terdapat dua sampel bebas dengan isipadu n 1 dan n 2 daripada populasi X dan Y. Perlu menguji hipotesis nol H 0:M[ X]=M[ Y]. Hipotesis nol dalam rumusan di atas adalah kompleks, kerana ia sah untuk mana-mana a=M[ X]=M[ Y], bagaimanapun, ia boleh dikurangkan kepada yang mudah jika kita mempertimbangkan perbezaan antara cara, i.e. H 0:M[ X]–M[ Y]=0.

Mengenai parameter dan, empat varian andaian boleh dibezakan:

a) kedua-dua varians diketahui dan sama antara satu sama lain;

b) kedua-dua varians diketahui tetapi tidak sama;

c) kedua-dua varians tidak diketahui, tetapi diandaikan bahawa ia adalah sama antara satu sama lain;

d) Kedua-dua varians tidak diketahui dan tidak diandaikan sama.

Kriteria untuk menguji hipotesis tentang nilai berangka parameter taburan normal diberikan dalam Jadual 3.8. Ambil perhatian bahawa dalam Jadual 3.8 pilihan a) dianggap sebagai kes khas pilihan b). Dalam kes varians tidak diketahui, yang tidak dianggap sama, analog statistik pilihan b) digunakan, dengan varians tidak diketahui digantikan dengan anggarannya.

Dalam keadaan ini, sukar untuk menentukan taburan tepat statistik yang diperkenalkan. Walau bagaimanapun, diketahui bahawa taburan ini hampir dengan taburan Pelajar dengan bilangan darjah kebebasan yang sama dengan

. (3.30)

Kriteria pengesahan disusun dengan cara yang sama seperti pilihan c).

Oleh itu, untuk memilih statistik ujian yang sesuai apabila varians am tidak diketahui, adalah perlu untuk mengetahui andaian yang dibuat. Pertama sekali, adalah perlu untuk memutuskan sama ada varians am yang tidak diketahui boleh dianggap sama atau tidak. Untuk kegunaan membuat keputusan F- Kriteria Fisher (lihat di bawah).

Jadual 3.9

H 0 Andaian Statistik kriteria H 1 Bidang keputusan
a 1 =a 2 , diketahui aa 2
a 1 >a 2
a 1 <a 2
, tidak diketahui tetapi sama , di mana aa 2
a 1 >a 2
a 1 <a 2

Selalunya, apabila membandingkan dua penunjuk ekonomi, analisis serakan nilai pembolehubah rawak yang dipertimbangkan datang ke hadapan. Sebagai contoh, apabila membuat keputusan sama ada untuk melabur dalam satu daripada dua industri, masalah risiko pelaburan adalah akut. Apabila membandingkan taraf hidup di kedua-dua negara, pendapatan per kapita mungkin menjadi lebih kurang sama. Dengan membandingkan spread dalam pendapatan, kita mendapat gambaran yang lebih tepat tentang mereka. Analisis yang serupa dengan yang diterangkan di atas hendaklah dijalankan dengan membandingkan varians pembolehubah rawak yang dikaji.

biarlah X~N(a 1 ,s 1) dan Y~ N(a 2 ,s 2), dan sisihan piawai mereka s 1 dan s 2 tidak diketahui. Hipotesis dikemukakan tentang kesamaan serakan. Walau bagaimanapun, hipotesis dalam rumusan di atas adalah kompleks, oleh itu, bukannya hipotesis ini, satu lagi, hipotesis mudah tentang nisbah varians dipertimbangkan, i.e. .

Sebagai kriteria untuk menguji hipotesis H 0 mengambil nilai rawak

ditentukan oleh nisbah varians sampel diperbetulkan yang lebih besar kepada yang lebih kecil (). Jika hipotesis nol H 0 adalah benar, maka statistik ini mempunyai F-Taburan Fischer dengan n 1 = n 1 –1 dan n 2 = n 2–1 darjah kebebasan. Pelbagai kegunaan kriteria Fisher ini ditunjukkan dalam Jadual 3.8.

Jadual 3.8

H 0 Andaian Statistik kriteria H 1 Bidang keputusan
a 1 , a 2 tidak diketahui , ()

Contoh 3.14. Syarikat gula pasir mempunyai barisan pengeluaran untuk mengisi beg dengan gula pasir sebanyak 1 kg. Menggunakan data yang dikumpul dalam jangka masa yang panjang, pengurus menganggarkan sisihan piawai am jisim beg yang dibekalkan dari garisan TAPI pada 0.02 kg(s 1) dan dari baris B pada 0.04 kg(s 2). Keluar dari barisan A sampel rawak telah diambil n 1 = 10 beg dan mendapati purata berat kandungan di dalam beg tersebut. Saiz sampel sedemikian n 2 =12 kantung telah diambil dari barisan B dan mendapati purata jisim . Adakah terdapat sebarang sebab untuk mempercayai bahawa kedua-dua barisan pengeluaran menimbang gula pasir ke dalam beg dengan purata berat yang berbeza?

Penyelesaian. Mari kita rumuskan hipotesis utama dan alternatif yang sepadan dengan keadaan masalah:

, .

Oleh kerana varians am ( dan ) diketahui, kami akan menyemak kepentingan perbezaan antara min sampel menggunakan taburan normal pada aras keertian a=0.01. Kira nilai yang diperhatikan bagi kriteria tersebut

Oleh kerana kawasan kritikal mempunyai bentuk dua belah, nilai kritikal kriteria akan ditentukan daripada keadaan

,

Hasilnya, kami memperoleh bahawa | Z obs|Crete, iaitu tiada sebab untuk menolak hipotesis nol. Oleh itu, boleh diandaikan bahawa beg yang diisi dengan gula pada dua barisan pengeluaran mempunyai berat purata yang sama. a

Contoh 3.15. Untuk mengkaji kualiti minyak, sampel dibuat sebanyak 10 unit daripada setiap siri berturut-turut ( n 1 dan n 2) dan peratusan air ditentukan x dalam setiap sampel. Dalam siri pertama, peratusan purata adalah dengan sisihan piawai yang diperbetulkan . Untuk siri kedua, purata peratusan air adalah dengan sisihan piawai . Adakah terdapat sebarang sebab untuk mengandaikan pada tahap keertian 5% bahawa kedua-dua siri minyak mempunyai pecahan jisim air yang berbeza?

Penyelesaian. Mari kita rumuskan hipotesis utama dan alternatif yang sepadan dengan keadaan masalah:

, .

Oleh kerana varians am ( dan ) tidak diketahui, seseorang harus terlebih dahulu menyemak kesamaan varians am, i.e. menguji hipotesis nol dengan hipotesis alternatif yang sepadan:

nilai yang diperhatikan bagi kriteria Fisher:

.

Di sini diketahui bahawa . Oleh kerana, selaras dengan hipotesis alternatif yang dipilih, kawasan kritikal akan menjadi dua belah, ia menentukan nilai kritikal bagi kriteria Fisher:

Akibatnya, kita mendapat itu F oblCrete, iaitu tiada sebab untuk menolak hipotesis nol. Oleh itu, boleh diandaikan bahawa kedua-dua penyebaran umum itu saling melukai.

Marilah kita teruskan menguji hipotesis tentang kesamaan dua purata am. Untuk melakukan ini, kami mengira nilai yang diperhatikan bagi ujian-t Pelajar yang sepadan:

.

Memandangkan kawasan kritikal juga akan menjadi dua belah, nilai kritikal yang sepadan bagi kriteria Pelajar akan sama dengan:

.

Akibatnya, kita mendapat itu T obs>T kritik, iaitu hipotesis nol ditolak. Oleh itu, boleh diandaikan bahawa kedua-dua siri sampel mempunyai kandungan air yang berbeza (mengikut berat). a

Tambahan 1.
KAEDAH DETIK

Di atas, kami telah mempertimbangkan kaedah untuk menganggarkan ciri berangka populasi umum, tanpa terikat dengan mana-mana fungsi pengedaran. Walau bagaimanapun, untuk menerangkan sepenuhnya populasi umum, anda perlu mengetahui fungsi pengedarannya. Jika bentuk fungsi pengedaran diketahui, maka ia kekal untuk menganggarkan parameternya sahaja. Pelbagai kaedah digunakan untuk menentukan. Salah seorang daripada mereka - kaedah momen, iaitu seperti berikut. Momen sampel ditentukan (contohnya, jangkaan matematik, varians) dalam jumlah yang sama dengan bilangan parameter yang dianggarkan, dan disamakan dengan momen taburan teori yang sepadan, yang merupakan fungsi parameter yang tidak diketahui.

Contoh 3.16. Cari dengan kaedah momen anggaran parameter a dan s taburan normal:

.

Penyelesaian. Untuk mencari dua parameter, perlu mempunyai dua persamaan untuk parameter ini. Mengikut kaedah momen, kita menyamakan, sebagai contoh, momen teori awal susunan pertama (jangkaan matematik): dengan momen empirikal tertib pertama (nilai purata): , serta momen teori pusat
Tertib ke-2 (varians): momen tengah tertib ke-2 (varians sampel diperbetulkan): . Akibatnya, kita mendapat dua persamaan:

daripada mana kami dapati anggaran yang diperlukan. a

Contoh 3.17. Cari anggaran parameter l bagi taburan Poisson dengan kaedah momen:

,

di mana , l>0.

Penyelesaian. Kami akan menyelesaikan masalah dengan dua cara.

a) Mari kita bandingkan momen awal urutan pertama, i.e. jangkaan matematik: Oleh kerana untuk taburan Poisson , kita dapat

b) Mari kita bandingkan momen awal susunan ke-2. Untuk pengedaran Poisson , kemudian . Kemudian

.

Penilaian adalah berbeza. Dengan maksud parameter pengedaran Poisson, adalah lebih baik untuk memilih anggaran pertama.

Seperti yang kita dapat lihat, ketidakpastian dalam pilihan momen awal membawa kepada mendapatkan anggaran yang berbeza untuk parameter yang sama. Walau bagaimanapun, kaedah momen, sebagai peraturan, membawa kepada anggaran yang konsisten. Ini bermakna dengan sampel yang cukup besar, perbezaan antara anggaran yang berbeza akan menjadi tidak ketara. Kelemahan kaedah momen ialah anggarannya (dengan pengecualian yang jarang berlaku) adalah tidak cekap. Oleh itu, kaedah momen digunakan dalam amalan hanya sebagai anggaran pertama, berdasarkan anggaran yang lebih cekap boleh diperolehi. Populariti kaedah momen terletak pada hakikat bahawa persamaan kaedah momen dalam banyak kes agak mudah dan penyelesaiannya tidak dikaitkan dengan kesukaran matematik yang hebat. a

Tambahan 2.
KAEDAH KEMUNGKINAN MAKSIMUM

Seperti yang telah kita lihat, kaedah yang berbeza untuk menganggar parameter pengedaran yang sama boleh memberikan hasil yang berbeza. Apabila terdapat beberapa laluan ke matlamat yang sama, adalah wajar untuk memilih yang terbaik. Di bawah sekatan tertentu, kaedah ini ialah kaedah kemungkinan maksimum, berdasarkan penggunaan maklumat yang optimum tentang parameter pengedaran yang tersedia dalam sampel.

biarlah X 1 , X 2 , …, X n kemungkinan keputusan pemerhatian bebas pembolehubah rawak X. Maksudnya begitu X 1 , X 2 , …, X n adalah pembolehubah rawak bebas, dan hukum taburan mana-mana daripadanya bertepatan dengan hukum taburan kuantiti X. Mari kita andaikan bahawa jenis taburan kuantiti X diberikan, tetapi parameter q, yang menentukan hukum ini, tidak diketahui. Kami memperkenalkan fungsi

di mana dalam kes taburan berterusan asal ditafsirkan sebagai ketumpatan taburan pembolehubah rawak X i, dan dalam kes diskret sebagai kebarangkalian bahawa nilai rawak X i akan mengambil makna x i. Fungsi daripada pembolehubah rawak X i, dianggap sebagai fungsi parameter q, dipanggil fungsi kemungkinan.

Anggaran Kemungkinan Maksimum (Anggaran MLM) parameter q dipanggil nilai sedemikian , di mana fungsi kemungkinan mencapai nilai tertinggi yang mungkin:

Adalah diketahui bahawa titik maksimum tidak akan berubah jika sebaliknya L(q) gunakan ln L(q). Kemudian, mengikut syarat yang diperlukan untuk ekstrem fungsi, kami memperoleh yang berikut persamaan kemungkinan:

, (3.14)

untuk mencari anggaran bagi parameter q.

Contoh 3.18. Cari dengan kaedah kemungkinan maksimum bagi anggaran parameter a dan s taburan normal.

Penyelesaian. Menurut formula (3.13), fungsi kemungkinan untuk taburan normal akan mempunyai bentuk

Logaritma ia, kita dapat

Cari derivatif separa berkenaan dengan a dan s:

, .

Menyamakan derivatif separa kepada sifar, kita memperoleh sistem persamaan:

Daripada persamaan ini kita dapati:

dan .

Telah ditetapkan bahawa anggaran adalah konsisten, tidak berat sebelah dan anggaran cekap parameter a, dan anggaran adalah anggaran yang konsisten, berat sebelah dan cekap secara asimptotik bagi parameter s 2 . a

Contoh 3.19. Cari anggaran kemungkinan maksimum untuk parameter l bagi taburan Poisson.

Penyelesaian. Fungsi kemungkinan log dalam kes ini, dibina pada sampel x 1 ,x 2 ,…,x n, akan kelihatan seperti

Oleh itu, selepas membezakan berkenaan dengan l, kita memperoleh persamaan kemungkinan maksimum

.

.

Adalah ditetapkan bahawa anggaran ini adalah anggaran yang konsisten, tidak berat sebelah dan cekap bagi parameter l. a

Ia ditunjukkan bahawa anggaran MMP adalah kaya raya, asymptotically tidak berat sebelah, asymptotically normal dan cekap secara asymptotically. Semua ini telah menjadikan kaedah kemungkinan maksimum sangat popular. Telah didapati bahawa untuk banyak masalah yang bersifat statistik yang paling pelbagai, MMP memberikan hasil yang baik. Satu-satunya kesukaran ialah kerumitan menyelesaikan persamaan kemungkinan (3.14). Oleh itu, untuk masa yang sangat lama, IMF hanya digunakan untuk pengiraan teori. Walau bagaimanapun, pada masa ini, pakej perisian statistik moden untuk komputer mula memasukkan kaedah ISM, yang sangat memudahkan penggunaan praktikal ISM.

Ia tidak boleh diandaikan bahawa penganggar MMP akan menjadi yang terbaik dalam semua situasi. Pertama sekali, sifat baiknya selalunya muncul hanya untuk saiz sampel yang sangat besar (iaitu, ia asimptotik), supaya untuk saiz sampel yang kecil. n kaedah lain boleh bersaing dengan mereka (dan juga mengatasi mereka). Kedua, dan ini, mungkin, "sekatan" utama pendekatan ini, untuk membina penganggar MLM dan memastikan sifat baik mereka pengetahuan yang tepat tentang jenis undang-undang pengagihan yang dianalisis f(x;q), yang dalam kebanyakan kes ternyata tidak realistik. Selalunya berlaku bahawa penyimpangan tertentu, walaupun kecil, bagi pengedaran sebenar daripada pengedaran yang diterima f(x;q), anggaran boleh kehilangan sifat "baik" secara tiba-tiba. Dalam hal ini, dalam beberapa tahun kebelakangan ini, yang dipanggil. teguh, atau mampan, kaedah anggaran yang memungkinkan untuk mencari anggaran, walaupun ia bukan yang terbaik dalam rangka undang-undang pengagihan yang diandaikan, tetapi mempunyai sifat yang cukup stabil apabila undang-undang sebenar menyimpang daripada yang diandaikan. DAN, ketiga, anggaran MMP mungkin juga tidak kaya, jika bilangan parameter yang dianggarkan daripada sampel adalah besar (mempunyai susunan yang sama dengan saiz sampel) dan berkembang dengan bilangan pemerhatian.

Tambahan 3.
KRITERIA PERSETUJUAN

Selalunya, fungsi taburan pembolehubah rawak tidak diketahui terlebih dahulu, dan ia menjadi perlu untuk menentukannya daripada data empirikal. Dalam banyak kes, daripada beberapa pertimbangan tambahan, andaian boleh dibuat tentang bentuk fungsi pengedaran F(x). Dalam ekonometrik, taburan normal sering digunakan, tetapi dalam beberapa kes persoalan mungkin timbul tentang kesahihan penggunaan taburan normal dalam kes tertentu. Dalam kes sedemikian, adalah perlu untuk menggunakan kriteria statistik yang mewajarkan satu atau satu lagi pilihan pengedaran.

Sebarang andaian tentang jenis taburan dipanggil hipotesis statistik dan secara matematik dinyatakan oleh hubungan ( F(xH 0), di mana H 0 ialah beberapa set fungsi pengedaran. Jika set H 0 terdiri daripada satu elemen, maka hipotesis dipanggil mudah. Apabila secara statistik menguji hipotesis utama H 0 juga merumuskan hipotesis alternatif ( F(xH 1), di mana H 1 ialah set fungsi taburan yang tidak bersilang dengan set H 0 . Sekiranya H 1 adalah set semua F(x) tidak termasuk dalam H 0 , maka set ini biasanya tidak disebut sama sekali. set H 0 dan H 1 dalam setiap tugasan ditentukan oleh keadaan logik, fizikal dan lain-lain tugasan.

Pertimbangkan kes hipotesis mudah ( F(x)=F teori(x)). biarlah X 1 , X 2 , …, X n ialah sampel rawak pembolehubah rawak X, dan biarkan menjadi fungsi taburan empirikal. Kami mentakrifkan beberapa ukuran bukan negatif D sisihan fungsi taburan empirikal daripada fungsi taburan teori yang diandaikan F teori(x). nilai D=D{F(x),F teori(x)) boleh ditakrifkan dalam banyak cara, mengikut mana pelbagai kriteria diperolehi untuk menguji hipotesis yang menarik minat kami: Ujian khi kuasa dua Pearson, Kolmogorov, Mises omega persegi, Smirnova dan lain lain.

Yang paling biasa ialah kriteria yang diperkenalkan oleh K. Pearson, yang membawa kepada pengedaran c 2 ( c 2 - Kriteria Pearson ). Pertimbangkan kriteria ini. Untuk melakukan ini, kami membahagikan set nilai pembolehubah rawak X pada r selang waktu S 1 , S 2 , … ,S r tiada titik persamaan. biarlah pi ialah kebarangkalian bahawa nilai X tergolong dalam selang Si; n i ialah bilangan nilai daripada antara yang diperhatikan X 2 , …, X n tergolong dalam selang Si. Untuk ukuran D sisihan fungsi taburan empirikal daripada teori F teori(x) ambil nilai

. (3.32)

Nilai c 2 adalah rawak dan kami berminat dengan taburannya di bawah andaian bahawa hipotesis yang diterima adalah benar, i.e. F(x)=F teori(x). Jawapan kepada soalan ini ialah Teorem Pearson:

Teorem. Walau apa pun fungsi taburan F teori (x) pembolehubah rawak X, untuk n®¥ taburan c 2 cenderung kepada c 2 -taburan dengan (r–1) darjah kebebasan.

Taburan teori hipotetikal yang ditakrifkan sepenuhnya agak jarang berlaku dalam amalan. Lebih kerap pengagihan teori F teori(x;q 1 ,…,q k) mengandungi beberapa parameter yang tidak diketahui q 1 ,…,q k, yang nilainya perlu dianggarkan daripada sampel. Akibatnya, kriteria Pearson akan mempunyai bentuk

. (3.33)

Walau bagaimanapun, tidak mungkin lagi untuk menggunakan teorem Pearson dalam kes ini, kerana nilainya q 1 ,…,q k tidak diketahui. Jika, dalam ungkapan yang diberikan, kuantiti q 1 ,…,q k menggantikannya dengan anggaran sampel, kemudian kuantiti pi(q 1 ,…,q k) sudah akan menjadi pembolehubah rawak, jadi teorem Pearson tidak boleh digunakan dalam kes ini sama ada.

Perhatikan bahawa untuk n®¥, taburan nilai c 2 , jika parameter q 1 ,…,q k dianggarkan dengan kaedah kemungkinan maksimum, ialah taburan c 2 dengan (r–1-k) darjah kebebasan(Teorem Fisher). Oleh itu, kehadiran parameter yang dianggarkan daripada sampel (jika anggaran dibuat dengan kaedah kemungkinan maksimum) tidak mengubah sifat taburan mengehad c 2, tetapi hanya mengurangkan bilangan darjah kebebasan pengedaran mengehad ini dengan sebagai sebanyak bilangan parameter yang dianggarkan. Ini adalah salah satu kelebihan kriteria Pearson.

Ambil perhatian bahawa kriteria Pearson digunakan hanya untuk sampel yang cukup besar ( n t50) dan frekuensi yang cukup tinggi ( n i³5). Jika syarat terakhir tidak dipenuhi untuk sebarang selang siri variasi, maka ia digabungkan dengan selang jiran, masing-masing mengurangkan jumlah bilangan selang.

Skim untuk menggunakan ujian kebaikan-kesesuaian Pearson menguji hipotesis tentang undang-undang yang didakwa bagi taburan yang tidak diketahui:

1) Parameter undang-undang pengedaran yang dicadangkan dikira.

2) Kekerapan teori dikira.

3) Kira nilai .

4) Mengikut bilangan darjah kebebasan yang dikira n= r–1–k, di mana r ialah bilangan selang pensampelan, k– bilangan parameter taburan dan mengikut aras keertian yang dipilih a mengikut jadual taburan c 2 , cari .

5) Jika , maka tidak ada sebab untuk menolak hipotesis nol, jika - hipotesis nol ditolak.

Contoh 3.20. Mengikut taburan yang diberikan oleh jadual (Jadual 3.9), gunakan ujian Pearson untuk mengetahui sama ada adalah mungkin untuk mempertimbangkan pada aras keertian a=0.05 bahawa populasi umum mempunyai taburan normal.

Penyelesaian. Dengan mengandaikan bahawa terdapat taburan normal, maka kita boleh menganggarkan dua parameternya

, .

PENGESAHAN HIPOTESIS STATISTIK

Perumusan masalah

Dalam ucapan biasa, perkataan "hipotesis" bermaksud andaian. Dalam statistik, ini adalah andaian tentang bentuk undang-undang pengedaran ("populasi umum ini diedarkan secara normal"), mengenai nilai parameternya ("purata umum ialah sifar"), mengenai kehomogenan data ( "dua sampel ini diambil daripada populasi umum yang sama"). Ujian hipotesis statistik terdiri daripada mengetahui sama ada keputusan pemerhatian (data sampel) konsisten dengan andaian kami.

Hasil semakan sedemikian mungkin jawapan negatif: data sampel bercanggah dengan hipotesis yang dinyatakan, jadi ia harus ditinggalkan. Jika tidak, kami mendapat jawapan bukan negatif: data sampel tidak bercanggah dengan hipotesis, jadi ia boleh diterima sebagai salah satu penyelesaian yang sah (tetapi bukan satu-satunya yang betul).

Hipotesis statistik yang diuji dipanggil asas (sifar) dan dilambangkan Hipotesis yang bertentangan dengan yang utama dipanggil alternatif (bersaing) dan dilambangkan dengan Tujuan ujian statistik hipotesis: berdasarkan data sampel, memutuskan kesahihan hipotesis utama atau menolaknya dalam memihak kepada alternatif.

Memandangkan ujian dilakukan berdasarkan sampel dan bukan keseluruhan populasi, terdapat kemungkinan, mungkin sangat kecil, kesimpulan yang salah.

Oleh itu, hipotesis nol boleh ditolak, sedangkan pada hakikatnya ia adalah benar dalam populasi umum. Ralat sedemikian dipanggil ralat taip satu , dan kebarangkaliannya ialah aras keertian dan menandakan Ada kemungkinan bahawa hipotesis nol diterima manakala hipotesis alternatif adalah benar dalam populasi umum. Ralat sedemikian dipanggil ralat jenis kedua, dan kebarangkaliannya dilambangkan (Jadual 6.1).

Jadual 6.1

Keputusan Ujian Hipotesis Statistik

Pengujian hipotesis statistik dijalankan dengan menggunakan ujian statistik . Ujian statistik K ialah peraturan (fungsi hasil pemerhatian) yang menentukan tahap percanggahan antara keputusan pemerhatian dan hipotesis nol. Kebarangkalian dipanggil kuasa kriteria.

Apabila menguji hipotesis statistik, adalah kebiasaan untuk menetapkan tahap keertian terlebih dahulu (nilai standard: 0.1, 0.05, 0.01, 0.001). Kemudian, daripada dua kriteria yang dicirikan oleh kebarangkalian yang sama, pilih satu yang sepadan dengan ralat yang lebih kecil daripada jenis ke-2, i.e. kuasa hebat. Adalah mungkin untuk mengurangkan kebarangkalian kedua-dua ralat dan pada masa yang sama dengan meningkatkan saiz sampel.

Nilai kriteria K dibahagikan kepada dua bahagian: kawasan nilai yang dibenarkan (kawasan penerimaan hipotesis ) dan kawasan kritikal (kawasan penerimaan hipotesis). Kawasan kritikal terdiri daripada nilai kriteria yang sama Kepada, yang tidak mungkin di bawah kesahihan hipotesis . Jika nilai kriteria K, dikira daripada data sampel, jatuh ke dalam kawasan kritikal, maka hipotesis ditolak memihak kepada alternatif, jika tidak, kami berpendapat bahawa tidak ada alasan untuk menolak hipotesis.

Contoh. Untuk persediaan menghadapi ujian, guru merumuskan 100 soalan (populasi umum) dan percaya bahawa seseorang pelajar boleh diberi “lulus” jika dia mengetahui 60% soalan (kriteria). Guru bertanya kepada pelajar 5 soalan (pilihan daripada populasi umum) dan meletakkan "lulus" jika terdapat sekurang-kurangnya tiga jawapan yang betul. Hipotesis: "pelajar telah menguasai kursus", dan set adalah kawasan penerimaan hipotesis ini. Kawasan kritikal adalah set - terdapat kurang daripada tiga jawapan yang betul, dalam kes ini hipotesis utama ditolak memihak kepada alternatif "pelajar tidak menguasai kursus, tahu kurang daripada 60% soalan."

Pelajar TAPI mempelajari 70 soalan daripada 100, tetapi menjawab dengan betul hanya dua daripada lima yang dicadangkan oleh guru - ujian tidak lulus. Dalam kes ini, guru membuat ralat Jenis I.

Pelajar B belajar 50 soalan daripada 100, tetapi dia bernasib baik, dan dia menjawab 3 soalan dengan betul - ujian itu telah diluluskan, tetapi kesilapan jenis kedua telah dibuat.

Guru boleh mengurangkan kemungkinan kesilapan ini dengan menambah bilangan soalan yang ditanya dalam ujian.

Untuk membina wilayah kritikal, anda perlu mengetahui undang-undang taburan statistik K dengan syarat bahawa hipotesis adalah benar. Tahap keertian (kebarangkalian nilai yang diperhatikan jatuh ke dalam kawasan kritikal) menentukan "saiz" kawasan kritikal, dan hipotesis bersaing menentukan "bentuk" kawasan kritikal. Sebagai contoh, jika hipotesis sedang diuji dan sebagai alternatif, maka kawasan kritikal akan menjadi tangan kanan (Rajah 6.1, a). Dengan alternatif, kawasan kritikal adalah sebelah kiri (Rajah 6.1, b). Dengan alternatif, kawasan kritikal adalah dua belah (Rajah 6.1, dalam). Dalam semua kes ini, pada tahap keertian tertentu, kawasan berlorek ialah % daripada jumlah kawasan di bawah lengkung ketumpatan taburan statistik K.

Algoritma untuk menguji hipotesis statistik adalah seperti berikut:

1) merumuskan hipotesis utama dan alternatif;

2) pilih tahap kepentingan;

3) mengikut jenis hipotesis, pilih kriteria statistik untuk mengujinya, i.e. pembolehubah rawak K, yang pengedarannya diketahui;

4) mengikut jadual taburan pembolehubah rawak K cari sempadan kawasan kritikal (tentukan jenis kawasan kritikal mengikut jenis hipotesis alternatif);

5) menggunakan data sampel, hitung nilai yang diperhatikan bagi kriteria tersebut

6) membuat keputusan statistik: jika ia jatuh ke dalam kawasan kritikal, tolak hipotesis yang memihak kepada satu alternatif; jika ia berada dalam julat nilai yang boleh diterima, maka tidak ada sebab untuk menolak hipotesis utama.

Menguji hipotesis tentang parameter taburan

Skim umum untuk menguji hipotesis

Konsep dan klasifikasi hipotesis statistik

Hipotesis statistik ialah andaian tentang bentuk taburan yang tidak diketahui atau parameter taburan yang diketahui bagi pembolehubah rawak yang diperhatikan.

Sebelum ini, dalam 5.2, contoh 1, 2 telah dipertimbangkan, di mana ciri sampel dikira, poligon atau histogram dibina. Ia boleh diandaikan bahawa pembolehubah rawak ini diedarkan mengikut salah satu undang-undang yang diketahui. Langkah seterusnya: anda perlu menyemak sama ada data eksperimen sepadan dengan hipotesis yang dinyatakan dan menerimanya. Langkah ini dipanggil ujian hipotesis statistik. Algoritma ujian hipotesis dipanggil peraturan keputusan. Oleh kerana hipotesis dikemukakan berdasarkan data sampel, hipotesis akan bersifat probabilistik.

Tugas utama statistik matematik termasuk:

  1. Ujian statistik hipotesis tentang parameter taburan. Dalam kes ini, diandaikan bahawa undang-undang taburan pembolehubah rawak ditubuhkan. Biarkan populasi diagihkan mengikut undang-undang biasa. Hipotesis dikemukakan tentang jangkaan matematik dalam julat jangkaan.
  2. Ujian statistik hipotesis tentang hukum taburan pembolehubah rawak. Hipotesis tentang jenis pengedaran dikemukakan dalam keadaan maklumat yang tidak mencukupi tentang sampel.

Dalam amalan, data eksperimen dengan sampel yang besar mendekati undang-undang biasa. Setelah mengemukakan hipotesis sedemikian, maka adalah perlu untuk mencari selang keyakinan untuk parameter taburan ini. Hipotesis yang diuji dipanggil yang nol (asas), yang paling munasabah atas sebab tertentu, dan ia dilambangkan H0. Bersama hipotesis utama, hipotesis alternatif (bersaing) dipertimbangkan H1, yang bercanggah dengan yang utama. Hipotesis nol yang dicadangkan memerlukan ujian lanjut.

Dalam kes ini, dua jenis ralat boleh dibuat:

  1. Ralat jenis pertama - hipotesis yang betul ditolak;
  2. Ralat jenis kedua - hipotesis yang salah diterima.

Untuk menguji hipotesis nol, pembolehubah rawak yang dipilih khas digunakan, taburan tepat atau anggarannya diketahui, dilambangkan dengan Z jika taburan normal, T - mengikut undang-undang Pelajar, c 2 - mengikut hukum khi kuasa dua. . Pembolehubah rawak yang dipilih khas ini dipanggil ujian statistik atau ujian keertian, yang akan dilambangkan dengan Z dalam berikut. Ujian statistik digunakan untuk menguji hipotesis nol.

Sebagai contoh, jika hipotesis sedang diuji tentang kesamaan varians dua populasi umum normal, maka nisbah varians sampel yang diperbetulkan diambil sebagai kriteria. Untuk menguji hipotesis, mengikut data sampel, nilai separa nilai yang termasuk dalam kriteria dikira dan nilai yang diperhatikan bagi kriteria diperolehi. Nilai cerapan bagi kriteria Z obs ialah nilai kriteria yang dikira daripada sampel. Contohnya, jika dua sampel menemui varians sampel d 1 =27; d 2 =9, maka nilai yang diperhatikan bagi kriteria adalah sama dengan nisbah varians terbetul yang lebih besar kepada yang lebih kecil: Masalah ujian hipotesis boleh dirumuskan seperti berikut.



1. Ia diperlukan untuk mencari pembolehubah rawak Z, yang juga dipanggil statistik ujian, yang memenuhi dua keperluan utama:

b) Taburan kriteria diketahui dengan andaian bahawa hipotesis nol adalah benar.

2. Selepas mencari atau memilih statistik, kawasan kritikal ditemui. Pada paksi berangka, kawasan diserlahkan yang tidak mungkin untuk pembolehubah rawak jatuh ke dalamnya. Kebarangkalian kecil diberikan, seperti dalam selang keyakinan, dengan nombor kecil - a, yang dipanggil aras keertian. Kebarangkalian untuk membuat ralat Jenis I (kebarangkalian menolak hipotesis yang betul) adalah sama dengan a, aras keertian.

Kawasan kritikal dipanggil set nilai kriteria Z, di mana hipotesis nol ditolak. Kawasan penerimaan hipotesis ialah set nilai kriteria Z, di mana hipotesis nol diterima.

titik kritikal(sempadan) – z kp ialah titik yang memisahkan kawasan kritikal daripada kawasan penerimaan hipotesis.

Terdapat tiga jenis kawasan kritikal:

  • sebelah kanan, ditakrifkan oleh ketaksamaan Z > z kp > 0;
  • sebelah kiri, ditakrifkan oleh ketaksamaan Z< z kp < 0;
  • dua hala, ditakrifkan oleh ketaksamaan Z< -z кр; Z >z cr.

Khususnya, jika titik kritikal adalah simetri berkenaan dengan sifar, maka kawasan kritikal dua belah ditentukan oleh ketaksamaan Z akan mengambil nilai yang terletak di kawasan kritikal, adalah sama dengan tahap kepentingan yang diterima. Hasilnya ialah:

  • untuk kawasan kritikal sebelah kanan:
P (Z > z kp) = a; (7.1)
  • untuk kawasan kritikal kidal P (Z< z kp) = a;
  • untuk kawasan simetri dua belah P (Z > z kp) = a/2 .

Prinsip asas ujian hipotesis statistik adalah seperti berikut:

  • Jika nilai cerapan bagi kriteria Z obs, dikira daripada data sampel, tergolong dalam kawasan kritikal, maka hipotesis ditolak.
  • Jika nilai yang diperhatikan tidak tergolong dalam kawasan kritikal, maka tidak ada sebab untuk menolak hipotesis.

Bagi setiap kriteria, terdapat jadual sepadan yang membolehkan untuk mencari titik kritikal z kp daripada a yang memenuhi keperluan (7.1).

Kerja makmal 2.

PENGESAHAN HIPOTESIS PADA PARAMETER PENDUDUK UMUM YANG TERTABAR BIASA

1. Peruntukan teori ringkas

1.1. Konsep asas.

Hipotesis - sebarang kenyataan yang dibuat tentang undang-undang taburan populasi umum yang tidak diketahui atau ciri berangka undang-undang taburan ini.

Hipotesis yang dicadangkan dipanggil null . Hipotesis alternatif adalah hipotesis yang bertentangan.

Kerana hipotesis diuji menggunakan kaedah statistik, kemudian hipotesis adalah statistik.

Hipotesis statistik ialah hukum taburan bagi beberapa pembolehubah rawak. AT kehidupan sebenar hipotesis ini mungkin:

Hipotesis tentang keberkesanan ubat tertentu;

Hipotesis tentang pertumbuhan pendapatan penduduk;

Hipotesis tentang menentukan kos atau perbelanjaan, dsb.

Jenis utama hipotesis yang diuji dengan kaedah statistik adalah seperti berikut:

1. Hipotesis tentang jenis hukum taburan pembolehubah rawak.

biarlah - persampelan nilai pembolehubah rawak. Berdasarkan sampel, boleh diandaikan bahawa fungsi taburan pembolehubah rawak mempunyai taburan tertentu. Kita perlu menyemak sama ada andaian kita tidak bercanggah dengan data eksperimen.

2. Hipotesis tentang kehomogenan dua atau lebih populasi umum atau ciri berangka.

Sebagai contoh, berdasarkan sampel nilai dua pembolehubah rawak dan adalah mungkin untuk mengemukakan hipotesis tentang undang-undang pengedaran yang sama bagi sampel ini atau kira-kira nilai purata, varians yang sama.

Sebagai contoh, anda boleh menyemak keberkesanan yang sama bagi dua jenis ubat atau kualiti produk yang sama daripada dua pengeluar yang berbeza.

3. Hipotesis tentang nilai berangka parameter populasi umum yang dikaji.

Sebagai contoh, katakan bahawa nilai jangkaan pembolehubah rawak tertentu ialah nombor tertentu.

Sebagai contoh, anda boleh membuat hipotesis bahawa kebarangkalian untuk lulus peperiksaan oleh pelajar tertentu ialah 3/4.

1.2. Skim am ujian statistik.

Peraturan ujian hipotesis dipanggil kriteria statistik.

Semua kriteria dibina mengikut skema berikut:

1. Hipotesis nol dan hipotesis alternatif dikemukakan.

2. Aras keertian diprapilih. Oleh kerana hipotesis diuji berdasarkan bilangan data eksperimen tertentu, keputusan itu disertai dengan kebarangkalian tertentu kesimpulan yang salah, iaitu, hipotesis boleh ditolak dengan kebarangkalian, walaupun sebenarnya ia adalah benar, atau, sebaliknya, hipotesis boleh diterima dengan kebarangkalian, walaupun ia sebenarnya palsu. Kebarangkalian ralat hendaklah kecil dan dipilih terlebih dahulu.

Kebarangkalian salah menolak hipotesis dipanggil tahap kepentingan ujian statistik.

Terdapat nilai standard lain juga.

Sebagai contoh, ia bermakna bahawa dalam 5 kes daripada 100 kita akan menolak hipotesis yang betul, tetapi 5 kesilapan daripada 100 kes adalah tidak banyak.

3. Beberapa fungsi dibina daripada hasil pemerhatian yang dipanggil statistik. Statistik itu sendiri adalah pembolehubah rawak dan, di bawah hipotesis tertentu, mempunyai undang-undang pengedaran tertentu.

4. Daripada jadual taburan statistik, cari nilai kritikal untuk hipotesis , iaitu dua nombor dan , yang membahagikan keseluruhan paksi berangka kepada 3 bahagian:

bahagian 1 dipanggil kawasan yang mempunyai nilai kecil yang tidak boleh diterima.

3 bahagian - wilayah tidak sah nilai yang besar.

Selang itu dipanggil julat nilai berkemungkinan.

Ia dikehendaki bahawa kebarangkalian nilai kecil dan besar yang tidak dibenarkan adalah kecil. Biasanya mereka diambil sama, i.e.

dan .

Pernyataan masalah menguji hipotesis statistik

Hipotesis statistik - sebarang andaian tentang bentuk hukum taburan pembolehubah yang dikaji atau parameter taburan yang diketahui.

Jadi, sebagai contoh, kita boleh menganggap (mengemukakan hipotesis) bahawa pembolehubah X yang dikaji diagihkan mengikut hukum biasa. Dalam hipotesis ini kita bercakap tentang bentuk undang-undang pengedaran yang dicadangkan. Situasi berikut agak tipikal: hukum taburan pembolehubah yang dikaji diketahui, tetapi parameter taburan ini tidak diketahui. Maka adalah wajar untuk mengemukakan hipotesis bahawa parameter yang tidak diketahui tergolong, sebagai contoh, kepada selang tertentu.

Oleh itu, hipotesis statistik dibahagikan kepada dua kumpulan:

· hipotesis tentang bentuk undang-undang pengedaran;

· hipotesis tentang parameter hukum taburan yang diketahui (hipotesis parametrik).

Hipotesis yang dicadangkan dipanggil nol (asas) dan dilambangkan dengan . Seiring dengan hipotesis yang dikemukakan, hipotesis yang bercanggah dengannya juga dipertimbangkan. Hipotesis yang bercanggah dengan yang nol dipanggil satu (alternatif) bersaing dan dilambangkan dengan ( = ).

Hipotesis yang dikemukakan, seperti mana-mana andaian, dalam realiti boleh sama ada benar atau salah; jadi ia perlu disahkan.

Data sampel (sampel) berfungsi sebagai bahan awal untuk menguji hipotesis yang dicadangkan.

Tugas menguji hipotesis secara deskriptif adalah seperti berikut: pada tahap kepentingan tertentu, ia diperlukan untuk menentukan sama ada hipotesis yang dicadangkan adalah konsisten dengan data sampel atau bercanggah dengannya.

Tahap kepentingan - kebarangkalian membuat kesilapan jenis pertama ("tahap risiko"), i.e. kebarangkalian tersilap menolak hipotesis yang betul. Tahap kepentingan ditetapkan oleh penyelidik; paling kerap diambil bersamaan dengan 0.05 (5%) atau 0.01 (1%), yang sepadan dengan risiko yang hampir boleh diabaikan, dan dengan itu memberikan kebolehpercayaan yang tinggi keputusan yang betul tugasan.

Prinsip asas dan langkah yang perlu untuk menguji hipotesis statistik

Untuk menguji hipotesis yang dikemukakan, kriteria statistik (peraturan penyelesaian) digunakan, mengikut mana, berdasarkan data sampel, keputusan dibuat untuk mengekalkan atau menolak hipotesis nol.

Kriteria adalah berdasarkan statistiknya Z- pembolehubah rawak yang dipilih khas untuk hipotesis yang dikemukakan, hukum taburannya dikaji dengan baik (terdapat jadual kuantiti taburan ini).

Nyatakan dengan set semua kemungkinan nilai statistik Z. Set ini dibahagikan kepada dua subset tidak bersilang dan :

, ,

di manakah julat nilai statistik Z yang boleh diterima;


ialah kawasan kritikal bagi statistik Z.

Titik yang memisahkan daripada dipanggil titik kritikal statistik Z. Kami tidak akan mempertimbangkan persoalan membina kawasan kritikal di sini; kami hanya ambil perhatian bahawa .

Mengikut data sampel (sampel), nilai pemerhatian statistik dikira: .

Kriteria (peraturan membenarkan) untuk menguji hipotesis yang dicadangkan adalah seperti berikut:

1. Jika , maka hipotesis ditolak.

2. Jika , maka hipotesis dikekalkan (iaitu, ia konsisten dengan data sampel).

Perhatikan bahawa hipotesis ditolak lebih kuat daripada diterima. Terima hipotesis dengan berhati-hati. Hakikatnya dalam kes hipotesis yang dikemukakan masih belum dibuktikan (mengikut satu sampel terhad). Dalam amalan, untuk keyakinan yang lebih besar dalam penerimaan hipotesis, eksperimen diulang, meningkatkan saiz sampel, dan hipotesis diuji semula (mungkin dengan cara lain).

Jadi, langkah-langkah yang perlu untuk menguji hipotesis statistik ialah:

pembentukan sampel;

· hipotesis dan ;

· penetapan aras kepentingan;

pemilihan statistik yang sesuai Z untuk cek;

· pengiraan nilai pemerhatian statistik daripada sampel;

definisi mengikut jadual titik kritikal perangkaan Z dan pembinaan kawasan kritikal;

· membuat keputusan mengikut kriteria ujian hipotesis .

Menguji hipotesis tentang taburan normal populasi umum. Kriteria Kolmogorov

Bagi pembolehubah C yang dikaji, hipotesis statistik: C mempunyai taburan normal. Data sampel (sampel) ialah bahan sumber untuk pengesahan. Pada tahap kepentingan tertentu, adalah perlu untuk menentukan sama ada hipotesis yang dicadangkan adalah konsisten dengan data sampel atau bercanggah dengannya.

Menguji hipotesis kenormalan oleh kriteria Kolmogorov adalah berdasarkan membandingkan fungsi taburan empirikal , diperoleh daripada data sampel isipadu , dan fungsi taburan hipotesis (teoretikal) undang-undang biasa. Keakraban antara mereka dianggarkan oleh statistik Kolmogorov.