Biografi Ciri-ciri Analisis

Fungsi taburan binomial. Varian taburan binomial


Sudah tentu, apabila mengira fungsi taburan kumulatif, seseorang harus menggunakan hubungan yang disebutkan antara taburan binomial dan beta. Kaedah ini sememangnya lebih baik daripada penjumlahan langsung apabila n > 10.

Dalam buku teks klasik mengenai statistik, untuk mendapatkan nilai taburan binomial, selalunya disyorkan untuk menggunakan formula berdasarkan teorem had (seperti formula Moivre-Laplace). Perlu diingatkan bahawa dari sudut pengiraan semata-mata nilai teorem ini hampir kepada sifar, terutamanya sekarang, apabila terdapat komputer berkuasa pada hampir setiap jadual. Kelemahan utama anggaran di atas ialah ketepatannya yang tidak mencukupi sepenuhnya untuk nilai n tipikal untuk kebanyakan aplikasi. Kelemahan yang tidak kurang adalah ketiadaan sebarang pengesyoran yang jelas tentang kebolehgunaan satu atau anggaran yang lain (hanya rumusan asimptotik diberikan dalam teks standard, ia tidak disertakan dengan anggaran ketepatan dan, oleh itu, tidak banyak digunakan). Saya akan mengatakan bahawa kedua-dua formula hanya sah untuk n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Saya tidak menganggap di sini masalah mencari kuantiti: untuk pengagihan diskret, ia adalah remeh, dan dalam masalah-masalah di mana pengagihan tersebut timbul, ia, sebagai peraturan, tidak relevan. Jika kuantiti masih diperlukan, saya mengesyorkan merumuskan semula masalah sedemikian rupa untuk berfungsi dengan nilai-p (kepentingan yang diperhatikan). Berikut ialah contoh: apabila melaksanakan beberapa algoritma penghitungan, pada setiap langkah ia perlu menyemak hipotesis statistik tentang pembolehubah rawak binomial. mengikut pendekatan klasik pada setiap langkah, adalah perlu untuk mengira statistik kriteria dan membandingkan nilainya dengan sempadan set kritikal. Oleh kerana, bagaimanapun, algoritma adalah enumeratif, adalah perlu untuk menentukan sempadan set kritikal setiap kali baharu (lagipun, saiz sampel berubah dari langkah ke langkah), yang secara tidak produktif meningkatkan kos masa. Pendekatan moden mengesyorkan mengira kepentingan yang diperhatikan dan membandingkannya dengan tahap keyakinan, menjimatkan carian untuk kuantil.

Oleh itu, kod berikut tidak mengira fungsi songsang, sebaliknya, fungsi rev_binomialDF diberikan, yang mengira kebarangkalian p kejayaan dalam satu percubaan memandangkan bilangan n percubaan, bilangan m kejayaan di dalamnya, dan nilai y kebarangkalian untuk mendapat m kejayaan ini. Ini menggunakan hubungan yang dinyatakan di atas antara taburan binomial dan beta.

Malah, fungsi ini membolehkan anda mendapatkan sempadan selang keyakinan. Malah, andaikan kita mendapat m kejayaan dalam n percubaan binomial. Seperti yang anda tahu, sempadan kiri dua belah selang keyakinan bagi parameter p dengan aras keyakinan ialah 0 jika m = 0, dan untuk ialah penyelesaian persamaan . Begitu juga, sempadan kanan ialah 1 jika m = n, dan untuk adalah penyelesaian kepada persamaan . Ini menunjukkan bahawa untuk mencari sempadan kiri, kita mesti menyelesaikan persamaan , dan untuk mencari yang betul - persamaan . Ia diselesaikan dalam fungsi binom_leftCI dan binom_rightCI , yang masing-masing mengembalikan sempadan atas dan bawah selang keyakinan dua belah.

Saya ingin ambil perhatian bahawa jika ketepatan yang sangat luar biasa tidak diperlukan, maka untuk n yang cukup besar, anda boleh menggunakan anggaran berikut [B.L. van der Waerden, statistik Matematik. M: IL, 1960, Bab. 2, sec. 7]: , di mana g ialah kuantil taburan normal. Nilai penghampiran ini ialah terdapat penghampiran yang sangat mudah yang membolehkan anda mengira kuantiti taburan normal (lihat teks tentang mengira taburan normal dan bahagian yang sepadan dalam rujukan ini). Dalam amalan saya (terutamanya untuk n > 100), anggaran ini memberikan kira-kira 3-4 digit, yang, sebagai peraturan, cukup mencukupi.

Pengiraan dengan kod berikut memerlukan fail betaDF.h , betaDF.cpp (lihat bahagian pengedaran beta), serta logGamma.h , logGamma.cpp (lihat lampiran A). Anda juga boleh melihat contoh penggunaan fungsi.

fail binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(percubaan berganda, kejayaan berganda, p berganda); /* * Biarkan ada "percubaan" pemerhatian bebas * dengan kebarangkalian "p" kejayaan dalam setiap satu. * Kira kebarangkalian B(berjaya|percubaan,p) bahawa bilangan * kejayaan adalah antara 0 dan "berjaya" (termasuk). */ double rev_binomialDF(percubaan berganda, kejayaan berganda, y berganda); /* * Biarkan kebarangkalian y sekurang-kurangnya m kejayaan * diketahui dalam percubaan skim Bernoulli. Fungsi mencari kebarangkalian p * kejayaan dalam satu percubaan. * * Hubungan berikut digunakan dalam pengiraan * * 1 - p = rev_Beta(cubaan-kejayaan| kejayaan+1, y). */ binom_leftCI berganda(percubaan berganda, kejayaan berganda, tahap berganda); /* Biarkan terdapat "percubaan" pemerhatian bebas * dengan kebarangkalian "p" kejayaan dalam setiap * dan bilangan kejayaan ialah "kejayaan". * Sempadan kiri selang keyakinan dua belah * dikira dengan aras aras keertian. */ double binom_rightCI(double n, double successes, double level); /* Biarkan terdapat "percubaan" pemerhatian bebas * dengan kebarangkalian "p" kejayaan dalam setiap * dan bilangan kejayaan ialah "kejayaan". * Sempadan kanan selang keyakinan dua belah * dikira dengan aras aras keertian. */ #endif /* Tamat #ifndef __BINOMIAL_H__ */

fail binomialDF.cpp

/************************************************ **** **********/ /* Taburan Binomial */ /**************************** **** *************************/ #include #termasuk #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Biarkan ada "n" pemerhatian bebas * dengan kebarangkalian "p" kejayaan dalam setiap satu. * Kira kebarangkalian B(m|n,p) bahawa bilangan kejayaan ialah * antara 0 dan "m" (termasuk), i.e. *jumlah kebarangkalian binomial dari 0 hingga m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Pengiraan tidak membayangkan penjumlahan tumpul - gunakan * pautan berikut kepada taburan beta pusat: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Hujah mestilah positif, dengan 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (hlm<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) pulangan 1; jika tidak kembalikan BetaDF(n-m, m+1).nilai(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Biarkan kebarangkalian y sekurang-kurangnya m kejayaan * diketahui dalam n percubaan skema Bernoulli. Fungsi mencari kebarangkalian p * kejayaan dalam satu percubaan. * * Hubungan berikut digunakan dalam pengiraan * * 1 - p = rev_Beta(y|n-m,m+1). */ ( tegaskan((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Pertimbangkan taburan Binomial, hitung jangkaan matematiknya, varians, mod. Menggunakan fungsi MS EXCEL BINOM.DIST(), kami akan memplotkan fungsi taburan dan graf ketumpatan kebarangkalian. Mari kita anggarkan parameter taburan p, jangkaan matematik pengedaran dan sisihan piawai. Pertimbangkan juga taburan Bernoulli.

Definisi. Biarlah mereka ditahan n ujian, di mana setiap satu hanya 2 peristiwa boleh berlaku: peristiwa "berjaya" dengan kebarangkalian hlm atau peristiwa "gagal" dengan kebarangkalian q =1-p (yang dipanggil Skim Bernoulli,Bernoullipercubaan).

Kebarangkalian mendapat tepat x kejayaan dalam hal ini n ujian adalah sama dengan:

Bilangan kejayaan dalam sampel x ialah pembolehubah rawak yang mempunyai Taburan binomial(Bahasa Inggeris) binomialpengedaran) hlm dan n adalah parameter taburan ini.

Ingat bahawa untuk memohon Skim Bernoulli dan sepadan taburan binomial, syarat-syarat berikut mesti dipenuhi:

  • setiap percubaan mesti mempunyai dua keputusan, secara bersyarat dipanggil "kejayaan" dan "kegagalan".
  • keputusan setiap ujian tidak harus bergantung kepada keputusan ujian sebelumnya (kebebasan ujian).
  • kadar kejayaan hlm hendaklah tetap untuk semua ujian.

Pengedaran binomial dalam MS EXCEL

Dalam MS EXCEL, bermula dari versi 2010, untuk Taburan binomial terdapat fungsi BINOM.DIST() , nama Inggeris- BINOM.DIST(), yang membolehkan anda mengira kebarangkalian sampel itu tepat X"berjaya" (iaitu fungsi ketumpatan kebarangkalian p(x), lihat formula di atas), dan fungsi taburan integral(kebarangkalian bahawa sampel akan mempunyai x atau kurang "berjaya", termasuk 0).

Sebelum MS EXCEL 2010, EXCEL mempunyai fungsi BINOMDIST(), yang juga membolehkan anda mengira fungsi pengagihan dan ketumpatan kebarangkalian p(x). BINOMDIST() ditinggalkan dalam MS EXCEL 2010 untuk keserasian.

Fail contoh mengandungi graf ketumpatan taburan kebarangkalian dan .

Taburan binomial mempunyai sebutan B(n; hlm) .

Catatan: Untuk bangunan fungsi taburan integral jenis carta yang sesuai Jadual, untuk ketumpatan pengedaranHistogram dengan kumpulan. Untuk maklumat lanjut tentang membina carta, baca artikel Jenis carta utama.

Catatan: Untuk kemudahan menulis formula dalam fail contoh, Nama untuk parameter telah dicipta Taburan binomial: n dan p.

Fail contoh menunjukkan pelbagai pengiraan kebarangkalian menggunakan fungsi MS EXCEL:

Seperti yang dilihat dalam gambar di atas, diandaikan bahawa:

  • Populasi tak terhingga dari mana sampel dibuat mengandungi 10% (atau 0.1) unsur yang baik (parameter hlm, argumen fungsi ketiga =BINOM.DIST() )
  • Untuk mengira kebarangkalian bahawa dalam sampel 10 elemen (parameter n, hujah kedua fungsi) akan ada tepat 5 elemen yang sah (hujah pertama), anda perlu menulis formula: =BINOM.DIST(5, 10, 0.1, SALAH)
  • Elemen terakhir, keempat ditetapkan = SALAH, i.e. nilai fungsi dikembalikan ketumpatan pengedaran.

Jika nilai argumen keempat = TRUE, maka fungsi BINOM.DIST() mengembalikan nilai fungsi taburan integral atau secara ringkas fungsi pengagihan. Dalam kes ini, kita boleh mengira kebarangkalian bahawa bilangan unsur yang baik dalam sampel akan datang julat tertentu, sebagai contoh, 2 atau kurang (termasuk 0).

Untuk melakukan ini, anda perlu menulis formula:
= BINOM.DIST(2, 10, 0.1, BENAR)

Catatan: Untuk nilai bukan integer bagi x, . Sebagai contoh, formula berikut akan mengembalikan nilai yang sama:
=BINOM.DIST( 2 ; sepuluh; 0.1; BENAR)
=BINOM.DIST( 2,9 ; sepuluh; 0.1; BENAR)

Catatan: Dalam fail contoh ketumpatan kebarangkalian dan fungsi pengagihan juga dikira menggunakan definisi dan fungsi COMBIN().

Penunjuk pengedaran

AT contoh fail pada helaian Contoh terdapat formula untuk mengira beberapa petunjuk pengedaran:

  • =n*p;
  • (sisihan piawai kuasa dua) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Kami memperoleh formula jangkaan matematik Taburan binomial menggunakan Skim Bernoulli.

Mengikut takrifan nilai rawak X masuk Skim Bernoulli(pembolehubah rawak Bernoulli) mempunyai fungsi pengagihan:

Pengagihan ini dipanggil Pengagihan Bernoulli.

Catatan: Pengagihan Bernoullikes istimewa Taburan binomial dengan parameter n=1.

Mari kita hasilkan 3 tatasusunan 100 nombor dengan kebarangkalian yang berbeza kejayaan: 0.1; 0.5 dan 0.9. Untuk melakukan ini, dalam tetingkap Penjanaan nombor rawak ditetapkan parameter berikut bagi setiap kebarangkalian p:

Catatan: Jika anda menetapkan pilihan Taburan rawak (Benih rawak), maka anda boleh memilih yang khusus set rawak nombor yang dijana. Contohnya, dengan menetapkan pilihan ini =25, anda boleh menjana set nombor rawak yang sama pada komputer yang berbeza (jika, sudah tentu, parameter pengedaran lain adalah sama). Nilai pilihan boleh mengambil nilai integer dari 1 hingga 32,767. Nama pilihan Taburan rawak boleh mengelirukan. Adalah lebih baik untuk menterjemahkannya sebagai Tetapkan nombor dengan nombor rawak.

Akibatnya, kita akan mempunyai 3 lajur 100 nombor, berdasarkan yang, sebagai contoh, kita boleh menganggarkan kebarangkalian kejayaan hlm mengikut formula: Bilangan kejayaan/100(cm. contoh helaian fail Menjana Bernoulli).

Catatan: Untuk Pengagihan Bernoulli dengan p=0.5, anda boleh menggunakan formula =RANDBETWEEN(0;1) , yang sepadan dengan .

Penjanaan nombor rawak. Taburan binomial

Katakan terdapat 7 item yang rosak dalam sampel. Ini bermakna "kemungkinan besar" bahagian produk yang rosak telah berubah. hlm, yang merupakan ciri proses pengeluaran kami. Walaupun situasi ini "sangat berkemungkinan", terdapat kemungkinan (risiko alfa, ralat jenis 1, "penggera palsu") yang hlm kekal tidak berubah, dan peningkatan bilangan produk yang rosak adalah disebabkan oleh pensampelan rawak.

Seperti yang dapat dilihat dalam rajah di bawah, 7 ialah bilangan produk yang rosak yang boleh diterima untuk proses dengan p=0.21 pada nilai yang sama Alfa. Ini menggambarkan bahawa apabila ambang item yang rosak dalam sampel melebihi, hlm"mungkin" meningkat. Frasa "kemungkinan besar" bermaksud hanya terdapat 10% peluang (100%-90%) bahawa sisihan peratusan produk yang rosak di atas ambang hanya disebabkan oleh sebab rawak.

Oleh itu, melebihi bilangan ambang produk yang rosak dalam sampel boleh berfungsi sebagai isyarat bahawa proses telah menjadi terganggu dan mula menghasilkan b kira-kira peratusan produk rosak yang lebih tinggi.

Catatan: Sebelum MS EXCEL 2010, EXCEL mempunyai fungsi CRITBINOM() , yang bersamaan dengan BINOM.INV() . CRITBINOM() ditinggalkan dalam MS EXCEL 2010 dan lebih tinggi untuk keserasian.

Kaitan taburan Binomial dengan taburan lain

Jika parameter n Taburan binomial cenderung kepada infiniti dan hlm cenderung kepada 0, maka dalam kes ini Taburan binomial boleh dianggarkan.
Ia adalah mungkin untuk merumuskan keadaan apabila anggaran Pengagihan Poisson berfungsi dengan baik:

  • hlm<0,1 (lebih kurang hlm dan banyak lagi n, lebih tepat anggaran);
  • hlm>0,9 (mempertimbangkan itu q=1- hlm, pengiraan dalam kes ini mesti dilakukan menggunakan q(a X perlu diganti dengan n- x). Oleh itu, semakin kurang q dan banyak lagi n, lebih tepat anggarannya).

Pada 0.1<=p<=0,9 и n*p>10 Taburan binomial boleh dianggarkan.

Pada gilirannya, Taburan binomial boleh berfungsi sebagai anggaran yang baik apabila saiz populasi ialah N Taburan hipergeometrik jauh lebih besar daripada saiz sampel n (iaitu, N>>n atau n/N<<1).

Anda boleh membaca lebih lanjut tentang hubungan pengedaran di atas dalam artikel. Contoh penghampiran juga diberikan di sana, dan syarat diterangkan apabila mungkin dan dengan ketepatan apa.

NASIHAT: Anda boleh membaca tentang pengedaran lain MS EXCEL dalam artikel.

Salam sejahtera kepada semua pembaca!

Analisis statistik, seperti yang anda ketahui, berkaitan dengan pengumpulan dan pemprosesan data sebenar. Ia berguna, dan selalunya menguntungkan, kerana. kesimpulan yang betul membolehkan anda mengelakkan kesilapan dan kerugian pada masa hadapan, dan kadangkala meneka dengan betul masa depan ini. Data yang dikumpul mencerminkan keadaan beberapa fenomena yang diperhatikan. Data selalunya (tetapi tidak selalu) berangka dan boleh dimanipulasi dengan pelbagai manipulasi matematik untuk mengekstrak maklumat tambahan.

Walau bagaimanapun, tidak semua fenomena diukur dalam skala kuantitatif seperti 1, 2, 3 ... 100500 ... Tidak semestinya fenomena boleh mengambil keadaan yang tidak terhingga atau sejumlah besar keadaan berbeza. Sebagai contoh, jantina seseorang boleh sama ada M atau F. Penembak sama ada mengenai sasaran atau tersasar. Anda boleh mengundi sama ada "Untuk" atau "Menentang", dsb. dan lain-lain. Dalam erti kata lain, data sedemikian menggambarkan keadaan atribut alternatif - sama ada "ya" (peristiwa telah berlaku) atau "tidak" (peristiwa itu belum berlaku). Peristiwa yang akan datang (hasil positif) juga dipanggil "kejayaan". Fenomena sedemikian juga boleh menjadi besar dan rawak. Oleh itu, ia boleh diukur dan kesimpulan yang sah secara statistik boleh dibuat.

Eksperimen dengan data sedemikian dipanggil Skim Bernoulli, sebagai penghormatan kepada ahli matematik Switzerland yang terkenal yang mendapati bahawa dengan sejumlah besar percubaan, nisbah hasil positif kepada jumlah bilangan percubaan cenderung kepada kebarangkalian peristiwa ini berlaku.

Pembolehubah Ciri Ganti

Untuk menggunakan radas matematik dalam analisis, keputusan pemerhatian tersebut hendaklah ditulis dalam bentuk berangka. Untuk melakukan ini, hasil positif diberikan nombor 1, satu negatif - 0. Dengan kata lain, kita berurusan dengan pembolehubah yang boleh mengambil hanya dua nilai: 0 atau 1.

Apakah faedah yang boleh diperoleh daripada ini? Malah, tidak kurang daripada data biasa. Jadi, mudah untuk mengira bilangan hasil positif - sudah cukup untuk merumuskan semua nilai, i.e. semua 1 (berjaya). Anda boleh pergi lebih jauh, tetapi untuk ini anda perlu memperkenalkan beberapa notasi.

Perkara pertama yang perlu diperhatikan ialah hasil positif (yang sama dengan 1) mempunyai beberapa kebarangkalian untuk berlaku. Sebagai contoh, mendapatkan kepala pada lambungan syiling ialah ½ atau 0.5. Kebarangkalian ini secara tradisinya dilambangkan dengan huruf Latin hlm. Oleh itu, kebarangkalian kejadian alternatif berlaku ialah 1-hlm, yang juga dilambangkan dengan q, itu dia q = 1 – hlm. Penamaan ini boleh disusun secara visual dalam bentuk plat pengedaran berubah-ubah X.

Sekarang kita mempunyai senarai nilai yang mungkin dan kebarangkaliannya. Anda boleh mula mengira ciri-ciri indah pembolehubah rawak seperti nilai yang dijangkakan dan penyebaran. Biar saya ingatkan anda bahawa jangkaan matematik dikira sebagai jumlah hasil darab semua nilai yang mungkin dan kebarangkalian sepadannya:

Mari kita hitung nilai jangkaan menggunakan tatatanda dalam jadual di atas.

Ternyata jangkaan matematik tanda alternatif adalah sama dengan kebarangkalian peristiwa ini - hlm.

Sekarang mari kita tentukan apakah varians ciri alternatif. Biar saya juga mengingatkan anda bahawa varians ialah kuasa dua min sisihan daripada jangkaan matematik. Formula umum (untuk data diskret) ialah:

Oleh itu varians ciri alternatif:

Adalah mudah untuk melihat bahawa penyebaran ini mempunyai maksimum 0.25 (at p=0.5).

Sisihan piawai - punca varians:

Nilai maksimum tidak melebihi 0.5.

Seperti yang anda lihat, kedua-dua jangkaan matematik dan varians tanda alternatif mempunyai bentuk yang sangat padat.

Taburan binomial pembolehubah rawak

Sekarang pertimbangkan keadaan dari sudut yang berbeza. Sesungguhnya, siapa yang peduli bahawa purata kehilangan kepala pada satu lambungan ialah 0.5? Malah mustahil untuk dibayangkan. Adalah lebih menarik untuk menimbulkan persoalan tentang bilangan kepala yang akan datang untuk bilangan lambungan tertentu.

Dalam erti kata lain, pengkaji sering berminat dengan kebarangkalian sebilangan peristiwa berjaya berlaku. Ini boleh menjadi bilangan produk yang rosak dalam lot yang diuji (1 - rosak, 0 - baik) atau bilangan pemulihan (1 - sihat, 0 - sakit), dsb. Bilangan "kejayaan" sedemikian akan sama dengan jumlah semua nilai pembolehubah X, iaitu bilangan hasil tunggal.

Nilai rawak B dipanggil binomial dan mengambil nilai dari 0 hingga n(pada B= 0 - semua bahagian adalah baik, dengan B = n- semua bahagian rosak). Diandaikan bahawa semua nilai x bebas antara satu sama lain. Pertimbangkan ciri-ciri utama pembolehubah binomial, iaitu, kita akan mewujudkan jangkaan, varians dan taburan matematiknya.

Jangkaan pembolehubah binomial sangat mudah diperolehi. Ingat bahawa terdapat sejumlah jangkaan matematik bagi setiap nilai tambah, dan ia adalah sama untuk semua orang, oleh itu:

Sebagai contoh, jangkaan bilangan kepala pada 100 lambungan ialah 100 × 0.5 = 50.

Sekarang kita memperoleh formula untuk varians pembolehubah binomial. ialah jumlah varians. Dari sini

Sisihan piawai, masing-masing

Untuk 100 lambungan syiling, sisihan piawai ialah

Dan akhirnya, pertimbangkan taburan kuantiti binomial, i.e. kebarangkalian bahawa pembolehubah rawak B akan mengambil nilai yang berbeza k, di mana 0≤k≤n. Untuk duit syiling, masalah ini mungkin berbunyi seperti ini: apakah kebarangkalian mendapat 40 kepala dalam 100 lambungan?

Untuk memahami kaedah pengiraan, mari kita bayangkan syiling itu dilambung 4 kali sahaja. Mana-mana pihak boleh jatuh setiap kali. Kami bertanya kepada diri sendiri: apakah kebarangkalian mendapat 2 kepala daripada 4 lambungan. Setiap lontaran adalah bebas antara satu sama lain. Ini bermakna kebarangkalian mendapat sebarang kombinasi akan sama dengan hasil darab kebarangkalian hasil yang diberikan untuk setiap balingan individu. Biarkan O menjadi kepala dan P adalah ekor. Kemudian, sebagai contoh, salah satu gabungan yang sesuai dengan kita mungkin kelihatan seperti OOPP, iaitu:

Kebarangkalian gabungan sedemikian adalah sama dengan hasil darab dua kebarangkalian timbul kepala dan dua lagi kebarangkalian tidak timbul kepala (peristiwa songsang dikira sebagai 1-hlm), iaitu 0.5×0.5×(1-0.5)×(1-0.5)=0.0625. Ini adalah kebarangkalian salah satu kombinasi yang sesuai dengan kita. Tetapi persoalannya ialah tentang jumlah bilangan helang, dan bukan tentang sebarang susunan tertentu. Kemudian anda perlu menambah kebarangkalian semua kombinasi di mana terdapat tepat 2 helang. Adalah jelas bahawa mereka semua adalah sama (produk tidak berubah daripada menukar tempat faktor). Oleh itu, anda perlu mengira nombor mereka, dan kemudian darabkan dengan kebarangkalian mana-mana gabungan tersebut. Mari kita mengira semua gabungan 4 lontaran 2 elang: RROO, RORO, ROOR, ORRO, OROR, OORR. Hanya 6 pilihan.

Oleh itu, kebarangkalian yang diingini untuk mendapat 2 kepala selepas 4 balingan ialah 6×0.0625=0.375.

Walau bagaimanapun, mengira dengan cara ini membosankan. Sudah untuk 10 syiling, ia akan menjadi sangat sukar untuk mendapatkan jumlah bilangan pilihan dengan kekerasan. Oleh itu, orang pintar mencipta formula lama dahulu, dengan bantuannya mereka mengira bilangan kombinasi yang berbeza n unsur oleh k, di mana n ialah jumlah bilangan unsur, k ialah bilangan elemen yang pilihan susunannya dikira. Formula gabungan daripada n unsur oleh k ialah:

Perkara yang sama berlaku dalam bahagian kombinatorik. Saya menghantar semua orang yang ingin meningkatkan pengetahuan mereka ke sana. Oleh itu, nama taburan binomial (formula di atas ialah pekali dalam pengembangan binomial Newton).

Formula untuk menentukan kebarangkalian boleh digeneralisasikan dengan mudah kepada sebarang nombor n dan k. Akibatnya, formula taburan binomial mempunyai bentuk berikut.

Dalam erti kata lain: darabkan bilangan gabungan padanan dengan kebarangkalian salah satu daripadanya.

Untuk kegunaan praktikal, cukup sekadar mengetahui formula bagi taburan binomial. Dan anda mungkin tidak tahu - di bawah ialah cara menentukan kebarangkalian menggunakan Excel. Tetapi lebih baik untuk mengetahui.

Mari kita gunakan formula ini untuk mengira kebarangkalian mendapat 40 kepala dalam 100 lambungan:

Atau hanya 1.08%. Sebagai perbandingan, kebarangkalian jangkaan matematik eksperimen ini, iaitu, 50 kepala, ialah 7.96%. Kebarangkalian maksimum nilai binomial tergolong dalam nilai yang sepadan dengan jangkaan matematik.

Mengira kebarangkalian taburan binomial dalam Excel

Jika anda hanya menggunakan kertas dan kalkulator, maka pengiraan menggunakan formula taburan binomial, walaupun tiada kamiran, agak sukar. Sebagai contoh, nilai 100! - mempunyai lebih daripada 150 aksara. Tidak mustahil untuk mengira ini secara manual. Sebelum ini, malah sekarang, formula anggaran digunakan untuk mengira kuantiti tersebut. Pada masa ini, adalah dinasihatkan untuk menggunakan perisian khas, seperti MS Excel. Oleh itu, mana-mana pengguna (walaupun seorang humanis mengikut pendidikan) boleh mengira dengan mudah kebarangkalian nilai pembolehubah rawak teragih binomial.

Untuk menyatukan bahan, kami akan menggunakan Excel buat masa ini sebagai kalkulator biasa, i.e. Mari kita buat pengiraan langkah demi langkah menggunakan formula taburan binomial. Mari kita kira, sebagai contoh, kebarangkalian mendapat 50 kepala. Di bawah adalah gambar dengan langkah pengiraan dan keputusan akhir.

Seperti yang anda lihat, hasil perantaraan adalah dalam skala sedemikian sehingga ia tidak muat dalam sel, walaupun fungsi mudah jenis digunakan di mana-mana: FACTOR (pengiraan faktor), POWER (menaikkan nombor kepada kuasa), juga sebagai operator darab dan bahagi. Lebih-lebih lagi, pengiraan ini agak rumit, dalam mana-mana ia tidak padat, kerana banyak sel yang terlibat. Dan ya, sukar untuk memikirkannya.

Secara umum, Excel menyediakan fungsi sedia untuk mengira kebarangkalian taburan binomial. Fungsi ini dipanggil BINOM.DIST.

Bilangan kejayaan ialah bilangan percubaan yang berjaya. Kami mempunyai 50 daripadanya.

Bilangan percubaan- bilangan lambungan: 100 kali.

Kebarangkalian Berjaya– kebarangkalian mendapat kepala pada satu lambungan ialah 0.5.

kamiran- sama ada 1 atau 0 ditunjukkan. Jika 0, maka kebarangkalian dikira P(B=k); jika 1, maka fungsi taburan binomial dikira, i.e. jumlah semua kebarangkalian daripada B=0 sebelum ini B=k inklusif.

Kami tekan OK dan kami mendapat hasil yang sama seperti di atas, hanya semuanya dikira oleh satu fungsi.

Sangat selesa. Demi percubaan, bukannya parameter terakhir 0, kami meletakkan 1. Kami mendapat 0.5398. Ini bermakna dalam 100 lambungan syiling, kebarangkalian mendapat kepala antara 0 dan 50 adalah hampir 54%. Dan pada mulanya nampaknya ia sepatutnya 50%. Secara amnya, pengiraan dibuat dengan mudah dan cepat.

Seorang penganalisis sebenar mesti memahami bagaimana fungsi itu berkelakuan (apakah pengedarannya), jadi mari kita hitung kebarangkalian untuk semua nilai dari 0 hingga 100. Iaitu, mari kita tanya diri kita sendiri: apakah kebarangkalian bahawa tidak satu helang akan jatuh, bahawa 1 helang akan jatuh, 2, 3 , 50, 90 atau 100. Pengiraan ditunjukkan dalam gambar bergerak sendiri berikut. Garis biru ialah taburan binomial itu sendiri, titik merah ialah kebarangkalian untuk bilangan kejayaan tertentu k.

Seseorang mungkin bertanya, bukankah taburan binomial serupa dengan... Ya, sangat serupa. Malah De Moivre (pada 1733) mengatakan bahawa dengan sampel yang besar pengedaran binomial mendekati (saya tidak tahu apa yang dipanggil kemudian), tetapi tiada siapa yang mendengarnya. Hanya Gauss, dan kemudian Laplace, 60-70 tahun kemudian, menemui semula dan mengkaji dengan teliti undang-undang taburan normal. Graf di atas jelas menunjukkan bahawa kebarangkalian maksimum jatuh pada jangkaan matematik, dan apabila ia menyimpang daripadanya, ia berkurangan dengan mendadak. Sama seperti undang-undang biasa.

Taburan binomial mempunyai kepentingan praktikal yang besar, ia berlaku agak kerap. Menggunakan Excel, pengiraan dijalankan dengan mudah dan cepat. Jadi jangan ragu untuk menggunakannya.

Mengenai ini saya mencadangkan untuk mengucapkan selamat tinggal sehingga mesyuarat akan datang. Semua yang terbaik, sihat!

Bab 7

Undang-undang khusus taburan pembolehubah rawak

Jenis-jenis hukum taburan pembolehubah rawak diskret

Biarkan pembolehubah rawak diskret mengambil nilainya X 1 , X 2 , …, x n, … . Kebarangkalian nilai ini boleh dikira menggunakan pelbagai formula, contohnya, menggunakan teorem asas teori kebarangkalian, formula Bernoulli, atau beberapa formula lain. Bagi sesetengah formula ini, undang-undang pengedaran mempunyai namanya sendiri.

Hukum taburan yang paling biasa bagi pembolehubah rawak diskret ialah binomial, geometri, hipergeometrik, hukum taburan Poisson.

Undang-undang pengedaran binomial

Biar terhasil n percubaan bebas, di mana setiap satu peristiwa mungkin atau mungkin tidak berlaku TAPI. Kebarangkalian berlakunya peristiwa ini dalam setiap percubaan tunggal adalah malar, tidak bergantung pada nombor percubaan dan sama dengan R=R(TAPI). Oleh itu kebarangkalian bahawa peristiwa itu tidak akan berlaku TAPI dalam setiap ujian juga adalah tetap dan sama dengan q=1–R. Pertimbangkan pembolehubah rawak X sama dengan bilangan kejadian kejadian TAPI dalam n ujian. Adalah jelas bahawa nilai kuantiti ini adalah sama dengan

X 1 =0 - peristiwa TAPI dalam n ujian tidak muncul;

X 2 =1 – peristiwa TAPI dalam n percubaan muncul sekali;

X 3 =2 - peristiwa TAPI dalam n percubaan muncul dua kali;

…………………………………………………………..

x n +1 = n- acara TAPI dalam n ujian muncul segala-galanya n sekali.

Kebarangkalian nilai ini boleh dikira menggunakan formula Bernoulli (4.1):

di mana kepada=0, 1, 2, …,n .

Undang-undang pengedaran binomial X sama dengan bilangan kejayaan dalam n Percubaan Bernoulli, dengan kebarangkalian berjaya R.

Jadi, pembolehubah rawak diskret mempunyai taburan binomial (atau diedarkan mengikut undang-undang binomial) jika kemungkinan nilainya ialah 0, 1, 2, …, n, dan kebarangkalian yang sepadan dikira dengan formula (7.1).

Taburan binomial bergantung kepada dua parameter R dan n.

Siri taburan pembolehubah rawak yang diedarkan mengikut hukum binomial mempunyai bentuk:

X k n
R

Contoh 7.1 . Tiga tembakan bebas dilepaskan ke sasaran. Kebarangkalian untuk memukul setiap pukulan ialah 0.4. Nilai rawak X- bilangan pukulan pada sasaran. Bina siri pengedarannya.

Penyelesaian. Kemungkinan nilai pembolehubah rawak X adalah X 1 =0; X 2 =1; X 3 =2; X 4=3. Cari kebarangkalian yang sepadan menggunakan formula Bernoulli. Adalah mudah untuk menunjukkan bahawa penggunaan formula ini di sini adalah wajar sepenuhnya. Ambil perhatian bahawa kebarangkalian untuk tidak mencapai sasaran dengan satu pukulan akan bersamaan dengan 1-0.4=0.6. Dapatkan

Siri pengedaran mempunyai bentuk berikut:

X
R 0,216 0,432 0,288 0,064

Adalah mudah untuk menyemak bahawa jumlah semua kebarangkalian adalah sama dengan 1. Pembolehubah rawak itu sendiri X diedarkan mengikut hukum binomial. ■

Mari kita cari jangkaan dan varians matematik bagi pembolehubah rawak yang diedarkan mengikut hukum binomial.

Apabila menyelesaikan contoh 6.5, telah ditunjukkan bahawa jangkaan matematik bilangan kejadian sesuatu peristiwa TAPI dalam n ujian bebas, jika kebarangkalian berlaku TAPI dalam setiap ujian adalah malar dan sama R, sama n· R

Dalam contoh ini, pembolehubah rawak telah digunakan, diedarkan mengikut hukum binomial. Oleh itu, penyelesaian Contoh 6.5 adalah, sebenarnya, bukti teorem berikut.

Teorem 7.1. Jangkaan matematik bagi pembolehubah rawak diskret yang diedarkan mengikut hukum binomial adalah sama dengan hasil darab bilangan percubaan dan kebarangkalian "berjaya", i.e. M(X)=n· R.

Teorem 7.2. Varians pembolehubah rawak diskret yang diedarkan mengikut hukum binomial adalah sama dengan hasil darab bilangan percubaan dengan kebarangkalian "berjaya" dan kebarangkalian "gagal", i.e. D(X)=npq.

Kecondongan dan kurtosis pembolehubah rawak yang diedarkan mengikut hukum binomial ditentukan oleh formula

Rumus ini boleh diperoleh menggunakan konsep momen awal dan momen pusat.

Undang-undang pengedaran binomial mendasari banyak situasi sebenar. Untuk nilai yang besar n taburan binomial boleh dianggarkan oleh taburan lain, khususnya taburan Poisson.

Pengagihan Poisson

Biarlah ada n Percubaan Bernoulli, dengan bilangan percubaan n cukup besar. Sebelum ini, ditunjukkan bahawa dalam kes ini (jika, sebagai tambahan, kebarangkalian R perkembangan TAPI sangat kecil) untuk mencari kebarangkalian bahawa sesuatu peristiwa TAPI untuk hadir t sekali dalam ujian, anda boleh menggunakan formula Poisson (4.9). Jika pembolehubah rawak X bermakna bilangan kejadian kejadian TAPI dalam n Bernoulli percubaan, maka kebarangkalian itu X akan mengambil makna k boleh dikira dengan formula

, (7.2)

di mana λ = np.

Undang-undang pengedaran Poisson dipanggil taburan pembolehubah rawak diskret X, yang mana nilai yang mungkin adalah integer bukan negatif, dan kebarangkalian p t nilai ini didapati dengan formula (7.2).

Nilai λ = np dipanggil parameter Pengagihan Poisson.

Pembolehubah rawak yang diedarkan mengikut hukum Poisson boleh mengambil bilangan nilai yang tidak terhingga. Oleh kerana untuk taburan ini kebarangkalian R Kejadian sesuatu peristiwa dalam setiap percubaan adalah kecil, maka taburan ini kadang-kadang dipanggil hukum fenomena jarang.

Siri taburan pembolehubah rawak yang diedarkan mengikut hukum Poisson mempunyai bentuk

X t
R

Adalah mudah untuk mengesahkan bahawa jumlah kebarangkalian baris kedua adalah sama dengan 1. Untuk melakukan ini, kita perlu ingat bahawa fungsi itu boleh dikembangkan dalam siri Maclaurin, yang menumpu untuk sebarang X. Dalam kes ini kita ada

. (7.3)

Seperti yang dinyatakan, undang-undang Poisson dalam kes mengehadkan tertentu menggantikan undang-undang binomial. Contohnya ialah pembolehubah rawak X, nilai yang sama dengan bilangan kegagalan untuk tempoh masa tertentu dengan penggunaan berulang peranti teknikal. Diandaikan bahawa peranti ini mempunyai kebolehpercayaan yang tinggi, i.e. kebarangkalian kegagalan dalam satu aplikasi adalah sangat kecil.

Sebagai tambahan kepada kes pengehadan tersebut, dalam amalan terdapat pembolehubah rawak yang diedarkan mengikut undang-undang Poisson, tidak berkaitan dengan taburan binomial. Sebagai contoh, pengedaran Poisson sering digunakan apabila berurusan dengan bilangan peristiwa yang berlaku dalam tempoh masa (bilangan panggilan ke pertukaran telefon pada waktu itu, bilangan kereta yang tiba di tempat cuci kereta pada siang hari, bilangan mesin berhenti setiap minggu, dsb.). Semua peristiwa ini mesti membentuk apa yang dipanggil aliran peristiwa, yang merupakan salah satu konsep asas teori beratur. Parameter λ mencirikan keamatan purata aliran peristiwa.

Taburan binomial adalah salah satu taburan kebarangkalian yang paling penting untuk pembolehubah rawak yang berubah-ubah secara diskret. Taburan binomial ialah taburan kebarangkalian bagi suatu nombor m peristiwa TAPI dalam n pemerhatian yang saling bebas. Selalunya acara TAPI dipanggil "kejayaan" pemerhatian, dan peristiwa yang bertentangan - "kegagalan", tetapi penunjukan ini sangat bersyarat.

Syarat taburan binomial:

  • dijalankan secara keseluruhan n percubaan di mana peristiwa itu TAPI mungkin atau mungkin tidak berlaku;
  • peristiwa TAPI dalam setiap percubaan boleh berlaku dengan kebarangkalian yang sama hlm;
  • ujian adalah saling bebas.

Kebarangkalian bahawa dalam n acara ujian TAPI betul-betul m kali, boleh dikira menggunakan formula Bernoulli:

,

di mana hlm- kebarangkalian kejadian itu berlaku TAPI;

q = 1 - hlm ialah kebarangkalian kejadian yang bertentangan berlaku.

Mari kita fikirkan mengapa taburan binomial berkaitan dengan formula Bernoulli dengan cara yang diterangkan di atas . Acara - bilangan kejayaan di n ujian dibahagikan kepada beberapa pilihan, di mana setiap satu kejayaan dicapai dalam m percubaan, dan kegagalan - dalam n - m ujian. Pertimbangkan salah satu daripada pilihan ini - B1 . Mengikut peraturan penambahan kebarangkalian, kita mendarabkan kebarangkalian kejadian berlawanan:

,

dan jika kita nyatakan q = 1 - hlm, kemudian

.

Kebarangkalian yang sama akan mempunyai pilihan lain di mana m kejayaan dan n - m kegagalan. Bilangan pilihan tersebut adalah sama dengan bilangan cara yang boleh dilakukan n ujian dapat m kejayaan.

Jumlah kebarangkalian semua m nombor acara TAPI(nombor dari 0 hingga n) adalah sama dengan satu:

di mana setiap sebutan ialah sebutan bagi binomial Newton. Oleh itu, taburan yang dipertimbangkan dipanggil taburan binomial.

Dalam amalan, selalunya perlu untuk mengira kebarangkalian "paling banyak m kejayaan dalam n ujian" atau "sekurang-kurangnya m kejayaan dalam n ujian". Untuk ini, formula berikut digunakan.

Fungsi integral, iaitu kebarangkalian F(m) bahawa dalam n peristiwa pemerhatian TAPI tidak akan datang lagi m sekali, boleh dikira menggunakan formula:

Pada gilirannya kebarangkalian F(≥m) bahawa dalam n peristiwa pemerhatian TAPI datang sekurang-kurangnya m sekali, dikira dengan formula:

Kadangkala adalah lebih mudah untuk mengira kebarangkalian bahawa dalam n peristiwa pemerhatian TAPI tidak akan datang lagi m kali, melalui kebarangkalian kejadian yang bertentangan:

.

Mana antara formula yang hendak digunakan bergantung pada formula yang mengandungi lebih sedikit istilah.

Ciri-ciri taburan binomial dikira menggunakan formula berikut .

Nilai jangkaan: .

serakan: .

Sisihan piawai: .

Pengedaran dan pengiraan binomial dalam MS Excel

Kebarangkalian Taburan Binomial P n ( m) dan nilai fungsi kamiran F(m) boleh dikira menggunakan fungsi MS Excel BINOM.DIST. Tetingkap untuk pengiraan yang sepadan ditunjukkan di bawah (klik butang kiri tetikus untuk membesarkan).


MS Excel memerlukan anda memasukkan data berikut:

  • bilangan kejayaan;
  • bilangan ujian;
  • kebarangkalian kejayaan;
  • integral - nilai logik: 0 - jika anda perlu mengira kebarangkalian P n ( m) dan 1 - jika kebarangkalian F(m).

Contoh 1 Pengurus syarikat itu meringkaskan maklumat tentang bilangan kamera yang dijual sepanjang 100 hari yang lalu. Jadual meringkaskan maklumat dan mengira kebarangkalian bahawa bilangan kamera tertentu akan dijual setiap hari.

Hari ini berakhir dengan keuntungan jika 13 atau lebih kamera dijual. Kebarangkalian bahawa hari itu akan diuruskan dengan keuntungan:

Kebarangkalian bahawa hari itu akan bekerja tanpa keuntungan:

Biarkan kebarangkalian bahawa hari itu diuruskan dengan keuntungan adalah tetap dan sama dengan 0.61, dan bilangan kamera yang dijual setiap hari tidak bergantung pada hari tersebut. Kemudian anda boleh menggunakan taburan binomial, di mana acara itu TAPI- hari itu akan diusahakan dengan keuntungan, - tanpa keuntungan.

Kebarangkalian bahawa daripada 6 hari semua akan diuruskan dengan keuntungan:

.

Kami mendapat hasil yang sama menggunakan fungsi MS Excel BINOM.DIST (nilai nilai kamiran ialah 0):

P 6 (6 ) = BINOM.DIST(6; 6; 0.61; 0) = 0.052.

Kebarangkalian bahawa daripada 6 hari 4 atau lebih hari akan diusahakan dengan keuntungan:

di mana ,

,

Menggunakan fungsi MS Excel BINOM.DIST, kami mengira kebarangkalian bahawa daripada 6 hari tidak lebih daripada 3 hari akan dilengkapkan dengan keuntungan (nilai nilai kamiran ialah 1):

P 6 (≤3 ) = BINOM.DIST(3, 6, 0.61, 1) = 0.435.

Kebarangkalian bahawa daripada 6 hari semua akan diselesaikan dengan kerugian:

,

Kami mengira penunjuk yang sama menggunakan fungsi MS Excel BINOM.DIST:

P 6 (0 ) = BINOM.DIST(0; 6; 0.61; 0) = 0.0035.

Selesaikan masalah itu sendiri dan kemudian lihat penyelesaiannya

Contoh 2 Sebuah guci mengandungi 2 bola putih dan 3 bola hitam. Sebiji bola dikeluarkan dari balang, warna ditetapkan dan diletakkan semula. Percubaan diulang 5 kali. Bilangan kemunculan bola putih ialah pembolehubah rawak diskret X, diedarkan mengikut hukum binomial. Susun hukum taburan pembolehubah rawak. Tentukan mod, jangkaan matematik dan varians.

Kami terus menyelesaikan masalah bersama

Contoh 3 Dari perkhidmatan kurier pergi ke objek n= 5 kurier. Setiap kurier dengan kebarangkalian hlm= 0.3 lewat untuk objek tanpa mengira yang lain. Pembolehubah rawak diskret X- bilangan kurier lewat. Bina satu siri taburan pembolehubah rawak ini. Cari jangkaan matematiknya, varians, sisihan piawai. Cari kebarangkalian bahawa sekurang-kurangnya dua kurier akan terlambat untuk objek.