Biograafiad Omadused Analüüs

Binoomjaotuse funktsioon. Binoomjaotuse dispersioon


Muidugi tuleks kumulatiivse jaotusfunktsiooni arvutamisel kasutada mainitud seost binoom- ja beetajaotuse vahel. See meetod on kindlasti parem kui otsene liitmine, kui n > 10.

Klassikalistes statistikaõpikutes soovitatakse binoomjaotuse väärtuste saamiseks sageli kasutada piirteoreemidel põhinevaid valemeid (nt Moivre-Laplace'i valem). Tuleb märkida, et puhtalt arvutuslikust vaatenurgast nende teoreemide väärtus on nullilähedane, eriti praegu, kui pea iga laua peal on võimas arvuti. Ülaltoodud lähenduste peamiseks puuduseks on nende täiesti ebapiisav täpsus enamiku rakenduste jaoks tüüpiliste n väärtuste jaoks. Mitte väiksemaks puuduseks on selgete soovituste puudumine ühe või teise lähenduse rakendatavuse kohta (standardtekstides on esitatud ainult asümptootilised sõnastused, neile ei kaasne täpsushinnanguid ja seetõttu on neist vähe kasu). Ütleksin, et mõlemad valemid kehtivad ainult n puhul< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Ma ei käsitle siin kvantiilide leidmise probleemi: diskreetsete jaotuste puhul on see triviaalne ja nendes probleemides, kus sellised jaotused tekivad, pole see reeglina asjakohane. Kui kvantiile on endiselt vaja, soovitan probleemi ümber sõnastada nii, et see töötaks p-väärtustega (vaadeldud olulisusega). Siin on näide: mõne loendusalgoritmi rakendamisel tuleb igal etapil kontrollida statistiline hüpotees binoomjuhusliku suuruse kohta. Vastavalt klassikaline lähenemine igal etapil on vaja arvutada kriteeriumi statistika ja võrrelda selle väärtust kriitilise hulga piiriga. Kuna aga algoritm on loenduslik, on vaja iga kord uuesti määrata kriitilise hulga piir (valimi suurus ju muutub sammuti), mis suurendab ebaproduktiivselt ajakulusid. Kaasaegne lähenemine soovitab vaadeldava olulisuse välja arvutada ja võrrelda sellega usalduse tase, säästes kvantiilide otsimisel.

Seetõttu ei arvuta järgmised koodid pöördfunktsiooni, selle asemel on antud funktsioon rev_binomialDF, mis arvutab ühe katse õnnestumise tõenäosuse p, arvestades katsete arvu n, nende õnnestumiste arvu m ja väärtust y nende m õnnestumiste saamise tõenäosusest. See kasutab ülalmainitud seost binoom- ja beetajaotuse vahel.

Tegelikult võimaldab see funktsioon teil saada usaldusvahemike piirid. Tõepoolest, oletame, et saame m õnnestumist n binoomkatses. Nagu teate, on kahepoolne vasakpoolne piir usaldusvahemik kui parameetri p usaldusnivooga on 0, kui m = 0 ja for on võrrandi lahend . Samamoodi on parempiir 1, kui m = n, ja for on võrrandi lahend . See tähendab, et vasakpoolse piiri leidmiseks peame võrrandi lahendama , ja õige otsimiseks - võrrandit . Need on lahendatud funktsioonides binom_leftCI ja binom_rightCI , mis tagastavad vastavalt kahepoolse usaldusvahemiku ülemise ja alumise piiri.

Tahan märkida, et kui absoluutselt uskumatut täpsust pole vaja, siis piisavalt suure n korral võite kasutada järgmist lähendust [B.L. van der Waerden, Matemaatiline statistika. M: IL, 1960, Ch. 2, sek. 7]: , kus g on kvantiil normaaljaotus. Selle lähenduse väärtus seisneb selles, et on väga lihtsaid lähendusi, mis võimaldavad arvutada normaaljaotuse kvantiile (vt normaaljaotuse arvutamise teksti ja selle viite vastavat osa). Minu praktikas (peamiselt n > 100 puhul) andis see lähendus umbes 3-4 numbrit, mis on reeglina täiesti piisav.

Järgmiste koodidega arvutamiseks on vaja faile betaDF.h , betaDF.cpp (vt beetalevitamise jaotist), samuti logGamma.h , logGamma.cpp (vt lisa A). Näete ka funktsioonide kasutamise näidet.

binomialDF.h faili

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(topeltkatsed, topelt õnnestumised, topelt p); /* * Olgu sõltumatute vaatluste "katsetused" * edukuse tõenäosusega "p". * Arvutage tõenäosus B(edumised|katsed,p), et õnnestumiste arv * on vahemikus 0 kuni "edukad" (kaasa arvatud). */ double rev_binomialDF(double katsed, topelt õnnestumised, double y); /* * Olgu vähemalt m õnnestumise * tõenäosus y teada Bernoulli skeemi katsetes. Funktsioon leiab ühe katse õnnestumise tõenäosuse p *. * * Arvutustes kasutatakse järgmist seost * * 1 - p = rev_Beta(katsed-edumised| õnnestumised+1, y). */ double binom_leftCI(double katsed, topelt õnnestumised, topelttase); /* Olgu sõltumatute vaatluste * "katsetused" igas * õnnestumise tõenäosusega "p" ja õnnestumiste arv on "edu". * Kahepoolse usaldusvahemiku * vasak piir arvutatakse olulisuse taseme tasemega. */ double binom_rightCI(double n, topelt õnnestumised, topelttase); /* Olgu sõltumatute vaatluste * "katsetused" igas * õnnestumise tõenäosusega "p" ja õnnestumiste arv on "edu". * Kahepoolse usaldusvahemiku * parempiir arvutatakse olulisuse taseme tasemega. */ #endif /* Lõpeb #ifndef __BINOMIAL_H__ */

binomialDF.cpp faili

/**************************************************** **** **********/ /* Binoomjaotus */ /******************************** ********************************/ #kaasa #kaasa #include "betaDF.h" SISESTUS double binomialDF(double n, double m, double p) /* * Olgu "n" sõltumatut vaatlust * tõenäosusega "p" mõlemas õnnestumises. * Arvutage tõenäosus B(m|n,p), et õnnestumiste arv on * vahemikus 0 kuni "m" (kaasa arvatud), s.t. * summa binoomtõenäosused 0 kuni m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Arvutused ei tähenda nüri liitmist – kasutage * järgmist linki kesksele beetajaotusele: * * B(m|n,p) = Beeta(1-p|n-m,m+1). * * Argumendid peavad olema positiivsed, 0-ga<= p <= 1. */ { assert((n >0) && (p >= 0) && (lk<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) tagastus 1; muidu tagastab BetaDF(n-m, m+1).väärtus(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Olgu vähemalt m õnnestumise * tõenäosus y teada n Bernoulli skeemi katses. Funktsioon leiab ühe katse õnnestumise tõenäosuse p *. * * Arvutustes kasutatakse järgmist seost * * 1 - p = rev_Beta(y|n-m,m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Mõelge binoomjaotusele, arvutage selle matemaatiline ootus, dispersioon, moodus. MS EXCEL funktsiooni BINOM.DIST() abil joonistame jaotusfunktsiooni ja tõenäosustiheduse graafikud. Hindame jaotuse parameetrit p, matemaatiline ootus levitamine ja standardhälve. Võtke arvesse ka Bernoulli jaotust.

Definitsioon. Las nad hoitakse n testid, millest igaühes võib toimuda ainult 2 sündmust: sündmus "eduneb" tõenäosusega lk või sündmus "tõrge" tõenäosusega q =1-p (nn Bernoulli skeem,Bernoullikatsumused).

Tõenäosus saada täpselt x edu nendes n testid on võrdne:

Valimi õnnestumiste arv x on juhuslik muutuja, millel on Binoomjaotus(Inglise) Binoomlevitamine) lk ja n on selle jaotuse parameetrid.

Kandideerimiseks tuletage see meelde Bernoulli skeemid ja vastavalt binoomjaotus, peavad olema täidetud järgmised tingimused:

  • igal katsel peab olema täpselt kaks tulemust, mida tinglikult nimetatakse "edu" ja "ebaõnnestumine".
  • iga testi tulemus ei tohiks sõltuda eelmiste testide tulemustest (testi sõltumatus).
  • õnnestumise tõenäosus lk peaks olema kõigi testide jaoks konstantne.

Binoomjaotus MS EXCELIS

MS EXCELIS, alates versioonist 2010, jaoks Binoomjaotus on funktsioon BINOM.DIST() , Ingliskeelne nimi- BINOM.DIST(), mis võimaldab arvutada tõenäosuse, et valim on täpselt X"edu" (st. tõenäosustiheduse funktsioon p(x), vt ülaltoodud valemit) ja integraalne jaotusfunktsioon(tõenäosus, et proovis on x või vähem "edu", sealhulgas 0).

Enne MS EXCEL 2010 oli EXCELis funktsioon BINOMDIST(), mis võimaldab ka arvutada jaotusfunktsioon ja tõenäosustihedus p(x). BINOMDIST() on ühilduvuse tagamiseks jäetud MS EXCEL 2010-sse.

Näidisfail sisaldab graafikuid tõenäosusjaotuse tihedus ja .

Binoomjaotus omab tähistust B(n; lk) .

Märge: Ehitamiseks integraalne jaotusfunktsioon ideaalse sobivuse diagrammi tüüp Ajakava, jaoks jaotustihedusHistogramm koos rühmitamisega. Lisateavet diagrammide ehitamise kohta leiate artiklist Diagrammide peamised tüübid.

Märge: Näidisfaili valemite kirjutamise mugavuse huvides on loodud parameetrite nimed Binoomjaotus: n ja p.

Näidisfail näitab erinevaid tõenäosusarvutusi, kasutades MS EXCELi funktsioone:

Nagu ülaltoodud pildil näha, eeldatakse, et:

  • Lõpmatu üldkogum, millest valim tehakse, sisaldab 10% (või 0,1) häid elemente (parameeter lk, funktsiooni kolmas argument =BINOM.DIST() )
  • Arvutada tõenäosus, et 10 elemendist koosnevas valimis (parameeter n, funktsiooni teine ​​argument) on täpselt 5 kehtivat elementi (esimene argument), peate kirjutama valemi: =BINOM.DIST(5, 10, 0,1, VÄÄR)
  • Viimane, neljas element on seatud = FALSE, st. funktsiooni väärtus tagastatakse jaotustihedus.

Kui neljanda argumendi väärtus on TRUE, tagastab funktsioon BINOM.DIST() väärtuse integraalne jaotusfunktsioon või lihtsalt jaotusfunktsioon. Sel juhul saame arvutada tõenäosuse, et heade elementide arv valimis pärineb teatud vahemik, näiteks 2 või vähem (sh 0).

Selleks peate kirjutama valemi:
= BINOM.DIST(2, 10, 0,1, TÕENE)

Märge: x mittetäisarvulise väärtuse korral . Näiteks järgmised valemid tagastavad sama väärtuse:
=BINOM.DIST( 2 ; kümme; 0,1; TÕSI)
=BINOM.DIST( 2,9 ; kümme; 0,1; TÕSI)

Märge: Näidisfailis tõenäosustihedus ja jaotusfunktsioon arvutatakse ka definitsiooni ja funktsiooni COMBIN() abil.

Jaotusnäitajad

AT näidisfail lehel Näide Mõnede jaotusnäitajate arvutamiseks on olemas valemid:

  • =n*p;
  • (ruut standardhälve) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*JUUR(n*p*(1-p)).

Tuletame valemi matemaatiline ootus Binoomjaotus kasutades Bernoulli skeem.

Definitsiooni järgi juhuslik väärtus X sisse Bernoulli skeem(Bernoulli juhuslik muutuja) on jaotusfunktsioon:

Seda jaotust nimetatakse Bernoulli jaotus.

Märge: Bernoulli jaotuserijuhtum Binoomjaotus parameetriga n=1.

Loome 3 massiivi 100 numbrist koos erinevad tõenäosused edu: 0,1; 0,5 ja 0,9. Selleks aknas Juhuslike arvude genereerimine seatud järgmised parameetrid iga tõenäosuse p kohta:

Märge: kui määrate valiku Juhuslik hajumine (Juhuslik seeme), siis saate valida konkreetse juhuslik komplekt genereeritud numbrid. Näiteks määrates selle valiku =25, saate genereerida erinevates arvutites samu juhuslike arvude komplekte (juhul, kui muud jaotusparameetrid on muidugi samad). Suvandi väärtus võib võtta täisarvud vahemikus 1 kuni 32 767. Suvandi nimi Juhuslik hajumine võib segadusse ajada. Parem oleks see tõlkida kui Määrake arv juhuslike numbritega.

Selle tulemusena saame 3 veergu 100 numbriga, mille põhjal saame näiteks hinnata edu tõenäosust lk valemi järgi: Õnnestumiste arv/100(cm. näidisfailileht Bernoulli genereerimine).

Märge: Sest Bernoulli distributsioonid kui p=0,5, saate kasutada valemit =RANDBETWEEN(0;1) , mis vastab .

Juhuslike arvude genereerimine. Binoomjaotus

Oletame, et proovis on 7 defektset eset. See tähendab, et on "väga tõenäoline", et defektsete toodete osakaal on muutunud. lk, mis on meie tootmisprotsessile iseloomulik. Kuigi see olukord on "väga tõenäoline", on olemas võimalus (alfa risk, 1. tüüpi viga, "valehäire"). lk jäi muutumatuks ning defektsete toodete arvu suurenemine oli tingitud juhuslikust proovivõtust.

Nagu on näha alloleval joonisel, on 7 defektsete toodete arv, mis on vastuvõetav protsessi jaoks, mille p=0,21 sama väärtuse juures Alfa. See näitab, et kui proovis on defektsete esemete piirmäär ületatud, lk"tõenäoliselt" suurenenud. Väljend "kõige tõenäolisemalt" tähendab, et on vaid 10% tõenäosus (100%-90%), et defektsete toodete osakaalu hälve üle läve on tingitud ainult juhuslikest põhjustest.

Seega võib proovis olevate defektsete toodete künnise ületamine olla signaaliks, et protsess on häiritud ja hakkas tootma b. umbes suurem defektsete toodete protsent.

Märge: Enne MS EXCEL 2010 oli EXCELil funktsioon CRITBINOM() , mis on samaväärne funktsiooniga BINOM.INV() . CRITBINOM() jäetakse ühilduvuse tagamiseks MS EXCEL 2010 ja uuemates versioonides.

Binoomjaotuse seos teiste jaotustega

Kui parameeter n Binoomjaotus kipub lõpmatusse ja lk kipub olema 0, siis antud juhul Binoomjaotus saab ligikaudselt hinnata.
Tingimusi on võimalik sõnastada, kui lähendus Poissoni jaotus töötab hästi:

  • lk<0,1 (vähem lk ja veel n, seda täpsem on lähendus);
  • lk>0,9 (võttes seda arvesse q=1- lk, tuleb sel juhul arvutused teha kasutades q(a X tuleb asendada n- x). Seetõttu, mida vähem q ja veel n, seda täpsem on lähendus).

Kell 0,1<=p<=0,9 и n*p>10 Binoomjaotus saab ligikaudselt hinnata.

Omakorda Binoomjaotus võib olla hea ligikaudne väärtus, kui populatsiooni suurus on N Hüpergeomeetriline jaotus palju suurem kui valimi suurus n (st N>>n või n/N<<1).

Lisateavet ülaltoodud jaotuste seoste kohta saate lugeda artiklist. Seal tuuakse ka näiteid lähendusest ning selgitatakse tingimusi, millal see võimalik on ja millise täpsusega.

NÕUANNE: MS EXCELi muude distributsioonide kohta saate lugeda artiklist.

Tervitused kõigile lugejatele!

Statistiline analüüs, nagu teate, tegeleb reaalsete andmete kogumise ja töötlemisega. See on kasulik ja sageli kasumlik, sest. õiged järeldused võimaldavad teil tulevikus vigu ja kaotusi vältida ning mõnikord seda tulevikku õigesti arvata. Kogutud andmed peegeldavad mõne vaadeldud nähtuse olukorda. Andmed on sageli (kuid mitte alati) numbrilised ja neid saab täiendava teabe saamiseks erinevate matemaatiliste manipulatsioonidega töödelda.

Siiski ei mõõdeta kõiki nähtusi kvantitatiivsel skaalal nagu 1, 2, 3 ... 100500 ... Mitte alati ei saa nähtus omandada lõpmatus või suurel hulgal erinevaid olekuid. Näiteks võib inimese sugu olla kas M või F. Laskur kas tabab märklauda või läheb mööda. Hääletada saab kas poolt või vastu jne. jne. Teisisõnu peegeldavad sellised andmed alternatiivse atribuudi olekut – kas "jah" (sündmus on toimunud) või "ei" (sündmust pole toimunud). Tulevat sündmust (positiivset tulemust) nimetatakse ka "eduks". Sellised nähtused võivad olla ka massilised ja juhuslikud. Seetõttu saab neid mõõta ja teha statistiliselt kehtivaid järeldusi.

Selliste andmetega katseid nimetatakse Bernoulli skeem, kuulsa Šveitsi matemaatiku auks, kes leidis, et suure arvu katsete korral kaldub positiivsete tulemuste suhe katsete koguarvusse selle sündmuse toimumise tõenäosust.

Alternatiivne funktsioonimuutuja

Selleks, et analüüsis kasutada matemaatilist aparaati, tuleks selliste vaatluste tulemused numbrilisel kujul kirja panna. Selleks omistatakse positiivsele tulemusele number 1, negatiivsele - 0. Teisisõnu, tegemist on muutujaga, mis võib võtta ainult kaks väärtust: 0 või 1.

Mis kasu sellest saab? Tegelikult mitte vähem kui tavaandmetest. Niisiis, positiivsete tulemuste arvu on lihtne kokku lugeda – piisab, kui kõik väärtused kokku võtta, s.t. kõik 1 (õnnestus). Võite minna kaugemale, kuid selleks peate sisse viima paar tähistust.

Esimene asi, mida tuleb märkida, on see, et positiivsetel tulemustel (mis võrdub 1) on teatav tõenäosus. Näiteks mündiviskega peade saamine on ½ või 0,5. Seda tõenäosust tähistatakse traditsiooniliselt ladina tähega lk. Seetõttu on alternatiivse sündmuse toimumise tõenäosus 1-p, mida tähistatakse ka tähisega q, see on q = 1 – p. Neid tähistusi saab visuaalselt süstematiseerida muutuva jaotusplaadi kujul X.

Nüüd on meil võimalike väärtuste ja nende tõenäosuste loend. Võite hakata arvutama juhusliku suuruse selliseid suurepäraseid omadusi nagu oodatud väärtus ja dispersioon. Lubage mul teile meelde tuletada, et matemaatiline ootus arvutatakse kõigi võimalike väärtuste ja neile vastavate tõenäosuste korrutiste summana:

Arvutame eeldatava väärtuse ülaltoodud tabelite tähiste abil.

Selgub, et alternatiivse märgi matemaatiline ootus on võrdne selle sündmuse tõenäosusega - lk.

Nüüd määratleme, milline on alternatiivse tunnuse dispersioon. Lubage mul teile ka meelde tuletada, et dispersioon on matemaatilisest ootusest kõrvalekallete keskmine ruut. Üldvalem (diskreetsete andmete jaoks) on järgmine:

Siit tuleneb ka alternatiivse funktsiooni dispersioon:

On lihtne näha, et selle dispersiooni maksimaalne väärtus on 0,25 (at p=0,5).

Standardhälve – dispersiooni juur:

Maksimaalne väärtus ei ületa 0,5.

Nagu näete, on nii matemaatiline ootus kui ka alternatiivse märgi dispersioon väga kompaktse kujuga.

Juhusliku suuruse binoomjaotus

Nüüd kaaluge olukorda teise nurga alt. Tõepoolest, keda huvitab, et keskmine peade kaotus ühel viskel on 0,5? Seda on isegi võimatu ette kujutada. Huvitavam on tõstatada küsimus, mitu pead etteantud arvu visete korral tuleb.

Teisisõnu huvitab teadlast sageli teatud arvu edukate sündmuste toimumise tõenäosus. See võib olla testitud partii defektsete toodete arv (1 - defektne, 0 - hea) või taastumiste arv (1 - terve, 0 - haige) jne. Selliste "edukate" arv on võrdne muutuja kõigi väärtuste summaga X, st. üksikute tulemuste arv.

Juhuslik väärtus B nimetatakse binoomseks ja see võtab väärtused 0 kuni n(at B= 0 - kõik osad on head, koos B = n- kõik osad on defektsed). Eeldatakse, et kõik väärtused xüksteisest sõltumatud. Vaatleme binoommuutuja põhiomadusi, st määrame selle matemaatilise ootuse, dispersiooni ja jaotuse.

Binoommuutuja ootust on väga lihtne saada. Tuletage meelde, et igal lisaväärtusel on matemaatiliste ootuste summa ja see on kõigi jaoks sama, seetõttu:

Näiteks peade arvu ootus 100 viske korral on 100 × 0,5 = 50.

Nüüd tuletame binoommuutuja dispersiooni valemi. on dispersioonide summa. Siit

Standardhälve vastavalt

100 mündiviske puhul on standardhälve

Ja lõpuks võtame arvesse binoomsuuruse jaotust, s.t. tõenäosus, et juhuslik suurus B võtab erinevaid väärtusi k, kus 0≤k≤n. Mündi puhul võib see probleem kõlada järgmiselt: kui suur on tõenäosus saada 100 viskega 40 pead?

Arvutusmeetodi mõistmiseks kujutame ette, et münti visatakse vaid 4 korda. Kumbki pool võib iga kord välja kukkuda. Küsime endalt: kui suur on tõenäosus saada 4 viskest 2 pead. Iga vise on üksteisest sõltumatu. See tähendab, et suvalise kombinatsiooni saamise tõenäosus võrdub iga üksiku viske korral antud tulemuse tõenäosuste korrutisega. Olgu O pead ja P sabad. Siis võib näiteks üks meile sobivatest kombinatsioonidest välja näha OOPP, see tähendab:

Sellise kombinatsiooni tõenäosus on võrdne kahe pea tõusmise tõenäosuse ja veel kahe mittetõusmise tõenäosuse korrutisega (pöördsündmus arvutatakse järgmiselt 1-p), st. 0,5 × 0,5 × (1–0,5) × (1–0,5) = 0,0625. See on ühe meile sobiva kombinatsiooni tõenäosus. Aga küsimus oli kotkaste koguarvus, mitte mingis kindlas järjekorras. Seejärel peate lisama kõigi kombinatsioonide tõenäosused, milles on täpselt 2 kotkast. On selge, et need on kõik ühesugused (toode ei muutu tegurite kohtade muutmisest). Seetõttu peate arvutama nende arvu ja seejärel korrutama sellise kombinatsiooni tõenäosusega. Loeme kokku kõik 2 kotka 4 viske kombinatsioonid: RROO, RORO, ROOR, ORRO, OROR, OORR. Ainult 6 võimalust.

Seetõttu on soovitav tõenäosus saada 4 viske peale 2 pead 6×0,0625=0,375.

Sel viisil loendamine on aga tüütu. Juba 10 mündi puhul on toore jõuga valikute koguarvu hankimine väga keeruline. Seetõttu mõtlesid targad inimesed juba ammu välja valemi, mille abil arvutavad välja erinevate kombinatsioonide arvu n elemendid poolt k, kus n on elementide koguarv, k on elementide arv, mille paigutusvõimalusi arvutatakse. Kombineeritud valem n elemendid poolt k on:

Sarnased asjad toimuvad kombinatoorika rubriigis. Saadan sinna kõik, kes soovivad oma teadmisi täiendada. Sellest, muide, ka binoomjaotuse nimi (ülaltoodud valem on Newtoni binoomjaotuse laienduskoefitsient).

Tõenäosuse määramise valemit saab kergesti üldistada mis tahes arvule n ja k. Selle tulemusena on binoomjaotuse valemil järgmine vorm.

Teisisõnu: korrutage sobivate kombinatsioonide arv nende ühe tõenäosusega.

Praktiliseks kasutamiseks piisab lihtsalt binoomjaotuse valemi teadmisest. Ja te ei pruugi isegi teada – allpool on näidatud, kuidas Exceli abil tõenäosust määrata. Aga parem on teada.

Kasutame seda valemit, et arvutada tõenäosus saada 100 viskega 40 pead:

Või ainult 1,08%. Võrdluseks, selle katse matemaatilise ootuse tõenäosus ehk 50 pead on 7,96%. Binoomväärtuse maksimaalne tõenäosus kuulub matemaatilisele ootusele vastavale väärtusele.

Binoomjaotuse tõenäosuste arvutamine Excelis

Kui kasutate ainult paberit ja kalkulaatorit, on binoomjaotuse valemi abil arvutamine hoolimata integraalide puudumisest üsna keeruline. Näiteks väärtus 100! - sisaldab rohkem kui 150 tähemärki. Seda on võimatu käsitsi arvutada. Varem ja ka praegu kasutati selliste koguste arvutamiseks ligikaudseid valemeid. Hetkel on soovitav kasutada spetsiaalset tarkvara, näiteks MS Excelit. Seega saab iga kasutaja (isegi hariduselt humanist) kergesti arvutada binoomjaotusega juhusliku muutuja väärtuse tõenäosust.

Materjali koondamiseks kasutame Excelit esialgu tavalise kalkulaatorina, s.o. Teeme samm-sammult arvutuse binoomjaotuse valemi abil. Arvutame näiteks 50 pea saamise tõenäosuse. Allpool on pilt arvutuse sammude ja lõpptulemusega.

Nagu näha, on vahetulemused sellise mastaabiga, et ei mahu lahtrisse, kuigi igal pool kasutatakse lihtsaid tüüpi funktsioone: FACTOR (faktoriaalne arvutus), POWER (arvu tõstmine astmeks) samuti korrutamise ja jagamise operaatoritena. Pealegi on see arvutus üsna tülikas, igal juhul pole see kompaktne, kuna kaasatud paljud rakud. Ja jah, sellest on raske aru saada.

Üldiselt pakub Excel binoomjaotuse tõenäosuste arvutamiseks valmis funktsiooni. Funktsiooni nimi on BINOM.DIST.

Õnnestumiste arv on edukate katsete arv. Meil on neid 50.

Katsete arv- visete arv: 100 korda.

Õnnestumise tõenäosus– ühe viske peale peade saamise tõenäosus on 0,5.

Integraalne- näidatakse kas 1 või 0. Kui 0, siis arvutatakse tõenäosus P(B=k); kui 1, siis arvutatakse binoomjaotusfunktsioon, s.t. kõigi tõenäosuste summa alates B = 0 enne B=k kaasa arvatud.

Vajutame OK ja saame sama tulemuse nagu ülal, ainult kõik arvutati ühe funktsiooni järgi.

Väga mugav. Katse huvides paneme viimase parameetri 0 asemele 1. Saame 0,5398. See tähendab, et 100 mündiviske korral on tõenäosus saada päid vahemikus 0 kuni 50 peaaegu 54%. Ja alguses tundus, et peaks olema 50%. Üldiselt tehakse arvutused lihtsalt ja kiiresti.

Tõeline analüütik peab mõistma, kuidas funktsioon käitub (milline on selle jaotus), seega arvutame kõigi väärtuste tõenäosused vahemikus 0 kuni 100. See tähendab, küsigem endalt: kui suur on tõenäosus, et ükski kotkas ei kuku? et kukub 1 kotkas, 2, 3 , 50, 90 või 100. Arvestus on näidatud järgmisel iseliikuval pildil. Sinine joon on binoomjaotus ise, punane punkt on teatud arvu õnnestumiste tõenäosus k.

Võib küsida, kas pole binoomjaotus sarnane... Jah, väga sarnane. Isegi De Moivre (aastal 1733) ütles, et suurte valimite puhul läheneb binoomjaotus (ma ei tea, kuidas seda siis nimetati), kuid keegi ei kuulanud teda. Ainult Gauss ja seejärel 60–70 aastat hiljem Laplace avastasid normaaljaotuse seaduse uuesti ja uurisid seda hoolikalt. Ülaltoodud graafik näitab selgelt, et maksimaalne tõenäosus langeb matemaatilisele ootusele ja sellest kõrvalekaldudes väheneb see järsult. Täpselt nagu tavaline seadus.

Binoomjaotusel on suur praktiline tähtsus, seda esineb üsna sageli. Exceli abil tehakse arvutused lihtsalt ja kiiresti. Nii et kasutage seda julgelt.

Sellega seoses teen ettepaneku jätta hüvasti kuni järgmise koosolekuni. Kõike paremat, olge terved!

7. peatükk

Juhuslike suuruste jaotuse spetsiifilised seadused

Diskreetsete juhuslike suuruste jaotusseaduste tüübid

Olgu väärtused diskreetne juhuslik suurus X 1 , X 2 , …, x n, …. Nende väärtuste tõenäosusi saab arvutada erinevate valemite abil, kasutades näiteks tõenäosusteooria põhiteoreeme, Bernoulli valemit või mõnda muud valemit. Mõne sellise valemi puhul on jaotusseadusel oma nimi.

Diskreetse juhusliku suuruse levinumad jaotusseadused on binoom-, geomeetriline, hüpergeomeetriline, Poissoni jaotusseadus.

Binoomjaotuse seadus

Las toodetakse n sõltumatud katsed, millest igaühes võib sündmus toimuda, kuid ei pruugi juhtuda AGA. Selle sündmuse esinemise tõenäosus igas üksikus katses on konstantne, ei sõltu katse numbrist ja on võrdne R=R(AGA). Siit ka tõenäosus, et sündmust ei toimu AGA igas testis on samuti konstantne ja võrdne q=1–R. Vaatleme juhuslikku muutujat X võrdne sündmuse esinemiste arvuga AGA sisse n testid. On ilmne, et selle koguse väärtused on võrdsed

X 1 =0 – sündmus AGA sisse n teste ei ilmunud;

X 2 =1 – sündmus AGA sisse n katsed ilmusid üks kord;

X 3 =2 – sündmus AGA sisse n katsed ilmusid kaks korda;

…………………………………………………………..

x n +1 = n- sündmus AGA sisse n testid näitasid kõike nüks kord.

Nende väärtuste tõenäosusi saab arvutada Bernoulli valemi (4.1) abil:

kus juurde=0, 1, 2, …,n .

Binoomjaotuse seadus X võrdub õnnestumiste arvuga aastal n Bernoulli katsed, edu tõenäosusega R.

Seega on diskreetsel juhuslikul suurusel binoomjaotus (või jaotatud vastavalt binoomseadusele), kui selle võimalikud väärtused on 0, 1, 2, …, n, ja vastavad tõenäosused arvutatakse valemiga (7.1).

Binoomjaotus sõltub kahest parameetrid R ja n.

Binoomseaduse järgi jaotatud juhusliku suuruse jaotusrida on järgmisel kujul:

X k n
R

Näide 7.1 . Sihtmärki tehakse kolm iseseisvat lasku. Iga lasu tabamise tõenäosus on 0,4. Juhuslik väärtus X- sihtmärgi tabamuste arv. Koostage selle jaotusseeria.

Lahendus. Juhusliku suuruse võimalikud väärtused X on X 1 =0; X 2 =1; X 3 =2; X 4=3. Leidke Bernoulli valemi abil vastavad tõenäosused. Lihtne on näidata, et selle valemi kasutamine siin on igati õigustatud. Pange tähele, et tõenäosus, et ühe lasuga sihtmärki ei taba, on 1-0,4=0,6. Hangi

Jaotussarja vorm on järgmine:

X
R 0,216 0,432 0,288 0,064

Lihtne on kontrollida, kas kõigi tõenäosuste summa on võrdne 1-ga. Juhuslik suurus ise X jagatud binoomseaduse järgi. ■

Leiame binoomseaduse järgi jaotatud juhusliku suuruse matemaatilise ootuse ja dispersiooni.

Näite 6.5 lahendamisel näidati, et sündmuse esinemiste arvu matemaatiline ootus AGA sisse n sõltumatud testid, kui esinemise tõenäosus AGA igas testis on konstantne ja võrdne R, võrdub n· R

Selles näites kasutati juhuslikku muutujat, mis on jagatud binoomseaduse järgi. Seetõttu on näite 6.5 lahendus tegelikult järgmise teoreemi tõestus.

Teoreem 7.1. Binoomseaduse järgi jaotatud diskreetse juhusliku suuruse matemaatiline ootus on võrdne katsete arvu ja "edu" tõenäosuse korrutisega, s.o. M(X)=n· R.

Teoreem 7.2. Binoomseaduse järgi jaotatud diskreetse juhusliku suuruse dispersioon on võrdne katsete arvu korrutisega "edu" tõenäosusega ja "ebaõnnestumise" tõenäosusega, s.o. D(X)=npq.

Binoomseaduse järgi jaotatud juhusliku suuruse kalduvus ja kurtoos määratakse valemitega

Neid valemeid saab saada alg- ja keskmomendi mõistet kasutades.

Binoomjaotuse seadus on paljude tegelike olukordade aluseks. Suurte väärtuste jaoks n binoomjaotust saab lähendada teiste jaotustega, eriti Poissoni jaotusega.

Poissoni jaotus

Las olla n Bernoulli katsed koos katsete arvuga n piisavalt suur. Varem näidati, et sel juhul (kui lisaks on tõenäosus R arenguid AGA väga väike), et leida tõenäosus, et sündmus AGA ilmuma t testides saate kasutada Poissoni valemit (4.9). Kui juhuslik suurus X tähendab sündmuse esinemiste arvu AGA sisse n Bernoulli katsed, siis tõenäosus, et X saab tähenduse k saab arvutada valemiga

, (7.2)

kus λ = nr.

Poissoni jaotamise seadus nimetatakse diskreetse juhusliku suuruse jaotuseks X, mille võimalikud väärtused on mittenegatiivsed täisarvud ja tõenäosused p t need väärtused leitakse valemiga (7.2).

Väärtus λ = nr helistas parameeter Poissoni jaotus.

Poissoni seaduse järgi jaotatud juhuslik suurus võib omandada lõpmatu arvu väärtusi. Kuna selle jaotuse korral on tõenäosus R Sündmuse esinemine igas katses on väike, siis nimetatakse seda jaotust mõnikord haruldaste nähtuste seaduseks.

Poissoni seaduse järgi jaotatud juhusliku suuruse jaotusridadel on kuju

X t
R

Lihtne on kontrollida, kas teise rea tõenäosuste summa on võrdne 1-ga. Selleks peame meeles pidama, et funktsiooni saab laiendada Maclaurini seerias, mis koondub mis tahes X. Sel juhul on meil

. (7.3)

Nagu märgitud, asendab Poissoni seadus teatud piiravatel juhtudel binoomseadust. Näiteks on juhuslik muutuja X, mille väärtused on võrdsed rikete arvuga teatud aja jooksul tehnilise seadme korduval kasutamisel. Eeldatakse, et see seade on suure töökindlusega, s.t. ebaõnnestumise tõenäosus ühes rakenduses on väga väike.

Lisaks sellistele piiravatele juhtumitele on praktikas Poissoni seaduse järgi jaotatud juhuslikud muutujad, mis ei ole seotud binoomjaotusega. Näiteks Poissoni jaotust kasutatakse sageli ajaperioodi jooksul toimuvate sündmuste arvu käsitlemisel (telefonikeskjaama kõnede arv tunni jooksul, päeva jooksul autopesulasse saabunud autode arv, autopesulasse saabunud autode arv, autopesulale saabunud autode arv). masina peatumiste arv nädalas jne). Kõik need sündmused peavad moodustama nn sündmuste voo, mis on järjekorrateooria üks põhimõisteid. Parameeter λ iseloomustab sündmuste voo keskmist intensiivsust.

Binoomjaotus on diskreetselt muutuva juhusliku suuruse üks olulisemaid tõenäosusjaotusi. Binoomjaotus on arvu tõenäosusjaotus m sündmus AGA sisse nüksteisest sõltumatud vaatlused. Sageli sündmus AGA nimetatakse vaatluse "edu" ja vastupidine sündmus - "ebaõnnestumine", kuid see nimetus on väga tingimuslik.

Binoomjaotuse tingimused:

  • viidi läbi kokku n katsed, milles sündmus AGA võib tekkida või mitte;
  • sündmus AGA igas katses võib juhtuda sama tõenäosusega lk;
  • testid on üksteisest sõltumatud.

Tõenäosus, et sisse n testüritus AGA täpselt m korda, saab arvutada Bernoulli valemi abil:

,

kus lk- sündmuse toimumise tõenäosus AGA;

q = 1 - lk on vastupidise sündmuse toimumise tõenäosus.

Selgitame välja miks on binoomjaotus ülalkirjeldatud viisil seotud Bernoulli valemiga . Sündmus – kordaminekute arv kell n testid on jagatud mitmeks valikuks, millest igaühes saavutatakse edu m katsumused ja ebaõnnestumised - sisse n - m testid. Kaaluge ühte neist valikutest - B1 . Tõenäosuste liitmise reegli kohaselt korrutame vastupidiste sündmuste tõenäosused:

,

ja kui me tähistame q = 1 - lk, siis

.

Sama tõenäosusega on mõni muu valik, milles m edu ja n - m ebaõnnestumisi. Selliste valikute arv on võrdne võimaluste arvuga n proovi saada m edu.

Kõigi tõenäosuste summa m sündmuse number AGA(numbrid 0 kuni n) on võrdne ühega:

kus iga liige on Newtoni binoomi liige. Seetõttu nimetatakse vaadeldavat jaotust binoomjaotuseks.

Praktikas on sageli vaja arvutada tõenäosused "kõige rohkem m edu sisse n testid" või "vähemalt m edu sisse n testid". Selleks kasutatakse järgmisi valemeid.

Integraalfunktsioon, see tähendab tõenäosus F(m), mis sisse n vaatlusüritus AGA enam ei tule müks kord, saab arvutada järgmise valemi abil:

Omakorda tõenäosus F(≥m), mis sisse n vaatlusüritus AGA tule vähemalt müks kord, arvutatakse järgmise valemiga:

Mõnikord on mugavam arvutada tõenäosus, et sisse n vaatlusüritus AGA enam ei tule m korda, vastupidise sündmuse tõenäosuse kaudu:

.

Millist valemit kasutada, sõltub sellest, milline neist sisaldab vähem termineid.

Binoomjaotuse karakteristikud arvutatakse järgmiste valemite abil .

Oodatud väärtus: .

dispersioon: .

Standardhälve: .

Binoomjaotus ja arvutused MS Excelis

Binoomjaotuse tõenäosus P n ( m) ja integraalfunktsiooni väärtus F(m) saab arvutada MS Exceli funktsiooni BINOM.DIST abil. Vastava arvutuse aken on näidatud allpool (suurendamiseks klõpsake hiire vasakut nuppu).


MS Excel nõuab järgmiste andmete sisestamist:

  • õnnestumiste arv;
  • testide arv;
  • õnnestumise tõenäosus;
  • integraal - loogiline väärtus: 0 - kui teil on vaja arvutada tõenäosus P n ( m) ja 1 – kui tõenäosus F(m).

Näide 1 Ettevõtte juht võttis kokku info viimase 100 päeva müüdud kaamerate arvu kohta. Tabelis on kokku võetud teave ja arvutatud tõenäosus, et teatud arv kaameraid müüakse päevas.

Päev lõpeb kasumiga, kui müüakse 13 või enam kaamerat. Tõenäosus, et päev töötatakse kasumiga:

Tõenäosus, et päev töötatakse tulutult:

Olgu tõenäosus, et päev töötatakse välja kasumiga, konstantne ja võrdne 0,61-ga ning päevas müüdavate kaamerate arv ei sõltu päevast. Seejärel saate kasutada binoomjaotust, kus sündmus AGA- päev töötatakse välja kasumiga, - ilma kasumita.

Tõenäosus, et 6 päeva jooksul töötatakse kõik kasumiga välja:

.

Sama tulemuse saame MS Exceli funktsiooni BINOM.DIST abil (integraali väärtuseks on 0):

P 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Tõenäosus, et 6 päevast töötatakse kasumiga 4 või enam päeva:

kus ,

,

Kasutades MS Exceli funktsiooni BINOM.DIST, arvutame välja tõenäosuse, et 6 päevast ei saa kasumit rohkem kui 3 päeva (integraalväärtuse väärtus on 1):

P 6 (≤3 ) = BINOM.DIST(3; 6; 0,61; 1) = 0,435.

Tõenäosus, et 6 päeva jooksul töötatakse kõik kahjumiga:

,

Sama näitaja arvutame MS Exceli funktsiooni BINOM.DIST abil:

P 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Lahendage probleem ise ja seejärel vaadake lahendust

Näide 2 Urnis on 2 valget ja 3 musta palli. Urnist võetakse pall välja, värvitakse ja pannakse tagasi. Katset korratakse 5 korda. Valgete pallide ilmumiste arv on diskreetne juhuslik suurus X, jaotatud binoomseaduse järgi. Koostage juhusliku suuruse jaotuse seadus. Määrake režiim, matemaatiline ootus ja dispersioon.

Jätkame koos probleemide lahendamist

Näide 3 Kulleriteenistusest läks objektidele n= 5 kullerit. Iga kuller tõenäosusega lk= 0,3 hilineb objekti jaoks sõltumata teistest. Diskreetne juhuslik suurus X- hilinenud kullerite arv. Koostage selle juhusliku suuruse jaotusseeria. Leidke selle matemaatiline ootus, dispersioon, standardhälve. Leidke tõenäosus, et vähemalt kaks kullerit jäävad objektidele hiljaks.