Biografije Karakteristike Analiza

Funkcija binomne distribucije. Varijanca binomne distribucije


Naravno, pri izračunu funkcije kumulativne distribucije treba koristiti spomenuti odnos između binomne i beta distribucije. Ova metoda je svakako bolja od izravnog zbrajanja kada je n > 10.

U klasičnim udžbenicima statistike, za dobivanje vrijednosti binomne distribucije, često se preporučuje korištenje formula temeljenih na graničnim teoremima (kao što je Moivre-Laplaceova formula). Treba napomenuti da s čisto računalne točke gledišta vrijednost ovih teorema je blizu nule, pogotovo sada, kada je moćno računalo na gotovo svakom stolu. Glavni nedostatak gornjih aproksimacija je njihova potpuno nedovoljna točnost za vrijednosti n tipične za većinu primjena. Ništa manji nedostatak je nepostojanje bilo kakvih jasnih preporuka o primjenjivosti jedne ili druge aproksimacije (u standardnim tekstovima dane su samo asimptotske formulacije, nisu popraćene procjenama točnosti i stoga su od male koristi). Rekao bih da obje formule vrijede samo za n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Ovdje ne razmatram problem pronalaženja kvantila: za diskretne distribucije on je trivijalan, au onim problemima gdje se takve distribucije pojavljuju, u pravilu nije relevantan. Ako su kvantili i dalje potrebni, preporučujem preformuliranje problema na takav način da se radi s p-vrijednostima (promatrane značajnosti). Evo primjera: kod implementacije nekih algoritama za nabrajanje, u svakom koraku potrebno je provjeriti statistička hipoteza o binomnoj slučajnoj varijabli. Prema klasični pristup u svakom koraku potrebno je izračunati kriterijsku statistiku i usporediti njezinu vrijednost s granicom kritičnog skupa. Kako je, međutim, algoritam enumerativan, potrebno je svaki put iznova odrediti granicu kritičnog skupa (uostalom, veličina uzorka se mijenja od koraka do koraka), što neproduktivno povećava vremenske troškove. Moderan pristup preporučuje izračunavanje uočene značajnosti i usporedbu s razina povjerenja, štedeći na traženju kvantila.

Stoga sljedeći kodovi ne izračunavaju inverznu funkciju, umjesto toga dana je funkcija rev_binomialDF, koja izračunava vjerojatnost p uspjeha u jednom pokušaju s obzirom na broj n pokušaja, broj m uspjeha u njima i vrijednost y vjerojatnosti postizanja ovih m uspjeha. Ovo koristi gore spomenuti odnos između binomne i beta distribucije.

Zapravo, ova vam funkcija omogućuje dobivanje granica intervala pouzdanosti. Doista, pretpostavimo da smo postigli m uspjeha u n binomnih pokusa. Kao što znate, lijeva granica je dvostrana interval pouzdanosti za parametar p s razinom pouzdanosti je 0 ako je m = 0, a za je rješenje jednadžbe . Slično, desna granica je 1 ako je m = n, a for je rješenje jednadžbe . To implicira da, kako bismo pronašli lijevu granicu, moramo riješiti jednadžbu , i tražiti onu pravu - jednadžbu . Rješavaju se u funkcijama binom_leftCI i binom_rightCI , koje vraćaju gornju odnosno donju granicu dvostranog intervala pouzdanosti.

Želim napomenuti da ako nije potrebna apsolutno nevjerojatna točnost, onda za dovoljno veliki n, možete koristiti sljedeću aproksimaciju [B.L. van der Waerden, Matematička statistika. M: IL, 1960, Ch. 2, sek. 7]: , gdje je g kvantil normalna distribucija. Vrijednost ove aproksimacije je u tome što postoje vrlo jednostavne aproksimacije koje vam omogućuju izračunavanje kvantila normalne distribucije (pogledajte tekst o izračunavanju normalne distribucije i odgovarajući odjeljak ove reference). U mojoj praksi (uglavnom za n > 100) ova aproksimacija je davala oko 3-4 znamenke, što je u pravilu sasvim dovoljno.

Izračuni sa sljedećim kodovima zahtijevaju datoteke betaDF.h, betaDF.cpp (pogledajte odjeljak o beta distribuciji), kao i logGamma.h, logGamma.cpp (pogledajte dodatak A). Također možete vidjeti primjer korištenja funkcija.

binomialDF.h datoteka

#ifndef __BINOMIAL_H__ #include "betaDF.h" dvostruki binomDF(dvostruki pokušaji, dvostruki uspjesi, dvostruki p); /* * Neka postoje "pokusi" neovisnih opažanja * s vjerojatnošću "p" uspjeha u svakom. * Izračunajte vjerojatnost B(uspjesi|pokusi,p) da je broj * uspjeha između 0 i "uspjeha" (uključujući). */ double rev_binomialDF(dvostruki pokušaji, dvostruki uspjesi, dvostruki y); /* * Neka je vjerojatnost y od najmanje m uspjeha * poznata u ispitivanjima Bernoullijeve sheme. Funkcija pronalazi vjerojatnost p * uspjeha u jednom pokušaju. * * U izračunima se koristi sljedeća relacija * * 1 - p = rev_Beta(pokusi-uspjesi| uspjesi+1, y). */ double binom_leftCI(dvostruki pokušaji, dvostruki uspjesi, dvostruka razina); /* Neka postoje "pokusi" neovisnih opažanja * s vjerojatnošću "p" uspjeha u svakom * i broj uspjeha je "uspjesi". * Lijeva granica dvostranog intervala pouzdanosti * izračunava se s razinom razine značajnosti. */ double binom_rightCI(double n, dvostruki uspjesi, dvostruka razina); /* Neka postoje "pokusi" neovisnih opažanja * s vjerojatnošću "p" uspjeha u svakom * i broj uspjeha je "uspjesi". * Desna granica dvostranog intervala pouzdanosti * izračunava se s razinom razine značajnosti. */ #endif /* Završava #ifndef __BINOMIAL_H__ */

datoteka binomialDF.cpp

/************************************************ **** **********/ /* Binomna distribucija */ /**************************** **** ***************************/ #uključi #uključi #include "betaDF.h" ULAZ double binomialDF(double n, double m, double p) /* * Neka postoji "n" neovisnih opažanja * s vjerojatnošću "p" uspjeha u svakom. * Izračunajte vjerojatnost B(m|n,p) da je broj uspjeha * između 0 i "m" (uključivo), tj. * iznos binomne vjerojatnosti od 0 do m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Izračuni ne podrazumijevaju grubo zbrajanje - koristite * sljedeću poveznicu na središnju beta distribuciju: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Argumenti moraju biti pozitivni, s 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (str<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) povratak 1; inače vrati BetaDF(n-m, m+1).vrijednost(1-p); )/* binomialDF */ ULAZ double rev_binomialDF(double n, double m, double y) /* * Neka je vjerojatnost y od najmanje m uspjeha * poznata u n pokušaja Bernoullijeve sheme. Funkcija pronalazi vjerojatnost p * uspjeha u jednom pokušaju. * * U izračunima se koristi sljedeća relacija * * 1 - p = rev_Beta(y|n-m,m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Razmotrite binomnu distribuciju, izračunajte njezino matematičko očekivanje, varijancu, modus. Pomoću MS EXCEL funkcije BINOM.DIST() iscrtat ćemo grafove funkcije distribucije i gustoće vjerojatnosti. Procijenimo parametar distribucije p, matematičko očekivanje distribucija i standardna devijacija. Također razmotrite Bernoullijevu distribuciju.

Definicija. Neka se drže n testovi, u svakom od kojih se mogu dogoditi samo 2 događaja: događaj "uspjeh" s vjerojatnošću str ili događaj "neuspjeh" s vjerojatnošću q =1-p (tzv Bernoullijeva shema,Bernoullisuđenja).

Vjerojatnost dobivanja točno x uspjeh u ovim n testovi jednaki su:

Broj uspjeha u uzorku x je slučajna varijabla koja ima Binomna distribucija(Engleski) Binomnidistribucija) str I n su parametri ove distribucije.

Prisjetite se toga kako biste se prijavili Bernoullijeve sheme i shodno tome binomna distribucija, moraju biti ispunjeni sljedeći uvjeti:

  • svaki pokušaj mora imati točno dva ishoda, uvjetno nazvana "uspjeh" i "neuspjeh".
  • rezultat svakog testa ne smije ovisiti o rezultatima prethodnih testova (nezavisnost testa).
  • stopa uspjeha str treba biti konstantan za sve testove.

Binomna distribucija u MS EXCEL-u

U MS EXCEL-u, počevši od verzije 2010, za Binomna distribucija postoji funkcija BINOM.DIST() , englesko ime- BINOM.DIST(), koji vam omogućuje izračunavanje vjerojatnosti da će uzorak biti točan x"uspjesi" (tj. funkcija gustoće vjerojatnosti p(x), vidi gornju formulu), i funkcija integralne distribucije(vjerojatnost da će uzorak imati x ili manje "uspjeha", uključujući 0).

Prije MS EXCEL-a 2010, EXCEL je imao funkciju BINOMDIST(), koja vam također omogućuje izračunavanje distribucijska funkcija I gustoća vjerojatnosti p(x). BINOMDIST() je ostavljen u MS EXCEL 2010 radi kompatibilnosti.

Datoteka primjera sadrži grafikone gustoća distribucije vjerojatnosti I .

Binomna distribucija ima oznaku B(n; str) .

Bilješka: Za izgradnju funkcija integralne distribucije tip karte savršenog pristajanja Raspored, Za gustoća distribucijeHistogram s grupiranjem. Za više informacija o izradi grafikona pročitajte članak Glavne vrste grafikona.

Bilješka: Radi lakšeg pisanja formula u datoteku primjera, stvoreni su nazivi za parametre Binomna distribucija: n i str.

Datoteka primjera prikazuje različite izračune vjerojatnosti pomoću MS EXCEL funkcija:

Kao što se vidi na gornjoj slici, pretpostavlja se da:

  • Beskonačna populacija iz koje je napravljen uzorak sadrži 10% (ili 0,1) dobrih elemenata (parametar str, treći argument funkcije =BINOM.DIST() )
  • Za izračunavanje vjerojatnosti da će u uzorku od 10 elemenata (parametar n, drugi argument funkcije) bit će točno 5 valjanih elemenata (prvi argument), trebate napisati formulu: =BINOM.DIST(5, 10, 0,1, FALSE)
  • Posljednji, četvrti element postavljen je = FALSE, tj. vraća se vrijednost funkcije gustoća distribucije.

Ako je vrijednost četvrtog argumenta = TRUE, tada funkcija BINOM.DIST() vraća vrijednost funkcija integralne distribucije ili jednostavno distribucijska funkcija. U ovom slučaju možemo izračunati vjerojatnost da će broj dobrih elemenata u uzorku biti od određeni raspon, na primjer, 2 ili manje (uključujući 0).

Da biste to učinili, morate napisati formulu:
= BINOM.DIST(2, 10, 0,1, TRUE)

Bilješka: Za vrijednost x koja nije cijeli broj, . Na primjer, sljedeće formule vratit će istu vrijednost:
=BINOM.DIST( 2 ; 10; 0,1; PRAVI)
=BINOM.DIST( 2,9 ; 10; 0,1; PRAVI)

Bilješka: U primjeru datoteke gustoća vjerojatnosti I distribucijska funkcija također izračunati pomoću definicije i funkcije COMBIN().

Pokazatelji distribucije

U primjer datoteke na listu Primjer postoje formule za izračun nekih pokazatelja distribucije:

  • =n*p;
  • (kvadrat standardne devijacije) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Izvodimo formulu matematičko očekivanje Binomna distribucija korištenjem Bernoullijeva shema.

A-priorat slučajna vrijednost X in Bernoullijeva shema(Bernoullijeva slučajna varijabla) ima distribucijska funkcija:

Ova distribucija se zove Bernoullijeva distribucija.

Bilješka: Bernoullijeva distribucijaposeban slučaj Binomna distribucija s parametrom n=1.

Generirajmo 3 niza od 100 brojeva s različite vjerojatnosti uspješnost: 0,1; 0,5 i 0,9. Da biste to učinili, u prozoru Generiranje slučajnih brojeva postaviti sljedeće parametre za svaku vjerojatnost p:

Bilješka: Ako postavite opciju Nasumično rasipanje (Nasumično sjeme), tada možete odabrati određeni slučajni skup generirani brojevi. Na primjer, postavljanjem ove opcije =25, možete generirati iste skupove nasumičnih brojeva na različitim računalima (ako su, naravno, ostali parametri distribucije isti). Vrijednost opcije može imati cjelobrojne vrijednosti od 1 do 32 767. Naziv opcije Nasumično rasipanje može zbuniti. Bolje bi bilo prevesti kao Postavite broj s nasumičnim brojevima.

Kao rezultat, imat ćemo 3 stupca od 100 brojeva, na temelju kojih npr. možemo procijeniti vjerojatnost uspjeha str prema formuli: Broj uspjeha/100(cm. list primjera datoteke Generiranje Bernoullija).

Bilješka: Za Bernoullijeve distribucije s p=0,5, možete koristiti formulu =RANDBETWEEN(0;1) , što odgovara .

Generiranje slučajnih brojeva. Binomna distribucija

Pretpostavimo da u uzorku ima 7 neispravnih artikala. To znači da je "vrlo vjerojatno" da se udio neispravnih proizvoda promijenio. str, što je karakteristika našeg proizvodnog procesa. Iako je ova situacija "vrlo vjerojatna", postoji mogućnost (alfa rizik, pogreška tipa 1, "lažni alarm") da str ostala nepromijenjena, a do povećanog broja neispravnih proizvoda došlo je zbog slučajnog uzorkovanja.

Kao što se može vidjeti na donjoj slici, 7 je broj neispravnih proizvoda koji je prihvatljiv za proces s p=0,21 pri istoj vrijednosti Alfa. Ovo ilustrira da kada se prekorači prag neispravnih artikala u uzorku, str“vjerojatno” povećao. Izraz "najvjerojatnije" znači da postoji samo 10% šanse (100%-90%) da je odstupanje postotka neispravnih proizvoda iznad praga uzrokovano samo slučajnim uzrocima.

Prema tome, prekoračenje praga broja neispravnih proizvoda u uzorku može poslužiti kao signal da je proces poremećen i počeo proizvoditi b oko veći postotak neispravnih proizvoda.

Bilješka: Prije MS EXCEL-a 2010, EXCEL je imao funkciju CRITBINOM() , koja je ekvivalentna BINOM.INV() . CRITBINOM() je ostavljen u MS EXCEL 2010 i novijim verzijama radi kompatibilnosti.

Odnos binomne distribucije s drugim distribucijama

Ako je parametar n Binomna distribucija teži beskonačnosti i str teži 0, onda u ovom slučaju Binomna distribucija može se približno odrediti.
Moguće je formulirati uvjete kada aproksimacija Poissonova distribucija radi dobro:

  • str<0,1 (manje str i više n, što je aproksimacija točnija);
  • str>0,9 (s obzirom na to q=1- str, izračuni u ovom slučaju moraju se izvesti pomoću q(A x treba zamijeniti s n- x). Stoga, što manje q i više n, što je aproksimacija točnija).

Na 0,1<=p<=0,9 и n*p>10 Binomna distribucija može se približno odrediti.

Sa svoje strane, Binomna distribucija može poslužiti kao dobra aproksimacija kada je veličina populacije N Hipergeometrijska raspodjela mnogo veći od veličine uzorka n (tj. N>>n ili n/N<<1).

Više o odnosu navedenih raspodjela možete pročitati u članku. Tu su također navedeni primjeri aproksimacije te su objašnjeni uvjeti kada je to moguće i s kojom točnošću.

SAVJET: O ostalim distribucijama MS EXCEL-a možete pročitati u članku.

Pozdrav svim čitateljima!

Statistička analiza, kao što znate, bavi se prikupljanjem i obradom stvarnih podataka. Korisno je, a često i isplativo, jer. ispravni zaključci omogućuju vam da izbjegnete pogreške i gubitke u budućnosti, a ponekad i točno pogodite ovu budućnost. Prikupljeni podaci odražavaju stanje neke promatrane pojave. Podaci su često (ali ne uvijek) numerički i njima se može manipulirati raznim matematičkim manipulacijama kako bi se izvukle dodatne informacije.

Međutim, ne mjere se sve pojave u kvantitativnoj ljestvici poput 1, 2, 3 ... 100 500 ... Ne može uvijek pojava poprimiti beskonačan ili velik broj različitih stanja. Na primjer, spol osobe može biti M ili Ž. Strijelac ili pogađa metu ili promašuje. Možete glasati "za" ili "protiv", itd. i tako dalje. Drugim riječima, takvi podaci odražavaju stanje alternativnog atributa - ili "da" (događaj se dogodio) ili "ne" (događaj se nije dogodio). Nadolazeći događaj (pozitivan ishod) također se naziva "uspjeh". Takve pojave također mogu biti masovne i nasumične. Stoga ih je moguće mjeriti i donositi statistički valjane zaključke.

Pokusi s takvim podacima nazivaju se Bernoullijeva shema, u čast slavnog švicarskog matematičara koji je otkrio da s velikim brojem pokusa omjer pozitivnih ishoda prema ukupnom broju pokusa teži vjerojatnosti da se taj događaj dogodi.

Varijabla alternativne značajke

Da bi se koristio matematički aparat u analizi, rezultate takvih opažanja treba zapisati u numeričkom obliku. Da bismo to učinili, pozitivnom ishodu se dodjeljuje broj 1, negativnom - 0. Drugim riječima, imamo posla s varijablom koja može imati samo dvije vrijednosti: 0 ili 1.

Kakva se korist može izvući iz ovoga? Zapravo, ništa manje nego iz običnih podataka. Dakle, lako je izbrojati pozitivne ishode - dovoljno je zbrojiti sve vrijednosti, tj. sve 1 (uspjeh). Možete ići dalje, ali za ovo morate uvesti nekoliko notacija.

Prvo što treba primijetiti jest da pozitivni ishodi (koji su jednaki 1) imaju određenu vjerojatnost da će se dogoditi. Na primjer, dobivanje glava pri bacanju novčića je ½ ili 0,5. Ta se vjerojatnost tradicionalno označava latiničnim slovom str. Stoga je vjerojatnost da se dogodi alternativni događaj 1-str, što je također označeno sa q, to je q = 1 – str. Ove oznake mogu se vizualno sistematizirati u obliku varijabilne distribucijske ploče x.

Sada imamo popis mogućih vrijednosti i njihove vjerojatnosti. Možete početi računati tako divne karakteristike slučajne varijable kao što je očekivana vrijednost I disperzija. Dopustite mi da vas podsjetim da se matematičko očekivanje izračunava kao zbroj proizvoda svih mogućih vrijednosti i njihovih odgovarajućih vjerojatnosti:

Izračunajmo očekivanu vrijednost koristeći oznake u gornjim tablicama.

Ispada da je matematičko očekivanje alternativnog znaka jednako vjerojatnosti ovog događaja - str.

Sada definirajmo što je varijanca alternativnog obilježja. Dopustite mi da vas također podsjetim da je varijanca srednji kvadrat odstupanja od matematičkog očekivanja. Opća formula (za diskretne podatke) je:

Otuda varijanca alternativne značajke:

Lako je vidjeti da ova disperzija ima najviše 0,25 (at p=0,5).

Standardna devijacija - korijen varijance:

Maksimalna vrijednost ne prelazi 0,5.

Kao što možete vidjeti, i matematičko očekivanje i varijanca alternativnog predznaka imaju vrlo kompaktan oblik.

Binomna distribucija slučajne varijable

Sada razmotrite situaciju iz drugog kuta. Doista, koga briga što je prosječni gubitak glava pri jednom bacanju 0,5? To je čak nemoguće zamisliti. Zanimljivije je postaviti pitanje broja glava koje dolaze za određeni broj bacanja.

Drugim riječima, istraživača često zanima vjerojatnost da će se dogoditi određeni broj uspješnih događaja. To može biti broj neispravnih proizvoda u testiranoj seriji (1 - neispravan, 0 - dobar) ili broj oporavka (1 - zdrav, 0 - bolesno), itd. Broj takvih "uspjeha" bit će jednak zbroju svih vrijednosti varijable x, tj. broj pojedinačnih ishoda.

Slučajna vrijednost B naziva se binom i ima vrijednosti od 0 do n(na B= 0 - svi dijelovi su dobri, sa B = n- svi dijelovi su neispravni). Pretpostavlja se da sve vrijednosti x neovisni jedni o drugima. Razmotrimo glavne karakteristike binomne varijable, odnosno utvrdit ćemo njezino matematičko očekivanje, varijancu i distribuciju.

Očekivanje binomne varijable je vrlo lako dobiti. Podsjetimo, postoji zbroj matematičkih očekivanja svake dodane vrijednosti, i isti je za sve, dakle:

Na primjer, očekivani broj glava u 100 bacanja je 100 × 0,5 = 50.

Sada izvodimo formulu za varijancu binomne varijable. je zbroj varijanci. Odavde

Standardna devijacija, odnosno

Za 100 bacanja novčića, standardna devijacija je

I na kraju, razmotrite distribuciju binomne količine, tj. vjerojatnost da slučajna varijabla B poprimit će različite vrijednosti k, Gdje 0≤k≤n. Za novčić bi ovaj problem mogao zvučati ovako: koja je vjerojatnost da dobijete 40 glava u 100 bacanja?

Da bismo razumjeli metodu izračuna, zamislimo da je novčić bačen samo 4 puta. Svaki put može ispasti bilo koja strana. Pitamo se: koja je vjerojatnost da dobijemo 2 glave od 4 bacanja. Svako bacanje je neovisno jedno o drugom. To znači da će vjerojatnost dobivanja bilo koje kombinacije biti jednaka umnošku vjerojatnosti danog ishoda za svako pojedinačno bacanje. Neka O budu glave, a P repovi. Tada, na primjer, jedna od kombinacija koja nam odgovara može izgledati kao OOPP, tj.

Vjerojatnost takve kombinacije jednaka je umnošku dviju vjerojatnosti da će doći do golova i još dvije vjerojatnosti da neće doći do heads-a (obrnuti događaj izračunat kao 1-str), tj. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. To je vjerojatnost jedne od kombinacija koje nam odgovaraju. Ali pitanje je bilo o ukupnom broju orlova, a ne o nekom određenom poretku. Zatim treba zbrojiti vjerojatnosti svih kombinacija u kojima su točno 2 orla. Jasno je da su svi isti (umnožak se ne mijenja promjenom mjesta faktora). Stoga morate izračunati njihov broj, a zatim pomnožiti s vjerojatnošću bilo koje takve kombinacije. Prebrojimo sve kombinacije od 4 bacanja 2 orla: RROO, RORO, ROOR, ORRO, OROR, OORR. Samo 6 opcija.

Stoga je željena vjerojatnost dobivanja 2 glave nakon 4 bacanja 6×0,0625=0,375.

Međutim, brojanje na ovaj način je zamorno. Već za 10 kovanica bit će vrlo teško brutalnom silom dobiti ukupan broj opcija. Stoga su pametni ljudi davno izmislili formulu uz pomoć koje izračunavaju broj različitih kombinacija n elementi po k, Gdje n je ukupan broj elemenata, k je broj elemenata čije su opcije rasporeda izračunate. Formula kombinacije od n elementi po k je:

Slično se događa i u kombinatorici. Tamo šaljem sve koji žele usavršiti svoje znanje. Otuda, uzgred, i naziv binomne distribucije (gornja formula je koeficijent u proširenju Newtonovog binoma).

Formula za određivanje vjerojatnosti može se lako generalizirati na bilo koji broj n I k. Kao rezultat, formula binomne distribucije ima sljedeći oblik.

Drugim riječima: pomnožite broj odgovarajućih kombinacija s vjerojatnošću jedne od njih.

Za praktičnu upotrebu dovoljno je jednostavno znati formulu za binomnu distribuciju. A možda čak i ne znate - ispod je kako odrediti vjerojatnost pomoću Excela. Ali bolje je znati.

Upotrijebimo ovu formulu za izračun vjerojatnosti dobivanja 40 glava u 100 bacanja:

Ili samo 1,08 posto. Usporedbe radi, vjerojatnost matematičkog očekivanja ovog pokusa, odnosno 50 grla, iznosi 7,96%. Najveća vjerojatnost binomne vrijednosti pripada vrijednosti koja odgovara matematičkom očekivanju.

Izračunavanje vjerojatnosti binomne distribucije u Excelu

Ako koristite samo papir i kalkulator, izračuni pomoću formule binomne distribucije, unatoč nedostatku integrala, prilično su teški. Na primjer, vrijednost 100! - ima više od 150 znakova. Nemoguće je to izračunati ručno. Prije, pa čak i sada, za izračunavanje takvih količina korištene su približne formule. Trenutno je preporučljivo koristiti poseban softver, kao što je MS Excel. Dakle, svaki korisnik (čak i humanist po obrazovanju) može lako izračunati vjerojatnost vrijednosti binomno distribuirane slučajne varijable.

Za učvršćivanje gradiva koristit ćemo Excel za sada kao obični kalkulator, tj. Napravimo izračun korak po korak pomoću formule binomne distribucije. Izračunajmo, na primjer, vjerojatnost dobivanja 50 grla. Ispod je slika s koracima izračuna i konačnim rezultatom.

Kao što vidite, međurezultati su takvog razmjera da ne stanu u ćeliju, iako se posvuda koriste jednostavne funkcije tipa: FACTOR (izračun faktorijala), POWER (podizanje broja na potenciju), također kao operatori množenja i dijeljenja. Štoviše, ovaj izračun je prilično glomazan, u svakom slučaju nije kompaktan, jer mnoge uključene stanice. I da, teško je to shvatiti.

Općenito, Excel nudi gotovu funkciju za izračunavanje vjerojatnosti binomne distribucije. Funkcija se zove BINOM.DIST.

Broj uspjeha je broj uspješnih pokušaja. Imamo ih 50.

Broj pokušaja- broj bacanja: 100 puta.

Vjerojatnost uspjeha– vjerojatnost dobivanja glava pri jednom bacanju je 0,5.

Sastavni- naznačeno je 1 ili 0. Ako je 0, izračunava se vjerojatnost P(B=k); ako je 1, tada se izračunava funkcija binomne distribucije, tj. zbroj svih vjerojatnosti iz B=0 prije B=k uključivo.

Pritisnemo OK i dobijemo isti rezultat kao gore, samo je sve izračunala jedna funkcija.

Vrlo udobno. Eksperimenta radi, umjesto posljednjeg parametra 0, stavili smo 1. Dobili smo 0,5398. To znači da je u 100 bacanja novčića vjerojatnost dobivanja glava između 0 i 50 gotovo 54%. I isprva se činilo da bi trebalo biti 50%. Općenito, izračuni se izvode jednostavno i brzo.

Pravi analitičar mora razumjeti kako se funkcija ponaša (kakva je njena distribucija), pa izračunajmo vjerojatnosti za sve vrijednosti od 0 do 100. Odnosno, zapitajmo se: kolika je vjerojatnost da niti jedan orao ne padne, da će pasti 1 orao, 2, 3, 50, 90 ili 100. Izračun je prikazan na sljedećoj samopokretnoj slici. Plava linija je sama binomna distribucija, crvena točka je vjerojatnost za određeni broj uspjeha k.

Netko bi se mogao zapitati, nije li binomna distribucija slična... Da, vrlo slična. Čak je i De Moivre (1733.) rekao da se s velikim uzorcima približava binomna distribucija (ne znam kako se to tada zvalo), ali nitko ga nije slušao. Tek su Gauss, a potom i Laplace, 60-70 godina kasnije, ponovno otkrili i pažljivo proučili zakon normalne distribucije. Gornji grafikon jasno pokazuje da maksimalna vjerojatnost pada na matematičko očekivanje, a kako ono od njega odstupa, naglo opada. Kao normalan zakon.

Binomna raspodjela je od velike praktične važnosti, pojavljuje se prilično često. Koristeći Excel, izračuni se izvode jednostavno i brzo. Stoga ga slobodno koristite.

Na ovome predlažem da se oprostimo do sljedećeg sastanka. Sve najbolje, zdravi bili!

Poglavlje 7

Specifični zakoni raspodjele slučajnih varijabli

Vrste zakona distribucije diskretnih slučajnih varijabli

Neka diskretna slučajna varijabla poprima vrijednosti x 1 , x 2 , …, x n, … . Vjerojatnosti ovih vrijednosti mogu se izračunati pomoću različitih formula, na primjer, pomoću osnovnih teorema teorije vjerojatnosti, Bernoullijeve formule ili nekih drugih formula. Za neke od ovih formula zakon raspodjele ima svoje ime.

Najčešći zakoni distribucije diskretne slučajne varijable su binomni, geometrijski, hipergeometrijski, Poissonov zakon distribucije.

Binomni zakon distribucije

Neka se proizvodi n neovisna ispitivanja, u svakom od njih se događaj može ili ne mora dogoditi A. Vjerojatnost pojave ovog događaja u svakom pojedinačnom pokusu je konstantna, ne ovisi o broju pokusa i jednaka je R=R(A). Otuda vjerojatnost da se događaj neće dogoditi A u svakom testu je također konstantan i jednak q=1–R. Razmotrimo slučajnu varijablu x jednak broju pojavljivanja događaja A V n testovi. Očito je da su vrijednosti ove količine jednake

x 1 =0 - događaj A V n testovi se nisu pojavili;

x 2 =1 – događaj A V n suđenja su se pojavila jednom;

x 3 =2 - događaj A V n suđenja su se pojavila dva puta;

…………………………………………………………..

x n +1 = n- događaj A V n testovi su se pojavili sve n jednom.

Vjerojatnosti ovih vrijednosti mogu se izračunati pomoću Bernoullijeve formule (4.1):

Gdje Do=0, 1, 2, …,n .

Binomni zakon distribucije x jednak broju uspjeha u n Bernoullijeva ispitivanja, s vjerojatnošću uspjeha R.

Dakle, diskretna slučajna varijabla ima binomnu distribuciju (ili je raspoređena prema binomnom zakonu) ako su njene moguće vrijednosti 0, 1, 2, …, n, a odgovarajuće vjerojatnosti izračunavaju se formulom (7.1).

Binomna distribucija ovisi o dva parametri R I n.

Niz distribucije slučajne varijable raspodijeljen prema binomnom zakonu ima oblik:

x k n
R

Primjer 7.1 . U metu se ispaljuju tri neovisna hica. Vjerojatnost pogađanja svakog udarca je 0,4. Slučajna vrijednost x- broj pogodaka u metu. Konstruirajte njegovu distribucijsku seriju.

Riješenje. Moguće vrijednosti slučajne varijable x su x 1 =0; x 2 =1; x 3 =2; x 4=3. Odredite odgovarajuće vjerojatnosti pomoću Bernoullijeve formule. Lako je pokazati da je primjena ove formule ovdje potpuno opravdana. Imajte na umu da će vjerojatnost da ne pogodite metu jednim hicem biti jednaka 1-0,4=0,6. Dobiti

Distribucijska serija ima sljedeći oblik:

x
R 0,216 0,432 0,288 0,064

Lako je provjeriti da je zbroj svih vjerojatnosti jednak 1. Sama slučajna varijabla x raspoređeni prema binomnom zakonu. ■

Nađimo matematičko očekivanje i varijancu slučajne varijable raspodijeljene prema binomnom zakonu.

Prilikom rješavanja primjera 6.5 pokazalo se da je matematičko očekivanje broja pojavljivanja događaja A V n neovisna ispitivanja, ako je vjerojatnost pojave A u svakom testu konstantan i jednak R, jednako n· R

U ovom primjeru korištena je slučajna varijabla raspoređena prema binomnom zakonu. Stoga je rješenje primjera 6.5, zapravo, dokaz sljedećeg teorema.

Teorem 7.1. Matematičko očekivanje diskretne slučajne varijable raspodijeljene prema binomnom zakonu jednako je umnošku broja pokušaja i vjerojatnosti "uspjeha", tj. M(x)=n· R.

Teorem 7.2. Varijanca diskretne slučajne varijable raspodijeljene prema binomnom zakonu jednaka je umnošku broja pokušaja s vjerojatnošću "uspjeha" i vjerojatnosti "neuspjeha", tj. D(x)=npq.

Asimetrija i kurtoza slučajne varijable raspodijeljene prema binomnom zakonu određuju se formulama

Ove formule mogu se dobiti korištenjem koncepta početnog i središnjeg momenta.

Zakon binomne distribucije je temelj mnogih stvarnih situacija. Za velike vrijednosti n binomna distribucija može se aproksimirati drugim distribucijama, posebno Poissonovom distribucijom.

Poissonova distribucija

Neka bude n Bernoullijevi pokusi, s brojem pokusa n dovoljno velik. Prethodno je pokazano da u ovom slučaju (ako je, osim toga, vjerojatnost R događanja A vrlo mala) kako bi se pronašla vjerojatnost da događaj A da se pojavi T jednom u testovima, možete koristiti Poissonovu formulu (4.9). Ako je slučajna varijabla x označava broj pojavljivanja događaja A V n Bernoullijeva ispitivanja, zatim vjerojatnost da x poprimit će značenje k može se izračunati po formuli

, (7.2)

Gdje λ = np.

Poissonov zakon distribucije naziva se distribucija diskretne slučajne varijable x, za koje su moguće vrijednosti nenegativni cijeli brojevi, i vjerojatnosti p t te se vrijednosti nalaze formulom (7.2).

Vrijednost λ = np nazvao parametar Poissonova distribucija.

Slučajna varijabla raspodijeljena prema Poissonovom zakonu može poprimiti beskonačan broj vrijednosti. Budući da je za ovu distribuciju vjerojatnost R pojava događaja u svakom pokušaju mala, onda se ova raspodjela ponekad naziva zakonom rijetkih pojava.

Niz distribucije slučajne varijable raspodijeljen prema Poissonovom zakonu ima oblik

x T
R

Lako je provjeriti da je zbroj vjerojatnosti drugog retka jednak 1. Da bismo to učinili, moramo zapamtiti da se funkcija može proširiti u Maclaurinov niz, koji konvergira za bilo koji x. U ovom slučaju imamo

. (7.3)

Kao što je navedeno, Poissonov zakon u određenim ograničavajućim slučajevima zamjenjuje binomni zakon. Primjer je slučajna varijabla x, čije su vrijednosti jednake broju kvarova u određenom vremenskom razdoblju s ponovljenom uporabom tehničkog uređaja. Pretpostavlja se da je ovaj uređaj visoke pouzdanosti, tj. vjerojatnost neuspjeha u jednoj aplikaciji je vrlo mala.

Osim takvih ograničavajućih slučajeva, u praksi postoje slučajne varijable raspodijeljene prema Poissonovom zakonu, koje nisu povezane s binomnom distribucijom. Na primjer, Poissonova distribucija se često koristi kada se radi o broju događaja koji se dogode u određenom vremenskom razdoblju (broj poziva telefonskoj centrali tijekom sata, broj automobila koji su stigli u autopraonicu tijekom dana, broj zaustavljanja stroja tjedno, itd. .). Svi ovi događaji moraju tvoriti tzv. tok događaja, što je jedan od temeljnih pojmova teorije čekanja. Parametar λ karakterizira prosječni intenzitet toka događaja.

Binomna distribucija je jedna od najvažnijih distribucija vjerojatnosti za diskretno promjenjivu slučajnu varijablu. Binomna distribucija je distribucija vjerojatnosti broja m događaj A V n međusobno neovisna opažanja. Često događaj A naziva se "uspjeh" promatranja, a suprotni događaj - "neuspjeh", ali ova je oznaka vrlo uvjetna.

Uvjeti binomne distribucije:

  • provedeno ukupno n suđenja u kojima događaj A može se ili ne mora pojaviti;
  • događaj A u svakom od pokusa može se dogoditi s istom vjerojatnošću str;
  • testovi su međusobno neovisni.

Vjerojatnost da u n ispitni događaj A točno m puta, može se izračunati pomoću Bernoullijeve formule:

,

Gdje str- vjerojatnost nastanka događaja A;

q = 1 - str je vjerojatnost da će se dogoditi suprotni događaj.

Hajdemo shvatiti zašto je binomna distribucija povezana s Bernoullijevom formulom na gore opisan način . Događaj - broj uspjeha na n testovi su podijeljeni u niz opcija, u svakoj od kojih se postiže uspjeh m kušnje, i neuspjeh - in n - m testovi. Razmotrite jednu od ovih opcija - B1 . Prema pravilu zbrajanja vjerojatnosti množimo vjerojatnosti suprotnih događaja:

,

a ako označimo q = 1 - str, To

.

Istu vjerojatnost će imati bilo koja druga opcija u kojoj m uspjeh i n - m kvarovi. Broj takvih opcija jednak je broju načina na koje je to moguće n test dobiti m uspjeh.

Zbroj vjerojatnosti svih m broj događaja A(brojevi od 0 do n) jednako je jedan:

gdje je svaki član član Newtonovog binoma. Stoga se razmatrana distribucija naziva binomna distribucija.

U praksi je često potrebno izračunati vjerojatnosti "najviše m uspjeh u n testovi" ili "barem m uspjeh u n testovi". Za to se koriste sljedeće formule.

Integralna funkcija, tj vjerojatnost F(m) to u n događaj promatranja A više neće doći m jednom, može se izračunati pomoću formule:

Sa svoje strane vjerojatnost F(≥m) to u n događaj promatranja A dođi barem m jednom, izračunava se formulom:

Ponekad je prikladnije izračunati vjerojatnost da u n događaj promatranja A više neće doći m puta, kroz vjerojatnost suprotnog događaja:

.

Koju od formula koristiti ovisi o tome koja od njih sadrži manje članova.

Obilježja binomne distribucije izračunavaju se pomoću sljedećih formula .

Očekivana vrijednost: .

disperzija: .

Standardna devijacija: .

Binomna distribucija i izračuni u MS Excelu

Vjerojatnost binomne distribucije P n ( m) i vrijednost integralne funkcije F(m) može se izračunati pomoću MS Excel funkcije BINOM.DIST. Dolje je prikazan prozor za odgovarajući izračun (kliknite lijevom tipkom miša za povećanje).


MS Excel zahtijeva da unesete sljedeće podatke:

  • broj uspjeha;
  • broj testova;
  • vjerojatnost uspjeha;
  • integral - logička vrijednost: 0 - ako trebate izračunati vjerojatnost P n ( m) i 1 - ako je vjerojatnost F(m).

Primjer 1 Direktor tvrtke sažeo je podatke o broju prodanih kamera u proteklih 100 dana. U tablici su sažeti podaci i izračunate vjerojatnosti da će određeni broj kamera biti prodan dnevno.

Dan završava s dobiti ako se proda 13 ili više kamera. Vjerojatnost da će se dan završiti s dobiti:

Vjerojatnost da će dan biti odrađen bez profita:

Neka je vjerojatnost da se dan završi s dobiti konstantna i jednaka 0,61, a broj prodanih kamera po danu ne ovisi o danu. Zatim možete koristiti binomnu distribuciju, gdje događaj A- dan će biti odrađen s dobiti, - bez dobiti.

Vjerojatnost da će od 6 dana svi biti odrađeni s dobiti:

.

Isti rezultat dobivamo pomoću MS Excel funkcije BINOM.DIST (vrijednost integralne vrijednosti je 0):

P 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Vjerojatnost da će se od 6 dana 4 ili više dana raditi s dobiti:

Gdje ,

,

Pomoću MS Excel funkcije BINOM.DIST izračunavamo vjerojatnost da od 6 dana najviše 3 dana neće završiti s dobiti (vrijednost integralne vrijednosti je 1):

P 6 (≤3 ) = BINOM.DIST(3, 6, 0,61, 1) = 0,435.

Vjerojatnost da će od 6 dana svi biti odrađeni s gubicima:

,

Isti pokazatelj izračunavamo pomoću MS Excel funkcije BINOM.DIST:

P 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Sami riješite problem i onda vidite rješenje

Primjer 2 Urna sadrži 2 bijele kugle i 3 crne. Iz urne se izvadi kuglica, namjesti se boja i vrati. Pokušaj se ponavlja 5 puta. Broj pojavljivanja bijelih kuglica je diskretna slučajna varijabla x, raspodijeljen prema binomnom zakonu. Sastavite zakon raspodjele slučajne varijable. Odredite modus, matematičko očekivanje i varijancu.

Nastavljamo zajedno rješavati probleme

Primjer 3 Od kurirske službe otišao do objekata n= 5 kurira. Svaki kurir s vjerojatnošću str= 0.3 kasni za objekt bez obzira na ostale. Diskretna slučajna varijabla x- broj zakašnjelih dostavljača. Konstruirajte niz distribucije ove slučajne varijable. Nađite njegovo matematičko očekivanje, varijancu, standardnu ​​devijaciju. Nađite vjerojatnost da će najmanje dva kurira zakasniti na predmete.