Biografije Karakteristike Analiza

Binomna funkcija distribucije. Varijanca binomne distribucije


Naravno, pri izračunavanju funkcije kumulativne distribucije treba koristiti pomenuti odnos između binomne i beta distribucije. Ova metoda je svakako bolja od direktnog zbrajanja kada je n > 10.

U klasičnim udžbenicima iz statistike, za dobivanje vrijednosti binomne distribucije, često se preporučuje korištenje formula zasnovanih na graničnim teoremama (kao što je Moivre-Laplaceova formula). Treba napomenuti da sa čisto računske tačke gledišta vrijednost ovih teorema je blizu nule, pogotovo sada, kada je moćan kompjuter na skoro svakom stolu. Glavni nedostatak gornjih aproksimacija je njihova potpuno nedovoljna tačnost za vrijednosti n tipične za većinu aplikacija. Ništa manji nedostatak je nepostojanje bilo kakvih jasnih preporuka o primjenjivosti jedne ili druge aproksimacije (u standardnim tekstovima date su samo asimptotske formulacije, nisu praćene procjenama tačnosti i stoga su od male koristi). Rekao bih da obje formule vrijede samo za n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Ovdje ne razmatram problem pronalaženja kvantila: za diskretne distribucije on je trivijalan, au onim problemima gdje se takve distribucije javljaju, po pravilu nije relevantan. Ako su kvantili i dalje potrebni, preporučujem da se problem preformuliše na takav način da radi sa p-vrijednostima (uočene značajnosti). Evo primjera: kada se implementiraju neki algoritami nabrajanja, u svakom koraku potrebno je provjeriti statistička hipoteza o binomnoj slučajnoj varijabli. Prema klasični pristup na svakom koraku potrebno je izračunati statistiku kriterijuma i uporediti njegovu vrijednost sa granicom kritičnog skupa. Kako je, međutim, algoritam enumerativan, potrebno je svaki put iznova odrediti granicu kritičnog skupa (na kraju krajeva, veličina uzorka se mijenja iz koraka u korak), što neproduktivno povećava vremenske troškove. Moderan pristup preporučuje izračunavanje uočene važnosti i poređenje sa nivo samopouzdanja, štedeći na potrazi za kvantilima.

Stoga, sljedeći kodovi ne izračunavaju inverznu funkciju, umjesto toga, data je funkcija rev_binomialDF, koja izračunava vjerovatnoću p uspjeha u jednom pokušaju s obzirom na broj n pokušaja, broj m uspjeha u njima i vrijednost y vjerovatnoće da ćete postići ove m uspjeha. Ovo koristi gore spomenuti odnos između binomne i beta distribucije.

Zapravo, ova funkcija vam omogućava da dobijete granice intervala povjerenja. Zaista, pretpostavimo da dobijemo m uspjeha u n binomnih pokušaja. Kao što znate, lijeva granica je dvostrana interval povjerenja za parametar p sa nivoom poverenja je 0 ako je m = 0, a za je rešenje jednadžbe . Slično, desna granica je 1 ako je m = n, a za je rješenje jednadžbe . To implicira da da bismo pronašli lijevu granicu, moramo riješiti jednačinu , a za traženje pravog - jednačina . Oni su riješeni u funkcijama binom_leftCI i binom_rightCI, koje vraćaju gornju i donju granicu dvostranog intervala povjerenja, respektivno.

Želim napomenuti da ako nije potrebna apsolutno nevjerojatna tačnost, onda za dovoljno veliko n možete koristiti sljedeću aproksimaciju [B.L. van der Waerden, Matematička statistika. M: IL, 1960, Ch. 2, sek. 7]: , gdje je g kvantil normalna distribucija. Vrijednost ove aproksimacije je u tome što postoje vrlo jednostavne aproksimacije koje vam omogućavaju da izračunate kvantile normalne distribucije (pogledajte tekst o izračunavanju normalne distribucije i odgovarajući dio ove reference). U mojoj praksi (uglavnom za n > 100) ova aproksimacija je dala oko 3-4 cifre, što je po pravilu sasvim dovoljno.

Izračuni sa sljedećim kodovima zahtijevaju datoteke betaDF.h, betaDF.cpp (pogledajte odjeljak o beta distribuciji), kao i logGamma.h, logGamma.cpp (pogledajte dodatak A). Također možete vidjeti primjer korištenja funkcija.

binomialDF.h fajl

#ifndef __BINOMIAL_H__ #include "betaDF.h" dvostruki binomni DF (dvostruki pokušaji, dvostruki uspjesi, dvostruki p); /* * Neka postoje "pokusi" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom. * Izračunajte vjerovatnoću B(uspjesi|pokušaji,p) da je broj * uspjeha između 0 i "uspjeha" (uključivo). */ double rev_binomialDF(dvostruki pokušaji, dvostruki uspjesi, dvostruki y); /* * Neka je vjerovatnoća y za najmanje m uspjeha * poznata u ispitivanjima Bernoullijeve šeme. Funkcija pronalazi vjerovatnoću p * uspjeha u jednom pokušaju. * * U proračunima se koristi sljedeća relacija * * 1 - p = rev_Beta(pokušaji-uspjesi| uspjesi+1, y). */ double binom_leftCI(dvostruki pokušaji, dvostruki uspjesi, dvostruki nivo); /* Neka postoje "pokusi" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom * i broj uspjeha je "uspjesi". * Lijeva granica dvostranog intervala povjerenja * izračunava se sa nivoom značaja. */ double binom_rightCI(dvostruki n, dvostruki uspjesi, dvostruki nivo); /* Neka postoje "pokusi" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom * i broj uspjeha je "uspjesi". * Desna granica dvostranog intervala pouzdanosti * izračunava se sa nivoom značaja. */ #endif /* Završava #ifndef __BINOMIAL_H__ */

binomialDF.cpp fajl

/************************************************** **** **********/ /* Binomna distribucija */ /****************************** **** **************************/ #include #include #include "betaDF.h" ENTRY dvostruki binom DF(dvostruki n, dupli m, dupli p) /* * Neka postoji "n" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom. * Izračunajte vjerovatnoću B(m|n,p) da je broj uspjeha * između 0 i "m" (uključivo), tj. * iznos binomne vjerovatnoće od 0 do m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Izračuni ne podrazumijevaju grubo zbrajanje - koristite * sljedeći link na centralnu beta distribuciju: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Argumenti moraju biti pozitivni, sa 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (str<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) vrati 1; inače vraća BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Neka je vjerovatnoća y od najmanje m uspjeha * poznata u n pokušaja Bernoullijeve šeme. Funkcija pronalazi vjerovatnoću p * uspjeha u jednom pokušaju. * * U proračunima se koristi sljedeća relacija * * 1 - p = rev_Beta(y|n-m,m+1). */ ( tvrditi((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Razmotrite binomnu distribuciju, izračunajte njeno matematičko očekivanje, varijansu, mod. Koristeći MS EXCEL funkciju BINOM.DIST(), nacrtat ćemo grafove funkcije distribucije i gustine vjerovatnoće. Procijenimo parametar distribucije p, matematičko očekivanje distribucija i standardna devijacija. Uzmite u obzir i Bernoullijevu distribuciju.

Definicija. Neka se drže n testovi, u svakom od kojih se mogu pojaviti samo 2 događaja: događaj "uspjeh" s vjerovatnoćom str ili događaj "neuspjeh" s vjerovatnoćom q =1-p (tzv Bernoullijeva šema,Bernoullisuđenja).

Verovatnoća dobijanja tačno x uspjeh u ovim n testovi je jednak:

Broj uspjeha u uzorku x je slučajna varijabla koja ima Binomna distribucija(engleski) Binomdistribucija) str I n su parametri ove distribucije.

Podsjetite to kako biste se prijavili Bernoullijeve šeme i shodno tome binomna distribucija, moraju biti ispunjeni sljedeći uslovi:

  • svako ispitivanje mora imati tačno dva ishoda, uslovno nazvana "uspjeh" i "neuspjeh".
  • rezultat svakog testa ne treba da zavisi od rezultata prethodnih testova (nezavisnost testa).
  • stopa uspjeha str treba biti konstantan za sve testove.

Binomna distribucija u MS EXCEL-u

U MS EXCEL-u, počevši od verzije 2010, za Binomna distribucija postoji funkcija BINOM.DIST() , engleski naziv- BINOM.DIST(), koji vam omogućava da izračunate vjerovatnoću da će uzorak biti tačan X"uspjesi" (tj. funkcija gustoće vjerovatnoće p(x), vidi gornju formulu) i integralna funkcija distribucije(vjerovatnoća da će uzorak imati x ili manje "uspjeha", uključujući 0).

Prije MS EXCEL 2010, EXCEL je imao funkciju BINOMDIST(), koja vam također omogućava da izračunate funkcija distribucije I gustina vjerovatnoće p(x). BINOMDIST() je ostavljen u MS EXCEL 2010 radi kompatibilnosti.

Datoteka primjera sadrži grafikone gustina raspodjele vjerovatnoće I .

Binomna distribucija ima oznaku B(n; str) .

Bilješka: Za gradnju integralna funkcija distribucije tip grafikona savršenog uklapanja Raspored, Za gustina distribucijeHistogram sa grupisanjem. Za više informacija o građenju dijagrama, pročitajte članak Glavne vrste dijagrama.

Bilješka: Za praktičnost pisanja formula u datoteku primjera, kreirana su imena za parametre Binomna distribucija: n i str.

Datoteka primjera prikazuje različite izračune vjerovatnoće pomoću MS EXCEL funkcija:

Kao što se vidi na gornjoj slici, pretpostavlja se da:

  • Beskonačna populacija od koje je napravljen uzorak sadrži 10% (ili 0,1) dobrih elemenata (parametar str, treći argument funkcije =BINOM.DIST() )
  • Za izračunavanje vjerovatnoće da će u uzorku od 10 elemenata (parametar n, drugi argument funkcije) bit će točno 5 valjanih elemenata (prvi argument), potrebno je napisati formulu: =BINOM.DIST(5, 10, 0.1, FALSE)
  • Poslednji, četvrti element je postavljen = FALSE, tj. vrijednost funkcije se vraća gustina distribucije.

Ako je vrijednost četvrtog argumenta = TRUE, tada funkcija BINOM.DIST() vraća vrijednost integralna funkcija distribucije ili jednostavno funkcija distribucije. U ovom slučaju možemo izračunati vjerovatnoću da će broj dobrih elemenata u uzorku biti od određeni raspon, na primjer, 2 ili manje (uključujući 0).

Da biste to učinili, morate napisati formulu:
= BINOM.DIST(2, 10, 0,1, TRUE)

Bilješka: Za necjelobrojnu vrijednost x, . Na primjer, sljedeće formule će vratiti istu vrijednost:
=BINOM.DIST( 2 ; 10; 0,1; ISTINITO)
=BINOM.DIST( 2,9 ; 10; 0,1; ISTINITO)

Bilješka: U primjeru datoteke gustina vjerovatnoće I funkcija distribucije također se izračunava korištenjem definicije i funkcije COMBIN().

Pokazatelji distribucije

IN primjer datoteke na listu Primjer postoje formule za izračunavanje nekih indikatora distribucije:

  • =n*p;
  • (kvadrat standardne devijacije) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Izvodimo formulu matematičko očekivanje Binomna distribucija koristeći Bernoullijeva šema.

A-prioritet slučajna vrijednost X in Bernoullijeva šema(Bernoullijeva slučajna varijabla) ima funkcija distribucije:

Ova distribucija se zove Bernulijeva distribucija.

Bilješka: Bernulijeva distribucijaposeban slučaj Binomna distribucija sa parametrom n=1.

Hajde da generišemo 3 niza od 100 brojeva sa različite vjerovatnoće uspjeh: 0,1; 0,5 i 0,9. Da biste to učinili, u prozoru Generisanje slučajnih brojeva set sljedeće opcije za svaku vjerovatnoću p:

Bilješka: Ako postavite opciju Slučajno rasipanje (Slučajno sjeme), tada možete odabrati određenu random set generisani brojevi. Na primjer, postavljanjem ove opcije =25, možete generirati iste skupove slučajnih brojeva na različitim računarima (ako su, naravno, drugi parametri distribucije isti). Vrijednost opcije može imati cjelobrojne vrijednosti od 1 do 32 767. Naziv opcije Slučajno rasipanje može zbuniti. Bilo bi bolje da se to prevede kao Postavite broj sa slučajnim brojevima.

Kao rezultat, imaćemo 3 kolone od 100 brojeva, na osnovu kojih, na primjer, možemo procijeniti vjerovatnoću uspjeha str prema formuli: Broj uspjeha/100(cm. primjer lista datoteka Generiranje Bernoullija).

Bilješka: Za Bernoullijeve distribucije sa p=0,5, možete koristiti formulu =RANDBETWEEN(0;1) , što odgovara .

Generisanje slučajnih brojeva. Binomna distribucija

Pretpostavimo da u uzorku ima 7 neispravnih predmeta. To znači da je "vrlo vjerovatno" da se udio neispravnih proizvoda promijenio. str, što je karakteristika našeg proizvodnog procesa. Iako je ova situacija “vrlo vjerovatna”, postoji mogućnost (alfa rizik, greška tipa 1, “lažni alarm”) da str je ostao nepromijenjen, a povećan broj neispravnih proizvoda uzrokovan je slučajnim uzorkovanjem.

Kao što se može vidjeti na donjoj slici, 7 je broj neispravnih proizvoda koji je prihvatljiv za proces sa p=0,21 pri istoj vrijednosti Alpha. Ovo ilustruje da kada se prekorači prag neispravnih predmeta u uzorku, str“vjerovatno” povećao. Izraz "najvjerovatnije" znači da postoji samo 10% šanse (100%-90%) da je odstupanje procenta neispravnih proizvoda iznad praga posljedica samo slučajnih uzroka.

Dakle, prekoračenje graničnog broja neispravnih proizvoda u uzorku može poslužiti kao signal da se proces poremetio i počeo proizvoditi b O veći procenat neispravnih proizvoda.

Bilješka: Prije MS EXCEL 2010, EXCEL je imao funkciju CRITBINOM() , koja je ekvivalentna BINOM.INV() . CRITBINOM() je ostavljen u MS EXCEL 2010 i novijim radi kompatibilnosti.

Odnos binomske distribucije prema drugim distribucijama

Ako je parametar n Binomna distribucija teži beskonačnosti i str teži 0, tada u ovom slučaju Binomna distribucija može se aproksimirati.
Moguće je formulisati uslove kada je aproksimacija Poissonova distribucija radi dobro:

  • str<0,1 (što manje str i više n, što je tačnija aproksimacija);
  • str>0,9 (s obzirom na to q=1- str, proračuni u ovom slučaju moraju se izvršiti pomoću q(A X potrebno je zamijeniti sa n- x). Dakle, što manje q i više n, to je tačnija aproksimacija).

Na 0,1<=p<=0,9 и n*p>10 Binomna distribucija može se aproksimirati.

sa svoje strane, Binomna distribucija može poslužiti kao dobra aproksimacija kada je veličina populacije N Hipergeometrijska distribucija mnogo veći od veličine uzorka n (tj. N>>n ili n/N<<1).

Više o odnosu gore navedenih distribucija možete pročitati u članku. Navedeni su i primjeri aproksimacije, te su objašnjeni uslovi kada je to moguće i sa kojom tačnošću.

SAVJET: O ostalim distribucijama MS EXCEL-a možete pročitati u članku.

Pozdrav svim čitaocima!

Statistička analiza se, kao što znate, bavi prikupljanjem i obradom stvarnih podataka. To je korisno, a često i isplativo, jer. pravi zaključci vam omogućavaju da izbjegnete greške i gubitke u budućnosti, a ponekad i ispravno pogodite ovu budućnost. Prikupljeni podaci odražavaju stanje neke uočene pojave. Podaci su često (ali ne uvijek) numerički i njima se može manipulirati raznim matematičkim manipulacijama kako bi se izvukle dodatne informacije.

Međutim, ne mjere se svi fenomeni u kvantitativnoj skali kao što je 1, 2, 3... 100500... Ne može uvijek pojava poprimiti beskonačan ili veliki broj različitih stanja. Na primjer, spol osobe može biti ili M ili F. Strijelac ili pogađa metu ili promašuje. Možete glasati ili "za" ili "protiv" itd. i tako dalje. Drugim riječima, takvi podaci odražavaju stanje alternativnog atributa - ili "da" (događaj se dogodio) ili "ne" (događaj se nije dogodio). Nadolazeći događaj (pozitivan ishod) naziva se i "uspjeh". Takve pojave takođe mogu biti masovne i nasumične. Stoga se mogu izmjeriti i izvući statistički valjani zaključci.

Eksperimenti sa takvim podacima se nazivaju Bernoullijeva šema, u čast poznatog švajcarskog matematičara koji je utvrdio da kod velikog broja pokušaja odnos pozitivnih ishoda i ukupnog broja pokušaja teži verovatnoći da se ovaj događaj desi.

Alternativna varijabla funkcije

Da bi se u analizi koristio matematički aparat, rezultate takvih opažanja treba zapisati u numeričkom obliku. Da bi se to postiglo, pozitivnom ishodu se dodeljuje broj 1, negativnom - 0. Drugim rečima, radi se o promenljivoj koja može imati samo dve vrednosti: 0 ili 1.

Kakva korist se može izvući iz ovoga? Zapravo, ništa manje nego iz običnih podataka. Dakle, lako je izbrojati broj pozitivnih ishoda – dovoljno je sabrati sve vrijednosti, tj. sve 1 (uspjeh). Možete ići dalje, ali za ovo morate uvesti nekoliko oznaka.

Prva stvar koju treba primijetiti je da pozitivni ishodi (koji su jednaki 1) imaju izvjesnu vjerovatnoću da će se dogoditi. Na primjer, dobijanje glave pri bacanju novčića je ½ ili 0,5. Ova vjerovatnoća se tradicionalno označava latiničnim slovom str. Stoga je vjerovatnoća da se dogodi alternativni događaj 1-p, što je takođe označeno sa q, to je q = 1 – str. Ove oznake se mogu vizualno sistematizirati u obliku promjenjive distribucijske ploče X.

Sada imamo listu mogućih vrijednosti i njihove vjerovatnoće. Možete početi izračunavati tako divne karakteristike slučajne varijable kao što je očekivanu vrijednost I disperzija. Da vas podsjetim da se matematičko očekivanje izračunava kao zbir proizvoda svih mogućih vrijednosti i njihovih odgovarajućih vjerovatnoća:

Izračunajmo očekivanu vrijednost koristeći notaciju u gornjim tabelama.

Ispada da je matematičko očekivanje alternativnog znaka jednako vjerovatnoći ovog događaja - str.

Hajde sada da definišemo šta je varijansa alternativne karakteristike. Dozvolite mi također da vas podsjetim da je varijansa srednji kvadrat odstupanja od matematičkog očekivanja. Opća formula (za diskretne podatke) je:

Otuda varijansa alternativne karakteristike:

Lako je vidjeti da ova disperzija ima maksimum od 0,25 (at p=0,5).

Standardna devijacija - korijen varijanse:

Maksimalna vrijednost ne prelazi 0,5.

Kao što možete vidjeti, i matematičko očekivanje i varijansa alternativnog znaka imaju vrlo kompaktan oblik.

Binomna distribucija slučajne varijable

Sada razmotrite situaciju iz drugog ugla. Zaista, koga briga što je prosječan gubitak glava pri jednom bacanju 0,5? To je čak nemoguće i zamisliti. Zanimljivije je postaviti pitanje o broju glava koje dolaze za dati broj bacanja.

Drugim riječima, istraživača često zanima vjerovatnoća da će se desiti određeni broj uspješnih događaja. To može biti broj neispravnih proizvoda u testiranoj seriji (1 - neispravan, 0 - dobar) ili broj oporavljenih (1 - zdrav, 0 - bolestan) itd. Broj takvih "uspjeha" bit će jednak zbroju svih vrijednosti varijable X, tj. broj pojedinačnih ishoda.

Slučajna vrijednost B naziva se binom i uzima vrijednosti od 0 do n(kod B= 0 - svi dijelovi su dobri, sa B = n- svi dijelovi su neispravni). Pretpostavlja se da su sve vrijednosti x nezavisni jedno od drugog. Razmotrimo glavne karakteristike binomske varijable, odnosno ustanovićemo njeno matematičko očekivanje, varijansu i distribuciju.

Očekivanje binomske varijable je vrlo lako dobiti. Podsjetimo da postoji zbir matematičkih očekivanja svake dodane vrijednosti i da je isti za sve, dakle:

Na primjer, očekivanje broja glava na 100 bacanja je 100 × 0,5 = 50.

Sada izvodimo formulu za varijansu binomske varijable. je zbir varijansi. Odavde

Standardna devijacija, respektivno

Za 100 bacanja novčića, standardna devijacija je

I na kraju, razmotrite distribuciju binomne količine, tj. vjerovatnoća da je slučajna varijabla B poprimiće različite vrijednosti k, Gdje 0≤k≤n. Za novčić, ovaj problem bi mogao zvučati ovako: kolika je vjerovatnoća da dobijete 40 grla u 100 bacanja?

Da bismo razumjeli način izračunavanja, zamislimo da se novčić baci samo 4 puta. Svaka strana može ispasti svaki put. Pitamo se: kolika je vjerovatnoća da dobijemo 2 glave od 4 bacanja. Svako bacanje je nezavisno jedno od drugog. To znači da će vjerovatnoća dobivanja bilo koje kombinacije biti jednaka proizvodu vjerovatnoće datog ishoda za svako pojedinačno bacanje. Neka su O glave i P repovi. Tada, na primjer, jedna od kombinacija koja nam odgovara može izgledati kao OOPP, odnosno:

Vjerovatnoća takve kombinacije jednaka je umnošku dvije vjerovatnoće izbijanja i još dvije vjerovatnoće neuspjeha (obrnuti događaj izračunat kao 1-p), tj. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Ovo je vjerovatnoća jedne od kombinacija koja nam odgovara. Ali pitanje je bilo o ukupnom broju orlova, a ne o nekom posebnom redu. Zatim trebate sabrati vjerovatnoće svih kombinacija u kojima se nalaze tačno 2 orla. Jasno je da su svi isti (proizvod se ne mijenja od promjene mjesta faktora). Stoga morate izračunati njihov broj, a zatim pomnožiti s vjerovatnoćom bilo koje takve kombinacije. Izbrojimo sve kombinacije od 4 bacanja 2 orla: RROO, RORO, ROOR, ORRO, OROR, OORR. Samo 6 opcija.

Dakle, željena vjerovatnoća da dobijete 2 glave nakon 4 bacanja je 6×0,0625=0,375.

Međutim, brojanje na ovaj način je zamorno. Već za 10 novčića bit će vrlo teško dobiti ukupan broj opcija grubom silom. Stoga su pametni ljudi davno izmislili formulu uz pomoć koje izračunavaju broj različitih kombinacija n elementi po k, Gdje n je ukupan broj elemenata, k je broj elemenata čije su opcije rasporeda izračunate. Kombinovana formula od n elementi po k je:

Slične stvari se dešavaju u sekciji kombinatorike. Saljem tamo sve koji zele da unaprede svoje znanje. Otuda, uzgred, naziv binomne distribucije (gornja formula je koeficijent u ekspanziji Newtonovog binoma).

Formula za određivanje vjerovatnoće može se lako generalizirati na bilo koji broj n I k. Kao rezultat, formula binomne distribucije ima sljedeći oblik.

Drugim riječima: pomnožite broj odgovarajućih kombinacija vjerovatnoćom jedne od njih.

Za praktičnu upotrebu, dovoljno je jednostavno znati formulu za binomnu distribuciju. A možda čak i ne znate - u nastavku je kako odrediti vjerovatnoću koristeći Excel. Ali bolje je znati.

Koristimo ovu formulu da izračunamo vjerovatnoću da dobijemo 40 glava u 100 bacanja:

Ili samo 1,08%. Poređenja radi, vjerovatnoća matematičkog očekivanja ovog eksperimenta, odnosno 50 grla je 7,96%. Maksimalna vjerovatnoća binomske vrijednosti pripada vrijednosti koja odgovara matematičkom očekivanju.

Izračunavanje vjerovatnoće binomne distribucije u Excelu

Ako koristite samo papir i kalkulator, tada su izračuni pomoću formule binomne distribucije, unatoč odsustvu integrala, prilično teški. Na primjer, vrijednost od 100! - ima više od 150 karaktera. Ovo je nemoguće izračunati ručno. Ranije, pa čak i sada, za izračunavanje takvih količina korištene su približne formule. Trenutno je preporučljivo koristiti poseban softver, kao što je MS Excel. Dakle, svaki korisnik (čak i humanista po obrazovanju) može lako izračunati vjerovatnoću vrijednosti binomno raspoređene slučajne varijable.

Za konsolidaciju gradiva koristićemo za sada Excel kao običan kalkulator, tj. Napravimo korak po korak izračunavanje koristeći formulu binomne distribucije. Izračunajmo, na primjer, vjerovatnoću da dobijemo 50 grla. Ispod je slika sa koracima proračuna i konačnim rezultatom.

Kao što vidite, međurezultati su takve skale da ne stanu u ćeliju, iako se posvuda koriste jednostavne funkcije tipa: FAKTOR (faktorski proračun), POWER (podizanje broja na stepen), kao i kao operatori množenja i dijeljenja. Štaviše, ovaj proračun je prilično glomazan, u svakom slučaju nije kompaktan, jer uključene mnoge ćelije. I da, teško je to shvatiti.

Generalno, Excel pruža gotovu funkciju za izračunavanje vjerovatnoća binomne distribucije. Funkcija se zove BINOM.DIST.

Broj uspjeha je broj uspješnih pokušaja. Imamo ih 50.

Broj pokušaja- broj bacanja: 100 puta.

Vjerovatnoća uspjeha– vjerovatnoća dobijanja glave pri jednom bacanju je 0,5.

Integral- naznačeno je ili 1 ili 0. Ako je 0, tada se izračunava vjerovatnoća P(B=k); ako je 1, onda se izračunava funkcija binomne distribucije, tj. zbir svih vjerovatnoća iz B=0 prije B=k inkluzivno.

Pritisnemo OK i dobijemo isti rezultat kao gore, samo što je sve izračunato po jednoj funkciji.

Vrlo udobno. Eksperimenta radi, umjesto posljednjeg parametra 0 stavljamo 1. Dobijamo 0,5398. To znači da je u 100 bacanja novčića vjerovatnoća da dobijete glave između 0 i 50 skoro 54%. I u početku se činilo da bi trebalo da bude 50%. Općenito, proračuni se rade lako i brzo.

Pravi analitičar mora razumjeti kako se funkcija ponaša (kakva je njena distribucija), pa izračunajmo vjerovatnoće za sve vrijednosti od 0 do 100. Odnosno, zapitajmo se: kolika je vjerovatnoća da nijedan orao neće pasti, da će 1 orao pasti, 2, 3, 50, 90 ili 100. Izračun je prikazan na sljedećoj samopokretnoj slici. Plava linija je sama binomna distribucija, crvena tačka je vjerovatnoća za određeni broj uspjeha k.

Moglo bi se zapitati, nije li binomna distribucija slična... Da, vrlo slična. Čak je i De Moivre (1733.) rekao da se sa velikim uzorcima približava binomska distribucija (ne znam kako se tada zvala), ali ga niko nije slušao. Tek su Gaus, a potom i Laplace, 60-70 godina kasnije, ponovo otkrili i pažljivo proučili zakon normalne raspodjele. Gornji grafikon jasno pokazuje da maksimalna vjerovatnoća pada na matematičko očekivanje, a kako odstupa od njega, naglo opada. Baš kao normalan zakon.

Binomna distribucija je od velike praktične važnosti, javlja se prilično često. Koristeći Excel, proračuni se izvode lako i brzo. Stoga ga slobodno koristite.

Na ovome predlažem da se pozdravimo do sljedećeg sastanka. Sve najbolje, budite zdravi!

Poglavlje 7

Specifični zakoni distribucije slučajnih varijabli

Vrste zakona raspodjele diskretnih slučajnih varijabli

Neka diskretna slučajna varijabla uzme vrijednosti X 1 , X 2 , …, x n, … . Vjerojatnosti ovih vrijednosti mogu se izračunati koristeći različite formule, na primjer, koristeći osnovne teoreme teorije vjerojatnosti, Bernoullijevu formulu ili neke druge formule. Za neke od ovih formula zakon raspodjele ima svoje ime.

Najčešći zakoni distribucije diskretne slučajne varijable su binomni, geometrijski, hipergeometrijski, Poissonov zakon raspodjele.

Zakon binomne distribucije

Neka se proizvede n nezavisna ispitivanja, u svakom od kojih se događaj može, ali ne mora dogoditi A. Vjerovatnoća pojave ovog događaja u svakom pojedinačnom pokušaju je konstantna, ne ovisi o broju pokušaja i jednaka je R=R(A). Otuda je vjerovatnoća da se događaj neće dogoditi A u svakom testu je također konstantan i jednak q=1–R. Razmotrite slučajnu varijablu X jednak broju pojavljivanja događaja A V n testovi. Očigledno je da su vrijednosti ove količine jednake

X 1 =0 - događaj A V n testovi se nisu pojavili;

X 2 =1 – događaj A V n suđenja su se pojavila jednom;

X 3 =2 - događaj A V n suđenja su se pojavila dva puta;

…………………………………………………………..

x n +1 = n- događaj A V n testovi su se pojavili sve n jednom.

Vjerojatnosti ovih vrijednosti mogu se izračunati korištenjem Bernoullijeve formule (4.1):

Gdje To=0, 1, 2, …,n .

Zakon binomne distribucije X jednak broju uspjeha u n Bernulijevi pokušaji, sa vjerovatnoćom uspjeha R.

Dakle, diskretna slučajna varijabla ima binomnu distribuciju (ili je distribuirana prema binomskom zakonu) ako su njene moguće vrijednosti 0, 1, 2, …, n, a odgovarajuće vjerovatnoće se izračunavaju po formuli (7.1).

Binomna distribucija zavisi od dva parametri R I n.

Red distribucije slučajne varijable raspoređene prema binomskom zakonu ima oblik:

X k n
R

Primjer 7.1 . Tri nezavisna hica se ispaljuju u metu. Vjerovatnoća da ćete pogoditi svaki metak je 0,4. Slučajna vrijednost X- broj pogodaka u metu. Konstruirajte njegovu distribucijsku seriju.

Rješenje. Moguće vrijednosti slučajne varijable X su X 1 =0; X 2 =1; X 3 =2; X 4=3. Pronađite odgovarajuće vjerovatnoće koristeći Bernoullijevu formulu. Lako je pokazati da je primjena ove formule ovdje potpuno opravdana. Imajte na umu da će vjerovatnoća da jednim udarcem ne pogodite metu biti jednaka 1-0,4=0,6. Get

Serija distribucije ima sljedeći oblik:

X
R 0,216 0,432 0,288 0,064

Lako je provjeriti da je zbir svih vjerovatnoća jednak 1. Sama slučajna varijabla X distribuiraju prema binomskom zakonu. ■

Nađimo matematičko očekivanje i varijansu slučajne varijable distribuirane prema binomskom zakonu.

Prilikom rješavanja primjera 6.5 pokazalo se da matematičko očekivanje broja pojavljivanja događaja A V n nezavisni testovi, ako je vjerovatnoća pojave A u svakom testu je konstantan i jednak R, jednako n· R

U ovom primjeru korištena je slučajna varijabla, raspoređena prema binomskom zakonu. Stoga je rješenje primjera 6.5, u stvari, dokaz sljedeće teoreme.

Teorema 7.1. Matematičko očekivanje diskretne slučajne varijable raspoređene prema binomskom zakonu jednako je proizvodu broja pokušaja i vjerovatnoće "uspjeha", tj. M(X)=n· R.

Teorema 7.2. Varijanca diskretne slučajne varijable raspoređene prema binomskom zakonu jednaka je proizvodu broja pokušaja sa vjerovatnoćom "uspjeha" i vjerovatnoćom "neuspjeha", tj. D(X)=npq.

Skewness i kurtosis slučajne varijable raspoređene prema binomskom zakonu određuju se formulama

Ove formule se mogu dobiti koristeći koncept početnih i centralnih momenata.

Zakon binomne distribucije je u osnovi mnogih stvarnih situacija. Za velike vrijednosti n binomna distribucija se može aproksimirati drugim distribucijama, posebno Poissonovom distribucijom.

Poissonova distribucija

Neka bude n Bernulijevih suđenja, sa brojem suđenja n dovoljno velika. Ranije je pokazano da u ovom slučaju (ako je, pored toga, vjerovatnoća R događaji A vrlo mala) da se pronađe vjerovatnoća da će neki događaj A da se pojavi T jednom u testovima, možete koristiti Poissonovu formulu (4.9). Ako je slučajna varijabla X znači broj pojavljivanja događaja A V n Bernulijevim suđenjima, onda verovatnoća da X poprimiće značenje k može se izračunati po formuli

, (7.2)

Gdje λ = np.

Poissonov zakon distribucije se naziva distribucija diskretne slučajne varijable X, za koje su moguće vrijednosti nenegativni cijeli brojevi i vjerovatnoće p t ove vrijednosti se nalaze po formuli (7.2).

Vrijednost λ = np pozvao parametar Poissonova distribucija.

Slučajna varijabla distribuirana prema Poissonovom zakonu može poprimiti beskonačan broj vrijednosti. Budući da je za ovu distribuciju vjerovatnoća R pojava događaja u svakom ispitivanju je mala, tada se ova raspodjela ponekad naziva zakonom rijetkih fenomena.

Red raspodjele slučajne varijable raspoređene prema Poissonovom zakonu ima oblik

X T
R

Lako je provjeriti da je zbir vjerovatnoća drugog reda jednak 1. Da bismo to učinili, moramo zapamtiti da se funkcija može proširiti u Maclaurinov red, koji konvergira za bilo koji X. U ovom slučaju imamo

. (7.3)

Kao što je navedeno, Poissonov zakon u određenim graničnim slučajevima zamjenjuje binomni zakon. Primjer je slučajna varijabla X, čije su vrijednosti jednake broju kvarova u određenom vremenskom periodu uz ponovnu upotrebu tehničkog uređaja. Pretpostavlja se da je ovaj uređaj visoke pouzdanosti, tj. vjerovatnoća neuspjeha u jednoj aplikaciji je vrlo mala.

Pored ovakvih ograničavajućih slučajeva, u praksi postoje slučajne varijable raspoređene prema Poissonovom zakonu, a ne vezane za binomsku distribuciju. Na primjer, Poissonova distribucija se često koristi kada se radi o broju događaja koji se dešavaju u određenom vremenskom periodu (broj poziva na telefonsku centralu u toku sata, broj automobila koji su stigli u autopraonicu tokom dana, broj zaustavljanja mašine sedmično, itd.). Svi ovi događaji moraju formirati takozvani tok događaja, što je jedan od osnovnih koncepata teorije čekanja. Parametar λ karakteriše prosečan intenzitet toka događaja.

Binomna distribucija je jedna od najvažnijih distribucija vjerovatnoće za slučajnu varijablu koja se diskretno mijenja. Binomna distribucija je raspodjela vjerovatnoće nekog broja m događaj A V n međusobno nezavisna zapažanja. Često događaj A naziva "uspjeh" posmatranja, a suprotan događaj - "neuspjeh", ali je ova oznaka vrlo uslovna.

Uvjeti binomne distribucije:

  • izvršeno ukupno n suđenja u kojima je događaj A može se dogoditi ili ne mora;
  • događaj A u svakom od pokusa može se dogoditi sa istom vjerovatnoćom str;
  • testovi su međusobno nezavisni.

Verovatnoća da u n test događaj A upravo m puta, može se izračunati korištenjem Bernoullijeve formule:

,

Gdje str- vjerovatnoća da će se događaj dogoditi A;

q = 1 - str je vjerovatnoća da se dogodi suprotan događaj.

Hajde da to shvatimo zašto je binomna distribucija povezana sa Bernulijevom formulom na gore opisan način . Događaj - broj uspjeha na n testovi su podijeljeni na više opcija, u svakoj od kojih se postiže uspjeh u m iskušenja, a neuspjeh - u n - m testovi. Razmotrite jednu od ovih opcija - B1 . Prema pravilu sabiranja vjerovatnoća, množimo vjerovatnoće suprotnih događaja:

,

i ako označimo q = 1 - str, To

.

Istu vjerovatnoću imat će bilo koja druga opcija u kojoj m uspjeh i n - m neuspjesi. Broj takvih opcija jednak je broju načina na koje je to moguće n test get m uspjeh.

Zbir vjerovatnoća svih m broj događaja A(brojevi od 0 do n) je jednako jedan:

gdje je svaki član član Njutnovog binoma. Stoga se razmatrana raspodjela naziva binomna distribucija.

U praksi je često potrebno izračunati vjerovatnoće „najviše m uspjeh u n testovi" ili "barem m uspjeh u n testovi". Za to se koriste sljedeće formule.

Integralna funkcija, tj vjerovatnoća F(m) to u n događaj posmatranja A više neće doći m jednom, može se izračunati pomoću formule:

Zauzvrat vjerovatnoća F(≥m) to u n događaj posmatranja A dođi barem m jednom, izračunava se po formuli:

Ponekad je zgodnije izračunati vjerovatnoću da in n događaj posmatranja A više neće doći m puta, kroz vjerovatnoću suprotnog događaja:

.

Koju od formula koristiti ovisi o tome koja od njih sadrži manje pojmova.

Karakteristike binomne distribucije se izračunavaju korištenjem sljedećih formula .

Očekivana vrijednost: .

disperzija: .

Standardna devijacija: .

Binomna distribucija i proračuni u MS Excel-u

Vjerojatnost binomne distribucije P n ( m) i vrijednost integralne funkcije F(m) može se izračunati pomoću MS Excel funkcije BINOM.DIST. Prozor za odgovarajući proračun je prikazan ispod (kliknite levi taster miša za uvećanje).


MS Excel zahtijeva da unesete sljedeće podatke:

  • broj uspjeha;
  • broj testova;
  • vjerovatnoća uspjeha;
  • integral - logička vrijednost: 0 - ako treba izračunati vjerovatnoću P n ( m) i 1 - ako je vjerovatnoća F(m).

Primjer 1 Direktor kompanije sumirao je podatke o broju prodatih kamera u proteklih 100 dana. U tabeli su sumirane informacije i izračunate vjerovatnoće da će se određeni broj kamera dnevno prodati.

Dan završava profitom ako se proda 13 ili više kamera. Verovatnoća da će dan biti odrađen sa profitom:

Vjerovatnoća da će dan biti odrađen bez dobiti:

Neka je vjerovatnoća da je dan odrađen sa profitom konstantna i jednaka 0,61, a broj prodatih kamera dnevno ne ovisi o danu. Tada možete koristiti binomnu distribuciju, gdje je događaj A- dan će biti odrađen sa profitom, - bez dobiti.

Verovatnoća da će od 6 dana sve biti rešeno sa profitom:

.

Isti rezultat dobijamo koristeći MS Excel funkciju BINOM.DIST (vrijednost integralne vrijednosti je 0):

P 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Verovatnoća da će od 6 dana 4 ili više dana biti odrađeno sa profitom:

Gdje ,

,

Koristeći MS Excel funkciju BINOM.DIST, izračunavamo vjerovatnoću da od 6 dana ne više od 3 dana bude završeno sa profitom (vrijednost integralne vrijednosti je 1):

P 6 (≤3 ) = BINOM.DIST(3, 6, 0,61, 1) = 0,435.

Verovatnoća da će od 6 dana sve biti rešeno sa gubicima:

,

Isti indikator izračunavamo koristeći MS Excel funkciju BINOM.DIST:

P 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Riješite problem sami, a zatim pogledajte rješenje

Primjer 2 Urna sadrži 2 bijele kugle i 3 crne. Iz urne se vadi kugla, postavlja se boja i vraća nazad. Pokušaj se ponavlja 5 puta. Broj pojavljivanja bijelih kuglica je diskretna slučajna varijabla X, distribuiran prema binomskom zakonu. Sastavite zakon raspodjele slučajne varijable. Odredite mod, matematičko očekivanje i varijansu.

Nastavljamo da zajedno rješavamo probleme

Primjer 3 Od kurirske službe otišao do objekata n= 5 kurira. Svaki kurir sa vjerovatnoćom str= 0,3 kasni za objekat bez obzira na ostale. Diskretna slučajna varijabla X- broj kasnih kurira. Konstruirajte seriju distribucije ove slučajne varijable. Pronađite njegovo matematičko očekivanje, varijansu, standardnu ​​devijaciju. Pronađite vjerovatnoću da će najmanje dva kurira zakasniti na objekte.