Биографии Характеристики Анализ

Биномиална функция на разпределение. Дисперсия на биномното разпределение


Разбира се, когато изчислявате функцията на кумулативното разпределение, трябва да използвате споменатата връзка между биномното и бета разпределението. Този метод очевидно е по-добър от директното сумиране, когато n > 10.

В класическите учебници по статистика, за да се получат стойностите на биномното разпределение, често се препоръчва използването на формули, базирани на гранични теореми (като формулата на Moivre-Laplace). трябва да бъде отбелязано че от чисто изчислителна гледна точкастойността на тези теореми е близка до нула, особено сега, когато почти всяко бюро има мощен компютър. Основният недостатък на горните приближения е тяхната напълно недостатъчна точност за стойности на n, характерни за повечето приложения. Не по-малък недостатък е липсата на ясни препоръки относно приложимостта на това или онова приближение (стандартните текстове предоставят само асимптотични формулировки; те не са придружени от оценки на точността и следователно са малко полезни). Бих казал, че и двете формули са подходящи само за n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Тук не разглеждам проблема с намирането на квантили: за дискретни разпределения той е тривиален, а в тези проблеми, при които възникват такива разпределения, той по правило не е уместен. Ако все още са необходими квантили, препоръчвам да преформулирате проблема по такъв начин, че да работите с p-стойности (наблюдавани значимости). Ето един пример: когато прилагате някои груби алгоритми, на всяка стъпка трябва да проверявате статистическа хипотезаза биномна случайна променлива. Според класически подходНа всяка стъпка трябва да изчислите критериалната статистика и да сравните нейната стойност с границата на критичния набор. Тъй като обаче алгоритъмът е изчерпателен, е необходимо всеки път да се определя границата на критичния набор (в края на краищата размерът на извадката се променя от стъпка на стъпка), което непродуктивно увеличава разходите за време. Модерен подходпрепоръчва да се изчисли наблюдаваната значимост и да се сравни с вероятност за доверие, спестявайки търсенето на квантили.

Следователно в кодовете по-долу няма изчисление на обратната функция; вместо това е дадена функцията rev_binomialDF, която изчислява вероятността p за успех в отделно изпитание при дадения брой n изпитания, броя m на успехите в тях и стойността y на вероятността за постигане на тези m успеха. Това използва гореспоменатата връзка между биномното и бета разпределението.

Всъщност тази функция ви позволява да получите границите на доверителните интервали. Наистина, да предположим, че в n биномни опити имаме m успеха. Както е известно, лявата граница е двустранна доверителен интервалза параметър p с ниво на достоверност е равно на 0, ако m = 0, и за е решение на уравнението . По същия начин, дясната граница е 1, ако m = n, и за е решение на уравнението . От това следва, че за да намерим лявата граница, трябва да решим относителното уравнение , а да намерим правилното – уравнението . Те се решават във функциите binom_leftCI и binom_rightCI, които връщат съответно горната и долната граница на двустранния доверителен интервал.

Бих искал да отбележа, че ако не се нуждаете от абсолютно невероятна точност, тогава за достатъчно голямо n можете да използвате следното приближение [B.L. Ван дер Ваерден, Математическа статистика. M: IL, 1960, гл. 2, раздел 7]: , където g – квантил нормална дистрибуция. Стойността на това приближение е, че има много прости приближения, които ви позволяват да изчислите квантили на нормално разпределение (вижте текста за изчисляване на нормалното разпределение и съответния раздел на този справочник). В моята практика (главно с n > 100) това приближение даде приблизително 3-4 цифри, което като правило е напълно достатъчно.

За да изчислите с помощта на следните кодове, ще ви трябват файловете betaDF.h, betaDF.cpp (вижте раздела за бета разпространение), както и logGamma.h, logGamma.cpp (вижте Приложение A). Можете също така да видите пример за използване на функциите.

Файл binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" двоен биномDF(двойни опити, двойни успехи, двойно p); /* * Нека има "изпитания" на независими наблюдения * с вероятност "p" за успех във всяко. * Изчислете вероятността B(successes|trials,p), че броят на * успехите е между 0 и "successes" (включително). */ double rev_binomialDF(двойни опити, двойни успехи, двойно y); /* * Нека е известна вероятността y за най-малко m успеха * в опити, тестващи схемата на Бернули. Функцията намира вероятността p* за успех в индивидуален опит. * * При изчисленията се използва следната връзка * * 1 - p = rev_Beta(проби-успехи| успехи+1, y). */ double binom_leftCI(двойни опити, двойни успехи, двойно ниво); /* Нека има "изпитания" на независими наблюдения * с вероятност "p" за успех във всяко * и броя на успехите, равен на "успехите". * Лявата граница на двустранния доверителен интервал се изчислява * с нивото на значимост. */ double binom_rightCI(double n, двойни успехи, двойно ниво); /* Нека има "изпитания" на независими наблюдения * с вероятност "p" за успех във всяко * и броя на успехите, равен на "успехите". * Дясната граница на двустранния доверителен интервал се изчислява * с нивото на значимост. */ #endif /* Завършва #ifndef __BINOMIAL_H__ */

Файл binomialDF.cpp

/************************************************ * *********/ /* Биномиално разпределение */ /******************************** * *************************/ #включи #включи #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Нека има "n" независими наблюдения * с вероятност "p" за успех във всяко. * Вероятността B(m|n,p) се изчислява, че броят на успехите е * между 0 и „m“ (включително), т.е. * количество биномни вероятностиот 0 до m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Изчисленията не предполагат грубо сумиране - следната връзка с използва се централно * бета разпределение: * * B(m|n,p) = бета(1-p|n-m,m+1). * * Аргументите трябва да са положителни, с 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) връщане 1; иначе връща BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Нека вероятността y за най-малко m успеха се случи * в n опита на схемата на Бернули. Функцията намира вероятността p* за успех в индивидуален опит. * * При изчисленията се използва следната връзка * * 1 - p = rev_Beta(y|n-m,m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Нека разгледаме биномното разпределение, изчислим математическото му очакване, дисперсията и модата. Използвайки функцията на MS EXCEL BINOM.DIST(), ще начертаем графики на функцията на разпределение и плътността на вероятността. Нека оценим параметъра на разпределение p, математическо очакванеразпространение и стандартно отклонение. Нека разгледаме и разпределението на Бернули.

Определение. Нека се състоят низпитания, във всяко от които могат да възникнат само 2 събития: събитието „успех” с вероятността стр или събитие „провал“ с вероятност р =1-p (т.нар схема на Бернули,Бернулиизпитания).

Вероятността да получите точно х успех в тези н тестове е равно на:

Брой успехи в извадката х е случайна променлива, която има Биномиално разпределение(Английски) Биномразпространение) стрИ нса параметрите на това разпределение.

Моля, не забравяйте, че да използвате Схеми на Бернулии съответно Биномно разпределение,трябва да бъдат изпълнени следните условия:

  • Всеки тест трябва да има точно два резултата, условно наречени „успех“ и „неуспех“.
  • резултатът от всеки тест не трябва да зависи от резултатите от предишни тестове (независимост на теста).
  • вероятност за успех стр трябва да бъде постоянно за всички тестове.

Биномиално разпределение в MS EXCEL

В MS EXCEL, като се започне от версия 2010, за Биномиално разпределениеима функция BINOM.DIST(), английско име- BINOM.DIST(), което ви позволява да изчислите вероятността извадката да съдържа точно х"успех" (т.е. функция на плътността на вероятността p(x), вижте формулата по-горе), и кумулативна функция на разпределение(вероятност пробата да има хили по-малко "успехи", включително 0).

Преди MS EXCEL 2010, EXCEL имаше функция BINOMDIST(), която също ви позволява да изчислявате разпределителна функцияИ плътност на вероятността p(x). BINOMIST() е оставен в MS EXCEL 2010 за съвместимост.

Примерният файл съдържа графики разпределение на плътността на вероятносттаИ .

Биномиално разпределениеима обозначението б(н; стр) .

Забележка: За застрояване кумулативна функция на разпределениеперфектна типова диаграма График, За плътност на разпространениеХистограма с групиране. За повече информация относно създаването на диаграми прочетете статията Основни типове диаграми.

Забележка: За удобство при писане на формули в примерния файл са създадени имена за параметри Биномиално разпределение: n и p.

Примерният файл показва различни вероятностни изчисления с помощта на функции на MS EXCEL:

Както можете да видите на снимката по-горе, се предполага, че:

  • Безкрайната популация, от която е взета пробата, съдържа 10% (или 0,1) валидни елемента (параметър стр, трети аргумент на функцията = BINOM.DIST() )
  • За да се изчисли вероятността в извадка от 10 елемента (параметър н, вторият аргумент на функцията) ще има точно 5 валидни елемента (първият аргумент), трябва да напишете формулата: =BINOM.DIST(5; 10; 0,1; FALSE)
  • Последният, четвърти елемент е зададен = FALSE, т.е. стойността на функцията се връща плътност на разпространение.

Ако стойността на четвъртия аргумент е TRUE, тогава функцията BINOM.DIST() връща стойността кумулативна функция на разпределениеили просто Разпределителна функция. В този случай можете да изчислите вероятността броят на подходящите елементи в извадката да бъде от определен диапазон, например 2 или по-малко (включително 0).

За да направите това, трябва да напишете формулата:
= BINOM.DIST(2; 10; 0,1; TRUE)

Забележка: За стойност на x, която не е цяло число, . Например следните формули ще върнат същата стойност:
=BINOM.DIST( 2 ; 10; 0,1; ВЯРНО)
=BINOM.DIST( 2,9 ; 10; 0,1; ВЯРНО)

Забележка: В примерния файл плътност на вероятносттаИ разпределителна функциясъщо се изчислява с помощта на дефиницията и функцията NUMBERCOMB().

Показатели за разпространение

IN примерен файл на работен лист ПримерИма формули за изчисляване на някои показатели за разпределение:

  • =n*p;
  • (стандартно отклонение на квадрат) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Нека изведем формулата математическо очакване Биномиално разпределениеизползвайки Верига на Бернули.

А-приори произволна стойност X в Схема на Бернули(случайна променлива на Бернули) има разпределителна функция:

Това разпределение се нарича Разпределение на Бернули.

Забележка: Разпределение на Бернулиспециален случай Биномиално разпределениес параметър n=1.

Нека генерираме 3 масива от по 100 числа всеки с различни вероятностиуспех: 0,1; 0,5 и 0,9. За да направите това в прозореца Генериране на случайни числаИнсталирай следните параметриза всяка вероятност p:

Забележка: Ако зададете опцията Случайно разпръскване (Случайно семе), тогава можете да изберете конкретен случаен наборгенерирани числа. Например, като зададете тази опция =25, можете да генерирате едни и същи набори от произволни числа на различни компютри (ако, разбира се, другите параметри на разпределение са еднакви). Стойността на опцията може да приема цели числа от 1 до 32 767. Име на опцията Случайно разпръскванеможе да е объркващо. Би било по-добре да го преведете като Наберете номер с произволни числа.

В резултат на това ще имаме 3 колони от 100 числа, въз основа на които можем например да оценим вероятността за успех стрпо формулата: Брой успехи/100(см. примерен файлов лист GenerationBernoulli).

Забележка: За Разпределения на Бернулис p=0,5 можете да използвате формулата =RANDBETWEEN(0;1), която съответства на .

Генериране на случайни числа. Биномиално разпределение

Да приемем, че в извадката има 7 дефектни продукта. Това означава, че е „много вероятно“ делът на дефектните продукти да се е променил стр, което е характерно за нашия производствен процес. Въпреки че такава ситуация е „много вероятна“, има възможност (алфа риск, грешка тип 1, „фалшива аларма“), че стростава непроменена, а увеличеният брой дефектни продукти се дължи на случайна извадка.

Както може да се види на фигурата по-долу, 7 е броят на дефектните продукти, който е приемлив за процес с p=0,21 при същата стойност Алфа. Това илюстрира, че когато праговата стойност на дефектните артикули в пробата е надвишена, стр„най-вероятно“ се е увеличил. Фразата „най-вероятно“ означава, че има само 10% вероятност (100%-90%), че отклонението на процента дефектни продукти над прага се дължи само на случайни причини.

По този начин превишаването на праговия брой дефектни продукти в пробата може да служи като сигнал, че процесът е нарушен и е започнал да произвежда използвани продукти. Опо-висок процент на дефектни продукти.

Забележка: Преди MS EXCEL 2010, EXCEL имаше функция CRITBINOM(), която е еквивалентна на BINOM.INV(). CRITBINOM() е оставен в MS EXCEL 2010 и по-нова версия за съвместимост.

Връзка на биномиалното разпределение с други разпределения

Ако параметърът н Биномиално разпределениеклони към безкрайност и стрклони към 0, тогава в този случай Биномиално разпределениеможе да бъде приблизително.
Можем да формулираме условия, когато приближението Поасоново разпределениеработи добре:

  • стр<0,1 (по-малкото стри още н, толкова по-точно е приближението);
  • стр>0,9 (като се има предвид това р=1- стр, изчисленията в този случай трябва да се направят чрез рхтрябва да се замени с н- х). Следователно, толкова по-малко ри още н, толкова по-точно е приближението).

На 0,1<=p<=0,9 и n*p>10 Биномиално разпределениеможе да бъде приблизително.

на свой ред Биномиално разпределениеможе да служи като добро приближение, когато размерът на популацията е N Хипергеометрично разпределениемного по-голям от размера на извадката n (т.е. N>>n или n/N<<1).

Повече подробности за връзката между горните разпределения можете да намерите в статията. Има и примери за приближение и са обяснени условията кога е възможно и с каква точност.

СЪВЕТ: Можете да прочетете за други дистрибуции на MS EXCEL в статията.

Поздрави на всички читатели!

Статистическият анализ, както знаем, се занимава със събиране и обработка на реални данни. Бизнесът е полезен, а често и печеливш, защото... правилните заключения ви позволяват да избегнете грешки и загуби в бъдеще, а понякога и правилно да познаете точно това бъдеще. Събраните данни отразяват състоянието на някое наблюдавано явление. Данните често (но не винаги) са числови и могат да бъдат манипулирани математически за извличане на допълнителна информация.

Въпреки това, не всички явления се измерват в количествена скала като 1, 2, 3 ... 100 500 ... Едно явление не винаги може да приеме безкраен или голям брой различни състояния. Например, полът на дадено лице може да бъде М или Ж. Стрелецът или уцелва целта, или пропуска. Можете да гласувате „За” или „Против” и т.н. и така нататък. С други думи, такива данни отразяват състоянието на алтернативен атрибут - или „да“ (събитието е настъпило), или „не“ (събитието не е настъпило). Настъпилото събитие (положителен резултат) се нарича още „успех“. Такива явления също могат да бъдат широко разпространени и случайни. Следователно те могат да бъдат измерени и могат да бъдат направени статистически валидни заключения.

Експерименти с такива данни се наричат Схема на Бернули, в чест на известния швейцарски математик, който установи, че при голям брой изпитания съотношението на положителните резултати към общия брой изпитания клони към вероятността за настъпване на това събитие.

Алтернативна характеристична променлива

За да се използва математически апарат при анализа, резултатите от такива наблюдения трябва да се записват в цифрова форма. За да направите това, на положителен резултат се присвоява номер 1, на отрицателен - 0. С други думи, имаме работа с променлива, която може да приема само две стойности: 0 или 1.

Каква полза може да се извлече от това? Всъщност не по-малко от обикновените данни. По този начин е лесно да се изчисли броят на положителните резултати - просто сумирайте всички стойности, т.е. всичко 1 (успех). Можете да отидете по-далеч, но това ще изисква да въведете няколко нотации.

Първото нещо, което трябва да се отбележи е, че положителните резултати (които са равни на 1) имат известна вероятност да се появят. Например получаването на глави при хвърляне на монета е ½ или 0,5. Тази вероятност традиционно се обозначава с латинската буква стр. Следователно вероятността за възникване на алтернативно събитие е равна на 1 - стр, което също се означава с р, това е q = 1 – p. Тези обозначения могат да бъдат ясно систематизирани под формата на таблица за разпределение на променливи х.

Сега имаме списък с възможни стойности и техните вероятности. Можем да започнем да изчисляваме такива забележителни характеристики на случайна променлива като очаквана стойностИ дисперсия. Нека ви напомня, че математическото очакване се изчислява като сбор от продуктите на всички възможни стойности и съответните им вероятности:

Нека изчислим очакването, като използваме нотацията в таблиците по-горе.

Оказва се, че математическото очакване на алтернативен знак е равно на вероятността за това събитие - стр.

Сега нека дефинираме каква е дисперсията на алтернативен атрибут. Нека ви напомня също, че дисперсията е средният квадрат на отклоненията от математическото очакване. Общата формула (за дискретни данни) е:

Оттук и вариацията на алтернативния атрибут:

Лесно се вижда, че тази дисперсия има максимум 0,25 (с p=0,5).

Стандартното отклонение е коренът на дисперсията:

Максималната стойност не надвишава 0,5.

Както можете да видите, както математическото очакване, така и дисперсията на алтернативния атрибут имат много компактна форма.

Биномиално разпределение на случайна променлива

Сега нека погледнем ситуацията от друг ъгъл. Наистина, на кого му пука, че средната загуба на глави на хвърляне е 0,5? Невъзможно е дори да си го представим. По-интересно е да се зададе въпросът за броя на главите, които се появяват за даден брой хвърляния.

С други думи, изследователят често се интересува от вероятността за възникване на определен брой успешни събития. Това може да бъде броят на дефектните продукти в тестваната партида (1 - дефектен, 0 - добър) или броят на възстановяването (1 - здрав, 0 - болен) и т.н. Броят на такива „успехи“ ще бъде равен на сумата от всички стойности на променливата х, т.е. брой единични резултати.

Случайна стойност бсе нарича бином и приема стойности от 0 до н(при б= 0 - всички части са подходящи, с б = н– всички части са дефектни). Предполага се, че всички стойности хнезависими един от друг. Нека разгледаме основните характеристики на биномна променлива, т.е. ще установим нейното математическо очакване, дисперсия и разпределение.

Очакването на биномна променлива се получава много лесно. Нека си припомним, че има сума от математически очаквания за всяка добавена стойност и тя е еднаква за всички, следователно:

Например, математическото очакване за броя на падналите глави при 100 хвърляния е 100 × 0,5 = 50.

Сега извеждаме формулата за дисперсията на биномна променлива. е сумата от дисперсиите. Оттук

Стандартно отклонение, респ

За 100 хвърляния на монети стандартното отклонение е

И накрая, разгледайте разпределението на биномната стойност, т.е. вероятността случайната променлива бще приема различни стойности к, Където 0≤k≤n. За монета този проблем може да изглежда така: Каква е вероятността да получите 40 глави при 100 хвърляния?

За да разберете метода на изчисление, представете си, че монетата е хвърлена само 4 пъти. Всяка страна може да падне всеки път. Питаме се: каква е вероятността да получим 2 глави от 4 хвърляния. Всяко хвърляне е независимо едно от друго. Това означава, че вероятността за получаване на която и да е комбинация ще бъде равна на произведението на вероятностите за даден резултат за всяко отделно хвърляне. Нека O са глави, P са опашки. Тогава, например, една от комбинациите, които ни подхождат, може да изглежда като OOPP, тоест:

Вероятността за такава комбинация е равна на произведението на две вероятности за получаване на глави и още две вероятности да не се получат глави (обратното събитие, изчислено като 1 - стр), т.е. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Това е вероятността за една от комбинациите, която ни подхожда. Но въпросът беше за общия брой на орлите, а не за някакъв конкретен ред. След това трябва да съберете вероятностите на всички комбинации, в които има точно 2 глави. Ясно е, че всички те са еднакви (продуктът не се променя, когато факторите се променят). Следователно трябва да изчислите техния брой и след това да умножите по вероятността за всяка такава комбинация. Нека преброим всички комбинации от 4 хвърляния на 2 глави: RROO, RORO, ROOR, ORRO, OROR, OORR. Има общо 6 варианта.

Следователно желаната вероятност за получаване на 2 глави след 4 хвърляния е 6×0,0625=0,375.

Броенето по този начин обаче е досадно. Вече за 10 монети ще бъде много трудно да се получи общият брой опции чрез груба сила. Затова умните хора отдавна са измислили формула, с която изчисляват броя на различните комбинации от нелементи от к, Където н– общ брой елементи, к– броят на елементите, чиито опции за подреждане се отчитат. Комбинирана формула на нелементи от ктова ли е:

Подобни неща се случват и в секцията комбинаторика. Пращам всеки, който иска да подобри знанията си там. Оттук, между другото, името на биномното разпределение (формулата по-горе е коефициент в разширението на бинома на Нютон).

Формулата за определяне на вероятността може лесно да се обобщи за всяко количество нИ к. В резултат на това формулата за биномиалното разпределение има следния вид.

С думи: броят комбинации, които отговарят на условието, умножен по вероятността за една от тях.

За практическа употреба е достатъчно просто да знаете формулата на биномното разпределение. Или може дори да не знаете - по-долу показваме как да определите вероятността с помощта на Excel. Но е по-добре да знаете.

Използвайки тази формула, изчисляваме вероятността да получим 40 глави за 100 хвърляния:

Или само 1,08%. За сравнение, вероятността математическото очакване на този експеримент, тоест 50 глави, да бъде равно на 7,96%. Максималната вероятност за биномна стойност принадлежи на стойността, съответстваща на математическото очакване.

Изчисляване на вероятността от биномно разпределение в Excel

Ако използвате само хартия и калкулатор, тогава изчисленията с помощта на формулата за биномно разпределение, въпреки липсата на интеграли, са доста трудни. Например стойността е 100! – има повече от 150 знака. Невъзможно е да се изчисли това ръчно. Преди, а дори и сега, се използват приблизителни формули за изчисляване на такива количества. В момента е препоръчително да използвате специален софтуер, като MS Excel. По този начин всеки потребител (дори хуманист по образование) може лесно да изчисли вероятността за стойността на биномно разпределена случайна променлива.

За да консолидираме материала, засега ще използваме Excel като обикновен калкулатор, т.е. Нека направим изчисление стъпка по стъпка, използвайки формулата за биномно разпределение. Нека изчислим, например, вероятността да получим 50 глави. По-долу има снимка със стъпките на изчисление и крайния резултат.

Както можете да видите, междинните резултати са с такъв мащаб, че не се побират в клетка, въпреки че прости функции като FACTOR (изчисляване на факториел), POWER (повишаване на число на степен), както и оператори за умножение и деление се използват навсякъде. Освен това това изчисление е доста тромаво; във всеки случай не е компактно, т.к участват много клетки. Да, и е малко трудно да се разбере веднага.

Като цяло Excel предоставя готова функция за изчисляване на вероятностите на биномно разпределение. Функцията се нарича BINOM.DIST.

Брой успехи– брой успешни тестове. Имаме 50 от тях.

Брой тестове– брой хвърляния: 100 пъти.

Вероятност за успех– вероятността да получите глави при едно хвърляне е 0,5.

Интеграл– показва се 1 или 0. Ако е 0, се изчислява вероятността P(B=k); ако е 1, тогава ще бъде изчислена функцията на биномно разпределение, т.е. сумата от всички вероятности от B=0преди B=kвключително.

Щракнете върху OK и ще получите същия резултат като по-горе, само че всичко е изчислено от една функция.

Много удобно. В името на експеримента, вместо последния параметър 0, поставяме 1. Получаваме 0,5398. Това означава, че при 100 хвърляния на монети, вероятността да получите глави между 0 и 50 е почти 54%. Но в началото изглеждаше, че трябва да е 50%. Като цяло изчисленията се правят бързо и лесно.

Истинският анализатор трябва да разбере как се държи функцията (какво е нейното разпределение), така че ще изчислим вероятностите за всички стойности от 0 до 100. Тоест ще зададем въпроса: каква е вероятността нито една глава ще се появи, че ще се появи 1 орел, 2, 3, 50, 90 или 100. Изчислението е показано на следващата самодвижеща се картинка. Синята линия е самото биномно разпределение, червената точка е вероятността за определен брой успехи k.

Някой може да попита дали биномното разпределение е подобно на... Да, много подобно. Дори Moivre (през 1733 г.) каза, че биномиалното разпределение с големи извадки се приближава (не знам как се наричаше тогава), но никой не го послуша. Едва Гаус и след това Лаплас 60-70 години по-късно преоткриват и внимателно изучават закона за нормалното разпределение. Графиката по-горе ясно показва, че максималната вероятност се пада на математическото очакване и при отклонение от него тя рязко намалява. Точно като нормалния закон.

Биномното разпределение е от голямо практическо значение и се среща доста често. С помощта на Excel изчисленията се правят бързо и лесно. Така че можете безопасно да го използвате.

С това предлагам да се сбогуваме до следващата среща. Всичко хубаво, бъдете здрави!

Глава 7.

Специфични закони на разпределение на случайни величини

Видове закони на разпределение на дискретни случайни величини

Нека дискретна случайна променлива приема стойностите х 1 , х 2 , …, x n,…. Вероятностите на тези стойности могат да бъдат изчислени с помощта на различни формули, например с помощта на основните теореми на теорията на вероятностите, формулата на Бернули или някои други формули. За някои от тези формули законът за разпределение има собствено име.

Най-често срещаните закони за разпределение на дискретна случайна променлива са биномиален, геометричен, хипергеометричен и закон на разпределение на Поасон.

Биномен закон на разпределение

Нека се произвежда ннезависими изпитания, във всяко от които събитието може да се появи или да не се появи А. Вероятността това събитие да се случи във всеки отделен опит е постоянна, не зависи от номера на опита и е равна на Р=Р(А). Оттук и вероятността събитието да не се случи Авъв всеки тест също е постоянен и равен р=1–Р. Помислете за случайната променлива хравен на броя повторения на събитието А V нтестове. Очевидно стойностите на това количество са равни

х 1 =0 – събитие А V нтестове не се появиха;

х 2 =1 – събитие А V няви се веднъж в опити;

х 3 =2 – събитие А V нтестове се появиха два пъти;

…………………………………………………………..

x n +1 = н- събитие А V нвсичко се появи по време на тестовете нведнъж.

Вероятностите на тези стойности могат да бъдат изчислени с помощта на формулата на Бернули (4.1):

Където Да се=0, 1, 2, …,н .

Биномен закон на разпределение х, равен на броя на успехите в нТестове на Бернули, с вероятност за успех Р.

И така, дискретна случайна променлива има биномиално разпределение (или се разпределя според биномиалния закон), ако нейните възможни стойности са 0, 1, 2, ..., н, а съответните вероятности се изчисляват с помощта на формула (7.1).

Биномното разпределение зависи от две параметри РИ н.

Серията на разпределение на случайна променлива, разпределена според биномиалния закон, има формата:

х к н
Р

Пример 7.1 . Произвеждат се три независими изстрела по целта. Вероятността за уцелване на всеки удар е 0,4. Случайна стойност х– брой попадения в целта. Конструирайте неговите разпределителни серии.

Решение. Възможни стойности на случайна променлива хса х 1 =0; х 2 =1; х 3 =2; х 4 =3. Нека намерим съответните вероятности, използвайки формулата на Бернули. Не е трудно да се покаже, че използването на тази формула тук е напълно оправдано. Имайте предвид, че вероятността да не уцелите целта с един изстрел ще бъде равна на 1-0,4=0,6. Получаваме

Серията на разпространение има следната форма:

х
Р 0,216 0,432 0,288 0,064

Лесно е да се провери, че сумата от всички вероятности е равна на 1. Самата случайна променлива хразпределени по биномния закон. ■

Нека намерим математическото очакване и дисперсията на случайна променлива, разпределена според биномния закон.

При решаването на пример 6.5 беше показано, че математическото очакване на броя на случванията на събитието А V ннезависими изпитвания, ако вероятността от възникване Авъв всеки тест е постоянен и равен Р, равно на н· Р

Този пример използва случайна променлива, разпределена според биномния закон. Следователно решението на Пример 6.5 по същество е доказателство на следната теорема.

Теорема 7.1.Математическото очакване на дискретна случайна променлива, разпределена според биномния закон, е равно на произведението от броя опити и вероятността за „успех“, т.е. М(х)=н· Р.

Теорема 7.2.Дисперсията на дискретна случайна променлива, разпределена според биномиалния закон, е равна на произведението на броя опити с вероятността за „успех“ и вероятността за „неуспех“, т.е. д(х)=nрq.

Асиметрията и ексцесът на случайна променлива, разпределена по биномния закон, се определят от формулите

Тези формули могат да бъдат получени с помощта на концепцията за начален и централен момент.

Законът за биномно разпределение е в основата на много ситуации от реалния живот. За големи стойности нБиномиалното разпределение може да бъде приблизително изчислено с помощта на други разпределения, по-специално разпределението на Поасон.

Поасоново разпределение

Нека има нТестове на Бернули, с броя на тестовете ндостатъчно голям. По-рано беше показано, че в този случай (ако освен това вероятността Рсъбития Амного малка), за да намерите вероятността събитието Ада се появи TВеднъж в тестовете можете да използвате формулата на Поасон (4.9). Ако случайната променлива хозначава броя на повторенията на събитието А V нТестове на Бернули, тогава вероятността, че хще вземе стойността кможе да се изчисли с помощта на формулата

, (7.2)

Където λ = нр.

Закон за разпределение на Поасонсе нарича разпределение на дискретна случайна променлива х, за които възможните стойности са неотрицателни цели числа, и вероятностите r tтези стойности се намират с помощта на формула (7.2).

величина λ = нрНаречен параметърПоасонови разпределения.

Случайна променлива, разпределена според закона на Поасон, може да приеме безкраен брой стойности. Тъй като за това разпределение вероятността РПоявата на събитие във всеки опит е малка, тогава това разпределение понякога се нарича закон на редките събития.

Серията на разпределение на случайна променлива, разпределена според закона на Поасон, има формата

х T
Р

Лесно е да се провери, че сумата от вероятностите на втория ред е равна на 1. За да направите това, трябва да запомните, че функцията може да бъде разширена в серия на Maclaurin, която се сближава за всеки х. В този случай имаме

. (7.3)

Както беше отбелязано, законът на Поасон замества биномния закон в някои ограничаващи случаи. Пример за това е случайната променлива х, чиито стойности са равни на броя на повреди за определен период от време при многократно използване на техническо средство. Предполага се, че това е високо надеждно устройство, т.е. Вероятността за неуспех в едно приложение е много малка.

В допълнение към такива ограничаващи случаи, на практика има случайни променливи, разпределени съгласно закона на Поасон, които не са свързани с биномното разпределение. Например, разпределението на Поасон често се използва, когато се работи с броя на събитията, настъпили за период от време (броя на обажданията, получени на телефонна централа за един час, броя на колите, пристигащи на автомивка за един ден, брой спирания на машината на седмица и т.н.). Всички тези събития трябва да образуват така наречения поток от събития, който е една от основните концепции на теорията на масовото обслужване. Параметър λ характеризира средната интензивност на потока от събития.

Биномиалното разпределение е едно от най-важните вероятностни разпределения на дискретно варираща случайна променлива. Биномиалното разпределение е вероятностното разпределение на числото мнастъпване на събитие А V нвзаимно независими наблюдения. Често събитие Асе нарича "успех" на наблюдение, а противоположното събитие се нарича "неуспех", но това обозначение е много условно.

Биномиални условия на разпределение:

  • общо извършени низпитания, при които събитието Аможе или не може да се случи;
  • събитие Авъв всеки опит може да се случи с еднаква вероятност стр;
  • тестовете са взаимно независими.

Вероятността, че в нсъбитие за тестване Аще дойде точно мпъти, може да се изчисли с помощта на формулата на Бернули:

,

Където стр- вероятност за настъпване на събитие А;

р = 1 - стр- вероятността за възникване на обратното събитие.

Нека да го разберем защо биномиалното разпределение е свързано с формулата на Бернули по описания по-горе начин? . Събитие - брой успехи при нтестовете са разделени на няколко варианта, във всеки от които се постига успех мтестове, а неуспех - в н - мтестове. Нека разгледаме една от тези опции - б1 . Използвайки правилото за събиране на вероятности, умножаваме вероятностите за противоположни събития:

,

и ако обозначим р = 1 - стр, Че

.

Всеки друг вариант, при който муспех и н - мнеуспехи. Броят на тези опции е равен на броя на начините, по които човек може нтест получите муспех.

Сума от всички вероятности мномера на събитията А(цифри от 0 до н) е равно на едно:

където всеки член представлява член в бинома на Нютон. Следователно разглежданото разпределение се нарича биномно разпределение.

На практика често е необходимо да се изчисляват вероятностите "не повече от муспех в нтестове" или "поне муспех в нтестове". За това се използват следните формули.

Интегралната функция, т.е вероятност Е(м) какво има ннаблюдателно събитие Аповече няма да дойде мведнъж, може да се изчисли по формулата:

На свой ред вероятност Е(≥м) какво има ннаблюдателно събитие Аще дойде не по-малко мведнъж, се изчислява по формулата:

Понякога е по-удобно да се изчисли вероятността, че ннаблюдателно събитие Аповече няма да дойде мпъти, чрез вероятността от обратното събитие:

.

Коя формула да се използва зависи от това кой от тях има сбор, съдържащ по-малко членове.

Характеристиките на биномното разпределение се изчисляват по следните формули .

Очаквана стойност: .

Дисперсия: .

Стандартно отклонение: .

Биномно разпределение и изчисления в MS Excel

Биномна вероятност Пн ( м) и стойностите на интегралната функция Е(м) може да се изчисли с помощта на функцията на MS Excel BINOM.DIST. Прозорецът за съответното изчисление е показан по-долу (щракнете с левия бутон за уголемяване).


MS Excel изисква да въведете следните данни:

  • брой успехи;
  • брой тестове;
  • вероятност за успех;
  • интеграл - логическа стойност: 0 - ако трябва да изчислите вероятността Пн ( м) и 1 - ако вероятността Е(м).

Пример 1.Управителят на компанията обобщи информацията за броя на продадените камери за последните 100 дни. Таблицата обобщава информацията и изчислява вероятностите определен брой камери да бъдат продадени на ден.

Денят завършва с печалба, ако се продадат 13 или повече камери. Вероятност денят да бъде изработен печелившо:

Вероятност един ден да бъде отработен без печалба:

Нека вероятността един ден да се работи с печалба е постоянна и равна на 0,61, а броят на продадените камери на ден не зависи от деня. Тогава можем да използваме биномното разпределение, където събитието А- денят ще се работи с печалба, - без печалба.

Вероятност всичките 6 дни да бъдат отработени с печалба:

.

Получаваме същия резултат с помощта на функцията на MS Excel BINOM.DIST (стойността на интегралната стойност е 0):

П 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Вероятността от 6 дни 4 или повече дни да бъдат отработени с печалба:

Където ,

,

Използвайки функцията на MS Excel BINOM.DIST, изчисляваме вероятността от 6 дни не повече от 3 дни да бъдат завършени с печалба (стойността на интегралната стойност е 1):

П 6 (≤3 ) = BINOM.DIST(3; 6; 0,61; 1) = 0,435.

Вероятност всичките 6 дни да бъдат отработени със загуби:

,

Можем да изчислим същия показател с помощта на функцията на MS Excel BINOM.DIST:

П 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Решете проблема сами и след това вижте решението

Пример 2.В урната има 2 бели топки и 3 черни топки. От урната се изважда топка, цветът се настройва и се връща обратно. Опитът се повтаря 5 пъти. Броят на срещанията на белите топки е дискретна случайна променлива х, разпределени по биномния закон. Начертайте закон за разпределение на случайна променлива. Дефинирайте режим, математическо очакване и дисперсия.

Нека продължим да решаваме проблемите заедно

Пример 3.От куриерската служба тръгнахме към обектите н= 5 куриера. Всеки куриер е вероятно стр= 0,3, независимо от другите, закъснява за обекта. Дискретна случайна променлива х- брой закъснели куриери. Постройте серия на разпределение за тази случайна променлива. Намерете неговото математическо очакване, дисперсия, стандартно отклонение. Намерете вероятността поне двама куриери да закъснеят за предметите.