Биографии Характеристики Анализ

Распределение Пуассона. Дискретные распределения в MS EXCEL

Рассмотрим распределение Пуассона, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL ПУАССОН.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения, его математического ожидания и стандартного отклонения.

Сначала дадим сухое формальное определение распределения, затем приведем примеры ситуаций, когда распределение Пуассона (англ. Poisson distribution ) является адекватной моделью для описания случайной величины.

Если случайные события происходят в заданный период времени (или в определенном объеме вещества) со средней частотой λ(лямбда ), то число событий x , произошедших за этот период времени, будет иметь распределение Пуассона .

Применение распределения Пуассона

Примеры, когда Распределение Пуассона является адекватной моделью:

  • число вызовов, поступивших на телефонную станцию за определенный период времени;
  • число частиц, подвергнувшихся радиоактивному распаду за определенный период времени;
  • число дефектов в куске ткани фиксированной длины.

Распределение Пуассона является адекватной моделью, если выполняются следующие условия:

  • события происходят независимо друг от друга, т.е. вероятность последующего события не зависит от предыдущего;
  • средняя частота событий постоянна. Как следствие, вероятность события пропорциональна длине интервала наблюдения;
  • два события не могут произойти одновременно;
  • число событий должно принимать значения 0; 1; 2…

Примечание : Хорошей подсказкой, что наблюдаемая случайная величина имеет распределение Пуассона, является тот факт, что приблизительно равно (см. ниже).

Ниже представлены примеры ситуаций, когда Распределение Пуассона не может быть применено:

  • число студентов, которые выходят из университета в течение часа (т.к. средний поток студентов не постоянен: во время занятий студентов мало, а в перерыве между занятиями число студентов резко возрастает);
  • число землетрясений амплитудой 5 баллов в год в Калифорнии (т.к. одно землетрясение может вызвать повторные толчки сходной амплитуды – события не независимы);
  • число дней, которые пациенты проводят в отделении интенсивной терапии (т.к. число дней, которое пациенты проводят в отделении интенсивной терапии всегда больше 0).

Примечание : Распределение Пуассона является приближением более точных дискретных распределений: и .

Примечание : О взаимосвязи распределения Пуассона и Биномиального распределения можно прочитать в статье . О взаимосвязи распределения Пуассона и Экспоненциального распределения можно прочитать в статье про .

Распределение Пуассона в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Распределения Пуассона имеется функция ПУАССОН.РАСП() , английское название - POISSON.DIST(), которая позволяет вычислить не только вероятность того, что за заданный период времени произойдет х событий (функцию плотности вероятности p(x), см. формулу выше), но и (вероятность того, что за заданный период времени произойдет не меньше x событий).

До MS EXCEL 2010 в EXCEL была функция ПУАССОН() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). ПУАССОН() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Распределение Пуассона имеет скошенную форму (длинный хвост справа у функции вероятности), но при увеличении параметра λ становится все более симметричным.

Примечание : Среднее и дисперсия (квадрат ) равны параметру распределения Пуассона – λ (см. файл примера лист Пример ).

Задача

Типичным применением Распределения Пуассона в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: =ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения , то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: =ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание : Если x не является целым числом, то при вычислении формулы . Формулы =ПУАССОН.РАСП(2 ; 4; ЛОЖЬ) и =ПУАССОН.РАСП(2,9 ; 4; ЛОЖЬ) вернут одинаковый результат.

Генерация случайных чисел и оценка λ

При значениях λ>15 , Распределение Пуассона хорошо аппроксимируется Нормальным распределением со следующими параметрами: μ, σ 2 .

Подробнее о связи этих распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .

Например, регистрируется количество дорожных происшествий за неделю на определенном участке дороги. Это число представляет собой случайную величину, которая может принимать значения: (верхнего предела нет). Число дорожных происшествий может быть каким угодно большим. Если рассмотреть какой-либо короткий временной промежуток в течение недели, скажем минуту, то происшествие либо произойдет на его протяжении, либо нет. Вероятность дорожного происшествия в течение отдельно взятой минуты очень мала, и примерно такая же она для всех минут.

Распределение вероятностей числа происшествий описывается формулой:

где m - среднее количество происшествий за неделю на определенном участке дороги; е - константа, равная 2,718...

Характерные особенности данных, для которых наилучшим образом подходит распределение Пуассона, следующие:

1. Каждый малый интервал времени может рассматриваться как опыт, результатом которого является одно из двух: либо происшествие (“успех”), либо его отсутствие (“неудача”). Интервалы столь малы, что может быть только один “успех” в одном интервале, вероятность которого мала и неизменна.

2. Число “успехов" в одном большом интервале не зависит от их числа в другом, т.е. “успехи” беспорядочно разбросаны по временным промежуткам.

3. Среднее число “успехов” постоянно на протяжении всего времени. Распределение вероятностей Пуассона может быть использовано не только при работе со случайными величинами на временных интервалах, но и при учете дефектов дорожного покрытия на километр пути или опечаток на страницу текста. Общая формула распределения вероятностей Пуассона:

где m - среднее число “успехов” на единицу.

В таблицах распределения вероятностей Пуассона значения табулированы для определенных значений m и

Пример 2.7. В среднем на телефонной станции заказывают три телефонных разговора в течение пяти минут. Какова вероятность, что будет заказано 0, 1,2, 3, 4 или больше четырех разговоров в течение пяти минут?

Применим распределение вероятностей Пуассона, так как:

1. Существует неограниченное количество опытов, т.е. маленьких отрезков времени, когда может появиться заказ на телефонный разговор, вероятность чего мала и постоянна.

2. Считается, что спрос на телефонные разговоры беспорядочно распределен во времени.

3. Считается, что среднее число телефонных разговоров в любом -минутном отрезке времени одинаково.

В этом примере среднее число заказов равно 3 за 5 минут. Отсюда, распределение Пуассона:

При распределении вероятностей Пуассона, зная среднее число “успехов” на 5-минутном промежутке (например как в примере 2.7), для того чтобы узнать среднее число “успехов” за один час, нужно просто умножить на 12. В примере 2.7 среднее число заказов в час составит: 3 х 12 = 36. Аналогично, если требуется определить среднее число заказов в минуту:

Пример 2.8. В среднем за пять дней рабочей недели на автоматической линии происходят 3,4 неполадок. Какова вероятность двух неполадок в каждый день работы? Решение.

Можно применить распределение Пуассона:

1. Существует неограниченное количество опытов, т.е. малых промежутков времени, в течение каждого из них может произойти или не произойти неполадка на автоматической линии. Вероятность этого для каждого промежутка времени мала и постоянна.

2. Предполагается, что неполадки беспорядочно расположены во времени.

3. Предполагается, что среднее число неполадок в течение любых пяти дней постоянно.

Среднее число неполадок равно 3, 4 за пять дней. Отсюда число неполадок в день:

Следовательно,

Где λ равна среднему числу появления событий в одинаковых независимых испытаниях, т.е. λ = n × p, где p – вероятность события при одном испытании, e = 2,71828 .

Ряд распределения закона Пуассона имеет вид:


Назначение сервиса . Онлайн-калькулятор используется для построения Пуассоновского распределения и вычисления всех характеристик ряда: математического ожидания, дисперсии и среднеквадратического отклонения. Отчет с решением оформляется в формате Word .
Число испытаний: n = , Вероятность p =
Вычислить вероятность для: m =
наступит раз
менее раз
не менее раз
более раз
не более раз
не менее и не более раз
наступит хотя бы один раз
В случае, когда n велико, а λ = p·n > 10 формула Пуассона дает очень грубое приближение и для расчета P n (m) используют локальную и интегральную теоремы Муавра-Лапласа .

Числовые характеристики случайной величины Х

Математическое ожидание распределения Пуассона
M[X] = λ

Дисперсия распределения Пуассона
D[X] = λ

Пример №1 . Семена содержат 0.1% сорняков. Какова вероятность при случайном отборе 2000 семян обнаружить 5 семян сорняков?
Решение.
Вероятность р мала, а число n велико. np = 2 P(5) = λ 5 e -5 /5! = 0.03609
Математическое ожидание : M[X] = λ = 2
Дисперсия : D[X] = λ = 2

Пример №2 . Среди семян ржи имеется 0.4% семян сорняков. Составить закон распределения числа сорняков при случайном отборе 5000 семян. Найти математическое ожидание и дисперсию этой случайной величины.
Решение. Математическое ожидание: M[X] = λ = 0.004*5000 = 20. Дисперсия: D[X] = λ = 20
Закон распределения:

X 0 1 2 m
P e -20 20e -20 200e -20 20 m e -20 /m!

Пример №3 . На телефонной станции неправильное соединение происходит с вероятностью 1/200. Найдите вероятность того, что среди 200 соединений произойдет:
а) ровно одно неправильное соединение;
б) меньше чем три неправильных соединения;
в) больше чем два неправильных соединения.
Решение. По условию задачи вероятность события мала, поэтому используем формулу Пуассона (15).
а) Задано: n = 200, p = 1/200, k = 1. Найдем P 200 (1).
Получаем: . Тогда P 200 (1) ≈ e -1 ≈ 0,3679.
б) Задано: n = 200, p = 1/200, k < 3. Найдем P 200 (k < 3).
Имеем: a = 1.

в) Задано: n = 200, p = 1/200, k > 2. Найдем P 200 (k > 2).
Эту задачу можно решить проще: найти вероятность противоположного события, так как в этом случае нужно вычислить меньше слагаемых. Принимая во внимание предыдущий случай, имеем

Рассмотрим случай, когда n является достаточно большим, а p - достаточно малым; положим np = a, где a - некоторое число. В этом случае искомая вероятность определяется формулой Пуассона:


Вероятность появления k событий за время длительностью t можно также найти по формуле Пуассона:
где λ - интенсивность потока событий, то есть среднее число событий, которые появляются в единицу времени.

Пример №4 . Вероятность того, что деталь бракованная, равна 0.005. проверяется 400 деталей. Укажите формулу вычисления вероятности того, что больше 3 деталей оказались с браком.

Пример №5 . Вероятность появления бракованных деталей при их массовом производстве равна p. определить вероятность того, что в партии из N деталей содержится а) ровно три детали; б) не более трех бракованных деталей.
p=0,001; N = 4500
Решение.
Вероятность р мала, а число n велико. np = 4.5 < 10. Значит случайная величина Х – распределена по Пуассоновскому распределению. Составим закон.
Случайная величина X имеет область значений (0,1,2,...,m). Вероятности этих значений можно найти по формуле:

Найдем ряд распределения X.
Здесь λ = np = 4500*0.001 = 4.5
P(0) = e - λ = e -4.5 = 0.01111
P(1) = λe -λ = 4.5e -4.5 = 0.04999

Тогда вероятность того, что в партии из N деталей содержится ровно три детали, равна:

Тогда вероятность того, что в партии из N деталей содержится не более трех бракованных деталей:
P(x<3) = P(0) + P(1) + P(2) = 0,01111 + 0,04999 + 0,1125 = 0,1736

Пример №6 . Автоматическая телефонная станция получает в среднем за час N вызовов. Определить вероятность того, что за данную минуту она получит: а) ровно два вызова; б) более двух вызовов.
N = 18
Решение.
За одну минуту АТС в среднем получает λ = 18/60 мин. = 0,3
Считая, что случайное число X вызовов, поступивших на АТС за одну минуту,
подчиняется закону Пуассона, по формуле найдем искомую вероятность

Найдем ряд распределения X.
Здесь λ = 0.3
P(0) = e - λ = e -0.3 = 0.7408
P(1) = λe -λ = 0.3e -0.3 = 0.2222

Вероятность того, что за данную минуту она получит ровно два вызова:
P(2) = 0,03334
Вероятность того, что за данную минуту она получит более двух вызовов:
P(x>2) = 1 – 0,7408 – 0,2222 – 0,03334 = 0,00366

Пример №7 . Рассматриваются два элемента, работающих независимо друг от друга. Продолжительность времени безотказной работы имеет показательное распределение с параметром λ1 = 0,02 для первого элемента и λ2 = 0,05 для второго элемента. Найти вероятность того, что за 10 часов: а) оба элемента будут работать безотказно; б) только Вероятность того, что за 10 часов элемент №1 не выйдет из строя:
Рещение.
P 1 (0) = e -λ1*t = e -0.02*10 = 0,8187

Вероятность того, что за 10 часов элемент №2 не выйдет из строя:
P 2 (0) = e -λ2*t = e -0.05*10 = 0,6065

а) оба элемента будут работать безотказно;
P(2) = P 1 (0)*P 2 (0) = 0,8187*0,6065 = 0,4966
б) только один элемент выйдет из строя.
P(1) = P 1 (0)*(1-P 2 (0)) + (1-P 1 (0))*P 2 (0) = 0.8187*(1-0.6065) + (1-0.8187)*0.6065 = 0.4321

Пример №7 . Производство даёт 1% брака. Какова вероятность того, что из взятых на исследование 1100 изделий выбраковано будет не больше 17?
Примечание : поскольку здесь n*p =1100*0.01=11 > 10, то необходимо использовать

Снова напомним ситуацию, которая была названа схемой Бернулли: производится n независимых испытаний, в каждом из которых некоторое событие А может появиться с одной и той же вероятностью р . Тогда для определения вероятности того, что в этих n испытаниях событие А появится ровно k раз (такая вероятность обозначалась P n (k ) ) может быть точно вычислена по формуле Бернулли , гдеq =1− p . Однако при большом числе испытаний n расчеты по формуле Бернулли становятся очень неудобными, так как приводят к действиям с очень большими числами. Поэтому (если помните это когда-то проходилось при изучении схемы и формулы Бернулли при изучении первой части теории вероятностей «Случайные события») при больших n предлагались значительно более удобные (хотя и приближенные) формулы, которые оказывались тем точнее, чем больше n (формула Пуассона, локальная и интегральная формула Муавра-Лапласа). Если в схеме Бернулли число опытов n велико, а вероятность р появления события А в каждом испытании мала, то хорошее приближение дает упомянутая формула Пуассона
, где параметра = n p . Эта формула и приводит к распределению Пуассона. Дадим точные определения

Дискретная случайная величина Х имеет распределение Пуассона , если она принимает значения 0, 1, 2, ... с вероятностями р 0 , р 1 , ... , которые вычисляются по формуле

а число а является параметром распределения Пуассона. Обращаем внимание, что возможных значений с.в. Х бесконечно много это все целые неотрицательные числа. Таким образом, д.с.в Х с распределением Пуассона имеет следующий закон распределения:

При вычислении математического ожидания (по их определению для д.с.в. с известным законом распределения) придется теперь считать не конечные суммы, а суммы соответствующих бесконечных рядов (так как таблица закона распределения имеет бесконечно много столбцов). Если же посчитать суммы этих рядов, то окажется, что и математическое ожидание, и дисперсия случайной величины Х с распределением Пуассона совпадает с параметром а этого распределения:

,
.

Найдем моду d (X ) распределенной по Пуассону случайной величины Х . Применим тот же самый прием, что был использован для вычисления моды биномиально распределенной случайной величины. По определению моды d (X )= k , если вероятность
наибольшая среди всех вероятностей р 0 , р 1 , ... . Найдем такое число k (это целое неотрицательное число). При таком k вероятность p k должна быть не меньше соседних с ней вероятностей: p k −1 p k p k +1 . Подставив вместо каждой вероятности соответствующую формулу, получим, что число k должно удовлетворять двойному неравенству:

.

Если расписать формулы для факториалов и провести простые преобразования, можно получить, что левое неравенство дает k ≤ а , а правое k ≥ а −1 . Таким образом, число k удовлетворяет двойному неравенству а −1 ≤ k ≤ а , т.е. принадлежит отрезку [а −1, а ] . Поскольку длина этого отрезка, очевидно, равна 1 , то в него может попасть либо одно, либо 2 целых числа. Если число а целое, то в отрезке [а −1, а ] имеется 2 целых числа, лежащих на концах отрезка. Если же число а не целое, то в этом отрезке есть только одно целое число.

Таким образом, если число а целое, то мода распределенной по Пуассону случайной величины Х принимает 2 соседних значения: d (X )=а−1 и d (X )=а . Если же число а не целое, то мода имеет одно значение d (X )= k , где k есть единственное целое число, удовлетворяющее неравенству а −1 ≤ k ≤ а , т.е. d (X )= [а ] .

Пример . Завод отправил на базу 5000 изделий. Вероятность того, что в пути изделие повредится, равно 0.0002 . Какова вероятность, что повредится 18 изделий? Каково среднее значение поврежденных изделий? Каково наивероятнейшее число поврежденных изделий и какова его вероятность?

Как сразу стали поступать запросы: «Где Пуассон? Где задачи на формулу Пуассона?» и т.п . И поэтому я начну с частного применения распределения Пуассона – ввиду большой востребованности материала.

Задача до боли эйфории знакома:

И следующие две задачи принципиально отличаются от предыдущих:

Пример 4

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет значение, меньшее, чем ее математическое ожидание.

Отличие состоит в том, что здесь речь идёт ИМЕННО о распределении Пуассона.

Решение : случайная величина принимает значения с вероятностями:

По условию, , и тут всё просто: событие состоит в трёх несовместных исходах :

Вероятность того, что случайная величина примет значение, меньшее, чем ее математическое ожидание.

Ответ :

Аналогичная задача на понимание:

Пример 5

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет положительное значение.

Решение и ответ в конце урока.

Помимо приближения биномиального распределения (Примеры 1-3), распределение Пуассона нашло широкое применение в теории массового обслуживания для вероятностной характеристики простейшего потока событий. Постараюсь быть лаконичным:

Пусть в некоторую систему поступают заявки (телефонные звонки, приходящие клиенты и т.д.). Поток заявок называют простейшим , если он удовлетворяет условиям стационарности , отсутствия последствий и ординарности . Стационарность подразумевает то, что интенсивность заявок постоянна и не зависит от времени суток, дня недели или других временнЫх рамок. Иными словами, не бывает «часа пик» и не бывает «мёртвых часов». Отсутствие последствий означает, что вероятность появления новых заявок не зависит от «предыстории», т.е. нет такого, что «одна бабка рассказала» и другие «набежали» (или наоборот, разбежались). И, наконец, свойство ординарности характеризуется тем, что за достаточно малый промежуток времени практически невозможно появление двух или бОльшего количества заявок. «Две старушки в двери?» – нет уж, увольте.

Итак, пусть в некоторую систему поступает простейший поток заявок со средней интенсивностью заявок в минуту (в час, в день или в произвольный промежуток времени). Тогда вероятность того, что за данный промежуток времени , в систему поступит ровно заявок, равна:

Пример 6

Звонки в диспетчерскую такси представляет собой простейший пуассоновский поток со средней интенсивностью 30 вызовов в час. Найти вероятность того, что: а) за 1 мин. поступит 2-3 вызова, б) в течение пяти минут будет хотя бы один звонок.

Решение : используем формулу Пуассона:

а) Учитывая стационарность потока, вычислим среднее количество вызовов за 1 минуту:
вызова – в среднем за одну минуту.

По теореме сложения вероятностей несовместных событий:
– вероятность того, что за 1 минуту в диспетчерскую поступит 2-3 вызова.

б) Вычислим среднее количество вызов за пять минут: