Точная оценка математического ожидания нормального распределения. Оценки математического ожидания и дисперсии

Математическое ожидание - это распределение вероятностей случайной величины

Математическое ожидание, определение, математическое ожидание дискретной и непрерывной случайных величин, выборочное, условное матожидание, расчет, свойства, задачи, оценка матожидания, дисперсия, функция распределения, формулы, примеры расчета

Развернуть содержание

Свернуть содержание

Математическое ожидание - это, определение

Одно из важнейших понятий в математической статистике и теории вероятностей, характеризующее распределение значений или вероятностей случайной величины. Обычно выражается как средневзвешенное значение всех возможных параметров случайной величины. Широко применяется при проведении технического анализа, исследовании числовых рядов, изучении непрерывных и продолжительных процессов. Имеет важное значение при оценке рисков, прогнозировании ценовых показателей при торговле на финансовых рынках, используется при разработке стратегий и методов игровой тактики в теории азартных игр.

Математическое ожидание - это среднее значение случайной величины, распределение вероятностей случайной величины рассматривается в теории вероятностей.

Математическое ожидание – это мера среднего значения случайной величины в теории вероятности. Математическое ожидание случайной величины x обозначается M(x) .

Математическое ожидание – это

Математическое ожидание – это в теории вероятности средневзвешенная величина всех возможных значений, которые может принимать эта случайная величина.

Математическое ожидание – это сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Математическое ожидание – это средняя выгода от того или иного решения при условии, что подобное решение может быть рассмотрено в рамках теории больших чисел и длительной дистанции.

Математическое ожидание – это в теории азартных игр сумма выигрыша, которую может заработать или проиграть игрок, в среднем, по каждой ставке. На языке азартных игроков это иногда называется «преимуществом игрока» (если оно положительно для игрока) или «преимуществом казино» (если оно отрицательно для игрока).

Математическое ожидание – это процент прибыли на выигрыш, умноженный на среднюю прибыль, минус вероятность убытка, умноженная на средний убыток.

Математическое ожидание случайной величины в математической теории

Одной из важных числовых характеристик случайной величины является математическое ожидание. Введем понятие системы случайных величин. Рассмотрим совокупность случайных величин, которые являются результатами одного и того же случайного эксперимента. Если - одно из возможных значений системы, то событию соответствует определенная вероятность удовлетворяющая аксиомам Колмогорова. Функция, определенная при любых возможных значениях случайных величин, называется совместным законом распределения. Эта функция позволяет вычислять вероятности любых событий из. В частности, совместный закон распределения случайных величин и, которые принимают значения из множества и, задается вероятностями.

Термин «математическое ожидание» введён Пьером Симоном маркизом де Лапласом (1795) и произошёл от понятия «ожидаемого значения выигрыша», впервые появившегося в 17 веке в теории азартных игр в трудах Блеза Паскаля и Христиана Гюйгенса. Однако первое полное теоретическое осмысление и оценка этого понятия даны Пафнутием Львовичем Чебышёвым (середина 19 века).

Закон распределения случайных числовых величин (функция распределения и ряд распределения или плотность вероятности) полностью описывают поведение случайной величины. Но в ряде задач достаточно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный вопрос. Основными числовыми характеристиками случайных величин являются математическое ожидание, дисперсия, мода и медиана.

Математическим ожиданием дискретной случайной величины называется сумма произведений ее возможных значений на соответствующие им вероятности. Иногда математическое ожидание называют взвешенным средним, так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольшего. Математическое ожидание случайной величины есть неслучайная (постоянная) величина.

Математическое ожидание имеет простой физический смысл: если на прямой разместить единичную массу, поместив в некоторые точки некоторую массу (для дискретного распределения), или «размазав» её с определенной плотностью (для абсолютно непрерывного распределения), то точка, соответствующая математическому ожиданию, будет координатой «центра тяжести» прямой.

Среднее значение случайной величины есть некоторое число, являющееся как бы её «представителем» и заменяющее её при грубо ориентировочных расчетах. Когда мы говорим: «среднее время работы лампы равно 100 часам» или «средняя точка попадания смещена относительно цели на 2 м вправо», мы этим указываем определенную числовую характеристику случайной величины, описывающую её местоположение на числовой оси, т.е. «характеристику положения».

Из характеристик положения в теории вероятностей важнейшую роль играет математическое ожидание случайной величины, которое иногда называют просто средним значением случайной величины.

Рассмотрим случайную величину Х , имеющую возможные значения х1, х2, …, хn с вероятностями p1, p2, …, pn . Нам требуется охарактеризовать каким-то числом положение значений случайной величины на оси абсцисс с учетом того, что эти значения имеют различные вероятности. Для этой цели естественно воспользоваться так называемым «средним взвешенным» из значений xi , причем каждое значение xi при осреднении должно учитываться с «весом», пропорциональным вероятности этого значения. Таким образом, мы вычислим среднее случайной величины X , которое мы обозначим M |X| :

Это среднее взвешенное значение и называется математическим ожиданием случайной величины. Таким образом, мы ввели в рассмотрении одно из важнейших понятий теории вероятностей – понятие математического ожидания. Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Х связано своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины при большом числе опытов. Эта зависимость того же типа, как зависимость между частотой и вероятностью, а именно: при большом числе опытов среднее арифметическое наблюденных значений случайной величины приближается (сходится по вероятности) к ее математическому ожиданию. Из наличия связи между частотой и вероятностью можно вывести как следствие наличие подобной же связи между средним арифметическим и математическим ожидание. Действительно, рассмотрим случайную величину Х , характеризуемую рядом распределения:

Пусть производится N независимых опытов, в каждом из которых величина X принимает определенное значение. Предположим, что значение x1 появилось m1 раз, значение x2 появилось m2 раз, вообще значение xi появилось mi раз. Вычислим среднее арифметическое наблюденных значений величины Х, которое, в отличие от математического ожидания М|X| мы обозначим M*|X|:

При увеличении числа опытов N частоты pi будут приближаться (сходиться по вероятности) к соответствующим вероятностям. Следовательно, и среднее арифметическое наблюденных значений случайной величины M|X| при увеличении числа опытов будет приближаться (сходится по вероятности) к её математическому ожиданию. Сформулированная выше связь между средним арифметическим и математическим ожиданием составляет содержание одной из форм закона больших чисел.

Мы уже знаем, что все формы закона больших чисел констатируют факт устойчивости некоторых средних при большом числе опытов. Здесь речь идет об устойчивости среднего арифметического из ряда наблюдений одной и той же величины. При небольшом числе опытов среднее арифметическое их результатов случайно; при достаточном увеличении числа опытов оно становится «почти не случайным» и, стабилизируясь, приближается к постоянной величине – математическому ожиданию.

Свойство устойчивости средних при большом числе опытов легко проверить экспериментально. Например, взвешивая какое-либо тело в лаборатории на точных весах, мы в результате взвешивания получаем каждый раз новое значение; чтобы уменьшить ошибку наблюдения, мы взвешиваем тело несколько раз и пользуемся средним арифметическим полученных значений. Легко убедиться, что при дальнейшем увеличении числа опытов (взвешиваний) среднее арифметическое реагирует на это увеличение все меньше и меньше и при достаточно большом числе опытов практически перестает меняться.

Следует заметить, что важнейшая характеристика положения случайной величины – математическое ожидание – существует не для всех случайных величин. Можно составить примеры таких случайных величин, для которых математического ожидания не существует, так как соответствующая сумма или интеграл расходятся. Однако для практики такие случаи существенного интереса не представляют. Обычно случайные величины, с которыми мы имеем дело, имеют ограниченную область возможных значений и, безусловно, обладают математическим ожиданием.

Кроме важнейшей из характеристик положения случайной величины – математического ожидания, - на практике иногда применяются и другие характеристики положения, в частности, мода и медиана случайной величины.

Модой случайной величины называется её наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. На рисунках показана мода соответственно для прерывной и непрерывной случайных величин.

Если многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется «полимодальным».

Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом. Такие распределения называют «антимодальными».

В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т.е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения.

Часто применяется еще одна характеристика положения – так называемая медиана случайной величины. Этой характеристикой пользуются обычно только для непрерывных случайных величин, хотя формально можно её определить и для прерывной величины. Геометрически медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.

В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой.

Математическое ожидание представляет собой среднее значение, случайной величины - числовая характеристика распределения вероятностей случайной величины. Самым общим образом математическое ожидание случайной величины Х(w) определяется как интеграл Лебега по отношению к вероятностной мере Р в исходном вероятностном пространстве:

Математическое ожидание может быть вычислено и как интеграл Лебега от х по распределению вероятностей рх величины X :

Естественным образом можно определить понятие случайной величины с бесконечным математическим ожиданием. Типичным примером служат времена возвращения в некоторых случайных блужданиях.

С помощью математического ожидания определяются многие числовые и функциональные характеристики распределения (как математическое ожидание соответствующих функций от случайной величины), например, производящая функция, характеристическая функция, моменты любого порядка, в частности дисперсия, ковариация.

Математическое ожидание есть характеристика расположения значений случайной величины (среднее значение ее распределения). В этом качестве математическое ожиддание служит некоторым "типичным" параметром распределения и его роль аналогична роли статического момента - координаты центра тяжести распределения массы - в механике. От прочих характеристик расположения, с помощью которых распределение описывается в общих чертах,- медиан, мод, математическое ожидание отличается тем большим значением, которое оно и соответствующая ему характеристика рассеяния - дисперсия - имеют в предельных теоремах теории вероятностей. С наибольшей полнотой смысл математического ожидания раскрывается законом больших чисел (неравенство Чебышева) и усиленным законом больших чисел.

Математическое ожидание дискретной случайной величины

Пусть есть некоторая случайная величина, которая может принять одно из нескольких числовых значений (допустим, количество очков при броске кости может быть 1, 2, 3, 4, 5 или 6). Часто на практике для такой величины возникает вопрос: а какое значение она принимает "в среднем" при большом количестве тестов? Каков будет наш средний доход (или убыток) от каждой из рискованных операций?

Скажем, есть какая-то лотерея. Мы хотим понять, выгодно или нет в ней поучаствовать (или даже участвовать неоднократно, регулярно). Допустим, выигрышный каждый четвёртый билет, приз составит 300 руб., а цена любого билета - 100 руб. При бесконечно большом количестве участий получается вот что. В трёх четвертях случаев мы проиграем, каждые три проигрыша обойдутся в 300 руб. В каждом четвёртом случае мы выиграем 200 руб. (приз минус стоимость), то есть за четыре участия мы в среднем теряем 100 руб., за одно - в среднем 25 руб. Итого в среднем темпы нашего разорения составят 25 руб./билет.

Кидаем игральную кость. Если она не жульническая (без смещения центра тяжести и т.д.), то сколько мы в среднем будем иметь очков за раз? Поскольку каждый вариант равновероятен, берём тупо среднее арифметическое и получаем 3,5. Поскольку это СРЕДНЕЕ, то незачем возмущаться, что 3,5 очков никакой конкретный бросок не даст - ну нет у этого куба грани с таким числом!

Теперь обобщим наши примеры:

Обратимся к только что приведённой картинке. Слева табличка распределения случайной величины. Величина X может принимать одно из n возможных значений (приведены в верхней строке). Никаких других значений не может быть. Под каждым возможным значением снизу подписана его вероятность. Справа приведена формула, где M(X) и называется математическим ожиданием. Смысл этой величины в том, что при большом количестве испытаний (при большой выборке) среднее значение будет стремиться к этому самому математическому ожиданию.

Вернёмся опять к тому же самому игральному кубу. Математическое ожидание количества очков при броске равно 3,5 (посчитайте сами по формуле, если не верите). Скажем, вы кинули его пару раз. Выпали 4 и 6. В среднем получилось 5, то есть далеко от 3,5. Кинули ещё разок, выпало 3, то есть в среднем (4 + 6 + 3)/3 = 4,3333... Как-то далеко от математического ожидания. А теперь проведите сумасшедший эксперимент - киньте куб 1000 раз! И если в среднем и не будет ровно 3,5, то будет близко к тому.

Посчитаем математическое ожидание для выше описанной лотереи. Табличка будет выглядеть вот так:

Тогда математическое ожидание составит, как мы установили выше.:

Другое дело, что так же "на пальцах", без формулы, было бы трудновато, если бы имелось больше вариантов. Ну скажем, имелось бы 75% проигрышных билетов, 20% выигрышных билетов и 5% особо выигрышных.

Теперь некоторые свойства математического ожидания.

Доказать это просто:

Постоянный множитель допускается выносить за знак математического ожидания, то есть:

Это является частным случаем свойства линейности математического ожидания.

Другое следствие линейности математического ожидания:

то есть математическое ожидание суммы случайных величин равно сумме математических ожиданий случайных величин.

Пусть X, Y - независимые случайные величины , тогда:

Это тоже несложно доказать) Произведение XY само представляет собой случайную величину, при этом если исходные величины могли принимать n и m значений соответственно, то XY может принимать nm значений. Вероятность каждого из значений вычисляется исходя из того, что вероятности независимых событий перемножаются. В итоге получаем вот что:

Математическое ожидание непрерывной случайной величины

У непрерывных случайных величин есть такая характеристика, как плотность распределения (плотность вероятности). Она, по сути характеризует ситуацию, что некоторые значения из множества действительных чисел случайная величина принимает чаще, некоторые - реже. Например, рассмотрим вот какой график:

Здесь X - собственно случайная величина, f(x) - плотность распределения. Судя по данному графику, при опытах значение X часто будет числом, близким к нулю. Шансы же превысить 3 или оказаться меньше -3 скорее чисто теоретические.

Пусть, например, есть равномерное распределение:

Это вполне соответствует интуитивному пониманию. Скажем, если мы получаем при равномерном распределении много случайных действительных чисел, каждое из отрезка |0; 1| , то среднее арифметическое должно быть около 0,5.

Свойства математического ожидания - линейность и т.д., применимые для дискретных случайных величин, применимы и здесь.

Взаимосвязь математического ожидания с другими статистическими показателями

В статистическом анализе наряду с математическим ожиданием существует система взаимозависимых показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

Степень изменчивости или устойчивости процессов в статистической науке может измеряться с помощью нескольких показателей.

Наиболее важным показателем, характеризующим изменчивость случайной величины, является Дисперсия , которая самым тесным и непосредственным образом связана с математическим ожиданием. Этот параметр активно используется в других видах статистического анализа (проверка гипотез, анализ причинно-следственных связей и др.). Как и среднее линейное отклонение, дисперсия также отражает меру разброса данных вокруг средней величины.

Язык знаков полезно перевести на язык слов. Получится, что дисперсия - это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Разгадка магического слова «дисперсия» заключается всего в трех словах.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который используется для других видов статистического анализа. У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных.

Пусть мы измеряем случайную величину N раз, например, десять раз измеряем скорость ветра и хотим найти среднее значение. Как связано среднее значение с функцией распределения?

Или будем кидать игральный кубик большое количество раз. Количество очков, которое выпадет на кубике при каждом броске, является случайной величиной и может принимать любые натуральные значения от 1 до 6. Среднее арифметическое выпавших очков, подсчитанных за все броски кубика, тоже является случайной величиной, однако при больших N оно стремится ко вполне конкретному числу – математическому ожиданию Mx . В данном случае Mx = 3,5.

Каким образом получилась эта величина? Пусть в N испытаниях n1 раз выпало 1 очко, n2 раз – 2 очка и так далее. Тогда количество исходов, в которых выпало одно очко:

Аналогично для исходов, когда выпало 2, 3, 4, 5 и 6 очков.

Предположим теперь, что мы знаем закон распределения случайной величины x, то есть знаем, что случайная величина x может принимать значения x1, x2, ..., xk с вероятностями p1, p2, ..., pk.

Математическое ожидание Mx случайной величины x равно:

Математическое ожидание не всегда является разумной оценкой какой-нибудь случайной величины. Так, для оценки средней заработной платы разумнее использовать понятие медианы, то есть такой величины, что количество людей, получающих меньшую, чем медиана, зарплату и большую, совпадают.

Вероятность р1 того, что случайная величина х окажется меньшей х1/2, и вероятность р2 того, что случайная величина x окажется большей х1/2, одинаковы и равны 1/2. Медиана определяется однозначно не для всех распределений.

Стандартным или Среднеквадратическим отклонением в статистике называется степень отклонения данных наблюдений или множеств от СРЕДНЕГО значения. Обозначается буквами s или s. Небольшое стандартное отклонение указывает на то, что данные группируются вокруг среднего значения, а значительное - что начальные данные располагаются далеко от него. Стандартное отклонение равно квадратному корню величины, называемой дисперсией. Она есть среднее число суммы возведенных в квадрат разностей начальных данных, отклоняющихся от среднего значения. Среднеквадратическим отклонением случайной величины называется корень квадратный из дисперсии:

Пример. В условиях испытаний при стрельбе по мишени вычислить дисперсию и среднеквадратическое отклонение случайной величины:

Вариация - колеблемость, изменяемость величины признака у единиц совокупности. Отдельные числовые значения признака, встречающиеся в изу¬чаемой совокупности, называют вариантами значений. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Коэффициент вариации вычисляют по формуле:

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности. Этот показатель дает самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Зависимость от крайних значений признака придает размаху вариации неустойчивый, случайный характер.

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины:

Математическое ожидание в теории азартных игр

Математическое ожидание – это среднее количество денег, которое игрок в азартные игры может выиграть или проиграть на данной ставке. Это очень существенное понятие для игрока, потому что оно является основополагающим для оценки большинства игровых ситуаций. Математическое ожидание – это также оптимальный инструмент для анализа основных карточных раскладов и игровых ситуаций.

Допустим, вы играете с другом в монетку, каждый раз делая ставку поровну по $1 независимо оттого, что выпадет. Решка – вы выиграли, орел – проиграли. Шансы на то, что выпадет решка один к одному, и вы делаете ставку $1 к $1. Таким образом, математическое ожидание у вас равно нулю, т.к. с точки зрения математики вы не можете знать будете вы вести или проигрывать после двух бросков или после 200.

Ваш часовой выигрыш равен нулю. Часовой выигрыш – это то количество денег, которое вы ожидаете выиграть за час. Вы можете кидать монету 500 раз в течение часа, но вы не выиграете и не проиграете, т.к. ваши шансы ни положительны, ни отрицательны. Если смотреть, с точки зрения серьезного игрока такая система ставок неплоха. Но это попросту потеря времени.

Но предположим, кто-то хочет поставить $2 против вашего $1 в эту же игру. Тогда вы сразу же обладаете положительным матожиданием в 50 центов с каждой ставки. Почему 50 центов? В среднем одну ставку вы выигрываете, вторую проигрываете. Поставите первый доллар – и потеряете $1, ставите второй – выиграете $2. Вы два раза сделали ставку по $1 и идете впереди на $1. Таким образом, каждая из ваших однодолларовых ставок дала вам 50 центов.

Если за один час монета выпадет 500 раз, ваш часовой выигрыш составит уже $250, т.к. в среднем вы потеряли по одному доллару 250 раз и выиграли по два доллара 250 раз. $500 минус $250 равно $250, что и составляет суммарный выигрыш. Обратите внимание, что матожидание, являющиеся суммой, которую в среднем вы выиграли на одной ставке, равняется 50 центам. Вы выиграли $250, делая ставку по доллару 500 раз, что равняется 50 центам со ставки.

Математическое ожидание не имеет ничего общего с кратковременным результатом. Ваш оппонент, который решил ставить против вас $2 мог обыграть вас на первых десяти бросках подряд, но вы, обладая преимуществом ставок 2 к 1 при прочих равных, в любых обстоятельствах зарабатываете 50 центов с каждой ставки в $1. Нет разницы, выигрываете вы либо проигрываете одну ставку или несколько ставок, но только при условии, что у вас хватит наличности, чтобы спокойно компенсировать затраты. Если вы будете продолжать ставить так же, то за длительный период времени ваш выигрыш подойдет к сумме матожиданий в отдельных бросках.

Каждый раз, делая ставку с лучшим исходом (ставка, которая может оказаться выгодной на длинной дистанции), когда шансы в вашу пользу, вы обязательно что-то выигрываете на ней, и не важно теряете ли вы ее или нет в данной раздаче. И напротив, если вы сделали ставку с худшим исходом (ставка, которая невыгодна на длинной дистанции), когда шансы не в вашу пользу, вы что-то теряете независимо от того, выиграли вы или проиграли в данной раздаче.

Вы делаете ставку с лучшим исходом, если матожидание у вас положительно, а оно является положительным, если шансы на вашей стороне. Делая ставку с худшим исходом, у вас отрицательное матожидание, которое бывает, когда шансы против вас. Серьезные игроки делают ставки только с лучшим исходом, при худшем – они пасуют. Что означает шансы в вашу пользу? Вы можете в итоге выиграть больше, чем приносят реальные шансы. Реальные шансы на то, что выпадет решка 1 к 1, но у вас выходит 2 к 1 за счет соотношения ставок. В данном случае шансы в вашу пользу. Вы точно получаете лучший исход с положительным ожиданием в 50 центов за одну ставку.

Вот более сложный пример математического ожидания. Приятель пишет цифры от одного до пяти и делает ставку $5 против вашего $1 на то, что вы не определите загаданную цифру. Соглашаться ли вам на такое пари? Какое здесь матожидание?

В среднем четыре раза вы ошибетесь. Исходя из этого, шансы против того, что вы отгадаете цифру, составят 4 к 1. Шансы за то, что при одной попытке вы лишитесь доллара. Тем не менее, вы выигрываете 5 к 1, при возможности проиграть 4 к 1. Поэтому шансы в вашу пользу, вы можете принимать пари и надеяться на лучший исход. Если вы сделаете такую ставку пять раз, в среднем вы проиграете четыре раза по $1 и один раз выиграете $5. Исходя из этого, за все пять попыток вы заработаете $1 с положительным математическим ожиданием в 20 центов за одну ставку.

Игрок, который собирается выиграть больше, чем ставит, как в примере выше, – ловит шансы. И напротив, он губит шансы, когда предполагает выиграть меньше, чем ставит. Игрок, делающий ставку может иметь либо положительное, либо отрицательное матожидание, которое зависит от того, ловит он или губит шансы.

Если вы поставите $50 для того, чтобы выиграть $10 при вероятности выигрыша 4 к 1, то вы получите отрицательное матожидание $2, т.к. в среднем вы выиграете четыре раза по $10 и один раз проиграете $50, из чего видно, что потеря за одну ставку составит $10. Но вот если вы поставите $30 для того, чтобы выиграть $ 10, при тех же шансах выигрыша 4 к 1, то в данном случае вы имеете положительное ожидание $2, т.к. вы вновь выигрываете четыре раза по $10 и один раз проигрываете $30, что составит прибыль в $10. Данные примеры показывают, что первая ставка плохая, а вторая – хорошая.

Математическое ожидание является центром любой игровой ситуации. Когда букмекер призывает футбольных болельщиков ставить $11, чтобы выиграть $10, то он имеет положительное матожидание с каждых $10 в размере 50 центов. Если казино выплачивает равные деньги с пасовой линии в крепсе, то положительное ожидание казино составит приблизительно $1.40 с каждых $100, т.к. эта игра построена так, что каждый, кто поставил на эту линию, в среднем проигрывает 50.7% и выигрывает 49.3% общего времени. Бесспорно, именно это вроде бы минимальное положительное матожидание и приносит колоссальные прибыли владельцам казино по всему миру. Как заметил хозяин казино Vegas World Боб Ступак, «одна тысячная процента отрицательной вероятности на достаточно длинной дистанции разорит богатейшего человека в мире».

Математическое ожидание при игре в Покер

Игра в Покер является наиболее показательным и наглядным примером с точки зрения использования теории и свойств математического ожидания.

Математическое ожидание (англ. Expected Value) в Покере – средняя выгода от того или иного решения при условии, что подобное решение может быть рассмотрено в рамках теории больших чисел и длительной дистанции. Успешная игра в покер заключается в том, чтобы всегда принимать ходы только с положительным математическим ожиданием.

Математический смысл математического ожидания при игре в покер заключается в том, что мы часто сталкиваемся со случайными величинами при принятии решения (мы не знаем, какие именно карты на руках у оппонента, какие карты придут на последующих кругах торговли). Мы должны рассматривать каждое из решений с точки зрения теории больших чисел, которая гласит, что при достаточно большой выборке среднее значение случайной величины будет стремиться к её математическому ожиданию.

Среди частных формул для вычисления математического ожидания, в покере наиболее применима следующая:

При игре в покер математическое ожидание можно рассчитывать как для ставок, так и для коллов. В первом случае во внимание следует принимать фолд-эквити, во втором - собственные шансы банка. При оценке математического ожидания того или иного хода следует помнить, что фолд всегда имеет нулевое матожидание. Таким образом, сброс карт будет всегда более выгодным решением, чем любой отрицательный ход.

Ожидание говорит вам о том, что вы можете ожидать (прибыль или убыток) на каждый рискуемый вами доллар. Казино зарабатывают деньги, поскольку математическое ожидание от всех игры, которые практикуются в них, в пользу казино. При достаточно длинной серии игры можно ожидать, что клиент потеряет свои деньги, поскольку «вероятность» в пользу казино. Однако профессиональные игроки в казино ограничивают свои игры короткими промежутками времени, тем самым увеличивая вероятность в свою пользу. То же самое касается и инвестирования. Если ваше ожидание является положительным, вы можете заработать больше денег, совершая много сделок в короткий период времени. Ожидание это ваш процент прибыли на выигрыш, умноженный на среднюю прибыль, минус ваша вероятность убытка, умноженная на средний убыток.

Покер также можно рассмотреть с точки зрения математического ожидания. Вы можете предположить, что определенный ход выгоден, но в некоторых случаях он может оказаться далеко не лучшим, потому что выгоднее другой ход. Допустим, вы собрали фулл-хаус в пятикарточном покере с обменом. Ваш соперник делает ставку. Вы знаете, что если повысите ставку, он ответит. Поэтому повышение выглядит лучшей тактикой. Но если вы все же поднимите ставку, оставшиеся двое игроков, точно сбросят карты. Но если вы уравняете ставку, то будете полностью уверены, что двое других игроков после вас поступят также. При повышении ставки вы получаете одну единицу, а просто уравнивая – две. Таким образом, уравнивание дает вам более высокое положительное математическое ожидание, и будет являться наилучшей тактикой.

Математическое ожидание также может дать понятие о том, какая в покере тактика менее выгодна, а какая – более. К примеру, играя на определенной руке, вы полагаете, что ваши потери в среднем составят 75 центов, включая анте, то такую руку следует играть, т.к. это лучше, чем сброситься, когда анте равно $1.

Другой важной причиной для понимания сути математического ожидания является то, что оно дает вам чувство спокойствия независимо от того, выиграли вы ставку или нет: если вы сделали хорошую ставку или вовремя спасовали, вы будете знать, что вы заработали или сберегли определенное количество денег, которое игрок слабее не смог уберечь. Гораздо сложнее сбросить карты, если вы расстроены тем, что соперник на обмене собрал более сильную комбинацию. При всем при этом, деньги, которые вы сберегли, не играя, вместо того, чтобы ставить, прибавляются к вашему выигрышу за ночь или за месяц.

Просто помните, что если поменять ваши руки, ваш соперник ответил бы вам, и как вы увидите в статье «фундаментальная теорема покера» это лишь одно из ваших преимуществ. Вы должны радоваться, когда это случится. Вам даже можно научиться получать удовольствие от проигранной раздачи, потому что вы знаете, что другие игроки на вашем месте проиграли бы гораздо больше.

Как говорилось в примере с игрой в монетку в начале, часовой коэффициент прибыли взаимосвязан с математическим ожиданием, и данное понятие особенно важно для профессиональных игроков. Когда вы собираетесь играть в покер, вы должны мысленно прикинуть, сколько вы сможете выиграть за час игры. В большинстве случаев вам необходимо будет основываться на вашей интуиции и опыте, но вы также можете пользоваться и некоторыми математическими выкладками. К примеру, вы играете в лоуболл с обменом, и наблюдаете, что три участника делают ставки по $10, а затем меняют две карты, что является очень плохой тактикой, вы можете посчитать для себя, что каждый раз, когда они ставят $10, они теряют около $2. Каждый из них делает это восемь раз в час, а значит, все трое теряют в час примерно $48. Вы один из оставшихся четырех игроков, которые приблизительно равны, соответственно эти четыре игрока (и вы среди них) должны разделить $48, и прибыль каждого составит $12 в час. Ваш часовой коэффициент в этом случае попросту равен вашей доли от суммы денег, проигранной тремя плохими игроками за час.

За большой промежуток времени суммарный выигрыш игрока составляет сумму его математических ожиданий в отдельных раздачах. Чем больше вы играете с положительным ожиданием, тем больше выигрываете, и наоборот, чем больше раздач с отрицательным ожиданием вы сыграете, тем больше вы проиграете. Вследствие этого, следует отдавать предпочтение игре, которая сможет максимально увеличить ваше положительное ожидание или сведет на нет отрицательное, чтобы вы смогли поднять до максимума ваш часовой выигрыш.

Положительное математическое ожидание в игровой стратегии

Если вы знаете, как считать карты, у вас может быть преимущество перед казино, если они не заметят этого и не выкинут вас вон. Казино обожают пьяных игроков и не переносят считающих карты. Преимущество позволит вам со временем выиграть большее число раз, чем проиграть. Хорошее управление капиталом при использовании расчетов математического ожидания может помочь извлечь больше прибыли из вашего преимущества и сократить потери. Без преимущества вам лучше отдать деньги на благотворительность. В игре на бирже преимущество дает система игры, создающая большую прибыль, чем потери, разница цен и комиссионные. Никакое управление капиталом не спасет плохую игровую систему.

Положительное ожидание определяется значением, превышающим ноль. Чем больше это число, тем сильнее статис¬тическое ожидание. Если значение меньше нуля, то математическое ожидание также будет отрицательным. Чем больше модуль отрица¬тельного значения, тем хуже ситуация. Если результат равен нулю, то ожидание является безубыточным. Вы можете выиграть только тогда, когда у вас положительное математическое ожидание, разумная система игры. Игра по интуиции приводит к катастрофе.

Математическое ожидание и биржевая торговля

Математическое ожидание – достаточно широко востребованный и популярный статистический показатель при осуществлении биржевых торгов на финансовых рынках. В первую очередь данный параметр используют для анализа успешности торговли. Не сложно догадаться, что чем больше данное значение, тем больше оснований считать изучаемую торговлю успешной. Конечно, анализ работы трейдера не может производиться только лишь с помощью данного параметра. Тем не менее, вычисляемое значение в совокупности с другими способами оценки качества работы, может существенно повысить точность анализа.

Математическое ожидание часто вычисляется в сервисах мониторингов торговых счетов, что позволяет быстро оценивать работу, совершаемую на депозите. В качестве исключений можно привести стратегии, в которых используется “пересиживание” убыточных сделок. Трейдеру может некоторое время сопутствовать удача, а потому, в его работе может не оказаться убытков вообще. В таком случае, ориентироваться только по матожиданию не получится, ведь не будут учтены риски, используемые в работе.

В торговле на рынке математическое ожидание чаще всего применяют при прогнозировании доходности какой-либо торговой стратегии или при прогнозировании доходов трейдера на основе статистических данных его предыдущих торгов.

В отношении управления капиталом очень важно понимать, что при совершении сделок с отрицательным ожиданием нет схемы управления деньгами, которая может однозначно принести высокую прибыль. Если вы продолжаете играть на бирже в этих условиях, то независимо от способа управления деньгами вы потеряете весь ваш счет, каким бы большим он ни был в начале.

Эта аксиома верна не только для игры или сделок с отрицательным ожиданием, она истинна также для игры с равными шансами. Поэтому единственный случай, когда у вас есть шанс получить выгоду в долгосрочной перспективе, - это заключение сделок с положительным математическим ожиданием.

Различие между отрицательным ожиданием и положительным ожиданием - это различие между жизнью и смертью. Не имеет значения, насколько положительное или насколько отрицательное ожидание; важно только то, положительное оно или отрицательное. Поэтому до рассмотрения вопросов управления капиталом вы должны найти игру с положительным ожиданием.

Если у вас такой игры нет, тогда никакое управление деньгами в мире не спасет вас. С другой стороны, если у вас есть положительное ожидание, то можно, посредством правильного управления деньгами, превратить его в функцию экспоненциального роста. Не имеет значения, насколько мало это положительное ожидание! Другими словами, не имеет значения, насколько прибыльна торговая система на основе одного контракта. Если у вас есть система, которая выигрывает 10 долларов на контракт в одной сделке (после вычета комиссионных и проскальзывания), можно использовать методы управления капиталом таким образом, чтобы сделать ее более прибыльной, чем систему, которая показывает среднюю прибыль 1000 долларов за сделку (после вычета комиссионных и проскальзывания).

Имеет значение не то, насколько прибыльна система была, а то, насколько определенно можно сказать, что система покажет, по крайней мере, минимальную прибыль в будущем. Поэтому наиболее важное приготовление, которое может сделать трейдер, - это убедиться в том, что система покажет положительное математическое ожидание в будущем.

Для того чтобы иметь положительное математическое ожидание в будущем, очень важно не ограничивать степени свободы вашей системы. Это достигается не только упразднением или уменьшением количества параметров, подлежащих оптимизации, но также и путем сокращения как можно большего количества правил системы. Каждый параметр, который вы добавляете, каждое правило, которое вы вносите, каждое мельчайшее изменение, которое вы делаете в системе, сокращает число степеней свободы. В идеале, вам нужно построить достаточно примитивную и простую систему, которая постоянно будет приносить небольшую прибыль почти на любом рынке. И снова важно, чтобы вы поняли, - не имеет значения, насколько прибыльна система, пока она прибыльна. Деньги, которые вы заработаете в торговле, будут заработаны посредством эффективного управления деньгами.

Торговая система - это просто средство, которое дает вам положительное математическое ожидание, чтобы можно было использовать управление деньгами. Системы, которые работают (показывают, по крайней мере, минимальную прибыль) только на одном или нескольких рынках или имеют различные правила или параметры для различных рынков, вероятнее всего, не будут работать в режиме реального времени достаточно долго. Проблема большинства технически ориентированных трейдеров состоит в том, что они тратят слишком много времени и усилий на оптимизацию различных правил и значений параметров торговой системы. Это дает совершенно противоположные результаты. Вместо того, чтобы тратить силы и компьютерное время на увеличение прибылей торговой системы, направьте энергию на увеличение уровня надежности получения минимальной прибыли.

Зная, что управление капиталом - это всего лишь числовая игра, которая требует использования положительных ожиданий, трейдер может прекратить поиски "священного Грааля" биржевой торговли. Вместо этого он может заняться проверкой своего торгового метода, выяснить, насколько этот метод логически обоснован, дает ли он поло¬жительные ожидания. Правильные методы управления капиталом, применяемые по отношению к любым, даже весьма посредственным методам ведения торговли, сами сделают всю остальную работу.

Любому трейдеру для успеха в своей работе необходимо решить три самые важные задачи: . Добиться, чтобы число удачных сделок превышало неизбежные ошибки и просчеты; Настроить свою систему торговли так, чтобы возможность заработка была как можно чаще; Достичь стабильности положительного результата своих операций.

И здесь нам, работающим трейдерам, неплохую помощь может оказать математическое ожидание. Данный термин в теории вероятности является одним из ключевых. С его помощью можно дать усредненную оценку некоторому случайному значению. Математическое ожидание случайной величины подобно центру тяжести, если представить себе все возможные вероятности точками с различной массой.

Применительно к торговой стратегии для оценки ее эффективности чаще всего используют математическое ожидание прибыли (либо убытка). Этот параметр определяют, как сумму произведений заданных уровней прибыли и потерь и вероятности их появления. К примеру, разработанная стратегия торговли предполагает, что 37% всех операций принесут прибыль, а оставшаяся часть – 63% - будет убыточной. При этом, средний доход от удачной сделки составит 7 долларов, а средний проигрыш будет равен 1,4 доллара. Рассчитаем математическое ожидание торговли по такой системе:

Что означает данное число? Оно говорит о том, что, следуя правилам данной системы, в среднем мы будет получать 1,708 доллара от каждой закрытой сделки. Поскольку полученная оценка эффективности больше нуля, то такую систему вполне можно использовать для реальной работы. Если же в результате расчета математическое ожидание получится отрицательным, то это уже говорит о среднем убытке и такая торговля приведет к разорению.

Размер прибыли на одну сделку может быть выражен также и относительной величиной в виде %. Например:

– процент дохода на 1 сделку - 5%;

– процент успешных торговых операций - 62%;

– процент убытка в расчете на 1 сделку - 3%;

– процент неудачных сделок - 38%;

То есть, средняя сделка принесет 1,96%.

Можно разработать систему, которая несмотря на преобладание убыточных сделок будет давать положительный результат, поскольку ее МО>0.

Впрочем, одного ожидания мало. Сложно заработать, если система дает очень мало торговых сигналов. В этом случае ее доходность будет сопоставима с банковским процентом. Пусть каждая операция дает в среднем всего лишь 0,5 доллара, но что если система предполагает 1000 операций в год? Это будет очень серьезная сумма за сравнительно малое время. Из этого логически вытекает, что еще одним отличительным признаком хорошей торговой системы можно считать короткий срок удержания позиций.

Источники и ссылки

dic.academic.ru – академический интернет-словарь

mathematics.ru – образовательный сайт по математике

nsu.ru – образовательный веб-сайт Новосибирского государственного университета

webmath.ru – образовательный портал для студентов, абитуриентов и школьников.

exponenta.ru образовательный математический сайт

ru.tradimo.com – бесплатная онлайн школа трейдинга

crypto.hut2.ru – многопрофильный информационный ресурс

poker-wiki.ru – свободная энциклопедия покера

sernam.ru – Научная библиотека избранных естественно-научных изданий

reshim.su – интернет сайт РЕШИМ задачи контрольные курсовые

unfx.ru – Forex на UNFX: обучение, торговые сигналы, доверительное управление

slovopedia.com – Большой Энциклопедический словарь Словопедия

pokermansion.3dn.ru – Ваш гид в мире покера

statanaliz.info – информационный блог «Статистический анализ данных»

форекс-трейдер.рф – портал Форекс-Трейдер

megafx.ru – актуальная аналитика Форекс

fx-by.com – всё для трейдера

Пусть случайная выборка порождена наблюдаемой случайной величиной ξ, математическое ожидание и дисперсия которой неизвестны. В качестве оценок для этих характеристик было предложено использовать выборочное среднее

и выборочную дисперсию

. (3.14)

Рассмотрим некоторые свойства оценок математического ожидания и дисперсии.

1. Вычислим математическое ожидание выборочного среднего:

Следовательно, выборочное среднее является несмещенной оценкой для .

2. Напомним, что результаты наблюдений – независимые случайные величины, каждая из которых имеет такой же закон распределения, как и величина , а значит, , , . Будем предполагать, что дисперсия конечна. Тогда, согласно теореме Чебышева о законе больших чисел, для любого ε > 0 имеет место равенство ,

которое можно записать так: . (3.16) Сравнивая (3.16) с определением свойства состоятельности (3.11), видим, что оценка является состоятельной оценкой математического ожидания .

3. Найдем дисперсию выборочного среднего:

. (3.17)

Таким образом, дисперсия оценки математического ожидания уменьшается обратно пропорционально объему выборки.

Можно доказать, что если случайная величина ξ распределена нормально, то выборочное среднее является эффективной оценкой математического ожидания , то есть дисперсия принимает наименьшее значение по сравнению с любой другой оценкой математического ожидания. Для других законов распределения ξ это может быть и не так.

Выборочная дисперсия является смещенной оценкой дисперсии , так как . (3.18)

Действительно, используя свойства математического ожидания и формулу (3.17), найдем

Чтобы получить несмещенную оценку дисперсии, оценку (3.14) нужно исправить, то есть домножить на . Тогда получим несмещенную выборочную дисперсию

. (3.19)

Отметим, что формулы (3.14) и (3.19) отличаются лишь знаменателем, и при больших значениях выборочная и несмещенная дисперсии отличаются мало. Однако при малом объеме выборки следует пользоваться соотношением (3.19).

Для оценки среднего квадратического отклонения случайной величины используют так называемое “исправленное” среднее квадратическое отклонение, которое равно квадратному корню из несмещенной дисперсии: .

Интервальные оценки

В статистике имеются два подхода к оцениванию неизвестных параметров распределений: точечный и интервальный. В соответствии с точечным оцениванием, которое рассмотрено в предыдущем разделе, указывается лишь точка, около которой находится оцениваемый параметр. Желательно, однако, знать, как далеко может отстоять в действительности этот параметр от возможных реализаций оценок в разных сериях наблюдений.

Ответ на этот вопрос – тоже приближенный – дает другой способ оценивания параметров – интервальный. В соответствии с этим способом оценивания находят интервал, который с вероятностью, близкой к единице, накрывает неизвестное числовое значение параметра.

Понятие интервальной оценки

Точечная оценка является случайной величиной и для возможных реализаций выборки принимает значения лишь приближенно равные истинному значению параметра . Чем меньше разность , тем точнее оценка. Таким образом, положительное число , для которого , характеризует точность оценки и называется ошибкой оценки (или предельной ошибкой).

Доверительной вероятностью (или надежностью) называется вероятность β , с которой осуществляется неравенство , т. е.

. (3.20)

Заменив неравенство равносильным ему двойным неравенством , или , получим

Интервал , накрывающий с вероятностью β , , неизвестный параметр , называется доверительным интервалом (или интервальной оценкой), соответствующим доверительной вероятности β .

Случайной величиной является не только оценка , но и ошибка : ее значение зависит от вероятности β и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (3.21) следует читать так: “Интервал накроет параметр с вероятностью β ”, а не так: “Параметр попадет в интервал с вероятностью β ”.

Смысл доверительного интервала состоит в том, что при многократном повторении выборки объема в относительной доле случаев, равной β , доверительный интервал, соответствующий доверительной вероятности β , накрывает истинное значение оцениваемого параметра. Таким образом, доверительная вероятность β характеризует надежность доверительного оценивания: чем больше β , тем вероятнее, что реализация доверительного интервала содержит неизвестный параметр.

Основные свойства точечных оценок

Для того чтобы оценка имела практическую ценность, она должна обладать следующими свойствами.

1. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е.

Если равенство (22.1) не выполняется, то оценка может либо завышать значение (М>), либо занижать его (М <) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

2. Оценка параметра называется состоятельной, если она подчиняется закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру при неограниченном возрастании числа опытов (наблюдений) и, следовательно, выполняется следующее равенство:

где > 0 сколько угодно малое число.

Для выполнения (22.2) достаточно, чтобы дисперсия оценки стремилась к нулю при, т.е.

и кроме того, чтобы оценка была несмещенной. От формулы (22.3) легко перейти к (22.2) , если воспользоваться неравенством Чебышева.

Итак, состоятельность оценки означает, что при достаточно большом количестве опытов и со сколько угодно большой достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины. Этим оправдано увеличение объема выборки.

Так как - случайная величина, значение которой изменяется от выборки к выборке, то меру ее рассеивания около математического ожидания будем характеризовать дисперсией D. Пусть и - две несмещенные оценки параметра, т.е. M = и M = , соответственно D и D и, если D < D , то в качестве оценки принимают.

3. Несмещенная оценка, которая имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра, вычисленных по выборкам одного и того же объема, называется эффективной оценкой.

На практике при оценке параметров не всегда удается удовлетворить одновременно требованиям 1, 2, 3. Однако выбору оценки всегда должно предшествовать ее критическое рассмотрение со всех точек зрения. При выборке практических методов обработки опытных данных необходимо руководствоваться сформулированными свойствами оценок.

Оценка математического ожидания и дисперсии по выборке

Наиболее важными характеристиками случайной величины являются математическое ожидание и дисперсия. Рассмотрим вопрос о том, какие выборочные характеристики лучше всего оценивают математическое ожидание и дисперсию в смысле несмещенности, эффективности и состоятельности.

Теорема 23.1. Арифметическая средняя, вычисленная по n независимым наблюдениям над случайной величиной, которая имеет математическое ожидание M = , является несмещенной оценкой этого параметра.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. По условию M = , а т.к. являются случайными величинами и имеют тот же закон распределения, то тогда. По определению средняя арифметическая

Рассмотрим математическое ожидание средней арифметической. Используя свойство математического ожидания, имеем:

т.е. . В силу (22.1) является несмещенной оценкой. ?

Теорема 23.2 . Арифметическая средняя, вычисленная по n независимым наблюдениям над случайной величиной, которая имеет M = и, является состоятельной оценкой этого параметра.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. Тогда в силу теоремы 23.1 имеем M = .

Для средней арифметической запишем неравенство Чебышева:

Используя свойства дисперсии 4,5 и (23.1), имеем:

т.к. по условию теоремы.

Следовательно,

Итак, дисперсия средней арифметической в n раз меньше дисперсии случайной величины. Тогда

а это значит, что является состоятельной оценкой.

Замечание : 1 . Примем без доказательства весьма важный для практики результат. Если N (a,), то несмещенная оценка математического ожидания a имеет минимальную дисперсию, равную, поэтому является эффективной оценкой параметра а. ?

Перейдем к оценке для дисперсии и проверим ее на состоятельность и несмещенность.

Теорема 23.3 . Если случайная выборка состоит из n независимых наблюдений над случайной величиной с

M = и D = , то выборочная дисперсия

не является несмещенной оценкой D - генеральной дисперсии.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. По условию и для всех. Преобразуем формулу (23.3) выборочной дисперсии:

Упростим выражение

Принимая во внимание (23.1), откуда

Оценки математического ожидания и дисперсии.

С понятием параметров распределения мы познакомились в теории вероятностей. Например, в нормальном законе распределения, задаваемом функцией плотности вероятности

параметрами служат а – математическое ожидание и а – среднее квадратическое отклонение. В распределении Пуассона параметром является число а = пр.

Определение. Статистической оценкой неизвестного параметра теоретического распределения называют его приближенное значение, зависящее от данных выборки (х 1 , х 2 , х 3 , ..., х k ; п 1 , п 2 , п 3 , ..., п k ), т. е. некоторую функцию этих величин.

Здесь х 1 , х 2 , х 3 , ..., х k – значения признака, п 1 , п 2 , п 3 , ..., п k –соответствующие частоты. Статистическая оценка является случайной величиной.

Обозначим через θ – оцениваемый параметр, а через θ * – его статистическую оценку. Величину |θ *–θ | называют точностью оценки. Чем меньше |θ *–θ |, тем лучше, точнее определен неизвестный параметр.

Чтобы оценка θ * имела практическое значение, она не должна содержать систематической ошибки и вместе с тем иметь возможно меньшую дисперсию. Кроме того, при увеличении объема выборки вероятность сколь угодно малых отклонений |θ *–θ | должна быть близка к 1.

Сформулируем следующие определения.

1. Оценка параметра называется несмещенной, если ее математическое ожидание М (θ *) равно оцениваемому параметру θ , т. е.

М (θ *) = θ, (1)

и смещенной, если

М (θ *) ≠ θ, (2)

2. Оценка θ* называется состоятельной, если при любом δ > 0

(3)

Равенство (3) читается так: оценка θ * сходится по вероятности к θ .

3. Оценка θ* называется эффективной, если при заданном п она имеет наименьшую дисперсию.

Теорема 1. Выборочная средняя Х В является несмещенной и состоятельной оценкой математического ожидания.

Доказательство. Пусть выборка репрезентативна, т. е.. все элементы генеральной совокупности имеют одинаковую возможность попасть в выборку. Значения признака х 1 , х 2 , х 3 ,...,х n можно принять за независимые случайные величины Х 1 , Х 2 , Х 3 , ...,Х n с одинаковыми распределениями и числовыми характеристиками, в том числе с равными математическими ожиданиями, равными а,

Так как каждая из величин Х 1 , Х 2 , Х 3 , …, Х п имеет распределение, совпадающее с распределением генеральной совокупности, то М (Х ) = а. Поэтому

откуда следует, что – состоятельная оценка М (Х ).

Используя правило исследования на экстремум, можно доказать, что является и эффективной оценкой М (Х ).

Пусть имеется случайная величина Х с математическим ожиданием m и дисперсией D , при этом оба эти параметра неизвестны. Над величиной Х произведено N независимых экспериментов, в результате которых была получена совокупность N численных результатов x 1 , x 2 , …, x N . В качестве оценки математического ожидания естественно предложить среднее арифметическое наблюдаемых значений

(1)

Здесь в качестве x i рассматриваются конкретные значения (числа), полученные в результате N экспериментов. Если взять другие (независимые от предыдущих) N экспериментов, то, очевидно, мы получим другое значение . Если взять еще N экспериментов, то мы получим еще одно новое значение . Обозначим через X i случайную величину, являющуюся результатом i -го эксперимента, тогда реализациями X i будут числа, полученные в результате этих экспериментов. Очевидно, что случайная величина X i будет иметь такую же плотность распределения вероятности, что и исходная случайная величина Х . Также считаем, что случайные величины X i и X j являются независимыми при i , не равном j (различные независимые друг относительно друга эксперименты). Поэтому формулу (1) перепишем в другом (статистическом) виде:

(2)

Покажем, что оценка является несмещенной:

Таким образом, математическое ожидание выборочного среднего равно истинному математическому ожиданию случайной величины m . Это достаточно предсказуемый и понятный факт. Следовательно, за оценку математического ожидания случайной величины можно принять выборочное среднее (2). Теперь возникает вопрос: что происходит с дисперсией оценки математического ожидания при увеличении числа экспериментов? Аналитические вычисления показывают, что

где - дисперсия оценки математического ожидания (2), а D - истинная дисперсия случайной величины X .

Из вышесказанного следует, что с ростом N (количества экспериментов) дисперсия оценки уменьшается, т.е. чем больше мы суммируем независимые реализации, тем ближе к математическому ожиданию мы получим оценку.

Оценки математического дисперсии

На первый взгляд наиболее естественной оценкой представляется

(3)

где вычисляется по формуле (2). Проверим, является ли оценка несмещенной. Формула (3) может быть записана следующим образом :

Подставим в эту формулу выражение (2):

Найдем математическое ожидание оценки дисперсии:

(4)

Так как дисперсия случайной величины не зависит от того, какое математическое ожидание у случайной величины, примем математическое ожидание равным 0, т.е. m = 0.

	(5)
при .	(6)