Биографии Характеристики Анализ

Емпирична функция на разпределение, свойства. Емпирична функция на разпределение Използвайки този пример, конструирайте емпирична функция на разпределение

Както е известно, законът за разпределение на случайна променлива може да бъде определен по различни начини. Дискретна случайна променлива може да бъде определена с помощта на серия на разпределение или интегрална функция, а непрекъсната случайна променлива може да бъде определена с помощта на интегрална или диференциална функция. Нека разгледаме селективни аналози на тези две функции.

Нека има примерен набор от стойности на произволна променлива на обема и всяка опция от този набор е свързана с нейната честота. Нека по-нататък е някакво реално число и – брой примерни стойности на случайната променлива
, по-малък .Тогава числото е честотата на стойностите на количеството, наблюдавани в пробата х, по-малък , тези. честота на възникване на събитието
. Когато се промени хв общия случай стойността също ще се промени . Това означава, че относителната честота е функция на аргумента . И тъй като тази функция се намира от примерни данни, получени в резултат на експерименти, тя се нарича селективна или емпиричен.

Определение 10.15. Емпирична функция на разпределение(функция на разпределение на пробите) е функцията
, определяйки за всяка стойност хотносителна честота на събитието
.

(10.19)

За разлика от функцията на разпределение на емпиричната извадка, функцията на разпределение Е(х) от генералната съвкупност се нарича теоретична функция на разпределение. Разликата между тях е, че теоретичната функция Е(х) определя вероятността от събитие
, а емпиричният е относителната честота на едно и също събитие. От теоремата на Бернули следва

,
(10.20)

тези. на свобода вероятност
и относителна честота на събитието
, т.е.
малко се различават един от друг. От това следва, че е препоръчително да се използва емпиричната функция на разпределение на извадката, за да се апроксимира теоретичната (интегрална) функция на разпределение на генералната съвкупност.

функция
И
имат същите свойства. Това следва от дефиницията на функцията.

Имоти
:


Пример 10.4.Конструирайте емпирична функция въз основа на даденото извадково разпределение:

Настроики

Честоти

Решение:Нека намерим размера на извадката н= 12+18+30=60. Най-малката опция
, следователно,
при
. Значение
, а именно
наблюдавано 12 пъти, следователно:

=
при
.

Значение х< 10, а именно
И
са наблюдавани 12+18=30 пъти, следователно,
=
при
. При

.

Необходимата емпирична функция на разпределение:

=

График
показано на фиг. 10.2

Р
е. 10.2

Контролни въпроси

1. Какви основни проблеми решава математическата статистика? 2. Генерална и извадкова съвкупност? 3. Определете размера на извадката. 4. Какви проби се наричат ​​представителни? 5. Грешки в представителността. 6. Основни методи за вземане на проби. 7. Понятия за честота, относителна честота. 8. Концепцията за статистически редове. 9. Запишете формулата на Sturges. 10. Формулирайте понятията обхват на извадката, медиана и мода. 11. Честотен полигон, хистограма. 12. Концепцията за точкова оценка на извадкова съвкупност. 13. Предубедена и непредубедена точкова оценка. 14. Формулирайте понятието извадкова средна стойност. 15. Формулирайте понятието дисперсия на извадката. 16. Формулирайте концепцията за извадково стандартно отклонение. 17. Формулирайте понятието коефициент на вариация на извадката. 18. Формулирайте понятието примерна средна геометрична стойност.

Определяне на емпиричната функция на разпределение

Нека $X$ е случайна променлива. $F(x)$ е функцията на разпределение на дадена случайна променлива. Ще проведем $n$ експеримента върху дадена случайна променлива при едни и същи условия, независимо едно от друго. В този случай получаваме поредица от стойности $x_1,\ x_2\ $, ... ,$\ x_n$, която се нарича извадка.

Определение 1

Всяка стойност $x_i$ ($i=1,2\ $, ... ,$ \ n$) се нарича вариант.

Една оценка на теоретичната функция на разпределение е емпиричната функция на разпределение.

Определение 3

Емпирична функция на разпределение $F_n(x)$ е функция, която определя за всяка стойност $x$ относителната честота на събитието $X \

където $n_x$ е броят опции, по-малък от $x$, $n$ е размерът на извадката.

Разликата между емпиричната функция и теоретичната е, че теоретичната функция определя вероятността на събитието $X

Свойства на емпиричната функция на разпределение

Нека сега разгледаме няколко основни свойства на функцията на разпределение.

    Диапазонът на функцията $F_n\left(x\right)$ е отсечката $$.

    $F_n\left(x\right)$ е ненамаляваща функция.

    $F_n\left(x\right)$ е ляво непрекъсната функция.

    $F_n\left(x\right)$ е частично постоянна функция и нараства само в точки от стойности на случайната променлива $X$

    Нека $X_1$ е най-малкият и $X_n$ най-големият вариант. Тогава $F_n\left(x\right)=0$ за $(x\le X)_1$ и $F_n\left(x\right)=1$ за $x\ge X_n$.

Нека въведем теорема, която свързва теоретичните и емпиричните функции.

Теорема 1

Нека $F_n\left(x\right)$ е емпиричната функция на разпределение, а $F\left(x\right)$ е теоретичната функция на разпределение на общата извадка. Тогава равенството е в сила:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Примери за задачи за намиране на емпиричната функция на разпределение

Пример 1

Нека разпределението на извадката има следните данни, записани с помощта на таблица:

Снимка 1.

Намерете размера на извадката, създайте емпирична функция на разпределение и я начертайте.

Размер на извадката: $n=5+10+15+20=50$.

По свойство 5 имаме това за $x\le 1$ $F_n\left(x\right)=0$ и за $x>4$ $F_n\left(x\right)=1$.

$x стойност

$x стойност

$x стойност

Така получаваме:

Фигура 2.

Фигура 3.

Пример 2

Бяха произволно избрани 20 града от градовете в централната част на Русия, за които бяха получени следните данни за цените на обществения транспорт: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

Създайте емпирична функция на разпределение за тази проба и я начертайте.

Нека запишем примерните стойности във възходящ ред и изчислим честотата на всяка стойност. Получаваме следната таблица:

Фигура 4.

Размер на извадката: $n=20$.

По свойство 5 имаме това за $x\le 12$ $F_n\left(x\right)=0$ и за $x>15$ $F_n\left(x\right)=1$.

$x стойност

$x стойност

$x стойност

Така получаваме:

Фигура 5.

Нека начертаем емпиричното разпределение:

Фигура 6.

Оригиналност: $92,12\%$.

Разберете каква е емпиричната формула.В химията EP е най-простият начин да се опише съединение - по същество списък на елементите, които изграждат съединение, въз основа на техните проценти. Трябва да се отбележи, че тази проста формула не описва поръчкаатоми в съединение, то просто показва от какви елементи се състои то. Например:

  • Съединение, състоящо се от 40,92% въглерод; 4,58% водород и 54,5% кислород ще имат емпиричната формула C 3 H 4 O 3 (пример за това как да се намери EF на това съединение ще бъде обсъден във втората част).
  • Разберете термина „процентен състав“.„Процентен състав“ се отнася до процентното съдържание на всеки отделен атом в цялото въпросно съединение. За да намерите емпиричната формула на съединение, трябва да знаете процентния състав на съединението. Ако търсите емпирична формула за домашна работа, най-вероятно ще бъдат дадени проценти.

    • За да се намери процентният състав на дадено химично съединение в лабораторията, то се подлага на някои физически експерименти и след това на количествен анализ. Освен ако не сте в лаборатория, не е необходимо да правите тези експерименти.
  • Имайте предвид, че ще трябва да се справите с грам атоми.Грам атом е определено количество вещество, чиято маса е равна на неговата атомна маса. За да намерите грам атома, трябва да използвате следното уравнение: Процентът на елемент в съединение се разделя на атомната маса на елемента.

    • Да кажем, например, че имаме съединение, което съдържа 40,92% въглерод. Атомната маса на въглерода е 12, така че нашето уравнение ще бъде 40,92 / 12 = 3,41.
  • Знайте как да намирате атомни съотношения.Когато работите със съединение, ще получите повече от един грам атом. След като намерите всички грам атоми на вашето съединение, погледнете ги. За да намерите атомното съотношение, ще трябва да изберете най-малката стойност на грам-атом, която сте изчислили. След това ще трябва да разделите всички грам атоми на най-малкия грам атом. Например:

    • Да приемем, че работите със съединение, съдържащо три грам атома: 1,5; 2 и 2.5. Най-малкото от тези числа е 1,5. Следователно, за да намерите съотношението на атомите, трябва да разделите всички числа на 1,5 и да поставите знак за съотношение между тях : .
    • 1,5 / 1,5 = 1. 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Следователно съотношението на атомите е 1: 1,33: 1,66 .
  • Разберете как да конвертирате стойностите на атомното съотношение в цели числа.Когато пишете емпирична формула, трябва да използвате цели числа. Това означава, че не можете да използвате числа като 1,33. След като намерите съотношението на атомите, трябва да преобразувате дроби (като 1,33) в цели числа (като 3). За да направите това, трябва да намерите цяло число, като умножите всяко число на атомното съотношение, с което ще получите цели числа. Например:

    • Опитайте 2. Умножете числата на атомното съотношение (1, 1,33 и 1,66) по 2. Получавате 2, 2,66 и 3,32. Това не са цели числа, така че 2 не е подходящо.
    • Опитайте 3. Ако умножите 1, 1,33 и 1,66 по 3, ще получите съответно 3, 4 и 5. Следователно атомното отношение на целите числа има формата 3: 4: 5 .
  • Примерна средна стойност.

    Нека се извлече извадка с размер n, за да се изследва общата популация по отношение на количествена характеристика X.

    Средната стойност на извадката е средната аритметична стойност на характеристика в извадкова съвкупност.

    Дисперсия на извадката.

    За да се наблюдава дисперсията на количествена характеристика на стойностите на извадката около нейната средна стойност, се въвежда обобщена характеристика - дисперсия на извадката.

    Дисперсията на извадката е средната аритметична стойност на квадратите на отклонението на наблюдаваните стойности на характеристика от тяхната средна стойност.

    Ако всички стойности на характеристиката на извадката са различни, тогава

    Коригирана дисперсия.

    Дисперсията на извадката е пристрастна оценка на дисперсията на съвкупността, т.е. математическото очакване на дисперсията на извадката не е равно на изчислената обща дисперсия, а е равно на

    За да коригирате дисперсията на извадката, просто я умножете по дроба

    Извадков коефициент на корелациясе намира по формулата

    където са примерните стандартни отклонения на стойностите и .

    Примерният корелационен коефициент показва близостта на линейната връзка между и : колкото по-близо до единица, толкова по-силна е линейната връзка между и .

    23. Честотен многоъгълник е начупена линия, чиито сегменти свързват точки. За да се построи многоъгълник на честотите, вариантите се нанасят по абсцисната ос, а съответните честоти се нанасят по ординатната ос, като точките се свързват с отсечки.

    Многоъгълникът на относителната честота е конструиран по подобен начин, с изключение на това, че относителните честоти са нанесени върху ординатната ос.

    Честотната хистограма е стъпаловидна фигура, състояща се от правоъгълници, чиито основи са частични интервали с дължина h, а височините са равни на отношението. За да се изгради честотна хистограма, върху абсцисната ос се поставят частични интервали, а над тях се чертаят сегменти, успоредни на абсцисната ос на разстояние (височина). Площта на i-тия правоъгълник е равна на сумата от честотите на i-o интервала, следователно площта на честотната хистограма е равна на сумата от всички честоти, т.е. размер на извадката.

    Емпирична функция на разпределение

    Където n x- брой на пробните стойности по-малък от х; н- размер на извадката.

    22 Нека дефинираме основните понятия на математическата статистика

    .Основни понятия на математическата статистика. Популация и извадка. Вариационни редове, статистически редове. Групирана извадка. Групирани статистически серии. Честотен полигон. Функция на разпределение на извадката и хистограма.

    Население– целия набор от налични обекти.

    проба– набор от обекти, произволно избрани от общата съвкупност.

    Извиква се поредица от опции, записани във възходящ ред вариационеннаблизо и списък с опции и съответните им честоти или относителни честоти - статистически серии: избрани на случаен принцип от общата популация.

    Многоъгълникчестоти се нарича прекъсната линия, чиито отсечки свързват точките.

    Честотна хистограмае стъпаловидна фигура, състояща се от правоъгълници, чиито основи са частични интервали с дължина h, а височините са равни на съотношението .

    Функция на извадково (емпирично) разпределениеизвикайте функцията Е*(х), определяйки за всяка стойност хотносителна честота на събитието х< x.

    Ако се изследва някаква непрекъсната характеристика, тогава вариационната серия може да се състои от много голям брой числа. В този случай е по-удобно да се използва групирана проба. За да се получи, интервалът, съдържащ всички наблюдавани стойности на атрибута, се разделя на няколко равни частични интервала с дължина чи след това намерете за всеки частичен интервал n i– сумата от честотите на варианта, включен в азти интервал.

    20. Законът за големите числа не трябва да се разбира като общ закон, свързан с големите числа. Законът за големите числа е обобщено име за няколко теореми, от което следва, че при неограничено увеличаване на броя на опитите средните стойности са склонни към определени константи.

    Те включват теоремите на Чебишев и Бернули. Теоремата на Чебишев е най-общият закон за големите числа.

    Доказателството на теоремите, обединени от термина "закон за големите числа", се основава на неравенството на Чебишев, което установява вероятността за отклонение от неговото математическо очакване:

    19 Разпределение на Пиърсън (хи - квадрат) - разпределение на случайна променлива

    къде са случайните променливи X 1, X 2,…, X nнезависими и имат еднакво разпределение н(0,1). В този случай броят на термините, т.е. н, се нарича „брой степени на свобода“ на разпределението хи-квадрат.

    Разпределението хи-квадрат се използва, когато се оценява дисперсията (с помощта на доверителен интервал), когато се тестват хипотези за съгласие, хомогенност, независимост,

    Разпределение T t на Стюдънт е разпределението на случайна променлива

    къде са случайните променливи UИ хнезависим, Uима стандартно нормално разпределение н(0,1) и х– чи разпределение – квадрат c нстепени на свобода. При което нсе нарича „брой степени на свобода“ на разпределението на Стюдънт.

    Използва се при оценка на математическото очакване, прогнозната стойност и други характеристики с помощта на доверителни интервали, тестване на хипотези за стойностите на математическите очаквания, регресионни коефициенти,

    Разпределението на Фишер е разпределението на случайна променлива

    Разпределението на Фишър се използва при тестване на хипотези за адекватността на модела при регресионен анализ, равенство на дисперсиите и при други проблеми на приложната статистика

    18Линейна регресияе статистически инструмент, използван за прогнозиране на бъдещи цени въз основа на минали данни и обикновено се използва за определяне кога цените са прегряти. Методът на най-малките квадрати се използва за конструиране на „най-подходяща“ права линия през поредица от ценови стойностни точки. Ценовите точки, използвани като входни данни, могат да бъдат някои от следните: отваряне, затваряне, високо, ниско,

    17. Двумерна случайна променлива е подреден набор от две случайни променливи или .

    Пример: Хвърлят се два зара. – броя на точките, хвърлени съответно на първия и втория зар

    Универсален начин за определяне на закона за разпределение на двумерна случайна променлива е функцията на разпределение.

    15.m.o Дискретни случайни променливи

    Имоти:

    1) М(° С) = ° С, ° С- постоянен;

    2) М(CX) = СМ.(х);

    3) М(X 1 + X 2) = М(X 1) + М(X 2), Където X 1, X 2- независими случайни променливи;

    4) М(X 1 X 2) = М(X 1)М(X 2).

    Математическото очакване на сумата от случайните променливи е равно на сумата от техните математически очаквания, т.е.

    Математическото очакване на разликата между случайните величини е равно на разликата на техните математически очаквания, т.е.

    Математическото очакване на произведение от случайни величини е равно на произведението на техните математически очаквания, т.е.

    Ако всички стойности на случайна променлива се увеличат (намалят) с едно и също число C, тогава нейното математическо очакване ще се увеличи (намали) със същото число

    14. Експоненциален(експоненциален)разпределителен закон хима експоненциален закон на разпределение с параметър λ >0, ако неговата плътност на вероятността има формата:

    Очаквана стойност: .

    Дисперсия: .

    Експоненциалният закон за разпределение играе голяма роля в теорията на опашките и теорията за надеждността.

    13. Законът за нормално разпределение се характеризира с честота на повреда a (t) или плътност на вероятността за повреда f (t) във формата:

    , (5.36)

    където σ е стандартното отклонение на SV х;

    м х– математическо очакване на СВ х. Този параметър често се нарича център на дисперсия или най-вероятната стойност на SV х.

    х– случайна променлива, която може да се приема като време, стойност на тока, стойност на електрическото напрежение и други аргументи.

    Нормалният закон е двупараметърен закон, за да го напишете, трябва да знаете m хи σ.

    Нормалното разпределение (разпределение на Гаус) се използва за оценка на надеждността на продукти, които са повлияни от редица случайни фактори, всеки от които има лек ефект върху резултатния ефект

    12. Закон за равномерно разпределение. Непрекъсната случайна променлива хима единен закон за разпределение на сегмента [ а, b], ако неговата плътност на вероятността е постоянна на този сегмент и равна на нула извън него, т.е.

    Обозначаване: .

    Очаквана стойност: .

    Дисперсия: .

    Случайна стойност х, разпределени по единен закон на сегмента се нарича произволно числоот 0 до 1. Той служи като изходен материал за получаване на случайни променливи с всеки закон на разпределение. Законът за равномерното разпределение се използва при анализа на грешки при закръгляване при извършване на числени изчисления, в поредица от проблеми с опашка, при статистическо моделиране на наблюдения, подчинени на дадено разпределение.

    11. Определение.Плътност на разпространениеот вероятностите на непрекъсната случайна променлива X се нарича функция f(x)– първата производна на функцията на разпределение F(x).

    Плътността на разпространение се нарича още диференциална функция. За да се опише дискретна случайна променлива, плътността на разпределение е неприемлива.

    Значението на плътността на разпределението е, че тя показва колко често случайна променлива X се появява в определена близост на точка хпри повтаряне на експерименти.

    След въвеждане на функциите на разпределение и плътността на разпределението може да се даде следната дефиниция на непрекъсната случайна променлива.

    10. Плътност на вероятността, плътност на разпределение на вероятността на случайна променлива x, е функция p(x), такава че

    и за всяко a< b вероятность события a < x < b равна
    .

    Ако p(x) е непрекъснато, тогава за достатъчно малко ∆x вероятността за неравенство x< X < x+∆x приближенно равна p(x) ∆x (с точностью до малых более высокого порядка). Функция распределения F(x) случайной величины x, связана с плотностью распределения соотношениями

    и ако F(x) е диференцируемо, тогава