Биографии Характеристики Анализ

Методи за обработка на информация и прогнозиране за студенти от специалност: "Управление на организации". Таблични стойности на критерия Irwin за екстремните елементи на вариационната серия V.V.

Нека е наблюдаваната извадка и е вариационната серия, конструирана от нея. Хипотезата, която трябва да се провери, е, че всички принадлежат към едно и също население(без отклонения). Алтернативна хипотеза е, че има отклонения в наблюдаваната извадка.

Съгласно критерия на Шовене, елемент от обемната извадка е отклонение, ако вероятността за неговото отклонение от средната стойност не е по-голяма от .

Компилира се следната статистика на Chauvenet:

къде е средната стойност,

Дисперсия на извадката

Нека определим какво разпределение има статистиката, когато хипотезата е изпълнена. За да направим това, правим предположението, че дори при малки случайни променливи и са независими, тогава плътността на разпределение случайна величинаизглежда като:


Стойностите на тази функция на разпределение могат да бъдат изчислени с помощта на математическия пакет Maple 14, замествайки получените стойности вместо неизвестните параметри.

Ако статистиката, тогава стойността () трябва да се разпознае като отклонение. Критичните стойности са дадени в таблицата (вижте Приложение А). Вместо това във формула (1.1) заместваме екстремни стойности, за да проверим за отклонения.

Критерий на Ъруин

Този критерий се използва, когато дисперсията на разпределението е известна предварително.

Извадка от обема се взема от нормална генерална популация и се компилира вариационна серия (сортирана във възходящ ред). Същите хипотези и се разглеждат като в предишния критерий.

Когато най-голямата (най-малката) стойност се разпознава като отклонение с вероятност. Критичните стойности са посочени в таблицата.

Критерий на Гръбс

Нека се извлече извадка и върху нея се изгради вариационна серия. Хипотезата, която трябва да се провери, е, че всички () принадлежат към една и съща генерална популация. При проверка за отклонение от най-голямата извадкова стойност, алтернативната хипотеза е, че те принадлежат към един закон, но към друг, значително изместен надясно. Когато се проверява за отклонение от най-голямата стойност на извадката, статистиката на теста на Grubbs има формата

където се изчислява по формула (1.2), а - по (1.3)

Когато се тества за отклонение от най-малката извадкова стойност, алтернативната хипотеза предполага, че тя принадлежи към някакъв друг закон, значително изместен наляво. AT този случайизчислената статистика приема формата

където се изчислява по формула (1.2), а - по (1.3).

Статистика или се прилагат, когато дисперсията е известна предварително; статистика и -- когато дисперсията се оценява от извадката с помощта на връзка (1.3).

Макс или минимален елементИзвадката се счита за отклонение, ако стойността на съответните статистики надвишава критичната стойност: или къде е определеното ниво на значимост. Критичните стойности и са дадени в обобщени таблици (вижте Приложение А). Статистиката, получена в този тест, когато нулевата хипотеза е изпълнена, има същото разпределение като статистиката в теста на Chauvenet.

За > 25 могат да се използват приближения за критични стойности

където е квантилът на стандарта нормална дистрибуция.

А се апроксимира по следния начин

Ако дисперсията () и математическото очакване (µ - средна стойност) са известни в извлечената проба, тогава се използва статистиката

Критичните стойности на тези статистики също са посочени в таблиците. Ако, тогава отклонението се счита за значително и алтернативната хипотеза се приема.


Задачи за самоподготовкадисциплини.

Упражнение 1.В съответствие с опцията, симулирайте набор от емпирични данни, получени в резултат на измерване на едномерна характеристика. За да направите това, трябва да таблицирате функцията:

, ,

и вземете 15 - 20 последователни данни. Тук, вероятно, характеристиката на знака (отразява основната тенденция на знака) и намесата (грешките) на измерванията, които са резултат от проявата на различни видове аварии.

Опции за първоначални данни:

Извършете откриването на аномални нива на сериите от данни, получени чрез таблично представяне на функцията и извършете тяхното изглаждане:

а). Метод на Ъруин, съгласно формулата

,

.

Изчислените стойности се сравняват с табличните стойности на критерия Irwin:

Тестовата таблица на Irwin

Таблицата показва стойностите на теста Irwin за нивото на значимост (с 5% грешка).

б). чрез проверка на разликите в средните нива, разделяне на времевия ред от данни на приблизително две равни части и изчисляване на средната стойност и дисперсията за всяка част. След това проверете равенството на дисперсиите на двете части с помощта на теста на Фишер. Ако се приеме хипотезата за равенство на дисперсиите, преминете към тестване на хипотезата за липса на тенденция, като използвате t-теста на Student. Да изчисля емпирична стойностстатистика, използвайте формули:

,

къде е средната стойност стандартно отклонениесредни разлики:

.

Сравнете изчислената стойност на статистиката с таблицата.

в). Метод на Фостър-Стюарт.

2. Извършете механично изглаждане на нивата на серията:

а). метод на проста подвижна средна;

б). метод на претеглена пълзяща средна;

в). Метод на експоненциално изглаждане.

Задача 2.Лист с данни икономически показатели, е даден времеви ред от месечни обеми на превози (обвързани с определен район) на селскостопански стоки в условни единици.

Прилагане на метода на Четвериков за извличане на компонентите на времевия ред:

а). подравнете емпиричните серии, като използвате центрирана подвижна средна с период на изглаждане;

б). извадете получената предварителна оценка на тенденцията от оригиналната емпирична серия: .

в). Изчислете за всяка година (по ред) стандартното отклонение на стойността, като използвате формулата

Ж). намерете предварителната стойност на средната сезонна вълна: .

д). вземете серия, лишена от сезонна вълна: .

д). получената серия се изглажда с помощта на проста подвижна средна с интервал на изглаждане, равен на пет, и се получава нова оценка на тренда.

и). изчисляване на отклоненията на серията от оригиналната емпирична серия:

.

з). получените отклонения се подлагат на обработка в съответствие с параграфи. в). и г). за идентифициране на нови стойности на сезонната вълна.

и). да се изчисли коефициентът на сила на сезонната вълна по формулите и по-нататък (самият коефициент):

.

Стрес факторът не се изчислява за първата и последната година.

да се). Като използвате коефициента на напрежение, изчислете крайните стойности сезонен компонентвремеви редове: .

Задача 3.Времевият ред е даден в таблицата:

Направете предварителен избор на най-добрата крива на растеж:

а). метод на крайните разлики (Tintner);

б). метод на характеристиките на растежа.

2. За оригиналната серия конструирайте линеен модел , като определи параметрите му по метода на най-малките квадрати.

3. За първоначалния времеви ред изградете адаптивен модел на Браун с параметъра за изглаждане и ; избирам най най-добър моделкафяво , където е времето за изпреварване (брой стъпки напред).

4. Оценете адекватността на моделите въз основа на изследвания:

а). близост математическо очакваненулев остатъчен компонент; критична стойност на статистиката на Стюдънт за приемане (за ниво на увереност 0,70);

б). случайни отклонения на остатъчната компонента по критерия пикове (повратни точки); извършете изчисления въз основа на съотношението ;

в). независимост (липса на автокорелация) на нивата на редица остатъци, или чрез теста на Дърбин-Уотсън (използвайте нивата и като критични), или чрез първия автокорелационен коефициент (вземете критичното ниво равно на );

Ж). нормалност на закона за разпределение на остатъчния компонент въз основа на RS-критерия (като критични ниваприемете интервала (2,7 - 3,7)).

5. Оценете точността на моделите, като използвате стандартното отклонение и средната стойност относителна грешкаприближения.

6. На базата сравнителен анализадекватността и точността на моделите, изберете най-добрия модел, според който да изграждате точкови и интервални прогнози две стъпки напред (). Покажете резултатите от прогнозирането графично.

Задача 4.Оценката на процесорите на 10 работни станции от локалната мрежа, изградени на базата на машини от приблизително същия тип, но от различни производители (което предполага някои отклонения в параметрите на машините от базовия модел). За тестване на работата на процесорите е използвана смес от типа ICOMP 2.0, която се основава на два основни теста:

1. 125.turb3D - тест за симулация на турбулентност в кубичен обем(приложен софтуер);

2.NortonSI32 - инженерна програмаТип AutoCAD

и спомагателен тест за нормализиране на времето за обработка на данни SPECint_base95. Процесорите бяха оценени чрез претегленото време за изпълнение на сместа, нормализирано от ефективността на базовия процесор, в съответствие с формулата

където е времето за изпълнение на th тест;

теглото на теста;

ефективност на базовия процесор при m теста.

Ако израз (1) е логаритмичен, тогава получаваме:

и след преименуване на променливите:

време за обработка на базов тест SPECint_base95;

логаритъм от времето за обработка на първия тест,

логаритъм от времето за обработка на втория тест, коефициент на регресия, получен при оценките (тегло на теста);

коефициент на регресия - теглото на теста за обработка на аритметични операции в цели числа (основен тест).

1. Въз основа на данните от измерванията, дадени в таблицата, изградете регресионна (емпирична) функция, оценете регресионните коефициенти и проверете адекватността на модела (изчислете ковариационната матрица, двойните корелационни коефициенти, коефициента на детерминация).

Опции за данни:

Опция 1.

Вариант 2.

Вариант 3.

Вариант 4.

При относително плъзгане на части от триещи се двойки възниква повреда на контактните повърхности. Този вид увреждане на повърхностните обеми на детайла се нарича износване.Загубата само на една хилядна от масата на машината в резултат на износване води до пълна загуба на производителност. На всеки три години...
(Механика. Основи на изчисляването и проектирането на машинни части)
  • КРИТЕРИИ ЗА СТАБИЛНОСТ НА СИСТЕМАТА И МЕТОДИ ЗА ОПРЕДЕЛЯНЕ НА КРИТИЧНИ НАТОВАРВАНИЯ
    Има три основни критерия за устойчивост на конструкциите: динамичен, статичен и енергиен, които определят и методологията за изчисляване на конструкциите за устойчивост. един. Динамичен(според Ляпунов) критерийсе основава на изследването на решения на уравненията на динамичното движение, отклонени от първоначалното ...
    (Строителна механикасистеми с плоски пръти)
  • КРИТЕРИИ ЗА ИЗБОР НА КАНАЛИ ЗА РАЗПРОСТРАНЕНИЕ НА РЕКЛАМА
    Сред всички решения, които се вземат в процеса на планиране, най-важен е изборът на специфични медии в рамките на всяка медия. По правило медийните плановици са склонни да избират онези медии, които им позволяват да постигнат следните цели: 1) постигане на дадена честота на представяне на рекламно съобщение ...
    (Психология на масовите комуникации)
  • Корелационно-регресионен анализ
    Корелацията и регресията са методи за идентифициране статистическа зависимостмежду изследваните променливи. „Въз основа на анализа на емпиричните данни, събрани по време на изследването, се описва не само самият факт на съществуването на статистическа зависимост, но и математическата формула на функцията ...
    (Маркетингово проучване)
  • КОРЕЛАЦИОННО-РЕГРЕСИОНЕН МЕТОД НА ИЗСЛЕДВАНЕ
    Един от методите за моделиране икономически процесие корелационно-регресионен метод на изследване. Моделирането е процес на изразяване на сложни взаимосвързани икономически явленияозначава математически формулии символи. Комбинация качествен анализизползвайки математически...
    (Обща и приложна статистика)
  • КОРЕЛАЦИОНЕН И РЕГРЕСИОНЕН АНАЛИЗ
    Статистическо изследване на икономическите и технологични процесив момента е един от основни инструментив разработването на системи за управление на процеси. Познаването на връзките между параметрите ви позволява да идентифицирате ключовите фактори, които влияят върху качеството на крайния продукт или изследвания ...
    (Математика и икономико-математически модели)

  • Груби грешки (пропуски)са сред грешките, които се променят произволно при повтарящи се наблюдения. Те явно превишават по своята стойност грешките, оправдани от условията на експеримента. Под пропуск се разбира стойността на грешката, чието отклонение от центъра на разпределение значително надвишава стойността, оправдана от обективните условия на измерване. Следователно, от гледна точка на теорията на вероятностите, възникването на пропуск е малко вероятно.

    Грубите грешки могат да бъдат причинени от неконтролирани промени в условията на измерване, неизправност, грешки на оператора и др.

    За отстраняване на груби грешки се използва апаратът за проверка на статистически хипотези.

    В метрологията се използват статистически хипотези, които се разбират като хипотези за формата на неизвестно разпределение или за параметрите на известни разпределения.

    Примери за статистически хипотези:

    Разглежданата извадка (или нейният отделен резултат) принадлежи към генералната съвкупност;

    Генералната съвкупност се разпределя според нормален закон;

    отклонение от две нормални колекцииса равни помежду си.

    В първите две хипотези е направено предположение за вида на неизвестното разпределение и принадлежността на отделни (подозрителни) резултати този видразпределения, а в третия – за параметрите на две известни разпределения. Наред с изложената хипотеза се разглежда и хипотеза, която й противоречи. Нулевата (основна) хипотеза се нарича. Конкурентна (алтернатива) е тази, която противоречи на нулата.

    При предлагане и приемане на хипотеза могат да възникнат следните четири случая:

    хипотезата е приета и всъщност е вярна;

    Хипотезата е вярна, но е погрешно отхвърлена. Получената грешка се нарича грешка от първи род, а вероятността за нейното възникване се нарича ниво на значимост и се обозначава р(α );

    хипотезата е отхвърлена, а в действителност е невярна;

    Хипотезата е невярна, но е погрешно приета. Грешката, която възниква в този случай, се нарича грешка от втори род, а вероятността за нейното възникване се означава с β .

    Стойност 1 - β, т.е. се нарича вероятността дадена хипотеза да бъде отхвърлена, когато е грешна силата на критерия.

    Трябва да се отбележи, че в регулаторната документация за статистически контрол на качеството на продуктите и учебниците по управление на качеството вероятността за признаване на партида от добри продукти като неподходящи (т.е. допускане на грешка от първи вид) се нарича „риск на производителя“, и вероятността за приемане на неизползваема партида се нарича „риск за потребителя“.

    всичко статистически критерииса случайни променливи определени стойности(таблици с критични стойности). Областта на приемане на хипотезата (областта позволени стойности) е набор от стойности на критерии, при които се приема хипотезата. Критичен е наборът от стойности на критериите, при които нулевата хипотеза се отхвърля. Областта на приемане на хипотезата и критичната област са разделени от критични точки, които са табличните стойности на критериите.

    Областта на отхвърляне на хипотезата, както е показано на фигура 1, може да бъде едностранна (дясна или лява страна) и двустранна.

    дясна ръка

    K obs > k cr, където k cr -положително число (Фигура 1, а).

    лявостранносе нарича критичната област, определена от неравенството

    K набл< k кр, където k cr -отрицателно число (Фигура 1, b).

    двустранносе нарича критичната област, определена от неравенствата

    K obs > k 1 ; K набл 2, където k 2 >k 1 .

    Ако критични точкиса симетрични по отношение на нулата, двустранната критична област се определя от неравенствата: K набл<-k кр, K набл >k cr,или еквивалентно неравенство \K obl \>k кр(Фигура 1, c).

    Фигура 1 - Графична интерпретация на разпределението на зоната на приемане на хипотезата

    Основният принцип на тестване на статистически хипотези се формулира по следния начин: ако наблюдаваната (експериментална) стойност на критерия принадлежи към критичната област, хипотезата се отхвърля; ако наблюдаваната стойност на критерия принадлежи към зоната на приемане на хипотезата , хипотезата се приема.

    Извършва се проверка на статистическата хипотеза за приетото ниво на значимост р(взето равно на 0,1; 0,05; 0,01 и т.н.). Така че приетото ниво на значимост q = 0,05 означава, че напредналата нула статистическа хипотезаможе да се приеме с увереност П= 0,95. Или има вероятност да се отхвърли тази хипотеза (да се направи грешка от тип I), равна на П= 0,95.

    Нулевата статистическа хипотеза потвърждава, че тестваният „подозрителен“ резултат от измерване (наблюдение) принадлежи към тази група измервания.

    Формалният критерий за аномалния резултат от наблюденията (и, следователно, основата за приемане на конкурентна хипотеза: „подозрителният“ резултат не принадлежи към тази група измервания) е границата, отдалечена от центъра на разпространение със стойността tS, т.е.:

    (1)

    където x isub- резултатът от наблюдението, проверен за наличие на груба грешка; T- коефициент в зависимост от вида и закона на разпределение, обем на извадката, ниво на значимост; S - RMS.

    Следователно границите на грешка зависят от вида на разпределението, размера на извадката и избраното ниво на достоверност.

    Когато обработвате вече налични резултати от наблюдение, произволно отхвърлете индивидуални резултатине трябва да се използва, тъй като това може да доведе до фиктивно повишаване на точността на резултата от измерването. Група от измервания (проба) може да съдържа няколко груби грешки и тяхното отстраняване се извършва последователно, една по една.

    Всички методи за отстраняване на груби грешки (пропуски) могат да бъдат разделени на два основни типа:

    Методи за изключване с известна обща RMS;

    Методи за изключване за неизвестен общ RMS.

    В първия случай X c . Р. и RMS се изчислява въз основа на резултатите от цялата проба; във втория случай подозрителните резултати се отстраняват от пробата преди изчислението.

    В случай на ограничен брой наблюдения и (или) сложността на оценката на параметрите на закона за разпределение се препоръчва да се изключат грубите грешки, като се използват приблизителни коефициенти на типа разпределение. Това изключва стойностите x i< x r- и x i> x r+ , къде x r - , x r+ – граници на пропуски, определени от изразите:

    (2),(3)

    където А– коефициент, чиято стойност се избира в зависимост от зададената доверителна вероятност в диапазона от 0,85 до 1,30 (препоръчително е да изберете максималната стойност НОравно на 1,3); γ – контраексцес, чиято стойност зависи от формата на закона за количествено разпределение (ЗРВ).

    След отстраняване на пропуските трябва да се повтори операцията за определяне на оценките на разпределителния център и стандартното отклонение на резултатите от наблюденията и измерванията.

    Тъй като измерванията са по-често срещани в практиката с неизвестна RMS (ограничен брой наблюдения), в ръководството се разглеждат следните критерии за проверка на подозрителни (от гледна точка на грешки) резултати от наблюдения: Ървин, Романовски, диапазон на вариация, Диксън, Смирнов, Шовен.

    Тъй като критериалните изисквания (коефициенти), които определят границата, отвъд която са „грубите“ (в смисъл на грешки) резултати от наблюдението различни авториса различни, тогава проверката трябва да се извърши едновременно по няколко критерия (препоръчително е да се използват поне три от разгледаните по-долу). Окончателното заключение за принадлежността на „съмнителните” резултати към разглеждания набор от наблюдения трябва да бъде направено според повечето критерии. Освен това изборът на критерий за определяне на грубите грешки трябва да се извърши след конструиране на хистограма на резултатите от наблюдението. По вида на хистограмата се извършва предварителна идентификация на вида на закона за разпределение (нормален, близък до нормалния или различен от него).

    Критерий на Ъруин.За получените експериментални данни коефициентът се определя по формулата:

    (4)

    където x n + 1, x nнай-високи стойностислучайна величина; Се стандартното отклонение, изчислено за всички стойности на извадката.

    След това този коефициент се сравнява с табличната стойност λq, чиито възможни стойности са дадени в таблица 1.

    Таблица 1 - Критерий на Ъруин λq.

    Ако λ >λ q ,тогава нулевата хипотеза не е потвърдена, т.е. резултатът е грешен и трябва да бъде изключен по време на по-нататъшната обработка на резултатите от наблюдението.

    Критерий на Романовски.Конкуриращата се хипотеза за наличието на груби грешки в подозрителни резултати се потвърждава, ако е вярно следното неравенство:

    (5)

    където tp- квантил на разпределението на Стюдънт за дадена доверителна вероятност с броя на степените на свобода k = n -k n (k n -брой подозрителни наблюдения). Фрагмент от квантили за разпределението на Стюдънт е представен в таблица 2.

    Точкови оценкиразпространение и RMS Sрезултати

    наблюдения се изчислява без да се вземат предвид k nподозрителни наблюдения.

    Таблица 2 – Критерий на Стюдънт tp(Квантили на студенти)

    Критерий за вариационен диапазон.Е един от прости методиизключване на груба грешка при измерване (пропускане). За да го използвате, определете диапазона вариационна серияподреден набор от наблюдения (x 1 ≤x 2 ≤...≤x k ≤...≤x n):

    Ако някой член на вариационната серия, напр x k,се различава рязко от всички останали, тогава се прави проверка, като се използва следното неравенство:

    (7)

    където х- извадкова средна стойност аритметична стойност, изчислен след изключване на очаквания пропуск; z-критерий стойност.

    Нулевата хипотеза (за липсата на груба грешка) се приема, ако посочено неравенствоизпълнени. Ако x kне отговаря на условие (7), тогава този резултат се изключва от вариационната серия.

    Коефициент zзависи от броя на членовете на вариационната редица нкоето е представено в таблица 3.

    Таблица 3 - Критерий за диапазон на вариация

    Критерий на Диксън.Критерият се основава на предположението, че грешките на измерване се подчиняват на нормалния закон (преди това е необходимо да се изгради хистограма на резултатите от наблюденията) и да се тества хипотезата, че разпределението принадлежи на нормалния закон. Когато се използва критерият, коефициентът на Диксън (наблюдаваната стойност на критерия) се изчислява, за да се тества за най-голямата или най-малката крайна стойност в зависимост от броя на измерванията. Таблица 4 показва формулите за изчисляване на коефициентите. Коефициенти r 10 , r 11 се прилага, когато има едно отклонение, и r 21 и r 22 - когато има две изтласквания. Изисква се първоначално подреждане на резултатите от измерването (размер на извадката). Критерият се прилага, когато извадката може да съдържа повече от една груба грешка.

    Таблица 4 - Формули за коефициент на Диксън

    Стойностите на коефициентите на Диксън, изчислени за пробата с помощта на формулите rв сравнение с приетата (таблична) стойност на критерия на Диксън r q(таблица 5).

    Нулева хипотезаотносно липсата на груба грешка е изпълнено, ако неравенството r< r q.

    Ако r> r q, тогава резултатът се признава за груба грешка и

    изключени от по-нататъшна обработка.

    Таблица 5 - Критериални стойности на коефициентите на Диксън (на приетото ниво

    значимост р)

    Критерии на Райт.Правилото на трите сигми е един от най-простите тестове за резултати, които се подчиняват на нормалния закон за разпределение. Същността на правилото на трите сигми: ако една случайна променлива е нормално разпределена, тогава абсолютна стойностотклонението му от математическото очакване не надвишава три пъти стандартното отклонение.

    На практика правилото на трите сигми се прилага по следния начин: ако разпределението на изследваната случайна променлива е неизвестно, но е изпълнено условието, посочено в горното правило, тогава има основание да се приеме, че изследваната променлива е разпределена нормално; в противен случай не се разпространява нормално. За тази цел за извадката (включително подозрителния резултат) се изчислява центърът на разпределение и оценката на стандартното отклонение на резултата от наблюдението. Резултат, който отговаря на условието

    ,

    се счита, че има груба грешка и се премахва, а предварително изчислените характеристики на разпределението се прецизират.

    Този критерий е подобен Критерий на Райт, въз основа на факта, че ако остатъчната грешка е по-голяма от четири сигма, тогава този резултат от измерването е груба грешка и трябва да бъде изключен по време на по-нататъшната обработка. И двата критерия са надеждни, когато броят на измерванията е повече от 20…50. Легитимно е да се използват, когато е известна стойността на общото стандартно отклонение ( С).

    Може да се окаже, че за нови стойности и Сдруги резултати ще попаднат в категорията на аномалните.

    Критерий на Смирнов.За размера на извадката се използва критерият на Смирнов П≥ 25 или при известни стойностиобщо средно и СКО. Той определя по-малко строги граници за грубата грешка. За да се приложи този критерий, действителните стойности на квантилите на разпределението (наблюдаваната стойност на критерия) се изчисляват по формулата:

    (8)

    Намерената стойност се сравнява с критерия β kдадени в таблица 6

    Таблица 6 - Квантили на разпределение β k

    Критерият на Шовен.Критерият на Шовене се използва за закони, които не противоречат на нормалните и се основава на определяне на броя на очакваните резултати от наблюденията n готино, които имат толкова големи грешки, колкото и подозрителната. Хипотезата за наличие на груба грешка се приема, ако е изпълнено следното условие:

    Процедурата за проверка на хипотезата е следната:

    1) изчисляват се средната аритметична стойност и стандартното отклонение Срезултати от наблюдение за цялата извадка;

    2) от таблицата на нормализираното нормално разпределение (Приложение 1 - интегралната функция на нормализираното нормално разпределение) по стойност

    определя се вероятността за подозрителен резултат в общата съвкупност от числа н:

    (9)

    3) брой очаквани резултати етсе определя по формулата:

    Горните критерии в много случаи се оказват „трудни“. Тогава се препоръчва използването на критерия за груба грешка " к", в зависимост от размера на извадката Пи прието ниво на доверие Р.

    Таблица 7 - Зависимост на критерия груба грешка квърху размера на извадката П

    и ниво на увереност Р

    За разпределения, различни от нормалните, класове като две модални кръгли връхни композиции на нормални и дискретно разпределениес ексцес ε = 1,5 - 3,0;заострен бимодален; композиции на дискретно двузначно разпределение и разпределение на Лаплас с ексцес ε = 1,5 - 6,0;композиции с равномерно разпределение с експоненциално разпределение на ексцеса ε = 1,8-6,0и класа на експоненциалните разпределения в рамките на промяната на ексцеса ε = 1,8-6,0границата на грубата грешка се определя от стойността ± (т гр . σ ) или ±( т гр . С), където:

    (11)

    където γ - контраексцес;

    (12)

    Грешки при определяне на оценки ССеверен Казахстан и T sp са отрицателно корелирани, т.е. увеличение на стандартното отклонение Спридружено от намаляване T zp. Следователно, определянето на границите на грубата грешка за закони, различни от нормалните, с ексцес ε < 6 използвайки критерия T zp е достатъчно точен и може да се използва широко в практиката.

    Оценки, Си ε трябва да се изчисли след изключване на подозрителни резултати от пробата. След изчисляване на границите на груба грешка се връщат резултатите от наблюденията, които са вътре в границите, и предварително намерените характеристики на разпределението се прецизират.

    За равномерно разпределение е възможно да се вземе стойността ±1,8 . С.

    Помислете за примерприлагане на критерии за отстраняване на груби грешки при измерване на скоростта ударна вълна. Резултатите са представени в таблица 8.

    Таблица 8 - Резултати от наблюденията

    Изисква се да се определи дали резултатът от наблюдението съдържа V=3,50 km/s груба грешка.

    За графична дефиницияформа на закона за разпределение, ще построим хистограма. При конструирането разделянето на интервали се извършва по такъв начин, че измерените стойности да се окажат в средата на интервалите, което е показано на фигура 2.

    Използва се за оценка на съмнителни пробни стойности за груби грешки. Редът на прилагането му е следният.

    Намерете изчислената стойност на критерия λ изчисление = (|x към - x към предишен |)/σ,

    където x k- съмнителна стойност x към предишната- предишната стойност в серията вариации, ако x kсе оценява от максималните стойности на вариационната серия или следващата, ако x kсе оценява от минималните стойности на вариационната серия (Ъруин, използван в общ случайтерминът "първо значение"); σ е общото стандартно отклонение (RMSD) на непрекъсната случайна променлива с нормално разпределение.

    Ако λ изчислено > λ табл, x kгаф. Тук λ таблица- таблична стойност (процентен пункт) на критерия Irwin.

    Въпросите, които възникват в този случай, са описани на страницата. По-специално, в оригиналната статия табличните стойности на критерия се изчисляват за нормално разпределена случайна променлива с известно общо стандартно отклонение (MSD) σ . Тъй като σ най-често неизвестен, Ъруин предложи да се използва в изчисленията вместо σ извадково стандартно отклонение s, определено по формулата

    където не размерът на извадката, x iса елементите на извадката, x сре средната стойност на извадката.

    Този подход обикновено се използва на практика. Въпреки това, приемливостта на използване на извадково стандартно отклонение и следователно процентни точки за общото стандартно отклонение не е потвърдено.

    Тази статия представя таблични стойности (процентни точки) на критерия Irwin, изчислени по метода на статистическото компютърно моделиране, като се използва извадково стандартно отклонение за максималната стойност на вариационната серия със стандартно нормално разпределение на случайна променлива (с други параметри на нормално разпределение, както и за минимална стойноствариационни серии се получават същите резултати). За всеки размер на извадката нсимулирани 10 6 проби. Както показват предварителните изчисления, паралелни определенияразликите в стойностите на процентните пунктове могат да бъдат до 0,003. Тъй като стойностите бяха закръглени до 0,01, в съмнителни случаи бяха извършени 2 до 4 паралелни определяния.

    В допълнение, според данните, табличните стойности на критерия Irwin за известното общо SD бяха изчислени и сравнени с тези, дадени в .

    Тъй като при практическо приложениеКритерият на Ъруин често възникват определени трудности поради липсата на литературни източницитабличните стойности на критерия за някои размери на извадката са изчислени по същия метод на статистическо компютърно моделиране, като някои от стойностите липсват в табличните стойности.

    Ясно е, че при размер на извадката 2 прилагането на теста, използващ стандартното отклонение на извадката, няма смисъл. Това се потвърждава от факта, че опростяването на израза за изчислената стойност на критерия с извадково стандартно отклонение дава Корен квадратенот двете, което ясно показва безсмислието на прилагане на критерия с размер на извадката 2 и извадково стандартно отклонение.

    Резултатите са показани в табл. един.

    Таблица 1 - Таблични стойности на критерия Irwin за екстремни елементивариационна серия.

    Размер на извадкатаСпоред генералаЧрез селективно стандартно отклонение
    Ниво на значимост
    0,1 0,05 0,01 0,1 0,05 0,01
    2 2,33* 2,77* 3,64* - - -
    3 1,79* 2,17* 2,90* 1,62 1,68 1,72
    4 1,58 1,92 2,60 1,55 1,70 1,88
    5 1,45 1,77 2,43 1,45 1,64 1,93/
    6 1,37 1,67 2,30 1,38 1,60 1,94
    7 1,31 1,60 2,22 1,32 1,55 1,93
    8 1,26 1,55 2,14 1,27 1,51 1,92
    9 1,22 1,50 2,09 1,23 1,47 1,90
    10 1,18* 1,46* 2,04* 1,20 1,44 1,88
    11 1,15 1,43 2,00 1,17 1,42 1,87
    12 1,13 1,40 1,97 1,15 1,39 1,85
    13 1,11 1,38 1,94 1,13 1,37 1,83
    14 1,09 1,36 1,91 1,11 1,35 1,82
    15 1,08 1,34 1,89 1,09 1,33 1,80
    20 1,03* 1,27* 1,80* 1,03 1,27 1,75
    25 0,99 1,23 1,74 0,99 1,22 1,70
    30 0,96* 1,20* 1,70* 0,96 1,19 1,66
    35 0,93 1,17 1,66 0,94 1,16 1,63
    40 0,91* 1,15* 1,63* 0,92 1,14 1,61
    45 0,89 1,13 1,61 0,90 1,12 1,59
    50 0,88* 1,11* 1,59* 0,89 1,10 1,57
    60 0,86* 1,08* 1,56* 0,87 1,08 1,54
    70 0,84* 1,06* 1,53* 0,85 1,06 1,52
    80 0,83* 1,04* 1,51* 0,83 1,04 1,50
    90 0,82* 1,03* 1,49* 0,82 1,03 1,48
    100 0,81* 1,02* 1,47* 0,81 1,02 1,46
    200 0,75* 0,95* 1,38* 0,75 0,95 1,38
    300 0,72* 0,91* 1,33* 0,72 0,91 1,33
    500 0,69* 0,88* 1,28* 0,69 0,88 1,28
    1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
    Забележка: стойностите, отбелязани със звездичка, се изчисляват от данните и, ако е необходимо, се коригират по време на статистическия анализ. компютърна симулация. Останалите стойности са изчислени с помощта на статистически компютърни симулации.

    Ако сравним процентните точки за известната обща RMS, дадена в табл. 1, като съответните процентни пунктове са дадени в , те се различават в няколко случая с 0,01, а в един случай с 0,02. Очевидно процентните точки, дадени в тази статия, са по-точни, тъй като в съмнителни случаи те са проверени чрез статистическо компютърно моделиране.

    От таблица 1 може да се види, че процентните пунктове на критерия Irwin при използване на стандартно отклонение на извадката с относително малки размери на извадката се различават значително от процентните точки при използване на общото стандартно отклонение. Само при значителни размери на извадката, около 40, процентните пунктове стават близки. Следователно, когато използвате критерия Irwin, трябва да използвате процентните точки, дадени в таблицата. 1, като се има предвид, че изчислената стойност на критерия е получена по общото или извадковото стандартно отклонение.

    ЛИТЕРАТУРА

    1. Ървин Дж.О. Относно критерия за отхвърляне на извънредно наблюдение //Biometrika.1925. Т. 17. С. 238-250.

    2. Кобзар А.И. Приложено математическа статистика. - М .: FIZMATLIT, 2006. - 816s. © В.В. Заляжних
    Когато използвате материали, поставете връзка.