Біографії Характеристики Аналіз

Однофакторний дисперсійний аналіз кореляційної таблиці. Множинне порівняння: процедура Тьюкі-Крамера

Припустимо, що на автоматичній лінії кілька верстатів паралельно виконують однакову операцію. Для правильного планування подальшої обробки важливо знати, наскільки однотипні середні розміри деталей, одержувані на верстатах, що паралельно працюють. Тут має місце лише один фактор, що впливає на розмір деталей, це верстати, на яких вони виготовляються. Необхідно з'ясувати, наскільки важливим є вплив цього фактора на розміри деталей. Припустимо, що сукупності розмірів деталей, виготовлених кожному станці, мають нормальний розподіл і рівні дисперсії.

Маємо т верстатів, отже, т сукупностей або рівнів, на яких зроблено n 1 , n 2 ,...,п т спостережень. Для простоти міркувань припустимо, що n 1 =n 2 =…=п т. Розміри деталей, що становлять n iспостережень на i-му рівні, позначимо х i 1 ,х i 2,..., x in. Тоді всі спостереження можна подати у вигляді таблиці, яка називається матрицею спостережень (табл. 3.1).

Таблиця 3.1

рівні Результати спостережень
1 2 j n
x 11 x 12 x 1 j x 1 n
x 21 x 22 x 2 j x 2 n
x 31 x 32 x 3 j x 3 n
i x i1 x i2 x i j x i n
m x m1 x m2 x mj x mn

Вважатимемо, що для i-го рівня п спостережень мають середню β i, рівну сумізагальної середньої µ та варіації її, обумовленої i-м рівнем чинника, тобто. β i = µ + γ i. Тоді одне спостереження можна уявити в наступному вигляді:

x i j = µ + γ i. +ε ij= β i +ε ij (3.1)

де µ - загальна середня; γ i- ефект, зумовлений i-м рівнем фактора; ε ij- Варіація результатів усередині окремого рівня.

Член ε ijхарактеризує вплив всіх не врахованих моделлю (3.1) факторів. Відповідно до загальної задачі дисперсійного аналізу потрібно оцінити суттєвість впливу фактора на розміри деталей. Загальну варіаціюзмінної x i jможна розкласти на частини, одна з яких характеризує вплив фактора, інша - вплив неврахованих факторів. Для цього необхідно знайти оцінку загальної середньої µ та оцінки середніх за рівнями β i. Очевидно, що оцінкою β є середня арифметична п спостережень i-го рівня, тобто.

Зірочка в індексі при x означає, що спостереження фіксовані на i-му рівні. Середня арифметична всієї сукупності спостережень є оцінкою загальної середньої µ, тобто.

Знайдемо суму квадратів відхилень x i jвід, тобто.

Подаємо її у вигляді (3.2)

Причому =

Але = 0, оскільки це є сума відхилень змінних однієї сукупності від середньої арифметичної цієї сукупності, тобто. вся сума дорівнює нулю. Другий член суми (3.2) запишемо у вигляді:



Або

Доданок є сумою квадратів різниць між середніми рівнями та середньою всією сукупністю спостережень. Ця сума називається сумою квадратів відхилень між групами та характеризує розбіжність між рівнями. Величину називають також розсіюванням за факторами, тобто. розсіюванням за рахунок досліджуваного фактора.

Доданок є сумою квадратів різниць між окремими спостереженнями та середньою i-го рівня. Ця сума називається сумою квадратів відхилень усередині групи та характеризує розбіжність між спостереженнями i-го рівня. Величину називають також залишковим розсіюванням, тобто. розсіюванням за рахунок неврахованих факторів.

Величину називається загальною або повною сумоюквадратів відхилень окремих спостережень від загальної середньої.

Знаючи суми квадратів SS, SS 1 і SS 2 можна оцінити незміщені оцінки відповідних дисперсій - загальної, міжгрупової та внутрішньогрупової (таблиця 3.2).

Якщо вплив всіх рівнів фактора γ однаково, то і оцінки загальної дисперсії.

Тоді для оцінки суттєвості впливу фактора досить перевірити нульову гіпотезу H 0: = .

Для цього обчислюють критерій Фішера F B = з числом ступенів свободи k 1 = т - 1 і k 2 = т (п - 1). Потім за таблицею F-розподілу (див. таблицю розподілу критерію Фішера) рівня значимості α знаходять критичне значення F кр.

Таблиця 3.2

Якщо F B > F кр то нульова гіпотеза відкидається і робиться висновок про суттєвий вплив фактора.

При F B< F кр нет основания отвергать нулевую гипотезу и можно считать, что влияние фактора γ несущественно.



Порівнюючи міжгрупову та залишкову дисперсії, за величиною їх відношення судять, наскільки сильно проявляється вплив факторів.

Приклад 3.1. Є чотири партії тканин для спецодягу. З кожної партії відібрано по п'ять зразків та проведено випробування на визначення величини розривного навантаження. Результати випробувань наведено у табл. 3.3.

Таблиця 3.3

Номер партії, т

Потрібно з'ясувати, чи суттєво вплив різних партій сировини на величину розривного навантаження.

Рішення.

У даному випадкут = 4, п = 5. Середню арифметичну кожного рядка обчислюємо за формулою

Маємо: = (200 +140 +170 +145 +165) / 5 = 164; =170; =202; = 164.

Знайдемо середню арифметичну всієї сукупності:

Обчислимо величини, необхідних побудови табл. 3.4:

· Суму квадратів відхилень між групами SS 1, з k 1 = т -1 =

4-1=3 ступенями свободи:

· суму квадратів відхилень усередині групи SS 2 з k 2 = тп - т = = 20-4 = 16 ступенями свободи:

· Повну суму квадратів SS c k = mn-1 = 20-1 = 19 ступенями свободи:

За знайденими значеннями оцінимо дисперсію, за формулами (табл. 3.2) складемо (табл. 3.4) для прикладу.

Таблиця 3.4

Проведемо статистичний аналіз за критерієм Фішера. Обчислимо F B = = (4980 1/3) / (7270 1/16) = 1660/454,4 = 3,65.

За таблицею F-розподілу (див. додатки) знаходимо значення F Kp при k 2 = 16 k 1= 3 степенях свободи та рівні значимості α = 0,01. Маємо F Kp = 5,29.

Обчислене значення F B менше табличного, тому можна стверджувати, що нульова гіпотеза не відкидається, а це означає, що різницю між тканинами в партіях не впливає на величину розривного навантаження.

У пакеті Аналіз даних інструмент Однофакторний дисперсійний аналіз використовується для перевірки гіпотези про схожість середніх значень двох або більше вибірок, що належать до однієї і тієї ж генеральної сукупності. Розглянемо роботу пакета щодо однофакторного дисперсійного аналізу.

Розв'яжемо приклад 3.1, використовуючи інструмент Однофакторний дисперсійний аналіз.

Застосування статистики у цій нотатці буде показано на наскрізному прикладі. Припустимо, що ви – керівник виробництва у компанії Perfect Parachute («Ідеальний парашут»). Парашути виготовляються із синтетичних волокон, що постачаються чотирма різними постачальниками. Однією з основних характеристик парашута є його міцність. Вам необхідно переконатися, що всі волокна, що поставляються, мають однакову міцність. Щоб відповісти на це питання, слід розробити схему експерименту, під час якого вимірюється міцність парашутів, зітканих із синтетичних волокон різних постачальників. Інформація, отримана під час експерименту, дозволить визначити, який постачальник забезпечують найбільшу міцність парашутів.

Багато програм пов'язані з експериментами, у яких розглядається кілька груп чи рівнів одного чинника. Деякі фактори, наприклад температура випалу кераміки, можуть мати кілька числових рівнів (тобто 300°, 350°, 400° і 450°). Інші фактори, наприклад, розташування товарів у супермаркеті, можуть мати категоріальні рівні (наприклад, перший постачальник, другий постачальник, третій постачальник, четвертий постачальник). Однофакторні експерименти, в ході яких експериментальні одиниці випадково розподіляються по групах або рівнях фактора, називаються повністю рандомізованими.

ВикористанняF-критерія для оцінки різниць між кількома математичними очікуваннями

Якщо числові вимірювання фактора в групах є безперервними та виконуються деякі додаткові умови, для порівняння математичних очікуванькількох груп застосовується дисперсійний аналіз (ANOVA - An alysis o f Va riance). Дисперсійний аналіз, який використовує повністю рандомізовані плани, називається однофакторною процедурою ANOVA. У певному сенсі термін дисперсійний аналіз є неточним, оскільки у цьому аналізі порівнюються різниці між математичними очікуваннями груп, а чи не між дисперсіями. Проте, порівняння математичних очікувань здійснюється саме на основі аналізу варіації даних. У процедурі ANOVA повна варіація результатів вимірювань поділяється на міжгрупову та внутрішньогрупову (рис. 1). Внутрішньогрупова варіація пояснюється помилкою експерименту, а міжгрупова – ефектами умов експерименту. Символ зпозначає кількість груп.

Рис. 1. Поділ варіації у повністю рандомізованому експерименті

Завантажити нотатку у форматі або , приклади у форматі

Припустимо, що згруп вилучено із незалежних генеральних сукупностей, що мають нормальний розподіл та однакову дисперсію. Нульова гіпотеза у тому, що математичні очікування генеральних сукупностей однакові: Н 0: μ 1 = μ 2 = … = μ с. Альтернативна гіпотеза свідчить, що не всі математичні очікування однакові: Н 1: не всі μ j однакові j= 1, 2, …, с).

На рис. 2 представлена ​​справжня нульова гіпотеза про математичні очікування п'яти порівнюваних груп за умови, що генеральні сукупності мають нормальний розподіл та однакову дисперсію. П'ять генеральних сукупностей, пов'язаних з різними рівнямифактора, ідентичні. Отже, вони накладаються одна на одну, маючи однакові математичне очікування, варіацію та форму.

Рис. 2. П'ять генеральних сукупностей мають однакове математичне очікування: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

З іншого боку, припустимо, що насправді нульова гіпотеза є хибною, причому четвертий рівень має найбільше математичне очікування, перший рівень - трохи менше математичне очікування, а інші рівні - однакові і менші математичні очікування (рис. 3). Зверніть увагу на те, що за винятком величини математичних очікувань всі п'ять генеральних сукупностей ідентичні (тобто мають однакову мінливість та форму).

Рис. 3. Спостерігається ефект умов експерименту: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

При перевірці гіпотези про рівність математичних очікувань кількох генеральних сукупностей повна варіація поділяється на дві частини: міжгрупову варіацію, обумовлену різницею між групами, та внутрішньогрупову, обумовлену різницею між елементами, що належать одній групі. Повна варіація виражається повною сумою квадратів (SST – sum of squares total). Оскільки нульова гіпотеза полягає в тому, що математичні очікування всіх згруп рівні між собою, повна варіація дорівнює сумі квадратів різниць між окремими спостереженнями та загальним середнім (середнє середніх), обчисленим за всіма вибірками. Повна варіація:

де - загальне середнє, X ij - i-e спостереження в j-ї групи або рівні, n j- кількість спостережень у j-ї групи, n - Загальна кількістьспостережень переважають у всіх групах (тобто. n = n 1 + n 2 + … + n c), з- кількість груп, що вивчаються або рівнів.

Міжгрупова варіація, звана зазвичай міжгруповою сумою квадратів (SSA – sum of squares among groups), дорівнює сумі квадратів різниць між вибірковим середнім кожної групи jта загальним середнім , помножених на об'єм відповідної групи n j:

де з- кількість груп, що вивчаються, або рівнів, n j- кількість спостережень у j-ї групи, j- середнє значення j-ї групи, - загальне середнє.

Внутрігрупова варіація, звана зазвичай внутрішньогруповою сумою квадратів (SSW – sum of squares withing groups), дорівнює сумі квадратів різниць між елементами кожної групи і середнім вибірковим цієї групи j:

де Хij - i-й елемент j-ї групи, j- середнє значення j-ї групи.

Оскільки порівняння піддаються зрівнів фактора, міжгрупова сума квадратів має з 1степенів свободи. Кожен з зрівнів має n j – 1 ступенями свободи, тому внутрішньогрупова сума квадратів має n- зступенів свободи, та

Крім того, загальна сума квадратів має n – 1 ступенів свободи, оскільки кожне спостереження Хijпорівнюється із загальним середнім, обчисленим за всіма nспостереженням. Якщо кожну з цих сум поділити на відповідну кількість ступенів свободи, виникнуть три види дисперсії: міжгрупова(mean square among - MSA), внутрішньогрупова(mean square within - MSW) та повна(Mean Square Total - MST):

Незважаючи на те, що основне призначення дисперсійного аналізу - порівняти математичні очікування згруп, щоб виявити ефект умов експерименту, його назва обумовлена ​​тим, що головним інструментом є аналіз дисперсій різного типу. Якщо нульова гіпотеза є істинною, і між математичними очікуваннями згруп немає істотних відмінностей, всі три дисперсії – MSA, MSW та MST – є оцінками дисперсії σ 2, властивої аналізованим даним. Таким чином, щоб перевірити нульову гіпотезу Н 0: μ 1 = μ 2 = … = μ ста альтернативну гіпотезу Н 1: не всі μ j однакові j = 1, 2, …, з), необхідно обчислити статистику F-критерію, що представляє собою відношення двох дисперсій, MSA та MSW. Тестова F-статистика в однофакторному дисперсійному аналізі

Статистика F-Критерія підпорядковується F-розподілу з з 1ступенями свободи у чисельнику MSAі n – зступенями свободи у знаменнику MSW. При заданому рівні значимості нульова гіпотеза відхиляється, якщо обчислена F FU, властивого F-розподілу з з 1 n – зступенями свободи у знаменнику. Таким чином, як показано на рис. 4, вирішальне правилоформулюється так: нульова гіпотеза Н 0відхиляється, якщо F > FU; в іншому випадку вона не відхиляється.

Рис. 4. Критична область дисперсійного аналізу під час перевірки гіпотези Н 0

Якщо нульова гіпотеза Н 0є істинною, обчислена F-статистика близька до 1, оскільки її чисельник і знаменник є оцінками однієї і тієї ж величини - дисперсії 2, властивої аналізованим даним. Якщо нульова гіпотеза Н 0є хибною (і між математичними очікуваннями різних груп існує значна різниця), обчислена F-статистика буде набагато більше одиниці, оскільки її чисельник, MSA, крім природної мінливості даних, оцінює ефект умов експерименту чи різниці між групами, тоді як знаменник MSW оцінює лише природну мінливість даних. Таким чином, процедура ANOVA є F-критерій, у якому при заданому рівні значущості нульова гіпотеза відхиляється, якщо обчислена F-Статистика більше верхнього критичного значення FU, властивого F-розподілу з з 1ступенями свободи в чисельнику та n – зступенями свободи у знаменнику, як показано на рис. 4.

Для ілюстрації однофакторного дисперсійного аналізу повернемося до сценарію, викладеного на початку нотатки. Мета експерименту - визначити, чи мають парашути, зіткані із синтетичного волокна, отриманого від різних постачальників, однакову міцність. У кожній із груп зіткано по п'ять парашутів. Групи розділені за постачальниками- Постачальник 1, Постачальник 2, Постачальник 3 і Постачальник 4. Міцність парашутів вимірюється за допомогою спеціального пристрою, що зазнає тканини на розрив з двох сторін. Сила, потрібна для розриву парашута, вимірюється за особливою шкалою. Чим вища сила розриву, тим міцніше парашут. Excel дозволяє провести аналіз F-Статистики одним кліком. Пройдіть меню ДаніАналіз даних, і виберіть рядок Однофакторний дисперсійний аналіз, заповніть вікно, що відкрилося (рис. 5). Результати експерименту (сила розриву), деякі описові статистики та результати однофакторного дисперсійного аналізу представлені на рис. 6.

Рис. 5. Вікно Однофакторний дисперсійний аналіз Пакету аналізу Excel

Рис. 6. Показники міцності парашутів, зітканих із синтетичних волокон, отриманих від різних постачальників, описові статистики та результати однофакторного дисперсійного аналізу

Аналіз малюнка 6 показує, що між вибірковими середніми спостерігається певна різниця. Середня міцність волокон, отриманих від першого постачальника, дорівнює 19,52, від другого – 24,26, від третього – 22,84 та від четвертого – 21,16. Чи можна назвати цю різницю статистично значущою? Розподіл сили розриву продемонстровано на діаграмі розкиду (рис. 7). На ній ясно помітні різниці як між групами, так і всередині них. Якби обсяг кожної групи був більшим, для їх аналізу можна було б застосувати діаграму «ствол та листя», блокову діаграму або графік нормального розподілу.

Рис. 7. Діаграма розкиду міцності парашутів, зітканих із синтетичних волокон, отриманих від чотирьох постачальників

Нульова гіпотеза стверджує, що серед середніми показниками міцності немає істотних відмінностей: Н 0: μ 1 = μ 2 = μ 3 = μ 4. Альтернативна гіпотеза полягає в тому, що існує принаймні один постачальник, у якого середня міцність волокон відрізняється від інших: Н 1: не всі μ j однакові ( j = 1, 2, …, з).

Загальне середнє (див. рис. 6) = СРЗНАЧ(D12: D15) = 21,945; для визначення також можна усереднити всі 20 вихідних чисел: СРЗНАЧ(A3:D7). Значення дисперсій розраховуються Пакетом аналізуі відображаються у табличці Дисперсійний аналіз(див. рис. 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (див. колонку SSтаблиці Дисперсійний аналізмалюнку 6). Середні значення обчислюються шляхом розподілу цих сум квадратів відповідну кількість ступенів свободи. Оскільки з= 4, а n= 20, отримуємо наступні значенняступенів волі; для SSA: з 1= 3; для SSW: n – c= 16; для SST: n – 1= 19 (див. колонку df). Таким чином: MSA = SSA / ( з 1)= 21,095; MSW = SSW / ( n – c) = 6,094; MST = SST / ( n – 1) = 8,463 (див. колонку MS). F-статистика = MSA / MSW = 3,462 (див. колонку F).

Верхнє критичне значення FU, характерне для F-розподілу, визначається за формулою = F.ОБР (0,95; 3; 16) = 3,239. Параметри функції =F.ОБР(): α = 0,05, чисельник має три ступені свободи, а знаменник - 16. Таким чином, обчислена F-статистика, що дорівнює 3,462, перевищує верхнє критичне значення FU= 3239, нульова гіпотеза відхиляється (рис. 8).

Рис. 8. Критична область дисперсійного аналізу при рівні значущості, що дорівнює 0,05, якщо чисельник має три ступені свободи, а знаменник -16

р-значення, тобто. ймовірність того, що за істинної нульової гіпотези F-статистика не менше 3,46, дорівнює 0,041 або 4,1% (див. колонку р-Значеннятаблиці Дисперсійний аналізмалюнку 6). Оскільки ця величина не перевищує значення α = 5%, нульова гіпотеза відхиляється. Більш того, р-значення свідчить у тому, що можливість виявити таку чи велику різницю між математичними очікуваннями генеральних сукупностей за умови, що вони однакові, дорівнює 4,1%.

Отже. Між чотирма середніми вибірковими існує різниця. Нульова гіпотеза полягала у тому, що це математичні очікування чотирьох генеральних сукупностей рівні між собою. У цих умовах міра повної мінливості (тобто повна варіація SST) міцності всіх парашутів обчислюється шляхом підсумовування квадратів різниць між кожним спостереженням X ijта загальним середнім . Потім повна варіація поділялася на два компоненти (див. рис. 1). Перший компонент був міжгруповою варіацією SSA, а другий - внутрішньогрупову SSW.

Чим пояснюється мінливість даних? Інакше кажучи, чому всі спостереження однакові? Одна з причин полягає в тому, що різні фірми постачають волокна різної міцності. Це частково пояснює, чому групи мають різні математичні очікування: чим сильніший ефект умов експерименту, тим більша різниця між математичними очікуваннями груп. Інший причиною мінливості даних є природна мінливість будь-якого процесу, у разі - виробництва парашутів. Навіть якби всі волокна купувалися в одного і того ж постачальника, їхня міцність була б неоднаковою за інших рівних умовах. Оскільки цей ефект проявляється у кожній із груп, він називається внутрішньогруповою варіацією.

Різниці між вибірковими середніми називаються міжгруповою варіацією SSA. Частина внутрішньогрупової варіації, як зазначалося, пояснюється належністю даних різним групам. Однак навіть якби групи були абсолютно однаковими (тобто нульова гіпотеза була б істинною), міжгрупова варіація все одно існувала. Причина цього полягає у природній мінливості процесу виробництва парашутів. Оскільки вибірки різні, їх середні вибіркові відрізняються один від одного. Отже, якщо нульова гіпотеза є істинною як міжгрупова, так і внутрішньогрупова мінливістьє оцінкою мінливості генеральної сукупності. Якщо нульова гіпотеза є хибною, міжгрупова гіпотеза буде більшою. Саме цей факт лежить в основі F-Критерію для порівняння різниць між математичними очікуваннями кількох груп.

Після виконання однофакторного дисперсійного аналізу та виявлення значної різниці між фірмами залишається невідомим, який із постачальників істотно відрізняється від інших. Нам відомо лише, що математичні очікування генеральних сукупностей не рівні. Інакше висловлюючись, по крайнього заходу одне з математичних очікувань суттєво відрізняється від інших. Щоб визначити, який постачальник відрізняється від інших, можна скористатися процедурою Тьюкі, що використовує попарне порівняння між постачальниками Ця процедура була розроблена Джоном Тьюкі. Згодом і К. Крамер незалежно друг від друга модифікували цю процедуру для ситуацій, у яких обсяги вибірок відрізняються друг від друга.

Множинне порівняння: процедура Тьюкі-Крамера

У нашому сценарії для порівняння міцності парашутів використовувався однофакторний дисперсійний аналіз. Виявивши значні відмінностіміж математичними очікуваннями чотирьох груп необхідно визначити, які саме групи відрізняються одна від одної. Хоча існує кілька способів вирішити це завдання, ми опишемо лише процедуру множинного порівняння Тьюкі-Крамера. Цей метод є прикладом процедур апостеріорного порівняння (post hoc comparison), оскільки гіпотеза, що перевіряється, формулюється після аналізу даних. Процедура Тьюкі-Крамера дозволяє одночасно порівняти всі пари груп. На першому етапі обчислюються різниці Xj - Xj, де j ≠j, між математичними очікуваннями с(с – 1)/2груп. Критичний розмахпроцедури Тьюкі-Крамера обчислюється за такою формулою:

де Q U- верхнє критичне значення розподілу стюдентизованого розмаху, що має зступенів свободи в чисельнику та n - зступенів свободи у знаменнику.

Якщо обсяги вибірок не однакові, критичний розмах обчислюється кожної пари математичних очікувань окремо. На останньому етапі кожна з с(с – 1)/2пар математичних очікувань порівнюється із відповідним критичним розмахом. Елементи пари є значно різними, якщо модуль різниці | X j - Xj| між ними перевищує критичний розмах.

Застосуємо процедуру Тьюкі-Крамера до завдання міцності парашутів. Оскільки компанія, яка виробляє парашути, має чотири постачальники, слід перевірити 4(4 – 1)/2 = 6 пар постачальників (рис. 9).

Рис. 9. Попарні порівняння вибіркових середніх

Оскільки всі групи мають однаковий обсяг (тобто всі n j = n j), достатньо обчислити лише один критичний розмах. Для цього за таблицею Дисперсійний аналіз(Рис. 6) визначимо величину MSW = 6,094. Потім знайдемо величину Q Uпри α = 0,05, з= 4 (число ступенів свободи в чисельнику) та n- з= 20 - 4 = 16 (число ступенів свободи в знаменнику). На жаль, я не знайшов відповідної функції в Excel, тому скористався таблицею (рис. 10).

Рис. 10. Критичне значення стюдентизованого розмаху Q U

Отримуємо:

Оскільки лише 4,74> 4,47 (див. нижню таблицю рис. 9), статистично значуща різниця існує між першим та другим постачальником. Всі інші пари мають вибіркові середні, які не дозволяють говорити про їхню відмінність. Отже, середня міцність парашутів, зітканих з волокон, придбаних у першого постачальника, значно менше, ніж у другого.

Необхідні умови однофакторного дисперсійного аналізу

При вирішенні задачі про міцність парашутів ми не перевіряли, чи виконуються умови, за яких можна використовувати однофакторний F-Критерій. Як дізнатися, чи можна застосовувати однофакторний F-Критерій під час аналізу конкретних експериментальних даних? Однофакторний F-Критерій можна застосовувати тільки якщо виконуються три основні припущення: експериментальні дані повинні бути випадковими і незалежними, мати нормальний розподіл, а їх дисперсії повинні бути однаковими.

Перше припущення - випадковість та незалежність даних- повинно виконуватися завжди, оскільки коректність будь-якого експерименту залежить від випадковості вибору та процесу рандомізації. Щоб уникнути спотворення результатів, необхідно, щоб дані витягувалися з згенеральних сукупностей випадково та незалежно один від одного. Аналогічно дані повинні бути випадковим чином розподіленими за зрівням цікавого для нас фактора (експериментальним групам). Порушення цих умов може серйозно спотворити результати дисперсійного аналізу.

Друге припущення - нормальність- означає, що дані вилучені із нормально розподілених генеральних сукупностей. Як і для t-критерія, однофакторний дисперсійний аналіз на основі F-Критерія відносно мало чутливий до порушення цієї умови. Якщо розподіл не дуже відрізняється від нормального, рівень значущості F-Критерію змінюється мало, особливо якщо обсяг вибірок досить великий. Якщо ж умова нормальності розподілу порушується серйозно, слід застосовувати .

Третє припущення - однорідність дисперсії- означає, що дисперсії кожної генеральної сукупності рівні між собою (тобто σ 1 2 = σ 2 2 = … = σ j 2). Це припущення дозволяє вирішити, розділяти чи поєднувати внутрішньогрупові дисперсії. Якщо обсяги груп збігаються, умова однорідності дисперсії слабко впливає висновки, отримані з допомогою F-Критерія. Однак, якщо обсяги вибірок неоднакові, порушення умови рівності дисперсій може серйозно спотворити результати дисперсійного аналізу. Таким чином, слід прагнути того, щоб обсяги вибірок були однаковими. Одним із методів перевірки припущення про однорідність дисперсії є критерій Левене, описаний нижче.

Якщо з усіх трьох умов порушується лише умова однорідності дисперсії, можна застосовувати процедуру, аналогічну t-критерію, що використовує роздільну дисперсію (докладніше див). Однак, якщо припущення про нормальний розподіл та однорідність дисперсії порушуються одночасно, необхідно виконати нормалізацію даних та зменшити різницю між дисперсіями або застосувати непараметричну процедуру.

Критерій Левене для перевірки однорідності дисперсії

Незважаючи на те що F-Критерій щодо стійкий до порушень умови про рівність дисперсій у групах, грубе порушення цього припущення істотно впливає на рівень значущості та потужність критерію. Можливо, одним із найпотужніших є критерій Левене. Для перевірки рівності дисперсій згенеральних сукупностей перевіримо такі гіпотези:

Н 0: σ 1 2 = σ 2 2 = … = σj 2

Н 1: не всі σ j 2однакові ( j = 1, 2, …, з)

Модифікований критерій Левене заснований на твердженні, що якщо мінливість у групах однакова, для перевірки нульової гіпотези про рівність дисперсій можна застосувати аналіз дисперсії абсолютних величинрізниць між спостереженнями та медіанами груп. Отже, спочатку слід обчислити абсолютні величини різниць між спостереженнями та медіанами у кожній групі, а потім виконати однофакторний дисперсійний аналіз отриманих абсолютних величин різниць. Для ілюстрації критерію Левене повернемося до сценарію, викладеного на початку нотатки. Використовуючи дані, подані на рис. 6, проведемо аналогічний аналіз, але щодо модулів різниць вихідних даних та медіан з кожної вибірки окремо (рис. 11).

Дисперсійний аналіз є сукупність статистичних методів, призначених для перевірки гіпотез про зв'язок між певними ознаками та досліджуваними факторами, які не мають кількісного опису, а також для встановлення ступеня впливу факторів та їх взаємодії. У спеціальній літературі часто називають ANOVA (від англомовної назви Analysis of Variations). Вперше цей метод був розроблений Р. Фішером у 1925 р.

Види та критерії дисперсійного аналізу

Цей метод використовується для дослідження зв'язку між якісними (номінальними) ознаками та кількісною (безперервною) змінною. По суті, він здійснює тестування гіпотези про рівність середніх арифметичних кількох вибірок. Таким чином, його можна розглядати як параметричний критерій для порівняння центрів кількох вибірок. Якщо використовувати цей метод для двох вибірок, результати дисперсійного аналізу будуть ідентичні результатам t-критерію Стьюдента. Проте, на відміну інших критеріїв, це дослідження дозволяє вивчити проблему детальніше.

Дисперсійний аналіз у статистиці базується на законі: сума квадратів відхилень об'єднаної вибірки дорівнює сумі квадратів внутрішньогрупових відхилень та сумі квадратів міжгрупових відхилень. Для дослідження використовується критерій Фішера для встановлення значущості відмінності міжгрупових дисперсій від внутрішньогрупових. Однак для цього необхідними передумовами є нормальність розподілу та гомоскедастичність (рівність дисперсій) вибірок. Розрізняють одномірний (однофакторний) дисперсійний аналіз та багатовимірний (багатофакторний). Перший розглядає залежність досліджуваної величини від однієї ознаки, другий - відразу від багатьох, а також дозволяє виявити зв'язок між ними.

Чинники

Чинниками називають контрольовані обставини, що впливають на кінцевий результат. Його рівнем чи способом обробки називають значення, що характеризує конкретний прояв цієї умови. Ці цифри зазвичай подають у номінальній чи порядковій шкалі вимірювань. Часто вихідні значення вимірюють у кількісних чи порядкових шкалах. Тоді виникає проблема угруповання вихідних даних у ряді спостережень, що відповідають приблизно однаковим числовим значенням. Якщо кількість груп взяти надмірно більшим, то кількість спостережень у них може виявитися недостатньою для отримання надійних результатів. Якщо брати число надмірно малим, це може призвести до втрати істотних особливостей впливу системи. Конкретний спосіб угруповання даних залежить від обсягу та характеру варіювання значень. Кількість та розміри інтервалів при однофакторному аналізі найчастіше визначають за принципом рівних проміжків або за принципом рівних частот.

Завдання дисперсійного аналізу

Отже, існують випадки коли потрібно порівняти дві або більше вибірок. Саме тоді й доцільне застосування дисперсійного аналізу. Назва методу свідчить про те, що висновки роблять з урахуванням дослідження складових дисперсії. Суть вивчення полягає в тому, що загальну зміну показника розбивають на складові, що відповідають дії кожного окремо взятого фактора. Розглянемо низку завдань, які вирішує типовий дисперсійний аналіз.

Приклад 1

У цеху є ряд верстатів – автоматів, які виготовляють певну деталь. Розмір кожної деталі - це випадкова величина, яка залежить від налаштування кожного верстата та випадкових відхилень, що виникають у процесі виготовлення деталей. Потрібно за даними вимірів розмірів деталей визначити, чи однаково налаштовані верстати.

Приклад 2

Під час виготовлення електричного апарату використовують різні типи ізоляційного паперу: конденсаторний, електротехнічний та ін. Апарат можна просочити різними речовинами: епоксидною смолою, лаком, смолою МЛ-2 та ін. Витоку можна усувати під вакуумом при підвищеному тиску, при нагріванні. Просочувати можна методом занурення в лак, під безперервним струменем лаку і т. п. Електричний апарат загалом заливають певним компаундом, варіантів якого є кілька. Показниками якості є електрична міцність ізоляції, температура перегріву обмотки в робочому режимі та інші. Під час відпрацювання технологічного процесувиготовлення апаратів треба визначити, як впливає кожен із перерахованих факторів на показники апарату.

Приклад 3

Тролейбусне депо обслуговує кілька тролейбусних маршрутів. На них працюють тролейбуси різних типів і оплату за проїзд збирають 125 контролерів. Керівництво депо цікавить питання: як порівняти економічні показники роботи кожного контролера (виручку) з огляду на різні маршрути, різні типи тролейбусів? Як визначити економічну доцільність випуску тролейбусів певного типу на той чи інший маршрут? Як встановити обґрунтовані вимоги до величини виручки, яку приносить кондуктор на кожному маршруті в різних типах тролейбусів?

Завдання на вибір методу полягає в тому, як отримати максимум інформації щодо впливу на кінцевий результат кожного фактора, визначити числові характеристики такого впливу, їх надійність при мінімальних витратах і максимально короткий час. Вирішити такі завдання дозволяють методи дисперсійного аналізу.

Однофакторний аналіз

Дослідження своєю метою ставить оцінку величини впливу конкретного випадку на аналізований відгук. Іншим завданням однофакторного аналізуможе бути порівняння двох або кількох обставин одна з одною з метою визначення різниці їх впливу на відкликання. Якщо нульову гіпотезу відкидають, то наступним етапом буде кількісне оцінювання та побудова довірчих інтервалівдля одержаних характеристик. У разі коли нульова гіпотеза не може бути відкинутою, зазвичай її приймають і роблять висновок про сутність впливу.

Однофакторний дисперсійний аналіз може стати непараметричним аналогом рангового методу Фаркела-Уолліса. Він розроблений американськими математиком Вільямом Краскелом та економістом Вільсоном Уоллісом у 1952 р. Цей критерій призначений для перевірки нульової гіпотези про рівність ефектів впливу на досліджувані вибірки з невідомими, але рівними середніми величинами. При цьому кількість вибірок має бути більшою за дві.

Критерій Джонкхієра (Джонкхієра-Терпстра) був запропонований незалежно один від одного нідерландським математиком Т. Дж. Терпстром у 1952 р. та британським психологом Є. Р. Джонкхієром у 1954 р. Його застосовують тоді, коли заздалегідь відомо, що наявні групи результатів упорядковані за зростання впливу досліджуваного фактора, який вимірюють у порядковій шкалі.

М - критерій Бартлетта, запропонований британським статистиком Мауріс Стівенсон Бартлетт в 1937 р., застосовують для перевірки нульової гіпотези про рівність дисперсій декількох нормальних генеральних сукупностей, з яких взяті досліджувані вибірки, в загальному випадкумають різні обсяги (число кожної вибірки має бути не менше чотирьох).

G – критерій Кохрена, який відкрив американець Вільям Геммел Кохрен у 1941 р. Його використовують для перевірки нульової гіпотези про рівність дисперсій нормальних генеральних сукупностей із незалежних вибірок рівного обсягу.

Непараметричний критерій Левен, запропонований американським математиком Ховардом Левен в 1960 р., є альтернативою критерію Бартлетта в умовах, коли немає впевненості в тому, що досліджувані вибірки підпорядковуються нормальному розподілу.

У 1974 р. американські статистики Мортон Б. Браун та Алан Б. Форсайт запропонували тест (критерій Брауна-Форсайта), який дещо відрізняється від критерію Левене.

Двофакторний аналіз

Двофакторний дисперсійний аналіз застосовують для пов'язаних нормально розподілених вибірок. На практиці часто використовують і складні таблиціцього методу, зокрема ті, в яких кожен осередок містить набір даних (повторні вимірювання), що відповідають фіксованим значенням рівнів. Якщо припущення, необхідні застосування двофакторного дисперсійного аналізу, не виконуються, то використовують непараметричний ранговий критерій Фрідмана (Фрідмана, Кендалла і Сміта), розроблений американським економістом Мілтоном Фрідманом наприкінці 1930 р. Цей критерій залежить від типу розподілу.

Передбачається тільки, що розподіл величин є однаковим і безперервним, а вони самі незалежні одна від одної. При перевірці нульової гіпотези вихідні дані подають у формі прямокутної матриці, в якій рядки відповідають рівням фактора, а стовпці - рівням А. Кожна осередок таблиці (блоку) може бути результатом вимірювань параметрів на одному об'єкті або на групі об'єктів при постійних значеннях рівнів обох факторів. У цьому випадку відповідні дані подають як середні значення певного параметра за всіма вимірами або об'єктами досліджуваної вибірки. Для застосування критерію вихідних даних необхідно перейти від безпосередніх результатів вимірювань до їхнього рангу. Ранжування здійснюють по кожному рядку окремо, тобто величини впорядковують кожного фіксованого значення.

Критерій Пейджа (L-критерій), запропонований американським статистиком Е. Б. Пейджем у 1963 р., призначений для перевірки нульової гіпотези. Для більших вибірок застосовують апроксимацію Пейджа. Вони за умови реальності відповідних нульових гіпотез підпорядковуються стандартному нормальному розподілу. У разі, коли у рядках вихідної таблиці є однакові значення, необхідно використовувати середні ранги. При цьому точність висновків буде гіршою, чим більше буде кількостей таких збігів.

Q - критерій Кохрена, запропонований В. Кохреном в 1937 р. Його використовують у випадках, коли групи однорідних суб'єктів піддаються впливам, кількість яких перевищує два і для яких можливі два варіанти відгуків - умовно-негативний (0) та умовно-позитивний (1) . Нульова гіпотеза складається з рівності ефектів впливу. Двофакторний дисперсійний аналіз дає можливість визначити існування ефектів обробки, проте не дає можливості встановити, для яких саме стовпців існує цей ефект. При вирішенні цієї проблеми застосовують метод множинних рівняньШеффе для пов'язаних вибірок.

Багатофакторний аналіз

Завдання багатофакторного дисперсійного аналізу виникає тоді, коли потрібно визначити вплив двох чи більше умов на певну випадкову величину. Дослідження передбачає наявність однієї залежної випадкової величини, виміряної в шкалі різниці або відносин, і кількох незалежних величин, кожна з яких виражена в шкалі найменувань або ранговій. Дисперсійний аналіз даних є досить розвиненим розділом математичної статистики, який має безліч варіантів. Концепція дослідження загальна як однофакторного, так багатофакторного. Сутність її полягає в тому, що загальну дисперсіюрозбивають на складові, що відповідає певному угрупованню даних. Кожному угрупованню даних відповідає своя модель. Тут ми розглянемо лише основні положення, необхідні для розуміння та практичного використаннянайбільш застосовуваних варіантів.

Дисперсійний аналіз факторів вимагає досить уважного ставлення до збору та подачі вхідних даних, а особливо до інтерпретації результатів. На відміну від однофакторного, результати якого можна умовно розмістити у певній послідовності, результати двофакторного вимагають складнішого уявлення. Ще складніша ситуаціявиникає, коли є три, чотири чи більше обставин. Через це модель досить рідко включають більше трьох (чотирьох) умов. Прикладом може бути виникнення резонансу за певної величини ємності та індуктивності електричного кола; прояв хімічної реакції за певної сукупності елементів, у тому числі побудована система; виникнення аномальних ефектів у складних системах за певного збігу обставин. Наявність взаємодії може докорінно змінити модель системи та іноді призвести до переосмислення природи явищ, із якими має справу експериментатор.

Багатофакторний дисперсійний аналіз із повторними дослідами

Дані вимірів досить часто можна групувати не за двома, а за більшою кількістю факторів. Так, якщо розглядати дисперсійний аналіз терміну служби покришок коліс тролейбуса з урахуванням обставин (завод-виробник та маршрут, на якому експлуатуються покришки), то можна виділити як окрему умову сезон, під час якого експлуатуються покришки (а саме: зимова та літня експлуатація). У результаті матимемо завдання трифакторного методу.

За наявності більшої кількості умов підхід такий самий, як і у двофакторному аналізі. У всіх випадках модель намагаються спростити. Явище взаємодії двох чинників проявляється негаразд часто, а потрійне взаємодія буває у виняткових випадках. Включають ту взаємодію, для якої є попередня інформація та серйозні підстави, щоб її врахувати у моделі. Процес виділення окремих чинників та їх урахування щодо простий. Тому часто виникає бажання виділити більше обставин. Цим не слід захоплюватися. Чим більше умов, тим менш надійною стає модель і тим більша ймовірність помилки. Сама модель, до якої входить велика кількістьнезалежних змінних, стає досить складною для інтерпретації та незручною для практичного використання.

Загальна ідея дисперсійного аналізу

Дисперсійний аналіз у статистиці – це метод отримання результатів спостережень, залежних від різних одночасно діючих обставин, та оцінки їхнього впливу. Керовану змінну величину, яка відповідає способу впливу на об'єкт дослідження і в певний період часу набуває певне значенняназивають фактором. Вони можуть бути якісними та кількісними. Рівні кількісних умов набувають певного значення на числовій шкалі. Прикладами є температура, тиск пресування, кількість речовини. Якісні фактори – це різні речовини, Різні технологічні методи, апарати, наповнювачі. Їхнім рівням відповідає шкала найменувань.

До якісних можна віднести також вид пакувального матеріалу, умови зберігання. лікарської форми. Сюди ж раціонально віднести ступінь подрібнення сировини, фракційний склад гранул, що мають кількісне значення, однак погано піддаються регулюванню, якщо використовувати кількісну шкалу. Число якісних факторів залежить від виду лікарської форми, а також фізичних та технологічних властивостей лікарських речовин. Наприклад, кристалічних речовин можна отримувати таблетки прямим пресуванням. У цьому випадку достатньо провести вибір ковзних та змащувальних речовин.

Приклади якісних факторів для різних видів лікарських форм

  • Настоянки.Склад екстрагента, тип екстрактора, спосіб підготовки сировини, спосіб одержання, спосіб фільтрації.
  • Екстракти (рідкі, густі, сухі).Склад екстрагента, спосіб екстракції, тип установки, спосіб видалення екстрагента та баластових речовин.
  • Пігулки.Склад допоміжних речовин, наповнювачі, розпушувачі, сполучні, змащувальні та ковзні речовини. Спосіб отримання пігулок, вид технологічного обладнання. Вид оболонки та її компонентів, плівкоутворювачі, пігменти, барвники, пластифікатори, розчинники.
  • Ін'єкційні розчини.Вид розчинника, спосіб фільтрації, природа стабілізаторів та консервантів, умови стерилізації, спосіб заповнення ампул.
  • Супозиторії.Склад супозиторної основи, спосіб одержання супозиторіїв, наповнювачів, упаковки.
  • Мазі.Склад основи, структурні компоненти, спосіб приготування мазі, вид обладнання, упаковка.
  • Капсули.Вид оболонкового матеріалу, спосіб одержання капсул, тип пластифікатора, консерванту, барвника.
  • Лініменти.Спосіб отримання, склад, тип обладнання, тип емульгатора.
  • Суспензії.Вид розчинника, вид стабілізатора, метод диспергування.

Приклади якісних факторів та їх рівнів, що вивчаються у процесі виготовлення таблеток

  • Розпушувач.Крохмаль картопляний, глина біла, суміш натрію гідрокарбонату з лимонною кислотою, магнію карбонат основний.
  • Зв'язуючий розчин.Вода, крохмальний клейстер, цукровий сироп, розчин метилцелюлози, розчин оксипропілметилцелюлози, розчин полівінілпіролідону, розчин полівінілового спирту.
  • Ковзна речовина.Аеросил, крохмаль, тальк.
  • Наповнювач.Цукор, глюкоза, лактоза, хлорид натрію, фосфат кальцію.
  • Змащувальна речовина.Стеаринова кислота, поліетиленгліколь, парафін.

Моделі дисперсійного аналізу у дослідженні рівня конкурентоспроможності держави

Одним із найважливіших критеріїв оцінки стану держави, за якими проводиться оцінка рівня її добробуту та соціально-економічного розвитку, є конкурентоспроможність, тобто сукупність властивостей, властивих національній економіці, які визначають здатність держави конкурувати з іншими країнами. Визначивши місце та роль держави на світовому ринку, можна встановити чітку стратегію забезпечення економічної безпеки у міжнародних масштабах, адже вона є запорукою позитивних взаємин Росії з усіма гравцями світового ринку: інвесторами, кредиторами, урядами держав.

Для порівняння рівня конкурентоспроможності держав проводиться ранжування країн за допомогою комплексних індексів, які включають різні виважені показники. В основу цих індексів закладено ключові фактори, що впливають на економічне, політичне тощо положення. Комплекс моделей дослідження конкурентоспроможності держави передбачає використання методів багатовимірного статистичного аналізу (зокрема, це дисперсійний аналіз (статистика), економетричне моделювання, прийняття рішень) та включає такі основні етапи:

  1. Формування системи показників-індикаторів.
  2. Оцінку та прогнозування індикаторів конкурентоспроможності держави.
  3. Порівняння показників-індикаторів конкурентоспроможності країн.

А тепер розглянемо зміст моделей кожного із етапів даного комплексу.

На першому етапіза допомогою методів експертного вивчення формується обґрунтований комплекс економічних показників-індикаторів оцінки конкурентоспроможності держави з урахуванням специфіки її розвитку на основі міжнародних рейтингів та даних статистичних відділів, що відображають стан системи загалом та її процесів. Вибір цих показників обґрунтований необхідністю відібрати ті з них, які найповніше з точки зору практики дозволяють визначити рівень держави, її інвестиційну привабливість та можливості відносної локалізації існуючих потенційних та реально чинних загроз.

Основні показники-індикатори міжнародних рейтинг-систем – це індекси:

  1. Глобальної конкурентоспроможності (ІГК).
  2. Економічна свобода (ІЕС).
  3. розвитку людського потенціалу(ІРПП).
  4. Сприйняття корупції (ІВК).
  5. Внутрішніх та зовнішніх загроз (ШВЗЗ).
  6. Потенціалу міжнародного впливу (ІПМВ).

Другий етаппередбачає оцінку та прогнозування індикаторів конкурентоспроможності держави щодо міжнародним рейтингамдля досліджуваних 139 країн світу.

Третій етаппередбачає порівняння умов конкурентоспроможності держав з допомогою методів кореляційно-регресійного аналізу.

Використовуючи результати дослідження можна визначити характер перебігу процесів загалом та за окремими складовими конкурентоспроможності держави; перевірити гіпотезу про вплив факторів та їх взаємозв'язок за відповідного рівня значущості.

Реалізація запропонованого комплексу моделей дозволить не лише оцінити ситуацію, що склалася, рівня конкурентоспроможності та інвестиційної привабливості держав, а й проаналізувати недоліки управління, попередити помилки неправильних рішень, не допустити розвитку кризи в державі.

Дисперсійний аналіз

1. Поняття дисперсійного аналізу

Дисперсійний аналіз- це аналіз мінливості ознаки під впливом будь-яких контрольованих змінних факторів У зарубіжній літературі дисперсійний аналіз часто позначається як ANOVA, що перекладається як аналіз варіативності (Analysis of Variance).

Завдання дисперсійного аналізуполягає в тому, щоб із загальної варіативності ознаки виокремити варіативність іншого роду:

а) варіативність обумовлену дією кожної із досліджуваних незалежних змінних;

б) варіативність, обумовлену взаємодією досліджуваних незалежних змінних;

в) випадкову варіативність, обумовлену усіма іншими невідомими змінними.

Варіативність, обумовлена ​​дією досліджуваних змінних та його взаємодією, співвідноситься з випадковою варіативністю. Показником цього співвідношення є критерій Фішера F.

До формули розрахунку критерію F входять оцінки дисперсій, тобто параметрів розподілу ознаки, тому критерій F є параметричним критерієм.

Чим в більшою міроюваріативність ознаки обумовлена ​​досліджуваними змінними (факторами) або їх взаємодією, тим вище емпіричні значення критерію.

Нульова гіпотеза в дисперсійному аналізі буде говорити, що середні величини досліджуваного результативного ознаки у всіх градаціях однакові.

Альтернативна гіпотеза стверджуватиме, що середні величини результативної ознаки в різних градаціях досліджуваного фактора різні.

Дисперсійний аналіз дозволяє нам констатувати зміну ознаки, але при цьому не вказує напрямокцих змін.

почнемо розгляд дисперсійного аналізу з найпростішого випадку, коли досліджується лише дія однієїзмінної (одного чинника).

2. Однофакторний дисперсійний аналіз для непов'язаних вибірок

2.1. Призначення методу

Метод однофакторного дисперсійного аналізу застосовується в тих випадках, коли досліджуються зміни результативної ознаки під впливом умов, що змінюються або градацій будь-якого фактора. В даному варіанті методу впливу кожної з градацій фактора піддаються різнівибірки піддослідних. Градацій фактора має бути не менше трьох. (Градацій може бути і дві, але в цьому випадку ми не зможемо встановити нелінійних залежностей і розумнішим є використання більш простих).

Непараметричним варіантом цього виду аналізу є критерій Н Крускала-Уолліса.

Гіпотези

H 0: Відмінності між градаціями фактора (різними умовами) не більш вираженими, ніж випадкові відмінності всередині кожної групи.

H 1: Відмінності між градаціями фактора (різними умовами) більш вираженими, ніж випадкові відмінності всередині кожної групи.

2.2. Обмеження методу однофакторного дисперсійного аналізу для непов'язаних вибірок

1. Однофакторний дисперсійний аналіз вимагає не менше трьох градацій фактора і не менше двох випробуваних у кожній градації.

2. Результативна ознака має бути нормально розподілена в досліджуваній вибірці.

Правда, зазвичай не вказується, чи йдеться про розподіл ознаки у всій обстеженій вибірці або в тій її частині, яка складає дисперсійний комплекс.

3. Приклад розв'язання задачі методом однофакторного дисперсійного аналізу для незв'язаних вибірок на прикладі:

Три різні групи із шести піддослідних отримали списки з десяти слів. Першій групі слова пред'являлися з низькою швидкістю -1 слово в 5 секунд, другий групі із середньою швидкістю - 1 слово в 2 секунди, і третій групі з великою швидкістю - 1 слово в секунду. Було передбачено, що показники відтворення залежатимуть від швидкості слів. Результати представлені у Табл. 1.

Кількість відтворених слів Таблиця 1

№ випробуваного

низька швидкість

Середня швидкість

висока швидкість

Загальна сума

H 0: Відмінність обсягу відтворення слів міжгрупами не більш вираженими, ніж випадкові відмінності всерединікожної групи.

H 1: Відмінності обсягом відтворення слів міжгрупами є більш вираженими, ніж випадкові відмінності всерединікожної групи. Використовуючи експериментальні значення, подані в Табл. 1, встановимо деякі величини, які будуть необхідні розрахунку критерію F.

Розрахунок основних величин для однофакторного дисперсійного аналізу подамо в таблиці:

Таблиця 2

Таблиця 3

Послідовність операцій в однофакторному дисперсійному аналізі для непов'язаних вибірок

Часто зустрічається в цій та наступних таблицях позначення SS - скорочення від "суми квадратів" (sum of squares). Це скорочення найчастіше використовується у перекладних джерелах.

SS фактозначає варіативність ознаки, обумовлену дією фактора, що досліджується;

SS заг- загальну варіативність ознаки;

S CA-варіативність, обумовлену неврахованими факторами, "випадкову" або "залишкову" варіативність.

MS - "середній квадрат", або математичне очікування суми квадратів, усереднена величина відповідних SS".

df - Число ступенів свободи, яке при розгляді непараметричних критеріїв ми позначили грецькою літерою v.

Висновок: H0 відхиляється. Приймається H1. Відмінності обсягом відтворення слів між групами є більш вираженими, ніж випадкові відмінності всередині кожної групи (α=0,05). Отже, швидкість пред'явлення слів впливає обсяг їхнього відтворення.

Приклад вирішення задачі в Excel наведено нижче:

Початкові дані:

Використовуючи команду: Сервіс->Аналіз даних->Однофакторний дисперсійний аналіз, отримаємо наступні результати:

Курсова робота з математики

Вступ

Поняття дисперсійного аналізу

Однофакторний дисперсійний аналіз (Практична реалізація в IBM SPSS Statistics 20)

Однофакторний дисперсійний аналіз (Практична реалізація в Microsoft Office 2013)

Висновок

Список використаних джерел

Вступ

Актуальність теми. Розвиток математичної статистики починається з робіт знаменитого німецького математика Карла Фрідріха Гауса в 1795 і досі розвивається. У статистичному аналізіІснує параметричний метод «Однофакторний дисперсійний аналіз». В даний час його використовують в економіці при проведенні дослідження ринку для сумісності результатів (наприклад, проводячи опитування з приводу споживання будь-якого товару в різних регіонах країни, необхідно зробити висновки, наскільки дані опитування відрізняються або не відрізняються один від одного, в психології при проведенні різноманітних досліджень), при складанні наукових тестів порівняння, або дослідженні будь-яких соціальних груп, Та й для вирішення завдань зі статистики.

Мета роботи. Познайомиться з таким статистичним методом, як однофакторний дисперсійний аналіз, а також з реалізацією його на ПК в різних програмах і порівняння цих програм.

Вивчити теорію однофакторного дисперсійного аналізу.

Вивчити програми на вирішення завдань на однофакторный аналіз.

Провести порівняльний аналізданих програм.

Досягнення роботи: Практична частинароботи повністю виконана автором: підбір програм, підбір завдань, їх вирішення на ПК, після проведено порівняльний аналіз. У теоретичній частині проведено класифікацію груп дисперсійного аналізу. Ця роботабула апробована як доповідь на студентській науковій сесії «Вибрані питання вищої математикита методики викладання математики»

Структура та обсяг роботи. Робота складається з вступу, висновків, змісту та списку літератури, що включає 4 найменування. Повний обсяг роботи – 25 сторінок друкованого тексту. Робота містить 1 приклад, вирішений 2 програмами.

Поняття дисперсійного аналізу

Часто виникає необхідність дослідити вплив однієї чи кількох незалежних змінних (чинників) однією чи кілька залежних змінних (результативних ознак), подібні завдання можна вирішувати методами дисперсійного аналізу, автором якого є Р. Фішер.

Дисперсійний аналіз ANOVA – сукупність статистичних методів обробки даних, що дозволяють аналізувати мінливість однієї чи кількох результативних ознак під впливом контрольованих факторів (незалежних змінних). Тут під чинником розуміється деяка величина, визначальна властивості досліджуваного об'єкта чи системи, тобто. причина, що впливає кінцевий результат. Під час проведення дисперсійного аналізу важливо правильно вибрати джерело та об'єкт впливу, тобто. визначити залежні та незалежні змінні.

Залежно від ознак класифікації розрізняють кілька класифікаційних груп дисперсійного аналізу (табл. 1).

За кількістю факторів, що враховуються: Однофакторний аналіз - досліджується вплив одного фактора; Багатофакторний аналіз - вивчається одночасний вплив двох або більше факторів. різних умовах. (Перевірюється нульова гіпотеза H0: середнє значення залежної змінної однаково в різних умовах виміру, тобто не залежить від досліджуваного фактора.); Аналіз пов'язаних (одних і тих же) вибірок - проводиться для двох і більше вимірів, проведених на одній і тій ж групі досліджуваних об'єктів у різних умовах. Тут можливий вплив неврахованого фактора, який можна помилково приписати зміні умов. За кількістю залежних змінних, схильних до впливу факторів. - багатовимірний коваріаційний аналіз) - впливу факторів схильно кілька залежних змінних. За метою дослідження. випадкова вибірказ генеральної сукупності рівнів фактора (перевіряється гіпотеза Н0 про те, що дисперсія середніх значень відгуку, обчислена для різних рівнів фактора, не відрізняється від нуля);

В однофакторному дисперсійному аналізі проводиться перевірка статистичної значимостівідмінностей вибіркових середніх двох чи більше сукупностей при цьому попередньо формуються гіпотези.

Нульова гіпотеза H0: середні величини результативної ознаки у всіх умовах дії фактора (або градаціях фактора) однакові

Альтернативна гіпотеза H1: середні величини результативної ознаки за всіх умов впливу чинника різні.

Методи дисперсійного аналізу можуть застосовуватися для нормально розподілених сукупностей (багатомірні аналоги параметричних тестів) та для сукупностей, які не мають певних розподілів (багатомірні аналоги непараметричних тестів). У першому випадку необхідно заздалегідь встановити, що розподіл результативної ознаки є нормальним. Для перевірки нормальності розподілу ознак можна використовувати показники асиметрії A = , , та ексцеса E = , , де , . - значення результативної ознаки та її середнє значення; - середньоквадратичне відхилення результативної ознаки; .

Число спостережень;

Помилки репрезентативності для показників A та E

Якщо показники асиметрії та ексцесу вбираються у більш ніж 3 разу свої помилки репрезентативності, тобто. А<3тА и Е <3тЕ, то распределение можно считать нормальным. Для нормальных распределений показатели А и Е равны нулю.

Дані, що стосуються однієї умови дії фактора (однієї градації), називають дисперсійним комплексом. При проведенні дисперсійного аналізу має дотримуватися рівність дисперсій між комплексами. При цьому вибір елементів має здійснюватися випадковим чином.

У другому випадку, коли вибіркові сукупності мають довільні розподіли, використовуються непараметричні (рангові) аналоги дисперсійного однофакторного аналізу (критерії Крускала - Уолліса, Фрідмана).

Розглянемо графічну ілюстрацію залежності ставки прибутковості акцій від стану справ економіки країни (рис. 1, а). Тут досліджуваним фактором є рівень стану економіки (точніше, три рівні її стану), а результативною ознакою – ставка доходності. Наведене розподіл показує, що це чинник істотно впливає дохідність, тобто. з поліпшенням справ економіки зростає і дохідність акцій, що суперечить здоровому глузду.

Зауважимо, обраний чинник має градації, тобто. його величина змінювалася під час переходу від однієї градації до іншої (від одного стану економіки до іншого).

Рис. 1. Співвідношення вплив фактора та внутрішньогрупового розкиду: а-суттєвий вплив фактора; б - незначний вплив фактора

Група градацій фактора є лише окремим випадком, крім того, фактор може мати градації, представлені навіть у номінальній шкалі. Тому частіше говорять не про градації фактора, а про різні умови його дії.

Розглянемо тепер ідею дисперсійного аналізу, в основі якої лежить правило складання дисперсій: загальна дисперсія дорівнює сумі міжгрупової та середньої із внутрішньогрупових дисперсій:

Загальна дисперсія, що виникає під впливом усіх факторів

міжгрупова дисперсія, обумовлена ​​впливом всіх інших факторів;

Середня внутрішньогрупова дисперсія, спричинена впливом групувальної ознаки.

Вплив групованої ознаки добре видно на рис.1 а, так як вплив фактора істотно в порівнянні з внутрішньогруповим розкидом, отже, міжгрупова дисперсія буде більшою за внутрішньогрупову ( > ), але в рис. 1 б спостерігається зворотна картина: тут переважає внутрішньогруповий розкид і практично відсутня вплив фактора.

На цьому принципі побудований і дисперсійний аналіз, тільки в ньому використовуються не дисперсії, а середні квадратів відхилень ( , , ), що є незміщеними оцінками відповідних дисперсій. Їх одержують розподілом сум квадратів відхилень на відповідну кількість ступенів свободи

сукупності загалом;

Внутрішньогрупові середні;

Міжгрупові середні;

Загальна середня за всіма вимірами (за всіма групами);

Групова середня для j-ї градації фактора.

Математичні очікування відповідно для внутрішньогрупової та міжгрупової суми квадратів відхилень обчислюються за формулами: (Модь з фіксованим фактором),

.

Е ( ) = Е ( ) = , то нульова гіпотеза H0 про відсутність відмінностей між середніми підтверджується, отже, досліджуваний фактор не істотно впливає (див. рис. 1, б). Якщо фактичне значення F-критерію Фішера F = Е ( ) /Е ( ) виявиться більше критичного то нульова гіпотеза H0 за рівня значимості , відкидається і приймається альтернативна гіпотеза H1 - про суттєвий вплив фактора рис. 1, а. .

Однофакторний дисперсійний аналіз

Дисперсійний аналіз, який розглядає лише одну змінну, називається однофакторним дисперсійним аналізом (One-Way ANOVA).

Є група з п об'єктів спостереження з виміряними значеннями деякої досліджуваної змінної . На змінну впливає певний якісний фактор з кількома рівнями (градаціями) дії. Виміряні значення змінної при різних рівнях фактора наведено у таблиці 2 (вони також можуть бути представлені в матричному вигляді).

Таблиця 2.

Таблична форма завдання вихідних даних для однофакторного аналізу

Номер об'єкта спостереження ()Значення змінної при рівні (градації) фактора (найнижчий) (низький)… (найвищий)1 2 … n .Тут кожен рівень може містити різну кількість відгуків, виміряних за одного рівня фактора, тоді кожному стовпцю буде відповідати своє значення . Потрібно оцінити значущість впливу даного фактора на змінну, що досліджується. Для розв'язання цього завдання можна використовувати однофакторна модель дисперсійного аналізу. Однофакторна дисперсійна модель.

Значення досліджуваної зміною для об'єкта спостереження при -му рівні фактора;

Групова середня для - го рівня фактора;

Ефект, обумовлений впливом рівня фактора;

Випадкова компонента або обурення, викликане впливом неконтрольованих факторів. Отже виділимо основні обмеження використання дисперсійного аналізу:

Рівність нулю математичного очікування випадкової компоненти: = 0.

Випадковий компонент , а отже, і мають нормальний закон розподілу.

Число градацій факторів має бути не менше трьох.

Ця модель в залежності від рівнів фактора за допомогою F-критерію Фішера дозволяє перевірити одну з нульових гіпотез.

При виконанні дисперсійного аналізу для пов'язаних вибірок можлива перевірка ще однієї нульової гіпотези H0(і) - індивідуальні відмінності між об'єктами спостереження виражені не більше ніж відмінності, зумовлені випадковими причинами.

Однофакторний дисперсійний аналіз

(Практична реалізація в IBM SPSS Statistics 20)

Дослідника цікавить питання, як змінюється певна ознака у різних умовах дії змінної (чинника). Вивчається дія лише однієї змінної (чинника) на досліджувану ознаку. Ми вже розглянули приклад з економіки тепер наведемо приклад із психології наприклад, як змінюється час вирішення завдання за різних умов мотивації випробуваних (низькою, середньою, високою мотивацією) або за різних способів пред'явлення задачі (усно, письмово або у вигляді тексту з графіками та ілюстраціями) , у різних умовах роботи із завданням (наодинці, у кімнаті з викладачем, у класі). У першому випадку фактором є мотивація, у другому – ступінь наочності, у третьому – фактор публічності.

У цьому варіанті способу впливу кожної з градацій піддаються різні вибірки піддослідних. Градацій фактора має бути не менше трьох.

Приклад 1. Три різні групи із шести піддослідних отримали списки з десяти слів. Першій групі слова пред'являлися з низькою швидкістю -1 слово в 5 секунд, другий групі із середньою швидкістю - 1 слово в 2 секунди, і третій групі з великою швидкістю - 1 слово в секунду. Було передбачено, що відтворення залежатимуть від швидкості пред'явлення слів (табл. 3) .

Таблиця 3

Кількість відтворених слів

ВипробуваногоГрупа 1 низька швидкістьГрупа 2 середня швидкістьГрупа 3 висока швидкість187427853953454656626874суми433724середнє7,176,174,00

Сформулюємо гіпотези: відмінності в обсязі відтворення слів між групами є не більш вираженими, ніж випадкові відмінності всередині кожної групи.

Рішення проведемо в середовищі SPSS за таким алгоритмом

Запустимо програму SPSS

Введемо числові значення у вікні дані

Рис. 1. Введення значень у SPSS

У вікні Змінні опишемо всі вихідні дані, згідно з умовою

Завдання

Малюнок 2 Вікно змінне

Для наочності у графі мітка опишемо назву таблиць

В графі Значення опишемо номер кожної групи

Малюнок 3 Мітки значень

Усе це робиться наочності тобто. цими налаштуваннями можна знехтувати

В графі шкала , у другому стовпці потрібно поставити номінальне значення

У вікні дані замовимо однофакторний дисперсійний аналіз за допомогою меню «Аналіз» Порівняння середніх

Однофакторний дисперсійний аналіз.

Рисунок 4 Функція Однофакторний дисперсійний аналіз

У діалоговому вікні, що відкрилося. Однофакторний дисперсійний аналіз виділимо залежну змінну і внесемо її в список залежних , а змінну фактор у вікно фактор

Малюнок 5 виділення списку залежних та фактора

Налаштуємо деякі параметри для якісного виведення даних

Рисунок 6 Параметри для якісного виведення даних

Обчислення за вибраним алгоритмом однофакторного дисперсійного аналізу починається після клацання ОК

Після закінчення обчислень у вікні перегляду виводяться результати розрахунку

Описові статистикиГрупа СереднєСтд. ВідхиленняСтд. Помилка95% довірчий інтервал для середньогоМінімумМаксимумНижня межаВерхня межанизька швидкість67,171,472,6015,628,7159середня швидкість66,171,472,6014,627,7148висока швидкість744,244 Таблиця 2. Описові статистики

У таблиці Описові статистики наведено основні показники за швидкостями у групах та їх підсумкові значення

Кількість спостережень у кожній групі та сумарне

Середнє - середнє арифметичне спостережень у кожній групі та по всіх групах разом

Стд. Відхилення, Стд. Помилка - середнє квадратичне відхилення та стандартні відхилення

% довірчий інтервал для середнього - ці інтервали є найбільш точними для кожної групи та по всіх групах разом, ніж якщо взяти інтервали нижче або вище за ці межі.

Мінімум, Максимум - мінімальні та максимальні значення для кожної групи, які почули випробувані

однофакторний дисперсійний випадковий

Критерій однорідності дисперсій Статистика Лівіняст.св.1ст.св.2Знч.,089215,915

Критерій однорідності Лівін використовується для перевірки дисперсій на гомогенність (однорідність). У разі він підтверджує незначність відмінностей між дисперсіями, оскільки значення = 0.915 тобто більше 0.05. Тому результати, отримані за допомогою дисперсійного аналізу, визнаються коректними.

У таблиці однофакторний дисперсійний аналіз наведено результати однофакторного ТАК

Сума квадратів «між групами» є сумою квадратів різниць між загальним середнім значенням і середніми значеннями в кожній групі з урахуванням вагових коефіцієнтів, рівних кількості об'єктів у групі

«Всередині груп» є сумою квадратів різниць середнього значення кожної групи та кожного значення цієї групи

Стовпець «ст.св.» містить число ступенів свободи V:

Міжгрупове (v = число груп - 1);

Внутрішньогрупове (v = число об'єктів - число груп - 1);

«Середній квадрат» містить відношення суми квадратів до ступенів свободи.

У стовпці "F" наведено відношення середнього квадрата між групами до середнього квадрата всередині груп.

У стовпці «ЗНЧ» міститься значення ймовірності того, що спостерігаються відмінності випадкові

Таблиця 4 Формули

Графіки середніх

За графіком видно, що він зменшується. Також можна визначити по таблиці Fк k1=2, k2=15 табличне значення статистики дорівнює 3,68. За правилом якщо , то нульова гіпотеза приймається, інакше приймається альтернативна гіпотеза. Для нашого прикладу (7.45>3.68), отже приймається альтернативна гіпотеза. Таким чином повертаючись до умови завдання, можна зробити висновок нульова гіпотеза відхиляється та приймається альтернативна : відмінності обсягом відтворення слів між групами є більш вираженими, ніж випадкові відмінності всередині кожної групи ). Т.о. швидкість пред'явлення слів впливає обсяг їх відтворення.

Однофакторний дисперсійний аналіз

(Практична реалізація у Microsoft Office 2013)

На цьому прикладі розглянемо однофакторний дисперсійний аналіз у Microsoft Office 2013

Вирішення задачі в Microsoft Excel

Відкриємо Microsoft Excel.


Рисунок 1. Запис даних у Excel

Перетворимо дані на числовий формат. Для цього на вкладці головне є пункт Формат а в ньому є підпункт Формат осередку . На екрані з'явиться вікно Формат осередків. Рис. 2 Виберемо Числовий формат, і введені дані перетворюються. Як показано на Рис.3

Рисунок 2 Перетворимо на числовий формат

Малюнок 3 Результат після перетворення

На вкладці дані є пункт аналіз даних клацнемо по ньому.

Виберемо однофакторний дисперсійний аналіз

Рисунок 6 Аналіз даних

На екрані з'явиться вікно Однофакторний дисперсійний аналіз проведення дисперсійного аналізу даних (Рис.7). Зробимо налаштування параметрів

Рис. 7 Налаштування параметрів для однофакторного аналізу

Клацніть мишею в полі Вхідний інтервал. Виділимо діапазон осередків B2::F9, дані в якому потрібно проаналізувати. У полі Вхідний інтервал групи елементів керування Вхідні дані з'явиться вказаний діапазон.

Якщо в групі елементів керування Вхідні дані не встановлено перемикач рядків, то встановіть його, щоб програма Ехcel сприймала групи даних рядків.

Якщо потрібно Встановіть прапорець Мітки в першому рядку групи елементів керування Вхідні дані, якщо перший стовпець виділеного діапазону даних містить назви рядків.

У полі введення Альфа групи елементів керування Вхідні дані за умовчанням відображається величина 0,05, яка пов'язана з ймовірністю виникнення помилки дисперсійного аналізу.

Якщо в групі елементів керування Параметри виведення не встановлено перемикач вихідний інтервал, то встановимо його або виберемо перемикач новий робочий лист, щоб дані були перенесені на новий лист.

Натисніть кнопку ОК, щоб закрити вікно Однофакторний дисперсійний аналіз. З'являться результати дисперсійного аналізу (рис.8).

Малюнок 8 Виведення даних

У діапазоні осередків А4:Е7 розташовані результати описової статистики. У рядку 4 знаходяться назви параметрів, у рядках 5 - 7 - статистичні значення, обчислені за партіями. У стовпці «Рахунок» розташовані кількості вимірювань, у стовпці «Сума» – суми величин, у стовпці «Середнє» – середні арифметичні значення, у стовпці «Дисперсія» – дисперсії.

Отримані результати показують, що найбільше середнє розривне навантаження партії №1, а найбільша дисперсія розривного навантаження -партії №2, №1.

У діапазоні осередків А10:G15 відображається інформація, що стосується суттєвості розбіжностей між групами даних. У рядку 11 знаходяться назви параметрів дисперсійного аналізу, у рядку 12 – результати міжгрупової обробки, у рядку 13 – результати внутрішньогрупової обробки, а у рядку 15 – суми значень цих двох рядків.

У шпальті SS розташовані величини варіювання, тобто. суми квадратів за всіма відхиленнями. Варіювання, як і дисперсія, характеризує розкид даних.

У стовпці df є значення чисел ступенів свободи. Дані числа вказують на кількість незалежних відхилень, за якими обчислюватиметься дисперсія. Наприклад, міжгрупове число ступенів свободи дорівнює різниці кількості груп даних та одиниці. Чим більше числостепенів свободи, тим вища надійність дисперсійних параметрів. Дані ступенів свобод у таблиці показують, що для внутрішньогрупових результатів надійність вища, ніж міжгрупових параметрів.

У стовпці MS розташовані величини дисперсії, що визначаються ставленням варіювання та числа ступенів свобод. Дисперсія характеризує ступінь розкиду даних, але на відміну величини варіювання, немає прямої тенденції збільшуватися зі зростанням числа ступенів свобод. З таблиці видно, що міжгрупова дисперсія значно більша за внутрішньогрупову дисперсію.

У стовпці F знаходиться значення F-статистики, що обчислюється відношенням міжгрупової та внутрішньогрупової дисперсій.

У стовпці F критичне розташоване F-критичне значення, що розраховується за ступенем свободи та величиною Альфа. F-статистика та F-критичне значення використовують критерій Фішера-Снедекору.

Якщо F-статистика більша за F-критичне значення, то можна стверджувати, що відмінності між групами даних носять невипадковий характер. тобто. на рівні значимості α = 0 ,05 (з надійністю 0,95) нульова гіпотеза відкидається і приймається альтернативна: швидкість пред'явлення слів впливає обсяг їх відтворення. У стовпці Р-значення є значення ймовірності того, що розбіжність між групами випадкова. Так як у таблиці дана можливість дуже мала, то відхилення між групами носить невипадковий характер.

Порівняння IBM SPSS Statistics 20 та Microsoft Office 2013

однофакторний дисперсійний випадковий програма

Подивімося на висновки програм, для цього поглянемо ще раз на скріншоти.

Однофакторний дисперсійний аналіз Сума квадратівст.св.Середній квадратFЗнч.Між групами31,444215,7227,447,006Всередині груп31,667152,111Разом63,11117

Таким чином програма IBM SPSS Statistics 20 краще здійснює рахунок, може округляти числа, будувати наочний графік(Див. повне рішення) яким можна визначити відповідь, у ній докладніше описані, як умови завдання, і їх вирішення. У Microsoft Office 2013 є свої плюси, по-перше це, звичайно, його поширеність оскільки Microsoft Office 2013 встановлений майже в кожному комп'ютері, він виводить Fкритичне, що не передбачено в SPSS Statistics, а також там теж просто і зручно вважати. Все-таки обидві ці програми дуже добре підходять для вирішення завдань на однофакторний дисперсійний аналіз, кожна з них має свої плюси та мінуси, але якщо рахувати великі завданняз більшими умовами рекомендував би SPSS Statistics.

Висновок

Дисперсійний аналіз застосовується у всіх областях наукових дослідженьде необхідно проаналізувати вплив різних факторівна досліджувану змінну. У сучасному світіІснує безліч завдань на однофакторний дисперсійний аналіз як в економіці, психології, біології. В результаті вивчення теоретичного матеріалубуло встановлено, що основою дисперсійного аналізу є теорема про складання дисперсій, з безлічі пакетів прикладних програм, в яких реалізовано апарат дисперсійного аналізу, підібрані найкращі та включені в роботу. Завдяки появі нових технологій кожен з нас може проводити дослідження (рішення), витрачаючи при цьому менше часу та зусиль на обчислення за допомогою ЕОМ. У процесі роботи було поставлено цілі, завдання, яких було досягнуто.

писок літератури

Сидоренко, Є.В. Методи математичної обробкиу психології [Текст]/СПб. 2011. – 256 с.

Математична статистика для психологів Єрмолаєв О.Ю [Текст] / Москва_2009 -336с

Лекція 7. Аналітична статистика [ Електронний ресурс]. , Дата доступу: 14.05.14

Теорія ймовірностей та математична статистика [Текст] / Гмурман В.Є 2010 -479с