Біографії Характеристики Аналіз

Оцінка рівняння регресії. Оцінка значущості рівняння множинної регресії

Для оцінки суттєвості, важливості коефіцієнта кореляції використовується t-критерій Стьюдента.

Знаходиться середня помилка коефіцієнта кореляції за такою формулою:

Н
а основі помилки розраховується t-критерій:

Розраховане значення t-критерію порівнюють з табличним, знайденим у таблиці розподілу Стьюдента при рівні значущості 0,05 або 0,01 та числі ступенів свободи n-1. Якщо розрахункове значення t-критерію більше табличного, то коефіцієнт кореляції визнається значним.

При криволінійному зв'язку з метою оцінки значущості кореляційного відношення та рівняння регресії застосовується F-критерій. Він обчислюється за такою формулою:

або

де - кореляційне відношення; n – кількість спостережень; m – кількість параметрів у рівнянні регресії.

Розраховане значення F порівнюється з табличним для прийнятого рівня значущості (0,05 або 0,01) і чисел ступенів свободи до 1 =m-1 і k 2 =n-m. Якщо розрахункове значення F перевищує табличне, зв'язок визнається суттєвим.

Значимість коефіцієнта регресії встановлюється за допомогою t-критерію Стьюдента, який обчислюється за такою формулою:

де ? 2 а i - Дисперсія коефіцієнта регресії.

Вона обчислюється за такою формулою:

де до - Число факторних ознак в рівнянні регресії.

Коефіцієнт регресії визнається значущим, якщо t a 1 t кр. t кр перебуває у таблиці критичних точок розподілу Стьюдента при прийнятому рівні значимості та числі ступенів свободи k=n-1.

4.3.Кореляційно-регресійний аналіз в Excel

Проведемо кореляційно-регресійний аналіз взаємозв'язку врожайності та витрат праці на 1 ц зерна. Для цього відкриваємо лист Excel, в комірки А1: А30 вводимо значення факторної ознаки врожайності зернових культур, у комірки В1: В30 значення результативної ознаки - витрат праці на 1 ц зерна. У меню Сервіс оберемо опцію Аналіз даних. Натиснувши лівою кнопкою миші по цьому пункту, відкриємо інструмент Регресія. Клацаємо по кнопці OK, на екрані з'являється діалогове вікно Регресія. У полі Вхідний інтервал У вводимо значення результативної ознаки (виділяючи комірки В1: В30), у полі Вхідний інтервал Х вводимо значення факторної ознаки (виділяючи комірки А1: А30). Зазначаємо рівень ймовірності 95%, вибираємо Новий робочий лист. Клацаємо по кнопці OK. На робочому аркуші з'являється таблиця «ВИСНОВОК ПІДСУМКІВ», в якій дано результати обчислення параметрів рівняння регресії, коефіцієнта кореляції та інші показники, що дозволяють визначити значущість коефіцієнта кореляції та параметрів рівняння регресії.

ВИСНОВОК ПІДСУМКІВ

Регресійна статистика

Множинний R

R-квадрат

Нормований R-квадрат

Стандартна помилка

Спостереження

Дисперсійний аналіз

Значення F

Регресія

Коефіцієнти

Стандартна помилка

t-статистика

P-Значення

Нижні 95%

Верхні 95%

Нижні 95,0%

Верхні 95,0%

Y-перетин

Змінна X 1

У цій таблиці «Множинний R» - це коефіцієнт кореляції, «R-квадрат» - коефіцієнт детермінації. "Коефіцієнти: Y-перетин" - вільний член рівняння регресії 2,836242; "Змінна Х1" - коефіцієнт регресії -0,06654. Тут є значення F-критерію Фішера 74,9876, t-критерію Стьюдента 14,18042, « Стандартна помилка 0,112121», які необхідні для оцінки значущості коефіцієнта кореляції, параметрів рівняння регресії та всього рівняння.

За підсумками даних таблиці побудуємо рівняння регресії: у x =2,836-0,067х. Коефіцієнт регресії а 1 =-0,067 означає, що з підвищенням урожайності зернових на 1 ц/га витрати на 1 ц зерна зменшуються на 0,067 чол.-ч.

Коефіцієнт кореляції r=0,85>0,7, отже, зв'язок між ознаками, що вивчаються, в даній сукупності тісний. p align="justify"> Коефіцієнт детермінації r 2 = 0,73 показує, що 73% варіації результативної ознаки (витрат праці на 1 ц зерна) викликано дією факторної ознаки (урожайності зернових).

В таблиці критичних точокрозподілу Фішера - Снедекора знайдемо критичне значення F-критерію при рівні значимості 0,05 і числі ступенів свободи до 1 = m-1 = 2-1 = 1 і k 2 = n-m = 30-2 = 28, воно дорівнює 4,21. Оскільки розраховане значення критерію більше табличного (F=74.9896>4,21), рівняння регресії визнається значним.

Для оцінки значущості коефіцієнта кореляції розрахуємо t-критерій Стьюдента:

У
таблиці критичних точок розподілу Стьюдента знайдемо критичне значення t-критерію при рівні значущості 0,05 та числі ступенів свободи n-1 = 30-1 = 29, воно дорівнює 2,0452. Оскільки розрахункове значення більше табличного, то коефіцієнт кореляції є значним.

Після того, як знайдено рівняння лінійної регресії, проводиться оцінка значущості як рівняння загалом, і окремих його параметрів.

Перевірити значущість рівняння регресії - означає встановити, чи відповідає математична модель, що виражає залежність між змінними, експериментальними даними і чи достатньо включених до рівняння пояснюючих змінних (однієї або декількох) для опису залежної змінної.

Перевірка значущості проводиться на основі дисперсійного аналізу.

Відповідно до ідеї дисперсійного аналізу, Загальна сумаквадратів відхилень (СКО) y від середнього значення розкладається на дві частини - пояснену та непояснену:

або, відповідно:

Тут можливі два крайні випадки: коли загальна СКО точно дорівнює залишкової і коли загальна СКО дорівнює факторной.

У першому випадку фактор х не впливає на результат, вся дисперсія y обумовлена ​​впливом інших факторів, лінія регресії паралельна осі Ох і рівняння має мати вигляд.

У другому випадку інші фактори не впливають на результат, пов'язаний з x функціонально, і залишкова СКО дорівнює нулю.

Однак на практиці у правій частині присутні обидва доданки. Придатність лінії регресії для прогнозу залежить від того, яка частина загальної варіації y посідає пояснену варіацію. Якщо пояснена СКО буде більше залишкової СКО, то рівняння регресії статистично значуще і фактор х істотно впливає на результат y. Це рівнозначно тому, що коефіцієнт детермінації наближатиметься до одиниці.

Число ступенів свободи (df-degrees of freedom) - це число незалежно значень ознаки, що варіюються.

Для загальної СКО потрібно (n-1) незалежних відхилень,

Факторна СКО має один ступінь свободи, та

Таким чином, можемо записати:

На цьому балансу визначаємо, що = n-2.

Розділивши кожну СКО на свою кількість ступенів свободи, отримаємо середній квадратвідхилень, або дисперсію на один ступінь свободи: - загальна дисперсія, - Факторна, - Залишкова.

Аналіз статистичної значимостікоефіцієнтів лінійної регресії

Хоча теоретичні значення коефіцієнтів рівняння лінійної залежності передбачаються постійними величинами, оцінки а та b цих коефіцієнтів, одержувані в ході побудови рівняння за даними випадкової вибірки, є випадковими величинами. Якщо помилки регресії мають нормальний розподіл, то оцінки коефіцієнтів також розподілені нормально і можуть характеризуватись своїми середніми значеннями та дисперсією. Тому аналіз коефіцієнтів починається з розрахунку цих показників.

Дисперсії коефіцієнтів розраховуються за формулами:

Дисперсія коефіцієнта регресії:

де - залишкова дисперсіяоднією ступінь свободи.

Дисперсія параметра:

Звідси стандартна помилка коефіцієнта регресії визначається за такою формулою:

Стандартна помилка параметра визначається за такою формулою:

Вони служать для перевірки нульових гіпотез у тому, що справжнє значення коефіцієнта регресії b чи вільного члена a дорівнює нулю: .

Альтернативна гіпотеза має вигляд: .

t – статистики мають t – розподіл Стьюдента зі ступенями свободи. За таблицями розподілу Стьюдента при певному рівні значущості б і степенях свободи знаходять критичне значення.

Якщо, то нульова гіпотеза має бути відхилена, коефіцієнти вважаються статистично значущими.

Якщо, то нульова гіпотеза може бути відхилена. (У випадку, якщо коефіцієнт b статистично незначний, рівняння повинно мати вигляд, і це означає, що зв'язок між ознаками відсутній. У випадку, якщо коефіцієнт а статистично незначний, рекомендується оцінити нове рівняння у вигляді).

Інтервальні оцінки коефіцієнтів лінійного рівняннярегресії:

Довірчий інтервал дляа: .

Довірчий інтервал для b:

Це означає, що із заданою надійністю (де - рівень значущості) справжні значенняа, b перебувають у зазначених інтервалах.

Коефіцієнт регресії має чітку економічну інтерпретацію, тому довірчі межі інтервалу не повинні містити суперечливих результатів, наприклад, вони не повинні включати нуль.

Аналіз статистичної значущості рівняння загалом.

Розподіл Фішера у регресійному аналізі

Оцінка значущості рівняння регресії загалом дається з допомогою F- критерію Фішера. У цьому висувається нульова гіпотеза у тому, що це коефіцієнти регресії, крім вільного члена а, рівні нулю і, отже, чинник х впливає результат y (чи).

Розмір F - критерію пов'язані з коефіцієнтом детермінації. В разі множинної регресії:

де m – число незалежних змінних.

В разі парної регресіїформула F - статистики набуває вигляду:

При знаходженні табличного значення F-критерію визначається рівень значущості (зазвичай 0,05 або 0,01) і два ступені свободи: - у разі множинної регресії, - для парної регресії.

Якщо, то відхиляється і робиться висновок про суттєвість статистичного зв'язку між y та x.

Якщо, то ймовірність рівняння регресії вважається статистично незначним, не відхиляється.

Зауваження. У парній лінійній регресії. Крім того, тому. Таким чином, перевірка гіпотез про значущість коефіцієнтів регресії та кореляції рівносильна перевірці гіпотези про суттєвість лінійного рівняння регресії.

Розподіл Фішера може бути використаний не тільки для перевірки гіпотези про одночасну рівність нуля всіх коефіцієнтів лінійної регресії, але й гіпотези про рівність нуля частини цих коефіцієнтів. Це важливо при розвитку лінійної регресійної моделі, оскільки дозволяє оцінити обгрунтованість виключення окремих змінних чи його груп із пояснюючих змінних, чи, навпаки, включення в це число.

Нехай, наприклад, спочатку була оцінена множинна лінійна регресія за п спостереженнями з пояснювальними змінними, і коефіцієнт детермінації дорівнює, потім останні k змінних виключені з числа пояснюючих, і за тими ж даними оцінено рівняння, для якого коефіцієнт детермінації дорівнює (, т.к кожна додаткова змінна пояснює частину, нехай невелику, варіації залежної змінної).

Для того щоб перевірити гіпотезу про одночасну рівність нулю всіх коефіцієнтів при виключених змінних, розраховується величина

має розподіл Фішера зі ступенями свободи.

По таблицях розподілу Фішера, за заданого рівня значущості, знаходять. І якщо, то нульова гіпотеза відкидається. У разі виключати все k змінних з рівняння некоректно.

Аналогічні міркування можуть бути проведені і з приводу обґрунтованості включення до рівняння регресії однієї або кількох нових пояснюючих змінних.

У цьому випадку розраховується F - статистика

має розподіл. І якщо вона перевищує критичний рівень, то включення нових змінних пояснює суттєву частину непоясненої раніше дисперсії залежної змінної (тобто включення нових змінних, що пояснюють, виправдано).

Зауваження. 1. Включати нові змінні доцільно за однією.

2. Для розрахунку F - статистики під час розгляду питання включення пояснюючих змінних рівняння бажано розглядати коефіцієнт детермінації з поправкою на кількість ступенів свободи.

F - статистика Фішера використовується також для перевірки гіпотези про збіг рівнянь регресії для окремих групспостережень.

Нехай є дві вибірки, що містять, відповідно, спостережень. Для кожної із цих вибірок оцінено рівняння регресії виду. Нехай СКО від лінії регресії (тобто) рівні їм, відповідно, .

Перевіряється нульова гіпотеза: у тому, що це відповідні коефіцієнти цих рівнянь рівні одне одному, тобто. рівняння регресії цих вибірок одне й те саме.

Нехай оцінено рівняння регресії тієї самої виду одночасно всім спостережень, і СКО.

Тоді розраховується F - статистика за такою формулою:

Вона має розподіл Фішера зі ступенями свободи. F - статистика буде близькою до нуля, якщо рівняння обох вибірок однаково, т.к. в цьому випадку. Тобто. якщо, то нульова гіпотеза приймається.

Якщо ж, то нульова гіпотеза відкидається, і єдине рівняння регресії збудувати не можна.

Після того як рівняння регресії побудовано та за допомогою коефіцієнта детермінації оцінено його точність, залишається відкритим питанняза рахунок чого досягнуто цієї точності і відповідно чи можна цьому рівнянню довіряти. Справа в тому, що рівняння регресії будувалося не за генеральної сукупності, яка невідома, а щодо вибірки з неї. Крапки з генеральної сукупності потрапляють у вибірку випадковим чином, тому відповідно до теорії ймовірності серед інших випадків можливий варіант, коли вибірка з “широкої” генеральної сукупності виявиться “вузькою” (рис. 15).

Рис. 15. Можливий варіантвлучення точок у вибірку з генеральної сукупності.

В цьому випадку:

а) рівняння регресії, побудоване на вибірку, може значно відрізнятися від рівняння регресії для генеральної сукупності, що призведе до помилок прогнозу;

б) коефіцієнт детермінації та інші характеристики точності виявляться невиправдано високими і вводитимуть в оману про прогнозні якості рівняння.

У граничному випадку не виключений варіант, коли з генеральної сукупності хмара з головною віссю паралельної горизонтальної осі (відсутня зв'язок між змінними) за рахунок випадкового відбору буде отримана вибірка, головна вісь якої виявиться нахиленою до осі. Таким чином, спроби прогнозувати чергові значення генеральної сукупності спираючись на дані вибірки з неї загрожують не тільки помилками в оцінці сили та напряму зв'язку між залежною та незалежною змінними, але й небезпекою знайти зв'язок між змінними там, де насправді її немає.

В умовах відсутності інформації про всі точки генеральної сукупності єдиний спосібЗменшити помилки в першому випадку полягає у використанні при оцінці коефіцієнтів рівняння регресії методу, що забезпечує їх незміщеність та ефективність. А ймовірність настання другого випадку може бути значно знижена завдяки тому, що апріорі відома одна властивість генеральної сукупності з двома незалежними один від одного змінними – в ній відсутня саме цей зв'язок. Досягається це зниження з допомогою перевірки статистичної значимості отриманого рівняння регресії.

Один з варіантів перевірки, що найчастіше використовуються, полягає в наступному. Для отриманого рівняння регресії визначається -статистика - характеристика точності рівняння регресії, що є відношенням тієї частини дисперсії залежною змінною яка пояснена рівнянням регресії до непоясненої (залишкової) частини дисперсії. Рівняння для визначення статистики у разі багатовимірної регресії має вигляд:

де: - Пояснена дисперсія - частина дисперсії залежною змінною Y яка пояснена рівнянням регресії;

Залишкова дисперсія - частина дисперсії залежною змінною Y яка не пояснена рівнянням регресії, її наявність є наслідком дії випадкової складової;

Число точок у вибірці;

Число змінних у рівнянні регресії.

Як видно з наведеної формули, дисперсії визначаються як окреме від поділу відповідної суми квадратів на число ступенів свободи. Число ступенів свободи це мінімально необхідне число значень залежної змінної, яких достатньо для отримання шуканої характеристики вибірки і які можуть вільно змінюватись з урахуванням того, що для цієї вибірки відомі всі інші величини, що використовуються для розрахунку потрібної характеристики.

Для отримання залишкової дисперсії потрібні коефіцієнти рівняння регресії. У разі парної лінійної регресії коефіцієнтів два, тому відповідно до формули (беручи ) число ступенів свободи дорівнює . Мається на увазі, що для визначення залишкової дисперсії достатньо знати коефіцієнти рівняння регресії і лише значень залежної змінної вибірки. Два значення, що залишилися, можуть бути обчислені на підставі цих даних, а значить, не є вільно варіюються.

Для обчислення поясненої дисперсії значень залежної змінної взагалі не потрібні, оскільки її можна обчислити, знаючи коефіцієнти регресії при незалежних змінних та дисперсію незалежної змінної. Для того щоб переконатися в цьому, достатньо згадати вираз, що наводився раніше. . Тому число ступенів свободи для залишкової дисперсії дорівнює числу незалежних змінних у рівнянні регресії (для парної лінійної регресії).

В результаті критерій для рівняння парної лінійної регресії визначається за формулою:

.

Теоретично ймовірності доведено, що критерій рівняння регресії, отриманого для вибірки з генеральної сукупності, у якої відсутній зв'язок між залежною і незалежною змінною має розподіл Фішера, досить добре вивчений. Завдяки цьому для будь-якого значення критерію можна розрахувати ймовірність його появи і навпаки, визначити те значення критерію яке він не зможе перевищити із заданою ймовірністю.

Для здійснення статистичної перевіркиЗначення рівняння регресії формулюється нульова гіпотеза про відсутність зв'язку між змінними (всі коефіцієнти при змінних дорівнюють нулю) і вибирається рівень значущості .

Рівень значущості – це припустима ймовірність припуститися помилки першого роду – відкинути в результаті перевірки вірну нульову гіпотезу. У даному випадку зробити помилку першого роду означає визнати за вибіркою наявність зв'язку між змінними в генеральній сукупності, коли насправді її там немає.

Зазвичай рівень значущості приймається рівним 5% чи 1%. Що рівень значимості (що менше ), то вище рівень надійності тесту, рівний , тобто. Тим більше шанс уникнути помилки визнання щодо вибірки наявності зв'язку у генеральної сукупності насправді незв'язаних між собою змінних. Але зі зростанням рівня значущості зростає небезпека скоєння помилки другого роду – відкинути правильну нульову гіпотезу, тобто. не помітити за вибіркою наявний насправді зв'язок змінних у генеральній сукупності. Тому залежно від того, яка помилка має великі негативні наслідки, Вибирають той чи інший рівень значущості.

Для обраного рівня значущості за розподілом Фішера визначається табличне значення ймовірність перевищення, якого у вибірці потужністю, отриманої з генеральної сукупності без зв'язку між змінними, не перевищує рівня значущості. порівнюється з фактичним значенням критерію для регресійного рівняння.

Якщо виконується умова, то помилкове виявлення зв'язку зі значенням -критерію рівним або більшим за вибіркою з генеральної сукупності з незв'язаними між собою змінними відбуватиметься з ймовірністю меншою за рівень значущості. Відповідно до правила “дуже рідкісних подійне буває”, приходимо до висновку, що встановлений за вибіркою зв'язок між змінними є і в генеральній сукупності, з якої вона отримана.

Якщо виявляється , то рівняння регресії статистично не значимо. Іншими словами існує реальна ймовірність того, що за вибіркою встановлено не існує в реальності зв'язок між змінними. До рівняння, що не витримало перевірку на статистичну значущість, ставляться так само, як і до ліків з терміном, що минув термін придатності.

Ті – такі ліки не обов'язково зіпсовані, але якщо немає впевненості у їхній якості, то їх вважають за краще не використовувати. Це правило не вберігає від усіх помилок, але дозволяє уникнути найбільш грубих, що також досить важливо.

Другий варіант перевірки, зручніший у разі використання електронних таблиць, це зіставлення ймовірності появи отриманого значення -критерію з рівнем значущості. Якщо ця можливість виявляється нижче рівня значимості , отже рівняння статистично значуще, інакше немає.

Після того, як виконано перевірку статистичної значущості регресійного рівняння в цілому корисно, особливо для багатовимірних залежностей здійснити перевірку на статистичну значущість отриманих коефіцієнтів регресії. Ідеологія перевірки така ж як і при перевірці рівняння в цілому але як критерій використовується - критерій Стьюдента, що визначається за формулами:

і

де: - значення критерію Стьюдента для коефіцієнтів і відповідно;

- Залишкова дисперсія рівняння регресії;

Число точок у вибірці;

Число змінних у вибірці, для парної лінійної регресії.

Отримані фактичні значення критерію Стьюдента порівнюються з табличними значеннями отриманими з розподілу Стьюдента. Якщо виявляється, що , то відповідний коефіцієнт статистично значущий, інакше немає. Другий варіант перевірки статистичної значущості коефіцієнтів - визначити ймовірність появи критерію Стьюдента і порівняти з рівнем значущості.

Для змінних, чиї коефіцієнти виявилися статистично не значущими, велика ймовірність того, що їх вплив на залежну змінну в генеральній сукупності взагалі відсутній. Тому або необхідно збільшити кількість точок у вибірці, тоді можливо коефіцієнт стане статистично значущим і заодно уточниться його значення, або як незалежні змінні знайти інші, більш тісно пов'язані з залежною змінною. Точність прогнозування у разі обох випадках зросте.

Як експресний метод оцінки значущості коефіцієнтів рівняння регресії можна застосовувати таке правило - якщо критерій Стьюдента більше 3, то такий коефіцієнт, як правило, виявляється статистично значущим. А взагалі вважається, що для отримання статистично значних рівняньрегресії необхідно, щоб виконувалася умова.

Стандартна помилка прогнозування щодо отриманого рівняння регресії невідомого значенняпри відомому оцінюють за формулою:

Таким чином, прогноз з довірчою ймовірністю 68% може бути представлений у вигляді:

Якщо потрібна інша довірча ймовірність, то рівня значимості необхідно визначити критерій Стьюдента і довірчий інтервалдля прогнозу з рівнем надійності дорівнюватиме .

Прогнозування багатовимірних та нелінійних залежностей

Якщо прогнозована величина залежить від кількох незалежних змінних, то цьому випадку є багатовимірна регресія виду:

де: - Коефіцієнти регресії, що описують вплив змінних на прогнозовану величину.

Методика визначення коефіцієнтів регресії не відрізняється від парної лінійної регресії, особливо під час використання електронної таблицітому що там застосовується одна і та ж функція і для парної і для багатовимірної лінійної регресії. У цьому бажано щоб між незалежними змінними були відсутні взаємозв'язки, тобто. зміна однієї змінної не позначалося на значення інших змінних. Але ця вимога не є обов'язковою, важливо щоб між змінними були відсутні функціональні лінійні залежності. Описані вище процедури перевірки статистичної значущості отриманого рівняння регресії та її окремих коефіцієнтів, оцінка точності прогнозування залишається як і для випадку парної лінійної регресії. У той же час застосування багатомірних регресій замість парної зазвичай дозволяє при належному виборі змінних суттєво підвищити точність опису поведінки залежної змінної, а отже, і точність прогнозування.

Крім цього, рівняння багатовимірної лінійної регресії дозволяють описати і нелінійну залежність прогнозованої величини від незалежних змінних. Процедура наведення нелінійного рівняннядо лінійного виглядуназивається лінеаризацією. Зокрема, якщо ця залежність описується поліномом ступеня відмінного від 1, то, здійснивши заміну змінних зі ступенями відмінними від одиниці на нові змінні в першому ступені, отримуємо завдання багатовимірної лінійної регресії замість нелінійної. Так, наприклад, якщо вплив незалежної змінної описується параболою виду

то заміна дозволяє перетворити нелінійне завдання до багатовимірного лінійного вигляду

Так само легко можуть бути перетворені нелінійні завданняу яких нелінійність виникає через те, що прогнозована величина залежить від твору незалежних змінних. Для обліку такого впливу необхідно запровадити нову змінну, що дорівнює цьому твору.

У тих випадках, коли нелінійність описується більш складними залежностями, Лінеаризація можлива за рахунок перетворення координат. Для цього розраховуються значення та будуються графіки залежності вихідних точок у різних комбінаціях перетворених змінних. Та комбінація перетворених координат або перетворених і не перетворених координат, в якій залежність найближче до прямої лінії підказує заміну змінних, яка призведе до перетворення нелінійної залежності до лінійного вигляду. Наприклад, нелінійна залежність виду

перетворюється на лінійну вигляду

Отримані коефіцієнти регресії для перетвореного рівняння залишаються незміщеними та ефективними, але перевірка статистичної значущості рівняння та коефіцієнтів неможлива

Перевірка обґрунтованості застосування методу найменших квадратів

Застосування методу найменших квадратів забезпечує ефективність та несмещенность оцінок коефіцієнтів рівняння регресії за дотримання наступних умов(Умов Гауса-Маркова):

3. значення не залежать один від одного

4. значення не залежать від незалежних змінних

Найбільш просто можна перевірити дотримання цих умов шляхом побудови графіків залишків залежно від , Потім від незалежної (незалежних) змінних. Якщо точки на цих графіках розташовані в коридорі розташованому симетрично осі абсцис і розташування точок не проглядаються закономірності, то умови Гауса-Маркова виконані і можливості підвищити точність рівняння регресії відсутні. Якщо це не так, то існує можливість суттєво підвищити точність рівняння і для цього необхідно звернутись до спеціальної літератури.

Підсумкові тести з економетрики

1. Оцінка значущості параметрів рівняння регресії складає основі:

А) t – критерію Стьюдента;

б) F-критерія Фішера - Снедекору;

в) середньої квадратичної помилки;

г) середньої помилки апроксимації.

2. Коефіцієнт регресії у рівнянні , що характеризує зв'язок між обсягом реалізованої продукції (млн. руб.) та прибутком підприємств автомобільної промисловості за рік (млн. руб.) означає, що при збільшенні обсягу реалізованої продукції на 1 млн. руб. прибуток збільшується на:

г) 0,5млн. руб.;

в) 500тис. руб.;

р) 1,5 млн. крб.

3. Кореляційне відношення (індекс кореляції) вимірює ступінь тісноти зв'язку між Х таY:

а) лише за нелінійної форми залежності;

Б) за будь-якої форми залежності;

в) лише за лінійної залежності.

4. У напрямку зв'язку бувають:

а) помірні;

Б) прямі;

в) прямолінійні.

5. За 17 спостереженнями побудовано рівняння регресії:
.
Для перевірки значущості рівняння обчисленоспостережуване значенняt- Статистики: 3.9. Висновок:

А) Рівняння значимо при a = 0,05;

б) Рівняння незначне за a = 0,01;

в) Рівняння незначне за a = 0,05.

6. Якими є наслідки порушення припущення МНК «математичне очікування регресійних залишківодно нулю»?

А) Зміщені оцінки коефіцієнтів регресії;

б) Ефективні, але неспроможні оцінки коефіцієнтів регресії;

в) неефективні оцінки коефіцієнтів регресії;

г) Неспроможні оцінки коефіцієнтів регресії.

7. Яке з таких тверджень правильне у разі гетероскедастичності залишків?

А) Висновки з t та F-статистиків є ненадійними;

г) Оцінки параметрів рівняння регресії є усунутими.

8. На чому ґрунтується тест рангової кореляціїСпірмена?

А) На використанні t – статистики;

в) На використанні ;

9. На чому базується тест Уайта?

б) На використанні F-статистики;

В) На використанні ;

г) На графічному аналізі залишків.

10. Яким способом можна скористатися для усунення автокореляції?

11. Як називається порушення припущення про сталість дисперсії залишків?

а) мультиколінеарність;

б) автокореляція;

В) Гетероскедастичність;

г) Гомоскедастичність.

12. Фіктивні змінні вводяться у:

а) лише у лінійні моделі;

б) лише у множинну нелінійну регресію;

в) тільки в нелінійні моделі;

Г) як у лінійні, так і в нелінійні моделі, що приводяться до лінійного вигляду.

13. Якщо у матриці парних коефіцієнтів кореляції зустрічаються
, то це свідчить:

А) Про наявність мультиколінеарності;

б) Про відсутність мультиколлінеарності;

в) Про наявність автокореляції;

г) Про відсутність гетероскедастичності.

14. За допомогою якого заходу неможливо позбутися мультиколінеарності?

а) збільшення обсягу вибірки;

Г) Перетворення випадкової складової.

15. Якщо
і ранг матриці А менший (К-1) то рівняння:

а) надіденцифіковано;

Б) неідентифіковано;

в) точно ідентифіковано.

16.Рівняння регресії має вигляд:

а)
;

б)
;

в)
.

17. У чому полягає проблема ідентифікації моделі?

А) одержання однозначно визначених параметрів моделі, заданої системою одночасних рівнянь;

б) вибір та реалізація методів статистичного оцінювання невідомих параметрів моделі за вихідними статистичними даними;

в) перевірка адекватності моделі.

18. Який метод застосовується для оцінювання параметрів надіденцифікованого рівняння?

В) ДМНК, КМНК;

19. Якщо якісна змінна маєkальтернативних значень, то при моделюванні використовуються:

А) (k-1) фіктивна змінна;

б) kфіктивних змінних;

в) (k+1) фіктивна змінна.

20. Аналіз тісноти та напрями зв'язків двох ознак здійснюється на основі:

а) парного коефіцієнта кореляції;

б) коефіцієнт детермінації;

в) множинного коефіцієнта кореляції.

21. У лінійному рівнянні x = а 0 +a 1 x коефіцієнт регресії показує:

а) тісноту зв'язку;

б) частку дисперсії "Y", залежну від "X";

В) на скільки в середньому зміниться "Y" за зміни "X" на одну одиницю;

г) помилку коефіцієнта кореляції.

22. Який показник використовується для визначення частини варіації, обумовленої зміною величини фактора, що вивчається?

а) коефіцієнт варіації;

б) коефіцієнт кореляції;

В) коефіцієнт детермінації;

г) коефіцієнт еластичності.

23. Коефіцієнт еластичності показує:

А) на скільки % зміниться значення y за зміни x на 1 %;

б) на скільки одиниць свого виміру зміниться значення y при зміні x на 1 %;

в) на скільки % зміниться значення y при зміні x на од. свого виміру.

24. Які методи можна застосувати для виявлення гетероскедастичності?

А) Тест Голфелда-Квандта;

Б) Тест рангової кореляції Спірмена;

в) Тест Дарбіна-Вотсона.

25. На чому ґрунтується тест Голфельда-Квандта

а) На використанні t-статистики;

Б) На використанні F – статистики;

в) На використанні ;

г) На графічному аналізі залишків.

26. За допомогою яких методів не можна усунути автокореляцію залишків?

а) узагальненим методом найменших квадратів;

Б) Виваженим способом найменших квадратів;

В) Методом максимальної правдоподібності;

Г) Двокроковим методом найменших квадратів.

27. Як називається порушення припущення про незалежність залишків?

а) мультиколінеарність;

Б) автокореляція;

в) Гетероскедастичність;

г) Гомоскедастичність.

28. Яким методом можна скористатися для усунення гетероскедастичності?

А) узагальненим методом найменших квадратів;

б) Виваженим шляхом найменших квадратів;

в) методом максимальної правдоподібності;

г) Двокроковим методом найменших квадратів.

30. Якщо поt-критерію більшість коефіцієнтів регресії статистично значущі, а модель загалом поF- критерію незначна то це може свідчити про:

а) мультиколінеарності;

Б) Про автокореляцію залишків;

в) Про гетероскедастичність залишків;

г) Такий варіант неможливий.

31. Чи можливо за допомогою перетворення змінних позбавитися мультиколлінеарності?

а) Цей захід ефективний тільки при збільшенні обсягу вибірки;

32. За допомогою якого методу можна визначити оцінки параметра рівняння лінійної регресії:

А) шляхом найменшого квадрата;

б) кореляційно-регресійного аналізу;

в) дисперсійний аналіз.

33. Побудовано множинне лінійне рівняння регресії з фіктивними змінними. Для перевірки значимості окремих коефіцієнтів використовується розподіл:

а) Нормальне;

б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

34. Якщо
і ранг матриці А більший (К-1) то рівняння:

А) надіденцифіковано;

б) неідентифіковано;

в) точно ідентифіковано.

35. Для оцінювання параметрів точно ідентифікованої системи рівнянь застосовується:

а) ДМНК, КМНК;

б) ДМНК, МНК, КМНК;

36. Критерій Чоу ґрунтується на застосуванні:

А) F – статистики;

б) t – статистики;

в) критерії Дарбіна-Уотсона.

37. Фіктивні змінні можуть набувати значення:

г) будь-які значення.

39. За 20 спостереженнями побудовано рівняння регресії:
.
Для перевірки значущості рівняння обчислено значення статистики:4.2. Висновки:

а) Рівняння значимо при a = 0.05;

б) Рівняння незначне при a = 0.05;

в) Рівняння незначне при a = 0.01.

40. Яке з таких тверджень неправильне у разі гетероскедастичності залишків?

а) Висновки з tіF-статистиків є ненадійними;

б) Гетероскедастичність проявляється через низьке значення статистики Дарбіна-Уотсона;

в) При гетероскедастичності оцінки залишаються ефективними;

г) Оцінки є усунутими.

41. Тест Чоу заснований на порівнянні:

а) дисперсій;

б) коефіцієнтів детермінації;

в) математичних очікувань;

г) середніх.

42. Якщо у тесті Чоу
то вважається:

А) що розбиття на подинтервали доцільно з погляду поліпшення якості моделі;

б) модель є статистично незначущою;

в) модель є статистично значущою;

г) що немає сенсу розбивати вибірку на частини.

43. Фіктивні змінні є змінними:

а) якісними;

б) випадковими;

в) кількісними;

г) логічними.

44. Який із перерахованих методів не може бути застосований для виявлення автокореляції?

а) Метод рядів;

б) критерій Дарбіна-Уотсона;

в) тест рангової кореляції Спірмена;

Г) тест Уайт.

45. Найпростіша структурна форма моделі має вигляд:

а)

б)

в)

г)
.

46. ​​За допомогою яких заходів можна позбутися мультиколлінеарності?

а) збільшення обсягу вибірки;

б) Винятки змінних висококорельованих з іншими;

в) зміна специфікації моделі;

г) Перетворення випадкової складової.

47. Якщо
і ранг матриці А дорівнює (К-1) то рівняння:

а) надіденцифіковано;

б) неідентифіковано;

В) точно ідентифіковано;

48. Модель вважається ідентифікованою, якщо:

а) серед рівнянь моделі є хоча одне нормальне;

Б) кожне рівняння системи ідентифікується;

в) серед рівнянь моделі є хоча б одне неідентифіковане;

г) серед рівнянь моделі є хоча б одне надідентифіковане.

49. Який метод застосовується для оцінювання параметрів неіденцифікованого рівняння?

а) ДМНК, КМНК;

б) ДМНК, МНК;

У) параметри такого рівняння не можна оцінити.

50. На стику яких галузей знань виникла економетрика:

а) економічна теорія; економічна та математична статистика;

б) економічна теорія, математична статистика та теорія ймовірності;

в) економічна та математична статистика, теорія ймовірності.

51. У множинному лінійному рівнянні регресії будуються довірчі інтервали для коефіцієнтів регресії за допомогою розподілу:

а) Нормального;

Б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

52. За 16 спостереженнями збудовано парне лінійне рівняння регресії. Дляперевірки значущості коефіцієнта регресії обчисленоt на6л =2.5.

а) Коефіцієнт незначний при a = 0.05;

б) Коефіцієнт значимий при a = 0.05;

в) Коефіцієнт значимий за a=0.01.

53. Відомо, що між величинамиXіYіснуєпозитивний зв'язок. У яких межахперебуває парний коефіцієнт кореляції?

а) від -1 до 0;

б) від 0 до 1;

У) від –1 до 1.

54. Множинний коефіцієнт кореляції дорівнює 0.9. Який відсотокдисперсії результативної ознаки пояснюється впливом усіхфакторні ознаки?

55. Який із перерахованих методів не може бути застосований для виявлення гетероскедастичності?

А) Тест Голфелда-Квандта;

б) Тест рангової кореляції Спірмена;

в) метод рядів.

56. Наведена форма моделі є:

а) систему нелінійних функцій екзогенних змінних від ендогенних;

Б) систему лінійних функційендогенних змінних від екзогенних;

в) систему лінійних функцій екзогенних змінних від ендогенних;

г) систему нормальних рівнянь.

57. У яких межах змінюється приватний коефіцієнт кореляції, обчислений за рекуретними формулами?

а) від - до + ;

б) від 0 до 1;

в) від 0 до + ;

г) від -1 до +1.

58. У яких межах змінюється приватний коефіцієнт кореляції, обчислений через коефіцієнт детермінації?

а) від - до + ;

Б) від 0 до 1;

в) від 0 до + ;

г) від -1 до +1.

59. Екзогенні змінні:

а) залежні змінні;

Б) незалежні змінні;

61. При додаванні до рівняння регресії ще одного пояснюючого фактора множинний коефіцієнт кореляції:

а) зменшиться;

б) зросте;

в) збереже своє значення.

62. Побудовано гіперболічне рівняння регресії:Y= a+ b/ X. ДляДля перевірки значущості рівняння використовується розподіл:

а) Нормальне;

Б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

63. Для яких видів систем параметри окремих економетричних рівнянь можна знайти з допомогою традиційного методу найменших квадратів?

а) система нормальних рівнянь;

Б) система незалежних рівнянь;

В) система рекурсивних рівнянь;

г) система взаємозалежних рівнянь.

64. Ендогенні змінні:

А) залежні змінні;

б) незалежні змінні;

в) датовані попередніми моментами часу.

65. У яких межах змінюється коефіцієнт детермінації?

а) від 0 до + ;

б) від - до + ;

в) від 0 до +1;

г) від -l до +1.

66. Побудовано множинне лінійне рівняння регресії. Для перевірки значимості окремих коефіцієнтів використовується розподіл:

а) Нормальне;

б) Стьюдента;

в) Пірсон;

Г) Фішера-Снідекору.

67. При додаванні до рівняння регресії ще одного пояснюючого фактора коефіцієнт детермінації:

а) зменшиться;

Б) зросте;

в) збереже своє значення;

г) не зменшиться.

68. Суть методу найменших квадратів у тому, что:

А) оцінка визначається за умови мінімізації суми квадратів відхилень вибіркових даних від оцінки, що визначається;

б) оцінка визначається за умови мінімізації суми відхилень вибіркових даних від оцінки, що визначається;

в) оцінка визначається за умови мінімізації суми квадратів відхилень вибіркової середньої від вибіркової дисперсії.

69. До якого класу нелінійних регресій належить парабола:

73. До якого класу нелінійних регресій відноситься експоненційна крива:

74. До якого класу нелінійних регресій належить функція виду ŷ
:

А) регресії, нелінійні щодо включених до аналізу змінних, але лінійних за оцінюваними параметрами;

б) нелінійні регресії за оцінюваними параметрами.

78. До якого класу нелінійних регресій відноситься функція виду ŷ
:

а) регресії, нелінійні щодо включених до аналізу змінних, але лінійних за оцінюваними параметрами;

Б) нелінійні регресії за оцінюваними параметрами.

79. У рівнянні регресії у формі гіперболи ŷ
якщо величина
b >0 , то:

а) зі збільшенням факторного ознаки хзначення результативної ознаки ууповільнено зменшуються, і при х→∞середня величина убуде рівна а;

б) то значення результативної ознаки узростає із уповільненим зростанням зі збільшенням факторного ознаки х, і при х→∞

81. Коефіцієнт еластичності визначається за формулою

а) лінійної функції;

б) Параболи;

в) гіперболи;

г) Показовою кривою;

д) Ступінневої.

82. Коефіцієнт еластичності визначається за формулою
для моделі регресії у формі:

а) лінійної функції;

Б) Параболи;

в) гіперболи;

г) Показовою кривою;

д) Ступінневої.

86. Рівняння
називається:

а) лінійним трендом;

б) параболічним трендом;

в) гіперболічний тренд;

г) експоненційним трендом.

89. Рівняння
називається:

а) лінійним трендом;

б) параболічним трендом;

в) гіперболічний тренд;

г) експоненційним трендом.

90. Система види називається:

а) системою незалежних рівнянь;

б) системою рекурсивних рівнянь;

в) системою взаємозалежних (спільних, одночасних) рівнянь.

93. Економетрику можна визначити як:

А) це самостійна наукова дисципліна, що об'єднує сукупність теоретичних результатів, прийомів, методів та моделей, призначених для того, щоб на базі економічної теорії, економічної статистики та математико-статистичного інструментарію надавати конкретний кількісний вираз загальним (якісним) закономірностям, зумовленим економічною теорією;

Б) наука про економічні виміри;

У) статистичний аналіз економічних даних.

94. До завдань економетрики можна віднести:

А) прогноз економічних та соціально-економічних показників, що характеризують стан та розвиток аналізованої системи;

Б) імітація можливих сценаріїв соціально-економічного розвитку системи для виявлення того, як плановані зміни тих чи інших параметрів, що піддаються управлінню, позначаться на вихідних характеристиках;

в) перевірка гіпотез за статистичними даними.

95. За характером розрізняють зв'язки:

А) функціональні та кореляційні;

б) функціональні, криволінійні та прямолінійні;

в) кореляційні та зворотні;

г) статистичні та прямі.

96. При прямому зв'язку із збільшенням факторної ознаки:

а) результативна ознака зменшується;

б) результативна ознака не змінюється;

В) результативна ознака зростає.

97. Які методи використовуються для виявлення наявності, характеру та напряму зв'язку у статистиці?

а) середніх величин;

Б) порівняння паралельних рядів;

В) метод аналітичного угруповання;

г) відносних величин;

д) графічний метод.

98. Який метод використовується виявлення форми впливу одних чинників інші?

а) кореляційний аналіз;

Б) регресійний аналіз;

в) індексний аналіз;

г) дисперсійний аналіз.

99. Який метод використовується для кількісної оцінки сили впливу одних факторів на інші:

а) кореляційний аналіз;

б) регресійний аналіз;

в) метод середніх величин;

г) дисперсійний аналіз.

100. Які показники за своєю величиною існують у межах від мінус до плюс одиниці:

а) коефіцієнт детермінації;

б) кореляційне ставлення;

У) лінійний коефіцієнт кореляції.

101. Коефіцієнт регресії при однофакторній моделі показує:

а) скільки одиниць змінюється функція при зміні аргументу однією одиницю;

б) скільки відсотків змінюється функція однією одиницю зміни аргументу.

102. Коефіцієнт еластичності показує:

а) на скільки відсотків змінюється функція зі зміною аргументу одну одиницю свого виміру;

Б) на скільки відсотків змінюється функція із зміною аргументу на 1%;

в) скільки одиниць свого виміру змінюється функція зі зміною аргументу на 1%.

105. Розмір індексу кореляції, що дорівнює 0,087, свідчить:

А) про слабку їхню залежність;

б) про сильний взаємозв'язок;

в) про помилки у обчисленнях.

107. Розмір парного коефіцієнта кореляції, що дорівнює 1,12, свідчить:

а) про слабку їхню залежність;

б) про сильний взаємозв'язок;

В) про помилки у обчисленнях.

109. Які із наведених чисел можуть бути значеннями парного коефіцієнта кореляції:

111. Які із наведених чисел можуть бути значеннями множинного коефіцієнта кореляції:

115. Позначте правильну форму лінійного рівняння регресії:

а) ŷ
;

б) ŷ
;

в) ŷ
;

Г) ŷ
.