Биографии Характеристики Анализ

Оценка на регресионното уравнение. Оценка на значимостта на параметрите на линейната регресия и на цялото уравнение като цяло

Регресия по двойкие регресия между две променливи

-y и x, т.е.преглед на модела + E

Където при- ефективен знак, т.е. зависима променлива; х- знаков фактор.

Линейната регресия се свежда до намиране на уравнение от формата или

Уравнението на формата позволява зададени стойностифактор x, за да има теоретичните стойности на ефективната характеристика, замествайки действителните стойности на фактора x в него.

Сграда линейна регресиясе свежда до оценка на неговите параметри a и b.

Оценките на параметрите на линейната регресия могат да бъдат намерени по различни методи.

1.

2.

Параметър bНаречен регресионен коефициент. Стойността му показва

средната промяна в резултата с промяна на фактора с една единица.

Формално А- значение припри х = 0. Ако знак-факторът

няма и не може да има нулева стойност, след това горното

безплатно тълкуване на термини, Аняма смисъл. Параметър, АМоже би

нямат икономическо съдържание. Опитва икономически

интерпретирайте параметъра, Аможе да доведе до абсурд, особено когато А < 0.

Може да се интерпретира само знакът на параметъра А.Ако А > 0,

тогава относителната промяна в резултата е по-бавна от промяната

проверка на качеството на намерените параметри и на целия модел като цяло:

-Оценка на значимостта на коефициента на регресия (b) и коефициента на корелация

-Оценка на значимостта на цялото регресионно уравнение. Коефициент на определяне

Регресионното уравнение винаги се допълва с индикатор за тясността на връзката. При

използване на линейна регресия като такъв индикатор

коефициент на линейна корелация r xy . Има различни

модификации на формулата за коефициента на линейна корелация.

Коефициентът на линейна корелация е в границите: -1≤ .rxy

≤ 1. Освен това, колкото по-близо rдо 0, толкова по-слаба е корелацията и обратно

колкото по-близо е r до 1 или -1, толкова по-силна е корелацията, т.е. зависимостта на x и y е близка до

линеен. Ако rточно =1 или -1 всички точки лежат на една и съща права линия.

Ако коефициентът регресия b>0 след това 0 ≤. rxy≤ 1 и

обратното за b<0 -1≤.rxy≤0. Коеф.

корелацията отразява степента на линейна зависимост на стойностите на m / y в присъствието на

изразена зависимост от друг вид.

За да се оцени качеството на избора на линейна функция, квадратът на линейната

коефициент на корелация

Наречен коефициент на детерминация.Коефициент на определяне

характеризира съотношението на дисперсията на резултантния признак y, обяснено от

регресия. Съответна стойност

характеризира дела на дисперсията y,причинени от влиянието на други неотчетени

във факторния модел.

OLS позволявавземете такива оценки на параметрите АИ б,който

сумата от квадратните отклонения на действителните стойности на получения атрибут

(y)от изчислено (теоретично)

минимум:

С други думи, от

от целия набор от линии, регресионната линия на диаграмата е избрана така, че сумата

квадрати на вертикалното разстояние между точките и тази линия ще бъдат

минимум.

Системата от нормални уравнения е решена

ОЦЕНКА НА ЗНАЧИМОСТТА НА ПАРАМЕТРИ НА ЛИНЕЙНА РЕГРЕСИЯ.

Оценката на значимостта на регресионното уравнение като цяло се дава с помощта на F-критерия

Фишър. В този случай се излага нулевата хипотеза, че регресионният коефициент е равен на

нула, т.е. b= 0, а оттам и факторът хне предоставя

влияние върху резултата г.

Директното изчисляване на F-критерия се предшества от анализ на дисперсията.

Централно за него е разширяването на общата сума на квадратите на отклоненията

променлива приот средната стойност прина две части -

"обяснено" и "необяснено":

Обща сума на квадратите на отклоненията

Сбор на квадрати

отклонения, обяснени с регресия

Остатъчна сума на квадратите на отклонението.

Всеки сбор от квадратни отклонения е свързан с броя на степените на свобода , T.

д. с броя на свободата на независимо изменение на признака. Броят на степените на свобода е свързан с броя на единиците от съвкупността n и броя на константите, определени от него. По отношение на разглеждания проблем броят на степените на свобода трябва да покаже колко независими отклонения от Пвъзможно изисква за

образуването на даден сбор от квадрати.

Дисперсия по степен на свобода Д.

F-съотношения (F-критерий):

Ако нулевата хипотеза е вярна, тогава факторът и остатъчните дисперсии не са

се различават един от друг. За H 0 е необходимо опровержение, така че

факторната дисперсия надвишава остатъчната с няколко пъти. Английски

статистикът Snedecor разработи таблици с критични стойности на F-съотношенията

на различни нива на същественост нулева хипотезаи различни степени

свобода. Табличната стойност на F-теста е максималната стойност на съотношението

дисперсии, които могат да възникнат при тяхното случайно разминаване за даденост

нивото на вероятност за наличие на нулевата хипотеза. Изчислена стойност на F-отношението

се признава за надежден, ако o е по-голямо от табличната стойност. В този случай нула

отхвърля се хипотезата за липсата на връзка на знаците и се прави заключение за

значението на тази връзка: F факт > F таблица H 0

се отхвърля.

Ако стойността е по-малка от табличния F факт ‹, F маса

Тогава вероятността за нулевата хипотеза е над дадено ниво и не може да бъде

отхвърлен без сериозен риск от подвеждане на връзката. IN

В този случай регресионното уравнение се счита за статистически незначимо. Но

не се отхвърля.


Подобна информация.


100 rбонус за първа поръчка

Изберете вида работа Дипломна работа Курсова работаРеферат Магистърска теза Доклад от практика Статия Доклад Рецензия ТестМонография Решаване на проблеми Бизнес план Отговори на въпроси творческа работаЕсе Рисуване Есета Превод Презентации Въвеждане на текст Друго Повишаване уникалността на текста Кандидатска теза Лабораторна работа Онлайн помощ

Попитайте за цена

След намирането на уравнението на линейната регресия, оценка на значимостта като уравнениекато цяло, така и индивидуално параметри. Проверете значимостта на регресионното уравнениеозначава да се определи дали математически модел, изразяваща връзката между променливи, експериментални данни и дали има достатъчно обяснителни променливи (една или повече), включени в уравнението, за да се опише зависимата променлива. За да имате обща преценка за качеството на модела от относителните отклонения за всяко наблюдение, определете средна апроксимационна грешка: Средна грешкаприближението не трябва да надвишава 8–10%.

Оценката на значимостта на регресионното уравнение като цяло се базира на Е- Критерий на Фишерпредшествано от дисперсионен анализ. Според основната идея дисперсионен анализ, обща сумаквадратни отклонения на променливата гот средното гсе декомпозира на две части - "обяснено" и "необяснено": където е общата сума на квадратите на отклоненията; е сумата от квадратните отклонения, обяснени чрез регресия (или факторната сума от квадратните отклонения); остатъчна сумаквадратни отклонения, което характеризира влиянието на фактори, неотчетени в модела. Определянето на дисперсията за една степен на свобода води дисперсиите до сравнима форма. Сравнявайки фактора и остатъчна дисперсияза една степен на свобода, получаваме стойността Е- Критерий на Фишер: истинска стойност Е- Критерият на Фишер се сравнява с

таблична стойност Етаблица(a; к 1; к 2) при ниво на значимост а и степени на свобода к 1 = мИ к 2= н-м-1.Въпреки това, ако действителната стойност Е- критерият е по-голям от табличния, тогава се признава статистическата значимост на уравнението като цяло.

За линейна регресия по двойки м=1, значи

Стойност Е-критерият е свързан с коефициента на определяне R2, той може да се изчисли по следната формула:

При сдвоената линейна регресия значението не само на уравнението като цяло, но и на неговите отделни параметри. За тази цел, за всеки от параметрите, неговата стандартна грешка: m bИ m a. Стандартната грешка на регресионния коефициент се определя по формулата: , Където

Стойността на стандартната грешка, заедно с T-Разпределение на студентите при н-2 степени на свобода се използват за тестване на значимостта на регресионния коефициент и за изчисляване на неговия доверителен интервал. За да се оцени значимостта на регресионния коефициент, неговата стойност се сравнява със стандартната му грешка, т.е. се определя действителната стойност T-Тест на Студент: който след това се сравнява с табличната стойност при определено ниво на значимост a и броя на степените на свобода (n-2). Доверителен интервалза регресионния коефициент се определя като b± Tтабл × мб. Тъй като знакът на коефициента на регресия показва нарастването на ефективната характеристика гс увеличаване на знаковия фактор х(b>0), намаляване на ефективната характеристика с увеличаване на фактора на характеристиката ( b<0) или его независимость от независимой переменной (b=0), тогава границите на доверителния интервал за регресионния коефициент не трябва да съдържат противоречиви резултати, например -1,5 £ b£0,8. Този вид запис показва, че истинската стойност на коефициента на регресия съдържа едновременно положителни и отрицателни стойности и дори нула, което не може да бъде.

стандартна грешка параметър а се определя по формулата: Процедурата за оценка на значимостта на този параметър не се различава от разгледаната по-горе за коефициента на регресия. Изчислено T-критерий: , стойността му се сравнява с табличната стойност, когато н- 2 степени на свобода.


ТЕМА 4. СТАТИСТИЧЕСКИ МЕТОДИ ЗА ИЗУЧАВАНЕ НА ВРЪЗКИ

Регресионно уравнение -това е аналитично представяне на корелационната зависимост. Уравнението на регресията описва хипотетична функционална зависимост между условната средна стойност на ефективния признак и стойността на признака - фактор (фактори), т.е. основната тенденция на пристрастяване.

Двойната корелационна зависимост се описва от уравнението на двойната регресия, множествената корелационна зависимост - от уравнението на множествената регресия.

Характеристиката-резултат в регресионното уравнение е зависимата променлива (отговор, обяснителна променлива), а характеристиката-фактор е независимата променлива (аргумент, обяснителна променлива).

Най-простият тип регресионно уравнение е уравнението на сдвоена линейна връзка:

където y е зависимата променлива (знак-резултат); x е независима променлива (коефициент на знак); и са параметрите на регресионното уравнение; - Грешка в оценката.

Различни математически функции могат да се използват като регресионно уравнение. Често практическо приложение намират уравненията на линейната зависимост, параболата, хиперболата, степната функция и др.

По правило анализът започва с линейна връзка, тъй като резултатите са лесни за смислено интерпретиране. Изборът на вида на ограничителното уравнение е доста важна стъпка в анализа. В "предкомпютърната" ера тази процедура беше свързана с определени трудности и изискваше анализаторът да познава свойствата на математическите функции. Понастоящем, въз основа на специализирани програми, е възможно бързо да се конструира набор от комуникационни уравнения и въз основа на формални критерии да се избере най-добрият модел (обаче математическата грамотност на анализатора не е загубила своята релевантност).

Въз основа на резултатите от конструирането на корелационното поле може да се изложи хипотеза за вида на корелационната зависимост (виж лекция 6). Въз основа на естеството на местоположението на точките на графиката (координатите на точките съответстват на стойностите на зависимите и независимите променливи) се разкрива тенденцията на връзката между знаците (индикаторите). Ако регресионната линия минава през всички точки на корелационното поле, това показва функционална връзка. В практиката на социално-икономическите изследвания такава картина не може да се наблюдава, тъй като има статистическа (корелационна) зависимост. В условията на корелационна зависимост при изчертаване на регресионна линия върху точкова диаграма се наблюдава отклонение на точките на корелационното поле от регресионната линия, което демонстрира т. нар. остатъци или грешки в оценката (виж Фигура 7.1).

Наличието на грешка в уравнението се дължи на факта, че:

§ не всички фактори, влияещи върху резултата, са взети предвид в уравнението на регресията;

§ формата на връзката може да е неправилно избрана - регресионното уравнение;

§ Не всички фактори са включени в уравнението.

Да се ​​състави регресионно уравнение означава да се изчислят стойностите на неговите параметри. Регресионното уравнение се изгражда въз основа на действителните стойности на анализираните характеристики. Изчисляването на параметрите обикновено се извършва с помощта на метод най-малки квадрати(MNK).

Същността на МНКе, че е възможно да се получат такива стойности на параметрите на уравнението, при които сумата от квадратите на отклоненията на теоретичните стойности на атрибута-резултат (изчислен на базата на регресионното уравнение) от действителното му стойностите са сведени до минимум:

,

където - действителната стойност на знака-резултат на i-тата единица от съвкупността; - стойността на знака-резултат на i-тата единица от съвкупността, получена от регресионното уравнение ().

По този начин проблемът се решава за екстремум, т.е. необходимо е да се намери при какви стойности на параметрите функцията S достига минимум.

Извършване на диференциране, приравняване на частните производни на нула:



, (7.3)

, (7.4)

където е средното произведение на стойностите на фактора и резултата; - средната стойност на знака - фактор; - средната стойност на знака-резултат; - дисперсия на знак-фактора.

Параметърът в регресионното уравнение характеризира наклона на регресионната линия на графиката. Тази опция се нарича регресионен коефициенти стойността му характеризира с колко мерни единици ще се промени знакът-резултат, когато факторът на знака се промени с единицата на неговото измерване. Знакът на регресионния коефициент отразява посоката на зависимостта (пряка или обратна) и съвпада със знака на корелационния коефициент (при условия на сдвоена зависимост).

Като част от разглеждания пример, програмата STATISTICA изчислява параметрите на регресионното уравнение, което описва връзката между нивото на средния паричен доход на глава от населението и стойността на брутния регионален продукт на глава от населението в регионите на Русия, виж таблица 7.1.

Таблица 7.1 - Изчисляване и оценка на параметрите на уравнението, описващо връзката между нивото на средния паричен доход на глава от населението и стойността на брутния регионален продукт на глава от населението в регионите на Русия, 2013 г.

Колона "B" на таблицата съдържа стойностите на параметрите на уравнението на двойната регресия, следователно можете да напишете: = 13406,89 + 22,82 x. Това уравнение описва тенденцията на връзката между анализираните характеристики. Параметърът е коефициентът на регресия. В този случай той е равен на 22,82 и характеризира следното: с увеличение на БВП на глава от населението с 1 хил. Рубли средните парични доходи на глава от населението се увеличават средно (както е посочено със знака "+") с 22,28 рубли.

Параметърът на регресионното уравнение в социално-икономическите изследвания, като правило, не се интерпретира смислено. Формално той отразява стойността на знака - резултат, при условие че знакът - фактор е равен на нула. Параметърът характеризира местоположението на регресионната линия на графиката, вижте Фигура 7.1.

Фигура 7.1 - Корелационно поле и регресионна линия, отразяваща зависимостта на нивото на средния паричен доход на глава от населението в регионите на Русия и стойността на GRP на глава от населението

Стойността на параметъра съответства на точката на пресичане на регресионната линия с оста Y, при X=0.

Построяването на регресионното уравнение е придружено от оценка статистическа значимостуравнението като цяло и неговите параметри. Необходимостта от такива процедури е свързана с ограничено количество данни, което може да попречи на действието на закона за големите числа и следователно идентифицирането на истинска тенденция във връзката на анализираните показатели. В допълнение, всяка изследвана популация може да се разглежда като извадка от генералната популация, а характеристиките, получени по време на анализа, като оценка на общите параметри.

Оценката на статистическата значимост на параметрите и уравнението като цяло е обосновката на възможността за използване на изградения комуникационен модел за вземане на управленски решения и прогнозиране (моделиране).

Статистическа значимост на регресионното уравнениекато цяло се оценява с помощта на F-тест на Fisher, което е отношението на факторните и остатъчните дисперсии, изчислени за една степен на свобода:

Където - факторна дисперсия на признака - резултат; k е броят на степените на свобода на факторната дисперсия (броят на факторите в регресионното уравнение); - средната стойност на зависимата променлива; - теоретична (получена чрез регресионното уравнение) стойност на зависимата променлива за i-тата единица от съвкупността; - остатъчна дисперсия на знака - резултат; n е обемът на населението; n-k-1 е броят на степените на свобода на остатъчната дисперсия.

Стойността на F-теста на Фишер, съгласно формулата, характеризира съотношението между фактора и остатъчните дисперсии на зависимата променлива, като по същество показва колко пъти стойността на обяснената част от вариацията надвишава необяснената.

F-тестът на Fisher е представен в таблица, входът към таблицата е броят на степените на свобода на факторните и остатъчните дисперсии. Сравнението на изчислената стойност на критерия с табличната (критична) позволява да се отговори на въпроса: тази част от вариацията на признака-резултат, която може да се обясни с факторите, включени в уравнението от този тип, е статистически значима? Ако , тогава регресионното уравнение се признава за статистически значимо и съответно коефициентът на детерминация също е статистически значим. В противен случай ( ), уравнението е статистически незначимо, т.е. вариацията на факторите, взети предвид в уравнението, не обяснява статистически значимата част от вариацията на черта-резултат или уравнението на връзката не е избрано правилно.

Оценка на статистическата значимост на параметрите на уравнениетоизвършено на осн t-статистика, което се изчислява като съотношението на абсолютната стойност на параметрите на регресионното уравнение към техните стандартни грешки ( ):

, Където ; (7.6)

, Където ; (7.7)

Където - стандартни отклонения на знак - фактор и знак - резултат; - коефициент на детерминация.

В специализираните статистически програми изчисляването на параметрите винаги се придружава от изчисляване на техните стандартни (средноквадратични) грешки и t-статистики (виж таблица 7.1). Изчислената стойност на t-статистиката се сравнява с табличната, ако обемът на изследваната популация е по-малък от 30 единици (определено малка извадка), трябва да се направи справка с t-разпределителната таблица на Student, ако обемът на популацията е голям, трябва да се използва таблицата за нормално разпределение (вероятностния интеграл на Лаплас). Параметърът на уравнението се счита за статистически значим, ако.

Оценката на параметри, базирана на t-статистика, по същество е проверка на нулевата хипотеза за равенството на общите параметри на нула (H 0: =0; H 0: =0;), тоест за статистически незначим стойност на параметрите на регресионното уравнение. Нивото на значимост на хипотезата, като правило, се приема: = 0,05. Ако изчисленото ниво на значимост е по-малко от 0,05, тогава нулевата хипотеза се отхвърля и се приема алтернативната - за статистическата значимост на параметъра.

Да продължим с примера. Таблица 7.1 в колона "B" показва стойностите на параметрите, в колоната Std.Err.ofB - стойностите на стандартните грешки на параметрите ( ), в колоната t (77 - броят на степените на свобода) стойностите на t - статистиката се изчисляват, като се вземе предвид броят на степените на свобода. За да се оцени статистическата значимост на параметрите, изчислените стойности на t-статистиката трябва да се сравнят със стойността на таблицата. Даденото ниво на значимост (0,05) в таблицата за нормално разпределение съответства на t = 1,96. От 18.02, 10.84, т.е. , трябва да се признае статистическата значимост на получените стойности на параметрите, т.е. тези стойности се формират под въздействието на неслучайни фактори и отразяват тенденцията на връзката между анализираните показатели.

За да оценим статистическата значимост на уравнението като цяло, се обръщаме към стойността на F-теста на Фишер (вижте таблица 7.1). Прогнозна стойност на F-критерия = 117.51, таблична стойносткритерият, базиран на съответния брой степени на свобода (за факторна дисперсия d.f. =1, за остатъчна дисперсия d.f. =77), е 4,00 (вижте Приложение .....). По този начин, , следователно уравнението на регресията като цяло е статистически значимо. В такава ситуация може да се говори и за статистическа значимост на стойността на коефициента на детерминация, т.е. 60-процентната разлика в средните доходи на глава от населението в регионите на Русия може да се обясни с промяната в обема на брутния регионален продукт на глава от населението.

Чрез оценка на статистическата значимост на регресионното уравнение и неговите параметри можем да получим различна комбинация от резултати.

· Уравнението чрез F-тест е статистически значимо и всички параметри на уравнението чрез t-статистиката също са статистически значими. Това уравнение може да се използва както за вземане на управленски решения (кои фактори трябва да бъдат повлияни, за да се получи желаният резултат), така и за прогнозиране на поведението на резултатния атрибут за определени стойности на факторите.

· Според F-критерия уравнението е статистически значимо, но параметрите (параметър) на уравнението са незначими. Уравнението може да се използва за вземане на управленски решения (относно тези фактори, за които е потвърдена статистическата значимост на тяхното влияние), но уравнението не може да се използва за прогнозиране.

· Уравнението на F-теста не е статистически значимо. Уравнението не може да се използва. Трябва да продължи търсенето на значими признаци-фактори или аналитична форма на връзката между аргумента и отговора.

Ако статистическата значимост на уравнението и неговите параметри се потвърди, тогава може да се приложи така наречената точкова прогноза, т.е. беше получена оценка на стойността на атрибута-резултат (y) за определени стойности на фактора (x).

Съвсем очевидно е, че прогнозираната стойност на зависимата променлива, изчислена на базата на релационното уравнение, няма да съвпадне с нейната действителна стойност ( Графично тази ситуация се потвърждава от факта, че не всички точки на корелационното поле лежат на линията на регресия, само с функционална връзка линията на регресия ще премине през всички точки на диаграмата на разсейване. Наличието на несъответствия между действителните и теоретичните стойности на зависимата променлива се дължи преди всичко на самата същност на корелационната зависимост: в същото време много фактори влияят върху резултата, от които само част могат да бъдат взети предвид в конкретно уравнение на връзката. В допълнение, формата на връзката между резултата и фактора (вида на регресионното уравнение) може да бъде неправилно избрана. В тази връзка възниква въпросът доколко е информативно построеното уравнение на ограничение. На този въпрос отговарят два показателя: коефициентът на детерминация (вече беше обсъден по-горе) и стандартната грешка на оценката.

Разликата между действителните и теоретичните стойности на зависимата променлива се нарича отклонения или грешки, или остатъци. Въз основа на тези стойности се изчислява остатъчната дисперсия. Корен квадратен от остатъчната дисперсия е средноквадратична (стандартна) грешка при оценка:

= (7.8)

Стандартната грешка на уравнението се измерва в същите единици като прогнозираната скорост. Ако грешките на уравнението следват нормално разпределение (с големи количества данни), тогава 95 процента от стойностите трябва да са от регресионната линия на разстояние, което не надвишава 2S (въз основа на свойството на нормално разпределение - правилото от три сигма). Стойността на стандартната грешка на оценката се използва при изчисляването на доверителните интервали, когато се прогнозира стойността на знак - резултатът за конкретна единица от съвкупността.

В практическите изследвания често става необходимо да се предскаже средната стойност на признак - резултат за определена стойност на признак - фактор. В този случай при изчисляването на доверителния интервал за средната стойност на зависимата променлива()

стойността на средната грешка се взема предвид:

(7.9)

Използването на различни стойности на грешката се обяснява с факта, че променливостта на нивата на показателите за конкретни единици от съвкупността е много по-висока от променливостта на средната стойност, следователно грешката на прогнозата на средната стойност е по-малка.

Доверителен интервал на прогнозата за средната стойност на зависимата променлива:

, (7.10)

Където - пределна грешка в оценката (виж теорията на извадката); t е коефициентът на доверие, чиято стойност е в съответната таблица, въз основа на нивото на вероятност, прието от изследователя (брой степени на свобода) (вижте теорията на вземането на проби).

Доверителният интервал за прогнозираната стойност на атрибута резултат може също да бъде изчислен, като се вземе предвид корекцията за отместването (отместването) на регресионната линия. Стойността на корекционния коефициент се определя от:

(7.11)

където е стойността на атрибута-фактор, въз основа на която се прогнозира стойността на атрибута-резултат.

От това следва, че колкото повече стойността се различава от средната стойност на атрибут-фактора, толкова по-голяма е стойността на корекционния фактор, толкова по-голяма е грешката на прогнозата. Като се има предвид този коефициент, ще се изчисли доверителният интервал на прогнозата:

Точността на прогнозата, базирана на регресионното уравнение, може да бъде повлияна от различни причини. На първо място, трябва да се има предвид, че оценката на качеството на уравнението и неговите параметри се основава на предположението за нормално разпределение на случайните остатъци. Нарушаването на това предположение може да се дължи на наличието на рязко различни стойности в данните, с неравномерна вариация, с наличие на нелинейна връзка. В този случай качеството на прогнозата се намалява. Второто нещо, което трябва да имате предвид е, че стойностите на факторите, взети предвид при прогнозиране на резултата, не трябва да надхвърлят диапазона на вариация на данните, на които се основава уравнението.

©2015-2019 сайт
Всички права принадлежат на техните автори. Този сайт не претендира за авторство, но предоставя безплатно използване.
Дата на създаване на страницата: 2018-01-08

Ще проверим значимостта на регресионното уравнение въз основа на

F-тест на Fisher:

Стойността на F-теста на Fisher може да бъде намерена в таблицата Анализ на дисперсията на протокола на Excel. Табличната стойност на F-критерия с доверителна вероятност α = 0,95 и брой степени на свобода, равен на v1 = k = 2 и v2 = n – k – 1= 50 – 2 – 1 = 47, е 0,051.

Тъй като Fcalc > Ftabl, регресионното уравнение трябва да се признае за значимо, т.е. може да се използва за анализ и прогнозиране.

Оценката на значимостта на коефициентите на получения модел, използвайки резултатите от доклада на Excel, може да се извърши по три начина.

Коефициентът на регресионното уравнение се признава за значим, ако:

1) наблюдаваната стойност на t-статистиката на Student за този коефициент е по-голяма от критичната (таблична) стойност на статистиката на Student (за дадено ниво на значимост, например, α = 0,05 и броят на степените на свобода df = n – k – 1, където n е броят наблюдения, а k е броят на факторите в модела);

2) p-стойността на t-статистиката на Student за този коефициент е по-ниска от нивото на значимост, например α = 0,05;

3) доверителният интервал за този коефициент, изчислен с определена вероятност за доверие (например 95%), не съдържа нула в себе си, т.е. долните 95% и горните 95% граници на доверителния интервал имат същите знаци .

Значение на коефициентите а1 И а2 Нека проверим втория и третия метод:

p-стойност ( а1 ) = 0,00 < 0,01 < 0,05.

p-стойност ( а2 ) = 0,00 < 0,01 < 0,05.

Следователно коефициентите а1 И а2 са значими на ниво 1% и още повече на ниво на значимост 5%. Долните и горните 95% граници на доверителния интервал имат едни и същи знаци, следователно коефициентите а1 И а2 значително.

Дефиниция на обяснителна променлива, от която

Дисперсията на случайните смущения може да зависи.

Проверка на изпълнението на условието за хомоскедастичност

Остатъци според теста на Голдфелд-Кванд

Когато се тества предпоставката на OLS за хомоскедастичност на остатъците в модел на множествена регресия, първо трябва да се определи по отношение на кой от факторите дисперсията на остатъците е най-нарушена. Това може да стане чрез визуално изследване на остатъчните графики за всеки от факторите, включени в модела. Тази от обяснителните променливи, от които дисперсията на случайните смущения зависи повече, ще бъде подредена чрез увеличаване на действителните стойности при проверка на теста на Голдфелд-Кванд. Графиките са лесни за получаване в отчета, който се генерира в резултат на използването на инструмента за регресия в пакета за анализ на данни).

Графики на остатъците за всеки от факторите на двуфакторния модел

От представените графики се вижда, че дисперсията на балансите е най-нарушена по отношение на фактора Краткосрочни вземания.

Нека проверим наличието на хомоскедастичност в остатъците на двуфакторния модел, базиран на теста на Голдфелд-Кванд.

    Нека сортираме променливите Y и X2 във възходящ ред на фактора X4 (в Excel можете да използвате командата Данни - Сортиране във възходящ ред X4):

    Данните са сортирани във възходящ X4:

  1. Нека премахнем C = 1/4 n = 1/4 50 = 12,5 (12) стойности от средата на подредения набор. В резултат на това получаваме две популации, съответно с малки и големи стойности на X4.

    За всеки комплект извършваме изчисленията:

Сума

111234876536,511

966570797682,068

455748832843,413

232578961097,877

834043911651,192

193722998259,505

1246409153509,290

31419681912489,100

2172804245053,280

768665257272,099

2732445494273,330

163253156450,331

18379855056009,900

10336693841766,000

Сума

69977593738424,600

Задайте уравнения

Y = -27275.746 + 0.126X2 + 1.817X4

Y = 61439.511 + 0.228X2 + 0.140X4

Резултатите от тази таблица бяха получени с помощта на инструмента за регресия на свой ред за всяка от получените популации.

4. Намерете отношението на получените остатъчни суми на квадрати

(числителят трябва да е по-голяма сума):

5. Заключението за наличието на хомоскедастичност на остатъците се прави с помощта на F-теста на Fisher с ниво на значимост α = 0,05 и две еднакви степени на свобода k1 = k2 = == 17

където p е броят на параметрите на регресионното уравнение:

Fтаблица (0,05; 17; 17) = 9,28.

Тъй като Ftabl > R, хомоскедастичността се потвърждава в остатъците от двуфакторната регресия.

Оценка на значимостта на параметрите на регресионното уравнение

Значимостта на параметрите на уравнението на линейната регресия се оценява с помощта на t-теста на Student:

Ако Tкалк. > T cr, тогава основната хипотеза се приема ( хо), показваща статистическата значимост на регресионните параметри;

Ако Tкалк.< T cr, тогава се приема алтернативната хипотеза ( H1), което показва статистическата незначимост на регресионните параметри.

Където m a , m bса стандартните грешки на параметрите аИ б:

(2.19)

(2.20)

Критичната (таблична) стойност на критерия се намира с помощта на статистическите таблици на разпределението на Стюдънт (Приложение Б) или според таблиците превъзходен(раздел на съветника за функции "Статистически"):

T cr = STEUDRASP( а=1-Р; k=n-2), (2.21)

Където k=n-2също представлява броя на степените на свобода .

Оценката на статистическата значимост може да се приложи и към коефициента на линейна корелация

Където г-не стандартната грешка при определяне на стойностите на коефициента на корелация r yx

(2.23)

По-долу са вариантите за задачи за практически и лабораторна работапо темата на втория раздел.

Въпроси за самопроверка в раздел 2

1. Посочете основните компоненти на иконометричния модел и тяхната същност.

2. Основното съдържание на етапите на иконометричното изследване.

3. Същност на подходите за определяне на параметрите на линейната регресия.

4. Същността и особеностите на прилагането на метода на най-малките квадрати при определяне на параметрите на регресионното уравнение.

5. Какви показатели се използват за оценка на близостта на връзката на изследваните фактори?

6. Същност линеен коефициенткорелации.

7. Същност на коефициента на детерминация.

8. Същност и основни характеристики на процедурите за оценка на адекватността (статистическа значимост) регресионни модели.

9. Оценка на адекватността на линейните регресионни модели чрез коефициента на апроксимация.

10. Същност на подхода за оценка на адекватността на регресионните модели по критерия на Фишер. Определяне на емпирични и критични стойности на критерия.

11. Същността на понятието "анализ на дисперсията" във връзка с иконометричните изследвания.

12. Същността и основните характеристики на процедурата за оценка на значимостта на параметрите линейно уравнениерегресия.

13. Особености на приложението на разпределението на Стюдънт при оценка на значимостта на параметрите на уравнението на линейната регресия.

14. Каква е задачата за прогнозиране на единични стойности на изследваното социално-икономическо явление?

1. Изграждане на корелационно поле и формулиране на предположение за формата на уравнението на връзката на изследваните фактори;

2. Запишете основните уравнения на метода на най-малките квадрати, направете необходимите трансформации, съставете таблица за междинни изчисления и определете параметрите на уравнението на линейната регресия;

3. Проверете правилността на изчисленията, извършени с помощта на стандартни процедури и функции на електрониката Excel таблици.

4. Анализирайте резултатите, формулирайте изводи и препоръки.

1. Изчисляване на стойността на коефициента на линейна корелация;

2. Изграждане на таблица за дисперсионен анализ;

3. Оценка на коефициента на детерминация;

4. Проверете правилността на изчисленията, извършени с помощта на стандартни процедури и функции електронни таблици Excel.

5. Анализирайте резултатите, формулирайте изводи и препоръки.

4. Харчете обща класацияадекватността на избраното регресионно уравнение;

1. Оценка на адекватността на уравнението чрез стойностите на коефициента на приближение;

2. Оценка на адекватността на уравнението чрез стойностите на коефициента на детерминация;

3. Оценка на адекватността на уравнението по критерия на Фишер;

4. Извършване на обща оценка на адекватността на параметрите на регресионното уравнение;

5. Проверете правилността на извършените изчисления с помощта на стандартни процедури и функции на електронни таблици на Excel.

6. Анализирайте резултатите, формулирайте изводи и препоръки.

1. Използване на стандартните процедури на Excel Spreadsheet Function Wizard (от секциите "Математически" и "Статистически");

2. Подготовка на данни и особености при използване на функцията "LINEST";

3. Подготовка на данни и характеристики на използването на функцията "ПРЕДВИД".

1. Използване на стандартните процедури на пакета за анализ на данни от електронни таблици на Excel;

2. Изготвяне на данни и особености на прилагането на процедура „РЕГРЕС”;

3. Интерпретация и обобщение на таблични данни регресионен анализ;

4. Интерпретация и обобщение на данните от таблицата за дисперсионен анализ;

5. Интерпретация и обобщение на данните от таблицата за оценка на значимостта на параметрите на регресионното уравнение;

При извършване на лабораторна работа по един от вариантите е необходимо да се изпълнят следните конкретни задачи:

1. Направете избор на формата на уравнението на връзката на изследваните фактори;

2. Определяне на параметрите на регресионното уравнение;

3. Да се ​​оцени стегнатостта на връзката на изследваните фактори;

4. Оценка на адекватността на избраното регресионно уравнение;

5. Оценете статистическата значимост на параметрите на регресионното уравнение.

6. Проверете коректността на извършените изчисления с помощта на стандартни процедури и функции на електронни таблици на Excel.

7. Анализирайте резултатите, формулирайте изводи и препоръки.

Задачи за практическа и лабораторна работа по темата „Сдвоена линейна регресия и корелация в иконометричните изследвания“.

Опция 1 Вариант 2 Вариант 3 Вариант 4 Вариант 5
х г х г х г х г х г
Вариант 6 Вариант 7 Вариант 8 Вариант 9 Вариант 10
х г х г х г х г х г