Биографии Характеристики Анализ

Условия применения дисперсионного анализа ANOVA. Проблема множественных сравнений

Один из путей устранения влияния тренировки на результаты оценки Н. р. - формирование устойчивого навыка в ра­боте с соответствующей методикой перед проведением тест-ретеста. Однако коли­чество повторений теста при этом неиз­бежно возрастает, что приводит к увели­чению числа запомнившихся решений. Такой прием может быть рекомендован для методик типа тестов скорости, со­держащих большое количество элементов тестового материала.

Для других методик, очевидно, един­ственным приемлемым путем снижения влияния тренировки остается увеличение интервала ретеста, что, однако, как уже говорилось выше, вступает в противоре­чие с определением надежности как ха­рактеристики теста.

Для большинства тестов общих спо­собностей характерно улучшение показа­телей Н. р. с возрастом испытуемых за счет лучшего контроля условий их выпол­нения. Другим фактором увеличения расчетных показателей Н. р. является отно­сительное замедление с возрастом темпа психического развития в области тех ха­рактеристик, которые могут стать объек­том измерения или влиять на результат теста. Благодаря этому, спустя время, со­ставляющее интервал ретеста, случайные колебания результатов обследования становятся менее выраженными. Это искус­ственно завышает показатели Н. р. Эта закономерность требует отдельных изме­рений Н. р. в разных возрастных контингентах испытуемых, что особенно суще­ственно для методик, предназначенных для обследования в широком возрастном диапазоне (см. Станфорд-Бине ум­ственного развития шкала, Векслера интеллекта измерения шкалы).

Указанные особенности и недостатки метода определения надежности путем ретеста делают его пригодным лишь для ограниченного числа методик, допускаю­щих многократное повторное обследова­ние. К их числу относятся сенсомоторные пробы, тесты скорости и ряд других мето­дик, отличающихся большим количеством пунктов (см. Миннесотский многоас­пектный личностный опросник).



НАДЕЖНОСТЬ ФАКТОРНО-ДИС­ПЕРСИОННАЯ - способ определения надежности, основанный на дисперси­онном анализе результатов теста. На­дежность теста соответствует отношению истинной дисперсии (т. е. дисперсии самого исследуемого фактора) к реально полученной эмпирической дисперсии. По­следняя складывается из истинной дис­персии и дисперсии погрешности изме­рения (см. Ошибка измерения). Фак­торно-аналитический подход к опреде­лению надежности дополнительно рас­членяет и дисперсию истинного показа­теля (Дж. Гилфорд, 1956).

Дисперсия истинного показателя, в свою очередь, может состоять из диспер­сии общего фактора для групп аналогич­ных тестов (см. Фактор G), особых фак­торов, обеспечивающих тесты специфи­ческой направленности (см. Факторы групповые) и дисперсии факторов, прису­щих конкретной тестовой методике. Сле­довательно, полная дисперсия теста рав­на сумме дисперсий для общих, специфических и единичных факторов плюс дис­персия погрешности:

где σ 2 t - дисперсия теста, - дис­персия общих, групповых и единичных факторов, - дисперсия погрешности. Разделив уравнение на σ 2 t получим:

что может быть записано в виде:

где - доля дисперсии, выраженная об­щим фактором а, и т. д.

Таким образом, коэффициент надеж­ности теста равен:

Факторно-дисперсионный способ оп­ределения надежности подходит для оцен­ки уже факторизованного теста (см. Фак­торно-аналитический принцип), но не для тестов, измеряющих широкий набор разнообразных параметров, так как неко­торые из них могут не входить в установленную область валидности методики.

НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА - характеристика надежности психодиаг­ностической методики, получаемая путем анализа устойчивости результатов от­дельных совокупностей тестовых задач или единичных пунктов (заданий) теста.

Наиболее простым и распространен­ным способом определения Н. ч. т. явля­ется метод расщепления, суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста. Обоснованием метода является вывод о том, что при нормальном или близком к нормальному распределении оценок по полному тесту (см. Нормальное распре­деление) выполнение любого случайного набора из частей теста даст аналогичное распределение (при условии, что части однородны по характеру заданий по отно­шению к тесту в целом).

Для оценки надежности методом рас­щепления выбирают две эквивалентные по характеру и степени трудности группы задач (см. Внутренняя согласован­ность, Трудность заданий теста). Раз­деление объема заданий теста на сопоста­вимые части достигается:

Распределением заданий на четные и нечетные (в том случае, если задания в тесте строго ранжированы по степе­ни субъективной трудности);

Распределением пунктов по принципу близости или равенства значений ин­дексов трудности и дискриминативности (см. Дискриминативность зада­ний теста). Такой принцип разделения пригоден для тестов достижений, в которых обязателен ответ испытуе­мых на все пункты;

Распределением задач по времени ре­шения каждой из частей (для тестов скорости).

Для испытуемых в выборке определе­ния надежности (раздельно для каждой из частей теста) вычисляются оценки успеш­ности решений, среднеквадратические от­клонения первого и второго рядов оценок и коэффициенты корреляции сравнивае­мых рядов. Естественно, эти коэффици­енты будут характеризовать надежность лишь половины теста.

Уравнение Спирмена-Брауна отра­жает влияние изменения количества зада­ний на коэффициент надежности теста:

где r t - коэффициент надежности для полного объема заданий, - его значе­ние после изменения числа заданий, п - отношение нового числа заданий к перво­начальному (если число заданий полного теста - 100, а его части, полученной ме­тодом расщепления на половины, - 50, то п = 0,5). Отсюда для полного теста:

Приведенные формулы справедливы для случаев равных стандартных отклоне­ний обеих половин теста (σ х1 = σ х2). Если σ х1 отличается от σ х2 , для определения ко­эффициента надежности применяется формула Фланагана:

Этот же показатель для малых выборок рассчитывается по формуле Кристофа:

При определении r t целого теста мож­но воспользоваться формулой Рюлона:

где - дисперсия разностей между ре­зультатами каждого испытуемого по двум половинам теста, - дисперсия сум­марных результатов. В данном случае ко­эффициент надежности рассчитывается как доля «истинной» дисперсии результа­тов теста (см. Надежность, Ошибка из­мерения).

При расщеплении тестов скорости применяется особая процедура группи­ровки заданий. Определяется минималь­ное время (t min) решения целого теста, за­тем отсчитываются половина и четвертая часть этого времени. Все испытуемые ра­ботают половину минимального времени, после чего ставят отметку против зада­ния, выполняемого в момент подачи сиг­нала, и продолжают работать еще чет­верть минимального времени. Коэффици­ент надежности в этом случае будет соответствовать степени корреляции между числом задач, решенных до первого сигна­ла (0,5t min) и решенных за время между первым и вторым сигналами (0,25t mjn ).

Разделение заданий теста на равно­ценные половины является лишь частным случаем Н. ч. т. Вполне возможно рас­щепление на три, четыре и более частей. В предельном случае число частей равно числу пунктов. При этом для определения надежности применяют анализ внутрен­ней согласованности.

При разделении всего набора заданий теста на любое количество групп для пра­вильного определения Н. ч. т., как уже указывалось выше, должно соблюдаться требование равноценности таких групп. Поэтому при вычислении коэффициента надежности методом анализа внутренней согласованности отобранные задания те­ста должны быть в высокой степени од­нородны по содержанию и трудности (го­могенны). При гетерогенных задачах значения r t ниже истинных.

Наиболее распространенным методом оценки надежности отдельных заданий является вычисление коэффициента Кью­дера-Ричардсона:

где - дисперсия первичных оценок те­ста, р - индекс трудности, выраженный в виде доли - - (см. Трудность заданий 100 теста), q = 1 - р, r pb - коэффициент дискриминации (см. Дискриминатив-ность заданий теста).

В целях упрощения вычисления мо­жет быть применена формула Гуликсена:

где k - число заданий в тесте.

Это уравнение может быть упрощено следующим образом:

При отсутствии коэффициента диск­риминации применим вариант формулы Кьюдера-Ричардсона:

Пример вычислений r t по методу Кью­дера - Ричардсона приведен в табл. 17.

Таблица 17

Определение коэффициента надежности методом Кьюдера-Ричардсона (n = 50; = 8,01;k = 16)

Предложенные выше формулы для оп­ределения коэффициента надежности при­годны для случаев, когда задания оцени­ваются в дихотомической шкале (см. Шка­лы измерительные) по принципу «выполнено - не выполнено». Для случаев с бо­лее дифференцированной оценкой приме­нима формула коэффициента альфа:

где - сумма дисперсий результатов отдельных заданий.

В практике психологической диагно­стики считается, что тест надежен, если r t ≥ 0,6.

Коэффициент надежности обладает доверительным интервалом, определение которого особенно важно в связи с боль­шим количеством факторов, способных влиять на его значение. Доверительный интервал для r t определяется как

где - стандартная ошибка коэффици­ента надежности - преобразование Фишера (определяется по статистическим таблицам). На практике применяется только нижняя граница r t (Z крит при γ = 0,05 составляет 1,96, при α = 0,01 -2,58).

Характеристика надежности по типу Н. ч. т. имеет серьезные преимущества по сравнению с надежностью ретестовой и надежностью параллельных, форм, главным образом благодаря отсутствию необходимости в повторном обследова­нии. Таким образом, снимается влияние многих посторонних факторов, в частно­сти тренировки, запоминания решений и т. д. Это обстоятельство определяет ши­рокое распространение методов характеристики Н. ч. т. по сравнению с другими типами надежности. К недостаткам мето­да относится невозможность проверить устойчивость результатов теста спустя определенное время. Это требует комби­нирования метода Н. ч. т. с другими типа­ми характеристики надежности психоло­гической методики.

«НАРИСУЙ ИСТОРИЮ» (Draw-a-Story, DAS) - проективная методика иссле­дования личности. Предложена Р. Силвером в 1987 г. Предназначена для раннего обнаружения депрессии, в частности - скрытой депрессии.

«Н. и.» основывается на обычных для проективных методик положениях: а) дет­ское восприятие одних и тех же рисунков различно; б) на восприятие оказывает влияние личный опыт; в) рисунки могут отражать элементы личности, поддающи­еся квантификации.

В методике комбинируются исследо­вательские процедуры разных проектив­ных техник. Первоначально обследуемый должен выбрать из 14 картин две и по ним придумать историю (на предлагаемых кар­тинах в основном содержатся изображе­ния людей и животных). Затем необходи­мо сделать рисунок по мотивам ранее во­ображенной истории. Наконец, предлага­ется записать историю. Темы рисунка и истории оцениваются по 7-балльной шка­ле (от «выражение негативная» до «выраженно позитивная»). Негативные темы содержат указания на «грусть», «печаль», «смерть», «беспомощность», «будущее без надежд на лучшее» и т. п. и рассматрива­ются как знаки депрессии.

«Н. и.» предназначена для группового обследования детей и подростков, начи­ная с 5-летнего возраста. Сообщается о высокой надежности методики. Так, на­дежность ретестовая (интервал ретеста - неделя) при обследовании детей с эмоциональными расстройствами - 0,87.

Данные о валидности ограниченны, тем не менее имеются сведения о том, что темы депрессивных детей и подростков оцениваются в основном как «выражение негативные», чего не наблюдается в других группах. Имеются нормативные дан­ные, полученные при обследовании 380 детей и подростков, однако они не могут быть признаны репрезентативными.

Сведений об использовании в СНГ нет.

«НАРИСУЙ ЧЕЛОВЕКА» ТЕСТ (Draw-A-Person Test, DAP) - проективная ме­тодика исследования личности. Разрабо­тана К. Маховер в 1948 г. на основе теста Ф. Гудинаф, предназначенного для опре­деления уровня интеллектуального разви­тия детей и подростков с помощью выпол­ненного ими рисунка мужчины (см. Гуди­наф «Нарисуй человека» тест).

«Н. ч.» т. можно использовать для об­следования как взрослых, так и детей, до­пускается групповое обследование.

Обследуемому предлагают каранда­шом на чистом листе бумаги нарисовать человека. После выполнения рисунка ему дают задание нарисовать человека проти­воположного пола. Заключительный этап обследования - опрос. К. Маховер со­ставлены специальные перечни вопросов о нарисованных фигурах. Эти вопросы ка­саются возраста, образования, семейного положения, привычек и т. д.

При интерпретации полученных дан­ных автор исходит из идеи о том, что ри­сунок является выражением «Я» обследу­емого. Значительное внимание уделяется анализу разнообразных деталей рисунка, прежде всего особенностям изображения основных частей тела, которые зачастую оценивают в соответствии с психоанали­тической символикой. Изучение валидно­сти «Н. ч.» т. западными психологами привело к противоречивым результатам в силу умозрительности предлагаемых ав­тором интерпретаций. Имеются данные о том, что общие субъективные оценки бо­лее валидны и надежны, нежели оценки по отдельным деталям рисунка.

В СССР «Н. ч.» т. первоначально при­менялся в клинико-психологических ис­следованиях. Анализировались преиму­щественно формальные аспекты рисун­ков, напр, размер фигуры, ее расположе­ние на листе бумаги, степень законченно­сти рисунка и т. п. (Ю. С. Савенко, 1970). Полученные при обследовании пациента результаты соотносились с клинической картиной заболевания, обогащая и уточ­няя представление о больном. Начиная с 90-х годов сфера использования теста су­щественно расширяется, выполнено не­мало исследований в возрастной и педаго­гической психологии.

НАРУШЕНИЙ ПСИХИЧЕСКОЙ АДАПТАЦИИ ОПРОСНИК (НПА) - опросник личностный, разработан А. И. Скорик и Л. С. Свердловым в 1993 г. Предназначен для предварительной диаг­ностики адаптационных нарушений.

Методика носит скрининговый харак­тер (см. Отсеивание). Исследование, проводимое при помощи НПА, позволяет получить общее представление о наличии или отсутствии проявлений психической дезадаптации, их основных особенностях. Требования,предъявляемые к такого рода ускоренной диагностике, обусловили не­большой объем опросника и простоту об­работки первичных данных.

Опросник НПА состоит из 37 утверж­дений, касающихся личностных качеств и психологических особенностей испытуе­мого, состояния соматической сферы, представлений о психическом здоровье, восприятия некоторых обыденных жизненных проблем. Задания опросника тре­буют только утвердительных или отрица­тельных ответов («да»-«нет», «верно»- «неверно», «согласен»-«не согласен»). Ответ «не знаю» не допускается. Опросник может применяться при индивидуаль­ном и групповом обследовании. Оценки первичные подсчитываются в соответ­ствии с «ключом», раздельно по 6 шкалам опросника. Особенностью первичной об­работки является то, что подсчитывается не просто число совпадений с ключом с оценкой 1 балл за каждое совпадение, а суммируются удельные веса каждого из совпавших с ключевым значением отве­тов (см. Внутренняя согласованность). Весовая величина каждого пункта рассчи­тывалась на основе определения фактор­ной нагрузки (см. Факторный анализ) данного ответа в измеряемом шкалой при­знаке. Расчет сделан таким образом, что веса пунктов выражаются целыми числа­ми от 1 до 9. Сырые оценки переводятся в стандартные Т-баллы (см. Оценки шкаль­ные). Результаты представляются графи­чески на специальном бланке в виде оце­нок профильных.

Шкалы опросника разработаны на ос­нове результатов факторного анализа первичного статистического материала, полученного в соответствующих клини­ческих группах испытуемых: 1. (В) Опи­сывает переживание общего физического и психического комфорта. В норме у адап­тированных испытуемых оценка по дан­ной шкале имеет тенденцию к повыше­нию. 2. (Н) Шкала «ипохондрии» - отра­жает степень фиксации на соматическом неблагополучии. При нарушениях адапта­ции оценка по данной шкале повышается. 3. (М) Шкала «гипоманиакальности» - фиксирует ощущение комфорта с оттен­ком эйфории, «форсированного благопо­лучия», беспечности. При нарушении адаптации оценка снижается. 4. (Р) Шка­ла описывает депрессивное состояние. Результат отрицательно коррелирует с данными по шкале М. В норме наблюда­ется низкая оценка. 5. (N) Шкала «невротизации» - описывает состояние эффек­тивно-вегетативного дисбаланса, возникающего при эмоциональном напряжении, «нервозность». При нарушениях адапта­ции оценка повышается. 6. (S) Шкала фиксирует нарушения в сфере соци­альных отношений. У дезадаптированных оценка повышается.

При интерпретации данных НПА ос­новное значение имеет анализ «профиля». Наряду с этим авторы предлагают про­стые формальные критерии диагностики дезадаптации. Простейшим из них являет­ся критерий, основанный на высоте про­филя. Дезадаптация имеет место в том случае, если оценки хотя бы двух шкал превышают значения 70 Т или опускают­ся ниже 30 Т либо одна из шкал превыша­ет 80 Т или опускается ниже 20 Т. По дан­ным авторов, вероятность необнаружения реально существующей дезадаптации со­ставляет лишь 5%. Однако вероятность того, что достаточно адаптированные лица будут причислены к дезадаптирован­ным, составляет 22,5%. Это делает дан­ный критерий малопригодным, в частно­сти при проведении массовых эпидемио­логических исследований. Более слож­ным и точным (10% вероятности того, что адаптированные будут причислены к дезадаптированным) является критерий, учи­тывающий дифференцированный резуль­тат по «шкалам благополучия» (В, М) и «шкалам неблагополучия» (Н, D, N, S). Дезадаптация диагностируется в тех слу­чаях, когда В + М составляют 79 Т или когда сумма Н, D, N и S превышает 255 Т. Сравнительные исследования на матери­але контрастных групп показали высо­кую корреляцию комплексного критерия дезадаптации с верифицированным диаг­нозом (r = 0,85, Р< 0,001).

Надежность ретестовая НПА (при интервале ретеста 1 сутки) по различным шкалам колеблется в интервале r t = 0,74-0,90. Имеются сведения о валидности текущей, которая изучалась путем сопоставления данных контрастных групп (группы психически здоровых адекватно адаптированных, психически здоровых с нарушениями адаптации и больных с неврозоподобными состояниями). Сведения о надежности и валидности опросника НПА дают основание предполагать эф­фективность методики в индивидуальном и массовом скрининге состояний психи­ческой дезадаптации.

НЕСУЩЕСТВУЮЩЕЕ ЖИВОТ­НОЕ - проективная методика иссле­дования личности; предложена М. 3. Друкаревич.

Испытуемому предлагают придумать и нарисовать несуществующее животное, а также дать ему ранее не существовавшее имя. Из имеющейся литературы видно, что процедура обследования не стандар­тизована (используются разных размеров листы бумаги для рисования, в одних слу­чаях рисунок выполняется цветными ка­рандашами, в других - одним цветом и т. д.). Общепринятой системы оценки ри­сунка не существует. Теоретические по­сылки, положенные в основу создания ме­тодики, совпадают с таковыми у прочих проективных методик. Как и многие дру­гие рисуночные тесты, Н. ж. направлен на диагностику личностных особенностей, иногда ее творческих потенций.

Показана удовлетворительная валидность конвергентная методики путем установления связи между результатами, полученными с ее помощью, и данными других личностных методик на материале обследования пациентов психиатричес­кой клиники и лиц, проходящих профот­бор в штат МВД (П. В.Яньшин, 1988, 1990). Валидность также подтверждена при дифференциации больных неврозами и здоровых (Т. И. Краско, 1995). Н. ж. - одна из наиболее популярных рисуночных методик и широко используется психоло­гами СНГ при обследовании детей и взрослых, больных и здоровых чаще всего в качестве ориентирующей методики, т. е. такой, данные которой позволяют выдвинуть некоторые гипотезы об особен­ностях личности.

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ - вид распределения переменных. Н. р. наблюдается при изменении призна­ка (переменной) под влиянием множества относительно независимых факторов. График уравнения Н. р. представляет со­бой симметричную унимодальную колоколообразную кривую, осью симметрии ко­торой является вертикаль (ордината), проведенная через точку 0 (рис. 46).

Рис. 46. Процентное распределение случаев под нормальной кривой

Кривая Н. р. была построена для про­стого аппроксимативного решения задачи вероятности частот событий. Нормальная кривая описывается формулой де Муавра

U - высота кривой над каждым за­данным значением x i , - среднее арифметическое x i , - среднеквадратическое отклонение от .

Теоретически существует бесконечное множество нормальных кривых с кон-летными значениями М и σ. При стандартизации тестовых оценок и в некоторых других случаях используется Н. р. со следующими характеристиками: М = 0; σ= 1; площадь под нормальной кривой равна единице. Такое распределе­ние носит название стандартного (единич­ного) Н. р. Для любого Н. р. в пределах значений х 1 . М + σ лежит около 68%, в пределах М ± 2σ - 95%, М ± 3σ - 99,7% площади под кривой. Частоты слу­чаев, укладывающихся в интервалы, огра­ниченные значениями от М ± σ до М ± σ, составляют 68,26%; 95,44%; 99,72%; 99,98 % соответственно (рис. 46). Высо­та кривой (U) над значением М приблизи­тельно равна 0,3989. Асимметрия стан­дартной, как и любой другой нормальной, кривой равна нулю, эксцесс (Q) - трем (см. Оценка типа распределения). Рас­пределение показателей, получаемых в эмпирических психологических и психо­диагностических исследованиях при боль­шом числе наблюдений, как правило, при­ближается к Н. р.

На практике важную роль имеет вы­числение площади слева от любой точки на оси абсцисс, ограниченной участком нормальной кривой и ординатой этой точки. Так как площадь стандартного Н. р. равна единице, то доля этой площа­ди отражает частоту случаев с х i , мень­шими, чем данное значение на оси X. Ре­шение уравнения де Муавра для любого значения х неудобно, поэтому для опре­деления площади слева от данного зна­чения в различных Н. р. (по оси z ) име­ются специальные таблицы (см. табл. 1 Приложения III).

Важнейшим качеством Н. р. является то, что для семейства нормальных кривых характерны одинаковые доли площадей, лежащих под участками, ограниченными равными значениями σ. При этом любую нормальную кривую можно свести к еди­ничной и таким образом ответить на во­прос о площади между выбранными точками на кривой или высоте кривой над любой из точек оси X. Форма нормальной кривой не изменяется при вычитании среднего значения и делении на σ. Так, если нужно выяснить, какая часть площади лежит слева от значения х = x l

Площадь слева от z для этого значения составит 0,1020 (10,2%). Следовательно, число лиц, имеющих оценку ниже 8,3, составляет 89,8%, а число лиц с оцен­кой в интервале 8,3-10,4 составляет 97,5-89,8 = 7,7%.

Число случаев в пределах стандартно­го отклонения можно легко определить без расчетов. Так, в интервале оценок, со­ответствующих -2 и - , находится 13,6% обследованных (см. рис. 46).

Дисперсионный анализ – статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Первоначально (1918г.) дисперсионный анализ был разработан английским математиком – статистиком Р.А. Фишером для обработки результатов агрономических опытов по выявлению условий получения максимального урожая различных сортов сельскохозяйственных культур.

При постановке опыта необходимо соблюдение условий:

    Каждый вариант опыта необходимо проводить на нескольких единицах наблюдения (групп животных, участков поля и т.п.)

    Распределение единиц наблюдения между вариантами опыта должно быть случайным, а не преднамеренным.

В дисперсионном анализе используется F -критерий (критерий Р.А. Фишера), представляющий отношение двух дисперсий:

где d факт, d ост – факторная (межгрупповая) и остаточная (внутригрупповая) дисперсии на одну степень свободы соответственно.

Факторная и остаточная дисперсии являются оценками дисперсии совокупности, рассчитываются по выборочным данным с учетом числа степеней свободы вариации.

Факторная (межгрупповая) дисперсия объясняет вариацию результативного признака под влиянием изучаемого фактора.

Остаточная (внутригрупповая) дисперсия объясняет вариацию результативного признака, обусловленную влиянием прочих факторов (за исключением влияния изучаемого фактора).

В сумме факторная и остаточная дисперсии дают общую дисперсию, выражающую влияние всех факторных признаков на результативный.

Порядок проведения дисперсионного анализа:

1. Опытные данные заносятся в расчетную таблицу и определяются суммы и средние значения в каждой группе изучаемой совокупности, а также общая сумма и среднее значение по всей совокупности (табл.1).

Таблица 1

Значение результативного признака для i-й единицы

в j-й группе, x ij

Число наблюдений, f j

Средние (групповые и общая), х j

x 11 , x 12 , …, х 1 n

х 21 , х 22 , …, х 2 n

х m 1 , х m 2 , …, х mn

Общее количество наблюдений n рассчитывается как сумма числа наблюдений f j в каждой группе:

Если во всех группах число элементов одинаковое, то общая средняя находится из групповых средних как простая средняя арифметическая:

Если же число элементов в группах разное, то общая средняя рассчитывается по формуле средней арифметической взвешенной:

2. Определяется общая дисперсия D общ как сумма квадратов отклонений индивидуальных значений результативного признака от общей средней :

3. Рассчитывается факторная (межгрупповая) дисперсия D факт как сумма квадратов отклонений групповых средних от общей средней , умноженных на число наблюдений:

4. Определяется величина остаточной (внутригрупповой) дисперсии D ост как разность между общей D общ и факторной D факт дисперсиями:

5. Рассчитываются число степеней свободы факторной
дисперсии как разница между числом группm и единицей:

6. Определяется число степеней свободы для остаточной дисперсии
как разница между количеством индивидуальных значений признакаn и числом групп m :

7. Рассчитывается величина факторной дисперсии на одну степень свободы d факт как отношение факторной дисперсии D факт к числу степеней свободы факторной дисперсии
:

8. Определяется величина остаточной дисперсии на одну степень свободыd ост как отношение остаточной дисперсии D ост к числу степеней свободы остаточной дисперсии
:

9. Определяется расчетное значение F-критерия F -расч как отношение факторной дисперсии на одну степень свободыd факт к остаточной дисперсии на одну степень свободы d ост :

10. По таблице F-критерия Фишера с учетом принятого в исследовании уровня значимости, а также с учетом степеней свободы для факторной и остаточной дисперсий находят теоретическое значение F табл .

5%-ному уровню значимости соответствует 95%-ный уровень вероятности, 1%-ному – 99%-ный уровень вероятности. В большинстве случаев используют 5%-ный уровень значимости.

Теоретическое значение F табл при заданном уровне значимости определяют по таблицам на пересечении строки и столбца, соответствующим двум степеням свободы дисперсий:

по строке – остаточной;

по столбцу – факторной.

11. Результаты расчетов оформляются в таблицу (табл.2).

Рассмотренные выше приемы проверки статистических гипотез о существенности различий между двумя средними на практике имеют ограниченное применение. Это связано с тем, что для выявления действия всех возможных условий и факторов на результативный признак полевые и лабораторные опыты, как правило, проводят с использованием не двух, а большего числа выборок (1220 и более).

Часто исследователи сравнивают средние нескольких выборок, объединенных в единый комплекс. Например, изучая влияние различных видов и доз удобрений на урожайность сельскохозяйственных культур опыты повторяют в разных вариантах. В этих случаях попарные сравнения становятся громоздкими, а статистический анализ всего комплекса требует применения особого метода. Такой метод, разработанный в математической статистике, получил название дисперсионного анализа. Впервые его применил английский статистик Р. Фишер при обработке результатов агрономических опытов (1938 г.).

Дисперсионный анализ - это метод статистической оценки надежности проявления зависимости результативного признака от одного или нескольких факторов. С помощью метода дисперсионного анализа проводится проверка статистических гипотез относительно средних в нескольких генеральных совокупностях, имеющих нормальное распределение.

Дисперсионный анализ является одним из основных методов статистической оценки результатов эксперимента. Все более широкое применение получает он и в анализе экономической информации. Дисперсионный анализ дает возможность установить, насколько выборочные показатели связи результативного и факторных признаков достаточны для распространения полученных по выборке данных на генеральную совокупность. Достоинством этого метода является то, что он дает достаточно надежные выводы по выборкам небольшого численности.

Исследуя вариацию результативного признака под влиянием одного или нескольких факторов с помощью дисперсионного анализа можно получить помимо общих оценок существенности зависимостей, также и оценку различий в величине средних, которые формируются при различных уровнях факторов, и существенности взаимодействия факторов. Дисперсионный анализ применяется для изучения зависимостей как количественных, так и качественных признаков, а также при их сочетании.

Суть этого метода заключается в статистическом изучении вероятности влияния одного или нескольких факторов, а также их взаимодействия на результативный признак. Согласно этого с помощью дисперсионного анализа решаются три основных задачи: 1) общая оценка существенности различий между групповыми средними; 2) оценка вероятности взаимодействия факторов; 3) оценка существенности различий между парами средних. Чаще всего такие задачи приходится решать исследователям при проведении полевых и зоотехнических опытов, когда изучается влияние нескольких факторов на результативный признак.

Принципиальная схема дисперсионного анализа включает установление основных источников варьирование результативного признака и определение объемов вариации (сумм квадратов отклонений) по источникам ее образования; определение числа степеней свободы, соответствующих компонентам общей вариации; вычисления дисперсий как отношение соответствующих объемов вариации к их числу степеней свободы; анализ соотношения между дисперсиями; оценка достоверности разницы между средними и формулирование выводов.

Указанная схема сохраняется как при простых моделях дисперсионного анализа, когда данные группируются по одному признаку, так и при сложных моделях, когда данные группируются по двумя и большим числом признаков. Однако с увеличением числа групповых признаков усложняется процесс разложение общей вариации по источникам ее образования.

Согласно принципиальной схемы дисперсионный анализ можно представить в виде пяти последовательно выполняемых этапов:

1) определение и разложения вариации;

2) определение числа степеней свободы вариации;

3) вычисление дисперсий и их соотношений;

4) анализ дисперсий и их соотношений;

5) оценка достоверности разницы между средними и формулировка выводов по проверке нулевой гипотезы.

Наиболее трудоемкой частью дисперсионного анализа является первый этап - определение и разложения вариации по источникам ее образования. Порядок разложения общего объема вариации подробно рассматривался в главе 5.

В основе решения задач дисперсионного анализа лежит закон разложения (добавление) вариации, согласно которого общая вариация (колебания) результативного признака делится на две: вариацию, обусловленную действием исследуемого фактора (факторов), и вариацию, вызванную действием случайных причин, то есть

Предположим, что исследуемая совокупность поделена по факторным признаком на несколько групп, каждая из которых характеризуется своей средней величине результативного признака. При этом вариацию этих величин можно объяснить двумя видами причин: такими, которые действуют на результативный признак систематически и поддаются регулировке в ходе проводимого эксперимента и регулировке не поддаются. Очевидно, что межгрупповая (факторная или систематическая) вариация зависит преимущественно от действия исследуемого фактора, а внутригрупповая (остаточная или случайная) - от действия случайных факторов.

Чтобы оценить достоверность различий между групповыми средними, необходимо определить межгрупповую и внутригрупповое вариации. Если межгрупповая (факторная) вариация значительно превышает внутригрупповое (остаточную) вариацию, то фактор влиял на результативный признак, существенно изменяя значения групповых средних величин. Но возникает вопрос, каково соотношение между міжгруповою и внутрішньогруповою вариациями можно рассматривать как достаточное для вывода о достоверности (существенности) различий между групповыми средними.

Для оценки существенности различий между средними и формулировка выводов по проверке нулевой гипотезы (Н0:х1 = х2 =... = хп) в дисперсионном анализе используется своеобразный норматив - Г-критерий, закон распределения которого установил Р.фишер. Этот критерий представляет собой отношение двух дисперсий: факторного, порождаемой действием изучаемого фактора, и остаточной, обусловленной действием случайных причин:

Дисперсионное отношение Г= £>и : £*2 американским статистиком Снедекором предложено обозначать буквой Г в честь изобретателя дисперсионного анализа Р.Фішера.

Дисперсии °2 іо2 являются оценками дисперсии генеральной совокупности. Если выборки с дисперсиями °2 °2 сделаны из одной и той же генеральной совокупности, где вариация величин имела случайный характер, то расхождение в величинах °2 °2 также случайна.

Если в эксперименте проверяют влияние нескольких факторов (А, В, С и т.д.) на результативный признак одновременно, то дисперсия, обусловленная действием каждого из них, должна быть сравнима с °е.гР , то есть

Если значение факторной дисперсии значительно больше остаточной, то фактор существенно влиял на результативный признак и наоборот.

В многофакторных экспериментах кроме вариации, обусловленной действием каждого фактора, практически всегда есть вариация, обусловленная взаимодействием факторов ($ав: ^лс ^вс $лііс). Суть взаимодействия заключается в том, что эффект одного фактора существенно меняется на разных уровнях второго (например, эффективность качества Почвы при разных дозах удобрений).

Взаимодействие факторов также должна быть оценена путем сравнения соответствующих дисперсий 3 ^в.гр:

При исчислении фактического значения Б-критерия в числителе берется большая из дисперсий, поэтому Б > 1. Очевидно, что чем больше критерий Бы, тем значительнее различия между дисперсиями. Если Б = 1, то вопрос об оценке существенности различий дисперсий снимается.

Для определения пределов случайных колебаний отношение дисперсий Г. Фишер разработал специальные таблицы Б-распределения (прил. 4 и 5). Критерий Бы функционально связанный с вероятностью и зависит от числа степеней свободы вариации к1 и к2 двух сравниваемых дисперсий. Обычно используются две таблицы, позволяющие делать выводы о предельно высокое значение критерия для уровней значимости 0,05 и 0,01. Уровень значимости 0,05 (или 5%) означает, что только в 5 случаях из 100 критерий Б может принимать значение, равное указанному в таблице или выше его. Снижение уровня значимости с 0,05 до 0,01 приводит к увеличению значения критерия Бы между двумя дисперсиями в силу действия только случайных причин.

Значение критерия также зависит непосредственно от числа степеней свободы двух сравниваемых дисперсий. Если число степеней свободы стремится к бесконечности (к-ме), то отношение Бы для двух дисперсий стремится к единице.

Табличное значение критерия Б показывает возможную случайную величину отношения двух дисперсий при заданном уровне значимости и соответствующем числе степеней свободы для каждой из сравниваемых дисперсий. В указанных таблицах приводится величина Б для выборок, сделанных из одной и той же генеральной совокупности, где причины изменения величин только случайные.

Значение Г находят по таблицам (прил. 4 и 5) на пересечении соответствующего столбца (число степеней свободы для большей дисперсии - к1) и строки (число степеней свободы для меньшей дисперсии - к2). Так, если большей дисперсии (числитель Г) к1 = 4, а меньшей (знаменатель Г) к2 = 9, то Га при уровне значимости а = 0,05 составит 3,63 (прил. 4). Итак, в результате действия случайных причин, поскольку малочисленные выборки, дисперсия одной выборки может при 5%-ном уровне значимости превышать дисперсию для второй выборки в 3,63 раза. При снижении уровня значимости с 0,05 до 0,01 табличное значение критерия Г, как отмечалось выше, будет увеличиваться. Так, при тех же степенях свободы к1 = 4 и к2 = 9 и а = 0,01 табличное значение критерия Г составит 6,99 (прил. 5).

Рассмотрим порядок определения числа степеней свободы в дисперсионном анализе. Число степеней свободы, что соответствует общей сумме квадратов отклонений, раскладывается на соответствующие компоненты аналогично разложению сумм квадратов отклонений (^общ = №^гр + ]¥вхр) , то есть общее число степеней свободы (к") раскладывается на число степеней свободы для межгрупповой (к1) и внутригрупповой (к2) вариаций.

Так, если выборочная совокупность, состоящая из N наблюдений, деленная на т групп (число вариантов опыта) и п подгрупп (количество повторностей), то число степеней свободы к соответственно составит:

а) для общей суммы квадратов отклонений (й7заг)

б) для межгрупповой суммы квадратов отклонений ^м.гР)

в) для внутригрупповой суммы квадратов отклонений в в.гР)

Согласно правилу сложения вариации:

Например, если в опыте было сформировано четыре варианта опыта (т = 4) в пяти повторностях каждый (п = 5), и общее количество наблюдений N = = т o п = 4 * 5 = 20, то число степеней свободы соответственно равно:

Зная суммы квадратов отклонений число степеней свободы, можно определить несмещенные (скорректированные) оценки для трех дисперсий:

Нулевую гипотезу Н0 по критерию Б проверяют так же, как и по и-критерию Стьюдента. Чтобы принять решение по проверки Н0, необходимо рассчитать фактическое значение критерия и сравнить его с табличным значением Ба для принятого уровня значимости а и числа степеней свободы к1 и к2 для двух дисперсий.

Если Бфакг > Ба, то в соответствии с принятым уровнем значимости можно сделать вывод, что различия выборочных дисперсий определяются не только случайными факторами; они существенные. Нулевую гипотезу в этом случае отклоняют и есть основание утверждать, что фактор существенно влияет на результативный признак. Если же < Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Применение той или иной модели дисперсионного анализа зависит как от количества изучаемых факторов, так и от способа формирования выборок.

в Зависимости от количества факторов, определяющих вариацию результативного признака, выборки могут быть сформированы по одним, двумя и большим числом факторов. Согласно этому дисперсионный анализ делится на однофакторный и многофакторный. Иначе его еще называют однофакторним и многофакторным дисперсионным комплексом.

Схема разложение общей вариации зависит от формирования групп. Оно может быть случайным (наблюдение одной группы не связаны с наблюдениями второй группы) и неслучайным (наблюдение двух выборок связаны между собой общностью условий эксперимента). Соответственно получают независимые и зависимые выборки. Независимые выборки могут быть сформированы как с ровной, так и неровной численностью. Формирование зависимых выборок предполагает их равную численность.

Если группы сформированы в невипадковому порядке, то общий объем вариации результативного признака включает в себя наряду с факторным (міжгруповою) и остаточной вариацией вариацию повторностей, то есть

На практике в большинстве случаев приходится рассматривать зависимые выборки, когда условия для групп и подгрупп выравниваются. Так, в полевом опыте весь участок разбивают на блоки, с максимально вирівняннями условиями. При этом каждый вариант опыта получает равные возможности быть представленным во всех блоках, чем достигается выравнивание условий для всех проверяемых вариантов, опыта. Такой метод построения опыта получил название метода рендомізованих блоков. Аналогично проводятся и опыты с животными.

При обработке методом дисперсионного анализа социально-экономических данных необходимо иметь в виду, что в силу багаточисельності факторов и их взаимосвязи трудно даже при самом тщательном выравнивании условий установить степень объективного влияния каждого отдельного фактора на результативный признак. Поэтому уровень остаточной вариации определяется не только случайными причинами, но и существенными факторами, которые не были учтены при построении модели дисперсионного анализа. В результате этого остаточная, дисперсия как база сравнения иногда становится неадекватным своему назначению, она явно завышается по величине и не может выступать как критерий существенности влияния факторов. В связи с этим при построении моделей дисперсионного анализа становится актуальной проблема отбора важнейших факторов и выравнивания условий для проявления действия каждого из них. Кроме того. применение дисперсионного анализа предполагает нормальный или близкий к нормальному распределение исследуемых статистических совокупностей. Если это условие не выдерживается, то оценки, полученные в дисперсионном анализе, окажутся преувеличенными.

Дисперсионный анализ – анализ изменчивости результативного признака под влиянием каких-либо контролируемых переменных факторов. (В зарубежной литературе именуется ANOVA – «Analisis of Variance»).

Результативный признак называют также зависимым признаком, а влияющие факторы – независимыми признаками.

Ограничение метода: независимые признаки могут измеряться по номинальной, порядковой или метрической шкале, зависимые – только по метрической. Для проведения дисперсионного анализа выделяют несколько градаций факторных признаков, а все элементы выборки группируют в соответствии с этими градациями.

Формулировка гипотез в дисперсионном анализе.

Нулевая гипотеза: «Средние величины результативного признака во всех условиях действия фактора (или градациях фактора) одинаковы».

Альтернативная гипотеза: «Средние величины результативного признака в разных условиях действия фактора различны».

Дисперсионный анализ можно подразделить на несколько категорий в зависимости:

от количества рассматриваемых независимых факторов;

от количества результативных переменных, подверженных действию факторов;

от характера, природы получения и наличия взаимосвязи сравниваемых выборок значений.

При наличии одного фактора, влияние которого исследуется, дисперсионный анализ именуется однофакторным, и распадается на две разновидности:

- Анализ несвязанных (то есть – различных) выборок . Например, одна группа респондентов решает задачу в условиях тишины, вторая – в шумной комнате. (В этом случае, к слову, нулевая гипотеза звучала бы так: «среднее время решения задач такого-то типа будет одинаково в тишине и в шумном помещении», то есть не зависит от фактора шума.)

- Анализ связанных выборок , то есть, двух замеров, проведенных на одной и той же группе респондентов в разных условиях. Тот же пример: в первый раз задача решалась в тишине, второй – сходная задача – в условиях шумовых помех. (На практике к подобным опытам следует подходить с осторожностью, поскольку в действие может вступить неучтенный фактор «научаемость», влияние которого исследователь рискует приписать изменению условий, а именно, - шуму.)

В случае если исследуется одновременное воздействие двух или более факторов, мы имеем дело с многофакторным дисперсионным анализом, который также можно подразделить по типу выборки.

Если же воздействию факторов подвержено несколько переменных, - речь идет о многомерном анализе . Проведение многомерного дисперсионного анализа предпочтительнее одномерного только в том случае, когда зависимые переменные не являются независимыми друг от друга и коррелируют между собой.

Обобщенно задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности:

    вариативность, обусловленную действием каждой из исследуемых независимых переменных (факторов).

    вариативность, обусловленную взаимодействием исследуемых независимых переменных.

    вариативность случайную, обусловленную всеми неучтенными обстоятельствами.

Для оценки вариативности, обусловленной действием исследуемых переменных и их взаимодействием вычисляется отношение соответствующего показателя вариативности и случайной вариативности. Показателем этого соотношения является F – критерий Фишера.

Чем в большей степени вариативность признака обусловлена действием влияющих факторов или их взаимодействием, тем выше эмпирические значения критерия .

В формулу расчета критерия входят оценки дисперсий, и, следовательно, этот метод относится к разряду параметрических.

Непараметрическим аналогом однофакторного дисперсионного анализа для независимых выборок является критерий Краскела-Уоллеса. Он подобен критерию Манна-Уитни для двух независимых выборок, за тем исключением, что он суммирует ранги для каждой из групп.

Кроме этого, в дисперсионном анализе может быть применен медианный критерий. При его использовании для каждой группы определяются число наблюдений, которые превышают медиану, вычисленную по всем группам, и число наблюдений, которые меньше медианы, после чего строится двумерная таблица сопряженности.

Критерий Фридмана является непараметрическим обобщением парного t-критерия для случая выборок с повторными измерениями, когда количество сравниваемых переменных больше двух.

В отличие от корреляционного анализа, в дисперсионном анализе исследователь исходит из предположения, что одни переменные выступают как влияющие (именуемые факторами или независимыми переменными), а другие (результативные признаки или зависимые переменные) – подвержены влиянию этих факторов. Хотя такое допущение и лежит в основе математических процедур расчета, оно, однако, требует осторожности при выводах о причине и следствии.

Например, если мы выдвигаем гипотезу о зависимости успешности работы должностного лица от фактора Н (социальной смелости по Кэттелу), то не исключено обратное: социальная смелость респондента как раз и может возникнуть (усилиться) вследствие успешности его работы – это с одной стороны. С другой: следует отдать себе отчет в том, как именно измерялась «успешность»? Если за ее основу взяты были не объективные характеристики (модные нынче «объемы продаж» и проч.), а экспертные оценки сослуживцев, то имеется вероятность того, что «успешность» может быть подменена поведенческими или личностными характеристиками (волевыми, коммуникативными, внешними проявлениями агрессивности etc.).

Дисперсионный анализ – метод статистического исследования, с помощью которого изучается влияние отдельных факторов на результативный показатель. Он позволяет среди множества факторов выделить один и оценить его влияние на вариацию результативного признака и влияние всех других факторов в совокупности на вариацию результативного признака.

Целью дисперсионного анализа является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации.

Этапы проведения дисперсионного анализа:

1. Определяется множество факторов, потенциально влияющих на Y.

2. Из всех факторов выделяется один основной.

3. Проводится группировка всей совокупности данных по выбранному признаку (число, интервал).

4. Рассчитывается общая дисперсия Y(по всей совокупности): .

5. Рассчитывается межгрупповая дисперсия – характеризует вариацию Yпод влиянием фактора, положенного в основу группировки:
,

где: n j – объем группы; – среднее значение признака внутри группы.

6. Вариация Yпод влиянием прочих факторов оценивается с помощью средней из внутригрупповых дисперсий:
.

7. Проверка: сумма межгрупповой дисперсии и средней из внутригрупповых дисперсий должна равняться общей дисперсии (теорема сложения дисперсии):
.

8. Правильность выбора фактора оценивается с помощью относительных показателей вариации:

– коэффициент детерминации:
– характеризует долю вариацииY, обусловленную влиянием фактора (например, 70% – т.е. 70% вариации Y объясняется влиянием фактора);

– эмпирическое корреляционное отношение:
– характеризует тесноту связи (по шкале Чеддока).

Как правило, дисперсионный анализ проводится итеративным способом, когда происходит последовательный анализ влияния факторов на Yдо тех пор, пока не будут определены наиболее важные факторы.

30. Использование индексного метода в анализе экономической информации

Индекс – относительный показатель характеризующий изменение величины какого либо явления во времени, в пространстве или по сравнению с любым этапом.

Индексный метод – метод статистического исследования, с помощью которого характеризуется развитие явления во времени, в пространстве, в сравнении с эталоном, а также изучается роль факторов в изменении сложных явлений.

Статистический индекс – это относительная величина сравнения сложных совокупностей и отдельных их единиц путем сопоставления абсолютных величин.

Основой индексного метода при определении изменений в производстве и обращении товаров является переход от натурально-вещественной формы выражения товарных масс к стоимостным (денежным) измерителям. Именно посредством денежного выражения стоимости отдельных товаров устраняется их несравнимость как потребительских стоимостей и достигается единство.

При вычислении индексов выделяют:

– сравниваемый уровень (уровень текущего периода, данного предприятия);

– основание сравнения (уровень базисного периода, плановый уровень, уровень по к.-л. объекту).

Виды индексов:

1. По степени охвата: индивидуальные, общие.

2. По базе сравнения: динамические (изменение во времени), территориальные.

3. Динамические: базисные (i 1 = q 1 / q 0 ;i 2 = q 2 / q 0 ) и цепные (i 1 = q 1 / q 0 ;i 2 = q 2 / q 1 ).

4. По характеру объема исследования: количественные, качественные.

5. По охвату явления: постоянного, переменного состава.

6. По периоду исчисления: годовые, квартальные..

Индивидуальные – характеризуют изменение отдельных единиц статистической совокупности или свойства единицы совокупности. Числитель – то, что изучается. Знаменатель – база, с чем сравнивается.

,
,
,

Общие – характеризуют сводные результаты изменения всех единиц в совокупности:

Для характеристики изменения: I Q = Q 1 / Q 0 .

Агрегатные – в числителе и знаменателе содержатся соединенные наборы элементов изучаемых совокупностей. Сопоставимость разнородных единиц достигается введением в индекс специальных сомножителей – соизмерителей. При этом значение соизмерителя и в числителе, и в знаменателе фиксируется на одном уровне (базовом или текущем):

(Пааше),
(Ласпейрес),I pq = I р I q . Тогда:
,
.

(Фишер).

Средние (используют реальные экономические категории в качестве соизмерителей):


(средняя гармоническая взвешанная форма);


(средняя арифметическая взвешанная).

Индекс переменного , постоянного состава и структурных сдвигов – средняя рентабельность:

,
,

Абсолютное изменение показателей под влиянием факторов:

Δ pq = ∑ p 1 q 1 – ∑ p 0 q 0 .

Δ p = ∑ p 1 q 1 – ∑ p 0 q 1 .

Δ q = ∑ p 0 q 1 – ∑ p 0 q 0 .