Биографии Характеристики Анализ

Интервални вариационни серии на равни интервали. За студенти и ученици - помощ при учене

При обработка на големи количества информация, което е особено важно при провеждане на съвременна научни разработки, изследователят е изправен пред сериозната задача да групира правилно изходните данни. Ако данните са дискретни, тогава, както видяхме, няма проблеми - просто трябва да изчислите честотата на всяка характеристика. Ако изследваната черта има непрекъснатохарактер (което е по-често срещано в практиката), то изборът на оптимален брой интервали за групиране на признак никак не е тривиална задача.

За групиране на непрекъснати случайни променливи, цялата диапазон на вариацияфункцията е разделена на няколко интервала да се.

Групиран интервал (непрекъснато) вариационни серии наречени интервали, класирани по стойността на характеристиката (), където е посочен заедно със съответните честоти () броят на наблюденията, които са попаднали в r"-ия интервал, или относителните честоти ():

Интервали на характерни стойности

mi честота

стълбовидна диаграмаи кумулативен (ogiva),вече разгледани подробно от нас, са отличен инструмент за визуализация на данни, който ви позволява да получите първоначално разбиране на структурата на данните. Такива графики (фиг. 1.15) се изграждат за непрекъснати данни по същия начин, както за дискретни данни, само като се вземе предвид фактът, че непрекъснатите данни напълно запълват областта на възможните им стойности, като приемат всякакви стойности.

Ориз. 1.15.

Ето защо колоните на хистограмата и кумулата трябва да са в контакт, да нямат области, където стойностите на атрибута не попадат във всички възможни(т.е. хистограмата и кумулацията не трябва да имат "дупки" по абсцисната ос, в които стойностите на изследваната променлива не попадат, както на фиг. 1.16). Височината на лентата съответства на честотата - броят на наблюденията, които попадат в дадения интервал, или на относителната честота - делът на наблюденията. Интервали не трябва да пресичаи обикновено са с еднаква ширина.

Ориз. 1.16.

Хистограмата и многоъгълникът са приближения на кривата на вероятностната плътност ( диференциална функция) f(x)теоретично разпределение, разглеждано в курса по теория на вероятностите. Поради това тяхната конструкция е от такова значение при първичната статистическа обработка на количествени непрекъснати данни - по формата им може да се съди за хипотетичния закон на разпределение.

Cumulate - кривата на натрупаните честоти (честоти) на интервалната вариационна серия. Графиката на интегралната функция на разпределение се сравнява с кумулативната F(x), също разглеждани в курса на теорията на вероятностите.

По принцип понятията хистограма и кумулати се свързват точно с непрекъснати данни и техните интервални вариационни серии, тъй като техните графики са емпирични оценки на функцията на плътност на вероятността и функцията на разпределение, съответно.

Изграждането на интервална вариационна серия започва с определяне на броя на интервалите к.И тази задача е може би най-трудната, важна и противоречива в разглежданата проблематика.

Броят на интервалите не трябва да е твърде малък, тъй като хистограмата ще бъде твърде гладка ( прекалено загладен),губи всички характеристики на променливостта на изходните данни - на фиг. 1.17 можете да видите как същите данни, върху които графиките на фиг. 1.15 се използват за изграждане на хистограма с по-малък брой интервали (лявата графика).

В същото време броят на интервалите не трябва да бъде твърде голям - в противен случай няма да можем да оценим плътността на разпределението на изследваните данни по цифровата ос: хистограмата ще се окаже недостатъчно изгладена (недостатъчно загладен)с незапълнени интервали, неравномерно (виж Фиг. 1.17, дясна графика).

Ориз. 1.17.

Как да определите най-предпочитания брой интервали?

През 1926 г. Хърбърт Стърджис предложи формула за изчисляване на броя на интервалите, на които е необходимо да се раздели първоначалният набор от стойности на изследвания атрибут. Тази формула наистина стана супер популярна - повечето статистически учебници я предлагат и много статистически пакети я използват по подразбиране. Дали това е оправдано и във всички случаи е много сериозен въпрос.

И така, на какво се основава формулата на Sturges?

Обмисли биномно разпределение, чиято горна граница включва последното число от класираната серия.

Ние строим интервални серии(Таблица 2.3).

Интервална серия от разпределение на фирмите, но средният брой мениджъри в един от регионите на Руската федерация през първото тримесечие на отчетната година

Заключение.Най-многобройната група фирми е групата със среден брой мениджъри 25-30 души, която включва 8 фирми (27%); най-малката група със среден брой мениджъри 40-45 души включва само една фирма (3%).

Използване на оригиналната таблица с данни. 2.1, както и интервалните серии на разпределението на фирмите по броя на мениджърите (Таблица 2.3), изисква сеизградете аналитична групировка на връзката между броя на мениджърите и обема на продажбите на фирмите и въз основа на нея направете заключение за наличието (или липсата) на връзка между посочените признаци.

Решение:

Аналитичното групиране се изгражда на факторна основа. В нашата задача факторният знак (x) е броят на мениджърите, а резултантният знак (y) е обемът на продажбите (Таблица 2.4).

Да строим сега аналитично групиране(Таблица 2.5).

Заключение.Въз основа на данните от изграденото аналитично групиране може да се каже, че с увеличаване на броя на мениджърите по продажби се увеличава и средният обем на продажбите на компанията в групата, което показва наличието на пряка връзка между тези характеристики.

Таблица 2.4

Помощна таблица за изграждане на аналитична групировка

Брой ръководители, лица,

Фирмен номер

Обем на продажбите, милиони рубли, г

» = 59 f = 9,97

I-™ 4 -Ю.22

74 '25 1PY1

U4 = 7 = 10,61

при = ’ =10,31 30

Таблица 2.5

Зависимостта на обема на продажбите от броя на мениджърите на компанията в един от регионите на Руската федерация през първото тримесечие на отчетната година

ТЕСТОВИ ВЪПРОСИ
  • 1. Каква е същността на статистическото наблюдение?
  • 2. Назовете етапите на статистическото наблюдение.
  • 3. Какви са организационни формистатистическо наблюдение?
  • 4. Назовете видовете статистическо наблюдение.
  • 5. Какво е статистическо резюме?
  • 6. Назовете видовете статистически отчети.
  • 7. Какво е статистическо групиране?
  • 8. Назовете видовете статистически групировки.
  • 9. Какво е серия за разпространение?
  • 10. Назовете структурните елементи на разпределителната серия.
  • 11. Каква е процедурата за изграждане на серия за разпределение?