Статистически редове на разпределение. Статистическо дискретно разпределение

Нека се вземе проба от общата популация и х 1 наблюдавано П 1 път, х 2 - П 2 пъти, x k - p къмпъти и е размерът на извадката. Наблюдавани стойности х 1 се наричат варианти, а поредицата от варианти, записана във възходящ ред - вариационни серии .

Броят на наблюденията на вариантите се нарича честота, а отношението му към размера на извадката се нарича относителна честота.

Определение. Статистически (емпиричен) закон за разпределение на извадката, или просто статистическо разпределение на извадкатаизвикайте варианта на последователността и съответните им честоти n iили относителни честоти.

Статистическото разпределение на извадка е удобно представено под формата на таблица на честотното разпределение, наречена статистическа дискретна серия на разпределение:

(сумата от всички относителни честоти е равна на единица).

Пример 1. При измерване в хомогенни групи от субекти са получени следните проби: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 (пулс). Въз основа на тези резултати съставете статистическа поредица от честотно разпределение и относителни честоти.

Решение. 1) Статистически серии от честотно разпределение:

Контрола: 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.

Честотен полигоннаречена начупена линия, сегментите, които свързват точките За да изградите многоъгълник от честоти по абсцисната ос, оставете опциите х 2 , а по оста y - съответните честоти p i .Точките са свързани чрез сегменти и получават полигон от честоти.

Многоъгълник на относителната честотанаречена начупена линия, сегментите, които свързват точките. За да изградите полигон от относителни честоти върху абсцисата, оставете опциите х i и по оста y съответните честоти wаз Точките се свързват с сегменти и получават многоъгълник от относителни честоти

Пример 2Конструирайте честотен многоъгълник и относителен честотен полигон според данните в Пример 1.

Решение:Използвайки дискретна серия от статистическо разпределение, компилирана в пример 1, ние конструираме честотен полигон и относителен честотен многоъгълник:

2. Серия на статистическо интервално разпределение. стълбовидна диаграма.

Статистически дискретни серии (или емпирична функция на разпределение) обикновено се използват, когато няма твърде много различни опции в извадката или когато дискретността е от съществено значение за изследователя по една или друга причина. Ако характеристиката на общата съвкупност X, която ни интересува, е разпределена непрекъснато или нейната дискретност е непрактично (или невъзможно) да се вземе предвид, тогава опциите се групират в интервали.

Статистическото разпределение може също да бъде определено като последователност от интервали и съответните им честоти (честотата, съответстваща на интервала, се приема като сбор от честотите в този интервал).

1. R(обхват) = X max -X min

2. к-брой групи

3. (формула на Стърджис)

4. a = x min, b = x max

Удобно е да се представи полученото групиране под формата на честотна таблица, която се нарича статистическа интервална серия на разпределение:

Интервали групировки			...
Честоти			...

Аналогична таблица може да се формира чрез замяна на честотите n iотносителни честоти.

Пробата, получена по време на експерименталното изследване, е неподреден набор от числа, записани в последователността, в която са направени измерванията. Обикновено извадката се съставя под формата на таблица, в първия ред (или колона) на която е номерът на опит аз, а във втория (second) - фиксираната стойност на случайната променлива на признака. В тази форма извадката е основната форма за регистриране на статистически материал, който може да се обработва по различни начини. Като пример, нека разгледаме резултатите, показани в състезания по лека атлетика от гюлестрелци и са дадени в таблица 1. Първият ред на тази таблица съдържа числата на измерванията, а вторият - техните числени стойности в метри.

маса 1

Резултати от тласкането на гюле

№
x i	16,36	14,91	15,31	14,26	14,77	13,88	14,97	14,01	14,07	14,48

№
x i	14,44	14,81	13,81	15,15	15,23	15,69	14,29	14,15	14,57	13,92

№
x i	13,62	14,92	15,73	13,22	14,65	14,8	13,04	15,1	13,3

Както може да се види от таблица 1, простата статистическа популация престава да бъде удобна форма за представяне на статистически материал дори при сравнително малък размер на извадката: тя е доста тромава и не е много визуална. Много е трудно да се анализират получените експериментални данни и още повече да се правят изводи въз основа на тях. Въз основа на това полученият статистически материал следва да се обработи за по-нататъшни изследвания. Най-простият начин за обработка на извадка е класирането. Класирането е подреждането на опциите във възходящ или низходящ ред на техните стойности. Таблица 2 по-долу показва класирана извадка, чиито елементи са подредени във възходящ ред.

таблица 2

Резултати от класираните състезания по тласкане на гюле

№
x i	13,04	13,22	13,3	13,62	13,81	13,88	13,92	14,01	14,07	14,15

№
x i	14,26	14,29	14,44	14,48	14,57	14,65	14,77	14,8	14,81	14,91

№
x i	14,92	14,97	15,1	15,15	15,23	15,31	15,69	15,73	16,36

Но дори и в този вид получените експериментални данни са слабо видими и трудно подходящи за директен анализ. Ето защо, за да стане по-компактен и прегледен статистическият материал, той трябва да бъде подложен на допълнителна обработка – изгражда се т. нар. статистически ред. Изграждането на статистически ред започва с групиране.

групираненаречен процес на рационализиране и систематизиране на данните, получени по време на експеримента, насочен към извличане на информацията, съдържаща се в тях. В процеса на групиране се извършва разпределението на варианта на извадката в групи или интервали на групиране, всеки от които съдържа определен диапазон от стойности на изследвания атрибут. Процесът на групиране започва с разделянето на целия диапазон от вариации на характеристиките на интервали за групиране.

За всяка конкретна цел на статистическото изследване, размера на разглежданата извадка и степента на вариация на даден признак в нея има оптимална стойност за броя на интервалите и ширината на всеки от тях. Очаквана стойност на оптималния брой интервали кможе да се определи въз основа на размера на извадката Пили използвайки данните, дадени в таблица 3., или използвайки формулата на Стърджис:

k = 1 + 3.322 lg н.

Таблица 3

Задаване на броя на груповите интервали

Стойността, получена от формулата кпочти винаги се оказва дробна стойност, която трябва да се закръгли до цяло число, тъй като броят на интервалите не може да бъде дробен. Практиката показва, че като правило е по-добре да се закръгли надолу, тъй като формулата дава добри резултати за големи стойности н, а при малки - донякъде надценени.

Нека разгледаме опцията за групиране на извадка на конкретен пример. За да направите това, нека се обърнем към примера с гюлетласкачи (вижте таблици 1, 2). Ще определим броя на интервалите на групиране въз основа на данните, дадени в таблица 3. С размер на извадката н=29 е препоръчително да изберете броя на интервалите, равен на к=5 (формулата на Стърджис дава стойността к =5,9).

Нека се съгласим да използваме интервали с еднаква ширина в разглеждания пример. В този случай, след като се определи броят на груповите интервали, трябва да се изчисли ширината на всеки от тях, като се използва връзката:

Тук че ширината на интервалите, и хмакс и х min - съответно максималната и минималната стойност на признака в извадката. Количества хмакс и х min се определят директно от таблицата с първоначални данни (виж таблица 2). В такъв случай:

(м).

Тук е необходимо да се спрем на точността на определяне на ширината на интервала. Възможни са две ситуации: точността на изчислената стойност чсъвпада с точността на експеримента или я надвишава. В последния случай е възможно да се използват два подхода за определяне на границите на интервалите. От теоретична гледна точка най-правилно е да се използва получената стойност чза изграждане на интервали. Този подход няма да въведе допълнителни изкривявания, свързани с обработката на експериментални данни. Въпреки това, за практически цели в статистическите изследвания, свързани с физическата култура и спорта, е обичайно получената стойност да се закръгля чдо точността на измерването на данните. Това се дължи на факта, че за визуално представяне на получените резултати е удобно границите на интервалите да са възможните стойности на атрибута. По този начин получената стойност на ширината на интервалите трябва да бъде закръглена, като се вземе предвид точността на експеримента. Специално отбелязваме, че закръгляването трябва да се извършва не в общоприетия математически смисъл, а нагоре, т.е. в излишък, за да не се намали общият диапазон на вариация на атрибута - сумата от ширината на всички интервали не трябва да бъде по-малка от разликата между максималните и минималните стойности на атрибута. В разглеждания пример експерименталните данни са определени до най-близките стотни (0,01 m), така че стойността на ширината на интервала, получена по-горе, трябва да се закръгли до най-близките стотни. В резултат на това получаваме:

ч= 0,67 (m).

След определяне на ширината на груповите интервали трябва да се определят техните граници. Препоръчително е долната граница на първия интервал да бъде равна на минималната стойност на характеристиката в извадката хмин.:

х H1 = хмин.

В този пример хН1 = 13,04 (m).

За да получите горната граница на първия интервал ( х B1) е необходимо да добавите стойността на ширината на интервала към стойността на долната граница на първия интервал:

х B1 = х H1 + ч.

Имайте предвид, че горната граница на всеки интервал (тук първият) ще бъде едновременно долната граница на следващия (в този случай втория) интервал: х H2 = хВ 1 .

По подобен начин се определят стойностите на долната и горната граница на всички останали интервали:

хВ i = х H i +1 = х H i + ч.

В този пример:

х B1 = х H2 = х H1 + ч=13,04+0,67=13,71 (m),

х B2 = х H3 = х H2+ ч=13,71+0,67=14,38 (m),

х B3 = х H4 = х H3+ ч=14,38+0,67=15,05 (m),

х B4 = х H5 = х H4+ ч=15,05+0,67=15,72 (m),

х B5 = х H5+ ч=15,72+0,67=16,39 (m).

Преди да групираме вариант, представяме концепцията средната стойност на интервала x i, равна на стойността на атрибута, равноотдалечен от краищата на този интервал. Като се има предвид, че той е отделен от долната граница със стойност, равна на половината от ширината на интервала, за определянето му е удобно да се използва връзката:

x i=хз аз+ ч/2,

където хН i - долна граница аз-ro интервал и ч- ширината му. Средните стойности на интервалите ще бъдат използвани по-късно при обработката на групирани данни.

След определяне на границите на всички интервали е необходимо да се разпределят вариантите на извадката върху тези интервали. Но първо е необходимо да се реши въпросът на кой интервал да се припише стойността, която е точно на границата на два интервала, т.е. когато стойността на вариантите съвпада с горната граница на един и долната граница на интервал, съседен на него. В този случай вариантът може да бъде приписан към всеки от двата съседни интервала и за да се елиминира двусмислието при групирането, ще се съгласим в такива случаи да отнесем вариантите към горния интервал. В полза на този подход може да се направи следният аргумент. Тъй като минималната стойност на атрибута съвпада с долната граница на първия интервал и е включена в този интервал, тогава вариантът, който попада на границата на два интервала, трябва да се припише на един от тях, стойността на долната граница на който е равен на разглеждания вариант.

Нека да преминем към разглеждането на статистическата таблица - вижте таблица 4, която се състои от седем колони.

Таблица 4

Таблично представяне на резултатите от тласкането на гюле

Първите три колони на статистическата таблица съдържат съответно номерата на груповите интервали аз, техните граници х з аз- х AT аз и средни стойности на интервалите х аз .

Четвъртата колона съдържа честотите на интервалите. Честотаинтервал се нарича число, показващо колко опции, т.е. резултатите от измерването попадат в този интервал. За обозначаване на тази стойност е обичайно да се използва символът n i. Сумата от всички честоти на всички интервали винаги е равна на размера на извадката П, с който може да се провери коректността на групирането.

Петата колона от таблица 4 е предвидена за въвеждане в нея натрупана честотаинтервал - числото, получено чрез сумиране на честотата на текущия интервал с честотите на всички предишни интервали. Натрупаната честота обикновено се обозначава с латинската буква N i. Кумулативната честота показва колко опции имат стойности не по-големи от горната граница на интервала.

Шестата колона на таблицата съдържа честотата. Честотанаречена честота, представена в относителни стойности, т.е. съотношение на честотата към размера на извадката. Сумата от всички честоти винаги е равна на 1. Символът, използван за означаване на честотата е фи:

фи=n i /n.

Честотата на даден интервал е свързана с вероятността случайна променлива да попадне в този интервал. Според теоремата на Бернули, с неограничено увеличаване на броя на експериментите, честотата на събитието се сближава по вероятност с неговата вероятност. Ако под събитие разбираме, че стойността на изследваната стойност попада в определен интервал, тогава става ясно, че при голям брой експерименти честотата на интервала се доближава до вероятността измерената случайна променлива да попадне в този интервал.

Както честотата, така и честотата характеризират повторяемостта на резултатите в дадена проба. Сравнявайки статистическата им значимост, трябва да се отбележи, че информационното съдържание на честотата е значително по-високо от това на честотата. Наистина, ако, както например в таблица 4, честотата на втория интервал е 8 и следователно 8 резултата попадат в този интервал, тогава е трудно да се разбере дали това е малко или много; ако има вариант в извадката от 1000, тогава такава честота е малка, а ако е 20, тогава е висока. В този случай за обективна оценка е необходимо стойността на честотата да се сравни с размера на извадката. Ако използваме честотата, тогава можем веднага да кажем каква част от резултатите попадат в разглеждания интервал (приблизително 28% в горния пример). Следователно честотата дава по-визуално представяне на честотата на характеристиката в извадката. Особено важно е да се отбележи друго важно предимство на честотата. Използването му ви позволява да сравнявате проби с различни размери. Честотата за такива цели не е приложима.

Седмата колона на таблицата съдържа натрупаната честота. Натрупана честотае съотношението на кумулативната честота към размера на извадката. Кумулативната честота се обозначава с буквата F i:

Кумулативната честота показва каква част от варианта на извадката има стойности, които не надвишават стойностите на горната граница на интервала.

Последният ред на статистическата таблица се използва за контрол на групирането.

След попълване на таблицата се връщаме към дефиницията на статистическия ред. По правило статистическата серия се изготвя под формата на таблица, в първия ред на която са изброени интервалите, а във втория - честотите или честотите, съответстващи на тях. По този начин, статистически сериисе нарича двойна числова серия, която установява връзка между числената стойност на изследваната характеристика и нейната честота в извадката. Съществено предимство на статистическите серии е, че за разлика от статистическите агрегати, те дават визуално представяне на характерните черти на изменението на признаците.

©2015-2019 сайт
Всички права принадлежат на техните автори. Този сайт не претендира за авторство, но предоставя безплатно използване.
Дата на създаване на страницата: 2016-08-20

Най-простият начин за обобщаване на статистическия материал е изграждането на серии. Резултатът от обобщение на статистическо изследване може да бъде серия на разпределение.

След определяне на характеристиката на групиране, броя на групите и интервалите на групиране, обобщените и груповите данни се представят под формата на редове на разпределение и се представят под формата на статистически таблици.

Разпределителната серия е един вид групиране.

Близо до разпределение в статистиката се нарича подреденото разпределение на съвкупността в групи според всеки един признак: качествен или количествен.

Видове разпределителни серии

В зависимост от признака, който е в основата на формирането на серия на разпределение, се разграничават атрибутивни и вариационни серии на разпределение:

атрибутивни, наречени разпределителни серии, изградени на качествени основания;

сериите на разпределение се наричат вариационни, построени във възходящ или низходящ ред на стойностите на количествена характеристика.

Вариационната серия на разпределението се състои от две колони. Първата колона съдържа количествените стойности на променливата характеристика, които се наричат варианти и се обозначават. Дискретен вариант – изразява се като цяло число. Опцията за интервал е в диапазона от и до. В зависимост от вида на вариантите е възможно да се построи дискретна или интервална вариационна серия. Втората колона съдържа броя на конкретните варианти, изразени като честоти или честоти:

честотите са абсолютни числа, показващи колко пъти дадена стойност на характеристика се среща в съвкупността; сумата от всички честоти трябва да бъде равна на броя на единиците от цялата популация;

честотите са честоти, изразени като процент от общата сума; сумата от всички честоти, изразена като процент, трябва да бъде равна на 100% в части от едно.

Вариационни серии се характеризира с два елемента: вариант (X) и честота (f). Вариантът е отделна стойност на знак на отделна единица или група население. Извиква се числото, показващо колко пъти се появява определена стойност на характеристика честота. Ако честотата е изразена като относително число, тогава тя се нарича честота.

Вариационните серии могат да бъдат:

интервал, когато границите "от" и "до" са определени, серията на интервалното разпределение може да бъде представена графично под формата на хистограма;

дискретни, когато изследваният признак се характеризира с определен брой.

Графично представяне на серии на разпределение

Разпределителните серии са визуализирани с помощта на графични изображения.

Разпределителните серии се показват като:

многоъгълник;

хистограми;

кумулира;

При изграждане многоъгълник на хоризонталната ос (абсцисата) се нанасят стойностите на променливия атрибут, а на вертикалната ос (ос y) - честотите или честотите.

За изграждане хистограми абсцисната ос показва стойностите на границите на интервалите и на тяхна основа се изграждат правоъгълници, чиято височина е пропорционална на честотите (или честотите).

Разпределението на признак във вариационна серия според натрупаните честоти (честоти) се изобразява с помощта на кумулата.

Кумулирайте или кумулативната крива, за разлика от полигона, се изгражда върху натрупаните честоти или честоти. В този случай характерните стойности се поставят върху абсцисната ос, а натрупаните честоти или честоти се поставят върху ординатната ос.

Огива се конструира подобно на кумулата с единствената разлика, че натрупаните честоти са поставени на абсцисната ос, а стойностите на характеристиките са поставени на ординатната ос.

Разновидност на кумулата е кривата на концентрация или графиката на Лоренц. За да се начертае кривата на концентрация, двете оси на правоъгълна координатна система се мащабират като процент от 0 до 100. В този случай абсцисните оси показват натрупаните честоти, а ординатните оси показват натрупаните стойности на дела (в процента) от обема на функцията.

Да приемем, че в резултат на измервания на параметрите на изследваните обекти има статистически набор, който е набор от стойности на SV X, получени в резултат на измервания (наблюдения).

Хистограмата се изгражда в следния ред.

1. Целият обхват на измерване SV () е разделен на интервали и се изчислява броят на стойностите, които се приписват на всеки -ти интервал. Това число се разделя на общия брой измервания (продукти) и се определя честотата, съответстваща на този интервал.

Сумата от честотите на всички битове очевидно трябва да бъде равна на единица.

2. Построена е таблица 1.1, в която са посочени интервалите по реда на разположението им по оста x и съответните им честоти. Тази таблица се нарича статистически серии.

Таблица 1.1

Статистически серии от стойности на SW

интервал,	…	…
Брой стойности	…	…
Честота,	…	…

Ето обозначението на i-тия интервал; - неговите граници; k е броят на интервалите.

При групиране на наблюдаваните стойности на SW в интервали може да възникне ситуация, при която стойността попада на границата на интервала. В този случай възниква въпросът към коя категория да се припише тази стойност. Препоръчително е тази стойност да се разглежда като принадлежаща еднакво на двата интервала и да се добави 0,5 към числата на двата интервала.

3. Определяне на броя на интервалите.

Броят на интервалите, в които трябва да се групират статистическите серии, не трябва да бъде твърде голям, тъй като в този случай серията на разпределение става неизразителна и честотите в нея показват неравномерни колебания. От друга страна, той не трябва да бъде твърде малък, тъй като за малък брой интервали свойствата на разпределението се описват от статистическите серии твърде грубо.

Практиката показва, че в повечето случаи е рационално да се избере броят на интервалите в рамките на 10–20. Колкото по-голям и по-хомогенен е статистическият материал, толкова повече интервали можете да избирате при съставянето на статистическите серии.

За да се определи броят на интервалите, можете да използвате и емпиричните формули, предложени от различни автори. В тази работа се предлага да се използват следните изрази като такива формули

Тези изрази са получени за най-често срещаните в практиката разпределения с ексцес в диапазона от 1,8 до 6, т.е. от равномерно до разпределение на Лаплас.

Дължините на интервалите могат да бъдат еднакви или различни. Очевидно е по-лесно да ги вземете еднакви. Въпреки това, когато компилирате SW данни, които са твърде неравномерно разпределени, понякога е удобно да изберете по-тесни интервали в областта на най-високата плътност на разпределение, отколкото в областта на ниската плътност.

4. Графично оформление на хистограмата.

Статистическият ред се оформя графично под формата на т.нар хистограми(фиг.1.1). Изгражда се по следния начин. Интервалите се нанасят по абсцисата, като върху всеки от интервалите се изгражда правоъгълник като основа, чиято площ е равна на честотата на този интервал. За да изградите хистограма, трябва да разделите честотата на всеки интервал на неговата дължина и да вземете полученото число като височина на правоъгълника. В случай на интервали с еднаква дължина, височините на правоъгълниците са пропорционални на съответните честоти. От метода за конструиране на хистограма следва, че нейната обща площ е равна на единица.

Очевидно, с увеличаване на броя на експериментите, можете да избирате все по-малки интервали и в този случай горната част на хистограмата все повече ще се приближава до кривата, която ограничава площта, равна на единица. Тази крива е графика функция на плътността на вероятността f(x) (функция на диференциалното разпределениеза непрекъснато MW ).

5. Статистическа функция на разпределение .

Използвайки данните от статистическите серии, е възможно да се конструират и статистическа (емпирична) функция на разпределение SV X. За целта от серията се вземат точки x i от границите на интервалите и съответстващите им суми от честоти p i, попадащи върху правоъгълниците на хистограмата вляво от тези точки. Тези честоти и техните суми се означават като F(x i). След това получаваме система от изрази, които определят точките на статистическата функция на разпределение. Свързвайки ги с прекъсната линия или гладка крива, получаваме приблизителна графика на статистическата функция на разпределение ( интегрална функция на разпределениеза непрекъснато MW ) F(x) (фиг. 1.2).

Най-важният етап в изследването на социално-икономическите явления и процеси е систематизирането на първичните данни и на тази основа получаването на обобщена характеристика на целия обект с помощта на обобщаващи показатели, което се постига чрез обобщаване и групиране на първичен статистически материал.

Статистическо резюме - това е комплекс от последователни операции за обобщаване на конкретни единични факти, които образуват набор, за идентифициране на типични характеристики и модели, присъщи на изследваното явление като цяло. Провеждането на статистическо обобщение включва следните стъпки :

избор на функция за групиране;
определяне на реда за формиране на групите;
разработване на система от статистически показатели за характеризиране на групите и обекта като цяло;
разработване на оформления на статистически таблици за представяне на обобщени резултати.

Статистическо групиране нарича разделяне на единици от изследваната съвкупност на хомогенни групи според определени характеристики, които са от съществено значение за тях. Групирането е най-важният статистически метод за обобщаване на статистически данни, основа за правилното изчисляване на статистическите показатели.

Различават се следните видове групировки: типологични, структурни, аналитични. Всички тези групи се обединяват от факта, че единиците на обекта са разделени на групи по някакъв признак.

знак за групиране се нарича признакът, по който единиците от съвкупността се разделят на отделни групи. Заключенията на статистическото изследване зависят от правилния избор на атрибут за групиране. Като основа за групиране е необходимо да се използват значими, теоретично обосновани признаци (количествени или качествени).

Количествени признаци на групиране имат цифров израз (обем на търговия, възраст на лицето, семеен доход и др.) и качествени характеристики на групировката отразяват състоянието на съвкупността (пол, семейно положение, отраслова принадлежност на предприятието, неговата форма на собственост и др.).

След като се определи основата на групирането, трябва да се реши въпросът за броя на групите, на които трябва да бъде разделена изследваната популация. Броят на групите зависи от целите на изследването и вида на показателя, залегнал в групирането, обема на популацията, степента на изменчивост на признака.

Например, групирането на предприятията според формите на собственост отчита общинската, федералната и собствеността на субектите на федерацията. Ако групирането се извършва по количествен признак, тогава е необходимо да се обърне специално внимание на броя на единиците на обекта, който се изследва, и степента на колебание на груповия признак.

Когато се определи броят на групите, трябва да се определят и интервалите на групиране. Интервал - това са стойностите на променлива характеристика, които се намират в определени граници. Всеки интервал има своя собствена стойност, горна и долна граница или поне една от тях.

Долната граница на интервала се нарича най-малката стойност на атрибута в интервала и Горна граница - най-голямата стойност на атрибута в интервала. Стойността на интервала е разликата между горната и долната граница.

Интервалите на групиране в зависимост от големината им биват: равни и неравни. Ако вариацията на признака се проявява в относително тесни граници и разпределението е равномерно, тогава се изгражда групиране с равни интервали. Стойността на равен интервал се определя по следната формула :

където Xmax, Xmin - максималните и минималните стойности на атрибута в съвкупността; n е броят на групите.

Най-простото групиране, при което всяка избрана група се характеризира с един показател, е серия на разпределение.

Статистически редове на разпределение - това е подредено разпределение на единиците на съвкупността в групи по определен признак. В зависимост от признака, който е в основата на формирането на серия на разпределение, се разграничават атрибутивни и вариационни серии на разпределение.

атрибутивни те наричат серията за разпределение, изградена според качествени характеристики, т.е. признаци, които нямат цифров израз (разпределение по вид труд, по пол, по професия и др.). Признаковите редове на разпределение характеризират състава на съвкупността по един или друг съществен признак. Взети за няколко периода, тези данни ни позволяват да изследваме промяната в структурата.

Вариационни редове наречена серия на разпределение, изградена на количествена основа. Всяка вариационна серия се състои от два елемента: варианти и честоти. Настроики отделните стойности на атрибута, които приема в серията вариации, се наричат, т.е. специфичната стойност на променливия атрибут.

Честоти наречен номер на индивидуален вариант или всяка група от вариационната серия, т.е. това са числа, които показват колко често се срещат определени варианти в разпределителната серия. Сумата от всички честоти определя размера на цялата популация, нейния обем. Честоти се наричат честоти, изразени в части от единица или като процент от общата сума. Съответно сумата от честотите е равна на 1 или 100%.

В зависимост от характера на изменението на признака се разграничават три форми на вариационни серии: класирана серия, дискретна серия и интервална серия.

Класирани вариационни серии - това е разпределението на отделните единици от съвкупността във възходящ или низходящ ред на изследвания признак. Класирането улеснява разделянето на количествените данни в групи, незабавното откриване на най-малките и най-големите стойности на характеристика, подчертаване на стойностите, които най-често се повтарят.

Дискретни вариационни серии характеризира разпределението на единиците на съвкупността според дискретен атрибут, който приема само цели числа. Например тарифната категория, броят на децата в семейството, броят на служителите в предприятието и др.

Ако знак има непрекъсната промяна, която в определени граници може да приема всякакви стойности ("от - до"), тогава за този знак трябва да изградите интервални вариационни серии . Например размерът на доходите, трудовият стаж, цената на дълготрайните активи на предприятието и др.

Примери за решаване на задачи по темата "Статистическо обобщение и групиране"

Задача 1 . Има информация за броя на получените книги от студентите чрез абонамент за изминалата учебна година.

Изграждане на диапазонна и дискретна вариационна серия на разпределение, обозначаваща елементите на серията.

Решение

Този комплект е набор от опции за броя на книгите, които учениците получават. Нека преброим броя на такива варианти и да ги подредим под формата на вариационна класирана и вариационна дискретна серия на разпределение.

Задача 2 . Има данни за стойността на дълготрайните активи за 50 предприятия, хиляди рубли.

Изградете серия за разпределение, като подчертаете 5 групи предприятия (на равни интервали).

Решение

За решението избираме най-големите и най-малките стойности на цената на дълготрайните активи на предприятията. Това са 30,0 и 10,2 хиляди рубли.

Намерете размера на интервала: h \u003d (30,0-10,2): 5 \u003d 3,96 хиляди рубли.

Тогава първата група ще включва предприятия, чийто размер на дълготрайните активи е от 10,2 хиляди рубли. до 10,2 + 3,96 = 14,16 хиляди рубли. Такива предприятия ще бъдат 9. Втората група ще включва предприятия, чийто размер на дълготрайните активи ще бъде от 14,16 хиляди рубли. до 14,16 + 3,96 = 18,12 хиляди рубли. Такива предприятия ще бъдат 16. По същия начин намираме броя на предприятията, включени в трета, четвърта и пета група.

Получената серия на разпределение се поставя в таблицата.

Задача 3 . За редица предприятия от леката промишленост бяха получени следните данни:

Направете групиране на предприятията според броя на работниците, като оформите 6 групи на равни интервали. Брой за всяка група:

1. брой предприятия
2. брой работници
3. обем на произведената продукция за година
4. средна действителна продукция на работник
5. размер на ДМА
6. среден размер на дълготрайните активи на едно предприятие
7. средна стойност на произведената продукция от едно предприятие

Запишете резултатите от изчислението в таблици. Направете си изводите.

Решение

За решението избираме най-големите и най-малките стойности на средния брой работници в предприятието. Това са 43 и 256.

Намерете размера на интервала: h = (256-43): 6 = 35,5

Тогава първата група ще включва предприятия със среден брой на работниците от 43 до 43 + 35,5 = 78,5 души. Такива предприятия ще бъдат 5. Втората група ще включва предприятия, средният брой на работниците в които ще бъде от 78,5 до 78,5 + 35,5 = 114 души. Такива предприятия ще бъдат 12. По същия начин намираме броя на предприятията, включени в трета, четвърта, пета и шеста група.

Поставяме получената серия на разпределение в таблица и изчисляваме необходимите показатели за всяка група:

Заключение : Както се вижда от таблицата, най-многобройна е втората група предприятия. Включва 12 предприятия. Най-малки са пета и шеста група (по две предприятия). Това са най-големите предприятия (по отношение на броя на работниците).

Тъй като втората група е най-многобройна, обемът на продукцията годишно от предприятията от тази група и обемът на дълготрайните активи са много по-високи от останалите. В същото време средната фактическа продукция на един работник в предприятията от тази група не е най-висока. Тук водещи са предприятията от четвърта група. Тази група също така представлява доста голямо количество дълготрайни активи.

В заключение отбелязваме, че средният размер на дълготрайните активи и средната стойност на продукцията на едно предприятие са пряко пропорционални на размера на предприятието (по отношение на броя на работниците).

Статистически редове на разпределение. Статистическо дискретно разпределение

Видове разпределителни серии

Графично представяне на серии на разпределение

Примери за решаване на задачи по темата "Статистическо обобщение и групиране"