Биографии Характеристики Анализ

Статистически редове на разпределение. Дискретни статистически серии

Най-простият начин за обобщаване на статистическия материал е построяването на серии. Обобщеният резултат от статистическо изследване може да бъде серия на разпределение.

След определяне на характеристиката на групиране, броя на групите и интервалите на групиране, обобщените и груповите данни се представят под формата на серии на разпределение и се представят под формата на статистически таблици.

Разпределителната серия е един от видовете групировки.

Близо до разпределение в статистиката подреденото разпределение на единиците на съвкупността в групи според всяка една характеристика се нарича: качествено или количествено.

  1. Видове разпределителни серии

В зависимост от характеристиката, която е в основата на формирането на серията на разпределение, се разграничават атрибутивни и вариационни серии на разпределение:

    сериите на разпределение, конструирани според качествени характеристики, се наричат ​​атрибутивни;

    Вариационни серии са серии на разпределение, изградени във възходящ или низходящ ред на стойностите на количествена характеристика.

Вариационната серия на разпределението се състои от две колони. Първата колона предоставя количествени стойности на вариращата характеристика, които се наричат ​​варианти и се обозначават. Дискретна опция - изразява се като цяло число. Опцията за интервал варира от и до. В зависимост от вида опциите могат да бъдат конструирани дискретни или интервални вариационна серия. Втората колона съдържа броя на конкретните опции, изразени като честоти или честоти:

    честотите са абсолютни числа, показващ общия брой срещания на дадена стойност на атрибута; сумата от всички честоти трябва да бъде равна на броя на единиците в цялата популация;

    честотите са честоти, изразени като процент от общата сума; сумата от всички честоти, изразени като проценти, трябва да бъде равна на 100% в части от едно.

Вариационни серии се характеризира с два елемента: вариант (X) и честота (f). Вариантът е отделна стойност на характеристика на отделна единица или група от съвкупност. Извиква се число, показващо колко пъти се среща определена стойност на дадена характеристика честота. Ако честотата е изразена като относително число, тогава тя се нарича честота.

Вариационните серии могат да бъдат:

    интервал, когато границите "от" и "до" са дефинирани, сериите на интервално разпределение могат да бъдат представени графично под формата на хистограма;

    дискретни, когато изследваната характеристика се характеризира с определено число.

  1. Графично представяне на сериите на разпределение

Сериите за разпространение са визуално представени с помощта на графични изображения.

Разпределителните серии са изобразени като:

    депо за отпадъци;

    хистограми;

    кумулира;

При изграждане полигон за изпитване по хоризонталната ос (абсцисната ос) се нанасят стойностите на вариращата характеристика, а по вертикална ос(y-ос) - честоти или честоти.

За изграждане хистограми Стойностите на границите на интервалите са посочени по абсцисната ос и на тяхна основа са изградени правоъгълници, чиято височина е пропорционална на честотите (или честотите).

Разпределението на характеристика в вариационна серия върху натрупаните честоти (честоти) се изобразява с помощта на кумулация.

Кумулира или кумулативната крива, за разлика от полигона, се изгражда от натрупани честоти или честоти. В този случай стойностите на характеристиката се поставят на абсцисната ос, а натрупаните честоти или честоти се поставят на ординатната ос.

Огива се конструира подобно на кумулата с единствената разлика, че натрупаните честоти са поставени на абсцисната ос, а характерните стойности са поставени на ординатната ос.

Тип кумулат е крива на концентрация или графика на Лоренц. За да се построи крива на концентрация, върху двете оси на правоъгълната координатна система се нанася скална скала в проценти от 0 до 100. В същото време натрупаните честоти са посочени на абсцисната ос, а натрупаните стойности на дела. (в проценти) по обем на характеристиката са посочени на ординатната ос.

Тема 9. Серии на разпределение

Статистически редове на разпределение- това е основната характеристика на масовата статистическа съвкупност, подредено разлагане на единици от съвкупността, които се изучават в групи според групиращите характеристики. Всяка статистическа серия на разпределение се състои от два елемента:

1) индивидуални стойности на различната характеристика ( настроики );

2) стойности, които показват колко пъти се повтаря дадена опция ( честоти ).

Забележка. Наричат ​​се честоти, изразени в части от единица или като процент от общата сума честоти ; това е броят на изразените серии на разпределение сбор от честоти.

Ако за основа на групирането се вземе качествена характеристика, тогава се нарича такава серия на разпределение атрибутивни(разпределение по вид труд, по пол, по професия, по религия, народност и др.). Ако серията на разпределение е построена съгласно количествена характеристика, тогава такава серия се нарича вариационен. Да се ​​конструира вариационна серия означава да се организира количественото разпределение на единиците на съвкупността по характерни стойности и след това да се преброи броя на единиците на популацията с тези стойности (изграждане на групова таблица).

Маркирайте три форми на вариационни серии:

1) класирани серии- това е разпределението на отделни единици от съвкупността във възходящ или низходящ ред на изучавания признак; класирането ви позволява лесно да разделяте количествените данни на групи, веднага да откривате най-малките и най-висока стойностхарактеристика, подчертайте стойностите, които най-често се повтарят; други форми на вариационни серии - групови маси, съставен според естеството на изменението на стойностите на изследваната характеристика;

2) дискретна серия- това е вариационна серия, чието изграждане се основава на характеристики с прекъснати промени, между които няма междинни стойности (дискретни характеристики - тарифна категория, брой деца в семейството, брой служители в предприятието и др. .); Тези признаци могат да бъдат взети само крайно числоопределени стойности;

Дискретна серия представлява групова маса, който се състои от две колони: в първата колона е посочена конкретната стойност на атрибута, а във втората - броят на единиците от съвкупността с определена стойностзнак;

3) ако характеристиката има непрекъсната промяна (размер на дохода, трудов стаж, цена на дълготрайните активи на предприятието и т.н., които в определени граници могат да приемат всякакви стойности), тогава за тази характеристика е необходимо да се изгради интервални серии (на равни или неравни интервали).

Групова масатук също има две колони. Първият показва стойността на атрибута в интервала „от - до“ (опции), вторият показва броя на единиците, включени в интервала (честота). Много често таблицата се допълва от колона, в която се изчисляват натрупаните честоти S, които показват колко единици от съвкупността имат характерна стойност не по-голяма от дадена стойност. Честотите от серията f могат да бъдат заменени с подробности w, изразени в относителни числа (дялове или проценти). Те представляват отношението на честотите на всеки интервал към техните обща сума (9.1):



(9.1)

При конструиране на вариационна серия с интервални стойности, на първо място, е необходимо да се установи стойността на интервала i, който се определя като съотношението на диапазона на вариация R към броя на групите n (9.2):

където R = x max - x min; n = 1 + 3,322 logN( Формула на Стърджис); Н- общ бройединици от населението.

Интервални вариационни серии могат също да бъдат конструирани за характеристики с дискретна вариация. Често в статистическо изследване е неуместно да се посочи отделна стойност на отделен атрибут, т.к. това има тенденция да затруднява разглеждането на вариация в черта. Следователно възможните дискретни стойности на атрибута се разпределят в групи и се изчисляват съответните честоти (данни). Когато се конструира серия от интервали въз основа на дискретен атрибут, границите на съседните интервали не се повтарят взаимно: следващият интервал започва със следващия по ред (след горната стойност на предишния интервал) дискретна стойностзнак.

Когато се сравняват честотите на серия с неравни интервали, се изчислява плътността на разпределението, за да се характеризира тяхната пълнота. Средна плътноств интервалае частното на честотата и особеността, разделено на стойността на интервала. В първия случай плътността е абсолютна, във втория – относителна. Средната плътност показва колко единици или проценти от тях са за единица измерване опции. Честота, особеност, плътност и натрупана честота са различни функции на опциите за величина.

В ход анализ статистически данни , представени чрез серии на разпределение, в допълнение към знанията за характера на разпределението (или структурата на съвкупността) могат да се изчислят различни статистически показатели ( числови характеристики), които в обобщен вид отразяват характеристиките на разпределението на изследваните характеристики. Тези характеристики (показатели) могат да бъдат разделени на 3 основни групи

1) характеристики на разпределителния център(средно, мода, медиана);

2) характеристики на степента на вариация (диапазон на вариация, средно линейно отклонение, дисперсия, средно стандартно отклонение, коефициентът на вариация);

3) характеристики на формата (типа) на разпределение(показатели за ексцес и асиметрия, рангови характеристики, криви на разпределение).

Най-надеждният начин за идентифициране на модели на разпространение е както следва:
1) увеличаване на броя на наблюдаваните случаи (в съответствие със закона големи числа, в такива редове случайни отклоненияот общ моделпри индивидуални ценностище се отменят взаимно);

2) първоначално разделете популацията на максималния възможен брой групи, след това, постепенно намалявайки броя на групите, оптимизирайте групирането от гледна точка на идентифициране на модели на разпространение.

При прилагането на този подход моделът, характерен за това разпределение, ще се появява все по-ясно и прекъсната линия, представляваща многоъгълника, ще се приближи до някаква гладка линия и в границата трябва да се превърне в крива линия.

Изпускам населениеизвлича се проба и х 1 наблюдавано П 1 път, х 2 - П 2 пъти, x k - p къмпъти и е размерът на извадката. Наблюдавани стойности х 1 се наричат ​​варианти, а последователността от варианти се записва във възходящ ред - вариационни серии .

Броят на вариантите на наблюдение се нарича честота, а връзката му с размера на извадката се нарича относителна честота.

Определение. Статистически (емпиричен) закон за разпределение на извадката, или просто статистическо разпределение на извадкатанаименувайте последователността от опции и съответните им честоти n iили относителни честоти.

Статистическо разпределениеУдобно е образците да се представят под формата на таблица на честотните разпределения, т.нар статистически дискретна серияразпределения:

(сумата от всички относителни честоти е равна на единица).

Пример 1. При измерване в хомогенни групи от субекти са получени следните проби: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 (пулс). Въз основа на тези резултати съставете статистическа серия от честотни разпределения и относителни честоти.

Решение. 1) Статистически серии от честотно разпределение:

Контрола: 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.

Честотен полигоннаречена начупена линия, сегменти, които свързват точки За да се изгради честотен многоъгълник, опциите са изложени върху абсцисната ос х 2, а по ординатата - съответните честоти p i .Точките се свързват с отсечки и се получава честотен полигон.

Многоъгълник на относителните честотинаречена начупена линия, сегменти, които свързват точки. За да се изгради полигон от относителни честоти, опциите се нанасят върху абсцисната ос х i , а по ординатната ос съответните честоти wаз Точките се свързват с отсечки и се получава полигон от относителни честоти

Пример 2.Конструирайте честотен полигон и относителен честотен полигон въз основа на данните в Пример 1.

Решение:Използвайки дискретната статистическа серия на разпределение, компилирана в пример 1, ще конструираме честотен многоъгълник и относителен честотен полигон:


2. Серия на статистическо интервално разпределение. стълбовидна диаграма.

Статистически дискретни серии (или емпирична функция на разпределение) обикновено се използват, когато добър приятеледин от друг няма твърде много опции в извадката или когато дискретността по една или друга причина е значима за изследователя. Ако характеристиката на общата съвкупност X, която ни интересува, е разпределена непрекъснато или нейната дискретност е непрактично (или невъзможно) да се вземе предвид, тогава опциите се групират в интервали.


Статистическото разпределение може също да бъде определено като последователност от интервали и честотите, съответстващи на тях (сумата от честотите, попадащи в този интервал, се приема като честота, съответстваща на интервала).

1. R (обхват) = X max -X ​​​​min

2. к-брой групи

3. (формула на Стърджис)

4. a = x min, b = x max

Удобно е полученото групиране да се представи под формата на честотна таблица, която се нарича статистическа интервална серия на разпределение:

Интервали фракции ...
Честоти ...

Аналогична таблица може да се формира чрез замяна на честотите n iотносителни честоти.

Най-важният етап в изследването на социално-икономическите явления и процеси е систематизирането на първичните данни и на тази основа получаването на обобщена характеристика на целия обект с помощта на общи показатели, което се постига чрез обобщаване и групиране на първичен статистически материал.

Статистическо резюме - е набор от последователни операции за обобщаване на конкретни изолирани факти, образувайки набор, за идентифициране типични характеристикии модели, присъщи на изследваното явление като цяло. Провеждането на статистическо обобщение включва следните стъпки :

  • избор на групиращи характеристики;
  • определяне на реда за формиране на групи;
  • развитие на системата статистически показателида характеризира групите и обекта като цяло;
  • разработване на оформления на статистически таблици за представяне на обобщени резултати.

Статистическо групиране се нарича разделяне на единици от изследваната съвкупност еднородни груписпоред определени съществени за тях характеристики. Групирането е най-важно статистически методобобщаване на статистически данни, основа за правилно изчисляване на статистически показатели.

Разграничете следните видовегрупировки: типологични, структурни, аналитични. Всички тези групи се обединяват от факта, че единиците на обекта се разделят на групи по някакъв признак.

Функция за групиране е характеристика, по която се разделят единиците на съвкупността отделни групи. от правилният изборхарактеристиката на групиране зависи от заключенията статистически изследвания. Като основа за групиране е необходимо да се използват значими, теоретично обосновани характеристики (количествени или качествени).

Количествени характеристики на групирането имат цифров израз (обем на търговия, възраст на лицето, семеен доход и т.н.) и качествени признаци на групиране отразяват състоянието на единица от населението (пол, Семейно положение, отраслова принадлежност на предприятието, неговата форма на собственост и др.).

След като се определи основата на групирането, трябва да се реши въпросът за броя на групите, на които трябва да се раздели изследваната популация. Броят на групите зависи от целите на изследването и вида на индикатора, който е в основата на групирането, обема на популацията и степента на вариация на характеристиката.

Например, групирането на предприятия по вид собственост взема предвид общинската, федералната и федералната субектна собственост. Ако групирането се извършва на количествена основа, тогава е необходимо да се обърне Специално вниманиевърху броя на единиците на изследвания обект и степента на изменчивост на групиращия признак.

След като се определи броят на групите, трябва да се определят интервалите на групиране. Интервал - това са стойностите на различна характеристика, които се намират в определени граници. Всеки интервал има своя стойност, горна и долна граница или поне една от тях.

Долна граница на интервала се нарича най-малката стойност на характеристиката в интервала и горен лимит - най-високата стойност на характеристиката в интервала. Стойността на интервала е разликата между горната и долната граница.

Интервалите на групиране в зависимост от големината им биват: равни и неравни. Ако вариацията на дадена характеристика се проявява в относително тесни граници и разпределението е равномерно, тогава групата се изгражда на равни интервали. величина равен интервалопределя се по следната формула :

където Xmax, Xmin - максимум и минимална стойностхарактеристики в съвкупност; n - брой групи.

Най-простото групиране, при което всяка избрана група се характеризира с един показател, представлява серия на разпределение.

Статистически редове на разпределение - това е подредено разпределение на единиците на съвкупността в групи по определен признак. В зависимост от характеристиката, която е в основата на формирането на редовете на разпределение, се разграничават атрибутивни и вариационни редове на разпределение.

Атрибутивен се наричат ​​редове на разпределение, построени съгласно качествени характеристики, тоест признаци, които нямат числено изражение(разпределение по вид труд, по пол, по професия и др.). Атрибутивните редове на разпределение характеризират състава на съвкупността по определени съществени характеристики. Взети за няколко периода, тези данни позволяват да се изследват промените в структурата.

Вариационни серии се наричат ​​серии на разпределение, построени на количествена основа. Всяка вариационна серия се състои от два елемента: опции и честоти. Настроики са наречени индивидуални ценностихарактеристики, които приема в серията вариации, т.е. специфичната стойност на вариращата характеристика.

Честоти наричат ​​се номерата на отделните варианти или всяка група от вариационна серия, т.е. това са числа, които показват колко често се срещат определени варианти в серията на разпределение. Сумата от всички честоти определя размера на цялата популация, нейния обем. Честоти се наричат ​​честоти, изразени в части от единица или като процент от общата сума. Съответно сумата от честотите е равна на 1 или 100%.

В зависимост от естеството на вариацията на дадена характеристика се разграничават три форми на вариационни серии: класирани серии, дискретни серии и интервални серии.

Класирани вариационни серии - това е разпределението на отделните единици от съвкупността във възходящ или низходящ ред на изучавания признак. Класирането ви позволява лесно да разделяте количествените данни на групи, незабавно да откривате най-малките и най-големите стойности на дадена характеристика и да подчертавате стойностите, които най-често се повтарят.

Дискретни вариационни серии характеризира разпределението на единиците на съвкупността според дискретна характеристика, която приема само цели числа. Например тарифна категория, брой деца в семейството, брой служители в предприятието и др.

Ако една характеристика има непрекъсната промяна, която в определени граници може да приема всякакви стойности („от - до“), тогава за тази характеристика е необходимо да се изгради интервални вариационни серии . Например размерът на дохода, трудовия стаж, цената на дълготрайните активи на предприятието и др.

Примери за решаване на задачи по темата „Статистическо обобщение и групиране“

Проблем 1 . Има информация за броя на книгите, които студентите са получили чрез абонамент през изминалата учебна година.

Конструирайте класирани и дискретни серии за разпределение на вариациите, обозначавайки елементите на серията.

Решение

Този комплектпредставлява много опции за броя на книгите, които учениците получават. Нека преброим броя на тези опции и да ги подредим под формата на вариационни класирани и вариационни дискретна серияразпределения.

Проблем 2 . Има данни за цената на дълготрайните активи за 50 предприятия, хиляди рубли.

Изградете серия на разпределение, като подчертаете 5 групи предприятия (на равни интервали).

Решение

За решаване избираме най-големия и най-малка стойностстойността на дълготрайните активи на предприятията. Това са 30,0 и 10,2 хиляди рубли.

Нека намерим размера на интервала: h = (30,0-10,2):5= 3,96 хиляди рубли.

Тогава първата група ще включва предприятия, чиито дълготрайни активи възлизат на 10,2 хиляди рубли. до 10,2+3,96=14,16 хиляди рубли. Ще има 9 такива предприятия, които ще включват предприятия, чиито дълготрайни активи възлизат на 14,16 хиляди рубли. до 14,16+3,96=18,12 хиляди рубли. По същия начин ще има 16 такива предприятия да намерим номерапредприятия, включени в трета, четвърта и пета група.

Поставяме получената серия на разпределение в таблицата.

Проблем 3 . За редица предприятия от леката промишленост са получени следните данни:

Групирайте предприятията по броя на работниците, образувайки 6 групи на равни интервали. Изчислете за всяка група:

1. брой предприятия
2. брой работници
3. обем на произведената продукция за година
4. средна действителна продукция на работник
5. обем на ДМА
6. средният размердълготрайни активи на едно предприятие
7. средна стойност на продукцията, произведена от едно предприятие

Представете резултатите от изчисленията в таблици. Направете изводи.

Решение

За да решим, ще изберем най-големите и най-малките стойности на средния брой работници в предприятието. Това са 43 и 256.

Нека намерим размера на интервала: h = (256-43):6 = 35,5

Тогава първата група ще включва предприятия, чийто среден брой работници е от 43 до 43 + 35,5 = 78,5 души. Втората група ще включва 5 предприятия, чиято средносписъчна численост ще бъде от 78,5 до 78,5+35,5=114 души. Ще има 12 такива предприятия. По същия начин ще намерим броя на предприятията, включени в трета, четвърта, пета и шеста група.

Поставяме получената серия на разпределение в таблица и изчисляваме необходимите показатели за всяка група:

Заключение : Както се вижда от таблицата, най-многобройна е втората група предприятия. Включва 12 предприятия. Най-малките групи са пета и шеста група (по две предприятия). Това са най-големите предприятия (като брой работници).

Тъй като втората група е най-голямата, обемът на продуктите, произведени годишно от предприятията от тази група, и обемът на дълготрайните активи са значително по-високи от останалите. В същото време средната действителна продукция на един работник в предприятията от тази група не е най-висока. Тук водещи са предприятията от четвъртата група. Тази група също представлява доста голям обем дълготрайни активи.

В заключение отбелязваме, че средният размер на дълготрайните активи и средна стойностпроизведените продукти на едно предприятие са правопропорционални на размера на предприятието (от броя на работниците).

Групиране- това е разделяне на съвкупност на групи, които са хомогенни по някакъв признак.

Цел на услугата. С помощта на онлайн калкулатора можете:

  • изградете вариационна серия, изграждане на хистограма и полигон;
  • намерете индикатори за вариация (средно, режим (включително графично), медиана, диапазон на вариация, квартили, децили, коефициент на квартилна диференциация, коефициент на вариация и други показатели);

Инструкции. За да групирате серия, трябва да изберете вида на получената вариационна серия (дискретна или интервална) и да посочите количеството данни (брой редове). Полученото решение се записва във файл на Word (вижте пример за групиране на статистически данни).

Брой входни данни
",0);">

Ако групирането вече е извършено и дискретни вариационни серииили интервални серии, тогава трябва да използвате онлайн калкулатора Variation Indices. Проверка на хипотезата за вида на разпределениетосе извършва чрез услугата Изучаване на формуляра за разпределение.

Видове статистически групировки

Вариационни серии. При наблюдения на дискретни случайна величинаедно и също значение може да се намери няколко пъти. Такива стойности x i на случайна променлива се записват, като се посочва n i броят пъти, в които се появява в n наблюдения, това е честотата на тази стойност.
В случай на непрекъсната случайна променлива на практика се използва групиране.
  1. Типологично групиране- това е разделянето на качествено разнородната изследвана популация на класове, социално-икономически типове, хомогенни групи единици. За да изградите това групиране, използвайте параметъра Дискретни вариационни серии.
  2. Групирането се нарича структурно, при което една хомогенна популация е разделена на групи, които характеризират нейната структура според някаква различна характеристика. За да създадете това групиране, използвайте параметъра Interval series.
  3. Нарича се групиране, което разкрива връзките между изучаваните явления и техните характеристики аналитична група(виж аналитично групиране на сериите).

Принципи за изграждане на статистически групировки

Серия от наблюдения, подредени във възходящ ред, се нарича вариационна серия. Функция за групиранее характеристика, по която една популация се разделя на отделни групи. Нарича се основа на групата. Групирането може да се основава както на количествени, така и на качествени характеристики.
След определяне на основата на групирането трябва да се реши въпросът за броя на групите, на които трябва да се раздели изследваната популация.

Когато се използват персонални компютри за обработка на статистически данни, групирането на обектни единици се извършва по стандартни процедури.
Една такава процедура се основава на използването на формулата на Стърджис за определяне на оптималния брой групи:

k = 1+3,322*log(N)

Където k е броят на групите, N е броят на единиците от съвкупността.

Дължината на частичните интервали се изчислява като h=(x max -x min)/k

След това се преброяват броя на наблюденията, попадащи в тези интервали, които се приемат като честоти n i . Няколко честоти, чиито стойности са по-малки от 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Средните стойности на интервалите x i =(c i-1 +c i)/2 се приемат като нови стойности.