Биографии Характеристики Анализ

Статистически редове и техните видове. Статистически редове на разпределение, тяхното значение и приложение в статистиката

Статистическо измерване, непрекъснато и селективно наблюдениесоциално-икономически явления и процеси, статистически групировки, методи за обработка и анализ статистическа информация.

Статистическото наблюдение е системно, научно организирано и по правило систематично събиране на данни за явления и процеси. Публичен животчрез регистриране на предварително определени съществени признаци, за да се получат допълнителни обобщаващи характеристики на тези явления и процеси. Въз основа на наблюдението се правят изводи за някои умствени процеси. Има два вида наблюдение - непрекъснато и избирателно. непрекъснатонаречено наблюдение, когато се записват всички характеристики и прояви умствена дейностлице за определен период. За разлика от това, когато селективеннаблюдението насочва вниманието само към онези факти в човешкото поведение, които са пряко или косвено свързани с разглеждания въпрос.

Селективно наблюдениее един от най-широко използваните видове непродължително наблюдение. Селективното наблюдение се основава на идеята, че определена част от единици, избрани в произволен ред, могат да представят цялата изследвана съвкупност от явлението според характеристиките, които представляват интерес за изследователя. целселективното наблюдение е да се получи информация за определяне на обобщените обобщаващи характеристики на цялата изследвана генерална съвкупност.

групиране- това е разпределението на набора от единици от изследваната популация в групи в съответствие със знака, който е от съществено значение за тази група. Методът на групиране ви позволява да осигурите първично обобщение на данните, тяхното представяне в по-подредена форма. Наричат ​​се признаците, по които се извършва групирането функции за групиране. Групиращият признак понякога се нарича основа за групиране. Правилен изборзначителна функция за групиране дава възможност да се направят научно обосновани заключения въз основа на резултатите статистически изследвания. Функциите за групиране могат да бъдат количественизраз (обем, доход, валутен курс, възраст и др.) и качество(форма на собственост на предприятието, пол на лицето, браншова принадлежност, семейно положениеи т.н.). Системата от методи, техники, с помощта на които изследва статистиката масови явления, форми статистическа методология. Спецификата му се състои в това, че всички основни методически похватиизползвани като задачи са изпълнени три последователни етапа (етапи) статистическо изследване:
I. Статистическо наблюдение;
II. обобщения и групиране на първични статистически данни;
III. научна обработка и анализ на статистическа информация.
Съдържанието на произведението първи етап включва използването на метода на масовите наблюдения, който не е нищо повече от събиране на първична статистическа информация.
На втори етап събрана информация с помощта на метода статистически групиобобщени и разпределени по определен начин.
На трети етап с помощта на метода на обобщаващи показатели се извършва анализ на статистическа информация.

Организационни форми и видове статистическо наблюдение. Методи за статистическо наблюдение. Видове групировки, приложението им в статистиката. Групиране на признаци, тяхното обосноваване и избор. Определяне на броя на групите и размера на интервала.

Основните организационни форми на статистическото наблюдение включват: отчетност и специално организирано наблюдение.

Докладване- това е форма на статистическо наблюдение, при която съответните статистически органи получават информация от предприятия и организации, които извършват стопанска дейност в рамките на определен период от време. Информацията трябва да бъде предоставена на законовред на отчетни документи.

тела държавна статистикаутвърдени са форми на статистическа отчетност.

AT търговски дейностиотчетността се разделя на:

1) общонационален - задължителен за всички организации и се представя в консолидиран вид на органите на държавната статистика;

2) вътрешноведомствена - тази отчетност е валидна в рамките на ведомства и министерства. Съществуват следните формидокладване:

1) стандарт се нарича отчетност, която съдържа показатели, които са еднакви за всички предприятия, институции от различни организационни форми, както и за други дейности

2) ако предприятието има свои специфични характеристики, тогава в тази организация се въвежда специализирано отчитане;

3) отчетността, предоставена от всяко предприятие на едни и същи интервали от време, се нарича периодична;

4) отчетността, която се получава от органите на статистиката при необходимост, се нарича еднократна отчетност. Всяка организация има право да избира как да предоставя отчетни данни.

Видове статистическо наблюдение:

1) ако абсолютно всички единици от изследваната съвкупност от явления и процеси са подложени на изследване, тогава това непрекъснато статистическо наблюдение;

2) ако част от единиците на изследваната съвкупност от явления са подложени на изследване, тогава това прекъснато статистическо наблюдение;

3) селективно наблюдение наречено наблюдение, при което характеристиките на цялата съвкупност от факти се дават според някои техни части, избрани в произволен ред;

4) монографично изследване - това е подробно проучване и описание на определени единици от съвкупността;

5) ако тази част от единиците на съвкупността е подложена на изследване, в която стойността на изследвания признак преобладава в целия обем, тогава това се нарича метод на основния масив;

6) се нарича събиране на данни въз основа на доброволното попълване на въпросници от адресатите анкетно проучване;

7) ако наблюдението се извършва непрекъснато и в същото време се записват всички факти и явления, протичащи в състояние на промяна, тогава това наблюдение се нарича текущ;

8) ако наблюдението се извършва нередовно, но само когато е необходимо, това наблюдение се нарича един път;

9) периодично издание нарича наблюдение, което се повтаря на определени интервали (година, месец, тримесечие и т.н.).

В зависимост от източниците на събрана информация има:

1) наблюдението, извършено от самите регистратори чрез измерване и с помощта на инспекция, преброяване и претегляне на характеристиките на обекта, който се изследва, се нарича пряко;

2) анкетата е наблюдение, при което отговорите на дадено лице на въпроси се записват в определен формуляр;

3) при документиране на факти документите служат като източник на информация.

Предоставяне от предприятия, организации на статистически отчети за техните стопанска дейноств строго своевременнонаречено отчитане. Видът статистическо наблюдение, което включва предоставяне на информация на органите, които извършват наблюдението, се нарича частен метод.

Ако кореспондентите предоставят информация на властите, тогава този метод се нарича кореспондент. (1) Типологични групировки

Тяхната задача е да идентифицират социално-икономически типове или по същество хомогенни групи.

(2) Структурни групировки

Тяхната задача е да изследват състава на отделните типични групи чрез комбиниране на единици от съвкупността, които са близки една до друга по отношение на размера на групиращия признак.

(3) Аналитични групировки

Тяхната задача е да идентифицират влиянието на едни характеристики върху други (да идентифицират връзката между социално-икономическите явления).

(4) Комбинирани групи

Те разделят населението на групи по два или повече признака. В същото време групите, формирани по един признак, се разделят на подгрупи по друг признак.

Такива групировки позволяват да се изследва структурата на населението по няколко признака едновременно. Знак за групиране- признак, по който се обединяват отделните единици от съвкупността в отделни групи. За групиране трябва да се вземат съществените признаци, които изразяват най-много черти на характерафеномен, който се изучава.

първично групиране- директно групиране на данни от статистическо наблюдение. Вторично групиранее пренареждане на предварително групирани данни. Трябва вторично групираневъзниква в два случая:

1) предварително направеното групиране не отговаря на целите на изследването по отношение на броя на групите;

2) за сравняване на данни, отнасящи се до различни периоди от време или до различни територии, ако първоначалното групиране е извършено според различни характеристики на групиране или на различни интервали.

Има два начина за вторично групиране: обединение на малки групи и по-големи и селекция определен дялагрегатни единици.

Основните задачи, решавани с помощта на групировки:

1) разпределение в съвкупността от изследваните явления на техните социално-икономически видове;

2) изследване на структурата на социалните явления;

3) идентифициране на връзки и зависимости между социалните явления.

За определяне на оптималния брой групи се използва формулата на Стърджис: , където n е броят на групите; N е броят на единиците от съвкупността. n се закръгля до цяло число. След определяне на броя на групите трябва да се определят интервалите на групиране. Интервалът е стойностите на променлива характеристика, които се намират в определени граници. Долната граница на интервала се нарича най-малка стойностфункция в интервала, а горната граница - най-висока стойноствлезте в него. Стойността (ширината) на интервала е разликата между горната и долната граница на интервала. Интервалите на групиране в зависимост от големината им са равни и неравни. Ако вариацията на черта се проявява в относително тесни граници и разпределението е повече или по-малко равномерно, тогава се изгражда групиране с на равни интервали. Стойността на равен интервал се определя по формулата: , където и са максималните и минимална стойностна атрибута Open са интервали, за които е посочена само една граница: горната е за първия интервал, долната е за последния. Ширината на отворен интервал се приема равна на ширината на съседния интервал. Интервалите се наричат ​​затворени, ако и двете граници са маркирани. При групиране по количествен признак границите на интервалите могат да бъдат обозначени по различни начини. Ако основата на групирането е непрекъснат признак, тогава една и съща стойност на признака действа като горна и долна граница на два съседни интервала. Така горната граница на i-тия интервал е равна на долната граница на i+1-ия интервал. При такова обозначение на границите може да възникне въпросът коя група да включва единиците на обекта, чиито атрибутни стойности съвпадат с границите на интервалите. Обикновено долната граница се формира на принципа „включително”, а горната – на принципа „изключително”. Ако групирането се основава на дискретен атрибут, тогава долната граница на i-тия интервал е равна на горната граница на i-1-ия интервал, увеличена с 1. Неравните интервали се използват в статистиката, когато стойностите на атрибут варират неравномерно и в значителни размери.

Статистически серииразпределения, техните видове. Основните характеристики на серията за разпространение.

Най-важната частстатистическият анализ е изграждането на серии на разпределение (структурно групиране), за да се подчертае характерни свойстваи закономерности на изследваната популация. В зависимост от това кой признак (количествен или качествен) се взема като основа за групиране на данни, съответно се разграничават видовете серии на разпределение.
Ако за основа на групирането се вземе качествен признак, тогава такава серия на разпределение се нарича атрибутивна (разпределение по вид труд, по пол, по професия, по религия, националност и др.).
Ако серия за разпределение е изградена на количествена основа, тогава такава серия се нарича вариационна. Изграждането на вариационна серия означава да се подреди количественото разпределение на единиците на съвкупността според стойностите на атрибута и след това да се преброи броят на единиците на популацията с тези стойности (изграждане на групова таблица).
Графично разпределителните серии се показват като:
1) хистограма - графика, според която серия от интервални вариации се показва под формата на колони, съседни една на друга. (На оста Ox - границите на интервалите, на Oy - честотата на интервала).
2) полигон на разпределение - графика, на която графиката на разпределението се показва като линейна диаграма. (Според Ox - стойността на променливия знак, според Oy - честотата).
3) кумулативна - графика, на която според Ox са стойностите на променливата характеристика или горните граници на интервалите, а според Oy - натрупаните честоти.
4) ogive - а) графика, на която по Ox са стойностите на променливата
знак, според Oy - честотата на знака;
б) графика, на която Ox е кумулативната честота Oy
– стойности на променливия признак. Във вариационната серия има определена връзка при промяна на честотите и стойностите на променливия атрибут: с увеличаване на променливия атрибут стойността на честотата първо се увеличава до определена стойност и след това намалява. Такива промени се наричат ​​модели на разпределение.
Важни свойства на кривата на разпределение са степента на нейната асиметрия, висок или нисък пик, които заедно характеризират формата или вида на кривата на разпределение.
Важна задачае дефиницията на формата на кривата.
Характерът на общото разпределение включва оценка на степента на неговата хомогенност и изчисляване на показатели за асиметрия и ексцес.
Разпределение се нарича симетрично, при което честотите на всеки два варианта, разположени на еднакво разстояние от двете страни на центъра на разпределението, са равни една на друга.
За симетрични разпределения средната аритметична стойност, модата и медианата са равни.
Най-точен и често срещан е индикаторът, базиран на дефиницията централен моменттрети ред.
Често срещано разпределение е нормалното разпределение, което може да бъде представено графично като симетрична куполообразна крива.
Куполообразната форма на кривата показва, че повечето от стойностите са концентрирани около центъра на измерването и при наистина симетрично унимодално разпределение средната стойност, модата и медианата ще съвпадат.
закон нормална дистрибуцияприема, че отклонението от средната е резултат от Голям броймалки отклонения, че положителните и отрицателните отклонения са еднакво вероятни и че най-вероятната стойност от всички в по равнонадеждни измервания е тяхното средно аритметично.
Теоретичната крива на разпределение е крива на разпределение, която изразява общ модел от този тип.
Нормалната крива на разпределение отразява модела, който възниква, когато много случайни причини си взаимодействат.
За симетрични разпределения се изчислява индексът на ексцес (заостреност).
Ексцесът е спад на върха на емпиричното разпределение нагоре или надолу от върха на кривата на нормалното разпределение.
Оценката на показателите за асиметрия и ексцес дава възможност да се заключи дали това емпирично разпределение може да се припише на типа нормални криви на разпределение.

Видове абсолютни величини, мерни единици и методи за получаване. Относителни величини, техните видове, методи за изчисляване. Относителни стойности на планираната задача, структура, динамика, интензивност, координация, сравнение и методи за тяхното изчисляване и анализ.

Абсолютните стойности са икономически прости (брой магазини, служители) и икономически сложни (обем на търговия, размер на дълготрайните активи). Абсолютните стойности винаги се наричат ​​числа, имат определено измерение, мерни единици. В статистическата наука се използват натурални, парични (стойностни) и трудови мерни единици. Мерните единици се наричат ​​естествени, ако съответстват на потребителски или природни свойстваобект, продукт и ще се изразява във физически тегла, мерки за дължина и пр. В статистическата практика естествени единициизмерванията могат да бъдат съставни. Условно естествените мерни единици се използват при сумиране на броя на различни стоки, продукти. Абсолютните стойности се използват в търговската практика, използват се при анализа и прогнозирането на търговски дейности. Въз основа на тези стойности се съставят бизнес договори в търговската дейност, оценява се обемът на търсенето на конкретни продукти и т.н. Всички аспекти на социалния живот се измерват с абсолютни стойности. Абсолютните стойности според начина на изразяване на размерите на изследваните процеси се разделят на: индивидуални и общи, те от своя страна принадлежат към един от видовете обобщаващи стойности. Размерите на количествените признаци за всяка статистическа единица характеризират индивидуалните абсолютни стойности, а също така са основа за статистическо резюмеза свързване на отделни единици статистически обектна групи. На тяхна основа се получават абсолютни стойности, в които е възможно да се отделят показатели за обема на характеристиките на популацията и показатели за размера на популацията.

Относителните стойности са показател, който е делението на две статистикаи характеризира количествената връзка между тях. За изчисление относителни стойностичислителят е сравненият показател, който ще отразява изследваното явление, а знаменателят отразява показателя, с който ще се направи това сравнение, той е основата или основата за сравнение. Базата за сравнение е един вид метър. Базата е резултат от съотношение в зависимост от количествената (числова) стойност, която се изразява в: коефициент, процент, ppm или децимил.

Ако базата за сравнение се приеме като единица, тогава относителната стойност е коефициент и показва колко пъти изследваната стойност е по-голяма от основата. Ако базата за сравнение се приеме за 100%, тогава резултатът от изчисляването на относителната стойност ще бъде изразен като процент.

Ако базата за сравнение се приеме като 1000, тогава резултатът от сравнението се изразява в ppm (%0). Относителните стойности също могат да бъдат изразени в децимили, ако основата на съотношението е 10 000.

В зависимост от целта на статистическото изследване, относителните стойности се разделят на следните видове: изпълнение на договорни задължения; относителни стойности, характеризиращи структурата на населението; относителни стойности на динамиката; сравнения; координация; относителни стойности на интензитета.

Относителни показателипланирана цел (OPPP) се използват за разширено планиранедейности на субекта на финансово-икономическата сфера и др.

CVPP се изчислява по следната формула:

Относителните стойности на структурата са показатели, които характеризират дела на състава на изследваните популации. Относителната стойност на структурата се определя от съотношението на абсолютната стойност на отделен елемент от статистическата съвкупност към абсолютната стойност на цялата съвкупност, т.е. като съотношение на частта към общото (цялото) и характеризира специфично теглочасти от цялото, под формата на процент.

Относителните стойности на динамиката характеризират промяната в изследваното явление във времето, разкриват посоката на развитие и измерват интензивността на развитието. Относителната стойност на динамиката се изчислява като съотношението на нивото на характеристика в определен период или момент от времето към нивото на същата характеристика в предходния период или точка от времето, т.е. характеризира промяната в ниво на определено явление във времето. Относителните стойности на динамиката се наричат ​​темпове на растеж:

Наименуваните стойности се изразяват в стойности на относителна интензивност:

Относителна стойност на интензитета = абсолютна стойностна изследваното явление / абсолютна стойност, характеризираща обема на средата, в която се разпространява явлението

Относителни показатели за координация (RIC) е съотношението на една част от популацията към друга част от същата популация:

OPC = ниво, характеризиращо i -тата част от популацията / ниво, характеризиращо частта от популацията, избрана като база за сравнение

Средна стойност в статистиката, нейната същност и условия на приложение. Видове и форми на ср. Средно прост и претеглен. Средни тегла, техен избор. Изчисляване на средни стойности по данни от вариационния ред на разпределение.

Средната стойност е обобщена количествена характеристикакомплекти от един и същи тип явления на една различна основа. В икономическата практика се използват широк набор от показатели, изчислени като средни величини. Най-важното свойство среден размерсе крие във факта, че той представя стойността на определен атрибут в цялата съвкупност като едно число, въпреки неговите количествени различия в отделните единици на съвкупността, и изразява общото нещо, което е присъщо на всички единици на изследваната популация. По този начин, чрез характеристиката на единица от съвкупността, тя характеризира цялата съвкупност като цяло. Най-важното условие за научното използване на средните стойности в Статистически анализсоциални явления е хомогенността на населението, за което се изчислява средната стойност. Качествената хомогенност на съвкупността се определя въз основа на комплексна теоретичен анализсъщността на явлението. Например, когато се изчислява средният добив, се изисква входните данни да се отнасят за една и съща култура (среден добив на пшеница) или група култури (среден добив на зърнени култури). Не можете да изчислите средната стойност за разнородни култури. Средните стойности, получени за хетерогенни популации, ще изкривят природата на изследваното социално явление, ще го фалшифицират или ще бъдат безсмислени. Друг важно условиеизползването на средни стойности в анализа е достатъчен брой единици в съвкупността, според които се изчислява средната стойност на признака. Осигурена е достатъчността на анализираните единици правилно определениеграници на изследваната популация, т.е. положени за начална фазастатистически изследвания. Това условие става решаващо при използване на извадково наблюдение, когато е необходимо да се осигури представителност на извадката.

Определянето на максималните и минималните стойности на признак в изследваната популация също е условие за използване на средната стойност в анализа. В случай на големи отклонения между екстремните стойности и средните е необходимо да се провери дали екстремумите принадлежат на изследваната популация. Ако силната променливост на черта е причинена от случайни, краткосрочни фактори, тогава може би екстремни стойностине са характерни за населението. Следователно те трябва да бъдат изключени от анализа, т.к те влияят върху размера на средната стойност. СреденТова е едно от най-често срещаните обобщения. Правилното разбиране на същността на средната определя нейното специално значение в пазарната икономика, когато средната чрез единична и произволна ви позволява да идентифицирате общото и необходимо, да идентифицирате тенденцията на моделите икономическо развитие. Средните стойности се характеризират качествени показателитърговски дейности: разходи за дистрибуция, печалба, рентабилност и др. В статистиката има няколко вида средни стойности:

1. По наличието на знак-тегло: а) непретеглена средна стойност; б) среднопретеглена стойност.

2. Според формата на изчисляване: а) средноаритметична стойност; б) средно хармонична стойност;

в) средно геометрично; г) средноквадратично, кубично и др. количества.

3. По обхват на населението: а) средногрупово; б) общата средна стойност. При изчисляване на средните стойности понятието „ теглото ". Теглото ще бъде цената на дълготрайните производствени активи и нормализирания оборотен капитал, т.е. концепцията тегло и честоти не винаги съвпадат.

На практика е необходимо от масата характеристики да се избере един, който да се използва като тежест. Изборът на тегло не трябва да се разбира по такъв начин, че всеки път да има няколко опции за претегляне. Въпросът трябва да бъде решен по такъв начин, че в резултат на претеглянето да се осигури връщане към тези стойности, които са играли ролята на числител при изчисляването на средната стойност. Следователно, когато претегляме средните стойности, знаменателят на дробта трябва да се приема като тегла, защото само когато умножим по това, на което сме разделили, ще се върнем към първоначалната стойност.

Вариантната поредица се състои от две колони, лявата колона съдържа стойностите на променливия атрибут, наречени варианти и обозначени с (x), а дясната колона съдържа абсолютни числа, показващи колко пъти се среща всеки вариант. Стойностите в тази колона се наричат ​​честоти и се означават с (f). Заедно със средните стойности като статистически характеристикивариационни редове на разпределение, изчисляват се структурни средни - мода и медиана.
Мода(Mo) представлява стойността на изследвания признак, повторен с най-висока честота.
Медиана(Me) е стойността на характеристиката, която попада в средата на класираната (подредена) популация.
Основното свойство на медианата е, че сумата от абсолютните отклонения на стойностите на атрибута от медианата е по-малка от всяка друга стойност ∑|x i - Me|=min.

7. Структурни средни: мода, медиана, квартили и децили.

Режимът е стойността на характеристика, която се среща най-често в дадена популация. По отношение на вариационните серии модата е най-често срещаната стойност на класираните серии. Той показва размера на признака, характерен за значителна част от населението, и се определя по формулата:

където x0 е долната граница на интервала;

h е стойността на интервала;

f м– интервална честота;

f m-1– честота на предходния интервал;

f m+1– честота на следващия интервал.

Медианата е вариантът, разположен в центъра на класираната серия. Медианата разделя серията на две равни части по такъв начин, че от двете й страни да има еднакъв брой единици съвкупност. В същото време в половината от единиците на съвкупността стойността на променливия признак е по-малка от медианата, а в другата половина е по-голяма.

Описателният характер на медианата се проявява във факта, че тя характеризира количествената граница на стойностите на променливия атрибут, които се притежават от половината единици на съвкупността.

При определяне на медианата в интервални вариационни серии първо се определя интервалът, в който тя се намира (средният интервал). Този интервал се характеризира с факта, че неговата натрупана сума от честоти е равна или надвишава половината от сумата от всички честоти на серията. Изчисляването на медианата на интервалните вариационни серии се извършва по формулата:

Където x0 е долната граница на интервала; h е стойността на интервала;

f м– интервална честота; f е броят на членовете на серията; см- 1 - сумата от натрупаните членове на серията, предхождаща тази. Заедно с медианата за повече пълни характеристикиструктурите на изследваната съвкупност използват и други стойности на опциите, които заемат съвсем определена позиция в класираната серия. Те включват квартили и децили. Квартилите разделят серията от сумата на честотите на четири равни части, а децилите - на десет равни части. Има три квартила и девет децила. Медианата и модата, за разлика от средната аритметична стойност, не се анулират индивидуални различияв стойностите на променлив атрибут и следователно са допълнителни и много важни характеристики на статистическата съвкупност. В практиката те често се използват вместо средно или заедно с него. Изчисляването на медианата и модата е особено целесъобразно в случаите, когато изследваната популация съдържа определен брой единици с много голяма или много малка стойност на променливия признак.

8. Показатели за изменчивост на признака: диапазон на изменчивост, средно стандартно отклонение, коефициентът на вариация.

За да се характеризира степента на хомогенност на изследваната съвкупност, степента на флуктуация на индивидуалните познания за даден знак от средната за цялата съвкупност, се използват така наречените показатели за вариация: диапазон на вариация, средно линейно отклонение, стандартно отклонение и коефициент на вариация. Диапазонът на вариация е разликата между максималната и минималната стойност на даден признак за дадена популация. Показва само разликата между максималните и минималните стойности на изследваната черта, без да засяга степента на флуктуация (вариация) на чертите на други единици от популацията. Средното линейно отклонение е средноаритметичното, получено от абсолютните отклонения индивидуални ценностизнак от средноаритметичното за цялата съвкупност. Стандартното отклонение се определя чрез вземане на корен квадратен от сумата от квадратите на линейните отклонения, разделена на броя на индивидуалните стойности на характеристиките на изследваната популация. Коефициент на вариация: процент от средната стойност стандартно отклонениедо средноаритметичното.

Статистически редове на разпределение- подредено разпределение на единиците на съвкупността в групи по определен признак. Той характеризира състава (структурата) на изследваното явление, дава възможност да се прецени хомогенността на съвкупността, моделите на разпространение и границите на вариация на единиците на популацията.

Наричат ​​се редове на разпределение, изградени според атрибутивни (качествени) характеристики атрибутивни(разпределение на населението по пол, заетост, националност, професия и др.).

Сериите на разпределение, построени на количествена основа, се наричат вариационен(разпределение на населението по възраст, работещите - по трудов стаж, работна заплата и др.). Вариационните серии на разпределение се състоят от два елемента: варианти и честоти. Настроикиса индивидуалните стойности на характеристиката, които приема в серията. Честотие броят на отделните варианти или всяка група от вариационната серия, т.е. това са числа, показващи колко често се появяват определени опции в серия за разпространение. Сумата от всички честоти се нарича обем на популацията и определя броя на елементите на цялата популация. Честотите са честоти, изразени в части от единици или в % от общата сума.

Вариационните серии, в зависимост от характера на вариацията, се делят на дискретни и интервални. Дискретните вариационни серии се основават на дискретни (прекъснати) характеристики, които имат само цели числа, на дискретни характеристики, представени като интервали. Сериите с интервални вариации се основават на непрекъснати характеристики (с всякакви стойности, дори дробни).

7. Таблично и графично представяне на статистически данни.

Резултатите от обобщаването и групирането са представени под формата на таблици. Таблицата е рационална, визуална и компактна форма на статистически материал.

Статистическа таблица - таблица, съдържаща резултатите от преброяването на практически данни и е резултат от обобщение на първоначалната информация.

Таблицата характеризира съвкупността по един или повече логически свързани признаци.

Статистическата таблица има свой субект и предикат. Субектът е обект, характеризиращ се с числа. Предикатът на таблицата е система от показатели.

Таблиците са прости и сложни. Една проста таблица дава прост списък от обекти. Сложната таблица съдържа групиране на единици съвкупност едновременно по 2 или повече признака. Таблицата трябва да е компактна, заглавията да са кратки, информацията в колони и колони да завършва с обобщаващ ред. Колоните и редовете трябва да имат мерни единици, след което е необходимо да се извърши равномерна и логична проверка на таблицата.

Статистическата графика е чертеж, в който статистическите агрегати, характеризиращи се с определени показатели, са описани с помощта на условни геометрични изображения или знаци. При изграждането на графика е необходимо да се спазват изискванията: видимост, изразителност, яснота. Графичното поле е част от равнината, в която са разположени графичните изображения. Използват се видове графики: линейни, стълбовидни, лентови, кръгови, секторни, къдрави, точкови, обемни, диаграми и статистически карти. Картограмата е схематична географска карта, която подчертава отраслите или състава на населението.

Резултатите от обобщаването и групирането на материалите от статистическите наблюдения се оформят под формата на статистически серии за разпределение. Статистическите серии на разпределение представляват подредено разпределение на единиците от изследваната съвкупност в групи според групиращ (променлив) признак. Те характеризират състава (структурата) на изследваното явление, позволяват да се прецени хомогенността на популацията, границите на нейното изменение и моделите на развитие на наблюдавания обект. В зависимост от признака статистическите серии на разпределение се разделят на:

Атрибутивен (качествен);

Вариационен (количествен)

а) дискретни;

б) интервал.

Серии за разпределение на атрибути

Признаковите редове се формират според качествени характеристики, които могат да бъдат длъжността, заемана от търговските работници, професия, пол, образование и др.

Таблица 1 - Разпределение на служителите в предприятието по образование.

AT този примергруповият признак е образованието на служителите на предприятието (висше, средно). Тези серии на разпределение са атрибутивни, тъй като променливата характеристика е представена не от количествени, а от качествени показатели. Най-голямо числоработници със средно образование (около 40%); останалите служители са разделени на групи според това качествена характеристика: средно специално образование- 25%; с незавършено висше - 20 %; с най-високата - 15%.

Вариационни серии на разпределение

Серия вариациисе изграждат на базата на количествен групиращ признак. Вариационните серии се състоят от два елемента: вариант и честоти.

опция- това е отделна стойностпроменлив признак, който приема в серията на разпространение. Те могат да бъдат положителни или отрицателни, абсолютни или относителни. Честота- това е броят на отделните варианти или всяка група от вариационната серия. Наричат ​​се честоти, изразени като части от единица или като процент от общата сума честоти. Сумата от честотите се нарича обем на популацията и определя броя на елементите на цялата популация.

Честотиса честоти, изразени като относителни стойности (части от единици или проценти). Сумата от честотите е равна на единица или 100%. Замяната на честотите с честоти ви позволява да сравните вариационните серии с различен номернаблюдения.

Вариационните серии, в зависимост от характера на вариацията, се разделят на: дискретни (прекъснати) и интервални (непрекъснати). Сериите на дискретно разпределение се основават на дискретни (прекъснати) характеристики, които имат само цели числа (например категорията на заплатите на работниците, броят на децата в семейството).

Сериите на интервално разпределение се основават на непрекъснато променяща се стойност на характеристика, която приема всякакви (включително дробни) количествени изрази, т.е. стойността на характеристиките в такива редове се дава като интервал.

При наличието на достатъчно голям брой опции за стойностите на атрибута, първичната серия е трудно видима и директното й разглеждане не дава представа за разпределението на единиците според стойността на атрибут в съвкупността. Следователно, първата стъпка в подреждането на първичната серия е нейното класиране - подреждането на всички опции във възходящ (низходящ) ред.

За да се конструира дискретна серия с малък брой опции, всички срещащи се варианти на стойностите на атрибута се записват х аз, след което се изчислява честотата на повторение на варианта f аз. Обичайно е да се организира серия за разпределение под формата на таблица, състояща се от две колони (или редове), едната от които представя опциите, а другата - честотите.

За да се изгради серия от разпределение на непрекъснато променящи се характеристики или дискретни, представени като интервали, е необходимо да се установи оптималният брой групи (интервали), на които трябва да бъдат разделени всички единици от изследваната съвкупност.

Серията на разпределение е най-простото групиране, в което се характеризира всяка разграничена група само един знак .

В таблица 2 (само броя на банките) - малка извадка - най-простата серия.

Пример: с деца, които са различно времев двора беше: 9 10 11 8 8 9 9 11 11. Класираме от min до max и получаваме:

Пример 2 : със студенти в публиката.

Таблица 0

Разпределение на броя на учениците в група 302

Брой студенти (лица)

Обща сума:

Статистически редове на разпределение - това е подредена поредица от разпределение на единиците на съвкупността в групи според определен променлив признак.

Има 2 вида редове:

1. атрибутивен

Например: таблица 0 Разпределение на броя на учениците в група 302 по пол (женски, мъжки), брой, % (номерацията на колоните е задължителна).

Изгражда се на качествена основа, която няма числено изражение. Такива редове характеризират популацията според изследваната характеристика.

2. вариационен

Построен от количествен атрибут, а атрибутът е подреден във възходящ или низходящ ред на стойността на атрибута, т.е. редът трябва да бъде класиран.

Характеристики на обхвата на разпространение:

1. x – опция(и)е стойността на характеристиката във вариационната серия, т.е. тези стойности, които атрибутът за групиране приема;

2. f - честота- показва колко пъти намерени в съвкупност дадена стойностзнак.

Пример 3 : Децата се разхождаха в двора. AT определено времеимаше: 9 10 11 8 8 9 9 11 11. Подреждаме серията от най-малката към най-голямата и виждаме колко пъти се среща тази или онази опция.

Сумата от всички честоти е равна на сумата от елементите на серията

Понякога честотите се използват за характеризиране на серия - изразени честоти в % или дялове 1.0 .

И в двата случая Wi-Frequency = 100% или Wi-Frequency = 1 такт.

(Вижте таблица 0: 83,3+16,7 = 100,0%)

(вижте таблица 0: 0,83+0,17 = 1,00).

В зависимост от характера на вариативния признак вариационните серии се делят на отделени интервал.

В отделни серии опциите са представени във формуляра цели числа и техните стойности могат да бъдат преброени.

Пример 4:

Таблица 4

Разпределение на семействата по брой деца

Брой деца в семейството (лица)

Брой семейства (единици)

S (натрупани честоти)

Обща сума:

интервални серии- това е сериал, в котка. стойността на характеристиката се изразява като интервали.

В интервални серии знакът може да се променя непрекъснато (от min до max) и да се различава един от друг с произволно малък размер .

Интервалните серии се използват в случаите, когато стойността на атрибута се променя непрекъснато, а също и ако дискретният знак варира в много широки граници, т.е. броят на опциите е доста голям.

Правила за конструиране на редове, избор на брой групи и интервали, както и при групиране.

Таблица 5

Разпределението на служителите на предприятието по месечен размер заплати, търкайте.

Заплата (търкайте)

Брой служители (лица)

Натрупани честоти

Обща сума:

В допълнение към честотите се използват кумулативни честоти или кумулативни честоти.

Те се определят чрез последователно сумиране на честотите на предходните интервали и се означават с S.

Кумулативните честоти се наричат натрупани честоти, те показват колко елемента от ред имат стойност до определен ред.

Несистематизираните данни, събрани в процеса на статистическото наблюдение, формират първичната поредица от данни. При достатъчно голям обем на съвкупността първичните серии от данни стават трудни за разглеждане и директното им разглеждане не може да даде представа за разпределението на съвкупните единици според размера на атрибута.

Първата стъпка в подреждането на основния ред е неговото класиране, т.е. подреждането на всички варианти на серията (характерни стойности) във възходящ или низходящ ред. Класирането на данните ви позволява да:

  • веднага вижте максималните и минималните стойности на атрибута в съвкупността и идентифицирайте разликата между тях (X max - X min);
  • определяне на броя на повторенията на отделните варианти на серията (честота).

В резултат на това първичната неподредена поредица от данни се преобразува в подредена поредица, която ще отразява броя на повторенията на всяка опция:

Тази серия се нарича статистическа серия на разпределение. Той характеризира състава и структурата на изследваното явление, дава възможност да се прецени степента на хомогенност на изследваната съвкупност, закономерностите и границите на вариация на анализирания признак.

Елементите на статистическата серия на разпределение са варианти X и честоти / (абсолютна стойност на числото повторения d-thнастроики).

За характеризиране на структурата на популацията се използва показател, който се нарича честота (4) и се определя по формулата

От определението за честота и честота следват следните равенства: където н - обемът на населението.

В резултат на групирането може да се получи серия на разпределение. Сериите на разпределение могат да бъдат атрибутни и вариационни.

Атрибутната серия е статистическа серия на разпределение, която е изградена на базата на атрибут. Като пример за такава серия може да се разгледа по-специално разпределението на работниците в цеха на предприятието по професия (Таблица 3.2).

Разпределение на цеховите работници по професии

вариационна серияе статистическа серия на разпределение, която е изградена на количествена основа. Могат да се вземат предвид вариационните серии дискретна серия, ако знакът, върху който) е изграден, съответно, е дискретен. Серията на разпределение на вариациите може да бъде и интервална, ако знакът, върху който е изграден, е непрекъснат. Пример за такава серия е разпределението на работниците в цех или предприятие по ниво на умения (Таблица 3.3).

Таблица 3.3

Разпределение на цеховите работници по ниво на квалификация

Като пример за интервална серия на разпределение можем да дадем пример за разпределението на предприятията по обем на производството (виж параграф 3.3). интервално разпределениев този случай се извършва в процеса на конструиране на съответната аналитична групировка, представена в табл. 3.4.

Интервалните серии на разпределение, заедно с дискретните серии на разпределение, позволяват да се разкрие и проучи структурата на изследваното явление (обект на наблюдение).

Таблица 3.4

Разпределение на предприятията по обем на производството

Групи предприятия по обем на производството, милиона рубли

Количество

предприятия

(честота)

Дял в общия брой предприятия

Натрупана

/относно

Xi

НО

НО

д,

Статистическият ред на разпределение може да се разглежда като задължителен резултат от всяко статистическо групиране. При конструиране на серии на разпределение броят на групите и дължината на интервала се определят съгласно правилата, използвани при извършване на статистически групировки (виж параграф 3.2).

За яснота и по-добро разбиранестатистическите серии на разпределение могат да бъдат представени не в таблична, а в графична форма.

Най-често графичен изгледсерия на разпределение се използва за показване на вариационни статистически серии на разпределение.

За показване на дискретна серия се използват линейни диаграми, които се наричат ​​полигони на разпределение. При изграждане на разпределителен полигон в правоъгълна системакоординатите по абсцисната ос отлагат вариантите (стойностите) на анализирания признак. На оста y се нанася честотата на разпределение на варианти или стойности на черта. Целесъобразността на показването на честотите върху ординатната ос се обяснява със следното:

  • това е най-удобният метод за голям обем от изследваната статистическа съвкупност;
  • това дава възможност в рамките на една графика да се изобрази статистическата серия на разпределение на два или повече признака с различен брой единици на съвкупността.

Пресечната точка на точки по абсцисната ос и ординатната ос се образува прекъсната линия, който е полигонът на разпределението (фиг. 3.1 - по данните в таблица 3.3).

За графично показване на интервалните серии по правило се използват стълбови диаграми, които са приети в този случайнаречени хистограми.

Можете да построите хистограма на интервалните серии на разпределението на предприятията по отношение на обема на производството (вижте таблица 3.4). Абсцисната ос в този случай е сегментите, равна наинтервали от серията на разпределение (в приетата скала). Освен това върху тези сегменти се изграждат правоъгълници, които по височина, нанесени по оста y, са равни на честотата или честотата на всеки интервал (фиг. 3.2).


Ориз. 3.1.


Ориз. 3.2.

За решаване на такива проблеми като определяне на структурни средни стойности, наблюдение на процеса на концентрация на изследваното явление и т.н., е обичайно да се трансформират сериите на разпределение в кумулативни серии, които се подреждат в зависимост от натрупаните честоти или честоти. Правилото за изчисляване на натрупването на честоти (честоти) на всеки интервал от серията на разпределение е доста просто. Натрупването на честоти (честоти) се изчислява като сбор от честотата (честотите) на даден интервал и честотите (честотите) на всички интервали, предхождащи този интервал.

Като пример за конструиране на кумулативна серия, ние вземаме данните в табл. 3.4 от последната колона (вижте кумулативната честота с,) и изградете съответната диаграма (фиг. 3.3).

При конструирането на кумулативни серии в правоъгълна координатна система, горните граници на интервалите на серията на разпределение се нанасят върху абсцисната ос, а натрупаните честоти (честоти), които съответстват на тези интервали, се нанасят върху ординатната ос.


Ориз. 3.3.

С използването на кумулати може да се илюстрира процесът на концентрация, където наред с натрупването на честоти (честоти) има разпределения и суми на натрупани групови (или други важни) характеристики на изследваното явление в статистическите серии. Такива криви, които отразяват процеса на концентрация, се наричат ​​криви на Лоренц.

Така че, ако се позовем на данните в табл. 3.4 и фиг. 3.3 може да се отбележи, че натрупаната честота на втория интервал показва, че седем предприятия от 25 произвеждат около 19% от общата продукция, докато всяко от седемте предприятия има производствен обем от не повече от 8,2 милиона рубли. и тези седем предприятия представляват 28% обща сумаразглеждани предприятия.

от най-много важно изискванеот всичко, което може да се представи при изграждането на статистически редове на разпределение, е изискването за съпоставимост във времето и пространството на данните за интервали. В същото време е съвсем ясно, че в редове с равни интервали това изискване се изпълнява автоматично. В тези серии на разпределение, чиито интервали не са равни, е обичайно да се изчислява плътността на разпределението като част от разделянето на честотата на интервала на неговата дължина. При графичното показване на сериите на разпределение с неравни интервали е обичайно да се изобразяват ns на честотата (честотата) на оста y и стойностите на плътността на разпределението.

За улесняване на изграждането на групи и графични показвания на статистически серии могат да се използват редактори. електронни таблици(напр. Excel).

  • Виж: Макарова Н. В., Трофимец В. С. Статистика в Excel. М.: Финанси и статистика, 2009; и други подобни публикации.