Биографии Характеристики Анализ

Построяване на дискретна серия. Построяване на дискретна вариационна редица

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Добра работакъм сайта">

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

публикувано на http://www.allbest.ru/

ЗАДАЧА1

Налична е следната информация за заплатислужители в предприятието:

Таблица 1.1

Размерът на заплатите в конв. бърлога единици

Изисква се да се построи интервална серия от разпределението, по която да се намира;

1) средна заплата;

2) средно линейно отклонение;

4) стандартно отклонение;

5) диапазон на вариация;

6) коефициент на трептене;

7) линеен коефициентвариации;

8) прост коефициент на вариация;

10) медиана;

11) коефициент на асиметрия;

12) Индекс на асиметрия на Pearson;

13) коефициент на ексцес.

Решение

Както знаете, опциите (разпознатите стойности) са подредени във възходящ ред за формиране дискретни вариационни серии. С голям брой вариант (повече от 10), дори и при дискретна вариация се изграждат интервални серии.

Ако една интервална серия е съставена с четни интервали, тогава диапазонът на вариация се разделя на посочен номеринтервали. В този случай, ако получената стойност е цяло число и еднозначна (което е рядко), тогава дължината на интервала се приема равна на това число. В други случаи произведени закръгляване непременно в страна увеличение, Така да се последната останала цифра беше четна. Очевидно с увеличаване на дължината на интервала, обхватът на вариация по величина, равно на произведениетоброй интервали: разликата между изчислената и първоначалната дължина на интервала

а) Ако стойността на разширението на диапазона на вариация е незначителна, тогава тя или се добавя към най-голямата, или се изважда от най-малката стойност на характеристиката;

б) Ако размерът на разширяването на диапазона на вариация е осезаем, тогава, за да се избегне смесването на центъра на диапазона, той се разделя грубо наполовина, като едновременно се добавя към най-големите и се изважда от най-малките стойности на атрибут.

Ако интервална поредица е съставена с неравни интервали, тогава процесът е опростен, но както преди, дължината на интервалите трябва да бъде изразена като число с последната четна цифра, което значително опростява следващите изчисления. числови характеристики.

30 - размер на извадката.

Нека съставим серия с интервално разпределение, използвайки формулата на Стърджис:

K \u003d 1 + 3,32 * lg n,

К - брой групи;

K \u003d 1 + 3,32 * lg 30 \u003d 5,91 \u003d 6

Намираме обхвата на знака - заплатите на служителите в предприятието - (x) по формулата

R \u003d xmax - xmin и разделете на 6; R=195-112=83

Тогава дължината на интервала ще бъде ллента=83:6=13.83

Началото на първия интервал ще бъде 112. Добавяне към 112 л ras=13,83, получаваме крайната му стойност 125,83, която също е началото на втория интервал и т.н. краят на петия интервал е 195.

При намиране на честоти трябва да се ръководи от правилото: "ако стойността на характеристика съвпада с границата на вътрешния интервал, тогава тя трябва да се отнесе към предишния интервал."

Получаваме интервална серия от честоти и кумулативни честоти.

Таблица 1.2

Следователно 3 служители имат заплати. плащане от 112 до 125,83 условни единици. Най-високата заплата плащане от 181,15 до 195 условни единици. само 6 работници.

За да изчислим числените характеристики, преобразуваме интервалната серия в дискретна, като вземем средата на интервалите като вариант:

Таблица 1.3

14131,83

Според формулата за средноаритметично претеглено

cond.mon.un.

Средно линейно отклонение:

където xi е стойността на изследвания признак в i-тата единица от съвкупността,

Средната стойност на изследвания признак.

публикувано на http://www.allbest.ru/

LПубликувано на http://www.allbest.ru/

Парична единица

Стандартно отклонение:

дисперсия:

Относителен диапазон на вариация (коефициент на трептене): c=R:,

Относително линейно отклонение: q = L:

Коефициентът на вариация: V = y:

Коефициентът на трептене показва относителната волатилност екстремни стойностизнакът е за средноаритметичното, а коефициентът на вариация характеризира степента и хомогенността на съвкупността.

c \u003d R: \u003d 83 / 159,485 * 100% \u003d 52,043%

Така разликата между екстремните стойности е с 5,16% (=94,84%-100%) по-малко от средната заплата на служителите в предприятието.

q \u003d L: \u003d 17,765 / 159,485 * 100% \u003d 11,139%

V \u003d y: \u003d 21,704 / 159,485 * 100% \u003d 13,609%

Коефициентът на вариация е по-малък от 33%, което показва слаба вариация в заплатите на служителите в предприятието, т.е. че средна стойносте типична характеристика на работната заплата на работниците (хомогенна съвкупност).

В интервалната серия на разпределението модасе определя по формулата -

Честотата на модалния интервал, т.е. интервалът, съдържащ най-голям бройопция;

Честотата на интервала, предхождащ модала;

Честотата на интервала след модала;

Дължината на модалния интервал;

Долната граница на модалния интервал.

За определяне медианив интервалните серии използваме формулата

където е кумулативната (кумулативна) честота на интервала, предхождащ медианата;

Долната граница на средния интервал;

Честота на средния интервал;

Дължината на средния интервал.

Среден интервал- интервал, чиято натрупана честота (=3+3+5+7) надхвърля половината от сумата на честотите - (153.49; 167.32).

Нека изчислим изкривяването и ексцеса, за които ще съставим нов работен лист:

Таблица 1.4

Фактически данни

Приблизителни данни

Изчислете момента на трети ред

Следователно асиметрията е

Тъй като 0,3553 0,25, асиметрията се признава за значима.

Изчислете момента от четвърти ред

Следователно, ексцесът е

защото< 0, то эксцесс является плосковершинным.

Степента на асиметрия може да се определи с помощта на коефициента на асиметрия на Пиърсън (As): колебание проба разходи оборот

където е средноаритметичната стойност на серията на разпределение; -- мода; -- стандартно отклонение.

Следователно при симетрично (нормално) разпределение = Mo коефициентът на асиметрия е нула. Ако Аs > 0, тогава има повече мода, следователно има дясна асиметрия.

Ако As< 0, то по-малко мода, следователно има лявостранна асиметрия. Коефициентът на асиметрия може да варира от -3 до +3.

Разпределението не е симетрично, а има лявостранна асиметрия.

ЗАДАЧА 2

Какъв трябва да бъде размерът на извадката, така че да има вероятност от 0,954 грешката на извадката да не надвишава 0,04, ако дисперсията е известна от предишни проучвания, че е 0,24?

Решение

Размер на извадката при без преизбиранеизчислено по формулата:

t - коефициент на доверие (с вероятност 0,954 е равен на 2,0; определен от таблиците на вероятностните интеграли),

y2=0,24 - стандартно отклонение;

10 000 души - размер на извадката;

Dx \u003d 0,04 - пределна грешкаизвадкова средна стойност.

С вероятност от 95,4%, може да се твърди, че размерът на извадката предоставя относителна грешкане повече от 0,04, трябва да са най-малко 566 семейства.

ЗАДАЧА3

Налични са следните данни за приходите от основната дейност на предприятието, милиона рубли.

За да анализирате поредица от динамика, определете следните показатели:

1) верига и основни:

Абсолютни печалби;

темпове на растеж;

темпове на растеж;

2) среден

Ниво на динамичен обхват;

Абсолютен растеж;

Скорост на растеж;

Скорост на нарастване;

3) абсолютната стойност на 1% растеж.

Решение

1. Абсолютен растеж (дy)- това е разликата между следващото ниво на серията и предишното (или основно):

верига: Du \u003d yi - yi-1,

основен: Du \u003d yi - y0,

yi - ниво на ред,

i - номер на ниво ред,

y0 - ниво на базова година.

2. Темп на растеж (Tu)е съотношението на следващото ниво от серията и предходното (или базовата година 2001):

верига: Tu = ;

основно: Tu =

3. Темп на растеж (Tд) - това е отношението на абсолютния растеж към предишното ниво, изразено в%.

верига: Tu = ;

основно: Tu =

4. Абсолютна стойност 1% увеличение (A)- е отношението на верижния абсолютен растеж към скоростта на растеж, изразено в%.

НО =

Ниво на среден редизчислено по формулата за средно аритметично.

Средно ниво на доходи от основна дейност за 4 години:

Среден абсолютен прирастизчислено по формулата:

където n е броят на нивата в реда.

Средно за годината приходите от основни дейности са се увеличили с 3,333 милиона рубли.

Средногодишен темп на растежизчислено по формулата за средно геометрична:

уn - последното ниво на серията,

y0 - Първо ниворед.

Tu \u003d 100% \u003d 102,174%

Средногодишен темп на растежизчислено по формулата:

T? \u003d Tu - 100% \u003d 102,74% - 100% \u003d 2,74%.

Така средно за година приходите от основна дейност на предприятието нарастват с 2,74%.

ЗАДАЧИНО4

Изчисли:

1. Индивидуални ценови индекси;

2. Общ индекс на текучеството;

3. Агрегиран индекс на цените;

4. Агрегиран индекс на физическия обем на продажбата на стоки;

5. Абсолютното увеличение на стойността на оборота и се разлага по фактори (поради промени в цените и броя на продадените стоки);

6. Направете кратки изводиза всички получени резултати.

Решение

1. По условие индивидуалните индекси на цените за продукти A, B, C възлизат на -

ipA=1,20; ipB=1,15; iрВ=1,00.

2. Общият индекс на оборота се изчислява по формулата:

I w \u003d \u003d 1470/1045 * 100% \u003d 140,67%

Търговският оборот нараства с 40,67% (140,67% -100%).

Средно цените на суровините са се повишили с 10,24%.

Размерът на допълнителните разходи за купувачите от увеличенията на цените:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333,478 \u003d 136,522 милиона рубли.

В резултат на нарастващите цени купувачите трябваше да похарчат допълнително 136,522 милиона рубли.

4. Общ индекс на физическия обем на търговията:

Физическият обем на търговията нараства с 27.61%.

5. Дефинирайте обща промянаоборот през втория период в сравнение с първия период:

w \u003d 1470- 1045 \u003d 425 милиона рубли.

поради промени в цените:

W(p) \u003d 1470 - 1333,478 \u003d 136,522 милиона рубли.

чрез промяна на физическия обем:

w(q) \u003d 1333.478 - 1045 \u003d 288.478 милиона рубли.

Стокооборотът се увеличава с 40,67%. С 10,24% са поскъпнали средно 3 стоки. Физическият обем на търговията нараства с 27.61%.

Като цяло обемът на продажбите се е увеличил с 425 милиона рубли, включително поради нарастващите цени, той се е увеличил със 136,522 милиона рубли, а поради увеличаване на обема на продажбите - с 288,478 милиона рубли.

ЗАДАЧА5

За 10 завода в една индустрия са налични следните данни.

Фабричен номер

Изход, хил. бр (Х)

Въз основа на предоставените данни:

I) за потвърждаване на разпоредбите на логическия анализ за наличието на линейна корелация между факторния знак (производство) и резултантния знак (консумация на електроенергия), начертайте първоначалните данни върху графиката на корелационното поле и направете изводи за форма на връзката, посочете нейната формула;

2) определете параметрите на уравнението на връзката и начертайте получената теоретична линия върху графиката на корелационното поле;

3) изчисляване на линейния коефициент на корелация,

4) обяснете стойностите на показателите, получени в параграфи 2) и 3);

5) използвайки получения модел, направете прогноза за възможното потребление на електроенергия в завод с производствен обем от 4,5 хиляди единици.

Решение

Символни данни - обемът на продукцията (фактор), означен с хi; знак - потребление на електроенергия (резултат) през ui; точки с координати (x, y) се нанасят върху корелационното поле OXY.

Точките на корелационното поле са разположени по права линия. Следователно връзката е линейна, ще търсим уравнението на регресията под формата на права Yx=ax+b. За да го намерим, използваме системата от нормални уравнения:

Нека създадем електронна таблица.

Въз основа на намерените средни съставяме системата и я решаваме по отношение на параметрите a и b:

И така, получаваме регресионното уравнение за y върху x: \u003d 3,57692 x + 3,19231

Изграждаме регресионна линия върху корелационното поле.

Замествайки стойностите x от колона 2 в уравнението на регресията, получаваме изчислените (колона 7) и ги сравняваме с данните за y, които са отразени в колона 8. Между другото, коректността на изчисленията също се потвърждава чрез съвпадението на средните стойности на y и.

Коефициентлинейна корелацияоценява плътността на връзката между характеристиките x и y и се изчислява по формулата

Ъгловият коефициент на директна регресия a (при x) характеризира посоката на идентифициранотозависимостипризнаци: за a>0 те са еднакви, за a<0- противоположны. Неговият абсолютен стойност - мярка за промяна в резултантния знак, когато факторният знак се промени за единица измерване.

Свободният член на директната регресия разкрива посоката, а абсолютната му стойност - количествена мярка за влияние върху ефективния знак на всички останали фактори.

Ако< 0, тогава ресурсът на факторния атрибут на отделен обект се използва с по-малко и когато>0 спо-висока производителност от средната за целия набор от обекти.

Нека направим пост-регресионен анализ.

Коефициентът при x на директна регресия е 3,57692 > 0, следователно с увеличаване (намаляване) на производството потреблението на електроенергия се увеличава (пада). Увеличение на производството с 1 хил. бр. дава средно увеличение на потреблението на електроенергия с 3,57692 хил. kWh.

2. Свободният член на директната регресия е 3.19231, следователно влиянието на други фактори увеличава силата на въздействието на производството върху потреблението на електроенергия в абсолютно измерванес 3.19231 хил. kWh.

3. Корелационният коефициент от 0,8235 разкрива много тясна зависимост на потреблението на електроенергия от производството.

Според уравнението регресионен моделлесни за правене на прогнози. За да направите това, стойностите x, представляващи обема на продукцията, се заместват в регресионното уравнение и се прогнозира консумацията на електроенергия. В този случай стойностите на x могат да бъдат взети не само в даден диапазон, но и извън него.

Нека направим прогноза за възможното потребление на електроенергия в завод с производствен обем от 4,5 хиляди единици.

3.57692*4.5 + 3.19231= 19.288 45 хиляди kWh.

СПИСЪК НА ИЗПОЛЗВАНИТЕ ИЗТОЧНИЦИ

1. Захаренков С.Н. Социално-икономическа статистика: Учебно ръководство. - Минск: BSEU, 2002.

2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Обща теориястатистика. - М.: ИНФРА - М., 2000.

3. Елисеева I.I. Статистика. - М.: Проспект, 2002.

4. Обща теория на статистиката / Изд. изд. О.Е. Башина, А.А. спирин. - М .: Финанси и статистика, 2000.

5. Социално-икономическа статистика: Учеб.-практ. помощ / Захаренков С.Н. и др. - Минск: YSU, 2004.

6. Социално-икономическа статистика: учеб. надбавка. / Ед. Нестерович С.Р. - Минск: BSEU, 2003.

7. Теслюк И. Е., Тарловская В. А., Терлиженко Н. Статистика - Минск, 2000 г.

8. Харченко Л.П. Статистика. - М.: ИНФРА - М, 2002.

9. Харченко Л.П., Долженкова В.Г., Йонин В.Г. Статистика. - М.: ИНФРА - М, 1999.

10. Икономическа статистика / Изд. Ю.Н. Иванова - М., 2000г.

Хоствано на Allbest.ru

...

Подобни документи

    Изчисляване на средно аритметично за интервални серииразпространение. Определение общ индексфизическия обем на търговията. Анализ на абсолютното изменение на общата себестойност на продукцията поради промени във физическия обем. Изчисляване на коефициента на вариация.

    тест, добавен на 19.07.2010 г

    Същността на търговията на едро, дребно и обществената търговия. Формули за изчисляване на индивидуални, съвкупни индекси на оборота. Изчисляване на характеристиките на интервалния ред на разпределение - средно аритметично, мода и медиана, коефициент на вариация.

    курсова работа, добавена на 05/10/2013

    Изчисляване на планирания и реалния обем на продажбите, процента на плана, абсолютното изменение на оборота. Определяне на абсолютен прираст, средни темпове на прираст и прираст на паричните доходи. Изчисляване на структурни средни: моди, медиани, квартили.

    тест, добавен на 24.02.2012 г

    Интервални редове на разпределение на банките по обем на печалбата. Намиране на модата и медианата на получените интервални серии на разпределение графичен методи чрез изчисления. Изчисляване на характеристиките на интервалния ред на разпределение. Изчисляване на средно аритметично.

    тест, добавен на 15.12.2010 г

    Формули за определяне на средните стойности на интервалните серии - моди, медиани, дисперсии. Изчисляване на аналитични показатели на динамични редове по верижни и основни схеми, темпове на растеж и растеж. Концепцията за съставен индекс на разходите, цените, разходите и оборота.

    курсова работа, добавена на 27.02.2011 г

    Понятие и предназначение, ред и правила за изграждане вариационна серия. Анализ на хомогенността на данните в групи. Индикатори за вариация (флуктуация) на признак. Определяне на средната линейна стойност и стандартно отклонение, коефициент на трептене и вариация.

    тест, добавен на 26.04.2010 г

    Понятието мода и медиана като типични характеристики, редът и критериите за тяхното определяне. Намиране на мода и медиана в дискретна и интервална вариационна серия. Квартили и децили като допълнителни характеристики на вариационните статистически редове.

    тест, добавен на 09/11/2010

    Построяване на интервален ред на разпределение на групов принцип. Характеризиране на отклонението на честотното разпределение от симетричната форма, изчисляване на показателите за ексцес и асиметрия. Анализ на показателите на баланса или отчета за доходите.

    контролна работа, добавена на 19.10.2014 г

    Трансформация на емпиричните редове в дискретни и интервални. Определяне на средната стойност върху дискретна серия с помощта на нейните свойства. Изчисляване на дискретна поредица от моди, медиани, вариационни показатели (дисперсия, отклонение, коефициент на трептене).

    тест, добавен на 17.04.2011 г

    Изграждане на статистическа серия от разпределение на организациите. Графична дефинициярежим и средни стойности. Стегнатостта на корелацията с използването на коефициента на детерминация. Определяне на извадковата грешка на средния брой служители.

Най-лесният начин да се обобщи статистически материале изграждането на редове. Обобщен резултат статистически изследванияможе да има разпределителни линии. Серия на разпределение в статистиката е подредено разпределение на единиците от съвкупността в групи според всеки един признак: качествен или количествен. Ако серията е изградена на качествена основа, тогава тя се нарича атрибутивна, а ако на количествен признак, след това вариационен.

Вариационната серия се характеризира с два елемента: вариант (X) и честота (f). Вариантът е отделна стойност на знак на отделна единица или група население. Числото, показващо колко пъти се появява определена стойност на характеристиката, се нарича честота. Ако честотата е изразена като относително число, тогава тя се нарича честота. Вариационните серии могат да бъдат интервални, когато са определени границите „от” и „до”, или могат да бъдат дискретни, когато изследваният признак се характеризира с определено число.

Ще разгледаме изграждането на вариационни серии, като използваме примери.

Пример. и има данни за категориите заплати на 60 работници в един от цеховете на завода.

Разпределете работниците според тарифната категория, изградете вариационна серия.

За да направите това, записваме всички стойности на атрибута във възходящ ред и изчисляваме броя на работниците във всяка група.

Таблица 1.4

Разпределение на работниците по категории

Ранг на работник (X)

Брой работници

човек (е)

в % от общото (по-специално)

Получихме вариационна дискретна серия, в която изследваната черта (работнически ранг) е представена с определено число. За нагледност вариационният ред е изобразен графично. Въз основа на тази серия на разпределение е изградена разпределителна повърхност.

Ориз. 1.1. Полигон за разпределение на работниците по категории заплати

Ще разгледаме изграждането на интервална серия с равни интервали, използвайки следния пример.

Пример. Известни данни за цената на основния капитал на 50 фирми в милиони рубли. Изисква се да се покаже разпределението на фирмите според цената на основния капитал.

За да покажем разпределението на фирмите според цената на основния капитал, първо решаваме броя на групите, които искаме да разграничим. Да предположим, че решим да отделим 5 групи предприятия. След това определяме размера на интервала в групата. За целта използваме формулата

Според нашия пример.

Като добавим стойността на интервала към минималната стойност на атрибута, получаваме групи от фирми по цена на основен капитал.

Единицата, която има двойна стойност, се отнася до групата, където действа като горна граница (т.е. стойността на характеристиката 17 ще отиде в първата група, 24 във втората и т.н.).

Нека преброим броя на растенията във всяка група.

Таблица 1.5

Разпределение на фирмите по стойност на основния капитал (млн рубли)

Цената на основния капитал
в милиони рубли (Х)

Брой фирми
(честота) (f)

Натрупани честоти
(кумулативно)

Според това разпределение се получава вариационна интервална серия, от която следва, че 36 фирми имат основен капитал на стойност от 10 до 24 милиона рубли. и т.н.

Интервалните разпределителни серии могат да бъдат представени графично като хистограма.

Резултатите от обработката на данните са документирани в статистически таблици. Статистическите таблици съдържат своя предмет и предикат.

Предметът е това множество или част от множеството, което е подложено на характеристиката.

Предикатът е показател, който характеризира субекта.

Различават се таблици: прости и групови, комбинирани, с просто и сложно развитие на предиката.

Една проста таблица в темата съдържа списък с отделни единици.

Ако предметът има групиране на единици, тогава такава таблица се нарича групова таблица. Например група предприятия по брой работници, групи от населението по пол.

Предметът на комбинираната таблица съдържа групиране по два или повече критерия. Например населението се разделя по пол на групи по образование, възраст и т.н.

Комбинираните таблици съдържат информация, която ви позволява да идентифицирате и характеризирате връзката на редица показатели и модела на техните промени както в пространството, така и във времето. За да бъде таблицата нагледна при разработване на предмета си, те се ограничават до два или три знака, образувайки ограничен брой групи за всеки от тях.

Предикатът в таблиците може да се развие по различни начини. При просто развитие на предиката всички негови индикатори са разположени независимо един от друг.

При сложно развитие на предиката показателите се комбинират един с друг.

При конструирането на всяка таблица трябва да се изхожда от целите на изследването и съдържанието на обработения материал.

В допълнение към таблиците статистиката използва графики и диаграми. Диаграма - статистическите данни се показват с помощта на геометрични форми. Диаграмите са разделени на линейни и лентови диаграми, но може да има къдрави диаграми (чертежи и символи), кръгови диаграми(кръгът се приема като стойност на цялата съвкупност, а площите на отделните сектори се показват специфично теглоили дял от него съставни части), радиални диаграми(построен на базата на полярни ординати). Картограмата е комбинация от контурна карта или план на площ с диаграма.

Резултатите от групирането са събрани статистически данни, като правило, се представят под формата на серии за разпространение. Серията на разпределение е подредено разпределение на единиците на популацията в групи според изследваната характеристика.

Сериите на разпределение се делят на атрибутивни и вариационни в зависимост от признака, който е в основата на групирането. Ако знакът е качествен, тогава серията на разпределение се нарича атрибутивна. Пример за серия от атрибути е разпределението на предприятията и организациите по форма на собственост (виж таблица 3.1).

Ако атрибутът, по който е изградена серията на разпределение, е количествена, тогава серията се нарича вариационна.

Сериите на вариационното разпределение винаги се състоят от две части: вариант и съответните им честоти (или честоти). Вариант е стойност, която може да приеме характеристика в единици от съвкупността, честота е броят единици на наблюдение, които имат дадена стойност на характеристиката. Сумата от честотите винаги е равна на размера на населението. Понякога вместо честоти се изчисляват честоти - това са честоти, изразени или във фракции от единица (тогава сумата от всички честоти е равна на 1), или като процент от обема на населението (сумата от честотите ще бъде равна на 100%).

Вариационните редове са дискретни и интервални. За дискретни серии (Таблица 3.7) опциите са изразени конкретни числа, обикновено цели.

Таблица 3.8. Разпределение на служителите по работно време в застрахователната компания
Работно време във фирмата пълни години(настроики) Брой служители
Човек (честоти) в % от общо (често)
до една година 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Обща сума 129 100,0

В интервалните серии (вижте таблица 3.2) стойностите на индикатора се задават като интервали. Интервалите имат две граници: долна и горна. Интервалите могат да бъдат отворени или затворени. Отворените нямат нито една от границите, така че в табл. 3.2 първият интервал няма долна граница, а последният няма горна граница. При конструирането на интервална серия, в зависимост от естеството на разпространението на стойностите на атрибута, се използват както равни, така и неравни интервали (Таблица 3.2 показва вариационна серия с равни интервали).

Ако характеристиката приема ограничен брой стойности, обикновено не повече от 10, се изграждат дискретни серии за разпределение. Ако вариантът е по-голям, тогава дискретната серия губи своята видимост; в този случай е препоръчително да се използва интервалната форма на вариационния ред. При непрекъснато изменение на характеристика, когато нейните стойности в определени граници се различават една от друга с произволно малка сума, също се изгражда серия от интервално разпределение.

3.3.1. Построяване на дискретни вариационни редове

Разгледайте техниката за конструиране на дискретни вариационни серии, като използвате пример.

Пример 3.2. Налични са следните данни за количествения състав на 60 семейства:

За да се получи представа за разпределението на семействата според броя на членовете им, трябва да се изгради вариационен ред. Тъй като атрибутът приема ограничен брой цели числа, ние конструираме дискретна вариационна серия. За да направите това, първо се препоръчва да изпишете всички стойности на атрибута (броя на членовете в семейството) във възходящ ред (т.е. да класирате статистическите данни):

След това трябва да преброите броя на семействата със същия състав. Броят на членовете на семейството (стойността на променливия признак) са опциите (ще ги обозначим с x), броят на семействата с еднакъв състав са честотите (ще ги означим с f). Представяме резултатите от групирането под формата на следната дискретна вариационна серия на разпределение:

Таблица 3.11.
Брой членове на семейството (x) Брой семейства (y)
1 8
2 14
3 20
4 9
5 5
6 4
Обща сума 60

3.3.2. Построяване на интервални вариационни серии

Нека покажем метода за конструиране на интервални вариационни серии на разпределение, като използваме следния пример.

Пример 3.3. Като резултат статистическо наблюдениеполучиха следните данни за средния лихвен процент на 50 търговски банки (%):

Таблица 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Както можете да видите, е изключително неудобно да видите такъв масив от данни, освен това няма модели на промяна в индикатора. Нека построим интервална серия на разпределение.

  1. Нека да определим броя на интервалите.

    Броят на интервалите на практика често се определя от самия изследовател въз основа на целите на всяко конкретно наблюдение. Въпреки това може да се изчисли и математически, като се използва формулата на Стърджис

    n = 1 + 3,322lgN,

    където n е броят на интервалите;

    N е обемът на съвкупността (броят единици за наблюдение).

    За нашия пример получаваме: n \u003d 1 + 3.322lgN \u003d 1 + 3.322lg50 \u003d 6.6 "7.

  2. Нека определим стойността на интервалите (i) по формулата

    където x max - максималната стойност на характеристиката;

    x min - минималната стойност на атрибута.

    За нашия пример

    Интервалите на вариационния ред са показателни, ако границите им имат „кръгли“ стойности, затова ще закръглим стойността на интервала 1,9 на 2, а минималната стойност на признака 12,3 на 12,0.

  3. Нека да определим границите на интервалите.

    Интервалите, като правило, се записват по такъв начин, че горната граница на един интервал е едновременно долната граница на следващия интервал. Така че за нашия пример получаваме: 12.0-14.0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20.0-22.0; 22.0-24.0; 24.0-26.0.

    Такъв запис означава, че функцията е непрекъсната. Ако вариантите на атрибута се приемат стриктно определени стойности, например, само цели числа, но техният брой е твърде голям за изграждане дискретна серия, тогава можете да създадете интервална серия, където долната граница на интервала няма да съвпада с горната граница на следващия интервал (това ще означава, че функцията е дискретна). Например, при разпределението на служителите на дадено предприятие по възраст, можете да създадете следните интервални групи от години: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 и Повече ▼.

    Освен това в нашия пример можем да направим първия и последния интервал отворени и т.н. запис: до 14.0; 24.0 и по-горе.

  4. Въз основа на първоначалните данни изграждаме класирана серия. За да направим това, записваме във възходящ ред стойностите, които функцията приема. Резултатите са представени в таблицата: Таблица 3.13. Класирани серии от лихвени проценти на търговски банки
    Банков процент % (опции)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Нека изчислим честотите.

    При преброяване на честотите може да възникне ситуация, когато стойността на характеристика попада на границата на интервал. В този случай можете да следвате правилото: дадената единица се присвоява на интервала, за който нейната стойност е горната граница. И така, стойността 16.0 в нашия пример ще се отнася за втория интервал.

Резултатите от групирането, получени в нашия пример, ще бъдат представени в таблица.

Таблица 3.14. Разпределение на търговските банки по кредитен лихвен процент
Къс процент, % Брой банки, единици (честоти) Натрупани честоти
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Обща сума 50 -

Последната колона на таблицата представя натрупаните честоти, които се получават чрез последователно сумиране на честотите, като се започне от първата (например за първия интервал - 5, за втория интервал 5 + 9 = 14, за третия интервал 5 + 9 + 4 = 18 и т.н.). Натрупаната честота, например 33, показва, че 33 банки имат процент по кредита, който не надвишава 20% (горната граница на съответния интервал).

В процеса на групиране на данни при конструирането на вариационни серии понякога се използват неравни интервали. Това се отнася за онези случаи, когато характерните стойности се подчиняват на правилото на аритметиката или геометрична прогресияили когато прилагането на формулата на Стърджис води до "празни" интервални групи, несъдържащи единици за наблюдение. След това границите на интервалите се задават произволно от самия изследовател, въз основа на здрав разуми целите на проучването или формулите. И така, за данни, които се променят аритметична прогресия, стойността на интервалите се изчислява по следния начин.

Състояние:

Има данни за възрастовия състав на работниците (години): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Изградете серия на интервално разпределение.
    2. Изграждане графично изображениеред.
    3. Графично определете модата и медианата.

Решение:

1) Според формулата на Стърджис населението трябва да бъде разделено на 1 + 3,322 lg 30 = 6 групи.

Максималната възраст е 38, минималната 18.

Ширина на интервала Тъй като краищата на интервалите трябва да са цели числа, ще разделим съвкупността на 5 групи. Ширина на интервала - 4.

За да улесним изчисленията, нека подредим данните във възходящ ред: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29 , 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

Разпределение възрастов съставработници

Графично серия може да бъде показана като хистограма или многоъгълник. Хистограма - стълбовидна графика. Основата на колоната е ширината на интервала. Височината на лентата е равна на честотата.

Полигон (или полигон на разпределение) е графика на честотите. За да го изградим според хистограмата, свързваме средните точки на горните страни на правоъгълниците. Затваряме многоъгълника по оста x на разстояния, равни на половината от интервала от екстремните стойности на x.

Режим (Mo) е стойността на изследваната характеристика, която се среща най-често в дадена популация.

За да определите режима от хистограмата, трябва да изберете най-високия правоъгълник, да начертаете линия от десния връх на този правоъгълник вдясно горен ъгълна предишния правоъгълник и начертайте линия от левия връх на модалния правоъгълник до левия връх на следващия правоъгълник. От точката на пресичане на тези линии начертайте перпендикуляр на оста x. Абсцисата ще бъде мода. Mo ≈ 27,5. Това означава, че най-често срещаната възраст в тази популация е 27-28 години.

Медианата (Me) е стойността на изследваната черта, която е в средата на подредена вариационна серия.

Намираме медианата по кумулата. Cumulate - графика на натрупаните честоти. Абсцисите са варианти на серия. Ординатите са натрупаните честоти.

За да определим медианата за кумулацията, намираме по ординатната ос точка, съответстваща на 50% от натрупаните честоти (в нашия случай 15), начертаваме права линия през нея, успоредна на оста Ox, и начертаваме перпендикуляр на оста x от точката на нейното пресичане с кумулата. Абсцисата е медианата. Аз ≈ 25.9. Това означава, че половината от работещите в тази популация са на възраст под 26 години.

Най-важният етап в изследването на социално-икономическите явления и процеси е систематизирането на първичните данни и на тази основа получаването на обобщена характеристика на целия обект с помощта на обобщаващи показатели, което се постига чрез обобщаване и групиране на първичен статистически материал.

Статистическо резюме е комплекс последователни операциивърху обобщаването на конкретни единични факти, които образуват набор, за идентифициране типични характеристикии модели, присъщи на изследваното явление като цяло. Провеждането на статистическо обобщение включва следните стъпки :

  • избор на функция за групиране;
  • определяне на реда за формиране на групите;
  • развитие на системата статистически показателида характеризира групите и обекта като цяло;
  • разработване на оформления на статистически таблици за представяне на обобщени резултати.

Статистическо групиране наречено разделяне на единици от изследваната съвкупност на еднородни груписпоред определени характеристики, които са съществени за тях. Групирането е най-важно статистически методобобщаване на статистически данни, основа за правилно изчисляване на статистически показатели.

Разграничете следните видовегрупировки: типологични, структурни, аналитични. Всички тези групи се обединяват от факта, че единиците на обекта са разделени на групи по някакъв признак.

знак за групиране се нарича признакът, по който единиците от съвкупността се разделят на отделни групи. от правилен изборфункцията за групиране зависи от заключенията на статистическото изследване. Като основа за групиране е необходимо да се използват значими, теоретично обосновани признаци (количествени или качествени).

Количествени признаци на групиране имат цифров израз (обем на търговия, възраст на лицето, семеен доход и др.) и качествени характеристики на групировката отразяват състоянието на единицата от населението (пол, семейно положение, отраслова принадлежност на предприятието, неговата форма на собственост и др.).

След като се определи основата на групирането, трябва да се реши въпросът за броя на групите, на които трябва да бъде разделена изследваната популация. Броят на групите зависи от целите на изследването и вида на показателя, залегнал в групирането, обема на популацията, степента на изменчивост на признака.

Например, групирането на предприятията според формите на собственост отчита общинската, федералната и собствеността на субектите на федерацията. Ако групирането се извършва на количествена основа, тогава е необходимо да се обърне Специално вниманиевърху броя на единиците на изследвания обект и степента на флуктуация на групиращия признак.

Когато се определи броят на групите, трябва да се определят и интервалите на групиране. Интервал - това са стойностите на променлива характеристика, които се намират в определени граници. Всеки интервал има своя собствена стойност, горна и долна граница или поне една от тях.

Долната граница на интервала се нарича най-малката стойност на атрибута в интервала и Горна граница - най-голямата стойност на атрибута в интервала. Стойността на интервала е разликата между горната и долната граница.

Интервалите на групиране в зависимост от големината им биват: равни и неравни. Ако вариацията на признака се проявява в относително тесни граници и разпределението е равномерно, тогава се изгражда групиране с равни интервали. Стойност равен интервалсе определя по следната формула :

където Xmax, Xmin - максимум и минимална стойностчерта в съвкупност; n е броят на групите.

Най-простото групиране, при което всяка избрана група се характеризира с един показател, е серия на разпределение.

Статистически серииразпространение - това е подредено разпределение на единиците на съвкупността в групи по определен признак. В зависимост от признака, който е в основата на формирането на серия на разпределение, се разграничават атрибутивни и вариационни серии на разпределение.

атрибутивни наречена серия на разпределение, построена според качествени характеристики, тоест признаци, които нямат числов израз(разпределение по видове работа, по пол, по професия и др.). Атрибутни редоверазпределения характеризират състава на населението по един или друг съществен признак. Взети за няколко периода, тези данни ни позволяват да изследваме промяната в структурата.

Вариационни редове наречена серия на разпределение, изградена на количествена основа. Всяка вариационна серия се състои от два елемента: варианти и честоти. Настроики Наречен индивидуални ценностипризнак, който той приема в вариационната серия, т.е. специфичната стойност на вариращия признак.

Честоти наречен номер на индивидуален вариант или всяка група от вариационната серия, т.е. това са числа, които показват колко често се срещат определени варианти в разпределителната серия. Сумата от всички честоти определя размера на цялата популация, нейния обем. Честоти се наричат ​​честоти, изразени в части от единица или като процент от общата сума. Съответно сумата от честотите е равна на 1 или 100%.

В зависимост от характера на изменението на признака се разграничават три форми на вариационни серии: класирана серия, дискретна серия и интервална серия.

Класирани вариационни серии - това е разпределението на отделните единици от съвкупността във възходящ или низходящ ред на изследвания признак. Класирането улеснява разделянето на количествените данни на групи, незабавното откриване на най-малките и най-голяма стойностфункция, маркирайте стойностите, които най-често се повтарят.

Дискретни вариационни серии характеризира разпределението на единиците на съвкупността според дискретен атрибут, който приема само цели числа. Например тарифната категория, броят на децата в семейството, броят на служителите в предприятието и др.

Ако знак има непрекъсната промяна, която в определени граници може да приема всякакви стойности ("от - до"), тогава за този знак трябва да изградите интервални вариационни серии . Например размерът на доходите, трудовият стаж, цената на дълготрайните активи на предприятието и др.

Примери за решаване на задачи по темата "Статистическо обобщение и групиране"

Задача 1 . Има информация за броя на получените книги от студентите чрез абонамент за изминалата учебна година.

Изграждане на диапазонна и дискретна вариационна серия на разпределение, обозначаваща елементите на серията.

Решение

Този комплектпредставлява набор от опции за броя на книгите, които студентите получават. Нека преброим броя на такива варианти и да ги подредим под формата на вариационна класирана и вариационна дискретна серия на разпределение.

Задача 2 . Има данни за стойността на дълготрайните активи за 50 предприятия, хиляди рубли.

Изградете серия за разпределение, като подчертаете 5 групи предприятия (на равни интервали).

Решение

За решението избираме най-големия и най-малка стойностстойност на дълготрайните активи на предприятията. Това са 30,0 и 10,2 хиляди рубли.

Намерете размера на интервала: h \u003d (30,0-10,2): 5 \u003d 3,96 хиляди рубли.

Тогава първата група ще включва предприятия, чийто размер на дълготрайните активи е от 10,2 хиляди рубли. до 10,2 + 3,96 = 14,16 хиляди рубли. Такива предприятия ще бъдат 9. Втората група ще включва предприятия, чийто размер на дълготрайните активи ще бъде от 14,16 хиляди рубли. до 14,16 + 3,96 = 18,12 хиляди рубли. Ще има 16 такива предприятия. намери номерапредприятия, включени в трета, четвърта и пета група.

Получената серия на разпределение се поставя в таблицата.

Задача 3 . За редица предприятия от леката промишленост бяха получени следните данни:

Направете групиране на предприятията според броя на работниците, като оформите 6 групи на равни интервали. Брой за всяка група:

1. брой предприятия
2. брой работници
3. обем на произведената продукция за година
4. средна действителна продукция на работник
5. размер на ДМА
6. средният размердълготрайни активи на едно предприятие
7. средна стойност на произведената продукция от едно предприятие

Запишете резултатите от изчислението в таблици. Направете си изводите.

Решение

За решението избираме най-големите и най-малките стойности на средния брой работници в предприятието. Това са 43 и 256.

Намерете размера на интервала: h = (256-43): 6 = 35,5

Тогава първата група ще включва предприятия със среден брой на работниците от 43 до 43 + 35,5 = 78,5 души. Такива предприятия ще бъдат 5. Втората група ще включва предприятия, средният брой на работниците в които ще бъде от 78,5 до 78,5 + 35,5 = 114 души. Такива предприятия ще бъдат 12. По същия начин намираме броя на предприятията, включени в трета, четвърта, пета и шеста група.

Поставяме получената серия на разпределение в таблица и изчисляваме необходимите показатели за всяка група:

Заключение : Както се вижда от таблицата, най-многобройна е втората група предприятия. Включва 12 предприятия. Най-малки са пета и шеста група (по две предприятия). Това са най-големите предприятия (по отношение на броя на работниците).

Тъй като втората група е най-многобройна, обемът на продукцията годишно от предприятията от тази група и обемът на дълготрайните активи са много по-високи от останалите. В същото време средната фактическа продукция на един работник в предприятията от тази група не е най-висока. Тук водещи са предприятията от четвърта група. Тази група също така представлява доста голямо количество дълготрайни активи.

В заключение отбелязваме, че средният размер на дълготрайните активи и средната стойност на продукцията на едно предприятие са пряко пропорционални на размера на предприятието (по отношение на броя на работниците).