Биографии Характеристики Анализ

Определение на интервални серии. Серии за разпределение и групиране

Упражнение 1

ВАРИАЦИОННА СЕРИЯ НА РАЗПРЕДЕЛЕНИЕ

вариационна серияили близко разпространениенаречено подредено разпределение на единици на съвкупността според нарастващи (по-често) или намаляващи (по-рядко) стойности на атрибута и преброяване на броя на единиците с една или друга стойност на атрибута.

Има 3 милдиапазон на разпространение:

1) класиран ред- това е списък на отделните единици от съвкупността във възходящ ред на изследвания признак; ако броят на единиците на популацията е достатъчно голям, класираните серии стават тромави и в такива случаи серията на разпределение се конструира чрез групиране на единици на популацията според стойностите на изследваната характеристика (ако характеристиката заема малък брой ценности, тогава дискретна серия, в противен случай интервални серии);

2) дискретна серия- това е таблица, състояща се от две колони (редове) - специфични стойности на променлив атрибут х ази броя на единиците съвкупност с дадената стойност на признака f аз– честоти; броят на групите в дискретна серия се определя от броя на действително съществуващите стойности на променливия атрибут;

3) интервални серии- това е таблица, състояща се от две колони (редове) - интервали с различен знак х ази броя на единиците от популацията, попадащи в даден интервал (честоти), или съотношението на този брой в общия брой на популациите (честоти).

Извикват се числа, показващи колко пъти се срещат отделни опции в дадена популация честотиили везниопция и са маркирани малки буквилатиница f. Общата сума на честотите на вариационните серии е равна на обема на тази съвкупност, т.е.

където к– брой групи, нобщ бройнаблюдения или размер на популацията.

Честотите (теглата) се изразяват не само в абсолютни, но и в относителни числа - във фракции от единица или като процент от общия брой варианти, които съставляват този набор. В такива случаи се извикват тежестите относителни честотиили честоти.Общата сума на данните е равна на единица

или
,

ако честотите са изразени като процент от общия брой наблюдения П.Замяната на честотите с честоти не е задължителна, но понякога се оказва полезна и дори необходима в случаите, когато е необходимо да се сравнят една с друга вариационни серии, които се различават значително по обем.

В зависимост от това как атрибутът варира - дискретно или непрекъснато, в широк или тесен диапазон - статистическата съвкупност се разпределя в без интервалиили интервалвариационни линии. В първия случай честотите се отнасят директно до класираните стойности на признака, които придобиват позицията отделни групиили класове на вариационните серии, във втория се изчисляват честотите, свързани с отделни интервали или интервали (от - до), на които е разделена общата вариация на признака в диапазона от минималните до максималните варианти на тази популация . Тези пространства или пространства на класове могат или не могат да бъдат еднакви по ширина. От тук се разграничават равни и неравноинтервални вариационни редове.В серията с неравни интервали естеството на честотното разпределение се променя с промяната на ширината на класовите интервали. Групирането с неравни интервали в биологията се използва сравнително рядко. По правило биометричните данни се разпределят в серии с равни интервали, което позволява не само да се идентифицира моделът на вариация, но също така улеснява изчисляването на обобщени данни. числови характеристикивариационни серии, сравнение на сериите на разпределение една с друга.

Когато започвате да конструирате вариационна серия с равен интервал, важно е правилно да очертаете ширината на класовия интервал. Факт е, че грубото групиране (когато са зададени много широки класови интервали) изкривява типичните характеристики на вариацията и води до намаляване на точността на числените характеристики на серията. При избора на прекалено тесни интервали точността на обобщаващите числени характеристики се увеличава, но серията се оказва твърде разширена и не дава ясна картина на вариацията.

За да се получи добре дефинирана вариационна серия и За да се осигури достатъчна точност на числените характеристики, изчислени от него, е необходимо да се раздели вариацията на признака (в диапазона от минималните до максималните опции) на такъв брой групи или класове, които да удовлетворят и двете изисквания. Този проблем се решава чрез разделяне на диапазона на вариация на атрибута на броя на групите или класовете, които са планирани при конструирането на вариационната серия:

,

където ч– интервална стойност; х m a x i х min е максимумът и минимална стойностОбщо; ке броят на групите.

При конструирането на серия от интервално разпределение е необходимо да изберете оптималния брой групи (интервали на знаци) и да зададете дължината (диапазон) на интервала. Тъй като анализът на серия на разпределение сравнява честотите в различни интервали, необходимо е дължината на интервалите да бъде постоянна. Ако трябва да се справите с интервална серия от разпределение с неравни интервали, тогава за сравнимост трябва да приведете честотата или честотата към единицата на интервала, получената стойност се нарича плътност ρ , това е
.

Оптималният брой групи е избран така, че разнообразието от стойности на чертите в съвкупността да е достатъчно отразено и в същото време редовността на разпределението, неговата форма да не се изкривява от случайни честотни колебания. Ако има твърде малко групи, няма да има модел на вариация; ако има твърде много групи, произволните честотни скокове ще изкривят формата на разпределението.

Най-често броят на групите в серия на разпределение се определя по формулата на Стърджис:

където н- размерът на населението.

Графичното представяне осигурява съществена помощ при анализа на серия на разпределение и нейните свойства. Интервалната поредица е представена от лентова графика, в която основите на лентите, разположени по абсцисната ос, са интервалите от стойности на променливия атрибут, а височините на лентите са честотите, съответстващи на скалата по ординатната ос. Този тип диаграма се нарича хистограма.

Ако има серия с дискретно разпределение или се използват средните точки на интервалите, тогава графично изображениетакава серия се нарича многоъгълник, което се получава чрез свързване на прави точки с координати х ази f аз .

Ако стойностите на класа се начертаят по абсцисната ос, а натрупаните честоти по ординатната ос, последвано от свързване на точките с прави линии, се получава графика, т.нар. кумулативен.Натрупаните честоти се намират чрез последователно сумиране, или кумулациячестоти в посока от първия клас до края на вариационната серия.

Пример. Има данни за производството на яйца от 50 кокошки носачки за 1 година, отглеждани в птицеферма (Таблица 1.1).

Т а б л и ц а 1.1

Кокошки носачки

Брой кокошки носачки

Производство на яйца, бр.

Брой кокошки носачки

Производство на яйца, бр.

Брой кокошки носачки

Производство на яйца, бр.

Брой кокошки носачки

Производство на яйца, бр.

Брой кокошки носачки

Производство на яйца, бр.

Необходимо е да се изгради интервална серия на разпределение и да се покаже графично под формата на хистограма, полигон и кумулация.

Вижда се, че признакът варира от 212 до 245 яйца, получени от кокошка носачка за 1 година.

В нашия пример, използвайки формулата на Стърджис, ние определяме броя на групите:

к = 1 + 3,322lg 50 = 6,643 ≈ 7.

Изчислете дължината (обхвата) на интервала, като използвате формулата:

.

Нека изградим интервална серия със 7 групи и интервал от 5 парчета. яйца (Таблица 1.2). За да изградим графики в таблицата, изчисляваме средата на интервалите и натрупаната честота.

Т а б л и ц а 1.2

Интервални серии на разпределение на производството на яйца

Група кокошки носачки според размера на производството на яйца

х аз

Брой кокошки носачки

f аз

Средна точка на интервал

хаз

Натрупана честота

f аз

Нека изградим хистограма на разпределението на производството на яйца (фиг. 1.1).

Ориз. 1.1. Хистограма на разпределението на производството на яйца

Тези хистограми показват формата на разпределение, характерна за много черти: стойностите на средните интервали на чертата са по-чести, по-рядко екстремните (малки и големи) стойности на чертата. Формата на това разпределение е близка до нормалния закон за разпределение, който се формира, ако една променлива променлива е повлияна от голям брой фактори, нито един от които няма преобладаваща стойност.

Полигонът и кумулатът на разпределението на производството на яйца имат формата (фиг. 1.2 и 1.3).

Ориз. 1.2. Полигон за разпределение на яйца

Ориз. 1.3. Кумулативно разпределение на производството на яйца

Технология за решаване на проблеми в процесор за електронни таблици Microsoft превъзходен следващия.

1. Въведете първоначалните данни в съответствие с фиг. 1.4.

2. Класирайте реда.

2.1. Изберете клетки A2:A51.

2.2. Щракнете с левия бутон върху лентата с инструменти върху бутона<Сортировка по возрастанию > .

3. Определете размера на интервала за построяване на интервалния ред на разпределението.

3.1. Копирайте клетка A2 в клетка E53.

3.2. Копирайте клетка A51 в клетка E54.

3.3. Изчислете диапазона на вариация. За да направите това, въведете формулата в клетка E55 =E54-E53.

3.4. Изчислете броя на вариационните групи. За да направите това, въведете формулата в клетка E56 =1+3,322*LOG10(50).

3.5. Въведете в клетка E57 закръгления брой групи.

3.6. Изчислете дължината на интервала. За да направите това, въведете формулата в клетка E58 =E55/E57.

3.7. Въведете в клетка E59 закръглената дължина на интервала.

4. Изградете интервална серия.

4.1. Копирайте клетка E53 в клетка B64.

4.2. Въведете формулата в клетка B65 =B64+$E$59.

4.3. Копирайте клетка B65 в клетки B66:B70.

4.4. Въведете формулата в клетка C64 =B65.

4.5. Въведете формулата в клетка C65 =C64+$E$59.

4.6. Копирайте клетка C65 в клетки C66:C70.

Резултатите от решението се извеждат на екрана в следната форма (фиг. 1.5).

5. Изчислете интервалната честота.

5.1. Изпълнете командата Обслужване,Анализ на данничрез последователно щракване с левия бутон на мишката.

5.2. В диалоговия прозорец Анализ на даннинастройте с левия бутон на мишката: Инструменти за анализ <Гистограмма>(фиг. 1.6).

5.3. Кликнете с левия бутон върху бутона<ОК>.

5.4. В раздела стълбовидна диаграмазадайте параметрите съгласно фиг. 1.7.

5.5. Кликнете с левия бутон върху бутона<ОК>.

Резултатите от решението се извеждат на екрана в следната форма (фиг. 1.8).

6. Попълнете таблицата "Интервална серия на разпределение".

6.1. Копирайте клетки B74:B80 в клетки D64:D70.

6.2. Изчислете сумата от честотите. За да направите това, изберете клетки D64:D70 и щракнете с левия бутон върху бутона в лентата с инструменти<Автосумма > .

6.3. Изчислете средата на интервалите. За да направите това, въведете формулата в клетка E64 =(B64+C64)/2и копирайте в клетки E65:E70.

6.4. Изчислете натрупаните честоти. За да направите това, копирайте клетка D64 в клетка F64. В клетка F65 въведете формулата =F64+D65 и я копирайте в клетки F66:F70.

Резултатите от решението се извеждат на екрана в следната форма (фиг. 1.9).

7. Редактирайте хистограмата.

7.1. Щракнете с десния бутон върху диаграмата на името "джоб" и в раздела, който се показва, щракнете върху бутона<Очистить>.

7.2. Щракнете с десния бутон върху диаграмата и в раздела, който се показва, щракнете върху бутона<Исходные данные>.

7.3. В диалоговия прозорец Изходни даннипроменете етикетите на оста X. За да направите това, изберете клетки B64:C70 (фиг. 1.10).

7.5. Натиснете клавиш .

Резултатите се показват на екрана в следната форма(фиг. 1.11).

8. Изградете полигон за разпределение на яйца.

8.1. Щракнете с левия бутон върху лентата с инструменти върху бутона<Мастер диаграмм > .

8.2. В диалоговия прозорец Съветник за диаграми (стъпка 1 от 4)използвайте левия бутон на мишката, за да зададете: Стандартен <График>(фиг. 1.12).

8.3. Кликнете с левия бутон върху бутона<Далее>.

8.4. В диалоговия прозорец Съветник за диаграми (стъпка 2 от 4)задайте параметрите съгласно фиг. 1.13.

8.5. Кликнете с левия бутон върху бутона<Далее>.

8.6. В диалоговия прозорец Съветник за диаграми (стъпка 3 от 4)въведете имената на диаграмата и ос Y (фиг. 1.14).

8.7. Кликнете с левия бутон върху бутона<Далее>.

8.8. В диалоговия прозорец Съветник за диаграми (стъпка 4 от 4)задайте параметрите съгласно фиг. 1.15.

8.9. Кликнете с левия бутон върху бутона<Готово>.

Резултатите се извеждат на екрана в следната форма (фиг. 1.16).

9. Вмъкнете етикети с данни в диаграмата.

9.1. Щракнете с десния бутон върху диаграмата и в раздела, който се показва, щракнете върху бутона<Исходные данные>.

9.2. В диалоговия прозорец Изходни даннипроменете етикетите на оста X. За да направите това, изберете клетки E64:E70 (фиг. 1.17).

9.3. Натиснете клавиш .

Резултатите се извеждат на екрана в следната форма (фиг. 1.18).

Разпределителната кумулация се конструира подобно на разпределителния полигон въз основа на натрупаните честоти.

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Добра работакъм сайта">

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

публикувано на http://www.allbest.ru/

ЗАДАЧА1

Налична е следната информация за заплатислужители в предприятието:

Таблица 1.1

Размерът на заплатите в конв. бърлога единици

Изисква се да се построи интервална серия от разпределението, по която да се намира;

1) средна заплата;

2) средно линейно отклонение;

4) стандартно отклонение;

5) диапазон на вариация;

6) коефициент на трептене;

7) линеен коефициентвариации;

8) прост коефициент на вариация;

10) медиана;

11) коефициент на асиметрия;

12) Индекс на асиметрия на Pearson;

13) коефициент на ексцес.

Решение

Както знаете, опциите (разпознатите стойности) са подредени във възходящ ред за формиране дискретни вариационни серии. При големи числа вариант (повече от 10), дори и при дискретна вариация се изграждат интервални серии.

Ако една интервална серия е съставена с четни интервали, тогава диапазонът на вариация се разделя на посочен номеринтервали. В този случай, ако получената стойност е цяло число и еднозначна (което е рядко), тогава дължината на интервала се приема равна на това число. В други случаи произведени закръгляване непременно в страна увеличение, Така да се последната останала цифра беше четна. Очевидно с увеличаване на дължината на интервала, обхватът на вариация по величина, равно на произведениетоброй интервали: разликата между изчислената и първоначалната дължина на интервала

а) Ако стойността на разширението на диапазона на вариация е незначителна, тогава тя или се добавя към най-голямата, или се изважда от най-малката стойност на характеристиката;

б) Ако големината на разширяването на обхвата на вариация е осезаема, тогава, за да няма смесване на центъра на обхвата, тя се разделя грубо наполовина, като едновременно се добавя към най-голямата и се изважда от най-малките стойностизнак.

Ако интервална серия е съставена с неравни интервали, тогава процесът е опростен, но както преди, дължината на интервалите трябва да бъде изразена като число с последната четна цифра, което значително опростява последващите изчисления на числените характеристики.

30 - размер на извадката.

Нека съставим серия с интервално разпределение, използвайки формулата на Стърджис:

K \u003d 1 + 3,32 * lg n,

К - брой групи;

K \u003d 1 + 3,32 * lg 30 \u003d 5,91 \u003d 6

Намираме обхвата на знака - заплатите на служителите в предприятието - (x) по формулата

R \u003d xmax - xmin и разделете на 6; R=195-112=83

Тогава дължината на интервала ще бъде ллента=83:6=13.83

Началото на първия интервал ще бъде 112. Добавяне към 112 л ras=13,83, получаваме крайната му стойност 125,83, която също е началото на втория интервал и т.н. краят на петия интервал е 195.

При намиране на честоти трябва да се ръководи от правилото: "ако стойността на характеристика съвпада с границата на вътрешния интервал, тогава тя трябва да се отнесе към предишния интервал."

Получаваме интервална серия от честоти и кумулативни честоти.

Таблица 1.2

Следователно 3 служители имат заплати. плащане от 112 до 125,83 условни единици. Най-високата заплата плащане от 181,15 до 195 условни единици. само 6 работници.

За да изчислим числените характеристики, преобразуваме интервалната серия в дискретна, като вземем средата на интервалите като вариант:

Таблица 1.3

14131,83

Според формулата за средноаритметично претеглено

cond.mon.un.

Средно линейно отклонение:

където xi е стойността на изследвания признак в i-тата единица от съвкупността,

Средната стойност на изследвания признак.

публикувано на http://www.allbest.ru/

LПубликувано на http://www.allbest.ru/

Парична единица

Стандартно отклонение:

дисперсия:

Относителен диапазон на вариация (коефициент на трептене): c=R:,

Относително линейно отклонение: q = L:

Коефициентът на вариация: V = y:

Коефициентът на колебание показва относителното колебание на екстремните стойности на признака около средноаритметичната стойност, а коефициентът на вариация характеризира степента и хомогенността на популацията.

c \u003d R: \u003d 83 / 159,485 * 100% \u003d 52,043%

Така разликата между екстремните стойности е с 5,16% (=94,84%-100%) по-малко от средната заплата на служителите в предприятието.

q \u003d L: \u003d 17,765 / 159,485 * 100% \u003d 11,139%

V \u003d y: \u003d 21,704 / 159,485 * 100% \u003d 13,609%

Коефициентът на вариация е по-малък от 33%, което показва слаба вариация в заплатите на служителите в предприятието, т.е. че средната е типична характеристика на работната заплата на работниците (хомогенна съвкупност).

В интервалната серия на разпределението модасе определя по формулата -

Честотата на модалния интервал, т.е. интервалът, съдържащ най-голям брой опции;

Честотата на интервала, предхождащ модала;

Честотата на интервала след модала;

Дължината на модалния интервал;

Долната граница на модалния интервал.

За определяне медианив интервалните серии използваме формулата

където е кумулативната (кумулативна) честота на интервала, предхождащ медианата;

Долната граница на средния интервал;

Честота на средния интервал;

Дължината на средния интервал.

Среден интервал- интервал, чиято натрупана честота (=3+3+5+7) надхвърля половината от сумата на честотите - (153.49; 167.32).

Нека изчислим изкривяването и ексцеса, за които ще съставим нов работен лист:

Таблица 1.4

Фактически данни

Приблизителни данни

Изчислете момента на трети ред

Следователно асиметрията е

Тъй като 0,3553 0,25, асиметрията се признава за значима.

Изчислете момента от четвърти ред

Следователно, ексцесът е

защото< 0, то эксцесс является плосковершинным.

Степента на асиметрия може да се определи с помощта на коефициента на асиметрия на Пиърсън (As): колебание проба разходи оборот

където е средноаритметичната стойност на серията на разпределение; -- мода; -- стандартно отклонение.

Следователно при симетрично (нормално) разпределение = Mo коефициентът на асиметрия е нула. Ако Аs > 0, тогава има повече мода, следователно има дясна асиметрия.

Ако As< 0, то по-малко мода, следователно има лявостранна асиметрия. Коефициентът на асиметрия може да варира от -3 до +3.

Разпределението не е симетрично, а има лявостранна асиметрия.

ЗАДАЧА 2

Какъв трябва да бъде размерът на извадката, така че да има вероятност от 0,954 грешката на извадката да не надвишава 0,04, ако дисперсията е известна от предишни проучвания, че е 0,24?

Решение

Размер на извадката при без преизбиранеизчислено по формулата:

t - коефициент на доверие (с вероятност 0,954 е равен на 2,0; определен от таблиците на вероятностните интеграли),

y2=0,24 - стандартно отклонение;

10 000 души - размер на извадката;

Dx \u003d 0,04 - пределна грешкаизвадкова средна стойност.

С вероятност от 95,4%, може да се твърди, че размерът на извадката предоставя относителна грешкане повече от 0,04, трябва да са най-малко 566 семейства.

ЗАДАЧА3

Налични са следните данни за приходите от основната дейност на предприятието, милиона рубли.

За да анализирате поредица от динамика, определете следните показатели:

1) верига и основни:

Абсолютни печалби;

темпове на растеж;

темпове на растеж;

2) среден

Ниво на динамичен обхват;

Абсолютен растеж;

Скорост на растеж;

Скорост на нарастване;

3) абсолютната стойност на 1% растеж.

Решение

1. Абсолютен растеж (дy)- това е разликата между следващото ниво на серията и предишното (или основно):

верига: Du \u003d yi - yi-1,

основен: Du \u003d yi - y0,

yi - ниво на ред,

i - номер на ниво ред,

y0 - ниво на базова година.

2. Темп на растеж (Tu)е съотношението на следващото ниво от серията и предходното (или базовата година 2001):

верига: Tu = ;

основно: Tu =

3. Темп на растеж (Tд) - това е отношението на абсолютния растеж към предишното ниво, изразено в%.

верига: Tu = ;

основно: Tu =

4. Абсолютна стойност 1% увеличение (A)- е отношението на верижния абсолютен растеж към скоростта на растеж, изразено в%.

НО =

Ниво на среден редизчислено по формулата за средно аритметично.

Средно ниво на доходи от основна дейност за 4 години:

Среден абсолютен прирастизчислено по формулата:

където n е броят на нивата в серията.

Средно за годината приходите от основни дейности са се увеличили с 3,333 милиона рубли.

Средногодишен темп на растежизчислено по формулата за средно геометрична:

уn - последното ниво на серията,

y0 - Първо ниворед.

Tu \u003d 100% \u003d 102,174%

Средногодишен темп на растежизчислено по формулата:

T? \u003d Tu - 100% \u003d 102,74% - 100% \u003d 2,74%.

Така средно за година приходите от основна дейност на предприятието нарастват с 2,74%.

ЗАДАЧИНО4

Изчисли:

1. Индивидуални ценови индекси;

2. Общ индекс на текучеството;

3. Агрегиран индекс на цените;

4. Агрегиран индекс на физическия обем на продажбата на стоки;

5. Абсолютното увеличение на стойността на оборота и се разлага по фактори (поради промени в цените и броя на продадените стоки);

6. Направете кратки изводиза всички получени резултати.

Решение

1. По условие индивидуалните индекси на цените за продукти A, B, C възлизат на -

ipA=1,20; ipB=1,15; iрВ=1,00.

2. Общият индекс на оборота се изчислява по формулата:

I w \u003d \u003d 1470/1045 * 100% \u003d 140,67%

Търговският оборот нараства с 40,67% (140,67% -100%).

Средно цените на суровините са се повишили с 10,24%.

Размерът на допълнителните разходи за купувачите от увеличенията на цените:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333,478 \u003d 136,522 милиона рубли.

В резултат на нарастващите цени купувачите трябваше да похарчат допълнително 136,522 милиона рубли.

4. Общ индекс на физическия обем на търговията:

Физическият обем на търговията нараства с 27.61%.

5. Дефинирайте обща промянаоборот през втория период в сравнение с първия период:

w \u003d 1470- 1045 \u003d 425 милиона рубли.

поради промени в цените:

W(p) \u003d 1470 - 1333,478 \u003d 136,522 милиона рубли.

чрез промяна на физическия обем:

w(q) \u003d 1333.478 - 1045 \u003d 288.478 милиона рубли.

Стокооборотът се увеличава с 40,67%. С 10,24% са поскъпнали средно 3 стоки. Физическият обем на търговията нараства с 27.61%.

Като цяло обемът на продажбите се е увеличил с 425 милиона рубли, включително поради нарастващите цени, той се е увеличил със 136,522 милиона рубли, а поради увеличаване на обема на продажбите - с 288,478 милиона рубли.

ЗАДАЧА5

За 10 завода в една индустрия са налични следните данни.

Фабричен номер

Изход, хил. бр (Х)

Въз основа на предоставените данни:

I) за потвърждаване на разпоредбите на логическия анализ за наличието на линейна корелация между факторния знак (производство) и резултантния знак (консумация на електроенергия), начертайте първоначалните данни върху графиката на корелационното поле и направете изводи за форма на връзката, посочете нейната формула;

2) определете параметрите на уравнението на връзката и начертайте получената теоретична линия върху графиката на корелационното поле;

3) изчисляване на линейния коефициент на корелация,

4) обяснете стойностите на показателите, получени в параграфи 2) и 3);

5) използвайки получения модел, направете прогноза за възможното потребление на електроенергия в завод с производствен обем от 4,5 хиляди единици.

Решение

Символни данни - обемът на продукцията (фактор), означен с хi; знак - потребление на електроенергия (резултат) през ui; точки с координати (x, y) се нанасят върху корелационното поле OXY.

Точките на корелационното поле са разположени по права линия. Следователно връзката е линейна, ще търсим уравнението на регресията под формата на права Yx=ax+b. За да го намерим, използваме системата от нормални уравнения:

Нека създадем електронна таблица.

Въз основа на намерените средни съставяме системата и я решаваме по отношение на параметрите a и b:

И така, получаваме регресионното уравнение за y върху x: \u003d 3,57692 x + 3,19231

Изграждаме регресионна линия върху корелационното поле.

Замествайки стойностите x от колона 2 в уравнението на регресията, получаваме изчислените (колона 7) и ги сравняваме с данните за y, които са отразени в колона 8. Между другото, коректността на изчисленията също се потвърждава чрез съвпадението на средните стойности на y и.

Коефициентлинейна корелацияоценява плътността на връзката между характеристиките x и y и се изчислява по формулата

Ъгловият коефициент на директна регресия a (при x) характеризира посоката на идентифициранотозависимостипризнаци: за a>0 те са еднакви, за a<0- противоположны. Неговият абсолютен стойност - мярка за промяна в резултантния знак, когато факторният знак се промени за единица измерване.

Свободният член на директната регресия разкрива посоката, а абсолютната му стойност - количествена мярка за влияние върху ефективния знак на всички останали фактори.

Ако< 0, тогава ресурсът на факторния атрибут на отделен обект се използва с по-малко и когато>0 спо-висока производителност от средната за целия набор от обекти.

Нека направим пост-регресионен анализ.

Коефициентът при x на директна регресия е 3,57692 > 0, следователно с увеличаване (намаляване) на производството потреблението на електроенергия се увеличава (пада). Увеличение на производството с 1 хил. бр. дава средно увеличение на потреблението на електроенергия с 3,57692 хил. kWh.

2. Свободният член на директната регресия е 3.19231, следователно влиянието на други фактори увеличава силата на въздействието на производството върху потреблението на електроенергия в абсолютно измерванес 3.19231 хил. kWh.

3. Корелационният коефициент от 0,8235 разкрива много тясна зависимост на потреблението на електроенергия от производството.

Според уравнението регресионен моделлесни за правене на прогнози. За да направите това, стойностите x, представляващи обема на продукцията, се заместват в регресионното уравнение и се прогнозира консумацията на електроенергия. В този случай стойностите на x могат да бъдат взети не само в даден диапазон, но и извън него.

Нека направим прогноза за възможното потребление на електроенергия в завод с производствен обем от 4,5 хиляди единици.

3.57692*4.5 + 3.19231= 19.288 45 хиляди kWh.

СПИСЪК НА ИЗПОЛЗВАНИТЕ ИЗТОЧНИЦИ

1. Захаренков С.Н. Социално-икономическа статистика: Учебно ръководство. - Минск: BSEU, 2002.

2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Обща теориястатистика. - М.: ИНФРА - М., 2000.

3. Елисеева I.I. Статистика. - М.: Проспект, 2002.

4. Обща теория на статистиката / Изд. изд. О.Е. Башина, А.А. спирин. - М .: Финанси и статистика, 2000.

5. Социално-икономическа статистика: Учеб.-практ. помощ / Захаренков С.Н. и др. - Минск: YSU, 2004.

6. Социално-икономическа статистика: учеб. надбавка. / Ед. Нестерович С.Р. - Минск: BSEU, 2003.

7. Теслюк И. Е., Тарловская В. А., Терлиженко Н. Статистика - Минск, 2000 г.

8. Харченко Л.П. Статистика. - М.: ИНФРА - М, 2002.

9. Харченко Л.П., Долженкова В.Г., Йонин В.Г. Статистика. - М.: ИНФРА - М, 1999.

10. икономическа статистика/ Ед. Ю.Н. Иванова - М., 2000г.

Хоствано на Allbest.ru

...

Подобни документи

    Изчисляване на средната аритметична стойност за реда на интервалното разпределение. Определение общ индексфизическия обем на търговията. Анализ на абсолютното изменение на общата себестойност на продукцията поради промени във физическия обем. Изчисляване на коефициента на вариация.

    тест, добавен на 19.07.2010 г

    Същността на търговията на едро, дребно и обществената търговия. Формули за изчисляване на индивидуални, съвкупни индекси на оборота. Изчисляване на характеристиките на интервалния ред на разпределение - средно аритметично, мода и медиана, коефициент на вариация.

    курсова работа, добавена на 05/10/2013

    Изчисляване на планирания и реалния обем на продажбите, процента на плана, абсолютното изменение на оборота. Определяне на абсолютен прираст, средни темпове на прираст и прираст на паричните доходи. Изчисляване на структурни средни: моди, медиани, квартили.

    тест, добавен на 24.02.2012 г

    Интервални редове на разпределение на банките по обем на печалбата. Намиране на модата и медианата на получените интервални серии на разпределение графичен методи чрез изчисления. Изчисляване на характеристиките на интервалния ред на разпределение. Изчисляване на средно аритметично.

    тест, добавен на 15.12.2010 г

    Формули за определяне на средните стойности на интервалните серии - моди, медиани, дисперсии. Изчисляване на аналитични показатели на динамични редове по верижни и основни схеми, темпове на растеж и растеж. Концепцията за съставен индекс на разходите, цените, разходите и оборота.

    курсова работа, добавена на 27.02.2011 г

    Концепцията и целта, реда и правилата за изграждане на вариационна серия. Анализ на хомогенността на данните в групи. Индикатори за вариация (флуктуация) на признак. Определяне на средната линейна стойност и стандартно отклонение, коефициент на трептене и вариация.

    тест, добавен на 26.04.2010 г

    Понятието мода и медиана като типични характеристики, редът и критериите за тяхното определяне. Намиране на мода и медиана в дискретна и интервална вариационна серия. Квартили и децили като допълнителни характеристики на вариацията статистически серии.

    тест, добавен на 09/11/2010

    Построяване на интервален ред на разпределение на групов принцип. Характеризиране на отклонението на честотното разпределение от симетричната форма, изчисляване на показателите за ексцес и асиметрия. Анализ на показателите на баланса или отчета за доходите.

    контролна работа, добавена на 19.10.2014 г

    Трансформация на емпиричните редове в дискретни и интервални. Определение среден размерв дискретна серия, използвайки неговите свойства. Изчисляване на дискретна поредица от моди, медиани, вариационни показатели (дисперсия, отклонение, коефициент на трептене).

    тест, добавен на 17.04.2011 г

    Изграждане на статистическа серия от разпределение на организациите. Графична дефинициярежим и средни стойности. Стегнатостта на корелацията с използването на коефициента на детерминация. Определяне на извадковата грешка на средния брой служители.

Състояние:

Има данни за възрастовия състав на работниците (години): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Изградете серия на интервално разпределение.
    2. Изградете графично представяне на серията.
    3. Графично определете модата и медианата.

Решение:

1) Според формулата на Стърджис населението трябва да бъде разделено на 1 + 3,322 lg 30 = 6 групи.

Максималната възраст е 38, минималната 18.

Ширина на интервала Тъй като краищата на интервалите трябва да са цели числа, ще разделим съвкупността на 5 групи. Ширина на интервала - 4.

За да улесним изчисленията, нека подредим данните във възходящ ред: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29 , 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

Разпределение възрастов съставработници

Графично серия може да бъде показана като хистограма или многоъгълник. Хистограма - стълбовидна диаграма. Основата на колоната е ширината на интервала. Височината на лентата е равна на честотата.

Полигон (или полигон на разпределение) е графика на честотите. За да го изградим според хистограмата, свързваме средните точки на горните страни на правоъгълниците. Затваряме многоъгълника по оста x на разстояния, равни на половината от интервала от екстремните стойности на x.

Режим (Mo) е стойността на изследваната характеристика, която се среща най-често в дадена популация.

За да определите режима от хистограмата, трябва да изберете най-високия правоъгълник, да начертаете линия от десния връх на този правоъгълник вдясно горен ъгълна предишния правоъгълник и начертайте линия от левия връх на модалния правоъгълник до левия връх на следващия правоъгълник. От точката на пресичане на тези линии начертайте перпендикуляр на оста x. Абсцисата ще бъде мода. Mo ≈ 27,5. Това означава, че най-често срещаната възраст в тази популация е 27-28 години.

Медианата (Me) е стойността на изследваната черта, която е в средата на подредена вариационна серия.

Намираме медианата по кумулата. Cumulate - графика на натрупаните честоти. Абсцисите са варианти на серия. Ординатите са натрупаните честоти.

За да определим медианата за кумулацията, намираме по ординатната ос точка, съответстваща на 50% от натрупаните честоти (в нашия случай 15), начертаваме права линия през нея, успоредна на оста Ox, и начертаваме перпендикуляр на оста x от точката на нейното пресичане с кумулата. Абсцисата е медианата. Аз ≈ 25.9. Това означава, че половината от работещите в тази популация са на възраст под 26 години.

В много случаи, ако статистическата съвкупност включва голям или още повече безкраен брой опции, което най-често се среща с непрекъсната вариация, е практически невъзможно и непрактично да се формира група от единици за всяка опция. В такива случаи обединяването на статистическите единици в групи е възможно само въз основа на интервала, т.е. такава група, която има определени граници на стойностите на променливия атрибут. Тези граници са обозначени с две числа, показващи горната и долната граница на всяка група. Използването на интервали води до формирането на интервална серия на разпределение.

интервал раде вариационна серия, чиито варианти са представени като интервали.

Интервалният ред може да се формира с равни и неравни интервали, като изборът на принципа за построяване на този ред зависи главно от степента на представителност и удобството на статистическата съвкупност. Ако наборът е достатъчно голям (представителен) по отношение на броя на единиците и е доста хомогенен по състав, тогава е препоръчително формирането на интервалната серия да се базира на равни интервали. Обикновено, според този принцип, се формира интервална серия за тези популации, където диапазонът на вариация е относително малък, т.е. максималния и минималния вариант обикновено се различават един от друг няколко пъти. В този случай стойността на равните интервали се изчислява чрез съотношението на диапазона на вариация на признака към дадения брой образувани интервали. За определяне на равни иинтервал, може да се използва формулата на Стърджис (обикновено с малка вариация в характеристиките на интервала и голям брой единици в статистическата популация):

където x i - величина равен интервал; X max, X min - максимални и минимални опции в статистическата съвкупност; н . - броят на единиците в съвкупността.

Пример. Препоръчително е да се изчисли размерът на равен интервал по плътност радиоактивно замърсяванецезий - 137 в 100 населени места на Краснополски район на Могилевска област, ако е известно, че първоначалният (минимален) вариант е равен на I km / km 2, крайният (максимум) - 65 ki / km 2. Използвайки формулата 5.1. получаваме:

Следователно, за да се образува интервална серия с равни интервали за плътността на замърсяване с цезий - 137 населени места на Краснополски район, размерът на равен интервал може да бъде 8 ki/km 2 .

В условия на неравномерно разпределение, т.е. когато максималните и минималните опции са стотици пъти, когато формирате интервалната серия, можете да приложите принципа неравенинтервали. Неравните интервали обикновено се увеличават, докато преминавате към големи стойностизнак.

Формата на интервалите може да бъде затворена и отворена. ЗатвореноОбичайно е да се назовават интервали, за които са посочени както долната, така и горната граница. отворенинтервалите имат само една граница: в първия интервал - горната, в последния - долната граница.

Препоръчително е да се оценят интервалните серии, особено тези с неравни интервали, като се вземат предвид плътност на разпространение, най-простият начин за изчисляване е отношението на локалната честота (или честота) към размера на интервала.

За практическото формиране на интервалната серия можете да използвате оформлението на таблицата. 5.3.

Т а б л и ц а 5.3. Редът за формиране на интервалната серия селищаКраснополски район според плътността на радиоактивно замърсяване с цезий -137

Основното предимство на интервалната серия е нейната граница компактност.в същото време в интервалните серии на разпределението отделните варианти на признака са скрити в съответните интервали

При графично представяне на интервалната серия в системата правоъгълни координатипо абсцисната ос са нанесени горните граници на интервалите, а по ординатната ос - локалните честоти на сериите. Графичната конструкция на интервална серия се различава от конструкцията на разпределителен многоъгълник по това, че всеки интервал има долна и горна граница, а две абсциси съответстват на всяка стойност на ординатата. Следователно на графиката на интервалната серия не се отбелязва точка, както в многоъгълник, а линия, свързваща две точки. Тези хоризонтални линии се свързват една с друга с вертикални линии и се получава фигура на стъпаловиден многоъгълник, който обикновено се нарича хистограмаразпределения (Фигура 5.3).

При графична конструкцияинтервални серии върху достатъчно голяма статистическа популация, хистограмата се приближава симетриченформа за разпространение. В случаите, когато статистическата съвкупност е малка, по правило тя се формира асиметриченстълбовидна диаграма.

В някои случаи е целесъобразно формирането на множество натрупани честоти, т.е. кумулативенред. Кумулативната серия може да се формира на базата на дискретна или интервална серия на разпределение. Когато кумулативна серия се изобразява графично в система от правоъгълни координати, опциите се нанасят по абсцисната ос, а натрупаните честоти (честоти) се нанасят по ординатната ос. Получената крива линия се нарича кумулативенразпределения (Фигура 5.4).

Оформяне и графично представяне различни видове вариационна сериядопринася за опростено изчисляване на осн статистически характеристики, които са разгледани подробно в тема 6, помага да се разбере по-добре същността на законите на разпределение на статистическата съвкупност. Анализът на вариационните серии е от особено значение в случаите, когато е необходимо да се идентифицира и проследи връзката между варианти и честоти (честоти). Тази зависимост се проявява във факта, че броят на случаите за всеки вариант е по определен начин свързан със стойността на този вариант, т.е. с увеличаване на стойностите на променливия знак на честотата (честотата) на тези стойности, те изпитват определени, систематични промени. Това означава, че числата в колоната с честоти (честоти) не са обект на хаотични колебания, а се променят в определена посока, в определен ред и последователност.

Ако честотите в техните промени показват известна систематичност, това означава, че сме на път да идентифицираме модели. Система, ред, последователност в променящите се честоти е отражение общи причини, Общи условияхарактерни за цялото население.

Не трябва да се приема, че моделът на разпределение винаги се дава готов. Има доста вариационни серии, в които честотите странно скачат, нарастват или намаляват. В такива случаи е препоръчително да разберете с какъв вид разпределение се занимава изследователят: или това разпределение изобщо не е присъщо на моделите, или природата му все още не е идентифицирана: Първият случай е рядък, докато вторият, вторият случай е доста често и много често срещано явление.

Така че, когато се формира интервална серия, общият брой на статистическите единици може да бъде малък и малък брой опции попадат във всеки интервал (например 1-3 единици). В такива случаи не е необходимо да се разчита на проявата на някаква редовност. За да се получи закономерен резултат на базата на случайни наблюдения, е необходимо законът да влезе в сила големи числа, т.е. така че за всеки интервал да има не няколко, а десетки и стотици статистически единици. За тази цел трябва да се опитаме да увеличим броя на наблюденията колкото е възможно повече. Това е най правилният начиноткриване на модели в масови процеси. Ако не се появи реална възможностувеличаване на броя на наблюденията, тогава идентифицирането на моделите може да се постигне чрез намаляване на броя на интервалите в серията на разпределение. Намаляване на броя на интервалите във вариационната серия, като по този начин се увеличава броят на честотите във всеки интервал. Това означава, че случайните колебания на всяка статистическа единица се наслагват една върху друга, "изглаждат се", превръщайки се в модел.

Формирането и изграждането на вариационни серии ви позволява да получите само обща, приблизителна картина на разпределението на статистическата съвкупност. Например, хистограмата само в груба форма изразява връзката между стойностите на дадена характеристика и нейните честоти (честоти).Следователно вариационните серии са по същество само основата за по-нататъшно, задълбочено проучваневътрешни модели на статично разпределение.

ТЕМА 5 ВЪПРОСИ

1. Какво е вариация? Какво причинява вариацията на черта в статистическа съвкупност?

2. Какви видове променливи знаци могат да се срещат в статистиката?

3. Какво е вариационна серия? Какви са видовете вариационни серии?

4. Какво е класирана серия? Какви са неговите предимства и недостатъци?

5. Какво е дискретна серия и какви са нейните предимства и недостатъци?

6. Какъв е редът на формиране на интервалната серия, какви са нейните предимства и недостатъци?

7. Какво е графично представяне на класирана, дискретна, интервална серия с разпределение?

8. Какво е разпределение кумулативно и какво характеризира?

При конструирането на серия от интервално разпределение се решават три въпроса:

  • 1. Колко интервала трябва да взема?
  • 2. Каква е дължината на интервалите?
  • 3. Каква е процедурата за включване на съвкупност от единици в границите на интервалите?
  • 1. Брой интервалиможе да се определи от Формула на Стърджис:

2. Дължина на интервала или интервална стъпка, обикновено се определя по формулата

където Р-диапазон на вариация.

3. Редът на включване на единиците на съвкупността в границите на интервала

може да бъде различно, но при изграждането на интервален ред разпределението задължително е строго определено.

Например това: [), в което единиците на съвкупността са включени в долните граници и не са включени в горните граници, но се прехвърлят към следващия интервал. Изключение от това правило е последният интервал, чиято горна граница включва последното число от класираната серия.

Границите на интервалите са:

  • затворен - с две екстремни стойности на атрибута;
  • отворен - с един изключителна стойностзнак (прединякакво число или надтакова число).

За да се асимилира теоретичен материалвъвеждам обща информацияза решения чрез задачи.

Има условни данни за средния брой мениджъри по продажбите, броя на продадените от тях стоки с едно качество, индивидуалната пазарна цена за този продукт, както и обема на продажбите на 30 фирми в един от регионите на Руската федерация в първото тримесечие на отчетната година (Таблица 2.1).

Таблица 2.1

Първоначална информация за междусекторна задача

население

мениджъри

Цена, хиляди рубли

Обем на продажбите, милиони рубли

население

мениджъри

Количество продадени стоки, бр.

Цена, хиляди рубли

Обем на продажбите, милиони рубли

Въз основа на първоначалната информация, както и на допълнителна информация, ще направим изявление индивидуални задачи. След това представяме методологията за решаването им и самите решения.

Междусекторна задача. Задача 2.1

Използване на оригиналната таблица с данни. Изисква се 2.1изградете дискретна серия от разпределение на фирмите по брой продадени стоки (Таблица 2.2).

Решение:

Таблица 2.2

Дискретна серия от разпределение на фирмите по броя на продадените стоки в един от регионите на Руската федерация през първото тримесечие на отчетната година

Междусекторна задача. Задача 2.2

изисква сеизградете класирана серия от 30 фирми според средния брой мениджъри.

Решение:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Междусекторна задача. Задача 2.3

Използване на оригиналната таблица с данни. 2.1, задължително:

  • 1. Постройте интервална серия за разпределение на фирмите по брой мениджъри.
  • 2. Изчислете честотите на сериите на разпределение на фирмите.
  • 3. Направете изводи.

Решение:

Изчислете по формулата на Стърджис (2.5) брой интервали:

Така вземаме 6 интервала (групи).

Дължина на интервала, или интервална стъпка, изчислете по формулата

Забележка.Редът за включване на единици от съвкупността в границите на интервала е следният: I), при който единиците от съвкупността са включени в долните граници, а не са включени в горните, а се прехвърлят към следващите интервал. Изключение от това правило е последният интервал I ], чиято горна граница включва последното число от класираната серия.

Изграждаме интервална серия (Таблица 2.3).

Интервална серия от разпределение на фирмите, но средният брой мениджъри в един от регионите на Руската федерация през първото тримесечие на отчетната година

Заключение.Най-многобройната група фирми е групата със среден брой мениджъри 25-30 души, която включва 8 фирми (27%); най-малката група със среден брой мениджъри 40-45 души включва само една фирма (3%).

Използване на оригиналната таблица с данни. 2.1, както и интервалните серии на разпределението на фирмите по броя на мениджърите (Таблица 2.3), изисква сеизградете аналитична групировка на връзката между броя на мениджърите и обема на продажбите на фирмите и въз основа на нея направете заключение за наличието (или липсата) на връзка между посочените признаци.

Решение:

Аналитичното групиране се изгражда на факторна основа. В нашата задача факторният знак (x) е броят на мениджърите, а резултантният знак (y) е обемът на продажбите (Таблица 2.4).

Да строим сега аналитично групиране(Таблица 2.5).

Заключение.Въз основа на данните от изграденото аналитично групиране може да се каже, че с увеличаване на броя на мениджърите по продажби се увеличава и средният обем на продажбите на компанията в групата, което показва наличието на пряка връзка между тези характеристики.

Таблица 2.4

Помощна таблица за изграждане на аналитична групировка

Брой ръководители, лица,

Фирмен номер

Обем на продажбите, милиони рубли, г

» = 59 f = 9,97

I-™ 4 -Ю.22

74 '25 1PY1

U4 = 7 = 10,61

при = ’ =10,31 30

Таблица 2.5

Зависимостта на обема на продажбите от броя на мениджърите на компанията в един от регионите на Руската федерация през първото тримесечие на отчетната година

ТЕСТОВИ ВЪПРОСИ
  • 1. Каква е същността на статистическото наблюдение?
  • 2. Назовете етапите на статистическото наблюдение.
  • 3. Какви са организационни формистатистическо наблюдение?
  • 4. Назовете видовете статистическо наблюдение.
  • 5. Какво е статистическо резюме?
  • 6. Назовете видовете статистически отчети.
  • 7. Какво е статистическо групиране?
  • 8. Назовете видовете статистически групировки.
  • 9. Какво е серия за разпространение?
  • 10. Назовете структурните елементи на разпределителната серия.
  • 11. Каква е процедурата за изграждане на серия за разпределение?