Biografier Kjennetegn Analyse

Konstruksjon av en diskret serie. Konstruksjon av en diskret variantserie

Det er enkelt å sende inn det gode arbeidet ditt til kunnskapsbasen. Bruk skjemaet nedenfor

god jobb til nettstedet">

Studenter, hovedfagsstudenter, unge forskere som bruker kunnskapsbasen i studiene og arbeidet vil være deg veldig takknemlig.

Lagt ut på http://www.allbest.ru/

OPPGAVE1

Følgende informasjon er tilgjengelig om lønn ansatte ved bedriften:

Tabell 1.1

Lønnsbeløpet i konvensjonelle termer. hi. enheter

Det kreves å konstruere en intervallfordelingsserie for å finne;

1) gjennomsnittslønn;

2) gjennomsnittlig lineært avvik;

4) standardavvik;

5) variasjonsområde;

6) oscillasjonskoeffisient;

7) lineær koeffisient variasjoner;

8) enkel variasjonskoeffisient;

10) median;

11) asymmetrikoeffisient;

12) Pearson asymmetriindeks;

13) kurtosis koeffisient.

Løsning

Som kjent er alternativene (gjenkjente verdier) ordnet i stigende rekkefølge for å danne diskrete variasjonsserier. Med et stort antall alternativ (mer enn 10), selv ved diskret variasjon, konstrueres intervallserier.

Hvis en intervallserie er kompilert med jevne intervaller, deles variasjonsområdet på spesifisert antall intervaller. Videre, hvis den resulterende verdien er heltall og entydig (noe som er sjelden), antas lengden på intervallet å være lik dette tallet. I andre tilfeller produsert avrunding Nødvendigvis V side øke, til det siste sifferet igjen var partall. Når lengden på intervallet øker, vil åpenbart variasjonsspekter etter størrelse, lik produktet antall intervaller: forskjellen mellom den beregnede og innledende lengden på intervallet

EN) Hvis størrelsen på utvidelsen av variasjonsområdet er ubetydelig, legges den enten til den største eller trekkes fra den minste verdien av karakteristikken;

b) Hvis størrelsen på utvidelsen av variasjonsområdet er merkbar, for å unngå forvirring av sentrum av området, blir den omtrent delt i to ved samtidig å legge til den største og trekke fra de minste verdiene av karakteristikken.

Hvis en intervallserie med ulik intervall kompileres, forenkles prosessen, men lengden på intervallene må fortsatt uttrykkes som et tall med siste partall, noe som i stor grad forenkler etterfølgende beregninger numeriske egenskaper.

30 er prøvestørrelsen.

La oss lage en intervallfordelingsserie ved å bruke Sturges-formelen:

K = 1 + 3,32*log n,

K - antall grupper;

K = 1 + 3,32*lg 30 = 5,91=6

Vi finner rekkevidden til attributtet - lønn til arbeidere i bedriften - (x) ved å bruke formelen

R= xmax - xmin og del med 6; R = 195-112 = 83

Da blir lengden på intervallet l bane=83:6=13,83

Begynnelsen av det første intervallet vil være 112. Legger til 112 l ras = 13,83, får vi dens endelige verdi 125,83, som også er begynnelsen på det andre intervallet osv. slutten av det femte intervallet - 195.

Når du finner frekvenser, bør du bli veiledet av regelen: "hvis verdien av en funksjon faller sammen med grensen til det interne intervallet, bør den tilskrives det forrige intervallet."

Vi får en intervallserie av frekvenser og kumulative frekvenser.

Tabell 1.2

Derfor har 3 ansatte lønn. gebyr fra 112 til 125,83 konvensjonelle pengeenheter. Høyeste lønn gebyr fra 181,15 til 195 konvensjonelle pengeenheter. kun 6 ansatte.

For å beregne numeriske egenskaper transformerer vi intervallserien til en diskret serie, og tar midten av intervallene som et alternativ:

Tabell 1.3

14131,83

Ved å bruke den vektede aritmetiske gjennomsnittsformelen

konvensjonelle pengeenheter

Gjennomsnittlig lineært avvik:

hvor xi er verdien av egenskapen som studeres for den i-te enheten av populasjonen,

Gjennomsnittlig verdi av den studerte egenskapen.

Lagt ut på http://www.allbest.ru/

LLagt ut på http://www.allbest.ru/

Konvensjonelle pengeenheter

Standardavvik:

Spredning:

Relativt variasjonsområde (oscillasjonskoeffisient): c= R:,

Relativt lineært avvik: q = L:

Variasjonskoeffisient: V = y:

Oscillasjonskoeffisienten viser den relative oscillasjonen ekstreme verdier karakteristikk handler om det aritmetiske gjennomsnittet, og variasjonskoeffisienten karakteriserer graden og homogeniteten til populasjonen.

c= R: = 83 / 159,485*100 % = 52,043 %

Dermed er forskjellen mellom ekstremverdiene 5,16% (=94,84%-100%) mindre enn gjennomsnittslønnen til ansatte i bedriften.

q = L: = 17,765/ 159,485*100 % = 11,139 %

V = y: = 21,704/159,485*100 % = 13,609 %

Variasjonskoeffisienten er mindre enn 33 %, noe som indikerer en svak variasjon i lønnen til arbeidere ved bedriften, dvs. om hva gjennomsnittsverdi er en typisk egenskap for arbeidernes lønn (befolkningen er homogen).

I intervallfordelingsserier mote bestemt av formelen -

Frekvensen av det modale intervallet, dvs. intervallet som inneholder største antall alternativ;

Frekvensen av intervallet før modalen;

Frekvensen av intervallet etter modalen;

Modal intervalllengde;

Den nedre grensen for det modale intervallet.

Å bestemme medianer i intervallserien bruker vi formelen

hvor er den kumulative (akkumulerte) frekvensen til intervallet før medianen;

Nedre grense for medianintervallet;

Median intervallfrekvens;

Lengden på medianintervallet.

Median intervall- et intervall hvis akkumulerte frekvens (=3+3+5+7) overstiger halvparten av summen av frekvenser - (153,49; 167,32).

La oss beregne asymmetri og kurtosis, som vi vil lage et nytt regneark for:

Tabell 1.4

Faktiske data

Beregnede data

La oss beregne tredje ordens øyeblikk

Derfor er asymmetrien lik

Siden 0,3553 0,25 anses asymmetrien som betydelig.

La oss beregne det fjerde ordensmomentet

Derfor er kurtosis lik

Fordi< 0, то эксцесс является плосковершинным.

Graden av asymmetri kan bestemmes ved å bruke Pearsons asymmetrikoeffisient (As): svingningsprøveverdiomsetning

hvor er det aritmetiske gjennomsnittet av distribusjonsserien; -- mote; -- standardavvik.

Med en symmetrisk (normal) fordeling = Mo, er derfor asymmetrikoeffisienten null. Hvis As > 0, så er det mer modus, derfor er det en høyrehendt asymmetri.

Hvis As< 0, то mindre mote, derfor er det venstresidig asymmetri. Asymmetrikoeffisienten kan variere fra -3 til +3.

Fordelingen er ikke symmetrisk, men har venstresidig asymmetri.

OPPGAVE 2

Hva bør utvalgsstørrelsen være slik at med sannsynlighet 0,954 overstiger ikke utvalgsfeilen 0,04 dersom man, basert på tidligere undersøkelser, vet at variansen er 0,24?

Løsning

Prøvestørrelse kl gjentatte valg beregnet med formelen:

t - konfidensskoeffisient (med en sannsynlighet på 0,954 er den lik 2,0; bestemt fra tabeller med sannsynlighetsintegraler),

y2=0,24 - standardavvik;

10 000 mennesker - prøvestørrelse;

Dx =0,04 - marginal feil prøvegjennomsnitt.

Med en sannsynlighet på 95,4 % kan det oppgis at utvalgsstørrelsen gir relativ feil ikke mer enn 0,04, må være minst 566 familier.

OPPGAVE3

Følgende data er tilgjengelige om inntekt fra hovedaktivitetene til bedriften, millioner rubler.

For å analysere en serie dynamikk, bestemme følgende indikatorer:

1) kjede og grunnleggende:

Absolutte økninger;

Veksthastighet;

Veksthastighet;

2) gjennomsnitt

Dynamikk radnivå;

Absolutt økning;

Veksthastighet;

Økningsrate;

3) absolutt verdi på 1 % økning.

Løsning

1. Absolutt økning (Dy)- dette er forskjellen mellom neste nivå i serien og det forrige (eller grunnleggende):

kjede: DN = yi - yi-1,

grunnleggende: DN = yi - y0,

уi - radnivå,

i - radnivånummer,

y0 - basisårsnivå.

2. Veksthastighet (tu) er forholdet mellom det påfølgende nivået i serien og det forrige (eller basisåret 2001):

kjede: Tu = ;

grunnleggende: Tu =

3. Veksthastighet (TD) er forholdet mellom absolutt vekst og forrige nivå, uttrykt i %.

kjede: Tu = ;

grunnleggende: Tu =

4. Absolutt verdi 1 % økning (A)- dette er forholdet mellom kjedens absolutte vekst og vekstraten, uttrykt i %.

EN =

Gjennomsnittlig radnivå beregnes ved å bruke den aritmetiske middelformelen.

Gjennomsnittlig inntektsnivå fra kjernevirksomhet i 4 år:

Gjennomsnittlig absolutt økning beregnet med formelen:

hvor n er antall nivåer i serien.

I gjennomsnitt for året økte inntektene fra kjerneaktiviteter med 3,333 millioner rubler.

Gjennomsnittlig årlig vekstrate beregnet ved hjelp av den geometriske gjennomsnittsformelen:

уn er det siste nivået i raden,

y0 - inngangsnivå rad.

Tu = 100 % = 102,174 %

Gjennomsnittlig årlig vekstrate beregnet med formelen:

T? = Tu - 100 % = 102,74 % - 100 % = 2,74 %.

I gjennomsnitt over året økte inntektene fra hovedvirksomheten til foretaket med 2,74 %.

OPPGAVEREN4

Kalkulere:

1. Individuelle prisindekser;

2. Generell handelsomsetningsindeks;

3. Samlet prisindeks;

4. Samlet indeks over det fysiske volumet av salg av varer;

5. Bryt ned den absolutte økningen i verdien av handelsomsetningen etter faktorer (på grunn av endringer i priser og antall solgte varer);

6. Lag korte konklusjoner for alle innhentede indikatorer.

Løsning

1. I henhold til vilkåret utgjorde individuelle prisindekser for produktene A, B, C -

ipA=1,20; iрБ=1,15; iрВ=1,00.

2. Vi vil beregne den generelle handelsomsetningsindeksen ved å bruke formelen:

I w = = 1470/1045*100 % = 140,67 %

Handelsomsetningen økte med 40,67 % (140,67 %-100 %).

I gjennomsnitt økte råvareprisene med 10,24 %.

Mengden ekstrakostnader for kjøpere fra prisøkninger:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333.478= 136.522 millioner rubler.

Som et resultat av stigende priser måtte kjøpere bruke ytterligere 136,522 millioner rubler.

4. Generell indeks for fysisk volum av handelsomsetning:

Det fysiske volumet av omsetningen økte med 27,61 %.

5. La oss definere generell endring omsetning i andre periode sammenlignet med første periode:

w = 1470-1045 = 425 millioner rubler.

på grunn av prisendringer:

W(p) = 1470 - 1333.478 = 136.522 millioner rubler.

på grunn av endringer i fysisk volum:

w(q) = 1333.478 - 1045 = 288.478 millioner rubler.

Vareomsetningen økte med 40,67 %. Prisene i gjennomsnitt for 3 varer økte med 10,24 %. Det fysiske volumet av omsetningen økte med 27,61 %.

Generelt økte salgsvolumet med 425 millioner rubler, inkludert på grunn av stigende priser, økte det med 136,522 millioner rubler, og på grunn av en økning i salgsvolum - med 288,478 millioner rubler.

OPPGAVE5

Følgende data er tilgjengelig for 10 fabrikker i en bransje.

Anleggsnummer

Produktutgang, tusen stk. (X)

Basert på gitte data:

I) for å bekrefte bestemmelsene for logisk analyse om tilstedeværelsen av en lineær korrelasjon mellom faktorkarakteristikken (volum av utgang) og den resulterende karakteristikken (elektrisitetsforbruk), plott de første dataene på grafen til korrelasjonsfeltet og trekke konklusjoner om form av forholdet, angi formelen;

2) bestemme parametrene til forbindelsesligningen og plott den resulterende teoretiske linjen på grafen til korrelasjonsfeltet;

3) beregne den lineære korrelasjonskoeffisienten,

4) forklare betydningen av indikatorene oppnådd i avsnitt 2) og 3);

5) ved å bruke den resulterende modellen, lag en prognose om mulig energiforbruk ved et anlegg med et produksjonsvolum på 4,5 tusen enheter.

Løsning

Dataene til attributtet - produksjonsvolumet (faktor), vil bli betegnet med xi; tegn - strømforbruk (resultat) gjennom yi; punkter med koordinater (x, y) er plottet på korrelasjonsfeltet OXY.

Punktene til korrelasjonsfeltet er plassert langs en viss rett linje. Derfor er forholdet lineært vil vi se etter en regresjonsligning i form av en rett linje Уx=ax+b. For å finne det bruker vi systemet med normale ligninger:

La oss lage en beregningstabell.

Ved å bruke gjennomsnittene som er funnet, komponerer vi et system og løser det med hensyn til parameterne a og b:

Så vi får regresjonsligningen for y på x: = 3,57692 x + 3,19231

Vi bygger en regresjonslinje på korrelasjonsfeltet.

Ved å erstatte x-verdiene fra kolonne 2 inn i regresjonsligningen, får vi de beregnede (kolonne 7) og sammenligner dem med y-dataene, som gjenspeiles i kolonne 8. For øvrig bekreftes riktigheten av beregningene av sammenfallet av gjennomsnittsverdiene av y og.

Koeffisientlineær korrelasjon vurderer nærheten til forholdet mellom egenskapene x og y og beregnes ved hjelp av formelen

Vinkelkoeffisienten for direkte regresjon a (ved x) karakteriserer retningen til den identifiserteavhengighetertegn: for a>0 er de like, for a<0- противоположны. Det er absolutt verdi - et mål på endring i den resulterende karakteristikken når faktorkarakteristikken endres med en måleenhet.

Den frie termen for den direkte regresjonen avslører retningen, og dens absolutte verdi er et kvantitativt mål på påvirkningen av alle andre faktorer på det resulterende tegnet.

Hvis< 0, så brukes ressursen til faktoren som er karakteristisk for et individuelt objekt med mindre, og når>0 Medstørre effektivitet enn gjennomsnittet for hele settet med objekter.

La oss gjennomføre en post-regresjonsanalyse.

Koeffisienten for x av den direkte regresjonen er lik 3,57692 >0, derfor, med en økning (reduksjon) i produksjonsproduksjon, øker (minker) elektrisitetsforbruket. Økning i produksjonsproduksjon med 1 tusen enheter. gir en gjennomsnittlig økning i strømforbruket med 3,57692 tusen kWh.

2. Fritiden for den direkte regresjonen er lik 3.19231, derfor øker påvirkningen av andre faktorer styrken av innvirkningen av produktproduksjon på elektrisitetsforbruket i absolutt måling med 3,19231 tusen kWh.

3. Korrelasjonskoeffisienten på 0,8235 avslører en svært nær avhengighet av elektrisitetsforbruk på produktproduksjon.

I følge Eq. regresjonsmodell lett å lage spådommer. For å gjøre dette, erstattes verdiene av x - produksjonsvolumet - inn i regresjonsligningen og elektrisitetsforbruk forutses. I dette tilfellet kan verdiene til x tas ikke bare innenfor et gitt område, men også utenfor det.

La oss lage en prognose om mulig energiforbruk ved et anlegg med et produksjonsvolum på 4,5 tusen enheter.

3,57692*4,5 + 3,19231= 19,288 45 tusen kWh.

LISTE OVER BRUKT KILDER

1. Zakharenkov S.N. Samfunnsøkonomisk statistikk: Lærebok og praktisk veiledning. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Generell teori statistikk. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistikk. - M.: Prospekt, 2002.

4. Generell teori om statistikk / Under generelt. utg. O.E. Bashina, A.A. Spirina. - M.: Finans og statistikk, 2000.

5. Samfunnsøkonomisk statistikk: Pedagogisk og praktisk. godtgjørelse / Zakharenkov S.N. og andre - Mn.: Yerevan State University, 2004.

6. Samfunnsøkonomisk statistikk: Lærebok. godtgjørelse. / Ed. Nesterovich S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics - Minsk, 2000.

8. Kharchenko L.P. Statistikk. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistikk. - M.: INFRA - M, 1999.

10. Økonomisk statistikk / Red. Yu.N. Ivanova - M., 2000.

Skrevet på Allbest.ru

...

Lignende dokumenter

    Beregning av det aritmetiske gjennomsnittet for intervallserie distribusjoner. Definisjon generell indeks fysisk volum av handelsomsetning. Analyse av den absolutte endringen i de totale produksjonskostnadene på grunn av endringer i fysisk volum. Beregning av variasjonskoeffisienten.

    test, lagt til 19.07.2010

    Essensen av omsetning i engros, detaljhandel og offentlig handel. Formler for beregning av individuelle og aggregerte omsetningsindekser. Beregning av karakteristikker for en intervallfordelingsserie - aritmetisk gjennomsnitt, modus og median, variasjonskoeffisient.

    kursarbeid, lagt til 05.10.2013

    Beregning av planlagt og faktisk salgsvolum, prosentandel av planoppfyllelse, absolutt endring i omsetning. Fastsettelse av absolutt vekst, gjennomsnittlig vekstrater og økning i kontantinntekter. Beregning av strukturelle gjennomsnitt: moduser, medianer, kvartiler.

    test, lagt til 24.02.2012

    Intervallserie for fordeling av banker etter overskuddsvolum. Finne modusen og medianen til den resulterende intervallfordelingsserien grafisk metode og ved beregninger. Beregning av karakteristikker for intervallfordelingsserier. Beregning av det aritmetiske gjennomsnittet.

    test, lagt til 15.12.2010

    Formler for å bestemme gjennomsnittsverdiene for en intervallserie - moduser, medianer, spredning. Beregning av analytiske indikatorer for dynamikkserier ved bruk av kjede- og grunnleggende skjemaer, vekstrater og inkrementer. Konseptet med en konsolidert indeks over kostnader, priser, utgifter og omsetning.

    kursarbeid, lagt til 27.02.2011

    Konsept og formål, rekkefølge og konstruksjonsregler variasjonsserie. Analyse av datahomogenitet i grupper. Indikatorer på variasjon (fluktuasjon) av en egenskap. Bestemmelse av lineært gjennomsnitt og kvadratavvik, oscillasjonskoeffisient og variasjon.

    test, lagt til 26.04.2010

    Konseptet med modus og median som typiske egenskaper, rekkefølgen og kriteriene for deres bestemmelse. Finne modus og median i diskrete og intervallvariasjonsserier. Kvartiler og desiler som tilleggsegenskaper for en variasjonsstatistisk serie.

    test, lagt til 09.11.2010

    Konstruksjon av en intervallfordelingsserie basert på grupperingsegenskaper. Kjennetegn på avviket i frekvensfordelingen fra en symmetrisk form, beregning av kurtose og asymmetriindikatorer. Analyse av balanse- eller resultatregnskapsindikatorer.

    test, lagt til 19.10.2014

    Konvertering av empiriske serier til diskrete serier og intervallserier. Bestemmelse av gjennomsnittsverdien for en diskret serie ved bruk av dens egenskaper. Beregning ved hjelp av en diskret serie av modus, median, variasjonsindikatorer (spredning, avvik, oscillasjonskoeffisient).

    test, lagt til 17.04.2011

    Konstruksjon av en statistisk serie av distribusjon av organisasjoner. Grafisk definisjon modus og medianverdier. Korrelasjonens nærhet ved bruk av bestemmelseskoeffisienten. Bestemme prøvetakingsfeilen for gjennomsnittlig antall ansatte.

Den enkleste måten å oppsummere statistisk materiale er konstruksjon av serier. Sammendrag resultat statistisk forskning det kan være distribusjonsserier. En distribusjonsserie i statistikk er en ordnet fordeling av befolkningsenheter i grupper i henhold til en hvilken som helst egenskap: kvalitativ eller kvantitativ. Hvis en serie er konstruert etter et kvalitativt kriterium, så kalles den attributiv, og hvis iht. kvantitativ karakteristikk, deretter variasjon.

En variasjonsserie kjennetegnes av to elementer: variant (X) og frekvens (f). En variant er en egen verdi av en egenskap ved en individuell enhet eller gruppe av en populasjon. Tallet som viser hvor mange ganger en bestemt verdi av en funksjon forekommer kalles frekvens. Hvis frekvens er uttrykt som et relativt tall, kalles det frekvens. En variasjonsserie kan være intervalal, når grensene "fra" og "til" er definert, eller den kan være diskret, når karakteristikken som studeres er preget av et visst antall.

La oss se på konstruksjonen av variasjonsserier ved hjelp av eksempler.

Eksempel. og det er data om tariffkategoriene til 60 arbeidere i et av anleggets verksteder.

Fordel arbeidere etter tariffkategori, bygg en variantserie.

For å gjøre dette skriver vi ned alle verdiene til karakteristikken i stigende rekkefølge og teller antall arbeidere i hver gruppe.

Tabell 1.4

Fordeling av arbeidere etter kategori

Arbeiderrangering (X)

Antall arbeidere

person (f)

i % av totalen (spesielt)

Vi mottok en variasjonsdiskret serie der karakteristikken som studeres (arbeiderens rangering) er representert med et visst tall. For klarhetens skyld er variasjonsserier avbildet grafisk. Med utgangspunkt i denne fordelingsserien ble det konstruert en fordelingsflate.

Ris. 1.1. Polygon for fordeling av arbeidere etter tariffkategori

Vi vil vurdere konstruksjonen av en intervallserie med like intervaller ved å bruke følgende eksempel.

Eksempel. Data er kjent om verdien av fast kapital til 50 selskaper i millioner rubler. Det er påkrevd å vise fordelingen av bedrifter etter kostnad for fast kapital.

For å vise fordelingen av bedrifter etter kostnad for fast kapital, løser vi først spørsmålet om antall grupper vi ønsker å fremheve. Anta at vi bestemte oss for å identifisere 5 grupper av foretak. Deretter bestemmer vi størrelsen på intervallet i gruppen. For å gjøre dette bruker vi formelen

I følge vårt eksempel.

Ved å legge til verdien av intervallet til minimumsverdien av attributtet, får vi grupper av firmaer etter kostnad for fast kapital.

Enhet har dobbel betydning, tilhører gruppen der den fungerer som den øvre grensen (dvs. verdien av attributtet 17 vil gå til den første gruppen, 24 til den andre, osv.).

La oss telle antall fabrikker i hver gruppe.

Tabell 1.5

Fordeling av bedrifter etter verdi av fast kapital (millioner rubler)

Kostnader for fast kapital
i millioner rubler (X)

Antall firmaer
(frekvens) (f)

Akkumulerte frekvenser
(kumulativ)

I henhold til denne fordelingen ble det oppnådd en variasjonsintervallserie, hvorfra det følger at 36 firmaer har en fast kapital verdt fra 10 til 24 millioner rubler. osv.

Intervallfordelingsserier kan representeres grafisk i form av et histogram.

Resultatene av databehandlingen presenteres i statistiske tabeller. Statistiske tabeller inneholder sitt eget emne og predikat.

Subjektet er helheten eller en del av helheten som karakteriseres.

Predikater er indikatorer som karakteriserer emnet.

Tabeller skilles: enkel og gruppe, kombinasjon, med enkel og kompleks utvikling av predikatet.

En enkel tabell i emnet inneholder en liste over individuelle enheter.

Hvis emnet inneholder en gruppering av enheter, kalles en slik tabell en gruppetabell. For eksempel en gruppe foretak etter antall arbeidere, befolkningsgrupper etter kjønn.

Emnet for kombinasjonstabellen inneholder gruppering i henhold til to eller flere egenskaper. For eksempel er befolkningen delt inn etter kjønn i grupper etter utdanning, alder osv.

Kombinasjonstabeller inneholder informasjon som lar en identifisere og karakterisere forholdet til en rekke indikatorer og mønsteret av deres endringer både i rom og tid. For å gjøre tabellen tydelig når du utvikler emnet, begrense deg til to eller tre egenskaper, og danner et begrenset antall grupper for hver av dem.

Predikatet i tabeller kan utvikles på forskjellige måter. Med en enkel utvikling av predikatet er alle indikatorene plassert uavhengig av hverandre.

I kompleks utvikling av predikatet kombineres indikatorene med hverandre.

Når man konstruerer en hvilken som helst tabell, må man gå ut fra formålet med studien og innholdet i det bearbeidede materialet.

I tillegg til tabeller bruker statistikken også grafer og diagrammer. Diagram – statistiske data er avbildet ved hjelp av geometriske former. Diagrammer er delt inn i linje- og stolpediagram, men det kan også være figurdiagram (tegninger og symboler), kakediagrammer(sirkelen tas som størrelsen på hele befolkningen, og områdene til individuelle sektorer vises egenvekt eller en andel av den komponenter), radielle diagrammer(bygget på basis av polare ordinater). Et kartogram er en kombinasjon av et disposisjonskart eller områdeplan med et diagram.

Resultater av gruppering av de innsamlede statistiske data, som regel presenteres i form av distribusjonsserier. En distribusjonsserie er en ordnet fordeling av befolkningsenheter i grupper i henhold til egenskapen som studeres.

Distribusjonsserier er delt inn i attributive og variasjonelle, avhengig av egenskapen som ligger til grunn for grupperingen. Hvis attributtet er kvalitativt, kalles distribusjonsserien attributiv. Et eksempel på en attributtserie er fordelingen av virksomheter og organisasjoner etter type eierskap (se tabell 3.1).

Hvis karakteristikken som distribusjonsserien er konstruert av er kvantitativ, kalles serien variasjon.

Variasjonsserien til en fordeling består alltid av to deler: en variant og de tilsvarende frekvensene (eller frekvensene). En variant er verdien som en egenskap kan få i populasjonsenheter, mens frekvens er antall observasjonsenheter som har en gitt verdi av egenskapen. Summen av frekvenser er alltid lik volumet av befolkningen. Noen ganger, i stedet for frekvenser, beregnes frekvenser - disse er frekvenser uttrykt enten som brøkdeler av en enhet (da er summen av alle frekvenser lik 1), eller som en prosentandel av volumet av populasjonen (summen av frekvensene vil være lik 100 %).

Variasjonsserier er diskrete og intervall. For diskrete serier (tabell 3.7) er alternativene uttrykt spesifikke tall, oftest hel.

Tabell 3.8.
Fordeling av ansatte etter arbeidstidspunkt i forsikringsselskapet Tid brukt på å jobbe i bedriften hele år (alternativer)
Antall ansatte Mann (frekvenser)
i % av totalt (frekvens) 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
opptil et år 129 100,0

Total

Hvis en karakteristikk antar et begrenset antall verdier, vanligvis ikke mer enn 10, konstrueres diskrete distribusjonsserier. Hvis alternativet er større, mister den diskrete serien sin klarhet; i dette tilfellet er det tilrådelig å bruke intervallformen til variasjonsserien. Med kontinuerlig variasjon av en karakteristikk, når verdiene innenfor visse grenser avviker fra hverandre med en vilkårlig liten mengde, konstrueres også en intervallfordelingsserie.

3.3.1. Konstruksjon av diskrete variasjonsserier

La oss vurdere metodikken for å konstruere diskrete variasjonsserier ved å bruke et eksempel.

Eksempel 3.2. Følgende data er tilgjengelig for den kvantitative sammensetningen av 60 familier:

For å få en ide om fordelingen av familier etter antall medlemmer, bør en variasjonsserie konstrueres. Siden tegnet har et begrenset antall heltallsverdier, konstruerer vi en diskret variasjonsserie. For å gjøre dette, anbefales det først å skrive ned alle verdiene til attributtet (antall medlemmer i familien) i stigende rekkefølge (dvs. ranger de statistiske dataene):

Deretter må du telle antall familier med samme sammensetning. Antall familiemedlemmer (verdien av en varierende karakteristikk) er varianter (vi vil betegne dem med x), antall familier med samme sammensetning er frekvenser (vi vil betegne dem med f). Vi presenterer grupperingsresultatene i form av følgende diskrete variasjonsfordelingsserier:

Tabell 3.11.
Antall familiemedlemmer (x) Antall familier (y)
1 8
2 14
3 20
4 9
5 5
6 4
opptil et år 60

3.3.2. Konstruksjon av intervallvariasjonsserier

La oss demonstrere teknikken for å konstruere intved å bruke følgende eksempel.

Eksempel 3.3. Som et resultat statistisk observasjon Følgende data ble innhentet om gjennomsnittsrenten til 50 forretningsbanker (%):

Tabell 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Som vi kan se, er det ekstremt upraktisk å se på en slik rekke data. I tillegg er ingen mønstre av endringer i indikatoren synlige. La oss konstruere en intervallfordelingsserie.

  1. La oss bestemme antall intervaller.

    Antall intervaller i praksis er ofte satt av forskeren selv basert på målene for hver spesifikke observasjon. Samtidig kan det også beregnes matematisk ved hjelp av Sturgess-formelen

    n = 1 + 3,322 lgN,

    hvor n er antall intervaller;

    N er volumet av populasjonen (antall observasjonsenheter).

    For vårt eksempel får vi: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6 "7.

  2. La oss bestemme størrelsen på intervallene (i) ved hjelp av formelen

    hvor x max er den maksimale verdien av attributtet;

    x min - minimumsverdien for attributtet.

    For vårt eksempel

    Intervallene til en variasjonsserie er klare hvis grensene deres har "runde" verdier, så la oss runde verdien av intervallet 1,9 til 2, og minimumsverdien til karakteristikken 12,3 til 12,0.

  3. La oss bestemme grensene for intervallene.

    Intervaller er som regel skrevet på en slik måte at øvre grense for ett intervall også er nedre grense for neste intervall. Så for vårt eksempel får vi: 12.0-14.0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24.0-26.0.

    En slik oppføring betyr at attributtet er kontinuerlig. Hvis variantene av skiltet er strengt akseptert visse verdier, for eksempel bare heltall, men antallet er for stort til å bygges diskrete serier, så kan du lage en intervallserie hvor den nedre grensen til intervallet ikke vil falle sammen med den øvre grensen til neste intervall (dette vil bety at attributtet er diskret). For eksempel, i fordelingen av bedriftsansatte etter alder, kan du opprette følgende intervallgrupper av år: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 og mer.

    I tillegg, i vårt eksempel, kan vi åpne de første og siste intervallene osv. skriv: opptil 14,0; 24,0 og oppover.

  4. Basert på de innledende dataene vil vi konstruere en rangert serie. For å gjøre dette, skriver vi ned i stigende rekkefølge verdiene som tegnet tar. Vi presenterer resultatene i tabellen: Tabell 3.13.
    Rangert serie med renter til kommersielle banker
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Bankrente % (alternativer)

    La oss telle frekvensene.

Når du teller frekvenser, kan det oppstå en situasjon når verdien av en funksjon faller på grensen til et eller annet intervall. I dette tilfellet kan du bli veiledet av regelen: en gitt enhet er tildelt intervallet som verdien er den øvre grensen for. Så verdien 16,0 i vårt eksempel vil referere til det andre intervallet.

Grupperingsresultatene oppnådd i vårt eksempel vil bli presentert i en tabell.
Tabell 3.14. Fordeling av forretningsbanker etter utlånsrente Kort sats, %
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
opptil et år 50 -

Antall banker, enheter (frekvenser)

I prosessen med å gruppere data når man konstruerer variasjonsserier, brukes noen ganger ulike intervaller. Dette gjelder de tilfellene når de karakteristiske verdiene følger aritmetikken eller geometrisk progresjon eller når bruken av Sturgess-formelen fører til fremkomsten av "tomme" intervallgrupper som ikke inneholder en enkelt observasjonsenhet. Deretter settes grensene for intervallene vilkårlig av forskeren selv ut fra sunn fornuft og undersøkelsesmål eller ved hjelp av formler. Så for data som endres inn aritmetisk progresjon, beregnes størrelsen på intervallene som følger.

Betingelse:

Det er data om alderssammensetningen til arbeidere (år): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Konstruer en intervallfordelingsserie.
    2. Bygge grafisk bilde rad.
    3. Bestem grafisk modus og median.

Løsning:

1) I følge Sturgess-formelen skal populasjonen deles inn i 1 + 3,322 lg 30 = 6 grupper.

Maksimal alder - 38 år, minimum - 18 år.

Intervallbredde Siden endene på intervallene må være heltall, deler vi populasjonen inn i 5 grupper. Intervallbredde - 4.

For å gjøre beregningene enklere, vil vi ordne dataene i stigende rekkefølge: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Distribusjon alderssammensetning arbeidere

Grafisk kan en serie avbildes som et histogram eller polygon. Histogram - stolpediagram. Basen av kolonnen er bredden på intervallet. Høyden på søylen er lik frekvensen.

Polygon (eller distribusjonspolygon) - frekvensgraf. For å bygge den ved hjelp av et histogram, kobler vi midtpunktene til de øvre sidene av rektanglene. Vi lukker polygonet på Ox-aksen i avstander lik halve intervallet fra de ekstreme x-verdiene.

Modus (Mo) er verdien av karakteristikken som studeres, som forekommer hyppigst i en gitt populasjon.

For å bestemme modusen fra histogrammet, må du velge det høyeste rektangelet, tegne en linje fra høyre toppunkt av dette rektangelet til høyre øverste hjørne det forrige rektangelet, og fra venstre toppunkt av det modale rektangelet tegne en linje til venstre toppunkt i det påfølgende rektangelet. Fra skjæringspunktet mellom disse linjene tegner du en vinkelrett på x-aksen. Abscissen vil være mote. Mo ≈ 27,5. Dette betyr at den vanligste alderen i denne populasjonen er 27-28 år.

Median (Me) er verdien av karakteristikken som studeres, som er midt i den ordnede variasjonsserien.

Vi finner medianen ved å bruke kumuleringen. Kumulerer - en graf over akkumulerte frekvenser. Abscisser er varianter av en serie. Ordinater er akkumulerte frekvenser.

For å bestemme medianen over kumulatet finner vi et punkt langs ordinataksen som tilsvarer 50 % av de akkumulerte frekvensene (i vårt tilfelle 15), trekker en rett linje gjennom den, parallelt med Ox-aksen, og fra punktet til dens skjæringspunkt med kumulatet, tegn en vinkelrett på x-aksen. Abscissen er medianen. Meg ≈ 25,9. Dette betyr at halvparten av arbeiderne i denne befolkningen er under 26 år.

Det viktigste stadiet i studiet av sosioøkonomiske fenomener og prosesser er systematisering av primærdata og på dette grunnlag oppnå en oppsummerende karakteristikk av hele objektet ved bruk av generelle indikatorer, som oppnås ved å oppsummere og gruppere primært statistisk materiale.

Statistisk oppsummering - Det er et kompleks sekvensielle operasjoner ved å generalisere spesifikke individuelle fakta som danner et sett for å identifisere typiske trekk og mønstre som er iboende i fenomenet som studeres som helhet. Å gjennomføre et statistisk sammendrag inkluderer følgende trinn :

  • utvalg av grupperingsegenskaper;
  • bestemme rekkefølgen av gruppedannelse;
  • systemutvikling statistiske indikatorerå karakterisere grupper og objektet som helhet;
  • utvikling av statistiske tabelloppsett for å presentere oppsummeringsresultater.

Statistisk gruppering kalles inndelingen av enheter av befolkningen som studeres inn i homogene grupper i henhold til visse egenskaper som er viktige for dem. Grupperinger er det viktigste statistisk metode generalisering av statistiske data, grunnlaget for korrekt beregning av statistiske indikatorer.

Skjelne følgende typer grupperinger: typologisk, strukturell, analytisk. Alle disse grupperingene er forent ved at enhetene til objektet er delt inn i grupper i henhold til en eller annen egenskap.

Grupperingsfunksjon er en egenskap der enhetene til en populasjon er delt inn i separate grupper. Fra det riktige valget

Grupperingskarakteristikken bestemmer konklusjonene til den statistiske studien. Som grunnlag for gruppering er det nødvendig å bruke betydelige, teoretisk baserte egenskaper (kvantitative eller kvalitative). Kvantitative egenskaper ved gruppering ha et numerisk uttrykk (handelsvolum, personens alder, familieinntekt osv.), og kvalitative tegn på gruppering gjenspeiler tilstanden til en befolkningsenhet (kjønn, sivilstand

Etter at grunnlaget for grupperingen er fastsatt, må spørsmålet om antall grupper som befolkningen under utredning skal deles inn i, avgjøres.

Antall grupper avhenger av målene for studien og typen indikator som ligger til grunn for grupperingen, populasjonens volum og graden av variasjon av karakteristikken. For eksempel, gruppering av foretak etter type eierskap tar hensyn til kommunal, føderal og føderal fageiendom. Hvis grupperingen utføres på kvantitativ basis, er det nødvendig å reversere spesiell oppmerksomhet

på antall enheter av objektet som studeres og graden av variabilitet av grupperingskarakteristikken. Når antall grupper er bestemt, må grupperingsintervallene bestemmes. Intervall

- dette er verdiene til en varierende egenskap som ligger innenfor visse grenser. Hvert intervall har sin egen verdi, øvre og nedre grenser, eller minst én av dem. Nedre grense for intervallet kalles den minste verdien av karakteristikken i intervallet, og øvre grense

- den høyeste verdien av karakteristikken i intervallet. Verdien av intervallet er differansen mellom øvre og nedre grense. Grupperingsintervaller, avhengig av størrelsen, er: like og ulikt. Hvis variasjonen av en karakteristikk manifesterer seg innenfor relativt trange grenser og fordelingen er ensartet, så bygges en gruppe med like intervaller. Størrelse like intervall :

bestemt av følgende formel hvor Xmax, Xmin - maksimum og minimumsverdi

egenskaper i aggregatet; n - antall grupper.

Den enkleste grupperingen, der hver utvalgt gruppe er preget av én indikator, representerer en distribusjonsserie. Statistisk serie distribusjon

- dette er en ordnet fordeling av befolkningsenheter i grupper i henhold til en bestemt egenskap. Avhengig av karakteristikken som ligger til grunn for dannelsen av distribusjonsserien, skilles attributive og variasjonelle distribusjonsserier. Attributiv kalles distribusjonsserier konstruert iht kvalitative egenskaper , det vil si tegn som ikke har numerisk uttrykk (fordeling etter type arbeidskraft, etter kjønn, etter yrke osv.). Attributtserie

fordelinger karakteriserer sammensetningen av befolkningen i henhold til visse vesentlige egenskaper. Tatt over flere perioder gjør disse dataene det mulig å studere endringer i struktur. Variasjonsserie kalles distribusjonsserier konstruert på kvantitativ basis. Enhver variasjonsserie består av to elementer: alternativer og frekvenser. Alternativer kalles egenskaper som den tar i variasjonsserien, det vil si den spesifikke verdien av den varierende egenskapen.

Frekvenser antall individuelle varianter eller hver gruppe av en variasjonsserie kalles, det vil si at dette er tall som viser hvor ofte enkelte varianter forekommer i distribusjonsserien. Summen av alle frekvenser bestemmer størrelsen på hele befolkningen, dens volum. Frekvenser kalles frekvenser uttrykt i brøkdeler av en enhet eller som en prosentandel av totalen. Følgelig er summen av frekvenser lik 1 eller 100%.

Avhengig av arten av variasjonen til en karakteristikk, skilles tre former for variasjonsserier ut: rangerte serier, diskrete serier og intervallserier.

Rangerte variantserier - dette er fordelingen av individuelle enheter av befolkningen i stigende eller synkende rekkefølge etter karakteristikken som studeres. Rangering lar deg enkelt dele opp kvantitative data i grupper, umiddelbart oppdage de minste og høyeste verdi karakteristisk, fremhev verdiene som oftest gjentas.

Diskrete variasjonsserier karakteriserer fordelingen av populasjonsenheter i henhold til en diskret attributt som kun tar heltallsverdier. For eksempel tariffkategori, antall barn i familien, antall ansatte i bedriften, etc.

Hvis en egenskap har en kontinuerlig endring, som innenfor visse grenser kan ta alle verdier ("fra - til"), så for denne egenskapen er det nødvendig å bygge intervallvariasjonsserier . For eksempel inntektsbeløpet, tjenestetiden, kostnadene for anleggsmidler til foretaket, etc.

Eksempler på å løse problemer om emnet "Statistisk sammendrag og gruppering"

Oppgave 1 . Det er informasjon om antall bøker studentene har mottatt gjennom abonnement det siste studieåret.

Konstruer rangerte og diskrete variasjonsdistribusjonsserier, angir elementene i serien.

Løsning

Dette settet representerer mange alternativer for antall bøker elevene mottar. La oss telle antall slike alternativer og ordne dem i form av variasjonsrangerte og variasjonsdiskrete distribusjonsserier.

Oppgave 2 . Det er data om kostnadene for anleggsmidler for 50 bedrifter, tusen rubler.

Konstruer en distribusjonsserie som fremhever 5 grupper av foretak (med like intervaller).

Løsning

For å løse velger vi den største og minste verdi verdien av anleggsmidler til foretak.

Disse er 30,0 og 10,2 tusen rubler.

Deretter vil den første gruppen inkludere foretak hvis anleggsmidler er fra 10,2 tusen rubler. opptil 10,2+3,96=14,16 tusen rubler. Det vil være 9 slike foretak Den andre gruppen vil inkludere foretak hvis anleggsmidler beløper seg til 14,16 tusen rubler. opptil 14,16+3,96=18,12 tusen rubler. Det vil være 16 slike virksomheter la oss finne nummeret foretak inkludert i tredje, fjerde og femte gruppe.

Vi plasserer den resulterende distribusjonsserien i tabellen.

Oppgave 3 . Følgende data ble innhentet for en rekke lettindustribedrifter:

Grupper foretakene etter antall arbeidere, og danner 6 grupper med like mellomrom.

Regn ut for hver gruppe:
1. antall foretak
2. antall arbeidere
3. volum av produkter produsert per år
4. gjennomsnittlig faktisk produksjon per arbeider
6. 5. volum av anleggsmidler middels størrelse
anleggsmidler til ett foretak

7. gjennomsnittlig verdi av produkter produsert av ett foretak

Løsning

Presenter beregningsresultatene i tabeller. Trekk konklusjoner.

For å løse, vil vi velge de største og minste verdiene av gjennomsnittlig antall arbeidere i bedriften. Disse er 43 og 256.

La oss finne størrelsen på intervallet: h = (256-43):6 = 35,5

Da vil den første gruppen inkludere foretak med gjennomsnittlig antall arbeidere fra 43 til 43 + 35,5 = 78,5 personer.

Det vil være 5 slike foretak. Den andre gruppen vil omfatte foretak med gjennomsnittlig antall ansatte fra 78,5 til 78,5+35,5=114 personer. Det vil være 12 slike foretak Tilsvarende vil vi finne antall foretak som inngår i tredje, fjerde, femte og sjette gruppe. Vi plasserer den resulterende distribusjonsserien i en tabell og beregner de nødvendige indikatorene for hver gruppe:

Konklusjon

: Som det fremgår av tabellen, er den andre gruppen av foretak den mest tallrike. Den omfatter 12 virksomheter. De minste gruppene er den femte og sjette gruppen (to foretak hver). Dette er de største bedriftene (målt i antall arbeidere).