Statistikk i enkle ord. Essensen og betydningen av gjennomsnittsverdier

Drivstoff settes basert på en analyse av statistiske data om faktisk spesifikt drivstofforbruk, samt faktorer som påvirker endringer i normale driftsforhold. Flere regresjonsmodeller brukes som et matematisk apparat.

Analyse av publikasjoner om vurdering av økonomisk effektivitet av ny teknologi og egen forskning tillot forfatterne å trekke en rekke konklusjoner. Først av alt kan virkningen av individuelle faktorer på å øke produksjonens økonomiske effektivitet ved bruk av nytt utstyr i oljeproduktrørledningstransport identifiseres på grunnlag av omfangsrikt materiale av faktiske observasjoner og analyse av statistiske data. Ved fastsettelse av indikatorer for vurdering av økonomisk effektivitet bør man ta hensyn til kvantitative verdier meter under hensyntagen til gjeldende forhold i denne perioden. Standardene som brukes i beregningene må fullt ut reflektere eksisterende kostnader med indeksering av kostnadene ved produksjon og bruk av utstyr under inflasjonsforhold.

Historien om menneskelig utvikling har vist at uten statistiske data er det umulig å styre staten, utvikle individuelle næringer og sektorer av økonomien og sikre optimale proporsjoner mellom dem. Behovet for å samle inn og oppsummere mye data om landets befolkning, bedrifter, banker, gårder osv. fører til eksistensen av spesielle statistiske tjenester - institusjoner statlig statistikk. Avhengig av bransjen der innsamlingen, behandlingen og analysen av statistiske data er organisert, skilles statistikk over befolkning, industri, landbruk, kapitalkonstruksjon, finans, etc. ut. Alle disse delene av statistikken er laget for å utvikle metoder for innsamling og oppsummering data, konstruere oppsummerende indikatorer for å reflektere prosesser i den aktuelle bransjen. Statistikken beregner også generelle økonomiske indikatorer - bruttonasjonalprodukt, bruttonasjonalprodukt, samlet samfunnsprodukt, nasjonalinntekt, etc.

Ordet statistikk brukes i flere betydninger, først og fremst som et synonym for data. Det er i denne forstand man kan si statistikken over fødsels- og dødsrater i Russland eller statistikken over forbrytelser. Statistikk er en kunnskapsgren som kombinerer prinsippene og metodene for å arbeide med numeriske data som karakteriserer massefenomener. Industri kalles også statistikk praktiske aktiviteter rettet mot å samle inn, behandle og analysere statistiske data.

En analyse av årsakene til fremveksten og forløpet av inflasjon i Den russiske føderasjonen viser deres unike karakter og den betydelige overvekt av kostnadspressende inflasjon over inflasjon på etterspørselssiden. Derfor er vestlige antiinflasjonsteorier lite egnet for russiske forhold. En innenlandsk harmonisk, fullstendig teori er ennå ikke skapt, akkurat som det ikke er noen tykke Russiske lærebøker for å bekjempe inflasjon. Kornene er så nødvendig kunnskap spredt over hundrevis av aviser og magasiner. Oppgaven er på den ene siden å rydde opp i de manglende betalingene, som i noen tilfeller allerede har ført til lammelse av produksjonen, og på den andre siden å forhindre kollaps av inflasjonen. Vanskelige oppgaver, men de må løses. Basert på analysen av statistiske data de siste syv årene, og studerer publikasjonene til ledende innenlandske økonomer, tilbyr forfatteren sine egne løsninger på problemer.

Oppgaven er på den ene siden å rydde opp i de manglende betalingene, som i noen tilfeller allerede har ført til lammelser, og på den andre siden å forhindre kollaps i inflasjonen. Det er på tide å begynne å undertrykke inflasjonen på normal måte – ved å øke produksjonen av produkter som er etterspurt på alle mulige måter. Dette er de vanskeligste oppgavene, men de må løses hvis vi vil overleve som verdensmakt, og ikke som et råstoffvedheng. Basert på analyse av statistiske data og kjennskap til publikasjonene til ledende innenlandske økonomer, tilbyr forfatteren sine egne løsninger på problemer.

Altså i modeller med variable parametere en differensiert tilnærming er nødvendig for å etablere variasjonsområder for utvalgskoeffisienter, basert på analyse av statistiske data, type teknologiske prosesser og kvalitetsindikatorer for strømmer.

Prognostisering av skatteinntekter basert på makroøkonomiske indikatorer bestemmer strategien for å generere skatteinntekter for neste år og mellomlang sikt, men løser ikke alle skatteplanleggingsproblemer. Derfor er en nødvendig komponent i skatteplanlegging behandling og analyse av statistiske data om akkumulering av skatter i budsjettet for siste periode, samt informasjon om mulige endringer i skattelovgivningen.

Det er nødvendig å organisere en systematisk innsamling og analyse av statistiske data som karakteriserer dynamikken gjennom årene med drift av volumet av produkter og arbeid utført ved bruk av utstyret som introduseres, samt kostnader, arbeidsintensitet og materialintensitet.

Sammen med å bestemme hovedparameteren, justeres beregningen av behovet for visse typer maskiner og utstyr basert på en rekke andre faktorer: endringer i balansen mellom forbruk av maskiner og utstyr etter sektorer i den nasjonale økonomien, endringer i struktur av produktproduksjon, endringer i utvalget av produkter planlagt i rubler på grunn av innføringen av mer progressive, pålitelige og holdbare design av endringer knyttet til utvikling av spesialisering og samarbeid, som påvirker det totale volumet av produksjon, etc. Påvirkningen av visse faktorer på endringer i indikatorer for å bestemme behovet for ulike typer utstyr er identifisert basert på analyse av statistiske data for den forhåndsplanlagte perioden med deres prognose for den planlagte perioden.

Det er veldig nær forbindelse sysselsettingsindikatorer med andre viktige indikatorer for økonomisk utvikling. Dermed er forholdet mellom arbeidsledighet og endringer i BNP preget av Okuns lov, empirisk oppdaget basert på analyse av statistiske data for USA (for perioden 50-80-årene), og deretter underbygget teoretisk i makroøkonomiske studier. I sin opprinnelige form, slik det gjelder USA, sier Okuns lov

Foran alle positive verdier x-funksjonen øker ved x = b/2; kurven har et bøyningspunkt - akselerert vekst ved x > b/2; Lignende type funksjoner brukes i analysen av statistiske data om forbrukerbudsjetter, der det fremsettes en hypotese om eksistensen av et asymptotisk forbruksnivå, om endringer i den marginale tilbøyeligheten til å konsumere et produkt, om eksistensen terskelnivå inntekt 1. I dette tilfellet, for x -> ja y - e" (fig. 2.5).

Denne formelen ble brukt til å analysere statistiske data,

Alle salgsprognoser er basert på tre typer informasjon hentet fra å studere hva folk sier, hva folk gjør og hva folk har gjort. Innhenting av den første typen informasjon er basert på å studere meningene til forbrukere og kjøpere, salgsagenter og mellommenn. Her brukes metoder for sosiologisk forskning og ekspertmetoder. Å studere hva folk gjør innebærer å gjøre markedstesting. Å studere hva folk har gjort innebærer å analysere statistiske data om kjøpene de har gjort.

La oss vurdere fordelingen av olje- og gassproduksjonsenheter i henhold til arten av endringer i produksjonsvolumer ved olje- og gassproduksjonsenheter med økende, stabil og fallende produksjon. Per 1/1 av 1972, av 104 olje- og gassproduksjonsenheter i industrien, var 43 (eller 41,4%) i vekst og 61 var stabile eller fallende. En analyse av statistiske data for 1970, utført av forfatterne for 76 olje- og gassproduksjonsenheter, gjorde det mulig å identifisere noen generelle kjennetegn ved ulike undergrupper av olje- og gassproduksjonsenheter, som er gitt i tabell. 15.

Hypoteser testes ved hjelp av statistisk analyse. Statistisk signifikans finner man ved å bruke P-verdien, som tilsvarer sannsynligheten for en gitt hendelse forutsatt at en påstand (nullhypotese) er sann. Hvis P-verdien er mindre enn det angitte nivået statistisk signifikans(vanligvis 0,05), kan eksperimentatoren trygt konkludere med at nullhypotesen er falsk og gå videre til å vurdere den alternative hypotesen. Ved hjelp av Studentens t-test kan du beregne P-verdien og bestemme signifikans for to datasett.

Trinn

Del 1

Sette opp eksperimentet

Definer hypotesen din. Det første trinnet i å vurdere statistisk signifikans er å velge spørsmålet du vil svare på og formulere en hypotese. En hypotese er et utsagn om eksperimentelle data, deres fordeling og egenskaper. For ethvert eksperiment er det både en null og en alternativ hypotese. Generelt sett må du sammenligne to sett med data for å finne ut om de er like eller forskjellige.

Nullhypotesen (H 0) sier typisk at det ikke er noen forskjell mellom to sett med data. For eksempel: de elevene som leser stoffet før timen får ikke høyere karakterer.
Den alternative hypotesen (H a) er motsatt nullhypotese og representerer et utsagn som må bekreftes ved hjelp av eksperimentelle data. For eksempel: de elevene som leser stoffet før timen får høyere karakterer.

Angi signifikansnivået for å bestemme hvor mye datadistribusjonen må avvike fra normalen før det kan betraktes som et signifikant resultat. Signifikansnivå (også kaltα (\displaystyle \alpha )
- -nivå) er terskelen du definerer for statistisk signifikans. Hvis P-verdien er mindre enn eller lik signifikansnivået, anses dataene som statistisk signifikante. Signifikansnivå (også kalt Som regel er signifikansnivået (verdi ) tas lik 0,05, og i dette tilfellet er sannsynligheten for å oppdage en tilfeldig forskjell mellom forskjellige sett
- data er bare 5 %. Jo høyere grad av betydning (og følgelig, mindre P-verdi
- ), jo mer pålitelige resultatene.
- Hvis du vil ha mer pålitelige resultater, senk P-verdien til 0,01. Vanligvis brukes lavere P-verdier i produksjonen når det er nødvendig å identifisere defekter i produkter. I dette tilfellet kreves høy pålitelighet for å være sikker på at alle deler fungerer som forventet.
For de fleste hypoteseeksperimenter er et signifikansnivå på 0,05 tilstrekkelig. Bestem hvilket kriterium du vil bruke: ensidig eller tosidig. En av forutsetningene i Student t-testen er at dataene er normalfordelt. Normalfordelingen er en klokkeformet kurve med maksimalt antall resultater i midten av kurven. Elevens t-test er matematisk metode datasjekk, som lar deg finne ut om dataene faller utenfor grensene normalfordeling
- (mer, mindre eller i "halene" av kurven).
- Hvis du ikke er sikker på om dataene er over eller under kontrollgruppeverdiene, bruk en tosidig test. Dette vil tillate deg å bestemme betydningen i begge retninger.
Hvis du vet i hvilken retning dataene kan falle utenfor normalfordelingen, bruk en ensidig test. I eksemplet ovenfor forventer vi at elevenes karakterer øker, så en ensidig test kan brukes. Bestem prøvestørrelsen ved hjelp av statistisk styrke. Den statistiske kraften til en studie er sannsynligheten for at prøver vil gi det forventede resultatet. En vanlig effektterskel (eller β) er 80 %. Å analysere statistisk kraft uten noen forutgående data kan være utfordrende fordi det krever litt informasjon om de forventede middelverdiene i hver gruppe data og deres standardavvik. Bruk en nettbasert strømanalysekalkulator for å bestemme den optimale prøvestørrelsen for dataene dine.
- Vanligvis utfører forskere en liten pilotstudie som gir data for statistisk kraftanalyse og bestemmer prøvestørrelsen som trengs for en større, mer fullstendig studie.
- Hvis du ikke klarer å gjennomføre en pilotstudie, prøv å estimere mulige gjennomsnitt basert på litteraturen og andres resultater. Dette kan hjelpe deg med å finne den optimale prøvestørrelsen.
Del 2
Kalkulere standardavvik
1. Skriv ned formelen for standardavvik. Standardavviket viser hvor stor spredning det er i dataene. Den lar deg konkludere med hvor nære dataene som er hentet fra en bestemt prøve er. Ved første øyekast virker formelen ganske komplisert, men forklaringene nedenfor vil hjelpe deg å forstå den. Formelen har neste visning: s = √∑((x i – µ) 2 /(N – 1)).
  - s - standardavvik;
  - tegnet ∑ indikerer at alle data innhentet fra prøven skal legges til;
  - x i tilsvarer den i-te verdien, det vil si et separat resultat oppnådd;
  - µ er gjennomsnittsverdien for en gitt gruppe;
  - N- totalt antall data i prøven.
2. Finn gjennomsnittet i hver gruppe. For å beregne standardavviket må du først finne gjennomsnittet for hver studiegruppe. Middelverdien er angitt med den greske bokstaven µ (mu). For å finne gjennomsnittet legger du ganske enkelt sammen alle de resulterende verdiene og deler dem med mengden data (prøvestørrelse).
  - For eksempel å finne gjennomsnittlig vurdering I gruppen av de elevene som studerer materialet før timen, vurder et lite sett med data. For enkelhets skyld bruker vi et sett med fem punkter: 90, 91, 85, 83 og 94.
  - La oss legge alle verdiene sammen: 90 + 91 + 85 + 83 + 94 = 443.
  - La oss dele summen på antall verdier, N = 5: 443/5 = 88,6.
  - Dermed er gjennomsnittet for denne gruppen 88,6.
3. Trekk fra hver verdi oppnådd fra gjennomsnittet. Neste trinn er å beregne differansen (x i – µ). For å gjøre dette, trekk fra det funnet gjennomsnittlig størrelse hver verdi mottatt. I vårt eksempel må vi finne fem forskjeller:
  - (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) og (94 – 88,6).
  - Som et resultat får vi følgende verdier: 1,4, 2,4, -3,6, -5,6 og 5,4.
4. Kvadrer hver oppnådd verdi og legg dem sammen. Hver av mengdene som nettopp er funnet, skal kvadrateres. På dette trinnet vil alle forsvinne negative verdier. Hvis etter dette trinnet du vil ha litt til overs negative tall, som betyr at du glemte å sette dem i rute.
  - For vårt eksempel får vi 1,96, 5,76, 12,96, 31,36 og 29,16.
  - Vi legger sammen de resulterende verdiene: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
5. Del på prøvestørrelse minus 1. I formelen er summen delt på N – 1 på grunn av at vi ikke tar hensyn til befolkningen generelt, men tar et utvalg av alle elever til evaluering.
  - Trekk fra: N – 1 = 5 – 1 = 4
  - Divide: 81,2/4 = 20,3
6. Fjerne kvadratrot. Etter at du har delt summen med prøvestørrelsen minus én, tar du kvadratroten av verdien som er funnet. Dette er det siste trinnet i beregningen av standardavviket. Spise statistiske programmer, som, etter å ha lagt inn de første dataene, utfører alle nødvendige beregninger.
  - I vårt eksempel er standardavviket for karakterene til de elevene som leste stoffet før timen s =√20,3 = 4,51.
Del 3
Bestem betydning
1. Beregn variansen mellom de to gruppene med data. Før dette trinnet så vi på et eksempel for bare én gruppe data. Hvis du vil sammenligne to grupper, bør du selvsagt ta data fra begge gruppene. Beregn standardavviket for den andre gruppen med data, og finn deretter variansen mellom de to eksperimentelle gruppene. Variansen beregnes ved hjelp av følgende formel: s d = √((s 1 /N 1) + (s 2 /N 2)).

Folks aktiviteter involverer i mange tilfeller arbeid med data, og dette kan i sin tur innebære ikke bare å operere med dem, men også studere, bearbeide og analysere dem. For eksempel når du trenger å kondensere informasjon, finne noen relasjoner eller definere strukturer. Og bare for analyser i dette tilfellet er det veldig praktisk å bruke ikke bare, men også å bruke statistiske metoder.

Et trekk ved statistiske analysemetoder er deres kompleksitet, på grunn av mangfoldet av former for statistiske mønstre, samt kompleksiteten til prosessen statistisk forskning. Vi ønsker imidlertid å snakke om metoder som alle kan bruke, og gjøre det effektivt og med glede.

Statistisk forskning kan utføres ved hjelp av følgende metoder:

Statistisk observasjon;
Oppsummering og gruppering av materialer statistisk observasjon;
Absolutt og relativt statistiske mengder;
Variasjon serien;
Prøve;
Korrelasjon og regresjonsanalyse;
Dynamisk serie.

Statistisk observasjon

Statistisk observasjon er en planlagt, organisert og i de fleste tilfeller systematisk innsamling av informasjon, hovedsakelig rettet mot fenomener sosialt liv. Implementert denne metoden gjennom registrering av forhåndsbestemte mest slående trekk, hvis formål er å i ettertid få kjennetegn ved fenomenene som studeres.

Statistisk observasjon må utføres under hensyntagen til noen viktige krav:

Den må fullt ut dekke fenomenene som studeres;
Dataene som innhentes må være nøyaktige og pålitelige;
Dataene som innhentes bør være enhetlige og lett sammenlignbare.

Statistisk observasjon kan også ha to former:

Rapportering er en form for statistisk observasjon hvor informasjon leveres til spesifikke statistiske avdelinger av organisasjoner, institusjoner eller virksomheter. I dette tilfellet blir dataene lagt inn i spesialrapporter.
Spesielt organisert observasjon er en observasjon som er organisert for et bestemt formål, for å innhente informasjon som ikke er tilgjengelig i rapportene, eller for å klargjøre og fastslå påliteligheten til informasjonen i rapportene. Dette skjemaet inkluderer undersøkelser (for eksempel meningsmålinger), folketellinger osv.

I tillegg kan statistiske observasjoner kategoriseres basert på to egenskaper: enten arten av dataregistreringen eller dekningen av observasjonsenheter. Den første kategorien omfatter undersøkelser, dokumentasjon og direkte observasjon, og den andre kategorien omfatter kontinuerlig og ufullstendig observasjon, d.v.s. selektiv.

For å innhente data ved hjelp av statistisk observasjon kan man bruke metoder som spørreskjemaer, korrespondentaktiviteter, egenberegning (når observerte for eksempel selv fyller ut de relevante dokumentene), ekspedisjoner og rapportering.

Oppsummering og gruppering av statistisk observasjonsmateriale

Når vi snakker om den andre metoden, bør vi først og fremst snakke om sammendraget. Sammendrag representerer behandlingen av visse isolerte fakta, som utgjør det totale settet med data samlet inn under observasjon. Hvis sammendraget utføres riktig, kan en enorm mengde individuelle data om individuelle observasjonsobjekter bli til et helt kompleks av statistiske tabeller og resultater. Denne studien er også med på å fastslå fellestrekk og mønstre av fenomenene som studeres.

Tatt i betraktning indikatorene for nøyaktighet og studiedybde, kan en enkel og en kompleks oppsummering skilles, men hvilken som helst av dem bør være basert på spesifikke stadier:

En grupperingskarakteristikk er valgt;
Rekkefølgen på gruppedannelsen bestemmes;
Et system med indikatorer er under utvikling for å karakterisere gruppen og objektet eller fenomenet som helhet;
Tabelloppsett er under utvikling der oppsummeringsresultatene vil bli presentert.

Det er viktig å merke seg at det finnes forskjellige former rapporterer:

Sentralisert sammendrag som krever overføring av mottatt informasjon primærmateriale til et høyere senter for videre behandling;
Desentralisert oppsummering, hvor studiet av data skjer på flere stadier på en stigende måte.

Sammendraget kan utføres ved hjelp av spesialutstyr, for eksempel ved hjelp av dataprogramvare eller manuelt.

Når det gjelder gruppering, skilles denne prosessen ved å dele dataene som studeres i grupper i henhold til egenskaper. Funksjonene ved oppgavene som statistisk analyse utgjør, påvirker hva slags gruppering det vil være: typologisk, strukturell eller analytisk. Det er grunnen til at de, for å oppsummere og gruppere, enten tyr til tjenester fra høyt spesialiserte spesialister eller bruker.

Absolutte og relative statistiske størrelser

Absolutte verdier regnes som den aller første formen for presentasjon av statistiske data. Med dens hjelp er det mulig å gi dimensjonale egenskaper til fenomener, for eksempel i tid, i lengde, i volum, i areal, i masse, etc.

Hvis du vil vite om individuelle absolutte statistiske verdier, kan du ty til målinger, estimering, telling eller veiing. Og hvis du trenger å få totalvolumindikatorer, bør du bruke sammendrag og gruppering. Det må tas i betraktning at absolutte statistiske verdier er forskjellige i nærvær av måleenheter. Slike enheter inkluderer kostnad, arbeid og naturlig.

EN relative verdier uttrykke kvantitative forhold angående fenomener i det sosiale livet. For å få dem deles alltid noen mengder med andre. Indikatoren den sammenlignes med (dette er nevneren) kalles sammenligningsgrunnlaget, og indikatoren den sammenlignes med (dette er telleren) kalles rapporteringsverdien.

Relative verdier kan være forskjellige, avhengig av innholdet. For eksempel er det sammenligningsverdier, utviklingsnivåverdier, intensitetsverdier spesifikk prosess, størrelse på koordinasjon, struktur, dynamikk, etc. osv.

For å studere en populasjon basert på differensierende egenskaper, bruker statistisk analyse gjennomsnittsverdier – oppsummerer de kvalitative egenskapene til et sett med homogene fenomener basert på en eller annen differensierende egenskap.

Ekstremt viktig eiendom gjennomsnittsverdier er at de snakker om verdiene til spesifikke funksjoner i hele komplekset som et enkelt tall. Til tross for at enkeltenheter kan oppleve kvantitativ forskjell, uttrykke gjennomsnittsverdier generelle verdier, karakteristisk for alle enhetene i komplekset som studeres. Det viser seg at ved å bruke egenskapene til én ting, kan man få egenskapene til helheten.

Det bør huskes at en av de mest viktige forhold bruke gjennomsnitt når du utfører statistisk analyse sosiale fenomener, homogeniteten til komplekset deres vurderes, som du må finne ut gjennomsnittsverdien for. Og formelen for å bestemme den vil avhenge av nøyaktig hvordan de første dataene for å beregne gjennomsnittsverdien vil bli presentert.

Variasjonsserie

I noen tilfeller kan det hende at data om gjennomsnittsindikatorene for visse studerte mengder ikke er nok til å behandle, evaluere og i dybden analysere et fenomen eller en prosess. Deretter bør man ta hensyn til variasjonen eller spredningen av indikatorene til individuelle enheter, som også representerer viktig egenskap befolkning under utredning.

På individuelle verdier mengder kan påvirkes av mange faktorer, og fenomenene eller prosessene som studeres i seg selv kan være svært forskjellige, dvs. har variasjon (denne varianten er variasjonsserier), årsakene til dette bør søkes i essensen av det som studeres.

Ovennevnte absolutte verdier er direkte avhengige av måleenhetene for egenskaper, noe som betyr at de gjør prosessen med å studere, evaluere og sammenligne to eller flere variantserie mer kompleks. EN relative indikatorer må beregnes som et forhold mellom absolutte og gjennomsnittlige indikatorer.

Prøve

Betydning prøvetakingsmetode(eller mer enkelt - samples) er at egenskapene til en del brukes til å bestemme numeriske egenskaper hele (dette kalles generell befolkning). Hovedprøvemetoden er den interne sammenhengen som forener delene og helheten, det individuelle og det generelle.

Prøvetakingsmetoden har en rekke betydelige fordeler fremfor andre, fordi Takket være reduksjonen i antall observasjoner, lar det deg redusere mengden arbeid, penger og innsats brukt, samt lykkes med å skaffe data om slike prosesser og fenomener der det enten er upraktisk eller rett og slett umulig å studere dem fullstendig.

Korrespondansen mellom egenskapene til prøven og egenskapene til fenomenet eller prosessen som studeres vil avhenge av et sett med forhold, og først og fremst av hvordan prøvetakingsmetoden vil bli implementert i praksis. Dette kan enten være et systematisk utvalg, etter et utarbeidet opplegg, eller uplanlagt, når utvalget er tatt fra den generelle populasjonen.

Men i alle tilfeller må prøvetakingsmetoden være typisk og oppfylle kriteriene for objektivitet. Disse kravene må alltid oppfylles, fordi samsvaret mellom egenskapene til metoden og egenskapene til det som analyseres statistisk vil avhenge av dem.

Derfor, før du behandler prøvemateriale, er det nødvendig å sjekke det grundig, og dermed bli kvitt alt unødvendig og uviktig. Samtidig, når du kompilerer en prøve, er det viktig å unngå amatøraktiviteter. Dette betyr at du ikke i noe tilfelle skal velge bare de alternativene som virker typiske og forkaste alle andre.

Et effektivt utvalg av høy kvalitet må velges objektivt, d.v.s. den må utføres på en slik måte at enhver subjektiv påvirkning og partiske motiver utelukkes. Og for at denne betingelsen skal oppfylles på riktig måte, er det nødvendig å ty til prinsippet om randomisering eller, enklere, til prinsippet om tilfeldig utvalg av alternativer fra hele befolkningen.

Det presenterte prinsippet tjener som grunnlag for teorien om prøvetakingsmetoden, og det må følges når det er nødvendig for å skape en effektiv utvalgspopulasjon, og tilfeller av systematisk seleksjon er intet unntak her.

Korrelasjons- og regresjonsanalyse

Korrelasjonsanalyse og regresjonsanalyse er to svært effektive metoder som lar deg analysere store mengder data for å studere mulig forhold mellom to eller flere indikatorer.

I tilfelle av korrelasjonsanalyse oppgavene er:

Måle nærheten av den eksisterende sammenhengen mellom differensierende egenskaper;
Identifisere ukjente årsakssammenhenger;
Vurder faktorene som påvirker den endelige egenskapen mest.

Og når det gjelder regresjonsanalyse, er oppgavene som følger:

Bestem kommunikasjonsformen;
Etablere graden av påvirkning av uavhengige indikatorer på den avhengige;
Bestem de beregnede verdiene til den avhengige indikatoren.

For å løse alle de ovennevnte problemene er det nesten alltid nødvendig å bruke både korrelasjons- og regresjonsanalyse i kombinasjon.

Dynamics-serien

Ved å bruke denne metoden for statistisk analyse er det veldig praktisk å bestemme intensiteten eller hastigheten som fenomener utvikler seg med, finne trenden for deres utvikling, fremheve svingninger, sammenligne utviklingsdynamikken og finne forholdet mellom fenomener som utvikler seg over tid.

En dynamikkserie er en serie der, med tiden, statistiske indikatorer, endringer som karakteriserer utviklingsprosessen til objektet eller fenomenet som studeres.

Dynamics-serien inkluderer to komponenter:

Perioden eller tidspunktet knyttet til tilgjengelige data;
Nivå eller statistisk indikator.

Til sammen representerer disse komponentene to ledd i en tidsserie, der det første leddet (tidsperiode) er merket med bokstaven "t", og det andre (nivå) med bokstaven "y".

Basert på varigheten av tidsintervallene som nivåene er sammenkoblet med, kan dynamikkserien være momentan og intervall. Intervallserier lar deg legge til nivåer for å få total verdi perioder som følger etter hverandre, men i øyeblikkelige perioder er det ingen slik mulighet, men dette er ikke påkrevd der.

Tidsserier eksisterer også med like og forskjellige intervaller. Essensen av intervaller i øyeblikk og intervallserier er alltid forskjellig. I det første tilfellet er intervallet tidsintervallet mellom datoene som dataene for analyse er knyttet til (det er praktisk å bruke en slik serie, for eksempel for å bestemme antall handlinger per måned, år osv.). Og i det andre tilfellet, en tidsperiode som et sett med generaliserte data er knyttet til (en slik serie kan brukes til å bestemme kvaliteten på de samme handlingene for en måned, et år osv.). Intervallene kan være like eller forskjellige, uavhengig av serietype.

Naturligvis, for å lære å anvende hver av metodene for statistisk analyse kompetent, er det ikke nok bare å vite om dem, for faktisk er statistikk en hel vitenskap som også krever visse ferdigheter og evner. Men for å gjøre det enklere, kan og bør du trene opp tenkningen og...

Ellers er forskning, vurdering, bearbeiding og analyse av informasjon svært interessante prosesser. Og selv i tilfeller der dette ikke fører til noe spesifikt resultat, kan mange interessante ting læres i løpet av forskningen. Statistisk analyse har funnet sin anvendelse i et stort antall områder av menneskelig aktivitet, og du kan bruke det i studier, arbeid, forretninger og andre områder, inkludert barns utvikling og selvopplæring.

En hel rekke vitenskaper brukes for å skaffe data om samfunnets tilstand. En av dem er statistikk. Hva er hun?

Hva er statistikk?

Dette er navnet gitt til grenen av kunnskap hvor generelle spørsmål om innsamling, måling og analyse av massedata (kvantitative eller kvalitative). Statistikk tar også for seg studiet av den kvantitative siden av sosialt massefenomener når det gjelder deres numeriske form. Skjer gitt ord fra den latinske statusen, som betyr "tilstand". I utgangspunktet denne vitenskapen kalt "Statsstudier".

Begrepet "statistikk" ble først brukt i 1746, og dette øyeblikket markerte begynnelsen på slikt akademisk disiplin og vitenskap. Riktignok kan det ikke sies at dens direkte bruk begynte med dette, siden opptak, måling og analyse av data ble utført mye tidligere. En viktig parameter er mote. Du kan huske noe lignende fra geometri, men det er ikke helt det samme. Men i statistikk? Dette er navnet på verdien fra en lineær serie som forekommer oftest.

Eksempler

La oss snakke om noe som er nærmere virkeligheten. Hva er nettsidestatistikk? Denne parameteren kan være antall brukere som har besøkt ressursen og hatt muligheten til å gjøre seg kjent med innholdet. Riktignok vil det fra dette synspunkt være vanskelig å svare på spørsmålet om hva VKontakte-statistikk er.

Informasjon samles ikke inn separat for hver side. Men antall brukere som logger på per dag, måned – generelt sett, telles konstant. Dette er svaret på spørsmålet om hva statistikk er i praksis innen informasjonsteknologi.

Typer gruppering

Innenfor vitenskapelig disiplin dele en befolkning inn i separate grupper, som er homogene i en viss henseende. For å beregne antall intervaller når det ikke er klare grenser, brukes Sturges-formelen ofte:

CHI=1+3,322*lg CHN, hvor

NHI - antall integraler;
Lg - logaritme;
CN - antall observasjoner.

Avhengig av målene skilles tre typer grupperinger:

En typisk gruppe bør strebe etter å være så forskjellig som mulig fra andre og å være så lik i seg selv som mulig. De er primære og sekundære. De første dannes i løpet av Sekundære fraksjoner gjøre basert på mottatte data.

Klassifisering av statistiske metoder

De har funnet søknaden sin nesten overalt. Derfor er det logisk å anta at det ikke finnes noe universelt verktøy. Avhengig av spesifisiteten og fordypningen i spesifikke problemer, skilles følgende dataanalyser ut:

Verktøyutvikling og forskning generelt formål, som ikke tar hensyn til spesifikasjonene til bruksområdet.
Opprettelse og bruk statistiske modeller et eller annet reelt fenomen eller prosess i et bestemt aktivitetsfelt.
Utvikle og bruke metoder og verktøy for å analysere spesifikke data for å løse anvendte problemer.

Anvendt statistikk

Denne grenen av vitenskapen omhandler behandling av data av vilkårlig natur. Som matematisk grunnlag Anvendt statistikk og dens analysemetoder inkluderer sannsynlighetsteori. Det hele starter med en beskrivelse av typen data som er oppnådd, samt mekanismen for opprinnelsen. For dette formålet brukes sannsynlige og deterministiske metoder. Sistnevnte kan bare brukes i tilfeller hvor forskeren har tilstrekkelige data til rådighet (for eksempel rapporter offentlige etater statistikk som er basert på informasjon gitt av foretak). Men det oppnådde resultatet kan overføres til en større skala og utsiktene kan vurderes utelukkende ved hjelp av

I den enkleste situasjonen fungerer de tilgjengelige dataene som verdien av et bestemt trekk som er karakteristisk for objektet som studeres. Parametrene her kan være kvantitative eller veiledende (avhengig av kategorien de tilhører). Det andre alternativet sier vanligvis kvalitative egenskaper. Hva om du tar flere av dem? Eller legge til kvantitative? Da kan vi si at objektvektoren er oppnådd. Han regnes som en ny Pri storstilt forskning prøver er sammensatt av flere sett med vektorer. Det er viktig å avklare og dobbeltsjekke informasjonen som mottas. Dette gjøres ved hjelp av resampling.

Konklusjon

Som du kan se, lar statistikk deg strukturere betydelige datamengder som er nødvendige for å kunne gi informasjon om tingenes tilstand på enkelte områder. Så, viktig rolle det spiller en rolle for investorer fordi det gir en mulighet til å observere dynamikken i veksten i statlige økonomier. Statistikk er av interesse for både innbyggere og myndigheter, og forteller dem om prosessene i landet: demografisk vekst eller en krise, en økning i velvære eller dens nedgang, og så videre.