Biografije Karakteristike Analiza

Statističke metode za analizu naučnih podataka. Statističke metode - šta su to? Primjena statističkih metoda

FEDERALNA AGENCIJA ZA OBRAZOVANJE

DRŽAVNA OBRAZOVNA USTANOVA

VISOKO STRUČNO OBRAZOVANJE

"JUGRA DRŽAVNI UNIVERZITET"

ZAVOD ZA DODATNO OBRAZOVANJE

PROGRAM STRUČNE PREOBRADE

"DRŽAVNO I OPŠTINSKO UPRAVLJANJE"

SAŽETAK

Disciplina: "Statistika"

"Statističke metode istraživanja"

Izvedeno:

Hanti-Mansijsk

Uvod

1. Metode statističkog istraživanja.

1.1. Metoda statističkog posmatranja

1.4. Varijacijska serija

1.5. Metoda uzorkovanja

1.6. Korelaciona i regresiona analiza

1.7. Serija Dynamics

1.8. Statistički indeksi

Zaključak

Spisak korišćene literature


Potpuna i pouzdana statistička informacija neophodna je osnova na kojoj se zasniva proces ekonomskog upravljanja. Sve informacije od nacionalnog ekonomskog značaja se na kraju obrađuju i analiziraju pomoću statistike.

Upravo statistički podaci omogućavaju određivanje obima bruto domaćeg proizvoda i nacionalnog dohotka, identifikaciju glavnih trendova u razvoju privrednih sektora, procjenu nivoa inflacije, analizu stanja finansijskih i robnih tržišta, proučavanje standarda život stanovništva i druge društveno-ekonomske pojave i procese. Ovladavanje statističkom metodologijom jedan je od uslova za razumijevanje tržišnih uslova, proučavanje trendova i predviđanja, te donošenje optimalnih odluka na svim nivoima djelatnosti.

Statistička nauka je grana znanja koja proučava pojave društvenog života sa njihove kvantitativne strane u neraskidivoj vezi sa njihovim kvalitativnim sadržajem u specifičnim uslovima mesta i vremena. Statistička praksa je djelatnost prikupljanja, akumuliranja, obrade i analize digitalnih podataka koji karakterišu sve pojave u životu društva.

Govoreći o statistici, treba imati na umu da brojke u statistici nisu apstraktne, već izražavaju duboko ekonomsko značenje. Svaki ekonomista mora biti sposoban koristiti statističke brojke, analizirati ih i biti u stanju da ih koristi da potkrijepi svoje zaključke.

Statistički zakoni djeluju u vremenu i mjestu na kojem se nalaze.

Svijet oko nas sastoji se od masovnih pojava. Ako jedna činjenica zavisi od zakona slučajnosti, onda se masa pojava pokorava zakonima. Za otkrivanje ovih obrazaca koristi se zakon velikih brojeva.

Za dobijanje statističkih informacija, državni i resorni organi za statistiku, kao i komercijalne strukture, sprovode različite vrste statističkih istraživanja. Proces statističkog istraživanja obuhvata tri glavne faze: prikupljanje podataka, njihovo sumiranje i grupisanje, analizu i izračunavanje opštih indikatora.

Od toga kako se prikuplja primarni statistički materijal, kako se obrađuje i grupiše, umnogome zavise rezultati i kvalitet cjelokupnog naknadnog rada, a u konačnici, ako se prekrši, može dovesti do potpuno pogrešnih zaključaka.

Završna, analitička faza studije je složena, dugotrajna i odgovorna. U ovoj fazi izračunavaju se prosječni pokazatelji i indikatori distribucije, analizira se struktura stanovništva i proučavaju dinamika i odnosi između pojava i procesa koji se proučavaju.

U svim fazama istraživanja statistika koristi različite metode. Statističke metode su posebne metode i metode za proučavanje masovnih društvenih pojava.

U prvoj fazi studije koriste se metode masovnog posmatranja i prikuplja se primarni statistički materijal. Glavni uslov je masovno učešće, jer obrasci društvenog života se manifestuju u dovoljno velikom nizu podataka usled dejstva zakona velikih brojeva, tj. u zbirnim statističkim karakteristikama, slučajnost se poništava.

U drugoj fazi istraživanja, kada se prikupljene informacije podvrgavaju statističkoj obradi, koristi se metod grupisanja. Upotreba metode grupisanja zahtijeva neizostavan uslov - kvalitativnu homogenost populacije.

U trećoj fazi studije statističke informacije se analiziraju korištenjem metoda kao što su metoda općih indikatora, tabelarne i grafičke metode, metode procjene varijacije, bilansna metoda i indeksna metoda.

Analitički rad treba da sadrži elemente predviđanja i ukaže na moguće posljedice nastalih situacija.

Upravljanje statistikom u zemlji vrši Državni komitet za statistiku Ruske Federacije. Kao savezni organ izvršne vlasti, vrši opšte upravljanje statistikom u zemlji, daje zvanične statističke informacije predsedniku, Vladi, Saveznoj skupštini, saveznim izvršnim organima, javnim i međunarodnim organizacijama, razvija statističku metodologiju, koordinira statističke aktivnosti savezne države. i regionalne izvršne organizacije, te vrši analizu ekonomskih i statističkih informacija, sastavlja nacionalne račune i izrađuje bilansne obračune.

Sistem statističkih tijela u Ruskoj Federaciji formiran je u skladu sa administrativno-teritorijalnom podjelom zemlje. U republikama koje su u sastavu Ruske Federacije postoje republički komiteti. Postoje državni komiteti za statistiku u autonomnim okruzima, teritorijama, regionima, Moskvi i Sankt Peterburgu.

U okruzima (gradovima) - odjeli (odjeljenja) državne statistike. Pored državne statistike, postoji i resorna statistika (u preduzećima, odeljenjima, ministarstvima). On obezbjeđuje interne potrebe za statističkim informacijama.

Svrha ovog rada je razmatranje statističkih metoda istraživanja.

1. Metode statističkog istraživanja

Postoji bliska veza između nauke o statistici i prakse: statistika koristi podatke iz prakse, generalizuje i razvija metode za sprovođenje statističkih istraživanja. Zauzvrat, u praktičnim aktivnostima, teorijski principi statističke nauke primjenjuju se za rješavanje specifičnih problema upravljanja. Poznavanje statistike neophodno je savremenom specijalistu za donošenje odluka u stohastičkim uslovima (kada su analizirane pojave podložne uticaju slučajnosti), za analizu elemenata tržišne ekonomije, za prikupljanje informacija u vezi sa povećanjem broja poslovne jedinice i njihove vrste, revizija, finansijsko upravljanje i predviđanje.

Za proučavanje predmeta statistike razvijene su i primijenjene specifične tehnike, čija kombinacija čini metodologiju statistike (metode masovnih opservacija, grupisanja, opći indikatori, vremenske serije, indeksna metoda itd.). Upotreba specifičnih metoda u statistici je unaprijed određena postavljenim zadacima i ovisi o prirodi izvorne informacije. Istovremeno, statistika se zasniva na dijalektičkim kategorijama kao što su kvantitet i kvalitet, nužnost i slučajnost, uzročnost, pravilnost, pojedinačno i masovno, pojedinačno i opšte. Statističke metode se koriste sveobuhvatno (sistematski). To je zbog složenosti procesa ekonomskog i statističkog istraživanja, koji se sastoji od tri glavne faze: prva je prikupljanje primarnih statističkih informacija; drugi - statistički sažetak i obrada primarnih informacija; treći je generalizacija i interpretacija statističkih informacija.

Opća metodologija za proučavanje statističkih populacija je korištenje osnovnih principa koji vode svaku nauku. Ovi principi, kao neka vrsta principa, uključuju sljedeće:

1. objektivnost pojava i procesa koji se proučavaju;

2. utvrđivanje odnosa i konzistentnosti u kojima se manifestuje sadržaj faktora koji se proučavaju;

3. postavljanje ciljeva, tj. postizanje postavljenih ciljeva od strane istraživača koji proučava relevantne statističke podatke.

To se izražava u dobijanju informacija o trendovima, obrascima i mogućim posljedicama razvoja procesa koji se proučavaju. Poznavanje obrazaca razvoja društveno-ekonomskih procesa koji interesuju društvo od velikog je praktičnog značaja.

Karakteristike statističke analize podataka uključuju metod masovnog posmatranja, naučnu validnost kvalitativnog sadržaja grupisanja i njegovih rezultata, proračun i analizu generalizovanih i generalizirajućih pokazatelja objekata koji se proučavaju.

Što se tiče specifičnih metoda ekonomske, industrijske ili statistike kulture, stanovništva, nacionalnog bogatstva itd., mogu postojati specifične metode za prikupljanje, grupisanje i analizu odgovarajućih agregata (zbir činjenica).

U ekonomskoj statistici, na primjer, bilansna metoda se široko koristi kao najčešća metoda međusobnog povezivanja pojedinačnih indikatora u jedinstveni sistem ekonomskih odnosa u društvenoj proizvodnji. Metode koje se koriste u ekonomskoj statistici uključuju i sastavljanje grupisanja, izračunavanje relativnih pokazatelja (procenta), poređenja, izračunavanje različitih vrsta prosjeka, indeksa itd.

Metoda veznih karika sastoji se u tome da dvije volumetrijske, tj. kvantitativni pokazatelji se upoređuju na osnovu odnosa koji postoji između njih. Na primjer, produktivnost rada u fizičkom smislu i odrađenim satima, ili obim transporta u tonama i prosječna udaljenost transporta u km.

Prilikom analize dinamike nacionalnog ekonomskog razvoja, glavni metod za identifikaciju ove dinamike (kretanja) je metod indeksa, metode analize vremenskih serija.

U statističkoj analizi osnovnih ekonomskih obrazaca nacionalnog ekonomskog razvoja, važan statistički metod je izračunavanje bliskosti veza između indikatora korišćenjem korelacione i disperzione analize itd.

Pored navedenih metoda, raširene su matematičke i statističke metode istraživanja, koje se šire kako se obim upotrebe računara pomera i stvaranjem automatizovanih sistema.

Faze statističkog istraživanja:

1. Statističko posmatranje je masovno naučno organizovano prikupljanje primarnih informacija o pojedinačnim jedinicama fenomena koji se proučava.

2. Grupisanje i sažetak materijala – generalizacija podataka posmatranja radi dobijanja apsolutnih vrednosti (računovodstvenih i evaluacionih indikatora) pojave.

3. Obrada statističkih podataka i analiza rezultata radi dobijanja utemeljenih zaključaka o stanju fenomena koji se proučava i obrascima njegovog razvoja.

Sve faze statističkog istraživanja usko su povezane jedna s drugom i podjednako su važne. Nedostaci i greške koje se javljaju u svakoj fazi utiču na cjelokupnu studiju u cjelini. Stoga, ispravna upotreba posebnih metoda statističke nauke u svakoj fazi omogućava vam da dobijete pouzdane informacije kao rezultat statističkog istraživanja.

Metode statističkog istraživanja:

1. Statističko posmatranje

2. Sažetak i grupisanje podataka

3. Obračun opštih pokazatelja (apsolutne, relativne i prosječne vrijednosti)

4. Statističke distribucije (serija varijacija)

5. Metoda uzorkovanja

6. Korelaciona i regresiona analiza

7. Serija Dynamics

Zadatak statistike je izračunavanje statističkih pokazatelja i njihova analiza, zahvaljujući kojoj organi upravljanja dobijaju sveobuhvatan opis objekta kojim se upravlja, bilo da se radi o cjelokupnoj nacionalnoj ekonomiji ili njenim pojedinačnim sektorima, preduzećima i njihovim odjeljenjima. Nemoguće je upravljati socio-ekonomskim sistemima bez posedovanja brzih, pouzdanih i potpunih statističkih informacija.


Statističko posmatranje- je plansko, naučno organizovano i po pravilu sistematsko prikupljanje podataka o pojavama društvenog života. Provodi se registracijom unaprijed određenih bitnih karakteristika kako bi se dobile dalje generalizirajuće karakteristike ovih pojava.

Na primjer, prilikom popisa stanovništva evidentiraju se podaci o svakom stanovniku zemlje o njegovom spolu, starosti, bračnom statusu, obrazovanju itd., a zatim na osnovu tih podataka statistički organi utvrđuju broj stanovnika zemlje, njegovu starosnu strukturu, rasprostranjenost u cijeloj zemlji, sastav porodice i druge pokazatelje.

Statističkom posmatranju postavljaju se sljedeći zahtjevi: potpunost obuhvata populacije koja se proučava, pouzdanost i tačnost podataka, njihova ujednačenost i uporedivost.

Oblici, vrste i metode statističkog posmatranja

Statističko posmatranje se sprovodi u dva oblika: izveštajno i posebno organizovano statističko posmatranje.

Izvještavanje je organizacioni oblik statističkog posmatranja u kojem statistički organi primaju informacije od preduzeća, ustanova i organizacija u obliku obaveznih izvještaja o njihovim aktivnostima.

Izvještavanje može biti nacionalno i unutarresorno.

Nacionalni - ide do viših organa i državnih organa za statistiku. Neophodan je za potrebe generalizacije, kontrole, analize i predviđanja.

Unutarresorni - koristi se u ministarstvima i odjeljenjima za operativne potrebe.

Izvještavanje odobrava Državni komitet za statistiku Ruske Federacije. Izvještavanje se priprema na osnovu primarnog računovodstva. Posebnost izvještavanja je u tome što je obavezno, dokumentovano i pravno potvrđeno potpisom rukovodioca.

Posebno organizovano statističko posmatranje- opservacija organizovana u neke posebne svrhe radi dobijanja informacija koje nisu u izvještaju, odnosno radi provjere i pojašnjenja izvještajnih podataka. Ovo je popis stanovništva, stoke, opreme, svih vrsta jednokratnih evidencija. Kao što su ankete o kućnom budžetu, istraživanja javnog mnijenja, itd.

Vrste statističkog posmatranja mogu se grupisati prema dvije karakteristike: po prirodi registracije činjenica i po obuhvatu jedinica stanovništva.

Po prirodi registraciječinjenice, statističko posmatranje može biti: struja ili sistematski i diskontinuirano .

Tekuće praćenje je kontinuirano obračunavanje npr. proizvodnje proizvoda, puštanja materijala iz skladišta i sl., tj. registracija se vrši kako se to dogodi.

Kontinuirano posmatranje može biti periodično, tj. ponavljanje u određenim intervalima. Na primjer, popis stoke 1. januara ili registracija tržišnih cijena 22. u mjesecu. Jednokratno posmatranje se organizuje po potrebi, tj. bez posmatranja periodičnosti ili čak jednom. Na primjer, proučavanje javnog mnijenja.

Po obuhvatu jedinica stanovništva posmatranje može biti kontinuirano ili nepotpuno.

At potpuno Posmatranju su sve jedinice u populaciji. Na primjer, popis stanovništva.

At nije kontinuirano Tokom opservacije ispituje se dio populacijskih jedinica. Nekontinuirano posmatranje se može podijeliti na podvrste: selektivno, monografsko, metoda glavnog niza.

Selektivno posmatranje je opservacija zasnovana na principu slučajnog odabira. Kada se pravilno organizuje i sprovede, posmatranje uzorka daje prilično pouzdane podatke o populaciji koja se proučava. U nekim slučajevima može zamijeniti kontinuirano računovodstvo, jer Rezultati posmatranja uzorka mogu se proširiti na cijelu populaciju sa vrlo izvjesnom vjerovatnoćom. Na primjer, kontrola kvaliteta proizvoda, proučavanje produktivnosti stoke, itd. U tržišnoj ekonomiji širi se opseg primjene posmatranja uzorka.

Monografsko posmatranje- ovo je detaljna, dubina studija i opis jedinica stanovništva koje su u nekom pogledu karakteristične. Provodi se s ciljem identifikovanja postojećih i novonastalih trendova u razvoju fenomena (prepoznavanje nedostataka, proučavanje najboljih praksi, novih oblika organizacije itd.)

Metoda glavnog niza leži u činjenici da se ispituju najveće jedinice koje zajedno imaju dominantan udio u agregatu prema glavnoj osobini (karakteristikama) za ovo istraživanje. Dakle, prilikom proučavanja rada pijaca u gradovima, ispituju se tržišta velikih gradova na kojima živi 50% ukupnog stanovništva, a promet na tržištu iznosi 60% ukupnog prometa.

Prema izvoru informacija razliku između direktnog posmatranja, dokumentarnog i anketnog.

Direktno je zapažanje u kojem sami registratori mjerenjem, vaganjem ili prebrojavanjem utvrđuju činjenicu i upisuju je u obrazac (obrazac) zapažanja.

Dokumentarac- uključuje evidentiranje odgovora na osnovu relevantnih dokumenata.

Anketa- Ovo je zapažanje u kojem se bilježe odgovori na pitanja iz riječi sagovornika. Na primjer, popis stanovništva.

U statistici se informacije o fenomenu koji se proučava mogu prikupljati na različite načine: izvještavanje, ekspedicija, samoproračun, upitnik, dopisnik.

Essence izvještavanje metod je da se izvještaji dostavljaju na striktno obavezan način.

Ekspedicijski Metoda je da posebno uključeni i obučeni radnici zapisuju podatke u obrazac za posmatranje (popis stanovništva).

At samoproračun(samoregistraciju) popunjavaju sami ispitanici. Ova metoda se koristi, na primjer, u proučavanju migracije klatna (kretanje stanovništva od mjesta stanovanja do mjesta rada i nazad).

Upitnik metoda je prikupljanje statističkih podataka pomoću posebnih upitnika (upitnika) koji se šalju određenom krugu ljudi ili objavljuju u periodici. Ova metoda se vrlo široko koristi, posebno u raznim sociološkim istraživanjima. Međutim, ima veliki udio subjektivnosti.

Essence dopisnik Metoda se sastoji u tome da se statistički organi dogovaraju sa određenim licima (dobrovoljnim dopisnicima), koja preuzimaju obavezu da prate bilo koju pojavu u određenom vremenskom roku i o rezultatima izvješćuju statističke organe. Na primjer, vrše se stručne procjene o specifičnim pitanjima društveno-ekonomskog razvoja zemlje.

1.2. Sažetak i grupisanje materijala statističkih opservacija

Suština i ciljevi sumiranja i grupisanja

Sažetak- ovo je operacija za razradu specifičnih pojedinačnih činjenica koje čine skup i prikupljene kao rezultat posmatranja. Kao rezultat sažetka, mnogi pojedinačni indikatori koji se odnose na svaku jedinicu objekta posmatranja pretvaraju se u sistem statističkih tabela i rezultata, pojavljuju se tipične karakteristike i obrasci fenomena koji se proučava u cjelini.

Na osnovu dubine i tačnosti obrade, pravi se razlika između jednostavnih i složenih izvještaja.

Jednostavan sažetak je operacija za izračunavanje totala, tj. skupom jedinica za posmatranje.

Kompleksni sažetak- ovo je skup operacija koje uključuju grupisanje jedinica posmatranja, izračunavanje rezultata za svaku grupu i za objekat u cjelini, te formatiranje rezultata u obliku statističkih tabela.

Izvođenje sažetka uključuje sljedeće korake:

Izbor karakteristika grupisanja;

Određivanje redosleda formiranja grupe;

Razvoj sistema indikatora za karakterizaciju grupa i objekta u cjelini;

Razvijte rasporede tabela kako biste predstavili zbirne rezultate.

Prema obliku obrade rezime je:

Centralizirano (sav primarni materijal ide jednoj višoj organizaciji, na primjer, Državnom komitetu za statistiku Ruske Federacije, i tamo se potpuno obrađuje);

Decentralizovano (obrada prikupljenog materijala ide uzlaznom linijom, tj. materijal se sumira i grupiše u svakoj fazi).

U praksi se obično kombinuju oba oblika sumarne organizacije. Tako se, na primjer, tokom popisa dobijaju preliminarni rezultati na način decentralizovanog sažetka, a konsolidovani konačni rezultati se dobijaju kao rezultat centralizovanog razvoja popisnih obrazaca.

Prema tehnici izvođenja, sažetak može biti mehanizovan ili ručni.

Grupisanje naziva se podjela proučavane populacije na homogene grupe prema određenim bitnim karakteristikama.

Na osnovu metode grupisanja rješavaju se centralni problemi istraživanja i osigurava ispravna primjena ostalih metoda statističke i statističko-matematičke analize.

Posao sastavljanja grupa je složen i težak. Tehnike grupisanja su raznovrsne, što je posledica raznovrsnosti karakteristika grupisanja i različitih ciljeva istraživanja. Glavni zadaci koji se rješavaju uz pomoć grupiranja uključuju:

Identifikacija socio-ekonomskih tipova;

Proučavanje strukture stanovništva, strukturnih pomaka u njemu;

Identifikacija veza između pojava i međuzavisnosti.

Vrste grupa

U zavisnosti od zadataka koji se rešavaju uz pomoć grupisanja, razlikuju se 3 tipa grupisanja: tipološka, ​​strukturna i analitička.

Tipološko grupisanje rješava problem identifikacije socio-ekonomskih tipova. Prilikom konstruisanja grupacije ove vrste, glavnu pažnju treba posvetiti identifikaciji tipova i odabiru karakteristika grupisanja. U ovom slučaju oni polaze od suštine fenomena koji se proučava. (Tabela 2.3).

Strukturno grupisanje rješava problem proučavanja sastava pojedinih tipičnih grupa prema nekoj osobini. Na primjer, raspodjela rezidentnog stanovništva po starosnim grupama.

Analitičko grupisanje omogućava nam da identifikujemo odnose između pojava i njihovih znakova, tj. identificirati utjecaj nekih karakteristika (faktorskih) na druge (rezultativne). Odnos se očituje u činjenici da kako se faktorska karakteristika povećava, vrijednost rezultirajuće karakteristike raste ili opada. Analitičko grupisanje se uvijek zasniva na faktorijel znak, a svaka grupa je okarakterisana prosjek vrijednosti rezultantnog znaka.

Na primjer, ovisnost obima maloprodajnog prometa o veličini prodajnog prostora trgovine. Ovdje je faktor (grupiranje) atribut maloprodajni prostor, a rezultujući atribut je prosječan obim prometa po radnji.

U smislu složenosti, grupisanje može biti jednostavno ili složeno (kombinovano).

IN jednostavno grupisanje ima jednu karakteristiku u svojoj osnovi, i kompleks- dva ili više u kombinaciji (u kombinaciji). U ovom slučaju prvo se formiraju grupe prema jednoj (glavnoj) osobini, a zatim se svaka od njih dijeli na podgrupe prema drugoj osobini itd.

1.3. Apsolutne i relativne statističke veličine

Apsolutne statističke vrijednosti

Originalni, primarni oblik izražavanja za statističke pokazatelje su apsolutne vrijednosti. Apsolutne vrijednosti karakteriziraju veličinu pojava u mjerama mase, površine, zapremine, opsega, vremena itd.

Pojedinačni apsolutni indikatori se po pravilu dobijaju direktno u procesu posmatranja kao rezultat merenja, vaganja, brojanja i evaluacije. U nekim slučajevima, apsolutni individualni rezultati predstavljaju razlike.

Rezime, ukupni volumetrijski apsolutni indikatori se dobijaju kao rezultat sumiranja i grupisanja.

Apsolutni statistički pokazatelji su uvijek imenovani brojevi, tj. imaju mjerne jedinice. Postoje 3 vrste mjernih jedinica apsolutnih vrijednosti: prirodne, radne i troškovne.

Prirodne jedinice mjerenja - izražavaju veličinu neke pojave fizičkim mjerama, tj. mjere težine, zapremine, dužine, vremena, brojanja, tj. u kilogramima, kubnim metrima, kilometrima, satima, komadima itd.

Različite prirodne jedinice su uslovno prirodne mjerne jedinice, koji se koriste za spajanje nekoliko varijanti iste upotrebne vrijednosti. Jedan od njih se uzima kao standard, a ostali se pomoću posebnih koeficijenata preračunavaju u mjerne jedinice ovog standarda. Na primjer, sapuni s različitim sadržajem masnih kiselina pretvaraju se u 40% sadržaja masnih kiselina.

U nekim slučajevima jedna mjerna jedinica nije dovoljna za karakterizaciju fenomena, već se koristi proizvod dvije mjerne jedinice.

Primjer bi bio teretni promet u tonskim kilometrima, proizvodnja električne energije u kilovat-satima itd.

U tržišnoj ekonomiji najvažnije su troškovne (novčane) mjerne jedinice(rublja, dolar, marka, itd.). Oni vam omogućavaju da dobijete monetarnu procjenu bilo koje društveno-ekonomske pojave (obim proizvodnje, trgovinski promet, nacionalni dohodak, itd.). Međutim, treba imati na umu da u uslovima visoke stope inflacije, pokazatelji u monetarnom smislu postaju neuporedivi. Ovo treba uzeti u obzir prilikom analize indikatora troškova tokom vremena. Da bi se postigla uporedivost, indikatori se moraju preračunati u uporedive cijene.

Radne jedinice mjere(čovjek-sati, čovjek-dani) se koriste za određivanje troškova rada u proizvodnji proizvoda, obavljanju nekog posla itd.

Relativne statističke veličine, njihova suština i oblici izražavanja

Relativne vrijednosti u statistici se nazivaju veličine koje izražavaju kvantitativni odnos između pojava društvenog života. Dobivaju se dijeljenjem jedne količine drugom.

Vrijednost sa kojom se vrši poređenje (imenilac) naziva se baza, osnova poređenja; a onaj koji se upoređuje (numerator) naziva se upoređena, izvještajna ili trenutna vrijednost.

Relativna vrijednost pokazuje koliko je puta upoređena vrijednost veća ili manja od osnovne vrijednosti, ili koliki je udio prve u drugoj; au nekim slučajevima - koliko jedinica jedne količine je po jedinici (ili na 100, na 1000, itd.) druge (osnovne) količine.

Kao rezultat poređenja apsolutnih vrijednosti istog imena, dobijaju se apstraktne neimenovane relativne vrijednosti koje pokazuju koliko je puta data vrijednost veća ili manja od osnovne vrijednosti. U ovom slučaju, osnovna vrijednost se uzima kao jedan (rezultat je koeficijent).

Pored koeficijenta, široko se koristi oblik izražavanja relativnih vrijednosti interes(%). U ovom slučaju, osnovna vrijednost se uzima kao 100 jedinica.

Relativne vrijednosti mogu se izraziti u ppm (‰), u prodecimilu (0/000). U ovim slučajevima se uzima kao osnova poređenja 1.000, odnosno 10.000, au nekim slučajevima baza za poređenje se može uzeti kao 100.000.

Relativne vrijednosti se mogu nazvati brojevima. Njegov naziv je kombinacija naziva upoređenih i osnovnih indikatora. Na primjer, gustina naseljenosti ljudi/kv. km (koliko ljudi ima na 1 kvadratnom kilometru).

Vrste relativnih veličina

Vrste relativnih veličina dijele se ovisno o njihovom sadržaju. To su relativne vrijednosti: cilj plana, implementacija plana, dinamika, struktura, koordinacija, intenzitet i nivo ekonomskog razvoja, poređenje.

Relativna vrijednost planirani cilj predstavlja odnos vrijednosti indikatora utvrđenog za planski period i njegove vrijednosti ostvarene u planiranom periodu.

Relativna vrijednost implementacija plana je vrijednost koja izražava odnos između stvarnog i planiranog nivoa indikatora.

Relativna vrijednost zvučnici predstavlja omjer nivoa indikatora za dati period prema nivou istog indikatora u prošlosti.

Tri gore navedene relativne vrijednosti su međusobno povezane, odnosno: relativna vrijednost dinamike jednaka je proizvodu relativnih vrijednosti cilja plana i realizacije plana.

Relativna vrijednost strukture predstavlja omjer veličine dijela i cjeline. Karakterizira strukturu i sastav određenog agregata.

Iste procentualne vrijednosti se nazivaju specifična težina.

Relativna vrijednost koordinacija Oni nazivaju odnos između dijelova cjeline. Kao rezultat, dobijamo koliko je puta ovaj dio veći od osnovnog. Ili koliko je to posto ili koliko jedinica datog konstruktivnog dijela pripada 1 jedinici (100 ili 1000 itd. jedinica) osnovnog konstruktivnog dijela.

Relativna vrijednost intenzitet karakteriše razvoj fenomena ili procesa koji se proučava u drugom okruženju. Ovo je odnos dva međusobno povezana fenomena, ali različita. Može se izraziti u procentima, i u ppm, i prodecemilla, i imenovati. Vrsta vrijednosti relativnog intenziteta je indikator stepen ekonomskog razvoja, karakterizirajući proizvodnju po glavi stanovnika.

Relativna vrijednost poređenja predstavlja omjer istoimenih apsolutnih indikatora za različite objekte (preduzeća, okruzi, regije, države itd.). Može se izraziti ili kao koeficijenti ili u procentima.

Prosječne količine, njihova suština i vrste

Statistika, kao što znamo, proučava masovne društveno-ekonomske pojave. Svaki od ovih fenomena može imati različit kvantitativni izraz iste karakteristike. Na primjer, plate radnika iste profesije ili tržišne cijene za isti proizvod itd.

Za proučavanje bilo koje populacije prema različitim (kvantitativno promjenjivim) karakteristikama, statistika koristi prosječne vrijednosti.

prosječna vrijednost- je generalizirajuća kvantitativna karakteristika skupa sličnih pojava jedan po jedan različita osobina.

Najvažnije svojstvo prosječne vrijednosti je da ona jednim brojem predstavlja vrijednost određene karakteristike u cjelokupnoj populaciji, uprkos njenim kvantitativnim razlikama u pojedinim jedinicama populacije, i izražava ono što je zajedničko svim jedinicama populacije koja se proučava. . Dakle, kroz karakteristike jedinice populacije karakteriše cjelokupnu populaciju kao cjelinu.

Prosječne vrijednosti su povezane sa zakonom velikih brojeva. Suština ove veze je da se prilikom usrednjavanja slučajna odstupanja pojedinačnih vrednosti, usled zakona velikih brojeva, međusobno poništavaju i otkriva se prosečni trend razvoja, neophodnost, obrazac, međutim, za to se mora izračunati prosek. na osnovu generalizacije mase činjenica.

Prosječne vrijednosti vam omogućavaju da uporedite pokazatelje koji se odnose na populacije s različitim brojem jedinica.

Najvažniji uslov za naučnu upotrebu prosječnih vrijednosti u statističkoj analizi društvenih pojava je uniformnost stanovništva za koje se izračunava prosjek. Prosjek koji je identičan oblikom i tehnikom izračunavanja je u nekim uvjetima fiktivan (za heterogenu populaciju), dok u drugim (za homogenu populaciju) odgovara stvarnosti. Kvalitativna homogenost stanovništva utvrđuje se na osnovu sveobuhvatne teorijske analize suštine fenomena. Na primjer, prilikom izračunavanja prosječnog prinosa potrebno je da se početni podaci odnose na isti usjev (prosječan prinos pšenice) ili grupu usjeva (prosječan prinos zrna). Nemoguće je izračunati prosjek za heterogene usjeve.

Matematičke tehnike koje se koriste u različitim granama statistike direktno su povezane sa izračunavanjem prosjeka.

Prosjeci u društvenim pojavama imaju relativnu konstantnost, tj. tokom određenog vremenskog perioda, slične pojave karakterišu približno isti proseci.

Srednje vrijednosti su usko povezane s metodom grupiranja, jer Za karakterizaciju pojava potrebno je izračunati ne samo opšte (za čitav fenomen) prosjeke, već i grupne prosjeke (za tipične grupe ove pojave prema osobini koja se proučava).

Vrste prosjeka

Oblik u kojem se prikazuju početni podaci za izračunavanje prosječne vrijednosti ovisi o tome po kojoj će se formuli odrediti. Razmotrimo vrste prosjeka koji se najčešće koriste u statistici:

Aritmetička sredina;

Harmonična sredina;

Geometrijska sredina;

Srednji kvadrat.

1.4. Varijacijska serija

Suština i uzroci varijacije

Informacije o prosječnim nivoima proučavanih indikatora obično su nedovoljne za dubinsku analizu procesa ili fenomena koji se proučava.

Također je potrebno uzeti u obzir raspršenost ili varijaciju vrijednosti pojedinih jedinica, što je važna karakteristika populacije koja se proučava. Svaka pojedinačna vrijednost neke karakteristike formira se pod kombinovanim utjecajem mnogih faktora. Društveno-ekonomski fenomeni imaju tendenciju da pokazuju velike varijacije. Razlozi za ovu varijaciju sadržani su u suštini fenomena.

Indikatori varijacije određuju kako se vrijednosti neke karakteristike grupišu oko prosječne vrijednosti. Koriste se za karakterizaciju uređenih statističkih agregata: grupisanja, klasifikacija, serija distribucije. Najviše podložni varijacijama su cijene akcija, obim ponude i potražnje, te kamatne stope u različitim periodima i na različitim mjestima.

Apsolutni i relativni pokazatelji varijacije

Prema značenju definicije, varijacija se mjeri stepenom fluktuacije varijanti neke karakteristike od nivoa njihove prosječne vrijednosti, tj. kao razlika x-x. Većina indikatora koji se koriste u statistici za mjerenje varijacija u vrijednostima neke karakteristike u agregatu zasnivaju se na korištenju odstupanja od prosjeka.

Najjednostavnija apsolutna mjera varijacije je raspon varijacija R=xmax-xmin. Opseg varijacije je izražen u istim mjernim jedinicama kao i X. Zavisi samo od dvije ekstremne vrijednosti atributa i stoga ne karakterizira dovoljno varijabilnost atributa.

Apsolutni indeksi varijacije zavise od mjernih jedinica osobine i otežavaju poređenje dvije ili više različitih serija varijacija.

Mjere relativne varijacije izračunavaju se kao omjer različitih apsolutnih indikatora varijacije prema aritmetičkoj sredini. Najčešći od njih je koeficijent varijacije.

Koeficijent varijacije karakteriše varijabilnost karakteristike unutar prosjeka. Najbolje vrijednosti su do 10%, dobre do 50%, loše preko 50%. Ako koeficijent varijacije ne prelazi 33%, tada se populacija za razmatranu karakteristiku može smatrati homogenom.

1.5. Metoda uzorkovanja

Suština metode uzorkovanja je suditi prema svojstvima dijela (uzorka) numeričkim karakteristikama cjeline (generalne populacije), po odvojenim grupama varijanti njihove opće populacije, koja se ponekad smatra populacijom beskonačno velike volumen. Osnova metode uzorkovanja je unutrašnja veza koja postoji u populacijama između pojedinca i općeg, dijela i cjeline.

Metoda uzorkovanja ima očigledne prednosti u odnosu na kontinuirano proučavanje opšte populacije, jer smanjuje količinu posla (smanjenjem broja posmatranja), omogućava uštedu truda i novca i dobijanje informacija o takvim populacijama, kompletan pregled što je praktično nemoguće ili nepraktično.

Iskustvo je pokazalo da pravilno napravljen uzorak prilično dobro reprezentuje ili predstavlja (od lat. represento - predstavljam) strukturu i stanje opšte populacije. Međutim, u pravilu ne postoji potpuna podudarnost podataka uzorka sa podacima obrade opće populacije. To je nedostatak metode uzorkovanja, na čijoj pozadini su vidljive prednosti kontinuiranog opisa opće populacije.

S obzirom na nepotpunu refleksiju uzorka statističkih karakteristika (parametara) opšte populacije, pred istraživačem je važan zadatak: prvo, da uzme u obzir i da se pridržava uslova pod kojima uzorak najbolje predstavlja opštu populaciju, i drugo, u svakom konkretnom slučaju, utvrditi čime je moguće pouzdano prenijeti rezultate posmatranja uzorka na cijelu populaciju iz koje je uzorak uzet.

Reprezentativnost uzorka zavisi od niza uslova i, pre svega, od načina na koji se sprovodi, bilo sistematski (tj. prema unapred planiranoj šemi), bilo neplaniranim odabirom opcije iz opšte populacije. U svakom slučaju, uzorak bi trebao biti tipičan i potpuno objektivan. Ovi zahtjevi moraju biti striktno ispunjeni kao najbitniji uvjeti za reprezentativnost uzorka. Prije obrade uzorka materijala, on se mora pažljivo provjeriti i uzorak osloboditi svih nepotrebnih stvari koje narušavaju uvjete reprezentativnosti. U isto vrijeme, prilikom kreiranja uzorka, ne možete djelovati proizvoljno, uključiti u njegov sastav samo one opcije koje izgledaju tipično, a sve ostale odbaciti. Uzorak dobrog kvaliteta mora biti objektivan, odnosno izveden bez pristrasnosti, sa izuzetkom subjektivnih uticaja na njegov sastav. Ispunjenje ovog uslova reprezentativnosti zadovoljava princip randomizacije (od engleskog rendom-case), odnosno slučajnog odabira opcije iz opšte populacije.

Ovaj princip čini osnovu teorije metode uzorkovanja i mora se poštovati u svim slučajevima formiranja reprezentativne populacije uzorka, ne isključujući slučajeve sistematske ili namjerne selekcije.

Postoje različite metode odabira. Ovisno o metodi odabira, razlikuju se sljedeće vrste uzoraka:

Slučajno uzorkovanje sa povratom;

Slučajno uzorkovanje bez povratka;

Mechanical;

Tipično;

Serial.

Razmotrimo formiranje slučajnih uzoraka sa i bez povratka. Ako je uzorak napravljen od mase proizvoda (na primjer, iz kutije), onda nakon temeljitog miješanja predmete treba uzeti nasumično, tj. tako da svi imaju istu vjerovatnoću da budu uključeni u uzorak. Često, da bi se formirao slučajni uzorak, elementi populacije su prethodno numerisani, a svaki broj se bilježi na posebnoj kartici. Rezultat je paket karata, čiji se broj poklapa s obimom opće populacije. Nakon temeljitog miješanja, uzmite jednu kartu iz ovog paketa. Predmet koji ima isti broj kao i kartica smatra se uključenim u uzorak. U ovom slučaju moguća su dva fundamentalno različita načina formiranja uzorka.

Prva metoda je da se izvađena kartica, nakon što zabilježi njen broj, vrati u paket, nakon čega se karte ponovo dobro promiješaju. Ponavljanjem takvih uzoraka jednu po jednu karticu, možete formirati populaciju uzoraka bilo koje veličine. Populacija uzorka formirana prema ovoj šemi naziva se slučajni uzorak sa povratom.

Druga metoda je da se svaka izvađena kartica ne vraća nakon što se zapiše. Ponavljanjem ove šeme uzorkovanja jednu po jednu karticu, možete dobiti populaciju uzorka bilo koje date veličine. Populacija uzorka formirana prema ovoj šemi naziva se slučajni uzorak bez povratka. Nasumični uzorak bez povratka formira se ako se potreban broj karata odmah uzme iz dobro izmiješanog paketa.

Međutim, s velikom populacijom, gornja metoda generiranja slučajnog uzorka sa i bez povrata pokazuje se kao vrlo radno intenzivna. U ovom slučaju se koriste tablice slučajnih brojeva u kojima su brojevi raspoređeni slučajnim redoslijedom. Da biste odabrali, na primjer, 50 objekata iz numerisane opće populacije, otvorite bilo koju stranicu tabele slučajnih brojeva i napišite 50 slučajnih brojeva u nizu; Uzorak uključuje one objekte čiji se brojevi poklapaju sa ispisanim slučajnim brojevima; ako se slučajni broj u tablici pokaže da je veći od volumena opće populacije, tada se takav broj preskače.

Imajte na umu da razlika između nasumičnih uzoraka sa i bez vraćanja unatrag postaje zamagljena ako čine mali dio velike populacije.

Mehaničkim metodom formiranja populacije uzorka, elementi opće populacije koja se ispituje se biraju u određenom intervalu. Tako, na primjer, ako uzorak treba da bude 50% populacije, tada se bira svaki drugi element populacije. Ako je uzorak deset posto, tada se bira svaki deseti element itd.

Treba napomenuti da ponekad mehaničko uzorkovanje možda neće dati reprezentativan uzorak. Na primjer, ako je odabran svaki dvanaesti valjak koji se okreće, a rezač se zamijeni odmah nakon odabira, tada će biti odabrani svi valjci okrenuti tupim noževima. U ovom slučaju potrebno je eliminirati podudarnost ritma odabira s ritmom zamjene glodala, za koji treba odabrati najmanje svaki deseti valjak od dvanaest okrenutih.

Kada se proizvodi veliki broj homogenih proizvoda, kada u njegovoj proizvodnji učestvuju različite mašine, pa čak i radionice, koristi se tipična metoda selekcije za formiranje reprezentativnog uzorka. U ovom slučaju, stanovništvo se prvo dijeli na nepovezane grupe. Zatim se iz svake grupe odabire određeni broj elemenata prema shemi slučajnog uzorkovanja sa ili bez povrata. Oni čine populaciju uzorka, koja se naziva tipičnom.

Neka, na primjer, probamo proizvode radionice u kojoj se nalazi 10 mašina koje proizvode iste proizvode. Koristeći shemu slučajnog uzorkovanja sa ili bez povrata, odabiru se proizvodi, prvo od proizvoda napravljenih na prvoj, zatim na drugoj, itd. mašinama. Ova metoda selekcije nam omogućava da formiramo tipičan uzorak.

Ponekad je u praksi preporučljivo koristiti metodu serijskog uzorkovanja, čija je ideja da se opća populacija podijeli na određeni broj serija koje se ne preklapaju i, prema shemi slučajnog uzorkovanja sa ili bez povrata, svi elementi kontroliraju se samo odabrane serije. Na primjer, ako proizvode proizvodi velika grupa automatskih mašina, onda su proizvodi samo nekoliko mašina podvrgnuti sveobuhvatnom ispitivanju. Serijski odabir se koristi ako karakteristika koja se ispituje neznatno varira u različitim serijama.

Koju metodu odabira treba dati prednost u datoj situaciji treba procijeniti na osnovu zahtjeva zadatka i uslova proizvodnje. Imajte na umu da se u praksi, prilikom sastavljanja uzorka, nekoliko metoda selekcije često koristi istovremeno u kompleksu.

1.6. Korelaciona i regresiona analiza

Regresijska i korelacione analize su efikasne metode koje vam omogućavaju da analizirate velike količine informacija kako biste proučavali verovatni odnos dve ili više varijabli.

Zadaci korelacione analize svodi se na mjerenje bliskosti poznate veze između različitih karakteristika, utvrđivanje nepoznatih uzročno-posljedičnih veza (čija uzročna priroda mora biti razjašnjena kroz teorijsku analizu) i procjenu faktora koji imaju najveći utjecaj na rezultirajuću karakteristiku.

Zadaci regresiona analiza biramo tip modela (oblik povezivanja), utvrđujemo stepen uticaja nezavisnih varijabli na zavisnu i utvrđujemo izračunate vrednosti zavisne varijable (regresiona funkcija).

Rješavanje svih ovih problema dovodi do potrebe za integriranom primjenom ovih metoda.

1.7. Serija Dynamics

Pojam dinamičkog niza i vrste dinamičkih serija

Zvučnici u blizini je niz statističkih indikatora lociranih u nizu u vremenu, koji u svojim promjenama odražavaju tok razvoja fenomena koji se proučava.

Serija dinamike sastoji se od dva elementa: trenutak ili vremenski period, na koji su podaci i statistički pokazatelji (nivoi). Oba elementa zajedno formiraju članovi serije. Nivoi serije se obično označavaju sa “y”, a vremenski period sa “t”.

Na osnovu dužine vremena kojem pripadaju nivoi serije, dinamičke serije se dijele na trenutne i intervalne.

IN moment serije svaki nivo karakteriše fenomene u određenom trenutku. Na primjer: broj depozita stanovništva u institucijama štedionice Ruske Federacije, na kraju godine.

IN intervalni redovi dinamike, svaki nivo serije karakteriše fenomen tokom određenog vremenskog perioda. Na primjer: proizvodnja satova u Ruskoj Federaciji po godinama.

U intervalnim serijama dinamike, nivoi serije se mogu sumirati i dobiti ukupna vrijednost za niz uzastopnih perioda. U serijama trenutaka ova suma nema značenje.

U zavisnosti od načina izražavanja nivoa serije, razlikuju se serije dinamike apsolutnih vrednosti, relativnih vrednosti i prosečnih vrednosti.

Dinamičke serije mogu biti u jednakim ili nejednakim intervalima. Koncept intervala u momentu i nizu intervala je različit. Interval serije trenutaka je vremenski period od jednog datuma do drugog datuma za koji su dati podaci. Ako se radi o podacima o broju depozita na kraju godine, onda je interval jednak od kraja jedne do kraja druge godine. Interval intervalne serije je vremenski period za koji se podaci sumiraju. Ako je ovo proizvodnja satova po godinama, onda je interval jednak jednoj godini.

Interval serije može biti jednak ili nejednak iu trenutnim i intervalnim vremenskim serijama.

Koristeći vremenske serije, utvrđuje se brzina i intenzitet razvoja pojava, identifikuje glavni trend njihovog razvoja, identifikuju se sezonske fluktuacije, upoređuje se razvoj tokom vremena pojedinih indikatora različitih zemalja i utvrđuju veze između pojava koje se razvijaju tokom vremena. identifikovan.

1.8. Statistički indeksi

Koncept indeksa

Riječ "indeks" je latinska i znači "indikator", "pokazivač". U statistici, indeks se shvata kao generalizirajući kvantitativni indikator koji izražava odnos između dvije populacije koji se sastoji od elemenata koji se ne mogu direktno sumirati. Na primjer, obim proizvodnje preduzeća u fizičkom smislu ne može se sumirati (osim homogenog), ali za generalizirajuću karakteristiku obima to je neophodno. Ne možete sumirati cijene za pojedine vrste proizvoda itd. Indeksi se koriste za generalizaciju karakteristika takvih populacija u dinamici, u prostoru iu poređenju sa planom. Pored sumarnog opisa pojava, indeksi omogućavaju procjenu uloge pojedinih faktora u promjeni složene pojave. Indeksi se također koriste za identifikaciju strukturnih promjena u nacionalnoj ekonomiji.

Indeksi se izračunavaju kako za složenu pojavu (opšti ili sumarni), tako i za njene pojedinačne elemente (pojedinačni indeksi).

Indeksi koji karakterišu promjene u nekoj pojavi tokom vremena razlikuju bazni i izvještajni (tekući) period. Basic period je vremenski period na koji se odnosi vrijednost uzeta kao osnova poređenja. Označava se indeksom "0". Izvještavanje period je vremenski period na koji se odnosi vrijednost koja se poredi. Označeno je indeksom "1".

Pojedinac indeksi su uobičajena relativna vrijednost.

Kompozitni indeks- karakteriše promenu čitavog kompleksnog skupa u celini, tj. koji se sastoje od nesabirnih elemenata. Shodno tome, da bi se izračunao takav indeks, potrebno je prevazići nesumarnost elemenata populacije.

To se postiže uvođenjem dodatnog indikatora (komjeritelja). Zbirni indeks se sastoji od dva elementa: indeksirane vrijednosti i težine.

Indeksirana vrijednost je indikator za koji se izračunava indeks. Težina (komerač) je dodatni indikator uveden u svrhu merenja indeksirane vrednosti. U kompozitnom indeksu, brojilac i imenilac su uvijek složeni skup, izražen kao zbir proizvoda indeksirane količine i težine.

U zavisnosti od predmeta proučavanja, opšti i pojedinačni indeksi se dele na indekse volumetrijske (kvantitativne) pokazatelje(fizički obim proizvodnje, zasijane površine, broj radnika itd.) i indeksi indikatora kvaliteta(cijene, troškovi, produktivnost, produktivnost rada, nadnice, itd.).

U zavisnosti od baze poređenja, pojedinačni i opšti indeksi mogu biti lanac I osnovni .

Ovisno o metodologiji izračuna, opći indeksi imaju dva oblika: agregat I oblik sredine index.

Pravilno obavljeno prikupljanje, analiza podataka i statistički proračuni omogućavaju da se zainteresovane strukture i javnost upoznaju sa razvojem privrede, pravcima njenog razvoja, pokaže se efikasnost korišćenja resursa, uzme u obzir zaposlenost privrede. stanovništva i njegove radne sposobnosti, određuju stopu rasta cijena i uticaj trgovine na samo tržište ili zasebno tržište.

Spisak korišćene literature

1. Glinsky V.V., Ionin V.G. Statistička analiza. Udžbenik - M.: FILIN, 1998 - 264 str.

2. Eliseeva I.I., Yuzbashev M.M. Opća teorija statistike. Udžbenik.-

M.: Finansije i statistika, 1995 - 368 str.

3. Efimova M.R., Petrova E.V., Rumyantsev V.N. Opća teorija statistike. Udžbenik.-M.: INFRA-M, 1996. - 416 str.

4. Kostina L.V. Metodologija za izradu statističkih grafova. Metodološki priručnik - Kazan, TISBI, 2000 - 49 str.

5. Kurs socio-ekonomske statistike: Udžbenik / ur. prof. M.G. Nazarova.-M.: Finstatinform, UNITY-DIANA, 2000. - 771 str.

6. Opća teorija statistike: statistička metodologija u proučavanju komercijalne djelatnosti: Udžbenik / ur. AA. Spirina, O.E.Bašenoj-M.: Finansije i statistika, 1994. - 296 str.

7. Statistika: tok predavanja / Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. i drugi - Novosibirsk,: NGAEiU, M.: INFRA-M, 1997. - 310 str.

8. Statistički rječnik/glavni ur. M.A. Korolev.-M.: Finansije i statistika, 1989. - 623 str.

9. Teorija statistike: Udžbenik / ur. prof. Šmoilova R.A. - M.: Finansije i statistika, 1996 - 464 str.

Opservacija kao početna faza istraživanja povezana je sa prikupljanjem početnih podataka o problematici koja se proučava. Karakteristično je za mnoge nauke. Međutim, svaka nauka ima svoje specifičnosti, koje se razlikuju u svojim zapažanjima. Stoga, nije svako zapažanje statističko.

Statistička istraživanja je naučno organizovano prikupljanje, sumiranje i analiza podataka (činjenica) o društveno-ekonomskim, demografskim i drugim pojavama i procesima društvenog života u državi, sa evidentiranjem njihovih najznačajnijih obeležja u računovodstvenoj dokumentaciji, organizovano po jedinstvenom programu.

Odlike (specifičnosti) statističkih istraživanja su: svrsishodnost, organizovanost, masovnost, sistematičnost (složenost), uporedivost, dokumentovanost, upravljivost, praktičnost.

Općenito, statistička studija bi trebala:

  • Imati društveno korisnu svrhu i opšti (državni) značaj;
  • Odnosi se na specifične uslove svog mjesta i vremena;
  • Izraziti statističku vrstu računovodstva (a ne računovodstvenu ili operativnu);
  • Sprovodi se po unapred izrađenom programu uz njegovu naučno utemeljenu metodološku i drugu podršku;
  • Prikupiti masovne podatke (činjenice), koji odražavaju čitav niz uzročno-posljedičnih i drugih faktora koji karakteriziraju pojavu na mnogo načina;
  • Registar u obliku računovodstvenih isprava utvrđenog obrasca;
  • Osigurajte da nema grešaka u promatranju ili ih svesti na mogući minimum;
  • Obezbediti određene kriterijume kvaliteta i metode za praćenje prikupljenih podataka, obezbeđujući njihovu pouzdanost, potpunost i sadržaj;
  • Fokus na isplativu tehnologiju za prikupljanje i obradu podataka;
  • Biti pouzdana informaciona baza za sve naredne faze statističkih istraživanja i svih korisnika statističkih informacija.

Studije koje ne ispunjavaju ove zahtjeve nisu statističke. Studije nisu statističke, na primjer, zapažanja i studije: majke koje gledaju svoju djecu kako se igraju (lično pitanje); gledaoci u pozorišnoj produkciji (ne postoji knjigovodstvena dokumentacija za spektakl); naučnik za fizičke i hemijske eksperimente sa njihovim merenjima, proračunima i dokumentacijom (ne masovni javni podaci); doktor za pacijente sa vođenjem medicinske dokumentacije (operativne evidencije); računovođa za kretanje sredstava na bankovnom računu preduzeća (računovodstvo); novinari o javnim i ličnim aktivnostima državnih službenika ili drugih poznatih ličnosti (koji nisu predmet statistike).

Skup jedinica koje imaju masu, tipičnost, kvalitativnu homogenost i prisustvo varijacija.

Statističku populaciju čine materijalno postojeći objekti (zaposleni, preduzeća, zemlje, regioni) i predmet je statističkog istraživanja.

Vidi također:

Statističko posmatranje je prva faza statističkog istraživanja, koja predstavlja naučno organizovano prikupljanje podataka o pojavama i procesima društvenog života koji se proučavaju.

Faze statističkih operacija

Svaka statistička studija sastoji se od šest faza.

Faza 1. Statističko istraživanje počinje formiranjem primarne statističke informacione baze za odabrani skup indikatora.
  • Izvođenje.
  • Upotreba zvaničnih državnih i korporativnih (kompanijskih) izvora.
  • Korišćenje naučnih statističkih istraživanja u časopisima, novinama, monografijama itd.
  • Korišćenje elektronskih medija (Internet, CD, diskete, itd.).
Faza 2. Primarna generalizacija i grupisanje statističkih podataka.
  • , kumulira (), grafovi raspodjele frekvencije (frekvencije).
  • Formiranje i njihova primarna analiza. Grafička prognoza (sa konceptom "optimista", "pesimista", "realista").
  • Izračunavanje momenata K-tog reda (proseci, varijanse, mere nagnutosti, mere kurtozisa) u cilju određivanja indikatora centra ekspanzije, indikatora kosine (asimetrije), indikatora kurtozisa (oštrine).
  • Formiranje i primarni proračuni složenih statističkih indikatora (relativnih, sumarnih višerazinskih).
  • Formiranje i primarni obračun indeksnih indikatora.
Faza 3. Sljedeća faza statističkog istraživanja uključuje ekonomsko tumačenje primarne generalizacije.
  • i finansijsku procjenu objekta analize.
  • Formiranje anksioznosti (zadovoljstva) u ekonomskim i finansijskim situacijama.
  • Upozorenje o približavanju statističkim vrijednostima praga u primijenjenim, obično makroekonomskim, problemima.
  • Diverzifikacija primarne statističke generalizacije dobijenih primenjenih rezultata prema hijerarhiji moći, partnerstva i poslovanja.
Faza 4. Kompjuterska analiza primarnih i generalizovanih proširenih (obimnih) statističkih podataka.
  • Varijacijska analiza napredne statistike.
  • Analiza dinamike naprednih statističkih podataka.
  • Analiza odnosa naprednih statističkih podataka.
  • Višedimenzionalni sažeci i grupisanja.
Faza 5. Računarsko predviđanje u odabranim najvažnijim oblastima.
  • Metoda najmanjih kvadrata (LSM).
  • Pokretni proseci.
  • Tehnička analiza.
  • Predstavlja zbirnu analizu i opcije prognoze sa preporukama za prilagođavanje upravljanja i ulaganja.
Faza 6. Generalizovana analiza dobijenih rezultata i provera njihove pouzdanosti korišćenjem statističkih kriterijuma. Faza 7. Završna faza statističkog istraživanja je prihvatanje.

Postoji pet glavnih tipova statističkih analiza koje se koriste u marketinškim istraživanjima: deskriptivna analiza, inferencijalna analiza, analiza razlika, analiza povezanosti i prediktivna analiza. Ponekad se ove vrste analiza koriste odvojeno, ponekad zajedno.

Deskriptivna analiza se zasniva na upotrebi statističkih mjera kao što su srednja vrijednost (prosjek), mod, standardna devijacija, raspon ili amplituda varijacije.

Analiza koja se oslanja na upotrebu statističkih procedura (kao što je testiranje hipoteza) za generalizaciju dobijenih rezultata na cijelu populaciju naziva se inferencijalna analiza.

Analiza razlika koristi se za upoređivanje rezultata studije dvije grupe (dva tržišna segmenta) kako bi se utvrdio stepen stvarne razlike u njihovom ponašanju, u reakciji na isto oglašavanje itd.

Analiza odnosa ima za cilj određivanje sistematskih odnosa (njihov smjer i jačina) varijabli. Na primjer, utvrđivanje kako povećanje troškova oglašavanja utiče na povećanu prodaju.

Prediktivna analiza se koristi za predviđanje budućeg razvoja, na primjer kroz analizu vremenskih serija. Metode statističkog predviđanja razmatrane su u Odjeljku 7.

Alati deskriptivne analize

Dvije grupe mjera se široko koriste za opisivanje informacija dobivenih mjerenjima uzorka. Prvi uključuje mjere “centralne tendencije” ili mjere koje opisuju tipičnog ispitanika ili tipičan odgovor. Drugi uključuje mjere varijacije, ili mjere koje opisuju stepen u kojem su ispitanici ili odgovori slični ili različiti od „tipičnih” ispitanika ili odgovora.

Postoje i druge deskriptivne mjere, kao što su mjere asimetrije (koliko se pronađene krive distribucije razlikuju od krivih normalne distribucije). Međutim, oni se ne koriste tako često kao gore navedeni i nisu od posebnog interesa za kupca.

U nastavku je samo kratak opis ovih mjera. Detaljnije informacije mogu se dobiti iz knjiga o matematičkoj statistici, na primjer.

Mjere centralne tendencije uključuju mod, medijan i srednju vrijednost.

Način karakterizira vrijednost karakteristike koja se najčešće pojavljuje u usporedbi s drugim vrijednostima date karakteristike. Moda je relativne prirode i nije neophodno da većina ispitanika navede upravo tu vrijednost atributa.

Medijan karakterizira vrijednost karakteristike koja zauzima srednje mjesto u uređenom nizu vrijednosti date karakteristike.

Treća mjera centralne tendencije je srednja vrijednost, koja se najčešće računa kao aritmetička sredina. Prilikom njegovog izračunavanja, ukupan volumen atributa se jednako raspoređuje na sve jedinice populacije.

Vidi se da je stepen informativnog sadržaja prosječne vrijednosti veći od medijane, a medijan veći od modusa.

Međutim, razmatrane mjere ne karakteriziraju varijacije u odgovorima na pitanje ili, drugim riječima, različitost, razliku ispitanika ili mjerene karakteristike. Očigledno, osim poznavanja vrijednosti mjera centralne tendencije, važno je ustanoviti koliko su blizu ovim vrijednostima ostale dobijene procjene. Obično se koriste tri mjere varijacije: distribucija frekvencije, raspon varijacije i standardna devijacija.

Raspodjela frekvencija prikazuje u tabelarnom ili grafičkom obliku broj pojavljivanja svake vrednosti merene karakteristike (atributa) u svakom izabranom opsegu njenih vrednosti. Raspodjela frekvencija vam omogućava da brzo izvučete zaključke o stepenu detalja rezultata mjerenja.

Raspon varijacija određuje apsolutnu razliku između maksimalne i minimalne vrijednosti mjerene karakteristike. Drugim riječima, to je razlika između krajnjih točaka u distribuciji uređenih vrijednosti mjerene osobine. Ova mjera određuje interval distribucije karakterističnih vrijednosti.

Standardna devijacija je opća statistička karakteristika varijacije vrijednosti atributa. Ako je ova mjera mala, onda kriva distribucije ima uski, komprimirani oblik (rezultati mjerenja imaju visok stepen sličnosti); ako je mjera velika, onda kriva distribucije ima širok, rastegnut izgled (stepen razlike u procjenama je velik).

Prethodno je napomenuto da izbor mjerne skale, a samim tim i vrsta pitanja u upitniku, određuje količinu primljenih informacija. Slično tome, količina informacija dobijenih korištenjem mjera o kojima se govorilo iznad varira. Opšte je pravilo da statističke mjere pružaju najviše informacija kada se koriste najinformativnije mjerne skale. Izbor mjerne skale određuje izbor statističkih mjera. Na primjer, jedno od pitanja u demografskoj studiji koja je koristila skalu imenovanja odnosilo se na nacionalnost. Rusima je dodijeljena šifra 1, Ukrajincima - 2, Tatarima - 3, itd. U ovom slučaju, naravno, možete izračunati prosjek. Ali kako da protumačimo prosječnu nacionalnost od, recimo, 5,67? Da biste izračunali prosjek, morate koristiti skalu intervala ili skalu omjera. Međutim, u našem primjeru možemo koristiti modu.

Što se tiče mjera varijacije, kada se koristi nominalna skala, koristi se distribucija frekvencije, kada se koristi skala poretka, koristi se kumulativna raspodjela frekvencije, a kada se koristi skala intervala i omjera, standardna devijacija.

Statistički zaključak

Zaključak je vrsta logičke analize koja ima za cilj dobijanje opštih zaključaka o celokupnoj populaciji na osnovu posmatranja male grupe jedinica u ovoj populaciji.

Zaključci se donose na osnovu analize malog broja činjenica. Na primjer, ako se dva vaša prijatelja koji imaju istu marku automobila žale na njegovu kvalitetu, onda možete zaključiti da je kvalitet ove marke automobila u cjelini nizak.

Statističko zaključivanje se zasniva na statističkoj analizi rezultata studija uzoraka i ima za cilj procjenu parametara populacije u cjelini. U ovom slučaju, rezultati studija uzoraka su samo polazna tačka za donošenje opštih zaključaka.

Na primjer, automobilska kompanija je sprovela dvije nezavisne studije kako bi utvrdila zadovoljstvo kupaca svojim vozilima. Prvi uzorak uključivao je 100 potrošača koji su kupili određeni model u posljednjih šest mjeseci. Drugi uzorak uključivao je 1000 potrošača. Tokom telefonskog intervjua, ispitanici su odgovarali na pitanje: „Da li ste zadovoljni ili niste zadovoljni modelom automobila koji ste kupili?“ Prvo istraživanje pokazalo je 30% nezadovoljnih, drugo - 35%.

Budući da postoje greške uzorkovanja i u prvom i u drugom slučaju, možemo izvući sljedeći zaključak. Za prvi slučaj: oko 30% ispitanika je izrazilo nezadovoljstvo kupljenim modelom automobila. Za drugi slučaj, oko 35% ispitanika je izrazilo nezadovoljstvo kupljenim modelom automobila. Koji se generalni zaključak može izvući u ovom slučaju? Kako se riješiti izraza "o"? Da bismo to uradili, uvodimo stopu greške: 30% ± x% i 35% ± y% i poredimo x i y. Logičkom analizom možemo zaključiti da veći uzorak sadrži manje greške i da se na osnovu toga mogu izvući ispravniji zaključci o mišljenjima cjelokupne populacije potrošača. Može se vidjeti da je odlučujući faktor za donošenje ispravnih zaključaka veličina uzorka. Ovaj indikator je prisutan u svim formulama koje određuju sadržaj različitih metoda statističkog zaključivanja.

Prilikom provođenja marketinškog istraživanja najčešće se koriste sljedeće metode statističkog zaključivanja: procjena parametara i testiranje hipoteza.

Procjena parametara Uzorkovanje populacije je proces određivanja, na osnovu podataka uzorka, intervala u kojem se nalazi jedan od parametara populacije, na primjer, srednja vrijednost. Za to se koriste sljedeći statistički pokazatelji: prosječne vrijednosti, standardna greška i željeni nivo pouzdanosti (obično 95% ili 99%).

U nastavku ćemo govoriti o njihovoj ulozi pri procjeni parametara.

Srednja kvadratna greška je, kao što je gore navedeno, mjera varijacije u distribuciji uzorka pod teorijskom pretpostavkom da je proučavano mnogo nezavisnih uzoraka iste populacije.

Određuje se sljedećom formulom:

Gdje je s x - srednja kvadratna greška srednje vrijednosti uzorka;

s - standardna devijacija od prosječne vrijednosti u uzorku;

n - veličina uzorka.

Ako se koriste procentualne mjere koje izražavaju alternativnu varijabilnost kvalitativnih karakteristika, onda

gdje je s standardna greška srednje vrijednosti uzorka kada se koriste procentualne mjere;

p je procenat ispitanika u uzorku koji su podržali prvu alternativu;

q = (100 - q) - procenat ispitanika u uzorku koji su podržali

druga alternativa;

n - veličina uzorka.

Može se vidjeti da je prosječna greška uzorkovanja veća, što je veća varijacija, a što je manja, to je veća veličina uzorka.

Budući da uvijek postoji greška uzorkovanja, potrebno je procijeniti širenje vrijednosti proučavanog parametra populacije. Pretpostavimo da istraživač odabere nivo pouzdanosti od 99%. Iz svojstava krive normalne distribucije slijedi da ona odgovara parametru Z = ± 2,58. Prosjek za populaciju u cjelini izračunava se pomoću formule

Ako se koriste procentualne mjere, onda

To znači da ako želite da raspon procjena uključuje istinitu procjenu populacije na nivou pouzdanosti od 99%, morate standardnu ​​grešku pomnožiti sa 2,58 i rezultat dodati p-vrijednosti procenta (procjena gornje granice). Ako oduzmemo ovaj proizvod, naći ćemo procjenu donje granice.

Kako se ove formule odnose na statističko zaključivanje?

Budući da se procjenjuje parametar populacije, naznačen je raspon unutar kojeg pada prava vrijednost parametra populacije. U tu svrhu za uzorak se uzima statistička mjera centralne tendencije, količina disperzije i veličina uzorka. Zatim se postavlja pretpostavka o nivou pouzdanosti i izračunava se opseg disperzije parametra za opštu populaciju.

Na primjer, za članove uzorka (100 čitalaca novina) utvrđeno je da je prosječno vrijeme za čitanje novina 45 minuta sa standardnom greškom od 20 minuta. Sa nivoom pouzdanosti od 95%, dobijamo

Dobijamo nivo pouzdanosti od 99%.

Može se vidjeti da je interval povjerenja širi za 99% u odnosu na nivo povjerenja od 95%.

Ako se koriste procenti i ispostavi se da na uzorku od 100 ljudi 50% ispitanika pije kafu ujutro, onda sa nivoom pouzdanosti od 99% dobijamo sledeći raspon procena:

Dakle, logika statističkog zaključivanja ima za cilj dobijanje konačnih zaključaka o proučavanom parametru opšte populacije na osnovu uzorka studije sprovedene prema zakonima matematičke statistike. Ako se koristi jednostavan zaključak koji nije zasnovan na statističkim mjerenjima, onda su konačni zaključci subjektivni i različiti stručnjaci mogu donijeti različite zaključke na osnovu istih činjenica.

Kada se koristi statističko zaključivanje, koriste se formule koje su objektivne prirode i zasnovane na opšteprihvaćenim statističkim konceptima. Kao rezultat toga, konačni zaključci su mnogo objektivniji.

U nizu slučajeva se o nekim parametrima opće populacije (vrijednost srednje vrijednosti, disperzija, priroda distribucije, oblik i bliskost odnosa između varijabli) prosuđuju samo na osnovu nekih pretpostavki, razmišljanja, intuicije. , i nepotpuno znanje. Takvi sudovi se nazivaju hipotezama.

Statistička hipoteza je pretpostavka o svojstvu populacije koja se može testirati na osnovu podataka uzorka.

Ispod testiranje hipoteza odnosi se na statističku proceduru koja se koristi za potvrđivanje ili odbacivanje hipoteze na osnovu rezultata studija uzoraka. Provjera hipoteza se provodi na osnovu utvrđivanja konzistentnosti empirijskih podataka sa hipotetičkim. Ako neslaganje između uspoređenih vrijednosti ne prelazi granice slučajnih grešaka, hipoteza se prihvaća. U ovom slučaju se ne donose zaključci o ispravnosti same hipoteze, već se radi samo o konzistentnosti upoređenih podataka.

Provjera hipoteza se provodi u pet faza:

1. Neka pretpostavka se odnosi na neke karakteristike populacije, na primjer, o prosječnoj vrijednosti određenog parametra.

2. Formira se slučajni uzorak, radi uzorkovanje i određuju statistički pokazatelji uzorka.

3. Upoređuju se hipotetičke i statističke vrijednosti ispitivane karakteristike.

4. Utvrđuje se da li rezultati studije uzorka odgovaraju ili ne prihvaćenoj hipotezi.

5. Ako rezultati studije uzorka ne potvrde hipotezu, potonja se revidira – mora odgovarati podacima studije uzorka.

Zbog varijacija u rezultatima studija uzoraka, nemoguće je donijeti apsolutno tačan zaključak o pouzdanosti hipoteze provođenjem jednostavnog aritmetičkog poređenja vrijednosti karakteristika. Stoga, statističko testiranje hipoteze uključuje korištenje: vrijednosti uzorka karakteristike, standardne devijacije, željenog nivoa pouzdanosti i hipotetičke vrijednosti karakteristike za populaciju u cjelini.

Za testiranje hipoteza o prosječnim vrijednostima koristi se sljedeća formula:

Na primjer, kada je pripremao oglas za program obuke u prodaji na fakultetu, direktor programa je vjerovao da diplomci programa zarađuju u prosjeku 1.750 dolara mjesečno. Dakle, hipotetički prosjek stanovništva iznosi 1.750 dolara. Da bi se provjerila ova hipoteza, provedena je telefonska anketa prodajnih agenata iz različitih kompanija.

Veličina uzorka bila je 100, srednja vrijednost uzorka bila je 1800 dolara, a standardna devijacija 350 dolara. Postavlja se pitanje da li je razlika (50$) između hipotetičke plate i njenog prosjeka za uzorak velika. Izračunavanje vršimo pomoću formule (4.2):

Može se vidjeti da je srednja kvadratna greška prosječne vrijednosti bila jednaka 35 $, a koeficijent dijeljenja 50 sa 45 je 1,43 (normalizovano odstupanje), što je manje od ±1,96, što je vrijednost koja karakteriše nivo pouzdanosti od 95%. U ovom slučaju, postavljena hipoteza može se smatrati pouzdanom.

Kada se koristi procentualna mjera, test hipoteze se provodi na sljedeći način. Pretpostavimo da je, na osnovu vlastitog iskustva, jedan od vozača iznio hipotezu prema kojoj samo 10% vozača koristi sigurnosne pojaseve. Međutim, istraživanje nacionalnog uzorka na 1.000 vozača pokazalo je da 80% njih koristi sigurnosne pojaseve. Proračuni se u ovom slučaju provode na sljedeći način:

gdje je p procenat studija uzoraka;

π H - procenat iz hipoteze;

s p - srednja kvadratna greška u proračunima kao procenat.

Vidi se da se početna hipoteza razlikovala od pronađenih 80% za vrijednost od 55,3 pomnoženu sa srednjom kvadratnom greškom, tj. ne može se smatrati pouzdanim.

U nekim slučajevima, preporučljivo je koristiti hipoteze usmjerenja. Hipoteze usmjerenja određuju smjerove mogućih vrijednosti nekog parametra populacije. Na primjer, plata je veća od 1.750 dolara. U ovom slučaju koristi se samo jedna strana krivulje distribucije, što se ogleda u korištenju znakova “+” i “-” u proračunskim formulama.

Detaljnije informacije o ovom pitanju možete dobiti od.

Ovdje se, međutim, postavlja pitanje. Ako možete provesti uzorke studija, zašto onda postavljati hipoteze? Obrada rezultata studija uzoraka omogućava da se dobiju prosječne vrijednosti i njihove statističke karakteristike bez postavljanja bilo kakvih hipoteza. Stoga je vjerojatnije da će se testiranje hipoteza koristiti u slučajevima kada je nemoguće ili izuzetno radno intenzivno provesti istraživanja u punoj mjeri i kada je potrebno uporediti rezultate nekoliko studija (za različite grupe ispitanika ili provedenih u različito vrijeme). ). Problemi ove vrste obično se javljaju u društvenim statistikama. Intenzitet rada statističkih i socioloških istraživanja dovodi do toga da su skoro sva bazirana na nepotpunom računovodstvu. Stoga je problem dokazivanja zaključaka u socijalnoj statistici posebno akutan.

Prilikom primjene postupka testiranja hipoteza, treba imati na umu da on može garantovati rezultate sa određenom vjerovatnoćom samo iz „nepristrasnih” uzoraka, zasnovanih na objektivnim podacima.

Analiza razlika

Testiranje značajnosti razlika sastoji se od poređenja odgovora na isto pitanje dobijenih za dvije ili više nezavisnih grupa ispitanika. Osim toga, u nekim slučajevima je od interesa uporediti odgovore na dva ili više nezavisnih pitanja za isti uzorak.

Primjer prvog slučaja je proučavanje pitanja: šta stanovnici određene regije više vole piti ujutro: kavu ili čaj. U početku je anketiran slučajni uzorak od 100 ispitanika, od kojih je 60% preferiralo kafu; Godinu dana kasnije, studija je ponovljena, a samo 40% od 300 ispitanih ljudi bilo je za kafu. Kako se mogu porediti rezultati ova dva istraživanja? Nemoguće je direktno aritmetički uporediti 40% i 60% zbog različitih grešaka uzorkovanja. Iako je u slučaju velikih razlika u brojkama, recimo 20 i 80%, lakše je zaključiti da su se ukusi promijenili u korist kafe. Međutim, ako se vjeruje da je ova velika razlika prvenstveno posljedica činjenice da je u prvom slučaju korišten vrlo mali uzorak, onda bi takav zaključak mogao biti upitan. Dakle, prilikom ovakvog poređenja moraju se uzeti u obzir dva kritična faktora: stepen značajnosti razlika između vrednosti parametara za dva uzorka i standardne greške dva uzorka, određene njihovim zapreminama.

Da bi se provjerilo da li je razlika u izmjerenim srednjim vrijednostima značajna, koristi se nulta hipoteza. Nul hipoteza pretpostavlja da se dvije populacije koje se uspoređuju po jednoj ili više karakteristika ne razlikuju jedna od druge. U ovom slučaju, pretpostavlja se da je stvarna razlika između uspoređenih vrijednosti nula, a razlika od nule identificirane iz podataka je slučajne prirode.

Da bi se testirala značajnost razlike između dvije izmjerene sredine (procenta), one se prvo upoređuju, a zatim se rezultirajuća razlika pretvara u srednju kvadratnu vrijednost greške i određuje koliko odstupaju od hipotetičke nulte vrijednosti.

Kada su srednje kvadratne greške određene, površina ispod krive normalne distribucije postaje poznata i postaje moguće izvesti zaključak o vjerovatnoći ispunjenja nulte hipoteze.

Razmotrite sljedeći primjer. Pokušajmo odgovoriti na pitanje: "Postoji li razlika u konzumaciji bezalkoholnih pića između djevojčica i dječaka?" Anketa je pitala o broju limenki bezalkoholnih pića konzumiranih tokom sedmice. Deskriptivna statistika je pokazala da dječaci u prosjeku konzumiraju 9, a djevojčice 7,5 limenki bezalkoholnih pića. Standardne devijacije su bile 2 odnosno 1,2. Veličina uzorka u oba slučaja bila je 100 ljudi. Testiranje statistički značajne razlike u procjenama obavljeno je na sljedeći način:

gdje su x 1 i x 2 prosjeci za dva uzorka;

s 1 i s 2 - standardne devijacije za dva uzorka;

n 1 i n 2 su zapremine prvog i drugog uzorka, respektivno.

Brojač ove formule karakterizira razliku između prosjeka. Osim toga, potrebno je uzeti u obzir razliku u obliku dvije krivulje raspodjele. To se radi u nazivniku formule. Distribucija uzorkovanja se sada posmatra kao distribucija uzorkovanja razlike između srednjih vrijednosti (procentualnih mjera). Ako je nulta hipoteza tačna, tada je distribucija razlike normalna kriva sa srednjom vrijednosti nula i standardnom greškom od 1.

Može se vidjeti da vrijednost 6,43 značajno premašuje vrijednost ±1,96 (95% nivo pouzdanosti) i ±2,58 (99% nivo pouzdanosti). To znači da nulta hipoteza nije tačna.

Na sl. 4.6 prikazuje krivulje raspodjele za ova dva upoređena uzorka i srednju kvadratnu grešku krivulje razlike. Srednja kvadratna greška krive srednje razlike je 0. Zbog velike vrijednosti srednje kvadratne greške, vjerovatnoća nulte hipoteze da nema razlike između ta dva srednje vrijednosti je manja od 0,001.

Osnove statističke analize podataka

statistika"biostatistika".

1. nominalni;
2. redni;
3. interval;

uzorci

predstavnik

selektivni okvir jednostavno nasumično uzorkovanje intervalno uzorkovanje

stratifikovani uzorak

klaster I kvotno uzorkovanje

Nulta hipoteza

alternativna hipoteza moć

verovatnoća poverenja".


Naslov: Osnove statističke analize podataka
Detaljan opis:

Nakon završetka bilo kojeg naučnog istraživanja, fundamentalnog ili eksperimentalnog, vrši se statistička analiza dobijenih podataka. Da bi se statistička analiza mogla uspješno sprovesti i riješiti zadati problemi, studija mora biti pravilno planirana. Posljedično, bez razumijevanja osnova statistike, nemoguće je planirati i obraditi rezultate naučnog eksperimenta. Međutim, medicinsko obrazovanje ne pruža samo poznavanje statistike, već čak ni osnove više matematike. Stoga se vrlo često može naići na mišljenje da samo statističar treba da se bavi pitanjima statističke obrade u biomedicinskim istraživanjima, a doktor istraživač treba da se fokusira na medicinska pitanja svog naučnog rada. Ovakva podjela rada, koja uključuje pomoć u analizi podataka, potpuno je opravdana. Međutim, potrebno je razumijevanje principa statistike, barem kako bi se izbjegla pogrešna formulacija problema pred specijalistom, komunikacija s kojim je prije početka studije jednako važna kao i u fazi obrade podataka.

Prije nego što govorimo o osnovama statističke analize, potrebno je razjasniti značenje pojma „ statistika". Postoji mnogo definicija, ali najkompletnija i najsažetija je, po našem mišljenju, definicija statistike kao „nauke o prikupljanju, predstavljanju i analizi podataka“. Zauzvrat, upotreba statistike u primjeni na živi svijet naziva se "biometrija" ili " biostatistika".

Treba napomenuti da se statistika vrlo često svodi samo na obradu eksperimentalnih podataka, ne obraćajući pažnju na fazu njihovog prikupljanja. Međutim, statistička znanja su neophodna već tokom planiranja eksperimenta, kako bi indikatori dobijeni tokom njega pružili istraživaču pouzdane informacije. Stoga možemo reći da statistička analiza eksperimentalnih rezultata počinje i prije početka istraživanja.

Već u fazi izrade plana, istraživač mora jasno razumjeti koja će vrsta varijabli biti u njegovom radu. Sve varijable se mogu podijeliti u dvije klase: kvalitativne i kvantitativne. Opseg koji varijabla može uzeti ovisi o skali mjerenja. Mogu se razlikovati četiri glavne skale:

1. nominalni;
2. redni;
3. interval;
4. racionalni (skala odnosa).

Nominalna skala (skala "imena") sadrži samo konvencionalne oznake za opisivanje određenih klasa objekata, na primjer, "spol" ili "profesija pacijenta". Nominalna skala podrazumijeva da će varijabla poprimiti vrijednosti čiji se kvantitativni odnosi ne mogu odrediti. Stoga je nemoguće uspostaviti matematičke odnose između muškog i ženskog spola. Konvencionalne numeričke oznake (žene - 0, muškarci - 1, ili obrnuto) date su apsolutno proizvoljno i namijenjene su samo za kompjutersku obradu. Nominalna skala je kvalitativna u svom čistom obliku, a pojedine kategorije u ovoj skali izražene su učestalošću (broj ili proporcija opažanja, procenti).

Ordinalna (redna) skala predviđa da se pojedine kategorije u njoj mogu poredati u rastućem ili opadajućem redosledu. U medicinskoj statistici, klasičan primjer ordinalne skale je gradacija stepena ozbiljnosti bolesti. U ovom slučaju, težinu možemo poredati uzlaznim redom, ali još uvijek nemamo mogućnost specificiranja kvantitativnih odnosa, odnosno udaljenost između vrijednosti ​​mjerenih na ordinalnoj skali je nepoznata ili nije bitna. Lako je ustanoviti redoslijed vrijednosti varijable "ozbiljnost", ali je nemoguće odrediti koliko se puta teško stanje razlikuje od umjerenog stanja.

Ordinalna skala se odnosi na polukvantitativne tipove podataka, a njene gradacije se mogu opisati i frekvencijama (kao na kvalitativnoj skali) i mjerama centralnih vrijednosti, o čemu ćemo govoriti u nastavku.

Intervalne i racionalne skale su čisto kvantitativne vrste podataka. U intervalnoj skali već možemo odrediti koliko se jedna vrijednost varijable razlikuje od druge. Dakle, povećanje telesne temperature za 1 stepen Celzijusa uvek znači povećanje toplote koju generiše fiksni broj jedinica. Međutim, skala intervala ima i pozitivne i negativne vrijednosti (ne postoji apsolutna nula). S tim u vezi, nemoguće je reći da je 20 stepeni Celzijusa duplo toplije od 10. Možemo samo konstatovati da je 20 stepeni jednako toplije od 10 kao što je 30 toplije od 20.

Racionalna skala (skala odnosa) ima jednu referentnu tačku i samo pozitivne vrijednosti. U medicini su najracionalnije skale koncentracije. Na primjer, nivo glukoze od 10 mmol/L je dvostruko veći od koncentracije u odnosu na 5 mmol/L. Za temperaturu, racionalna skala je Kelvinova skala, gde postoji apsolutna nula (nema toplote).

Treba dodati da svaka kvantitativna varijabla može biti kontinuirana, kao u slučaju mjerenja tjelesne temperature (ovo je kontinuirana intervalna skala), ili diskretna, ako računamo broj krvnih stanica ili potomstvo laboratorijskih životinja (ovo je diskretna racionalna skala).

Ove razlike su ključne za izbor metoda za statističku analizu eksperimentalnih rezultata. Dakle, za nominalne podatke primjenjujemo hi-kvadrat test, a dobro poznati Studentov test zahtijeva da varijabla (intervalna ili racionalna) bude kontinuirana.

Nakon što je pitanje o tipu varijable odlučeno, treba početi kreirati uzorci. Uzorak je mala grupa predmeta određene klase (u medicini - populacija). Da bi se dobili apsolutno tačni podaci, potrebno je proučiti sve objekte date klase, međutim, iz praktičnih (često finansijskih) razloga, proučava se samo dio populacije, koji se naziva uzorak. Nakon toga, statistička analiza omogućava istraživaču da proširi dobijene obrasce na čitavu populaciju sa određenim stepenom tačnosti. Zapravo, sve biomedicinske statistike imaju za cilj da dobiju što preciznije rezultate iz što manjeg broja opažanja, jer su etička razmatranja također važna kada se istražuje na ljudima. Ne možemo priuštiti da više pacijenata izložimo riziku nego što je potrebno.

Kreiranje uzorka regulirano je nizom obaveznih zahtjeva, čije kršenje može dovesti do pogrešnih zaključaka iz rezultata istraživanja. Prvo, važna je veličina uzorka. Točnost procjene proučavanih parametara ovisi o veličini uzorka. Ovdje treba obratiti pažnju na riječ "preciznost". Što je veća veličina proučavanih grupa, naučnik dobija tačnije (ali ne nužno tačne) rezultate. Da bi rezultati studija uzoraka bili prenosivi na cijelu populaciju u cjelini, uzorak mora biti predstavnik. Reprezentativnost uzorka pretpostavlja da on odražava sva bitna svojstva populacije. Drugim riječima, u istraživanim grupama osobe različitog pola, starosti, profesije, socijalnog statusa itd. susreću se sa istom učestalošću kao i u cjelokupnoj populaciji.

Međutim, prije nego počnete birati studijsku grupu, trebali biste utvrditi potrebu za proučavanjem određene populacije. Primjer populacije mogu biti svi pacijenti sa određenom nozologijom ili ljudi u radnoj dobi, itd. Prema tome, malo je vjerovatno da će rezultati dobijeni za populaciju mladih vojno sposobnih biti ekstrapolirani na žene u postmenopauzi. Skup karakteristika koje će imati ispitivana populacija određuje „generalizaciju“ podataka studije.

Uzorci se mogu formirati na različite načine. Najjednostavniji od njih je da se pomoću generatora slučajnih brojeva odabere potreban broj objekata iz populacije ili selektivni okvir(okvir za uzorkovanje). Ova metoda se zove " jednostavno nasumično uzorkovanje" Ako nasumično odaberete početnu tačku u okviru uzorkovanja, a zatim uzmete svaki drugi, peti ili deseti objekt (u zavisnosti od toga koje su veličine grupe potrebne u studiji), dobit ćete intervalno uzorkovanje. Intervalno uzorkovanje nije slučajno, jer se nikada ne isključuje mogućnost periodičnog ponavljanja podataka u okviru uzorkovanja.

Moguće je kreirati tzv. stratifikovani uzorak“, što pretpostavlja da se populacija sastoji od nekoliko različitih grupa i tu strukturu treba reproducirati u eksperimentalnoj grupi. Na primjer, ako je omjer muškaraca i žena u populaciji 30:70, onda bi u stratificiranom uzorku taj odnos trebao biti isti. Kod ovakvog pristupa je kritično ne prebalansirati uzorak, odnosno izbjeći homogenost njegovih karakteristika, inače istraživač može propustiti priliku da pronađe razlike ili odnose u podacima.

Pored opisanih metoda formiranja grupa, postoje i klaster I kvotno uzorkovanje. Prvi se koristi u slučaju kada je dobivanje potpunih informacija o okviru uzorka teško zbog njegove veličine. Tada se uzorak formira od nekoliko grupa uključenih u populaciju. Druga – kvota – je slična stratificiranom uzorkovanju, ali ovdje distribucija objekata ne odgovara onoj u populaciji.

Vraćajući se na veličinu uzorka, treba reći da je on usko povezan sa vjerovatnoćom statističkih grešaka prvog i drugog tipa. Statističke greške mogu biti posljedica činjenice da studija ne proučava cjelokupnu populaciju, već njen dio. Greška prvog tipa je pogrešno odstupanje Nulta hipoteza. Zauzvrat, nulta hipoteza je pretpostavka da su sve proučavane grupe preuzete iz iste opće populacije, što znači da su razlike ili odnosi između njih slučajni. Ako povučemo analogiju sa dijagnostičkim testovima, onda je greška tipa I lažno pozitivan rezultat.

Greška drugog tipa je pogrešno odstupanje. alternativna hipoteza, čije značenje je da razlike ili veze između grupa nisu rezultat slučajnih slučajnosti, već uticaja faktora koji se proučavaju. I opet, analogija s dijagnostikom: greška tipa II je lažno negativan rezultat. S ovom greškom je povezan koncept moć, koji nam govori koliko je određena statistička metoda efikasna u datim uslovima i njenu osjetljivost. Snaga se izračunava pomoću formule: 1-β, gdje je β vjerovatnoća greške tipa II. Ovaj indikator uglavnom zavisi od veličine uzorka. Što su grupe veće, to je manja vjerovatnoća greške tipa II i veća je moć statističkih testova. Ova ovisnost je barem kvadratna, odnosno smanjenje veličine uzorka za polovicu će dovesti do pada snage za najmanje četiri puta. Smatra se da je minimalna prihvatljiva snaga 80%, a maksimalni prihvatljiv nivo greške tipa I 5%. Međutim, uvijek treba imati na umu da su ove granice postavljene proizvoljno i da se mogu mijenjati ovisno o prirodi i ciljevima studije. Po pravilu, naučna zajednica prepoznaje proizvoljnu promenu snage, ali u velikoj većini slučajeva nivo greške tipa I ne može preći 5%.

Sve navedeno je direktno povezano sa fazom planiranja studije. Međutim, mnogi istraživači pogrešno posmatraju statističku obradu podataka samo kao neku vrstu manipulacije koja se vrši nakon završetka glavnog dijela posla. Često se, nakon završetka neplaniranog eksperimenta, pojavi neodoljiva želja da se na stranu naruči analiza statističkih podataka. Ali iz "gomile smeća" čak i statističaru će biti veoma teško da izvuče rezultat koji istraživač očekuje. Stoga, ako nemate dovoljno znanja o biostatistici, trebali biste potražiti pomoć u statističkoj analizi prije početka eksperimenta.

Prelazeći na sam postupak analize, treba istaći dva glavna tipa statističkih tehnika: deskriptivnu i demonstrativnu (analitičku). Deskriptivne tehnike uključuju metode koje vam omogućavaju da podatke predstavite u kompaktnom i lako razumljivom obliku. To uključuje tabele, grafikone, frekvencije (apsolutne i relativne), mjere centralne tendencije (srednja vrijednost, medijan, mod) i mjere disperzije podataka (varijansa, standardna devijacija, interkvartilni raspon, itd.). Drugim riječima, deskriptivne metode karakteriziraju uzorke koji se proučavaju.

Najpopularniji (iako često pogrešan) način opisivanja dostupnih kvantitativnih podataka je definiranje sljedećih indikatora:

  • broj zapažanja u uzorku ili njegovu veličinu;
  • prosječna vrijednost (aritmetička sredina);
  • standardna devijacija je mjera koliko variraju vrijednosti varijable.

Važno je zapamtiti da su aritmetička sredina i standardna devijacija mjere centralne tendencije i disperzije u prilično malom broju uzoraka. U takvim uzorcima vrijednosti većine objekata odstupaju od prosjeka s jednakom vjerojatnošću, a njihova distribucija formira simetrično "zvono" (Gaussova ili Gauss-Laplaceova kriva). Ova distribucija se naziva i "normalna", ali u praksi medicinskih eksperimenata javlja se samo u 30% slučajeva. Ako su vrijednosti varijable raspoređene asimetrično u odnosu na centar, onda je bolje opisati grupe koristeći medijanu i kvantile (percentili, kvartili, decili).

Nakon što je kompletiran opis grupa, potrebno je odgovoriti na pitanje o njihovim odnosima i mogućnosti generalizacije rezultata istraživanja na cjelokupnu populaciju. U tu svrhu koriste se biostatističke metode zasnovane na dokazima. To su oni kojih se istraživači prvo sjete kada je u pitanju statistička obrada podataka. Ova faza rada se obično naziva “testiranje statističkih hipoteza”.

Zadaci testiranja hipoteza mogu se podijeliti u dvije velike grupe. Prva grupa odgovara na pitanje da li postoje razlike između grupa u nivou nekog indikatora, na primer, razlike u nivou jetrenih transaminaza kod pacijenata sa hepatitisom i zdravih osoba. Druga grupa vam omogućava da dokažete postojanje veze između dva ili više indikatora, na primjer, funkcije jetre i imunološkog sistema.

Praktično, zadaci iz prve grupe mogu se podijeliti u dvije podvrste:

  • poređenje indikatora samo u dvije grupe (zdravi i bolesni, muškarci i žene);
  • poređenje tri ili više grupa (proučavanje različitih doza lijeka).

Mora se uzeti u obzir da se statističke metode značajno razlikuju za kvalitativne i kvantitativne podatke.

U situaciji kada je varijabla koja se proučava kvalitativna i upoređuju se samo dvije grupe, može se koristiti hi-kvadrat test. Ovo je prilično moćan i široko poznat kriterij, međutim, nije dovoljno efikasan ako je broj opservacija mali. Postoji nekoliko metoda za rješavanje ovog problema, kao što su Yatesova korekcija kontinuiteta i Fisherova egzaktna metoda.

Ako je varijabla koja se proučava kvantitativna, tada se može koristiti jedan od dva tipa statističkih testova. Kriterijumi prvog tipa zasnivaju se na specifičnom tipu distribucije populacije i operišu sa parametrima ove populacije. Takvi testovi se nazivaju “parametrijski” i obično se zasnivaju na pretpostavci normalne raspodjele vrijednosti. Neparametarski testovi se ne zasnivaju na pretpostavci o vrsti distribucije populacije i ne koriste njene parametre. Ponekad se takvi kriteriji nazivaju „testovima bez distribucije“. U određenoj mjeri, ovo je pogrešno, jer bilo koji neparametarski kriterij pretpostavlja da će distribucije u svim upoređenim grupama biti iste, inače se mogu dobiti lažno pozitivni rezultati.

Postoje dva parametarska testa primenjena na podatke ekstrahovane iz normalno raspoređene populacije: Studentov t-test za poređenje dve grupe i Fišerov F-test za testiranje jednakosti varijansi (takođe poznat kao analiza varijanse). Postoji mnogo više neparametarskih kriterijuma. Različiti testovi se međusobno razlikuju po pretpostavkama na kojima se zasnivaju, po složenosti proračuna, po statističkoj snazi ​​itd. Međutim, najprihvatljiviji u većini slučajeva su Wilcoxon test (za srodne grupe) i Mann-Whitney test , također poznat kao Wilcoxonov test za nezavisne uzorke. Ovi testovi su pogodni jer ne zahtijevaju pretpostavke o prirodi distribucije podataka. Ali ako se ispostavi da su uzorci uzeti iz normalno raspoređene populacije, onda se njihova statistička snaga neće značajno razlikovati od Studentovog testa.

Kompletan opis statističkih metoda može se naći u specijalizovanoj literaturi, međutim, ključna stvar je da svaki statistički test zahteva skup pravila (pretpostavki) i uslova za njegovu upotrebu, kao i mehaničku pretragu nekoliko metoda za pronalaženje „prave ” rezultat je apsolutno neprihvatljiv sa naučne tačke gledišta. U tom smislu, statistički testovi su slični lijekovima - svaki ima indikacije i kontraindikacije, nuspojave i vjerovatnoću neefikasnosti. A jednako je opasno i nekontrolisano korištenje statističkih testova, jer se na njima temelje hipoteze i zaključci.

Da bi se potpunije razumelo pitanje tačnosti statističke analize, potrebno je definisati i analizirati pojam „ verovatnoća poverenja". Vjerojatnost povjerenja je vrijednost koja se uzima kao granica između vjerovatnih i malo vjerovatnih događaja. Tradicionalno se označava slovom "p". Za mnoge istraživače, jedina svrha izvođenja statističke analize je izračunavanje željene p-vrijednosti, koja izgleda stavlja zareze u čuvenu frazu „pogubiti se ne može oprostiti“. Smatra se da je maksimalni prihvatljiv nivo pouzdanosti 0,05. Treba imati na umu da vjerovatnoća povjerenja nije vjerovatnoća nekog događaja, već stvar povjerenja. Postavljanjem vjerovatnoće povjerenja prije početka analize, na taj način određujemo stepen povjerenja u rezultate našeg istraživanja. A, kao što znate, pretjerana lakovjernost i pretjerana sumnjičavost podjednako negativno utječu na rezultate bilo kojeg rada.

Nivo pouzdanosti pokazuje koju maksimalnu vjerovatnoću pojave greške tipa I istraživač smatra prihvatljivom. Smanjenje nivoa pouzdanosti, drugim rečima, pooštravanje uslova za testiranje hipoteza, povećava verovatnoću grešaka drugog tipa. Shodno tome, izbor nivoa vjerovatnoće pouzdanosti treba izvršiti uzimajući u obzir moguću štetu od pojave grešaka prvog i drugog tipa. Na primjer, strogi okvir usvojen u biomedicinskoj statistici, koji definiše udio lažno pozitivnih rezultata kao ne više od 5%, je ozbiljna potreba, jer se na osnovu rezultata medicinskih istraživanja uvodi ili odbacuje novi tretman, a to je životno pitanje za hiljade ljudi.

Mora se imati na umu da sama p vrijednost nije baš informativna za doktora, jer samo ukazuje na vjerovatnoću pogrešnog odbacivanja nulte hipoteze. Ovaj pokazatelj ne govori ništa, na primjer, o veličini terapijskog učinka pri korištenju lijeka koji se proučava u općoj populaciji. Stoga postoji mišljenje da je umjesto nivoa vjerovatnoće povjerenja, bolje rezultate studije vrednovati veličinom intervala povjerenja. Interval pouzdanosti je raspon vrijednosti unutar kojeg se, s određenom vjerojatnošću, nalazi prava vrijednost populacije (za srednju vrijednost, medijan ili učestalost). U praksi je zgodnije imati obje ove vrijednosti, što vam omogućava da s većim povjerenjem procijenite primjenjivost dobivenih rezultata na populaciju u cjelini.

U zaključku, treba reći nekoliko riječi o alatima koje koristi statističar ili istraživač koji samostalno provodi analizu podataka. Ručni proračuni su odavno nestali. Postojeći statistički kompjuterski programi omogućavaju izvođenje statističkih analiza bez ozbiljne matematičke obuke. Tako moćni sistemi kao što su SPSS, SAS, R, itd. omogućavaju istraživaču da koristi složene i moćne statističke metode. Međutim, to nije uvijek dobra stvar. Bez poznavanja stepena primjenjivosti statističkih testova koji se koriste za specifične eksperimentalne podatke, istraživač može izvršiti proračune i čak dobiti neke izlazne brojeve, ali će rezultat biti vrlo sumnjiv. Stoga, preduslov za izvođenje statističke obrade eksperimentalnih rezultata mora biti dobro poznavanje matematičkih osnova statistike.


Oni su dovoljno detaljno opisani u domaćoj literaturi. U praksi ruskih preduzeća, međutim, koriste se samo neka od njih. Pogledajmo dalje neke metode statističke obrade.

Opće informacije

U praksi domaćih preduzeća oni su pretežno rasprostranjeni statističke metode kontrole. Ako govorimo o regulaciji tehnološkog procesa, ona se uočava izuzetno rijetko. Primjena statističkih metoda predviđa da preduzeće formira grupu stručnjaka koji imaju odgovarajuće kvalifikacije.

Značenje

Prema zahtjevima ISO ser. 9000, dobavljač mora utvrditi potrebu za statističkim metodama koje se koriste u razvoju, regulaciji i testiranju mogućnosti proizvodnog procesa i performansi proizvoda. Korištene tehnike su zasnovane na teoriji vjerovatnoće i matematičkim proračunima. Statističke metode analize podataka može se implementirati u bilo kojoj fazi životnog ciklusa proizvoda. Oni pružaju procjenu i obračun stepena heterogenosti proizvoda ili varijabilnosti njegovih svojstava u odnosu na utvrđene nazive ili tražene vrijednosti, kao i varijabilnost u procesu njegovog stvaranja. Statističke metode su tehnike pomoću kojih se može sa zadatom tačnošću i pouzdanošću suditi o stanju pojava koje se proučavaju. Oni vam omogućavaju da predvidite određene probleme i razvijete optimalna rješenja na osnovu proučavanih činjeničnih informacija, trendova i obrazaca.

Uputstvo za upotrebu

Glavna područja u kojima su rasprostranjeni statističke metode su:


Praksa razvijenih zemalja

Statističke metode su baza koja osigurava stvaranje proizvoda sa visokim potrošačkim karakteristikama. Ove tehnike se široko koriste u industrijski razvijenim zemljama. Statističke metode su, u suštini, garancije da potrošači dobijaju proizvode koji ispunjavaju utvrđene zahtjeve. Efekat njihove upotrebe dokazan je praksom industrijskih preduzeća u Japanu. Upravo su oni doprinijeli postizanju najvišeg nivoa proizvodnje u ovoj zemlji. Dugogodišnje iskustvo u stranim zemljama pokazuje koliko su ove tehnike efikasne. Konkretno, poznato je da je kompanija Hewlelt Packard, koristeći statističke metode, uspjela u jednom slučaju smanjiti broj kvarova mjesečno sa 9.000 na 45 jedinica.

Poteškoće u implementaciji

U domaćoj praksi postoji niz prepreka koje onemogućavaju upotrebu statističke metode proučavanja indikatori. Poteškoće nastaju zbog:


Razvoj programa

Mora se reći da je utvrđivanje potrebe za određenim statističkim metodama u oblasti kvaliteta, odabira i ovladavanja specifičnim tehnikama prilično složen i dugotrajan posao za svako domaće preduzeće. Za njegovu efektivnu implementaciju preporučljivo je izraditi poseban dugoročni program. Trebalo bi obezbijediti formiranje službe čiji će zadaci uključivati ​​organizaciju i metodološko vođenje primjene statističkih metoda. U okviru programa potrebno je obezbijediti opremanje odgovarajućim tehničkim sredstvima, obuku stručnjaka, te odrediti sastav proizvodnih zadataka koji se moraju rješavati odabranom tehnikom. Preporučljivo je započeti savladavanje korištenjem najjednostavnijih pristupa. Na primjer, možete koristiti dobro poznatu elementarnu proizvodnju. Nakon toga, preporučljivo je prijeći na druge tehnike. Na primjer, to može biti analiza varijanse, selektivna obrada informacija, regulacija procesa, planiranje faktorskih istraživanja i eksperimenata, itd.

Klasifikacija

Statističke metode ekonomske analize uključuju različite tehnike. Vrijedi reći da ih ima dosta. Međutim, vodeći stručnjak u oblasti upravljanja kvalitetom u Japanu, K. Ishikawa, preporučuje korištenje sedam glavnih metoda:

  1. Pareto grafikoni.
  2. Grupisanje informacija prema zajedničkim karakteristikama.
  3. Kontrolne kartice.
  4. Dijagrami uzroka i posljedica.
  5. Histogrami.
  6. Kontrolne liste.
  7. Scatter plots.

Na osnovu vlastitog iskustva upravljanja, Ishikawa tvrdi da se 95% svih pitanja i problema u preduzeću može riješiti korištenjem ovih sedam pristupa.

Pareto grafikon

Ovaj se zasniva na određenom omjeru. Zvao se "Pareto princip". Prema njegovim riječima, 80% posljedica javlja se iz 20% uzroka. prikazuje u jasnom i razumljivom obliku relativni uticaj svake okolnosti na ukupan problem u opadajućem redosledu. Ovaj utjecaj se može proučavati brojem gubitaka i nedostataka uzrokovanih svakim uzrokom. Relativni uticaj je ilustrovan pomoću šipki, a akumulirani uticaj faktora pomoću kumulativne prave linije.

Dijagram uzroka i posljedice

Na njemu je proučavani problem konvencionalno prikazan u obliku horizontalne ravne strelice, a uslovi i faktori koji posredno ili direktno utiču na njega su u obliku nagnutih. Prilikom izgradnje treba uzeti u obzir čak i naizgled beznačajne okolnosti. To je zbog činjenice da su u praksi prilično česti slučajevi u kojima se rješenje problema postiže eliminacijom nekoliko, naizgled nevažnih faktora. Razlozi koji utiču na glavne okolnosti (prvog i sledećeg reda) prikazani su na dijagramu horizontalnim kratkim strelicama. Detaljan dijagram će biti u obliku ribljeg skeleta.

Informacije o grupisanju

Ovo ekonomsko-statistički metod koristi se za organizovanje različitih indikatora koji su dobijeni procenom i merenjem jednog ili više parametara objekta. Obično se takve informacije predstavljaju u obliku neuređenog niza vrijednosti. To mogu biti linearne dimenzije obratka, temperatura topljenja, tvrdoća materijala, broj nedostataka i tako dalje. Na osnovu takvog sistema teško je izvući zaključke o svojstvima proizvoda ili procesima njegovog nastanka. Naručivanje se vrši pomoću linijskih grafova. Oni jasno pokazuju promjene posmatranih parametara u određenom periodu.

Kontrolna lista

U pravilu se prikazuje u obliku tabele frekvencijske distribucije pojavljivanja izmjerenih vrijednosti parametara objekta u odgovarajućim intervalima. Kontrolne liste se sastavljaju u zavisnosti od svrhe studije. Raspon vrijednosti indikatora podijeljen je na jednake intervale. Njihov broj se obično bira jednak kvadratnom korijenu broja izvršenih mjerenja. Obrazac bi trebao biti jednostavan kako biste izbjegli probleme prilikom popunjavanja, čitanja ili provjere.

trakasti grafikon

Predstavljen je u obliku stepenastog poligona. To jasno ilustruje distribuciju mjernih indikatora. Raspon utvrđenih vrijednosti podijeljen je na jednake intervale, koji su iscrtani duž ose apscise. Za svaki interval se konstruiše pravougaonik. Njegova visina jednaka je učestalosti pojavljivanja veličine u datom intervalu.

Scatter plots

Koriste se za testiranje hipoteze o odnosu između dvije varijable. Model je konstruiran na sljedeći način. Vrijednost jednog parametra je iscrtana na osi apscise, a vrijednost drugog parametra na osi ordinata. Kao rezultat, na grafikonu se pojavljuje tačka. Ovi koraci se ponavljaju za sve vrijednosti varijabli. Ako postoji veza, korelacijsko polje je izduženo, a smjer se neće poklapati sa smjerom y-ose. Ako nema ograničenja, ono će biti paralelno s jednom od osi ili će imati oblik kruga.

Kontrolne kartice

Koriste se prilikom evaluacije procesa u određenom periodu. Formiranje kontrolnih karata zasniva se na sljedećim odredbama:

  1. Svi procesi vremenom odstupaju od specificiranih parametara.
  2. Nestabilan tok pojava ne menja se slučajno. Odstupanja koja prelaze očekivane granice nisu slučajna.
  3. Pojedinačne promjene se mogu predvidjeti.
  4. Stabilan proces može nasumično odstupiti unutar očekivanih granica.

Upotreba u praksi ruskih preduzeća

Treba reći da domaće i strano iskustvo pokazuje da je najefikasniji statistički metod za procjenu stabilnosti i tačnosti opreme i tehnoloških procesa sastavljanje kontrolnih karata. Ova metoda se koristi i za regulisanje proizvodnih potencijala. Prilikom izrade karata potrebno je pravilno odabrati parametar koji se proučava. Preporučljivo je dati prednost onim pokazateljima koji su direktno povezani sa svrhom proizvoda, koji se lako mogu mjeriti i na koje se može utjecati kontrolom procesa. Ako je takav izbor težak ili nije opravdan, možete procijeniti količine koje su u korelaciji (međusobno povezane) s kontroliranim parametrom.

Nijanse

Ako je mjerenje indikatora sa tačnošću potrebnom za sastavljanje karata na osnovu kvantitativnih kriterija ekonomski ili tehnički nemoguće, koristi se alternativni indikator. S njim su povezani izrazi kao što su "defekt" i "defekt". Potonje se podrazumijeva kao svako pojedinačno neusklađenost proizvoda sa utvrđenim zahtjevima. Nedostaci su proizvodi koje nije dozvoljeno dati potrošačima zbog prisustva nedostataka na njima.

Posebnosti

Svaka vrsta kartice ima svoje specifičnosti. To se mora uzeti u obzir pri njihovom odabiru za određeni slučaj. Smatra se da su karte zasnovane na kvantitativnom kriteriju osjetljivije na promjene procesa od onih koje koriste alternativnu karakteristiku. Međutim, prve su radno intenzivnije. Koriste se za:

  1. Otklanjanje grešaka u procesu.
  2. Procjena mogućnosti implementacije tehnologije.
  3. Provjera ispravnosti rada opreme.
  4. Definicije tolerancije.
  5. Poređenje nekoliko prihvatljivih načina stvaranja proizvoda.

Dodatno

Ako se procesni poremećaj karakterizira pomakom kontroliranog parametra, potrebno je koristiti X-kartice. Ako dođe do povećanja disperzije vrijednosti, potrebno je odabrati R ili S-modele. Međutim, potrebno je uzeti u obzir niz karakteristika. Konkretno, upotreba S-mapa će omogućiti da se istovremeno preciznije i brže utvrdi poremećaj procesa nego R-modeli, ali konstrukcija ovih potonjih ne zahtijeva složene proračune.

Zaključak

U ekonomiji je moguće proučavati faktore koji se otkrivaju tokom kvalitativne procjene, u prostoru i dinamici. Uz njihovu pomoć možete izvršiti prediktivne proračune. Statističke metode ekonomske analize ne uključuju metode za procjenu uzročno-posljedičnih veza ekonomskih procesa i događaja, utvrđivanje obećavajućih i neiskorišćenih rezervi za povećanje poslovnih performansi. Drugim riječima, razmatrani pristupi ne uključuju faktorijalne tehnike.