Biograafiad Omadused Analüüs

Põhilised statistilised kategooriad. Kvalitatiivsete tunnuste seoste koefitsiendid

Rühmitamise meetod võimaldab uurida olekut ja suhteid majandusnähtused, kui rühmi iseloomustavad näitajad, mis paljastavad uuritava nähtuse olulisemad aspektid.

Analüüsimisel ja planeerimisel on vaja mitte toetuda juhuslikud faktid, vaid peamist, tüüpilist juurt väljendavatel näitajatel. See iseloomustus on antud erinevat tüüpi keskmised väärtused, samuti režiim ja mediaan.

Rahvastiku homogeensuse küsimust ei tohiks otsustada formaalselt selle jaotusvormi järgi. See, nagu küsimus tüüpilisest keskmisest, tuleb otsustada rahvastiku moodustavate põhjuste ja tingimuste põhjal. Homogeenne on selline kogum, mille üksused moodustuvad ühiste peamiste põhjuste ja määravate tingimuste mõjul üldine tase see omadus, mis on iseloomulik kogu elanikkonnale.

Tüpoloogiliste rühmituste teooria kohaselt ülioluline populatsiooni homogeensuse hindamisel ei kuulu see mitte leviku vormi, vaid variatsiooni suuruse ja kujunemise tingimuste alla. Kvalitatiivselt homogeenset komplekti iseloomustab varieerumine teatud piirides, mille järel algab uus kvaliteet. Samas tuleb agregaadi kvalitatiivse homogeensuse hindamiseks nendele piiridele läheneda asja olemuse, mitte formaalselt, kuna sama kogus erinevates tingimustes väljendab uut kvaliteeti. Näiteks sama töötajate arvu juures on mõne tööstusharu ettevõtted suured, teised aga väikesed.

Põhjalikuks ja süvaõpe nähtusi, selleks et objektiivselt iseloomustada nähtuste liike, nende seoseid ja protsesse, mis tulenevad süsteemi kui terviku arengust, on vaja kombineerida rühmade keskmised üldkeskmistega. Selliste keskmiste kombinatsioon on keerukate süsteemide analüüsi üks peamisi elemente. See kombinatsioon seob üheks tervikuks kaks orgaaniliselt üksteist täiendavat statistiline meetod: keskmiste meetod ja rühmitamise meetod. Keskmise arvutamisel asendatakse rühmati erinevad väärtused ühe keskmise väärtusega. Kus juhuslikud kõrvalekaldedüksikute üksuste atribuudi väärtused suurenemise või vähenemise suunas on vastastikku tasakaalustatud ja tühistavad üksteist ning keskmine väärtus näitab sellele rühmale iseloomuliku atribuudi tüüpilist suurust. Keskmine väärtus toimib populatsiooni tunnusena ja viitab samal ajal selle üksikule elemendile - nähtuse kvalitatiivsete tunnuste kandjale. Keskmise tähendus on üsna konkreetne, kuid samas abstraktne; see saadakse abstraheerides iga üksuse juhuslikust indiviidist, et tuvastada üldine, tüüpiline, mis on iseloomulik kõigile üksustele ja mis moodustab see komplekt. Keskmise väärtuse arvutamisel peaks rahvastiku ühikute arv olema piisavalt suur. Keskmise väärtus on defineeritud kui nähtuste kogumahu ja grupi rahvastikuüksuste arvu suhe. Grupeerimata andmete puhul on see lihtne aritmeetiline keskmine:

ja rühmitatud andmete puhul, kus igal tunnuse väärtusel on oma sagedus, kaalutud aritmeetiline keskmine:

kus X i- tunnuse väärtus; f i on nende tunnuste väärtuste sagedus.

Kuna aritmeetiline keskmine arvutatakse iseloomulike väärtuste summa suhtena kogu tugevus, ei ületa see kunagi neid väärtusi. Aritmeetilisel keskmisel on mitmeid omadusi, mida kasutatakse arvutuste sujuvamaks muutmiseks laialdaselt.

1. Hälvete summa individuaalsed väärtused märk keskmisest väärtusest on alati null:

Tõestus. n

Eraldades vasaku ja parem pool peal

2. Kui karakteristikuid (X i) muudetakse k korda, siis muutub ka aritmeetiline keskmine sisse xüks kord.

Tõestus.

Atribuudi uute väärtuste aritmeetilist keskmist tähistame X-ga, siis:

Püsiv väärtus 1/k saab summa märgist välja võtta ja siis saame:

3. Kui kõigist iseloomulikest väärtustest välja X i lahutage või lisage sama konstantne arv, siis aritmeetiline keskmine väheneb või suureneb selle võrra.

Tõestus.

Iseloomulike väärtuste kõrvalekallete keskmine konstantne arv on võrdne:

Seda tõestatakse samamoodi konstantse arvu liitmise korral.

4. Kui kõigi iseloomulike väärtuste sagedusi vähendatakse või suurendatakse n korda, siis keskmine ei muutu:

Kui on olemas andmed tunnuse kogumahu ja teadaolevate väärtuste kohta, kuid sagedused on teadmata, kasutatakse keskmise määramiseks kaalutud aritmeetilise keskmise valemit.

Näiteks on olemas andmed kapsa müügihindade ja erinevate müügiperioodide kogutulude kohta (tabel 1).

Tabel 1.

Kapsa müügihind ja erinevate müügiperioodide kogutulu


Kuna keskmine hind kujutab endast kogutulu suhet müüdud kapsa kogumahusse, tuleb esmalt määrata erinevate müügiperioodide müüdud kapsa kogus tulu ja hinna suhtena ning seejärel määrata keskmine hind müüs kapsast.

Meie näites oleks keskmine hind:

Kui arvutada sisse sel juhul keskmine müügihind lihtsa aritmeetilise keskmise järgi, siis saame teistsuguse tulemuse, mis moonutab tegelikku olukorda ja hindab keskmist müügihinda üle, kuna asjaolu, et suur osa müügist langeb madalama hinnaga hilisele kapsale arvesse võtta.

Mõnikord on vormil iseloomulike väärtuste esitamisel vaja määrata keskmine väärtus murdarvud, st täisarvude pöördarvud (näiteks tööviljakuse uurimisel selle pöördnäitaja, tööintensiivsuse kaudu). Sellistel juhtudel on soovitatav kasutada harmoonilise keskmise valemit:

Seega on väljundühiku valmistamiseks kuluv keskmine aeg harmooniline keskmine. Kui X 1 \u003d 1/4 tundi, X 2 \u003d 1/2 tundi, X 3 \u003d 1/3 tundi, siis on nende arvude harmooniline keskmine:

Keskmise väärtuse arvutamiseks kahe samanimelise näitaja, näiteks kasvumäärade suhetest, kasutatakse geomeetrilist keskmist, mis arvutatakse valemiga:

kus X 1 x X 2 ... x ... X 4 - kahe samanimelise koguse suhe, näiteks ahela kasvukiirused; n on kasvumäärade suhtarvude kogumi suurus.

Vaadeldavatel keskmistel väärtustel on järgmised omadused:

Olgu meil näiteks järgmised väärtused X(20; 40), siis on varem vaadeldud keskmiste tüübid võrdsed:

Populatsiooni koosseisu uurides saab tunnuse tüüpilist suurust hinnata nn struktuursete keskmiste – mooduse ja mediaani – järgi.

Moodnimetatakse üldkogumis kõige sagedamini esinevat tunnuse väärtust. Intervalli variatsioonireas leitakse esmalt modaalne intervall. Leitud modaalintervalli korral arvutatakse režiim järgmise valemiga:

kus X 0 on modaalintervalli alumine piir; d- intervalli väärtus; f 1, f 2, f 3 – premodaalsete, modaalsete ja postmodaalsete intervallide sagedus.

Moe väärtus intervalli seeriad graafiku põhjal üsna lihtne leida. Selleks tõmmatakse histogrammi kõrgeimas veerus kahe kõrvuti asetseva veeru piiridest kaks joont. Nende joonte lõikepunktist langetatakse risti abstsisstelje suhtes. Abstsissteljel oleva tunnuse väärtuseks on režiim (joonis 2).


Riis. 2

Praktiliste probleemide lahendamiseks suurim huvi tähistab tavaliselt režiimi, mida väljendatakse pigem intervallina kui diskreetse arvuna. Seda seletatakse režiimi eesmärgiga, mis peaks paljastama nähtuse levinumad mõõtmed.

Keskmine – homogeense populatsiooni kõikidele üksustele tüüpiline väärtus. Režiim on samuti tüüpiline väärtus, kuid see määrab otseselt atribuudi suuruse, mis on iseloomulik olulisele osale, kuid siiski mitte kogu populatsioonile. Tal on suur tähtsus mõne probleemi lahendamiseks, näiteks ennustada, mis suurustes jalanõud, riided peaksid olema mõeldud masstootmiseks jne.

Mediaan- funktsiooni väärtus, mis on vahemiku seeria keskel. See näitab rahvastiku ühikute jaotuskeskust ja jagab selle kaheks võrdseks osaks.

Mediaan on parim omadus keskne trend, kui äärmuslike intervallide piirid on avatud. Mediaan on jaotustaseme vastuvõetavam tunnus isegi siis, kui jaotusreas on liiga suuri või liiga väikseid väärtusi, millel on tugev mõju keskmisele, kuid mitte mediaanile. Mediaanil on ka lineaarse miinimumi omadus: summa absoluutväärtused tunnuse väärtuse kõrvalekalded üldkogumi kõigi üksuste puhul mediaanist on minimaalsed, s.o.

Sellel omadusel on suur tähtsus mõne praktilise probleemi lahendamisel – näiteks lühima võimaliku vahemaa arvutamisel erinevad tüübid transport, paigutada teenindusjaamad selliselt, et kaugus kõigi selles jaamas hooldatavate autodeni oleks minimaalne jne.

Mediaani otsimisel tehakse see kõigepealt kindlaks seerianumber levitamise seerias:

Lisaks leitakse seerianumbri järgi mediaan ise seeria akumuleeritud sagedustest. AT diskreetne seeria- ilma igasuguse arvutuseta, kuid intervallreas, teades mediaani järjekorranumbrit, kasutatakse akumuleeritud sagedusi mediaanintervalli leidmiseks, milles mediaani väärtus määratakse juba kõige lihtsama interpolatsiooni meetodiga. Mediaan arvutatakse järgmise valemi abil:

kus X 0 on mediaanintervalli alumine piir; d– intervalli väärtus; f _ 1 – mediaanintervallini akumuleeritud sagedus; f on mediaanintervalli sagedus.

Arvutame intervalljaotuse näitel välja keskmise, mooduse ja mediaani. Andmed on toodud tabelis. 2.


Seega saab jaotuskeskusena kasutada erinevaid näitajaid: keskmine, moodus ja mediaan,


ja igal neist omadustest on oma omadused. Seega on keskmise väärtuse jaoks iseloomulik, et kõik kõrvalekalded sellest individuaalsed väärtused märgid tühistavad üksteist, st.

Mediaani iseloomustab asjaolu, et atribuudi individuaalsete väärtuste kõrvalekallete summa sellest (märke arvestamata) on minimaalne. Režiim iseloomustab funktsiooni kõige sagedamini esinevat väärtust. Seetõttu tuleks sõltuvalt sellest, milline tunnustest uurija huvi pakub, valida üks vaadeldavatest omadustest. AT üksikjuhtudel kõik omadused arvutatakse.

Nende võrdlemine ja omavaheliste seoste tuvastamine aitab selgitada ühe või teise variatsioonirea jaotuse tunnuseid. Niisiis, sümmeetrilistes jadades, nagu meie puhul, langevad kõik kolm omadust (keskmine, režiim ja mediaan) ligikaudu kokku. Mida suurem on lahknevus moe ja keskmine, seda asümmeetrilisem seeria on. On kindlaks tehtud, et mõõdukalt asümmeetriliste seeriate korral on režiimi ja aritmeetilise keskmise erinevus ligikaudu kolm korda suurem kui mediaani ja aritmeetilise keskmise erinevus:

Selle suhte abil saab määrata ühe näitaja kahe teadaoleva hulgast. Sellest järeldub, et jaotuse tüübi iseloomustamiseks on oluline ka mooduse, mediaani ja keskmise kombinatsioon.

Arvutiteadus ja matemaatika – Teoreetilised materjalid esimeseks kollokviumiks

1. Teema matemaatiline statistika, selle peamised jaotised. Mõiste statistiline jaotus. Normaaljaotus. Millistel tingimustel on juhuslik suurus normaaljaotus?

Statistika on teadus, mis uurib kogusummat. wt. yavl-I, et tuvastada loomulik. ja uurida neid üldistatud näitajate abil.

Kõik matemaatilise statistika meetodid võib omistada selle kahele põhiosale: parameetrite statistilise hindamise teooriad ja statistiliste hüpoteeside kontrollimise teooriad.

Sektsioonid:

1. kirjeldav statistika

2. proovivõtu meetod, usaldusvahemikud

3. korrelatsioonianalüüs

4. regressioonanalüüs

5. kvalitatiivsete tunnuste analüüs

6. mitme muutujaga statistiline analüüs:

a) rühmitatud

b) faktoriaal

7. aegridade analüüs

8. diferentsiaalvõrrandid

9. matemaatiline modelleerimine ajaloolised protsessid

Levitamine:

Teoreetiline (lõpmatult palju objekte ja need käituvad ideaalselt)

Empiiriline (tõelised andmed, mida saab joonistada histogrammis)

Normaaljaotus - kui jaotuse olemust mõjutavad paljud tegurid ja ükski neist ei ole määrav. Eriti sageli kasutatakse praktikas.


2. Normaaljaotust saab graafiliselt kujutada kellukesekujulise sümmeetrilise ühetipulise kõverana. Selle kõvera iga punkti kõrgus (ordinaat) näitab, kui sageli vastav väärtus esineb. kirjeldav statistika. Keskmised väärtused - aritmeetiline keskmine, mediaan, režiim. Millistes olukordades annavad need kolm mõõdet sarnaseid väärtusi ja millistes olukordades on need väga erinevad?

Kirjeldav statistika - See on kirjeldav statistika.

aritmeetiline keskmine, mediaan, režiim - keskmised mõõdud - koefitsiendid, mis võivad iseloomustada objektide kogumit

· keskmine (aritmeetiline) väärtus – kõigi viidatud väärtuste summa koguarv tähelepanekud ( aktsepteeritud nimetused: tähendab või ), st. keskmine aritmeetiline väärtus omadust nimetatakse väärtuseks

kus on tunnuse y väärtus i- objekt, n- objektide arv agregaadis.

· mode - muutuja (M) kõige sagedamini esinev väärtus

· mediaan on keskmine väärtus (aktsepteeritud nimetused: mediaan, m). Mediaan on tunnuse "keskmine" väärtus selles mõttes, et pooltel populatsiooni objektidel on selle tunnuse väärtus väiksem ja teisel poolel rohkem kui mediaan. Ligikaudu saate mediaani arvutada, paigutades kõik atribuudi väärtused kasvavas (kahanevas) järjekorras ja leides sellest variatsioonireast arvu, millel on kas arv ( n+1)/2 - paaritu korral n, või asub numbritega numbrite vahel keskel n/2 ja ( n+1)/2 - paarisarvu korral n.

Kõiki loetletud omadusi ei saa kvalitatiivsete tunnuste jaoks arvutada. Kui atribuut on kvalitatiivne ja nominaalne, siis saab sellele leida ainult režiimi (selle väärtus on nominaalse atribuudi kõige sagedamini esineva kategooria nimi). Kui atribuut on auaste üks, siis lisaks režiimile saab sellele leida ka mediaani. Aritmeetilist keskmist saab arvutada ainult kvantitatiivsed tunnused.

Kvantitatiivsete andmete puhul mõõdetakse kõiki keskmise taseme tunnuseid samades ühikutes nagu algne atribuut ise.

Koefitsientide väärtused on samad, kui jaotusgraafik on sümmeetriline.


3. Heterogeensuse näitajad - dispersioon, keskmine ruut (standard)hälve, variatsioonikordaja. AT mis ühikutes neid mõõdetakse? Miks võtta kasutusele variatsioonikoefitsiendi mõiste?

· ruutkeskmine või standardhälve- iseloomulike väärtuste hajumise mõõt aritmeetilise keskmise väärtuse ümber (aktsepteeritud nimetused: Std.Dev. () standardhälve), s või s). Selle hälbe väärtus arvutatakse valemiga

.

· tunnuse dispersioon ( s2 või s2)

· variatsioonikoefitsient - standardhälbe ja aritmeetilise keskmise suhe, väljendatuna protsentides (statistikas tähistatakse tähega V). Koefitsient arvutatakse valemiga: .

Kõikneid meetmeid saab arvutada ainult kvantitatiivsete näitajate jaoks. Kõik need näitavad, kui tugevalt varieeruvad atribuudi väärtused (õigemini nende kõrvalekalded keskmisest) antud populatsioonis. Kuidas vähem väärtust hajuvusmõõtmised, seda lähemal on kõigi objektide tunnuse väärtused nende keskmisele väärtusele ja seega ka üksteisele. Kui hajuvusmõõte väärtus on võrdne nulliga, on atribuudi väärtused kõigi objektide jaoks samad.

Kõige sagedamini kasutatakse keskmist ruuthälvet (või standardhälvet s). Seda mõõdetakse, nagu aritmeetilist keskmist, samades ühikutes nagu algne tunnus ise. Kui atribuudi kõik väärtused muutuvad mitu korda, muutub standardhälve samamoodi, kui aga atribuudi kõiki väärtusi teatud summa võrra suurendada (vähendada), siis selle standardhälve Ei muutu. Koos standardhälbega kasutatakse sageli dispersiooni (= selle ruutu), kuid praktikas on see vähem mugav mõõt, sest. dispersiooniühikud ei ühti mõõtühikutega.

Variatsioonikordaja tähendus seisneb selles, et erinevalt s-st ei mõõda see atribuudi väärtuste leviku absoluutset, vaid suhtelist mõõdet statistilises üldkogumis.

Mida rohkem V , seda vähem homogeenne on populatsioon.

Homogeenne Üleminek Heterogeenne

V = 0–30% V = 30–50% V = 50–100%

Võib-olla »100% (liiga heterogeenne populatsioon).


4. Mõistevalikuline meetod. Esinduslik näidis, selle meetodid moodustamine Kahte tüüpi diskreetimisvigu. Usalduse tõenäosus.

Näidis:

Esindaja

Juhuslik

Mehaaniline proovivõtt – sarnane suvaline näidis(iga 10., 20. jne).

Looduslik (mis on aja jooksul HS-st alles jäänud) proovide võtmine.

Esinduslik näidis - peegeldab täpselt omadusi elanikkonnast.

Et proov õigesti kajastaks põhiomadused, mis on omane üldisele elanikkonnale, see peaks olema juhuslik, st. Kõigil üldkogumi üksustel peab olema võrdne võimalus valimisse sattuda.

Proovid moodustatakse spetsiaalsete tehnikaid. Lihtsaim on juhuslik valik, kasutades näiteks tavalist loosimist (väikeste populatsioonide puhul) või tabeleid. juhuslikud arvud. Suuremate, kuid üsna homogeensete populatsioonide puhul kasutatakse mehaanilist selektsiooni (mida kasutati Zemstvo statistikas). Teatud struktuuriga heterogeensete populatsioonide puhul kasutatakse sagedamini tüüpilist selektsiooni. On ka teisi meetodeid, sealhulgas - kombinatsioone erinevaid viise valik mitmes proovivõtu etapis.

Näidistulemused sisaldavad alati vigu. Need vead võib jagada kahte klassi: juhuslikud ja süstemaatilised. Esimesed hõlmavad valimi karakteristikute juhuslikke kõrvalekaldeid üldistest, mis on tingitud valimi moodustamise meetodi olemusest. Juhusliku vea väärtust saab arvutada (hinnata). Süstemaatilised vead seevastu mitte juhuslik; neid seostatakse valimi struktuuri kõrvalekaldega üldkogumi tegelikust struktuurist. Süstemaatilised vead ilmnevad siis, kui rikutakse juhusliku valiku põhireeglit – tagada, et kõikidel objektidel on võrdsed võimalused valimisse sattuda. Sellist statistikat ei ole võimalik hinnata.

Peamised allikad süstemaatilised vead on: a) moodustatud valimi mittevastavus uuringu eesmärkidele; b) teadmatus üldkogumi jaotuse olemusest ja sellest tulenevalt üldkogumi struktuuri rikkumine valimis; c) elanikkonna kõige mugavamate ja soodsamate elementide teadlik valik.

Usalduse tõenäosus -


5. Usalduse tõenäosus. Keskmine (standardne) ja marginaalne valimiviga. Usaldusvahemik keskmise väärtuse hindamiseks üldine elanikkond. Hüpoteesi kontrollimine umbes kahe valimi keskmise erinevuse statistiline olulisus.

Usaldusvahemik - arvutatud koefitsiendi väärtus, millesse meie arvates see geeni väärtus peaks langema. Agregaat.

Usalduse tõenäosus - tõenäosus, et geeni arvutatud koefitsiendi väärtus. Populatsioon jääb usaldusvahemikku. Kumba rohkem DV-d, seda rohkem CI-d.

Valimi keskmiste vältimatut hajumist üldkeskmise (s.o valimi keskmiste standardhälbe) ümber nimetatakse nn. standardne proovivõtuviga m, mida väljendatakse valemiga (s- keskmine standardhälve, n- näidissuurus). valimi standardviga on seda väiksem, seda väiksem on väärtuss(mis iseloomustab tunnuse väärtuste levikut) ja seda suurem on valimi suurus n.

Kui mittekvantitatiivsete andmetega töötamiseks kasutatakse valimimeetodit, siis mängib aritmeetilise keskmise rolli üldkogumis osakaal või sagedus q märk. Osakaal arvutatakse seda omadust omavate objektide arvu () ja objektide arvu suhtena kogu populatsioonis: . Laotuse mõõdiku rolli mängib kogus .

Sel juhul standardne proovivõtuvigamarvutatakse valemiga:

Valimi põhjal üldkogumi parameetrite hindamise täpsus ja usaldusväärsus on sees pöördvõrdeline seos: mida suurem on täpsus (st seda väiksem piirviga ja mida kitsam on usaldusvahemik, seda väiksem on sellise hinnangu usaldusväärsus (usaldusaste). Ja vastupidi – mida väiksem on hinnangu täpsus, seda suurem on selle usaldusväärsus. Tihti luuakse usaldusvahemik 95% usaldusväärsuse jaoks, seega on valimi võtmise piirviga tavaliselt võrdne kahekordse keskmise veaga.m..

Usaldusvahemik üldpopulatsiooni keskmise hindamiseks:

X(g.s.) =x(valitud) +-Δ =x(valitud) +- = X(valitud) +- σ(g.s.)/√n

Keskmise erinevuse kriteeriumid

Tihti tekib probleem kahe valimi keskmiste võrdlemisel, et kontrollida hüpoteesi, et need proovid saadi samast üldkogumist, ning valimi keskmiste väärtuste tegelikud lahknevused on seletatavad valimite juhuslikkusega.

Testitava hüpoteesi saab sõnastada järgmiselt: valimi keskmiste erinevus on juhuslik, s.o. üldkeskmised on mõlemal juhul võrdsed. Nagu statistiline tunnus väärtust kasutatakse uuesti t, mis on erinevus valimi keskmiste vahel jagatuna mõlema valimi keskmise standardveaga.

Statistilise tunnuse tegelikku väärtust võrreldakse valitud olulisuse tasemele vastava kriitilise väärtusega. Kui tegelik väärtus on suurem kui kriitiline väärtus, lükatakse kontrollitud hüpotees tagasi, s.t. vahendite erinevust peetakse oluliseks (oluliseks).


7. Korrelatsioon. Lineaarne korrelatsioonikordaja, selle valem, väärtuste piirid. Determinatsioonikoefitsient, selle tähenduslik tähendus. Mõiste korrelatsioonikordaja statistiline olulisus.

Korrelatsioonikordaja näitab, kui tihedalt on kaks muutujat seotud .

Korrelatsioonikordaja r võtab väärtused vahemikus -1 kuni +1. Kui a r= 1, siis on kahe muutuja vahel funktsionaalne positiivne lineaarne ühendus, st. hajuvusdiagrammil asuvad vastavad punktid positiivse kaldega sirgel. Kui a r = -1, siis on kahe muutuja vahel funktsionaalne negatiivne seos. Kui a r = 0, seejärel vaadeldavad muutujad lineaarselt sõltumatu, st. hajuvusgraafikus on punktipilv "horisontaalselt venitatud".

Regressioonivõrrand ja korrelatsioonikordaja on otstarbekas arvutada ainult juhul, kui muutujate vahelist sõltuvust saab vähemalt ligikaudselt lugeda lineaarseks. Vastasel juhul võivad tulemused olla täiesti valed, eelkõige võib korrelatsioonikordaja tugeva seose olemasolul olla nullilähedane. See kehtib eriti juhtudel, kui sõltuvus on selgelt mittelineaarne (näiteks muutujate vahelist sõltuvust kirjeldatakse ligikaudselt sinusoidi või parabooliga). Paljudel juhtudel saab sellest probleemist mööda minna algsete muutujate teisendamisega. Et aga aimata sellise teisenduse vajalikkust, s.o. et teada saada, mida andmed võivad sisaldada keerulised kujundid sõltuvused, on soovitav neid "näha". Seetõttu peaks kvantitatiivsete muutujate vaheliste seoste uurimine tavaliselt hõlmama hajuvusdiagrammide vaatamist.

Korrelatsioonikordajaid saab arvutada ilma regressioonisirge eelneva konstrueerimiseta. Antud juhul on küsimus märkide tõlgendamise kohta tõhusaks ja faktoriliseks, s.o. sõltuvat ja sõltumatut ei määrata ning korrelatsioone mõistetakse kui tunnuste väärtuste samaaegse muutumise järjepidevust või sünkroonsust üleminekul objektilt objektile.

Kui objekte iseloomustab terve hulk kvantitatiivseid tunnuseid, saab kohe ehitada nn. korrelatsioonimaatriks, st. ruudukujuline tabel, mille ridade ja veergude arv võrdub tunnuste arvuga ning iga rea ​​ja veeru ristumiskohas on vastava tunnuspaari korrelatsioonikordaja.

Korrelatsioonikordajal puudub sisuline tõlgendus. Kuid tema väljak, kutsus määramiskoefitsient(R2), Sellel on.

määramiskoefitsient (R 2) - see näitab, kui palju muutusi sõltuvas tunnuses on seletatav muutustega sõltumatus. Täpsemalt on see sõltumatu tunnuse dispersiooni osakaal, mis on seletatav sõltuva mõjuga .

Kui kaks muutujat on funktsionaalselt lineaarselt sõltuvad (hajuvusdiagrammi punktid asuvad samal sirgel), siis võime öelda, et muutuja muutus y täielikult seletatav muutuja muutusega x, ja see on just juhul, kui determinatsioonikoefitsient võrdne ühega(sel juhul võib korrelatsioonikordaja olla võrdne nii 1 kui ka -1-ga). Kui kaks muutujat on lineaarselt sõltumatud (meetod vähimruudud annab horisontaalse joone), siis muutuja y selle variatsioonid ei ole mingil juhul muutujale "võlgu". x– sel juhul on määramiskoefitsient võrdne nulliga. Vahepealsel juhul näitab determinatsioonikordaja, milline osa muutuja muutustest y seletatav muutuja muutusega x(mõnikord on mugav seda väärtust esitada protsentides).


8. Leiliruum jamitmekordne lineaarne regressioon. Koefitsient mitmekordne korrelatsioon. Regressioonikordaja tähenduslik tähendus, tähendus, mõiste t- statistika. Determinatsioonikoefitsiendi mõtestatud tähendus R2.

Regressioonanalüüs - Statistiline meetod, mis võimaldab koostada selgitavaid mudeleid, mis põhinevad tunnuste koostoimel.

kõige poolt lihtne juhtum suhe on paarisuhe, st. seos kahe tunnuse vahel. Eeldatakse, et seos kahe muutuja vahel on reeglina olemuselt põhjuslik, s.t. üks neist sõltub teisest. Esimene (sõltuv) kutsutakse sisse regressioonanalüüs tulemuseks teine ​​(sõltumatu) - faktoriaalne. Tuleb märkida, et alati ei ole võimalik üheselt määrata, milline kahest muutujast on sõltumatu ja milline sõltuv. Suhtlemist võib sageli pidada kahesuunaliseks.

Paari regressioonivõrrand : y = kx + b.

Kõige sagedamini mõjuvad sõltuvale muutujale korraga mitu tegurit, millest ainsat või peamist on raske välja tuua, näiteks sõltub ettevõtte tulu samaaegselt kahest tootmistegurist – töötajate arvust ja toiteallikast. Pealegi ei ole need kaks tegurit üksteisest sõltumatud.

Võrrand mitmekordne regressioon : y = k 1 · x 1 + k 2 · x 2 + … + b,

kus x 1, x 2, . . . - sõltumatud muutujad, millest uuritav (tulemuslik) muutuja y ühel või teisel määral sõltub;

k 1, k 2. . . on vastavate muutujate koefitsiendid ( regressioonikoefitsiendid), mis näitab, kui palju muutub saadud muutuja väärtus, kui üks sõltumatu muutuja muutub ühe võrra.

Mitmekordse regressiooni võrrand täpsustab regressioonimudel sõltuva muutuja käitumise selgitamine. Mitte ühtegi regressioonimudel ei suuda öelda, milline muutuja on sõltuv (mõju) ja milline sõltumatu (põhjused).

R - mitu koefitsienti korrelatsioon, mõõdab sõltumatute tunnuste mõju kogumit, saadud tunnuse seose lähedust kogu sõltumatute tunnuste kogumiga, väljendatuna protsentides%.

Näitab, millist osa tunnustest on tulemuste osas arvesse võetud, s.t. kui palju % on tunnuse y varieerumine seletatav vaadeldavate tunnuste X1, X2, X3 variatsioonidega.

T- statistikanäitab statistika taset. igaühe tähtsust regressioonikordaja, s.o. selle vastupidavus valimi suhtes.

T = b/ Δb

Statistiliselt oluline t >2. Mida suurem koefitsient, seda parem.

R kaudu ² teeme järelduse selle kohta, kui suur on arvesse võetud tunnuste % tulemust.


9.Meetodid mitmemõõtmeline Statistiline analüüs. Klasteranalüüs. Mõiste hierarhiline meetod ja umbesK-tähendab meetod. Mitme muutujaga klassifikatsioon koos hägusate komplektide kasutamine.

ON:

klastri analüüs

Faktoranalüüs

Mitmemõõtmeline skaleerimine

klastri analüüs - objektide ühendamine rühmaks, millel on ühine eesmärk (märke on palju).

Klasteranalüüsi meetodid:

1. hierarhiline(hierarhiline analüüsipuu):

peamine idee hierarhiline meetod seisneb rühmitatud objektide järjestikuses ühendamises - esmalt kõige lähemal ja seejärel üksteisest üha kaugemal. Klassifikatsiooni koostamise protseduur koosneb järjestikused sammud, millest igaühel on liidetud kaks lähimat objektide rühma (klastrid).

2. k-tähendab meetod.

Nõuab eelnevalt määratletud klasse (klastreid). Rõhutab klassisisest dispersiooni. tuginedes kõige tõenäolisema klasside arvu hüpoteesile. Meetodi ülesandeks on ehitada etteantud arv klastreid, mis peaksid üksteisest võimalikult palju erinema.

Klassifitseerimisprotseduur algab objektide juhusliku rühmitamise teel saadud etteantud arvu klastrite ehitamisega. Iga klaster peaks koosnema maksimaalselt "sarnastest" objektidest ja klastrid ise peaksid olema üksteisega maksimaalselt "erinevad".

Selle meetodi tulemused võimaldavad teil hankida kõigi klasside keskused (ja ka muud kirjeldava statistika parameetrid) iga algse funktsiooni jaoks ning näha ka graafiline esitus selle kohta, kuidas ja milliste parameetrite poolest saadud klassid erinevad.

Kui erinevate meetoditega saadud klassifikatsioonide tulemused langevad kokku, siis see kinnitab tegelikkust. Olemasolevad rühmad (usaldusväärsus, usaldusväärsus).


10. Mitmemõõtmelise statistilise analüüsi meetodid. Faktoranalüüs, selle kasutamise eesmärk. Mõiste faktorikaalud, nende piirid väärtused; teguritega seletatav osa kogu dispersioonist.

Mitmemõõtmeline statistiline analüüs. Selle eesmärk: lihtsustatud suurendatud objektide seeria ehitamine.

ON:

klastri analüüs

Faktoranalüüs

Mitmemõõtmeline skaleerimine

Keskmiselt faktoranalüüs peitub idee, et eksplitsiitselt etteantud tunnuste keeruliste seoste taga on suhteliselt lihtsam struktuur, mis peegeldab uuritava nähtuse kõige olulisemaid tunnuseid ning "välised" tunnused on varjatud funktsioonid. ühised tegurid selle struktuuri määratlemine.

Eesmärk: üleminek alates rohkem tunnused vähestele teguritele.

sisse faktoranalüüs kõik faktoriaalmudelis sisalduvad suurused on standardiseeritud, s.t. on mõõtmeteta suurused aritmeetilise keskmise 0 ja standardhälbega 1.

Teatud tunnuse ja ühisteguri vahelise seose koefitsienti, mis väljendab teguri mõju määra tunnusele, nimetatakse tegurikoormus selle ühise teguri jaoks . See on arv vahemikus –1 kuni 1. Mida kaugemal 0, seda tugevam on seos. Teguri koormuse väärtus teatud teguri puhul nullilähedane näitab, et see tegur seda tunnust praktiliselt ei mõjuta.

Üksikobjektis esineva teguri väärtust (ilmumise mõõtu) nimetatakse faktorikaal selle teguri objektiks. Tegurikaalud võimaldavad teil järjestada ja järjestada objekte iga teguri järgi. Mida suurem on objekti teguri kaal, seda rohkem avaldub see nähtuse see pool või muster, mida see tegur peegeldab. Tegurid on standardiseeritud väärtused, ei saa olla = null. Nullilähedased tegurikaalud näitavad keskmine aste teguri ilmingud, positiivne - et see aste on üle keskmise, negatiivne - umbes nii. et see on alla keskmise.

Teguri kaalu tabelis on n read objektide arvu järgi ja k veerud ühistegurite arvu järgi. Objektide asukoht iga teguri teljel näitab ühelt poolt nende järjestust selle teguri järgi ja teiselt poolt nende paigutuse ühtlust või ebaühtlust, objekte kujutavate punktide klastrite olemasolu. , mis võimaldab visuaalselt esile tõsta enam-vähem homogeenseid rühmi.


11. Kvalitatiivsete märkide tüübid. Nominaaltunnused, näited alates ajaloolised allikad. Ettenägematute olukordade tabel. Nimitunnuste ühenduskoefitsient, selle väärtuste piirid.

Hinnangulised andmed on esitatud kategooriate kaupa, mille puhul järjekord ei ole absoluutselt oluline. Nende jaoks pole määratletud muud võrdlusviisi, välja arvatud sõnasõnaline sobivus/mittevastavus.

Nominaalsete muutujate näited:

· Kodakondsus: inglise, valgevene, saksa, vene, jaapani jne.

· Amet: töötaja, arst, sõjaväelane, õpetaja jne.

· Hariduse profiil: humanitaar-, tehniline-, meditsiini-, juriidiline jne.

Kui haridustaseme puhul võiks veel inimesi võrrelda "parem-halvem" või "kõrgem-madalam", siis nüüd oleme isegi sellest võimalusest ilma jäetud; ainus õige võrdlusviis on öelda, et need isiksused "on kõik ajaloolased" või "kõik pole juristid".

Ettenägematute olukordade tabelid

Kontingentsitabel on ristkülikukujuline tabel, mille ridadel on märgitud ühe tunnuse kategooriad (näiteks erinevad sotsiaalsed rühmad), veergudel aga teise tunnuse kategooriad (näiteks erakondlik kuuluvus). Iga kollektsiooni objekt kuulub selle tabeli ühte lahtrisse vastavalt sellele, millisesse kategooriasse see kummagi kahe tunnuse puhul kuulub. Seega on tabeli lahtrites numbrid, mis tähistavad kahe tunnuse kategooriate ühise esinemise sagedusi (teatud sotsiaalsesse rühma kuuluvate ja teatud erakonda kuuluvate inimeste arv). Olenevalt nende sageduste jaotuse olemusest tabelis saab hinnata, kas tunnuste vahel on seos. Mille vahel on seos sotsiaalne staatus ja erakondlik kuuluvus? Sel juhul viitaks seose olemasolu teatud poliitiliste eelistuste olemasolule erinevate liikmete seas sotsiaalsed rühmad. Vormiliselt mõistetakse seda seost kui üksikute kategooriate kombinatsioonide sagedasemat (või vastupidi, harvemat) ühist esinemist võrreldes eeldatava esinemisega - olukorda, kus objektid esinevad seal puhtjuhuslikult (näiteks talupoegade suurem osakaal aastal Trudoviku partei ja kadettide partei aadlikud, kui nende sotsiaalsete rühmade osakaal kogu duumasaadikute elanikkonnas).


12. Kvalitatiivsete märkide tüübid. Järjekorramärgid, näited alates ajaloolised allikad. AT millised on koefitsientide väärtuste piirid astme korrelatsioon? Milliseid koefitsiente tuleks kasutada auastme ja vahelise seose hindamiseks nimimärgid?

Kvalitatiivsed (või kategoorilised) andmed jagunevad kahte tüüpi: järjestatud ja nominaalsed.

Auaste andmedon esindatud kategooriatega, mille järjekorra saab määrata, s.t. kategooriad on võrreldavad põhimõttel "rohkem-vähem" või "parem-halvem".

Auastmemuutujate näited:

· Eksamihinded on väljendunud auastmega ja neid väljendatakse sellistes kategooriates nagu "suurepärane", "hea", "rahuldav" jne.

· Haridustaseme võib esitada kategooriate kogumina: "kõrgem", "keskharidus" jne.

Muidugi saame kasutusele võtta pingerida ja selle abil järjestada kõik inimesed, kelle haridustaset või testi tulemust teame. Kuid kas on tõsi, et "hea" on sama palju halvem kui "suurepärane" kui "rahuldav" on halvem kui "hea"? Vaatamata sellele, et formaalselt võib hinnete puhul saada punktide vahe, on vaevalt korrektne mõõta vahemaad "suurepärasest" kuni "heani" samade reeglite järgi nagu Moskva ja Peterburi vahemaa puhul. . Haridustaseme puhul on eriti selgelt näha, et lihtsad arvutused on võimatud, sest puudub ühtne reegel "keskhariduse" ja "kõrghariduse" lahutamiseks, isegi kui me omistame kõrgharidusele koodi "3" ja keskharidusele koodi "2".

Kvalitatiivsete andmete eripära ei tähenda, et neid ei saaks analüüsida matemaatiliste ja statistiliste meetoditega.

Mitmeid objekte, mis on järjestatud vastavalt teatud omaduse avaldumisastmele, nimetatakse järjestatuks, iga sellise seeria number määratakse koht.

Statistikas nimetatakse paari tunnuse vahelise seose mõõtmeid, millest igaüks järjestab uuritud objektide komplekti. astme korrelatsioonikordajad .

Need koefitsiendid on koostatud järgmise kolme omaduse alusel:

· kui mõlema tunnuse järjestatud seeriad langevad täielikult kokku (st iga objekt on mõlemas seerias samal kohal), peaks järgu korrelatsioonikordaja olema võrdne +1-ga, mis tähendab täielikku positiivset korrelatsiooni:

· kui samas reas olevad objektid asuvad vastupidises järjekorras võrreldes teisega on koefitsient -1, mis tähendab täielikku negatiivset korrelatsiooni;

· muudes olukordades on koefitsiendi väärtused vahemikus [-1, +1]; koefitsiendi mooduli tõus 0-lt 1-le iseloomustab kahe järjestatud rea vastavuse suurenemist.

Määratud omadused omavad järgu korrelatsioonikordajaid Spearman r ja Kedalla t .

Kedalli koefitsient annab korrelatsioonile konservatiivsema hinnangu kui Spearmani koefitsient (arvuline väärtustalati vähem kuir).

Kvalitatiivsete tunnuste seoste koefitsiendid

Kvalitatiivsete tunnuste seose hindamiseks on vaja koefitsienti, mis maksimaalse seose korral omaks teatud maksimumi ja võimaldaks omavahel võrrelda. erinevad lauad tunnustevahelise seose tugevuse järgi. Sel juhul sobime Crameri koefitsient V .

Hii-ruuttesti väärtuse põhjal võimaldab Crameri koefitsient mõõta kahe liigitatud muutuja vahelise seose tugevust - mõõta seda arvuga, mis võtab väärtused vahemikus 0 kuni 1, s.o. täielikust suhtlemise puudumisest kuni maksimumini tugev ühendus. Koefitsient võimaldab võrrelda sõltuvusi erinevad märgid, et paljastada rohkem ja vähem tugevaid seoseid.


13. Matemaatika modelleerimine ajaloolised protsessid janähtusi. Mõiste "mudel" määratlus. Kolme tüüpi mudeleid, nende näited kasutada sisse ajalooline uurimine.

14. Diferentsiaalvõrrandid kui peamine ehitustööriist matemaatilised mudelid teoreetiline tüüp. Nende omadused võrreldes simulatsiooni ja statistilise tüübi mudelitega. Sellise mudeli näide.

Saada oma head tööd teadmistebaasi on lihtne. Kasutage allolevat vormi

Hea töö saidile">

Üliõpilased, magistrandid, noored teadlased, kes kasutavad teadmistebaasi oma õpingutes ja töös, on teile väga tänulikud.

postitatud http://www.allbest.ru/

1. ülesanne

Mõnes piirkonnas praegune aasta Pandi toime 12 390 ja eelmisel aastal 11 800 kuritegu. Arvutage (%) jooksval aastal registreeritud kuritegude arvu kasvutempo ja kasvutempo eelmise aasta suhtes. Arvutage välja ka kuritegevuse määr iga aasta kohta, kui piirkonna elanikkond on lõpus Eelmine aasta oli 1 475 000 ja jooksva aasta lõpus 1 770 000 inimest. Tehke järeldused kuritegevuse dünaamika kohta piirkonnas.

Lahendus: Kuritegevusest täpse pildi saamiseks on väga oluline selline kuritegevuse näitaja nagu dünaamika ehk ajas muutumine. Kuritegevuse dünaamikat iseloomustavad mõisted absoluutne kasv (või kahanemine) ning kuritegevuse kasvu ja kasvu kiirus, et teha kindlaks, millised need tunnused teatud valemite järgi arvutatakse.

Kuritegevuse kasvumäärad arvutatakse dünaamika põhinäitajate põhjal, mis hõlmab mitme aasta (ja mõnikord ka aastakümnete, kui on vaja laiaulatuslikku materjali katvust) andmete võrdlemist konstantse baasiga, mille all mõistetakse kuritegevuse taset. algperioodil analüüsimiseks. See arvutus võimaldab kriminoloogidel suurel määral tagada võrreldavuse suhtelised näitajad, arvutatuna protsentides, mis näitavad, kuidas korreleerub järgnevate perioodide kuritegevus eelnevaga.

Arvutamisel võetakse 100% algse aasta andmetest; järgnevate aastate näitajad kajastavad ainult kasvu protsenti, mis teeb arvutuse täpsemaks ja pildi objektiivsemaks; suhteliste andmetega opereerides on võimalik välistada kriminaalvastutuseikka jõudnud elanike arvu suurenemise või vähenemise mõju kuritegevuse vähenemisele või suurenemisele.

Kuritegevuse kasvumäär arvutatakse protsentides. Kuritegevuse kasvumäär näitab, kui palju on hilisem kuritegevuse määr eelmise perioodiga võrreldes suurenenud või vähenenud. Vastu võetud sümbol kasvukiiruse vektor: kui protsenti suureneb, pannakse plussmärk, kui väheneb, pannakse miinusmärk.

Seoses meie ülesande tingimustega peaksime rakendama vastavaid valemeid ning arvutama kuritegevuse kasvu ja kasvu.

1) Kuritegevuse kasvutempo arvutatakse valemiga ^

Tr \u003d U / U2 * 100%,

kus U on kuritegevuse määra näitaja ja U2 on eelmise perioodi kuritegevuse näitaja. Seega on kuritegevuse kasvumäär probleemi tingimustes - 12390/11800 * 100% = 1,05%.

2) Kuritegevuse kasvumäär arvutatakse järgmise valemiga:

Tpr \u003d Tr-100%.

Seega on kasvumäär vastavalt ülesande tingimustele 1,05% -100% = 98,95%.

Konkreetne koondnäitaja on kuritegevuse tase kokku registreeritud kuritegusid, mis on korrelatsioonis rahvaarvuga. See tähistab kuritegude arvu 100 000, 10 000 või 1000 elaniku kohta ning on objektiivne kuritegevuse mõõt, mis võimaldab võrrelda selle taset erinevates piirkondades ja erinevatel aastatel.

Kuritegevuse määr aitab adekvaatsemalt hinnata ühe elaniku kohta arvutatud kuritegevuse taseme dünaamikat.

Kuritegevuse tase arvutatakse järgmise valemi abil:

KP \u003d (P x 100000): N,

kus P - absoluutarv registreeritud kuriteod; ja H on kogupopulatsiooni absoluutarv.

Mõlemad näitajad on võetud samas territoriaalses ja ajalises mahus. Kuritegude arvu arvestatakse tavaliselt 100 000 elaniku kohta. Kuid väikese kuritegude arvu ja elanike arvu korral (linnas, linnaosas, ettevõttes) saab kuritegevuse määra arvutada 10 tuhande või 1 tuhande elaniku kohta. igal juhul tähendavad need numbrid vaadeldava koefitsiendi dimensiooni, mis tuleb ära märkida: kuritegude arv 100 000 või 10 000 elaniku kohta.

Arvutame kuritegevuse määra meie probleemi tingimuste alusel:

1) CP = (12390 * 100000): 1 770 000 inimest. = 700 (käesoleval aastal).

2) CP = (11800 * 100000): 1 475 000 = 800 (eelmine aasta).

Kuritegevus piirkonnas väheneb, sest kuritegevuse määra analüüsides võib järeldada, et piirkonna elanike arvu kasvuga (16,6%) ja kuritegude arvu mõningase kasvuga 1,05% võrra üldiselt on kuritegevuse kasv väheneb (-98,95%).

2. ülesanne

Asutuse teenistusse vastu võetud 11 noore spetsialisti vanus oli jooksval aastal vastavalt 19,25,21,23,23,23,25,20,18,20,21 aastat. Tehke andmed kokku ja rühmitage statistilises sagedustabelis. Selguse huvides koostage sageduste hulknurk ja leidke ka palgatud töötajate vanuse modaal-, mediaan- ja keskmine väärtus.

Lahendus: rühmitamine- see on elanikkonna jagunemine rühmadeks, mis on mingil moel homogeensed. Rahvastiku üksikute üksuste seisukohalt on rühmitus rahvastiku üksikute üksuste liitumine rühmadeks, mis on mingil moel homogeensed.

Rühmitamise meetod põhineb järgmistel kategooriatel - rühmitamise atribuut, rühmitamise intervall ja rühmade arv.

Rühmitamise märk- see on märk, mille järgi rahvastiku üksikud üksused ühendatakse homogeenseteks rühmadeks.

Intervall visandab rühmade kvantitatiivsed piirid. Reeglina tähistab see intervalli atribuudi maksimaalse ja minimaalse väärtuse vahel rühmas.

Rühmade arvu määramine.

Rühmade arv määratakse ligikaudu Sturgessi valemiga:

n = 1 + 3,2log n = 1 + 3,2log(11) = 4.

Intervalli laius on:

Xmax- maksimaalne väärtus rühmitustunnus agregaadis. Xmin – rühmitamise atribuudi minimaalne väärtus. Määratleme rühma piirid.

Grupi number

Alumine joon

Ülemine piir

Sama tunnusväärtus toimib kahe külgneva (eelmise ja järgneva) rühma ülemise ja alumise piirina.

Iga seeria väärtuse jaoks arvutame, mitu korda see konkreetsesse intervalli langeb. Selleks sortige seeriad kasvavas järjekorras.

rahvaarvu

sagedus fi

Sageduse hulknurk on tiheduse ja tõenäosuse graafik juhuslik muutuja, on katkendlik joon, mis ühendab rühmitusintervallide mediaanväärtustele vastavad punktid nende intervallide sagedustega.

Tähendab:

Moodsõnasõnaline tähendus. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

kus x 0 - modaalintervalli algus; h - intervalli väärtus; f 2 - modaalintervallile vastav sagedus; f 1 - premodaalne sagedus; f 3 - postmodaalne sagedus.

Valime intervalli alguseks 19,75, kuna just see intervall moodustab suurima arvu.

Seeria levinuim väärtus on 20,92.

Mediaan. Mediaan jagab valimi kaheks osaks: pool varianti on mediaanist väiksem, pool rohkem.

Intervalljaotuse seerias saab kohe määrata ainult intervalli, milles mood või mediaan paikneb. Mediaan vastab vahemiku keskel olevale valikule. Mediaan on intervall 19,75-21,5, sest selles intervallis on akumuleeritud sagedus S suurem kui mediaanarv (mediaan on esimene intervall, mille akumuleeritud sagedus S ületab poole kogu summa sagedused).

Seega jääb 50% rahvastikuühikutest alla 21,28.

3. ülesanne

Määrake nõutav valimi suurus Venemaa föderaalse karistusteenistuse sertifitseeritud töötajate keskmise vanuse uurimiseks tingimusel, et standardhälve on 10 aastat ja maksimaalne lubatud valimiviga ei tohiks ületada 5%.

Otsime lahendust ümbervalimiseks valimi suuruse määramise valemi järgi.

Ф(t) = g/2 = 0,95/2 = 0,475 ja Laplace'i tabeli järgi vastab see väärtus t=1,96.

Hinnanguline standardhälve s = 10; proovivõtu viga e = 5.

4. ülesanne

Järgmises tabelis on esitatud ametlik osakondade statistika süüdimõistetute jaotuse kohta vangistuse (karistuse) järgi aastatel 2002–2011, mis on postitatud Venemaa föderaalse karistusteenistuse ametlikule veebisaidile: www.fsin.su. Leida iga kalendriaasta kohta süüdimõistetute arvu vahemik ja variatsioonikoefitsient ning teha järeldused selle statistilise tunnuse struktuuri homogeensuse kohta.

Peamine andmete homogeensust iseloomustav näitaja on variatsioonikordaja. Statistikas on üldtunnustatud, et kui koefitsiendi väärtus on alla 33%, siis on andmekogum homogeenne, kui üle 33%, siis heterogeenne.

Variatsioonikoefitsient

Sest v? 30%, siis on populatsioon homogeenne ja varieeruvus nõrk. Saadud tulemusi võib usaldada.

Karistuse tähtaeg

1 kuni 3 aastat

3 kuni 5 aastat

5 kuni 10 aastat

10 kuni 15 aastat vana

Üle 15 aasta

Maksimaalne väärtus (MAX funktsioon)

Minimaalne väärtus (MIN-funktsioon)

Laiuse variatsioon

Keskmine väärtus (funktsioon AVERAGE)

Standardhälve (STANDAR LONA funktsioon)

Variatsioonikoefitsient

lihtne keskmine:

Mood tähenduses

Mediaan

Leiame vahemiku seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab rea väärtusele 70580. Seetõttu on mediaan Me = 70580.

Variatsiooninäitajad. .

R \u003d X max - X min.

R = 295916-2250 = 293666.

Keskmine lineaarne hälve

Iga seeria väärtus erineb teisest keskmiselt 90895,71 võrra.

Dispersioon

(keskmine viga proovid).

Iga seeria väärtus erineb keskmisest väärtusest 103008 keskmiselt 107169,83 võrra.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Sest v>

või

Võnketegur

lihtne keskmine:

Mood

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame vahemiku seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab jada väärtusele 76186. Seetõttu on mediaan Me = 76186.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R = X max - X min

R = 291112-3101 = 288011.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 83422,69 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 97334,29 keskmiselt 100750,25 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnkekoefitsient, lineaarne koefitsient variatsioonid, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab suhtelist volatiilsust äärmuslikud väärtused funktsioon keskmise ümber.

lihtne keskmine:

Mood sõnasõnaline tähendus. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame vahemiku seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab jada väärtusele 71093. Seetõttu on mediaan Me = 71093.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R = X max - X min

R = 243852-3856 = 239996.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 68998,08 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 85765,57 keskmiselt 82541,55 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

:

Mood. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame järjestatud seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab rea väärtusele 74588. Seetõttu on mediaan Me = 74588.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R \u003d X max - X min,

R=242984-5304=237680.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 73148,73 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 92104,14 keskmiselt 82873,1 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

lihtne aritmeetiline keskmine:

Mood. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame vahemiku seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab jada väärtusele 76678. Seetõttu on mediaan Me = 76678

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R \u003d X max - X min.

R = 249346-6536 = 242810.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 79680,53 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 99551,71 keskmiselt 87389,04 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

lihtne aritmeetiline keskmine:

Mood. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame vahemiku seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab jada väärtusele 76461. Seetõttu on mediaan Me = 76461.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R \u003d X max - X min.

R = 254722-6704 = 248018.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 82302,82 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 102346,71 keskmiselt 89787,88 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

lihtne aritmeetiline keskmine:

Mood. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame vahemiku seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab rea väärtusele 78959. Seetõttu on mediaan Me = 78959.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R \u003d X max - X min.

R = 261334-7635 = 253699.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 83791,55 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 104898,86 keskmiselt 91616,15 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

lihtne aritmeetiline keskmine:

Mood. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame vahemiku seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab jada väärtusele 75916. Seetõttu on mediaan Me = 75916.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R \u003d X max - X min.

R=263863-8145=255718.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 82767,96 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 103440,71 keskmiselt 91207,92 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

lihtne aritmeetiline keskmine:

Mood. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame järjestatud seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab seeria 78019 väärtusele. Seetõttu on mediaan Me = 78019.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R = X max - X min

R = 260094-7798 = 252296.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 77827,76 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 99212,29 keskmiselt 88081,39 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

lihtne aritmeetiline keskmine:

Mood. Režiim on tunnuse kõige levinum väärtus antud populatsiooni ühikutes.

Režiimi pole (kõik seeria väärtused on individuaalsed).

Mediaan. Mediaan on selle tunnuse väärtus, mis jagab järjestatud seeria ühikud kaheks osaks. Mediaan vastab vahemiku keskel olevale valikule.

Leiame järjestatud seeria keskkoha: h = (n + 1) / 2 = (7 + 1) / 2 = 4. See arv vastab rea väärtusele 72248. Seetõttu on mediaan Me = 72248.

Variatsiooninäitajad. Absoluutsed variatsioonimäärad.

Variatsioonivahemik on erinevus esmase seeria atribuudi maksimaalse ja minimaalse väärtuse vahel.

R \u003d X max - X min.

R = 242137-7173 = 234964.

Keskmine lineaarne hälve- arvutatakse, et võtta arvesse uuritava üldkogumi kõigi üksuste erinevusi.

Iga seeria väärtus erineb teisest keskmiselt 70459,02 võrra.

Dispersioon- iseloomustab hajutuse mõõdet selle keskmise väärtuse ümber (dispersiooni mõõt, s.o. kõrvalekalle keskmisest).

Standardhälve(keskmine diskreetimisviga).

Iga seeria väärtus erineb keskmisest väärtusest 91375,14 keskmiselt 80674,43 võrra.

Variatsiooni suhtelised mõõdud. Suhteliste variatsiooninäitajate hulka kuuluvad: võnketegur, lineaarne variatsioonitegur, suhteline lineaarne hälve.

Variatsioonikoefitsient- populatsiooni väärtuste suhtelise leviku mõõt: näitab, kui suur osa selle suuruse keskmisest väärtusest on selle keskmine levik.

Kuna v>70%, läheneb populatsioon heterogeensuse piirile ja kõikumine on tugev.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline. Sel juhul viivad mitmesugused statistilised meetodid praktilistes uuringutes populatsiooni homogeensesse vormi.

Lineaarne variatsioonikoefitsient või Suhteline lineaarne hälve- iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

Võnketegur- peegeldab atribuudi äärmuslike väärtuste suhtelist kõikumist keskmise ümber.

5. ülesanne

Eelmise ülesande tingimustes rühmitage antud lausete intervallid ümber, et parandada tunnuse varieerumise suhtelisi näitajaid 2010. aastal. Koostada histogrammid süüdimõistetute jaotusest vangistuse (karistuse) tähtaegade järgi 2010. aasta kohta enne ja pärast andmete rühmitamist ning teha järeldused uuritava statistilise tunnuse struktuuri homogeensuse kohta.

Lahendus:

Kuna v>30%, kuid v<70 %, то вариация умеренная.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline.

Järjestame andmed ümber järgmiselt:

Gruppi 1) kuuluvad rühmad: kuni aasta, aasta, 1-3 aastat, vastavalt 156978.

Rühm 2) hõlmab grupist üle 3 kuni 5 aastat täielikult ja 1/5 grupist üle 5 kuni 10 aasta, saame 1/5 * 260094 + 168651 = 220669,8.

Rühm 3) sisaldab 3\5 rühma 5 kuni 10, st. 3\5*260094=156056.4.

4. rühm) (1\5*260094)+(1\5*78019)=67622,6.

5. rühm) 3\5*78019=46811,4.

6. rühm 30744+(1\5*78019)=46347,8.

Tulpdiagramm. Uuritud statistilise tunnuse homogeensuse kohta järelduse saamiseks arvutame variatsioonikordaja:

Kuna v>30%, kuid v<70 %, то вариация умеренная.

Variatsioonikoefitsient on palju suurem kui 33%. Järelikult on vaadeldav hulk heterogeenne ja selle keskmine ebapiisavalt tüüpiline.

6. ülesanne

Kirjeldage lühidalt (abstraktselt, 1-2 leheküljel) hiljutise sotsiaal- ja õigusvaldkonna ametliku statistilise uuringu sisu ja tulemused (vajalikud on teie valitud teemad, lingid Interneti-allikatele), tehke järeldused ja esitage asjakohased statistilised andmed. hüpoteesid lühiajaliseks perspektiiviks.

Ametliku statistilise uuringuna võeti uuring viivispalgavõlgade kohta seisuga 1. detsember 2015.

Alates 1. detsembrist 2015 organisatsioonide andmetel (ei ole seotud väikeettevõtetega) koguvõlg ulatus vaadeldud majandustegevuse tüüpide palkade osas 3900 miljonit rublateda ja võrreldes 1. novembriga 2015 kasvas 395 miljoni rubla võrra (11,3%).

Tähtaja ületanud töötasu omavahendite puudumise tõttu seisuga 1. detsember 2015 ulatus 3818 miljonit rublateda, ehk 97,9% viivisvõlgade kogusummast. Võrreldes 01.11.2015 see kasvas 389 miljoni rubla võrra (11,3%). Võlg rahaliste vahendite mitteõigeaegse laekumise tõttu kõikide tasandite eelarvetest ulatus 82 miljonit rublateda ja kasvas võrreldes 2015. aasta 1. novembriga. 6 miljoni rubla võrra (7,7%), sealhulgas võlg föderaalriigist eelarve ulatus 62 miljoni rublani ja vähenes võrreldes 2015. aasta 1. novembriga. 6 miljoni rubla võrra (8,6%), Vene Föderatsiooni subjektide eelarved oli 1,1 miljonit rubla (kasv 0,2 miljonit rubla ehk 20,7%), kohalikud eelarved - 19 miljonit rubla (kasv 12 miljonit rubla ehk 2,5 korda).

Mäetööstuses, töötlevas tööstuses, tervishoiu- ja sotsiaalteenustes, kalanduses ja kalakasvatuses tekivad 100% tasumata palgavõlgnevused organisatsioonide omavahendite puudumise tõttu.

Viivispalga võlgnevuste kogusummast langeb töötleva tööstuse, 29% ehituse, 9% elektri, gaasi ja vee tootmise ja jaotamise, 7% transpordi, 6% mäetööstuse, 5% võlgnevuste kogusummast. - põllumajandus, jahindus ja teenuste osutamine nendes piirkondades, metsaraie.

Töötasu võlgnevuste maht 01.12.2015 seisuga moodustas vaadeldud majandustegevuse liikide puhul alla 1% töötajate kuupalga kuludest.

Palgavõlgnevused viimase kuu eest, mille osas tehti viitvõlad, moodustas viivisvõlgade kogusumma keskmiselt 29%: elektri, gaasi ja vee tootmine ja jaotamine - 75%, tegevus haridusvaldkonnas - 37%, tervishoid ja sotsiaalteenused - 35%, teadus- ja arendustegevus - 32%, ehitus - 29%, transport - 23%, töötlev tööstus - 22%.

Väljamaksmata töötasude kogusummast moodustavad 2014. aastal tekkinud võlad 457 miljonit rubla (11,7%), 2013. a. ja varem - 657 miljonit rubla (16,8%).

Üldiselt võib palgavõlgade dünaamikat jälgides (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif) järeldada, et märkimisväärne langus toimub jaanuar, veebruar 2016.

Peamine võlaprotsent langeb töötlevale tööstusele - 37%, 29% - ehitusele, tõenäoliselt on selle põhjuseks tarbijate nõudluse vähenemine toodete järele ja kasum vastavalt väheneb.

Esitame hüpoteesi. Alates 2016. aasta jaanuarist väheneb võlaprotsent tulenevalt järgmise aasta aastaeelarve jaotusest, arvestades palgavõlgnevuste osalist tagasimaksmist ja ulatub 2700 miljonini Kuritegevuse varieerumise dünaamika mediaan

Hüpoteesi kontrollimiseks (võtame aluseks selle tabeli http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Koostame diskreetse variatsioonirea. Selleks sorteerige seeriad kasvavas järjekorras ja loendage iga seeria elemendi korduste arv.

Arvutame keskmise:

Arvutame dispersiooni. Dispersioon – iseloomustab dispersiooni mõõtu selle keskväärtuse ümber (dispersiooni mõõt, s.t. kõrvalekalle keskmisest).

Kasutades ühepoolset testi, mille b = 0,05, kontrollige seda hüpoteesi, kui valimi n = 24 kuud keskmine oli 2741,25 ja dispersioon on teada ja võrdne y = 193469,27

Lahendus. Standardhälve:

Esitatakse nullhüpotees H 0, et üldkogumi matemaatilise ootuse väärtus on võrdne arvuga m 0: = 2700.

Alternatiivne hüpotees:

H 1: m? 2700, kriitiline ala - kahepoolne.

Nullhüpoteesi testimiseks kasutatakse juhuslikku muutujat:

kus x on valimi keskmine; S on üldkogumi standardhälve.

Kui nullhüpotees on tõene, on juhuslikul suurusel T standardne normaaljaotus. Statistilise T kriitiline väärtus määratakse alternatiivse hüpoteesi tüübi alusel:

P(|T|

Leiame statistika T eksperimentaalse väärtuse:

Kuna valimi suurus on üsna suur (n>30), saab standardhälbe tegeliku väärtuse asemel kasutada selle hinnangut S=439,851.

F (t cr) \u003d (1-b) / 2 = (1-0,05) / 2 = 0,475.

Laplace'i funktsioonitabeli järgi leiame millise t kp juures väärtuse Ф (t kp) = 0,475.

Kriteeriumi T katseväärtus ei langenud kriitilisse piirkonda T ? t kp , seega tuleks nullhüpoteesiga nõustuda. Üldkogumi matemaatilise ootuse väärtuseks võib võtta 2700

Bibliograafia

1. Kazantsev S.Ya. Õigusstatistika: Õpik / Toim. S.Ya. Kazantseva, S.Ya. Lebedeva - M.: UNITY-DANA: Seadus ja õigus, 2009

2. Kurys? in K.N. Õigusstatistika alused: õpik. toetus / K.N. Kurys? Venemaa VUI FPS. - Vladimir, 2005. - 44 lk.

3. Makarova N.V. Statistika Excelis: õpik. toetus / N.V. Makarova, V.Ya. Trofimets. - M.: Rahandus ja statistika.

4. Kondratjuk L.V., Ovtšinski V.S. Kriminoloogiline mõõde / toim. K.K. Gorjainov. - M.: Norma, 2008.

5. Jakovlev V.B. Statistika. Arvutused Microsoft Excelis: õpik. Käsiraamat ülikoolidele / V.B. Jakovlev. - M.: Kolos, 2005. - 352 lk.

Majutatud saidil Allbest.ru

...

Sarnased dokumendid

    Alaealiste kuritegevuse uurimine kriminoloogilise uurimisobjekti seisukohalt. Seos teismeliste alkoholismi, ainete kuritarvitamise, narkosõltuvuse ja kuritegevuse vahel. Alaealiste kuritegevuse ennetamise põhjused ja tingimused ning viisid.

    kursusetöö, lisatud 08.04.2011

    Konkreetse kriminoloogilise uurimistöö metoodika. Vägivaldse kuritegevuse ja selle ennetamise kriminoloogilised tunnused. Avalik oht ja vägivallakuritegude tagajärgede raskus. Kuritegevuse statistika.

    kontrolltöö, lisatud 15.01.2011

    Kuritegevuse määra arvutamise valem. Ühe kohtuniku aasta keskmise töökoormuse, kriminaalasjade uurimise keskmise kestuse, kuritegevuse aastase keskmise kasvutempo arvutamine. Režiimiindikaatorite, mediaani, variatsiooni ja standardhälbe arvutamine.

    test, lisatud 20.04.2011

    Palgakuritegevuse aluste uurimine: mõiste, elemendid, objektid ja subjektiivsed aspektid. Sotsiaalse ja erikriminoloogilise kuritegevuse ennetamise kirjeldus palgasõduri motiividel. Kuritegevuse ennetamise meetmete komplekti väljatöötamine.

    lõputöö, lisatud 09.11.2012

    Kriminoloogilise prognoosimise mõiste ja teema. Kuritegevuse seisundi, taseme, struktuuri ja dünaamika võimalike muutuste väljaselgitamine tulevikus. Hinnang kuritegevuse arengule tulevikus. Kuriteokontrolli planeerimine ja ennetamine.

    kursusetöö, lisatud 29.05.2015

    Kriminoloogilise prognoosimise ja kujundamise tüüpide uurimine kuritegevuse valdkonnas. Alaealiste kuritegevuse prognoosimise tunnused Kasahstani Vabariigis. Kuritegevuse vastu võitlemise programmide väljatöötamine riiklikul tasandil.

    lõputöö, lisatud 25.10.2015

    Alaealiste kuritegevus kui kriminoloogilise uurimise objekt. Alaealiste kuritegevuse põhilised, kriminoloogilised tunnused. Kuritegevuse seis. Alaealiste isikuomaduste tunnused.

    abstraktne, lisatud 01.04.2003

    Tänapäeva naiste kuritegeliku käitumise suundumused: raskete ja retsidivistlike kuritegude kasv ja püsiv osakaal, kurjategijate noorenemine ning eakate naiste arvu kasv süüdimõistetute hulgas. Üldised meetmed naiste kuritegevuse ennetamiseks.

    abstraktne, lisatud 03.01.2014

    Süüdimõistetute struktuuri ja kategooriate koordineerimise suhteliste näitajate arvutamine toimepandud kuritegude raskusastme järgi. Kuritegevuse ja karistusregistri määrad föderaalpiirkondade ja Venemaa kui terviku lõikes. Dünaamika näitajate arvutamine MS Exceli abil.

    test, lisatud 31.07.2011

    Varjatud kuritegevuse mõiste, liigid, tähendused, määrajad, põhjused, ennetamise ja vähendamise meetodid. Kuritegevuse taseme määramine ja selle struktuuri analüüs. Süstemaatiline lähenemine varjatud kuritegevuse kui sotsiaalse nähtuse uurimisele.

abstraktne

Keskmised väärtused ja variatsiooninäitajad

1. Keskmiste olemus statistikas

2. Keskmiste tüübid ja nende arvutamise meetodid

3. Peamised variatsiooninäitajad ja nende olulisus statistikas

1. Keskmiste kaalude olemusnäod statistikas

Massiliste sotsiaal-majanduslike nähtuste uurimise käigus on vaja välja selgitada nende ühised omadused, tüüpilised suurused ja iseloomulikud tunnused. Üldistava keskmise vajadus tekib siis, kui uuritava üldkogumi ühikuid iseloomustavad tunnused varieeruvad kvantitatiivselt. Näiteks kudujate päevase toodangu suurus tekstiilitehases oleneb üldistest tootmise tingimustest, kudujad kasutavad samu tooraineid, töötavad samadel masinatel jne. Samal ajal kõigub üksikute kudujate tunnitoodang; varieerub, kuna see sõltub iga kuduja individuaalsetest omadustest (tema kvalifikatsioon, töökogemus jne). Ettevõtte kõigi kudujate päevase toodangu iseloomustamiseks on vaja arvutada keskmine päevatoodang, kuna ainult selles näitajas kajastuvad kudujate üldised tootmistingimused.

Seega tähendab keskmiste üldistavate näitajate arvutamine tähelepanu hajumist (abstraktsiooni) tunnuse suurusjärgus kajastuvatest tunnustest üksikutes ühikutes ning tüüpiliste tunnuste ja omaduste tuvastamist, mis on antud hulgale ühised.

Seega on statistika keskmine väärtus märgi ja statistilise üldkogumi üldistatud kvantitatiivne tunnus. See väljendab tunnuse iseloomulikku, tüüpilist väärtust populatsiooni ühikutes, mis kujunevad antud koha ja aja tingimustes tegurite kogumi mõjul. Erinevate tegurite toime tekitab kõikumisi, keskmistatud tunnuse varieerumist. Keskmine väärtus on nende tegevuse üldine mõõt, kõigi nende tegurite tulemus. Keskmine väärtus iseloomustab populatsiooni keskmistatud tunnuse järgi, kuid viitab üldkogumi ühikule. Näiteks antud ettevõtte keskmine toodang töötaja kohta on kogu (mis tahes ajaperioodi) toodangu ja selle töötajate koguarvu (sama perioodi keskmine) suhe. See iseloomustab antud agregaadi tööviljakust, kuid viitab ühele töötajale. Massinähtuse keskmises väärtuses tühistatakse juhuslikest asjaoludest tingitud individuaalsed erinevused statistilise üldkogumi ühikutes keskmistatud atribuudi väärtustes. Selle vastastikuse tühistamise tulemusena avaldub keskmises nähtuste antud statistilise kogumi üldine, loomulik omadus. Keskmistatud atribuudi keskmiste ja individuaalsete väärtuste vahel on dialektiline seos, nagu ka üldise ja üksikisiku vahel. Keskmine on statistikateaduse kõige olulisem kategooria ja üldistavate näitajate kõige olulisem vorm. Paljud ühiskonnaelu nähtused saavad selgeks ja kindlateks alles siis, kui neid üldistatakse keskmiste kujul. Sellised on näiteks eespool mainitud tööviljakus, töötajate kogusumma, põllukultuuride saagikus jne. Keskmine on statistika kõige olulisem teadusliku üldistuse meetod. Selles mõttes räägitakse majanduses laialdaselt kasutatavast keskmiste meetodist. Paljud majandusteaduse kategooriad on määratletud keskmise mõistega.

Keskmise väärtuse õige rakendamise peamiseks tingimuseks on statistilise üldkogumi homogeensus vastavalt keskmistatud tunnusele. Homogeenne statistiline totaalsus on selline tervik, milles selle moodustavad elemendid (ühikud) on käesoleva uurimuse jaoks oluliste tunnuste poolest sarnased ja kuuluvad sama tüüpi nähtuste hulka. Homogeenne populatsioon, mis on mõnes mõttes homogeenne, võib teistes aspektides olla heterogeenne. Ainult selliste agregaatide keskmistes avalduvad analüüsitava nähtuse spetsiifilised tunnused, arengumustrid. Heterogeense statistilise üldkogumi jaoks arvutatud keskmine, s.o. selline, kus kvalitatiivselt erinevad nähtused kombineeritakse, kaotab oma teadusliku tähtsuse. Sellised keskmised on fiktiivsed, mitte ainult ei anna tegelikkusest aimu, vaid ka moonutavad seda. Homogeensete statistiliste agregaatide moodustamiseks viiakse läbi asjakohane rühmitamine. Rühmituste abil ja kvalitatiivselt homogeenses komplektis saab eristada kvantitatiivselt iseloomulikke rühmi. Igaühele neist saab arvutada oma keskmise, mida nimetatakse grupi (era) keskmiseks, erinevalt üldisest keskmisest (rahvastiku kui terviku kohta).

2. Keskmiste tüübid

Keskmiste metoodikas on suure tähtsusega keskmise vormi valiku küsimused, s.o. valemid, mille abil saate keskmise väärtuse õigesti arvutada, ja keskmise kaalu valik. Kõige sagedamini kasutatav statistikas koondkeskmine, aritmeetiline keskmine, harmooniline keskmine, keskminegeomeetriline, ruutkeskmine, moodus ja mediaan. Konkreetse valemi kasutamine sõltub keskmistatud tunnuse sisust ja konkreetsetest andmetest, mille põhjal see arvutada tuleb. Keskmise vormi valimiseks saab kasutada nn keskmist algsuhet.

2.1 Aritmeetiline keskmine

Aritmeetiline keskmine on keskmise üks levinumaid vorme. Aritmeetiline keskmine arvutatakse muutuva üksikute väärtuste (valikute) summa jagatisena. kirjutage oma numbrile alla. Aritmeetilist keskmist kasutatakse juhtudel, kui homogeense statistilise üldkogumi nähtuste muutuva atribuudi maht moodustatakse statistilise üldkogumi kõigi nähtuste ühikute atribuudi väärtuste liitmisel. Seal on järgmised aritmeetilised keskmised väärtused:

1) lihtne aritmeetiline keskmine, mis määratakse lihtsalt muutuva atribuudi kvantitatiivsete väärtuste liitmisel ja selle summa jagamisel nende variantidega ning arvutatakse järgmise valemi abil:

X – statistilise üldkogumi keskmine väärtus,

x i – statistilise üldkogumi nähtuste üksikute varieeruvate variantide summa,

n i - statistilise üldkogumi nähtuste varieeruvate variantide arv.

2) Kaalutud aritmeetiline keskmine- nähtuse märgi keskmine väärtus, mis on arvutatud kaalusid arvesse võttes. Keskmiste väärtuste kaalud on sagedused, millega keskmistatud tunnuse üksikuid väärtusi võetakse selle keskmise väärtuse arvutamisel arvesse. Keskmise väärtuse kaalude valik sõltub keskmistatud tunnuse olemusest ja keskmiste väärtuste arvutamiseks saadaolevate andmete olemusest. Keskmiste väärtuste kaaludena võivad olla näitajad statistilise üldkogumi osade ühikute arvu või suuruste kohta (absoluutsete või suhteliste väärtuste kujul), millel on nähtuse nähtuse keskmistatud tunnuse antud variant (väärtus). statistiline üldkogum, samuti keskmistatud tunnusega seotud näitaja väärtus. Kaalutud aritmeetiline keskmine arvutatakse järgmise valemi abil:

X- aritmeetiline kaalutud keskmine,

x – statistilise üldkogumi nähtuste üksikute varieeruvate variantide väärtus,

Lihtsa ja kaalutud aritmeetilise keskmise eesmärk on määrata muutuja atribuudi keskmine väärtus. Kui uuritavas statistilises populatsioonis esinevad tunnuse väärtuste variandid ühekordselt või on sama kaaluga, siis kasutatakse lihtsat aritmeetilist keskmist, aga kui selle tunnuse väärtuste variandid esinevad mitu korda. uuritud populatsioon või erineva kaaluga, kasutatakse muutuja tunnuse keskmise väärtuse määramiseks aritmeetilist keskmist.kaalutud.

2.2 Keskmine harmooniline

Harmoonilise keskmise abil arvutatakse keskmine väärtus, kui kaalude kohta puuduvad otsesed andmed, ning keskmistatud atribuudi (x) variandid ja variantide väärtuste korrutis seda väärtust omavate ühikute arvuga. w (w = xf) on teada.

See keskmine arvutatakse järgmiste valemite abil:

1.) Keskmine harmooniline lihtne:

X - harmooniline lihtne,

n - statistilise üldkogumi nähtuste varieeruvate variantide arv.

2) Keskmine harmooniline kaalutud:

X – harmooniline kaalutud keskmine,

x – statistilise üldkogumi nähtuste üksikute varieeruvate variantide summa,

Harmoonilise kaalu kasutamisel tuvastatakse kaalud ja nii saadakse sama tulemus, mis annaks kaalutud aritmeetilise keskmise arvutamise, kui kõik selleks vajalikud andmed oleksid teada.

2.3 Keskmine agregaat

Keskmine koondsumma arvutatakse järgmise valemiga:

X – keskmine koondnäitaja,

x – statistilise üldkogumi nähtuste üksikute varieeruvate variantide summa,

Koondkeskmine arvutatakse juhtudel, kui keskmise algsuhte lugeja ja nimetaja väärtused on teada (saadaval).

2.4 Geomeetriline keskmine

Geomeetriline keskmine on üks keskmise väärtuse vormidest ja arvutatakse n-nda astme juurena üksikute väärtuste - tunnuse (x) variantide - korrutisest ja määratakse järgmise valemiga:

Geomeetrilist keskmist kasutatakse peamiselt keskmiste kasvumäärade arvutamisel.

2.5 Režiim ja mediaan

Eespool vaadeldud keskmiste kõrval on nn struktuursed keskmised - mood ja mediaan.

Mode (Mo) on tunnuse kõige sagedamini esinev väärtus populatsiooniühikutes. Diskreetsete seeriate puhul on sellel valikul kõrgeim sagedus.

Intervallvariatsiooniridades on võimalik määrata ennekõike intervall, milles režiim paikneb, s.t. niinimetatud modaalne intervall. Võrdsete intervallidega variatsioonireas määratakse modaalintervall kõrgeima sagedusega, ebavõrdsete intervallidega jadades suurima jaotustihedusega.

Režiimi määramiseks võrdsete intervallidega ridades kasutage järgmise vormi valemit:

Хн - modaalse intervalli alumine piir,

h - intervalli väärtus,

f 1 , f 2 , f 3 - vastavalt premodaalsete, modaalsete ja postmodaalsete intervallide sagedused (või üksikasjad).

Intervalli seerias on režiim graafiliselt leitav. Selleks tõmmatakse histogrammi kõrgeimas veerus kahe kõrvuti asetseva veeru piiridest kaks joont. Seejärel langetatakse nende ristumispunktist risti abstsissteljele. Perpendikulaarile vastav tunnusväärtus abstsissil on režiim.

Paljudel juhtudel eelistatakse populatsiooni kui üldistatud näitaja iseloomustamisel režiimi, mitte aritmeetilist keskmist.

Seega ei ole turul hindu uurides fikseeritud ja dünaamikas uuritud mitte mingi toote keskmine hind, vaid modaalne; uurides elanikkonna nõudlust teatud suuruse jalanõude või riiete järele, pakub huvi määrata jalanõude modaalsuurus ja keskmine suurus kui selline ei oma siinkohal üldse tähtsust. Mood ei paku mitte ainult iseseisvat huvi, vaid mängib ka keskmise abinäitaja rolli, iseloomustades selle tüüpilisust. Kui aritmeetiline keskmine on väärtuselt režiimile lähedane, siis on see tüüpiline.

Mediaan (Me) on järjestatud seeria keskmise üksuse tunnuse väärtus. (Reastatud seeria on seeria, mille atribuutide väärtused on kirjutatud kasvavas või kahanevas järjekorras.)

Mediaani leidmiseks määratakse esmalt selle seerianumber. Selleks liidetakse paaritu arvu ühikutega kõigi sageduste summale üks ja kõik jagatakse kahega. Kui ühikute arv on paaris, on seerias kaks keskmist ühikut ja kõigi reeglite kohaselt tuleks mediaan määrata nende kahe ühiku väärtuste keskmisena. Seejuures praktiliselt paarisarvu ühikute juures leitakse mediaan ühiku atribuudi väärtusena, mille järjekorranumbri määrab sageduste kogusumma jagatud kahega. Teades mediaani järjekorranumbrit, on akumuleeritud sageduste järgi lihtne leida selle väärtust.

Intervallreas leitakse pärast mediaani järjekorranumbri määramist kumulatiivsete sageduste (partiikulaaride) abil mediaanintervall ning seejärel kõige lihtsama interpolatsioonitehnika abil määratakse mediaani enda väärtus. Seda arvutust väljendatakse järgmise valemiga:

X n - mediaanintervalli alumine piir,

h - mediaanintervalli väärtus,

Mediaani järgarv,

S Me - 1 sagedus (sagedus), mis on kogunenud kuni mediaanintervallini,

F Me - mediaanintervalli sagedus (eriti).

Kirjaliku valemi järgi liidetakse mediaanintervalli alumisele piirile selline osa intervalli väärtusest, mis langeb selle rühma ühikute murdosale, mis mediaani järgarvust puuduvad. Teisisõnu, mediaani arvutamine põhineb eeldusel, et tunnuse kasv iga rühma üksuste vahel toimub ühtlaselt. Öeldu põhjal saab mediaani arvutada ka teistmoodi. Pärast mediaanintervalli määramist on võimalik mediaanintervalli (Xv) ülemisest piirist lahutada see osa intervallist, mis langeb mediaani järjekorranumbrit ületavale ühikute murdosale, s.o. järgmise valemi järgi:

Mediaani saab määrata ka graafiliselt. Selleks ehitatakse kummulaat ja akumuleeritud sageduste (partiklite) skaala punktist, mis vastab mediaani järjekorranumbrile, tõmmatakse sirgjoon paralleelselt x-teljega, kuni see lõikub kumulatsiooniga. Seejärel langetatakse näidatud sirge ja kumulatsiooni ristumispunktist risti abstsissteljele. Joonistatud ordinaadile (risti) vastava tunnuse väärtus x-teljel on mediaan.

Samal põhimõttel on lihtne leida tunnuse väärtust järjestatud seeria mis tahes ühiku jaoks.

Seega saab variatsioonirea keskmise väärtuse arvutamiseks kasutada tervet komplekti näitajaid.

3. Vari põhinäitajadja nende tähtsust statistikas

Populatsiooni ühikutes muutuva tunnuse uurimisel ei tohiks piirduda ainult üksikute valikute keskmise väärtuse arvutamisega, kuna sama keskmine võib viidata populatsioonidele, mis pole koostiselt kaugeltki identsed. Seda saab illustreerida järgmise tingimusliku näitega, mis kajastab andmeid majapidamiste arvu kohta kahe rajooni põllumajandusettevõtetes:

Majapidamiste keskmine arv kahe rajooni taludes on sama - 160. Samas ei ole nende kahe rajooni talude koosseis kaugeltki sama. Seetõttu on vaja mõõta tunnuse varieerumist populatsioonis.

Selleks arvutatakse statistikas välja hulk tunnuseid, s.o. näitajad. Tunnuse varieerumise kõige elementaarsem näitaja on variatsiooni ulatus R, mis on selle variatsioonirea tunnuse maksimaalse ja minimaalse väärtuse erinevus, st. R = Xmax - Xmin. Meie näites on esimeses piirkonnas R = 300 - 80 - 220 ja teises piirkonnas R = 180 - 145 = 35.

Variatsiooniindikaatori vahemik ei ole alati rakendatav, kuna see võtab arvesse ainult tunnuse äärmuslikke väärtusi, mis võivad kõigist teistest ühikutest väga erineda. Mõnikord leiavad nad variatsioonivahemiku ja aritmeetilise keskmise suhte ja kasutavad seda väärtust, nimetades seda indikaatoriks võnkumisi.

Täpsemalt saate määrata seeria variatsiooni indikaatorite abil, mis võtavad arvesse kõigi valikute kõrvalekaldeid aritmeetilisest keskmisest. Statistikas on kaks sellist näitajat – keskmine lineaarne ja keskmine ruuthälve.

Keskmine lineaarne hälve tähistab variantide keskmisest kõrvalekallete absoluutväärtuste aritmeetilist keskmist. Sel juhul kõrvalekallete märke eiratakse, vastasel juhul võrdub kõigi kõrvalekallete summa nulliga. See indikaator arvutatakse järgmise valemi abil:

b) variatsiooniseeria puhul:

Tuleb meeles pidada, et keskmine lineaarne hälve on minimaalne, kui hälbed arvutatakse mediaanist, s.o. valemi järgi:

Standardhälve () arvutatakse järgmiselt - iga kõrvalekalle keskmisest ruudustatakse, kõik ruudud liidetakse (arvestades kaalusid), misjärel jagatakse ruutude summa rea ​​liikmete arvuga ja jagatisest eraldatakse ruutjuur.

Kõiki neid toiminguid väljendatakse järgmiste valemitega:

a) rühmitamata andmete puhul:

b) variatsiooniseeria puhul:

f, st. Standardhälve on keskmiste ruutude hälbete aritmeetilise keskmise ruutjuur. Juure all olevat avaldist nimetatakse dispersiooniks. Dispersioonil on statistikas iseseisev väljend ja see on üks olulisemaid variatsiooninäitajaid.

kus - vastavalt atribuudi maksimaalne ja minimaalne väärtus agregaadis;

on rühmade arv.

Jaotussarja saab visualiseerida nende graafilise esituse abil. Selleks koostatakse hulknurk, histogramm, kumulatiivne kõver, ogive.

4. TEEMA.Absoluutsed ja suhtelised väärtused

Statistilise näitaja mõiste ja selle liigid

Statistika- see on ühikute rühma või agregaadi kui terviku mõne omaduse kvantitatiivne ja kvalitatiivne üldistav tunnus konkreetsetes koha- ja ajatingimustes. Erinevalt tunnusest saadakse statistiline näitaja arvutamise teel. See võib olla lihtne populatsiooni ühikute loendus, atribuutide väärtuste liitmine, kahe või enama väärtuse võrdlemine, keerukamad võrdlused.

1. Vastavalt rahvastikuüksuste katvusele jagunevad statistilised näitajad:


2. Arvutusmeetodi järgi jagunevad statistilised näitajad:

3. Ruumilise kindluse järgi jagunevad statistilised näitajad:


Vastavalt väljendusvormile jagunevad statistilised näitajad:

Absoluutsed väärtused

Absoluutväärtus (näitaja)- see on arv, mis väljendab nähtuse suurust, mahtu konkreetsetes koha- ja ajatingimustes. Absoluutväärtusi nimetatakse alati väärtusteks, see tähendab, et neil on mingi mõõtühik. Sõltuvalt valitud mõõtühikust eristatakse järgmist: absoluutväärtuste tüübid:

1. loomulik- iseloomustada nähtuse mahtu ja suurust pikkuse, kaalu, mahu, ühikute arvu, sündmuste arvu järgi. Looduslikke indikaatoreid kasutatakse ühenimeliste tooteliikide mahu, suuruse iseloomustamiseks ja seetõttu on nende kasutamine piiratud.

2. Tinglikult loomulik- kasutatakse juhul, kui on vaja kanda ühte tingimuslikku indikaatorisse erinevat tüüpi, kuid sama väärtusega tooteid. Tinglikult loomulik näitaja arvutatakse loomuliku indikaatori korrutamisel teisendus- (ümberarvutus) koefitsiendiga. Teisenduskoefitsiendid võetakse kataloogidest või arvutatakse iseseisvalt. Tinglikult looduslikke indikaatoreid kasutatakse homogeensete toodete mahu, suuruse iseloomustamiseks ja seetõttu on nende kasutamine piiratud.

3. Töö- omama selliseid mõõtühikuid nagu inimtund, inimpäev. Kasutatakse tööaja maksumuse määramiseks, töötasu ja tööviljakuse arvutamiseks.

4. Maksumus(universaalsed) mõõdetakse vastava riigi valuutas. Kulunäitajad = toodete kogus füüsilises mõttes * toodanguühiku hind. Kuluindikaatorid on universaalsed, kuna need võimaldavad teil määrata erinevat tüüpi toodete mahtu, suurust.

Absoluutnäitajate miinused: uuritava nähtuse kvalitatiivseid tunnuseid ja struktuuri ei ole võimalik iseloomustada, selleks kasutatakse suhtelisi näitajaid, mis arvutatakse absoluutnäitajate alusel.

Suhtelised väärtused

Suhteline näitaja- see on näitaja, mis on ühe absoluutnäitaja jagamise jagatis teisega ja annab nendevahelise seose numbrilise mõõdu.


Nimetu O.P.

1. Koefitsient saadakse, kui võrdlusbaas on 1. Kui koefitsient on suurem kui 1, siis see näitab, mitu korda on võrreldav väärtus võrdlusbaasist suurem. Kui koefitsient on väiksem kui 1, siis see näitab, milline osa võrdlusbaasist on võrreldav väärtus.

2. Protsent saadakse, kui võrdlusaluseks on 100. Protsent saadakse koefitsiendi korrutamisel 100-ga.

3. Permille (‰) - kui võrdlusaluseks on 1000. Saadakse koefitsiendi korrutamisel 1000-ga. Permille kasutatakse selleks, et vältida indikaatorite murdväärtusi. Neid kasutatakse laialdaselt demograafilises statistikas, kus määratakse suremus, sündimus ja abielud 1000 inimese kohta.

4. Prodetsimil (‰0) kui võrdlusbaas on 10 000. See saadakse koefitsiendi korrutamisel 10 000. Näiteks kui palju arste, haiglavoodeid 10 000 inimese kohta.

Suhteliste väärtuste tüübid (näitajad):

1. Suhteline struktuuriindeks:

See näitaja arvutatakse rühmitatud andmete põhjal ja näitab üksikute osade osatähtsust rahvastiku kogumahus. Seda saab väljendada suhtena (osakaal) või protsendina (erikaal). Näide, 0,4 - osakaal, 40% - erikaal. Kõigi osade summa on 1 ja erikaal on 100%.

2. Dünaamika suhteline näitaja:

.

See indikaator näitab nähtuse muutumist ajas. Seda väljendatakse koefitsiendi kujul - kasvutegur ja protsendina - kasvutempo.

3. Plaani suhteline toimivus:

See näitaja näitab plaani elluviimise astet ja seda väljendatakse kujul%.

Suhteline sihtnäitaja:

See näitaja näitab, mida on plaanis tulevikus indikaatorit eelmise perioodiga võrreldes muuta ja seda väljendatakse protsentides.

Näitajate vaheline seos: .

5. Koordineerimise suhteline näitaja:

Seda indikaatorit saab arvutada 1, 10, 100 ühiku kohta ja see näitab, mitu ühikut ühest osast moodustab keskmiselt 1, 10, 100 ühikut teisest osast. Näiteks linnaelanike arv 1, 10, 100 külaelaniku kohta

6. Suhtelise intensiivsuse näitaja:

See näitaja arvutatakse erinevate näitajate võrdlemisel, mis on omavahel teatud suhtes. Seda indikaatorit saab arvutada 1, 10, 100 ühiku kohta ja see on nimega indikaator. Näiteks asustustihedus - inimest / 1, 10, 100 km2.

7. Suhtelise võrdluse indeks:

See näitaja arvutatakse sama perioodiga, kuid erinevate objektide või territooriumidega seotud sarnaste näitajate võrdlemisel. Seda väljendatakse koefitsiendi ja protsendina.

TEEMA 5. Keskmised väärtused ja variatsiooninäitajad

1. Keskmine väärtus: mõiste ja liigid

Keskmine väärtus - see on üldnäitaja, mis iseloomustab varieeruva kvantitatiivse tunnuse tüüpilist taset populatsiooniühiku kohta teatud kohas ja ajas.

Keskmise väärtuse arvutamise tingimused:

1. Üldkogum, mille põhjal arvutatakse keskmine väärtus, peab olema piisavalt suur, vastasel juhul ei tühistata juhuslikud kõrvalekalded atribuudi väärtuses ja keskmine ei näita sellele protsessile omaseid mustreid.

2. Populatsioon, mille põhjal arvutatakse keskmine väärtus, peab olema kvalitatiivselt homogeenne, vastasel juhul ei oma nad mitte ainult teaduslikku väärtust, vaid võivad olla ka kahjulikud, moonutades uuritava nähtuse tegelikku olemust.

3. Üldkeskmisele tuleks lisada rühma keskmised. Üldkeskmine näitab kogu populatsiooni tüüpilist suurust ja grupi keskmised selle üksikuid spetsiifiliste omadustega osi.

4. Nähtuse põhjalikuks kirjeldamiseks tuleks kõige olulisemate tunnuste järgi arvutada keskmiste näitajate süsteem.

Keskmine väärtus on alati nimega, sellel on sama mõõde kui keskmistatud tunnusel.

Keskmiste näitajate tüübid:

1. Võim tähendab(nende hulka kuuluvad aritmeetiline keskmine, harmooniline keskmine, keskmine ruut, geomeetriline keskmine);

2. Struktuursed keskmised(režiim ja mediaan).

Võimsuskeskmised arvutatakse valemiga (juur kõigi teatud määral võetud võimaluste keskmiste võimsusest R):

kus on uuritava tunnuse võimsuse keskmine väärtus;

− keskmistatud tunnuse individuaalne väärtus;

− keskmise astme näitaja;

− märkide arv (üks komplekt);

− summa.

Sõltuvalt astmest saadakse erinevat tüüpi lihtkeskmised.

Tähendus

Lihtsa keskmise nimi

lihtne harmooniline

kus P on korrutis

lihtne geomeetriline

lihtne aritmeetika

lihtne ruut

Mida kõrgem on astendaja () võimsuskeskmises, seda suurem on keskväärtuse väärtus. Kui arvutame kõik need keskmised samade andmete jaoks, saame järgmise suhte:

Seda võimuseaduse vahendite omadust suureneda koos defineeriva funktsiooni eksponendi suurenemisega nimetatakse vahendite majorantsi reegliks.

Seda tüüpi keskmistest on kõige sagedamini kasutatav aritmeetiline keskmine ja harmooniline keskmine. Keskmise tüübi valik sõltub esialgsest teabest.

Aritmeetiline keskmine: arvutusmeetodid ja selle omadused

Aritmeetiline keskmine on jagatis, mis jagatakse kõigi populatsiooniüksuste tunnuse individuaalsete väärtuste summa rahvastikuühikute arvuga.

Aritmeetilist keskmist kasutatakse lihtkeskmise ja kaalutud keskmise kujul. lihtne aritmeetiline keskmine arvutatakse valemiga:

kus on tunnuse keskmine väärtus;

- atribuudi individuaalsed väärtused (valikud);

− rahvastikuüksuste arv (valikuline).

Lihtsat aritmeetilist keskmist kasutatakse kahel juhul:

kui iga variant esineb jaotuseseerias ainult üks kord;

kui kõik sagedused on võrdsed.

Aritmeetiline kaalutud keskmine kasutatakse, kui sagedused ei ole üksteisega võrdsed:

kus − sagedused või kaalud (numbrid, mis näitavad, kui palju

kordades esinevad individuaalsed väärtused

märk).

Aritmeetilise keskmise omadused(tõestust pole):

1. Konstantse väärtuse keskmine väärtus on võrdne iseendaga: .

2. Keskmise väärtuse ja sageduste summa korrutis võrdub optsioonide ja nende sageduste korrutise summaga: .

3. Kui iga valikut suurendatakse või vähendatakse sama summa võrra, siis keskmine väärtus suureneb või väheneb sama palju: .

4. Kui iga valikut suurendatakse või vähendatakse sama palju kordi, siis keskmine väärtus suureneb või väheneb sama palju kordi: .

5. Kui kõiki sagedusi suurendatakse või vähendatakse sama palju kordi, siis keskmine väärtus ei muutu: .

6. Summa keskmine väärtus võrdub keskmiste väärtuste summaga: .

7. Kõikide tunnuste väärtuste kõrvalekallete summa keskmisest väärtusest on null.

3. Keskmise harmoonilise arvutamise meetodid

Mõnel juhul on lähteandmete olemus selline, et aritmeetilise keskmise arvutamine kaotab oma mõtte ja ainsad üldistavad näitajad saab olla harmooniline keskmine.

Keskmise harmoonilise tüübid:

1. Keskmine harmooniline lihtne arvutatakse valemiga:

Lihtsat harmoonilist lihtsat kasutatakse väga harva, vaid selleks, et arvutada keskmine tootmisüksuse valmistamise aeg, eeldusel, et kõigi valikute sagedused on võrdsed.

2. Keskmine harmooniline kaalutud arvutatakse valemiga:

.

kus on nähtuse kogumaht.

Harmooniliste kaalutud keskmist kasutatakse juhul, kui nähtuse kogu ruumala on teada, kuid sagedused pole teada. Seda harmoonilist kasutatakse keskmiste kvaliteedinäitajate arvutamiseks: keskmine palk, keskmine hind, keskmine maksumus, keskmine saagikus, keskmine tööviljakus.

4. Struktuuri keskmised: mood ja mediaan

Struktuurseid keskmisi (mood, mediaan) kasutatakse atribuutide väärtuste jaotusrea sisemise struktuuri ja struktuuri uurimiseks.

Mood- tunnuse kõige levinum väärtus üldkogumi ühikutes. Jaotuseseerias, kus iga variant esineb üks kord, režiimi ei arvutata. Diskreetses seerias on režiimiks kõrgeima sagedusega variant. Võrdsete intervallidega intervallide jaoks arvutatakse režiim järgmise valemiga:

.

kus on modaalintervalli esialgne (alumine) piir;

- modaali väärtus, vastavalt enne - ja postmodaalne intervall

− vastavalt modaalsete, pre- ja postmodaalsete intervallide sagedus.

Modaalne intervall on intervall, mille sagedus on kõrgeim.

Mediaan on järjestatud seeria keskel asuva tunnuse väärtus ja jagab selle seeria ühikute arvuga kaheks võrdseks osaks: ühe osa tunnuste väärtused on mediaanist väiksemad ja teise osa väärtused on mediaanist suuremad.

järjestatud rida on iseloomulike väärtuste paigutus kasvavas või kahanevas järjekorras.

Diskreetses järjestatud seerias, kus iga valik esineb üks kord ja valikute arv pole paaris, määratakse mediaanarv järgmise valemiga:

kus on seeria terminite arv.

Diskreetses järjestatud seerias, kus iga valik esineb üks kord ja valikute arv on paaris, on mediaan reastatud seeria keskel asuva kahe variandi aritmeetiline keskmine.

Diskreetses järjestatud seerias, kus iga valik esineb mitu korda, määratakse mediaanarv järgmise valemiga:

Seejärel, alates esimesest valikust, summeeritakse sagedused järjestikku, kuni saate .

Intervallseeria korral arvutatakse mediaan järgmise valemiga:

,

kus on mediaanintervalli alumine piir;

− mediaanintervalli väärtus;

−rahvastiku üksuste koguarv;

− kumulatiivne sagedus kuni mediaanintervallini;

on mediaanintervalli sagedus.

Mediaanintervall on selline intervall, mille puhul selle akumuleeritud sagedus on võrdne või suurem kui pool kõigi jada sageduste summast.

5. Variatsiooninäitajad

Funktsiooni variatsioon- see on tunnuse individuaalsete väärtuste erinevus uuritud populatsioonis. Tunnuse varieerumist iseloomustavad variatsiooninäitajad. Variatsiooninäitajad täiendavad keskmisi väärtusi, iseloomustavad statistilise populatsiooni homogeensuse astet antud tunnuse puhul, tunnuse variatsiooni piire. Variatsiooninäitajate suhe määrab tunnustevahelise seose.

Variatsiooninäitajad jagunevad:

1) Absoluutne: variatsioonivahemik; keskmine lineaarne hälve; standardhälve; dispersioon. Neil on samad ühikud, mis iseloomulikel väärtustel.

2) Suhteline: võnketegur, variatsioonitegur, suhteline lineaarne hälve.

Variatsioonivahemik näitab, kui palju atribuudi väärtus muutub:

kus on tunnuse maksimaalne väärtus;

on funktsiooni minimaalne väärtus.

Keskmine lineaarhälve ja keskmine ruuthälve näitavad, kui palju erinevad tunnuse üksikud väärtused keskmiselt selle keskmisest väärtusest.

Keskmine lineaarne hälve määratletud:

- lihtne; - kaalutud.

Dispersioon on määratletud:

- lihtne; - kaalutud;

- lihtne; - kaalutud.

Kui atribuudi keskmine väärtus arvutati lihtsa aritmeetika abil, siis arvutatakse see lihtsa valemi abil, kui keskmine arvutati kaalutud valemi abil, siis arvutatakse see kaalutud valemiga.

Dispersioonja standardhälve saab arvutada ka erineva valemi abil:

- lihtne; - kaalutud.

Erinevate tunnuste varieeruvuse võrdlemiseks samas populatsioonis või sama tunnuse eri populatsioonides arvutatakse suhteline variatsiooninäitaja, nn. variatsioonikoefitsient:

Mida suurem on variatsioonikoefitsiendi väärtus, seda suurem on atribuudi väärtuste hajumine keskmise ümber, seda vähem homogeenne on populatsioon oma koosseisus ja seda vähem esinduslik on keskmine. Komplekt loetakse homogeenseks, kui variatsioonikoefitsient ei ületa 33%.

6. Dispersioonide liigid ja dispersioonide liitmise seadus (reegel).

Kui uuritav populatsioon koosneb mitmest mis tahes tunnuse alusel moodustatud rühmast, siis määratakse lisaks summaarsele dispersioonile ka rühmadevaheline dispersioon

Vastavalt dispersiooni liitmise reegel kogu dispersioon on võrdne grupisiseste ja rühmadevaheliste dispersioonide keskmise summaga:

Kasutades dispersioonide liitmise reeglit, on alati võimalik kahe teadaoleva dispersiooni hulgast määrata kolmas, tundmatu, ning hinnata ka rühmitava atribuudi mõju tugevust.

Empiiriline määramistegur näitab rühmitustunnuse varieerumisest tingitud osakaalu uuritava tunnuse koguvariatsioonis:

Empiiriline korrelatsiooniseos näitab rühmituse aluseks oleva atribuudi mõju saadud atribuudi variatsioonile:

Empiiriline korrelatsioonisuhe varieerub vahemikus 0 kuni 1. Kui ühendus puudub, kui - ühendus on täielik. Vaheväärtusi hinnatakse vastavalt nende lähedusele piirväärtustele.

6. TEEMA.Dünaamika seeria

1. Dünaamika jada: mõiste ja tüübid

Dünaamika seeria ( kronoloogiline jada, dünaamiline seeria, aegrida) on kronoloogilises järjestuses järjestatud statistilise näitaja arvväärtuste jada. Dünaamika seeria koosneb kahest elemendist (graafik):

1. aeg (t) on ajahetked (kuupäevad) või perioodid (aastad, kvartalid, kuud, päevad), millele statistilised näitajad (seeriatasemed) viitavad.

2. seeria tase (y) – nähtuse seisundit iseloomustavad statistilise näitaja väärtused kindlal ajahetkel või ajaperioodil.

Rea tase y

Dünaamiliste seeriate tüübid:

1. Aja järgi:

A) intervall - jada, mille tasemed iseloomustavad nähtuse suurust teatud ajaperioodil (päev, kuu, kvartal, aasta). Sellise seeria näiteks on andmed tootmise dünaamika, töötatud inimpäevade arvu jms kohta. Intervalliridade absoluuttasemeid saab kokku võtta, summa on mõttekas, mis võimaldab saada dünaamika seeriaid pikematest perioodidest.

B) hetkeline - seeria, mille tasemed iseloomustavad nähtuse suurust kuupäeval (hetkel). Sellise jada näiteks võivad olla andmed rahvaarvu dünaamika, kariloomade, varude, põhivara väärtuse, käibevara jms kohta. Momendiridade tasemeid ei saa kokku võtta, summal pole mõtet, kuna järgmine tase sisaldab täielikult või osaliselt eelmist taset.

2. Vastavalt tasemete esitusvormile (väljendusmeetodile):

A) absoluutväärtuste jada.

B) suhteliste väärtuste jada. Suhtelised väärtused iseloomustavad näiteks linna- ja maarahvastiku osakaalu (%) ja töötuse määra dünaamikat.