Intervallide variatsiooniseeriad võrdsetes intervallides. Üliõpilastele ja koolilastele - abi õppimisel

Suure hulga teabe töötlemisel, mis on eriti oluline kaasaegse läbiviimisel teaduse arenguid, seisab teadlase ees tõsine ülesanne lähteandmed õigesti rühmitada. Kui andmed on diskreetsed, siis, nagu nägime, pole probleeme - peate lihtsalt arvutama iga funktsiooni sageduse. Kui uuritaval tunnusel on pidev märk (mis on praktikas enam levinud), siis pole tunnuse rühmitamiseks optimaalse intervallide arvu valik sugugi tühine ülesanne.

Pidevate juhuslike muutujate rühmitamiseks kogu variatsioonivahemik funktsioon on jagatud mitmeks intervalliks juurde.

Rühmitatud intervall (pidev) variatsiooniline seeria nimetatakse intervallideks, mis on järjestatud tunnuse väärtuse järgi (), kus on näidatud koos vastavate sagedustega () r-ndasse intervalli langenud vaatluste arv või suhtelised sagedused ():

Iseloomulikud väärtuste intervallid
mi sagedus

tulpdiagramm ja kumuleerida (ogiva), Oleme juba üksikasjalikult arutanud, on suurepärane andmete visualiseerimise tööriist, mis võimaldab teil andmestruktuurist esmase ülevaate saada. Sellised graafikud (joonis 1.15) on koostatud pidevate andmete jaoks samamoodi nagu diskreetsete andmete jaoks, võttes arvesse ainult asjaolu, et pidevandmed täidavad täielikult oma võimalike väärtuste ala, võttes mis tahes väärtused.

Riis. 1.15.

Sellepärast histogrammi ja kumulatsiooni veerud peavad olema kontaktis, neil ei tohi olla piirkondi, kus atribuudi väärtused ei langeks kõigisse võimalikesse(st histogrammil ja kumulatsioonil ei tohiks olla "auke" piki abstsisstellge, millesse uuritava muutuja väärtused ei lange, nagu joonisel 1.16). Tulba kõrgus vastab sagedusele – antud intervalli langevate vaatluste arvule või suhtelisele sagedusele – vaatluste osakaalule. Intervallid ei tohi ületada ja on tavaliselt sama laiad.

Riis. 1.16.

Histogramm ja hulknurk on tõenäosustiheduse kõvera ligikaudsed väärtused ( diferentsiaalfunktsioon) f(x) teoreetiline jaotus, mida peetakse tõenäosusteooria käigus. Seetõttu on nende konstrueerimine kvantitatiivsete pidevandmete esmasel statistilisel töötlemisel nii oluline – nende vormi järgi saab hinnata hüpoteetilist jaotusseadust.

Kumuleeri – intervalli variatsioonirea akumuleeritud sageduste (sageduste) kõver. Integraaljaotusfunktsiooni graafikut võrreldakse kumulatsiooniga F(x), mida peetakse ka tõenäosusteooria käigus.

Põhimõtteliselt on histogrammi ja kumulaatide mõisted seotud täpselt pidevate andmete ja nende intervallide variatsiooniridadega, kuna nende graafikud on vastavalt tõenäosustiheduse funktsiooni ja jaotusfunktsiooni empiirilised hinnangud.

Intervallide variatsioonirea koostamine algab intervallide arvu määramisest k. Ja see ülesanne on uuritavas küsimuses võib-olla kõige raskem, olulisem ja vastuolulisem.

Intervallide arv ei tohiks olla liiga väike, sest histogramm on liiga sujuv ( üle silutud), kaotab kõik algandmete varieeruvuse omadused - joonisel fig. 1.17 näete, kuidas samad andmed, millel on joonisel fig. 1.15 kasutatakse väiksema intervallide arvuga histogrammi koostamiseks (vasak graafik).

Samal ajal ei tohiks intervallide arv olla liiga suur - vastasel juhul ei saa me hinnata uuritavate andmete jaotustihedust piki arvtelge: histogramm osutub alatasaseks. (alasilitatud) täitmata intervallidega, ebaühtlane (vt joon. 1.17, parem graafik).

Riis. 1.17.

Kuidas määrata eelistatuim intervallide arv?

Aastal 1926 pakkus Herbert Sturges välja valemi intervallide arvu arvutamiseks, milleks on vaja jagada uuritava atribuudi algväärtuste kogum. See valem on tõesti muutunud ülipopulaarseks – enamik statistikaõpikuid pakub seda ja paljud statistikapaketid kasutavad seda vaikimisi. Kas see on õigustatud ja kõigil juhtudel, on väga tõsine küsimus.

Millel siis Sturgesi valem põhineb?

Kaaluge binoomjaotus, mille ülemine piir sisaldab järjestatud seeria viimast numbrit.

Me ehitame intervalli seeriad(Tabel 2.3).

Ettevõtete jaotuse intervallseeria, kuid keskmine juhtide arv ühes Vene Föderatsiooni piirkonnas aruandeaasta esimeses kvartalis

Järeldus. Kõige arvukam ettevõtete rühm on keskmise juhtide arvuga 25-30 inimest, kuhu kuulub 8 ettevõtet (27%); väikseimasse gruppi, kus on keskmiselt 40-45 inimest, kuulub ainult üks ettevõte (3%).

Kasutades algset andmetabelit. 2.1, samuti ettevõtete jaotuse intervallrida juhtide arvu järgi (tabel 2.3), nõutud koostage juhtide arvu ja ettevõtete müügimahu vahelise seose analüütiline rühmitus ning tehke selle põhjal järeldus näidatud märkide vahelise seose olemasolu (või puudumise) kohta.

Lahendus:

Analüütiline rühmitamine on üles ehitatud faktoripõhiselt. Meie ülesandes on tegurimärk (x) juhtide arv ja resultantmärk (y) müügimaht (tabel 2.4).

Ehitame nüüd analüütiline rühmitus(Tabel 2.5).

Järeldus. Konstrueeritud analüütilise rühmituse andmete põhjal võib väita, et müügijuhtide arvu suurenemisega suureneb ka kontsernis oleva ettevõtte keskmine müügimaht, mis viitab otsese seose olemasolule nende tunnuste vahel.

Tabel 2.4

Abitabel analüütilise rühmituse koostamiseks

Juhtide arv, isikud,	Ettevõtte number	Müügimaht, miljonit rubla, a











		» = 59 f = 9,97








		I-™ 4 - Yu.22







		74 '25 1PY1 U4 = 7 = 10,61










			juures = ’ =10,31 30

Tabel 2.5

Müügimahtude sõltuvus ettevõtte juhtide arvust ühes Vene Föderatsiooni piirkonnas aruandeaasta esimeses kvartalis

TESTIKÜSIMUSED

1. Mis on statistilise vaatluse olemus?
2. Nimeta statistilise vaatluse etapid.
3. Mis on organisatsioonilised vormid statistiline vaatlus?
4. Nimeta statistilise vaatluse liigid.
5. Mis on statistiline kokkuvõte?
6. Nimeta statistiliste aruannete liigid.
7. Mis on statistiline rühmitus?
8. Nimetage statistiliste rühmituste tüübid.
9. Mis on jaotusseeria?
10. Nimetage jaotussarja struktuurielemendid.
11. Milline on jaotusseeria koostamise protseduur?