Biograafiad Omadused Analüüs

Keskmise standardhälve. Arvutage režiimi suurus

Standardhälve

Kõige täiuslikum variatsiooni tunnus on standardhälve, ĸᴏᴛᴏᴩᴏᴇ nimetatakse standardiks (või standardhälbeks). Standardhälve() on võrdne üksikute tunnuste väärtuste aritmeetilisest keskmisest kõrvalekallete keskmise ruudu ruutjuurega:

Standardhälve on lihtne:

Kaalutud standardhälvet kasutatakse rühmitatud andmete puhul:

Keskmise ruudu ja keskmise lineaarhälbe vahel normaaljaotuse tingimustes toimub järgmine seos: ~ 1,25.

Standardhälvet, mis on peamine absoluutne variatsioonimõõt, kasutatakse normaaljaotuse kõvera ordinaatide väärtuste määramisel, valimi vaatluse korraldamise ja valimi karakteristikute täpsuse määramisega seotud arvutustes, samuti tunnuse varieerumise piiride hindamine homogeenses populatsioonis.

18. Dispersioon, selle liigid, standardhälve.

Juhusliku suuruse dispersioon- antud juhusliku suuruse leviku mõõt, st selle kõrvalekalle matemaatilisest ootusest. Statistikas kasutatakse sageli nimetust või. Dispersiooni ruutjuurt nimetatakse standardhälve, standardhälve või tavaline levi.

Kogu dispersioon (σ2) mõõdab tunnuse varieerumist kogu populatsioonis kõigi selle kõikumise põhjustanud tegurite mõjul. Samas on tänu rühmitusmeetodile võimalik isoleerida ja mõõta rühmitamistunnusest tulenevat variatsiooni ja variatsiooni, mis tekib arvesse võtmata tegurite mõjul.

Gruppidevaheline dispersioon (σ 2 m.gr) iseloomustab süstemaatilist varieerumist, st uuritava tunnuse väärtuse erinevusi, mis tekivad tunnuse – rühmitamise aluseks oleva teguri – mõjul.

standardhälve(sünonüümid: standardhälve, standardhälve, standardhälve; seotud terminid: standardhälve, standardne levik) - tõenäosusteoorias ja statistikas on kõige levinum juhusliku suuruse väärtuste hajuvuse näitaja selle matemaatilise ootuse suhtes. Piiratud väärtuste valimite massiivi puhul kasutatakse matemaatilise ootuse asemel valimite komplekti aritmeetilist keskmist.

Standardhälvet mõõdetakse juhusliku suuruse enda ühikutes ja seda kasutatakse aritmeetilise keskmise standardvea arvutamisel, usaldusvahemike koostamisel, hüpoteeside statistilisel kontrollimisel ja juhuslike suuruste vahelise lineaarse seose mõõtmisel. See on defineeritud kui juhusliku suuruse dispersiooni ruutjuur.

Standardhälve:

Standardhälve(juhusliku suuruse standardhälbe hinnang x võrreldes selle matemaatilise ootusega, mis põhineb selle dispersiooni erapooletul hinnangul):

kus on dispersioon; - i-th proovi element; - näidissuurus; - valimi aritmeetiline keskmine:

Tuleb märkida, et mõlemad hinnangud on kallutatud. Üldjuhul on erapooletu hinnangu koostamine võimatu. Samal ajal on erapooletu dispersioonihinnangul põhinev hinnang järjepidev.

19. Režiimi ja mediaani olemus, ulatus ja määramise kord.

Lisaks statistikas võimuseaduse keskmistele kasutatakse muutuva atribuudi suuruse suhtelise tunnuse ja jaotusridade sisemise struktuuri jaoks struktuurseid keskmisi, mida esindavad peamiselt režiim ja mediaan.

Mood- See on seeria kõige levinum variant. Moodi kasutatakse näiteks riiete, jalanõude suuruse määramisel, mille järele ostjate seas on kõige suurem nõudlus. Diskreetse seeria režiim on kõrgeima sagedusega variant. Intervalli variatsiooniseeria režiimi arvutamisel on äärmiselt oluline kõigepealt määrata modaalintervall (maksimaalse sageduse järgi) ja seejärel atribuudi modaalväärtuse väärtus vastavalt valemile:

§ - moeväärtus

§ - modaalintervalli alumine piir

§ - intervalli väärtus

§ - modaalintervalli sagedus

§ - modaalile eelneva intervalli sagedus

§ - modaalile järgneva intervalli sagedus

Mediaan – see funktsiooni väärtus ĸᴏᴛᴏᴩᴏᴇ asub järjestatud seeria aluses ja jagab selle seeria kaheks võrdseks osaks.

Mediaani määramiseks diskreetses seerias sageduste olemasolul arvutatakse esmalt sageduste poolsumma ja seejärel tehakse kindlaks, milline variandi väärtus sellele langeb. (Kui sorteeritud rida sisaldab paaritu arvu tunnuseid, arvutatakse mediaanarv järgmise valemi abil:

M e \u003d (n (objektide arv koondmaterjalis) + 1) / 2,

paarisarvu tunnuste korral on mediaan võrdne seeria keskel asuva kahe tunnuse keskmisega).

Mediaani arvutamisel intervallide variatsiooniseeriate jaoks esmalt määrake mediaanintervall, mille sees mediaan asub, ja seejärel mediaani väärtus vastavalt valemile:

§ - soovitud mediaan

§ - mediaani sisaldava intervalli alumine piir

§ - intervalli väärtus

§ - sageduste summa või seeria liikmete arv

§ - mediaanile eelnevate intervallide akumuleeritud sageduste summa

§ - mediaanintervalli sagedus

Näide. Leidke režiim ja mediaan.

Lahendus: selles näites on modaalne intervall vanuserühmas 25–30 aastat, kuna see intervall moodustab suurima sageduse (1054).

Arvutame režiimi väärtuse:

See tähendab, et õpilaste modaalne vanus on 27 aastat.

Arvutame mediaani. Keskmine intervall on vanuserühmas 25-30 aastat, kuna selle intervalli sees on variant, mis jagab elanikkonna kaheks võrdseks osaks (Σf i /2 = 3462/2 = 1731). Järgmisena asendame valemis vajalikud arvandmed ja saame mediaani väärtuse:

See tähendab, et pooled õpilastest on alla 27,4-aastased, teine ​​pool aga üle 27,4-aastased.

Lisaks režiimile ja mediaanile kasutatakse selliseid näitajaid nagu kvartiilid, mis jagavad järjestatud seeriad 4 võrdseks osaks, detsiilid - 10 osaks ja protsentiilid - 100 osaks.

20. Valikulise vaatluse mõiste ja selle ulatus.

Valikuline vaatlus kehtib pideva vaatluse rakendamisel füüsiliselt võimatu suure andmemahu tõttu või ei ole majanduslikult otstarbekas. Füüsiline võimatus leiab aset näiteks reisijatevoogude, turuhindade, pereeelarvete uurimisel. Majanduslik ebaotstarbekus ilmneb nende hävitamisega seotud kaupade kvaliteedi hindamisel, näiteks maitsmisel, telliste tugevuse kontrollimisel jne.

Vaatluseks valitud statistilised ühikud on proovivõtu raam või proovide võtmine ja kogu nende massiiv - üldine elanikkond(GS). Kus ühikute arv valimis määrama n ja kõigis HS-is - N. Suhtumine n/N helistas suhteline suurus või näidisosa.

Proovivõtu tulemuste kvaliteet sõltub valimi esinduslikkus st selle kohta, kui esinduslik see GS-is on. Valimi esinduslikkuse tagamiseks on oluline, et ühikute juhusliku valiku põhimõte, mis eeldab, et HS-ühiku valimisse kaasamist ei saa mõjutada ükski muu tegur peale juhuse.

Olemas 4 juhusliku valiku võimalust prooviks:

  1. Tegelikult juhuslikult valik või ʼʼloto meetodʼʼ, kui statistilistele väärtustele omistatakse seerianumbrid, mis kantakse teatud objektidele (näiteks vaadid), mis seejärel segatakse teatud konteineris (näiteks kotis) ja valitakse juhuslikult. Praktikas kasutatakse seda meetodit juhuslike arvude generaatori või juhuslike arvude matemaatiliste tabelite abil.
  2. Mehaaniline valik, mille järgi iga ( N/n)-nda üldkogumi väärtus. Näiteks kui see sisaldab 100 000 väärtust ja soovite valida 1000, siis iga 100 000 / 1000 = 100. väärtus langeb valimisse. Veelgi enam, kui neid ei järjestata, valitakse esimene saja hulgast juhuslikult ja ülejäänute arv on saja võrra suurem. Näiteks kui esimene ühik oli number 19, siis järgmine peaks olema number 119, siis number 219, siis number 319 jne. Kui reastada üldkogumi üksused, siis valitakse kõigepealt nr 50, seejärel nr 150, siis nr 250 jne.
  3. Väärtused valitakse heterogeensest andmemassiivist kihistunud(kihistatud) meetod, kui üldpopulatsioon on eelnevalt jagatud homogeenseteks rühmadeks, millele rakendatakse juhuslikku või mehaanilist valikut.
  4. Spetsiaalne proovivõtumeetod on sari valik, mille puhul ei valita juhuslikult või mehaaniliselt mitte üksikuid suurusi, vaid nende seeriaid (jadad mingist arvust mõneni järjest), mille raames teostatakse pidevat vaatlust.

Proovivaatluste kvaliteet sõltub ka sellest proovivõtu tüüp: kordas või mittekorduv. Kell uuesti valik valimisse sattunud statistilised väärtused või nende seeriad tagastatakse pärast kasutamist üldkogumisse, millel on võimalus pääseda uude valimisse. Samal ajal on kõigil üldkogumi väärtustel sama tõenäosus valimisse kaasata. Mittekorduv valik tähendab, et valimisse kaasatud statistilisi väärtusi või nende seeriaid ei tagastata pärast kasutamist üldkogumisse ja seetõttu suureneb tõenäosus järgmisse valimisse sattuda viimase ülejäänud väärtuste puhul.

Mittekorduv proovivõtt annab täpsemad tulemused ja seetõttu kasutatakse seda sagedamini. Kuid on olukordi, kus seda ei saa rakendada (reisijatevoogude, tarbijanõudluse jms uuring) ja siis tehakse kordusvalik.

21. Vaatluse diskreetimisviga, keskmine valimiviga, nende arvutamise järjekord.

Vaatleme üksikasjalikult ülaltoodud valimi üldkogumi moodustamise meetodeid ja sel juhul tekkivaid esindusvigu. Tegelikult - juhuslik valim põhineb üksuste valikul üldkogumist juhuslikult, ilma järjepidevuse elementideta. Tehniliselt toimub õige juhuslik valik loosi teel (näiteks loteriid) või juhuslike arvude tabeli abil.

Tegelikult kasutatakse "puhtal kujul" juhuslikku valikut selektiivse vaatluse praktikas harva, kuid see on teiste valikutüüpide hulgas esialgne, rakendades selektiivse vaatluse aluspõhimõtteid. Vaatleme mõningaid küsimusi valimimeetodi teooriast ja lihtsa juhusliku valimi veavalemi kohta.

Proovivõtu viga- ϶ᴛᴏ parameetri väärtuse erinevus üldkogumis ja selle valimi vaatluse tulemuste põhjal arvutatud väärtuse vahel. Oluline on märkida, et keskmise kvantitatiivse karakteristiku puhul määrab valimi võtmise vea

Näitajat nimetatakse tavaliselt valimi võtmise piirveaks. Valimi keskmine on juhuslik suurus, mis võib võtta erinevaid väärtusi olenevalt sellest, millised ühikud valimis on. Seetõttu on valimivead ka juhuslikud muutujad ja võivad omandada erinevaid väärtusi. Sel põhjusel määratakse võimalike vigade keskmine - tähendab diskreetimise viga, mis sõltub:

valimi suurus: mida suurem arv, seda väiksem on keskmine viga;

Uuritava tunnuse muutumise määr: mida väiksem on tunnuse varieeruvus ja sellest tulenevalt ka dispersioon, seda väiksem on keskmine valimiviga.

Kell juhuslik uuesti valik arvutatakse keskmine viga. Praktikas ei ole üldine dispersioon täpselt teada, kuid tõenäosusteoorias on tõestatud, et . Kuna piisavalt suure n väärtus on 1-le lähedane, võime eeldada, et . Seejärel tuleks arvutada keskmine valimiviga: . Kuid väikese valimi korral (n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

Kell juhuslik valim antud valemeid parandatakse väärtusega . Siis on mittevalimise keskmine viga: ja . Sest on alati väiksem kui , siis tegur () on alati väiksem kui 1. See tähendab, et keskmine viga mittekorduva valiku korral on alati väiksem kui korduva valiku korral. Mehaaniline proovivõtt kasutatakse siis, kui rahvaarv on mingil viisil järjestatud (näiteks valijate nimekirjad tähestikulises järjekorras, telefoninumbrid, majanumbrid, korterid). Ühikute valimine toimub teatud intervalliga, mis on võrdne valimi protsendi pöördarvuga. Seega valitakse 2% valimiga iga 50 ühikut = 1 / 0,02, 5%, iga 1 / 0,05 = 20 ühikut üldkogumist.

Lähtekoht valitakse erineval viisil: juhuslikult, intervalli keskelt, lähtekoha muutusega. Peaasi on vältida süstemaatilisi vigu. Näiteks 5% valimiga, kui esimeseks ühikuks on valitud 13., siis järgmised 33, 53, 73 jne.

Täpsuse poolest on mehaaniline valik lähedane õigele juhuslikule valimile. Sel põhjusel kasutatakse mehaanilise valimi keskmise vea määramiseks õige juhusliku valiku valemeid.

Kell tüüpiline valik küsitletud populatsioon jaguneb esialgselt homogeenseteks ühetüübilisteks rühmadeks. Näiteks ettevõtete küsitlemisel on need sektorid, allsektorid, rahvastiku uurimisel valdkonnad, sotsiaalsed või vanuserühmad. Järgmisena tehakse igast rühmast mehaaniliselt või juhuslikult iseseisev valik.

Tüüpiline proovivõtt annab täpsemad tulemused kui teised meetodid. Üldkogumi tüpiseerimine tagab iga tüpoloogilise rühma esindatuse valimis, mis võimaldab välistada rühmadevahelise dispersiooni mõju keskmisele valimi veale. Seetõttu on tüüpvalimi vea leidmisel dispersioonide liitmise reegli () järgi äärmiselt oluline arvestada ainult grupi dispersioonide keskmist. Siis keskmine diskreetimisviga: korduva valikuga , mittekorduva valikuga , kus on valimi rühmasiseste dispersioonide keskmine.

Jada (või pesastatud) valik kasutatakse, kui üldkogum jagatakse enne valikuuringu algust seeriateks või rühmadeks. Need sarjad on valmistoodete paketid, õpilasrühmad, meeskonnad. Uurimiseks valitakse seeriad mehaaniliselt või juhuslikult ning seeria raames viiakse läbi täielik ühikute uuring. Sel põhjusel sõltub keskmine valimiviga ainult rühmadevahelisest (seeriatevahelisest) dispersioonist, mis arvutatakse järgmise valemiga: kus r on valitud seeriate arv; on i-nda seeria keskmine. Arvutatakse keskmine jadavalimise viga: kordusvalikuga , mittekorduva valikuga , kus R on seeriate koguarv. Kombineeritud valik on valitud valikumeetodite kombinatsioon.

Iga valikumeetodi keskmine valimi koostamise viga sõltub peamiselt valimi absoluutsest suurusest ja vähemal määral valimi protsendist. Oletame, et esimesel juhul tehakse 225 vaatlust 4500 ühiku suurusest populatsioonist ja teisel juhul 225 000 ühikust. Dispersioon on mõlemal juhul võrdne 25-ga. Siis on esimesel juhul 5% valiku korral valimi viga: Teisel juhul, 0,1% valikuga, on see võrdne:

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, kui valimi moodustamise protsent vähenes 50 korda, suurenes valimi võtmise viga veidi, kuna valimi suurus ei muutunud. Oletame, et valimi suurust suurendatakse 625 vaatluseni. Sel juhul on proovivõtu viga: Valimi kasv 2,8 korda sama üldkogumi suuruse korral vähendab valimi koostamise vea suurust rohkem kui 1,6 korda.

22. Valimipopulatsiooni moodustamise meetodid ja viisid.

Statistikas kasutatakse erinevaid valimikomplektide moodustamise meetodeid, mis on määratud uuringu eesmärkidega ja sõltuvad uurimisobjekti spetsiifikast.

Valimküsitluse läbiviimise peamiseks tingimuseks on üldkogumi iga üksuse valimisse pääsemise võrdsete võimaluste põhimõtte rikkumisest tulenevate süsteemsete vigade esinemise vältimine. Süstemaatiliste vigade vältimine saavutatakse teaduslikult põhjendatud meetodite kasutamise tulemusena valimipopulatsiooni moodustamisel.

Üldkogumi hulgast üksuste valimiseks on järgmised võimalused: 1) individuaalne valik - valimisse valitakse üksikud üksused; 2) rühmavalik - valimisse langevad kvalitatiivselt homogeensed uuritavad rühmad või üksuste sarjad; 3) kombineeritud valik on kombinatsioon individuaalsest ja rühmavalikust. Valikumeetodid määratakse kindlaks valimipopulatsiooni moodustamise reeglitega.

Näidis peab olema:

  • õige juhuslik seisneb selles, et valim moodustatakse üldkogumist üksikute üksuste juhusliku (tahtmatu) valiku tulemusena. Sel juhul määratakse valimikomplekti valitud ühikute arv tavaliselt valimi aktsepteeritud osakaalu alusel. Valimi osakaal on valimi üldkogumi n üksuste arvu ja üldkogumi N üksuste arvu suhe, ᴛ.ᴇ.
  • mehaanilised seisneb selles, et ühikute valik valimis tehakse üldkogumi hulgast, mis on jagatud võrdseteks intervallideks (rühmadeks). Sel juhul on intervalli suurus üldkogumis võrdne valimi osakaalu pöördarvuga. Seega valitakse 2% valimiga iga 50. ühik (1:0,02), 5% valimiga iga 20. ühik (1:0,05) jne. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, vastavalt aktsepteeritud valiku proportsioonile jagatakse üldpopulatsioon justkui mehaaniliselt võrdseteks rühmadeks. Igast valimisrühmast valitakse ainult üks üksus.
  • tüüpiline - milles üldpopulatsioon jagatakse esmalt homogeenseteks tüüpilisteks rühmadeks. Lisaks tehakse igast tüüpilisest rühmast juhusliku või mehaanilise valimi abil individuaalsed ühikud valimisse. Tüüpilise valimi oluline omadus on see, et see annab täpsemaid tulemusi võrreldes muude ühikute valimise meetoditega proovis;
  • sari- milles üldpopulatsioon on jagatud ühesuurusteks rühmadeks - seeriad. Seeriad valitakse näidiskomplekti. Sarja sees toimub pidev seeriasse sattunud üksuste vaatlus;
  • kombineeritud- valim peaks olema kaheastmeline. Sel juhul jagatakse üldpopulatsioon kõigepealt rühmadesse. Järgmisena valitakse rühmad ja viimase sees üksikud üksused.

Statistikas eristatakse järgmisi valimi ühikute valimise meetodeid:

  • üks etapp valim – iga valitud üksus allutatakse koheselt antud alusel uurimisele (tegelikult juhuslikud ja seeriaproovid);
  • mitmeastmeline valim - valik tehakse üksikute rühmade üldkogumi hulgast ja rühmade hulgast valitakse välja üksikud üksused (tüüpiline valim mehaanilise ühikute valimise meetodiga valimipopulatsioonis).

Lisaks erista:

  • uuesti valik- vastavalt tagastatud palli skeemile. Samal ajal tagastatakse iga valimisse sattunud üksus või seeria üldkogumisse ja seetõttu on tal võimalus uuesti valimisse sattuda;
  • mittekorduv valik- vastavalt tagastamata palli skeemile. Sellel on täpsemad tulemused sama valimi suuruse kohta.

23. Kriitilise valimi suuruse määramine (Student'i tabeli kasutamine).

Valimiteooria üks teaduslikest põhimõtetest on tagada, et valitakse piisav arv ühikuid. Teoreetiliselt on selle printsiibi järgimise üliolulisust väljendatud tõenäosusteooria piirteoreemide tõestustes, mis võimaldavad kindlaks teha, mitu ühikut tuleks üldkogumist valida, et see oleks piisav ja tagaks valimi esinduslikkuse.

Valimi standardvea vähenemine ja seega ka hinnangu täpsuse suurenemine on alati seotud valimi suuruse suurenemisega, sellega seoses on juba valimivaatluse korraldamise etapis vajalik otsustada , milline peaks olema valimi suurus , et tagada vaatlustulemuste nõutav täpsus . Äärmiselt olulise valimi suuruse arvutamisel kasutatakse valimi piirvigade (A) valemitest tuletatud valemeid, mis vastavad ühele või teisele valikutüübile ja -meetodile. Seega on juhusliku korduva valimi suuruse (n) jaoks:

Selle valemi olemus seisneb selles, et äärmiselt olulise arvu juhusliku ümbervalimise korral on valimi suurus otseselt proportsionaalne usalduskoefitsiendi ruuduga. (t2) ja variatsioonitunnuse (A2) dispersioon ning on pöördvõrdeline diskreetimise piirvea (A2) ruuduga. Eelkõige tuleb piirvea kahekordistumisel nõutavat valimi suurust vähendada neli korda. Kolmest parameetrist kaks (t ja?) määrab uurija. Samal ajal uurija, lähtudes eesmärgist

ja valikuuringu eesmärgid peaksid otsustama küsimuse: millises kvantitatiivses kombinatsioonis on parem neid parameetreid kaasata, et pakkuda parimat võimalust? Ühel juhul võib ta olla rohkem rahul saadud tulemuste usaldusväärsusega (t) kui täpsuse mõõduga (?), teisel juhul vastupidi. Valimi piirvea väärtuse küsimuse lahendamine on keerulisem, kuna valimivaatluse kavandamise staadiumis uurijal see näitaja puudub, sellega seoses on praktikas tavaks seada valimi piirvea. , reeglina 10% piires tunnuse eeldatavast keskmisest tasemest . Eeldatava keskmise taseme määramisele saab läheneda erinevalt: kasutades sarnaste varasemate uuringute andmeid või kasutades valimi raami andmeid ja võttes väikese pilootvalimi.

Valimivaatluse kujundamisel on kõige keerulisem tuvastada valemis (5.2) kolmas parameeter - valimi üldkogumi dispersioon. Sel juhul on oluline kasutada kogu varasematest sarnastest ja pilootuuringutest uurijale kättesaadavat teavet.

Üliolulise valimi suuruse määramise küsimus muutub keerulisemaks, kui valikuuringu käigus uuritakse valimiüksuste mitmeid tunnuseid. Sel juhul on iga tunnuse keskmised tasemed ja nende varieeruvus reeglina erinevad ning sellega seoses on võimalik otsustada, millist hajuvust millistest tunnustest eelistada, ainult eesmärki arvestades. ja uuringu eesmärgid.

Valimivaatluse kavandamisel eeldatakse lubatud valimivea etteantud väärtust vastavalt konkreetse uuringu eesmärkidele ja vaatlustulemuste põhjal järelduste tegemise tõenäosusele.

Üldiselt võimaldab valimi keskmise väärtuse piirvea valem määrata:

‣‣‣ üldkogumi näitajate võimalike kõrvalekallete suurust valimi üldkogumi näitajatest;

‣‣‣ vajalik valimi suurus, mis tagab vajaliku täpsuse, mille puhul võimaliku vea piirid ei ületa teatud määratud väärtust;

‣‣‣ tõenäosus, et valimi veal on etteantud piir.

Üliõpilaste jaotus tõenäosusteoorias on see absoluutselt pidevate jaotuste üheparameetriline perekond.

24. Dünaamikaseeria (intervall, moment), dünaamikaseeria sulgemine.

Dünaamika seeria- need on statistiliste näitajate väärtused, mis on esitatud teatud kronoloogilises järjestuses.

Iga aegrida sisaldab kahte komponenti:

1) ajaperioodi näitajad(aastad, kvartalid, kuud, päevad või kuupäevad);

2) uuritavat objekti iseloomustavad näitajad perioodideks või vastavatel kuupäevadel, mida kutsutakse arvu tasemed.

Seeria tasemeid väljendatakse nii absoluutsete kui ka keskmiste või suhteliste väärtustena. Arvestades sõltuvust indikaatorite olemusest, koostatakse absoluutsete, suhteliste ja keskmiste väärtuste dünaamilised seeriad. Suhteliste ja keskmiste väärtuste dünaamilised seeriad koostatakse absoluutväärtuste tuletiseeria alusel. Dünaamikas on intervallide ja hetkede jada.

Dünaamilised intervallid sisaldab teatud ajaperioodide näitajate väärtusi. Intervallreas saab tasemeid summeerida, saades nähtuse mahu pikema perioodi kohta ehk nn akumuleeritud summad.

Dünaamiline hetkesari peegeldab indikaatorite väärtusi teatud ajahetkel (kellaaeg). Momendiridade puhul võib uurijat huvitada vaid nähtuste erinevus, mis peegeldab seeria taseme muutumist teatud kuupäevade vahel, kuna tasemete summal pole siin reaalset sisu. Kumulatiivseid kogusummasid siin ei arvutata.

Aegridade õige konstrueerimise kõige olulisem tingimus on seeriataseme võrreldavus mis on seotud erinevate perioodidega. Tasemed tuleks esitada homogeensetes kogustes, nähtuse eri osade katvus peaks olema ühesugune.

Vältimaks tegeliku dünaamika moonutamist, tehakse statistilises uuringus (aegrea sulgemine) eelarvutused, mis eelneb aegridade statistilisele analüüsile. Under dünaamika ridade sulgemine on kombeks mõista kombinatsiooni üheks reaks kahest või enamast reast, mille tasemed on arvutatud erineva metoodika järgi või ei vasta territoriaalsetele piiridele jne. Dünaamikaseeria sulgemine võib kaasneda ka dünaamikaseeria absoluuttasemete taandamisega ühisele alusele, mis välistab dünaamika jada tasemete sobimatuse.

25. Dünaamika, koefitsientide, kasvu ja kasvumäärade jadate võrreldavuse mõiste.

Dünaamika seeria- need on statistiliste näitajate jadad, mis iseloomustavad loodus- ja ühiskonnanähtuste arengut ajas. Venemaa riikliku statistikakomitee avaldatud statistikakogud sisaldavad suurt hulka aegridu tabeli kujul. Dünaamika seeria võimaldab paljastada uuritud nähtuste arengumustreid.

Aegread sisaldavad kahte tüüpi näitajaid. Aja indikaatorid(aastad, kvartalid, kuud jne) või ajapunktid (aasta alguses, iga kuu alguses jne). Rea taseme indikaatorid. Aegridade tasemenäitajaid väljendatakse absoluutväärtustes (toodang tonnides või rublades), suhtelistes väärtustes (linnaelanikkonna osakaal protsentides) ja keskmistes väärtustes (tööstustöötajate keskmine palk aastate lõikes jne). .). Tabeli kujul sisaldab aegrida kahte veergu või kahte rida.

Aegridade õige koostamine eeldab mitme nõude täitmist:

  1. kõik dünaamikaseeria näitajad peavad olema teaduslikult põhjendatud, usaldusväärsed;
  2. dünaamikaseeria näitajad peaksid olema ajaliselt võrreldavad, ᴛ.ᴇ. tuleb arvutada samade ajaperioodide või samade kuupäevade kohta;
  3. mitme dünaamika näitajad peaksid olema kogu territooriumil võrreldavad;
  4. dünaamika seeria näitajad peaksid olema sisult võrreldavad, ᴛ.ᴇ. arvutatakse ühe metoodika järgi, samal viisil;
  5. dünaamika näitajad peaksid olema kõigis vaadeldavates põllumajandusettevõtetes võrreldavad. Kõik dünaamikaseeria näitajad tuleks esitada samades mõõtühikutes.

Statistilised näitajad võivad iseloomustada kas uuritava protsessi tulemusi teatud ajaperioodil või uuritava nähtuse seisundit teatud ajahetkel, ᴛ.ᴇ. indikaatorid on intervall (perioodiline) ja hetkeline. Sellest lähtuvalt on dünaamika seeriad esialgu kas intervall või hetk. Dünaamika momendiread tulevad omakorda võrdsete ja ebavõrdsete ajavahemikega.

Algsed dünaamika seeriad teisendatakse keskmiste väärtuste ja suhteliste väärtuste seeriateks (ahel ja alus). Selliseid aegridu nimetatakse tuletatud aegridadeks.

Dünaamikaseeria keskmise taseme arvutamise meetod on dünaamikaseeria tüübi tõttu erinev. Kaaluge näidete abil aegridade tüüpe ja keskmise taseme arvutamise valemeid.

Absoluutne kasu (Δy) näitavad, mitu ühikut on seeria järgnev tase muutunud võrreldes eelmisega (veerg 3. - ahela absoluutsed juurdekasvud) või võrreldes algtasemega (veerg 4. - põhilised absoluutsed juurdekasvud). Arvutusvalemid saab kirjutada järgmiselt:

Seeria absoluutväärtuste vähenemisega toimub vastavalt "vähenemine", "vähenemine".

Absoluutsed kasvumäärad näitavad, et näiteks 1998. aastal ᴦ. toote "A" tootmine on võrreldes 1997. aastaga ᴦ kasvanud. 4 tuhande tonni võrra ja võrreldes 1994. aastaga ᴦ. - 34 tuhande tonni võrra; teiste aastate kohta vaata tabelit. 11,5 gr.
Majutatud aadressil ref.rf
3 ja 4.

Kasvufaktor näitab, mitu korda on seeria tase muutunud võrreldes eelmisega (veerg 5 - ahela kasvu- või langustegurid) või võrreldes algtasemega (veerg 6 - põhikasvu- või langustegurid). Arvutusvalemid saab kirjutada järgmiselt:

Kasvumäärad näidata, mitu protsenti on seeria järgmine tase võrreldes eelmisega (veerg 7 - ahela kasvumäärad) või võrreldes algtasemega (veerg 8 - põhikasvumäärad). Arvutusvalemid saab kirjutada järgmiselt:

Nii näiteks 1997. aastal ᴦ. toote "A" tootmismaht võrreldes 1996. aastaga ᴦ. moodustas 105,5% (

Kasvumäär näidata, mitu protsenti tõusis aruandeperioodi tase võrreldes eelmisega (veerg 9 - ahela kasvumäärad) või võrreldes algtasemega (veerg 10 - põhikasvumäärad). Arvutusvalemid saab kirjutada järgmiselt:

T pr \u003d T p - 100% või T pr \u003d absoluutne kasv / eelmise perioodi tase * 100%

Nii näiteks 1996. aastal ᴦ. võrreldes 1995. aastaga ᴦ. toodet "A" toodeti rohkem 3,8% (103,8% - 100%) ehk (8:210)x100% võrra ja võrreldes 1994. aastaga ᴦ. - 9% võrra (109% - 100%).

Kui seeria absoluuttasemed vähenevad, on määr alla 100% ja vastavalt sellele toimub langus (miinusmärgiga kasvutempo).

Absoluutväärtus 1% tõus(gr.
Majutatud aadressil ref.rf
11) näitab, mitu ühikut tuleb antud perioodil toota, et eelmise perioodi tase tõuseks 1%. Meie näites 1995. aastal ᴦ. oli vaja toota 2,0 tuhat tonni ja 1998 ᴦ. - 2,3 tuhat tonni, ᴛ.ᴇ. palju suurem.

1% kasvu absoluutväärtuse suuruse määramiseks on kaks võimalust:

§ eelmise perioodi tase jagatud 100-ga;

§ ahela absoluutsed juurdekasvud jagatud vastavate ahela kasvumääradega.

1% kasvu absoluutväärtus =

Dünaamikas, eriti pikema perioodi jooksul, on oluline ühiselt analüüsida kasvutempot iga protsendi suurenemise või languse sisuga.

Pange tähele, et vaadeldav metoodika aegridade analüüsimiseks on rakendatav nii aegridade puhul, mille tasemed on väljendatud absoluutväärtustes (t, tuhat rubla, töötajate arv jne), kui ka aegridade jaoks mida väljendatakse suhtelistes näitajates (% praagist, % kivisöe tuhasisaldus jne) või keskmistes väärtustes (keskmine saagikus c/ha, keskmine palk jne).

Aegridade analüüsimisel on igaks aastaks arvestatavate analüütiliste näitajate kõrval, mis on arvutatud võrreldes eelmise või algtasemega, äärmiselt oluline välja arvutada perioodi keskmised analüütilised näitajad: rea keskmine tase, aasta keskmine absoluutne tõus. (vähenemine) ja keskmine aastane kasvumäär ja kasvutempo .

Eespool käsitleti dünaamikaseeria keskmise taseme arvutamise meetodeid. Vaadeldavas dünaamika intervallreas arvutatakse seeria keskmine tase lihtsa aritmeetilise keskmise valemiga:

Toote keskmine aastane toodang aastatel 1994-1998. moodustas 218,4 tuhat tonni.

Aasta keskmine absoluutne kasv arvutatakse samuti aritmeetilise keskmise valemiga

Standardhälve – mõiste ja liigid. Kategooria "Standardhälve" klassifikatsioon ja tunnused 2017, 2018.

Statistilise analüüsi üks peamisi tööriistu on standardhälbe arvutamine. See indikaator võimaldab teil hinnata valimi või üldkogumi standardhälvet. Õpime kasutama Excelis standardhälbe valemit.

Defineerime kohe, mis on standardhälve ja kuidas selle valem välja näeb. See väärtus on seeria kõigi väärtuste ja nende aritmeetilise keskmise erinevuse ruutude aritmeetilise keskmise ruutjuur. Sellel indikaatoril on identne nimi - standardhälve. Mõlemad nimed on täiesti samaväärsed.

Kuid loomulikult ei pea kasutaja Excelis seda arvutama, kuna programm teeb kõik tema eest. Õpime Excelis standardhälbe arvutama.

Arvutamine Excelis

Määratud väärtuse saate Excelis arvutada kahe erifunktsiooni abil STDEV.V(vastavalt näidisele) ja STDEV.G(vastavalt üldrahvastikule). Nende tööpõhimõte on absoluutselt sama, kuid neid saab nimetada kolmel viisil, mida käsitleme allpool.

1. meetod: funktsiooniviisard


2. meetod: valemite vahekaart


3. meetod: valemi käsitsi sisestamine

Samuti on võimalus, et argumentide akent pole üldse vaja kutsuda. Selleks sisestage valem käsitsi.


Nagu näete, on Exceli standardhälbe arvutamise mehhanism väga lihtne. Kasutajal tuleb sisestada vaid populatsioonist pärit numbrid või linke neid sisaldavatele lahtritele. Kõik arvutused teeb programm ise. Palju keerulisem on aru saada, mis on arvutatud näitaja ja kuidas arvutuse tulemusi praktikas rakendada. Kuid selle mõistmine kuulub juba rohkem statistika kui tarkvaraga töötamise õppimise valdkonda.

Standardhälve on kirjeldava statistika varieeruvuse klassikaline näitaja.

Standardhälve, standardhälve, RMS, valimi standardhälve (inglise standardhälve, STD, STDev) on kirjeldavas statistikas väga levinud hajumise mõõt. Aga sest tehniline analüüs sarnaneb statistikaga, seda näitajat saab (ja tuleks) kasutada tehnilises analüüsis, et tuvastada analüüsitava instrumendi hinna hajumise määr ajas. Tähistatakse kreeka sümboliga Sigma "σ".

Aitäh Karl Gaussile ja Pearsonile selle eest, et meil on võimalus kasutada standardhälvet.

Kasutades standardhälve tehnilises analüüsis, keerame selle ümber "hajumisindeks"sisse "volatiilsuse indikaator"Säilitades tähendust, kuid muutes termineid.

Mis on standardhälve

Kuid lisaks vahepealsetele abiarvutustele standardhälve on enesearvutamiseks üsna vastuvõetav ja rakendused tehnilises analüüsis. Nagu märkis meie ajakirja takjas aktiivne lugeja, " Ma ei saa siiani aru, miks RMS ei kuulu kodumaiste müügikeskuste standardnäitajate komplekti«.

Tõesti, standardhälve võib klassikalisel ja "puhtal" viisil mõõta instrumendi muutlikkust. Kuid kahjuks pole see näitaja väärtpaberianalüüsis nii levinud.

Standardhälbe rakendamine

Standardhälbe käsitsi arvutamine pole eriti huvitav. kuid kogemuse jaoks kasulik. Standardhälvet saab väljendada valem STD=√[(∑(x-x ) 2)/n] , mis kõlab nagu valimiüksuste ja keskmise ruudu erinevuste juursumma, jagatud valimi üksuste arvuga.

Kui valimi elementide arv ületab 30, siis juure all oleva murdosa nimetaja saab väärtuse n-1. Vastasel juhul kasutatakse n.

samm sammu haaval standardhälbe arvutamine:

  1. arvutada andmevalimi aritmeetiline keskmine
  2. lahutage see keskmine valimi igast elemendist
  3. kõik saadud erinevused on ruudus
  4. Summa kõik saadud ruudud
  5. jagage saadud summa valimi elementide arvuga (või n-1-ga, kui n>30)
  6. arvutage saadud jagatise ruutjuur (nn dispersioon)

Dispersioon. Standardhälve

Dispersioon on iga tunnuse väärtuse ruudus hälvete aritmeetiline keskmine summaarsest keskmisest. Sõltuvalt lähteandmetest võib dispersioon olla kaalumata (lihtne) või kaalutud.

Dispersioon arvutatakse järgmiste valemite abil:

rühmitamata andmete jaoks

rühmitatud andmete jaoks

Kaalutud dispersiooni arvutamise protseduur:

1. määrake aritmeetiline kaalutud keskmine

2. Määratakse kõrvalekalded keskmisest

3. ruut iga variandi kõrvalekalle keskmisest

4. korrutage kõrvalekalded ruudus kaalude (sagedustega)

5. teha kokkuvõtted laekunud töödest

6. saadud summa jagatakse kaalude summaga

Dispersiooni määramise valemi saab teisendada järgmiseks valemiks:

- lihtne

Dispersiooni arvutamise protseduur on lihtne:

1. määrake aritmeetiline keskmine

2. ruudu aritmeetiline keskmine

3. ruudu iga rea ​​valik

4. leida ruutude summa variant

5. jaga optsiooni ruutude summa nende arvuga, s.o. määrake keskmine ruut

6. määrake tunnuse keskmise ruudu ja keskmise ruudu erinevus

Ka kaalutud dispersiooni määramise valemi saab teisendada järgmiseks valemiks:

need. dispersioon on võrdne tunnuse väärtuste ruutude keskmise ja aritmeetilise keskmise ruudu vahega. Teisendatud valemi kasutamisel on välistatud täiendav protseduur tunnuse üksikute väärtuste kõrvalekallete arvutamiseks x-st ja ümardamise kõrvalekalletega seotud viga arvutamisel.

Dispersioonil on mitmeid omadusi, millest mõned muudavad arvutamise lihtsamaks:

1) konstantse väärtuse dispersioon on null;

2) kui atribuutide väärtuste kõiki variante vähendatakse sama arvu võrra, siis dispersioon ei vähene;

3) kui atribuutide väärtuste kõiki variante vähendatakse sama arv kordi (kordi), siis dispersioon väheneb teguri võrra

Standardhälve S- on dispersiooni ruutjuur:

Grupeerimata andmete puhul:

;

Variatsiooniseeria jaoks:

Variatsioonivahemikku, keskmist lineaarhälvet ja keskmist ruuthälvet nimetatakse suurusteks. Neil on samad mõõtühikud kui üksikutel iseloomulikel väärtustel.

Dispersioon ja standardhälve on kõige laialdasemalt kasutatavad variatsiooni mõõdikud. Seda seletatakse asjaoluga, et need sisalduvad enamikus tõenäosusteooria teoreemides, mis on matemaatilise statistika aluseks. Lisaks saab dispersiooni lagundada selle koostisosadeks, mis võimaldab hinnata erinevate tegurite mõju, mis põhjustavad tunnuse varieerumist.

Kasumi alusel rühmitatud pankade variatsiooninäitajate arvutamine on toodud tabelis.

Kasum, miljon rubla Pankade arv arvutatud näitajad
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Kokku: 121,70 17,640 23,126

Keskmine lineaar- ja ruuthälve näitavad, kui palju kõigub atribuudi väärtus keskmiselt uuritavate ühikute ja üldkogumi puhul. Seega on antud juhul kasumi suuruse kõikumise keskmine väärtus: keskmise lineaarse hälbe järgi 0,882 miljonit rubla; standardhälbe järgi - 1,075 miljonit rubla. Standardhälve on alati suurem kui keskmine lineaarhälve. Kui tunnuse jaotus on normaalsele lähedane, siis on S ja d vahel seos: S=1,25d või d=0,8S. Standardhälve näitab, kuidas suurem osa populatsiooni ühikutest paikneb aritmeetilise keskmise suhtes. Olenemata jaotuse vormist jääb vahemikku x 2S 75 atribuudi väärtust ja vähemalt 89 kõigist väärtustest jääb intervalli x 3S (P.L. Tšebõševi teoreem).

X i - juhuslikud (praegused) väärtused;

valimi juhuslike muutujate keskmine väärtus arvutatakse järgmise valemiga:

Niisiis, dispersioon on kõrvalekallete keskmine ruut . See tähendab, et kõigepealt arvutatakse keskmine väärtus, seejärel võetakse see iga algväärtuse ja keskmise väärtuse erinevus ruudus , lisatakse ja jagatakse siis antud populatsiooni väärtuste arvuga.

Individuaalse väärtuse ja keskmise erinevus peegeldab kõrvalekalde mõõtu. See on ruudus tagamaks, et kõik kõrvalekalded muutuksid eranditult positiivseteks numbriteks ja et vältida positiivsete ja negatiivsete kõrvalekallete vastastikust tühistamist nende summeerimisel. Seejärel arvutame ruudus hälbeid arvestades lihtsalt aritmeetilise keskmise.

Võlusõna "dispersioon" vihje peitub just nendes kolmes sõnas: keskmine – ruut – kõrvalekalded.

Standardhälve (RMS)

Võttes dispersiooni ruutjuure, saame nn. standardhälve". Nimesid on "standardhälve" või "sigma" (kreeka tähe nimest σ .). Standardhälbe valem on järgmine:

Niisiis, dispersioon on sigma ruudus või - standardhälve ruudus.

Ilmselgelt iseloomustab standardhälve ka andmete hajuvuse mõõtu, kuid nüüd (erinevalt dispersioonist) saab seda võrrelda algandmetega, kuna neil on samad mõõtühikud (see selgub arvutusvalemist). Variatsioonivahemik on äärmuslike väärtuste erinevus. Standardhälvet kui määramatuse mõõdikut kasutatakse ka paljudes statistilistes arvutustes. Tema abiga määratakse erinevate hinnangute ja prognooside täpsusaste. Kui variatsioon on väga suur, siis on ka standardhälve suur, mistõttu on prognoos ebatäpne, mis väljendub näiteks väga laiades usaldusvahemikes.

Seetõttu kasutatakse kinnisvara hindamiste statistilise andmetöötluse meetodites olenevalt ülesande nõutavast täpsusest kahe või kolme sigma reeglit.

Kahe sigma reegli ja kolme sigma reegli võrdlemiseks kasutame Laplace'i valemit:

F - F,

kus Ф(x) on Laplace'i funktsioon;



Minimaalne väärtus

β = maksimaalne väärtus

s = sigma väärtus (standardhälve)

a = keskmine väärtus

Sel juhul kasutatakse Laplace'i valemi konkreetset vormi, kui juhusliku suuruse X väärtuste piirid α ja β on jaotuskeskusest a = M(X) võrdse kaugusel mingi väärtuse d võrra: a = a-d , b = a+d. Või (1) Valem (1) määrab normaaljaotuse seadusega juhusliku suuruse X antud kõrvalekalde d tõenäosuse tema matemaatilisest ootusest М(X) = a. Kui valemis (1) võtame järjestikku d = 2s ja d = 3s, siis saame: (2), (3).

Kahe sigma reegel

Peaaegu usaldusväärselt (usaldustõenäosusega 0,954) võib väita, et kõik normaaljaotuse seadusega juhusliku suuruse X väärtused kalduvad kõrvale tema matemaatilisest ootusest M(X) = a mitte rohkem kui 2s (kaks standardit). kõrvalekalded). Usaldustõenäosus (Pd) on tinglikult usaldusväärseks tunnistatud sündmuste tõenäosus (nende tõenäosus on 1 lähedal).

Illustreerime kahe sigma reeglit geomeetriliselt. Joonisel fig. 6 kujutab Gaussi kõverat jaotuskeskusega a. Kogu kõvera ja Ox-teljega piiratud pindala on 1 (100%) ning abstsisside a–2s ja a+2 vahelise kõverjoonelise trapetsi pindala on kahe sigma reegli kohaselt 0,954 (95,4%). kogupinnast). Varjutatud alade pindala on 1-0,954 = 0,046 (>5% kogupindalast). Neid sektsioone nimetatakse juhusliku suuruse kriitiliseks vahemikuks. Kriitilisesse piirkonda sattuvad juhusliku suuruse väärtused on ebatõenäolised ja praktikas peetakse neid tinglikult võimatuks.

Tinglikult võimatute väärtuste tõenäosust nimetatakse juhusliku suuruse olulisuse tasemeks. Olulisuse tase on seotud usaldustasemega valemiga:

kus q on olulisuse tase, väljendatuna protsentides.

Kolme sigma reegel

Suuremat usaldusväärsust nõudvate küsimuste lahendamisel, kui usalduse tõenäosuseks (Pd) võetakse 0,997 (täpsemalt 0,9973), kasutatakse kahe sigma reegli asemel valemi (3) järgi reeglit. kolm sigmat.



Vastavalt kolme sigma reegel usaldusnivooga 0,9973 on kriitiliseks piirkonnaks atribuutide väärtuste ala väljaspool intervalli (a-3s, a+3s). Olulisuse tase on 0,27%.

Teisisõnu, tõenäosus, et hälbe absoluutväärtus ületab standardhälbe kolm korda, on väga väike, nimelt 0,0027=1-0,9973. See tähendab, et see võib juhtuda vaid 0,27% juhtudest. Selliseid sündmusi, mis lähtuvad ebatõenäoliste sündmuste võimatuse põhimõttest, võib pidada praktiliselt võimatuks. Need. kõrge täpsusega proovide võtmine.

See on kolme sigma reegli olemus:

Kui juhuslik suurus on normaaljaotusega, siis selle matemaatilisest ootusest kõrvalekaldumise absoluutväärtus ei ületa kolmekordset standardhälvet (RMS).

Praktikas rakendatakse kolme sigma reeglit järgmiselt: kui uuritava juhusliku suuruse jaotus on teadmata, kuid eeltoodud reeglis toodud tingimus on täidetud, siis on alust eeldada, et uuritav muutuja jaotub normaalselt; muidu ei levita seda tavaliselt.

Olulisuse tase võetakse sõltuvalt lubatud riskiastmest ja ülesandest. Kinnisvara hindamiseks võetakse tavaliselt kahe sigma reegli järgi vähem täpne proov.