Biografi Ciri-ciri Analisis

Kategori statistik asas. Pekali hubungan ciri kualitatif

Kaedah pengelompokan membolehkan anda mengkaji keadaan dan hubungan fenomena ekonomi, jika kumpulan tersebut dicirikan oleh penunjuk yang mendedahkan aspek paling penting dalam fenomena yang dikaji.

Apabila menganalisis dan merancang, adalah perlu untuk tidak bergantung kepada fakta rawak, tetapi pada penunjuk yang menyatakan akar utama, tipikal. Pencirian ini diberikan jenis lain nilai min, serta mod dan median.

Persoalan kehomogenan populasi tidak seharusnya diputuskan secara formal dari segi bentuk taburannya. Ia, seperti persoalan purata biasa, mesti diputuskan berdasarkan sebab dan keadaan yang membentuk populasi. Homogen adalah satu set, unit yang dibentuk di bawah pengaruh sebab dan keadaan utama yang menentukan peringkat umum ciri ini, ciri seluruh penduduk.

Menurut teori pengelompokan tipologi, penting dalam menilai kehomogenan populasi, ia bukan dalam bentuk pengedaran, tetapi kepada saiz variasi dan syarat untuk pembentukannya. Set homogen secara kualitatif dicirikan oleh variasi dalam had tertentu, selepas itu kualiti baru bermula. Pada masa yang sama, untuk menilai kehomogenan kualitatif agregat, had ini mesti didekati dari sudut pandangan intipati perkara itu, dan bukan secara formal, kerana kuantiti yang sama di bawah keadaan yang berbeza menyatakan kualiti baru. Sebagai contoh, dengan bilangan pekerja yang sama, perusahaan beberapa cabang industri adalah besar, manakala yang lain adalah kecil.

Untuk komprehensif dan kajian yang mendalam fenomena, untuk mencirikan jenis fenomena secara objektif, hubungan dan prosesnya disebabkan oleh pembangunan sistem secara keseluruhan, adalah perlu untuk menggabungkan purata kumpulan dengan purata umum. Gabungan purata tersebut adalah salah satu elemen utama analisis sistem kompleks. Gabungan ini mengikat menjadi satu keseluruhan dua pelengkap organik kaedah statistik: kaedah purata dan kaedah pengumpulan. Apabila mengira purata, nilai individu yang berbeza mengikut kumpulan digantikan dengan satu nilai purata. Di mana sisihan rawak nilai atribut untuk unit individu dalam arah peningkatan atau penurunan adalah saling seimbang dan membatalkan satu sama lain, dan nilai purata menunjukkan saiz tipikal ciri atribut kumpulan ini. Nilai purata berfungsi sebagai ciri populasi dan pada masa yang sama merujuk kepada elemen individunya - pembawa ciri kualitatif fenomena tersebut. Maksud purata agak konkrit, tetapi pada masa yang sama abstrak; ia diperoleh dengan mengabstraksi daripada individu rawak untuk setiap unit untuk mengenal pasti umum, tipikal yang menjadi ciri semua unit dan yang membentuk. set ini. Apabila mengira nilai purata, bilangan unit populasi hendaklah cukup besar. Nilai purata ditakrifkan sebagai nisbah jumlah isipadu fenomena kepada bilangan unit populasi dalam kumpulan. Untuk data tidak terkumpul, ini akan menjadi min aritmetik mudah:

dan untuk data terkumpul, di mana setiap nilai ciri mempunyai kekerapannya sendiri, purata aritmetik berwajaran:

di mana X i- nilai ciri; f i ialah kekerapan nilai ciri ini.

Oleh kerana min aritmetik dikira sebagai nisbah jumlah nilai ciri kepada kekuatan total, ia tidak pernah melampaui nilai ini. Min aritmetik mempunyai beberapa sifat yang digunakan secara meluas untuk menyelaraskan pengiraan.

1. Jumlah sisihan nilai individu tanda daripada nilai min sentiasa sifar:

Bukti. n

Memisahkan kiri dan sebelah kanan pada

2. Jika nilai ciri (X i) diubah dalam k kali, maka min aritmetik juga akan berubah x sekali.

Bukti.

Kami menandakan min aritmetik bagi nilai baharu atribut dengan X, kemudian:

Nilai tetap 1/k boleh diambil daripada tanda jumlah, dan kemudian kita mendapat:

3. Jika daripada semua nilai ciri X i tolak atau tambah nombor tetap yang sama, maka min aritmetik akan berkurang atau bertambah dengan jumlah tersebut.

Bukti.

Purata sisihan nilai ciri dari nombor tetap akan sama dengan:

Ini dibuktikan dengan cara yang sama dalam hal menambah nombor tetap.

4. Jika frekuensi semua nilai ciri dikurangkan atau meningkat dalam n kali, maka purata tidak akan berubah:

Jika terdapat data tentang jumlah volum dan nilai yang diketahui bagi sifat, tetapi frekuensi yang tidak diketahui, formula min aritmetik berwajaran digunakan untuk menentukan purata.

Sebagai contoh, data tersedia mengenai harga jualan kubis dan jumlah hasil untuk pelbagai tempoh jualan (Jadual 1).

Jadual 1.

Harga jualan kubis dan jumlah hasil untuk pelbagai tempoh jualan


Oleh kerana harga purata ialah nisbah jumlah hasil kepada jumlah volum kubis yang dijual, pertama sekali adalah perlu untuk menentukan jumlah kubis yang dijual untuk tempoh jualan yang berbeza sebagai nisbah hasil kepada harga, dan kemudian menentukan harga purata jual kobis.

Dalam contoh kami, harga purata ialah:

Jika dikira dalam kes ini harga jualan purata mengikut min aritmetik mudah, maka kita mendapat hasil yang berbeza, yang akan memesongkan keadaan sebenar dan melebihkan harga jualan purata, kerana hakikat bahawa bahagian besar dalam jualan jatuh pada kubis lewat dengan harga yang lebih rendah tidak akan diambil kira.

Kadang-kadang ia diperlukan untuk menentukan nilai purata apabila nilai ciri diberikan dalam bentuk nombor pecahan, iaitu, timbal balik integer (contohnya, apabila mengkaji produktiviti buruh melalui penunjuk songsangnya, keamatan buruh). Dalam kes sedemikian, adalah dinasihatkan untuk menggunakan formula min harmonik:

Oleh itu, purata masa yang diperlukan untuk mengeluarkan unit keluaran ialah min harmonik. Jika X 1 \u003d 1/4 jam, X 2 \u003d 1/2 jam, X 3 \u003d 1/3 jam, maka min harmonik nombor ini ialah:

Untuk mengira nilai purata daripada nisbah dua penunjuk dengan nama yang sama, sebagai contoh, kadar pertumbuhan, min geometri digunakan, dikira dengan formula:

di mana X 1 x X 2 ... x ... X 4 - nisbah dua kuantiti dengan nama yang sama, contohnya, kadar pertumbuhan rantai; n ialah saiz set nisbah kadar pertumbuhan.

Nilai min yang dianggap mempunyai sifat maorant:

Biarkan, sebagai contoh, kita ada nilai berikut X(20; 40), maka jenis purata yang dipertimbangkan sebelum ini adalah sama dengan:

Apabila mengkaji komposisi populasi, saiz tipikal sesuatu ciri boleh dinilai dengan apa yang dipanggil purata struktur - mod dan median.

Fesyennilai ciri yang paling kerap berlaku dalam populasi dipanggil. Dalam siri variasi selang, selang modal pertama kali ditemui. Dalam selang modal yang ditemui, mod dikira dengan formula:

dengan X 0 ialah had bawah selang modal; d- nilai selang; f 1 , f 2 , f 3 – kekerapan selang pramodal, modal dan pascamodal.

Nilai fesyen dalam siri selang agak mudah dicari berdasarkan graf. Untuk melakukan ini, dua garisan diambil dari sempadan dua lajur bersebelahan dalam lajur tertinggi histogram. Dari titik persilangan garis ini, serenjang diturunkan ke paksi absis. Nilai ciri pada paksi abscissa akan menjadi mod (Rajah 2).


nasi. 2

Untuk menyelesaikan masalah praktikal kepentingan terbesar biasanya mewakili mod yang dinyatakan sebagai selang dan bukannya nombor diskret. Ini dijelaskan oleh tujuan mod, yang sepatutnya mendedahkan dimensi fenomena yang paling biasa.

Purata - nilai biasa untuk semua unit populasi homogen. Mod juga merupakan nilai biasa, tetapi ia secara langsung menentukan saiz atribut, yang merupakan ciri sebahagian penting, tetapi masih bukan keseluruhan populasi. Dia mempunyai sangat penting untuk menyelesaikan beberapa masalah, sebagai contoh, untuk meramalkan saiz kasut, pakaian yang sepatutnya digunakan untuk pengeluaran besar-besaran, dsb.

Median- nilai ciri, yang berada di tengah-tengah siri julat. Ia menunjukkan pusat taburan unit populasi dan membahagikannya kepada dua bahagian yang sama.

Median ialah ciri terbaik arah aliran tengah, apabila sempadan selang yang melampau terbuka. Median ialah ciri tahap taburan yang lebih boleh diterima walaupun terdapat nilai yang terlalu besar atau terlalu kecil dalam siri taburan yang mempunyai pengaruh yang kuat kepada min, tetapi tidak kepada median. Median juga mempunyai sifat minimum linear: jumlah nilai mutlak sisihan nilai atribut untuk semua unit populasi daripada median adalah minimum, i.e.

Sifat ini sangat penting untuk menyelesaikan beberapa masalah praktikal - contohnya, untuk mengira jarak terpendek yang mungkin untuk jenis yang berbeza pengangkutan, untuk mencari stesen servis sedemikian rupa sehingga jarak ke semua kereta yang diservis oleh stesen ini adalah minimum, dsb.

Apabila mencari median, ia terlebih dahulu ditentukan nombor siri dalam siri pengedaran:

Selanjutnya, mengikut nombor siri, median itu sendiri didapati daripada frekuensi terkumpul siri. AT siri diskret- tanpa sebarang pengiraan, tetapi dalam siri selang, mengetahui nombor ordinal median, frekuensi terkumpul digunakan untuk mencari selang median, di mana nilai median sudah ditentukan oleh kaedah interpolasi yang paling mudah. Median dikira menggunakan formula:

di mana X 0 ialah had bawah selang median; d– nilai selang; f _ 1 – kekerapan terkumpul sehingga selang median; f ialah kekerapan selang median.

Mari kita hitung min, mod dan median menggunakan taburan selang sebagai contoh. Data diberikan dalam jadual. 2.


Oleh itu, pelbagai penunjuk boleh digunakan sebagai pusat pengedaran: min, mod dan median,


dan setiap ciri ini mempunyai ciri tersendiri. Jadi, untuk nilai purata, ia adalah ciri bahawa semua penyelewengan daripadanya nilai individu tanda-tanda membatalkan satu sama lain, i.e.

Median dicirikan oleh fakta bahawa jumlah sisihan nilai individu atribut daripadanya (tidak termasuk tanda) adalah minimum. Mod mencirikan nilai yang paling kerap berlaku bagi sesuatu ciri. Oleh itu, bergantung kepada ciri mana yang menarik minat penyelidik, salah satu ciri yang dipertimbangkan harus dipilih. AT kes individu semua ciri dikira.

Perbandingan dan pengenalpastian hubungan antara mereka membantu menjelaskan ciri-ciri taburan satu atau siri variasi yang lain. Jadi, dalam siri simetri, seperti dalam kes kami, ketiga-tiga ciri (min, mod dan median) lebih kurang bertepatan. Semakin besar percanggahan antara fesyen dan purata, semakin tidak simetri siri itu. Telah ditetapkan bahawa untuk siri sederhana tidak simetri, perbezaan antara mod dan min aritmetik adalah kira-kira tiga kali lebih besar daripada perbezaan antara median dan min aritmetik:

Nisbah ini boleh digunakan untuk menentukan satu penunjuk daripada dua yang diketahui. Oleh itu, gabungan mod, median, dan min juga penting untuk mencirikan jenis taburan.

Sains Komputer dan Matematik - Bahan teori untuk kolokium pertama

1. item statistik matematik, bahagian utamanya. Konsep taburan statistik. Taburan normal. Di bawah keadaan apakah pembolehubah rawak diedarkan secara normal?

Statistik adalah sains yang mengkaji jumlah. wt. yavl-I untuk mengenal pasti semula jadi. dan mengkajinya dengan bantuan petunjuk umum.

Semua kaedah statistik matematik boleh dikaitkan dengan dua bahagian utamanya: teori anggaran statistik parameter dan teori menguji hipotesis statistik.

Bahagian:

1. statistik deskriptif

2. kaedah persampelan, selang keyakinan

3. analisis korelasi

4. analisis regresi

5. analisis ciri kualitatif

6. analisis statistik multivariate:

a) berkelompok

b) faktorial

7. analisis siri masa

8. persamaan pembezaan

9. pemodelan matematik proses sejarah

Pengedaran:

Teoretikal (banyak objek yang tidak terhingga dan mereka berkelakuan sempurna)

Empirikal (data sebenar yang boleh diplot dalam histogram)

Taburan normal - apabila sifat pengedaran dipengaruhi oleh banyak faktor, dan tiada satu pun daripadanya yang menentukan. Terutama sering digunakan dalam amalan.


2. Taburan normal boleh diwakili secara grafik sebagai lengkung berbentuk loceng, simetri, satu puncak. Ketinggian (ordinat) setiap titik pada lengkung ini menunjukkan kekerapan nilai yang sepadan berlaku. Statistik deskriptif. Nilai min - min aritmetik, median, mod. Dalam situasi apakah ketiga-tiga ukuran ini memberikan nilai yang sama, dan dalam situasi apakah ia sangat berbeza?

Statistik deskriptif - Ini adalah statistik deskriptif.

min aritmetik, median, mod - ukuran purata - pekali yang boleh mencirikan satu set objek

· nilai min (aritmetik) - jumlah semua nilai, yang dirujuk jumlah nombor pemerhatian ( jawatan yang diterima: bermakna atau ), i.e. sederhana nilai aritmetik ciri dipanggil nilai

di manakah nilai ciri y i-objek ke-, n- bilangan objek dalam agregat.

· mod - nilai paling kerap berlaku bagi pembolehubah (M)

· median ialah nilai purata (penetapan yang diterima: Median, m). Median ialah nilai "tengah" ciri dalam erti kata bahawa separuh daripada objek dalam populasi mempunyai nilai ciri ini kurang, dan separuh lagi mempunyai lebih daripada median. Anda boleh mengira median kira-kira dengan menyusun semua nilai atribut dalam tertib menaik (menurun) dan mencari nombor dalam siri variasi ini, yang sama ada mempunyai nombor ( n+1)/2 - sekiranya berlaku ganjil n, atau berada di tengah-tengah antara nombor dengan nombor n/2 dan ( n+1)/2 - dalam kes genap n.

Tidak semua ciri yang disenaraikan boleh dikira untuk ciri kualitatif. Jika atribut adalah kualitatif dan nominal, maka hanya mod boleh ditemui untuknya (nilainya akan menjadi nama kategori yang paling kerap berlaku bagi atribut nominal). Jika atribut itu adalah pangkat satu, maka sebagai tambahan kepada mod, seseorang juga boleh mencari median untuknya. Min aritmetik hanya boleh dikira sifat kuantitatif.

Dalam kes data kuantitatif, semua ciri tahap purata diukur dalam unit yang sama dengan atribut asal itu sendiri.

Nilai pekali adalah sama jika jadual pengedaran adalah simetri.


3. Penunjuk heterogen - varians, sisihan min kuasa dua (standard), pekali variasi. AT dalam unit apa mereka diukur? Mengapa memperkenalkan konsep pekali variasi?

· punca purata kuasa dua atau sisihan piawai- ukuran penyebaran nilai ciri di sekeliling nilai min aritmetik (nama yang diterima: Std.Dev. ( sisihan piawai), s atau s). Nilai sisihan ini dikira dengan formula

.

· varians ciri ( s2 atau s2)

· pekali variasi - nisbah sisihan piawai kepada min aritmetik, dinyatakan sebagai peratusan (ditandakan dalam statistik dengan huruf V). Pekali dikira dengan formula: .

Semua oranglangkah-langkah ini hanya boleh dikira untuk ciri kuantitatif. Kesemuanya menunjukkan betapa kuatnya nilai atribut (atau sebaliknya, sisihan mereka daripada purata) berbeza dalam populasi tertentu. Bagaimana kurang nilai ukuran taburan, semakin hampir nilai ciri untuk semua objek dengan nilai puratanya, dan seterusnya antara satu sama lain. Jika nilai ukuran serakan adalah sama dengan sifar, nilai atribut adalah sama untuk semua objek.

Yang paling biasa digunakan ialah sisihan min kuasa dua (atau piawai) s. Ia diukur, seperti min aritmetik, dalam unit yang sama dengan ciri asal itu sendiri. Jika semua nilai atribut berubah beberapa kali, sisihan piawai akan berubah dengan cara yang sama, bagaimanapun, jika semua nilai atribut dinaikkan (dikurangkan) dengan jumlah tertentu, sisihan piawainya. tidak akan berubah. Bersama-sama dengan sisihan piawai, varians (= kuasa duanya) sering digunakan, tetapi dalam praktiknya ia adalah ukuran yang kurang mudah, kerana. unit varians tidak sepadan dengan unit ukuran.

Maksud pekali variasi ialah, tidak seperti s, ia mengukur bukan mutlak, tetapi ukuran relatif penyebaran nilai atribut dalam populasi statistik.

Lebih banyak V , semakin kurang homogen populasi.

Heterogen Peralihan Homogen

V = 0 - 30% V = 30 - 50% V = 50 - 100%

Mungkin »100% (penduduk terlalu heterogen).


4. Konsepkaedah terpilih. Sampel Perwakilan, kaedahnya membentuk Dua jenis ralat pensampelan. Kebarangkalian keyakinan.

Sampel:

wakil rakyat

rawak

Persampelan mekanikal - serupa dengan sampel rawak(setiap 10hb, 20hb, dsb.).

Persampelan semula jadi (apa yang tinggal dari HS dari semasa ke semasa).

Sampel perwakilan - mencerminkan sifat dengan tepat penduduk.

Agar sampel dapat mencerminkan dengan betul sifat asas, yang wujud dalam populasi umum, ia sepatutnya rawak, iaitu Semua item dalam populasi mesti mempunyai peluang yang sama untuk dimasukkan ke dalam sampel.

Sampel dibentuk menggunakan khas teknik. Yang paling mudah ialah pemilihan rawak, contohnya, menggunakan cabutan biasa (untuk populasi kecil) atau menggunakan jadual. nombor rawak. Untuk populasi yang lebih besar, tetapi agak homogen, pemilihan mekanikal digunakan (yang digunakan dalam statistik Zemstvo). Untuk populasi heterogen dengan struktur tertentu, pemilihan tipikal lebih kerap digunakan. Terdapat kaedah lain, termasuk - kombinasi cara yang berbeza pemilihan pada beberapa peringkat persampelan.

Hasil sampel sentiasa mengandungi ralat. Ralat ini boleh dibahagikan kepada dua kelas: rawak dan sistematik. Yang pertama termasuk sisihan rawak ciri sampel daripada yang umum, disebabkan oleh sifat kaedah persampelan. Nilai ralat rawak boleh dikira (anggaran). Ralat sistematik, sebaliknya, tidak rawak; ia dikaitkan dengan sisihan struktur sampel daripada struktur sebenar populasi umum. Ralat sistematik muncul apabila peraturan asas pemilihan rawak dilanggar - memastikan semua objek mempunyai peluang yang sama untuk dimasukkan ke dalam sampel. Ralat statistik jenis ini tidak dapat dinilai.

Sumber utama kesilapan sistematik adalah: a) ketidakcukupan sampel yang dibentuk kepada objektif kajian; b) ketidaktahuan tentang sifat pengagihan dalam populasi umum dan, akibatnya, pelanggaran dalam sampel struktur populasi umum; c) pemilihan secara sedar unsur-unsur yang paling mudah dan berfaedah bagi populasi umum.

Kebarangkalian keyakinan -


5. Kebarangkalian keyakinan. Sederhana (standard) dan ralat pensampelan marginal. Selang keyakinan untuk menganggarkan nilai purata dalam penduduk umum. Menguji hipotesis tentang kepentingan statistik perbezaan antara dua min sampel.

Selang keyakinan - nilai pekali yang dikira, di mana, kami percaya, nilai ini untuk gen harus jatuh. Agregat.

Kebarangkalian keyakinan - kebarangkalian bahawa nilai pekali yang dikira untuk gen. Populasi akan jatuh dalam selang keyakinan. Mana lebih DV, lagi banyak CI.

Penyebaran sampel yang tidak dapat dielakkan bermakna di sekitar min am (iaitu sisihan piawai min sampel) dipanggil ralat pensampelan piawai m, yang dinyatakan oleh formula (s- sederhana sisihan piawai, n- saiz sampel). ralat piawai sampel adalah lebih kecil, lebih kecil nilainyas(yang mencirikan penyebaran nilai sifat) dan semakin besar saiz sampel n.

Jika kaedah persampelan digunakan untuk bekerja dengan data bukan kuantitatif, maka peranan min aritmetik dalam populasi dimainkan oleh perkadaran atau kekerapan. q tanda. Bahagian dikira sebagai nisbah bilangan objek yang mempunyai ciri ini () kepada bilangan objek dalam keseluruhan populasi: . Peranan ukuran sebaran dimainkan oleh kuantiti .

Dalam kes ini, ralat pensampelan standardmdikira dengan formula:

Ketepatan dan kebolehpercayaan menganggar parameter populasi umum berdasarkan sampel adalah dalam hubungan songsang: semakin besar ketepatannya (iaitu semakin kurang ralat marginal dan semakin sempit selang keyakinan), semakin rendah kebolehpercayaan anggaran tersebut (darjah keyakinan). Dan sebaliknya - semakin rendah ketepatan anggaran, semakin tinggi kebolehpercayaannya. Selalunya selang keyakinan dibina untuk kebolehpercayaan 95%, jadi ralat pensampelan marginal biasanya sama dengan dua kali ralat min.m..

Selang keyakinan untuk menganggar min dalam populasi umum:

X(g.s.) =x(dipilih) +-Δ =x(dipilih) +- = X(dipilih) +- σ(g.s.)/√n

Kriteria untuk perbezaan min

Selalunya terdapat masalah untuk membandingkan dua min sampel untuk menguji hipotesis bahawa sampel ini diperoleh daripada populasi umum yang sama, dan percanggahan sebenar dalam nilai min sampel dijelaskan oleh rawak sampel.

Hipotesis di bawah ujian boleh dirumuskan seperti berikut: perbezaan antara min sampel adalah rawak, i.e. purata am adalah sama dalam kedua-dua kes. Sebagai ciri statistik nilai digunakan semula t, iaitu perbezaan antara min sampel dibahagikan dengan purata ralat piawai min bagi kedua-dua sampel.

Nilai sebenar ciri statistik dibandingkan dengan nilai kritikal yang sepadan dengan aras keertian yang dipilih. Jika nilai sebenar lebih besar daripada nilai kritikal, hipotesis yang diuji ditolak, i.e. perbezaan antara min dianggap signifikan (signifikan).


7. Korelasi. Pekali korelasi linear, formulanya, had nilainya. Pekali penentuan, makna yang bermakna. Konsep kepentingan statistik pekali korelasi.

Pekali korelasi menunjukkan betapa rapatnya dua pembolehubah berkait .

Pekali korelasi r mengambil nilai dalam julat dari -1 hingga +1. Jika r= 1, maka di antara dua pembolehubah tersebut terdapat fungsi positif sambungan linear, iaitu dalam plot serakan, titik yang sepadan terletak pada garis lurus dengan cerun positif. Jika r = -1, maka wujud hubungan negatif berfungsi antara kedua-dua pembolehubah. Jika r = 0, maka pembolehubah yang dipertimbangkan bebas linear, iaitu dalam scatterplot, awan titik "diregangkan secara mendatar".

Adalah dinasihatkan untuk mengira persamaan regresi dan pekali korelasi hanya dalam kes apabila hubungan antara pembolehubah sekurang-kurangnya boleh dianggap linear. Jika tidak, keputusan mungkin benar-benar salah, khususnya, pekali korelasi mungkin hampir sifar dengan adanya hubungan yang kuat. Ini adalah benar terutamanya untuk kes di mana pergantungan jelas bukan linear (contohnya, pergantungan antara pembolehubah lebih kurang diterangkan oleh sinusoid atau parabola). Dalam banyak kes, masalah ini boleh dielakkan dengan mengubah pembolehubah asal. Walau bagaimanapun, untuk meneka keperluan untuk transformasi sedemikian, i.e. untuk mengetahui apa yang mungkin mengandungi data bentuk kompleks tanggungan, adalah wajar untuk "melihat" mereka. Itulah sebabnya kajian hubungan antara pembolehubah kuantitatif biasanya harus merangkumi melihat plot serakan.

Pekali korelasi boleh dikira tanpa pembinaan awal garis regresi. Dalam kes ini, persoalan mentafsir tanda sebagai berkesan dan faktorial, i.e. bergantung dan bebas tidak ditetapkan, dan korelasi difahami sebagai ketekalan atau penyegerakan perubahan serentak dalam nilai ciri dalam peralihan dari objek ke objek.

Jika objek dicirikan oleh satu set keseluruhan ciri kuantitatif, anda boleh segera membina apa yang dipanggil. matriks korelasi, i.e. jadual segi empat sama, bilangan baris dan lajur yang sama dengan bilangan ciri, dan di persimpangan setiap baris dan lajur ialah pekali korelasi bagi pasangan ciri yang sepadan.

Pekali korelasi tidak mempunyai tafsiran yang bermakna. Walau bagaimanapun, persegi beliau, dipanggil pekali penentuan(R2), Ia ada.

pekali penentuan (R 2) - ini ialah penunjuk berapa banyak perubahan dalam ciri bergantung dijelaskan oleh perubahan dalam ciri bebas. Lebih tepat lagi, ia adalah perkadaran varians ciri bebas yang dijelaskan oleh pengaruh bergantung .

Jika dua pembolehubah bergantung secara linear berfungsi (titik pada plot serakan terletak pada garis lurus yang sama), maka kita boleh mengatakan bahawa perubahan dalam pembolehubah y dijelaskan sepenuhnya oleh perubahan dalam pembolehubah x, dan ini hanya berlaku apabila pekali penentuan sama dengan satu(dalam kes ini, pekali korelasi boleh sama dengan kedua-dua 1 dan -1). Jika dua pembolehubah tidak bersandar secara linear (kaedah petak terkecil memberikan garis mendatar), kemudian pembolehubah y variasinya sama sekali tidak "terhutang" kepada pembolehubah x– dalam kes ini, pekali penentuan adalah sama dengan sifar. Dalam kes pertengahan, pekali penentuan menunjukkan bahagian mana perubahan dalam pembolehubah y dijelaskan oleh perubahan dalam pembolehubah x(kadang-kadang mudah untuk mewakili nilai ini sebagai peratusan).


8. Bilik wap danpelbagai regresi linear. Pekali pelbagai korelasi. Maksud bermakna pekali regresi, kepentingannya, konsep t- perangkaan. Maksud bermakna pekali penentuan R2.

Analisis regresi - Kaedah statistik yang membolehkan anda membina model penjelasan berdasarkan interaksi ciri.

paling banyak kes mudah hubungan adalah hubungan pasangan, iaitu hubungan antara dua sifat. Diandaikan bahawa hubungan antara dua pembolehubah adalah, sebagai peraturan, bersifat kausal, i.e. satu daripada mereka bergantung kepada yang lain. Yang pertama (bergantung) dipanggil masuk analisis regresi terhasil kedua (bebas) - faktorial. Perlu diingatkan bahawa tidak selalu mungkin untuk menentukan dengan jelas yang mana antara dua pembolehubah adalah bebas dan yang mana bersandar. Komunikasi selalunya boleh dilihat sebagai dua arah.

Persamaan Regresi Berpasangan : y = kx + b.

Selalunya, beberapa faktor bertindak ke atas pembolehubah bersandar sekaligus, antaranya adalah sukar untuk memilih satu-satunya atau yang utama. Contohnya, pendapatan sesebuah perusahaan bergantung kepada serentak daripada dua faktor pengeluaran - bilangan pekerja dan bekalan kuasa. Selain itu, kedua-dua faktor ini tidak bebas antara satu sama lain.

Persamaan regresi berganda : y = k 1 · x 1 + k 2 · x 2 + … + b,

di mana x 1 , x 2, . . . - pembolehubah tidak bersandar, di mana pembolehubah (yang terhasil) yang dikaji bergantung kepada satu darjah atau yang lain;

k 1 , k 2. . . ialah pekali bagi pembolehubah yang sepadan ( pekali regresi) menunjukkan berapa banyak nilai pembolehubah yang terhasil berubah apabila satu pembolehubah bebas berubah sebanyak satu.

Persamaan regresi berganda menentukan model regresi menerangkan tingkah laku pembolehubah bersandar. tiada model regresi tidak dapat memberitahu pembolehubah mana yang bersandar (kesan) dan yang mana tidak bersandar (menyebabkan).

R - berbilang kemungkinan korelasi, mengukur keseluruhan kesan ciri bebas, keakraban hubungan ciri yang terhasil dengan keseluruhan set ciri bebas, dinyatakan dalam%.

Menunjukkan perkadaran ciri yang diambil kira dalam bahagian hasil, i.e. berapa % variasi ciri y dijelaskan oleh variasi ciri yang dipertimbangkan X1, X2, X3.

T-statistikmenunjukkan tahap stat. kepentingan masing-masing pekali regresi, i.e. keteguhannya berkenaan dengan sampel.

T = b/ Δb

Statistik yang signifikan t >2. Lebih tinggi pekali, lebih baik.

melalui R ² kami membuat kesimpulan tentang % daripada ciri yang diambil kira menerangkan hasilnya.


9.Kaedah multidimensi Analisis statistik. Analisis kluster. Konsep kaedah hierarki dan kira-kiraKaedah K-means. Pengelasan multivariate dengan menggunakan set kabur.

IALAH:

analisis kelompok

Analisis faktor

Penskalaan pelbagai dimensi

analisis kelompok - menggabungkan objek ke dalam kumpulan dengan matlamat yang sama (terdapat banyak tanda).

Kaedah analisis kelompok:

1. berhierarki(pokok analisis hierarki):

idea utama kaedah hierarki terdiri dalam persatuan berurutan objek berkumpulan - pertama yang paling dekat, dan kemudian semakin jauh antara satu sama lain. Prosedur untuk membina klasifikasi terdiri daripada langkah berturut-turut, pada setiap satunya dua kumpulan objek terdekat digabungkan (kelompok).

2. kaedah k-means.

Memerlukan kelas yang telah ditetapkan (kelompok). Menekankan varians dalam kelas. berdasarkan hipotesis bilangan kelas yang paling berkemungkinan. Tugas kaedah ini adalah untuk membina bilangan kelompok tertentu, yang sepatutnya berbeza antara satu sama lain sebanyak mungkin.

Prosedur pengelasan bermula dengan pembinaan bilangan gugusan tertentu yang diperolehi dengan pengumpulan objek secara rawak. Setiap kluster hendaklah terdiri daripada objek "serupa" secara maksimum, dan kluster itu sendiri hendaklah secara maksimum "tidak serupa" antara satu sama lain.

Hasil kaedah ini membolehkan anda mendapatkan pusat semua kelas (serta parameter lain statistik deskriptif) untuk setiap ciri asal, dan juga melihat perwakilan grafik tentang bagaimana dan dalam parameter apakah kelas yang dihasilkan berbeza.

Jika keputusan klasifikasi yang diperolehi oleh kaedah yang berbeza bertepatan, maka ini mengesahkan realiti. Kumpulan sedia ada (kebolehpercayaan, kebolehpercayaan).


10. Kaedah analisis statistik pelbagai dimensi. Analisis faktor, tujuan penggunaannya. Konsep berat faktorial, hadnya nilai; bahagian jumlah varians yang dijelaskan oleh faktor.

Analisis statistik pelbagai variasi. Tujuannya: pembinaan siri objek diperbesarkan dipermudahkan.

IALAH:

analisis kelompok

Analisis faktor

Penskalaan pelbagai dimensi

Pada intinya analisis faktor terletak idea bahawa di sebalik perkaitan kompleks ciri yang diberikan secara eksplisit adalah struktur yang agak ringkas yang mencerminkan ciri paling penting bagi fenomena yang dikaji, dan ciri "luaran" adalah fungsi tersembunyi. faktor biasa mentakrifkan struktur ini.

Tujuan: peralihan daripada lebih sifat kepada sebilangan kecil faktor.

dalam analisis faktor semua kuantiti yang termasuk dalam model faktorial adalah diseragamkan, i.e. adalah kuantiti tanpa dimensi dengan min aritmetik 0 dan sisihan piawai 1.

Pekali hubungan antara ciri tertentu dan faktor sepunya, yang menyatakan tahap pengaruh faktor pada ciri, dipanggil beban faktor sifat ini untuk faktor sepunya ini . Ini ialah nombor antara -1 dan 1. Semakin jauh dari 0, semakin kuat hubungan itu. Nilai beban faktor untuk faktor tertentu, hampir kepada sifar, menunjukkan bahawa faktor ini secara praktikalnya tidak menjejaskan sifat ini.

Nilai (ukuran manifestasi) faktor dalam objek individu dipanggil berat faktorial objek untuk faktor ini. Pemberat faktor membolehkan anda menentukan kedudukan, memesan objek mengikut setiap faktor. Lebih besar berat faktor objek, lebih banyak ia menunjukkan sisi fenomena atau corak yang dicerminkan oleh faktor ini. Faktor ialah nilai piawai, tidak boleh = sifar. Berat faktor hampir dengan sifar menunjukkan ijazah sederhana manifestasi faktor, positif - bahawa tahap ini adalah di atas purata, negatif - tentang itu. bahawa ia adalah di bawah purata.

Jadual berat faktor mempunyai n baris dengan bilangan objek dan k lajur mengikut bilangan faktor sepunya. Kedudukan objek pada paksi setiap faktor menunjukkan, di satu pihak, susunan di mana ia ditarafkan oleh faktor ini, dan sebaliknya, keseragaman atau ketidaksamaan dalam susunannya, kehadiran kelompok titik yang menggambarkan objek , yang memungkinkan untuk menyerlahkan lebih kurang kumpulan homogen secara visual.


11. Jenis tanda kualitatif. Ciri nominal, contoh daripada sumber sejarah. Jadual kontingensi. Pekali sambungan ciri nominal, had nilainya.

Data dinilai dibentangkan mengikut kategori yang susunannya sama sekali tidak penting. Tiada cara perbandingan lain ditakrifkan untuk mereka, kecuali padanan literal/ketakpadanan.

Contoh pembolehubah nominal:

· Warganegara: Inggeris, Belarus, Jerman, Rusia, Jepun, dll.

· Pekerjaan: pekerja, doktor, tentera, guru, dll.

· Profil pendidikan: kemanusiaan, teknikal, perubatan, undang-undang, dsb.

Jika dalam kes tahap pendidikan kita masih boleh membandingkan orang dari segi "lebih baik-lebih teruk" atau "lebih tinggi-lebih rendah", kini kita dilucutkan walaupun kemungkinan ini; satu-satunya cara perbandingan yang betul adalah dengan mengatakan bahawa personaliti ini "semua ahli sejarah", atau "semuanya bukan peguam".

Jadual kontingensi

Jadual kontingensi ialah jadual segi empat tepat, baris yang menunjukkan kategori satu ciri (contohnya, kumpulan sosial yang berbeza), dan lajur menunjukkan kategori yang lain (contohnya, gabungan parti). Setiap objek koleksi jatuh ke dalam salah satu sel jadual ini mengikut kategori mana ia termasuk untuk setiap dua ciri. Oleh itu, dalam sel jadual terdapat nombor yang mewakili frekuensi kejadian bersama kategori dua ciri (bilangan orang yang tergolong dalam kumpulan sosial tertentu dan milik pihak tertentu). Bergantung pada sifat taburan frekuensi ini dalam jadual, seseorang boleh menilai sama ada terdapat hubungan antara ciri. Apakah kaitan antara status sosial dan gabungan parti? Dalam kes ini, kehadiran sambungan akan menunjukkan kehadiran pilihan politik tertentu di kalangan ahli yang berbeza kumpulan sosial. Secara formal, sambungan ini difahami sebagai kejadian bersama yang lebih kerap (atau sebaliknya, lebih jarang) gabungan individu kategori berbanding kejadian yang dijangkakan - keadaan objek rawak semata-mata yang sampai ke sana (contohnya, perkadaran yang lebih tinggi daripada petani di Parti Trudovik, dan bangsawan dalam Parti Kadet, daripada bahagian kumpulan sosial ini dalam seluruh penduduk timbalan Duma).


12. Jenis tanda kualitatif. Tanda pangkat, contoh daripada sumber sejarah. AT apakah had nilai pekali korelasi pangkat? Apakah pekali yang harus digunakan untuk menilai hubungan antara pangkat dan tanda nominal?

Data kualitatif (atau kategori) dibahagikan kepada dua jenis: kedudukan dan nominal.

Data Kedudukandiwakili oleh kategori yang anda boleh tentukan pesanannya, i.e. kategori boleh dibandingkan mengikut prinsip "lebih-kurang" atau "lebih baik-lebih teruk".

Contoh pembolehubah kedudukan:

· Gred peperiksaan mempunyai sifat pangkat yang jelas dan dinyatakan dalam kategori seperti "cemerlang", "baik", "memuaskan", dll.

· Tahap pendidikan boleh diwakili sebagai satu set kategori: "lebih tinggi", "menengah", dll.

Sudah tentu, kita boleh memperkenalkan skala kedudukan dan menggunakannya untuk menilai semua orang yang kita tahu tahap pendidikan atau markah ujian mereka. Namun, adakah benar bahawa "baik" adalah lebih buruk daripada "cemerlang" kerana "memuaskan" lebih buruk daripada "baik"? Walaupun fakta bahawa secara rasmi, dalam kes gred, anda boleh mendapatkan perbezaan dalam mata, adalah sukar untuk mengukur jarak dari "cemerlang" kepada "baik" menggunakan peraturan yang sama seperti jarak dari Moscow ke St. . Dalam kes tahap pendidikan, jelas sekali bahawa pengiraan mudah adalah mustahil, kerana tiada peraturan tunggal untuk menolak pendidikan "menengah" daripada "lebih tinggi", walaupun kita memberikan kod "3" kepada pendidikan tinggi dan kod "2" kepada menengah.

Keanehan data kualitatif tidak bermakna ia tidak boleh dianalisis menggunakan kaedah matematik dan statistik.

Sebilangan objek yang diperintahkan mengikut tahap manifestasi harta tertentu dipanggil peringkat, setiap nombor siri tersebut diberikan pangkat.

Ukuran hubungan antara sepasang ciri, yang setiap satunya menyusun set objek yang dikaji, dipanggil dalam statistik pekali korelasi pangkat .

Pekali ini dibina berdasarkan tiga sifat berikut:

· jika siri kedudukan untuk kedua-dua ciri bertepatan sepenuhnya (iaitu, setiap objek menduduki tempat yang sama dalam kedua-dua siri), maka pekali korelasi kedudukan harus sama dengan +1, yang bermaksud korelasi positif penuh:

· jika objek dalam baris yang sama terletak di susunan terbalik berbanding dengan yang kedua, pekali ialah -1, yang bermaksud korelasi negatif yang lengkap;

· dalam situasi lain, nilai pekali berada dalam selang [-1, +1]; peningkatan dalam modulus pekali daripada 0 kepada 1 mencirikan peningkatan dalam korespondensi antara dua baris berperingkat.

Sifat yang ditentukan mempunyai pekali korelasi pangkat Spearman r dan Kedalla t .

Pekali Kedall memberikan anggaran korelasi yang lebih konservatif daripada pekali Spearman (nilai berangkatsentiasa kurang daripadar).

Pekali hubungan ciri kualitatif

Untuk menilai hubungan ciri kualitatif, pekali diperlukan, yang akan mempunyai maksimum tertentu dalam kes hubungan maksimum dan akan membolehkan perbandingan antara satu sama lain. jadual yang berbeza oleh kekuatan hubungan antara ciri. Dalam kes ini, kami sesuai Pekali Cramer V .

Berdasarkan nilai ujian khi kuasa dua, pekali Cramer membolehkan anda mengukur kekuatan hubungan antara dua pembolehubah yang dikategorikan - untuk mengukurnya dengan nombor yang mengambil nilai dari 0 hingga 1, i.e. daripada kekurangan komunikasi sepenuhnya kepada maksimum sambungan yang kuat. Pekali membolehkan anda membandingkan kebergantungan tanda yang berbeza, untuk mendedahkan sambungan yang semakin kurang kukuh.


13. Permodelan matematik proses sejarah danfenomena. Takrif istilah "model". Tiga jenis model, contohnya gunakan dalam penyelidikan sejarah.

14. Persamaan pembezaan sebagai alat pembinaan utama model matematik jenis teori. Ciri-ciri mereka berbanding dengan model simulasi dan jenis statistik. Contoh model sedemikian.

Hantar kerja baik anda di pangkalan pengetahuan adalah mudah. Gunakan borang di bawah

Kerja yang bagus ke tapak">

Pelajar, pelajar siswazah, saintis muda yang menggunakan pangkalan pengetahuan dalam pengajian dan kerja mereka akan sangat berterima kasih kepada anda.

Disiarkan pada http://www.allbest.ru/

Tugasan 1

Di beberapa wilayah di tahun semasa 12,390 jenayah telah dilakukan, dan pada tahun sebelumnya - 11,800 jenayah. Kira (dalam %) kadar pertumbuhan dan kadar pertumbuhan bilangan jenayah yang didaftarkan dalam tahun semasa berhubung dengan yang sebelumnya. Kirakan juga kadar jenayah bagi setiap tahun jika penduduk wilayah itu pada penghujungnya tahun sebelumnya ialah 1,475,000, dan pada akhir tahun semasa - 1,770,000 orang. Buat kesimpulan tentang dinamika jenayah di rantau ini.

Keputusan: Untuk mendapatkan gambaran jenayah yang tepat, penunjuk jenayah seperti dinamik, iaitu, perubahan dari semasa ke semasa, adalah sangat penting. Dinamik jenayah dicirikan oleh konsep pertumbuhan mutlak (atau penurunan) dan kadar pertumbuhan dan pertumbuhan jenayah, untuk menentukan ciri-ciri ini dikira mengikut formula tertentu.

Kadar pertumbuhan jenayah dikira berdasarkan petunjuk asas dinamik, yang melibatkan perbandingan data untuk beberapa tahun (dan kadangkala berdekad, jika liputan luas bahan diperlukan) dengan asas yang berterusan, yang difahami sebagai tahap jenayah dalam tempoh awal untuk analisis. Pengiraan ini membolehkan ahli kriminologi sebahagian besarnya menjamin kebolehbandingan penunjuk relatif, dikira sebagai peratusan, yang menunjukkan bagaimana jenayah tempoh berikutnya berkorelasi dengan yang sebelumnya.

Dalam pengiraan, 100% diambil daripada data tahun asal; penunjuk yang diperoleh untuk tahun-tahun berikutnya hanya mencerminkan peratusan pertumbuhan, yang menjadikan pengiraan tepat dan gambaran lebih objektif; apabila beroperasi dengan data relatif, adalah mungkin untuk mengecualikan pengaruh terhadap penurunan atau peningkatan jenayah peningkatan atau penurunan bilangan penduduk yang telah mencapai umur tanggungjawab jenayah.

Kadar peningkatan jenayah dikira sebagai peratusan. Kadar peningkatan jenayah menunjukkan berapa banyak kadar jenayah seterusnya meningkat atau menurun berbanding tempoh sebelumnya. Diterima simbol vektor kadar pertumbuhan: jika peratusan bertambah, tanda tambah diletakkan; jika berkurang, tanda tolak diletakkan.

Berkenaan dengan syarat tugas kita, kita harus menggunakan formula yang sesuai dan mengira pertumbuhan dan pertumbuhan jenayah.

1) Kadar pertumbuhan jenayah dikira dengan formula ^

Tr \u003d U / U2 * 100%,

di mana U ialah penunjuk kadar jenayah, dan U2 ialah penunjuk kadar jenayah tempoh sebelumnya. Jadi kadar pertumbuhan jenayah di bawah terma masalah akan menjadi - 12390/11800 * 100% = 1.05%.

2) Kadar peningkatan jenayah dikira dengan formula berikut:

Tpr \u003d Tr-100%.

Jadi kadar pertumbuhan mengikut keadaan masalah akan menjadi 1.05% -100% = 98.95%.

Kadar jenayah ialah penunjuk ringkasan khusus jumlah jenayah yang direkodkan, dikaitkan dengan penduduk. Ia bermaksud bilangan jenayah bagi setiap 100,000, 10,000 atau 1,000 penduduk dan merupakan ukuran objektif jenayah yang membolehkan membandingkan tahapnya di wilayah yang berbeza dan dalam tahun yang berbeza.

Kadar jenayah membantu menilai dengan lebih mencukupi dinamik tahap jenayah yang dikira per kapita.

Kadar jenayah dikira dengan formula:

KP \u003d (P x 100000): N,

di mana P - nombor mutlak jenayah yang direkodkan; dan H ialah nombor mutlak bagi jumlah penduduk.

Kedua-dua penunjuk diambil dalam volum wilayah dan temporal yang sama. Bilangan jenayah biasanya dikira bagi setiap 100,000 penduduk. Tetapi dengan bilangan jenayah dan penduduk yang kecil (di bandar, daerah, di perusahaan), kadar jenayah boleh dikira setiap 10 ribu atau setiap 1 ribu penduduk. dalam apa jua keadaan, nombor ini bermaksud dimensi pekali yang sedang dipertimbangkan, yang mesti ditunjukkan: bilangan jenayah bagi setiap 100,000 atau 10,000 penduduk.

Mari kita mengira kadar jenayah berhubung dengan keadaan masalah kita:

1) CP = (12390 * 100000): 1,770,000 orang. = 700 (dalam tahun semasa).

2) CP = (11800 * 100000): 1,475,000 = 800 (tahun sebelumnya).

Jenayah di rantau ini semakin berkurangan, kerana, menganalisis kadar jenayah, kita boleh menyimpulkan bahawa dengan peningkatan populasi di rantau ini (sebanyak 16.6%), dan sedikit peningkatan dalam jumlah jenayah sebanyak 1.05%, secara umum, peningkatan jenayah berkurangan (-98.95 %).

Tugasan 2

Umur 11 pakar muda institusi, yang diterima untuk perkhidmatan, pada tahun semasa masing-masing berjumlah 19,25,21,23,23,23,25,20,18,20,21 tahun. Ringkaskan dan kumpulkan data dalam jadual kekerapan statistik. Untuk kejelasan, bina poligon frekuensi, dan juga cari nilai modal, median dan purata umur pekerja yang diupah.

Keputusan: berkumpulan- ini adalah pembahagian populasi kepada kumpulan yang homogen dalam beberapa cara. Dari sudut pandangan unit individu populasi, kumpulan adalah kesatuan unit individu populasi ke dalam kumpulan yang homogen dalam beberapa cara.

Kaedah pengumpulan adalah berdasarkan kategori berikut - atribut kumpulan, selang kumpulan dan bilangan kumpulan.

Tanda kumpulan- ini adalah tanda di mana unit individu populasi disatukan ke dalam kumpulan homogen.

Selang itu menggariskan sempadan kuantitatif kumpulan. Sebagai peraturan, ia mewakili selang antara nilai maksimum dan minimum atribut dalam kumpulan.

Menentukan bilangan kumpulan.

Bilangan kumpulan lebih kurang ditentukan oleh formula Sturgess:

n = 1 + 3.2log n = 1 + 3.2log(11) = 4.

Lebar selang itu ialah:

Xmax- nilai maksimum mengelompokkan sifat dalam agregat. Xmin - nilai minimum ciri kumpulan. Mari kita tentukan sempadan kumpulan.

Nombor kumpulan

Pokoknya

Batas atas

Nilai ciri yang sama berfungsi sebagai sempadan atas dan bawah dua kumpulan bersebelahan (sebelum dan seterusnya).

Untuk setiap nilai siri, kami mengira berapa kali ia jatuh ke dalam selang tertentu. Untuk melakukan ini, susun siri dalam tertib menaik.

bilangan penduduk

kekerapan fi

Poligon kekerapan ialah graf ketumpatan dan kebarangkalian pembolehubah rawak, ialah garis putus-putus yang menghubungkan titik-titik yang sepadan dengan nilai median selang kumpulan dengan frekuensi selang ini.

Nilai purata:

Fesyenmakna literal. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

di mana x 0 - permulaan selang modal; h - nilai selang; f 2 - kekerapan sepadan dengan selang modal; f 1 - kekerapan pramodal; f 3 - kekerapan postmodal.

Kami memilih 19.75 sebagai permulaan selang, kerana selang inilah yang menyumbang nombor terbesar.

Nilai yang paling biasa bagi siri ini ialah 20.92.

Median. Median membahagikan sampel kepada dua bahagian: separuh pilihan adalah kurang daripada median, separuh lagi.

Dalam siri pengedaran selang, anda boleh dengan serta-merta menentukan hanya selang di mana mod atau median akan ditempatkan. Median sepadan dengan pilihan di tengah julat. Median ialah selang 19.75-21.5, kerana dalam selang ini, kekerapan terkumpul S adalah lebih besar daripada nombor median (median ialah selang pertama, kekerapan terkumpul S yang melebihi separuh jumlah keseluruhan frekuensi).

Oleh itu, 50% daripada unit populasi akan kurang daripada 21.28.

Tugasan 3

Tentukan saiz sampel yang diperlukan untuk mengkaji purata umur pekerja bertauliah Perkhidmatan Penjara Persekutuan Rusia, dengan syarat sisihan piawai ialah 10 tahun, dan ralat pensampelan maksimum yang dibenarkan tidak boleh melebihi 5%.

Kami sedang mencari penyelesaian mengikut formula untuk menentukan saiz sampel untuk pemilihan semula.

Ф(t) = g/2 = 0.95/2 = 0.475 dan mengikut jadual Laplace nilai ini sepadan dengan t=1.96.

Anggaran sisihan piawai s = 10; ralat pensampelan e = 5.

Tugasan 4

Jadual berikut menyediakan statistik jabatan rasmi mengenai pengagihan banduan mengikut syarat pemenjaraan (hukuman) untuk 2002-2011, yang disiarkan di laman web rasmi Perkhidmatan Penjara Persekutuan Rusia: www.fsin.su. Cari julat dan pekali variasi bilangan banduan bagi setiap tahun kalendar dan buat kesimpulan tentang kehomogenan struktur ciri statistik ini.

Penunjuk utama yang mencirikan kehomogenan data ialah pekali variasi. Dalam statistik, secara umum diterima bahawa jika nilai pekali kurang daripada 33%, maka set data adalah homogen, jika lebih daripada 33%, maka ia adalah heterogen.

Pekali variasi

Kerana v? 30%, maka populasi adalah homogen, dan variasinya lemah. Keputusan yang diperolehi boleh dipercayai.

Tempoh hukuman

1 hingga 3 tahun

3 hingga 5 tahun

5 hingga 10 tahun

10 hingga 15 tahun

Lebih 15 tahun

Nilai maksimum (fungsi MAX)

Nilai minimum (fungsi MIN)

Variasi rentang

Nilai purata (fungsi AVERAGE)

Sisihan piawai (fungsi STANDAR LONA)

Pekali variasi

purata sederhana:

Fesyen maksudnya

Median

Kami mencari tengah siri julat: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 70580. Oleh itu, median Me = 70580.

Penunjuk variasi. .

R \u003d X maks - X min.

R = 295916-2250 = 293666.

Sisihan linear purata

Setiap nilai siri berbeza daripada yang lain dengan purata 90895.71.

Penyerakan

(kesalahan bermakna sampel).

Setiap nilai siri berbeza daripada nilai purata 103008 dengan purata 107169.83.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Kerana v>

atau

Faktor ayunan

purata sederhana:

Fesyen

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari tengah-tengah siri julat: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 76186. Oleh itu, median Me = 76186.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R = X maks - X min

R = 291112-3101 = 288011.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 83422.69.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 97334.29 dengan purata 100750.25.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai yang melampau ciri sekitar min.

purata sederhana:

Fesyen makna literal. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari tengah siri julat: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 71093. Oleh itu, median Me = 71093.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R = X maks - X min

R = 243852-3856 = 239996.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 68998.08.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 85765.57 dengan purata 82541.55.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

:

Fesyen. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mendapati tengah siri kedudukan: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 74588. Oleh itu, median Me = 74588.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R \u003d X maks - X min,

R=242984-5304=237680.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 73148.73.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 92104.14 dengan purata 82873.1.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

min aritmetik mudah:

Fesyen. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari tengah siri julat: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 76678. Oleh itu, median Me = 76678

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R \u003d X maks - X min.

R = 249346-6536 = 242810.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 79680.53.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 99551.71 dengan purata 87389.04.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

min aritmetik mudah:

Fesyen. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari tengah siri julat: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 76461. Oleh itu, median Me = 76461.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R \u003d X maks - X min.

R = 254722-6704 = 248018.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 82302.82.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 102346.71 dengan purata 89787.88.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

min aritmetik mudah:

Fesyen. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari tengah siri julat: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 78959. Oleh itu, median Me = 78959.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R \u003d X maks - X min.

R = 261334-7635 = 253699.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 83791.55.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 104898.86 dengan purata 91616.15.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

min aritmetik mudah:

Fesyen. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari tengah siri julat: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 75916. Oleh itu, median Me = 75916.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R \u003d X maks - X min.

R=263863-8145=255718.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 82767.96.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 103440.71 dengan purata 91207.92.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

min aritmetik mudah:

Fesyen. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari bahagian tengah siri kedudukan: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 78019. Oleh itu, median Me = 78019.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R = X maks - X min

R = 260094-7798 = 252296.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 77827.76.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 99212.29 dengan purata 88081.39.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

min aritmetik mudah:

Fesyen. Mod ialah nilai paling biasa bagi sesuatu ciri dalam unit populasi tertentu.

Tiada mod (semua nilai siri adalah individu).

Median. Median ialah nilai ciri yang membahagikan unit siri kedudukan kepada dua bahagian. Median sepadan dengan pilihan di tengah julat.

Kami mencari tengah siri kedudukan: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Nombor ini sepadan dengan nilai siri 72248. Oleh itu, median Me = 72248.

Penunjuk variasi. Kadar Variasi Mutlak.

Julat variasi ialah perbezaan antara nilai maksimum dan minimum bagi atribut siri primer.

R \u003d X maks - X min.

R = 242137-7173 = 234964.

Sisihan linear purata- dikira untuk mengambil kira perbezaan semua unit populasi yang dikaji.

Setiap nilai siri berbeza daripada yang lain dengan purata 70459.02.

Penyerakan- mencirikan ukuran sebaran di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Sisihan piawai(min ralat pensampelan).

Setiap nilai siri berbeza daripada nilai purata 91375.14 dengan purata 80674.43.

Ukuran relatif variasi. Penunjuk relatif variasi termasuk: pekali ayunan, pekali linear variasi, sisihan linear relatif.

Pekali variasi- ukuran sebaran relatif nilai populasi: menunjukkan berapa bahagian nilai purata kuantiti ini adalah sebaran puratanya.

Sejak v>70%, populasi menghampiri pinggir heterogeniti, dan variasi adalah kuat.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa. Dalam kes ini, dalam kajian praktikal, pelbagai kaedah statistik membawa populasi kepada bentuk homogen.

Pekali variasi linear atau Sisihan linear relatif- mencirikan bahagian nilai purata tanda sisihan mutlak daripada nilai purata.

Faktor ayunan- mencerminkan turun naik relatif nilai ekstrem atribut di sekitar purata.

Tugasan 5

Dalam keadaan tugasan sebelumnya, kumpulkan semula selang ayat yang diberikan untuk menambah baik penunjuk relatif variasi atribut pada tahun 2010. Bina histogram taburan banduan mengikut terma pemenjaraan (hukuman) bagi tahun 2010 sebelum dan selepas pengumpulan data dan buat kesimpulan tentang kehomogenan struktur ciri statistik yang dikaji.

Keputusan:

Sejak v>30%, tetapi v<70 %, то вариация умеренная.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa.

Mari kita susun semula data seperti berikut:

Kumpulan 1) termasuk kumpulan: sehingga setahun, setahun, dari 1-3 tahun, masing-masing 156978.

Kumpulan 2) termasuk daripada kumpulan lebih 3 hingga 5 tahun sepenuhnya dan 1/5 daripada kumpulan lebih 5 hingga 10 tahun, kita mendapat 1/5 * 260094 + 168651 = 220669.8.

Kumpulan 3) termasuk 3\5 kumpulan dari 5 hingga 10 i.e. 3\5*260094=156056.4.

Kumpulan 4) (1\5*260094)+(1\5*78019)=67622.6.

Kumpulan 5) 3\5*78019=46811.4.

Kumpulan 6 30744+(1\5*78019)=46347.8.

Graf bar. Untuk mendapatkan kesimpulan tentang kehomogenan ciri statistik yang dikaji, kami mengira pekali variasi:

Sejak v>30%, tetapi v<70 %, то вариация умеренная.

Pekali variasi adalah lebih daripada 33%. Akibatnya, set yang dipertimbangkan adalah heterogen dan purata untuknya adalah tidak biasa.

Tugasan 6

Nyatakan secara ringkas (abstrak, pada 1-2 halaman) kandungan dan hasil kajian statistik rasmi baru-baru ini dalam bidang sosial dan undang-undang (topik - pilihan anda, pautan ke sumber Internet - diperlukan), buat kesimpulan dan kemukakan statistik yang sesuai hipotesis untuk perspektif jangka pendek.

Sebagai kajian statistik rasmi, kajian mengenai tunggakan gaji tertunggak pada 1 Disember 2015 telah diambil.

Mulai 1 Disember 2015, menurut organisasi (tidak berkaitan dengan perniagaan kecil), jumlah hutang dari segi upah bagi julat jenis aktiviti ekonomi yang diperhatikan berjumlah 3900 juta rubeldia dan berbanding 1 November 2015 meningkat sebanyak 395 juta rubel (sebanyak 11.3%).

Gaji tertunggak kerana kekurangan dana sendiri pada 1 Disember 2015 berjumlah 3818 juta rubeldia, atau 97.9% daripada jumlah hutang tertunggak. Berbanding 1 November 2015 ia meningkat sebanyak 389 juta rubel (sebanyak 11.3%). Hutang disebabkan oleh penerimaan dana yang tidak tepat pada masanya daripada belanjawan semua peringkat berjumlah 82 juta rubeldia dan meningkat berbanding 1 November 2015. sebanyak 6 juta rubel (sebanyak 7.7%), termasuk hutang daripada persekutuan bajet berjumlah 62 juta rubel dan menurun berbanding 1 November 2015. sebanyak 6 juta rubel (sebanyak 8.6%), belanjawan subjek Persekutuan Rusia berjumlah 1.1 juta rubel (peningkatan 0.2 juta rubel atau 20.7%), belanjawan tempatan - 19 juta rubel (peningkatan 12 juta rubel, atau 2.5 kali ganda).

Dalam perlombongan, pembuatan, penjagaan kesihatan dan perkhidmatan sosial, perikanan dan penternakan ikan, 100% tunggakan gaji tertunggak terbentuk kerana kekurangan dana organisasi sendiri.

Dalam jumlah tunggakan gaji tertunggak, 37% jatuh pada pembuatan, 29% - pada pembinaan, 9% - pada pengeluaran dan pengagihan elektrik, gas dan air, 7% - pada pengangkutan, 6% - pada perlombongan, 5% - untuk pertanian, pemburuan dan penyediaan perkhidmatan di kawasan ini, pembalakan.

Jumlah tunggakan gaji pada 1 Disember 2015 berjumlah kurang daripada 1% daripada bil gaji bulanan pekerja dalam jenis aktiviti ekonomi yang diperhatikan.

Tunggakan gaji untuk bulan lepas, yang mana akruan dibuat, dalam jumlah hutang tertunggak berjumlah purata 29%: pengeluaran dan pengagihan elektrik, gas dan air - 75%, aktiviti dalam bidang pendidikan - 37%, penjagaan kesihatan dan perkhidmatan sosial - 35%, penyelidikan dan pembangunan saintifik - 32%, pembinaan - 29%, pengangkutan - 23%, pembuatan - 22%.

Daripada jumlah gaji yang belum dibayar, hutang yang terbentuk pada tahun 2014 menyumbang 457 juta rubel (11.7%), pada tahun 2013. dan lebih awal - 657 juta rubel (16.8%).

Secara umum, memerhatikan dinamik tunggakan gaji (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), kita boleh membuat kesimpulan bahawa penurunan yang ketara akan berlaku dalam Januari, Februari 2016.

Peratusan utama hutang jatuh ke atas industri pembuatan - 37%, 29% - pada pembinaan, kemungkinan besar ini disebabkan oleh penurunan dalam permintaan pengguna untuk produk, dan keuntungan yang sewajarnya berkurangan.

Mari kita kemukakan hipotesis. Sejak Januari 2016, peratusan hutang akan berkurangan disebabkan oleh pengagihan belanjawan tahunan untuk tahun hadapan, dengan mengambil kira pembayaran balik sebahagian tunggakan gaji, dan akan berjumlah 2,700 juta. Dinamik median variasi jenayah

Untuk menguji hipotesis (Kami mengambil jadual ini sebagai asas http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Mari kita bina siri variasi diskret. Untuk melakukan ini, susun siri dalam tertib menaik dan kira bilangan ulangan untuk setiap elemen siri.

Mari kita hitung purata:

Mari kita hitung varians. Serakan - mencirikan ukuran serakan di sekeliling nilai minnya (ukuran serakan, iaitu sisihan daripada min).

Menggunakan ujian satu hujung dengan b = 0.05, uji hipotesis ini jika, dalam sampel n = 24 bulan, purata ialah 2741.25, dan varians diketahui dan sama dengan y = 193469.27

Keputusan. Sisihan piawai:

Hipotesis nol H 0 dikemukakan bahawa nilai jangkaan matematik populasi umum adalah sama dengan nombor m 0: = 2700.

Hipotesis alternatif:

H 1: m? 2700, kawasan kritikal - dua hala.

Untuk menguji hipotesis nol, pembolehubah rawak digunakan:

di mana x ialah min sampel; S ialah sisihan piawai bagi populasi umum.

Jika hipotesis nol adalah benar, maka pembolehubah rawak T mempunyai taburan normal piawai. Nilai kritikal statistik T ditentukan berdasarkan jenis hipotesis alternatif:

P(|T|

Mari kita cari nilai eksperimen bagi statistik T:

Oleh kerana saiz sampel agak besar (n>30), bukannya nilai sebenar sisihan piawai, anda boleh menggunakan anggarannya S=439.851.

F (t cr) \u003d (1-b) / 2 \u003d (1-0.05) / 2 \u003d 0.475.

Menurut jadual fungsi Laplace, kita dapati pada apa t kp nilai Ф (t kp) = 0.475.

Nilai eksperimen bagi kriteria T tidak jatuh ke dalam kawasan kritikal T ? t kp , maka hipotesis nol harus diterima. Nilai jangkaan matematik populasi umum boleh diambil sama dengan 2700

Bibliografi

1. Kazantsev S.Ya. Perangkaan Undang-undang: Buku Teks / Ed. S.Ya. Kazantseva, S.Ya. Lebedeva - M.: UNITY-DANA: Undang-undang dan Undang-undang, 2009

2. Kurys? dalam K.N. Asas statistik undang-undang: buku teks. elaun / K.N. Kurys? dalam; VUI FPS Rusia. - Vladimir, 2005. - 44 p.

3. Makarova N.V. Statistik dalam Excel: buku teks. elaun / N.V. Makarova, V.Ya. Trofimets. - M.: Kewangan dan statistik.

4. Kondratyuk L.V., Ovchinsky V.S. Dimensi kriminologi / ed. K.K. Goryainov. - M.: Norma, 2008.

5. Yakovlev V.B. Perangkaan. Pengiraan dalam Microsoft Excel: buku teks. Manual untuk universiti / V.B. Yakovlev. - M.: Kolos, 2005. - 352 p.

Dihoskan di Allbest.ru

...

Dokumen Serupa

    Kajian kenakalan juvana dari sudut objek kajian kriminologi. Hubungan antara alkoholisme remaja, penyalahgunaan bahan, penagihan dadah dan jenayah. Punca dan syarat serta cara mencegah kenakalan juvana.

    kertas penggal, ditambah 04/08/2011

    Metodologi penyelidikan kriminologi khusus. Ciri-ciri kriminologi jenayah kekerasan dan pencegahannya. Bahaya awam dan keterukan akibat jenayah kekerasan. Perangkaan jenayah.

    ujian, ditambah 01/15/2011

    Formula untuk mengira kadar jenayah. Pengiraan purata beban kerja tahunan bagi setiap hakim, tempoh purata penyiasatan kes jenayah, purata kadar pertumbuhan tahunan jenayah. Pengiraan penunjuk mod, median, variasi dan sisihan piawai.

    ujian, ditambah 04/20/2011

    Kajian tentang asas jenayah upahan: konsep, elemen, objek dan aspek subjektif. Penerangan mengenai pencegahan jenayah sosial dan khas kriminologi daripada motif upahan. Pembangunan satu set langkah untuk mencegah jenayah.

    tesis, ditambah 11/09/2012

    Konsep dan subjek ramalan kriminologi. Penubuhan kemungkinan perubahan dalam keadaan, tahap, struktur dan dinamik jenayah pada masa hadapan. Penilaian perkembangan jenayah pada masa hadapan. Perancangan kawalan jenayah dan pencegahan.

    kertas penggal, ditambah 29/05/2015

    Kajian tentang jenis ramalan dan reka bentuk kriminologi dalam bidang jenayah. Ciri-ciri ramalan kenakalan juvana di Republik Kazakhstan. Pembangunan program membanteras jenayah di peringkat kebangsaan.

    tesis, ditambah 25/10/2015

    Kenakalan remaja sebagai objek penyelidikan kriminologi. Ciri asas kriminologi kenakalan remaja. Keadaan jenayah. Ciri ciri peribadi kanak-kanak bawah umur.

    abstrak, ditambah 04/01/2003

    Trend dalam tingkah laku jenayah wanita moden: pertumbuhan dan perkadaran stabil jenayah serius dan berulang, peremajaan penjenayah dan peningkatan bilangan wanita warga emas dalam kalangan banduan. Langkah-langkah am untuk pencegahan jenayah wanita.

    abstrak, ditambah 03/01/2014

    Pengiraan penunjuk relatif struktur dan penyelarasan kategori banduan mengikut keterukan jenayah yang dilakukan. Kadar rekod jenayah dan jenayah mengikut daerah persekutuan dan Rusia secara keseluruhan. Pengiraan penunjuk dinamik menggunakan MS Excel.

    ujian, ditambah 07/31/2011

    Konsep, jenis, makna, penentu jenayah terpendam, puncanya, kaedah pencegahan dan pengurangan. Menentukan tahap dan analisis struktur jenayah. Pendekatan sistematik terhadap kajian jenayah terpendam sebagai fenomena sosial.

abstrak

Nilai min dan penunjuk variasi

1. Intipati purata dalam statistik

2. Jenis purata dan kaedah untuk pengiraannya

3. Penunjuk utama variasi dan kepentingannya dalam statistik

1. Intipati berat puratawajah dalam statistik

Dalam proses mengkaji fenomena sosio-ekonomi massa, ia menjadi perlu untuk mengenal pasti sifat umum, saiz tipikal dan ciri ciri mereka. Keperluan untuk purata generalisasi timbul apabila ciri-ciri yang mencirikan unit populasi yang dikaji berbeza-beza secara kuantitatif. Sebagai contoh, jumlah keluaran harian penenun di kilang tekstil bergantung pada keadaan umum pengeluaran, penenun menggunakan bahan mentah yang sama, bekerja pada mesin yang sama, dsb. Pada masa yang sama, keluaran setiap jam penenun individu berubah-ubah; berbeza-beza, kerana ia bergantung pada ciri individu setiap penenun (kelayakan, pengalaman profesional, dll.). Untuk mencirikan pengeluaran harian semua penenun perusahaan, adalah perlu untuk mengira purata pengeluaran harian, kerana, hanya dalam penunjuk ini, keadaan umum pengeluaran untuk penenun akan ditunjukkan.

Oleh itu, pengiraan penunjuk generalisasi purata bermaksud gangguan (abstraksi) daripada ciri yang dicerminkan dalam magnitud sifat dalam unit individu, dan pengenalpastian ciri dan sifat tipikal yang biasa kepada set tertentu.

Oleh itu, nilai purata dalam statistik ialah ciri umum, kuantitatif tanda dan populasi statistik. Ia menyatakan ciri, nilai tipikal sifat dalam unit populasi, yang terbentuk di bawah keadaan tempat dan masa yang diberikan di bawah pengaruh keseluruhan faktor. Tindakan pelbagai faktor menjana turun naik, variasi ciri purata. Nilai purata ialah ukuran umum tindakan mereka, hasil semua faktor ini. Nilai purata mencirikan populasi mengikut atribut purata, tetapi merujuk kepada unit populasi. Sebagai contoh, purata keluaran bagi setiap pekerja bagi perusahaan tertentu ialah nisbah semua keluaran (untuk sebarang tempoh masa) kepada jumlah (purata untuk tempoh yang sama) bilangan pekerjanya. Ia mencirikan produktiviti buruh bagi agregat tertentu, tetapi merujuk kepada seorang pekerja. Dalam nilai purata fenomena jisim, perbezaan individu dalam unit populasi statistik dalam nilai atribut purata, disebabkan oleh keadaan rawak, dibatalkan. Hasil daripada pembatalan bersama ini, sifat umum dan semula jadi bagi keseluruhan statistik fenomena tertentu ditunjukkan dalam purata. Terdapat hubungan dialektik antara nilai purata dan individu bagi atribut purata, seperti antara umum dan individu. Purata adalah kategori paling penting dalam sains statistik dan bentuk penunjuk generalisasi yang paling penting. Banyak fenomena kehidupan sosial menjadi jelas dan pasti hanya apabila ia digeneralisasikan dalam bentuk purata. Contohnya, produktiviti buruh yang disebutkan di atas, jumlah pekerja, hasil tanaman pertanian, dan sebagainya. Purata adalah kaedah generalisasi saintifik yang paling penting dalam statistik. Dalam pengertian ini, seseorang bercakap tentang kaedah purata, yang digunakan secara meluas dalam ekonomi. Banyak kategori sains ekonomi ditakrifkan menggunakan konsep purata.

Syarat utama untuk penggunaan nilai purata yang betul ialah kehomogenan populasi statistik mengikut atribut purata. Keseluruhan statistik homogen ialah keseluruhan di mana unsur-unsur konstituennya (unit) adalah serupa antara satu sama lain dari segi ciri-ciri penting untuk kajian ini dan tergolong dalam jenis fenomena yang sama. Populasi homogen, yang homogen dalam beberapa aspek, mungkin heterogen dalam yang lain. Hanya dalam purata untuk agregat tersebut ciri khusus, corak pembangunan fenomena yang dianalisis ditunjukkan. Purata yang dikira untuk populasi statistik heterogen, i.e. satu fenomena yang berbeza secara kualitatif digabungkan kehilangan kepentingan saintifiknya. Purata seperti itu adalah rekaan, bukan sahaja tidak memberikan gambaran tentang realiti, tetapi juga memutarbelitkannya. Untuk pembentukan agregat statistik homogen, kumpulan yang sesuai dijalankan. Dengan bantuan kumpulan dan dalam set homogen secara kualitatif, kumpulan ciri kuantitatif boleh dibezakan. Bagi setiap daripada mereka, purata sendiri boleh dikira, dipanggil purata kumpulan (swasta), berbeza dengan purata umum (untuk populasi secara keseluruhan).

2. Jenis-jenis purata

Amat penting dalam metodologi purata ialah persoalan memilih bentuk purata, i.e. formula yang membolehkan anda mengira nilai purata dengan betul, dan pilihan berat purata. Yang paling biasa digunakan dalam statistik min agregat, min aritmetik, min harmonik, mingeometri, purata punca kuasa dua, mod dan median. Penggunaan formula tertentu bergantung pada kandungan ciri purata dan data khusus yang mesti dikira. Untuk memilih bentuk purata, anda boleh menggunakan nisbah permulaan purata yang dipanggil.

2.1 Min aritmetik

Purata aritmetik adalah salah satu bentuk purata yang paling biasa. Purata aritmetik dikira sebagai hasil bagi membahagikan hasil tambah nilai individu (pilihan) tandatangan ke nombor mereka. Purata aritmetik digunakan dalam kes di mana isipadu atribut pembolehubah fenomena populasi statistik homogen dibentuk dengan menjumlahkan nilai atribut semua unit fenomena dalam populasi statistik. Terdapat nilai min aritmetik berikut:

1) min aritmetik mudah, yang ditentukan dengan hanya menjumlahkan nilai kuantitatif atribut yang berbeza-beza dan membahagikan jumlah ini dengan variannya dan dikira menggunakan formula berikut:

X - nilai purata populasi statistik,

x i - jumlah variasi individu yang berbeza-beza bagi fenomena populasi statistik,

n i - bilangan variasi yang berbeza-beza bagi fenomena populasi statistik.

2) Aritmetik min berwajaran- nilai purata tanda fenomena, dikira dengan mengambil kira berat. Berat nilai purata ialah kekerapan yang mana nilai individu bagi ciri purata diambil kira semasa mengira nilai puratanya. Pilihan pemberat untuk nilai purata bergantung pada sifat ciri purata dan sifat data yang tersedia untuk mengira nilai purata. Sebagai berat nilai purata, boleh terdapat penunjuk bilangan unit atau saiz bahagian populasi statistik (dalam bentuk nilai mutlak atau relatif) yang mempunyai varian tertentu (nilai) ciri purata fenomena populasi statistik, serta nilai penunjuk yang dikaitkan dengan ciri purata. Purata aritmetik berwajaran dikira menggunakan formula berikut:

Purata wajaran aritmetik X,

x - nilai variasi individu yang berbeza-beza bagi fenomena populasi statistik,

Tujuan min aritmetik yang mudah dan berwajaran adalah untuk menentukan nilai min bagi atribut pembolehubah. Jika dalam populasi statistik yang dikaji varian nilai atribut berlaku sekali atau mempunyai berat yang sama, maka min aritmetik mudah digunakan, tetapi jika varian nilai atribut ini berlaku beberapa kali dalam populasi yang dikaji atau mempunyai pemberat yang berbeza, min aritmetik digunakan untuk menentukan nilai purata atribut pembolehubah.berwajaran.

2.2 Purata harmonik

Min harmonik digunakan untuk mengira nilai purata apabila tiada data langsung pada pemberat, tetapi varian ciri purata (x) dan hasil darab nilai pilihan dengan bilangan unit yang mempunyai nilai ini w (w = xf) diketahui.

Purata ini dikira menggunakan formula berikut:

1.) Purata harmonik ringkas:

X - harmonik ringkas,

n - bilangan variasi variasi fenomena populasi statistik.

2) Purata wajaran harmonik:

X - purata wajaran harmonik,

x - jumlah variasi individu yang berbeza-beza bagi fenomena populasi statistik,

Apabila menggunakan pemberat harmonik, pemberat dikenal pasti dan dengan itu keputusan yang sama diperoleh yang akan memberikan pengiraan min aritmetik berwajaran jika semua data yang diperlukan untuk ini diketahui.

2.3 Agregat purata

Purata agregat dikira dengan formula:

X - purata agregat,

x - jumlah variasi individu yang berbeza-beza bagi fenomena populasi statistik,

Purata agregat dikira dalam kes di mana nilai pengangka dan penyebut nisbah awal purata diketahui (tersedia).

2.4 Purata geometri

Purata geometri ialah salah satu bentuk nilai purata dan dikira sebagai punca darjah ke-n daripada hasil darab nilai individu - varian atribut (x) dan ditentukan oleh formula berikut:

Min geometri digunakan terutamanya dalam mengira kadar pertumbuhan purata.

2.5 Mod dan median

Bersama-sama dengan purata yang dipertimbangkan di atas, apa yang dipanggil purata struktur - mod dan median.

Mod (Mo) ialah nilai yang paling kerap berlaku bagi sesuatu ciri dalam unit populasi. Untuk siri diskret, pilihan ini mempunyai kekerapan tertinggi.

Dalam siri variasi selang, adalah mungkin untuk menentukan, pertama sekali, selang di mana mod itu terletak, i.e. selang modal yang dipanggil. Dalam siri variasi dengan selang yang sama, selang modal ditentukan oleh frekuensi tertinggi, dalam siri dengan selang yang tidak sama, dengan ketumpatan taburan tertinggi.

Untuk menentukan mod dalam baris dengan selang yang sama, gunakan formula bentuk berikut:

Хн - had bawah selang modal,

h - nilai selang,

f 1 , f 2 , f 3 - frekuensi (atau butiran) bagi selang pra-modal, modal dan pascamodal, masing-masing.

Dalam siri selang waktu, mod boleh didapati secara grafik. Untuk melakukan ini, dua garisan diambil dari sempadan dua lajur bersebelahan dalam lajur tertinggi histogram. Kemudian, dari titik persilangan mereka, serenjang diturunkan ke paksi absis. Nilai ciri pada absis yang sepadan dengan serenjang akan menjadi mod.

Dalam banyak kes, apabila mencirikan populasi sebagai penunjuk umum, keutamaan diberikan kepada mod, bukannya min aritmetik.

Jadi, apabila mengkaji harga di pasaran, bukan harga purata untuk produk tertentu yang ditetapkan dan dikaji dalam dinamik, tetapi yang modal; apabila mengkaji permintaan penduduk untuk saiz kasut atau pakaian tertentu, adalah menarik untuk menentukan saiz modal kasut, dan saiz purata seperti itu tidak penting di sini sama sekali. Fesyen bukan sahaja untuk kepentingan bebas, tetapi juga memainkan peranan sebagai penunjuk tambahan dalam purata, mencirikan tipikalnya. Jika min aritmetik adalah hampir dengan nilai mod, maka ia adalah tipikal.

Median (Saya) ialah nilai ciri dalam unit tengah siri kedudukan. (Siri berperingkat ialah siri di mana nilai atribut ditulis dalam susunan menaik atau menurun.)

Untuk mencari median, nombor sirinya ditentukan terlebih dahulu. Untuk melakukan ini, dengan bilangan unit ganjil, satu ditambah kepada jumlah semua frekuensi, dan semuanya dibahagikan dengan dua. Jika bilangan unit genap, akan ada dua unit tengah dalam siri itu, dan mengikut semua peraturan median harus ditentukan sebagai purata nilai kedua-dua unit ini. Pada masa yang sama, secara praktikal dengan bilangan unit genap, median didapati sebagai nilai atribut unit, nombor ordinalnya ditentukan oleh jumlah jumlah frekuensi dibahagikan dengan dua. Mengetahui nombor ordinal median, adalah mudah untuk mencari nilainya daripada frekuensi terkumpul.

Dalam siri selang, selepas menentukan nombor ordinal median dengan frekuensi terkumpul (butiran), selang median ditemui, dan kemudian, menggunakan teknik interpolasi paling mudah, nilai median itu sendiri ditentukan. Pengiraan ini dinyatakan dengan formula berikut:

X n - had bawah selang median,

h - nilai selang median,

Nombor ordinal median,

S Me - 1 kekerapan (frekuensi) terkumpul sehingga selang median,

F Me - kekerapan (khusus) selang median.

Mengikut formula bertulis, ke sempadan bawah selang median, bahagian nilai selang sedemikian ditambah yang jatuh pada pecahan unit kumpulan ini yang hilang daripada nombor ordinal median. Dengan kata lain, pengiraan median adalah berdasarkan andaian bahawa pertumbuhan ciri di antara unit setiap kumpulan berlaku secara sama rata. Berdasarkan apa yang telah diperkatakan, median boleh dikira dengan cara lain. Setelah menentukan selang median, adalah mungkin untuk menolak daripada had atas selang median (Xv) bahagian selang yang jatuh pada pecahan unit yang melebihi nombor ordinal median, i.e. mengikut formula berikut:

Median juga boleh ditentukan secara grafik. Untuk melakukan ini, terkumpul dibina dan dari satu titik pada skala frekuensi terkumpul (butiran) sepadan dengan nombor ordinal median, garis lurus dilukis selari dengan paksi x sehingga ia bersilang dengan terkumpul. Kemudian, dari titik persilangan garis lurus yang ditunjukkan dengan terkumpul, serenjang diturunkan ke paksi absis. Nilai ciri pada paksi-x yang sepadan dengan ordinat yang dilukis (berserenjang) akan menjadi median.

Dengan prinsip yang sama, adalah mudah untuk mencari nilai ciri untuk mana-mana unit siri kedudukan.

Oleh itu, satu set keseluruhan penunjuk boleh digunakan untuk mengira nilai purata siri variasi.

3. Penunjuk utama varitions dan kepentingannya dalam statistik

Apabila mengkaji sifat pembolehubah dalam unit populasi, seseorang tidak boleh mengehadkan dirinya hanya untuk mengira nilai purata daripada varian individu, kerana nilai purata yang sama mungkin merujuk kepada populasi yang jauh daripada sama dalam komposisi. Ini boleh digambarkan melalui contoh bersyarat berikut, yang menggambarkan data tentang bilangan isi rumah dalam perusahaan pertanian dua daerah:

Purata bilangan isi rumah di ladang kedua-dua daerah adalah sama - 160. Pada masa yang sama, komposisi ladang-ladang ini di kedua-dua daerah adalah jauh daripada sama. Oleh itu, adalah perlu untuk mengukur variasi sesuatu sifat dalam populasi.

Untuk tujuan ini, beberapa ciri dikira dalam statistik, i.e. penunjuk. Penunjuk paling asas bagi variasi sesuatu sifat ialah julat variasi R, iaitu perbezaan antara nilai maksimum dan minimum sifat dalam siri variasi ini, i.e. R = Xmax - Xmin. Dalam contoh kami, di rantau 1 R = 300 - 80 - 220, dan di rantau kedua R = 180 - 145 = 35.

Julat penunjuk variasi tidak selalu terpakai, kerana ia hanya mengambil kira nilai ekstrem sifat, yang boleh sangat berbeza daripada semua unit lain. Kadangkala mereka mencari nisbah julat variasi kepada min aritmetik dan menggunakan nilai ini, memanggilnya penunjuk ayunan.

Lebih tepat lagi, anda boleh menentukan variasi dalam siri menggunakan penunjuk yang mengambil kira sisihan semua pilihan daripada min aritmetik. Terdapat dua penunjuk sedemikian dalam statistik - min linear dan min sisihan kuasa dua.

Sisihan linear purata mewakili min aritmetik bagi nilai mutlak sisihan varian daripada min. Tanda sisihan diabaikan dalam kes ini, jika tidak, jumlah semua sisihan akan sama dengan sifar. Penunjuk ini dikira dengan formula:

b) untuk siri variasi:

Perlu diingat bahawa sisihan linear purata akan menjadi minimum jika sisihan dikira dari median, i.e. mengikut formula:

Sisihan piawai () dikira seperti berikut - setiap sisihan daripada purata adalah kuasa dua, semua kuasa dua dijumlahkan (dengan mengambil kira berat), selepas itu jumlah kuasa dua dibahagikan dengan bilangan ahli siri dan punca kuasa dua diekstrak daripada hasil bahagi.

Semua tindakan ini dinyatakan oleh formula berikut:

a) untuk data tidak terkumpul:

b) untuk siri variasi:

f, i.e. Sisihan piawai ialah punca kuasa dua bagi min aritmetik bagi sisihan kuasa dua bagi min. Ungkapan di bawah akar dipanggil varians. Penyerakan mempunyai ungkapan bebas dalam statistik dan merupakan salah satu penunjuk variasi yang paling penting.

di mana - masing-masing, nilai maksimum dan minimum atribut dalam agregat;

ialah bilangan kumpulan.

Siri pengedaran boleh digambarkan menggunakan perwakilan grafiknya. Untuk tujuan ini, poligon, histogram, lengkung kumulatif, ogif dibina.

TEMA 4.Nilai mutlak dan relatif

Konsep penunjuk statistik dan jenisnya

statistik- ini ialah ciri pengitlak kuantitatif dan kualitatif bagi sesetengah harta sekumpulan unit atau agregat secara keseluruhan dalam keadaan tempat dan masa tertentu. Tidak seperti ciri, penunjuk statistik diperoleh melalui pengiraan. Ini boleh menjadi kiraan mudah unit populasi, penjumlahan nilai atribut, perbandingan dua atau lebih nilai, perbandingan yang lebih kompleks.

1. Mengikut liputan unit penduduk, penunjuk statistik dibahagikan:


2. Mengikut kaedah pengiraan, penunjuk statistik dibahagikan kepada:

3. Mengikut kepastian spatial, penunjuk statistik dibahagikan kepada:


Mengikut bentuk ungkapan, penunjuk statistik dibahagikan kepada:

Nilai mutlak

Nilai mutlak (penunjuk)- ini ialah nombor yang menyatakan saiz, isipadu fenomena dalam keadaan tempat dan masa tertentu. Nilai mutlak sentiasa dinamakan nilai, iaitu, mereka mempunyai beberapa unit ukuran. Bergantung pada unit ukuran yang dipilih, yang berikut dibezakan: jenis nilai mutlak:

1. semula jadi- mencirikan isipadu dan saiz fenomena dari segi panjang, berat, isipadu, bilangan unit, bilangan peristiwa. Penunjuk semula jadi digunakan untuk mencirikan volum, saiz jenis individu produk dengan nama yang sama, dan oleh itu penggunaannya adalah terhad.

2. Bersyarat semula jadi- digunakan sekiranya perlu untuk memindahkan pelbagai jenis produk, tetapi dengan nilai yang sama, ke dalam satu penunjuk bersyarat. Penunjuk semula jadi bersyarat dikira dengan mendarabkan penunjuk semula jadi dengan pekali penukaran (pengiraan semula). Pekali penukaran diambil dari direktori atau dikira secara bebas. Penunjuk semula jadi bersyarat digunakan untuk mencirikan isipadu, saiz produk homogen, dan oleh itu penggunaannya adalah terhad.

3. buruh- mempunyai unit ukuran seperti jam-manusia, hari-manusia. Digunakan untuk menentukan kos masa bekerja, untuk mengira upah dan produktiviti buruh.

4. kos(sejagat) diukur dalam mata wang negara masing-masing. Penunjuk kos = kuantiti produk dari segi fizikal * harga seunit pengeluaran. Penunjuk kos adalah universal, kerana ia membolehkan anda menentukan volum, saiz pelbagai jenis produk.

Kelemahan penunjuk mutlak: adalah mustahil untuk mencirikan ciri kualitatif dan struktur fenomena yang dikaji; untuk ini, penunjuk relatif digunakan, yang dikira berdasarkan penunjuk mutlak.

Nilai relatif

Penunjuk relatif- ini ialah penunjuk yang merupakan hasil bagi membahagikan satu penunjuk mutlak dengan yang lain dan memberikan ukuran berangka perhubungan antara mereka.


O.P yang tidak dinamakan

1. Pekali diperoleh jika asas perbandingan ialah 1. Jika pekali lebih besar daripada 1, maka ia menunjukkan berapa kali nilai perbandingan lebih besar daripada asas perbandingan. Jika pekali kurang daripada 1, maka ia menunjukkan bahagian asas perbandingan yang merupakan nilai perbandingan.

2. Peratusan akan diperolehi jika asas perbandingan ialah 100. Peratusan diperoleh dengan mendarab pekali dengan 100.

3. Permille (‰) - jika asas perbandingan ialah 1000. Diperolehi dengan mendarab pekali dengan 1000. Permille digunakan untuk mengelakkan nilai pecahan penunjuk. Ia digunakan secara meluas dalam statistik demografi, di mana kadar kematian, kadar kelahiran dan perkahwinan ditentukan bagi setiap 1,000 orang.

4. Prodecimille (‰0) jika asas perbandingan ialah 10,000. Ia diperoleh dengan mendarab pekali dengan 10,000. Contohnya, berapa ramai doktor, katil hospital bagi setiap 10,000 orang.

Jenis nilai relatif (penunjuk):

1. Indeks struktur relatif:

Penunjuk ini dikira daripada data terkumpul dan menunjukkan bahagian bahagian individu dalam jumlah volum populasi. Ia boleh dinyatakan sebagai nisbah (bahagian) atau peratusan (graviti tentu). Contoh, 0.4 - bahagian, 40% - graviti tentu. Jumlah semua saham adalah sama dengan 1, dan graviti tentu ialah 100%.

2. Penunjuk relatif dinamik:

.

Penunjuk ini menunjukkan perubahan dalam fenomena dari semasa ke semasa. Ia dinyatakan dalam bentuk pekali - faktor pertumbuhan, dan dalam bentuk peratusan - kadar pertumbuhan.

3. Prestasi relatif pelan:

Penunjuk ini menunjukkan tahap pelaksanaan rancangan dan dinyatakan dalam bentuk%.

Penunjuk sasaran relatif:

Penunjuk ini menunjukkan apa yang dirancang untuk menukar penunjuk pada masa hadapan berbanding tempoh sebelumnya dan dinyatakan sebagai peratusan.

Hubungan antara penunjuk: .

5. Penunjuk relatif koordinasi:

Penunjuk ini boleh dikira untuk 1, 10, 100 unit dan menunjukkan berapa banyak unit satu bahagian menyumbang purata 1, 10, 100 unit bahagian lain. Sebagai contoh, bilangan penduduk bandar bagi setiap 1, 10, 100 penduduk kampung

6. Penunjuk keamatan relatif:

Penunjuk ini dikira dengan membandingkan penunjuk berbeza yang mempunyai hubungan tertentu antara satu sama lain. Penunjuk ini boleh dikira untuk 1, 10, 100 unit dan merupakan penunjuk yang dinamakan. Sebagai contoh, kepadatan penduduk - orang / 1, 10, 100 km2.

7. Indeks Perbandingan Relatif:

Penunjuk ini dikira dengan membandingkan penunjuk serupa yang berkaitan dengan tempoh masa yang sama, tetapi dengan objek atau wilayah yang berbeza. Ia dinyatakan dalam bentuk pekali dan peratusan.

TEMA 5. Nilai min dan penunjuk variasi

1. Nilai purata: konsep dan jenis

Nilai purata - ini ialah penunjuk umum yang mencirikan tahap tipikal bagi sifat kuantitatif yang berbeza-beza bagi setiap unit populasi di bawah keadaan tempat dan masa tertentu.

Syarat untuk mengira nilai purata:

1. Populasi di mana nilai purata dikira mestilah cukup besar, jika tidak, sisihan rawak dalam nilai atribut tidak akan dibatalkan dan purata tidak akan menunjukkan corak yang wujud dalam proses ini.

2. Populasi di mana nilai purata dikira mestilah homogen secara kualitatif, jika tidak, mereka bukan sahaja tidak mempunyai nilai saintifik, tetapi mungkin juga berbahaya, memesongkan sifat sebenar fenomena yang dikaji.

3. Purata keseluruhan hendaklah ditambah dengan purata kumpulan. Purata umum menunjukkan saiz tipikal keseluruhan populasi, dan purata kumpulan menunjukkan bahagian individunya dengan sifat khusus.

4. Untuk penerangan menyeluruh tentang fenomena, sistem penunjuk purata harus dikira, mengikut ciri yang paling ketara.

Nilai purata sentiasa dinamakan, ia mempunyai dimensi yang sama dengan ciri purata.

Jenis purata:

1. Kuasa bermaksud(ini termasuk min aritmetik, min harmonik, min segi empat sama, min geometri);

2. Purata struktur(mod dan median).

Cara kuasa dikira dengan formula (akar kepada kuasa R cara semua pilihan yang diambil sedikit sebanyak):

di manakah nilai min kuasa bagi ciri yang dikaji;

− nilai individu bagi ciri purata;

− penunjuk tahap purata;

− bilangan tanda (set tunggal);

− jumlah.

Bergantung pada tahap, pelbagai jenis purata mudah diperolehi.

Maknanya

Nama purata mudah

harmonik ringkas

di mana P ialah hasil darab

geometri mudah

aritmetik mudah

kuadratik mudah

Semakin tinggi eksponen () dalam min kuasa, semakin besar nilai min itu sendiri. Jika kita mengira semua purata ini untuk data yang sama, kita mendapat nisbah berikut:

Sifat undang-undang kuasa ini bermakna meningkat dengan peningkatan eksponen fungsi penentu dipanggil peraturan majoriti cara.

Daripada jenis purata ini, yang paling biasa digunakan ialah purata aritmetik dan purata harmonik. Pilihan jenis purata bergantung pada maklumat awal.

Min aritmetik: kaedah pengiraan dan sifatnya

Purata aritmetik ialah hasil bagi membahagikan jumlah nilai individu bagi ciri semua unit populasi dengan bilangan unit populasi.

Min aritmetik digunakan dalam bentuk purata mudah dan purata wajaran. min aritmetik mudah dikira dengan formula:

di manakah nilai purata ciri;

- nilai individu atribut (pilihan);

− bilangan unit populasi (pilihan).

Purata aritmetik mudah digunakan dalam dua kes:

apabila setiap varian berlaku sekali sahaja dalam siri pengedaran;

apabila semua frekuensi adalah sama.

Purata wajaran aritmetik digunakan apabila frekuensi tidak sama antara satu sama lain:

di mana − frekuensi atau berat (nombor menunjukkan bilangan

kali nilai individu berlaku

tanda).

Sifat bagi min aritmetik(tiada bukti):

1. Nilai purata bagi nilai malar adalah sama dengan dirinya sendiri: .

2. Hasil darab nilai purata dan hasil tambah frekuensi adalah sama dengan hasil darab pilihan dan frekuensinya: .

3. Jika setiap pilihan dinaikkan atau dikurangkan dengan jumlah yang sama, maka nilai purata akan meningkat atau menurun dengan jumlah yang sama: .

4. Jika setiap pilihan dinaikkan atau dikurangkan dengan bilangan kali yang sama, maka nilai purata akan meningkat atau menurun dengan bilangan kali yang sama: .

5. Jika semua frekuensi dinaikkan atau dikurangkan dengan bilangan kali yang sama, nilai purata tidak akan berubah: .

6. Nilai purata jumlah adalah sama dengan jumlah nilai purata: .

7. Jumlah sisihan semua nilai sifat daripada nilai purata ialah sifar.

3. Kaedah untuk mengira min harmonik

Dalam sesetengah kes, sifat data awal adalah sedemikian sehingga pengiraan min aritmetik kehilangan maknanya dan satu-satunya penunjuk umum boleh menjadi min harmonik.

Jenis harmonik min:

1. Purata harmonik ringkas dikira dengan formula:

Ringkas harmonik ringkas digunakan sangat jarang, hanya untuk mengira purata masa yang dibelanjakan untuk pembuatan unit pengeluaran, dengan syarat bahawa frekuensi semua pilihan adalah sama.

2. Purata wajaran harmonik dikira dengan formula:

.

di manakah jumlah isipadu fenomena itu.

Purata wajaran harmonik digunakan jika keseluruhan isipadu fenomena diketahui, tetapi frekuensinya tidak diketahui. Harmonik ini digunakan untuk mengira penunjuk kualiti purata: gaji purata, harga purata, kos purata, hasil purata, produktiviti buruh purata.

4. Purata struktur: mod dan median

Purata struktur (mod, median) digunakan untuk mengkaji struktur dalaman dan struktur siri taburan nilai atribut.

Fesyen- nilai atribut yang paling biasa dalam unit populasi. Dalam siri pengedaran di mana setiap varian berlaku sekali, mod tidak dikira. Dalam siri diskret, mod ialah varian dengan frekuensi tertinggi. Untuk siri selang dengan selang yang sama, mod dikira dengan formula:

.

di manakah sempadan awal (bawah) selang modal;

- nilai selang modal, sebelum - dan pascamodal, masing-masing

− kekerapan selang modal, pra dan pascamodal, masing-masing.

Selang modal ialah selang yang mempunyai frekuensi tertinggi.

Median ialah nilai ciri yang terletak di tengah-tengah siri kedudukan dan membahagikan siri ini kepada dua bahagian yang sama dengan bilangan unit: satu bahagian mempunyai nilai ciri kurang daripada median, dan satu lagi lebih besar daripada median.

baris berperingkat ialah susunan nilai ciri dalam susunan menaik atau menurun.

Dalam siri kedudukan diskret, di mana setiap pilihan berlaku sekali, dan bilangan pilihan tidak genap, nombor median ditentukan oleh formula:

di manakah bilangan sebutan dalam siri itu.

Dalam siri kedudukan diskret, di mana setiap pilihan berlaku sekali dan bilangan pilihan adalah genap, median akan menjadi min aritmetik bagi dua pilihan yang terletak di tengah-tengah siri kedudukan.

Dalam siri kedudukan diskret, di mana setiap pilihan berlaku beberapa kali, nombor median ditentukan oleh formula:

Kemudian, bermula dari pilihan pertama, frekuensi dijumlahkan secara berurutan sehingga anda mendapat .

Untuk siri selang waktu, median dikira dengan formula:

,

di manakah had bawah selang median;

− nilai selang median;

−jumlah bilangan unit penduduk;

− kekerapan terkumpul sehingga selang median;

ialah kekerapan selang median.

Selang median ialah selang di mana kekerapan terkumpulnya adalah sama atau lebih daripada separuh jumlah semua frekuensi dalam siri itu.

5. Penunjuk variasi

Variasi Ciri- ini adalah perbezaan dalam nilai individu sifat dalam populasi yang dikaji. Variasi sesuatu sifat dicirikan oleh penunjuk variasi. Penunjuk variasi melengkapkan nilai purata, mencirikan tahap kehomogenan populasi statistik untuk sifat tertentu, sempadan variasi sifat. Nisbah penunjuk variasi menentukan hubungan antara ciri.

Penunjuk variasi dibahagikan kepada:

1) Mutlak: julat variasi; sisihan linear purata; sisihan piawai; penyebaran. Mereka mempunyai unit yang sama dengan nilai ciri.

2) Relatif: pekali ayunan, pekali variasi, sisihan linear relatif.

Julat variasi menunjukkan berapa banyak nilai atribut berubah:

di manakah nilai maksimum ciri;

ialah nilai minimum ciri.

Purata sisihan linear dan purata sisihan kuasa dua menunjukkan berapa banyak nilai individu ciri berbeza secara purata daripada nilai minnya.

Sisihan linear purata ditakrifkan:

- mudah; - berwajaran.

Penyerakan ditakrifkan:

- mudah; - berwajaran;

- mudah; - berwajaran.

Jika nilai purata atribut dikira menggunakan aritmetik mudah, maka ia dikira menggunakan formula mudah, jika purata dikira menggunakan satu wajaran, maka ia dikira menggunakan formula berwajaran.

Penyerakandan sisihan piawai juga boleh dikira menggunakan formula yang berbeza:

- mudah; - berwajaran.

Untuk membandingkan variasi ciri yang berbeza dalam populasi yang sama atau sifat yang sama dalam populasi yang berbeza, penunjuk relatif variasi dikira, dipanggil pekali variasi:

Semakin besar nilai pekali variasi, semakin besar penyebaran nilai atribut di sekeliling purata, semakin kurang homogen populasi dalam komposisinya dan semakin kurang mewakili purata. Set itu dianggap homogen jika pekali variasi tidak melebihi 33%.

6. Jenis-jenis serakan dan hukum (peraturan) penambahan serakan

Jika populasi yang dikaji terdiri daripada beberapa kumpulan yang dibentuk berdasarkan sebarang ciri, maka sebagai tambahan kepada jumlah varians, varians antara kumpulan juga ditentukan.

mengikut peraturan penambahan varians jumlah varians adalah sama dengan jumlah purata varians antara kumpulan dan antara kumpulan:

Menggunakan peraturan menambah varians, adalah sentiasa mungkin untuk menentukan yang ketiga, tidak diketahui, daripada dua varians yang diketahui, dan juga untuk menilai kekuatan pengaruh atribut kumpulan.

Pekali penentuan empirikal menunjukkan bahagian disebabkan oleh variasi ciri pengelompokan dalam jumlah variasi ciri yang dikaji:

Hubungan korelasi empirikal menunjukkan pengaruh atribut yang mendasari kumpulan pada variasi atribut yang terhasil:

Nisbah korelasi empirikal berbeza dari 0 hingga 1. Jika tiada sambungan, jika - sambungan selesai. Nilai perantaraan dinilai mengikut kedekatannya dengan nilai had.

TEMA 6.Siri dinamik

1. Siri dinamik: konsep dan jenis

Siri dinamik ( siri kronologi, siri dinamik, siri masa) ialah satu siri nilai berangka penunjuk statistik yang disusun dalam urutan kronologi. Satu siri dinamik terdiri daripada dua elemen (graf):

1. masa (t) ialah detik (tarikh) atau tempoh (tahun, suku tahun, bulan, hari) masa yang dirujuk oleh penunjuk statistik (peringkat siri).

2. tahap siri (y) – nilai penunjuk statistik yang mencirikan keadaan fenomena pada titik masa tertentu atau sepanjang tempoh masa.

Aras baris y

Jenis siri dinamik:

1. Mengikut masa:

A) selang - siri, tahap yang mencirikan saiz fenomena dalam tempoh masa (hari, bulan, suku tahun, tahun). Contoh siri sedemikian ialah data mengenai dinamik pengeluaran, bilangan hari manusia bekerja, dsb. Tahap mutlak siri selang boleh disimpulkan, jumlahnya masuk akal, yang memungkinkan untuk mendapatkan siri dinamik daripada tempoh yang lebih besar.

B) sekejap - siri, tahap yang mencirikan saiz fenomena pada tarikh (momen) masa. Contoh siri sedemikian boleh menjadi data mengenai dinamik populasi, ternakan, inventori, nilai aset tetap, aset semasa, dll. Tahap siri detik tidak boleh diringkaskan, jumlahnya tidak masuk akal, kerana yang seterusnya tahap sepenuhnya atau sebahagiannya merangkumi satu tahap sebelumnya.

2. Mengikut bentuk persembahan (kaedah ekspresi) peringkat:

A) siri nilai mutlak.

B) siri nilai relatif. Nilai relatif mencirikan, sebagai contoh, dinamik bahagian penduduk bandar dan luar bandar (%) dan kadar pengangguran.