Biografi Ciri-ciri Analisis

Bagaimana untuk mengira min aritmetik. Ringkasan: Nilai purata yang digunakan dalam statistik

Istilah ini mempunyai makna lain, lihat makna purata.

Purata(dalam matematik dan statistik) set nombor - jumlah semua nombor dibahagikan dengan nombornya. Ia adalah salah satu ukuran kecenderungan memusat yang paling biasa.

Ia telah dicadangkan (bersama-sama dengan min geometri dan min harmonik) oleh Pythagoreans.

Kes khas bagi min aritmetik ialah min (daripada populasi umum) dan min sampel (bagi sampel).

pengenalan

Nyatakan set data X = (x 1 , x 2 , …, x n), maka min sampel biasanya dilambangkan dengan bar mendatar di atas pembolehubah (x ¯ (\displaystyle (\bar (x))) , disebut " x dengan sengkang").

Huruf Yunani μ digunakan untuk menunjukkan min aritmetik bagi keseluruhan populasi. Untuk pembolehubah rawak, yang mana nilai min ditakrifkan, μ ialah min kebarangkalian atau nilai yang dijangkakan pembolehubah rawak. Jika set X adalah koleksi nombor rawak dengan kebarangkalian min μ, kemudian bagi mana-mana sampel x i daripada koleksi ini μ = E( x i) adalah jangkaan sampel ini.

Dalam amalan, perbezaan antara μ dan x ¯ (\displaystyle (\bar (x))) ialah μ ialah pembolehubah biasa kerana anda boleh melihat pilihan dan bukannya keseluruhan Populasi umum. Oleh itu, jika sampel diwakili secara rawak (dari segi teori kebarangkalian), maka x ¯ (\displaystyle (\bar (x))) (tetapi bukan μ) boleh dianggap sebagai pembolehubah rawak yang mempunyai taburan kebarangkalian pada sampel ( taburan kebarangkalian bagi min).

Kedua-dua kuantiti ini dikira dengan cara yang sama:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Sekiranya X ialah pembolehubah rawak, maka jangkaan matematik X boleh dianggap sebagai min aritmetik bagi nilai dalam pengukuran kuantiti berulang X. Ini adalah manifestasi undang-undang nombor besar. Oleh itu, min sampel digunakan untuk menganggar jangkaan matematik yang tidak diketahui.

Dalam algebra asas, dibuktikan bahawa min n+ 1 nombor melebihi purata n nombor jika dan hanya jika nombor baru lebih besar daripada purata lama, kurang jika dan hanya jika nombor baru kurang daripada purata, dan tidak berubah jika dan hanya jika nombor baru sama dengan purata. Lebih banyak n, semakin kecil perbezaan antara purata baharu dan lama.

Ambil perhatian bahawa terdapat beberapa "cara" lain yang tersedia, termasuk min undang-undang kuasa, min Kolmogorov, min harmonik, min aritmetik-geometrik dan pelbagai min berwajaran (cth., min berwajaran aritmetik, min berwajaran geometri, min berwajaran harmonik) .

Contoh

x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Untuk empat nombor, anda perlu menambahnya dan membahagi dengan 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Atau lebih mudah 5+5=10, 10:2. Kerana kita menambah 2 nombor, bermakna berapa banyak nombor yang kita tambah, kita bahagi dengan sebanyak itu.

Pembolehubah rawak berterusan

Untuk nilai teragih berterusan f (x) (\displaystyle f(x)) min aritmetik pada selang [ a ; b ] (\displaystyle ) ditakrifkan melalui kamiran pasti:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Beberapa masalah menggunakan purata

Kurang keteguhan

Rencana utama: Kekukuhan dalam statistik

Walaupun min aritmetik sering digunakan sebagai cara atau arah aliran pusat, konsep ini tidak terpakai pada statistik teguh, yang bermaksud bahawa min aritmetik tertakluk kepada pengaruh yang kuat"penyimpangan besar". Perlu diperhatikan bahawa untuk taburan dengan kecondongan yang besar, min aritmetik mungkin tidak sepadan dengan konsep "purata", dan nilai min daripada statistik teguh (contohnya, median) mungkin menggambarkan arah aliran pusat dengan lebih baik.

Contoh klasik ialah pengiraan pendapatan purata. Min aritmetik boleh disalahtafsirkan sebagai median, yang boleh membawa kepada kesimpulan bahawa terdapat lebih ramai orang yang mempunyai pendapatan lebih daripada yang sebenarnya. Pendapatan "min" ditafsirkan sedemikian rupa sehingga pendapatan kebanyakan orang hampir dengan jumlah ini. Pendapatan "purata" (dalam erti kata purata aritmetik) ini lebih tinggi daripada pendapatan kebanyakan orang, kerana pendapatan yang tinggi dengan sisihan besar daripada purata menjadikan min aritmetik sangat condong (sebaliknya, pendapatan median "menentang" seperti condong). Walau bagaimanapun, pendapatan "purata" ini tidak menyatakan apa-apa tentang bilangan orang berhampiran pendapatan median (dan tidak mengatakan apa-apa tentang bilangan orang berhampiran pendapatan modal). Walau bagaimanapun, jika konsep "purata" dan "majoriti" dipandang ringan, maka seseorang boleh membuat kesimpulan yang salah bahawa kebanyakan orang mempunyai pendapatan yang lebih tinggi daripada yang sebenarnya. Sebagai contoh, laporan mengenai pendapatan bersih "purata" di Madinah, Washington, yang dikira sebagai purata aritmetik bagi semua pendapatan bersih tahunan pemastautin, akan memberikan angka yang sangat tinggi disebabkan oleh Bill Gates. Pertimbangkan sampel (1, 2, 2, 2, 3, 9). Min aritmetik ialah 3.17, tetapi lima daripada enam nilai berada di bawah min ini.

Faedah kompaun

Rencana utama: ROI

Jika nombor membiak, tetapi tidak lipat, anda perlu menggunakan min geometri, bukan min aritmetik. Selalunya, kejadian ini berlaku semasa mengira pulangan pelaburan dalam kewangan.

Sebagai contoh, jika saham jatuh 10% pada tahun pertama dan naik 30% pada tahun kedua, maka adalah tidak betul untuk mengira kenaikan "purata" sepanjang dua tahun ini sebagai min aritmetik (-10% + 30%) / 2 = 10%; purata yang betul dalam kes ini diberikan oleh kadar pertumbuhan tahunan kompaun, dari mana pertumbuhan tahunan hanya kira-kira 8.16653826392% ≈ 8.2%.

Sebabnya ialah peratusan mempunyai titik permulaan baharu setiap kali: 30% ialah 30% daripada nombor yang kurang daripada harga pada awal tahun pertama: jika saham bermula pada $30 dan jatuh 10%, ia bernilai $27 pada permulaan tahun kedua. Jika stok naik 30%, ia bernilai $35.1 pada akhir tahun kedua. Purata aritmetik pertumbuhan ini ialah 10%, tetapi memandangkan stok hanya berkembang sebanyak $5.1 dalam 2 tahun, peningkatan purata sebanyak 8.2% memberikan hasil akhir sebanyak $35.1:

[$30 (1 - 0.1) (1 + 0.3) = $30 (1 + 0.082) (1 + 0.082) = $35.1]. Jika kita menggunakan min aritmetik 10% dengan cara yang sama, kita tidak akan mendapat nilai sebenar: [$30 (1 + 0.1) (1 + 0.1) = $36.3].

Faedah kompaun pada akhir tahun 2: 90% * 130% \u003d 117%, iaitu, jumlah peningkatan sebanyak 17%, dan purata tahunan faedah kompaun 117% ≈ 108.2% (\displaystyle (\sqrt (117\%))\lebih kurang 108.2\%) , iaitu purata peningkatan tahunan sebanyak 8.2%.

Arah

Rencana utama: Statistik destinasi

Apabila mengira purata nilai aritmetik beberapa pembolehubah yang berubah secara kitaran (contohnya, fasa atau sudut), penjagaan khusus harus diambil. Sebagai contoh, purata 1° dan 359° ialah 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Nombor ini tidak betul kerana dua sebab.

  • pertama, langkah sudut ditakrifkan hanya untuk julat 0° hingga 360° (atau 0 hingga 2π apabila diukur dalam radian). Oleh itu, pasangan nombor yang sama boleh ditulis sebagai (1° dan −1°) atau sebagai (1° dan 719°). Purata setiap pasangan adalah berbeza: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circling )), 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Kedua, dalam kes ini, nilai 0° (bersamaan dengan 360°) akan menjadi min terbaik dari segi geometri, kerana nombor menyimpang kurang daripada 0° berbanding mana-mana nilai lain (nilai 0° mempunyai varians terkecil). Bandingkan:
    • nombor 1° menyimpang dari 0° dengan hanya 1°;
    • nombor 1° menyimpang daripada purata pengiraan 180° sebanyak 179°.

Nilai purata untuk pembolehubah kitaran, yang dikira mengikut formula di atas, akan dianjakkan secara buatan berbanding purata sebenar ke tengah julat berangka. Oleh sebab itu, purata dikira dengan cara yang berbeza, iaitu, nombor dengan varians terkecil (titik tengah) dipilih sebagai nilai purata. Selain itu, bukannya menolak, jarak modulo (iaitu, jarak lilitan) digunakan. Sebagai contoh, jarak modular antara 1° dan 359° ialah 2°, bukan 358° (pada bulatan antara 359° dan 360°==0° - satu darjah, antara 0° dan 1° - juga 1°, secara keseluruhannya - 2 °).

Jenis nilai purata dan kaedah untuk pengiraannya

Di pentas pemprosesan statistik Pelbagai masalah penyelidikan boleh ditetapkan, untuk penyelesaiannya adalah perlu untuk memilih purata yang sesuai. Dalam kes ini, perlu dipandu oleh peraturan berikut: nilai-nilai yang mewakili pengangka dan penyebut purata mestilah berkaitan secara logik antara satu sama lain.

  • purata kuasa;
  • purata struktur.

Mari kita perkenalkan notasi berikut:

Nilai yang dikira purata;

Purata, di mana garis atas menunjukkan bahawa purata sedang berlaku nilai individu;

Kekerapan (kebolehulangan nilai sifat individu).

Pelbagai cara diperoleh daripada formula min kuasa am:

(5.1)

untuk k = 1 - min aritmetik; k = -1 - min harmonik; k = 0 - min geometri; k = -2 - punca min kuasa dua.

Purata sama ada mudah atau wajaran. purata wajaran dipanggil kuantiti yang mengambil kira bahawa beberapa varian nilai atribut mungkin mempunyai nombor yang berbeza, dan oleh itu setiap varian perlu didarab dengan nombor ini. Dalam erti kata lain, "berat" ialah bilangan unit populasi dalam kumpulan yang berbeza, i.e. setiap pilihan "ditimbang" mengikut kekerapannya. Frekuensi f dipanggil berat statistik atau purata berat.

Min aritmetik- jenis medium yang paling biasa. Ia digunakan apabila pengiraan dijalankan pada data statistik tidak terkumpul, di mana anda ingin mendapatkan summan purata. Min aritmetik ialah nilai purata bagi sesuatu ciri, apabila menerimanya, jumlah isipadu ciri dalam populasi kekal tidak berubah.

Rumus min aritmetik ( ringkas) mempunyai bentuk

di mana n ialah saiz populasi.

Sebagai contoh, purata gaji pekerja sesebuah perusahaan dikira sebagai purata aritmetik:

Penunjuk penentu di sini ialah gaji setiap pekerja dan bilangan pekerja perusahaan. Apabila mengira purata, jumlah gaji tetap sama, tetapi diagihkan, seolah-olah, sama rata di kalangan semua pekerja. Sebagai contoh, anda perlu mengira purata upah pekerja sebuah syarikat kecil yang menggaji 8 orang:

Apabila mengira purata, nilai individu bagi atribut yang dipuratakan boleh diulang, jadi purata dikira menggunakan data terkumpul. Dalam kes ini kita bercakap tentang menggunakan aritmetik min wajaran, yang kelihatan seperti

(5.3)

Jadi, kita perlu mengira purata harga saham syarikat saham bersama di bursa saham. Adalah diketahui bahawa urus niaga telah dijalankan dalam tempoh 5 hari (5 urus niaga), jumlah saham yang dijual pada kadar jualan diagihkan seperti berikut:

1 - 800 ac. - 1010 rubel

2 - 650 ac. - 990 gosok.

3 - 700 ak. - 1015 rubel.

4 - 550 ac. - 900 gosok.

5 - 850 ak. - 1150 rubel.

Nisbah awal untuk menentukan harga saham purata ialah nisbah jumlah keseluruhan urus niaga (OSS) kepada bilangan saham yang dijual (KPA):

OSS = 1010 800+990 650+1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

Dalam kes ini, harga saham purata adalah sama dengan

Adalah perlu untuk mengetahui sifat-sifat min aritmetik, yang sangat penting untuk kegunaannya dan untuk pengiraannya. Tiga boleh dibezakan sifat asas, yang kebanyakannya membawa kepada penggunaan min aritmetik secara meluas dalam pengiraan statistik dan ekonomi.

Harta satu (sifar): jumlah sisihan positif nilai individu ciri daripada nilai min adalah sama dengan jumlah sisihan negatif. Ini adalah sifat yang sangat penting, kerana ia menunjukkan bahawa sebarang penyelewengan (kedua-duanya dengan + dan dengan -) disebabkan sebab rawak akan dibatalkan bersama.

Bukti:

Harta dua (minimum): jumlah sisihan kuasa dua nilai individu bagi sifat daripada min aritmetik adalah kurang daripada mana-mana nombor lain (a), i.e. ialah nombor minimum.

Bukti.

Susun jumlah sisihan kuasa dua daripada pembolehubah a:

(5.4)

Untuk mencari ekstrem fungsi ini, adalah perlu untuk menyamakan terbitannya berkenaan dengan a kepada sifar:

Dari sini kita dapat:

(5.5)

Oleh itu, keterlaluan jumlah sisihan kuasa dua dicapai pada . Ekstrem ini adalah minimum, kerana fungsi tidak boleh mempunyai maksimum.

Harta tiga: min aritmetik nilai tetap adalah sama dengan pemalar ini: untuk a = const.

Sebagai tambahan kepada ketiga-tiga ini sifat yang paling penting aritmetik min, ada yang dipanggil sifat reka bentuk, yang secara beransur-ansur kehilangan kepentingannya disebabkan oleh penggunaan komputer elektronik:

  • jika nilai individu atribut setiap unit didarab atau dibahagikan dengan nombor tetap, maka min aritmetik akan bertambah atau berkurang dengan jumlah yang sama;
  • min aritmetik tidak akan berubah jika berat (kekerapan) setiap nilai ciri dibahagikan dengan nombor tetap;
  • jika nilai individu atribut setiap unit dikurangkan atau ditambah dengan jumlah yang sama, maka min aritmetik akan berkurangan atau meningkat dengan jumlah yang sama.

Purata harmonik. Purata ini dipanggil purata aritmetik salingan, kerana nilai ini digunakan apabila k = -1.

Min harmonik mudah digunakan apabila berat nilai ciri adalah sama. Formulanya boleh diperolehi daripada formula asas, menggantikan k = -1:

Sebagai contoh, kita perlu mengira kelajuan purata dua kereta yang telah melalui laluan yang sama, tetapi pada kelajuan yang berbeza: yang pertama - pada kelajuan 100 km / j, yang kedua - 90 km / j. Menggunakan kaedah min harmonik, kami mengira kelajuan purata:

Dalam amalan statistik, wajaran harmonik lebih kerap digunakan, formula yang mempunyai bentuk

Formula ini digunakan dalam kes di mana pemberat (atau isipadu fenomena) untuk setiap atribut tidak sama. Dalam nisbah asal, pengangka diketahui mengira purata, tetapi penyebutnya tidak diketahui.

Sebagai contoh, apabila mengira harga purata, kita mesti menggunakan nisbah jumlah yang dijual kepada bilangan unit yang dijual. Kami tidak tahu bilangan unit yang dijual (kami bercakap tentang barangan yang berbeza), tetapi kami tahu jumlah jualan barangan yang berbeza ini. Katakan kita perlu tahu harga purata barang yang dijual:

Kita mendapatkan

Purata geometri. Selalunya, min geometri menemui aplikasinya dalam menentukan kadar pertumbuhan purata (kadar pertumbuhan purata), apabila nilai individu sifat itu dibentangkan dalam bentuk nilai relatif. Ia juga digunakan jika perlu untuk mencari purata antara minimum dan nilai maksimum ciri (contohnya, antara 100 dan 1000000). Terdapat formula untuk min geometri mudah dan wajaran.

Untuk min geometri yang mudah

Bagi min geometri berwajaran

Sederhana nilai segi empat sama . Skop utama penggunaannya ialah pengukuran variasi sifat dalam populasi (pengiraan purata sisihan piawai).

Rumus kuasa dua min punca mudah

Formula Kuasa Dua Akar Wajaran

(5.11)

Akibatnya, boleh dikatakan begitu pilihan yang tepat jenis nilai purata dalam setiap kes tertentu bergantung penyelesaian yang berjaya tugas penyelidikan statistik. Pilihan purata menganggap urutan berikut:

a) penubuhan penunjuk umum populasi;

b) penentuan nisbah matematik nilai untuk penunjuk umum tertentu;

c) penggantian nilai individu dengan nilai purata;

d) pengiraan purata menggunakan persamaan yang sepadan.

Nilai min dan variasi

nilai purata ialah penunjuk generalisasi yang mencirikan populasi homogen secara kualitatif untuk sesuatu yang tertentu atribut kuantitatif. Sebagai contoh, purata umur orang yang disabitkan kesalahan mencuri.

Dalam statistik kehakiman, purata digunakan untuk mencirikan:

Purata syarat pertimbangan bagi kes kategori ini;

Tuntutan saiz sederhana;

Purata bilangan defendan setiap kes;

Purata jumlah kerosakan;

Purata beban kerja hakim, dsb.

Nilai purata sentiasa dinamakan dan mempunyai dimensi yang sama dengan atribut unit berasingan populasi. setiap satu nilai purata mencirikan populasi yang dikaji mengikut mana-mana satu atribut yang berbeza-beza, oleh itu, di sebalik sebarang purata, satu siri taburan unit populasi ini mengikut atribut yang dikaji tersembunyi. Pilihan jenis purata ditentukan oleh kandungan penunjuk dan data awal untuk mengira purata.

Semua jenis purata yang digunakan dalam kajian statistik terbahagi kepada dua kategori:

1) purata kuasa;

2) purata struktur.

Kategori purata pertama termasuk: min aritmetik, min harmonik, min geometri dan punca purata kuasa dua . Kategori kedua ialah fesyen dan median. Pada masa yang sama, setiap daripada spesies tersenarai cara kuasa boleh mempunyai dua bentuk: ringkas dan berwajaran . bentuk mudah nilai min digunakan untuk mendapatkan nilai purata trait yang dikaji apabila pengiraan dijalankan pada data statistik tidak terkumpul, atau apabila setiap varian dalam populasi berlaku sekali sahaja. Purata wajaran dipanggil nilai yang mengambil kira bahawa pilihan untuk nilai ciri boleh mempunyai nombor yang berbeza, dan oleh itu setiap pilihan perlu didarab dengan kekerapan yang sepadan. Dalam erti kata lain, setiap pilihan "ditimbang" mengikut kekerapannya. Kekerapan dipanggil berat statistik.

min aritmetik mudah- jenis medium yang paling biasa. Ia sama dengan jumlah nilai individu sifat dibahagikan dengan jumlah nombor nilai-nilai ini:

,

di mana x 1 ,x 2 , … ,x N ialah nilai individu bagi sifat pembolehubah (pilihan), dan N ialah bilangan unit populasi.

Purata wajaran aritmetik digunakan apabila data dipersembahkan dalam bentuk siri pengedaran atau pengelompokan. Ia dikira sebagai jumlah produk pilihan dan frekuensi sepadannya, dibahagikan dengan jumlah frekuensi semua pilihan:

di mana x i- maksudnya i–varian ke- bagi ciri; fi– kekerapan i-pilihan ke-.

Oleh itu, setiap nilai varian ditimbang dengan kekerapannya, itulah sebabnya frekuensi kadangkala dipanggil pemberat statistik.

Komen. Apabila ia datang kepada purata nilai aritmetik tanpa menyatakan jenisnya, min aritmetik mudah adalah tersirat.

Jadual 12

Penyelesaian. Untuk pengiraan, kami menggunakan formula purata wajaran aritmetik:

Oleh itu, secara purata, terdapat dua defendan bagi setiap kes jenayah.

Jika pengiraan nilai purata dilakukan mengikut data yang dikumpulkan dalam bentuk siri taburan selang, maka pertama anda perlu menentukan nilai median setiap selang x "i, kemudian hitung nilai purata menggunakan pemberat. formula min aritmetik, di mana x" i digantikan dengan x i.

Contoh. Data mengenai umur penjenayah yang disabitkan dengan kecurian dibentangkan dalam jadual:

Jadual 13

Tentukan purata umur penjenayah yang disabitkan kesalahan mencuri.

Penyelesaian. Bagi menentukan purata umur pesalah berdasarkan selang masa siri variasi anda mesti mencari nilai median selang dahulu. Oleh kerana kita diberi siri selang dengan buka dulu dan selang terakhir, maka nilai selang ini diambil sama dengan nilai selang tertutup bersebelahan. Dalam kes kami, nilai selang pertama dan terakhir ialah 10.

Sekarang kita dapati purata umur penjenayah menggunakan formula min aritmetik berwajaran:

Oleh itu, purata umur pesalah yang disabitkan kesalahan mencuri adalah lebih kurang 27 tahun.

Purata harmonik ringkas ialah salingan min aritmetik bagi nilai salingan ciri:

di mana 1/ x inilai timbal balik pilihan, dan N ialah bilangan unit populasi.

Contoh. Untuk menentukan purata beban kerja tahunan bagi hakim mahkamah daerah semasa mempertimbangkan kes jenayah, satu tinjauan telah dijalankan ke atas beban kerja 5 hakim mahkamah ini. Purata masa yang dihabiskan untuk satu kes jenayah bagi setiap hakim yang dikaji ternyata sama (dalam hari): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Cari purata kos untuk satu kes jenayah dan purata beban kerja tahunan hakim mahkamah daerah ini apabila mempertimbangkan kes jenayah.

Penyelesaian. Untuk menentukan purata masa yang dibelanjakan untuk satu kes jenayah, kami menggunakan formula mudah harmonik:

Untuk memudahkan pengiraan dalam contoh, mari kita ambil bilangan hari dalam setahun bersamaan dengan 365, termasuk hujung minggu (ini tidak menjejaskan kaedah pengiraan, dan apabila mengira penunjuk yang serupa dalam amalan, adalah perlu untuk menggantikan bilangan kerja hari dalam tahun tertentu dan bukannya 365 hari). Maka purata beban kerja tahunan bagi hakim mahkamah daerah ini apabila mempertimbangkan kes jenayah ialah: 365 (hari): 5.56 ≈ 65.6 (kes).

Jika kita menggunakan formula min aritmetik mudah untuk menentukan purata masa yang dibelanjakan untuk satu kes jenayah, kita akan mendapat:

365 (hari): 5.64 ≈ 64.7 (kes), i.e. beban kerja purata untuk hakim adalah kurang.

Mari kita semak kesahihan pendekatan ini. Untuk melakukan ini, kami menggunakan data tentang masa yang dibelanjakan untuk satu kes jenayah untuk setiap hakim dan mengira bilangan kes jenayah yang dipertimbangkan oleh setiap kes setiap tahun.

Kami mendapat sewajarnya:

365(hari): 6 ≈ 61 (kes), 365(hari): 5.6 ≈ 65.2 (kes), 365(hari): 6.3 ≈ 58 (kes),

365(hari): 4.9 ≈ 74.5 (kes), 365(hari) : 5.4 ≈ 68 (kes).

Kini kami mengira purata beban kerja tahunan untuk hakim mahkamah daerah ini apabila mempertimbangkan kes jenayah:

Itu. purata beban tahunan adalah sama seperti semasa menggunakan min harmonik.

Oleh itu, penggunaan min aritmetik dalam kes ini adalah haram.

Dalam kes di mana varian sesuatu ciri diketahui, nilai isipadunya (hasil daripada varian mengikut kekerapan), tetapi frekuensi itu sendiri tidak diketahui, formula purata wajaran harmonik digunakan:

,

di mana x i ialah nilai varian sifat, dan w i ialah nilai isipadu varian ( w i = x i f i).

Contoh. Data mengenai harga unit jenis barang yang sama yang dihasilkan oleh pelbagai institusi sistem penjara, dan jumlah pelaksanaannya diberikan dalam jadual 14.

Jadual 14

Cari purata harga jualan produk.

Penyelesaian. Apabila mengira harga purata, kita mesti menggunakan nisbah jumlah yang dijual kepada bilangan unit yang dijual. Kami tidak tahu jumlah unit yang dijual, tetapi kami tahu jumlah jualan barang. Oleh itu, untuk mencari purata harga barang yang dijual, kami menggunakan formula purata wajaran harmonik. Kita mendapatkan

Jika anda menggunakan formula min aritmetik di sini, anda boleh mendapatkan harga purata yang tidak realistik:

Purata geometri dikira dengan mengekstrak punca darjah N daripada hasil darab semua nilai pilihan ciri:

di mana x 1 ,x 2 , … ,x N ialah nilai individu bagi sifat pembolehubah (pilihan), dan

N ialah bilangan unit penduduk.

Purata jenis ini digunakan untuk mengira kadar pertumbuhan purata siri masa.

punca purata kuasa dua digunakan untuk mengira sisihan piawai, yang merupakan penunjuk variasi, dan akan dibincangkan di bawah.

Untuk menentukan struktur populasi, purata khas digunakan, yang termasuk median dan fesyen , atau apa yang dipanggil purata struktur. Jika min aritmetik dikira berdasarkan penggunaan semua varian nilai atribut, maka median dan mod mencirikan nilai varian yang menduduki kedudukan purata tertentu dalam siri berperingkat (tertib). Susunan unit populasi statistik boleh dilakukan dalam susunan menaik atau menurun bagi varian ciri yang dikaji.

Median (Saya) ialah nilai yang sepadan dengan varian di tengah-tengah siri kedudukan. Oleh itu, median ialah varian bagi siri kedudukan, di kedua-dua belah yang dalam siri ini sepatutnya ada nombor yang sama unit agregat.

Untuk mencari median, anda perlu menentukannya terlebih dahulu. nombor siri dalam baris berperingkat mengikut formula:

di mana N ialah isipadu siri (bilangan unit populasi).

Jika siri itu terdiri daripada bilangan ahli ganjil, maka median adalah sama dengan varian dengan nombor N Me . Jika siri itu terdiri daripada bilangan ahli genap, maka median ditakrifkan sebagai min aritmetik bagi dua pilihan bersebelahan yang terletak di tengah.

Contoh. Diberi kedudukan siri 1, 2, 3, 3, 6, 7, 9, 9, 10. Isipadu siri itu ialah N = 9, yang bermaksud N Me = (9 + 1) / 2 = 5. Oleh itu, Me = 6, iaitu . pilihan kelima. Jika satu baris diberi 1, 5, 7, 9, 11, 14, 15, 16, i.e. siri dengan bilangan ahli genap (N = 8), kemudian N Me = (8 + 1) / 2 = 4.5. Jadi median adalah sama dengan separuh jumlah pilihan keempat dan kelima, i.e. Saya = (9 + 11) / 2 = 10.

Dalam siri variasi diskret, median ditentukan oleh frekuensi terkumpul. Kekerapan varian, bermula dengan yang pertama, dijumlahkan sehingga nombor median melebihi. Nilai pilihan jumlah terakhir akan menjadi median.

Contoh. Cari median bilangan defendan bagi setiap kes jenayah menggunakan data dalam Jadual 12.

Penyelesaian. Dalam kes ini, isipadu siri variasi ialah N = 154, oleh itu, N Me = (154 + 1) / 2 = 77.5. Merumuskan frekuensi pilihan pertama dan kedua, kita dapat: 75 + 43 = 118, i.e. kita telah melepasi nombor median. Jadi Saya = 2.

Dalam siri variasi selang taburan, mula-mula nyatakan selang di mana median akan ditempatkan. Dia dipanggil median . Ini ialah selang pertama yang kekerapan terkumpulnya melebihi separuh isipadu siri variasi selang. Kemudian nilai berangka median ditentukan oleh formula:

di mana x Saya ialah had bawah selang median; i ialah nilai selang median; S Saya-1 ialah kekerapan kumulatif selang yang mendahului median; f Saya ialah kekerapan selang median.

Contoh. Cari umur median pesalah yang disabitkan dengan kecurian, berdasarkan statistik yang dibentangkan dalam Jadual 13.

Penyelesaian. Data statistik dibentangkan mengikut selang siri variasi, jadi kita tentukan dahulu selang median. Isipadu populasi N = 162, oleh itu, selang median ialah selang 18-28, kerana ini ialah selang pertama, kekerapan terkumpulnya (15 + 90 = 105) melebihi separuh isipadu (162: 2 = 81) siri variasi selang. Sekarang nilai berangka median ditentukan oleh formula di atas:

Oleh itu, separuh daripada mereka yang disabitkan kesalahan mencuri berumur di bawah 25 tahun.

Fesyen (Mo) namakan nilai atribut, yang paling kerap ditemui dalam unit populasi. Fesyen digunakan untuk mengenal pasti nilai sesuatu ciri yang ada paling meluas. Untuk siri diskret, mod akan menjadi varian dengan frekuensi tertinggi. Sebagai contoh, untuk siri diskret yang dibentangkan dalam Jadual 3 Mo= 1, kerana nilai pilihan ini sepadan dengan frekuensi tertinggi - 75. Untuk menentukan mod siri selang, mula-mula tentukan modal selang (selang yang mempunyai kekerapan tertinggi). Kemudian, dalam selang waktu ini, nilai ciri ditemui, yang boleh menjadi mod.

Nilainya didapati dengan formula:

di mana x Mo ialah had bawah selang modal; i ialah nilai selang modal; f Mo ialah kekerapan selang modal; f Mo-1 ialah kekerapan selang sebelum modal; f Mo+1 ialah kekerapan selang berikutan modal.

Contoh. Cari mod umur penjenayah yang disabitkan dengan kecurian, data yang ditunjukkan dalam jadual 13.

Penyelesaian. Kekerapan tertinggi sepadan dengan selang 18-28, oleh itu, mod mestilah dalam selang ini. Nilainya ditentukan oleh formula di atas:

Dengan cara ini, bilangan terbesar pesalah yang disabitkan kesalahan mencuri berumur 24 tahun.

Nilai purata memberikan ciri umum bagi keseluruhan fenomena yang dikaji. Walau bagaimanapun, dua populasi dengan nilai min yang sama mungkin berbeza dengan ketara antara satu sama lain dari segi tahap turun naik (variasi) dalam nilai sifat yang dikaji. Sebagai contoh, dalam satu mahkamah, syarat pemenjaraan berikut telah ditetapkan: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 tahun, dan dalam satu lagi - 5, 5, 6, 6, 7, 7 , 7, 8, 8, 8 tahun. Dalam kedua-dua kes, purata aritmetik ialah 6.7 tahun. Walau bagaimanapun, agregat ini berbeza dengan ketara antara satu sama lain dalam penyebaran nilai individu bagi tempoh pemenjaraan yang ditetapkan berbanding dengan nilai purata.

Dan untuk mahkamah pertama, di mana variasi ini agak besar, purata tempoh pemenjaraan tidak menggambarkan keseluruhan penduduk dengan baik. Oleh itu, jika nilai individu atribut berbeza sedikit antara satu sama lain, maka min aritmetik akan menjadi ciri yang agak menunjukkan ciri-ciri populasi ini. Jika tidak, min aritmetik akan menjadi ciri yang tidak boleh dipercayai bagi populasi ini dan penggunaannya dalam amalan tidak berkesan. Oleh itu, adalah perlu untuk mengambil kira variasi dalam nilai sifat yang dikaji.

Variasi- ini adalah perbezaan dalam nilai sifat dalam unit berbeza populasi tertentu dalam tempoh atau titik masa yang sama. Istilah "variasi" ialah asal latin- variatio, yang bermaksud perbezaan, perubahan, turun naik. Ia timbul akibat fakta bahawa nilai individu atribut terbentuk di bawah pengaruh gabungan pelbagai faktor (keadaan), yang digabungkan dengan cara yang berbeza dalam setiap kes berasingan. Untuk mengukur variasi sesuatu sifat, pelbagai mutlak dan prestasi relatif.

Penunjuk utama variasi termasuk yang berikut:

1) julat variasi;

2) sisihan linear purata;

3) penyebaran;

4) sisihan piawai;

5) pekali variasi.

Mari kita fikirkan secara ringkas setiap daripada mereka.

Variasi rentang R ialah penunjuk mutlak yang paling mudah diakses dari segi kemudahan pengiraan, yang ditakrifkan sebagai perbezaan antara nilai terbesar dan terkecil atribut untuk unit populasi ini:

Julat variasi (julat turun naik) - penunjuk penting turun naik tanda, tetapi ia memungkinkan untuk melihat hanya penyelewengan yang melampau, yang mengehadkan skop penggunaannya. Untuk pencirian yang lebih tepat bagi variasi sifat berdasarkan turun naiknya, penunjuk lain digunakan.

Sisihan linear purata ialah min aritmetik bagi nilai mutlak sisihan nilai individu atribut daripada purata dan ditentukan oleh formula:

1) untuk data tidak terkumpul

2) untuk siri variasi

Walau bagaimanapun, ukuran variasi yang paling banyak digunakan ialah penyebaran . Ia mencirikan ukuran penyebaran nilai sifat yang dikaji berbanding dengan nilai puratanya. Varians ditakrifkan sebagai purata sisihan kuasa dua.

varians mudah untuk data tidak terkumpul:

.

Varians berwajaran untuk siri variasi:

Komen. Dalam amalan, lebih baik menggunakan formula berikut untuk mengira varians:

Untuk varians mudah

.

Untuk varians berwajaran

Sisihan piawai ialah punca kuasa dua varians:

Sisihan piawai ialah ukuran kebolehpercayaan min. Lebih kecil sisihan piawai, lebih homogen populasi dan lebih baik min aritmetik mencerminkan keseluruhan populasi.

Ukuran serakan yang dipertimbangkan di atas (julat variasi, varians, sisihan piawai) ialah penunjuk mutlak, yang tidak selalu mungkin untuk menilai tahap turun naik sifat. Dalam beberapa masalah, adalah perlu untuk menggunakan indeks serakan relatif, salah satunya ialah pekali variasi.

Pekali variasi- dinyatakan sebagai peratusan nisbah sisihan piawai kepada min aritmetik:

Pekali variasi digunakan bukan sahaja untuk penilaian perbandingan variasi tanda yang berbeza atau sifat yang sama dalam populasi yang berbeza, tetapi juga untuk mencirikan kehomogenan populasi. Populasi statistik dianggap homogen secara kuantitatif jika pekali variasi tidak melebihi 33% (untuk taburan yang hampir dengan taburan normal).

Contoh. Terdapat data berikut mengenai syarat pemenjaraan 50 banduan yang dihantar menjalani hukuman yang dijatuhkan oleh mahkamah di institusi pembetulan sistem penjara: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1 , 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Membina siri pengedaran mengikut terma pemenjaraan.

2. Cari min, varians dan sisihan piawai.

3. Kira pekali variasi dan buat kesimpulan tentang kehomogenan atau heterogeniti populasi yang dikaji.

Penyelesaian. Untuk membina siri pengedaran diskret, adalah perlu untuk menentukan varian dan frekuensi. Pilihan dalam masalah ini ialah tempoh pemenjaraan, dan kekerapannya ialah bilangan pilihan individu. Setelah mengira frekuensi, kami mendapat yang berikut siri diskret pengedaran:

Cari min dan varians. Memandangkan data statistik diwakili oleh siri variasi diskret, kami akan menggunakan formula purata wajaran aritmetik dan varians untuk mengiranya. Kita mendapatkan:

= = 4,1;

= 5,21.

Sekarang kita mengira sisihan piawai:

Kami mencari pekali variasi:

Akibatnya, populasi statistik adalah heterogen secara kuantitatif.

min aritmetik mudah

Nilai purata

Nilai purata digunakan secara meluas dalam statistik.

nilai purata ialah penunjuk generalisasi di mana ungkapan tindakan ditemui syarat am, corak perkembangan fenomena yang dikaji.

Purata statistik dikira berdasarkan data jisim pemerhatian yang disusun secara statistik dengan betul (berterusan dan sampel). Walau bagaimanapun, purata statistik akan menjadi objektif dan tipikal jika ia dikira daripada data jisim untuk populasi homogen secara kualitatif ( fenomena jisim). Sebagai contoh, jika kita mengira purata gaji dalam syarikat saham bersama dan perusahaan milik negara, dan memanjangkan hasilnya kepada seluruh penduduk, maka purata adalah rekaan, kerana ia dikira pada populasi heterogen, dan purata sedemikian kehilangan semua maksudnya.

Dengan bantuan purata, terdapat, seolah-olah, pelicinan perbezaan dalam magnitud ciri yang timbul untuk satu sebab atau yang lain dalam unit pemerhatian individu.

Sebagai contoh, output purata penjual individu bergantung pada banyak faktor: kelayakan, tempoh perkhidmatan, umur, bentuk perkhidmatan, kesihatan, dan sebagainya. Keluaran purata mencerminkan ciri umum keseluruhan agregat.

Nilai purata diukur dalam unit yang sama seperti ciri itu sendiri.

Setiap nilai purata mencirikan populasi yang dikaji mengikut mana-mana satu atribut. Untuk mendapatkan gambaran lengkap dan menyeluruh tentang populasi yang dikaji dari segi beberapa ciri penting, adalah perlu untuk mempunyai sistem nilai purata yang boleh menggambarkan fenomena dari sudut yang berbeza.

wujud jenis lain sederhana:

    min aritmetik;

    purata harmonik;

    min geometri;

    punca purata kuasa dua;

    kubik purata.

Purata semua jenis yang disenaraikan di atas, seterusnya, dibahagikan kepada mudah (tidak berwajaran) dan berwajaran.

Pertimbangkan jenis purata yang digunakan dalam statistik.

Purata aritmetik mudah (tidak berwajaran) adalah sama dengan jumlah nilai individu ciri, dibahagikan dengan bilangan nilai ini.

Nilai berasingan bagi sesuatu ciri dipanggil varian dan dilambangkan dengan х i (
); bilangan unit populasi dilambangkan dengan n, nilai purata ciri - oleh . Oleh itu, min aritmetik mudah ialah:

atau

Contoh 1 Jadual 1

Data pengeluaran produk A oleh pekerja setiap syif

AT contoh ini ciri berubah ialah keluaran produk setiap syif.

Nilai berangka atribut (16, 17, dsb.) dipanggil pilihan. Mari kita tentukan purata keluaran produk oleh pekerja kumpulan ini:

PCS.

Purata aritmetik mudah digunakan dalam kes di mana terdapat nilai individu bagi sesuatu ciri, i.e. data tidak dikumpulkan. Jika data dipersembahkan dalam bentuk siri pengedaran atau pengelompokan, maka purata dikira secara berbeza.

Purata wajaran aritmetik

Purata wajaran aritmetik adalah sama dengan hasil tambah setiap nilai individu atribut (pilihan) dengan frekuensi yang sepadan, dibahagikan dengan jumlah semua frekuensi.

Bilangan nilai ciri yang sama dalam siri pengedaran dipanggil kekerapan atau berat dan dilambangkan dengan f i .

Selaras dengan ini, purata wajaran aritmetik kelihatan seperti ini:

atau

Ia boleh dilihat dari formula bahawa purata bergantung bukan sahaja pada nilai atribut, tetapi juga pada frekuensinya, i.e. mengenai komposisi penduduk, pada strukturnya.

Contoh 2 jadual 2

Data gaji pekerja

Menurut data siri pengedaran diskret, dapat dilihat bahawa nilai atribut (pilihan) yang sama diulang beberapa kali. Jadi, varian x 1 berlaku dalam agregat 2 kali, dan varian x 2 - 6 kali, dsb.

Kira purata gaji setiap pekerja:

Tabung upah bagi setiap kumpulan pekerja adalah sama dengan produk pilihan frekuensi (
), dan jumlah produk ini memberikan jumlah dana gaji semua pekerja (
).

Jika pengiraan dilakukan menggunakan formula purata aritmetik mudah, purata pendapatan ialah 3,000 rubel. (). Membandingkan hasil yang diperoleh dengan data awal, adalah jelas bahawa gaji purata harus jauh lebih tinggi (lebih separuh daripada pekerja menerima gaji melebihi 3,000 rubel). Oleh itu, pengiraan min aritmetik mudah dalam kes sedemikian akan menjadi salah.

Bahan statistik hasil pemprosesan boleh dipersembahkan bukan sahaja dalam bentuk siri pengedaran diskret, tetapi juga dalam bentuk siri variasi selang dengan selang tertutup atau terbuka.

Pertimbangkan pengiraan min aritmetik untuk siri tersebut.

Puratanya ialah:

Min

Min - ciri berangka set nombor atau fungsi; - beberapa nombor disertakan di antara nilai terkecil dan terbesar.

  • 1 Maklumat asas
  • 2 Hierarki cara dalam matematik
  • 3 Dalam teori dan statistik kebarangkalian
  • 4 Lihat juga
  • 5 Nota

Maklumat asas

Titik permulaan untuk pembentukan teori purata ialah kajian perkadaran oleh sekolah Pythagoras. Pada masa yang sama, tiada perbezaan yang ketat dibuat antara konsep purata dan perkadaran. Dorongan yang ketara kepada perkembangan teori perkadaran dari sudut aritmetik diberikan oleh ahli matematik Yunani - Nicomachus of Geras (akhir I - awal abad II M) dan Pappus dari Alexandria (abad III AD). Peringkat pertama dalam pembangunan konsep purata ialah peringkat apabila purata mula dianggap sebagai ahli pusat perkadaran berterusan. Tetapi konsep min sebagai nilai pusat janjang tidak memungkinkan untuk memperoleh konsep min berkenaan dengan urutan n sebutan, tanpa mengira susunan di mana ia mengikut satu sama lain. Untuk tujuan ini adalah perlu untuk menggunakan generalisasi purata purata. Peringkat seterusnya ialah peralihan daripada perkadaran berterusan kepada janjang - aritmetik, geometri dan harmonik.

Dalam sejarah statistik, buat pertama kalinya, penggunaan purata yang meluas dikaitkan dengan nama saintis Inggeris W. Petty. W. Petty adalah salah seorang yang pertama yang cuba memberikan makna statistik kepada nilai purata, mengaitkannya dengan kategori ekonomi. Tetapi Petty tidak menghasilkan penerangan tentang konsep nilai purata, peruntukannya. A. Quetelet dianggap sebagai pengasas teori purata. Beliau adalah salah seorang yang pertama secara konsisten membangunkan teori purata, cuba membawa asas matematik untuknya. A. Quetelet memilih dua jenis purata - purata sebenar dan purata aritmetik. Purata dengan betul mewakili sesuatu, nombor, benar-benar wujud. Sebenarnya purata atau purata statistik harus diperoleh daripada fenomena kualiti yang sama, sama dalam kepentingan dalaman mereka. Purata aritmetik ialah nombor yang memberikan idea yang paling dekat dengan banyak nombor, berbeza, walaupun homogen.

Setiap jenis purata boleh sama ada purata mudah atau purata wajaran. Ketepatan pilihan bentuk purata mengikut sifat material objek kajian. Rumus purata mudah digunakan jika nilai individu bagi ciri purata tidak berulang. Apabila masuk penyelidikan praktikal nilai individu bagi sifat yang dikaji berlaku beberapa kali dalam unit populasi yang dikaji, maka kekerapan pengulangan nilai sifat individu terdapat dalam formula pengiraan purata kuasa. Dalam kes ini, ia dipanggil formula purata wajaran.

Yayasan Wikimedia. 2010.

Topik 5. Purata sebagai penunjuk statistik

Konsep purata. Skop nilai purata dalam kajian statistik

Nilai purata digunakan pada peringkat pemprosesan dan meringkaskan data statistik utama yang diperolehi. Keperluan untuk menentukan nilai purata adalah disebabkan oleh fakta bahawa untuk unit yang berbeza dari populasi yang dikaji, nilai individu sifat yang sama, sebagai peraturan, tidak sama.

Nilai purata memanggil penunjuk yang mencirikan nilai umum ciri atau kumpulan ciri dalam populasi kajian.

Jika kita mengkaji populasi dengan kualitatif ciri homogen, maka nilai purata muncul di sini sebagai purata biasa. Sebagai contoh, bagi kumpulan pekerja dalam industri tertentu dengan tahap pendapatan tetap, purata perbelanjaan biasa untuk keperluan asas ditentukan, i.e. purata tipikal menyamaratakan nilai kualitatif homogen sifat dalam populasi tertentu, yang merupakan bahagian perbelanjaan pekerja dalam kumpulan ini ke atas barangan keperluan.

Dalam kajian populasi dengan ciri-ciri heterogen secara kualitatif, penunjuk purata atipikal mungkin diketengahkan. Ini, sebagai contoh, adalah penunjuk purata pendapatan negara per kapita yang dihasilkan (pelbagai kumpulan umur), purata hasil tanaman bijirin di seluruh Rusia (kawasan zon iklim berbeza dan tanaman bijirin berbeza), kadar kelahiran purata penduduk di semua wilayah negara, suhu purata melebihi tempoh tertentu dan lain-lain. Di sini, nilai purata menyamaratakan nilai heterogen secara kualitatif bagi ciri atau agregat spatial sistemik (komuniti antarabangsa, benua, negeri, wilayah, daerah, dll.) atau agregat dinamik yang dilanjutkan dalam masa (abad, dekad, tahun, musim, dsb. ). Purata ini dipanggil purata sistem.

Oleh itu, makna nilai purata terdiri daripada fungsi generalisasi mereka. Nilai purata menggantikan sejumlah besar nilai sifat individu, mendedahkan sifat umum, wujud dalam semua unit populasi. Ini, seterusnya, membolehkan anda mengelakkan punca rawak dan mengenal pasti corak umum disebabkan oleh sebab biasa.

Jenis nilai purata dan kaedah untuk pengiraannya

Pada peringkat pemprosesan statistik, pelbagai tugas penyelidikan boleh ditetapkan, untuk penyelesaiannya perlu memilih purata yang sesuai. Dalam kes ini, perlu dipandu oleh peraturan berikut: nilai-nilai yang mewakili pengangka dan penyebut purata mestilah berkaitan secara logik antara satu sama lain.

    purata kuasa;

    purata struktur.

Mari kita perkenalkan notasi berikut:

Nilai yang dikira purata;

Purata, di mana garis di atas menunjukkan bahawa purata nilai individu berlaku;

Kekerapan (kebolehulangan nilai sifat individu).

Pelbagai cara diperoleh daripada formula min kuasa am:

(5.1)

untuk k = 1 - min aritmetik; k = -1 - min harmonik; k = 0 - min geometri; k = -2 - punca min kuasa dua.

Purata sama ada mudah atau wajaran. purata wajaran dipanggil kuantiti yang mengambil kira bahawa beberapa varian nilai atribut mungkin mempunyai nombor yang berbeza, dan oleh itu setiap varian perlu didarab dengan nombor ini. Dalam erti kata lain, "berat" ialah bilangan unit populasi dalam kumpulan yang berbeza, i.e. setiap pilihan "ditimbang" mengikut kekerapannya. Frekuensi f dipanggil berat statistik atau purata berat.

Min aritmetik- jenis medium yang paling biasa. Ia digunakan apabila pengiraan dijalankan pada data statistik tidak terkumpul, di mana anda ingin mendapatkan summan purata. Min aritmetik ialah nilai purata bagi sesuatu ciri, apabila menerimanya, jumlah isipadu ciri dalam populasi kekal tidak berubah.

Rumus min aritmetik (mudah) mempunyai bentuk

di mana n ialah saiz populasi.

Sebagai contoh, purata gaji pekerja sesebuah perusahaan dikira sebagai purata aritmetik:


Penunjuk penentu di sini ialah gaji setiap pekerja dan bilangan pekerja perusahaan. Apabila mengira purata, jumlah gaji tetap sama, tetapi diagihkan, seolah-olah, sama rata di kalangan semua pekerja. Sebagai contoh, adalah perlu untuk mengira purata gaji pekerja sebuah syarikat kecil di mana 8 orang bekerja:

Apabila mengira purata, nilai individu bagi atribut yang dipuratakan boleh diulang, jadi purata dikira menggunakan data terkumpul. Dalam kes ini, kita bercakap tentang menggunakan aritmetik min wajaran, yang kelihatan seperti

(5.3)

Jadi, kita perlu mengira purata harga saham syarikat saham bersama di bursa saham. Adalah diketahui bahawa urus niaga telah dijalankan dalam tempoh 5 hari (5 urus niaga), jumlah saham yang dijual pada kadar jualan diagihkan seperti berikut:

    1 - 800 ac. - 1010 rubel

    2 - 650 ac. - 990 gosok.

    3 - 700 ak. - 1015 rubel.

    4 - 550 ac. - 900 gosok.

    5 - 850 ak. - 1150 rubel.

Nisbah awal untuk menentukan harga saham purata ialah nisbah jumlah urus niaga (TCA) kepada bilangan saham yang dijual (KPA):

OSS = 1010 800+990 650+1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

Dalam kes ini, harga saham purata adalah sama dengan

Adalah perlu untuk mengetahui sifat-sifat min aritmetik, yang sangat penting untuk kegunaannya dan untuk pengiraannya. Terdapat tiga sifat utama yang kebanyakannya membawa kepada penggunaan min aritmetik secara meluas dalam pengiraan statistik dan ekonomi.

Harta satu (sifar): jumlah sisihan positif nilai individu sifat daripada nilai min adalah sama dengan jumlah sisihan negatif. Ini adalah sifat yang sangat penting, kerana ia menunjukkan bahawa sebarang penyelewengan (kedua-duanya dengan + dan dengan -) disebabkan sebab rawak akan dibatalkan bersama.

Bukti:

Sifat kedua (minimum): jumlah sisihan kuasa dua nilai individu atribut daripada min aritmetik adalah kurang daripada mana-mana nombor lain (a), i.e. ialah nombor minimum.

Bukti.

Susun jumlah sisihan kuasa dua daripada pembolehubah a:

(5.4)

Untuk mencari ekstrem fungsi ini, adalah perlu untuk menyamakan terbitannya berkenaan dengan a kepada sifar:

Dari sini kita dapat:

(5.5)

Oleh itu, keterlaluan jumlah sisihan kuasa dua dicapai pada . Ekstrem ini adalah minimum, kerana fungsi tidak boleh mempunyai maksimum.

Sifat ketiga: min aritmetik pemalar adalah sama dengan pemalar ini: pada a = const.

Sebagai tambahan kepada tiga sifat terpenting bagi min aritmetik ini, terdapat apa yang dipanggil sifat reka bentuk, yang secara beransur-ansur kehilangan kepentingannya disebabkan oleh penggunaan komputer elektronik:

    jika nilai individu atribut setiap unit didarab atau dibahagikan dengan nombor tetap, maka min aritmetik akan meningkat atau berkurangan dengan jumlah yang sama;

    min aritmetik tidak akan berubah jika berat (kekerapan) setiap nilai ciri dibahagikan dengan nombor tetap;

    jika nilai individu atribut setiap unit dikurangkan atau ditambah dengan jumlah yang sama, maka min aritmetik akan berkurangan atau meningkat dengan jumlah yang sama.

Purata harmonik. Purata ini dipanggil purata aritmetik salingan, kerana nilai ini digunakan apabila k = -1.

Min harmonik mudah digunakan apabila berat nilai ciri adalah sama. Formulanya boleh diperoleh daripada formula asas dengan menggantikan k = -1:

Sebagai contoh, kita perlu mengira kelajuan purata dua kereta yang telah melalui laluan yang sama, tetapi pada kelajuan yang berbeza: yang pertama pada 100 km/j, yang kedua pada 90 km/j. Menggunakan kaedah min harmonik, kami mengira kelajuan purata:

Dalam amalan statistik, wajaran harmonik lebih kerap digunakan, formula yang mempunyai bentuk

Formula ini digunakan dalam kes di mana pemberat (atau isipadu fenomena) untuk setiap atribut tidak sama. Dalam nisbah asal, pengangka diketahui mengira purata, tetapi penyebutnya tidak diketahui.

Bagaimana untuk mengira purata nombor dalam Excel

Cari min nombor aritmetik dalam Excel, anda boleh menggunakan .

Sintaks PURATA

=PURATA(nombor1,[nombor2],…) - Versi Rusia

Hujah AVERAGE

  • nombor 1- nombor pertama atau julat nombor, untuk mengira min aritmetik;
  • nombor2(Pilihan) – nombor kedua atau julat nombor untuk mengira min aritmetik. Jumlah maksimum hujah fungsi - 255.

Untuk mengira, lakukan langkah berikut:

  • Pilih mana-mana sel;
  • Tulis formula di dalamnya =PURATA(
  • Pilih julat sel yang anda ingin buat pengiraan;
  • Tekan kekunci "Enter" pada papan kekunci

Fungsi ini akan mengira nilai purata dalam julat yang ditentukan antara sel yang mengandungi nombor.

Bagaimana untuk mencari nilai purata teks yang diberikan

Jika terdapat baris atau teks kosong dalam julat data, maka fungsi itu menganggapnya sebagai "sifar". Jika data mengandungi ungkapan boolean FALSE atau TRUE, maka fungsi tersebut menganggap FALSE sebagai “sifar” dan TRUE sebagai “1”.

Bagaimana untuk mencari min aritmetik mengikut keadaan

Fungsi ini digunakan untuk mengira purata mengikut keadaan atau kriteria. Sebagai contoh, katakan kami mempunyai data jualan produk:

Tugas kami ialah mengira purata jualan pen. Untuk melakukan ini, kami akan mengambil langkah berikut:

  • Dalam sel A13 tulis nama produk "Pens";
  • Dalam sel B13 mari kita masukkan formula:

=PURATA(A2:A10,A13,B2:B10)

Julat sel " A2:A10” menunjuk pada senarai produk yang akan kami cari perkataan “Pens”. Hujah A13 ini ialah pautan ke sel dengan teks yang akan kami cari di antara keseluruhan senarai produk. Julat sel " B2:B10” ialah julat dengan data jualan produk, antaranya fungsi akan mencari “Pen” dan mengira nilai purata.


Dalam proses pembelajaran matematik, pelajar membiasakan diri dengan konsep min aritmetik. Pada masa hadapan, dalam statistik dan beberapa sains lain, pelajar berhadapan dengan pengiraan orang lain.Apakah yang boleh mereka dan bagaimana mereka berbeza antara satu sama lain?

makna dan perbezaan

Tidak selalu penunjuk yang tepat memberikan pemahaman tentang keadaan. Untuk menilai situasi ini atau itu, kadangkala perlu untuk menganalisis jumlah yang besar digit. Dan kemudian rata-rata datang untuk menyelamatkan. Mereka membolehkan anda menilai keadaan secara umum.

Sejak zaman persekolahan, ramai orang dewasa mengingati kewujudan min aritmetik. Ia sangat mudah untuk dikira - jumlah jujukan n sebutan boleh dibahagi dengan n. Iaitu, jika anda perlu mengira min aritmetik dalam urutan nilai 27, 22, 34 dan 37, maka anda perlu menyelesaikan ungkapan (27 + 22 + 34 + 37) / 4, kerana 4 nilai digunakan dalam pengiraan. Dalam kes ini, nilai yang dikehendaki akan sama dengan 30.

Selalunya dalam kursus sekolah mengkaji min geometri. Pengiraan nilai yang diberi adalah berdasarkan mengekstrak punca darjah ke-n daripada hasil darab sebutan-n. Jika kita mengambil nombor yang sama: 27, 22, 34 dan 37, maka hasil pengiraan akan menjadi 29.4.

min harmonik dalam sekolah pendidikan am selalunya bukan subjek kajian. Walau bagaimanapun, ia digunakan agak kerap. Nilai ini ialah salingan bagi min aritmetik dan dikira sebagai hasil bagi n - bilangan nilai dan hasil tambah 1/a 1 +1/a 2 +...+1/a n . Jika kita sekali lagi mengambil yang sama untuk pengiraan, maka harmonik akan menjadi 29.6.

Purata Wajaran: Ciri-ciri

Walau bagaimanapun, semua nilai di atas mungkin tidak digunakan di mana-mana. Sebagai contoh, dalam statistik, apabila mengira beberapa peranan penting mempunyai "berat" bagi setiap nombor yang digunakan dalam pengiraan. Hasilnya lebih mendedahkan dan betul kerana mereka mengambil kira lebih banyak maklumat. Kumpulan kuantiti ini ialah nama yang selalu digunakan "purata wajaran". Mereka tidak lulus di sekolah, jadi ia patut dibincangkan dengan lebih terperinci.

Pertama sekali, perlu dijelaskan apa yang dimaksudkan dengan "berat" nilai tertentu. Cara paling mudah untuk menerangkan perkara ini ialah contoh khusus. Suhu badan setiap pesakit diukur dua kali sehari di hospital. Daripada 100 pesakit di jabatan berbeza hospital, 44 akan mempunyai suhu normal - 36.6 darjah. 30 lagi akan mempunyai nilai yang meningkat - 37.2, 14 - 38, 7 - 38.5, 3 - 39, dan baki dua - 40. Dan jika kita mengambil min aritmetik, maka nilai ini secara umum untuk hospital akan melebihi 38 darjah ! Tetapi hampir separuh daripada pesakit telah benar-benar Dan di sini adalah lebih tepat untuk menggunakan purata wajaran, dan "berat" setiap nilai akan menjadi bilangan orang. Dalam kes ini, hasil pengiraan akan menjadi 37.25 darjah. Perbezaannya jelas.

Dalam kes pengiraan purata wajaran, "berat" boleh diambil sebagai bilangan penghantaran, bilangan orang yang bekerja pada hari tertentu, secara umum, apa-apa sahaja yang boleh diukur dan menjejaskan keputusan akhir.

Varieti

Purata wajaran sepadan dengan purata aritmetik yang dibincangkan pada permulaan artikel. Walau bagaimanapun, nilai pertama, seperti yang telah disebutkan, juga mengambil kira berat setiap nombor yang digunakan dalam pengiraan. Selain itu, terdapat juga nilai geometri dan harmonik berwajaran.

Terdapat satu lagi variasi menarik yang digunakan dalam siri nombor. Ini ialah purata bergerak wajaran. Atas dasar itu trend dikira. Sebagai tambahan kepada nilai itu sendiri dan beratnya, periodicity juga digunakan di sana. Dan apabila mengira nilai purata pada satu ketika, nilai untuk tempoh masa sebelumnya juga diambil kira.

Mengira semua nilai ini tidak begitu sukar, tetapi dalam amalan, hanya purata wajaran biasa yang biasa digunakan.

Kaedah pengiraan

Dalam era pengkomputeran, tidak perlu mengira purata wajaran secara manual. Walau bagaimanapun, adalah berguna untuk mengetahui formula pengiraan supaya anda boleh menyemak dan, jika perlu, membetulkan keputusan yang diperolehi.

Ia akan menjadi paling mudah untuk mempertimbangkan pengiraan pada contoh tertentu.

Adalah perlu untuk mengetahui berapa gaji purata di perusahaan ini, dengan mengambil kira bilangan pekerja yang menerima gaji tertentu.

Jadi, pengiraan purata wajaran dijalankan menggunakan formula berikut:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Sebagai contoh, pengiraannya ialah:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33.48

Jelas sekali, tiada kesukaran khusus dalam mengira purata wajaran secara manual. Formula untuk mengira nilai ini dalam salah satu aplikasi paling popular dengan formula - Excel - kelihatan seperti fungsi SUMPRODUCT (siri nombor; siri pemberat) / SUM (siri pemberat).

nilai purata- ini ialah penunjuk generalisasi yang mencirikan populasi homogen secara kualitatif mengikut atribut kuantitatif tertentu. Sebagai contoh, purata umur orang yang disabitkan kesalahan mencuri.

Dalam statistik kehakiman, purata digunakan untuk mencirikan:

Purata syarat pertimbangan bagi kes kategori ini;

Tuntutan saiz sederhana;

Purata bilangan defendan setiap kes;

Purata jumlah kerosakan;

Purata beban kerja hakim, dsb.

Nilai purata sentiasa dinamakan dan mempunyai dimensi yang sama dengan atribut unit berasingan populasi. Setiap nilai purata mencirikan populasi yang dikaji mengikut mana-mana satu atribut yang berbeza-beza, oleh itu, di sebalik sebarang purata, terdapat satu siri taburan unit populasi ini mengikut atribut yang dikaji. Pilihan jenis purata ditentukan oleh kandungan penunjuk dan data awal untuk mengira purata.

Semua jenis purata yang digunakan dalam kajian statistik terbahagi kepada dua kategori:

1) purata kuasa;

2) purata struktur.

Kategori purata pertama termasuk: min aritmetik, min harmonik, min geometri dan punca purata kuasa dua . Kategori kedua ialah fesyen dan median. Selain itu, setiap jenis purata kuasa yang disenaraikan boleh mempunyai dua bentuk: ringkas dan berwajaran . Bentuk ringkas min digunakan untuk mendapatkan min bagi sifat yang dikaji apabila pengiraan adalah berdasarkan statistik tidak terkumpul, atau apabila setiap varian berlaku sekali sahaja dalam populasi. Purata wajaran dipanggil nilai yang mengambil kira bahawa pilihan untuk nilai ciri boleh mempunyai nombor yang berbeza, dan oleh itu setiap pilihan perlu didarab dengan kekerapan yang sepadan. Dalam erti kata lain, setiap pilihan "ditimbang" mengikut kekerapannya. Kekerapan dipanggil berat statistik.

min aritmetik mudah- jenis medium yang paling biasa. Ia sama dengan jumlah nilai ciri individu dibahagikan dengan jumlah bilangan nilai ini:

di mana x 1 ,x 2 , … ,x N- nilai individu atribut pembolehubah (pilihan), dan N - bilangan unit populasi.

Purata wajaran aritmetik digunakan apabila data dipersembahkan dalam bentuk siri pengedaran atau pengelompokan. Ia dikira sebagai jumlah produk pilihan dan frekuensi sepadannya, dibahagikan dengan jumlah frekuensi semua pilihan:

di mana x i- maksudnya i-varian ke- bagi ciri; fi- kekerapan i pilihan ke.

Oleh itu, setiap nilai varian ditimbang dengan kekerapannya, itulah sebabnya frekuensi kadangkala dipanggil pemberat statistik.


Komen. Apabila ia datang kepada min aritmetik tanpa menyatakan jenisnya, min aritmetik mudah dimaksudkan.

Jadual 12

Penyelesaian. Untuk pengiraan, kami menggunakan formula purata wajaran aritmetik:

Oleh itu, secara purata, terdapat dua defendan bagi setiap kes jenayah.

Jika pengiraan nilai purata dilakukan mengikut data yang dikumpulkan dalam bentuk siri taburan selang, maka pertama anda perlu menentukan nilai median setiap selang x "i, kemudian hitung nilai purata menggunakan pemberat. formula min aritmetik, di mana x" i digantikan dengan x i.

Contoh. Data mengenai umur penjenayah yang disabitkan dengan kecurian dibentangkan dalam jadual:

Jadual 13

Tentukan purata umur penjenayah yang disabitkan kesalahan mencuri.

Penyelesaian. Untuk menentukan purata umur penjenayah berdasarkan siri variasi selang, anda mesti mencari nilai median selang dahulu. Oleh kerana siri selang dengan selang pertama dan terakhir terbuka diberikan, nilai selang ini diambil sama dengan nilai selang tertutup bersebelahan. Dalam kes kami, nilai selang pertama dan terakhir ialah 10.

Sekarang kita dapati purata umur penjenayah menggunakan formula min aritmetik berwajaran:

Oleh itu, purata umur pesalah yang disabitkan kesalahan mencuri adalah lebih kurang 27 tahun.

Purata harmonik ringkas ialah salingan min aritmetik bagi nilai salingan ciri:

di mana 1/ x i ialah timbal balik pilihan, dan N ialah bilangan unit populasi.

Contoh. Untuk menentukan purata beban kerja tahunan bagi hakim mahkamah daerah semasa mempertimbangkan kes jenayah, satu tinjauan telah dijalankan ke atas beban kerja 5 hakim mahkamah ini. Purata masa yang dihabiskan untuk satu kes jenayah bagi setiap hakim yang dikaji ternyata sama (dalam hari): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Cari purata kos untuk satu kes jenayah dan purata beban kerja tahunan hakim mahkamah daerah ini apabila mempertimbangkan kes jenayah.

Penyelesaian. Untuk menentukan purata masa yang dibelanjakan untuk satu kes jenayah, kami menggunakan formula mudah harmonik:

Untuk memudahkan pengiraan dalam contoh, mari kita ambil bilangan hari dalam setahun bersamaan dengan 365, termasuk hujung minggu (ini tidak menjejaskan kaedah pengiraan, dan apabila mengira penunjuk yang serupa dalam amalan, adalah perlu untuk menggantikan bilangan kerja hari dalam tahun tertentu dan bukannya 365 hari). Maka purata beban kerja tahunan bagi hakim mahkamah daerah ini apabila mempertimbangkan kes jenayah ialah: 365 (hari): 5.56 ≈ 65.6 (kes).

Jika kita menggunakan formula min aritmetik mudah untuk menentukan purata masa yang dibelanjakan untuk satu kes jenayah, kita akan mendapat:

365 (hari): 5.64 ≈ 64.7 (kes), i.e. beban kerja purata untuk hakim adalah kurang.

Mari kita semak kesahihan pendekatan ini. Untuk melakukan ini, kami menggunakan data tentang masa yang dibelanjakan untuk satu kes jenayah untuk setiap hakim dan mengira bilangan kes jenayah yang dipertimbangkan oleh setiap kes setiap tahun.

Kami mendapat sewajarnya:

365(hari): 6 ≈ 61 (kes), 365(hari): 5.6 ≈ 65.2 (kes), 365(hari): 6.3 ≈ 58 (kes),

365(hari): 4.9 ≈ 74.5 (kes), 365(hari) : 5.4 ≈ 68 (kes).

Kini kami mengira purata beban kerja tahunan untuk hakim mahkamah daerah ini apabila mempertimbangkan kes jenayah:

Itu. purata beban tahunan adalah sama seperti semasa menggunakan min harmonik.

Oleh itu, penggunaan min aritmetik dalam kes ini adalah haram.

Dalam kes di mana varian sesuatu ciri diketahui, nilai isipadunya (hasil daripada varian mengikut kekerapan), tetapi frekuensi itu sendiri tidak diketahui, formula purata wajaran harmonik digunakan:

,

di mana x i ialah nilai pilihan ciri, dan w i ialah nilai isipadu bagi pilihan ( w i = x i f i).

Contoh. Data mengenai harga unit jenis barang yang sama yang dihasilkan oleh pelbagai institusi sistem penjara, dan jumlah pelaksanaannya diberikan dalam jadual 14.

Jadual 14

Cari purata harga jualan produk.

Penyelesaian. Apabila mengira harga purata, kita mesti menggunakan nisbah jumlah yang dijual kepada bilangan unit yang dijual. Kami tidak tahu jumlah unit yang dijual, tetapi kami tahu jumlah jualan barang. Oleh itu, untuk mencari purata harga barang yang dijual, kami menggunakan formula purata wajaran harmonik. Kita mendapatkan

Jika anda menggunakan formula min aritmetik di sini, anda boleh mendapatkan harga purata yang tidak realistik:

Purata geometri dikira dengan mengekstrak punca darjah N daripada hasil darab semua nilai pilihan ciri:

,

di mana x 1 ,x 2 , … ,x N- nilai individu sifat pembolehubah (pilihan), dan

N- bilangan unit penduduk.

Purata jenis ini digunakan untuk mengira kadar pertumbuhan purata siri masa.

punca purata kuasa dua digunakan untuk mengira sisihan piawai, yang merupakan penunjuk variasi, dan akan dibincangkan di bawah.

Untuk menentukan struktur populasi, purata khas digunakan, yang termasuk median dan fesyen , atau apa yang dipanggil purata struktur. Jika min aritmetik dikira berdasarkan penggunaan semua varian nilai atribut, maka median dan mod mencirikan nilai varian yang menduduki kedudukan purata tertentu dalam siri berperingkat (tertib). Susunan unit populasi statistik boleh dilakukan dalam susunan menaik atau menurun bagi varian ciri yang dikaji.

Median (Saya) ialah nilai yang sepadan dengan varian di tengah-tengah siri kedudukan. Oleh itu, median ialah varian bagi siri kedudukan, di kedua-dua belah siri ini harus ada bilangan unit populasi yang sama.

Untuk mencari median, anda perlu terlebih dahulu menentukan nombor sirinya dalam siri kedudukan menggunakan formula:

di mana N ialah isipadu siri (bilangan unit populasi).

Jika siri itu terdiri daripada bilangan ahli ganjil, maka median adalah sama dengan varian dengan nombor N Me . Jika siri itu terdiri daripada bilangan ahli genap, maka median ditakrifkan sebagai min aritmetik bagi dua pilihan bersebelahan yang terletak di tengah.

Contoh. Diberi kedudukan siri 1, 2, 3, 3, 6, 7, 9, 9, 10. Isipadu siri itu ialah N = 9, yang bermaksud N Me = (9 + 1) / 2 = 5. Oleh itu, Me = 6, iaitu . pilihan kelima. Jika satu baris diberi 1, 5, 7, 9, 11, 14, 15, 16, i.e. siri dengan bilangan ahli genap (N = 8), kemudian N Me = (8 + 1) / 2 = 4.5. Jadi median adalah sama dengan separuh jumlah pilihan keempat dan kelima, i.e. Saya = (9 + 11) / 2 = 10.

Dalam siri variasi diskret, median ditentukan oleh frekuensi terkumpul. Kekerapan varian, bermula dengan yang pertama, dijumlahkan sehingga nombor median melebihi. Nilai pilihan jumlah terakhir akan menjadi median.

Contoh. Cari median bilangan defendan bagi setiap kes jenayah menggunakan data dalam Jadual 12.

Penyelesaian. Dalam kes ini, isipadu siri variasi ialah N = 154, oleh itu, N Me = (154 + 1) / 2 = 77.5. Merumuskan frekuensi pilihan pertama dan kedua, kita dapat: 75 + 43 = 118, i.e. kita telah melepasi nombor median. Jadi Saya = 2.

Dalam siri variasi selang taburan, mula-mula nyatakan selang di mana median akan ditempatkan. Dia dipanggil median . Ini ialah selang pertama yang kekerapan terkumpulnya melebihi separuh isipadu siri variasi selang. Kemudian nilai berangka median ditentukan oleh formula:

di mana x Saya- had bawah selang median; i - nilai selang median; S Saya-1- kekerapan terkumpul selang yang mendahului median; f Saya- kekerapan selang median.

Contoh. Cari umur median pesalah yang disabitkan dengan kecurian, berdasarkan statistik yang dibentangkan dalam Jadual 13.

Penyelesaian. Data statistik diwakili oleh siri variasi selang, yang bermaksud bahawa kita mula-mula menentukan selang median. Isipadu populasi N = 162, oleh itu, selang median ialah selang 18-28, kerana ini ialah selang pertama, kekerapan terkumpulnya (15 + 90 = 105) melebihi separuh isipadu (162: 2 = 81) siri variasi selang. Sekarang nilai berangka median ditentukan oleh formula di atas:

Oleh itu, separuh daripada mereka yang disabitkan kesalahan mencuri berumur di bawah 25 tahun.

Fesyen (Mo) namakan nilai atribut, yang paling kerap ditemui dalam unit populasi. Fesyen digunakan untuk mengenal pasti nilai sifat yang mempunyai taburan terbesar. Untuk siri diskret, mod akan menjadi varian dengan frekuensi tertinggi. Sebagai contoh, untuk siri diskret yang dibentangkan dalam Jadual 3 Mo= 1, kerana nilai pilihan ini sepadan dengan frekuensi tertinggi - 75. Untuk menentukan mod siri selang, mula-mula tentukan modal selang (selang yang mempunyai frekuensi tertinggi). Kemudian, dalam selang waktu ini, nilai ciri ditemui, yang boleh menjadi mod.

Nilainya didapati dengan formula:

di mana x Mo- had bawah selang modal; i - nilai selang modal; f Mo- kekerapan selang modal; f Mo-1- kekerapan selang sebelum modal; f Mo+1- kekerapan selang mengikut modal.

Contoh. Cari mod umur penjenayah yang disabitkan dengan kecurian, data yang ditunjukkan dalam jadual 13.

Penyelesaian. Kekerapan tertinggi sepadan dengan selang 18-28, oleh itu, mod mestilah dalam selang ini. Nilainya ditentukan oleh formula di atas:

Justeru, bilangan penjenayah terbanyak yang disabitkan kesalahan mencuri ialah 24 tahun.

Nilai purata memberikan ciri umum bagi keseluruhan fenomena yang dikaji. Walau bagaimanapun, dua populasi dengan nilai min yang sama mungkin berbeza dengan ketara antara satu sama lain dari segi tahap turun naik (variasi) dalam nilai sifat yang dikaji. Sebagai contoh, dalam satu mahkamah, syarat pemenjaraan berikut telah ditetapkan: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 tahun, dan dalam satu lagi - 5, 5, 6, 6, 7, 7 , 7, 8, 8, 8 tahun. Dalam kedua-dua kes, purata aritmetik ialah 6.7 tahun. Walau bagaimanapun, agregat ini berbeza dengan ketara antara satu sama lain dalam penyebaran nilai individu bagi tempoh pemenjaraan yang ditetapkan berbanding dengan nilai purata.

Dan untuk mahkamah pertama, di mana variasi ini agak besar, purata tempoh pemenjaraan tidak menggambarkan keseluruhan penduduk dengan baik. Oleh itu, jika nilai individu atribut berbeza sedikit antara satu sama lain, maka min aritmetik akan menjadi ciri yang agak menunjukkan ciri-ciri populasi ini. Jika tidak, min aritmetik akan menjadi ciri yang tidak boleh dipercayai bagi populasi ini dan penggunaannya dalam amalan tidak berkesan. Oleh itu, adalah perlu untuk mengambil kira variasi dalam nilai sifat yang dikaji.

Variasi- ini adalah perbezaan dalam nilai ciri dalam unit berbeza populasi tertentu dalam tempoh atau titik masa yang sama. Istilah "variasi" berasal dari bahasa Latin - variatio, yang bermaksud perbezaan, perubahan, turun naik. Ia timbul akibat fakta bahawa nilai individu atribut terbentuk di bawah pengaruh gabungan pelbagai faktor (syarat), yang digabungkan dengan cara yang berbeza dalam setiap kes individu. Untuk mengukur variasi sesuatu sifat, pelbagai penunjuk mutlak dan relatif digunakan.

Penunjuk utama variasi termasuk yang berikut:

1) julat variasi;

2) sisihan linear purata;

3) penyebaran;

4) sisihan piawai;

5) pekali variasi.

Mari kita fikirkan secara ringkas setiap daripada mereka.

Variasi rentang R ialah penunjuk mutlak yang paling mudah diakses dari segi kemudahan pengiraan, yang ditakrifkan sebagai perbezaan antara nilai terbesar dan terkecil atribut untuk unit populasi ini:

Julat variasi (julat turun naik) ialah penunjuk penting bagi kebolehubahan sifat, tetapi ia membolehkan untuk melihat hanya sisihan melampau, yang mengehadkan skopnya. Untuk pencirian yang lebih tepat bagi variasi sifat berdasarkan turun naiknya, penunjuk lain digunakan.

Sisihan linear purata mewakili min aritmetik nilai mutlak sisihan nilai individu sifat daripada min dan ditentukan oleh formula:

1) untuk data tidak terkumpul

2) untuk siri variasi

Walau bagaimanapun, ukuran variasi yang paling banyak digunakan ialah penyebaran . Ia mencirikan ukuran penyebaran nilai sifat yang dikaji berbanding dengan nilai puratanya. Varians ditakrifkan sebagai purata sisihan kuasa dua.

varians mudah untuk data tidak terkumpul:

.

Varians berwajaran untuk siri variasi:

Komen. Dalam amalan, lebih baik menggunakan formula berikut untuk mengira varians:

Untuk varians mudah

.

Untuk varians berwajaran

Sisihan piawai ialah punca kuasa dua varians:

Sisihan piawai ialah ukuran kebolehpercayaan min. Lebih kecil sisihan piawai, lebih homogen populasi dan lebih baik min aritmetik mencerminkan keseluruhan populasi.

Ukuran serakan yang dipertimbangkan di atas (julat variasi, varians, sisihan piawai) adalah penunjuk mutlak, yang mana tidak selalu mungkin untuk menilai tahap turun naik sesuatu sifat. Dalam beberapa masalah, adalah perlu untuk menggunakan indeks serakan relatif, salah satunya ialah pekali variasi.

Pekali variasi- dinyatakan sebagai peratusan nisbah sisihan piawai kepada min aritmetik:

Koefisien variasi digunakan bukan sahaja untuk penilaian perbandingan variasi ciri yang berbeza atau sifat yang sama dalam populasi yang berbeza, tetapi juga untuk mencirikan kehomogenan populasi. Populasi statistik dianggap homogen secara kuantitatif jika pekali variasi tidak melebihi 33% (untuk taburan yang hampir dengan taburan normal).

Contoh. Terdapat data berikut mengenai syarat pemenjaraan 50 banduan yang dihantar menjalani hukuman yang dijatuhkan oleh mahkamah di institusi pembetulan sistem penjara: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1 , 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Membina siri pengedaran mengikut terma pemenjaraan.

2. Cari min, varians dan sisihan piawai.

3. Kira pekali variasi dan buat kesimpulan tentang kehomogenan atau heterogeniti populasi yang dikaji.

Penyelesaian. Untuk membina siri pengedaran diskret, adalah perlu untuk menentukan varian dan frekuensi. Varian dalam masalah ini ialah tempoh pemenjaraan, dan kekerapannya ialah bilangan varian individu. Setelah mengira frekuensi, kami memperoleh siri pengedaran diskret berikut:

Cari min dan varians. Memandangkan data statistik diwakili oleh siri variasi diskret, kami akan menggunakan formula purata wajaran aritmetik dan varians untuk mengiranya. Kita mendapatkan:

= = 4,1;

= 5,21.

Sekarang kita mengira sisihan piawai:

Kami mencari pekali variasi:

Akibatnya, populasi statistik adalah heterogen secara kuantitatif.