Biografi Ciri-ciri Analisis

Matematik yang menghiburkan. Nilai purata

Ciri-ciri unit agregat statistik adalah berbeza dalam maksudnya, sebagai contoh, gaji pekerja dalam profesion yang sama sesebuah perusahaan tidak sama untuk tempoh masa yang sama, harga pasaran untuk produk yang sama, hasil tanaman di daerah itu. ladang, dsb. Oleh itu, untuk menentukan nilai ciri yang menjadi ciri keseluruhan populasi unit yang dikaji, nilai purata dikira.
Nilai purata ini adalah ciri umum bagi satu set nilai individu daripada beberapa ciri kuantitatif.

Populasi yang dikaji oleh ciri kuantitatif, terdiri daripada nilai individu; mereka dipengaruhi oleh sebab biasa, dan keadaan individu. Dalam nilai purata, ciri sisihan nilai individu dibatalkan. Purata, sebagai fungsi set nilai individu, mewakili keseluruhan agregat dengan satu nilai dan mencerminkan perkara biasa kepada semua unitnya.

Purata yang dikira untuk populasi yang terdiri daripada unit homogen secara kualitatif dipanggil purata biasa. Sebagai contoh, anda boleh mengira purata gaji bulanan pekerja kumpulan profesional tertentu (pelombong, doktor, pustakawan). Sudah tentu, tahap gaji bulanan pelombong, disebabkan oleh perbezaan dalam kelayakan mereka, tempoh perkhidmatan, masa bekerja sebulan dan banyak faktor lain, berbeza antara satu sama lain dan dari tahap gaji purata. Walau bagaimanapun, tahap purata mencerminkan faktor utama yang mempengaruhi tahap upah, dan membatalkan perbezaan yang timbul akibat ciri individu pekerja. Gaji purata mencerminkan tahap tipikal gaji untuk pekerja jenis ini. Mendapatkan purata biasa harus didahului dengan analisis bagaimana set ini secara kualitatif homogen. Jika keseluruhannya terdiri daripada bahagian individu, ia harus dibahagikan kepada kumpulan tipikal (suhu purata di hospital).

Nilai purata yang digunakan sebagai ciri untuk populasi heterogen dipanggil purata sistem. Sebagai contoh, nilai purata keluaran dalam negara kasar (KDNK) per kapita, penggunaan purata pelbagai kumpulan barangan setiap orang dan nilai lain yang serupa, mewakili ciri umum negara sebagai sistem ekonomi yang bersatu.

Purata mesti dikira untuk populasi yang terdiri daripada mencukupi bilangan yang besar unit. Pematuhan kepada syarat ini adalah perlu untuk undang-undang berkuat kuasa bilangan yang besar, akibatnya sisihan rawak nilai individu daripada trend umum membatalkan satu sama lain.

Jenis purata dan kaedah untuk mengiranya

Pilihan jenis purata ditentukan oleh kandungan ekonomi penunjuk tertentu dan data sumber. Walau bagaimanapun, sebarang nilai purata mesti dikira supaya apabila ia menggantikan setiap variasi ciri purata, yang muktamad, generalisasi, atau, seperti yang biasa dipanggil, tidak berubah. penunjuk yang menentukan, yang dikaitkan dengan penunjuk purata. Sebagai contoh, apabila menggantikan kelajuan sebenar pada bahagian individu laluan, mereka kelajuan purata tidak sepatutnya berubah jumlah jarak, lulus kenderaan pada masa yang sama; apabila menggantikan gaji sebenar pekerja individu bagi perusahaan bersaiz sederhana upah Kumpulan wang gaji tidak sepatutnya berubah. Akibatnya, dalam setiap kes tertentu, bergantung kepada sifat data yang tersedia, hanya terdapat satu nilai purata sebenar penunjuk yang mencukupi untuk sifat dan intipati fenomena sosio-ekonomi yang dikaji.
Yang paling biasa digunakan ialah min aritmetik, min harmonik, min geometri, min kuadratik dan min padu.
Purata yang disenaraikan tergolong dalam kelas penenang sederhana dan bersatu formula am:
,
di manakah nilai purata ciri yang dikaji;
m - indeks darjah purata;
– nilai semasa (varian) ciri yang dipuratakan;
n – bilangan ciri.
Bergantung kepada nilai eksponen m, terdapat jenis berikut purata kuasa:
apabila m = -1 – min harmonik;
pada m = 0 – min geometri;
untuk m = 1 – min aritmetik;
untuk m = 2 – punca min kuasa dua;
pada m = 3 – padu purata.
Apabila menggunakan data awal yang sama, semakin besar eksponen m dalam formula di atas, semakin besar lebih nilai saiz purata:
.
Sifat purata kuasa ini meningkat dengan peningkatan eksponen bagi fungsi penentu dipanggil peraturan majoriti purata.
Setiap purata yang ditanda boleh mengambil dua bentuk: ringkas Dan berwajaran.
Bentuk sederhana sederhana digunakan apabila purata dikira daripada data primer (tidak terkumpul). Bentuk tertimbang– apabila mengira purata berdasarkan data sekunder (berkumpulan).

Aritmetik min

Purata aritmetik digunakan apabila isipadu populasi ialah jumlah semua nilai individu dengan ciri yang berbeza-beza. Perlu diingat bahawa jika jenis purata tidak dinyatakan, purata aritmetik diandaikan. Formula logiknya kelihatan seperti:

Min aritmetik mudah dikira berdasarkan data tidak terkumpul mengikut formula:
atau ,
di mana - nilai individu tanda;
j – nombor siri unit pemerhatian, yang dicirikan oleh nilai;
N – bilangan unit cerapan (isipadu populasi).
Contoh. Kuliah "Ringkasan dan pengelompokan data statistik" meneliti hasil pemerhatian pengalaman kerja sepasukan 10 orang. Mari kita hitung purata pengalaman kerja pekerja pasukan. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

Mengikut formula min aritmetik mudah juga dikira purata dalam siri kronologi, jika selang masa yang mana nilai ciri dibentangkan adalah sama.
Contoh. Jumlah produk yang dijual untuk suku pertama berjumlah 47 den. unit, untuk yang kedua 54, untuk yang ketiga 65 dan untuk yang keempat 58 den. unit Purata pusing ganti suku tahunan ialah (47+54+65+58)/4 = 56 den. unit
Jika penunjuk seketika diberikan dalam siri kronologi, maka apabila mengira purata ia digantikan dengan separuh jumlah nilai pada permulaan dan akhir tempoh.
Jika terdapat lebih daripada dua momen dan selang antara keduanya adalah sama, maka purata dikira menggunakan formula untuk purata kronologi

,
di mana n ialah bilangan titik masa
Dalam kes apabila data dikumpulkan mengikut nilai ciri (iaitu, siri pengedaran variasi diskret telah dibina) dengan berwajaran purata aritmetik dikira menggunakan sama ada frekuensi atau kekerapan pemerhatian nilai khusus ciri, yang bilangannya (k) adalah ketara kurang bilangan pemerhatian (N) .
,
,
di mana k ialah bilangan kumpulan siri variasi,
i – nombor kumpulan siri variasi.
Oleh kerana , a , kami memperoleh formula yang digunakan untuk pengiraan praktikal:
Dan
Contoh. Mari kita hitung purata tempoh perkhidmatan pasukan kerja dalam baris berkumpulan.
a) menggunakan frekuensi:

b) menggunakan frekuensi:

Dalam kes apabila data dikumpulkan mengikut selang , iaitu dibentangkan dalam borang siri selang taburan, apabila mengira min aritmetik, pertengahan selang diambil sebagai nilai ciri, berdasarkan andaian taburan seragam unit populasi sepanjang selang tertentu. Pengiraan dilakukan menggunakan formula:
Dan
di manakah pertengahan selang: ,
di mana dan ialah sempadan bawah dan atas selang (dengan syarat sempadan atas selang tertentu bertepatan dengan sempadan bawah selang seterusnya).

Contoh. Mari kita hitung min aritmetik bagi siri variasi selang yang dibina berdasarkan hasil kajian gaji tahunan 30 pekerja (lihat kuliah "Ringkasan dan pengumpulan data statistik").
Jadual 1 – Taburan siri variasi selang.

Selang, UAH

Kekerapan, orang

Kekerapan,

Tengah selang

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

UAH atau UAH
Maksud aritmetik yang dikira berdasarkan data sumber dan siri variasi selang mungkin tidak bertepatan kerana taburan nilai atribut yang tidak sekata dalam selang. Dalam kes ini, untuk lebih banyak lagi pengiraan yang tepat Purata aritmetik berwajaran tidak seharusnya menggunakan pertengahan selang, tetapi purata aritmetik mudah dikira untuk setiap kumpulan ( purata kumpulan). Purata yang dikira daripada kumpulan bermakna menggunakan formula pengiraan wajaran dipanggil purata am.
Purata aritmetik mempunyai beberapa sifat.
1. Jumlah sisihan daripada pilihan purata ialah sifar:
.
2. Jika semua nilai opsyen meningkat atau menurun dengan jumlah A, maka nilai purata meningkat atau menurun dengan jumlah A yang sama:

3. Jika setiap pilihan dinaikkan atau dikurangkan sebanyak B kali, maka nilai purata juga akan meningkat atau menurun dengan bilangan kali yang sama:
atau
4. Jumlah hasil pilihan dengan frekuensi adalah sama dengan hasil darab nilai purata dengan jumlah frekuensi:

5. Jika semua frekuensi dibahagikan atau didarab dengan sebarang nombor, maka min aritmetik tidak akan berubah:

6) jika dalam semua selang frekuensi adalah sama antara satu sama lain, maka min aritmetik berwajaran adalah sama dengan min aritmetik mudah:
,
di mana k ialah bilangan kumpulan siri variasi.

Menggunakan sifat purata membolehkan anda memudahkan pengiraannya.
Mari kita andaikan bahawa semua pilihan (x) dikurangkan terlebih dahulu dengan nombor A yang sama, dan kemudian dikurangkan dengan faktor B. Penyederhanaan terbesar dicapai apabila nilai tengah selang, yang mempunyai kekerapan tertinggi, dan sebagai B – nilai selang (untuk siri dengan selang yang sama). Kuantiti A dipanggil asal, jadi kaedah pengiraan purata ini dipanggil cara b rujukan ohm daripada sifar bersyarat atau cara detik.
Selepas transformasi sedemikian, kami memperoleh siri pengedaran variasi baharu, yang variannya adalah sama dengan . Min aritmetik mereka, dipanggil detik pesanan pertama, dinyatakan oleh formula dan mengikut sifat kedua dan ketiga, min aritmetik adalah sama dengan min versi awal, dikurangkan dahulu sebanyak A dan kemudian dengan kali B, iaitu.
Untuk menerima purata sebenar(purata siri asal) anda perlu mendarab momen tertib pertama dengan B dan menambah A:

Pengiraan min aritmetik menggunakan kaedah momen digambarkan oleh data dalam Jadual. 2.
Jadual 2 – Taburan pekerja kedai kilang mengikut tempoh perkhidmatan


Tempoh perkhidmatan pekerja, tahun

Bilangan pekerja

Tengah selang

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Mencari detik pesanan pertama . Kemudian, mengetahui bahawa A = 17.5 dan B = 5, kami mengira purata tempoh perkhidmatan pekerja bengkel:
tahun

Maksud harmonik
Seperti yang ditunjukkan di atas, min aritmetik digunakan untuk mengira nilai purata ciri dalam kes di mana variannya x dan frekuensinya f diketahui.
Jika maklumat statistik tidak mengandungi frekuensi f untuk pilihan individu x populasi, tetapi dibentangkan sebagai produk mereka, formula digunakan purata berwajaran harmonik . Untuk mengira purata, mari kita nyatakan di mana . Menggantikan ungkapan ini ke dalam formula untuk purata wajaran aritmetik, kami memperoleh formula untuk purata wajaran harmonik:
,
di manakah isipadu (berat) nilai atribut penunjuk dalam selang bernombor i (i=1,2, …, k).

Oleh itu, min harmonik digunakan dalam kes di mana bukan pilihan itu sendiri yang tertakluk kepada penjumlahan, tetapi timbal baliknya: .
Dalam kes di mana berat setiap pilihan sama dengan satu, iaitu nilai individu tanda songsang berlaku sekali, berlaku bermakna mudah harmonik:
,
di mana varian individu bagi ciri songsang, berlaku sekali;
N – pilihan nombor.
Jika terdapat purata harmonik untuk dua bahagian populasi, maka purata keseluruhan untuk keseluruhan populasi dikira menggunakan formula:

dan dipanggil min harmonik berwajaran bagi min kumpulan.

Contoh. Semasa berdagang di pertukaran mata wang, tiga transaksi telah dibuat pada jam pertama operasi. Data mengenai jumlah jualan Hryvnia dan kadar pertukaran Hryvnia berbanding dolar AS diberikan dalam jadual. 3 (lajur 2 dan 3). Tentukan kadar pertukaran purata Hryvnia berbanding dolar AS untuk jam pertama dagangan.
Jadual 3 – Data tentang kemajuan dagangan pada pertukaran mata wang asing

Purata kadar pertukaran dolar ditentukan oleh nisbah jumlah Hryvnia yang dijual semasa semua urus niaga kepada jumlah dolar yang diperoleh hasil daripada urus niaga yang sama. Jumlah akhir penjualan Hryvnia diketahui dari lajur 2 jadual, dan bilangan dolar yang dibeli dalam setiap transaksi ditentukan dengan membahagikan jumlah penjualan Hryvnia dengan kadar pertukarannya (lajur 4). Sejumlah $22 juta telah dibeli dalam tiga transaksi. Ini bermakna bahawa kadar pertukaran purata Hryvnia untuk satu dolar adalah
.
Nilai yang terhasil adalah nyata, kerana menggantikan kadar pertukaran Hryvnia sebenar dalam urus niaga tidak akan mengubah jumlah akhir jualan Hryvnia, yang berfungsi sebagai penunjuk yang menentukan: juta UAH
Jika min aritmetik digunakan untuk pengiraan, i.e. Hryvnia, kemudian oleh kadar pertukaran untuk pembelian 22 juta dolar. ia akan menjadi perlu untuk membelanjakan 110.660.000 UAH, yang tidak benar.

Purata geometri
Purata geometri digunakan untuk menganalisis dinamik fenomena dan membolehkan kita menentukan pekali purata pertumbuhan. Apabila mengira min geometri, nilai individu ciri adalah penunjuk relatif dinamik yang dibina dalam bentuk kuantiti rantai, sebagai nisbah setiap peringkat kepada yang sebelumnya.
Purata geometri mudah dikira menggunakan formula:
,
di manakah tanda produk,
N – bilangan nilai purata.
Contoh. Bilangan jenayah berdaftar dalam tempoh 4 tahun meningkat sebanyak 1.57 kali, termasuk untuk yang pertama – 1.08 kali, untuk yang ke-2 – 1.1 kali, untuk yang ke-3 – 1.18 dan untuk yang ke-4 – 1.12 kali. Kemudian kadar purata tahunan pertumbuhan dalam bilangan jenayah ialah: , i.e. bilangan jenayah berdaftar meningkat setiap tahun dengan purata 12%.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Untuk mengira purata berwajaran kuasa dua, kita tentukan dan masukkan ke dalam jadual dan . Kemudian sisihan purata panjang produk dari norma yang diberikan adalah sama dengan:

Aritmetik min dalam dalam kes ini akan menjadi tidak sesuai, kerana akibatnya kita akan mendapat sisihan sifar.
Penggunaan kuasa dua min akan dibincangkan dengan lebih lanjut dari segi variasi.

Apabila mengambil pelbagai ukuran kuantiti, maksud sebenar yang a, sedang lakukan n ukuran. Akibatnya, beberapa nilai anggaran diperolehi

Marilah kita mewakili kesilapan mutlak sebenar sebagai

Kemudian kita boleh menulis:

Menambah istilah demi istilah, kami mempunyai:

,

min aritmetik bagi ukuran individu.

Maksud sebenar A, akan diluahkan

kesilapan mutlak sebenar, yang masih tidak diketahui.

Masalah mencari ralat rawak telah diselesaikan oleh Gauss. Pertimbangan adalah berdasarkan dua aksiom:

    Ralat dengan magnitud mutlak yang sama dan tanda yang berlawanan adalah sama berkemungkinan.

    Lebih banyak nilai mutlak kesilapan, semakin kecil kemungkinannya.

Daripada aksiom pertama ia mengikuti bahawa untuk bilangan dimensi yang tidak terhingga (untuk
)

dan kemudian

Tetapi dalam praktiknya hanya bilangan pengukuran yang terhad boleh dijalankan. Dan ini ternyata mencukupi, kerana ralat besar tidak mungkin berdasarkan aksiom kedua.

Ia berikutan itu
banyak ukuran, dan tugas timbul untuk menganggarkan tahap penghampiran nilai purata kepada nilai sebenar.

3. Ralat pengukuran langsung atau langsung

Jika, hasil daripada mengukur nilai b nilai yang diterima
maka min aritmetik

Kesilapan mutlak ukuran individu
sama besarnya dengan perbezaan nilai purata dan hasil pengukuran individu

,
,…,

ralat pengukuran mutlak purata.

Keputusan pengukuran dibentangkan seperti berikut:

Pengiraan dijalankan dengan mengambil kira peraturan pengiraan anggaran.

Ralat relatif menunjukkan bahagian mana ralat mutlak membentuk nilai purata dan biasanya dinyatakan sebagai peratusan

Ralat pengukuran terkecil tidak boleh kurang daripada ralat instrumen. Yang terakhir ditunjukkan dalam pasport, atau kami mengambil separuh harga bahagian peranti untuknya.

Jika pengukuran dilakukan sekali atau hasil yang sama diperolehi selepas pengulangan berulang, maka ralat pengukuran dianggap sebagai ralat peranti (mengikut kelas pasport atau ketepatan peranti) atau ia diambil sama dengan separuh harga bahagian terkecil peranti.

Kelas ketepatan peranti ditentukan oleh ralat maksimum peranti, dinyatakan sebagai peratusan nilai skala penuh. Sebagai contoh, kelas ketepatan 0.5 bermakna ralat 0.5% apabila jarum melencong ke atas keseluruhan skala. Apabila anak panah menyimpang separuh daripada skala, ralat itu berganda, dan apabila anak panah menyimpang sebanyak satu pertiga daripada skala, ralat meningkat tiga kali ganda.

4. Ralat pengukuran tidak langsung

Untuk pengukuran tidak langsung, nilai x didapati sebagai fungsi kuantiti yang diukur secara langsung A, b, Dengan. Kesilapan mutlak
pengukuran langsung menyebabkan ralat mutlak
Apabila anda menjumpai
gunakan teorem berikut:

1. Ralat mutlak jumlah (perbezaan) adalah sama dengan jumlah ralat mutlak istilah (ditolak dan ditolak)


,

2. Ralat mutlak hasil darab adalah sama dengan jumlah hasil darab faktor pertama dengan ralat mutlak kedua dan faktor kedua dengan ralat mutlak faktor pertama.


,

3. Ralat mutlak hasil bagi adalah sama dengan jumlah hasil darab pembahagi dibahagikan dengan ralat mutlak dan pembahagi dengan ralat mutlak dividen, dibahagikan dengan kuasa dua pembahagi.


,

Ralat relatif

Analisis matematik menunjukkan bahawa

Pada masa yang sama x - terdapat beberapa fungsi
dsb. secara eksplisit, dan oleh itu seseorang boleh mengira pembezaannya daripada logaritma, yang akan mengandungi
dll.

Jika kita menggantikan semua pembezaan dalam ungkapan yang terhasil dengan perbezaan terhingga kecil
dan lain-lain, maka kita mendapat formula untuk ralat relatif

untuk perbezaan terhingga

.

Jika
ada kesilapan mutlak dengan pengukuran langsung A, b, Dengan, Itu
– ralat nilai mutlak x.

Formula untuk mencari ralat relatif akan ditulis seperti berikut: (semua istilah diambil dalam nilai mutlak)

.

Untuk menyatakannya sebagai peratusan, anda perlu mendarab sisi kanan dan kiri sebanyak 100%.

Formula ini juga mudah digunakan untuk mencari ralat mutlak.

sungguh,

.

Hasilnya dibentangkan seperti ini:
.

Jika fungsi x mewakili jumlah atau perbezaan yang kompleks, maka ralat ditemui untuk setiap istilah secara berasingan dan kemudian dijumlahkan. Dalam kes di mana formula untuk mencari kuantiti x termasuk kuantiti rujukan fizikal atau matematik yang dinyatakan sebagai nombor anggaran ralatnya dianggap sebagai setengah unit daripada siri terendah. Sebagai contoh,

Katakan anda perlu mencari purata bilangan hari untuk menyelesaikan tugasan oleh pekerja yang berbeza. Atau adakah anda ingin mengira selang masa 10 tahun Suhu purata pada hari tertentu. Mengira purata siri nombor dalam beberapa cara.

Min ialah fungsi ukuran kecenderungan memusat, yang merupakan pusat siri nombor dalam taburan statistik. Tiga majoriti kriteria umum kecenderungan pusat menonjol.

    Purata Min aritmetik dikira dengan menambah satu siri nombor dan kemudian membahagikan nombor nombor tersebut. Sebagai contoh, purata 2, 3, 3, 5, 7, dan 10 ialah 30 dibahagikan dengan 6.5;

    Median Purata bilangan siri nombor. Separuh nombor mempunyai nilai yang lebih besar daripada Median, dan separuh nombor mempunyai nilai yang kurang daripada Median. Sebagai contoh, median bagi 2, 3, 3, 5, 7 dan 10 ialah 4.

    Mod Nombor yang paling biasa dalam kumpulan nombor. Contohnya, mod 2, 3, 3, 5, 7 dan 10 - 3.

Ketiga-tiga ukuran kecenderungan memusat ini, taburan simetri bagi satu siri nombor, adalah sama. Dalam taburan tidak simetri bagi beberapa nombor, mereka boleh berbeza.

Kira purata sel yang bersebelahan dalam baris atau lajur yang sama

Ikuti langkah ini:

Mengira purata sel rawak

Untuk melaksanakan tugas ini, gunakan fungsi PURATA. Salin jadual di bawah pada helaian kertas kosong.

Pengiraan purata wajaran

SUMPRODUCT Dan jumlah. vContoh ini mengira purata harga unit yang dibayar merentas tiga pembelian, di mana setiap pembelian adalah untuk bilangan unit yang berbeza pada harga unit yang berbeza.

Salin jadual di bawah pada helaian kertas kosong.

Mengira purata nombor, tanpa mengambil kira nilai sifar

Untuk melaksanakan tugas ini, gunakan fungsi PURATA Dan Jika. Salin jadual di bawah dan ingat bahawa dalam contoh ini, untuk memudahkan pemahaman, salin pada helaian kertas kosong.

Dalam kebanyakan kes, data tertumpu di sekitar beberapa titik pusat. Oleh itu, untuk menerangkan sebarang set data, sudah cukup untuk menunjukkan nilai purata. Mari kita pertimbangkan tiga berturut-turut ciri berangka, yang digunakan untuk menganggarkan min taburan: min aritmetik, median dan mod.

Min aritmetik

Min aritmetik (selalunya dipanggil hanya min) ialah anggaran paling biasa bagi min bagi sesuatu taburan. Ia adalah hasil daripada membahagikan jumlah semua yang boleh diperhatikan kuantiti berangka dengan nombor mereka. Bagi sampel yang terdiri daripada nombor X 1, X 2, …, Xn, min sampel (ditandakan dengan ) sama = (X 1 + X 2 + … + Xn) / n, atau

di manakah min sampel, n- saiz sampel, Xiunsur ke-i sampel.

Muat turun nota dalam atau format, contoh dalam format

Pertimbangkan untuk mengira purata nilai aritmetik pulangan tahunan purata lima tahun bagi 15 dana bersama dengan sangat tahap tinggi risiko (Rajah 1).

nasi. 1. Purata pulangan tahunan 15 dana bersama berisiko tinggi

Purata sampel dikira seperti berikut:

Ini adalah pulangan yang baik, terutamanya berbanding pulangan 3-4% yang diterima oleh pendeposit bank atau kesatuan kredit dalam tempoh masa yang sama. Jika kita mengisih pulangan, adalah mudah untuk melihat bahawa lapan dana mempunyai pulangan melebihi purata, dan tujuh - di bawah purata. Min aritmetik bertindak sebagai titik keseimbangan, supaya dana dengan pulangan rendah mengimbangi dana dengan pulangan tinggi. Semua elemen sampel terlibat dalam pengiraan purata. Tiada anggaran lain bagi purata taburan yang mempunyai sifat ini.

Bilakah anda perlu mengira min aritmetik? Memandangkan min aritmetik bergantung pada semua elemen dalam sampel, kehadiran nilai ekstrem memberi kesan yang ketara kepada hasilnya. Dalam situasi sedemikian, min aritmetik boleh memesongkan maksud data berangka. Oleh itu, apabila menerangkan set data yang mengandungi nilai ekstrem, adalah perlu untuk menunjukkan median atau min aritmetik dan median. Sebagai contoh, jika kita mengalih keluar pulangan dana RS Emerging Growth daripada sampel, purata sampel pulangan 14 dana berkurangan hampir 1% kepada 5.19%.

Median

Median mewakili nilai tengah tatasusunan nombor. Jika tatasusunan tidak mengandungi nombor berulang, maka separuh daripada elemennya akan kurang daripada dan separuh akan lebih besar daripada median. Jika sampel mengandungi nilai ekstrem, adalah lebih baik menggunakan median daripada min aritmetik untuk menganggarkan min. Untuk mengira median sampel, ia mesti dipesan terlebih dahulu.

Formula ini adalah samar-samar. Keputusannya bergantung kepada sama ada nombor itu genap atau ganjil n:

  • Jika sampel mengandungi bilangan unsur ganjil, median ialah (n+1)/2-elemen ke.
  • Jika sampel mengandungi bilangan elemen genap, median terletak di antara dua elemen tengah sampel dan adalah sama dengan min aritmetik yang dikira ke atas kedua-dua elemen ini.

Untuk mengira median sampel yang mengandungi pulangan 15 dana bersama yang sangat berisiko tinggi, anda perlu mengisih data mentah terlebih dahulu (Rajah 2). Kemudian median akan bertentangan dengan nombor unsur tengah sampel; dalam contoh kami No. 8. Excel mempunyai fungsi khas =MEDIAN() yang berfungsi dengan tatasusunan tidak tertib juga.

nasi. 2. Median 15 dana

Oleh itu, median ialah 6.5. Ini bermakna pulangan pada separuh daripada dana yang sangat berisiko tinggi tidak melebihi 6.5, dan pulangan pada separuh lagi melebihinya. Perhatikan bahawa median 6.5 tidak jauh lebih besar daripada min 6.08.

Jika kita mengalih keluar pulangan dana RS Emerging Growth daripada sampel, median baki 14 dana akan berkurangan kepada 6.2%, iaitu, tidak begitu ketara seperti min aritmetik (Rajah 3).

nasi. 3. Median 14 dana

Fesyen

Istilah ini pertama kali dicipta oleh Pearson pada tahun 1894. Fesyen ialah nombor yang paling kerap berlaku dalam sampel (yang paling bergaya). Fesyen menggambarkan dengan baik, sebagai contoh, reaksi tipikal pemandu di isyarat lampu isyarat untuk menghentikan lalu lintas. Contoh klasik penggunaan fesyen - memilih saiz kumpulan kasut atau warna kertas dinding. Jika pengedaran mempunyai beberapa mod, maka ia dikatakan sebagai multimodal atau multimodal (mempunyai dua atau lebih "puncak"). Pengagihan multimodal memberi maklumat penting tentang sifat pembolehubah yang dikaji. Sebagai contoh, dalam tinjauan sosiologi, jika pembolehubah mewakili keutamaan atau sikap terhadap sesuatu, maka multimodaliti mungkin bermakna terdapat beberapa pendapat yang berbeza. Multimodaliti juga berfungsi sebagai penunjuk bahawa sampel tidak homogen dan pemerhatian mungkin dihasilkan oleh dua atau lebih taburan "bertindih". Tidak seperti min aritmetik, outlier tidak menjejaskan mod. Untuk pembolehubah rawak yang diedarkan secara berterusan, seperti purata pulangan tahunan bagi dana bersama, mod kadangkala tidak wujud (atau tidak masuk akal) sama sekali. Oleh kerana penunjuk ini boleh mengambil nilai yang sangat berbeza, nilai berulang adalah sangat jarang berlaku.

Kuartil

Kuartil ialah metrik yang paling kerap digunakan untuk menilai taburan data apabila menerangkan sifat sampel berangka yang besar. Walaupun median membahagikan tatasusunan tertib kepada separuh (50% daripada elemen tatasusunan adalah kurang daripada median dan 50% lebih besar), kuartil membahagikan set data tersusun kepada empat bahagian. Nilai Q 1 , median dan Q 3 masing-masing ialah persentil ke-25, ke-50 dan ke-75. Kuartil pertama Q 1 ialah nombor yang membahagikan sampel kepada dua bahagian: 25% daripada unsur adalah kurang dan 75% adalah kurang. lebih daripada yang pertama kuartil

Kuartil ketiga Q 3 ialah nombor yang turut membahagikan sampel kepada dua bahagian: 75% unsur adalah kurang daripada, dan 25% lebih besar daripada, kuartil ketiga.

Untuk mengira kuartil dalam versi Excel sebelum 2007, gunakan fungsi =QUARTILE(array,part). Bermula dari Excel 2010, dua fungsi digunakan:

  • =QUARTILE.ON(array,part)
  • =QUARTILE.EXC(array,bahagian)

Kedua-dua fungsi ini memberi sedikit makna yang berbeza(Gamb. 4). Contohnya, apabila mengira kuartil sampel yang mengandungi pulangan tahunan purata 15 dana bersama berisiko tinggi, Q 1 = 1.8 atau –0.7 untuk QUARTILE.IN dan QUARTILE.EX, masing-masing. By the way, fungsi QUARTILE yang digunakan sebelum ini sepadan dengan fungsi moden KUARTIL.TERMASUK. Untuk mengira kuartil dalam Excel menggunakan formula di atas, tatasusunan data tidak perlu dipesan.

nasi. 4. Mengira kuartil dalam Excel

Mari kita tekankan sekali lagi. Excel boleh mengira kuartil untuk univariat siri diskret , yang mengandungi nilai pembolehubah rawak. Pengiraan kuartil untuk taburan berasaskan frekuensi diberikan di bawah dalam bahagian.

Purata geometri

Tidak seperti min aritmetik, min geometri membolehkan anda menganggarkan tahap perubahan dalam pembolehubah dari semasa ke semasa. Purata geometri ialah punca n ijazah ke- dari kerja n kuantiti (dalam Excel fungsi =SRGEOM digunakan):

G= (X 1 * X 2 * … * X n) 1/n

Parameter yang sama ialah purata makna geometri kadar pulangan ditentukan oleh formula:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

di mana R i– kadar keuntungan untuk i tempoh masa ke.

Sebagai contoh, katakan pelaburan awal ialah $100,000 Menjelang akhir tahun pertama, ia jatuh kepada $50,000, dan pada akhir tahun kedua ia pulih ke tahap awal $100,000 Kadar pulangan pelaburan ini lebih daripada dua tempoh -tahun bersamaan dengan 0, kerana jumlah awal dan akhir dana adalah sama antara satu sama lain. Walau bagaimanapun, min aritmetik piawaian tahunan keuntungan adalah sama dengan = (–0.5 + 1) / 2 = 0.25 atau 25%, kerana kadar keuntungan pada tahun pertama R 1 = (50,000 – 100,000) / 100,000 = –0.5, dan pada R 2 kedua = ( 100,000 – 50,000) / 50,000 = 1. Pada masa yang sama, nilai purata geometri bagi kadar keuntungan selama dua tahun adalah bersamaan dengan: G = [(1–0.5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Oleh itu, min geometri lebih tepat menggambarkan perubahan (lebih tepat lagi, ketiadaan perubahan) dalam jumlah pelaburan dalam tempoh dua tahun daripada min aritmetik.

Fakta menarik. Pertama, min geometri akan sentiasa kurang daripada min aritmetik nombor yang sama. Kecuali untuk kes apabila semua nombor yang diambil adalah sama antara satu sama lain. Kedua, setelah mempertimbangkan harta benda segi tiga tepat, seseorang boleh memahami mengapa min dipanggil geometri. Ketinggian segi tiga tegak, diturunkan kepada hipotenus, ialah purata berkadar antara unjuran kaki ke hipotenus, dan setiap kaki ialah purata berkadar antara hipotenus dan unjurannya ke hipotenus (Rajah 5). Ini memberikan cara geometri untuk membina min geometri bagi dua (panjang) segmen: anda perlu membina bulatan pada jumlah kedua-dua segmen ini sebagai diameter, kemudian ketinggian dipulihkan dari titik sambungannya ke persimpangan dengan bulatan akan memberikan nilai yang dikehendaki:

nasi. 5. Sifat geometri bagi min geometri (rajah daripada Wikipedia)

Kedua harta yang penting data berangka - mereka variasi, mencirikan tahap penyebaran data. Dua sampel berbeza mungkin berbeza dalam kedua-dua min dan varians. Walau bagaimanapun, seperti yang ditunjukkan dalam Rajah. 6 dan 7, dua sampel mungkin mempunyai variasi yang sama tetapi cara yang berbeza, atau cara yang sama dan variasi yang sama sekali berbeza. Data yang sepadan dengan poligon B dalam Rajah. 7, berubah lebih kurang daripada data yang poligon A dibina.

nasi. 6. Dua taburan berbentuk loceng simetri dengan hamparan yang sama dan nilai min yang berbeza

nasi. 7. Dua taburan berbentuk loceng simetri dengan nilai min yang sama dan hamparan yang berbeza

Terdapat lima anggaran variasi data:

  • skop,
  • julat antara kuartil,
  • penyebaran,
  • sisihan piawai,
  • pekali variasi.

Skop

Julat ialah perbezaan antara elemen terbesar dan terkecil sampel:

Julat = XMaks – XMin

Julat sampel yang mengandungi purata pulangan tahunan 15 dana bersama berisiko tinggi boleh dikira menggunakan tatasusunan tertib (lihat Rajah 4): Julat = 18.5 – (–6.1) = 24.6. Ini bermakna perbezaan antara pulangan tahunan purata tertinggi dan terendah bagi dana berisiko tinggi ialah 24.6%.

Julat mengukur penyebaran keseluruhan data. Walaupun julat sampel adalah anggaran yang sangat mudah bagi penyebaran keseluruhan data, kelemahannya ialah ia tidak mengambil kira dengan tepat cara data diedarkan antara elemen minimum dan maksimum. Kesan ini jelas kelihatan dalam Rajah. 8, yang menggambarkan sampel yang mempunyai julat yang sama. Skala B menunjukkan bahawa jika sampel mengandungi sekurang-kurangnya satu nilai ekstrem, julat sampel ialah anggaran yang sangat tidak tepat bagi penyebaran data.

nasi. 8. Perbandingan tiga sampel dengan julat yang sama; segi tiga melambangkan sokongan skala, dan lokasinya sepadan dengan min sampel

Julat antara kuartil

Julat antara kuartil, atau purata, ialah perbezaan antara kuartil ketiga dan pertama sampel:

Julat antara kuartil = Q 3 – Q 1

Nilai ini membolehkan kita menganggarkan serakan 50% unsur dan tidak mengambil kira pengaruh unsur ekstrem. Julat antara kuartil sampel yang mengandungi pulangan tahunan purata 15 dana bersama yang sangat berisiko tinggi boleh dikira menggunakan data dalam Rajah. 4 (contohnya, untuk fungsi QUARTILE.EXC): Julat antara kuartil = 9.8 – (–0.7) = 10.5. Selang yang dibatasi oleh nombor 9.8 dan -0.7 sering dipanggil separuh tengah.

Perlu diingatkan bahawa nilai Q 1 dan Q 3 , dan oleh itu julat antara kuartil, tidak bergantung pada kehadiran outlier, kerana pengiraannya tidak mengambil kira sebarang nilai yang akan kurang daripada Q 1 atau lebih besar. daripada Q 3 . Jumlah ciri kuantitatif nilai seperti median, kuartil pertama dan ketiga, dan julat antara kuartil yang tidak dipengaruhi oleh outlier dipanggil ukuran teguh.

Walaupun julat dan julat antara kuartil masing-masing memberikan anggaran sebaran keseluruhan dan purata sampel, kedua-dua anggaran ini tidak mengambil kira cara data diedarkan dengan tepat. Varians dan sisihan piawai tidak mempunyai kelemahan ini. Penunjuk ini membolehkan anda menilai sejauh mana data turun naik di sekitar nilai purata. Varians sampel ialah anggaran min aritmetik yang dikira daripada segi empat sama perbezaan antara setiap elemen sampel dan min sampel. Untuk sampel X 1, X 2, ... X n, varians sampel (ditandakan dengan simbol S 2 diberikan oleh formula berikut:

DALAM kes am varians sampel ialah jumlah kuasa dua perbezaan antara elemen sampel dan min sampel, dibahagikan dengan nilai yang sama dengan saiz sampel tolak satu:

di mana - min aritmetik, n- saiz sampel, X i - i elemen pemilihan ke X. Dalam Excel sehingga versi 2007 untuk pengiraan varians sampel fungsi =DISP() telah digunakan sejak versi 2010, fungsi =DISP.V() telah digunakan.

Anggaran penyebaran data yang paling praktikal dan diterima secara meluas ialah standard sisihan sampel . Penunjuk ini dilambangkan dengan simbol S dan sama dengan punca kuasa dua daripada varians sampel:

Dalam Excel sebelum versi 2007, fungsi =STDEV.() digunakan untuk mengira sisihan sampel piawai sejak versi 2010, fungsi =STDEV.V() digunakan. Untuk mengira fungsi ini, tatasusunan data mungkin tidak tertib.

Baik varians sampel mahupun sisihan piawai sampel tidak boleh negatif. Satu-satunya keadaan di mana penunjuk S 2 dan S boleh menjadi sifar adalah jika semua elemen sampel adalah sama antara satu sama lain. Ini betul-betul kes yang luar biasa julat dan julat antara kuartil juga sifar.

Data berangka sememangnya tidak menentu. Sebarang pembolehubah boleh mengambil banyak makna yang berbeza. Sebagai contoh, dana bersama yang berbeza mempunyai kadar pulangan dan kerugian yang berbeza. Oleh kerana kebolehubahan data berangka, adalah sangat penting untuk mengkaji bukan sahaja anggaran min, yang bersifat ringkasan, tetapi juga anggaran varians, yang mencirikan penyebaran data.

Serakan dan sisihan piawai membolehkan anda menilai sebaran data di sekitar nilai purata, dengan kata lain, menentukan berapa banyak elemen sampel yang kurang daripada purata dan berapa banyak yang lebih besar. Varians mempunyai beberapa nilai sifat matematik. Walau bagaimanapun, nilainya ialah kuasa dua unit ukuran - peratus persegi, dolar persegi, inci persegi, dll. Oleh itu, ukuran serakan semula jadi ialah sisihan piawai, yang dinyatakan dalam unit biasa peratusan pendapatan, dolar atau inci.

Sisihan piawai membolehkan anda menganggarkan jumlah variasi elemen sampel di sekitar nilai purata. Dalam hampir semua situasi, majoriti nilai yang diperhatikan terletak dalam julat tambah atau tolak satu sisihan piawai daripada min. Akibatnya, mengetahui min aritmetik unsur sampel dan sisihan sampel piawai, adalah mungkin untuk menentukan selang yang sebahagian besar data dimiliki.

Sisihan piawai pulangan untuk 15 dana bersama berisiko tinggi ialah 6.6 (Rajah 9). Ini bermakna keuntungan sebahagian besar dana berbeza daripada nilai purata tidak lebih daripada 6.6% (iaitu, ia turun naik dalam julat dari –S= 6.2 – 6.6 = –0.4 hingga +S= 12.8). Malah, pulangan tahunan purata lima tahun sebanyak 53.3% (8 daripada 15) dana terletak dalam julat ini.

nasi. 9. Sisihan piawai sampel

Ambil perhatian bahawa apabila menjumlahkan perbezaan kuasa dua, item sampel yang lebih jauh daripada min diberi lebih berat daripada item yang lebih dekat dengan min. Sifat ini ialah sebab utama mengapa min aritmetik paling kerap digunakan untuk menganggarkan min taburan.

Pekali variasi

Tidak seperti anggaran serakan sebelumnya, pekali variasi ialah anggaran relatif. Ia sentiasa diukur sebagai peratusan dan bukan dalam unit data asal. Pekali variasi, yang dilambangkan dengan simbol CV, mengukur penyebaran data di sekitar min. Pekali variasi adalah sama dengan sisihan piawai dibahagikan dengan min aritmetik dan didarab dengan 100%:

di mana S- sisihan sampel piawai, - purata sampel.

Pekali variasi membolehkan anda membandingkan dua sampel yang unsur-unsurnya dinyatakan dalam unit ukuran yang berbeza. Sebagai contoh, pengurus perkhidmatan penghantaran mel berhasrat untuk memperbaharui kumpulan traknya. Semasa memuatkan pakej, terdapat dua sekatan yang perlu dipertimbangkan: berat (dalam paun) dan isipadu (dalam kaki padu) setiap bungkusan. Katakan dalam sampel yang mengandungi 200 beg, berat purata ialah 26.0 paun, sisihan piawai berat ialah 3.9 paun, purata isipadu beg ialah 8.8 kaki padu, dan sisihan piawai isipadu ialah 2.2 kaki padu. Bagaimana untuk membandingkan variasi dalam berat dan isipadu bungkusan?

Oleh kerana unit ukuran untuk berat dan isipadu berbeza antara satu sama lain, pengurus mesti membandingkan sebaran relatif kuantiti ini. Pekali variasi berat ialah CV W = 3.9 / 26.0 * 100% = 15%, dan pekali variasi volum ialah CV V = 2.2 / 8.8 * 100% = 25%. Oleh itu, variasi relatif dalam jumlah paket adalah lebih besar daripada variasi relatif dalam beratnya.

Borang pengedaran

Sifat penting yang ketiga bagi sampel ialah bentuk taburannya. Taburan ini mungkin simetri atau tidak simetri. Untuk menerangkan bentuk taburan, adalah perlu untuk mengira min dan mediannya. Jika kedua-duanya adalah sama, pembolehubah dianggap bertaburan simetri. Jika nilai min pembolehubah lebih besar daripada median, taburannya mempunyai kecondongan positif (Rajah 10). Jika median lebih besar daripada min, taburan pembolehubah adalah condong secara negatif. Kecondongan positif berlaku apabila min meningkat ke tahap yang luar biasa nilai yang tinggi. Kecondongan negatif berlaku apabila min menurun kepada nilai yang luar biasa kecil. Pembolehubah diagihkan secara simetri jika ia tidak mengambil sebarang nilai ekstrem dalam mana-mana arah, supaya nilai besar dan kecil pembolehubah membatalkan satu sama lain.

nasi. 10. Tiga jenis pengagihan

Data yang ditunjukkan pada skala A adalah condong secara negatif. Angka ini menunjukkan ekor yang panjang dan condong ke kiri yang disebabkan oleh kehadiran nilai yang luar biasa kecil. Nilai yang sangat kecil ini mengalihkan nilai purata ke kiri, menjadikannya kurang daripada median. Data yang ditunjukkan pada skala B diedarkan secara simetri. Bahagian kiri dan kanan pengedaran adalah milik mereka sendiri pantulan cermin. Nilai besar dan kecil mengimbangi satu sama lain, dan min dan median adalah sama. Data yang ditunjukkan pada skala B adalah condong secara positif. Angka ini menunjukkan ekor yang panjang dan condong ke kanan disebabkan oleh kehadiran nilai yang luar biasa tinggi. Nilai yang terlalu besar ini mengalihkan min ke kanan, menjadikannya lebih besar daripada median.

Dalam Excel, statistik deskriptif boleh diperoleh menggunakan tambahan Pakej analisis. Pergi melalui menu DataAnalisis Data, dalam tetingkap yang terbuka, pilih baris Statistik Deskriptif dan klik Ok. Di tingkap Statistik Deskriptif pastikan untuk menunjukkan Selang input(Gamb. 11). Jika anda ingin melihat statistik deskriptif pada helaian yang sama dengan data asal, pilih butang radio Selang keluaran dan nyatakan sel di mana yang kiri harus diletakkan sudut atas statistik output (dalam contoh kami $C$1). Jika anda ingin mengeluarkan data ke daun baru atau dalam buku baru, hanya pilih suis yang sesuai. Tandai kotak di sebelah Statistik ringkasan. Jika mahu, anda juga boleh memilih Tahap kesukarankth terkecil dankth terbesar.

Jika di deposit Data di kawasan tersebut Analisis anda tidak melihat ikon itu Analisis Data, anda perlu memasang alat tambah terlebih dahulu Pakej analisis(lihat, sebagai contoh,).

nasi. 11. Statistik Deskriptif Purata pulangan tahunan dana lima tahun dengan tahap risiko yang sangat tinggi, dikira menggunakan tambahan Analisis Data program Excel

Excel mengira satu siri keseluruhan statistik yang dibincangkan di atas: min, median, mod, sisihan piawai, serakan, julat ( selang waktu), minimum, maksimum dan saiz sampel ( semak). Excel juga mengira beberapa statistik yang baharu kepada kami: ralat standard, kurtosis dan kecondongan. Ralat standard sama dengan sisihan piawai dibahagikan dengan punca kuasa dua saiz sampel. Asimetri mencirikan sisihan daripada simetri taburan dan merupakan fungsi yang bergantung kepada kubus perbezaan antara unsur sampel dan nilai purata. Kurtosis ialah ukuran kepekatan relatif data di sekitar min berbanding ekor taburan dan bergantung kepada perbezaan antara elemen sampel dan min yang dinaikkan kepada kuasa keempat.

Kira statistik deskriptif untuk penduduk

Min, taburan dan bentuk taburan yang dibincangkan di atas adalah ciri-ciri yang ditentukan daripada sampel. Walau bagaimanapun, jika set data mengandungi ukuran berangka bagi keseluruhan populasi, parameternya boleh dikira. Parameter tersebut termasuk nilai jangkaan, serakan dan sisihan piawai populasi.

Jangkaan sama dengan jumlah semua nilai dalam populasi dibahagikan dengan saiz populasi:

di mana µ - jangkaan matematik, Xi- i pemerhatian ke atas pembolehubah X, N- jumlah penduduk umum. Dalam Excel untuk pengiraan jangkaan matematik Fungsi yang sama digunakan seperti untuk min aritmetik: =AVERAGE().

Varians populasi sama dengan jumlah kuasa dua perbezaan antara unsur populasi umum dan tikar. jangkaan dibahagikan dengan saiz populasi:

di mana σ 2– penyebaran penduduk umum. Dalam Excel sebelum versi 2007, fungsi =VARP() digunakan untuk mengira varians populasi, bermula dengan versi 2010 =VARP().

Sisihan piawai penduduk sama dengan punca kuasa dua varians populasi:

Dalam Excel sebelum versi 2007, fungsi =STDEV() digunakan untuk mengira sisihan piawai populasi, bermula dengan versi 2010 =STDEV.Y(). Ambil perhatian bahawa formula untuk varians populasi dan sisihan piawai adalah berbeza daripada formula untuk mengira varians sampel dan sisihan piawai. Apabila mengira statistik sampel S 2 Dan S penyebut pecahan itu ialah n – 1, dan apabila mengira parameter σ 2 Dan σ - jumlah penduduk umum N.

Peraturan biasa

Dalam kebanyakan situasi, sebahagian besar pemerhatian tertumpu di sekitar median, membentuk gugusan. Dalam set data dengan pencongan positif, kelompok ini terletak di sebelah kiri (iaitu, di bawah) jangkaan matematik, dan dalam set dengan pencongan negatif, kelompok ini terletak di sebelah kanan (iaitu, di atas) jangkaan matematik. Untuk data simetri, min dan median adalah sama, dan pemerhatian berkumpul di sekeliling min, membentuk taburan berbentuk loceng. Jika taburan tidak condong dengan jelas dan data tertumpu di sekitar pusat graviti, peraturan praktikal yang boleh digunakan untuk menganggar kebolehubahan ialah jika data mempunyai taburan berbentuk loceng, maka kira-kira 68% daripada pemerhatian berada dalam lingkungan satu sisihan piawai bagi nilai jangkaan lebih kurang 95% daripada pemerhatian adalah tidak lebih daripada dua sisihan piawai daripada jangkaan matematik dan 99.7% daripada pemerhatian adalah tidak lebih daripada tiga sisihan piawai daripada jangkaan matematik.

Oleh itu, sisihan piawai, yang merupakan anggaran variasi purata di sekitar nilai jangkaan, membantu memahami cara pemerhatian diedarkan dan mengenal pasti penyimpangan. Peraturan praktikal ialah untuk taburan berbentuk loceng, hanya satu nilai dalam dua puluh berbeza daripada jangkaan matematik dengan lebih daripada dua sisihan piawai. Oleh itu, nilai di luar selang µ ± 2σ, boleh dianggap outlier. Di samping itu, hanya tiga daripada 1000 pemerhatian berbeza daripada jangkaan matematik dengan lebih daripada tiga sisihan piawai. Oleh itu, nilai di luar selang µ ± 3σ hampir selalu outlier. Untuk pengedaran yang sangat condong atau tidak berbentuk loceng, peraturan Bienamay-Chebyshev boleh digunakan.

Lebih daripada seratus tahun yang lalu, ahli matematik Bienamay dan Chebyshev secara bebas menemuinya harta yang berguna sisihan piawai. Mereka mendapati bahawa untuk mana-mana set data, tanpa mengira bentuk taburan, peratusan pemerhatian terletak dalam jarak k sisihan piawai daripada jangkaan matematik, tidak kurang (1 – 1/ k 2)*100%.

Sebagai contoh, jika k= 2, peraturan Bienname-Chebyshev menyatakan bahawa sekurang-kurangnya (1 – (1/2) 2) x 100% = 75% daripada pemerhatian mesti terletak pada selang µ ± 2σ. Peraturan ini adalah benar untuk mana-mana k, melebihi satu. Peraturan Bienamay-Chebyshev sangat watak umum dan sah untuk pengedaran apa-apa jenis. Ia menunjukkan kuantiti minimum pemerhatian, jarak dari mana ke jangkaan matematik tidak melebihi nilai yang diberikan. Walau bagaimanapun, jika pengedaran berbentuk loceng, peraturan praktikal menganggarkan kepekatan data di sekitar nilai yang dijangkakan dengan lebih tepat.

Mengira Statistik Deskriptif untuk Taburan Berasaskan Kekerapan

Jika data asal tidak tersedia, taburan kekerapan menjadi satu-satunya sumber maklumat. Dalam situasi sedemikian, adalah mungkin untuk mengira nilai anggaran penunjuk kuantitatif taburan, seperti min aritmetik, sisihan piawai dan kuartil.

Jika data sampel diwakili sebagai taburan kekerapan, anggaran min aritmetik boleh dikira dengan mengandaikan bahawa semua nilai dalam setiap kelas tertumpu pada titik tengah kelas:

di mana - purata sampel, n- bilangan pemerhatian, atau saiz sampel, Dengan- bilangan kelas dalam taburan kekerapan, m j- titik tengah j kelas ke, fj- kekerapan sepadan j-kelas ke.

Untuk mengira sisihan piawai daripada taburan kekerapan, ia juga diandaikan bahawa semua nilai dalam setiap kelas tertumpu pada titik tengah kelas.

Untuk memahami cara kuartil siri ditentukan berdasarkan frekuensi, pertimbangkan pengiraan kuartil bawah berdasarkan data untuk 2013 mengenai taburan penduduk Rusia mengikut purata pendapatan monetari per kapita (Rajah 12).

nasi. 12. Bahagian penduduk Rusia dengan purata pendapatan tunai per kapita sebulan, rubel

Untuk mengira kuartil pertama siri variasi selang, anda boleh menggunakan formula:

di mana Q1 ialah nilai kuartil pertama, xQ1 ialah had bawah selang yang mengandungi kuartil pertama (selang ditentukan oleh kekerapan terkumpul yang terlebih dahulu melebihi 25%); i – nilai selang; Σf – jumlah kekerapan keseluruhan sampel; mungkin sentiasa sama dengan 100%; SQ1–1 – kekerapan terkumpul selang sebelum selang yang mengandungi kuartil bawah; fQ1 – kekerapan selang yang mengandungi kuartil bawah. Formula untuk kuartil ketiga berbeza kerana di semua tempat anda perlu menggunakan Q3 dan bukannya Q1, dan gantikan ¾ dan bukannya ¼.

Dalam contoh kami (Rajah 12), kuartil bawah berada dalam julat 7000.1 – 10,000, kekerapan terkumpulnya ialah 26.4%. Had bawah selang ini ialah 7000 rubel, nilai selang ialah 3000 rubel, kekerapan terkumpul selang sebelum selang yang mengandungi kuartil bawah ialah 13.4%, kekerapan selang yang mengandungi kuartil bawah ialah 13.0%. Oleh itu: Q1 = 7000 + 3000 * (¼ * 100 – 13.4) / 13 = 9677 gosok.

Perangkap Berkaitan dengan Statistik Deskriptif

Dalam siaran ini, kami melihat cara untuk menerangkan set data menggunakan pelbagai statistik yang menilai min, sebaran dan pengedarannya. Langkah seterusnya ialah analisis dan tafsiran data. Sehingga kini, kami telah mengkaji sifat objektif data, dan kini kami beralih kepada tafsiran subjektif mereka. Penyelidik menghadapi dua kesilapan: subjek analisis yang salah dipilih dan tafsiran keputusan yang salah.

Analisis pulangan 15 dana bersama berisiko tinggi agak tidak berat sebelah. Dia membawa kepada kesimpulan objektif sepenuhnya: semua dana bersama mempunyai pulangan yang berbeza, sebaran pulangan dana berjulat dari -6.1 hingga 18.5, dan pulangan purata ialah 6.08. Objektiviti analisis data dipastikan pilihan yang tepat jumlah penunjuk kuantitatif taburan. Beberapa kaedah untuk menganggar min dan serakan data telah dipertimbangkan, dan kelebihan dan kekurangannya telah ditunjukkan. Bagaimana untuk memilih statistik yang betul yang memberikan analisis objektif dan saksama? Jika taburan data condong sedikit, patutkah anda memilih median dan bukannya min? Penunjuk manakah yang lebih tepat mencirikan penyebaran data: sisihan piawai atau julat? Patutkah kita nyatakan bahawa pengagihan adalah condong secara positif?

Sebaliknya, tafsiran data adalah proses subjektif. Orang yang berbeza membuat kesimpulan yang berbeza apabila mentafsir keputusan yang sama. Setiap orang ada pandangan masing-masing. Seseorang menganggap jumlah pulangan tahunan purata 15 dana dengan tahap risiko yang sangat tinggi adalah baik dan agak berpuas hati dengan pendapatan yang diterima. Orang lain mungkin merasakan bahawa dana ini mempunyai pulangan yang terlalu rendah. Oleh itu, subjektiviti harus diberi pampasan dengan kejujuran, berkecuali dan kejelasan kesimpulan.

Isu etika

Analisis data berkait rapat dengan isu etika. Anda harus bersikap kritis terhadap maklumat yang disebarkan oleh akhbar, radio, televisyen dan Internet. Dari masa ke masa, anda akan belajar untuk menjadi skeptikal bukan sahaja terhadap keputusan, tetapi juga matlamat, subjek dan objektiviti penyelidikan. Ahli politik British terkenal Benjamin Disraeli berkata yang terbaik: "Terdapat tiga jenis pembohongan: pembohongan, pembohongan terkutuk dan statistik."

Seperti yang dinyatakan dalam nota isu etika timbul apabila memilih keputusan untuk dibentangkan dalam laporan. Anda harus menerbitkan kedua-dua positif dan keputusan negatif. Selain itu, semasa membuat laporan atau laporan bertulis, keputusannya hendaklah dibentangkan secara jujur, neutral dan objektif. Terdapat perbezaan yang perlu dibuat antara pembentangan yang tidak berjaya dan tidak jujur. Untuk melakukan ini, adalah perlu untuk menentukan apakah niat penceramah itu. Kadangkala penutur mengetepikan maklumat penting kerana tidak tahu, dan kadangkala sengaja (contohnya, jika dia menggunakan min aritmetik untuk menganggarkan purata data yang condong dengan jelas untuk mendapatkan hasil yang diingini). Ia juga tidak jujur ​​untuk menindas keputusan yang tidak sesuai dengan pandangan penyelidik.

Bahan daripada buku Levin et al Statistik untuk Pengurus digunakan. – M.: Williams, 2004. – hlm. 178–209

Fungsi QUARTILE dibiarkan untuk digabungkan dengan lebih banyak lagi versi terdahulu Excel

Dalam proses pelbagai pengiraan dan bekerja dengan data, selalunya perlu untuk mengira nilai purata mereka. Ia dikira dengan menambah nombor dan membahagi jumlah keseluruhan dengan nombor mereka. Mari kita ketahui cara mengira purata set nombor menggunakan program Microsoft Excel dalam pelbagai cara.

Yang paling mudah dan kaedah yang diketahui Untuk mencari min aritmetik bagi set nombor adalah dengan menggunakan butang khas pada reben Microsoft Excel. Pilih julat nombor yang terletak dalam lajur atau baris dokumen. Semasa dalam tab "Rumah", klik pada butang "AutoSum", yang terletak pada reben dalam blok alat "Pengeditan". Daripada senarai juntai bawah, pilih "Purata".

Selepas ini, menggunakan fungsi "PURATA", pengiraan dibuat. Purata aritmetik dipaparkan dalam sel di bawah lajur yang dipilih, atau di sebelah kanan baris yang dipilih. set ini nombor.

Kaedah ini bagus untuk kesederhanaan dan kemudahannya. Tetapi ia juga mempunyai kelemahan yang ketara. Menggunakan kaedah ini, anda boleh mengira nilai purata hanya nombor yang disusun dalam satu baris dalam satu lajur atau dalam satu baris. Tetapi anda tidak boleh bekerja dengan tatasusunan sel, atau dengan sel bertaburan pada helaian, menggunakan kaedah ini.

Sebagai contoh, jika anda memilih dua lajur dan mengira min aritmetik menggunakan kaedah yang diterangkan di atas, jawapan akan diberikan untuk setiap lajur secara berasingan, dan bukan untuk keseluruhan tatasusunan sel.

Pengiraan menggunakan Wizard Fungsi

Untuk kes apabila anda perlu mengira purata aritmetik tatasusunan sel atau sel berselerak, anda boleh menggunakan Wizard Fungsi. Ia menggunakan fungsi "PURATA" yang sama, yang kami ketahui daripada kaedah pengiraan pertama, tetapi melakukannya dengan cara yang sedikit berbeza.

Klik pada sel di mana kita mahu hasil pengiraan nilai purata dipaparkan. Klik pada butang "Sisipkan Fungsi", yang terletak di sebelah kiri bar formula. Atau, taip gabungan Shift+F3 pada papan kekunci.

Wizard Fungsi bermula. Dalam senarai fungsi yang dibentangkan, cari "PURATA". Pilihnya dan klik pada butang "OK".

Tetingkap argumen untuk fungsi ini dibuka. Argumen fungsi dimasukkan ke dalam medan "Nombor". Ini boleh sama ada nombor biasa atau alamat sel tempat nombor ini berada. Jika anda tidak selesa memasukkan alamat sel secara manual, anda harus mengklik pada butang yang terletak di sebelah kanan medan kemasukan data.

Selepas ini, tetingkap argumen fungsi akan diminimumkan, dan anda akan dapat memilih kumpulan sel pada helaian yang anda ambil untuk pengiraan. Kemudian, klik sekali lagi pada butang di sebelah kiri medan kemasukan data untuk kembali ke tetingkap argumen fungsi.

Jika anda ingin mengira min aritmetik antara nombor yang terletak dalam kumpulan sel yang berasingan, kemudian lakukan tindakan yang sama yang dinyatakan di atas dalam medan "Nombor 2". Dan seterusnya sehingga semuanya kumpulan yang diperlukan tiada sel akan diserlahkan.

Selepas ini, klik pada butang "OK".

Hasil pengiraan min aritmetik akan diserlahkan dalam sel yang anda pilih sebelum melancarkan Wizard Fungsi.

Bar formula

Terdapat cara ketiga untuk melancarkan fungsi AVERAGE. Untuk melakukan ini, pergi ke tab "Formula". Pilih sel di mana hasilnya akan dipaparkan. Selepas itu, dalam kumpulan alat "Perpustakaan Fungsi" pada reben, klik pada butang "Fungsi Lain". Senarai muncul di mana anda perlu menyemak item "Statistik" dan "PURATA" secara berurutan.

Kemudian, tetingkap argumen fungsi yang sama dilancarkan seperti semasa menggunakan Wizard Fungsi, kerja yang kami terangkan secara terperinci di atas.

Tindakan selanjutnya adalah sama.

Kemasukan fungsi manual

Tetapi, jangan lupa bahawa anda sentiasa boleh memasukkan fungsi "PURATA" secara manual jika anda mahu. Ia akan mempunyai corak berikut: “=AVERAGE(alamat_julat_sel(nombor); alamat_julat_sel(nombor)).

Sudah tentu, kaedah ini tidak semudah yang sebelumnya, dan memerlukan pengguna untuk diingati formula tertentu, tetapi ia lebih fleksibel.

Pengiraan nilai purata mengikut syarat

Sebagai tambahan kepada pengiraan biasa nilai purata, adalah mungkin untuk mengira nilai purata mengikut keadaan. Dalam kes ini, hanya nombor daripada julat terpilih yang memenuhi syarat tertentu akan diambil kira. Contohnya, jika nombor ini lebih besar atau kurang daripada nilai tertentu.

Untuk tujuan ini, fungsi "AVERAGEIF" digunakan. Seperti fungsi AVERAGE, anda boleh melancarkannya melalui Function Wizard, dari bar formula atau dengan memasukkannya ke dalam sel secara manual. Selepas tetingkap argumen fungsi dibuka, anda perlu memasukkan parameternya. Dalam medan "Julat", masukkan julat sel yang nilainya akan mengambil bahagian dalam menentukan purata nombor aritmetik. Kami melakukan ini dengan cara yang sama seperti dengan fungsi "PURATA".

Tetapi dalam medan "Syarat" kita mesti menunjukkan nilai tertentu, nombor yang lebih besar atau kurang daripada yang akan mengambil bahagian dalam pengiraan. Ini boleh dilakukan menggunakan tanda perbandingan. Sebagai contoh, kami mengambil ungkapan ">=15000". Iaitu, hanya sel dalam julat yang mengandungi nombor lebih besar daripada atau sama dengan 15000 akan diambil untuk pengiraan Jika perlu, bukannya nombor tertentu, di sini anda boleh menentukan alamat sel di mana nombor yang sepadan terletak.

Medan "Julat purata" adalah pilihan. Memasukkan data ke dalamnya hanya diperlukan apabila menggunakan sel dengan kandungan teks.

Apabila semua data telah dimasukkan, klik pada butang "OK".

Selepas ini, hasil pengiraan purata aritmetik untuk julat yang dipilih dipaparkan dalam sel pra-pilihan, kecuali sel yang datanya tidak memenuhi syarat.

Seperti yang kita lihat, dalam program Microsoft Excel mempunyai beberapa alat yang boleh digunakan untuk mengira purata siri nombor yang dipilih. Selain itu, terdapat fungsi yang secara automatik memilih nombor daripada julat yang tidak memenuhi kriteria yang ditentukan pengguna. Ini menjadikan pengiraan dalam Microsoft Excel lebih mesra pengguna.