Biografi Ciri-ciri Analisis

Bagaimana untuk mengira formula min aritmetik. Cari jumlah indeks bekalan borong produk makanan dalam harga sebenar

Bagaimana untuk mengira purata nombor dalam Excel

Anda boleh mencari min aritmetik nombor dalam Excel menggunakan fungsi tersebut.

Sintaks PURATA

=PURATA(nombor1,[nombor2],…) - Versi Rusia

Hujah AVERAGE

  • nombor 1- nombor pertama atau julat nombor, untuk mengira min aritmetik;
  • nombor2(Pilihan) – nombor kedua atau julat nombor untuk mengira min aritmetik. Bilangan maksimum argumen fungsi ialah 255.

Untuk mengira, lakukan langkah berikut:

  • Pilih mana-mana sel;
  • Tulis formula di dalamnya =PURATA(
  • Pilih julat sel yang anda ingin buat pengiraan;
  • Tekan kekunci "Enter" pada papan kekunci

Fungsi ini akan mengira nilai purata dalam julat yang ditentukan antara sel yang mengandungi nombor.

Bagaimana untuk mencari nilai purata teks yang diberikan

Jika terdapat baris atau teks kosong dalam julat data, maka fungsi itu menganggapnya sebagai "sifar". Jika terdapat ungkapan logik FALSE atau TRUE antara data, maka fungsi tersebut menganggap FALSE sebagai "sifar", dan TRUE sebagai "1".

Bagaimana untuk mencari min aritmetik mengikut keadaan

Fungsi ini digunakan untuk mengira purata mengikut keadaan atau kriteria. Sebagai contoh, katakan kami mempunyai data jualan produk:

Tugas kami ialah mengira purata jualan pen. Untuk melakukan ini, kami akan mengambil langkah berikut:

  • Dalam sel A13 tulis nama produk "Pens";
  • Dalam sel B13 mari kita masukkan formula:

=PURATA(A2:A10,A13,B2:B10)

Julat sel " A2:A10” menunjuk pada senarai produk yang akan kami cari perkataan “Pens”. Hujah A13 ini ialah pautan ke sel dengan teks yang akan kami cari di antara keseluruhan senarai produk. Julat sel " B2:B10” ialah julat dengan data jualan produk, antaranya fungsi akan mencari “Pen” dan mengira nilai purata.


Untuk menganalisis dan mendapatkan kesimpulan statistik mengenai hasil ringkasan dan pengelompokan, penunjuk generalisasi dikira - nilai purata dan relatif.

Masalah purata - untuk mencirikan semua unit populasi statistik dengan satu nilai atribut.

Nilai purata mencirikan penunjuk kualitatif aktiviti keusahawanan: kos pengedaran, keuntungan, keuntungan, dll.

nilai purata- ini adalah ciri umum unit populasi mengikut beberapa atribut yang berbeza-beza.

Nilai purata membolehkan anda membandingkan tahap sifat yang sama dalam populasi yang berbeza dan mencari sebab percanggahan ini.

Dalam analisis fenomena yang dikaji, peranan nilai purata adalah sangat besar. Ahli ekonomi Inggeris W. Petty (1623-1687) menggunakan purata secara meluas. V. Petty ingin menggunakan nilai purata sebagai ukuran kos perbelanjaan pada purata sara hidup harian seorang pekerja. Kestabilan nilai purata adalah gambaran corak proses yang dikaji. Beliau percaya bahawa maklumat boleh diubah walaupun tidak ada data awal yang mencukupi.

Saintis Inggeris G. King (1648-1712) menggunakan nilai purata dan relatif semasa menganalisis data mengenai populasi England.

Perkembangan teori ahli statistik Belgium A. Quetelet (1796-1874) adalah berdasarkan ketidakkonsistenan sifat fenomena sosial - sangat stabil dalam jisim, tetapi semata-mata individu.

Menurut A. Quetelet, punca kekal bertindak dengan cara yang sama pada setiap fenomena yang dikaji dan menjadikan fenomena ini serupa antara satu sama lain, mewujudkan corak yang sama kepada kesemuanya.

Akibat daripada ajaran A. Quetelet adalah peruntukan nilai purata sebagai kaedah utama analisis statistik. Beliau berkata bahawa purata statistik bukanlah kategori realiti objektif.

A. Quetelet menyatakan pandangannya tentang purata dalam teorinya tentang orang biasa. Orang biasa ialah orang yang mempunyai semua kualiti dalam saiz purata (purata kadar kematian atau kelahiran, purata ketinggian dan berat, purata kelajuan larian, purata kecenderungan untuk berkahwin dan membunuh diri, untuk perbuatan baik, dsb.). Bagi A. Quetelet, orang biasa adalah ideal seseorang. Ketidakkonsistenan teori A. Quetelet tentang manusia biasa telah dibuktikan dalam kesusasteraan statistik Rusia pada akhir abad ke-19-20.

Ahli statistik Rusia yang terkenal Yu. E. Yanson (1835-1893) menulis bahawa A. Quetelet menganggap kewujudan dalam sifat jenis orang biasa sebagai sesuatu yang diberikan, dari mana kehidupan telah menolak orang biasa dalam masyarakat tertentu dan masa tertentu, dan ini membawanya kepada pandangan mekanikal sepenuhnya tentang undang-undang pergerakan kehidupan sosial: gerakan adalah peningkatan beransur-ansur dalam sifat purata seseorang, pemulihan beransur-ansur jenis; akibatnya, seperti meratakan semua manifestasi kehidupan badan sosial, di mana sebarang pergerakan ke hadapan terhenti.

Intipati teori ini telah menemui perkembangan selanjutnya dalam karya beberapa ahli teori statistik sebagai teori nilai sebenar. A. Quetelet mempunyai pengikut - ahli ekonomi dan statistik Jerman W. Lexis (1837-1914), yang memindahkan teori nilai sebenar kepada fenomena ekonomi kehidupan sosial. Teori beliau dikenali sebagai teori kestabilan. Satu lagi versi teori purata idealistik adalah berdasarkan falsafah

Pengasasnya ialah ahli statistik Inggeris A. Bowley (1869–1957), salah seorang ahli teori yang paling menonjol pada zaman moden dalam bidang teori purata. Konsep purata beliau digariskan dalam buku "Elemen Statistik".

A. Bowley menganggap purata hanya dari segi kuantitatif, dengan itu memisahkan kuantiti daripada kualiti. Menentukan makna nilai purata (atau "fungsi mereka"), A. Bowley mengemukakan prinsip pemikiran Machist. A. Bowley menulis bahawa fungsi purata harus menyatakan kumpulan kompleks

dengan beberapa nombor perdana. Data statistik harus dipermudahkan, dikumpulkan dan dipuratakan. Pandangan ini dikongsi oleh R. Fisher (1890-1968), J. Yule (1871-1951), Frederick S. Mills (1892), dan lain-lain.

Dalam 30-an. abad ke-20 dan tahun-tahun berikutnya, nilai purata dianggap sebagai ciri penting dari segi sosial, kandungan maklumat yang bergantung pada kehomogenan data.

Wakil yang paling menonjol dari sekolah Itali R. Benini (1862-1956) dan C. Gini (1884-1965), menganggap statistik sebagai cabang logik, memperluaskan skop induksi statistik, tetapi mereka mengaitkan prinsip kognitif logik dan statistik dengan sifat fenomena yang dikaji, mengikut tradisi tafsiran sosiologi statistik.

Dalam karya K. Marx dan V. I. Lenin, peranan khas diberikan kepada nilai purata.

K. Marx berhujah bahawa sisihan individu dari tahap umum dibatalkan dalam nilai purata dan tahap purata menjadi ciri umum fenomena jisim. Nilai purata menjadi ciri fenomena jisim hanya jika sejumlah besar unit diambil. dan unit-unit ini adalah homogen secara kualitatif. Marx menulis bahawa nilai purata yang ditemui ialah purata "... banyak nilai individu yang berbeza dari jenis yang sama."

Nilai purata memperoleh kepentingan istimewa dalam ekonomi pasaran. Ia membantu untuk menentukan perlu dan umum, trend undang-undang pembangunan ekonomi secara langsung melalui individu dan rawak.

Nilai purata adalah penunjuk generalisasi di mana tindakan keadaan umum, keteraturan fenomena yang dikaji dinyatakan.

Purata statistik dikira berdasarkan data jisim pemerhatian jisim tersusun dengan betul secara statistik. Jika purata statistik dikira daripada data jisim untuk populasi homogen secara kualitatif (fenomena jisim), maka ia akan menjadi objektif.

Nilai purata adalah abstrak, kerana ia mencirikan nilai unit abstrak.

Purata disarikan daripada kepelbagaian ciri dalam objek individu. Abstraksi adalah peringkat penyelidikan saintifik. Kesatuan dialektik individu dan umum direalisasikan dalam nilai purata.

Nilai purata hendaklah digunakan berdasarkan pemahaman dialektik bagi kategori individu dan umum, individu dan jisim.

Bahagian tengah mencerminkan sesuatu yang sama yang dijumlahkan dalam objek tunggal tertentu.

Untuk mengenal pasti corak dalam proses sosial massa, nilai purata adalah sangat penting.

Penyimpangan individu daripada umum adalah manifestasi proses pembangunan.

Nilai purata mencerminkan ciri, tipikal, tahap sebenar fenomena yang dikaji. Tujuan purata adalah untuk mencirikan tahap ini dan perubahannya dalam masa dan ruang.

Penunjuk purata adalah nilai biasa, kerana ia terbentuk dalam keadaan normal, semula jadi, umum untuk kewujudan fenomena jisim tertentu, dianggap sebagai keseluruhan.

Sifat objektif proses atau fenomena statistik mencerminkan nilai purata.

Nilai individu ciri statistik yang dikaji adalah berbeza untuk setiap unit populasi. Nilai purata nilai individu bagi satu jenis adalah produk keperluan, yang merupakan hasil daripada tindakan kumulatif semua unit populasi, yang ditunjukkan dalam banyak kemalangan berulang.

Sesetengah fenomena individu mempunyai tanda-tanda yang wujud dalam semua fenomena, tetapi dalam kuantiti yang berbeza - ini adalah ketinggian atau umur seseorang. Tanda-tanda lain bagi fenomena individu secara kualitatif berbeza dalam fenomena yang berbeza, iaitu, mereka hadir dalam beberapa dan tidak diperhatikan pada orang lain (seorang lelaki tidak akan menjadi seorang wanita). Nilai purata dikira untuk tanda yang secara kualitatif homogen dan berbeza hanya secara kuantitatif, yang wujud dalam semua fenomena dalam set tertentu.

Nilai purata adalah cerminan nilai sifat yang sedang dikaji dan diukur dalam dimensi yang sama dengan sifat ini.

Teori materialisme dialektik mengajar bahawa segala sesuatu di dunia berubah dan berkembang. Dan juga tanda-tanda yang dicirikan oleh nilai purata berubah, dan, dengan itu, purata itu sendiri.

Kehidupan adalah proses berterusan untuk mencipta sesuatu yang baru. Pembawa kualiti baru adalah objek tunggal, maka bilangan objek ini meningkat, dan yang baru menjadi jisim, tipikal.

Nilai purata mencirikan populasi yang dikaji hanya pada satu asas. Untuk pembentangan lengkap dan komprehensif populasi yang dikaji untuk beberapa ciri khusus, adalah perlu untuk mempunyai sistem nilai purata yang boleh menggambarkan fenomena dari sudut yang berbeza.

2. Jenis-jenis purata

Dalam pemprosesan statistik bahan, pelbagai masalah timbul yang perlu diselesaikan, dan oleh itu pelbagai nilai purata digunakan dalam amalan statistik. Statistik matematik menggunakan pelbagai purata, seperti: purata aritmetik; min geometri; purata harmonik; punca purata kuasa dua.

Untuk menerapkan salah satu jenis purata di atas, adalah perlu untuk menganalisis populasi yang dikaji, menentukan kandungan material fenomena yang dikaji, semua ini dilakukan berdasarkan kesimpulan yang diperoleh daripada prinsip kebermaknaan hasil. semasa menimbang atau menjumlahkan.

Dalam kajian purata, penunjuk dan tatatanda berikut digunakan.

Kriteria di mana purata ditemui dipanggil ciri purata dan dilambangkan dengan x; nilai ciri purata bagi mana-mana unit populasi statistik dipanggil makna individunya atau pilihan, dan dilambangkan sebagai x 1 , X 2 , x 3 ,… X P ; kekerapan ialah kebolehulangan nilai individu bagi sesuatu sifat, yang dilambangkan dengan huruf f.

Min aritmetik

Salah satu jenis medium yang paling biasa min aritmetik, yang dikira apabila isipadu atribut purata dibentuk sebagai jumlah nilainya untuk unit individu populasi statistik yang dikaji.

Untuk mengira min aritmetik, jumlah semua peringkat ciri dibahagikan dengan nombornya.


Jika beberapa pilihan berlaku beberapa kali, maka jumlah peringkat atribut boleh diperolehi dengan mendarab setiap peringkat dengan bilangan unit populasi yang sepadan, diikuti dengan penambahan produk yang terhasil, min aritmetik yang dikira dengan cara ini dipanggil aritmetik berwajaran bermakna.

Formula bagi min aritmetik berwajaran adalah seperti berikut:


di mana x i adalah pilihan,

f i - frekuensi atau berat.

Purata wajaran harus digunakan dalam semua kes di mana varian mempunyai kelimpahan yang berbeza.

Purata aritmetik, seolah-olah, mengagihkan sama rata antara objek individu jumlah nilai atribut, yang sebenarnya berbeza-beza untuk setiap objek.

Pengiraan nilai purata dijalankan mengikut data yang dikumpulkan dalam bentuk siri taburan selang, apabila varian sifat dari mana purata dikira dibentangkan dalam bentuk selang (dari - hingga).

Sifat aritmetik min:

1) min aritmetik hasil tambah nilai yang berbeza-beza adalah sama dengan hasil tambah bermakna aritmetik: Jika x i = y i + z i , maka


Sifat ini menunjukkan dalam kes yang mana adalah mungkin untuk meringkaskan nilai purata.

2) jumlah algebra bagi sisihan nilai individu ciri pembolehubah dari min adalah sama dengan sifar, kerana jumlah sisihan dalam satu arah diimbangi oleh jumlah sisihan ke arah yang lain:


Peraturan ini menunjukkan bahawa min ialah paduan.

3) jika semua varian siri ditambah atau dikurangkan dengan nombor yang sama?, maka purata akan meningkat atau berkurangan dengan nombor yang sama?:


4) jika semua varian siri itu dinaikkan atau dikurangkan sebanyak A kali, maka purata juga akan meningkat atau menurun sebanyak A kali:


5) sifat kelima purata menunjukkan kepada kita bahawa ia tidak bergantung pada saiz berat, tetapi bergantung pada nisbah antara mereka. Sebagai pemberat, bukan sahaja relatif, tetapi juga nilai mutlak boleh diambil.

Jika semua frekuensi siri dibahagikan atau didarab dengan nombor yang sama d, maka purata tidak akan berubah.


Purata harmonik. Untuk menentukan min aritmetik, adalah perlu untuk mempunyai beberapa pilihan dan frekuensi, iaitu, nilai X dan f.

Katakan kita tahu nilai individu ciri tersebut X dan berfungsi X/, dan frekuensi f tidak diketahui, maka, untuk mengira purata, kami menandakan hasil = X/; di mana:



Purata dalam bentuk ini dipanggil purata wajaran harmonik dan dilambangkan x membahayakan. vzvv.

Sehubungan itu, min harmonik adalah sama dengan min aritmetik. Ia terpakai apabila berat sebenar tidak diketahui. f, dan produk diketahui fx = z

Apabila kerja-kerja fx sama atau sama dengan satu (m = 1), min ringkas harmonik digunakan, dikira dengan formula:


di mana X- pilihan berasingan;

n- nombor.

Purata geometri

Jika terdapat n faktor pertumbuhan, maka formula bagi pekali purata ialah:


Ini ialah formula min geometri.

Purata geometri adalah sama dengan punca darjah n daripada produk pekali pertumbuhan yang mencirikan nisbah nilai setiap tempoh berikutnya kepada nilai yang sebelumnya.

Jika nilai yang dinyatakan sebagai fungsi segi empat sama tertakluk kepada purata, punca purata kuasa dua digunakan. Sebagai contoh, menggunakan kuasa dua min akar, anda boleh menentukan diameter paip, roda, dsb.

Purata kuasa dua ringkas ditentukan dengan mengambil punca kuasa dua hasil bagi daripada membahagikan jumlah kuasa dua nilai ciri individu dengan nombornya.


Purata berwajaran min kuasa dua ialah:

3. Purata struktur. Mod dan median

Untuk mencirikan struktur populasi statistik, penunjuk digunakan yang dipanggil purata struktur. Ini termasuk mod dan median.

Fesyen (M kira-kira ) - pilihan yang paling biasa. Fesyen nilai ciri dipanggil, yang sepadan dengan titik maksimum keluk taburan teori.

Mod mewakili nilai yang paling kerap berlaku atau biasa.

Fesyen digunakan dalam amalan komersial untuk mengkaji permintaan pengguna dan merekodkan harga.

Dalam siri diskret, mod ialah varian dengan frekuensi tertinggi. Dalam siri variasi selang, varian tengah selang, yang mempunyai frekuensi tertinggi (kekhususan), dianggap sebagai mod.

Dalam selang waktu, adalah perlu untuk mencari nilai atribut, iaitu mod.


di mana X kira-kira ialah had bawah selang modal;

h ialah nilai selang modal;

fm ialah kekerapan selang modal;

f t-1 - kekerapan selang sebelum modal;

fm+1 ialah kekerapan selang berikutan modal.

Mod bergantung pada saiz kumpulan, pada kedudukan tepat sempadan kumpulan.

Fesyen- nombor yang paling kerap berlaku (adalah nilai tertentu), dalam praktiknya ia mempunyai aplikasi terluas (jenis pembeli yang paling biasa).

Median (M e- ini ialah nilai yang membahagikan bilangan siri variasi tertib kepada dua bahagian yang sama: satu bahagian mempunyai nilai ciri yang berbeza-beza yang lebih kecil daripada varian purata, dan satu lagi adalah besar.

Median ialah unsur yang lebih besar daripada atau sama dengan dan pada masa yang sama kurang daripada atau sama dengan separuh daripada unsur-unsur yang tinggal dalam siri taburan.

Sifat median ialah jumlah sisihan mutlak nilai sifat daripada median adalah kurang daripada nilai lain.

Menggunakan median membolehkan anda mendapatkan hasil yang lebih tepat daripada menggunakan bentuk purata lain.

Urutan mencari median dalam siri variasi selang adalah seperti berikut: kami menyusun nilai individu atribut mengikut pangkat; tentukan frekuensi terkumpul untuk siri kedudukan ini; mengikut frekuensi terkumpul, kita dapati selang median:


di mana x saya ialah had bawah selang median;

i saya ialah nilai selang median;

f/2 ialah jumlah separuh daripada frekuensi siri itu;

S saya-1 ialah jumlah kekerapan terkumpul sebelum selang median;

f saya ialah kekerapan selang median.

Median membahagikan bilangan baris kepada separuh, oleh itu, di mana kekerapan terkumpul adalah separuh atau lebih daripada separuh daripada jumlah bilangan frekuensi, dan kekerapan sebelumnya (kumulatif) adalah kurang daripada separuh populasi.

Dalam kebanyakan kes, data tertumpu di sekitar beberapa titik pusat. Oleh itu, untuk menerangkan sebarang set data, sudah cukup untuk menunjukkan nilai purata. Pertimbangkan berturut-turut tiga ciri berangka yang digunakan untuk menganggar nilai min taburan: min aritmetik, median dan mod.

Purata

Min aritmetik (selalunya dirujuk sebagai min) ialah anggaran paling biasa bagi min bagi sesuatu taburan. Ia adalah hasil daripada membahagikan jumlah semua nilai berangka yang diperhatikan dengan nombor mereka. Untuk sampel nombor X 1, X 2, ..., Xn, min sampel (ditandakan dengan simbol ) sama \u003d (X 1 + X 2 + ... + Xn) / n, atau

di manakah min sampel, n- saiz sampel, Xi– unsur ke-i bagi sampel.

Muat turun nota dalam atau format, contoh dalam format

Pertimbangkan untuk mengira purata aritmetik pulangan tahunan purata lima tahun bagi 15 dana bersama yang sangat berisiko tinggi (Rajah 1).

nasi. 1. Purata pulangan tahunan bagi 15 dana bersama berisiko tinggi

Purata sampel dikira seperti berikut:

Ini adalah pulangan yang baik, terutamanya jika dibandingkan dengan pulangan 3-4% yang diterima oleh pendeposit bank atau kesatuan kredit dalam tempoh masa yang sama. Jika anda mengisih nilai pulangan, adalah mudah untuk melihat bahawa lapan dana mempunyai pulangan di atas, dan tujuh - di bawah purata. Purata aritmetik bertindak sebagai titik imbangan, supaya dana berpendapatan rendah mengimbangi dana berpendapatan tinggi. Semua elemen sampel terlibat dalam pengiraan purata. Tiada penganggar lain bagi min taburan mempunyai sifat ini.

Bila hendak mengira min aritmetik. Memandangkan min aritmetik bergantung pada semua elemen sampel, kehadiran nilai ekstrem memberi kesan yang ketara kepada hasilnya. Dalam situasi sedemikian, min aritmetik boleh memesongkan maksud data berangka. Oleh itu, apabila menerangkan set data yang mengandungi nilai ekstrem, adalah perlu untuk menunjukkan median atau min aritmetik dan median. Sebagai contoh, jika pulangan dana RS Emerging Growth dikeluarkan daripada sampel, purata sampel pulangan 14 dana berkurangan hampir 1% kepada 5.19%.

Median

Median ialah nilai tengah bagi tatasusunan nombor. Jika tatasusunan tidak mengandungi nombor berulang, maka separuh daripada elemennya akan kurang daripada dan separuh lebih daripada median. Jika sampel mengandungi nilai ekstrem, adalah lebih baik menggunakan median daripada min aritmetik untuk menganggarkan min. Untuk mengira median sampel, ia mesti diisih terlebih dahulu.

Formula ini adalah samar-samar. Keputusannya bergantung kepada sama ada nombor itu genap atau ganjil. n:

  • Jika sampel mengandungi bilangan item ganjil, median ialah (n+1)/2-elemen ke.
  • Jika sampel mengandungi bilangan elemen genap, median terletak di antara dua elemen tengah sampel dan adalah sama dengan min aritmetik yang dikira ke atas kedua-dua elemen ini.

Untuk mengira median bagi sampel 15 dana bersama yang sangat berisiko tinggi, kita perlu mengisih data mentah terlebih dahulu (Rajah 2). Kemudian median akan bertentangan dengan nombor unsur tengah sampel; dalam contoh nombor 8 kami. Excel mempunyai fungsi khas =MEDIAN() yang berfungsi dengan tatasusunan tidak tertib juga.

nasi. 2. Median 15 dana

Oleh itu, median ialah 6.5. Ini bermakna separuh daripada dana yang sangat berisiko tinggi tidak melebihi 6.5, manakala separuh lagi berbuat demikian. Ambil perhatian bahawa median 6.5 adalah lebih besar sedikit daripada median 6.08.

Jika kita mengeluarkan keuntungan dana RS Emerging Growth daripada sampel, maka median baki 14 dana akan berkurangan kepada 6.2%, iaitu, tidak begitu ketara seperti min aritmetik (Rajah 3).

nasi. 3. Median 14 dana

Fesyen

Istilah ini pertama kali diperkenalkan oleh Pearson pada tahun 1894. Fesyen ialah nombor yang paling kerap berlaku dalam sampel (yang paling bergaya). Fesyen menerangkan dengan baik, sebagai contoh, reaksi tipikal pemandu terhadap isyarat lalu lintas untuk menghentikan lalu lintas. Contoh klasik penggunaan fesyen ialah pilihan saiz kumpulan kasut yang dihasilkan atau warna kertas dinding. Jika pengedaran mempunyai berbilang mod, maka ia dikatakan multimodal atau multimodal (mempunyai dua atau lebih "puncak"). Taburan multimodal menyediakan maklumat penting tentang sifat pembolehubah yang dikaji. Sebagai contoh, dalam tinjauan sosiologi, jika pembolehubah mewakili keutamaan atau sikap terhadap sesuatu, maka multimodaliti boleh bermakna terdapat beberapa pendapat yang berbeza. Multimodaliti juga merupakan penunjuk bahawa sampel tidak homogen dan pemerhatian mungkin dihasilkan oleh dua atau lebih taburan "bertindih". Tidak seperti min aritmetik, outlier tidak menjejaskan mod. Untuk pembolehubah rawak yang diedarkan secara berterusan, seperti purata pulangan tahunan bagi dana bersama, mod kadangkala tidak wujud sama sekali (atau tidak masuk akal). Oleh kerana penunjuk ini boleh mengambil pelbagai nilai, nilai berulang adalah sangat jarang berlaku.

Kuartil

Kuartil ialah ukuran yang paling biasa digunakan untuk menilai taburan data apabila menerangkan sifat sampel berangka yang besar. Walaupun median membahagikan tatasusunan tertib kepada separuh (50% daripada elemen tatasusunan adalah kurang daripada median dan 50% lebih besar), kuartil memecahkan set data tersusun kepada empat bahagian. Nilai Q 1 , median dan Q 3 masing-masing ialah persentil ke-25, ke-50 dan ke-75. Kuartil pertama Q 1 ialah nombor yang membahagikan sampel kepada dua bahagian: 25% unsur kurang daripada, dan 75% lebih daripada kuartil pertama.

Kuartil ketiga Q 3 ialah nombor yang turut membahagikan sampel kepada dua bahagian: 75% unsur adalah kurang daripada, dan 25% lebih daripada kuartil ketiga.

Untuk mengira kuartil dalam versi Excel sebelum 2007, fungsi =QUARTILE(array, part) telah digunakan. Bermula dengan Excel 2010, dua fungsi digunakan:

  • =QUARTILE.ON(array, part)
  • =QUARTILE.EXC(susun, bahagian)

Kedua-dua fungsi ini memberikan nilai yang sedikit berbeza (Rajah 4). Contohnya, apabila mengira kuartil sampel yang mengandungi data pada purata pulangan tahunan 15 dana bersama berisiko tinggi, Q 1 = 1.8 atau -0.7 untuk QUARTILE.INC dan QUARTILE.EXC, masing-masing. Sebenarnya, fungsi QUARTILE yang digunakan sebelum ini sepadan dengan fungsi QUARTILE.ON moden. Untuk mengira kuartil dalam Excel menggunakan formula di atas, tatasusunan data boleh dibiarkan tanpa tertib.

nasi. 4. Kira kuartil dalam Excel

Mari kita tekankan lagi. Excel boleh mengira kuartil untuk univariat siri diskret, yang mengandungi nilai pembolehubah rawak. Pengiraan kuartil untuk taburan berasaskan frekuensi diberikan dalam bahagian di bawah.

min geometri

Tidak seperti min aritmetik, min geometri mengukur berapa banyak pembolehubah telah berubah dari semasa ke semasa. Purata geometri ialah punca n ijazah ke- dari produk n nilai (dalam Excel, fungsi = CUGEOM digunakan):

G= (X 1 * X 2 * ... * X n) 1/n

Parameter yang serupa - min geometri bagi kadar pulangan - ditentukan oleh formula:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

di mana R i- kadar pulangan i-tempoh masa ke.

Sebagai contoh, katakan pelaburan awal ialah $100,000. Menjelang akhir tahun pertama, ia turun kepada $50,000, dan menjelang akhir tahun kedua, ia pulih kepada $100,000 asal. Kadar pulangan pelaburan ini selama dua- tempoh tahun adalah sama dengan 0, kerana jumlah awal dan akhir dana adalah sama antara satu sama lain. Walau bagaimanapun, purata aritmetik kadar pulangan tahunan ialah = (-0.5 + 1) / 2 = 0.25 atau 25%, kerana kadar pulangan pada tahun pertama R 1 = (50,000 - 100,000) / 100,000 = -0.5 , dan dalam R 2 kedua = (100,000 - 50,000) / 50,000 = 1. Pada masa yang sama, min geometri bagi kadar pulangan untuk dua tahun ialah: G = [(1–0.5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Oleh itu, min geometri lebih tepat menggambarkan perubahan (lebih tepat lagi, ketiadaan perubahan) dalam isipadu pelaburan sepanjang biennium daripada min aritmetik.

Fakta menarik. Pertama, min geometri akan sentiasa kurang daripada min aritmetik nombor yang sama. Kecuali untuk kes apabila semua nombor yang diambil adalah sama antara satu sama lain. Kedua, setelah mempertimbangkan sifat segi tiga tepat, seseorang boleh memahami mengapa min dipanggil geometri. Ketinggian segi tiga bersudut tegak, diturunkan kepada hipotenus, ialah purata berkadar antara unjuran kaki pada hipotenus, dan setiap kaki ialah berkadar purata antara hipotenus dan unjurannya pada hipotenus (Rajah 5). Ini memberikan cara geometri untuk membina min geometri bagi dua (panjang) segmen: anda perlu membina bulatan pada jumlah kedua-dua segmen ini sebagai diameter, kemudian ketinggian, dipulihkan dari titik sambungannya ke persimpangan dengan bulatan, akan memberikan nilai yang diperlukan:

nasi. 5. Sifat geometri min geometri (rajah dari Wikipedia)

Sifat penting kedua data berangka ialah mereka variasi mencirikan tahap serakan data. Dua sampel berbeza boleh berbeza dalam nilai min dan dalam variasi. Walau bagaimanapun, seperti yang ditunjukkan dalam rajah. 6 dan 7, dua sampel boleh mempunyai variasi yang sama tetapi cara yang berbeza, atau min yang sama dan variasi yang sama sekali berbeza. Data yang sepadan dengan poligon B dalam Rajah. 7 berubah lebih kurang daripada data yang poligon A dibina.

nasi. 6. Dua taburan berbentuk loceng simetri dengan hamparan yang sama dan nilai min yang berbeza

nasi. 7. Dua taburan berbentuk loceng simetri dengan nilai min yang sama dan serakan yang berbeza

Terdapat lima anggaran variasi data:

  • rentang,
  • julat antara kuartil,
  • penyebaran,
  • sisihan piawai,
  • pekali variasi.

skop

Julat ialah perbezaan antara elemen terbesar dan terkecil sampel:

Leret = XMax-XMin

Julat sampel yang mengandungi purata pulangan tahunan 15 dana bersama berisiko tinggi boleh dikira menggunakan tatasusunan tertib (lihat Rajah 4): julat = 18.5 - (-6.1) = 24.6. Ini bermakna perbezaan antara pulangan tahunan purata tertinggi dan terendah untuk dana berisiko tinggi ialah 24.6%.

Julat mengukur penyebaran keseluruhan data. Walaupun julat sampel adalah anggaran yang sangat mudah bagi jumlah penyebaran data, kelemahannya ialah ia tidak mengambil kira dengan tepat cara data diedarkan antara elemen minimum dan maksimum. Kesan ini dilihat dengan baik dalam Rajah. 8 yang menggambarkan sampel yang mempunyai julat yang sama. Skala B menunjukkan bahawa jika sampel mengandungi sekurang-kurangnya satu nilai ekstrem, julat sampel adalah anggaran yang sangat tidak tepat bagi serakan data.

nasi. 8. Perbandingan tiga sampel dengan julat yang sama; segi tiga melambangkan sokongan baki, dan lokasinya sepadan dengan nilai purata sampel

Julat antara kuartil

Julat antara kuartil, atau min, ialah perbezaan antara kuartil ketiga dan pertama sampel:

Julat antara kuartil \u003d Q 3 - Q 1

Nilai ini memungkinkan untuk menganggarkan penyebaran 50% unsur dan tidak mengambil kira pengaruh unsur ekstrem. Julat antara kuartil untuk sampel yang mengandungi data mengenai pulangan tahunan purata 15 dana bersama yang sangat berisiko tinggi boleh dikira menggunakan data dalam Rajah. 4 (contohnya, untuk fungsi QUARTILE.EXC): Julat antara kuartil = 9.8 - (-0.7) = 10.5. Selang antara 9.8 dan -0.7 sering dirujuk sebagai separuh pertengahan.

Perlu diingatkan bahawa nilai Q 1 dan Q 3, dan oleh itu julat antara kuartil, tidak bergantung pada kehadiran outlier, kerana pengiraannya tidak mengambil kira sebarang nilai yang akan kurang daripada Q 1 atau lebih besar daripada Q 3 . Jumlah ciri kuantitatif, seperti median, kuartil pertama dan ketiga, dan julat antara kuartil, yang tidak dipengaruhi oleh outlier, dipanggil penunjuk teguh.

Walaupun julat dan julat antara kuartil masing-masing memberikan anggaran jumlah dan min serakan sampel, kedua-dua anggaran ini tidak mengambil kira dengan tepat cara data diedarkan. Varians dan sisihan piawai bebas daripada kekurangan ini. Penunjuk ini membolehkan anda menilai tahap turun naik data di sekitar min. Varians sampel ialah anggaran min aritmetik yang dikira daripada perbezaan kuasa dua antara setiap elemen sampel dan min sampel. Untuk sampel X 1 , X 2 , ... X n varians sampel (ditandakan dengan simbol S 2 diberikan oleh formula berikut:

Secara umum, varians sampel ialah jumlah perbezaan kuasa dua antara elemen sampel dan min sampel, dibahagikan dengan nilai yang sama dengan saiz sampel tolak satu:

di mana - min aritmetik, n- saiz sampel, X i - i-elemen sampel ke- X. Dalam Excel sebelum versi 2007, fungsi =VAR() telah digunakan untuk mengira varians sampel, sejak versi 2010, fungsi =VAR.V() digunakan.

Anggaran serakan data yang paling praktikal dan diterima secara meluas ialah sisihan piawai. Penunjuk ini dilambangkan dengan simbol S dan sama dengan punca kuasa dua varians sampel:

Dalam Excel sebelum versi 2007, fungsi =STDEV() digunakan untuk mengira sisihan piawai, dari versi 2010 fungsi =STDEV.V() digunakan. Untuk mengira fungsi ini, tatasusunan data boleh tidak tertib.

Baik varians sampel mahupun sisihan piawai sampel tidak boleh negatif. Satu-satunya keadaan di mana penunjuk S 2 dan S boleh menjadi sifar adalah jika semua elemen sampel adalah sama. Dalam kes yang sangat mustahil ini, julat dan julat antara kuartil juga adalah sifar.

Data berangka sememangnya tidak menentu. Mana-mana pembolehubah boleh mengambil banyak nilai yang berbeza. Sebagai contoh, dana bersama yang berbeza mempunyai kadar pulangan dan kerugian yang berbeza. Oleh kerana kebolehubahan data berangka, adalah sangat penting untuk mengkaji bukan sahaja anggaran min, yang bersifat sumatif, tetapi juga anggaran varians, yang mencirikan serakan data.

Varians dan sisihan piawai membolehkan kami menganggarkan penyebaran data di sekitar min, dengan kata lain, untuk menentukan berapa banyak elemen sampel yang kurang daripada min, dan berapa banyak yang lebih besar. Penyerakan mempunyai beberapa sifat matematik yang berharga. Walau bagaimanapun, nilainya ialah kuasa dua unit ukuran - peratusan persegi, dolar persegi, inci persegi, dsb. Oleh itu, anggaran semula jadi bagi varians ialah sisihan piawai, yang dinyatakan dalam unit ukuran biasa - peratus pendapatan, dolar atau inci.

Sisihan piawai membolehkan anda menganggarkan jumlah turun naik unsur sampel di sekitar nilai min. Dalam hampir semua situasi, majoriti nilai yang diperhatikan terletak dalam tambah atau tolak satu sisihan piawai daripada min. Oleh itu, mengetahui min aritmetik unsur sampel dan sisihan sampel piawai, adalah mungkin untuk menentukan selang yang sebahagian besar data dimiliki.

Sisihan piawai pulangan ke atas 15 dana bersama berisiko tinggi ialah 6.6 (Rajah 9). Ini bermakna bahawa keuntungan sebahagian besar dana berbeza daripada nilai purata tidak lebih daripada 6.6% (iaitu, ia turun naik dalam julat dari – S= 6.2 – 6.6 = –0.4 hingga +S= 12.8). Malah, selang ini mengandungi purata pulangan tahunan lima tahun sebanyak 53.3% (8 daripada 15) dana.

nasi. 9. Sisihan piawai

Ambil perhatian bahawa dalam proses menjumlahkan perbezaan kuasa dua, item yang lebih jauh dari min mendapat lebih berat daripada item yang lebih dekat. Sifat ini ialah sebab utama mengapa min aritmetik paling kerap digunakan untuk menganggarkan min taburan.

Pekali variasi

Tidak seperti anggaran serakan sebelumnya, pekali variasi ialah anggaran relatif. Ia sentiasa diukur sebagai peratusan, bukan dalam unit data asal. Pekali variasi, yang dilambangkan dengan simbol CV, mengukur serakan data di sekitar min. Pekali variasi adalah sama dengan sisihan piawai dibahagikan dengan min aritmetik dan didarab dengan 100%:

di mana S- sisihan sampel piawai, - min sampel.

Pekali variasi membolehkan anda membandingkan dua sampel, unsur-unsurnya dinyatakan dalam unit ukuran yang berbeza. Sebagai contoh, pengurus perkhidmatan penghantaran mel berhasrat untuk menaik taraf kumpulan trak. Semasa memuatkan pakej, terdapat dua jenis sekatan yang perlu dipertimbangkan: berat (dalam paun) dan isipadu (dalam kaki padu) setiap bungkusan. Andaikan bahawa dalam sampel 200 beg, berat purata ialah 26.0 paun, sisihan piawai berat ialah 3.9 paun, purata isipadu pakej ialah 8.8 kaki padu, dan sisihan piawai isipadu ialah 2.2 kaki padu. Bagaimana untuk membandingkan penyebaran berat dan isipadu bungkusan?

Memandangkan unit ukuran untuk berat dan isipadu berbeza antara satu sama lain, pengurus mesti membandingkan sebaran relatif nilai ini. Pekali variasi berat ialah CV W = 3.9 / 26.0 * 100% = 15%, dan pekali variasi volum CV V = 2.2 / 8.8 * 100% = 25% . Oleh itu, serakan relatif isipadu paket adalah lebih besar daripada serakan relatif beratnya.

Borang pengedaran

Sifat penting ketiga bagi sampel ialah bentuk pengedarannya. Taburan ini boleh menjadi simetri atau tidak simetri. Untuk menerangkan bentuk taburan, adalah perlu untuk mengira min dan mediannya. Jika kedua-dua ukuran ini adalah sama, pembolehubah dikatakan bertaburan simetri. Jika nilai min pembolehubah lebih besar daripada median, taburannya mempunyai kecondongan positif (Rajah 10). Jika median lebih besar daripada min, taburan pembolehubah adalah condong secara negatif. Kecondongan positif berlaku apabila min meningkat kepada nilai yang luar biasa tinggi. Kecondongan negatif berlaku apabila min menurun kepada nilai luar biasa kecil. Pembolehubah diagihkan secara simetri jika ia tidak mengambil sebarang nilai ekstrem dalam mana-mana arah, sehingga nilai besar dan kecil pembolehubah membatalkan satu sama lain.

nasi. 10. Tiga jenis pengagihan

Data yang digambarkan pada skala A mempunyai kecondongan negatif. Angka ini menunjukkan ekor yang panjang dan condong ke kiri yang disebabkan oleh nilai yang luar biasa kecil. Nilai yang sangat kecil ini mengalihkan nilai min ke kiri, dan ia menjadi kurang daripada median. Data yang ditunjukkan pada skala B diedarkan secara simetri. Bahagian kiri dan kanan pengedaran adalah imej cermin mereka. Nilai besar dan kecil mengimbangi satu sama lain, dan min dan median adalah sama. Data yang ditunjukkan pada skala B mempunyai kecondongan positif. Angka ini menunjukkan ekor yang panjang dan condong ke kanan, disebabkan oleh kehadiran nilai yang luar biasa tinggi. Nilai yang terlalu besar ini mengalihkan min ke kanan, dan ia menjadi lebih besar daripada median.

Dalam Excel, statistik deskriptif boleh diperoleh menggunakan alat tambah Pakej analisis. Pergi melalui menu DataAnalisis data, dalam tetingkap yang terbuka, pilih baris Statistik deskriptif dan klik Okey. Di tingkap Statistik deskriptif pastikan untuk menunjukkan selang input(Gamb. 11). Jika anda ingin melihat statistik deskriptif pada helaian yang sama dengan data asal, pilih butang radio selang keluaran dan tentukan sel di mana anda ingin meletakkan sudut kiri atas statistik yang dipaparkan (dalam contoh kami, $C$1). Jika anda ingin mengeluarkan data ke helaian baharu atau ke buku kerja baharu, hanya pilih butang radio yang sesuai. Tandai kotak di sebelah Statistik akhir. Secara pilihan, anda juga boleh memilih Tahap kesukaran,k-terkecil danke-k terbesar.

Jika di deposit Data di kawasan Analisis anda tidak melihat ikon itu Analisis data, anda mesti memasang alat tambah dahulu Pakej analisis(lihat, sebagai contoh,).

nasi. 11. Statistik deskriptif bagi pulangan tahunan purata lima tahun dana dengan tahap risiko yang sangat tinggi, dikira menggunakan alat tambah Analisis data program Excel

Excel mengira beberapa statistik yang dibincangkan di atas: min, median, mod, sisihan piawai, varians, julat ( selang waktu), minimum, maksimum dan saiz sampel ( semak). Selain itu, Excel mengira beberapa statistik baharu untuk kami: ralat standard, kurtosis dan kecondongan. kesalahan biasa sama dengan sisihan piawai dibahagikan dengan punca kuasa dua saiz sampel. Asimetri mencirikan sisihan daripada simetri taburan dan merupakan fungsi yang bergantung kepada kubus perbezaan antara unsur-unsur sampel dan nilai min. Kurtosis ialah ukuran kepekatan relatif data di sekitar min berbanding ekor taburan, dan bergantung pada perbezaan antara sampel dan min yang dinaikkan kepada kuasa keempat.

Pengiraan statistik deskriptif untuk populasi umum

Min, serakan dan bentuk taburan yang dibincangkan di atas adalah ciri berasaskan sampel. Walau bagaimanapun, jika set data mengandungi ukuran berangka keseluruhan populasi, maka parameternya boleh dikira. Parameter ini termasuk min, varians dan sisihan piawai populasi.

Nilai yang dijangkakan adalah sama dengan jumlah semua nilai populasi umum dibahagikan dengan jumlah populasi umum:

di mana µ - nilai jangkaan, Xi- i-pemerhatian pembolehubah ke X, N- jumlah penduduk umum. Dalam Excel, untuk mengira jangkaan matematik, fungsi yang sama digunakan seperti untuk min aritmetik: =AVERAGE().

Varians populasi sama dengan jumlah perbezaan kuasa dua antara unsur populasi umum dan tikar. jangkaan dibahagikan dengan saiz populasi:

di mana σ2 ialah varians populasi umum. Excel sebelum versi 2007 menggunakan fungsi =VAR() untuk mengira varians populasi, bermula dengan versi 2010 =VAR.G().

sisihan piawai populasi adalah sama dengan punca kuasa dua varians populasi:

Excel sebelum versi 2007 menggunakan =STDEV() untuk mengira sisihan piawai populasi, bermula dengan versi 2010 =STDEV.Y(). Ambil perhatian bahawa formula untuk varians populasi dan sisihan piawai adalah berbeza daripada formula untuk varians sampel dan sisihan piawai. Apabila mengira statistik sampel S2 dan S penyebut pecahan itu ialah n - 1, dan apabila mengira parameter σ2 dan σ - jumlah penduduk umum N.

peraturan biasa

Dalam kebanyakan situasi, sebahagian besar pemerhatian tertumpu di sekitar median, membentuk gugusan. Dalam set data dengan pencongan positif, kelompok ini terletak di sebelah kiri (iaitu, di bawah) jangkaan matematik, dan dalam set dengan pencongan negatif, kelompok ini terletak di sebelah kanan (iaitu, di atas) jangkaan matematik. Data simetri mempunyai min dan median yang sama, dan kumpulan pemerhatian di sekeliling min, membentuk taburan berbentuk loceng. Jika taburan tidak mempunyai kecondongan yang jelas, dan data tertumpu di sekitar pusat graviti tertentu, peraturan praktikal boleh digunakan untuk menganggarkan kebolehubahan, yang mengatakan: jika data mempunyai taburan berbentuk loceng, maka kira-kira 68% daripada pemerhatian adalah kurang daripada satu sisihan piawai daripada jangkaan matematik, Kira-kira 95% daripada pemerhatian berada dalam dua sisihan piawai bagi nilai jangkaan, dan 99.7% daripada pemerhatian berada dalam tiga sisihan piawai bagi nilai jangkaan.

Oleh itu, sisihan piawai, yang merupakan anggaran turun naik purata di sekitar jangkaan matematik, membantu memahami cara pemerhatian diedarkan dan mengenal pasti outlier. Ia mengikuti peraturan praktikal bahawa untuk taburan berbentuk loceng, hanya satu nilai dalam dua puluh berbeza daripada jangkaan matematik dengan lebih daripada dua sisihan piawai. Oleh itu, nilai di luar selang µ ± 2σ, boleh dianggap outlier. Di samping itu, hanya tiga daripada 1000 pemerhatian berbeza daripada jangkaan matematik dengan lebih daripada tiga sisihan piawai. Oleh itu, nilai di luar selang µ ± 3σ hampir selalu outlier. Untuk pengedaran yang sangat condong atau tidak berbentuk loceng, peraturan Biename-Chebyshev boleh digunakan.

Lebih daripada seratus tahun yang lalu, ahli matematik Bienamay dan Chebyshev secara bebas menemui sifat berguna sisihan piawai. Mereka mendapati bahawa bagi mana-mana set data, tanpa mengira bentuk taburan, peratusan cerapan yang terletak pada jarak tidak melebihi k sisihan piawai daripada jangkaan matematik, tidak kurang (1 – 1/ 2)*100%.

Sebagai contoh, jika k= 2, peraturan Biename-Chebyshev menyatakan bahawa sekurang-kurangnya (1 - (1/2) 2) x 100% = 75% daripada pemerhatian mesti terletak pada selang µ ± 2σ. Peraturan ini adalah benar untuk mana-mana k melebihi satu. Peraturan Biename-Chebyshev adalah bersifat umum dan sah untuk pengedaran dalam apa jua bentuk. Ia menunjukkan bilangan minimum pemerhatian, jarak dari mana ke jangkaan matematik tidak melebihi nilai yang diberikan. Walau bagaimanapun, jika pengedaran berbentuk loceng, peraturan praktikal menganggarkan kepekatan data di sekitar min dengan lebih tepat.

Mengira statistik deskriptif untuk taburan berasaskan frekuensi

Jika data asal tidak tersedia, taburan kekerapan menjadi satu-satunya sumber maklumat. Dalam situasi sedemikian, anda boleh mengira nilai anggaran penunjuk kuantitatif taburan, seperti min aritmetik, sisihan piawai, kuartil.

Jika data sampel dibentangkan sebagai taburan kekerapan, nilai anggaran min aritmetik boleh dikira, dengan mengandaikan bahawa semua nilai dalam setiap kelas tertumpu pada titik tengah kelas:

di mana - min sampel, n- bilangan pemerhatian, atau saiz sampel, Dengan- bilangan kelas dalam taburan kekerapan, mj- titik tengah j-kelas ke-, fj- kekerapan sepadan dengan j-kelas ke.

Untuk mengira sisihan piawai daripada taburan kekerapan, ia juga diandaikan bahawa semua nilai dalam setiap kelas tertumpu pada titik tengah kelas.

Untuk memahami bagaimana kuartil siri ditentukan berdasarkan frekuensi, mari kita pertimbangkan pengiraan kuartil bawah berdasarkan data untuk 2013 mengenai pengagihan penduduk Rusia dengan purata pendapatan tunai per kapita (Rajah 12).

nasi. 12. Bahagian penduduk Rusia dengan pendapatan kewangan per kapita secara purata sebulan, rubel

Untuk mengira kuartil pertama siri variasi selang, anda boleh menggunakan formula:

di mana Q1 ialah nilai kuartil pertama, xQ1 ialah had bawah selang yang mengandungi kuartil pertama (selang ditentukan oleh kekerapan terkumpul, yang pertama melebihi 25%); i ialah nilai selang; Σf ialah jumlah frekuensi keseluruhan sampel; mungkin sentiasa sama dengan 100%; SQ1–1 ialah kekerapan kumulatif selang sebelum selang yang mengandungi kuartil bawah; fQ1 ialah kekerapan selang yang mengandungi kuartil bawah. Formula untuk kuartil ketiga berbeza kerana di semua tempat, bukannya Q1, anda perlu menggunakan Q3, dan gantikan ¾ dan bukannya ¼.

Dalam contoh kami (Rajah 12), kuartil bawah berada dalam julat 7000.1 - 10,000, kekerapan kumulatifnya ialah 26.4%. Had bawah selang ini ialah 7000 rubel, nilai selang ialah 3000 rubel, kekerapan terkumpul selang sebelum selang yang mengandungi kuartil bawah ialah 13.4%, kekerapan selang yang mengandungi kuartil bawah ialah 13.0%. Oleh itu: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13.4) / 13 \u003d 9677 rubel.

Perangkap yang berkaitan dengan statistik deskriptif

Dalam nota ini, kami melihat cara untuk menerangkan set data menggunakan pelbagai statistik yang menganggarkan min, serakan dan taburannya. Langkah seterusnya ialah menganalisis dan mentafsir data. Setakat ini, kami telah mengkaji sifat objektif data, dan kini kami beralih kepada tafsiran subjektif mereka. Dua kesilapan menanti penyelidik: subjek analisis yang dipilih secara salah dan tafsiran keputusan yang salah.

Analisis prestasi 15 dana bersama yang sangat berisiko tinggi adalah tidak berat sebelah. Dia membawa kepada kesimpulan objektif sepenuhnya: semua dana bersama mempunyai pulangan yang berbeza, sebaran pulangan dana berjulat dari -6.1 hingga 18.5, dan pulangan purata ialah 6.08. Objektiviti analisis data dipastikan oleh pilihan yang betul bagi jumlah penunjuk kuantitatif taburan. Beberapa kaedah untuk menganggar min dan serakan data telah dipertimbangkan, dan kelebihan dan kekurangannya telah ditunjukkan. Bagaimana untuk memilih statistik yang betul yang memberikan analisis yang objektif dan tidak berat sebelah? Jika taburan data condong sedikit, adakah median harus dipilih berbanding min aritmetik? Penunjuk manakah yang lebih tepat mencirikan penyebaran data: sisihan piawai atau julat? Patutkah kecondongan positif pengedaran ditunjukkan?

Sebaliknya, tafsiran data adalah proses subjektif. Orang yang berbeza membuat kesimpulan yang berbeza, mentafsir keputusan yang sama. Setiap orang ada pandangan masing-masing. Seseorang menganggap jumlah pulangan tahunan purata 15 dana dengan tahap risiko yang sangat tinggi adalah baik dan agak berpuas hati dengan pendapatan yang diterima. Orang lain mungkin berpendapat bahawa dana ini mempunyai pulangan yang terlalu rendah. Oleh itu, subjektiviti harus diberi pampasan dengan kejujuran, berkecuali dan kejelasan kesimpulan.

Isu etika

Analisis data berkait rapat dengan isu etika. Seseorang harus kritis terhadap maklumat yang disebarkan oleh akhbar, radio, televisyen dan Internet. Dari masa ke masa, anda akan belajar untuk menjadi ragu-ragu bukan sahaja tentang keputusan, tetapi juga tentang matlamat, subjek dan objektiviti penyelidikan. Ahli politik British terkenal Benjamin Disraeli berkata yang terbaik: "Terdapat tiga jenis pembohongan: pembohongan, pembohongan terkutuk dan statistik."

Seperti yang dinyatakan dalam nota, isu etika timbul apabila memilih keputusan yang harus dibentangkan dalam laporan. Kedua-dua keputusan positif dan negatif harus diterbitkan. Selain itu, semasa membuat laporan atau laporan bertulis, keputusannya hendaklah dibentangkan secara jujur, neutral dan objektif. Bezakan antara persembahan yang buruk dan tidak jujur. Untuk melakukan ini, adalah perlu untuk menentukan apakah niat penceramah itu. Kadangkala penutur mengetepikan maklumat penting kerana kejahilan, dan kadangkala sengaja (contohnya, jika dia menggunakan min aritmetik untuk menganggarkan min data yang condong dengan jelas untuk mendapatkan hasil yang diinginkan). Ia juga tidak jujur ​​untuk menindas keputusan yang tidak sesuai dengan sudut pandangan penyelidik.

Bahan daripada buku Levin et al. Perangkaan untuk pengurus digunakan. - M.: Williams, 2004. - hlm. 178–209

Fungsi QUARTILE dikekalkan untuk diselaraskan dengan versi Excel terdahulu

Nilai purata merujuk kepada penunjuk statistik umum yang memberikan ringkasan (akhir) ciri fenomena sosial massa, kerana ia dibina berdasarkan sejumlah besar nilai individu dari sifat yang berbeza-beza. Untuk menjelaskan intipati nilai purata, adalah perlu untuk mempertimbangkan ciri-ciri pembentukan nilai-nilai tanda-tanda fenomena tersebut, mengikut mana nilai purata dikira.

Adalah diketahui bahawa unit setiap fenomena jisim mempunyai banyak ciri. Mana-mana tanda ini yang kita ambil, nilainya untuk unit individu akan berbeza, ia berubah, atau, seperti yang mereka katakan dalam statistik, berbeza dari satu unit ke unit yang lain. Jadi, sebagai contoh, gaji pekerja ditentukan oleh kelayakannya, sifat kerja, tempoh perkhidmatan dan beberapa faktor lain, dan oleh itu berbeza dalam julat yang sangat luas. Pengaruh kumulatif semua faktor menentukan jumlah pendapatan setiap pekerja, bagaimanapun, kita boleh bercakap tentang purata gaji bulanan pekerja dalam sektor ekonomi yang berbeza. Di sini kami beroperasi dengan nilai ciri khas bagi atribut pembolehubah, dirujuk kepada unit populasi yang besar.

Rata-rata mencerminkannya umum, yang tipikal untuk semua unit populasi yang dikaji. Pada masa yang sama, ia mengimbangi pengaruh semua faktor yang bertindak pada magnitud atribut unit individu populasi, seolah-olah saling membatalkannya. Tahap (atau saiz) mana-mana fenomena sosial ditentukan oleh tindakan dua kumpulan faktor. Sebahagian daripadanya adalah umum dan utama, sentiasa beroperasi, berkait rapat dengan sifat fenomena atau proses yang dikaji, dan membentuk tipikal untuk semua unit populasi yang dikaji, yang ditunjukkan dalam nilai purata. Yang lain adalah individu, aksi mereka kurang ketara dan episodik, rawak. Mereka bertindak dalam arah yang bertentangan, menyebabkan perbezaan antara ciri kuantitatif unit individu populasi, berusaha untuk mengubah nilai malar ciri yang sedang dikaji. Tindakan tanda individu dipadamkan dalam nilai purata. Dalam pengaruh kumulatif faktor tipikal dan individu, yang seimbang dan saling dibatalkan dalam ciri generalisasi, asas hukum bilangan besar.

Dalam agregat, nilai individu tanda bergabung menjadi jisim biasa dan, seolah-olah, larut. Oleh itu dan nilai purata bertindak sebagai "tidak peribadi", yang boleh menyimpang daripada nilai individu ciri, tidak secara kuantitatif bertepatan dengan mana-mana daripada mereka. Nilai purata mencerminkan umum, ciri dan tipikal untuk keseluruhan populasi disebabkan oleh pembatalan bersama di dalamnya secara rawak, perbezaan atipikal antara tanda-tanda unit individunya, kerana nilainya ditentukan, seolah-olah, oleh hasil sepunya semua punca.

Walau bagaimanapun, agar nilai purata mencerminkan nilai paling tipikal bagi sesuatu sifat, ia tidak seharusnya ditentukan untuk mana-mana populasi, tetapi hanya untuk populasi yang terdiri daripada unit homogen secara kualitatif. Keperluan ini adalah syarat utama untuk aplikasi purata berasaskan saintifik dan membayangkan hubungan rapat antara kaedah purata dan kaedah pengelompokan dalam analisis fenomena sosio-ekonomi. Oleh itu, nilai purata ialah penunjuk generalisasi yang mencirikan tahap tipikal sifat berubah-ubah seunit populasi homogen dalam keadaan tempat dan masa tertentu.

Menentukan, oleh itu, intipati nilai purata, perlu ditekankan bahawa pengiraan yang betul bagi sebarang nilai purata membayangkan pemenuhan keperluan berikut:

  • kehomogenan kualitatif populasi di mana nilai purata dikira. Ini bermakna pengiraan nilai purata hendaklah berdasarkan kaedah pengelompokan, yang memastikan pemilihan fenomena jenis yang sama;
  • pengecualian pengaruh pada pengiraan nilai purata rawak, punca dan faktor individu semata-mata. Ini dicapai apabila pengiraan purata adalah berdasarkan bahan yang cukup besar di mana operasi undang-undang bilangan besar ditunjukkan, dan semua kemalangan membatalkan satu sama lain;
  • apabila mengira nilai purata, adalah penting untuk mewujudkan tujuan pengiraannya dan apa yang dipanggil menentukan penunjuk-tel(harta benda) yang sepatutnya diorientasikan.

Penunjuk penentu boleh bertindak sebagai jumlah nilai atribut purata, jumlah nilai timbal baliknya, hasil darab nilainya, dsb. Hubungan antara penunjuk penentu dan nilai purata dinyatakan seperti berikut: jika semua nilai atribut purata digantikan dengan nilai purata, maka jumlah atau produk mereka dalam dalam kes ini tidak akan mengubah penunjuk penentu. Atas dasar sambungan penunjuk penentu dengan nilai purata ini, nisbah kuantitatif awal dibina untuk pengiraan langsung nilai purata. Keupayaan purata untuk mengekalkan sifat populasi statistik dipanggil mendefinisikan harta.

Nilai purata yang dikira untuk populasi secara keseluruhan dipanggil purata am; nilai purata dikira untuk setiap kumpulan - purata kumpulan. Purata umum mencerminkan ciri umum fenomena yang dikaji, purata kumpulan memberikan penerangan tentang fenomena yang berkembang di bawah keadaan khusus kumpulan ini.

Kaedah pengiraan boleh berbeza, oleh itu, dalam statistik, beberapa jenis purata dibezakan, yang utama adalah purata aritmetik, purata harmonik dan purata geometri.

Dalam analisis ekonomi, penggunaan purata adalah alat utama untuk menilai hasil kemajuan saintifik dan teknologi, langkah sosial, dan pencarian rizab untuk pembangunan ekonomi. Pada masa yang sama, perlu diingat bahawa tumpuan yang berlebihan pada purata boleh membawa kepada kesimpulan yang berat sebelah apabila menjalankan analisis ekonomi dan statistik. Ini disebabkan oleh fakta bahawa nilai purata, sebagai penunjuk umum, membatalkan dan mengabaikan perbezaan dalam ciri kuantitatif unit individu populasi yang benar-benar wujud dan mungkin mempunyai kepentingan bebas.

Jenis-jenis purata

Dalam statistik, pelbagai jenis purata digunakan, yang dibahagikan kepada dua kelas besar:

  • purata kuasa (min harmonik, min geometri, min aritmetik, min persegi, min padu);
  • purata struktur (mod, median).

Untuk mengira kuasa bermakna semua nilai ciri yang ada mesti digunakan. Fesyen dan median ditentukan hanya oleh struktur pengedaran, oleh itu ia dipanggil struktur, purata kedudukan. Median dan mod sering digunakan sebagai ciri purata dalam populasi tersebut di mana pengiraan eksponen min adalah mustahil atau tidak praktikal.

Jenis purata yang paling biasa ialah purata aritmetik. Di bawah min aritmetik difahami sebagai nilai ciri yang akan dimiliki oleh setiap unit populasi jika jumlah semua nilai ciri tersebut diagihkan sama rata di antara semua unit populasi. Pengiraan nilai ini dikurangkan kepada penjumlahan semua nilai atribut pembolehubah dan pembahagian jumlah yang terhasil dengan jumlah bilangan unit populasi. Sebagai contoh, lima pekerja menyelesaikan pesanan untuk pembuatan bahagian, manakala yang pertama menghasilkan 5 bahagian, yang kedua - 7, yang ketiga - 4, yang keempat - 10, yang kelima - 12. Oleh kerana dalam data awal nilai setiap pilihan berlaku sekali sahaja, untuk menentukan purata keluaran seorang pekerja hendaklah menggunakan formula min aritmetik mudah:

iaitu, dalam contoh kami, output purata seorang pekerja adalah sama dengan

Bersama-sama dengan min aritmetik yang mudah, mereka belajar min aritmetik berwajaran. Sebagai contoh, mari kita hitung purata umur pelajar dalam kumpulan 20 orang yang umurnya antara 18 hingga 22 tahun, di mana xi- varian ciri purata, fi- kekerapan, yang menunjukkan berapa kali ia berlaku i-th nilai dalam agregat (Jadual 5.1).

Jadual 5.1

Purata umur pelajar

Menggunakan formula min aritmetik berwajaran, kita mendapat:


Terdapat peraturan tertentu untuk memilih purata aritmetik berwajaran: jika terdapat satu siri data pada dua penunjuk, untuk satu daripadanya adalah perlu untuk mengira

nilai purata, dan pada masa yang sama, nilai berangka penyebut formula logiknya diketahui, dan nilai pengangka tidak diketahui, tetapi boleh didapati sebagai hasil darab penunjuk ini, maka nilai purata hendaklah dikira menggunakan formula purata wajaran aritmetik.

Dalam sesetengah kes, sifat data statistik awal adalah sedemikian sehingga pengiraan min aritmetik kehilangan maknanya dan satu-satunya penunjuk umum hanya boleh menjadi jenis nilai purata yang lain - harmonik purata. Pada masa ini, sifat pengiraan min aritmetik telah kehilangan kaitannya dalam pengiraan penunjuk statistik umum kerana pengenalan komputer elektronik yang meluas. Nilai harmonik purata, yang juga mudah dan berwajaran, telah memperoleh kepentingan praktikal yang besar. Jika nilai berangka pengangka formula logik diketahui, dan nilai penyebut tidak diketahui, tetapi boleh didapati sebagai pembahagian persendirian satu penunjuk dengan yang lain, maka nilai purata dikira oleh wajaran formula min harmonik.

Sebagai contoh, hendaklah diketahui bahawa kereta itu menempuh 210 km pertama pada kelajuan 70 km/j, dan baki 150 km pada kelajuan 75 km/j. Adalah mustahil untuk menentukan purata kelajuan kereta sepanjang keseluruhan perjalanan sejauh 360 km menggunakan formula min aritmetik. Oleh kerana pilihan adalah kelajuan dalam bahagian individu xj= 70 km/j dan X2= 75 km/j, dan pemberat (fi) ialah segmen laluan yang sepadan, maka produk pilihan mengikut pemberat tidak akan mempunyai makna fizikal mahupun ekonomi. Dalam kes ini, masuk akal untuk membahagikan segmen laluan ke dalam kelajuan yang sepadan (pilihan xi), iaitu, masa yang dihabiskan untuk melepasi bahagian individu laluan (fi / xi). Jika segmen laluan dilambangkan dengan fi, maka keseluruhan laluan dinyatakan sebagai Σfi, dan masa yang dihabiskan pada keseluruhan laluan dinyatakan sebagai Σ fi / xi , Kemudian kelajuan purata boleh didapati sebagai hasil bagi jumlah jarak dibahagikan dengan jumlah masa yang dibelanjakan:

Dalam contoh kami, kami mendapat:

Jika apabila menggunakan purata berat harmonik semua pilihan (f) adalah sama, maka bukannya wajaran, anda boleh menggunakan min harmonik mudah (tidak berwajaran):

di mana xi - pilihan individu; n- bilangan varian ciri purata. Dalam contoh dengan kelajuan, min harmonik mudah boleh digunakan jika segmen laluan yang dilalui pada kelajuan yang berbeza adalah sama.

Sebarang nilai purata hendaklah dikira supaya apabila ia menggantikan setiap variasi ciri purata, nilai beberapa penunjuk pengitlak muktamad, yang dikaitkan dengan penunjuk purata, tidak berubah. Jadi, apabila menggantikan kelajuan sebenar pada bahagian individu laluan dengan nilai puratanya (kelajuan purata), jumlah jarak tidak seharusnya berubah.

Bentuk (formula) nilai purata ditentukan oleh sifat (mekanisme) hubungan penunjuk akhir ini dengan purata, oleh itu penunjuk akhir, yang nilainya tidak boleh berubah apabila pilihan digantikan dengan nilai puratanya , dipanggil penunjuk yang menentukan. Untuk mendapatkan formula purata, anda perlu mengarang dan menyelesaikan persamaan menggunakan hubungan penunjuk purata dengan penunjuk yang menentukan. Persamaan ini dibina dengan menggantikan varian ciri purata (penunjuk) dengan nilai puratanya.

Sebagai tambahan kepada min aritmetik dan min harmonik, jenis (bentuk) min yang lain juga digunakan dalam statistik. Kesemuanya adalah kes khas. purata ijazah. Jika kita mengira semua jenis purata undang-undang kuasa untuk data yang sama, maka nilainya

mereka akan sama, peraturannya terpakai di sini jurusan sederhana. Apabila eksponen bagi min bertambah, begitu juga min itu sendiri. Formula yang paling biasa digunakan dalam penyelidikan praktikal untuk mengira pelbagai jenis nilai min kuasa dibentangkan dalam Jadual. 5.2.

Jadual 5.2


Purata geometri digunakan apabila tersedia. n faktor pertumbuhan, manakala nilai individu sifat adalah, sebagai peraturan, nilai relatif dinamik, dibina dalam bentuk nilai rantai, sebagai nisbah kepada tahap sebelumnya setiap peringkat dalam siri dinamik. Oleh itu, purata mencirikan kadar pertumbuhan purata. geometri bermakna mudah dikira dengan formula

Formula berwajaran min geometri mempunyai bentuk berikut:

Formula di atas adalah sama, tetapi satu digunakan pada pekali semasa atau kadar pertumbuhan, dan yang kedua - pada nilai mutlak tahap siri.

punca purata kuasa dua digunakan apabila mengira dengan nilai fungsi segi empat sama, digunakan untuk mengukur tahap turun naik nilai individu atribut di sekitar min aritmetik dalam siri taburan dan dikira dengan formula

Purata berwajaran persegi dikira menggunakan formula yang berbeza:

Purata kubik digunakan apabila mengira dengan nilai fungsi padu dan dikira dengan formula

padu purata wajaran:

Semua nilai purata di atas boleh diwakili sebagai formula umum:

di manakah nilai purata; - nilai individu; n- bilangan unit populasi yang dikaji; k- eksponen, yang menentukan jenis purata.

Apabila menggunakan data sumber yang sama, lebih banyak k dalam formula min kuasa am, semakin besar nilai min. Ia berikutan daripada ini bahawa terdapat hubungan tetap antara nilai kuasa bermakna:

Nilai purata yang diterangkan di atas memberikan idea umum tentang populasi yang dikaji, dan dari sudut pandangan ini, kepentingan teori, gunaan dan kognitif mereka tidak dapat dipertikaikan. Tetapi ia berlaku bahawa nilai purata tidak bertepatan dengan mana-mana pilihan yang benar-benar sedia ada, oleh itu, sebagai tambahan kepada purata yang dipertimbangkan, dalam analisis statistik adalah dinasihatkan untuk menggunakan nilai-nilai pilihan tertentu yang menduduki agak kedudukan pasti dalam siri nilai atribut yang tersusun (berperingkat). Antara kuantiti ini, yang paling biasa digunakan ialah struktur, atau deskriptif, purata- mod (Mo) dan median (Me).

Fesyen- nilai sifat yang paling kerap ditemui dalam populasi ini. Berkenaan dengan siri variasi, mod ialah nilai yang paling kerap berlaku bagi siri kedudukan, iaitu, varian dengan frekuensi tertinggi. Fesyen boleh digunakan untuk menentukan kedai yang paling banyak dikunjungi, harga yang paling biasa untuk mana-mana produk. Ia menunjukkan saiz ciri ciri sebahagian besar populasi, dan ditentukan oleh formula

di mana x0 ialah had bawah selang; h- nilai selang; fm- kekerapan selang; fm_ 1 - kekerapan selang sebelumnya; fm+ 1 - kekerapan selang seterusnya.

median varian yang terletak di tengah-tengah baris berperingkat dipanggil. Median membahagikan siri kepada dua bahagian yang sama sedemikian rupa sehingga pada kedua-dua belahnya terdapat bilangan unit populasi yang sama. Pada masa yang sama, dalam satu separuh daripada unit populasi, nilai atribut pembolehubah adalah kurang daripada median, pada separuh lagi ia lebih besar daripadanya. Median digunakan apabila memeriksa elemen yang nilainya lebih besar daripada atau sama dengan atau pada masa yang sama kurang daripada atau sama dengan separuh daripada elemen siri taburan. Median memberikan gambaran umum tentang di mana nilai ciri tertumpu, dengan kata lain, di mana pusatnya.

Sifat deskriptif median ditunjukkan dalam fakta bahawa ia mencirikan sempadan kuantitatif nilai-nilai atribut yang berbeza-beza, yang dimiliki oleh separuh daripada unit populasi. Masalah mencari median bagi siri variasi diskret diselesaikan dengan mudah. Jika semua unit siri diberi nombor siri, maka nombor siri varian median ditakrifkan sebagai (n + 1) / 2 dengan bilangan ahli yang ganjil n. Jika bilangan ahli siri itu ialah nombor genap, maka median akan menjadi purata dua varian dengan nombor siri n/ 2 dan n / 2 + 1.

Apabila menentukan median dalam siri variasi selang, selang di mana ia terletak (selang median) ditentukan terlebih dahulu. Selang ini dicirikan oleh fakta bahawa jumlah frekuensi terkumpulnya adalah sama atau melebihi separuh daripada jumlah semua frekuensi siri. Pengiraan median siri variasi selang dijalankan mengikut formula

di mana X0- had bawah selang; h- nilai selang; fm- kekerapan selang; f- bilangan ahli siri;

∫m-1 - jumlah sebutan terkumpul bagi siri sebelum ini.

Bersama dengan median, untuk pencirian struktur populasi yang dikaji yang lebih lengkap, nilai pilihan lain digunakan, yang menduduki kedudukan yang agak pasti dalam siri kedudukan. Ini termasuk kuartil dan desil. Kuartil membahagikan siri dengan jumlah frekuensi kepada 4 bahagian yang sama, dan desil - kepada 10 bahagian yang sama. Terdapat tiga kuartil dan sembilan desil.

Median dan mod, berbeza dengan min aritmetik, tidak memadamkan perbezaan individu dalam nilai atribut pembolehubah dan, oleh itu, adalah ciri tambahan dan sangat penting bagi populasi statistik. Dalam amalan, mereka sering digunakan dan bukannya purata atau bersama-sama dengannya. Ia amat sesuai untuk mengira median dan mod dalam kes tersebut apabila populasi yang dikaji mengandungi bilangan unit tertentu dengan nilai atribut pembolehubah yang sangat besar atau sangat kecil. Nilai-nilai pilihan ini, yang tidak begitu ciri untuk populasi, sambil mempengaruhi nilai min aritmetik, tidak menjejaskan nilai median dan mod, yang menjadikan penunjuk yang terakhir sangat berharga untuk analisis ekonomi dan statistik .

Penunjuk variasi

Tujuan kajian statistik adalah untuk mengenal pasti sifat dan corak utama populasi statistik yang dikaji. Dalam proses pemprosesan ringkasan data cerapan statistik, kami membina talian pengedaran. Terdapat dua jenis siri pengedaran - atribut dan variasi, bergantung pada sama ada atribut yang diambil sebagai asas pengelompokan adalah kualitatif atau kuantitatif.

variasi dipanggil siri pengedaran yang dibina secara kuantitatif. Nilai ciri kuantitatif untuk unit individu populasi tidak tetap, lebih kurang berbeza antara satu sama lain. Perbezaan dalam nilai sifat ini dipanggil variasi. Nilai berangka yang berasingan bagi sifat yang berlaku dalam populasi yang dikaji dipanggil pilihan nilai. Kehadiran variasi dalam unit individu populasi adalah disebabkan oleh pengaruh sejumlah besar faktor pada pembentukan tahap sifat. Kajian tentang sifat dan tahap variasi tanda dalam unit individu populasi adalah isu paling penting dalam mana-mana kajian statistik. Penunjuk variasi digunakan untuk menerangkan ukuran kebolehubahan sifat.

Satu lagi tugas penting dalam penyelidikan statistik adalah untuk menentukan peranan faktor individu atau kumpulan mereka dalam variasi ciri tertentu populasi. Untuk menyelesaikan masalah sedemikian dalam statistik, kaedah khas untuk mengkaji variasi digunakan, berdasarkan penggunaan sistem penunjuk yang mengukur variasi. Dalam amalan, penyelidik berhadapan dengan bilangan pilihan yang cukup besar untuk nilai atribut, yang tidak memberikan gambaran tentang pengedaran unit mengikut nilai atribut dalam agregat. Untuk melakukan ini, semua varian nilai atribut disusun dalam susunan menaik atau menurun. Proses ini dipanggil kedudukan baris. Siri berperingkat serta-merta memberikan gambaran umum tentang nilai yang diambil oleh ciri itu dalam agregat.

Ketidakcukupan nilai purata untuk pencirian menyeluruh populasi menjadikannya perlu untuk menambah nilai purata dengan penunjuk yang memungkinkan untuk menilai tipikal purata ini dengan mengukur turun naik (variasi) sifat yang dikaji. Penggunaan penunjuk variasi ini memungkinkan untuk membuat analisis statistik lebih lengkap dan bermakna, dan dengan itu untuk lebih memahami intipati fenomena sosial yang dikaji.

Tanda-tanda variasi yang paling mudah ialah minimum dan maksimum - ini adalah nilai terkecil dan terbesar bagi ciri dalam populasi. Bilangan pengulangan varian individu nilai ciri dipanggil kadar pengulangan. Mari kita nyatakan kekerapan pengulangan nilai ciri fi, jumlah frekuensi yang sama dengan isipadu populasi yang dikaji ialah:

di mana k- bilangan varian nilai atribut. Ia adalah mudah untuk menggantikan frekuensi dengan frekuensi - w.i. Kekerapan- penunjuk kekerapan relatif - boleh dinyatakan dalam pecahan unit atau peratusan dan membolehkan anda membandingkan siri variasi dengan bilangan cerapan yang berbeza. Secara rasmi kami mempunyai:

Untuk mengukur variasi sesuatu sifat, pelbagai penunjuk mutlak dan relatif digunakan. Penunjuk mutlak variasi termasuk sisihan linear min, julat variasi, varians, sisihan piawai.

Variasi rentang(R) ialah perbezaan antara nilai maksimum dan minimum sifat dalam populasi yang dikaji: R= Xmax - Xmin. Penunjuk ini hanya memberikan idea paling umum tentang turun naik sifat yang dikaji, kerana ia hanya menunjukkan perbezaan antara nilai mengehadkan pilihan. Ia sama sekali tidak berkaitan dengan frekuensi dalam siri variasi, iaitu, dengan sifat pengedaran, dan pergantungannya boleh memberikannya watak rawak yang tidak stabil hanya dari nilai ekstrem atribut. Julat variasi tidak memberikan sebarang maklumat tentang ciri populasi yang dikaji dan tidak membenarkan kami menilai tahap tipikal nilai purata yang diperolehi. Skop penunjuk ini terhad kepada populasi yang agak homogen, lebih tepat lagi, ia mencirikan variasi sifat, penunjuk berdasarkan mengambil kira kebolehubahan semua nilai sifat.

Untuk mencirikan variasi ciri, adalah perlu untuk menyamaratakan sisihan semua nilai daripada sebarang nilai biasa untuk populasi yang dikaji. Penunjuk sedemikian

variasi, seperti min sisihan linear, varians dan sisihan piawai, adalah berdasarkan pertimbangan sisihan nilai atribut unit individu populasi daripada min aritmetik.

Sisihan linear purata ialah min aritmetik bagi nilai mutlak sisihan pilihan individu daripada min aritmetik mereka:


Nilai mutlak (modulus) sisihan varian daripada min aritmetik; f- kekerapan.

Formula pertama digunakan jika setiap pilihan berlaku dalam agregat sekali sahaja, dan yang kedua - dalam siri dengan frekuensi yang tidak sama rata.

Terdapat satu lagi cara untuk purata sisihan pilihan daripada min aritmetik. Kaedah ini, yang sangat biasa dalam statistik, dikurangkan untuk mengira sisihan kuasa dua pilihan daripada nilai min dan kemudian puratanya. Dalam kes ini, kita mendapat penunjuk variasi baharu - varians.

Penyerakan(σ 2) - purata sisihan kuasa dua bagi varian nilai sifat daripada nilai puratanya:

Formula kedua digunakan jika varian mempunyai beratnya sendiri (atau frekuensi siri variasi).

Dalam analisis ekonomi dan statistik, adalah kebiasaan untuk menilai variasi atribut paling kerap menggunakan sisihan piawai. Sisihan piawai(σ) ialah punca kuasa dua varians:

Purata sisihan linear dan min kuasa dua menunjukkan berapa banyak nilai atribut berubah-ubah secara purata untuk unit populasi yang dikaji, dan dinyatakan dalam unit yang sama seperti varian.

Dalam amalan statistik, sering menjadi perlu untuk membandingkan variasi pelbagai ciri. Sebagai contoh, adalah sangat menarik untuk membandingkan variasi dalam umur kakitangan dan kelayakan mereka, tempoh perkhidmatan dan gaji, dsb. Untuk perbandingan sedemikian, penunjuk kebolehubahan mutlak tanda - purata sisihan linear dan piawai - tidak sesuai . Adalah mustahil, sebenarnya, untuk membandingkan turun naik pengalaman kerja, dinyatakan dalam tahun, dengan turun naik gaji, dinyatakan dalam rubel dan kopecks.

Apabila membandingkan kebolehubahan pelbagai ciri dalam agregat, adalah mudah untuk menggunakan penunjuk relatif variasi. Penunjuk ini dikira sebagai nisbah penunjuk mutlak kepada min aritmetik (atau median). Menggunakan sebagai penunjuk mutlak variasi julat variasi, sisihan linear purata, sisihan piawai, seseorang memperoleh penunjuk relatif turun naik:


Penunjuk turun naik relatif yang paling biasa digunakan, mencirikan kehomogenan populasi. Set dianggap homogen jika pekali variasi tidak melebihi 33% untuk taburan hampir normal.

Katakan anda perlu mencari purata bilangan hari untuk tugasan disiapkan oleh pekerja yang berbeza. Atau anda ingin mengira selang masa 10 tahun Suhu purata pada hari tertentu. Mengira nilai purata bagi satu siri nombor dalam beberapa cara.

Min ialah fungsi ukuran kecenderungan memusat, yang merupakan pusat siri nombor dalam taburan statistik. Tiga kriteria yang paling biasa untuk arah aliran pusat ialah.

    Purata Min aritmetik dikira dengan menambah satu siri nombor dan kemudian membahagikan nombor nombor tersebut. Sebagai contoh, purata 2, 3, 3, 5, 7, dan 10 mempunyai 30 dibahagikan dengan 6, 5;

    Median Nombor tengah siri nombor. Separuh daripada nombor mempunyai nilai yang lebih besar daripada Median, dan separuh daripada nombor mempunyai nilai yang kurang daripada Median. Sebagai contoh, median bagi 2, 3, 3, 5, 7 dan 10 ialah 4.

    Mod Nombor yang paling kerap berlaku dalam kumpulan nombor. Contohnya mod 2, 3, 3, 5, 7 dan 10 - 3.

Ketiga-tiga ukuran kecenderungan memusat taburan simetri bagi satu siri nombor adalah satu dan sama. Dalam taburan asimetri beberapa nombor, mereka boleh berbeza.

Kira nilai purata sel yang terletak secara berterusan dalam satu baris atau satu lajur

Lakukan perkara berikut.

Mengira Purata Sel Tersebar

Untuk menyelesaikan tugas ini, gunakan fungsi PURATA. Salin jadual di bawah pada helaian kosong.

Mengira purata wajaran

SUMPRODUCT dan jumlah. Contoh vThis mengira purata harga unit yang dibayar merentas tiga pembelian, di mana setiap pembelian adalah untuk bilangan unit ukuran yang berbeza pada harga unit yang berbeza.

Salin jadual di bawah pada helaian kosong.

Mengira nilai purata nombor, mengabaikan nilai sifar

Untuk menyelesaikan tugas ini, gunakan fungsi PURATA dan jika. Salin jadual di bawah dan ingat bahawa dalam contoh ini, untuk memudahkan pemahaman, salin jadual itu ke helaian kosong.