Biografi Ciri-ciri Analisis

Langkah-langkah penyebaran. Pengiraan kumpulan, antara kumpulan dan jumlah varians (mengikut peraturan menambah varians)

Untuk data berkumpulan serakan sisa- purata penyebaran intrakumpulan:

Di mana σ 2 j ialah varians antara kumpulan bagi kumpulan ke-j.

Untuk data tidak terkumpul serakan sisa ialah ukuran ketepatan anggaran, i.e. penghampiran garis regresi kepada data asal:
dengan y(t) ialah ramalan mengikut persamaan arah aliran; y t – siri permulaan dinamik; n ialah bilangan mata; p ialah bilangan pekali persamaan regresi (bilangan pembolehubah penjelasan).
Dalam contoh ini ia dipanggil anggaran varians yang tidak berat sebelah.

Contoh #1. Pengagihan pekerja tiga perusahaan satu persatuan mengikut kategori tarif dicirikan oleh data berikut:

Kategori gaji pekerjaBilangan pekerja di perusahaan
perusahaan 1perusahaan 2perusahaan 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

takrifkan:
1. penyebaran bagi setiap perusahaan (penyebaran intrakumpulan);
2. purata penyebaran dalam kumpulan;
3. penyebaran antara kumpulan;
4. jumlah varians.

Penyelesaian.
Sebelum meneruskan untuk menyelesaikan masalah, adalah perlu untuk mengetahui ciri mana yang berkesan dan yang mana faktorial. Dalam contoh yang sedang dipertimbangkan, ciri berkesan ialah "Kategori tarif", dan ciri faktor ialah "Nombor (nama) perusahaan".
Kemudian kita mempunyai tiga kumpulan (perusahaan) yang mana perlu untuk mengira purata kumpulan dan varians intrakumpulan:


Syarikatpurata kumpulan,varians dalam kumpulan,
1 4 1,8

Purata varians antara kumpulan ( serakan sisa) dikira dengan formula:


di mana anda boleh mengira:
atau:


Kemudian:
Jumlah penyebaran akan sama dengan: s 2 \u003d 1.6 + 0 \u003d 1.6.
Jumlah varians juga boleh dikira menggunakan salah satu daripada dua formula berikut:

Apabila menyelesaikan masalah praktikal, seseorang sering perlu berurusan dengan tanda yang hanya mengambil dua nilai alternatif. Dalam kes ini, mereka tidak bercakap tentang berat nilai tertentu ciri, tetapi mengenai bahagiannya dalam agregat. Jika perkadaran unit populasi yang mempunyai sifat yang dikaji dilambangkan dengan " R", dan tidak memiliki - melalui" q”, maka penyebaran boleh dikira dengan formula:
s 2 = p×q

Contoh #2. Mengikut data mengenai pembangunan enam pekerja briged, tentukan varians antara kumpulan dan nilaikan kesan anjakan kerja terhadap produktiviti buruh mereka jika jumlah varians ialah 12.2.

No. briged yang bekerjaKeluaran kerja, pcs.
dalam syif pertamadalam syif ke-2
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Penyelesaian. Data awal

Xf1f2f 3f4f5f6Jumlah
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Jumlah 31 33 37 37 40 38

Kemudian kita mempunyai 6 kumpulan yang mana perlu untuk mengira min kumpulan dan varians intrakumpulan.
1. Cari nilai purata setiap kumpulan.







2. Cari min kuasa dua bagi setiap kumpulan.







Kami meringkaskan hasil pengiraan dalam jadual:
Nombor kumpulanPurata kumpulanVarians dalam kumpulan
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varians dalam kumpulan mencirikan perubahan (variasi) sifat yang dikaji (hasil) dalam kumpulan di bawah pengaruh semua faktor, kecuali faktor yang mendasari kumpulan:
Kami mengira purata penyebaran intrakumpulan menggunakan formula:


4. Varians antara kumpulan mencirikan perubahan (variasi) sifat yang dikaji (hasil) di bawah pengaruh faktor (sifat faktor) yang mendasari pengelompokan.
Penyerakan antara kumpulan ditakrifkan sebagai:

di mana


Kemudian

Jumlah varians mencirikan perubahan (variasi) sifat yang dikaji (hasil) di bawah pengaruh semua faktor (sifat faktor) tanpa pengecualian. Mengikut keadaan masalah, ia bersamaan dengan 12.2.
Hubungan korelasi empirikal mengukur berapa banyak daripada jumlah turun naik atribut yang terhasil disebabkan oleh faktor yang dikaji. Ini ialah nisbah varians faktorial kepada jumlah varians:

Kami menentukan hubungan korelasi empirikal:

Hubungan antara ciri boleh menjadi lemah atau kuat (dekat). Kriteria mereka dinilai pada skala Chaddock:
0.1 0.3 0.5 0.7 0.9 Dalam contoh kami, hubungan antara ciri Y faktor X adalah lemah
Pekali penentuan.

Mari kita tentukan pekali penentuan:

Oleh itu, 0.67% variasi adalah disebabkan oleh perbezaan antara ciri, dan 99.37% disebabkan oleh faktor lain.
Kesimpulan: dalam kes ini, keluaran pekerja tidak bergantung kepada kerja dalam syif tertentu, i.e. pengaruh anjakan kerja terhadap produktiviti buruh mereka adalah tidak ketara dan disebabkan oleh faktor lain.

Contoh #3. Berdasarkan data mengenai gaji purata dan sisihan kuasa dua daripada nilainya untuk dua kumpulan pekerja, cari jumlah varians dengan menggunakan peraturan penambahan varians:

Penyelesaian:
Purata variasi dalam kumpulan

Penyerakan antara kumpulan ditakrifkan sebagai:


Jumlah varians ialah: 480 + 13824 = 14304

Halaman ini menerangkan contoh standard mencari varians, anda juga boleh melihat tugas lain untuk mencarinya

Contoh 1. Penentuan kumpulan, purata kumpulan, antara kumpulan dan jumlah varians

Contoh 2. Mencari varians dan pekali variasi dalam jadual kumpulan

Contoh 3. Mencari varians dalam siri diskret

Contoh 4. Kami mempunyai data berikut untuk sekumpulan 20 pelajar surat-menyurat. Ia adalah perlu untuk membina siri selang taburan ciri, mengira nilai min ciri dan mengkaji variansnya

Mari kita bina kumpulan selang. Mari kita tentukan julat selang dengan formula:

dengan X max ialah nilai maksimum bagi ciri kumpulan;
X min ialah nilai minimum bagi ciri kumpulan;
n ialah bilangan selang:

Kami menerima n=5. Langkahnya ialah: h \u003d (192 - 159) / 5 \u003d 6.6

Mari buat kumpulan selang

Untuk pengiraan lanjut, kami akan membina jadual tambahan:

X "i - tengah selang. (contohnya, tengah selang 159 - 165.6 \u003d 162.3)

Purata pertumbuhan pelajar ditentukan oleh formula purata wajaran aritmetik:

Kami menentukan penyebaran dengan formula:

Formula boleh ditukar seperti ini:

Daripada formula ini ia mengikutinya varians ialah perbezaan antara min kuasa dua pilihan dan kuasa dua dan min.

Varians dalam siri variasi dengan selang yang sama mengikut kaedah momen boleh dikira dengan cara berikut menggunakan sifat serakan kedua (membahagikan semua pilihan dengan nilai selang). Definisi varians, dikira dengan kaedah momen, mengikut formula berikut adalah kurang memakan masa:

di mana i ialah nilai selang;
A - sifar bersyarat, yang sesuai untuk menggunakan pertengahan selang dengan frekuensi tertinggi;
m1 ialah kuasa dua momen tertib pertama;
m2 - momen urutan kedua

Varian ciri (jika dalam populasi statistik atribut berubah sedemikian rupa sehingga terdapat hanya dua pilihan yang saling eksklusif, maka kebolehubahan tersebut dipanggil alternatif) boleh dikira dengan formula:

Menggantikan dalam formula penyebaran ini q = 1- p, kita dapat:

Jenis-jenis penyebaran

Jumlah varians mengukur variasi sesuatu sifat ke atas keseluruhan populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi ini. Ia adalah sama dengan kuasa dua min bagi sisihan nilai individu atribut x daripada jumlah nilai purata x dan boleh ditakrifkan sebagai varians mudah atau varians berwajaran.

Varians dalam kumpulan mencirikan variasi rawak, i.e. sebahagian daripada variasi, yang disebabkan oleh pengaruh faktor yang tidak diambil kira dan tidak bergantung pada faktor tanda yang mendasari pengelompokan. Varians ini adalah sama dengan min kuasa dua sisihan nilai individu atribut dalam kumpulan X daripada min aritmetik kumpulan dan boleh dikira sebagai varians mudah atau sebagai varians berwajaran.



Oleh itu, ukuran varians dalam kumpulan variasi sifat dalam kumpulan dan ditentukan oleh formula:

di mana xi - purata kumpulan;
ni ialah bilangan unit dalam kumpulan.

Sebagai contoh, varians intra-kumpulan yang perlu ditentukan dalam tugas mengkaji kesan kelayakan pekerja terhadap tahap produktiviti buruh di kedai menunjukkan variasi dalam output dalam setiap kumpulan disebabkan oleh semua faktor yang mungkin (keadaan teknikal peralatan, ketersediaan alatan dan bahan, umur pekerja, intensiti buruh, dsb.), kecuali perbezaan dalam kategori kelayakan (dalam kumpulan, semua pekerja mempunyai kelayakan yang sama).

Jangkaan dan varians matematik ialah ciri berangka yang paling biasa digunakan bagi pembolehubah rawak. Mereka mencirikan ciri pengedaran yang paling penting: kedudukan dan tahap penyebarannya. Dalam banyak masalah amalan, penerangan lengkap dan menyeluruh tentang pembolehubah rawak - hukum pengedaran - sama ada tidak boleh diperolehi sama sekali, atau tidak diperlukan sama sekali. Dalam kes ini, ia terhad kepada perihalan anggaran pembolehubah rawak menggunakan ciri berangka.

Jangkaan matematik sering dirujuk sebagai nilai purata pembolehubah rawak. Serakan pembolehubah rawak adalah ciri serakan, serakan pembolehubah rawak di sekeliling jangkaan matematiknya.

Jangkaan matematik bagi pembolehubah rawak diskret

Mari kita mendekati konsep jangkaan matematik, mula-mula meneruskan dari tafsiran mekanikal taburan pembolehubah rawak diskret. Biarkan jisim unit diedarkan di antara titik-titik paksi-x x1 , x 2 , ..., x n, dan setiap titik bahan mempunyai jisim yang sepadan dengannya hlm1 , hlm 2 , ..., hlm n. Ia dikehendaki memilih satu titik pada paksi-x, yang mencirikan kedudukan keseluruhan sistem titik bahan, dengan mengambil kira jisimnya. Adalah wajar untuk mengambil pusat jisim sistem titik bahan sebagai titik sedemikian. Ini ialah purata wajaran pembolehubah rawak X, di mana absis setiap titik xi masuk dengan "berat" sama dengan kebarangkalian yang sepadan. Nilai min pembolehubah rawak yang diperolehi X dipanggil jangkaan matematiknya.

Jangkaan matematik pembolehubah rawak diskret ialah jumlah hasil darab semua nilai yang mungkin dan kebarangkalian nilai ini:

Contoh 1 Loteri menang-menang telah dianjurkan. Terdapat 1000 kemenangan, 400 daripadanya adalah 10 rubel setiap satu. 300 - 20 rubel setiap satu 200 - 100 rubel setiap satu. dan 100 - 200 rubel setiap satu. Apakah purata kemenangan bagi seseorang yang membeli satu tiket?

Penyelesaian. Kami akan mencari purata kemenangan jika jumlah keseluruhan kemenangan, yang sama dengan 10*400 + 20*300 + 100*200 + 200*100 = 50,000 rubel, dibahagikan dengan 1000 (jumlah kemenangan). Kemudian kita mendapat 50000/1000 = 50 rubel. Tetapi ungkapan untuk mengira keuntungan purata juga boleh diwakili dalam bentuk berikut:

Sebaliknya, di bawah syarat ini, jumlah kemenangan adalah pembolehubah rawak yang boleh mengambil nilai 10, 20, 100 dan 200 rubel. dengan kebarangkalian sama dengan 0.4, masing-masing; 0.3; 0.2; 0.1. Oleh itu, pulangan purata yang dijangkakan adalah sama dengan jumlah produk saiz hasil dan kebarangkalian untuk menerimanya.

Contoh 2 Penerbit memutuskan untuk menerbitkan buku baharu. Dia akan menjual buku itu dengan harga 280 rubel, di mana 200 akan diberikan kepadanya, 50 ke kedai buku, dan 30 kepada penulis. Jadual memberikan maklumat tentang kos penerbitan buku dan kemungkinan menjual sejumlah salinan buku tersebut.

Cari keuntungan jangkaan penerbit.

Penyelesaian. Pembolehubah rawak "keuntungan" adalah sama dengan perbezaan antara pendapatan daripada jualan dan kos kos. Sebagai contoh, jika 500 salinan buku dijual, maka pendapatan daripada jualan ialah 200 * 500 = 100,000, dan kos penerbitan ialah 225,000 rubel. Oleh itu, penerbit menghadapi kerugian sebanyak 125,000 rubel. Jadual berikut meringkaskan nilai jangkaan pembolehubah rawak - keuntungan:

NomborUntung xi Kebarangkalian hlmi xi hlm i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Jumlah: 1,00 25000

Oleh itu, kami memperoleh jangkaan matematik keuntungan penerbit:

.

Contoh 3 Peluang untuk memukul dengan satu pukulan hlm= 0.2. Tentukan penggunaan cengkerang yang memberikan jangkaan matematik bilangan pukulan bersamaan dengan 5.

Penyelesaian. Daripada formula jangkaan yang sama yang telah kami gunakan setakat ini, kami nyatakan x- penggunaan cengkerang:

.

Contoh 4 Tentukan jangkaan matematik pembolehubah rawak x bilangan pukulan dengan tiga pukulan, jika kebarangkalian pukulan dengan setiap pukulan hlm = 0,4 .

Petunjuk: cari kebarangkalian nilai pembolehubah rawak dengan Formula Bernoulli .

Sifat Jangkaan

Pertimbangkan sifat jangkaan matematik.

Harta 1. Jangkaan matematik bagi nilai pemalar adalah sama dengan pemalar ini:

Harta 2. Faktor malar boleh diambil daripada tanda jangkaan:

Hartanah 3. Jangkaan matematik jumlah (perbezaan) pembolehubah rawak adalah sama dengan jumlah (perbezaan) jangkaan matematiknya:

Harta benda 4. Jangkaan matematik hasil darab rawak adalah sama dengan hasil darab jangkaan matematiknya:

Harta 5. Jika semua nilai pembolehubah rawak X menurun (meningkat) dengan bilangan yang sama DENGAN, maka jangkaan matematiknya akan berkurangan (meningkat) dengan nombor yang sama:

Apabila anda tidak boleh dihadkan hanya kepada jangkaan matematik

Dalam kebanyakan kes, hanya jangkaan matematik tidak dapat mencirikan pembolehubah rawak dengan secukupnya.

Biarkan pembolehubah rawak X Dan Y diberikan oleh undang-undang pengedaran berikut:

Maknanya X Kebarangkalian
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Maknanya Y Kebarangkalian
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Jangkaan matematik bagi kuantiti ini adalah sama - sama dengan sifar:

Walau bagaimanapun, pengedaran mereka berbeza. Nilai rawak X hanya boleh mengambil nilai yang sedikit berbeza daripada jangkaan matematik, dan pembolehubah rawak Y boleh mengambil nilai yang menyimpang dengan ketara daripada jangkaan matematik. Contoh yang sama: gaji purata tidak memungkinkan untuk menilai bahagian pekerja bergaji tinggi dan rendah. Dalam erti kata lain, dengan jangkaan matematik seseorang tidak boleh menilai apa penyelewengan daripadanya, sekurang-kurangnya secara purata, mungkin. Untuk melakukan ini, anda perlu mencari varians pembolehubah rawak.

Serakan pembolehubah rawak diskret

penyebaran pembolehubah rawak diskret X dipanggil jangkaan matematik bagi kuasa dua sisihan daripada jangkaan matematik:

Sisihan piawai pembolehubah rawak X ialah nilai aritmetik punca kuasa dua variansnya:

.

Contoh 5 Kira varians dan sisihan piawai pembolehubah rawak X Dan Y, yang undang-undang pengedarannya diberikan dalam jadual di atas.

Penyelesaian. Jangkaan matematik pembolehubah rawak X Dan Y, seperti yang terdapat di atas, adalah sama dengan sifar. Mengikut formula serakan untuk E(X)=E(y)=0 kita dapat:

Kemudian sisihan piawai pembolehubah rawak X Dan Y membentuk

.

Oleh itu, dengan jangkaan matematik yang sama, varians pembolehubah rawak X sangat kecil dan rawak Y- ketara. Ini adalah akibat daripada perbezaan dalam pengedaran mereka.

Contoh 6 Pelabur mempunyai 4 projek pelaburan alternatif. Jadual meringkaskan data mengenai jangkaan keuntungan dalam projek ini dengan kebarangkalian yang sepadan.

Projek 1Projek 2Projek 3Projek 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Cari bagi setiap alternatif jangkaan matematik, varians dan sisihan piawai.

Penyelesaian. Mari kita tunjukkan bagaimana kuantiti ini dikira untuk alternatif ke-3:

Jadual meringkaskan nilai yang ditemui untuk semua alternatif.

Semua alternatif mempunyai jangkaan matematik yang sama. Ini bermakna dalam jangka masa panjang semua orang mempunyai pendapatan yang sama. Sisihan piawai boleh ditafsirkan sebagai ukuran risiko - lebih besar ia, lebih besar risiko pelaburan. Pelabur yang tidak mahu banyak risiko akan memilih projek 1 kerana ia mempunyai sisihan piawai terkecil (0). Jika pelabur lebih suka risiko dan pulangan tinggi dalam tempoh yang singkat, maka dia akan memilih projek yang mempunyai sisihan piawai terbesar - projek 4.

Sifat Serakan

Marilah kita membentangkan sifat-sifat serakan.

Harta 1. Penyerakan nilai malar ialah sifar:

Harta 2. Faktor malar boleh dikeluarkan daripada tanda serakan dengan mengkuadratkannya:

.

Hartanah 3. Varians pembolehubah rawak adalah sama dengan jangkaan matematik bagi kuasa dua nilai ini, dari mana kuasa dua jangkaan matematik bagi nilai itu sendiri dikurangkan:

,

di mana .

Harta benda 4. Varians jumlah (perbezaan) pembolehubah rawak adalah sama dengan jumlah (perbezaan) variansnya:

Contoh 7 Adalah diketahui bahawa pembolehubah rawak diskret X hanya mengambil dua nilai: −3 dan 7. Di samping itu, jangkaan matematik diketahui: E(X) = 4 . Cari varians pembolehubah rawak diskret.

Penyelesaian. Nyatakan dengan hlm kebarangkalian pembolehubah rawak mengambil nilai x1 = −3 . Kemudian kebarangkalian nilai x2 = 7 akan menjadi 1 − hlm. Mari terbitkan persamaan untuk jangkaan matematik:

E(X) = x 1 hlm + x 2 (1 − hlm) = −3hlm + 7(1 − hlm) = 4 ,

di mana kita mendapat kebarangkalian: hlm= 0.3 dan 1 − hlm = 0,7 .

Hukum taburan pembolehubah rawak:

X −3 7
hlm 0,3 0,7

Kami mengira varians pembolehubah rawak ini menggunakan formula daripada sifat 3 varians:

D(X) = 2,7 + 34,3 − 16 = 21 .

Cari sendiri jangkaan matematik pembolehubah rawak, dan kemudian lihat penyelesaiannya

Contoh 8 Pembolehubah rawak diskret X hanya mengambil dua nilai. Ia mengambil nilai yang lebih besar iaitu 3 dengan kebarangkalian 0.4. Selain itu, varians pembolehubah rawak diketahui D(X) = 6 . Cari jangkaan matematik bagi pembolehubah rawak.

Contoh 9 Sebuah guci mengandungi 6 bola putih dan 4 bola hitam. 3 biji bola diambil dari urn. Bilangan bola putih di antara bola yang ditarik ialah pembolehubah rawak diskret X. Cari jangkaan dan varians matematik bagi pembolehubah rawak ini.

Penyelesaian. Nilai rawak X boleh mengambil nilai 0, 1, 2, 3. Kebarangkalian yang sepadan boleh dikira daripada peraturan pendaraban kebarangkalian. Hukum taburan pembolehubah rawak:

X 0 1 2 3
hlm 1/30 3/10 1/2 1/6

Oleh itu jangkaan matematik pembolehubah rawak ini:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Varians pembolehubah rawak yang diberikan ialah:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Jangkaan matematik dan serakan pembolehubah rawak berterusan

Untuk pembolehubah rawak berterusan, tafsiran mekanikal jangkaan matematik akan mengekalkan makna yang sama: pusat jisim untuk jisim unit yang diedarkan secara berterusan pada paksi-x dengan ketumpatan. f(x). Berbeza dengan pembolehubah rawak diskret, yang mana hujah fungsi xi berubah secara mendadak, untuk pembolehubah rawak berterusan, hujah berubah secara berterusan. Tetapi jangkaan matematik bagi pembolehubah rawak berterusan juga berkaitan dengan nilai minnya.

Untuk mencari jangkaan dan varians matematik pembolehubah rawak berterusan, anda perlu mencari kamiran pasti . Jika fungsi ketumpatan pembolehubah rawak selanjar diberikan, maka ia masuk terus ke dalam integrand. Jika fungsi taburan kebarangkalian diberikan, maka dengan membezakannya, anda perlu mencari fungsi ketumpatan.

Purata aritmetik semua nilai yang mungkin bagi pembolehubah rawak berterusan dipanggilnya jangkaan matematik, dilambangkan dengan atau .

Penyerakan pembolehubah rawak adalah ukuran penyebaran nilai pembolehubah ini. Varians kecil bermakna bahawa nilai-nilai dikelompokkan rapat antara satu sama lain. Varians yang besar menunjukkan taburan nilai yang kuat. Konsep serakan pembolehubah rawak digunakan dalam statistik. Sebagai contoh, jika anda membandingkan varians nilai dua kuantiti (seperti hasil pemerhatian pesakit lelaki dan wanita), anda boleh menguji kepentingan beberapa pembolehubah. Varians juga digunakan semasa membina model statistik, kerana varians yang kecil boleh menjadi petanda bahawa anda telah melakukan overfitting nilai.

Langkah-langkah

Pengiraan Varians Contoh

  1. Catatkan nilai sampel. Dalam kebanyakan kes, hanya sampel populasi tertentu tersedia untuk ahli statistik. Sebagai contoh, sebagai peraturan, ahli statistik tidak menganalisis kos mengekalkan populasi semua kereta di Rusia - mereka menganalisis sampel rawak beberapa ribu kereta. Sampel sedemikian akan membantu menentukan kos purata setiap kereta, tetapi kemungkinan besar, nilai yang terhasil akan jauh dari yang sebenar.

    • Sebagai contoh, mari analisa bilangan roti yang dijual di kafe dalam masa 6 hari, diambil secara rawak. Sampel mempunyai bentuk berikut: 17, 15, 23, 7, 9, 13. Ini adalah sampel, bukan populasi, kerana kami tidak mempunyai data tentang roti yang dijual untuk setiap hari kafe dibuka.
    • Jika anda diberi populasi dan bukan sampel nilai, langkau ke bahagian seterusnya.
  2. Tuliskan formula untuk mengira varians sampel. Serakan ialah ukuran sebaran nilai sesuatu kuantiti. Semakin hampir nilai serakan kepada sifar, semakin hampir nilai-nilai itu dikumpulkan bersama. Apabila bekerja dengan sampel nilai, gunakan formula berikut untuk mengira varians:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) ialah serakan. Serakan diukur dalam unit persegi.
    • x i (\displaystyle x_(i))- setiap nilai dalam sampel.
    • x i (\displaystyle x_(i)) anda perlu menolak xᅳ, kuasa dua, dan kemudian tambah hasilnya.
    • xᅳ – min sampel (min sampel).
    • n ialah bilangan nilai dalam sampel.
  3. Kirakan min sampel. Ia dilambangkan sebagai xᅳ. Min sampel dikira seperti min aritmetik biasa: tambah semua nilai dalam sampel, dan kemudian bahagikan hasilnya dengan bilangan nilai dalam sampel.

    • Dalam contoh kami, tambahkan nilai dalam sampel: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Sekarang bahagikan hasilnya dengan bilangan nilai dalam sampel (dalam contoh kami terdapat 6): 84 ÷ 6 = 14.
      Sampel min xᅳ = 14.
    • Purata sampel ialah nilai pusat di mana nilai dalam sampel diedarkan. Jika nilai dalam kelompok sampel di sekeliling sampel bermakna, maka varians adalah kecil; jika tidak, serakan adalah besar.
  4. Kurangkan min sampel daripada setiap nilai dalam sampel. Sekarang hitung perbezaannya x i (\displaystyle x_(i))- xᅳ, di mana x i (\displaystyle x_(i))- setiap nilai dalam sampel. Setiap keputusan yang diperoleh menunjukkan sejauh mana nilai tertentu menyimpang daripada min sampel, iaitu sejauh mana nilai ini daripada min sampel.

    • Dalam contoh kami:
      x 1 (\displaystyle x_(1))- xᅳ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- xᅳ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- xᅳ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- xᅳ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- xᅳ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- xᅳ = 13 - 14 = -1
    • Ketepatan keputusan yang diperoleh adalah mudah untuk disahkan, kerana jumlahnya mestilah sama dengan sifar. Ini berkaitan dengan penentuan nilai purata, kerana nilai negatif (jarak dari nilai purata ke nilai yang lebih kecil) sepenuhnya diimbangi oleh nilai positif (jarak dari nilai purata ke nilai yang lebih besar).
  5. Seperti yang dinyatakan di atas, jumlah perbezaan x i (\displaystyle x_(i))- xᅳ mestilah sama dengan sifar. Ini bermakna varians min sentiasa sifar, yang tidak memberikan sebarang idea tentang penyebaran nilai beberapa kuantiti. Untuk menyelesaikan masalah ini, kuasa duakan setiap perbezaan x i (\displaystyle x_(i))- x̅. Ini akan menyebabkan anda hanya mendapat nombor positif yang, apabila ditambah bersama, tidak akan menambah sehingga 0.

    • Dalam contoh kami:
      (x 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Anda telah menemui kuasa dua beza - x̅) 2 (\displaystyle ^(2)) bagi setiap nilai dalam sampel.
  6. Kira jumlah perbezaan kuasa dua. Iaitu, cari bahagian formula yang ditulis seperti ini: ∑[( x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. Di sini tanda Σ bermaksud jumlah perbezaan kuasa dua untuk setiap nilai x i (\displaystyle x_(i)) dalam sampel. Anda telah menemui perbezaan kuasa dua (x i (\displaystyle (x_(i)))-x̅) 2 (\displaystyle ^(2)) bagi setiap nilai x i (\displaystyle x_(i)) dalam sampel; sekarang hanya tambah petak ini.

    • Dalam contoh kami: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Bahagikan hasilnya dengan n - 1, dengan n ialah bilangan nilai dalam sampel. Beberapa ketika dahulu, untuk mengira varians sampel, ahli statistik hanya membahagikan hasilnya dengan n; dalam kes ini, anda akan mendapat min varians kuasa dua, yang sesuai untuk menerangkan varians sampel yang diberikan. Tetapi ingat bahawa mana-mana sampel hanyalah sebahagian kecil daripada populasi umum nilai. Jika anda mengambil sampel yang berbeza dan melakukan pengiraan yang sama, anda akan mendapat hasil yang berbeza. Ternyata, membahagikan dengan n - 1 (bukan hanya n) memberikan anggaran varians populasi yang lebih baik, iaitu perkara yang anda cari. Membahagi dengan n - 1 telah menjadi perkara biasa, jadi ia termasuk dalam formula untuk mengira varians sampel.

    • Dalam contoh kami, sampel termasuk 6 nilai, iaitu, n = 6.
      Varians sampel = s 2 = 166 6 − 1 = (\gaya paparan s^(2)=(\frac (166)(6-1))=) 33,2
  8. Perbezaan antara varians dan sisihan piawai. Ambil perhatian bahawa formula mengandungi eksponen, jadi varians diukur dalam unit kuasa dua nilai yang dianalisis. Kadangkala nilai sedemikian agak sukar untuk dikendalikan; dalam kes sedemikian, sisihan piawai digunakan, yang sama dengan punca kuasa dua varians. Itulah sebabnya varians sampel ditandakan sebagai s 2 (\displaystyle s^(2)), dan sisihan piawai sampel sebagai s (\displaystyle s).

    • Dalam contoh kami, sisihan piawai sampel ialah: s = √33.2 = 5.76.

    Pengiraan varians populasi

    1. Menganalisis beberapa set nilai. Set termasuk semua nilai kuantiti yang sedang dipertimbangkan. Sebagai contoh, jika anda mengkaji umur penduduk wilayah Leningrad, maka populasi termasuk umur semua penduduk wilayah ini. Dalam kes bekerja dengan agregat, adalah disyorkan untuk membuat jadual dan masukkan nilai agregat ke dalamnya. Pertimbangkan contoh berikut:

      • Terdapat 6 akuarium di dalam bilik tertentu. Setiap akuarium mengandungi bilangan ikan berikut:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Tuliskan formula untuk mengira varians populasi. Oleh kerana populasi merangkumi semua nilai kuantiti tertentu, formula berikut membolehkan anda mendapatkan nilai tepat varians populasi. Untuk membezakan varians populasi daripada varians sampel (yang hanya anggaran), ahli statistik menggunakan pelbagai pembolehubah:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- varians populasi (dibaca sebagai "sigma kuasa dua"). Serakan diukur dalam unit persegi.
      • x i (\displaystyle x_(i))- setiap nilai dalam agregat.
      • Σ ialah tanda jumlah. Iaitu, untuk setiap nilai x i (\displaystyle x_(i)) tolak μ, kuasa dua, dan kemudian tambah hasilnya.
      • μ ialah min populasi.
      • n ialah bilangan nilai dalam populasi umum.
    3. Kirakan min populasi. Apabila bekerja dengan populasi umum, nilai puratanya dilambangkan sebagai μ (mu). Purata populasi dikira sebagai purata aritmetik biasa: tambah semua nilai dalam populasi, dan kemudian bahagikan hasilnya dengan bilangan nilai dalam populasi.

      • Perlu diingat bahawa purata tidak selalu dikira sebagai min aritmetik.
      • Dalam contoh kami, populasi bermakna: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Kurangkan min populasi daripada setiap nilai dalam populasi. Semakin hampir nilai perbezaan kepada sifar, semakin hampir nilai tertentu dengan min populasi. Cari perbezaan antara setiap nilai dalam populasi dan minnya, dan anda akan mendapat pandangan pertama pada taburan nilai tersebut.

      • Dalam contoh kami:
        x 1 (\displaystyle x_(1))- μ = 5 - 10.5 = -5.5
        x 2 (\displaystyle x_(2))- μ = 5 - 10.5 = -5.5
        x 3 (\displaystyle x_(3))- μ = 8 - 10.5 = -2.5
        x 4 (\displaystyle x_(4))- μ = 12 - 10.5 = 1.5
        x 5 (\displaystyle x_(5))- μ = 15 - 10.5 = 4.5
        x 6 (\displaystyle x_(6))- μ = 18 - 10.5 = 7.5
    5. Square setiap hasil yang anda dapat. Nilai perbezaan akan menjadi positif dan negatif; jika anda meletakkan nilai ini pada garis nombor, maka ia akan terletak di sebelah kanan dan kiri min populasi. Ini tidak baik untuk mengira varians, kerana nombor positif dan negatif membatalkan satu sama lain. Oleh itu, kuasai setiap perbezaan untuk mendapatkan nombor positif secara eksklusif.

      • Dalam contoh kami:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) untuk setiap nilai populasi (dari i = 1 hingga i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Di mana x n (\displaystyle x_(n)) ialah nilai terakhir dalam populasi.
      • Untuk mengira nilai purata keputusan yang diperoleh, anda perlu mencari jumlahnya dan membahagikannya dengan n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Sekarang mari kita tulis penjelasan di atas menggunakan pembolehubah: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n dan dapatkan formula untuk mengira varians populasi.

Serakan dalam statistik didapati sebagai nilai individu bagi ciri dalam petak . Bergantung pada data awal, ia ditentukan oleh formula varians mudah dan berwajaran:

1. (untuk data tidak terkumpul) dikira dengan formula:

2. Varians berwajaran (untuk siri variasi):

di mana n ialah kekerapan (faktor kebolehulangan X)

Contoh mencari varians

Halaman ini menerangkan contoh standard mencari varians, anda juga boleh melihat tugas lain untuk mencarinya

Contoh 1. Kami mempunyai data berikut untuk sekumpulan 20 pelajar surat-menyurat. Ia adalah perlu untuk membina siri selang taburan ciri, mengira nilai min ciri dan mengkaji variansnya

Mari kita bina kumpulan selang. Mari kita tentukan julat selang dengan formula:

dengan X max ialah nilai maksimum bagi ciri kumpulan;
X min ialah nilai minimum bagi ciri kumpulan;
n ialah bilangan selang:

Kami menerima n=5. Langkahnya ialah: h \u003d (192 - 159) / 5 \u003d 6.6

Mari buat kumpulan selang

Untuk pengiraan lanjut, kami akan membina jadual tambahan:

X'i ialah pertengahan selang. (contohnya, pertengahan selang 159 - 165.6 = 162.3)

Purata pertumbuhan pelajar ditentukan oleh formula purata wajaran aritmetik:

Kami menentukan penyebaran dengan formula:

Formula varians boleh ditukar seperti berikut:

Daripada formula ini ia mengikutinya varians ialah perbezaan antara min kuasa dua pilihan dan kuasa dua dan min.

Varians dalam siri variasi dengan selang yang sama mengikut kaedah momen boleh dikira dengan cara berikut menggunakan sifat serakan kedua (membahagikan semua pilihan dengan nilai selang). Definisi varians, dikira dengan kaedah momen, mengikut formula berikut adalah kurang memakan masa:

di mana i ialah nilai selang;
A - sifar bersyarat, yang sesuai untuk menggunakan pertengahan selang dengan frekuensi tertinggi;
m1 ialah kuasa dua momen tertib pertama;
m2 - momen urutan kedua

(jika dalam populasi statistik atribut berubah sedemikian rupa sehingga terdapat hanya dua pilihan yang saling eksklusif, maka kebolehubahan tersebut dipanggil alternatif) boleh dikira dengan formula:

Menggantikan dalam formula penyebaran ini q = 1- p, kita dapat:

Jenis-jenis penyebaran

Jumlah varians mengukur variasi sesuatu sifat ke atas keseluruhan populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi ini. Ia adalah sama dengan kuasa dua min bagi sisihan nilai individu atribut x daripada jumlah nilai purata x dan boleh ditakrifkan sebagai varians mudah atau varians berwajaran.

mencirikan variasi rawak, i.e. sebahagian daripada variasi, yang disebabkan oleh pengaruh faktor yang tidak diambil kira dan tidak bergantung pada faktor tanda yang mendasari pengelompokan. Varians ini adalah sama dengan min kuasa dua sisihan nilai individu atribut dalam kumpulan X daripada min aritmetik kumpulan dan boleh dikira sebagai varians mudah atau sebagai varians berwajaran.

Oleh itu, ukuran varians dalam kumpulan variasi sifat dalam kumpulan dan ditentukan oleh formula:

di mana xi - purata kumpulan;
ni ialah bilangan unit dalam kumpulan.

Sebagai contoh, varians intra-kumpulan yang perlu ditentukan dalam tugas mengkaji kesan kelayakan pekerja terhadap tahap produktiviti buruh di kedai menunjukkan variasi dalam output dalam setiap kumpulan disebabkan oleh semua faktor yang mungkin (keadaan teknikal peralatan, ketersediaan alatan dan bahan, umur pekerja, intensiti buruh, dsb.), kecuali perbezaan dalam kategori kelayakan (dalam kumpulan, semua pekerja mempunyai kelayakan yang sama).

Purata varians dalam kumpulan mencerminkan rawak, iaitu, bahagian variasi yang berlaku di bawah pengaruh semua faktor lain, kecuali faktor kumpulan. Ia dikira dengan formula:

Ia mencirikan variasi sistematik sifat yang terhasil, yang disebabkan oleh pengaruh faktor sifat yang mendasari pengelompokan. Ia sama dengan kuasa dua min bagi sisihan min kumpulan daripada min keseluruhan. Varians antara kumpulan dikira dengan formula:

Peraturan penambahan varians dalam statistik

mengikut peraturan penambahan varians jumlah varians adalah sama dengan jumlah purata varians antara kumpulan dan antara kumpulan:

Maksud peraturan ini ialah jumlah varians yang berlaku di bawah pengaruh semua faktor adalah sama dengan jumlah varians yang timbul di bawah pengaruh semua faktor lain, dan varians yang timbul disebabkan oleh faktor pengelompokan.

Menggunakan formula untuk menambah varians, adalah mungkin untuk menentukan ketiga yang tidak diketahui daripada dua varians yang diketahui, dan juga untuk menilai kekuatan pengaruh atribut kumpulan.

Sifat Serakan

1. Jika semua nilai atribut dikurangkan (ditambah) dengan nilai malar yang sama, maka varians tidak akan berubah daripada ini.
2. Jika semua nilai atribut dikurangkan (ditambah) dengan bilangan kali n yang sama, maka varians akan berkurangan (peningkatan) sebanyak n^2 kali.