Biografi Ciri-ciri Analisis

Formula untuk mengira varians pembolehubah rawak diskret. Jangkaan matematik dan varians pembolehubah rawak

Varians dalam statistik ditakrifkan sebagai min sisihan piawai nilai individu bagi sifat kuasa dua daripada min aritmetik. Cara biasa untuk mengira sisihan kuasa dua pilihan daripada min dan kemudian puratanya.

Dalam analisis ekonomi dan statistik, adalah lazim untuk menilai variasi ciri paling kerap menggunakan sisihan piawai, iaitu punca kuasa dua varians.

(3)

Ia mencirikan turun naik mutlak nilai atribut pembolehubah dan dinyatakan dalam unit yang sama dengan varian. Dalam statistik, sering menjadi perlu untuk membandingkan variasi pelbagai ciri. Untuk perbandingan sedemikian, penunjuk relatif variasi, pekali variasi, digunakan.

Sifat serakan:

1) jika anda menolak sebarang nombor daripada semua pilihan, maka varians tidak akan berubah;

2) jika semua nilai varian dibahagikan dengan beberapa nombor b, maka varians akan berkurangan sebanyak b^2 kali, i.e.

3) jika anda mengira persegi tengah sisihan daripada sebarang nombor dengan min aritmetik yang tidak sama, maka ia akan lebih besar daripada varians. Dalam kes ini, dengan nilai yang jelas bagi setiap persegi perbezaan antara nilai purata pos.

Varians boleh ditakrifkan sebagai perbezaan antara min kuasa dua dan min kuasa dua.

17. Variasi kumpulan dan antara kumpulan. Peraturan penambahan varians

Jika populasi statistik dibahagikan kepada kumpulan atau bahagian mengikut ciri yang dikaji, maka bagi populasi sedemikian, jenis berikut varians: kumpulan (swasta), purata kumpulan (swasta), dan antara kumpulan.

Jumlah varians- mencerminkan variasi sifat disebabkan semua keadaan dan punca beroperasi dalam populasi statistik tertentu.

Varians kumpulan- sama dengan sisihan kuasa dua min nilai individu ciri dalam kumpulan daripada min aritmetik kumpulan ini, dipanggil min kumpulan. Dalam kes ini, purata kumpulan tidak bertepatan dengan jumlah purata untuk keseluruhan populasi.

Varians kumpulan mencerminkan variasi sifat hanya disebabkan oleh keadaan dan punca beroperasi dalam kumpulan.

Purata variasi kumpulan- ditakrifkan sebagai purata aritmetik berwajaran bagi serakan kumpulan, dengan pemberat ialah isipadu kumpulan.

Varians antara kumpulan- adalah sama dengan min kuasa dua sisihan kumpulan bermakna daripada jumlah min.

Varians antara kumpulan mencirikan variasi atribut terhasil disebabkan oleh atribut kumpulan.

Terdapat hubungan tertentu antara jenis serakan yang dipertimbangkan: jumlah serakan adalah sama dengan jumlah kumpulan purata dan varians antara kumpulan.

Hubungan ini dipanggil peraturan penambahan varians.

18. Siri dinamik dan unsur konstituennya. Jenis siri dinamik.

Siri dalam statistik- ini adalah data digital yang menunjukkan sama ada fenomena berubah dalam masa atau ruang dan memungkinkan untuk membuat perbandingan statistik fenomena dalam proses perkembangannya dalam masa dan dalam pelbagai bentuk dan jenis proses. Terima kasih kepada ini, adalah mungkin untuk mengesan pergantungan bersama fenomena.

Proses perkembangan pergerakan fenomena sosial dalam masa dalam statistik biasanya dipanggil dinamik. Untuk memaparkan dinamik, siri dinamik (kronologi, temporal) dibina, yang merupakan siri nilai perubahan masa penunjuk statistik (contohnya, bilangan banduan lebih 10 tahun), terletak di susunan kronologi. Unsur konstituennya ialah nilai berangka penunjuk tertentu dan tempoh atau titik masa yang dirujuknya.

Ciri yang paling penting dalam siri masa- saiz (isipadu, nilai) fenomena ini atau itu, dicapai dalam tempoh tertentu atau pada saat tertentu. Sehubungan itu, magnitud istilah siri dinamik adalah tahapnya. Membezakan peringkat awal, pertengahan dan akhir siri dinamik. Tahap pertama menunjukkan nilai yang pertama, akhir - nilai ahli terakhir siri. Tahap purata mewakili purata julat variasi kronologi dan dikira bergantung pada sama ada siri masa adalah selang atau segera.

Yang lagi satu ciri penting siri dinamik- masa berlalu dari pemerhatian awal hingga akhir, atau bilangan pemerhatian sedemikian.

Terdapat pelbagai jenis siri masa, ia boleh dikelaskan mengikut kriteria berikut.

1) Bergantung pada cara menyatakan tahap, siri dinamik dibahagikan kepada siri penunjuk mutlak dan terbitan (nilai relatif dan purata).

2) Bergantung pada cara tahap siri menyatakan keadaan fenomena pada titik masa tertentu (pada awal bulan, suku tahun, dll.) atau nilainya untuk selang masa tertentu (contohnya, setiap hari, bulan, tahun, dsb.) n.), bezakan antara siri momen dan selang dinamik, masing-masing. Siri detik dalam kerja analisis agensi penguatkuasa undang-undang digunakan agak jarang.

Dalam teori statistik, dinamik juga dibezakan mengikut beberapa ciri pengelasan lain: bergantung pada jarak antara tahap - dengan tahap yang sama dan tahap yang tidak sama dalam masa; bergantung kepada kehadiran trend utama proses yang dikaji - pegun dan tidak pegun. Apabila menganalisis siri masa datang dari peringkat seterusnya siri dibentangkan dalam bentuk komponen:

Y t \u003d TP + E (t)

di mana TR ialah komponen penentu yang menentukan arah aliran umum perubahan mengikut masa atau arah aliran.

E(t) - komponen rawak menyebabkan turun naik tahap.

Nilai yang dijangkakan dan serakan - ciri berangka yang paling biasa digunakan pembolehubah rawak. Mereka mencirikan ciri pengedaran yang paling penting: kedudukan dan tahap penyebarannya. Dalam banyak masalah amalan, penerangan lengkap dan menyeluruh tentang pembolehubah rawak - hukum pengedaran - sama ada tidak boleh diperolehi sama sekali, atau tidak diperlukan sama sekali. Dalam kes ini, ia terhad kepada perihalan anggaran pembolehubah rawak menggunakan ciri berangka.

Jangkaan matematik sering dirujuk sebagai nilai purata pembolehubah rawak. Serakan pembolehubah rawak adalah ciri serakan, serakan pembolehubah rawak di sekeliling jangkaan matematiknya.

Jangkaan matematik bagi pembolehubah rawak diskret

Mari kita mendekati konsep jangkaan matematik, mula-mula meneruskan dari tafsiran mekanikal taburan pembolehubah rawak diskret. Biarkan jisim unit diedarkan di antara titik-titik paksi-x x1 , x 2 , ..., x n, dan setiap titik bahan mempunyai jisim yang sepadan dengannya hlm1 , hlm 2 , ..., hlm n. Ia dikehendaki memilih satu titik pada paksi-x, mencirikan kedudukan keseluruhan sistem mata material, dengan mengambil kira jisim mereka. Adalah wajar untuk mengambil pusat jisim sistem titik bahan sebagai titik sedemikian. Ini ialah purata wajaran pembolehubah rawak X, di mana absis setiap titik xi masuk dengan "berat" sama dengan kebarangkalian yang sepadan. Nilai min pembolehubah rawak yang diperolehi X dipanggil jangkaan matematiknya.

Jangkaan matematik pembolehubah rawak diskret ialah jumlah hasil darab semua nilai yang mungkin dan kebarangkalian nilai ini:

Contoh 1 Menganjurkan loteri menang-menang. Terdapat 1000 kemenangan, 400 daripadanya adalah 10 rubel setiap satu. 300 - 20 rubel setiap satu 200 - 100 rubel setiap satu. dan 100 - 200 rubel setiap satu. Apa saiz purata kemenangan bagi seseorang yang membeli satu tiket?

Penyelesaian. Kami mendapati pulangan purata jika jumlah keseluruhan kemenangan, yang sama dengan 10 * 400 + 20 * 300 + 100 * 200 + 200 * 100 = 50,000 rubel, dibahagikan dengan 1000 (jumlah kemenangan). Kemudian kita mendapat 50000/1000 = 50 rubel. Tetapi ungkapan untuk mengira keuntungan purata juga boleh diwakili dalam bentuk berikut:

Sebaliknya, di bawah syarat ini, jumlah kemenangan adalah pembolehubah rawak yang boleh mengambil nilai 10, 20, 100 dan 200 rubel. dengan kebarangkalian sama dengan 0.4, masing-masing; 0.3; 0.2; 0.1. Oleh itu, pulangan purata yang dijangkakan adalah sama dengan jumlah produk saiz kemenangan dengan kebarangkalian untuk mendapatkannya.

Contoh 2 Penerbit memutuskan untuk menerbitkan buku baru. Dia akan menjual buku itu dengan harga 280 rubel, di mana 200 akan diberikan kepadanya, 50 ke kedai buku, dan 30 kepada penulis. Jadual memberikan maklumat tentang kos penerbitan buku dan kemungkinan menjual sejumlah salinan buku tersebut.

Cari keuntungan jangkaan penerbit.

Penyelesaian. Pembolehubah rawak "keuntungan" adalah sama dengan perbezaan antara pendapatan daripada jualan dan kos kos. Sebagai contoh, jika 500 salinan buku dijual, maka pendapatan daripada jualan ialah 200 * 500 = 100,000, dan kos penerbitan ialah 225,000 rubel. Oleh itu, penerbit menghadapi kerugian sebanyak 125,000 rubel. Jadual berikut meringkaskan nilai jangkaan pembolehubah rawak - keuntungan:

NomborUntung xi Kebarangkalian hlmi xi hlm i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Jumlah: 1,00 25000

Oleh itu, kami memperoleh jangkaan matematik keuntungan penerbit:

.

Contoh 3 Peluang untuk memukul dengan satu pukulan hlm= 0.2. Tentukan penggunaan cengkerang yang memberikan jangkaan matematik bilangan pukulan bersamaan dengan 5.

Penyelesaian. Daripada formula jangkaan yang sama yang telah kami gunakan setakat ini, kami nyatakan x- penggunaan cengkerang:

.

Contoh 4 Tentukan jangkaan matematik pembolehubah rawak x bilangan pukulan dengan tiga pukulan, jika kebarangkalian pukulan dengan setiap pukulan hlm = 0,4 .

Petunjuk: cari kebarangkalian nilai pembolehubah rawak dengan Formula Bernoulli .

Sifat Jangkaan

Pertimbangkan sifat jangkaan matematik.

Harta 1. Jangkaan matematik bagi nilai pemalar adalah sama dengan pemalar ini:

Harta 2. Faktor malar boleh diambil daripada tanda jangkaan:

Hartanah 3. Jangkaan matematik jumlah (perbezaan) pembolehubah rawak adalah sama dengan jumlah (perbezaan) jangkaan matematiknya:

Harta benda 4. Jangkaan matematik hasil darab rawak adalah sama dengan hasil darab jangkaan matematiknya:

Harta 5. Jika semua nilai pembolehubah rawak X menurun (meningkat) dengan bilangan yang sama DARI, maka jangkaan matematiknya akan berkurangan (meningkat) dengan nombor yang sama:

Apabila anda tidak boleh dihadkan hanya kepada jangkaan matematik

Dalam kebanyakan kes, hanya jangkaan matematik tidak dapat mencirikan pembolehubah rawak dengan secukupnya.

Biarkan pembolehubah rawak X dan Y diberikan oleh undang-undang pengedaran berikut:

Maknanya X Kebarangkalian
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Maknanya Y Kebarangkalian
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Jangkaan matematik bagi kuantiti ini adalah sama - sama dengan sifar:

Walau bagaimanapun, pengedaran mereka berbeza. Nilai rawak X hanya boleh mengambil nilai yang sedikit berbeza daripada jangkaan matematik, dan pembolehubah rawak Y boleh mengambil nilai yang menyimpang dengan ketara daripada jangkaan matematik. Contoh yang sama: gaji purata tidak memungkinkan untuk menilai graviti tertentu pekerja bergaji tinggi dan rendah. Dalam erti kata lain, dengan jangkaan matematik seseorang tidak boleh menilai apa penyelewengan daripadanya, sekurang-kurangnya secara purata, mungkin. Untuk melakukan ini, anda perlu mencari varians pembolehubah rawak.

Serakan pembolehubah rawak diskret

penyebaran pembolehubah rawak diskret X dipanggil jangkaan matematik bagi kuasa dua sisihan daripada jangkaan matematik:

Sisihan piawai pembolehubah rawak X dipanggil nilai aritmetik punca kuasa dua kelainannya:

.

Contoh 5 Kira varians dan sisihan piawai pembolehubah rawak X dan Y, yang undang-undang pengedarannya diberikan dalam jadual di atas.

Penyelesaian. Jangkaan matematik pembolehubah rawak X dan Y, seperti yang terdapat di atas, adalah sama dengan sifar. Mengikut formula serakan untuk E(X)=E(y)=0 kita dapat:

Kemudian sisihan piawai pembolehubah rawak X dan Y membentuk

.

Oleh itu, dengan jangkaan matematik yang sama, varians pembolehubah rawak X sangat kecil dan rawak Y- ketara. Ini adalah akibat daripada perbezaan dalam pengedaran mereka.

Contoh 6 Pelabur mempunyai 4 projek pelaburan alternatif. Jadual meringkaskan data mengenai jangkaan keuntungan dalam projek ini dengan kebarangkalian yang sepadan.

Projek 1Projek 2Projek 3Projek 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Cari bagi setiap alternatif jangkaan matematik, varians dan sisihan piawai.

Penyelesaian. Mari kita tunjukkan bagaimana kuantiti ini dikira untuk alternatif ke-3:

Jadual meringkaskan nilai yang ditemui untuk semua alternatif.

Semua alternatif mempunyai jangkaan matematik yang sama. Ini bermakna dalam jangka masa panjang semua orang mempunyai pendapatan yang sama. Sisihan piawai boleh ditafsirkan sebagai ukuran risiko - lebih besar ia, lebih besar risiko pelaburan. Seorang pelabur yang tidak sanggup mengambil banyak risiko akan memilih projek 1 kerana ia mempunyai paling sedikit sisihan piawai(0). Jika pelabur lebih suka risiko dan pulangan tinggi dalam tempoh yang singkat, maka dia akan memilih projek yang mempunyai sisihan piawai terbesar - projek 4.

Sifat Serakan

Marilah kita membentangkan sifat-sifat serakan.

Harta 1. Penyerakan nilai malar ialah sifar:

Harta 2. Faktor malar boleh dikeluarkan daripada tanda serakan dengan mengkuadratkannya:

.

Hartanah 3. Varians pembolehubah rawak adalah sama dengan jangkaan matematik bagi kuasa dua nilai ini, dari mana kuasa dua jangkaan matematik bagi nilai itu sendiri dikurangkan:

,

di mana .

Harta benda 4. Varians jumlah (perbezaan) pembolehubah rawak adalah sama dengan jumlah (perbezaan) variansnya:

Contoh 7 Adalah diketahui bahawa pembolehubah rawak diskret X hanya mengambil dua nilai: −3 dan 7. Di samping itu, jangkaan matematik diketahui: E(X) = 4 . Cari varians bagi pembolehubah rawak diskret.

Penyelesaian. Nyatakan dengan hlm kebarangkalian pembolehubah rawak mengambil nilai x1 = −3 . Kemudian kebarangkalian nilai x2 = 7 akan menjadi 1 − hlm. Mari terbitkan persamaan untuk jangkaan matematik:

E(X) = x 1 hlm + x 2 (1 − hlm) = −3hlm + 7(1 − hlm) = 4 ,

di mana kita mendapat kebarangkalian: hlm= 0.3 dan 1 − hlm = 0,7 .

Hukum taburan pembolehubah rawak:

X −3 7
hlm 0,3 0,7

Kami mengira varians pembolehubah rawak ini menggunakan formula daripada sifat 3 varians:

D(X) = 2,7 + 34,3 − 16 = 21 .

Cari sendiri jangkaan matematik pembolehubah rawak, dan kemudian lihat penyelesaiannya

Contoh 8 Pembolehubah rawak diskret X hanya mengambil dua nilai. Ia mengambil nilai yang lebih besar iaitu 3 dengan kebarangkalian 0.4. Selain itu, varians pembolehubah rawak diketahui D(X) = 6 . Cari jangkaan matematik bagi pembolehubah rawak.

Contoh 9 Sebuah guci mengandungi 6 bola putih dan 4 bola hitam. 3 biji bola diambil dari urn. Bilangan bola putih di antara bola yang ditarik ialah pembolehubah rawak diskret X. Cari jangkaan dan varians matematik bagi pembolehubah rawak ini.

Penyelesaian. Nilai rawak X boleh mengambil nilai 0, 1, 2, 3. Kebarangkalian yang sepadan boleh dikira daripada peraturan pendaraban kebarangkalian. Hukum taburan pembolehubah rawak:

X 0 1 2 3
hlm 1/30 3/10 1/2 1/6

Oleh itu jangkaan matematik pembolehubah rawak ini:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Varians pembolehubah rawak yang diberikan ialah:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Jangkaan matematik dan serakan pembolehubah rawak berterusan

Untuk pembolehubah rawak berterusan, tafsiran mekanikal jangkaan matematik akan mengekalkan makna yang sama: pusat jisim untuk jisim unit yang diedarkan secara berterusan pada paksi-x dengan ketumpatan. f(x). Berbeza dengan pembolehubah rawak diskret, yang mana hujah fungsi xi berubah secara mendadak, untuk pembolehubah rawak berterusan, hujah berubah secara berterusan. Tetapi jangkaan matematik bagi pembolehubah rawak berterusan juga berkaitan dengan nilai minnya.

Untuk mencari jangkaan dan varians matematik pembolehubah rawak berterusan, anda perlu mencari kamiran pasti . Jika fungsi ketumpatan pembolehubah rawak selanjar diberikan, maka ia masuk terus ke dalam integrand. Jika fungsi taburan kebarangkalian diberikan, maka dengan membezakannya, anda perlu mencari fungsi ketumpatan.

Purata aritmetik semua nilai yang mungkin bagi pembolehubah rawak berterusan dipanggilnya jangkaan matematik, dilambangkan dengan atau .

Jika populasi dibahagikan kepada kumpulan mengikut ciri yang dikaji, maka jenis serakan berikut boleh dikira untuk populasi ini: jumlah, kumpulan (intrakumpulan), purata kumpulan (purata intrakumpulan), antara kumpulan.

Pada mulanya, ia mengira pekali penentuan, yang menunjukkan bahagian mana variasi umum daripada sifat yang dikaji ialah variasi antara kumpulan, iaitu. disebabkan pengelompokan:

Nisbah korelasi empirikal mencirikan ketatnya hubungan antara pengelompokan (faktorial) dan tanda-tanda berkesan.

Nisbah korelasi empirikal boleh mengambil nilai dari 0 hingga 1.

Untuk menilai keakraban hubungan berdasarkan nisbah korelasi empirikal, anda boleh menggunakan hubungan Chaddock:

Contoh 4 Terdapat data berikut tentang prestasi kerja oleh organisasi reka bentuk dan tinjauan bentuk yang berbeza harta:

takrifkan:

1) jumlah varians;

2) penyebaran kumpulan;

3) purata serakan kumpulan;

4) penyebaran antara kumpulan;

5) jumlah varians berdasarkan peraturan menambah varians;


6) pekali penentuan dan korelasi empirikal.

Buat kesimpulan sendiri.

Penyelesaian:

1. Takrifkan isipadu purata prestasi kerja perusahaan dalam dua bentuk pemilikan:

Kira jumlah varians:

2. Tentukan purata kumpulan:

juta rubel;

mln gosok.

Varian kumpulan:

;

3. Kira purata varians kumpulan:

4. Tentukan varians antara kumpulan:

5. Kira jumlah varians berdasarkan peraturan untuk menambah varians:

6. Tentukan pekali penentuan:

.

Oleh itu, jumlah kerja yang dilakukan oleh organisasi reka bentuk dan tinjauan sebanyak 22% bergantung pada bentuk pemilikan perusahaan.

Nisbah korelasi empirikal dikira dengan formula

.

Nilai penunjuk yang dikira menunjukkan bahawa pergantungan jumlah kerja pada bentuk pemilikan perusahaan adalah kecil.

Contoh 5 Hasil daripada tinjauan tersebut disiplin teknologi tapak pengeluaran menerima data berikut:

Tentukan pekali penentuan

Penyerakanpembolehubah rawak- ukuran penyebaran sesuatu yang diberikan pembolehubah rawak, iaitu dia penyelewengan daripada jangkaan matematik. Dalam statistik, tatatanda (sigma kuasa dua) sering digunakan untuk menunjukkan varians. Punca kuasa dua varians dipanggil sisihan piawai atau spread standard. Sisihan piawai diukur dalam unit yang sama dengan pembolehubah rawak itu sendiri, dan varians diukur dalam kuasa dua unit itu.

Walaupun sangat mudah untuk menggunakan hanya satu nilai (seperti min atau mod dan median) untuk menganggarkan keseluruhan sampel, pendekatan ini boleh membawa kepada kesimpulan yang salah dengan mudah. Sebab bagi keadaan ini bukan terletak pada nilai itu sendiri, tetapi pada hakikat bahawa satu nilai tidak sama sekali mencerminkan penyebaran nilai data.

Sebagai contoh, dalam sampel:

purata ialah 5.

Walau bagaimanapun, tiada unsur dalam sampel itu sendiri dengan nilai 5. Anda mungkin perlu mengetahui sejauh mana hampir setiap elemen sampel dengan nilai minnya. Atau, dengan kata lain, anda perlu mengetahui varians nilai. Mengetahui sejauh mana data telah berubah, anda boleh mentafsir dengan lebih baik bermakna, median dan fesyen. Tahap perubahan dalam nilai sampel ditentukan dengan mengira varians dan sisihan piawai mereka.



Varians dan punca kuasa dua varians, dipanggil sisihan piawai, mencirikan sisihan min daripada min sampel. Antara dua kuantiti ini nilai tertinggi Ia ada sisihan piawai. Nilai ini boleh diwakili sebagai jarak purata di mana unsur-unsur adalah dari unsur tengah sampel.

Penyerakan sukar untuk ditafsirkan secara bermakna. Walau bagaimanapun, punca kuasa dua nilai ini ialah sisihan piawai dan sesuai untuk tafsiran.

Sisihan piawai dikira dengan terlebih dahulu menentukan varians dan kemudian mengira punca kuasa dua varians.

Sebagai contoh, untuk tatasusunan data yang ditunjukkan dalam rajah, nilai berikut:

Gambar 1

Di sini, min bagi perbezaan kuasa dua ialah 717.43. Untuk mendapatkan sisihan piawai, ia kekal hanya untuk mengambil punca kuasa dua nombor ini.

Hasilnya adalah kira-kira 26.78.

Perlu diingat bahawa sisihan piawai ditafsirkan sebagai jarak purata di mana unsur-unsur adalah dari min sampel.

Sisihan piawai menunjukkan seberapa baik min menggambarkan keseluruhan sampel.

Katakan anda adalah ketua jabatan pengeluaran untuk memasang PC. Laporan suku tahunan mengatakan bahawa output untuk suku terakhir ialah 2500 PC. Adakah ia buruk atau baik? Anda meminta (atau sudah ada lajur ini dalam laporan) untuk memaparkan sisihan piawai untuk data ini dalam laporan. Angka sisihan piawai, sebagai contoh, ialah 2000. Ia menjadi jelas kepada anda, sebagai ketua jabatan, bahawa barisan pengeluaran memerlukan pengurusan yang lebih baik(penyimpangan terlalu besar dalam bilangan PC yang dipasang).

Mari kita ingat: bila saiz besar Jika sisihan piawai terlalu rendah, data tersebar secara meluas di sekitar min, dan jika sisihan piawai rendah, ia dikelompokkan hampir dengan min.

Empat fungsi statistik VARP(), VARP(), STDEV() dan STDEV() direka untuk mengira varians dan sisihan piawai nombor dalam julat sel. Sebelum mengira varians dan sisihan piawai bagi satu set data, adalah perlu untuk menentukan sama ada data mewakili populasi umum atau sampel penduduk. Dalam kes sampel daripada populasi umum, fungsi VARP() dan STDEV() hendaklah digunakan, dan dalam kes populasi umum, fungsi VARP() dan STDEV() hendaklah digunakan:

Penduduk Fungsi

VARP()

STDLONG()
Sampel

VARI()

STDEV()

Varians (serta sisihan piawai), seperti yang kami nyatakan, menunjukkan sejauh mana nilai-nilai yang disertakan dalam set data bertaburan di sekitar min aritmetik.

Nilai kecil varians atau sisihan piawai menunjukkan bahawa semua data berpusat di sekitar min aritmetik, dan sangat penting nilai-nilai ini - bahawa data bertaburan ke atas julat nilai yang luas.

Varians agak sukar untuk ditafsirkan secara bermakna (apa maksud nilai kecil, nilai besar?). Prestasi Tugasan 3 akan membolehkan anda secara visual, pada graf, menunjukkan maksud varians untuk set data.

Tugasan

· Latihan 1.

· 2.1. Berikan konsep: varians dan sisihan piawai; sebutan simbolik mereka pemprosesan statistik data.

· 2.2. Lukiskan lembaran kerja mengikut Rajah 1 dan buat pengiraan yang diperlukan.

· 2.3. Berikan formula asas yang digunakan dalam pengiraan

· 2.4. Terangkan semua tatatanda ( , , )

· 2.5. terangkan nilai praktikal konsep varians dan sisihan piawai.

Tugasan 2.

1.1. Berikan konsep: populasi umum dan sampel; jangkaan matematik dan min aritmetik bagi penunjukan simbolik mereka dalam pemprosesan data statistik.

1.2. Selaras dengan Rajah 2, lukis lembaran kerja dan buat pengiraan.

1.3. Berikan formula asas yang digunakan dalam pengiraan (untuk populasi umum dan sampel).

Rajah 2

1.4. Terangkan mengapa adalah mungkin untuk mendapatkan nilai cara aritmetik dalam sampel seperti 46.43 dan 48.78 (lihat Lampiran fail). Untuk menyimpulkan.

Tugasan 3.

Terdapat dua sampel dengan set data yang berbeza, tetapi purata bagi mereka adalah sama:

Rajah 3

3.1. Lukiskan lembaran kerja mengikut Rajah 3 dan buat pengiraan yang diperlukan.

3.2. Berikan formula pengiraan asas.

3.3. Bina graf mengikut rajah 4, 5.

3.4. Terangkan kebergantungan yang terhasil.

3.5. Lakukan pengiraan yang sama untuk kedua-dua sampel ini.

Sampel awal 11119999

Pilih nilai sampel kedua supaya min aritmetik untuk sampel kedua adalah sama, contohnya:

Pilih sendiri nilai untuk sampel kedua. Susun pengiraan dan plot seperti rajah 3, 4, 5. Tunjukkan formula utama yang digunakan dalam pengiraan.

Buat kesimpulan yang sesuai.

Semua tugas hendaklah dibentangkan dalam bentuk laporan dengan semua angka, graf, formula dan penjelasan ringkas yang diperlukan.

Nota: pembinaan graf mesti dijelaskan dengan angka dan penerangan ringkas.

Julat variasi (atau julat variasi) - ialah perbezaan antara maksimum dan nilai minimum tanda:

Dalam contoh kami, julat variasi dalam keluaran syif pekerja ialah: dalam briged pertama R=105-95=10 kanak-kanak, dalam briged kedua R=125-75=50 kanak-kanak. (5 kali ganda lagi). Ini menunjukkan bahawa output briged 1 lebih "stabil", tetapi briged kedua mempunyai lebih banyak rizab untuk pertumbuhan output, kerana. jika semua pekerja mencapai output maksimum untuk briged ini, ia boleh menghasilkan 3 * 125 = 375 bahagian, dan dalam briged pertama hanya 105 * 3 = 315 bahagian.
Sekiranya nilai yang melampau sifat tidak tipikal untuk populasi, maka julat kuartil atau desil digunakan. Julat kuartil RQ= Q3-Q1 meliputi 50% daripada populasi, julat desil pertama RD1 = D9-D1 meliputi 80% data, julat desil kedua RD2= D8-D2 meliputi 60%.
Kelemahan penunjuk julat variasi adalah, tetapi nilainya tidak mencerminkan semua turun naik atribut.
Penunjuk generalisasi paling mudah yang mencerminkan semua turun naik sifat ialah min sisihan linear, iaitu min aritmetik bagi sisihan mutlak pilihan individu daripada nilai puratanya:

,
untuk data berkumpulan
,
di mana хi ialah nilai ciri dalam siri diskret atau pertengahan selang dalam taburan selang.
Dalam formula di atas, perbezaan dalam pengangka diambil modulo, jika tidak, mengikut sifat min aritmetik, pengangka akan sentiasa sama dengan sifar. Oleh itu, sisihan linear purata dalam amalan statistik jarang digunakan, hanya dalam kes di mana penjumlahan penunjuk tanpa mengambil kira tanda telah pengertian ekonomi. Dengan bantuannya, sebagai contoh, komposisi pekerja, keuntungan pengeluaran, dan pusing ganti perdagangan asing dianalisis.
Varian ciri ialah kuasa dua purata bagi sisihan varian daripada nilai puratanya:
varians mudah
,
varians berwajaran
.
Formula untuk mengira varians boleh dipermudahkan:

Oleh itu, varians adalah sama dengan perbezaan antara min kuasa dua varian dan kuasa dua min varian populasi:
.
Walau bagaimanapun, disebabkan penjumlahan sisihan kuasa dua, varians memberikan idea yang herot tentang sisihan, jadi purata dikira daripadanya. sisihan piawai, yang menunjukkan berapa banyak varian khusus atribut menyimpang secara purata daripada nilai puratanya. Dikira dengan mengambil punca kuasa dua varians:
untuk data tidak terkumpul
,
untuk siri variasi

Bagaimana kurang nilai serakan dan sisihan piawai, lebih homogen populasi, lebih dipercayai (tipikal) akan menjadi nilai purata.
Min dan Min Linear sisihan piawai- nombor bernama, iaitu, ia dinyatakan dalam unit ukuran atribut, adalah sama dalam kandungan dan hampir dalam makna.
mengira penunjuk mutlak variasi disyorkan menggunakan jadual.
Jadual 3 - Pengiraan ciri variasi (pada contoh tempoh data pada output syif pasukan kerja)


Bilangan pekerja

Titik tengah selang,

Anggaran nilai

Jumlah:

Purata keluaran syif pekerja:

Sisihan linear purata:

Penyerakan keluaran:

Sisihan piawai keluaran pekerja individu daripada keluaran purata:
.

1 Pengiraan serakan dengan kaedah momen

Pengiraan varians dikaitkan dengan pengiraan yang rumit (terutamanya jika nilai purata dinyatakan sebilangan besar dengan berbilang tempat perpuluhan). Pengiraan boleh dipermudahkan dengan menggunakan formula yang dipermudahkan dan sifat serakan.
Penyerakan mempunyai sifat berikut:

  1. jika semua nilai atribut dikurangkan atau ditingkatkan dengan nilai A yang sama, maka varians tidak akan berkurangan daripada ini:

,

, kemudian atau
Menggunakan sifat varians dan mula-mula mengurangkan semua varians populasi dengan nilai A, dan kemudian membahagikan dengan nilai selang h, kami memperoleh formula untuk mengira varians dalam siri variasi dengan pada selang waktu yang sama cara detik:
,
di manakah serakan dikira dengan kaedah momen;
h ialah nilai selang siri variasi;
– nilai varian baharu (diubah);
TAPI- tetap, yang digunakan sebagai pertengahan selang dengan frekuensi tertinggi; atau pilihan yang mempunyai kekerapan tertinggi;
ialah kuasa dua momen bagi susunan pertama;
adalah detik urutan kedua.
Mari kita hitung varians dengan kaedah momen berdasarkan data pada output anjakan pasukan kerja.
Jadual 4 - Pengiraan serakan dengan kaedah momen


Kumpulan pekerja pengeluaran, pcs.

Bilangan pekerja

Tengah selang

Anggaran nilai

Prosedur pengiraan:


  1. hitung varians:

2 Pengiraan varians ciri alternatif

Antara tanda yang dikaji oleh statistik, terdapat yang hanya mempunyai dua makna yang saling eksklusif. Ini adalah tanda alternatif. Mereka diberi dua nilai kuantitatif: pilihan 1 dan 0. Kekerapan pilihan 1, yang dilambangkan p, ialah perkadaran unit yang mempunyai ciri tertentu. Perbezaan 1-p=q ialah kekerapan pilihan 0. Oleh itu,


xi

Purata aritmetik bagi ciri alternatif
, kerana p+q=1.

Varian ciri
, kerana 1-p=q
Oleh itu, varians atribut alternatif adalah sama dengan hasil perkadaran unit yang mempunyai atribut ini dan bahagian unit yang tidak mempunyai atribut ini.
Jika nilai 1 dan 0 adalah sama kerap, iaitu p=q, varians mencapai maksimum pq=0.25.
Varians ciri alternatif digunakan dalam sampel tinjauan seperti kualiti produk.

3 Penyerakan antara kumpulan. Peraturan penambahan varians

Penyerakan, tidak seperti ciri variasi lain, adalah kuantiti bahan tambahan. Iaitu, dalam agregat, yang dibahagikan kepada kumpulan mengikut kriteria faktor X , varians terhasil y boleh diuraikan kepada varians dalam setiap kumpulan (dalam kumpulan) dan varians antara kumpulan (antara kumpulan). Kemudian, bersama-sama dengan kajian variasi sifat di seluruh populasi secara keseluruhan, ia menjadi mungkin untuk mengkaji variasi dalam setiap kumpulan, dan juga antara kumpulan ini.

Jumlah varians mengukur variasi sesuatu sifat di ke atas keseluruhan populasi di bawah pengaruh semua faktor yang menyebabkan variasi ini (penyimpangan). Ia sama dengan kuasa dua min bagi sisihan nilai individu bagi ciri tersebut di daripada min keseluruhan dan boleh dikira sebagai varians mudah atau wajaran.
Varians antara kumpulan mencirikan variasi ciri berkesan di, disebabkan oleh pengaruh faktor tanda X mendasari pengelompokan. Ia mencirikan variasi min kumpulan dan sama dengan kuasa dua min sisihan min kumpulan daripada jumlah min:
,
di manakah min aritmetik bagi kumpulan ke-i;
– bilangan unit dalam kumpulan ke-i (kekerapan kumpulan ke-i);
– am min penduduk.
Varians dalam kumpulan mencerminkan variasi rawak, iaitu, bahagian variasi yang disebabkan oleh pengaruh faktor yang tidak diambil kira dan tidak bergantung pada faktor atribut yang mendasari pengelompokan. Ia mencirikan variasi nilai individu relatif kepada min kumpulan, sama dengan kuadrat min bagi sisihan nilai individu atribut di dalam kumpulan daripada min aritmetik kumpulan ini (min kumpulan) dan dikira sebagai varians mudah atau berwajaran untuk setiap kumpulan:
atau ,
di manakah bilangan unit dalam kumpulan itu.
Berdasarkan varians dalam kumpulan bagi setiap kumpulan, adalah mungkin untuk menentukan purata keseluruhan varians dalam kumpulan:
.
Hubungan antara tiga varians dipanggil peraturan penambahan varians, mengikut mana jumlah varians adalah sama dengan jumlah varians antara kumpulan dan purata varians antara kumpulan:

Contoh. Apabila mengkaji pengaruh kategori tarif (kelayakan) pekerja pada tahap produktiviti buruh mereka, data berikut diperolehi.
Jadual 5 - Taburan pekerja mengikut purata keluaran setiap jam.



p/p

Pekerja kategori ke-4

Pekerja kategori ke-5

Bersenam
pekerja, pcs.,

Bersenam
pekerja, pcs.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

AT contoh ini pekerja dibahagikan kepada dua kumpulan mengikut kriteria faktor X- kelayakan, yang dicirikan oleh pangkat mereka. Sifat berkesan - pengeluaran - berbeza di bawah pengaruhnya (variasi antara kumpulan) dan disebabkan oleh faktor rawak lain (variasi intrakumpulan). Cabarannya adalah untuk mengukur variasi ini menggunakan tiga varians: jumlah, antara kumpulan dan dalam kumpulan. Pekali penentuan empirikal menunjukkan perkadaran variasi ciri yang terhasil di di bawah pengaruh tanda faktor X. Selebihnya daripada jumlah variasi di disebabkan oleh perubahan faktor lain.
Dalam contoh, pekali penentuan empirikal ialah:
atau 66.7%,
Ini bermakna 66.7% daripada variasi dalam produktiviti buruh pekerja adalah disebabkan oleh perbezaan dalam kelayakan, dan 33.3% adalah disebabkan oleh pengaruh faktor lain.
Hubungan korelasi empirikal menunjukkan ketatnya hubungan antara pengelompokan dan ciri-ciri berkesan. Ia dikira sebagai punca kuasa dua bagi pekali penentuan empirikal:

Nisbah korelasi empirikal, dan juga, boleh mengambil nilai dari 0 hingga 1.
Jika tiada sambungan, maka =0. Dalam kes ini, =0, iaitu bermakna kumpulan adalah sama antara satu sama lain dan tiada variasi antara kumpulan. Ini bermakna tanda kumpulan - faktor tidak menjejaskan pembentukan variasi umum.
Jika hubungan itu berfungsi, maka =1. Dalam kes ini, varians kumpulan bermakna ialah jumlah varians(), iaitu, tiada variasi intrakumpulan. Ini bermakna ciri pengelompokan menentukan sepenuhnya variasi ciri yang terhasil yang sedang dikaji.
Semakin dekat nilai hubungan korelasi dengan satu, semakin dekat, lebih dekat dengan pergantungan fungsi, hubungan antara ciri.
Untuk penilaian kualitatif tentang keakraban hubungan antara tanda, hubungan Chaddock digunakan.

Dalam contoh , yang menunjukkan sambungan rapat antara produktiviti pekerja dan kelayakan mereka.