Biografi Ciri-ciri Analisis

Pengiraan sisihan piawai. Bagaimana untuk mencari sisihan piawai

Dalam ujian statistik hipotesis, apabila mengukur hubungan linear antara pembolehubah rawak.

Sisihan piawai:

Sisihan Piawai(anggaran sisihan piawai Lantai pembolehubah rawak, dinding di sekeliling kita dan siling, x relatif kepada jangkaan matematiknya berdasarkan anggaran tidak berat sebelah variansnya):

di manakah penyebaran; - Lantai, dinding di sekeliling kita dan siling, i elemen pilihan ke-; - saiz sampel; - min aritmetik sampel:

Perlu diingatkan bahawa kedua-dua anggaran adalah berat sebelah. Dalam kes umum, adalah mustahil untuk membina anggaran yang tidak berat sebelah. Walau bagaimanapun, anggaran berdasarkan anggaran varians tidak berat sebelah adalah konsisten.

Peraturan tiga sigma

Peraturan tiga sigma() - hampir semua nilai pembolehubah rawak taburan normal terletak pada selang. Lebih tegas - dengan keyakinan tidak kurang daripada 99.7%, nilai pembolehubah rawak teragih normal terletak pada selang yang ditentukan (dengan syarat nilai itu benar dan tidak diperoleh hasil daripada pemprosesan sampel).

Jika nilai sebenar tidak diketahui, maka kita seharusnya tidak menggunakan, tetapi Lantai, dinding di sekeliling kita dan siling, s. Oleh itu, peraturan tiga sigma diubah menjadi peraturan tiga Tingkat, dinding di sekeliling kita dan siling, s .

Tafsiran nilai sisihan piawai

Nilai sisihan piawai yang besar menunjukkan sebaran nilai yang besar dalam set yang dibentangkan dengan nilai purata set; nilai yang kecil, oleh itu, menunjukkan bahawa nilai dalam set dikumpulkan di sekitar nilai tengah.

Sebagai contoh, kita mempunyai tiga set nombor: (0, 0, 14, 14), (0, 6, 8, 14) dan (6, 6, 8, 8). Ketiga-tiga set mempunyai nilai min sama dengan 7, dan sisihan piawai, masing-masing, sama dengan 7, 5 dan 1. Set terakhir mempunyai sisihan piawai yang kecil, kerana nilai dalam set dikumpulkan di sekitar nilai min; set pertama mempunyai nilai sisihan piawai terbesar - nilai dalam set sangat berbeza daripada nilai purata.

Dalam pengertian umum, sisihan piawai boleh dianggap sebagai ukuran ketidakpastian. Sebagai contoh, dalam fizik, sisihan piawai digunakan untuk menentukan ralat siri pengukuran berturut-turut bagi beberapa kuantiti. Nilai ini sangat penting untuk menentukan kebolehpercayaan fenomena yang dikaji berbanding dengan nilai yang diramalkan oleh teori: jika nilai purata pengukuran sangat berbeza daripada nilai yang diramalkan oleh teori (sisihan piawai yang besar), maka nilai yang diperolehi atau kaedah untuk mendapatkannya hendaklah disemak semula.

Aplikasi Praktikal

Dalam amalan, sisihan piawai membolehkan anda menentukan berapa banyak nilai dalam set mungkin berbeza daripada nilai purata.

iklim

Katakan terdapat dua bandar dengan purata suhu harian maksimum yang sama, tetapi satu terletak di pantai dan satu lagi di pedalaman. Adalah diketahui bahawa bandar yang terletak di pantai mempunyai banyak suhu siang hari maksimum yang berbeza yang lebih rendah daripada bandar yang terletak di pedalaman. Oleh itu, sisihan piawai suhu harian maksimum untuk bandar pantai akan kurang daripada bandar kedua, walaupun pada hakikatnya nilai purata nilai ini adalah sama, yang dalam amalan bermakna kebarangkalian bahawa suhu udara maksimum pada mana-mana hari dalam setahun akan lebih tinggi berbeza daripada nilai purata, lebih tinggi untuk bandar yang terletak di pedalaman.

sukan

Mari kita anggap bahawa terdapat beberapa pasukan bola sepak yang dinilai berdasarkan beberapa set parameter, sebagai contoh, jumlah gol yang dijaringkan dan dibolosi, peluang menjaringkan, dll. Kemungkinan besar pasukan terbaik dalam kumpulan ini akan mempunyai nilai yang lebih baik. pada bilangan parameter yang lebih besar. Lebih kecil sisihan piawai pasukan untuk setiap parameter yang dibentangkan, lebih boleh diramalkan keputusan pasukan adalah seimbang. Sebaliknya, pasukan yang mempunyai sisihan piawai yang besar sukar untuk meramalkan keputusan, yang seterusnya dijelaskan oleh ketidakseimbangan, contohnya, pertahanan yang kuat tetapi serangan yang lemah.

Menggunakan sisihan piawai parameter pasukan membolehkan, pada satu tahap atau yang lain, untuk meramalkan keputusan perlawanan antara dua pasukan, menilai kekuatan dan kelemahan pasukan, dan oleh itu kaedah pertempuran yang dipilih.

Analisis teknikal

Lihat juga

kesusasteraan

* Borovikov, V. STATISTIK. Seni analisis data pada komputer: Untuk profesional / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Menurut tinjauan sampel, pendeposit dikumpulkan mengikut saiz deposit mereka di Sberbank bandar:

takrifkan:

1) skop variasi;

2) saiz deposit purata;

3) sisihan linear purata;

4) penyebaran;

5) sisihan piawai;

6) pekali variasi sumbangan.

Penyelesaian:

Siri pengedaran ini mengandungi selang terbuka. Dalam siri sedemikian, nilai selang kumpulan pertama secara konvensional diandaikan sama dengan nilai selang kumpulan seterusnya, dan nilai selang kumpulan terakhir adalah sama dengan nilai selang yang sebelumnya.

Nilai selang kumpulan kedua adalah sama dengan 200, oleh itu, nilai kumpulan pertama juga sama dengan 200. Nilai selang kumpulan kedua terakhir adalah sama dengan 200, yang bermaksud selang terakhir juga akan mempunyai nilai 200.

1) Mari kita takrifkan julat variasi sebagai perbezaan antara nilai terbesar dan terkecil atribut:

Julat variasi dalam saiz deposit ialah 1000 rubel.

2) Saiz purata sumbangan akan ditentukan menggunakan formula purata aritmetik berwajaran.

Mari kita tentukan nilai diskret atribut dalam setiap selang. Untuk melakukan ini, menggunakan rumus min aritmetik mudah, kita mencari titik tengah selang.

Nilai purata selang pertama ialah:

yang kedua - 500, dsb.

Mari masukkan hasil pengiraan dalam jadual:

Jumlah deposit, gosok.Bilangan pendeposit, fTengah selang, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Jumlah 400 - 312000

Deposit purata di Sberbank bandar ialah 780 rubel:

3) Purata sisihan linear ialah min aritmetik bagi sisihan mutlak nilai individu bagi suatu ciri daripada purata keseluruhan:

Prosedur untuk mengira sisihan linear purata dalam siri taburan selang adalah seperti berikut:

1. Purata aritmetik berwajaran dikira, seperti yang ditunjukkan dalam perenggan 2).

2. Sisihan mutlak daripada purata ditentukan:

3. Sisihan yang terhasil didarab dengan frekuensi:

4. Cari jumlah sisihan berwajaran tanpa mengambil kira tanda:

5. Jumlah sisihan berwajaran dibahagikan dengan jumlah frekuensi:

Ia adalah mudah untuk menggunakan jadual data pengiraan:

Jumlah deposit, gosok.Bilangan pendeposit, fTengah selang, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Jumlah 400 - - - 81280

Purata sisihan linear saiz deposit pelanggan Sberbank ialah 203.2 rubel.

4) Serakan ialah min aritmetik bagi sisihan kuasa dua bagi setiap nilai atribut daripada min aritmetik.

Pengiraan varians dalam siri taburan selang dijalankan menggunakan formula:

Prosedur untuk mengira varians dalam kes ini adalah seperti berikut:

1. Tentukan min aritmetik berwajaran, seperti yang ditunjukkan dalam perenggan 2).

2. Cari sisihan daripada purata:

3. Kuadratkan sisihan setiap pilihan daripada purata:

4. Darabkan kuasa dua sisihan dengan pemberat (frekuensi):

5. Jumlahkan produk yang terhasil:

6. Jumlah yang terhasil dibahagikan dengan jumlah pemberat (frekuensi):

Mari letakkan pengiraan dalam jadual:

Jumlah deposit, gosok.Bilangan pendeposit, fTengah selang, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Jumlah 400 - - - 23040000

Dalam ujian statistik hipotesis, apabila mengukur hubungan linear antara pembolehubah rawak.

Sisihan piawai:

Sisihan Piawai(anggaran sisihan piawai Lantai pembolehubah rawak, dinding di sekeliling kita dan siling, x relatif kepada jangkaan matematiknya berdasarkan anggaran tidak berat sebelah variansnya):

di manakah penyebaran; - Lantai, dinding di sekeliling kita dan siling, i elemen pilihan ke-; - saiz sampel; - min aritmetik sampel:

Perlu diingatkan bahawa kedua-dua anggaran adalah berat sebelah. Dalam kes umum, adalah mustahil untuk membina anggaran yang tidak berat sebelah. Walau bagaimanapun, anggaran berdasarkan anggaran varians tidak berat sebelah adalah konsisten.

Peraturan tiga sigma

Peraturan tiga sigma() - hampir semua nilai pembolehubah rawak taburan normal terletak pada selang. Lebih tegas - dengan keyakinan tidak kurang daripada 99.7%, nilai pembolehubah rawak teragih normal terletak pada selang yang ditentukan (dengan syarat nilai itu benar dan tidak diperoleh hasil daripada pemprosesan sampel).

Jika nilai sebenar tidak diketahui, maka kita seharusnya tidak menggunakan, tetapi Lantai, dinding di sekeliling kita dan siling, s. Oleh itu, peraturan tiga sigma diubah menjadi peraturan tiga Tingkat, dinding di sekeliling kita dan siling, s .

Tafsiran nilai sisihan piawai

Nilai sisihan piawai yang besar menunjukkan sebaran nilai yang besar dalam set yang dibentangkan dengan nilai purata set; nilai yang kecil, oleh itu, menunjukkan bahawa nilai dalam set dikumpulkan di sekitar nilai tengah.

Sebagai contoh, kita mempunyai tiga set nombor: (0, 0, 14, 14), (0, 6, 8, 14) dan (6, 6, 8, 8). Ketiga-tiga set mempunyai nilai min sama dengan 7, dan sisihan piawai, masing-masing, sama dengan 7, 5 dan 1. Set terakhir mempunyai sisihan piawai yang kecil, kerana nilai dalam set dikumpulkan di sekitar nilai min; set pertama mempunyai nilai sisihan piawai terbesar - nilai dalam set sangat berbeza daripada nilai purata.

Dalam pengertian umum, sisihan piawai boleh dianggap sebagai ukuran ketidakpastian. Sebagai contoh, dalam fizik, sisihan piawai digunakan untuk menentukan ralat siri pengukuran berturut-turut bagi beberapa kuantiti. Nilai ini sangat penting untuk menentukan kebolehpercayaan fenomena yang dikaji berbanding dengan nilai yang diramalkan oleh teori: jika nilai purata pengukuran sangat berbeza daripada nilai yang diramalkan oleh teori (sisihan piawai yang besar), maka nilai yang diperolehi atau kaedah untuk mendapatkannya hendaklah disemak semula.

Aplikasi Praktikal

Dalam amalan, sisihan piawai membolehkan anda menentukan berapa banyak nilai dalam set mungkin berbeza daripada nilai purata.

iklim

Katakan terdapat dua bandar dengan purata suhu harian maksimum yang sama, tetapi satu terletak di pantai dan satu lagi di pedalaman. Adalah diketahui bahawa bandar yang terletak di pantai mempunyai banyak suhu siang hari maksimum yang berbeza yang lebih rendah daripada bandar yang terletak di pedalaman. Oleh itu, sisihan piawai suhu harian maksimum untuk bandar pantai akan kurang daripada bandar kedua, walaupun pada hakikatnya nilai purata nilai ini adalah sama, yang dalam amalan bermakna kebarangkalian bahawa suhu udara maksimum pada mana-mana hari dalam setahun akan lebih tinggi berbeza daripada nilai purata, lebih tinggi untuk bandar yang terletak di pedalaman.

sukan

Mari kita anggap bahawa terdapat beberapa pasukan bola sepak yang dinilai berdasarkan beberapa set parameter, sebagai contoh, jumlah gol yang dijaringkan dan dibolosi, peluang menjaringkan, dll. Kemungkinan besar pasukan terbaik dalam kumpulan ini akan mempunyai nilai yang lebih baik. pada bilangan parameter yang lebih besar. Lebih kecil sisihan piawai pasukan untuk setiap parameter yang dibentangkan, lebih boleh diramalkan keputusan pasukan adalah seimbang. Sebaliknya, pasukan yang mempunyai sisihan piawai yang besar sukar untuk meramalkan keputusan, yang seterusnya dijelaskan oleh ketidakseimbangan, contohnya, pertahanan yang kuat tetapi serangan yang lemah.

Menggunakan sisihan piawai parameter pasukan membolehkan, pada satu tahap atau yang lain, untuk meramalkan keputusan perlawanan antara dua pasukan, menilai kekuatan dan kelemahan pasukan, dan oleh itu kaedah pertempuran yang dipilih.

Analisis teknikal

Lihat juga

kesusasteraan

* Borovikov, V. STATISTIK. Seni analisis data pada komputer: Untuk profesional / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Menjalankan sebarang analisis statistik adalah tidak dapat difikirkan tanpa pengiraan. Dalam artikel ini kita akan melihat cara mengira varians, sisihan piawai, pekali variasi dan penunjuk statistik lain dalam Excel.

Nilai maksimum dan minimum

Sisihan linear purata

Purata sisihan linear ialah purata sisihan mutlak (modulo) daripada dalam set data yang dianalisis. Formula matematiknya ialah:

a– sisihan linear purata,

X– penunjuk yang dianalisis,

Xᅳ– nilai purata penunjuk,

n

Dalam Excel fungsi ini dipanggil SROTCL.

Selepas memilih fungsi SROTCL, kami menunjukkan julat data di mana pengiraan harus berlaku. Klik "OK".

Penyerakan

(modul 111)

Mungkin tidak semua orang tahu apa, jadi saya akan terangkan, ini adalah ukuran yang mencirikan penyebaran data di sekitar jangkaan matematik. Walau bagaimanapun, biasanya hanya sampel yang tersedia, jadi formula varians berikut digunakan:

s 2– varians sampel dikira daripada data pemerhatian,

X- nilai individu,

Xᅳ– min aritmetik bagi sampel,

n– bilangan nilai dalam set data yang dianalisis.

Fungsi Excel yang sepadan ialah DISP.G. Apabila menganalisis sampel yang agak kecil (sehingga kira-kira 30 pemerhatian), anda harus menggunakan , yang dikira menggunakan formula berikut.

Perbezaan, seperti yang anda lihat, hanya dalam penyebut. Excel mempunyai fungsi untuk mengira varians tidak berat sebelah sampel DISP.B.

Pilih pilihan yang dikehendaki (umum atau selektif), nyatakan julat, dan klik butang "OK". Nilai yang terhasil mungkin sangat besar disebabkan oleh kuasa dua awal sisihan. Penyerakan dalam statistik adalah penunjuk yang sangat penting, tetapi ia biasanya digunakan bukan dalam bentuk tulen, tetapi untuk pengiraan selanjutnya.

Sisihan piawai

Sisihan piawai (RMS) ialah punca varians. Penunjuk ini juga dipanggil sisihan piawai dan dikira menggunakan formula:

oleh penduduk umum

mengikut sampel

Anda hanya boleh mengambil punca varians, tetapi Excel mempunyai fungsi sedia untuk sisihan piawai: STDEV.G Dan STDEV.V(untuk populasi umum dan sampel, masing-masing).

Sisihan piawai dan piawai, saya ulangi, adalah sinonim.

Seterusnya, seperti biasa, nyatakan julat yang dikehendaki dan klik pada "OK". Sisihan piawai mempunyai unit ukuran yang sama dengan penunjuk yang dianalisis, dan oleh itu adalah setanding dengan data asal. Lebih lanjut mengenai perkara ini di bawah.

Pekali variasi

Semua penunjuk yang dibincangkan di atas terikat pada skala data sumber dan tidak membenarkan seseorang memperoleh idea kiasan tentang variasi populasi yang dianalisis. Untuk mendapatkan ukuran relatif penyebaran data, gunakan pekali variasi, yang dikira dengan membahagi sisihan piawai pada min aritmetik. Formula untuk pekali variasi adalah mudah:

Tiada fungsi sedia untuk mengira pekali variasi dalam Excel, yang bukan masalah besar. Pengiraan boleh dibuat dengan hanya membahagikan sisihan piawai dengan min. Untuk melakukan ini, tulis dalam bar formula:

STANDARDDEVIATION.G()/PURATA()

Julat data ditunjukkan dalam kurungan. Jika perlu, gunakan sisihan piawai sampel (STDEV.B).

Pekali variasi biasanya dinyatakan sebagai peratusan, jadi anda boleh membingkai sel dengan formula dalam format peratusan. Butang yang diperlukan terletak pada reben pada tab "Rumah":

Anda juga boleh menukar format dengan memilih daripada menu konteks selepas menyerlahkan sel yang dikehendaki dan klik kanan.

Pekali variasi, tidak seperti penunjuk lain bagi serakan nilai, digunakan sebagai penunjuk bebas dan sangat bermaklumat bagi variasi data. Dalam statistik, secara umum diterima bahawa jika pekali variasi kurang daripada 33%, maka set data adalah homogen, jika lebih daripada 33%, maka ia adalah heterogen. Maklumat ini boleh berguna untuk pencirian awal data dan untuk mengenal pasti peluang untuk analisis lanjut. Di samping itu, pekali variasi, diukur sebagai peratusan, membolehkan anda membandingkan tahap serakan data yang berbeza, tanpa mengira skala dan unit ukurannya. Harta yang berguna.

Pekali ayunan

Satu lagi penunjuk penyebaran data hari ini ialah pekali ayunan. Ini ialah nisbah julat variasi (perbezaan antara nilai maksimum dan minimum) kepada purata. Tiada formula Excel sedia dibuat, jadi anda perlu menggabungkan tiga fungsi: MAX, MIN, AVERAGE.

Pekali ayunan menunjukkan tahap variasi berbanding purata, yang juga boleh digunakan untuk membandingkan set data yang berbeza.

Secara umum, menggunakan Excel, banyak penunjuk statistik dikira dengan sangat mudah. Jika ada yang tidak jelas, anda sentiasa boleh menggunakan kotak carian dalam sisipan fungsi. Nah, Google sedia membantu.

Untuk mengira min geometri mudah, formula digunakan:

Wajaran geometri

Untuk menentukan min geometri berwajaran, formula digunakan:

Purata diameter roda, paip, dan sisi purata segi empat sama ditentukan menggunakan kuasa dua min.

Nilai akar-min-kuasa dua digunakan untuk mengira beberapa penunjuk, contohnya, pekali variasi, yang mencirikan irama pengeluaran. Di sini sisihan piawai daripada keluaran pengeluaran yang dirancang untuk tempoh tertentu ditentukan menggunakan formula berikut:

Nilai-nilai ini secara tepat mencirikan perubahan dalam penunjuk ekonomi berbanding dengan nilai asasnya, diambil dalam nilai puratanya.

Kuadratik mudah

Purata min kuasa dua dikira menggunakan formula:

Wajaran kuadratik

Purata purata berwajaran adalah sama dengan:

22. Penunjuk mutlak variasi termasuk:

julat variasi

sisihan linear purata

penyebaran

sisihan piawai

Julat variasi (r)

Julat variasi ialah perbezaan antara nilai maksimum dan minimum atribut

Ia menunjukkan had di mana nilai sesuatu ciri berubah dalam populasi yang dikaji.

Pengalaman kerja lima pemohon dalam kerja terdahulu ialah: 2,3,4,7 dan 9 tahun. Penyelesaian: julat variasi = 9 - 2 = 7 tahun.

Untuk penerangan umum tentang perbezaan dalam nilai atribut, penunjuk variasi purata dikira berdasarkan mengambil kira sisihan daripada min aritmetik. Perbezaan itu diambil sebagai sisihan daripada purata.

Dalam kes ini, untuk mengelakkan jumlah sisihan varian ciri daripada purata bertukar kepada sifar (sifat sifar purata), seseorang mesti sama ada mengabaikan tanda-tanda sisihan, iaitu, ambil jumlah modulo ini , atau kuasa dua nilai sisihan

Purata sisihan linear dan segi empat sama

Sisihan linear purata ialah min aritmetik bagi sisihan mutlak nilai individu bagi ciri daripada purata.

Sisihan linear purata adalah mudah:

Pengalaman kerja lima pemohon dalam kerja terdahulu ialah: 2,3,4,7 dan 9 tahun.

Dalam contoh kami: tahun;

Jawapan: 2.4 tahun.

Wajaran sisihan linear purata digunakan untuk data terkumpul:

Disebabkan konvensyennya, sisihan linear purata digunakan dalam amalan agak jarang (khususnya, untuk mencirikan pemenuhan kewajipan kontrak mengenai keseragaman penghantaran; dalam analisis kualiti produk, dengan mengambil kira ciri teknologi pengeluaran).

Sisihan piawai

Ciri variasi yang paling sempurna ialah sisihan kuasa dua min, yang dipanggil piawai (atau sisihan piawai). Sisihan piawai() adalah sama dengan punca kuasa dua sisihan kuasa dua purata bagi nilai individu bagi ciri purata aritmetik:

Sisihan piawai adalah mudah:

Sisihan piawai berwajaran digunakan pada data terkumpul:

Antara punca purata kuasa dua dan min sisihan linear dalam keadaan taburan normal nisbah berikut berlaku: ~ 1.25.

Sisihan piawai, sebagai ukuran mutlak utama variasi, digunakan dalam menentukan nilai ordinat lengkung taburan normal, dalam pengiraan yang berkaitan dengan organisasi pemerhatian sampel dan mewujudkan ketepatan ciri sampel, serta dalam menilai had variasi ciri dalam populasi homogen.