Biografi Ciri-ciri Analisis

Formula untuk ralat pensampelan kuasa dua min. Formula ralat pensampelan purata

Pada pemerhatian terpilih mesti dipastikan kemalangan pemilihan unit. Setiap unit mesti mempunyai peluang yang sama untuk dipilih. Inilah yang berdasarkan sampel rawak.

KEPADA sampel rawak sebenar merujuk kepada pemilihan unit daripada semua penduduk(tanpa membahagikannya terlebih dahulu kepada mana-mana kumpulan) dengan membuat undian (terutamanya) atau kaedah lain yang serupa, contohnya, menggunakan jadual nombor rawak. Pemilihan rawak- pemilihan ini bukan sembarangan. Prinsip rawak mengandaikan bahawa kemasukan atau pengecualian objek daripada sampel tidak boleh dipengaruhi oleh sebarang faktor selain daripada kebetulan. Contoh sebenarnya rawak pemilihan boleh berfungsi sebagai cabutan menang: daripada jumlah bilangan daripada tiket yang dikeluarkan, bahagian tertentu nombor dipilih secara rawak dan kemenangan jatuh pada mereka. Selain itu, semua nombor diberikan peluang yang sama untuk dimasukkan ke dalam sampel. Dalam kes ini, bilangan unit yang dipilih dalam populasi sampel biasanya ditentukan berdasarkan perkadaran sampel yang diterima.

Perkongsian sampel ialah nisbah bilangan unit dalam populasi sampel kepada bilangan unit dalam populasi umum:

Jadi, dengan sampel 5% daripada kumpulan bahagian 1000 unit. saiz sampel n ialah 50 unit, dan dengan sampel 10% - 100 unit. dll. Dengan hak organisasi saintifik ralat persampelan keterwakilan boleh dikurangkan kepada nilai minimum, akibatnya, pemerhatian terpilih menjadi agak tepat.

Sebenarnya pemilihan rawak “dalam bentuk tulen“jarang digunakan dalam amalan pemerhatian terpilih, tetapi ia adalah yang asli di antara semua jenis pemilihan lain yang mengandungi dan melaksanakan prinsip asas pemerhatian terpilih.

Mari kita pertimbangkan beberapa soalan tentang teori kaedah persampelan dan formula ralat untuk sampel rawak mudah.

Apabila menggunakan kaedah persampelan dalam statistik, dua jenis utama penunjuk umum biasanya digunakan: nilai purata ciri kuantitatif Dan nilai relatif bagi ciri alternatif(bahagian atau berat khusus unit dalam populasi statistik yang berbeza daripada semua unit lain populasi ini hanya dengan kehadiran ciri yang dikaji).

Bahagian terpilih (w), atau kekerapan, ditentukan oleh nisbah bilangan unit yang mempunyai ciri yang sedang dikaji T, Kepada jumlah bilangan unit sampel p:

Contohnya, jika daripada 100 butiran sampel ( n=100), 95 bahagian ternyata standard (T=95), maka pecahan sampel

w=95/100=0,95 .

Untuk mencirikan kebolehpercayaan penunjuk sampel, terdapat purata Dan ralat pensampelan maksimum.

Ralat pensampelan ? atau, dengan kata lain, ralat perwakilan ialah perbezaan antara sampel yang sepadan dan ciri umum:

*

*

Ralat persampelan adalah ciri hanya pemerhatian sampel. Bagaimana lebih nilai ralat ini, semakin banyak penunjuk sampel berbeza daripada penunjuk umum yang sepadan.

Purata sampel dan bahagian sampel adalah secara semula jadi pembolehubah rawak, yang boleh mengambil nilai yang berbeza bergantung pada unit populasi yang dimasukkan dalam sampel. Oleh itu, ralat persampelan juga pembolehubah rawak dan boleh diambil makna yang berbeza. Oleh itu, purata ralat yang mungkin ditentukan - ralat pensampelan purata.

Bergantung pada apa? ralat pensampelan purata? Jika prinsip pemilihan rawak diperhatikan, ralat pensampelan purata ditentukan terlebih dahulu saiz sampel: bagaimana lebih banyak nombor selain itu syarat sama rata, semakin kecil ralat pensampelan purata. Meliputi sampel tinjauan Semua lebih unit populasi umum, kami mencirikan keseluruhan populasi umum dengan lebih tepat.

Ralat purata persampelan juga bergantung kepada darjah variasi sifat yang dikaji. Tahap variasi, seperti yang diketahui, dicirikan oleh penyebaran? 2 atau w(1-w)-- untuk tanda alternatif. Semakin kecil variasi ciri, dan oleh itu serakan, semakin kecil ralat pensampelan purata, dan sebaliknya. Dengan penyebaran sifar (ciri tidak berbeza), ralat pensampelan purata adalah sifar, iaitu, mana-mana unit dalam populasi umum akan mencirikan keseluruhan populasi dengan tepat mengikut ciri ini.

Kebergantungan ralat pensampelan purata pada volumnya dan tahap variasi atribut dicerminkan dalam formula yang boleh digunakan untuk mengira ralat pensampelan purata di bawah keadaan pemerhatian terpilih, apabila ciri umum ( x,p) tidak diketahui, dan oleh itu, nampaknya tidak mungkin untuk mencari ralat pensampelan sebenar secara langsung menggunakan formula (Borang. 1), (Borang. 2).

Sh Secara kebetulan pemilihan semula ralat purata dikira secara teori menggunakan formula berikut:

* untuk purata ciri kuantitatif

* untuk bahagian (atribut alternatif)

Oleh kerana secara praktikalnya varians sesuatu sifat dalam populasi? 2 tidak diketahui dengan tepat, dalam praktiknya mereka menggunakan nilai serakan S 2 yang dikira untuk populasi sampel berdasarkan undang-undang bilangan yang besar, mengikut mana populasi sampel dengan saiz sampel yang cukup besar, ia menghasilkan semula dengan tepat ciri-ciri populasi umum.

Oleh itu, formula pengiraan purata ralat pensampelan dengan pemilihan semula rawak, perkara berikut akan menjadi:

* untuk ciri kuantitatif purata

* untuk bahagian (atribut alternatif)

Walau bagaimanapun, serakan populasi sampel tidak sama dengan serakan populasi umum, dan oleh itu, ralat pensampelan purata yang dikira menggunakan formula (Borang. 5) dan (Borang. 6) akan menjadi anggaran. Tetapi dalam teori kebarangkalian ia telah terbukti varians umum dinyatakan melalui elektif oleh hubungan berikut:

Kerana p/(n-1) untuk cukup besar p -- nilai adalah hampir kepada perpaduan, maka kita boleh menganggap bahawa, dan oleh itu, dalam pengiraan praktikal ralat pensampelan purata, formula (Borang. 5) dan (Borang. 6) boleh digunakan. Dan hanya dalam kes sampel kecil (apabila saiz sampel tidak melebihi 30) adalah perlu untuk mengambil kira pekali n/(n-1) dan mengira ralat purata sampel kecil mengikut formula:

W X Dengan pemilihan rawak yang tidak berulang Dalam formula di atas untuk mengira ralat pensampelan purata, adalah perlu untuk mendarabkan ungkapan radikal dengan 1-(n/N), kerana dalam proses pensampelan tidak berulang bilangan unit dalam populasi umum dikurangkan. Oleh itu, untuk pensampelan tidak berulang formula pengiraan ralat pensampelan purata akan mengambil bentuk berikut:

* untuk ciri kuantitatif purata

* untuk bahagian (atribut alternatif)

. (borang. 10)

Kerana n sentiasa kurang N, maka faktor tambahan 1-( n/N) akan sentiasa kurang daripada satu. Ia berikutan bahawa ralat purata semasa pemilihan tidak berulang akan sentiasa kurang daripada semasa pemilihan berulang. Pada masa yang sama, dengan peratusan sampel yang agak kecil, pengganda ini hampir kepada perpaduan (contohnya, dengan sampel 5% ia bersamaan dengan 0.95; dengan sampel 2% ia adalah 0.98, dsb.). Oleh itu, kadangkala dalam amalan mereka menggunakan formula (Borang. 5) dan (Borang. 6) tanpa pengganda yang ditentukan untuk menentukan ralat pensampelan purata, walaupun sampel disusun sebagai tidak berulang. Ini berlaku dalam kes di mana bilangan unit dalam populasi N tidak diketahui atau tidak terhad, atau bila n sangat sedikit berbanding dengan N, dan pada dasarnya, pengenalan pengganda tambahan, hampir dengan nilai perpaduan, hampir tidak akan memberi kesan ke atas nilai ralat pensampelan purata.

Persampelan mekanikal ialah pemilihan unit ke dalam populasi sampel daripada populasi umum, dibahagikan mengikut kriteria neutral kepada selang yang sama(kumpulan), dijalankan dengan cara yang daripada setiap kumpulan tersebut hanya satu unit dipilih untuk sampel. Untuk mengelakkan berat sebelah, unit yang berada di tengah-tengah setiap kumpulan hendaklah dipilih.

Apabila mengatur pemilihan mekanikal, unit populasi disusun secara awal (biasanya dalam senarai) dalam susunan tertentu (contohnya, mengikut abjad, lokasi, dalam susunan menaik atau menurun bagi nilai beberapa penunjuk yang tidak berkaitan dengan harta benda. sedang dikaji, dsb.). dsb.), selepas itu bilangan unit tertentu dipilih secara mekanikal, pada selang waktu tertentu. Dalam kes ini, saiz selang dalam populasi adalah sama dengan nilai timbal balik saham sampel. Jadi, dengan sampel 2%, setiap unit ke-50 dipilih dan diperiksa (1: 0.02), dengan sampel 5% - setiap unit ke-20 (1: 0.05), sebagai contoh, bahagian penumpuan dari mesin.

Apabila cukup penduduk yang ramai Pemilihan mekanikal hampir rawak semata-mata dari segi ketepatan keputusannya. Oleh itu, untuk menentukan ralat purata persampelan mekanikal, formula untuk persampelan tidak berulang rawak yang betul digunakan (Borang. 9), (Borang. 10).

Untuk memilih unit daripada populasi heterogen, yang dipanggil sampel biasa , yang digunakan dalam kes di mana semua unit populasi umum boleh dibahagikan kepada beberapa kumpulan yang homogen secara kualitatif, serupa mengikut ciri-ciri yang mempengaruhi penunjuk yang dikaji.

Apabila meninjau perusahaan, kumpulan sedemikian boleh, sebagai contoh, industri dan sub-industri, bentuk pemilikan. Kemudian, daripada setiap kumpulan biasa, sampel rawak atau mekanikal semata-mata digunakan untuk memilih unit secara individu ke dalam populasi sampel.

Sampel tipikal biasanya digunakan semasa mengkaji populasi statistik yang kompleks. Sebagai contoh, semasa tinjauan sampel belanjawan keluarga pekerja dan pekerja dalam sektor ekonomi tertentu, produktiviti buruh pekerja perusahaan mewakili kumpulan berasingan mengikut kelayakan.

Sampel biasa memberikan lebih banyak keputusan yang tepat berbanding kaedah lain untuk memilih unit dalam populasi sampel. Menaip populasi umum memastikan keterwakilan sampel sedemikian, perwakilan setiap kumpulan tipologi di dalamnya, yang memungkinkan untuk menghapuskan pengaruh penyebaran antara kumpulan pada ralat pensampelan purata.

Apabila menentukan ralat purata sampel biasa bertindak sebagai penunjuk variasi purata daripada varians dalam kumpulan.

Ralat pensampelan purata didapati menggunakan formula:

* untuk ciri kuantitatif purata

(pemilihan semula); (borang. 11)

(pemilihan tidak boleh balik); (borang. 12)

* untuk bahagian (atribut alternatif)

(pemilihan semula); (borang.13)

(pemilihan tidak berulang), (borang. 14)

di manakah purata varians antara kumpulan untuk populasi sampel;

Purata varians dalam kumpulan perkadaran (sifat alternatif) untuk populasi sampel.

Persampelan bersiri melibatkan pemilihan rawak daripada populasi umum bukan unit individu, tetapi kumpulan yang sama (sarang, siri) supaya dalam kumpulan sedemikian semua unit tanpa pengecualian boleh diperhatikan.

Permohonan persampelan bersiri disebabkan oleh fakta bahawa banyak barang untuk pengangkutan, penyimpanan dan penjualan mereka dibungkus dalam bungkusan, kotak, dll. Oleh itu, apabila mengawal kualiti barangan yang dibungkus, adalah lebih rasional untuk menyemak beberapa pakej (siri) daripada memilih daripada semua pakej kuantiti yang diperlukan barang.

Oleh kerana dalam kumpulan (siri) semua unit tanpa pengecualian diperiksa, ralat pensampelan purata (apabila memilih siri yang sama) bergantung hanya pada serakan antara kumpulan (interseries).

Sh Ralat pensampelan purata untuk ciri kuantitatif purata semasa pemilihan bersiri mereka didapati menggunakan formula:

(pemilihan semula); (bentuk.15)

(pemilihan tidak berulang), (borang. 16)

di mana r- bilangan episod yang dipilih; R- jumlah bilangan episod.

Varians antara kumpulan sampel bersiri dikira seperti berikut:

di manakah purata i- siri ke-; - purata keseluruhan untuk keseluruhan populasi sampel.

Sh Ralat pensampelan purata untuk perkongsian (atribut alternatif) dalam pemilihan bersiri:

(pemilihan semula); (borang. 17)

(pemilihan tidak berulang). (borang. 18)

Antara kumpulan(antara siri) varians bahagian sampel bersiri ditentukan oleh formula:

, (borang. 19)

di manakah bahagian ciri dalam i-siri ke-; - jumlah bahagian ciri dalam keseluruhan populasi sampel.

Dalam amalan tinjauan statistik, sebagai tambahan kepada kaedah pemilihan yang telah dibincangkan sebelum ini, gabungannya digunakan (pemilihan gabungan).

Pemerhatian terpilih

Konsep pemerhatian sampel

Kaedah pensampelan digunakan apabila penggunaan pemerhatian berterusan adalah mustahil secara fizikal disebabkan oleh jumlah data yang besar atau tidak dapat dilaksanakan secara ekonomi. Ketidakmungkinan fizikal berlaku, contohnya, apabila mengkaji aliran penumpang, harga pasaran dan belanjawan keluarga. Ketidakupayaan ekonomi berlaku apabila menilai kualiti barangan yang berkaitan dengan kemusnahannya. Contohnya, mengecap, menguji kekuatan batu bata, dsb. Pemerhatian sampel juga digunakan untuk mengesahkan keputusan pemerhatian berterusan.

Unit statistik yang dipilih untuk pemerhatian ialah selektif keseluruhan atau sampel, dan keseluruhan tatasusunan - umum keseluruhan (GS). Dalam kes ini, bilangan unit dalam sampel dilambangkan dengan p, sepanjang keseluruhan HS - N. Sikap n/N dipanggil saiz relatif atau bahagian sampel.

Kualiti hasil pemerhatian sampel bergantung kepada keterwakilan sampel, i.e. tentang bagaimana ia mewakili dalam GC. Untuk memastikan keterwakilan sampel, adalah perlu untuk mematuhi prinsip pemilihan rawak unit, yang menganggap bahawa kemasukan unit HS dalam sampel tidak boleh dipengaruhi oleh sebarang faktor lain selain daripada kebetulan.

Kaedah persampelan

1. Sebenarnya rawak pemilihan: semua unit GS bernombor, dan nombor yang dilukis sebagai hasil cabutan sepadan dengan unit yang disertakan dalam sampel, dan bilangan nombor adalah sama dengan saiz sampel yang dirancang. Dalam amalan, penjana nombor rawak digunakan dan bukannya melukis lot. Kaedah ini pemilihan mungkin berulang(apabila setiap unit yang dipilih untuk sampel kembali ke HS selepas pemerhatian dan boleh ditinjau semula) dan tidak boleh berulang(apabila unit yang ditinjau tidak dikembalikan kepada HS dan tidak boleh ditinjau semula). Dengan pemilihan berulang, kebarangkalian untuk masuk ke dalam sampel untuk setiap unit GS kekal tidak berubah, dan dengan pemilihan berulang ia berubah (meningkat), tetapi untuk beberapa unit yang tinggal dalam GS selepas memilih daripadanya, kebarangkalian untuk masuk ke dalam sampel adalah sama.



2. Mekanikal pemilihan: unit populasi dipilih dengan langkah yang tetap T/a. Jadi, jika populasi umum mengandungi 100 ribu unit, dan anda perlu memilih 1 ribu unit, maka setiap unit keseratus akan dimasukkan ke dalam sampel.

3. Berstrata pemilihan (berstrata) dijalankan daripada populasi umum yang heterogen apabila ia mula-mula dibahagikan kepada kumpulan homogen, selepas itu unit daripada setiap kumpulan dipilih ke dalam populasi sampel secara rawak atau mekanikal mengikut kadar bilangan mereka dalam populasi umum.

4. bersiri pemilihan (kelompok): bukan unit individu, tetapi siri tertentu (sarang) dipilih secara rawak atau mekanikal, di mana pemerhatian berterusan dijalankan.

Ralat pensampelan purata

Selepas melengkapkan pemilihan bilangan unit yang diperlukan dalam sampel dan merekodkan ciri yang dikaji bagi unit ini yang disediakan oleh program pemerhatian, kami meneruskan pengiraan penunjuk generalisasi. Ini termasuk nilai purata ciri yang sedang dikaji dan bahagian unit yang mempunyai sebarang nilai untuk ciri ini. Walau bagaimanapun, jika GS membuat beberapa sampel, setelah menentukan ciri umum mereka, maka dapat ditentukan bahawa nilai mereka akan berbeza, di samping itu, mereka akan berbeza daripada nilai sebenar mereka dalam GS, jika ini ditentukan menggunakan pemerhatian berterusan . Dalam erti kata lain, ciri umum yang dikira daripada data sampel akan berbeza daripada nilai sebenar mereka dalam GS, jadi kami memperkenalkan simbol berikut (Jadual 8).

Jadual 8. Lagenda

Perbezaan antara nilai ciri umum sampel dan populasi umum dipanggil ralat pensampelan, yang terbahagi kepada kesilapan pendaftaran dan kesilapan keterwakilan. Yang pertama timbul kerana maklumat yang salah atau tidak tepat kerana kekurangan pemahaman tentang intipati isu, ketidakpedulian pendaftar semasa mengisi soal selidik, borang, dll. Ia agak mudah untuk dikesan dan dihapuskan. Yang kedua timbul daripada ketidakpatuhan prinsip pemilihan rawak unit dalam sampel. Ia lebih sukar untuk dikesan dan dihapuskan, ia lebih besar daripada yang pertama dan oleh itu pengukurannya adalah tugas utama pemerhatian terpilih.

Untuk mengukur ralat pensampelan, ralat puratanya ditentukan menggunakan formula (39) untuk pensampelan berulang dan formula (40) untuk pensampelan tidak berulang:

= ;(39) = . (40)

Daripada formula (39) dan (40) adalah jelas bahawa ralat purata adalah lebih kecil untuk pensampelan tidak berulang, yang menentukan penggunaannya yang lebih luas.

Konsep dan pengiraan ralat pensampelan.

Tugas pemerhatian sampel adalah untuk memberi idea yang betul tentang petunjuk ringkasan keseluruhan populasi berdasarkan sebahagian daripada mereka yang tertakluk kepada pemerhatian. Sisihan yang mungkin bagi perkadaran sampel dan min sampel daripada perkadaran dan min dalam populasi dipanggil ralat pensampelan atau kesilapan perwakilan. Lebih besar magnitud ralat ini, lebih banyak petunjuk pemerhatian sampel berbeza daripada penunjuk populasi umum.

Mereka berbeza:

Ralat pensampelan;

Kesilapan pendaftaran.

Kesilapan pendaftaran timbul apabila fakta tidak betul ditubuhkan semasa proses pemerhatian. Mereka adalah ciri kedua-dua pemerhatian berterusan dan pemerhatian terpilih, tetapi dalam pemerhatian terpilih terdapat lebih sedikit daripada mereka.

Secara semula jadi, kesilapan adalah:

Cenderung – sengaja, i.e. sama ada unit terbaik atau terburuk dalam populasi telah dipilih. Dalam kes ini, pemerhatian kehilangan makna;

Rawak - prinsip organisasi asas pemerhatian pensampelan adalah untuk mengelakkan pemilihan yang disengajakan, i.e. memastikan pematuhan ketat kepada prinsip pemilihan rawak.

Peraturan am pemilihan rawak ialah: unit individu populasi umum mesti mempunyai keadaan dan peluang yang sama untuk jatuh ke dalam bilangan unit yang termasuk dalam sampel. Ini mencirikan kebebasan hasil persampelan daripada kehendak pemerhati. Kehendak pemerhati menimbulkan kesilapan yang cenderung. Ralat persampelan dalam persampelan rawak ialah sifat rawak. Ia mencirikan saiz sisihan ciri umum daripada ciri sampel.

Oleh kerana ciri-ciri dalam populasi yang dikaji berbeza-beza, komposisi unit yang termasuk dalam sampel mungkin tidak bertepatan dengan komposisi unit keseluruhan populasi. Ini bermakna bahawa R dan tidak bertepatan dengan W Dan . Kemungkinan percanggahan antara ciri-ciri ini ditentukan oleh ralat pensampelan, yang ditentukan oleh formula:

di manakah varians am.

di manakah varians sampel.

Ini menunjukkan di mana varians am berbeza daripada varians sampel kadang-kadang.

Terdapat pemilihan berulang dan tidak berulang. Intipati pemilihan berulang ialah setiap unit yang dimasukkan ke dalam sampel, selepas pemerhatian, kembali kepada populasi umum dan boleh diperiksa semula. Apabila pensampelan semula, ralat pensampelan purata dikira:

Untuk penunjuk bahagian ciri alternatif, varians sampel ditentukan oleh formula:

Dalam amalan, pemilihan berulang jarang digunakan. Dengan pemilihan tidak berulang, saiz populasi umum N dikurangkan semasa pensampelan, formula untuk ralat pensampelan purata untuk ciri kuantitatif mempunyai bentuk:



, Kemudian

Salah satu nilai yang mungkin di mana bahagian ciri yang dikaji mungkin sama dengan:

di manakah ralat pensampelan bagi atribut alternatif.

Contoh.

Apabila persampelan 10% daripada produk dalam kelompok produk siap menggunakan kaedah tanpa persampelan berulang, data berikut diperolehi tentang kandungan lembapan dalam sampel.

Tentukan purata % kelembapan, varians, purata sisihan piawai, dengan kebarangkalian 0.954 had yang mungkin, di mana ia dijangka purata % kandungan lembapan semua produk siap, dengan kebarangkalian 0.987 had yang mungkin graviti tentu produk standard, dengan syarat kumpulan bukan standard termasuk produk dengan kandungan lembapan sehingga 13 dan ke atas 19%.

Hanya dengan kebarangkalian tertentu kita boleh mengatakan bahawa bahagian umum daripada bahagian sampel dan purata umum daripada purata sampel menyimpang dengan t sekali.

Dalam statistik penyimpangan ini dipanggil ralat pensampelan maksimum dan ditetapkan.

Kebarangkalian penghakiman boleh ditambah atau dikurangkan mengikut t sekali. Pada kebarangkalian 0.683, pada 0.954, pada 0.987, maka penunjuk populasi umum ditentukan daripada penunjuk sampel.

Teori statistik: nota kuliah Burkhanova Inessa Viktorovna

3. Ralat pensampelan

3. Ralat pensampelan

Setiap unit dalam pemerhatian sampel mesti mempunyai peluang yang sama dengan yang lain untuk dipilih - ini adalah asas sampel rawak yang betul.

Persampelan rawak yang betul - ialah pemilihan unit daripada keseluruhan populasi dengan membuat undian atau lain-lain dengan cara yang serupa.

Prinsip rawak ialah kemasukan atau pengecualian sesuatu item daripada sampel tidak boleh dipengaruhi oleh sebarang faktor selain daripada peluang.

Perkongsian sampel ialah nisbah bilangan unit dalam populasi sampel kepada bilangan unit dalam populasi umum:

Pemilihan rawak yang betul dalam bentuk tulen adalah yang awal di antara semua jenis pemilihan yang lain ia mengandungi dan melaksanakan prinsip asas persampelan pemerhatian statistik.

Dua jenis utama penunjuk umum yang digunakan dalam kaedah persampelan ialah nilai purata ciri kuantitatif dan nilai relatif tanda alternatif.

Pecahan sampel (w), atau kekhususan, ditentukan oleh nisbah bilangan unit yang mempunyai ciri yang sedang dikaji. m, kepada jumlah bilangan unit dalam populasi sampel (n):

Untuk mencirikan kebolehpercayaan penunjuk sampel, perbezaan dibuat antara ralat pensampelan purata dan maksimum.

Ralat pensampelan, juga dipanggil ralat perwakilan, ialah perbezaan antara sampel yang sepadan dan ciri umum:

?x ==x – x|;

?w ==x – p|.

Hanya pemerhatian sampel tertakluk kepada ralat pensampelan.

Purata sampel dan perkadaran sampel– ini adalah pembolehubah rawak yang mengambil nilai yang berbeza bergantung pada unit populasi statistik yang dikaji yang termasuk dalam sampel. Sehubungan itu, ralat pensampelan juga merupakan pembolehubah rawak dan juga boleh mengambil nilai yang berbeza. Oleh itu, tentukan purata bagi kesilapan yang mungkin– ralat pensampelan purata.

Ralat pensampelan purata ditentukan oleh saiz sampel: semakin besar bilangannya, perkara lain adalah sama, semakin kecil ralat pensampelan purata. Dengan merangkumi peningkatan bilangan unit populasi umum dengan tinjauan sampel, kami mencirikan keseluruhan populasi umum dengan lebih tepat dan lebih tepat.

Ralat pensampelan purata bergantung kepada tahap variasi ciri yang dikaji, seterusnya tahap variasi dicirikan oleh penyebaran? 2 atau w(l – w)– untuk tanda alternatif. Semakin kecil variasi dan serakan sifat, semakin kecil ralat pensampelan purata, dan sebaliknya.

Dalam kes persampelan berulang rawak, ralat purata dikira secara teori menggunakan formula berikut:

1) untuk ciri kuantitatif purata:

di mana? 2 – nilai purata serakan ciri kuantitatif.

2) untuk bahagian (atribut alternatif):

Jadi apakah varians sifat dalam populasi? 2 tidak diketahui dengan tepat, dalam praktiknya mereka menggunakan nilai serakan S 2 yang dikira untuk populasi sampel berdasarkan undang-undang bilangan besar, mengikut mana populasi sampel, dengan saiz sampel yang cukup besar, menghasilkan semula dengan agak tepat. ciri-ciri populasi umum.

Formula bagi ralat pensampelan purata bagi pensampelan semula rawak adalah seperti berikut. Untuk saiz purata ciri kuantitatif: varians umum dinyatakan melalui varians terpilih oleh hubungan berikut:

di mana S 2 ialah nilai serakan.

Persampelan mekanikal– ini ialah pemilihan unit ke dalam populasi sampel daripada populasi umum, yang dibahagikan mengikut kriteria neutral kepada kumpulan yang sama; Ia dijalankan sedemikian rupa sehingga daripada setiap kumpulan tersebut hanya satu unit dipilih untuk sampel.

Dalam persampelan mekanikal, unit populasi statistik yang dikaji disusun secara awal dalam susunan tertentu, selepas itu bilangan unit tertentu dipilih secara mekanikal pada selang waktu tertentu. Dalam kes ini, saiz selang dalam populasi adalah sama dengan nilai songsang perkadaran sampel.

Dengan populasi yang cukup besar, pemilihan mekanikal hampir dengan rawak kendiri dari segi ketepatan keputusan Oleh itu, untuk menentukan ralat purata persampelan mekanikal, formula untuk persampelan tidak berulang secara rawak sendiri digunakan.

Untuk memilih unit daripada populasi heterogen, apa yang dipanggil sampel tipikal digunakan apabila semua unit populasi umum boleh dibahagikan kepada beberapa kumpulan yang sama secara kualitatif, mengikut ciri-ciri yang bergantung kepada penunjuk yang dikaji.

Kemudian, daripada setiap kumpulan tipikal, pemilihan unit individu ke dalam populasi sampel dijalankan menggunakan sampel rawak atau mekanikal semata-mata.

Persampelan sampel biasanya digunakan semasa mengkaji populasi statistik yang kompleks.

Persampelan biasa memberikan hasil yang lebih tepat. Menaip populasi umum memastikan keterwakilan sampel sedemikian, perwakilan setiap kumpulan tipologi di dalamnya, yang memungkinkan untuk mengecualikan pengaruh penyebaran antara kumpulan pada ralat pensampelan purata. Oleh itu, apabila menentukan ralat purata sampel biasa, purata varians dalam kumpulan bertindak sebagai penunjuk variasi.

Persampelan bersiri melibatkan pemilihan rawak daripada populasi umum kumpulan yang sama untuk menundukkan semua unit dalam kumpulan tersebut kepada pemerhatian tanpa pengecualian.

Oleh kerana dalam kumpulan (siri) semua unit tanpa pengecualian diperiksa, ralat pensampelan purata (apabila memilih siri yang sama) bergantung hanya pada serakan antara kumpulan (interseries).

Daripada buku Belanjawan Peribadi. Wang terkawal pengarang Makarov Sergey Vladimirovich

Kesilapan penduduk Anda boleh mendekati kesilapan dengan cara yang berbeza: anda boleh takut untuk melakukannya dan bimbang tentang setiap daripada mereka, anda boleh bergembira dengan kesilapan dan krisis anda sebagai petunjuk di jalan menuju kejayaan dan kemenangan peribadi. Satu-satunya perkara yang berterusan tentang kesilapan ialah anda perlu membayarnya.

Dari buku Buku papan mengenai audit dalaman. Risiko dan proses perniagaan pengarang Kryshkin Oleg

Persampelan Prosedur persampelan merupakan peringkat penting dalam projek audit dalaman. Ia diterangkan secara terperinci dalam pelbagai sumber mengenai topik pengauditan. Walau bagaimanapun, dalam banyak cara huraian tersebut bersifat akademik. Saya cadangkan fokus pada mereka

Dari buku The Psychology of Investments [Bagaimana untuk berhenti melakukan perkara bodoh dengan wang anda] oleh Richards Carl

Kesilapan Pelaburan Adalah Kesilapan Pelabur Saya kini lebih yakin berbanding sebelum ini bahawa semua kesilapan pelaburan sebenarnya adalah kesilapan pelabur. Berbeza dengan pelabur Melabur adalah pilihan. Tepat mengenai perkara ini

pengarang Shcherbina Lidiya Vladimirovna

29. Menentukan saiz sampel yang diperlukan Salah satu daripada prinsip saintifik dalam teori kaedah persampelan adalah untuk memastikan bilangan unit terpilih yang mencukupi ralat piawai persampelan sentiasa dikaitkan dengan pertambahan saiz sampel. Pengiraan

Dari buku Teori umum perangkaan pengarang Shcherbina Lidiya Vladimirovna

30. Kaedah pemilihan dan jenis persampelan. Sebenarnya persampelan rawak Dalam teori kaedah persampelan, pelbagai kaedah pemilihan dan jenis persampelan telah dibangunkan untuk memastikan keterwakilan. Kaedah pemilihan merujuk kepada prosedur untuk memilih unit daripada populasi umum.

Daripada buku General Theory of Statistics pengarang Shcherbina Lidiya Vladimirovna

31. Persampelan mekanikal dan tipikal Dengan persampelan mekanikal semata-mata, keseluruhan populasi umum unit hendaklah pertama sekali dibentangkan dalam bentuk senarai unit pemilihan, disusun dalam beberapa susunan neutral berhubung dengan sifat yang dikaji. Kemudian senaraikan

Daripada buku General Theory of Statistics pengarang Shcherbina Lidiya Vladimirovna

32. Persampelan bersiri dan gabungan Persampelan bersiri (kluster) ialah sejenis pembentukan populasi sampel apabila bukan unit untuk dikaji, tetapi kumpulan unit (siri, sarang) dipilih secara rawak. Di dalam siri yang dipilih (sarang)

Daripada buku General Theory of Statistics pengarang Shcherbina Lidiya Vladimirovna

33. Persampelan berbilang peringkat, berbilang fasa dan interpenetrasi. Keistimewaan pensampelan berbilang peringkat ialah populasi sampel terbentuk secara beransur-ansur, mengikut peringkat pemilihan. Pada peringkat pertama, menggunakan kaedah dan jenis pemilihan yang telah ditetapkan

pengarang Konik Nina Vladimirovna

3. Menentukan saiz sampel yang diperlukan Salah satu prinsip saintifik dalam teori persampelan ialah memastikan bilangan unit terpilih yang mencukupi. Keperluan teori untuk pematuhan prinsip ini dibentangkan dalam bukti had teorem

Daripada buku General Theory of Statistics: Lecture Notes pengarang Konik Nina Vladimirovna

4. Kaedah pemilihan dan jenis persampelan Teori kaedah persampelan telah berkembang pelbagai cara pemilihan dan jenis persampelan untuk memastikan keterwakilan. Kaedah pemilihan merujuk kepada prosedur untuk memilih unit daripada populasi umum. Terdapat dua kaedah pemilihan: berulang

Daripada buku Theory of Statistics pengarang Burkhanova Inessa Viktorovna

36. Kesilapan persampelan Persampelan rawak yang betul ialah pemilihan unit daripada keseluruhan populasi dengan membuat undian atau cara lain yang serupa. Prinsip rawak ialah kemasukan atau pengecualian sesuatu objek daripada sampel tidak boleh dipengaruhi oleh sebarang faktor

Dari buku Business Correspondence: manual latihan pengarang Kirsanova Maria Vladimirovna

Kesilapan leksikal 1. Penggunaan perkataan dan istilah yang tidak betul Sebahagian besar daripada kesalahan dalam surat perniagaan adalah leksikal. Celik huruf yang tidak mencukupi membawa bukan sahaja kepada karut yang ingin tahu, tetapi juga kepada istilah individu dan profesional perkataan slanga

Dari buku era baru- kebimbangan lama: Ekonomi politik pengarang Yasin Evgeniy Grigorievich

5 Kesilapan kami Kami menegaskan: laluan reformasi pasaran yang dipilih adalah betul. Dan mereka tidak gagal sama sekali, mereka hanya tersandung lagi. Tetapi terdapat kesilapan dan ketinggalan. Ini adalah kesilapan kita dan kesilapan kepimpinan negara yang gagal kita cegah. Kesilapan - dalam banyak cara

oleh Kurtis Face

Kepentingan Saiz Sampel Seperti yang saya katakan sebelum ini, orang ramai cenderung untuk memberi terlalu banyak perhatian kepada kejadian yang jarang berlaku sesuatu fenomena, walaupun, dari sudut statistik, adalah mustahil untuk mengekstrak banyak maklumat daripada beberapa kes. Ini adalah sebab utama

Daripada buku The Way of the Turtles. Dari amatur kepada peniaga legenda oleh Kurtis Face

Sampel perwakilan Keterwakilan ujian kami untuk tujuan meramal masa depan ditentukan oleh dua faktor: – Bilangan pasaran: ujian yang dijalankan di pasaran berbeza kemungkinan akan merangkumi pasaran dengan kepada tahap yang berbeza-beza jenis turun naik

Daripada buku The Way of the Turtles. Dari amatur kepada peniaga legenda oleh Kurtis Face

Saiz Sampel Konsep saiz sampel adalah mudah: untuk membuat kesimpulan yang sah secara statistik, anda perlu mempunyai sampel yang cukup besar. Lebih kecil sampel, lebih kasar kesimpulan yang boleh dibuat; Lebih besar sampel, lebih baik kualiti kesimpulan. tak ada

Berdasarkan nilai ciri unit dalam populasi sampel yang didaftarkan mengikut program pemerhatian statistik, ciri sampel umum dikira: min sampel() Dan bahagian sampel unit yang mempunyai sebarang ciri yang menarik minat penyelidik, dalam jumlah bilangan mereka ( w).

Perbezaan antara penunjuk sampel dan populasi umum dipanggil ralat pensampelan.

Ralat pensampelan, seperti ralat dalam mana-mana jenis pemerhatian statistik yang lain, dibahagikan kepada ralat pendaftaran dan ralat perwakilan. Objektif utama kaedah persampelan adalah untuk mengkaji dan mengukur ralat rawak keterwakilan.

Purata sampel dan perkadaran sampel adalah pembolehubah rawak yang boleh mengambil nilai yang berbeza bergantung pada unit populasi yang dimasukkan dalam sampel. Oleh itu, ralat pensampelan juga adalah pembolehubah rawak dan boleh membawa maksud yang berbeza. Oleh itu, purata kesilapan yang mungkin ditentukan.

Ralat pensampelan purata (µ - mu) adalah sama dengan:

untuk purata ; untuk perkongsian ,

di mana r- bahagian ciri tertentu dalam populasi umum.

Dalam formula ini σ x 2 Dan r(1-r) ialah ciri-ciri populasi umum yang tidak diketahui semasa pemerhatian sampel. Dalam praktiknya, mereka digantikan oleh ciri-ciri populasi sampel yang serupa berdasarkan undang-undang bilangan besar, mengikut mana populasi sampel, dengan jumlah yang cukup besar, cukup tepat menghasilkan semula ciri-ciri populasi umum. Kaedah untuk mengira ralat persampelan purata bagi purata dan bagi bahagian semasa persampelan berulang dan tidak berulang diberikan dalam Jadual. 6.1.

Jadual 6.1.

Formula untuk mengira ralat pensampelan purata bagi min dan bagi bahagian

Nilai sentiasa kurang daripada satu, jadi purata ralat persampelan dengan persampelan tidak berulang adalah kurang daripada dengan persampelan berulang. Dalam kes di mana bahagian sampel tidak penting dan pengganda hampir kepada perpaduan, pembetulan boleh diabaikan.

Untuk menegaskan bahawa jeneral nilai purata penunjuk atau bahagian umum tidak akan melangkaui ralat pensampelan purata hanya dengan tahap kebarangkalian tertentu. Oleh itu, untuk mencirikan ralat pensampelan, sebagai tambahan kepada ralat purata, hitung ralat pensampelan marginal(Δ), yang dikaitkan dengan tahap kebarangkalian yang menjaminnya.

Tahap kebarangkalian ( R) menentukan nilai sisihan ternormal ( t), dan sebaliknya. Nilai t diberikan dalam jadual taburan normal kebarangkalian. Gabungan yang paling kerap digunakan t Dan R diberikan dalam jadual. 6.2.


Jadual 6.2

Nilai sisihan ternormal t pada nilai tahap kebarangkalian yang sepadan R

t 1,0 1,5 2,0 2,5 3,0 3,5
R 0,683 0,866 0,954 0,988 0,997 0,999

t- faktor keyakinan, bergantung pada kebarangkalian yang boleh dijamin bahawa ralat maksimum tidak akan melebihi t- ralat purata berbilang. Ia menunjukkan berapa banyak ralat purata terkandung dalam ralat marginal. Jadi, jika t= 1, maka dengan kebarangkalian 0.683 boleh dinyatakan bahawa perbezaan antara sampel dan penunjuk am tidak akan melebihi satu ralat purata.

Formula untuk mengira ralat pensampelan maksimum diberikan dalam Jadual. 6.3.

Jadual 6.3.

Formula untuk mengira ralat pensampelan maksimum untuk purata dan untuk bahagian

Selepas mengira ralat sampel maksimum, kami dapati selang keyakinan untuk petunjuk umum. Kebarangkalian yang diterima semasa mengira ralat ciri sampel dipanggil keyakinan. Tahap keyakinan kebarangkalian 0.95 bermakna hanya dalam 5 kes daripada 100 ralat boleh melampaui sempadan yang ditetapkan; kebarangkalian 0.954 - dalam 46 kes daripada 1000, dan dengan 0.999 - dalam 1 kes daripada 1000.

Untuk purata umum, sempadan yang paling berkemungkinan di mana ia akan ditempatkan, dengan mengambil kira ralat perwakilan maksimum, akan mempunyai bentuk:

.

Sempadan yang paling mungkin di dalamnya bahagian umum akan ditempatkan ialah:

.

Dari sini, purata am , bahagian umum .

Diberi dalam jadual. 6.3. formula digunakan untuk menentukan ralat persampelan yang dilakukan dengan kaedah rawak dan mekanikal semata-mata.

Dengan persampelan berstrata, sampel semestinya termasuk wakil semua kumpulan dan biasanya dalam perkadaran yang sama seperti dalam populasi umum. Oleh itu, ralat pensampelan dalam dalam kes ini bergantung terutamanya pada purata varians dalam kumpulan. Berdasarkan peraturan untuk menambah varians, kita boleh membuat kesimpulan bahawa ralat pensampelan untuk pensampelan berstrata akan sentiasa kurang daripada untuk pensampelan rawak itu sendiri.

Dengan pemilihan bersiri (berkelompok), ukuran kebolehubahan akan menjadi serakan antara kumpulan.