Biografi Ciri-ciri Analisis

Selang keyakinan. Kebarangkalian keyakinan

SELANG KEYAKINAN UNTUK KEKERAPAN DAN BAHAGIAN

© 2008

Institut Kesihatan Awam Negara, Oslo, Norway

Artikel ini menerangkan dan membincangkan pengiraan selang keyakinan untuk frekuensi dan perkadaran menggunakan kaedah Wald, Wilson, Klopper-Pearson, menggunakan penjelmaan sudut dan kaedah Wald dengan pembetulan Agresti-Cowll. Bahan yang dibentangkan menyediakan maklumat umum tentang kaedah untuk mengira selang keyakinan untuk frekuensi dan perkadaran dan bertujuan untuk membangkitkan minat pembaca jurnal bukan sahaja dalam menggunakan selang keyakinan semasa membentangkan hasil penyelidikan mereka sendiri, tetapi juga dalam membaca kesusasteraan khusus sebelum memulakan. bekerja pada penerbitan masa hadapan.

Kata kunci: selang keyakinan, kekerapan, perkadaran

Dalam salah satu penerbitan terdahulu, perihalan data kualitatif telah disebut secara ringkas dan dilaporkan bahawa anggaran selangnya adalah lebih baik daripada anggaran titik untuk menerangkan kekerapan berlakunya ciri yang dikaji dalam populasi umum. Sesungguhnya, memandangkan kajian dijalankan menggunakan data sampel, unjuran keputusan pada populasi umum mesti mengandungi unsur ketidaktepatan dalam anggaran sampel. Selang keyakinan ialah ukuran ketepatan parameter yang dianggarkan. Adalah menarik bahawa dalam beberapa buku mengenai asas statistik untuk doktor, topik selang keyakinan untuk frekuensi diabaikan sepenuhnya. Dalam artikel ini, kami akan mempertimbangkan beberapa cara untuk mengira selang keyakinan untuk frekuensi, dengan mengandaikan ciri sampel seperti tidak berulang dan keterwakilan, serta kebebasan pemerhatian antara satu sama lain. Kekerapan dalam artikel ini tidak difahami sebagai nombor mutlak yang menunjukkan berapa kali nilai ini atau itu berlaku dalam agregat, tetapi nilai relatif yang menentukan bahagian peserta kajian yang mempunyai sifat yang dikaji.

Dalam penyelidikan bioperubatan, selang keyakinan 95% paling kerap digunakan. Selang keyakinan ini ialah kawasan di mana perkadaran sebenar jatuh 95% sepanjang masa. Dengan kata lain, boleh dikatakan dengan kepastian 95% bahawa nilai sebenar kekerapan kejadian sesuatu sifat dalam populasi umum akan berada dalam selang keyakinan 95%.

Kebanyakan buku teks statistik untuk penyelidik perubatan melaporkan bahawa ralat kekerapan dikira menggunakan formula

di mana p ialah kekerapan berlakunya ciri dalam sampel (nilai dari 0 hingga 1). Dalam kebanyakan artikel saintifik domestik, nilai kekerapan kejadian ciri dalam sampel (p) ditunjukkan, serta ralatnya (s) dalam bentuk p ± s. Walau bagaimanapun, adalah lebih sesuai untuk membentangkan selang keyakinan 95% untuk kekerapan kejadian sesuatu sifat dalam populasi umum, yang akan merangkumi nilai daripada

sebelum ini.

Dalam sesetengah buku teks, untuk sampel kecil, adalah disyorkan untuk menggantikan nilai 1.96 dengan nilai t untuk N - 1 darjah kebebasan, di mana N ialah bilangan cerapan dalam sampel. Nilai t terdapat dalam jadual untuk taburan-t, yang terdapat dalam hampir semua buku teks tentang statistik. Penggunaan taburan t untuk kaedah Wald tidak memberikan kelebihan yang boleh dilihat berbanding kaedah lain yang dibincangkan di bawah, dan oleh itu tidak dialu-alukan oleh sesetengah pengarang.

Kaedah di atas untuk mengira selang keyakinan untuk frekuensi atau pecahan dinamakan sempena Abraham Wald (Abraham Wald, 1902–1950), kerana ia mula digunakan secara meluas selepas penerbitan Wald dan Wolfowitz pada tahun 1939. Walau bagaimanapun, kaedah itu sendiri telah dicadangkan oleh Pierre Simon Laplace (1749–1827) seawal 1812.

Kaedah Wald sangat popular, tetapi aplikasinya dikaitkan dengan masalah yang ketara. Kaedah ini tidak disyorkan untuk saiz sampel yang kecil, serta dalam kes di mana kekerapan kejadian ciri cenderung kepada 0 atau 1 (0% atau 100%) dan tidak mungkin untuk frekuensi 0 dan 1. Di samping itu, anggaran taburan normal, yang digunakan semasa mengira ralat , "tidak berfungsi" dalam kes di mana n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Memandangkan pembolehubah baharu diedarkan secara normal, sempadan bawah dan atas selang keyakinan 95% untuk pembolehubah φ ialah φ-1.96 dan φ+1.96 kiri">

Daripada 1.96 untuk sampel kecil, adalah disyorkan untuk menggantikan nilai t untuk N - 1 darjah kebebasan. Kaedah ini tidak memberikan nilai negatif dan membolehkan anda menganggarkan selang keyakinan untuk frekuensi dengan lebih tepat daripada kaedah Wald. Di samping itu, ia diterangkan dalam banyak buku rujukan domestik mengenai statistik perubatan, yang, bagaimanapun, tidak membawa kepada penggunaannya yang meluas dalam penyelidikan perubatan. Mengira selang keyakinan menggunakan penjelmaan sudut tidak disyorkan untuk frekuensi yang menghampiri 0 atau 1.

Di sinilah huraian kaedah untuk menganggar selang keyakinan dalam kebanyakan buku mengenai asas statistik untuk penyelidik perubatan biasanya berakhir, dan masalah ini adalah tipikal bukan sahaja untuk domestik, tetapi juga untuk kesusasteraan asing. Kedua-dua kaedah adalah berdasarkan teorem had pusat, yang membayangkan sampel yang besar.

Memandangkan kelemahan menganggar selang keyakinan menggunakan kaedah di atas, Clopper (Clopper) dan Pearson (Pearson) mencadangkan pada tahun 1934 satu kaedah untuk mengira apa yang dipanggil selang keyakinan tepat, dengan mengambil kira taburan binomial sifat yang dikaji. Kaedah ini tersedia dalam banyak kalkulator dalam talian, walau bagaimanapun, selang keyakinan yang diperoleh dengan cara ini dalam kebanyakan kes terlalu lebar. Pada masa yang sama, kaedah ini disyorkan untuk digunakan dalam kes di mana anggaran konservatif diperlukan. Tahap konservatif kaedah meningkat apabila saiz sampel berkurangan, terutamanya untuk N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Menurut banyak ahli statistik, anggaran selang keyakinan yang paling optimum untuk frekuensi dijalankan oleh kaedah Wilson, yang dicadangkan pada tahun 1927, tetapi praktikalnya tidak digunakan dalam penyelidikan bioperubatan domestik. Kaedah ini bukan sahaja memungkinkan untuk menganggarkan selang keyakinan untuk kedua-dua frekuensi yang sangat kecil dan sangat tinggi, tetapi juga boleh digunakan untuk sebilangan kecil pemerhatian. Secara umum, selang keyakinan mengikut formula Wilson mempunyai bentuk dari



di mana ia mengambil nilai 1.96 apabila mengira selang keyakinan 95%, N ialah bilangan cerapan, dan p ialah kekerapan ciri dalam sampel. Kaedah ini tersedia dalam kalkulator dalam talian, jadi aplikasinya tidak bermasalah. dan jangan mengesyorkan menggunakan kaedah ini untuk n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Sebagai tambahan kepada kaedah Wilson, kaedah Wald yang diperbetulkan Agresti-Caull juga dipercayai memberikan anggaran optimum selang keyakinan untuk frekuensi. Pembetulan Agresti-Coulle ialah penggantian dalam formula Wald untuk kekerapan berlakunya sifat dalam sampel (p) dengan p`, apabila mengira yang mana 2 ditambah kepada pengangka, dan 4 ditambah kepada penyebut, iaitu , p` = (X + 2) / (N + 4), di mana X ialah bilangan peserta kajian yang mempunyai sifat yang dikaji, dan N ialah saiz sampel. Pengubahsuaian ini menghasilkan keputusan yang hampir sama dengan formula Wilson, kecuali apabila kadar peristiwa menghampiri 0% atau 100% dan sampel adalah kecil. Sebagai tambahan kepada kaedah di atas untuk mengira selang keyakinan untuk frekuensi, pembetulan kesinambungan telah dicadangkan untuk kedua-dua kaedah Wald dan kaedah Wilson untuk sampel kecil, tetapi kajian telah menunjukkan bahawa penggunaannya tidak sesuai.

Pertimbangkan penggunaan kaedah di atas untuk mengira selang keyakinan menggunakan dua contoh. Dalam kes pertama, kami mengkaji sampel besar 1,000 peserta kajian yang dipilih secara rawak, di mana 450 daripadanya mempunyai sifat yang dikaji (sama ada faktor risiko, hasil atau sebarang sifat lain), iaitu kekerapan 0.45, atau 45%. Dalam kes kedua, kajian dijalankan menggunakan sampel yang kecil, katakan, hanya 20 orang, dan hanya 1 peserta dalam kajian (5%) mempunyai sifat yang dikaji. Selang keyakinan untuk kaedah Wald, untuk kaedah Wald dengan pembetulan Agresti-Coll, untuk kaedah Wilson dikira menggunakan kalkulator dalam talian yang dibangunkan oleh Jeff Sauro (http://www./wald.htm). Selang keyakinan Wilson yang diperbetulkan kesinambungan dikira menggunakan kalkulator yang disediakan oleh Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Pengiraan menggunakan penjelmaan sudut Fisher dilakukan "secara manual" menggunakan nilai kritikal t untuk 19 dan 999 darjah kebebasan, masing-masing. Keputusan pengiraan dibentangkan dalam jadual untuk kedua-dua contoh.

Selang keyakinan dikira dalam enam cara berbeza untuk dua contoh yang diterangkan dalam teks

Kaedah Pengiraan Selang Keyakinan

P=0.0500, atau 5%

95% CI untuk X=450, N=1000, P=0.4500 atau 45%

–0,0455–0,2541

Walda dengan pembetulan Agresti-Coll

<,0001–0,2541

Wilson dengan pembetulan kesinambungan

"kaedah tepat" Klopper-Pearson

Transformasi sudut

<0,0001–0,1967

Seperti yang dapat dilihat dari jadual, untuk contoh pertama, selang keyakinan yang dikira oleh kaedah Wald "diterima secara umum" masuk ke kawasan negatif, yang tidak boleh berlaku untuk frekuensi. Malangnya, kejadian sebegitu tidak jarang berlaku dalam kesusasteraan Rusia. Cara tradisional untuk mewakili data sebagai kekerapan dan ralatnya sebahagiannya menutupi masalah ini. Sebagai contoh, jika kekerapan kejadian sesuatu sifat (dalam peratus) dibentangkan sebagai 2.1 ± 1.4, maka ini tidak "merengsakan" seperti 2.1% (95% CI: -0.7; 4.9), walaupun dan bermakna sama. Kaedah Wald dengan pembetulan Agresti-Coulle dan pengiraan menggunakan penjelmaan sudut memberikan batas bawah yang cenderung kepada sifar. Kaedah Wilson dengan pembetulan kesinambungan dan "kaedah tepat" memberikan selang keyakinan yang lebih luas daripada kaedah Wilson. Untuk contoh kedua, semua kaedah memberikan kira-kira selang keyakinan yang sama (perbezaan hanya muncul dalam perseribu), yang tidak menghairankan, kerana kekerapan kejadian dalam contoh ini tidak banyak berbeza daripada 50%, dan saiz sampel agak besar .

Bagi pembaca yang berminat dengan masalah ini, kami boleh mengesyorkan karya R. G. Newcombe dan Brown, Cai dan Dasgupta, yang masing-masing memberi kebaikan dan keburukan menggunakan 7 dan 10 kaedah berbeza untuk mengira selang keyakinan. Dari manual domestik, buku dan disyorkan, di mana, sebagai tambahan kepada penerangan terperinci tentang teori, kaedah Wald dan Wilson dibentangkan, serta kaedah untuk mengira selang keyakinan, dengan mengambil kira taburan frekuensi binomial. Selain kalkulator dalam talian percuma (http://www./wald.htm dan http://faculty.vassar.edu/lowry/prop1.html), selang keyakinan untuk frekuensi (dan bukan sahaja!) boleh dikira menggunakan Program CIA ( Confidence Intervals Analysis), yang boleh dimuat turun dari http://www. sekolah perubatan. soton. ac. uk/cia/ .

Artikel seterusnya akan melihat cara univariate untuk membandingkan data kualitatif.

Bibliografi

Banerjee A. Statistik perubatan dalam bahasa biasa: kursus pengenalan / A. Banerzhi. - M. : Perubatan praktikal, 2007. - 287 p. Statistik perubatan / . - M. : Agensi Maklumat Perubatan, 2007. - 475 p. Glanz S. Statistik perubatan-biologi / S. Glants. - M. : Amalan, 1998. Jenis data, pengesahan pengedaran dan statistik deskriptif / // Ekologi Manusia - 2008. - No. 1. - P. 52–58. Zhizhin K.S.. Statistik perubatan: buku teks / . - Rostov n / D: Phoenix, 2007. - 160 p. Perangkaan Perubatan Gunaan / , . - St Petersburg. : Folio, 2003. - 428 hlm. Lakin G. F. Biometrik / . - M. : Sekolah tinggi, 1990. - 350 p. Perubatan V. A. Statistik matematik dalam perubatan / , . - M. : Kewangan dan perangkaan, 2007. - 798 p. Statistik matematik dalam penyelidikan klinikal / , . - M. : GEOTAR-MED, 2001. - 256 hlm. Junkerov V. Dan. Pemprosesan statistik perubatan data penyelidikan perubatan /,. - St Petersburg. : VmedA, 2002. - 266 p. Agresti A. Anggaran adalah lebih baik daripada tepat untuk anggaran selang perkadaran binomial / A. Agresti, B. Coull // ahli statistik Amerika. - 1998. - N 52. - S. 119-126. Altman D. Statistik dengan yakin // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. Brown L.D. Anggaran selang untuk perkadaran binomial / L. D. Brown, T. T. Cai, A. Dasgupta // Sains statistik. - 2001. - N 2. - P. 101-133. Clopper C.J. Penggunaan had keyakinan atau fiducial yang digambarkan dalam kes binomial / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. Pada selang keyakinan untuk parameter binomial / M. A. Garcia-Perez // Kualiti dan kuantiti. - 2005. - N 39. - P. 467-481. Motulsky H. Biostatistik intuitif // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 hlm. Newcombe R.G. Selang Keyakinan Dua Sebelah untuk Perkadaran Tunggal: Perbandingan Tujuh Kaedah / R. G. Newcombe // Statistik dalam Perubatan. - 1998. - N. 17. - P. 857–872. Sauro J. Menganggar kadar penyiapan daripada sampel kecil menggunakan selang keyakinan binomial: perbandingan dan cadangan / J. Sauro, J. R. Lewis // Prosiding mesyuarat tahunan masyarakat faktor manusia dan ergonomik. – Orlando, FL, 2005. Wald A. Had keyakinan untuk fungsi pengedaran berterusan // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - Hlm. 105–118. Wilson E. B. Inferens berkemungkinan, undang-undang penggantian, dan inferens statistik / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

SELANG KEYAKINAN UNTUK PERKADAR

A. M. Grjibovski

Institut Kesihatan Awam Negara, Oslo, Norway

Artikel ini membentangkan beberapa kaedah untuk pengiraan selang keyakinan untuk perkadaran binomial, iaitu, Wald, Wilson, arcsine, Agresti-Coull dan kaedah Clopper-Pearson yang tepat. Makalah ini hanya memberikan pengenalan umum kepada masalah anggaran selang keyakinan bagi perkadaran binomial dan tujuannya bukan sahaja untuk merangsang pembaca menggunakan selang keyakinan apabila membentangkan hasil selang kajian empirikal sendiri, tetapi juga untuk menggalakkan mereka merujuk buku statistik sebelum ini. untuk menganalisis data sendiri dan menyediakan manuskrip.

kata kunci: selang keyakinan, perkadaran

Maklumat perhubungan:

Penasihat Kanan, Institut Kesihatan Awam Negara, Oslo, Norway

Minda bukan sahaja dalam pengetahuan, tetapi juga dalam keupayaan untuk menggunakan pengetahuan dalam amalan. (Aristotle)

Selang keyakinan

tinjauan umum

Mengambil sampel daripada populasi, kami akan mendapatkan anggaran mata parameter yang menarik minat kami dan mengira ralat piawai untuk menunjukkan ketepatan anggaran.

Walau bagaimanapun, untuk kebanyakan kes, ralat standard seperti itu tidak boleh diterima. Adalah lebih berguna untuk menggabungkan ukuran ketepatan ini dengan anggaran selang untuk parameter populasi.

Ini boleh dilakukan dengan menggunakan pengetahuan tentang taburan kebarangkalian teori bagi statistik sampel (parameter) untuk mengira selang keyakinan (CI - Selang Keyakinan, CI - Selang Keyakinan) untuk parameter.

Secara umum, selang keyakinan memanjangkan anggaran dalam kedua-dua arah dengan beberapa gandaan ralat piawai (parameter tertentu); dua nilai (had keyakinan) yang mentakrifkan selang biasanya dipisahkan dengan koma dan disertakan dalam kurungan.

Selang keyakinan untuk min

Menggunakan taburan normal

Min sampel mempunyai taburan normal jika saiz sampel adalah besar, jadi pengetahuan tentang taburan normal boleh digunakan apabila mempertimbangkan min sampel.

Khususnya, 95% daripada taburan min sampel berada dalam 1.96 sisihan piawai (SD) daripada min populasi.

Apabila kami hanya mempunyai satu sampel, kami memanggil ini ralat standard min (SEM) dan mengira selang keyakinan 95% untuk min seperti berikut:

Jika eksperimen ini diulang beberapa kali, maka selang itu akan mengandungi min populasi sebenar 95% daripada masa itu.

Ini biasanya selang keyakinan, seperti julat nilai di mana purata populasi sebenar (min am) terletak dengan tahap keyakinan 95%.

Walaupun ia tidak begitu ketat (min populasi ialah nilai tetap dan oleh itu tidak boleh mempunyai kebarangkalian yang berkaitan dengannya) untuk mentafsir selang keyakinan dengan cara ini, ia lebih mudah difahami dari segi konsep.

Penggunaan t- pengedaran

Anda boleh menggunakan taburan normal jika anda mengetahui nilai varians dalam populasi. Selain itu, apabila saiz sampel kecil, min sampel mengikut taburan normal jika data yang mendasari populasi adalah taburan normal.

Jika data yang mendasari populasi tidak bertaburan normal dan/atau varians umum (varians populasi) tidak diketahui, min sampel mematuhi Taburan-t pelajar.

Kirakan selang keyakinan 95% bagi min populasi seperti berikut:

Di mana - mata peratusan (peratus) t- Taburan pelajar dengan (n-1) darjah kebebasan, yang memberikan kebarangkalian dua hujung 0.05.

Secara amnya, ia memberikan selang yang lebih luas daripada apabila menggunakan taburan normal, kerana ia mengambil kira ketidakpastian tambahan yang diperkenalkan dengan menganggar sisihan piawai populasi dan/atau disebabkan oleh saiz sampel yang kecil.

Apabila saiz sampel adalah besar (daripada susunan 100 atau lebih), perbezaan antara kedua-dua taburan ( t-pelajar dan normal) boleh diabaikan. Walau bagaimanapun, sentiasa gunakan t- pengedaran semasa mengira selang keyakinan, walaupun saiz sampel adalah besar.

Biasanya 95% CI diberikan. Selang keyakinan lain boleh dikira, seperti 99% CI untuk min.

Daripada produk ralat piawai dan nilai jadual t- taburan yang sepadan dengan kebarangkalian dua hujung 0.05 darabkannya (ralat piawai) dengan nilai yang sepadan dengan kebarangkalian dua hujung 0.01. Ini adalah selang keyakinan yang lebih luas daripada kes 95% kerana ia mencerminkan peningkatan keyakinan bahawa selang itu sememangnya termasuk min populasi.

Selang keyakinan untuk perkadaran

Taburan persampelan perkadaran mempunyai taburan binomial. Walau bagaimanapun, jika saiz sampel n agak besar, maka taburan sampel perkadaran adalah lebih kurang normal dengan min .

Anggarkan mengikut nisbah persampelan p=r/n(di mana r- bilangan individu dalam sampel dengan ciri yang menarik minat kami), dan ralat piawai dianggarkan:

Selang keyakinan 95% untuk perkadaran dianggarkan:

Jika saiz sampel kecil (biasanya apabila np atau n(1-p) kurang 5 ), maka taburan binomial mesti digunakan untuk mengira selang keyakinan yang tepat.

Perhatikan bahawa jika hlm dinyatakan sebagai peratusan, maka (1-p) digantikan oleh (100p).

Tafsiran selang keyakinan

Apabila mentafsir selang keyakinan, kami berminat dengan soalan berikut:

Berapa lebar selang keyakinan?

Selang keyakinan yang luas menunjukkan bahawa anggaran adalah tidak tepat; sempit menunjukkan anggaran yang baik.

Lebar selang keyakinan bergantung pada saiz ralat piawai, yang, seterusnya, bergantung pada saiz sampel dan, apabila mempertimbangkan pembolehubah berangka daripada kebolehubahan data, memberikan selang keyakinan yang lebih luas daripada kajian set data yang besar. daripada beberapa pembolehubah.

Adakah CI memasukkan sebarang nilai kepentingan tertentu?

Anda boleh menyemak sama ada nilai kemungkinan untuk parameter populasi berada dalam selang keyakinan. Jika ya, maka keputusannya adalah konsisten dengan nilai kemungkinan ini. Jika tidak, maka tidak mungkin (untuk selang keyakinan 95%, peluangnya hampir 5%) bahawa parameter mempunyai nilai ini.

Selang keyakinan ialah nilai had kuantiti statistik, yang, dengan kebarangkalian keyakinan yang diberikan γ, akan berada dalam selang ini dengan saiz sampel yang lebih besar. Ditandakan sebagai P(θ - ε . Dalam amalan, kebarangkalian keyakinan γ dipilih daripada nilai γ = 0.9 , γ = 0.95 , γ = 0.99 cukup hampir kepada perpaduan.

Tugasan perkhidmatan. Perkhidmatan ini mentakrifkan:

  • selang keyakinan untuk min am, selang keyakinan untuk varians;
  • selang keyakinan untuk sisihan piawai, selang keyakinan untuk pecahan am;
Penyelesaian yang terhasil disimpan dalam fail Word (lihat contoh). Di bawah ialah arahan video tentang cara mengisi data awal.

Contoh #1. Di ladang kolektif, daripada sejumlah 1,000 ekor biri-biri, 100 ekor biri-biri telah dikenakan pemotongan kawalan terpilih. Hasilnya, ricih purata bulu sebanyak 4.2 kg setiap ekor biri-biri telah ditubuhkan. Tentukan dengan kebarangkalian 0.99 ralat piawai sampel dalam menentukan purata ricih bulu bagi setiap biri-biri dan had di mana nilai ricih terletak jika varians ialah 2.5. Sampel tidak berulang.
Contoh #2. Daripada kumpulan produk import di pos Kastam Utara Moscow, 20 sampel produk "A" telah diambil mengikut susunan pensampelan semula secara rawak. Hasil daripada pemeriksaan, kandungan lembapan purata produk "A" dalam sampel telah ditubuhkan, yang ternyata 6% dengan sisihan piawai 1%.
Tentukan dengan kebarangkalian 0.683 had purata kandungan lembapan produk dalam keseluruhan kumpulan produk import.
Contoh #3. Tinjauan terhadap 36 pelajar menunjukkan purata bilangan buku teks yang dibaca oleh mereka bagi setiap tahun akademik adalah 6. Dengan mengandaikan bilangan buku teks yang dibaca oleh pelajar setiap semester mempunyai undang-undang taburan normal dengan sisihan piawai bersamaan 6, cari : A) dengan kebolehpercayaan anggaran selang 0.99 untuk jangkaan matematik pembolehubah rawak ini; B) dengan apakah kebarangkalian boleh dikatakan bahawa purata bilangan buku teks yang dibaca oleh pelajar setiap semester, yang dikira untuk sampel ini, menyimpang daripada jangkaan matematik dalam nilai mutlak tidak lebih daripada 2.

Klasifikasi selang keyakinan

Mengikut jenis parameter yang dinilai:

Mengikut jenis sampel:

  1. Selang keyakinan untuk persampelan tak terhingga;
  2. Selang keyakinan untuk sampel akhir;
Persampelan dipanggil pensampelan semula, jika objek yang dipilih dikembalikan kepada populasi umum sebelum memilih yang seterusnya. Sampel dipanggil tidak berulang. jika objek yang dipilih tidak dikembalikan kepada populasi umum. Dalam amalan, seseorang biasanya berurusan dengan sampel tidak berulang.

Pengiraan ralat pensampelan min untuk pemilihan rawak

Percanggahan antara nilai penunjuk yang diperoleh daripada sampel dan parameter yang sepadan bagi populasi umum dipanggil kesilapan perwakilan.
Penetapan parameter utama populasi umum dan sampel.
Contoh Formula Ralat Min
pemilihan semulapemilihan tidak berulang
untuk pertengahanuntuk perkongsianuntuk pertengahanuntuk perkongsian
Nisbah antara had ralat pensampelan (Δ) dijamin dengan beberapa kebarangkalian P(t), dan ralat pensampelan purata mempunyai bentuk: atau Δ = t μ, di mana t– pekali keyakinan, ditentukan bergantung pada tahap kebarangkalian P(t) mengikut jadual fungsi Laplace kamiran.

Formula untuk mengira saiz sampel dengan kaedah pemilihan rawak yang betul

Dalam statistik, terdapat dua jenis anggaran: titik dan selang. Anggaran Mata ialah statistik sampel tunggal yang digunakan untuk menganggar parameter populasi. Contohnya, min sampel ialah anggaran titik bagi min populasi, dan varians sampel S2- anggaran titik varians populasi σ2. telah ditunjukkan bahawa min sampel adalah anggaran yang tidak berat sebelah terhadap jangkaan populasi. Min sampel dipanggil tidak berat sebelah kerana min semua sampel bermakna (dengan saiz sampel yang sama n) adalah sama dengan jangkaan matematik populasi umum.

Untuk varians sampel S2 menjadi penganggar yang tidak berat sebelah bagi varians populasi σ2, penyebut varians sampel hendaklah ditetapkan sama dengan n – 1 , tetapi tidak n. Dengan kata lain, varians populasi ialah purata semua varians sampel yang mungkin.

Apabila menganggar parameter populasi, perlu diingat bahawa statistik sampel seperti , bergantung pada sampel tertentu. Untuk mengambil kira fakta ini, untuk mendapatkan anggaran selang jangkaan matematik populasi umum menganalisis taburan min sampel (untuk butiran lanjut, lihat). Selang yang dibina dicirikan oleh tahap keyakinan tertentu, iaitu kebarangkalian bahawa parameter sebenar populasi umum dianggarkan dengan betul. Selang keyakinan yang serupa boleh digunakan untuk menganggarkan perkadaran ciri R dan jisim teragih utama penduduk umum.

Muat turun nota dalam atau format, contoh dalam format

Pembinaan selang keyakinan untuk jangkaan matematik populasi umum dengan sisihan piawai yang diketahui

Membina selang keyakinan untuk perkadaran sifat dalam populasi umum

Dalam bahagian ini, konsep selang keyakinan dilanjutkan kepada data kategori. Ini membolehkan anda menganggarkan bahagian sifat dalam populasi umum R dengan bahagian sampel RS= X/n. Seperti yang dinyatakan, jika nilai nR dan n(1 - p) melebihi nombor 5, taburan binomial boleh dianggarkan dengan yang normal. Oleh itu, untuk menganggar bahagian sesuatu sifat dalam populasi umum R adalah mungkin untuk membina selang yang tahap keyakinannya sama dengan (1 - α)x100%.


di mana hlmS- bahagian sampel ciri, sama dengan X/n, iaitu bilangan kejayaan dibahagikan dengan saiz sampel, R- bahagian sifat dalam populasi umum, Z ialah nilai kritikal taburan normal piawai, n- saiz sampel.

Contoh 3 Mari kita andaikan bahawa sampel diekstrak daripada sistem maklumat, yang terdiri daripada 100 invois yang disiapkan pada bulan lepas. Katakan 10 daripada invois ini tidak betul. Dengan cara ini, R= 10/100 = 0.1. Tahap keyakinan 95% sepadan dengan nilai kritikal Z = 1.96.

Oleh itu, terdapat 95% kemungkinan bahawa antara 4.12% dan 15.88% daripada invois mengandungi ralat.

Untuk saiz sampel tertentu, selang keyakinan yang mengandungi perkadaran sifat dalam populasi umum nampaknya lebih luas daripada pembolehubah rawak berterusan. Ini kerana pengukuran pembolehubah rawak berterusan mengandungi lebih banyak maklumat daripada pengukuran data kategori. Dalam erti kata lain, data kategori yang mengambil hanya dua nilai mengandungi maklumat yang tidak mencukupi untuk menganggarkan parameter pengedarannya.

ATpengiraan anggaran yang diambil daripada populasi terhingga

Anggaran jangkaan matematik. Faktor pembetulan untuk populasi akhir ( fpc) digunakan untuk mengurangkan ralat piawai dengan faktor . Apabila mengira selang keyakinan untuk anggaran parameter populasi, faktor pembetulan digunakan dalam situasi di mana sampel diambil tanpa penggantian. Oleh itu, selang keyakinan untuk jangkaan matematik, mempunyai tahap keyakinan yang sama dengan (1 - α)x100%, dikira dengan formula:

Contoh 4 Untuk menggambarkan penggunaan faktor pembetulan bagi populasi terhingga, mari kita kembali kepada masalah mengira selang keyakinan bagi jumlah purata invois yang dibincangkan dalam Contoh 3 di atas. Katakan syarikat mengeluarkan 5,000 invois sebulan, dan Xᅳ=110.27 USD, S= $28.95 N = 5000, n = 100, α = 0.05, t99 = 1.9842. Menurut formula (6) kita dapat:

Anggaran bahagian ciri. Apabila memilih tiada pulangan, selang keyakinan untuk bahagian ciri yang mempunyai tahap keyakinan yang sama dengan (1 - α)x100%, dikira dengan formula:

Selang keyakinan dan isu etika

Apabila persampelan populasi dan merumuskan inferens statistik, masalah etika sering timbul. Perkara utama ialah bagaimana selang keyakinan dan anggaran titik statistik sampel bersetuju. Anggaran titik penerbitan tanpa menyatakan selang keyakinan yang sesuai (biasanya pada tahap keyakinan 95%) dan saiz sampel yang mana ia diperoleh boleh mengelirukan. Ini mungkin memberi pengguna tanggapan bahawa anggaran mata adalah perkara yang dia perlukan untuk meramalkan sifat keseluruhan populasi. Oleh itu, adalah perlu untuk memahami bahawa dalam mana-mana penyelidikan, bukan titik, tetapi anggaran selang harus diletakkan di hadapan. Di samping itu, perhatian khusus harus diberikan kepada pilihan saiz sampel yang betul.

Selalunya, objek manipulasi statistik adalah hasil tinjauan sosiologi penduduk mengenai pelbagai isu politik. Pada masa yang sama, hasil tinjauan diletakkan di muka depan akhbar, dan ralat pensampelan dan metodologi analisis statistik dicetak di suatu tempat di tengah-tengah. Untuk membuktikan kesahihan anggaran mata yang diperoleh, adalah perlu untuk menunjukkan saiz sampel berdasarkan mana ia diperoleh, sempadan selang keyakinan dan tahap keertiannya.

Nota seterusnya

Bahan daripada buku Levin et al. Perangkaan untuk pengurus digunakan. - M.: Williams, 2004. - hlm. 448–462

Teorem had pusat menyatakan bahawa, memandangkan saiz sampel yang cukup besar, taburan sampel min boleh dianggarkan dengan taburan normal. Harta ini tidak bergantung pada jenis taburan penduduk.

"Katren-Style" terus menerbitkan kitaran Konstantin Kravchik mengenai statistik perubatan. Dalam dua artikel sebelum ini, penulis menyentuh penjelasan tentang konsep seperti dan.

Konstantin Kravchik

Ahli matematik-penganalisis. Pakar dalam bidang penyelidikan statistik dalam perubatan dan kemanusiaan

bandar Moscow

Selalunya dalam artikel mengenai ujian klinikal anda boleh menemui frasa misteri: "selang keyakinan" (95% CI atau 95% CI - selang keyakinan). Sebagai contoh, artikel mungkin berkata: "Ujian-t pelajar digunakan untuk menilai kepentingan perbezaan, dengan selang keyakinan 95% dikira."

Apakah nilai "selang keyakinan 95%" dan mengapa mengiranya?

Apakah selang keyakinan? - Ini ialah julat di mana nilai min sebenar dalam populasi jatuh. Dan apakah, terdapat purata "tidak benar"? Dari satu segi, ya, mereka lakukan. Dalam kami menjelaskan bahawa adalah mustahil untuk mengukur parameter minat dalam keseluruhan populasi, jadi penyelidik berpuas hati dengan sampel yang terhad. Dalam sampel ini (contohnya, mengikut berat badan) terdapat satu nilai purata (berat tertentu), yang mana kami menilai nilai purata dalam keseluruhan populasi umum. Walau bagaimanapun, tidak mungkin purata berat dalam sampel (terutama yang kecil) akan bertepatan dengan purata berat dalam populasi umum. Oleh itu, adalah lebih tepat untuk mengira dan menggunakan julat nilai purata populasi umum.

Sebagai contoh, katakan selang keyakinan 95% (95% CI) untuk hemoglobin adalah antara 110 dan 122 g/L. Ini bermakna dengan kebarangkalian 95 %, nilai min sebenar hemoglobin dalam populasi umum adalah dalam julat dari 110 hingga 122 g/l. Dalam erti kata lain, kita tidak mengetahui purata hemoglobin dalam populasi umum, tetapi kita boleh menunjukkan julat nilai untuk ciri ini dengan kebarangkalian 95%.

Selang keyakinan amat berkaitan dengan perbezaan cara antara kumpulan, atau apa yang dipanggil saiz kesan.

Katakan kita membandingkan keberkesanan dua persediaan besi: satu yang telah lama di pasaran dan satu yang baru didaftarkan. Selepas kursus terapi, kepekatan hemoglobin dalam kumpulan pesakit yang dikaji telah dinilai, dan program statistik mengira untuk kita bahawa perbezaan antara nilai purata kedua-dua kumpulan dengan kebarangkalian 95% adalah dalam julat dari 1.72 hingga 14.36 g/l (Jadual 1).

Tab. 1. Kriteria untuk sampel bebas
(kumpulan dibandingkan dengan tahap hemoglobin)

Ini harus ditafsirkan seperti berikut: dalam sebahagian daripada pesakit dalam populasi umum yang mengambil ubat baru, hemoglobin akan lebih tinggi secara purata sebanyak 1.72-14.36 g/l berbanding mereka yang mengambil ubat yang telah diketahui.

Dalam erti kata lain, dalam populasi umum, perbezaan dalam nilai purata hemoglobin dalam kumpulan dengan kebarangkalian 95% adalah dalam had ini. Terpulang kepada pengkaji untuk menilai sama ada ini banyak atau sedikit. Inti dari semua ini ialah kami tidak bekerja dengan satu nilai purata, tetapi dengan julat nilai, oleh itu, kami lebih pasti menganggarkan perbezaan dalam parameter antara kumpulan.

Dalam pakej statistik, mengikut budi bicara penyelidik, seseorang boleh secara bebas menyempitkan atau mengembangkan sempadan selang keyakinan. Dengan menurunkan kebarangkalian selang keyakinan, kami menyempitkan julat cara. Contohnya, pada 90% CI, julat min (atau perbezaan min) akan lebih sempit daripada 95% CI.

Sebaliknya, meningkatkan kebarangkalian kepada 99% meluaskan julat nilai. Apabila membandingkan kumpulan, had bawah CI mungkin melepasi tanda sifar. Sebagai contoh, jika kita memanjangkan sempadan selang keyakinan kepada 99 %, maka sempadan selang itu berjulat dari –1 hingga 16 g/L. Ini bermakna dalam populasi umum terdapat kumpulan, perbezaan di antara purata antara untuk sifat yang dikaji ialah 0 (M=0).

Selang keyakinan boleh digunakan untuk menguji hipotesis statistik. Jika selang keyakinan melepasi nilai sifar, maka hipotesis nol, yang menganggap bahawa kumpulan tidak berbeza dalam parameter yang dikaji, adalah benar. Satu contoh diterangkan di atas, apabila kami mengembangkan sempadan kepada 99%. Di suatu tempat dalam populasi umum, kami menemui kumpulan yang tidak berbeza dalam apa jua cara.

95% selang keyakinan perbezaan hemoglobin, (g/l)


Rajah menunjukkan selang keyakinan 95% perbezaan purata hemoglobin antara kedua-dua kumpulan sebagai garis. Garis melepasi tanda sifar, oleh itu, terdapat perbezaan antara min sama dengan sifar, yang mengesahkan hipotesis nol bahawa kumpulan tidak berbeza. Perbezaan antara kumpulan adalah dari -2 hingga 5 g/l, yang bermaksud hemoglobin boleh sama ada menurun sebanyak 2 g/l atau meningkat sebanyak 5 g/l.

Selang keyakinan adalah penunjuk yang sangat penting. Terima kasih kepadanya, anda boleh melihat sama ada perbezaan dalam kumpulan itu benar-benar disebabkan oleh perbezaan dalam cara atau disebabkan oleh sampel yang besar, kerana dengan sampel yang besar, peluang untuk mencari perbezaan adalah lebih besar daripada dengan sampel yang kecil.

Dalam amalan, ia mungkin kelihatan seperti ini. Kami mengambil sampel 1000 orang, mengukur tahap hemoglobin dan mendapati bahawa selang keyakinan untuk perbezaan min terletak dari 1.2 hingga 1.5 g/L. Tahap kepentingan statistik dalam kes ini p

Kami melihat bahawa kepekatan hemoglobin meningkat, tetapi hampir tidak dapat dilihat, oleh itu, kepentingan statistik muncul dengan tepat disebabkan oleh saiz sampel.

Selang keyakinan boleh dikira bukan sahaja untuk purata, tetapi juga untuk perkadaran (dan nisbah risiko). Sebagai contoh, kami berminat dengan selang keyakinan perkadaran pesakit yang mencapai remisi semasa mengambil ubat yang dibangunkan. Andaikan bahawa 95% CI untuk perkadaran, iaitu untuk perkadaran pesakit sedemikian, adalah dalam julat 0.60-0.80. Oleh itu, kita boleh mengatakan bahawa ubat kita mempunyai kesan terapeutik dalam 60 hingga 80% kes.