Biografi Ciri-ciri Analisis

Bagaimana untuk mengira sampel untuk kajian. Populasi umum dan kaedah persampelan

Formula di bawah untuk mengira saiz sampel digunakan dalam kes di mana responden (responden) ditanya hanya satu soalan, yang hanya terdapat dua kemungkinan jawapan. Contohnya, "Ya" dan "Tidak"; "Saya guna" dan "Saya tidak guna". Sudah tentu, formula ini hanya boleh digunakan untuk penyelidikan mudah. Jika anda perlu menentukan saiz sampel untuk lebih daripada penyelidikan berskala besar, sebagai contoh, soal selidik, maka formula lain harus digunakan.

Formula mudah untuk mengira saiz sampel

di mana: n- saiz sampel;

z ialah sisihan ternormal ditentukan berdasarkan tahap keyakinan yang dipilih. Penunjuk ini mencirikan kemungkinan, kebarangkalian mendapat jawapan dalam selang keyakinan khas. Dalam amalan, tahap keyakinan selalunya diambil sebagai 95% atau 99%. Maka nilai z ialah 1.96 dan 2.58, masing-masing;

hlm– variasi untuk sampel, dalam saham. Pada dasarnya, p ialah kebarangkalian bahawa responden akan memilih satu atau pilihan jawapan yang lain. Katakan jika kita percaya bahawa satu perempat daripada responden akan memilih jawapan "Ya", maka p akan bersamaan dengan 25%, iaitu, p = 0.25;

q= (1 – p);

e– ralat yang dibenarkan, dalam pecahan.

Contoh pengiraan saiz sampel

Syarikat itu merancang untuk penyelidikan sosiologi untuk mengenal pasti kadar perokok dalam populasi bandar. Untuk melakukan ini, pekerja syarikat akan bertanya kepada orang yang lalu lalang satu soalan: "Adakah anda merokok?". Pilihan yang mungkin Oleh itu, hanya ada dua jawapan: "Ya" dan "Tidak".

Saiz sampel dalam kes ini dikira seperti berikut. Tahap keyakinan diambil sebagai 95%, kemudian sisihan ternormal z = 1.96. Kami menerima variasi sebagai 50%, iaitu, kami percaya dengan syarat bahawa separuh daripada responden boleh menjawab soalan sama ada mereka merokok - "Ya". Kemudian p=0.5. Dari sini kita dapati q = 1 – p = 1 – 0.5 = 0,5 . Ralat pensampelan yang boleh diterima diambil sebagai 10%, iaitu e = 0.1.

Kami menggantikan data ini ke dalam formula dan mengira:

Mendapatkan saiz sampel n = 96 orang.

Skop formula ini

Semasa menjalankan penyelidikan mudah apabila anda perlu mendapatkan jawapan kepada hanya satu soalan mudah. Dalam kes ini, skala respons, sebagai peraturan, adalah bersifat dikotomi. Iaitu, jawapan ditawarkan (atau tersirat) daripada jenis "Ya" - "Tidak", "Hitam" - "Putih", dsb.

Ciri-ciri formula ini untuk mengira saiz sampel

Galyautdinov R.R.


© Menyalin bahan dibenarkan hanya jika anda menetapkan hiperpautan terus ke

Saiz sampel perlu ditentukan sebelum memulakan kebanyakan kajian kuantitatif. Penentuan saiz sampel tidak diperlukan untuk penyelidikan kualitatif(Perhatikan bahawa ini merujuk kepada kaedah kuantitatif secara formal seperti analisis kandungan; projek deskriptif mudah adalah kuantitatif.) Pengiraan saiz sampel mungkin tidak dilakukan sebelum menjalankan kajian perintis awal (namun, kajian sedemikian biasanya dilakukan sebelum perancangan sebenar kajian saintifik). Jika ragu-ragu, pastikan anda menghubungi institusi yang membiayai kajian atau memasukkannya dalam rancangan penyelidikan mereka - kekurangan data mengenai saiz sampel adalah salah satu yang paling punca biasa keengganan untuk meluluskan topik tersebut

Mengapa saiz sampel penting kepada penyelidik?

Apabila menjalankan kajian yang menentukan kelaziman ciri dalam populasi (contohnya, kelaziman asma pada kanak-kanak), pengiraan saiz sampel adalah perlu agar anggaran yang diperolehi mempunyai tahap ketepatan yang dikehendaki. Sebagai contoh, kelaziman penyakit sebanyak 10% yang diperoleh daripada saiz sampel 20 akan mempunyai selang keyakinan 95% 1% hingga 31%, yang tidak tepat dan tidak bermaklumat. Sebaliknya, kelaziman penyakit sebanyak 10% yang diperoleh daripada sampel 400 orang akan mempunyai selang keyakinan 95% sebanyak 7% hingga 13%, yang boleh dianggap sebagai keputusan yang agak tepat. menganggarkan saiz sampel mengelakkan yang pertama daripada dua pilihan ini.

Dalam kajian yang direka untuk mengesan kesan (cth., perbezaan keberkesanan antara dua rawatan, risiko relatif penyakit dengan atau tanpa faktor risiko), anggaran saiz sampel adalah penting untuk memastikan bahawa jika secara klinikal atau biologi kesan penting wujud, maka ia ijazah yang tinggi kebarangkalian akan dikesan, dengan kata lain, analisis akan memberikan keputusan yang signifikan secara statistik. Jika saiz sampel kecil, maka walaupun perbezaan yang ketara antara kumpulan, adalah mustahil untuk membuktikan bahawa mereka adalah hasil daripada sesuatu selain daripada kebolehubahan sampel.

Maklumat Diperlukan untuk Mengira Saiz Sampel

Kaedah untuk menganggar saiz sampel diterangkan dalam beberapa buku teks mengenai statistik, termasuk Altman, 1991; Hambar, 2000; Armitage, Berry dan Matthews, 2002. Dua buku mengkhusus dalam menerangkan kaedah untuk menganggar saiz sampel dalam situasi yang berbeza. Untuk parameter kualitatif, kerja Manchin et al. harus dirujuk. (1998), untuk kualiti - Lemeshow et al. (1996). Kedua-dua buku menyediakan jadual untuk membantu mengira saiz sampel. Dalam kes percubaan bersiri, rujukan harus dibuat kepada Whitehead (1997). Pengiraan saiz sampel sendiri boleh dilakukan menggunakan salah satu daripada banyak program komputer. Sebagai contoh, program Stata membolehkan anda menganalisis saiz sampel yang diperlukan untuk perbandingan min dan perkadaran, serta analisis kelaziman. banyak Kuantiti yang besar pilihan menawarkan pakej khusus seperti nQuery Advisor atau UnifyPow.

Pengiraan saiz sampel bergantung kepada faktor berikut, yang perlu dilaporkan kepada perunding perangkaan:

  • Pembolehubah yang dikaji dalam kajian, termasuk jenisnya
  • Kuasa penyelidikan yang diperlukan
  • Tahap yang diperlukan kepentingan statistik
  • Saiz kesan yang berkaitan secara klinikal
  • Sisihan piawai untuk pembolehubah skala
  • Sama ada ujian keertian satu hujung atau dua hujung akan digunakan
  • Reka bentuk kajian, dengan kata lain, ialah kajian:
    • percubaan terkawal rawak
    • Percubaan rawak kluster
    • Penyelidikan kesetaraan
    • Kajian intervensi bukan rawak
    • kajian pemerhatian
    • kajian kelaziman
    • Mengkaji sensitiviti dan kekhususan ujian

Ini memerlukan jawapan beberapa soalan tambahan:

  • Adakah data berpasangan termasuk dalam kajian?
  • Adakah kajian akan mengukur pembolehubah yang sama berulang kali pada orang yang sama?
  • Adakah kumpulan yang termasuk dalam kajian sama saiz?
  • Adakah data berhierarki?

Perlu diambil kira bahawa kajian bukan rawak tentang perbezaan atau perhubungan biasanya memerlukan saiz sampel yang jauh lebih besar untuk mengambil kira pengaruh pembolehubah ketiga dalam analisis. Pada masa yang sama, penyelidik berminat dengan saiz mutlak sampel, dan bukannya peratusan yang terdiri daripada populasi secara keseluruhan.

Apakah istilah statistik yang digunakan untuk menerangkan proses perancangan saiz sampel

Hipotesis nol dan alternatif

banyak jenis Analisis statistik bertujuan untuk membandingkan dua jenis rawatan, prosedur atau kumpulan pesakit. Nilai berangka yang meringkaskan perbezaan minat penyelidik dipanggil kesan. Dalam kajian lain, kesannya mungkin pekali korelasi, nisbah kemungkinan atau risiko relatif. Kami kemudiannya mengemukakan hipotesis nol dan alternatif. Biasanya hipotesis nol menyatakan bahawa tiada kesan (perbezaan antara kumpulan adalah sifar, risiko relatif sama dengan satu, pekali korelasi adalah sifar), hipotesis alternatif menunjukkan bahawa terdapat kesan.

Kebarangkalian keyakinan (nilai-p)

Nilai-p ialah kebarangkalian untuk melihat kesan yang sama atau lebih besar dalam kajian, memandangkan kesahihan hipotesis nol. Biasanya dinyatakan sebagai perkadaran (cth. p=0.03)

Tahap keertian

Aras keertian ialah nilai ambang bagi skor p di bawah yang mana hipotesis nol mesti ditolak dan disimpulkan bahawa terdapat bukti kesan. Biasanya, aras keertian ditetapkan pada 5% (Tahap keertian, walaupun berkaitan secara langsung dengan skor p, dinyatakan sebagai peratusan: aras keertian 5% bersamaan dengan p=0.05). Sekiranya nilai yang diperhatikan adalah kurang daripada 5%, maka terdapat kemungkinan kecil bahawa kajian akan memperoleh keputusan sedemikian jika tiada kesan yang benar. Oleh itu, hipotesis kehadiran kesan diterima.

Tahap keertian 5% juga bermakna terdapat hampir 5% peluang untuk membuat kesimpulan bahawa terdapat kesan, sedangkan sebenarnya tidak ada. Kadangkala adalah lebih sesuai untuk menggunakan aras keertian 1%, terutamanya jika sangat penting untuk mengelak daripada membuat kesimpulan bahawa kesan wujud sedangkan ia sebenarnya tidak.

Kuasa

Kuasa adalah kebarangkalian itu hipotesis nol akan ditolak secukupnya, dengan kata lain, apabila memang terdapat bukti perbezaan atau perhubungan yang sebenar. Ia boleh dianggap sebagai "100 peratus tolak peluang kehilangan kesan sebenar". oleh itu, semakin tinggi kuasa, semakin kecil kemungkinan kesan sebenar akan terlepas. Kuasa biasanya ditetapkan pada 80%, 90% atau 95%. Kuasa tidak boleh kurang daripada 80%. Jika adalah kritikal bahawa kajian itu tidak terlepas kesan yang sedia ada, seseorang harus menyasarkan kuasa 90% atau lebih.

Saiz kesan yang penting secara klinikal

Ini ialah perbezaan terkecil antara min kumpulan atau peratusan peristiwa dalam mereka (nisbah ganjil yang paling hampir dengan risiko perpaduan) yang masih boleh dianggap penting secara biologi atau klinikal. Saiz sampel harus sedemikian rupa sehingga jika perbezaan tersebut wujud, maka kajian akan menghasilkan keputusan yang signifikan secara statistik.

Ujian keertian satu ekor atau dua ekor

Dalam ujian dua hujung, hipotesis nol ialah tiada perbezaan, dan hipotesis alternatif ialah perbezaan antara kumpulan boleh pergi ke mana-mana arah. Dalam ujian satu hujung, hipotesis alternatif mentakrifkan arah perbezaan yang dimaksudkan, seperti rawatan adalah lebih baik daripada plasebo, dan hipotesis nol termasuk situasi di mana kesan ubat dan plasebo adalah sama dan di mana keputusan ubat. dalam hasil yang lebih teruk daripada plasebo.

Jika tidak sebab yang serius untuk tidak melakukan ini, seseorang harus menggunakan hipotesis dua sisi. Jangkaan bahawa perbezaan akan pergi ke satu arah atau yang lain bukanlah alasan yang mencukupi untuk menggunakan ujian satu hujung. Penyelidik perubatan sering terkejut jika hasilnya tidak seperti yang diharapkan, selalunya penemuan sedemikian mempunyai akibat lain daripada tiada perbezaan, dan oleh itu ia mesti diterangkan dengan secukupnya. Ujian berat sebelah tidak membenarkan ini. Untuk contoh situasi di mana ujian satu hujung boleh diterima, lihat Bland dan Altman (1994).

Apakah pembolehubah yang perlu diambil kira semasa mengira saiz sampel

Pengiraan saiz sampel hendaklah berdasarkan analisis pembolehubah hasil utama dalam kajian ini.

Jika pembolehubah tambahan dimasukkan dalam kajian, yang juga dianggap penting kepentingan saintifik, maka saiz sampel hendaklah sedemikian untuk membolehkan analisis yang mencukupi bagi pembolehubah ini. Untuk semua yang penting secara saintifik pembolehubah perlu dijalankan dan pengiraan saiz sampel dibentangkan.

Peratusan Perakaunan Kerugian Respons dan Pengawasan

Anggaran saiz sampel menunjukkan bilangan pesakit dalam kumpulan terakhir yang dianalisis pada akhir kajian. Oleh itu, bilangan individu yang akan didaftarkan dalam kajian perlu ditambah mengikut tindak balas yang dijangkakan, kehilangan susulan, kegagalan untuk mengikuti protokol, dan sebab-sebab lain yang mungkin untuk kehilangan subjek eksperimen. Hubungan antara jangkaan bilangan peserta dan saiz sampel yang akan dibentuk hendaklah diterangkan dengan jelas.

Pematuhan dengan objektif kajian dan kaedah analisis statistik

Kecukupan saiz sampel juga perlu dinilai mengikut tujuan kajian. Sebagai contoh, jika matlamat kajian adalah untuk menunjukkan bahawa ubat baharu adalah lebih baik daripada ubat sedia ada, saiz sampel mestilah cukup besar untuk mengesan perbezaan ketara secara klinikal antara kedua-dua rawatan. Walau bagaimanapun, kadangkala diperlukan untuk menunjukkan bahawa dua ubat adalah setara secara klinikal. Kajian jenis ini sering dirujuk sebagai kesetaraan atau ujian "negatif". Isu saiz sampel untuk kajian ini diperincikan dalam Pocock (1983). Saiz sampel dalam kajian yang bertujuan untuk menunjukkan kesetaraan ubat adalah lebih besar daripada dalam kajian yang bertujuan untuk mengenal pasti perbezaan keberkesanan. Adalah penting untuk memastikan bahawa pengiraan saiz sampel adalah berkaitan dengan matlamat dan objektif kajian dan berdasarkan data pada pembolehubah hasil utama.

Saiz sampel juga harus mencukupi untuk kaedah analisis yang digunakan dalam kajian, kerana kedua-dua saiz sampel dan analisis bergantung pada reka bentuk kajian yang dipilih. Adalah penting untuk memastikan bahawa kaedah analisis yang dimaksudkan dan pengiraan saiz sampel adalah serasi antara satu sama lain.

Contoh pengiraan saiz sampel.

Jika kajian yang dimaksudkan memerlukan anggaran frekuensi tunggal, perbandingan dua cara, atau perbandingan dua frekuensi, pengiraan saiz sampel adalah (biasanya) agak mudah dan oleh itu dibentangkan di bawah. Walau bagaimanapun, kami mengesyorkan agar anda sentiasa berunding dengan ahli statistik tentang pengiraan saiz sampel.

Anggaran satu kekerapan tunggal

Nota: Formula di bawah adalah berdasarkan apa yang dipanggil. "anggaran taburan normal" dan, melainkan jika ia dirancang untuk mencipta sampel yang sangat besar, tidak disyorkan untuk menganggarkan frekuensi hampir 0 atau 1 (0: atau 100%. Dalam kes sedemikian, kaedah "tepat" harus digunakan. Keadaan yang sama boleh diperhatikan apabila mengkaji sensitiviti dan kekhususan kaedah diagnostik baru, di mana kehadiran frekuensi hampir 1 (100%) dijangka. AT kes ini seorang ahli statistik harus dirujuk, atau sekurang-kurangnya program komputer khusus harus digunakan.

Senario: Gunakan soal selidik mel untuk menilai kelaziman masalah pernafasan pada pesakit dengan asma bronkial di bawah pengawasan perubatan. latihan umum(Thomas et al., 2001)

Maklumat yang diperlukan:

  • Pembolehubah hasil utama = kehadiran atau ketiadaan kegagalan pernafasan
  • Anggaran kekerapan pelanggaran = 30% (0.3)
  • Diperlukan 95% lebar selang keyakinan = 10% (iaitu +/-5% atau 25% hingga 35%)

Formula untuk menganggar saiz sampel bagi frekuensi tunggal ialah:

n=15.4*p*(1-p)/W2

di mana n ialah saiz sampel yang diperlukan, p ialah kekerapan jangkaan keputusan (dalam kes ini 0.3) dan W ialah lebar selang keyakinan (dalam kes ini 0.1)

Menggantikan nilai ke dalam formula, kami mendapat:

n=15.4*0.3*(1-0.3)/0.1 2 =324

"Untuk mendapatkan selang keyakinan +/-5% sekitar anggaran kelaziman 30%, sampel 324 orang akan diperlukan. Memandangkan kadar respons 70% kepada tawaran untuk menyertai kajian, 480 soal selidik akan diedarkan"

Perbandingan dua frekuensi

Senario: Percubaan rawak terkawal plasebo tentang keberkesanan faktor perangsang koloni dalam mengurangkan risiko sepsis pada bayi pramatang dirancang. Kajian terdahulu menunjukkan bahawa kejadian sepsis pada kanak-kanak ini adalah 50% dalam tempoh 2 minggu selepas kelahiran, dan para penyelidik percaya bahawa mengurangkan kekerapan ini kepada 34% akan menjadi signifikan secara klinikal.

Maklumat yang diperlukan:

  • Pembolehubah hasil utama = Kehadiran atau ketiadaan sepsis pada neonatus 14 hari selepas kelahiran (rawatan diberikan sehingga maksimum 72 jam selepas kelahiran). Ini adalah pembolehubah kualitatif yang diwakili oleh frekuensi.
  • Perbezaan ketara = 16% atau 0.16 (iaitu 50%-34%)
  • Tahap keertian=5%
  • Kuasa=80%
  • Ujian=dua belah

Formula untuk mengira saiz sampel apabila membandingkan dua frekuensi ialah:

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

di mana n=saiz sampel bagi setiap kumpulan ( saiz keseluruhan dua kali lebih banyak sampel)

p 1 = kekerapan pertama - dalam kes ini 0.50

p 2 = kekerapan kedua - dalam kes ini 0.34

p 1 -p 2 = perbezaan ketara secara klinikal, dalam kes ini 0.16

Jadual nilai untuk A dan B

Tahap keertian

Kuasa

Menggantikan nilai ke dalam formula, kami mendapat:

n= 2 *[(0.5*0.5+(0.34*0.66)]/ 2 =146

Oleh itu, kami mendapat bilangan pemerhatian yang diperlukan untuk dimasukkan ke dalam setiap kumpulan. Jumlah penduduk sampel akan menjadi dua kali lebih besar, i.e. 292 kanak-kanak

Perihalan hasil pengiraan saiz sampel mungkin kelihatan seperti ini:

"Sampel 292 neonat (146 dalam kumpulan rawatan dan plasebo) akan mencukupi untuk mengesan perbezaan kadar sepsis sebanyak 16% dengan kuasa 80% pada tahap keyakinan 5%. Perbezaan 16% sama dengan perbezaan antara 50% sepsis kadar pada hari ke-14 dalam kumpulan plasebo dan 34% dalam kumpulan rawatan."

Perbandingan dua purata

Nota: Pengiraan di bawah hanya sah apabila kedua-dua kumpulan mempunyai saiz yang sama.

Senario: Percubaan terkawal rawak yang membandingkan rawatan psikologi jangka pendek berbanding rawatan konvensional untuk memerangi kecenderungan membunuh diri dalam pesakit yang dimasukkan ke hospital selepas percubaan membunuh diri dirancang. Kecenderungan membunuh diri diukur menggunakan skala Beck. Sisihan piawai untuk skor pada skala ini ialah 7.7 (data daripada kajian terdahulu), dan perbezaan 5 mata pada skala Beck dianggap signifikan secara klinikal. Sehingga satu pertiga daripada pesakit dijangka keluar daripada kumpulan rawatan (Guthrie et al., 2001)

Maklumat yang diperlukan:

  • Pembolehubah hasil utama = Skala Kematian Diri Beck. Pembolehubah berterusan diterangkan dengan cara
  • Sisihan piawai=7.7 mata
  • Saiz Kesan Ketara Secara Klinikal = 5 mata
  • Tahap keertian=5%
  • Kuasa=80%
  • Ujian=dua belah

Formula untuk mengira saiz sampel apabila membandingkan dua cara adalah seperti berikut:

n= 2 *2*SD 2 /DIFF 2

di mana n=saiz sampel untuk setiap kumpulan (jumlah saiz sampel adalah dua kali lebih besar)

SD= sisihan piawai untuk pembolehubah hasil utama, dalam kes ini 7.7

DIFF=kesan penting secara klinikal, dalam kes ini 5.0

A - bergantung pada tahap keertian (lihat jadual) - dalam kes ini 1.96

B - bergantung kepada kuasa (lihat jadual) - dalam kes ini 0.84

Jadual nilai untuk A dan B

Tahap keertian

Kuasa

Menggantikan nilai yang diperlukan ke dalam formula yang kita dapat:

n= 2 *2*7.7 2 /5.0 2 =38

Oleh itu, kami mendapat bilangan pemerhatian yang diperlukan untuk dimasukkan ke dalam setiap kumpulan. Jumlah saiz sampel akan menjadi dua kali lebih besar, i.e. 76 orang.

Penerangan yang mencukupi tentang anggaran saiz sampel adalah seperti berikut:

"Untuk mengesan perbezaan 5 mata pada Skala Kecenderungan Bunuh Diri Beck pada tahap keertian 5% dengan kuasa 80%, dengan mengandaikan sisihan piawai 7.7 mata, akan memerlukan 38 orang dalam kumpulan intervensi dan kawalan. Jumlah ini meningkat kepada 60 dalam kumpulan ( jumlah pemerhatian 120), untuk mengimbangi kerugian dalam pemerhatian, yang biasanya kira-kira satu pertiga daripada subjek "

Contoh penerangan yang tidak mencukupi tentang anggaran saiz sampel yang diperlukan

Contoh 1

"Kajian terdahulu di kawasan ini menggunakan sampel 150 orang dan memperoleh keputusan yang sangat boleh dipercayai (p = 0.014), jadi bilangan pesakit yang sama dimasukkan dalam kajian ini"

Kajian terdahulu mungkin hanya "bertuah" dalam erti kata bahawa keputusan penting yang mereka dapati adalah disebabkan oleh variasi rawak dalam cara sampel. Saiz sampel perlu dikira kajian ini- termasuk butiran seperti kuasa kajian, tahap keertian, pembolehubah utama yang dikaji, saiz kesan yang signifikan secara klinikal, sisihan piawai (untuk pembolehubah kuantitatif) dan saiz setiap kumpulan jika terdapat beberapa kumpulan dalam kajian

Contoh 2

"Saiz sampel tidak dikira kerana tiada maklumat awal untuk menganggarkannya"

Kesusasteraan harus disemak dengan teliti untuk mencari maklumat yang diperlukan untuk mengira saiz sampel. Jika maklumat ini tidak tersedia, satu kajian awal kecil boleh dianjurkan untuk mengumpul maklumat ini.

Jika tiada maklumat tentang nilai sisihan piawai, pengiraan saiz sampel boleh diberikan dalam lebih Pandangan umum, sebagai contoh, perbezaan yang berkesan secara klinikal mungkin tidak diterangkan dalam nilai mutlak, tetapi dalam unit sisihan piawai.

Walau bagaimanapun, jika cadangan geran sedang ditulis untuk membiayai kajian rintis untuk mengumpul maklumat yang diperlukan untuk mengira saiz sampel kajian besar berikutnya, maka pengiraan saiz sampel tidak dijalankan dalam cadangan tersebut.

"Klinik ini menerima 50 pesakit yang menghidap penyakit ini pada tahun ini. Kira-kira 10% daripada mereka mungkin enggan mengambil bahagian dalam kajian ini. Oleh itu, dalam tempoh dua tahun, sampel 90 orang boleh diambil"

Walaupun kebanyakan kajian mesti mengimbangi reka bentuk mereka dengan kapasiti, saiz sampel tidak boleh ditentukan semata-mata berdasarkan bilangan pesakit yang tersedia untuk kajian itu.

Dalam situasi di mana bilangan pesakit adalah faktor pengehad dalam saiz sampel, pengiraan masih perlu dibuat untuk menentukan a) kuasa kajian dengan bilangan pesakit tertentu berbanding perbezaan penting secara klinikal, atau b) saiz kesan. yang boleh didapati dalam kajian saiz tertentu.(memandangkan kuasanya).

Dalam kes di mana bilangan pesakit yang tersedia terlalu kecil untuk mengesan perbezaan yang berkaitan secara klinikal, pertimbangan boleh diberikan untuk melanjutkan tempoh kajian atau menjalankan percubaan multisenter kolaboratif dengan berbilang penyiasat.

kesusasteraan

  1. Altman D.G. (1991) Statistik Praktikal untuk Penyelidikan Perubatan. Chapman dan Hall, London.
  2. Armitage P, Berry G, Matthews JNS. (2002) Kaedah Statistik dalam Penyelidikan Perubatan, ed ke-4. Blackwell, Oxford.
  3. Bland JM dan Altman DG. (1994). Ujian kepentingan satu dan dua sisi. Jurnal Perubatan British 309 248.
  4. Bland M. (2000) An Introduction to Medical Statistics, ke-3. ed. Oxford University Press, Oxford.
  5. Elashoff JD. (2000) Panduan Pengguna nQuery Advisor Versi 4.0 Los Angeles, CA.
  6. Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) Percubaan terkawal rawak campur tangan psikologi ringkas selepas keracunan diri yang disengajakan. Jurnal Perubatan British 323, 135-138.
  7. Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (1996) Kecukupan saiz sampel dalam kajian kesihatan. John Wiley & Sons, Chichester.
  8. Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) Jadual Statistik untuk Reka Bentuk Kajian Klinikal, Edisi Kedua Blackwell, Oxford.
  9. Pocock SJ. (1983) Ujian Klinikal: Satu Pendekatan Praktikal. John Wiley and Sons, Chichester.
  10. Thomas M, McKinley RK, Freeman E, Foy C. (2001) Kelaziman pernafasan yang tidak berfungsi pada pesakit yang dirawat untuk asma dalam penjagaan primer: tinjauan keratan rentas. Jurnal Perubatan British 322, 1098-1100.
  11. Whitehead, J. (1997) The Design and Analysis of Sequential Clinical Trials, disemak ke-2. ed. Chichester, Wiley.
KALKULATOR

Penduduk

Jumlah objek pemerhatian (orang, isi rumah, perusahaan, penempatan dsb.), yang mempunyai set ciri tertentu (jantina, umur, pendapatan, bilangan, pusing ganti, dsb.), terhad dalam ruang dan masa. Contoh populasi: - Semua penduduk Moscow (10.6 juta orang mengikut banci 2002) - Lelaki Muscovite (4.9 juta orang mengikut banci 2002) - Entiti undang-undang Rusia (2.2 juta pada awal tahun 2005) - Kedai runcit menjual produk makanan (20 ribu pada awal tahun 2008), dsb.

Sampel (Populasi sampel)

Sebahagian daripada objek daripada populasi yang dipilih untuk dikaji untuk membuat kesimpulan tentang keseluruhan populasi. Agar kesimpulan yang diperoleh dengan mengkaji sampel dapat diperluaskan kepada keseluruhan populasi, sampel mestilah mempunyai sifat mewakili.

Kewakilan sampel

Sifat sampel untuk mencerminkan populasi umum dengan betul. Sampel yang sama mungkin atau mungkin tidak mewakili populasi yang berbeza. Contoh: - Sampel yang terdiri sepenuhnya daripada warga Muscovite yang memiliki kereta tidak mewakili keseluruhan penduduk Moscow. - Sampel perusahaan Rusia sehingga 100 orang tidak mewakili semua perusahaan di Rusia. - Sampel Muscovite yang membuat pembelian di pasaran tidak mewakili gelagat pembelian semua Muscovite. Pada masa yang sama, sampel ini (tertakluk kepada yang lain keadaan) boleh mewakili Muscovites dengan sempurna - pemilik kereta, perusahaan Rusia kecil dan sederhana dan pembeli membeli-belah di pasaran, masing-masing.Adalah penting untuk memahami bahawa perwakilan sampel dan ralat pensampelan adalah fenomena yang berbeza. Kewakilan, tidak seperti ralat, tidak bergantung pada saiz sampel dalam apa cara sekalipun. Contoh: Tidak kira berapa banyak kami meningkatkan bilangan pemilik kereta Muscovite yang ditemuduga, kami tidak akan dapat mewakili semua Muscovite dengan sampel ini.

Ralat pensampelan (selang keyakinan)

Penolakan keputusan yang diperoleh menggunakan pemerhatian terpilih daripada data sebenar populasi umum.Terdapat dua jenis ralat persampelan - statistik dan sistematik. Ralat statistik bergantung pada saiz sampel. Lebih besar saiz sampel, lebih rendah.Contoh: Untuk yang mudah sampel rawak dengan saiz 400 unit, ralat statistik maksimum (dengan kebarangkalian keyakinan 95%) ialah 5%, untuk sampel 600 unit - 4%, untuk sampel 1100 unit - 3% daripada pelbagai faktor yang mempunyai kesan kekal terhadap kajian dan berat sebelah keputusan kajian ke arah tertentu. imej aktif kehidupan. Ini berlaku disebabkan fakta bahawa adalah lebih sukar untuk mencari orang sedemikian di mana-mana tempat tertentu (contohnya, di rumah). 80%) Dalam sesetengah kes, apabila pengedaran sebenar diketahui, ralat sistematik boleh disamakan dengan pengenalan kuota atau pemberatan semula data, tetapi dalam kebanyakan kajian sebenar, malah menilai ia boleh menjadi agak bermasalah.

Jenis sampel

Sampel dibahagikan kepada dua jenis:
- kebarangkalian
- kemustahilan

1. Sampel kebarangkalian
1.1 Persampelan rawak (pemilihan rawak mudah)
Sampel sedemikian mengandaikan kehomogenan populasi umum, kebarangkalian yang sama bagi ketersediaan semua unsur, kehadiran senarai lengkap semua elemen. Apabila memilih elemen, sebagai peraturan, jadual nombor rawak digunakan.
1.2 Persampelan mekanikal (sistematik).
Sejenis sampel rawak, diisih mengikut beberapa atribut (susun abjad, nombor telefon, tarikh lahir, dsb.). Elemen pertama dipilih secara rawak, kemudian setiap elemen 'k' dipilih dalam kenaikan 'n'. Saiz populasi umum, manakala - N=n*k
1.3 Berstrata (berzon)
Ia digunakan dalam kes heterogenitas populasi umum. Penduduk dibahagikan kepada kumpulan (strata). Dalam setiap lapisan, pemilihan dijalankan secara rawak atau mekanikal.
1.4 Persampelan bersiri (bersarang atau berkelompok).
Pada persampelan bersiri unit pemilihan bukanlah objek itu sendiri, tetapi kumpulan (kelompok atau sarang). Kumpulan dipilih secara rawak. Objek dalam kumpulan ditinjau di seluruh.

2. Sampel yang luar biasa
Pemilihan dalam sampel sedemikian dilakukan bukan mengikut prinsip peluang, tetapi mengikut kriteria subjektif - kebolehcapaian, tipikal, perwakilan yang sama, dll.
2.1. Persampelan kuota
Pada mulanya, sebilangan kumpulan objek tertentu diperuntukkan (contohnya, lelaki berumur 20-30 tahun, 31-45 tahun dan 46-60 tahun; orang yang berpendapatan sehingga 30 ribu rubel, dengan pendapatan 30 hingga 60 tahun. ribu rubel dan dengan pendapatan lebih daripada 60 ribu rubel ) Bagi setiap kumpulan, bilangan objek yang akan ditinjau ditentukan. Bilangan objek yang sepatutnya termasuk dalam setiap kumpulan ditetapkan, paling kerap, sama ada mengikut nisbah bahagian kumpulan yang diketahui sebelum ini dalam populasi umum, atau sama untuk setiap kumpulan. Dalam kumpulan, objek dipilih secara rawak. Sampel kuota digunakan agak kerap dalam penyelidikan pemasaran.
2.2. Kaedah Bola salji
Sampel dibina seperti berikut. Setiap responden, bermula dengan yang pertama, diminta menghubungi rakan, rakan sekerja, kenalannya yang sesuai dengan syarat pemilihan dan boleh mengambil bahagian dalam kajian. Oleh itu, dengan pengecualian langkah pertama, sampel dibentuk dengan penyertaan objek kajian itu sendiri. Kaedah ini sering digunakan apabila perlu untuk mencari dan menemu bual kumpulan responden yang sukar dijangkau (contohnya, responden yang berpendapatan tinggi, responden yang tergolong dalam kumpulan profesional yang sama, responden yang mempunyai beberapa hobi / minat yang sama, dll. )
2.3 Persampelan spontan
Responden yang paling mudah diakses adalah ditinjau. Contoh biasa sampel spontan - tinjauan dalam akhbar / majalah, soal selidik yang diberikan kepada responden untuk dilengkapkan sendiri, kebanyakan tinjauan Internet. Saiz dan komposisi sampel spontan tidak diketahui terlebih dahulu, dan ditentukan oleh hanya satu parameter - aktiviti responden.
2.4 Contoh kes biasa
Unit populasi umum dipilih yang mempunyai nilai purata (tipikal) atribut. Ini menimbulkan masalah memilih ciri dan menentukan nilai tipikalnya.

Ralat dan Kalkulator Saiz Sampel

(untuk sampel rawak mudah)

Penjelasan untuk bidang:

Kebarangkalian keyakinan
Kebarangkalian bahawa selang keyakinan meliputi yang tidak diketahui nilai sebenar parameter dianggarkan daripada data sampel. Dalam amalan penyelidikan, tahap keyakinan 95% paling kerap digunakan.

Ralat pensampelan (selang keyakinan)
Selang yang dikira daripada data sampel yang, dengan kebarangkalian tertentu (keyakinan), meliputi nilai sebenar yang tidak diketahui bagi parameter taburan anggaran.

Bahagian ciri

Bahagian jangkaan ciri yang ralat dikira. Sekiranya tiada data mengenai bahagian ciri, perlu menggunakan nilai yang sama dengan 50, di mana ralat maksimum dicapai.

Salah satu komponen utama kajian yang direka bentuk dengan baik ialah definisi sampel dan apakah sampel yang mewakili. Ia seperti contoh kek. Lagipun, tidak perlu makan keseluruhan pencuci mulut untuk memahami rasanya? Sebahagian kecil sudah memadai.

Jadi, kek adalah penduduk (iaitu semua responden yang layak untuk tinjauan). Ia boleh dinyatakan secara teritorial, sebagai contoh, hanya penduduk wilayah Moscow. Jantina - wanita sahaja. Atau mempunyai sekatan umur - warga Rusia berumur lebih dari 65 tahun.

Sukar untuk mengira populasi: anda perlu mempunyai data daripada banci penduduk atau tinjauan penilaian awal. Oleh itu, biasanya populasi umum adalah "anggaran", dan daripada bilangan yang terhasil mereka mengira bingkai pensampelan atau persampelan.

Apakah sampel perwakilan?

Sampel adalah bilangan responden yang jelas. Strukturnya harus bertepatan sebanyak mungkin dengan struktur populasi umum dari segi ciri utama pemilihan.

Sebagai contoh, jika responden yang berpotensi adalah seluruh penduduk Rusia, di mana 54% adalah wanita dan 46% adalah lelaki, maka sampel harus mengandungi sama persis. peratusan. Jika parameter sepadan, maka sampel boleh dipanggil wakil. Ini bermakna ketidaktepatan dan kesilapan dalam kajian dapat diminimumkan.

Saiz sampel ditentukan dengan mengambil kira keperluan ketepatan dan ekonomi. Keperluan ini adalah berkadar songsang antara satu sama lain: semakin besar saiz sampel, semakin besar saiz sampel lebih tepat hasilnya. Lebih-lebih lagi, semakin tinggi ketepatannya, semakin banyak kos yang diperlukan untuk kajian ini. Dan sebaliknya, semakin kecil sampel, semakin murah kosnya, semakin kurang tepat dan lebih rawak sifat populasi umum dihasilkan semula.

Oleh itu, untuk mengira jumlah pilihan, ahli sosiologi mencipta formula dan mencipta kalkulator khas:

Kebarangkalian keyakinan dan kesilapan keyakinan

Apakah istilah " tahap keyakinan"dan" kesilapan keyakinan"? Tahap keyakinan adalah ukuran ketepatan pengukuran. Dan kesilapan keyakinan adalah kemungkinan ralat hasil penyelidikan. Sebagai contoh, dengan populasi umum lebih daripada 500,00 orang (contohnya, tinggal di Novokuznetsk), sampel akan menjadi 384 orang dengan tahap keyakinan 95% dan ralat 5% ATAU (dengan selang keyakinan 95±5%).

Apa yang berikut daripada ini? Apabila menjalankan 100 kajian dengan sampel sedemikian (384 orang), dalam 95 peratus kes, jawapan yang diterima, mengikut undang-undang statistik, akan berada dalam ± 5% daripada yang asal. Dan kita akan dapat sampel perwakilan dengan kebarangkalian minimum ralat statistik.

Selepas pengiraan saiz sampel dilakukan, anda boleh melihat sama ada terdapat cukup responden dalam versi demo Panel Soal Selidik. Anda boleh mengetahui lebih lanjut tentang cara menjalankan tinjauan panel.

Apabila anda bertanya soalan, "Berapa ramai responden yang saya perlukan untuk tinjauan?", anda benar-benar bertanya, "Seberapa besar sampel saya perlu untuk menganggarkan populasi saya dengan tepat?" Memandangkan kerumitan konsep ini, kami telah membahagikan proses kepada 5 langkah, memudahkan anda mengira saiz sampel ideal anda dan memastikan ketepatan hasil tinjauan anda.

5 langkah untuk memastikan sampel anda menganggarkan populasi dengan tepat:

Langkah 1

Apakah populasi umum anda?

Dengan istilah "penduduk umum" kami bermaksud keseluruhan kumpulan orang yang pendapat mereka akan anda tanyakan (sampel akan terdiri daripada ahli populasi ini yang sebenarnya akan mengambil bahagian dalam tinjauan).

Sebagai contoh, jika anda ingin memahami cara mencari pasaran untuk ubat gigi di Perancis, populasi anda ialah rakyat Perancis. Dan jika anda cuba menentukan berapa hari percutian yang ingin dimiliki oleh orang yang bekerja untuk syarikat ubat gigi, maka penduduk anda ialah pekerja syarikat itu.

Sama ada negara atau syarikat, mewujudkan populasi adalah langkah pertama yang penting. Setelah anda membuat keputusan tentang populasi, tetapkan (anggaran) saiznya. Sebagai contoh, Perancis mempunyai kira-kira 65 juta orang, tetapi syarikat ubat gigi berkemungkinan mempunyai pekerja yang jauh lebih sedikit.

Adakah anda mendapat nombor yang betul? Baiklah, mari kita teruskan...

Langkah 2

Apakah ketepatan yang diperlukan?

Langkah ini adalah sejenis penilaian tentang berapa banyak risiko yang anda sanggup ambil mengenai kemungkinan respons tinjauan yang tidak tepat disebabkan oleh fakta bahawa anda tidak meninjau keseluruhan populasi. Oleh itu, anda harus menjawab dua soalan:

  1. Sejauh manakah anda perlu yakin bahawa respons yang anda terima mencerminkan pendapat penduduk umum?
    Ini adalah margin kesilapan anda. Jadi katakan 90% sampel suka gula-gula getah berperisa anggur. Margin ralat sebanyak 5% menambah 5% pada setiap sisi nombor itu, bermakna sebenarnya 85-95% daripada sampel menyukai gula-gula getah berperisa anggur. 5% ialah margin ralat yang paling biasa digunakan, tetapi anda boleh menetapkannya kepada antara 1% dan 10% bergantung pada tinjauan. Ia tidak disyorkan untuk menaikkan angka ini melebihi 10%.
  2. Sejauh manakah anda perlu yakin bahawa sampel mewakili populasi dengan tepat?

    Ini adalah tahap kepercayaan anda. Tahap keyakinan ialah kebarangkalian bahawa sampel adalah signifikan untuk keputusan yang diperolehi. Pengiraan biasanya dibuat seperti berikut. Jika anda memilih 30 sampel lagi daripada populasi ini secara rawak, berapa kerapkah keputusan anda untuk satu sampel berbeza dengan ketara daripada keputusan untuk 30 sampel yang lain? Tahap keyakinan 95% bermakna 95% daripada masa keputusan akan sepadan. 95% ialah nilai yang paling biasa digunakan, tetapi anda boleh menetapkannya kepada 90% atau 99% bergantung pada tinjauan pendapat. Menurunkan nilai tahap keyakinan di bawah 90% tidak disyorkan.

Langkah 3

Apakah saiz sampel yang saya perlukan?

Dalam jadual di bawah, pilih anggaran saiz populasi sasaran dan margin ralat untuk menentukan bilangan tinjauan lengkap yang diperlukan.

Kini setelah anda mempunyai nilai langkah 1 dan langkah 2 anda, gunakan jadual berguna di bawah untuk menentukan saiz sampel yang diperlukan...

Penduduk Margin kesilapan Tahap amanah
10% 5% 1% 90% 95% 99%
100 50 80 99 74 80 88
500 81 218 476 176 218 286
1000 88 278 906 215 278 400
10 000 96 370 4900 264 370 623
100 000 96 383 8763 270 383 660
1 000 000+ 97 384 9513 271 384 664

Catatan. Data disediakan sebagai garis panduan sahaja. Juga, untuk populasi melebihi 1 juta, angka boleh dibundarkan kepada ratus yang terdekat.

Langkah 4

Sejauh manakah orang akan bertindak balas?

Malangnya, bukan semua orang yang anda hantar tinjauan akan menerima balasan.

Peratusan orang yang melengkapkan borang tinjauan yang mereka terima dirujuk sebagai "kadar respons." Menentukan peratusan responden kepada tinjauan anda akan membantu anda menentukan jumlah nombor contoh tinjauan yang mesti dihantar untuk menerima bilangan respons yang diperlukan.

Peratusan respons secara langsung bergantung pada beberapa faktor, seperti hubungan dengan penonton sasaran, panjang dan kerumitan tinjauan, insentif yang ditawarkan dan topik tinjauan. Untuk tinjauan dalam talian di mana tiada hubungan telah diwujudkan sebelum ini dengan penerima, peratusan kadar tindak balas 20-30% dianggap sangat tinggi. Nilai yang lebih konservatif dan berkemungkinan ialah 10-14%, jika anda belum pernah menjalankan tinjauan dalam populasi ini.

Langkah 5

Jadi kepada berapa orang yang patut anda hantar tinjauan?

Ini adalah langkah mudah!

Bahagikan sahaja nombor yang anda dapat dalam langkah 3 dengan nombor yang anda dapat dalam langkah 4. Ini adalah nombor ajaib anda.

Sebagai contoh, jika anda mahu 100 wanita yang menggunakan syampu untuk melengkapkan tinjauan dan anda fikir 10% daripada wanita yang anda hantar tinjauan itu akan melengkapkannya, anda perlu menghantar tinjauan kepada 1000 wanita (100/10%)!