วิธีการคำนวณตัวอย่างสำหรับการศึกษา ประชากรทั่วไปและวิธีการสุ่มตัวอย่าง

สูตรคำนวณด้านล่าง ขนาดตัวอย่างใช้ในกรณีที่ผู้ตอบแบบสอบถาม (ผู้ตอบแบบสอบถาม) ถูกถามคำถามเพียงคำถามเดียว ซึ่งมีเพียงสองคำตอบที่เป็นไปได้ ตัวอย่างเช่น "ใช่" และ "ไม่"; "ฉันใช้" และ "ฉันไม่ใช้" แน่นอน, สูตรนี้สามารถใช้สำหรับการวิจัยอย่างง่ายเท่านั้น หากคุณต้องการกำหนดขนาดตัวอย่างมากกว่า การวิจัยขนาดใหญ่เช่น แบบสอบถาม ก็ควรใช้สูตรอื่น

สูตรคำนวณขนาดตัวอย่างอย่างง่าย

ที่ไหน: น- ขนาดตัวอย่าง;

zคือค่าเบี่ยงเบนมาตรฐานที่กำหนดตามระดับความเชื่อมั่นที่เลือก ตัวบ่งชี้นี้แสดงถึงความเป็นไปได้ ความน่าจะเป็นที่จะได้คำตอบในช่วงเวลาพิเศษ - ความมั่นใจ ในทางปฏิบัติ ระดับความมั่นใจมักถูกนำมาเป็น 95% หรือ 99% จากนั้นค่า z จะเป็น 1.96 และ 2.58 ตามลำดับ

พี– การเปลี่ยนแปลงสำหรับตัวอย่างในหุ้น โดยพื้นฐานแล้ว p คือความน่าจะเป็นที่ผู้ตอบจะเลือกตัวเลือกคำตอบอย่างใดอย่างหนึ่ง สมมติว่าถ้าเราเชื่อว่าหนึ่งในสี่ของผู้ตอบแบบสอบถามจะเลือกคำตอบ "ใช่" แล้ว p จะเท่ากับ 25% นั่นคือ p = 0.25;

q= (1 – p);

อี– ข้อผิดพลาดที่อนุญาตเป็นเศษส่วน

ตัวอย่างการคำนวณขนาดตัวอย่าง

บริษัทมีแผนที่จะ การวิจัยทางสังคมวิทยาเพื่อระบุสัดส่วนของผู้สูบบุหรี่ในประชากรของเมือง ในการดำเนินการนี้ พนักงานของบริษัทจะถามคำถามกับคนที่เดินผ่านไปมาหนึ่งคำถามว่า "คุณสูบบุหรี่ไหม" ทางเลือกที่เป็นไปได้ดังนั้นจึงมีเพียงสองคำตอบคือ "ใช่" และ "ไม่ใช่"

ขนาดตัวอย่างในกรณีนี้คำนวณได้ดังนี้ ระดับความเชื่อมั่นนำมาเป็น 95% จากนั้นค่าเบี่ยงเบนมาตรฐาน z = 1.96. เรายอมรับการเปลี่ยนแปลงเป็น 50% นั่นคือเราเชื่อว่าผู้ตอบแบบสอบถามครึ่งหนึ่งสามารถตอบคำถามว่าพวกเขาสูบบุหรี่หรือไม่ - "ใช่" แล้ว p=0.5. จากนี้ไปเราจะพบว่า q = 1 – p = 1 – 0.5 = 0,5 . ข้อผิดพลาดในการสุ่มตัวอย่างที่ยอมรับได้คิดเป็น 10% นั่นคือ อี = 0.1.

เราแทนที่ข้อมูลนี้ลงในสูตรและคำนวณ:

รับขนาดตัวอย่าง n = 96 คน.

ขอบเขตของสูตรนี้

เมื่อดำเนินการ วิจัยง่ายๆเมื่อคุณต้องการคำตอบสำหรับคำถามง่ายๆ เพียงคำถามเดียว ในกรณีนี้ ขนาดของการตอบสนองตามกฎแล้วจะมีลักษณะเป็นสองขั้ว กล่าวคือมีคำตอบ (หรือโดยนัย) ประเภท "ใช่" - "ไม่", "ดำ" - "ขาว" เป็นต้น

คุณสมบัติของสูตรนี้ในการคำนวณขนาดตัวอย่าง

Galyautdinov R.R.

ต้องกำหนดขนาดกลุ่มตัวอย่างก่อนเริ่มการศึกษาเชิงปริมาณส่วนใหญ่ ไม่จำเป็นต้องกำหนดขนาดตัวอย่างสำหรับ การวิจัยเชิงคุณภาพ(โปรดทราบว่านี่หมายถึงวิธีการเชิงปริมาณอย่างเป็นทางการ เช่น การวิเคราะห์เนื้อหา โครงการพรรณนาอย่างง่ายเป็นเชิงปริมาณ) การคำนวณขนาดกลุ่มตัวอย่างอาจไม่สามารถทำได้ก่อนดำเนินการศึกษานำร่องเบื้องต้น (อย่างไรก็ตาม การศึกษาดังกล่าวมักจะดำเนินการก่อนการวางแผนจริง การวิจัยทางวิทยาศาสตร์). หากมีข้อสงสัย โปรดติดต่อสถาบันที่ให้ทุนในการศึกษาหรือรวมไว้ในแผนการวิจัย - การขาดข้อมูลเกี่ยวกับขนาดกลุ่มตัวอย่างเป็นหนึ่งในสาเหตุที่สำคัญที่สุด สาเหตุทั่วไปปฏิเสธที่จะอนุมัติหัวข้อ

เหตุใดขนาดตัวอย่างจึงมีความสำคัญต่อนักวิจัย

เมื่อทำการศึกษาที่กำหนดความชุกของลักษณะเฉพาะในประชากร (เช่น ความชุกของโรคหอบหืดในเด็ก) จำเป็นต้องคำนวณขนาดตัวอย่างเพื่อให้แน่ใจว่าผลประมาณการที่ได้จะมีระดับความถูกต้องตามที่ต้องการ ตัวอย่างเช่น ความชุกของโรค 10% ที่ได้จากขนาดตัวอย่าง 20 จะมีช่วงความเชื่อมั่น 95% ที่ 1% ถึง 31% ซึ่งไม่ถูกต้องและไม่ให้ข้อมูล ในทางกลับกัน ความชุกของโรค 10% ที่ได้จากกลุ่มตัวอย่าง 400 คน จะมีช่วงความเชื่อมั่น 95% ที่ 7% ถึง 13% ซึ่งถือได้ว่าเป็นผลลัพธ์ที่ค่อนข้างแม่นยำ การประมาณขนาดตัวอย่างจะหลีกเลี่ยงตัวเลือกแรกจากสองตัวเลือกนี้

ในการศึกษาที่ออกแบบมาเพื่อตรวจหาผลกระทบ (เช่น ความแตกต่างในประสิทธิภาพระหว่างการรักษาสองวิธี ความเสี่ยงสัมพัทธ์ของโรคที่มีหรือไม่มีปัจจัยเสี่ยง) การประมาณขนาดกลุ่มตัวอย่างมีความสำคัญเพื่อให้แน่ใจว่าหากในทางทางคลินิกหรือทางชีววิทยา ผลกระทบที่สำคัญมีอยู่แล้วก็ ระดับสูงความน่าจะเป็นจะถูกตรวจพบ กล่าวคือ การวิเคราะห์จะให้ผลลัพธ์ที่มีนัยสำคัญทางสถิติ หากขนาดตัวอย่างมีขนาดเล็ก แม้ว่า ความแตกต่างที่สำคัญระหว่างกลุ่ม จะไม่สามารถพิสูจน์ได้ว่าเป็นผลจากสิ่งอื่นนอกเหนือจากความแปรปรวนของตัวอย่าง

ข้อมูลที่จำเป็นในการคำนวณขนาดตัวอย่าง

วิธีการประมาณค่าขนาดตัวอย่างได้อธิบายไว้ในหนังสือเรียนเกี่ยวกับสถิติจำนวนหนึ่ง รวมทั้ง Altman, 1991; อ่อนโยน 2000; Armitage, Berry and Matthews, 2002. หนังสือสองเล่มเชี่ยวชาญในการอธิบายวิธีการประมาณค่าขนาดตัวอย่างใน สถานการณ์ต่างๆ. สำหรับพารามิเตอร์เชิงคุณภาพควรปรึกษาการทำงานของ Manchin et al. (1998) เพื่อคุณภาพ - Lemeshow et al. (1996). หนังสือทั้งสองเล่มมีตารางเพื่อช่วยในการคำนวณขนาดตัวอย่าง ในกรณีของการทดลองแบบอนุกรม ควรมีการอ้างอิงถึง Whitehead (1997) การคำนวณขนาดตัวอย่างที่เกิดขึ้นจริงสามารถทำได้โดยใช้โปรแกรมคอมพิวเตอร์โปรแกรมใดโปรแกรมหนึ่งที่มีอยู่มากมาย ตัวอย่างเช่น โปรแกรม Stata ให้คุณวิเคราะห์ขนาดตัวอย่างที่จำเป็นสำหรับการเปรียบเทียบค่าเฉลี่ยและสัดส่วน ตลอดจนการวิเคราะห์ความชุก มาก ปริมาณมากตัวเลือกเสนอแพ็คเกจพิเศษเช่น nQuery Advisor หรือ UnifyPow

การคำนวณขนาดตัวอย่างขึ้นอยู่กับ ปัจจัยดังต่อไปนี้ซึ่งจะต้องรายงานไปยังที่ปรึกษาสถิติ:

ตัวแปรที่ศึกษาในการศึกษารวมทั้งประเภท
พลังการวิจัยที่จำเป็น
ระดับที่ต้องการ นัยสำคัญทางสถิติ
ขนาดผลที่เกี่ยวข้องทางคลินิก
ส่วนเบี่ยงเบนมาตรฐานสำหรับตัวแปรมาตราส่วน
จะใช้การทดสอบนัยสำคัญด้านเดียวหรือสองด้าน
การออกแบบการศึกษากล่าวอีกนัยหนึ่งคือการศึกษา:

สุ่มทดลองควบคุม
การทดลองสุ่มคลัสเตอร์
การวิจัยความเท่าเทียมกัน
การศึกษาการแทรกแซงแบบไม่สุ่มตัวอย่าง
การศึกษาเชิงสังเกต
การศึกษาความชุก
การศึกษาความไวและความจำเพาะของการทดสอบ

ซึ่งจะต้องตอบเป็นตัวเลข คำถามเพิ่มเติม:

ข้อมูลที่จับคู่รวมอยู่ในการศึกษาหรือไม่?
การศึกษาจะวัดตัวแปรเดียวกันซ้ำ ๆ ในบุคคลเดียวกันหรือไม่?
กลุ่มที่รวมอยู่ในการศึกษามีขนาดเท่ากันหรือไม่?
ข้อมูลมีลำดับชั้นหรือไม่?

ควรคำนึงว่าการศึกษาความแตกต่างหรือความสัมพันธ์แบบไม่สุ่มตัวอย่างมักต้องการขนาดตัวอย่างที่ใหญ่ขึ้นอย่างมีนัยสำคัญ เพื่อพิจารณาอิทธิพลของตัวแปรที่สามในการวิเคราะห์ ในเวลาเดียวกัน ผู้วิจัยสนใจในขนาดสัมบูรณ์ของกลุ่มตัวอย่าง ไม่ใช่เปอร์เซ็นต์ที่สร้างขึ้นจากประชากรทั้งหมด

คำศัพท์ทางสถิติใดที่ใช้อธิบายกระบวนการวางแผนขนาดกลุ่มตัวอย่าง

สมมติฐานว่างและทางเลือก

หลายประเภท การวิเคราะห์ทางสถิติมุ่งที่จะเปรียบเทียบสอง ประเภทของการรักษา, ขั้นตอนหรือกลุ่มผู้ป่วย. ค่าตัวเลขที่สรุปความแตกต่างที่น่าสนใจของผู้วิจัยเรียกว่าผลกระทบ ในการศึกษาอื่นๆ ผลกระทบอาจเป็นค่าสัมประสิทธิ์สหสัมพันธ์ อัตราต่อรอง หรือความเสี่ยงสัมพัทธ์ จากนั้นเราเสนอสมมติฐานว่างและสมมติฐานทางเลือก โดยปกติสมมติฐานว่างระบุว่าไม่มีผลกระทบ (ความแตกต่างระหว่างกลุ่มเป็นศูนย์ ความเสี่ยงสัมพัทธ์ เท่ากับหนึ่ง, สัมประสิทธิ์สหสัมพันธ์เป็นศูนย์) สมมติฐานทางเลือกแสดงให้เห็นว่ามีผลกระทบ

ความน่าจะเป็นด้านความเชื่อมั่น (p-score)

ค่า p คือความน่าจะเป็นของการสังเกตผลที่เหมือนกันหรือมากกว่าในการศึกษา โดยพิจารณาจากความถูกต้องของสมมติฐานว่าง มักจะแสดงเป็นสัดส่วน (เช่น p=0.03)

ระดับความสำคัญ

ระดับนัยสำคัญคือค่าขีดจำกัดสำหรับ p-score ด้านล่าง ซึ่งต้องปฏิเสธสมมติฐานว่าง และสรุปได้ว่ามีหลักฐานของผลกระทบ โดยปกติ ระดับนัยสำคัญถูกกำหนดไว้ที่ค่า 5% (ระดับนัยสำคัญ แม้ว่าจะมีความสัมพันธ์โดยตรงกับคะแนน p จะแสดงเป็นเปอร์เซ็นต์: ระดับนัยสำคัญ 5% เทียบเท่ากับ p=0.05) หากค่าที่สังเกตได้น้อยกว่า 5% มีโอกาสเล็กน้อยที่การศึกษาจะได้รับผลลัพธ์ดังกล่าวหากไม่มีผลกระทบที่แท้จริง ดังนั้นจึงยอมรับสมมติฐานของการมีอยู่ของผลกระทบ

ระดับนัยสำคัญที่ 5% ยังหมายความว่ามีโอกาสเกือบ 5% ที่จะสรุปได้ว่ามีผลกระทบ โดยที่จริงแล้วไม่มีเลย บางครั้งก็เหมาะสมกว่าที่จะใช้ระดับนัยสำคัญ 1% โดยเฉพาะอย่างยิ่งหากเป็นสิ่งสำคัญมากที่จะหลีกเลี่ยงการสรุปว่าผลกระทบนั้นมีอยู่ทั้งๆ ที่จริงแล้วไม่มี

พลัง

กำลังคือความน่าจะเป็นที่ สมมติฐานว่างจะถูกปฏิเสธอย่างเพียงพอ กล่าวอีกนัยหนึ่ง เมื่อมีข้อพิสูจน์ถึงความแตกต่างหรือความสัมพันธ์ที่แท้จริง ถือได้ว่าเป็น "100 เปอร์เซ็นต์ ลบโอกาสที่จะพลาดผลที่แท้จริง" ดังนั้น ยิ่งพลังสูงเท่าไหร่ก็ยิ่งมีโอกาสพลาดผลกระทบที่แท้จริงน้อยลงเท่านั้น พลังงานมักจะคงที่ที่ 80%, 90% หรือ 95% กำลังไฟฟ้าไม่ควรต่ำกว่า 80% หากจำเป็นอย่างยิ่งที่การศึกษาจะต้องไม่พลาดผลกระทบที่มีอยู่ เราควรมุ่งเป้าไปที่พลัง 90% หรือมากกว่า

ขนาดผลที่สำคัญทางคลินิก

นี่คือความแตกต่างที่เล็กที่สุดระหว่างค่าเฉลี่ยของกลุ่มหรือเปอร์เซ็นต์ของเหตุการณ์ภายใน (อัตราต่อรองที่ใกล้เคียงที่สุดกับความเสี่ยงในการรวมกันเป็นหนึ่ง) ที่ยังคงถือว่ามีนัยสำคัญทางชีววิทยาหรือทางคลินิก ขนาดกลุ่มตัวอย่างควรเป็นแบบที่ว่า หากมีความแตกต่างดังกล่าว การศึกษาจะให้ผลลัพธ์ที่มีนัยสำคัญทางสถิติ

การทดสอบนัยสำคัญด้านเดียวหรือสองด้าน

ในการทดสอบแบบสองด้าน สมมติฐานว่างคือไม่มีความแตกต่าง และสมมติฐานทางเลือกคือความแตกต่างระหว่างกลุ่มสามารถไปในทิศทางใดทิศทางหนึ่งได้ ในการทดสอบแบบด้านเดียว สมมติฐานทางเลือกจะกำหนดทิศทางที่ตั้งใจไว้ของความแตกต่าง เช่น การรักษานั้นดีกว่ายาหลอก และสมมติฐานที่เป็นโมฆะรวมถึงสถานการณ์ที่ผลของยาและยาหลอกเหมือนกันและผลลัพธ์ของยาเป็นอย่างไร ในผลลัพธ์ที่เลวร้ายยิ่งกว่ายาหลอก

ถ้าไม่ เหตุสุดวิสัยเพื่อที่จะไม่ทำเช่นนี้ เราควรใช้สมมติฐานสองด้าน การคาดหวังว่าความแตกต่างจะไปในทิศทางเดียวหรืออย่างอื่นนั้นไม่เพียงพอที่จะใช้การทดสอบแบบทางเดียว นักวิจัยทางการแพทย์มักจะแปลกใจหากผลลัพธ์ไม่เป็นไปตามที่คาดหวัง บ่อยครั้งที่การค้นพบดังกล่าวมีผลที่ตามมามากกว่าไม่มีความแตกต่าง ดังนั้นจึงต้องมีการอธิบายอย่างเพียงพอ การทดสอบด้านเดียวไม่อนุญาตให้ทำเช่นนี้ สำหรับตัวอย่างสถานการณ์ที่อาจยอมรับการทดสอบแบบด้านเดียว โปรดดูที่ Bland and Altman (1994)

ตัวแปรใดที่ควรคำนึงถึงเมื่อคำนวณขนาดตัวอย่าง

การคำนวณขนาดกลุ่มตัวอย่างควรขึ้นอยู่กับการวิเคราะห์ตัวแปรผลลัพธ์หลักในการศึกษานี้

หากมีการรวมตัวแปรเพิ่มเติมในการศึกษาซึ่งถือว่ามีความสำคัญเช่นกัน ความสำคัญทางวิทยาศาสตร์ดังนั้นขนาดกลุ่มตัวอย่างควรเป็นเพื่อให้สามารถวิเคราะห์ตัวแปรเหล่านี้ได้อย่างเพียงพอ สำหรับสิ่งสำคัญทั้งหมด ทางวิทยาศาสตร์ควรดำเนินการตัวแปรและการคำนวณขนาดตัวอย่างที่นำเสนอ

เปอร์เซ็นต์ของการตอบสนองและการบัญชีการสูญเสียจากการเฝ้าระวัง

ขนาดตัวอย่างโดยประมาณระบุจำนวนผู้ป่วยในกลุ่มสุดท้ายที่วิเคราะห์เมื่อสิ้นสุดการศึกษา ดังนั้น จำนวนบุคคลที่ลงทะเบียนในการศึกษาควรเพิ่มขึ้นตามการตอบสนองที่คาดหวัง การสูญเสียการติดตาม ความล้มเหลวในการปฏิบัติตามโปรโตคอล และสาเหตุที่เป็นไปได้อื่นๆ สำหรับการสูญเสียอาสาสมัครที่ทดลอง ควรอธิบายความสัมพันธ์ระหว่างจำนวนผู้เข้าร่วมที่คาดไว้กับขนาดกลุ่มตัวอย่างที่จะเกิดขึ้นอย่างชัดเจน

การปฏิบัติตามวัตถุประสงค์ของการศึกษาและวิธีการวิเคราะห์ทางสถิติ

ควรประเมินความเพียงพอของขนาดกลุ่มตัวอย่างตามวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น หากเป้าหมายของการศึกษาคือการแสดงให้เห็นว่ายาชนิดใหม่ดีกว่ายาที่มีอยู่ จำเป็นต้องตรวจสอบให้แน่ใจว่าขนาดตัวอย่างสามารถตรวจจับความแตกต่างที่มีนัยสำคัญทางคลินิกระหว่างการรักษาทั้งสองได้ อย่างไรก็ตาม บางครั้งจำเป็นต้องแสดงให้เห็นว่ายาสองชนิดมีความเท่าเทียมกันทางคลินิก การศึกษาประเภทนี้มักเรียกว่าการทดสอบเทียบเท่าหรือ "เชิงลบ" ปัญหาขนาดตัวอย่างสำหรับการศึกษาเหล่านี้มีรายละเอียดอยู่ใน Pocock (1983) ขนาดตัวอย่างในการศึกษาที่มีวัตถุประสงค์เพื่อแสดงให้เห็นถึงความเท่าเทียมกันของยานั้นใหญ่กว่าในการศึกษาที่มุ่งระบุความแตกต่างในประสิทธิภาพ จำเป็นอย่างยิ่งที่จะต้องตรวจสอบให้แน่ใจว่าการคำนวณขนาดกลุ่มตัวอย่างเกี่ยวข้องกับเป้าหมายและวัตถุประสงค์ของการศึกษาวิจัย และอิงตามข้อมูลตัวแปรผลลัพธ์หลัก

ขนาดตัวอย่างควรเพียงพอสำหรับวิธีการวิเคราะห์ที่ใช้ในการศึกษา เนื่องจากทั้งขนาดตัวอย่างและการวิเคราะห์ขึ้นอยู่กับการออกแบบการศึกษาที่เลือก จำเป็นอย่างยิ่งที่จะต้องตรวจสอบให้แน่ใจว่าวิธีการวิเคราะห์ที่ต้องการและการคำนวณขนาดตัวอย่างสามารถทำงานร่วมกันได้

ตัวอย่างการคำนวณขนาดตัวอย่าง

หากการศึกษาที่ต้องการใช้การประมาณความถี่เดียว การเปรียบเทียบสองวิธี หรือการเปรียบเทียบความถี่สองความถี่ การคำนวณขนาดตัวอย่าง (โดยปกติ) ค่อนข้างง่าย และแสดงไว้ด้านล่าง อย่างไรก็ตาม เราขอแนะนำให้คุณปรึกษานักสถิติเกี่ยวกับการคำนวณขนาดตัวอย่างเสมอ

การประมาณความถี่เดียว

หมายเหตุ: สูตรด้านล่างขึ้นอยู่กับสิ่งที่เรียกว่า "โดยประมาณ การกระจายแบบปกติ" และไม่แนะนำให้ประมาณการความถี่ใกล้กับ 0 หรือ 1 (0: หรือ 100% เว้นแต่จะมีการวางแผนเพื่อสร้างตัวอย่างขนาดใหญ่มาก ในกรณีเช่นนี้ ควรใช้วิธีการ "ที่แน่นอน" สถานการณ์ที่คล้ายกันสามารถสังเกตได้เมื่อศึกษาความไวและความจำเพาะของวิธีการวินิจฉัยแบบใหม่ ซึ่งคาดว่าจะมีความถี่ใกล้เคียงกับ 1 (100%) ที่ กรณีนี้ควรปรึกษานักสถิติหรืออย่างน้อยควรใช้โปรแกรมคอมพิวเตอร์เฉพาะทาง

สถานการณ์จำลอง: ใช้แบบสอบถามทางไปรษณีย์เพื่อประเมินความชุกของปัญหาระบบทางเดินหายใจในผู้ป่วยโรคหอบหืดภายใต้การดูแลของแพทย์ การปฏิบัติทั่วไป(โทมัสและคณะ, 2001)

ข้อมูลที่จำเป็น:

ตัวแปรผลลัพธ์หลัก = มีหรือไม่มีการหายใจล้มเหลว
ความถี่ของการละเมิดโดยประมาณ = 30% (0.3)
ความกว้างช่วงความเชื่อมั่นที่ต้องการ 95% = 10% (เช่น +/-5% หรือ 25% ถึง 35%)

สูตรสำหรับการประมาณขนาดกลุ่มตัวอย่างของความถี่เดียวคือ:

n=15.4*p*(1-p)/W2

โดยที่ n คือขนาดตัวอย่างที่ต้องการ p คือความถี่ที่คาดหวังของผลลัพธ์ (ในกรณีนี้คือ 0.3) และ W คือความกว้างของช่วงความเชื่อมั่น (ในกรณีนี้คือ 0.1)

แทนค่าลงในสูตรเราได้รับ:

n=15.4*0.3*(1-0.3)/0.1 2 =324

"เพื่อให้ได้ช่วงความเชื่อมั่น +/-5% รอบค่าประมาณความชุกที่ 30% จำเป็นต้องมีกลุ่มตัวอย่าง 324 คน เมื่อพิจารณาจากอัตราการตอบกลับ 70% ต่อข้อเสนอเพื่อเข้าร่วมในการศึกษานี้ จะมีการแจกจ่ายแบบสอบถาม 480 รายการ"

เปรียบเทียบสองความถี่

สถานการณ์สมมติ: มีการวางแผนการทดลองแบบสุ่มควบคุมด้วยยาหลอกเกี่ยวกับประสิทธิภาพของปัจจัยกระตุ้นอาณานิคมในการลดความเสี่ยงของภาวะติดเชื้อในทารกคลอดก่อนกำหนด การศึกษาก่อนหน้านี้แสดงให้เห็นว่าอุบัติการณ์ของภาวะติดเชื้อในเด็กเหล่านี้คือ 50% ภายใน 2 สัปดาห์หลังคลอด และนักวิจัยเชื่อว่าการลดความถี่นี้เป็น 34% จะมีนัยสำคัญทางคลินิก

ข้อมูลที่จำเป็น:

ตัวแปรผลลัพธ์หลัก = มีหรือไม่มีภาวะติดเชื้อในทารกแรกเกิด 14 วันหลังคลอด (ให้การรักษาไม่เกิน 72 ชั่วโมงหลังคลอด) นี่คือตัวแปรเชิงคุณภาพที่แสดงด้วยความถี่
ความแตกต่างที่มีนัยสำคัญ = 16% หรือ 0.16 (เช่น 50%-34%)
ระดับความสำคัญ=5%
อำนาจ=80%
ทดสอบ=สองด้าน

สูตรคำนวณขนาดตัวอย่างเมื่อเปรียบเทียบสองความถี่คือ

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

โดยที่ n=ขนาดตัวอย่างสำหรับแต่ละกลุ่ม ( ขนาดโดยรวมมากเป็นสองเท่าของตัวอย่าง)

p 1 = ความถี่แรก - ในกรณีนี้ 0.50

p 2 = ความถี่ที่สอง - ในกรณีนี้ 0.34

p 1 -p 2 = ความแตกต่างที่มีนัยสำคัญทางคลินิก ในกรณีนี้ 0.16

ตารางค่าสำหรับ A และ B
ระดับความสำคัญ



พลัง

แทนค่าลงในสูตรเราได้รับ:

n= 2 *[(0.5*0.5+(0.34*0.66)]/ 2 =146

ดังนั้นเราจึงได้รับจำนวนการสังเกตที่จำเป็นในแต่ละกลุ่ม ประชากรทั้งหมดตัวอย่างจะมีขนาดใหญ่เป็นสองเท่า กล่าวคือ 292 ลูก

คำอธิบายของผลลัพธ์ของการคำนวณขนาดตัวอย่างอาจมีลักษณะดังนี้:

"ตัวอย่างของทารกแรกเกิด 292 คน (146 ในกลุ่มการรักษาและกลุ่มยาหลอก) จะเพียงพอที่จะตรวจพบความแตกต่างของอัตราการติดเชื้อที่ 16% โดยมีกำลัง 80% ที่ระดับความเชื่อมั่น 5% ความแตกต่าง 16% เท่ากับความแตกต่างระหว่างการติดเชื้อ 50% อัตรา ณ วันที่ 14 ในกลุ่มยาหลอกและ 34% ในกลุ่มที่ได้รับการรักษา"

การเปรียบเทียบสองค่าเฉลี่ย

หมายเหตุ: การคำนวณด้านล่างจะใช้ได้เฉพาะเมื่อทั้งสองกลุ่มมีขนาดเท่ากัน

สถานการณ์สมมติ: การทดลองแบบสุ่มที่มีกลุ่มเปรียบเทียบเปรียบเทียบการรักษาทางจิตวิทยาในระยะสั้นกับการรักษาแบบเดิมเพื่อต่อสู้กับแนวโน้มการฆ่าตัวตายในผู้ป่วยที่เข้ารับการรักษาในโรงพยาบาลหลังจากมีการวางแผนพยายามฆ่าตัวตาย แนวโน้มการฆ่าตัวตายวัดโดยใช้มาตราส่วนเบ็ค ค่าเบี่ยงเบนมาตรฐานสำหรับคะแนนในระดับนี้คือ 7.7 (ข้อมูลจากการศึกษาก่อนหน้านี้) และความแตกต่าง 5 คะแนนในระดับ Beck ถือว่ามีนัยสำคัญทางคลินิก ผู้ป่วยมากถึงหนึ่งในสามคาดว่าจะออกจากกลุ่มการรักษา (Guthrie et al., 2001)

ข้อมูลที่จำเป็น:

ตัวแปรผลลัพธ์หลัก = Beck Suicidality Scale ตัวแปรต่อเนื่องที่อธิบายโดยวิธี
ส่วนเบี่ยงเบนมาตรฐาน = 7.7 คะแนน
ขนาดผลทางคลินิกที่สำคัญ = 5 คะแนน
ระดับความสำคัญ=5%
อำนาจ=80%
ทดสอบ=สองด้าน

สูตรคำนวณขนาดกลุ่มตัวอย่างเมื่อเปรียบเทียบวิธีการทั้งสองมีดังต่อไปนี้

n= 2 *2*SD 2 /DIFF 2

โดยที่ n=ขนาดตัวอย่างสำหรับแต่ละกลุ่ม (ขนาดตัวอย่างทั้งหมดมีขนาดใหญ่เป็นสองเท่า)

SD= ส่วนเบี่ยงเบนมาตรฐานสำหรับตัวแปรผลลัพธ์หลัก ในกรณีนี้ 7.7

DIFF=ผลกระทบที่สำคัญทางคลินิก ในกรณีนี้ 5.0

A - ขึ้นอยู่กับระดับความสำคัญ (ดูตาราง) - ในกรณีนี้ 1.96

B - ขึ้นอยู่กับพลังงาน (ดูตาราง) - ในกรณีนี้ 0.84

ตารางค่าสำหรับ A และ B
ระดับความสำคัญ



พลัง

ทดแทน ค่าที่จำเป็นในสูตรที่เราได้รับ:

n= 2 *2*7.7 2 /5.0 2 =38

ดังนั้นเราจึงได้รับจำนวนการสังเกตที่จำเป็นในแต่ละกลุ่ม ขนาดกลุ่มตัวอย่างทั้งหมดจะใหญ่เป็นสองเท่า กล่าวคือ 76 คน.

คำอธิบายที่เพียงพอของการประมาณขนาดกลุ่มตัวอย่างจะเป็นดังนี้:

"ในการตรวจสอบความแตกต่าง 5 จุดบนมาตรวัดแนวโน้มการฆ่าตัวตายของเบ็คที่ระดับนัยสำคัญ 5% โดยมีกำลัง 80% โดยถือว่าส่วนเบี่ยงเบนมาตรฐาน 7.7 คะแนน จะต้องมี 38 คนในกลุ่มแทรกแซงและควบคุม จำนวนนี้เพิ่มขึ้นเป็น 60 ในกลุ่ม ( ทั้งหมดข้อสังเกต 120) เพื่อชดเชยการสูญเสียการสังเกตซึ่งมักจะประมาณหนึ่งในสามของวิชา "

ตัวอย่างคำอธิบายไม่เพียงพอของขนาดตัวอย่างโดยประมาณที่ต้องการ

ตัวอย่างที่ 1

"การศึกษาก่อนหน้านี้ในพื้นที่นี้ใช้กลุ่มตัวอย่าง 150 คน และได้รับผลลัพธ์ที่น่าเชื่อถือสูง (p = 0.014) ดังนั้นจึงรวมผู้ป่วยจำนวนใกล้เคียงกันในการศึกษานี้"

การศึกษาก่อนหน้านี้อาจเป็นเพียง "โชคดี" ในแง่ที่ว่าผลลัพธ์ที่มีนัยสำคัญที่พบเกิดจากการแปรผันแบบสุ่มในค่าเฉลี่ยของกลุ่มตัวอย่าง ต้องคำนวณขนาดตัวอย่างสำหรับ การศึกษานี้- รวมถึงรายละเอียดต่างๆ เช่น กำลังศึกษา ระดับนัยสำคัญ ตัวแปรหลักที่ศึกษา ขนาดผลที่มีนัยสำคัญทางคลินิก ส่วนเบี่ยงเบนมาตรฐาน (สำหรับตัวแปรเชิงปริมาณ) และขนาดของแต่ละกลุ่มหากมีหลายกลุ่มในการศึกษา

ตัวอย่าง 2

"ไม่ได้คำนวณขนาดกลุ่มตัวอย่างเพราะไม่มีข้อมูลเบื้องต้นในการประมาณการ"

ควรทบทวนวรรณกรรมอย่างรอบคอบเพื่อค้นหาข้อมูลที่จำเป็นในการคำนวณขนาดกลุ่มตัวอย่าง หากไม่มีข้อมูลนี้ สามารถจัดการศึกษาเบื้องต้นเล็กๆ เพื่อรวบรวมข้อมูลนี้ได้

หากไม่มีข้อมูลเกี่ยวกับค่า ส่วนเบี่ยงเบนมาตรฐาน, สามารถคำนวณขนาดตัวอย่างเพิ่มเติมได้ ปริทัศน์ตัวอย่างเช่น ความแตกต่างที่มีประสิทธิผลทางคลินิกอาจไม่อธิบายไว้ใน ค่าสัมบูรณ์แต่ในหน่วยของส่วนเบี่ยงเบนมาตรฐาน

อย่างไรก็ตาม หากมีการเขียนข้อเสนอทุนสนับสนุนสำหรับการศึกษานำร่องเพื่อรวบรวมข้อมูลที่จำเป็นในการคำนวณขนาดตัวอย่างของการศึกษาขนาดใหญ่ที่ตามมา จะไม่มีการคำนวณขนาดตัวอย่างในข้อเสนอดังกล่าว

"คลินิกรับผู้ป่วยโรคนี้ 50 รายในระหว่างปี ประมาณ 10% ของพวกเขาอาจปฏิเสธที่จะเข้าร่วมในการศึกษาวิจัย ดังนั้นภายในสองปีจึงจะสามารถคัดเลือกตัวอย่างได้ 90 คน"

แม้ว่าการศึกษาส่วนใหญ่จะต้องสร้างสมดุลระหว่างการออกแบบกับกำลัง แต่ไม่ควรกำหนดขนาดกลุ่มตัวอย่างโดยพิจารณาจากจำนวนผู้ป่วยที่มีอยู่สำหรับการศึกษาเพียงอย่างเดียว

ในสถานการณ์ที่จำนวนผู้ป่วยเป็นปัจจัยจำกัดในขนาดตัวอย่าง ควรทำการคำนวณเพื่อสร้าง a) พลังของการศึกษาที่มีผู้ป่วยจำนวนหนึ่งๆ เทียบกับความแตกต่างที่สำคัญทางคลินิก หรือ b) ขนาดของผลกระทบ ที่หาได้จากการศึกษาขนาดที่กำหนด (โดยพิจารณาจากกำลังของมัน)

ในกรณีที่จำนวนผู้ป่วยที่มีอยู่มีน้อยเกินไปที่จะตรวจพบความแตกต่างที่เกี่ยวข้องทางคลินิก อาจมีการพิจารณาเพื่อขยายระยะเวลาของการศึกษาหรือดำเนินการทดลองแบบหลายศูนย์ร่วมกับผู้วิจัยหลายคน

วรรณกรรม

อัลท์แมน ดีจี (1991) สถิติเชิงปฏิบัติสำหรับการวิจัยทางการแพทย์. แชปแมนแอนด์ฮอลล์ ลอนดอน
Armitage P, Berry G, Matthews JNS. (2545) วิธีสถิติในการวิจัยทางการแพทย์ ครั้งที่ 4 แบล็กเวลล์, อ็อกซ์ฟอร์ด.
Bland JM และ Altman DG (1994). การทดสอบนัยสำคัญแบบหนึ่งและสองด้าน วารสารการแพทย์อังกฤษ 309 248
Bland M. (2000) สถิติทางการแพทย์เบื้องต้น, 3rd. เอ็ด สำนักพิมพ์มหาวิทยาลัยอ็อกซ์ฟอร์ด, อ็อกซ์ฟอร์ด
อีแลชอฟ เจดี (2000) คู่มือผู้ใช้ nQuery Advisor เวอร์ชัน 4.0 ลอสแองเจลิส แคลิฟอร์เนีย
Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) การทดลองแบบสุ่มควบคุมของการแทรกแซงทางจิตวิทยาสั้น ๆ หลังจาก พิษภัยโดยเจตนา วารสารการแพทย์อังกฤษ 323, 135-138.
Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (2539) ความเพียงพอของขนาดตัวอย่างในการศึกษาสุขภาพ จอห์น ไวลีย์ แอนด์ ซันส์, ชิเชสเตอร์
Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) ตารางสถิติสำหรับการออกแบบการศึกษาทางคลินิก, Second Edition Blackwell, Oxford
โพค็อก เอสเจ (1983) การทดลองทางคลินิก: แนวทางปฏิบัติ John Wiley and Sons, ชิเชสเตอร์
Thomas M, McKinley RK, Freeman E, Foy C. (2001) ความชุกของการหายใจผิดปกติในผู้ป่วยที่รักษาโรคหอบหืดในการดูแลเบื้องต้น: การสำรวจแบบตัดขวาง วารสารการแพทย์อังกฤษ 322, 1098-1100.
Whitehead, J. (1997) การออกแบบและการวิเคราะห์การทดลองทางคลินิกตามลำดับ, แก้ไขครั้งที่ 2 เอ็ด ชิเชสเตอร์, ไวลีย์.

เครื่องคิดเลข

ประชากร

จำนวนวัตถุสังเกตการณ์ทั้งหมด (คน ครัวเรือน สถานประกอบการ การตั้งถิ่นฐานฯลฯ) ซึ่งมีลักษณะเฉพาะบางอย่าง (เพศ อายุ รายได้ จำนวน ผลประกอบการ ฯลฯ) ที่จำกัดในด้านพื้นที่และเวลา ตัวอย่างของประชากร: - ผู้อยู่อาศัยทั้งหมดในมอสโก (10.6 ล้านคนตามสำมะโน 2545) - ชาวมอสโก (4.9 ล้านคนตามการสำรวจสำมะโนประชากร 2545) - นิติบุคคลรัสเซีย (2.2 ล้านเมื่อต้นปี 2548) - ร้านค้าปลีกที่จำหน่ายผลิตภัณฑ์อาหาร (20,000 เมื่อต้นปี 2551) เป็นต้น

ตัวอย่าง (กลุ่มตัวอย่าง)

ส่วนหนึ่งของวัตถุจากประชากรที่เลือกเพื่อการศึกษาเพื่อสรุปเกี่ยวกับประชากรทั้งหมด เพื่อให้ข้อสรุปที่ได้จากการศึกษาตัวอย่างขยายไปสู่ประชากรทั้งหมด กลุ่มตัวอย่างต้องมีคุณสมบัติเป็นตัวแทน

ตัวแทนตัวอย่าง

คุณสมบัติของกลุ่มตัวอย่างที่สะท้อนถึงประชากรทั่วไปได้อย่างถูกต้อง กลุ่มตัวอย่างเดียวกันอาจใช่หรือไม่ใช่ตัวแทนของประชากรที่แตกต่างกัน ตัวอย่าง: - กลุ่มตัวอย่างที่ประกอบด้วยชาวมอสโกทั้งหมดที่มีรถยนต์เป็นของตนเองไม่ได้เป็นตัวแทนของประชากรทั้งหมดของมอสโก - ตัวอย่างวิสาหกิจของรัสเซียไม่เกิน 100 คนไม่ได้เป็นตัวแทนของวิสาหกิจทั้งหมดในรัสเซีย - กลุ่มตัวอย่างชาวมอสโกที่ซื้อของในตลาดไม่ได้แสดงถึงพฤติกรรมการซื้อของชาวมอสโกทั้งหมด ในขณะเดียวกัน ตัวอย่างเหล่านี้ (ขึ้นอยู่กับปัจจัยอื่นๆ เงื่อนไข) สามารถเป็นตัวแทนของ Muscovites ได้อย่างสมบูรณ์แบบ - เจ้าของรถ บริษัท รัสเซียขนาดเล็กและขนาดกลางและผู้ซื้อที่ซื้อของในตลาด ตามลำดับ สิ่งสำคัญคือต้องเข้าใจว่าการเป็นตัวแทนตัวอย่างและข้อผิดพลาดในการสุ่มตัวอย่างเป็นปรากฏการณ์ที่แตกต่างกัน ความเป็นตัวแทนซึ่งแตกต่างจากข้อผิดพลาดไม่ได้ขึ้นอยู่กับขนาดกลุ่มตัวอย่างแต่อย่างใด ตัวอย่าง: ไม่ว่าเราจะเพิ่มจำนวนเจ้าของรถ Muscovites ที่ถูกสัมภาษณ์มากแค่ไหนก็ตาม

ข้อผิดพลาดในการสุ่มตัวอย่าง (ช่วงความเชื่อมั่น)

การปฏิเสธผลลัพธ์ที่ได้รับโดยใช้ การสังเกตแบบคัดเลือกจากข้อมูลจริงของประชากรทั่วไป ข้อผิดพลาดในการสุ่มตัวอย่างมี 2 ประเภท คือ ทางสถิติและเชิงระบบ ข้อผิดพลาดทางสถิติขึ้นอยู่กับขนาดกลุ่มตัวอย่าง ยิ่งขนาดกลุ่มตัวอย่างมากเท่าใด ก็ยิ่งต่ำเท่านั้น ตัวอย่าง: แบบง่าย สุ่มตัวอย่างด้วยขนาด 400 หน่วย ข้อผิดพลาดทางสถิติสูงสุด (ด้วยความน่าจะเป็นของความเชื่อมั่น 95%) คือ 5% สำหรับตัวอย่าง 600 หน่วย - 4% สำหรับตัวอย่าง 1100 หน่วย - 3% จาก ปัจจัยต่างๆที่มีผลกระทบถาวรต่อการศึกษาและอคติต่อผลการศึกษาไปในทิศทางใดทิศทางหนึ่ง ภาพที่ใช้งานชีวิต. สิ่งนี้เกิดขึ้นเนื่องจากการหาบุคคลดังกล่าวในสถานที่ใดที่หนึ่งได้ยากกว่ามาก (เช่น ที่บ้าน) 80%) ในบางกรณี เมื่อทราบการแจกแจงที่แท้จริง ผิดพลาดอย่างเป็นระบบสามารถปรับระดับได้โดยการแนะนำโควต้าหรือการถ่วงน้ำหนักข้อมูลใหม่ แต่ในการศึกษาจริงส่วนใหญ่ การประเมินก็อาจเป็นปัญหาค่อนข้างมาก

ประเภทตัวอย่าง

ตัวอย่างแบ่งออกเป็นสองประเภท:
- ความน่าจะเป็น
- ความเป็นไปไม่ได้

1. ตัวอย่างความน่าจะเป็น
1.1 การสุ่มตัวอย่าง (การเลือกสุ่มอย่างง่าย)
ตัวอย่างดังกล่าวถือว่าความเป็นเนื้อเดียวกันของประชากรทั่วไป ความน่าจะเป็นเท่ากันของการมีอยู่ขององค์ประกอบทั้งหมด การมีอยู่ รายการทั้งหมดองค์ประกอบทั้งหมด เมื่อเลือกองค์ประกอบตามกฎแล้วจะใช้ตารางตัวเลขสุ่ม
1.2 การสุ่มตัวอย่างทางกล (อย่างเป็นระบบ)
ตัวอย่างแบบสุ่ม จัดเรียงตามคุณลักษณะบางอย่าง (ลำดับตามตัวอักษร หมายเลขโทรศัพท์ วันเดือนปีเกิด ฯลฯ) องค์ประกอบแรกจะถูกเลือกแบบสุ่ม จากนั้นทุกองค์ประกอบ 'k' จะถูกเลือกโดยเพิ่มขึ้นทีละ 'n' ขนาดของประชากรทั่วไป ในขณะที่ - N=n*k
1.3 แบ่งชั้น (แบ่งโซน)
ใช้ในกรณีที่มีความหลากหลายของประชากรทั่วไป ประชากรแบ่งออกเป็นกลุ่ม (ชั้น) ในแต่ละชั้น การคัดเลือกจะดำเนินการแบบสุ่มหรือโดยกลไก
1.4 การสุ่มตัวอย่างแบบอนุกรม (แบบซ้อนหรือแบบคลัสเตอร์)
ที่ การสุ่มตัวอย่างแบบอนุกรมหน่วยของการเลือกไม่ใช่วัตถุ แต่เป็นกลุ่ม (คลัสเตอร์หรือรัง) กลุ่มจะถูกสุ่มเลือก วัตถุภายในกลุ่มจะถูกสำรวจไปทั่ว

2. ตัวอย่างที่เหลือเชื่อ
การคัดเลือกในตัวอย่างดังกล่าวไม่ได้ดำเนินการตามหลักการของโอกาส แต่เป็นไปตามเกณฑ์ส่วนตัว - การเข้าถึง ความธรรมดา การเป็นตัวแทนที่เท่าเทียมกัน ฯลฯ
2.1. การสุ่มตัวอย่างโควต้า
เริ่มแรกมีการจัดสรรกลุ่มวัตถุจำนวนหนึ่ง (เช่นผู้ชายอายุ 20-30 ปี, 31-45 ปีและ 46-60 ปี; บุคคลที่มีรายได้สูงถึง 30,000 rubles โดยมีรายได้ 30 ถึง 60 พันรูเบิลและมีรายได้มากกว่า 60,000 รูเบิล ) สำหรับแต่ละกลุ่มจะระบุจำนวนวัตถุที่จะสำรวจ จำนวนของอ็อบเจ็กต์ที่ควรอยู่ในแต่ละกลุ่มถูกกำหนด ส่วนใหญ่มักจะเป็นสัดส่วนกับส่วนแบ่งที่รู้จักก่อนหน้านี้ของกลุ่มในประชากรทั่วไป หรือเท่ากันสำหรับแต่ละกลุ่ม ภายในกลุ่ม วัตถุจะถูกสุ่มเลือก ตัวอย่างโควต้ามักใช้ในการวิจัยการตลาด
2.2. วิธีสโนว์บอล
สร้างตัวอย่างได้ดังนี้ ขอให้ผู้ตอบแต่ละคนโดยเริ่มจากคนแรก ให้ติดต่อเพื่อน เพื่อนร่วมงาน คนรู้จัก ที่จะเข้าเงื่อนไขการคัดเลือกและสามารถมีส่วนร่วมในการศึกษาวิจัยได้ ดังนั้น ยกเว้นขั้นตอนแรก ตัวอย่างถูกสร้างขึ้นด้วยการมีส่วนร่วมของวัตถุที่ศึกษาด้วยตนเอง วิธีนี้มักใช้เมื่อจำเป็นต้องค้นหาและสัมภาษณ์กลุ่มผู้ตอบแบบสอบถามที่เข้าถึงยาก (เช่น ผู้ตอบแบบสอบถามที่มีรายได้สูง ผู้ตอบแบบสอบถามที่อยู่ในกลุ่มอาชีพเดียวกัน ผู้ตอบแบบสำรวจที่มีงานอดิเรก/ความสนใจคล้ายกัน เป็นต้น )
2.3 การสุ่มตัวอย่างที่เกิดขึ้นเอง
ผู้ตอบแบบสำรวจที่เข้าถึงได้มากที่สุดจะถูกสำรวจ ตัวอย่างทั่วไปตัวอย่างที่เกิดขึ้นเอง - แบบสำรวจในหนังสือพิมพ์ / นิตยสาร แบบสอบถามที่มอบให้ผู้ตอบแบบสำรวจด้วยตนเอง แบบสำรวจทางอินเทอร์เน็ตส่วนใหญ่ ขนาดและองค์ประกอบของตัวอย่างที่เกิดขึ้นเองไม่ทราบล่วงหน้าและถูกกำหนดโดยพารามิเตอร์เดียวเท่านั้น - กิจกรรมของผู้ตอบแบบสอบถาม
2.4 ตัวอย่างกรณีทั่วไป
หน่วยของประชากรทั่วไปถูกเลือกโดยมีค่าเฉลี่ย (ทั่วไป) ของแอตทริบิวต์ ทำให้เกิดปัญหาในการเลือกคุณลักษณะและกำหนดค่าทั่วไป

เครื่องคำนวณข้อผิดพลาดและขนาดตัวอย่าง

(สำหรับตัวอย่างสุ่มอย่างง่าย)

คำอธิบายสำหรับฟิลด์:

ความมั่นใจ ความน่าจะเป็น
ความน่าจะเป็นที่ช่วงความเชื่อมั่นครอบคลุมค่าที่ไม่รู้จัก มูลค่าที่แท้จริงพารามิเตอร์ที่ประเมินจากข้อมูลตัวอย่าง ในทางปฏิบัติการวิจัย ระดับความมั่นใจ 95% มักใช้บ่อยที่สุด

ข้อผิดพลาดในการสุ่มตัวอย่าง (ช่วงความเชื่อมั่น)
ช่วงเวลาที่คำนวณจากข้อมูลตัวอย่างที่มีความน่าจะเป็นที่กำหนด (ความมั่นใจ) ครอบคลุมค่าจริงที่ไม่รู้จักของพารามิเตอร์การกระจายโดยประมาณ

การแชร์คุณสมบัติ

ส่วนแบ่งที่คาดหวังของคุณลักษณะที่มีการคำนวณข้อผิดพลาด หากไม่มีข้อมูลเกี่ยวกับส่วนแบ่งของคุณลักษณะ จำเป็นต้องใช้ค่าเท่ากับ 50 ซึ่งจะมีข้อผิดพลาดสูงสุด

องค์ประกอบหลักอย่างหนึ่งของการศึกษาที่ออกแบบมาอย่างดีคือคำจำกัดความของกลุ่มตัวอย่างและกลุ่มตัวอย่างคืออะไร มันเหมือนกับตัวอย่างเค้ก ท้ายที่สุดไม่จำเป็นต้องกินของหวานทั้งหมดเพื่อทำความเข้าใจรสชาติของมัน? ส่วนเล็ก ๆ ก็เพียงพอแล้ว

ดังนั้นเค้กคือ ประชากร (กล่าวคือ ผู้ตอบแบบสอบถามทุกคนที่มีคุณสมบัติตามแบบสำรวจ) สามารถแสดงออกได้ทางอาณาเขตเช่นเฉพาะผู้ที่อาศัยอยู่ในภูมิภาคมอสโกเท่านั้น เพศ - ผู้หญิงเท่านั้น หรือมีข้อ จำกัด ด้านอายุ - รัสเซียมีอายุมากกว่า 65 ปี

การคำนวณประชากรเป็นเรื่องยาก คุณต้องมีข้อมูลจากการสำรวจสำมะโนประชากรหรือแบบสำรวจการประเมินเบื้องต้น ดังนั้น โดยปกติประชากรทั่วไปจะถูก "ประมาณ" และจากจำนวนผลลัพธ์ที่พวกเขาคำนวณ กรอบตัวอย่าง หรือ การสุ่มตัวอย่าง.

ตัวอย่างตัวแทนคืออะไร?

ตัวอย่างเป็นจำนวนผู้ตอบแบบสอบถามที่ชัดเจน โครงสร้างควรตรงกับโครงสร้างของประชากรทั่วไปมากที่สุดในแง่ของลักษณะสำคัญของการคัดเลือก

ตัวอย่างเช่น หากผู้ที่อาจเป็นผู้ตอบแบบสอบถามคือประชากรทั้งหมดของรัสเซีย โดยที่ 54% เป็นผู้หญิงและ 46% เป็นผู้ชาย กลุ่มตัวอย่างควรมีเนื้อหาที่เหมือนกันทุกประการ เปอร์เซ็นต์. หากพารามิเตอร์ตรงกัน ตัวอย่างสามารถเรียกได้ว่าเป็นตัวแทน ซึ่งหมายความว่าความไม่ถูกต้องและข้อผิดพลาดในการศึกษาจะลดลง

ขนาดตัวอย่างถูกกำหนดโดยคำนึงถึงข้อกำหนดของความถูกต้องและความประหยัด ข้อกำหนดเหล่านี้เป็นสัดส่วนผกผันซึ่งกันและกัน: ยิ่งขนาดตัวอย่างใหญ่ ผลลัพธ์ที่แม่นยำยิ่งขึ้น. ยิ่งไปกว่านั้น ยิ่งมีความแม่นยำสูงเท่าใด ก็ยิ่งต้องใช้ค่าใช้จ่ายในการศึกษามากขึ้นเท่านั้น และในทางกลับกัน ยิ่งกลุ่มตัวอย่างมีขนาดเล็กเท่าใด ต้นทุนก็จะยิ่งต่ำลง คุณสมบัติของประชากรทั่วไปก็จะยิ่งมีความเที่ยงตรงน้อยลงและสุ่มมากขึ้น

ดังนั้นในการคำนวณจำนวนทางเลือกนักสังคมวิทยาจึงคิดค้นสูตรและสร้างขึ้น เครื่องคิดเลขพิเศษ:

ความมั่นใจ ความน่าจะเป็นและ ความผิดพลาดของความมั่นใจ

เงื่อนไขอะไร " ระดับความเชื่อมั่น" และ " ความผิดพลาดของความมั่นใจ"? ระดับความเชื่อมั่นเป็นตัววัดความถูกต้องของการวัด และความผิดพลาดของความมั่นใจคือ ข้อผิดพลาดที่เป็นไปได้ผลการวิจัย ตัวอย่างเช่น ด้วยประชากรทั่วไปมากกว่า 500,000 คน (เช่น อาศัยอยู่ในโนโวคุซเนตสค์) กลุ่มตัวอย่างจะเป็น 384 คน โดยมี ระดับความเชื่อมั่น 95% และข้อผิดพลาด 5% หรือ (ด้วย ช่วงความมั่นใจ 95±5%).

อะไรต่อจากนี้? เมื่อทำการศึกษา 100 ตัวอย่างกับกลุ่มตัวอย่างดังกล่าว (384 คน) ใน 95 เปอร์เซ็นต์ของกรณี คำตอบที่ได้รับตามกฎหมายของสถิติจะอยู่ภายใน ± 5% ของต้นฉบับ แล้วเราจะได้ ตัวอย่างตัวแทนที่มีความน่าจะเป็นน้อยที่สุดของข้อผิดพลาดทางสถิติ

หลังจากคำนวณขนาดตัวอย่างเสร็จแล้ว คุณสามารถดูได้ว่ามีผู้ตอบแบบสอบถามเพียงพอในแผงแบบสอบถามรุ่นสาธิตหรือไม่ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับวิธีการทำการสำรวจความคิดเห็น

เมื่อคุณถามคำถามว่า "ฉันต้องการผู้ตอบแบบสำรวจกี่คน" คุณกำลังถามจริงๆ ว่า "กลุ่มตัวอย่างของฉันต้องมีขนาดใหญ่แค่ไหนจึงจะสามารถประมาณจำนวนประชากรได้อย่างแม่นยำ" ด้วยความซับซ้อนของแนวคิดเหล่านี้ เราได้แบ่งกระบวนการออกเป็น 5 ขั้นตอน ทำให้ง่ายต่อการคำนวณขนาดตัวอย่างในอุดมคติของคุณและรับรองความถูกต้องของผลการสำรวจของคุณ

5 ขั้นตอนเพื่อให้แน่ใจว่ากลุ่มตัวอย่างของคุณประมาณประชากรได้อย่างแม่นยำ:

ขั้นตอนที่ 1

ประชากรทั่วไปของคุณคืออะไร?

โดยคำว่า "ประชากรทั่วไป" เราหมายถึงกลุ่มคนทั้งกลุ่มที่คุณกำลังจะถามความคิดเห็น (กลุ่มตัวอย่างจะประกอบด้วยสมาชิกของประชากรกลุ่มนี้ที่จะมีส่วนร่วมในการสำรวจจริงๆ)

ตัวอย่างเช่น หากคุณต้องการเข้าใจวิธีการหาตลาดยาสีฟันในฝรั่งเศส ประชากรของคุณจะเป็นคนฝรั่งเศส และถ้าคุณกำลังพยายามกำหนดวันลาพักร้อนที่คนทำงานในบริษัทยาสีฟันอยากได้ ประชากรของคุณก็คือพนักงานของบริษัทนั้น

ไม่ว่าจะเป็นประเทศหรือบริษัท การสร้างประชากรเป็นขั้นตอนแรกที่สำคัญ เมื่อคุณได้ตัดสินใจเกี่ยวกับจำนวนประชากรแล้ว ให้กำหนด (โดยประมาณ) ขนาดของประชากร ตัวอย่างเช่น ฝรั่งเศสมีประชากรประมาณ 65 ล้านคน แต่บริษัทยาสีฟันน่าจะมีพนักงานน้อยกว่ามาก

คุณได้รับหมายเลขที่ถูกต้องหรือไม่? โอเค งั้นเราไปกันเลย...

ขั้นตอนที่ 2

ความแม่นยำที่ต้องการคืออะไร?

ขั้นตอนนี้เป็นการประเมินความเสี่ยงที่คุณยินดีรับความเสี่ยงเกี่ยวกับความเป็นไปได้ของการตอบแบบสำรวจที่ไม่ถูกต้อง เนื่องจากคุณไม่ได้สำรวจประชากรทั้งหมด ดังนั้นคุณควรตอบคำถามสองข้อ:

คุณต้องการความมั่นใจเพียงใดที่คำตอบที่คุณได้รับสะท้อนความคิดเห็นของประชากรทั่วไป
นี่คือระยะขอบของข้อผิดพลาด สมมติว่า 90% ของกลุ่มตัวอย่างชอบหมากฝรั่งรสองุ่น ขอบของข้อผิดพลาด 5% บวก 5% ในแต่ละด้านของตัวเลขนั้น หมายความว่าจริง ๆ แล้ว 85-95% ของกลุ่มตัวอย่างชอบหมากฝรั่งรสองุ่น 5% คือส่วนต่างของข้อผิดพลาดที่ใช้บ่อยที่สุด แต่คุณสามารถตั้งค่าให้อยู่ระหว่าง 1% ถึง 10% ขึ้นอยู่กับแบบสำรวจ ไม่แนะนำให้เพิ่มตัวเลขนี้เกินกว่า 10%
คุณต้องการความมั่นใจเพียงใดที่กลุ่มตัวอย่างจะเป็นตัวแทนของประชากรได้อย่างแม่นยำ

นี่คือระดับความไว้วางใจของคุณ ระดับความเชื่อมั่นคือความน่าจะเป็นที่กลุ่มตัวอย่างมีนัยสำคัญสำหรับผลลัพธ์ที่ได้ การคำนวณมักจะทำดังนี้ หากคุณสุ่มเลือกกลุ่มตัวอย่างอีก 30 ตัวอย่างจากประชากรกลุ่มนี้ ผลลัพธ์ของคุณสำหรับตัวอย่างหนึ่งจะแตกต่างอย่างมากจากผลลัพธ์สำหรับอีก 30 ตัวอย่างมากน้อยเพียงใด ระดับความมั่นใจ 95% หมายความว่า 95% ของเวลาที่ผลลัพธ์จะตรงกัน 95% เป็นค่าที่ใช้บ่อยที่สุด แต่คุณสามารถตั้งค่าเป็น 90% หรือ 99% ขึ้นอยู่กับโพล ไม่แนะนำให้ลดค่าระดับความเชื่อมั่นต่ำกว่า 90%

ขั้นตอนที่ 3

ฉันต้องการตัวอย่างขนาดใด

ในตารางด้านล่าง ให้เลือกขนาดประชากรเป้าหมายโดยประมาณและส่วนต่างของข้อผิดพลาดเพื่อกำหนดจำนวนการสัมภาษณ์ที่ต้องการ

ตอนนี้คุณมีค่า stride 1 และ stride 2 แล้ว ให้ใช้ตารางที่มีประโยชน์ด้านล่างเพื่อกำหนดขนาดของตัวอย่างที่ต้องการ...

ประชากร	ขอบของข้อผิดพลาด			ระดับความน่าเชื่อถือ
ประชากร	10%	5%	1%	90%	95%	99%
100	50	80	99	74	80	88
500	81	218	476	176	218	286
1000	88	278	906	215	278	400
10 000	96	370	4900	264	370	623
100 000	96	383	8763	270	383	660
1 000 000+	97	384	9513	271	384	664

บันทึก. ข้อมูลมีไว้เพื่อเป็นแนวทางเท่านั้น นอกจากนี้ สำหรับประชากรที่มากกว่า 1 ล้านคน สามารถปัดเศษตัวเลขให้เป็นจำนวนเต็มร้อยที่ใกล้ที่สุดได้

ขั้นตอนที่ 4

ผู้คนจะตอบสนองอย่างไร?

ขออภัย ไม่ใช่ทุกคนที่คุณส่งแบบสำรวจให้จะได้รับคำตอบ

เปอร์เซ็นต์ของผู้ที่กรอกแบบสำรวจที่ได้รับจะเรียกว่า "อัตราการตอบกลับ" การระบุเปอร์เซ็นต์ของผู้ตอบแบบสำรวจจะช่วยให้คุณระบุได้ จำนวนทั้งหมดตัวอย่างแบบสำรวจที่ต้องส่งออกเพื่อรับคำตอบตามจำนวนที่ต้องการ

เปอร์เซ็นต์ของการตอบสนองโดยตรงขึ้นอยู่กับปัจจัยหลายประการ เช่น ความสัมพันธ์กับ กลุ่มเป้าหมายความยาวและความซับซ้อนของแบบสำรวจ สิ่งจูงใจที่เสนอ และหัวข้อของแบบสำรวจ สำหรับแบบสำรวจออนไลน์ที่ไม่เคยมีการสร้างความสัมพันธ์กับผู้รับมาก่อน เปอร์เซ็นต์อัตราการตอบสนอง 20-30% ถือว่าสูงมาก ค่าที่อนุรักษ์นิยมและมีแนวโน้มมากขึ้นคือ 10-14% หากคุณไม่เคยทำการสำรวจในประชากรกลุ่มนี้มาก่อน

ขั้นตอนที่ 5

คุณควรส่งแบบสำรวจไปให้กี่คน?

นี่เป็นขั้นตอนง่าย ๆ !

เพียงหารจำนวนที่คุณได้รับในขั้นตอนที่ 3 ด้วยจำนวนที่คุณได้รับในขั้นตอนที่ 4 นี่คือเลขมหัศจรรย์ของคุณ

ตัวอย่างเช่น ถ้าคุณต้องการผู้หญิง 100 คนที่ใช้แชมพูเพื่อทำแบบสำรวจ และคุณคิดว่า 10% ของผู้หญิงที่คุณส่งแบบสำรวจจะทำแบบสำรวจให้เสร็จ คุณต้องส่งแบบสำรวจไปให้ผู้หญิง 1,000 คน (100/10%)!