วิธีการคำนวณตัวอย่างสำหรับการศึกษา ประชากรทั่วไปและวิธีการสุ่มตัวอย่าง
สูตรคำนวณด้านล่าง ขนาดตัวอย่างใช้ในกรณีที่ผู้ตอบแบบสอบถาม (ผู้ตอบแบบสอบถาม) ถูกถามคำถามเพียงคำถามเดียว ซึ่งมีเพียงสองคำตอบที่เป็นไปได้ ตัวอย่างเช่น "ใช่" และ "ไม่"; "ฉันใช้" และ "ฉันไม่ใช้" แน่นอน, สูตรนี้สามารถใช้สำหรับการวิจัยอย่างง่ายเท่านั้น หากคุณต้องการกำหนดขนาดตัวอย่างมากกว่า การวิจัยขนาดใหญ่เช่น แบบสอบถาม ก็ควรใช้สูตรอื่น
สูตรคำนวณขนาดตัวอย่างอย่างง่าย
ที่ไหน: น- ขนาดตัวอย่าง;
zคือค่าเบี่ยงเบนมาตรฐานที่กำหนดตามระดับความเชื่อมั่นที่เลือก ตัวบ่งชี้นี้แสดงถึงความเป็นไปได้ ความน่าจะเป็นที่จะได้คำตอบในช่วงเวลาพิเศษ - ความมั่นใจ ในทางปฏิบัติ ระดับความมั่นใจมักถูกนำมาเป็น 95% หรือ 99% จากนั้นค่า z จะเป็น 1.96 และ 2.58 ตามลำดับ
พี– การเปลี่ยนแปลงสำหรับตัวอย่างในหุ้น โดยพื้นฐานแล้ว p คือความน่าจะเป็นที่ผู้ตอบจะเลือกตัวเลือกคำตอบอย่างใดอย่างหนึ่ง สมมติว่าถ้าเราเชื่อว่าหนึ่งในสี่ของผู้ตอบแบบสอบถามจะเลือกคำตอบ "ใช่" แล้ว p จะเท่ากับ 25% นั่นคือ p = 0.25;
q= (1 – p);
อี– ข้อผิดพลาดที่อนุญาตเป็นเศษส่วน
ตัวอย่างการคำนวณขนาดตัวอย่าง
บริษัทมีแผนที่จะ การวิจัยทางสังคมวิทยาเพื่อระบุสัดส่วนของผู้สูบบุหรี่ในประชากรของเมือง ในการดำเนินการนี้ พนักงานของบริษัทจะถามคำถามกับคนที่เดินผ่านไปมาหนึ่งคำถามว่า "คุณสูบบุหรี่ไหม" ทางเลือกที่เป็นไปได้ดังนั้นจึงมีเพียงสองคำตอบคือ "ใช่" และ "ไม่ใช่"
ขนาดตัวอย่างในกรณีนี้คำนวณได้ดังนี้ ระดับความเชื่อมั่นนำมาเป็น 95% จากนั้นค่าเบี่ยงเบนมาตรฐาน z = 1.96. เรายอมรับการเปลี่ยนแปลงเป็น 50% นั่นคือเราเชื่อว่าผู้ตอบแบบสอบถามครึ่งหนึ่งสามารถตอบคำถามว่าพวกเขาสูบบุหรี่หรือไม่ - "ใช่" แล้ว p=0.5. จากนี้ไปเราจะพบว่า q = 1 – p = 1 – 0.5 = 0,5 . ข้อผิดพลาดในการสุ่มตัวอย่างที่ยอมรับได้คิดเป็น 10% นั่นคือ อี = 0.1.
เราแทนที่ข้อมูลนี้ลงในสูตรและคำนวณ:
รับขนาดตัวอย่าง n = 96 คน.
ขอบเขตของสูตรนี้
เมื่อดำเนินการ วิจัยง่ายๆเมื่อคุณต้องการคำตอบสำหรับคำถามง่ายๆ เพียงคำถามเดียว ในกรณีนี้ ขนาดของการตอบสนองตามกฎแล้วจะมีลักษณะเป็นสองขั้ว กล่าวคือมีคำตอบ (หรือโดยนัย) ประเภท "ใช่" - "ไม่", "ดำ" - "ขาว" เป็นต้น
คุณสมบัติของสูตรนี้ในการคำนวณขนาดตัวอย่าง
Galyautdinov R.R.
© อนุญาตให้คัดลอกเนื้อหาได้ก็ต่อเมื่อคุณระบุไฮเปอร์ลิงก์โดยตรงไปยัง
ต้องกำหนดขนาดกลุ่มตัวอย่างก่อนเริ่มการศึกษาเชิงปริมาณส่วนใหญ่ ไม่จำเป็นต้องกำหนดขนาดตัวอย่างสำหรับ การวิจัยเชิงคุณภาพ(โปรดทราบว่านี่หมายถึงวิธีการเชิงปริมาณอย่างเป็นทางการ เช่น การวิเคราะห์เนื้อหา โครงการพรรณนาอย่างง่ายเป็นเชิงปริมาณ) การคำนวณขนาดกลุ่มตัวอย่างอาจไม่สามารถทำได้ก่อนดำเนินการศึกษานำร่องเบื้องต้น (อย่างไรก็ตาม การศึกษาดังกล่าวมักจะดำเนินการก่อนการวางแผนจริง การวิจัยทางวิทยาศาสตร์). หากมีข้อสงสัย โปรดติดต่อสถาบันที่ให้ทุนในการศึกษาหรือรวมไว้ในแผนการวิจัย - การขาดข้อมูลเกี่ยวกับขนาดกลุ่มตัวอย่างเป็นหนึ่งในสาเหตุที่สำคัญที่สุด สาเหตุทั่วไปปฏิเสธที่จะอนุมัติหัวข้อ
เหตุใดขนาดตัวอย่างจึงมีความสำคัญต่อนักวิจัย
เมื่อทำการศึกษาที่กำหนดความชุกของลักษณะเฉพาะในประชากร (เช่น ความชุกของโรคหอบหืดในเด็ก) จำเป็นต้องคำนวณขนาดตัวอย่างเพื่อให้แน่ใจว่าผลประมาณการที่ได้จะมีระดับความถูกต้องตามที่ต้องการ ตัวอย่างเช่น ความชุกของโรค 10% ที่ได้จากขนาดตัวอย่าง 20 จะมีช่วงความเชื่อมั่น 95% ที่ 1% ถึง 31% ซึ่งไม่ถูกต้องและไม่ให้ข้อมูล ในทางกลับกัน ความชุกของโรค 10% ที่ได้จากกลุ่มตัวอย่าง 400 คน จะมีช่วงความเชื่อมั่น 95% ที่ 7% ถึง 13% ซึ่งถือได้ว่าเป็นผลลัพธ์ที่ค่อนข้างแม่นยำ การประมาณขนาดตัวอย่างจะหลีกเลี่ยงตัวเลือกแรกจากสองตัวเลือกนี้
ในการศึกษาที่ออกแบบมาเพื่อตรวจหาผลกระทบ (เช่น ความแตกต่างในประสิทธิภาพระหว่างการรักษาสองวิธี ความเสี่ยงสัมพัทธ์ของโรคที่มีหรือไม่มีปัจจัยเสี่ยง) การประมาณขนาดกลุ่มตัวอย่างมีความสำคัญเพื่อให้แน่ใจว่าหากในทางทางคลินิกหรือทางชีววิทยา ผลกระทบที่สำคัญมีอยู่แล้วก็ ระดับสูงความน่าจะเป็นจะถูกตรวจพบ กล่าวคือ การวิเคราะห์จะให้ผลลัพธ์ที่มีนัยสำคัญทางสถิติ หากขนาดตัวอย่างมีขนาดเล็ก แม้ว่า ความแตกต่างที่สำคัญระหว่างกลุ่ม จะไม่สามารถพิสูจน์ได้ว่าเป็นผลจากสิ่งอื่นนอกเหนือจากความแปรปรวนของตัวอย่าง
ข้อมูลที่จำเป็นในการคำนวณขนาดตัวอย่าง
วิธีการประมาณค่าขนาดตัวอย่างได้อธิบายไว้ในหนังสือเรียนเกี่ยวกับสถิติจำนวนหนึ่ง รวมทั้ง Altman, 1991; อ่อนโยน 2000; Armitage, Berry and Matthews, 2002. หนังสือสองเล่มเชี่ยวชาญในการอธิบายวิธีการประมาณค่าขนาดตัวอย่างใน สถานการณ์ต่างๆ. สำหรับพารามิเตอร์เชิงคุณภาพควรปรึกษาการทำงานของ Manchin et al. (1998) เพื่อคุณภาพ - Lemeshow et al. (1996). หนังสือทั้งสองเล่มมีตารางเพื่อช่วยในการคำนวณขนาดตัวอย่าง ในกรณีของการทดลองแบบอนุกรม ควรมีการอ้างอิงถึง Whitehead (1997) การคำนวณขนาดตัวอย่างที่เกิดขึ้นจริงสามารถทำได้โดยใช้โปรแกรมคอมพิวเตอร์โปรแกรมใดโปรแกรมหนึ่งที่มีอยู่มากมาย ตัวอย่างเช่น โปรแกรม Stata ให้คุณวิเคราะห์ขนาดตัวอย่างที่จำเป็นสำหรับการเปรียบเทียบค่าเฉลี่ยและสัดส่วน ตลอดจนการวิเคราะห์ความชุก มาก ปริมาณมากตัวเลือกเสนอแพ็คเกจพิเศษเช่น nQuery Advisor หรือ UnifyPow
การคำนวณขนาดตัวอย่างขึ้นอยู่กับ ปัจจัยดังต่อไปนี้ซึ่งจะต้องรายงานไปยังที่ปรึกษาสถิติ:
- ตัวแปรที่ศึกษาในการศึกษารวมทั้งประเภท
- พลังการวิจัยที่จำเป็น
- ระดับที่ต้องการ นัยสำคัญทางสถิติ
- ขนาดผลที่เกี่ยวข้องทางคลินิก
- ส่วนเบี่ยงเบนมาตรฐานสำหรับตัวแปรมาตราส่วน
- จะใช้การทดสอบนัยสำคัญด้านเดียวหรือสองด้าน
- การออกแบบการศึกษากล่าวอีกนัยหนึ่งคือการศึกษา:
- สุ่มทดลองควบคุม
- การทดลองสุ่มคลัสเตอร์
- การวิจัยความเท่าเทียมกัน
- การศึกษาการแทรกแซงแบบไม่สุ่มตัวอย่าง
- การศึกษาเชิงสังเกต
- การศึกษาความชุก
- การศึกษาความไวและความจำเพาะของการทดสอบ
ซึ่งจะต้องตอบเป็นตัวเลข คำถามเพิ่มเติม:
- ข้อมูลที่จับคู่รวมอยู่ในการศึกษาหรือไม่?
- การศึกษาจะวัดตัวแปรเดียวกันซ้ำ ๆ ในบุคคลเดียวกันหรือไม่?
- กลุ่มที่รวมอยู่ในการศึกษามีขนาดเท่ากันหรือไม่?
- ข้อมูลมีลำดับชั้นหรือไม่?
ควรคำนึงว่าการศึกษาความแตกต่างหรือความสัมพันธ์แบบไม่สุ่มตัวอย่างมักต้องการขนาดตัวอย่างที่ใหญ่ขึ้นอย่างมีนัยสำคัญ เพื่อพิจารณาอิทธิพลของตัวแปรที่สามในการวิเคราะห์ ในเวลาเดียวกัน ผู้วิจัยสนใจในขนาดสัมบูรณ์ของกลุ่มตัวอย่าง ไม่ใช่เปอร์เซ็นต์ที่สร้างขึ้นจากประชากรทั้งหมด
คำศัพท์ทางสถิติใดที่ใช้อธิบายกระบวนการวางแผนขนาดกลุ่มตัวอย่าง
สมมติฐานว่างและทางเลือก
หลายประเภท การวิเคราะห์ทางสถิติมุ่งที่จะเปรียบเทียบสอง ประเภทของการรักษา, ขั้นตอนหรือกลุ่มผู้ป่วย. ค่าตัวเลขที่สรุปความแตกต่างที่น่าสนใจของผู้วิจัยเรียกว่าผลกระทบ ในการศึกษาอื่นๆ ผลกระทบอาจเป็นค่าสัมประสิทธิ์สหสัมพันธ์ อัตราต่อรอง หรือความเสี่ยงสัมพัทธ์ จากนั้นเราเสนอสมมติฐานว่างและสมมติฐานทางเลือก โดยปกติสมมติฐานว่างระบุว่าไม่มีผลกระทบ (ความแตกต่างระหว่างกลุ่มเป็นศูนย์ ความเสี่ยงสัมพัทธ์ เท่ากับหนึ่ง, สัมประสิทธิ์สหสัมพันธ์เป็นศูนย์) สมมติฐานทางเลือกแสดงให้เห็นว่ามีผลกระทบ
ความน่าจะเป็นด้านความเชื่อมั่น (p-score)
ค่า p คือความน่าจะเป็นของการสังเกตผลที่เหมือนกันหรือมากกว่าในการศึกษา โดยพิจารณาจากความถูกต้องของสมมติฐานว่าง มักจะแสดงเป็นสัดส่วน (เช่น p=0.03)
ระดับความสำคัญ
ระดับนัยสำคัญคือค่าขีดจำกัดสำหรับ p-score ด้านล่าง ซึ่งต้องปฏิเสธสมมติฐานว่าง และสรุปได้ว่ามีหลักฐานของผลกระทบ โดยปกติ ระดับนัยสำคัญถูกกำหนดไว้ที่ค่า 5% (ระดับนัยสำคัญ แม้ว่าจะมีความสัมพันธ์โดยตรงกับคะแนน p จะแสดงเป็นเปอร์เซ็นต์: ระดับนัยสำคัญ 5% เทียบเท่ากับ p=0.05) หากค่าที่สังเกตได้น้อยกว่า 5% มีโอกาสเล็กน้อยที่การศึกษาจะได้รับผลลัพธ์ดังกล่าวหากไม่มีผลกระทบที่แท้จริง ดังนั้นจึงยอมรับสมมติฐานของการมีอยู่ของผลกระทบ
ระดับนัยสำคัญที่ 5% ยังหมายความว่ามีโอกาสเกือบ 5% ที่จะสรุปได้ว่ามีผลกระทบ โดยที่จริงแล้วไม่มีเลย บางครั้งก็เหมาะสมกว่าที่จะใช้ระดับนัยสำคัญ 1% โดยเฉพาะอย่างยิ่งหากเป็นสิ่งสำคัญมากที่จะหลีกเลี่ยงการสรุปว่าผลกระทบนั้นมีอยู่ทั้งๆ ที่จริงแล้วไม่มี
พลัง
กำลังคือความน่าจะเป็นที่ สมมติฐานว่างจะถูกปฏิเสธอย่างเพียงพอ กล่าวอีกนัยหนึ่ง เมื่อมีข้อพิสูจน์ถึงความแตกต่างหรือความสัมพันธ์ที่แท้จริง ถือได้ว่าเป็น "100 เปอร์เซ็นต์ ลบโอกาสที่จะพลาดผลที่แท้จริง" ดังนั้น ยิ่งพลังสูงเท่าไหร่ก็ยิ่งมีโอกาสพลาดผลกระทบที่แท้จริงน้อยลงเท่านั้น พลังงานมักจะคงที่ที่ 80%, 90% หรือ 95% กำลังไฟฟ้าไม่ควรต่ำกว่า 80% หากจำเป็นอย่างยิ่งที่การศึกษาจะต้องไม่พลาดผลกระทบที่มีอยู่ เราควรมุ่งเป้าไปที่พลัง 90% หรือมากกว่า
ขนาดผลที่สำคัญทางคลินิก
นี่คือความแตกต่างที่เล็กที่สุดระหว่างค่าเฉลี่ยของกลุ่มหรือเปอร์เซ็นต์ของเหตุการณ์ภายใน (อัตราต่อรองที่ใกล้เคียงที่สุดกับความเสี่ยงในการรวมกันเป็นหนึ่ง) ที่ยังคงถือว่ามีนัยสำคัญทางชีววิทยาหรือทางคลินิก ขนาดกลุ่มตัวอย่างควรเป็นแบบที่ว่า หากมีความแตกต่างดังกล่าว การศึกษาจะให้ผลลัพธ์ที่มีนัยสำคัญทางสถิติ
การทดสอบนัยสำคัญด้านเดียวหรือสองด้าน
ในการทดสอบแบบสองด้าน สมมติฐานว่างคือไม่มีความแตกต่าง และสมมติฐานทางเลือกคือความแตกต่างระหว่างกลุ่มสามารถไปในทิศทางใดทิศทางหนึ่งได้ ในการทดสอบแบบด้านเดียว สมมติฐานทางเลือกจะกำหนดทิศทางที่ตั้งใจไว้ของความแตกต่าง เช่น การรักษานั้นดีกว่ายาหลอก และสมมติฐานที่เป็นโมฆะรวมถึงสถานการณ์ที่ผลของยาและยาหลอกเหมือนกันและผลลัพธ์ของยาเป็นอย่างไร ในผลลัพธ์ที่เลวร้ายยิ่งกว่ายาหลอก
ถ้าไม่ เหตุสุดวิสัยเพื่อที่จะไม่ทำเช่นนี้ เราควรใช้สมมติฐานสองด้าน การคาดหวังว่าความแตกต่างจะไปในทิศทางเดียวหรืออย่างอื่นนั้นไม่เพียงพอที่จะใช้การทดสอบแบบทางเดียว นักวิจัยทางการแพทย์มักจะแปลกใจหากผลลัพธ์ไม่เป็นไปตามที่คาดหวัง บ่อยครั้งที่การค้นพบดังกล่าวมีผลที่ตามมามากกว่าไม่มีความแตกต่าง ดังนั้นจึงต้องมีการอธิบายอย่างเพียงพอ การทดสอบด้านเดียวไม่อนุญาตให้ทำเช่นนี้ สำหรับตัวอย่างสถานการณ์ที่อาจยอมรับการทดสอบแบบด้านเดียว โปรดดูที่ Bland and Altman (1994)
ตัวแปรใดที่ควรคำนึงถึงเมื่อคำนวณขนาดตัวอย่าง
การคำนวณขนาดกลุ่มตัวอย่างควรขึ้นอยู่กับการวิเคราะห์ตัวแปรผลลัพธ์หลักในการศึกษานี้
หากมีการรวมตัวแปรเพิ่มเติมในการศึกษาซึ่งถือว่ามีความสำคัญเช่นกัน ความสำคัญทางวิทยาศาสตร์ดังนั้นขนาดกลุ่มตัวอย่างควรเป็นเพื่อให้สามารถวิเคราะห์ตัวแปรเหล่านี้ได้อย่างเพียงพอ สำหรับสิ่งสำคัญทั้งหมด ทางวิทยาศาสตร์ควรดำเนินการตัวแปรและการคำนวณขนาดตัวอย่างที่นำเสนอ
เปอร์เซ็นต์ของการตอบสนองและการบัญชีการสูญเสียจากการเฝ้าระวัง
ขนาดตัวอย่างโดยประมาณระบุจำนวนผู้ป่วยในกลุ่มสุดท้ายที่วิเคราะห์เมื่อสิ้นสุดการศึกษา ดังนั้น จำนวนบุคคลที่ลงทะเบียนในการศึกษาควรเพิ่มขึ้นตามการตอบสนองที่คาดหวัง การสูญเสียการติดตาม ความล้มเหลวในการปฏิบัติตามโปรโตคอล และสาเหตุที่เป็นไปได้อื่นๆ สำหรับการสูญเสียอาสาสมัครที่ทดลอง ควรอธิบายความสัมพันธ์ระหว่างจำนวนผู้เข้าร่วมที่คาดไว้กับขนาดกลุ่มตัวอย่างที่จะเกิดขึ้นอย่างชัดเจน
การปฏิบัติตามวัตถุประสงค์ของการศึกษาและวิธีการวิเคราะห์ทางสถิติ
ควรประเมินความเพียงพอของขนาดกลุ่มตัวอย่างตามวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น หากเป้าหมายของการศึกษาคือการแสดงให้เห็นว่ายาชนิดใหม่ดีกว่ายาที่มีอยู่ จำเป็นต้องตรวจสอบให้แน่ใจว่าขนาดตัวอย่างสามารถตรวจจับความแตกต่างที่มีนัยสำคัญทางคลินิกระหว่างการรักษาทั้งสองได้ อย่างไรก็ตาม บางครั้งจำเป็นต้องแสดงให้เห็นว่ายาสองชนิดมีความเท่าเทียมกันทางคลินิก การศึกษาประเภทนี้มักเรียกว่าการทดสอบเทียบเท่าหรือ "เชิงลบ" ปัญหาขนาดตัวอย่างสำหรับการศึกษาเหล่านี้มีรายละเอียดอยู่ใน Pocock (1983) ขนาดตัวอย่างในการศึกษาที่มีวัตถุประสงค์เพื่อแสดงให้เห็นถึงความเท่าเทียมกันของยานั้นใหญ่กว่าในการศึกษาที่มุ่งระบุความแตกต่างในประสิทธิภาพ จำเป็นอย่างยิ่งที่จะต้องตรวจสอบให้แน่ใจว่าการคำนวณขนาดกลุ่มตัวอย่างเกี่ยวข้องกับเป้าหมายและวัตถุประสงค์ของการศึกษาวิจัย และอิงตามข้อมูลตัวแปรผลลัพธ์หลัก
ขนาดตัวอย่างควรเพียงพอสำหรับวิธีการวิเคราะห์ที่ใช้ในการศึกษา เนื่องจากทั้งขนาดตัวอย่างและการวิเคราะห์ขึ้นอยู่กับการออกแบบการศึกษาที่เลือก จำเป็นอย่างยิ่งที่จะต้องตรวจสอบให้แน่ใจว่าวิธีการวิเคราะห์ที่ต้องการและการคำนวณขนาดตัวอย่างสามารถทำงานร่วมกันได้
ตัวอย่างการคำนวณขนาดตัวอย่าง
หากการศึกษาที่ต้องการใช้การประมาณความถี่เดียว การเปรียบเทียบสองวิธี หรือการเปรียบเทียบความถี่สองความถี่ การคำนวณขนาดตัวอย่าง (โดยปกติ) ค่อนข้างง่าย และแสดงไว้ด้านล่าง อย่างไรก็ตาม เราขอแนะนำให้คุณปรึกษานักสถิติเกี่ยวกับการคำนวณขนาดตัวอย่างเสมอ
การประมาณความถี่เดียว
หมายเหตุ: สูตรด้านล่างขึ้นอยู่กับสิ่งที่เรียกว่า "โดยประมาณ การกระจายแบบปกติ" และไม่แนะนำให้ประมาณการความถี่ใกล้กับ 0 หรือ 1 (0: หรือ 100% เว้นแต่จะมีการวางแผนเพื่อสร้างตัวอย่างขนาดใหญ่มาก ในกรณีเช่นนี้ ควรใช้วิธีการ "ที่แน่นอน" สถานการณ์ที่คล้ายกันสามารถสังเกตได้เมื่อศึกษาความไวและความจำเพาะของวิธีการวินิจฉัยแบบใหม่ ซึ่งคาดว่าจะมีความถี่ใกล้เคียงกับ 1 (100%) ที่ กรณีนี้ควรปรึกษานักสถิติหรืออย่างน้อยควรใช้โปรแกรมคอมพิวเตอร์เฉพาะทาง
สถานการณ์จำลอง: ใช้แบบสอบถามทางไปรษณีย์เพื่อประเมินความชุกของปัญหาระบบทางเดินหายใจในผู้ป่วยโรคหอบหืดภายใต้การดูแลของแพทย์ การปฏิบัติทั่วไป(โทมัสและคณะ, 2001)
ข้อมูลที่จำเป็น:
- ตัวแปรผลลัพธ์หลัก = มีหรือไม่มีการหายใจล้มเหลว
- ความถี่ของการละเมิดโดยประมาณ = 30% (0.3)
- ความกว้างช่วงความเชื่อมั่นที่ต้องการ 95% = 10% (เช่น +/-5% หรือ 25% ถึง 35%)
สูตรสำหรับการประมาณขนาดกลุ่มตัวอย่างของความถี่เดียวคือ:
n=15.4*p*(1-p)/W2
โดยที่ n คือขนาดตัวอย่างที่ต้องการ p คือความถี่ที่คาดหวังของผลลัพธ์ (ในกรณีนี้คือ 0.3) และ W คือความกว้างของช่วงความเชื่อมั่น (ในกรณีนี้คือ 0.1)
แทนค่าลงในสูตรเราได้รับ:
n=15.4*0.3*(1-0.3)/0.1 2 =324
"เพื่อให้ได้ช่วงความเชื่อมั่น +/-5% รอบค่าประมาณความชุกที่ 30% จำเป็นต้องมีกลุ่มตัวอย่าง 324 คน เมื่อพิจารณาจากอัตราการตอบกลับ 70% ต่อข้อเสนอเพื่อเข้าร่วมในการศึกษานี้ จะมีการแจกจ่ายแบบสอบถาม 480 รายการ"
เปรียบเทียบสองความถี่
สถานการณ์สมมติ: มีการวางแผนการทดลองแบบสุ่มควบคุมด้วยยาหลอกเกี่ยวกับประสิทธิภาพของปัจจัยกระตุ้นอาณานิคมในการลดความเสี่ยงของภาวะติดเชื้อในทารกคลอดก่อนกำหนด การศึกษาก่อนหน้านี้แสดงให้เห็นว่าอุบัติการณ์ของภาวะติดเชื้อในเด็กเหล่านี้คือ 50% ภายใน 2 สัปดาห์หลังคลอด และนักวิจัยเชื่อว่าการลดความถี่นี้เป็น 34% จะมีนัยสำคัญทางคลินิก
ข้อมูลที่จำเป็น:
- ตัวแปรผลลัพธ์หลัก = มีหรือไม่มีภาวะติดเชื้อในทารกแรกเกิด 14 วันหลังคลอด (ให้การรักษาไม่เกิน 72 ชั่วโมงหลังคลอด) นี่คือตัวแปรเชิงคุณภาพที่แสดงด้วยความถี่
- ความแตกต่างที่มีนัยสำคัญ = 16% หรือ 0.16 (เช่น 50%-34%)
- ระดับความสำคัญ=5%
- อำนาจ=80%
- ทดสอบ=สองด้าน
สูตรคำนวณขนาดตัวอย่างเมื่อเปรียบเทียบสองความถี่คือ
n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2
โดยที่ n=ขนาดตัวอย่างสำหรับแต่ละกลุ่ม ( ขนาดโดยรวมมากเป็นสองเท่าของตัวอย่าง)
p 1 = ความถี่แรก - ในกรณีนี้ 0.50
p 2 = ความถี่ที่สอง - ในกรณีนี้ 0.34
p 1 -p 2 = ความแตกต่างที่มีนัยสำคัญทางคลินิก ในกรณีนี้ 0.16
ตารางค่าสำหรับ A และ B |
|
ระดับความสำคัญ |
|
พลัง |
|
แทนค่าลงในสูตรเราได้รับ:
n= 2 *[(0.5*0.5+(0.34*0.66)]/ 2 =146
ดังนั้นเราจึงได้รับจำนวนการสังเกตที่จำเป็นในแต่ละกลุ่ม ประชากรทั้งหมดตัวอย่างจะมีขนาดใหญ่เป็นสองเท่า กล่าวคือ 292 ลูก
คำอธิบายของผลลัพธ์ของการคำนวณขนาดตัวอย่างอาจมีลักษณะดังนี้:
"ตัวอย่างของทารกแรกเกิด 292 คน (146 ในกลุ่มการรักษาและกลุ่มยาหลอก) จะเพียงพอที่จะตรวจพบความแตกต่างของอัตราการติดเชื้อที่ 16% โดยมีกำลัง 80% ที่ระดับความเชื่อมั่น 5% ความแตกต่าง 16% เท่ากับความแตกต่างระหว่างการติดเชื้อ 50% อัตรา ณ วันที่ 14 ในกลุ่มยาหลอกและ 34% ในกลุ่มที่ได้รับการรักษา"
การเปรียบเทียบสองค่าเฉลี่ย
หมายเหตุ: การคำนวณด้านล่างจะใช้ได้เฉพาะเมื่อทั้งสองกลุ่มมีขนาดเท่ากัน
สถานการณ์สมมติ: การทดลองแบบสุ่มที่มีกลุ่มเปรียบเทียบเปรียบเทียบการรักษาทางจิตวิทยาในระยะสั้นกับการรักษาแบบเดิมเพื่อต่อสู้กับแนวโน้มการฆ่าตัวตายในผู้ป่วยที่เข้ารับการรักษาในโรงพยาบาลหลังจากมีการวางแผนพยายามฆ่าตัวตาย แนวโน้มการฆ่าตัวตายวัดโดยใช้มาตราส่วนเบ็ค ค่าเบี่ยงเบนมาตรฐานสำหรับคะแนนในระดับนี้คือ 7.7 (ข้อมูลจากการศึกษาก่อนหน้านี้) และความแตกต่าง 5 คะแนนในระดับ Beck ถือว่ามีนัยสำคัญทางคลินิก ผู้ป่วยมากถึงหนึ่งในสามคาดว่าจะออกจากกลุ่มการรักษา (Guthrie et al., 2001)
- ตัวแปรผลลัพธ์หลัก = Beck Suicidality Scale ตัวแปรต่อเนื่องที่อธิบายโดยวิธี
- ส่วนเบี่ยงเบนมาตรฐาน = 7.7 คะแนน
- ขนาดผลทางคลินิกที่สำคัญ = 5 คะแนน
- ระดับความสำคัญ=5%
- อำนาจ=80%
- ทดสอบ=สองด้าน
สูตรคำนวณขนาดกลุ่มตัวอย่างเมื่อเปรียบเทียบวิธีการทั้งสองมีดังต่อไปนี้
n= 2 *2*SD 2 /DIFF 2
โดยที่ n=ขนาดตัวอย่างสำหรับแต่ละกลุ่ม (ขนาดตัวอย่างทั้งหมดมีขนาดใหญ่เป็นสองเท่า)
SD= ส่วนเบี่ยงเบนมาตรฐานสำหรับตัวแปรผลลัพธ์หลัก ในกรณีนี้ 7.7
DIFF=ผลกระทบที่สำคัญทางคลินิก ในกรณีนี้ 5.0
A - ขึ้นอยู่กับระดับความสำคัญ (ดูตาราง) - ในกรณีนี้ 1.96
B - ขึ้นอยู่กับพลังงาน (ดูตาราง) - ในกรณีนี้ 0.84
ตารางค่าสำหรับ A และ B |
|
ระดับความสำคัญ |
|
พลัง |
|
ทดแทน ค่าที่จำเป็นในสูตรที่เราได้รับ:
n= 2 *2*7.7 2 /5.0 2 =38
ดังนั้นเราจึงได้รับจำนวนการสังเกตที่จำเป็นในแต่ละกลุ่ม ขนาดกลุ่มตัวอย่างทั้งหมดจะใหญ่เป็นสองเท่า กล่าวคือ 76 คน.
คำอธิบายที่เพียงพอของการประมาณขนาดกลุ่มตัวอย่างจะเป็นดังนี้:
"ในการตรวจสอบความแตกต่าง 5 จุดบนมาตรวัดแนวโน้มการฆ่าตัวตายของเบ็คที่ระดับนัยสำคัญ 5% โดยมีกำลัง 80% โดยถือว่าส่วนเบี่ยงเบนมาตรฐาน 7.7 คะแนน จะต้องมี 38 คนในกลุ่มแทรกแซงและควบคุม จำนวนนี้เพิ่มขึ้นเป็น 60 ในกลุ่ม ( ทั้งหมดข้อสังเกต 120) เพื่อชดเชยการสูญเสียการสังเกตซึ่งมักจะประมาณหนึ่งในสามของวิชา "
ตัวอย่างคำอธิบายไม่เพียงพอของขนาดตัวอย่างโดยประมาณที่ต้องการ
ตัวอย่างที่ 1
"การศึกษาก่อนหน้านี้ในพื้นที่นี้ใช้กลุ่มตัวอย่าง 150 คน และได้รับผลลัพธ์ที่น่าเชื่อถือสูง (p = 0.014) ดังนั้นจึงรวมผู้ป่วยจำนวนใกล้เคียงกันในการศึกษานี้"
การศึกษาก่อนหน้านี้อาจเป็นเพียง "โชคดี" ในแง่ที่ว่าผลลัพธ์ที่มีนัยสำคัญที่พบเกิดจากการแปรผันแบบสุ่มในค่าเฉลี่ยของกลุ่มตัวอย่าง ต้องคำนวณขนาดตัวอย่างสำหรับ การศึกษานี้- รวมถึงรายละเอียดต่างๆ เช่น กำลังศึกษา ระดับนัยสำคัญ ตัวแปรหลักที่ศึกษา ขนาดผลที่มีนัยสำคัญทางคลินิก ส่วนเบี่ยงเบนมาตรฐาน (สำหรับตัวแปรเชิงปริมาณ) และขนาดของแต่ละกลุ่มหากมีหลายกลุ่มในการศึกษา
ตัวอย่าง 2
"ไม่ได้คำนวณขนาดกลุ่มตัวอย่างเพราะไม่มีข้อมูลเบื้องต้นในการประมาณการ"
ควรทบทวนวรรณกรรมอย่างรอบคอบเพื่อค้นหาข้อมูลที่จำเป็นในการคำนวณขนาดกลุ่มตัวอย่าง หากไม่มีข้อมูลนี้ สามารถจัดการศึกษาเบื้องต้นเล็กๆ เพื่อรวบรวมข้อมูลนี้ได้
หากไม่มีข้อมูลเกี่ยวกับค่า ส่วนเบี่ยงเบนมาตรฐาน, สามารถคำนวณขนาดตัวอย่างเพิ่มเติมได้ ปริทัศน์ตัวอย่างเช่น ความแตกต่างที่มีประสิทธิผลทางคลินิกอาจไม่อธิบายไว้ใน ค่าสัมบูรณ์แต่ในหน่วยของส่วนเบี่ยงเบนมาตรฐาน
อย่างไรก็ตาม หากมีการเขียนข้อเสนอทุนสนับสนุนสำหรับการศึกษานำร่องเพื่อรวบรวมข้อมูลที่จำเป็นในการคำนวณขนาดตัวอย่างของการศึกษาขนาดใหญ่ที่ตามมา จะไม่มีการคำนวณขนาดตัวอย่างในข้อเสนอดังกล่าว
"คลินิกรับผู้ป่วยโรคนี้ 50 รายในระหว่างปี ประมาณ 10% ของพวกเขาอาจปฏิเสธที่จะเข้าร่วมในการศึกษาวิจัย ดังนั้นภายในสองปีจึงจะสามารถคัดเลือกตัวอย่างได้ 90 คน"
แม้ว่าการศึกษาส่วนใหญ่จะต้องสร้างสมดุลระหว่างการออกแบบกับกำลัง แต่ไม่ควรกำหนดขนาดกลุ่มตัวอย่างโดยพิจารณาจากจำนวนผู้ป่วยที่มีอยู่สำหรับการศึกษาเพียงอย่างเดียว
ในสถานการณ์ที่จำนวนผู้ป่วยเป็นปัจจัยจำกัดในขนาดตัวอย่าง ควรทำการคำนวณเพื่อสร้าง a) พลังของการศึกษาที่มีผู้ป่วยจำนวนหนึ่งๆ เทียบกับความแตกต่างที่สำคัญทางคลินิก หรือ b) ขนาดของผลกระทบ ที่หาได้จากการศึกษาขนาดที่กำหนด (โดยพิจารณาจากกำลังของมัน)
ในกรณีที่จำนวนผู้ป่วยที่มีอยู่มีน้อยเกินไปที่จะตรวจพบความแตกต่างที่เกี่ยวข้องทางคลินิก อาจมีการพิจารณาเพื่อขยายระยะเวลาของการศึกษาหรือดำเนินการทดลองแบบหลายศูนย์ร่วมกับผู้วิจัยหลายคน
วรรณกรรม
- อัลท์แมน ดีจี (1991) สถิติเชิงปฏิบัติสำหรับการวิจัยทางการแพทย์. แชปแมนแอนด์ฮอลล์ ลอนดอน
- Armitage P, Berry G, Matthews JNS. (2545) วิธีสถิติในการวิจัยทางการแพทย์ ครั้งที่ 4 แบล็กเวลล์, อ็อกซ์ฟอร์ด.
- Bland JM และ Altman DG (1994). การทดสอบนัยสำคัญแบบหนึ่งและสองด้าน วารสารการแพทย์อังกฤษ 309 248
- Bland M. (2000) สถิติทางการแพทย์เบื้องต้น, 3rd. เอ็ด สำนักพิมพ์มหาวิทยาลัยอ็อกซ์ฟอร์ด, อ็อกซ์ฟอร์ด
- อีแลชอฟ เจดี (2000) คู่มือผู้ใช้ nQuery Advisor เวอร์ชัน 4.0 ลอสแองเจลิส แคลิฟอร์เนีย
- Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) การทดลองแบบสุ่มควบคุมของการแทรกแซงทางจิตวิทยาสั้น ๆ หลังจาก พิษภัยโดยเจตนา วารสารการแพทย์อังกฤษ 323, 135-138.
- Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (2539) ความเพียงพอของขนาดตัวอย่างในการศึกษาสุขภาพ จอห์น ไวลีย์ แอนด์ ซันส์, ชิเชสเตอร์
- Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) ตารางสถิติสำหรับการออกแบบการศึกษาทางคลินิก, Second Edition Blackwell, Oxford
- โพค็อก เอสเจ (1983) การทดลองทางคลินิก: แนวทางปฏิบัติ John Wiley and Sons, ชิเชสเตอร์
- Thomas M, McKinley RK, Freeman E, Foy C. (2001) ความชุกของการหายใจผิดปกติในผู้ป่วยที่รักษาโรคหอบหืดในการดูแลเบื้องต้น: การสำรวจแบบตัดขวาง วารสารการแพทย์อังกฤษ 322, 1098-1100.
- Whitehead, J. (1997) การออกแบบและการวิเคราะห์การทดลองทางคลินิกตามลำดับ, แก้ไขครั้งที่ 2 เอ็ด ชิเชสเตอร์, ไวลีย์.
เครื่องคิดเลข
ประชากร
จำนวนวัตถุสังเกตการณ์ทั้งหมด (คน ครัวเรือน สถานประกอบการ การตั้งถิ่นฐานฯลฯ) ซึ่งมีลักษณะเฉพาะบางอย่าง (เพศ อายุ รายได้ จำนวน ผลประกอบการ ฯลฯ) ที่จำกัดในด้านพื้นที่และเวลา ตัวอย่างของประชากร: - ผู้อยู่อาศัยทั้งหมดในมอสโก (10.6 ล้านคนตามสำมะโน 2545) - ชาวมอสโก (4.9 ล้านคนตามการสำรวจสำมะโนประชากร 2545) - นิติบุคคลรัสเซีย (2.2 ล้านเมื่อต้นปี 2548) - ร้านค้าปลีกที่จำหน่ายผลิตภัณฑ์อาหาร (20,000 เมื่อต้นปี 2551) เป็นต้น
ตัวอย่าง (กลุ่มตัวอย่าง)
ส่วนหนึ่งของวัตถุจากประชากรที่เลือกเพื่อการศึกษาเพื่อสรุปเกี่ยวกับประชากรทั้งหมด เพื่อให้ข้อสรุปที่ได้จากการศึกษาตัวอย่างขยายไปสู่ประชากรทั้งหมด กลุ่มตัวอย่างต้องมีคุณสมบัติเป็นตัวแทน
ตัวแทนตัวอย่าง
คุณสมบัติของกลุ่มตัวอย่างที่สะท้อนถึงประชากรทั่วไปได้อย่างถูกต้อง กลุ่มตัวอย่างเดียวกันอาจใช่หรือไม่ใช่ตัวแทนของประชากรที่แตกต่างกัน ตัวอย่าง: - กลุ่มตัวอย่างที่ประกอบด้วยชาวมอสโกทั้งหมดที่มีรถยนต์เป็นของตนเองไม่ได้เป็นตัวแทนของประชากรทั้งหมดของมอสโก - ตัวอย่างวิสาหกิจของรัสเซียไม่เกิน 100 คนไม่ได้เป็นตัวแทนของวิสาหกิจทั้งหมดในรัสเซีย - กลุ่มตัวอย่างชาวมอสโกที่ซื้อของในตลาดไม่ได้แสดงถึงพฤติกรรมการซื้อของชาวมอสโกทั้งหมด ในขณะเดียวกัน ตัวอย่างเหล่านี้ (ขึ้นอยู่กับปัจจัยอื่นๆ เงื่อนไข) สามารถเป็นตัวแทนของ Muscovites ได้อย่างสมบูรณ์แบบ - เจ้าของรถ บริษัท รัสเซียขนาดเล็กและขนาดกลางและผู้ซื้อที่ซื้อของในตลาด ตามลำดับ สิ่งสำคัญคือต้องเข้าใจว่าการเป็นตัวแทนตัวอย่างและข้อผิดพลาดในการสุ่มตัวอย่างเป็นปรากฏการณ์ที่แตกต่างกัน ความเป็นตัวแทนซึ่งแตกต่างจากข้อผิดพลาดไม่ได้ขึ้นอยู่กับขนาดกลุ่มตัวอย่างแต่อย่างใด ตัวอย่าง: ไม่ว่าเราจะเพิ่มจำนวนเจ้าของรถ Muscovites ที่ถูกสัมภาษณ์มากแค่ไหนก็ตาม
ข้อผิดพลาดในการสุ่มตัวอย่าง (ช่วงความเชื่อมั่น)
การปฏิเสธผลลัพธ์ที่ได้รับโดยใช้ การสังเกตแบบคัดเลือกจากข้อมูลจริงของประชากรทั่วไป ข้อผิดพลาดในการสุ่มตัวอย่างมี 2 ประเภท คือ ทางสถิติและเชิงระบบ ข้อผิดพลาดทางสถิติขึ้นอยู่กับขนาดกลุ่มตัวอย่าง ยิ่งขนาดกลุ่มตัวอย่างมากเท่าใด ก็ยิ่งต่ำเท่านั้น ตัวอย่าง: แบบง่าย สุ่มตัวอย่างด้วยขนาด 400 หน่วย ข้อผิดพลาดทางสถิติสูงสุด (ด้วยความน่าจะเป็นของความเชื่อมั่น 95%) คือ 5% สำหรับตัวอย่าง 600 หน่วย - 4% สำหรับตัวอย่าง 1100 หน่วย - 3% จาก ปัจจัยต่างๆที่มีผลกระทบถาวรต่อการศึกษาและอคติต่อผลการศึกษาไปในทิศทางใดทิศทางหนึ่ง ภาพที่ใช้งานชีวิต. สิ่งนี้เกิดขึ้นเนื่องจากการหาบุคคลดังกล่าวในสถานที่ใดที่หนึ่งได้ยากกว่ามาก (เช่น ที่บ้าน) 80%) ในบางกรณี เมื่อทราบการแจกแจงที่แท้จริง ผิดพลาดอย่างเป็นระบบสามารถปรับระดับได้โดยการแนะนำโควต้าหรือการถ่วงน้ำหนักข้อมูลใหม่ แต่ในการศึกษาจริงส่วนใหญ่ การประเมินก็อาจเป็นปัญหาค่อนข้างมาก
ประเภทตัวอย่าง
ตัวอย่างแบ่งออกเป็นสองประเภท:
- ความน่าจะเป็น
- ความเป็นไปไม่ได้
1. ตัวอย่างความน่าจะเป็น
1.1 การสุ่มตัวอย่าง (การเลือกสุ่มอย่างง่าย)
ตัวอย่างดังกล่าวถือว่าความเป็นเนื้อเดียวกันของประชากรทั่วไป ความน่าจะเป็นเท่ากันของการมีอยู่ขององค์ประกอบทั้งหมด การมีอยู่ รายการทั้งหมดองค์ประกอบทั้งหมด เมื่อเลือกองค์ประกอบตามกฎแล้วจะใช้ตารางตัวเลขสุ่ม
1.2 การสุ่มตัวอย่างทางกล (อย่างเป็นระบบ)
ตัวอย่างแบบสุ่ม จัดเรียงตามคุณลักษณะบางอย่าง (ลำดับตามตัวอักษร หมายเลขโทรศัพท์ วันเดือนปีเกิด ฯลฯ) องค์ประกอบแรกจะถูกเลือกแบบสุ่ม จากนั้นทุกองค์ประกอบ 'k' จะถูกเลือกโดยเพิ่มขึ้นทีละ 'n' ขนาดของประชากรทั่วไป ในขณะที่ - N=n*k
1.3 แบ่งชั้น (แบ่งโซน)
ใช้ในกรณีที่มีความหลากหลายของประชากรทั่วไป ประชากรแบ่งออกเป็นกลุ่ม (ชั้น) ในแต่ละชั้น การคัดเลือกจะดำเนินการแบบสุ่มหรือโดยกลไก
1.4 การสุ่มตัวอย่างแบบอนุกรม (แบบซ้อนหรือแบบคลัสเตอร์)
ที่ การสุ่มตัวอย่างแบบอนุกรมหน่วยของการเลือกไม่ใช่วัตถุ แต่เป็นกลุ่ม (คลัสเตอร์หรือรัง) กลุ่มจะถูกสุ่มเลือก วัตถุภายในกลุ่มจะถูกสำรวจไปทั่ว
2. ตัวอย่างที่เหลือเชื่อ
การคัดเลือกในตัวอย่างดังกล่าวไม่ได้ดำเนินการตามหลักการของโอกาส แต่เป็นไปตามเกณฑ์ส่วนตัว - การเข้าถึง ความธรรมดา การเป็นตัวแทนที่เท่าเทียมกัน ฯลฯ
2.1. การสุ่มตัวอย่างโควต้า
เริ่มแรกมีการจัดสรรกลุ่มวัตถุจำนวนหนึ่ง (เช่นผู้ชายอายุ 20-30 ปี, 31-45 ปีและ 46-60 ปี; บุคคลที่มีรายได้สูงถึง 30,000 rubles โดยมีรายได้ 30 ถึง 60 พันรูเบิลและมีรายได้มากกว่า 60,000 รูเบิล ) สำหรับแต่ละกลุ่มจะระบุจำนวนวัตถุที่จะสำรวจ จำนวนของอ็อบเจ็กต์ที่ควรอยู่ในแต่ละกลุ่มถูกกำหนด ส่วนใหญ่มักจะเป็นสัดส่วนกับส่วนแบ่งที่รู้จักก่อนหน้านี้ของกลุ่มในประชากรทั่วไป หรือเท่ากันสำหรับแต่ละกลุ่ม ภายในกลุ่ม วัตถุจะถูกสุ่มเลือก ตัวอย่างโควต้ามักใช้ในการวิจัยการตลาด
2.2. วิธีสโนว์บอล
สร้างตัวอย่างได้ดังนี้ ขอให้ผู้ตอบแต่ละคนโดยเริ่มจากคนแรก ให้ติดต่อเพื่อน เพื่อนร่วมงาน คนรู้จัก ที่จะเข้าเงื่อนไขการคัดเลือกและสามารถมีส่วนร่วมในการศึกษาวิจัยได้ ดังนั้น ยกเว้นขั้นตอนแรก ตัวอย่างถูกสร้างขึ้นด้วยการมีส่วนร่วมของวัตถุที่ศึกษาด้วยตนเอง วิธีนี้มักใช้เมื่อจำเป็นต้องค้นหาและสัมภาษณ์กลุ่มผู้ตอบแบบสอบถามที่เข้าถึงยาก (เช่น ผู้ตอบแบบสอบถามที่มีรายได้สูง ผู้ตอบแบบสอบถามที่อยู่ในกลุ่มอาชีพเดียวกัน ผู้ตอบแบบสำรวจที่มีงานอดิเรก/ความสนใจคล้ายกัน เป็นต้น )
2.3 การสุ่มตัวอย่างที่เกิดขึ้นเอง
ผู้ตอบแบบสำรวจที่เข้าถึงได้มากที่สุดจะถูกสำรวจ ตัวอย่างทั่วไปตัวอย่างที่เกิดขึ้นเอง - แบบสำรวจในหนังสือพิมพ์ / นิตยสาร แบบสอบถามที่มอบให้ผู้ตอบแบบสำรวจด้วยตนเอง แบบสำรวจทางอินเทอร์เน็ตส่วนใหญ่ ขนาดและองค์ประกอบของตัวอย่างที่เกิดขึ้นเองไม่ทราบล่วงหน้าและถูกกำหนดโดยพารามิเตอร์เดียวเท่านั้น - กิจกรรมของผู้ตอบแบบสอบถาม
2.4 ตัวอย่างกรณีทั่วไป
หน่วยของประชากรทั่วไปถูกเลือกโดยมีค่าเฉลี่ย (ทั่วไป) ของแอตทริบิวต์ ทำให้เกิดปัญหาในการเลือกคุณลักษณะและกำหนดค่าทั่วไป
เครื่องคำนวณข้อผิดพลาดและขนาดตัวอย่าง
(สำหรับตัวอย่างสุ่มอย่างง่าย)
คำอธิบายสำหรับฟิลด์:
ความมั่นใจ ความน่าจะเป็น
ความน่าจะเป็นที่ช่วงความเชื่อมั่นครอบคลุมค่าที่ไม่รู้จัก มูลค่าที่แท้จริงพารามิเตอร์ที่ประเมินจากข้อมูลตัวอย่าง ในทางปฏิบัติการวิจัย ระดับความมั่นใจ 95% มักใช้บ่อยที่สุด
ข้อผิดพลาดในการสุ่มตัวอย่าง (ช่วงความเชื่อมั่น)
ช่วงเวลาที่คำนวณจากข้อมูลตัวอย่างที่มีความน่าจะเป็นที่กำหนด (ความมั่นใจ) ครอบคลุมค่าจริงที่ไม่รู้จักของพารามิเตอร์การกระจายโดยประมาณ
การแชร์คุณสมบัติ
ส่วนแบ่งที่คาดหวังของคุณลักษณะที่มีการคำนวณข้อผิดพลาด หากไม่มีข้อมูลเกี่ยวกับส่วนแบ่งของคุณลักษณะ จำเป็นต้องใช้ค่าเท่ากับ 50 ซึ่งจะมีข้อผิดพลาดสูงสุด
องค์ประกอบหลักอย่างหนึ่งของการศึกษาที่ออกแบบมาอย่างดีคือคำจำกัดความของกลุ่มตัวอย่างและกลุ่มตัวอย่างคืออะไร มันเหมือนกับตัวอย่างเค้ก ท้ายที่สุดไม่จำเป็นต้องกินของหวานทั้งหมดเพื่อทำความเข้าใจรสชาติของมัน? ส่วนเล็ก ๆ ก็เพียงพอแล้ว
ดังนั้นเค้กคือ ประชากร (กล่าวคือ ผู้ตอบแบบสอบถามทุกคนที่มีคุณสมบัติตามแบบสำรวจ) สามารถแสดงออกได้ทางอาณาเขตเช่นเฉพาะผู้ที่อาศัยอยู่ในภูมิภาคมอสโกเท่านั้น เพศ - ผู้หญิงเท่านั้น หรือมีข้อ จำกัด ด้านอายุ - รัสเซียมีอายุมากกว่า 65 ปี
การคำนวณประชากรเป็นเรื่องยาก คุณต้องมีข้อมูลจากการสำรวจสำมะโนประชากรหรือแบบสำรวจการประเมินเบื้องต้น ดังนั้น โดยปกติประชากรทั่วไปจะถูก "ประมาณ" และจากจำนวนผลลัพธ์ที่พวกเขาคำนวณ กรอบตัวอย่าง หรือ การสุ่มตัวอย่าง.
ตัวอย่างตัวแทนคืออะไร?
ตัวอย่างเป็นจำนวนผู้ตอบแบบสอบถามที่ชัดเจน โครงสร้างควรตรงกับโครงสร้างของประชากรทั่วไปมากที่สุดในแง่ของลักษณะสำคัญของการคัดเลือก
ตัวอย่างเช่น หากผู้ที่อาจเป็นผู้ตอบแบบสอบถามคือประชากรทั้งหมดของรัสเซีย โดยที่ 54% เป็นผู้หญิงและ 46% เป็นผู้ชาย กลุ่มตัวอย่างควรมีเนื้อหาที่เหมือนกันทุกประการ เปอร์เซ็นต์. หากพารามิเตอร์ตรงกัน ตัวอย่างสามารถเรียกได้ว่าเป็นตัวแทน ซึ่งหมายความว่าความไม่ถูกต้องและข้อผิดพลาดในการศึกษาจะลดลง
ขนาดตัวอย่างถูกกำหนดโดยคำนึงถึงข้อกำหนดของความถูกต้องและความประหยัด ข้อกำหนดเหล่านี้เป็นสัดส่วนผกผันซึ่งกันและกัน: ยิ่งขนาดตัวอย่างใหญ่ ผลลัพธ์ที่แม่นยำยิ่งขึ้น. ยิ่งไปกว่านั้น ยิ่งมีความแม่นยำสูงเท่าใด ก็ยิ่งต้องใช้ค่าใช้จ่ายในการศึกษามากขึ้นเท่านั้น และในทางกลับกัน ยิ่งกลุ่มตัวอย่างมีขนาดเล็กเท่าใด ต้นทุนก็จะยิ่งต่ำลง คุณสมบัติของประชากรทั่วไปก็จะยิ่งมีความเที่ยงตรงน้อยลงและสุ่มมากขึ้น
ดังนั้นในการคำนวณจำนวนทางเลือกนักสังคมวิทยาจึงคิดค้นสูตรและสร้างขึ้น เครื่องคิดเลขพิเศษ:
ความมั่นใจ ความน่าจะเป็นและ ความผิดพลาดของความมั่นใจ
เงื่อนไขอะไร " ระดับความเชื่อมั่น" และ " ความผิดพลาดของความมั่นใจ"? ระดับความเชื่อมั่นเป็นตัววัดความถูกต้องของการวัด และความผิดพลาดของความมั่นใจคือ ข้อผิดพลาดที่เป็นไปได้ผลการวิจัย ตัวอย่างเช่น ด้วยประชากรทั่วไปมากกว่า 500,000 คน (เช่น อาศัยอยู่ในโนโวคุซเนตสค์) กลุ่มตัวอย่างจะเป็น 384 คน โดยมี ระดับความเชื่อมั่น 95% และข้อผิดพลาด 5% หรือ (ด้วย ช่วงความมั่นใจ 95±5%).
อะไรต่อจากนี้? เมื่อทำการศึกษา 100 ตัวอย่างกับกลุ่มตัวอย่างดังกล่าว (384 คน) ใน 95 เปอร์เซ็นต์ของกรณี คำตอบที่ได้รับตามกฎหมายของสถิติจะอยู่ภายใน ± 5% ของต้นฉบับ แล้วเราจะได้ ตัวอย่างตัวแทนที่มีความน่าจะเป็นน้อยที่สุดของข้อผิดพลาดทางสถิติ
หลังจากคำนวณขนาดตัวอย่างเสร็จแล้ว คุณสามารถดูได้ว่ามีผู้ตอบแบบสอบถามเพียงพอในแผงแบบสอบถามรุ่นสาธิตหรือไม่ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับวิธีการทำการสำรวจความคิดเห็น
เมื่อคุณถามคำถามว่า "ฉันต้องการผู้ตอบแบบสำรวจกี่คน" คุณกำลังถามจริงๆ ว่า "กลุ่มตัวอย่างของฉันต้องมีขนาดใหญ่แค่ไหนจึงจะสามารถประมาณจำนวนประชากรได้อย่างแม่นยำ" ด้วยความซับซ้อนของแนวคิดเหล่านี้ เราได้แบ่งกระบวนการออกเป็น 5 ขั้นตอน ทำให้ง่ายต่อการคำนวณขนาดตัวอย่างในอุดมคติของคุณและรับรองความถูกต้องของผลการสำรวจของคุณ
5 ขั้นตอนเพื่อให้แน่ใจว่ากลุ่มตัวอย่างของคุณประมาณประชากรได้อย่างแม่นยำ:
ขั้นตอนที่ 1
ประชากรทั่วไปของคุณคืออะไร?
โดยคำว่า "ประชากรทั่วไป" เราหมายถึงกลุ่มคนทั้งกลุ่มที่คุณกำลังจะถามความคิดเห็น (กลุ่มตัวอย่างจะประกอบด้วยสมาชิกของประชากรกลุ่มนี้ที่จะมีส่วนร่วมในการสำรวจจริงๆ)
ตัวอย่างเช่น หากคุณต้องการเข้าใจวิธีการหาตลาดยาสีฟันในฝรั่งเศส ประชากรของคุณจะเป็นคนฝรั่งเศส และถ้าคุณกำลังพยายามกำหนดวันลาพักร้อนที่คนทำงานในบริษัทยาสีฟันอยากได้ ประชากรของคุณก็คือพนักงานของบริษัทนั้น
ไม่ว่าจะเป็นประเทศหรือบริษัท การสร้างประชากรเป็นขั้นตอนแรกที่สำคัญ เมื่อคุณได้ตัดสินใจเกี่ยวกับจำนวนประชากรแล้ว ให้กำหนด (โดยประมาณ) ขนาดของประชากร ตัวอย่างเช่น ฝรั่งเศสมีประชากรประมาณ 65 ล้านคน แต่บริษัทยาสีฟันน่าจะมีพนักงานน้อยกว่ามาก
คุณได้รับหมายเลขที่ถูกต้องหรือไม่? โอเค งั้นเราไปกันเลย...
ขั้นตอนที่ 2
ความแม่นยำที่ต้องการคืออะไร?
ขั้นตอนนี้เป็นการประเมินความเสี่ยงที่คุณยินดีรับความเสี่ยงเกี่ยวกับความเป็นไปได้ของการตอบแบบสำรวจที่ไม่ถูกต้อง เนื่องจากคุณไม่ได้สำรวจประชากรทั้งหมด ดังนั้นคุณควรตอบคำถามสองข้อ:
- คุณต้องการความมั่นใจเพียงใดที่คำตอบที่คุณได้รับสะท้อนความคิดเห็นของประชากรทั่วไป
นี่คือระยะขอบของข้อผิดพลาด สมมติว่า 90% ของกลุ่มตัวอย่างชอบหมากฝรั่งรสองุ่น ขอบของข้อผิดพลาด 5% บวก 5% ในแต่ละด้านของตัวเลขนั้น หมายความว่าจริง ๆ แล้ว 85-95% ของกลุ่มตัวอย่างชอบหมากฝรั่งรสองุ่น 5% คือส่วนต่างของข้อผิดพลาดที่ใช้บ่อยที่สุด แต่คุณสามารถตั้งค่าให้อยู่ระหว่าง 1% ถึง 10% ขึ้นอยู่กับแบบสำรวจ ไม่แนะนำให้เพิ่มตัวเลขนี้เกินกว่า 10% - คุณต้องการความมั่นใจเพียงใดที่กลุ่มตัวอย่างจะเป็นตัวแทนของประชากรได้อย่างแม่นยำ
นี่คือระดับความไว้วางใจของคุณ ระดับความเชื่อมั่นคือความน่าจะเป็นที่กลุ่มตัวอย่างมีนัยสำคัญสำหรับผลลัพธ์ที่ได้ การคำนวณมักจะทำดังนี้ หากคุณสุ่มเลือกกลุ่มตัวอย่างอีก 30 ตัวอย่างจากประชากรกลุ่มนี้ ผลลัพธ์ของคุณสำหรับตัวอย่างหนึ่งจะแตกต่างอย่างมากจากผลลัพธ์สำหรับอีก 30 ตัวอย่างมากน้อยเพียงใด ระดับความมั่นใจ 95% หมายความว่า 95% ของเวลาที่ผลลัพธ์จะตรงกัน 95% เป็นค่าที่ใช้บ่อยที่สุด แต่คุณสามารถตั้งค่าเป็น 90% หรือ 99% ขึ้นอยู่กับโพล ไม่แนะนำให้ลดค่าระดับความเชื่อมั่นต่ำกว่า 90%
ขั้นตอนที่ 3
ฉันต้องการตัวอย่างขนาดใด
ในตารางด้านล่าง ให้เลือกขนาดประชากรเป้าหมายโดยประมาณและส่วนต่างของข้อผิดพลาดเพื่อกำหนดจำนวนการสัมภาษณ์ที่ต้องการ
ตอนนี้คุณมีค่า stride 1 และ stride 2 แล้ว ให้ใช้ตารางที่มีประโยชน์ด้านล่างเพื่อกำหนดขนาดของตัวอย่างที่ต้องการ...
ประชากร | ขอบของข้อผิดพลาด | ระดับความน่าเชื่อถือ | ||||
---|---|---|---|---|---|---|
10% | 5% | 1% | 90% | 95% | 99% | |
100 | 50 | 80 | 99 | 74 | 80 | 88 |
500 | 81 | 218 | 476 | 176 | 218 | 286 |
1000 | 88 | 278 | 906 | 215 | 278 | 400 |
10 000 | 96 | 370 | 4900 | 264 | 370 | 623 |
100 000 | 96 | 383 | 8763 | 270 | 383 | 660 |
1 000 000+ | 97 | 384 | 9513 | 271 | 384 | 664 |
บันทึก. ข้อมูลมีไว้เพื่อเป็นแนวทางเท่านั้น นอกจากนี้ สำหรับประชากรที่มากกว่า 1 ล้านคน สามารถปัดเศษตัวเลขให้เป็นจำนวนเต็มร้อยที่ใกล้ที่สุดได้
ขั้นตอนที่ 4
ผู้คนจะตอบสนองอย่างไร?
ขออภัย ไม่ใช่ทุกคนที่คุณส่งแบบสำรวจให้จะได้รับคำตอบ
เปอร์เซ็นต์ของผู้ที่กรอกแบบสำรวจที่ได้รับจะเรียกว่า "อัตราการตอบกลับ" การระบุเปอร์เซ็นต์ของผู้ตอบแบบสำรวจจะช่วยให้คุณระบุได้ จำนวนทั้งหมดตัวอย่างแบบสำรวจที่ต้องส่งออกเพื่อรับคำตอบตามจำนวนที่ต้องการ
เปอร์เซ็นต์ของการตอบสนองโดยตรงขึ้นอยู่กับปัจจัยหลายประการ เช่น ความสัมพันธ์กับ กลุ่มเป้าหมายความยาวและความซับซ้อนของแบบสำรวจ สิ่งจูงใจที่เสนอ และหัวข้อของแบบสำรวจ สำหรับแบบสำรวจออนไลน์ที่ไม่เคยมีการสร้างความสัมพันธ์กับผู้รับมาก่อน เปอร์เซ็นต์อัตราการตอบสนอง 20-30% ถือว่าสูงมาก ค่าที่อนุรักษ์นิยมและมีแนวโน้มมากขึ้นคือ 10-14% หากคุณไม่เคยทำการสำรวจในประชากรกลุ่มนี้มาก่อน
ขั้นตอนที่ 5
คุณควรส่งแบบสำรวจไปให้กี่คน?
นี่เป็นขั้นตอนง่าย ๆ !
เพียงหารจำนวนที่คุณได้รับในขั้นตอนที่ 3 ด้วยจำนวนที่คุณได้รับในขั้นตอนที่ 4 นี่คือเลขมหัศจรรย์ของคุณ
ตัวอย่างเช่น ถ้าคุณต้องการผู้หญิง 100 คนที่ใช้แชมพูเพื่อทำแบบสำรวจ และคุณคิดว่า 10% ของผู้หญิงที่คุณส่งแบบสำรวจจะทำแบบสำรวจให้เสร็จ คุณต้องส่งแบบสำรวจไปให้ผู้หญิง 1,000 คน (100/10%)!