ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

ช่วงความเชื่อมั่น ความน่าจะเป็นของความมั่นใจ

ช่วงความเชื่อมั่นสำหรับความถี่และเศษส่วน

© 2008

สถาบันสาธารณสุขแห่งชาติ ออสโล ประเทศนอร์เวย์

บทความนี้อธิบายและอภิปรายการคำนวณช่วงความเชื่อมั่นสำหรับความถี่และสัดส่วนโดยใช้วิธี Wald, Wilson, Clopper - Pearson โดยใช้การแปลงเชิงมุมและวิธีการ Wald พร้อมการแก้ไข Agresti - Coull เนื้อหาที่นำเสนอให้ข้อมูลทั่วไปเกี่ยวกับวิธีการคำนวณช่วงความเชื่อมั่นสำหรับความถี่และสัดส่วนและมีจุดมุ่งหมายเพื่อกระตุ้นความสนใจของผู้อ่านวารสารไม่เพียง แต่ในการใช้ช่วงความเชื่อมั่นเมื่อนำเสนอผลการวิจัยของตนเอง แต่ยังรวมถึงการอ่านวรรณกรรมเฉพาะทางก่อนเริ่มงานด้วย เกี่ยวกับการตีพิมพ์ในอนาคต

คำหลัก: ช่วงความเชื่อมั่น ความถี่ สัดส่วน

สิ่งพิมพ์ก่อนหน้านี้ฉบับหนึ่งกล่าวถึงคำอธิบายของข้อมูลเชิงคุณภาพโดยย่อ และรายงานว่าการประมาณช่วงของข้อมูลนั้นดีกว่าการชี้ประมาณการเพื่ออธิบายความถี่ของการเกิดลักษณะเฉพาะที่กำลังศึกษาในประชากร เนื่องจากการวิจัยดำเนินการโดยใช้ข้อมูลตัวอย่าง การฉายภาพผลลัพธ์ต่อประชากรจึงต้องมีองค์ประกอบของความไม่แม่นยำในการสุ่มตัวอย่าง ช่วงความเชื่อมั่นคือการวัดความแม่นยำของพารามิเตอร์ที่กำลังประมาณ เป็นที่น่าสนใจที่หนังสือเกี่ยวกับสถิติพื้นฐานสำหรับแพทย์บางเล่มเพิกเฉยต่อหัวข้อช่วงความเชื่อมั่นสำหรับความถี่โดยสิ้นเชิง ในบทความนี้ เราจะดูหลายวิธีในการคำนวณช่วงความเชื่อมั่นสำหรับความถี่ ซึ่งหมายถึงคุณลักษณะของกลุ่มตัวอย่าง เช่น การไม่ซ้ำซ้อนและความเป็นตัวแทน ตลอดจนความเป็นอิสระของการสังเกตจากกันและกัน ในบทความนี้ ความถี่ไม่ใช่ที่เข้าใจว่าเป็นจำนวนสัมบูรณ์ที่แสดงจำนวนครั้งของค่าหนึ่งๆ ที่เกิดขึ้นโดยรวม แต่เป็นค่าสัมพัทธ์ที่กำหนดสัดส่วนของผู้เข้าร่วมการศึกษาที่มีลักษณะเฉพาะที่ศึกษาเกิดขึ้น

ในการวิจัยทางชีวการแพทย์ มักใช้ช่วงความเชื่อมั่น 95% ช่วงความเชื่อมั่นนี้คือพื้นที่ที่สัดส่วนที่แท้จริงตกอยู่ที่ 95% ของเวลา กล่าวอีกนัยหนึ่ง เราสามารถพูดได้ด้วยความน่าเชื่อถือ 95% ว่ามูลค่าที่แท้จริงของความถี่ของการเกิดลักษณะใดลักษณะหนึ่งในกลุ่มประชากรจะอยู่ภายในช่วงความเชื่อมั่น 95%

คู่มือสถิติสำหรับนักวิจัยทางการแพทย์ส่วนใหญ่รายงานว่าข้อผิดพลาดของความถี่คำนวณโดยใช้สูตร

โดยที่ p คือความถี่ของการเกิดลักษณะเฉพาะในกลุ่มตัวอย่าง (ค่าตั้งแต่ 0 ถึง 1) บทความทางวิทยาศาสตร์ในประเทศส่วนใหญ่ระบุค่าของความถี่ของการเกิดลักษณะในตัวอย่าง (p) รวมถึงข้อผิดพลาดในรูปแบบ p ± s อย่างไรก็ตาม จะเหมาะสมกว่าที่จะนำเสนอช่วงความเชื่อมั่น 95% สำหรับความถี่ของการเกิดลักษณะในประชากรซึ่งจะรวมค่าจาก

ถึง.

คู่มือบางฉบับแนะนำว่าสำหรับตัวอย่างขนาดเล็ก ให้แทนที่ค่า 1.96 ด้วยค่า t สำหรับระดับความอิสระ N – 1 โดยที่ N คือจำนวนข้อสังเกตในตัวอย่าง ค่า t พบได้โดยใช้ตารางสำหรับการแจกแจงค่า t ซึ่งมีอยู่ในหนังสือเรียนสถิติเกือบทุกเล่ม การใช้การแจกแจงแบบ t สำหรับวิธี Wald ไม่ได้ให้ข้อได้เปรียบที่มองเห็นได้เมื่อเปรียบเทียบกับวิธีอื่นๆ ที่กล่าวถึงด้านล่าง ดังนั้นจึงไม่แนะนำโดยผู้เขียนบางคน

วิธีที่นำเสนอข้างต้นสำหรับการคำนวณช่วงความเชื่อมั่นสำหรับความถี่หรือสัดส่วนมีชื่อว่า Wald เพื่อเป็นเกียรติแก่ Abraham Wald (1902–1950) เนื่องจากการใช้อย่างแพร่หลายเริ่มขึ้นหลังจากการตีพิมพ์ของ Wald และ Wolfowitz ในปี 1939 อย่างไรก็ตาม วิธีการนี้ถูกเสนอโดย Pierre Simon Laplace (1749–1827) ย้อนกลับไปในปี 1812

วิธี Wald เป็นที่นิยมมาก แต่การใช้งานนั้นเกี่ยวข้องกับปัญหาสำคัญ ไม่แนะนำให้ใช้วิธีนี้กับตัวอย่างที่มีขนาดน้อย รวมถึงในกรณีที่ความถี่ของการเกิดลักษณะเฉพาะมีแนวโน้มที่จะเป็น 0 หรือ 1 (0% หรือ 100%) และเป็นไปไม่ได้เลยสำหรับความถี่ 0 และ 1 นอกจากนี้ การประมาณค่าการแจกแจงแบบปกติซึ่งใช้ในการคำนวณข้อผิดพลาด “ไม่ทำงาน” ในกรณีที่ n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

เนื่องจากตัวแปรใหม่มีการกระจายตามปกติ ขอบเขตล่างและบนของช่วงความเชื่อมั่น 95% สำหรับตัวแปร φ จะเป็น φ-1.96 และ φ+1.96left">

แทนที่จะเป็น 1.96 สำหรับตัวอย่างขนาดเล็ก ขอแนะนำให้แทนที่ค่า t ด้วยดีกรีอิสระ N – 1 วิธีนี้ไม่สร้างค่าลบและช่วยให้สามารถประมาณค่าช่วงความเชื่อมั่นสำหรับความถี่ได้แม่นยำกว่าวิธี Wald นอกจากนี้ยังมีการอธิบายไว้ในหนังสืออ้างอิงในประเทศเกี่ยวกับสถิติทางการแพทย์หลายเล่มซึ่งไม่ได้นำไปสู่การใช้อย่างแพร่หลายในการวิจัยทางการแพทย์ ไม่แนะนำให้คำนวณช่วงความเชื่อมั่นโดยใช้การแปลงเชิงมุมสำหรับความถี่ที่เข้าใกล้ 0 หรือ 1

นี่คือจุดที่คำอธิบายวิธีการประมาณช่วงความเชื่อมั่นในหนังสือส่วนใหญ่เกี่ยวกับสถิติพื้นฐานสำหรับนักวิจัยทางการแพทย์มักจะสิ้นสุดลง และปัญหานี้เป็นเรื่องปกติไม่เพียงแต่สำหรับในประเทศเท่านั้น แต่ยังรวมถึงวรรณกรรมต่างประเทศด้วย ทั้งสองวิธีใช้ทฤษฎีบทขีดจำกัดศูนย์กลาง ซึ่งหมายถึงตัวอย่างจำนวนมาก

เมื่อคำนึงถึงข้อบกพร่องของการประมาณช่วงความเชื่อมั่นโดยใช้วิธีการข้างต้น คลอปเปอร์และเพียร์สันเสนอในปี พ.ศ. 2477 เกี่ยวกับวิธีการคำนวณสิ่งที่เรียกว่าช่วงความเชื่อมั่นที่แน่นอน โดยพิจารณาจากการแจกแจงแบบทวินามของลักษณะที่กำลังศึกษา วิธีนี้มีอยู่ในเครื่องคิดเลขออนไลน์หลายเครื่อง แต่ช่วงความเชื่อมั่นที่ได้รับด้วยวิธีนี้มักจะกว้างเกินไป ในขณะเดียวกันก็แนะนำให้ใช้วิธีนี้ในกรณีที่จำเป็นต้องมีการประเมินแบบอนุรักษ์นิยม ระดับของการอนุรักษ์ของวิธีการจะเพิ่มขึ้นเมื่อขนาดตัวอย่างลดลง โดยเฉพาะอย่างยิ่งเมื่อ N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

ตามที่นักสถิติหลายคนกล่าวไว้ การประเมินช่วงความเชื่อมั่นสำหรับความถี่ที่เหมาะสมที่สุดนั้นดำเนินการโดยวิธีของ Wilson ซึ่งเสนอย้อนกลับไปในปี 1927 แต่ในทางปฏิบัติแล้วไม่ได้ใช้ในการวิจัยทางชีวการแพทย์ในประเทศ วิธีการนี้ไม่เพียงแต่ทำให้สามารถประมาณช่วงความเชื่อมั่นสำหรับทั้งความถี่ที่เล็กมากและความถี่ที่มากเท่านั้น แต่ยังใช้ได้กับการสังเกตจำนวนเล็กน้อยอีกด้วย โดยทั่วไป ช่วงความเชื่อมั่นตามสูตรของวิลสันจะมีรูปแบบ



โดยที่ค่า 1.96 เมื่อคำนวณช่วงความเชื่อมั่น 95% N คือจำนวนการสังเกต และ p คือความถี่ของการเกิดลักษณะเฉพาะในตัวอย่าง วิธีการนี้มีอยู่ในเครื่องคิดเลขออนไลน์ ดังนั้นการใช้งานจึงไม่เป็นปัญหา และไม่แนะนำให้ใช้วิธีนี้กับ n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

นอกจากวิธี Wilson แล้ว ยังเชื่อว่าวิธี Wald ที่มีการแก้ไข Agresti – Coll จะให้ค่าประมาณที่เหมาะสมที่สุดสำหรับช่วงความเชื่อมั่นสำหรับความถี่ การแก้ไข Agresti-Coll เป็นการแทนที่ในสูตร Wald ของความถี่ของการเกิดขึ้นของลักษณะเฉพาะในตัวอย่าง (p) ด้วย p` เมื่อคำนวณว่า 2 จะถูกบวกเข้ากับตัวเศษและ 4 จะถูกบวกเข้ากับตัวส่วนนั่นคือ p` = (X + 2) / (N + 4) โดยที่ X คือจำนวนผู้เข้าร่วมการศึกษาที่มีลักษณะเฉพาะที่กำลังศึกษา และ N คือขนาดกลุ่มตัวอย่าง การปรับเปลี่ยนนี้ให้ผลลัพธ์ที่คล้ายคลึงกับสูตรของ Wilson มาก ยกเว้นเมื่อความถี่ของเหตุการณ์เข้าใกล้ 0% หรือ 100% และตัวอย่างมีขนาดเล็ก นอกเหนือจากวิธีการข้างต้นในการคำนวณช่วงความเชื่อมั่นสำหรับความถี่แล้ว ยังมีการเสนอการแก้ไขความต่อเนื่องสำหรับทั้งวิธี Wald และ Wilson สำหรับตัวอย่างขนาดเล็ก แต่การศึกษาพบว่าการใช้งานดังกล่าวไม่เหมาะสม

ลองพิจารณาการประยุกต์ใช้วิธีการข้างต้นในการคำนวณช่วงความเชื่อมั่นโดยใช้สองตัวอย่าง ในกรณีแรก เราศึกษากลุ่มตัวอย่างจำนวนมากจากผู้เข้าร่วมการศึกษาที่ได้รับการสุ่มเลือกจำนวน 1,000 ราย โดยในจำนวนนี้ 450 รายมีลักษณะที่กำลังศึกษาอยู่ (ซึ่งอาจเป็นปัจจัยเสี่ยง ผลลัพธ์ หรือลักษณะอื่นๆ) ซึ่งคิดเป็นความถี่ 0.45 หรือ 45 % ในกรณีที่สอง การศึกษาดำเนินการโดยใช้กลุ่มตัวอย่างขนาดเล็ก เช่น มีเพียง 20 คน และมีผู้เข้าร่วมการศึกษาเพียง 1 คน (5%) เท่านั้นที่มีลักษณะที่ศึกษา ช่วงความเชื่อมั่นโดยใช้วิธี Wald วิธี Wald พร้อมการแก้ไข Agresti – Coll และวิธีการ Wilson คำนวณโดยใช้เครื่องคิดเลขออนไลน์ที่พัฒนาโดย Jeff Sauro (//www. /wald. htm) ช่วงความเชื่อมั่นที่แก้ไขความต่อเนื่องของ Wilson คำนวณโดยใช้เครื่องคิดเลขที่ Wassar Stats ให้มา: เว็บไซต์สำหรับการคำนวณทางสถิติ (//faculty.vassar.edu/lowry/prop1.html) การคำนวณการแปลงเชิงมุมฟิชเชอร์ดำเนินการด้วยตนเองโดยใช้ค่าวิกฤตสำหรับองศาอิสระ 19 และ 999 ตามลำดับ ผลการคำนวณจะแสดงในตารางสำหรับทั้งสองตัวอย่าง

ช่วงความเชื่อมั่นคำนวณด้วยวิธีที่แตกต่างกันหกวิธีสำหรับสองตัวอย่างที่อธิบายไว้ในข้อความ

วิธีการคำนวณช่วงความเชื่อมั่น

P=0.0500 หรือ 5%

CI 95% สำหรับ X=450, N=1000, P=0.4500 หรือ 45%

–0,0455–0,2541

Wald พร้อมการแก้ไข Agresti–Coll

<,0001–0,2541

วิลสันพร้อมการแก้ไขอย่างต่อเนื่อง

Clopper–Pearson "วิธีการที่แน่นอน"

การแปลงเชิงมุม

<0,0001–0,1967

ดังที่เห็นได้จากตาราง สำหรับตัวอย่างแรก ช่วงความเชื่อมั่นที่คำนวณโดยใช้วิธี Wald “ที่ยอมรับโดยทั่วไป” จะเข้าสู่ขอบเขตลบ ซึ่งไม่สามารถเป็นกรณีของความถี่ได้ น่าเสียดายที่เหตุการณ์ดังกล่าวไม่ใช่เรื่องแปลกในวรรณคดีรัสเซีย วิธีการนำเสนอข้อมูลแบบดั้งเดิมในแง่ของความถี่และข้อผิดพลาดสามารถปกปิดปัญหานี้ได้บางส่วน ตัวอย่างเช่น หากความถี่ของการเกิดลักษณะหนึ่งๆ (เป็นเปอร์เซ็นต์) แสดงเป็น 2.1 ± 1.4 แสดงว่าสิ่งนี้ไม่ "น่ารังเกียจต่อดวงตา" เท่ากับ 2.1% (95% CI: –0.7; 4.9) แม้ว่า และ หมายถึง สิ่งเดียวกัน วิธี Wald ที่มีการแก้ไขและการคำนวณ Agresti–Coll โดยใช้การแปลงเชิงมุมจะให้ขอบเขตล่างที่มีแนวโน้มเป็นศูนย์ วิธีแก้ไขความต่อเนื่องของวิลสันและ "วิธีที่แน่นอน" จะสร้างช่วงความเชื่อมั่นที่กว้างกว่าวิธีของวิลสัน สำหรับตัวอย่างที่สอง วิธีการทั้งหมดให้ช่วงความเชื่อมั่นที่เท่ากันโดยประมาณ (ความแตกต่างปรากฏเพียงในพันเท่านั้น) ซึ่งไม่น่าแปลกใจ เนื่องจากความถี่ของการเกิดเหตุการณ์ในตัวอย่างนี้ไม่แตกต่างจาก 50% มากนัก และขนาดตัวอย่างเท่ากับ ค่อนข้างใหญ่

สำหรับผู้อ่านที่สนใจปัญหานี้ เราสามารถแนะนำผลงานของ R. G. Newcombe และ Brown, Cai และ Dasgupta ซึ่งให้ข้อดีและข้อเสียของการใช้วิธีการที่แตกต่างกัน 7 และ 10 วิธีในการคำนวณช่วงความเชื่อมั่น ตามลำดับ ในบรรดาคู่มือภายในประเทศ เราขอแนะนำหนังสือเล่มนี้ ซึ่งนอกเหนือจากคำอธิบายโดยละเอียดของทฤษฎีแล้ว ยังนำเสนอวิธีการของ Wald และ Wilson ตลอดจนวิธีการคำนวณช่วงความเชื่อมั่นโดยคำนึงถึงการแจกแจงความถี่ทวินาม นอกจากเครื่องคิดเลขออนไลน์ฟรี (http://www. /wald.htm และ http://faculty. vassar. edu/lowry/prop1.html) แล้ว ช่วงความเชื่อมั่นสำหรับความถี่ (และไม่เพียงเท่านั้น!) ยังสามารถคำนวณได้โดยใช้ โปรแกรม CIA (Confidence Intervals Analysis) ซึ่งสามารถดาวน์โหลดได้จาก http://www. โรงเรียนแพทย์ โซตอน เครื่องปรับอากาศ สหราชอาณาจักร/ซีไอเอ/ .

บทความถัดไปจะพิจารณาวิธีการเปรียบเทียบข้อมูลเชิงคุณภาพที่ไม่แปรเปลี่ยน

อ้างอิง

บาเนอร์จี เอ.สถิติทางการแพทย์ด้วยภาษาที่ชัดเจน หลักสูตรเบื้องต้น / อ. บาเนอร์จี. – อ.: เวชศาสตร์ปฏิบัติ, 2550. – 287 น. สถิติทางการแพทย์ / . – อ.: หน่วยงานข้อมูลทางการแพทย์, 2550. – 475 หน้า กลานซ์ เอส.สถิติการแพทย์และชีววิทยา / เอส. กลานซ์. – อ.: แพรกติกา, 2541. ประเภทข้อมูล การทดสอบการกระจายตัว และสถิติเชิงพรรณนา // นิเวศวิทยาของมนุษย์ – 2551 – ฉบับที่ 1 – หน้า 52–58 จือซิน เค.เอส.- สถิติการแพทย์ : หนังสือเรียน / . – Rostov ไม่มี: Phoenix, 2007. – 160 น. สถิติการแพทย์ประยุกต์ / , . – เซนต์ปีเตอร์สเบิร์ก : โฟเลียต, 2003. – 428 น. ลาคิน จี.เอฟ- ไบโอเมตริกซ์ / . – ม.: มัธยมปลาย, 2533. – 350 น. แพทย์ V. A- สถิติทางคณิตศาสตร์ทางการแพทย์ / , . – อ.: การเงินและสถิติ, 2550. – 798 น. สถิติทางคณิตศาสตร์ในการวิจัยทางคลินิก / , . – อ.: GEOTAR-MED, 2001. – 256 หน้า จุนเครอฟ วี. และ- การประมวลผลทางการแพทย์และสถิติของข้อมูลการวิจัยทางการแพทย์ / , . – เซนต์ปีเตอร์สเบิร์ก : VmedA, 2002. – 266 หน้า อาเกรสติ เอ.การประมาณดีกว่าการประมาณค่าช่วงสัดส่วนทวินาม / A. Agresti, B. Coull // นักสถิติชาวอเมริกัน – 1998. – N 52. – หน้า 119–126. อัลท์แมน ดี.สถิติด้วยความมั่นใจ // D. Altman, D. Machin, T. Bryant, M. J. Gardner – ลอนดอน: หนังสือ BMJ, 2000. – 240 น. บราวน์ แอล.ดี.การประมาณช่วงสำหรับสัดส่วนทวินาม / L. D. Brown, T. T. Cai, A. Dasgupta // วิทยาศาสตร์ทางสถิติ – 2001. – N 2. – หน้า 101–133. คลอปเปอร์ ซี.เจ.การใช้ความเชื่อมั่นหรือขีดจำกัดความไว้วางใจที่แสดงไว้ในกรณีของทวินาม / C. J. Clopper, E. S. Pearson // Biometrika – 1934. – N 26. – หน้า 404–413. การ์เซีย-เปเรซ ม.เอ- เกี่ยวกับช่วงความมั่นใจสำหรับพารามิเตอร์ทวินาม / M. A. Garcia-Perez // คุณภาพและปริมาณ – 2005. – N 39. – หน้า 467–481. โมตุลสกี้ เอช.ชีวสถิติที่ใช้งานง่าย // H. Motulsky – ออกซ์ฟอร์ด: สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด, 1995. – 386 หน้า นิวคอมบ์ อาร์.จี.ช่วงความเชื่อมั่นสองด้านสำหรับสัดส่วนเดียว: การเปรียบเทียบวิธีทั้งเจ็ด / R. G. Newcombe // สถิติทางการแพทย์ – 1998. – N.17. – หน้า 857–872. เซาโร เจ.การประมาณอัตราความสำเร็จจากตัวอย่างขนาดเล็กโดยใช้ช่วงความเชื่อมั่นทวินาม: การเปรียบเทียบและคำแนะนำ / J. Sauro, J. R. Lewis // การประชุมประจำปีของปัจจัยมนุษย์และสังคมการยศาสตร์ – ออร์แลนโด รัฐฟลอริดา 2548 วอลด์ เอ.ขีดจำกัดความมั่นใจสำหรับฟังก์ชันการแจกแจงแบบต่อเนื่อง // A. Wald, J. Wolfovitz // พงศาวดารของสถิติทางคณิตศาสตร์ – 1939. – N 10. – หน้า 105–118. วิลสัน อี.บี- การอนุมานที่เป็นไปได้ กฎแห่งการสืบทอด และการอนุมานทางสถิติ / อี. บี. วิลสัน // วารสารสมาคมสถิติอเมริกัน – 1927. – N 22. – หน้า 209–212.

ช่วงความเชื่อมั่นสำหรับสัดส่วน

ก. เอ็ม. กรีบอฟสกี้

สถาบันสาธารณสุขแห่งชาติ ออสโล ประเทศนอร์เวย์

บทความนี้นำเสนอวิธีการคำนวณช่วงความเชื่อมั่นสำหรับสัดส่วนทวินามหลายวิธี ได้แก่ วิธี Wald, Wilson, arcsine, Agresti-Coull และวิธี Clopper-Pearson ที่แน่นอน บทความนี้เป็นเพียงการแนะนำทั่วไปเกี่ยวกับปัญหาการประมาณค่าช่วงความเชื่อมั่นของสัดส่วนทวินาม และจุดมุ่งหมายไม่เพียงเพื่อกระตุ้นให้ผู้อ่านใช้ช่วงความเชื่อมั่นเมื่อนำเสนอผลการวิจัยเชิงประจักษ์ของตนเอง แต่ยังสนับสนุนให้พวกเขาปรึกษาหนังสือสถิติด้วย ก่อนที่จะวิเคราะห์ข้อมูลของตัวเองและเตรียมต้นฉบับ

คำสำคัญ: ช่วงความเชื่อมั่น สัดส่วน

ข้อมูลการติดต่อ:

ที่ปรึกษาอาวุโส สถาบันสาธารณสุขแห่งชาติ ออสโล นอร์เวย์

ความฉลาดไม่เพียงประกอบด้วยความรู้เท่านั้น แต่ยังรวมถึงความสามารถในการประยุกต์ความรู้ในทางปฏิบัติด้วย (อริสโตเติล)

ช่วงความมั่นใจ

ภาพรวมทั่วไป

โดยการเก็บตัวอย่างจากประชากร เราจะได้ค่าประมาณแบบจุดของพารามิเตอร์ที่สนใจ และคำนวณค่าคลาดเคลื่อนมาตรฐานเพื่อระบุความแม่นยำของการประมาณค่า

อย่างไรก็ตาม ในกรณีส่วนใหญ่ ข้อผิดพลาดมาตรฐานดังกล่าวไม่สามารถยอมรับได้ การรวมการวัดความแม่นยำนี้เข้ากับการประมาณช่วงสำหรับพารามิเตอร์ประชากรจะมีประโยชน์มากกว่ามาก

ซึ่งสามารถทำได้โดยใช้ความรู้เกี่ยวกับการแจกแจงความน่าจะเป็นทางทฤษฎีของสถิติตัวอย่าง (พารามิเตอร์) เพื่อคำนวณช่วงความเชื่อมั่น (CI - ช่วงความเชื่อมั่น, CI - ช่วงความเชื่อมั่น) สำหรับพารามิเตอร์

โดยทั่วไป ช่วงความเชื่อมั่นจะขยายการประมาณการทั้งสองทิศทางด้วยค่าทวีคูณของค่าคลาดเคลื่อนมาตรฐาน (ของพารามิเตอร์ที่กำหนด) ค่าทั้งสอง (ขีดจำกัดความเชื่อมั่น) ที่กำหนดช่วงเวลามักจะคั่นด้วยเครื่องหมายจุลภาคและอยู่ในวงเล็บ

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย

การใช้การแจกแจงแบบปกติ

ค่าเฉลี่ยตัวอย่างจะมีการแจกแจงตามปกติหากขนาดตัวอย่างมีขนาดใหญ่ ดังนั้นคุณจึงสามารถนำความรู้เรื่องการแจกแจงแบบปกติไปประยุกต์ใช้ในการพิจารณาค่าเฉลี่ยตัวอย่างได้

โดยเฉพาะอย่างยิ่ง 95% ของการกระจายตัวของค่าเฉลี่ยตัวอย่างอยู่ภายในค่าเบี่ยงเบนมาตรฐาน (SD) 1.96 ของค่าเฉลี่ยประชากร

เมื่อเรามีตัวอย่างเดียว เราจะเรียกมันว่าค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย (SEM) และคำนวณช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยดังนี้

หากเราทำการทดลองนี้ซ้ำหลายครั้ง ช่วงดังกล่าวจะมีค่าเฉลี่ยประชากรจริง 95% ของเวลาทั้งหมด

โดยทั่วไปนี่คือช่วงความเชื่อมั่น เช่น ช่วงของค่าที่ค่าเฉลี่ยประชากรที่แท้จริง (ค่าเฉลี่ยทั่วไป) อยู่กับความน่าจะเป็นของความเชื่อมั่น 95%

แม้ว่าจะไม่เข้มงวดทั้งหมด (ค่าเฉลี่ยประชากรเป็นค่าคงที่ ดังนั้นจึงไม่สามารถมีความน่าจะเป็นแนบมาด้วย) ในการตีความช่วงความเชื่อมั่นในลักษณะนี้ แต่ก็ง่ายกว่าในเชิงแนวคิดที่จะเข้าใจ

การใช้งาน ที-การกระจาย

คุณสามารถใช้การแจกแจงแบบปกติได้หากคุณทราบค่าของความแปรปรวนในประชากร นอกจากนี้ เมื่อขนาดของกลุ่มตัวอย่างมีขนาดเล็ก ค่าเฉลี่ยของกลุ่มตัวอย่างจะเป็นไปตามการแจกแจงแบบปกติ หากข้อมูลประชากรพื้นฐานมีการกระจายแบบปกติ

หากข้อมูลที่เป็นพื้นฐานของประชากรไม่ได้รับการแจกแจงตามปกติ และ/หรือไม่ทราบความแปรปรวนทั่วไป (ความแปรปรวนในประชากร) ค่าเฉลี่ยตัวอย่างจะเป็นไปตาม การกระจายตัวแบบ t ของนักเรียน.

เราคำนวณช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยประชากรทั่วไปดังนี้

จุดเปอร์เซ็นต์ (เปอร์เซ็นไทล์) อยู่ที่ไหน ที-การแจกแจงค่า t ของนักเรียนด้วยดีกรีอิสระ (n-1) ซึ่งให้ความน่าจะเป็นสองด้านเท่ากับ 0.05

โดยทั่วไป จะมีช่วงที่กว้างกว่าการใช้การแจกแจงแบบปกติ เนื่องจากจะคำนึงถึงความไม่แน่นอนเพิ่มเติมที่เกิดขึ้นจากการประมาณค่าเบี่ยงเบนมาตรฐานของประชากร และ/หรือเนื่องจากขนาดตัวอย่างเล็ก

เมื่อขนาดตัวอย่างมีขนาดใหญ่ (ตั้งแต่ 100 ขึ้นไป) ความแตกต่างระหว่างการแจกแจงทั้งสองแบบ ( t-นักเรียนและปกติ) ไม่มีนัยสำคัญ อย่างไรก็ตามพวกเขาก็ใช้อยู่เสมอ ที-การกระจายตัวเมื่อคำนวณช่วงความเชื่อมั่น แม้ว่ากลุ่มตัวอย่างจะมีขนาดใหญ่ก็ตาม

โดยทั่วไปจะมีการรายงาน CI 95% ช่วงความเชื่อมั่นอื่นๆ สามารถคำนวณได้ เช่น 99% CI สำหรับค่าเฉลี่ย

แทนที่จะเป็นผลคูณของข้อผิดพลาดมาตรฐานและค่าตาราง ที-การแจกแจงซึ่งสอดคล้องกับความน่าจะเป็นสองด้านที่ 0.05 ให้คูณ (ข้อผิดพลาดมาตรฐาน) ด้วยค่าที่สอดคล้องกับความน่าจะเป็นสองด้านที่ 0.01 นี่เป็นช่วงความเชื่อมั่นที่กว้างกว่าช่วงความเชื่อมั่น 95% เนื่องจากสะท้อนถึงความเชื่อมั่นที่เพิ่มขึ้นว่าช่วงนั้นรวมค่าเฉลี่ยประชากรด้วย

ช่วงความเชื่อมั่นสำหรับสัดส่วน

การกระจายตัวอย่างตามสัดส่วนมีการกระจายแบบทวินาม แต่ถ้าเป็นขนาดตัวอย่าง nมีขนาดใหญ่พอสมควร ดังนั้น การกระจายตัวตัวอย่างของสัดส่วนจะอยู่ที่ประมาณปกติโดยมีค่าเฉลี่ย

ประเมินโดยอัตราส่วนการคัดเลือก พี=ร/n(ที่ไหน - จำนวนบุคคลในกลุ่มตัวอย่างที่มีคุณสมบัติเฉพาะที่เราสนใจ) และค่าความผิดพลาดมาตรฐานโดยประมาณ:

ช่วงความเชื่อมั่น 95% สำหรับสัดส่วนนี้ประมาณไว้:

หากขนาดตัวอย่างมีขนาดเล็ก (ปกติเมื่อ n.p.หรือ เอ็น(1-พี)น้อย 5 ) จึงจำเป็นต้องใช้การแจกแจงแบบทวินามเพื่อคำนวณช่วงความเชื่อมั่นที่แม่นยำ

โปรดทราบว่าถ้า พีแสดงเป็นเปอร์เซ็นต์แล้ว (1-หน้า)แทนที่ด้วย (100-หน้า).

การตีความช่วงความเชื่อมั่น

เมื่อตีความช่วงความเชื่อมั่น เราสนใจคำถามต่อไปนี้:

ช่วงความเชื่อมั่นกว้างแค่ไหน?

ช่วงความเชื่อมั่นที่กว้างบ่งชี้ว่าการประมาณการไม่แม่นยำ แคบบ่งบอกถึงการประมาณการที่แม่นยำ

ความกว้างของช่วงความเชื่อมั่นขึ้นอยู่กับขนาดของข้อผิดพลาดมาตรฐาน ซึ่งในทางกลับกันก็ขึ้นอยู่กับขนาดตัวอย่าง และเมื่อพิจารณาตัวแปรตัวเลข ความแปรปรวนของข้อมูลจะสร้างช่วงความเชื่อมั่นที่กว้างกว่าการศึกษาชุดข้อมูลขนาดใหญ่ที่มีตัวแปรเพียงไม่กี่ตัว .

CI มีค่าใด ๆ ที่น่าสนใจเป็นพิเศษหรือไม่?

คุณสามารถตรวจสอบว่าค่าที่เป็นไปได้สำหรับพารามิเตอร์ประชากรอยู่ภายในช่วงความเชื่อมั่นหรือไม่ หากเป็นเช่นนั้น ผลลัพธ์จะสอดคล้องกับค่าที่เป็นไปได้นี้ ถ้าไม่เช่นนั้น ก็ไม่น่าจะเป็นไปได้ (สำหรับช่วงความเชื่อมั่น 95% โอกาสเกือบ 5%) ที่พารามิเตอร์จะมีค่านั้น

ช่วงความเชื่อมั่น– ค่าจำกัดของปริมาณทางสถิติที่ด้วยความน่าจะเป็นของความเชื่อมั่นที่กำหนด γ จะอยู่ในช่วงเวลานี้เมื่อสุ่มตัวอย่างในปริมาณที่มากขึ้น เขียนแทนด้วย P(θ - ε ในทางปฏิบัติ ความน่าจะเป็นของความเชื่อมั่น γ ถูกเลือกจากค่าที่ค่อนข้างใกล้เคียงกับความสามัคคี: γ = 0.9, γ = 0.95, γ = 0.99

วัตถุประสงค์ของการบริการ- เมื่อใช้บริการนี้ คุณสามารถกำหนด:

  • ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยทั่วไป ช่วงความเชื่อมั่นสำหรับความแปรปรวน
  • ช่วงความเชื่อมั่นสำหรับส่วนเบี่ยงเบนมาตรฐาน ช่วงความเชื่อมั่นสำหรับส่วนแบ่งทั่วไป
ผลลัพธ์ที่ได้จะถูกบันทึกเป็นไฟล์ Word (ดูตัวอย่าง) ด้านล่างนี้เป็นคำแนะนำวิดีโอเกี่ยวกับวิธีการกรอกข้อมูลเบื้องต้น

ตัวอย่างหมายเลข 1 ในฟาร์มรวมแห่งหนึ่ง จากฝูงแกะทั้งหมด 1,000 ตัว แกะ 100 ตัวได้รับการคัดเลือกควบคุมการตัดขน เป็นผลให้มีการตัดขนโดยเฉลี่ย 4.2 กิโลกรัมต่อแกะหนึ่งตัว หาค่าความคลาดเคลื่อนกำลังสองเฉลี่ยของตัวอย่างด้วยความน่าจะเป็นที่ 0.99 เมื่อพิจารณาค่าการตัดขนแกะโดยเฉลี่ยต่อแกะ และขีดจำกัดของค่าการตัดหากค่าความแปรปรวนคือ 2.5 ตัวอย่างไม่ซ้ำกัน
ตัวอย่างหมายเลข 2 จากชุดผลิตภัณฑ์นำเข้าที่ไปรษณีย์ของกรมศุลกากรภาคเหนือของมอสโก ตัวอย่างผลิตภัณฑ์ "A" จำนวน 20 ตัวอย่างถูกสุ่มตัวอย่างซ้ำ จากผลการทดสอบ ปริมาณความชื้นเฉลี่ยของผลิตภัณฑ์ "A" ในตัวอย่างจึงถูกสร้างขึ้น ซึ่งกลายเป็นเท่ากับ 6% โดยมีค่าเบี่ยงเบนมาตรฐาน 1%
กำหนดด้วยความน่าจะเป็น 0.683 ขีดจำกัดของปริมาณความชื้นเฉลี่ยของผลิตภัณฑ์ในผลิตภัณฑ์นำเข้าทั้งชุด
ตัวอย่างหมายเลข 3 จากการสำรวจนักเรียน 36 คน พบว่าจำนวนหนังสือเรียนโดยเฉลี่ยที่นักเรียนอ่านในระหว่างปีการศึกษาเท่ากับ 6 สมมติว่าจำนวนหนังสือเรียนที่นักเรียนอ่านต่อภาคการศึกษามีกฎการแจกแจงแบบปกติโดยมีค่าเบี่ยงเบนมาตรฐานเท่ากับ 6 แล้วพบว่า : A) ด้วยความน่าเชื่อถือของการประมาณช่วง 0 .99 สำหรับความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มนี้ B) ด้วยความน่าจะเป็นที่เราสามารถพูดได้ว่าจำนวนหนังสือเรียนโดยเฉลี่ยที่นักเรียนอ่านต่อภาคการศึกษาซึ่งคำนวณจากตัวอย่างนี้จะเบี่ยงเบนไปจากความคาดหวังทางคณิตศาสตร์ในค่าสัมบูรณ์ไม่เกิน 2

การจำแนกช่วงความเชื่อมั่น

ตามประเภทของพารามิเตอร์ที่กำลังประเมิน:

ตามประเภทตัวอย่าง:

  1. ช่วงความเชื่อมั่นสำหรับตัวอย่างที่ไม่มีที่สิ้นสุด
  2. ช่วงความเชื่อมั่นสำหรับตัวอย่างสุดท้าย
ตัวอย่างนี้เรียกว่าการสุ่มตัวอย่างใหม่หากวัตถุที่เลือกถูกส่งคืนให้กับประชากรก่อนที่จะเลือกวัตถุถัดไป ตัวอย่างเรียกว่าไม่ทำซ้ำหากวัตถุที่เลือกไม่ได้ส่งคืนให้กับประชากร ในทางปฏิบัติ เรามักจะจัดการกับตัวอย่างที่ไม่ซ้ำกัน

การคำนวณค่าความคลาดเคลื่อนในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับการสุ่มตัวอย่าง

เรียกว่าความแตกต่างระหว่างค่าของตัวบ่งชี้ที่ได้จากตัวอย่างและพารามิเตอร์ที่เกี่ยวข้องของประชากรทั่วไป ข้อผิดพลาดในการเป็นตัวแทน.
การกำหนดพารามิเตอร์หลักของประชากรทั่วไปและประชากรตัวอย่าง
สูตรข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย
การคัดเลือกใหม่เลือกซ้ำ
สำหรับค่าเฉลี่ยเพื่อการแบ่งปันสำหรับค่าเฉลี่ยเพื่อการแบ่งปัน
ความสัมพันธ์ระหว่างขีดจำกัดข้อผิดพลาดในการสุ่มตัวอย่าง (Δ) รับประกันความน่าจะเป็นบางประการ พี(ที)และข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยมีรูปแบบ: หรือ Δ = t·μ โดยที่ ที– สัมประสิทธิ์ความเชื่อมั่น พิจารณาจากระดับความน่าจะเป็น P(t) ตามตารางฟังก์ชันอินทิกรัลลาปลาซ

สูตรคำนวณขนาดตัวอย่างโดยใช้วิธีการสุ่มตัวอย่างล้วนๆ

การประมาณค่าทางสถิติมีสองประเภท: จุดและช่วง การประมาณจุดคือสถิติตัวอย่างเดียวที่ใช้ในการประมาณค่าพารามิเตอร์ประชากร ตัวอย่างเช่น ค่าเฉลี่ยตัวอย่าง คือค่าประมาณแบบจุดของความคาดหวังทางคณิตศาสตร์ของประชากร และความแปรปรวนของกลุ่มตัวอย่าง เอส 2- การประมาณจุดของความแปรปรวนของประชากร ซิ 2- แสดงให้เห็นว่าค่าเฉลี่ยของกลุ่มตัวอย่างเป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ของประชากรอย่างเป็นกลาง ค่าเฉลี่ยตัวอย่างเรียกว่าเป็นกลาง เนื่องจากค่าเฉลี่ยของค่าเฉลี่ยตัวอย่างทั้งหมด (ที่มีขนาดตัวอย่างเท่ากัน) n) เท่ากับค่าคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป

เพื่อให้เกิดความแปรปรวนตัวอย่าง เอส 2กลายเป็นการประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง ซิ 2ควรตั้งค่าตัวส่วนของความแปรปรวนตัวอย่างให้เท่ากับ n – 1 , ไม่ n- กล่าวอีกนัยหนึ่ง ความแปรปรวนของประชากรคือค่าเฉลี่ยของความแปรปรวนตัวอย่างที่เป็นไปได้ทั้งหมด

เมื่อประมาณค่าพารามิเตอร์ประชากร ควรคำนึงถึงสถิติตัวอย่าง เช่น ขึ้นอยู่กับตัวอย่างเฉพาะ เพื่อคำนึงถึงข้อเท็จจริงนี้เพื่อรับ การประมาณช่วงความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป วิเคราะห์การกระจายตัวของค่าเฉลี่ยตัวอย่าง (ดูรายละเอียดเพิ่มเติม) ช่วงที่สร้างขึ้นนั้นมีลักษณะเฉพาะด้วยระดับความเชื่อมั่นที่แน่นอน ซึ่งแสดงถึงความน่าจะเป็นที่พารามิเตอร์ประชากรจริงได้รับการประมาณอย่างถูกต้อง ช่วงความเชื่อมั่นที่คล้ายกันสามารถใช้เพื่อประมาณสัดส่วนของคุณลักษณะได้ และมวลกระจายหลักของประชากร

ดาวน์โหลดบันทึกในรูปแบบหรือตัวอย่างในรูปแบบ

การสร้างช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของประชากรที่มีค่าเบี่ยงเบนมาตรฐานที่ทราบ

การสร้างช่วงความเชื่อมั่นสำหรับส่วนแบ่งของคุณลักษณะในประชากร

ส่วนนี้จะขยายแนวคิดเรื่องช่วงความเชื่อมั่นไปสู่ข้อมูลที่เป็นหมวดหมู่ สิ่งนี้ช่วยให้เราสามารถประมาณส่วนแบ่งของลักษณะเฉพาะในประชากรได้ โดยใช้การแชร์ตัวอย่าง = เอ็กซ์/n- ตามที่ระบุหากมีปริมาณ nและ n(1 – หน้า)เกินเลข 5 การแจกแจงแบบทวินามสามารถประมาณได้ตามปกติ ดังนั้นเพื่อประมาณส่วนแบ่งของลักษณะเฉพาะในประชากร สามารถสร้างช่วงที่มีระดับความเชื่อมั่นเท่ากับได้ (1 – แอลฟา)x100%.


ที่ไหน พี- สัดส่วนตัวอย่างลักษณะเท่ากับ เอ็กซ์/n, เช่น. จำนวนความสำเร็จหารด้วยขนาดตัวอย่าง - ส่วนแบ่งของลักษณะในประชากรทั่วไป ซี- ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐาน n- ขนาดตัวอย่าง

ตัวอย่างที่ 3สมมติว่าตัวอย่างที่ประกอบด้วยใบแจ้งหนี้ 100 ใบที่กรอกในช่วงเดือนที่แล้วถูกแยกออกจากระบบข้อมูล สมมติว่าใบแจ้งหนี้ทั้ง 10 ใบถูกรวบรวมโดยมีข้อผิดพลาด ดังนั้น, = 10/100 = 0.1 ระดับความเชื่อมั่น 95% สอดคล้องกับค่าวิกฤต Z = 1.96

ดังนั้น ความน่าจะเป็นที่ระหว่าง 4.12% ถึง 15.88% ของใบแจ้งหนี้มีข้อผิดพลาดคือ 95%

สำหรับขนาดตัวอย่างที่กำหนด ช่วงความเชื่อมั่นที่มีสัดส่วนของคุณลักษณะในประชากรจะปรากฏกว้างกว่าตัวแปรสุ่มแบบต่อเนื่อง เนื่องจากการวัดตัวแปรสุ่มแบบต่อเนื่องมีข้อมูลมากกว่าการวัดข้อมูลเชิงหมวดหมู่ กล่าวอีกนัยหนึ่งข้อมูลหมวดหมู่ที่รับเพียงสองค่าจะมีข้อมูลไม่เพียงพอที่จะประมาณค่าพารามิเตอร์ของการแจกแจง

ในการคำนวณค่าประมาณที่ดึงมาจากประชากรจำนวนจำกัด

การประมาณค่าความคาดหวังทางคณิตศาสตร์ปัจจัยแก้ไขสำหรับประชากรสุดท้าย ( เอฟพีซี) ถูกนำมาใช้เพื่อลดข้อผิดพลาดมาตรฐานตามปัจจัย เมื่อคำนวณช่วงความเชื่อมั่นสำหรับการประมาณค่าพารามิเตอร์ประชากร ปัจจัยการแก้ไขจะถูกใช้ในสถานการณ์ที่มีการเก็บตัวอย่างโดยไม่ถูกส่งกลับ ดังนั้น ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ที่มีระดับความเชื่อมั่นเท่ากับ (1 – แอลฟา)x100%คำนวณโดยสูตร:

ตัวอย่างที่ 4เพื่อแสดงให้เห็นการใช้ปัจจัยแก้ไขสำหรับประชากรที่มีจำกัด ขอให้เรากลับไปสู่ปัญหาในการคำนวณช่วงความเชื่อมั่นสำหรับจำนวนใบแจ้งหนี้โดยเฉลี่ย ตามที่กล่าวไว้ข้างต้นในตัวอย่างที่ 3 สมมติว่าบริษัทออกใบแจ้งหนี้ 5,000 ใบต่อเดือน และ เอ็กซ์=110.27 ดอลลาร์ = $28.95 เอ็น = 5000, n = 100, α = 0.05, ที 99 = 1.9842 การใช้สูตร (6) เราได้รับ:

การประมาณส่วนแบ่งของฟีเจอร์เมื่อเลือกโดยไม่ส่งคืน ช่วงความเชื่อมั่นสำหรับสัดส่วนของคุณลักษณะที่มีระดับความเชื่อมั่นเท่ากับ (1 – แอลฟา)x100%คำนวณโดยสูตร:

ช่วงความเชื่อมั่นและประเด็นทางจริยธรรม

เมื่อทำการสุ่มตัวอย่างประชากรและทำการสรุปทางสถิติ มักจะเกิดปัญหาด้านจริยธรรมเกิดขึ้น สิ่งสำคัญคือช่วงความเชื่อมั่นและการประมาณค่าจุดของสถิติตัวอย่างสอดคล้องกันอย่างไร การเผยแพร่การประมาณจุดโดยไม่ระบุช่วงความเชื่อมั่นที่เกี่ยวข้อง (โดยปกติจะอยู่ที่ระดับความเชื่อมั่น 95%) และขนาดตัวอย่างที่ได้รับมาอาจทำให้เกิดความสับสนได้ สิ่งนี้อาจทำให้ผู้ใช้รู้สึกว่าการประมาณจุดเป็นสิ่งที่เขาต้องการในการทำนายคุณสมบัติของประชากรทั้งหมด ดังนั้นจึงจำเป็นต้องเข้าใจว่าในการวิจัยใดๆ การมุ่งเน้นไม่ควรอยู่ที่การประมาณแบบจุด แต่เป็นการประมาณตามช่วงเวลา นอกจากนี้ควรให้ความใส่ใจเป็นพิเศษกับการเลือกขนาดตัวอย่างที่ถูกต้อง

บ่อยครั้งที่เป้าหมายของการจัดการทางสถิติเป็นผลมาจากการสำรวจทางสังคมวิทยาของประชากรในประเด็นทางการเมืองบางอย่าง ในเวลาเดียวกัน ผลการสำรวจจะถูกตีพิมพ์บนหน้าแรกของหนังสือพิมพ์ และข้อผิดพลาดในการสุ่มตัวอย่างและวิธีการวิเคราะห์ทางสถิติจะถูกตีพิมพ์ที่ไหนสักแห่งตรงกลาง เพื่อพิสูจน์ความถูกต้องของการประมาณค่าจุดที่ได้รับ จำเป็นต้องระบุขนาดตัวอย่างตามที่ได้รับ ขอบเขตของช่วงความเชื่อมั่น และระดับนัยสำคัญ

หมายเหตุถัดไป

มีการใช้สื่อจากหนังสือ Levin และคณะ สถิติสำหรับผู้จัดการ – อ.: วิลเลียมส์, 2004. – หน้า. 448–462

ทฤษฎีบทขีดจำกัดกลางระบุว่าด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ การกระจายตัวของค่าเฉลี่ยของตัวอย่างสามารถประมาณได้โดยการแจกแจงแบบปกติ คุณสมบัตินี้ไม่ขึ้นอยู่กับประเภทของการกระจายตัวของประชากร

“ Katren-Style” ยังคงเผยแพร่ซีรีส์เกี่ยวกับสถิติทางการแพทย์ของ Konstantin Kravchik ต่อไป ในบทความสองบทความก่อนหน้านี้ ผู้เขียนได้กล่าวถึงคำอธิบายแนวคิดต่างๆ เช่น และ

คอนสแตนติน คราฟชิค

นักคณิตศาสตร์-นักวิเคราะห์ ผู้เชี่ยวชาญด้านการวิจัยทางสถิติด้านการแพทย์และมนุษยศาสตร์

เมือง: มอสโก

บ่อยครั้งในบทความเกี่ยวกับการศึกษาทางคลินิก คุณจะพบวลีลึกลับ: “ช่วงความมั่นใจ” (95 % CI หรือ 95 % CI - ช่วงความมั่นใจ) ตัวอย่างเช่น บทความอาจเขียนว่า: "เพื่อประเมินความสำคัญของความแตกต่าง การทดสอบของนักเรียนใช้ในการคำนวณช่วงความเชื่อมั่น 95 %"

“ช่วงความเชื่อมั่น 95 %” มีค่าเท่าใด และเหตุใดจึงต้องคำนวณ

ช่วงความเชื่อมั่นคืออะไร? - นี่คือช่วงที่ประชากรที่แท้จริงหมายถึงการโกหก มีค่าเฉลี่ยที่ "ไม่จริง" หรือไม่? ในแง่หนึ่งใช่พวกเขาทำ ใน เราอธิบายว่าเป็นไปไม่ได้ที่จะวัดพารามิเตอร์ที่น่าสนใจในประชากรทั้งหมด ดังนั้นนักวิจัยจึงใช้กลุ่มตัวอย่างที่มีจำกัด ในตัวอย่างนี้ (เช่น ตามน้ำหนักตัว) มีค่าเฉลี่ยหนึ่งค่า (น้ำหนักที่แน่นอน) ซึ่งเราจะตัดสินค่าเฉลี่ยในประชากรทั้งหมด อย่างไรก็ตาม ไม่น่าเป็นไปได้ที่น้ำหนักเฉลี่ยในกลุ่มตัวอย่าง (โดยเฉพาะกลุ่มที่มีขนาดเล็ก) จะตรงกับน้ำหนักเฉลี่ยในประชากรทั่วไป ดังนั้นจึงถูกต้องกว่าในการคำนวณและใช้ช่วงค่าเฉลี่ยของประชากร

ตัวอย่างเช่น จินตนาการว่าช่วงความเชื่อมั่น 95% (95% CI) สำหรับฮีโมโกลบินคือ 110 ถึง 122 กรัม/ลิตร ซึ่งหมายความว่ามีโอกาส 95% ที่ค่าฮีโมโกลบินเฉลี่ยที่แท้จริงในประชากรจะอยู่ระหว่าง 110 ถึง 122 กรัม/ลิตร กล่าวอีกนัยหนึ่งเราไม่ทราบค่าฮีโมโกลบินเฉลี่ยในประชากร แต่ด้วยความน่าจะเป็น 95 % เราสามารถระบุช่วงของค่าสำหรับคุณลักษณะนี้ได้

ช่วงความเชื่อมั่นมีความเกี่ยวข้องอย่างยิ่งกับความแตกต่างในค่าเฉลี่ยระหว่างกลุ่ม หรือขนาดผลกระทบเมื่อมีการเรียก

สมมติว่าเราเปรียบเทียบประสิทธิภาพของการเตรียมธาตุเหล็กสองชนิด: ชนิดหนึ่งที่มีอยู่ในตลาดมาเป็นเวลานานและอีกชนิดที่เพิ่งได้รับการขึ้นทะเบียน หลังจากการบำบัด เราได้ประเมินความเข้มข้นของฮีโมโกลบินในกลุ่มผู้ป่วยที่ทำการศึกษา และโปรแกรมทางสถิติได้คำนวณว่าความแตกต่างระหว่างค่าเฉลี่ยของทั้งสองกลุ่มมีความน่าจะเป็น 95 % ในช่วงตั้งแต่ 1.72 ถึง 14.36 กรัม/ลิตร (ตารางที่ 1)

โต๊ะ 1. ทดสอบตัวอย่างอิสระ
(กลุ่มถูกเปรียบเทียบตามระดับฮีโมโกลบิน)

ควรตีความดังนี้ ในผู้ป่วยบางรายในประชากรทั่วไปที่รับประทานยาใหม่ ฮีโมโกลบินจะสูงกว่าโดยเฉลี่ย 1.72–14.36 กรัม/ลิตร มากกว่าในผู้ป่วยที่รับประทานยาที่ทราบอยู่แล้ว

กล่าวอีกนัยหนึ่ง ในประชากรทั่วไป ความแตกต่างของค่าฮีโมโกลบินเฉลี่ยระหว่างกลุ่มอยู่ภายในขีดจำกัดเหล่านี้โดยมีความน่าจะเป็น 95% ขึ้นอยู่กับผู้วิจัยที่จะตัดสินว่ามากหรือน้อย ประเด็นทั้งหมดก็คือ เราไม่ได้ทำงานกับค่าเฉลี่ยเพียงค่าเดียว แต่ด้วยช่วงของค่า ดังนั้นเราจึงประมาณค่าความแตกต่างในพารามิเตอร์ระหว่างกลุ่มได้อย่างน่าเชื่อถือมากขึ้น

ในแพ็คเกจทางสถิติ คุณสามารถจำกัดหรือขยายขอบเขตของช่วงความเชื่อมั่นได้โดยขึ้นอยู่กับดุลยพินิจของผู้วิจัย การลดความน่าจะเป็นของช่วงความเชื่อมั่นจะทำให้ช่วงของค่าเฉลี่ยแคบลง ตัวอย่างเช่น ที่ 90 % CI ช่วงของค่าเฉลี่ย (หรือความแตกต่างในค่าเฉลี่ย) จะแคบกว่าที่ 95 %

ในทางกลับกัน การเพิ่มความน่าจะเป็นเป็น 99 % จะทำให้ช่วงของค่ากว้างขึ้น เมื่อทำการเปรียบเทียบกลุ่ม ขีดจำกัดล่างของ CI อาจข้ามเครื่องหมายศูนย์ ตัวอย่างเช่น ถ้าเราขยายขอบเขตของช่วงความเชื่อมั่นเป็น 99 % ขอบเขตของช่วงความเชื่อมั่นจะอยู่ในช่วงตั้งแต่ –1 ถึง 16 กรัม/ลิตร ซึ่งหมายความว่าในประชากรทั่วไปมีกลุ่มต่างๆ ซึ่งความแตกต่างระหว่างค่าเฉลี่ยสำหรับคุณลักษณะที่กำลังศึกษาคือ 0 (M = 0)

คุณสามารถทดสอบสมมติฐานทางสถิติได้โดยใช้ช่วงความเชื่อมั่น ถ้าช่วงความเชื่อมั่นข้ามค่าศูนย์ สมมุติฐานว่างซึ่งถือว่ากลุ่มไม่แตกต่างกันตามพารามิเตอร์ที่กำลังศึกษาจะเป็นจริง ตัวอย่างอธิบายไว้ข้างต้นโดยที่เราขยายขอบเขตเป็น 99 % ที่ไหนสักแห่งในประชากรทั่วไปเราพบกลุ่มที่ไม่แตกต่างกันแต่อย่างใด

ช่วงความเชื่อมั่น 95% ของความแตกต่างในฮีโมโกลบิน (กรัม/ลิตร)


รูปนี้แสดงช่วงความเชื่อมั่น 95% สำหรับความแตกต่างของค่าฮีโมโกลบินเฉลี่ยระหว่างทั้งสองกลุ่ม เส้นตรงลากผ่านเครื่องหมายศูนย์ ดังนั้นจึงมีความแตกต่างระหว่างค่าเฉลี่ยของศูนย์ ซึ่งยืนยันสมมติฐานว่างที่ว่ากลุ่มต่างๆ ไม่ได้แตกต่างกัน ช่วงความแตกต่างระหว่างกลุ่มคือตั้งแต่ –2 ถึง 5 กรัม/ลิตร ซึ่งหมายความว่าฮีโมโกลบินสามารถลดลง 2 กรัม/ลิตรหรือเพิ่มขึ้น 5 กรัม/ลิตร

ช่วงความเชื่อมั่นเป็นตัวบ่งชี้ที่สำคัญมาก ด้วยเหตุนี้ คุณจะสามารถดูได้ว่าความแตกต่างในกลุ่มนั้นจริงๆ แล้วเกิดจากความแตกต่างในวิธีการหรือเนื่องจากกลุ่มตัวอย่างขนาดใหญ่ เนื่องจากกลุ่มตัวอย่างขนาดใหญ่โอกาสในการค้นหาความแตกต่างมีมากกว่ากลุ่มตัวอย่างขนาดเล็ก

ในทางปฏิบัติอาจมีลักษณะเช่นนี้ เราสุ่มตัวอย่างจากคน 1,000 คน วัดระดับฮีโมโกลบิน และพบว่าช่วงความเชื่อมั่นสำหรับความแตกต่างในค่าเฉลี่ยอยู่ระหว่าง 1.2 ถึง 1.5 กรัม/ลิตร ระดับนัยสำคัญทางสถิติในกรณีนี้ p

เราเห็นว่าความเข้มข้นของฮีโมโกลบินเพิ่มขึ้น แต่แทบจะมองไม่เห็น ดังนั้นนัยสำคัญทางสถิติจึงปรากฏอย่างแม่นยำเนื่องจากขนาดตัวอย่าง

ช่วงความเชื่อมั่นสามารถคำนวณได้ไม่เพียงแต่สำหรับวิธีการเท่านั้น แต่ยังรวมถึงสัดส่วน (และอัตราส่วนความเสี่ยง) ด้วย ตัวอย่างเช่น เราสนใจช่วงความเชื่อมั่นของสัดส่วนของผู้ป่วยที่ได้รับการบรรเทาอาการขณะรับประทานยาที่พัฒนาแล้ว ให้เราสมมติว่า 95 % CI สำหรับสัดส่วน เช่น สำหรับสัดส่วนของผู้ป่วยดังกล่าว อยู่ในช่วง 0.60–0.80 ดังนั้น เราสามารถพูดได้ว่ายาของเรามีผลการรักษาในกรณี 60 ถึง 80 %