เหตุใดความตรงทางสถิติจึงมีระดับเรียงความ การเตรียมงาน
งานของการศึกษาทางสถิติคือการระบุรูปแบบที่อยู่ในธรรมชาติของปรากฏการณ์ที่กำลังศึกษาอยู่ ตัวบ่งชี้และค่าเฉลี่ยควรทำหน้าที่เป็นภาพสะท้อนของความเป็นจริงซึ่งจำเป็นต้องกำหนดระดับความน่าเชื่อถือ การแสดงตัวอย่างประชากรที่ถูกต้องของประชากรทั่วไปเรียกว่าความเป็นตัวแทน . การวัดความแม่นยำและความน่าเชื่อถือของค่าสถิติตัวอย่างคือข้อผิดพลาดเฉลี่ยของการเป็นตัวแทน (การเป็นตัวแทน) ซึ่งขึ้นอยู่กับขนาดของตัวอย่างและระดับความหลากหลายของประชากรตัวอย่างสำหรับลักษณะที่ศึกษา
ดังนั้นในการกำหนดระดับความน่าเชื่อถือของผลการศึกษาทางสถิติจึงจำเป็นต้องคำนวณข้อผิดพลาดเฉลี่ยที่สอดคล้องกันสำหรับแต่ละค่าสัมพัทธ์และค่าเฉลี่ย ข้อผิดพลาดเฉลี่ยของตัวบ่งชี้ m p คำนวณโดยสูตร:
เมื่อจำนวนการสังเกตน้อยกว่า 30 โดยที่
P - ค่าของตัวบ่งชี้เป็นเปอร์เซ็นต์ ppm เป็นต้น
q - เพิ่มตัวบ่งชี้นี้เป็น 100 หากเป็นเปอร์เซ็นต์ เพิ่มเป็น 1,000 หากเป็น % 0 เป็นต้น (เช่น q = 100–P, 1,000–P เป็นต้น)
ตัวอย่างเช่น เป็นที่ทราบกันดีว่ามีคน 224 คนป่วยด้วยโรคบิดในภูมิภาคในระหว่างปี จำนวนประชากร 33,000 คน อัตราการเกิดโรคบิดใน
ข้อผิดพลาดเฉลี่ยของตัวบ่งชี้นี้
เพื่อแก้ไขปัญหาระดับความน่าเชื่อถือของตัวบ่งชี้ ค่าสัมประสิทธิ์ความเชื่อมั่น (t) จะถูกกำหนดซึ่งเท่ากับอัตราส่วนของตัวบ่งชี้ต่อข้อผิดพลาดเฉลี่ย เช่น
ในตัวอย่างของเรา
ยิ่ง t สูง ระดับความมั่นใจก็จะยิ่งมากขึ้นเท่านั้น ที่ t=1 ความน่าจะเป็นของความน่าเชื่อถือของตัวบ่งชี้คือ 68.3% ที่ t=2 - 95.5% ที่ t=3 - 99.7% ในการศึกษาทางสถิติทางการแพทย์ มักใช้ระดับความเชื่อมั่น (ความน่าเชื่อถือ) ที่ 95.5%–99.0% และในกรณีที่รับผิดชอบมากที่สุด - 99.7% ดังนั้น ในตัวอย่างของเรา อัตราอุบัติการณ์จึงเชื่อถือได้
หากจำนวนการสังเกตน้อยกว่า 30 ค่าของเกณฑ์จะถูกกำหนดโดยตารางของนักเรียน หากค่าที่ได้สูงกว่าหรือเท่ากับค่าตาราง แสดงว่าตัวบ่งชี้มีความน่าเชื่อถือ หากต่ำกว่านี้แสดงว่าไม่ถูกต้อง
หากจำเป็นต้องเปรียบเทียบตัวบ่งชี้ที่เป็นเนื้อเดียวกันสองตัว ความน่าเชื่อถือของความแตกต่างจะถูกกำหนดโดยสูตร:
(ลบจำนวนที่น้อยกว่าออกจากจำนวนที่มากขึ้น)
โดยที่ P 1 –P 2 คือความแตกต่างระหว่างตัวบ่งชี้เปรียบเทียบสองตัว
คือค่าความผิดพลาดเฉลี่ยของความแตกต่างระหว่างตัวบ่งชี้สองตัว
ตัวอย่างเช่น ในเขต B มีคน 270 คนป่วยด้วยโรคบิดในระหว่างปี ประชากรในเขตนี้คือ 45,000 ดังนั้นอุบัติการณ์ของโรคบิด:
เหล่านั้น. อัตราการเกิดถูกต้อง
อย่างที่คุณเห็น อุบัติการณ์ในภูมิภาค B นั้นต่ำกว่าในภูมิภาค A เรากำหนดความน่าเชื่อถือของความแตกต่างระหว่างตัวบ่งชี้ทั้งสองโดยใช้สูตร:
หากมีข้อสังเกตจำนวนมาก (มากกว่า 30 ข้อ) ความแตกต่างของตัวบ่งชี้จะมีนัยสำคัญทางสถิติหาก t = 2 หรือมากกว่า ดังนั้น ในตัวอย่างของเรา อุบัติการณ์ในภูมิภาค A จึงสูงขึ้นอย่างมาก เนื่องจาก ค่าความเชื่อมั่น (t) มากกว่า 2
เมื่อทราบค่าของข้อผิดพลาดเฉลี่ยของตัวบ่งชี้ จึงเป็นไปได้ที่จะกำหนดขีดจำกัดความเชื่อมั่นของตัวบ่งชี้นี้ ทั้งนี้ขึ้นอยู่กับอิทธิพลของสาเหตุแบบสุ่ม ขอบเขตความเชื่อมั่นถูกกำหนดโดยสูตร:
P เป็นตัวบ่งชี้
m คือข้อผิดพลาดเฉลี่ย
t คือปัจจัยความเชื่อมั่นที่เลือกขึ้นอยู่กับค่าความน่าเชื่อถือที่ต้องการ: t=1 สอดคล้องกับความน่าเชื่อถือของผลลัพธ์ในกรณี 68.3%, t=2 - 95.5%, t=2.6 - 99%, t=3 - 99.7 % , t=3.3 - 99.9 ค่านี้เรียกว่าข้อผิดพลาดส่วนเพิ่ม
ตัวอย่างเช่น ในเขต B อัตราอุบัติการณ์ของโรคบิดที่มีความแม่นยำ 99.7-9% อาจผันผวนเนื่องจากปัจจัยสุ่มภายในเช่น จาก 49.1 เป็น 70.9
การทดสอบสมมติฐานดำเนินการโดยใช้การวิเคราะห์ทางสถิติ นัยสำคัญทางสถิติพบได้โดยใช้ค่า P ซึ่งสอดคล้องกับความน่าจะเป็นของเหตุการณ์ที่กำหนดภายใต้สมมติฐานว่าข้อความบางส่วน (สมมติฐานว่าง) เป็นจริง ถ้าค่า P น้อยกว่าระดับนัยสำคัญทางสถิติที่กำหนด (ปกติคือ 0.05) ผู้ทดลองสามารถสรุปได้อย่างปลอดภัยว่าสมมติฐานว่างเป็นเท็จ และพิจารณาสมมติฐานทางเลือกต่อไป เมื่อใช้การทดสอบของนักเรียน คุณสามารถคำนวณค่า P และกำหนดนัยสำคัญสำหรับชุดข้อมูลสองชุดได้
ขั้นตอน
ส่วนที่ 1
การตั้งค่าการทดสอบ- สมมติฐานว่าง (H 0) มักจะระบุว่าไม่มีความแตกต่างระหว่างชุดข้อมูลทั้งสอง ตัวอย่างเช่น นักเรียนที่อ่านเนื้อหาก่อนเรียนจะไม่ได้คะแนนสูงขึ้น
- สมมติฐานทางเลือก (H a) เป็นสิ่งที่ตรงกันข้ามกับสมมติฐานว่างและเป็นข้อความที่ต้องได้รับการยืนยันด้วยข้อมูลการทดลอง ตัวอย่างเช่น นักเรียนที่อ่านเนื้อหาก่อนเรียนจะได้คะแนนสูงกว่า
-
ตั้งค่าระดับนัยสำคัญเพื่อกำหนดว่าการกระจายของข้อมูลจะต้องแตกต่างจากปกติมากน้อยเพียงใดจึงจะถือว่าเป็นผลลัพธ์ที่มีนัยสำคัญ ระดับนัยสำคัญ (เรียกว่า α (\displaystyle \alpha )-ระดับ) เป็นเกณฑ์ที่คุณกำหนดสำหรับนัยสำคัญทางสถิติ ถ้าค่า P น้อยกว่าหรือเท่ากับระดับนัยสำคัญ ข้อมูลจะถูกพิจารณาว่ามีนัยสำคัญทางสถิติ
- ตามกฎแล้ว ระดับความสำคัญ (value α (\displaystyle \alpha )) มีค่าเท่ากับ 0.05 ซึ่งในกรณีนี้ความน่าจะเป็นที่จะตรวจพบความแตกต่างแบบสุ่มระหว่างชุดข้อมูลต่างๆ กันคือ 5% เท่านั้น
- ยิ่งระดับนัยสำคัญยิ่งสูง (และค่า P-value ยิ่งน้อย) ผลลัพธ์ก็ยิ่งน่าเชื่อถือมากขึ้นเท่านั้น
- หากคุณต้องการผลลัพธ์ที่น่าเชื่อถือมากขึ้น ให้ลดค่า P เป็น 0.01 โดยทั่วไปแล้ว ค่า P ที่ต่ำกว่าจะใช้ในการผลิตเมื่อจำเป็นต้องตรวจจับข้อบกพร่องในผลิตภัณฑ์ ในกรณีนี้ จำเป็นต้องมีความเที่ยงตรงสูงเพื่อให้แน่ใจว่าชิ้นส่วนทั้งหมดทำงานตามที่คาดไว้
- สำหรับการทดลองสมมติฐานส่วนใหญ่ ระดับนัยสำคัญที่ 0.05 ก็เพียงพอแล้ว
-
ตัดสินใจว่าคุณจะใช้เกณฑ์ใด:ด้านเดียวหรือสองด้าน สมมติฐานข้อหนึ่งในการทดสอบ t-test ของ Student คือข้อมูลมีการกระจายตามปกติ การแจกแจงแบบปกติคือเส้นโค้งรูประฆังที่มีจำนวนผลลัพธ์สูงสุดอยู่ตรงกลางของเส้นโค้ง การทดสอบ t ของนักเรียนเป็นวิธีการตรวจสอบความถูกต้องของข้อมูลทางคณิตศาสตร์ที่ช่วยให้คุณระบุได้ว่าข้อมูลอยู่นอกการแจกแจงแบบปกติ (มากกว่า น้อยกว่า หรืออยู่ใน "ส่วนท้าย" ของเส้นโค้ง)
- หากคุณไม่แน่ใจว่าข้อมูลอยู่เหนือหรือต่ำกว่ากลุ่มควบคุม ให้ใช้การทดสอบแบบสองด้าน สิ่งนี้จะช่วยให้คุณสามารถระบุนัยสำคัญทั้งสองทิศทางได้
- หากคุณทราบว่าข้อมูลอาจอยู่นอกการแจกแจงแบบปกติไปในทิศทางใด ให้ใช้การทดสอบแบบด้านเดียว ในตัวอย่างข้างต้น เราคาดหวังให้เกรดของนักเรียนสูงขึ้น ดังนั้นจึงสามารถใช้แบบทดสอบด้านเดียวได้
-
กำหนดขนาดตัวอย่างโดยใช้กำลังทางสถิติพลังทางสถิติของการศึกษาคือความน่าจะเป็นที่ขนาดตัวอย่างที่กำหนดจะให้ผลลัพธ์ตามที่คาดหวัง เกณฑ์พลังงานทั่วไป (หรือ β) คือ 80% การวิเคราะห์กำลังโดยไม่มีข้อมูลก่อนหน้าอาจเป็นเรื่องยุ่งยาก เนื่องจากจำเป็นต้องมีข้อมูลบางอย่างเกี่ยวกับค่าเฉลี่ยที่คาดไว้ในแต่ละชุดข้อมูลและส่วนเบี่ยงเบนมาตรฐาน ใช้เครื่องคำนวณกำลังทางสถิติออนไลน์เพื่อกำหนดขนาดตัวอย่างที่เหมาะสมที่สุดสำหรับข้อมูลของคุณ
- โดยทั่วไปแล้ว นักวิจัยจะทำการศึกษานำร่องขนาดเล็กเพื่อให้ข้อมูลสำหรับการวิเคราะห์พลังงานและกำหนดขนาดตัวอย่างที่จำเป็นสำหรับการศึกษาที่ใหญ่ขึ้นและสมบูรณ์ยิ่งขึ้น
- หากคุณไม่มีโอกาสทำการศึกษานำร่อง ให้ลองประมาณค่าเฉลี่ยที่เป็นไปได้ตามข้อมูลวรรณกรรมและผลลัพธ์ของผู้อื่น วิธีนี้อาจช่วยให้คุณกำหนดขนาดตัวอย่างที่เหมาะสมที่สุดได้
ส่วนที่ 2
ค่าเบี่ยงเบนมาตรฐานการคำนวณ-
จดสูตรสำหรับส่วนเบี่ยงเบนมาตรฐาน.ค่าเบี่ยงเบนมาตรฐานบ่งชี้ว่าข้อมูลมีการแพร่กระจายมากเพียงใด ช่วยให้คุณสามารถสรุปได้ว่าข้อมูลที่ได้รับจากตัวอย่างใดตัวอย่างหนึ่งมีความใกล้เคียงกันเพียงใด เมื่อมองแวบแรก สูตรดูเหมือนค่อนข้างซับซ้อน แต่คำอธิบายด้านล่างจะช่วยให้คุณเข้าใจได้ สูตรมีดังนี้: s = √∑((x i – µ) 2 /(N – 1)).
- s - ส่วนเบี่ยงเบนมาตรฐาน
- เครื่องหมาย ∑ บ่งชี้ว่าควรเพิ่มข้อมูลทั้งหมดที่ได้รับจากตัวอย่าง
- x i สอดคล้องกับค่า i-th นั่นคือผลลัพธ์แยกต่างหากที่ได้รับ
- µ คือค่าเฉลี่ยสำหรับกลุ่มนี้
- N คือจำนวนข้อมูลทั้งหมดในตัวอย่าง
-
หาค่าเฉลี่ยในแต่ละกลุ่มในการคำนวณส่วนเบี่ยงเบนมาตรฐาน ก่อนอื่นคุณต้องหาค่าเฉลี่ยสำหรับแต่ละกลุ่มการศึกษา ค่าเฉลี่ยจะแสดงด้วยตัวอักษรกรีก µ (mu) หากต้องการหาค่าเฉลี่ย เพียงเพิ่มค่าผลลัพธ์ทั้งหมดแล้วหารด้วยจำนวนข้อมูล (ขนาดตัวอย่าง)
- ตัวอย่างเช่น หากต้องการหาเกรดเฉลี่ยในกลุ่มนักเรียนที่ศึกษาเนื้อหาก่อนเรียน ให้พิจารณาชุดข้อมูลขนาดเล็ก เพื่อความง่าย เราใช้ชุดของจุดห้าจุด: 90, 91, 85, 83 และ 94
- บวกค่าทั้งหมดเข้าด้วยกัน: 90 + 91 + 85 + 83 + 94 = 443
- หารผลรวมด้วยจำนวนค่า N = 5: 443/5 = 88.6
- ดังนั้นค่าเฉลี่ยของกลุ่มนี้คือ 88.6
-
ลบแต่ละค่าที่ได้จากค่าเฉลี่ยขั้นตอนต่อไปคือการคำนวณความแตกต่าง (x i - µ) ในการทำเช่นนี้ ให้ลบแต่ละค่าที่ได้รับจากค่าเฉลี่ยที่พบ ในตัวอย่างของเรา เราจำเป็นต้องค้นหาความแตกต่างห้าประการ:
- (90 - 88.6), (91 - 88.6), (85 - 88.6), (83 - 88.6) และ (94 - 88.6)
- ผลลัพธ์ที่ได้คือ 1.4, 2.4, -3.6, -5.6 และ 5.4
-
นำแต่ละค่าที่ได้มายกกำลังสองแล้วบวกเข้าด้วยกันแต่ละปริมาณที่เพิ่งพบควรยกกำลังสอง ขั้นตอนนี้จะลบค่าลบทั้งหมด หากหลังจากขั้นตอนนี้คุณยังมีจำนวนติดลบ แสดงว่าคุณลืมยกกำลังสอง
- ตัวอย่างของเรา เราจะได้ 1.96, 5.76, 12.96, 31.36 และ 29.16
- เราเพิ่มค่าที่ได้รับ: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2
-
หารด้วยขนาดตัวอย่าง ลบ 1ในสูตรผลรวมหารด้วย N - 1 เนื่องจากเราไม่ได้คำนึงถึงประชากรทั่วไป แต่นำตัวอย่างของนักเรียนทั้งหมดมาประเมิน
- ลบ: N - 1 = 5 - 1 = 4
- แบ่ง: 81.2/4 = 20.3
-
หารากที่สองหลังจากหารผลรวมด้วยขนาดตัวอย่างลบหนึ่งแล้ว ให้หารากที่สองของค่าที่พบ นี่เป็นขั้นตอนสุดท้ายในการคำนวณส่วนเบี่ยงเบนมาตรฐาน มีโปรแกรมทางสถิติที่หลังจากป้อนข้อมูลเริ่มต้นแล้วให้ทำการคำนวณที่จำเป็นทั้งหมด
- ในตัวอย่างของเรา ค่าเบี่ยงเบนมาตรฐานของคะแนนของนักเรียนที่อ่านเนื้อหาก่อนเริ่มเรียนคือ s = √20.3 = 4.51
ตอนที่ 3
กำหนดความสำคัญ-
คำนวณความแปรปรวนระหว่างข้อมูลสองกลุ่มจนถึงขั้นตอนนี้ เราได้พิจารณาตัวอย่างสำหรับกลุ่มข้อมูลเพียงกลุ่มเดียว หากคุณต้องการเปรียบเทียบสองกลุ่ม แน่นอนว่าคุณควรนำข้อมูลของทั้งสองกลุ่มมาเปรียบเทียบกัน คำนวณค่าเบี่ยงเบนมาตรฐานสำหรับข้อมูลกลุ่มที่สอง แล้วหาค่าความแปรปรวนระหว่างกลุ่มทดลองทั้งสอง การกระจายคำนวณโดยใช้สูตรต่อไปนี้: s d = √((s 1 /N 1) + (s 2 /N 2))
กำหนดสมมติฐานของคุณขั้นตอนแรกในการประเมินนัยสำคัญทางสถิติคือการเลือกคำถามที่คุณต้องการคำตอบและกำหนดสมมติฐาน สมมติฐานคือคำสั่งเกี่ยวกับข้อมูลการทดลอง การแจกแจง และคุณสมบัติต่างๆ สำหรับการทดลองใดๆ ก็ตาม มีทั้งสมมติฐานที่เป็นโมฆะและสมมติฐานทางเลือก โดยทั่วไป คุณจะต้องเปรียบเทียบข้อมูลสองชุดเพื่อดูว่ามีความเหมือนหรือแตกต่างกันหรือไม่
ฟังก์ชั่นจ่ายคุณลักษณะที่มีนัยสำคัญทางสถิติมีให้บริการในแผนการกำหนดราคาบางแผนเท่านั้น ตรวจสอบว่าอยู่ใน
คุณสามารถดูได้ว่าคำตอบที่ได้รับจากกลุ่มต่างๆ ของผู้ตอบคำถามในแบบสำรวจมีความแตกต่างกันอย่างมีนัยสำคัญทางสถิติหรือไม่ ในการทำงานกับฟังก์ชันนัยสำคัญทางสถิติใน SurveyMonkey คุณต้อง:
- เปิดใช้ฟีเจอร์นัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ เลือกกลุ่มเปรียบเทียบเพื่อจัดเรียงผลการสำรวจออกเป็นกลุ่มเพื่อให้เปรียบเทียบได้ง่าย
- ตรวจสอบตารางข้อมูลสำหรับคำถามแบบสำรวจของคุณเพื่อดูว่ามีความแตกต่างอย่างมีนัยสำคัญทางสถิติในคำตอบที่ได้รับจากกลุ่มผู้ตอบที่แตกต่างกันหรือไม่
การดูนัยสำคัญทางสถิติ
เมื่อทำตามขั้นตอนด้านล่าง คุณจะสามารถสร้างแบบสำรวจที่แสดงนัยสำคัญทางสถิติได้
1. เพิ่มคำถามที่ปิดในแบบสำรวจของคุณ
ในการแสดงนัยสำคัญทางสถิติระหว่างการวิเคราะห์ผลลัพธ์ คุณจะต้องใช้กฎการเปรียบเทียบกับคำถามใดๆ จากแบบสำรวจของคุณ
คุณสามารถใช้กฎการเปรียบเทียบและคำนวณนัยสำคัญทางสถิติในคำตอบ หากคุณใช้คำถามประเภทใดประเภทหนึ่งต่อไปนี้ในการออกแบบแบบสำรวจของคุณ:
จำเป็นต้องตรวจสอบให้แน่ใจว่าตัวเลือกคำตอบที่เสนอสามารถแบ่งออกเป็นกลุ่มที่สมบูรณ์ได้ ตัวเลือกคำตอบที่คุณเลือกสำหรับการเปรียบเทียบเมื่อคุณสร้างกฎการเปรียบเทียบจะถูกใช้เพื่อข้ามแท็บข้อมูลของคุณตลอดแบบสำรวจ
2. รวบรวมคำตอบ
เมื่อคุณทำแบบสำรวจเสร็จแล้ว ให้สร้างตัวรวบรวมเพื่อแจกจ่าย มีหลายวิธี
คุณต้องได้รับการตอบกลับอย่างน้อย 30 รายการสำหรับแต่ละตัวเลือกคำตอบที่คุณวางแผนจะใช้ในกฎการเปรียบเทียบของคุณ เพื่อเปิดใช้งานและดูนัยสำคัญทางสถิติ
ตัวอย่างการสำรวจความคิดเห็น
คุณต้องการทราบว่าผู้ชายพอใจกับผลิตภัณฑ์ของคุณมากกว่าผู้หญิงหรือไม่
- เพิ่มคำถามปรนัยสองข้อในแบบสำรวจของคุณ:
เพศของคุณคืออะไร? (เพศชายเพศหญิง)
คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเราหรือไม่? (พอใจ (-ลินิน) ไม่พอใจ (-ลินิน)) - ตรวจสอบให้แน่ใจว่าผู้ตอบอย่างน้อย 30 คนเลือก 'ชาย' สำหรับคำถามเรื่องเพศ และผู้ตอบอย่างน้อย 30 คนเลือก 'หญิง' เป็นเพศของตน
- เพิ่มกฎการเปรียบเทียบให้กับคำถาม "คุณเป็นเพศอะไร" และเลือกทั้งสองคำตอบเป็นกลุ่มของคุณ
- ใช้แผ่นข้อมูลด้านล่างแผนภูมิคำถาม "คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเรา" เพื่อดูว่าตัวเลือกคำตอบใดแสดงความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่
ความแตกต่างอย่างมีนัยสำคัญทางสถิติคืออะไร?
ความแตกต่างที่มีนัยสำคัญทางสถิติหมายความว่า เมื่อใช้การวิเคราะห์ทางสถิติ จะมีความแตกต่างอย่างมีนัยสำคัญระหว่างคำตอบของผู้ตอบแบบสอบถามกลุ่มหนึ่งกับคำตอบของอีกกลุ่มหนึ่ง นัยสำคัญทางสถิติ หมายความว่า ตัวเลขที่ได้มีความแตกต่างกันอย่างมีนัยสำคัญ ความรู้ดังกล่าวจะช่วยคุณอย่างมากในการวิเคราะห์ข้อมูล อย่างไรก็ตาม คุณเป็นผู้กำหนดความสำคัญของผลลัพธ์ที่ได้รับ คุณเป็นผู้ตัดสินใจว่าจะตีความผลลัพธ์ของแบบสำรวจอย่างไรและควรดำเนินการอย่างไรตามผลการสำรวจ
ตัวอย่างเช่น คุณได้รับการอ้างสิทธิ์จากนักช้อปหญิงมากกว่านักช้อปชาย จะทราบได้อย่างไรว่าความแตกต่างดังกล่าวเป็นจริงและจำเป็นต้องมีการดำเนินการในเรื่องนี้หรือไม่? วิธีหนึ่งที่ดีในการทดสอบข้อสังเกตของคุณคือการทำแบบสำรวจที่จะแสดงให้คุณเห็นว่าลูกค้าผู้ชายพึงพอใจกับผลิตภัณฑ์ของคุณมากกว่าหรือไม่ ด้วยความช่วยเหลือของสูตรทางสถิติ ฟังก์ชันนัยสำคัญทางสถิติที่เราเสนอจะช่วยให้คุณระบุได้ว่าผลิตภัณฑ์ของคุณเป็นที่ชื่นชอบของผู้ชายมากกว่าผู้หญิงหรือไม่ สิ่งนี้จะช่วยให้คุณสามารถดำเนินการตามข้อเท็จจริง ไม่ใช่การคาดเดา
ความแตกต่างอย่างมีนัยสำคัญทางสถิติ
หากผลลัพธ์ของคุณถูกเน้นในตารางข้อมูล แสดงว่าผู้ตอบแบบสอบถามทั้งสองกลุ่มมีความแตกต่างกันอย่างมาก คำว่า "มีนัยสำคัญ" ไม่ได้หมายความว่าตัวเลขที่ได้มีความสำคัญหรือมีนัยสำคัญเป็นพิเศษ แต่เป็นเพียงความแตกต่างทางสถิติเท่านั้น
ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติ
หากผลลัพธ์ของคุณไม่ได้ถูกเน้นในตารางข้อมูลที่สอดคล้องกัน หมายความว่า แม้ว่าตัวเลขเปรียบเทียบทั้งสองจะมีความแตกต่างกัน แต่ก็ไม่มีความแตกต่างทางสถิติระหว่างผลลัพธ์ทั้งสอง
คำตอบที่ไม่มีความแตกต่างอย่างมีนัยสำคัญทางสถิติแสดงให้เห็นว่าไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างสองรายการเปรียบเทียบตามขนาดตัวอย่างที่คุณใช้ แต่ก็ไม่ได้หมายความว่าไม่สำคัญเสมอไป บางทีการเพิ่มขนาดตัวอย่าง คุณจะสามารถระบุความแตกต่างที่มีนัยสำคัญทางสถิติได้
ขนาดตัวอย่าง
หากคุณมีขนาดตัวอย่างที่เล็กมาก ความแตกต่างอย่างมากระหว่างสองกลุ่มเท่านั้นที่จะมีความสำคัญ หากคุณมีขนาดตัวอย่างที่ใหญ่มาก ความแตกต่างทั้งเล็กน้อยและมากจะถูกนับว่ามีนัยสำคัญ
อย่างไรก็ตาม หากตัวเลขสองตัวมีความแตกต่างกันทางสถิติ ไม่ได้หมายความว่าความแตกต่างระหว่างผลลัพธ์มีความสำคัญในทางปฏิบัติสำหรับคุณ คุณจะต้องตัดสินใจด้วยตัวเองว่าข้อแตกต่างใดที่สำคัญสำหรับแบบสำรวจของคุณ
การคำนวณนัยสำคัญทางสถิติ
เราคำนวณนัยสำคัญทางสถิติโดยใช้ระดับความเชื่อมั่นมาตรฐาน 95% หากตัวเลือกคำตอบแสดงนัยสำคัญทางสถิติ หมายความว่ามีโอกาสน้อยกว่า 5% ของความแตกต่างระหว่างสองกลุ่มเนื่องจากโอกาสหรือข้อผิดพลาดในการสุ่มตัวอย่างเพียงอย่างเดียว (มักแสดงเป็น: p<0,05).
ในการคำนวณความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างกลุ่ม เราใช้สูตรต่อไปนี้:
พารามิเตอร์ |
คำอธิบาย | |
---|---|---|
ก1 | สัดส่วนของผู้เข้าร่วมจากกลุ่มแรกที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดตัวอย่างของกลุ่มนี้ | |
ข1 | สัดส่วนของผู้เข้าร่วมจากกลุ่มที่สองที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดตัวอย่างของกลุ่มนี้ | |
ส่วนแบ่งตัวอย่างรวม (p) | ผลรวมของสองหุ้นจากทั้งสองกลุ่ม | |
ข้อผิดพลาดมาตรฐาน (SE) | การวัดว่าส่วนแบ่งของคุณแตกต่างจากส่วนแบ่งจริงของคุณมากน้อยเพียงใด ค่าที่น้อยกว่าหมายความว่าส่วนแบ่งนั้นใกล้เคียงกับส่วนแบ่งจริง ค่าที่มากขึ้นหมายความว่าส่วนแบ่งนั้นแตกต่างจากส่วนแบ่งจริงอย่างมาก | |
สถิติทดสอบ (t) | ทดสอบสถิติ. จำนวนค่าเบี่ยงเบนมาตรฐานที่ค่านี้แตกต่างจากค่าเฉลี่ย | |
นัยสำคัญทางสถิติ | หากค่าสัมบูรณ์ของสถิติทดสอบเกิน 1.96* ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ให้ถือว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติ |
*1.96 เป็นค่าที่ใช้สำหรับระดับความเชื่อมั่น 95% เนื่องจาก 95% ของช่วงที่ดำเนินการโดยการทดสอบของนักเรียนนั้นอยู่ภายใน 1.96 ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ย
ตัวอย่างการคำนวณ
ต่อด้วยตัวอย่างที่ใช้ด้านบน มาดูกันว่าเปอร์เซ็นต์ของผู้ชายที่กล่าวว่าพวกเขาพอใจกับผลิตภัณฑ์ของคุณนั้นสูงกว่าเปอร์เซ็นต์ของผู้หญิงอย่างมีนัยสำคัญหรือไม่
สมมติว่าผู้ชาย 1,000 คนและผู้หญิง 1,000 คนมีส่วนร่วมในการสำรวจของคุณ และจากผลการสำรวจพบว่าผู้ชาย 70% และผู้หญิง 65% บอกว่าพวกเขาพอใจกับผลิตภัณฑ์ของคุณ คะแนนที่ 70% สูงกว่าคะแนนที่ 65% อย่างมีนัยสำคัญหรือไม่?
แทนที่ข้อมูลต่อไปนี้จากแบบสำรวจลงในสูตรที่แนะนำ:
- p1 (% ของผู้ชายที่พอใจกับผลิตภัณฑ์) = 0.7
- p2 (% ของผู้หญิงที่พอใจกับผลิตภัณฑ์) = 0.65
- n1 (จำนวนผู้ชายที่สัมภาษณ์) = 1,000
- n2 (จำนวนผู้หญิงที่สัมภาษณ์) = 1,000
เนื่องจากค่าสัมบูรณ์ของสถิติการทดสอบมีค่ามากกว่า 1.96 หมายความว่าความแตกต่างระหว่างชายและหญิงมีนัยสำคัญ เมื่อเทียบกับผู้หญิงแล้ว ผู้ชายมีแนวโน้มที่จะพอใจกับผลิตภัณฑ์ของคุณมากกว่า
ซ่อนนัยสำคัญทางสถิติ
วิธีซ่อนนัยสำคัญทางสถิติสำหรับคำถามทั้งหมด
- คลิกลูกศรชี้ลงทางขวาของกฎการเปรียบเทียบในแถบด้านข้างซ้าย
- เลือกรายการ แก้ไขกฎ.
- ปิดการใช้งานคุณสมบัติ แสดงนัยสำคัญทางสถิติโดยใช้สวิตช์
- คลิกที่ปุ่ม นำมาใช้.
หากต้องการซ่อนนัยสำคัญทางสถิติสำหรับคำถามเดียว คุณต้อง:
- คลิกที่ปุ่ม ปรับแต่งเหนือแผนภาพคำถาม
- เปิดแท็บ ตัวเลือกการแสดงผล.
- ยกเลิกการทำเครื่องหมายที่ช่องถัดจาก นัยสำคัญทางสถิติ.
- คลิกที่ปุ่ม บันทึก.
ตัวเลือกการแสดงผลจะเปิดใช้งานโดยอัตโนมัติเมื่อเปิดใช้งานการแสดงนัยสำคัญทางสถิติ หากคุณยกเลิกการเลือกตัวเลือกการแสดงผลนี้ การแสดงนัยสำคัญทางสถิติจะถูกปิดใช้งานด้วย
เปิดฟีเจอร์นัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ ตรวจสอบตารางข้อมูลสำหรับคำถามแบบสำรวจของคุณเพื่อระบุความแตกต่างที่มีนัยสำคัญทางสถิติในคำตอบที่ได้รับจากกลุ่มผู้ตอบที่แตกต่างกัน
นัยสำคัญทางสถิติ
ผลลัพธ์ที่ได้โดยใช้ขั้นตอนการวิจัยบางอย่างเรียกว่า อย่างมีนัยสำคัญทางสถิติหากความน่าจะเป็นของการเกิดขึ้นแบบสุ่มมีน้อยมาก แนวคิดนี้สามารถแสดงให้เห็นได้จากตัวอย่างการโยนเหรียญ สมมติว่าเหรียญถูกพลิก 30 ครั้ง; ออกหัว 17 ครั้ง และออกก้อย 13 ครั้ง ใช่ไหม สำคัญนี่เป็นการเบี่ยงเบนจากผลลัพธ์ที่คาดไว้ (15 หัวและ 15 ก้อย) หรือนี่เป็นเรื่องบังเอิญ? ในการตอบคำถามนี้ คุณสามารถเช่น โยนเหรียญเดียวกันหลายๆ ครั้ง 30 ครั้งติดต่อกัน และในขณะเดียวกันก็สังเกตว่ามีการทำซ้ำอัตราส่วนของหัวและก้อยเท่ากับ 17:13 กี่ครั้ง การวิเคราะห์ทางสถิติช่วยเราจากกระบวนการที่น่าเบื่อนี้ ด้วยความช่วยเหลือของมัน หลังจากการโยน 30 เหรียญแรก เป็นไปได้ที่จะประมาณจำนวนการเกิดขึ้นแบบสุ่มที่เป็นไปได้ของ 17 หัวและ 13 ก้อย ค่าประมาณดังกล่าวเรียกว่า งบความน่าจะเป็น
ในวรรณกรรมทางวิทยาศาสตร์เกี่ยวกับจิตวิทยาอุตสาหกรรมและองค์กร ประโยคความน่าจะเป็นในรูปแบบคณิตศาสตร์จะแสดงด้วยนิพจน์ ร(ความน่าจะเป็น)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (ร< 0.01). ข้อเท็จจริงนี้มีความสำคัญต่อการทำความเข้าใจวรรณกรรม แต่ไม่ควรถือเอาว่าไม่มีจุดหมายที่จะตั้งข้อสังเกตที่ไม่ตรงตามมาตรฐานเหล่านี้ เรียกว่าผลการวิจัยที่ไม่มีนัยสำคัญ (ข้อสังเกต ที่ได้มาโดยบังเอิญ มากกว่าหนึ่งหรือห้าครั้งจาก 100 ครั้ง) จะมีประโยชน์มากสำหรับการระบุแนวโน้มและเป็นแนวทางสำหรับการวิจัยในอนาคต
ควรสังเกตด้วยว่าไม่ใช่นักจิตวิทยาทุกคนที่เห็นด้วยกับมาตรฐานและขั้นตอนแบบดั้งเดิม (เช่น Cohen, 1994; Sauley & Bedeian, 1989) ประเด็นการวัดในตัวเองเป็นจุดสนใจหลักของงานสำหรับนักวิจัยหลายคนที่ศึกษาความถูกต้องของวิธีการวัดและสมมติฐานที่สนับสนุนวิธีการและมาตรฐานที่มีอยู่ ตลอดจนการพัฒนายาและเครื่องมือใหม่ๆ บางทีในอนาคต การวิจัยในอำนาจนี้จะนำไปสู่การเปลี่ยนแปลงมาตรฐานดั้งเดิมสำหรับการประเมินนัยสำคัญทางสถิติ และการเปลี่ยนแปลงเหล่านี้จะได้รับการยอมรับในระดับสากล (บทที่ห้าของสมาคมจิตวิทยาอเมริกันรวบรวมนักจิตวิทยาที่เชี่ยวชาญในการศึกษาการประเมิน การวัด และสถิติ)
ในรายงานการวิจัย ข้อความแสดงความน่าจะเป็น เช่น ร< 0.05 เนื่องจากบางส่วน สถิตินั่นคือ ตัวเลขที่ได้มาจากชุดขั้นตอนการคำนวณทางคณิตศาสตร์ชุดหนึ่ง การยืนยันความน่าจะเป็นทำได้โดยการเปรียบเทียบสถิติเหล่านี้กับข้อมูลจากตารางพิเศษที่เผยแพร่เพื่อจุดประสงค์นี้ ในการวิจัยเชิงจิตวิทยาเชิงอุตสาหกรรมและองค์กร สถิติเช่น r, F, t, r>(อ่านว่า "ไคสแควร์") และ ร(อ่านว่า "ทวีคูณ ร").ในแต่ละกรณี สถิติ (ตัวเลขหนึ่งตัว) ที่ได้จากการวิเคราะห์ชุดการสังเกตสามารถเปรียบเทียบได้กับตัวเลขจากตารางที่เผยแพร่ หลังจากนั้นก็เป็นไปได้ที่จะกำหนดคำแถลงความน่าจะเป็นเกี่ยวกับความน่าจะเป็นของการสุ่มรับตัวเลขนี้ นั่นคือ เพื่อหาข้อสรุปเกี่ยวกับความสำคัญของการสังเกต
เพื่อให้เข้าใจการศึกษาที่อธิบายไว้ในหนังสือเล่มนี้ ก็เพียงพอแล้วที่จะมีความเข้าใจที่ชัดเจนเกี่ยวกับแนวคิดของนัยสำคัญทางสถิติ และไม่จำเป็นต้องรู้ว่าสถิติที่กล่าวถึงข้างต้นคำนวณอย่างไร อย่างไรก็ตาม จะเป็นประโยชน์หากจะหารือเกี่ยวกับข้อสันนิษฐานหนึ่งข้อที่อยู่ภายใต้ขั้นตอนเหล่านี้ทั้งหมด นี่คือสมมติฐานที่ว่าตัวแปรที่สังเกตได้ทั้งหมดมีการกระจายโดยประมาณตามกฎหมายปกติ นอกจากนี้ เมื่ออ่านรายงานเกี่ยวกับการวิจัยทางจิตวิทยาในองค์กรและอุตสาหกรรม มักจะมีแนวคิดอีกสามแนวคิดที่มีบทบาทสำคัญ ประการแรก สหสัมพันธ์และสหสัมพันธ์ ประการที่สอง ตัวแปรกำหนด / ตัวทำนาย และ "ANOVA" (การวิเคราะห์ความแปรปรวน) ประการที่สาม ซึ่งเป็นกลุ่มของวิธีการทางสถิติที่มีชื่อทั่วไปว่า "การวิเคราะห์อภิมาน"
ทุกวันนี้มันง่ายเกินไป: คุณสามารถเดินไปที่คอมพิวเตอร์และมีความรู้เพียงเล็กน้อยหรือไม่มีเลยเกี่ยวกับสิ่งที่คุณกำลังทำอยู่ สร้างเรื่องไร้สาระด้วยความเร็วที่น่าทึ่งอย่างแท้จริง (เจ.บ็อกซ์)
คำศัพท์และแนวคิดพื้นฐานของเวชสถิติ
ในบทความนี้ เราจะนำเสนอแนวคิดหลักบางประการเกี่ยวกับสถิติที่เกี่ยวข้องกับการวิจัยทางการแพทย์ เงื่อนไขจะกล่าวถึงในรายละเอียดเพิ่มเติมในบทความที่เกี่ยวข้อง
การเปลี่ยนแปลง
คำนิยาม.ระดับการกระจายของข้อมูล (ค่าเครื่องหมาย) ในช่วงของค่า
ความน่าจะเป็น
คำนิยาม. ความน่าจะเป็นคือระดับที่เหตุการณ์บางอย่างสามารถเกิดขึ้นได้ภายใต้เงื่อนไขบางประการ
ตัวอย่าง. ให้เราอธิบายคำจำกัดความของคำศัพท์ในประโยค "ความน่าจะเป็นของการกู้คืนเมื่อใช้ยา Arimidex คือ 70%" เหตุการณ์คือ "การฟื้นตัวของผู้ป่วย" เงื่อนไข "ผู้ป่วยกำลังรับ Arimidex" ระดับความเป็นไปได้คือ 70% (โดยคร่าว ๆ จาก 100 คนที่รับ Arimidex 70 คนหาย)
ความน่าจะเป็นสะสม
คำนิยาม.ความน่าจะเป็นสะสมของการรอดชีวิต ณ เวลา t เท่ากับสัดส่วนของผู้ป่วยที่รอดชีวิตในขณะนั้น
ตัวอย่าง. หากมีการกล่าวว่าความน่าจะเป็นสะสมของการรอดชีวิตหลังจากการรักษาเป็นเวลา 5 ปีคือ 0.7 นั่นหมายความว่าในกลุ่มผู้ป่วยที่พิจารณาแล้ว 70% ของจำนวนเริ่มต้นยังคงมีชีวิตอยู่และ 30% เสียชีวิต กล่าวอีกนัยหนึ่งจากทุกๆ ร้อยคน 30 คนเสียชีวิตภายใน 5 ปีแรก
เวลาไปงาน
คำนิยาม.เวลาถึงเหตุการณ์ - นี่คือเวลาที่แสดงในหน่วยบางหน่วย นับจากเวลาเริ่มต้นจนกระทั่งเกิดเหตุการณ์บางอย่าง
คำอธิบาย. หน่วยของเวลาในการวิจัยทางการแพทย์คือ วัน เดือน และปี
ตัวอย่างทั่วไปของเวลาเริ่มต้น:
เริ่มการติดตามผลผู้ป่วย
การผ่าตัดรักษา
ตัวอย่างทั่วไปของเหตุการณ์ที่พิจารณา:
ความก้าวหน้าของโรค
การเกิดซ้ำ
ผู้ป่วยเสียชีวิต
ตัวอย่าง
คำนิยาม.ส่วนหนึ่งของประชากรที่ได้จากการคัดเลือก
จากผลการวิเคราะห์ตัวอย่าง จะมีการสรุปผลเกี่ยวกับประชากรทั้งหมด ซึ่งจะใช้ได้ก็ต่อเมื่อการเลือกสุ่มเท่านั้น เนื่องจากการสุ่มเลือกจากประชากรนั้นเป็นไปไม่ได้ในทางปฏิบัติ เราควรพยายามเพื่อให้แน่ใจว่าตัวอย่างนั้นเป็นตัวแทนของประชากรเป็นอย่างน้อย
ตัวอย่างขึ้นอยู่กับและเป็นอิสระ
คำนิยาม.กลุ่มตัวอย่างที่คัดเลือกวัตถุประสงค์ของการศึกษาโดยอิสระจากกัน ทางเลือกอื่นสำหรับตัวอย่างอิสระขึ้นอยู่กับตัวอย่าง (เชื่อมต่อ, จับคู่)
สมมติฐาน
สมมติฐานทวิภาคีและฝ่ายเดียว
ให้เราอธิบายการใช้คำว่าสมมติฐานในสถิติก่อน
เป้าหมายของการวิจัยส่วนใหญ่คือการทดสอบความจริงของข้อความบางส่วน จุดประสงค์ของการทดสอบยาส่วนใหญ่มักจะทดสอบสมมติฐานที่ว่ายาตัวใดตัวหนึ่งมีประสิทธิภาพมากกว่าตัวอื่น (เช่น Arimidex มีประสิทธิภาพมากกว่า Tamoxifen)
เพื่อถ่ายทอดความเข้มงวดของการศึกษา ข้อความที่ได้รับการตรวจสอบจะแสดงทางคณิตศาสตร์ ตัวอย่างเช่น ถ้า A คือจำนวนปีที่ผู้ป่วยที่ใช้ Arimidex จะมีชีวิตอยู่ และ T คือจำนวนปีที่ผู้ป่วยที่รักษาด้วย Tamoxifen จะมีชีวิตอยู่ สมมติฐานที่จะทดสอบสามารถเขียนเป็น A>T
คำนิยาม.สมมติฐานเรียกว่าสองด้านถ้ามันประกอบด้วยความเท่าเทียมกันของสองปริมาณ
ตัวอย่างของสมมติฐานสองด้าน: A=T
คำนิยาม. สมมติฐานเรียกว่าด้านเดียว (ด้านเดียว) ถ้าประกอบด้วยความไม่เท่าเทียมกันของสองปริมาณ
ตัวอย่างของสมมติฐานด้านเดียว:
ข้อมูลแบบสองขั้ว (ไบนารี)
คำนิยาม.ข้อมูลแสดงด้วยค่าทางเลือกที่ถูกต้องเพียงสองค่า
ตัวอย่าง: ผู้ป่วย "แข็งแรง" - "ป่วย" อาการบวมน้ำ "คือ" - "ไม่มีอยู่"
ช่วงความเชื่อมั่น
คำนิยาม.ช่วงความเชื่อมั่นสำหรับบางปริมาณคือช่วงรอบค่าของปริมาณที่มีค่าที่แท้จริงของปริมาณนั้น (โดยมีระดับความเชื่อมั่นหนึ่งๆ)
ตัวอย่าง. ให้ปริมาณที่กำลังศึกษาเป็นจำนวนผู้ป่วยต่อปี โดยเฉลี่ยแล้ว จำนวนของพวกเขาคือ 500 และช่วงความมั่นใจ 95% คือ (350, 900) ซึ่งหมายความว่า เป็นไปได้มาก (ด้วยความน่าจะเป็น 95%) อย่างน้อย 350 และไม่เกิน 900 คนจะติดต่อคลินิกในระหว่างปี
การกำหนด ตัวย่อทั่วไปคือ: 95% CI (95% CI) คือช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่น 95%
ความน่าเชื่อถือมีนัยสำคัญทางสถิติ (ระดับ P)
คำนิยาม.นัยสำคัญทางสถิติของผลลัพธ์คือการวัดความเชื่อมั่นใน "ความจริง"
การวิจัยใด ๆ ขึ้นอยู่กับวัตถุเพียงบางส่วนเท่านั้น การศึกษาประสิทธิภาพของยาไม่ได้ดำเนินการบนพื้นฐานของผู้ป่วยทุกรายในโลกโดยทั่วไป แต่เฉพาะกับผู้ป่วยบางกลุ่มเท่านั้น (เป็นไปไม่ได้ที่จะทำการวิเคราะห์บนพื้นฐานของผู้ป่วยทุกราย)
สมมติว่าข้อสรุปบางอย่างเกิดขึ้นจากการวิเคราะห์ (ตัวอย่างเช่น การใช้ Arimidex ในการบำบัดอย่างเพียงพอจะมีประสิทธิภาพมากกว่า Tamoxifen ถึง 2 เท่า)
คำถามที่ต้องถามคือ: "คุณสามารถเชื่อถือผลลัพธ์นี้ได้มากแค่ไหน"
ลองนึกภาพว่าเรากำลังทำการศึกษาจากผู้ป่วยเพียงสองคน แน่นอน ในกรณีนี้ ผลลัพธ์ควรได้รับการปฏิบัติด้วยความกังวล หากผู้ป่วยจำนวนมากได้รับการตรวจ (ค่าตัวเลขของ "จำนวนมาก" ขึ้นอยู่กับสถานการณ์) ข้อสรุปที่ได้จะเชื่อถือได้อยู่แล้ว
ดังนั้น ระดับของความไว้วางใจจะถูกกำหนดโดยค่าของระดับ p (p-value)
ระดับ p ที่สูงขึ้นสอดคล้องกับระดับความเชื่อมั่นที่ต่ำกว่าในผลลัพธ์ที่ได้จากการวิเคราะห์ตัวอย่าง ตัวอย่างเช่น ระดับ p เท่ากับ 0.05 (5%) แสดงให้เห็นว่าข้อสรุปที่เกิดขึ้นในระหว่างการวิเคราะห์ของกลุ่มใดกลุ่มหนึ่งเป็นเพียงลักษณะสุ่มของวัตถุเหล่านี้ที่มีความน่าจะเป็นเพียง 5%
กล่าวอีกนัยหนึ่งด้วยความน่าจะเป็นที่สูงมาก (95%) ข้อสรุปสามารถขยายไปยังวัตถุทั้งหมดได้
ในการศึกษาจำนวนมาก 5% ถือเป็นค่า p ที่ยอมรับได้ ซึ่งหมายความว่า ตัวอย่างเช่น ถ้า p=0.01 ผลลัพธ์สามารถเชื่อถือได้ แต่ถ้า p=0.06 แสดงว่าเป็นไปไม่ได้
ศึกษา
การศึกษาในอนาคตเป็นการศึกษาที่เลือกตัวอย่างจากปัจจัยนำเข้าและวิเคราะห์ปัจจัยที่เป็นผลลัพธ์ในตัวอย่าง
การศึกษาย้อนหลังเป็นการศึกษาที่เลือกตัวอย่างจากปัจจัยที่เป็นผลลัพธ์และวิเคราะห์ปัจจัยนำเข้าบางส่วนในตัวอย่าง
ตัวอย่าง. ปัจจัยเริ่มต้นคือหญิงตั้งครรภ์ที่มีอายุน้อยกว่า/มากกว่า 20 ปี ผลที่ได้คือเด็กเบา/หนักกว่า 2.5 กก. เราวิเคราะห์ว่าน้ำหนักของเด็กขึ้นอยู่กับอายุของแม่หรือไม่
หากเราสุ่มตัวอย่าง 2 กลุ่ม กลุ่มหนึ่งเป็นคุณแม่อายุน้อยกว่า 20 ปี อีกกลุ่มหนึ่งเป็นกลุ่มที่มีอายุมากกว่า แล้ววิเคราะห์มวลของเด็กในแต่ละกลุ่ม นี่คือการศึกษาในอนาคต
หากเรารวบรวม 2 ตัวอย่าง ในหนึ่ง - มารดาที่ให้กำเนิดบุตรที่มีน้ำหนักน้อยกว่า 2.5 กก. อีกตัวอย่างหนึ่ง - หนักกว่า จากนั้นเราวิเคราะห์อายุของมารดาในแต่ละกลุ่ม นี่คือการศึกษาย้อนหลัง (โดยธรรมชาติแล้ว การศึกษาดังกล่าว จะกระทำได้ต่อเมื่อการทดลองเสร็จสิ้น กล่าวคือ เด็กทุกคนเกิด)
การอพยพ
คำนิยาม.เหตุการณ์สำคัญทางคลินิก ค่าทางห้องปฏิบัติการ หรือสัญญาณที่ผู้วิจัยสนใจ ในการทดลองทางคลินิก ผลลัพธ์ใช้เป็นเกณฑ์ในการประเมินประสิทธิผลของการรักษาหรือการป้องกันโรค
ระบาดวิทยาคลินิก
คำนิยาม.วิทยาศาสตร์ที่ช่วยให้สามารถทำนายผลลัพธ์เฉพาะสำหรับผู้ป่วยแต่ละรายตามการศึกษาหลักสูตรทางคลินิกของโรคในกรณีที่คล้ายกัน โดยใช้วิธีทางวิทยาศาสตร์ที่เข้มงวดในการศึกษาผู้ป่วยเพื่อให้แน่ใจว่าการคาดการณ์มีความแม่นยำ
กลุ่ม
คำนิยาม.กลุ่มผู้เข้าร่วมในการศึกษาซึ่งรวมกันเป็นหนึ่งโดยลักษณะทั่วไปบางอย่างในเวลาที่ก่อตัวขึ้นและศึกษาเป็นระยะเวลานาน
ควบคุม
การควบคุมทางประวัติศาสตร์
คำนิยาม.กลุ่มควบคุมจัดตั้งและตรวจสอบในช่วงเวลาก่อนการศึกษา
การควบคุมแบบขนาน
คำนิยาม.กลุ่มควบคุมเกิดขึ้นพร้อมกันกับการก่อตัวของกลุ่มหลัก
ความสัมพันธ์
คำนิยาม.ความสัมพันธ์ทางสถิติของสัญญาณสองสัญญาณ (เชิงปริมาณหรือลำดับ) แสดงให้เห็นว่าค่าที่มากกว่าของสัญญาณหนึ่งในกรณีส่วนหนึ่งสอดคล้องกับค่าที่มากกว่า - ในกรณีของความสัมพันธ์เชิงบวก (โดยตรง) - ค่าของสัญญาณอื่นหรือค่าที่น้อยกว่า - ในกรณีของความสัมพันธ์เชิงลบ (ผกผัน)
ตัวอย่าง. พบความสัมพันธ์อย่างมีนัยสำคัญระหว่างระดับเกล็ดเลือดและเม็ดเลือดขาวในเลือดของผู้ป่วย ค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0.76
อัตราส่วนความเสี่ยง (CR)
คำนิยาม.อัตราส่วนความเสี่ยง (อัตราส่วนความเป็นอันตราย) คืออัตราส่วนของความน่าจะเป็นของเหตุการณ์บางอย่าง ("ไม่ดี") สำหรับวัตถุกลุ่มแรกต่อความน่าจะเป็นของเหตุการณ์เดียวกันที่เกิดขึ้นกับวัตถุกลุ่มที่สอง
ตัวอย่าง. หากผู้ไม่สูบบุหรี่มีโอกาสเป็นมะเร็งปอด 20% และมีโอกาสเป็นมะเร็งปอด 100% ในผู้สูบบุหรี่ ค่า CR จะเท่ากับ 1 ใน 5 ในตัวอย่างนี้ วัตถุกลุ่มแรกเป็นผู้ไม่สูบบุหรี่ กลุ่มที่สองเป็นผู้สูบบุหรี่ และการเกิดมะเร็งปอดถือเป็นเหตุการณ์ที่ "เลวร้าย"
เห็นได้ชัดว่า:
1) ถ้า КР=1 ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในกลุ่มจะเท่ากัน
2) ถ้า КР>1 เหตุการณ์จะเกิดขึ้นกับวัตถุจากกลุ่มแรกบ่อยกว่าจากกลุ่มที่สอง
3) ถ้า CR<1, то событие чаще происходит с объектами из второй группы, чем из первой
การวิเคราะห์อภิมาน
คำนิยาม. กับการวิเคราะห์ทางสถิติที่สรุปผลการศึกษาหลายชิ้นที่ตรวจสอบปัญหาเดียวกัน (โดยปกติคือประสิทธิภาพของวิธีการรักษา การป้องกัน การวินิจฉัย) การศึกษาแบบรวมกลุ่มจะมีตัวอย่างขนาดใหญ่สำหรับการวิเคราะห์และพลังทางสถิติที่มากขึ้นของการศึกษาแบบรวม ใช้เพื่อเพิ่มหลักฐานหรือความมั่นใจในข้อสรุปเกี่ยวกับประสิทธิผลของวิธีการศึกษา
วิธี Kaplan-Meier (ค่าประมาณของ Kaplan-Meier หลายรายการ)
วิธีนี้คิดค้นโดยนักสถิติ E. L. Kaplan และ Paul Meyer
วิธีการนี้ใช้ในการคำนวณปริมาณต่าง ๆ ที่เกี่ยวข้องกับเวลาของการสังเกตของผู้ป่วย ตัวอย่างของค่าดังกล่าว:
โอกาสหายภายในหนึ่งปีเมื่อใช้ยา
โอกาสกลับเป็นซ้ำหลังการผ่าตัดภายใน 3 ปีหลังการผ่าตัด
ความน่าจะเป็นสะสมของการรอดชีวิตที่ห้าปีของผู้ป่วยมะเร็งต่อมลูกหมากหลังการตัดอวัยวะ
ให้เราอธิบายข้อดีของการใช้วิธีการของ Kaplan-Meier
ค่าของค่าในการวิเคราะห์ "ปกติ" (ไม่ใช้วิธี Kaplan-Meier) คำนวณจากการแบ่งช่วงเวลาที่พิจารณาออกเป็นช่วงเวลา
ตัวอย่างเช่น หากเราตรวจสอบความน่าจะเป็นของการเสียชีวิตของผู้ป่วยภายใน 5 ปี ช่วงเวลาสามารถแบ่งออกเป็น 5 ส่วน (น้อยกว่า 1 ปี, 1-2 ปี, 2-3 ปี, 3-4 ปี, 4- 5 ปี) และ 10 (ครึ่งปี) หรือจำนวนช่วงอื่น ผลลัพธ์จะแตกต่างกันไปในแต่ละพาร์ติชัน
การเลือกพาร์ติชั่นที่เหมาะสมที่สุดนั้นไม่ใช่เรื่องง่าย
การประมาณค่าของปริมาณที่ได้จากวิธี Kaplan-Meier ไม่ได้ขึ้นอยู่กับการแบ่งเวลาการสังเกตออกเป็นช่วงๆ แต่ขึ้นอยู่กับอายุการใช้งานของผู้ป่วยแต่ละรายเท่านั้น
ดังนั้นจึงง่ายกว่าสำหรับนักวิจัยในการวิเคราะห์ และผลลัพธ์มักจะออกมามีคุณภาพสูงกว่าผลลัพธ์ของการวิเคราะห์ "ธรรมดา"
เส้นโค้ง Kaplan-Meier เป็นกราฟของเส้นโค้งการอยู่รอดที่ได้รับจากวิธีการของ Kaplan-Meier
รุ่นค็อกซ์
โมเดลนี้คิดค้นโดย Sir David Roxby Cox (เกิดปี 1924) นักสถิติชื่อดังชาวอังกฤษ ผู้เขียนบทความและหนังสือกว่า 300 เล่ม
แบบจำลอง Cox ใช้ในสถานการณ์ที่ปริมาณที่ศึกษาในการวิเคราะห์การอยู่รอดขึ้นอยู่กับฟังก์ชันของเวลา ตัวอย่างเช่น ความน่าจะเป็นของการเกิดซ้ำหลังจาก t ปี (t=1.2,…) อาจขึ้นอยู่กับลอการิทึมของบันทึกเวลา (t)
ข้อได้เปรียบที่สำคัญของวิธีการที่เสนอโดย Cox คือการบังคับใช้วิธีนี้ในสถานการณ์จำนวนมาก (แบบจำลองไม่ได้กำหนดข้อจำกัดที่เข้มงวดเกี่ยวกับลักษณะหรือรูปแบบของการแจกแจงความน่าจะเป็น)
ตามแบบจำลอง Cox การวิเคราะห์ (เรียกว่าการวิเคราะห์ Cox) สามารถดำเนินการได้ ซึ่งส่งผลให้ค่าอัตราส่วนความเสี่ยงและช่วงความเชื่อมั่นสำหรับอัตราส่วนความเสี่ยง
วิธีสถิติแบบไม่อิงพารามิเตอร์
คำนิยาม.ประเภทของวิธีการทางสถิติที่ใช้เป็นหลักในการวิเคราะห์ข้อมูลเชิงปริมาณที่ไม่กระจายตามปกติ เช่นเดียวกับการวิเคราะห์ข้อมูลเชิงคุณภาพ
ตัวอย่าง. ในการระบุความสำคัญของความแตกต่างของความดันซิสโตลิกของผู้ป่วยขึ้นอยู่กับประเภทของการรักษา เราจะใช้การทดสอบ Mann-Whitney แบบไม่ใช้พารามิเตอร์
คุณลักษณะ (ตัวแปร)
คำนิยาม. เอ็กซ์ลักษณะของวัตถุประสงค์ของการศึกษา (การสังเกต) มีลักษณะเชิงคุณภาพและเชิงปริมาณ
การสุ่ม
คำนิยาม.วิธีการสุ่มกระจายวัตถุการวิจัยลงในกลุ่มหลักและกลุ่มควบคุมโดยใช้วิธีการพิเศษ (ตารางหรือตัวนับตัวเลขสุ่ม การโยนเหรียญ และวิธีการอื่นในการสุ่มกำหนดหมายเลขกลุ่มให้กับการสังเกตที่รวมอยู่) การสุ่มจะลดความแตกต่างระหว่างกลุ่มในแง่ของลักษณะที่รู้จักและไม่รู้จักซึ่งอาจส่งผลต่อผลลัพธ์ที่กำลังศึกษาอยู่
เสี่ยง
คุณลักษณะ- ความเสี่ยงเพิ่มเติมของผลลัพธ์ที่ไม่พึงประสงค์ (เช่น โรค) เนื่องจากมีลักษณะเฉพาะ (ปัจจัยเสี่ยง) ในวัตถุประสงค์ของการศึกษา นี่เป็นส่วนหนึ่งของความเสี่ยงในการเกิดโรคที่เกี่ยวข้องกับปัจจัยเสี่ยงนี้ ซึ่งอธิบายได้และสามารถกำจัดได้หากปัจจัยเสี่ยงนี้ถูกกำจัด
ความเสี่ยงสัมพัทธ์- อัตราส่วนของความเสี่ยงต่อภาวะที่ไม่เอื้ออำนวยในกลุ่มหนึ่งต่อความเสี่ยงของภาวะนี้ในอีกกลุ่มหนึ่ง ใช้ในการศึกษาเชิงคาดการณ์และเชิงสังเกตเมื่อมีการจัดตั้งกลุ่มล่วงหน้า และยังไม่เกิดสภาวะที่ศึกษา
การสอบกลิ้ง
คำนิยาม.วิธีการตรวจสอบความเสถียร ความน่าเชื่อถือ ประสิทธิภาพ (ความถูกต้อง) ของแบบจำลองทางสถิติโดยการลบการสังเกตและคำนวณแบบจำลองใหม่อย่างต่อเนื่อง ยิ่งโมเดลที่ได้มีความคล้ายคลึงกันมากเท่าใด โมเดลก็ยิ่งมีความเสถียรและน่าเชื่อถือมากขึ้นเท่านั้น
เหตุการณ์
คำนิยาม.ผลลัพธ์ทางคลินิกที่สังเกตได้จากการศึกษา เช่น การเกิดภาวะแทรกซ้อน การกลับเป็นซ้ำ การฟื้นตัว การเสียชีวิต
การแบ่งชั้น
คำนิยาม. มวิธีการสุ่มตัวอย่างที่ประชากรของผู้เข้าร่วมทั้งหมดที่มีคุณสมบัติตรงตามเกณฑ์การคัดเข้าสำหรับการศึกษาจะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ตามลักษณะอย่างน้อยหนึ่งอย่าง (โดยปกติคือเพศ อายุ) ที่อาจมีอิทธิพลต่อผลลัพธ์ภายใต้การศึกษา จากนั้นจากแต่ละลักษณะ กลุ่มเหล่านี้ ( ชั้น) ผู้เข้าร่วมจะถูกคัดเลือกอย่างอิสระในกลุ่มทดลองและกลุ่มควบคุม สิ่งนี้ทำให้ผู้วิจัยสามารถรักษาสมดุลของลักษณะสำคัญระหว่างกลุ่มทดลองและกลุ่มควบคุมได้
ตารางฉุกเฉิน
คำนิยาม.ตารางความถี่สัมบูรณ์ (ตัวเลข) ของการสังเกต คอลัมน์ที่สอดคล้องกับค่าของคุณสมบัติหนึ่ง และแถวของค่าของคุณสมบัติอื่น (ในกรณีของตารางฉุกเฉินสองมิติ) ค่าของความถี่สัมบูรณ์จะอยู่ในเซลล์ที่จุดตัดของแถวและคอลัมน์
ให้เรายกตัวอย่างตารางฉุกเฉิน ทำการผ่าตัดหลอดเลือดโป่งพองในผู้ป่วย 194 ราย ตัวบ่งชี้ความรุนแรงของอาการบวมน้ำในผู้ป่วยก่อนการผ่าตัด
อาการบวมน้ำ \ ผลลัพธ์ | |||
---|---|---|---|
ไม่มีอาการบวมน้ำ | 20 | 6 | 26 |
บวมปานกลาง | 27 | 15 | 42 |
อาการบวมน้ำที่เด่นชัด | 8 | 21 | 29 |
มจ | 55 | 42 | 194 |
ดังนั้นจากผู้ป่วย 26 รายที่ไม่มีอาการบวมน้ำ ผู้ป่วย 20 รายรอดชีวิตหลังการผ่าตัด 6 รายเสียชีวิต จากผู้ป่วย 42 รายที่มีอาการบวมน้ำปานกลาง 27 รายรอดชีวิต 15 รายเสียชีวิต ฯลฯ
การทดสอบไคสแควร์สำหรับตารางฉุกเฉิน
ในการกำหนดนัยสำคัญ (ความน่าเชื่อถือ) ของความแตกต่างในสัญญาณหนึ่งซึ่งขึ้นอยู่กับสัญญาณอื่น (เช่น ผลลัพธ์ของการดำเนินการขึ้นอยู่กับความรุนแรงของอาการบวมน้ำ) การทดสอบไคสแควร์ใช้สำหรับตารางฉุกเฉิน:
โอกาส
ให้ความน่าจะเป็นของบางเหตุการณ์เท่ากับ p จากนั้นความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้นคือ 1-p
ตัวอย่างเช่น หากความน่าจะเป็นที่ผู้ป่วยจะยังมีชีวิตอยู่หลังจากผ่านไป 5 ปีคือ 0.8 (80%) ความน่าจะเป็นที่ผู้ป่วยจะเสียชีวิตในช่วงเวลานี้คือ 0.2 (20%)
คำนิยาม.โอกาสคืออัตราส่วนของความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นกับความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้น
ตัวอย่าง. ในตัวอย่างของเรา (เกี่ยวกับผู้ป่วย) โอกาสคือ 4 เนื่องจาก 0.8/0.2=4
ดังนั้น ความน่าจะเป็นของการฟื้นตัวเป็น 4 เท่าของความน่าจะเป็นของการเสียชีวิต
การตีความค่าของปริมาณ
1) ถ้าโอกาส = 1 ความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นจะเท่ากับความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้น
2) ถ้าโอกาส >1 ความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นจะมากกว่าความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้น
3) ถ้ามีโอกาส<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.
อัตราส่วนราคาต่อรอง
คำนิยาม.อัตราส่วนอัตราต่อรองคืออัตราส่วนของอัตราต่อรองสำหรับวัตถุกลุ่มแรกต่ออัตราส่วนอัตราต่อรองสำหรับวัตถุกลุ่มที่สอง
ตัวอย่าง. สมมติว่าทั้งชายและหญิงได้รับการรักษาบางอย่าง
ความน่าจะเป็นที่ผู้ป่วยชายจะยังมีชีวิตอยู่หลังจากผ่านไป 5 ปีคือ 0.6 (60%) ความน่าจะเป็นที่เขาจะตายในช่วงเวลานี้คือ 0.4 (40%)
ความน่าจะเป็นที่คล้ายกันสำหรับผู้หญิงคือ 0.8 และ 0.2
อัตราต่อรองในตัวอย่างนี้คือ
การตีความค่าของปริมาณ
1) หากอัตราต่อรอง = 1 ดังนั้นโอกาสของกลุ่มแรกจะเท่ากับโอกาสของกลุ่มที่สอง
2) หากอัตราต่อรองคือ >1 โอกาสของกลุ่มแรกจะมากกว่าโอกาสของกลุ่มที่สอง
3) หากอัตราต่อรอง<1, то шанс для первой группы меньше шанса для второй группы