วิธีหาตัวอย่างค่าเบี่ยงเบนมาตรฐาน ค่าเบี่ยงเบนมาตรฐานคืออะไร - การใช้ฟังก์ชันค่าเบี่ยงเบนมาตรฐานเพื่อคำนวณค่าเบี่ยงเบนมาตรฐานใน Excel
ในการทดสอบสมมติฐานทางสถิติ เมื่อทำการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม
ส่วนเบี่ยงเบนมาตรฐาน:
ส่วนเบี่ยงเบนมาตรฐาน(ค่าประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม พื้น ผนังรอบตัวเรา และเพดาน xสัมพันธ์กับความคาดหวังทางคณิตศาสตร์โดยอิงจากการประมาณค่าความแปรปรวนที่เป็นกลาง):
การกระจายตัวอยู่ที่ไหน - พื้น ผนังรอบตัวเรา และเพดาน ฉันองค์ประกอบที่ 3 ของการเลือก - ขนาดตัวอย่าง - ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง:
ควรสังเกตว่าการประมาณการทั้งสองมีความลำเอียง ในกรณีทั่วไป ไม่สามารถสร้างการประมาณการที่เป็นกลางได้ อย่างไรก็ตาม การประมาณการตามการประมาณค่าความแปรปรวนที่เป็นกลางมีความสอดคล้องกัน
กฎสามซิกมา
กฎสามซิกมา() - ค่าเกือบทั้งหมดของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลา เข้มงวดมากขึ้น - ด้วยความเชื่อมั่นไม่ต่ำกว่า 99.7% ค่าของตัวแปรสุ่มแบบกระจายแบบปกติจะอยู่ในช่วงที่ระบุ (โดยมีเงื่อนไขว่าค่าเป็นจริงและไม่ได้รับจากการประมวลผลตัวอย่าง)
หากไม่ทราบมูลค่าที่แท้จริง เราก็ไม่ควรใช้ แต่พื้น ผนังรอบตัวเรา และเพดาน ส- ดังนั้น กฎสามซิกมาจึงเปลี่ยนเป็นกฎสามชั้น ผนังรอบตัวเรา และเพดาน ส .
การตีความค่าส่วนเบี่ยงเบนมาตรฐาน
ค่าเบี่ยงเบนมาตรฐานที่มีค่ามากจะแสดงการแพร่กระจายของค่าจำนวนมากในชุดที่นำเสนอพร้อมกับค่าเฉลี่ยของชุด ค่าเล็กน้อยแสดงว่าค่าในชุดจัดกลุ่มตามค่าเฉลี่ย
ตัวอย่างเช่น เรามีชุดตัวเลขสามชุด: (0, 0, 14, 14), (0, 6, 8, 14) และ (6, 6, 8, 8) ทั้งสามชุดมีค่าเฉลี่ยเท่ากับ 7 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 7, 5 และ 1 ตามลำดับ ชุดสุดท้ายมีค่าเบี่ยงเบนมาตรฐานเล็กน้อยเนื่องจากค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย ชุดแรกมีค่าเบี่ยงเบนมาตรฐานที่ใหญ่ที่สุด - ค่าภายในชุดแตกต่างจากค่าเฉลี่ยอย่างมาก
โดยทั่วไปแล้ว ค่าเบี่ยงเบนมาตรฐานถือได้ว่าเป็นการวัดความไม่แน่นอน ตัวอย่างเช่น ในวิชาฟิสิกส์ ค่าเบี่ยงเบนมาตรฐานใช้ในการระบุข้อผิดพลาดของชุดการวัดปริมาณบางค่าที่ต่อเนื่องกัน ค่านี้มีความสำคัญมากในการพิจารณาความน่าเชื่อถือของปรากฏการณ์ภายใต้การศึกษาเมื่อเปรียบเทียบกับค่าที่ทำนายโดยทฤษฎี: หากค่าเฉลี่ยของการวัดแตกต่างอย่างมากจากค่าที่ทำนายโดยทฤษฎี (ส่วนเบี่ยงเบนมาตรฐานขนาดใหญ่) ดังนั้นควรตรวจสอบค่าที่ได้รับหรือวิธีการรับอีกครั้ง
การประยุกต์ใช้ในทางปฏิบัติ
ในทางปฏิบัติ ค่าเบี่ยงเบนมาตรฐานช่วยให้คุณสามารถกำหนดได้ว่าค่าในชุดอาจแตกต่างจากค่าเฉลี่ยมากน้อยเพียงใด
ภูมิอากาศ
สมมติว่ามีสองเมืองที่มีอุณหภูมิสูงสุดเฉลี่ยต่อวันเท่ากัน แต่เมืองหนึ่งตั้งอยู่บนชายฝั่งและอีกเมืองหนึ่งอยู่บนบก เป็นที่ทราบกันดีว่าเมืองต่างๆ ที่ตั้งอยู่บนชายฝั่งมีอุณหภูมิสูงสุดในเวลากลางวันที่แตกต่างกันหลายประการ ซึ่งต่ำกว่าเมืองที่ตั้งอยู่ในแผ่นดิน ดังนั้น ค่าเบี่ยงเบนมาตรฐานของอุณหภูมิสูงสุดรายวันสำหรับเมืองชายฝั่งทะเลจะน้อยกว่าค่าเบี่ยงเบนมาตรฐานของเมืองที่สอง แม้ว่าค่าเฉลี่ยของค่านี้จะเท่ากันก็ตาม ซึ่งในทางปฏิบัติหมายความว่าความน่าจะเป็นที่อุณหภูมิอากาศสูงสุดบน วันใดวันหนึ่งของปีจะสูงกว่าแตกต่างจากค่าเฉลี่ย ซึ่งสูงกว่าสำหรับเมืองที่ตั้งอยู่ในแผ่นดิน
กีฬา
สมมติว่ามีทีมฟุตบอลหลายทีมที่จัดอันดับตามพารามิเตอร์บางชุด เช่น จำนวนประตูที่ทำได้และเสียโอกาสทำประตู เป็นต้น มีแนวโน้มว่าทีมที่ดีที่สุดในกลุ่มนี้จะมีมูลค่าที่ดีกว่า ด้วยพารามิเตอร์จำนวนมากขึ้น ยิ่งค่าเบี่ยงเบนมาตรฐานของทีมสำหรับแต่ละพารามิเตอร์ที่นำเสนอน้อยเท่าไร ผลลัพธ์ของทีมก็จะยิ่งสมดุลมากขึ้นเท่านั้น ในทางกลับกัน ทีมที่มีค่าเบี่ยงเบนมาตรฐานสูงนั้นยากที่จะคาดเดาผลลัพธ์ ซึ่งในทางกลับกัน อธิบายได้จากความไม่สมดุล เช่น การป้องกันที่แข็งแกร่งแต่การโจมตีที่อ่อนแอ
การใช้ค่าเบี่ยงเบนมาตรฐานของพารามิเตอร์ทีมทำให้สามารถทำนายผลการแข่งขันระหว่างสองทีมได้ในระดับหนึ่งหรืออย่างอื่น ประเมินจุดแข็งและจุดอ่อนของทีม และดังนั้นวิธีการต่อสู้ที่เลือก
การวิเคราะห์ทางเทคนิค
ดูเพิ่มเติม
วรรณกรรม
บทความนี้เสนอให้ลบ
คำอธิบายเหตุผลและการสนทนาที่เกี่ยวข้องสามารถพบได้ในหน้า Wikipedia: จะถูกลบ/17 ธันวาคม 2012 |
* โบโรวิคอฟ, วี.สถิติ. ศิลปะการวิเคราะห์ข้อมูลบนคอมพิวเตอร์: สำหรับมืออาชีพ / V. Borovikov - เซนต์ปีเตอร์สเบิร์ก : ปีเตอร์, 2546. - 688 น. - ไอ 5-272-00078-1.
ตัวชี้วัดทางสถิติ | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
บรรยาย สถิติ |
|
||||||||||
เชิงสถิติ เอาท์พุทและ การตรวจสอบ สมมติฐาน |
|
บทเรียนหมายเลข 4
หัวข้อ: “สถิติเชิงพรรณนา ตัวชี้วัดความหลากหลายในลักษณะรวม"
เกณฑ์หลักสำหรับความหลากหลายของคุณลักษณะในประชากรทางสถิติ ได้แก่ ขีดจำกัด แอมพลิจูด ส่วนเบี่ยงเบนมาตรฐาน สัมประสิทธิ์การแกว่ง และสัมประสิทธิ์การแปรผัน ในบทเรียนก่อนหน้านี้มีการกล่าวถึงว่าค่าเฉลี่ยให้เฉพาะลักษณะทั่วไปของคุณลักษณะที่กำลังศึกษาโดยรวมและไม่ได้คำนึงถึงค่าของตัวแปรแต่ละตัว: ค่าต่ำสุดและค่าสูงสุด, สูงกว่าค่าเฉลี่ย, ต่ำกว่า เฉลี่ย ฯลฯ
ตัวอย่าง. ค่าเฉลี่ยของลำดับตัวเลขที่แตกต่างกันสองลำดับ: -100; -20; 100; 20 และ 0.1; -0.2; 0.1 เหมือนกันและเท่ากันทุกประการเกี่ยวกับ.อย่างไรก็ตาม ช่วงกระจายของข้อมูลลำดับค่าเฉลี่ยสัมพัทธ์เหล่านี้แตกต่างกันมาก
การกำหนดเกณฑ์ที่ระบุไว้สำหรับความหลากหลายของคุณลักษณะนั้นดำเนินการโดยคำนึงถึงมูลค่าของมันในแต่ละองค์ประกอบของประชากรทางสถิติเป็นหลัก
ตัวชี้วัดในการวัดความแปรผันของลักษณะคือ แน่นอนและ ญาติ- ตัวบ่งชี้ความแปรปรวนสัมบูรณ์ ได้แก่ ช่วงของความแปรผัน ขีดจำกัด ส่วนเบี่ยงเบนมาตรฐาน การกระจายตัว ค่าสัมประสิทธิ์ของการแปรผันและค่าสัมประสิทธิ์การแกว่งหมายถึงการวัดสัมพัทธ์ของการแปรผัน
ขีดจำกัด (ลิม)–นี่คือเกณฑ์ที่กำหนดโดยค่าสุดขีดของตัวแปรในชุดรูปแบบต่างๆ กล่าวอีกนัยหนึ่งเกณฑ์นี้จำกัดอยู่ที่ค่าต่ำสุดและสูงสุดของแอตทริบิวต์:
แอมพลิจูด (แอม)หรือ ช่วงของการเปลี่ยนแปลง –นี่คือความแตกต่างระหว่างตัวเลือกสุดขั้ว การคำนวณเกณฑ์นี้ดำเนินการโดยการลบค่าต่ำสุดออกจากค่าสูงสุดของแอตทริบิวต์ซึ่งช่วยให้สามารถประมาณระดับการกระจายของตัวเลือกได้:
ข้อเสียของขีด จำกัด และแอมพลิจูดเป็นเกณฑ์ของความแปรปรวนก็คือพวกมันขึ้นอยู่กับค่าสุดขีดของลักษณะเฉพาะในซีรีย์รูปแบบต่างๆ ในกรณีนี้ ความผันผวนของค่าคุณลักษณะภายในชุดข้อมูลจะไม่ถูกนำมาพิจารณาด้วย
คำอธิบายที่สมบูรณ์ที่สุดของความหลากหลายของลักษณะในประชากรทางสถิติมีให้โดย ส่วนเบี่ยงเบนมาตรฐาน(ซิกมา) ซึ่งเป็นการวัดความเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ยโดยทั่วไป ค่าเบี่ยงเบนมาตรฐานมักเรียกว่า ส่วนเบี่ยงเบนมาตรฐาน.
ค่าเบี่ยงเบนมาตรฐานจะขึ้นอยู่กับการเปรียบเทียบแต่ละตัวเลือกกับค่าเฉลี่ยเลขคณิตของประชากรที่กำหนด เนื่องจากโดยรวมจะมีตัวเลือกทั้งน้อยกว่าและมากกว่าเสมอ ผลรวมของการเบี่ยงเบนที่มีเครื่องหมาย "" จะถูกยกเลิกด้วยผลรวมของการเบี่ยงเบนที่มีเครื่องหมาย "" เช่น ผลรวมของการเบี่ยงเบนทั้งหมดเป็นศูนย์ เพื่อหลีกเลี่ยงอิทธิพลของสัญญาณของความแตกต่าง จะมีการเบี่ยงเบนจากค่าเฉลี่ยเลขคณิตยกกำลังสอง เช่น - ผลรวมของการเบี่ยงเบนกำลังสองไม่เท่ากับศูนย์ เพื่อให้ได้ค่าสัมประสิทธิ์ที่สามารถวัดความแปรปรวนได้ ให้หาค่าเฉลี่ยของผลรวมของกำลังสอง - ค่านี้เรียกว่า ความแตกต่าง:
โดยพื้นฐานแล้วการกระจายตัวคือกำลังสองเฉลี่ยของการเบี่ยงเบนของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ย การกระจายตัว – กำลังสองของส่วนเบี่ยงเบนมาตรฐาน
ความแปรปรวนคือปริมาณมิติ (ระบุชื่อ) ดังนั้น ถ้าตัวแปรของชุดตัวเลขแสดงเป็นหน่วยเมตร ความแปรปรวนก็จะให้ตารางเมตร หากตัวเลือกแสดงเป็นกิโลกรัม ความแปรปรวนจะให้กำลังสองของการวัดนี้ (กก. 2) เป็นต้น
ส่วนเบี่ยงเบนมาตรฐาน– รากที่สองของความแปรปรวน:
แล้วเมื่อคำนวณการกระจายตัวและส่วนเบี่ยงเบนมาตรฐานในตัวส่วนของเศษส่วนแทนจะต้องใส่.
การคำนวณค่าเบี่ยงเบนมาตรฐานสามารถแบ่งออกเป็นหกขั้นตอนซึ่งจะต้องดำเนินการในลำดับที่แน่นอน:
การใช้ค่าเบี่ยงเบนมาตรฐาน:
ก) สำหรับการตัดสินความแปรปรวนของอนุกรมความแปรผันและการประเมินเชิงเปรียบเทียบของลักษณะทั่วไป (การเป็นตัวแทน) ของค่าเฉลี่ยเลขคณิต นี่เป็นสิ่งจำเป็นในการวินิจฉัยแยกโรคเมื่อพิจารณาความคงตัวของอาการ
b) เพื่อสร้างซีรี่ส์รูปแบบใหม่ขึ้นมาใหม่ เช่น การฟื้นฟูการตอบสนองความถี่ตาม กฎสามซิกมา. ในช่วงเวลา (ม ±3σ) 99.7% ของตัวแปรทั้งหมดของซีรีส์อยู่ในช่วงเวลา (ม±2σ) - 95.5% และอยู่ในช่วง (ม±1σ) - ตัวแปรแถว 68.3%(รูปที่ 1)
c) เพื่อระบุตัวเลือก "ป๊อปอัป"
d) เพื่อกำหนดพารามิเตอร์ของบรรทัดฐานและพยาธิวิทยาโดยใช้การประมาณค่าซิกมา
e) เพื่อคำนวณค่าสัมประสิทธิ์ของการแปรผัน
f) เพื่อคำนวณความคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ยเลขคณิต
เพื่อระบุลักษณะประชากรใด ๆ ที่มีประเภทการกระจายแบบปกติ ก็เพียงพอที่จะรู้พารามิเตอร์สองตัว: ค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐาน
รูปที่ 1 กฎสามซิกมา
ตัวอย่าง.
ในด้านกุมารเวชศาสตร์ ค่าเบี่ยงเบนมาตรฐานใช้ในการประเมินพัฒนาการทางร่างกายของเด็กโดยการเปรียบเทียบข้อมูลของเด็กแต่ละคนกับตัวชี้วัดมาตรฐานที่เกี่ยวข้อง ค่าเฉลี่ยเลขคณิตของพัฒนาการทางกายภาพของเด็กที่มีสุขภาพดีถือเป็นมาตรฐาน การเปรียบเทียบตัวบ่งชี้กับมาตรฐานดำเนินการโดยใช้ตารางพิเศษที่กำหนดมาตรฐานพร้อมกับสเกลซิกมาที่เกี่ยวข้อง เชื่อกันว่าหากตัวบ่งชี้พัฒนาการทางกายภาพของเด็กอยู่ในมาตรฐาน (ค่าเฉลี่ยเลขคณิต) ±σแสดงว่าพัฒนาการทางกายภาพของเด็ก (ตามตัวบ่งชี้นี้) จะสอดคล้องกับบรรทัดฐาน หากตัวบ่งชี้อยู่ภายในมาตรฐาน ±2σ แสดงว่ามีความเบี่ยงเบนเล็กน้อยจากบรรทัดฐาน หากตัวบ่งชี้เกินขีด จำกัด เหล่านี้แสดงว่าพัฒนาการทางกายภาพของเด็กแตกต่างอย่างมากจากบรรทัดฐาน (เป็นไปได้ทางพยาธิวิทยา)
นอกจากตัวบ่งชี้ความแปรผันที่แสดงเป็นค่าสัมบูรณ์แล้ว การวิจัยทางสถิติยังใช้ตัวบ่งชี้ความแปรผันที่แสดงเป็นค่าสัมพัทธ์ ค่าสัมประสิทธิ์การสั่น -นี่คืออัตราส่วนของช่วงของการแปรผันต่อค่าเฉลี่ยของลักษณะ ค่าสัมประสิทธิ์การเปลี่ยนแปลง -นี่คืออัตราส่วนของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยของคุณลักษณะ โดยปกติแล้วค่าเหล่านี้จะแสดงเป็นเปอร์เซ็นต์
สูตรคำนวณตัวบ่งชี้ความแปรผันสัมพัทธ์:
จากสูตรข้างต้นจะเห็นได้ว่าค่าสัมประสิทธิ์ยิ่งมากขึ้น วี ใกล้กับศูนย์มากขึ้น ความแปรผันของค่าคุณลักษณะก็จะยิ่งน้อยลงเท่านั้น ยิ่งมาก. วีเครื่องหมายยิ่งแปรผันมาก
ในทางปฏิบัติทางสถิติ มักใช้ค่าสัมประสิทธิ์ของการแปรผัน ซึ่งไม่เพียงแต่ใช้สำหรับการประเมินเปรียบเทียบความแปรปรวนเท่านั้น แต่ยังใช้เพื่อระบุลักษณะความเป็นเนื้อเดียวกันของประชากรด้วย ประชากรจะถือว่าเป็นเนื้อเดียวกันหากค่าสัมประสิทธิ์การเปลี่ยนแปลงไม่เกิน 33% (สำหรับการแจกแจงที่ใกล้เคียงกับปกติ) ในทางคณิตศาสตร์ อัตราส่วนของ σ และค่าเฉลี่ยเลขคณิตจะทำให้อิทธิพลของค่าสัมบูรณ์ของคุณลักษณะเหล่านี้เป็นกลาง และอัตราส่วนเปอร์เซ็นต์ทำให้ค่าสัมประสิทธิ์ของการแปรผันเป็นค่าที่ไม่มีมิติ (ไม่มีชื่อ)
ค่าผลลัพธ์ของค่าสัมประสิทธิ์การแปรผันจะประมาณตามการไล่ระดับโดยประมาณของระดับความหลากหลายของลักษณะ:
อ่อนแอ - มากถึง 10%
เฉลี่ย - 10 - 20%
แข็งแกร่ง - มากกว่า 20%
แนะนำให้ใช้ค่าสัมประสิทธิ์การแปรผันในกรณีที่จำเป็นต้องเปรียบเทียบคุณลักษณะที่มีขนาดและมิติต่างกัน
แสดงให้เห็นความแตกต่างระหว่างค่าสัมประสิทธิ์ของการแปรผันและเกณฑ์การกระจายอื่นๆ อย่างชัดเจน ตัวอย่าง.
ตารางที่ 1
องค์ประกอบของคนงานในวิสาหกิจอุตสาหกรรม
จากลักษณะทางสถิติที่ระบุในตัวอย่าง เราสามารถสรุปได้เกี่ยวกับความสม่ำเสมอขององค์ประกอบอายุและระดับการศึกษาของพนักงานในองค์กร โดยคำนึงถึงความมั่นคงทางวิชาชีพที่ต่ำของอาสาสมัครที่ทำการสำรวจ จะเห็นได้ง่ายว่าความพยายามที่จะตัดสินแนวโน้มทางสังคมเหล่านี้ด้วยส่วนเบี่ยงเบนมาตรฐานจะนำไปสู่ข้อสรุปที่ผิดพลาด และความพยายามในการเปรียบเทียบลักษณะทางบัญชี “ประสบการณ์การทำงาน” และ “อายุ” กับตัวบ่งชี้ทางบัญชี “การศึกษา” โดยทั่วไปจะเป็น ไม่ถูกต้องเนื่องจากความหลากหลายของลักษณะเหล่านี้
ค่ามัธยฐานและเปอร์เซ็นไทล์
สำหรับการแจกแจงลำดับ (อันดับ) โดยที่เกณฑ์สำหรับตรงกลางของอนุกรมคือค่ามัธยฐาน ค่าเบี่ยงเบนมาตรฐานและการกระจายตัวไม่สามารถใช้เป็นลักษณะของการกระจายตัวของตัวแปรได้
เช่นเดียวกับซีรีส์รูปแบบเปิด สถานการณ์นี้เกิดจากการที่ค่าเบี่ยงเบนจากการคำนวณความแปรปรวนและ σ นั้นวัดจากค่าเฉลี่ยเลขคณิต ซึ่งไม่ได้คำนวณในชุดข้อมูลรูปแบบเปิดและในชุดของการแจกแจงคุณลักษณะเชิงคุณภาพ ดังนั้น สำหรับคำอธิบายของการแจกแจงแบบบีบอัด จึงมีการใช้พารามิเตอร์กระจายอื่น - ปริมาณ(คำพ้องความหมาย - "เปอร์เซ็นไทล์") เหมาะสำหรับการอธิบายลักษณะเชิงคุณภาพและเชิงปริมาณในรูปแบบใด ๆ ของการกระจาย พารามิเตอร์นี้ยังสามารถใช้เพื่อแปลงคุณลักษณะเชิงปริมาณให้เป็นเชิงคุณภาพได้ ในกรณีนี้ การให้คะแนนดังกล่าวจะถูกกำหนดขึ้นอยู่กับลำดับของควอไทล์ที่ตัวเลือกเฉพาะนั้นสอดคล้องกับ
ในการปฏิบัติงานของการวิจัยทางชีวการแพทย์ มักใช้ควอไทล์ต่อไปนี้:
– ค่ามัธยฐาน;
, – ควอร์ไทล์ (ควอเตอร์) โดยที่ – ควอไทล์ต่ำกว่า – ควอไทล์บน
Quantiles แบ่งพื้นที่ของการเปลี่ยนแปลงที่เป็นไปได้ในชุดรูปแบบต่างๆ ออกเป็นช่วงๆ ค่ามัธยฐาน (ควอนไทล์) เป็นตัวเลือกที่อยู่ตรงกลางของอนุกรมรูปแบบต่างๆ และแบ่งอนุกรมนี้ออกเป็นสองส่วนเท่าๆ กัน ( 0,5 และ 0,5 - ควอร์ไทล์แบ่งอนุกรมออกเป็นสี่ส่วน ส่วนแรก (ควอไทล์ล่าง) เป็นตัวเลือกที่แยกตัวเลือกที่มีค่าตัวเลขไม่เกิน 25% ของค่าสูงสุดที่เป็นไปได้ในซีรีส์ที่กำหนด ส่วนควอไทล์จะแยกตัวเลือกด้วยค่าตัวเลข มากถึง 50% ของสูงสุดที่เป็นไปได้ ควอร์ไทล์บน () แยกตัวเลือกได้ถึง 75% ของค่าสูงสุดที่เป็นไปได้
ในกรณีที่มีการกระจายตัวไม่สมมาตร ตัวแปรที่สัมพันธ์กับค่าเฉลี่ยเลขคณิต จะใช้ค่ามัธยฐานและควอร์ไทล์เพื่อระบุลักษณะเฉพาะในกรณีนี้ จะใช้รูปแบบการแสดงค่าเฉลี่ยต่อไปนี้ - เอิ่ม. (;). ตัวอย่างเช่นคุณลักษณะที่ศึกษา – “ช่วงเวลาที่เด็กเริ่มเดินอย่างอิสระ” – มีการกระจายแบบไม่สมมาตรในกลุ่มการศึกษา ในเวลาเดียวกันควอไทล์ล่าง () สอดคล้องกับจุดเริ่มต้นของการเดิน - 9.5 เดือน ค่ามัธยฐาน - 11 เดือน ควอไทล์บน () - 12 เดือน ดังนั้น ลักษณะของแนวโน้มเฉลี่ยของคุณลักษณะที่ระบุจะแสดงเป็น 11 (9.5; 12) เดือน
การประเมินนัยสำคัญทางสถิติของผลการศึกษา
นัยสำคัญทางสถิติของข้อมูลเป็นที่เข้าใจกันว่าเป็นระดับที่สอดคล้องกับความเป็นจริงที่แสดง เช่น ข้อมูลที่มีนัยสำคัญทางสถิติคือข้อมูลที่ไม่บิดเบือนและสะท้อนความเป็นจริงตามวัตถุประสงค์อย่างถูกต้อง
การประเมินนัยสำคัญทางสถิติของผลการวิจัยหมายถึงการพิจารณาความน่าจะเป็นที่เป็นไปได้ในการถ่ายโอนผลลัพธ์ที่ได้รับจากประชากรตัวอย่างไปยังประชากรทั้งหมด การประเมินนัยสำคัญทางสถิติเป็นสิ่งจำเป็นเพื่อให้เข้าใจว่าปรากฏการณ์หนึ่งๆ สามารถนำไปใช้ตัดสินปรากฏการณ์โดยรวมและรูปแบบของปรากฏการณ์ได้มากน้อยเพียงใด
การประเมินนัยสำคัญทางสถิติของผลการวิจัยประกอบด้วย
1. ข้อผิดพลาดของการเป็นตัวแทน (ข้อผิดพลาดของค่าเฉลี่ยและค่าสัมพัทธ์) - ม;
2. ขีดจำกัดความเชื่อมั่นของค่าเฉลี่ยหรือค่าสัมพัทธ์
3. ความน่าเชื่อถือของความแตกต่างในค่าเฉลี่ยหรือค่าสัมพัทธ์ตามเกณฑ์ ที.
ความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิตหรือ ข้อผิดพลาดในการเป็นตัวแทนระบุลักษณะความผันผวนของค่าเฉลี่ย ควรสังเกตว่ายิ่งขนาดตัวอย่างใหญ่ขึ้น การแพร่กระจายของค่าเฉลี่ยก็จะยิ่งน้อยลงเท่านั้น ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยคำนวณโดยใช้สูตร:
ในวรรณคดีทางวิทยาศาสตร์สมัยใหม่ ค่าเฉลี่ยเลขคณิตเขียนพร้อมกับข้อผิดพลาดในการเป็นตัวแทน:
หรือร่วมกับส่วนเบี่ยงเบนมาตรฐาน:
ตัวอย่างเช่น พิจารณาข้อมูลเกี่ยวกับคลินิกในเมือง 1,500 แห่งในประเทศ (ประชากรทั่วไป) จำนวนผู้ป่วยที่ให้บริการในคลินิกโดยเฉลี่ยคือ 18,150 คน สุ่มเลือกสถานที่ 10% (150 คลินิก) ทำให้จำนวนผู้ป่วยเฉลี่ยเท่ากับ 20,051 คน ข้อผิดพลาดในการสุ่มตัวอย่างเห็นได้ชัดว่ามีคลินิกไม่ทั้งหมด 1,500 แห่งรวมอยู่ในกลุ่มตัวอย่าง ซึ่งเท่ากับความแตกต่างระหว่างค่าเฉลี่ยเหล่านี้ - ค่าเฉลี่ยทั่วไป ( มยีน) และค่าเฉลี่ยตัวอย่าง ( มเลือก) หากเราสร้างตัวอย่างอื่นที่มีขนาดเท่ากันจากประชากรของเรา มันจะให้ค่าความผิดพลาดที่แตกต่างกัน ค่าเฉลี่ยตัวอย่างทั้งหมดนี้ซึ่งมีตัวอย่างขนาดใหญ่เพียงพอ จะถูกกระจายตามปกติรอบๆ ค่าเฉลี่ยทั่วไป โดยมีการทำซ้ำจำนวนมากเพียงพอของกลุ่มตัวอย่างที่มีจำนวนวัตถุเท่ากันจากประชากรทั่วไป ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย ม- นี่คือการแพร่กระจายของค่าเฉลี่ยตัวอย่างอย่างหลีกเลี่ยงไม่ได้รอบๆ ค่าเฉลี่ยทั่วไป
กรณีนำเสนอผลการวิจัยเป็นปริมาณสัมพัทธ์ (เช่น เปอร์เซ็นต์) - คำนวณแล้ว ข้อผิดพลาดมาตรฐานของเศษส่วน:
โดยที่ P คือตัวบ่งชี้ในหน่วย %, n คือจำนวนการสังเกต
ผลลัพธ์จะแสดงเป็น (พี ± ม.)% ตัวอย่างเช่น,เปอร์เซ็นต์การฟื้นตัวของผู้ป่วยคือ (95.2±2.5)%
ในกรณีที่จำนวนองค์ประกอบของประชากรแล้วเมื่อคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยและเศษส่วนในตัวส่วนของเศษส่วนแทนจะต้องใส่.
สำหรับการแจกแจงแบบปกติ (การกระจายตัวของค่าเฉลี่ยตัวอย่างเป็นเรื่องปกติ) เรารู้ว่าประชากรส่วนใดอยู่ในช่วงใดก็ได้รอบๆ ค่าเฉลี่ย โดยเฉพาะอย่างยิ่ง:
ในทางปฏิบัติ ปัญหาคือเราไม่ทราบลักษณะของประชากรทั่วไป และกลุ่มตัวอย่างถูกสร้างขึ้นมาอย่างแม่นยำเพื่อจุดประสงค์ในการประมาณค่าเหล่านั้น ซึ่งหมายความว่าถ้าเราสร้างตัวอย่างที่มีขนาดเท่ากัน nจากประชากรทั่วไป ดังนั้นในกรณี 68.3% ช่วงจะประกอบด้วยค่า ม(ใน 95.5% ของกรณีจะอยู่ในช่วงเวลา และใน 99.7% ของกรณี – จะอยู่ในช่วงเวลา)
เนื่องจากมีการใช้ตัวอย่างเพียงตัวอย่างเดียว คำสั่งนี้จึงถูกกำหนดขึ้นในแง่ของความน่าจะเป็น: ด้วยความน่าจะเป็น 68.3% ค่าเฉลี่ยของคุณลักษณะในประชากรจะอยู่ในช่วงเวลา โดยมีความน่าจะเป็น 95.5% - ในช่วงเวลา ฯลฯ
ในทางปฏิบัติ ช่วงเวลาจะถูกสร้างขึ้นรอบๆ ค่าตัวอย่าง โดยมีความน่าจะเป็นที่กำหนด (สูงเพียงพอ) ความน่าจะเป็นของความมั่นใจ –จะ "ครอบคลุม" ค่าที่แท้จริงของพารามิเตอร์นี้ในประชากรทั่วไป ช่วงเวลานี้เรียกว่า ช่วงความมั่นใจ.
ความน่าจะเป็นของความมั่นใจป – นี่คือระดับความเชื่อมั่นว่าช่วงความเชื่อมั่นจะมีค่าจริง (ไม่ทราบ) ของพารามิเตอร์ในประชากร
เช่น ถ้าความน่าจะเป็นของความเชื่อมั่น รคือ 90% ซึ่งหมายความว่า 90 ตัวอย่างจาก 100 ตัวอย่างจะให้ค่าประมาณพารามิเตอร์ในประชากรที่ถูกต้อง ดังนั้นความน่าจะเป็นของข้อผิดพลาดคือ การประมาณการที่ไม่ถูกต้องของค่าเฉลี่ยทั่วไปสำหรับตัวอย่างมีค่าเท่ากับเปอร์เซ็นต์: สำหรับตัวอย่างนี้ หมายความว่า 10 ตัวอย่างจาก 100 ตัวอย่างจะให้ค่าประมาณที่ไม่ถูกต้อง
แน่นอนว่า ระดับความเชื่อมั่น (ความน่าจะเป็นของความเชื่อมั่น) ขึ้นอยู่กับขนาดของช่วงเวลา ยิ่งช่วงกว้างเท่าใด ความเชื่อมั่นก็จะยิ่งสูงขึ้นเท่านั้นว่าค่าที่ไม่ทราบสำหรับประชากรจะตกอยู่ในนั้น ในทางปฏิบัติ มีการใช้ข้อผิดพลาดในการสุ่มตัวอย่างอย่างน้อยสองเท่าเพื่อสร้างช่วงความเชื่อมั่นเพื่อให้มีความมั่นใจอย่างน้อย 95.5%
การกำหนดขีดจำกัดความเชื่อมั่นของค่าเฉลี่ยและค่าสัมพัทธ์ช่วยให้เราค้นหาค่าสุดขั้วสองค่า - ค่าต่ำสุดที่เป็นไปได้และค่าสูงสุดที่เป็นไปได้ ซึ่งตัวบ่งชี้ที่ศึกษาสามารถเกิดขึ้นได้ในประชากรทั้งหมด บนพื้นฐานนี้ ขีดจำกัดความเชื่อมั่น (หรือช่วงความเชื่อมั่น)- สิ่งเหล่านี้คือขอบเขตของค่าเฉลี่ยหรือค่าสัมพัทธ์ ซึ่งเกินกว่านั้นเนื่องจากความผันผวนแบบสุ่มจึงมีความน่าจะเป็นที่ไม่มีนัยสำคัญ
ช่วงความเชื่อมั่นสามารถเขียนใหม่เป็น: , โดยที่ ที– เกณฑ์ความเชื่อมั่น
ขีดจำกัดความเชื่อมั่นของค่าเฉลี่ยเลขคณิตในประชากรถูกกำหนดโดยสูตร:
ม ยีน = ม เลือก + ที ม ม
สำหรับค่าสัมพัทธ์:
ร ยีน = ป เลือก + ที ม ร
ที่ไหน ม ยีนและ ร ยีน- ค่าเฉลี่ยและค่าสัมพัทธ์สำหรับประชากรทั่วไป ม เลือกและ ร เลือก- ค่าเฉลี่ยและค่าสัมพัทธ์ที่ได้จากประชากรตัวอย่าง ม มและ ม ป- ข้อผิดพลาดของค่าเฉลี่ยและค่าสัมพัทธ์ ที- เกณฑ์ความเชื่อมั่น (เกณฑ์ความแม่นยำซึ่งกำหนดขึ้นเมื่อวางแผนการศึกษาและอาจเท่ากับ 2 หรือ 3) ที ม- นี่คือช่วงความเชื่อมั่นหรือ Δ - ข้อผิดพลาดสูงสุดของตัวบ่งชี้ที่ได้รับในการศึกษาตัวอย่าง
ควรสังเกตว่ามูลค่าของเกณฑ์ ทีในระดับหนึ่งที่เกี่ยวข้องกับความน่าจะเป็นของการพยากรณ์ที่ปราศจากข้อผิดพลาด (p) ซึ่งแสดงเป็น % ผู้วิจัยเลือกเองโดยคำนึงถึงความต้องการเพื่อให้ได้ผลลัพธ์ที่มีระดับความแม่นยำที่ต้องการ ดังนั้นเพื่อความน่าจะเป็นที่จะพยากรณ์โดยปราศจากข้อผิดพลาดที่ 95.5% ค่าของเกณฑ์ ทีคือ 2 สำหรับ 99.7% - 3
การประมาณช่วงความเชื่อมั่นที่กำหนดนั้นยอมรับได้สำหรับประชากรทางสถิติที่มีการสังเกตมากกว่า 30 ครั้งเท่านั้น ด้วยขนาดประชากรที่น้อยกว่า (ตัวอย่างขนาดเล็ก) จึงมีการใช้ตารางพิเศษเพื่อกำหนดเกณฑ์ t ในตารางเหล่านี้ ค่าที่ต้องการจะอยู่ที่จุดตัดของเส้นที่สอดคล้องกับขนาดของประชากร (n-1)และคอลัมน์ที่สอดคล้องกับระดับความน่าจะเป็นของการพยากรณ์ที่ปราศจากข้อผิดพลาด (95.5%; 99.7%) เลือกโดยผู้วิจัย ในการวิจัยทางการแพทย์ เมื่อสร้างขีดจำกัดความเชื่อมั่นสำหรับตัวบ่งชี้ใดๆ ความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาดคือ 95.5% ขึ้นไป ซึ่งหมายความว่าค่าตัวบ่งชี้ที่ได้จากประชากรตัวอย่างจะต้องพบในประชากรทั่วไปอย่างน้อย 95.5% ของกรณี
คำถามในหัวข้อบทเรียน:
ความเกี่ยวข้องของตัวชี้วัดความหลากหลายทางลักษณะในประชากรทางสถิติ
ลักษณะทั่วไปของตัวชี้วัดความแปรผันสัมบูรณ์
ส่วนเบี่ยงเบนมาตรฐาน การคำนวณ การประยุกต์
การวัดสัมพัทธ์ของการแปรผัน
ค่ามัธยฐานควอไทล์คะแนน
การประเมินนัยสำคัญทางสถิติของผลการศึกษา
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิต สูตรคำนวณ ตัวอย่างการใช้งาน
การคำนวณสัดส่วนและข้อผิดพลาดมาตรฐาน
แนวคิดเรื่องความน่าจะเป็นของความเชื่อมั่น ตัวอย่างการใช้งาน
10. แนวคิดเรื่องช่วงความเชื่อมั่น และการนำไปใช้
ทดสอบงานในหัวข้อด้วยคำตอบมาตรฐาน:
1. ตัวชี้วัดสัมบูรณ์ของการเปลี่ยนแปลงอ้างอิงถึง
1) ค่าสัมประสิทธิ์ของการแปรผัน
2) ค่าสัมประสิทธิ์การสั่น
4) ค่ามัธยฐาน
2. ตัวบ่งชี้ความสัมพันธ์ของการเปลี่ยนแปลงที่เกี่ยวข้อง
1) การกระจายตัว
4) ค่าสัมประสิทธิ์ของการแปรผัน
3. เกณฑ์ที่กำหนดโดยค่านิยมสูงสุดของตัวเลือกในชุดตัวเลือกต่างๆ
2) แอมพลิจูด
3) การกระจายตัว
4) ค่าสัมประสิทธิ์ของการแปรผัน
4. ความแตกต่างของตัวเลือกที่รุนแรงคือ
2) แอมพลิจูด
3) ส่วนเบี่ยงเบนมาตรฐาน
4) ค่าสัมประสิทธิ์ของการแปรผัน
5. ตารางเฉลี่ยของการเบี่ยงเบนของมูลค่าส่วนบุคคลของลักษณะจากค่าเฉลี่ยคือ
1) ค่าสัมประสิทธิ์การสั่น
2) ค่ามัธยฐาน
3) การกระจายตัว
6. อัตราส่วนของระดับความแปรปรวนต่อมูลค่าเฉลี่ยของตัวละครคือ
1) ค่าสัมประสิทธิ์ของการแปรผัน
2) ส่วนเบี่ยงเบนมาตรฐาน
4) ค่าสัมประสิทธิ์การสั่น
7. อัตราส่วนความเบี่ยงเบนของสี่เหลี่ยมจัตุรัสเฉลี่ยต่อมูลค่าเฉลี่ยของลักษณะเฉพาะคือ
1) การกระจายตัว
2) ค่าสัมประสิทธิ์ของการแปรผัน
3) ค่าสัมประสิทธิ์การสั่น
4) แอมพลิจูด
8. ตัวเลือกที่อยู่ตรงกลางของชุดความหลากหลายและแบ่งออกเป็นสองส่วนเท่า ๆ กันคือ
1) ค่ามัธยฐาน
3) แอมพลิจูด
9. ในการวิจัยทางการแพทย์ เมื่อมีการกำหนดขีดจำกัดความเชื่อมั่นสำหรับตัวบ่งชี้ใดๆ จะยอมรับความน่าจะเป็นของการทำนายที่ปราศจากข้อผิดพลาด
10. หากตัวอย่าง 90 ตัวอย่างจากทั้งหมด 100 ตัวอย่างให้ค่าประมาณที่ถูกต้องของพารามิเตอร์ในประชากร นั่นหมายความว่าความเชื่อมั่นน่าจะเป็น ปเท่ากัน
11. หาก 10 ตัวอย่างจาก 100 ตัวอย่างให้ค่าประมาณที่ไม่ถูกต้อง ความน่าจะเป็นของข้อผิดพลาดจะเท่ากัน
12. ขีดจำกัดของค่าเฉลี่ยหรือค่าสัมพัทธ์ ซึ่งไปไกลกว่าซึ่งเนื่องจากการแกว่งแบบสุ่มมีความน่าจะเป็นเล็กน้อย - นี่คือ
1) ช่วงความเชื่อมั่น
2) แอมพลิจูด
4) ค่าสัมประสิทธิ์ของการแปรผัน
13. ตัวอย่างเล็กๆ น้อยๆ ถือเป็นประชากรกลุ่มใด
1) n น้อยกว่าหรือเท่ากับ 100
2) n น้อยกว่าหรือเท่ากับ 30
3) n น้อยกว่าหรือเท่ากับ 40
4) n อยู่ใกล้กับ 0
14. สำหรับความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาด มูลค่าเกณฑ์ 95% ทีเป็น
15. สำหรับความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาด มูลค่าเกณฑ์ 99% ทีเป็น
16. สำหรับการกระจายตัวที่ใกล้เคียงกับปกติ ประชากรจะถูกพิจารณาว่าเป็นเนื้อเดียวกัน หากค่าสัมประสิทธิ์ของการแปรผันไม่เกิน
17. ตัวเลือก การแยกตัวเลือก ค่าตัวเลขซึ่งไม่เกิน 25% ของค่าสูงสุดที่เป็นไปได้ในซีรีส์ที่กำหนด - นี่คือ
2) ควอไทล์ล่าง
3) ควอไทล์บน
4) ควอไทล์
18. ข้อมูลที่ไม่บิดเบือนและสะท้อนความเป็นจริงของวัตถุประสงค์อย่างถูกต้องเรียกว่า
1) เป็นไปไม่ได้
2) เป็นไปได้อย่างเท่าเทียมกัน
3) เชื่อถือได้
4) สุ่ม
19. ตามกฎของ "สามซิกมา" โดยมีการกระจายลักษณะภายในตามปกติ
จะถูกตั้งอยู่
1) ตัวเลือก 68.3%
ในการคำนวณค่าเฉลี่ยเรขาคณิตอย่างง่าย จะใช้สูตร:
ถ่วงน้ำหนักทางเรขาคณิต
ในการหาค่าเฉลี่ยเรขาคณิตแบบถ่วงน้ำหนัก จะใช้สูตรดังนี้
เส้นผ่านศูนย์กลางเฉลี่ยของล้อ ท่อ และด้านเฉลี่ยของสี่เหลี่ยมจัตุรัสถูกกำหนดโดยใช้สี่เหลี่ยมจัตุรัสเฉลี่ย
ค่า Root-mean-square ใช้ในการคำนวณตัวบ่งชี้บางตัว เช่น ค่าสัมประสิทธิ์การแปรผัน ซึ่งเป็นตัวกำหนดลักษณะจังหวะของการผลิต ค่าเบี่ยงเบนมาตรฐานจากผลผลิตตามแผนในช่วงระยะเวลาหนึ่งถูกกำหนดโดยใช้สูตรต่อไปนี้:
ค่าเหล่านี้แสดงลักษณะการเปลี่ยนแปลงของตัวชี้วัดทางเศรษฐกิจได้อย่างแม่นยำเมื่อเปรียบเทียบกับมูลค่าฐานซึ่งถือเป็นค่าเฉลี่ย
สมการกำลังสองอย่างง่าย
กำลังสองเฉลี่ยรากคำนวณโดยใช้สูตร:
ถ่วงน้ำหนักแบบกำลังสอง
ค่าเฉลี่ยกำลังสองถ่วงน้ำหนักเท่ากับ:
22. ตัวชี้วัดสัมบูรณ์ของการเปลี่ยนแปลงได้แก่:
ช่วงของการเปลี่ยนแปลง
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย
การกระจายตัว
ส่วนเบี่ยงเบนมาตรฐาน
ช่วงของการเปลี่ยนแปลง (r)
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์
โดยจะแสดงขีดจำกัดภายในมูลค่าของการเปลี่ยนแปลงลักษณะเฉพาะในประชากรที่กำลังศึกษา
ประสบการณ์การทำงานของผู้สมัครทั้งห้าคนในงานก่อนหน้าคือ: 2,3,4,7 และ 9 ปี วิธีแก้ไข: พิสัยของการเปลี่ยนแปลง = 9 - 2 = 7 ปี
สำหรับคำอธิบายทั่วไปเกี่ยวกับความแตกต่างในค่าคุณลักษณะ ตัวบ่งชี้การเปลี่ยนแปลงโดยเฉลี่ยจะคำนวณโดยคำนึงถึงความเบี่ยงเบนจากค่าเฉลี่ยเลขคณิต ความแตกต่างถือเป็นส่วนเบี่ยงเบนจากค่าเฉลี่ย
ในกรณีนี้ เพื่อหลีกเลี่ยงผลรวมของการเบี่ยงเบนของลักษณะเฉพาะจากค่าเฉลี่ยที่เปลี่ยนเป็นศูนย์ (คุณสมบัติของค่าเฉลี่ยเป็นศูนย์) เราจะต้องเพิกเฉยต่อสัญญาณของการเบี่ยงเบน นั่นคือ ใช้ผลรวมโมดูโลนี้ หรือ ยกกำลังสองค่าเบี่ยงเบน
ค่าเบี่ยงเบนเชิงเส้นและกำลังสองเฉลี่ย
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยคือค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนสัมบูรณ์ของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ย
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยนั้นง่าย:
ประสบการณ์การทำงานของผู้สมัครทั้งห้าคนในงานก่อนหน้าคือ: 2,3,4,7 และ 9 ปี
ในตัวอย่างของเรา: ปี;
คำตอบ: 2.4 ปี
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยถ่วงน้ำหนักใช้กับข้อมูลที่จัดกลุ่ม:
เนื่องจากแบบแผน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจึงถูกนำมาใช้ในทางปฏิบัติค่อนข้างน้อย (โดยเฉพาะอย่างยิ่งเพื่อระบุลักษณะการปฏิบัติตามภาระผูกพันตามสัญญาเกี่ยวกับความสม่ำเสมอของการส่งมอบในการวิเคราะห์คุณภาพผลิตภัณฑ์โดยคำนึงถึงคุณสมบัติทางเทคโนโลยีของการผลิต)
ส่วนเบี่ยงเบนมาตรฐาน
คุณลักษณะที่สมบูรณ์แบบที่สุดของการเปลี่ยนแปลงคือค่าเบี่ยงเบนกำลังสองเฉลี่ย ซึ่งเรียกว่าค่ามาตรฐาน (หรือค่าเบี่ยงเบนมาตรฐาน) ส่วนเบี่ยงเบนมาตรฐาน() เท่ากับรากที่สองของค่าเบี่ยงเบนกำลังสองเฉลี่ยของแต่ละค่าของลักษณะค่าเฉลี่ยเลขคณิต:
ค่าเบี่ยงเบนมาตรฐานนั้นง่าย:
ค่าเบี่ยงเบนมาตรฐานแบบถ่วงน้ำหนักใช้กับข้อมูลที่จัดกลุ่ม:
ระหว่างค่ารากกำลังสองและการเบี่ยงเบนเชิงเส้นเฉลี่ยภายใต้เงื่อนไขการแจกแจงแบบปกติ อัตราส่วนต่อไปนี้จะเกิดขึ้น: ~ 1.25
ค่าเบี่ยงเบนมาตรฐานซึ่งเป็นการวัดความแปรผันหลักสัมบูรณ์ใช้ในการกำหนดค่าพิกัดของเส้นโค้งการกระจายปกติในการคำนวณที่เกี่ยวข้องกับการจัดองค์กรของการสังเกตตัวอย่างและการสร้างความแม่นยำของคุณลักษณะตัวอย่างตลอดจนในการประเมิน ขีดจำกัดของการแปรผันของคุณลักษณะในประชากรเนื้อเดียวกัน
นักคณิตศาสตร์และนักสถิติที่ชาญฉลาดได้คิดค้นตัวบ่งชี้ที่น่าเชื่อถือมากขึ้น แม้ว่าจะมีจุดประสงค์ที่แตกต่างกันเล็กน้อยก็ตาม ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย- ตัวบ่งชี้นี้แสดงลักษณะการวัดการกระจายตัวของค่าของชุดข้อมูลรอบค่าเฉลี่ย
ในการแสดงการวัดการกระจายของข้อมูล คุณต้องตัดสินใจก่อนว่าจะคำนวณการกระจายนี้ว่าใด ซึ่งโดยปกติจะเป็นค่าเฉลี่ย ถัดไปคุณต้องคำนวณว่าค่าของชุดข้อมูลที่วิเคราะห์นั้นอยู่ห่างจากค่าเฉลี่ยมากน้อยเพียงใด เห็นได้ชัดว่าแต่ละค่าสอดคล้องกับค่าเบี่ยงเบนที่แน่นอน แต่เราสนใจในการประเมินโดยรวมซึ่งครอบคลุมประชากรทั้งหมด ดังนั้นค่าเบี่ยงเบนเฉลี่ยจึงคำนวณโดยใช้สูตรค่าเฉลี่ยเลขคณิตปกติ แต่! แต่เพื่อที่จะคำนวณค่าเฉลี่ยของการเบี่ยงเบนนั้น จะต้องบวกเข้าด้วยกันก่อน และถ้าเราบวกจำนวนบวกและลบ พวกมันจะหักล้างกัน และผลรวมของพวกมันจะมีแนวโน้มเป็นศูนย์ เพื่อหลีกเลี่ยงปัญหานี้ การเบี่ยงเบนทั้งหมดจะถูกนำมาใช้แบบโมดูโล กล่าวคือ จำนวนลบทั้งหมดจะกลายเป็นบวก ตอนนี้ค่าเบี่ยงเบนเฉลี่ยจะแสดงการวัดโดยทั่วไปของการแพร่กระจายของค่า เป็นผลให้ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจะถูกคำนวณโดยใช้สูตร:
ก– ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย
x– ตัวบ่งชี้ที่วิเคราะห์ โดยมีขีดด้านบน – ค่าเฉลี่ยของตัวบ่งชี้
n– จำนวนค่าในชุดข้อมูลที่วิเคราะห์
ฉันหวังว่าตัวดำเนินการรวมจะไม่ทำให้ใครกลัว
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยที่คำนวณโดยใช้สูตรที่ระบุสะท้อนถึงค่าเบี่ยงเบนสัมบูรณ์โดยเฉลี่ยจากค่าเฉลี่ยสำหรับประชากรที่กำหนด
ในภาพเส้นสีแดงคือค่าเฉลี่ย การเบี่ยงเบนของการสังเกตแต่ละครั้งจากค่าเฉลี่ยจะแสดงด้วยลูกศรเล็กๆ เป็นแบบโมดูโลและสรุปผล จากนั้นทุกอย่างจะถูกหารด้วยจำนวนค่า
เพื่อให้ภาพสมบูรณ์ เราต้องยกตัวอย่าง สมมติว่ามีบริษัทหนึ่งที่ผลิตเครื่องตัดพลั่ว การตัดแต่ละครั้งควรมีความยาว 1.5 เมตร แต่ที่สำคัญกว่านั้นคือทั้งหมดควรเท่ากันหรืออย่างน้อยบวกหรือลบ 5 ซม. อย่างไรก็ตาม คนงานที่ไม่ระมัดระวังจะตัดออก 1.2 ม. หรือ 1.8 ม. ผู้อยู่อาศัยในช่วงฤดูร้อนจะไม่มีความสุข ผู้อำนวยการของบริษัทตัดสินใจทำการวิเคราะห์ทางสถิติเกี่ยวกับความยาวของการตัด ฉันเลือกชิ้นส่วน 10 ชิ้นแล้ววัดความยาว หาค่าเฉลี่ย และคำนวณค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย ค่าเฉลี่ยกลายเป็นเพียงสิ่งที่จำเป็น - 1.5 ม. แต่ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยคือ 0.16 ม. ปรากฎว่าการตัดแต่ละครั้งยาวหรือสั้นกว่าที่ต้องการโดยเฉลี่ย 16 ซม. มีบางอย่างที่จะพูดคุยเกี่ยวกับ คนงาน อันที่จริง ฉันไม่เคยเห็นการใช้ตัวบ่งชี้นี้จริง ๆ เลย ดังนั้นฉันจึงคิดตัวอย่างขึ้นมาเอง อย่างไรก็ตาม มีตัวบ่งชี้ดังกล่าวในสถิติ
การกระจายตัว
เช่นเดียวกับค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย ความแปรปรวนยังสะท้อนถึงขอบเขตของการแพร่กระจายของข้อมูลรอบๆ ค่าเฉลี่ยอีกด้วย
สูตรการคำนวณความแปรปรวนมีลักษณะดังนี้:
(สำหรับอนุกรมรูปแบบ (ผลต่างถ่วงน้ำหนัก))
(สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม (ความแปรปรวนอย่างง่าย))
โดยที่: σ 2 – การกระจายตัว สี– เราวิเคราะห์ตัวบ่งชี้ sq (ค่าสัญญาณ), – ค่าเฉลี่ยของตัวบ่งชี้, f i – จำนวนค่าในชุดข้อมูลที่วิเคราะห์
การกระจายตัวคือกำลังสองเฉลี่ยของการเบี่ยงเบน
ขั้นแรกให้คำนวณค่าเฉลี่ย จากนั้นนำความแตกต่างระหว่างค่าดั้งเดิมและค่าเฉลี่ยแต่ละค่า ยกกำลังสอง คูณด้วยความถี่ของค่าแอตทริบิวต์ที่เกี่ยวข้อง เพิ่มแล้วหารด้วยจำนวนค่าในประชากร
อย่างไรก็ตาม ในรูปแบบบริสุทธิ์ เช่น ค่าเฉลี่ยเลขคณิตหรือดัชนี จะไม่มีการใช้การกระจายตัว ค่อนข้างเป็นตัวบ่งชี้เสริมและระดับกลางที่ใช้สำหรับการวิเคราะห์ทางสถิติประเภทอื่นๆ
วิธีง่ายๆ ในการคำนวณความแปรปรวน
ส่วนเบี่ยงเบนมาตรฐาน
หากต้องการใช้ความแปรปรวนในการวิเคราะห์ข้อมูล จะต้องหารากที่สองของความแปรปรวน ปรากฎสิ่งที่เรียกว่า ส่วนเบี่ยงเบนมาตรฐาน.
อย่างไรก็ตาม ค่าเบี่ยงเบนมาตรฐานเรียกอีกอย่างว่าซิกมา - จากอักษรกรีกที่แสดงถึงค่าดังกล่าว
แน่นอนว่าค่าเบี่ยงเบนมาตรฐานยังเป็นตัวกำหนดลักษณะการวัดการกระจายตัวของข้อมูล แต่ตอนนี้ (ไม่เหมือนกับความแปรปรวน) สามารถนำมาเปรียบเทียบกับข้อมูลต้นฉบับได้ ตามกฎแล้ว การวัดรากกำลังสองในสถิติจะให้ผลลัพธ์ที่แม่นยำมากกว่าการวัดเชิงเส้น ดังนั้น ค่าเบี่ยงเบนมาตรฐานจึงเป็นการวัดการกระจายตัวของข้อมูลที่แม่นยำมากกว่าค่าเบี่ยงเบนเฉลี่ยเชิงเส้น
ค่าเบี่ยงเบนมาตรฐานเป็นตัวบ่งชี้คลาสสิกของความแปรปรวนจากสถิติเชิงพรรณนา
ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง (อังกฤษ ส่วนเบี่ยงเบนมาตรฐาน, STD, STDev) - ตัวบ่งชี้การกระจายตัวทั่วไปในสถิติเชิงพรรณนา แต่เพราะว่า การวิเคราะห์ทางเทคนิคนั้นคล้ายคลึงกับสถิติ ตัวบ่งชี้นี้สามารถ (และควร) ใช้ในการวิเคราะห์ทางเทคนิคเพื่อตรวจจับระดับการกระจายตัวของราคาของเครื่องมือที่วิเคราะห์เมื่อเวลาผ่านไป แสดงด้วยสัญลักษณ์กรีกซิกมา "σ"
ขอขอบคุณ Carl Gauss และ Pearson ที่ให้เราใช้ค่าเบี่ยงเบนมาตรฐาน
โดยใช้ ส่วนเบี่ยงเบนมาตรฐานในการวิเคราะห์ทางเทคนิคเราหมุนสิ่งนี้ "ดัชนีการกระจายตัว""วี “ตัวชี้วัดความผันผวน“คงความหมายแต่เปลี่ยนเงื่อนไข
ค่าเบี่ยงเบนมาตรฐานคืออะไร
แต่นอกเหนือจากการคำนวณเสริมระดับกลางแล้ว ค่าเบี่ยงเบนมาตรฐานค่อนข้างยอมรับได้สำหรับการคำนวณแบบอิสระและการประยุกต์ในการวิเคราะห์ทางเทคนิค ในฐานะผู้อ่านนิตยสารหญ้าเจ้าชู้ของเรากล่าวว่า “ ฉันยังไม่เข้าใจว่าเหตุใดค่าเบี่ยงเบนมาตรฐานจึงไม่รวมอยู่ในชุดตัวบ่งชี้มาตรฐานของศูนย์ซื้อขายในประเทศ«.
จริงหรือ, ค่าเบี่ยงเบนมาตรฐานสามารถวัดความแปรปรวนของเครื่องมือด้วยวิธีคลาสสิกและ "บริสุทธิ์"- แต่น่าเสียดายที่ตัวบ่งชี้นี้ไม่ได้พบเห็นได้ทั่วไปในการวิเคราะห์หลักทรัพย์
การใช้ค่าเบี่ยงเบนมาตรฐาน
การคำนวณค่าเบี่ยงเบนมาตรฐานด้วยตนเองนั้นไม่น่าสนใจนักแต่มีประโยชน์สำหรับประสบการณ์ ค่าเบี่ยงเบนมาตรฐานสามารถแสดงได้สูตร STD=√[(∑(x-x ) 2)/n] ซึ่งฟังดูเหมือนรากของผลรวมของผลต่างกำลังสองระหว่างองค์ประกอบของตัวอย่างและค่าเฉลี่ย หารด้วยจำนวนองค์ประกอบในตัวอย่าง
หากจำนวนองค์ประกอบในกลุ่มตัวอย่างเกิน 30 ตัวส่วนของเศษส่วนที่อยู่ใต้รากจะใช้ค่า n-1 มิฉะนั้นจะใช้ n
ทีละขั้นตอน การคำนวณค่าเบี่ยงเบนมาตรฐาน:
- คำนวณค่าเฉลี่ยเลขคณิตของตัวอย่างข้อมูล
- ลบค่าเฉลี่ยนี้ออกจากแต่ละองค์ประกอบตัวอย่าง
- เรายกกำลังสองผลต่างผลลัพธ์ทั้งหมด
- รวมผลกำลังสองทั้งหมด
- หารจำนวนผลลัพธ์ด้วยจำนวนองค์ประกอบในกลุ่มตัวอย่าง (หรือด้วย n-1 ถ้า n>30)
- คำนวณรากที่สองของผลหารผลลัพธ์ (เรียกว่า การกระจายตัว)