ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

วิธีหาตัวอย่างค่าเบี่ยงเบนมาตรฐาน ค่าเบี่ยงเบนมาตรฐานคืออะไร - การใช้ฟังก์ชันค่าเบี่ยงเบนมาตรฐานเพื่อคำนวณค่าเบี่ยงเบนมาตรฐานใน Excel

ในการทดสอบสมมติฐานทางสถิติ เมื่อทำการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม

ส่วนเบี่ยงเบนมาตรฐาน:

ส่วนเบี่ยงเบนมาตรฐาน(ค่าประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม พื้น ผนังรอบตัวเรา และเพดาน xสัมพันธ์กับความคาดหวังทางคณิตศาสตร์โดยอิงจากการประมาณค่าความแปรปรวนที่เป็นกลาง):

การกระจายตัวอยู่ที่ไหน - พื้น ผนังรอบตัวเรา และเพดาน ฉันองค์ประกอบที่ 3 ของการเลือก - ขนาดตัวอย่าง - ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง:

ควรสังเกตว่าการประมาณการทั้งสองมีความลำเอียง ในกรณีทั่วไป ไม่สามารถสร้างการประมาณการที่เป็นกลางได้ อย่างไรก็ตาม การประมาณการตามการประมาณค่าความแปรปรวนที่เป็นกลางมีความสอดคล้องกัน

กฎสามซิกมา

กฎสามซิกมา() - ค่าเกือบทั้งหมดของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลา เข้มงวดมากขึ้น - ด้วยความเชื่อมั่นไม่ต่ำกว่า 99.7% ค่าของตัวแปรสุ่มแบบกระจายแบบปกติจะอยู่ในช่วงที่ระบุ (โดยมีเงื่อนไขว่าค่าเป็นจริงและไม่ได้รับจากการประมวลผลตัวอย่าง)

หากไม่ทราบมูลค่าที่แท้จริง เราก็ไม่ควรใช้ แต่พื้น ผนังรอบตัวเรา และเพดาน - ดังนั้น กฎสามซิกมาจึงเปลี่ยนเป็นกฎสามชั้น ผนังรอบตัวเรา และเพดาน .

การตีความค่าส่วนเบี่ยงเบนมาตรฐาน

ค่าเบี่ยงเบนมาตรฐานที่มีค่ามากจะแสดงการแพร่กระจายของค่าจำนวนมากในชุดที่นำเสนอพร้อมกับค่าเฉลี่ยของชุด ค่าเล็กน้อยแสดงว่าค่าในชุดจัดกลุ่มตามค่าเฉลี่ย

ตัวอย่างเช่น เรามีชุดตัวเลขสามชุด: (0, 0, 14, 14), (0, 6, 8, 14) และ (6, 6, 8, 8) ทั้งสามชุดมีค่าเฉลี่ยเท่ากับ 7 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 7, 5 และ 1 ตามลำดับ ชุดสุดท้ายมีค่าเบี่ยงเบนมาตรฐานเล็กน้อยเนื่องจากค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย ชุดแรกมีค่าเบี่ยงเบนมาตรฐานที่ใหญ่ที่สุด - ค่าภายในชุดแตกต่างจากค่าเฉลี่ยอย่างมาก

โดยทั่วไปแล้ว ค่าเบี่ยงเบนมาตรฐานถือได้ว่าเป็นการวัดความไม่แน่นอน ตัวอย่างเช่น ในวิชาฟิสิกส์ ค่าเบี่ยงเบนมาตรฐานใช้ในการระบุข้อผิดพลาดของชุดการวัดปริมาณบางค่าที่ต่อเนื่องกัน ค่านี้มีความสำคัญมากในการพิจารณาความน่าเชื่อถือของปรากฏการณ์ภายใต้การศึกษาเมื่อเปรียบเทียบกับค่าที่ทำนายโดยทฤษฎี: หากค่าเฉลี่ยของการวัดแตกต่างอย่างมากจากค่าที่ทำนายโดยทฤษฎี (ส่วนเบี่ยงเบนมาตรฐานขนาดใหญ่) ดังนั้นควรตรวจสอบค่าที่ได้รับหรือวิธีการรับอีกครั้ง

การประยุกต์ใช้ในทางปฏิบัติ

ในทางปฏิบัติ ค่าเบี่ยงเบนมาตรฐานช่วยให้คุณสามารถกำหนดได้ว่าค่าในชุดอาจแตกต่างจากค่าเฉลี่ยมากน้อยเพียงใด

ภูมิอากาศ

สมมติว่ามีสองเมืองที่มีอุณหภูมิสูงสุดเฉลี่ยต่อวันเท่ากัน แต่เมืองหนึ่งตั้งอยู่บนชายฝั่งและอีกเมืองหนึ่งอยู่บนบก เป็นที่ทราบกันดีว่าเมืองต่างๆ ที่ตั้งอยู่บนชายฝั่งมีอุณหภูมิสูงสุดในเวลากลางวันที่แตกต่างกันหลายประการ ซึ่งต่ำกว่าเมืองที่ตั้งอยู่ในแผ่นดิน ดังนั้น ค่าเบี่ยงเบนมาตรฐานของอุณหภูมิสูงสุดรายวันสำหรับเมืองชายฝั่งทะเลจะน้อยกว่าค่าเบี่ยงเบนมาตรฐานของเมืองที่สอง แม้ว่าค่าเฉลี่ยของค่านี้จะเท่ากันก็ตาม ซึ่งในทางปฏิบัติหมายความว่าความน่าจะเป็นที่อุณหภูมิอากาศสูงสุดบน วันใดวันหนึ่งของปีจะสูงกว่าแตกต่างจากค่าเฉลี่ย ซึ่งสูงกว่าสำหรับเมืองที่ตั้งอยู่ในแผ่นดิน

กีฬา

สมมติว่ามีทีมฟุตบอลหลายทีมที่จัดอันดับตามพารามิเตอร์บางชุด เช่น จำนวนประตูที่ทำได้และเสียโอกาสทำประตู เป็นต้น มีแนวโน้มว่าทีมที่ดีที่สุดในกลุ่มนี้จะมีมูลค่าที่ดีกว่า ​​ด้วยพารามิเตอร์จำนวนมากขึ้น ยิ่งค่าเบี่ยงเบนมาตรฐานของทีมสำหรับแต่ละพารามิเตอร์ที่นำเสนอน้อยเท่าไร ผลลัพธ์ของทีมก็จะยิ่งสมดุลมากขึ้นเท่านั้น ในทางกลับกัน ทีมที่มีค่าเบี่ยงเบนมาตรฐานสูงนั้นยากที่จะคาดเดาผลลัพธ์ ซึ่งในทางกลับกัน อธิบายได้จากความไม่สมดุล เช่น การป้องกันที่แข็งแกร่งแต่การโจมตีที่อ่อนแอ

การใช้ค่าเบี่ยงเบนมาตรฐานของพารามิเตอร์ทีมทำให้สามารถทำนายผลการแข่งขันระหว่างสองทีมได้ในระดับหนึ่งหรืออย่างอื่น ประเมินจุดแข็งและจุดอ่อนของทีม และดังนั้นวิธีการต่อสู้ที่เลือก

การวิเคราะห์ทางเทคนิค

ดูเพิ่มเติม

วรรณกรรม

* โบโรวิคอฟ, วี.สถิติ. ศิลปะการวิเคราะห์ข้อมูลบนคอมพิวเตอร์: สำหรับมืออาชีพ / V. Borovikov - เซนต์ปีเตอร์สเบิร์ก : ปีเตอร์, 2546. - 688 น. - ไอ 5-272-00078-1.

บทเรียนหมายเลข 4

หัวข้อ: “สถิติเชิงพรรณนา ตัวชี้วัดความหลากหลายในลักษณะรวม"

เกณฑ์หลักสำหรับความหลากหลายของคุณลักษณะในประชากรทางสถิติ ได้แก่ ขีดจำกัด แอมพลิจูด ส่วนเบี่ยงเบนมาตรฐาน สัมประสิทธิ์การแกว่ง และสัมประสิทธิ์การแปรผัน ในบทเรียนก่อนหน้านี้มีการกล่าวถึงว่าค่าเฉลี่ยให้เฉพาะลักษณะทั่วไปของคุณลักษณะที่กำลังศึกษาโดยรวมและไม่ได้คำนึงถึงค่าของตัวแปรแต่ละตัว: ค่าต่ำสุดและค่าสูงสุด, สูงกว่าค่าเฉลี่ย, ต่ำกว่า เฉลี่ย ฯลฯ

ตัวอย่าง. ค่าเฉลี่ยของลำดับตัวเลขที่แตกต่างกันสองลำดับ: -100; -20; 100; 20 และ 0.1; -0.2; 0.1 เหมือนกันและเท่ากันทุกประการเกี่ยวกับ.อย่างไรก็ตาม ช่วงกระจายของข้อมูลลำดับค่าเฉลี่ยสัมพัทธ์เหล่านี้แตกต่างกันมาก

การกำหนดเกณฑ์ที่ระบุไว้สำหรับความหลากหลายของคุณลักษณะนั้นดำเนินการโดยคำนึงถึงมูลค่าของมันในแต่ละองค์ประกอบของประชากรทางสถิติเป็นหลัก

ตัวชี้วัดในการวัดความแปรผันของลักษณะคือ แน่นอนและ ญาติ- ตัวบ่งชี้ความแปรปรวนสัมบูรณ์ ได้แก่ ช่วงของความแปรผัน ขีดจำกัด ส่วนเบี่ยงเบนมาตรฐาน การกระจายตัว ค่าสัมประสิทธิ์ของการแปรผันและค่าสัมประสิทธิ์การแกว่งหมายถึงการวัดสัมพัทธ์ของการแปรผัน

ขีดจำกัด (ลิม)–นี่คือเกณฑ์ที่กำหนดโดยค่าสุดขีดของตัวแปรในชุดรูปแบบต่างๆ กล่าวอีกนัยหนึ่งเกณฑ์นี้จำกัดอยู่ที่ค่าต่ำสุดและสูงสุดของแอตทริบิวต์:

แอมพลิจูด (แอม)หรือ ช่วงของการเปลี่ยนแปลง –นี่คือความแตกต่างระหว่างตัวเลือกสุดขั้ว การคำนวณเกณฑ์นี้ดำเนินการโดยการลบค่าต่ำสุดออกจากค่าสูงสุดของแอตทริบิวต์ซึ่งช่วยให้สามารถประมาณระดับการกระจายของตัวเลือกได้:

ข้อเสียของขีด จำกัด และแอมพลิจูดเป็นเกณฑ์ของความแปรปรวนก็คือพวกมันขึ้นอยู่กับค่าสุดขีดของลักษณะเฉพาะในซีรีย์รูปแบบต่างๆ ในกรณีนี้ ความผันผวนของค่าคุณลักษณะภายในชุดข้อมูลจะไม่ถูกนำมาพิจารณาด้วย

คำอธิบายที่สมบูรณ์ที่สุดของความหลากหลายของลักษณะในประชากรทางสถิติมีให้โดย ส่วนเบี่ยงเบนมาตรฐาน(ซิกมา) ซึ่งเป็นการวัดความเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ยโดยทั่วไป ค่าเบี่ยงเบนมาตรฐานมักเรียกว่า ส่วนเบี่ยงเบนมาตรฐาน.

ค่าเบี่ยงเบนมาตรฐานจะขึ้นอยู่กับการเปรียบเทียบแต่ละตัวเลือกกับค่าเฉลี่ยเลขคณิตของประชากรที่กำหนด เนื่องจากโดยรวมจะมีตัวเลือกทั้งน้อยกว่าและมากกว่าเสมอ ผลรวมของการเบี่ยงเบนที่มีเครื่องหมาย "" จะถูกยกเลิกด้วยผลรวมของการเบี่ยงเบนที่มีเครื่องหมาย "" เช่น ผลรวมของการเบี่ยงเบนทั้งหมดเป็นศูนย์ เพื่อหลีกเลี่ยงอิทธิพลของสัญญาณของความแตกต่าง จะมีการเบี่ยงเบนจากค่าเฉลี่ยเลขคณิตยกกำลังสอง เช่น - ผลรวมของการเบี่ยงเบนกำลังสองไม่เท่ากับศูนย์ เพื่อให้ได้ค่าสัมประสิทธิ์ที่สามารถวัดความแปรปรวนได้ ให้หาค่าเฉลี่ยของผลรวมของกำลังสอง - ค่านี้เรียกว่า ความแตกต่าง:

โดยพื้นฐานแล้วการกระจายตัวคือกำลังสองเฉลี่ยของการเบี่ยงเบนของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ย การกระจายตัว กำลังสองของส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนคือปริมาณมิติ (ระบุชื่อ) ดังนั้น ถ้าตัวแปรของชุดตัวเลขแสดงเป็นหน่วยเมตร ความแปรปรวนก็จะให้ตารางเมตร หากตัวเลือกแสดงเป็นกิโลกรัม ความแปรปรวนจะให้กำลังสองของการวัดนี้ (กก. 2) เป็นต้น

ส่วนเบี่ยงเบนมาตรฐาน– รากที่สองของความแปรปรวน:

แล้วเมื่อคำนวณการกระจายตัวและส่วนเบี่ยงเบนมาตรฐานในตัวส่วนของเศษส่วนแทนจะต้องใส่.

การคำนวณค่าเบี่ยงเบนมาตรฐานสามารถแบ่งออกเป็นหกขั้นตอนซึ่งจะต้องดำเนินการในลำดับที่แน่นอน:

การใช้ค่าเบี่ยงเบนมาตรฐาน:

ก) สำหรับการตัดสินความแปรปรวนของอนุกรมความแปรผันและการประเมินเชิงเปรียบเทียบของลักษณะทั่วไป (การเป็นตัวแทน) ของค่าเฉลี่ยเลขคณิต นี่เป็นสิ่งจำเป็นในการวินิจฉัยแยกโรคเมื่อพิจารณาความคงตัวของอาการ

b) เพื่อสร้างซีรี่ส์รูปแบบใหม่ขึ้นมาใหม่ เช่น การฟื้นฟูการตอบสนองความถี่ตาม กฎสามซิกมา. ในช่วงเวลา (ม ±3σ) 99.7% ของตัวแปรทั้งหมดของซีรีส์อยู่ในช่วงเวลา (ม±2σ) - 95.5% และอยู่ในช่วง (ม±1σ) - ตัวแปรแถว 68.3%(รูปที่ 1)

c) เพื่อระบุตัวเลือก "ป๊อปอัป"

d) เพื่อกำหนดพารามิเตอร์ของบรรทัดฐานและพยาธิวิทยาโดยใช้การประมาณค่าซิกมา

e) เพื่อคำนวณค่าสัมประสิทธิ์ของการแปรผัน

f) เพื่อคำนวณความคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ยเลขคณิต

เพื่อระบุลักษณะประชากรใด ๆ ที่มีประเภทการกระจายแบบปกติ ก็เพียงพอที่จะรู้พารามิเตอร์สองตัว: ค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐาน

รูปที่ 1 กฎสามซิกมา

ตัวอย่าง.

ในด้านกุมารเวชศาสตร์ ค่าเบี่ยงเบนมาตรฐานใช้ในการประเมินพัฒนาการทางร่างกายของเด็กโดยการเปรียบเทียบข้อมูลของเด็กแต่ละคนกับตัวชี้วัดมาตรฐานที่เกี่ยวข้อง ค่าเฉลี่ยเลขคณิตของพัฒนาการทางกายภาพของเด็กที่มีสุขภาพดีถือเป็นมาตรฐาน การเปรียบเทียบตัวบ่งชี้กับมาตรฐานดำเนินการโดยใช้ตารางพิเศษที่กำหนดมาตรฐานพร้อมกับสเกลซิกมาที่เกี่ยวข้อง เชื่อกันว่าหากตัวบ่งชี้พัฒนาการทางกายภาพของเด็กอยู่ในมาตรฐาน (ค่าเฉลี่ยเลขคณิต) ±σแสดงว่าพัฒนาการทางกายภาพของเด็ก (ตามตัวบ่งชี้นี้) จะสอดคล้องกับบรรทัดฐาน หากตัวบ่งชี้อยู่ภายในมาตรฐาน ±2σ แสดงว่ามีความเบี่ยงเบนเล็กน้อยจากบรรทัดฐาน หากตัวบ่งชี้เกินขีด จำกัด เหล่านี้แสดงว่าพัฒนาการทางกายภาพของเด็กแตกต่างอย่างมากจากบรรทัดฐาน (เป็นไปได้ทางพยาธิวิทยา)

นอกจากตัวบ่งชี้ความแปรผันที่แสดงเป็นค่าสัมบูรณ์แล้ว การวิจัยทางสถิติยังใช้ตัวบ่งชี้ความแปรผันที่แสดงเป็นค่าสัมพัทธ์ ค่าสัมประสิทธิ์การสั่น -นี่คืออัตราส่วนของช่วงของการแปรผันต่อค่าเฉลี่ยของลักษณะ ค่าสัมประสิทธิ์การเปลี่ยนแปลง -นี่คืออัตราส่วนของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยของคุณลักษณะ โดยปกติแล้วค่าเหล่านี้จะแสดงเป็นเปอร์เซ็นต์

สูตรคำนวณตัวบ่งชี้ความแปรผันสัมพัทธ์:

จากสูตรข้างต้นจะเห็นได้ว่าค่าสัมประสิทธิ์ยิ่งมากขึ้น วี ใกล้กับศูนย์มากขึ้น ความแปรผันของค่าคุณลักษณะก็จะยิ่งน้อยลงเท่านั้น ยิ่งมาก. วีเครื่องหมายยิ่งแปรผันมาก

ในทางปฏิบัติทางสถิติ มักใช้ค่าสัมประสิทธิ์ของการแปรผัน ซึ่งไม่เพียงแต่ใช้สำหรับการประเมินเปรียบเทียบความแปรปรวนเท่านั้น แต่ยังใช้เพื่อระบุลักษณะความเป็นเนื้อเดียวกันของประชากรด้วย ประชากรจะถือว่าเป็นเนื้อเดียวกันหากค่าสัมประสิทธิ์การเปลี่ยนแปลงไม่เกิน 33% (สำหรับการแจกแจงที่ใกล้เคียงกับปกติ) ในทางคณิตศาสตร์ อัตราส่วนของ σ และค่าเฉลี่ยเลขคณิตจะทำให้อิทธิพลของค่าสัมบูรณ์ของคุณลักษณะเหล่านี้เป็นกลาง และอัตราส่วนเปอร์เซ็นต์ทำให้ค่าสัมประสิทธิ์ของการแปรผันเป็นค่าที่ไม่มีมิติ (ไม่มีชื่อ)

ค่าผลลัพธ์ของค่าสัมประสิทธิ์การแปรผันจะประมาณตามการไล่ระดับโดยประมาณของระดับความหลากหลายของลักษณะ:

อ่อนแอ - มากถึง 10%

เฉลี่ย - 10 - 20%

แข็งแกร่ง - มากกว่า 20%

แนะนำให้ใช้ค่าสัมประสิทธิ์การแปรผันในกรณีที่จำเป็นต้องเปรียบเทียบคุณลักษณะที่มีขนาดและมิติต่างกัน

แสดงให้เห็นความแตกต่างระหว่างค่าสัมประสิทธิ์ของการแปรผันและเกณฑ์การกระจายอื่นๆ อย่างชัดเจน ตัวอย่าง.

ตารางที่ 1

องค์ประกอบของคนงานในวิสาหกิจอุตสาหกรรม

จากลักษณะทางสถิติที่ระบุในตัวอย่าง เราสามารถสรุปได้เกี่ยวกับความสม่ำเสมอขององค์ประกอบอายุและระดับการศึกษาของพนักงานในองค์กร โดยคำนึงถึงความมั่นคงทางวิชาชีพที่ต่ำของอาสาสมัครที่ทำการสำรวจ จะเห็นได้ง่ายว่าความพยายามที่จะตัดสินแนวโน้มทางสังคมเหล่านี้ด้วยส่วนเบี่ยงเบนมาตรฐานจะนำไปสู่ข้อสรุปที่ผิดพลาด และความพยายามในการเปรียบเทียบลักษณะทางบัญชี “ประสบการณ์การทำงาน” และ “อายุ” กับตัวบ่งชี้ทางบัญชี “การศึกษา” โดยทั่วไปจะเป็น ไม่ถูกต้องเนื่องจากความหลากหลายของลักษณะเหล่านี้

ค่ามัธยฐานและเปอร์เซ็นไทล์

สำหรับการแจกแจงลำดับ (อันดับ) โดยที่เกณฑ์สำหรับตรงกลางของอนุกรมคือค่ามัธยฐาน ค่าเบี่ยงเบนมาตรฐานและการกระจายตัวไม่สามารถใช้เป็นลักษณะของการกระจายตัวของตัวแปรได้

เช่นเดียวกับซีรีส์รูปแบบเปิด สถานการณ์นี้เกิดจากการที่ค่าเบี่ยงเบนจากการคำนวณความแปรปรวนและ σ นั้นวัดจากค่าเฉลี่ยเลขคณิต ซึ่งไม่ได้คำนวณในชุดข้อมูลรูปแบบเปิดและในชุดของการแจกแจงคุณลักษณะเชิงคุณภาพ ดังนั้น สำหรับคำอธิบายของการแจกแจงแบบบีบอัด จึงมีการใช้พารามิเตอร์กระจายอื่น - ปริมาณ(คำพ้องความหมาย - "เปอร์เซ็นไทล์") เหมาะสำหรับการอธิบายลักษณะเชิงคุณภาพและเชิงปริมาณในรูปแบบใด ๆ ของการกระจาย พารามิเตอร์นี้ยังสามารถใช้เพื่อแปลงคุณลักษณะเชิงปริมาณให้เป็นเชิงคุณภาพได้ ในกรณีนี้ การให้คะแนนดังกล่าวจะถูกกำหนดขึ้นอยู่กับลำดับของควอไทล์ที่ตัวเลือกเฉพาะนั้นสอดคล้องกับ

ในการปฏิบัติงานของการวิจัยทางชีวการแพทย์ มักใช้ควอไทล์ต่อไปนี้:

– ค่ามัธยฐาน;

, – ควอร์ไทล์ (ควอเตอร์) โดยที่ – ควอไทล์ต่ำกว่า ควอไทล์บน

Quantiles แบ่งพื้นที่ของการเปลี่ยนแปลงที่เป็นไปได้ในชุดรูปแบบต่างๆ ออกเป็นช่วงๆ ค่ามัธยฐาน (ควอนไทล์) เป็นตัวเลือกที่อยู่ตรงกลางของอนุกรมรูปแบบต่างๆ และแบ่งอนุกรมนี้ออกเป็นสองส่วนเท่าๆ กัน ( 0,5 และ 0,5 - ควอร์ไทล์แบ่งอนุกรมออกเป็นสี่ส่วน ส่วนแรก (ควอไทล์ล่าง) เป็นตัวเลือกที่แยกตัวเลือกที่มีค่าตัวเลขไม่เกิน 25% ของค่าสูงสุดที่เป็นไปได้ในซีรีส์ที่กำหนด ส่วนควอไทล์จะแยกตัวเลือกด้วยค่าตัวเลข มากถึง 50% ของสูงสุดที่เป็นไปได้ ควอร์ไทล์บน () แยกตัวเลือกได้ถึง 75% ของค่าสูงสุดที่เป็นไปได้

ในกรณีที่มีการกระจายตัวไม่สมมาตร ตัวแปรที่สัมพันธ์กับค่าเฉลี่ยเลขคณิต จะใช้ค่ามัธยฐานและควอร์ไทล์เพื่อระบุลักษณะเฉพาะในกรณีนี้ จะใช้รูปแบบการแสดงค่าเฉลี่ยต่อไปนี้ - เอิ่ม. (;). ตัวอย่างเช่นคุณลักษณะที่ศึกษา – “ช่วงเวลาที่เด็กเริ่มเดินอย่างอิสระ” – มีการกระจายแบบไม่สมมาตรในกลุ่มการศึกษา ในเวลาเดียวกันควอไทล์ล่าง () สอดคล้องกับจุดเริ่มต้นของการเดิน - 9.5 เดือน ค่ามัธยฐาน - 11 เดือน ควอไทล์บน () - 12 เดือน ดังนั้น ลักษณะของแนวโน้มเฉลี่ยของคุณลักษณะที่ระบุจะแสดงเป็น 11 (9.5; 12) เดือน

การประเมินนัยสำคัญทางสถิติของผลการศึกษา

นัยสำคัญทางสถิติของข้อมูลเป็นที่เข้าใจกันว่าเป็นระดับที่สอดคล้องกับความเป็นจริงที่แสดง เช่น ข้อมูลที่มีนัยสำคัญทางสถิติคือข้อมูลที่ไม่บิดเบือนและสะท้อนความเป็นจริงตามวัตถุประสงค์อย่างถูกต้อง

การประเมินนัยสำคัญทางสถิติของผลการวิจัยหมายถึงการพิจารณาความน่าจะเป็นที่เป็นไปได้ในการถ่ายโอนผลลัพธ์ที่ได้รับจากประชากรตัวอย่างไปยังประชากรทั้งหมด การประเมินนัยสำคัญทางสถิติเป็นสิ่งจำเป็นเพื่อให้เข้าใจว่าปรากฏการณ์หนึ่งๆ สามารถนำไปใช้ตัดสินปรากฏการณ์โดยรวมและรูปแบบของปรากฏการณ์ได้มากน้อยเพียงใด

การประเมินนัยสำคัญทางสถิติของผลการวิจัยประกอบด้วย

1. ข้อผิดพลาดของการเป็นตัวแทน (ข้อผิดพลาดของค่าเฉลี่ยและค่าสัมพัทธ์) - ;

2. ขีดจำกัดความเชื่อมั่นของค่าเฉลี่ยหรือค่าสัมพัทธ์

3. ความน่าเชื่อถือของความแตกต่างในค่าเฉลี่ยหรือค่าสัมพัทธ์ตามเกณฑ์ ที.

ความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิตหรือ ข้อผิดพลาดในการเป็นตัวแทนระบุลักษณะความผันผวนของค่าเฉลี่ย ควรสังเกตว่ายิ่งขนาดตัวอย่างใหญ่ขึ้น การแพร่กระจายของค่าเฉลี่ยก็จะยิ่งน้อยลงเท่านั้น ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยคำนวณโดยใช้สูตร:

ในวรรณคดีทางวิทยาศาสตร์สมัยใหม่ ค่าเฉลี่ยเลขคณิตเขียนพร้อมกับข้อผิดพลาดในการเป็นตัวแทน:

หรือร่วมกับส่วนเบี่ยงเบนมาตรฐาน:

ตัวอย่างเช่น พิจารณาข้อมูลเกี่ยวกับคลินิกในเมือง 1,500 แห่งในประเทศ (ประชากรทั่วไป) จำนวนผู้ป่วยที่ให้บริการในคลินิกโดยเฉลี่ยคือ 18,150 คน สุ่มเลือกสถานที่ 10% (150 คลินิก) ทำให้จำนวนผู้ป่วยเฉลี่ยเท่ากับ 20,051 คน ข้อผิดพลาดในการสุ่มตัวอย่างเห็นได้ชัดว่ามีคลินิกไม่ทั้งหมด 1,500 แห่งรวมอยู่ในกลุ่มตัวอย่าง ซึ่งเท่ากับความแตกต่างระหว่างค่าเฉลี่ยเหล่านี้ - ค่าเฉลี่ยทั่วไป ( ยีน) และค่าเฉลี่ยตัวอย่าง ( เลือก) หากเราสร้างตัวอย่างอื่นที่มีขนาดเท่ากันจากประชากรของเรา มันจะให้ค่าความผิดพลาดที่แตกต่างกัน ค่าเฉลี่ยตัวอย่างทั้งหมดนี้ซึ่งมีตัวอย่างขนาดใหญ่เพียงพอ จะถูกกระจายตามปกติรอบๆ ค่าเฉลี่ยทั่วไป โดยมีการทำซ้ำจำนวนมากเพียงพอของกลุ่มตัวอย่างที่มีจำนวนวัตถุเท่ากันจากประชากรทั่วไป ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย - นี่คือการแพร่กระจายของค่าเฉลี่ยตัวอย่างอย่างหลีกเลี่ยงไม่ได้รอบๆ ค่าเฉลี่ยทั่วไป

กรณีนำเสนอผลการวิจัยเป็นปริมาณสัมพัทธ์ (เช่น เปอร์เซ็นต์) - คำนวณแล้ว ข้อผิดพลาดมาตรฐานของเศษส่วน:

โดยที่ P คือตัวบ่งชี้ในหน่วย %, n คือจำนวนการสังเกต

ผลลัพธ์จะแสดงเป็น (พี ± ม.)% ตัวอย่างเช่น,เปอร์เซ็นต์การฟื้นตัวของผู้ป่วยคือ (95.2±2.5)%

ในกรณีที่จำนวนองค์ประกอบของประชากรแล้วเมื่อคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยและเศษส่วนในตัวส่วนของเศษส่วนแทนจะต้องใส่.

สำหรับการแจกแจงแบบปกติ (การกระจายตัวของค่าเฉลี่ยตัวอย่างเป็นเรื่องปกติ) เรารู้ว่าประชากรส่วนใดอยู่ในช่วงใดก็ได้รอบๆ ค่าเฉลี่ย โดยเฉพาะอย่างยิ่ง:

ในทางปฏิบัติ ปัญหาคือเราไม่ทราบลักษณะของประชากรทั่วไป และกลุ่มตัวอย่างถูกสร้างขึ้นมาอย่างแม่นยำเพื่อจุดประสงค์ในการประมาณค่าเหล่านั้น ซึ่งหมายความว่าถ้าเราสร้างตัวอย่างที่มีขนาดเท่ากัน nจากประชากรทั่วไป ดังนั้นในกรณี 68.3% ช่วงจะประกอบด้วยค่า (ใน 95.5% ของกรณีจะอยู่ในช่วงเวลา และใน 99.7% ของกรณี – จะอยู่ในช่วงเวลา)

เนื่องจากมีการใช้ตัวอย่างเพียงตัวอย่างเดียว คำสั่งนี้จึงถูกกำหนดขึ้นในแง่ของความน่าจะเป็น: ด้วยความน่าจะเป็น 68.3% ค่าเฉลี่ยของคุณลักษณะในประชากรจะอยู่ในช่วงเวลา โดยมีความน่าจะเป็น 95.5% - ในช่วงเวลา ฯลฯ

ในทางปฏิบัติ ช่วงเวลาจะถูกสร้างขึ้นรอบๆ ค่าตัวอย่าง โดยมีความน่าจะเป็นที่กำหนด (สูงเพียงพอ) ความน่าจะเป็นของความมั่นใจ –จะ "ครอบคลุม" ค่าที่แท้จริงของพารามิเตอร์นี้ในประชากรทั่วไป ช่วงเวลานี้เรียกว่า ช่วงความมั่นใจ.

ความน่าจะเป็นของความมั่นใจ นี่คือระดับความเชื่อมั่นว่าช่วงความเชื่อมั่นจะมีค่าจริง (ไม่ทราบ) ของพารามิเตอร์ในประชากร

เช่น ถ้าความน่าจะเป็นของความเชื่อมั่น คือ 90% ซึ่งหมายความว่า 90 ตัวอย่างจาก 100 ตัวอย่างจะให้ค่าประมาณพารามิเตอร์ในประชากรที่ถูกต้อง ดังนั้นความน่าจะเป็นของข้อผิดพลาดคือ การประมาณการที่ไม่ถูกต้องของค่าเฉลี่ยทั่วไปสำหรับตัวอย่างมีค่าเท่ากับเปอร์เซ็นต์: สำหรับตัวอย่างนี้ หมายความว่า 10 ตัวอย่างจาก 100 ตัวอย่างจะให้ค่าประมาณที่ไม่ถูกต้อง

แน่นอนว่า ระดับความเชื่อมั่น (ความน่าจะเป็นของความเชื่อมั่น) ขึ้นอยู่กับขนาดของช่วงเวลา ยิ่งช่วงกว้างเท่าใด ความเชื่อมั่นก็จะยิ่งสูงขึ้นเท่านั้นว่าค่าที่ไม่ทราบสำหรับประชากรจะตกอยู่ในนั้น ในทางปฏิบัติ มีการใช้ข้อผิดพลาดในการสุ่มตัวอย่างอย่างน้อยสองเท่าเพื่อสร้างช่วงความเชื่อมั่นเพื่อให้มีความมั่นใจอย่างน้อย 95.5%

การกำหนดขีดจำกัดความเชื่อมั่นของค่าเฉลี่ยและค่าสัมพัทธ์ช่วยให้เราค้นหาค่าสุดขั้วสองค่า - ค่าต่ำสุดที่เป็นไปได้และค่าสูงสุดที่เป็นไปได้ ซึ่งตัวบ่งชี้ที่ศึกษาสามารถเกิดขึ้นได้ในประชากรทั้งหมด บนพื้นฐานนี้ ขีดจำกัดความเชื่อมั่น (หรือช่วงความเชื่อมั่น)- สิ่งเหล่านี้คือขอบเขตของค่าเฉลี่ยหรือค่าสัมพัทธ์ ซึ่งเกินกว่านั้นเนื่องจากความผันผวนแบบสุ่มจึงมีความน่าจะเป็นที่ไม่มีนัยสำคัญ

ช่วงความเชื่อมั่นสามารถเขียนใหม่เป็น: , โดยที่ ที– เกณฑ์ความเชื่อมั่น

ขีดจำกัดความเชื่อมั่นของค่าเฉลี่ยเลขคณิตในประชากรถูกกำหนดโดยสูตร:

ยีน = ม เลือก + ที ม

สำหรับค่าสัมพัทธ์:

ยีน = ป เลือก + ที ม

ที่ไหน ยีนและ ยีน- ค่าเฉลี่ยและค่าสัมพัทธ์สำหรับประชากรทั่วไป เลือกและ เลือก- ค่าเฉลี่ยและค่าสัมพัทธ์ที่ได้จากประชากรตัวอย่าง และ - ข้อผิดพลาดของค่าเฉลี่ยและค่าสัมพัทธ์ ที- เกณฑ์ความเชื่อมั่น (เกณฑ์ความแม่นยำซึ่งกำหนดขึ้นเมื่อวางแผนการศึกษาและอาจเท่ากับ 2 หรือ 3) ที ม- นี่คือช่วงความเชื่อมั่นหรือ Δ - ข้อผิดพลาดสูงสุดของตัวบ่งชี้ที่ได้รับในการศึกษาตัวอย่าง

ควรสังเกตว่ามูลค่าของเกณฑ์ ทีในระดับหนึ่งที่เกี่ยวข้องกับความน่าจะเป็นของการพยากรณ์ที่ปราศจากข้อผิดพลาด (p) ซึ่งแสดงเป็น % ผู้วิจัยเลือกเองโดยคำนึงถึงความต้องการเพื่อให้ได้ผลลัพธ์ที่มีระดับความแม่นยำที่ต้องการ ดังนั้นเพื่อความน่าจะเป็นที่จะพยากรณ์โดยปราศจากข้อผิดพลาดที่ 95.5% ค่าของเกณฑ์ ทีคือ 2 สำหรับ 99.7% - 3

การประมาณช่วงความเชื่อมั่นที่กำหนดนั้นยอมรับได้สำหรับประชากรทางสถิติที่มีการสังเกตมากกว่า 30 ครั้งเท่านั้น ด้วยขนาดประชากรที่น้อยกว่า (ตัวอย่างขนาดเล็ก) จึงมีการใช้ตารางพิเศษเพื่อกำหนดเกณฑ์ t ในตารางเหล่านี้ ค่าที่ต้องการจะอยู่ที่จุดตัดของเส้นที่สอดคล้องกับขนาดของประชากร (n-1)และคอลัมน์ที่สอดคล้องกับระดับความน่าจะเป็นของการพยากรณ์ที่ปราศจากข้อผิดพลาด (95.5%; 99.7%) เลือกโดยผู้วิจัย ในการวิจัยทางการแพทย์ เมื่อสร้างขีดจำกัดความเชื่อมั่นสำหรับตัวบ่งชี้ใดๆ ความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาดคือ 95.5% ขึ้นไป ซึ่งหมายความว่าค่าตัวบ่งชี้ที่ได้จากประชากรตัวอย่างจะต้องพบในประชากรทั่วไปอย่างน้อย 95.5% ของกรณี

    คำถามในหัวข้อบทเรียน:

    ความเกี่ยวข้องของตัวชี้วัดความหลากหลายทางลักษณะในประชากรทางสถิติ

    ลักษณะทั่วไปของตัวชี้วัดความแปรผันสัมบูรณ์

    ส่วนเบี่ยงเบนมาตรฐาน การคำนวณ การประยุกต์

    การวัดสัมพัทธ์ของการแปรผัน

    ค่ามัธยฐานควอไทล์คะแนน

    การประเมินนัยสำคัญทางสถิติของผลการศึกษา

    ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิต สูตรคำนวณ ตัวอย่างการใช้งาน

    การคำนวณสัดส่วนและข้อผิดพลาดมาตรฐาน

    แนวคิดเรื่องความน่าจะเป็นของความเชื่อมั่น ตัวอย่างการใช้งาน

10. แนวคิดเรื่องช่วงความเชื่อมั่น และการนำไปใช้

    ทดสอบงานในหัวข้อด้วยคำตอบมาตรฐาน:

1. ตัวชี้วัดสัมบูรณ์ของการเปลี่ยนแปลงอ้างอิงถึง

1) ค่าสัมประสิทธิ์ของการแปรผัน

2) ค่าสัมประสิทธิ์การสั่น

4) ค่ามัธยฐาน

2. ตัวบ่งชี้ความสัมพันธ์ของการเปลี่ยนแปลงที่เกี่ยวข้อง

1) การกระจายตัว

4) ค่าสัมประสิทธิ์ของการแปรผัน

3. เกณฑ์ที่กำหนดโดยค่านิยมสูงสุดของตัวเลือกในชุดตัวเลือกต่างๆ

2) แอมพลิจูด

3) การกระจายตัว

4) ค่าสัมประสิทธิ์ของการแปรผัน

4. ความแตกต่างของตัวเลือกที่รุนแรงคือ

2) แอมพลิจูด

3) ส่วนเบี่ยงเบนมาตรฐาน

4) ค่าสัมประสิทธิ์ของการแปรผัน

5. ตารางเฉลี่ยของการเบี่ยงเบนของมูลค่าส่วนบุคคลของลักษณะจากค่าเฉลี่ยคือ

1) ค่าสัมประสิทธิ์การสั่น

2) ค่ามัธยฐาน

3) การกระจายตัว

6. อัตราส่วนของระดับความแปรปรวนต่อมูลค่าเฉลี่ยของตัวละครคือ

1) ค่าสัมประสิทธิ์ของการแปรผัน

2) ส่วนเบี่ยงเบนมาตรฐาน

4) ค่าสัมประสิทธิ์การสั่น

7. อัตราส่วนความเบี่ยงเบนของสี่เหลี่ยมจัตุรัสเฉลี่ยต่อมูลค่าเฉลี่ยของลักษณะเฉพาะคือ

1) การกระจายตัว

2) ค่าสัมประสิทธิ์ของการแปรผัน

3) ค่าสัมประสิทธิ์การสั่น

4) แอมพลิจูด

8. ตัวเลือกที่อยู่ตรงกลางของชุดความหลากหลายและแบ่งออกเป็นสองส่วนเท่า ๆ กันคือ

1) ค่ามัธยฐาน

3) แอมพลิจูด

9. ในการวิจัยทางการแพทย์ เมื่อมีการกำหนดขีดจำกัดความเชื่อมั่นสำหรับตัวบ่งชี้ใดๆ จะยอมรับความน่าจะเป็นของการทำนายที่ปราศจากข้อผิดพลาด

10. หากตัวอย่าง 90 ตัวอย่างจากทั้งหมด 100 ตัวอย่างให้ค่าประมาณที่ถูกต้องของพารามิเตอร์ในประชากร นั่นหมายความว่าความเชื่อมั่นน่าจะเป็น เท่ากัน

11. หาก 10 ตัวอย่างจาก 100 ตัวอย่างให้ค่าประมาณที่ไม่ถูกต้อง ความน่าจะเป็นของข้อผิดพลาดจะเท่ากัน

12. ขีดจำกัดของค่าเฉลี่ยหรือค่าสัมพัทธ์ ซึ่งไปไกลกว่าซึ่งเนื่องจากการแกว่งแบบสุ่มมีความน่าจะเป็นเล็กน้อย - นี่คือ

1) ช่วงความเชื่อมั่น

2) แอมพลิจูด

4) ค่าสัมประสิทธิ์ของการแปรผัน

13. ตัวอย่างเล็กๆ น้อยๆ ถือเป็นประชากรกลุ่มใด

1) n น้อยกว่าหรือเท่ากับ 100

2) n น้อยกว่าหรือเท่ากับ 30

3) n น้อยกว่าหรือเท่ากับ 40

4) n อยู่ใกล้กับ 0

14. สำหรับความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาด มูลค่าเกณฑ์ 95% ทีเป็น

15. สำหรับความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาด มูลค่าเกณฑ์ 99% ทีเป็น

16. สำหรับการกระจายตัวที่ใกล้เคียงกับปกติ ประชากรจะถูกพิจารณาว่าเป็นเนื้อเดียวกัน หากค่าสัมประสิทธิ์ของการแปรผันไม่เกิน

17. ตัวเลือก การแยกตัวเลือก ค่าตัวเลขซึ่งไม่เกิน 25% ของค่าสูงสุดที่เป็นไปได้ในซีรีส์ที่กำหนด - นี่คือ

2) ควอไทล์ล่าง

3) ควอไทล์บน

4) ควอไทล์

18. ข้อมูลที่ไม่บิดเบือนและสะท้อนความเป็นจริงของวัตถุประสงค์อย่างถูกต้องเรียกว่า

1) เป็นไปไม่ได้

2) เป็นไปได้อย่างเท่าเทียมกัน

3) เชื่อถือได้

4) สุ่ม

19. ตามกฎของ "สามซิกมา" โดยมีการกระจายลักษณะภายในตามปกติ
จะถูกตั้งอยู่

1) ตัวเลือก 68.3%

ในการคำนวณค่าเฉลี่ยเรขาคณิตอย่างง่าย จะใช้สูตร:

ถ่วงน้ำหนักทางเรขาคณิต

ในการหาค่าเฉลี่ยเรขาคณิตแบบถ่วงน้ำหนัก จะใช้สูตรดังนี้

เส้นผ่านศูนย์กลางเฉลี่ยของล้อ ท่อ และด้านเฉลี่ยของสี่เหลี่ยมจัตุรัสถูกกำหนดโดยใช้สี่เหลี่ยมจัตุรัสเฉลี่ย

ค่า Root-mean-square ใช้ในการคำนวณตัวบ่งชี้บางตัว เช่น ค่าสัมประสิทธิ์การแปรผัน ซึ่งเป็นตัวกำหนดลักษณะจังหวะของการผลิต ค่าเบี่ยงเบนมาตรฐานจากผลผลิตตามแผนในช่วงระยะเวลาหนึ่งถูกกำหนดโดยใช้สูตรต่อไปนี้:

ค่าเหล่านี้แสดงลักษณะการเปลี่ยนแปลงของตัวชี้วัดทางเศรษฐกิจได้อย่างแม่นยำเมื่อเปรียบเทียบกับมูลค่าฐานซึ่งถือเป็นค่าเฉลี่ย

สมการกำลังสองอย่างง่าย

กำลังสองเฉลี่ยรากคำนวณโดยใช้สูตร:

ถ่วงน้ำหนักแบบกำลังสอง

ค่าเฉลี่ยกำลังสองถ่วงน้ำหนักเท่ากับ:

22. ตัวชี้วัดสัมบูรณ์ของการเปลี่ยนแปลงได้แก่:

ช่วงของการเปลี่ยนแปลง

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย

การกระจายตัว

ส่วนเบี่ยงเบนมาตรฐาน

ช่วงของการเปลี่ยนแปลง (r)

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์

โดยจะแสดงขีดจำกัดภายในมูลค่าของการเปลี่ยนแปลงลักษณะเฉพาะในประชากรที่กำลังศึกษา

ประสบการณ์การทำงานของผู้สมัครทั้งห้าคนในงานก่อนหน้าคือ: 2,3,4,7 และ 9 ปี วิธีแก้ไข: พิสัยของการเปลี่ยนแปลง = 9 - 2 = 7 ปี

สำหรับคำอธิบายทั่วไปเกี่ยวกับความแตกต่างในค่าคุณลักษณะ ตัวบ่งชี้การเปลี่ยนแปลงโดยเฉลี่ยจะคำนวณโดยคำนึงถึงความเบี่ยงเบนจากค่าเฉลี่ยเลขคณิต ความแตกต่างถือเป็นส่วนเบี่ยงเบนจากค่าเฉลี่ย

ในกรณีนี้ เพื่อหลีกเลี่ยงผลรวมของการเบี่ยงเบนของลักษณะเฉพาะจากค่าเฉลี่ยที่เปลี่ยนเป็นศูนย์ (คุณสมบัติของค่าเฉลี่ยเป็นศูนย์) เราจะต้องเพิกเฉยต่อสัญญาณของการเบี่ยงเบน นั่นคือ ใช้ผลรวมโมดูโลนี้ หรือ ยกกำลังสองค่าเบี่ยงเบน

ค่าเบี่ยงเบนเชิงเส้นและกำลังสองเฉลี่ย

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยคือค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนสัมบูรณ์ของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ย

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยนั้นง่าย:

ประสบการณ์การทำงานของผู้สมัครทั้งห้าคนในงานก่อนหน้าคือ: 2,3,4,7 และ 9 ปี

ในตัวอย่างของเรา: ปี;

คำตอบ: 2.4 ปี

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยถ่วงน้ำหนักใช้กับข้อมูลที่จัดกลุ่ม:

เนื่องจากแบบแผน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจึงถูกนำมาใช้ในทางปฏิบัติค่อนข้างน้อย (โดยเฉพาะอย่างยิ่งเพื่อระบุลักษณะการปฏิบัติตามภาระผูกพันตามสัญญาเกี่ยวกับความสม่ำเสมอของการส่งมอบในการวิเคราะห์คุณภาพผลิตภัณฑ์โดยคำนึงถึงคุณสมบัติทางเทคโนโลยีของการผลิต)

ส่วนเบี่ยงเบนมาตรฐาน

คุณลักษณะที่สมบูรณ์แบบที่สุดของการเปลี่ยนแปลงคือค่าเบี่ยงเบนกำลังสองเฉลี่ย ซึ่งเรียกว่าค่ามาตรฐาน (หรือค่าเบี่ยงเบนมาตรฐาน) ส่วนเบี่ยงเบนมาตรฐาน() เท่ากับรากที่สองของค่าเบี่ยงเบนกำลังสองเฉลี่ยของแต่ละค่าของลักษณะค่าเฉลี่ยเลขคณิต:

ค่าเบี่ยงเบนมาตรฐานนั้นง่าย:

ค่าเบี่ยงเบนมาตรฐานแบบถ่วงน้ำหนักใช้กับข้อมูลที่จัดกลุ่ม:

ระหว่างค่ารากกำลังสองและการเบี่ยงเบนเชิงเส้นเฉลี่ยภายใต้เงื่อนไขการแจกแจงแบบปกติ อัตราส่วนต่อไปนี้จะเกิดขึ้น: ~ 1.25

ค่าเบี่ยงเบนมาตรฐานซึ่งเป็นการวัดความแปรผันหลักสัมบูรณ์ใช้ในการกำหนดค่าพิกัดของเส้นโค้งการกระจายปกติในการคำนวณที่เกี่ยวข้องกับการจัดองค์กรของการสังเกตตัวอย่างและการสร้างความแม่นยำของคุณลักษณะตัวอย่างตลอดจนในการประเมิน ขีดจำกัดของการแปรผันของคุณลักษณะในประชากรเนื้อเดียวกัน

นักคณิตศาสตร์และนักสถิติที่ชาญฉลาดได้คิดค้นตัวบ่งชี้ที่น่าเชื่อถือมากขึ้น แม้ว่าจะมีจุดประสงค์ที่แตกต่างกันเล็กน้อยก็ตาม ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย- ตัวบ่งชี้นี้แสดงลักษณะการวัดการกระจายตัวของค่าของชุดข้อมูลรอบค่าเฉลี่ย

ในการแสดงการวัดการกระจายของข้อมูล คุณต้องตัดสินใจก่อนว่าจะคำนวณการกระจายนี้ว่าใด ซึ่งโดยปกติจะเป็นค่าเฉลี่ย ถัดไปคุณต้องคำนวณว่าค่าของชุดข้อมูลที่วิเคราะห์นั้นอยู่ห่างจากค่าเฉลี่ยมากน้อยเพียงใด เห็นได้ชัดว่าแต่ละค่าสอดคล้องกับค่าเบี่ยงเบนที่แน่นอน แต่เราสนใจในการประเมินโดยรวมซึ่งครอบคลุมประชากรทั้งหมด ดังนั้นค่าเบี่ยงเบนเฉลี่ยจึงคำนวณโดยใช้สูตรค่าเฉลี่ยเลขคณิตปกติ แต่! แต่เพื่อที่จะคำนวณค่าเฉลี่ยของการเบี่ยงเบนนั้น จะต้องบวกเข้าด้วยกันก่อน และถ้าเราบวกจำนวนบวกและลบ พวกมันจะหักล้างกัน และผลรวมของพวกมันจะมีแนวโน้มเป็นศูนย์ เพื่อหลีกเลี่ยงปัญหานี้ การเบี่ยงเบนทั้งหมดจะถูกนำมาใช้แบบโมดูโล กล่าวคือ จำนวนลบทั้งหมดจะกลายเป็นบวก ตอนนี้ค่าเบี่ยงเบนเฉลี่ยจะแสดงการวัดโดยทั่วไปของการแพร่กระจายของค่า เป็นผลให้ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจะถูกคำนวณโดยใช้สูตร:

– ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย

x– ตัวบ่งชี้ที่วิเคราะห์ โดยมีขีดด้านบน – ค่าเฉลี่ยของตัวบ่งชี้

n– จำนวนค่าในชุดข้อมูลที่วิเคราะห์

ฉันหวังว่าตัวดำเนินการรวมจะไม่ทำให้ใครกลัว

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยที่คำนวณโดยใช้สูตรที่ระบุสะท้อนถึงค่าเบี่ยงเบนสัมบูรณ์โดยเฉลี่ยจากค่าเฉลี่ยสำหรับประชากรที่กำหนด

ในภาพเส้นสีแดงคือค่าเฉลี่ย การเบี่ยงเบนของการสังเกตแต่ละครั้งจากค่าเฉลี่ยจะแสดงด้วยลูกศรเล็กๆ เป็นแบบโมดูโลและสรุปผล จากนั้นทุกอย่างจะถูกหารด้วยจำนวนค่า

เพื่อให้ภาพสมบูรณ์ เราต้องยกตัวอย่าง สมมติว่ามีบริษัทหนึ่งที่ผลิตเครื่องตัดพลั่ว การตัดแต่ละครั้งควรมีความยาว 1.5 เมตร แต่ที่สำคัญกว่านั้นคือทั้งหมดควรเท่ากันหรืออย่างน้อยบวกหรือลบ 5 ซม. อย่างไรก็ตาม คนงานที่ไม่ระมัดระวังจะตัดออก 1.2 ม. หรือ 1.8 ม. ผู้อยู่อาศัยในช่วงฤดูร้อนจะไม่มีความสุข ผู้อำนวยการของบริษัทตัดสินใจทำการวิเคราะห์ทางสถิติเกี่ยวกับความยาวของการตัด ฉันเลือกชิ้นส่วน 10 ชิ้นแล้ววัดความยาว หาค่าเฉลี่ย และคำนวณค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย ค่าเฉลี่ยกลายเป็นเพียงสิ่งที่จำเป็น - 1.5 ม. แต่ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยคือ 0.16 ม. ปรากฎว่าการตัดแต่ละครั้งยาวหรือสั้นกว่าที่ต้องการโดยเฉลี่ย 16 ซม. มีบางอย่างที่จะพูดคุยเกี่ยวกับ คนงาน อันที่จริง ฉันไม่เคยเห็นการใช้ตัวบ่งชี้นี้จริง ๆ เลย ดังนั้นฉันจึงคิดตัวอย่างขึ้นมาเอง อย่างไรก็ตาม มีตัวบ่งชี้ดังกล่าวในสถิติ

การกระจายตัว

เช่นเดียวกับค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย ความแปรปรวนยังสะท้อนถึงขอบเขตของการแพร่กระจายของข้อมูลรอบๆ ค่าเฉลี่ยอีกด้วย

สูตรการคำนวณความแปรปรวนมีลักษณะดังนี้:

(สำหรับอนุกรมรูปแบบ (ผลต่างถ่วงน้ำหนัก))

(สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม (ความแปรปรวนอย่างง่าย))

โดยที่: σ 2 – การกระจายตัว สี– เราวิเคราะห์ตัวบ่งชี้ sq (ค่าสัญญาณ), – ค่าเฉลี่ยของตัวบ่งชี้, f i – จำนวนค่าในชุดข้อมูลที่วิเคราะห์

การกระจายตัวคือกำลังสองเฉลี่ยของการเบี่ยงเบน

ขั้นแรกให้คำนวณค่าเฉลี่ย จากนั้นนำความแตกต่างระหว่างค่าดั้งเดิมและค่าเฉลี่ยแต่ละค่า ยกกำลังสอง คูณด้วยความถี่ของค่าแอตทริบิวต์ที่เกี่ยวข้อง เพิ่มแล้วหารด้วยจำนวนค่าในประชากร

อย่างไรก็ตาม ในรูปแบบบริสุทธิ์ เช่น ค่าเฉลี่ยเลขคณิตหรือดัชนี จะไม่มีการใช้การกระจายตัว ค่อนข้างเป็นตัวบ่งชี้เสริมและระดับกลางที่ใช้สำหรับการวิเคราะห์ทางสถิติประเภทอื่นๆ

วิธีง่ายๆ ในการคำนวณความแปรปรวน

ส่วนเบี่ยงเบนมาตรฐาน

หากต้องการใช้ความแปรปรวนในการวิเคราะห์ข้อมูล จะต้องหารากที่สองของความแปรปรวน ปรากฎสิ่งที่เรียกว่า ส่วนเบี่ยงเบนมาตรฐาน.

อย่างไรก็ตาม ค่าเบี่ยงเบนมาตรฐานเรียกอีกอย่างว่าซิกมา - จากอักษรกรีกที่แสดงถึงค่าดังกล่าว

แน่นอนว่าค่าเบี่ยงเบนมาตรฐานยังเป็นตัวกำหนดลักษณะการวัดการกระจายตัวของข้อมูล แต่ตอนนี้ (ไม่เหมือนกับความแปรปรวน) สามารถนำมาเปรียบเทียบกับข้อมูลต้นฉบับได้ ตามกฎแล้ว การวัดรากกำลังสองในสถิติจะให้ผลลัพธ์ที่แม่นยำมากกว่าการวัดเชิงเส้น ดังนั้น ค่าเบี่ยงเบนมาตรฐานจึงเป็นการวัดการกระจายตัวของข้อมูลที่แม่นยำมากกว่าค่าเบี่ยงเบนเฉลี่ยเชิงเส้น

ค่าเบี่ยงเบนมาตรฐานเป็นตัวบ่งชี้คลาสสิกของความแปรปรวนจากสถิติเชิงพรรณนา

ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง (อังกฤษ ส่วนเบี่ยงเบนมาตรฐาน, STD, STDev) - ตัวบ่งชี้การกระจายตัวทั่วไปในสถิติเชิงพรรณนา แต่เพราะว่า การวิเคราะห์ทางเทคนิคนั้นคล้ายคลึงกับสถิติ ตัวบ่งชี้นี้สามารถ (และควร) ใช้ในการวิเคราะห์ทางเทคนิคเพื่อตรวจจับระดับการกระจายตัวของราคาของเครื่องมือที่วิเคราะห์เมื่อเวลาผ่านไป แสดงด้วยสัญลักษณ์กรีกซิกมา "σ"

ขอขอบคุณ Carl Gauss และ Pearson ที่ให้เราใช้ค่าเบี่ยงเบนมาตรฐาน

โดยใช้ ส่วนเบี่ยงเบนมาตรฐานในการวิเคราะห์ทางเทคนิคเราหมุนสิ่งนี้ "ดัชนีการกระจายตัว""วี “ตัวชี้วัดความผันผวน“คงความหมายแต่เปลี่ยนเงื่อนไข

ค่าเบี่ยงเบนมาตรฐานคืออะไร

แต่นอกเหนือจากการคำนวณเสริมระดับกลางแล้ว ค่าเบี่ยงเบนมาตรฐานค่อนข้างยอมรับได้สำหรับการคำนวณแบบอิสระและการประยุกต์ในการวิเคราะห์ทางเทคนิค ในฐานะผู้อ่านนิตยสารหญ้าเจ้าชู้ของเรากล่าวว่า “ ฉันยังไม่เข้าใจว่าเหตุใดค่าเบี่ยงเบนมาตรฐานจึงไม่รวมอยู่ในชุดตัวบ่งชี้มาตรฐานของศูนย์ซื้อขายในประเทศ«.

จริงหรือ, ค่าเบี่ยงเบนมาตรฐานสามารถวัดความแปรปรวนของเครื่องมือด้วยวิธีคลาสสิกและ "บริสุทธิ์"- แต่น่าเสียดายที่ตัวบ่งชี้นี้ไม่ได้พบเห็นได้ทั่วไปในการวิเคราะห์หลักทรัพย์

การใช้ค่าเบี่ยงเบนมาตรฐาน

การคำนวณค่าเบี่ยงเบนมาตรฐานด้วยตนเองนั้นไม่น่าสนใจนักแต่มีประโยชน์สำหรับประสบการณ์ ค่าเบี่ยงเบนมาตรฐานสามารถแสดงได้สูตร STD=√[(∑(x-x ) 2)/n] ซึ่งฟังดูเหมือนรากของผลรวมของผลต่างกำลังสองระหว่างองค์ประกอบของตัวอย่างและค่าเฉลี่ย หารด้วยจำนวนองค์ประกอบในตัวอย่าง

หากจำนวนองค์ประกอบในกลุ่มตัวอย่างเกิน 30 ตัวส่วนของเศษส่วนที่อยู่ใต้รากจะใช้ค่า n-1 มิฉะนั้นจะใช้ n

ทีละขั้นตอน การคำนวณค่าเบี่ยงเบนมาตรฐาน:

  1. คำนวณค่าเฉลี่ยเลขคณิตของตัวอย่างข้อมูล
  2. ลบค่าเฉลี่ยนี้ออกจากแต่ละองค์ประกอบตัวอย่าง
  3. เรายกกำลังสองผลต่างผลลัพธ์ทั้งหมด
  4. รวมผลกำลังสองทั้งหมด
  5. หารจำนวนผลลัพธ์ด้วยจำนวนองค์ประกอบในกลุ่มตัวอย่าง (หรือด้วย n-1 ถ้า n>30)
  6. คำนวณรากที่สองของผลหารผลลัพธ์ (เรียกว่า การกระจายตัว)