ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

สูตรความแปรปรวนทางคณิตศาสตร์ ความแปรปรวนของตัวแปรสุ่มแบบไม่ต่อเนื่อง

มาคำนวณกันนางสาวเอ็กเซลความแปรปรวนตัวอย่างและส่วนเบี่ยงเบนมาตรฐาน เราจะคำนวณความแปรปรวนของตัวแปรสุ่มด้วยหากทราบการกระจายตัวของมัน

เรามาพิจารณากันก่อน การกระจายตัว, แล้ว ส่วนเบี่ยงเบนมาตรฐาน.

ความแปรปรวนตัวอย่าง

ความแปรปรวนตัวอย่าง (ความแปรปรวนตัวอย่างตัวอย่างความแปรปรวน) แสดงลักษณะการแพร่กระจายของค่าในอาร์เรย์ที่สัมพันธ์กับ

ทั้ง 3 สูตรมีความเท่าเทียมกันทางคณิตศาสตร์

จากสูตรแรกชัดเจนว่า ความแปรปรวนตัวอย่างคือผลรวมของการเบี่ยงเบนกำลังสองของแต่ละค่าในอาร์เรย์ จากค่าเฉลี่ยหารด้วยขนาดตัวอย่างลบ 1

ความแตกต่าง ตัวอย่างใช้ฟังก์ชัน DISP() เป็นภาษาอังกฤษ ชื่อ VAR เช่น ความแปรปรวน จากเวอร์ชัน MS EXCEL 2010 ขอแนะนำให้ใช้อนาล็อก DISP.V() ภาษาอังกฤษ ชื่อ VARS เช่น ค่าความแปรปรวนตัวอย่าง นอกจากนี้ตั้งแต่เวอร์ชัน MS EXCEL 2010 จะมีฟังก์ชัน DISP.Г() ภาษาอังกฤษ ชื่อ VARP เช่น VARIance ของประชากร ซึ่งคำนวณ การกระจายตัวสำหรับ ประชากร- ความแตกต่างทั้งหมดอยู่ที่ตัวส่วน: แทนที่จะเป็น n-1 เช่น DISP.V() DISP.G() มีเพียง n ในตัวส่วน ก่อน MS EXCEL 2010 ฟังก์ชัน VAR() ถูกใช้เพื่อคำนวณความแปรปรวนของประชากร

ความแปรปรวนตัวอย่าง
=QUADROTCL(ตัวอย่าง)/(COUNT(ตัวอย่าง)-1)
=(SUM(ตัวอย่าง)-COUNT(ตัวอย่าง)*เฉลี่ย(ตัวอย่าง)^2)/ (COUNT(ตัวอย่าง)-1)– สูตรปกติ
=SUM((ตัวอย่าง -เฉลี่ย(ตัวอย่าง))^2)/ (COUNT(ตัวอย่าง)-1) –

ความแปรปรวนตัวอย่างเท่ากับ 0 เฉพาะในกรณีที่ค่าทั้งหมดเท่ากันและเท่ากัน ค่าเฉลี่ย- โดยปกติแล้วยิ่งค่ามากขึ้น ความแตกต่างยิ่งการกระจายค่าในอาเรย์มากขึ้นเท่านั้น

ความแปรปรวนตัวอย่างเป็นการประมาณแบบจุด ความแตกต่างการกระจายตัวของตัวแปรสุ่มที่ใช้สร้างมันขึ้นมา ตัวอย่าง- เกี่ยวกับการก่อสร้าง ช่วงความมั่นใจเมื่อทำการประเมิน ความแตกต่างสามารถอ่านได้ในบทความ

ความแปรปรวนของตัวแปรสุ่ม

เพื่อคำนวณ การกระจายตัวตัวแปรสุ่ม คุณต้องรู้มัน

สำหรับ ความแตกต่างตัวแปรสุ่ม X มักเขียนแทนด้วย Var(X) การกระจายตัวเท่ากับกำลังสองของการเบี่ยงเบนจากค่าเฉลี่ย E(X): Var(X)=E[(X-E(X)) 2 ]

การกระจายตัวคำนวณโดยสูตร:

โดยที่ x i คือค่าที่ตัวแปรสุ่มสามารถรับได้ และ μ คือค่าเฉลี่ย () p(x) คือความน่าจะเป็นที่ตัวแปรสุ่มจะใช้ค่า x

ถ้าตัวแปรสุ่มมี แล้ว การกระจายตัวคำนวณโดยสูตร:

มิติ ความแตกต่างสอดคล้องกับกำลังสองของหน่วยการวัดค่าเดิม ตัวอย่างเช่น หากค่าในตัวอย่างแสดงถึงการวัดน้ำหนักชิ้นส่วน (เป็นกิโลกรัม) มิติความแปรปรวนก็จะเป็น กิโลกรัม 2 ซึ่งอาจตีความได้ยาก ดังนั้น เพื่อระบุลักษณะการแพร่กระจายของค่า ซึ่งเป็นค่าที่เท่ากับรากที่สองของ ความแตกต่างส่วนเบี่ยงเบนมาตรฐาน.

คุณสมบัติบางอย่าง ความแตกต่าง:

Var(X+a)=Var(X) โดยที่ X เป็นตัวแปรสุ่ม และ a เป็นค่าคงที่

วาร์(a Raj)=a 2 วาร์(X)

วาร์(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*อี(X)*อี(X)+(อี(X)) 2 =อี(X 2)-(อี(X)) 2

คุณสมบัติการกระจายตัวนี้ถูกใช้ใน บทความเกี่ยวกับการถดถอยเชิงเส้น.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y) โดยที่ X และ Y เป็นตัวแปรสุ่ม Cov(X;Y) คือความแปรปรวนร่วมของตัวแปรสุ่มเหล่านี้

หากตัวแปรสุ่มมีความเป็นอิสระก็จะเป็นเช่นนั้น ความแปรปรวนร่วมเท่ากับ 0 ดังนั้น Var(X+Y)=Var(X)+Var(Y) คุณสมบัติของการกระจายนี้ใช้ในการหามา

ให้เราแสดงว่าสำหรับปริมาณอิสระ Var(X-Y)=Var(X+Y) แท้จริงแล้ว Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 วาร์(Y)= วาร์(X)+วาร์(Y)= วาร์(X+Y) คุณสมบัติการกระจายนี้ใช้ในการสร้าง

ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

ตัวอย่างค่าเบี่ยงเบนมาตรฐานคือการวัดว่าค่าต่างๆ ในกลุ่มตัวอย่างมีการกระจายอย่างกว้างขวางเพียงใดโดยสัมพันธ์กับค่าเหล่านั้น

ตามคำนิยาม ส่วนเบี่ยงเบนมาตรฐานเท่ากับรากที่สองของ ความแตกต่าง:

ส่วนเบี่ยงเบนมาตรฐานไม่ได้คำนึงถึงขนาดของค่าใน ตัวอย่างแต่มีเพียงระดับการกระจายตัวของค่านิยมรอบตัวเท่านั้น เฉลี่ย- เพื่ออธิบายสิ่งนี้ เรามายกตัวอย่างกัน

ลองคำนวณค่าเบี่ยงเบนมาตรฐานสำหรับ 2 ตัวอย่าง: (1; 5; 9) และ (1001; 1005; 1009) ในทั้งสองกรณี s=4 เห็นได้ชัดว่าอัตราส่วนของส่วนเบี่ยงเบนมาตรฐานต่อค่าอาร์เรย์แตกต่างกันอย่างมีนัยสำคัญระหว่างตัวอย่าง ในกรณีเช่นนี้จะใช้ ค่าสัมประสิทธิ์ของการแปรผัน(สัมประสิทธิ์การเปลี่ยนแปลง, CV) - อัตราส่วน ส่วนเบี่ยงเบนมาตรฐานถึงค่าเฉลี่ย เลขคณิตแสดงเป็นเปอร์เซ็นต์

ใน MS EXCEL 2007 และเวอร์ชันก่อนหน้าสำหรับการคำนวณ ตัวอย่างค่าเบี่ยงเบนมาตรฐานใช้ฟังก์ชัน =STDEVAL() เป็นภาษาอังกฤษ ชื่อ STDEV เช่น ส่วนเบี่ยงเบนมาตรฐาน จากเวอร์ชันของ MS EXCEL 2010 ขอแนะนำให้ใช้อะนาล็อก =STDEV.B() , อังกฤษ ชื่อ STDEV.S เช่น ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

นอกจากนี้ตั้งแต่เวอร์ชัน MS EXCEL 2010 จะมีฟังก์ชัน STANDARDEV.G() ภาษาอังกฤษ ชื่อ STDEV.P เช่น ค่าเบี่ยงเบนมาตรฐานประชากรซึ่งคำนวณ ส่วนเบี่ยงเบนมาตรฐานสำหรับ ประชากร- ความแตกต่างทั้งหมดอยู่ที่ตัวส่วน แทนที่จะเป็น n-1 ดังใน STANDARDEV.V() STANDARDEVAL.G() มีเพียง n ในตัวส่วน

ส่วนเบี่ยงเบนมาตรฐานสามารถคำนวณได้โดยตรงโดยใช้สูตรด้านล่าง (ดูไฟล์ตัวอย่าง)
=ROOT(QUADROTCL(ตัวอย่าง)/(COUNT(ตัวอย่าง)-1))
=ROOT((SUM(ตัวอย่าง)-COUNT(ตัวอย่าง)*เฉลี่ย(ตัวอย่าง)^2)/(COUNT(ตัวอย่าง)-1))

มาตรการกระจายอื่น ๆ

ฟังก์ชัน SQUADROTCL() คำนวณด้วย ผลรวมของการเบี่ยงเบนค่ากำลังสองจากค่าของพวกเขา เฉลี่ย- ฟังก์ชันนี้จะส่งกลับผลลัพธ์เดียวกันกับสูตร =DISP.G( ตัวอย่าง)*ตรวจสอบ( ตัวอย่าง) , ที่ไหน ตัวอย่าง- การอ้างอิงถึงช่วงที่มีอาร์เรย์ของค่าตัวอย่าง () การคำนวณในฟังก์ชัน QUADROCL() ทำตามสูตร:

ฟังก์ชัน SROTCL() ยังเป็นการวัดการแพร่กระจายของชุดข้อมูลอีกด้วย ฟังก์ชัน SROTCL() คำนวณค่าเฉลี่ยของค่าสัมบูรณ์ของการเบี่ยงเบนของค่าจาก เฉลี่ย- ฟังก์ชันนี้จะส่งกลับผลลัพธ์เดียวกันกับสูตร =SUMPRODUCT(ABS(ตัวอย่าง-ค่าเฉลี่ย(ตัวอย่าง)))/COUNT(ตัวอย่าง), ที่ไหน ตัวอย่าง- ลิงก์ไปยังช่วงที่มีอาร์เรย์ของค่าตัวอย่าง

การคำนวณในฟังก์ชัน SROTCL () ทำตามสูตร:

ช่วงการเปลี่ยนแปลง (หรือช่วงของการเปลี่ยนแปลง) -นี่คือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของคุณลักษณะ:

ในตัวอย่างของเรา ช่วงของการเปลี่ยนแปลงในผลลัพธ์กะของคนงานคือ: ในกลุ่มแรก R = 105-95 = เด็ก 10 คน ในกลุ่มที่สอง R = 125-75 = 50 คน (มากกว่า 5 เท่า) นี่แสดงให้เห็นว่าเอาต์พุตของกลุ่มที่ 1 นั้น "มีเสถียรภาพ" มากกว่า แต่กองพลที่สองมีปริมาณสำรองมากกว่าสำหรับการเพิ่มผลผลิตเพราะ หากคนงานทั้งหมดบรรลุผลผลิตสูงสุดสำหรับกองพลนี้ ก็สามารถผลิตได้ 3 * 125 = 375 ส่วน และในกลุ่มที่ 1 เพียง 105 * 3 = 315 ส่วน
หากค่าสุดขีดของคุณลักษณะไม่ปกติสำหรับประชากร จะใช้ช่วงควอไทล์หรือเดไซล์ ช่วงเดไซล์แรก RQ= Q3-Q1 ครอบคลุม 50% ของปริมาตรประชากร ช่วงเดไซล์แรก RD1 = D9-D1 ครอบคลุม 80% ของข้อมูล ช่วงเดไซล์ที่สอง RD2= D8-D2 – 60%
ข้อเสียของตัวบ่งชี้ช่วงความแปรผันคือค่าของตัวบ่งชี้ไม่ได้สะท้อนถึงความผันผวนของลักษณะทั้งหมด
ตัวบ่งชี้ทั่วไปที่ง่ายที่สุดที่สะท้อนถึงความผันผวนของคุณลักษณะทั้งหมดคือ ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยซึ่งเป็นค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนสัมบูรณ์ของแต่ละตัวเลือกจากค่าเฉลี่ย:

,
สำหรับข้อมูลที่จัดกลุ่ม
,
โดยที่ xi คือค่าของแอ็ตทริบิวต์ในชุดข้อมูลที่ไม่ต่อเนื่องหรือค่ากึ่งกลางของช่วงเวลาในการแจกแจงช่วง
ในสูตรข้างต้น ความแตกต่างในตัวเศษจะถูกใช้แบบโมดูโล มิฉะนั้น ตามคุณสมบัติของค่าเฉลี่ยเลขคณิต ตัวเศษจะเท่ากับศูนย์เสมอ ดังนั้นค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจึงไม่ค่อยถูกนำมาใช้ในการปฏิบัติทางสถิติ เฉพาะในกรณีที่การรวมตัวบ่งชี้โดยไม่คำนึงถึงเครื่องหมายจะสมเหตุสมผลทางเศรษฐกิจ ด้วยความช่วยเหลือ เช่น วิเคราะห์องค์ประกอบของกำลังคน การทำกำไรของการผลิต และการหมุนเวียนการค้าต่างประเทศ
ความแปรปรวนของลักษณะคือกำลังสองเฉลี่ยของการเบี่ยงเบนจากค่าเฉลี่ย:
ความแปรปรวนง่าย
,
ถ่วงน้ำหนักความแปรปรวน
.
สูตรการคำนวณความแปรปรวนสามารถทำให้ง่ายขึ้น:

ดังนั้น ความแปรปรวนจึงเท่ากับความแตกต่างระหว่างค่าเฉลี่ยของกำลังสองของตัวเลือกและกำลังสองของค่าเฉลี่ยของตัวเลือกของประชากร:
.
อย่างไรก็ตาม เนื่องจากผลรวมของการเบี่ยงเบนกำลังสอง ความแปรปรวนทำให้ความคิดที่บิดเบี้ยวเกี่ยวกับการเบี่ยงเบน ดังนั้นค่าเฉลี่ยจึงถูกคำนวณตามค่านั้น ส่วนเบี่ยงเบนมาตรฐานซึ่งแสดงให้เห็นว่าลักษณะเฉพาะที่แตกต่างกันโดยเฉลี่ยนั้นเบี่ยงเบนไปจากค่าเฉลี่ยมากน้อยเพียงใด คำนวณโดยการหารากที่สองของความแปรปรวน:
สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม
,
สำหรับซีรีย์รูปแบบต่างๆ

ยิ่งค่าความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานมีค่าน้อยลง ประชากรก็จะมีความเป็นเนื้อเดียวกันมากขึ้น ค่าเฉลี่ย (ทั่วไป) ก็จะยิ่งเชื่อถือได้มากขึ้นเท่านั้น
ค่าเบี่ยงเบนเชิงเส้นและค่ามาตรฐานเฉลี่ยเป็นตัวเลขที่มีชื่อ เช่น แสดงในหน่วยการวัดคุณลักษณะ มีเนื้อหาเหมือนกัน และมีความหมายใกล้เคียงกัน
ขอแนะนำให้คำนวณรูปแบบสัมบูรณ์โดยใช้ตาราง
ตารางที่ 3 - การคำนวณลักษณะการเปลี่ยนแปลง (โดยใช้ตัวอย่างระยะเวลาข้อมูลเกี่ยวกับผลลัพธ์กะของพนักงานลูกเรือ)


จำนวนคนงาน

ตรงกลางของช่วงเวลา

ค่าที่คำนวณได้

ทั้งหมด:

ผลผลิตกะเฉลี่ยของคนงาน:

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย:

ผลต่างการผลิต:

ค่าเบี่ยงเบนมาตรฐานของผลผลิตของคนงานแต่ละคนจากผลผลิตเฉลี่ย:
.

1 การคำนวณการกระจายตัวโดยใช้วิธีโมเมนต์

การคำนวณความแปรปรวนเกี่ยวข้องกับการคำนวณที่ยุ่งยาก (โดยเฉพาะถ้าค่าเฉลี่ยแสดงเป็นตัวเลขจำนวนมากและมีทศนิยมหลายตำแหน่ง) การคำนวณสามารถทำให้ง่ายขึ้นได้โดยใช้สูตรที่เรียบง่ายและคุณสมบัติการกระจายตัว
การกระจายตัวมีคุณสมบัติดังต่อไปนี้:

  1. หากค่าทั้งหมดของคุณลักษณะลดลงหรือเพิ่มขึ้นด้วยค่า A เดียวกัน การกระจายตัวจะไม่ลดลง:

,

แล้วหรือ
การใช้คุณสมบัติของการกระจายและลดตัวแปรทั้งหมดของประชากรด้วยค่า A จากนั้นหารด้วยค่าของช่วงเวลา h เราจะได้สูตรสำหรับการคำนวณการกระจายตัวในชุดรูปแบบที่มีช่วงเวลาที่เท่ากัน ช่วงเวลา:
,
การกระจายตัวคำนวณโดยวิธีโมเมนต์โดยที่
h คือค่าของช่วงเวลาของอนุกรมการแปรผัน
– ตัวเลือกค่าใหม่ (เปลี่ยนแล้ว)
A คือค่าคงที่ซึ่งใช้เป็นจุดกึ่งกลางของช่วงความถี่สูงสุด หรือตัวเลือกที่มีความถี่สูงสุด
– กำลังสองของช่วงเวลาลำดับแรก
– ช่วงเวลาของลำดับที่สอง
ให้เราคำนวณการกระจายตัวโดยใช้วิธีการของโมเมนต์โดยอิงจากข้อมูลกะเอาท์พุตของผู้ปฏิบัติงานในทีม
ตารางที่ 4 - การคำนวณความแปรปรวนโดยใช้วิธีช่วงเวลา


กลุ่มคนงานฝ่ายผลิต ชิ้น

จำนวนคนงาน

ตรงกลางของช่วงเวลา

ค่าที่คำนวณได้

ขั้นตอนการคำนวณ:


  1. เราคำนวณความแปรปรวน:

2 การคำนวณความแปรปรวนของคุณลักษณะทางเลือก

ในบรรดาลักษณะที่ศึกษาโดยสถิติ ยังมีลักษณะที่มีความหมายที่ไม่เกิดร่วมกันเพียงสองประการเท่านั้น สิ่งเหล่านี้เป็นสัญญาณทางเลือก โดยจะได้รับค่าเชิงปริมาณสองค่าตามลำดับ: ตัวเลือก 1 และ 0 ความถี่ของตัวเลือก 1 ซึ่งแสดงด้วย p คือสัดส่วนของหน่วยที่มีคุณสมบัตินี้ ความแตกต่าง 1-р=q คือความถี่ของตัวเลือก 0 ดังนั้น


ซี

ค่าเฉลี่ยเลขคณิตของเครื่องหมายทางเลือก
เพราะ p+q=1

ความแปรปรวนลักษณะทางเลือก
, เพราะ 1-р=คิว
ดังนั้น ความแปรปรวนของคุณลักษณะทางเลือกจึงเท่ากับผลคูณของสัดส่วนของหน่วยที่มีลักษณะนี้และสัดส่วนของหน่วยที่ไม่มีลักษณะนี้
หากค่า 1 และ 0 เกิดขึ้นเท่าๆ กัน เช่น p=q ความแปรปรวนจะถึงค่าสูงสุด pq=0.25
ความแปรปรวนของคุณลักษณะทางเลือกจะถูกใช้ในการสำรวจตัวอย่าง เช่น คุณภาพของผลิตภัณฑ์

3 ความแปรปรวนระหว่างกลุ่ม กฎการบวกผลต่าง

การกระจายตัวไม่เหมือนกับคุณลักษณะอื่นๆ ของการแปรผัน คือปริมาณบวก กล่าวคือโดยรวมแล้วแบ่งออกเป็นกลุ่มตามลักษณะของปัจจัย เอ็กซ์ , ความแปรปรวนของลักษณะผลลัพธ์ สามารถแยกย่อยได้เป็นความแปรปรวนภายในแต่ละกลุ่ม (ภายในกลุ่ม) และความแปรปรวนระหว่างกลุ่ม (ระหว่างกลุ่ม) จากนั้น เมื่อศึกษาความแปรผันของลักษณะเฉพาะของประชากรโดยรวมแล้ว ยังเป็นไปได้ที่จะศึกษาความแปรผันในแต่ละกลุ่มตลอดจนระหว่างกลุ่มเหล่านี้ด้วย

ผลต่างรวมวัดการเปลี่ยนแปลงในลักษณะ ที่อย่างครบถ้วนภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ (ความเบี่ยงเบน) มันเท่ากับค่าเบี่ยงเบนกำลังสองเฉลี่ยของแต่ละค่าของแอตทริบิวต์ ที่จากค่าเฉลี่ยแกรนด์และสามารถคำนวณได้เป็นความแปรปรวนอย่างง่ายหรือแบบถ่วงน้ำหนัก
ความแปรปรวนระหว่างกลุ่มระบุลักษณะการเปลี่ยนแปลงของลักษณะผลลัพธ์ ที่เกิดจากอิทธิพลของเครื่องหมายปัจจัย เอ็กซ์ซึ่งเป็นรากฐานของการจัดกลุ่ม มันแสดงลักษณะการเปลี่ยนแปลงของค่าเฉลี่ยกลุ่มและเท่ากับกำลังสองเฉลี่ยของการเบี่ยงเบนของค่าเฉลี่ยกลุ่มจากค่าเฉลี่ยโดยรวม:
,
ค่าเฉลี่ยเลขคณิตของกลุ่ม i-th อยู่ที่ไหน
– จำนวนหน่วยในกลุ่ม i-th (ความถี่ของกลุ่ม i-th)
– ค่าเฉลี่ยโดยรวมของประชากร
ความแปรปรวนภายในกลุ่มสะท้อนถึงความแปรผันแบบสุ่ม เช่น ส่วนหนึ่งของความแปรผันที่เกิดจากอิทธิพลของปัจจัยที่ไม่สามารถนับได้ และไม่ขึ้นอยู่กับคุณสมบัติของปัจจัยที่เป็นพื้นฐานของการจัดกลุ่ม เป็นลักษณะการเปลี่ยนแปลงของแต่ละค่าที่สัมพันธ์กับค่าเฉลี่ยกลุ่มและเท่ากับค่าเบี่ยงเบนกำลังสองเฉลี่ยของแต่ละค่าของแอตทริบิวต์ ที่ภายในกลุ่มจากค่าเฉลี่ยเลขคณิตของกลุ่มนี้ (ค่าเฉลี่ยกลุ่ม) และคำนวณเป็นผลต่างอย่างง่ายหรือถ่วงน้ำหนักสำหรับแต่ละกลุ่ม:
หรือ ,
โดยที่จำนวนหน่วยในกลุ่มคือ
ขึ้นอยู่กับความแปรปรวนภายในกลุ่มของแต่ละกลุ่ม เราสามารถกำหนดได้ ค่าเฉลี่ยโดยรวมของความแปรปรวนภายในกลุ่ม:
.
ความสัมพันธ์ระหว่างการกระจายตัวทั้งสามนี้เรียกว่า กฎสำหรับการบวกผลต่างโดยที่ความแปรปรวนรวมจะเท่ากับผลรวมของความแปรปรวนระหว่างกลุ่มและค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:

ตัวอย่าง- เมื่อศึกษาอิทธิพลของประเภทภาษี (คุณสมบัติ) ของคนงานที่มีต่อระดับผลิตภาพแรงงานของพวกเขา จะได้รับข้อมูลต่อไปนี้
ตารางที่ 5 – การกระจายตัวของคนงานตามผลผลิตเฉลี่ยต่อชั่วโมง



หน้า/พี

คนงานประเภทที่ 4

คนงานประเภทที่ 5

เอาท์พุต
คนงาน, ชิ้น,

เอาท์พุต
คนงาน, ชิ้น,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

ในตัวอย่างนี้ ผู้ปฏิบัติงานจะถูกแบ่งออกเป็นสองกลุ่มตามลักษณะของปัจจัย เอ็กซ์– คุณสมบัติซึ่งมีลักษณะตามอันดับของพวกเขา ลักษณะผลลัพธ์ - การผลิต - แตกต่างกันไปทั้งภายใต้อิทธิพลของมัน (ความแปรผันระหว่างกลุ่ม) และเนื่องจากปัจจัยสุ่มอื่น ๆ (ความแปรผันภายในกลุ่ม) เป้าหมายคือการวัดความแปรผันเหล่านี้โดยใช้ความแปรปรวน 3 แบบ ได้แก่ ผลรวม ระหว่างกลุ่ม และภายในกลุ่ม ที่ค่าสัมประสิทธิ์การกำหนดเชิงประจักษ์แสดงสัดส่วนของความแปรผันในลักษณะผลลัพธ์ เอ็กซ์ภายใต้อิทธิพลของเครื่องหมายปัจจัย ที่- ส่วนที่เหลือของการเปลี่ยนแปลงทั้งหมด
เกิดจากการเปลี่ยนแปลงปัจจัยอื่นๆ
ในตัวอย่าง ค่าสัมประสิทธิ์การตัดสินใจเชิงประจักษ์คือ:
หรือ 66.7%
ซึ่งหมายความว่า 66.7% ของการเปลี่ยนแปลงในผลิตภาพของพนักงานเกิดจากความแตกต่างในด้านคุณสมบัติ และ 33.3% เกิดจากอิทธิพลของปัจจัยอื่นๆความสัมพันธ์เชิงประจักษ์

แสดงให้เห็นถึงความสัมพันธ์ที่ใกล้ชิดระหว่างการจัดกลุ่มและคุณลักษณะด้านประสิทธิภาพ คำนวณเป็นรากที่สองของสัมประสิทธิ์เชิงประจักษ์ของการกำหนด:
หากไม่มีการเชื่อมต่อ ดังนั้น =0 ในกรณีนี้ =0 นั่นคือ ค่าเฉลี่ยกลุ่มมีค่าเท่ากันและไม่มีการแปรผันระหว่างกลุ่ม ซึ่งหมายความว่าลักษณะการจัดกลุ่ม - ปัจจัยไม่ส่งผลต่อการก่อตัวของความแปรปรวนทั่วไป
หากการเชื่อมต่อใช้งานได้ ดังนั้น =1 ในกรณีนี้ ความแปรปรวนของค่าเฉลี่ยกลุ่มจะเท่ากับความแปรปรวนรวม () นั่นคือไม่มีการแปรผันภายในกลุ่ม ซึ่งหมายความว่าลักษณะการจัดกลุ่มจะกำหนดความแปรผันของลักษณะผลลัพธ์ที่กำลังศึกษาได้อย่างสมบูรณ์
ยิ่งค่าของอัตราส่วนสหสัมพันธ์มีความเป็นเอกภาพมากเท่าไร ความเชื่อมโยงระหว่างลักษณะต่างๆ ก็จะยิ่งใกล้ชิดมากขึ้นเท่านั้น ยิ่งใกล้กับการพึ่งพาฟังก์ชันมากขึ้นเท่านั้น
ในการประเมินความใกล้ชิดของความสัมพันธ์ระหว่างคุณลักษณะในเชิงคุณภาพ จะใช้ความสัมพันธ์ของ Chaddock

ในตัวอย่าง ซึ่งบ่งบอกถึงความเชื่อมโยงอย่างใกล้ชิดระหว่างประสิทธิภาพการทำงานของพนักงานและคุณสมบัติของพวกเขา

นอกจากการศึกษาความแปรผันของลักษณะเฉพาะทั่วทั้งประชากรโดยรวมแล้ว ยังมักจำเป็นต้องติดตามการเปลี่ยนแปลงเชิงปริมาณในลักษณะเฉพาะข้ามกลุ่มที่แบ่งประชากรออก รวมไปถึงระหว่างกลุ่มด้วย การศึกษาความแปรปรวนนี้ทำได้โดยการคำนวณและวิเคราะห์ความแปรปรวนประเภทต่างๆ
มีความแปรปรวนทั้งหมด ระหว่างกลุ่มและภายในกลุ่ม.
ความแปรปรวนรวม σ 2วัดความแปรผันของลักษณะทั่วทั้งประชากรทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้

ความแปรปรวนระหว่างกลุ่ม (δ) แสดงถึงลักษณะการเปลี่ยนแปลงที่เป็นระบบ เช่น ความแตกต่างในคุณค่าของลักษณะที่ศึกษาซึ่งเกิดขึ้นภายใต้อิทธิพลของลักษณะปัจจัยที่เป็นพื้นฐานของกลุ่ม คำนวณโดยใช้สูตร:
.

ความแปรปรวนภายในกลุ่ม (σ)สะท้อนถึงความแปรผันแบบสุ่ม เช่น ส่วนหนึ่งของการเปลี่ยนแปลงที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สามารถนับได้ และไม่ขึ้นอยู่กับคุณลักษณะของปัจจัยที่เป็นพื้นฐานของกลุ่ม คำนวณโดยสูตร:
.

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม: .

มีกฎหมายเชื่อมโยงการกระจายตัว 3 ประเภท ความแปรปรวนรวมเท่ากับผลรวมของค่าเฉลี่ยของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม: .
อัตราส่วนนี้เรียกว่า กฎสำหรับการบวกผลต่าง.

ตัวบ่งชี้ที่ใช้กันอย่างแพร่หลายในการวิเคราะห์คือสัดส่วนของความแปรปรวนระหว่างกลุ่มต่อความแปรปรวนทั้งหมด มันถูกเรียกว่า ค่าสัมประสิทธิ์การตัดสินใจเชิงประจักษ์ (η 2): .
รากที่สองของสัมประสิทธิ์เชิงประจักษ์ของความมุ่งมั่นเรียกว่า อัตราส่วนสหสัมพันธ์เชิงประจักษ์ (η):
.
เป็นการแสดงลักษณะอิทธิพลของลักษณะที่เป็นพื้นฐานของกลุ่มต่อการเปลี่ยนแปลงของลักษณะผลลัพธ์ อัตราส่วนสหสัมพันธ์เชิงประจักษ์อยู่ระหว่าง 0 ถึง 1
ให้เราสาธิตการใช้งานจริงโดยใช้ตัวอย่างต่อไปนี้ (ตารางที่ 1)

ตัวอย่างหมายเลข 1 ตารางที่ 1 - ผลิตภาพแรงงานของคนงานสองกลุ่มในหนึ่งในการประชุมเชิงปฏิบัติการของ NPO "Cyclone"

มาคำนวณค่าเฉลี่ยและความแปรปรวนโดยรวมและกลุ่ม:




ข้อมูลเริ่มต้นสำหรับการคำนวณค่าเฉลี่ยของความแปรปรวนภายในกลุ่มและระหว่างกลุ่มแสดงไว้ในตาราง 2.
ตารางที่ 2
การคำนวณและ δ 2 สำหรับคนงานสองกลุ่ม


กลุ่มคนงาน
จำนวนคนงานคน เฉลี่ย ลูก/กะ การกระจายตัว

เสร็จสิ้นการฝึกอบรมด้านเทคนิค

5 95 42,0

ผู้ที่ยังไม่ผ่านการฝึกอบรมด้านเทคนิค

5 81 231,2

คนงานทุกคน

10 88 185,6
มาคำนวณตัวบ่งชี้กัน ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:
.
ความแปรปรวนระหว่างกลุ่ม

ผลต่างทั้งหมด:
ดังนั้น อัตราสหสัมพันธ์เชิงประจักษ์: .

นอกจากความแปรผันในลักษณะเชิงปริมาณแล้ว ยังสามารถสังเกตความแปรผันในลักษณะเชิงคุณภาพได้อีกด้วย การศึกษาความแปรผันนี้ทำได้โดยการคำนวณความแปรปรวนประเภทต่อไปนี้:

การกระจายส่วนแบ่งภายในกลุ่มถูกกำหนดโดยสูตร

ที่ไหน ฉัน– จำนวนหน่วยแยกกลุ่ม
ส่วนแบ่งของลักษณะที่ศึกษาในประชากรทั้งหมดซึ่งกำหนดโดยสูตร:
ความแปรปรวนทั้งสามประเภทมีความสัมพันธ์กันดังนี้:
.

ความสัมพันธ์ของความแปรปรวนนี้เรียกว่าทฤษฎีบทของการบวกความแปรปรวนของส่วนแบ่งลักษณะ

ทฤษฎีความน่าจะเป็นเป็นสาขาพิเศษของคณิตศาสตร์ที่ศึกษาโดยนักศึกษาสถาบันอุดมศึกษาเท่านั้น คุณชอบการคำนวณและสูตรหรือไม่? คุณกลัวโอกาสในการทำความรู้จักกับการแจกแจงแบบปกติ เอนโทรปีทั้งมวล ความคาดหวังทางคณิตศาสตร์ และการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่องหรือไม่ แล้ววิชานี้จะน่าสนใจมากสำหรับคุณ มาทำความคุ้นเคยกับแนวคิดพื้นฐานที่สำคัญที่สุดหลายประการของสาขาวิทยาศาสตร์นี้กันดีกว่า

เรามาจำพื้นฐานกัน

แม้ว่าคุณจะจำแนวคิดที่ง่ายที่สุดของทฤษฎีความน่าจะเป็นได้ แต่อย่าละเลยย่อหน้าแรกของบทความ ประเด็นก็คือหากไม่มีความเข้าใจพื้นฐานที่ชัดเจน คุณจะไม่สามารถทำงานกับสูตรที่กล่าวถึงด้านล่างได้

จึงมีเหตุการณ์สุ่มเกิดขึ้น การทดลองบางอย่าง จากการกระทำที่เราทำ เราจึงสามารถได้รับผลลัพธ์หลายประการ - บางอย่างเกิดขึ้นบ่อยกว่า และบางอย่างไม่บ่อยนัก ความน่าจะเป็นของเหตุการณ์คืออัตราส่วนของจำนวนผลลัพธ์จริงที่ได้รับจริงประเภทหนึ่งต่อจำนวนผลลัพธ์ที่เป็นไปได้ทั้งหมด เพียงทราบคำจำกัดความดั้งเดิมของแนวคิดนี้ คุณก็สามารถเริ่มศึกษาความคาดหวังทางคณิตศาสตร์และการกระจายตัวของตัวแปรสุ่มต่อเนื่องได้

ค่าเฉลี่ยเลขคณิต

ย้อนกลับไปในโรงเรียน ระหว่างเรียนคณิตศาสตร์ คุณเริ่มทำงานกับค่าเฉลี่ยเลขคณิต แนวคิดนี้ใช้กันอย่างแพร่หลายในทฤษฎีความน่าจะเป็น ดังนั้นจึงไม่สามารถละเลยได้ สิ่งสำคัญสำหรับเราในขณะนี้คือเราจะพบมันในสูตรสำหรับความคาดหวังทางคณิตศาสตร์และการกระจายตัวของตัวแปรสุ่ม

เรามีลำดับของตัวเลขและต้องการหาค่าเฉลี่ยเลขคณิต สิ่งเดียวที่เราต้องการก็คือสรุปทุกอย่างที่มีอยู่แล้วหารด้วยจำนวนองค์ประกอบในลำดับ ขอให้เรามีตัวเลขตั้งแต่ 1 ถึง 9 ผลรวมขององค์ประกอบจะเท่ากับ 45 และเราจะหารค่านี้ด้วย 9 คำตอบ: - 5

การกระจายตัว

ในแง่วิทยาศาสตร์ การกระจายตัวคือกำลังสองเฉลี่ยของการเบี่ยงเบนของค่าที่ได้รับของคุณลักษณะจากค่าเฉลี่ยเลขคณิต มันถูกเขียนแทนด้วยอักษรละตินตัวพิมพ์ใหญ่ D ตัวหนึ่ง สิ่งที่จำเป็นในการคำนวณคืออะไร? สำหรับแต่ละองค์ประกอบของลำดับ เราจะคำนวณความแตกต่างระหว่างตัวเลขที่มีอยู่กับค่าเฉลี่ยเลขคณิตแล้วยกกำลังสอง จะมีคุณค่ามากที่สุดเท่าที่จะเป็นไปได้สำหรับเหตุการณ์ที่เรากำลังพิจารณา ต่อไปเราจะสรุปทุกอย่างที่ได้รับและหารด้วยจำนวนองค์ประกอบในลำดับ หากเรามีผลลัพธ์ที่เป็นไปได้ห้ารายการ ให้หารด้วยห้า

การกระจายตัวยังมีคุณสมบัติที่ต้องจดจำเพื่อใช้ในการแก้ปัญหา ตัวอย่างเช่น เมื่อเพิ่มตัวแปรสุ่ม X ครั้ง ความแปรปรวนจะเพิ่มขึ้น X กำลังสองคูณ (เช่น X*X) มันไม่เคยน้อยกว่าศูนย์และไม่ขึ้นอยู่กับการเลื่อนค่าขึ้นหรือลงด้วยจำนวนที่เท่ากัน นอกจากนี้ สำหรับการทดลองอิสระ ความแปรปรวนของผลรวมจะเท่ากับผลรวมของผลรวม

ตอนนี้เราต้องพิจารณาตัวอย่างการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่องและความคาดหวังทางคณิตศาสตร์อย่างแน่นอน

สมมติว่าเราทำการทดลอง 21 ครั้ง และได้ผลลัพธ์ที่แตกต่างกัน 7 แบบ เราสังเกตแต่ละครั้ง 1, 2, 2, 3, 4, 4 และ 5 ครั้งตามลำดับ ความแปรปรวนจะเท่ากับอะไร?

ขั้นแรก มาคำนวณค่าเฉลี่ยเลขคณิต แน่นอนว่าผลรวมขององค์ประกอบคือ 21 หารด้วย 7 จะได้ 3 จากนั้นให้ลบ 3 ออกจากแต่ละตัวเลขในลำดับเดิม ยกกำลังสองแต่ละค่า แล้วบวกผลลัพธ์เข้าด้วยกัน ผลลัพธ์คือ 12 ตอนนี้สิ่งที่เราต้องทำคือหารตัวเลขด้วยจำนวนองค์ประกอบ และดูเหมือนว่าก็แค่นั้นแหละ แต่ก็มีสิ่งที่จับได้! มาหารือกัน

ขึ้นอยู่กับจำนวนการทดลอง

ปรากฎว่าเมื่อคำนวณความแปรปรวน ตัวส่วนสามารถมีตัวเลขหนึ่งในสองจำนวน: N หรือ N-1 โดยที่ N คือจำนวนการทดลองที่ทำหรือจำนวนองค์ประกอบในลำดับ (ซึ่งโดยพื้นฐานแล้วคือสิ่งเดียวกัน) สิ่งนี้ขึ้นอยู่กับอะไร?

ถ้าจำนวนการทดสอบวัดเป็นร้อย เราต้องใส่ N ในตัวส่วน ถ้าเป็นหน่วยแล้ว N-1 นักวิทยาศาสตร์ตัดสินใจวาดเส้นขอบในเชิงสัญลักษณ์: วันนี้มันผ่านเลข 30 หากเราทำการทดลองน้อยกว่า 30 ครั้ง เราจะหารจำนวนด้วย N-1 และถ้ามากกว่านั้นก็หารด้วย N

งาน

กลับมาที่ตัวอย่างการแก้ปัญหาความแปรปรวนและความคาดหวังทางคณิตศาสตร์กัน เราได้เลขกลาง 12 ซึ่งต้องหารด้วย N หรือ N-1 เนื่องจากเราทำการทดลอง 21 ครั้ง ซึ่งน้อยกว่า 30 ครั้ง เราจะเลือกตัวเลือกที่สอง คำตอบคือ: ความแปรปรวนคือ 12/2 = 2

ความคาดหวัง

เรามาดูแนวคิดที่สองกันดีกว่าซึ่งเราต้องพิจารณาในบทความนี้ ความคาดหวังทางคณิตศาสตร์เป็นผลมาจากการบวกผลลัพธ์ที่เป็นไปได้ทั้งหมดคูณด้วยความน่าจะเป็นที่สอดคล้องกัน สิ่งสำคัญคือต้องเข้าใจว่าค่าที่ได้รับตลอดจนผลลัพธ์ของการคำนวณความแปรปรวนนั้นได้มาเพียงครั้งเดียวสำหรับปัญหาทั้งหมด ไม่ว่าจะพิจารณาผลลัพธ์จำนวนเท่าใดก็ตาม

สูตรสำหรับความคาดหวังทางคณิตศาสตร์นั้นค่อนข้างง่าย: เรานำผลลัพธ์มาคูณด้วยความน่าจะเป็นของมันบวกกับผลลัพธ์ที่สองและสามเป็นต้น ทุกอย่างที่เกี่ยวข้องกับแนวคิดนี้คำนวณได้ไม่ยาก เช่น ผลรวมของค่าที่คาดหวังจะเท่ากับค่าที่คาดหวังของผลรวม เช่นเดียวกับการทำงาน ไม่ใช่ทุกปริมาณในทฤษฎีความน่าจะเป็นที่จะอนุญาตให้คุณดำเนินการง่ายๆ เช่นนั้นได้ ลองใช้ปัญหาและคำนวณความหมายของสองแนวคิดที่เราศึกษาพร้อมกัน นอกจากนี้เรายังถูกรบกวนจากทฤษฎี - ถึงเวลาฝึกฝนแล้ว

อีกตัวอย่างหนึ่ง

เราทำการทดลอง 50 ครั้งและได้รับผลลัพธ์ 10 ประเภท - ตัวเลขตั้งแต่ 0 ถึง 9 - ปรากฏเป็นเปอร์เซ็นต์ที่แตกต่างกัน เหล่านี้คือตามลำดับ: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18% โปรดจำไว้ว่าเพื่อให้ได้ความน่าจะเป็นคุณต้องหารค่าเปอร์เซ็นต์ด้วย 100 ดังนั้นเราจึงได้ 0.02 0.1 เป็นต้น ให้เรานำเสนอตัวอย่างการแก้ปัญหาความแปรปรวนของตัวแปรสุ่มและความคาดหวังทางคณิตศาสตร์

เราคำนวณค่าเฉลี่ยเลขคณิตโดยใช้สูตรที่เราจำได้ตั้งแต่ชั้นประถมศึกษา: 50/10 = 5

ทีนี้มาแปลงความน่าจะเป็นเป็นจำนวนผลลัพธ์ "เป็นชิ้น ๆ" เพื่อให้นับได้ง่ายขึ้น เราได้ 1, 5, 2, 7, 1, 9, 3, 8, 5 และ 9 จากแต่ละค่าที่ได้รับ เราจะลบค่าเฉลี่ยเลขคณิต หลังจากนั้นเราจะยกกำลังสองผลลัพธ์แต่ละรายการที่ได้รับ ดูวิธีดำเนินการโดยใช้องค์ประกอบแรกเป็นตัวอย่าง: 1 - 5 = (-4) ถัดไป: (-4) * (-4) = 16 สำหรับค่าอื่นๆ ให้ดำเนินการเหล่านี้ด้วยตนเอง ถ้าคุณทำทุกอย่างถูกต้องแล้ว เมื่อรวมทั้งหมดแล้วคุณจะได้ 90

มาคำนวณความแปรปรวนและค่าคาดหวังต่อไปโดยหาร 90 ด้วย N ทำไมเราจึงเลือก N แทนที่จะเป็น N-1 ถูกต้อง เนื่องจากจำนวนการทดลองที่ทำเกิน 30 ดังนั้น: 90/10 = 9 เราได้ความแปรปรวน หากได้เลขอื่นอย่าหมดหวัง เป็นไปได้มากว่าคุณทำผิดพลาดง่าย ๆ ในการคำนวณ ตรวจสอบสิ่งที่คุณเขียนอีกครั้งและทุกอย่างอาจจะเข้าที่

สุดท้าย จำสูตรความคาดหวังทางคณิตศาสตร์ไว้ เราจะไม่ให้การคำนวณทั้งหมด เราจะเขียนเฉพาะคำตอบที่คุณสามารถตรวจสอบได้หลังจากทำตามขั้นตอนที่จำเป็นทั้งหมดแล้วเท่านั้น ค่าคาดหวังจะเป็น 5.48 ให้เรานึกถึงวิธีดำเนินการเท่านั้น โดยใช้องค์ประกอบแรกเป็นตัวอย่าง: 0*0.02 + 1*0.1... และอื่นๆ อย่างที่คุณเห็น เราแค่คูณค่าผลลัพธ์ด้วยความน่าจะเป็น

การเบี่ยงเบน

แนวคิดอีกประการหนึ่งที่เกี่ยวข้องอย่างใกล้ชิดกับการกระจายตัวและความคาดหวังทางคณิตศาสตร์ก็คือค่าเบี่ยงเบนมาตรฐาน มันถูกแสดงด้วยตัวอักษรละติน sd หรือด้วยตัวพิมพ์เล็กกรีก "sigma" แนวคิดนี้แสดงให้เห็นว่าค่าเบี่ยงเบนไปจากคุณลักษณะส่วนกลางโดยเฉลี่ยเท่าใด ในการหาค่าของมัน คุณจำเป็นต้องคำนวณรากที่สองของความแปรปรวน

หากคุณพล็อตกราฟการแจกแจงแบบปกติและต้องการดูค่าเบี่ยงเบนกำลังสองบนกราฟนั้นโดยตรง สามารถทำได้ในหลายๆ ขั้นตอน ใช้เวลาครึ่งหนึ่งของภาพไปทางซ้ายหรือขวาของโหมด (ค่ากลาง) วาดตั้งฉากกับแกนนอนเพื่อให้พื้นที่ของตัวเลขที่ได้เท่ากัน ขนาดของส่วนระหว่างกึ่งกลางของการกระจายและการฉายภาพที่เกิดขึ้นบนแกนนอนจะแสดงถึงค่าเบี่ยงเบนมาตรฐาน

ซอฟต์แวร์

ดังที่เห็นได้จากคำอธิบายของสูตรและตัวอย่างที่นำเสนอ การคำนวณความแปรปรวนและความคาดหวังทางคณิตศาสตร์ไม่ใช่ขั้นตอนที่ง่ายที่สุดจากมุมมองทางคณิตศาสตร์ เพื่อไม่ให้เป็นการเสียเวลา ควรใช้โปรแกรมที่ใช้ในสถาบันการศึกษาระดับอุดมศึกษา - เรียกว่า "R" มีฟังก์ชันที่ช่วยให้คุณคำนวณค่าสำหรับแนวคิดต่างๆ จากสถิติและทฤษฎีความน่าจะเป็น

ตัวอย่างเช่น คุณระบุเวกเตอร์ของค่า ทำได้ดังนี้: เวกเตอร์<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

สรุปแล้ว

การกระจายตัวและความคาดหวังทางคณิตศาสตร์นั้นเป็นสิ่งที่ยากในการคำนวณสิ่งใดในอนาคต ในหลักสูตรหลักของการบรรยายที่มหาวิทยาลัยจะมีการพูดคุยกันในช่วงเดือนแรกของการศึกษาวิชานี้ เป็นเพราะการขาดความเข้าใจในแนวคิดง่ายๆ เหล่านี้และไม่สามารถคำนวณได้ ทำให้นักเรียนจำนวนมากเริ่มล้าหลังในโปรแกรมทันทีและต่อมาได้รับคะแนนไม่ดีเมื่อสิ้นสุดภาคเรียน ซึ่งทำให้ไม่ได้รับทุนการศึกษา

ฝึกฝนอย่างน้อยหนึ่งสัปดาห์ ครึ่งชั่วโมงต่อวัน เพื่อแก้ปัญหาคล้ายกับที่นำเสนอในบทความนี้ จากนั้น ในการทดสอบใดๆ ในทฤษฎีความน่าจะเป็น คุณจะสามารถรับมือกับตัวอย่างต่างๆ ได้โดยไม่ต้องอาศัยคำแนะนำและสูตรโกงเพิ่มเติม

ตัวชี้วัดทั่วไปที่สำคัญของการเปลี่ยนแปลงทางสถิติคือการกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน

การกระจายตัว นี้ ค่าเฉลี่ยเลขคณิต ค่าเบี่ยงเบนกำลังสองของค่าลักษณะเฉพาะแต่ละค่าจากค่าเฉลี่ยโดยรวม ความแปรปรวนมักเรียกว่ากำลังสองเฉลี่ยของการเบี่ยงเบน และเขียนแทนด้วย  2 ความแปรปรวนสามารถคำนวณได้โดยใช้ค่าเฉลี่ยเลขคณิตแบบง่ายหรือแบบถ่วงน้ำหนัก ทั้งนี้ขึ้นอยู่กับข้อมูลต้นฉบับ:

 ความแปรปรวนที่ไม่ถ่วงน้ำหนัก (ง่าย)

 ถ่วงน้ำหนักความแปรปรวน

ส่วนเบี่ยงเบนมาตรฐาน นี่คือลักษณะทั่วไปของขนาดสัมบูรณ์ รูปแบบต่างๆ สัญญาณโดยรวม โดยจะแสดงเป็นหน่วยวัดเดียวกันกับแอตทริบิวต์ (เป็นเมตร ตัน เปอร์เซ็นต์ เฮกตาร์ ฯลฯ)

ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนและเขียนแทนด้วย :

 ส่วนเบี่ยงเบนมาตรฐานไม่ได้ถ่วงน้ำหนัก;

 ค่าเบี่ยงเบนมาตรฐานถ่วงน้ำหนัก

ค่าเบี่ยงเบนมาตรฐานคือการวัดความน่าเชื่อถือของค่าเฉลี่ย ยิ่งค่าเบี่ยงเบนมาตรฐานมีค่าน้อย ค่าเฉลี่ยเลขคณิตจะสะท้อนถึงจำนวนประชากรทั้งหมดได้ดียิ่งขึ้น

การคำนวณค่าเบี่ยงเบนมาตรฐานนำหน้าด้วยการคำนวณความแปรปรวน

ขั้นตอนการคำนวณผลต่างถ่วงน้ำหนักมีดังนี้:

1) กำหนดค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:

2) คำนวณความเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย:

3) ยกกำลังสองส่วนเบี่ยงเบนของแต่ละตัวเลือกจากค่าเฉลี่ย:

4) คูณกำลังสองของการเบี่ยงเบนด้วยน้ำหนัก (ความถี่):

5) สรุปผลิตภัณฑ์ผลลัพธ์:

6) จำนวนผลลัพธ์จะถูกหารด้วยผลรวมของน้ำหนัก:

ตัวอย่างที่ 2.1

ลองคำนวณค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:

ค่าเบี่ยงเบนจากค่าเฉลี่ยและกำลังสองแสดงอยู่ในตาราง มานิยามความแปรปรวนกัน:

ค่าเบี่ยงเบนมาตรฐานจะเท่ากับ:

หากข้อมูลต้นฉบับถูกนำเสนอในรูปแบบช่วงเวลา ชุดการจัดจำหน่าย จากนั้นคุณต้องกำหนดค่าแยกกันของแอตทริบิวต์ก่อน จากนั้นจึงใช้วิธีการที่อธิบายไว้

ตัวอย่างที่ 2.2

ให้เราแสดงการคำนวณความแปรปรวนสำหรับอนุกรมช่วงเวลาโดยใช้ข้อมูลการกระจายพื้นที่หว่านของฟาร์มรวมตามผลผลิตข้าวสาลี

ค่าเฉลี่ยเลขคณิตคือ:

มาคำนวณความแปรปรวนกัน:

6.3. การคำนวณความแปรปรวนโดยใช้สูตรตามข้อมูลแต่ละบุคคล

เทคนิคการคำนวณ ความแตกต่าง ซับซ้อนและด้วยตัวเลือกและความถี่ที่มีค่ามากอาจทำให้ยุ่งยากได้ การคำนวณสามารถทำให้ง่ายขึ้นโดยใช้คุณสมบัติของการกระจายตัว

การกระจายตัวมีคุณสมบัติดังต่อไปนี้

1. การลดหรือเพิ่มน้ำหนัก (ความถี่) ของคุณลักษณะที่แตกต่างกันตามจำนวนครั้งที่กำหนดจะไม่เปลี่ยนการกระจายตัว

2. ลดหรือเพิ่มแต่ละค่าของคุณลักษณะด้วยจำนวนคงที่ที่เท่ากัน ไม่เปลี่ยนการกระจายตัว

3. ลดหรือเพิ่มค่าแอตทริบิวต์แต่ละรายการตามจำนวนครั้งที่กำหนด เคตามลำดับจะลดหรือเพิ่มความแปรปรวนใน เค 2 ครั้ง และ ส่วนเบี่ยงเบนมาตรฐาน  ใน เคครั้งหนึ่ง.

4. การกระจายตัวของคุณลักษณะที่สัมพันธ์กับค่าที่กำหนดมักจะมากกว่าการกระจายตัวที่สัมพันธ์กับค่าเฉลี่ยเลขคณิตต่อกำลังสองของความแตกต่างระหว่างค่าเฉลี่ยและค่าที่กำหนดเอง:

ถ้า  0 แล้วเราจะได้ความเท่าเทียมกันดังต่อไปนี้:

กล่าวคือความแปรปรวนของคุณลักษณะจะเท่ากับความแตกต่างระหว่างกำลังสองเฉลี่ยของค่าคุณลักษณะและกำลังสองของค่าเฉลี่ย

คุณสมบัติแต่ละรายการสามารถใช้แยกกันหรือใช้ร่วมกับคุณสมบัติอื่นๆ เมื่อคำนวณความแปรปรวน

ขั้นตอนการคำนวณความแปรปรวนนั้นง่าย:

1) กำหนด ค่าเฉลี่ยเลขคณิต :

2) ยกกำลังสองค่าเฉลี่ยเลขคณิต:

3) ยกกำลังสองส่วนเบี่ยงเบนของแต่ละตัวแปรของซีรีย์:

เอ็กซ์ ฉัน 2 .

4) ค้นหาผลรวมของกำลังสองของตัวเลือก:

5) หารผลรวมของกำลังสองของตัวเลือกด้วยหมายเลขนั่นคือ กำหนดกำลังสองเฉลี่ย:

6) กำหนดความแตกต่างระหว่างกำลังสองเฉลี่ยของคุณลักษณะและกำลังสองของค่าเฉลี่ย:

ตัวอย่างที่ 3.1ข้อมูลต่อไปนี้มีเกี่ยวกับประสิทธิภาพการทำงานของผู้ปฏิบัติงาน:

มาทำการคำนวณต่อไปนี้: