สูตรความแปรปรวนเฉลี่ย ตัวบ่งชี้การเปลี่ยนแปลง: แนวคิด ประเภท สูตรสำหรับการคำนวณ
ตัวบ่งชี้ทั่วไปหลักของการเปลี่ยนแปลงในสถิติคือความแปรปรวนและค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน.
การกระจายตัว มัน เลขคณิต ส่วนเบี่ยงเบนกำลังสองของค่าคุณลักษณะแต่ละค่าจากค่าเฉลี่ยทั้งหมด ความแปรปรวนมักจะเรียกว่ากำลังสองเฉลี่ยของส่วนเบี่ยงเบนและแสดงแทน 2 . ขึ้นอยู่กับข้อมูลเริ่มต้น ความแปรปรวนสามารถคำนวณได้จากค่าเฉลี่ยเลขคณิต แบบง่าย หรือแบบถ่วงน้ำหนัก:
การกระจายตัวแบบไม่ถ่วงน้ำหนัก (แบบง่าย)
ความแปรปรวนถ่วงน้ำหนัก
ส่วนเบี่ยงเบนมาตรฐาน เป็นลักษณะทั่วไปของมิติสัมบูรณ์ รูปแบบต่างๆ ลักษณะโดยรวม มันถูกแสดงในหน่วยเดียวกับเครื่องหมาย (เป็นเมตร, ตัน, เปอร์เซ็นต์, เฮกตาร์, ฯลฯ )
ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนและเขียนแทนด้วย :
ส่วนเบี่ยงเบนมาตรฐานไม่ถ่วงน้ำหนัก
ค่าเบี่ยงเบนมาตรฐานถ่วงน้ำหนัก
ค่าเบี่ยงเบนมาตรฐานเป็นตัววัดความน่าเชื่อถือของค่าเฉลี่ย ยิ่งค่าเบี่ยงเบนมาตรฐานน้อยกว่า ค่าเฉลี่ยเลขคณิตจะสะท้อนประชากรทั้งหมดได้ดีกว่า
การคำนวณค่าเบี่ยงเบนมาตรฐานนำหน้าด้วยการคำนวณค่าความแปรปรวน
ขั้นตอนการคำนวณความแปรปรวนถ่วงน้ำหนักมีดังนี้:
1) กำหนดค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:
2) คำนวณค่าเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย:
3) ยกกำลังส่วนเบี่ยงเบนของแต่ละตัวเลือกจากค่าเฉลี่ย:
4) คูณค่าเบี่ยงเบนกำลังสองด้วยน้ำหนัก (ความถี่):
5) สรุปผลงานที่ได้รับ:
6) จำนวนผลลัพธ์หารด้วยผลรวมของน้ำหนัก:
ตัวอย่าง 2.1
คำนวณค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:
ค่าเบี่ยงเบนจากค่าเฉลี่ยและกำลังสองแสดงในตาราง มานิยามความแปรปรวนกัน:
ส่วนเบี่ยงเบนมาตรฐานจะเท่ากับ:
หากข้อมูลต้นทางถูกนำเสนอเป็นช่วงเวลา ชุดจำหน่าย จากนั้นคุณต้องกำหนดค่าที่ไม่ต่อเนื่องของคุณลักษณะ จากนั้นใช้วิธีที่อธิบายไว้
ตัวอย่าง 2.2
ให้เราแสดงการคำนวณความแปรปรวนสำหรับชุดช่วงเวลาเกี่ยวกับข้อมูลเกี่ยวกับการกระจายพื้นที่หว่านของฟาร์มส่วนรวมด้วยผลผลิตข้าวสาลี
ค่าเฉลี่ยเลขคณิตคือ:
ลองคำนวณความแปรปรวน:
6.3. การคำนวณการกระจายตามสูตรสำหรับข้อมูลแต่ละส่วน
เทคนิคการคำนวณ การกระจายตัว ซับซ้อนและ คุณค่ามหาศาลตัวเลือกและความถี่อาจยุ่งยาก การคำนวณสามารถทำให้ง่ายขึ้นได้โดยใช้คุณสมบัติการกระจาย
การกระจายมีคุณสมบัติดังต่อไปนี้
1. การลดลงหรือเพิ่มขึ้นในน้ำหนัก (ความถี่) ของคุณลักษณะตัวแปรตามจำนวนครั้งที่กำหนดจะไม่เปลี่ยนการกระจาย
2. ลดหรือเพิ่มค่าคุณลักษณะแต่ละค่าด้วยค่าคงที่เท่ากัน แต่การกระจายตัวไม่เปลี่ยนแปลง
3. ลดหรือเพิ่มค่าคุณสมบัติแต่ละค่าตามจำนวนครั้งที่กำหนด kลดหรือเพิ่มความแปรปรวนตามลำดับใน k 2 ครั้ง ส่วนเบี่ยงเบนมาตรฐาน ใน kครั้งหนึ่ง.
4. ความแปรปรวนของจุดสนใจที่สัมพันธ์กับค่าที่กำหนดเองมักจะมากกว่าความแปรปรวนที่สัมพันธ์กับค่าเฉลี่ยเลขคณิตด้วยกำลังสองของผลต่างระหว่างค่าเฉลี่ยและค่าที่กำหนดเอง:
ถ้า แต่ 0 แล้วเราก็มาถึงความเท่าเทียมกันดังต่อไปนี้:
กล่าวคือ ความแปรปรวนของจุดสนใจเท่ากับผลต่างระหว่างค่าเฉลี่ยกำลังสองของค่าคุณลักษณะและกำลังสองของค่าเฉลี่ย
แต่ละคุณสมบัติสามารถใช้เดี่ยวๆ หรือใช้ร่วมกับคุณสมบัติอื่นๆ เมื่อคำนวณความแปรปรวน
ขั้นตอนการคำนวณความแปรปรวนนั้นง่าย:
1) กำหนด เลขคณิต :
2) ยกกำลังสองค่าเฉลี่ยเลขคณิต:
3) ยกกำลังส่วนเบี่ยงเบนของแต่ละตัวแปรในซีรีส์:
X ผม 2 .
4) ค้นหาผลรวมของตัวเลือกกำลังสอง:
5) หารผลรวมของกำลังสองของตัวเลือกด้วยจำนวนของมัน เช่น กำหนด จตุรัสกลาง:
6) กำหนดความแตกต่างระหว่างกำลังสองเฉลี่ยของจุดสนใจและกำลังสองของค่าเฉลี่ย:
ตัวอย่าง 3.1เรามีข้อมูลต่อไปนี้เกี่ยวกับประสิทธิภาพการทำงานของพนักงาน:
มาทำการคำนวณต่อไปนี้:
หน้านี้อธิบาย ตัวอย่างมาตรฐานการหาความแปรปรวน คุณยังสามารถดูงานอื่นเพื่อค้นหามัน
ตัวอย่างที่ 1 การหากลุ่ม ค่าเฉลี่ยของกลุ่ม ระหว่างกลุ่มและความแปรปรวนทั้งหมด
ตัวอย่างที่ 2 การหาความแปรปรวนและสัมประสิทธิ์การแปรผันในตารางการจัดกลุ่ม
ตัวอย่างที่ 3 การหาความแปรปรวนใน ซีรีส์ไม่ต่อเนื่อง
ตัวอย่างที่ 4 เรามีข้อมูลต่อไปนี้สำหรับกลุ่มนักเรียน 20 คน แผนกจดหมาย. ต้องสร้าง อนุกรมช่วงเวลาการกระจายของคุณลักษณะ คำนวณค่าเฉลี่ยของคุณลักษณะ และศึกษาความแปรปรวนของมัน
มาสร้างกันเถอะ การจัดกลุ่มตามช่วงเวลา. ลองกำหนดช่วงของช่วงเวลาโดยใช้สูตร:
โดยที่ X สูงสุด– มูลค่าสูงสุดเครื่องหมายการจัดกลุ่ม
X min คือค่าต่ำสุดของคุณลักษณะการจัดกลุ่ม
n คือจำนวนช่วง:
เรายอมรับ n=5 ขั้นตอนคือ: h \u003d (192 - 159) / 5 \u003d 6.6
มาทำการจัดกลุ่มตามช่วงเวลากันเถอะ
สำหรับการคำนวณเพิ่มเติม เราจะสร้างตารางเสริม:
X "i - ตรงกลางของช่วง (เช่น ตรงกลางของช่วง 159 - 165.6 \u003d 162.3)
ค่าเฉลี่ยการเติบโตของนักเรียนถูกกำหนดโดยสูตรของค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:
เรากำหนดการกระจายตัวตามสูตร:
สามารถแปลงสูตรได้ดังนี้
จากสูตรนี้ ได้ดังนี้ ความแปรปรวนคือ ความแตกต่างระหว่างค่าเฉลี่ยของกำลังสองของตัวเลือกกับค่ากำลังสองและค่าเฉลี่ย
ความแปรปรวนในอนุกรมผันแปรกับ ในช่วงเวลาเท่ากันโดยวิธีโมเมนต์คำนวณได้ ด้วยวิธีต่อไปนี้เมื่อใช้คุณสมบัติที่สองของความแปรปรวน (หารตัวเลือกทั้งหมดด้วยค่าของช่วงเวลา) ความหมายของความแปรปรวนคำนวณโดยวิธีช่วงเวลาตามสูตรต่อไปนี้ใช้เวลาน้อยลง:
โดยที่ i คือค่าของช่วงเวลา
A เป็นศูนย์แบบมีเงื่อนไข ซึ่งสะดวกที่จะใช้ตรงกลางของช่วงที่มี ความถี่สูงสุด;
m1 คือกำลังสองของโมเมนต์ลำดับแรก
m2 - โมเมนต์ของคำสั่งที่สอง
ความแปรปรวนของคุณสมบัติ (หากในประชากรทางสถิติ คุณลักษณะเปลี่ยนแปลงในลักษณะที่มีเพียงสองตัวเลือกที่ไม่เกิดร่วมกัน ความแปรปรวนดังกล่าวเรียกว่าทางเลือก) สามารถคำนวณได้โดยสูตร:
แทนที่ใน สูตรนี้การกระจายตัว q \u003d 1- p เราได้รับ:
ประเภทของการกระจายตัว
ผลต่างทั้งหมดวัดความแปรผันของลักษณะเฉพาะของประชากรทั้งหมดโดยรวมภายใต้อิทธิพลของปัจจัยทั้งหมดที่ก่อให้เกิดการเปลี่ยนแปลงนี้ เท่ากับค่าเฉลี่ยกำลังสองของส่วนเบี่ยงเบน ค่าส่วนบุคคลคุณลักษณะ x ของค่าเฉลี่ยโดยรวมของ x และสามารถกำหนดเป็นความแปรปรวนอย่างง่ายหรือความแปรปรวนแบบถ่วงน้ำหนักได้
ความแปรปรวนภายในกลุ่ม กำหนดลักษณะการแปรผันแบบสุ่ม กล่าวคือ ส่วนหนึ่งของความผันแปร ซึ่งเกิดจากอิทธิพลของปัจจัยที่ไม่คำนึงถึงและไม่ขึ้นอยู่กับปัจจัยเครื่องหมายที่อยู่ภายใต้การจัดกลุ่ม ความแปรปรวนนี้เท่ากับกำลังสองเฉลี่ยของการเบี่ยงเบนของค่าแต่ละค่าของแอตทริบิวต์ภายในกลุ่ม X จากค่าเฉลี่ยเลขคณิตของกลุ่มและสามารถคำนวณเป็นค่าความแปรปรวนอย่างง่ายหรือค่าความแปรปรวนแบบถ่วงน้ำหนัก
ทางนี้, การวัดความแปรปรวนภายในกลุ่มการเปลี่ยนแปลงของคุณลักษณะภายในกลุ่มและกำหนดโดยสูตร:
โดยที่ xi - ค่าเฉลี่ยกลุ่ม
ni คือจำนวนหน่วยในกลุ่ม
ตัวอย่างเช่น ความแปรปรวนภายในกลุ่มที่ต้องพิจารณาในงานศึกษาผลกระทบของคุณสมบัติของคนงานต่อระดับผลิตภาพแรงงานในร้านค้า แสดงความผันแปรของผลผลิตในแต่ละกลุ่มที่เกิดจากปัจจัยที่เป็นไปได้ทั้งหมด (สภาพทางเทคนิคของอุปกรณ์ ความพร้อมใช้งานของเครื่องมือและวัสดุ อายุของคนงาน ความเข้มข้นของแรงงาน ฯลฯ . ) ยกเว้นความแตกต่างในประเภทคุณสมบัติ (ภายในกลุ่ม พนักงานทุกคนมีคุณสมบัติเหมือนกัน)
มาคำนวณกันนางสาวEXCELการกระจายตัวและ ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง นอกจากนี้เรายังคำนวณความแปรปรวนของตัวแปรสุ่มหากทราบการแจกแจง
พิจารณาก่อน การกระจายตัว, แล้ว ส่วนเบี่ยงเบนมาตรฐาน.
ความแปรปรวนตัวอย่าง
ความแปรปรวนตัวอย่าง (ความแปรปรวนตัวอย่างตัวอย่างความแปรปรวน) แสดงลักษณะการกระจายของค่าในอาร์เรย์ที่สัมพันธ์กับ
ทั้ง 3 สูตรเทียบเท่าทางคณิตศาสตร์
จะเห็นได้จากสูตรแรกว่า ความแปรปรวนตัวอย่างคือผลรวมของค่าเบี่ยงเบนกำลังสองของแต่ละค่าในอาร์เรย์ จากค่าเฉลี่ยหารด้วยขนาดกลุ่มตัวอย่างลบ 1
การกระจายตัว ตัวอย่างใช้ฟังก์ชัน DISP() ENG ชื่อของ VAR คือ ความแปรปรวน ตั้งแต่ MS EXCEL 2010 ขอแนะนำให้ใช้อะนาล็อก DISP.V() , eng ชื่อ VARS คือ ตัวอย่างความแปรปรวน นอกจากนี้ เริ่มจากเวอร์ชันของ MS EXCEL 2010 มีฟังก์ชัน DISP.G () eng ชื่อ VARP กล่าวคือ ความแปรปรวนของประชากรซึ่งคำนวณ การกระจายตัวสำหรับ ประชากร . ความแตกต่างทั้งหมดลงมาที่ตัวส่วน: แทนที่จะเป็น n-1 เช่น DISP.V() , DISP.G() มีเพียง n ในตัวส่วน ก่อนหน้า MS EXCEL 2010 ฟังก์ชัน VARP() ถูกใช้เพื่อคำนวณความแปรปรวนของประชากร
ความแปรปรวนตัวอย่าง
=SQUARE(ตัวอย่าง)/(COUNT(ตัวอย่าง)-1)
=(SUMSQ(ตัวอย่าง)-COUNT(ตัวอย่าง)*AVERAGE(ตัวอย่าง)^2)/ (COUNT(ตัวอย่าง)-1)- สูตรปกติ
=SUM((ตัวอย่าง -AVERAGE(ตัวอย่าง))^2)/ (COUNT(ตัวอย่าง)-1) –
ความแปรปรวนตัวอย่างมีค่าเท่ากับ 0 ต่อเมื่อค่าทั้งหมดเท่ากันและเท่ากัน ค่ากลาง. โดยปกติแล้ว ยิ่งค่ามากเท่าไหร่ การกระจายตัวยิ่งการแพร่กระจายของค่าในอาร์เรย์มากขึ้น
ความแปรปรวนตัวอย่างเป็น ประมาณการจุด การกระจายตัวการกระจายของตัวแปรสุ่มจากการที่ ตัวอย่าง. เกี่ยวกับอาคาร ช่วงความเชื่อมั่น เมื่อประเมิน การกระจายตัวสามารถอ่านได้ในบทความ
ความแปรปรวนของตัวแปรสุ่ม
ในการคำนวณ การกระจายตัวตัวแปรสุ่ม คุณจำเป็นต้องรู้
สำหรับ การกระจายตัวตัวแปรสุ่ม X มักใช้สัญลักษณ์ Var(X) การกระจายตัวเท่ากับกำลังสองของส่วนเบี่ยงเบนจากค่าเฉลี่ย E(X): Var(X)=E[(X-E(X)) 2 ]
การกระจายตัวคำนวณโดยสูตร:
โดยที่ x i คือค่าที่ตัวแปรสุ่มสามารถรับได้ และ μ คือค่าเฉลี่ย () p(x) คือความน่าจะเป็นที่ตัวแปรสุ่มจะใช้ค่า x
หากตัวแปรสุ่มมี แล้ว การกระจายตัวคำนวณโดยสูตร:
มิติ การกระจายตัวสอดคล้องกับกำลังสองของหน่วยการวัดค่าดั้งเดิม ตัวอย่างเช่น หากค่าในตัวอย่างเป็นการวัดน้ำหนักของชิ้นส่วน (กก.) มิติของความแปรปรวนจะเป็นกก. 2 . ซึ่งอาจตีความได้ยาก ดังนั้น ในการอธิบายลักษณะการกระจายของค่า ค่าเท่ากับ รากที่สองจาก การกระจายตัว – ส่วนเบี่ยงเบนมาตรฐาน.
คุณสมบัติบางอย่าง การกระจายตัว:
Var(X+a)=Var(X) โดยที่ X เป็นตัวแปรสุ่มและ a เป็นค่าคงที่
Var(aХ)=a 2 Var(X)
Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2
คุณสมบัติการกระจายนี้ใช้ใน บทความเกี่ยวกับการถดถอยเชิงเส้น.
Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y) โดยที่ X และ Y อยู่ ตัวแปรสุ่ม, Cov(Х;Y) - ความแปรปรวนร่วมของตัวแปรสุ่มเหล่านี้
หากตัวแปรสุ่มเป็นอิสระ แสดงว่า ความแปรปรวนร่วมคือ 0 และด้วยเหตุนี้ Var(X+Y)=Var(X)+Var(Y) คุณสมบัติของความแปรปรวนนี้ใช้ในเอาต์พุต
ให้เราแสดงให้เห็นว่าสำหรับ ตัวแปรอิสระวาร์(X-Y)=วาร์(X+Y). แน่นอน Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 วาร์(Y)= วาร์(X)+วาร์(Y)= วาร์(X+Y). คุณสมบัติของความแปรปรวนนี้ใช้ในการพล็อต
ตัวอย่างค่าเบี่ยงเบนมาตรฐาน
ตัวอย่างค่าเบี่ยงเบนมาตรฐานเป็นการวัดว่าค่าในกลุ่มตัวอย่างกระจัดกระจายมากเพียงใดเมื่อเทียบกับค่าของพวกเขา
ตามคำจำกัดความ ส่วนเบี่ยงเบนมาตรฐานเท่ากับรากที่สองของ การกระจายตัว:
ส่วนเบี่ยงเบนมาตรฐานไม่คำนึงถึงขนาดของค่าใน การสุ่มตัวอย่างแต่ระดับความกระเจิงของค่ารอบตัวเท่านั้น กลาง. ลองมาดูตัวอย่างเพื่ออธิบายสิ่งนี้
ลองคำนวณค่าเบี่ยงเบนมาตรฐานสำหรับ 2 ตัวอย่าง: (1; 5; 9) และ (1001; 1005; 1009) ในทั้งสองกรณี s=4 เห็นได้ชัดว่าอัตราส่วนของค่าเบี่ยงเบนมาตรฐานต่อค่าของอาร์เรย์นั้นแตกต่างกันอย่างมากสำหรับกลุ่มตัวอย่าง สำหรับกรณีดังกล่าว ให้ใช้ ค่าสัมประสิทธิ์การแปรผัน(ค่าสัมประสิทธิ์การแปรผัน CV) - อัตราส่วน ส่วนเบี่ยงเบนมาตรฐานโดยเฉลี่ย เลขคณิตโดยแสดงเป็นเปอร์เซ็นต์
ใน MS EXCEL 2007 ขึ้นไป รุ่นแรกๆในการคำนวณ ตัวอย่างค่าเบี่ยงเบนมาตรฐานใช้ฟังก์ชัน =STDEV() ภาษาอังกฤษ ชื่อ STDEV คือ ส่วนเบี่ยงเบนมาตรฐาน. ตั้งแต่ MS EXCEL 2010 ขอแนะนำให้ใช้อะนาล็อก = STDEV.B () , eng ชื่อ STDEV.S เช่น ตัวอย่างค่าเบี่ยงเบนมาตรฐาน
นอกจากนี้ เริ่มจากเวอร์ชันของ MS EXCEL 2010 มีฟังก์ชัน STDEV.G () , eng ชื่อ STDEV.P เช่น DEViation มาตรฐานของประชากรซึ่งคำนวณ ส่วนเบี่ยงเบนมาตรฐานสำหรับ ประชากร. ความแตกต่างทั้งหมดลงมาที่ตัวส่วน: แทนที่จะเป็น n-1 เช่น STDEV.V() , STDEV.G() มีเพียง n ในตัวส่วน
ส่วนเบี่ยงเบนมาตรฐานสามารถคำนวณได้โดยตรงจากสูตรด้านล่าง (ดูไฟล์ตัวอย่าง)
=SQRT(SQUADROTIV(ตัวอย่าง)/(COUNT(ตัวอย่าง)-1))
=SQRT((SUMSQ(ตัวอย่าง)-COUNT(ตัวอย่าง)*AVERAGE(ตัวอย่าง)^2)/(COUNT(ตัวอย่าง)-1))
มาตรการกระจายอื่นๆ
ฟังก์ชัน SQUADRIVE() คำนวณด้วย umm ของการเบี่ยงเบนกำลังสองของค่าจากพวกเขา กลาง. ฟังก์ชันนี้จะส่งคืนผลลัพธ์เหมือนกับสูตร =VAR.G( ตัวอย่าง)*ตรวจสอบ( ตัวอย่าง) , ที่ไหน ตัวอย่าง- การอ้างอิงถึงช่วงที่มีอาร์เรย์ของค่าตัวอย่าง () การคำนวณในฟังก์ชัน QUADROTIV() สร้างขึ้นตามสูตร:
ฟังก์ชัน SROOT() ยังเป็นการวัดการกระจายของชุดข้อมูล ฟังก์ชัน AVERAGE() จะคำนวณหาค่าเฉลี่ย ค่าสัมบูรณ์การเบี่ยงเบนจาก กลาง. ฟังก์ชันนี้จะส่งคืนผลลัพธ์เหมือนกับสูตร =SUMPRODUCT(ABS(Sample-AVERAGE(Sample)))/COUNT(Sample), ที่ไหน ตัวอย่าง- การอ้างอิงถึงช่วงที่มีอาร์เรย์ของค่าตัวอย่าง
การคำนวณในฟังก์ชัน SROOTKL () ทำตามสูตร:
สำหรับข้อมูลที่จัดกลุ่ม การกระจายตัวของสารตกค้าง - ค่าเฉลี่ยของ ความแปรปรวนภายในกลุ่ม:โดยที่ σ 2 j คือความแปรปรวนภายในกลุ่มของกลุ่ม j -th
สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม การกระจายตัวของสารตกค้างเป็นการวัดความแม่นยําโดยประมาณ กล่าวคือ การประมาณเส้นการถดถอยกับข้อมูลเดิม:
โดยที่ y(t) คือการคาดการณ์ตามสมการแนวโน้ม y เสื้อ – ชุดเริ่มต้นของไดนามิก; n คือจำนวนคะแนน p คือจำนวนสัมประสิทธิ์ของสมการถดถอย (จำนวนตัวแปรอธิบาย)
ในตัวอย่างนี้เรียกว่า ค่าประมาณความแปรปรวนที่ไม่เอนเอียง.
ตัวอย่าง # 1 การกระจายคนงานของสามองค์กรของหนึ่งสมาคมตามหมวดหมู่ภาษีมีลักษณะตามข้อมูลต่อไปนี้:
หมวดหมู่ค่าจ้างแรงงาน | จำนวนคนงานในสถานประกอบการ | ||
องค์กร 1 | องค์กร 2 | องค์กร 3 | |
1 | 50 | 20 | 40 |
2 | 100 | 80 | 60 |
3 | 150 | 150 | 200 |
4 | 350 | 300 | 400 |
5 | 200 | 150 | 250 |
6 | 150 | 100 | 150 |
กำหนด:
1. การกระจายตัวสำหรับแต่ละองค์กร (การกระจายภายในกลุ่ม);
2. ค่าเฉลี่ยของการกระจายภายในกลุ่ม
3. การกระจายตัวระหว่างกลุ่ม
4. ผลต่างทั้งหมด.
วิธีการแก้.
ก่อนดำเนินการแก้ไขปัญหา คุณจำเป็นต้องค้นหาว่าคุณลักษณะใดมีประสิทธิภาพและคุณลักษณะใดเป็นแฟกทอเรียล ในตัวอย่างที่พิจารณา คุณลักษณะที่มีผลคือ "หมวดหมู่ภาษี" และคุณลักษณะปัจจัยคือ "หมายเลข (ชื่อ) ขององค์กร"
จากนั้นเรามีสามกลุ่ม (องค์กร) ซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยของกลุ่มและความแปรปรวนภายในกลุ่ม:
บริษัท | ค่าเฉลี่ยของกลุ่ม | ความแปรปรวนภายในกลุ่ม |
1 | 4 | 1,8 |
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม ( การกระจายตัวของสารตกค้าง) คำนวณโดยสูตร:
ที่คุณสามารถคำนวณ:
หรือ:
แล้ว:
การกระจายทั้งหมดจะเท่ากับ: s 2 \u003d 1.6 + 0 \u003d 1.6
ค่าความแปรปรวนรวมสามารถคำนวณได้โดยใช้หนึ่งในสองสูตรต่อไปนี้:
เมื่อแก้ปัญหาในทางปฏิบัติ เรามักจะต้องจัดการกับเครื่องหมายที่ใช้ค่าทางเลือกเพียงสองค่าเท่านั้น ในกรณีนี้ พวกเขาไม่ได้พูดถึงน้ำหนักของค่าเฉพาะของจุดสนใจ แต่เกี่ยวกับส่วนแบ่งโดยรวม หากสัดส่วนของหน่วยประชากรที่มีลักษณะภายใต้การศึกษาแสดงด้วย " R"และไม่ครอบครอง - ผ่าน" q” จากนั้นสามารถคำนวณการกระจายโดยสูตร:
s 2 = p×q
ตัวอย่าง # 2 ตามข้อมูลการพัฒนาคนงานหกคนในกองพลน้อย ให้กำหนดความแปรปรวนระหว่างกลุ่มและประเมินผลกระทบของกะการทำงานที่มีต่อผลิตภาพแรงงานของพวกเขา หากความแปรปรวนทั้งหมดเท่ากับ 12.2
จำนวนกองพลทำงาน | ผลงานชิ้น | |
ในกะแรก | ในกะที่ 2 | |
1 | 18 | 13 |
2 | 19 | 14 |
3 | 22 | 15 |
4 | 20 | 17 |
5 | 24 | 16 |
6 | 23 | 15 |
วิธีการแก้. ข้อมูลเบื้องต้น
X | f1 | f2 | ฉ 3 | f4 | f5 | f6 | ทั้งหมด |
1 | 18 | 19 | 22 | 20 | 24 | 23 | 126 |
2 | 13 | 14 | 15 | 17 | 16 | 15 | 90 |
ทั้งหมด | 31 | 33 | 37 | 37 | 40 | 38 |
จากนั้นเรามี 6 กลุ่มซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยของกลุ่มและความแปรปรวนภายในกลุ่ม
1. หาค่าเฉลี่ยของแต่ละกลุ่ม.
2. หาค่าเฉลี่ยกำลังสองของแต่ละกลุ่ม.
เราสรุปผลการคำนวณในตาราง:
หมายเลขกลุ่ม | ค่าเฉลี่ยของกลุ่ม | ความแปรปรวนภายในกลุ่ม |
1 | 1.42 | 0.24 |
2 | 1.42 | 0.24 |
3 | 1.41 | 0.24 |
4 | 1.46 | 0.25 |
5 | 1.4 | 0.24 |
6 | 1.39 | 0.24 |
3. ความแปรปรวนภายในกลุ่มกำหนดลักษณะการเปลี่ยนแปลง (การเปลี่ยนแปลง) ของลักษณะที่ศึกษา (ผลลัพธ์) ภายในกลุ่มภายใต้อิทธิพลของปัจจัยทั้งหมด ยกเว้นปัจจัยที่อยู่ภายใต้การจัดกลุ่ม:
เราคำนวณค่าเฉลี่ยของการกระจายภายในกลุ่มโดยใช้สูตร:
4. ความแปรปรวนระหว่างกลุ่มแสดงลักษณะการเปลี่ยนแปลง (ความแปรผัน) ของลักษณะที่ศึกษา (ผลลัพธ์) ภายใต้อิทธิพลของปัจจัย (ลักษณะแฟกทอเรียล) ที่อยู่ภายใต้การจัดกลุ่ม
การกระจายตัวระหว่างกลุ่มถูกกำหนดเป็น:
ที่ไหน
แล้ว
ผลต่างทั้งหมดแสดงลักษณะการเปลี่ยนแปลง (การเปลี่ยนแปลง) ของลักษณะที่ศึกษา (ผลลัพธ์) ภายใต้อิทธิพลของปัจจัยทั้งหมด (ลักษณะแฟกทอเรียล) โดยไม่มีข้อยกเว้น โดยเงื่อนไขของปัญหาจะเท่ากับ 12.2
ความสัมพันธ์เชิงประจักษ์วัดว่าความผันผวนทั้งหมดของแอตทริบิวต์ที่เป็นผลลัพธ์นั้นเกิดจากปัจจัยที่ศึกษามากเพียงใด นี่คืออัตราส่วนของความแปรปรวนแฟกทอเรียลต่อความแปรปรวนทั้งหมด:
เรากำหนดความสัมพันธ์เชิงประจักษ์:
ความสัมพันธ์ระหว่างจุดสนใจอาจอ่อนแอหรือแข็งแกร่ง (ใกล้เคียง) เกณฑ์ของพวกเขาได้รับการประเมินในระดับแชดด็อค:
0.1 0.3 0.5 0.7 0.9 ในตัวอย่างของเรา ความสัมพันธ์ระหว่างคุณลักษณะ Y ปัจจัย X นั้นอ่อนแอ
สัมประสิทธิ์ความมุ่งมั่น
มากำหนดสัมประสิทธิ์ของการกำหนด:
ดังนั้น 0.67% ของความผันแปรเกิดจากความแตกต่างระหว่างคุณลักษณะ และ 99.37% เกิดจากปัจจัยอื่นๆ
บทสรุป: ใน กรณีนี้การพัฒนาคนทำงานไม่ได้ขึ้นอยู่กับการทำงานเป็นกะเฉพาะ กล่าวคือ อิทธิพลของกะการทำงานที่มีต่อผลิตภาพแรงงานไม่มีนัยสำคัญและเกิดจากปัจจัยอื่นๆ
ตัวอย่าง #3 อิงจากค่าเฉลี่ย ค่าจ้างและค่าเบี่ยงเบนยกกำลังสองจากค่าของมันสำหรับคนทำงานสองกลุ่ม ให้หาค่าความแปรปรวนทั้งหมดโดยใช้กฎสำหรับการบวกความแปรปรวน:
วิธีการแก้:ค่าเฉลี่ยของผลต่างภายในกลุ่ม
การกระจายตัวระหว่างกลุ่มถูกกำหนดเป็น:
ความแปรปรวนทั้งหมดจะเป็น: 480 + 13824 = 14304
ในบรรดาตัวชี้วัดจำนวนมากที่ใช้ในสถิติ จำเป็นต้องเน้นการคำนวณความแปรปรวน ควรสังเกตว่าการคำนวณด้วยตนเองเป็นงานที่ค่อนข้างน่าเบื่อ โชคดีที่มีฟังก์ชันใน Excel ที่ช่วยให้ขั้นตอนการคำนวณเป็นไปโดยอัตโนมัติ มาดูอัลกอริทึมสำหรับการทำงานกับเครื่องมือเหล่านี้กัน
ความแปรปรวนคือการวัดความแปรผัน ซึ่งเป็นค่ากำลังสองเฉลี่ยของส่วนเบี่ยงเบนจาก ความคาดหวังทางคณิตศาสตร์. ดังนั้นจึงแสดงการแพร่กระจายของตัวเลขเกี่ยวกับค่าเฉลี่ย การคำนวณการกระจายสามารถทำได้ทั้งสำหรับประชากรทั่วไปและสำหรับกลุ่มตัวอย่าง
วิธีที่ 1: การคำนวณประชากรทั่วไป
ในการคำนวณตัวบ่งชี้นี้ใน Excel สำหรับประชากรทั่วไป ฟังก์ชันจะใช้ DISP.G. ไวยากรณ์สำหรับนิพจน์นี้มีดังต่อไปนี้:
DISP.G(หมายเลข1;หมายเลข2;…)
โดยรวมแล้ว สามารถใช้อาร์กิวเมนต์ได้ตั้งแต่ 1 ถึง 255 รายการ อาร์กิวเมนต์สามารถ ค่าตัวเลขตลอดจนการอ้างอิงถึงเซลล์ที่มีอยู่
เรามาดูวิธีการคำนวณค่านี้สำหรับช่วงข้อมูลตัวเลขกัน
วิธีที่ 2: การคำนวณตัวอย่าง
ตรงกันข้ามกับการคำนวณค่าสำหรับประชากรทั่วไป ในการคำนวณตัวอย่าง ตัวส่วนจะไม่ถูกระบุ ทั้งหมดตัวเลข แต่น้อยกว่าหนึ่ง สิ่งนี้ทำเพื่อแก้ไขข้อผิดพลาด Excel คำนึงถึงความแตกต่างนี้ในฟังก์ชันพิเศษที่ออกแบบมาสำหรับการคำนวณประเภทนี้ - DISP.V ไวยากรณ์ของมันถูกแสดงโดยสูตรต่อไปนี้:
VAR.B(นัมเบอร์1;นัมเบอร์2;…)
จำนวนอาร์กิวเมนต์ เช่นเดียวกับในฟังก์ชันก่อนหน้า ยังสามารถอยู่ในช่วงตั้งแต่ 1 ถึง 255
อย่างที่คุณเห็น โปรแกรม Excel สามารถอำนวยความสะดวกในการคำนวณความแปรปรวนได้อย่างมาก นี้ สถิติสามารถคำนวณได้โดยแอปพลิเคชัน ทั้งสำหรับประชากรทั่วไปและสำหรับกลุ่มตัวอย่าง ในกรณีนี้ การกระทำของผู้ใช้ทั้งหมดจะลดลงเหลือเพียงการระบุช่วงของตัวเลขที่จะประมวลผล และ Excel จะทำงานหลักเอง แน่นอนว่าวิธีนี้จะช่วยประหยัดเวลาของผู้ใช้ได้มาก