ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

สูตรความแปรปรวนเฉลี่ย ตัวบ่งชี้การเปลี่ยนแปลง: แนวคิด ประเภท สูตรสำหรับการคำนวณ

ตัวบ่งชี้ทั่วไปหลักของการเปลี่ยนแปลงในสถิติคือความแปรปรวนและค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน.

การกระจายตัว มัน เลขคณิต ส่วนเบี่ยงเบนกำลังสองของค่าคุณลักษณะแต่ละค่าจากค่าเฉลี่ยทั้งหมด ความแปรปรวนมักจะเรียกว่ากำลังสองเฉลี่ยของส่วนเบี่ยงเบนและแสดงแทน  2 . ขึ้นอยู่กับข้อมูลเริ่มต้น ความแปรปรวนสามารถคำนวณได้จากค่าเฉลี่ยเลขคณิต แบบง่าย หรือแบบถ่วงน้ำหนัก:

 การกระจายตัวแบบไม่ถ่วงน้ำหนัก (แบบง่าย)

 ความแปรปรวนถ่วงน้ำหนัก

ส่วนเบี่ยงเบนมาตรฐาน เป็นลักษณะทั่วไปของมิติสัมบูรณ์ รูปแบบต่างๆ ลักษณะโดยรวม มันถูกแสดงในหน่วยเดียวกับเครื่องหมาย (เป็นเมตร, ตัน, เปอร์เซ็นต์, เฮกตาร์, ฯลฯ )

ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนและเขียนแทนด้วย :

 ส่วนเบี่ยงเบนมาตรฐานไม่ถ่วงน้ำหนัก

 ค่าเบี่ยงเบนมาตรฐานถ่วงน้ำหนัก

ค่าเบี่ยงเบนมาตรฐานเป็นตัววัดความน่าเชื่อถือของค่าเฉลี่ย ยิ่งค่าเบี่ยงเบนมาตรฐานน้อยกว่า ค่าเฉลี่ยเลขคณิตจะสะท้อนประชากรทั้งหมดได้ดีกว่า

การคำนวณค่าเบี่ยงเบนมาตรฐานนำหน้าด้วยการคำนวณค่าความแปรปรวน

ขั้นตอนการคำนวณความแปรปรวนถ่วงน้ำหนักมีดังนี้:

1) กำหนดค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:

2) คำนวณค่าเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย:

3) ยกกำลังส่วนเบี่ยงเบนของแต่ละตัวเลือกจากค่าเฉลี่ย:

4) คูณค่าเบี่ยงเบนกำลังสองด้วยน้ำหนัก (ความถี่):

5) สรุปผลงานที่ได้รับ:

6) จำนวนผลลัพธ์หารด้วยผลรวมของน้ำหนัก:

ตัวอย่าง 2.1

คำนวณค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:

ค่าเบี่ยงเบนจากค่าเฉลี่ยและกำลังสองแสดงในตาราง มานิยามความแปรปรวนกัน:

ส่วนเบี่ยงเบนมาตรฐานจะเท่ากับ:

หากข้อมูลต้นทางถูกนำเสนอเป็นช่วงเวลา ชุดจำหน่าย จากนั้นคุณต้องกำหนดค่าที่ไม่ต่อเนื่องของคุณลักษณะ จากนั้นใช้วิธีที่อธิบายไว้

ตัวอย่าง 2.2

ให้เราแสดงการคำนวณความแปรปรวนสำหรับชุดช่วงเวลาเกี่ยวกับข้อมูลเกี่ยวกับการกระจายพื้นที่หว่านของฟาร์มส่วนรวมด้วยผลผลิตข้าวสาลี

ค่าเฉลี่ยเลขคณิตคือ:

ลองคำนวณความแปรปรวน:

6.3. การคำนวณการกระจายตามสูตรสำหรับข้อมูลแต่ละส่วน

เทคนิคการคำนวณ การกระจายตัว ซับซ้อนและ คุณค่ามหาศาลตัวเลือกและความถี่อาจยุ่งยาก การคำนวณสามารถทำให้ง่ายขึ้นได้โดยใช้คุณสมบัติการกระจาย

การกระจายมีคุณสมบัติดังต่อไปนี้

1. การลดลงหรือเพิ่มขึ้นในน้ำหนัก (ความถี่) ของคุณลักษณะตัวแปรตามจำนวนครั้งที่กำหนดจะไม่เปลี่ยนการกระจาย

2. ลดหรือเพิ่มค่าคุณลักษณะแต่ละค่าด้วยค่าคงที่เท่ากัน แต่การกระจายตัวไม่เปลี่ยนแปลง

3. ลดหรือเพิ่มค่าคุณสมบัติแต่ละค่าตามจำนวนครั้งที่กำหนด kลดหรือเพิ่มความแปรปรวนตามลำดับใน k 2 ครั้ง ส่วนเบี่ยงเบนมาตรฐาน  ใน kครั้งหนึ่ง.

4. ความแปรปรวนของจุดสนใจที่สัมพันธ์กับค่าที่กำหนดเองมักจะมากกว่าความแปรปรวนที่สัมพันธ์กับค่าเฉลี่ยเลขคณิตด้วยกำลังสองของผลต่างระหว่างค่าเฉลี่ยและค่าที่กำหนดเอง:

ถ้า แต่ 0 แล้วเราก็มาถึงความเท่าเทียมกันดังต่อไปนี้:

กล่าวคือ ความแปรปรวนของจุดสนใจเท่ากับผลต่างระหว่างค่าเฉลี่ยกำลังสองของค่าคุณลักษณะและกำลังสองของค่าเฉลี่ย

แต่ละคุณสมบัติสามารถใช้เดี่ยวๆ หรือใช้ร่วมกับคุณสมบัติอื่นๆ เมื่อคำนวณความแปรปรวน

ขั้นตอนการคำนวณความแปรปรวนนั้นง่าย:

1) กำหนด เลขคณิต :

2) ยกกำลังสองค่าเฉลี่ยเลขคณิต:

3) ยกกำลังส่วนเบี่ยงเบนของแต่ละตัวแปรในซีรีส์:

X ผม 2 .

4) ค้นหาผลรวมของตัวเลือกกำลังสอง:

5) หารผลรวมของกำลังสองของตัวเลือกด้วยจำนวนของมัน เช่น กำหนด จตุรัสกลาง:

6) กำหนดความแตกต่างระหว่างกำลังสองเฉลี่ยของจุดสนใจและกำลังสองของค่าเฉลี่ย:

ตัวอย่าง 3.1เรามีข้อมูลต่อไปนี้เกี่ยวกับประสิทธิภาพการทำงานของพนักงาน:

มาทำการคำนวณต่อไปนี้:

หน้านี้อธิบาย ตัวอย่างมาตรฐานการหาความแปรปรวน คุณยังสามารถดูงานอื่นเพื่อค้นหามัน

ตัวอย่างที่ 1 การหากลุ่ม ค่าเฉลี่ยของกลุ่ม ระหว่างกลุ่มและความแปรปรวนทั้งหมด

ตัวอย่างที่ 2 การหาความแปรปรวนและสัมประสิทธิ์การแปรผันในตารางการจัดกลุ่ม

ตัวอย่างที่ 3 การหาความแปรปรวนใน ซีรีส์ไม่ต่อเนื่อง

ตัวอย่างที่ 4 เรามีข้อมูลต่อไปนี้สำหรับกลุ่มนักเรียน 20 คน แผนกจดหมาย. ต้องสร้าง อนุกรมช่วงเวลาการกระจายของคุณลักษณะ คำนวณค่าเฉลี่ยของคุณลักษณะ และศึกษาความแปรปรวนของมัน

มาสร้างกันเถอะ การจัดกลุ่มตามช่วงเวลา. ลองกำหนดช่วงของช่วงเวลาโดยใช้สูตร:

โดยที่ X สูงสุด– มูลค่าสูงสุดเครื่องหมายการจัดกลุ่ม
X min คือค่าต่ำสุดของคุณลักษณะการจัดกลุ่ม
n คือจำนวนช่วง:

เรายอมรับ n=5 ขั้นตอนคือ: h \u003d (192 - 159) / 5 \u003d 6.6

มาทำการจัดกลุ่มตามช่วงเวลากันเถอะ

สำหรับการคำนวณเพิ่มเติม เราจะสร้างตารางเสริม:

X "i - ตรงกลางของช่วง (เช่น ตรงกลางของช่วง 159 - 165.6 \u003d 162.3)

ค่าเฉลี่ยการเติบโตของนักเรียนถูกกำหนดโดยสูตรของค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:

เรากำหนดการกระจายตัวตามสูตร:

สามารถแปลงสูตรได้ดังนี้

จากสูตรนี้ ได้ดังนี้ ความแปรปรวนคือ ความแตกต่างระหว่างค่าเฉลี่ยของกำลังสองของตัวเลือกกับค่ากำลังสองและค่าเฉลี่ย

ความแปรปรวนในอนุกรมผันแปรกับ ในช่วงเวลาเท่ากันโดยวิธีโมเมนต์คำนวณได้ ด้วยวิธีต่อไปนี้เมื่อใช้คุณสมบัติที่สองของความแปรปรวน (หารตัวเลือกทั้งหมดด้วยค่าของช่วงเวลา) ความหมายของความแปรปรวนคำนวณโดยวิธีช่วงเวลาตามสูตรต่อไปนี้ใช้เวลาน้อยลง:

โดยที่ i คือค่าของช่วงเวลา
A เป็นศูนย์แบบมีเงื่อนไข ซึ่งสะดวกที่จะใช้ตรงกลางของช่วงที่มี ความถี่สูงสุด;
m1 คือกำลังสองของโมเมนต์ลำดับแรก
m2 - โมเมนต์ของคำสั่งที่สอง

ความแปรปรวนของคุณสมบัติ (หากในประชากรทางสถิติ คุณลักษณะเปลี่ยนแปลงในลักษณะที่มีเพียงสองตัวเลือกที่ไม่เกิดร่วมกัน ความแปรปรวนดังกล่าวเรียกว่าทางเลือก) สามารถคำนวณได้โดยสูตร:

แทนที่ใน สูตรนี้การกระจายตัว q \u003d 1- p เราได้รับ:

ประเภทของการกระจายตัว

ผลต่างทั้งหมดวัดความแปรผันของลักษณะเฉพาะของประชากรทั้งหมดโดยรวมภายใต้อิทธิพลของปัจจัยทั้งหมดที่ก่อให้เกิดการเปลี่ยนแปลงนี้ เท่ากับค่าเฉลี่ยกำลังสองของส่วนเบี่ยงเบน ค่าส่วนบุคคลคุณลักษณะ x ของค่าเฉลี่ยโดยรวมของ x และสามารถกำหนดเป็นความแปรปรวนอย่างง่ายหรือความแปรปรวนแบบถ่วงน้ำหนักได้

ความแปรปรวนภายในกลุ่ม กำหนดลักษณะการแปรผันแบบสุ่ม กล่าวคือ ส่วนหนึ่งของความผันแปร ซึ่งเกิดจากอิทธิพลของปัจจัยที่ไม่คำนึงถึงและไม่ขึ้นอยู่กับปัจจัยเครื่องหมายที่อยู่ภายใต้การจัดกลุ่ม ความแปรปรวนนี้เท่ากับกำลังสองเฉลี่ยของการเบี่ยงเบนของค่าแต่ละค่าของแอตทริบิวต์ภายในกลุ่ม X จากค่าเฉลี่ยเลขคณิตของกลุ่มและสามารถคำนวณเป็นค่าความแปรปรวนอย่างง่ายหรือค่าความแปรปรวนแบบถ่วงน้ำหนัก



ทางนี้, การวัดความแปรปรวนภายในกลุ่มการเปลี่ยนแปลงของคุณลักษณะภายในกลุ่มและกำหนดโดยสูตร:

โดยที่ xi - ค่าเฉลี่ยกลุ่ม
ni คือจำนวนหน่วยในกลุ่ม

ตัวอย่างเช่น ความแปรปรวนภายในกลุ่มที่ต้องพิจารณาในงานศึกษาผลกระทบของคุณสมบัติของคนงานต่อระดับผลิตภาพแรงงานในร้านค้า แสดงความผันแปรของผลผลิตในแต่ละกลุ่มที่เกิดจากปัจจัยที่เป็นไปได้ทั้งหมด (สภาพทางเทคนิคของอุปกรณ์ ความพร้อมใช้งานของเครื่องมือและวัสดุ อายุของคนงาน ความเข้มข้นของแรงงาน ฯลฯ . ) ยกเว้นความแตกต่างในประเภทคุณสมบัติ (ภายในกลุ่ม พนักงานทุกคนมีคุณสมบัติเหมือนกัน)

มาคำนวณกันนางสาวEXCELการกระจายตัวและ ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง นอกจากนี้เรายังคำนวณความแปรปรวนของตัวแปรสุ่มหากทราบการแจกแจง

พิจารณาก่อน การกระจายตัว, แล้ว ส่วนเบี่ยงเบนมาตรฐาน.

ความแปรปรวนตัวอย่าง

ความแปรปรวนตัวอย่าง (ความแปรปรวนตัวอย่างตัวอย่างความแปรปรวน) แสดงลักษณะการกระจายของค่าในอาร์เรย์ที่สัมพันธ์กับ

ทั้ง 3 สูตรเทียบเท่าทางคณิตศาสตร์

จะเห็นได้จากสูตรแรกว่า ความแปรปรวนตัวอย่างคือผลรวมของค่าเบี่ยงเบนกำลังสองของแต่ละค่าในอาร์เรย์ จากค่าเฉลี่ยหารด้วยขนาดกลุ่มตัวอย่างลบ 1

การกระจายตัว ตัวอย่างใช้ฟังก์ชัน DISP() ENG ชื่อของ VAR คือ ความแปรปรวน ตั้งแต่ MS EXCEL 2010 ขอแนะนำให้ใช้อะนาล็อก DISP.V() , eng ชื่อ VARS คือ ตัวอย่างความแปรปรวน นอกจากนี้ เริ่มจากเวอร์ชันของ MS EXCEL 2010 มีฟังก์ชัน DISP.G () eng ชื่อ VARP กล่าวคือ ความแปรปรวนของประชากรซึ่งคำนวณ การกระจายตัวสำหรับ ประชากร . ความแตกต่างทั้งหมดลงมาที่ตัวส่วน: แทนที่จะเป็น n-1 เช่น DISP.V() , DISP.G() มีเพียง n ในตัวส่วน ก่อนหน้า MS EXCEL 2010 ฟังก์ชัน VARP() ถูกใช้เพื่อคำนวณความแปรปรวนของประชากร

ความแปรปรวนตัวอย่าง
=SQUARE(ตัวอย่าง)/(COUNT(ตัวอย่าง)-1)
=(SUMSQ(ตัวอย่าง)-COUNT(ตัวอย่าง)*AVERAGE(ตัวอย่าง)^2)/ (COUNT(ตัวอย่าง)-1)- สูตรปกติ
=SUM((ตัวอย่าง -AVERAGE(ตัวอย่าง))^2)/ (COUNT(ตัวอย่าง)-1) –

ความแปรปรวนตัวอย่างมีค่าเท่ากับ 0 ต่อเมื่อค่าทั้งหมดเท่ากันและเท่ากัน ค่ากลาง. โดยปกติแล้ว ยิ่งค่ามากเท่าไหร่ การกระจายตัวยิ่งการแพร่กระจายของค่าในอาร์เรย์มากขึ้น

ความแปรปรวนตัวอย่างเป็น ประมาณการจุด การกระจายตัวการกระจายของตัวแปรสุ่มจากการที่ ตัวอย่าง. เกี่ยวกับอาคาร ช่วงความเชื่อมั่น เมื่อประเมิน การกระจายตัวสามารถอ่านได้ในบทความ

ความแปรปรวนของตัวแปรสุ่ม

ในการคำนวณ การกระจายตัวตัวแปรสุ่ม คุณจำเป็นต้องรู้

สำหรับ การกระจายตัวตัวแปรสุ่ม X มักใช้สัญลักษณ์ Var(X) การกระจายตัวเท่ากับกำลังสองของส่วนเบี่ยงเบนจากค่าเฉลี่ย E(X): Var(X)=E[(X-E(X)) 2 ]

การกระจายตัวคำนวณโดยสูตร:

โดยที่ x i คือค่าที่ตัวแปรสุ่มสามารถรับได้ และ μ คือค่าเฉลี่ย () p(x) คือความน่าจะเป็นที่ตัวแปรสุ่มจะใช้ค่า x

หากตัวแปรสุ่มมี แล้ว การกระจายตัวคำนวณโดยสูตร:

มิติ การกระจายตัวสอดคล้องกับกำลังสองของหน่วยการวัดค่าดั้งเดิม ตัวอย่างเช่น หากค่าในตัวอย่างเป็นการวัดน้ำหนักของชิ้นส่วน (กก.) มิติของความแปรปรวนจะเป็นกก. 2 . ซึ่งอาจตีความได้ยาก ดังนั้น ในการอธิบายลักษณะการกระจายของค่า ค่าเท่ากับ รากที่สองจาก การกระจายตัวส่วนเบี่ยงเบนมาตรฐาน.

คุณสมบัติบางอย่าง การกระจายตัว:

Var(X+a)=Var(X) โดยที่ X เป็นตัวแปรสุ่มและ a เป็นค่าคงที่

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

คุณสมบัติการกระจายนี้ใช้ใน บทความเกี่ยวกับการถดถอยเชิงเส้น.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y) โดยที่ X และ Y อยู่ ตัวแปรสุ่ม, Cov(Х;Y) - ความแปรปรวนร่วมของตัวแปรสุ่มเหล่านี้

หากตัวแปรสุ่มเป็นอิสระ แสดงว่า ความแปรปรวนร่วมคือ 0 และด้วยเหตุนี้ Var(X+Y)=Var(X)+Var(Y) คุณสมบัติของความแปรปรวนนี้ใช้ในเอาต์พุต

ให้เราแสดงให้เห็นว่าสำหรับ ตัวแปรอิสระวาร์(X-Y)=วาร์(X+Y). แน่นอน Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 วาร์(Y)= วาร์(X)+วาร์(Y)= วาร์(X+Y). คุณสมบัติของความแปรปรวนนี้ใช้ในการพล็อต

ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

ตัวอย่างค่าเบี่ยงเบนมาตรฐานเป็นการวัดว่าค่าในกลุ่มตัวอย่างกระจัดกระจายมากเพียงใดเมื่อเทียบกับค่าของพวกเขา

ตามคำจำกัดความ ส่วนเบี่ยงเบนมาตรฐานเท่ากับรากที่สองของ การกระจายตัว:

ส่วนเบี่ยงเบนมาตรฐานไม่คำนึงถึงขนาดของค่าใน การสุ่มตัวอย่างแต่ระดับความกระเจิงของค่ารอบตัวเท่านั้น กลาง. ลองมาดูตัวอย่างเพื่ออธิบายสิ่งนี้

ลองคำนวณค่าเบี่ยงเบนมาตรฐานสำหรับ 2 ตัวอย่าง: (1; 5; 9) และ (1001; 1005; 1009) ในทั้งสองกรณี s=4 เห็นได้ชัดว่าอัตราส่วนของค่าเบี่ยงเบนมาตรฐานต่อค่าของอาร์เรย์นั้นแตกต่างกันอย่างมากสำหรับกลุ่มตัวอย่าง สำหรับกรณีดังกล่าว ให้ใช้ ค่าสัมประสิทธิ์การแปรผัน(ค่าสัมประสิทธิ์การแปรผัน CV) - อัตราส่วน ส่วนเบี่ยงเบนมาตรฐานโดยเฉลี่ย เลขคณิตโดยแสดงเป็นเปอร์เซ็นต์

ใน MS EXCEL 2007 ขึ้นไป รุ่นแรกๆในการคำนวณ ตัวอย่างค่าเบี่ยงเบนมาตรฐานใช้ฟังก์ชัน =STDEV() ภาษาอังกฤษ ชื่อ STDEV คือ ส่วนเบี่ยงเบนมาตรฐาน. ตั้งแต่ MS EXCEL 2010 ขอแนะนำให้ใช้อะนาล็อก = STDEV.B () , eng ชื่อ STDEV.S เช่น ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

นอกจากนี้ เริ่มจากเวอร์ชันของ MS EXCEL 2010 มีฟังก์ชัน STDEV.G () , eng ชื่อ STDEV.P เช่น DEViation มาตรฐานของประชากรซึ่งคำนวณ ส่วนเบี่ยงเบนมาตรฐานสำหรับ ประชากร. ความแตกต่างทั้งหมดลงมาที่ตัวส่วน: แทนที่จะเป็น n-1 เช่น STDEV.V() , STDEV.G() มีเพียง n ในตัวส่วน

ส่วนเบี่ยงเบนมาตรฐานสามารถคำนวณได้โดยตรงจากสูตรด้านล่าง (ดูไฟล์ตัวอย่าง)
=SQRT(SQUADROTIV(ตัวอย่าง)/(COUNT(ตัวอย่าง)-1))
=SQRT((SUMSQ(ตัวอย่าง)-COUNT(ตัวอย่าง)*AVERAGE(ตัวอย่าง)^2)/(COUNT(ตัวอย่าง)-1))

มาตรการกระจายอื่นๆ

ฟังก์ชัน SQUADRIVE() คำนวณด้วย umm ของการเบี่ยงเบนกำลังสองของค่าจากพวกเขา กลาง. ฟังก์ชันนี้จะส่งคืนผลลัพธ์เหมือนกับสูตร =VAR.G( ตัวอย่าง)*ตรวจสอบ( ตัวอย่าง) , ที่ไหน ตัวอย่าง- การอ้างอิงถึงช่วงที่มีอาร์เรย์ของค่าตัวอย่าง () การคำนวณในฟังก์ชัน QUADROTIV() สร้างขึ้นตามสูตร:

ฟังก์ชัน SROOT() ยังเป็นการวัดการกระจายของชุดข้อมูล ฟังก์ชัน AVERAGE() จะคำนวณหาค่าเฉลี่ย ค่าสัมบูรณ์การเบี่ยงเบนจาก กลาง. ฟังก์ชันนี้จะส่งคืนผลลัพธ์เหมือนกับสูตร =SUMPRODUCT(ABS(Sample-AVERAGE(Sample)))/COUNT(Sample), ที่ไหน ตัวอย่าง- การอ้างอิงถึงช่วงที่มีอาร์เรย์ของค่าตัวอย่าง

การคำนวณในฟังก์ชัน SROOTKL () ทำตามสูตร:

สำหรับข้อมูลที่จัดกลุ่ม การกระจายตัวของสารตกค้าง - ค่าเฉลี่ยของ ความแปรปรวนภายในกลุ่ม:

โดยที่ σ 2 j คือความแปรปรวนภายในกลุ่มของกลุ่ม j -th

สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม การกระจายตัวของสารตกค้างเป็นการวัดความแม่นยําโดยประมาณ กล่าวคือ การประมาณเส้นการถดถอยกับข้อมูลเดิม:
โดยที่ y(t) คือการคาดการณ์ตามสมการแนวโน้ม y เสื้อ – ชุดเริ่มต้นของไดนามิก; n คือจำนวนคะแนน p คือจำนวนสัมประสิทธิ์ของสมการถดถอย (จำนวนตัวแปรอธิบาย)
ในตัวอย่างนี้เรียกว่า ค่าประมาณความแปรปรวนที่ไม่เอนเอียง.

ตัวอย่าง # 1 การกระจายคนงานของสามองค์กรของหนึ่งสมาคมตามหมวดหมู่ภาษีมีลักษณะตามข้อมูลต่อไปนี้:

หมวดหมู่ค่าจ้างแรงงานจำนวนคนงานในสถานประกอบการ
องค์กร 1องค์กร 2องค์กร 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

กำหนด:
1. การกระจายตัวสำหรับแต่ละองค์กร (การกระจายภายในกลุ่ม);
2. ค่าเฉลี่ยของการกระจายภายในกลุ่ม
3. การกระจายตัวระหว่างกลุ่ม
4. ผลต่างทั้งหมด.

วิธีการแก้.
ก่อนดำเนินการแก้ไขปัญหา คุณจำเป็นต้องค้นหาว่าคุณลักษณะใดมีประสิทธิภาพและคุณลักษณะใดเป็นแฟกทอเรียล ในตัวอย่างที่พิจารณา คุณลักษณะที่มีผลคือ "หมวดหมู่ภาษี" และคุณลักษณะปัจจัยคือ "หมายเลข (ชื่อ) ขององค์กร"
จากนั้นเรามีสามกลุ่ม (องค์กร) ซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยของกลุ่มและความแปรปรวนภายในกลุ่ม:


บริษัทค่าเฉลี่ยของกลุ่มความแปรปรวนภายในกลุ่ม
1 4 1,8

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม ( การกระจายตัวของสารตกค้าง) คำนวณโดยสูตร:


ที่คุณสามารถคำนวณ:
หรือ:


แล้ว:
การกระจายทั้งหมดจะเท่ากับ: s 2 \u003d 1.6 + 0 \u003d 1.6
ค่าความแปรปรวนรวมสามารถคำนวณได้โดยใช้หนึ่งในสองสูตรต่อไปนี้:

เมื่อแก้ปัญหาในทางปฏิบัติ เรามักจะต้องจัดการกับเครื่องหมายที่ใช้ค่าทางเลือกเพียงสองค่าเท่านั้น ในกรณีนี้ พวกเขาไม่ได้พูดถึงน้ำหนักของค่าเฉพาะของจุดสนใจ แต่เกี่ยวกับส่วนแบ่งโดยรวม หากสัดส่วนของหน่วยประชากรที่มีลักษณะภายใต้การศึกษาแสดงด้วย " R"และไม่ครอบครอง - ผ่าน" q” จากนั้นสามารถคำนวณการกระจายโดยสูตร:
s 2 = p×q

ตัวอย่าง # 2 ตามข้อมูลการพัฒนาคนงานหกคนในกองพลน้อย ให้กำหนดความแปรปรวนระหว่างกลุ่มและประเมินผลกระทบของกะการทำงานที่มีต่อผลิตภาพแรงงานของพวกเขา หากความแปรปรวนทั้งหมดเท่ากับ 12.2

จำนวนกองพลทำงานผลงานชิ้น
ในกะแรกในกะที่ 2
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

วิธีการแก้. ข้อมูลเบื้องต้น

Xf1f2ฉ 3f4f5f6ทั้งหมด
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
ทั้งหมด 31 33 37 37 40 38

จากนั้นเรามี 6 กลุ่มซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยของกลุ่มและความแปรปรวนภายในกลุ่ม
1. หาค่าเฉลี่ยของแต่ละกลุ่ม.







2. หาค่าเฉลี่ยกำลังสองของแต่ละกลุ่ม.







เราสรุปผลการคำนวณในตาราง:
หมายเลขกลุ่มค่าเฉลี่ยของกลุ่มความแปรปรวนภายในกลุ่ม
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. ความแปรปรวนภายในกลุ่มกำหนดลักษณะการเปลี่ยนแปลง (การเปลี่ยนแปลง) ของลักษณะที่ศึกษา (ผลลัพธ์) ภายในกลุ่มภายใต้อิทธิพลของปัจจัยทั้งหมด ยกเว้นปัจจัยที่อยู่ภายใต้การจัดกลุ่ม:
เราคำนวณค่าเฉลี่ยของการกระจายภายในกลุ่มโดยใช้สูตร:


4. ความแปรปรวนระหว่างกลุ่มแสดงลักษณะการเปลี่ยนแปลง (ความแปรผัน) ของลักษณะที่ศึกษา (ผลลัพธ์) ภายใต้อิทธิพลของปัจจัย (ลักษณะแฟกทอเรียล) ที่อยู่ภายใต้การจัดกลุ่ม
การกระจายตัวระหว่างกลุ่มถูกกำหนดเป็น:

ที่ไหน


แล้ว

ผลต่างทั้งหมดแสดงลักษณะการเปลี่ยนแปลง (การเปลี่ยนแปลง) ของลักษณะที่ศึกษา (ผลลัพธ์) ภายใต้อิทธิพลของปัจจัยทั้งหมด (ลักษณะแฟกทอเรียล) โดยไม่มีข้อยกเว้น โดยเงื่อนไขของปัญหาจะเท่ากับ 12.2
ความสัมพันธ์เชิงประจักษ์วัดว่าความผันผวนทั้งหมดของแอตทริบิวต์ที่เป็นผลลัพธ์นั้นเกิดจากปัจจัยที่ศึกษามากเพียงใด นี่คืออัตราส่วนของความแปรปรวนแฟกทอเรียลต่อความแปรปรวนทั้งหมด:

เรากำหนดความสัมพันธ์เชิงประจักษ์:

ความสัมพันธ์ระหว่างจุดสนใจอาจอ่อนแอหรือแข็งแกร่ง (ใกล้เคียง) เกณฑ์ของพวกเขาได้รับการประเมินในระดับแชดด็อค:
0.1 0.3 0.5 0.7 0.9 ในตัวอย่างของเรา ความสัมพันธ์ระหว่างคุณลักษณะ Y ปัจจัย X นั้นอ่อนแอ
สัมประสิทธิ์ความมุ่งมั่น

มากำหนดสัมประสิทธิ์ของการกำหนด:

ดังนั้น 0.67% ของความผันแปรเกิดจากความแตกต่างระหว่างคุณลักษณะ และ 99.37% เกิดจากปัจจัยอื่นๆ
บทสรุป: ใน กรณีนี้การพัฒนาคนทำงานไม่ได้ขึ้นอยู่กับการทำงานเป็นกะเฉพาะ กล่าวคือ อิทธิพลของกะการทำงานที่มีต่อผลิตภาพแรงงานไม่มีนัยสำคัญและเกิดจากปัจจัยอื่นๆ

ตัวอย่าง #3 อิงจากค่าเฉลี่ย ค่าจ้างและค่าเบี่ยงเบนยกกำลังสองจากค่าของมันสำหรับคนทำงานสองกลุ่ม ให้หาค่าความแปรปรวนทั้งหมดโดยใช้กฎสำหรับการบวกความแปรปรวน:

วิธีการแก้:
ค่าเฉลี่ยของผลต่างภายในกลุ่ม

การกระจายตัวระหว่างกลุ่มถูกกำหนดเป็น:


ความแปรปรวนทั้งหมดจะเป็น: 480 + 13824 = 14304

ในบรรดาตัวชี้วัดจำนวนมากที่ใช้ในสถิติ จำเป็นต้องเน้นการคำนวณความแปรปรวน ควรสังเกตว่าการคำนวณด้วยตนเองเป็นงานที่ค่อนข้างน่าเบื่อ โชคดีที่มีฟังก์ชันใน Excel ที่ช่วยให้ขั้นตอนการคำนวณเป็นไปโดยอัตโนมัติ มาดูอัลกอริทึมสำหรับการทำงานกับเครื่องมือเหล่านี้กัน

ความแปรปรวนคือการวัดความแปรผัน ซึ่งเป็นค่ากำลังสองเฉลี่ยของส่วนเบี่ยงเบนจาก ความคาดหวังทางคณิตศาสตร์. ดังนั้นจึงแสดงการแพร่กระจายของตัวเลขเกี่ยวกับค่าเฉลี่ย การคำนวณการกระจายสามารถทำได้ทั้งสำหรับประชากรทั่วไปและสำหรับกลุ่มตัวอย่าง

วิธีที่ 1: การคำนวณประชากรทั่วไป

ในการคำนวณตัวบ่งชี้นี้ใน Excel สำหรับประชากรทั่วไป ฟังก์ชันจะใช้ DISP.G. ไวยากรณ์สำหรับนิพจน์นี้มีดังต่อไปนี้:

DISP.G(หมายเลข1;หมายเลข2;…)

โดยรวมแล้ว สามารถใช้อาร์กิวเมนต์ได้ตั้งแต่ 1 ถึง 255 รายการ อาร์กิวเมนต์สามารถ ค่าตัวเลขตลอดจนการอ้างอิงถึงเซลล์ที่มีอยู่

เรามาดูวิธีการคำนวณค่านี้สำหรับช่วงข้อมูลตัวเลขกัน


วิธีที่ 2: การคำนวณตัวอย่าง

ตรงกันข้ามกับการคำนวณค่าสำหรับประชากรทั่วไป ในการคำนวณตัวอย่าง ตัวส่วนจะไม่ถูกระบุ ทั้งหมดตัวเลข แต่น้อยกว่าหนึ่ง สิ่งนี้ทำเพื่อแก้ไขข้อผิดพลาด Excel คำนึงถึงความแตกต่างนี้ในฟังก์ชันพิเศษที่ออกแบบมาสำหรับการคำนวณประเภทนี้ - DISP.V ไวยากรณ์ของมันถูกแสดงโดยสูตรต่อไปนี้:

VAR.B(นัมเบอร์1;นัมเบอร์2;…)

จำนวนอาร์กิวเมนต์ เช่นเดียวกับในฟังก์ชันก่อนหน้า ยังสามารถอยู่ในช่วงตั้งแต่ 1 ถึง 255


อย่างที่คุณเห็น โปรแกรม Excel สามารถอำนวยความสะดวกในการคำนวณความแปรปรวนได้อย่างมาก นี้ สถิติสามารถคำนวณได้โดยแอปพลิเคชัน ทั้งสำหรับประชากรทั่วไปและสำหรับกลุ่มตัวอย่าง ในกรณีนี้ การกระทำของผู้ใช้ทั้งหมดจะลดลงเหลือเพียงการระบุช่วงของตัวเลขที่จะประมวลผล และ Excel จะทำงานหลักเอง แน่นอนว่าวิธีนี้จะช่วยประหยัดเวลาของผู้ใช้ได้มาก