ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

วิธีจัดกลุ่มข้อมูลรอง สถิติการจัดกลุ่ม

การจัดกลุ่มสถิติที่จัดกลุ่มไว้ก่อนหน้านี้ใหม่เรียกว่าการจัดกลุ่มรอง วิธีการนี้ใช้ในกรณีที่ลักษณะของการกระจายตัวของประชากรที่กำลังศึกษาไม่ชัดเจนอันเป็นผลมาจากการจัดกลุ่มครั้งแรก

ในกรณีนี้ ช่วงเวลาจะขยายหรือลดลง การจัดกลุ่มรองยังใช้เพื่อนำการจัดกลุ่มตามช่วงเวลาที่ต่างกันมาเป็นรูปแบบที่เปรียบเทียบได้เพื่อจุดประสงค์ในการเปรียบเทียบ ลองดูเทคนิคการจัดกลุ่มรองโดยใช้ตัวอย่าง

ตัวอย่างที่ 1

ขยายช่วงเวลาตามข้อมูลในตาราง 2.7:

ตารางที่ 2.7.

จำนวนร้านค้า

การจัดกลุ่มข้างต้นยังไม่ชัดเจนเพียงพอ เนื่องจากไม่ได้แสดงรูปแบบการเปลี่ยนแปลงมูลค่าการซื้อขายตามกลุ่มที่ชัดเจนและเข้มงวด

ให้เรากระชับแถวการแจกแจงโดยแบ่งเป็นหกกลุ่ม กลุ่มใหม่จะถูกสร้างขึ้นโดยการรวมกลุ่มเดิม (ตาราง 2.8.)

ตารางที่ 2.8.

กลุ่มร้านค้าตามมูลค่าการซื้อขายในไตรมาสที่สี่พันรูเบิล

จำนวนร้านค้า

มูลค่าการซื้อขายในไตรมาสที่สี่, พันรูเบิล

มูลค่าการซื้อขายเฉลี่ยต่อร้าน พันรูเบิล

เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งร้านค้ามีขนาดใหญ่เท่าใด ระดับการหมุนเวียนก็จะยิ่งสูงขึ้นเท่านั้น

ตัวอย่างที่ 2

ข้อมูลต่อไปนี้มีอยู่ในการกระจายของฟาร์มรวมตามจำนวนครัวเรือน (ตารางที่ 2.9)

ตารางที่ 2.9.

ส่วนแบ่งฟาร์มรวมในกลุ่มเป็นเปอร์เซ็นต์ของทั้งหมด

กลุ่มฟาร์มรวม จำแนกตามจำนวนครัวเรือน

ข้อมูลเหล่านี้ไม่อนุญาตให้มีการเปรียบเทียบการกระจายตัวของฟาร์มรวมในทั้งสองอำเภอด้วยจำนวนครัวเรือน เนื่องจากในเขตเหล่านี้มีจำนวนกลุ่มฟาร์มรวมต่างกัน มีความจำเป็นต้องนำซีรี่ส์การจำหน่ายไปใช้ในรูปแบบที่เทียบเคียงได้

เพื่อเป็นพื้นฐานในการเปรียบเทียบจำเป็นต้องมีการกระจายฟาร์มรวมในเขตที่ 1 ด้วยเหตุนี้ การจัดกลุ่มรองจะต้องดำเนินการในภูมิภาคที่สองเพื่อสร้างกลุ่มจำนวนเท่ากันและในช่วงเวลาเดียวกันกับในภูมิภาคแรก เราได้รับข้อมูลต่อไปนี้ (ตาราง 2.10.)

ตารางที่ 2.10.

กลุ่มฟาร์มรวม จำแนกตามจำนวนครัวเรือน

ส่วนแบ่งฟาร์มรวมในกลุ่มเป็นเปอร์เซ็นต์ของทั้งหมด

21-7=14, 14+23=37

เพื่อกำหนดจำนวนฟาร์มรวมที่ต้องนำมาจากกลุ่มที่ห้าไปยังกลุ่มที่จัดตั้งขึ้นใหม่ เราจะถือว่ามีเงื่อนไขว่าฟาร์มรวมจำนวนนี้ควรเป็นสัดส่วนกับความถ่วงจำเพาะของครัวเรือนที่เลือกในกลุ่ม

เรากำหนดส่วนแบ่งของ 50 ครัวเรือนในกลุ่มที่ห้า

(50 * 18) / (250 - 150) = 9

เรากำหนดส่วนแบ่งของ 50 ครัวเรือนในกลุ่มที่หก

(50 * 21) / (400 - 250) = 7 เป็นต้น

เมื่อวิเคราะห์และเปรียบเทียบกลุ่มต่างๆ เช่น สำหรับเวิร์กช็อป องค์กรต่างๆ เป็นต้น สถานการณ์อาจเกิดขึ้นเมื่อกลุ่มเดิมไม่สามารถเปรียบเทียบได้เนื่องจาก ตัวเลขต่างๆกลุ่มหรือช่วงขนาดต่างๆ ที่ใช้ เพื่อนำการจัดกลุ่มดังกล่าวมาอยู่ในรูปแบบที่เทียบเคียงได้คือ ใช้วิธีการจัดกลุ่มรองโดยใช้วิธีการจัดกลุ่มรอง วิธีการจัดกลุ่มรอง เป็นวิธีการสร้างกลุ่มใหม่ตามกลุ่มที่มีอยู่ตามข้อกำหนดที่กำหนดในการดำเนินการจัดกลุ่มรอง มีการใช้ 2 วิธี: 1) รวมกลุ่มดั้งเดิม 2) การจัดกลุ่มใหม่แบบเศษส่วน

การนำกลุ่มที่แตกต่างกันหลายกลุ่มมาอยู่ในรูปแบบที่เทียบเคียงได้จะดำเนินการในสามขั้นตอน ในระยะแรก การจัดกลุ่มเริ่มแรกจะได้รับการวิเคราะห์เพื่อระบุเงื่อนไขของความไม่มีใครเทียบได้ของการจัดกลุ่มดั้งเดิม ในขั้นตอนที่สอง จะมีการเลือกวิธีการเพื่อนำการจัดกลุ่มดั้งเดิมมาอยู่ในรูปแบบที่เทียบเคียงได้ ในขั้นตอนที่สามจะดำเนินการ การจัดเรียงใหม่ครั้งที่สองการจัดกลุ่มเบื้องต้นและการวิเคราะห์ผลลัพธ์ที่ได้รับ หากจำเป็นให้ดำเนินการจัดกลุ่มใหม่ พิจารณาวิธีการจัดเรียงรองใหม่

1 วิธีการสังเกตทางสถิติเกี่ยวกับการกระจายตัวของคนงานในองค์กรตามระยะเวลาการทำงานในปี 2543 ให้ผลลัพธ์ดังต่อไปนี้ (ตารางที่ 2.7)

ตารางที่ 2.7

ในปี พ.ศ. 2545 ได้มีการสังเกตทางสถิติซ้ำแล้วซ้ำอีก ซึ่งให้ผลลัพธ์ดังต่อไปนี้ (ตารางที่ 2.8) ไม่สามารถประเมินการเปลี่ยนแปลงการกระจายตัวของคนงานตามระยะเวลาการทำงานมากกว่า 2 ปีได้โดยตรงจากข้อมูลในทั้งสองตาราง การวิเคราะห์ทั้งสองตารางแสดงให้เห็นว่าไม่สอดคล้องกันเนื่องจาก ตัวเลขที่แตกต่างกันกลุ่มและขนาดช่วงต่างๆ

ตารางที่ 2.8

หากต้องการนำข้อมูลจากทั้งสองตารางมาอยู่ในรูปแบบที่เทียบเคียงได้ คุณสามารถรวมทั้งกลุ่ม 1 และ 2 และกลุ่ม 3 และ 4 ในตาราง 2.7 ได้ สิ่งนี้จะทำให้สามารถประเมินการเปลี่ยนแปลงในการกระจายตัวของคนงานตามระยะเวลาการทำงานที่เกิดขึ้นในองค์กรในช่วงสองปี ผลลัพธ์ของการจัดกลุ่มข้อมูลใหม่ การสังเกตทางสถิติสำหรับปี 2000 (ตารางที่ 2.7) แสดงไว้ในตารางที่ 2.9

ตารางที่ 2.9

เมื่อเปรียบเทียบข้อมูลสำหรับปี 2545 (ตาราง 2.8) กับข้อมูลที่จัดกลุ่มใหม่สำหรับปี 2543 (ตาราง 2.9) เราสามารถสรุปได้: ในสองปีจำนวนคนงานที่มีประสบการณ์สูงสุด 6 ปีลดลงเช่น อายุน้อยและจำนวนคนทำงานที่มีประสบการณ์เพิ่มมากขึ้น

วิธีที่ 2ให้การสังเกตทางสถิติในปี พ.ศ. 2545 ให้ผลลัพธ์ดังนี้ (ตารางที่ 2.10) เมื่อเปรียบเทียบข้อมูลสำหรับปี 2000 (ตาราง 2.9) และข้อมูลสำหรับปี 2002 (ตาราง 2.7) เราสามารถสรุปได้ว่าข้อมูลเหล่านี้เข้ากันไม่ได้เนื่องจากจำนวนกลุ่มต่างกันและขนาดช่วงเวลาต่างกัน การวิเคราะห์แสดงให้เห็นว่าการใช้วิธีเดียวในการนำข้อมูลมาสู่รูปแบบที่เทียบเคียงนั้นเป็นไปไม่ได้ ดังนั้นเราจึงใช้วิธีที่ 2 จัดกลุ่มข้อมูลปี 2543 ใหม่ (ตาราง 2.7) เพื่อให้สอดคล้องกับการจัดกลุ่มข้อมูลปี 2545 (ตาราง 2.10)

ตารางที่ 2.10

การใช้วิธีที่สองถือว่าการกระจายความถี่สม่ำเสมอภายในแต่ละกลุ่ม นี่เป็นข้อกำหนดเบื้องต้นสำหรับการใช้วิธีการที่สอง หากต้องการจัดกลุ่มข้อมูลใหม่สำหรับปี 2000 (ตาราง 2.7) เราจะทำการคำนวณดังต่อไปนี้ ดังนั้นกลุ่มแรกใหม่ (1-4) (ตาราง 2.10) จะรวมข้อมูลทั้งหมดจากกลุ่มแรกเก่า (1-3) (ตาราง 22.7) และข้อมูลจำนวนคนงานที่มีประสบการณ์ 4 ปีจากกลุ่มที่สองเก่า . จำนวนคนงานที่มีประสบการณ์ 4 ปีคือ 3 (9/3=3 เนื่องจากมีคนงาน 9 คนในกลุ่มที่สองแบบเก่า และช่วงเวลาคือ 3) ดังนั้นกลุ่มแรกใหม่ (1-4) จะรวมคนงาน 18 คน (18=15+3)กลุ่มที่สอง กลุ่มใหม่(5-8) จะรวมคนงาน 6 คนที่มีประสบการณ์ 5, 6 ปี (จากกลุ่มที่สองเก่า 6 = 9/3 2) และคนงาน 18 คนที่มีประสบการณ์ 7, 8 ปี (จากกลุ่มที่สามเก่า 18 = 27/3 2) ดังนั้น กลุ่มที่สองใหม่ (5-8) จะรวมคนงาน 24 คน (24=6+18) กลุ่มที่สามใหม่ (9-12) จะรวมคนงานที่มีประสบการณ์ 9 ปี (9=27/3) และพนักงานทั้งหมด 9 คนจากกลุ่มที่สี่เก่า (10-12) ดังนั้นในกลุ่มที่สามใหม่ (9-12) จะมีคนงาน 18 คน (18=9+9) เราจะรวมข้อมูลที่จัดกลุ่มใหม่สำหรับปี 2000 และข้อมูลสำหรับปี 2002 ไว้ในตารางเดียว (2.11) ซึ่งจะช่วยให้สามารถวิเคราะห์เปรียบเทียบได้

ตารางที่ 2.11

การวิเคราะห์การกระจายตัวของคนงานในองค์กรตามระยะเวลาการทำงาน (ตาราง 2.11) แสดงให้เห็นว่าในปี 2545 จำนวนคนงานที่มีประสบการณ์มากกว่า (จาก 9 เป็น 12 ปี) เพิ่มขึ้น และผู้ที่มีประสบการณ์น้อยกว่า (จาก 1 เป็น 8 ปี) ลดลง ดังนั้น การจัดกลุ่มข้อมูลใหม่ทำให้สามารถนำข้อมูลมาอยู่ในรูปแบบที่เปรียบเทียบได้ ดำเนินการวิเคราะห์ และสรุปผลที่จำเป็นได้

คำถามเพื่อความปลอดภัยและงานต่างๆ

1.การสังเกตทางสถิติคืออะไร? ต้องปฏิบัติตามเงื่อนไขใดบ้างเมื่อดำเนินการสังเกตทางสถิติ (ดูคำจำกัดความ)

2. การสังเกตทางสถิติสามารถจำแนกตามเกณฑ์ใดได้บ้าง? ยกตัวอย่างการสังเกตทางสถิติ

3. มีข้อผิดพลาดอะไรบ้างที่เกิดขึ้นเมื่อทำการสังเกตทางสถิติ และวิธีการควบคุมที่สามารถใช้ได้?

4. พิจารณาว่าตัวอย่างใดมีตัวอย่างที่เรียบง่ายและตัวอย่างใดเป็นบทสรุปที่ซับซ้อน ตัวอย่างที่ 1 ในวันจันทร์ คนงานหญิง 200 คนทำงานในโรงทอผ้า ตัวอย่างที่ 2 ในวันจันทร์ คนงานหญิง 40 คนทำงานในโรงทอผ้าที่ไซต์งานหมายเลข 1 คนงานหญิง 60 คนในไซต์หมายเลข 2 และคนงานหญิงทั้งหมด 100 คนทำงาน

5. กลุ่มใดที่ใช้ในระหว่างการประมวลผล ข้อมูลทางสถิติ- พวกเขาแตกต่างกันอย่างไร?

6. หัวหน้าฝ่ายเทคโนโลยีมีพนักงาน 15 คน และฝ่ายการตลาดและการขายมีพนักงาน 10 คน ในกรณีใดทีมงานแผนกเป็นประชากรเนื้อเดียวกัน และในกรณีใดบ้างที่พวกเขาเป็นประชากรต่างกัน

7. ยอดขายรายวันของรายการผ้า A ในร้านผ้าในเดือนตุลาคมมีลักษณะเป็นข้อมูลต่อไปนี้ (เป็นเมตร): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9 , 5, 10 , 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. จัดกลุ่มข้อมูลโดยใช้ช่วงเวลาที่เท่ากัน

8. จัดกลุ่มผลลัพธ์ของการจัดกลุ่มข้อมูลจากจุดที่ 7 ใหม่ถึง กลุ่มต่อไปนี้: (3-9), (9-15), 15-21).

หัวข้อที่ 3 ชุดการกระจายทางสถิติ ตาราง กราฟิก

3.1 ชุดการแจกแจงทางสถิติ - แนวคิด ประเภท รูปแบบการนำเสนอ

รูปแบบหนึ่งของการนำเสนอข้อมูลการสังเกตทางสถิติคือชุดการแจกแจงทางสถิติ อนุกรมทางสถิติ การกระจายคือการจัดเรียงหน่วยประชากรออกเป็นกลุ่มตามลักษณะการจัดกลุ่มตามลำดับด้วยความช่วยเหลือของชุดการแจกแจงทางสถิติ คุณสามารถศึกษาโครงสร้างและขอบเขตของการเปลี่ยนแปลงประชากร ประเมินความเป็นเนื้อเดียวกัน และกำหนดรูปแบบการพัฒนาหน่วยประชากรได้ โดยรูปลักษณ์ภายนอก ชุดสถิติการแจกแจงแบ่งออกเป็นคุณลักษณะ รูปแบบ และอนุกรมเวลา

อนุกรมที่แสดงที่มาและแปรผันประกอบด้วยสององค์ประกอบ: การแปรผันและความถี่ (ความถี่หรือความหนาแน่น) ตัวเลือก() – นี่คือค่าเฉพาะของแอตทริบิวต์ที่ใช้ในซีรีย์การแจกจ่าย ความถี่ () - นี้ จำนวนสัมบูรณ์แสดงจำนวนครั้ง (บ่อยแค่ไหน) ที่ค่าเฉพาะของคุณลักษณะ (ตัวแปร) เกิดขึ้นในประชากร หรือจำนวนหน่วยของประชากรที่มีค่าเฉพาะของคุณลักษณะ (ตัวแปร) ความถี่() – นี่คือค่าสัมพัทธ์ที่กำหนดส่วนแบ่งของตัวเลือกแต่ละรายการในปริมาณรวมของประชากร ()ความถี่สามารถแสดงเป็นหุ้นก็ได้ ซึ่งในกรณีนี้คือปริมาณของประชากร เท่ากับหนึ่ง() หรือคิดเป็นเปอร์เซ็นต์ ซึ่งในกรณีนี้ปริมาตรของประชากรคือ 100% () โดยทั่วไปความถี่จะคำนวณดังนี้

ปริมาณประชากรอยู่ที่ไหน

ความหนาแน่น() เป็นค่าสัมพัทธ์ที่แสดงจำนวนหน่วยประชากร (ในรูปแบบสัมบูรณ์หรือ รูปแบบสัมพัทธ์) คือต่อหน่วยความยาวของช่วงเวลากลุ่ม ()ความหนาแน่นอาจเป็นแบบสัมบูรณ์หรือแบบสัมพัทธ์ก็ได้ ความหนาแน่นสัมบูรณ์ เท่ากับ

ความหนาแน่นสัมพัทธ์ เท่ากับ

เมื่อคำนวณความหนาแน่นสัมพัทธ์ จะใช้ความถี่โดยแสดงเป็นเศษส่วน

ซีรี่ส์ที่มีคุณลักษณะ เป็นชุดที่สร้างขึ้นบนพื้นฐานของคุณลักษณะเชิงคุณภาพของประชากรซีรีส์เหล่านี้สร้างขึ้นโดยใช้การจัดกลุ่มประเภทและสามารถแสดงเป็นตารางได้ ตัวอย่างเช่นการกระจายตัวของผู้ปฏิบัติงานตามประเภทภาษี (ตารางที่ 3.1)

ตารางที่ 3.1

ในตัวอย่างที่ให้มา (ตารางที่ 3.1) จำนวนทั้งสิ้นคือคนงานทั้งหมดขององค์กร ขนาดประชากร 250 คน หน่วยประชากรคือคนงานหนึ่งคน หมวดหมู่ภาษีถูกเลือกเป็นลักษณะของหน่วยประชากร คุณลักษณะนี้มีความหมายเฉพาะหลายประการ - ตัวแปร (หมวดที่ 1, หมวดที่ 2, หมวดที่ 3, หมวดที่ 4, หมวดที่ 5) ในตาราง ค่าแอตทริบิวต์จะได้รับในคอลัมน์ 2 ค่าความถี่ในคอลัมน์ 3 และค่าความถี่ในคอลัมน์ 4

ซีรี่ส์รูปแบบต่างๆเป็นชุดที่สร้างขึ้นบนพื้นฐานของคุณลักษณะเชิงปริมาณของประชากรซีรีส์เหล่านี้สร้างขึ้นโดยใช้การจัดกลุ่มโครงสร้างเป็นหลัก และสามารถแสดงเป็นตารางได้ ซีรีย์รูปแบบมีสองประเภท: ซีรีย์รูปแบบแยกและซีรีย์ช่วง ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง – นี่คือชุดค่าของคุณลักษณะ (ตัวเลือก) ที่แสดงด้วยค่าที่ไม่ต่อเนื่อง. อนุกรมความแปรผันของช่วง – นี่คือชุดที่แสดงค่าของคุณลักษณะเป็นช่วงเวลา- จากข้อมูลการหมุนเวียนรายวันของผู้ประกอบการรายบุคคล 34 รายที่ให้ไว้ในหน้า เราจะสร้างชุดช่วงการเปลี่ยนแปลง (ตาราง 3.2)

ตารางที่ 3.2

คอลัมน์ที่ 3 แสดงความถี่ - จำนวนผู้ประกอบการที่ผลประกอบการหนึ่งวันอยู่ในช่วงที่กำหนด (คอลัมน์ที่ 2) คอลัมน์ 4 คำนวณความถี่เป็นเปอร์เซ็นต์โดยใช้สูตร 3.1 ดังนั้นความถี่ของกลุ่มแรก (3.1 – 3.9) จะเท่ากับ

ความถี่จะถูกคำนวณเช่นเดียวกันสำหรับกลุ่มอื่นๆ คอลัมน์ 5 แสดงความถี่ในการแชร์ สามารถรับได้โดยการคำนวณ

หรือโดยการแปลงเปอร์เซ็นต์เป็นหุ้น เมื่อทำการคำนวณต้องแสดงข้อมูลในรูปแบบทศนิยมด้วยความแม่นยำสูงสุด 3 ตำแหน่ง ซึ่งจะช่วยปรับปรุงความแม่นยำในการคำนวณและการผลิตข้อมูลขั้นสุดท้ายที่เหมาะสม ดังนั้นผลรวมของความถี่เป็นเปอร์เซ็นต์ควรเท่ากับ 100% และเป็นเศษส่วน – เท่ากับ 1

คอลัมน์ที่ 6 ของตาราง 3.2 แสดงค่าความหนาแน่นสัมบูรณ์ การคำนวณดำเนินการตามสูตร 3.2 ดังนั้นสำหรับกลุ่มแรก ความหนาแน่นสัมบูรณ์จะเท่ากับ

หากนำความถี่ () จากคอลัมน์ 3 ค่าของช่วงเวลา () จะถูกกำหนดให้เป็นความแตกต่างระหว่างขีดจำกัดบน (3.9) และขีดจำกัดล่าง (3.1) ของช่วงเวลาของกลุ่มแรก เช่น - ความหนาแน่นสัมบูรณ์สำหรับกลุ่มอื่นๆ จะคำนวณในลักษณะเดียวกัน หลังจากทำการคำนวณแล้วจำเป็นต้องให้การตีความทางเศรษฐศาสตร์แก่พวกเขา ตัวอย่างเช่น ความหนาแน่นสัมบูรณ์ของกลุ่มแรกบ่งชี้ว่าทุกๆ พันรูเบิล มูลค่าการซื้อขายในกลุ่มแรกมีผู้ประกอบการ 5 ราย

คอลัมน์ที่ 7 ของตาราง 3.2 แสดงค่าความหนาแน่นสัมพัทธ์ การคำนวณดำเนินการตามสูตร 3.3 ดังนั้นกลุ่มแรกความหนาแน่นสัมพัทธ์จะเท่ากับ

ความหนาแน่นสัมพัทธ์ได้รับการคำนวณในลักษณะเดียวกันสำหรับกลุ่มอื่นๆ ความหนาแน่นสัมพัทธ์ของกลุ่มแรกแสดงให้เห็นว่าส่วนแบ่งของผู้ประกอบการที่มาต่อรายได้ทุกๆ พันรายในกลุ่มแรกคือ 0.147

คอลัมน์ที่ 2 ของตาราง 3.3 นำเสนอมูลค่าการซื้อขายในรูปแบบของช่วงเวลา และคอลัมน์ 3 นำเสนอมูลค่าการซื้อขายในรูปแบบของค่าที่ไม่ต่อเนื่อง สำหรับกลุ่มแรกจะมีการคำนวณค่าแยกดังนี้

มูลค่าการซื้อขายจะคำนวณในลักษณะเดียวกับ ค่าที่ไม่ต่อเนื่องและสำหรับกลุ่มอื่นๆ

บ่อยครั้งในระหว่างการวิเคราะห์ ซีรีย์การเปลี่ยนแปลงจำเป็นต้องเข้าใจการเปลี่ยนแปลงในปริมาณประชากรเมื่อเปลี่ยนแปลงค่าของลักษณะ (โดยส่วนใหญ่จะเรียงลำดับจากน้อยไปมาก) สำหรับสิ่งนี้ จะใช้แนวคิด เช่น ความถี่สะสมหรือความถี่สะสม ความถี่สะสม ( )คือผลรวมของความถี่ตั้งแต่แถวแรกถึง ค่าที่แน่นอนรวมเครื่องหมาย ความถี่สะสม คือผลรวมของความถี่ตั้งแต่เริ่มต้นซีรีส์จนถึงค่าหนึ่งของแอตทริบิวต์ลองพิจารณาค้นหาค่าของตัวบ่งชี้เหล่านี้ตามข้อมูลในตาราง 3.4 ในคอลัมน์ที่ 6 ของตาราง 3.4 แสดงความถี่สะสม ในกลุ่มแรก (กลุ่มที่ 1) ผู้ประกอบการ 4 ราย (กลุ่มที่ 4) มีมูลค่าการซื้อขาย 3.1 ถึง 3.9 พันรูเบิล (คอลัมน์ 2) หรือมูลค่าการซื้อขายเฉลี่ย 3.5 พันรูเบิล (กรัม 3) เนื่องจากเป็นกลุ่มแรกความถี่สะสมคือ จำนวนผู้ประกอบการจะเท่ากับ 4 (คอลัมน์ 6) ในกลุ่มที่สองคือจำนวนผู้ประกอบการที่มีมูลค่าการซื้อขาย 3.9 ถึง 4.7 พันรูเบิล หรือมูลค่าการซื้อขายเฉลี่ย 4.3 พันรูเบิล เท่ากับ 5 คน ดังนั้นความถี่สะสมคือ จำนวนผู้ประกอบการที่มีมูลค่าการซื้อขาย 3.1 ถึง 4.7 พันรูเบิล หรือโดยเฉลี่ยจากและน้อยกว่า 4.3 พันรูเบิล จะเท่ากับ 9=4+5 กลุ่มที่ 3 ความถี่สะสมจะเป็น 16=4+5+7 เป็นต้น ความถี่สะสมจะคำนวณในลักษณะเดียวกัน

นอกจากการจัดกลุ่มหลักแล้ว การจัดกลุ่มรองยังถูกนำมาใช้กันอย่างแพร่หลายในสถิติ - การจัดกลุ่มรองเรียกว่าการจัดตั้งกลุ่มใหม่ตามการจัดกลุ่มที่จัดขึ้นก่อนหน้านี้

การจัดกลุ่มรองใช้เพื่อแก้ปัญหาต่าง ๆ ที่สำคัญที่สุดคือ 1) การศึกษาตามกลุ่มตามลักษณะเชิงปริมาณและเชิงคุณภาพ กลุ่มที่เป็นเนื้อเดียวกัน(ประเภท) 2) นำสองกลุ่ม (หรือมากกว่า) ที่มีช่วงเวลาต่างกันไป ประเภทเดียวเพื่อวัตถุประสงค์ในการเปรียบเทียบและการวิเคราะห์ 3) การก่อตัวของกลุ่มใหญ่ซึ่งลักษณะของการกระจายปรากฏชัดเจนยิ่งขึ้น

สาระสำคัญของเทคนิคนี้คือเพื่อให้ได้ข้อมูลที่เปรียบเทียบได้สำหรับกลุ่มต่างๆ ซึ่ง: ความแข็งแกร่งเชิงตัวเลขกลุ่ม (ตามเปอร์เซ็นต์) ได้รับการแก้ไขที่ระดับเดียวกันในทุกกลุ่ม สำหรับการจัดกลุ่มทั้งหมด จะมีกลุ่มจำนวนเท่ากันและเนื้อหาในตารางกลุ่มเหมือนกัน การเปรียบเทียบและการเปรียบเทียบไม่อยู่ภายใต้บังคับ ตัวชี้วัดที่แน่นอนตามกลุ่มและ ค่าสัมพัทธ์, เปอร์เซ็นต์

การจัดกลุ่มรองมีสองวิธี: 1) โดยการเปลี่ยนช่วงของการจัดกลุ่มหลัก (โดยปกติโดยการขยายช่วง) และ 2) โดยการกำหนดส่วนหนึ่งของหน่วยประชากรให้กับแต่ละกลุ่ม (การจัดกลุ่มใหม่บางส่วน) เมื่อใช้วิธีการจัดกลุ่มทุติยภูมิเหล่านี้ มักจะถือว่าการกระจายตัวของคุณลักษณะภายในช่วงเวลาจะสม่ำเสมอ

การใช้การจัดกลุ่มรองเพื่อนำสองกลุ่มที่มีช่วงเวลาต่างกันมาอยู่ในรูปแบบเดียวเพื่อวัตถุประสงค์ในการเปรียบเทียบจะแสดงตัวอย่างด้วยตัวอย่างต่อไปนี้ ในการดำเนินการนี้ เราใช้ข้อมูลจากเดือนธันวาคมแรกของทั้งสองอำเภอเกี่ยวกับจำนวนคนงานปศุสัตว์ (ตาราง 37.7)

- ตารางที่ 37. การจัดกลุ่มฟาร์มใน 2 อำเภอ ตามจำนวนคนงานปศุสัตว์

เขต 1

เขตที่ 2

กลุ่มฟาร์มโดย

กลุ่มฟาร์มโดย

จำนวนพนักงานคน

ในที่สุด

จำนวนพนักงานคน

ในที่สุด

ข้อมูลโดยตรงสำหรับกลุ่มของทั้งสองภูมิภาคไม่สามารถเปรียบเทียบกันได้ เนื่องจากฟาร์มจะกระจายออกเป็นกลุ่มในช่วงเวลาที่ต่างกัน: 20 คนในภูมิภาค I และ 30 คนในภูมิภาค II จำนวนกลุ่มที่จัดสรรก็ไม่เท่ากัน

เพื่อนำทั้งสองกลุ่มมาอยู่ในรูปแบบที่เปรียบเทียบได้ เราจะดำเนินการจัดกลุ่มรอง เพื่อจุดประสงค์นี้ วัสดุจะถูกจัดกลุ่มใหม่ออกเป็นกลุ่มที่เหมือนกันสำหรับทั้งสองภูมิภาค เรามาแบ่งช่วงเวลากัน 40 คน (ตารางที่ 38)

เนื่องจากมีความเป็นไปได้ที่จะจัดกลุ่มฟาร์มรองในภูมิภาค 1 โดยการขยายช่วงเวลา (มีความบังเอิญที่ช่วงล่างและช่วงบนในทั้งสองกลุ่ม) เราจึงใช้วิธีนี้ในการแก้ปัญหา

ให้เราอธิบายลำดับการคำนวณ ฟาร์มกลุ่มแรกที่มีพนักงานมากถึง 160 คนจะรวมถึงฟาร์มของกลุ่ม I และ II

- ตารางที่ 38. การจัดกลุ่มฟาร์มรองใน 2 อำเภอ ตามจำนวนคนงานปศุสัตว์

ส่วนแบ่งของฟาร์มในกลุ่มเหล่านี้ใน ผลลัพธ์โดยรวมจะเป็น 16% (12 เมษายน) ฟาร์มกลุ่มที่สองที่มีพนักงาน 160 ถึง 200 คนจะรวมฟาร์มของกลุ่ม III และ IV ส่วนแบ่งเฮกตาร์ทั้งหมดจะอยู่ที่ 45% (18 27) การคำนวณจะดำเนินการในลักษณะเดียวกันเมื่อสร้างกลุ่มเดือนธันวาคมที่เหลือ

จะจัดกลุ่มฟาร์มของภูมิภาค II ใหม่ เนื่องจากการขยายช่วงเวลาไม่เหมาะสำหรับฟาร์มในภูมิภาค II และไม่สามารถแก้ปัญหาได้ เราจึงใช้วิธีการจัดกลุ่มข้อมูลใหม่บางส่วนตามการจัดกลุ่มหลัก

กลุ่มฟาร์มกลุ่มแรกที่สร้างขึ้นใหม่ในภูมิภาค II ซึ่งมีจำนวนคนงานปศุสัตว์มากถึง 160 คนจะรวมฟาร์มของกลุ่มหลักที่มีช่วงเวลาเดียวกันโดยสมบูรณ์ ส่วนแบ่งของฟาร์มในกลุ่มนี้คือ 88%

ฟาร์มกลุ่มที่สองของกลุ่มรองที่มีจำนวนพนักงานตั้งแต่ 160 ถึง 200 คนจะรวมฟาร์มของกลุ่ม II (16%) และฟาร์มบางแห่งโดยสมบูรณ์ กลุ่มที่ 3- ในการกำหนดส่วนของรัฐบาลที่ต้องนำมาจากกลุ่ม III จำเป็นต้องแบ่งออกเป็นกลุ่มย่อยโดยมีพนักงานจำนวน 190 - 200, 200 - 210, 210 - 220 คน ตัวชี้วัดส่วนแบ่งของฟาร์มในกลุ่มย่อยเหล่านี้จะถูกกำหนดตามสัดส่วนการแบ่งช่วงเวลา ขนาดช่วงเวลาที่เรากำลังพิจารณาคือ 30 คน และแบ่งออกเป็น 3 ส่วนเท่าๆ กัน หากต้องการรับช่วงเวลาที่ต้องการ 160 - 200 คนต่อค่าของช่วงเวลาของกลุ่ม II (160 - 190 คน) ควรเพิ่มหนึ่งในสามของมูลค่าของช่วงเวลาของกลุ่ม III (190 - 220 คน) และส่วนเดียวกัน ของฟาร์มในกลุ่มนี้

ดังนั้น กลุ่มฟาร์มที่สองที่สร้างขึ้นใหม่จะรวม 16% ของฟาร์มของกลุ่มที่สองและหนึ่งในสามของกลุ่ม III - 10% (1/3-30) ซึ่งจะเท่ากับ 26% ของ จำนวนทั้งหมดฟาร์มในภูมิภาค II

ฟาร์มกลุ่มที่ 3 ของกลุ่มรอง (200 - 240 คน) จะรวมส่วนหนึ่งของฟาร์มของกลุ่มที่ 3 (190 - 220 คน) ส่วนที่เหลือ - 20% (% -30) และสองในสามของฟาร์มของ กลุ่ม IV (220 - 250 คน) - % (% - 21) นั่นคือ 34% ของจำนวนฟาร์มทั้งหมดในภูมิภาค I II

การคำนวณที่คล้ายกันจะดำเนินการเมื่อสร้างกลุ่มฟาร์มที่สร้างขึ้นใหม่ที่เหลือ: 240 - 280 คนและมากกว่า 280 คน หากในตารางที่ 37 พร้อมด้วยข้อมูลเกี่ยวกับส่วนแบ่งของฟาร์มตามกลุ่ม ให้ข้อมูลเกี่ยวกับตัวเลขด้วย ดังนั้นการคำนวณสำหรับกลุ่มที่สร้างขึ้นใหม่จะดำเนินการในสัดส่วนเดียวกันกับ ความถ่วงจำเพาะโฮสต์วี

หลังจากการจัดกลุ่มรอง วัสดุหลักจะเปรียบเทียบกันได้ เนื่องจากทั้งสองภูมิภาคใช้กลุ่มเดียวกันตามจำนวนคนงาน จากข้อมูลในตารางที่ 38 เป็นที่ชัดเจนว่าการกระจายฟาร์มตามจำนวนคนงานปศุสัตว์ในทั้งสองภูมิภาคมีความแตกต่างกันอย่างมีนัยสำคัญ: ในภูมิภาค 1 ฟาร์มที่มีคนงานปศุสัตว์มากถึง 200 คนมีอำนาจเหนือกว่า (61% ของจำนวนฟาร์มทั้งหมด) ในภูมิภาค II - ฟาร์มที่มีจำนวนคนงานปศุสัตว์ - มากกว่า 200 คน (66% ของจำนวนฟาร์มทั้งหมด)

ข้อมูลเกี่ยวกับแต่ละหน่วยของประชากรที่วิเคราะห์ที่ได้รับจากระยะแรก การวิจัยทางสถิติระบุลักษณะการสังเกตทางสถิติจากแง่มุมต่างๆ เนื่องจากมีสัญญาณและคุณสมบัติมากมายที่เปลี่ยนแปลงตามเวลาและสถานที่ เพื่อให้ได้ลักษณะสรุปของวัตถุทั้งหมดโดยใช้ตัวบ่งชี้ทั่วไป จำเป็นต้องจัดระบบและสรุปผลลัพธ์ที่ได้รับระหว่างการสังเกตทางสถิติ สิ่งนี้จะทำให้เรามีโอกาสที่จะระบุคุณลักษณะและลักษณะของประชากรทางสถิติโดยรวมและองค์ประกอบแต่ละส่วน และค้นพบรูปแบบของปรากฏการณ์และกระบวนการทางเศรษฐกิจและสังคมที่กำลังศึกษาอยู่ การจัดระบบนี้เรียกว่าการสรุปเนื้อหาทางสถิติหลัก

ขั้นตอนที่สอง งานทางสถิติสรุปทางสถิติ – เป็นการประมวลผลข้อมูลปฐมภูมิเพื่อให้ได้ลักษณะทั่วไปของปรากฏการณ์หรือกระบวนการที่กำลังศึกษาตามคุณลักษณะจำนวนหนึ่งที่จำเป็นเพื่อระบุ คุณสมบัติทั่วไปและรูปแบบที่มีอยู่ในปรากฏการณ์หรือกระบวนการโดยรวม

สรุปทางสถิติเป็นการเปลี่ยนจากข้อมูลส่วนบุคคลไปเป็นข้อมูลเกี่ยวกับกลุ่มหน่วยและประชากรโดยรวม

การจัดทำสรุปประกอบด้วยสามขั้นตอน:

1) การควบคุมเบื้องต้นเป็นการตรวจสอบข้อมูล

2) การจัดกลุ่มข้อมูลตามคุณลักษณะที่กำหนดคือการกำหนดตัวบ่งชี้ที่ได้รับ

3) การนำเสนอผลสรุปในรูปแบบตารางสถิติซึ่งเป็นรูปแบบที่สะดวกในการรับรู้ข้อมูลที่ได้รับ

ความสอดคล้องทางความหมายของข้อมูลทางสถิติถือเป็นการควบคุมเบื้องต้น ตามโปรแกรมสรุปทางสถิติ เพื่อที่จะให้ข้อมูลที่ได้รับในรูปแบบที่เข้าใจได้ในภายหลัง จะใช้การจัดกลุ่มข้อมูลทางสถิติ

ผลลัพธ์การจัดกลุ่มที่ได้รับจะแสดงในรูปแบบของตารางการจัดกลุ่มที่มีลักษณะสรุปของประชากรภายใต้การศึกษาตามลักษณะหนึ่งหรือหลายลักษณะที่เชื่อมโยงกันด้วยตรรกะของการวิเคราะห์ มีบทสรุปที่ง่ายและซับซ้อน ข้อมูลเกี่ยวกับแต่ละหน่วยจะสรุปโดยรวมโดยไม่แบ่งออกเป็นกลุ่มที่เป็นเนื้อเดียวกัน ผลลัพธ์ของการสรุปทางสถิติอย่างง่ายมีจุดประสงค์เพื่อการประมวลผลเนื้อหาต่อไป การสรุปอย่างง่ายยังมีคุณค่าทางปัญญาที่เป็นอิสระอีกด้วย

สรุปสถิติอย่างง่ายเป็นการดำเนินการสำหรับการคำนวณข้อมูลสุดท้ายและข้อมูลกลุ่มทั่วไปสำหรับชุดหน่วยการสังเกตและจัดระเบียบเนื้อหานี้เป็นตาราง

การสรุปทางสถิติอย่างง่ายทำให้เรามีโอกาสกำหนดจำนวนหน่วยของประชากรที่กำลังศึกษาและปริมาณของลักษณะที่กำลังศึกษา แต่ด้วยเหตุนี้การสรุปอย่างง่ายไม่ได้ทำให้เราเข้าใจถึงความสมบูรณ์ขององค์ประกอบของประชากรที่เป็นอยู่ ศึกษา

หากหน่วยของประชากรถูกแบ่งออกเป็นกลุ่มที่เป็นเนื้อเดียวกัน จะมีการคำนวณผลรวมสำหรับแต่ละกลุ่ม จากนั้นสำหรับประชากรทั้งหมดโดยรวม การสรุปทางสถิติดังกล่าวเรียกว่าซับซ้อน การสรุปที่ซับซ้อนช่วยให้เราสามารถศึกษาองค์ประกอบของประชากรและระบุอิทธิพลของลักษณะบางอย่างที่มีต่อลักษณะอื่น ๆ ได้ กล่าวคือ เปิดเผยรูปแบบที่มีอยู่ในประชากรที่กำหนด

สรุปทางสถิติที่ซับซ้อนเป็นการดำเนินงานที่ซับซ้อน รวมทั้งการแบ่งหน่วยสังเกตการณ์ปรากฏการณ์ทางเศรษฐกิจและสังคมหรือกระบวนการที่กำลังศึกษาออกเป็นกลุ่มๆ การรวบรวมระบบตัวบ่งชี้เพื่อกำหนดลักษณะกลุ่มทั่วไปและกลุ่มย่อยของชุดปรากฏการณ์ที่ศึกษา การนับจำนวนหน่วยและผลลัพธ์ในแต่ละกลุ่มและ กลุ่มย่อยและการนำเสนอผลงานในรูปแบบตารางสถิติ บนพื้นฐานของความครอบคลุม การวิเคราะห์ทางทฤษฎีสาระสำคัญและเนื้อหาของปรากฏการณ์และกระบวนการที่กำลังศึกษาจะมีการสรุปทางสถิติ โปรแกรมและแผนการดำเนินการสรุปทางสถิติทำให้มั่นใจในความน่าเชื่อถือและความถูกต้องของผลลัพธ์

โปรแกรมสรุปทางสถิติประกอบด้วยรายชื่อกลุ่มที่สามารถแบ่งหรือแบ่งชุดหน่วยการสังเกตทางสถิติได้ เช่นเดียวกับระบบตัวบ่งชี้ที่แสดงลักษณะของชุดปรากฏการณ์และกระบวนการที่ศึกษาทั้งโดยรวมและแต่ละส่วน โปรแกรมสรุปทางสถิติขึ้นอยู่กับเป้าหมายและวัตถุประสงค์ของการศึกษา การพัฒนาโปรแกรมประกอบด้วยขั้นตอนต่อไปนี้:

1) เลือกลักษณะการจัดกลุ่มเพื่อสร้างกลุ่มที่เป็นเนื้อเดียวกัน

2) กำหนดลำดับของการก่อตัวและจำนวนกลุ่ม

3) กำลังพัฒนาระบบ ตัวชี้วัดทางสถิติเพื่อระบุลักษณะกลุ่มและวัตถุโดยรวม

4) มีการสร้างเค้าโครงตารางทางสถิติเพื่อให้ผลลัพธ์สรุป

ร่วมกับโปรแกรมสรุปทางสถิติจะมีการร่างแผนการดำเนินงาน แผนจะต้องมีข้อมูลเกี่ยวกับลำดับ เวลา และเทคนิคในการดำเนินการสรุป ผู้ดำเนินการ ขั้นตอนและกฎเกณฑ์ในการจัดรูปแบบผลลัพธ์ในรูปแบบของตาราง

ข้อมูลสรุปยังสามารถกระจายอำนาจหรือรวมศูนย์ได้

สรุปสถิติแบบกระจายอำนาจ- นี่คือวิธีการสรุปเนื้อหาซึ่งดำเนินการจากล่างขึ้นบนตามบันไดการจัดการแบบลำดับชั้นและมีการประมวลผลในแต่ละขั้นตอน การประมวลผลข้อมูลดำเนินการในพื้นที่ เช่น รายงานขององค์กรรวบรวมโดยหน่วยงานทางสถิติของวิชาต่างๆ สหพันธรัฐรัสเซีย- ผลลัพธ์ที่ได้จะถูกส่งไปยังคณะกรรมการสถิติแห่งรัฐของสหพันธรัฐรัสเซีย จากนั้นจึงแสดงตัวชี้วัดสุดท้ายโดยรวมสำหรับสถานการณ์ทางเศรษฐกิจและสังคมของประเทศ

สรุปสถิติแบบรวมศูนย์เป็นวิธีการที่ข้อมูลปฐมภูมิทั้งหมดที่ได้รับจากการสังเกตทางสถิติรวมอยู่ในที่เดียว องค์กรกลางและประมวลผลตั้งแต่ต้นจนจบ

ตามเทคนิคของการดำเนินการ สรุปทางสถิติสามารถใช้เป็นเครื่องจักร (โดยใช้คอมพิวเตอร์อิเล็กทรอนิกส์) และแบบแมนนวล

2. สาระสำคัญและการจำแนกกลุ่ม

การกระจายตามหลักวิทยาศาสตร์ออกเป็นกลุ่มทำให้สามารถสรุปผลที่ถูกต้องเกี่ยวกับประชากรที่กำลังศึกษาและกระบวนการที่เกิดขึ้นในนั้น

หลักการจัดกลุ่มทางวิทยาศาสตร์ถูกกำหนดไว้ในงานของ V.I. การจัดกลุ่มทางสถิติดังที่ V.I. Lenin ชี้ให้เห็น ไม่ใช่ประเด็นรอง ต้องมีการวิเคราะห์ทางเศรษฐกิจและสังคมที่ครอบคลุมของปรากฏการณ์ที่กำลังศึกษา สำคัญในการจัดกลุ่มทางสถิติได้ ทางเลือกที่ถูกต้องลักษณะการจัดกลุ่มตามวัตถุประสงค์ของการวิจัยทางสถิติ การจัดกลุ่มควรขึ้นอยู่กับคุณลักษณะที่สำคัญที่สุดและสำคัญที่สุดสำหรับประเด็นที่กำลังศึกษาอยู่ ซึ่งจะทำให้สามารถระบุประเภทของปรากฏการณ์ทางเศรษฐกิจและสังคมได้ ตัวอย่างที่ยอดเยี่ยมของการใช้การจัดกลุ่มทางสถิติเพื่อระบุประเภททางเศรษฐกิจและสังคมคือตารางจากงานของ V. I. Lenin เรื่อง "การพัฒนาระบบทุนนิยมในรัสเซีย"

การจัดกลุ่มทางสถิติ– นี่เป็นหนึ่งในขั้นตอนหลักของการดำเนินการวิจัยทางสถิติ

กระบวนการสร้างกลุ่มที่เป็นเนื้อเดียวกันโดยแบ่งประชากรทางสถิติออกเป็นส่วน ๆ หรือรวมหน่วยทางสถิติที่ศึกษาเข้าด้วยกันตามลักษณะเฉพาะเรียกว่า การจัดกลุ่มทางสถิติ ที่สำคัญที่สุด วิธีการทางสถิติลักษณะทั่วไปของข้อมูลคือการจัดกลุ่มทางสถิติ

ปัญหาหลักสามประเภทได้รับการแก้ไขโดยใช้วิธีการ การจัดกลุ่มทางสถิติ:

1) การระบุประเภทปรากฏการณ์ทางเศรษฐกิจและสังคม

2) การศึกษาโครงสร้างของปรากฏการณ์และการเปลี่ยนแปลงโครงสร้างที่เกิดขึ้นในปรากฏการณ์

3) การระบุความสัมพันธ์และการพึ่งพาซึ่งกันและกันระหว่างปรากฏการณ์และสัญญาณที่แสดงถึงปรากฏการณ์เหล่านี้ แยกแยะ ประเภทต่อไปนี้การจัดกลุ่มทางสถิติ:

1) ประเภท;

2) โครงสร้าง;

3) การวิเคราะห์

กลุ่มมวลรวมที่เป็นเนื้อเดียวกันในเชิงคุณภาพ ได้แก่ วัตถุที่อยู่ใกล้กันในลักษณะการจัดกลุ่มเรียกว่า การจัดกลุ่มประเภท

ตัวอย่างของการจัดกลุ่มประเภทคือ: การจัดกลุ่มที่ดินตามรูปแบบการเป็นเจ้าของ ควรให้ความสนใจหลักในการจัดกลุ่มประเภทเพื่อระบุประเภทและการเลือกลักษณะการจัดกลุ่ม ในการสร้างการจัดกลุ่มประเภทจำเป็นต้องใช้คุณลักษณะเชิงปริมาณและคุณภาพ (ระบุแหล่งที่มา)

การจัดกลุ่มตามแอตทริบิวต์แสดงให้เห็นว่าจำนวนกลุ่มที่ระบุสอดคล้องกับจำนวนการไล่ระดับที่แท้จริงของคุณลักษณะนี้ ตามเกณฑ์เชิงปริมาณ จำเป็นต้องกำหนดช่วงเวลาการจัดกลุ่มให้ถูกต้องและกำหนดจำนวนกลุ่มที่ต้องการ ปัญหาในการกำหนดช่วงเวลาของการจัดกลุ่มประเภทจะได้รับการแก้ไขบนพื้นฐานของการระบุขอบเขตเชิงปริมาณของการเปลี่ยนแปลงในลักษณะการจัดกลุ่มซึ่งปรากฏการณ์เปลี่ยนแปลงหรือได้รับคุณภาพใหม่

ในการจัดกลุ่มประเภท จำนวนกลุ่มขึ้นอยู่กับจำนวนประเภททางเศรษฐกิจและสังคมที่มีอยู่ ปรากฏการณ์ประเภทเศรษฐกิจและสังคมขึ้นอยู่กับองค์ประกอบ โครงสร้างของกลุ่มเนื้อเดียวกัน และการศึกษาความแปรผันในลักษณะภายในประชากรประเภทเดียวกันและกลุ่มประเภทเดียวกันโดยอาศัยการสร้างการจัดกลุ่มโครงสร้าง การแบ่งประชากรที่เป็นเนื้อเดียวกันออกเป็นกลุ่มบางกลุ่มซึ่งจะกำหนดลักษณะโครงสร้างเพิ่มเติมตามลักษณะการจัดกลุ่มบางอย่างเรียกว่าการจัดกลุ่มโครงสร้าง นอกจากนี้ยังมีการกล่าวถึงลักษณะเชิงปริมาณและลักษณะเฉพาะที่นี่ด้วย ตัวอย่างคือการจัดกลุ่มผู้ปฏิบัติงานคลังสินค้าตามคุณสมบัติ

ตามคุณลักษณะ กลุ่มจะแตกต่างกันในลักษณะของคุณลักษณะ คุณลักษณะเชิงปริมาณยังเกี่ยวข้องกับการกำหนดจำนวนกลุ่มและความกว้างของช่วงเวลาด้วย

ภารกิจหลักของการจัดกลุ่มทางสถิติ– การศึกษาความเชื่อมโยงและการพึ่งพาระหว่างคุณลักษณะของหน่วยของประชากรทางสถิติ ซึ่งแก้ไขได้โดยการสร้างกลุ่มเชิงวิเคราะห์ การจัดกลุ่มเชิงวิเคราะห์– นี่คือการจัดกลุ่มที่เปิดเผยความสัมพันธ์และการพึ่งพาซึ่งกันและกันระหว่างปรากฏการณ์ทางเศรษฐกิจและสังคมที่ศึกษาและลักษณะเฉพาะที่มีลักษณะเฉพาะ

คุณลักษณะทั้งหมดในวิทยาศาสตร์สถิติสามารถแบ่งออกเป็นแฟคทอเรียลและประสิทธิผลได้ สัญญาณที่มีอิทธิพลอย่างมากต่อการเปลี่ยนแปลงสัญญาณที่มีประสิทธิภาพเรียกว่า แฟกทอเรียล ลักษณะที่เปลี่ยนแปลงภายใต้อิทธิพลของลักษณะปัจจัยเรียกว่า มีประสิทธิภาพ.

งานที่สำคัญเมื่อสร้างการจัดกลุ่มเชิงวิเคราะห์คือการเลือกจำนวนกลุ่มที่จำเป็นในการแบ่งชุดหน่วยการสังเกตที่ศึกษาและการกำหนดขอบเขต

ข้อกำหนดที่ต้องปฏิบัติตามในกระบวนการสร้างกลุ่มวิเคราะห์คือ แต่ละกลุ่มที่ศึกษาจะต้องมีหน่วยประชากรที่เป็นเนื้อเดียวกันตามลักษณะการจัดกลุ่ม และจำนวนหน่วยในแต่ละกลุ่มที่ศึกษาต้องเพียงพอที่จะได้รับ ลักษณะทางสถิติวัตถุที่กำลังศึกษา

เรียกง่ายๆว่า การจัดกลุ่มถ้ากลุ่มเกิดขึ้นตามลักษณะเดียวเท่านั้น หากคุณแบ่งกลุ่มออกเป็นกลุ่มย่อยตามลักษณะเฉพาะกลุ่มดังกล่าวจะเรียกว่ารวมกัน

การผสมผสาน การจัดกลุ่มจะพิจารณาเมื่อประชากรถูกแบ่งออกเป็นกลุ่มตามลักษณะการจัดกลุ่มตั้งแต่สองลักษณะขึ้นไปที่นำมารวมกัน (รวมกัน) การจัดกลุ่มแบบผสมทำให้สามารถศึกษาหน่วยของประชากรพร้อมกันตามลักษณะหลายประการได้

เมื่อศึกษาปรากฏการณ์และกระบวนการทางเศรษฐกิจและสังคมที่ซับซ้อน จะใช้การจัดกลุ่มแบบผสมผสาน ในการสร้างการรวมกลุ่มแบบผสมผสาน จำเป็นต้องระบุความมีอยู่ที่เพียงพอ จำนวนมากการสังเกต

เพื่อค้นหาคลัสเตอร์ (ใน พื้นที่มิติ) วัตถุ (จุด) จะต้องถูกนำมาใช้ การจัดกลุ่มหลายมิติ มีการจัดกลุ่มตามข้อมูลที่ใช้:

1) หลัก – สร้างขึ้นบนพื้นฐานของข้อมูลเริ่มต้นที่ได้รับจากการสังเกตทางสถิติ

2) รอง - นี่เป็นผลมาจากการเชื่อมต่อหรือการแยกส่วนของกลุ่ม

3. หลักการจัดกลุ่มอาคาร

ในการสร้างการจัดกลุ่มทางสถิติ คุณต้องเลือกลักษณะการจัดกลุ่ม จากนั้นจึงกำหนดจำนวนกลุ่มที่จะแบ่งประชากรทางสถิติที่กำลังศึกษาอยู่ และกำหนดขอบเขตของช่วงการจัดกลุ่ม สำหรับแต่ละกลุ่ม จำเป็นต้องค้นหาตัวบ่งชี้หรือระบบที่เฉพาะเจาะจง ซึ่งควรระบุลักษณะกลุ่มที่กำลังศึกษา

การเลือกลักษณะการจัดกลุ่ม – คำถามที่ยากในทฤษฎีการจัดกลุ่มทางสถิติและการวิจัยทางสถิติโดยทั่วไป ลักษณะการจัดกลุ่มเป็นพื้นฐานในการแบ่งหน่วยประชากรออกเป็น แยกกลุ่ม- ความแม่นยำของข้อสรุปของการศึกษาทางสถิติขึ้นอยู่กับระดับความแม่นยำของลักษณะการจัดกลุ่ม

กลุ่มนี้ประกอบด้วยคุณลักษณะเชิงปริมาณและเชิงคุณภาพ (เชิงคุณภาพ) ลักษณะเชิงปริมาณมักจะมี นิพจน์ตัวเลข(เช่น ปริมาณผลผลิต อายุของบุคคล รายได้ของครอบครัว เป็นต้น) คุณลักษณะการระบุแหล่งที่มาให้คุณลักษณะเชิงคุณภาพของหน่วยประชากร (เช่น เพศ สถานภาพการสมรสการวางแนวทางการเมืองของบุคคล ฯลฯ) กลุ่มที่เลือกตามคุณลักษณะในการจัดกลุ่มจะต้องแตกต่างกัน ลักษณะเชิงคุณภาพเข้าสู่ระบบ. จำนวนกลุ่มที่มีการแบ่งประชากรทางสถิติขึ้นอยู่กับจำนวนการไล่ระดับของคุณลักษณะ

สิ่งสำคัญคือต้องศึกษา สาระสำคัญทางเศรษฐกิจปรากฏการณ์ที่กำลังศึกษาอยู่เมื่อสร้างการจัดกลุ่มตามลักษณะเชิงปริมาณ

หากต้องการกำหนดจำนวนกลุ่ม คุณสามารถใช้สูตร Sturgess ได้:

เอช+ 3,322 ? แอลจี ยังไม่มีข้อความ

ที่ไหน ชม.– จำนวนกลุ่ม

เอ็น– จำนวนหน่วยประชากร

แอลจีเอ็น – ลอการิทึมทศนิยมจาก N.

สูตรนี้แสดงให้เห็นว่าการเลือกจำนวนกลุ่มขึ้นอยู่กับขนาดของประชากร หลังจากกำหนดจำนวนกลุ่มแล้ว ประเด็นของการกำหนดช่วงเวลาการจัดกลุ่มจะถูกตัดสินใจ

ขึ้นอยู่กับช่วงเวลาของการจัดกลุ่ม คุณสามารถแยกความแตกต่างบางกลุ่มจากกลุ่มอื่นๆ ในเชิงปริมาณ และสรุปขอบเขตของการระบุคุณภาพใหม่ได้ ช่วงเวลาการจัดกลุ่มคือช่วงเวลาของค่าของคุณลักษณะที่แตกต่างกันซึ่งอยู่ภายใน กลุ่มใดกลุ่มหนึ่ง- แต่ละช่วงเวลามีความยาว (กว้าง) ขอบเขตบนและล่างของตัวเอง

ขีดจำกัดล่างของช่วงเวลาคือ ค่าที่น้อยที่สุดลักษณะเฉพาะในช่วงเวลา และขีดจำกัดบนของช่วงเวลาคือค่าที่ใหญ่ที่สุด ขีดจำกัดล่างของช่วงแรกถือเป็นค่าที่น้อยที่สุดของคุณลักษณะในชุดหน่วยการสังเกต ขีดจำกัดบนของช่วงสุดท้ายต้องไม่ต่ำกว่า มูลค่าสูงสุดลักษณะเฉพาะในชุดหน่วยสังเกตการณ์

ความกว้างช่วงคือความแตกต่างระหว่างขอบเขตบนและขอบเขตล่าง การจัดกลุ่มช่วง ขึ้นอยู่กับความกว้าง อาจเท่ากันหรือไม่เท่ากันก็ได้ ความเหลื่อมล้ำแบ่งออกเป็น เพิ่มขึ้นเรื่อยๆ ลดลงเรื่อยๆ ตามอำเภอใจ และเฉพาะทาง หากการแปรผันของคุณลักษณะปรากฏภายในขอบเขตที่ค่อนข้างแคบและมีการกระจายสม่ำเสมอ แสดงว่ากลุ่มจะถูกสร้างขึ้นในช่วงเวลาที่เท่ากัน

ค่าของช่วงเวลาที่เท่ากันถูกกำหนดโดยสูตรต่อไปนี้:

ชั่วโมง = R/n = (x สูงสุด – x นาที) / n,

โดยที่ x สูงสุด, x นาที – สูงสุด และ ค่าต่ำสุดลักษณะโดยรวม

n – จำนวนกลุ่ม

สูตรนี้เรียกว่าขั้นตอนช่วง ถ้าช่วงของการแปรผันของคุณลักษณะในการรวมมีขนาดใหญ่และค่าของลักษณะแตกต่างกันไม่เท่ากัน จะใช้การจัดกลุ่มด้วยช่วงเวลาที่ไม่เท่ากัน สามารถรับช่วงเวลาที่ไม่เท่ากันได้หากการจัดกลุ่มที่สร้างขึ้นโดยมีช่วงเวลาที่เท่ากันมีกลุ่มที่ไม่สะท้อน บางประเภทปรากฏการณ์หรือกระบวนการที่กำลังศึกษาอยู่หรือไม่มีหน่วยเดียวก็จำเป็นต้องเพิ่ม - รวมสองหน่วยขึ้นไปหรือ "ว่าง" ติดต่อกัน ช่วงเวลาเท่ากัน- การเลือกช่วงเวลาที่เท่ากันหรือไม่เท่ากันนั้นขึ้นอยู่กับระดับการเติมช่วงเวลา ช่วงเวลาการจัดกลุ่มสามารถปิดหรือเปิดได้ ปิด ช่วงเป็นช่วงที่ระบุขอบเขตบนและล่าง ช่วงเวลาที่เปิดมีขอบเขตเพียงขอบเขตเดียว (ขอบเขตบนสำหรับขอบเขตแรก ขอบเขตล่างสำหรับขอบเขตสุดท้าย) สู่ลักษณะเชิงปริมาณ สามารถจัดเป็นคุณลักษณะต่อเนื่องหรือแบบไม่ต่อเนื่องได้ หากกลุ่มอิงตามแอ็ตทริบิวต์ที่ไม่ต่อเนื่อง ขีดจำกัดล่างของช่วงเวลาที่ i จะเท่ากับขีดจำกัดบนของช่วงเวลาที่ i เพิ่มขึ้น 1

ในการจัดกลุ่มที่สะท้อนถึงคุณลักษณะเชิงคุณภาพและความจำเพาะของกลุ่มหน่วยประชากรที่แตกต่างกันภายใต้การศึกษาตามลักษณะเฉพาะจะใช้ช่วงเวลาเฉพาะ ช่วงเวลาพิเศษ - เป็นช่วงที่ใช้แยกแยะจากผลรวมประเภทเดียวกันตามเกณฑ์เดียวกันในปรากฏการณ์ที่อยู่ใน เงื่อนไขที่แตกต่างกัน- ขึ้นอยู่กับบทบาทของคุณลักษณะในความสัมพันธ์ระหว่างวัตถุ กระบวนการ หรือปรากฏการณ์ที่กำลังศึกษา สิ่งเหล่านี้สามารถแบ่งออกเป็นแฟกทอเรียลและผลลัพธ์ได้ คุณลักษณะของปัจจัยมีอิทธิพลต่อคุณลักษณะอื่น ๆ และคุณลักษณะการผลิตได้รับอิทธิพลจากคุณลักษณะอื่น ๆ

แยกแยะกลุ่มได้:

  1. หลัก, เรียบเรียงบนพื้นฐาน วัสดุหลักรวบรวมระหว่างการสังเกต
  2. รองรวบรวมบนพื้นฐานของหลักใช้ในสองกรณี:
    • เมื่อจำเป็นต้องจัดกลุ่มอย่างเป็นทางการขนาดเล็กให้เป็นกลุ่มใหญ่
    • เมื่อจำเป็นต้องทำการประเมินเปรียบเทียบวัสดุที่รวบรวมในสถานที่ต่าง ๆ และใช้วิธีการที่แตกต่างกัน
การจัดกลุ่มตามลักษณะตั้งแต่สองลักษณะขึ้นไปเรียกว่า - รวมกัน.
ลักษณะที่เรียกว่ากลุ่มหรือประเภทของปรากฏการณ์ การจัดกลุ่มหรือพื้นฐานการจัดกลุ่ม- พื้นฐานอาจเป็นเชิงปริมาณหรือเชิงประกอบก็ได้ แอตทริบิวต์– นี่คือสัญลักษณ์ที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า, ครู ฯลฯ )

ตัวอย่างหมายเลข 1 มีข้อมูลการกระจายต่อไปนี้ บริษัทการค้าตามจำนวนพนักงานในสองภูมิภาค


สร้าง การจัดกลุ่มรองข้อมูลการกระจายตัวของบริษัทโดยคำนวณข้อมูลจากภูมิภาคที่ 1 ใหม่ตามการจัดกลุ่มภูมิภาคที่ 2 ในภูมิภาคใด จำนวนเฉลี่ยคนงานมากขึ้นเหรอ?

สารละลาย:
กลุ่มแรก “น้อยกว่า 5” จะรวม 4/5 ของกลุ่ม “1-5” จำนวนบริษัทจะเป็น: 6*4/5 = 4.8 µm 5
กลุ่ม "5-10" รวมกลุ่ม "6-10" อย่างสมบูรณ์และเป็นส่วนหนึ่งของกลุ่ม "1-5" เช่น บริษัทเลขจะเป็น 4 + (6-5) = 5
กลุ่ม “11-20” จะรวมกลุ่ม “11-15” และส่วนหนึ่งของกลุ่ม “16-20” โดยสมบูรณ์ นั่นคือ ¼*50 = 12.5 µm 13
กลุ่ม "21-30" ประกอบด้วยกลุ่ม "16-20" และกลุ่ม "21-25" และกลุ่ม "มากกว่า 25" โดยสมบูรณ์ เราได้: (50-13) + 20 + 15 = 72


ค้นหาจำนวนพนักงานโดยเฉลี่ย:
สำหรับภาคแรก

ค่าเฉลี่ยถ่วงน้ำหนัก: x av = 1960/105 = 18.67

สำหรับภูมิภาคที่สอง


ค่าเฉลี่ยถ่วงน้ำหนัก: x av = 3502.5/117 = 29.94
ดังนั้นในภูมิภาคที่สอง จำนวนพนักงานโดยเฉลี่ยจึงสูงขึ้น

ตัวอย่างหมายเลข 2
การแบ่งคนงานตามระยะเวลาการทำงาน

หมายเลขกลุ่มกลุ่มคนงาน จำแนกตามอายุงาน ปีจำนวนคนงานคนจำนวนคนงานคิดเป็นเปอร์เซ็นต์ของทั้งหมด
ฉัน2-6 6 30,0
ครั้งที่สอง6-10 6 30,0
ที่สาม10-14 5 25,0
IV14-18 3 15,0
ทั้งหมด20 100,0

ในชุดการแจกแจง เพื่อความชัดเจน คุณลักษณะที่กำลังศึกษาจะคำนวณเป็นเปอร์เซ็นต์ ผลการจัดกลุ่มเบื้องต้นพบว่า 60.0% ของคนงานมีประสบการณ์มากถึง 10 ปี โดยแบ่งเป็น 2-6 ปีเท่ากัน - 30% และจาก 6-10 ปี - 30% และ 40% ของคนงานมีประสบการณ์จาก 10 ถึง 18 ปี
เพื่อศึกษาความสัมพันธ์ระหว่างประสบการณ์การทำงานและผลลัพธ์ จำเป็นต้องสร้างกลุ่มการวิเคราะห์ ที่ฐานเราจะใช้กลุ่มเดียวกันกับในชุดการแจกจ่าย เรานำเสนอผลลัพธ์การจัดกลุ่มในตารางที่ 2

ตารางที่ 2 - การจัดกลุ่มคนงานตามระยะเวลาการทำงาน

หมายเลขกลุ่มกลุ่มคนงานตามประสบการณ์จำนวนคนงานคนประสบการณ์การทำงานโดยเฉลี่ยปีผลลัพธ์ของผลิตภัณฑ์ถู
ทั้งหมดเพื่อทาสคนหนึ่ง
ฉัน2-6 6 3,25 1335,0 222,5
ครั้งที่สอง6-10 6 7,26 1613,0 268,8
ที่สาม10-14 5 11,95 1351,0 270,2
IV14-18 3 16,5 965,0 321,6
ทั้งหมด:20 8,62 5264 236

ในการกรอกตารางที่ 2 คุณต้องสร้างแผ่นงาน 3

ตารางที่ 3.

เลขที่กลุ่มคนงาน จำแนกตามอายุงาน ปีหมายเลขคนงานประสบการณ์ส่งออกเป็นถู
1 2 3 4 5
1 2-6 1, 2, 3, 4, 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
รวมสำหรับกลุ่ม:6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
รวมสำหรับกลุ่ม6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
รวมสำหรับกลุ่ม5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
รวมสำหรับกลุ่ม3 49,5 965
ทั้งหมด20 172.4 5264,0

การแบ่งคอลัมน์ (4:3); (5:3) แท็บ 3 เราได้รับข้อมูลที่เกี่ยวข้องเพื่อกรอกตารางที่ 2 นอกจากนี้สำหรับทุกกลุ่ม โดยการกรอกตารางที่ 2 เราจะได้ตารางการวิเคราะห์
เมื่อคำนวณตารางงานแล้วเราจะเปรียบเทียบผลลัพธ์สุดท้ายของตารางกับข้อมูลของเงื่อนไขปัญหาที่ต้องตรงกัน ดังนั้น นอกเหนือจากการสร้างกลุ่มและการค้นหาค่าเฉลี่ยแล้ว เรายังจะตรวจสอบการควบคุมทางคณิตศาสตร์ด้วย
จากการวิเคราะห์ตารางวิเคราะห์ที่ 2 เราสามารถสรุปได้ว่าลักษณะที่ศึกษา (ตัวชี้วัด) ขึ้นอยู่กับแต่ละอื่น ๆ ด้วยประสบการณ์การทำงานที่เพิ่มขึ้น ผลผลิตต่อพนักงานก็เพิ่มขึ้นอย่างต่อเนื่อง ผลลัพธ์ของคนงานกลุ่มที่สี่คือ 99.1 รูเบิล สูงกว่าครั้งแรกหรือ 44.5% เราพิจารณาตัวอย่างการจัดกลุ่มตามลักษณะหนึ่ง แต่ในหลายกรณี การจัดกลุ่มดังกล่าวไม่เพียงพอที่จะแก้ไขปัญหาที่ได้รับมอบหมาย ในกรณีเช่นนี้ จะดำเนินการจัดกลุ่มตามลักษณะตั้งแต่สองลักษณะขึ้นไป ได้แก่ เพื่อการรวมกัน ให้เราจัดกลุ่มข้อมูลรองตามผลผลิตเฉลี่ย
เรากำหนดลักษณะแต่ละกลุ่มตามจำนวนคนงาน ประสบการณ์การทำงานโดยเฉลี่ย ผลลัพธ์เฉลี่ย - รวมและการคำนวณต่อพนักงานแสดงไว้ในตารางที่ 4

ตารางที่ 4 - การจัดกลุ่มคนงานตามระยะเวลาการให้บริการและผลผลิตเฉลี่ย

เลขที่กลุ่มคนงานจำนวนคนงานคนเฉลี่ย ประสบการณ์การทำงานปีผลผลิตเฉลี่ยถู
โดยประสบการณ์ตามการผลิตโดยเฉลี่ย ต่อ ในถูทั้งหมดต่อคนงานหนึ่งคน
1 2-6 200,0-250,0 4 2,5 835,0 208,75
รวมสำหรับกลุ่ม6 3,25 1335,0 222,5
2 6-10 200,0-250,0 - - - -
3 10-14 200,0-250,0 1 12,5 230,0 230,0
รวมสำหรับกลุ่ม5 11,96 1351,0 270,2
4 14-18 200,0-250,0 - - - -
รวมสำหรับกลุ่ม3 16,5 965,0 321,6
รวมเป็นรายกลุ่ม200,0-250,0 5 3,0 1065,0 213,0
ทั้งหมด20 8,62 5264 263,2

ในการสร้างการจัดกลุ่มเชิงวิเคราะห์รองตามผลผลิตผลิตภัณฑ์โดยเฉลี่ยภายในกลุ่มที่สร้างขึ้นครั้งแรก เราจะกำหนดช่วงเวลาของการจัดกลุ่มรองโดยเน้นสามกลุ่ม ได้แก่ น้อยกว่าในกลุ่มเดิมหนึ่งรายการ
จากนั้น i=(350-200)/3 = 50 ถู
ไม่มีประโยชน์ที่จะรับหลายกลุ่มมากขึ้น จะมีช่วงเวลาสั้นมาก เป็นไปได้น้อย ข้อมูลสุดท้ายของกลุ่มคำนวณเป็นผลรวมของประสบการณ์ของกลุ่ม ส่ง 19 ปีแรก 5 ปี หารด้วยจำนวนคนงาน - 6 คน เราได้ 3.25 ปี
ข้อมูลในตารางแสดงให้เห็นว่าผลผลิตของผลิตภัณฑ์ขึ้นอยู่กับประสบการณ์การทำงานโดยตรง

บางครั้งการจัดกลุ่มเริ่มแรกไม่ได้ระบุลักษณะของการกระจายตัวของหน่วยประชากรอย่างชัดเจน หรือนำการจัดกลุ่มไปเป็นประเภทที่เทียบเคียงกันเพื่อดำเนินการได้ การวิเคราะห์เปรียบเทียบจำเป็นต้องเปลี่ยนการจัดกลุ่มที่มีอยู่บ้าง: เพื่อรวมกลุ่มที่ค่อนข้างเล็กที่ระบุก่อนหน้านี้เป็นกลุ่มทั่วไปที่ใหญ่กว่าจำนวนเล็กน้อย หรือเปลี่ยนขอบเขตของกลุ่มก่อนหน้านี้เพื่อทำให้การจัดกลุ่มสามารถเทียบเคียงได้กับกลุ่มอื่น ๆ