อนุกรมการเปลี่ยนแปลงช่วงเวลาในช่วงเวลาที่เท่ากัน สำหรับนักเรียนและเด็กนักเรียน - ช่วยในการเรียน
เมื่อประมวลผลข้อมูลจำนวนมากซึ่งมีความสำคัญอย่างยิ่งเมื่อดำเนินการที่ทันสมัย พัฒนาการทางวิทยาศาสตร์ผู้วิจัยต้องเผชิญกับงานที่จริงจังในการจัดกลุ่มข้อมูลเริ่มต้นอย่างถูกต้อง หากข้อมูลไม่ต่อเนื่องกันก็ไม่มีปัญหาตามที่เราเห็น - คุณเพียงแค่ต้องคำนวณความถี่ของแต่ละคุณสมบัติ หากมีลักษณะที่ศึกษาอยู่ ต่อเนื่องอักขระ (ซึ่งพบได้ทั่วไปในทางปฏิบัติ) ดังนั้นการเลือกจำนวนช่วงเวลาที่เหมาะสมที่สุดสำหรับการจัดกลุ่มคุณลักษณะจึงไม่ใช่เรื่องเล็กน้อย
สำหรับการจัดกลุ่มตัวแปรสุ่มแบบต่อเนื่อง ทั้งหมด ช่วงการเปลี่ยนแปลงคุณสมบัติแบ่งออกเป็นหลายช่วง ถึง.
ช่วงเวลาที่จัดกลุ่ม (ต่อเนื่อง) ชุดการเปลี่ยนแปลง เรียกว่า ช่วงเวลา จัดอันดับโดยค่าของคุณสมบัติ () ซึ่งระบุพร้อมกับความถี่ที่สอดคล้องกัน () จำนวนการสังเกตที่ตกอยู่ในช่วง r "th หรือความถี่สัมพัทธ์ ():
ช่วงค่าลักษณะเฉพาะ |
||||||
ไมล์ความถี่ |
แผนภูมิแท่งและ สะสม (ogiva),ที่เรากล่าวถึงในรายละเอียดแล้วเป็นเครื่องมือแสดงภาพข้อมูลที่ยอดเยี่ยมที่ช่วยให้คุณได้รับความเข้าใจเบื้องต้นเกี่ยวกับโครงสร้างข้อมูล กราฟดังกล่าว (รูปที่ 1.15) สร้างขึ้นสำหรับข้อมูลต่อเนื่องในลักษณะเดียวกับข้อมูลแยก โดยคำนึงถึงข้อเท็จจริงที่ว่าข้อมูลต่อเนื่องเติมเต็มพื้นที่ของค่าที่เป็นไปได้อย่างสมบูรณ์ โดยรับค่าใดๆ
ข้าว. 1.15 น.
นั่นเป็นเหตุผล คอลัมน์บนฮิสโตแกรมและสะสมต้องติดต่อกันไม่มีพื้นที่ที่ค่าแอตทริบิวต์ไม่อยู่ในขอบเขตที่เป็นไปได้ทั้งหมด(เช่นฮิสโตแกรมและสะสมไม่ควรมี "รู" ตามแกน abscissa ซึ่งค่าของตัวแปรที่ศึกษาจะไม่ตกดังรูปที่ 1.16) ความสูงของแท่งสอดคล้องกับความถี่ - จำนวนของการสังเกตที่ตกอยู่ในช่วงเวลาที่กำหนด หรือความถี่สัมพัทธ์ - สัดส่วนของการสังเกต ช่วงเวลา ต้องไม่ข้ามและมักจะมีความกว้างเท่ากัน
ข้าว. 1.16.
ฮิสโตแกรมและรูปหลายเหลี่ยมเป็นการประมาณเส้นโค้งความหนาแน่นของความน่าจะเป็น ( ฟังก์ชันดิฟเฟอเรนเชียล) ฉ(x)การกระจายเชิงทฤษฎีพิจารณาในหลักสูตรทฤษฎีความน่าจะเป็น ดังนั้นการก่อสร้างของพวกเขาจึงมีความสำคัญในการประมวลผลทางสถิติเบื้องต้นของข้อมูลต่อเนื่องเชิงปริมาณ - ด้วยรูปแบบของพวกเขาเราสามารถตัดสินกฎการกระจายสมมุติฐานได้
สะสม - เส้นโค้งของความถี่สะสม (ความถี่) ของชุดการเปลี่ยนแปลงช่วงเวลา กราฟของฟังก์ชันการแจกแจงแบบอินทิกรัลจะถูกเปรียบเทียบกับแบบสะสม เอฟ(x)พิจารณาในหลักสูตรของทฤษฎีความน่าจะเป็น
โดยพื้นฐานแล้ว แนวคิดของฮิสโตแกรมและคิวมูเลตนั้นเชื่อมโยงอย่างแม่นยำกับข้อมูลต่อเนื่องและอนุกรมการแปรผันของช่วงเวลา เนื่องจากกราฟเป็นค่าประมาณเชิงประจักษ์ของฟังก์ชันความหนาแน่นของความน่าจะเป็นและฟังก์ชันการกระจายตามลำดับ
การสร้างชุดการเปลี่ยนแปลงของช่วงเวลาเริ่มต้นด้วยการกำหนดจำนวนของช่วงเวลา เคและงานนี้อาจเป็นงานที่ยาก สำคัญ และขัดแย้งที่สุดในประเด็นที่กำลังศึกษาอยู่
จำนวนช่วงเวลาไม่ควรน้อยเกินไป เนื่องจากฮิสโตแกรมจะเรียบเกินไป ( เรียบเกินไป),สูญเสียคุณสมบัติทั้งหมดของความแปรปรวนของข้อมูลเริ่มต้น - ในรูป 1.17 คุณสามารถดูว่าข้อมูลเดียวกันกับที่กราฟของรูปที่ 1.15 ใช้เพื่อสร้างฮิสโตแกรมที่มีจำนวนช่วงน้อยกว่า (กราฟด้านซ้าย)
ในเวลาเดียวกันจำนวนของช่วงเวลาไม่ควรใหญ่เกินไป - มิฉะนั้นเราจะไม่สามารถประเมินความหนาแน่นของการกระจายของข้อมูลที่ศึกษาตามแกนตัวเลขได้: ฮิสโตแกรมจะไม่เรียบ (เรียบ)ด้วยช่วงที่ไม่เต็ม ไม่สม่ำเสมอ (ดูรูปที่ 1.17 กราฟด้านขวา)
ข้าว. 1.17.
จะกำหนดจำนวนช่วงเวลาที่ต้องการมากที่สุดได้อย่างไร
ย้อนกลับไปในปี 1926 Herbert Sturges ได้เสนอสูตรสำหรับคำนวณจำนวนช่วงเวลาที่จำเป็นต้องแบ่งชุดค่าเริ่มต้นของแอตทริบิวต์ที่ศึกษา สูตรนี้ได้รับความนิยมอย่างมาก - ตำราทางสถิติส่วนใหญ่นำเสนอและแพ็คเกจทางสถิติจำนวนมากใช้เป็นค่าเริ่มต้น ไม่ว่าจะเป็นความชอบธรรมและในทุกกรณีเป็นคำถามที่ร้ายแรงมาก
แล้วสูตรของ Sturges ขึ้นอยู่กับอะไร?
พิจารณา การกระจายทวินามซึ่งขอบเขตบนรวมหมายเลขสุดท้ายของซีรีส์อันดับ
เรากำลังสร้าง ซีรีย์ช่วงเวลา(ตารางที่ 2.3)
ช่วงการกระจายของ บริษัท แต่จำนวนผู้จัดการเฉลี่ยในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน
บทสรุป.กลุ่มบริษัทที่มีจำนวนมากที่สุดคือกลุ่มที่มีจำนวนผู้จัดการเฉลี่ย 25-30 คน ซึ่งรวมถึง 8 บริษัท (27%) กลุ่มที่เล็กที่สุดที่มีจำนวนผู้จัดการเฉลี่ย 40-45 คนรวมบริษัทเพียงแห่งเดียว (3%)
โดยใช้ตารางข้อมูลเดิม 2.1 เช่นเดียวกับชุดช่วงเวลาของการกระจาย บริษัท ตามจำนวนผู้จัดการ (ตารางที่ 2.3) ที่จำเป็นสร้างกลุ่มเชิงวิเคราะห์ของความสัมพันธ์ระหว่างจำนวนผู้จัดการและปริมาณการขายของ บริษัท และสรุปผลเกี่ยวกับการมีอยู่ (หรือไม่มี) ของความสัมพันธ์ระหว่างสัญญาณที่ระบุ
วิธีการแก้:
การจัดกลุ่มเชิงวิเคราะห์ถูกสร้างขึ้นบนพื้นฐานปัจจัย ในปัญหาของเรา เครื่องหมายตัวประกอบ (x) คือจำนวนผู้จัดการ และเครื่องหมายผลลัพธ์ (y) คือปริมาณการขาย (ตารางที่ 2.4)
มาสร้างกันเถอะ การจัดกลุ่มเชิงวิเคราะห์(ตารางที่ 2.5)
บทสรุป.จากข้อมูลของการจัดกลุ่มเชิงวิเคราะห์ที่สร้างขึ้น อาจกล่าวได้ว่าด้วยจำนวนผู้จัดการฝ่ายขายที่เพิ่มขึ้น ปริมาณการขายเฉลี่ยของบริษัทในกลุ่มก็เพิ่มขึ้นเช่นกัน ซึ่งบ่งชี้ว่ามีความสัมพันธ์โดยตรงระหว่างคุณลักษณะเหล่านี้
ตารางที่ 2.4
ตารางเสริมสำหรับการสร้างกลุ่มการวิเคราะห์
จำนวนผู้จัดการ คน |
เบอร์บริษัท |
ปริมาณการขาย, ล้านรูเบิล, y |
|
» = 59 f = 9.97 |
|||
ฉัน™ 4 - Yu.22 |
|||
74 '25 1PY1 U4 = 7 = 10,61 |
ที่ = ’ =10,31 30 |
ตารางที่ 2.5
ปริมาณการขายขึ้นอยู่กับจำนวนผู้จัดการ บริษัท ในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน
คำถามทดสอบ- 1. สาระสำคัญของการสังเกตทางสถิติคืออะไร?
- 2. บอกชื่อขั้นตอนของการสังเกตทางสถิติ
- 3. คืออะไร รูปแบบองค์กรการสังเกตทางสถิติ?
- 4. บอกประเภทของการสังเกตทางสถิติ
- 5. สรุปสถิติคืออะไร?
- 6. ตั้งชื่อประเภทของรายงานสถิติ
- 7. การจัดกลุ่มทางสถิติคืออะไร?
- 8. ตั้งชื่อประเภทของการจัดกลุ่มทางสถิติ
- 9. ชุดการจัดจำหน่ายคืออะไร?
- 10. ตั้งชื่อองค์ประกอบโครงสร้างของชุดการกระจาย
- 11. การสร้างชุดการแจกจ่ายมีขั้นตอนอย่างไร