ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

อนุกรมการเปลี่ยนแปลงช่วงเวลาในช่วงเวลาที่เท่ากัน สำหรับนักเรียนและเด็กนักเรียน - ช่วยในการเรียน

เมื่อประมวลผลข้อมูลจำนวนมากซึ่งมีความสำคัญอย่างยิ่งเมื่อดำเนินการที่ทันสมัย พัฒนาการทางวิทยาศาสตร์ผู้วิจัยต้องเผชิญกับงานที่จริงจังในการจัดกลุ่มข้อมูลเริ่มต้นอย่างถูกต้อง หากข้อมูลไม่ต่อเนื่องกันก็ไม่มีปัญหาตามที่เราเห็น - คุณเพียงแค่ต้องคำนวณความถี่ของแต่ละคุณสมบัติ หากมีลักษณะที่ศึกษาอยู่ ต่อเนื่องอักขระ (ซึ่งพบได้ทั่วไปในทางปฏิบัติ) ดังนั้นการเลือกจำนวนช่วงเวลาที่เหมาะสมที่สุดสำหรับการจัดกลุ่มคุณลักษณะจึงไม่ใช่เรื่องเล็กน้อย

สำหรับการจัดกลุ่มตัวแปรสุ่มแบบต่อเนื่อง ทั้งหมด ช่วงการเปลี่ยนแปลงคุณสมบัติแบ่งออกเป็นหลายช่วง ถึง.

ช่วงเวลาที่จัดกลุ่ม (ต่อเนื่อง) ชุดการเปลี่ยนแปลง เรียกว่า ช่วงเวลา จัดอันดับโดยค่าของคุณสมบัติ () ซึ่งระบุพร้อมกับความถี่ที่สอดคล้องกัน () จำนวนการสังเกตที่ตกอยู่ในช่วง r "th หรือความถี่สัมพัทธ์ ():

ช่วงค่าลักษณะเฉพาะ

ไมล์ความถี่

แผนภูมิแท่งและ สะสม (ogiva),ที่เรากล่าวถึงในรายละเอียดแล้วเป็นเครื่องมือแสดงภาพข้อมูลที่ยอดเยี่ยมที่ช่วยให้คุณได้รับความเข้าใจเบื้องต้นเกี่ยวกับโครงสร้างข้อมูล กราฟดังกล่าว (รูปที่ 1.15) สร้างขึ้นสำหรับข้อมูลต่อเนื่องในลักษณะเดียวกับข้อมูลแยก โดยคำนึงถึงข้อเท็จจริงที่ว่าข้อมูลต่อเนื่องเติมเต็มพื้นที่ของค่าที่เป็นไปได้อย่างสมบูรณ์ โดยรับค่าใดๆ

ข้าว. 1.15 น.

นั่นเป็นเหตุผล คอลัมน์บนฮิสโตแกรมและสะสมต้องติดต่อกันไม่มีพื้นที่ที่ค่าแอตทริบิวต์ไม่อยู่ในขอบเขตที่เป็นไปได้ทั้งหมด(เช่นฮิสโตแกรมและสะสมไม่ควรมี "รู" ตามแกน abscissa ซึ่งค่าของตัวแปรที่ศึกษาจะไม่ตกดังรูปที่ 1.16) ความสูงของแท่งสอดคล้องกับความถี่ - จำนวนของการสังเกตที่ตกอยู่ในช่วงเวลาที่กำหนด หรือความถี่สัมพัทธ์ - สัดส่วนของการสังเกต ช่วงเวลา ต้องไม่ข้ามและมักจะมีความกว้างเท่ากัน

ข้าว. 1.16.

ฮิสโตแกรมและรูปหลายเหลี่ยมเป็นการประมาณเส้นโค้งความหนาแน่นของความน่าจะเป็น ( ฟังก์ชันดิฟเฟอเรนเชียล) ฉ(x)การกระจายเชิงทฤษฎีพิจารณาในหลักสูตรทฤษฎีความน่าจะเป็น ดังนั้นการก่อสร้างของพวกเขาจึงมีความสำคัญในการประมวลผลทางสถิติเบื้องต้นของข้อมูลต่อเนื่องเชิงปริมาณ - ด้วยรูปแบบของพวกเขาเราสามารถตัดสินกฎการกระจายสมมุติฐานได้

สะสม - เส้นโค้งของความถี่สะสม (ความถี่) ของชุดการเปลี่ยนแปลงช่วงเวลา กราฟของฟังก์ชันการแจกแจงแบบอินทิกรัลจะถูกเปรียบเทียบกับแบบสะสม เอฟ(x)พิจารณาในหลักสูตรของทฤษฎีความน่าจะเป็น

โดยพื้นฐานแล้ว แนวคิดของฮิสโตแกรมและคิวมูเลตนั้นเชื่อมโยงอย่างแม่นยำกับข้อมูลต่อเนื่องและอนุกรมการแปรผันของช่วงเวลา เนื่องจากกราฟเป็นค่าประมาณเชิงประจักษ์ของฟังก์ชันความหนาแน่นของความน่าจะเป็นและฟังก์ชันการกระจายตามลำดับ

การสร้างชุดการเปลี่ยนแปลงของช่วงเวลาเริ่มต้นด้วยการกำหนดจำนวนของช่วงเวลา เคและงานนี้อาจเป็นงานที่ยาก สำคัญ และขัดแย้งที่สุดในประเด็นที่กำลังศึกษาอยู่

จำนวนช่วงเวลาไม่ควรน้อยเกินไป เนื่องจากฮิสโตแกรมจะเรียบเกินไป ( เรียบเกินไป),สูญเสียคุณสมบัติทั้งหมดของความแปรปรวนของข้อมูลเริ่มต้น - ในรูป 1.17 คุณสามารถดูว่าข้อมูลเดียวกันกับที่กราฟของรูปที่ 1.15 ใช้เพื่อสร้างฮิสโตแกรมที่มีจำนวนช่วงน้อยกว่า (กราฟด้านซ้าย)

ในเวลาเดียวกันจำนวนของช่วงเวลาไม่ควรใหญ่เกินไป - มิฉะนั้นเราจะไม่สามารถประเมินความหนาแน่นของการกระจายของข้อมูลที่ศึกษาตามแกนตัวเลขได้: ฮิสโตแกรมจะไม่เรียบ (เรียบ)ด้วยช่วงที่ไม่เต็ม ไม่สม่ำเสมอ (ดูรูปที่ 1.17 กราฟด้านขวา)

ข้าว. 1.17.

จะกำหนดจำนวนช่วงเวลาที่ต้องการมากที่สุดได้อย่างไร

ย้อนกลับไปในปี 1926 Herbert Sturges ได้เสนอสูตรสำหรับคำนวณจำนวนช่วงเวลาที่จำเป็นต้องแบ่งชุดค่าเริ่มต้นของแอตทริบิวต์ที่ศึกษา สูตรนี้ได้รับความนิยมอย่างมาก - ตำราทางสถิติส่วนใหญ่นำเสนอและแพ็คเกจทางสถิติจำนวนมากใช้เป็นค่าเริ่มต้น ไม่ว่าจะเป็นความชอบธรรมและในทุกกรณีเป็นคำถามที่ร้ายแรงมาก

แล้วสูตรของ Sturges ขึ้นอยู่กับอะไร?

พิจารณา การกระจายทวินามซึ่งขอบเขตบนรวมหมายเลขสุดท้ายของซีรีส์อันดับ

เรากำลังสร้าง ซีรีย์ช่วงเวลา(ตารางที่ 2.3)

ช่วงการกระจายของ บริษัท แต่จำนวนผู้จัดการเฉลี่ยในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน

บทสรุป.กลุ่มบริษัทที่มีจำนวนมากที่สุดคือกลุ่มที่มีจำนวนผู้จัดการเฉลี่ย 25-30 คน ซึ่งรวมถึง 8 บริษัท (27%) กลุ่มที่เล็กที่สุดที่มีจำนวนผู้จัดการเฉลี่ย 40-45 คนรวมบริษัทเพียงแห่งเดียว (3%)

โดยใช้ตารางข้อมูลเดิม 2.1 เช่นเดียวกับชุดช่วงเวลาของการกระจาย บริษัท ตามจำนวนผู้จัดการ (ตารางที่ 2.3) ที่จำเป็นสร้างกลุ่มเชิงวิเคราะห์ของความสัมพันธ์ระหว่างจำนวนผู้จัดการและปริมาณการขายของ บริษัท และสรุปผลเกี่ยวกับการมีอยู่ (หรือไม่มี) ของความสัมพันธ์ระหว่างสัญญาณที่ระบุ

วิธีการแก้:

การจัดกลุ่มเชิงวิเคราะห์ถูกสร้างขึ้นบนพื้นฐานปัจจัย ในปัญหาของเรา เครื่องหมายตัวประกอบ (x) คือจำนวนผู้จัดการ และเครื่องหมายผลลัพธ์ (y) คือปริมาณการขาย (ตารางที่ 2.4)

มาสร้างกันเถอะ การจัดกลุ่มเชิงวิเคราะห์(ตารางที่ 2.5)

บทสรุป.จากข้อมูลของการจัดกลุ่มเชิงวิเคราะห์ที่สร้างขึ้น อาจกล่าวได้ว่าด้วยจำนวนผู้จัดการฝ่ายขายที่เพิ่มขึ้น ปริมาณการขายเฉลี่ยของบริษัทในกลุ่มก็เพิ่มขึ้นเช่นกัน ซึ่งบ่งชี้ว่ามีความสัมพันธ์โดยตรงระหว่างคุณลักษณะเหล่านี้

ตารางที่ 2.4

ตารางเสริมสำหรับการสร้างกลุ่มการวิเคราะห์

จำนวนผู้จัดการ คน

เบอร์บริษัท

ปริมาณการขาย, ล้านรูเบิล, y

» = 59 f = 9.97

ฉัน™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

ที่ = ’ =10,31 30

ตารางที่ 2.5

ปริมาณการขายขึ้นอยู่กับจำนวนผู้จัดการ บริษัท ในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน

คำถามทดสอบ
  • 1. สาระสำคัญของการสังเกตทางสถิติคืออะไร?
  • 2. บอกชื่อขั้นตอนของการสังเกตทางสถิติ
  • 3. คืออะไร รูปแบบองค์กรการสังเกตทางสถิติ?
  • 4. บอกประเภทของการสังเกตทางสถิติ
  • 5. สรุปสถิติคืออะไร?
  • 6. ตั้งชื่อประเภทของรายงานสถิติ
  • 7. การจัดกลุ่มทางสถิติคืออะไร?
  • 8. ตั้งชื่อประเภทของการจัดกลุ่มทางสถิติ
  • 9. ชุดการจัดจำหน่ายคืออะไร?
  • 10. ตั้งชื่อองค์ประกอบโครงสร้างของชุดการกระจาย
  • 11. การสร้างชุดการแจกจ่ายมีขั้นตอนอย่างไร