ชีวประวัติ ข้อมูลจำเพาะ การวิเคราะห์

หมวดสถิติพื้นฐาน. ค่าสัมประสิทธิ์ความสัมพันธ์ของคุณลักษณะเชิงคุณภาพ

วิธีการจัดกลุ่มทำให้คุณสามารถศึกษาสถานะและความสัมพันธ์ได้ ปรากฏการณ์ทางเศรษฐกิจหากกลุ่มมีลักษณะเฉพาะด้วยตัวบ่งชี้ที่เผยให้เห็นแง่มุมที่สำคัญที่สุดของปรากฏการณ์ภายใต้การศึกษา

เมื่อวิเคราะห์และวางแผนจำเป็นต้องไม่พึ่งพา ข้อเท็จจริงแบบสุ่มแต่บนตัวบ่งชี้ที่แสดงหลัก ทั่วไป ราก ลักษณะนี้จะได้รับ ชนิดต่างๆค่าเฉลี่ย เช่นเดียวกับฐานนิยมและค่ามัธยฐาน

คำถามเกี่ยวกับความเป็นเนื้อเดียวกันของประชากรไม่ควรได้รับการตัดสินอย่างเป็นทางการในแง่ของรูปแบบการกระจาย เช่นเดียวกับคำถามของค่าเฉลี่ยทั่วไป จะต้องตัดสินใจบนพื้นฐานของสาเหตุและเงื่อนไขที่ก่อตัวเป็นประชากร ความเป็นเนื้อเดียวกันคือชุดดังกล่าว หน่วยที่ก่อตัวขึ้นภายใต้อิทธิพลของสาเหตุหลักทั่วไปและเงื่อนไขที่กำหนด ระดับทั่วไปของคุณลักษณะนี้ ลักษณะของประชากรทั้งหมด

ตามทฤษฎีการจัดกลุ่มแบบแผน สำคัญในการประเมินความเป็นเนื้อเดียวกันของประชากร มันไม่ได้ขึ้นอยู่กับรูปแบบของการกระจาย แต่ขึ้นอยู่กับขนาดของการแปรผันและเงื่อนไขในการก่อตัวของมัน ชุดที่เป็นเนื้อเดียวกันในเชิงคุณภาพมีลักษณะเฉพาะโดยการเปลี่ยนแปลงภายในขอบเขตที่กำหนด หลังจากนั้นคุณภาพใหม่จะเริ่มต้นขึ้น ในเวลาเดียวกัน เพื่อประเมินความเป็นเนื้อเดียวกันเชิงคุณภาพของมวลรวม ขีดจำกัดเหล่านี้ต้องเข้าหาจากมุมมองของสาระสำคัญของเรื่อง ไม่ใช่อย่างเป็นทางการ เนื่องจากปริมาณเดียวกันภายใต้เงื่อนไขที่แตกต่างกันเป็นการแสดงออกถึงคุณภาพใหม่ ตัวอย่างเช่น ด้วยจำนวนคนงานที่เท่ากัน วิสาหกิจของอุตสาหกรรมบางสาขามีขนาดใหญ่ ในขณะที่สาขาอื่นมีขนาดเล็ก

เพื่อให้ครอบคลุมและ การศึกษาเชิงลึกปรากฏการณ์เพื่อที่จะกำหนดลักษณะประเภทของปรากฏการณ์ความสัมพันธ์และกระบวนการอย่างเป็นกลางเนื่องจากการพัฒนาระบบโดยรวมจำเป็นต้องรวมค่าเฉลี่ยกลุ่มเข้ากับค่าเฉลี่ยทั่วไป การรวมกันของค่าเฉลี่ยดังกล่าวเป็นหนึ่งในองค์ประกอบหลักของการวิเคราะห์ระบบที่ซับซ้อน ชุดค่าผสมนี้รวมเข้าด้วยกันเป็นหนึ่งเดียวทั้งสองส่วนเสริมที่เป็นธรรมชาติ วิธีการทางสถิติ: วิธีหาค่าเฉลี่ยและวิธีแบ่งกลุ่ม. เมื่อคำนวณค่าเฉลี่ย แต่ละค่าที่แตกต่างกันไปตามกลุ่มจะถูกแทนที่ด้วยค่าเฉลี่ยหนึ่งค่า ในนั้น การเบี่ยงเบนแบบสุ่มค่าของแอตทริบิวต์สำหรับแต่ละหน่วยในทิศทางที่เพิ่มขึ้นหรือลดลงนั้นสมดุลกันและยกเลิกซึ่งกันและกัน และค่าเฉลี่ยจะแสดงขนาดทั่วไปของคุณลักษณะแอตทริบิวต์ของกลุ่มนี้ ค่าเฉลี่ยทำหน้าที่เป็นลักษณะของประชากรและในขณะเดียวกันก็หมายถึงองค์ประกอบส่วนบุคคล - ผู้ให้บริการคุณสมบัติเชิงคุณภาพของปรากฏการณ์ ความหมายของค่าเฉลี่ยค่อนข้างเป็นรูปธรรม แต่ในขณะเดียวกันก็เป็นนามธรรม มันได้มาจากการสุ่มบุคคลสำหรับแต่ละหน่วยเพื่อระบุทั่วไปซึ่งเป็นลักษณะเฉพาะของทุกหน่วยและรูปแบบ ชุดนี้. เมื่อคำนวณค่าเฉลี่ยจำนวนหน่วยประชากรควรมีมากพอ ค่าเฉลี่ยหมายถึงอัตราส่วนของปริมาตรรวมของปรากฏการณ์ต่อจำนวนหน่วยประชากรในกลุ่ม สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม นี่จะเป็นค่าเฉลี่ยเลขคณิตอย่างง่าย:

และสำหรับข้อมูลที่จัดกลุ่ม ซึ่งแต่ละค่าคุณลักษณะมีความถี่ของตัวเอง ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:

ที่ไหน X ฉัน- ค่าของคุณลักษณะ ผมคือความถี่ของค่าคุณลักษณะเหล่านี้

เนื่องจากค่าเฉลี่ยเลขคณิตคำนวณเป็นอัตราส่วนของผลรวมของค่าลักษณะเฉพาะถึง ความแข็งแรงทั้งหมดมันไม่เคยไปไกลกว่าค่าเหล่านี้ ค่าเฉลี่ยเลขคณิตมีคุณสมบัติหลายอย่างที่ใช้กันอย่างแพร่หลายเพื่อปรับปรุงการคำนวณ

1. ผลรวมของการเบี่ยงเบน ค่าส่วนบุคคลเครื่องหมายจากค่าเฉลี่ยเป็นศูนย์เสมอ:

การพิสูจน์. น

แยกซ้ายและ ด้านขวาบน

2. หากค่าคุณลักษณะ (X i) มีการเปลี่ยนแปลง เคครั้ง ค่าเฉลี่ยเลขคณิตก็จะเปลี่ยนไปด้วย xครั้งหนึ่ง.

การพิสูจน์.

เราแสดงค่าเฉลี่ยเลขคณิตของค่าใหม่ของแอตทริบิวต์ด้วย X จากนั้น:

ค่าคงที่ 1/เคนำออกจากเครื่องหมายผลรวม แล้วเราจะได้:

3. หากออกจากค่าคุณลักษณะทั้งหมด เอ็กซ์ ผมลบหรือบวกจำนวนคงที่เดียวกัน แล้วค่าเฉลี่ยเลขคณิตจะลดลงหรือเพิ่มขึ้นตามจำนวนนั้น

การพิสูจน์.

ค่าเฉลี่ยของการเบี่ยงเบนของค่าลักษณะเฉพาะจาก จำนวนคงที่จะเท่ากับ:

สิ่งนี้ได้รับการพิสูจน์ในลักษณะเดียวกันในกรณีของการเพิ่มจำนวนคงที่

4. หากความถี่ของค่าคุณลักษณะทั้งหมดลดลงหรือเพิ่มขึ้น ครั้ง ค่าเฉลี่ยจะไม่เปลี่ยนแปลง:

หากมีข้อมูลเกี่ยวกับปริมาณทั้งหมดและค่าที่ทราบของลักษณะ แต่ไม่ทราบความถี่ สูตรค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักจะถูกใช้เพื่อกำหนดค่าเฉลี่ย

ตัวอย่างเช่น ข้อมูลเกี่ยวกับราคาขายกะหล่ำปลีและรายได้รวมสำหรับช่วงเวลาการขายต่างๆ มีให้ (ตารางที่ 1)

ตารางที่ 1.

ราคาขายกะหล่ำปลีและรายได้รวมสำหรับช่วงเวลาการขายต่างๆ


เนื่องจากราคาเฉลี่ยคืออัตราส่วนของรายได้รวมต่อปริมาณกะหล่ำปลีที่ขายทั้งหมด อันดับแรกจำเป็นต้องกำหนดปริมาณกะหล่ำปลีที่ขายสำหรับช่วงเวลาการขายที่แตกต่างกันเป็นอัตราส่วนของรายได้ต่อราคา แล้วจึงกำหนด ราคาเฉลี่ยขายกะหล่ำปลี

ในตัวอย่างของเรา ราคาเฉลี่ยจะเป็น:

ถ้าคำนวณเป็น กรณีนี้ราคาขายเฉลี่ยตามค่าเฉลี่ยเลขคณิตอย่างง่ายเราจะได้ผลลัพธ์ที่แตกต่างกันซึ่งจะบิดเบือนสถานการณ์ที่แท้จริงและประเมินราคาขายเฉลี่ยสูงเกินไปเนื่องจากข้อเท็จจริงที่ว่ายอดขายส่วนใหญ่ตกอยู่กับกะหล่ำปลีปลายที่มีราคาที่ต่ำกว่าจะไม่ นำมาพิจารณา.

บางครั้งจำเป็นต้องกำหนดค่าเฉลี่ยเมื่อกำหนดค่าลักษณะเฉพาะในแบบฟอร์ม ตัวเลขเศษส่วนนั่นคือส่วนกลับของจำนวนเต็ม (ตัวอย่างเช่น เมื่อศึกษาผลิตภาพแรงงานผ่านตัวบ่งชี้ผกผัน ความเข้มแรงงาน) ในกรณีเช่นนี้ ขอแนะนำให้ใช้สูตรค่าเฉลี่ยฮาร์มอนิก:

ดังนั้น เวลาเฉลี่ยที่ต้องใช้ในการผลิตหน่วยเอาต์พุตจึงเป็นค่าเฉลี่ยฮาร์มอนิก ถ้า X 1 \u003d 1/4 ชั่วโมง X 2 \u003d 1/2 ชั่วโมง X 3 \u003d 1/3 ชั่วโมง ค่าเฉลี่ยฮาร์มอนิกของตัวเลขเหล่านี้คือ:

ในการคำนวณค่าเฉลี่ยจากอัตราส่วนของตัวบ่งชี้สองตัวที่มีชื่อเดียวกัน เช่น อัตราการเติบโต จะใช้ค่าเฉลี่ยทางเรขาคณิต ซึ่งคำนวณโดยสูตร:

โดยที่ X 1 x X 2 ... x ... X 4 - อัตราส่วนของสองปริมาณที่มีชื่อเดียวกัน เช่น อัตราการเติบโตของห่วงโซ่ คือขนาดของชุดอัตราส่วนของอัตราการเติบโต

ค่าเฉลี่ยที่พิจารณามีคุณสมบัติ maorant:

ตัวอย่างเช่นเรามี ค่าต่อไปนี้ เอ็กซ์(20; 40) ประเภทของค่าเฉลี่ยที่พิจารณาก่อนหน้านี้จะเท่ากับ:

เมื่อศึกษาองค์ประกอบของประชากร ขนาดทั่วไปของคุณลักษณะสามารถตัดสินได้จากค่าเฉลี่ยโครงสร้างที่เรียกว่า ฐานนิยมและค่ามัธยฐาน

แฟชั่นค่าที่เกิดขึ้นบ่อยที่สุดของคุณลักษณะในประชากรเรียกว่าในซีรีส์การเปลี่ยนแปลงช่วงเวลา จะพบช่วงโมดอลก่อน ในช่วงโมดอลที่พบ โหมดจะคำนวณโดยสูตร:

โดยที่ X 0 คือขีดจำกัดล่างของช่วงเวลาโมดอล d-ค่าช่วงเวลา ฉ 1 , ฉ 2 , 3 – ความถี่ของช่วงพรีโมดอล โมดอล และหลังมอดัล

คุณค่าของแฟชั่นใน ซีรีย์ช่วงเวลาค่อนข้างง่ายที่จะหาได้จากกราฟ ในการทำเช่นนี้ เส้นสองเส้นจะดึงออกมาจากขอบเขตของสองคอลัมน์ที่อยู่ติดกันในคอลัมน์สูงสุดของฮิสโตแกรม จากจุดตัดของเส้นเหล่านี้ เส้นตั้งฉากจะลดลงไปที่แกน abscissa ค่าของคุณสมบัติบนแกน abscissa จะเป็นโหมด (รูปที่ 2)


ข้าว. 2

เพื่อแก้ปัญหาในทางปฏิบัติ ความสนใจที่ยิ่งใหญ่ที่สุดมักจะแสดงโหมดที่แสดงเป็นช่วงแทนที่จะเป็นตัวเลขที่ไม่ต่อเนื่อง สิ่งนี้อธิบายได้จากวัตถุประสงค์ของโหมด ซึ่งควรเปิดเผยมิติที่พบบ่อยที่สุดของปรากฏการณ์

ค่าเฉลี่ย - ค่าทั่วไปสำหรับทุกหน่วยของประชากรที่เป็นเนื้อเดียวกัน โหมดยังเป็นค่าทั่วไป แต่จะกำหนดขนาดของแอตทริบิวต์โดยตรง ซึ่งเป็นลักษณะของส่วนที่สำคัญ แต่ยังไม่ใช่ประชากรทั้งหมด เธอมี ความสำคัญอย่างยิ่งเพื่อแก้ปัญหาบางอย่าง เช่น ทำนายขนาดรองเท้า เสื้อผ้า ที่ควรผลิตจำนวนมาก เป็นต้น

ค่ามัธยฐาน- ค่าของคุณสมบัติซึ่งอยู่ตรงกลางของซีรีย์ช่วง มันบ่งบอกถึงศูนย์กลางของการกระจายหน่วยของประชากรและแบ่งออกเป็นสองส่วนเท่า ๆ กัน

ค่ามัธยฐานคือ คุณสมบัติที่ดีที่สุดแนวโน้มเข้าสู่ศูนย์กลาง เมื่อขอบเขตของช่วงเวลาสุดขั้วเปิดอยู่ ค่ามัธยฐานเป็นลักษณะที่ยอมรับได้มากขึ้นของระดับการกระจายแม้ว่าจะมีค่ามากหรือน้อยเกินไปในชุดการกระจายที่มี อิทธิพลที่แข็งแกร่งถึงค่าเฉลี่ย แต่ไม่ใช่ค่ามัธยฐาน ค่ามัธยฐานยังมีคุณสมบัติของค่าต่ำสุดเชิงเส้น: ผลรวม ค่าสัมบูรณ์ค่าเบี่ยงเบนของค่าแอตทริบิวต์สำหรับทุกหน่วยของประชากรจากค่ามัธยฐานนั้นน้อยมาก เช่น

คุณสมบัตินี้มีความสำคัญอย่างยิ่งสำหรับการแก้ปัญหาในทางปฏิบัติ ตัวอย่างเช่น สำหรับการคำนวณระยะทางที่สั้นที่สุดที่เป็นไปได้สำหรับ ประเภทต่างๆการขนส่ง เพื่อค้นหาสถานีบริการในลักษณะที่ระยะทางไปยังรถทุกคันที่ให้บริการโดยสถานีนี้น้อยที่สุด ฯลฯ

เมื่อต้องการหาค่ามัธยฐาน จะพิจารณาก่อน หมายเลขซีเรียลในชุดการจัดจำหน่าย:

นอกจากนี้ตามหมายเลขซีเรียลจะพบค่ามัธยฐานจากความถี่สะสมของซีรีส์ ที่ ซีรีส์ที่ไม่ต่อเนื่อง- ไม่มีการคำนวณใด ๆ แต่ในอนุกรมช่วงเวลาเมื่อทราบจำนวนลำดับของค่ามัธยฐานแล้ว ความถี่สะสมจะถูกใช้เพื่อค้นหาช่วงค่ามัธยฐาน ซึ่งค่าของค่ามัธยฐานนั้นถูกกำหนดโดยวิธีการแก้ไขที่ง่ายที่สุดแล้ว ค่ามัธยฐานคำนวณโดยใช้สูตร:

ที่ไหน เอ็กซ์ 0 คือขีดจำกัดล่างของช่วงมัธยฐาน – ค่าช่วงเวลา _ 1 – ความถี่สะสมจนถึงช่วงมัธยฐาน คือความถี่ของช่วงมัธยฐาน

ลองคำนวณค่าเฉลี่ย ฐานนิยม และมัธยฐานโดยใช้การแจกแจงช่วงเวลาเป็นตัวอย่าง ข้อมูลได้รับในตาราง 2.


ดังนั้น ตัวบ่งชี้ต่าง ๆ สามารถใช้เป็นศูนย์กลางของการกระจาย: ค่าเฉลี่ย ฐานนิยม และค่ามัธยฐาน


และแต่ละลักษณะเหล่านี้มีลักษณะเฉพาะของตนเอง ดังนั้นสำหรับค่าเฉลี่ยมันเป็นลักษณะที่เบี่ยงเบนทั้งหมดจากมัน ค่าส่วนบุคคลเครื่องหมายหักล้างกันคือ

ค่ามัธยฐานมีลักษณะโดยความจริงที่ว่าผลรวมของการเบี่ยงเบนของค่าแต่ละค่าของแอตทริบิวต์จากค่านั้น (ไม่รวมสัญญาณ) มีค่าน้อยที่สุด โหมดกำหนดลักษณะของค่าที่เกิดขึ้นบ่อยที่สุดของคุณลักษณะ ดังนั้น ขึ้นอยู่กับคุณลักษณะใดที่ผู้วิจัยสนใจ ควรเลือกคุณลักษณะใดลักษณะหนึ่งที่ได้รับการพิจารณา ที่ แต่ละกรณีคำนวณลักษณะทั้งหมด

การเปรียบเทียบและการระบุความสัมพันธ์ระหว่างพวกเขาช่วยชี้แจงคุณลักษณะของการแจกแจงของชุดการเปลี่ยนแปลงหนึ่งชุดหรือชุดอื่น ดังนั้น ในอนุกรมสมมาตร เช่นในกรณีของเรา คุณลักษณะทั้งสาม (ค่าเฉลี่ย ฐานนิยม และค่ามัธยฐาน) ใกล้เคียงกัน ยิ่งความแตกต่างระหว่างแฟชั่นและ เฉลี่ยยิ่งซีรีส์ไม่สมมาตรมากเท่าไร เป็นที่ทราบกันดีว่าสำหรับอนุกรมอสมมาตรปานกลาง ความแตกต่างระหว่างฐานนิยมและค่าเฉลี่ยเลขคณิตจะมากกว่าผลต่างระหว่างค่ามัธยฐานและค่าเฉลี่ยเลขคณิตประมาณสามเท่า:

อัตราส่วนนี้สามารถใช้เพื่อกำหนดหนึ่งตัวบ่งชี้จากสองตัวบ่งชี้ที่รู้จัก จากนี้ไปการรวมกันของฐานนิยม มัธยฐาน และค่าเฉลี่ยก็มีความสำคัญต่อการระบุลักษณะประเภทของการแจกแจง

วิทยาการคอมพิวเตอร์และคณิตศาสตร์ - วัสดุทางทฤษฎีสำหรับการประชุมครั้งแรก

1. สิ่งของ สถิติทางคณิตศาสตร์, ส่วนหลักของมัน. แนวคิดของ การกระจายทางสถิติ. การแจกแจงแบบปกติ. ตัวแปรสุ่มมีการแจกแจงแบบปกติภายใต้เงื่อนไขใด

สถิติเป็นศาสตร์ที่ศึกษาเกี่ยวกับผลรวม น้ำหนัก yavl-I เพื่อระบุธรรมชาติ และศึกษาโดยใช้ตัวบ่งชี้ทั่วไป

วิธีการทางสถิติทางคณิตศาสตร์ทั้งหมดสามารถนำมาประกอบกับสองส่วนหลัก: ทฤษฎีการประมาณค่าพารามิเตอร์ทางสถิติและ ทฤษฎีการทดสอบสมมติฐานทางสถิติ.

ส่วน:

1. สถิติเชิงพรรณนา

2. วิธีการสุ่มตัวอย่าง, ช่วงความเชื่อมั่น

3. การวิเคราะห์ความสัมพันธ์

4. การวิเคราะห์การถดถอย

5. การวิเคราะห์คุณลักษณะเชิงคุณภาพ

6. การวิเคราะห์ทางสถิติหลายตัวแปร:

ก) คลัสเตอร์

ข) แฟคทอเรียล

7. การวิเคราะห์อนุกรมเวลา

8. สมการเชิงอนุพันธ์

9. การสร้างแบบจำลองทางคณิตศาสตร์ กระบวนการทางประวัติศาสตร์

การกระจาย:

เชิงทฤษฎี (มีวัตถุจำนวนมากและทำงานได้อย่างสมบูรณ์)

เชิงประจักษ์ (ข้อมูลจริงที่สามารถลงจุดในฮิสโตแกรม)

การแจกแจงแบบปกติ - เมื่อธรรมชาติของการกระจายได้รับอิทธิพลจากหลายปัจจัยและไม่มีปัจจัยใดเป็นปัจจัยชี้ขาด โดยเฉพาะอย่างยิ่งมักใช้ในทางปฏิบัติ


2. การแจกแจงแบบปกติสามารถแสดงในรูปแบบกราฟิกเป็นเส้นโค้งรูประฆัง สมมาตร มีจุดยอดเดียว ความสูง (พิกัด) ของแต่ละจุดบนเส้นโค้งนี้บ่งชี้ว่าค่าที่เกี่ยวข้องเกิดขึ้นบ่อยเพียงใด สถิติเชิงพรรณนา ค่าเฉลี่ย - ค่าเฉลี่ยเลขคณิต, ค่ามัธยฐาน, โหมด การวัดทั้งสามนี้ให้ค่าที่คล้ายคลึงกันในสถานการณ์ใด และในสถานการณ์ใดที่แตกต่างกันอย่างมาก

สถิติเชิงพรรณนา - นี่คือสถิติเชิงพรรณนา

ค่าเฉลี่ยเลขคณิต มัธยฐาน ฐานนิยม - มาตรการเฉลี่ย - ค่าสัมประสิทธิ์ที่สามารถกำหนดลักษณะชุดของวัตถุ

· ค่าเฉลี่ย (เลขคณิต) - ผลรวมของค่าทั้งหมดที่อ้างถึง จำนวนทั้งหมดข้อสังเกต ( ได้รับการยอมรับ: หมายถึง หรือ ) เช่น ปานกลาง ค่าเลขคณิต คุณลักษณะที่เรียกว่าค่า

ค่าของคุณสมบัติ y อยู่ที่ไหน ผม-th วัตถุ - จำนวนของวัตถุในการรวม

· โหมด - ค่าที่เกิดขึ้นบ่อยที่สุดของตัวแปร (M)

· ค่ามัธยฐานคือค่าเฉลี่ย (การกำหนดที่ยอมรับ: ค่ามัธยฐาน, ม.) ค่ามัธยฐานคือค่า "กลาง" ของคุณลักษณะในแง่ที่ว่าครึ่งหนึ่งของวัตถุในประชากรมีค่าของคุณลักษณะนี้น้อยกว่า และอีกครึ่งหนึ่งมีค่ามากกว่าค่ามัธยฐาน คุณสามารถคำนวณค่ามัธยฐานโดยประมาณได้โดยการจัดเรียงค่าทั้งหมดของแอตทริบิวต์ในลำดับจากน้อยไปมาก (จากมากไปน้อย) และค้นหาตัวเลขในชุดรูปแบบนี้ซึ่งมีตัวเลข ( +1)/2 - ในกรณีที่เป็นเลขคี่ หรืออยู่ตรงกลางระหว่างตัวเลขกับตัวเลข /2 และ ( +1)/2 - ในกรณีที่เป็นเลขคู่ .

ไม่สามารถคำนวณคุณสมบัติที่แสดงรายการทั้งหมดสำหรับคุณสมบัติเชิงคุณภาพได้ หากแอตทริบิวต์เป็นเชิงคุณภาพและระบุ จะพบเฉพาะโหมดเท่านั้น (ค่าจะเป็นชื่อของหมวดหมู่ที่เกิดขึ้นบ่อยที่สุดของแอตทริบิวต์ระบุ) หากแอตทริบิวต์เป็นอันดับหนึ่ง นอกเหนือจากโหมดแล้ว คุณยังสามารถหาค่ามัธยฐานได้อีกด้วย สามารถคำนวณค่าเฉลี่ยเลขคณิตได้เท่านั้น ลักษณะเชิงปริมาณ.

ในกรณีของข้อมูลเชิงปริมาณ คุณลักษณะทั้งหมดของระดับค่าเฉลี่ยจะถูกวัดในหน่วยเดียวกับแอตทริบิวต์ดั้งเดิม

ค่าของสัมประสิทธิ์จะเหมือนกันหากกำหนดการกระจายเป็นแบบสมมาตร


3. ตัวบ่งชี้ความแตกต่าง - ความแปรปรวน ค่าเฉลี่ยกำลังสอง (มาตรฐาน) ส่วนเบี่ยงเบน ค่าสัมประสิทธิ์ของการแปรผัน ที่ พวกเขาวัดในหน่วยอะไร? ทำไมถึงแนะนำแนวคิดเรื่องค่าสัมประสิทธิ์การแปรผัน?

· รูทหมายถึงกำลังสองหรือ ส่วนเบี่ยงเบนมาตรฐาน- การวัดการแพร่กระจายของค่าลักษณะเฉพาะรอบค่าเฉลี่ยเลขคณิต (การกำหนดที่ยอมรับ: Std.Dev. ( ส่วนเบี่ยงเบนมาตรฐาน), หรือ s). ค่าของความเบี่ยงเบนนี้คำนวณโดยสูตร

.

· ความแปรปรวนของคุณลักษณะ ( s2 หรือ s2)

· ค่าสัมประสิทธิ์การแปรผัน - อัตราส่วนของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยเลขคณิตซึ่งแสดงเป็นเปอร์เซ็นต์ (แสดงเป็นสถิติด้วยตัวอักษร วี). ค่าสัมประสิทธิ์คำนวณโดยสูตร: .

ทุกคนมาตรการเหล่านี้สามารถคำนวณได้สำหรับลักษณะเชิงปริมาณเท่านั้น พวกเขาทั้งหมดแสดงให้เห็นว่าค่าของแอตทริบิวต์ (หรือมากกว่านั้นคือค่าเบี่ยงเบนจากค่าเฉลี่ย) แตกต่างกันมากเพียงใดในประชากรที่กำหนด ยังไง มูลค่าน้อยลงการวัดแบบกระจายยิ่งค่าคุณสมบัติสำหรับวัตถุทั้งหมดใกล้เคียงกับค่าเฉลี่ยมากขึ้นเท่านั้น และด้วยเหตุนี้จึงอยู่ใกล้กัน หากค่าการวัดการกระจายมีค่าเท่ากับศูนย์ ค่าแอตทริบิวต์จะเหมือนกันสำหรับวัตถุทั้งหมด

ที่ใช้บ่อยที่สุดคือค่าเฉลี่ยกำลังสอง (หรือมาตรฐาน) ส่วนเบี่ยงเบน s มีการวัดเช่นเดียวกับค่าเฉลี่ยเลขคณิตในหน่วยเดียวกับคุณลักษณะเดิม หากค่าทั้งหมดของแอตทริบิวต์เปลี่ยนแปลงหลายครั้ง ส่วนเบี่ยงเบนมาตรฐานจะเปลี่ยนในลักษณะเดียวกัน อย่างไรก็ตาม หากค่าทั้งหมดของแอตทริบิวต์เพิ่มขึ้น (ลดลง) ตามจำนวนที่กำหนด ค่าเบี่ยงเบนมาตรฐาน จะไม่เปลี่ยนแปลง. นอกจากค่าเบี่ยงเบนมาตรฐานแล้ว ความแปรปรวน (= กำลังสองของมัน) มักจะถูกใช้ แต่ในทางปฏิบัติแล้ว มันเป็นการวัดที่สะดวกน้อยกว่าเพราะ หน่วยความแปรปรวนไม่ตรงกับหน่วยการวัด

ความหมายของค่าสัมประสิทธิ์การแปรผันคือไม่เหมือนกับ s มันไม่ได้วัดค่าสัมบูรณ์ แต่เป็นการวัดสัมพัทธ์ของการแพร่กระจายของค่าของแอตทริบิวต์ในประชากรทางสถิติ

ยิ่ง V ประชากรที่เป็นเนื้อเดียวกันน้อยลง

เป็นเนื้อเดียวกันเฉพาะกาลต่างกัน

V = 0 - 30% V = 30 - 50% V = 50 - 100%

อาจจะ » 100% (ประชากรต่างกันเกินไป)


4. แนวคิดของวิธีการเลือก ตัวอย่างตัวแทน, วิธีการของมัน การสร้างข้อผิดพลาดในการสุ่มตัวอย่างสองประเภท ความน่าจะเป็นของความมั่นใจ.

ตัวอย่าง:

ตัวแทน

สุ่ม

การสุ่มตัวอย่างทางกล - คล้ายกับ สุ่มตัวอย่าง(ทุกวันที่ 10, 20 เป็นต้น)

การสุ่มตัวอย่างตามธรรมชาติ (สิ่งที่เหลืออยู่ของ HS เมื่อเวลาผ่านไป)

ตัวอย่างตัวแทน - สะท้อนคุณสมบัติได้อย่างแม่นยำ ประชากร.

เพื่อให้ตัวอย่างสะท้อนได้อย่างถูกต้อง คุณสมบัติพื้นฐานที่มีอยู่ในประชาชนทั่วไปนั่นเอง ควรสุ่ม, เช่น. รายการทั้งหมดในประชากรต้องมีโอกาสเท่ากันที่จะรวมอยู่ในกลุ่มตัวอย่าง

ตัวอย่างถูกสร้างขึ้นโดยใช้พิเศษ เทคนิค วิธีที่ง่ายที่สุดคือการเลือกแบบสุ่ม เช่น ใช้การจับฉลากตามปกติ (สำหรับประชากรกลุ่มเล็ก) หรือใช้ตาราง ตัวเลขสุ่ม. สำหรับประชากรที่มีขนาดใหญ่กว่าแต่ค่อนข้างเป็นเนื้อเดียวกัน จะใช้การเลือกเชิงกล (ซึ่งใช้ในสถิติ Zemstvo) สำหรับประชากรที่แตกต่างกันซึ่งมีโครงสร้างที่แน่นอน การเลือกทั่วไปมักจะใช้มากกว่า มีวิธีการอื่น ๆ ได้แก่ - การรวมกัน วิธีทางที่แตกต่างการเลือกตัวอย่างหลายขั้นตอน

ผลลัพธ์ตัวอย่างมีข้อผิดพลาดเสมอ ข้อผิดพลาดเหล่านี้สามารถแบ่งออกเป็นสองประเภท: แบบสุ่มและเป็นระบบ อดีตรวมถึงการเบี่ยงเบนแบบสุ่มของลักษณะตัวอย่างจากลักษณะทั่วไปเนื่องจากวิธีการสุ่มตัวอย่างเป็นธรรมชาติมาก ค่าของข้อผิดพลาดแบบสุ่มสามารถคำนวณได้ (โดยประมาณ) ในทางกลับกัน ข้อผิดพลาดอย่างเป็นระบบไม่ได้เกิดขึ้น สุ่ม; มีความเกี่ยวข้องกับการเบี่ยงเบนของโครงสร้างตัวอย่างจากโครงสร้างที่แท้จริงของประชากรทั่วไป ข้อผิดพลาดอย่างเป็นระบบปรากฏขึ้นเมื่อกฎพื้นฐานของการเลือกแบบสุ่มถูกละเมิด - ตรวจสอบให้แน่ใจว่าวัตถุทั้งหมดมีโอกาสเท่ากันที่จะรวมอยู่ในตัวอย่าง สถิติความผิดพลาดแบบนี้ไม่สามารถประเมินได้

แหล่งข่าวหลัก ข้อผิดพลาดอย่างเป็นระบบคือ: ก) ตัวอย่างที่เกิดขึ้นไม่เพียงพอต่อวัตถุประสงค์ของการศึกษา; b) ความไม่รู้ธรรมชาติของการกระจายตัวในประชากรทั่วไปและเป็นผลให้เกิดการฝ่าฝืนตัวอย่างโครงสร้างของประชากรทั่วไป c) การเลือกองค์ประกอบที่สะดวกและเป็นประโยชน์ที่สุดของประชากรทั่วไปอย่างมีสติ

ความน่าจะเป็นของความเชื่อมั่น -


5. ความน่าจะเป็นของความมั่นใจ ปานกลาง(มาตรฐาน)และ ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อย ช่วงความเชื่อมั่นเพื่อประมาณค่าเฉลี่ยใน ประชาชนทั่วไป การทดสอบสมมติฐานเกี่ยวกับ นัยสำคัญทางสถิติของความแตกต่างระหว่างค่าเฉลี่ยตัวอย่างทั้งสอง

ช่วงความเชื่อมั่น - ค่าของค่าสัมประสิทธิ์ที่คำนวณได้ ซึ่งเราเชื่อว่าค่านี้สำหรับยีนควรลดลง รวม

ความน่าจะเป็นของความเชื่อมั่น - ความน่าจะเป็นที่ค่าของค่าสัมประสิทธิ์ที่คำนวณได้สำหรับยีน ประชากรจะอยู่ในช่วงความเชื่อมั่น DV ใดยิ่ง CI ยิ่งมาก

การแพร่กระจายอย่างหลีกเลี่ยงไม่ได้ของค่าเฉลี่ยตัวอย่างรอบค่าเฉลี่ยทั่วไป (เช่น ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง) เรียกว่า ข้อผิดพลาดในการสุ่มตัวอย่างมาตรฐาน ซึ่งแสดงโดยสูตร (- เฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน, - ขนาดตัวอย่าง). ข้อผิดพลาดมาตรฐานของตัวอย่างยิ่งเล็กค่ายิ่งน้อย(ซึ่งเป็นลักษณะการแพร่กระจายของค่าคุณลักษณะ) และขนาดตัวอย่างที่ใหญ่ขึ้น .

หากใช้วิธีการสุ่มตัวอย่างเพื่อทำงานกับข้อมูลที่ไม่ใช่เชิงปริมาณ บทบาทของค่าเฉลี่ยเลขคณิตในประชากรจะเล่นตามสัดส่วนหรือความถี่ ถามเข้าสู่ระบบ. การแบ่งปันจะคำนวณเป็นอัตราส่วนของจำนวนออบเจ็กต์ที่มีคุณลักษณะนี้ () ต่อจำนวนออบเจ็กต์ในประชากรทั้งหมด: บทบาทของการวัดการแพร่กระจายเล่นโดยปริมาณ

ในกรณีนี้ ข้อผิดพลาดในการสุ่มตัวอย่างมาตรฐานคำนวณโดยสูตร:

ความแม่นยำและความน่าเชื่อถือของการประมาณค่าพารามิเตอร์ของประชากรทั่วไปตามกลุ่มตัวอย่างอยู่ใน ความสัมพันธ์ผกผัน: ยิ่งมีความแม่นยำมาก (เช่น ยิ่งน้อย ข้อผิดพลาดเล็กน้อยและยิ่งช่วงความเชื่อมั่นแคบลง) ความน่าเชื่อถือของค่าประมาณดังกล่าวก็จะยิ่งลดลง (ระดับความเชื่อมั่น) และในทางกลับกัน - ยิ่งความแม่นยำของการประมาณค่าลดลงเท่าใดความน่าเชื่อถือก็จะยิ่งสูงขึ้นเท่านั้น บ่อยครั้งที่ช่วงความเชื่อมั่นถูกสร้างขึ้นสำหรับความน่าเชื่อถือ 95% ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มมักจะเท่ากับสองเท่าของข้อผิดพลาดเฉลี่ย..

ช่วงความเชื่อมั่นในการประมาณค่าเฉลี่ยของประชากรทั่วไป:

เอ็กซ์(ช.) =x(ที่เลือกไว้) +-Δ =x(เลือกแล้ว) +- = เอ็กซ์(ที่เลือกไว้) +- σ(g.s.)/√

เกณฑ์สำหรับความแตกต่างของค่าเฉลี่ย

บ่อยครั้งที่มีปัญหาในการเปรียบเทียบค่าเฉลี่ยตัวอย่างสองค่าเพื่อทดสอบสมมติฐานว่าตัวอย่างเหล่านี้ได้มาจากประชากรทั่วไปกลุ่มเดียวกันและความคลาดเคลื่อนที่แท้จริงในค่าของค่าเฉลี่ยตัวอย่างอธิบายได้โดยการสุ่มตัวอย่าง

สมมติฐานภายใต้การทดสอบสามารถกำหนดได้ดังนี้: ความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่างเป็นแบบสุ่ม เช่น ค่าเฉลี่ยทั่วไปเท่ากันในทั้งสองกรณี เนื่องจาก ลักษณะทางสถิติค่าถูกนำมาใช้อีกครั้ง ทีซึ่งเป็นผลต่างระหว่างค่าเฉลี่ยของตัวอย่างหารด้วยค่าเฉลี่ยข้อผิดพลาดมาตรฐานของค่าเฉลี่ยสำหรับทั้งสองตัวอย่าง

ค่าที่แท้จริงของลักษณะทางสถิติจะถูกเปรียบเทียบกับค่าวิกฤตที่สอดคล้องกับระดับนัยสำคัญที่เลือก หากค่าจริงมากกว่าค่าวิกฤต สมมติฐานที่ทดสอบจะถูกปฏิเสธ เช่น ความแตกต่างระหว่างค่าเฉลี่ยถือว่ามีนัยสำคัญ (มีนัยสำคัญ)


7. ความสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น สูตรของมัน ลิมิตของค่าของมัน ค่าสัมประสิทธิ์ของการกำหนดความหมายที่มีความหมาย แนวคิดของ นัยสำคัญทางสถิติของค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์ แสดงให้เห็นว่าตัวแปรทั้งสองมีความสัมพันธ์กันอย่างไร .

ค่าสัมประสิทธิ์สหสัมพันธ์ รับค่าในช่วงตั้งแต่ -1 ถึง +1 ถ้า = 1 จากนั้นระหว่างตัวแปรทั้งสองจะมีค่าบวกเชิงฟังก์ชัน การเชื่อมต่อเชิงเส้น, เช่น. ในแผนภาพกระจาย จุดที่สอดคล้องกันจะอยู่บนเส้นตรงที่มีความชันเป็นบวก ถ้า = -1, จากนั้นจึงมีความสัมพันธ์เชิงลบตามหน้าที่ระหว่างตัวแปรทั้งสอง ถ้า = 0, แล้วตัวแปรที่อยู่ระหว่างการพิจารณา อิสระเชิงเส้น, เช่น. ในแผนภาพกระจาย เมฆแบบจุดจะ "ยืดออกในแนวนอน"

ขอแนะนำให้คำนวณสมการถดถอยและค่าสัมประสิทธิ์สหสัมพันธ์เฉพาะในกรณีที่ความสัมพันธ์ระหว่างตัวแปรสามารถพิจารณาเป็นเส้นตรงได้อย่างน้อยโดยประมาณ มิฉะนั้น ผลลัพธ์อาจผิดทั้งหมด โดยเฉพาะอย่างยิ่ง ค่าสัมประสิทธิ์สหสัมพันธ์อาจใกล้เคียงกับศูนย์เมื่อมีความสัมพันธ์ที่แน่นแฟ้น โดยเฉพาะอย่างยิ่งในกรณีที่การพึ่งพาอาศัยกันนั้นไม่เป็นเชิงเส้นอย่างชัดเจน (ตัวอย่างเช่น การพึ่งพาระหว่างตัวแปรจะอธิบายโดยประมาณด้วยไซน์ซอยด์หรือพาราโบลา) ในหลายกรณี ปัญหานี้สามารถหลีกเลี่ยงได้โดยการแปลงตัวแปรดั้งเดิม อย่างไรก็ตาม เพื่อคาดเดาความจำเป็นในการเปลี่ยนแปลงดังกล่าว เช่น เพื่อดูว่าข้อมูลนั้นประกอบด้วยอะไรบ้าง รูปร่างที่ซับซ้อนเป็นที่พึงปรารถนาที่จะ "เห็น" พวกเขา นั่นคือเหตุผลที่การศึกษาความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณโดยทั่วไปควรรวมถึงการดูแผนภาพกระจาย

สามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้โดยไม่ต้องสร้างเส้นถดถอยเบื้องต้น ในกรณีนี้ คำถามเกี่ยวกับการตีความสัญญาณว่ามีประสิทธิภาพและแฟกทอเรียล เช่น ไม่ได้ตั้งค่าขึ้นอยู่กับและเป็นอิสระและความสัมพันธ์เป็นที่เข้าใจกันว่าเป็นความสอดคล้องหรือการซิงโครไนซ์ของการเปลี่ยนแปลงพร้อมกันในค่าของคุณลักษณะในการเปลี่ยนจากวัตถุหนึ่งไปยังอีกวัตถุหนึ่ง

หากวัตถุมีลักษณะเชิงปริมาณทั้งชุด คุณสามารถสร้างสิ่งที่เรียกว่าได้ทันที เมทริกซ์สหสัมพันธ์เช่น ตารางสี่เหลี่ยมจัตุรัส จำนวนแถวและคอลัมน์เท่ากับจำนวนคุณลักษณะ และที่จุดตัดของแต่ละแถวและคอลัมน์คือค่าสัมประสิทธิ์สหสัมพันธ์ของคู่คุณลักษณะที่สอดคล้องกัน

ค่าสัมประสิทธิ์สหสัมพันธ์ไม่มีการตีความที่มีความหมาย อย่างไรก็ตามตารางของเขาเรียกว่า ค่าสัมประสิทธิ์การกำหนด(R2), มันมี.

ค่าสัมประสิทธิ์การกำหนด (R 2) - นี่เป็นตัวบ่งชี้ว่าการเปลี่ยนแปลงในคุณลักษณะที่พึ่งพานั้นอธิบายโดยการเปลี่ยนแปลงในคุณลักษณะที่เป็นอิสระมากน้อยเพียงใด อย่างแม่นยำยิ่งขึ้น มันคือสัดส่วนของความแปรปรวนของคุณลักษณะอิสระที่อธิบายโดยอิทธิพลของผู้อยู่ในอุปการะ .

หากตัวแปรสองตัวขึ้นอยู่กับการทำงานเชิงเส้น (จุดบนแผนภาพกระจายอยู่บนเส้นตรงเดียวกัน) เราก็สามารถพูดได้ว่าการเปลี่ยนแปลงในตัวแปร อธิบายได้อย่างสมบูรณ์จากการเปลี่ยนแปลงของตัวแปร x,และนี่เป็นเพียงกรณีที่ค่าสัมประสิทธิ์ของการกำหนด เท่ากับหนึ่ง(ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์สามารถเป็นได้ทั้ง 1 และ -1) ถ้าตัวแปรสองตัวเป็นอิสระเชิงเส้น (เมธอด กำลังสองน้อยที่สุดให้เส้นแนวนอน) จากนั้นตัวแปร ความผันแปรของมันไม่ได้ "เป็นหนี้" กับตัวแปรแต่อย่างใด x– ในกรณีนี้ ค่าสัมประสิทธิ์ของการกำหนดจะเท่ากับศูนย์ ในกรณีระหว่างกลาง ค่าสัมประสิทธิ์ของการกำหนดจะระบุว่าส่วนใดของการเปลี่ยนแปลงในตัวแปร อธิบายได้จากการเปลี่ยนแปลงของตัวแปร x(บางครั้งก็สะดวกที่จะแสดงค่านี้เป็นเปอร์เซ็นต์)


8. ห้องอบไอน้ำและหลายรายการ การถดถอยเชิงเส้น. ค่าสัมประสิทธิ์ ความสัมพันธ์ที่หลากหลาย. ความหมายที่มีความหมายของสัมประสิทธิ์การถดถอย, ความสำคัญ, แนวคิดของ ที- สถิติ ความหมายที่มีความหมายของค่าสัมประสิทธิ์ของการกำหนด 2.

การวิเคราะห์การถดถอย - วิธีการทางสถิติที่ช่วยให้คุณสร้างแบบจำลองเชิงอธิบายตามปฏิสัมพันธ์ของคุณลักษณะต่างๆ

มากที่สุด กรณีที่เรียบง่ายความสัมพันธ์คือ ความสัมพันธ์แบบคู่, เช่น. ความสัมพันธ์ระหว่างสองลักษณะ สันนิษฐานว่าความสัมพันธ์ระหว่างตัวแปรทั้งสองเป็นไปตามกฎ เชิงสาเหตุ กล่าวคือ หนึ่งในนั้นขึ้นอยู่กับอีกอันหนึ่ง คนแรก (ขึ้นอยู่กับ) ถูกเรียกเข้ามา การวิเคราะห์การถดถอย ส่งผลให้วินาที (อิสระ) - แฟคทอเรียล. ควรสังเกตว่า เป็นไปไม่ได้เสมอที่จะระบุได้อย่างชัดเจนว่าตัวแปรใดในสองตัวแปรนี้เป็นอิสระและตัวแปรใดขึ้นอยู่กับ การสื่อสารมักถูกมองว่าเป็นแบบสองทิศทาง

สมการถดถอยคู่ : = เคเอ็กซ์ + .

บ่อยครั้งที่ตัวแปรตามหลายตัวทำหน้าที่พร้อมกันซึ่งเป็นเรื่องยากที่จะแยกแยะตัวแปรเดียวหรือตัวหลัก ตัวอย่างเช่น รายได้ขององค์กรขึ้นอยู่กับ พร้อมกันจากสองปัจจัยการผลิต - จำนวนคนงานและแหล่งจ่ายไฟ นอกจากนี้ปัจจัยทั้งสองนี้ไม่เป็นอิสระจากกัน

สมการ การถดถอยพหุคูณ : = เค 1 · x 1 + เค 2 · x 2 + … + ข,

ที่ไหน x 1 , x 2, . . . - ตัวแปรอิสระซึ่งตัวแปรที่ศึกษา (ผลลัพธ์) y ขึ้นอยู่กับระดับใดระดับหนึ่ง

k 1 , k 2. . . เป็นค่าสัมประสิทธิ์ของตัวแปรที่เกี่ยวข้อง ( ค่าสัมประสิทธิ์การถดถอย) แสดงจำนวนค่าของตัวแปรผลลัพธ์ที่เปลี่ยนไปเมื่อตัวแปรอิสระตัวเดียวเปลี่ยนไปทีละตัว

ระบุสมการถดถอยพหุคูณ แบบจำลองการถดถอยอธิบายพฤติกรรมของตัวแปรตาม ไม่มี แบบจำลองการถดถอยไม่สามารถบอกได้ว่าตัวแปรใดขึ้นอยู่กับ (ผล) และตัวแปรใดไม่ขึ้นกับ (สาเหตุ)

- อัตราต่อรองหลายรายการ ความสัมพันธ์ วัดผลรวมของผลกระทบของคุณลักษณะอิสระ ความใกล้ชิดของความสัมพันธ์ของคุณลักษณะที่เป็นผลลัพธ์กับคุณลักษณะอิสระทั้งชุด แสดงเป็น %

แสดงสัดส่วนของลักษณะที่นำมาพิจารณาในส่วนผลลัพธ์ เช่น % ความแปรผันของคุณลักษณะ y อธิบายได้จากความแปรผันของคุณลักษณะที่พิจารณา X1, X2, X3

-สถิติแสดงระดับของสถิติ ความสำคัญของแต่ละอย่าง ค่าสัมประสิทธิ์การถดถอย เช่น ความทนทานเมื่อเทียบกับตัวอย่าง

= / ∆b

มีนัยสำคัญทางสถิติที >2. ค่าสัมประสิทธิ์ยิ่งสูงยิ่งดี

ผ่านทาง ร ² เราได้ข้อสรุปเกี่ยวกับ % ของคุณสมบัติที่นำมาพิจารณาเพื่ออธิบายผลลัพธ์


9. วิธีการหลายมิติ การวิเคราะห์ทางสถิติ. การวิเคราะห์คลัสเตอร์ แนวคิดของ วิธีการลำดับชั้นและ เกี่ยวกับวิธี K-mean การจำแนกหลายตัวแปรด้วย โดยใช้ชุดคลุมเครือ

คือ:

การวิเคราะห์คลัสเตอร์

การวิเคราะห์ปัจจัย

การปรับขนาดหลายมิติ

การวิเคราะห์คลัสเตอร์ - การรวมวัตถุเป็นกลุ่มโดยมีเป้าหมายร่วมกัน (มีหลายสัญญาณ)

วิธีการวิเคราะห์คลัสเตอร์:

1. ลำดับชั้น(แผนผังการวิเคราะห์ลำดับชั้น):

แนวคิดหลัก วิธีการลำดับชั้น ประกอบด้วยการเชื่อมโยงตามลำดับของวัตถุที่จัดกลุ่ม - อันดับแรกที่ใกล้เคียงที่สุดจากนั้นจึงห่างจากกันมากขึ้นเรื่อย ๆ ขั้นตอนการสร้างหมวดหมู่ประกอบด้วย ขั้นตอนต่อเนื่องซึ่งแต่ละกลุ่มจะรวมวัตถุสองกลุ่มที่ใกล้ที่สุดเข้าด้วยกัน (กระจุก).

2. วิธี k-mean.

ต้องการคลาสที่กำหนดไว้ล่วงหน้า (คลัสเตอร์) เน้นความแปรปรวนภายในชั้นเรียน ตามสมมติฐานของจำนวนคลาสที่เป็นไปได้มากที่สุด งานของวิธีนี้คือการสร้างคลัสเตอร์ตามจำนวนที่กำหนด ซึ่งควรแตกต่างจากกันมากที่สุด

ขั้นตอนการจำแนกเริ่มต้นด้วยการสร้างกลุ่มจำนวนหนึ่งที่ได้จากการจัดกลุ่มวัตถุแบบสุ่ม แต่ละคลัสเตอร์ควรประกอบด้วยออบเจ็กต์ที่ "คล้ายกัน" มากที่สุด และคลัสเตอร์เองก็ควร "ต่างกัน" มากที่สุด

ผลลัพธ์ของวิธีนี้ช่วยให้คุณได้รับศูนย์กลางของคลาสทั้งหมด (รวมถึงพารามิเตอร์อื่น ๆ ของสถิติเชิงพรรณนา) สำหรับแต่ละคุณลักษณะดั้งเดิม และยังเห็น การแสดงกราฟิกเกี่ยวกับพารามิเตอร์ที่คลาสผลลัพธ์แตกต่างกันอย่างไรและในพารามิเตอร์ใด

หากผลลัพธ์ของการจำแนกประเภทที่ได้รับจากวิธีการต่างๆ ตรงกัน แสดงว่าเป็นการยืนยันความเป็นจริง กลุ่มที่มีอยู่ (ความน่าเชื่อถือ, ความน่าเชื่อถือ)


10. วิธีการวิเคราะห์ทางสถิติหลายมิติ การวิเคราะห์ปัจจัย วัตถุประสงค์ของการใช้งาน แนวคิดของ น้ำหนักแฟกทอเรียล ขีดจำกัดของพวกเขา ค่า; สัดส่วนของความแปรปรวนทั้งหมดที่อธิบายได้จากปัจจัยต่างๆ

การวิเคราะห์ทางสถิติหลายตัวแปร วัตถุประสงค์: การสร้างชุดวัตถุขยายแบบง่าย

คือ:

การวิเคราะห์คลัสเตอร์

การวิเคราะห์ปัจจัย

การปรับขนาดหลายมิติ

ที่แกนกลาง การวิเคราะห์ปัจจัยแนวคิดที่ว่าเบื้องหลังความสัมพันธ์ที่ซับซ้อนของคุณลักษณะที่กำหนดอย่างชัดเจนนั้นเป็นโครงสร้างที่ค่อนข้างง่ายกว่าซึ่งสะท้อนถึงคุณลักษณะที่สำคัญที่สุดของปรากฏการณ์ภายใต้การศึกษา และคุณลักษณะ "ภายนอก" เป็นฟังก์ชันของสิ่งที่ซ่อนอยู่ ปัจจัยทั่วไปการกำหนดโครงสร้างนี้

วัตถุประสงค์: เปลี่ยนจาก มากกว่าลักษณะของปัจจัยจำนวนเล็กน้อย

ใน การวิเคราะห์ปัจจัยปริมาณทั้งหมดที่รวมอยู่ในแบบจำลองแฟคทอเรียลเป็นมาตรฐาน เช่น เป็นปริมาณไร้มิติที่มีค่าเฉลี่ยเลขคณิตเป็น 0 และส่วนเบี่ยงเบนมาตรฐาน 1

ค่าสัมประสิทธิ์ของความสัมพันธ์ระหว่างคุณลักษณะบางอย่างกับปัจจัยทั่วไป ซึ่งแสดงระดับของอิทธิพลของปัจจัยที่มีต่อคุณลักษณะนั้นเรียกว่า โหลดปัจจัยของลักษณะนี้สำหรับปัจจัยร่วมนี้ . นี่คือตัวเลขระหว่าง -1 ถึง 1 ยิ่งห่างจาก 0 ความสัมพันธ์ยิ่งแน่นแฟ้น ค่าของโหลดแฟกเตอร์สำหรับแฟกเตอร์บางตัว ซึ่งมีค่าใกล้เคียงกับศูนย์ บ่งชี้ว่าแฟกเตอร์นี้แทบไม่ส่งผลต่อลักษณะนี้

ค่า (การวัดการสำแดง) ของปัจจัยในแต่ละวัตถุเรียกว่า น้ำหนักแฟคทอเรียลวัตถุสำหรับปัจจัยนี้. น้ำหนักปัจจัยช่วยให้คุณสามารถจัดลำดับ จัดลำดับวัตถุตามแต่ละปัจจัย ยิ่งน้ำหนักปัจจัยของวัตถุมากเท่าใด วัตถุก็จะยิ่งแสดงด้านนั้นของปรากฏการณ์หรือรูปแบบที่สะท้อนโดยปัจจัยนี้มากขึ้นเท่านั้น ตัวประกอบเป็นค่ามาตรฐาน ไม่สามารถเป็น = ศูนย์ได้ น้ำหนักตัวประกอบใกล้เคียงกับศูนย์บ่งชี้ ระดับปานกลางการแสดงออกของปัจจัย, บวก - ระดับนี้สูงกว่าค่าเฉลี่ย, ลบ - ประมาณนั้น ว่ามันต่ำกว่าค่าเฉลี่ย

ตารางน้ำหนักปัจจัยมี แถวตามจำนวนวัตถุและ เคคอลัมน์ตามจำนวนตัวประกอบทั่วไป ตำแหน่งของวัตถุบนแกนของแต่ละปัจจัย ในแง่หนึ่ง ลำดับที่พวกมันถูกจัดอันดับโดยปัจจัยนี้ และในทางกลับกัน ความสม่ำเสมอหรือความไม่สม่ำเสมอในการจัดเรียง การมีอยู่ของกลุ่มจุดที่แสดงถึงวัตถุ ซึ่งทำให้สามารถเน้นกลุ่มที่เป็นเนื้อเดียวกันมากขึ้นหรือน้อยลงได้


11. ประเภทของสัญญาณเชิงคุณภาพ คุณสมบัติที่กำหนด ตัวอย่างจาก แหล่งประวัติศาสตร์. ตารางฉุกเฉิน ค่าสัมประสิทธิ์การเชื่อมต่อของคุณสมบัติเล็กน้อย ขีด จำกัด ของค่า

จัดอันดับข้อมูล นำเสนอตามหมวดหมู่ที่ลำดับไม่สำคัญอย่างยิ่ง ไม่มีวิธีเปรียบเทียบอื่นใดที่กำหนดไว้สำหรับพวกเขา ยกเว้นการจับคู่ตามตัวอักษร/ไม่ตรงกัน

ตัวอย่างของตัวแปรเล็กน้อย:

· สัญชาติ: อังกฤษ เบลารุส เยอรมัน รัสเซีย ญี่ปุ่น ฯลฯ

· อาชีพ: พนักงาน, แพทย์, ทหาร, ครู, ฯลฯ

· ประวัติการศึกษา: มนุษยธรรม เทคนิค การแพทย์ กฎหมาย ฯลฯ

หากในกรณีของระดับการศึกษา เรายังสามารถเปรียบเทียบผู้คนในแง่ของ "ดีกว่า-แย่" หรือ "สูงกว่า-ต่ำกว่า" ได้ ตอนนี้เราขาดแม้แต่ความเป็นไปได้นี้ วิธีเปรียบเทียบที่ถูกต้องวิธีเดียวคือบอกว่าบุคคลเหล่านี้ "ล้วนแต่เป็นนักประวัติศาสตร์" หรือ "ทุกคนไม่ใช่นักกฎหมาย"

ตารางฉุกเฉิน

ตารางฉุกเฉินคือตารางสี่เหลี่ยม แถวที่ระบุหมวดหมู่ของสถานที่หนึ่ง (เช่น กลุ่มสังคมต่างๆ) และคอลัมน์ระบุหมวดหมู่ของอีกสถานที่หนึ่ง (เช่น การสังกัดพรรค) แต่ละอ็อบเจกต์ของคอลเล็กชันจะอยู่ในเซลล์ใดเซลล์หนึ่งของตารางนี้ตามประเภทที่จัดอยู่ในแต่ละฟีเจอร์ ดังนั้นในเซลล์ของตารางจึงมีตัวเลขที่แสดงถึงความถี่ของการเกิดขึ้นร่วมกันของหมวดหมู่ของสองคุณสมบัติ (จำนวนคนที่อยู่ในกลุ่มสังคมเฉพาะและอยู่ในกลุ่มใดกลุ่มหนึ่ง) ขึ้นอยู่กับลักษณะของการกระจายความถี่เหล่านี้ภายในตาราง เราสามารถตัดสินได้ว่ามีความสัมพันธ์ระหว่างคุณลักษณะต่างๆ หรือไม่ ความเชื่อมโยงระหว่างอะไร สถานะทางสังคมและสังกัดพรรค? ในกรณีนี้ การมีสายสัมพันธ์กันจะบ่งชี้ถึงความชอบทางการเมืองบางอย่างในหมู่สมาชิกที่แตกต่างกัน กลุ่มทางสังคม. พูดอย่างเป็นทางการ ความเชื่อมโยงนี้เป็นที่เข้าใจกันว่าเป็นการเกิดขึ้นร่วมกันบ่อยขึ้น (หรือกลับกัน หายากกว่า) ของการรวมกันของแต่ละหมวดหมู่เมื่อเทียบกับเหตุการณ์ที่คาดไว้ - สถานการณ์ของวัตถุสุ่มอย่างหมดจดที่ไปถึงที่นั่น (ตัวอย่างเช่น สัดส่วนชาวนาที่สูงขึ้นใน พรรค Trudovik และขุนนางในพรรคนายร้อยมากกว่าหุ้นของกลุ่มสังคมเหล่านี้ในประชากรทั้งหมดของเจ้าหน้าที่ Duma)


12. ประเภทของสัญญาณเชิงคุณภาพ เครื่องหมายยศ ตัวอย่างจาก แหล่งประวัติศาสตร์ ที่ ข้อ จำกัด ของค่าสัมประสิทธิ์คืออะไร ความสัมพันธ์อันดับ? ควรใช้ค่าสัมประสิทธิ์ใดในการประเมินความสัมพันธ์ระหว่างอันดับและ สัญญาณเล็กน้อย?

ข้อมูลเชิงคุณภาพ (หรือหมวดหมู่) แบ่งออกเป็นสองประเภท: จัดอันดับและระบุ

ข้อมูลอันดับจะแสดงตามหมวดหมู่ที่คุณสามารถระบุลำดับได้ เช่น หมวดเทียบเคียงตามหลัก "มาก-น้อย" หรือ "ดีกว่า-เลว"

ตัวอย่างของตัวแปรอันดับ:

· คะแนนสอบมีลักษณะของอันดับที่ชัดเจนและแสดงเป็นหมวดหมู่เช่น "ดีเยี่ยม" "ดี" "น่าพอใจ" เป็นต้น

· ระดับการศึกษาสามารถแสดงเป็นชุดของหมวดหมู่: "สูงกว่า", "มัธยม" เป็นต้น

แน่นอน เราสามารถแนะนำมาตราส่วนการจัดอันดับและใช้เพื่อจัดอันดับบุคคลทั้งหมดที่เราทราบระดับการศึกษาหรือคะแนนสอบของพวกเขา อย่างไรก็ตาม จริงหรือไม่ที่ "ดี" แย่กว่า "ยอดเยี่ยม" พอๆ กับ "น่าพอใจ" แย่กว่า "ดี" แม้จะมีข้อเท็จจริงที่เป็นทางการ ในกรณีของเกรด คุณสามารถได้รับความแตกต่างของคะแนน แต่ก็แทบจะไม่ถูกต้องที่จะวัดระยะทางจาก "ยอดเยี่ยม" ถึง "ดี" โดยใช้กฎเดียวกันกับระยะทางจากมอสโกวถึงเซนต์ปีเตอร์สเบิร์ก . ในกรณีของระดับการศึกษานั้นชัดเจนเป็นพิเศษ การคำนวณอย่างง่ายเป็นไปไม่ได้ เนื่องจากไม่มีกฎข้อเดียวสำหรับการลบการศึกษา "ระดับมัธยมศึกษา" ออกจาก "ระดับสูงกว่า" แม้ว่าเราจะกำหนดรหัส "3" ให้กับระดับอุดมศึกษาและรหัส "2" ให้กับระดับมัธยมศึกษาก็ตาม

ความไม่ชอบมาพากลของข้อมูลเชิงคุณภาพไม่ได้หมายความว่าไม่สามารถวิเคราะห์ได้โดยใช้วิธีทางคณิตศาสตร์และสถิติ

วัตถุจำนวนหนึ่งที่เรียงลำดับตามระดับของการแสดงคุณสมบัติบางอย่างเรียกว่า จัดอันดับ แต่ละชุดจะมีการกำหนดหมายเลขดังกล่าว อันดับ.

การวัดความสัมพันธ์ระหว่างคุณลักษณะคู่หนึ่ง ซึ่งแต่ละคุณลักษณะจัดลำดับชุดของวัตถุที่ศึกษา จะเรียกเป็นสถิติ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับ .

ค่าสัมประสิทธิ์เหล่านี้สร้างขึ้นจากคุณสมบัติสามประการต่อไปนี้:

· หากอนุกรมอันดับสำหรับคุณลักษณะทั้งสองตรงกันอย่างสมบูรณ์ (เช่น แต่ละออบเจกต์อยู่ในตำแหน่งเดียวกันในทั้งสองอนุกรม) ค่าสัมประสิทธิ์สหสัมพันธ์อันดับควรเท่ากับ +1 ซึ่งหมายถึงความสัมพันธ์เชิงบวกทั้งหมด:

· ถ้าวัตถุที่อยู่ในแถวเดียวกันอยู่ใน ลำดับย้อนกลับเมื่อเทียบกับวินาที ค่าสัมประสิทธิ์คือ -1 ซึ่งหมายถึงความสัมพันธ์เชิงลบทั้งหมด

· ในสถานการณ์อื่น ค่าสัมประสิทธิ์จะอยู่ในช่วง [-1, +1]; การเพิ่มค่าโมดูลัสของค่าสัมประสิทธิ์จาก 0 เป็น 1 เป็นการระบุลักษณะการเพิ่มขึ้นของความสอดคล้องกันระหว่างสองแถวที่มีอันดับ

คุณสมบัติที่ระบุมีค่าสัมประสิทธิ์สหสัมพันธ์อันดับ สเปียร์แมน และ เคดัลลา ที .

ค่าสัมประสิทธิ์ของ Kedall ให้ค่าประมาณของความสัมพันธ์ที่อนุรักษ์นิยมมากกว่าค่าสัมประสิทธิ์ของ Spearman (ค่าตัวเลขทีน้อยกว่าเสมอ).

ค่าสัมประสิทธิ์ความสัมพันธ์ของคุณลักษณะเชิงคุณภาพ

ในการประเมินความสัมพันธ์ของคุณลักษณะเชิงคุณภาพ จำเป็นต้องมีค่าสัมประสิทธิ์ ซึ่งจะมีค่าสูงสุดที่แน่นอนในกรณีของความสัมพันธ์สูงสุด และจะอนุญาตให้เปรียบเทียบกันได้ ตารางที่แตกต่างกันโดยความแข็งแกร่งของความสัมพันธ์ระหว่างคุณสมบัติ กรณีนี้เราพอดี ค่าสัมประสิทธิ์ของแครมเมอร์ วี .

ขึ้นอยู่กับค่าของการทดสอบไคสแควร์ ค่าสัมประสิทธิ์ของแครมเมอร์ช่วยให้คุณวัดความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรที่จัดหมวดหมู่สองตัวแปร - เพื่อวัดด้วยตัวเลขที่รับค่าจาก 0 ถึง 1 เช่น จากการขาดการสื่อสารอย่างสมบูรณ์ถึงขีดสุด การเชื่อมต่อที่แข็งแกร่ง. ค่าสัมประสิทธิ์ช่วยให้คุณสามารถเปรียบเทียบการพึ่งพาได้ สัญญาณที่แตกต่างกันเพื่อเปิดเผยการเชื่อมต่อที่แข็งแกร่งมากขึ้นและน้อยลง


13. การสร้างแบบจำลองทางคณิตศาสตร์กระบวนการทางประวัติศาสตร์และปรากฏการณ์. คำจำกัดความของคำว่า "แบบจำลอง" แบบจำลองสามประเภท ตัวอย่างของพวกเขาใช้ใน การวิจัยทางประวัติศาสตร์

14. สมการเชิงอนุพันธ์เป็นเครื่องมือหลักในการสร้าง แบบจำลองทางคณิตศาสตร์ประเภททางทฤษฎี คุณลักษณะของพวกเขาเมื่อเปรียบเทียบกับแบบจำลองของการจำลองและประเภทสถิติ ตัวอย่างของรูปแบบดังกล่าว

ส่งงานที่ดีของคุณในฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง

การทำงานที่ดีไปที่ไซต์">

นักศึกษา บัณฑิต นักวิทยาศาสตร์รุ่นเยาว์ที่ใช้ฐานความรู้ในการศึกษาและการทำงานจะขอบคุณมาก

โพสต์เมื่อ http://www.allbest.ru/

ภารกิจที่ 1

ในบางภูมิภาคใน ปีนี้มีการก่ออาชญากรรม 12,390 คดี และในปีที่แล้ว - อาชญากรรม 11,800 คดี คำนวณ (เป็น %) อัตราการเติบโตและอัตราการเติบโตของจำนวนอาชญากรรมที่ลงทะเบียนในปีปัจจุบันโดยสัมพันธ์กับปีก่อนหน้า คำนวณอัตราการเกิดอาชญากรรมในแต่ละปีด้วยหากรวมประชากรในภูมิภาคนี้ในตอนท้าย ปีก่อนคือ 1,475,000 และ ณ สิ้นปีปัจจุบัน - 1,770,000 คน หาข้อสรุปเกี่ยวกับการเปลี่ยนแปลงของอาชญากรรมในภูมิภาค

การตัดสินใจ:เพื่อให้ได้ภาพที่ถูกต้องของอาชญากร ตัวบ่งชี้อาชญากรเช่นพลวัตซึ่งก็คือการเปลี่ยนแปลงตลอดเวลามีความสำคัญอย่างยิ่ง พลวัตของอาชญากรรมมีลักษณะตามแนวคิดของการเติบโตแบบสัมบูรณ์ (หรือการลดลง) และอัตราการเติบโตและการเติบโตของอาชญากรรม เพื่อกำหนดลักษณะเหล่านี้ที่คำนวณตามสูตรบางอย่าง

อัตราการเติบโตของอาชญากรรมคำนวณจากตัวบ่งชี้พื้นฐานของพลวัต ซึ่งเกี่ยวข้องกับการเปรียบเทียบข้อมูลเป็นเวลาหลายปี (และบางครั้งหลายสิบปี หากต้องการข้อมูลที่ครอบคลุมในวงกว้าง) ด้วยพื้นฐานที่คงที่ ซึ่งเข้าใจว่าเป็นระดับของอาชญากรรม ในช่วงเริ่มต้นสำหรับการวิเคราะห์ การคำนวณนี้ช่วยให้นักอาชญาวิทยารับประกันความสามารถในการเปรียบเทียบได้ในระดับมาก ตัวบ่งชี้สัมพัทธ์คำนวณเป็นเปอร์เซ็นต์ ซึ่งแสดงให้เห็นว่าอาชญากรรมในช่วงเวลาต่อมามีความสัมพันธ์กับช่วงเวลาก่อนหน้าอย่างไร

ในการคำนวณ 100% นำมาจากข้อมูลของปีเดิม ตัวบ่งชี้ที่ได้รับสำหรับปีต่อ ๆ ไปจะสะท้อนเฉพาะเปอร์เซ็นต์ของการเติบโต ซึ่งทำให้การคำนวณแม่นยำและภาพมีจุดมุ่งหมายมากขึ้น เมื่อทำงานกับข้อมูลสัมพัทธ์ มันเป็นไปได้ที่จะไม่รวมอิทธิพลต่อการลดลงหรือการเพิ่มขึ้นของอาชญากรรมของจำนวนผู้อยู่อาศัยที่เพิ่มขึ้นหรือลดลงซึ่งมีอายุถึงเกณฑ์ที่ต้องรับผิดชอบทางอาญา

อัตราการเพิ่มขึ้นของอาชญากรรมคิดเป็นเปอร์เซ็นต์ อัตราการเพิ่มขึ้นของอาชญากรรมแสดงให้เห็นว่าอัตราอาชญากรรมที่ตามมาเพิ่มขึ้นหรือลดลงมากน้อยเพียงใดเมื่อเทียบกับช่วงเวลาก่อนหน้า ได้รับการยอมรับ สัญลักษณ์เวกเตอร์อัตราการเติบโต: ถ้า เปอร์เซ็นต์เพิ่มขึ้นให้ใส่เครื่องหมายบวก ถ้าลดลง ให้ใส่เครื่องหมายลบ

สำหรับเงื่อนไขของงานของเรา เราควรใช้สูตรที่เหมาะสมและคำนวณการเติบโตและการเติบโตของอาชญากรรม

1) อัตราการเติบโตของอาชญากรรมคำนวณโดยสูตร ^

Tr \u003d U / U2 * 100%

โดยที่ U เป็นตัวบ่งชี้อัตราการเกิดอาชญากรรม และ U2 เป็นตัวบ่งชี้อัตราการเกิดอาชญากรรมในช่วงก่อนหน้า ดังนั้นอัตราการเติบโตของอาชญากรรมภายใต้เงื่อนไขของปัญหาจะเป็น - 12390/11800 * 100% = 1.05%

2) อัตราการเพิ่มขึ้นของอาชญากรรมคำนวณโดยสูตรต่อไปนี้:

Tpr \u003d Tr-100%

ดังนั้นอัตราการเติบโตตามเงื่อนไขของโจทย์จะเท่ากับ 1.05% -100% = 98.95%

อัตราการเกิดอาชญากรรมเป็นตัวบ่งชี้สรุปที่เฉพาะเจาะจง ทั้งหมดอาชญากรรมที่บันทึกไว้มีความสัมพันธ์กับประชากร ย่อมาจากจำนวนอาชญากรรมต่อประชากร 100,000, 10,000 หรือ 1,000 คน และเป็นมาตรการเชิงวัตถุประสงค์ของอาชญากรรมที่ช่วยให้สามารถเปรียบเทียบระดับอาชญากรรมในภูมิภาคต่างๆ และในปีต่างๆ ได้

อัตราการเกิดอาชญากรรมช่วยในการประเมินพลวัตของระดับอาชญากรรมที่คำนวณต่อหัวได้อย่างเพียงพอ

อัตราอาชญากรรมคำนวณโดยสูตร:

KP \u003d (P x 100000): ยังไม่มีข้อความ

โดยที่ P - จำนวนสัมบูรณ์อาชญากรรมที่บันทึกไว้; และ H คือจำนวนสัมบูรณ์ของประชากรทั้งหมด

ตัวบ่งชี้ทั้งสองถูกนำมาใช้ในปริมาณอาณาเขตและชั่วคราวเดียวกัน จำนวนอาชญากรรมมักจะคำนวณต่อประชากร 100,000 คน แต่ด้วยอาชญากรรมและประชากรจำนวนน้อย (ในเมือง อำเภอ ในองค์กร) สามารถคำนวณอัตราการเกิดอาชญากรรมต่อประชากร 10,000 คนหรือต่อประชากร 1,000 คน ไม่ว่าในกรณีใด ตัวเลขเหล่านี้หมายถึงมิติของค่าสัมประสิทธิ์ที่ต้องพิจารณา ซึ่งจะต้องระบุ: จำนวนอาชญากรรมต่อประชากร 100,000 หรือ 10,000 คน

ลองคำนวณอัตราการเกิดอาชญากรรมตามเงื่อนไขของปัญหาของเรา:

1) CP = (12390 * 100000): 1,770,000 คน = 700 (ในปีปัจจุบัน)

2) CP = (11800 * 100000): 1,475,000 = 800 (ปีก่อนหน้า)

อาชญากรรมในภูมิภาคกำลังลดลง เนื่องจากการวิเคราะห์อัตราการเกิดอาชญากรรม เราสามารถสรุปได้ว่าด้วยการเพิ่มขึ้นของประชากรในภูมิภาค (16.6%) และจำนวนอาชญากรรมที่เพิ่มขึ้นเล็กน้อย 1.05% โดยทั่วไปแล้ว การเพิ่มขึ้นของอาชญากรรมลดลง (-98.95 %)

ภารกิจที่ 2

อายุของผู้เชี่ยวชาญอายุน้อย 11 ปีของสถาบันที่เข้ารับบริการในปีปัจจุบันคือ 19,25,21,23,23,23,25,20,18,20,21 ปีตามลำดับ สรุปและจัดกลุ่มข้อมูลในตารางความถี่ทางสถิติ เพื่อความชัดเจน ให้สร้างรูปหลายเหลี่ยมของความถี่ และค้นหาค่าโมดอล ค่ามัธยฐาน และค่าเฉลี่ยของอายุของพนักงานที่ได้รับการว่าจ้าง

การตัดสินใจ: การจัดกลุ่ม- นี่คือการแบ่งประชากรออกเป็นกลุ่มที่เป็นเนื้อเดียวกันไม่ทางใดก็ทางหนึ่ง จากมุมมองของแต่ละหน่วยของประชากร การจัดกลุ่มคือการรวมตัวกันของหน่วยแต่ละหน่วยของประชากรให้เป็นกลุ่มที่มีความเป็นเนื้อเดียวกันไม่ทางใดก็ทางหนึ่ง

วิธีการจัดกลุ่มขึ้นอยู่กับหมวดหมู่ต่อไปนี้ - แอตทริบิวต์การจัดกลุ่ม ช่วงเวลาการจัดกลุ่ม และจำนวนกลุ่ม

สัญญาณการจัดกลุ่ม- นี่เป็นสัญญาณที่แต่ละหน่วยของประชากรรวมกันเป็นกลุ่มที่เป็นเนื้อเดียวกัน

ช่วงเวลาแสดงขอบเขตเชิงปริมาณของกลุ่ม ตามกฎแล้ว จะแสดงถึงช่วงเวลาระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ในกลุ่ม

การกำหนดจำนวนกลุ่ม.

จำนวนกลุ่มถูกกำหนดโดยประมาณโดยสูตร Sturgess:

n = 1 + 3.2log n = 1 + 3.2log(11) = 4.

ความกว้างของช่วงจะเป็น:

Xmax- ค่าสูงสุดลักษณะการรวมกลุ่มในลักษณะรวม Xmin - ค่าต่ำสุดของแอตทริบิวต์การจัดกลุ่ม มากำหนดขอบเขตของกลุ่มกัน

หมายเลขกลุ่ม

บรรทัดล่าง

ขอบเขตบน

ค่าคุณลักษณะเดียวกันทำหน้าที่เป็นขอบเขตบนและล่างของสองกลุ่มที่อยู่ติดกัน (ก่อนหน้าและถัดไป)

สำหรับแต่ละค่าของซีรีส์ เราจะคำนวณจำนวนครั้งที่ค่านั้นอยู่ในช่วงเวลาหนึ่งๆ ในการทำเช่นนี้ ให้เรียงลำดับชุดตามลำดับจากน้อยไปมาก

จำนวนประชากร

ความถี่

รูปหลายเหลี่ยมความถี่คือกราฟของความหนาแน่นและความน่าจะเป็น ตัวแปรสุ่มเป็นเส้นแบ่งที่เชื่อมต่อจุดที่สอดคล้องกับค่ามัธยฐานของช่วงเวลาการจัดกลุ่มกับความถี่ของช่วงเวลาเหล่านี้

ค่าเฉลี่ย:

แฟชั่นความหมายที่แท้จริง. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

โดยที่ x 0 - จุดเริ่มต้นของช่วงเวลาโมดอล h - ค่าช่วงเวลา f 2 - ความถี่ที่สอดคล้องกับช่วงเวลาโมดอล f 1 - ความถี่พรีโมดอล; f 3 - ความถี่ภายหลัง

เราเลือก 19.75 เป็นจุดเริ่มต้นของช่วงเวลา เนื่องจากเป็นช่วงที่มีตัวเลขมากที่สุด

ค่าที่พบบ่อยที่สุดของซีรีส์คือ 20.92

ค่ามัธยฐาน. ค่ามัธยฐานจะแบ่งกลุ่มตัวอย่างออกเป็นสองส่วน ตัวเลือกครึ่งหนึ่งมีค่าน้อยกว่าค่ามัธยฐาน และค่ามัธยฐานมากกว่าครึ่งหนึ่ง

ในชุดการกระจายช่วงเวลา คุณสามารถระบุเฉพาะช่วงเวลาที่โหมดหรือค่ามัธยฐานจะอยู่ได้ทันที ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง ค่ามัธยฐานคือช่วง 19.75-21.5 เนื่องจาก ในช่วงเวลานี้ ความถี่สะสม S มากกว่าค่ามัธยฐาน (ค่ามัธยฐานคือช่วงแรก ความถี่สะสม S ซึ่งเกินครึ่งหนึ่ง จำนวนเงินทั้งหมดความถี่)

ดังนั้น 50% ของหน่วยประชากรจะน้อยกว่า 21.28

ภารกิจที่ 3

กำหนดขนาดตัวอย่างที่จำเป็นสำหรับการศึกษาอายุเฉลี่ยของพนักงานที่ได้รับการรับรองของ Federal Penitentiary Service of Russia โดยมีเงื่อนไขว่าค่าเบี่ยงเบนมาตรฐานคือ 10 ปี และข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดที่อนุญาตไม่ควรเกิน 5%

เรากำลังมองหาวิธีแก้ปัญหาตามสูตรสำหรับกำหนดขนาดของตัวอย่างสำหรับการเลือกใหม่

Ф(t) = g/2 = 0.95/2 = 0.475 และตามตาราง Laplace ค่านี้สอดคล้องกับ t=1.96

ค่าเบี่ยงเบนมาตรฐานโดยประมาณ s = 10; ข้อผิดพลาดในการสุ่มตัวอย่าง e = 5

ภารกิจที่ 4

ตารางต่อไปนี้แสดงสถิติของแผนกอย่างเป็นทางการเกี่ยวกับการกระจายตัวของนักโทษตามเงื่อนไขการจำคุก (การลงโทษ) สำหรับปี 2545-2554 ซึ่งโพสต์บนเว็บไซต์อย่างเป็นทางการของ Federal Penitentiary Service of Russia: www.fsin.su ค้นหาช่วงและค่าสัมประสิทธิ์การแปรผันของจำนวนนักโทษในแต่ละปีปฏิทิน และสรุปผลเกี่ยวกับความสอดคล้องกันของโครงสร้างของคุณลักษณะทางสถิตินี้

ตัวบ่งชี้หลักที่แสดงลักษณะความเป็นเนื้อเดียวกันของข้อมูลคือค่าสัมประสิทธิ์ของการแปรผัน ในสถิติ เป็นที่ยอมรับกันโดยทั่วไปว่าถ้าค่าของสัมประสิทธิ์น้อยกว่า 33% แสดงว่าชุดข้อมูลนั้นเป็นเนื้อเดียวกัน ถ้ามากกว่า 33% ก็จะต่างกัน

ค่าสัมประสิทธิ์ของการแปรผัน

เพราะวี? 30% จากนั้นประชากรจะเป็นเนื้อเดียวกัน และความแปรผันจะอ่อนแอ ผลลัพธ์ที่ได้สามารถเชื่อถือได้

ระยะเวลาการลงโทษ

1 ถึง 3 ปี

3 ถึง 5 ปี

5 ถึง 10 ปี

อายุ 10 ถึง 15 ปี

กว่า 15 ปี

ค่าสูงสุด (ฟังก์ชัน MAX)

ค่าต่ำสุด (ฟังก์ชัน MIN)

การเปลี่ยนแปลงช่วง

ค่าเฉลี่ย (ฟังก์ชัน AVERAGE)

ส่วนเบี่ยงเบนมาตรฐาน (ฟังก์ชัน STANDAR LONA)

ค่าสัมประสิทธิ์ของการแปรผัน

ค่าเฉลี่ยง่ายๆ:

แฟชั่นความหมาย

ค่ามัธยฐาน

เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 70580 ดังนั้นค่ามัธยฐาน Me = 70580

ตัวบ่งชี้ความแปรปรวน. .

R \u003d X สูงสุด - X นาที

R = 295916-2250 = 293666.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 90895.71

การกระจายตัว

(หมายถึงข้อผิดพลาดตัวอย่าง).

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 103008 โดยเฉลี่ย 107169.83

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

เพราะ v>

หรือ

ปัจจัยการสั่น

ค่าเฉลี่ยง่ายๆ:

แฟชั่น

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 76186 ดังนั้นค่ามัธยฐาน Me = 76186

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R = X สูงสุด - X นาที

R = 291112-3101 = 288011.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นๆ โดยเฉลี่ย 83422.69

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 97334.29 โดยเฉลี่ย 100750.25

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: ค่าสัมประสิทธิ์การแกว่ง ค่าสัมประสิทธิ์เชิงเส้นการแปรผัน การเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ ค่ามากคุณลักษณะรอบค่าเฉลี่ย

ค่าเฉลี่ยง่ายๆ:

แฟชั่นความหมายที่แท้จริง. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 71093 ดังนั้นค่ามัธยฐาน Me = 71093

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R = X สูงสุด - X นาที

R = 243852-3856 = 239996.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 68998.08

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 85765.57 โดยเฉลี่ย 82541.55

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

:

แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์อันดับ: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 74588 ดังนั้นค่ามัธยฐาน Me = 74588

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R \u003d X สูงสุด - X นาที

R=242984-5304=237680.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นๆ โดยเฉลี่ย 73148.73

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 92104.14 โดยเฉลี่ย 82873.1

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

ค่าเฉลี่ยเลขคณิตอย่างง่าย:

แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 76678 ดังนั้นค่ามัธยฐาน Me = 76678

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R \u003d X สูงสุด - X นาที

R = 249346-6536 = 242810.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 79680.53

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 99551.71 โดยเฉลี่ย 87389.04

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

ค่าเฉลี่ยเลขคณิตอย่างง่าย:

แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 76461 ดังนั้นค่ามัธยฐาน Me = 76461

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R \u003d X สูงสุด - X นาที

R = 254722-6704 = 248018.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 82302.82

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 102346.71 โดยเฉลี่ย 89787.88

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

ค่าเฉลี่ยเลขคณิตอย่างง่าย:

แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 78959 ดังนั้นค่ามัธยฐาน Me = 78959

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R \u003d X สูงสุด - X นาที

R = 261334-7635 = 253699.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 83791.55

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 104898.86 โดยเฉลี่ย 91616.15

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

ค่าเฉลี่ยเลขคณิตอย่างง่าย:

แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 75916 ดังนั้นค่ามัธยฐาน Me = 75916

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R \u003d X สูงสุด - X นาที

R=263863-8145=255718.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นๆ โดยเฉลี่ย 82767.96

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 103440.71 โดยเฉลี่ย 91207.92

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

ค่าเฉลี่ยเลขคณิตอย่างง่าย:

แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์อันดับ: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 78019 ดังนั้นค่ามัธยฐาน Me = 78019

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R = X สูงสุด - X นาที

R = 260094-7798 = 252296.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 77827.76

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 99212.29 โดยเฉลี่ย 88081.39

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

ค่าเฉลี่ยเลขคณิตอย่างง่าย:

แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด

ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)

ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง

เราพบช่วงกลางของซีรีส์อันดับ: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 72248 ดังนั้นค่ามัธยฐาน Me = 72248

ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.

ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก

R \u003d X สูงสุด - X นาที

R = 242137-7173 = 234964.

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา

แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 70459.02

การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)

ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 91375.14 โดยเฉลี่ย 80674.43

การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย

ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน

ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย

ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย

ภารกิจที่ 5

ในเงื่อนไขของงานก่อนหน้า ให้จัดกลุ่มช่วงของประโยคใหม่เพื่อปรับปรุงตัวบ่งชี้สัมพัทธ์ของการแปรผันของแอตทริบิวต์ในปี 2010 สร้างฮิสโตแกรมของการกระจายตัวของนักโทษตามเงื่อนไขการจำคุก (การลงโทษ) สำหรับปี 2010 ก่อนและหลังการจัดกลุ่มข้อมูลและสรุปผลเกี่ยวกับความสม่ำเสมอของโครงสร้างของคุณลักษณะทางสถิติภายใต้การศึกษา

การตัดสินใจ:

ตั้งแต่ v>30% แต่ v<70 %, то вариация умеренная.

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ

มาจัดเรียงข้อมูลใหม่ดังนี้:

กลุ่ม 1) รวมกลุ่ม: สูงสุด 1 ปี, 1 ปี, ตั้งแต่ 1-3 ปี, ตามลำดับ 156978

กลุ่ม 2) รวมจากกลุ่ม 3 ถึง 5 ปีอย่างสมบูรณ์และ 1/5 จากกลุ่ม 5 ถึง 10 ปี เราได้ 1/5 * 260094 + 168651 = 220669.8

กลุ่ม 3) รวม 3\5 กลุ่มตั้งแต่ 5 ถึง 10 เช่น 3\5*260094=156056.4

กลุ่ม 4) (1\5*260094)+(1\5*78019)=67622.6.

กลุ่ม 5) 3\5*78019=46811.4.

กลุ่ม 6 30744+(1\5*78019)=46347.8.

กราฟแท่ง. เพื่อให้ได้ข้อสรุปเกี่ยวกับความเป็นเนื้อเดียวกันของคุณลักษณะทางสถิติที่ศึกษา เราจะคำนวณค่าสัมประสิทธิ์ของการแปรผัน:

ตั้งแต่ v>30% แต่ v<70 %, то вариация умеренная.

ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ

ภารกิจที่ 6

ระบุสั้น ๆ (บทคัดย่อ, ใน 1-2 หน้า) เนื้อหาและผลลัพธ์ของการศึกษาทางสถิติอย่างเป็นทางการล่าสุดในแวดวงสังคมและกฎหมาย (หัวข้อ - ที่คุณเลือก, ลิงก์ไปยังแหล่งข้อมูลอินเทอร์เน็ต - จำเป็น), สรุปผลและนำเสนอทางสถิติที่เหมาะสม สมมติฐานสำหรับมุมมองระยะสั้น

จากการศึกษาทางสถิติอย่างเป็นทางการ ได้มีการศึกษาเกี่ยวกับการค้างชำระค่าจ้าง ณ วันที่ 1 ธันวาคม 2015

ณ วันที่ 1 ธันวาคม 2015 ตามองค์กร (ไม่เกี่ยวข้องกับธุรกิจขนาดเล็ก) หนี้ทั้งหมดในแง่ของค่าจ้างสำหรับช่วงของกิจกรรมทางเศรษฐกิจที่สังเกตได้คือ 3900 ล้านรูเบิลของเธอและเมื่อเทียบกับวันที่ 1 พฤศจิกายน 2558 เพิ่มขึ้น 395 ล้านรูเบิล (เพิ่มขึ้น 11.3%)

ค้างชำระค่าจ้าง เนื่องจากไม่มีเงินทุนของตัวเองณ วันที่ 1 ธันวาคม 2558 เป็นจำนวน 3818 ล้านรูเบิลของเธอหรือคิดเป็นร้อยละ 97.9 ของยอดหนี้ค้างชำระทั้งหมด เทียบกับวันที่ 1 พฤศจิกายน 2558 เพิ่มขึ้น 389 ล้านรูเบิล (11.3%) หนี้ เนื่องจากได้รับเงินจากงบประมาณทุกระดับเกินควรเป็นจำนวน 82 ล้านรูเบิลของเธอและเพิ่มขึ้นเมื่อเทียบกับวันที่ 1 พฤศจิกายน 2558 6 ล้านรูเบิล (7.7%) รวมถึงหนี้ จากรัฐบาลกลาง งบประมาณมีจำนวน 62 ล้านรูเบิลและลดลงเมื่อเทียบกับวันที่ 1 พฤศจิกายน 2558 6 ล้านรูเบิล (8.6%) งบประมาณของอาสาสมัครของสหพันธรัฐรัสเซียมีจำนวน 1.1 ล้านรูเบิล (เพิ่มขึ้น 0.2 ล้านรูเบิลหรือ 20.7%) งบประมาณท้องถิ่น - 19 ล้านรูเบิล (เพิ่มขึ้น 12 ล้านรูเบิล หรือ 2.5 เท่า)

ในการขุด การผลิต การดูแลสุขภาพและบริการทางสังคม การประมงและการเลี้ยงปลา 100% ของค่าจ้างที่ค้างชำระเกิดจากการขาดเงินทุนขององค์กร

ในจำนวนค่าจ้างที่ค้างชำระทั้งหมด 37% ตกอยู่ที่การผลิต 29% - การก่อสร้าง 9% - การผลิตและจำหน่ายไฟฟ้า ก๊าซและน้ำ 7% - การขนส่ง 6% - การขุด 5% - เพื่อการเกษตร การล่าสัตว์ และการให้บริการในพื้นที่เหล่านี้ การตัดไม้

ปริมาณค้างชำระค่าจ้าง ณ วันที่ 1 ธันวาคม 2558 มีจำนวนน้อยกว่า 1% ของค่าจ้างรายเดือนของคนงานในกิจกรรมทางเศรษฐกิจประเภทที่สังเกตได้

ค้างค่าจ้าง สำหรับเดือนที่แล้วซึ่งมียอดคงค้างในจำนวนหนี้ที่ค้างชำระทั้งหมดโดยเฉลี่ย 29%: การผลิตและจำหน่ายไฟฟ้า ก๊าซและน้ำ - 75% กิจกรรมในด้านการศึกษา - 37% การดูแลสุขภาพและบริการสังคม - 35% การวิจัยและพัฒนาทางวิทยาศาสตร์ - 32% การก่อสร้าง - 29% การขนส่ง - 23% การผลิต - 22%

จากจำนวนค่าจ้างค้างชำระทั้งหมด หนี้ที่เกิดขึ้นในปี 2557 คิดเป็น 457 ล้านรูเบิล (11.7%) ในปี 2556 และก่อนหน้านี้ - 657 ล้านรูเบิล (16.8%)

โดยทั่วไปแล้ว การสังเกตการเปลี่ยนแปลงของค่าจ้างค้างชำระ (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif) เราสามารถสรุปได้ว่าการลดลงอย่างมีนัยสำคัญจะเกิดขึ้นใน มกราคม กุมภาพันธ์ 2559

เปอร์เซ็นต์หลักของหนี้อยู่ในอุตสาหกรรมการผลิต - 37%, 29% - ในการก่อสร้าง เป็นไปได้มากว่าเป็นผลมาจากความต้องการสินค้าของผู้บริโภคลดลง และกำไรก็ลดลงตามไปด้วย

เรามาตั้งสมมุติฐานกันดีกว่า ตั้งแต่เดือนมกราคม 2559 เปอร์เซ็นต์ของหนี้จะลดลงเนื่องจากการกระจายงบประมาณประจำปีสำหรับปีถัดไปโดยคำนึงถึงการชำระคืนค่าจ้างบางส่วนที่ค้างชำระ และจะมีจำนวน 2,700 ล้าน ค่ามัธยฐานของความผันแปรของอาชญากรรม

เพื่อทดสอบสมมติฐาน (เราใช้ตารางนี้เป็นพื้นฐาน http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif)

ให้เราสร้างอนุกรมการแปรผันแบบไม่ต่อเนื่อง ในการทำเช่นนี้ ให้เรียงลำดับซีรีส์ตามลำดับจากน้อยไปหามาก และนับจำนวนการทำซ้ำสำหรับแต่ละองค์ประกอบของซีรีส์

ลองคำนวณค่าเฉลี่ย:

ลองคำนวณความแปรปรวนกัน การกระจายตัว - แสดงลักษณะของการวัดการกระจายรอบค่าเฉลี่ยของมัน (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)

ใช้การทดสอบแบบด้านเดียวที่มี b = 0.05 ทดสอบสมมติฐานนี้ ถ้าในกลุ่มตัวอย่าง n = 24 เดือน ค่าเฉลี่ยคือ 2741.25 และทราบความแปรปรวนและเท่ากับ y = 193469.27

การตัดสินใจ. ส่วนเบี่ยงเบนมาตรฐาน:

สมมติฐานว่าง H 0 เสนอว่าค่าของความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปเท่ากับจำนวน m 0: = 2700

สมมติฐานทางเลือก:

H 1: ม? 2700 พื้นที่วิกฤต - ทวิภาคี

ในการทดสอบสมมติฐานว่าง จะใช้ตัวแปรสุ่ม:

โดยที่ x คือค่าเฉลี่ยตัวอย่าง S คือค่าเบี่ยงเบนมาตรฐานของประชากรทั่วไป

ถ้าสมมติฐานว่างเป็นจริง แสดงว่าตัวแปรสุ่ม T มีการแจกแจงแบบปกติมาตรฐาน ค่าวิกฤตของสถิติ T พิจารณาจากประเภทของสมมติฐานทางเลือก:

พี(|T|

ให้เราหาค่าการทดลองของสถิติ T:

เนื่องจากขนาดตัวอย่างค่อนข้างใหญ่ (n>30) แทนที่จะใช้ค่าจริงของส่วนเบี่ยงเบนมาตรฐาน คุณจึงใช้ค่าประมาณ S=439.851 ได้

F (t cr) \u003d (1-b) / 2 \u003d (1-0.05) / 2 \u003d 0.475.

ตามตารางฟังก์ชัน Laplace เราพบว่าค่า t kp คืออะไร Ф (t kp) = 0.475

ค่าการทดลองของเกณฑ์ T ไม่ได้อยู่ในขอบเขตวิกฤต T ? t kp ดังนั้นควรยอมรับสมมติฐานว่าง ค่าของความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปสามารถรับได้เท่ากับ 2,700

บรรณานุกรม

1. Kazantsev S.Ya. กฎหมายสถิติ: ตำรา / เอ็ด. ส.ยา Kazantseva, S.Ya. Lebedeva - M.: UNITY-DANA: กฎหมายและกฎหมาย 2552

2. Kurys ใน K.N. พื้นฐานกฎหมายสถิติ: หนังสือเรียน. เบี้ยเลี้ยง / ก.น. คูรีส ใน; VUI FPS ของรัสเซีย - วลาดิเมียร์ 2548 - 44 หน้า

3. มาคาโรว่า เอ็น.วี. สถิติใน Excel: หนังสือเรียน. เบี้ยเลี้ยง / N.V. Makarova, V.Ya. โทรฟิเมตส์ - ม.: การเงินและสถิติ.

4. Kondratyuk L.V., Ovchinsky VS. มิติทางอาชญาวิทยา / บรรณาธิการ. เค.เค. กอร์ยานอฟ - ม.: นอร์มา, 2551.

5. ยาโคฟเลฟ V.B. สถิติ. การคำนวณใน Microsoft Excel: หนังสือเรียน คู่มือสำหรับมหาวิทยาลัย / ว.บ. ยาโคฟเลฟ. - ม.: Kolos, 2548. - 352 น.

โฮสต์บน Allbest.ru

...

เอกสารที่คล้ายกัน

    การศึกษาการกระทำผิดของเด็กและเยาวชนในมุมมองของเป้าหมายของการวิจัยทางอาชญาวิทยา ความสัมพันธ์ระหว่างโรคพิษสุราเรื้อรังในวัยรุ่น การใช้สารเสพติด การติดยาเสพติด และอาชญากรรม สาเหตุ เงื่อนไข และแนวทางป้องกันปัญหาการกระทำผิดของเด็กและเยาวชน

    ภาคนิพนธ์ เพิ่ม 04/08/2011

    ระเบียบวิธีวิจัยทางอาชญาวิทยาเฉพาะทาง ลักษณะทางอาชญาวิทยาของอาชญากรรมรุนแรงและการป้องกัน ภัยสาธารณะและความรุนแรงของผลของอาชญากรรมรุนแรง. สถิติอาชญากรรม.

    ทดสอบ เพิ่ม 01/15/2011

    สูตรคำนวณอัตราการก่ออาชญากรรม การคำนวณภาระงานเฉลี่ยต่อปีต่อผู้พิพากษา, ระยะเวลาเฉลี่ยของการสอบสวนคดีอาญา, อัตราการเติบโตเฉลี่ยต่อปีของอาชญากรรม การคำนวณตัวบ่งชี้โหมด มัธยฐาน การแปรผัน และส่วนเบี่ยงเบนมาตรฐาน

    ทดสอบเพิ่ม 04/20/2011

    การศึกษารากฐานของอาชญากรรมรับจ้าง: แนวคิด องค์ประกอบ วัตถุ และอัตวิสัย คำอธิบายของการป้องกันอาชญากรรมทางสังคมและอาชญากรพิเศษจากแรงจูงใจของทหารรับจ้าง การพัฒนาชุดมาตรการป้องกันอาชญากรรม

    วิทยานิพนธ์, เพิ่ม 11/09/2012

    แนวคิดและหัวเรื่องของการพยากรณ์อาชญาวิทยา. สร้างการเปลี่ยนแปลงที่เป็นไปได้ในสถานะ ระดับ โครงสร้าง และพลวัตของอาชญากรรมในอนาคต การประเมินพัฒนาการของอาชญากรรมในอนาคต การวางแผนควบคุมและป้องกันอาชญากรรม

    ภาคนิพนธ์ เพิ่ม 05/29/2015

    ศึกษาประเภทของการพยากรณ์และการออกแบบอาชญากรในด้านอาชญากร คุณลักษณะของการพยากรณ์การกระทำผิดของเด็กและเยาวชนในสาธารณรัฐคาซัคสถาน การพัฒนาโครงการต่อต้านอาชญากรรมในระดับชาติ

    วิทยานิพนธ์, เพิ่ม 10/25/2015

    การกระทำผิดของเด็กและเยาวชนเป็นเป้าหมายของการวิจัยทางอาชญาวิทยา ลักษณะพื้นฐานทางอาชญาวิทยาของการกระทำผิดของเด็กและเยาวชน สถานะของอาชญากรรม คุณสมบัติของลักษณะส่วนบุคคลของผู้เยาว์

    บทคัดย่อ เพิ่ม 04/01/2003

    แนวโน้มพฤติกรรมอาชญากรของผู้หญิงยุคใหม่: การเติบโตและสัดส่วนที่คงที่ของอาชญากรรมร้ายแรงและการกระทำผิดซ้ำ การฟื้นฟูของอาชญากร และการเพิ่มจำนวนของผู้หญิงสูงอายุในกลุ่มนักโทษ มาตรการทั่วไปในการป้องกันอาชญากรรมหญิง

    บทคัดย่อ เพิ่ม 03/01/2014

    การคำนวณตัวบ่งชี้สัมพัทธ์ของโครงสร้างและการประสานงานของประเภทนักโทษตามความรุนแรงของอาชญากรรมที่ก่อขึ้น อัตราอาชญากรรมและประวัติอาชญากรรมตามเขตของรัฐบาลกลางและรัสเซียโดยรวม การคำนวณตัวบ่งชี้ไดนามิกโดยใช้ MS Excel

    ทดสอบเพิ่ม 07/31/2011

    แนวคิด ประเภท ความหมาย ตัวกำหนดของอาชญากรรมแฝง สาเหตุ วิธีการป้องกันและลด การกำหนดระดับและการวิเคราะห์โครงสร้างอาชญากรรม แนวทางการศึกษาอาชญากรรมแฝงที่เป็นปรากฏการณ์ทางสังคมอย่างเป็นระบบ

นามธรรม

ค่าเฉลี่ยและตัวบ่งชี้ความแปรปรวน

1. สาระสำคัญของค่าเฉลี่ยในสถิติ

2. ประเภทของค่าเฉลี่ยและวิธีการคำนวณ

3. ตัวบ่งชี้หลักของความแปรปรวนและความสำคัญในสถิติ

1. สาระสำคัญของน้ำหนักเฉลี่ยใบหน้าในสถิติ

ในกระบวนการศึกษาปรากฏการณ์ทางเศรษฐกิจและสังคมจำนวนมาก จำเป็นต้องระบุคุณสมบัติทั่วไป ขนาดทั่วไป และลักษณะเฉพาะ ความต้องการค่าเฉลี่ยทั่วไปเกิดขึ้นเมื่อลักษณะเฉพาะของหน่วยของประชากรที่ศึกษาแตกต่างกันในเชิงปริมาณ ตัวอย่างเช่น ปริมาณผลผลิตต่อวันของช่างทอในโรงงานสิ่งทอขึ้นอยู่กับสภาวะทั่วไปของการผลิต ช่างทอใช้วัตถุดิบเดียวกัน ทำงานบนเครื่องจักรเดียวกัน เป็นต้น ในขณะเดียวกัน ผลผลิตรายชั่วโมงของช่างทอแต่ละคนจะผันผวน แตกต่างกันไปเนื่องจากขึ้นอยู่กับลักษณะเฉพาะของช่างทอแต่ละคน (คุณสมบัติ ประสบการณ์วิชาชีพ ฯลฯ) ในการระบุลักษณะผลผลิตรายวันของช่างทอผ้าทั้งหมดขององค์กร จำเป็นต้องคำนวณผลผลิตเฉลี่ยต่อวัน เนื่องจากเฉพาะในตัวบ่งชี้นี้เท่านั้น เงื่อนไขทั่วไปของการผลิตสำหรับช่างทอจะสะท้อนให้เห็น

ดังนั้น การคำนวณตัวบ่งชี้ทั่วไปเฉลี่ยหมายถึงการเบี่ยงเบนความสนใจ (สิ่งที่เป็นนามธรรม) จากคุณลักษณะที่สะท้อนในขนาดของคุณลักษณะในแต่ละหน่วย และการระบุคุณลักษณะทั่วไปและคุณสมบัติที่เหมือนกันในชุดที่กำหนด

ดังนั้น ค่าเฉลี่ยในสถิติจึงเป็นลักษณะทั่วไปเชิงปริมาณของเครื่องหมายและประชากรทางสถิติ เป็นการแสดงออกถึงลักษณะค่าทั่วไปของลักษณะในหน่วยของประชากรซึ่งเกิดขึ้นภายใต้เงื่อนไขของสถานที่และเวลาที่กำหนดภายใต้อิทธิพลของปัจจัยทั้งหมด การกระทำของปัจจัยต่างๆ ทำให้เกิดความผันผวน แปรผันของคุณลักษณะค่าเฉลี่ย ค่าเฉลี่ยเป็นตัววัดทั่วไปของการกระทำของพวกเขา ซึ่งเป็นผลมาจากปัจจัยเหล่านี้ทั้งหมด ค่าเฉลี่ยแสดงลักษณะของประชากรตามแอตทริบิวต์ของค่าเฉลี่ย แต่หมายถึงหน่วยของประชากร ตัวอย่างเช่น ผลผลิตเฉลี่ยต่อผู้ปฏิบัติงานขององค์กรที่กำหนดคืออัตราส่วนของผลผลิตทั้งหมด (สำหรับช่วงเวลาใดๆ) ต่อจำนวนคนงานทั้งหมด (โดยเฉลี่ยสำหรับช่วงเวลาเดียวกัน) มันแสดงลักษณะผลิตภาพแรงงานของจำนวนรวมที่กำหนด แต่หมายถึงคนงานคนเดียว ในค่าเฉลี่ยของปรากฏการณ์มวลความแตกต่างระหว่างบุคคลในหน่วยของประชากรทางสถิติในค่าของแอตทริบิวต์เฉลี่ยจะถูกยกเลิกเนื่องจากสถานการณ์สุ่ม ผลที่ตามมาของการยกเลิกร่วมกันนี้ คุณสมบัติทางธรรมชาติโดยทั่วไปของจำนวนรวมของปรากฏการณ์ทางสถิติที่กำหนดจะแสดงออกมาในค่าเฉลี่ย มีการเชื่อมต่อแบบวิภาษวิธีระหว่างค่าเฉลี่ยและค่าแต่ละค่าของแอตทริบิวต์เฉลี่ย เช่น ระหว่างค่าทั่วไปและค่าแต่ละค่า ค่าเฉลี่ยเป็นหมวดหมู่ที่สำคัญที่สุดของวิทยาศาสตร์ทางสถิติและเป็นรูปแบบที่สำคัญที่สุดของตัวบ่งชี้ทั่วไป ปรากฏการณ์ต่างๆ ของชีวิตทางสังคมจะชัดเจนและแน่นอนก็ต่อเมื่อมันถูกสรุปให้อยู่ในรูปของค่าเฉลี่ยเท่านั้น ตัวอย่างเช่นผลผลิตของแรงงานที่กล่าวถึงข้างต้น จำนวนแรงงานทั้งหมด ผลผลิตของพืชผลทางการเกษตร เป็นต้น ค่าเฉลี่ยเป็นวิธีการที่สำคัญที่สุดในการสรุปทางวิทยาศาสตร์ในสถิติ ในแง่นี้ เราพูดถึงวิธีการหาค่าเฉลี่ยซึ่งใช้กันอย่างแพร่หลายในทางเศรษฐศาสตร์ วิทยาศาสตร์เศรษฐศาสตร์หลายประเภทถูกกำหนดโดยใช้แนวคิดของค่าเฉลี่ย

เงื่อนไขหลักสำหรับการใช้ค่าเฉลี่ยที่ถูกต้องคือความสม่ำเสมอของประชากรทางสถิติตามแอตทริบิวต์ค่าเฉลี่ย จำนวนทั้งสิ้นทางสถิติที่เป็นเนื้อเดียวกันคือจำนวนทั้งสิ้นที่องค์ประกอบ (หน่วย) ขององค์ประกอบนั้นคล้ายคลึงกันในแง่ของคุณสมบัติที่จำเป็นสำหรับการศึกษานี้และอยู่ในปรากฏการณ์ประเภทเดียวกัน ประชากรที่เป็นเนื้อเดียวกัน ซึ่งมีความเหมือนกันในบางประการ อาจแตกต่างกันในประการอื่นๆ เฉพาะในค่าเฉลี่ยสำหรับการรวมดังกล่าวเท่านั้นที่มีคุณลักษณะเฉพาะรูปแบบการพัฒนาของปรากฏการณ์ที่วิเคราะห์ ค่าเฉลี่ยที่คำนวณสำหรับประชากรทางสถิติที่แตกต่างกัน เช่น หนึ่งซึ่งปรากฏการณ์ที่แตกต่างกันในเชิงคุณภาพรวมกันจะสูญเสียความสำคัญทางวิทยาศาสตร์ไป ค่าเฉลี่ยดังกล่าวเป็นเรื่องโกหก ไม่เพียง แต่ไม่ให้แนวคิดเกี่ยวกับความเป็นจริงเท่านั้น แต่ยังบิดเบือนอีกด้วย สำหรับการก่อตัวของมวลรวมทางสถิติที่เป็นเนื้อเดียวกันจะดำเนินการจัดกลุ่มที่เหมาะสม ด้วยความช่วยเหลือของการจัดกลุ่มและในชุดที่เป็นเนื้อเดียวกันในเชิงคุณภาพสามารถแยกแยะกลุ่มที่มีลักษณะเชิงปริมาณได้ สำหรับแต่ละค่าเฉลี่ยสามารถคำนวณได้เองเรียกว่าค่าเฉลี่ยกลุ่ม (ส่วนตัว) ตรงกันข้ามกับค่าเฉลี่ยทั่วไป (สำหรับประชากรโดยรวม)

2. ประเภทของค่าเฉลี่ย

สิ่งที่สำคัญอย่างยิ่งในวิธีการเฉลี่ยคือคำถามของการเลือกรูปแบบของค่าเฉลี่ย เช่น สูตรที่คุณสามารถคำนวณค่าเฉลี่ยได้อย่างถูกต้องและเลือกน้ำหนักเฉลี่ย ใช้มากที่สุดในสถิติ ค่าเฉลี่ยรวม ค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยฮาร์มอนิก ค่าเฉลี่ยเรขาคณิต รูทค่าเฉลี่ยกำลังสอง โหมด และค่ามัธยฐานการใช้สูตรเฉพาะขึ้นอยู่กับเนื้อหาของคุณลักษณะเฉลี่ยและข้อมูลเฉพาะที่ต้องคำนวณ หากต้องการเลือกรูปแบบของค่าเฉลี่ย คุณสามารถใช้อัตราส่วนเริ่มต้นเฉลี่ยที่เรียกว่า

2.1 ค่าเฉลี่ยเลขคณิต

ค่าเฉลี่ยเลขคณิตเป็นหนึ่งในรูปแบบทั่วไปของค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตคำนวณเป็นผลหารของการหารผลรวมของแต่ละค่า (ตัวเลือก) ของการแปรผัน ลงชื่อเข้าใช้หมายเลขของพวกเขาค่าเฉลี่ยเลขคณิตใช้ในกรณีที่ปริมาณของแอตทริบิวต์ตัวแปรของปรากฏการณ์ของประชากรทางสถิติที่เป็นเนื้อเดียวกันนั้นเกิดจากการรวมค่าของแอตทริบิวต์ของหน่วยปรากฏการณ์ทั้งหมดในประชากรทางสถิติ มีค่าเฉลี่ยเลขคณิตดังต่อไปนี้:

1) ค่าเฉลี่ยเลขคณิตอย่างง่ายซึ่งถูกกำหนดโดยการสรุปค่าเชิงปริมาณของแอตทริบิวต์ที่แตกต่างกันและหารผลรวมนี้ด้วยตัวแปรและคำนวณโดยใช้สูตรต่อไปนี้:

X - ค่าเฉลี่ยของประชากรทางสถิติ

x ผม - ผลรวมของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ

n ผม - จำนวนตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ

2) ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก- ค่าเฉลี่ยของเครื่องหมายของปรากฏการณ์ คำนวณโดยคำนึงถึงน้ำหนัก น้ำหนักของค่าเฉลี่ยคือความถี่ที่คำนึงถึงค่าแต่ละค่าของคุณลักษณะเฉลี่ยเมื่อคำนวณค่าเฉลี่ย การเลือกน้ำหนักสำหรับค่าเฉลี่ยขึ้นอยู่กับลักษณะของค่าเฉลี่ยและลักษณะของข้อมูลที่มีในการคำนวณค่าเฉลี่ย ในฐานะที่เป็นน้ำหนักของค่าเฉลี่ย อาจมีตัวบ่งชี้จำนวนหน่วยหรือขนาดของส่วนต่างๆ ของประชากรทางสถิติ (ในรูปของค่าสัมบูรณ์หรือค่าสัมพัทธ์) ที่มีตัวแปร (ค่า) ที่กำหนดของคุณลักษณะค่าเฉลี่ยของปรากฏการณ์ของ ประชากรทางสถิติ ตลอดจนค่าของตัวบ่งชี้ที่เกี่ยวข้องกับคุณลักษณะค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักคำนวณโดยใช้สูตรต่อไปนี้:

X- ค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต

x - ค่าของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ

จุดประสงค์ของค่าเฉลี่ยเลขคณิตแบบง่ายและถ่วงน้ำหนักคือการกำหนดค่าเฉลี่ยของแอตทริบิวต์ตัวแปร หากในประชากรทางสถิติที่ศึกษาตัวแปรของค่าแอตทริบิวต์เกิดขึ้นครั้งเดียวหรือมีน้ำหนักเท่ากันก็จะใช้ค่าเฉลี่ยเลขคณิตอย่างง่าย แต่ถ้าตัวแปรของค่าของแอตทริบิวต์นี้เกิดขึ้นหลายครั้งใน ประชากรที่ศึกษาหรือมีน้ำหนักต่างกันจะใช้ค่าเฉลี่ยเลขคณิตเพื่อกำหนดค่าเฉลี่ยของแอตทริบิวต์ตัวแปร ถ่วงน้ำหนัก

2.2 ฮาร์มอนิกเฉลี่ย

ค่าเฉลี่ยฮาร์มอนิกใช้ในการคำนวณค่าเฉลี่ยเมื่อไม่มีข้อมูลโดยตรงเกี่ยวกับน้ำหนัก แต่ตัวแปรของคุณสมบัติเฉลี่ย (x) และผลคูณของค่าตัวเลือกตามจำนวนหน่วยที่มีค่านี้ w (w = xf) เป็นที่รู้จัก

ค่าเฉลี่ยนี้คำนวณโดยใช้สูตรต่อไปนี้:

1.) ฮาร์มอนิกเฉลี่ยอย่างง่าย:

X - ฮาร์มอนิกอย่างง่าย

n - จำนวนตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ

2) ฮาร์มอนิกเฉลี่ยถ่วงน้ำหนัก:

X - ค่าเฉลี่ยถ่วงน้ำหนักแบบฮาร์มอนิก

x - ผลรวมของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ

เมื่อใช้ฮาร์มอนิกถ่วงน้ำหนัก น้ำหนักจะถูกระบุและทำให้ได้ผลลัพธ์เดียวกันซึ่งจะให้การคำนวณค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักหากทราบข้อมูลทั้งหมดที่จำเป็นสำหรับสิ่งนี้

2.3 รวมเฉลี่ย

การรวมค่าเฉลี่ยคำนวณโดยสูตร:

X - ผลรวมเฉลี่ย

x - ผลรวมของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ

ค่าเฉลี่ยรวมจะคำนวณในกรณีที่ทราบค่าของตัวเศษและตัวส่วนของอัตราส่วนเริ่มต้นของค่าเฉลี่ย (มี)

2.4 ค่าเฉลี่ยเรขาคณิต

ค่าเฉลี่ยทางเรขาคณิตเป็นหนึ่งในรูปแบบของค่าเฉลี่ยและคำนวณเป็นรากของระดับที่ n จากผลคูณของแต่ละค่า - ตัวแปรของแอตทริบิวต์ (x) และกำหนดโดยสูตรต่อไปนี้:

ค่าเฉลี่ยทางเรขาคณิตส่วนใหญ่จะใช้ในการคำนวณอัตราการเติบโตเฉลี่ย

2.5 โหมดและค่ามัธยฐาน

พร้อมกับค่าเฉลี่ยที่พิจารณาข้างต้น สิ่งที่เรียกว่า ค่าเฉลี่ยโครงสร้าง - โหมดและค่ามัธยฐาน

โหมด (Mo) เป็นค่าที่เกิดขึ้นบ่อยที่สุดของคุณลักษณะในหน่วยประชากร. สำหรับซีรีส์แบบไม่ต่อเนื่อง ตัวเลือกนี้มีความถี่สูงสุด

ในซีรีส์การแปรผันของช่วงเวลา อันดับแรกสามารถกำหนดช่วงเวลาที่โหมดตั้งอยู่ได้ เช่น ช่วงเวลาโมดอลที่เรียกว่า ในอนุกรมแปรผันที่มีช่วงเท่ากัน ช่วงโมดอลถูกกำหนดโดยความถี่สูงสุด ในอนุกรมที่มีช่วงไม่เท่ากัน โดยความหนาแน่นของการกระจายสูงสุด

เมื่อต้องการกำหนดโหมดในแถวที่มีช่วงเวลาเท่ากัน ให้ใช้สูตรของแบบฟอร์มต่อไปนี้:

Хн - ขีด จำกัด ล่างของช่วงเวลาโมดอล

h - ค่าช่วงเวลา

ฉ 1 , ฉ 2 , ฉ 3 - ความถี่ (หรือรายละเอียด) ของช่วงก่อนโมดอล โมดอล และหลังโมดอล ตามลำดับ

ในซีรีย์ช่วงเวลา โหมดสามารถพบได้ในรูปแบบกราฟิก ในการทำเช่นนี้ เส้นสองเส้นจะดึงออกมาจากขอบเขตของสองคอลัมน์ที่อยู่ติดกันในคอลัมน์สูงสุดของฮิสโตแกรม จากนั้นจากจุดตัดกันตั้งฉากจะลดลงไปที่แกน abscissa ค่าคุณลักษณะบน abscissa ที่สอดคล้องกับแนวตั้งฉากจะเป็นโหมด

ในหลายกรณี เมื่อระบุลักษณะของประชากรเป็นตัวบ่งชี้ทั่วไป การตั้งค่าจะถูกกำหนดให้กับฐานนิยมมากกว่าค่าเฉลี่ยเลขคณิต

ดังนั้นเมื่อศึกษาราคาในตลาด จึงไม่ใช่ราคาเฉลี่ยสำหรับผลิตภัณฑ์บางอย่างที่ได้รับการแก้ไขและศึกษาในไดนามิก แต่เป็นราคาโมดอล เมื่อศึกษาความต้องการของประชากรสำหรับรองเท้าหรือเสื้อผ้าบางขนาด มันเป็นเรื่องที่น่าสนใจที่จะกำหนดขนาดรองเท้าแบบโมดัล และขนาดเฉลี่ยเช่นนี้ไม่สำคัญเลย แฟชั่นไม่ได้เป็นเพียงความสนใจที่เป็นอิสระเท่านั้น แต่ยังมีบทบาทเป็นตัวบ่งชี้เสริมในค่าเฉลี่ยซึ่งแสดงถึงลักษณะเฉพาะของมัน หากค่าเฉลี่ยเลขคณิตมีค่าใกล้เคียงกับฐานนิยม แสดงว่าเป็นเรื่องปกติ

ค่ามัธยฐาน (Me) คือค่าของคุณสมบัติในหน่วยกลางของซีรีส์อันดับ (ชุดอันดับคือชุดที่เขียนค่าแอตทริบิวต์โดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปน้อย)

หากต้องการหาค่ามัธยฐาน อันดับแรกจะกำหนดหมายเลขซีเรียล ในการทำเช่นนี้ ด้วยจำนวนหน่วยคี่ หนึ่งจะถูกบวกเข้ากับผลรวมของความถี่ทั้งหมด และทุกอย่างจะถูกหารด้วยสอง หากจำนวนหน่วยเป็นเลขคู่ จะมีหน่วยกลางสองหน่วยในซีรีส์ และตามกฎทั้งหมด ค่ามัธยฐานควรถูกกำหนดเป็นค่าเฉลี่ยของค่าของหน่วยทั้งสองนี้ ในเวลาเดียวกัน ในทางปฏิบัติด้วยจำนวนหน่วยที่เท่ากัน ค่ามัธยฐานจะถูกพบว่าเป็นค่าของแอตทริบิวต์ของหน่วย จำนวนลำดับที่กำหนดโดยผลรวมของความถี่หารด้วยสอง เมื่อทราบเลขลำดับของค่ามัธยฐานแล้ว การหาค่าจากความถี่สะสมจึงเป็นเรื่องง่าย

ในอนุกรมช่วงเวลา หลังจากกำหนดเลขลำดับของค่ามัธยฐานโดยความถี่สะสม (โดยเฉพาะ) แล้วจะพบช่วงค่ามัธยฐาน จากนั้นใช้เทคนิคการแก้ไขที่ง่ายที่สุด ค่าของค่ามัธยฐานจะถูกกำหนด การคำนวณนี้แสดงโดยสูตรต่อไปนี้:

Xn - ขีด จำกัด ล่างของช่วงเวลามัธยฐาน

ชั่วโมง - ค่าของช่วงเวลามัธยฐาน

เลขลำดับของค่ามัธยฐาน

S Me - 1 ความถี่ (ความถี่) สะสมจนถึงช่วงมัธยฐาน

F Me - ความถี่ (โดยเฉพาะ) ของช่วงมัธยฐาน

ตามสูตรที่เป็นลายลักษณ์อักษร ที่ขอบเขตล่างของช่วงเวลามัธยฐาน ส่วนหนึ่งของค่าช่วงเวลาดังกล่าวจะถูกเพิ่มเข้าไปในเศษส่วนของหน่วยของกลุ่มนี้ซึ่งขาดหายไปจากเลขลำดับของค่ามัธยฐาน กล่าวอีกนัยหนึ่ง การคำนวณค่ามัธยฐานตั้งอยู่บนสมมติฐานที่ว่าการเติบโตของคุณลักษณะระหว่างหน่วยของแต่ละกลุ่มเกิดขึ้นเท่าๆ กัน จากที่ได้กล่าวไว้ ค่ามัธยฐานสามารถคำนวณได้อีกทางหนึ่ง เมื่อพิจารณาช่วงเวลามัธยฐานแล้ว คุณสามารถลบออกจากขีดจำกัดบนของช่วงเวลามัธยฐาน (Xv) ซึ่งเป็นส่วนหนึ่งของช่วงเวลาที่ตรงกับเศษส่วนของหน่วยที่เกินจำนวนลำดับของค่ามัธยฐาน เช่น ตามสูตรต่อไปนี้:

ค่ามัธยฐานยังสามารถกำหนดได้แบบกราฟิก เมื่อต้องการทำเช่นนี้ สะสมจะถูกสร้างขึ้นและจากจุดบนสเกลของความถี่สะสม (เฉพาะ) ที่สอดคล้องกับเลขลำดับของค่ามัธยฐาน เส้นตรงจะถูกลากขนานกับแกน x จนกว่าจะตัดกับค่ามัธยฐาน จากนั้นจากจุดตัดของเส้นตรงที่ระบุกับจุดสะสม เส้นตั้งฉากจะลดลงไปที่แกน abscissa ค่าของจุดสนใจบนแกน x ที่สอดคล้องกับพิกัดที่วาด (ตั้งฉาก) จะเป็นค่ามัธยฐาน

ด้วยหลักการเดียวกัน มันเป็นเรื่องง่ายที่จะหาค่าของคุณสมบัติสำหรับหน่วยใด ๆ ของซีรีส์อันดับ

ดังนั้น ตัวบ่งชี้ทั้งชุดสามารถใช้ในการคำนวณค่าเฉลี่ยของชุดการเปลี่ยนแปลงได้

3. ตัวบ่งชี้หลักของ variและความสำคัญในทางสถิติ

เมื่อศึกษาลักษณะที่ผันแปรในหน่วยของประชากร เราไม่สามารถจำกัดตัวเองให้คำนวณเฉพาะค่าเฉลี่ยจากตัวแปรแต่ละตัวได้ เนื่องจากค่าเฉลี่ยที่เหมือนกันอาจหมายถึงประชากรที่ห่างไกลจากองค์ประกอบที่เหมือนกัน สามารถแสดงได้ด้วยตัวอย่างตามเงื่อนไขต่อไปนี้ ซึ่งสะท้อนข้อมูลเกี่ยวกับจำนวนครัวเรือนในกิจการเกษตรของสองอำเภอ:

จำนวนครัวเรือนโดยเฉลี่ยในฟาร์มของทั้งสองเขตเท่ากันคือ 160 ครัวเรือน ในขณะเดียวกัน องค์ประกอบของฟาร์มเหล่านี้ในสองเขตก็ห่างไกลจากความเหมือนกัน ดังนั้นจึงจำเป็นต้องวัดความแปรผันของลักษณะเฉพาะในประชากร

เพื่อจุดประสงค์นี้ มีการคำนวณคุณสมบัติจำนวนหนึ่งในสถิติ เช่น ตัวชี้วัด ตัวบ่งชี้พื้นฐานที่สุดของการเปลี่ยนแปลงของลักษณะคือ ช่วงของการเปลี่ยนแปลง ซึ่งเป็นความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของลักษณะในชุดรูปแบบนี้ เช่น R = Xmax - X นาที ในตัวอย่างของเรา ในพื้นที่ที่ 1 R = 300 - 80 - 220 และในพื้นที่ที่สอง R = 180 - 145 = 35

ตัวบ่งชี้ช่วงของการเปลี่ยนแปลงไม่สามารถใช้งานได้เสมอไป เนื่องจากจะพิจารณาเฉพาะค่าสูงสุดของลักษณะซึ่งอาจแตกต่างอย่างมากจากหน่วยอื่นๆ ทั้งหมด บางครั้งพวกเขาพบอัตราส่วนของช่วงของการแปรผันต่อค่าเฉลี่ยเลขคณิตและใช้ค่านี้เรียกมันว่าตัวบ่งชี้ การสั่น

อย่างแม่นยำยิ่งขึ้น คุณสามารถระบุความผันแปรในชุดข้อมูลได้โดยใช้ตัวบ่งชี้ที่พิจารณาความเบี่ยงเบนของตัวเลือกทั้งหมดจากค่าเฉลี่ยเลขคณิต มีตัวบ่งชี้ดังกล่าวสองตัวในสถิติ - ค่าเฉลี่ยเชิงเส้นและค่าเฉลี่ยส่วนเบี่ยงเบนกำลังสอง

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ยแสดงถึงค่าเฉลี่ยเลขคณิตของค่าสัมบูรณ์ของการเบี่ยงเบนของตัวแปรจากค่าเฉลี่ย เครื่องหมายเบี่ยงเบนจะถูกละเว้นในกรณีนี้ มิฉะนั้น ผลรวมของการเบี่ยงเบนทั้งหมดจะเท่ากับศูนย์ ตัวบ่งชี้นี้คำนวณโดยสูตร:

b) สำหรับชุดการเปลี่ยนแปลง:

โปรดทราบว่าค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจะน้อยที่สุดหากคำนวณค่าเบี่ยงเบนจากค่ามัธยฐาน เช่น ตามสูตร:

ส่วนเบี่ยงเบนมาตรฐาน () มีการคำนวณดังนี้ - แต่ละส่วนเบี่ยงเบนจากค่าเฉลี่ยจะยกกำลังสอง กำลังสองทั้งหมดจะรวมกัน (โดยคำนึงถึงน้ำหนัก) หลังจากนั้นผลรวมของกำลังสองจะถูกหารด้วยจำนวนสมาชิกของซีรีส์ และรากที่สองจะถูกแยกออกจากผลหาร

การกระทำทั้งหมดนี้แสดงโดยสูตรต่อไปนี้:

ก) สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม:

b) สำหรับชุดการเปลี่ยนแปลง:

ฉ เช่น ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของค่าเฉลี่ยเลขคณิตของส่วนเบี่ยงเบนกำลังสองของค่าเฉลี่ย การแสดงออกภายใต้รากเรียกว่าความแปรปรวน การกระจายตัวมีการแสดงออกที่เป็นอิสระทางสถิติและเป็นตัวบ่งชี้ที่สำคัญที่สุดอย่างหนึ่งของความแปรผัน

โดยที่ - ตามลำดับ ค่าสูงสุดและต่ำสุดของแอตทริบิวต์ในการรวม

คือจำนวนกลุ่ม

ชุดการแจกจ่ายสามารถมองเห็นได้โดยใช้การแสดงกราฟิก ด้วยเหตุนี้จึงมีการสร้างรูปหลายเหลี่ยม ฮิสโตแกรม เส้นโค้งสะสม และโอกีฟ

ธีม 4ค่าสัมบูรณ์และสัมพัทธ์

แนวคิดของตัวบ่งชี้ทางสถิติและประเภทของมัน

สถิติ- นี่คือลักษณะทั่วไปเชิงปริมาณและเชิงคุณภาพของคุณสมบัติบางอย่างของกลุ่มหน่วยหรือโดยรวมในเงื่อนไขเฉพาะของสถานที่และเวลา ตัวบ่งชี้ทางสถิติจะได้รับจากการคำนวณซึ่งแตกต่างจากลักษณะเฉพาะ นี่อาจเป็นการนับหน่วยประชากรอย่างง่าย การรวมค่าแอตทริบิวต์ การเปรียบเทียบค่าตั้งแต่สองค่าขึ้นไป การเปรียบเทียบที่ซับซ้อนมากขึ้น

1. ตามความครอบคลุมของหน่วยประชากร ตัวชี้วัดทางสถิติแบ่งย่อย:


2. ตามวิธีการคำนวณ ตัวบ่งชี้ทางสถิติแบ่งออกเป็น:

3. ตามความแน่นอนเชิงพื้นที่ ตัวชี้วัดทางสถิติแบ่งออกเป็น:


ตามรูปแบบของนิพจน์ ตัวบ่งชี้ทางสถิติแบ่งออกเป็น:

ค่าสัมบูรณ์

ค่าสัมบูรณ์ (ตัวบ่งชี้)- เป็นตัวเลขที่แสดงขนาด ปริมาณ ของปรากฏการณ์ในเงื่อนไขเฉพาะของสถานที่และเวลา ค่าสัมบูรณ์มักจะตั้งชื่อค่านั่นคือมีหน่วยการวัด ขึ้นอยู่กับหน่วยวัดที่เลือก ประเภทของค่าสัมบูรณ์:

1. เป็นธรรมชาติ- บอกลักษณะของปริมาตรและขนาดของปรากฏการณ์ในรูปของความยาว น้ำหนัก ปริมาตร จำนวนหน่วย จำนวนเหตุการณ์ ตัวบ่งชี้ตามธรรมชาติใช้เพื่อระบุลักษณะปริมาตร ขนาดของผลิตภัณฑ์แต่ละประเภทที่มีชื่อเดียวกัน ดังนั้นการใช้จึงถูกจำกัด

2. เป็นธรรมชาติตามเงื่อนไข- ใช้ในกรณีที่จำเป็นต้องถ่ายโอนผลิตภัณฑ์ประเภทต่างๆ แต่มีมูลค่าเท่ากันไปยังตัวบ่งชี้ที่มีเงื่อนไขเดียว ตัวบ่งชี้ธรรมชาติตามเงื่อนไขคำนวณโดยการคูณตัวบ่งชี้ธรรมชาติด้วยค่าสัมประสิทธิ์การแปลง (การคำนวณใหม่) ค่าสัมประสิทธิ์การแปลงนำมาจากไดเร็กทอรีหรือคำนวณโดยอิสระ ตัวบ่งชี้ตามธรรมชาติแบบมีเงื่อนไขใช้เพื่อระบุลักษณะปริมาตร ขนาดของผลิตภัณฑ์ที่เป็นเนื้อเดียวกัน ดังนั้นการใช้งานจึงถูกจำกัด

3. แรงงาน- มีหน่วยวัดเช่น ชั่วโมงทำงาน วันทำงาน ใช้ในการกำหนดต้นทุนเวลาทำงาน คำนวณค่าจ้าง และผลิตภาพแรงงาน

4. ค่าใช้จ่าย(สากล) วัดเป็นสกุลเงินของประเทศนั้นๆ ตัวบ่งชี้ต้นทุน = ปริมาณของผลิตภัณฑ์ในแง่กายภาพ * ราคาต่อหน่วยการผลิต ตัวบ่งชี้ต้นทุนเป็นแบบสากลเนื่องจากช่วยให้คุณสามารถกำหนดปริมาณขนาดของผลิตภัณฑ์ประเภทต่างๆ

ข้อเสียของตัวบ่งชี้สัมบูรณ์: ไม่สามารถระบุลักษณะเชิงคุณภาพและโครงสร้างของปรากฏการณ์ที่กำลังศึกษาได้ สำหรับสิ่งนี้จะใช้ตัวบ่งชี้สัมพัทธ์ซึ่งคำนวณจากตัวบ่งชี้สัมบูรณ์

ค่าสัมพัทธ์

ตัวบ่งชี้สัมพัทธ์- นี่คือตัวบ่งชี้ที่เป็นผลหารของการหารตัวบ่งชี้สัมบูรณ์หนึ่งตัวด้วยตัวบ่งชี้อื่นและให้การวัดความสัมพันธ์ระหว่างตัวบ่งชี้เป็นตัวเลข


ไม่มีชื่อ O.P.

1. จะได้ค่าสัมประสิทธิ์หากฐานเปรียบเทียบเป็น 1 หากค่าสัมประสิทธิ์มากกว่า 1 แสดงว่าค่าที่เปรียบเทียบมากกว่าฐานเปรียบเทียบหลายเท่า หากค่าสัมประสิทธิ์น้อยกว่า 1 แสดงว่าส่วนใดของฐานเปรียบเทียบคือค่าเปรียบเทียบ

2. เปอร์เซ็นต์จะได้มาถ้าฐานของการเปรียบเทียบคือ 100 จะได้เปอร์เซ็นต์โดยการคูณค่าสัมประสิทธิ์ด้วย 100

3. Permille (‰) - หากฐานของการเปรียบเทียบคือ 1,000 ได้จากการคูณค่าสัมประสิทธิ์ด้วย 1,000 Permille ใช้เพื่อหลีกเลี่ยงค่าเศษส่วนของตัวบ่งชี้ มีการใช้กันอย่างแพร่หลายในสถิติประชากร ซึ่งกำหนดอัตราการตาย อัตราการเกิด และการแต่งงานต่อประชากร 1,000 คน

4. โปรเดซิมิลล์ (‰0) ถ้าฐานของการเปรียบเทียบคือ 10,000 จะได้โดยการคูณค่าสัมประสิทธิ์ด้วย 10,000 เช่น จำนวนแพทย์ จำนวนเตียงในโรงพยาบาลต่อประชากร 10,000 คน

ประเภทของค่าสัมพัทธ์ (ตัวบ่งชี้):

1. ดัชนีโครงสร้างสัมพัทธ์:

ตัวบ่งชี้นี้คำนวณจากข้อมูลที่จัดกลุ่มและแสดงส่วนแบ่งของแต่ละส่วนในปริมาณรวมของประชากร สามารถแสดงเป็นอัตราส่วน (ส่วนแบ่ง) หรือร้อยละ (ความถ่วงจำเพาะ) ตัวอย่าง 0.4 - ส่วนแบ่ง 40% - ความถ่วงจำเพาะ ผลรวมของหุ้นทั้งหมดเท่ากับ 1 และความถ่วงจำเพาะคือ 100%

2. ตัวบ่งชี้สัมพัทธ์ของไดนามิก:

.

ตัวบ่งชี้นี้แสดงการเปลี่ยนแปลงของปรากฏการณ์เมื่อเวลาผ่านไป ซึ่งแสดงในรูปของค่าสัมประสิทธิ์ - ปัจจัยการเติบโต และในรูปของเปอร์เซ็นต์ - อัตราการเติบโต

3. ประสิทธิภาพสัมพัทธ์ของแผน:

ตัวบ่งชี้นี้แสดงระดับของการดำเนินการตามแผนและแสดงในรูปของ%

ตัวบ่งชี้เป้าหมายสัมพัทธ์:

ตัวบ่งชี้นี้แสดงสิ่งที่มีแผนจะเปลี่ยนแปลงตัวบ่งชี้ในอนาคตเมื่อเทียบกับช่วงเวลาก่อนหน้า และแสดงเป็นเปอร์เซ็นต์

ความสัมพันธ์ระหว่างตัวบ่งชี้: .

5. ตัวบ่งชี้สัมพัทธ์ของการประสานงาน:

ตัวบ่งชี้นี้สามารถคำนวณได้ 1, 10, 100 หน่วย และแสดงจำนวนหน่วยของส่วนหนึ่งที่คิดเป็นค่าเฉลี่ย 1, 10, 100 หน่วยของอีกส่วนหนึ่ง ตัวอย่างเช่น จำนวนประชากรในเมืองต่อชาวบ้าน 1, 10, 100 คน

6. ตัวบ่งชี้ความเข้มสัมพัทธ์:

ตัวบ่งชี้นี้คำนวณโดยการเปรียบเทียบตัวบ่งชี้ต่าง ๆ ที่มีความสัมพันธ์ซึ่งกันและกัน ตัวบ่งชี้นี้สามารถคำนวณได้ 1, 10, 100 หน่วยและเป็นตัวบ่งชี้ที่มีชื่อ ตัวอย่างเช่น ความหนาแน่นของประชากร - คน / 1, 10, 100 km2

7. ดัชนีเปรียบเทียบสัมพัทธ์:

ตัวบ่งชี้นี้คำนวณโดยการเปรียบเทียบตัวบ่งชี้ที่คล้ายกันที่เกี่ยวข้องกับช่วงเวลาเดียวกัน แต่กับวัตถุหรือดินแดนที่แตกต่างกัน ซึ่งแสดงในรูปของค่าสัมประสิทธิ์และเปอร์เซ็นต์

ธีม 5. ค่าเฉลี่ยและตัวบ่งชี้ความแปรปรวน

1. ค่าเฉลี่ย: แนวคิดและประเภท

ค่าเฉลี่ย -นี่เป็นตัวบ่งชี้ทั่วไปที่แสดงลักษณะระดับทั่วไปของลักษณะเชิงปริมาณที่แตกต่างกันต่อหน่วยของประชากรภายใต้เงื่อนไขของสถานที่และเวลา

เงื่อนไขการคำนวณค่าเฉลี่ย:

1. จำนวนประชากรที่ใช้คำนวณค่าเฉลี่ยจะต้องมีขนาดใหญ่เพียงพอ มิฉะนั้น ค่าเบี่ยงเบนแบบสุ่มในค่าของแอตทริบิวต์จะไม่ถูกยกเลิก และค่าเฉลี่ยจะไม่แสดงรูปแบบที่มีอยู่ในกระบวนการนี้

2. ประชากรที่ใช้คำนวณค่าเฉลี่ยจะต้องมีคุณสมบัติเป็นเนื้อเดียวกัน มิฉะนั้นจะไม่เพียงไม่มีคุณค่าทางวิทยาศาสตร์เท่านั้น แต่ยังอาจเป็นอันตราย บิดเบือนธรรมชาติที่แท้จริงของปรากฏการณ์ที่กำลังศึกษา

3. ค่าเฉลี่ยโดยรวมควรเสริมด้วยค่าเฉลี่ยกลุ่ม ค่าเฉลี่ยทั่วไปแสดงขนาดทั่วไปของประชากรทั้งหมด และค่าเฉลี่ยกลุ่มแสดงแต่ละส่วนพร้อมคุณสมบัติเฉพาะ

4. สำหรับคำอธิบายที่ครอบคลุมของปรากฏการณ์ ควรคำนวณระบบตัวบ่งชี้ค่าเฉลี่ยตามคุณลักษณะที่สำคัญที่สุด

ค่าเฉลี่ยจะถูกตั้งชื่อเสมอ โดยมีมิติเดียวกับคุณลักษณะค่าเฉลี่ย

ประเภทของค่าเฉลี่ย:

1. อำนาจหมายถึง(ซึ่งรวมถึงค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยฮาร์มอนิก ค่าเฉลี่ยกำลังสอง ค่าเฉลี่ยเรขาคณิต)

2. ค่าเฉลี่ยโครงสร้าง(โหมดและค่ามัธยฐาน)

ค่าเฉลี่ยกำลังคำนวณโดยสูตร (รูทกำลัง R ของค่าเฉลี่ยของตัวเลือกทั้งหมดที่มีขอบเขต):

ค่าเฉลี่ยกำลังของคุณลักษณะที่กำลังศึกษาอยู่ที่ไหน

− ค่าแต่ละค่าของคุณลักษณะเฉลี่ย

− ตัวบ่งชี้ระดับของค่าเฉลี่ย

− จำนวนสัญญาณ (ชุดเดียว);

- จำนวนเงิน

ได้รับค่าเฉลี่ยอย่างง่ายประเภทต่าง ๆ ขึ้นอยู่กับระดับ

ความหมาย

ชื่อของค่าเฉลี่ยอย่างง่าย

ฮามอนิกอย่างง่าย

โดยที่ P คือผลคูณ

รูปทรงเรขาคณิตที่เรียบง่าย

เลขคณิตอย่างง่าย

กำลังสองอย่างง่าย

ยิ่งเลขชี้กำลัง () ในค่าเฉลี่ยกำลังสูง ค่าของค่าเฉลี่ยก็จะยิ่งมากขึ้นเท่านั้น หากเราคำนวณค่าเฉลี่ยเหล่านี้สำหรับข้อมูลเดียวกัน เราจะได้อัตราส่วนต่อไปนี้:

คุณสมบัติของกฎแห่งอำนาจหมายถึงการเพิ่มขึ้นด้วยการเพิ่มขึ้นของเลขชี้กำลังของฟังก์ชันที่กำหนดเรียกว่ากฎของวิธีสำคัญ

ในบรรดาค่าเฉลี่ยประเภทนี้ ค่าเฉลี่ยที่ใช้บ่อยที่สุดคือค่าเฉลี่ยเลขคณิตและค่าเฉลี่ยฮาร์มอนิก การเลือกประเภทของค่าเฉลี่ยขึ้นอยู่กับข้อมูลเริ่มต้น

ค่าเฉลี่ยเลขคณิต: วิธีการคำนวณและคุณสมบัติของมัน

ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของค่าแต่ละค่าของคุณลักษณะของหน่วยประชากรทั้งหมดด้วยจำนวนหน่วยประชากร

ค่าเฉลี่ยเลขคณิตใช้ในรูปแบบของค่าเฉลี่ยอย่างง่ายและค่าเฉลี่ยถ่วงน้ำหนัก ค่าเฉลี่ยเลขคณิตอย่างง่ายคำนวณโดยสูตร:

ค่าเฉลี่ยของคุณสมบัติอยู่ที่ไหน

- ค่าแต่ละค่าของแอตทริบิวต์ (ตัวเลือก);

− จำนวนหน่วยประชากร (ตัวเลือก)

ค่าเฉลี่ยเลขคณิตอย่างง่ายใช้ในสองกรณี:

เมื่อแต่ละตัวแปรเกิดขึ้นเพียงครั้งเดียวในชุดการแจกจ่าย

เมื่อความถี่เท่ากันหมด

ค่าเฉลี่ยถ่วงน้ำหนักเลขคณิตใช้เมื่อความถี่ไม่เท่ากัน:

ที่ไหน − ความถี่หรือน้ำหนัก (ตัวเลขแสดงจำนวน

ครั้งค่าแต่ละค่าเกิดขึ้น

เข้าสู่ระบบ).

คุณสมบัติของค่าเฉลี่ยเลขคณิต(ไม่มีหลักฐาน):

1. ค่าเฉลี่ยของค่าคงที่เท่ากับตัวมันเอง: .

2. ผลคูณของค่าเฉลี่ยและผลรวมของความถี่จะเท่ากับผลรวมของผลคูณของตัวเลือกและความถี่ของมัน: .

3. หากแต่ละตัวเลือกเพิ่มขึ้นหรือลดลงในจำนวนที่เท่ากัน ค่าเฉลี่ยจะเพิ่มขึ้นหรือลดลงในจำนวนที่เท่ากัน: .

4. หากแต่ละตัวเลือกเพิ่มขึ้นหรือลดลงในจำนวนครั้งเท่ากัน ค่าเฉลี่ยจะเพิ่มขึ้นหรือลดลงในจำนวนครั้งเท่ากัน: .

5. หากความถี่ทั้งหมดเพิ่มขึ้นหรือลดลงในจำนวนครั้งเท่ากัน ค่าเฉลี่ยจะไม่เปลี่ยนแปลง: .

6. ค่าเฉลี่ยของผลรวมเท่ากับผลรวมของค่าเฉลี่ย: .

7. ผลรวมของการเบี่ยงเบนของค่าคุณลักษณะทั้งหมดจากค่าเฉลี่ยคือศูนย์

3. วิธีการคำนวณฮาร์มอนิกเฉลี่ย

ในบางกรณี ลักษณะของข้อมูลเริ่มต้นนั้นทำให้การคำนวณค่าเฉลี่ยเลขคณิตสูญเสียความหมายไป และตัวบ่งชี้ทั่วไปเท่านั้นที่สามารถเป็นค่าเฉลี่ยฮาร์มอนิกได้

ประเภทของฮาร์มอนิกเฉลี่ย:

1. ฮาร์มอนิกเฉลี่ยอย่างง่ายคำนวณโดยสูตร:

ซิมเปิลฮาร์มอนิกอย่างง่ายใช้น้อยมาก เพียงเพื่อคำนวณเวลาเฉลี่ยที่ใช้ในการผลิตหน่วยการผลิต โดยมีเงื่อนไขว่าความถี่ของตัวเลือกทั้งหมดเท่ากัน

2. ฮาร์มอนิกเฉลี่ยถ่วงน้ำหนักคำนวณโดยสูตร:

.

ปริมาณรวมของปรากฏการณ์อยู่ที่ไหน

จะใช้ค่าเฉลี่ยถ่วงน้ำหนักแบบฮาร์มอนิกหากทราบปริมาตรทั้งหมดของปรากฏการณ์ แต่ไม่ทราบความถี่ ฮาร์มอนิกนี้ใช้ในการคำนวณตัวชี้วัดคุณภาพเฉลี่ย: ค่าจ้างเฉลี่ย, ราคาเฉลี่ย, ต้นทุนเฉลี่ย, ผลผลิตเฉลี่ย, ผลิตภาพแรงงานเฉลี่ย

4. ค่าเฉลี่ยเชิงโครงสร้าง: โหมดและค่ามัธยฐาน

ค่าเฉลี่ยโครงสร้าง (ฐานนิยม, ค่ามัธยฐาน) ใช้เพื่อศึกษาโครงสร้างภายในและโครงสร้างของชุดการกระจายของค่าแอตทริบิวต์

แฟชั่น- ค่าทั่วไปของแอตทริบิวต์ในหน่วยของประชากร ในชุดการกระจายที่แต่ละตัวแปรเกิดขึ้นครั้งเดียว โหมดจะไม่ถูกคำนวณ ในซีรีส์ที่ไม่ต่อเนื่อง โหมดคือตัวแปรที่มีความถี่สูงสุด สำหรับอนุกรมช่วงเวลาที่มีช่วงเท่ากัน โหมดจะคำนวณโดยสูตร:

.

ขอบเขตเริ่มต้น (ล่าง) ของช่วงเวลาโมดอลอยู่ที่ไหน

- ค่าของโมดอล ช่วงก่อน - และหลังโมดอล ตามลำดับ

− ความถี่ของช่วงโมดอล ก่อนและหลังโมดอล ตามลำดับ

ช่วงโมดอลคือช่วงที่มีความถี่สูงสุด

ค่ามัธยฐานคือค่าของคุณลักษณะที่อยู่ตรงกลางของซีรี่ส์ที่จัดอันดับและแบ่งซีรี่ส์นี้ออกเป็นสองส่วนเท่า ๆ กันตามจำนวนหน่วย: ส่วนหนึ่งมีค่าคุณลักษณะน้อยกว่าค่ามัธยฐานและอีกส่วนหนึ่งมีค่ามากกว่าค่ามัธยฐาน

อันดับแถวคือการจัดเรียงค่าลักษณะตามลำดับขึ้นหรือลง

ในชุดการจัดอันดับแบบไม่ต่อเนื่อง ซึ่งแต่ละตัวเลือกเกิดขึ้นเพียงครั้งเดียว และจำนวนตัวเลือกไม่เป็นเลขคู่ ค่ามัธยฐานจะถูกกำหนดโดยสูตร:

จำนวนคำศัพท์ในซีรีส์อยู่ที่ไหน

ในซีรีส์อันดับแบบไม่ต่อเนื่อง ซึ่งแต่ละตัวเลือกเกิดขึ้นครั้งเดียวและจำนวนตัวเลือกเป็นเลขคู่ ค่ามัธยฐานจะเป็นค่าเฉลี่ยเลขคณิตของสองตัวเลือกที่อยู่ตรงกลางของซีรีส์อันดับ

ในชุดการจัดอันดับแบบไม่ต่อเนื่อง ซึ่งแต่ละตัวเลือกเกิดขึ้นหลายครั้ง ค่ามัธยฐานจะถูกกำหนดโดยสูตร:

จากนั้น เริ่มจากตัวเลือกแรก ความถี่จะถูกรวมตามลำดับจนกว่าคุณจะได้

สำหรับอนุกรมช่วงเวลา ค่ามัธยฐานจะคำนวณตามสูตร:

,

ขีด จำกัด ล่างของช่วงเวลามัธยฐานอยู่ที่ไหน

− ค่าของช่วงเวลามัธยฐาน

−จำนวนหน่วยประชากรทั้งหมด

− ความถี่สะสมจนถึงช่วงมัธยฐาน

คือความถี่ของช่วงมัธยฐาน

ช่วงมัธยฐานคือช่วงเวลาที่ความถี่สะสมมีค่าเท่ากับหรือมากกว่าครึ่งหนึ่งของผลรวมของความถี่ทั้งหมดในอนุกรม

5. ตัวบ่งชี้การเปลี่ยนแปลง

รูปแบบคุณลักษณะ- นี่คือความแตกต่างในค่านิยมส่วนบุคคลของลักษณะภายในประชากรที่ศึกษา การแปรผันของลักษณะมีลักษณะเฉพาะโดยตัวบ่งชี้การแปรผัน ตัวบ่งชี้การแปรผันช่วยเสริมค่าเฉลี่ย แสดงระดับความเป็นเนื้อเดียวกันของประชากรทางสถิติสำหรับลักษณะที่กำหนด ขอบเขตของการเปลี่ยนแปลงลักษณะ อัตราส่วนของตัวบ่งชี้ความผันแปรกำหนดความสัมพันธ์ระหว่างคุณสมบัติต่างๆ

ตัวบ่งชี้ความแปรปรวนแบ่งออกเป็น:

1) Absolute: ช่วงของการเปลี่ยนแปลง; ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน; การกระจายตัว มีหน่วยเดียวกันกับค่าลักษณะเฉพาะ

2) สัมพัทธ์: สัมประสิทธิ์ของการสั่น, สัมประสิทธิ์ของการแปรผัน, ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์

ช่วงของการเปลี่ยนแปลงจะแสดงมูลค่าของแอตทริบิวต์ที่เปลี่ยนแปลงไปมากเพียงใด:

ค่าสูงสุดของแอตทริบิวต์อยู่ที่ไหน

เป็นค่าต่ำสุดของคุณสมบัติ

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยและค่าเบี่ยงเบนกำลังสองเฉลี่ยแสดงว่าค่าแต่ละค่าของคุณลักษณะแตกต่างจากค่าเฉลี่ยเท่าใด

ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ยกำหนด:

- เรียบง่าย; - ถ่วงน้ำหนัก

การกระจายตัวถูกกำหนด:

- เรียบง่าย; - ถ่วงน้ำหนัก;

- เรียบง่าย; - ถ่วงน้ำหนัก

หากค่าเฉลี่ยของแอตทริบิวต์คำนวณโดยใช้เลขคณิตอย่างง่าย ก็จะคำนวณโดยใช้สูตรอย่างง่าย หากค่าเฉลี่ยคำนวณโดยใช้ค่าถ่วงน้ำหนัก ก็จะคำนวณโดยใช้สูตรถ่วงน้ำหนัก

การกระจายตัวและส่วนเบี่ยงเบนมาตรฐานสามารถคำนวณได้โดยใช้สูตรอื่น:

- เรียบง่าย; - ถ่วงน้ำหนัก

ในการเปรียบเทียบความผันแปรของลักษณะที่แตกต่างกันในประชากรเดียวกันหรือลักษณะเดียวกันในประชากรที่แตกต่างกัน ตัวบ่งชี้สัมพัทธ์ของการแปรผันจะถูกคำนวณ เรียกว่า ค่าสัมประสิทธิ์การแปรผัน:

ยิ่งค่าสัมประสิทธิ์การแปรผันมากเท่าใด การแพร่กระจายของค่าแอตทริบิวต์รอบ ๆ ค่าเฉลี่ยก็จะยิ่งมากขึ้นเท่านั้น ประชากรในองค์ประกอบก็จะยิ่งมีความเป็นเนื้อเดียวกันน้อยลงและค่าเฉลี่ยก็จะยิ่งเป็นตัวแทนน้อยลงเท่านั้น ชุดนี้จะถือว่าเป็นเนื้อเดียวกันหากค่าสัมประสิทธิ์การแปรผันไม่เกิน 33%

6. ประเภทของการกระจายและกฎ (กฎ) ของการเพิ่มการกระจาย

หากประชากรที่ศึกษาประกอบด้วยหลายกลุ่มที่เกิดขึ้นจากคุณลักษณะใด ๆ นอกจากความแปรปรวนทั้งหมดแล้ว ยังกำหนดความแปรปรวนระหว่างกลุ่มด้วย

ตาม กฎการบวกผลต่างความแปรปรวนทั้งหมดเท่ากับผลรวมของค่าเฉลี่ยของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม:

การใช้กฎของการเพิ่มความแปรปรวน เป็นไปได้เสมอที่จะกำหนดความแปรปรวนที่สามซึ่งไม่รู้จักจากสองความแปรปรวนที่ทราบ และยังตัดสินความแข็งแกร่งของอิทธิพลของแอตทริบิวต์การจัดกลุ่ม

ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด แสดงส่วนแบ่งเนื่องจากการเปลี่ยนแปลงของลักษณะการจัดกลุ่มในความแปรผันทั้งหมดของลักษณะที่ศึกษา:

ความสัมพันธ์เชิงประจักษ์แสดงอิทธิพลของแอตทริบิวต์ที่อยู่ภายใต้การจัดกลุ่มต่อการเปลี่ยนแปลงของแอตทริบิวต์ที่เป็นผลลัพธ์:

อัตราส่วนสหสัมพันธ์เชิงประจักษ์จะแปรผันตั้งแต่ 0 ถึง 1 หากไม่มีการเชื่อมต่อ ถ้า - การเชื่อมต่อเสร็จสมบูรณ์ ค่ากลางจะถูกประเมินตามความใกล้เคียงกับค่าจำกัด

ธีม 6.ชุดไดนามิก

1. ชุดไดนามิก: แนวคิดและประเภท

ชุดไดนามิก (อนุกรมเวลา อนุกรมไดนามิก อนุกรมเวลา) เป็นอนุกรมของค่าตัวเลขของตัวบ่งชี้ทางสถิติที่จัดเรียงตามลำดับเวลา ชุดไดนามิกประกอบด้วยสององค์ประกอบ (กราฟ):

1. เวลา (t) คือช่วงเวลา (วันที่) หรือช่วงเวลา (ปี, ไตรมาส, เดือน, วัน) ของเวลาที่ตัวบ่งชี้ทางสถิติ (ระดับซีรีส์) อ้างอิง

2. ระดับของซีรีส์ (y) – ค่าของตัวบ่งชี้ทางสถิติที่แสดงสถานะของปรากฏการณ์ ณ เวลาที่กำหนดหรือในช่วงเวลาหนึ่ง

ระดับแถว y

ประเภทของไดนามิกซีรีส์:

1. ตามเวลา:

A) ช่วงเวลา - ซีรีส์ ซึ่งเป็นระดับที่แสดงลักษณะของขนาดของปรากฏการณ์ในช่วงระยะเวลาหนึ่ง (วัน เดือน ไตรมาส ปี) ตัวอย่างของชุดดังกล่าวคือข้อมูลเกี่ยวกับไดนามิกของการผลิต จำนวนวันทำงาน ฯลฯ สามารถสรุประดับสัมบูรณ์ของชุดช่วงเวลาได้ ซึ่งเป็นผลรวมที่เหมาะสม ซึ่งทำให้สามารถรับชุดของไดนามิกได้ ของช่วงเวลาที่ขยายใหญ่ขึ้น

B) ชั่วขณะ - ซีรีส์ ระดับที่แสดงลักษณะของขนาดของปรากฏการณ์ ณ วันที่ (ช่วงเวลา) ของเวลา ตัวอย่างของชุดข้อมูลดังกล่าวอาจเป็นข้อมูลเกี่ยวกับพลวัตของประชากร ปศุสัตว์ สินค้าคงคลัง มูลค่าของสินทรัพย์ถาวร สินทรัพย์หมุนเวียน ฯลฯ ไม่สามารถสรุประดับของชุดช่วงเวลาได้ ผลรวมไม่สมเหตุสมผล เนื่องจากชุดข้อมูลถัดไป ระดับทั้งหมดหรือบางส่วนรวมถึงหนึ่งระดับก่อนหน้า

2. ตามรูปแบบการนำเสนอ (วิธีการแสดงออก) ของระดับต่างๆ:

A) อนุกรมของค่าสัมบูรณ์

B) อนุกรมของค่าสัมพัทธ์ ค่าสัมพัทธ์กำหนดลักษณะเช่นพลวัตของส่วนแบ่งของประชากรในเมืองและชนบท (%) และอัตราการว่างงาน