หมวดสถิติพื้นฐาน. ค่าสัมประสิทธิ์ความสัมพันธ์ของคุณลักษณะเชิงคุณภาพ
วิธีการจัดกลุ่มทำให้คุณสามารถศึกษาสถานะและความสัมพันธ์ได้ ปรากฏการณ์ทางเศรษฐกิจหากกลุ่มมีลักษณะเฉพาะด้วยตัวบ่งชี้ที่เผยให้เห็นแง่มุมที่สำคัญที่สุดของปรากฏการณ์ภายใต้การศึกษา
เมื่อวิเคราะห์และวางแผนจำเป็นต้องไม่พึ่งพา ข้อเท็จจริงแบบสุ่มแต่บนตัวบ่งชี้ที่แสดงหลัก ทั่วไป ราก ลักษณะนี้จะได้รับ ชนิดต่างๆค่าเฉลี่ย เช่นเดียวกับฐานนิยมและค่ามัธยฐาน
คำถามเกี่ยวกับความเป็นเนื้อเดียวกันของประชากรไม่ควรได้รับการตัดสินอย่างเป็นทางการในแง่ของรูปแบบการกระจาย เช่นเดียวกับคำถามของค่าเฉลี่ยทั่วไป จะต้องตัดสินใจบนพื้นฐานของสาเหตุและเงื่อนไขที่ก่อตัวเป็นประชากร ความเป็นเนื้อเดียวกันคือชุดดังกล่าว หน่วยที่ก่อตัวขึ้นภายใต้อิทธิพลของสาเหตุหลักทั่วไปและเงื่อนไขที่กำหนด ระดับทั่วไปของคุณลักษณะนี้ ลักษณะของประชากรทั้งหมด
ตามทฤษฎีการจัดกลุ่มแบบแผน สำคัญในการประเมินความเป็นเนื้อเดียวกันของประชากร มันไม่ได้ขึ้นอยู่กับรูปแบบของการกระจาย แต่ขึ้นอยู่กับขนาดของการแปรผันและเงื่อนไขในการก่อตัวของมัน ชุดที่เป็นเนื้อเดียวกันในเชิงคุณภาพมีลักษณะเฉพาะโดยการเปลี่ยนแปลงภายในขอบเขตที่กำหนด หลังจากนั้นคุณภาพใหม่จะเริ่มต้นขึ้น ในเวลาเดียวกัน เพื่อประเมินความเป็นเนื้อเดียวกันเชิงคุณภาพของมวลรวม ขีดจำกัดเหล่านี้ต้องเข้าหาจากมุมมองของสาระสำคัญของเรื่อง ไม่ใช่อย่างเป็นทางการ เนื่องจากปริมาณเดียวกันภายใต้เงื่อนไขที่แตกต่างกันเป็นการแสดงออกถึงคุณภาพใหม่ ตัวอย่างเช่น ด้วยจำนวนคนงานที่เท่ากัน วิสาหกิจของอุตสาหกรรมบางสาขามีขนาดใหญ่ ในขณะที่สาขาอื่นมีขนาดเล็ก
เพื่อให้ครอบคลุมและ การศึกษาเชิงลึกปรากฏการณ์เพื่อที่จะกำหนดลักษณะประเภทของปรากฏการณ์ความสัมพันธ์และกระบวนการอย่างเป็นกลางเนื่องจากการพัฒนาระบบโดยรวมจำเป็นต้องรวมค่าเฉลี่ยกลุ่มเข้ากับค่าเฉลี่ยทั่วไป การรวมกันของค่าเฉลี่ยดังกล่าวเป็นหนึ่งในองค์ประกอบหลักของการวิเคราะห์ระบบที่ซับซ้อน ชุดค่าผสมนี้รวมเข้าด้วยกันเป็นหนึ่งเดียวทั้งสองส่วนเสริมที่เป็นธรรมชาติ วิธีการทางสถิติ: วิธีหาค่าเฉลี่ยและวิธีแบ่งกลุ่ม. เมื่อคำนวณค่าเฉลี่ย แต่ละค่าที่แตกต่างกันไปตามกลุ่มจะถูกแทนที่ด้วยค่าเฉลี่ยหนึ่งค่า ในนั้น การเบี่ยงเบนแบบสุ่มค่าของแอตทริบิวต์สำหรับแต่ละหน่วยในทิศทางที่เพิ่มขึ้นหรือลดลงนั้นสมดุลกันและยกเลิกซึ่งกันและกัน และค่าเฉลี่ยจะแสดงขนาดทั่วไปของคุณลักษณะแอตทริบิวต์ของกลุ่มนี้ ค่าเฉลี่ยทำหน้าที่เป็นลักษณะของประชากรและในขณะเดียวกันก็หมายถึงองค์ประกอบส่วนบุคคล - ผู้ให้บริการคุณสมบัติเชิงคุณภาพของปรากฏการณ์ ความหมายของค่าเฉลี่ยค่อนข้างเป็นรูปธรรม แต่ในขณะเดียวกันก็เป็นนามธรรม มันได้มาจากการสุ่มบุคคลสำหรับแต่ละหน่วยเพื่อระบุทั่วไปซึ่งเป็นลักษณะเฉพาะของทุกหน่วยและรูปแบบ ชุดนี้. เมื่อคำนวณค่าเฉลี่ยจำนวนหน่วยประชากรควรมีมากพอ ค่าเฉลี่ยหมายถึงอัตราส่วนของปริมาตรรวมของปรากฏการณ์ต่อจำนวนหน่วยประชากรในกลุ่ม สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม นี่จะเป็นค่าเฉลี่ยเลขคณิตอย่างง่าย:
และสำหรับข้อมูลที่จัดกลุ่ม ซึ่งแต่ละค่าคุณลักษณะมีความถี่ของตัวเอง ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:
ที่ไหน X ฉัน- ค่าของคุณลักษณะ ฉ ผมคือความถี่ของค่าคุณลักษณะเหล่านี้
เนื่องจากค่าเฉลี่ยเลขคณิตคำนวณเป็นอัตราส่วนของผลรวมของค่าลักษณะเฉพาะถึง ความแข็งแรงทั้งหมดมันไม่เคยไปไกลกว่าค่าเหล่านี้ ค่าเฉลี่ยเลขคณิตมีคุณสมบัติหลายอย่างที่ใช้กันอย่างแพร่หลายเพื่อปรับปรุงการคำนวณ
1. ผลรวมของการเบี่ยงเบน ค่าส่วนบุคคลเครื่องหมายจากค่าเฉลี่ยเป็นศูนย์เสมอ:
การพิสูจน์. น
แยกซ้ายและ ด้านขวาบน
2. หากค่าคุณลักษณะ (X i) มีการเปลี่ยนแปลง เคครั้ง ค่าเฉลี่ยเลขคณิตก็จะเปลี่ยนไปด้วย xครั้งหนึ่ง.
การพิสูจน์.
เราแสดงค่าเฉลี่ยเลขคณิตของค่าใหม่ของแอตทริบิวต์ด้วย X จากนั้น:
ค่าคงที่ 1/เคนำออกจากเครื่องหมายผลรวม แล้วเราจะได้:
3. หากออกจากค่าคุณลักษณะทั้งหมด เอ็กซ์ ผมลบหรือบวกจำนวนคงที่เดียวกัน แล้วค่าเฉลี่ยเลขคณิตจะลดลงหรือเพิ่มขึ้นตามจำนวนนั้น
การพิสูจน์.
ค่าเฉลี่ยของการเบี่ยงเบนของค่าลักษณะเฉพาะจาก จำนวนคงที่จะเท่ากับ:
สิ่งนี้ได้รับการพิสูจน์ในลักษณะเดียวกันในกรณีของการเพิ่มจำนวนคงที่
4. หากความถี่ของค่าคุณลักษณะทั้งหมดลดลงหรือเพิ่มขึ้น นครั้ง ค่าเฉลี่ยจะไม่เปลี่ยนแปลง:
หากมีข้อมูลเกี่ยวกับปริมาณทั้งหมดและค่าที่ทราบของลักษณะ แต่ไม่ทราบความถี่ สูตรค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักจะถูกใช้เพื่อกำหนดค่าเฉลี่ย
ตัวอย่างเช่น ข้อมูลเกี่ยวกับราคาขายกะหล่ำปลีและรายได้รวมสำหรับช่วงเวลาการขายต่างๆ มีให้ (ตารางที่ 1)
ตารางที่ 1.
ราคาขายกะหล่ำปลีและรายได้รวมสำหรับช่วงเวลาการขายต่างๆ
เนื่องจากราคาเฉลี่ยคืออัตราส่วนของรายได้รวมต่อปริมาณกะหล่ำปลีที่ขายทั้งหมด อันดับแรกจำเป็นต้องกำหนดปริมาณกะหล่ำปลีที่ขายสำหรับช่วงเวลาการขายที่แตกต่างกันเป็นอัตราส่วนของรายได้ต่อราคา แล้วจึงกำหนด ราคาเฉลี่ยขายกะหล่ำปลี
ในตัวอย่างของเรา ราคาเฉลี่ยจะเป็น:
ถ้าคำนวณเป็น กรณีนี้ราคาขายเฉลี่ยตามค่าเฉลี่ยเลขคณิตอย่างง่ายเราจะได้ผลลัพธ์ที่แตกต่างกันซึ่งจะบิดเบือนสถานการณ์ที่แท้จริงและประเมินราคาขายเฉลี่ยสูงเกินไปเนื่องจากข้อเท็จจริงที่ว่ายอดขายส่วนใหญ่ตกอยู่กับกะหล่ำปลีปลายที่มีราคาที่ต่ำกว่าจะไม่ นำมาพิจารณา.
บางครั้งจำเป็นต้องกำหนดค่าเฉลี่ยเมื่อกำหนดค่าลักษณะเฉพาะในแบบฟอร์ม ตัวเลขเศษส่วนนั่นคือส่วนกลับของจำนวนเต็ม (ตัวอย่างเช่น เมื่อศึกษาผลิตภาพแรงงานผ่านตัวบ่งชี้ผกผัน ความเข้มแรงงาน) ในกรณีเช่นนี้ ขอแนะนำให้ใช้สูตรค่าเฉลี่ยฮาร์มอนิก:
ดังนั้น เวลาเฉลี่ยที่ต้องใช้ในการผลิตหน่วยเอาต์พุตจึงเป็นค่าเฉลี่ยฮาร์มอนิก ถ้า X 1 \u003d 1/4 ชั่วโมง X 2 \u003d 1/2 ชั่วโมง X 3 \u003d 1/3 ชั่วโมง ค่าเฉลี่ยฮาร์มอนิกของตัวเลขเหล่านี้คือ:
ในการคำนวณค่าเฉลี่ยจากอัตราส่วนของตัวบ่งชี้สองตัวที่มีชื่อเดียวกัน เช่น อัตราการเติบโต จะใช้ค่าเฉลี่ยทางเรขาคณิต ซึ่งคำนวณโดยสูตร:
โดยที่ X 1 x X 2 ... x ... X 4 - อัตราส่วนของสองปริมาณที่มีชื่อเดียวกัน เช่น อัตราการเติบโตของห่วงโซ่ นคือขนาดของชุดอัตราส่วนของอัตราการเติบโต
ค่าเฉลี่ยที่พิจารณามีคุณสมบัติ maorant:
ตัวอย่างเช่นเรามี ค่าต่อไปนี้ เอ็กซ์(20; 40) ประเภทของค่าเฉลี่ยที่พิจารณาก่อนหน้านี้จะเท่ากับ:
เมื่อศึกษาองค์ประกอบของประชากร ขนาดทั่วไปของคุณลักษณะสามารถตัดสินได้จากค่าเฉลี่ยโครงสร้างที่เรียกว่า ฐานนิยมและค่ามัธยฐาน
แฟชั่นค่าที่เกิดขึ้นบ่อยที่สุดของคุณลักษณะในประชากรเรียกว่าในซีรีส์การเปลี่ยนแปลงช่วงเวลา จะพบช่วงโมดอลก่อน ในช่วงโมดอลที่พบ โหมดจะคำนวณโดยสูตร:
โดยที่ X 0 คือขีดจำกัดล่างของช่วงเวลาโมดอล d-ค่าช่วงเวลา ฉ 1 , ฉ 2 , ฉ 3 – ความถี่ของช่วงพรีโมดอล โมดอล และหลังมอดัล
คุณค่าของแฟชั่นใน ซีรีย์ช่วงเวลาค่อนข้างง่ายที่จะหาได้จากกราฟ ในการทำเช่นนี้ เส้นสองเส้นจะดึงออกมาจากขอบเขตของสองคอลัมน์ที่อยู่ติดกันในคอลัมน์สูงสุดของฮิสโตแกรม จากจุดตัดของเส้นเหล่านี้ เส้นตั้งฉากจะลดลงไปที่แกน abscissa ค่าของคุณสมบัติบนแกน abscissa จะเป็นโหมด (รูปที่ 2)
ข้าว. 2
เพื่อแก้ปัญหาในทางปฏิบัติ ความสนใจที่ยิ่งใหญ่ที่สุดมักจะแสดงโหมดที่แสดงเป็นช่วงแทนที่จะเป็นตัวเลขที่ไม่ต่อเนื่อง สิ่งนี้อธิบายได้จากวัตถุประสงค์ของโหมด ซึ่งควรเปิดเผยมิติที่พบบ่อยที่สุดของปรากฏการณ์
ค่าเฉลี่ย - ค่าทั่วไปสำหรับทุกหน่วยของประชากรที่เป็นเนื้อเดียวกัน โหมดยังเป็นค่าทั่วไป แต่จะกำหนดขนาดของแอตทริบิวต์โดยตรง ซึ่งเป็นลักษณะของส่วนที่สำคัญ แต่ยังไม่ใช่ประชากรทั้งหมด เธอมี ความสำคัญอย่างยิ่งเพื่อแก้ปัญหาบางอย่าง เช่น ทำนายขนาดรองเท้า เสื้อผ้า ที่ควรผลิตจำนวนมาก เป็นต้น
ค่ามัธยฐาน- ค่าของคุณสมบัติซึ่งอยู่ตรงกลางของซีรีย์ช่วง มันบ่งบอกถึงศูนย์กลางของการกระจายหน่วยของประชากรและแบ่งออกเป็นสองส่วนเท่า ๆ กัน
ค่ามัธยฐานคือ คุณสมบัติที่ดีที่สุดแนวโน้มเข้าสู่ศูนย์กลาง เมื่อขอบเขตของช่วงเวลาสุดขั้วเปิดอยู่ ค่ามัธยฐานเป็นลักษณะที่ยอมรับได้มากขึ้นของระดับการกระจายแม้ว่าจะมีค่ามากหรือน้อยเกินไปในชุดการกระจายที่มี อิทธิพลที่แข็งแกร่งถึงค่าเฉลี่ย แต่ไม่ใช่ค่ามัธยฐาน ค่ามัธยฐานยังมีคุณสมบัติของค่าต่ำสุดเชิงเส้น: ผลรวม ค่าสัมบูรณ์ค่าเบี่ยงเบนของค่าแอตทริบิวต์สำหรับทุกหน่วยของประชากรจากค่ามัธยฐานนั้นน้อยมาก เช่น
คุณสมบัตินี้มีความสำคัญอย่างยิ่งสำหรับการแก้ปัญหาในทางปฏิบัติ ตัวอย่างเช่น สำหรับการคำนวณระยะทางที่สั้นที่สุดที่เป็นไปได้สำหรับ ประเภทต่างๆการขนส่ง เพื่อค้นหาสถานีบริการในลักษณะที่ระยะทางไปยังรถทุกคันที่ให้บริการโดยสถานีนี้น้อยที่สุด ฯลฯ
เมื่อต้องการหาค่ามัธยฐาน จะพิจารณาก่อน หมายเลขซีเรียลในชุดการจัดจำหน่าย:
นอกจากนี้ตามหมายเลขซีเรียลจะพบค่ามัธยฐานจากความถี่สะสมของซีรีส์ ที่ ซีรีส์ที่ไม่ต่อเนื่อง- ไม่มีการคำนวณใด ๆ แต่ในอนุกรมช่วงเวลาเมื่อทราบจำนวนลำดับของค่ามัธยฐานแล้ว ความถี่สะสมจะถูกใช้เพื่อค้นหาช่วงค่ามัธยฐาน ซึ่งค่าของค่ามัธยฐานนั้นถูกกำหนดโดยวิธีการแก้ไขที่ง่ายที่สุดแล้ว ค่ามัธยฐานคำนวณโดยใช้สูตร:
ที่ไหน เอ็กซ์ 0 คือขีดจำกัดล่างของช่วงมัธยฐาน ง– ค่าช่วงเวลา ฉ _ 1 – ความถี่สะสมจนถึงช่วงมัธยฐาน ฉคือความถี่ของช่วงมัธยฐาน
ลองคำนวณค่าเฉลี่ย ฐานนิยม และมัธยฐานโดยใช้การแจกแจงช่วงเวลาเป็นตัวอย่าง ข้อมูลได้รับในตาราง 2.
ดังนั้น ตัวบ่งชี้ต่าง ๆ สามารถใช้เป็นศูนย์กลางของการกระจาย: ค่าเฉลี่ย ฐานนิยม และค่ามัธยฐาน
และแต่ละลักษณะเหล่านี้มีลักษณะเฉพาะของตนเอง ดังนั้นสำหรับค่าเฉลี่ยมันเป็นลักษณะที่เบี่ยงเบนทั้งหมดจากมัน ค่าส่วนบุคคลเครื่องหมายหักล้างกันคือ
ค่ามัธยฐานมีลักษณะโดยความจริงที่ว่าผลรวมของการเบี่ยงเบนของค่าแต่ละค่าของแอตทริบิวต์จากค่านั้น (ไม่รวมสัญญาณ) มีค่าน้อยที่สุด โหมดกำหนดลักษณะของค่าที่เกิดขึ้นบ่อยที่สุดของคุณลักษณะ ดังนั้น ขึ้นอยู่กับคุณลักษณะใดที่ผู้วิจัยสนใจ ควรเลือกคุณลักษณะใดลักษณะหนึ่งที่ได้รับการพิจารณา ที่ แต่ละกรณีคำนวณลักษณะทั้งหมด
การเปรียบเทียบและการระบุความสัมพันธ์ระหว่างพวกเขาช่วยชี้แจงคุณลักษณะของการแจกแจงของชุดการเปลี่ยนแปลงหนึ่งชุดหรือชุดอื่น ดังนั้น ในอนุกรมสมมาตร เช่นในกรณีของเรา คุณลักษณะทั้งสาม (ค่าเฉลี่ย ฐานนิยม และค่ามัธยฐาน) ใกล้เคียงกัน ยิ่งความแตกต่างระหว่างแฟชั่นและ เฉลี่ยยิ่งซีรีส์ไม่สมมาตรมากเท่าไร เป็นที่ทราบกันดีว่าสำหรับอนุกรมอสมมาตรปานกลาง ความแตกต่างระหว่างฐานนิยมและค่าเฉลี่ยเลขคณิตจะมากกว่าผลต่างระหว่างค่ามัธยฐานและค่าเฉลี่ยเลขคณิตประมาณสามเท่า:
อัตราส่วนนี้สามารถใช้เพื่อกำหนดหนึ่งตัวบ่งชี้จากสองตัวบ่งชี้ที่รู้จัก จากนี้ไปการรวมกันของฐานนิยม มัธยฐาน และค่าเฉลี่ยก็มีความสำคัญต่อการระบุลักษณะประเภทของการแจกแจง
วิทยาการคอมพิวเตอร์และคณิตศาสตร์ - วัสดุทางทฤษฎีสำหรับการประชุมครั้งแรก
1. สิ่งของ สถิติทางคณิตศาสตร์, ส่วนหลักของมัน. แนวคิดของ การกระจายทางสถิติ. การแจกแจงแบบปกติ. ตัวแปรสุ่มมีการแจกแจงแบบปกติภายใต้เงื่อนไขใด
สถิติเป็นศาสตร์ที่ศึกษาเกี่ยวกับผลรวม น้ำหนัก yavl-I เพื่อระบุธรรมชาติ และศึกษาโดยใช้ตัวบ่งชี้ทั่วไป
วิธีการทางสถิติทางคณิตศาสตร์ทั้งหมดสามารถนำมาประกอบกับสองส่วนหลัก: ทฤษฎีการประมาณค่าพารามิเตอร์ทางสถิติและ ทฤษฎีการทดสอบสมมติฐานทางสถิติ.
ส่วน:
1. สถิติเชิงพรรณนา
2. วิธีการสุ่มตัวอย่าง, ช่วงความเชื่อมั่น
4. การวิเคราะห์การถดถอย
5. การวิเคราะห์คุณลักษณะเชิงคุณภาพ
6. การวิเคราะห์ทางสถิติหลายตัวแปร:
ก) คลัสเตอร์
ข) แฟคทอเรียล
7. การวิเคราะห์อนุกรมเวลา
8. สมการเชิงอนุพันธ์
9. การสร้างแบบจำลองทางคณิตศาสตร์ กระบวนการทางประวัติศาสตร์
การกระจาย:
เชิงทฤษฎี (มีวัตถุจำนวนมากและทำงานได้อย่างสมบูรณ์)
เชิงประจักษ์ (ข้อมูลจริงที่สามารถลงจุดในฮิสโตแกรม)
การแจกแจงแบบปกติ - เมื่อธรรมชาติของการกระจายได้รับอิทธิพลจากหลายปัจจัยและไม่มีปัจจัยใดเป็นปัจจัยชี้ขาด โดยเฉพาะอย่างยิ่งมักใช้ในทางปฏิบัติ
2. การแจกแจงแบบปกติสามารถแสดงในรูปแบบกราฟิกเป็นเส้นโค้งรูประฆัง สมมาตร มีจุดยอดเดียว ความสูง (พิกัด) ของแต่ละจุดบนเส้นโค้งนี้บ่งชี้ว่าค่าที่เกี่ยวข้องเกิดขึ้นบ่อยเพียงใด สถิติเชิงพรรณนา ค่าเฉลี่ย - ค่าเฉลี่ยเลขคณิต, ค่ามัธยฐาน, โหมด การวัดทั้งสามนี้ให้ค่าที่คล้ายคลึงกันในสถานการณ์ใด และในสถานการณ์ใดที่แตกต่างกันอย่างมาก
สถิติเชิงพรรณนา - นี่คือสถิติเชิงพรรณนา
ค่าเฉลี่ยเลขคณิต มัธยฐาน ฐานนิยม - มาตรการเฉลี่ย - ค่าสัมประสิทธิ์ที่สามารถกำหนดลักษณะชุดของวัตถุ
· ค่าเฉลี่ย (เลขคณิต) - ผลรวมของค่าทั้งหมดที่อ้างถึง จำนวนทั้งหมดข้อสังเกต ( ได้รับการยอมรับ: หมายถึง หรือ ) เช่น ปานกลาง ค่าเลขคณิต คุณลักษณะที่เรียกว่าค่า
ค่าของคุณสมบัติ y อยู่ที่ไหน ผม-th วัตถุ น- จำนวนของวัตถุในการรวม
· โหมด - ค่าที่เกิดขึ้นบ่อยที่สุดของตัวแปร (M)
· ค่ามัธยฐานคือค่าเฉลี่ย (การกำหนดที่ยอมรับ: ค่ามัธยฐาน, ม.) ค่ามัธยฐานคือค่า "กลาง" ของคุณลักษณะในแง่ที่ว่าครึ่งหนึ่งของวัตถุในประชากรมีค่าของคุณลักษณะนี้น้อยกว่า และอีกครึ่งหนึ่งมีค่ามากกว่าค่ามัธยฐาน คุณสามารถคำนวณค่ามัธยฐานโดยประมาณได้โดยการจัดเรียงค่าทั้งหมดของแอตทริบิวต์ในลำดับจากน้อยไปมาก (จากมากไปน้อย) และค้นหาตัวเลขในชุดรูปแบบนี้ซึ่งมีตัวเลข ( น+1)/2 - ในกรณีที่เป็นเลขคี่ นหรืออยู่ตรงกลางระหว่างตัวเลขกับตัวเลข น/2 และ ( น+1)/2 - ในกรณีที่เป็นเลขคู่ น.
ไม่สามารถคำนวณคุณสมบัติที่แสดงรายการทั้งหมดสำหรับคุณสมบัติเชิงคุณภาพได้ หากแอตทริบิวต์เป็นเชิงคุณภาพและระบุ จะพบเฉพาะโหมดเท่านั้น (ค่าจะเป็นชื่อของหมวดหมู่ที่เกิดขึ้นบ่อยที่สุดของแอตทริบิวต์ระบุ) หากแอตทริบิวต์เป็นอันดับหนึ่ง นอกเหนือจากโหมดแล้ว คุณยังสามารถหาค่ามัธยฐานได้อีกด้วย สามารถคำนวณค่าเฉลี่ยเลขคณิตได้เท่านั้น ลักษณะเชิงปริมาณ.
ในกรณีของข้อมูลเชิงปริมาณ คุณลักษณะทั้งหมดของระดับค่าเฉลี่ยจะถูกวัดในหน่วยเดียวกับแอตทริบิวต์ดั้งเดิม
ค่าของสัมประสิทธิ์จะเหมือนกันหากกำหนดการกระจายเป็นแบบสมมาตร
3. ตัวบ่งชี้ความแตกต่าง - ความแปรปรวน ค่าเฉลี่ยกำลังสอง (มาตรฐาน) ส่วนเบี่ยงเบน ค่าสัมประสิทธิ์ของการแปรผัน ที่ พวกเขาวัดในหน่วยอะไร? ทำไมถึงแนะนำแนวคิดเรื่องค่าสัมประสิทธิ์การแปรผัน?
· รูทหมายถึงกำลังสองหรือ ส่วนเบี่ยงเบนมาตรฐาน- การวัดการแพร่กระจายของค่าลักษณะเฉพาะรอบค่าเฉลี่ยเลขคณิต (การกำหนดที่ยอมรับ: Std.Dev. ( ส่วนเบี่ยงเบนมาตรฐาน), ส หรือ s). ค่าของความเบี่ยงเบนนี้คำนวณโดยสูตร
.
· ความแปรปรวนของคุณลักษณะ ( s2 หรือ s2)
· ค่าสัมประสิทธิ์การแปรผัน - อัตราส่วนของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยเลขคณิตซึ่งแสดงเป็นเปอร์เซ็นต์ (แสดงเป็นสถิติด้วยตัวอักษร วี). ค่าสัมประสิทธิ์คำนวณโดยสูตร: .
ทุกคนมาตรการเหล่านี้สามารถคำนวณได้สำหรับลักษณะเชิงปริมาณเท่านั้น พวกเขาทั้งหมดแสดงให้เห็นว่าค่าของแอตทริบิวต์ (หรือมากกว่านั้นคือค่าเบี่ยงเบนจากค่าเฉลี่ย) แตกต่างกันมากเพียงใดในประชากรที่กำหนด ยังไง มูลค่าน้อยลงการวัดแบบกระจายยิ่งค่าคุณสมบัติสำหรับวัตถุทั้งหมดใกล้เคียงกับค่าเฉลี่ยมากขึ้นเท่านั้น และด้วยเหตุนี้จึงอยู่ใกล้กัน หากค่าการวัดการกระจายมีค่าเท่ากับศูนย์ ค่าแอตทริบิวต์จะเหมือนกันสำหรับวัตถุทั้งหมด
ที่ใช้บ่อยที่สุดคือค่าเฉลี่ยกำลังสอง (หรือมาตรฐาน) ส่วนเบี่ยงเบน s มีการวัดเช่นเดียวกับค่าเฉลี่ยเลขคณิตในหน่วยเดียวกับคุณลักษณะเดิม หากค่าทั้งหมดของแอตทริบิวต์เปลี่ยนแปลงหลายครั้ง ส่วนเบี่ยงเบนมาตรฐานจะเปลี่ยนในลักษณะเดียวกัน อย่างไรก็ตาม หากค่าทั้งหมดของแอตทริบิวต์เพิ่มขึ้น (ลดลง) ตามจำนวนที่กำหนด ค่าเบี่ยงเบนมาตรฐาน จะไม่เปลี่ยนแปลง. นอกจากค่าเบี่ยงเบนมาตรฐานแล้ว ความแปรปรวน (= กำลังสองของมัน) มักจะถูกใช้ แต่ในทางปฏิบัติแล้ว มันเป็นการวัดที่สะดวกน้อยกว่าเพราะ หน่วยความแปรปรวนไม่ตรงกับหน่วยการวัด
ความหมายของค่าสัมประสิทธิ์การแปรผันคือไม่เหมือนกับ s มันไม่ได้วัดค่าสัมบูรณ์ แต่เป็นการวัดสัมพัทธ์ของการแพร่กระจายของค่าของแอตทริบิวต์ในประชากรทางสถิติ
ยิ่ง V ประชากรที่เป็นเนื้อเดียวกันน้อยลง
เป็นเนื้อเดียวกันเฉพาะกาลต่างกัน
V = 0 - 30% V = 30 - 50% V = 50 - 100%
อาจจะ » 100% (ประชากรต่างกันเกินไป)
4. แนวคิดของวิธีการเลือก ตัวอย่างตัวแทน, วิธีการของมัน การสร้างข้อผิดพลาดในการสุ่มตัวอย่างสองประเภท ความน่าจะเป็นของความมั่นใจ.
ตัวอย่าง:
ตัวแทน
สุ่ม
การสุ่มตัวอย่างทางกล - คล้ายกับ สุ่มตัวอย่าง(ทุกวันที่ 10, 20 เป็นต้น)
การสุ่มตัวอย่างตามธรรมชาติ (สิ่งที่เหลืออยู่ของ HS เมื่อเวลาผ่านไป)
ตัวอย่างตัวแทน - สะท้อนคุณสมบัติได้อย่างแม่นยำ ประชากร.
เพื่อให้ตัวอย่างสะท้อนได้อย่างถูกต้อง คุณสมบัติพื้นฐานที่มีอยู่ในประชาชนทั่วไปนั่นเอง ควรสุ่ม, เช่น. รายการทั้งหมดในประชากรต้องมีโอกาสเท่ากันที่จะรวมอยู่ในกลุ่มตัวอย่าง
ตัวอย่างถูกสร้างขึ้นโดยใช้พิเศษ เทคนิค วิธีที่ง่ายที่สุดคือการเลือกแบบสุ่ม เช่น ใช้การจับฉลากตามปกติ (สำหรับประชากรกลุ่มเล็ก) หรือใช้ตาราง ตัวเลขสุ่ม. สำหรับประชากรที่มีขนาดใหญ่กว่าแต่ค่อนข้างเป็นเนื้อเดียวกัน จะใช้การเลือกเชิงกล (ซึ่งใช้ในสถิติ Zemstvo) สำหรับประชากรที่แตกต่างกันซึ่งมีโครงสร้างที่แน่นอน การเลือกทั่วไปมักจะใช้มากกว่า มีวิธีการอื่น ๆ ได้แก่ - การรวมกัน วิธีทางที่แตกต่างการเลือกตัวอย่างหลายขั้นตอน
ผลลัพธ์ตัวอย่างมีข้อผิดพลาดเสมอ ข้อผิดพลาดเหล่านี้สามารถแบ่งออกเป็นสองประเภท: แบบสุ่มและเป็นระบบ อดีตรวมถึงการเบี่ยงเบนแบบสุ่มของลักษณะตัวอย่างจากลักษณะทั่วไปเนื่องจากวิธีการสุ่มตัวอย่างเป็นธรรมชาติมาก ค่าของข้อผิดพลาดแบบสุ่มสามารถคำนวณได้ (โดยประมาณ) ในทางกลับกัน ข้อผิดพลาดอย่างเป็นระบบไม่ได้เกิดขึ้น สุ่ม; มีความเกี่ยวข้องกับการเบี่ยงเบนของโครงสร้างตัวอย่างจากโครงสร้างที่แท้จริงของประชากรทั่วไป ข้อผิดพลาดอย่างเป็นระบบปรากฏขึ้นเมื่อกฎพื้นฐานของการเลือกแบบสุ่มถูกละเมิด - ตรวจสอบให้แน่ใจว่าวัตถุทั้งหมดมีโอกาสเท่ากันที่จะรวมอยู่ในตัวอย่าง สถิติความผิดพลาดแบบนี้ไม่สามารถประเมินได้
แหล่งข่าวหลัก ข้อผิดพลาดอย่างเป็นระบบคือ: ก) ตัวอย่างที่เกิดขึ้นไม่เพียงพอต่อวัตถุประสงค์ของการศึกษา; b) ความไม่รู้ธรรมชาติของการกระจายตัวในประชากรทั่วไปและเป็นผลให้เกิดการฝ่าฝืนตัวอย่างโครงสร้างของประชากรทั่วไป c) การเลือกองค์ประกอบที่สะดวกและเป็นประโยชน์ที่สุดของประชากรทั่วไปอย่างมีสติ
ความน่าจะเป็นของความเชื่อมั่น -
5. ความน่าจะเป็นของความมั่นใจ ปานกลาง(มาตรฐาน)และ ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อย ช่วงความเชื่อมั่นเพื่อประมาณค่าเฉลี่ยใน ประชาชนทั่วไป การทดสอบสมมติฐานเกี่ยวกับ นัยสำคัญทางสถิติของความแตกต่างระหว่างค่าเฉลี่ยตัวอย่างทั้งสอง
ช่วงความเชื่อมั่น - ค่าของค่าสัมประสิทธิ์ที่คำนวณได้ ซึ่งเราเชื่อว่าค่านี้สำหรับยีนควรลดลง รวม
ความน่าจะเป็นของความเชื่อมั่น - ความน่าจะเป็นที่ค่าของค่าสัมประสิทธิ์ที่คำนวณได้สำหรับยีน ประชากรจะอยู่ในช่วงความเชื่อมั่น DV ใดยิ่ง CI ยิ่งมาก
การแพร่กระจายอย่างหลีกเลี่ยงไม่ได้ของค่าเฉลี่ยตัวอย่างรอบค่าเฉลี่ยทั่วไป (เช่น ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง) เรียกว่า ข้อผิดพลาดในการสุ่มตัวอย่างมาตรฐาน มซึ่งแสดงโดยสูตร (ส- เฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน, น- ขนาดตัวอย่าง). ข้อผิดพลาดมาตรฐานของตัวอย่างยิ่งเล็กค่ายิ่งน้อยส(ซึ่งเป็นลักษณะการแพร่กระจายของค่าคุณลักษณะ) และขนาดตัวอย่างที่ใหญ่ขึ้น น.
หากใช้วิธีการสุ่มตัวอย่างเพื่อทำงานกับข้อมูลที่ไม่ใช่เชิงปริมาณ บทบาทของค่าเฉลี่ยเลขคณิตในประชากรจะเล่นตามสัดส่วนหรือความถี่ ถามเข้าสู่ระบบ. การแบ่งปันจะคำนวณเป็นอัตราส่วนของจำนวนออบเจ็กต์ที่มีคุณลักษณะนี้ () ต่อจำนวนออบเจ็กต์ในประชากรทั้งหมด: บทบาทของการวัดการแพร่กระจายเล่นโดยปริมาณ
ในกรณีนี้ ข้อผิดพลาดในการสุ่มตัวอย่างมาตรฐานมคำนวณโดยสูตร:
ความแม่นยำและความน่าเชื่อถือของการประมาณค่าพารามิเตอร์ของประชากรทั่วไปตามกลุ่มตัวอย่างอยู่ใน ความสัมพันธ์ผกผัน: ยิ่งมีความแม่นยำมาก (เช่น ยิ่งน้อย ข้อผิดพลาดเล็กน้อยและยิ่งช่วงความเชื่อมั่นแคบลง) ความน่าเชื่อถือของค่าประมาณดังกล่าวก็จะยิ่งลดลง (ระดับความเชื่อมั่น) และในทางกลับกัน - ยิ่งความแม่นยำของการประมาณค่าลดลงเท่าใดความน่าเชื่อถือก็จะยิ่งสูงขึ้นเท่านั้น บ่อยครั้งที่ช่วงความเชื่อมั่นถูกสร้างขึ้นสำหรับความน่าเชื่อถือ 95% ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มมักจะเท่ากับสองเท่าของข้อผิดพลาดเฉลี่ยม..
ช่วงความเชื่อมั่นในการประมาณค่าเฉลี่ยของประชากรทั่วไป:
เอ็กซ์(ช.) =x(ที่เลือกไว้) +-Δ =x(เลือกแล้ว) +-tμ = เอ็กซ์(ที่เลือกไว้) +- σ(g.s.)/√น
เกณฑ์สำหรับความแตกต่างของค่าเฉลี่ย
บ่อยครั้งที่มีปัญหาในการเปรียบเทียบค่าเฉลี่ยตัวอย่างสองค่าเพื่อทดสอบสมมติฐานว่าตัวอย่างเหล่านี้ได้มาจากประชากรทั่วไปกลุ่มเดียวกันและความคลาดเคลื่อนที่แท้จริงในค่าของค่าเฉลี่ยตัวอย่างอธิบายได้โดยการสุ่มตัวอย่าง
สมมติฐานภายใต้การทดสอบสามารถกำหนดได้ดังนี้: ความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่างเป็นแบบสุ่ม เช่น ค่าเฉลี่ยทั่วไปเท่ากันในทั้งสองกรณี เนื่องจาก ลักษณะทางสถิติค่าถูกนำมาใช้อีกครั้ง ทีซึ่งเป็นผลต่างระหว่างค่าเฉลี่ยของตัวอย่างหารด้วยค่าเฉลี่ยข้อผิดพลาดมาตรฐานของค่าเฉลี่ยสำหรับทั้งสองตัวอย่าง
ค่าที่แท้จริงของลักษณะทางสถิติจะถูกเปรียบเทียบกับค่าวิกฤตที่สอดคล้องกับระดับนัยสำคัญที่เลือก หากค่าจริงมากกว่าค่าวิกฤต สมมติฐานที่ทดสอบจะถูกปฏิเสธ เช่น ความแตกต่างระหว่างค่าเฉลี่ยถือว่ามีนัยสำคัญ (มีนัยสำคัญ)
7. ความสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น สูตรของมัน ลิมิตของค่าของมัน ค่าสัมประสิทธิ์ของการกำหนดความหมายที่มีความหมาย แนวคิดของ นัยสำคัญทางสถิติของค่าสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์ แสดงให้เห็นว่าตัวแปรทั้งสองมีความสัมพันธ์กันอย่างไร .
ค่าสัมประสิทธิ์สหสัมพันธ์ ร รับค่าในช่วงตั้งแต่ -1 ถึง +1 ถ้า ร= 1 จากนั้นระหว่างตัวแปรทั้งสองจะมีค่าบวกเชิงฟังก์ชัน การเชื่อมต่อเชิงเส้น, เช่น. ในแผนภาพกระจาย จุดที่สอดคล้องกันจะอยู่บนเส้นตรงที่มีความชันเป็นบวก ถ้า ร = -1, จากนั้นจึงมีความสัมพันธ์เชิงลบตามหน้าที่ระหว่างตัวแปรทั้งสอง ถ้า ร = 0, แล้วตัวแปรที่อยู่ระหว่างการพิจารณา อิสระเชิงเส้น, เช่น. ในแผนภาพกระจาย เมฆแบบจุดจะ "ยืดออกในแนวนอน"
ขอแนะนำให้คำนวณสมการถดถอยและค่าสัมประสิทธิ์สหสัมพันธ์เฉพาะในกรณีที่ความสัมพันธ์ระหว่างตัวแปรสามารถพิจารณาเป็นเส้นตรงได้อย่างน้อยโดยประมาณ มิฉะนั้น ผลลัพธ์อาจผิดทั้งหมด โดยเฉพาะอย่างยิ่ง ค่าสัมประสิทธิ์สหสัมพันธ์อาจใกล้เคียงกับศูนย์เมื่อมีความสัมพันธ์ที่แน่นแฟ้น โดยเฉพาะอย่างยิ่งในกรณีที่การพึ่งพาอาศัยกันนั้นไม่เป็นเชิงเส้นอย่างชัดเจน (ตัวอย่างเช่น การพึ่งพาระหว่างตัวแปรจะอธิบายโดยประมาณด้วยไซน์ซอยด์หรือพาราโบลา) ในหลายกรณี ปัญหานี้สามารถหลีกเลี่ยงได้โดยการแปลงตัวแปรดั้งเดิม อย่างไรก็ตาม เพื่อคาดเดาความจำเป็นในการเปลี่ยนแปลงดังกล่าว เช่น เพื่อดูว่าข้อมูลนั้นประกอบด้วยอะไรบ้าง รูปร่างที่ซับซ้อนเป็นที่พึงปรารถนาที่จะ "เห็น" พวกเขา นั่นคือเหตุผลที่การศึกษาความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณโดยทั่วไปควรรวมถึงการดูแผนภาพกระจาย
สามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้โดยไม่ต้องสร้างเส้นถดถอยเบื้องต้น ในกรณีนี้ คำถามเกี่ยวกับการตีความสัญญาณว่ามีประสิทธิภาพและแฟกทอเรียล เช่น ไม่ได้ตั้งค่าขึ้นอยู่กับและเป็นอิสระและความสัมพันธ์เป็นที่เข้าใจกันว่าเป็นความสอดคล้องหรือการซิงโครไนซ์ของการเปลี่ยนแปลงพร้อมกันในค่าของคุณลักษณะในการเปลี่ยนจากวัตถุหนึ่งไปยังอีกวัตถุหนึ่ง
หากวัตถุมีลักษณะเชิงปริมาณทั้งชุด คุณสามารถสร้างสิ่งที่เรียกว่าได้ทันที เมทริกซ์สหสัมพันธ์เช่น ตารางสี่เหลี่ยมจัตุรัส จำนวนแถวและคอลัมน์เท่ากับจำนวนคุณลักษณะ และที่จุดตัดของแต่ละแถวและคอลัมน์คือค่าสัมประสิทธิ์สหสัมพันธ์ของคู่คุณลักษณะที่สอดคล้องกัน
ค่าสัมประสิทธิ์สหสัมพันธ์ไม่มีการตีความที่มีความหมาย อย่างไรก็ตามตารางของเขาเรียกว่า ค่าสัมประสิทธิ์การกำหนด(R2), มันมี.
ค่าสัมประสิทธิ์การกำหนด (R 2) - นี่เป็นตัวบ่งชี้ว่าการเปลี่ยนแปลงในคุณลักษณะที่พึ่งพานั้นอธิบายโดยการเปลี่ยนแปลงในคุณลักษณะที่เป็นอิสระมากน้อยเพียงใด อย่างแม่นยำยิ่งขึ้น มันคือสัดส่วนของความแปรปรวนของคุณลักษณะอิสระที่อธิบายโดยอิทธิพลของผู้อยู่ในอุปการะ .
หากตัวแปรสองตัวขึ้นอยู่กับการทำงานเชิงเส้น (จุดบนแผนภาพกระจายอยู่บนเส้นตรงเดียวกัน) เราก็สามารถพูดได้ว่าการเปลี่ยนแปลงในตัวแปร ยอธิบายได้อย่างสมบูรณ์จากการเปลี่ยนแปลงของตัวแปร x,และนี่เป็นเพียงกรณีที่ค่าสัมประสิทธิ์ของการกำหนด เท่ากับหนึ่ง(ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์สามารถเป็นได้ทั้ง 1 และ -1) ถ้าตัวแปรสองตัวเป็นอิสระเชิงเส้น (เมธอด กำลังสองน้อยที่สุดให้เส้นแนวนอน) จากนั้นตัวแปร ยความผันแปรของมันไม่ได้ "เป็นหนี้" กับตัวแปรแต่อย่างใด x– ในกรณีนี้ ค่าสัมประสิทธิ์ของการกำหนดจะเท่ากับศูนย์ ในกรณีระหว่างกลาง ค่าสัมประสิทธิ์ของการกำหนดจะระบุว่าส่วนใดของการเปลี่ยนแปลงในตัวแปร ยอธิบายได้จากการเปลี่ยนแปลงของตัวแปร x(บางครั้งก็สะดวกที่จะแสดงค่านี้เป็นเปอร์เซ็นต์)
8. ห้องอบไอน้ำและหลายรายการ การถดถอยเชิงเส้น. ค่าสัมประสิทธิ์ ความสัมพันธ์ที่หลากหลาย. ความหมายที่มีความหมายของสัมประสิทธิ์การถดถอย, ความสำคัญ, แนวคิดของ ที- สถิติ ความหมายที่มีความหมายของค่าสัมประสิทธิ์ของการกำหนด ร2.
การวิเคราะห์การถดถอย - วิธีการทางสถิติที่ช่วยให้คุณสร้างแบบจำลองเชิงอธิบายตามปฏิสัมพันธ์ของคุณลักษณะต่างๆ
มากที่สุด กรณีที่เรียบง่ายความสัมพันธ์คือ ความสัมพันธ์แบบคู่, เช่น. ความสัมพันธ์ระหว่างสองลักษณะ สันนิษฐานว่าความสัมพันธ์ระหว่างตัวแปรทั้งสองเป็นไปตามกฎ เชิงสาเหตุ กล่าวคือ หนึ่งในนั้นขึ้นอยู่กับอีกอันหนึ่ง คนแรก (ขึ้นอยู่กับ) ถูกเรียกเข้ามา การวิเคราะห์การถดถอย ส่งผลให้วินาที (อิสระ) - แฟคทอเรียล. ควรสังเกตว่า เป็นไปไม่ได้เสมอที่จะระบุได้อย่างชัดเจนว่าตัวแปรใดในสองตัวแปรนี้เป็นอิสระและตัวแปรใดขึ้นอยู่กับ การสื่อสารมักถูกมองว่าเป็นแบบสองทิศทาง
สมการถดถอยคู่ : ย = เคเอ็กซ์ + ข.
บ่อยครั้งที่ตัวแปรตามหลายตัวทำหน้าที่พร้อมกันซึ่งเป็นเรื่องยากที่จะแยกแยะตัวแปรเดียวหรือตัวหลัก ตัวอย่างเช่น รายได้ขององค์กรขึ้นอยู่กับ พร้อมกันจากสองปัจจัยการผลิต - จำนวนคนงานและแหล่งจ่ายไฟ นอกจากนี้ปัจจัยทั้งสองนี้ไม่เป็นอิสระจากกัน
สมการ การถดถอยพหุคูณ : ย = เค 1 · x 1 + เค 2 · x 2 + … + ข,
ที่ไหน x 1 , x 2, . . . - ตัวแปรอิสระซึ่งตัวแปรที่ศึกษา (ผลลัพธ์) y ขึ้นอยู่กับระดับใดระดับหนึ่ง
k 1 , k 2. . . เป็นค่าสัมประสิทธิ์ของตัวแปรที่เกี่ยวข้อง ( ค่าสัมประสิทธิ์การถดถอย) แสดงจำนวนค่าของตัวแปรผลลัพธ์ที่เปลี่ยนไปเมื่อตัวแปรอิสระตัวเดียวเปลี่ยนไปทีละตัว
ระบุสมการถดถอยพหุคูณ แบบจำลองการถดถอยอธิบายพฤติกรรมของตัวแปรตาม ไม่มี แบบจำลองการถดถอยไม่สามารถบอกได้ว่าตัวแปรใดขึ้นอยู่กับ (ผล) และตัวแปรใดไม่ขึ้นกับ (สาเหตุ)
ร - อัตราต่อรองหลายรายการ ความสัมพันธ์ วัดผลรวมของผลกระทบของคุณลักษณะอิสระ ความใกล้ชิดของความสัมพันธ์ของคุณลักษณะที่เป็นผลลัพธ์กับคุณลักษณะอิสระทั้งชุด แสดงเป็น %
แสดงสัดส่วนของลักษณะที่นำมาพิจารณาในส่วนผลลัพธ์ เช่น % ความแปรผันของคุณลักษณะ y อธิบายได้จากความแปรผันของคุณลักษณะที่พิจารณา X1, X2, X3
ต-สถิติแสดงระดับของสถิติ ความสำคัญของแต่ละอย่าง ค่าสัมประสิทธิ์การถดถอย เช่น ความทนทานเมื่อเทียบกับตัวอย่าง
ต = ข/ ∆b
มีนัยสำคัญทางสถิติที >2. ค่าสัมประสิทธิ์ยิ่งสูงยิ่งดี
ผ่านทาง ร ² เราได้ข้อสรุปเกี่ยวกับ % ของคุณสมบัติที่นำมาพิจารณาเพื่ออธิบายผลลัพธ์
9. วิธีการหลายมิติ การวิเคราะห์ทางสถิติ. การวิเคราะห์คลัสเตอร์ แนวคิดของ วิธีการลำดับชั้นและ เกี่ยวกับวิธี K-mean การจำแนกหลายตัวแปรด้วย โดยใช้ชุดคลุมเครือ
คือ:
การวิเคราะห์คลัสเตอร์
การวิเคราะห์ปัจจัย
การปรับขนาดหลายมิติ
การวิเคราะห์คลัสเตอร์ - การรวมวัตถุเป็นกลุ่มโดยมีเป้าหมายร่วมกัน (มีหลายสัญญาณ)
วิธีการวิเคราะห์คลัสเตอร์:
1. ลำดับชั้น(แผนผังการวิเคราะห์ลำดับชั้น):
แนวคิดหลัก วิธีการลำดับชั้น ประกอบด้วยการเชื่อมโยงตามลำดับของวัตถุที่จัดกลุ่ม - อันดับแรกที่ใกล้เคียงที่สุดจากนั้นจึงห่างจากกันมากขึ้นเรื่อย ๆ ขั้นตอนการสร้างหมวดหมู่ประกอบด้วย ขั้นตอนต่อเนื่องซึ่งแต่ละกลุ่มจะรวมวัตถุสองกลุ่มที่ใกล้ที่สุดเข้าด้วยกัน (กระจุก).
2. วิธี k-mean.
ต้องการคลาสที่กำหนดไว้ล่วงหน้า (คลัสเตอร์) เน้นความแปรปรวนภายในชั้นเรียน ตามสมมติฐานของจำนวนคลาสที่เป็นไปได้มากที่สุด งานของวิธีนี้คือการสร้างคลัสเตอร์ตามจำนวนที่กำหนด ซึ่งควรแตกต่างจากกันมากที่สุด
ขั้นตอนการจำแนกเริ่มต้นด้วยการสร้างกลุ่มจำนวนหนึ่งที่ได้จากการจัดกลุ่มวัตถุแบบสุ่ม แต่ละคลัสเตอร์ควรประกอบด้วยออบเจ็กต์ที่ "คล้ายกัน" มากที่สุด และคลัสเตอร์เองก็ควร "ต่างกัน" มากที่สุด
ผลลัพธ์ของวิธีนี้ช่วยให้คุณได้รับศูนย์กลางของคลาสทั้งหมด (รวมถึงพารามิเตอร์อื่น ๆ ของสถิติเชิงพรรณนา) สำหรับแต่ละคุณลักษณะดั้งเดิม และยังเห็น การแสดงกราฟิกเกี่ยวกับพารามิเตอร์ที่คลาสผลลัพธ์แตกต่างกันอย่างไรและในพารามิเตอร์ใด
หากผลลัพธ์ของการจำแนกประเภทที่ได้รับจากวิธีการต่างๆ ตรงกัน แสดงว่าเป็นการยืนยันความเป็นจริง กลุ่มที่มีอยู่ (ความน่าเชื่อถือ, ความน่าเชื่อถือ)
10. วิธีการวิเคราะห์ทางสถิติหลายมิติ การวิเคราะห์ปัจจัย วัตถุประสงค์ของการใช้งาน แนวคิดของ น้ำหนักแฟกทอเรียล ขีดจำกัดของพวกเขา ค่า; สัดส่วนของความแปรปรวนทั้งหมดที่อธิบายได้จากปัจจัยต่างๆ
การวิเคราะห์ทางสถิติหลายตัวแปร วัตถุประสงค์: การสร้างชุดวัตถุขยายแบบง่าย
คือ:
การวิเคราะห์คลัสเตอร์
การวิเคราะห์ปัจจัย
การปรับขนาดหลายมิติ
ที่แกนกลาง การวิเคราะห์ปัจจัยแนวคิดที่ว่าเบื้องหลังความสัมพันธ์ที่ซับซ้อนของคุณลักษณะที่กำหนดอย่างชัดเจนนั้นเป็นโครงสร้างที่ค่อนข้างง่ายกว่าซึ่งสะท้อนถึงคุณลักษณะที่สำคัญที่สุดของปรากฏการณ์ภายใต้การศึกษา และคุณลักษณะ "ภายนอก" เป็นฟังก์ชันของสิ่งที่ซ่อนอยู่ ปัจจัยทั่วไปการกำหนดโครงสร้างนี้
วัตถุประสงค์: เปลี่ยนจาก มากกว่าลักษณะของปัจจัยจำนวนเล็กน้อย
ใน การวิเคราะห์ปัจจัยปริมาณทั้งหมดที่รวมอยู่ในแบบจำลองแฟคทอเรียลเป็นมาตรฐาน เช่น เป็นปริมาณไร้มิติที่มีค่าเฉลี่ยเลขคณิตเป็น 0 และส่วนเบี่ยงเบนมาตรฐาน 1
ค่าสัมประสิทธิ์ของความสัมพันธ์ระหว่างคุณลักษณะบางอย่างกับปัจจัยทั่วไป ซึ่งแสดงระดับของอิทธิพลของปัจจัยที่มีต่อคุณลักษณะนั้นเรียกว่า โหลดปัจจัยของลักษณะนี้สำหรับปัจจัยร่วมนี้ . นี่คือตัวเลขระหว่าง -1 ถึง 1 ยิ่งห่างจาก 0 ความสัมพันธ์ยิ่งแน่นแฟ้น ค่าของโหลดแฟกเตอร์สำหรับแฟกเตอร์บางตัว ซึ่งมีค่าใกล้เคียงกับศูนย์ บ่งชี้ว่าแฟกเตอร์นี้แทบไม่ส่งผลต่อลักษณะนี้
ค่า (การวัดการสำแดง) ของปัจจัยในแต่ละวัตถุเรียกว่า น้ำหนักแฟคทอเรียลวัตถุสำหรับปัจจัยนี้. น้ำหนักปัจจัยช่วยให้คุณสามารถจัดลำดับ จัดลำดับวัตถุตามแต่ละปัจจัย ยิ่งน้ำหนักปัจจัยของวัตถุมากเท่าใด วัตถุก็จะยิ่งแสดงด้านนั้นของปรากฏการณ์หรือรูปแบบที่สะท้อนโดยปัจจัยนี้มากขึ้นเท่านั้น ตัวประกอบเป็นค่ามาตรฐาน ไม่สามารถเป็น = ศูนย์ได้ น้ำหนักตัวประกอบใกล้เคียงกับศูนย์บ่งชี้ ระดับปานกลางการแสดงออกของปัจจัย, บวก - ระดับนี้สูงกว่าค่าเฉลี่ย, ลบ - ประมาณนั้น ว่ามันต่ำกว่าค่าเฉลี่ย
ตารางน้ำหนักปัจจัยมี นแถวตามจำนวนวัตถุและ เคคอลัมน์ตามจำนวนตัวประกอบทั่วไป ตำแหน่งของวัตถุบนแกนของแต่ละปัจจัย ในแง่หนึ่ง ลำดับที่พวกมันถูกจัดอันดับโดยปัจจัยนี้ และในทางกลับกัน ความสม่ำเสมอหรือความไม่สม่ำเสมอในการจัดเรียง การมีอยู่ของกลุ่มจุดที่แสดงถึงวัตถุ ซึ่งทำให้สามารถเน้นกลุ่มที่เป็นเนื้อเดียวกันมากขึ้นหรือน้อยลงได้
11. ประเภทของสัญญาณเชิงคุณภาพ คุณสมบัติที่กำหนด ตัวอย่างจาก แหล่งประวัติศาสตร์. ตารางฉุกเฉิน ค่าสัมประสิทธิ์การเชื่อมต่อของคุณสมบัติเล็กน้อย ขีด จำกัด ของค่า
จัดอันดับข้อมูล นำเสนอตามหมวดหมู่ที่ลำดับไม่สำคัญอย่างยิ่ง ไม่มีวิธีเปรียบเทียบอื่นใดที่กำหนดไว้สำหรับพวกเขา ยกเว้นการจับคู่ตามตัวอักษร/ไม่ตรงกัน
ตัวอย่างของตัวแปรเล็กน้อย:
· สัญชาติ: อังกฤษ เบลารุส เยอรมัน รัสเซีย ญี่ปุ่น ฯลฯ
· อาชีพ: พนักงาน, แพทย์, ทหาร, ครู, ฯลฯ
· ประวัติการศึกษา: มนุษยธรรม เทคนิค การแพทย์ กฎหมาย ฯลฯ
หากในกรณีของระดับการศึกษา เรายังสามารถเปรียบเทียบผู้คนในแง่ของ "ดีกว่า-แย่" หรือ "สูงกว่า-ต่ำกว่า" ได้ ตอนนี้เราขาดแม้แต่ความเป็นไปได้นี้ วิธีเปรียบเทียบที่ถูกต้องวิธีเดียวคือบอกว่าบุคคลเหล่านี้ "ล้วนแต่เป็นนักประวัติศาสตร์" หรือ "ทุกคนไม่ใช่นักกฎหมาย"
ตารางฉุกเฉิน
ตารางฉุกเฉินคือตารางสี่เหลี่ยม แถวที่ระบุหมวดหมู่ของสถานที่หนึ่ง (เช่น กลุ่มสังคมต่างๆ) และคอลัมน์ระบุหมวดหมู่ของอีกสถานที่หนึ่ง (เช่น การสังกัดพรรค) แต่ละอ็อบเจกต์ของคอลเล็กชันจะอยู่ในเซลล์ใดเซลล์หนึ่งของตารางนี้ตามประเภทที่จัดอยู่ในแต่ละฟีเจอร์ ดังนั้นในเซลล์ของตารางจึงมีตัวเลขที่แสดงถึงความถี่ของการเกิดขึ้นร่วมกันของหมวดหมู่ของสองคุณสมบัติ (จำนวนคนที่อยู่ในกลุ่มสังคมเฉพาะและอยู่ในกลุ่มใดกลุ่มหนึ่ง) ขึ้นอยู่กับลักษณะของการกระจายความถี่เหล่านี้ภายในตาราง เราสามารถตัดสินได้ว่ามีความสัมพันธ์ระหว่างคุณลักษณะต่างๆ หรือไม่ ความเชื่อมโยงระหว่างอะไร สถานะทางสังคมและสังกัดพรรค? ในกรณีนี้ การมีสายสัมพันธ์กันจะบ่งชี้ถึงความชอบทางการเมืองบางอย่างในหมู่สมาชิกที่แตกต่างกัน กลุ่มทางสังคม. พูดอย่างเป็นทางการ ความเชื่อมโยงนี้เป็นที่เข้าใจกันว่าเป็นการเกิดขึ้นร่วมกันบ่อยขึ้น (หรือกลับกัน หายากกว่า) ของการรวมกันของแต่ละหมวดหมู่เมื่อเทียบกับเหตุการณ์ที่คาดไว้ - สถานการณ์ของวัตถุสุ่มอย่างหมดจดที่ไปถึงที่นั่น (ตัวอย่างเช่น สัดส่วนชาวนาที่สูงขึ้นใน พรรค Trudovik และขุนนางในพรรคนายร้อยมากกว่าหุ้นของกลุ่มสังคมเหล่านี้ในประชากรทั้งหมดของเจ้าหน้าที่ Duma)
12. ประเภทของสัญญาณเชิงคุณภาพ เครื่องหมายยศ ตัวอย่างจาก แหล่งประวัติศาสตร์ ที่ ข้อ จำกัด ของค่าสัมประสิทธิ์คืออะไร ความสัมพันธ์อันดับ? ควรใช้ค่าสัมประสิทธิ์ใดในการประเมินความสัมพันธ์ระหว่างอันดับและ สัญญาณเล็กน้อย?
ข้อมูลเชิงคุณภาพ (หรือหมวดหมู่) แบ่งออกเป็นสองประเภท: จัดอันดับและระบุ
ข้อมูลอันดับจะแสดงตามหมวดหมู่ที่คุณสามารถระบุลำดับได้ เช่น หมวดเทียบเคียงตามหลัก "มาก-น้อย" หรือ "ดีกว่า-เลว"
ตัวอย่างของตัวแปรอันดับ:
· คะแนนสอบมีลักษณะของอันดับที่ชัดเจนและแสดงเป็นหมวดหมู่เช่น "ดีเยี่ยม" "ดี" "น่าพอใจ" เป็นต้น
· ระดับการศึกษาสามารถแสดงเป็นชุดของหมวดหมู่: "สูงกว่า", "มัธยม" เป็นต้น
แน่นอน เราสามารถแนะนำมาตราส่วนการจัดอันดับและใช้เพื่อจัดอันดับบุคคลทั้งหมดที่เราทราบระดับการศึกษาหรือคะแนนสอบของพวกเขา อย่างไรก็ตาม จริงหรือไม่ที่ "ดี" แย่กว่า "ยอดเยี่ยม" พอๆ กับ "น่าพอใจ" แย่กว่า "ดี" แม้จะมีข้อเท็จจริงที่เป็นทางการ ในกรณีของเกรด คุณสามารถได้รับความแตกต่างของคะแนน แต่ก็แทบจะไม่ถูกต้องที่จะวัดระยะทางจาก "ยอดเยี่ยม" ถึง "ดี" โดยใช้กฎเดียวกันกับระยะทางจากมอสโกวถึงเซนต์ปีเตอร์สเบิร์ก . ในกรณีของระดับการศึกษานั้นชัดเจนเป็นพิเศษ การคำนวณอย่างง่ายเป็นไปไม่ได้ เนื่องจากไม่มีกฎข้อเดียวสำหรับการลบการศึกษา "ระดับมัธยมศึกษา" ออกจาก "ระดับสูงกว่า" แม้ว่าเราจะกำหนดรหัส "3" ให้กับระดับอุดมศึกษาและรหัส "2" ให้กับระดับมัธยมศึกษาก็ตาม
ความไม่ชอบมาพากลของข้อมูลเชิงคุณภาพไม่ได้หมายความว่าไม่สามารถวิเคราะห์ได้โดยใช้วิธีทางคณิตศาสตร์และสถิติ
วัตถุจำนวนหนึ่งที่เรียงลำดับตามระดับของการแสดงคุณสมบัติบางอย่างเรียกว่า จัดอันดับ แต่ละชุดจะมีการกำหนดหมายเลขดังกล่าว อันดับ.
การวัดความสัมพันธ์ระหว่างคุณลักษณะคู่หนึ่ง ซึ่งแต่ละคุณลักษณะจัดลำดับชุดของวัตถุที่ศึกษา จะเรียกเป็นสถิติ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับ .
ค่าสัมประสิทธิ์เหล่านี้สร้างขึ้นจากคุณสมบัติสามประการต่อไปนี้:
· หากอนุกรมอันดับสำหรับคุณลักษณะทั้งสองตรงกันอย่างสมบูรณ์ (เช่น แต่ละออบเจกต์อยู่ในตำแหน่งเดียวกันในทั้งสองอนุกรม) ค่าสัมประสิทธิ์สหสัมพันธ์อันดับควรเท่ากับ +1 ซึ่งหมายถึงความสัมพันธ์เชิงบวกทั้งหมด:
· ถ้าวัตถุที่อยู่ในแถวเดียวกันอยู่ใน ลำดับย้อนกลับเมื่อเทียบกับวินาที ค่าสัมประสิทธิ์คือ -1 ซึ่งหมายถึงความสัมพันธ์เชิงลบทั้งหมด
· ในสถานการณ์อื่น ค่าสัมประสิทธิ์จะอยู่ในช่วง [-1, +1]; การเพิ่มค่าโมดูลัสของค่าสัมประสิทธิ์จาก 0 เป็น 1 เป็นการระบุลักษณะการเพิ่มขึ้นของความสอดคล้องกันระหว่างสองแถวที่มีอันดับ
คุณสมบัติที่ระบุมีค่าสัมประสิทธิ์สหสัมพันธ์อันดับ สเปียร์แมน ร และ เคดัลลา ที .
ค่าสัมประสิทธิ์ของ Kedall ให้ค่าประมาณของความสัมพันธ์ที่อนุรักษ์นิยมมากกว่าค่าสัมประสิทธิ์ของ Spearman (ค่าตัวเลขทีน้อยกว่าเสมอร).
ค่าสัมประสิทธิ์ความสัมพันธ์ของคุณลักษณะเชิงคุณภาพ
ในการประเมินความสัมพันธ์ของคุณลักษณะเชิงคุณภาพ จำเป็นต้องมีค่าสัมประสิทธิ์ ซึ่งจะมีค่าสูงสุดที่แน่นอนในกรณีของความสัมพันธ์สูงสุด และจะอนุญาตให้เปรียบเทียบกันได้ ตารางที่แตกต่างกันโดยความแข็งแกร่งของความสัมพันธ์ระหว่างคุณสมบัติ กรณีนี้เราพอดี ค่าสัมประสิทธิ์ของแครมเมอร์ วี .
ขึ้นอยู่กับค่าของการทดสอบไคสแควร์ ค่าสัมประสิทธิ์ของแครมเมอร์ช่วยให้คุณวัดความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรที่จัดหมวดหมู่สองตัวแปร - เพื่อวัดด้วยตัวเลขที่รับค่าจาก 0 ถึง 1 เช่น จากการขาดการสื่อสารอย่างสมบูรณ์ถึงขีดสุด การเชื่อมต่อที่แข็งแกร่ง. ค่าสัมประสิทธิ์ช่วยให้คุณสามารถเปรียบเทียบการพึ่งพาได้ สัญญาณที่แตกต่างกันเพื่อเปิดเผยการเชื่อมต่อที่แข็งแกร่งมากขึ้นและน้อยลง
13. การสร้างแบบจำลองทางคณิตศาสตร์กระบวนการทางประวัติศาสตร์และปรากฏการณ์. คำจำกัดความของคำว่า "แบบจำลอง" แบบจำลองสามประเภท ตัวอย่างของพวกเขาใช้ใน การวิจัยทางประวัติศาสตร์
14. สมการเชิงอนุพันธ์เป็นเครื่องมือหลักในการสร้าง แบบจำลองทางคณิตศาสตร์ประเภททางทฤษฎี คุณลักษณะของพวกเขาเมื่อเปรียบเทียบกับแบบจำลองของการจำลองและประเภทสถิติ ตัวอย่างของรูปแบบดังกล่าว
ส่งงานที่ดีของคุณในฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง
นักศึกษา บัณฑิต นักวิทยาศาสตร์รุ่นเยาว์ที่ใช้ฐานความรู้ในการศึกษาและการทำงานจะขอบคุณมาก
โพสต์เมื่อ http://www.allbest.ru/
ภารกิจที่ 1
ในบางภูมิภาคใน ปีนี้มีการก่ออาชญากรรม 12,390 คดี และในปีที่แล้ว - อาชญากรรม 11,800 คดี คำนวณ (เป็น %) อัตราการเติบโตและอัตราการเติบโตของจำนวนอาชญากรรมที่ลงทะเบียนในปีปัจจุบันโดยสัมพันธ์กับปีก่อนหน้า คำนวณอัตราการเกิดอาชญากรรมในแต่ละปีด้วยหากรวมประชากรในภูมิภาคนี้ในตอนท้าย ปีก่อนคือ 1,475,000 และ ณ สิ้นปีปัจจุบัน - 1,770,000 คน หาข้อสรุปเกี่ยวกับการเปลี่ยนแปลงของอาชญากรรมในภูมิภาค
การตัดสินใจ:เพื่อให้ได้ภาพที่ถูกต้องของอาชญากร ตัวบ่งชี้อาชญากรเช่นพลวัตซึ่งก็คือการเปลี่ยนแปลงตลอดเวลามีความสำคัญอย่างยิ่ง พลวัตของอาชญากรรมมีลักษณะตามแนวคิดของการเติบโตแบบสัมบูรณ์ (หรือการลดลง) และอัตราการเติบโตและการเติบโตของอาชญากรรม เพื่อกำหนดลักษณะเหล่านี้ที่คำนวณตามสูตรบางอย่าง
อัตราการเติบโตของอาชญากรรมคำนวณจากตัวบ่งชี้พื้นฐานของพลวัต ซึ่งเกี่ยวข้องกับการเปรียบเทียบข้อมูลเป็นเวลาหลายปี (และบางครั้งหลายสิบปี หากต้องการข้อมูลที่ครอบคลุมในวงกว้าง) ด้วยพื้นฐานที่คงที่ ซึ่งเข้าใจว่าเป็นระดับของอาชญากรรม ในช่วงเริ่มต้นสำหรับการวิเคราะห์ การคำนวณนี้ช่วยให้นักอาชญาวิทยารับประกันความสามารถในการเปรียบเทียบได้ในระดับมาก ตัวบ่งชี้สัมพัทธ์คำนวณเป็นเปอร์เซ็นต์ ซึ่งแสดงให้เห็นว่าอาชญากรรมในช่วงเวลาต่อมามีความสัมพันธ์กับช่วงเวลาก่อนหน้าอย่างไร
ในการคำนวณ 100% นำมาจากข้อมูลของปีเดิม ตัวบ่งชี้ที่ได้รับสำหรับปีต่อ ๆ ไปจะสะท้อนเฉพาะเปอร์เซ็นต์ของการเติบโต ซึ่งทำให้การคำนวณแม่นยำและภาพมีจุดมุ่งหมายมากขึ้น เมื่อทำงานกับข้อมูลสัมพัทธ์ มันเป็นไปได้ที่จะไม่รวมอิทธิพลต่อการลดลงหรือการเพิ่มขึ้นของอาชญากรรมของจำนวนผู้อยู่อาศัยที่เพิ่มขึ้นหรือลดลงซึ่งมีอายุถึงเกณฑ์ที่ต้องรับผิดชอบทางอาญา
อัตราการเพิ่มขึ้นของอาชญากรรมคิดเป็นเปอร์เซ็นต์ อัตราการเพิ่มขึ้นของอาชญากรรมแสดงให้เห็นว่าอัตราอาชญากรรมที่ตามมาเพิ่มขึ้นหรือลดลงมากน้อยเพียงใดเมื่อเทียบกับช่วงเวลาก่อนหน้า ได้รับการยอมรับ สัญลักษณ์เวกเตอร์อัตราการเติบโต: ถ้า เปอร์เซ็นต์เพิ่มขึ้นให้ใส่เครื่องหมายบวก ถ้าลดลง ให้ใส่เครื่องหมายลบ
สำหรับเงื่อนไขของงานของเรา เราควรใช้สูตรที่เหมาะสมและคำนวณการเติบโตและการเติบโตของอาชญากรรม
1) อัตราการเติบโตของอาชญากรรมคำนวณโดยสูตร ^
Tr \u003d U / U2 * 100%
โดยที่ U เป็นตัวบ่งชี้อัตราการเกิดอาชญากรรม และ U2 เป็นตัวบ่งชี้อัตราการเกิดอาชญากรรมในช่วงก่อนหน้า ดังนั้นอัตราการเติบโตของอาชญากรรมภายใต้เงื่อนไขของปัญหาจะเป็น - 12390/11800 * 100% = 1.05%
2) อัตราการเพิ่มขึ้นของอาชญากรรมคำนวณโดยสูตรต่อไปนี้:
Tpr \u003d Tr-100%
ดังนั้นอัตราการเติบโตตามเงื่อนไขของโจทย์จะเท่ากับ 1.05% -100% = 98.95%
อัตราการเกิดอาชญากรรมเป็นตัวบ่งชี้สรุปที่เฉพาะเจาะจง ทั้งหมดอาชญากรรมที่บันทึกไว้มีความสัมพันธ์กับประชากร ย่อมาจากจำนวนอาชญากรรมต่อประชากร 100,000, 10,000 หรือ 1,000 คน และเป็นมาตรการเชิงวัตถุประสงค์ของอาชญากรรมที่ช่วยให้สามารถเปรียบเทียบระดับอาชญากรรมในภูมิภาคต่างๆ และในปีต่างๆ ได้
อัตราการเกิดอาชญากรรมช่วยในการประเมินพลวัตของระดับอาชญากรรมที่คำนวณต่อหัวได้อย่างเพียงพอ
อัตราอาชญากรรมคำนวณโดยสูตร:
KP \u003d (P x 100000): ยังไม่มีข้อความ
โดยที่ P - จำนวนสัมบูรณ์อาชญากรรมที่บันทึกไว้; และ H คือจำนวนสัมบูรณ์ของประชากรทั้งหมด
ตัวบ่งชี้ทั้งสองถูกนำมาใช้ในปริมาณอาณาเขตและชั่วคราวเดียวกัน จำนวนอาชญากรรมมักจะคำนวณต่อประชากร 100,000 คน แต่ด้วยอาชญากรรมและประชากรจำนวนน้อย (ในเมือง อำเภอ ในองค์กร) สามารถคำนวณอัตราการเกิดอาชญากรรมต่อประชากร 10,000 คนหรือต่อประชากร 1,000 คน ไม่ว่าในกรณีใด ตัวเลขเหล่านี้หมายถึงมิติของค่าสัมประสิทธิ์ที่ต้องพิจารณา ซึ่งจะต้องระบุ: จำนวนอาชญากรรมต่อประชากร 100,000 หรือ 10,000 คน
ลองคำนวณอัตราการเกิดอาชญากรรมตามเงื่อนไขของปัญหาของเรา:
1) CP = (12390 * 100000): 1,770,000 คน = 700 (ในปีปัจจุบัน)
2) CP = (11800 * 100000): 1,475,000 = 800 (ปีก่อนหน้า)
อาชญากรรมในภูมิภาคกำลังลดลง เนื่องจากการวิเคราะห์อัตราการเกิดอาชญากรรม เราสามารถสรุปได้ว่าด้วยการเพิ่มขึ้นของประชากรในภูมิภาค (16.6%) และจำนวนอาชญากรรมที่เพิ่มขึ้นเล็กน้อย 1.05% โดยทั่วไปแล้ว การเพิ่มขึ้นของอาชญากรรมลดลง (-98.95 %)
ภารกิจที่ 2
อายุของผู้เชี่ยวชาญอายุน้อย 11 ปีของสถาบันที่เข้ารับบริการในปีปัจจุบันคือ 19,25,21,23,23,23,25,20,18,20,21 ปีตามลำดับ สรุปและจัดกลุ่มข้อมูลในตารางความถี่ทางสถิติ เพื่อความชัดเจน ให้สร้างรูปหลายเหลี่ยมของความถี่ และค้นหาค่าโมดอล ค่ามัธยฐาน และค่าเฉลี่ยของอายุของพนักงานที่ได้รับการว่าจ้าง
การตัดสินใจ: การจัดกลุ่ม- นี่คือการแบ่งประชากรออกเป็นกลุ่มที่เป็นเนื้อเดียวกันไม่ทางใดก็ทางหนึ่ง จากมุมมองของแต่ละหน่วยของประชากร การจัดกลุ่มคือการรวมตัวกันของหน่วยแต่ละหน่วยของประชากรให้เป็นกลุ่มที่มีความเป็นเนื้อเดียวกันไม่ทางใดก็ทางหนึ่ง
วิธีการจัดกลุ่มขึ้นอยู่กับหมวดหมู่ต่อไปนี้ - แอตทริบิวต์การจัดกลุ่ม ช่วงเวลาการจัดกลุ่ม และจำนวนกลุ่ม
สัญญาณการจัดกลุ่ม- นี่เป็นสัญญาณที่แต่ละหน่วยของประชากรรวมกันเป็นกลุ่มที่เป็นเนื้อเดียวกัน
ช่วงเวลาแสดงขอบเขตเชิงปริมาณของกลุ่ม ตามกฎแล้ว จะแสดงถึงช่วงเวลาระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ในกลุ่ม
การกำหนดจำนวนกลุ่ม.
จำนวนกลุ่มถูกกำหนดโดยประมาณโดยสูตร Sturgess:
n = 1 + 3.2log n = 1 + 3.2log(11) = 4.
ความกว้างของช่วงจะเป็น:
Xmax- ค่าสูงสุดลักษณะการรวมกลุ่มในลักษณะรวม Xmin - ค่าต่ำสุดของแอตทริบิวต์การจัดกลุ่ม มากำหนดขอบเขตของกลุ่มกัน
หมายเลขกลุ่ม |
บรรทัดล่าง |
ขอบเขตบน |
|
ค่าคุณลักษณะเดียวกันทำหน้าที่เป็นขอบเขตบนและล่างของสองกลุ่มที่อยู่ติดกัน (ก่อนหน้าและถัดไป)
สำหรับแต่ละค่าของซีรีส์ เราจะคำนวณจำนวนครั้งที่ค่านั้นอยู่ในช่วงเวลาหนึ่งๆ ในการทำเช่นนี้ ให้เรียงลำดับชุดตามลำดับจากน้อยไปมาก
จำนวนประชากร |
ความถี่ |
||
รูปหลายเหลี่ยมความถี่คือกราฟของความหนาแน่นและความน่าจะเป็น ตัวแปรสุ่มเป็นเส้นแบ่งที่เชื่อมต่อจุดที่สอดคล้องกับค่ามัธยฐานของช่วงเวลาการจัดกลุ่มกับความถี่ของช่วงเวลาเหล่านี้
ค่าเฉลี่ย:
แฟชั่นความหมายที่แท้จริง. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
โดยที่ x 0 - จุดเริ่มต้นของช่วงเวลาโมดอล h - ค่าช่วงเวลา f 2 - ความถี่ที่สอดคล้องกับช่วงเวลาโมดอล f 1 - ความถี่พรีโมดอล; f 3 - ความถี่ภายหลัง
เราเลือก 19.75 เป็นจุดเริ่มต้นของช่วงเวลา เนื่องจากเป็นช่วงที่มีตัวเลขมากที่สุด
ค่าที่พบบ่อยที่สุดของซีรีส์คือ 20.92
ค่ามัธยฐาน. ค่ามัธยฐานจะแบ่งกลุ่มตัวอย่างออกเป็นสองส่วน ตัวเลือกครึ่งหนึ่งมีค่าน้อยกว่าค่ามัธยฐาน และค่ามัธยฐานมากกว่าครึ่งหนึ่ง
ในชุดการกระจายช่วงเวลา คุณสามารถระบุเฉพาะช่วงเวลาที่โหมดหรือค่ามัธยฐานจะอยู่ได้ทันที ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง ค่ามัธยฐานคือช่วง 19.75-21.5 เนื่องจาก ในช่วงเวลานี้ ความถี่สะสม S มากกว่าค่ามัธยฐาน (ค่ามัธยฐานคือช่วงแรก ความถี่สะสม S ซึ่งเกินครึ่งหนึ่ง จำนวนเงินทั้งหมดความถี่)
ดังนั้น 50% ของหน่วยประชากรจะน้อยกว่า 21.28
ภารกิจที่ 3
กำหนดขนาดตัวอย่างที่จำเป็นสำหรับการศึกษาอายุเฉลี่ยของพนักงานที่ได้รับการรับรองของ Federal Penitentiary Service of Russia โดยมีเงื่อนไขว่าค่าเบี่ยงเบนมาตรฐานคือ 10 ปี และข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดที่อนุญาตไม่ควรเกิน 5%
เรากำลังมองหาวิธีแก้ปัญหาตามสูตรสำหรับกำหนดขนาดของตัวอย่างสำหรับการเลือกใหม่
Ф(t) = g/2 = 0.95/2 = 0.475 และตามตาราง Laplace ค่านี้สอดคล้องกับ t=1.96
ค่าเบี่ยงเบนมาตรฐานโดยประมาณ s = 10; ข้อผิดพลาดในการสุ่มตัวอย่าง e = 5
ภารกิจที่ 4
ตารางต่อไปนี้แสดงสถิติของแผนกอย่างเป็นทางการเกี่ยวกับการกระจายตัวของนักโทษตามเงื่อนไขการจำคุก (การลงโทษ) สำหรับปี 2545-2554 ซึ่งโพสต์บนเว็บไซต์อย่างเป็นทางการของ Federal Penitentiary Service of Russia: www.fsin.su ค้นหาช่วงและค่าสัมประสิทธิ์การแปรผันของจำนวนนักโทษในแต่ละปีปฏิทิน และสรุปผลเกี่ยวกับความสอดคล้องกันของโครงสร้างของคุณลักษณะทางสถิตินี้
ตัวบ่งชี้หลักที่แสดงลักษณะความเป็นเนื้อเดียวกันของข้อมูลคือค่าสัมประสิทธิ์ของการแปรผัน ในสถิติ เป็นที่ยอมรับกันโดยทั่วไปว่าถ้าค่าของสัมประสิทธิ์น้อยกว่า 33% แสดงว่าชุดข้อมูลนั้นเป็นเนื้อเดียวกัน ถ้ามากกว่า 33% ก็จะต่างกัน
ค่าสัมประสิทธิ์ของการแปรผัน
เพราะวี? 30% จากนั้นประชากรจะเป็นเนื้อเดียวกัน และความแปรผันจะอ่อนแอ ผลลัพธ์ที่ได้สามารถเชื่อถือได้
ระยะเวลาการลงโทษ |
|||||||||||
1 ถึง 3 ปี |
|||||||||||
3 ถึง 5 ปี |
|||||||||||
5 ถึง 10 ปี |
|||||||||||
อายุ 10 ถึง 15 ปี |
|||||||||||
กว่า 15 ปี |
|||||||||||
ค่าสูงสุด (ฟังก์ชัน MAX) |
|||||||||||
ค่าต่ำสุด (ฟังก์ชัน MIN) |
|||||||||||
การเปลี่ยนแปลงช่วง |
|||||||||||
ค่าเฉลี่ย (ฟังก์ชัน AVERAGE) |
|||||||||||
ส่วนเบี่ยงเบนมาตรฐาน (ฟังก์ชัน STANDAR LONA) |
|||||||||||
ค่าสัมประสิทธิ์ของการแปรผัน |
ค่าเฉลี่ยง่ายๆ:
แฟชั่นความหมาย
ค่ามัธยฐาน
เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 70580 ดังนั้นค่ามัธยฐาน Me = 70580
ตัวบ่งชี้ความแปรปรวน. .
R \u003d X สูงสุด - X นาที
R = 295916-2250 = 293666.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 90895.71
การกระจายตัว
(หมายถึงข้อผิดพลาดตัวอย่าง).
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 103008 โดยเฉลี่ย 107169.83
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
เพราะ v>
หรือ
ปัจจัยการสั่น
ค่าเฉลี่ยง่ายๆ:
แฟชั่น
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 76186 ดังนั้นค่ามัธยฐาน Me = 76186
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R = X สูงสุด - X นาที
R = 291112-3101 = 288011.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นๆ โดยเฉลี่ย 83422.69
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 97334.29 โดยเฉลี่ย 100750.25
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: ค่าสัมประสิทธิ์การแกว่ง ค่าสัมประสิทธิ์เชิงเส้นการแปรผัน การเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ ค่ามากคุณลักษณะรอบค่าเฉลี่ย
ค่าเฉลี่ยง่ายๆ:
แฟชั่นความหมายที่แท้จริง. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 71093 ดังนั้นค่ามัธยฐาน Me = 71093
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R = X สูงสุด - X นาที
R = 243852-3856 = 239996.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 68998.08
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 85765.57 โดยเฉลี่ย 82541.55
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
:
แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์อันดับ: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 74588 ดังนั้นค่ามัธยฐาน Me = 74588
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R \u003d X สูงสุด - X นาที
R=242984-5304=237680.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นๆ โดยเฉลี่ย 73148.73
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 92104.14 โดยเฉลี่ย 82873.1
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
ค่าเฉลี่ยเลขคณิตอย่างง่าย:
แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 76678 ดังนั้นค่ามัธยฐาน Me = 76678
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R \u003d X สูงสุด - X นาที
R = 249346-6536 = 242810.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 79680.53
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 99551.71 โดยเฉลี่ย 87389.04
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
ค่าเฉลี่ยเลขคณิตอย่างง่าย:
แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 76461 ดังนั้นค่ามัธยฐาน Me = 76461
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R \u003d X สูงสุด - X นาที
R = 254722-6704 = 248018.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 82302.82
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 102346.71 โดยเฉลี่ย 89787.88
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
ค่าเฉลี่ยเลขคณิตอย่างง่าย:
แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 78959 ดังนั้นค่ามัธยฐาน Me = 78959
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R \u003d X สูงสุด - X นาที
R = 261334-7635 = 253699.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 83791.55
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 104898.86 โดยเฉลี่ย 91616.15
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
ค่าเฉลี่ยเลขคณิตอย่างง่าย:
แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์ที่มีช่วง: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 75916 ดังนั้นค่ามัธยฐาน Me = 75916
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R \u003d X สูงสุด - X นาที
R=263863-8145=255718.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นๆ โดยเฉลี่ย 82767.96
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 103440.71 โดยเฉลี่ย 91207.92
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
ค่าเฉลี่ยเลขคณิตอย่างง่าย:
แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์อันดับ: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 78019 ดังนั้นค่ามัธยฐาน Me = 78019
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R = X สูงสุด - X นาที
R = 260094-7798 = 252296.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 77827.76
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 99212.29 โดยเฉลี่ย 88081.39
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
ค่าเฉลี่ยเลขคณิตอย่างง่าย:
แฟชั่น. โหมดคือค่าทั่วไปของคุณลักษณะในหน่วยของประชากรที่กำหนด
ไม่มีโหมด (ค่าทั้งหมดของซีรีส์เป็นค่าส่วนบุคคล)
ค่ามัธยฐาน. ค่ามัธยฐานคือค่าของฟีเจอร์ที่แบ่งหน่วยของซีรีส์อันดับออกเป็นสองส่วน ค่ามัธยฐานสอดคล้องกับตัวเลือกที่อยู่ตรงกลางของช่วง
เราพบช่วงกลางของซีรีส์อันดับ: h = (n + 1) / 2 = (7 + 1) / 2 = 4 ตัวเลขนี้สอดคล้องกับค่าของซีรีส์ 72248 ดังนั้นค่ามัธยฐาน Me = 72248
ตัวบ่งชี้ความแปรปรวน. อัตราการเปลี่ยนแปลงสัมบูรณ์.
ช่วงของการเปลี่ยนแปลงคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของแอตทริบิวต์ของซีรี่ส์หลัก
R \u003d X สูงสุด - X นาที
R = 242137-7173 = 234964.
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย- คำนวณโดยคำนึงถึงความแตกต่างของทุกหน่วยของประชากรที่ศึกษา
แต่ละค่าของซีรีส์แตกต่างจากค่าอื่นโดยเฉลี่ย 70459.02
การกระจายตัว- ระบุลักษณะของการวัดการแพร่กระจายรอบค่าเฉลี่ย (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน(หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง)
ค่าแต่ละชุดแตกต่างจากค่าเฉลี่ย 91375.14 โดยเฉลี่ย 80674.43
การวัดสัมพัทธ์ของการแปรผัน. ตัวบ่งชี้สัมพัทธ์ของการแปรผันประกอบด้วย: สัมประสิทธิ์การแกว่ง สัมประสิทธิ์เชิงเส้นของการแปรผัน ความเบี่ยงเบนเชิงเส้นสัมพัทธ์
ค่าสัมประสิทธิ์ของการแปรผัน- การวัดการแพร่กระจายสัมพัทธ์ของค่าประชากร: แสดงสัดส่วนของค่าเฉลี่ยของปริมาณนี้คือการแพร่กระจายเฉลี่ย
ตั้งแต่ v>70% ประชากรเข้าใกล้ขอบของความหลากหลายและความแปรผันนั้นรุนแรง
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ ในกรณีนี้ ในการศึกษาเชิงปฏิบัติ วิธีการทางสถิติต่างๆ จะนำประชากรไปสู่รูปแบบที่เป็นเนื้อเดียวกัน
ค่าสัมประสิทธิ์การแปรผันเชิงเส้นหรือ ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์- แสดงลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย
ปัจจัยการสั่น- สะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดโต่งของแอตทริบิวต์รอบค่าเฉลี่ย
ภารกิจที่ 5
ในเงื่อนไขของงานก่อนหน้า ให้จัดกลุ่มช่วงของประโยคใหม่เพื่อปรับปรุงตัวบ่งชี้สัมพัทธ์ของการแปรผันของแอตทริบิวต์ในปี 2010 สร้างฮิสโตแกรมของการกระจายตัวของนักโทษตามเงื่อนไขการจำคุก (การลงโทษ) สำหรับปี 2010 ก่อนและหลังการจัดกลุ่มข้อมูลและสรุปผลเกี่ยวกับความสม่ำเสมอของโครงสร้างของคุณลักษณะทางสถิติภายใต้การศึกษา
การตัดสินใจ:
ตั้งแต่ v>30% แต่ v<70 %, то вариация умеренная.
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ
มาจัดเรียงข้อมูลใหม่ดังนี้:
กลุ่ม 1) รวมกลุ่ม: สูงสุด 1 ปี, 1 ปี, ตั้งแต่ 1-3 ปี, ตามลำดับ 156978
กลุ่ม 2) รวมจากกลุ่ม 3 ถึง 5 ปีอย่างสมบูรณ์และ 1/5 จากกลุ่ม 5 ถึง 10 ปี เราได้ 1/5 * 260094 + 168651 = 220669.8
กลุ่ม 3) รวม 3\5 กลุ่มตั้งแต่ 5 ถึง 10 เช่น 3\5*260094=156056.4
กลุ่ม 4) (1\5*260094)+(1\5*78019)=67622.6.
กลุ่ม 5) 3\5*78019=46811.4.
กลุ่ม 6 30744+(1\5*78019)=46347.8.
กราฟแท่ง. เพื่อให้ได้ข้อสรุปเกี่ยวกับความเป็นเนื้อเดียวกันของคุณลักษณะทางสถิติที่ศึกษา เราจะคำนวณค่าสัมประสิทธิ์ของการแปรผัน:
ตั้งแต่ v>30% แต่ v<70 %, то вариация умеренная.
ค่าสัมประสิทธิ์การแปรผันมากกว่า 33% ดังนั้นชุดที่พิจารณาจึงต่างกันและค่าเฉลี่ยสำหรับชุดนั้นไม่เพียงพอ
ภารกิจที่ 6
ระบุสั้น ๆ (บทคัดย่อ, ใน 1-2 หน้า) เนื้อหาและผลลัพธ์ของการศึกษาทางสถิติอย่างเป็นทางการล่าสุดในแวดวงสังคมและกฎหมาย (หัวข้อ - ที่คุณเลือก, ลิงก์ไปยังแหล่งข้อมูลอินเทอร์เน็ต - จำเป็น), สรุปผลและนำเสนอทางสถิติที่เหมาะสม สมมติฐานสำหรับมุมมองระยะสั้น
จากการศึกษาทางสถิติอย่างเป็นทางการ ได้มีการศึกษาเกี่ยวกับการค้างชำระค่าจ้าง ณ วันที่ 1 ธันวาคม 2015
ณ วันที่ 1 ธันวาคม 2015 ตามองค์กร (ไม่เกี่ยวข้องกับธุรกิจขนาดเล็ก) หนี้ทั้งหมดในแง่ของค่าจ้างสำหรับช่วงของกิจกรรมทางเศรษฐกิจที่สังเกตได้คือ 3900 ล้านรูเบิลของเธอและเมื่อเทียบกับวันที่ 1 พฤศจิกายน 2558 เพิ่มขึ้น 395 ล้านรูเบิล (เพิ่มขึ้น 11.3%)
ค้างชำระค่าจ้าง เนื่องจากไม่มีเงินทุนของตัวเองณ วันที่ 1 ธันวาคม 2558 เป็นจำนวน 3818 ล้านรูเบิลของเธอหรือคิดเป็นร้อยละ 97.9 ของยอดหนี้ค้างชำระทั้งหมด เทียบกับวันที่ 1 พฤศจิกายน 2558 เพิ่มขึ้น 389 ล้านรูเบิล (11.3%) หนี้ เนื่องจากได้รับเงินจากงบประมาณทุกระดับเกินควรเป็นจำนวน 82 ล้านรูเบิลของเธอและเพิ่มขึ้นเมื่อเทียบกับวันที่ 1 พฤศจิกายน 2558 6 ล้านรูเบิล (7.7%) รวมถึงหนี้ จากรัฐบาลกลาง งบประมาณมีจำนวน 62 ล้านรูเบิลและลดลงเมื่อเทียบกับวันที่ 1 พฤศจิกายน 2558 6 ล้านรูเบิล (8.6%) งบประมาณของอาสาสมัครของสหพันธรัฐรัสเซียมีจำนวน 1.1 ล้านรูเบิล (เพิ่มขึ้น 0.2 ล้านรูเบิลหรือ 20.7%) งบประมาณท้องถิ่น - 19 ล้านรูเบิล (เพิ่มขึ้น 12 ล้านรูเบิล หรือ 2.5 เท่า)
ในการขุด การผลิต การดูแลสุขภาพและบริการทางสังคม การประมงและการเลี้ยงปลา 100% ของค่าจ้างที่ค้างชำระเกิดจากการขาดเงินทุนขององค์กร
ในจำนวนค่าจ้างที่ค้างชำระทั้งหมด 37% ตกอยู่ที่การผลิต 29% - การก่อสร้าง 9% - การผลิตและจำหน่ายไฟฟ้า ก๊าซและน้ำ 7% - การขนส่ง 6% - การขุด 5% - เพื่อการเกษตร การล่าสัตว์ และการให้บริการในพื้นที่เหล่านี้ การตัดไม้
ปริมาณค้างชำระค่าจ้าง ณ วันที่ 1 ธันวาคม 2558 มีจำนวนน้อยกว่า 1% ของค่าจ้างรายเดือนของคนงานในกิจกรรมทางเศรษฐกิจประเภทที่สังเกตได้
ค้างค่าจ้าง สำหรับเดือนที่แล้วซึ่งมียอดคงค้างในจำนวนหนี้ที่ค้างชำระทั้งหมดโดยเฉลี่ย 29%: การผลิตและจำหน่ายไฟฟ้า ก๊าซและน้ำ - 75% กิจกรรมในด้านการศึกษา - 37% การดูแลสุขภาพและบริการสังคม - 35% การวิจัยและพัฒนาทางวิทยาศาสตร์ - 32% การก่อสร้าง - 29% การขนส่ง - 23% การผลิต - 22%
จากจำนวนค่าจ้างค้างชำระทั้งหมด หนี้ที่เกิดขึ้นในปี 2557 คิดเป็น 457 ล้านรูเบิล (11.7%) ในปี 2556 และก่อนหน้านี้ - 657 ล้านรูเบิล (16.8%)
โดยทั่วไปแล้ว การสังเกตการเปลี่ยนแปลงของค่าจ้างค้างชำระ (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif) เราสามารถสรุปได้ว่าการลดลงอย่างมีนัยสำคัญจะเกิดขึ้นใน มกราคม กุมภาพันธ์ 2559
เปอร์เซ็นต์หลักของหนี้อยู่ในอุตสาหกรรมการผลิต - 37%, 29% - ในการก่อสร้าง เป็นไปได้มากว่าเป็นผลมาจากความต้องการสินค้าของผู้บริโภคลดลง และกำไรก็ลดลงตามไปด้วย
เรามาตั้งสมมุติฐานกันดีกว่า ตั้งแต่เดือนมกราคม 2559 เปอร์เซ็นต์ของหนี้จะลดลงเนื่องจากการกระจายงบประมาณประจำปีสำหรับปีถัดไปโดยคำนึงถึงการชำระคืนค่าจ้างบางส่วนที่ค้างชำระ และจะมีจำนวน 2,700 ล้าน ค่ามัธยฐานของความผันแปรของอาชญากรรม
เพื่อทดสอบสมมติฐาน (เราใช้ตารางนี้เป็นพื้นฐาน http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif)
ให้เราสร้างอนุกรมการแปรผันแบบไม่ต่อเนื่อง ในการทำเช่นนี้ ให้เรียงลำดับซีรีส์ตามลำดับจากน้อยไปหามาก และนับจำนวนการทำซ้ำสำหรับแต่ละองค์ประกอบของซีรีส์
ลองคำนวณค่าเฉลี่ย:
ลองคำนวณความแปรปรวนกัน การกระจายตัว - แสดงลักษณะของการวัดการกระจายรอบค่าเฉลี่ยของมัน (การวัดการกระจาย เช่น การเบี่ยงเบนจากค่าเฉลี่ย)
ใช้การทดสอบแบบด้านเดียวที่มี b = 0.05 ทดสอบสมมติฐานนี้ ถ้าในกลุ่มตัวอย่าง n = 24 เดือน ค่าเฉลี่ยคือ 2741.25 และทราบความแปรปรวนและเท่ากับ y = 193469.27
การตัดสินใจ. ส่วนเบี่ยงเบนมาตรฐาน:
สมมติฐานว่าง H 0 เสนอว่าค่าของความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปเท่ากับจำนวน m 0: = 2700
สมมติฐานทางเลือก:
H 1: ม? 2700 พื้นที่วิกฤต - ทวิภาคี
ในการทดสอบสมมติฐานว่าง จะใช้ตัวแปรสุ่ม:
โดยที่ x คือค่าเฉลี่ยตัวอย่าง S คือค่าเบี่ยงเบนมาตรฐานของประชากรทั่วไป
ถ้าสมมติฐานว่างเป็นจริง แสดงว่าตัวแปรสุ่ม T มีการแจกแจงแบบปกติมาตรฐาน ค่าวิกฤตของสถิติ T พิจารณาจากประเภทของสมมติฐานทางเลือก:
พี(|T| ให้เราหาค่าการทดลองของสถิติ T: เนื่องจากขนาดตัวอย่างค่อนข้างใหญ่ (n>30) แทนที่จะใช้ค่าจริงของส่วนเบี่ยงเบนมาตรฐาน คุณจึงใช้ค่าประมาณ S=439.851 ได้ F (t cr) \u003d (1-b) / 2 \u003d (1-0.05) / 2 \u003d 0.475. ตามตารางฟังก์ชัน Laplace เราพบว่าค่า t kp คืออะไร Ф (t kp) = 0.475 ค่าการทดลองของเกณฑ์ T ไม่ได้อยู่ในขอบเขตวิกฤต T ? t kp ดังนั้นควรยอมรับสมมติฐานว่าง ค่าของความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปสามารถรับได้เท่ากับ 2,700
บรรณานุกรม 1. Kazantsev S.Ya. กฎหมายสถิติ: ตำรา / เอ็ด. ส.ยา Kazantseva, S.Ya. Lebedeva - M.: UNITY-DANA: กฎหมายและกฎหมาย 2552 2. Kurys ใน K.N. พื้นฐานกฎหมายสถิติ: หนังสือเรียน. เบี้ยเลี้ยง / ก.น. คูรีส ใน; VUI FPS ของรัสเซีย - วลาดิเมียร์ 2548 - 44 หน้า 3. มาคาโรว่า เอ็น.วี. สถิติใน Excel: หนังสือเรียน. เบี้ยเลี้ยง / N.V. Makarova, V.Ya. โทรฟิเมตส์ - ม.: การเงินและสถิติ. 4. Kondratyuk L.V., Ovchinsky VS. มิติทางอาชญาวิทยา / บรรณาธิการ. เค.เค. กอร์ยานอฟ - ม.: นอร์มา, 2551. 5. ยาโคฟเลฟ V.B. สถิติ. การคำนวณใน Microsoft Excel: หนังสือเรียน คู่มือสำหรับมหาวิทยาลัย / ว.บ. ยาโคฟเลฟ. - ม.: Kolos, 2548. - 352 น. โฮสต์บน Allbest.ru การศึกษาการกระทำผิดของเด็กและเยาวชนในมุมมองของเป้าหมายของการวิจัยทางอาชญาวิทยา ความสัมพันธ์ระหว่างโรคพิษสุราเรื้อรังในวัยรุ่น การใช้สารเสพติด การติดยาเสพติด และอาชญากรรม สาเหตุ เงื่อนไข และแนวทางป้องกันปัญหาการกระทำผิดของเด็กและเยาวชน ภาคนิพนธ์ เพิ่ม 04/08/2011 ระเบียบวิธีวิจัยทางอาชญาวิทยาเฉพาะทาง ลักษณะทางอาชญาวิทยาของอาชญากรรมรุนแรงและการป้องกัน ภัยสาธารณะและความรุนแรงของผลของอาชญากรรมรุนแรง. สถิติอาชญากรรม. ทดสอบ เพิ่ม 01/15/2011 สูตรคำนวณอัตราการก่ออาชญากรรม การคำนวณภาระงานเฉลี่ยต่อปีต่อผู้พิพากษา, ระยะเวลาเฉลี่ยของการสอบสวนคดีอาญา, อัตราการเติบโตเฉลี่ยต่อปีของอาชญากรรม การคำนวณตัวบ่งชี้โหมด มัธยฐาน การแปรผัน และส่วนเบี่ยงเบนมาตรฐาน ทดสอบเพิ่ม 04/20/2011 การศึกษารากฐานของอาชญากรรมรับจ้าง: แนวคิด องค์ประกอบ วัตถุ และอัตวิสัย คำอธิบายของการป้องกันอาชญากรรมทางสังคมและอาชญากรพิเศษจากแรงจูงใจของทหารรับจ้าง การพัฒนาชุดมาตรการป้องกันอาชญากรรม วิทยานิพนธ์, เพิ่ม 11/09/2012 แนวคิดและหัวเรื่องของการพยากรณ์อาชญาวิทยา. สร้างการเปลี่ยนแปลงที่เป็นไปได้ในสถานะ ระดับ โครงสร้าง และพลวัตของอาชญากรรมในอนาคต การประเมินพัฒนาการของอาชญากรรมในอนาคต การวางแผนควบคุมและป้องกันอาชญากรรม ภาคนิพนธ์ เพิ่ม 05/29/2015 ศึกษาประเภทของการพยากรณ์และการออกแบบอาชญากรในด้านอาชญากร คุณลักษณะของการพยากรณ์การกระทำผิดของเด็กและเยาวชนในสาธารณรัฐคาซัคสถาน การพัฒนาโครงการต่อต้านอาชญากรรมในระดับชาติ วิทยานิพนธ์, เพิ่ม 10/25/2015 การกระทำผิดของเด็กและเยาวชนเป็นเป้าหมายของการวิจัยทางอาชญาวิทยา ลักษณะพื้นฐานทางอาชญาวิทยาของการกระทำผิดของเด็กและเยาวชน สถานะของอาชญากรรม คุณสมบัติของลักษณะส่วนบุคคลของผู้เยาว์ บทคัดย่อ เพิ่ม 04/01/2003 แนวโน้มพฤติกรรมอาชญากรของผู้หญิงยุคใหม่: การเติบโตและสัดส่วนที่คงที่ของอาชญากรรมร้ายแรงและการกระทำผิดซ้ำ การฟื้นฟูของอาชญากร และการเพิ่มจำนวนของผู้หญิงสูงอายุในกลุ่มนักโทษ มาตรการทั่วไปในการป้องกันอาชญากรรมหญิง บทคัดย่อ เพิ่ม 03/01/2014 การคำนวณตัวบ่งชี้สัมพัทธ์ของโครงสร้างและการประสานงานของประเภทนักโทษตามความรุนแรงของอาชญากรรมที่ก่อขึ้น อัตราอาชญากรรมและประวัติอาชญากรรมตามเขตของรัฐบาลกลางและรัสเซียโดยรวม การคำนวณตัวบ่งชี้ไดนามิกโดยใช้ MS Excel ทดสอบเพิ่ม 07/31/2011 แนวคิด ประเภท ความหมาย ตัวกำหนดของอาชญากรรมแฝง สาเหตุ วิธีการป้องกันและลด การกำหนดระดับและการวิเคราะห์โครงสร้างอาชญากรรม แนวทางการศึกษาอาชญากรรมแฝงที่เป็นปรากฏการณ์ทางสังคมอย่างเป็นระบบ
นามธรรม ค่าเฉลี่ยและตัวบ่งชี้ความแปรปรวน 1. สาระสำคัญของค่าเฉลี่ยในสถิติ 2. ประเภทของค่าเฉลี่ยและวิธีการคำนวณ 3. ตัวบ่งชี้หลักของความแปรปรวนและความสำคัญในสถิติ 1. สาระสำคัญของน้ำหนักเฉลี่ยใบหน้าในสถิติ ในกระบวนการศึกษาปรากฏการณ์ทางเศรษฐกิจและสังคมจำนวนมาก จำเป็นต้องระบุคุณสมบัติทั่วไป ขนาดทั่วไป และลักษณะเฉพาะ ความต้องการค่าเฉลี่ยทั่วไปเกิดขึ้นเมื่อลักษณะเฉพาะของหน่วยของประชากรที่ศึกษาแตกต่างกันในเชิงปริมาณ ตัวอย่างเช่น ปริมาณผลผลิตต่อวันของช่างทอในโรงงานสิ่งทอขึ้นอยู่กับสภาวะทั่วไปของการผลิต ช่างทอใช้วัตถุดิบเดียวกัน ทำงานบนเครื่องจักรเดียวกัน เป็นต้น ในขณะเดียวกัน ผลผลิตรายชั่วโมงของช่างทอแต่ละคนจะผันผวน แตกต่างกันไปเนื่องจากขึ้นอยู่กับลักษณะเฉพาะของช่างทอแต่ละคน (คุณสมบัติ ประสบการณ์วิชาชีพ ฯลฯ) ในการระบุลักษณะผลผลิตรายวันของช่างทอผ้าทั้งหมดขององค์กร จำเป็นต้องคำนวณผลผลิตเฉลี่ยต่อวัน เนื่องจากเฉพาะในตัวบ่งชี้นี้เท่านั้น เงื่อนไขทั่วไปของการผลิตสำหรับช่างทอจะสะท้อนให้เห็น ดังนั้น การคำนวณตัวบ่งชี้ทั่วไปเฉลี่ยหมายถึงการเบี่ยงเบนความสนใจ (สิ่งที่เป็นนามธรรม) จากคุณลักษณะที่สะท้อนในขนาดของคุณลักษณะในแต่ละหน่วย และการระบุคุณลักษณะทั่วไปและคุณสมบัติที่เหมือนกันในชุดที่กำหนด ดังนั้น ค่าเฉลี่ยในสถิติจึงเป็นลักษณะทั่วไปเชิงปริมาณของเครื่องหมายและประชากรทางสถิติ เป็นการแสดงออกถึงลักษณะค่าทั่วไปของลักษณะในหน่วยของประชากรซึ่งเกิดขึ้นภายใต้เงื่อนไขของสถานที่และเวลาที่กำหนดภายใต้อิทธิพลของปัจจัยทั้งหมด การกระทำของปัจจัยต่างๆ ทำให้เกิดความผันผวน แปรผันของคุณลักษณะค่าเฉลี่ย ค่าเฉลี่ยเป็นตัววัดทั่วไปของการกระทำของพวกเขา ซึ่งเป็นผลมาจากปัจจัยเหล่านี้ทั้งหมด ค่าเฉลี่ยแสดงลักษณะของประชากรตามแอตทริบิวต์ของค่าเฉลี่ย แต่หมายถึงหน่วยของประชากร ตัวอย่างเช่น ผลผลิตเฉลี่ยต่อผู้ปฏิบัติงานขององค์กรที่กำหนดคืออัตราส่วนของผลผลิตทั้งหมด (สำหรับช่วงเวลาใดๆ) ต่อจำนวนคนงานทั้งหมด (โดยเฉลี่ยสำหรับช่วงเวลาเดียวกัน) มันแสดงลักษณะผลิตภาพแรงงานของจำนวนรวมที่กำหนด แต่หมายถึงคนงานคนเดียว ในค่าเฉลี่ยของปรากฏการณ์มวลความแตกต่างระหว่างบุคคลในหน่วยของประชากรทางสถิติในค่าของแอตทริบิวต์เฉลี่ยจะถูกยกเลิกเนื่องจากสถานการณ์สุ่ม ผลที่ตามมาของการยกเลิกร่วมกันนี้ คุณสมบัติทางธรรมชาติโดยทั่วไปของจำนวนรวมของปรากฏการณ์ทางสถิติที่กำหนดจะแสดงออกมาในค่าเฉลี่ย มีการเชื่อมต่อแบบวิภาษวิธีระหว่างค่าเฉลี่ยและค่าแต่ละค่าของแอตทริบิวต์เฉลี่ย เช่น ระหว่างค่าทั่วไปและค่าแต่ละค่า ค่าเฉลี่ยเป็นหมวดหมู่ที่สำคัญที่สุดของวิทยาศาสตร์ทางสถิติและเป็นรูปแบบที่สำคัญที่สุดของตัวบ่งชี้ทั่วไป ปรากฏการณ์ต่างๆ ของชีวิตทางสังคมจะชัดเจนและแน่นอนก็ต่อเมื่อมันถูกสรุปให้อยู่ในรูปของค่าเฉลี่ยเท่านั้น ตัวอย่างเช่นผลผลิตของแรงงานที่กล่าวถึงข้างต้น จำนวนแรงงานทั้งหมด ผลผลิตของพืชผลทางการเกษตร เป็นต้น ค่าเฉลี่ยเป็นวิธีการที่สำคัญที่สุดในการสรุปทางวิทยาศาสตร์ในสถิติ ในแง่นี้ เราพูดถึงวิธีการหาค่าเฉลี่ยซึ่งใช้กันอย่างแพร่หลายในทางเศรษฐศาสตร์ วิทยาศาสตร์เศรษฐศาสตร์หลายประเภทถูกกำหนดโดยใช้แนวคิดของค่าเฉลี่ย เงื่อนไขหลักสำหรับการใช้ค่าเฉลี่ยที่ถูกต้องคือความสม่ำเสมอของประชากรทางสถิติตามแอตทริบิวต์ค่าเฉลี่ย จำนวนทั้งสิ้นทางสถิติที่เป็นเนื้อเดียวกันคือจำนวนทั้งสิ้นที่องค์ประกอบ (หน่วย) ขององค์ประกอบนั้นคล้ายคลึงกันในแง่ของคุณสมบัติที่จำเป็นสำหรับการศึกษานี้และอยู่ในปรากฏการณ์ประเภทเดียวกัน ประชากรที่เป็นเนื้อเดียวกัน ซึ่งมีความเหมือนกันในบางประการ อาจแตกต่างกันในประการอื่นๆ เฉพาะในค่าเฉลี่ยสำหรับการรวมดังกล่าวเท่านั้นที่มีคุณลักษณะเฉพาะรูปแบบการพัฒนาของปรากฏการณ์ที่วิเคราะห์ ค่าเฉลี่ยที่คำนวณสำหรับประชากรทางสถิติที่แตกต่างกัน เช่น หนึ่งซึ่งปรากฏการณ์ที่แตกต่างกันในเชิงคุณภาพรวมกันจะสูญเสียความสำคัญทางวิทยาศาสตร์ไป ค่าเฉลี่ยดังกล่าวเป็นเรื่องโกหก ไม่เพียง แต่ไม่ให้แนวคิดเกี่ยวกับความเป็นจริงเท่านั้น แต่ยังบิดเบือนอีกด้วย สำหรับการก่อตัวของมวลรวมทางสถิติที่เป็นเนื้อเดียวกันจะดำเนินการจัดกลุ่มที่เหมาะสม ด้วยความช่วยเหลือของการจัดกลุ่มและในชุดที่เป็นเนื้อเดียวกันในเชิงคุณภาพสามารถแยกแยะกลุ่มที่มีลักษณะเชิงปริมาณได้ สำหรับแต่ละค่าเฉลี่ยสามารถคำนวณได้เองเรียกว่าค่าเฉลี่ยกลุ่ม (ส่วนตัว) ตรงกันข้ามกับค่าเฉลี่ยทั่วไป (สำหรับประชากรโดยรวม) 2. ประเภทของค่าเฉลี่ย สิ่งที่สำคัญอย่างยิ่งในวิธีการเฉลี่ยคือคำถามของการเลือกรูปแบบของค่าเฉลี่ย เช่น สูตรที่คุณสามารถคำนวณค่าเฉลี่ยได้อย่างถูกต้องและเลือกน้ำหนักเฉลี่ย ใช้มากที่สุดในสถิติ ค่าเฉลี่ยรวม ค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยฮาร์มอนิก ค่าเฉลี่ยเรขาคณิต รูทค่าเฉลี่ยกำลังสอง โหมด และค่ามัธยฐานการใช้สูตรเฉพาะขึ้นอยู่กับเนื้อหาของคุณลักษณะเฉลี่ยและข้อมูลเฉพาะที่ต้องคำนวณ หากต้องการเลือกรูปแบบของค่าเฉลี่ย คุณสามารถใช้อัตราส่วนเริ่มต้นเฉลี่ยที่เรียกว่า 2.1
ค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยเลขคณิตเป็นหนึ่งในรูปแบบทั่วไปของค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตคำนวณเป็นผลหารของการหารผลรวมของแต่ละค่า (ตัวเลือก) ของการแปรผัน ลงชื่อเข้าใช้หมายเลขของพวกเขาค่าเฉลี่ยเลขคณิตใช้ในกรณีที่ปริมาณของแอตทริบิวต์ตัวแปรของปรากฏการณ์ของประชากรทางสถิติที่เป็นเนื้อเดียวกันนั้นเกิดจากการรวมค่าของแอตทริบิวต์ของหน่วยปรากฏการณ์ทั้งหมดในประชากรทางสถิติ มีค่าเฉลี่ยเลขคณิตดังต่อไปนี้: 1) ค่าเฉลี่ยเลขคณิตอย่างง่ายซึ่งถูกกำหนดโดยการสรุปค่าเชิงปริมาณของแอตทริบิวต์ที่แตกต่างกันและหารผลรวมนี้ด้วยตัวแปรและคำนวณโดยใช้สูตรต่อไปนี้: X - ค่าเฉลี่ยของประชากรทางสถิติ x ผม - ผลรวมของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ n ผม - จำนวนตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ 2) ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก- ค่าเฉลี่ยของเครื่องหมายของปรากฏการณ์ คำนวณโดยคำนึงถึงน้ำหนัก น้ำหนักของค่าเฉลี่ยคือความถี่ที่คำนึงถึงค่าแต่ละค่าของคุณลักษณะเฉลี่ยเมื่อคำนวณค่าเฉลี่ย การเลือกน้ำหนักสำหรับค่าเฉลี่ยขึ้นอยู่กับลักษณะของค่าเฉลี่ยและลักษณะของข้อมูลที่มีในการคำนวณค่าเฉลี่ย ในฐานะที่เป็นน้ำหนักของค่าเฉลี่ย อาจมีตัวบ่งชี้จำนวนหน่วยหรือขนาดของส่วนต่างๆ ของประชากรทางสถิติ (ในรูปของค่าสัมบูรณ์หรือค่าสัมพัทธ์) ที่มีตัวแปร (ค่า) ที่กำหนดของคุณลักษณะค่าเฉลี่ยของปรากฏการณ์ของ ประชากรทางสถิติ ตลอดจนค่าของตัวบ่งชี้ที่เกี่ยวข้องกับคุณลักษณะค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักคำนวณโดยใช้สูตรต่อไปนี้: X- ค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต x - ค่าของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ จุดประสงค์ของค่าเฉลี่ยเลขคณิตแบบง่ายและถ่วงน้ำหนักคือการกำหนดค่าเฉลี่ยของแอตทริบิวต์ตัวแปร หากในประชากรทางสถิติที่ศึกษาตัวแปรของค่าแอตทริบิวต์เกิดขึ้นครั้งเดียวหรือมีน้ำหนักเท่ากันก็จะใช้ค่าเฉลี่ยเลขคณิตอย่างง่าย แต่ถ้าตัวแปรของค่าของแอตทริบิวต์นี้เกิดขึ้นหลายครั้งใน ประชากรที่ศึกษาหรือมีน้ำหนักต่างกันจะใช้ค่าเฉลี่ยเลขคณิตเพื่อกำหนดค่าเฉลี่ยของแอตทริบิวต์ตัวแปร ถ่วงน้ำหนัก 2.2
ฮาร์มอนิกเฉลี่ย ค่าเฉลี่ยฮาร์มอนิกใช้ในการคำนวณค่าเฉลี่ยเมื่อไม่มีข้อมูลโดยตรงเกี่ยวกับน้ำหนัก แต่ตัวแปรของคุณสมบัติเฉลี่ย (x) และผลคูณของค่าตัวเลือกตามจำนวนหน่วยที่มีค่านี้ w (w = xf) เป็นที่รู้จัก ค่าเฉลี่ยนี้คำนวณโดยใช้สูตรต่อไปนี้: 1.) ฮาร์มอนิกเฉลี่ยอย่างง่าย: X - ฮาร์มอนิกอย่างง่าย n - จำนวนตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ 2) ฮาร์มอนิกเฉลี่ยถ่วงน้ำหนัก: X - ค่าเฉลี่ยถ่วงน้ำหนักแบบฮาร์มอนิก x - ผลรวมของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ เมื่อใช้ฮาร์มอนิกถ่วงน้ำหนัก น้ำหนักจะถูกระบุและทำให้ได้ผลลัพธ์เดียวกันซึ่งจะให้การคำนวณค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักหากทราบข้อมูลทั้งหมดที่จำเป็นสำหรับสิ่งนี้ 2.3
รวมเฉลี่ย การรวมค่าเฉลี่ยคำนวณโดยสูตร: X - ผลรวมเฉลี่ย x - ผลรวมของตัวแปรที่แตกต่างกันของปรากฏการณ์ของประชากรทางสถิติ ค่าเฉลี่ยรวมจะคำนวณในกรณีที่ทราบค่าของตัวเศษและตัวส่วนของอัตราส่วนเริ่มต้นของค่าเฉลี่ย (มี) 2.4 ค่าเฉลี่ยเรขาคณิต ค่าเฉลี่ยทางเรขาคณิตเป็นหนึ่งในรูปแบบของค่าเฉลี่ยและคำนวณเป็นรากของระดับที่ n จากผลคูณของแต่ละค่า - ตัวแปรของแอตทริบิวต์ (x) และกำหนดโดยสูตรต่อไปนี้: ค่าเฉลี่ยทางเรขาคณิตส่วนใหญ่จะใช้ในการคำนวณอัตราการเติบโตเฉลี่ย 2.5
โหมดและค่ามัธยฐาน พร้อมกับค่าเฉลี่ยที่พิจารณาข้างต้น สิ่งที่เรียกว่า ค่าเฉลี่ยโครงสร้าง - โหมดและค่ามัธยฐาน โหมด (Mo) เป็นค่าที่เกิดขึ้นบ่อยที่สุดของคุณลักษณะในหน่วยประชากร. สำหรับซีรีส์แบบไม่ต่อเนื่อง ตัวเลือกนี้มีความถี่สูงสุด ในซีรีส์การแปรผันของช่วงเวลา อันดับแรกสามารถกำหนดช่วงเวลาที่โหมดตั้งอยู่ได้ เช่น ช่วงเวลาโมดอลที่เรียกว่า ในอนุกรมแปรผันที่มีช่วงเท่ากัน ช่วงโมดอลถูกกำหนดโดยความถี่สูงสุด ในอนุกรมที่มีช่วงไม่เท่ากัน โดยความหนาแน่นของการกระจายสูงสุด เมื่อต้องการกำหนดโหมดในแถวที่มีช่วงเวลาเท่ากัน ให้ใช้สูตรของแบบฟอร์มต่อไปนี้: Хн - ขีด จำกัด ล่างของช่วงเวลาโมดอล h - ค่าช่วงเวลา ฉ 1 , ฉ 2 , ฉ 3 - ความถี่ (หรือรายละเอียด) ของช่วงก่อนโมดอล โมดอล และหลังโมดอล ตามลำดับ ในซีรีย์ช่วงเวลา โหมดสามารถพบได้ในรูปแบบกราฟิก ในการทำเช่นนี้ เส้นสองเส้นจะดึงออกมาจากขอบเขตของสองคอลัมน์ที่อยู่ติดกันในคอลัมน์สูงสุดของฮิสโตแกรม จากนั้นจากจุดตัดกันตั้งฉากจะลดลงไปที่แกน abscissa ค่าคุณลักษณะบน abscissa ที่สอดคล้องกับแนวตั้งฉากจะเป็นโหมด ในหลายกรณี เมื่อระบุลักษณะของประชากรเป็นตัวบ่งชี้ทั่วไป การตั้งค่าจะถูกกำหนดให้กับฐานนิยมมากกว่าค่าเฉลี่ยเลขคณิต ดังนั้นเมื่อศึกษาราคาในตลาด จึงไม่ใช่ราคาเฉลี่ยสำหรับผลิตภัณฑ์บางอย่างที่ได้รับการแก้ไขและศึกษาในไดนามิก แต่เป็นราคาโมดอล เมื่อศึกษาความต้องการของประชากรสำหรับรองเท้าหรือเสื้อผ้าบางขนาด มันเป็นเรื่องที่น่าสนใจที่จะกำหนดขนาดรองเท้าแบบโมดัล และขนาดเฉลี่ยเช่นนี้ไม่สำคัญเลย แฟชั่นไม่ได้เป็นเพียงความสนใจที่เป็นอิสระเท่านั้น แต่ยังมีบทบาทเป็นตัวบ่งชี้เสริมในค่าเฉลี่ยซึ่งแสดงถึงลักษณะเฉพาะของมัน หากค่าเฉลี่ยเลขคณิตมีค่าใกล้เคียงกับฐานนิยม แสดงว่าเป็นเรื่องปกติ ค่ามัธยฐาน (Me) คือค่าของคุณสมบัติในหน่วยกลางของซีรีส์อันดับ (ชุดอันดับคือชุดที่เขียนค่าแอตทริบิวต์โดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปน้อย) หากต้องการหาค่ามัธยฐาน อันดับแรกจะกำหนดหมายเลขซีเรียล ในการทำเช่นนี้ ด้วยจำนวนหน่วยคี่ หนึ่งจะถูกบวกเข้ากับผลรวมของความถี่ทั้งหมด และทุกอย่างจะถูกหารด้วยสอง หากจำนวนหน่วยเป็นเลขคู่ จะมีหน่วยกลางสองหน่วยในซีรีส์ และตามกฎทั้งหมด ค่ามัธยฐานควรถูกกำหนดเป็นค่าเฉลี่ยของค่าของหน่วยทั้งสองนี้ ในเวลาเดียวกัน ในทางปฏิบัติด้วยจำนวนหน่วยที่เท่ากัน ค่ามัธยฐานจะถูกพบว่าเป็นค่าของแอตทริบิวต์ของหน่วย จำนวนลำดับที่กำหนดโดยผลรวมของความถี่หารด้วยสอง เมื่อทราบเลขลำดับของค่ามัธยฐานแล้ว การหาค่าจากความถี่สะสมจึงเป็นเรื่องง่าย ในอนุกรมช่วงเวลา หลังจากกำหนดเลขลำดับของค่ามัธยฐานโดยความถี่สะสม (โดยเฉพาะ) แล้วจะพบช่วงค่ามัธยฐาน จากนั้นใช้เทคนิคการแก้ไขที่ง่ายที่สุด ค่าของค่ามัธยฐานจะถูกกำหนด การคำนวณนี้แสดงโดยสูตรต่อไปนี้: Xn - ขีด จำกัด ล่างของช่วงเวลามัธยฐาน ชั่วโมง - ค่าของช่วงเวลามัธยฐาน เลขลำดับของค่ามัธยฐาน S Me - 1 ความถี่ (ความถี่) สะสมจนถึงช่วงมัธยฐาน F Me - ความถี่ (โดยเฉพาะ) ของช่วงมัธยฐาน ตามสูตรที่เป็นลายลักษณ์อักษร ที่ขอบเขตล่างของช่วงเวลามัธยฐาน ส่วนหนึ่งของค่าช่วงเวลาดังกล่าวจะถูกเพิ่มเข้าไปในเศษส่วนของหน่วยของกลุ่มนี้ซึ่งขาดหายไปจากเลขลำดับของค่ามัธยฐาน กล่าวอีกนัยหนึ่ง การคำนวณค่ามัธยฐานตั้งอยู่บนสมมติฐานที่ว่าการเติบโตของคุณลักษณะระหว่างหน่วยของแต่ละกลุ่มเกิดขึ้นเท่าๆ กัน จากที่ได้กล่าวไว้ ค่ามัธยฐานสามารถคำนวณได้อีกทางหนึ่ง เมื่อพิจารณาช่วงเวลามัธยฐานแล้ว คุณสามารถลบออกจากขีดจำกัดบนของช่วงเวลามัธยฐาน (Xv) ซึ่งเป็นส่วนหนึ่งของช่วงเวลาที่ตรงกับเศษส่วนของหน่วยที่เกินจำนวนลำดับของค่ามัธยฐาน เช่น ตามสูตรต่อไปนี้: ค่ามัธยฐานยังสามารถกำหนดได้แบบกราฟิก เมื่อต้องการทำเช่นนี้ สะสมจะถูกสร้างขึ้นและจากจุดบนสเกลของความถี่สะสม (เฉพาะ) ที่สอดคล้องกับเลขลำดับของค่ามัธยฐาน เส้นตรงจะถูกลากขนานกับแกน x จนกว่าจะตัดกับค่ามัธยฐาน จากนั้นจากจุดตัดของเส้นตรงที่ระบุกับจุดสะสม เส้นตั้งฉากจะลดลงไปที่แกน abscissa ค่าของจุดสนใจบนแกน x ที่สอดคล้องกับพิกัดที่วาด (ตั้งฉาก) จะเป็นค่ามัธยฐาน ด้วยหลักการเดียวกัน มันเป็นเรื่องง่ายที่จะหาค่าของคุณสมบัติสำหรับหน่วยใด ๆ ของซีรีส์อันดับ ดังนั้น ตัวบ่งชี้ทั้งชุดสามารถใช้ในการคำนวณค่าเฉลี่ยของชุดการเปลี่ยนแปลงได้ 3. ตัวบ่งชี้หลักของ variและความสำคัญในทางสถิติ เมื่อศึกษาลักษณะที่ผันแปรในหน่วยของประชากร เราไม่สามารถจำกัดตัวเองให้คำนวณเฉพาะค่าเฉลี่ยจากตัวแปรแต่ละตัวได้ เนื่องจากค่าเฉลี่ยที่เหมือนกันอาจหมายถึงประชากรที่ห่างไกลจากองค์ประกอบที่เหมือนกัน สามารถแสดงได้ด้วยตัวอย่างตามเงื่อนไขต่อไปนี้ ซึ่งสะท้อนข้อมูลเกี่ยวกับจำนวนครัวเรือนในกิจการเกษตรของสองอำเภอ: จำนวนครัวเรือนโดยเฉลี่ยในฟาร์มของทั้งสองเขตเท่ากันคือ 160 ครัวเรือน ในขณะเดียวกัน องค์ประกอบของฟาร์มเหล่านี้ในสองเขตก็ห่างไกลจากความเหมือนกัน ดังนั้นจึงจำเป็นต้องวัดความแปรผันของลักษณะเฉพาะในประชากร เพื่อจุดประสงค์นี้ มีการคำนวณคุณสมบัติจำนวนหนึ่งในสถิติ เช่น ตัวชี้วัด ตัวบ่งชี้พื้นฐานที่สุดของการเปลี่ยนแปลงของลักษณะคือ ช่วงของการเปลี่ยนแปลง รซึ่งเป็นความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของลักษณะในชุดรูปแบบนี้ เช่น R = Xmax - X นาที ในตัวอย่างของเรา ในพื้นที่ที่ 1 R = 300 - 80 - 220 และในพื้นที่ที่สอง R = 180 - 145 = 35 ตัวบ่งชี้ช่วงของการเปลี่ยนแปลงไม่สามารถใช้งานได้เสมอไป เนื่องจากจะพิจารณาเฉพาะค่าสูงสุดของลักษณะซึ่งอาจแตกต่างอย่างมากจากหน่วยอื่นๆ ทั้งหมด บางครั้งพวกเขาพบอัตราส่วนของช่วงของการแปรผันต่อค่าเฉลี่ยเลขคณิตและใช้ค่านี้เรียกมันว่าตัวบ่งชี้ การสั่น อย่างแม่นยำยิ่งขึ้น คุณสามารถระบุความผันแปรในชุดข้อมูลได้โดยใช้ตัวบ่งชี้ที่พิจารณาความเบี่ยงเบนของตัวเลือกทั้งหมดจากค่าเฉลี่ยเลขคณิต มีตัวบ่งชี้ดังกล่าวสองตัวในสถิติ - ค่าเฉลี่ยเชิงเส้นและค่าเฉลี่ยส่วนเบี่ยงเบนกำลังสอง ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ยแสดงถึงค่าเฉลี่ยเลขคณิตของค่าสัมบูรณ์ของการเบี่ยงเบนของตัวแปรจากค่าเฉลี่ย เครื่องหมายเบี่ยงเบนจะถูกละเว้นในกรณีนี้ มิฉะนั้น ผลรวมของการเบี่ยงเบนทั้งหมดจะเท่ากับศูนย์ ตัวบ่งชี้นี้คำนวณโดยสูตร: b) สำหรับชุดการเปลี่ยนแปลง: โปรดทราบว่าค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจะน้อยที่สุดหากคำนวณค่าเบี่ยงเบนจากค่ามัธยฐาน เช่น ตามสูตร: ส่วนเบี่ยงเบนมาตรฐาน ()
มีการคำนวณดังนี้ - แต่ละส่วนเบี่ยงเบนจากค่าเฉลี่ยจะยกกำลังสอง กำลังสองทั้งหมดจะรวมกัน (โดยคำนึงถึงน้ำหนัก) หลังจากนั้นผลรวมของกำลังสองจะถูกหารด้วยจำนวนสมาชิกของซีรีส์ และรากที่สองจะถูกแยกออกจากผลหาร การกระทำทั้งหมดนี้แสดงโดยสูตรต่อไปนี้: ก) สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม: b) สำหรับชุดการเปลี่ยนแปลง: ฉ เช่น ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของค่าเฉลี่ยเลขคณิตของส่วนเบี่ยงเบนกำลังสองของค่าเฉลี่ย การแสดงออกภายใต้รากเรียกว่าความแปรปรวน การกระจายตัวมีการแสดงออกที่เป็นอิสระทางสถิติและเป็นตัวบ่งชี้ที่สำคัญที่สุดอย่างหนึ่งของความแปรผันเอกสารที่คล้ายกัน
โดยที่ - ตามลำดับ ค่าสูงสุดและต่ำสุดของแอตทริบิวต์ในการรวม
คือจำนวนกลุ่ม
ชุดการแจกจ่ายสามารถมองเห็นได้โดยใช้การแสดงกราฟิก ด้วยเหตุนี้จึงมีการสร้างรูปหลายเหลี่ยม ฮิสโตแกรม เส้นโค้งสะสม และโอกีฟ
ธีม 4ค่าสัมบูรณ์และสัมพัทธ์
แนวคิดของตัวบ่งชี้ทางสถิติและประเภทของมัน
สถิติ- นี่คือลักษณะทั่วไปเชิงปริมาณและเชิงคุณภาพของคุณสมบัติบางอย่างของกลุ่มหน่วยหรือโดยรวมในเงื่อนไขเฉพาะของสถานที่และเวลา ตัวบ่งชี้ทางสถิติจะได้รับจากการคำนวณซึ่งแตกต่างจากลักษณะเฉพาะ นี่อาจเป็นการนับหน่วยประชากรอย่างง่าย การรวมค่าแอตทริบิวต์ การเปรียบเทียบค่าตั้งแต่สองค่าขึ้นไป การเปรียบเทียบที่ซับซ้อนมากขึ้น
1. ตามความครอบคลุมของหน่วยประชากร ตัวชี้วัดทางสถิติแบ่งย่อย:
2. ตามวิธีการคำนวณ ตัวบ่งชี้ทางสถิติแบ่งออกเป็น:
3. ตามความแน่นอนเชิงพื้นที่ ตัวชี้วัดทางสถิติแบ่งออกเป็น:
ตามรูปแบบของนิพจน์ ตัวบ่งชี้ทางสถิติแบ่งออกเป็น:
ค่าสัมบูรณ์
ค่าสัมบูรณ์ (ตัวบ่งชี้)- เป็นตัวเลขที่แสดงขนาด ปริมาณ ของปรากฏการณ์ในเงื่อนไขเฉพาะของสถานที่และเวลา ค่าสัมบูรณ์มักจะตั้งชื่อค่านั่นคือมีหน่วยการวัด ขึ้นอยู่กับหน่วยวัดที่เลือก ประเภทของค่าสัมบูรณ์:
1. เป็นธรรมชาติ- บอกลักษณะของปริมาตรและขนาดของปรากฏการณ์ในรูปของความยาว น้ำหนัก ปริมาตร จำนวนหน่วย จำนวนเหตุการณ์ ตัวบ่งชี้ตามธรรมชาติใช้เพื่อระบุลักษณะปริมาตร ขนาดของผลิตภัณฑ์แต่ละประเภทที่มีชื่อเดียวกัน ดังนั้นการใช้จึงถูกจำกัด
2. เป็นธรรมชาติตามเงื่อนไข- ใช้ในกรณีที่จำเป็นต้องถ่ายโอนผลิตภัณฑ์ประเภทต่างๆ แต่มีมูลค่าเท่ากันไปยังตัวบ่งชี้ที่มีเงื่อนไขเดียว ตัวบ่งชี้ธรรมชาติตามเงื่อนไขคำนวณโดยการคูณตัวบ่งชี้ธรรมชาติด้วยค่าสัมประสิทธิ์การแปลง (การคำนวณใหม่) ค่าสัมประสิทธิ์การแปลงนำมาจากไดเร็กทอรีหรือคำนวณโดยอิสระ ตัวบ่งชี้ตามธรรมชาติแบบมีเงื่อนไขใช้เพื่อระบุลักษณะปริมาตร ขนาดของผลิตภัณฑ์ที่เป็นเนื้อเดียวกัน ดังนั้นการใช้งานจึงถูกจำกัด
3. แรงงาน- มีหน่วยวัดเช่น ชั่วโมงทำงาน วันทำงาน ใช้ในการกำหนดต้นทุนเวลาทำงาน คำนวณค่าจ้าง และผลิตภาพแรงงาน
4. ค่าใช้จ่าย(สากล) วัดเป็นสกุลเงินของประเทศนั้นๆ ตัวบ่งชี้ต้นทุน = ปริมาณของผลิตภัณฑ์ในแง่กายภาพ * ราคาต่อหน่วยการผลิต ตัวบ่งชี้ต้นทุนเป็นแบบสากลเนื่องจากช่วยให้คุณสามารถกำหนดปริมาณขนาดของผลิตภัณฑ์ประเภทต่างๆ
ข้อเสียของตัวบ่งชี้สัมบูรณ์: ไม่สามารถระบุลักษณะเชิงคุณภาพและโครงสร้างของปรากฏการณ์ที่กำลังศึกษาได้ สำหรับสิ่งนี้จะใช้ตัวบ่งชี้สัมพัทธ์ซึ่งคำนวณจากตัวบ่งชี้สัมบูรณ์
ค่าสัมพัทธ์
ตัวบ่งชี้สัมพัทธ์- นี่คือตัวบ่งชี้ที่เป็นผลหารของการหารตัวบ่งชี้สัมบูรณ์หนึ่งตัวด้วยตัวบ่งชี้อื่นและให้การวัดความสัมพันธ์ระหว่างตัวบ่งชี้เป็นตัวเลข
ไม่มีชื่อ O.P.
1. จะได้ค่าสัมประสิทธิ์หากฐานเปรียบเทียบเป็น 1 หากค่าสัมประสิทธิ์มากกว่า 1 แสดงว่าค่าที่เปรียบเทียบมากกว่าฐานเปรียบเทียบหลายเท่า หากค่าสัมประสิทธิ์น้อยกว่า 1 แสดงว่าส่วนใดของฐานเปรียบเทียบคือค่าเปรียบเทียบ
2. เปอร์เซ็นต์จะได้มาถ้าฐานของการเปรียบเทียบคือ 100 จะได้เปอร์เซ็นต์โดยการคูณค่าสัมประสิทธิ์ด้วย 100
3. Permille (‰) - หากฐานของการเปรียบเทียบคือ 1,000 ได้จากการคูณค่าสัมประสิทธิ์ด้วย 1,000 Permille ใช้เพื่อหลีกเลี่ยงค่าเศษส่วนของตัวบ่งชี้ มีการใช้กันอย่างแพร่หลายในสถิติประชากร ซึ่งกำหนดอัตราการตาย อัตราการเกิด และการแต่งงานต่อประชากร 1,000 คน
4. โปรเดซิมิลล์ (‰0) – ถ้าฐานของการเปรียบเทียบคือ 10,000 จะได้โดยการคูณค่าสัมประสิทธิ์ด้วย 10,000 เช่น จำนวนแพทย์ จำนวนเตียงในโรงพยาบาลต่อประชากร 10,000 คน
ประเภทของค่าสัมพัทธ์ (ตัวบ่งชี้):
1. ดัชนีโครงสร้างสัมพัทธ์:
ตัวบ่งชี้นี้คำนวณจากข้อมูลที่จัดกลุ่มและแสดงส่วนแบ่งของแต่ละส่วนในปริมาณรวมของประชากร สามารถแสดงเป็นอัตราส่วน (ส่วนแบ่ง) หรือร้อยละ (ความถ่วงจำเพาะ) ตัวอย่าง 0.4 - ส่วนแบ่ง 40% - ความถ่วงจำเพาะ ผลรวมของหุ้นทั้งหมดเท่ากับ 1 และความถ่วงจำเพาะคือ 100%
2. ตัวบ่งชี้สัมพัทธ์ของไดนามิก:
.
ตัวบ่งชี้นี้แสดงการเปลี่ยนแปลงของปรากฏการณ์เมื่อเวลาผ่านไป ซึ่งแสดงในรูปของค่าสัมประสิทธิ์ - ปัจจัยการเติบโต และในรูปของเปอร์เซ็นต์ - อัตราการเติบโต
3. ประสิทธิภาพสัมพัทธ์ของแผน:
ตัวบ่งชี้นี้แสดงระดับของการดำเนินการตามแผนและแสดงในรูปของ%
ตัวบ่งชี้เป้าหมายสัมพัทธ์:
ตัวบ่งชี้นี้แสดงสิ่งที่มีแผนจะเปลี่ยนแปลงตัวบ่งชี้ในอนาคตเมื่อเทียบกับช่วงเวลาก่อนหน้า และแสดงเป็นเปอร์เซ็นต์
ความสัมพันธ์ระหว่างตัวบ่งชี้: .
5. ตัวบ่งชี้สัมพัทธ์ของการประสานงาน:
ตัวบ่งชี้นี้สามารถคำนวณได้ 1, 10, 100 หน่วย และแสดงจำนวนหน่วยของส่วนหนึ่งที่คิดเป็นค่าเฉลี่ย 1, 10, 100 หน่วยของอีกส่วนหนึ่ง ตัวอย่างเช่น จำนวนประชากรในเมืองต่อชาวบ้าน 1, 10, 100 คน
6. ตัวบ่งชี้ความเข้มสัมพัทธ์:
ตัวบ่งชี้นี้คำนวณโดยการเปรียบเทียบตัวบ่งชี้ต่าง ๆ ที่มีความสัมพันธ์ซึ่งกันและกัน ตัวบ่งชี้นี้สามารถคำนวณได้ 1, 10, 100 หน่วยและเป็นตัวบ่งชี้ที่มีชื่อ ตัวอย่างเช่น ความหนาแน่นของประชากร - คน / 1, 10, 100 km2
7. ดัชนีเปรียบเทียบสัมพัทธ์:
ตัวบ่งชี้นี้คำนวณโดยการเปรียบเทียบตัวบ่งชี้ที่คล้ายกันที่เกี่ยวข้องกับช่วงเวลาเดียวกัน แต่กับวัตถุหรือดินแดนที่แตกต่างกัน ซึ่งแสดงในรูปของค่าสัมประสิทธิ์และเปอร์เซ็นต์
ธีม 5. ค่าเฉลี่ยและตัวบ่งชี้ความแปรปรวน
1. ค่าเฉลี่ย: แนวคิดและประเภท
ค่าเฉลี่ย -นี่เป็นตัวบ่งชี้ทั่วไปที่แสดงลักษณะระดับทั่วไปของลักษณะเชิงปริมาณที่แตกต่างกันต่อหน่วยของประชากรภายใต้เงื่อนไขของสถานที่และเวลา
เงื่อนไขการคำนวณค่าเฉลี่ย:
1. จำนวนประชากรที่ใช้คำนวณค่าเฉลี่ยจะต้องมีขนาดใหญ่เพียงพอ มิฉะนั้น ค่าเบี่ยงเบนแบบสุ่มในค่าของแอตทริบิวต์จะไม่ถูกยกเลิก และค่าเฉลี่ยจะไม่แสดงรูปแบบที่มีอยู่ในกระบวนการนี้
2. ประชากรที่ใช้คำนวณค่าเฉลี่ยจะต้องมีคุณสมบัติเป็นเนื้อเดียวกัน มิฉะนั้นจะไม่เพียงไม่มีคุณค่าทางวิทยาศาสตร์เท่านั้น แต่ยังอาจเป็นอันตราย บิดเบือนธรรมชาติที่แท้จริงของปรากฏการณ์ที่กำลังศึกษา
3. ค่าเฉลี่ยโดยรวมควรเสริมด้วยค่าเฉลี่ยกลุ่ม ค่าเฉลี่ยทั่วไปแสดงขนาดทั่วไปของประชากรทั้งหมด และค่าเฉลี่ยกลุ่มแสดงแต่ละส่วนพร้อมคุณสมบัติเฉพาะ
4. สำหรับคำอธิบายที่ครอบคลุมของปรากฏการณ์ ควรคำนวณระบบตัวบ่งชี้ค่าเฉลี่ยตามคุณลักษณะที่สำคัญที่สุด
ค่าเฉลี่ยจะถูกตั้งชื่อเสมอ โดยมีมิติเดียวกับคุณลักษณะค่าเฉลี่ย
ประเภทของค่าเฉลี่ย:
1. อำนาจหมายถึง(ซึ่งรวมถึงค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยฮาร์มอนิก ค่าเฉลี่ยกำลังสอง ค่าเฉลี่ยเรขาคณิต)
2. ค่าเฉลี่ยโครงสร้าง(โหมดและค่ามัธยฐาน)
ค่าเฉลี่ยกำลังคำนวณโดยสูตร (รูทกำลัง R ของค่าเฉลี่ยของตัวเลือกทั้งหมดที่มีขอบเขต):
ค่าเฉลี่ยกำลังของคุณลักษณะที่กำลังศึกษาอยู่ที่ไหน
− ค่าแต่ละค่าของคุณลักษณะเฉลี่ย
− ตัวบ่งชี้ระดับของค่าเฉลี่ย
− จำนวนสัญญาณ (ชุดเดียว);
- จำนวนเงิน
ได้รับค่าเฉลี่ยอย่างง่ายประเภทต่าง ๆ ขึ้นอยู่กับระดับ
ความหมาย |
ชื่อของค่าเฉลี่ยอย่างง่าย |
|
ฮามอนิกอย่างง่าย |
||
โดยที่ P คือผลคูณ |
รูปทรงเรขาคณิตที่เรียบง่าย |
|
เลขคณิตอย่างง่าย |
||
กำลังสองอย่างง่าย |
ยิ่งเลขชี้กำลัง () ในค่าเฉลี่ยกำลังสูง ค่าของค่าเฉลี่ยก็จะยิ่งมากขึ้นเท่านั้น หากเราคำนวณค่าเฉลี่ยเหล่านี้สำหรับข้อมูลเดียวกัน เราจะได้อัตราส่วนต่อไปนี้:
คุณสมบัติของกฎแห่งอำนาจหมายถึงการเพิ่มขึ้นด้วยการเพิ่มขึ้นของเลขชี้กำลังของฟังก์ชันที่กำหนดเรียกว่ากฎของวิธีสำคัญ
ในบรรดาค่าเฉลี่ยประเภทนี้ ค่าเฉลี่ยที่ใช้บ่อยที่สุดคือค่าเฉลี่ยเลขคณิตและค่าเฉลี่ยฮาร์มอนิก การเลือกประเภทของค่าเฉลี่ยขึ้นอยู่กับข้อมูลเริ่มต้น
ค่าเฉลี่ยเลขคณิต: วิธีการคำนวณและคุณสมบัติของมัน
ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของค่าแต่ละค่าของคุณลักษณะของหน่วยประชากรทั้งหมดด้วยจำนวนหน่วยประชากร
ค่าเฉลี่ยเลขคณิตใช้ในรูปแบบของค่าเฉลี่ยอย่างง่ายและค่าเฉลี่ยถ่วงน้ำหนัก ค่าเฉลี่ยเลขคณิตอย่างง่ายคำนวณโดยสูตร:
ค่าเฉลี่ยของคุณสมบัติอยู่ที่ไหน
- ค่าแต่ละค่าของแอตทริบิวต์ (ตัวเลือก);
− จำนวนหน่วยประชากร (ตัวเลือก)
ค่าเฉลี่ยเลขคณิตอย่างง่ายใช้ในสองกรณี:
เมื่อแต่ละตัวแปรเกิดขึ้นเพียงครั้งเดียวในชุดการแจกจ่าย
เมื่อความถี่เท่ากันหมด
ค่าเฉลี่ยถ่วงน้ำหนักเลขคณิตใช้เมื่อความถี่ไม่เท่ากัน:
ที่ไหน − ความถี่หรือน้ำหนัก (ตัวเลขแสดงจำนวน
ครั้งค่าแต่ละค่าเกิดขึ้น
เข้าสู่ระบบ).
คุณสมบัติของค่าเฉลี่ยเลขคณิต(ไม่มีหลักฐาน):
1. ค่าเฉลี่ยของค่าคงที่เท่ากับตัวมันเอง: .
2. ผลคูณของค่าเฉลี่ยและผลรวมของความถี่จะเท่ากับผลรวมของผลคูณของตัวเลือกและความถี่ของมัน: .
3. หากแต่ละตัวเลือกเพิ่มขึ้นหรือลดลงในจำนวนที่เท่ากัน ค่าเฉลี่ยจะเพิ่มขึ้นหรือลดลงในจำนวนที่เท่ากัน: .
4. หากแต่ละตัวเลือกเพิ่มขึ้นหรือลดลงในจำนวนครั้งเท่ากัน ค่าเฉลี่ยจะเพิ่มขึ้นหรือลดลงในจำนวนครั้งเท่ากัน: .
5. หากความถี่ทั้งหมดเพิ่มขึ้นหรือลดลงในจำนวนครั้งเท่ากัน ค่าเฉลี่ยจะไม่เปลี่ยนแปลง: .
6. ค่าเฉลี่ยของผลรวมเท่ากับผลรวมของค่าเฉลี่ย: .
7. ผลรวมของการเบี่ยงเบนของค่าคุณลักษณะทั้งหมดจากค่าเฉลี่ยคือศูนย์
3. วิธีการคำนวณฮาร์มอนิกเฉลี่ย
ในบางกรณี ลักษณะของข้อมูลเริ่มต้นนั้นทำให้การคำนวณค่าเฉลี่ยเลขคณิตสูญเสียความหมายไป และตัวบ่งชี้ทั่วไปเท่านั้นที่สามารถเป็นค่าเฉลี่ยฮาร์มอนิกได้
ประเภทของฮาร์มอนิกเฉลี่ย:
1. ฮาร์มอนิกเฉลี่ยอย่างง่ายคำนวณโดยสูตร:
ซิมเปิลฮาร์มอนิกอย่างง่ายใช้น้อยมาก เพียงเพื่อคำนวณเวลาเฉลี่ยที่ใช้ในการผลิตหน่วยการผลิต โดยมีเงื่อนไขว่าความถี่ของตัวเลือกทั้งหมดเท่ากัน
2. ฮาร์มอนิกเฉลี่ยถ่วงน้ำหนักคำนวณโดยสูตร:
.
ปริมาณรวมของปรากฏการณ์อยู่ที่ไหน
จะใช้ค่าเฉลี่ยถ่วงน้ำหนักแบบฮาร์มอนิกหากทราบปริมาตรทั้งหมดของปรากฏการณ์ แต่ไม่ทราบความถี่ ฮาร์มอนิกนี้ใช้ในการคำนวณตัวชี้วัดคุณภาพเฉลี่ย: ค่าจ้างเฉลี่ย, ราคาเฉลี่ย, ต้นทุนเฉลี่ย, ผลผลิตเฉลี่ย, ผลิตภาพแรงงานเฉลี่ย
4. ค่าเฉลี่ยเชิงโครงสร้าง: โหมดและค่ามัธยฐาน
ค่าเฉลี่ยโครงสร้าง (ฐานนิยม, ค่ามัธยฐาน) ใช้เพื่อศึกษาโครงสร้างภายในและโครงสร้างของชุดการกระจายของค่าแอตทริบิวต์
แฟชั่น- ค่าทั่วไปของแอตทริบิวต์ในหน่วยของประชากร ในชุดการกระจายที่แต่ละตัวแปรเกิดขึ้นครั้งเดียว โหมดจะไม่ถูกคำนวณ ในซีรีส์ที่ไม่ต่อเนื่อง โหมดคือตัวแปรที่มีความถี่สูงสุด สำหรับอนุกรมช่วงเวลาที่มีช่วงเท่ากัน โหมดจะคำนวณโดยสูตร:
.
ขอบเขตเริ่มต้น (ล่าง) ของช่วงเวลาโมดอลอยู่ที่ไหน
- ค่าของโมดอล ช่วงก่อน - และหลังโมดอล ตามลำดับ
− ความถี่ของช่วงโมดอล ก่อนและหลังโมดอล ตามลำดับ
ช่วงโมดอลคือช่วงที่มีความถี่สูงสุด
ค่ามัธยฐานคือค่าของคุณลักษณะที่อยู่ตรงกลางของซีรี่ส์ที่จัดอันดับและแบ่งซีรี่ส์นี้ออกเป็นสองส่วนเท่า ๆ กันตามจำนวนหน่วย: ส่วนหนึ่งมีค่าคุณลักษณะน้อยกว่าค่ามัธยฐานและอีกส่วนหนึ่งมีค่ามากกว่าค่ามัธยฐาน
อันดับแถวคือการจัดเรียงค่าลักษณะตามลำดับขึ้นหรือลง
ในชุดการจัดอันดับแบบไม่ต่อเนื่อง ซึ่งแต่ละตัวเลือกเกิดขึ้นเพียงครั้งเดียว และจำนวนตัวเลือกไม่เป็นเลขคู่ ค่ามัธยฐานจะถูกกำหนดโดยสูตร:
จำนวนคำศัพท์ในซีรีส์อยู่ที่ไหน
ในซีรีส์อันดับแบบไม่ต่อเนื่อง ซึ่งแต่ละตัวเลือกเกิดขึ้นครั้งเดียวและจำนวนตัวเลือกเป็นเลขคู่ ค่ามัธยฐานจะเป็นค่าเฉลี่ยเลขคณิตของสองตัวเลือกที่อยู่ตรงกลางของซีรีส์อันดับ
ในชุดการจัดอันดับแบบไม่ต่อเนื่อง ซึ่งแต่ละตัวเลือกเกิดขึ้นหลายครั้ง ค่ามัธยฐานจะถูกกำหนดโดยสูตร:
จากนั้น เริ่มจากตัวเลือกแรก ความถี่จะถูกรวมตามลำดับจนกว่าคุณจะได้
สำหรับอนุกรมช่วงเวลา ค่ามัธยฐานจะคำนวณตามสูตร:
,
ขีด จำกัด ล่างของช่วงเวลามัธยฐานอยู่ที่ไหน
− ค่าของช่วงเวลามัธยฐาน
−จำนวนหน่วยประชากรทั้งหมด
− ความถี่สะสมจนถึงช่วงมัธยฐาน
คือความถี่ของช่วงมัธยฐาน
ช่วงมัธยฐานคือช่วงเวลาที่ความถี่สะสมมีค่าเท่ากับหรือมากกว่าครึ่งหนึ่งของผลรวมของความถี่ทั้งหมดในอนุกรม
5. ตัวบ่งชี้การเปลี่ยนแปลง
รูปแบบคุณลักษณะ- นี่คือความแตกต่างในค่านิยมส่วนบุคคลของลักษณะภายในประชากรที่ศึกษา การแปรผันของลักษณะมีลักษณะเฉพาะโดยตัวบ่งชี้การแปรผัน ตัวบ่งชี้การแปรผันช่วยเสริมค่าเฉลี่ย แสดงระดับความเป็นเนื้อเดียวกันของประชากรทางสถิติสำหรับลักษณะที่กำหนด ขอบเขตของการเปลี่ยนแปลงลักษณะ อัตราส่วนของตัวบ่งชี้ความผันแปรกำหนดความสัมพันธ์ระหว่างคุณสมบัติต่างๆ
ตัวบ่งชี้ความแปรปรวนแบ่งออกเป็น:
1) Absolute: ช่วงของการเปลี่ยนแปลง; ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน; การกระจายตัว มีหน่วยเดียวกันกับค่าลักษณะเฉพาะ
2) สัมพัทธ์: สัมประสิทธิ์ของการสั่น, สัมประสิทธิ์ของการแปรผัน, ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์
ช่วงของการเปลี่ยนแปลงจะแสดงมูลค่าของแอตทริบิวต์ที่เปลี่ยนแปลงไปมากเพียงใด:
ค่าสูงสุดของแอตทริบิวต์อยู่ที่ไหน
เป็นค่าต่ำสุดของคุณสมบัติ
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยและค่าเบี่ยงเบนกำลังสองเฉลี่ยแสดงว่าค่าแต่ละค่าของคุณลักษณะแตกต่างจากค่าเฉลี่ยเท่าใด
ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ยกำหนด:
- เรียบง่าย; - ถ่วงน้ำหนัก
การกระจายตัวถูกกำหนด:
- เรียบง่าย; - ถ่วงน้ำหนัก;
- เรียบง่าย; - ถ่วงน้ำหนัก
หากค่าเฉลี่ยของแอตทริบิวต์คำนวณโดยใช้เลขคณิตอย่างง่าย ก็จะคำนวณโดยใช้สูตรอย่างง่าย หากค่าเฉลี่ยคำนวณโดยใช้ค่าถ่วงน้ำหนัก ก็จะคำนวณโดยใช้สูตรถ่วงน้ำหนัก
การกระจายตัวและส่วนเบี่ยงเบนมาตรฐานสามารถคำนวณได้โดยใช้สูตรอื่น:
- เรียบง่าย; - ถ่วงน้ำหนัก
ในการเปรียบเทียบความผันแปรของลักษณะที่แตกต่างกันในประชากรเดียวกันหรือลักษณะเดียวกันในประชากรที่แตกต่างกัน ตัวบ่งชี้สัมพัทธ์ของการแปรผันจะถูกคำนวณ เรียกว่า ค่าสัมประสิทธิ์การแปรผัน:
ยิ่งค่าสัมประสิทธิ์การแปรผันมากเท่าใด การแพร่กระจายของค่าแอตทริบิวต์รอบ ๆ ค่าเฉลี่ยก็จะยิ่งมากขึ้นเท่านั้น ประชากรในองค์ประกอบก็จะยิ่งมีความเป็นเนื้อเดียวกันน้อยลงและค่าเฉลี่ยก็จะยิ่งเป็นตัวแทนน้อยลงเท่านั้น ชุดนี้จะถือว่าเป็นเนื้อเดียวกันหากค่าสัมประสิทธิ์การแปรผันไม่เกิน 33%
6. ประเภทของการกระจายและกฎ (กฎ) ของการเพิ่มการกระจาย
หากประชากรที่ศึกษาประกอบด้วยหลายกลุ่มที่เกิดขึ้นจากคุณลักษณะใด ๆ นอกจากความแปรปรวนทั้งหมดแล้ว ยังกำหนดความแปรปรวนระหว่างกลุ่มด้วย
ตาม กฎการบวกผลต่างความแปรปรวนทั้งหมดเท่ากับผลรวมของค่าเฉลี่ยของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม:
การใช้กฎของการเพิ่มความแปรปรวน เป็นไปได้เสมอที่จะกำหนดความแปรปรวนที่สามซึ่งไม่รู้จักจากสองความแปรปรวนที่ทราบ และยังตัดสินความแข็งแกร่งของอิทธิพลของแอตทริบิวต์การจัดกลุ่ม
ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด แสดงส่วนแบ่งเนื่องจากการเปลี่ยนแปลงของลักษณะการจัดกลุ่มในความแปรผันทั้งหมดของลักษณะที่ศึกษา:
ความสัมพันธ์เชิงประจักษ์แสดงอิทธิพลของแอตทริบิวต์ที่อยู่ภายใต้การจัดกลุ่มต่อการเปลี่ยนแปลงของแอตทริบิวต์ที่เป็นผลลัพธ์:
อัตราส่วนสหสัมพันธ์เชิงประจักษ์จะแปรผันตั้งแต่ 0 ถึง 1 หากไม่มีการเชื่อมต่อ ถ้า - การเชื่อมต่อเสร็จสมบูรณ์ ค่ากลางจะถูกประเมินตามความใกล้เคียงกับค่าจำกัด
ธีม 6.ชุดไดนามิก
1. ชุดไดนามิก: แนวคิดและประเภท
ชุดไดนามิก (อนุกรมเวลา อนุกรมไดนามิก อนุกรมเวลา) เป็นอนุกรมของค่าตัวเลขของตัวบ่งชี้ทางสถิติที่จัดเรียงตามลำดับเวลา ชุดไดนามิกประกอบด้วยสององค์ประกอบ (กราฟ):
1. เวลา (t) คือช่วงเวลา (วันที่) หรือช่วงเวลา (ปี, ไตรมาส, เดือน, วัน) ของเวลาที่ตัวบ่งชี้ทางสถิติ (ระดับซีรีส์) อ้างอิง
2. ระดับของซีรีส์ (y) – ค่าของตัวบ่งชี้ทางสถิติที่แสดงสถานะของปรากฏการณ์ ณ เวลาที่กำหนดหรือในช่วงเวลาหนึ่ง
ระดับแถว y |
ประเภทของไดนามิกซีรีส์:
1. ตามเวลา:
A) ช่วงเวลา - ซีรีส์ ซึ่งเป็นระดับที่แสดงลักษณะของขนาดของปรากฏการณ์ในช่วงระยะเวลาหนึ่ง (วัน เดือน ไตรมาส ปี) ตัวอย่างของชุดดังกล่าวคือข้อมูลเกี่ยวกับไดนามิกของการผลิต จำนวนวันทำงาน ฯลฯ สามารถสรุประดับสัมบูรณ์ของชุดช่วงเวลาได้ ซึ่งเป็นผลรวมที่เหมาะสม ซึ่งทำให้สามารถรับชุดของไดนามิกได้ ของช่วงเวลาที่ขยายใหญ่ขึ้น
B) ชั่วขณะ - ซีรีส์ ระดับที่แสดงลักษณะของขนาดของปรากฏการณ์ ณ วันที่ (ช่วงเวลา) ของเวลา ตัวอย่างของชุดข้อมูลดังกล่าวอาจเป็นข้อมูลเกี่ยวกับพลวัตของประชากร ปศุสัตว์ สินค้าคงคลัง มูลค่าของสินทรัพย์ถาวร สินทรัพย์หมุนเวียน ฯลฯ ไม่สามารถสรุประดับของชุดช่วงเวลาได้ ผลรวมไม่สมเหตุสมผล เนื่องจากชุดข้อมูลถัดไป ระดับทั้งหมดหรือบางส่วนรวมถึงหนึ่งระดับก่อนหน้า
2. ตามรูปแบบการนำเสนอ (วิธีการแสดงออก) ของระดับต่างๆ:
A) อนุกรมของค่าสัมบูรณ์
B) อนุกรมของค่าสัมพัทธ์ ค่าสัมพัทธ์กำหนดลักษณะเช่นพลวัตของส่วนแบ่งของประชากรในเมืองและชนบท (%) และอัตราการว่างงาน