ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองของกลุ่มตัวอย่างมีค่ามากกว่า ค่าเฉลี่ยคำอธิบายข้อผิดพลาดมาตรฐานตัวอย่างกำลังสองสำหรับ

ข้อผิดพลาดของตัวอย่างโดยเฉลี่ยแสดงว่าพารามิเตอร์เบี่ยงเบนไปโดยเฉลี่ยเท่าใด กรอบการสุ่มตัวอย่างจากพารามิเตอร์ทั่วไปที่สอดคล้องกัน หากเราคำนวณค่าเฉลี่ยของข้อผิดพลาดของตัวอย่างที่เป็นไปได้ทั้งหมด บางชนิดปริมาณที่กำหนด ( ) แยกมาจากประชากรกลุ่มเดียวกัน จากนั้นเราจะได้ลักษณะทั่วไปของพวกมัน - หมายถึงข้อผิดพลาดในการสุ่มตัวอย่าง ().

ในทฤษฎีการสังเกตแบบเลือกสูตรสำหรับการพิจารณาซึ่งเป็นรายบุคคล วิธีทางที่แตกต่างการเลือก (ซ้ำและไม่ซ้ำ) ประเภทของตัวอย่างที่ใช้และประเภทของตัวบ่งชี้ทางสถิติโดยประมาณ

ตัวอย่างเช่น หากใช้การสุ่มตัวอย่างซ้ำๆ ก็จะถูกกำหนดเป็น:

เมื่อประเมินค่าเฉลี่ยของคุณลักษณะ

หากเครื่องหมายเป็นทางเลือกและส่วนแบ่งเป็นค่าประมาณ

ในกรณีที่ไม่มีการเลือกแบบสุ่มซ้ำ สูตรจะได้รับการแก้ไข (1 - n/N):

- สำหรับค่าเฉลี่ยของแอตทริบิวต์

- สำหรับส่วนแบ่ง

ความน่าจะเป็นที่จะได้ค่าความผิดพลาดดังกล่าวจะเท่ากับ 0.683 เสมอ ในทางปฏิบัติ เป็นการดีกว่าที่จะได้ข้อมูลที่มีความน่าจะเป็นสูงกว่า แต่สิ่งนี้จะนำไปสู่การเพิ่มขนาดของข้อผิดพลาดในการสุ่มตัวอย่าง

ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม () เท่ากับ t คูณจำนวนข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย (ในทฤษฎีการสุ่มตัวอย่าง เป็นเรื่องปกติที่จะเรียกค่าสัมประสิทธิ์ เสื้อ ค่าสัมประสิทธิ์ความเชื่อมั่น):

หากข้อผิดพลาดในการสุ่มตัวอย่างเพิ่มขึ้นเป็นสองเท่า (t = 2) เราจะมีโอกาสมากขึ้นที่จะไม่เกินขีดจำกัดที่กำหนด (ในกรณีของเรา ให้เพิ่มเป็นสองเท่า ข้อผิดพลาดเฉลี่ย) - 0.954. ถ้าเราให้ t = 3 แล้ว ระดับความเชื่อมั่นจะเป็น 0.997 - ความแน่นอนในทางปฏิบัติ

ระดับ ข้อผิดพลาดเล็กน้อยการสุ่มตัวอย่างขึ้นอยู่กับปัจจัยต่อไปนี้:

  • ระดับการเปลี่ยนแปลงของหน่วยของประชากรทั่วไป
  • ขนาดตัวอย่าง;
  • รูปแบบการเลือกที่เลือก (การเลือกที่ไม่ซ้ำให้ค่าความผิดพลาดที่น้อยลง);
  • ระดับความเชื่อมั่น.

หากขนาดตัวอย่างมากกว่า 30 ค่าของ t จะถูกกำหนดจากตารางการแจกแจงปกติ ถ้าน้อยกว่า - จากตารางการแจกแจงของนักเรียน

ต่อไปนี้คือค่าสัมประสิทธิ์ความเชื่อมั่นบางส่วนจากตารางการแจกแจงแบบปกติ

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของแอตทริบิวต์และสำหรับสัดส่วนในประชากรทั่วไปกำหนดไว้ดังนี้:

ดังนั้น คำจำกัดความของขอบเขตของค่าเฉลี่ยทั่วไปและส่วนแบ่งประกอบด้วยขั้นตอนต่อไปนี้:

ข้อผิดพลาดในการสุ่มตัวอย่างที่ หลากหลายชนิดการเลือก

  1. การสุ่มตัวอย่างแบบสุ่มและเชิงกล ข้อผิดพลาดเฉลี่ยของการสุ่มตัวอย่างเชิงกลและการสุ่มที่เกิดขึ้นจริงพบได้โดยใช้สูตรที่แสดงในตาราง 11.3.

ตัวอย่าง 11.2 เพื่อศึกษาระดับผลตอบแทนจากสินทรัพย์ การสำรวจตัวอย่างจาก 90 องค์กรจาก 225 แห่งดำเนินการโดยใช้การสุ่ม การสุ่มตัวอย่างใหม่ซึ่งส่งผลให้ข้อมูลที่แสดงในตาราง

ในตัวอย่างนี้ เรามีตัวอย่าง 40% (90: 225 = 0.4 หรือ 40%) ให้เราพิจารณาข้อผิดพลาดเล็กน้อยและขอบเขตสำหรับค่าเฉลี่ยของคุณลักษณะในประชากรทั่วไปตามขั้นตอนของอัลกอริทึม:

  1. จากผลการสำรวจตัวอย่าง เราคำนวณค่าเฉลี่ยและความแปรปรวนในกลุ่มประชากรตัวอย่าง:
ตารางที่ 11.5
ผลการสังเกต ค่าโดยประมาณ
ผลตอบแทนจากสินทรัพย์ rub., x i จำนวนวิสาหกิจฉ ตรงกลางของช่วง x i \xb4 x ฉัน \xb4 ฉ ฉัน x ฉัน \xb4 2 ฉ ฉัน
สูงถึง 1.4 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2.2 ขึ้นไป 14 2,3 32,2 74,06
ทั้งหมด 90 - 162,6 303,62

ค่าเฉลี่ยตัวอย่าง

ตัวอย่างความแปรปรวนของลักษณะที่ศึกษา

สำหรับข้อมูลของเรา เรากำหนดข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม ตัวอย่างเช่น ด้วยความน่าจะเป็น 0.954 ตามตารางค่าความน่าจะเป็นของฟังก์ชันการแจกแจงแบบปกติ (ดูสารสกัดจากภาคผนวก 1) เราพบค่าสัมประสิทธิ์ความเชื่อมั่น t ที่สอดคล้องกับความน่าจะเป็น 0.954 ด้วยความน่าจะเป็น 0.954 ค่าสัมประสิทธิ์ t คือ 2

ดังนั้นใน 954 กรณีจาก 1,000 ผลตอบแทนจากสินทรัพย์โดยเฉลี่ยจะไม่เกิน 1.88 รูเบิล และไม่น้อยกว่า 1.74 รูเบิล

ข้างต้น มีการใช้แผนการสุ่มเลือกซ้ำๆ มาดูกันว่าผลลัพธ์ของการสำรวจจะเปลี่ยนไปหรือไม่หากเราถือว่าการเลือกนั้นดำเนินการตามรูปแบบการเลือกที่ไม่ซ้ำ ในกรณีนี้ ค่าเฉลี่ยข้อผิดพลาดจะคำนวณโดยใช้สูตร

จากนั้น ด้วยความน่าจะเป็นเท่ากับ 0.954 ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มจะเป็น:

ขีดจำกัดความเชื่อมั่นสำหรับค่าเฉลี่ยของคุณสมบัติในกรณีของการเลือกแบบสุ่มแบบไม่ซ้ำจะมีค่าดังต่อไปนี้:

การเปรียบเทียบผลลัพธ์ของรูปแบบการเลือกทั้งสอง เราสามารถสรุปได้ว่าการใช้การสุ่มตัวอย่างแบบไม่ซ้ำจะให้ผลลัพธ์ที่แม่นยำกว่าเมื่อเปรียบเทียบกับการใช้การเลือกซ้ำที่มีระดับความเชื่อมั่นเดียวกัน ในเวลาเดียวกัน ยิ่งขนาดตัวอย่างใหญ่เท่าใด ขอบเขตของค่าเฉลี่ยก็จะยิ่งแคบลงเมื่อย้ายจากรูปแบบการเลือกหนึ่งไปยังอีกรูปแบบหนึ่ง

ตามตัวอย่าง เรากำหนดขอบเขตของส่วนแบ่งขององค์กรโดยให้ผลตอบแทนจากสินทรัพย์ที่ไม่เกิน 2.0 รูเบิลในประชากรทั่วไป:

  1. ลองคำนวณอัตราตัวอย่าง

จำนวนวิสาหกิจในตัวอย่างที่มีผลตอบแทนจากสินทรัพย์ไม่เกิน 2.0 รูเบิลคือ 60 หน่วย แล้ว

m = 60, n = 90, w = m/n = 60: 90 = 0.667;

  1. คำนวณความแปรปรวนของส่วนแบ่งในกลุ่มประชากรตัวอย่าง
  1. ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยเมื่อใช้ โครงการใหม่การเลือกจะเป็น

หากเราสันนิษฐานว่ามีการใช้โครงร่างการเลือกที่ไม่ซ้ำ ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยโดยคำนึงถึงการแก้ไขสำหรับจำนวนจำกัดของประชากรจะเป็น

  1. เราตั้งค่าความน่าจะเป็นที่มั่นใจและกำหนดข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม

ด้วยค่าความน่าจะเป็นของ P = 0.997 ตามตารางการแจกแจงแบบปกติ เราได้ค่าสำหรับค่าสัมประสิทธิ์ความเชื่อมั่น t = 3 (ดูข้อความที่แยกออกมาในภาคผนวก 1):

ดังนั้นด้วยความน่าจะเป็นที่ 0.997 จึงเป็นที่ถกเถียงกันอยู่ว่าในประชากรทั่วไป ส่วนแบ่งขององค์กรที่มีผลตอบแทนจากสินทรัพย์ไม่เกิน 2.0 รูเบิล ไม่น้อยกว่า 54.7% และไม่เกิน 78.7%

  1. ตัวอย่างทั่วไป ด้วยตัวอย่างทั่วไป ประชากรวัตถุจะถูกแบ่งออกเป็น k กลุ่มแล้ว

N 1 + N 2 + ... + N i + ... + N k = N.

ปริมาณของหน่วยที่สกัดจากแต่ละกลุ่มทั่วไปขึ้นอยู่กับวิธีการเลือกที่นำมาใช้ พวกเขา ทั้งหมดสร้างขนาดตัวอย่างที่ต้องการ

n 1 + n 2 + … + n i + … + n k = n

มีสองวิธีดังต่อไปนี้ในการจัดระเบียบการเลือกภายในกลุ่มทั่วไป: สัดส่วนกับปริมาณของกลุ่มทั่วไปและสัดส่วนตามระดับความผันผวนของค่าของแอตทริบิวต์ในหน่วยการสังเกตในกลุ่ม พิจารณาอย่างแรกว่าเป็นสิ่งที่ใช้บ่อยที่สุด

การเลือกสัดส่วนตามขนาดของกลุ่มทั่วไปจะถือว่าในแต่ละกลุ่มจะถูกเลือก หมายเลขถัดไปหน่วยประชากร:

n = n ผม ยังไม่มี ผม /N

โดยที่ n i คือจำนวนหน่วยที่แยกได้สำหรับตัวอย่างจากกลุ่มทั่วไป i-th

n คือขนาดตัวอย่างทั้งหมด

N i - จำนวนหน่วยของประชากรทั่วไปที่ประกอบขึ้นเป็น i-th กลุ่มทั่วไป

N คือจำนวนหน่วยทั้งหมดในประชากรทั่วไป

การเลือกหน่วยภายในกลุ่มเกิดขึ้นในรูปแบบของการสุ่มหรือการสุ่มตัวอย่างเชิงกล

สูตรสำหรับการประมาณค่าเฉลี่ยข้อผิดพลาดในการสุ่มตัวอย่างสำหรับค่าเฉลี่ยและส่วนแบ่งจะแสดงในตาราง 11.6.

นี่คือค่าเฉลี่ยของความแปรปรวนของกลุ่มของกลุ่มทั่วไป

ตัวอย่าง 11.3 มีการสำรวจตัวอย่างนักเรียนในมหาวิทยาลัยมอสโกแห่งหนึ่งเพื่อกำหนดตัวบ่งชี้การเข้าเรียนโดยเฉลี่ยของห้องสมุดมหาวิทยาลัยโดยนักเรียนหนึ่งคนต่อภาคการศึกษา สำหรับสิ่งนี้ ใช้ตัวอย่างทั่วไปที่ไม่ซ้ำ 5% ซึ่งเป็นกลุ่มทั่วไปที่สอดคล้องกับหมายเลขหลักสูตร เมื่อเลือกตามสัดส่วนของปริมาณของกลุ่มทั่วไป จะได้ข้อมูลต่อไปนี้:

ตาราง 11.7.
หมายเลขรายวิชา นักเรียนทั้งหมด, คน, N i ตรวจสอบจากการสังเกตแบบเลือก, คน, n i จำนวนการเข้าใช้ห้องสมุดโดยเฉลี่ยต่อนักเรียนต่อภาคการศึกษา x i ความแปรปรวนตัวอย่างภายในกลุ่ม
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
ทั้งหมด 2 550 128 8 -

จำนวนนักศึกษาที่จะสอบในแต่ละรายวิชาคำนวณได้ดังนี้

คล้ายกันสำหรับกลุ่มอื่น:

การกระจายของค่าเฉลี่ยตัวอย่างมีกฎการกระจายแบบปกติเสมอ (หรือเข้าใกล้) สำหรับ n > 100 โดยไม่คำนึงถึงลักษณะของการกระจายของประชากรทั่วไป อย่างไรก็ตาม ในกรณีของตัวอย่างขนาดเล็ก จะใช้กฎหมายการกระจายที่แตกต่างกัน - การกระจายของนักเรียน ในกรณีนี้ จะพบค่าสัมประสิทธิ์ความเชื่อมั่นตามตารางการแจกแจงแบบ t ของนักเรียน ขึ้นอยู่กับค่าของความน่าจะเป็นทางความเชื่อมั่น P และขนาดตัวอย่าง n ภาคผนวก 1 แสดงส่วนของตารางการแจกแจงแบบ t ของนักเรียน ซึ่งแสดงเป็นการพึ่งพา ของความเชื่อมั่นความน่าจะเป็นของขนาดตัวอย่างและค่าสัมประสิทธิ์ความเชื่อมั่น t

ตัวอย่าง 11.4 สมมติว่าการสำรวจตัวอย่างของนักเรียนแปดคนในสถาบันแสดงว่ากำลังเตรียมตัวสำหรับ ควบคุมการทำงานตามสถิติพวกเขาใช้เวลาหลายชั่วโมงต่อไปนี้: 8.5; 8.0; 7.8; 9.0; 7.2; 6.2; 8.4; 6.6.

ตัวอย่าง 11.5 ลองคำนวณจำนวน 507 กัน สถานประกอบการอุตสาหกรรมควรตรวจสอบสำนักงานภาษีเพื่อกำหนดส่วนแบ่งขององค์กรที่มีการละเมิดภาษีโดยมีความน่าจะเป็น 0.997 จากการสำรวจที่คล้ายกันก่อนหน้านี้ ค่าของส่วนเบี่ยงเบนมาตรฐานคือ 0.15; ขนาดของข้อผิดพลาดในการสุ่มตัวอย่างคาดว่าจะไม่เกิน 0.05

เมื่อใช้การเลือกสุ่มซ้ำ ตรวจสอบ

ในการสุ่มแบบไม่ซ้ำจะต้องตรวจสอบ

อย่างที่คุณเห็น การใช้การสุ่มตัวอย่างแบบไม่ซ้ำทำให้คุณสามารถสำรวจได้มาก น้อยลงวัตถุ

ตัวอย่าง 11.6 มีการวางแผนการสำรวจ ค่าจ้างที่สถานประกอบการของอุตสาหกรรมโดยวิธีการสุ่มเลือกแบบไม่ซ้ำ ขนาดของกลุ่มตัวอย่างควรเป็นเท่าใดหากในขณะที่ทำการสำรวจจำนวนพนักงานในอุตสาหกรรมคือ 100,000 คน ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มไม่ควรเกิน 100 รูเบิล ด้วยความน่าจะเป็น 0.954 จากการสำรวจค่าจ้างในอุตสาหกรรมที่ผ่านมาทราบว่าเป็นค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐานคือ 500 รูเบิล

ดังนั้นในการแก้ปัญหาจำเป็นต้องรวมกลุ่มตัวอย่างอย่างน้อย 100 คน

ความแตกต่างระหว่างค่าของตัวบ่งชี้ที่ได้จากตัวอย่างและพารามิเตอร์ที่สอดคล้องกันของประชากรทั่วไปเรียกว่า ข้อผิดพลาดในการเป็นตัวแทน แยกแยะความแตกต่างระหว่างระบบและ ข้อผิดพลาดแบบสุ่มตัวอย่าง

ข้อผิดพลาดแบบสุ่ม อธิบายไม่เพียงพอ การแสดงเครื่องแบบในชุดตัวอย่างหน่วยประเภทต่างๆ ของประชากรทั่วไป

ข้อผิดพลาดอย่างเป็นระบบ อาจเกี่ยวข้องกับการละเมิดกฎการคัดเลือกหรือเงื่อนไขสำหรับการนำตัวอย่างไปใช้

ดังนั้นเมื่อสำรวจงบประมาณครัวเรือนกรอบการสุ่มตัวอย่างจึงถูกสร้างขึ้นมานานกว่า 40 ปีบนพื้นฐานของหลักการเลือกภาคพื้นที่ซึ่งเกิดจากเป้าหมายหลักของการสำรวจงบประมาณ - เพื่อกำหนดลักษณะมาตรฐานการครองชีพของคนงาน พนักงาน และกลุ่มเกษตรกร ตัวอย่างถูกกระจายไปตามภูมิภาคและภาคส่วนเศรษฐกิจของ RSFSR ตามสัดส่วน ความแข็งแรงทั้งหมดลูกจ้าง; ในการสร้างตัวอย่างอุตสาหกรรม จะใช้ตัวอย่างทั่วไปกับการเลือกเชิงกลของหน่วยภายในกลุ่ม

เกณฑ์การคัดเลือกหลักคือเงินเดือนเฉลี่ยต่อเดือน หลักการของการคัดเลือกทำให้แน่ใจได้ว่ามีตัวแทนตามสัดส่วนในกลุ่มตัวอย่างแรงงานที่มีระดับค่าจ้างต่างกัน

ด้วยการถือกำเนิดขึ้นใหม่ กลุ่มทางสังคม(ผู้ประกอบการ, เกษตรกร, ผู้ว่างงาน), ตัวแทนของกลุ่มตัวอย่างถูกละเมิดไม่เพียงเนื่องจากความแตกต่างกับโครงสร้างของประชากรทั่วไป แต่ยังเกิดจากข้อผิดพลาดอย่างเป็นระบบที่เกิดขึ้นเนื่องจากความไม่ตรงกันระหว่างหน่วยตัวอย่าง (พนักงาน) และ หน่วยสังเกตการณ์ (ครัวเรือน) ครัวเรือนที่มีสมาชิกในครอบครัวที่ทำงานมากกว่าหนึ่งคนก็มีแนวโน้มที่จะได้รับเลือกมากกว่าครัวเรือนที่มีคนงานหนึ่งคน ครอบครัวที่ไม่มีงานทำในภาคส่วนการสำรวจหลุดออกจากช่วงของหน่วยที่เลือก (ครัวเรือนผู้รับบำนาญ ครัวเรือนที่ประกอบอาชีพอิสระ ฯลฯ) เป็นการยากที่จะประเมินความถูกต้องของผลลัพธ์ที่ได้ (ขอบเขตของช่วงความเชื่อมั่น ข้อผิดพลาดในการสุ่มตัวอย่าง) เนื่องจากไม่ได้ใช้แบบจำลองความน่าจะเป็นในการสร้างตัวอย่าง

ในปี พ.ศ. 2539–2540 ได้รับการแนะนำเป็นพื้นฐาน แนวทางใหม่ในการสุ่มตัวอย่างครัวเรือน ข้อมูลของการสำรวจสำมะโนประชากรปี พ.ศ. 2537 ใช้เป็นพื้นฐานในการดำเนินการ ประชากรทั่วไป ในการเลือกประกอบด้วยครัวเรือนทุกประเภท ยกเว้น ครัวเรือนรวม และเริ่มจัดกลุ่มตัวอย่างโดยคำนึงถึงความเป็นตัวแทนขององค์ประกอบและประเภทของครัวเรือนในแต่ละเรื่องของสหพันธรัฐรัสเซีย

การวัดข้อผิดพลาดในการเป็นตัวแทนของตัวบ่งชี้ตัวอย่างขึ้นอยู่กับสมมติฐานของลักษณะสุ่มของการแจกแจงที่ไม่มีที่สิ้นสุด จำนวนมากตัวอย่าง

การหาปริมาณความน่าเชื่อถือของตัวบ่งชี้ตัวอย่างใช้เพื่อทำความเข้าใจลักษณะทั่วไป สิ่งนี้ดำเนินการบนพื้นฐานของตัวบ่งชี้ตัวอย่างโดยคำนึงถึงข้อผิดพลาดแบบสุ่มหรือบนพื้นฐานของสมมติฐานที่แน่นอน (เกี่ยวกับค่า ความแปรปรวนปานกลาง, ลักษณะการกระจาย, ความเชื่อมโยง) ที่สัมพันธ์กับคุณสมบัติของประชากรทั่วไป.

ในการทดสอบสมมติฐาน จะมีการประเมินความสอดคล้องของข้อมูลเชิงประจักษ์กับข้อมูลสมมุติฐาน

ขนาดของข้อผิดพลาดในการเป็นตัวแทนแบบสุ่มขึ้นอยู่กับ:

  • 1) ขนาดตัวอย่าง
  • 2) ระดับความแปรปรวนของลักษณะที่ศึกษาในประชากรทั่วไป
  • 3) วิธีการที่ยอมรับในการสร้างประชากรตัวอย่าง

มีค่าเฉลี่ย (มาตรฐาน) และข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อย

ข้อผิดพลาดเฉลี่ย ลักษณะการวัดความเบี่ยงเบนของตัวบ่งชี้ตัวอย่างจากตัวบ่งชี้ที่คล้ายกันของประชากรทั่วไป

ข้อผิดพลาดเล็กน้อย เป็นเรื่องปกติที่จะต้องพิจารณาความแตกต่างที่เป็นไปได้สูงสุดระหว่างตัวอย่างกับลักษณะทั่วไป เช่น ข้อผิดพลาดสูงสุดสำหรับความน่าจะเป็นของการเกิดขึ้นที่กำหนด

จากตัวอย่างประชากรสามารถประเมินตัวบ่งชี้ต่างๆ (พารามิเตอร์) ของประชากรทั่วไปได้ คะแนนที่ใช้บ่อยที่สุดคือ:

หลักการพื้นฐานของการใช้วิธีการสุ่มตัวอย่างคือ เพื่อให้แน่ใจว่าทุกหน่วยของประชากรทั่วไปได้รับเลือกในกลุ่มประชากรตัวอย่างอย่างเท่าเทียมกัน ด้วยวิธีการนี้ จะมีการปฏิบัติตามข้อกำหนดของการเลือกแบบสุ่มและมีวัตถุประสงค์ ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างจึงถูกกำหนดโดยขนาดของมันเป็นหลัก ( พี ). เมื่อเพิ่มขึ้นในช่วงหลังค่าของข้อผิดพลาดเฉลี่ยจะลดลงลักษณะของประชากรกลุ่มตัวอย่างจะเข้าใกล้ลักษณะของประชากรทั่วไป

ด้วยจำนวนชุดตัวอย่างที่เท่ากันและอื่น ๆ เงื่อนไขที่เท่าเทียมกันข้อผิดพลาดในการสุ่มตัวอย่างจะมีขนาดเล็กลงในกลุ่มตัวอย่างซึ่งเลือกจากประชากรทั่วไปที่มีลักษณะที่ศึกษาแตกต่างกันน้อยกว่า การลดลงของการเปลี่ยนแปลงของลักษณะหมายถึงการลดลงของค่าของความแปรปรวน (สำหรับลักษณะเชิงปริมาณหรือสำหรับลักษณะทางเลือก)

การพึ่งพาขนาดของข้อผิดพลาดในการสุ่มตัวอย่างในวิธีการสร้างกลุ่มตัวอย่างถูกกำหนดโดยสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย (ตารางที่ 5.2)

มาเสริมตัวบ่งชี้ของตาราง 5.2 พร้อมคำอธิบายต่อไปนี้

ความแปรปรวนของกลุ่มตัวอย่างน้อยกว่าความแปรปรวนทั่วไปเล็กน้อย สถิติทางคณิตศาสตร์พิสูจน์แล้วว่า

ตารางที่ 5.2

สูตรสำหรับคำนวณค่าความผิดพลาดตัวอย่างเฉลี่ย mri วิธีต่างๆการเลือก

ประเภทตัวอย่าง

ซ้ำสำหรับ

ไม่ซ้ำสำหรับ

จริงๆ แล้ว

สุ่ม

(เรียบง่าย)

อนุกรม

(มีค่าเท่ากัน

ทั่วไป (ตามสัดส่วนของขนาดกลุ่ม)

หากตัวอย่างมีขนาดใหญ่ (เช่น พี มากเพียงพอ) จากนั้นอัตราส่วนจะเข้าใกล้เอกภาพและความแปรปรวนของตัวอย่างเกือบจะตรงกับค่าทั่วไป

ตัวอย่างถือว่าใหญ่อย่างไม่มีเงื่อนไขเมื่อ n> 100 และเล็กอย่างไม่มีเงื่อนไขที่ พี < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

สามารถคำนวณได้โดยใช้สูตรต่อไปนี้:

ค่าเฉลี่ยอยู่ที่ไหน ผม ชุดที่; คือค่าเฉลี่ยโดยรวมสำหรับตัวอย่างทั้งหมด

สัดส่วนของหน่วยของหมวดหมู่ใดหมวดหมู่หนึ่งอยู่ที่ไหน ผม ชุดที่; - ส่วนแบ่งของหน่วยของหมวดหมู่นี้ในตัวอย่างทั้งหมด r- จำนวนตอนที่เลือก

4. หาค่าความผิดพลาดเฉลี่ยของตัวอย่างทั่วไปในกรณีเลือกหน่วยตามสัดส่วนของแต่ละกลุ่ม ค่าเฉลี่ยของ ความแปรปรวนภายในกลุ่ม(– สำหรับลักษณะเชิงปริมาณ สำหรับลักษณะทางเลือก) ตามกฎสำหรับการเพิ่มความแปรปรวน ค่าของค่าเฉลี่ยของความแปรปรวนภายในกลุ่มน้อยกว่าค่า ความแปรปรวนทั้งหมด. ค่าเฉลี่ย ข้อผิดพลาดที่เป็นไปได้การสุ่มตัวอย่างทั่วไปจะน้อยกว่าข้อผิดพลาดของการสุ่มตัวอย่างที่เหมาะสมอย่างง่าย

มักใช้การเลือกแบบรวม: การเลือกแต่ละหน่วยจะรวมกับการเลือกแบบกลุ่ม การเลือกทั่วไปจะรวมกับการเลือกเป็นชุด ด้วยวิธีการเลือกใด ๆ ด้วยความน่าจะเป็น อาจเป็นที่ถกเถียงกันอยู่ว่าการเบี่ยงเบนของค่าเฉลี่ยตัวอย่าง (หรือส่วนแบ่ง) จากค่าเฉลี่ยทั่วไป (หรือส่วนแบ่ง) จะไม่เกินค่าที่กำหนดซึ่งเรียกว่า ข้อผิดพลาดเล็กน้อย ตัวอย่าง

อัตราส่วนระหว่างขีดจำกัดข้อผิดพลาดในการสุ่มตัวอย่าง (∆) รับประกันด้วยความน่าจะเป็น ฉ(เสื้อ), และค่าเฉลี่ยข้อผิดพลาดในการสุ่มตัวอย่างมีรูปแบบ: หรือ ที่ไหน ที – ค่าสัมประสิทธิ์ความเชื่อมั่น กำหนดขึ้นอยู่กับระดับของความน่าจะเป็น ฉ(เ).

ค่าฟังก์ชัน ฉ(เ) และ ที ถูกกำหนดบนพื้นฐานของตารางทางคณิตศาสตร์ที่รวบรวมเป็นพิเศษ นี่คือบางส่วนที่ใช้บ่อยที่สุด:

ที

ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มจึงตอบคำถามเกี่ยวกับความแม่นยำในการสุ่มตัวอย่างด้วยความน่าจะเป็น ค่าที่ขึ้นอยู่กับค่าของค่าสัมประสิทธิ์ความเชื่อมั่น ที ใช่ที่ ที = 1 ความน่าจะเป็น F(ที ) การเบี่ยงเบนของลักษณะตัวอย่างจากลักษณะทั่วไปโดยค่าของข้อผิดพลาดค่าเฉลี่ยเดียวคือ 0.683 ดังนั้น โดยเฉลี่ยแล้ว จากทุกๆ 1,000 ตัวอย่าง 683 จะให้ตัวบ่งชี้ทั่วไป (ค่าเฉลี่ย, ส่วนแบ่ง) ซึ่งจะแตกต่างจากค่าทั่วไปโดยมีข้อผิดพลาดเฉลี่ยไม่เกินค่าเดียว ที่ เสื้อ = 2 ความน่าจะเป็น ฉ(เ) เท่ากับ 0.954 ซึ่งหมายความว่าจากทุกๆ 1,000 ตัวอย่าง 954 จะให้ตัวบ่งชี้ทั่วไปซึ่งจะแตกต่างจากค่าทั่วไปโดยไม่เกินสองเท่าของข้อผิดพลาดเฉลี่ยของตัวอย่าง เป็นต้น

พร้อมด้วย ค่าสัมบูรณ์มีการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มและ ข้อผิดพลาดสัมพัทธ์, ซึ่งกำหนดเป็น เปอร์เซ็นต์ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อยกับคุณลักษณะที่สอดคล้องกันของประชากรตัวอย่าง:

ในทางปฏิบัติ เป็นเรื่องปกติที่จะตั้งค่า ∆ ตามกฎภายใน 10% ของระดับเฉลี่ยที่คาดไว้ของแอตทริบิวต์

การคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยและส่วนเพิ่มช่วยให้คุณสามารถกำหนดขีด จำกัด ซึ่งลักษณะของประชากรทั่วไปจะเป็น:

ขีด จำกัด ซึ่งด้วยระดับความน่าจะเป็นที่กำหนด ค่าที่ไม่รู้จักของตัวบ่งชี้ภายใต้การศึกษาในประชากรทั่วไปจะถูกเรียกว่า ช่วงความมั่นใจ, และความน่าจะเป็น ฉ(เ) ความน่าจะเป็นที่มั่นใจ ยิ่งค่า ∆ สูง ค่ายิ่งมาก ช่วงความมั่นใจและทำให้ความแม่นยำในการประมาณลดลง

พิจารณาตัวอย่างต่อไปนี้ ในการกำหนดขนาดเฉลี่ยของเงินฝากในธนาคาร บัญชีเงินฝากสกุลเงินต่างประเทศจำนวน 200 บัญชีถูกเลือกโดยใช้วิธีการสุ่มตัวอย่างซ้ำ ผลปรากฎว่า ขนาดเฉลี่ยเงินฝาก - 60,000 rubles การกระจายคือ 32 ในเวลาเดียวกัน 40 บัญชีกลายเป็นที่ต้องการ มีความน่าจะเป็นที่ 0.954 เพื่อกำหนดขีดจำกัดซึ่งจำนวนเงินฝากเฉลี่ยในบัญชีสกุลเงินต่างประเทศในธนาคารและส่วนแบ่งของบัญชีอุปสงค์ตั้งอยู่

คำนวณค่าเฉลี่ยข้อผิดพลาดของค่าเฉลี่ยตัวอย่างโดยใช้สูตรการเลือกใหม่

ข้อผิดพลาดเล็กน้อยของค่าเฉลี่ยตัวอย่างที่มีความน่าจะเป็น 0.954 จะเป็น

ดังนั้น เงินฝากเฉลี่ยในบัญชีธนาคารสกุลเงินต่างประเทศจะอยู่ภายในหนึ่งพันรูเบิล:

ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าเงินฝากเฉลี่ยในบัญชีสกุลเงินต่างประเทศมีตั้งแต่ 59,200 ถึง 60,800 รูเบิล

ให้เรากำหนดส่วนแบ่งของเงินฝากอุปสงค์ในประชากรตัวอย่าง:

ข้อผิดพลาดค่าเฉลี่ยการแบ่งตัวอย่าง

ข้อผิดพลาดเล็กน้อยของการแบ่งปันที่มีความน่าจะเป็น 0.954 จะเป็น

ดังนั้นส่วนแบ่งของบัญชีความต้องการในประชากรทั่วไปจึงอยู่ภายใน :

ด้วยความน่าจะเป็นที่ 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าส่วนแบ่งของอุปสงค์ในบัญชีสกุลเงินต่างประเทศทั้งหมดในธนาคารมีตั้งแต่ 14.4 ถึง 25.6%

ที่ กรณีศึกษาสิ่งสำคัญคือต้องกำหนดอัตราส่วนที่เหมาะสมที่สุดระหว่างการวัดความน่าเชื่อถือของผลลัพธ์ที่ได้และขนาดของข้อผิดพลาดในการสุ่มตัวอย่างที่ยอมรับได้ ในเรื่องนี้ เมื่อจัดระเบียบการสังเกตตัวอย่าง คำถามเกิดขึ้นที่เกี่ยวข้องกับการกำหนดขนาดตัวอย่างที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่ถูกต้องตามที่ต้องการด้วยความน่าจะเป็นที่กำหนด การคำนวณขนาดตัวอย่างที่ต้องการดำเนินการตามสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มตามประเภทและวิธีการเลือก (ตารางที่ 5.3)

ตารางที่ 5.3

สูตรคำนวณขนาดตัวอย่างด้วยวิธีสุ่มเลือกที่เหมาะสม

มาดูตัวอย่างกันต่อซึ่งนำเสนอผลการสำรวจตัวอย่างบัญชีส่วนบุคคลของผู้ฝากเงินธนาคาร

จำเป็นต้องกำหนดจำนวนบัญชีที่ต้องตรวจสอบเพื่อให้มีโอกาสเกิดข้อผิดพลาด 0.977 ในการกำหนดจำนวนเงินฝากเฉลี่ยไม่เกิน 1.5 พันรูเบิล ให้เราแสดงจากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสำหรับการเลือกตัวบ่งชี้ขนาดตัวอย่างอีกครั้ง:

เมื่อกำหนดขนาดตัวอย่างที่ต้องการโดยใช้สูตรข้างต้น การหาค่าของ σ2 และใช่เป็นเรื่องยาก เนื่องจากค่าเหล่านี้สามารถรับได้หลังจากการสำรวจตัวอย่างเท่านั้น ในเรื่องนี้ แทนที่จะใช้ค่าจริงของตัวบ่งชี้เหล่านี้ ค่าประมาณจะถูกแทนที่ ซึ่งสามารถพิจารณาได้จากการทดลองใด ๆ การสังเกตตัวอย่างหรือจากการสำรวจเชิงวิเคราะห์ก่อนหน้านี้

ในกรณีที่นักสถิติทราบค่าเฉลี่ยของลักษณะเฉพาะที่กำลังศึกษา (เช่น จากคำแนะนำ กฎหมาย ฯลฯ) หรือขีดจำกัดซึ่งคุณลักษณะนี้แตกต่างกันไป สามารถใช้การคำนวณต่อไปนี้โดยใช้สูตรโดยประมาณ:

และผลิตภัณฑ์ w(1 – w) ควรถูกแทนที่ด้วยค่า 0.25 (w = 0.5)

ที่จะได้รับมากขึ้น ผลลัพธ์ที่แน่นอนใช้ค่าที่เป็นไปได้สูงสุดของตัวบ่งชี้เหล่านี้ หากการกระจายของลักษณะในประชากรทั่วไปเชื่อฟัง กฎหมายปกติแล้วช่วงของการแปรผันจะเท่ากับ 6σ ( ค่ามากแยกทั้งสองทิศทางจากค่าเฉลี่ยที่ระยะ 3σ) ดังนั้น แต่ถ้าการกระจายไม่สมมาตรอย่างเห็นได้ชัด ดังนั้น

สำหรับตัวอย่างประเภทใดก็ตาม ปริมาตรของตัวอย่างจะเริ่มคำนวณตามสูตรการสุ่มตัวอย่างซ้ำ

หากเป็นผลมาจากการคำนวณส่วนแบ่งการเลือก ( ) เกิน 5% จากนั้นการคำนวณจะดำเนินการตามสูตรของการเลือกแบบไม่ซ้ำ

สำหรับตัวอย่างทั่วไป จำเป็นต้องแบ่งปริมาตรรวมของประชากรตัวอย่างระหว่างหน่วยประเภทที่เลือก การคำนวณจำนวนการสังเกตจากแต่ละกลุ่มขึ้นอยู่กับชื่อก่อนหน้านี้ รูปแบบองค์กรตัวอย่างทั่วไป

ในการเลือกหน่วยโดยทั่วไปโดยไม่ได้สัดส่วนกับจำนวนกลุ่ม จำนวนรวมของหน่วยที่เลือกจะถูกหารด้วยจำนวนกลุ่ม ค่าที่ได้จะให้จำนวนการเลือกจากแต่ละกลุ่มทั่วไป:

ที่ไหน เค คือจำนวนของกลุ่มทั่วไปที่ระบุ

เมื่อเลือกหน่วยตามสัดส่วนของจำนวนกลุ่มทั่วไป จำนวนการสังเกตสำหรับแต่ละกลุ่มจะถูกกำหนดโดยสูตร

ขนาดตัวอย่างมาจากไหน ผม -th กลุ่ม; - ปริมาณ ผม - กลุ่มที่

เมื่อเลือกโดยคำนึงถึงการเปลี่ยนแปลงของลักษณะ เปอร์เซ็นต์ของตัวอย่างจากแต่ละกลุ่มควรเป็นสัดส่วนกับส่วนเบี่ยงเบนมาตรฐานในกลุ่มนี้ () การคำนวณตัวเลข () ดำเนินการตามสูตร

ในการเลือกแบบอนุกรม จำนวนที่ต้องการของซีรีย์ที่เลือกจะถูกกำหนดในลักษณะเดียวกับการเลือกแบบสุ่มที่เหมาะสม:

การเลือกใหม่

การเลือกที่ไม่ซ้ำ

ในกรณีนี้ สามารถคำนวณผลต่างและข้อผิดพลาดในการสุ่มตัวอย่างสำหรับค่าเฉลี่ยหรือสัดส่วนของลักษณะ

เมื่อใช้การสังเกตแบบเลือก ลักษณะของผลลัพธ์จะเป็นไปได้บนพื้นฐานของการเปรียบเทียบขีดจำกัดข้อผิดพลาดที่ได้รับของตัวบ่งชี้แบบเลือกกับค่าของข้อผิดพลาดที่อนุญาต

ในเรื่องนี้ ปัญหาเกิดจากการพิจารณาความน่าจะเป็นที่ข้อผิดพลาดในการสุ่มตัวอย่างจะไม่เกินข้อผิดพลาดที่อนุญาต วิธีแก้ปัญหานี้ลดลงเหลือการคำนวณตามสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มของปริมาณ ที

จากการพิจารณาตัวอย่างการสำรวจตัวอย่างบัญชีส่วนบุคคลของลูกค้าธนาคารอย่างต่อเนื่องเราจะพบความน่าจะเป็นที่สามารถโต้แย้งได้ว่าข้อผิดพลาดในการกำหนดขนาดเงินฝากเฉลี่ยจะไม่เกิน 785 รูเบิล:

ระดับความเชื่อมั่นที่เกี่ยวข้องคือ 0.95

ในปัจจุบัน แนวทางปฏิบัติในการสุ่มตัวอย่าง ได้แก่ การสังเกตทางสถิติดำเนินการ:

  • - ร่างของ Rosstat;
  • – กระทรวงและหน่วยงานอื่น ๆ (เช่น การตรวจสอบวิสาหกิจในระบบของธนาคารแห่งรัสเซีย)

ประสบการณ์โดยรวมที่เป็นที่รู้จักกันดีในการจัดทำแบบสำรวจตัวอย่างของวิสาหกิจขนาดย่อม ประชากร และครัวเรือนได้นำเสนอไว้ในบทบัญญัติระเบียบวิธีว่าด้วยสถิติ พวกเขาให้มากขึ้น แนวคิดกว้างๆตัวอย่างการสังเกตที่กล่าวถึงข้างต้น (ตารางที่ 5.4)

ในทางปฏิบัติทางสถิติ จะใช้ตัวอย่างทั้งสี่ประเภทดังแสดงในตาราง 5.4. อย่างไรก็ตาม การตั้งค่ามักจะให้กับตัวอย่างที่น่าจะเป็น (สุ่ม) ที่อธิบายไว้ข้างต้น ซึ่งมีวัตถุประสงค์มากที่สุด เนื่องจากสามารถใช้เพื่อประเมินความถูกต้องของผลลัพธ์ที่ได้จากข้อมูลของตัวอย่างเอง

ตารางที่ 5.4

ประเภทตัวอย่าง

ในตัวอย่าง ประเภทกึ่งสุ่ม การเลือกความน่าจะเป็นจะถือว่าอยู่บนพื้นฐานที่ผู้เชี่ยวชาญพิจารณาตัวอย่างเห็นว่ายอมรับได้ ตัวอย่างของการใช้การสุ่มตัวอย่างแบบกึ่งสุ่มในทางสถิติ ได้แก่ "การสำรวจการสุ่มตัวอย่างวิสาหกิจขนาดย่อมเพื่อศึกษา กระบวนการทางสังคมในธุรกิจขนาดเล็ก" ดำเนินการในปี 1996 ในบางภูมิภาคของรัสเซีย หน่วยสังเกตการณ์ (วิสาหกิจขนาดเล็ก) ได้รับการคัดเลือกอย่างเชี่ยวชาญโดยคำนึงถึงการเป็นตัวแทนของภาคเศรษฐกิจจากตัวอย่างการสำรวจกิจกรรมทางการเงินและเศรษฐกิจของขนาดเล็กที่เกิดขึ้นแล้ว องค์กร (แบบฟอร์ม "ข้อมูลเกี่ยวกับตัวบ่งชี้หลักของกิจกรรมทางการเงินและเศรษฐกิจขององค์กรขนาดเล็ก") เมื่อสรุปข้อมูลตัวอย่างจะถือว่าตัวอย่างถูกสร้างขึ้นโดยวิธีการเลือกแบบสุ่มอย่างง่าย

โดยตรง การใช้วิจารณญาณของผู้เชี่ยวชาญ เป็นที่สุด วิธีการทั่วไปการรวมหน่วยในตัวอย่างโดยเจตนา ตัวอย่างของวิธีการเลือกดังกล่าวคือ วิธีเดียวซึ่งเกี่ยวข้องกับการได้รับข้อมูลจากหน่วยสังเกตการณ์เพียงหน่วยเดียว ซึ่งเป็นเรื่องปกติตามที่ผู้จัดสำรวจ - ผู้เชี่ยวชาญระบุ

ตัวอย่างขึ้นอยู่กับ การเลือกทิศทาง, ดำเนินการโดยใช้ขั้นตอนวัตถุประสงค์ แต่ไม่ใช้กลไกความน่าจะเป็น วิธีอาร์เรย์หลักเป็นที่รู้จักอย่างกว้างขวาง ซึ่งตัวอย่างประกอบด้วยหน่วยสังเกตที่ใหญ่ที่สุด (จำเป็น) ที่ให้การสนับสนุนหลักในตัวบ่งชี้ เช่น มูลค่ารวมคุณลักษณะที่แสดงถึงวัตถุประสงค์หลักของแบบสำรวจ

ในทางปฏิบัติทางสถิติมักใช้ วิธีการสังเกตทางสถิติแบบผสมผสาน การรวมกันของวิธีการสังเกตแบบต่อเนื่องและแบบเลือกมี 2 ลักษณะคือ

  • สลับเวลา;
  • การใช้งานพร้อมกัน (ส่วนหนึ่งของประชากรถูกสังเกตอย่างต่อเนื่องและบางส่วน - คัดเลือก)

สลับ การสุ่มตัวอย่างเป็นระยะด้วยการสำรวจหรือการสำรวจสำมะโนต่อเนื่องที่ค่อนข้างหายากเป็นสิ่งที่จำเป็นในการทำให้องค์ประกอบของประชากรที่ศึกษาชัดเจนขึ้น ข้อมูลนี้จะถูกใช้เป็น พื้นฐานทางสถิติการสังเกตแบบเลือก ตัวอย่างคือการสำรวจสำมะโนประชากรและการสำรวจตัวอย่างครัวเรือนในระหว่างนั้น

ที่ กรณีนี้ต้องการงานต่อไปนี้:

  • – การกำหนดองค์ประกอบของสัญญาณของการสังเกตอย่างต่อเนื่องซึ่งรับประกันการจัดกลุ่มตัวอย่าง
  • – การยืนยันช่วงเวลาของการสลับกัน เช่น เมื่อข้อมูลที่ต่อเนื่องไม่เกี่ยวข้องอีกต่อไปและจำเป็นต้องมีค่าใช้จ่ายในการอัปเดต

การใช้งานพร้อมกัน ภายในกรอบของการสำรวจแบบต่อเนื่องและการสังเกตตัวอย่างหนึ่งเนื่องมาจากความแตกต่างของประชากรที่พบในการปฏิบัติทางสถิติ นี่เป็นเรื่องจริงโดยเฉพาะอย่างยิ่งสำหรับการสำรวจกิจกรรมทางเศรษฐกิจของกลุ่มวิสาหกิจ ซึ่งมีลักษณะการกระจายตัวที่เบ้ของลักษณะที่กำลังศึกษา เมื่อหน่วยจำนวนหนึ่งมีลักษณะที่แตกต่างอย่างมากจากค่าจำนวนมาก ในกรณีนี้ หน่วยดังกล่าวจะถูกสังเกตอย่างต่อเนื่อง และส่วนอื่นๆ ของประชากรจะถูกสังเกตอย่างเลือกปฏิบัติ

ด้วยองค์กรแห่งการสังเกตการณ์ ภารกิจหลักคือ:

  • – การกำหนดสัดส่วนที่เหมาะสม;
  • – การพัฒนาวิธีการประเมินความถูกต้องของผลลัพธ์

ตัวอย่างทั่วไปที่แสดงแง่มุมนี้ของแอปพลิเคชัน วิธีการรวมกัน, เป็น หลักการทั่วไปดำเนินการสำรวจประชากรของวิสาหกิจตามการสำรวจประชากรของวิสาหกิจขนาดกลางและขนาดใหญ่ดำเนินการโดยวิธีต่อเนื่องเป็นหลัก และวิสาหกิจขนาดเล็กโดยวิธีตัวอย่าง

การพัฒนาเพิ่มเติมของวิธีการสุ่มตัวอย่างนั้นดำเนินการทั้งร่วมกับองค์กรของการสังเกตอย่างต่อเนื่องและผ่านองค์กรของการสำรวจพิเศษ การดำเนินการที่กำหนดโดยความต้องการที่จะได้รับ ข้อมูลเพิ่มเติมเพื่อแก้ปัญหาเฉพาะหน้า ดังนั้นองค์กรของการสำรวจในด้านเงื่อนไขและมาตรฐานการครองชีพของประชากรจึงมีไว้สำหรับสองด้าน:

องค์ประกอบบังคับอาจเป็นการสำรวจรายรับ รายจ่าย และการบริโภคประจำปี (คล้ายกับการสำรวจงบประมาณครัวเรือน) ซึ่งรวมถึงตัวชี้วัดพื้นฐานเกี่ยวกับสภาพความเป็นอยู่ของประชากรด้วย ทุกปีตามแผนพิเศษองค์ประกอบบังคับจะต้องเสริมด้วยการสำรวจครั้งเดียว (โมดูล) ของสภาพความเป็นอยู่ของประชากรโดยมุ่งเป้าไปที่ การศึกษาเชิงลึกเลือกใด ๆ ธีมทางสังคมของพวกเขา จำนวนทั้งหมด(เช่น ทรัพย์สินในครัวเรือน สุขภาพ โภชนาการ การศึกษา สภาพการทำงาน ที่อยู่อาศัย การพักผ่อน การเคลื่อนไหวทางสังคม, ความปลอดภัย ฯลฯ) ด้วยความถี่ที่แตกต่างกัน ซึ่งพิจารณาจากความต้องการตัวบ่งชี้และความสามารถของทรัพยากร

แนวคิดและการคำนวณข้อผิดพลาดในการสุ่มตัวอย่าง

งานของการสังเกตแบบเลือกปฏิบัติคือการให้แนวคิดที่ถูกต้องเกี่ยวกับตัวบ่งชี้สรุปของประชากรทั้งหมดโดยพิจารณาจากบางส่วนที่อยู่ภายใต้การสังเกต ค่าเบี่ยงเบนที่เป็นไปได้ของส่วนแบ่งตัวอย่างและค่าเฉลี่ยตัวอย่างจากส่วนแบ่งและค่าเฉลี่ยในประชากรทั่วไปเรียกว่า ข้อผิดพลาดในการสุ่มตัวอย่าง หรือ ข้อผิดพลาดในการเป็นตัวแทน ยิ่งค่าของข้อผิดพลาดนี้มีค่ามากเท่าใด ตัวบ่งชี้ของการสังเกตตัวอย่างก็ยิ่งแตกต่างจากของประชากรทั่วไปมากเท่านั้น

แตกต่าง:

ข้อผิดพลาดในการสุ่มตัวอย่าง

ข้อผิดพลาดในการลงทะเบียน

ข้อผิดพลาดในการลงทะเบียนเกิดขึ้นเมื่อมีการกำหนดข้อเท็จจริงอย่างไม่ถูกต้องในกระบวนการสังเกตการณ์ เป็นลักษณะเฉพาะของการสังเกตแบบต่อเนื่องและการสังเกตแบบเลือกเฟ้น แต่จะน้อยกว่าในการสังเกตแบบเลือก

ลักษณะของข้อผิดพลาดคือ:

มีแนวโน้ม - โดยเจตนาเช่น เลือกหน่วยที่ดีที่สุดหรือแย่ที่สุดของประชากร ในกรณีนี้ การสังเกตจะสูญเสียความหมายไป

สุ่ม - หลักการขององค์กรหลักของการสังเกตแบบเลือกคือการป้องกันการเลือกโดยเจตนาเช่น ให้ปฏิบัติตามหลักการสุ่มเลือกอย่างเคร่งครัด

กฎทั่วไปการเลือกแบบสุ่มคือ: แต่ละหน่วยของประชากรทั่วไปต้องมีเงื่อนไขและโอกาสที่จะตกอยู่ในจำนวนหน่วยที่รวมอยู่ในกลุ่มตัวอย่างเหมือนกันทุกประการ นี่เป็นลักษณะความเป็นอิสระของผลลัพธ์ตัวอย่างจากความประสงค์ของผู้สังเกต เจตจำนงของผู้สังเกตการณ์ทำให้เกิดข้อผิดพลาดที่มักเกิดขึ้น ข้อผิดพลาดในการสุ่มตัวอย่างคือ ตัวละครสุ่ม. เป็นลักษณะขนาดของส่วนเบี่ยงเบนของลักษณะทั่วไปจากตัวอย่าง

เนื่องจากลักษณะเฉพาะของประชากรที่ศึกษาแตกต่างกันไป องค์ประกอบของหน่วยในตัวอย่างอาจไม่ตรงกับองค์ประกอบของหน่วยของประชากรทั้งหมด มันหมายความว่า และไม่เข้ากับ และ . ความคลาดเคลื่อนที่เป็นไปได้ระหว่างลักษณะเหล่านี้ถูกกำหนดโดยข้อผิดพลาดในการสุ่มตัวอย่าง ซึ่งกำหนดโดยสูตร:

ที่ไหน - ความแปรปรวนทั่วไป.

ความแปรปรวนตัวอย่างอยู่ที่ไหน

สิ่งนี้แสดงให้เห็นว่าความแปรปรวนทั่วไปแตกต่างจากที่ใด ความแปรปรวนของตัวอย่างภายในเวลาที่กำหนด.

มีให้เลือกซ้ำและไม่ซ้ำ สาระสำคัญของการเลือกใหม่คือแต่ละหน่วยในตัวอย่าง หลังจากการสังเกต จะกลับไปยังประชากรทั่วไปและสามารถตรวจสอบซ้ำได้ เมื่อทำการสุ่มตัวอย่างใหม่ จะมีการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย:

สำหรับตัวบ่งชี้ส่วนแบ่งของแอตทริบิวต์ทางเลือก ความแปรปรวนตัวอย่างถูกกำหนดโดยสูตร:

ในทางปฏิบัติไม่ค่อยใช้การเลือกซ้ำ ที่ ไม่มีการเลือกใหม่, ขนาดประชากร เอ็นลดลงระหว่างการสุ่มตัวอย่าง สูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับแอตทริบิวต์เชิงปริมาณคือ:



, แล้ว

หนึ่งในค่าที่เป็นไปได้ซึ่งส่วนแบ่งของลักษณะที่ศึกษาสามารถเท่ากับ:

ข้อผิดพลาดในการสุ่มตัวอย่างคุณลักษณะทางเลือกอยู่ที่ไหน

ตัวอย่าง.

ที่ แบบสำรวจตัวอย่าง 10% ของผลิตภัณฑ์ในชุดผลิตภัณฑ์สำเร็จรูปตามวิธีการที่ไม่มีการเลือกใหม่ได้รับข้อมูลต่อไปนี้เกี่ยวกับความชื้นในตัวอย่าง

หาความชื้นเฉลี่ย % ความแปรปรวน ส่วนเบี่ยงเบนมาตรฐาน มีค่าความน่าจะเป็นเท่ากับ 0.954 ขีดจำกัดที่เป็นไปได้ซึ่งเราคาดว่าcf. % ความชื้นของผลิตภัณฑ์สำเร็จรูปทั้งหมด โดยมีความเป็นไปได้ที่ 0.987 ขีดจำกัดที่เป็นไปได้ แรงดึงดูดเฉพาะผลิตภัณฑ์มาตรฐาน โดยมีเงื่อนไขว่าล็อตที่ไม่ได้มาตรฐานรวมถึงผลิตภัณฑ์ที่มีความชื้นสูงถึง 13 และสูงกว่า 19%

ด้วยความน่าจะเป็นเท่านั้นที่สามารถโต้แย้งได้ว่าส่วนแบ่งทั่วไปของส่วนแบ่งตัวอย่างและค่าเฉลี่ยทั่วไปของค่าเฉลี่ยตัวอย่างเบี่ยงเบนไปใน ทีครั้งหนึ่ง.

ในทางสถิติจะเรียกความเบี่ยงเบนเหล่านี้ว่า ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อย และมีการทำเครื่องหมาย

ความน่าจะเป็นของการตัดสินสามารถเพิ่มหรือลดลงได้ ทีครั้งหนึ่ง. ด้วยความน่าจะเป็น 0.683, 0.954, กับ 0.987 จากนั้นตัวบ่งชี้ของประชากรทั่วไปจะถูกกำหนดโดยตัวบ่งชี้ของกลุ่มตัวอย่าง

อย่างที่เราทราบกันดีอยู่แล้ว ความเป็นตัวแทนเป็นคุณสมบัติของกลุ่มตัวอย่างที่แสดงถึงคุณลักษณะของประชากรทั่วไป หากไม่มีการจับคู่พวกเขาจะพูดถึงข้อผิดพลาดในการเป็นตัวแทน - การวัดความเบี่ยงเบนของโครงสร้างทางสถิติของตัวอย่างจากโครงสร้างของประชากรทั่วไปที่สอดคล้องกัน สมมติว่ารายได้ครอบครัวเฉลี่ยต่อเดือนของผู้รับบำนาญในประชากรทั่วไปคือ 2,000 รูเบิลและในตัวอย่าง - 6,000 รูเบิล ซึ่งหมายความว่านักสังคมวิทยาสัมภาษณ์เฉพาะผู้รับบำนาญที่มีฐานะร่ำรวย และข้อผิดพลาดในการเป็นตัวแทนก็พุ่งเข้ามาในการศึกษาของเขา กล่าวอีกนัยหนึ่งข้อผิดพลาดในการเป็นตัวแทนคือความแตกต่างระหว่างสองชุด - ชุดทั่วไปซึ่งมุ่งความสนใจทางทฤษฎีของนักสังคมวิทยาและแนวคิดเกี่ยวกับคุณสมบัติที่เขาต้องการได้รับในตอนท้ายและชุดที่เลือก ซึ่งมุ่งความสนใจในทางปฏิบัติของนักสังคมวิทยาซึ่งทำหน้าที่เป็นทั้งวัตถุในการตรวจสอบและวิธีการรับข้อมูลเกี่ยวกับประชากรทั่วไป

นอกเหนือจากคำว่า "ข้อผิดพลาดในการเป็นตัวแทน" ในเอกสารในประเทศแล้ว คุณสามารถค้นหาอีก - "ข้อผิดพลาดในการสุ่มตัวอย่าง" บางครั้งใช้แทนกันได้ และบางครั้งใช้ "ข้อผิดพลาดในการสุ่มตัวอย่าง" แทน "ข้อผิดพลาดในการเป็นตัวแทน" เป็นแนวคิดเชิงปริมาณที่แม่นยำกว่า

ข้อผิดพลาดในการสุ่มตัวอย่างคือการเบี่ยงเบนของลักษณะเฉลี่ยของประชากรตัวอย่างจากลักษณะเฉลี่ยของประชากรทั่วไป

ในทางปฏิบัติ ข้อผิดพลาดในการสุ่มตัวอย่างถูกกำหนดโดยการเปรียบเทียบคุณลักษณะที่ทราบของประชากรกับค่าเฉลี่ยของตัวอย่าง ในสังคมวิทยา การสำรวจประชากรผู้ใหญ่มักใช้ข้อมูลจากสำมะโนประชากร บันทึกทางสถิติปัจจุบัน และผลการสำรวจครั้งก่อน มักใช้ลักษณะทางสังคมและประชากรเป็นพารามิเตอร์ควบคุม การเปรียบเทียบค่าเฉลี่ยของประชากรทั่วไปและกลุ่มตัวอย่าง บนพื้นฐานของสิ่งนี้ การกำหนดข้อผิดพลาดในการสุ่มตัวอย่างและการลดลงเรียกว่าการควบคุมความเป็นตัวแทน เนื่องจากเมื่อสิ้นสุดการศึกษาสามารถเปรียบเทียบข้อมูลของตนเองและของผู้อื่นได้ วิธีการควบคุมนี้จึงเรียกว่าหลัง (posteriori) กล่าวคือ ดำเนินการหลังจากมีประสบการณ์

ในการสำรวจความคิดเห็นของ Gallup ความเป็นตัวแทนถูกควบคุมโดยข้อมูลที่มีอยู่ในสำมะโนแห่งชาติเกี่ยวกับการกระจายตัวของประชากรตามเพศ อายุ การศึกษา รายได้ อาชีพ เชื้อชาติ สถานที่อยู่อาศัย ขนาด ท้องที่. ศูนย์วิจัยออลรัสเซีย ความคิดเห็นของประชาชน(VTsIOM) ใช้เพื่อวัตถุประสงค์ดังกล่าว เช่น ตัวบ่งชี้เพศ อายุ การศึกษา ประเภทของการตั้งถิ่นฐาน สถานภาพการสมรส, ขอบเขตของการจ้างงาน, สถานะอย่างเป็นทางการของผู้ตอบแบบสอบถามซึ่งยืมมาจากคณะกรรมการแห่งรัฐเกี่ยวกับสถิติของสหพันธรัฐรัสเซีย ในทั้งสองกรณี ประชากรเป็นที่รู้จัก ไม่สามารถสร้างข้อผิดพลาดในการสุ่มตัวอย่างหากไม่ทราบค่าของตัวแปรในตัวอย่างและประชากร

ในระหว่างการวิเคราะห์ข้อมูล ผู้เชี่ยวชาญของ VTsIOM จะทำการซ่อมแซมตัวอย่างอย่างละเอียดถี่ถ้วน เพื่อลดความเบี่ยงเบนที่เกิดขึ้นระหว่าง งานภาคสนาม. การเปลี่ยนแปลงที่รุนแรงโดยเฉพาะอย่างยิ่งจะสังเกตได้ในแง่ของเพศและอายุ สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าผู้หญิงและผู้ที่มี อุดมศึกษาใช้เวลาที่บ้านมากขึ้นและติดต่อกับผู้สัมภาษณ์ได้ง่ายขึ้น เป็นกลุ่มที่เข้าถึงได้ง่ายเมื่อเทียบกับผู้ชายและคนที่ “ไม่มีการศึกษา”35

ข้อผิดพลาดในการสุ่มตัวอย่างเกิดจากปัจจัย 2 ประการ ได้แก่ วิธีการสุ่มตัวอย่างและขนาดตัวอย่าง

ข้อผิดพลาดในการสุ่มตัวอย่างแบ่งออกเป็นสองประเภท - สุ่มและเป็นระบบ ข้อผิดพลาดแบบสุ่มคือความน่าจะเป็นที่ค่าเฉลี่ยตัวอย่างจะ (หรือไม่เกิน) เกิน ช่วงเวลาที่กำหนด. ข้อผิดพลาดแบบสุ่มรวมถึงข้อผิดพลาดทางสถิติที่มีอยู่ในวิธีการสุ่มตัวอย่างเอง ลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น

ข้อผิดพลาดในการสุ่มตัวอย่างประเภทที่สองคือข้อผิดพลาดอย่างเป็นระบบ หากนักสังคมวิทยาตัดสินใจที่จะค้นหาความคิดเห็นของผู้อยู่อาศัยทั้งหมดในเมืองเกี่ยวกับเหตุการณ์ที่เกิดขึ้น หน่วยงานท้องถิ่นผู้มีอำนาจในนโยบายสังคมและสัมภาษณ์เฉพาะผู้ที่มีโทรศัพท์แล้วมีอคติโดยเจตนาในกลุ่มตัวอย่างที่เข้าข้างกลุ่มคนร่ำรวยเช่น ข้อผิดพลาดอย่างเป็นระบบ

ดังนั้นข้อผิดพลาดอย่างเป็นระบบจึงเป็นผลมาจากกิจกรรมของนักวิจัยเอง พวกเขาเป็นสิ่งที่อันตรายที่สุดเพราะนำไปสู่อคติที่ค่อนข้างสำคัญในผลการศึกษา ข้อผิดพลาดอย่างเป็นระบบถือว่าแย่กว่าข้อผิดพลาดแบบสุ่มเช่นกัน เนื่องจากไม่สามารถควบคุมและวัดผลได้

เกิดขึ้นเมื่อ: 1) ตัวอย่างไม่ตรงตามวัตถุประสงค์ของการศึกษา (นักสังคมวิทยาตัดสินใจศึกษาเฉพาะผู้รับบำนาญที่ทำงาน แต่สัมภาษณ์ทุกคนในแถว) 2) มีความไม่รู้ในธรรมชาติของประชากรทั่วไป (นักสังคมวิทยาคิดว่า 70% ของผู้รับบำนาญทั้งหมดไม่ทำงาน แต่ปรากฎว่ามีเพียง 10% เท่านั้นที่ไม่ได้ทำงาน) 3) เลือกเฉพาะองค์ประกอบที่ "ชนะ" ของประชากรทั่วไปเท่านั้น (เช่น ผู้รับบำนาญที่ร่ำรวยเท่านั้น)

ความสนใจ! ซึ่งแตกต่างจากข้อผิดพลาดแบบสุ่ม ข้อผิดพลาดอย่างเป็นระบบจะไม่ลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น

สรุปกรณีทั้งหมดที่เกิดข้อผิดพลาดอย่างเป็นระบบ นักระเบียบวิธีได้รวบรวมทะเบียนของพวกเขา พวกเขาเชื่อว่าแหล่งที่มาของอคติที่ไม่มีการควบคุมในการกระจายตัวของการสังเกตอาจเป็นได้ ปัจจัยดังต่อไปนี้:
♦ กฎระเบียบวิธีและระเบียบวิธีปฏิบัติ การวิจัยทางสังคมวิทยา;
♦ เลือกวิธีการสุ่มตัวอย่าง การรวบรวมข้อมูล และวิธีการคำนวณไม่เพียงพอ
♦ มีการแทนที่หน่วยสังเกตการณ์ที่ต้องการโดยผู้อื่น เข้าถึงได้มากขึ้น
♦ สังเกตความครอบคลุมของประชากรตัวอย่างที่ไม่สมบูรณ์ (การขาดแคลนแบบสอบถาม การกรอกแบบสอบถามไม่ครบถ้วน การเข้าไม่ถึงหน่วยสังเกตการณ์)

นักสังคมวิทยาไม่ค่อยทำผิดพลาดโดยเจตนา บ่อยครั้งที่ข้อผิดพลาดเกิดขึ้นเนื่องจากนักสังคมวิทยาไม่ตระหนักดีถึงโครงสร้างของประชากรทั่วไป: การกระจายตัวของผู้คนตามอายุ อาชีพ รายได้ และอื่นๆ

ข้อผิดพลาดอย่างเป็นระบบนั้นป้องกันได้ง่ายกว่า (เมื่อเทียบกับข้อผิดพลาดแบบสุ่ม) แต่กำจัดได้ยากมาก เป็นการดีที่สุดที่จะป้องกันข้อผิดพลาดอย่างเป็นระบบโดยคาดการณ์แหล่งที่มาล่วงหน้าอย่างแม่นยำ - ในช่วงเริ่มต้นของการศึกษา

วิธีหลีกเลี่ยงข้อผิดพลาดในการสุ่มตัวอย่างมีดังนี้
♦ แต่ละหน่วยของประชากรทั่วไปต้องมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในกลุ่มตัวอย่าง
♦ เป็นที่พึงปรารถนาที่จะเลือกจากประชากรที่เป็นเนื้อเดียวกัน;
♦ จำเป็นต้องรู้ลักษณะของประชากรทั่วไป
♦ ควรคำนึงถึงข้อผิดพลาดแบบสุ่มและเป็นระบบเมื่อรวบรวมตัวอย่าง

หากตัวอย่าง (หรือเพียงแค่ตัวอย่าง) ถูกวาดขึ้นอย่างถูกต้อง นักสังคมวิทยาจะได้ผลลัพธ์ที่เชื่อถือได้ซึ่งระบุลักษณะของประชากรทั้งหมด หากรวบรวมอย่างไม่ถูกต้อง ข้อผิดพลาดที่เกิดขึ้นในขั้นตอนของการสุ่มตัวอย่างจะทวีคูณในแต่ละขั้นตอนต่อมาของการวิจัยทางสังคมวิทยา และในที่สุดก็ถึงค่าที่เกินดุลของการศึกษา ว่ากันว่าการวิจัยดังกล่าวส่งผลเสียมากกว่าผลดี

ข้อผิดพลาดดังกล่าวสามารถเกิดขึ้นได้กับกลุ่มตัวอย่างเท่านั้น เพื่อหลีกเลี่ยงหรือลดความน่าจะเป็นของข้อผิดพลาด วิธีที่ง่ายที่สุดคือการเพิ่มขนาดตัวอย่าง (ตามหลักการแล้วให้เท่ากับขนาดของประชากร: เมื่อประชากรทั้งสองตรงกัน ข้อผิดพลาดของตัวอย่างจะหายไปโดยสิ้นเชิง) ในทางเศรษฐกิจ วิธีนี้เป็นไปไม่ได้ มีวิธีอื่น - เพื่อปรับปรุง วิธีการทางคณิตศาสตร์การสุ่มตัวอย่าง นำไปใช้ในทางปฏิบัติ นี่เป็นช่องทางแรกของการเข้าสู่สังคมวิทยาของคณิตศาสตร์ ช่องที่สอง - การประมวลผลทางคณิตศาสตร์ข้อมูล.

โดยเฉพาะ ปัญหาสำคัญข้อผิดพลาดกลายเป็นในการวิจัยการตลาดซึ่งใช้กลุ่มตัวอย่างไม่มากนัก โดยปกติแล้วจะมีหลายร้อยคน แต่น้อยกว่านั้น - ผู้ตอบแบบสอบถามหนึ่งพันคน ที่นี่ จุดเริ่มต้นสำหรับการคำนวณตัวอย่างคือคำถามของการกำหนดขนาดของประชากรตัวอย่าง ขนาดตัวอย่างขึ้นอยู่กับปัจจัยสองประการ: 1) ค่าใช้จ่ายในการรวบรวมข้อมูลและ 2) ความพยายามในระดับหนึ่ง ความถูกต้องทางสถิติผลลัพธ์ที่ผู้วิจัยหวังว่าจะได้รับ แน่นอน แม้แต่คนที่ไม่มีประสบการณ์ด้านสถิติและสังคมวิทยาก็เข้าใจได้โดยสัญชาตญาณว่ายิ่งกลุ่มตัวอย่างมีขนาดใหญ่เท่าไร นั่นคือ ยิ่งเข้าใกล้ขนาดของประชากรโดยรวมมากเท่าใด ข้อมูลที่ได้รับก็ยิ่งน่าเชื่อถือและน่าเชื่อถือมากขึ้นเท่านั้น อย่างไรก็ตาม เราได้พูดไปแล้วข้างต้นเกี่ยวกับความเป็นไปไม่ได้ในทางปฏิบัติของการสำรวจทั้งหมดในกรณีเหล่านั้น เมื่อดำเนินการกับวัตถุที่มีจำนวนเกินกว่าหมื่น แสน และแม้แต่นับล้าน เป็นที่ชัดเจนว่าค่าใช้จ่ายในการเก็บรวบรวมข้อมูล (รวมถึงการชำระเงินสำหรับการจำลองแบบของเครื่องมือ แรงงานของแบบสอบถาม ผู้จัดการภาคสนาม และผู้ดำเนินการป้อนข้อมูลด้วยคอมพิวเตอร์) ขึ้นอยู่กับจำนวนเงินที่ลูกค้ายินดีจัดสรร และขึ้นอยู่กับนักวิจัยเพียงเล็กน้อย สำหรับปัจจัยที่สองเราจะพิจารณารายละเอียดเพิ่มเติมเล็กน้อย

ดังนั้น ยิ่งขนาดตัวอย่างใหญ่ขึ้น ข้อผิดพลาดที่เป็นไปได้ก็จะยิ่งน้อยลงเท่านั้น แม้ว่าควรสังเกตว่าหากคุณต้องการเพิ่มความแม่นยำเป็นสองเท่า คุณจะต้องเพิ่มจำนวนตัวอย่างไม่ใช่สองเท่า แต่เพิ่มขึ้นสี่เท่า เช่น ให้ทำสองเท่า ประมาณการที่แม่นยำข้อมูลที่ได้จากการสัมภาษณ์ 400 คน คุณต้องสัมภาษณ์ไม่ใช่ 800 คน แต่เป็น 1,600 คน อย่างไรก็ตาม การวิจัยการตลาดไม่น่าจะต้องการความแม่นยำ 100% หากผู้ผลิตเบียร์ต้องการทราบว่าผู้บริโภคเบียร์ชอบแบรนด์ของตนในสัดส่วนใด ไม่ใช่ความหลากหลายของคู่แข่ง - 60% หรือ 40% ดังนั้นความแตกต่างระหว่าง 57%, 60 หรือ 63% จะไม่ส่งผลกระทบต่อแผนของเขา

ข้อผิดพลาดในการสุ่มตัวอย่างอาจไม่ได้ขึ้นอยู่กับขนาดของมันเท่านั้น แต่ยังขึ้นอยู่กับระดับของความแตกต่างระหว่างแต่ละหน่วยภายในประชากรทั่วไปที่เรากำลังศึกษาด้วย ตัวอย่างเช่น หากเราต้องการทราบว่ามีการบริโภคเบียร์เท่าใด เราจะพบว่าภายในประชากรของเรา อัตราการบริโภคสำหรับ ผู้คนหลากหลายแตกต่างกันอย่างมีนัยสำคัญ (ประชากรทั่วไปต่างกัน) อีกกรณีหนึ่งเราจะศึกษาการบริโภคขนมปังและพบว่า ผู้คนที่หลากหลายมันแตกต่างกันอย่างมีนัยสำคัญน้อยกว่ามาก (ประชากรที่เป็นเนื้อเดียวกัน) ยิ่งความแตกต่าง (หรือ heterogeneity) ภายในประชากรมีมากเท่าใด จำนวนข้อผิดพลาดในการสุ่มตัวอย่างก็จะยิ่งมากขึ้นเท่านั้น ความสม่ำเสมอนี้เป็นเพียงการยืนยันสิ่งที่เรียบง่ายเท่านั้น กึ๋น. ดังที่ V. Yadov กล่าวอย่างถูกต้อง "ขนาด (ปริมาตร) ของตัวอย่างขึ้นอยู่กับระดับของความเป็นเนื้อเดียวกันหรือความไม่เหมือนกันของวัตถุที่ศึกษา ยิ่งมีความเป็นเนื้อเดียวกันมากเท่าใด จำนวนที่น้อยลงก็สามารถให้ข้อสรุปที่น่าเชื่อถือทางสถิติได้

การกำหนดขนาดตัวอย่างยังขึ้นอยู่กับระดับของช่วงความเชื่อมั่นของข้อผิดพลาดทางสถิติที่อนุญาต ในที่นี้เราหมายถึงข้อผิดพลาดแบบสุ่มซึ่งเกี่ยวข้องกับธรรมชาติของข้อผิดพลาดทางสถิติใดๆ ในและ Paniotto ให้การคำนวณต่อไปนี้ ตัวอย่างตัวแทนด้วยสมมติฐานของข้อผิดพลาด 5%:
ซึ่งหมายความว่าหากคุณสัมภาษณ์คน 400 คนในเขตเมืองซึ่งมีประชากรผู้ใหญ่ 100,000 คนพบว่า 33% ของผู้ซื้อที่ทำแบบสำรวจชอบผลิตภัณฑ์ของโรงงานแปรรูปเนื้อสัตว์ในท้องถิ่น จากนั้นด้วย 95 % ความน่าจะเป็น คุณสามารถพูดได้ว่า 33+5% (เช่น จาก 28 เป็น 38%) ของชาวเมืองนี้เป็นผู้ซื้อสินค้าเหล่านี้เป็นประจำ

คุณยังสามารถใช้การคำนวณของ Gallup เพื่อประเมินอัตราส่วนของขนาดตัวอย่างและข้อผิดพลาดในการสุ่มตัวอย่าง