ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

สูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างกำลังสองเฉลี่ย สูตรข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

ที่ การสังเกตแบบเลือกสรรจะต้องมั่นใจ อุบัติเหตุการเลือกหน่วย แต่ละหน่วยจะต้องมีโอกาสถูกเลือกเท่ากัน นี่คือสิ่งที่กลุ่มตัวอย่างสุ่มใช้

ถึง ตัวอย่างสุ่มจริง หมายถึงการเลือกหน่วยจากทั้งหมด ประชากร(โดยไม่ได้แบ่งเป็นกลุ่มๆ ก่อน) โดยการจับสลาก (เป็นหลัก) หรือวิธีอื่นที่คล้ายคลึงกัน เช่น ใช้ตาราง ตัวเลขสุ่ม. สุ่มเลือก- การเลือกนี้ไม่ใช่การสุ่ม หลักการของการสุ่มสันนิษฐานว่าการรวมหรือแยกวัตถุออกจากตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยอื่นใดนอกจากความบังเอิญ ตัวอย่าง สุ่มจริงๆการเลือกสามารถใช้เป็นผลเสมอได้: จาก จำนวนทั้งหมดของตั๋วที่ออก ส่วนหนึ่งของตัวเลขจะถูกสุ่มเลือกและเงินรางวัลจะตกอยู่กับตั๋วเหล่านั้น นอกจากนี้ ตัวเลขทั้งหมดยังมีโอกาสที่เท่าเทียมกันในการรวมไว้ในตัวอย่าง ในกรณีนี้ จำนวนหน่วยที่เลือกในประชากรตัวอย่างมักจะถูกกำหนดตามสัดส่วนตัวอย่างที่ยอมรับ

แชร์ตัวอย่าง คืออัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไป:

ดังนั้นด้วยตัวอย่าง 5% จากชุดชิ้นส่วน 1,000 หน่วย ขนาดตัวอย่าง nคือ 50 หน่วยและด้วยตัวอย่าง 10% - 100 หน่วย ฯลฯ ด้วยสิทธิ องค์กรทางวิทยาศาสตร์ข้อผิดพลาดในการสุ่มตัวอย่างของการเป็นตัวแทนสามารถลดลงได้ ค่าต่ำสุดเป็นผลให้การสังเกตแบบเลือกสรรมีความแม่นยำมาก

จริงๆแล้วการสุ่มเลือก”ใน รูปแบบบริสุทธิ์“ไม่ค่อยมีการใช้ในทางปฏิบัติของการสังเกตแบบเลือกสรร แต่เป็นแบบดั้งเดิมในบรรดาการเลือกประเภทอื่นๆ ทั้งหมด ประกอบด้วยและนำหลักการพื้นฐานของการสังเกตแบบเลือกสรรไปใช้

ลองพิจารณาคำถามบางข้อเกี่ยวกับทฤษฎีวิธีการสุ่มตัวอย่างและสูตรข้อผิดพลาดสำหรับตัวอย่างสุ่มอย่างง่าย

เมื่อใช้วิธีการสุ่มตัวอย่างในสถิติ มักจะใช้ตัวบ่งชี้ทั่วไปสองประเภทหลัก: ค่าเฉลี่ยของลักษณะเชิงปริมาณและ ค่าสัมพัทธ์ของคุณลักษณะทางเลือก(ส่วนแบ่งหรือน้ำหนักเฉพาะของหน่วยในประชากรทางสถิติที่แตกต่างจากหน่วยอื่น ๆ ทั้งหมดของประชากรนี้เฉพาะเมื่อมีลักษณะเฉพาะที่กำลังศึกษาอยู่)

การแบ่งปันแบบเลือกสรร (ญ)หรือความถี่ที่กำหนดโดยอัตราส่วนของจำนวนหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา ที,ถึง จำนวนทั้งหมดหน่วยตัวอย่าง พี:

ตัวอย่างเช่น หากรายละเอียดตัวอย่างจากทั้งหมด 100 รายการ ( n=100) 95 ชิ้นกลายเป็นมาตรฐาน (ท=95) จากนั้นเศษส่วนตัวอย่าง

=95/100=0,95 .

เพื่อระบุลักษณะความน่าเชื่อถือของตัวบ่งชี้ตัวอย่าง เฉลี่ยและ ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด

ข้อผิดพลาดในการสุ่มตัวอย่าง - หรืออีกนัยหนึ่ง ข้อผิดพลาดในการเป็นตัวแทนคือความแตกต่างระหว่างตัวอย่างที่เกี่ยวข้องและคุณลักษณะทั่วไป:

*

*

ข้อผิดพลาดในการสุ่มตัวอย่างเป็นลักษณะเฉพาะของการสังเกตตัวอย่างเท่านั้น ยังไง มีคุณค่ามากขึ้นข้อผิดพลาดนี้ ยิ่งตัวบ่งชี้ตัวอย่างแตกต่างจากตัวบ่งชี้ทั่วไปที่เกี่ยวข้องมากเท่านั้น

ค่าเฉลี่ยตัวอย่างและส่วนแบ่งตัวอย่างมีอยู่โดยธรรมชาติ ตัวแปรสุ่ม, ซึ่งสามารถรับค่าที่แตกต่างกันได้ขึ้นอยู่กับหน่วยประชากรที่รวมอยู่ในกลุ่มตัวอย่าง ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างจึงเป็นตัวแปรสุ่มและสามารถรับได้ ความหมายที่แตกต่างกัน- ดังนั้นจึงกำหนดค่าเฉลี่ยของข้อผิดพลาดที่เป็นไปได้ - ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

มันขึ้นอยู่กับอะไร? ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย?หากปฏิบัติตามหลักการของการเลือกแบบสุ่ม ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะถูกกำหนดเป็นอันดับแรก ขนาดตัวอย่าง:ยังไง ตัวเลขมากขึ้นนอกเหนือจากนั้น เงื่อนไขที่เท่าเทียมกันยิ่งข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยน้อยลงเท่านั้น การปกปิด แบบสำรวจตัวอย่างทั้งหมด มากกว่าหน่วยของประชากรทั่วไป เราจะระบุลักษณะของประชากรทั่วไปทั้งหมดได้แม่นยำยิ่งขึ้น

ข้อผิดพลาดโดยเฉลี่ยการสุ่มตัวอย่างยังขึ้นอยู่กับ ระดับของการเปลี่ยนแปลงลักษณะที่กำลังศึกษาอยู่ ระดับของการแปรผันตามที่ทราบกันดีนั้นมีลักษณะเฉพาะคือการกระจายตัว? 2 หรือ w(1-w)-- เพื่อเป็นสัญญาณทางเลือก ยิ่งความแปรผันของคุณลักษณะน้อยและการกระจายตัวน้อยลง ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลง และในทางกลับกัน เมื่อการกระจายตัวเป็นศูนย์ (คุณลักษณะไม่เปลี่ยนแปลง) ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะเป็นศูนย์ กล่าวคือ หน่วยใดๆ ในประชากรทั่วไปจะระบุลักษณะเฉพาะของประชากรทั้งหมดตามคุณลักษณะนี้ได้อย่างแม่นยำ

การพึ่งพาข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยกับปริมาตรและระดับของการเปลี่ยนแปลงของคุณลักษณะนั้นสะท้อนให้เห็นในสูตรที่สามารถใช้เพื่อคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยภายใต้เงื่อนไขของการสังเกตแบบเลือกเมื่อลักษณะทั่วไป ( เอ็กซ์,พี)ไม่ทราบ จึงดูเหมือนเป็นไปไม่ได้ที่จะค้นหาข้อผิดพลาดในการสุ่มตัวอย่างจริงโดยตรงโดยใช้สูตร (แบบฟอร์ม 1) (แบบฟอร์ม 2)

โดยบังเอิญ การคัดเลือกใหม่ ข้อผิดพลาดโดยเฉลี่ยคำนวณตามทฤษฎีโดยใช้สูตรต่อไปนี้:

* สำหรับค่าเฉลี่ย ลักษณะเชิงปริมาณ

* สำหรับการแบ่งปัน (คุณลักษณะทางเลือก)

เนื่องจากในทางปฏิบัติแล้วความแปรปรวนของคุณลักษณะในประชากร? 2 ยังไม่ทราบแน่ชัด ในทางปฏิบัติจะใช้ค่าของการกระจาย S 2 ที่คำนวณสำหรับประชากรตัวอย่างตามกฎหมาย จำนวนมากตามนั้น ประชากรตัวอย่างด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ จึงสามารถจำลองลักษณะของประชากรทั่วไปได้อย่างแม่นยำ

ดังนั้น, สูตรการคำนวณ เฉลี่ย ข้อผิดพลาดในการสุ่มตัวอย่าง ด้วยการสุ่มเลือกใหม่จะได้ดังต่อไปนี้:

* สำหรับคุณลักษณะเชิงปริมาณเฉลี่ย

* สำหรับการแบ่งปัน (คุณลักษณะทางเลือก)

อย่างไรก็ตาม การกระจายตัวของประชากรตัวอย่างไม่เท่ากับการกระจายตัวของประชากรทั่วไป ดังนั้น ค่าคลาดเคลื่อนในการสุ่มตัวอย่างโดยเฉลี่ยที่คำนวณโดยใช้สูตร (แบบ 5) และ (แบบ 6) จึงเป็นค่าประมาณ แต่ในทฤษฎีความน่าจะเป็นนั้น ได้รับการพิสูจน์แล้ว ความแปรปรวนทั่วไปแสดงออกผ่านวิชาเลือกด้วยความสัมพันธ์ดังต่อไปนี้:

เพราะ หน้า/(n-1) สำหรับขนาดใหญ่เพียงพอ พี --ค่าใกล้เคียงกับความสามัคคี ดังนั้นในการคำนวณเชิงปฏิบัติของข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย จึงสามารถใช้สูตร (แบบฟอร์ม 5) และ (แบบฟอร์ม 6) ได้ และเฉพาะในกรณีตัวอย่างขนาดเล็กเท่านั้น (เมื่อขนาดตัวอย่างไม่เกิน 30) จำเป็นต้องคำนึงถึงค่าสัมประสิทธิ์ n/(n-1) และคำนวณ ข้อผิดพลาดเฉลี่ยตัวอย่างขนาดเล็กตามสูตร:

ดับบลิว เอ็กซ์ ด้วยการสุ่มเลือกแบบไม่ซ้ำกัน ในสูตรข้างต้นสำหรับการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย จำเป็นต้องคูณนิพจน์รากด้วย 1-(n/N) เนื่องจากในกระบวนการสุ่มตัวอย่างแบบไม่ทำซ้ำ จำนวนหน่วยในประชากรทั่วไปจะลดลง ดังนั้นสำหรับการสุ่มตัวอย่างแบบไม่ซ้ำกัน สูตรการคำนวณ ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย จะอยู่ในรูปแบบต่อไปนี้:

* สำหรับคุณลักษณะเชิงปริมาณเฉลี่ย

* สำหรับการแบ่งปัน (คุณลักษณะทางเลือก)

- (แบบ.10)

เพราะ nน้อยลงเสมอ เอ็นแล้วปัจจัยเพิ่มเติม 1-( ไม่มี/ไม่มี) จะน้อยกว่าหนึ่งเสมอ ตามมาว่าข้อผิดพลาดโดยเฉลี่ยระหว่างการเลือกแบบไม่ซ้ำจะน้อยกว่าระหว่างการเลือกซ้ำเสมอ ในเวลาเดียวกัน ด้วยเปอร์เซ็นต์ของกลุ่มตัวอย่างที่ค่อนข้างน้อย ตัวคูณนี้จึงใกล้เคียงกับความสามัคคี (เช่น ด้วยตัวอย่าง 5% จะได้ 0.95; ด้วยตัวอย่าง 2% จะได้ 0.98 เป็นต้น) ดังนั้นบางครั้งในทางปฏิบัติพวกเขาจึงใช้สูตร (แบบฟอร์ม 5) และ (แบบฟอร์ม 6) โดยไม่มีตัวคูณที่ระบุเพื่อระบุข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย แม้ว่าตัวอย่างจะถูกจัดเป็นแบบไม่ซ้ำกันก็ตาม กรณีนี้เกิดขึ้นในกรณีที่ไม่ทราบจำนวนหน่วยในประชากร N หรือไม่จำกัด หรือเมื่อใด nน้อยมากเมื่อเทียบกับ เอ็นและโดยพื้นฐานแล้ว การนำตัวคูณเพิ่มเติมเข้ามาซึ่งมีมูลค่าใกล้เคียงกับเอกภาพ แทบจะไม่มีผลกระทบต่อค่าของข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

การสุ่มตัวอย่างทางกล คือการเลือกหน่วยเป็นประชากรตัวอย่างจากประชากรทั่วไปโดยแบ่งตามเกณฑ์ที่เป็นกลางออกเป็น ช่วงเวลาเท่ากัน(กลุ่ม) ดำเนินการในลักษณะที่จะเลือกหน่วยเดียวสำหรับตัวอย่างจากแต่ละกลุ่มดังกล่าว เพื่อหลีกเลี่ยงอคติ ควรเลือกหน่วยที่อยู่ตรงกลางแต่ละกลุ่ม

เมื่อจัดการคัดเลือกทางกลหน่วยของประชากรจะถูกจัดเรียงเบื้องต้น (โดยปกติจะอยู่ในรายการ) ตามลำดับที่แน่นอน (เช่นตามตัวอักษรตำแหน่งโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปน้อยของค่าของตัวบ่งชี้บางตัวที่ไม่เกี่ยวข้องกับทรัพย์สิน กำลังศึกษาอยู่ ฯลฯ ) เป็นต้น) หลังจากนั้นจะมีการเลือกหน่วยตามจำนวนที่กำหนดในช่วงเวลาหนึ่ง ในกรณีนี้ ขนาดของช่วงเวลาในประชากรจะเท่ากับ คุณค่าซึ่งกันและกันหุ้นตัวอย่าง ดังนั้น ด้วยตัวอย่าง 2% ทุก ๆ หน่วยที่ 50 จะถูกเลือกและตรวจสอบ (1: 0.02) โดยมีตัวอย่าง 5% - ทุกๆ หน่วยที่ 20 (1: 0.05) เช่น ชิ้นส่วนที่มาบรรจบกันจากเครื่องจักร

เมื่อเพียงพอ ประชากรจำนวนมากการเลือกกลไกนั้นใกล้เคียงกับการสุ่มล้วนๆ ในแง่ของความแม่นยำของผลลัพธ์ ดังนั้น เพื่อกำหนดความคลาดเคลื่อนโดยเฉลี่ยของการสุ่มตัวอย่างเชิงกล จึงใช้สูตรสำหรับการสุ่มตัวอย่างแบบไม่ซ้ำซ้อนที่เหมาะสม (แบบฟอร์ม 9) (แบบฟอร์ม 10)

เพื่อเลือกหน่วยจากประชากรที่แตกต่างกันที่เรียกว่า ตัวอย่างทั่วไป , ซึ่งใช้ในกรณีที่ทุกหน่วยของประชากรทั่วไปสามารถแบ่งออกเป็นกลุ่มที่มีคุณภาพเป็นเนื้อเดียวกันและคล้ายคลึงกันหลายกลุ่มตามลักษณะที่มีอิทธิพลต่อตัวบ่งชี้ที่กำลังศึกษา

เมื่อสำรวจวิสาหกิจ กลุ่มดังกล่าวอาจเป็นรูปแบบการเป็นเจ้าของ เช่น อุตสาหกรรมและอุตสาหกรรมย่อย จากนั้น จากกลุ่มทั่วไปแต่ละกลุ่ม จะมีการใช้ตัวอย่างแบบสุ่มหรือตัวอย่างเชิงกลเพื่อเลือกหน่วยต่างๆ ในกลุ่มตัวอย่าง

การสุ่มตัวอย่างโดยทั่วไปมักใช้เมื่อศึกษาประชากรทางสถิติที่ซับซ้อน ตัวอย่างเช่น ในระหว่างการสำรวจตัวอย่างงบประมาณครอบครัวของคนงานและลูกจ้างในบางภาคส่วนของเศรษฐกิจ ผลผลิตแรงงานของคนงานในองค์กรเป็นตัวแทน แยกกลุ่มตามคุณสมบัติ

ตัวอย่างทั่วไปจะให้มากกว่า ผลลัพธ์ที่แม่นยำเปรียบเทียบกับวิธีการอื่นในการเลือกหน่วยในกลุ่มประชากรตัวอย่าง การพิมพ์ประชากรทั่วไปช่วยให้มั่นใจได้ถึงความเป็นตัวแทนของกลุ่มตัวอย่าง ซึ่งเป็นการเป็นตัวแทนของกลุ่มประเภทแต่ละกลุ่มในกลุ่มนั้น ซึ่งทำให้สามารถกำจัดอิทธิพลของการกระจายตัวระหว่างกลุ่มต่อข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

เมื่อกำหนด ข้อผิดพลาดโดยเฉลี่ยของกลุ่มตัวอย่างทั่วไปทำหน้าที่เป็นตัวบ่งชี้ความแปรปรวน ค่าเฉลี่ยของ ความแปรปรวนภายในกลุ่ม.

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย พบโดยใช้สูตร:

* สำหรับคุณลักษณะเชิงปริมาณเฉลี่ย

(เลือกใหม่); (แบบ.11)

(การเลือกที่ไม่สามารถย้อนกลับได้); (แบบ.12)

* สำหรับการแบ่งปัน (คุณลักษณะทางเลือก)

(เลือกใหม่); (แบบ.13)

(การคัดเลือกแบบไม่ซ้ำกัน) (แบบฟอร์ม 14)

โดยที่ คือค่าเฉลี่ยของความแปรปรวนภายในกลุ่มสำหรับประชากรตัวอย่าง

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มของสัดส่วน (ของคุณลักษณะทางเลือก) สำหรับประชากรตัวอย่าง

การสุ่มตัวอย่างแบบอนุกรม เกี่ยวข้องกับการสุ่มเลือกจากประชากรทั่วไป ไม่ใช่หน่วยแต่ละหน่วย แต่เป็นกลุ่มที่เท่ากัน (รัง อนุกรม) เพื่อที่จะสามารถสังเกตทุกหน่วยในกลุ่มดังกล่าวได้โดยไม่มีข้อยกเว้น

แอปพลิเคชัน การสุ่มตัวอย่างแบบอนุกรมเนื่องจากสินค้าจำนวนมากสำหรับการขนส่ง จัดเก็บ และขายบรรจุเป็นกลุ่ม กล่อง ฯลฯ ดังนั้นในการควบคุมคุณภาพของสินค้าที่บรรจุหีบห่อการตรวจสอบหลายบรรจุภัณฑ์ (ชุด) จึงมีเหตุผลมากกว่าการเลือกจากบรรจุภัณฑ์ทั้งหมด ปริมาณที่ต้องการสินค้า.

เนื่องจากภายในกลุ่ม (อนุกรม) มีการตรวจสอบทุกหน่วยโดยไม่มีข้อยกเว้น ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย (เมื่อเลือกอนุกรมที่เท่ากัน) ขึ้นอยู่กับการกระจายระหว่างกลุ่ม (อนุกรม) เท่านั้น

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับลักษณะเชิงปริมาณโดยเฉลี่ย ในระหว่างการเลือกแบบอนุกรมจะพบได้โดยใช้สูตร:

(เลือกใหม่); (แบบ.15)

(การคัดเลือกแบบไม่ซ้ำกัน) (แบบฟอร์ม 16)

ที่ไหน ร-จำนวนตอนที่เลือก ร-จำนวนตอนทั้งหมด

ความแปรปรวนระหว่างกลุ่มของตัวอย่างอนุกรมได้รับการคำนวณดังนี้:

ค่าเฉลี่ยอยู่ที่ไหน ฉัน- ซีรีส์ที่ 2; - ค่าเฉลี่ยโดยรวมของประชากรตัวอย่างทั้งหมด

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับการแชร์ (แอตทริบิวต์ทางเลือก) ในการเลือกแบบอนุกรม:

(เลือกใหม่); (แบบ.17)

(การเลือกแบบไม่ซ้ำกัน) (แบบ.18)

อินเตอร์กรุ๊ป(อินเตอร์ซีรีส์) ความแปรปรวนของส่วนแบ่งตัวอย่างแบบอนุกรมกำหนดโดยสูตร:

, (แบบ.19)

ส่วนแบ่งของลักษณะอยู่ที่ไหน ฉัน- ชุดที่ 2; - ส่วนแบ่งรวมของคุณลักษณะในประชากรตัวอย่างทั้งหมด

ในทางปฏิบัติของการสำรวจทางสถิติ นอกเหนือจากวิธีการคัดเลือกที่กล่าวถึงก่อนหน้านี้แล้ว ยังใช้วิธีผสมผสานกันอีกด้วย (การเลือกแบบรวม)

การสังเกตแบบเลือกสรร

แนวคิดของการสังเกตตัวอย่าง

วิธีการสุ่มตัวอย่างจะใช้เมื่อการใช้การสังเกตอย่างต่อเนื่องเป็นไปไม่ได้ทางกายภาพเนื่องจากมีข้อมูลจำนวนมากหรือไม่สามารถทำได้ในเชิงเศรษฐกิจ ความเป็นไปไม่ได้ทางกายภาพเกิดขึ้นเมื่อศึกษาจำนวนผู้โดยสาร ราคาตลาด และงบประมาณของครอบครัว ความไม่สะดวกทางเศรษฐกิจเกิดขึ้นเมื่อประเมินคุณภาพของสินค้าที่เกี่ยวข้องกับการทำลายล้าง เช่น การชิม การทดสอบอิฐเพื่อความแข็งแรง เป็นต้น การสังเกตตัวอย่างยังใช้เพื่อตรวจสอบผลลัพธ์ของการสังเกตอย่างต่อเนื่อง

หน่วยทางสถิติที่เลือกมาสังเกตคือ เลือกสรรจำนวนทั้งสิ้นหรือ ตัวอย่าง,และอาร์เรย์ทั้งหมด - ทั่วไปจำนวนทั้งสิ้น (GS) ในกรณีนี้ จำนวนหน่วยในกลุ่มตัวอย่างจะแสดงด้วย พีตลอด HS ทั้งหมด - เอ็น.ทัศนคติ ไม่มี/ไม่มีเรียกว่าขนาดสัมพัทธ์หรือ แบ่งปันตัวอย่าง.

คุณภาพของผลการสังเกตตัวอย่างขึ้นอยู่กับ ความเป็นตัวแทนตัวอย่างเช่น ว่าเป็นตัวแทนใน GC แค่ไหน เพื่อให้มั่นใจถึงความเป็นตัวแทนของตัวอย่าง จำเป็นต้องปฏิบัติตามหลักการสุ่มเลือกหน่วย ซึ่งถือว่าการรวมหน่วย HS ไว้ในตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยอื่นใดนอกจากโอกาส

วิธีการสุ่มตัวอย่าง

1. จริงๆแล้วสุ่มเลยการเลือก: หน่วย GS ทั้งหมดจะมีหมายเลขกำกับไว้ และตัวเลขที่สุ่มได้จากผลการจับฉลากจะสอดคล้องกับหน่วยที่รวมอยู่ในตัวอย่าง และจำนวนตัวเลขจะเท่ากับขนาดตัวอย่างที่วางแผนไว้ ในทางปฏิบัติ มีการใช้เครื่องสร้างตัวเลขสุ่มแทนการจับฉลาก วิธีการนี้การเลือกอาจจะเป็น ซ้ำแล้วซ้ำเล่า(เมื่อแต่ละหน่วยที่เลือกสำหรับตัวอย่างกลับสู่ HS หลังจากการสังเกตและสามารถสำรวจได้อีกครั้ง) และ หยาบคาย(เมื่อหน่วยที่สำรวจไม่ถูกส่งกลับไปยัง HS และไม่สามารถสำรวจได้อีก) ด้วยการเลือกซ้ำๆ ความน่าจะเป็นที่จะเข้าไปในกลุ่มตัวอย่างสำหรับแต่ละหน่วยของ GS ยังคงไม่เปลี่ยนแปลง และด้วยการเลือกซ้ำๆ ความน่าจะเป็นที่จะเข้าไปในกลุ่มตัวอย่างจำนวนไม่กี่หน่วยที่เหลืออยู่ใน GS หลังจากเลือกจากกลุ่มนั้น ความน่าจะเป็นที่จะเข้าไปในกลุ่มตัวอย่าง ตัวอย่างก็เหมือนกัน



2. เครื่องกลการเลือก: หน่วยของประชากรจะถูกเลือกด้วยขั้นตอนคงที่ ไม่มี- ดังนั้น หากประชากรทั่วไปมี 100,000 หน่วย และคุณต้องเลือก 1,000 หน่วย ทุก ๆ 100 หน่วยก็จะรวมอยู่ในตัวอย่างด้วย

3. แบ่งชั้นการคัดเลือก (แบ่งชั้น) จะดำเนินการจากประชากรทั่วไปที่ต่างกันเมื่อถูกแบ่งออกเป็นครั้งแรก กลุ่มที่เป็นเนื้อเดียวกันหลังจากนั้นหน่วยจากแต่ละกลุ่มจะถูกเลือกให้เป็นประชากรตัวอย่างโดยการสุ่มหรือโดยกลไกตามสัดส่วนของจำนวนหน่วยในประชากรทั่วไป

4. อนุกรมการเลือก (คลัสเตอร์): ไม่ใช่แต่ละหน่วย แต่อนุกรมบางชุด (รัง) จะถูกเลือกแบบสุ่มหรือโดยกลไก ซึ่งจะดำเนินการสังเกตอย่างต่อเนื่อง

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

หลังจากเสร็จสิ้นการเลือกจำนวนหน่วยที่ต้องการในตัวอย่างและบันทึกคุณลักษณะที่ศึกษาของหน่วยเหล่านี้ที่โปรแกรมการสังเกตจัดเตรียมไว้ให้แล้ว เราจะดำเนินการคำนวณตัวบ่งชี้ทั่วไปต่อไป ซึ่งรวมถึงค่าเฉลี่ยของคุณลักษณะที่กำลังศึกษาและสัดส่วนของหน่วยที่มีค่าใดๆ สำหรับคุณลักษณะนี้ อย่างไรก็ตามหาก GS ทำตัวอย่างหลายตัวอย่างโดยพิจารณาถึงลักษณะทั่วไปแล้วก็สามารถระบุได้ว่าค่าของพวกเขาจะแตกต่างกันนอกจากนี้พวกเขาจะแตกต่างจากมูลค่าที่แท้จริงใน GS หากถูกกำหนดโดยใช้การสังเกตอย่างต่อเนื่อง . กล่าวอีกนัยหนึ่งลักษณะทั่วไปที่คำนวณจากข้อมูลตัวอย่างจะแตกต่างจากค่าจริงใน GS ดังนั้นเราจึงแนะนำสัญลักษณ์ต่อไปนี้ (ตารางที่ 8)

ตารางที่ 8. ตำนาน

เรียกว่าความแตกต่างระหว่างค่าของลักษณะทั่วไปของกลุ่มตัวอย่างและประชากรทั่วไป ข้อผิดพลาดในการสุ่มตัวอย่างซึ่งแบ่งออกเป็นข้อผิดพลาด การลงทะเบียนและข้อผิดพลาด ความเป็นตัวแทน- ประการแรกเกิดขึ้นเนื่องจากข้อมูลที่ไม่ถูกต้องหรือไม่ถูกต้องเนื่องจากขาดความเข้าใจในสาระสำคัญของปัญหาการไม่เอาใจใส่ของนายทะเบียนเมื่อกรอกแบบสอบถามแบบฟอร์ม ฯลฯ มันค่อนข้างง่ายที่จะตรวจจับและกำจัด ประการที่สองเกิดจากการไม่ปฏิบัติตามหลักการสุ่มเลือกหน่วยในกลุ่มตัวอย่าง ตรวจจับและกำจัดได้ยากกว่า เนื่องจากมีขนาดใหญ่กว่าครั้งแรกมาก ดังนั้นการวัดจึงเป็นภารกิจหลักของการสังเกตแบบเลือกสรร

ในการวัดข้อผิดพลาดในการสุ่มตัวอย่าง ข้อผิดพลาดโดยเฉลี่ยจะถูกกำหนดโดยใช้สูตร (39) สำหรับการสุ่มตัวอย่างซ้ำ และสูตร (40) สำหรับการสุ่มตัวอย่างแบบไม่ซ้ำกัน:

= ;(39) = . (40)

จากสูตร (39) และ (40) เห็นได้ชัดว่าข้อผิดพลาดโดยเฉลี่ยน้อยกว่าสำหรับการสุ่มตัวอย่างแบบไม่ซ้ำ ซึ่งเป็นตัวกำหนดการใช้งานที่กว้างขึ้น

แนวคิดและการคำนวณข้อผิดพลาดในการสุ่มตัวอย่าง

หน้าที่ของการสังเกตตัวอย่างคือการให้แนวคิดที่ถูกต้องเกี่ยวกับตัวบ่งชี้รวมของประชากรทั้งหมดโดยอิงจากบางส่วนที่ถูกสังเกตการณ์ ค่าเบี่ยงเบนที่เป็นไปได้ของสัดส่วนตัวอย่างและค่าเฉลี่ยตัวอย่างจากสัดส่วนและค่าเฉลี่ยในประชากรเรียกว่า ข้อผิดพลาดในการสุ่มตัวอย่าง หรือ ข้อผิดพลาดในการเป็นตัวแทน ยิ่งข้อผิดพลาดนี้มีขนาดใหญ่เท่าใด ตัวบ่งชี้การสังเกตตัวอย่างก็จะยิ่งแตกต่างจากตัวบ่งชี้ประชากรทั่วไปมากขึ้นเท่านั้น

พวกเขาแตกต่างกัน:

ข้อผิดพลาดในการสุ่มตัวอย่าง

ข้อผิดพลาดในการลงทะเบียน

ข้อผิดพลาดในการลงทะเบียนเกิดขึ้นเมื่อข้อเท็จจริงได้รับการพิสูจน์อย่างไม่ถูกต้องในระหว่างกระบวนการสังเกต เป็นลักษณะของทั้งการสังเกตอย่างต่อเนื่องและการสังเกตแบบเลือก แต่ในการสังเกตแบบเลือกจะมีน้อยกว่า

โดยธรรมชาติแล้ว ข้อผิดพลาดคือ:

Tendentious – จงใจ เช่น เลือกหน่วยที่ดีที่สุดหรือแย่ที่สุดในประชากร ในกรณีนี้ การสังเกตจะหมดความหมาย

สุ่ม - หลักการพื้นฐานของการจัดองค์กรในการสังเกตการสุ่มตัวอย่างคือการหลีกเลี่ยงการเลือกโดยเจตนา เช่น รับรองการปฏิบัติตามหลักการสุ่มเลือกอย่างเข้มงวด

กฎทั่วไปการเลือกแบบสุ่มคือ: แต่ละหน่วยของประชากรทั่วไปจะต้องมีเงื่อนไขและโอกาสที่เหมือนกันทุกประการที่จะตกอยู่ในจำนวนหน่วยที่รวมอยู่ในกลุ่มตัวอย่าง สิ่งนี้แสดงถึงความเป็นอิสระของผลการสุ่มตัวอย่างจากความประสงค์ของผู้สังเกตการณ์ เจตจำนงของผู้สังเกตการณ์ก่อให้เกิดข้อผิดพลาดที่มีแนวโน้ม ข้อผิดพลาดในการสุ่มตัวอย่างในการสุ่มตัวอย่างคือ ธรรมชาติแบบสุ่ม- มันแสดงลักษณะของขนาดความเบี่ยงเบนของลักษณะทั่วไปจากลักษณะของตัวอย่าง

เนื่องจากลักษณะของประชากรที่ศึกษาแตกต่างกันไป องค์ประกอบของหน่วยที่รวมอยู่ในกลุ่มตัวอย่างอาจไม่ตรงกับองค์ประกอบของหน่วยของประชากรทั้งหมด นี่หมายความว่า และไม่ตรงกันด้วย และ . ความคลาดเคลื่อนที่เป็นไปได้ระหว่างคุณลักษณะเหล่านี้ถูกกำหนดโดยข้อผิดพลาดในการสุ่มตัวอย่างซึ่งกำหนดโดยสูตร:

ความแปรปรวนทั่วไปอยู่ที่ไหน

ความแปรปรวนตัวอย่างอยู่ที่ไหน

นี่แสดงให้เห็นว่าความแปรปรวนทั่วไปแตกต่างจากที่ใด ความแปรปรวนตัวอย่างในบางครั้ง

มีการเลือกซ้ำและไม่ซ้ำซ้อน สาระสำคัญของการคัดเลือกซ้ำคือ หลังจากสังเกตแล้ว แต่ละหน่วยที่รวมอยู่ในตัวอย่างจะกลับคืนสู่ประชากรทั่วไปและสามารถตรวจสอบได้อีกครั้ง เมื่อทำการสุ่มตัวอย่างใหม่ จะมีการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย:

สำหรับตัวบ่งชี้ส่วนแบ่งของคุณลักษณะทางเลือก ความแปรปรวนตัวอย่างจะถูกกำหนดโดยสูตร:

ในทางปฏิบัติ ไม่ค่อยมีการใช้การเลือกซ้ำๆ ด้วยการคัดเลือกแบบไม่ซ้ำซ้อนตามขนาดของประชากรทั่วไป เอ็นลดลงในระหว่างการสุ่มตัวอย่าง สูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับคุณลักษณะเชิงปริมาณมีรูปแบบ:



, แล้ว

หนึ่งในค่าที่เป็นไปได้ซึ่งส่วนแบ่งของลักษณะที่กำลังศึกษาอาจเท่ากับ:

โดยที่ข้อผิดพลาดในการสุ่มตัวอย่างของแอตทริบิวต์ทางเลือก

ตัวอย่าง.

เมื่อสุ่มตัวอย่าง 10% ของผลิตภัณฑ์ในชุดผลิตภัณฑ์สำเร็จรูปโดยใช้วิธีการโดยไม่ต้องสุ่มตัวอย่างซ้ำ จะได้ข้อมูลต่อไปนี้เกี่ยวกับปริมาณความชื้นในตัวอย่าง

กำหนดค่าเฉลี่ย % ความชื้น ความแปรปรวน ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐานด้วยความน่าจะเป็น 0.954 ขีดจำกัดที่เป็นไปได้ซึ่งคาดว่าจะมีค่าเฉลี่ย % ความชื้นของผลิตภัณฑ์สำเร็จรูปทั้งหมด โดยมีความน่าจะเป็น 0.987 ขีดจำกัดที่เป็นไปได้ ความถ่วงจำเพาะผลิตภัณฑ์มาตรฐาน โดยมีเงื่อนไขว่าชุดที่ไม่ได้มาตรฐานประกอบด้วยผลิตภัณฑ์ที่มีความชื้นสูงถึง 13 และสูงกว่า 19%

มีเพียงความน่าจะเป็นที่แน่นอนเท่านั้นที่เราสามารถพูดได้ว่าส่วนแบ่งทั่วไปจากส่วนแบ่งตัวอย่างและค่าเฉลี่ยทั่วไปจากค่าเฉลี่ยตัวอย่างเบี่ยงเบนไป ทีครั้งหนึ่ง.

ในสถิติการเบี่ยงเบนเหล่านี้เรียกว่า ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด และถูกกำหนดไว้

ความน่าจะเป็นของการตัดสินสามารถเพิ่มหรือลดลงได้ตาม ทีครั้งหนึ่ง. ที่มีความน่าจะเป็น 0.683 ที่ 0.954 ที่ 0.987 แล้วตัวชี้วัดของประชากรทั่วไปจะถูกกำหนดจากตัวชี้วัดของกลุ่มตัวอย่าง

ทฤษฎีสถิติ: บันทึกการบรรยาย Burkhanova Inessa Viktorovna

3. ข้อผิดพลาดในการสุ่มตัวอย่าง

3. ข้อผิดพลาดในการสุ่มตัวอย่าง

แต่ละหน่วยในการสังเกตตัวอย่างจะต้องมีโอกาสเท่าเทียมกับหน่วยอื่น ๆ ที่จะเลือก - นี่คือพื้นฐานของกลุ่มตัวอย่างแบบสุ่ม

การสุ่มตัวอย่างที่เหมาะสม - คือการเลือกหน่วยจากจำนวนประชากรทั้งหมดโดยการจับสลากหรืออื่นๆ ในทำนองเดียวกัน.

หลักการของการสุ่มคือการที่การรวมหรือการยกเว้นรายการจากตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยอื่นใดนอกจากความบังเอิญ

แชร์ตัวอย่างคืออัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไป:

การเลือกสุ่มที่เหมาะสมในรูปแบบบริสุทธิ์ถือเป็นการเลือกเริ่มต้นในบรรดาการเลือกประเภทอื่นๆ ทั้งหมด โดยมีและใช้หลักการพื้นฐานของการสุ่มตัวอย่าง การสังเกตทางสถิติ.

ตัวบ่งชี้ทั่วไปสองประเภทหลักที่ใช้ในวิธีการสุ่มตัวอย่างคือค่าเฉลี่ยของคุณลักษณะเชิงปริมาณและ ค่าสัมพัทธ์เครื่องหมายทางเลือก

เศษส่วนตัวอย่าง (w) หรือความเฉพาะเจาะจงถูกกำหนดโดยอัตราส่วนของจำนวนหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา ม.ถึงจำนวนหน่วยทั้งหมดในประชากรตัวอย่าง (n):

เพื่อระบุลักษณะความน่าเชื่อถือของตัวบ่งชี้ตัวอย่าง จะต้องแยกความแตกต่างระหว่างข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยและสูงสุด

ข้อผิดพลาดในการสุ่มตัวอย่างหรือที่เรียกว่าข้อผิดพลาดในการเป็นตัวแทนคือความแตกต่างระหว่างตัวอย่างที่สอดคล้องกันและคุณลักษณะทั่วไป:

?x =|x – x|;

?w =|x – พี|.

เฉพาะการสังเกตตัวอย่างเท่านั้นที่อาจเกิดข้อผิดพลาดในการสุ่มตัวอย่าง

ค่าเฉลี่ยตัวอย่างและสัดส่วนตัวอย่าง– เหล่านี้เป็นตัวแปรสุ่มที่ใช้ค่าที่แตกต่างกันขึ้นอยู่กับหน่วยของประชากรทางสถิติที่กำลังศึกษาซึ่งรวมอยู่ในตัวอย่าง. ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างจึงเป็นตัวแปรสุ่มและอาจรับค่าที่ต่างกันได้เช่นกัน ดังนั้นให้กำหนดค่าเฉลี่ยของ ข้อผิดพลาดที่เป็นไปได้– ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะพิจารณาจากขนาดตัวอย่าง ยิ่งตัวเลขมากขึ้น สิ่งอื่นๆ จะเท่ากัน ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะน้อยลง ด้วยการครอบคลุมจำนวนหน่วยประชากรทั่วไปที่เพิ่มขึ้นด้วยการสำรวจตัวอย่าง เราจึงสามารถระบุลักษณะของประชากรทั่วไปทั้งหมดได้แม่นยำยิ่งขึ้น

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยขึ้นอยู่กับระดับของความแปรผันของคุณลักษณะที่กำลังศึกษา ในทางกลับกัน ระดับของความแปรผันจะมีลักษณะเฉพาะด้วยการกระจายตัว 2 หรือ ก(ล – ญ)– สำหรับสัญญาณทางเลือก ยิ่งความแปรผันและการกระจายตัวของคุณลักษณะมีขนาดเล็กลง ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะน้อยลง และในทางกลับกัน

ในกรณีที่สุ่มตัวอย่างซ้ำ ข้อผิดพลาดโดยเฉลี่ยจะถูกคำนวณตามทฤษฎีโดยใช้สูตรต่อไปนี้:

1) สำหรับลักษณะเชิงปริมาณโดยเฉลี่ย:

ที่ไหน? 2 – ค่าเฉลี่ยของการกระจายตัวของคุณลักษณะเชิงปริมาณ

2) สำหรับการแบ่งปัน (คุณลักษณะทางเลือก):

แล้วความแปรปรวนของลักษณะในประชากรเป็นเท่าไหร่? 2 ยังไม่ทราบแน่ชัด ในทางปฏิบัติ พวกเขาใช้ค่าของการกระจายตัว S 2 ที่คำนวณสำหรับประชากรตัวอย่างตามกฎของจำนวนจำนวนมาก ตามที่ประชากรตัวอย่างซึ่งมีขนาดตัวอย่างใหญ่เพียงพอ สามารถสร้างซ้ำได้อย่างแม่นยำ ลักษณะของประชากรทั่วไป

สูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับการสุ่มตัวอย่างใหม่มีดังต่อไปนี้ สำหรับ ขนาดเฉลี่ยลักษณะเชิงปริมาณ: ความแปรปรวนทั่วไปแสดงผ่านความแปรปรวนแบบเลือกโดยความสัมพันธ์ต่อไปนี้:

โดยที่ S 2 คือค่าการกระจายตัว

การสุ่มตัวอย่างทางกล– เป็นการเลือกหน่วยเป็นประชากรตัวอย่างจากประชากรทั่วไปโดยแบ่งตามเกณฑ์ที่เป็นกลางออกเป็นกลุ่มเท่าๆ กัน ดำเนินการในลักษณะที่เลือกเพียงหนึ่งหน่วยสำหรับตัวอย่างจากแต่ละกลุ่มดังกล่าว

ในการสุ่มตัวอย่างทางกล หน่วยของประชากรทางสถิติที่กำลังศึกษาจะถูกจัดเรียงเบื้องต้นตามลำดับที่แน่นอน หลังจากนั้นจึงเลือกหน่วยตามจำนวนที่กำหนดในช่วงเวลาหนึ่ง ในกรณีนี้ ขนาดของช่วงเวลาในประชากรจะเท่ากับค่าผกผันของสัดส่วนตัวอย่าง

เนื่องจากมีประชากรจำนวนมากเพียงพอ การเลือกทางกลจึงใกล้เคียงกับการสุ่มตัวอย่างเองในแง่ของความถูกต้องแม่นยำของผลลัพธ์ ดังนั้น เพื่อกำหนดข้อผิดพลาดโดยเฉลี่ยของการสุ่มตัวอย่างทางกล จึงมีการใช้สูตรสำหรับการสุ่มตัวอย่างด้วยตนเองแบบไม่ทำซ้ำ

ในการเลือกหน่วยจากประชากรที่ต่างกันจะใช้สิ่งที่เรียกว่าตัวอย่างทั่วไปซึ่งจะใช้เมื่อหน่วยทั้งหมดของประชากรทั่วไปสามารถแบ่งออกเป็นกลุ่มที่มีคุณภาพเหมือนกันหลายกลุ่มและคล้ายคลึงกันตามลักษณะที่ตัวบ่งชี้ที่กำลังศึกษาอยู่

จากนั้น จากแต่ละกลุ่มทั่วไป การเลือกหน่วยต่างๆ ในกลุ่มตัวอย่างจะดำเนินการโดยใช้ตัวอย่างแบบสุ่มหรือตัวอย่างเชิงกลล้วนๆ

การสุ่มตัวอย่างมักใช้เมื่อศึกษาประชากรทางสถิติที่ซับซ้อน

การสุ่มตัวอย่างโดยทั่วไปจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น การพิมพ์ประชากรทั่วไปช่วยให้มั่นใจได้ถึงความเป็นตัวแทนของกลุ่มตัวอย่าง ซึ่งเป็นการเป็นตัวแทนของกลุ่มประเภทแต่ละกลุ่มในกลุ่มนั้น ซึ่งทำให้สามารถกำจัดอิทธิพลของการกระจายตัวระหว่างกลุ่มต่อข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย ดังนั้น เมื่อพิจารณาค่าความผิดพลาดโดยเฉลี่ยของกลุ่มตัวอย่างทั่วไป ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มจะทำหน้าที่เป็นตัวบ่งชี้ความแปรผัน

การสุ่มตัวอย่างแบบอนุกรมเกี่ยวข้องกับการสุ่มเลือกจากประชากรทั่วไปของกลุ่มที่เท่ากัน เพื่อให้ทุกหน่วยในกลุ่มดังกล่าวสังเกตโดยไม่มีข้อยกเว้น

เนื่องจากภายในกลุ่ม (อนุกรม) มีการตรวจสอบทุกหน่วยโดยไม่มีข้อยกเว้น ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย (เมื่อเลือกอนุกรมที่เท่ากัน) ขึ้นอยู่กับการกระจายระหว่างกลุ่ม (อนุกรม) เท่านั้น

จากหนังสืองบประมาณส่วนบุคคล เงินอยู่ภายใต้การควบคุม ผู้เขียน มาคารอฟ เซอร์เกย์ วลาดิมีโรวิช

ข้อผิดพลาดของผู้อยู่อาศัย คุณสามารถจัดการกับข้อผิดพลาดได้หลายวิธี: คุณสามารถกลัวที่จะทำผิดพลาดและกังวลเกี่ยวกับแต่ละข้อผิดพลาด คุณสามารถชื่นชมยินดีกับความผิดพลาดและวิกฤตการณ์ของคุณในฐานะตัวชี้บนเส้นทางสู่ความสำเร็จและชัยชนะส่วนตัว สิ่งเดียวที่เกี่ยวกับข้อผิดพลาดอยู่ตลอดเวลาคือคุณต้องจ่ายเงินเพื่อความผิดพลาดเหล่านั้น

จากหนังสือ บอร์ดบุ๊คเกี่ยวกับการตรวจสอบภายใน ความเสี่ยงและกระบวนการทางธุรกิจ ผู้เขียน Kryshkin Oleg

การสุ่มตัวอย่าง ขั้นตอนการสุ่มตัวอย่างถือเป็นขั้นตอนสำคัญของโครงการ การตรวจสอบภายใน- โดยมีการอธิบายรายละเอียดไว้ในแหล่งต่างๆ ในหัวข้อการตรวจสอบ อย่างไรก็ตาม คำอธิบายดังกล่าวมีลักษณะทางวิชาการหลายประการ ฉันขอแนะนำให้มุ่งเน้นไปที่สิ่งเหล่านั้น

จากหนังสือ The Psychology of Investments [วิธีหยุดทำเรื่องโง่ ๆ ด้วยเงินของคุณ] โดยริชาร์ดส คาร์ล

ข้อผิดพลาดในการลงทุนคือข้อผิดพลาดของนักลงทุน ตอนนี้ฉันมั่นใจมากขึ้นกว่าเดิมว่าข้อผิดพลาดในการลงทุนทั้งหมดเป็นข้อผิดพลาดของนักลงทุนจริงๆ ต่างจากนักลงทุน การลงทุนเป็นทางเลือก ตรงนี้เอง

ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

29. การกำหนดขนาดตัวอย่างที่ต้องการ หนึ่งในนั้น หลักการทางวิทยาศาสตร์ในทฤษฎีของวิธีการสุ่มตัวอย่างคือเพื่อให้แน่ใจว่ามีหน่วยที่เลือกลดลง ข้อผิดพลาดมาตรฐานการสุ่มตัวอย่างสัมพันธ์กับการเพิ่มขนาดตัวอย่างเสมอ การคำนวณ

จากหนังสือ ทฤษฎีทั่วไปสถิติ ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

30. วิธีการเลือกและประเภทของการชักตัวอย่าง การสุ่มตัวอย่างตามจริง ตามทฤษฎีของวิธีการสุ่มตัวอย่าง วิธีการเลือกและประเภทของการสุ่มตัวอย่างต่างๆ ได้รับการพัฒนาขึ้นเพื่อให้มั่นใจถึงความเป็นตัวแทน วิธีการคัดเลือกหมายถึงขั้นตอนการคัดเลือกหน่วยจากประชากรทั่วไป

จากหนังสือทฤษฎีสถิติทั่วไป ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

31. การสุ่มตัวอย่างทางกลและการสุ่มตัวอย่างทั่วไป ในการสุ่มตัวอย่างทางกลล้วนๆ อันดับแรกควรนำเสนอประชากรทั่วไปทั้งหมดของหน่วยในรูปแบบของรายการหน่วยคัดเลือก ซึ่งรวบรวมตามลำดับบางอย่างที่เป็นกลางโดยสัมพันธ์กับลักษณะที่กำลังศึกษา จากนั้นรายการ

จากหนังสือทฤษฎีสถิติทั่วไป ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

32. การสุ่มตัวอย่างแบบอนุกรมและแบบรวม การสุ่มตัวอย่างแบบอนุกรม (คลัสเตอร์) เป็นรูปแบบหนึ่งของการก่อตัวของประชากรตัวอย่างเมื่อไม่ใช่หน่วยที่จะสำรวจ แต่กลุ่มของหน่วย (อนุกรม, รัง) จะถูกเลือกโดยการสุ่ม ภายในซีรีส์ที่เลือก (รัง)

จากหนังสือทฤษฎีสถิติทั่วไป ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

33. การสุ่มตัวอย่างแบบหลายขั้นตอน หลายเฟส และแบบแทรกซึม ลักษณะเฉพาะของการสุ่มตัวอย่างแบบหลายขั้นตอนคือ ประชากรตัวอย่างจะค่อยๆ ก่อตัวขึ้นตามขั้นตอนการคัดเลือก ในระยะแรกให้ใช้วิธีการและประเภทของการเลือกที่กำหนดไว้ล่วงหน้า

ผู้เขียน โคนิค นีน่า วลาดีมีรอฟนา

3. การกำหนดขนาดตัวอย่างที่ต้องการ หลักการทางวิทยาศาสตร์ประการหนึ่งในทฤษฎีการสุ่มตัวอย่างคือ การตรวจสอบให้แน่ใจว่ามีจำนวนหน่วยที่เลือกเพียงพอ ความจำเป็นทางทฤษฎีในการปฏิบัติตามหลักการนี้แสดงอยู่ในหลักฐาน ทฤษฎีบทขีดจำกัด

จากหนังสือทฤษฎีสถิติทั่วไป: บันทึกการบรรยาย ผู้เขียน โคนิค นีน่า วลาดีมีรอฟนา

4. วิธีการเลือกและประเภทของการสุ่มตัวอย่าง ทฤษฎีของวิธีการสุ่มตัวอย่างได้พัฒนาขึ้น วิธีต่างๆการเลือกและประเภทของการสุ่มตัวอย่างเพื่อให้มั่นใจถึงความเป็นตัวแทน วิธีการคัดเลือกหมายถึงขั้นตอนการคัดเลือกหน่วยจากประชากรทั่วไป มีสองวิธีในการเลือก: ซ้ำ

จากหนังสือทฤษฎีสถิติ ผู้เขียน บูร์กาโนวา อิเนสซา วิคโตรอฟนา

36. ข้อผิดพลาดในการสุ่มตัวอย่าง การสุ่มตัวอย่างที่เหมาะสมคือการเลือกหน่วยจากประชากรทั้งหมดโดยการจับฉลากหรือวิธีการอื่นที่คล้ายคลึงกัน หลักการของการสุ่มก็คือ การรวมหรือแยกวัตถุออกจากตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยใดๆ

จากหนังสือ Business Correspondence: คู่มือการฝึกอบรม ผู้เขียน เคอร์ซาโนวา มาเรีย วลาดิเมียร์รอฟนา

ข้อผิดพลาดด้านคำศัพท์ 1. การใช้คำและคำศัพท์ไม่ถูกต้อง ข้อผิดพลาดจำนวนมากในจดหมายธุรกิจถือเป็นคำศัพท์ การรู้หนังสือไม่เพียงพอไม่เพียงแต่นำไปสู่เรื่องไร้สาระที่น่าสงสัยเท่านั้น แต่ยังนำไปสู่ความไร้สาระส่วนบุคคลและทางวิชาชีพด้วย คำสแลง

จากหนังสือ ยุคใหม่- ความกังวลเก่าๆ : เศรษฐกิจการเมือง ผู้เขียน ยาซิน เยฟเกนีย์ กริกอรีวิช

5 ข้อผิดพลาดของเรา เรายืนยัน: แนวทางการปฏิรูปตลาดที่เลือกนั้นถูกต้อง และพวกเขาไม่ได้ล้มเหลวเลย พวกเขาแค่สะดุดอีกครั้ง แต่มีข้อผิดพลาดและการละเว้น สิ่งเหล่านี้เป็นความผิดพลาดของเราและความผิดพลาดของผู้นำประเทศซึ่งเราไม่สามารถป้องกันได้ ข้อผิดพลาด - ในหลาย ๆ ด้าน

โดย Kurtis Face

ความสำคัญของขนาดตัวอย่าง ดังที่ได้กล่าวไปแล้ว ผู้คนมักจะให้ความสนใจมากเกินไปกับปรากฏการณ์ที่เกิดขึ้นซึ่งเกิดขึ้นไม่บ่อยนัก แม้ว่าจากมุมมองทางสถิติแล้ว เป็นไปไม่ได้ที่จะดึงข้อมูลจำนวนมากจากบางกรณีได้ นี่คือเหตุผลหลัก

จากหนังสือ วิถีแห่งเต่า จากมือสมัครเล่นไปจนถึงเทรดเดอร์ระดับตำนาน โดย Kurtis Face

ตัวอย่างตัวแทน ความเป็นตัวแทนของการทดสอบของเราเพื่อวัตถุประสงค์ในการทำนายอนาคตถูกกำหนดโดยปัจจัยสองประการ: – จำนวนตลาด: การทดสอบที่ดำเนินการในตลาดที่แตกต่างกันมักจะรวมถึงตลาดที่มี องศาที่แตกต่างกันประเภทความผันผวน

จากหนังสือ วิถีแห่งเต่า จากมือสมัครเล่นไปจนถึงเทรดเดอร์ระดับตำนาน โดย Kurtis Face

ขนาดตัวอย่าง แนวคิดเรื่องขนาดตัวอย่างนั้นเรียบง่าย: เพื่อที่จะได้ข้อสรุปที่ถูกต้องทางสถิติ คุณจำเป็นต้องมีตัวอย่างที่มีขนาดใหญ่เพียงพอ ยิ่งตัวอย่างมีขนาดเล็กเท่าไร ข้อสรุปก็จะยิ่งหยาบมากขึ้นเท่านั้น ยิ่งตัวอย่างมีขนาดใหญ่ คุณภาพของข้อสรุปก็จะยิ่งดีขึ้นเท่านั้น ไม่มี

ขึ้นอยู่กับค่าของลักษณะของหน่วยในประชากรตัวอย่างที่ลงทะเบียนตามโปรแกรมการสังเกตทางสถิติ ลักษณะตัวอย่างทั่วไปจะถูกคำนวณ: ค่าเฉลี่ยตัวอย่าง() และ แบ่งปันตัวอย่างหน่วยที่มีลักษณะใดที่เป็นที่สนใจของนักวิจัย รวมเป็นจำนวน ( ).

เรียกว่าความแตกต่างระหว่างตัวบ่งชี้ของกลุ่มตัวอย่างและประชากรทั่วไป ข้อผิดพลาดในการสุ่มตัวอย่าง.

ข้อผิดพลาดในการสุ่มตัวอย่าง เช่น ข้อผิดพลาดในการสังเกตทางสถิติประเภทอื่นๆ จะถูกแบ่งออกเป็นข้อผิดพลาดในการลงทะเบียนและข้อผิดพลาดในการเป็นตัวแทน วัตถุประสงค์หลักของวิธีการสุ่มตัวอย่างคือเพื่อศึกษาและวัดผล ข้อผิดพลาดแบบสุ่มความเป็นตัวแทน

ค่าเฉลี่ยตัวอย่างและสัดส่วนตัวอย่างเป็นตัวแปรสุ่มที่สามารถรับค่าที่แตกต่างกันได้ขึ้นอยู่กับหน่วยประชากรที่รวมอยู่ในตัวอย่าง ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างก็เช่นกัน เป็นตัวแปรสุ่มและตีความหมายได้หลากหลาย ดังนั้นจึงกำหนดค่าเฉลี่ยของข้อผิดพลาดที่เป็นไปได้

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย (µ - mu) เท่ากับ:

สำหรับค่าเฉลี่ย - เพื่อการแบ่งปัน ,

ที่ไหน - ส่วนแบ่งของลักษณะบางอย่างในประชากรทั่วไป

ในสูตรเหล่านี้ ซิ x 2และ (1-) คือลักษณะของประชากรทั่วไปที่ไม่ทราบในระหว่างการสังเกตตัวอย่าง ในทางปฏิบัติจะถูกแทนที่ด้วยลักษณะที่คล้ายกันของประชากรตัวอย่างตามกฎของจำนวนมากตามที่ประชากรตัวอย่างซึ่งมีปริมาณมากเพียงพอสามารถทำซ้ำลักษณะของประชากรทั่วไปได้อย่างแม่นยำ วิธีการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับค่าเฉลี่ยและการแบ่งส่วนระหว่างการสุ่มตัวอย่างซ้ำและไม่ซ้ำมีอยู่ในตาราง 6.1.

ตารางที่ 6.1.

สูตรคำนวณความคลาดเคลื่อนในการสุ่มตัวอย่างเฉลี่ยสำหรับค่าเฉลี่ยและส่วนแบ่ง

ค่าจะน้อยกว่าหนึ่งเสมอ ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยที่มีการสุ่มตัวอย่างแบบไม่ซ้ำจึงน้อยกว่าการสุ่มตัวอย่างซ้ำ ในกรณีที่ส่วนแบ่งตัวอย่างไม่มีนัยสำคัญและตัวคูณใกล้เคียงกับเอกภาพ การแก้ไขสามารถละเลยได้

เพื่อยืนยันว่านายพล ค่าเฉลี่ยตัวบ่งชี้หรือส่วนแบ่งทั่วไปจะไม่เกินกว่าค่าความผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยเท่านั้นโดยมีระดับความน่าจะเป็นที่แน่นอน ดังนั้นเพื่อระบุลักษณะข้อผิดพลาดในการสุ่มตัวอย่าง นอกเหนือจากข้อผิดพลาดโดยเฉลี่ย ให้คำนวณ ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อย(Δ) ซึ่งสัมพันธ์กับระดับความน่าจะเป็นที่รับประกันได้

ระดับความน่าจะเป็น ( ) กำหนดค่าของการเบี่ยงเบนมาตรฐาน ( ที) และในทางกลับกัน ค่านิยม ทีจะได้รับในตาราง การกระจายตัวแบบปกติความน่าจะเป็น ชุดค่าผสมที่ใช้บ่อยที่สุด ทีและ จะได้รับในตาราง 6.2.


ตารางที่ 6.2

ค่าเบี่ยงเบนมาตรฐาน ทีที่ค่าที่สอดคล้องกันของระดับความน่าจะเป็น

ที 1,0 1,5 2,0 2,5 3,0 3,5
0,683 0,866 0,954 0,988 0,997 0,999

ที- ปัจจัยความเชื่อมั่น ขึ้นอยู่กับความน่าจะเป็นที่สามารถรับประกันได้ว่าข้อผิดพลาดสูงสุดจะไม่เกิน ที- ข้อผิดพลาดเฉลี่ยหลายรายการ มันแสดงจำนวนข้อผิดพลาดโดยเฉลี่ยที่มีอยู่ในข้อผิดพลาดส่วนเพิ่ม- ถ้าอย่างนั้น ที= 1 จากนั้นด้วยความน่าจะเป็น 0.683 สามารถระบุได้ว่าความแตกต่างระหว่างตัวอย่างและตัวบ่งชี้ทั่วไปจะไม่เกินข้อผิดพลาดเฉลี่ยหนึ่งรายการ

สูตรสำหรับคำนวณข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดมีระบุไว้ในตารางที่ 1 6.3.

ตารางที่ 6.3.

สูตรคำนวณข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดสำหรับค่าเฉลี่ยและส่วนแบ่ง

หลังจากคำนวณข้อผิดพลาดตัวอย่างสูงสุดแล้ว เราจะพบ ช่วงความมั่นใจสำหรับตัวชี้วัดทั่วไป- ความน่าจะเป็นที่เกิดขึ้นเมื่อคำนวณข้อผิดพลาดของคุณลักษณะตัวอย่างเรียกว่าความมั่นใจ ระดับความมั่นใจความน่าจะเป็น 0.95 หมายความว่ามีเพียง 5 กรณีจาก 100 เท่านั้นที่ข้อผิดพลาดอาจไปไกลกว่านั้น ขอบเขตที่กำหนดไว้- ความน่าจะเป็น 0.954 - ใน 46 กรณีจาก 1,000 และ 0.999 - ใน 1 กรณีจาก 1,000

สำหรับค่าเฉลี่ยทั่วไป ขอบเขตที่เป็นไปได้มากที่สุดที่จะตั้งอยู่ โดยคำนึงถึงข้อผิดพลาดในการเป็นตัวแทนสูงสุดจะมีรูปแบบ:

.

ขอบเขตที่เป็นไปได้มากที่สุดที่หุ้นทั่วไปจะตั้งอยู่คือ:

.

จากที่นี่ ค่าเฉลี่ยทั่วไป , หุ้นทั่วไป .

ให้ไว้ในตาราง 6.3. สูตรต่างๆ ใช้เพื่อระบุข้อผิดพลาดในการสุ่มตัวอย่างที่ดำเนินการโดยวิธีการสุ่มและเชิงกลล้วนๆ

ด้วยการสุ่มตัวอย่างแบบแบ่งชั้น กลุ่มตัวอย่างจำเป็นต้องประกอบด้วยตัวแทนของทุกกลุ่มและโดยปกติจะมีสัดส่วนเดียวกันกับในประชากรทั่วไป ดังนั้นการสุ่มตัวอย่างจึงเกิดข้อผิดพลาด ในกรณีนี้ขึ้นอยู่กับค่าเฉลี่ยของความแปรปรวนภายในกลุ่มเป็นหลัก ตามกฎสำหรับการบวกความแปรปรวน เราสามารถสรุปได้ว่าข้อผิดพลาดในการสุ่มตัวอย่างสำหรับการสุ่มตัวอย่างแบบแบ่งชั้นจะน้อยกว่าการสุ่มตัวอย่างเสมอ

ด้วยการเลือกแบบอนุกรม (คลัสเตอร์) การวัดความแปรปรวนจะเป็นการกระจายตัวระหว่างกลุ่ม