ประชากรและกลุ่มตัวอย่าง ประชากรและกลุ่มตัวอย่าง
ชุดของวัตถุที่เป็นเนื้อเดียวกันมักได้รับการศึกษาโดยสัมพันธ์กับคุณลักษณะบางอย่างที่บ่งบอกลักษณะเฉพาะของวัตถุนั้น วัดในเชิงปริมาณหรือในเชิงคุณภาพ
เช่นถ้ามีชิ้นส่วนเป็นชุดก็แสดงว่า ลักษณะเชิงปริมาณขนาดของชิ้นส่วนอาจเป็นไปตาม GOST และคุณภาพอาจเป็นมาตรฐานของชิ้นส่วน
หากจำเป็นต้องตรวจสอบการปฏิบัติตามมาตรฐาน บางครั้งพวกเขาก็หันไปใช้การตรวจสอบทั้งหมด แต่ในทางปฏิบัติไม่ค่อยมีการใช้มากนัก เช่นหากประชากรประกอบด้วย จำนวนมากวัตถุที่กำลังศึกษาอยู่ แทบจะเป็นไปไม่ได้เลยที่จะดำเนินการสำรวจที่ครอบคลุม ในกรณีนี้ จะมีการเลือกวัตถุ (องค์ประกอบ) จำนวนหนึ่งจากประชากรทั้งหมดและตรวจสอบ จึงมีประชากรทั่วไปและประชากรตัวอย่าง
ทั่วไป คือผลรวมของวัตถุทั้งหมดที่อยู่ภายใต้การตรวจสอบหรือการศึกษา ประชากรตามกฎแล้วประกอบด้วย หมายเลขสุดท้ายองค์ประกอบต่างๆ แต่ถ้ามีขนาดใหญ่เกินไปก็เพื่อให้ง่ายขึ้น การคำนวณทางคณิตศาสตร์สันนิษฐานว่าทั้งเซตประกอบด้วยวัตถุจำนวนอนันต์
ตัวอย่างหรือกรอบการสุ่มตัวอย่างเป็นส่วนหนึ่งขององค์ประกอบที่เลือกจากประชากรทั้งหมด ตัวอย่างสามารถทำซ้ำหรือไม่ซ้ำก็ได้ ในกรณีแรกจะถูกส่งกลับไปยังประชากรทั่วไป ในกรณีที่สอง - ไม่ใช่ ใน กิจกรรมภาคปฏิบัติการเลือกแบบสุ่มซ้ำ ๆ มักใช้บ่อยกว่า
ประชากรและกลุ่มตัวอย่างจะต้องมีความสัมพันธ์ซึ่งกันและกันโดยเป็นตัวแทน กล่าวอีกนัยหนึ่ง เพื่อที่จะกำหนดลักษณะของประชากรทั้งหมดอย่างมั่นใจตามลักษณะของประชากรตัวอย่าง จำเป็นที่องค์ประกอบตัวอย่างจะต้องแสดงองค์ประกอบเหล่านั้นอย่างถูกต้องที่สุด กล่าวอีกนัยหนึ่ง ตัวอย่างจะต้องเป็นตัวแทน (ตัวแทน)
ตัวอย่างจะเป็นตัวแทนไม่มากก็น้อยหากสุ่มเลือกจากค่ามาก จำนวนมากทั้งชุด สิ่งนี้สามารถระบุได้บนพื้นฐานของกฎที่เรียกว่ากฎจำนวนมาก ในกรณีนี้ องค์ประกอบทั้งหมดมีความน่าจะเป็นที่เท่ากันที่จะรวมไว้ในตัวอย่าง
มีอยู่ ตัวเลือกต่างๆการเลือก โดยทั่วไปวิธีการทั้งหมดนี้สามารถแบ่งออกเป็นสองตัวเลือก:
- ตัวเลือก 1. องค์ประกอบจะถูกเลือกเมื่อประชากรไม่ได้แบ่งออกเป็นส่วนๆ ตัวเลือกนี้รวมถึงการสุ่มซ้ำแบบง่ายและปีศาจ การคัดเลือกใหม่ส.
- ตัวเลือกที่ 2 ประชากรทั่วไปแบ่งออกเป็นส่วน ๆ และเลือกองค์ประกอบต่างๆ ซึ่งรวมถึงการสุ่มตัวอย่างทั่วไป แบบเชิงกล และแบบอนุกรม
การสุ่มอย่างง่าย - การเลือกองค์ประกอบที่ถูกเลือกทีละรายการจากประชากรทั้งหมดโดยการสุ่ม
โดยทั่วไปคือการเลือกองค์ประกอบที่ไม่ได้เลือกจากประชากรทั้งหมด แต่จากส่วนที่ "ทั่วไป" ทั้งหมด
การเลือกทางกลคือการที่ประชากรทั้งหมดถูกแบ่งออกเป็นกลุ่มจำนวนเท่ากับจำนวนองค์ประกอบที่ควรอยู่ในตัวอย่าง และด้วยเหตุนี้จึงมีการเลือกองค์ประกอบหนึ่งจากแต่ละกลุ่ม ตัวอย่างเช่น หากคุณต้องการเลือก 25% ของชิ้นส่วนที่ผลิตโดยเครื่องจักร ก็จะเลือกทุกๆ ส่วนที่สี่ และหากคุณต้องการเลือก 4% ของชิ้นส่วน ก็จะเลือกทุกๆ ยี่สิบห้าส่วนที่เป็นเช่นนี้ไปเรื่อยๆ ต้องบอกว่าบางครั้งการเลือกใช้กลไกอาจไม่เพียงพอ
อนุกรมคือการเลือกองค์ประกอบต่างๆ ที่ถูกเลือกจากประชากรทั้งหมดใน "อนุกรม" ซึ่งได้รับการวิจัยอย่างต่อเนื่อง ไม่ใช่ทีละรายการ เช่น เมื่อมีการผลิตชิ้นส่วน จำนวนมากเครื่องจักรอัตโนมัติ จากนั้นจะมีการสำรวจที่ครอบคลุมเกี่ยวกับผลิตภัณฑ์ของเครื่องจักรหลายเครื่องเท่านั้น การเลือกแบบอนุกรมจะใช้หากลักษณะที่ศึกษามีความแปรปรวนเล็กน้อยในชุดข้อมูลต่างๆ
เพื่อลดข้อผิดพลาด จึงมีการใช้การประมาณประชากรทั่วไปโดยใช้ตัวอย่าง นอกจากนี้ การควบคุมการสุ่มตัวอย่างอาจเป็นแบบขั้นตอนเดียวหรือหลายขั้นตอนก็ได้ ซึ่งจะเพิ่มความน่าเชื่อถือของการสำรวจ
ประชากร- จำนวนทั้งสิ้นของวัตถุทั้งหมด (หน่วย) ที่นักวิทยาศาสตร์ตั้งใจที่จะสรุปผลเมื่อศึกษาปัญหาเฉพาะ ประชากรประกอบด้วยวัตถุทั้งหมดที่กำลังศึกษาอยู่ องค์ประกอบของประชากรขึ้นอยู่กับวัตถุประสงค์ของการศึกษา บางครั้งประชากรทั่วไปคือประชากรทั้งหมดของภูมิภาคหนึ่ง (เช่น เมื่อศึกษาทัศนคติของผู้มีสิทธิ์ลงคะแนนเสียงที่มีต่อผู้สมัคร) โดยส่วนใหญ่แล้ว มักจะมีการระบุเกณฑ์หลายข้อเพื่อกำหนดวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น ผู้หญิงอายุ 18-29 ปีที่ใช้ครีมทามือบางยี่ห้ออย่างน้อยสัปดาห์ละครั้งและมีรายได้อย่างน้อย $150 ต่อสมาชิกในครอบครัว
ตัวอย่าง- ชุดของกรณี (วิชา วัตถุ เหตุการณ์ ตัวอย่าง) โดยใช้ขั้นตอนบางอย่าง คัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา
- ขนาดตัวอย่าง
- ตัวอย่างขึ้นอยู่กับและเป็นอิสระ
- ความเป็นตัวแทน:
- ตัวอย่าง ตัวอย่างที่ไม่ใช่ตัวแทน;
- ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง
- กลยุทธ์การสร้างกลุ่ม:
- การสุ่ม;
- การเลือกคู่;
- การเลือกสตราโตเมตริก
- การสร้างแบบจำลองโดยประมาณ
ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำให้จำนวนเคสมีอย่างน้อย 30-35
ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ
เมื่อเปรียบเทียบสองตัวอย่าง (หรือมากกว่า) พารามิเตอร์ที่สำคัญคือการพึ่งพาอาศัยกัน หากเป็นไปได้ที่จะสร้างคู่โฮโมมอร์ฟิก (นั่นคือ เมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับกรณีเดียวจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และพื้นฐานสำหรับความสัมพันธ์นี้มีความสำคัญสำหรับ ลักษณะที่วัดได้ในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่าขึ้นอยู่กับ ตัวอย่างของกลุ่มตัวอย่างที่ต้องพึ่งพา: คู่แฝด การวัดลักษณะสองครั้งก่อนและหลัง อิทธิพลของการทดลองสามีและภรรยา ฯลฯ
หากไม่มีความสัมพันธ์ดังกล่าวระหว่างกลุ่มตัวอย่าง ตัวอย่างเหล่านี้จะถือว่าเป็นอิสระ เช่น ชายและหญิง นักจิตวิทยา และนักคณิตศาสตร์
ดังนั้น ตัวอย่างที่ต้องพึ่งพาจะมีปริมาตรเท่ากันเสมอ ในขณะที่ปริมาตรของตัวอย่างอิสระอาจแตกต่างกัน
การเปรียบเทียบตัวอย่างทำได้โดยใช้เกณฑ์ทางสถิติต่างๆ:
- แบบทดสอบของนักเรียน
- วิลคอกสันทีทดสอบ;
- การทดสอบ Mann-Whitney U;
- เกณฑ์การลงนาม ฯลฯ
ความเป็นตัวแทน
ตัวอย่างอาจถือได้ว่าเป็นตัวแทนหรือไม่เป็นตัวแทน
ตัวอย่างของกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน
ในประเทศสหรัฐอเมริกาที่มีชื่อเสียงที่สุดแห่งหนึ่ง ตัวอย่างทางประวัติศาสตร์การเลือกตั้งประธานาธิบดีในปี พ.ศ. 2479 ถือเป็นกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน ซึ่งหนังสือพิมพ์ The Literary Digest คาดการณ์เหตุการณ์ต่างๆ ในการเลือกตั้งครั้งก่อนได้สำเร็จ คาดการณ์ผิดโดยส่งบัตรลงคะแนนทดสอบจำนวน 10 ล้านใบให้กับสมาชิก โดยประชาชนเลือกจากสมุดโทรศัพท์ตลอดทั้งการเลือกตั้ง ประเทศ และบุคคลจากรายชื่อทะเบียนรถ ใน 25% ของบัตรลงคะแนนที่ได้รับคืน (เกือบ 2.5 ล้านใบ) แบ่งคะแนนเสียงดังนี้
57% ต้องการผู้สมัครจากพรรครีพับลิกัน Alf Landon
40% เลือกประธานาธิบดีแฟรงคลิน รูสเวลต์ ซึ่งเป็นพรรคเดโมแครตในขณะนั้น
ในการเลือกตั้งจริง ดังที่ทราบกันดีว่ารูสเวลต์ชนะ โดยได้รับคะแนนเสียงมากกว่า 60% ข้อผิดพลาดของ Literary Digest คือ: ต้องการเพิ่มความเป็นตัวแทนของกลุ่มตัวอย่าง - เนื่องจากพวกเขารู้ว่าสมาชิกส่วนใหญ่คิดว่าตัวเองเป็นพรรครีพับลิกัน - พวกเขาจึงขยายกลุ่มตัวอย่างให้รวมผู้ที่ได้รับเลือกจากสมุดโทรศัพท์และรายชื่อการลงทะเบียน อย่างไรก็ตาม พวกเขาไม่ได้คำนึงถึงความเป็นจริงของเวลาของพวกเขาและในความเป็นจริงได้คัดเลือกพรรครีพับลิกันมากขึ้น: ในช่วงภาวะเศรษฐกิจตกต่ำครั้งใหญ่ส่วนใหญ่เป็นตัวแทนของชนชั้นกลางและชนชั้นสูงที่สามารถเป็นเจ้าของโทรศัพท์และรถยนต์ได้ (นั่นคือพรรครีพับลิกันส่วนใหญ่ ไม่ใช่พรรคเดโมแครต)
ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง
แผนการสร้างกลุ่มมีหลายประเภทหลัก:
- การศึกษากับกลุ่มทดลองและกลุ่มควบคุมซึ่งอยู่ในสภาวะที่แตกต่างกัน
- การศึกษากับกลุ่มทดลองและกลุ่มควบคุมโดยใช้กลยุทธ์การเลือกแบบคู่
- การศึกษาโดยใช้เพียงกลุ่มเดียว - ทดลอง;
- การศึกษาโดยใช้การออกแบบแบบผสม (แฟคทอเรียล) ทุกกลุ่มจะถูกจัดให้อยู่ในสภาวะที่แตกต่างกัน
กลยุทธ์การสร้างกลุ่ม
การคัดเลือกกลุ่มที่จะเข้าร่วม การทดลองทางจิตวิทยาดำเนินการผ่านกลยุทธ์ต่างๆ ที่จำเป็นเพื่อให้แน่ใจว่าการรักษาความถูกต้องทั้งภายในและภายนอกจะคงอยู่ในขอบเขตสูงสุดที่เป็นไปได้:
- การสุ่ม (การเลือกแบบสุ่ม);
- การเลือกคู่;
- การเลือกสตราโตเมตริก
- การสร้างแบบจำลองโดยประมาณ
- ดึงดูดกลุ่มจริง
การสุ่ม
การสุ่มหรือการสุ่มตัวอย่างใช้เพื่อสร้างตัวอย่างสุ่มอย่างง่าย การใช้ตัวอย่างดังกล่าวตั้งอยู่บนสมมติฐานที่ว่าสมาชิกแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในกลุ่มตัวอย่างเท่าๆ กัน เช่น การทำ ตัวอย่างแบบสุ่มจากนักศึกษามหาวิทยาลัย 100 คน คุณสามารถใส่กระดาษที่มีชื่อของนักศึกษามหาวิทยาลัยทุกคนใส่หมวก แล้วหยิบกระดาษออกมา 100 แผ่น - นี่จะเป็นการเลือกแบบสุ่ม
การเลือกคู่
การเลือกแบบคู่เป็นกลยุทธ์สำหรับการสร้างกลุ่มตัวอย่าง ซึ่งกลุ่มของอาสาสมัครจะประกอบด้วยอาสาสมัครที่เทียบเท่ากันในแง่ของพารามิเตอร์รองที่มีนัยสำคัญสำหรับการทดลอง กลยุทธ์นี้มีประสิทธิภาพสำหรับการทดลองโดยใช้กลุ่มทดลองและกลุ่มควบคุม โดยตัวเลือกที่ดีที่สุดคือการมีส่วนร่วมของคู่แฝด (โมโนและไดไซโกติก) เนื่องจากช่วยให้คุณสร้างได้
การสุ่มตัวอย่างแบบ Stratometric
การเลือก Stratometric - การสุ่มด้วยการจัดสรรชั้น (หรือกลุ่ม) ที่ วิธีนี้เมื่อสร้างกลุ่มตัวอย่าง ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ที่มีลักษณะเฉพาะ (เพศ อายุ ความชอบทางการเมือง การศึกษา ระดับรายได้ ฯลฯ) และเลือกวิชาที่มีลักษณะสอดคล้องกัน
การสร้างแบบจำลองโดยประมาณ
การสร้างแบบจำลองโดยประมาณ - การวาดตัวอย่างที่จำกัดและสรุปข้อสรุปเกี่ยวกับตัวอย่างนี้แก่ประชากรในวงกว้าง ตัวอย่างเช่น เมื่อนักศึกษามหาวิทยาลัยชั้นปีที่ 2 มีส่วนร่วมในการศึกษาวิจัย ข้อมูลของการศึกษานี้ใช้กับ “ผู้ที่มีอายุ 17 ถึง 21 ปี” การยอมรับลักษณะทั่วไปดังกล่าวมีจำกัดอย่างมาก
ประชากร(ในภาษาอังกฤษ - ประชากร) - ชุดของวัตถุทั้งหมด (หน่วย) ที่นักวิทยาศาสตร์ตั้งใจที่จะสรุปผลเมื่อศึกษาปัญหาเฉพาะ
ประชากรประกอบด้วยวัตถุทั้งหมดที่กำลังศึกษาอยู่ องค์ประกอบของประชากรขึ้นอยู่กับวัตถุประสงค์ของการศึกษา บางครั้งประชากรทั่วไปคือประชากรทั้งหมดของภูมิภาคหนึ่ง (เช่น เมื่อศึกษาทัศนคติของผู้มีสิทธิ์ลงคะแนนเสียงที่มีต่อผู้สมัคร) โดยส่วนใหญ่แล้ว มักจะมีการระบุเกณฑ์หลายข้อเพื่อกำหนดวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น ผู้ชายอายุ 30-50 ปีที่ใช้มีดโกนบางยี่ห้ออย่างน้อยสัปดาห์ละครั้งและมีรายได้อย่างน้อย 100 ดอลลาร์ต่อสมาชิกในครอบครัว
ตัวอย่างหรือ ประชากรตัวอย่าง- ชุดของกรณี (วิชา วัตถุ เหตุการณ์ ตัวอย่าง) โดยใช้ขั้นตอนบางอย่าง คัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา
ลักษณะตัวอย่าง:
ลักษณะเชิงคุณภาพของกลุ่มตัวอย่าง - ใครกันแน่ที่เราเลือกและวิธีการสุ่มตัวอย่างที่เราใช้สำหรับสิ่งนี้
คุณลักษณะเชิงปริมาณของกลุ่มตัวอย่าง - จำนวนกรณีที่เราเลือก กล่าวคือ ขนาดตัวอย่าง
ความจำเป็นของการสุ่มตัวอย่าง
วัตถุประสงค์ของการศึกษานั้นกว้างขวางมาก ตัวอย่างเช่น ผู้บริโภคผลิตภัณฑ์ของบริษัทระดับโลกมีตลาดที่กระจายตัวทางภูมิศาสตร์จำนวนมาก
มีความจำเป็นต้องรวบรวมข้อมูลเบื้องต้น
ขนาดตัวอย่าง
ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำว่าจำนวนเคสควรมีอย่างน้อย 30 ถึง 35
17. วิธีการสุ่มตัวอย่างเบื้องต้น
การสุ่มตัวอย่างขึ้นอยู่กับความรู้เกี่ยวกับกรอบการสุ่มตัวอย่างเป็นหลัก ซึ่งหมายถึงรายการหน่วยทั้งหมดในประชากรที่เลือกหน่วยสุ่มตัวอย่าง ตัวอย่างเช่น หากเราถือว่าเวิร์กช็อปบริการรถยนต์ทั้งหมดในเมืองมอสโกเป็นประชากร เราก็จำเป็นต้องมีรายชื่อเวิร์กช็อปดังกล่าว ซึ่งถือเป็นโครงร่างภายในที่มีตัวอย่างเกิดขึ้น
เส้นขอบตัวอย่างมีข้อผิดพลาดอย่างหลีกเลี่ยงไม่ได้ เรียกว่าข้อผิดพลาดเส้นขอบตัวอย่าง ซึ่งระบุลักษณะระดับความเบี่ยงเบนจากขนาดที่แท้จริงของประชากร เห็นได้ชัดว่าไม่มีรายชื่อร้านซ่อมรถยนต์อย่างเป็นทางการทั้งหมดในมอสโก ผู้วิจัยจะต้องแจ้งให้ลูกค้าทราบถึงขนาดของข้อผิดพลาดของรูปร่างตัวอย่าง
เมื่อสร้างตัวอย่าง จะใช้วิธีการความน่าจะเป็น (สุ่ม) และวิธีที่ไม่น่าจะเป็น (ไม่สุ่ม)
ถ้าหน่วยตัวอย่างทั้งหมดมีโอกาส (ความน่าจะเป็น) ที่ทราบที่จะรวมอยู่ในตัวอย่าง ตัวอย่างนั้นเรียกว่าความน่าจะเป็น หากไม่ทราบความน่าจะเป็นนี้ ตัวอย่างจะเรียกว่าไม่น่าจะเป็น น่าเสียดายที่ในการศึกษาการตลาดส่วนใหญ่ เนื่องจากไม่สามารถระบุขนาดประชากรได้อย่างแม่นยำ จึงไม่สามารถคำนวณความน่าจะเป็นได้อย่างแม่นยำ ดังนั้น คำว่า "ความน่าจะเป็นที่ทราบ" จึงขึ้นอยู่กับการใช้เทคนิคการสุ่มตัวอย่างบางอย่าง แทนที่จะอาศัยความรู้เกี่ยวกับขนาดที่แน่นอนของประชากร
วิธีการความน่าจะเป็นได้แก่:
การเลือกแบบสุ่มอย่างง่าย
การคัดเลือกอย่างเป็นระบบ
การเลือกคลัสเตอร์
การคัดเลือกแบบแบ่งชั้น
วิธีการที่ไม่น่าจะเป็น:
การคัดเลือกตามหลักความสะดวก
การคัดเลือกขึ้นอยู่กับการตัดสิน
การสุ่มตัวอย่างในระหว่างกระบวนการสำรวจ
การสุ่มตัวอย่างตามโควต้า
ความหมายของวิธีการคัดเลือกตามหลักความสะดวกคือ การสุ่มตัวอย่างจะดำเนินการในวิธีที่สะดวกที่สุดจากมุมมองของผู้วิจัย เช่น จากมุมมองของเวลาและความพยายามน้อยที่สุดจากมุมมองของ ความพร้อมของผู้ตอบแบบสอบถาม การเลือกสถานที่วิจัยและองค์ประกอบตัวอย่างนั้นขึ้นอยู่กับจิตใจ เช่น การสำรวจลูกค้าจะดำเนินการในร้านค้าที่ใกล้กับสถานที่อยู่อาศัยของผู้วิจัยมากที่สุด เห็นได้ชัดว่าประชากรจำนวนมากไม่ได้มีส่วนร่วมในการสำรวจ
การสุ่มตัวอย่างตามวิจารณญาณขึ้นอยู่กับการใช้ความคิดเห็นของผู้เชี่ยวชาญและผู้เชี่ยวชาญที่มีคุณสมบัติเกี่ยวกับองค์ประกอบของตัวอย่าง จากแนวทางนี้ มักมีการจัดองค์ประกอบของกลุ่มเป้าหมายขึ้น
การสุ่มตัวอย่างในระหว่างขั้นตอนการสำรวจจะขึ้นอยู่กับการขยายจำนวนผู้ตอบแบบสอบถามตามข้อเสนอแนะของผู้ตอบแบบสอบถามที่ได้มีส่วนร่วมในการสำรวจแล้ว ในขั้นต้น ผู้วิจัยสร้างตัวอย่างที่มีขนาดเล็กกว่าที่จำเป็นสำหรับการศึกษามาก จากนั้นจะขยายออกไปเมื่อการวิจัยดำเนินไป
การสร้างกลุ่มตัวอย่างตามโควต้า (การเลือกโควต้า) เกี่ยวข้องกับการกำหนดจำนวนกลุ่มผู้ตอบแบบสอบถามที่ตรงตามข้อกำหนด (เกณฑ์) เบื้องต้น โดยขึ้นอยู่กับวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น เพื่อวัตถุประสงค์ของการศึกษา มีการตัดสินใจว่าควรสัมภาษณ์ผู้ชายห้าสิบคนและผู้หญิงห้าสิบคนในห้างสรรพสินค้าแห่งหนึ่ง ผู้สัมภาษณ์ดำเนินการสำรวจจนกว่าเขาจะเลือกโควต้าที่กำหนด
การกระจาย ตัวแปรสุ่มมีข้อมูลทั้งหมดเกี่ยวกับเธอ คุณสมบัติทางสถิติ- คุณจำเป็นต้องรู้ค่าของตัวแปรสุ่มกี่ค่าเพื่อสร้างการกระจายตัวของมัน? เมื่อต้องการทำเช่นนี้ คุณต้องสำรวจมัน ประชากรทั่วไป.
ประชากรคือชุดของค่าทั้งหมดที่ตัวแปรสุ่มที่กำหนดสามารถรับได้
จำนวนหน่วยในประชากรเรียกว่าปริมาตร เอ็น- ค่านี้สามารถมีขอบเขตหรือไม่มีที่สิ้นสุด ตัวอย่างเช่น หากมีการศึกษาการเติบโตของประชากรในเมืองหนึ่ง ขนาดของประชากรก็จะเป็น เท่ากับจำนวนชาวเมือง ถ้ามี การทดลองทางกายภาพแล้วปริมาตรของประชากรทั่วไปจะไม่มีที่สิ้นสุดเพราะว่า จำนวนค่าที่เป็นไปได้ทั้งหมดของค่าใด ๆ พารามิเตอร์ทางกายภาพเท่ากับอนันต์
การศึกษาประชากรทั่วไปอาจไม่สามารถทำได้หรือไม่ควรทำเสมอไป เป็นไปไม่ได้หากจำนวนประชากรมีไม่จำกัด แต่ถึงแม้จะมีปริมาณจำกัดก็ตาม การศึกษาเต็มรูปแบบไม่ได้เป็นสิ่งที่สมเหตุสมผลเสมอไป เนื่องจากต้องใช้เวลาและแรงงานมากและมักไม่จำเป็นต้องมีความแม่นยำที่แท้จริงของผลลัพธ์ น้อย ผลลัพธ์ที่แม่นยำแต่ด้วยความพยายามและเงินที่น้อยลงอย่างมากสามารถหาได้จากการศึกษาประชากรทั่วไปเพียงบางส่วนเท่านั้น การศึกษาดังกล่าวเรียกว่าการสุ่มตัวอย่าง
การศึกษาทางสถิติที่ดำเนินการเฉพาะบางส่วนของประชากรเรียกว่าการสุ่มตัวอย่าง และส่วนหนึ่งของประชากรที่กำลังศึกษาเรียกว่าตัวอย่าง
รูปที่ 7.2 แสดงประชากรและกลุ่มตัวอย่างเป็นเซตและเซตย่อยในเชิงสัญลักษณ์
รูปที่ 7.2 ประชากรและกลุ่มตัวอย่าง
เมื่อทำงานกับกลุ่มย่อยหนึ่งของประชากรที่กำหนด ซึ่งมักจะเป็นส่วนที่ไม่มีนัยสำคัญ เราได้รับผลลัพธ์ที่ค่อนข้างน่าพอใจในด้านความแม่นยำสำหรับวัตถุประสงค์ในทางปฏิบัติ การศึกษาประชากรส่วนใหญ่จะเพิ่มความแม่นยำเท่านั้น แต่จะไม่เปลี่ยนสาระสำคัญของผลลัพธ์ หากเก็บตัวอย่างอย่างถูกต้องจากมุมมองทางสถิติ
เพื่อให้ตัวอย่างสะท้อนคุณสมบัติของประชากรและผลลัพธ์มีความน่าเชื่อถือ จะต้องเป็นเช่นนั้น ตัวแทน(ตัวแทน).
สำหรับประชากรทั่วไปบางส่วน ส่วนใดส่วนหนึ่งเป็นตัวแทนเนื่องจากธรรมชาติของพวกเขา อย่างไรก็ตาม ในกรณีส่วนใหญ่ ต้องใช้มาตรการพิเศษเพื่อให้แน่ใจว่าตัวอย่างที่เป็นตัวแทน
หนึ่งหนึ่งในความสำเร็จหลักของความทันสมัย สถิติทางคณิตศาสตร์ถือเป็นการพัฒนาทฤษฎีและการปฏิบัติของวิธีการสุ่มตัวอย่างเพื่อให้มั่นใจถึงความเป็นตัวแทนของการเลือกข้อมูล
การศึกษาตัวอย่างมักจะมีความแม่นยำน้อยกว่าการศึกษาในประชากรทั้งหมดเสมอ อย่างไรก็ตาม เรื่องนี้สามารถกระทบยอดได้หากทราบขนาดของข้อผิดพลาด แน่นอนว่า ยิ่งขนาดตัวอย่างใกล้เคียงกับขนาดประชากรมากเท่าไร ข้อผิดพลาดก็จะยิ่งน้อยลงเท่านั้น เป็นที่ชัดเจนว่าปัญหาของการอนุมานทางสถิติมีความเกี่ยวข้องโดยเฉพาะเมื่อทำงานกับตัวอย่างขนาดเล็ก ( เอ็น ? 10-50).
อาร์เรย์ทั้งหมดของบุคคลในหมวดหมู่ใดหมวดหมู่หนึ่งเรียกว่าประชากรทั่วไป ขนาดของประชากรถูกกำหนดโดยวัตถุประสงค์ของการศึกษา
หากมีการศึกษาชนิดของสัตว์ป่าหรือพืช ประชากรทั่วไปจะเป็นบุคคลในสายพันธุ์นี้ทั้งหมด ใน ในกรณีนี้ปริมาณของประชากรทั่วไปจะมีขนาดใหญ่มากและในการคำนวณจะถือว่าเป็นมูลค่าที่มากอย่างไม่สิ้นสุด
หากมีการศึกษาผลกระทบของสารต่อพืชและสัตว์ในประเภทใดประเภทหนึ่ง ประชากรทั่วไปจะเป็นพืชและสัตว์ทั้งหมดในประเภทนั้น (ชนิด เพศ อายุ วัตถุประสงค์ทางเศรษฐกิจ) ที่เป็นของวัตถุทดลอง มันไม่ค่อยดีแล้ว จำนวนมากบุคคลแต่ยังไม่พร้อมสำหรับการศึกษาแบบครอบคลุม
ปริมาณประชากรทั่วไปอาจไม่พร้อมสำหรับการศึกษาแบบครอบคลุมเสมอไป บางครั้งมีการศึกษาประชากรกลุ่มเล็กๆ เช่น ปริมาณน้ำนมโดยเฉลี่ยหรือการตัดขนโดยเฉลี่ยของกลุ่มสัตว์ที่มอบหมายให้กับคนงานบางคนจะถูกกำหนด ในกรณีเช่นนี้ ประชากรจะเป็นบุคคลจำนวนน้อยมาก ซึ่งทั้งหมดนี้ได้รับการศึกษา ประชากรกลุ่มเล็กๆ ยังพบได้เมื่อศึกษาพืชหรือสัตว์ในกลุ่มเพื่อจุดประสงค์ในการจำแนกลักษณะ กลุ่มใดกลุ่มหนึ่งในคอลเลกชันนี้
ลักษณะของคุณสมบัติกลุ่ม (ฯลฯ) ที่เกี่ยวข้องกับประชากรทั้งหมดเรียกว่าพารามิเตอร์ทั่วไป
ตัวอย่างคือกลุ่มของออบเจ็กต์ที่มีคุณสมบัติแตกต่างกัน 3 ประการ:
1 เป็นส่วนหนึ่งของประชากรทั่วไป
2 สุ่มเลือกด้วยวิธีใดวิธีหนึ่ง;
3 ศึกษาเพื่อระบุลักษณะของประชากรทั้งหมด
เพื่อให้ได้คุณลักษณะที่แม่นยำของประชากรทั้งหมดจากตัวอย่าง จำเป็นต้องจัดระเบียบการเลือกวัตถุที่ถูกต้องจากประชากร
ทฤษฎีและการปฏิบัติได้พัฒนาระบบหลายระบบสำหรับการคัดเลือกบุคคลเพื่อสุ่มตัวอย่าง ระบบทั้งหมดนี้ขึ้นอยู่กับความปรารถนาที่จะให้โอกาสสูงสุดในการเลือกวัตถุใด ๆ จากประชากรทั่วไป แนวโน้ม อคติในการเลือกวัตถุให้ แบบสำรวจตัวอย่างรบกวนการได้รับข้อสรุปทั่วไปที่ถูกต้อง และทำให้ผลลัพธ์ของการศึกษาตัวอย่างไม่บ่งชี้ถึงประชากรทั้งหมด กล่าวคือ ไม่ได้เป็นตัวแทน
เพื่อให้ได้คุณลักษณะที่ถูกต้องและไม่บิดเบือนของประชากรทั้งหมด จำเป็นต้องพยายามให้แน่ใจว่ามีความเป็นไปได้ในการเลือกวัตถุใดๆ จากส่วนใดๆ ของประชากรลงในกลุ่มตัวอย่าง ข้อกำหนดพื้นฐานนี้จะต้องได้รับการปฏิบัติตามอย่างเคร่งครัดมากขึ้น ลักษณะที่ศึกษาจะมีความหลากหลายมากขึ้น เป็นที่เข้าใจได้ว่าเมื่อความหลากหลายเข้าใกล้ศูนย์ เช่น ในกรณีศึกษาสีผมหรือขนนกในบางสายพันธุ์ วิธีการเลือกตัวอย่างใดๆ จะให้ผลลัพธ์ที่เป็นตัวแทน
ศึกษาการใช้งานต่างๆ วิธีการดังต่อไปนี้การเลือกวัตถุสำหรับตัวอย่าง
4 การเลือกซ้ำแบบสุ่ม โดยเลือกวัตถุการศึกษาจากประชากรทั่วไป โดยไม่คำนึงถึงการพัฒนาคุณลักษณะที่กำลังศึกษาก่อน เช่น ตามลำดับแบบสุ่ม (สำหรับคุณลักษณะที่กำหนด) หลังจากการคัดเลือกแล้ว แต่ละวัตถุจะถูกศึกษาแล้วส่งกลับไปยังประชากรของมัน เพื่อให้สามารถเลือกวัตถุใดๆ อีกครั้งได้ วิธีการคัดเลือกนี้เทียบเท่ากับการเลือกจากประชากรทั่วไปที่มีจำนวนไม่สิ้นสุดซึ่งมีการพัฒนาตัวบ่งชี้หลักของความสัมพันธ์ระหว่างตัวอย่างและค่าทั่วไป
5 การเลือกแบบสุ่มแบบไม่ซ้ำซ้อน โดยที่วัตถุที่เลือกไว้เหมือนวิธีก่อนหน้า จะไม่กลับคืนสู่ประชากรทั่วไปและไม่สามารถกลับเข้าไปในตัวอย่างได้อีกครั้ง นี่เป็นวิธีทั่วไปในการจัดระเบียบตัวอย่าง เทียบเท่ากับการคัดเลือกจากประชากรจำนวนมากแต่มีจำกัด ซึ่งจะนำมาพิจารณาเมื่อพิจารณาตัวบ่งชี้ทั่วไปจากตัวอย่าง
6 การเลือกทางกล ซึ่งวัตถุจะถูกเลือกจากแต่ละส่วนของประชากรทั่วไป และชิ้นส่วนเหล่านี้ถูกกำหนดเบื้องต้นทางกลไกตามกำลังสองของสนามทดลอง ตามกลุ่มสัตว์สุ่มที่นำมาจากพื้นที่ต่าง ๆ ของประชากร เป็นต้น โดยปกติจะเป็น ชิ้นส่วนดังกล่าวหลายชิ้นได้รับการสรุปตามที่คาดว่าจะเป็นวัตถุที่จะศึกษา ดังนั้นจำนวนชิ้นส่วนจึงเท่ากับขนาดของตัวอย่าง บางครั้งการคัดเลือกเชิงกลทำได้โดยการเลือกศึกษาตัวบุคคลตามจำนวนที่กำหนด เช่น โดยการส่งสัตว์ผ่านแยกและเลือกทุกๆ ในสิบ ในร้อย เป็นต้น หรือโดยการตัดหญ้าทุกๆ 100 หรือ 200 เมตร หรือโดยการเลือกอย่างใดอย่างหนึ่ง วัตถุทุกๆ 10 ชิ้นที่พบ 100 ชิ้น ฯลฯ เมื่อศึกษาประชากรทั้งหมด
8 การเลือกแบบอนุกรม (คลัสเตอร์) ซึ่งประชากรทั่วไปแบ่งออกเป็นส่วน - ซีรีส์ ซึ่งบางส่วนได้รับการศึกษาทั้งหมด วิธีการนี้ใช้ได้ผลดีในกรณีที่วัตถุที่กำลังศึกษามีการกระจายอย่างเท่าเทียมกันในปริมาณหนึ่งหรือเหนือขอบเขตที่กำหนด เช่น เมื่อศึกษาการปนเปื้อนของอากาศหรือน้ำด้วยจุลินทรีย์ จะมีการเก็บตัวอย่างและตรวจอย่างละเอียด ในบางกรณี วัตถุทางการเกษตรก็สามารถสำรวจได้โดยใช้วิธีทำรังด้วย เมื่อศึกษาผลผลิตเนื้อสัตว์และผลิตภัณฑ์แปรรูปอื่นๆ ของสายพันธุ์เนื้อปศุสัตว์ ตัวอย่างสามารถนำสัตว์ทุกตัวในสายพันธุ์นี้ที่มาถึงโรงงานแปรรูปเนื้อสัตว์สองหรือสามแห่ง เมื่อศึกษาขนาดไข่ในการเลี้ยงสัตว์ปีกในฟาร์มรวม คุณสามารถศึกษาลักษณะนี้ในฟาร์มรวมหลายแห่งทั่วทั้งประชากรไก่ทั้งหมด
ลักษณะของคุณสมบัติกลุ่ม (μ, สฯลฯ) ที่ได้รับสำหรับตัวอย่างเรียกว่าตัวบ่งชี้ตัวอย่าง
ความเป็นตัวแทน
การศึกษาโดยตรงของกลุ่มวัตถุที่เลือก ประการแรกจะให้ข้อมูลเบื้องต้นเกี่ยวกับวัสดุหลักและคุณลักษณะของตัวอย่างเอง
ข้อมูลตัวอย่างและตัวชี้วัดสรุปทั้งหมดมีความสำคัญเป็นข้อเท็จจริงเบื้องต้นที่เปิดเผยโดยการศึกษา และต้องได้รับการพิจารณา วิเคราะห์ และเปรียบเทียบกับผลงานอื่นๆ อย่างรอบคอบ แต่นี่ไม่ได้จำกัดอยู่เพียงแค่กระบวนการดึงข้อมูลที่มีอยู่เท่านั้น วัสดุหลักวิจัย.
ความจริงที่ว่าวัตถุถูกเลือกสำหรับตัวอย่างโดยใช้วิธีการพิเศษและในปริมาณที่เพียงพอ ทำให้ผลการศึกษาตัวอย่างบ่งชี้ไม่เพียงแต่สำหรับตัวอย่างเท่านั้น แต่ยังรวมถึงประชากรทั้งหมดที่ใช้ตัวอย่างนี้ด้วย
ตัวอย่างภายใต้เงื่อนไขบางประการจะสะท้อนประชากรทั้งหมดได้แม่นยำมากขึ้นหรือน้อยลง คุณสมบัติของตัวอย่างนี้เรียกว่าความเป็นตัวแทน ซึ่งหมายถึงความเป็นตัวแทนที่มีความแม่นยำและความน่าเชื่อถือในระดับหนึ่ง
เช่นเดียวกับคุณสมบัติอื่นๆ ความเป็นตัวแทนของข้อมูลตัวอย่างสามารถแสดงออกมาได้ในระดับที่เพียงพอหรือไม่เพียงพอ ในกรณีแรก จะได้ค่าประมาณที่เชื่อถือได้ของพารามิเตอร์ทั่วไปในตัวอย่างที่ 2 จะได้ค่าประมาณที่ไม่น่าเชื่อถือ สิ่งสำคัญคือต้องจำไว้ว่าการได้รับค่าประมาณที่ไม่น่าเชื่อถือนั้นไม่ได้ทำให้ค่าของตัวบ่งชี้ตัวอย่างลดลงไปจากการกำหนดลักษณะของตัวอย่าง การได้รับค่าประมาณที่เชื่อถือได้จะขยายขอบเขตการประยุกต์ใช้ความสำเร็จที่ได้รับในการศึกษาตัวอย่าง