ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

ประชากรเป็นการสุ่มตัวอย่างตามธรรมชาติ ประชากรและวิธีการสุ่มตัวอย่าง

ประชากร (ในภาษาอังกฤษ - ประชากร) - ชุดของวัตถุทั้งหมด (หน่วย) ที่นักวิทยาศาสตร์ตั้งใจที่จะสรุปผลเมื่อศึกษาปัญหาเฉพาะ

ประชากรประกอบด้วยวัตถุทั้งหมดที่กำลังศึกษาอยู่ องค์ประกอบของประชากรขึ้นอยู่กับวัตถุประสงค์ของการศึกษา บางครั้งประชากรทั่วไปคือประชากรทั้งหมดของภูมิภาคหนึ่ง (เช่น เมื่อศึกษาทัศนคติของผู้มีสิทธิ์ลงคะแนนเสียงที่มีต่อผู้สมัคร) โดยส่วนใหญ่แล้ว มักจะมีการระบุเกณฑ์หลายข้อเพื่อกำหนดวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น ผู้ชายอายุ 30-50 ปีที่ใช้มีดโกนบางยี่ห้ออย่างน้อยสัปดาห์ละครั้งและมีรายได้อย่างน้อย 100 ดอลลาร์ต่อสมาชิกในครอบครัว

ตัวอย่างหรือ ประชากรตัวอย่าง- ชุดของกรณี (วิชา วัตถุ เหตุการณ์ ตัวอย่าง) โดยใช้ขั้นตอนบางอย่าง คัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา

ลักษณะตัวอย่าง:

· ลักษณะเชิงคุณภาพของกลุ่มตัวอย่าง - เราเลือกใครกันแน่และวิธีการสุ่มตัวอย่างที่เราใช้สำหรับสิ่งนี้

· ลักษณะเชิงปริมาณของกลุ่มตัวอย่าง - จำนวนกรณีที่เราเลือก กล่าวคือ ขนาดตัวอย่าง

ความจำเป็นของการสุ่มตัวอย่าง

· วัตถุประสงค์ของการศึกษานั้นกว้างขวางมาก ตัวอย่างเช่น ผู้บริโภคผลิตภัณฑ์ของบริษัทระดับโลก - จำนวนมากตลาดที่กระจายตัวทางภูมิศาสตร์

· มีความจำเป็นต้องรวบรวมข้อมูลเบื้องต้น

ขนาดตัวอย่าง

ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำว่าจำนวนเคสควรมีอย่างน้อย 30 ถึง 35

ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ

เมื่อเปรียบเทียบสองตัวอย่าง (หรือมากกว่า) พารามิเตอร์ที่สำคัญคือการพึ่งพาอาศัยกัน หากสามารถสร้างคู่โฮโมมอร์ฟิกได้ (นั่นคือ เมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับกรณีเดียวจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และความสัมพันธ์พื้นฐานนี้มีความสำคัญสำหรับลักษณะที่จะวัด ในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่า ขึ้นอยู่กับ- ตัวอย่างของกลุ่มตัวอย่างที่ต้องพึ่งพา:

· คู่แฝด

· การวัดลักษณะใดๆ สองครั้งก่อนและหลัง อิทธิพลของการทดลอง,

· สามีและภรรยา

· ฯลฯ

หากไม่มีความสัมพันธ์ดังกล่าวระหว่างตัวอย่าง จะมีการพิจารณาตัวอย่างเหล่านี้ เป็นอิสระ, ตัวอย่างเช่น:

· ชายและหญิง

· นักจิตวิทยาและนักคณิตศาสตร์

ดังนั้น ตัวอย่างที่ต้องพึ่งพาจะมีปริมาตรเท่ากันเสมอ ในขณะที่ปริมาตรของตัวอย่างอิสระอาจแตกต่างกัน

การเปรียบเทียบตัวอย่างทำได้โดยใช้เกณฑ์ทางสถิติต่างๆ:

· แบบทดสอบของนักเรียน

· การทดสอบวิลคอกสัน

· การทดสอบแมนน์-วิทนีย์ยู

· เกณฑ์การลงนาม

· ฯลฯ

ความเป็นตัวแทน

ตัวอย่างอาจถือได้ว่าเป็นตัวแทนหรือไม่เป็นตัวแทน

ตัวอย่างของกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน

ในประเทศสหรัฐอเมริกาที่มีชื่อเสียงที่สุดแห่งหนึ่ง ตัวอย่างทางประวัติศาสตร์ ตัวอย่างที่ไม่ใช่ตัวแทนเชื่อกันว่าเกิดขึ้นระหว่างการเลือกตั้งประธานาธิบดี พ.ศ. 2479 Literary Digest ซึ่งทำนายเหตุการณ์ของการเลือกตั้งครั้งก่อนได้สำเร็จ คาดการณ์ผิดเมื่อได้ส่งบัตรลงคะแนนทดสอบจำนวน 10 ล้านใบให้กับสมาชิก รวมถึงผู้ที่ได้รับเลือกจากสมุดโทรศัพท์ทั่วประเทศและจากรายชื่อทะเบียนรถยนต์ ใน 25% ของบัตรลงคะแนนที่ได้รับคืน (เกือบ 2.5 ล้านใบ) แบ่งคะแนนเสียงดังนี้

· 57% ต้องการผู้สมัครจากพรรครีพับลิกัน Alf Landon

· 40% เลือกประธานาธิบดีแฟรงคลิน รูสเวลต์ ซึ่งเป็นพรรคเดโมแครตในขณะนั้น

ในการเลือกตั้งจริง ดังที่ทราบกันดีว่ารูสเวลต์ชนะ โดยได้รับคะแนนเสียงมากกว่า 60% ข้อผิดพลาดของ Literary Digest คือ: ต้องการเพิ่มความเป็นตัวแทนของกลุ่มตัวอย่าง - เนื่องจากพวกเขารู้ว่าสมาชิกส่วนใหญ่คิดว่าตนเองเป็นพรรครีพับลิกัน - พวกเขาจึงขยายกลุ่มตัวอย่างให้รวมผู้ที่ได้รับเลือกจากสมุดโทรศัพท์และรายชื่อการลงทะเบียน อย่างไรก็ตาม พวกเขาไม่ได้คำนึงถึงความเป็นจริงของเวลาของพวกเขาและในความเป็นจริงได้คัดเลือกพรรครีพับลิกันมากขึ้น: ในช่วงภาวะเศรษฐกิจตกต่ำครั้งใหญ่ส่วนใหญ่เป็นตัวแทนของชนชั้นกลางและชนชั้นสูงที่สามารถเป็นเจ้าของโทรศัพท์และรถยนต์ได้ (นั่นคือพรรครีพับลิกันส่วนใหญ่ ไม่ใช่พรรคเดโมแครต)

ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง

แผนการสร้างกลุ่มมีหลายประเภทหลัก:

1. เป็นการศึกษากับกลุ่มทดลองและกลุ่มควบคุมซึ่งจัดอยู่ในสภาวะต่างๆ

2. ศึกษากับกลุ่มทดลองและกลุ่มควบคุมโดยใช้กลยุทธ์การเลือกแบบคู่

3. เป็นการศึกษาโดยใช้เพียงกลุ่มเดียว - กลุ่มทดลอง

4. การศึกษาโดยใช้การออกแบบแบบผสม (แฟคทอเรียล) ทุกกลุ่มจะถูกจัดให้อยู่ในสภาวะที่แตกต่างกัน

ประเภทการสุ่มตัวอย่าง

ตัวอย่างแบ่งออกเป็นสองประเภท:

· ความน่าจะเป็น

· ไม่น่าจะเป็น

ตัวอย่างความน่าจะเป็น

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างง่าย:

โอเรียบง่าย การสุ่มตัวอย่างใหม่- การใช้ตัวอย่างดังกล่าวขึ้นอยู่กับสมมติฐานว่าผู้ตอบแบบสอบถามแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในตัวอย่างเท่ากัน จากรายชื่อประชากรทั่วไป จะมีการรวบรวมบัตรที่มีหมายเลขผู้ตอบแบบสอบถาม พวกเขาจะถูกวางไว้ในสำรับ สับ และไพ่จะถูกสุ่มออกมา หมายเลขจะถูกเขียนลงไป จากนั้นจึงคืนกลับ จากนั้น ให้ทำซ้ำขั้นตอนนี้ซ้ำหลาย ๆ ครั้งตามขนาดตัวอย่างที่เราต้องการ ข้อเสีย: การทำซ้ำหน่วยการเลือก

ขั้นตอนการสร้างตัวอย่างสุ่มอย่างง่ายมีขั้นตอนต่อไปนี้:

1.ต้องได้รับ รายการทั้งหมดสมาชิกของประชากรและหมายเลขรายการนี้ รายการดังกล่าว เรียกว่า กรอบการสุ่มตัวอย่าง

2. กำหนดขนาดตัวอย่างที่คาดหวัง นั่นคือ จำนวนผู้ตอบแบบสอบถามที่คาดหวัง

3. สารสกัดจากตาราง ตัวเลขสุ่มจำนวนเท่าใดก็ได้ตามที่เราต้องการหน่วยตัวอย่าง หากในกลุ่มตัวอย่างควรมี 100 คน ระบบจะนำตัวเลขสุ่ม 100 ตัวออกจากตาราง ตัวเลขสุ่มเหล่านี้สามารถสร้างขึ้นได้โดยโปรแกรมคอมพิวเตอร์

4. เลือกจากรายการฐานของการสังเกตที่มีตัวเลขตรงกับตัวเลขสุ่มที่เขียนไว้

· การสุ่มตัวอย่างอย่างง่ายมีข้อดีที่ชัดเจน วิธีนี้เข้าใจง่ายมาก ผลการศึกษาสามารถสรุปได้ทั่วไปกับประชากรที่กำลังศึกษา แนวทางส่วนใหญ่ในการอนุมานทางสถิติเกี่ยวข้องกับการรวบรวมข้อมูลโดยใช้ตัวอย่างแบบสุ่มง่ายๆ อย่างไรก็ตาม วิธีการสุ่มตัวอย่างอย่างง่ายมีข้อจำกัดที่สำคัญอย่างน้อยสี่ประการ:

1. มักจะเป็นเรื่องยากที่จะสร้างกรอบการสุ่มตัวอย่างที่ยอมให้สุ่มตัวอย่างแบบง่ายๆ

2. ผลลัพธ์ของการใช้ตัวอย่างสุ่มอย่างง่ายอาจเป็นประชากรจำนวนมากหรือประชากรที่กระจายไปเป็นกลุ่มใหญ่ พื้นที่ทางภูมิศาสตร์ซึ่งเพิ่มเวลาและต้นทุนในการรวบรวมข้อมูลอย่างมาก

3. ผลลัพธ์ของการใช้ตัวอย่างสุ่มอย่างง่ายมักมีลักษณะที่มีความแม่นยำต่ำและสูงกว่า ข้อผิดพลาดมาตรฐานมากกว่าผลลัพธ์ของการใช้วิธีความน่าจะเป็นแบบอื่น

4. จากการใช้ SRS อาจเกิดตัวอย่างที่ไม่เป็นตัวแทนได้ แม้ว่าตัวอย่างที่ได้จากการสุ่มตัวอย่างอย่างง่าย โดยเฉลี่ยจะเป็นตัวแทนของประชากรได้อย่างเพียงพอ แต่ตัวอย่างบางส่วนก็บิดเบือนความจริงอย่างมากเกี่ยวกับประชากรที่กำลังศึกษา โดยเฉพาะอย่างยิ่งเมื่อขนาดตัวอย่างมีขนาดเล็ก

· การสุ่มตัวอย่างอย่างง่ายแบบไม่ทำซ้ำ ขั้นตอนการสุ่มตัวอย่างจะเหมือนกัน เฉพาะไพ่ที่มีหมายเลขผู้ตอบแบบสอบถามเท่านั้นที่จะไม่ส่งคืนไปที่สำรับ

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างเป็นระบบ เป็นการสุ่มตัวอย่างความน่าจะเป็นอย่างง่ายเวอร์ชันที่เรียบง่าย จากรายชื่อประชากรทั่วไป ผู้ตอบแบบสอบถามจะถูกเลือกในช่วงเวลาหนึ่ง (K) ค่าของ K ถูกกำหนดแบบสุ่ม ผลลัพธ์ที่เชื่อถือได้มากที่สุดจะเกิดขึ้นเมื่อมีประชากรเป็นเนื้อเดียวกัน มิฉะนั้น ขนาดขั้นตอนและรูปแบบวงจรภายในบางอย่างของตัวอย่างอาจตรงกัน (การผสมตัวอย่าง) ข้อเสีย: เช่นเดียวกับตัวอย่างความน่าจะเป็นแบบง่าย

2. การสุ่มตัวอย่างแบบอนุกรม (คลัสเตอร์) หน่วยสุ่มตัวอย่างได้แก่ ชุดสถิติ(ครอบครัว โรงเรียน ทีม ฯลฯ) องค์ประกอบที่เลือกจะต้องได้รับการตรวจสอบอย่างสมบูรณ์ การเลือกหน่วยทางสถิติสามารถจัดเป็นการสุ่มตัวอย่างหรือสุ่มตัวอย่างเป็นระบบ ข้อเสีย: มีความเป็นไปได้ที่จะมีความเป็นเนื้อเดียวกันมากกว่าในประชากรทั่วไป

3. การสุ่มตัวอย่างในระดับภูมิภาค ในกรณีที่มีประชากรต่างกัน ก่อนที่จะใช้การสุ่มตัวอย่างความน่าจะเป็นด้วยเทคนิคการคัดเลือกใดๆ ขอแนะนำให้แบ่งประชากรออกเป็นส่วนที่เป็นเนื้อเดียวกัน ตัวอย่างดังกล่าวเรียกว่าการสุ่มตัวอย่างแบบอำเภอ กลุ่มการแบ่งเขตสามารถรวมทั้งการก่อตัวตามธรรมชาติ (เช่น เขตเมือง) และลักษณะใดๆ ที่เป็นพื้นฐานของการศึกษา ลักษณะบนพื้นฐานของการแบ่งส่วนเรียกว่าลักษณะของการแบ่งชั้นและการแบ่งเขต

4. ตัวอย่าง "ความสะดวกสบาย" ขั้นตอนการสุ่มตัวอย่าง "สะดวก" ประกอบด้วยการสร้างการติดต่อกับหน่วยสุ่มตัวอย่าง "สะดวก" - กลุ่มนักเรียน ทีมกีฬา เพื่อน และเพื่อนบ้าน หากคุณต้องการทราบข้อมูลเกี่ยวกับปฏิกิริยาของผู้คน แนวคิดใหม่ตัวอย่างดังกล่าวค่อนข้างสมเหตุสมผล การสุ่มตัวอย่างตามความสะดวกมักใช้เพื่อทดสอบแบบสอบถามล่วงหน้า

ตัวอย่างที่ไม่น่าจะเป็น

การเลือกในกลุ่มตัวอย่างดังกล่าวไม่ได้ดำเนินการตามหลักการของการสุ่ม แต่เป็นไปตามเกณฑ์ส่วนตัว - ความพร้อมใช้งาน ลักษณะทั่วไป การเป็นตัวแทนที่เท่าเทียมกัน ฯลฯ

1. การสุ่มตัวอย่างโควต้า - ตัวอย่างถูกสร้างขึ้นเพื่อเป็นแบบจำลองที่สร้างโครงสร้างของประชากรทั่วไปในรูปแบบของโควต้า (สัดส่วน) ของคุณลักษณะที่กำลังศึกษา จำนวนองค์ประกอบตัวอย่างที่มีการผสมผสานระหว่างคุณลักษณะที่ศึกษาต่างกันจะถูกกำหนดเพื่อให้สอดคล้องกับส่วนแบ่ง (สัดส่วน) ในประชากรทั่วไป ตัวอย่างเช่น หากประชากรทั่วไปของเราประกอบด้วย 5,000 คน โดยเป็นผู้หญิง 2,000 คน และผู้ชาย 3,000 คน ดังนั้นในโควตาตัวอย่าง เราจะมีผู้หญิง 20 คน ผู้ชาย 30 คน หรือผู้หญิง 200 คน ผู้ชาย 300 คน ตัวอย่างโควต้ามักขึ้นอยู่กับเกณฑ์ทางประชากร ได้แก่ เพศ อายุ ภูมิภาค รายได้ การศึกษา และอื่นๆ ข้อเสีย: โดยทั่วไปแล้วตัวอย่างดังกล่าวจะไม่เป็นตัวแทนเพราะว่า เป็นไปไม่ได้ที่จะคำนึงถึงพารามิเตอร์ทางสังคมหลายอย่างพร้อมกัน ข้อดี: วัสดุที่หาได้ง่าย

2. วิธีสโนว์บอล ตัวอย่างถูกสร้างขึ้นดังนี้ ผู้ตอบแบบสอบถามแต่ละคน เริ่มจากคนแรก จะถูกขอให้ติดต่อกับเพื่อน เพื่อนร่วมงาน คนรู้จักที่เหมาะกับเงื่อนไขการคัดเลือกและสามารถมีส่วนร่วมในการศึกษาวิจัยได้ ดังนั้น ยกเว้นขั้นตอนแรก กลุ่มตัวอย่างจึงถูกสร้างขึ้นโดยการมีส่วนร่วมของวัตถุวิจัยเอง วิธีนี้มักใช้เมื่อจำเป็นต้องค้นหาและสัมภาษณ์กลุ่มผู้ตอบแบบสอบถามที่เข้าถึงยาก (เช่น ผู้ตอบแบบสอบถามที่มีรายได้สูง ผู้ตอบแบบสอบถามที่อยู่ในกลุ่มวิชาชีพเดียวกัน ผู้ตอบแบบสอบถามที่มีงานอดิเรก/ความสนใจคล้ายกัน เป็นต้น)

3. การสุ่มตัวอย่างโดยธรรมชาติ - การสุ่มตัวอย่างจากสิ่งที่เรียกว่า "คนแรกที่คุณเจอ" มักใช้ในการเลือกตั้งทางโทรทัศน์และวิทยุ ขนาดและองค์ประกอบของตัวอย่างที่เกิดขึ้นเองไม่เป็นที่รู้จักล่วงหน้าและถูกกำหนดโดยพารามิเตอร์เดียวเท่านั้น - กิจกรรมของผู้ตอบแบบสอบถาม ข้อเสีย: ไม่สามารถระบุได้ว่าผู้ตอบแบบสอบถามเป็นตัวแทนของประชากรกลุ่มใด และด้วยเหตุนี้ จึงไม่สามารถระบุความเป็นตัวแทนได้

4. การสำรวจเส้นทาง – มักใช้เมื่อหน่วยการศึกษาเป็นครอบครัว บนแผนที่ การตั้งถิ่นฐานโดยที่จะดำเนินการสำรวจจะมีการกำหนดหมายเลขถนนทุกสาย การใช้ตาราง (ตัวสร้าง) ตัวเลขสุ่ม จะเลือกตัวเลขจำนวนมาก แต่ละ จำนวนมากถือว่าประกอบด้วย 3 องค์ประกอบ คือ เลขที่ถนน (2-3 ตัวแรก) เลขที่บ้าน เลขที่อพาร์ตเมนต์ ตัวอย่างเช่น หมายเลข 14832: 14 คือหมายเลขถนนบนแผนที่ 8 คือหมายเลขบ้าน 32 คือหมายเลขอพาร์ตเมนต์

5. การสุ่มตัวอย่างระดับภูมิภาคพร้อมการเลือกวัตถุทั่วไป หากหลังจากการแบ่งเขตแล้ว วัตถุทั่วไปจะถูกเลือกจากแต่ละกลุ่ม เช่น วัตถุที่ใกล้เคียงกับค่าเฉลี่ยในแง่ของลักษณะส่วนใหญ่ที่ศึกษาในการศึกษาตัวอย่างดังกล่าวเรียกว่าการทำให้เป็นภูมิภาคด้วยการเลือกวัตถุทั่วไป

กลยุทธ์การสร้างกลุ่ม

การคัดเลือกกลุ่มที่จะเข้าร่วม การทดลองทางจิตวิทยาดำเนินการผ่านกลยุทธ์ต่างๆ ที่จำเป็นเพื่อให้แน่ใจว่าการรักษาความถูกต้องทั้งภายในและภายนอกจะคงอยู่ในขอบเขตสูงสุดที่เป็นไปได้

· การสุ่ม (การเลือกแบบสุ่ม)

· การเลือกคู่

· การสุ่มตัวอย่างแบบ Stratometric

· การสร้างแบบจำลองโดยประมาณ

· ดึงดูดกลุ่มจริง

การสุ่ม, หรือ การเลือกแบบสุ่ม, ใช้เพื่อสร้างตัวอย่างสุ่มอย่างง่าย การใช้ตัวอย่างดังกล่าวตั้งอยู่บนสมมติฐานที่ว่าสมาชิกแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในกลุ่มตัวอย่างเท่าๆ กัน ตัวอย่างเช่น ในการสุ่มตัวอย่างนักศึกษามหาวิทยาลัย 100 คน คุณสามารถใส่กระดาษที่มีชื่อนักศึกษาทุกคนในหมวก แล้วหยิบกระดาษออกมา 100 แผ่น - นี่จะเป็นการเลือกแบบสุ่ม (Goodwin J ., หน้า 147)

การเลือกคู่- กลยุทธ์ในการสร้างกลุ่มตัวอย่าง โดยกลุ่มวิชาประกอบด้วยวิชาที่เทียบเท่ากันในแง่ของพารามิเตอร์รองที่มีนัยสำคัญต่อการทดลอง กลยุทธ์นี้ใช้ได้ผลสำหรับการทดลองโดยใช้กลุ่มทดลองและกลุ่มควบคุม โดยตัวเลือกที่ดีที่สุดคือการมีส่วนร่วมของคู่แฝด (โมโนและไดไซโกติก) เนื่องจากช่วยให้คุณสร้าง...

การสุ่มตัวอย่างแบบ Stratometric - การสุ่มด้วยการจัดสรรชั้น (หรือกลุ่ม) ที่ วิธีนี้เมื่อสร้างกลุ่มตัวอย่าง ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ที่มีลักษณะเฉพาะ (เพศ อายุ ความชอบทางการเมือง การศึกษา ระดับรายได้ ฯลฯ) และเลือกวิชาที่มีลักษณะสอดคล้องกัน

การสร้างแบบจำลองโดยประมาณ - ดึงตัวอย่างที่จำกัดและสรุปข้อสรุปเกี่ยวกับตัวอย่างนี้ให้กับประชากรในวงกว้าง ตัวอย่างเช่น เมื่อนักศึกษามหาวิทยาลัยชั้นปีที่ 2 มีส่วนร่วมในการศึกษาวิจัย ข้อมูลของการศึกษานี้ใช้กับ “ผู้ที่มีอายุ 17 ถึง 21 ปี” การยอมรับลักษณะทั่วไปดังกล่าวมีจำกัดอย่างมาก

การสร้างแบบจำลองโดยประมาณคือการก่อตัวของแบบจำลองซึ่งสำหรับระดับของระบบ (กระบวนการ) ที่กำหนดไว้อย่างชัดเจน อธิบายพฤติกรรมของมัน (หรือปรากฏการณ์ที่ต้องการ) ด้วยความแม่นยำที่ยอมรับได้

ชุดของวัตถุที่เป็นเนื้อเดียวกันมักได้รับการศึกษาโดยสัมพันธ์กับคุณลักษณะบางอย่างที่บ่งบอกลักษณะเฉพาะของวัตถุนั้น วัดในเชิงปริมาณหรือในเชิงคุณภาพ

เช่นถ้ามีชิ้นส่วนเป็นชุดก็แสดงว่า ลักษณะเชิงปริมาณขนาดของชิ้นส่วนอาจเป็นไปตาม GOST และคุณภาพอาจเป็นมาตรฐานของชิ้นส่วน

หากจำเป็นต้องตรวจสอบการปฏิบัติตามมาตรฐาน บางครั้งพวกเขาก็หันไปใช้การตรวจสอบทั้งหมด แต่ในทางปฏิบัติไม่ค่อยมีการใช้มากนัก ตัวอย่างเช่น หากประชากรทั่วไปมีวัตถุที่ศึกษาจำนวนมาก ก็แทบจะเป็นไปไม่ได้เลยที่จะดำเนินการสำรวจอย่างต่อเนื่อง ในกรณีนี้ จะมีการเลือกวัตถุ (องค์ประกอบ) จำนวนหนึ่งจากประชากรทั้งหมดและตรวจสอบ จึงมีประชากรทั่วไปและประชากรตัวอย่าง

ทั่วไป คือผลรวมของวัตถุทั้งหมดที่อยู่ภายใต้การตรวจสอบหรือการศึกษา ประชากรทั่วไปตามกฎประกอบด้วย หมายเลขสุดท้ายองค์ประกอบต่างๆ แต่ถ้ามีขนาดใหญ่เกินไปก็เพื่อให้ง่ายขึ้น การคำนวณทางคณิตศาสตร์สันนิษฐานว่าทั้งเซตประกอบด้วยวัตถุจำนวนอนันต์

ตัวอย่างหรือกรอบการสุ่มตัวอย่างเป็นส่วนหนึ่งขององค์ประกอบที่เลือกจากประชากรทั้งหมด ตัวอย่างสามารถทำซ้ำหรือไม่ซ้ำก็ได้ ในกรณีแรกจะถูกส่งกลับไปยังประชากรทั่วไป ในกรณีที่สอง - ไม่ใช่ ใน กิจกรรมภาคปฏิบัติการเลือกแบบสุ่มซ้ำ ๆ มักใช้บ่อยกว่า

ประชากรและกลุ่มตัวอย่างจะต้องมีความสัมพันธ์ซึ่งกันและกันโดยเป็นตัวแทน กล่าวอีกนัยหนึ่ง เพื่อที่จะกำหนดลักษณะของประชากรทั้งหมดอย่างมั่นใจตามลักษณะของประชากรตัวอย่าง จำเป็นที่องค์ประกอบตัวอย่างจะต้องแสดงองค์ประกอบเหล่านั้นอย่างถูกต้องที่สุด กล่าวอีกนัยหนึ่ง ตัวอย่างจะต้องเป็นตัวแทน (ตัวแทน)

ตัวอย่างจะเป็นตัวแทนไม่มากก็น้อยหากสุ่มเลือกจากประชากรทั้งหมดจำนวนมาก สิ่งนี้สามารถระบุได้บนพื้นฐานของกฎที่เรียกว่ากฎจำนวนมาก ในกรณีนี้ องค์ประกอบทั้งหมดมีความน่าจะเป็นที่เท่ากันที่จะรวมไว้ในตัวอย่าง

มีอยู่ ตัวเลือกต่างๆการเลือก โดยทั่วไปวิธีการทั้งหมดนี้สามารถแบ่งออกเป็นสองตัวเลือก:

  • ตัวเลือก 1. องค์ประกอบจะถูกเลือกเมื่อประชากรไม่ได้แบ่งออกเป็นส่วนๆ ตัวเลือกนี้ประกอบด้วยการเลือกแบบสุ่มซ้ำและไม่ซ้ำซ้อน
  • ตัวเลือกที่ 2 ประชากรทั่วไปแบ่งออกเป็นส่วน ๆ และเลือกองค์ประกอบต่างๆ ซึ่งรวมถึงการสุ่มตัวอย่างทั่วไป แบบเชิงกล และแบบอนุกรม

การสุ่มอย่างง่าย - การเลือกองค์ประกอบที่ถูกเลือกทีละรายการจากประชากรทั้งหมดโดยการสุ่ม

โดยทั่วไปคือการเลือกองค์ประกอบที่ไม่ได้เลือกจากประชากรทั้งหมด แต่จากส่วนที่ "ทั่วไป" ทั้งหมด

การเลือกทางกลคือเมื่อประชากรทั้งหมดถูกแบ่งออกเป็นจำนวนกลุ่ม เท่ากับจำนวนองค์ประกอบที่ควรอยู่ในตัวอย่าง ดังนั้นจึงเลือกหนึ่งองค์ประกอบจากแต่ละกลุ่ม ตัวอย่างเช่น หากคุณต้องการเลือก 25% ของชิ้นส่วนที่ผลิตโดยเครื่องจักร ก็จะเลือกทุกๆ ส่วนที่สี่ และหากคุณต้องการเลือก 4% ของชิ้นส่วน ก็จะเลือกทุกๆ ยี่สิบห้าส่วนที่เป็นเช่นนี้ไปเรื่อยๆ ต้องบอกว่าบางครั้งการเลือกใช้กลไกอาจไม่เพียงพอ

อนุกรมคือการเลือกองค์ประกอบต่างๆ ที่ถูกเลือกจากประชากรทั้งหมดใน "อนุกรม" ซึ่งได้รับการวิจัยอย่างต่อเนื่อง ไม่ใช่ทีละรายการ เช่น เมื่อมีการผลิตชิ้นส่วน จำนวนมากเครื่องจักรอัตโนมัติ จากนั้นจะมีการสำรวจที่ครอบคลุมเกี่ยวกับผลิตภัณฑ์ของเครื่องจักรหลายเครื่องเท่านั้น การเลือกแบบอนุกรมจะใช้หากลักษณะที่ศึกษามีความแปรปรวนเล็กน้อยในชุดข้อมูลต่างๆ

เพื่อลดข้อผิดพลาด จึงมีการใช้การประมาณประชากรทั่วไปโดยใช้ตัวอย่าง นอกจากนี้ การควบคุมการสุ่มตัวอย่างอาจเป็นแบบขั้นตอนเดียวหรือหลายขั้นตอนก็ได้ ซึ่งจะเพิ่มความน่าเชื่อถือของการสำรวจ

ในส่วนก่อนหน้านี้ เราสนใจในการกระจายคุณลักษณะในชุดองค์ประกอบบางชุด ชุดที่รวมองค์ประกอบทั้งหมดที่มีคุณสมบัตินี้เข้าด้วยกันเรียกว่าชุดทั่วไป หากลักษณะเฉพาะเป็นมนุษย์ (สัญชาติ การศึกษา ไอคิว ฯลฯ) ประชากรทั่วไปก็คือประชากรทั้งหมดของโลก นี่เป็นคอลเลกชันที่มีขนาดใหญ่มาก กล่าวคือ จำนวนองค์ประกอบในคอลเลกชัน n มีขนาดใหญ่ จำนวนองค์ประกอบเรียกว่าปริมาตรของประชากร คอลเลกชันอาจมีขอบเขตหรือไม่มีที่สิ้นสุด ประชากรทั่วไป - ทุกคนถึงแม้จะมีขนาดใหญ่มาก แต่ก็มีจำนวนจำกัดโดยธรรมชาติ ประชากรทั่วไปคือดวงดาวทั้งหมด อาจมีอย่างไม่มีสิ้นสุด

หากนักวิจัยวัดตัวแปรสุ่ม X ที่ต่อเนื่องกัน ผลการวัดแต่ละรายการจะถือเป็นองค์ประกอบของประชากรไม่จำกัดจำนวนตามสมมุติฐาน ในประชากรกลุ่มนี้ นับไม่ถ้วนผลลัพธ์จะถูกกระจายตามความน่าจะเป็นภายใต้อิทธิพลของข้อผิดพลาดในเครื่องมือ การไม่ตั้งใจของผู้ทดลอง การรบกวนแบบสุ่มในปรากฏการณ์นั้นเอง เป็นต้น

หากเราทำการวัดตัวแปรสุ่ม X ซ้ำ n ครั้ง กล่าวคือ เราได้ค่าตัวเลขที่แตกต่างกันเฉพาะ n ค่า ผลการทดลองนี้ถือได้ว่าเป็นตัวอย่างของปริมาตร n จากประชากรทั่วไปสมมุติของผลลัพธ์ของการวัดเดี่ยว

เป็นเรื่องปกติที่จะถือว่ามูลค่าที่แท้จริงของปริมาณที่วัดได้คือค่าเฉลี่ยเลขคณิตของผลลัพธ์ ฟังก์ชันของผลลัพธ์การวัด n นี้เรียกว่าสถิติ และตัวมันเองเป็นตัวแปรสุ่มที่มีการแจกแจงที่แน่นอนเรียกว่าการกระจายตัวอย่าง การกำหนดการกระจายตัวตัวอย่างของสถิติเฉพาะ -- งานที่สำคัญที่สุดการวิเคราะห์ทางสถิติ เห็นได้ชัดว่าการกระจายตัวนี้ขึ้นอยู่กับขนาดตัวอย่าง n และการกระจายตัวของตัวแปรสุ่ม X ของประชากรสมมุติ การกระจายตัวอย่างสถิติคือการกระจายของ X q ในประชากรอนันต์ของกลุ่มตัวอย่างที่เป็นไปได้ทั้งหมดที่มีขนาด n จากประชากรดั้งเดิม

คุณยังสามารถวัดตัวแปรสุ่มแบบไม่ต่อเนื่องได้

ให้การวัดตัวแปรสุ่ม X เป็นการโยนค่าเอกพันธ์ปกติ ปิรามิดสามเหลี่ยมที่ด้านที่มีการเขียนตัวเลข 1, 2, 3, 4 ตัวแปรสุ่ม X มีการแจกแจงแบบสม่ำเสมอ:

การทดลองสามารถทำได้ไม่จำกัดจำนวนครั้ง ประชากรตามทฤษฎีสมมุติคือประชากรจำนวนไม่สิ้นสุดซึ่งมีส่วนแบ่งเท่ากัน (0.25 ตัวต่อตัว) ขององค์ประกอบที่แตกต่างกัน 4 องค์ประกอบ ซึ่งกำหนดให้มี 1, 2, 3, 4 การโยนปิรามิดที่เหมือนกัน n ครั้งติดต่อกัน หรือการโยนปิรามิดที่เหมือนกัน n ชิ้นพร้อมกัน ถือเป็นตัวอย่างปริมาตร n จากประชากรทั่วไปกลุ่มนี้ จากการทดลอง เรามี n ตัวเลข เป็นไปได้ที่จะแนะนำฟังก์ชันบางอย่างของปริมาณเหล่านี้ ซึ่งเรียกว่าสถิติ โดยสามารถเชื่อมโยงกับพารามิเตอร์บางตัวของการแจกแจงทั่วไปได้

ที่สำคัญที่สุด ลักษณะเชิงตัวเลขการแจกแจงคือความน่าจะเป็นР i ความคาดหวังทางคณิตศาสตร์ M, ความแปรปรวน D. สถิติสำหรับความน่าจะเป็น P i คือความถี่สัมพัทธ์ โดยที่ n i คือความถี่ของผลลัพธ์ i (i = 1,2,3,4) ในตัวอย่าง ความคาดหวังทางคณิตศาสตร์ M สอดคล้องกับสถิติ

ซึ่งเรียกว่าค่าเฉลี่ยตัวอย่าง ความแปรปรวนตัวอย่าง

สอดคล้องกัน ความแปรปรวนทั่วไปดี.

ความถี่สัมพัทธ์ของเหตุการณ์ใดๆ (i=1,2,3,4) ในชุดการทดลองซ้ำ n ครั้ง (หรือในกลุ่มตัวอย่างขนาด n จากประชากร) จะมีการแจกแจงแบบทวินาม

การแจกแจงนี้มีค่าคาดหวังทางคณิตศาสตร์เท่ากับ 0.25 (ไม่ขึ้นอยู่กับ n) และค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐานเท่ากับ (ลดลงอย่างรวดเร็วเมื่อ n เพิ่มขึ้น) การแจกแจงคือการสุ่มตัวอย่างการกระจายของสถิติ ซึ่งเป็นความถี่สัมพัทธ์ของผลลัพธ์ที่เป็นไปได้สี่ประการของการโยนปิรามิดครั้งเดียวใน n การทดสอบซ้ำแล้วซ้ำอีก- หากเราเลือกจากประชากรทั่วไปจำนวนไม่สิ้นสุด ซึ่งมีองค์ประกอบสี่ตัวที่แตกต่างกัน (i = 1,2,3,4) มีส่วนแบ่งเท่ากันคือ 0.25 ตัวอย่างที่เป็นไปได้ทั้งหมดที่มีขนาด n (จำนวนพวกมันก็ไม่มีที่สิ้นสุดเช่นกัน) เราจะได้ ขนาดตัวอย่างทางคณิตศาสตร์ที่เรียกว่า n ในตัวอย่างนี้ แต่ละองค์ประกอบ (i=1,2,3,4) จะถูกกระจายตามกฎทวินาม

สมมติว่าเราโยนปิรามิดนี้แล้วเลขสองขึ้นมา 3 ครั้ง () เราสามารถหาความน่าจะเป็นของผลลัพธ์นี้ได้โดยใช้การแจกแจงตัวอย่าง มันก็เท่าเทียมกัน

ผลลัพธ์ของเราไม่น่าเป็นไปได้อย่างมาก ในการโยนหลายครั้งยี่สิบสี่ครั้งจะเกิดขึ้นประมาณหนึ่งครั้ง ในทางชีววิทยา ผลลัพธ์ดังกล่าวมักถือว่าเป็นไปไม่ได้ในทางปฏิบัติ ในกรณีนี้ เราจะมีข้อสงสัย: ปิรามิดถูกต้องและเป็นเนื้อเดียวกันหรือไม่ ความเท่าเทียมกันเป็นจริงในการโยนครั้งเดียว การกระจายตัวคือ ดังนั้น การกระจายตัวอย่างจึงถูกต้อง

เพื่อแก้ไขข้อสงสัย คุณต้องโยนมันอีกครั้งสี่ครั้ง หากผลลัพธ์ปรากฏขึ้นอีกครั้ง ความน่าจะเป็นของผลลัพธ์ทั้งสองจะมีน้อยมาก เห็นได้ชัดว่าเราได้รับผลลัพธ์ที่แทบจะเป็นไปไม่ได้เลย ดังนั้นการแจกแจงแบบเดิมจึงไม่ถูกต้อง เห็นได้ชัดว่าหากผลลัพธ์ที่สองไม่น่าเป็นไปได้มากขึ้นไปอีก ก็มีเหตุผลมากกว่านั้นในการจัดการกับปิรามิดที่ "ถูกต้อง" นี้ หากผลลัพธ์ของการทดลองซ้ำเป็น และ เราสามารถสรุปได้ว่าปิรามิดนั้นถูกต้อง และผลลัพธ์แรก () ก็ถูกต้องเช่นกัน แต่ก็ไม่น่าจะเป็นไปได้

เราไม่สามารถตรวจสอบความถูกต้องและความสม่ำเสมอของปิรามิดได้ แต่พิจารณาว่าปิรามิดนั้นถูกต้องและเป็นเนื้อเดียวกัน ดังนั้นการกระจายตัวอย่างจึงถูกต้อง ต่อไป เราควรค้นหาความรู้เกี่ยวกับการกระจายตัวอย่างเพื่อศึกษาประชากรทั่วไป แต่เนื่องจากการสร้างการกระจายตัวอย่างจึงเป็นงานหลัก การวิจัยทางสถิติ, คำอธิบายโดยละเอียดการทดลองกับปิรามิดถือได้ว่าสมเหตุสมผล

เราถือว่าการกระจายตัวอย่างถูกต้อง จากนั้นค่าการทดลองของความถี่สัมพัทธ์ในชุดต่างๆ ของการขว้าง n ครั้งของปิรามิดจะถูกจัดกลุ่มไว้ประมาณค่า 0.25 ซึ่งเป็นศูนย์กลางของการกระจายตัวอย่างและค่าที่แน่นอนของความน่าจะเป็นโดยประมาณ ในกรณีนี้ ความถี่สัมพัทธ์ถือเป็นค่าประมาณที่เป็นกลาง เนื่องจากการกระจายตัวอย่างมีแนวโน้มที่จะเป็นศูนย์เมื่อเพิ่มขึ้น n ค่าการทดลองของความถี่สัมพัทธ์จะถูกจัดกลุ่มอย่างใกล้ชิดมากขึ้นเรื่อยๆ ตามความคาดหวังทางคณิตศาสตร์ของการกระจายตัวอย่างเมื่อขนาดตัวอย่างเพิ่มขึ้น ดังนั้นจึงเป็นการประมาณความน่าจะเป็นที่สอดคล้องกัน

ถ้าปิรามิดกลายเป็นแบบมีทิศทางและต่างกัน การแจกแจงตัวอย่างสำหรับค่าต่างๆ (i = 1,2,3,4) ก็จะมีความคาดหวังทางคณิตศาสตร์ (ต่างกัน) และความแปรปรวนที่แตกต่างกัน

โปรดทราบว่าการแจกแจงตัวอย่างแบบทวินามที่ได้รับที่นี่สำหรับ n () ขนาดใหญ่นั้นประมาณไว้อย่างดีด้วยการแจกแจงแบบปกติพร้อมพารามิเตอร์ ซึ่งช่วยให้การคำนวณง่ายขึ้นมาก

เรามาทำการทดลองแบบสุ่มต่อไปโดยขว้างปิรามิดสามเหลี่ยมสม่ำเสมอสม่ำเสมอ ตัวแปรสุ่ม X ที่เกี่ยวข้องกับการทดลองนี้มีการแจกแจง ความคาดหวังทางคณิตศาสตร์ตรงนี้คือ

ขอให้เราดำเนินการ n แคสต์ ซึ่งเทียบเท่ากับการสุ่มตัวอย่างขนาด n จากประชากรสมมุติที่ไม่มีที่สิ้นสุด ซึ่งมีส่วนแบ่งเท่ากัน (0.25) ขององค์ประกอบที่แตกต่างกันสี่องค์ประกอบ เราได้รับค่าตัวอย่างของตัวแปรสุ่ม X () ลองเลือกสถิติที่แสดงถึงค่าเฉลี่ยของกลุ่มตัวอย่าง ตัวค่าเองนั้นเป็นตัวแปรสุ่มที่มีการแจกแจงที่แน่นอนขึ้นอยู่กับขนาดตัวอย่างและการแจกแจงของตัวแปรสุ่มดั้งเดิม X ค่าคือผลรวมเฉลี่ยของ n ที่เหมือนกัน ตัวแปรสุ่ม(นั่นคือมีการกระจายแบบเดียวกัน) มันชัดเจนว่า

ดังนั้นสถิติจึงเป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ที่เป็นกลาง นอกจากนี้ยังเป็นการประมาณการที่ถูกต้องเพราะว่า

ดังนั้นการแจกแจงตัวอย่างทางทฤษฎีจึงมีความคาดหวังทางคณิตศาสตร์เหมือนกับการแจกแจงแบบเดิม ความแปรปรวนจะลดลง n เท่า

จำได้ว่ามันเท่ากับ

ตัวอย่างอนันต์ทางคณิตศาสตร์เชิงนามธรรมที่เกี่ยวข้องกับตัวอย่างขนาด n จากประชากรทั่วไปและสถิติที่ป้อน ในกรณีของเรา จะมีองค์ประกอบต่างๆ ตัวอย่างเช่น ถ้า ตัวอย่างทางคณิตศาสตร์จะมีองค์ประกอบที่มีค่าสถิติ จะมีทั้งหมด 13 องค์ประกอบ องค์ประกอบสุดขั้วในตัวอย่างทางคณิตศาสตร์จะมีค่าน้อยที่สุด เนื่องจากผลลัพธ์มีความน่าจะเป็นเท่ากัน ในบรรดาผลลัพธ์เบื้องต้นหลายประการของการขว้างปิรามิดสี่ครั้ง มีเพียงผลลัพธ์เดียวเท่านั้นที่เป็นประโยชน์ต่อกัน เมื่อสถิติเข้าใกล้ค่าเฉลี่ย ความน่าจะเป็นก็จะเพิ่มขึ้น เช่น มูลค่าจะรับรู้เมื่อใด ผลลัพธ์เบื้องต้นฯลฯ ดังนั้นส่วนแบ่งขององค์ประกอบ 1.5 ในตัวอย่างทางคณิตศาสตร์จึงเพิ่มขึ้น

ค่าเฉลี่ยจะมีความน่าจะเป็นสูงสุด เมื่อ n เพิ่มขึ้น ผลการทดลองจะรวมตัวกันใกล้เคียงค่าเฉลี่ยมากขึ้น ความจริงที่ว่าค่าเฉลี่ยตัวอย่างเท่ากับค่าเฉลี่ยประชากรเดิม มักใช้ในสถิติ

หากคุณคำนวณความน่าจะเป็นในการแจกแจงตัวอย่าง c คุณจะมั่นใจได้ว่าถึงแม้จะมีค่า n เพียงเล็กน้อย การแจกแจงตัวอย่างก็จะดูเหมือนปกติ มันจะเป็นสมมาตร โดยค่าจะเป็นค่ามัธยฐาน โหมด และความคาดหวังทางคณิตศาสตร์ เมื่อ n เพิ่มขึ้น มันจะถูกประมาณอย่างดีด้วยค่าปกติที่สอดคล้องกัน แม้ว่าการกระจายตัวดั้งเดิมจะเป็นสี่เหลี่ยมก็ตาม หากการแจกแจงดั้งเดิมเป็นแบบปกติ การแจกแจงก็คือการแจกแจงแบบ Student สำหรับ n ใดๆ

ในการประมาณค่าความแปรปรวนทั่วไป จำเป็นต้องเลือกสถิติที่ซับซ้อนมากขึ้นซึ่งให้ค่าประมาณที่เป็นกลางและสม่ำเสมอ ในการกระจายตัวอย่างสำหรับ S 2 ความคาดหวังทางคณิตศาสตร์จะเท่ากับ และความแปรปรวน ด้วยขนาดตัวอย่างที่ใหญ่ การกระจายตัวอย่างจึงถือว่าเป็นเรื่องปกติ สำหรับ n ขนาดเล็กและการแจกแจงเริ่มต้นแบบปกติ การกระจายตัวอย่างสำหรับ S 2 จะเป็น h 2 _distribution

ข้างต้นเราพยายามนำเสนอขั้นตอนแรกของนักวิจัยที่พยายามดำเนินการง่ายๆ การวิเคราะห์ทางสถิติการทดลองซ้ำๆ ให้เป็นเนื้อเดียวกันที่ถูกต้อง ปริซึมสามเหลี่ยม(จัตุรมุข). ในกรณีนี้ เรารู้การกระจายตัวดั้งเดิม ตามหลักการแล้ว เป็นไปได้ที่จะได้รับการกระจายตัวอย่างของความถี่สัมพัทธ์ ค่าเฉลี่ยตัวอย่าง และ ความแปรปรวนตัวอย่างขึ้นอยู่กับจำนวน การทดลองซ้ำแล้วซ้ำเล่า n. สำหรับ n ขนาดใหญ่ การแจกแจงตัวอย่างทั้งหมดเหล่านี้จะเข้าใกล้ค่าที่สอดคล้องกัน การแจกแจงแบบปกติเนื่องจากเป็นตัวแทนของกฎการกระจายผลรวมของตัวแปรสุ่มอิสระ (ส่วนกลาง ทฤษฎีบทขีดจำกัด- ดังนั้นเราจึงรู้ผลลัพธ์ที่คาดหวัง

การทดลองหรือตัวอย่างซ้ำๆ จะให้ค่าประมาณของพารามิเตอร์ของการแจกแจงตัวอย่าง เราแย้งว่าการประมาณการเชิงทดลองนั้นถูกต้อง เราไม่ได้ทำการทดลองเหล่านี้และไม่ได้นำเสนอผลการทดลองที่นักวิจัยคนอื่นได้รับด้วยซ้ำ เน้นย้ำว่าเมื่อกำหนดกฎหมายจำหน่าย วิธีการทางทฤษฎีถูกใช้บ่อยกว่าการทดลองโดยตรง

ในสถิติทางคณิตศาสตร์ มีแนวคิดพื้นฐานสองประการ: ประชากรและกลุ่มตัวอย่าง
ชุดคือชุดของวัตถุหรือองค์ประกอบบางอย่างที่นักวิจัยสนใจเกือบนับได้
คุณสมบัติของคอลเลกชันคือคุณสมบัติที่แท้จริงหรือในจินตนาการที่องค์ประกอบบางอย่างใช้ร่วมกัน คุณสมบัติอาจเป็นแบบสุ่มหรือไม่สุ่มก็ได้
พารามิเตอร์ประชากรคือคุณสมบัติที่สามารถวัดปริมาณเป็นค่าคงที่หรือตัวแปรได้
ชุดเรียบง่ายมีลักษณะดังนี้:
ทรัพย์สินแยกต่างหาก (เช่น นักเรียนทุกคนในรัสเซีย)
พารามิเตอร์แยกต่างหากในรูปแบบของค่าคงที่หรือตัวแปร (นักเรียนหญิงทุกคน)
ระบบคุณสมบัติที่ไม่ทับซ้อนกัน (เข้ากันไม่ได้) เช่น ครูและนักเรียนทุกคนของโรงเรียนวลาดิวอสต็อก
ชุดที่ซับซ้อนมีลักษณะโดย:
ระบบที่มีคุณสมบัติทับซ้อนกันบางส่วนเป็นอย่างน้อย (นักศึกษาคณะจิตวิทยาและคณิตศาสตร์ของ Far Eastern State University ที่สำเร็จการศึกษาจากโรงเรียนด้วยเหรียญทอง)
ระบบของพารามิเตอร์อิสระและขึ้นอยู่กับการรวม ที่ การศึกษาที่ครอบคลุมบุคลิกภาพ.
เป็นเนื้อเดียวกันหรือเป็นเนื้อเดียวกันเป็นชุดซึ่งมีลักษณะทั้งหมดที่มีอยู่ในแต่ละองค์ประกอบ
ต่างกันหรือต่างกันคือประชากรที่มีลักษณะกระจุกตัวอยู่ในองค์ประกอบย่อยที่แยกจากกัน
พารามิเตอร์ที่สำคัญคือปริมาตรของประชากร - จำนวนองค์ประกอบที่ก่อตัวขึ้น ขนาดของปริมาตรขึ้นอยู่กับวิธีการกำหนดประชากร และคำถามที่เราสนใจเป็นพิเศษ สมมุติว่าเราสนใจ. สภาวะทางอารมณ์เป็นนักศึกษาชั้นปีที่ 1 ในช่วงที่สอบผ่านภาควิชาเฉพาะ จากนั้นประชากรจะหมดภายในครึ่งชั่วโมง หากเราสนใจสภาวะทางอารมณ์ของนักเรียนชั้นปีที่ 1 ทั้งหมด จำนวนทั้งสิ้นก็จะมากขึ้น และจะมากขึ้นไปอีกหากเรานำสภาวะทางอารมณ์ของนักเรียนชั้นปีที่ 1 ทั้งหมด ของมหาวิทยาลัยแห่งนี้ฯลฯ เป็นที่ชัดเจนว่าสามารถศึกษาประชากรจำนวนมากได้เฉพาะแบบคัดเลือกเท่านั้น
กลุ่มตัวอย่างเป็นส่วนหนึ่งของประชากรทั่วไป ซึ่งเป็นสิ่งที่ต้องศึกษาโดยตรง
ตัวอย่างจะถูกจำแนกตามความเป็นตัวแทน ขนาด วิธีการเลือก และการออกแบบการทดสอบ
ตัวแทน - กลุ่มตัวอย่างที่สะท้อนถึงประชากรทั่วไปอย่างเพียงพอในเชิงคุณภาพและ ในเชิงปริมาณ- กลุ่มตัวอย่างจะต้องสะท้อนประชากรอย่างเพียงพอ มิฉะนั้นผลลัพธ์จะไม่ตรงกับวัตถุประสงค์ของการศึกษา
ความเป็นตัวแทนขึ้นอยู่กับปริมาตร ยิ่งปริมาตรมาก ตัวอย่างก็จะยิ่งเป็นตัวแทนมากขึ้น ตามวิธีการคัดเลือก
สุ่ม - หากองค์ประกอบถูกเลือกแบบสุ่ม เนื่องจากวิธีการส่วนใหญ่ สถิติทางคณิตศาสตร์ขึ้นอยู่กับแนวคิดของการสุ่มตัวอย่าง โดยปกติแล้วการสุ่มตัวอย่างควรเป็นการสุ่ม
การสุ่มตัวอย่างแบบไม่สุ่ม:
การเลือกทางกล เมื่อประชากรทั้งหมดถูกแบ่งออกเป็นหลายส่วนตามที่มีการวางแผนหน่วยไว้ในตัวอย่าง จากนั้นจึงเลือกหนึ่งองค์ประกอบจากแต่ละส่วน
การคัดเลือกทั่วไป - ประชากรถูกแบ่งออกเป็นส่วนที่เป็นเนื้อเดียวกันและสุ่มตัวอย่างจากแต่ละส่วน
การเลือกแบบอนุกรม - ประชากรถูกแบ่งออกเป็นซีรีย์ขนาดต่าง ๆ จำนวนมากจากนั้นจึงสร้างตัวอย่างของซีรีย์หนึ่งชุดโดยเฉพาะ
การเลือกแบบรวม - ประเภทของการเลือกที่อยู่ระหว่างการพิจารณาจะรวมกันในขั้นตอนต่างๆ
ตามการออกแบบการทดสอบ ตัวอย่างสามารถเป็นอิสระและขึ้นอยู่กับ ขึ้นอยู่กับขนาดตัวอย่าง ตัวอย่างจะถูกแบ่งออกเป็นขนาดเล็กและขนาดใหญ่ ตัวอย่างขนาดเล็กประกอบด้วยตัวอย่างที่มีจำนวนองค์ประกอบ n 200 และตัวอย่างโดยเฉลี่ยเป็นไปตามเงื่อนไข 30 ตัวอย่างขนาดเล็กใช้สำหรับการควบคุมทางสถิติของคุณสมบัติที่ทราบของประชากรที่ศึกษาแล้ว
มีการใช้ตัวอย่างขนาดใหญ่ในการติดตั้ง คุณสมบัติที่ไม่รู้จักและพารามิเตอร์ประชากร

เพิ่มเติมในหัวข้อ 1.3 ประชากรและกลุ่มตัวอย่าง:

  1. 7.2 ลักษณะของกลุ่มตัวอย่างและประชากร
  2. 1.6. การประมาณค่าแบบจุดและช่วงของค่าสัมประสิทธิ์สหสัมพันธ์ของประชากรที่แจกแจงตามปกติ

ประชากร- จำนวนทั้งสิ้นของวัตถุทั้งหมด (หน่วย) ที่นักวิทยาศาสตร์ตั้งใจที่จะสรุปผลเมื่อศึกษาปัญหาเฉพาะ ประชากรประกอบด้วยวัตถุทั้งหมดที่กำลังศึกษาอยู่ องค์ประกอบของประชากรขึ้นอยู่กับวัตถุประสงค์ของการศึกษา บางครั้งประชากรทั่วไปคือประชากรทั้งหมดของภูมิภาคหนึ่ง (เช่น เมื่อศึกษาทัศนคติของผู้มีสิทธิ์ลงคะแนนเสียงที่มีต่อผู้สมัคร) โดยส่วนใหญ่แล้ว มักจะมีการระบุเกณฑ์หลายข้อเพื่อกำหนดวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น ผู้หญิงอายุ 18-29 ปีที่ใช้ครีมทามือบางยี่ห้ออย่างน้อยสัปดาห์ละครั้งและมีรายได้อย่างน้อย $150 ต่อสมาชิกในครอบครัว

ตัวอย่าง- ชุดของกรณี (วิชา วัตถุ เหตุการณ์ ตัวอย่าง) โดยใช้ขั้นตอนบางอย่าง คัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา

  1. ขนาดตัวอย่าง
  2. ตัวอย่างขึ้นอยู่กับและเป็นอิสระ
  3. ความเป็นตัวแทน:
    1. ตัวอย่างของกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน
  4. ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง
  5. กลยุทธ์การสร้างกลุ่ม:
    1. การสุ่ม;
    2. การเลือกคู่;
    3. การเลือกสตราโตเมตริก
    4. การสร้างแบบจำลองโดยประมาณ

ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำให้จำนวนเคสมีอย่างน้อย 30-35

ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ

เมื่อเปรียบเทียบสองตัวอย่าง (หรือมากกว่า) พารามิเตอร์ที่สำคัญคือการพึ่งพาอาศัยกัน หากเป็นไปได้ที่จะสร้างคู่โฮโมมอร์ฟิก (นั่นคือ เมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับกรณีเดียวจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และพื้นฐานสำหรับความสัมพันธ์นี้มีความสำคัญสำหรับ ลักษณะที่วัดได้ในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่าขึ้นอยู่กับ ตัวอย่างของกลุ่มตัวอย่างที่ต้องพึ่งพา: คู่แฝด การวัดลักษณะสองครั้งก่อนและหลังอิทธิพลของการทดลอง สามีและภรรยา ฯลฯ

หากไม่มีความสัมพันธ์ดังกล่าวระหว่างกลุ่มตัวอย่าง ตัวอย่างเหล่านี้จะถือว่าเป็นอิสระ เช่น ชายและหญิง นักจิตวิทยา และนักคณิตศาสตร์

ดังนั้น ตัวอย่างที่ต้องพึ่งพาจะมีปริมาตรเท่ากันเสมอ ในขณะที่ปริมาตรของตัวอย่างอิสระอาจแตกต่างกัน

การเปรียบเทียบตัวอย่างทำได้โดยใช้เกณฑ์ทางสถิติต่างๆ:

  • แบบทดสอบของนักเรียน
  • วิลคอกสันทีทดสอบ;
  • การทดสอบ Mann-Whitney U;
  • เกณฑ์การลงนาม ฯลฯ

ความเป็นตัวแทน

ตัวอย่างอาจถือได้ว่าเป็นตัวแทนหรือไม่เป็นตัวแทน

ตัวอย่างของกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน

ในสหรัฐอเมริกา ตัวอย่างทางประวัติศาสตร์ที่มีชื่อเสียงที่สุดกรณีหนึ่งของการสุ่มตัวอย่างที่ไม่ใช่ตัวแทนถือเป็นกรณีที่เกิดขึ้นระหว่างการเลือกตั้งประธานาธิบดีในปี 1936 นิตยสาร Literary Digest ซึ่งประสบความสำเร็จในการทำนายเหตุการณ์ของการเลือกตั้งครั้งก่อนหลายครั้งนั้นผิด คาดการณ์โดยส่งบัตรลงคะแนนทดสอบ 10 ล้านใบให้ผู้ใช้บริการ ผู้ที่ได้รับคัดเลือกตามสมุดโทรศัพท์ทั่วประเทศ และรายชื่อผู้จดทะเบียนรถยนต์ ใน 25% ของบัตรลงคะแนนที่ได้รับคืน (เกือบ 2.5 ล้านใบ) แบ่งคะแนนเสียงดังนี้

57% ต้องการผู้สมัครจากพรรครีพับลิกัน Alf Landon

40% เลือกประธานาธิบดีแฟรงคลิน รูสเวลต์ ซึ่งเป็นพรรคเดโมแครตในขณะนั้น

ในการเลือกตั้งจริง ดังที่ทราบกันดีว่ารูสเวลต์ชนะ โดยได้รับคะแนนเสียงมากกว่า 60% ข้อผิดพลาดของ Literary Digest คือ: ต้องการเพิ่มความเป็นตัวแทนของกลุ่มตัวอย่าง - เนื่องจากพวกเขารู้ว่าสมาชิกส่วนใหญ่คิดว่าตนเองเป็นพรรครีพับลิกัน - พวกเขาจึงขยายกลุ่มตัวอย่างให้รวมผู้ที่ได้รับเลือกจากสมุดโทรศัพท์และรายชื่อการลงทะเบียน อย่างไรก็ตาม พวกเขาไม่ได้คำนึงถึงความเป็นจริงของเวลาของพวกเขาและในความเป็นจริงได้คัดเลือกพรรครีพับลิกันมากขึ้น: ในช่วงภาวะเศรษฐกิจตกต่ำครั้งใหญ่ส่วนใหญ่เป็นตัวแทนของชนชั้นกลางและชนชั้นสูงที่สามารถเป็นเจ้าของโทรศัพท์และรถยนต์ได้ (นั่นคือพรรครีพับลิกันส่วนใหญ่ ไม่ใช่พรรคเดโมแครต)

ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง

แผนการสร้างกลุ่มมีหลายประเภทหลัก:

  1. การศึกษากับกลุ่มทดลองและกลุ่มควบคุมซึ่งอยู่ในสภาวะที่แตกต่างกัน
  2. การศึกษากับกลุ่มทดลองและกลุ่มควบคุมโดยใช้กลยุทธ์การเลือกแบบคู่
  3. การศึกษาโดยใช้เพียงกลุ่มเดียว - ทดลอง;
  4. การศึกษาโดยใช้การออกแบบแบบผสม (แฟคทอเรียล) ทุกกลุ่มจะถูกจัดให้อยู่ในสภาวะที่แตกต่างกัน

กลยุทธ์การสร้างกลุ่ม

การคัดเลือกกลุ่มเพื่อเข้าร่วมในการทดลองทางจิตวิทยาดำเนินการโดยใช้กลยุทธ์ต่าง ๆ ซึ่งจำเป็นเพื่อให้แน่ใจว่ามีการเคารพความถูกต้องทั้งภายในและภายนอกมากที่สุด:

  1. การสุ่ม (การเลือกแบบสุ่ม);
  2. การเลือกคู่;
  3. การเลือกสตราโตเมตริก
  4. การสร้างแบบจำลองโดยประมาณ
  5. ดึงดูดกลุ่มจริง

การสุ่ม

การสุ่มหรือการสุ่มตัวอย่างใช้เพื่อสร้างตัวอย่างสุ่มอย่างง่าย การใช้ตัวอย่างดังกล่าวตั้งอยู่บนสมมติฐานที่ว่าสมาชิกแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในกลุ่มตัวอย่างเท่าๆ กัน ตัวอย่างเช่น ในการสุ่มตัวอย่างนักศึกษามหาวิทยาลัย 100 คน คุณสามารถใส่กระดาษที่มีชื่อของนักศึกษาทุกคนในหมวก แล้วนำกระดาษออกมา 100 แผ่น - นี่จะเป็นการเลือกแบบสุ่ม

การเลือกคู่

การเลือกแบบคู่เป็นกลยุทธ์สำหรับการสร้างกลุ่มตัวอย่าง ซึ่งกลุ่มของอาสาสมัครจะประกอบด้วยอาสาสมัครที่เทียบเท่ากันในแง่ของพารามิเตอร์รองที่มีนัยสำคัญสำหรับการทดลอง กลยุทธ์นี้มีประสิทธิภาพสำหรับการทดลองโดยใช้กลุ่มทดลองและกลุ่มควบคุม โดยตัวเลือกที่ดีที่สุดคือการมีส่วนร่วมของคู่แฝด (โมโนและไดไซโกติก) เนื่องจากช่วยให้คุณสร้างได้

การสุ่มตัวอย่างแบบ Stratometric

การเลือก Stratometric - การสุ่มด้วยการจัดสรรชั้น (หรือกลุ่ม) ด้วยวิธีสุ่มตัวอย่างนี้ ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ที่มีลักษณะบางอย่าง (เพศ อายุ ความชอบทางการเมือง การศึกษา ระดับรายได้ ฯลฯ) และเลือกวิชาที่มีลักษณะสอดคล้องกัน

การสร้างแบบจำลองโดยประมาณ

การสร้างแบบจำลองโดยประมาณ - การวาดตัวอย่างที่จำกัดและสรุปข้อสรุปเกี่ยวกับตัวอย่างนี้แก่ประชากรในวงกว้าง ตัวอย่างเช่น เมื่อนักศึกษามหาวิทยาลัยชั้นปีที่ 2 มีส่วนร่วมในการศึกษาวิจัย ข้อมูลของการศึกษานี้ใช้กับ “ผู้ที่มีอายุ 17 ถึง 21 ปี” การยอมรับลักษณะทั่วไปดังกล่าวมีจำกัดอย่างมาก