ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

ตัวอย่างจากประชาชนทั่วไป ประชากรทั่วไปและกลุ่มตัวอย่าง

ชุดของวัตถุที่เป็นเนื้อเดียวกันมักได้รับการศึกษาโดยสัมพันธ์กับคุณลักษณะบางอย่างที่บ่งบอกลักษณะเฉพาะของวัตถุนั้น วัดในเชิงปริมาณหรือในเชิงคุณภาพ

ตัวอย่างเช่น หากมีชิ้นส่วนเป็นชุด ลักษณะเชิงปริมาณอาจเป็นขนาดของชิ้นส่วนตาม GOST และลักษณะเชิงคุณภาพอาจเป็นมาตรฐานของชิ้นส่วน

หากจำเป็นต้องตรวจสอบการปฏิบัติตามมาตรฐาน บางครั้งพวกเขาก็หันไปใช้การตรวจสอบทั้งหมด แต่ในทางปฏิบัติไม่ค่อยมีการใช้มากนัก เช่นหากประชากรประกอบด้วย จำนวนมากวัตถุที่กำลังศึกษาอยู่ ในทางปฏิบัติเป็นไปไม่ได้เลยที่จะดำเนินการสำรวจที่ครอบคลุม ในกรณีนี้ จะมีการเลือกวัตถุ (องค์ประกอบ) จำนวนหนึ่งจากประชากรทั้งหมดและตรวจสอบ จึงมีประชากรทั่วไปและประชากรตัวอย่าง

ทั่วไป คือผลรวมของวัตถุทั้งหมดที่อยู่ภายใต้การตรวจสอบหรือการศึกษา ประชากรทั่วไปตามกฎประกอบด้วย หมายเลขสุดท้ายองค์ประกอบต่างๆ แต่ถ้ามีขนาดใหญ่เกินไปก็เพื่อให้ง่ายขึ้น การคำนวณทางคณิตศาสตร์สันนิษฐานว่าทั้งเซตประกอบด้วยวัตถุจำนวนอนันต์

ตัวอย่างหรือกรอบการสุ่มตัวอย่างเป็นส่วนหนึ่งขององค์ประกอบที่เลือกจากประชากรทั้งหมด ตัวอย่างสามารถทำซ้ำหรือไม่ซ้ำก็ได้ ในกรณีแรกจะถูกส่งกลับไปยังประชากรทั่วไป ในกรณีที่สอง - ไม่ใช่ ใน กิจกรรมภาคปฏิบัติการเลือกแบบสุ่มซ้ำ ๆ มักใช้บ่อยกว่า

ประชากรและกลุ่มตัวอย่างจะต้องมีความสัมพันธ์ซึ่งกันและกันโดยเป็นตัวแทน กล่าวอีกนัยหนึ่ง เพื่อที่จะกำหนดลักษณะของประชากรทั้งหมดอย่างมั่นใจตามลักษณะของประชากรตัวอย่าง จำเป็นที่องค์ประกอบตัวอย่างจะต้องแสดงองค์ประกอบเหล่านั้นอย่างถูกต้องที่สุด กล่าวอีกนัยหนึ่ง ตัวอย่างจะต้องเป็นตัวแทน (ตัวแทน)

ตัวอย่างจะเป็นตัวแทนไม่มากก็น้อยหากสุ่มเลือกจากค่ามาก จำนวนมากทั้งชุด สิ่งนี้สามารถระบุได้บนพื้นฐานของกฎที่เรียกว่ากฎจำนวนมาก ในกรณีนี้ องค์ประกอบทั้งหมดมีความน่าจะเป็นที่เท่ากันที่จะรวมไว้ในตัวอย่าง

มีอยู่ ตัวเลือกต่างๆการเลือก โดยทั่วไปวิธีการทั้งหมดนี้สามารถแบ่งออกเป็นสองตัวเลือก:

  • ตัวเลือก 1. องค์ประกอบจะถูกเลือกเมื่อประชากรไม่ได้แบ่งออกเป็นส่วนๆ ตัวเลือกนี้ประกอบด้วยการเลือกแบบสุ่มซ้ำและไม่ซ้ำซ้อน
  • ตัวเลือกที่ 2 ประชากรทั่วไปแบ่งออกเป็นส่วน ๆ และเลือกองค์ประกอบต่างๆ ซึ่งรวมถึงการสุ่มตัวอย่างทั่วไป แบบเชิงกล และแบบอนุกรม

การสุ่มอย่างง่าย - การเลือกองค์ประกอบที่ถูกเลือกทีละรายการจากประชากรทั้งหมดโดยการสุ่ม

โดยทั่วไปคือการเลือกองค์ประกอบที่ไม่ได้เลือกจากประชากรทั้งหมด แต่จากส่วนที่ "ทั่วไป" ทั้งหมด

การเลือกทางกลคือเมื่อประชากรทั้งหมดถูกแบ่งออกเป็นจำนวนกลุ่ม เท่ากับจำนวนองค์ประกอบที่ควรอยู่ในตัวอย่าง ดังนั้นจึงเลือกหนึ่งองค์ประกอบจากแต่ละกลุ่ม ตัวอย่างเช่น หากคุณต้องการเลือก 25% ของชิ้นส่วนที่ผลิตโดยเครื่องจักร ก็จะเลือกทุกๆ ส่วนที่สี่ และหากคุณต้องการเลือก 4% ของชิ้นส่วน ก็จะเลือกทุกๆ ยี่สิบห้าส่วนที่เป็นเช่นนี้ไปเรื่อยๆ ต้องบอกว่าบางครั้งการเลือกใช้กลไกอาจไม่เพียงพอ

อนุกรมคือการเลือกองค์ประกอบต่างๆ ที่ถูกเลือกจากประชากรทั้งหมดใน "อนุกรม" ซึ่งได้รับการวิจัยอย่างต่อเนื่อง ไม่ใช่ทีละรายการ ตัวอย่างเช่น เมื่อชิ้นส่วนถูกผลิตขึ้นด้วยเครื่องจักรอัตโนมัติจำนวนมาก จะมีการดำเนินการสำรวจที่ครอบคลุมเกี่ยวกับผลิตภัณฑ์ของเครื่องจักรหลายเครื่องเท่านั้น การเลือกแบบอนุกรมจะใช้หากลักษณะที่ศึกษามีความแปรปรวนเล็กน้อยในชุดข้อมูลต่างๆ

เพื่อลดข้อผิดพลาด จึงมีการใช้การประมาณการ ประชากรโดยใช้การคัดเลือก นอกจากนี้ การควบคุมการสุ่มตัวอย่างอาจเป็นแบบขั้นตอนเดียวหรือหลายขั้นตอนก็ได้ ซึ่งจะเพิ่มความน่าเชื่อถือของการสำรวจ

ในสถิติทางคณิตศาสตร์ มีแนวคิดพื้นฐานสองประการ: ประชากรและกลุ่มตัวอย่าง
ชุดคือชุดของวัตถุหรือองค์ประกอบบางอย่างที่นักวิจัยสนใจเกือบนับได้
คุณสมบัติของเซตคือคุณภาพจริงหรือจินตภาพที่ใช้ร่วมกันโดยองค์ประกอบบางส่วน คุณสมบัติอาจเป็นแบบสุ่มหรือไม่สุ่มก็ได้
พารามิเตอร์ประชากรคือคุณสมบัติที่สามารถวัดปริมาณเป็นค่าคงที่หรือตัวแปรได้
ชุดเรียบง่ายมีลักษณะดังนี้:
ทรัพย์สินแยกต่างหาก (เช่น นักเรียนทุกคนในรัสเซีย)
พารามิเตอร์แยกต่างหากในรูปแบบของค่าคงที่หรือตัวแปร (นักเรียนหญิงทุกคน)
ระบบคุณสมบัติที่ไม่ทับซ้อนกัน (เข้ากันไม่ได้) เช่น ครูและนักเรียนทุกคนของโรงเรียนวลาดิวอสต็อก
ชุดที่ซับซ้อนมีลักษณะโดย:
ระบบที่มีคุณสมบัติทับซ้อนกันบางส่วนเป็นอย่างน้อย (นักศึกษาคณะจิตวิทยาและคณิตศาสตร์ของ Far Eastern State University ที่สำเร็จการศึกษาจากโรงเรียนด้วยเหรียญทอง)
ระบบของพารามิเตอร์อิสระและขึ้นอยู่กับการรวม ที่ การศึกษาที่ครอบคลุมบุคลิกภาพ.
เป็นเนื้อเดียวกันหรือเป็นเนื้อเดียวกันเป็นชุดซึ่งมีลักษณะทั้งหมดที่มีอยู่ในแต่ละองค์ประกอบ
ต่างกันหรือต่างกันคือประชากรที่มีลักษณะกระจุกตัวอยู่ในองค์ประกอบย่อยที่แยกจากกัน
พารามิเตอร์ที่สำคัญคือปริมาตรของประชากร - จำนวนองค์ประกอบที่ก่อตัวขึ้น ขนาดของปริมาตรขึ้นอยู่กับวิธีการกำหนดประชากร และคำถามที่เราสนใจเป็นพิเศษ สมมุติว่าเราสนใจ. สภาวะทางอารมณ์เป็นนักศึกษาชั้นปีที่ 1 ในช่วงที่สอบผ่านภาควิชาเฉพาะ จากนั้นประชากรจะหมดภายในครึ่งชั่วโมง หากเราสนใจสภาวะทางอารมณ์ของนักเรียนชั้นปีที่ 1 ทั้งหมด จำนวนทั้งสิ้นก็จะมากขึ้น และจะมากขึ้นไปอีกหากเรานำสภาวะทางอารมณ์ของนักเรียนชั้นปีที่ 1 ทั้งหมด ของมหาวิทยาลัยแห่งนี้ฯลฯ เป็นที่ชัดเจนว่าสามารถศึกษาประชากรจำนวนมากได้เฉพาะแบบคัดเลือกเท่านั้น
กลุ่มตัวอย่างเป็นส่วนหนึ่งของประชากรทั่วไป ซึ่งเป็นสิ่งที่ต้องศึกษาโดยตรง
ตัวอย่างจะถูกจำแนกตามความเป็นตัวแทน ขนาด วิธีการเลือก และการออกแบบการทดสอบ
ตัวแทน - กลุ่มตัวอย่างที่สะท้อนถึงประชากรทั่วไปอย่างเพียงพอในเชิงคุณภาพและ ในเชิงปริมาณ- กลุ่มตัวอย่างจะต้องสะท้อนถึงประชากรอย่างเพียงพอ มิฉะนั้นผลลัพธ์จะไม่ตรงกับวัตถุประสงค์ของการศึกษา
ความเป็นตัวแทนขึ้นอยู่กับปริมาตร ยิ่งปริมาตรมาก ตัวอย่างก็จะยิ่งเป็นตัวแทนมากขึ้น ตามวิธีการคัดเลือก
สุ่ม - หากองค์ประกอบถูกเลือกแบบสุ่ม เนื่องจากวิธีการส่วนใหญ่ สถิติทางคณิตศาสตร์ขึ้นอยู่กับแนวคิดของการสุ่มตัวอย่าง โดยปกติแล้วการสุ่มตัวอย่างควรเป็นการสุ่ม
การสุ่มตัวอย่างแบบไม่สุ่ม:
การเลือกทางกล เมื่อประชากรทั้งหมดถูกแบ่งออกเป็นหลายส่วนตามที่มีการวางแผนหน่วยไว้ในตัวอย่าง จากนั้นจึงเลือกหนึ่งองค์ประกอบจากแต่ละส่วน
การคัดเลือกทั่วไป - ประชากรถูกแบ่งออกเป็นส่วนที่เป็นเนื้อเดียวกันและสุ่มตัวอย่างจากแต่ละส่วน
การเลือกแบบอนุกรม - ประชากรถูกแบ่งออกเป็นซีรีย์ขนาดต่าง ๆ จำนวนมากจากนั้นจึงสร้างตัวอย่างของซีรีย์หนึ่งชุดโดยเฉพาะ
การเลือกแบบรวม - ประเภทของการเลือกที่อยู่ระหว่างการพิจารณาจะรวมกันในขั้นตอนต่างๆ
ตามการออกแบบการทดสอบ ตัวอย่างสามารถเป็นอิสระและขึ้นอยู่กับ ขึ้นอยู่กับขนาดตัวอย่าง ตัวอย่างจะถูกแบ่งออกเป็นขนาดเล็กและขนาดใหญ่ ตัวอย่างขนาดเล็กประกอบด้วยตัวอย่างที่จำนวนองค์ประกอบ n คือ 200 และ ตัวอย่างเฉลี่ยเป็นไปตามเงื่อนไข 30ตัวอย่างขนาดเล็กใช้สำหรับการควบคุมทางสถิติของคุณสมบัติที่ทราบของประชากรที่ศึกษาแล้ว
มีการใช้ตัวอย่างขนาดใหญ่ในการติดตั้ง คุณสมบัติที่ไม่รู้จักและพารามิเตอร์ประชากร

เพิ่มเติมในหัวข้อ 1.3 ประชากรและกลุ่มตัวอย่าง:

  1. 7.2 ลักษณะของกลุ่มตัวอย่างและประชากร
  2. 1.6. การประมาณค่าแบบจุดและช่วงของค่าสัมประสิทธิ์สหสัมพันธ์ของประชากรที่แจกแจงตามปกติ

ประชากร - กลุ่มคนที่นักสังคมวิทยาพยายามรับข้อมูลในการวิจัยของเขา ประชากรก็จะกว้างพอๆ กัน ขึ้นอยู่กับว่าหัวข้อวิจัยกว้างแค่ไหน

ประชากรตัวอย่าง – รูปแบบประชากรที่ลดลง; บรรดาผู้ที่นักสังคมวิทยาแจกจ่ายแบบสอบถามให้ซึ่งเรียกว่าผู้ตอบแบบสอบถามซึ่งท้ายที่สุดแล้วก็เป็นเป้าหมายของการวิจัยทางสังคมวิทยา

ผู้ที่รวมอยู่ในประชากรทั่วไปจะถูกกำหนดโดยวัตถุประสงค์ของการศึกษา และผู้ที่รวมอยู่ในประชากรตัวอย่างจะถูกตัดสินใจ วิธีการทางคณิตศาสตร์- หากนักสังคมวิทยาตั้งใจที่จะมองสงครามอัฟกานิสถานผ่านสายตาของผู้เข้าร่วม ประชากรทั่วไปจะรวมถึงทหารอัฟกานิสถานทั้งหมด แต่เขาจะต้องสัมภาษณ์ส่วนเล็กๆ นั่นคือประชากรตัวอย่าง เพื่อให้กลุ่มตัวอย่างสะท้อนถึงประชากรทั่วไปได้อย่างถูกต้อง นักสังคมวิทยาจึงปฏิบัติตามกฎ: ทหารอัฟกานิสถานคนใดก็ตาม โดยไม่คำนึงถึงที่อยู่อาศัย สถานที่ทำงาน สถานะสุขภาพ และสถานการณ์อื่น ๆ จะต้องมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในกลุ่มตัวอย่าง ประชากร.

เมื่อนักสังคมวิทยาได้ตัดสินใจว่าใครที่เขาต้องการสัมภาษณ์ เขาก็เป็นผู้กำหนด กรอบตัวอย่าง- จากนั้นจึงตัดสินใจเลือกประเภทของการสุ่มตัวอย่าง

ตัวอย่างแบ่งออกเป็นสามกลุ่มใหญ่:

ก) แข็ง(สำมะโน, การลงประชามติ). มีการสำรวจทุกหน่วยจากประชากร

ข) สุ่ม;

วี) ไม่สุ่ม

การสุ่มตัวอย่างแบบสุ่มและแบบไม่สุ่มจะแบ่งออกเป็นหลายประเภท

สุ่มได้แก่:

1) ความน่าจะเป็น;

2) เป็นระบบ;

3) แบ่งเขต (แบ่งชั้น);

4) การทำรัง

สิ่งที่ไม่สุ่มได้แก่:

1) "เกิดขึ้นเอง";

2) โควต้า;

3) วิธีการ "อาร์เรย์หลัก"

รายการหน่วยที่สมบูรณ์และถูกต้องในรูปแบบประชากรตัวอย่าง กรอบตัวอย่าง . องค์ประกอบที่มีไว้สำหรับการเลือกเรียกว่า หน่วยคัดเลือก - หน่วยเก็บตัวอย่างอาจจะเหมือนกับหน่วยสังเกตเพราะว่า หน่วยสังเกตการณ์ ถือเป็นองค์ประกอบของประชากรทั่วไปที่รวบรวมข้อมูลโดยตรง โดยทั่วไปหน่วยของการสังเกตคือปัจเจกบุคคล การเลือกจากรายการทำได้ดีที่สุดโดยการกำหนดหมายเลขหน่วยและใช้ตารางตัวเลขสุ่ม แม้ว่ามักใช้วิธีสุ่มเสมือนก็ตาม เมื่อองค์ประกอบที่ n ทุกตัวนำมาจากรายการแบบง่าย

หากกรอบการสุ่มตัวอย่างมีรายการหน่วยการสุ่มตัวอย่าง โครงสร้างการสุ่มตัวอย่างจะหมายถึงการจัดกลุ่มตามคุณลักษณะที่สำคัญบางประการ เช่น การกระจายตัวของบุคคลตามอาชีพ คุณสมบัติ เพศ หรืออายุ ตัวอย่างเช่น หากในประชากรทั่วไป มีเยาวชน 30% วัยกลางคน 50% และผู้สูงอายุ 20% ดังนั้นจะต้องสังเกตสัดส่วนเปอร์เซ็นต์ที่เท่ากันของทั้งสามวัยในประชากรตัวอย่าง คุณสามารถเพิ่มชั้นเรียน เพศ สัญชาติ ฯลฯ ลงในอายุได้ สำหรับแต่ละสัดส่วน เปอร์เซ็นต์จะถูกกำหนดขึ้นในประชากรทั่วไปและประชากรตัวอย่าง ดังนั้น, กรอบตัวอย่าง – สัดส่วนเปอร์เซ็นต์ของคุณลักษณะของวัตถุ โดยขึ้นอยู่กับการรวบรวมประชากรตัวอย่าง

หากประเภทตัวอย่างบอกเราว่าผู้คนเข้ามาในกลุ่มตัวอย่างได้อย่างไร ขนาดตัวอย่างจะบอกเราว่ามีกี่คนเข้ามาในกลุ่มตัวอย่าง

ขนาดตัวอย่าง – จำนวนหน่วยในประชากรตัวอย่าง เนื่องจากประชากรตัวอย่างเป็นส่วนหนึ่งของประชากรทั่วไปที่เลือกโดยใช้วิธีพิเศษ ปริมาตรจึงน้อยกว่าปริมาตรของประชากรทั่วไปเสมอ ดังนั้นจึงเป็นเรื่องสำคัญมากที่ส่วนนั้นจะต้องไม่บิดเบือนความคิดโดยรวมนั่นคือมันเป็นตัวแทนของมัน

ความน่าเชื่อถือของข้อมูลไม่ได้รับอิทธิพลจากลักษณะเชิงปริมาณของประชากรตัวอย่าง (ปริมาตร) แต่ขึ้นอยู่กับลักษณะเชิงคุณภาพของประชากรทั่วไป - ระดับความเป็นเนื้อเดียวกัน เรียกว่าความแตกต่างระหว่างประชากรทั่วไปและประชากรตัวอย่าง ข้อผิดพลาดในการเป็นตัวแทน , ค่าเบี่ยงเบนที่อนุญาต – 5%

ต่อไปนี้เป็นวิธีหลีกเลี่ยงข้อผิดพลาด:

    แต่ละหน่วยในประชากรจะต้องมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในกลุ่มตัวอย่าง

    ขอแนะนำให้เลือกจากประชากรที่เป็นเนื้อเดียวกัน

    คุณจำเป็นต้องรู้ลักษณะของประชากร

    เมื่อรวบรวมประชากรตัวอย่าง จะต้องคำนึงถึงข้อผิดพลาดแบบสุ่มและเป็นระบบด้วย

หากวาดประชากรตัวอย่าง (ตัวอย่าง) อย่างถูกต้อง นักสังคมวิทยาจะได้ผลลัพธ์ที่เชื่อถือได้ซึ่งระบุลักษณะของประชากรทั้งหมด

หลักๆมีอะไรบ้าง วิธีการสุ่มตัวอย่าง?

วิธีการสุ่มตัวอย่างทางกลเมื่อจาก รายการทั่วไปของประชากรทั่วไป จำนวนผู้ตอบแบบสอบถามที่ต้องการจะถูกเลือกเป็นระยะๆ (เช่น ทุก ๆ 10)

วิธีการสุ่มตัวอย่างแบบอนุกรม- ในกรณีนี้ ประชากรทั่วไปจะถูกแบ่งออกเป็นส่วนที่เป็นเนื้อเดียวกันและหน่วยการวิเคราะห์จะถูกเลือกตามสัดส่วนจากแต่ละส่วน (เช่น 20% ของชายและหญิงในสถานประกอบการ)

วิธีการสุ่มตัวอย่างแบบคลัสเตอร์- หน่วยการคัดเลือกไม่ใช่ผู้ตอบแบบสำรวจรายบุคคล แต่เป็นกลุ่มที่มีการวิจัยอย่างต่อเนื่องในภายหลัง ตัวอย่างนี้จะเป็นตัวแทนหากองค์ประกอบของกลุ่มมีความคล้ายคลึงกัน (เช่น กลุ่มนักศึกษาหนึ่งกลุ่มจากแต่ละสายงานของแผนกมหาวิทยาลัย)

วิธีอาเรย์หลัก– การสำรวจ 60–70% ของประชากรทั่วไป

วิธีการสุ่มตัวอย่างโควต้า- ที่สุด วิธีการที่ซับซ้อนโดยต้องมีการกำหนดลักษณะอย่างน้อยสี่ประการในการเลือกผู้ตอบแบบสอบถาม มักใช้กับประชากรจำนวนมาก

ประชากร (ในภาษาอังกฤษ - ประชากร) - ชุดของวัตถุทั้งหมด (หน่วย) ที่นักวิทยาศาสตร์ตั้งใจที่จะสรุปผลเมื่อศึกษาปัญหาเฉพาะ

ประชากรประกอบด้วยวัตถุทั้งหมดที่กำลังศึกษาอยู่ องค์ประกอบของประชากรขึ้นอยู่กับวัตถุประสงค์ของการศึกษา บางครั้งประชากรทั่วไปคือประชากรทั้งหมดของภูมิภาคหนึ่ง (เช่น เมื่อศึกษาทัศนคติของผู้มีสิทธิ์ลงคะแนนเสียงที่มีต่อผู้สมัคร) โดยส่วนใหญ่แล้ว มักจะมีการระบุเกณฑ์หลายข้อเพื่อกำหนดวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น ผู้ชายอายุ 30-50 ปีที่ใช้มีดโกนบางยี่ห้ออย่างน้อยสัปดาห์ละครั้งและมีรายได้อย่างน้อย 100 ดอลลาร์ต่อสมาชิกในครอบครัว

ตัวอย่างหรือ ประชากรตัวอย่าง- ชุดของกรณี (วิชา วัตถุ เหตุการณ์ ตัวอย่าง) โดยใช้ขั้นตอนบางอย่าง คัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา

ลักษณะตัวอย่าง:

· ลักษณะเชิงคุณภาพของกลุ่มตัวอย่าง - เราเลือกใครกันแน่และวิธีการสุ่มตัวอย่างที่เราใช้สำหรับสิ่งนี้

· ลักษณะเชิงปริมาณของกลุ่มตัวอย่าง - จำนวนกรณีที่เราเลือก กล่าวคือ ขนาดตัวอย่าง

ความจำเป็นของการสุ่มตัวอย่าง

· วัตถุประสงค์ของการศึกษานั้นกว้างขวางมาก ตัวอย่างเช่น ผู้บริโภคผลิตภัณฑ์ของบริษัทระดับโลกมีตลาดที่กระจายตัวทางภูมิศาสตร์จำนวนมาก

· มีความจำเป็นต้องรวบรวมข้อมูลเบื้องต้น

ขนาดตัวอย่าง

ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำว่าจำนวนเคสควรมีอย่างน้อย 30 ถึง 35

ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ

เมื่อเปรียบเทียบสองตัวอย่าง (หรือมากกว่า) พารามิเตอร์ที่สำคัญคือการพึ่งพากัน หากสามารถสร้างคู่โฮโมมอร์ฟิกได้ (นั่นคือ เมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับกรณีเดียวจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และความสัมพันธ์พื้นฐานนี้มีความสำคัญสำหรับลักษณะที่จะวัด ในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่า ขึ้นอยู่กับ- ตัวอย่างของกลุ่มตัวอย่างที่ต้องพึ่งพา:

· คู่แฝด

· การวัดลักษณะใดๆ สองครั้งก่อนและหลังการสัมผัสการทดลอง

· สามีและภรรยา

· ฯลฯ

หากไม่มีความสัมพันธ์ดังกล่าวระหว่างตัวอย่าง จะมีการพิจารณาตัวอย่างเหล่านี้ เป็นอิสระ, ตัวอย่างเช่น:

· ชายและหญิง

· นักจิตวิทยาและนักคณิตศาสตร์

ดังนั้น ตัวอย่างที่ต้องพึ่งพาจะมีปริมาตรเท่ากันเสมอ ในขณะที่ปริมาตรของตัวอย่างอิสระอาจแตกต่างกัน

การเปรียบเทียบตัวอย่างทำได้โดยใช้เกณฑ์ทางสถิติต่างๆ:

· แบบทดสอบของนักเรียน

· การทดสอบวิลคอกสัน

· การทดสอบแมนน์-วิทนีย์ยู

· เกณฑ์การลงนาม

· ฯลฯ

ความเป็นตัวแทน

ตัวอย่างอาจถือได้ว่าเป็นตัวแทนหรือไม่เป็นตัวแทน

ตัวอย่างของกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน

ในประเทศสหรัฐอเมริกาที่มีชื่อเสียงที่สุดแห่งหนึ่ง ตัวอย่างทางประวัติศาสตร์กลุ่มตัวอย่างที่ไม่ใช่ตัวแทนถือเป็นเหตุการณ์ที่เกิดขึ้นในระหว่างการเลือกตั้งประธานาธิบดีในปี พ.ศ. 2479 วรรณกรรมสำคัญซึ่งทำนายเหตุการณ์การเลือกตั้งครั้งก่อนได้สำเร็จ ทำนายผิดโดยส่งบัตรลงคะแนนทดสอบสิบล้านใบให้กับสมาชิก รวมทั้งผู้ที่ได้รับเลือกจากสมุดโทรศัพท์ของทั้งประเทศและจากทะเบียนรถยนต์ รายการ ใน 25% ของบัตรลงคะแนนที่ได้รับคืน (เกือบ 2.5 ล้านใบ) แบ่งคะแนนเสียงดังนี้

· 57% ต้องการผู้สมัครจากพรรครีพับลิกัน Alf Landon

· 40% เลือกประธานาธิบดีแฟรงคลิน รูสเวลต์ ซึ่งเป็นพรรคเดโมแครตในขณะนั้น

ในการเลือกตั้งจริง ดังที่ทราบกันดีว่ารูสเวลต์ชนะ โดยได้รับคะแนนเสียงมากกว่า 60% ข้อผิดพลาดของ Literary Digest คือ: ต้องการเพิ่มความเป็นตัวแทนของกลุ่มตัวอย่าง - เนื่องจากพวกเขารู้ว่าสมาชิกส่วนใหญ่คิดว่าตนเองเป็นพรรครีพับลิกัน - พวกเขาจึงขยายกลุ่มตัวอย่างให้รวมผู้ที่ได้รับเลือกจากสมุดโทรศัพท์และรายชื่อการลงทะเบียน อย่างไรก็ตาม พวกเขาไม่ได้คำนึงถึงความเป็นจริงของเวลาของพวกเขา และในความเป็นจริง พวกเขาคัดเลือกพรรครีพับลิกันมากขึ้น: ในช่วงภาวะเศรษฐกิจตกต่ำครั้งใหญ่ ส่วนใหญ่เป็นตัวแทนของชนชั้นกลางและชนชั้นสูงที่สามารถเป็นเจ้าของโทรศัพท์และรถยนต์ได้ (นั่นคือ พรรครีพับลิกันส่วนใหญ่ ไม่ใช่พรรคเดโมแครต)

ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง

แผนการสร้างกลุ่มมีหลายประเภทหลัก:

1. เป็นการศึกษากับกลุ่มทดลองและกลุ่มควบคุมซึ่งจัดอยู่ในสภาวะต่างๆ

2. ศึกษากับกลุ่มทดลองและกลุ่มควบคุมโดยใช้กลยุทธ์การเลือกแบบคู่

3. การศึกษาโดยใช้เพียงกลุ่มเดียว - กลุ่มทดลอง

4. การศึกษาโดยใช้การออกแบบแบบผสม (แฟคทอเรียล) ทุกกลุ่มจะถูกจัดให้อยู่ในสภาวะที่แตกต่างกัน

ประเภทการสุ่มตัวอย่าง

ตัวอย่างแบ่งออกเป็นสองประเภท:

· ความน่าจะเป็น

· ไม่น่าจะเป็น

ตัวอย่างความน่าจะเป็น

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างง่าย:

โอเรียบง่าย การสุ่มตัวอย่างใหม่- การใช้ตัวอย่างดังกล่าวขึ้นอยู่กับสมมติฐานว่าผู้ตอบแบบสอบถามแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในตัวอย่างเท่ากัน จากรายชื่อประชากรทั่วไป จะมีการรวบรวมบัตรที่มีหมายเลขผู้ตอบแบบสอบถาม พวกเขาจะถูกวางไว้ในสำรับ สับ และไพ่จะถูกสุ่มออกมา หมายเลขจะถูกเขียนลงไป จากนั้นจึงคืนกลับ จากนั้น ให้ทำซ้ำขั้นตอนนี้ซ้ำหลาย ๆ ครั้งตามขนาดตัวอย่างที่เราต้องการ ข้อเสีย: การทำซ้ำหน่วยการเลือก

ขั้นตอนการสร้างตัวอย่างสุ่มอย่างง่ายมีขั้นตอนต่อไปนี้:

1.ต้องได้รับ รายการทั้งหมดสมาชิกของประชากรและหมายเลขรายการนี้ รายการดังกล่าว เรียกว่า กรอบการสุ่มตัวอย่าง

2. กำหนดขนาดตัวอย่างที่คาดหวัง นั่นคือ จำนวนผู้ตอบแบบสอบถามที่คาดหวัง

3. แยกตัวเลขออกจากตารางตัวเลขสุ่มได้มากเท่าที่เราต้องการหน่วยตัวอย่าง หากในกลุ่มตัวอย่างควรมี 100 คน ระบบจะนำตัวเลขสุ่ม 100 ตัวออกจากตาราง ตัวเลขสุ่มเหล่านี้สามารถสร้างขึ้นได้โดยโปรแกรมคอมพิวเตอร์

4. เลือกจากรายการฐานของการสังเกตที่มีตัวเลขตรงกับตัวเลขสุ่มที่เขียนไว้

· การสุ่มตัวอย่างอย่างง่ายมีข้อดีที่ชัดเจน วิธีนี้เข้าใจง่ายมาก ผลการศึกษาสามารถสรุปได้ทั่วไปกับประชากรที่กำลังศึกษา แนวทางส่วนใหญ่ในการอนุมานทางสถิติเกี่ยวข้องกับการรวบรวมข้อมูลโดยใช้ตัวอย่างแบบสุ่มง่ายๆ อย่างไรก็ตาม วิธีการสุ่มตัวอย่างอย่างง่ายมีข้อจำกัดที่สำคัญอย่างน้อยสี่ประการ:

1. มักจะเป็นเรื่องยากที่จะสร้างกรอบการสุ่มตัวอย่างที่ยอมให้เรียบง่าย ตัวอย่างแบบสุ่ม.

2. ผลลัพธ์ของการใช้ตัวอย่างสุ่มอย่างง่ายอาจเป็นประชากรจำนวนมากหรือประชากรที่กระจายไปเป็นกลุ่มใหญ่ พื้นที่ทางภูมิศาสตร์ซึ่งเพิ่มเวลาและต้นทุนในการรวบรวมข้อมูลอย่างมาก

3. ผลลัพธ์ของการสุ่มตัวอย่างอย่างง่ายมักมีลักษณะเฉพาะคือมีความแม่นยำต่ำและมีข้อผิดพลาดมาตรฐานมากกว่าผลลัพธ์ของวิธีความน่าจะเป็นอื่นๆ

4. จากการใช้ SRS ตัวอย่างที่ไม่ใช่ตัวแทน- แม้ว่าตัวอย่างที่ได้จากการสุ่มตัวอย่างอย่างง่าย โดยเฉลี่ยจะเป็นตัวแทนของประชากรได้อย่างเพียงพอ แต่ตัวอย่างบางส่วนก็บิดเบือนความจริงอย่างมากเกี่ยวกับประชากรที่กำลังศึกษา โดยเฉพาะอย่างยิ่งเมื่อขนาดตัวอย่างมีขนาดเล็ก

· การสุ่มตัวอย่างอย่างง่ายแบบไม่ทำซ้ำ ขั้นตอนการสุ่มตัวอย่างจะเหมือนกัน เฉพาะไพ่ที่มีหมายเลขผู้ตอบแบบสอบถามเท่านั้นที่จะไม่ส่งคืนไปที่สำรับ

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างเป็นระบบ เป็นการสุ่มตัวอย่างความน่าจะเป็นอย่างง่ายเวอร์ชันที่เรียบง่าย จากรายชื่อประชากรทั่วไป ผู้ตอบแบบสอบถามจะถูกเลือกในช่วงเวลาหนึ่ง (K) ค่าของ K ถูกกำหนดแบบสุ่ม ผลลัพธ์ที่เชื่อถือได้มากที่สุดจะเกิดขึ้นเมื่อมีประชากรเป็นเนื้อเดียวกัน มิฉะนั้น ขนาดขั้นตอนและรูปแบบวงจรภายในบางอย่างของตัวอย่างอาจตรงกัน (การผสมตัวอย่าง) ข้อเสีย: เช่นเดียวกับตัวอย่างความน่าจะเป็นแบบง่าย

2. การสุ่มตัวอย่างแบบอนุกรม (คลัสเตอร์) หน่วยสุ่มตัวอย่างได้แก่ ชุดสถิติ(ครอบครัว โรงเรียน ทีม ฯลฯ) องค์ประกอบที่เลือกจะต้องได้รับการตรวจสอบอย่างสมบูรณ์ การเลือกหน่วยทางสถิติสามารถจัดเป็นการสุ่มตัวอย่างหรือสุ่มตัวอย่างเป็นระบบ ข้อเสีย: มีความเป็นไปได้ที่จะมีความเป็นเนื้อเดียวกันมากกว่าในประชากรทั่วไป

3. การสุ่มตัวอย่างในระดับภูมิภาค ในกรณีที่มีประชากรต่างกัน ก่อนที่จะใช้การสุ่มตัวอย่างความน่าจะเป็นด้วยเทคนิคการคัดเลือกใดๆ ขอแนะนำให้แบ่งประชากรออกเป็นส่วนที่เป็นเนื้อเดียวกัน ตัวอย่างดังกล่าวเรียกว่าการสุ่มตัวอย่างแบบอำเภอ กลุ่มการแบ่งเขตสามารถรวมทั้งการก่อตัวตามธรรมชาติ (เช่น เขตเมือง) และลักษณะใดๆ ที่เป็นพื้นฐานของการศึกษา ลักษณะบนพื้นฐานของการแบ่งส่วนเรียกว่าลักษณะของการแบ่งชั้นและการแบ่งเขต

4. ตัวอย่าง "ความสะดวกสบาย" ขั้นตอนการสุ่มตัวอย่าง "สะดวก" ประกอบด้วยการสร้างการติดต่อกับหน่วยสุ่มตัวอย่าง "สะดวก" - กลุ่มนักเรียน ทีมกีฬา เพื่อน และเพื่อนบ้าน หากคุณต้องการทราบข้อมูลเกี่ยวกับปฏิกิริยาของผู้คน แนวคิดใหม่ตัวอย่างดังกล่าวค่อนข้างสมเหตุสมผล การสุ่มตัวอย่างตามความสะดวกมักใช้เพื่อทดสอบแบบสอบถามล่วงหน้า

ตัวอย่างที่ไม่น่าจะเป็น

การเลือกในกลุ่มตัวอย่างดังกล่าวไม่ได้ดำเนินการตามหลักการของการสุ่ม แต่เป็นไปตามเกณฑ์ส่วนตัว - ความพร้อมใช้งาน ลักษณะทั่วไป การเป็นตัวแทนที่เท่าเทียมกัน ฯลฯ

1. การสุ่มตัวอย่างโควต้า - ตัวอย่างถูกสร้างขึ้นเพื่อเป็นแบบจำลองที่สร้างโครงสร้างของประชากรทั่วไปในรูปแบบของโควต้า (สัดส่วน) ของคุณลักษณะที่กำลังศึกษา จำนวนองค์ประกอบตัวอย่างที่มีการผสมผสานระหว่างคุณลักษณะที่ศึกษาต่างกันจะถูกกำหนดเพื่อให้สอดคล้องกับส่วนแบ่ง (สัดส่วน) ในประชากรทั่วไป ตัวอย่างเช่น หากประชากรทั่วไปของเราประกอบด้วย 5,000 คน โดยเป็นผู้หญิง 2,000 คน และผู้ชาย 3,000 คน ดังนั้นในโควตาตัวอย่าง เราจะมีผู้หญิง 20 คน ผู้ชาย 30 คน หรือผู้หญิง 200 คน ผู้ชาย 300 คน ตัวอย่างโควต้ามักขึ้นอยู่กับเกณฑ์ทางประชากร ได้แก่ เพศ อายุ ภูมิภาค รายได้ การศึกษา และอื่นๆ ข้อเสีย: โดยทั่วไปแล้วตัวอย่างดังกล่าวจะไม่เป็นตัวแทนเพราะว่า เป็นไปไม่ได้ที่จะคำนึงถึงพารามิเตอร์ทางสังคมหลายอย่างพร้อมกัน ข้อดี: วัสดุที่หาได้ง่าย

2. วิธีสโนว์บอล ตัวอย่างถูกสร้างขึ้นดังนี้ ผู้ตอบแบบสอบถามแต่ละคน เริ่มจากคนแรก จะถูกถามถึงข้อมูลติดต่อของเพื่อน เพื่อนร่วมงาน คนรู้จักที่จะตรงกับเงื่อนไขการคัดเลือกและสามารถเข้าร่วมในการศึกษาได้ ดังนั้น ยกเว้นขั้นตอนแรก กลุ่มตัวอย่างจึงถูกสร้างขึ้นโดยการมีส่วนร่วมของอาสาสมัครวิจัยเอง วิธีนี้มักใช้เมื่อจำเป็นต้องค้นหาและสัมภาษณ์กลุ่มผู้ตอบแบบสอบถามที่เข้าถึงยาก (เช่น ผู้ตอบแบบสอบถามที่มีรายได้สูง ผู้ตอบแบบสอบถามที่อยู่ในกลุ่มวิชาชีพเดียวกัน ผู้ตอบแบบสอบถามที่มีงานอดิเรก/ความสนใจคล้ายกัน เป็นต้น)

3. การสุ่มตัวอย่างโดยธรรมชาติ - การสุ่มตัวอย่างจากสิ่งที่เรียกว่า "คนแรกที่คุณเจอ" มักใช้ในการเลือกตั้งทางโทรทัศน์และวิทยุ ขนาดและองค์ประกอบของตัวอย่างที่เกิดขึ้นเองไม่เป็นที่รู้จักล่วงหน้าและถูกกำหนดโดยพารามิเตอร์เดียวเท่านั้น - กิจกรรมของผู้ตอบแบบสอบถาม ข้อเสีย: ไม่สามารถระบุได้ว่าผู้ตอบแบบสอบถามเป็นตัวแทนของประชากรกลุ่มใด และด้วยเหตุนี้ จึงไม่สามารถระบุความเป็นตัวแทนได้

4. การสำรวจเส้นทาง – มักใช้เมื่อหน่วยการศึกษาเป็นครอบครัว บนแผนที่ การตั้งถิ่นฐานโดยที่จะดำเนินการสำรวจจะมีการกำหนดหมายเลขถนนทุกสาย โดยใช้ตาราง (เครื่องกำเนิด) ของตัวเลขสุ่มที่ถูกเลือก ตัวเลขใหญ่- ตัวเลขขนาดใหญ่แต่ละตัวจะถือว่าประกอบด้วย 3 องค์ประกอบ: เลขที่ถนน (2-3 ตัวแรก) เลขที่บ้าน เลขที่อพาร์ตเมนต์ ตัวอย่างเช่น หมายเลข 14832: 14 คือหมายเลขถนนบนแผนที่ 8 คือหมายเลขบ้าน 32 คือหมายเลขอพาร์ตเมนต์

5. การสุ่มตัวอย่างระดับภูมิภาคพร้อมการเลือกวัตถุทั่วไป หากหลังจากการแบ่งเขตแล้ว วัตถุทั่วไปจะถูกเลือกจากแต่ละกลุ่ม เช่น วัตถุที่ใกล้เคียงกับค่าเฉลี่ยในแง่ของลักษณะส่วนใหญ่ที่ศึกษาในการศึกษาตัวอย่างดังกล่าวเรียกว่าการทำให้เป็นภูมิภาคด้วยการเลือกวัตถุทั่วไป

กลยุทธ์การสร้างกลุ่ม

การคัดเลือกกลุ่มที่จะเข้าร่วม การทดลองทางจิตวิทยาดำเนินการผ่านกลยุทธ์ต่างๆ ที่จำเป็นเพื่อให้แน่ใจว่าการรักษาความถูกต้องทั้งภายในและภายนอกจะคงอยู่ในขอบเขตสูงสุดที่เป็นไปได้

· การสุ่ม (การเลือกแบบสุ่ม)

· การเลือกคู่

· การสุ่มตัวอย่างแบบ Stratometric

· การสร้างแบบจำลองโดยประมาณ

· ดึงดูดกลุ่มจริง

การสุ่ม, หรือ การเลือกแบบสุ่ม, ใช้เพื่อสร้างตัวอย่างสุ่มอย่างง่าย การใช้ตัวอย่างดังกล่าวตั้งอยู่บนสมมติฐานที่ว่าสมาชิกแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในกลุ่มตัวอย่างเท่ากัน ตัวอย่างเช่น ในการสุ่มตัวอย่างนักศึกษามหาวิทยาลัย 100 คน คุณสามารถใส่กระดาษที่มีชื่อนักศึกษาทุกคนในหมวก แล้วหยิบกระดาษออกมา 100 แผ่น - นี่จะเป็นการเลือกแบบสุ่ม (Goodwin J ., หน้า 147)

การเลือกคู่- กลยุทธ์ในการสร้างกลุ่มตัวอย่าง โดยกลุ่มวิชาประกอบด้วยวิชาที่เทียบเท่ากันในแง่ของพารามิเตอร์รองที่มีนัยสำคัญต่อการทดลอง กลยุทธ์นี้ใช้ได้ผลสำหรับการทดลองโดยใช้กลุ่มทดลองและกลุ่มควบคุม โดยตัวเลือกที่ดีที่สุดคือการมีส่วนร่วมของคู่แฝด (โมโนและไดไซโกติก) เนื่องจากช่วยให้คุณสร้าง...

การสุ่มตัวอย่างแบบ Stratometric - การสุ่มด้วยการจัดสรรชั้น (หรือกลุ่ม) ที่ วิธีนี้เมื่อสร้างกลุ่มตัวอย่าง ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ที่มีลักษณะเฉพาะ (เพศ อายุ ความชอบทางการเมือง การศึกษา ระดับรายได้ ฯลฯ) และเลือกวิชาที่มีลักษณะสอดคล้องกัน

การสร้างแบบจำลองโดยประมาณ - ดึงตัวอย่างที่จำกัดและสรุปข้อสรุปเกี่ยวกับตัวอย่างนี้ให้กับประชากรในวงกว้าง ตัวอย่างเช่น เมื่อนักศึกษามหาวิทยาลัยชั้นปีที่ 2 มีส่วนร่วมในการศึกษาวิจัย ข้อมูลของการศึกษานี้ใช้กับ “ผู้ที่มีอายุ 17 ถึง 21 ปี” การยอมรับลักษณะทั่วไปดังกล่าวมีจำกัดอย่างมาก

การสร้างแบบจำลองโดยประมาณคือการก่อตัวของแบบจำลองซึ่งสำหรับระดับของระบบ (กระบวนการ) ที่กำหนดไว้อย่างชัดเจน อธิบายพฤติกรรมของมัน (หรือปรากฏการณ์ที่ต้องการ) ด้วยความแม่นยำที่ยอมรับได้

การบรรยายครั้งที่ 6 องค์ประกอบของสถิติทางคณิตศาสตร์

คำถามควบคุมความรู้และสรุปการบรรยายที่ให้

1. กำหนดตัวแปรสุ่ม

2.เขียนสูตรสำหรับ ความคาดหวังทางคณิตศาสตร์และการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง

3. กำหนดอินทิกรัลท้องถิ่น ทฤษฎีบทขีดจำกัดลาปลาซ

4.เขียนสูตรที่ให้ การแจกแจงแบบทวินามการกระจายตัวแบบไฮเปอร์เรขาคณิต การแจกแจงแบบปัวซง การแจกแจงแบบสม่ำเสมอ และการแจกแจงแบบปกติ

วัตถุประสงค์: เพื่อศึกษาแนวคิดพื้นฐานของสถิติทางคณิตศาสตร์

1. ประชากรและกลุ่มตัวอย่าง

2. การกระจายตัวทางสถิติของกลุ่มตัวอย่าง รูปหลายเหลี่ยม ฮิสโตแกรม .

3. การประมาณค่าพารามิเตอร์ของประชากรทั่วไปตามกลุ่มตัวอย่าง

4. ค่าเฉลี่ยทั่วไปและค่าเฉลี่ยตัวอย่าง วิธีการคำนวณ

5. ความแปรปรวนทั่วไปและตัวอย่าง

6. คำถามควบคุมความรู้และสรุปการบรรยายที่ให้

เราเริ่มศึกษาองค์ประกอบของสถิติทางคณิตศาสตร์ซึ่งพัฒนาวิธีการทางวิทยาศาสตร์ในการรวบรวมข้อมูลทางสถิติและประมวลผล

1. ประชากรทั่วไปและกลุ่มตัวอย่างปล่อยให้จำเป็นต้องศึกษาชุดของวัตถุที่เป็นเนื้อเดียวกัน (ชุดนี้เรียกว่า ผลรวมทางสถิติ)เกี่ยวกับคุณภาพบางอย่างหรือ ลักษณะเชิงปริมาณการกำหนดลักษณะของวัตถุเหล่านี้ เช่นถ้ามีชิ้นส่วนเป็นชุดก็แสดงว่า สัญญาณเชิงคุณภาพการกำหนดมาตรฐานของชิ้นส่วนสามารถใช้เป็นการวัดเชิงปริมาณ และขนาดที่ควบคุมของชิ้นส่วนสามารถใช้เป็นการวัดเชิงปริมาณได้

เป็นการดีที่สุดที่จะดำเนินการตรวจสอบให้ครบถ้วนเช่น ตรวจสอบแต่ละวัตถุ อย่างไรก็ตามโดยส่วนใหญ่แล้ว เหตุผลต่างๆมันเป็นไปไม่ได้ที่จะทำเช่นนี้ วัตถุจำนวนมากและการไม่สามารถเข้าถึงได้สามารถขัดขวางการสำรวจที่สมบูรณ์ได้ ตัวอย่างเช่น หากเราจำเป็นต้องทราบความลึกเฉลี่ยของปล่องภูเขาไฟเมื่อกระสุนจากชุดทดลองระเบิด จากนั้นทำการตรวจสอบอย่างละเอียด เราจะทำลายทั้งชุด

หากไม่สามารถสำรวจได้ครบถ้วน ส่วนหนึ่งของวัตถุจะถูกเลือกจากประชากรทั้งหมดเพื่อการศึกษา

เรียกว่าประชากรทางสถิติซึ่งเป็นส่วนหนึ่งของวัตถุที่ถูกเลือก ประชากรทั่วไปชุดของวัตถุที่สุ่มเลือกจากประชากรเรียกว่า การสุ่มตัวอย่าง

เรียกจำนวนวัตถุในประชากรและกลุ่มตัวอย่างตามลำดับ ปริมาณประชาชนทั่วไปและ ปริมาณตัวอย่าง

ตัวอย่างที่ 10.1ตรวจสอบผลของต้นไม้ต้นหนึ่ง (200 ชิ้น) ว่ามีรสชาติเฉพาะสำหรับพันธุ์นี้หรือไม่ เพื่อจุดประสงค์นี้จึงเลือก 10 ชิ้น โดยที่ 200 คือขนาดของประชากร และ 10 คือขนาดของกลุ่มตัวอย่าง

หากเลือกตัวอย่างจากวัตถุหนึ่งซึ่งมีการตรวจสอบและส่งกลับไปยังประชากร ตัวอย่างนั้นจะถูกเรียก ซ้ำแล้วซ้ำเล่าหากออบเจ็กต์ตัวอย่างไม่ได้ถูกส่งกลับไปยังประชากรอีกต่อไป ระบบจะเรียกตัวอย่าง ทำซ้ำได้



ในทางปฏิบัติมักใช้การสุ่มตัวอย่างแบบไม่ซ้ำกันมากกว่า หากขนาดตัวอย่างเป็นเพียงเศษเสี้ยวของขนาดประชากร ความแตกต่างระหว่างตัวอย่างที่ทำซ้ำและตัวอย่างที่ไม่ทำซ้ำนั้นไม่สำคัญเลย

คุณสมบัติของวัตถุในกลุ่มตัวอย่างต้องสะท้อนคุณสมบัติของวัตถุในกลุ่มประชากรได้อย่างถูกต้องหรืออย่างที่เขาว่ากันว่ากลุ่มตัวอย่างต้องเป็น ตัวแทน(ตัวแทน). ตัวอย่างจะถือว่าเป็นตัวแทนหากวัตถุทั้งหมดในประชากรมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในตัวอย่าง กล่าวคือ การเลือกจะกระทำแบบสุ่ม ตัวอย่างเช่น เพื่อประเมินการเก็บเกี่ยวในอนาคต คุณสามารถสร้างตัวอย่างจากประชากรทั่วไปของผลไม้ที่ยังไม่สุก และตรวจสอบลักษณะของผลไม้ (น้ำหนัก คุณภาพ ฯลฯ) หากเก็บตัวอย่างทั้งหมดจากต้นไม้ต้นเดียว ตัวอย่างนั้นจะไม่เป็นตัวแทน ตัวอย่างตัวแทนควรประกอบด้วยผลไม้ที่สุ่มเลือกจากต้นไม้ที่สุ่มเลือก

2. การกระจายตัวทางสถิติของกลุ่มตัวอย่าง รูปหลายเหลี่ยม ฮิสโตแกรมให้สุ่มตัวอย่างจากประชาชนทั่วไปและ เอ็กซ์ 1 สังเกต n 1 ครั้ง เอ็กซ์ 2 - หมายเลข 2ครั้งหนึ่ง, ..., เอ็กซ์ เค - เอ็น k ครั้ง และ n 1 +n 2 +…+ ไม่เป็นไร= พี -ขนาดตัวอย่าง ค่าที่สังเกตได้ x 1 , x 2 , …, เอ็กซ์เคเรียกว่า ตัวเลือกและลำดับตัวแปรที่เขียนตามลำดับจากน้อยไปมากคือ ซีรีย์การเปลี่ยนแปลงจำนวนการสังเกต n 1 , n 2 , …, ไม่เป็นไรเรียกว่า ความถี่และความสัมพันธ์กับขนาดตัวอย่าง , , …, - ความถี่สัมพัทธ์โปรดทราบว่าผลรวมของความถี่สัมพัทธ์เท่ากับความสามัคคี: .

การกระจายตัวอย่างทางสถิติเรียกรายการตัวเลือกและความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ การแจกแจงทางสถิติยังสามารถระบุเป็นลำดับของช่วงเวลาและความถี่ที่สอดคล้องกันได้ (การแจกแจงแบบต่อเนื่อง) ผลรวมของความถี่ของตัวแปรที่อยู่ภายในช่วงเวลานี้จะถูกนำมาเป็นความถี่ที่สอดคล้องกับช่วงเวลา สำหรับ ภาพกราฟิก การกระจายทางสถิติใช้ รูปหลายเหลี่ยมและ ฮิสโตแกรม

เพื่อสร้างรูปหลายเหลี่ยมบนแกน โอ้เลื่อนตัวเลือกค่า เอ็กซ์ฉันอยู่บนแกน โอ้ -ค่าความถี่ nฉัน (ความถี่สัมพัทธ์)

ตัวอย่างที่ 10.2ในรูป 10.1 แสดงรูปหลายเหลี่ยมของการแจกแจงต่อไปนี้

โดยทั่วไปรูปหลายเหลี่ยมจะใช้ในกรณีที่มีตัวเลือกจำนวนน้อย ในกรณีที่มีจำนวนมาก ตัวเลือกก็ในกรณีนี้เช่นกัน การกระจายอย่างต่อเนื่องลักษณะเฉพาะ ฮิสโตแกรมมักถูกสร้างขึ้น ในการทำเช่นนี้ช่วงเวลาที่มีค่าที่สังเกตได้ทั้งหมดของแอตทริบิวต์จะถูกแบ่งออกเป็นช่วงความยาวบางส่วนหลายช่วง ชม.และค้นหาแต่ละช่วงย่อย ฉัน, - ผลรวมของความถี่ของตัวแปรที่รวมอยู่ใน ฉัน-ช่วงเวลา จากนั้น ในช่วงเวลาเหล่านี้ เช่นเดียวกับบนฐาน สี่เหลี่ยมที่มีความสูงจะถูกสร้างขึ้น (หรือ โดยที่ พี -ขนาดตัวอย่าง)

สี่เหลี่ยม ฉันสี่เหลี่ยมบางส่วนเท่ากับ , (หรือ ).

ดังนั้นพื้นที่ของฮิสโตแกรมจึงเท่ากับผลรวมของความถี่ทั้งหมด (หรือความถี่สัมพัทธ์) เช่น ขนาดตัวอย่าง (หรือหน่วย)

ตัวอย่างที่ 10.3ในรูป รูปที่ 10.2 แสดงฮิสโตแกรมของการกระจายปริมาตรแบบต่อเนื่อง n= 100 ให้ไว้ในตารางต่อไปนี้