ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

การวิเคราะห์ตัวแปรเดียวของตารางสหสัมพันธ์ความแปรปรวน การเปรียบเทียบหลายรายการ: ขั้นตอน Tukey-Kramer

สมมติว่าในสายอัตโนมัติ เครื่องหลายเครื่องทำงานแบบขนานกัน สำหรับการวางแผนที่เหมาะสมของการประมวลผลในภายหลัง สิ่งสำคัญคือต้องรู้ว่าขนาดเฉลี่ยของชิ้นส่วนที่ได้รับจากเครื่องจักรคู่ขนานนั้นมีความสม่ำเสมอเพียงใด มีเพียงปัจจัยเดียวที่ส่งผลต่อขนาดของชิ้นส่วน และนี่คือเครื่องจักรที่ผลิตขึ้น จำเป็นต้องค้นหาว่าอิทธิพลของปัจจัยนี้มีความสำคัญอย่างไรต่อขนาดของชิ้นส่วน สมมติว่าชุดขนาดชิ้นส่วนที่ผลิตในแต่ละเครื่องมีการกระจายแบบปกติและความแปรปรวนเท่ากัน

เรามีเครื่อง m เครื่อง ดังนั้น m รวมหรือระดับที่ น 1 , น 2 ,...,ข้อสังเกต เพื่อความง่ายในการให้เหตุผล สมมุติว่า n 1 \u003d n 2 \u003d ... \u003dเป็นต้น ขนาดของชิ้นส่วนที่ประกอบขึ้นเป็น ฉันข้อสังเกตเกี่ยวกับ ผม- ระดับที่หมายถึง x i 1 , x ฉัน2,..., x ใน จากนั้นการสังเกตทั้งหมดสามารถแสดงในรูปแบบของตารางซึ่งเรียกว่าเมทริกซ์ของการสังเกต (ตารางที่ 3.1)

ตารางที่3.1

ระดับ ผลการสังเกต
1 2 เจ
x 11 x 12 x 1 j x 1 น
x 21 x 22 x 2 ญ x 2 น
x 31 x 32 x 3 j x 3 วัน
ผม x i1 x i2 x ฉัน j x ฉัน n
x m1 x m2 x mj xmn

เราจะถือว่าสำหรับ ผม- การสังเกตระดับที่ n มีค่าเฉลี่ย บีซี, เท่ากับผลรวมค่าเฉลี่ยทั่วไป µ และการแปรผันเนื่องจาก ผม- ระดับของปัจจัยคือ บีซี = µ + γ ฉัน. จากนั้นสามารถแสดงข้อสังเกตหนึ่งข้อใน แบบฟอร์มต่อไปนี้:

x ฉัน j = µ + γ ฉัน. +ε อิจ= บี + อิจ (3.1)

โดยที่ µ คือค่าเฉลี่ยโดยรวม γ ฉัน- ผลกระทบเนื่องจาก ผม- ระดับของปัจจัย; อิจ- ความผันแปรของผลลัพธ์ในระดับใดระดับหนึ่ง

สมาชิก อิจกำหนดลักษณะอิทธิพลของปัจจัยทั้งหมดที่ไม่ได้นำมาพิจารณาในแบบจำลอง (3.1) จากปัญหาทั่วไปของการวิเคราะห์การกระจาย จำเป็นต้องประเมินความสำคัญของอิทธิพลของปัจจัย γ ที่มีต่อมิติของชิ้นส่วน รูปแบบทั่วไปตัวแปร x ฉัน jสามารถย่อยสลายเป็นส่วน ๆ ได้ซึ่งหนึ่งในนั้นแสดงถึงอิทธิพลของปัจจัย γ อีกส่วนหนึ่ง - อิทธิพลของปัจจัยที่ไม่ได้พิจารณา ในการทำเช่นนี้ จำเป็นต้องหาค่าประมาณสำหรับค่าเฉลี่ยโดยรวม µ และค่าประมาณสำหรับค่าเฉลี่ยเหนือระดับต่างๆ บีซี. เป็นที่ชัดเจนว่าการประเมิน β คือค่าเฉลี่ยเลขคณิตของการสังเกต n ระดับที่ i.e.

เครื่องหมายดอกจันในดัชนีที่ x หมายความว่าการสังเกตได้รับการแก้ไขที่ระดับ i-th ค่าเฉลี่ยเลขคณิตของการสังเกตทั้งชุดคือค่าประมาณของค่าเฉลี่ยโดยรวม µ กล่าวคือ

หาผลรวมของส่วนเบี่ยงเบนกำลังสอง x ฉัน jจาก นั่นคือ

เราแสดงในรูปแบบ (3.2)

และ =

แต่ = 0 เนื่องจากนี่คือผลรวมของการเบี่ยงเบนของตัวแปรของประชากรหนึ่งกลุ่มจากค่าเฉลี่ยเลขคณิตของประชากรเดียวกัน กล่าวคือ ผลรวมทั้งหมดเป็นศูนย์ เราเขียนเทอมที่สองของผลรวม (3.2) ในรูปแบบ:



หรือ

คำนี้เป็นผลรวมของผลต่างกำลังสองระหว่างระดับเฉลี่ยและค่าเฉลี่ยของการสังเกตทั้งชุด ผลรวมนี้เรียกว่าผลรวมของการเบี่ยงเบนกำลังสองระหว่างกลุ่มและกำหนดลักษณะความคลาดเคลื่อนระหว่างระดับ ค่า เรียกอีกอย่างว่าการกระจายตัวตามปัจจัยเช่น การกระจายตัวเนื่องจากปัจจัยที่ศึกษา

คำนี้เป็นผลรวมของผลต่างกำลังสองระหว่างการสังเกตแต่ละรายการและค่าเฉลี่ยของระดับที่ i ผลรวมนี้เรียกว่าผลรวมของค่าเบี่ยงเบนกำลังสองภายในกลุ่ม และกำหนดลักษณะความคลาดเคลื่อนระหว่างการสังเกตของระดับที่ i ค่านี้เรียกอีกอย่างว่าการกระเจิงที่เหลือ นั่นคือ กระจัดกระจายเนื่องจากไม่ได้คำนึงถึงปัจจัย

ค่านี้เรียกว่าผลรวมหรือ เต็มจำนวนส่วนเบี่ยงเบนกำลังสองของการสังเกตแต่ละรายการจากค่าเฉลี่ยทั้งหมด

เมื่อทราบผลรวมของกำลังสอง SS, SS 1 และ SS 2 เป็นไปได้ที่จะประมาณการค่าประมาณที่ไม่เอนเอียงของความแปรปรวนที่เกี่ยวข้อง - รวม, ระหว่างกลุ่มและภายในกลุ่ม (ตารางที่ 3.2)

หากอิทธิพลของปัจจัย γ ทุกระดับเหมือนกัน แสดงว่าค่าประมาณของความแปรปรวนทั้งหมด

จากนั้น เพื่อประเมินความสำคัญของอิทธิพลของปัจจัย γ ก็เพียงพอแล้วที่จะทดสอบสมมติฐานว่าง H 0: =

เมื่อต้องการทำสิ่งนี้ ให้คำนวณเกณฑ์ฟิชเชอร์ FB = ด้วยจำนวนองศาอิสระ k 1 = m - 1 และ k 2 = m (n - 1) จากนั้น ตามตารางการกระจาย F (ดูตารางการกระจายของเกณฑ์ Fisher) สำหรับระดับนัยสำคัญ α จะพบค่าวิกฤตของ F cr

ตารางที่3.2

ถ้า FB > F cr สมมติฐานว่างจะถูกปฏิเสธและมีการสรุปเกี่ยวกับอิทธิพลที่สำคัญของปัจจัย γ

ที่เอฟบี< F кр нет основания отвергать нулевую гипотезу и можно считать, что влияние фактора γ несущественно.



การเปรียบเทียบระหว่างกลุ่มและความแปรปรวนที่เหลือ ขนาดของอัตราส่วนจะใช้ในการตัดสินว่าอิทธิพลของปัจจัยต่างๆ ปรากฏออกมามากเพียงใด

ตัวอย่างที่ 3.1 มีผ้าชุดทำงานสี่ชุด เลือกตัวอย่างห้าตัวอย่างจากแต่ละชุดงานและทำการทดสอบเพื่อกำหนดขนาดของภาระการแตกหัก ผลการทดสอบแสดงไว้ในตาราง 3.3.

ตาราง 3.3

หมายเลขแบทช์ t

จำเป็นต้องค้นหาว่าอิทธิพลของวัตถุดิบชุดต่างๆ ที่มีต่อขนาดของภาระการแตกหักมีความสำคัญหรือไม่

วิธีการแก้.

ที่ กรณีนี้ m = 4, n = 5. ค่าเฉลี่ยเลขคณิตของแต่ละแถวคำนวณโดยสูตร

เรามี: =(200+140+170+145+165)/5=164; =170; =202; = 164.

ค้นหาค่าเฉลี่ยเลขคณิตของประชากรทั้งหมด:

ให้เราคำนวณปริมาณที่จำเป็นในการสร้างตาราง 3.4:

ผลรวมของค่าเบี่ยงเบนกำลังสองระหว่างกลุ่ม SS 1 , โดยที่ k 1 =t –1=

4-1=3 องศาอิสระ:

ผลรวมของการเบี่ยงเบนกำลังสองภายในกลุ่ม SS 2 กับ k 2 = mp - m = =20-4=16 องศาอิสระ:

ผลรวมของกำลังสอง SS ที่มี k=mn-1=20-1=19 องศาอิสระ:

จากค่าที่พบ เราประมาณค่าความแปรปรวนตามสูตร (ตารางที่ 3.2) เราจะเขียน (ตารางที่ 3.4) สำหรับตัวอย่างที่พิจารณา

ตาราง 3.4

ลองทำการวิเคราะห์ทางสถิติตามเกณฑ์ของฟิชเชอร์ คำนวณ F B \u003d \u003d (4980 1/3) / (7270 1/16) \u003d 1660 / 454.4 \u003d 3.65

ตามตารางการกระจาย F (ดูภาคผนวก) เราพบค่าของ F Kp ที่ k 2 = 16 และ k 1= ระดับความเป็นอิสระ 3 องศาและระดับนัยสำคัญ α = 0.01 เรามี F Kp = 5.29

ค่าที่คำนวณได้ของ FB น้อยกว่าค่าในตาราง ดังนั้นจึงสามารถโต้แย้งได้ว่าสมมติฐานว่างไม่ได้ถูกปฏิเสธ ซึ่งหมายความว่าความแตกต่างระหว่างเนื้อเยื่อในชุดงานไม่ส่งผลต่อภาระการแตกหัก

ในแพ็คเกจการวิเคราะห์ข้อมูล เครื่องมือ One-Way ANOVA ใช้เพื่อทดสอบสมมติฐานว่าค่าเฉลี่ยของตัวอย่างตั้งแต่สองตัวอย่างขึ้นไปที่อยู่ในประชากรเดียวกันนั้นมีความคล้ายคลึงกัน ลองพิจารณางานของแพ็คเกจสำหรับการวิเคราะห์ความแปรปรวนทางเดียว

มาแก้ตัวอย่างที่ 3.1 โดยใช้เครื่องมือการวิเคราะห์ความแปรปรวนทางเดียว

การใช้สถิติในหมายเหตุนี้จะแสดงด้วยตัวอย่างแบบตัดขวาง สมมติว่าคุณเป็นผู้จัดการฝ่ายผลิตที่ Perfect Parachute ร่มชูชีพทำจากเส้นใยสังเคราะห์ที่จัดหาโดยซัพพลายเออร์สี่รายที่แตกต่างกัน หนึ่งในคุณสมบัติหลักของร่มชูชีพคือความแข็งแกร่ง คุณต้องตรวจสอบให้แน่ใจว่าเส้นใยทั้งหมดที่ให้มานั้นมีความแข็งแรงเท่ากัน เพื่อตอบคำถามนี้ จำเป็นต้องออกแบบการทดลองโดยวัดความแข็งแรงของร่มชูชีพที่ทอจากเส้นใยสังเคราะห์จากซัพพลายเออร์ต่างๆ ข้อมูลที่ได้รับระหว่างการทดลองนี้จะเป็นตัวกำหนดว่าซัพพลายเออร์รายใดจัดหาร่มชูชีพที่ทนทานที่สุด

การใช้งานจำนวนมากเกี่ยวข้องกับการทดลองโดยพิจารณากลุ่มหรือระดับของปัจจัยเดียวหลายกลุ่ม ปัจจัยบางอย่าง เช่น อุณหภูมิการเผาเซรามิก อาจมีระดับตัวเลขหลายระดับ (เช่น 300 °, 350 °, 400 ° และ 450 °) ปัจจัยอื่นๆ เช่น ที่ตั้งของสินค้าในซูเปอร์มาร์เก็ต อาจมีระดับหมวดหมู่ (เช่น ซัพพลายเออร์รายแรก ซัพพลายเออร์รายที่สอง ซัพพลายเออร์รายที่สาม ซัพพลายเออร์ที่สี่) การทดลองแบบปัจจัยเดียวซึ่งหน่วยทดลองถูกสุ่มจัดสรรให้กับกลุ่มหรือระดับปัจจัยเรียกว่าการสุ่มอย่างสมบูรณ์

การใช้งานF-เกณฑ์การประเมินความแตกต่างระหว่างความคาดหวังทางคณิตศาสตร์หลายประการ

หากการวัดเชิงตัวเลขของปัจจัยในกลุ่มมีความต่อเนื่องและตรงตามเงื่อนไขเพิ่มเติมบางประการสำหรับการเปรียบเทียบ ความคาดหวังทางคณิตศาสตร์หลายกลุ่ม วิเคราะห์ความแปรปรวน (ANOVA - หนึ่งการวิเคราะห์ oวาไรอันซ์) การวิเคราะห์ความแปรปรวนโดยใช้การออกแบบแบบสุ่มทั้งหมดเรียกว่า ANOVA ทางเดียว ในแง่หนึ่ง คำว่าการวิเคราะห์ความแปรปรวนทำให้เข้าใจผิดเพราะเป็นการเปรียบเทียบความแตกต่างระหว่างค่ากลางของกลุ่ม ไม่ใช่ระหว่างความแปรปรวน อย่างไรก็ตาม การเปรียบเทียบความคาดหวังทางคณิตศาสตร์นั้นดำเนินการอย่างแม่นยำบนพื้นฐานของการวิเคราะห์ความแปรผันของข้อมูล ในขั้นตอน ANOVA ความแปรผันทั้งหมดของผลการวัดจะถูกแบ่งออกเป็นระหว่างกลุ่มและภายในกลุ่ม (รูปที่ 1) ความผันแปรภายในกลุ่มอธิบายโดยข้อผิดพลาดในการทดลอง ในขณะที่ความผันแปรระหว่างกลุ่มอธิบายโดยผลของเงื่อนไขการทดลอง เครื่องหมาย กับหมายถึงจำนวนกลุ่ม

ข้าว. 1. การแยกความแปรปรวนในการทดลองแบบสุ่มอย่างสมบูรณ์

ดาวน์โหลดบันทึกในรูปแบบหรือรูปแบบ ตัวอย่างในรูปแบบ

มาแสร้งทำเป็นว่า กับกลุ่มถูกดึงมาจากประชากรอิสระที่มีการแจกแจงแบบปกติและความแปรปรวนเท่ากัน สมมติฐานว่างคือความคาดหวังทางคณิตศาสตร์ของประชากรเหมือนกัน: H 0: μ 1 = μ 2 = ... = μ s. สมมติฐานทางเลือกระบุว่าความคาดหวังทางคณิตศาสตร์บางอย่างไม่เหมือนกัน: H 1: μ j ไม่เหมือนกันทั้งหมด เจ= 1, 2, …, s).

ในรูป รูปที่ 2 นำเสนอสมมติฐานว่างที่แท้จริงเกี่ยวกับความคาดหวังทางคณิตศาสตร์ของกลุ่มเปรียบเทียบทั้งห้ากลุ่ม โดยมีเงื่อนไขว่าประชากรทั่วไปมีการแจกแจงแบบปกติและความแปรปรวนเท่ากัน ห้าประชากรที่เกี่ยวข้องกับ ระดับต่างๆปัจจัยที่เหมือนกัน ดังนั้นจึงซ้อนทับกันโดยมีความคาดหวัง การเปลี่ยนแปลง และรูปแบบทางคณิตศาสตร์เหมือนกัน

ข้าว. 2. ห้าประชากรมีความคาดหวังทางคณิตศาสตร์เหมือนกัน: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

ในทางกลับกัน สมมติว่าในความเป็นจริง สมมติฐานว่างเป็นเท็จ และระดับที่สี่มีความคาดหวังทางคณิตศาสตร์ที่ใหญ่ที่สุด ระดับแรกมีความคาดหวังทางคณิตศาสตร์ที่ต่ำกว่าเล็กน้อย และระดับที่เหลือมีความคาดหวังทางคณิตศาสตร์ที่เท่ากันและแม้แต่น้อย (รูปที่ 3). โปรดทราบว่า ยกเว้นค่าเฉลี่ย ประชากรทั้งห้านั้นเหมือนกัน (กล่าวคือ มีความแปรปรวนและรูปร่างเหมือนกัน)

ข้าว. 3. สังเกตผลของเงื่อนไขการทดลอง: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

เมื่อทดสอบสมมติฐานความเท่าเทียมกันของความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปหลายกลุ่ม การแปรผันทั้งหมดจะถูกแบ่งออกเป็นสองส่วน: ความแปรปรวนระหว่างกลุ่ม เนื่องจากความแตกต่างระหว่างกลุ่ม และความแปรผันภายในกลุ่ม เนื่องจากความแตกต่างระหว่างองค์ประกอบที่อยู่ในกลุ่มเดียวกัน รูปแบบทั้งหมดจะแสดงเป็นผลรวมของสี่เหลี่ยมจัตุรัสทั้งหมด (SST - ผลรวมของช่องสี่เหลี่ยมทั้งหมด) เนื่องจากสมมติฐานว่างคือความคาดหวังของทั้งหมด กับกลุ่มมีค่าเท่ากัน ความแปรผันทั้งหมดเท่ากับผลรวมของผลต่างกำลังสองระหว่างการสังเกตแต่ละครั้งและค่าเฉลี่ยทั้งหมด (ค่าเฉลี่ยของค่าเฉลี่ย) ที่คำนวณสำหรับตัวอย่างทั้งหมด รูปแบบเต็ม:

ที่ไหน - ค่าเฉลี่ยโดยรวม ซีจือ - ผม-e ดูใน เจ- กลุ่มหรือระดับที่ nj- จำนวนการสังเกตใน เจ-กลุ่มที่, - ทั้งหมดการสังเกตในทุกกลุ่ม (เช่น = 1 + น 2 + … + nc), กับ- จำนวนกลุ่มหรือระดับการศึกษา

ความแตกต่างระหว่างกลุ่มมักเรียกว่าผลรวมของกำลังสองระหว่างกลุ่ม (SSA) เท่ากับผลรวมของผลต่างกำลังสองระหว่างค่าเฉลี่ยตัวอย่างของแต่ละกลุ่ม เจและค่าเฉลี่ยโดยรวม คูณด้วยปริมาตรของกลุ่มที่สอดคล้องกัน nj:

ที่ไหน กับ- จำนวนกลุ่มหรือระดับที่ศึกษา nj- จำนวนการสังเกตใน เจ-กลุ่มที่, เจ- หมายถึง เจ-กลุ่มที่, - ค่าเฉลี่ยทั่วไป

การเปลี่ยนแปลงภายในกลุ่มมักจะเรียกว่าผลรวมของกำลังสองภายในกลุ่ม (SSW) เท่ากับผลรวมของผลต่างกำลังสองระหว่างองค์ประกอบของแต่ละกลุ่มกับค่าเฉลี่ยตัวอย่างของกลุ่มนี้ เจ:

ที่ไหน Xอิจ - ผม- องค์ประกอบที่ เจ-กลุ่มที่, เจ- หมายถึง เจ-กลุ่มที่.

เพราะเอามาเทียบกัน กับระดับปัจจัย ผลรวมระหว่างกลุ่มของกำลังสองมี s - 1ระดับความอิสระ. แต่ละ กับระดับมี nj – 1 องศาอิสระ ดังนั้นผลรวมของกำลังสองภายในกลุ่มมี - กับองศาของเสรีภาพและ

นอกจากนี้ ผลรวมของกำลังสองมี – 1 องศาอิสระ เนื่องจากการสังเกตแต่ละครั้ง Xอิจเทียบกับค่าเฉลี่ยโดยรวมที่คำนวณได้ทั้งหมด การสังเกต หากผลรวมเหล่านี้หารด้วยจำนวนองศาอิสระที่สอดคล้องกัน จะเกิดการกระจัดกระจายสามประเภท: อินเตอร์กรุ๊ป(ค่าเฉลี่ยกำลังสองระหว่าง - MSA) ภายในกลุ่ม(ค่าเฉลี่ยกำลังสองภายใน - MSW) และ เสร็จสิ้น(ค่าเฉลี่ยกำลังสอง - MST):

ถึงแม้ว่าจุดประสงค์หลักของการวิเคราะห์ความแปรปรวนคือการเปรียบเทียบความคาดหวังทางคณิตศาสตร์ กับกลุ่มที่จะเปิดเผยผลกระทบของเงื่อนไขการทดลอง ชื่อของมันเป็นเพราะความจริงที่ว่าเครื่องมือหลักคือการวิเคราะห์ความแปรปรวน ประเภทต่างๆ. หากสมมติฐานว่างเป็นจริง และระหว่างค่าที่คาดไว้ กับกลุ่มไม่มีความแตกต่างที่มีนัยสำคัญ ความแปรปรวนทั้งสาม - MSA, MSW และ MST - เป็นค่าประมาณของความแปรปรวน σ2ที่มีอยู่ในข้อมูลที่วิเคราะห์ ดังนั้นเพื่อทดสอบสมมติฐานว่าง H 0: μ 1 = μ 2 = ... = μ sและสมมติฐานทางเลือก H 1: μ j ไม่เหมือนกันทั้งหมด เจ = 1, 2, …, กับ) จำเป็นต้องคำนวณสถิติ F-criterion ซึ่งเป็นอัตราส่วนของสองความแปรปรวน MSA และ MSW ทดสอบ F-สถิติในการวิเคราะห์ความแปรปรวนแบบไม่มีตัวแปร

สถิติ F-เกณฑ์เชื่อฟัง F- จำหน่ายกับ s - 1องศาอิสระในตัวเศษ MSAและ น - กับองศาของเสรีภาพในตัวส่วน ขยะมูลฝอย. สำหรับระดับนัยสำคัญที่กำหนด α สมมติฐานว่างจะถูกปฏิเสธหากคำนวณ F Fยูโดยธรรมชาติ F- จำหน่ายกับ s - 1 น - กับองศาอิสระในตัวส่วน ดังแสดงในรูปที่ สี่ กฎการตัดสินใจมีสูตรดังนี้ สมมติฐานว่าง H 0ปฏิเสธถ้า F > Fยู; มิฉะนั้นจะไม่ถูกปฏิเสธ

ข้าว. 4. พื้นที่วิกฤตของการวิเคราะห์ความแปรปรวนเมื่อทดสอบสมมติฐาน H 0

ถ้าสมมุติฐานว่าง H 0เป็นจริงคำนวณ F-สถิติใกล้เคียงกับ 1 เนื่องจากตัวเศษและตัวส่วนเป็นการประมาณค่าเดียวกัน - ความแปรปรวน σ 2 ที่มีอยู่ในข้อมูลที่วิเคราะห์ ถ้าสมมุติฐานว่าง H 0เป็นเท็จ (และมีความแตกต่างอย่างมีนัยสำคัญระหว่างค่าคาดหวังของกลุ่มต่าง ๆ ) คำนวณ F-สถิติจะมากกว่า 1 มาก เนื่องจากตัวเศษ MSA นอกเหนือจากความแปรปรวนตามธรรมชาติของข้อมูลแล้ว ยังประเมินผลกระทบของเงื่อนไขการทดลองหรือความแตกต่างระหว่างกลุ่มต่างๆ ในขณะที่ MSW ตัวส่วนจะประมาณความแปรปรวนตามธรรมชาติของข้อมูลเท่านั้น ดังนั้น ขั้นตอน ANOVA คือ Fเป็นการทดสอบที่ระดับนัยสำคัญที่กำหนด α สมมติฐานว่างจะถูกปฏิเสธหากคำนวณ F- สถิติมีค่ามากกว่าค่าวิกฤตบน Fยูโดยธรรมชาติ F- จำหน่ายกับ s - 1องศาอิสระในตัวเศษและ น - กับองศาอิสระในตัวส่วน ดังแสดงในรูปที่ สี่.

เพื่อแสดงการวิเคราะห์ความแปรปรวนทางเดียว ให้กลับไปที่สถานการณ์ที่ระบุไว้ที่จุดเริ่มต้นของบันทึกย่อ การทดลองนี้มีวัตถุประสงค์เพื่อตรวจสอบว่าร่มชูชีพที่ทอจากเส้นใยสังเคราะห์ที่ได้จากซัพพลายเออร์หลายรายมีความแข็งแรงเท่ากันหรือไม่ แต่ละกลุ่มมีห้าร่มชูชีพทอ แบ่งกลุ่มตามซัพพลายเออร์ - ซัพพลายเออร์ 1 ซัพพลายเออร์ 2 ซัพพลายเออร์ 3 และซัพพลายเออร์ 4 ความแข็งแรงของร่มชูชีพวัดโดยใช้อุปกรณ์พิเศษที่ทดสอบผ้าสำหรับการฉีกขาดทั้งสองด้าน แรงที่ต้องใช้ในการทำลายร่มชูชีพนั้นวัดในระดับพิเศษ แรงทำลายยิ่งสูง ร่มชูชีพยิ่งแข็งแกร่ง Excel ช่วยให้การวิเคราะห์ F- สถิติได้ด้วยคลิกเดียว ผ่านเมนู ข้อมูลการวิเคราะห์ข้อมูลและเลือกบรรทัด การวิเคราะห์ความแปรปรวนทางเดียว, กรอกข้อมูลในหน้าต่างที่เปิดอยู่ (รูปที่ 5) ผลลัพธ์ของการทดลอง (ความแรงของช่องว่าง) สถิติเชิงพรรณนาบางส่วน และผลลัพธ์ของการวิเคราะห์ความแปรปรวนทางเดียวแสดงไว้ในรูปที่ 6.

ข้าว. 5. หน้าต่าง แพ็คเกจการวิเคราะห์ความแปรปรวนทางเดียวเก่ง

ข้าว. รูปที่ 6 ตัวชี้วัดความแข็งแรงของร่มชูชีพที่ทอจากเส้นใยสังเคราะห์ที่ได้จากซัพพลายเออร์หลายราย สถิติเชิงพรรณนาและผลการวิเคราะห์ความแปรปรวนทางเดียว

การวิเคราะห์รูปที่ 6 แสดงให้เห็นว่ามีความแตกต่างระหว่างค่าเฉลี่ยตัวอย่าง ความแข็งแรงเฉลี่ยของเส้นใยที่ได้จากซัพพลายเออร์รายแรกคือ 19.52 จากที่สอง - 24.26 จากที่สาม - 22.84 และจากสี่ - 21.16 ความแตกต่างนี้มีนัยสำคัญทางสถิติหรือไม่? การกระจายแรงแตกจะแสดงในแผนภาพการกระจาย (รูปที่ 7) แสดงให้เห็นอย่างชัดเจนถึงความแตกต่างระหว่างกลุ่มและภายในกลุ่ม ถ้าปริมาตรของแต่ละกลุ่มมีขนาดใหญ่ขึ้น ก็สามารถวิเคราะห์โดยใช้แปลงลำต้นและใบ แปลงกล่อง หรือแปลงแบบปกติ

ข้าว. 7. แผนภาพการกระจายกำลังของร่มชูชีพที่ทอจากเส้นใยสังเคราะห์ที่ได้จากซัพพลายเออร์สี่ราย

สมมติฐานว่างระบุว่าไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างค่าความแรงเฉลี่ย: H 0: μ 1 = μ 2 = μ 3 = μ 4. สมมติฐานอื่นคือมีซัพพลายเออร์อย่างน้อยหนึ่งรายที่มีความแข็งแรงของเส้นใยเฉลี่ยแตกต่างจากที่อื่น: H 1: μ j ไม่เหมือนกันทั้งหมด ( เจ = 1, 2, …, กับ).

ค่าเฉลี่ยโดยรวม (ดูรูปที่ 6) = AVERAGE(D12:D15) = 21.945; คุณยังสามารถหาค่าเฉลี่ยของตัวเลขเดิมทั้ง 20 ตัว: \u003d AVERAGE (A3: D7) มีการคำนวณค่าความแปรปรวน แพ็คเกจการวิเคราะห์และสะท้อนอยู่ในตาราง การวิเคราะห์ความแปรปรวน(ดูรูปที่ 6): SSA = 63.286, SSW = 97.504, SST = 160.790 (ดูคอลัมน์ SSโต๊ะ การวิเคราะห์ความแปรปรวนรูปที่ 6) ค่าเฉลี่ยคำนวณโดยการหารผลรวมของกำลังสองเหล่านี้ด้วยจำนวนองศาอิสระที่เหมาะสม เพราะว่า กับ= 4 และ = 20 เราได้ ค่าต่อไปนี้ระดับความอิสระ; สำหรับ SSA: s - 1= 3; สำหรับ SSW: n–c= 16; สำหรับ SST: น - 1= 19 (ดูคอลัมน์ df). ดังนั้น: MSA = SSA / ( ค - 1)= 21.095; MSW=สสวท./( n–c) = 6.094; MST = SST / ( น - 1) = 8.463 (ดูคอลัมน์ นางสาว). F-สถิติ = MSA / MSW = 3.462 (ดูคอลัมน์ F).

ค่าวิกฤตบน Fยู, ลักษณะเฉพาะสำหรับ F-การกระจายถูกกำหนดโดยสูตร = F. OBR (0.95; 3; 16) = 3.239 พารามิเตอร์ของฟังก์ชัน =F.OBR(): α = 0.05 ตัวเศษมีอิสระสามองศา และตัวส่วนคือ 16 ดังนั้น ค่าที่คำนวณได้ F-สถิติเท่ากับ 3.462 เกินค่าวิกฤตบน Fยู= 3.239 สมมติฐานว่างถูกปฏิเสธ (รูปที่ 8)

ข้าว. 8. บริเวณวิกฤตของการวิเคราะห์ความแปรปรวนที่ระดับนัยสำคัญเท่ากับ 0.05 ถ้าตัวเศษมีอิสระสามองศาและตัวส่วนเป็น -16

R-ค่า คือ ความน่าจะเป็นที่อยู่ภายใต้สมมติฐานว่างจริง F- สถิติไม่ต่ำกว่า 3.46 เท่ากับ 0.041 หรือ 4.1% (ดูคอลัมน์ p-valueโต๊ะ การวิเคราะห์ความแปรปรวนรูปที่ 6) เนื่องจากค่านี้ไม่เกินระดับนัยสำคัญ α = 5% สมมติฐานว่างจึงถูกปฏิเสธ นอกจากนี้, R-value บ่งชี้ว่าความน่าจะเป็นที่จะค้นพบดังกล่าวหรือความแตกต่างอย่างมากระหว่างความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป โดยที่จริง ๆ แล้วเหมือนกันคือ 4.1%

ดังนั้น. มีความแตกต่างระหว่างค่าเฉลี่ยสี่ตัวอย่าง สมมติฐานว่างคือความคาดหวังทางคณิตศาสตร์ทั้งหมดของประชากรทั้งสี่นั้นเท่ากัน ภายใต้เงื่อนไขเหล่านี้ การวัดความแปรปรวนรวม (เช่น ความแปรผันของ SST ทั้งหมด) ของความแรงของร่มชูชีพทั้งหมดคำนวณโดยการรวมผลต่างกำลังสองระหว่างการสังเกตแต่ละครั้ง ซีจือและค่าเฉลี่ยโดยรวม . จากนั้นความแปรผันทั้งหมดจะถูกแบ่งออกเป็นสององค์ประกอบ (ดูรูปที่ 1) องค์ประกอบแรกคือการแปรผันระหว่างกลุ่มใน SSA และองค์ประกอบที่สองคือการแปรผันภายในกลุ่มใน SSW

อะไรอธิบายความแปรปรวนในข้อมูล? กล่าวอีกนัยหนึ่ง เหตุใดการสังเกตทั้งหมดจึงไม่เหมือนกัน เหตุผลหนึ่งคือบริษัทต่างๆ จัดหาเส้นใยที่มีจุดแข็งต่างกัน ส่วนนี้อธิบายได้ว่าทำไมกลุ่มจึงมีค่าคาดหวังต่างกัน: ยิ่งผลของเงื่อนไขการทดลองรุนแรงมากเท่าใด ความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มก็จะยิ่งมากขึ้น อีกสาเหตุหนึ่งของความแปรปรวนของข้อมูลคือความแปรปรวนตามธรรมชาติของกระบวนการใดๆ ในกรณีนี้คือการผลิตร่มชูชีพ แม้ว่าเส้นใยทั้งหมดจะถูกซื้อจากซัพพลายเออร์รายเดียวกัน ความแข็งแกร่งของเส้นใยจะไม่เท่ากันภายใต้เงื่อนไขอื่นๆ เงื่อนไขที่เท่าเทียมกัน. เนื่องจากเอฟเฟกต์นี้ปรากฏในแต่ละกลุ่ม จึงเรียกว่ารูปแบบภายในกลุ่ม

ความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างเรียกว่ารูปแบบระหว่างกลุ่มของ SSA ส่วนหนึ่งของรูปแบบภายในกลุ่ม ดังที่ได้กล่าวไปแล้วนั้น อธิบายได้จากข้อเท็จจริงที่ว่าข้อมูลอยู่ในกลุ่มต่างๆ อย่างไรก็ตาม แม้ว่ากลุ่มจะเหมือนกันทุกประการ (กล่าวคือ สมมติฐานว่างจะเป็นจริง) แต่ก็ยังมีความแปรผันระหว่างกลุ่ม เหตุผลนี้อยู่ที่ความแปรปรวนตามธรรมชาติของกระบวนการผลิตร่มชูชีพ เนื่องจากตัวอย่างต่างกัน ค่าเฉลี่ยตัวอย่างจึงต่างกัน ดังนั้น หากสมมติฐานว่างเป็นจริง ทั้งระหว่างกลุ่มและ ความแปรปรวนภายในกลุ่มแทนค่าประมาณความแปรปรวนของประชากร ถ้าสมมติฐานว่างเป็นเท็จ สมมติฐานระหว่างกลุ่มจะใหญ่ขึ้น ความจริงข้อนี้รองรับ F-เกณฑ์การเปรียบเทียบความแตกต่างระหว่างความคาดหวังทางคณิตศาสตร์ของหลายกลุ่ม

หลังจากดำเนินการ ANOVA ทางเดียวและพบความแตกต่างที่มีนัยสำคัญระหว่างบริษัทต่างๆ ก็ยังไม่ทราบว่าซัพพลายเออร์รายใดแตกต่างจากบริษัทอื่นอย่างมีนัยสำคัญ เรารู้แค่ว่าความคาดหวังทางคณิตศาสตร์ของประชากรไม่เท่ากัน กล่าวอีกนัยหนึ่ง ความคาดหวังทางคณิตศาสตร์อย่างน้อยหนึ่งข้อแตกต่างอย่างมากจากความคาดหวังอื่นๆ ในการพิจารณาว่าผู้ให้บริการรายใดแตกต่างจากผู้ให้บริการรายอื่น คุณสามารถใช้ ขั้นตอน Tukeyซึ่งใช้การเปรียบเทียบแบบคู่ระหว่างผู้ให้บริการ ขั้นตอนนี้ได้รับการพัฒนาโดย John Tukey ต่อจากนั้น เขาและ C. Cramer ได้แก้ไขขั้นตอนนี้โดยอิสระสำหรับสถานการณ์ที่ขนาดตัวอย่างแตกต่างกัน

การเปรียบเทียบหลายรายการ: ขั้นตอน Tukey-Kramer

ในสถานการณ์ของเรา การวิเคราะห์ความแปรปรวนทางเดียวถูกใช้เพื่อเปรียบเทียบความแรงของร่มชูชีพ การค้นพบ ความแตกต่างที่สำคัญระหว่างความคาดหวังทางคณิตศาสตร์ของทั้งสี่กลุ่ม จำเป็นต้องกำหนดว่ากลุ่มใดแตกต่างกัน แม้ว่าจะมีหลายวิธีในการแก้ปัญหานี้ แต่เราจะอธิบายเฉพาะขั้นตอนการเปรียบเทียบหลายรายการของ Tukey-Kramer วิธีนี้เป็นตัวอย่างของขั้นตอนการเปรียบเทียบแบบโพสต์เฉพาะกิจ เนื่องจากสมมติฐานที่จะทดสอบถูกกำหนดขึ้นหลังจากการวิเคราะห์ข้อมูล ขั้นตอน Tukey-Kramer ช่วยให้คุณสามารถเปรียบเทียบทุกคู่ของกลุ่มได้พร้อมกัน ในระยะแรกจะคำนวณส่วนต่าง Xเจ – Xเจ, ที่ไหน เจ ≠เจ, ระหว่างความคาดหวังทางคณิตศาสตร์ s(s – 1)/2กลุ่ม ช่วงวิกฤตขั้นตอน Tukey-Kramer คำนวณโดยสูตร:

ที่ไหน คิว ยู- ค่าวิกฤตบนของการกระจายของช่วงนักเรียนซึ่งมี กับองศาอิสระในตัวเศษและ - กับองศาอิสระในตัวส่วน

หากขนาดตัวอย่างไม่เท่ากัน ช่วงวิกฤตจะถูกคำนวณสำหรับความคาดหวังทางคณิตศาสตร์แต่ละคู่แยกกัน ในขั้นตอนสุดท้ายแต่ละ s(s – 1)/2การเปรียบเทียบความคาดหวังทางคณิตศาสตร์กับช่วงวิกฤตที่สอดคล้องกัน องค์ประกอบของคู่จะถือว่าแตกต่างกันอย่างมากหากโมดูลัสของความแตกต่าง | Xj – Xเจ| ระหว่างพวกเขาเกินช่วงวิกฤต

ให้เราใช้ขั้นตอน Tukey-Cramer กับปัญหาความแข็งแกร่งของร่มชูชีพ เนื่องจากบริษัทร่มชูชีพมีซัพพลายเออร์สี่ราย จึงควรทดสอบซัพพลายเออร์ 4(4 – 1)/2 = 6 คู่ (ภาพที่ 9)

ข้าว. 9. การเปรียบเทียบแบบคู่ของค่าเฉลี่ยตัวอย่าง

เนื่องจากทุกกลุ่มมีปริมาณเท่ากัน (เช่น all nj = nj) ก็เพียงพอที่จะคำนวณช่วงวิกฤตเพียงช่วงเดียวเท่านั้น การทำเช่นนี้ตามตาราง ANOVA(รูปที่ 6) เรากำหนดค่าของ MSW = 6.094 แล้วเราจะพบค่า คิว ยูที่ α = 0.05, กับ= 4 (จำนวนองศาอิสระในตัวเศษ) และ - กับ= 20 – 4 = 16 (จำนวนองศาอิสระในตัวส่วน) ขออภัย ฉันไม่พบฟังก์ชันที่เกี่ยวข้องใน Excel ดังนั้นฉันจึงใช้ตาราง (รูปที่ 10)

ข้าว. 10. ค่าวิกฤตของช่วงนักเรียน คิว ยู

เราได้รับ:

เนื่องจากมีเพียง 4.74 > 4.47 (ดูตารางด้านล่างในรูปที่ 9) ความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างซัพพลายเออร์รายแรกและรายที่สอง คู่อื่น ๆ ทั้งหมดมีค่าเฉลี่ยตัวอย่างซึ่งไม่อนุญาตให้เราพูดถึงความแตกต่างของพวกเขา ดังนั้น ความแข็งแรงเฉลี่ยของร่มชูชีพที่ทอจากเส้นใยที่ซื้อจากซัพพลายเออร์รายแรกจึงน้อยกว่าของที่สองอย่างมีนัยสำคัญ

เงื่อนไขที่จำเป็นสำหรับการวิเคราะห์ความแปรปรวนทางเดียว

ในการแก้ปัญหาความแรงของร่มชูชีพเราไม่ได้ตรวจสอบว่าตรงตามเงื่อนไขที่สามารถใช้ปัจจัยเดียวได้หรือไม่ F-เกณฑ์ คุณรู้ได้อย่างไรว่าคุณสามารถใช้ single-factor F-เกณฑ์ในการวิเคราะห์ข้อมูลการทดลองเฉพาะ? ปัจจัยเดียว Fสามารถใช้ -test ได้ก็ต่อเมื่อเป็นไปตามสมมติฐานพื้นฐานสามข้อ: ข้อมูลการทดลองจะต้องสุ่มและเป็นอิสระ มีการแจกแจงแบบปกติ และความแปรปรวนของข้อมูลการทดสอบต้องเหมือนกัน

เดาแรกคือ การสุ่มและความเป็นอิสระของข้อมูล- ควรทำเสมอ เนื่องจากความถูกต้องของการทดลองขึ้นอยู่กับการสุ่มตัวเลือกและ / หรือกระบวนการสุ่มตัวอย่าง เพื่อหลีกเลี่ยงการบิดเบือนผลลัพธ์ จำเป็นต้องดึงข้อมูลออกจาก กับประชากรสุ่มและเป็นอิสระจากกัน ในทำนองเดียวกัน ข้อมูลควรถูกสุ่มกระจายไปทั่ว กับระดับของปัจจัยที่เราสนใจ (กลุ่มทดลอง) การละเมิดเงื่อนไขเหล่านี้สามารถบิดเบือนผลการวิเคราะห์ความแปรปรวนอย่างจริงจัง

การเดาที่สองคือ ความปกติ- หมายความว่าข้อมูลถูกดึงมาจากประชากรแบบกระจายตามปกติ ส่วน t-เกณฑ์การวิเคราะห์ทางเดียวของความแปรปรวนตาม F-เกณฑ์ค่อนข้างไม่อ่อนไหวต่อการละเมิดเงื่อนไขนี้ ถ้าการกระจายไม่ห่างจากปกติมากเกินไป ระดับนัยสำคัญ F- เกณฑ์เปลี่ยนแปลงเพียงเล็กน้อย โดยเฉพาะอย่างยิ่งถ้าขนาดกลุ่มตัวอย่างใหญ่เพียงพอ หากเงื่อนไขของการแจกแจงแบบปกติถูกละเมิดอย่างร้ายแรงก็ควรใช้

การเดาครั้งที่สามคือ ความสม่ำเสมอของการกระจายตัว- หมายความว่าความแปรปรวนของประชากรทั่วไปแต่ละกลุ่มมีค่าเท่ากัน (เช่น σ 1 2 = σ 2 2 = … = σ j 2) สมมติฐานนี้ช่วยให้ตัดสินใจได้ว่าจะแยกหรือรวมความแปรปรวนภายในกลุ่ม หากปริมาตรของกลุ่มเท่ากัน สภาวะความเป็นเนื้อเดียวกันของความแปรปรวนจะมีผลเพียงเล็กน้อยต่อข้อสรุปที่ได้จากการใช้ F-เกณฑ์. อย่างไรก็ตาม หากขนาดตัวอย่างไม่เท่ากัน การละเมิดเงื่อนไขความเท่าเทียมกันของความแปรปรวนอาจบิดเบือนผลการวิเคราะห์ความแปรปรวนอย่างจริงจัง ดังนั้น เราควรพยายามทำให้แน่ใจว่าขนาดตัวอย่างเท่ากัน วิธีหนึ่งในการตรวจสอบสมมติฐานเกี่ยวกับความเป็นเนื้อเดียวกันของความแปรปรวนคือเกณฑ์ เลเวเนย์อธิบายไว้ด้านล่าง.

ถ้าในทั้งสามเงื่อนไข มีการละเมิดความสม่ำเสมอของสภาวะการกระจายเท่านั้น ขั้นตอนจะคล้ายกับ t-เกณฑ์โดยใช้ความแปรปรวนแยกกัน (ดูรายละเอียด) อย่างไรก็ตาม หากสมมติฐานของการแจกแจงแบบปกติและความเหมือนกันของความแปรปรวนถูกละเมิดในเวลาเดียวกัน จำเป็นต้องทำให้ข้อมูลเป็นมาตรฐานและลดความต่างระหว่างความแปรปรวนหรือใช้ขั้นตอนที่ไม่เกี่ยวกับพารามิเตอร์

เกณฑ์ของ Leveney สำหรับตรวจสอบความเป็นเนื้อเดียวกันของความแปรปรวน

แม้ว่า F- เกณฑ์ค่อนข้างต่อต้านการละเมิดเงื่อนไขความเท่าเทียมกันของความแปรปรวนในกลุ่ม การละเมิดข้อสันนิษฐานนี้โดยรวมส่งผลกระทบอย่างมีนัยสำคัญต่อระดับความสำคัญและอำนาจของเกณฑ์ บางทีหนึ่งในเกณฑ์ที่ทรงพลังที่สุดคือเกณฑ์ เลเวเนย์. เพื่อตรวจสอบความเท่าเทียมกันของความแปรปรวน กับประชากรทั่วไป เราจะทดสอบสมมติฐานต่อไปนี้:

H 0: σ 1 2 = σ 2 2 = ... = σเจ 2

H 1: ไม่ทั้งหมด σ เจ 2เหมือนกัน ( เจ = 1, 2, …, กับ)

การทดสอบ Leveney ที่แก้ไขจะขึ้นอยู่กับข้อความที่ว่าถ้าความแปรปรวนในกลุ่มเหมือนกัน การวิเคราะห์ความแปรปรวนสามารถใช้เพื่อทดสอบสมมติฐานว่างของความเท่าเทียมกันของความแปรปรวนได้ ค่าสัมบูรณ์ความแตกต่างระหว่างการสังเกตและค่ามัธยฐานของกลุ่ม ดังนั้นก่อนอื่นคุณควรคำนวณค่าสัมบูรณ์ของความแตกต่างระหว่างการสังเกตและค่ามัธยฐานในแต่ละกลุ่มแล้วทำการวิเคราะห์ความแปรปรวนทางเดียวกับค่าสัมบูรณ์ที่ได้รับของความแตกต่าง เพื่อแสดงเกณฑ์ของเลอเวเนย์ ให้เรากลับไปที่สถานการณ์ที่สรุปไว้ตอนต้นของบันทึกย่อ โดยใช้ข้อมูลที่แสดงในรูปที่ 6 เราจะทำการวิเคราะห์ที่คล้ายกัน แต่สำหรับโมดูลของความแตกต่างในข้อมูลเริ่มต้นและค่ามัธยฐานสำหรับแต่ละตัวอย่างแยกกัน (รูปที่ 11)

การวิเคราะห์ความแปรปรวนเป็นเซต วิธีการทางสถิติออกแบบมาเพื่อทดสอบสมมติฐานเกี่ยวกับความสัมพันธ์ระหว่างคุณลักษณะบางอย่างกับปัจจัยที่ศึกษาซึ่งไม่มีคำอธิบายเชิงปริมาณ รวมทั้งเพื่อกำหนดระดับของอิทธิพลของปัจจัยและปฏิสัมพันธ์ ในวรรณคดีเฉพาะทาง มักเรียกกันว่า ANOVA (จากชื่อภาษาอังกฤษว่า Analysis of Variations) วิธีนี้ได้รับการพัฒนาครั้งแรกโดย R. Fischer ในปี 1925

ประเภทและเกณฑ์การวิเคราะห์ความแปรปรวน

วิธีนี้ใช้เพื่อตรวจสอบความสัมพันธ์ระหว่างคุณลักษณะเชิงคุณภาพ (ระบุ) และตัวแปรเชิงปริมาณ (ต่อเนื่อง) อันที่จริง มันทดสอบสมมติฐานเกี่ยวกับความเท่าเทียมกันของค่าเฉลี่ยเลขคณิตของตัวอย่างหลายตัวอย่าง ดังนั้นจึงถือได้ว่าเป็นเกณฑ์เชิงพาราเมตริกสำหรับการเปรียบเทียบจุดศูนย์กลางของตัวอย่างหลายตัวอย่างในคราวเดียว หากคุณใช้วิธีนี้กับตัวอย่างสองตัวอย่าง ผลลัพธ์ของการวิเคราะห์ความแปรปรวนจะเหมือนกันกับผลการทดสอบ t ของนักเรียน อย่างไรก็ตาม การศึกษานี้ช่วยให้คุณศึกษาปัญหาโดยละเอียดยิ่งขึ้น ซึ่งแตกต่างจากเกณฑ์อื่นๆ

การวิเคราะห์ความแปรปรวนในสถิติเป็นไปตามกฎหมาย: ผลรวมของการเบี่ยงเบนกำลังสองของตัวอย่างที่รวมกันจะเท่ากับผลรวมของกำลังสองของการเบี่ยงเบนภายในกลุ่มและผลรวมของกำลังสองของการเบี่ยงเบนระหว่างกลุ่ม สำหรับการศึกษา การทดสอบของฟิชเชอร์ใช้เพื่อกำหนดความสำคัญของความแตกต่างระหว่างความแปรปรวนระหว่างกลุ่มและภายในกลุ่ม อย่างไรก็ตาม สำหรับสิ่งนี้ ข้อกำหนดเบื้องต้นที่จำเป็นคือความปกติของการกระจายและ homoscedasticity (ความเท่าเทียมกันของความแปรปรวน) ของตัวอย่าง แยกแยะระหว่างการวิเคราะห์แบบหนึ่งมิติ (ปัจจัยเดียว) ของความแปรปรวนและหลายตัวแปร (หลายปัจจัย) ประการแรกพิจารณาการพึ่งพาอาศัยกันของค่าภายใต้การศึกษาคุณลักษณะหนึ่ง ประการที่สอง - หลายค่าในคราวเดียว และยังช่วยให้คุณสามารถระบุความสัมพันธ์ระหว่างพวกเขาได้

ปัจจัย

ปัจจัยที่เรียกว่าสถานการณ์ควบคุมที่ส่งผลต่อผลลัพธ์สุดท้าย ระดับหรือวิธีการประมวลผลเรียกว่าค่าที่กำหนดลักษณะเฉพาะของเงื่อนไขนี้ ตัวเลขเหล่านี้มักจะได้รับในมาตราส่วนการวัดเล็กน้อยหรือลำดับ ค่าเอาต์พุตมักจะวัดจากมาตราส่วนเชิงปริมาณหรือลำดับ แล้วมีปัญหาในการจัดกลุ่มข้อมูลเอาท์พุตในชุดการสังเกตซึ่งสอดคล้องกันโดยประมาณ ค่าตัวเลข. หากจำนวนกลุ่มมากเกินไป จำนวนการสังเกตในกลุ่มอาจไม่เพียงพอเพื่อให้ได้ผลลัพธ์ที่เชื่อถือได้ หากใช้ตัวเลขน้อยเกินไป อาจทำให้สูญเสียคุณสมบัติที่สำคัญที่มีอิทธิพลต่อระบบ วิธีการเฉพาะในการจัดกลุ่มข้อมูลขึ้นอยู่กับปริมาณและลักษณะของความแปรผันของค่า จำนวนและขนาดของช่วงเวลาในการวิเคราะห์แบบไม่แปรผันมักถูกกำหนดโดยหลักการของช่วงที่เท่ากันหรือโดยหลักการของความถี่ที่เท่ากัน

งานวิเคราะห์การกระจายตัว

ดังนั้น มีหลายกรณีที่คุณต้องการเปรียบเทียบตัวอย่างตั้งแต่สองตัวอย่างขึ้นไป จากนั้นจึงแนะนำให้ใช้การวิเคราะห์ความแปรปรวน ชื่อของวิธีการบ่งชี้ว่าข้อสรุปทำขึ้นบนพื้นฐานของการศึกษาองค์ประกอบของความแปรปรวน สาระสำคัญของการศึกษาคือการเปลี่ยนแปลงโดยรวมในตัวบ่งชี้แบ่งออกเป็นองค์ประกอบที่สอดคล้องกับการกระทำของแต่ละปัจจัย พิจารณาปัญหาจำนวนหนึ่งที่การวิเคราะห์ความแปรปรวนโดยทั่วไปจะแก้ไขได้

ตัวอย่าง 1

การประชุมเชิงปฏิบัติการมีเครื่องจักรจำนวนมาก - เครื่องจักรอัตโนมัติที่ผลิตชิ้นส่วนเฉพาะ ขนาดของแต่ละส่วนเป็นค่าสุ่ม ซึ่งขึ้นอยู่กับการตั้งค่าของแต่ละเครื่องและการเบี่ยงเบนแบบสุ่มที่เกิดขึ้นระหว่างกระบวนการผลิตของชิ้นส่วน จำเป็นต้องกำหนดจากการวัดขนาดของชิ้นส่วนว่าเครื่องจักรถูกตั้งค่าในลักษณะเดียวกันหรือไม่

ตัวอย่าง 2

ในระหว่างการผลิตอุปกรณ์ไฟฟ้า มีการใช้กระดาษฉนวนหลายประเภท: ตัวเก็บประจุ ไฟฟ้า ฯลฯ อุปกรณ์สามารถชุบได้ สารต่างๆ: อีพอกซีเรซิน วานิช ML-2 เรซิน ฯลฯ สามารถขจัดรอยรั่วได้ภายใต้สุญญากาศที่ความดันสูง เมื่อถูกความร้อน มันสามารถชุบโดยการแช่ในวานิชภายใต้กระแสวานิชอย่างต่อเนื่อง ฯลฯ อุปกรณ์ไฟฟ้าทั้งหมดถูกเทด้วยสารประกอบบางอย่างซึ่งมีหลายตัวเลือก ตัวบ่งชี้คุณภาพคือค่าความเป็นฉนวนของฉนวน อุณหภูมิความร้อนสูงเกินไปของขดลวดในโหมดการทำงาน และอื่นๆ อีกจำนวนหนึ่ง ระหว่างออกกำลังกาย กระบวนการทางเทคโนโลยีอุปกรณ์การผลิต จำเป็นต้องพิจารณาว่าแต่ละปัจจัยที่ระบุไว้มีผลกระทบต่อประสิทธิภาพของอุปกรณ์อย่างไร

ตัวอย่างที่ 3

คลังเก็บรถเข็นให้บริการหลายเส้นทาง พวกเขาใช้รถเข็นประเภทต่าง ๆ และผู้ตรวจสอบ 125 คนเก็บค่าโดยสาร ฝ่ายบริหารของคลังมีความสนใจในคำถาม: จะเปรียบเทียบประสิทธิภาพทางเศรษฐกิจของผู้ควบคุม (รายได้) แต่ละรายการตามเส้นทางที่แตกต่างกัน รถเข็นประเภทต่าง ๆ ได้อย่างไร จะกำหนดความเป็นไปได้ทางเศรษฐกิจของการเปิดตัวรถเข็นประเภทใดประเภทหนึ่งบนเส้นทางใดเส้นทางหนึ่งได้อย่างไร จะสร้างข้อกำหนดที่สมเหตุสมผลสำหรับจำนวนรายได้ที่ผู้ควบคุมรถนำมาในแต่ละเส้นทางในรถเข็นประเภทต่างๆ ได้อย่างไร?

หน้าที่ของการเลือกวิธีการคือวิธีการรับข้อมูลสูงสุดเกี่ยวกับผลกระทบต่อผลลัพธ์ขั้นสุดท้ายของแต่ละปัจจัย กำหนดลักษณะเชิงตัวเลขของผลกระทบดังกล่าว ความน่าเชื่อถือด้วยต้นทุนขั้นต่ำและสูงสุด เวลาอันสั้น. วิธีการวิเคราะห์การกระจายช่วยให้สามารถแก้ปัญหาดังกล่าวได้

การวิเคราะห์ตัวแปรเดียว

การศึกษานี้มีจุดมุ่งหมายเพื่อประเมินขนาดของผลกระทบของกรณีใดกรณีหนึ่งต่อการทบทวนที่กำลังวิเคราะห์ อีกหนึ่งความท้าทาย การวิเคราะห์แบบไม่แปรผันอาจมีการเปรียบเทียบสถานการณ์สองอย่างหรือมากกว่าซึ่งกันและกันเพื่อกำหนดความแตกต่างในอิทธิพลที่มีต่อการเรียกคืน หากสมมติฐานว่างถูกปฏิเสธ ขั้นตอนต่อไปคือการหาปริมาณและสร้าง ช่วงความเชื่อมั่นสำหรับคุณสมบัติที่ได้รับ ในกรณีที่ไม่สามารถปฏิเสธสมมติฐานว่างได้ มักจะเป็นที่ยอมรับและมีการสรุปเกี่ยวกับธรรมชาติของอิทธิพล

การวิเคราะห์ความแปรปรวนทางเดียวอาจกลายเป็นแอนะล็อกที่ไม่มีพารามิเตอร์ของวิธีอันดับครุสคาล-วาลลิส ได้รับการพัฒนาโดยนักคณิตศาสตร์ชาวอเมริกัน William Kruskal และนักเศรษฐศาสตร์ Wilson Wallis ในปี 1952 การทดสอบนี้มีวัตถุประสงค์เพื่อทดสอบสมมติฐานว่างว่าผลกระทบของอิทธิพลต่อตัวอย่างที่ศึกษามีค่าเท่ากับค่าเฉลี่ยที่ไม่ทราบค่าแต่เท่ากัน ในกรณีนี้ จำนวนตัวอย่างต้องมากกว่าสองตัวอย่าง

เกณฑ์ Jonkhier (Jonkhier-Terpstra) ได้รับการเสนอโดยอิสระโดยนักคณิตศาสตร์ชาวดัตช์ T. J. Terpstrom ในปี 1952 และนักจิตวิทยาชาวอังกฤษ E. R. Jonkhier ในปี 1954 ใช้เมื่อทราบล่วงหน้าว่ากลุ่มผลลัพธ์ที่มีจะถูกเรียงลำดับโดยการเพิ่มขึ้นใน อิทธิพลของปัจจัยที่อยู่ระหว่างการศึกษาซึ่งวัดในระดับลำดับ

M - เกณฑ์ Bartlett ที่เสนอโดย Maurice Stevenson Bartlett นักสถิติชาวอังกฤษในปี 1937 ใช้เพื่อทดสอบสมมติฐานว่างเกี่ยวกับความเท่าเทียมกันของความแปรปรวนของประชากรปกติหลายกลุ่มจากตัวอย่างที่ศึกษา กรณีทั่วไปมีปริมาตรต่างกัน (จำนวนตัวอย่างแต่ละตัวอย่างต้องมีอย่างน้อยสี่ตัวอย่าง)

G คือการทดสอบ Cochran ซึ่งค้นพบโดย American William Gemmel Cochran ในปี 1941 มันถูกใช้เพื่อทดสอบสมมติฐานว่างเกี่ยวกับความเท่าเทียมกันของความแปรปรวนของประชากรปกติสำหรับตัวอย่างอิสระที่มีขนาดเท่ากัน

การทดสอบ Levene แบบไม่อิงพารามิเตอร์ซึ่งเสนอโดย Howard Levene นักคณิตศาสตร์ชาวอเมริกันในปี 1960 เป็นอีกทางเลือกหนึ่งของการทดสอบ Bartlett ในสภาวะที่ไม่มีความแน่นอนว่ากลุ่มตัวอย่างที่ศึกษามีการแจกแจงแบบปกติ

ในปี 1974 นักสถิติชาวอเมริกัน Morton B. Brown และ Alan B. Forsythe เสนอการทดสอบ (การทดสอบ Brown-Forsyth) ซึ่งค่อนข้างแตกต่างจากการทดสอบ Levene

การวิเคราะห์สองทาง

การวิเคราะห์ความแปรปรวนแบบสองทางใช้สำหรับตัวอย่างที่มีการกระจายแบบปกติที่เชื่อมโยง ในทางปฏิบัติมักใช้ ตารางที่ซับซ้อนวิธีนี้ โดยเฉพาะอย่างยิ่งที่แต่ละเซลล์มีชุดข้อมูล (การวัดซ้ำ) ที่สอดคล้องกับค่าระดับคงที่ หากไม่เป็นไปตามสมมติฐานที่จำเป็นในการวิเคราะห์ความแปรปรวนแบบสองทาง จะใช้การทดสอบอันดับฟรีดแมนแบบไม่มีพารามิเตอร์ (ฟรีดแมน เคนดัลล์ และสมิธ) ซึ่งพัฒนาโดยนักเศรษฐศาสตร์ชาวอเมริกัน มิลตัน ฟรีดแมนเมื่อปลายปี พ.ศ. 2473 นี้ เกณฑ์ไม่ได้ขึ้นอยู่กับประเภทของการแจกแจง

สันนิษฐานว่าการกระจายของปริมาณจะเหมือนกันและต่อเนื่องกันเท่านั้น และตัวมันเองเป็นอิสระจากกัน เมื่อทดสอบสมมติฐานว่าง ผลลัพธ์จะได้รับในรูปแบบ เมทริกซ์สี่เหลี่ยมซึ่งแถวสอดคล้องกับระดับของปัจจัย B และคอลัมน์สอดคล้องกับระดับ A แต่ละเซลล์ของตาราง (บล็อก) อาจเป็นผลมาจากการวัดพารามิเตอร์บนวัตถุหนึ่งชิ้นหรือกลุ่มของวัตถุที่มีค่าคงที่ ค่าของระดับของปัจจัยทั้งสอง ในกรณีนี้ ข้อมูลที่เกี่ยวข้องจะแสดงเป็นค่าเฉลี่ยของพารามิเตอร์บางอย่างสำหรับการวัดหรือวัตถุทั้งหมดของตัวอย่างที่ศึกษา ในการใช้เกณฑ์ผลลัพธ์ จำเป็นต้องย้ายจากผลการวัดโดยตรงไปยังอันดับของพวกเขา การจัดอันดับจะดำเนินการแยกกันในแต่ละแถว กล่าวคือ มีการเรียงลำดับค่าสำหรับค่าคงที่แต่ละค่า

การทดสอบหน้า (L-test) ที่เสนอโดยนักสถิติชาวอเมริกัน E.B. Page ในปี 1963 ได้รับการออกแบบมาเพื่อทดสอบสมมติฐานว่าง สำหรับตัวอย่างขนาดใหญ่ จะใช้การประมาณหน้า พวกมันขึ้นอยู่กับความเป็นจริงของสมมติฐานว่างที่สอดคล้องกัน เชื่อฟังการแจกแจงแบบปกติมาตรฐาน ในกรณีที่แถวของตารางต้นทางมีค่าเท่ากัน จำเป็นต้องใช้อันดับเฉลี่ย ในกรณีนี้ความถูกต้องของข้อสรุปจะยิ่งแย่ลงจำนวนความบังเอิญดังกล่าวก็จะยิ่งมากขึ้น

ถาม - เกณฑ์ของ Cochran เสนอโดย V. Cochran ในปี 1937 ใช้ในกรณีที่กลุ่มของอาสาสมัครที่เป็นเนื้อเดียวกันได้รับอิทธิพลมากกว่าสองอย่าง และมีตัวเลือกการตอบสนองสองทางที่เป็นไปได้ - เชิงลบตามเงื่อนไข (0) และแง่บวกตามเงื่อนไข (1) . สมมติฐานว่างประกอบด้วยผลอิทธิพลที่เท่าเทียมกัน การวิเคราะห์ความแปรปรวนแบบสองทางทำให้สามารถระบุการมีอยู่ของเอฟเฟกต์การประมวลผลได้ แต่ไม่สามารถระบุได้ว่าเอฟเฟกต์นี้มีอยู่ในคอลัมน์ใด เพื่อแก้ปัญหานี้ วิธีการ หลายสมการ Scheffe สำหรับตัวอย่างที่เชื่อมโยง

การวิเคราะห์หลายตัวแปร

ปัญหาของการวิเคราะห์ความแปรปรวนหลายตัวแปรเกิดขึ้นเมื่อจำเป็นต้องกำหนดอิทธิพลของสองเงื่อนไขหรือมากกว่าต่อตัวแปรสุ่มบางตัว การศึกษาจัดให้มีผู้อยู่ในอุปการะหนึ่งคน ตัวแปรสุ่ม, วัดในอัตราส่วนความแตกต่างหรืออัตราส่วนและหลาย ตัวแปรอิสระซึ่งแต่ละส่วนจะแสดงเป็นสเกลชื่อหรือระดับยศ การวิเคราะห์การกระจายข้อมูลเป็นส่วนที่พัฒนาอย่างเป็นธรรม สถิติทางคณิตศาสตร์ซึ่งมีตัวเลือกมากมาย แนวคิดของการศึกษานี้เป็นเรื่องปกติสำหรับการศึกษาทั้งแบบไม่มีตัวแปรและหลายตัวแปร สาระสำคัญของมันคือ ผลต่างทั้งหมดแบ่งออกเป็นองค์ประกอบซึ่งสอดคล้องกับการจัดกลุ่มข้อมูลบางกลุ่ม การจัดกลุ่มข้อมูลแต่ละกลุ่มมีรูปแบบของตัวเอง ที่นี่เราจะพิจารณาเฉพาะบทบัญญัติหลักที่จำเป็นสำหรับความเข้าใจและ การใช้งานจริงตัวเลือกที่ใช้มากที่สุด

การวิเคราะห์ปัจจัยความแปรปรวนต้องให้ความสนใจอย่างรอบคอบในการรวบรวมและนำเสนอข้อมูลที่ป้อนเข้า และโดยเฉพาะอย่างยิ่งกับการตีความผลลัพธ์ ตรงกันข้ามกับปัจจัยเดียว ผลลัพธ์ที่สามารถวางตามเงื่อนไขในลำดับที่แน่นอน ผลลัพธ์ของปัจจัยสองปัจจัยต้องการการนำเสนอที่ซับซ้อนมากขึ้น มากกว่า สถานการณ์ยากขึ้นเกิดขึ้นเมื่อมีสาม สี่ หรือมากกว่านั้น ด้วยเหตุนี้ โมเดลจึงไม่ค่อยมีเงื่อนไขมากกว่าสาม (สี่) ตัว ตัวอย่างคือการเกิดขึ้นของเรโซแนนซ์ที่ค่าความจุและความเหนี่ยวนำของวงกลมไฟฟ้า การปรากฏตัวของปฏิกิริยาเคมีกับชุดขององค์ประกอบที่สร้างระบบ การเกิดขึ้นของผลกระทบผิดปกติในระบบที่ซับซ้อนภายใต้สถานการณ์บังเอิญบางอย่าง การปรากฏตัวของปฏิสัมพันธ์สามารถเปลี่ยนรูปแบบของระบบอย่างรุนแรงและบางครั้งนำไปสู่การคิดทบทวนเกี่ยวกับธรรมชาติของปรากฏการณ์ที่ผู้ทดลองกำลังเผชิญอยู่

การวิเคราะห์ความแปรปรวนหลายตัวแปรด้วยการทดลองซ้ำๆ

ข้อมูลการวัดมักจะจัดกลุ่มไม่ได้โดยแบ่งเป็นสองกลุ่ม แต่แยกตามปัจจัยอื่นๆ ดังนั้น หากเราพิจารณาการวิเคราะห์การกระจายตัวของอายุการใช้งานของยางสำหรับล้อรถเข็นโดยคำนึงถึงสถานการณ์ (ผู้ผลิตและเส้นทางที่ใช้ยาง) เราสามารถแยกเป็นเงื่อนไขแยกฤดูกาลระหว่างยาง ใช้แล้ว (กล่าวคือ การดำเนินการในฤดูหนาวและฤดูร้อน) เป็นผลให้เราจะมีปัญหาของวิธีสามปัจจัย

ในกรณีที่มีเงื่อนไขมากกว่านี้ วิธีนี้จะเหมือนกับการวิเคราะห์แบบสองทาง ในทุกกรณี ตัวแบบพยายามทำให้ง่ายขึ้น ปรากฏการณ์ปฏิสัมพันธ์ของสองปัจจัยไม่ได้เกิดขึ้นบ่อยนัก และปฏิสัมพันธ์สามประการเกิดขึ้นเฉพาะในกรณีพิเศษเท่านั้น รวมการโต้ตอบที่มีข้อมูลก่อนหน้านี้และเหตุผลที่ดีที่จะนำมาพิจารณาในแบบจำลอง กระบวนการแยกปัจจัยแต่ละอย่างและนำมาพิจารณานั้นค่อนข้างง่าย ดังนั้นจึงมักมีความปรารถนาที่จะเน้นย้ำถึงสถานการณ์ต่างๆ มากขึ้น คุณไม่ควรดำเนินการไปกับสิ่งนี้ ยิ่งมีเงื่อนไขมากเท่าใด โมเดลก็จะยิ่งมีความน่าเชื่อถือน้อยลงเท่านั้น และมีโอกาสเกิดข้อผิดพลาดมากขึ้น ตัวแบบเองซึ่งรวมถึง จำนวนมากของตัวแปรอิสระจะตีความได้ยากและไม่สะดวกต่อการใช้งานจริง

แนวคิดทั่วไปของการวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวนทางสถิติเป็นวิธีการหาผลการสังเกตที่ขึ้นอยู่กับสถานการณ์ต่างๆ ที่เกิดขึ้นพร้อมกันและการประเมินอิทธิพล ตัวแปรควบคุมที่สอดคล้องกับวิธีการที่มีอิทธิพลต่อวัตถุประสงค์ของการศึกษาและในช่วงระยะเวลาหนึ่งได้มา ค่าบางอย่างเรียกว่าเป็นปัจจัย พวกเขาสามารถเป็นเชิงคุณภาพและเชิงปริมาณ ระดับของเงื่อนไขเชิงปริมาณได้รับค่าที่แน่นอนในระดับตัวเลข ตัวอย่างได้แก่ อุณหภูมิ แรงดันกด ปริมาณของสาร ปัจจัยด้านคุณภาพคือ สารต่างๆ, วิธีการทางเทคโนโลยีต่างๆ, อุปกรณ์, สารตัวเติม. ระดับของพวกเขาสอดคล้องกับขนาดของชื่อ

คุณภาพยังรวมถึงประเภทของวัสดุบรรจุภัณฑ์ สภาพการเก็บรักษา แบบฟอร์มการให้ยา. นอกจากนี้ยังสมเหตุสมผลที่จะรวมระดับการบดวัตถุดิบ องค์ประกอบเศษส่วนของเม็ดที่มี มูลค่าเชิงปริมาณแต่ควบคุมได้ยากหากใช้มาตราส่วนเชิงปริมาณ จำนวนของปัจจัยด้านคุณภาพขึ้นอยู่กับชนิดของรูปแบบยา เช่นเดียวกับคุณสมบัติทางกายภาพและเทคโนโลยีของสารยา ตัวอย่างเช่น ยาเม็ดสามารถหาได้จากสารที่เป็นผลึกโดยการบีบอัดโดยตรง ในกรณีนี้ การเลือกสารเลื่อนและสารหล่อลื่นก็เพียงพอแล้ว

ตัวอย่างปัจจัยด้านคุณภาพสำหรับรูปแบบยาประเภทต่างๆ

  • ทิงเจอร์องค์ประกอบของสารสกัด ชนิดของเครื่องสกัด วิธีการเตรียมวัตถุดิบ วิธีการผลิต วิธีการกรอง
  • สารสกัด (ของเหลว, หนา, แห้ง).องค์ประกอบของสารสกัด วิธีการสกัด ชนิดของการติดตั้ง วิธีการกำจัดสารสกัดและสารอับเฉา
  • แท็บเล็ตองค์ประกอบของส่วนเติมเนื้อยา สารตัวเติม สารช่วยแตกตัว สารยึดเกาะ สารหล่อลื่นและสารหล่อลื่น วิธีการรับแท็บเล็ต ประเภทของอุปกรณ์เทคโนโลยี ประเภทของเปลือกและส่วนประกอบ สารก่อฟิล์ม เม็ดสี สีย้อม พลาสติไซเซอร์ ตัวทำละลาย
  • โซลูชั่นการฉีดประเภทของตัวทำละลาย วิธีการกรอง ลักษณะของสารทำให้คงตัวและสารกันบูด สภาวะการฆ่าเชื้อ วิธีการบรรจุหลอด
  • เหน็บองค์ประกอบของฐานเหน็บ, วิธีการรับเหน็บ, ฟิลเลอร์, บรรจุภัณฑ์
  • ขี้ผึ้งองค์ประกอบฐาน ส่วนประกอบโครงสร้าง, วิธีการเตรียมครีม , ชนิดของอุปกรณ์ , บรรจุภัณฑ์
  • แคปซูล.ประเภทของวัสดุเปลือก วิธีการรับแคปซูล ชนิดของพลาสติไซเซอร์ สารกันบูด สีย้อม
  • เสื่อน้ำมันวิธีการผลิต องค์ประกอบ ชนิดอุปกรณ์ ชนิดของอิมัลซิไฟเออร์
  • การระงับชนิดของตัวทำละลาย ชนิดของสารทำให้คงตัว วิธีการกระจายตัว

ตัวอย่างปัจจัยด้านคุณภาพและระดับที่ศึกษาในกระบวนการผลิตแท็บเล็ต

  • ผงฟู.แป้งมันฝรั่ง ดินขาว ส่วนผสมของโซเดียมไบคาร์บอเนตกับกรดซิตริก แมกนีเซียมคาร์บอเนตพื้นฐาน
  • สารละลายที่มีผลผูกพันน้ำ, แป้งมัน, น้ำเชื่อม, สารละลายเมทิลเซลลูโลส, สารละลายไฮดรอกซีโพรพิลเมทิลเซลลูโลส, สารละลายโพลีไวนิลไพร์โรลิโดน, สารละลายโพลีไวนิลแอลกอฮอล์
  • สารเลื่อนละอองลอย แป้ง แป้งโรยตัว
  • ผู้ที่ใส่.น้ำตาล, กลูโคส, แลคโตส, โซเดียมคลอไรด์, แคลเซียมฟอสเฟต
  • น้ำมันหล่อลื่น.กรดสเตียริก, โพลีเอทิลีนไกลคอล, พาราฟิน

แบบจำลองการวิเคราะห์การกระจายตัวในการศึกษาระดับความสามารถในการแข่งขันของรัฐ

เกณฑ์ที่สำคัญที่สุดประการหนึ่งในการประเมินสถานะของรัฐตามระดับของสวัสดิการและการพัฒนาเศรษฐกิจและสังคม คือ ความสามารถในการแข่งขัน กล่าวคือ ชุดของคุณสมบัติที่มีอยู่ในเศรษฐกิจของประเทศที่กำหนดความสามารถของ รัฐเพื่อแข่งขันกับประเทศอื่นๆ เมื่อกำหนดสถานที่และบทบาทของรัฐในตลาดโลกแล้ว จึงเป็นไปได้ที่จะกำหนดกลยุทธ์ที่ชัดเจนเพื่อสร้างความมั่นคงทางเศรษฐกิจในระดับสากล เนื่องจากเป็นกุญแจสำคัญในความสัมพันธ์เชิงบวกระหว่างรัสเซียกับผู้เล่นทั้งหมดในตลาดโลก: นักลงทุน ,เจ้าหนี้,หน่วยงานของรัฐ

เพื่อเปรียบเทียบระดับความสามารถในการแข่งขันของรัฐ ประเทศต่างๆ ได้รับการจัดอันดับโดยใช้ดัชนีที่ซับซ้อน ซึ่งรวมถึงตัวบ่งชี้ที่ถ่วงน้ำหนักต่างๆ ดัชนีเหล่านี้อิงตามปัจจัยสำคัญที่ส่งผลต่อสถานการณ์ทางเศรษฐกิจ การเมือง ฯลฯ ความซับซ้อนของแบบจำลองในการศึกษาความสามารถในการแข่งขันของรัฐนั้นจัดให้มีการใช้วิธีการวิเคราะห์ทางสถิติหลายตัวแปร (โดยเฉพาะอย่างยิ่ง นี่คือการวิเคราะห์ความแปรปรวน (สถิติ) แบบจำลองทางเศรษฐมิติ การตัดสินใจ) และรวมถึงขั้นตอนหลักดังต่อไปนี้:

  1. การสร้างระบบอินดิเคเตอร์-อินดิเคเตอร์
  2. การประเมินและการคาดการณ์ตัวบ่งชี้ความสามารถในการแข่งขันของรัฐ
  3. การเปรียบเทียบตัวชี้วัด-ตัวชี้วัดความสามารถในการแข่งขันของรัฐ

และตอนนี้ลองพิจารณาเนื้อหาของแบบจำลองของแต่ละขั้นตอนของคอมเพล็กซ์นี้

ในระยะแรกด้วยความช่วยเหลือของวิธีการศึกษาของผู้เชี่ยวชาญจึงมีการสร้างตัวบ่งชี้ทางเศรษฐกิจ - ตัวบ่งชี้ที่สมเหตุสมผลสำหรับการประเมินความสามารถในการแข่งขันของรัฐโดยคำนึงถึงลักษณะเฉพาะของการพัฒนาบนพื้นฐานของการให้คะแนนระหว่างประเทศและข้อมูลจากแผนกสถิติซึ่งสะท้อนถึงสถานะของ ระบบโดยรวมและกระบวนการของมัน ทางเลือกของตัวชี้วัดเหล่านี้มีเหตุผลโดยความจำเป็นในการเลือกตัวชี้วัดที่เหมาะสมที่สุดจากมุมมองของการปฏิบัติ อนุญาตให้กำหนดระดับของรัฐ ความน่าดึงดูดใจในการลงทุน และความเป็นไปได้ของการแปลที่เกี่ยวข้องของศักยภาพที่มีอยู่และภัยคุกคามที่เกิดขึ้นจริง

ตัวชี้วัดหลัก-ตัวชี้วัดของระบบการจัดอันดับระหว่างประเทศคือดัชนี:

  1. ความสามารถในการแข่งขันระดับโลก (GCC)
  2. เสรีภาพทางเศรษฐกิจ (IES)
  3. การพัฒนา ศักยภาพของมนุษย์(เอชดีไอ).
  4. การรับรู้ถึงการทุจริต (CPI)
  5. ภัยคุกคามภายในและภายนอก (IVZZ)
  6. ศักยภาพสำหรับอิทธิพลระหว่างประเทศ (IPIP)

ระยะที่สองจัดให้มีการประเมินและคาดการณ์ตัวบ่งชี้ความสามารถในการแข่งขันของรัฐในแง่ของ การจัดอันดับระหว่างประเทศสำหรับ 139 รัฐของโลกที่ศึกษา

ขั้นตอนที่สามจัดให้มีการเปรียบเทียบสภาพการแข่งขันของรัฐโดยใช้วิธีการวิเคราะห์สหสัมพันธ์และการถดถอย

การใช้ผลการศึกษาทำให้สามารถกำหนดลักษณะของกระบวนการโดยทั่วไปและสำหรับองค์ประกอบแต่ละรายการของความสามารถในการแข่งขันของรัฐ ทดสอบสมมติฐานเกี่ยวกับอิทธิพลของปัจจัยและความสัมพันธ์ในระดับนัยสำคัญที่เหมาะสม

การดำเนินการตามชุดแบบจำลองที่เสนอจะช่วยให้ไม่เพียง แต่จะประเมินสถานการณ์ปัจจุบันของระดับการแข่งขันและความน่าดึงดูดใจการลงทุนของรัฐ แต่ยังเพื่อวิเคราะห์ข้อบกพร่องของการจัดการป้องกันข้อผิดพลาดของการตัดสินใจที่ผิดพลาดและป้องกันการพัฒนาของวิกฤต ในรัฐ

การวิเคราะห์ความแปรปรวน

1. แนวคิดของการวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวน- นี่คือการวิเคราะห์ความแปรปรวนของลักษณะภายใต้อิทธิพลของปัจจัยตัวแปรควบคุมใดๆ ในวรรณคดีต่างประเทศ การวิเคราะห์ความแปรปรวนมักเรียกว่า ANOVA ซึ่งแปลว่าการวิเคราะห์ความแปรปรวน (การวิเคราะห์ความแปรปรวน)

งานวิเคราะห์ความแปรปรวนประกอบด้วยการแยกความแปรปรวนของชนิดที่แตกต่างจากความแปรปรวนทั่วไปของลักษณะ:

ก) ความแปรปรวนอันเนื่องมาจากการกระทำของตัวแปรอิสระแต่ละตัวที่ศึกษา

b) ความแปรปรวนอันเนื่องมาจากปฏิสัมพันธ์ของตัวแปรอิสระที่ศึกษา

c) การแปรผันแบบสุ่มเนื่องจากตัวแปรที่ไม่รู้จักอื่นๆ ทั้งหมด

ความแปรปรวนอันเนื่องมาจากการกระทำของตัวแปรที่ศึกษาและปฏิสัมพันธ์ของพวกมันสัมพันธ์กับความแปรปรวนแบบสุ่ม ตัวบ่งชี้ของอัตราส่วนนี้คือการทดสอบ F ของฟิชเชอร์

สูตรสำหรับการคำนวณเกณฑ์ F รวมถึงการประมาณค่าความแปรปรวน กล่าวคือ พารามิเตอร์การกระจายของจุดสนใจ ดังนั้นเกณฑ์ F จึงเป็นเกณฑ์เชิงพาราเมตริก

ตันอิน มากกว่าความแปรปรวนของลักษณะเกิดจากตัวแปรที่ศึกษา (ปัจจัย) หรือการโต้ตอบของพวกมัน ยิ่งสูง ค่าเชิงประจักษ์ของเกณฑ์.

ศูนย์ สมมติฐานในการวิเคราะห์ความแปรปรวนจะบอกว่าค่าเฉลี่ยของคุณลักษณะที่มีประสิทธิภาพที่ศึกษาในการไล่ระดับทั้งหมดจะเท่ากัน

ทางเลือก สมมติฐานจะระบุว่าค่าเฉลี่ยของคุณลักษณะที่มีประสิทธิภาพในการไล่ระดับต่างๆ ของปัจจัยที่ศึกษานั้นแตกต่างกัน

การวิเคราะห์ความแปรปรวนช่วยให้เราสามารถระบุการเปลี่ยนแปลงในลักษณะ แต่ไม่ได้ระบุ ทิศทางการเปลี่ยนแปลงเหล่านี้

เริ่มการวิเคราะห์ความแปรปรวนกับกรณีที่ง่ายที่สุดเมื่อเราศึกษาการกระทำของ only หนึ่งตัวแปร (ปัจจัยเดียว)

2. การวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง

2.1. วัตถุประสงค์ของวิธีการ

วิธีการวิเคราะห์ความแปรปรวนแบบไม่มีตัวแปรใช้ในกรณีที่ศึกษาการเปลี่ยนแปลงในแอตทริบิวต์ที่มีประสิทธิภาพภายใต้อิทธิพลของสภาวะที่เปลี่ยนแปลงหรือการไล่ระดับของปัจจัยใดๆ ในเวอร์ชันของวิธีการนี้ อิทธิพลของการไล่ระดับของปัจจัยแต่ละอย่างคือ หลากหลายตัวอย่างวิชาที่สอบ ต้องมีปัจจัยอย่างน้อยสามระดับ (อาจมีการไล่ระดับสองระดับ แต่ในกรณีนี้ เราไม่สามารถสร้างการพึ่งพาแบบไม่เชิงเส้นได้ และดูเหมือนว่าจะมีเหตุผลมากกว่าที่จะใช้การขึ้นต่อกันที่ง่ายกว่า)

รูปแบบที่ไม่อิงพารามิเตอร์ของการวิเคราะห์ประเภทนี้คือการทดสอบ Kruskal-Wallis H

สมมติฐาน

H 0: ความแตกต่างระหว่างเกรดปัจจัย (เงื่อนไขที่แตกต่างกัน) จะไม่เด่นชัดมากไปกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม

H 1: ความแตกต่างระหว่างการไล่ระดับปัจจัย (เงื่อนไขที่ต่างกัน) มีความชัดเจนมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม

2.2. ข้อจำกัดของการวิเคราะห์ค่าความแปรปรวนแบบตัวแปรเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง

1. การวิเคราะห์ความแปรปรวนแบบเอกตัวแปรต้องมีการไล่ระดับปัจจัยอย่างน้อยสามครั้งและอย่างน้อยสองวิชาในการไล่ระดับแต่ละครั้ง

2. ลักษณะผลลัพธ์ต้องกระจายตามปกติในตัวอย่างการศึกษา

จริงอยู่ โดยปกติแล้วจะไม่ระบุว่าเรากำลังพูดถึงการแจกแจงคุณลักษณะในตัวอย่างที่สำรวจทั้งหมดหรือในส่วนนั้นที่ประกอบเป็นคอมเพล็กซ์การกระจาย

3. ตัวอย่างการแก้ปัญหาโดยวิธีการวิเคราะห์ความแปรปรวนของปัจจัยเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้องโดยใช้ตัวอย่าง:

สามกลุ่มที่แตกต่างกันจากหกวิชาได้รับรายการคำศัพท์สิบคำ นำเสนอคำต่อกลุ่มแรกในอัตราต่ำ 1 คำต่อ 5 วินาที กลุ่มที่สองในอัตราเฉลี่ย 1 คำต่อ 2 วินาที และกลุ่มที่สามในอัตราสูง 1 คำต่อวินาที ประสิทธิภาพการสืบพันธุ์ถูกคาดการณ์ว่าขึ้นอยู่กับความเร็วของการนำเสนอคำ ผลลัพธ์ถูกนำเสนอในตาราง หนึ่ง.

จำนวนคำที่ทำซ้ำ ตารางที่ 1

เลขเรื่อง

ความเร็วต่ำ

ความเร็วเฉลี่ย

ความเร็วสูง

ยอดรวม

H 0: ความแตกต่างของปริมาณคำ ระหว่างกลุ่มไม่เด่นชัดมากไปกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม

H1: ความแตกต่างของปริมาณคำ ระหว่างกลุ่มมีความเด่นชัดมากกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม โดยใช้ค่าทดลองที่แสดงในตาราง 1 เราจะสร้างค่าบางอย่างที่จำเป็นสำหรับการคำนวณเกณฑ์ F

การคำนวณปริมาณหลักสำหรับการวิเคราะห์ความแปรปรวนทางเดียวแสดงในตาราง:

ตารางที่ 2

ตารางที่ 3

ลำดับของการดำเนินการในการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ตัดการเชื่อมต่อ

ใช้บ่อยในตารางนี้และตารางต่อมา การกำหนด SS เป็นตัวย่อของ "ผลรวมของกำลังสอง" ตัวย่อนี้มักใช้ในแหล่งที่แปล

SS ข้อเท็จจริงหมายถึงความแปรปรวนของลักษณะอันเนื่องมาจากการกระทำของปัจจัยที่ศึกษา

SS ทั่วไป- ความแปรปรวนทั่วไปของลักษณะ

CA- ความแปรปรวนอันเนื่องมาจากปัจจัยที่ไม่ถูกนับ ความแปรปรวน "สุ่ม" หรือ "ความคงเหลือ"

นางสาว - "จตุรัสกลาง" หรือค่าเฉลี่ยของผลรวมของกำลังสอง ค่าเฉลี่ยของ SS ที่สอดคล้องกัน

df - จำนวนองศาอิสระซึ่งเมื่อพิจารณาเกณฑ์ที่ไม่ใช่พารามิเตอร์เราเขียนแทนด้วยตัวอักษรกรีก วี.

สรุป: H 0 ถูกปฏิเสธ ยอมรับ H1 แล้ว ความแตกต่างของปริมาณการสร้างคำระหว่างกลุ่มมีความชัดเจนมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม (α=0.05) ดังนั้นความเร็วในการนำเสนอคำจึงส่งผลต่อปริมาณการทำซ้ำ

ตัวอย่างของการแก้ปัญหาใน Excel แสดงไว้ด้านล่าง:

ข้อมูลเบื้องต้น:

การใช้คำสั่ง: Tools->Data Analysis->One-way analysis of variance เราได้ผลลัพธ์ดังต่อไปนี้:

วิชาคณิตศาสตร์

บทนำ

แนวคิดของการวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวนทางเดียว (การใช้งานจริงใน IBM SPSS Statistics 20)

การวิเคราะห์ความแปรปรวนทางเดียว (การใช้งานจริงใน Microsoft Office 2013)

บทสรุป

รายการแหล่งที่ใช้

บทนำ

ความเกี่ยวข้องของหัวข้อ การพัฒนาสถิติทางคณิตศาสตร์เริ่มต้นด้วยผลงานของนักคณิตศาสตร์ชาวเยอรมันชื่อ Carl Friedrich Gauss ในปี ค.ศ. 1795 และยังคงพัฒนาอยู่ ที่ การวิเคราะห์ทางสถิติมีวิธีการแบบพาราเมตริก "การวิเคราะห์ปัจจัยเดียวของความแปรปรวน" ปัจจุบันมีการใช้ในทางเศรษฐศาสตร์เมื่อทำการวิจัยตลาดเพื่อเปรียบเทียบผลลัพธ์ (เช่น เมื่อทำการสำรวจเกี่ยวกับการบริโภคผลิตภัณฑ์ในภูมิภาคต่างๆ ของประเทศ จำเป็นต้องสรุปว่าข้อมูลการสำรวจแตกต่างกันหรือทำมากน้อยเพียงใด ไม่แตกต่างกัน ในทางจิตวิทยา เมื่อทำการวิจัยประเภทต่าง ๆ ) เมื่อรวบรวมการทดสอบเชิงเปรียบเทียบทางวิทยาศาสตร์หรือค้นคว้าใด ๆ กลุ่มสังคมและสำหรับการแก้ปัญหาทางสถิติ

วัตถุประสงค์. ทำความคุ้นเคยกับวิธีการทางสถิติเช่นการวิเคราะห์ความแปรปรวนทางเดียวตลอดจนการใช้งานบนพีซีในโปรแกรมต่างๆ และเปรียบเทียบโปรแกรมเหล่านี้

เพื่อศึกษาทฤษฎีการวิเคราะห์ความแปรปรวนทางเดียว

เพื่อศึกษาโปรแกรมการแก้ปัญหาสำหรับการวิเคราะห์ปัจจัยเดียว

ใช้จ่าย การวิเคราะห์เปรียบเทียบโปรแกรมเหล่านี้

ความสำเร็จในการทำงาน: ภาคปฏิบัติผู้เขียนงานเสร็จสมบูรณ์: การเลือกโปรแกรม การเลือกงาน วิธีแก้ปัญหาบนพีซี หลังจากนั้นทำการวิเคราะห์เปรียบเทียบ ในส่วนทางทฤษฎี ได้ดำเนินการจำแนกกลุ่ม ANOVA งานนี้ได้รับการทดสอบเป็นรายงานในเซสชั่นวิทยาศาสตร์ของนักเรียน "คำถามที่เลือก คณิตศาสตร์ชั้นสูงและวิธีการสอนคณิตศาสตร์"

โครงสร้างและขอบเขตของงาน ผลงานประกอบด้วย บทนำ บทสรุป เนื้อหาและบรรณานุกรม รวม 4 เรื่อง ปริมาณงานรวม 25 หน้าที่พิมพ์ งานประกอบด้วย 1 ตัวอย่างแก้ไขโดย 2 โปรแกรม

แนวคิดของการวิเคราะห์ความแปรปรวน

บ่อยครั้งมีความจำเป็นต้องตรวจสอบอิทธิพลของตัวแปรอิสระ (ปัจจัย) อย่างน้อยหนึ่งตัวแปรต่อตัวแปรตามตั้งแต่หนึ่งตัวแปรขึ้นไป (คุณสมบัติผลลัพธ์) ปัญหาดังกล่าวสามารถแก้ไขได้โดยวิธีการวิเคราะห์ความแปรปรวน ซึ่งเขียนโดย R. Fisher

การวิเคราะห์ความแปรปรวน ANOVA เป็นชุดของวิธีการประมวลผลข้อมูลทางสถิติที่ช่วยให้คุณสามารถวิเคราะห์ความแปรปรวนของคุณลักษณะที่มีประสิทธิภาพอย่างน้อยหนึ่งอย่างภายใต้อิทธิพลของปัจจัยควบคุม (ตัวแปรอิสระ) ในที่นี้ ปัจจัยที่เข้าใจว่าเป็นค่าหนึ่งที่กำหนดคุณสมบัติของวัตถุหรือระบบที่กำลังศึกษา กล่าวคือ เหตุผลสำหรับผลลัพธ์สุดท้าย เมื่อทำการวิเคราะห์ความแปรปรวน สิ่งสำคัญคือต้องเลือกแหล่งที่มาและเป้าหมายของอิทธิพลที่เหมาะสม กล่าวคือ ระบุตัวแปรตามและตัวแปรอิสระ

ขึ้นอยู่กับสัญญาณของการจำแนกประเภท การแบ่งกลุ่มการวิเคราะห์ความแปรปรวนจะแตกต่างกันหลายกลุ่ม (ตารางที่ 1)

ตามจำนวนปัจจัยที่นำมาพิจารณา: การวิเคราะห์ตัวแปรเดียว - ศึกษาอิทธิพลของปัจจัยหนึ่ง การวิเคราะห์หลายตัวแปร - ศึกษาอิทธิพลพร้อมกันของปัจจัยตั้งแต่สองปัจจัยขึ้นไป โดยการปรากฏตัวของความเชื่อมโยงระหว่างตัวอย่างค่า: การวิเคราะห์ที่ไม่เกี่ยวข้อง (ต่างกัน) ) ตัวอย่าง - ดำเนินการเมื่อมีวัตถุวิจัยหลายกลุ่มตั้งอยู่ เงื่อนไขต่างๆ. (มีการตรวจสอบสมมติฐานว่าง H0: ค่าเฉลี่ยของตัวแปรตามเหมือนกันในสภาวะการวัดที่ต่างกัน กล่าวคือ ไม่ขึ้นกับปัจจัยที่ศึกษา) การวิเคราะห์ตัวอย่างที่เกี่ยวข้อง (เหมือนกัน) - ดำเนินการตั้งแต่สองตัวขึ้นไป การวัดจากวัตถุที่ศึกษากลุ่มเดียวกันภายใต้สภาวะที่ต่างกัน ในที่นี้ อิทธิพลของปัจจัยที่ยังไม่ได้พิจารณานั้นเป็นไปได้ ซึ่งอาจเกิดจากการเปลี่ยนแปลงเงื่อนไขอย่างไม่ถูกต้อง โดยจำนวนตัวแปรตามที่ได้รับผลจากปัจจัยต่างๆ การวิเคราะห์ตัวแปรเดียว (ANOVA หรือ AMCOVA - การวิเคราะห์ความแปรปรวนร่วม) - ตัวแปรตามหนึ่งตัวแปรได้รับผลกระทบจากปัจจัย การวิเคราะห์หลายตัวแปร (MANOVA - การวิเคราะห์หลายตัวแปรของความแปรปรวนหรือ MANCOVA - การวิเคราะห์ความแปรปรวนร่วมหลายตัวแปร) - ตัวแปรตามหลายตัวแปรได้รับผลกระทบจากปัจจัยต่างๆ ตามวัตถุประสงค์ของการศึกษา Deterministic - ระดับของปัจจัยทั้งหมดได้รับการแก้ไขล่วงหน้าและเป็นอิทธิพลของพวกเขา ที่ตรวจสอบแล้ว (สมมติฐาน H0 ถูกตรวจสอบเกี่ยวกับการไม่มีความแตกต่างระหว่างระดับเฉลี่ย) สุ่ม - ระดับของแต่ละปัจจัยจะได้รับเป็น สุ่มตัวอย่างจากประชากรทั่วไปของระดับปัจจัย (สมมติฐาน H0 กำลังถูกทดสอบว่าการกระจายตัวของค่าการตอบสนองเฉลี่ยที่คำนวณสำหรับระดับต่างๆ ของปัจจัยนั้นไม่เป็นศูนย์)

การวิเคราะห์ทางเดียวของการตรวจสอบความแปรปรวน นัยสำคัญทางสถิติความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างตั้งแต่สองกลุ่มขึ้นไปสำหรับสิ่งนี้ สมมติฐานถูกสร้างขึ้นในเบื้องต้น

สมมติฐานว่าง H0: ค่าเฉลี่ยของคุณสมบัติที่มีประสิทธิภาพในทุกเงื่อนไขของการกระทำของปัจจัย (หรือการไล่ระดับปัจจัย) จะเท่ากัน

สมมติฐานทางเลือก H1: ค่าเฉลี่ยของคุณลักษณะที่มีประสิทธิภาพในทุกสภาวะของปัจจัยนั้นแตกต่างกัน

วิธีการ ANOVA สามารถใช้กับประชากรที่มีการกระจายตามปกติ (การทดสอบแบบเปรียบเทียบหลายตัวแปรของการทดสอบแบบพารามิเตอร์) และกับประชากรที่ไม่มีการแจกแจงที่แน่ชัด ในกรณีแรก จำเป็นต้องกำหนดก่อนว่าการกระจายของคุณลักษณะที่ได้นั้นเป็นเรื่องปกติ ในการตรวจสอบความปกติของการแจกแจงคุณลักษณะ คุณสามารถใช้ตัวบ่งชี้ความไม่สมมาตร A = , , และความโด่ง E = , , ที่ไหน , . - มูลค่าของคุณสมบัติที่มีประสิทธิภาพและค่าเฉลี่ย - ส่วนเบี่ยงเบนมาตรฐานของคุณสมบัติผลลัพธ์ .

จำนวนการสังเกต;

ข้อผิดพลาดในการเป็นตัวแทนสำหรับตัวบ่งชี้ A และ E

หากตัวบ่งชี้ความเบ้และความโด่งไม่เกินข้อผิดพลาดในการเป็นตัวแทนมากกว่า 3 ครั้งเช่น แต่<3тА и Е <3тЕ, то распределение можно считать нормальным. Для нормальных распределений показатели А и Е равны нулю.

ข้อมูลที่เกี่ยวข้องกับเงื่อนไขหนึ่งของปัจจัย (หนึ่งการไล่ระดับ) เรียกว่าการกระจายตัวเชิงซ้อน เมื่อทำการวิเคราะห์ความแปรปรวน ควรสังเกตความเท่าเทียมกันของการกระจายตัวระหว่างสารเชิงซ้อน ในกรณีนี้ การเลือกองค์ประกอบควรดำเนินการแบบสุ่ม

ในกรณีที่สอง เมื่อกลุ่มตัวอย่างมีการแจกแจงตามอำเภอใจ จะใช้แอนะล็อกแบบไม่อิงพารามิเตอร์ (อันดับ) ของการวิเคราะห์ความแปรปรวนทางเดียว (เกณฑ์ Kruskal-Wallis ฟรีดแมน)

พิจารณาภาพประกอบกราฟิกของการพึ่งพาอัตราผลตอบแทนของหุ้นต่อสถานะของเศรษฐกิจของประเทศ (รูปที่ 1, a) ในที่นี้ ปัจจัยที่อยู่ระหว่างการศึกษาคือระดับของสภาวะเศรษฐกิจ (ให้แม่นยำกว่าคือ สามระดับของรัฐ) และคุณลักษณะที่มีประสิทธิภาพคืออัตราผลตอบแทน การกระจายข้างต้นแสดงให้เห็นว่าปัจจัยนี้มีผลกระทบอย่างมากต่อความสามารถในการทำกำไร กล่าวคือ เมื่อเศรษฐกิจดีขึ้น ผลตอบแทนของหุ้นก็เช่นกัน ซึ่งไม่ขัดต่อสามัญสำนึก

โปรดทราบว่าปัจจัยที่เลือกมีการไล่ระดับ กล่าวคือ ค่าของมันเปลี่ยนไปในระหว่างการเปลี่ยนจากการไล่ระดับหนึ่งไปอีกระดับหนึ่ง (จากสถานะเศรษฐกิจหนึ่งไปอีกสถานะหนึ่ง)

ข้าว. 1. อัตราส่วนของอิทธิพลของปัจจัยและการแพร่กระจายภายในกลุ่ม: a - อิทธิพลที่สำคัญของปัจจัย; b - อิทธิพลเล็กน้อยของปัจจัย

กลุ่มของการไล่ระดับของปัจจัยเป็นเพียงกรณีพิเศษ นอกจากนี้ ปัจจัยยังสามารถแสดงการไล่ระดับได้แม้ในระดับเล็กน้อย ดังนั้นบ่อยครั้งที่พวกเขาไม่ได้พูดถึงการไล่ระดับของปัจจัย แต่เกี่ยวกับเงื่อนไขต่างๆ ของการกระทำของมัน

ตอนนี้ให้เราพิจารณาแนวคิดของการวิเคราะห์ความแปรปรวนซึ่งอยู่บนพื้นฐานของกฎการบวกความแปรปรวน: ความแปรปรวนทั้งหมดเท่ากับผลรวมของระหว่างกลุ่มและค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:

ความแปรปรวนรวมที่เกิดจากอิทธิพลของปัจจัยทั้งหมด

การกระจายตัวระหว่างกลุ่มเนื่องจากอิทธิพลของปัจจัยอื่นๆ ทั้งหมด

ความแปรปรวนภายในกลุ่มโดยเฉลี่ยที่เกิดจากอิทธิพลของแอตทริบิวต์การจัดกลุ่ม

อิทธิพลของลักษณะที่จัดกลุ่มจะเห็นได้ชัดเจนในรูปที่ 1a เนื่องจากอิทธิพลของปัจจัยมีความสำคัญเมื่อเทียบกับการกระจายภายในกลุ่ม ดังนั้น ความแปรปรวนระหว่างกลุ่มจะมากกว่ากลุ่มภายใน 1 ( > ) และในรูป 1, b, ภาพตรงข้ามถูกสังเกต: ที่นี่การแพร่กระจายภายในกลุ่มมีชัยและอิทธิพลของปัจจัยนั้นแทบไม่มีเลย

การวิเคราะห์ความแปรปรวนสร้างขึ้นบนหลักการเดียวกัน ไม่ใช้ความแปรปรวน แต่เป็นค่าเฉลี่ยของค่าเบี่ยงเบนกำลังสอง ( , , ) ซึ่งเป็นค่าประมาณที่ไม่เอนเอียงของความแปรปรวนที่สอดคล้องกัน ได้จากการหารผลรวมของการเบี่ยงเบนกำลังสองด้วยจำนวนองศาอิสระที่สอดคล้องกัน

รวมทั้งหมด;

ค่าเฉลี่ยภายในกลุ่ม

ค่าเฉลี่ยระหว่างกลุ่ม

ค่าเฉลี่ยโดยรวมสำหรับการวัดทั้งหมด (สำหรับทุกกลุ่ม);

ค่าเฉลี่ยกลุ่มสำหรับการไล่ระดับ j-th ของปัจจัย

ความคาดหวังทางคณิตศาสตร์สำหรับผลรวมระหว่างกลุ่มและส่วนเบี่ยงเบนกำลังสองตามลำดับ คำนวณโดยสูตร: (แบบจำลองปัจจัยคงที่),

.

อี ( ) = อี ( ) = จากนั้น สมมติฐานว่าง H0 เกี่ยวกับการไม่มีความแตกต่างระหว่างวิธีการจะได้รับการยืนยัน ดังนั้น ปัจจัยที่อยู่ระหว่างการศึกษาจึงไม่มีผลกระทบอย่างมีนัยสำคัญ (ดูรูปที่ 1, b) ถ้าค่าจริงของ Fisher's F-test F= E ( ) /E ( ) จะยิ่งใหญ่กว่าวิกฤต แล้วสมมติฐานว่าง H0 ที่ระดับนัยสำคัญ , สมมติฐานทางเลือก H1 ถูกปฏิเสธและยอมรับ - เกี่ยวกับผลกระทบที่สำคัญของปัจจัย รูปที่ 1, ก. .

การวิเคราะห์ความแปรปรวนทางเดียว

การวิเคราะห์ความแปรปรวนที่พิจารณาตัวแปรเดียวเท่านั้นเรียกว่าการวิเคราะห์ความแปรปรวนทางเดียว

มีกลุ่มของ n วัตถุของการสังเกตที่มีค่าที่วัดได้ของตัวแปรบางตัวที่กำลังศึกษาอยู่ . ต่อตัวแปร ได้รับอิทธิพลจากปัจจัยด้านคุณภาพบางอย่าง กับหลายๆ ระดับ (การไล่ระดับ) ของผลกระทบ ค่าตัวแปรที่วัดได้ ในระดับต่างๆ ของปัจจัย แสดงไว้ในตารางที่ 2 (สามารถนำเสนอในรูปแบบเมทริกซ์ได้ด้วย)

ตารางที่ 2

รูปแบบตารางของการระบุข้อมูลเริ่มต้นสำหรับการวิเคราะห์แบบไม่แปรผัน

วัตถุสังเกตการณ์หมายเลข ()ค่าตัวแปร ที่ระดับ (การไล่ระดับ) ของปัจจัย (ต่ำสุด) (สั้น)… (สูงสุด)1 2 … n .ที่นี่แต่ละระดับสามารถมีจำนวนการตอบสนองที่แตกต่างกันที่วัดได้ที่ระดับหนึ่งของปัจจัย จากนั้นแต่ละคอลัมน์จะมีค่าของตัวเอง . จำเป็นต้องประเมินความสำคัญของอิทธิพลของปัจจัยนี้ที่มีต่อตัวแปรที่กำลังศึกษา เพื่อแก้ปัญหานี้ สามารถใช้แบบจำลองปัจจัยเดียวของการวิเคราะห์ความแปรปรวนได้ แบบจำลองการกระจายตัวแบบปัจจัยเดียว

ค่าของตัวแปรที่กำลังศึกษาสำหรับวัตถุที่ - ของการสังเกตที่ - ระดับของปัจจัย;

ค่าเฉลี่ยของกลุ่มสำหรับ - ระดับของปัจจัย;

ผลกระทบเนื่องจากอิทธิพลของปัจจัยระดับ -th;

ส่วนประกอบแบบสุ่มหรือสิ่งรบกวนที่เกิดจากอิทธิพลของปัจจัยที่ควบคุมไม่ได้ เรามาเน้นถึงข้อจำกัดหลักของการใช้ ANOVA:

ความเท่าเทียมกันเป็นศูนย์ของความคาดหวังทางคณิตศาสตร์ขององค์ประกอบสุ่ม: = 0.

สุ่มส่วนประกอบ และด้วยเหตุนี้ด้วย มีการแจกแจงแบบปกติ

จำนวนการไล่ระดับของปัจจัยต้องมีอย่างน้อยสาม

โมเดลนี้ ขึ้นอยู่กับระดับของปัจจัย โดยใช้ Fisher F-test ให้คุณทดสอบหนึ่งในสมมติฐานว่าง

เมื่อทำการวิเคราะห์ความแปรปรวนสำหรับตัวอย่างที่เกี่ยวข้อง เป็นไปได้ที่จะทดสอบสมมติฐานว่าง H0(u) อื่น - ความแตกต่างส่วนบุคคลระหว่างวัตถุของการสังเกตจะแสดงไม่เกินความแตกต่างเนื่องจากเหตุผลแบบสุ่ม

การวิเคราะห์ความแปรปรวนทางเดียว

(การใช้งานจริงใน IBM SPSS Statistics 20)

ผู้วิจัยมีความสนใจในคำถามว่าคุณลักษณะบางอย่างเปลี่ยนแปลงไปอย่างไรภายใต้เงื่อนไขต่างๆ ของการกระทำของตัวแปร (ปัจจัย) มีการศึกษาผลกระทบของตัวแปร (ปัจจัย) เพียงตัวเดียวต่อลักษณะที่ศึกษา เราได้พิจารณาตัวอย่างจากเศรษฐศาสตร์แล้ว ตอนนี้เราจะยกตัวอย่างจากจิตวิทยา เช่น เวลาในการแก้ปัญหาเปลี่ยนแปลงอย่างไรภายใต้เงื่อนไขแรงจูงใจที่แตกต่างกันของวิชา (แรงจูงใจต่ำ ปานกลาง สูง) หรือด้วยวิธีต่างๆ การนำเสนองาน (ด้วยวาจา เป็นลายลักษณ์อักษรหรือในรูปแบบของข้อความที่มีกราฟและภาพประกอบ) ในสภาพการทำงานที่แตกต่างกัน (คนเดียว ในห้องกับครู ในห้องเรียน) ในกรณีแรก ปัจจัยคือแรงจูงใจ ประการที่สอง - ระดับการมองเห็น ประการที่สาม - ปัจจัยของการประชาสัมพันธ์

ในเวอร์ชันของวิธีการนี้ ตัวอย่างต่างๆ ของอาสาสมัครจะได้รับอิทธิพลจากการไล่ระดับแต่ละระดับ ต้องมีปัจจัยอย่างน้อยสามระดับ

ตัวอย่างที่ 1 สามกลุ่มที่แตกต่างกันหกวิชาได้รับรายชื่อสิบคำ นำเสนอคำต่อกลุ่มแรกในอัตราต่ำ 1 คำต่อ 5 วินาที กลุ่มที่สองในอัตราเฉลี่ย 1 คำต่อ 2 วินาที และกลุ่มที่สามในอัตราสูง 1 คำต่อวินาที คาดการณ์ว่าประสิทธิภาพของการทำสำเนาจะขึ้นอยู่กับความเร็วของการนำเสนอคำ (ตารางที่ 3)

ตารางที่ 3

จำนวนคำที่ทำซ้ำ

กลุ่มวิชาที่ 1 ความเร็วต่ำ กลุ่มที่ 2 ความเร็วปานกลาง กลุ่มที่ 3 ความเร็วสูง

เราตั้งสมมติฐาน: ความแตกต่างในปริมาณของการสร้างคำระหว่างกลุ่มจะไม่เด่นชัดมากไปกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม: ความแตกต่างในการทำซ้ำคำระหว่างกลุ่มมีความชัดเจนมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม

เราจะดำเนินการแก้ไขในสภาพแวดล้อม SPSS ตามอัลกอริทึมต่อไปนี้

มาเรียกใช้โปรแกรม SPSS กันเถอะ

ป้อนค่าตัวเลขในหน้าต่าง ข้อมูล

ข้าว. 1. การป้อนค่าใน SPSS

ในหน้าต่าง ตัวแปร เราอธิบายข้อมูลเริ่มต้นทั้งหมดตามเงื่อนไข

งาน

รูปที่ 2 หน้าต่างตัวแปร

เพื่อความชัดเจน ในคอลัมน์ป้ายกำกับ เราอธิบายชื่อตาราง

ในกราฟ ค่านิยม อธิบายจำนวนของแต่ละกลุ่ม

รูปที่ 3 ป้ายค่า

ทั้งหมดนี้ทำเพื่อความชัดเจน กล่าวคือ การตั้งค่าเหล่านี้สามารถละเว้นได้

ในกราฟ มาตราส่วน ในคอลัมน์ที่สองคุณต้องใส่ค่าของชื่อ

ในหน้าต่าง ข้อมูล สั่งซื้อการวิเคราะห์ความแปรปรวนทางเดียวโดยใช้เมนู "การวิเคราะห์" การเปรียบเทียบโดยเฉลี่ย

การวิเคราะห์ความแปรปรวนทางเดียว…

รูปที่ 4 ฟังก์ชัน ANOVA ทางเดียว

ในกล่องโต้ตอบที่เปิดขึ้น การวิเคราะห์ความแปรปรวนทางเดียว เลือกตัวแปรตามและเพิ่มลงใน รายชื่อผู้อยู่ในอุปการะ และปัจจัยตัวแปรในปัจจัยหน้าต่าง

รูปที่ 5 เน้นรายการผู้อยู่ในอุปการะและปัจจัย

ตั้งค่าพารามิเตอร์บางอย่างสำหรับเอาต์พุตข้อมูลคุณภาพสูง

รูปที่ 6 พารามิเตอร์สำหรับการอนุมานข้อมูลเชิงคุณภาพ

การคำนวณสำหรับอัลกอริธึม ANOVA แบบทางเดียวที่เลือกจะเริ่มขึ้นหลังจากคลิก ตกลง

เมื่อสิ้นสุดการคำนวณ ผลลัพธ์ของการคำนวณจะแสดงในหน้าต่างการดู

กลุ่มสถิติเชิงพรรณนา NAverage มาตรฐาน เบี่ยงเบนมาตรฐาน ช่วงความเชื่อมั่น Error95% สำหรับค่าเฉลี่ย ค่าต่ำสุด สูงสุด ตารางที่ 2. สถิติพรรณนา

ตารางสถิติเชิงพรรณนาแสดงตัวบ่งชี้หลักสำหรับความเร็วในกลุ่มและค่ารวม

จำนวนการสังเกตในแต่ละกลุ่มและทั้งหมด

ค่าเฉลี่ย - ค่าเฉลี่ยเลขคณิตของการสังเกตในแต่ละกลุ่มและสำหรับทุกกลุ่มเข้าด้วยกัน

มาตรฐาน เบี่ยงเบนมาตรฐาน ข้อผิดพลาด - ส่วนเบี่ยงเบนมาตรฐานและส่วนเบี่ยงเบนมาตรฐาน

% ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย - ช่วงเหล่านี้มีความแม่นยำมากขึ้นสำหรับแต่ละกลุ่มและสำหรับทุกกลุ่มรวมกัน แทนที่จะใช้ช่วงเวลาต่ำกว่าหรือสูงกว่าขีดจำกัดเหล่านี้

ต่ำสุด, สูงสุด - ค่าต่ำสุดและสูงสุดสำหรับแต่ละกลุ่มที่วิชาที่ได้ยิน

สุ่มความแปรปรวนปัจจัยเดียว

เกณฑ์ความเป็นเนื้อเดียวกันของความแปรปรวนgroup สถิติ Livinast.st.1st.st.

การทดสอบความเป็นเนื้อเดียวกันของ Livin ใช้เพื่อทดสอบการกระจายตัวของความเป็นเนื้อเดียวกัน (ความเป็นเนื้อเดียวกัน) ในกรณีนี้ เป็นการยืนยันถึงความไม่สำคัญของความแตกต่างระหว่างความแปรปรวน เนื่องจากค่า = 0.915 นั่นคือ มากกว่า 0.05 อย่างชัดเจน ดังนั้นผลลัพธ์ที่ได้จากการวิเคราะห์ความแปรปรวนจึงถือว่าถูกต้อง

ตารางการวิเคราะห์ความแปรปรวนแบบ 1 ทางแสดงผลของ DA . ทางเดียว

ผลรวมของกำลังสอง "ระหว่างกลุ่ม" คือผลรวมของกำลังสองของผลต่างระหว่างค่าเฉลี่ยโดยรวมกับค่าเฉลี่ยในแต่ละกลุ่ม ถ่วงน้ำหนักด้วยจำนวนวัตถุในกลุ่ม

"ภายในกลุ่ม" คือผลรวมของผลต่างกำลังสองระหว่างค่าเฉลี่ยของแต่ละกลุ่มกับแต่ละค่าของกลุ่มนั้น

คอลัมน์ "เซนต์เซนต์" มีจำนวนองศาอิสระ V:

ระหว่างกลุ่ม (v=จำนวนกลุ่ม - 1);

ภายในกลุ่ม (v=จำนวนวัตถุ - จำนวนกลุ่ม - 1);

"ค่าเฉลี่ยกำลังสอง" ประกอบด้วยอัตราส่วนของผลรวมของกำลังสองต่อจำนวนองศาอิสระ

คอลัมน์ "F" แสดงอัตราส่วนของค่าเฉลี่ยกำลังสองระหว่างกลุ่มกับค่าเฉลี่ยกำลังสองภายในกลุ่ม

คอลัมน์ "ค่า" ประกอบด้วยค่าความน่าจะเป็นที่ความแตกต่างที่สังเกตได้นั้นเป็นแบบสุ่ม

ตารางที่ 4 สูตร

กราฟค่าเฉลี่ย

กราฟแสดงว่ากำลังลดลง นอกจากนี้ยังสามารถกำหนดได้จากตาราง Fk k1=2, k2=15 ค่าตารางของสถิติคือ 3.68 ตามกฎ ถ้า จากนั้นจึงยอมรับสมมติฐานว่าง มิฉะนั้นจะยอมรับสมมติฐานทางเลือก สำหรับตัวอย่างของเรา (7.45>3.68) ดังนั้นจึงยอมรับสมมติฐานทางเลือก ดังนั้น เมื่อกลับสู่สภาวะของปัญหา เราสามารถสรุปสมมติฐานว่างได้ ปฏิเสธและยอมรับทางเลือกอื่น : ความแตกต่างของปริมาณคำระหว่างกลุ่มมีความเด่นชัดมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม ). ที่. ความเร็วในการนำเสนอคำส่งผลต่อปริมาณการทำซ้ำ

การวิเคราะห์ความแปรปรวนทางเดียว

(การใช้งานจริงใน Microsoft Office 2013)

ในตัวอย่างเดียวกัน ให้พิจารณาการวิเคราะห์ความแปรปรวนทางเดียวใน Microsoft Office 2013

การแก้ปัญหาใน Microsoft Excel

มาเปิด Microsoft Excel กันเถอะ


รูปที่ 1. การเขียนข้อมูลไปยัง Excel

มาแปลงข้อมูลเป็น รูปแบบตัวเลข. ในการทำเช่นนี้บนแท็บหลักจะมีรายการ รูปแบบ และมีวรรคย่อย รูปแบบเซลล์ . หน้าต่าง Format Cells จะปรากฏขึ้นบนหน้าจอ ข้าว. 2 เลือก รูปแบบตัวเลข และข้อมูลที่ป้อนจะถูกแปลง ดังแสดงในรูปที่ 3

รูปที่ 2 แปลงเป็นรูปแบบตัวเลข

รูปที่ 3 ผลลัพธ์หลังการแปลง

บนแท็บข้อมูลมีรายการ การวิเคราะห์ข้อมูล คลิกที่มัน

มาเลือกการวิเคราะห์ความแปรปรวนทางเดียว

รูปที่ 6 การวิเคราะห์ข้อมูล

หน้าต่างการวิเคราะห์ความแปรปรวนทางเดียวจะปรากฏบนหน้าจอเพื่อทำการวิเคราะห์ข้อมูลแบบกระจาย (รูปที่ 7) มากำหนดค่าพารามิเตอร์กันเถอะ

ข้าว. 7 การตั้งค่าพารามิเตอร์สำหรับการวิเคราะห์ตัวแปรเดียว

คลิกเมาส์ในช่องช่วงการป้อนข้อมูล เลือกช่วงของเซลล์ B2::F9 ซึ่งเป็นข้อมูลที่คุณต้องการวิเคราะห์ ในฟิลด์ Input Spacing ของกลุ่มควบคุม Inputs ช่วงที่ระบุจะปรากฏขึ้น

ถ้าไม่ได้ตั้งค่าสวิตช์แบบทีละแถวในกลุ่มควบคุมการป้อนข้อมูล ให้เลือกเพื่อให้โปรแกรม Excel ยอมรับกลุ่มข้อมูลทีละแถว

ทางเลือก เลือกกล่องกาเครื่องหมายป้ายกำกับในแถวแรกในกลุ่มตัวควบคุมอินพุต ถ้าคอลัมน์แรกของช่วงข้อมูลที่เลือกมีชื่อแถว

ในฟิลด์อินพุตอัลฟ่าของกลุ่มควบคุมข้อมูลอินพุต โดยค่าเริ่มต้น ค่า 0.05 จะแสดงขึ้น ซึ่งสัมพันธ์กับความน่าจะเป็นของข้อผิดพลาดในการวิเคราะห์ความแปรปรวน

หากไม่ได้ตั้งค่าสวิตช์ช่วงเอาต์พุตในกลุ่มตัวควบคุมพารามิเตอร์เอาต์พุต ให้ตั้งค่าหรือเลือกสวิตช์เวิร์กชีตใหม่เพื่อให้ข้อมูลถูกถ่ายโอนไปยังแผ่นงานใหม่

คลิกปุ่ม OK เพื่อปิดหน้าต่าง One-Way ANOVA ผลการวิเคราะห์ความแปรปรวนจะปรากฏขึ้น (รูปที่ 8)

รูปที่ 8 เอาท์พุทข้อมูล

ในช่วงของเซลล์ A4:E7 คือผลลัพธ์ สถิติเชิงพรรณนา. บรรทัดที่ 4 ประกอบด้วยชื่อของพารามิเตอร์ บรรทัดที่ 5 - 7 - ค่าทางสถิติคำนวณโดยแบทช์ ในคอลัมน์ "บัญชี" คือจำนวนการวัด ในคอลัมน์ "ผลรวม" - ผลรวมของค่า ในคอลัมน์ "เฉลี่ย" - ค่าเฉลี่ย ค่าเลขคณิต, ในคอลัมน์ "การกระจาย" - การกระจายตัว

ผลลัพธ์ที่ได้แสดงว่าโหลดทำลายเฉลี่ยสูงสุดอยู่ในกลุ่มที่ 1 และการกระจายตัวที่ใหญ่ที่สุดของภาระการแตกหักอยู่ในกลุ่มที่ 2 ลำดับที่ 1

ช่วงของเซลล์ A10:G15 แสดงข้อมูลเกี่ยวกับความสำคัญของความคลาดเคลื่อนระหว่างกลุ่มข้อมูล บรรทัดที่ 11 ประกอบด้วยชื่อของการวิเคราะห์พารามิเตอร์ความแปรปรวน บรรทัดที่ 12 - ผลลัพธ์ของการประมวลผลระหว่างกลุ่ม บรรทัดที่ 13 - ผลลัพธ์ของการประมวลผลภายในกลุ่ม และบรรทัดที่ 15 - ผลรวมของค่าของสองบรรทัดนี้

คอลัมน์ SS มีค่าความผันแปร กล่าวคือ ผลรวมของกำลังสองส่วนเบี่ยงเบนทั้งหมด การเปลี่ยนแปลง เช่น การกระจาย กำหนดลักษณะการแพร่กระจายของข้อมูล

คอลัมน์ df มีค่าของจำนวนองศาอิสระ ตัวเลขเหล่านี้ระบุจำนวนการเบี่ยงเบนอิสระที่จะคำนวณความแปรปรวน ตัวอย่างเช่น จำนวนระดับความเป็นอิสระระหว่างกลุ่มเท่ากับความแตกต่างระหว่างจำนวนกลุ่มข้อมูลกับหนึ่งกลุ่ม ยังไง จำนวนมากขึ้นองศาความเป็นอิสระยิ่งความน่าเชื่อถือของพารามิเตอร์การกระจายตัวสูงขึ้น ข้อมูลระดับความเป็นอิสระในตารางแสดงให้เห็นว่าผลลัพธ์ภายในกลุ่มมีความน่าเชื่อถือมากกว่าพารามิเตอร์ระหว่างกลุ่ม

คอลัมน์ MS มีค่าการกระจาย ซึ่งกำหนดโดยอัตราส่วนของการแปรผันและจำนวนองศาอิสระ การกระจายเป็นตัวกำหนดระดับความกระจัดกระจายของข้อมูล แต่ต่างจากขนาดของความผันแปร มันไม่มีแนวโน้มโดยตรงที่จะเพิ่มขึ้นตามจำนวนองศาอิสระที่เพิ่มขึ้น ตารางแสดงให้เห็นว่าความแปรปรวนระหว่างกลุ่มมากกว่าความแปรปรวนภายในกลุ่มมาก

คอลัมน์ F มีค่าของสถิติ F ซึ่งคำนวณโดยอัตราส่วนของความแปรปรวนระหว่างกลุ่มและความแปรปรวนภายในกลุ่ม

คอลัมน์ F-critical ประกอบด้วยค่า F-critical ที่คำนวณจากจำนวนองศาอิสระและค่าของ Alpha ค่าสถิติ F และค่าวิกฤต F ใช้การทดสอบ Fisher-Snedekor

หากสถิติ F มากกว่าค่าวิกฤต F ก็สามารถโต้แย้งได้ว่าความแตกต่างระหว่างกลุ่มข้อมูลนั้นไม่ใช่แบบสุ่ม เหล่านั้น. ในระดับความสำคัญ α = 0 .05 (ด้วยความน่าเชื่อถือที่ 0.95) สมมติฐานว่างถูกปฏิเสธและยอมรับทางเลือกอื่น: ความเร็วในการนำเสนอคำส่งผลต่อปริมาณการทำซ้ำ คอลัมน์ค่า P มีความน่าจะเป็นที่ความแตกต่างระหว่างกลุ่มเป็นแบบสุ่ม เนื่องจากความน่าจะเป็นนี้มีน้อยมากในตาราง ความเบี่ยงเบนระหว่างกลุ่มจึงไม่สุ่ม

การเปรียบเทียบ IBM SPSS Statistics 20 และ Microsoft Office 2013

โปรแกรมสุ่มความแปรปรวนปัจจัยเดียว

ลองดูผลลัพธ์ของโปรแกรมสำหรับสิ่งนี้เราจะดูที่ภาพหน้าจออีกครั้ง

การวิเคราะห์ทางเดียวของกลุ่มความแปรปรวน ผลรวมของกำลังสอง St.Lm Mean Square FZn ระหว่างกลุ่ม31.444215.7227.447.006 ภายในกลุ่ม31.667152.111รวม63.11117

ดังนั้นโปรแกรม IBM SPSS Statistics 20 จึงมีคะแนนที่ดีกว่า ปัดเศษตัวเลข สร้าง กราฟภาพ(ซม. โซลูชั่นที่สมบูรณ์) ซึ่งคุณสามารถกำหนดคำตอบได้ โดยจะอธิบายรายละเอียดเพิ่มเติมทั้งเงื่อนไขของปัญหาและวิธีแก้ไข Microsoft Office 2013 มีข้อดี ประการแรก แน่นอนว่ามีความแพร่หลาย เนื่องจาก Microsoft Office 2013 ได้รับการติดตั้งในคอมพิวเตอร์แทบทุกเครื่อง จึงแสดง Fcritical ซึ่งไม่มีอยู่ใน SPSS Statistics และยังง่ายต่อการคำนวณ ถึงกระนั้น โปรแกรมทั้งสองนี้เหมาะอย่างยิ่งสำหรับการแก้ปัญหาสำหรับการวิเคราะห์ความแปรปรวนทางเดียว ซึ่งแต่ละโปรแกรมก็มีข้อดีและข้อเสียต่างกันไป แต่ถ้าคุณนับ งานใหญ่ด้วยเงื่อนไขเพิ่มเติมจะแนะนำสถิติ SPSS

บทสรุป

การวิเคราะห์ความแปรปรวนถูกนำไปใช้ในทุกพื้นที่ การวิจัยทางวิทยาศาสตร์ซึ่งจำเป็นต้องวิเคราะห์อิทธิพล ปัจจัยต่างๆให้กับตัวแปรที่กำลังศึกษา ที่ โลกสมัยใหม่มีงานหลายอย่างสำหรับการวิเคราะห์ปัจจัยเดียวของความแปรปรวนทางเศรษฐศาสตร์ จิตวิทยา และชีววิทยา เป็นผลจากการเรียน วัสดุทางทฤษฎีพบว่าพื้นฐานของการวิเคราะห์ความแปรปรวนเป็นทฤษฎีบทเกี่ยวกับการเพิ่มความแปรปรวนจากแพ็คเกจซอฟต์แวร์จำนวนมากที่มีการนำเครื่องมือของการวิเคราะห์ความแปรปรวนมาใช้ซึ่งสิ่งที่ดีที่สุดได้รับการคัดเลือกและรวมไว้ในงาน ด้วยการถือกำเนิดของเทคโนโลยีใหม่ เราแต่ละคนสามารถดำเนินการวิจัย (การตัดสินใจ) ในขณะที่ใช้เวลาและความพยายามในการคำนวณน้อยลงโดยใช้คอมพิวเตอร์ ในกระบวนการทำงาน มีการกำหนดเป้าหมาย งานที่ทำสำเร็จ

รายชื่อวรรณกรรม

ซิโดเรนโก อี.วี. วิธีการ การประมวลผลทางคณิตศาสตร์ในทางจิตวิทยา [ข้อความ] / เซนต์ปีเตอร์สเบิร์ก 2554. - 256 น.

สถิติทางคณิตศาสตร์สำหรับนักจิตวิทยา Ermolaev O.Yu [ข้อความ] / Moscow_2009 -336s

การบรรยาย 7. สถิติการวิเคราะห์ [ ทรัพยากรอิเล็กทรอนิกส์]. , วันที่เข้าถึง: 05/14/14

ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ [ข้อความ] / Gmurman V.E. 2010 -479s