แนวคิดเรื่อง heteroscedasticity ของเศษเหลือในแบบจำลองการถดถอย Heteroskedasticity ของสารตกค้างแบบสุ่ม

ความต่าง

ข้อผิดพลาดแบบสุ่มคือค่าเบี่ยงเบนในแบบจำลองเชิงเส้น การถดถอยพหุคูณ:

εi=yi–β0–β1x1i–…–βmxmi

เนื่องจากค่า ข้อผิดพลาดแบบสุ่มแบบจำลองการถดถอยเป็นปริมาณที่ไม่รู้จักคำนวณ การประเมินตัวอย่างข้อผิดพลาดแบบสุ่มของตัวแบบการถดถอยตามสูตร:

โดยที่ ei คือเศษเหลือของตัวแบบการถดถอย

คำว่า heteroskedasticity ใน ความหมายกว้างเป็นที่เข้าใจกันว่าเป็นการสันนิษฐานเกี่ยวกับความแปรปรวนของข้อผิดพลาดแบบสุ่มของตัวแบบการถดถอย

เมื่อสร้างแบบจำลองการถดถอยเชิงเส้นปกติ เราคำนึงถึง เงื่อนไขดังต่อไปนี้เกี่ยวกับข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอย:

6) การคาดการณ์ทางคณิตศาสตร์ของข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอยเป็นศูนย์ในการสังเกตทั้งหมด:

7) ความแปรปรวนของความคลาดเคลื่อนแบบสุ่มของแบบจำลองการถดถอยเป็นค่าคงที่สำหรับการสังเกตทั้งหมด:

8) ไม่มีความสัมพันธ์ที่เป็นระบบระหว่างค่าของข้อผิดพลาดแบบสุ่มของตัวแบบการถดถอยในการสังเกตสองครั้งใด ๆ นั่นคือข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอยไม่มีความสัมพันธ์กัน (ความแปรปรวนร่วมของข้อผิดพลาดแบบสุ่มของการสังเกตสองแบบที่แตกต่างกัน เป็นศูนย์):

เงื่อนไขที่สอง

หมายถึง homoscedasticity (การกระจายที่เป็นเนื้อเดียวกัน) ของความแปรปรวนข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอย

Hoscedasticity เป็นที่เข้าใจกันว่าเป็นการสันนิษฐานว่ารู้จักความแปรปรวนของข้อผิดพลาดแบบสุ่ม βi ค่าคงที่สำหรับการสังเกตทั้งหมด

แต่ในทางปฏิบัติ ข้อสันนิษฐานของ homoscedasticity ของข้อผิดพลาดแบบสุ่ม βi หรือเศษเหลือของแบบจำลองการถดถอย ei ไม่เป็นที่พอใจเสมอไป

ภายใต้ heteroscedasticity (heteroscedasticity - การกระจายไม่สม่ำเสมอ) เป็นที่เข้าใจกันว่าสมมติฐานที่ว่าความแปรปรวนของข้อผิดพลาดแบบสุ่มเป็นค่าที่แตกต่างกันสำหรับการสังเกตทั้งหมดซึ่งหมายถึงการละเมิดเงื่อนไขที่สองของแบบจำลองเชิงเส้นปกติของการถดถอยพหุคูณ:

Heteroscedasticity สามารถเขียนได้ในรูปของเมทริกซ์ความแปรปรวนร่วมข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอย:

จากนั้นสามารถโต้แย้งได้ว่าข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอย βi เป็นไปตามกฎการแจกแจงแบบปกติโดยไม่มีความคาดหวังทางคณิตศาสตร์และความแปรปรวน G2Ω:

โดยที่ Ω คือเมทริกซ์ความแปรปรวนร่วมของข้อผิดพลาดแบบสุ่ม

หากความแปรปรวนของข้อผิดพลาดแบบสุ่ม

แบบจำลองการถดถอยเป็นที่ทราบล่วงหน้า จากนั้นปัญหาของ heteroscedasticity จะถูกขจัดออกอย่างง่ายดาย อย่างไรก็ตาม ในกรณีส่วนใหญ่ ไม่เพียงไม่ทราบความแปรปรวนของข้อผิดพลาดแบบสุ่มเท่านั้น แต่ยังไม่ทราบถึงฟังก์ชันของการพึ่งพาการถดถอย y=f(x) ซึ่งจะต้องสร้างและประเมินผล

เพื่อตรวจหา heteroscedasticity ของแบบจำลองการถดถอยที่เหลือ จำเป็นต้องวิเคราะห์พวกมัน ในกรณีนี้ มีการทดสอบสมมติฐานต่อไปนี้

สมมติฐานหลัก H0 ถือว่าความคงตัวของความแปรปรวนของข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอย กล่าวคือ การมีอยู่ของสภาวะ homoscedasticity ในแบบจำลอง:

สมมติฐานทางเลือก H1 ถือว่าความแปรปรวนของความแปรปรวนของข้อผิดพลาดแบบสุ่มในการสังเกตต่างๆ เช่น การมีอยู่ของสภาวะ heteroscedasticity ในแบบจำลอง:

ความแตกต่างของค่าคงเหลือของแบบจำลองการถดถอยสามารถนำไปสู่ผลด้านลบ:

1) การประมาณค่าสัมประสิทธิ์ที่ไม่รู้จักของแบบจำลองการถดถอยเชิงเส้นปกติมีความเป็นกลางและสม่ำเสมอ แต่คุณสมบัติด้านประสิทธิภาพจะหายไป

2) มีความเป็นไปได้สูงที่ค่าประมาณความผิดพลาดมาตรฐานของสัมประสิทธิ์ตัวแบบการถดถอยจะถูกคำนวณอย่างไม่ถูกต้อง ซึ่งท้ายที่สุดอาจนำไปสู่การยืนยันสมมติฐานที่ไม่ถูกต้องเกี่ยวกับความสำคัญของสัมประสิทธิ์การถดถอยและความสำคัญของตัวแบบการถดถอยได้ดังนี้ ทั้งหมด.

รักร่วมเพศ

Homoscedasticity ของส่วนที่เหลือหมายความว่าความแปรปรวนของความแปรปรวนแต่ละค่าจะเท่ากันสำหรับค่า x ทั้งหมด หากไม่เป็นไปตามเงื่อนไขนี้จะเกิดความแตกต่าง การมีอยู่ของ heteroscedasticity สามารถเห็นได้อย่างชัดเจนจากสนามสหสัมพันธ์

เพราะ ความแปรปรวนแสดงลักษณะการเบี่ยงเบนนั้นสามารถเห็นได้จากตัวเลขว่าในกรณีแรกความแปรปรวนของสารตกค้างเพิ่มขึ้นเมื่อ x เพิ่มขึ้นและในกรณีที่สองความแปรปรวนของเศษเหลือถึงค่าสูงสุดที่ค่าเฉลี่ยของ x และลดลง ที่ค่าต่ำสุดและสูงสุดของ x การปรากฏตัวของ heteroscedasticity จะส่งผลต่อการลดประสิทธิภาพของการประมาณค่าพารามิเตอร์ของสมการถดถอย การมีอยู่ของ homoscedasticity หรือ heteroscedasticity ยังสามารถกำหนดได้จากแผนภาพของสารตกค้างกับค่าทางทฤษฎี

ตามข้อกำหนดเบื้องต้นข้อหนึ่งของกำลังสองน้อยที่สุด จำเป็นต้องให้ค่าความแปรปรวนของเศษเหลือเป็น homoscedastic ซึ่งหมายความว่าสำหรับแต่ละค่าของปัจจัย X เศษเหลือ e มีความแปรปรวนเท่ากัน หากไม่เป็นไปตามเงื่อนไขนี้จะเกิดความแตกต่าง การมีอยู่ของ heteroscedasticity สามารถแสดงให้เห็นได้อย่างชัดเจนในฟิลด์สหสัมพันธ์ (ดูรูปที่)

Homoscedasticity ของสิ่งตกค้างหมายความว่าความแปรปรวนของสิ่งตกค้างจะเท่ากันสำหรับแต่ละค่าของ X การใช้ภาพ 3D จะได้รับแผนภาพต่อไปนี้ซึ่งจะแสดงให้เห็นถึง homo- และ heteroscedasticity

ตัวเลขที่มี homoscedasticity แสดงให้เห็นว่าสำหรับแต่ละค่าของ X การแจกแจงของส่วนที่เหลือจะเท่ากัน ตรงกันข้ามกับ heteroscedasticity

สำหรับการถดถอยพหุคูณ ประเภทของกราฟเป็นวิธีที่มองเห็นได้ชัดเจนที่สุดในการศึกษาความเป็น homo- และ heteroscedasticity

การมีอยู่ของ heteroscedasticity ในบางกรณีอาจนำไปสู่ความลำเอียงในการประมาณค่าสัมประสิทธิ์การถดถอย แม้ว่าความเป็นกลางของการประมาณค่าสัมประสิทธิ์การถดถอยตามกฎจะขึ้นอยู่กับการปฏิบัติตามสมมติฐานที่สองของกำลังสองน้อยที่สุด กล่าวคือ ความเป็นอิสระของเศษวัสดุและปัจจัย ค่า Heteroskedasticity จะส่งผลต่อการลดลงของประสิทธิภาพของการประมาณการข. โดยเฉพาะอย่างยิ่ง กลายเป็นเรื่องยากที่จะใช้สูตรสำหรับข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอย Sb ซึ่งถือว่าความแปรปรวนเดียวของค่าคงเหลือสำหรับค่าปัจจัยใดๆ

ความหมายของ heteroscedasticity

ด้วยขนาดตัวอย่างเล็กๆ ซึ่งเป็นเรื่องปกติสำหรับคนส่วนใหญ่ วิธี Goldfeld-Quandt ใช้ในการประเมิน heteroscedasticity ซึ่งพัฒนาขึ้นในปี 1965 โดย Goldfeld และ Quandt ซึ่งพวกเขาพิจารณาปัจจัยเดียว แบบจำลองเชิงเส้นซึ่งความแปรปรวนของเศษเหลือเพิ่มขึ้นตามสัดส่วนของกำลังสองของตัวประกอบ เพื่อประเมินการละเมิด homoscedasticity พวกเขาเสนอให้ดำเนินการดังต่อไปนี้

จัดเรียงข้อสังเกตเมื่อปัจจัย X เพิ่มขึ้น
แยกออกจากการพิจารณา C การสังเกตจากส่วนกลาง และ (n - C): 2 > p โดยที่ p คือจำนวนพารามิเตอร์โดยประมาณ
แบ่งชุดของการสังเกต (n - C) ออกเป็นสองกลุ่ม (ที่มีขนาดเล็กและ คุณค่ามหาศาลปัจจัย X)
กำหนดผลรวมที่เหลือของกำลังสองสำหรับกลุ่มแรก (S1) และกลุ่มที่สอง (S2) และหาอัตราส่วน: R = S1: S2

ขณะทำ สมมติฐานว่างเกี่ยวกับ homoscedasticity อัตราส่วน R จะเป็นไปตามเกณฑ์ของ Fisher ด้วย (n - C - 2p) : 2 องศาอิสระสำหรับแต่ละ ยอดเงินคงเหลือสี่เหลี่ยม ยิ่งค่า R เกิน ค่าตาราง F-test หัวข้อใน มากกว่าสมมติฐานเกี่ยวกับความเท่าเทียมกันของการกระจายตัวของสารตกค้างถูกละเมิด

คำตอบ ตั๋วสอบในเศรษฐมิติ Yakovleva Angelina Vitalievna

57. Heteroskedasticity ของส่วนที่เหลือของแบบจำลองการถดถอย

สุ่มผิดเรียกว่าความแปรปรวนในแบบจำลองการถดถอยพหุคูณเชิงเส้น:

?i=yi–?0–?1x1i–…–?mxmi

เนื่องจากข้อเท็จจริงที่ว่าขนาดของข้อผิดพลาดแบบสุ่มของตัวแบบการถดถอยเป็นค่าที่ไม่รู้จัก การประมาณค่าตัวอย่างของข้อผิดพลาดแบบสุ่มของตัวแบบการถดถอยจึงคำนวณโดยใช้สูตร:

ที่ไหน ไอคือเศษเหลือของตัวแบบการถดถอย

คำว่า heteroskedasticity เป็นที่เข้าใจกันโดยทั่วไปว่าเป็นสมมติฐานเกี่ยวกับความแปรปรวนของข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอย

เมื่อสร้างแบบจำลองการถดถอยเชิงเส้นปกติ เงื่อนไขต่อไปนี้จะถูกนำมาพิจารณาเกี่ยวกับข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอย:

6) มูลค่าที่คาดหวังข้อผิดพลาดแบบสุ่มของแบบจำลองการถดถอยเป็นศูนย์ในการสังเกตทั้งหมด:

เงื่อนไขที่สอง

ภายใต้ รักร่วมเพศเป็นที่เข้าใจกันว่าเป็นการสันนิษฐานว่าความแปรปรวนของความคลาดเคลื่อนแบบสุ่ม ?ผมเป็นค่าคงที่ที่ทราบสำหรับการสังเกตทั้งหมด

แต่ในทางปฏิบัติ การสันนิษฐานของ homoscedasticity ของความคลาดเคลื่อนแบบสุ่ม?i หรือเศษเหลือของแบบจำลองการถดถอย ไอไม่ได้ดำเนินการเสมอไป

ภายใต้ ความแตกต่าง(heteroscedasticity - heterogeneous scatter) เป็นที่เข้าใจกันว่าความแปรปรวนของข้อผิดพลาดแบบสุ่มเป็นค่าที่แตกต่างกันสำหรับการสังเกตทั้งหมดซึ่งหมายถึงการละเมิดเงื่อนไขที่สองของแบบจำลองเชิงเส้นปกติของการถดถอยพหุคูณ:

แล้วสามารถโต้แย้งได้ว่าความคลาดเคลื่อนแบบสุ่มของตัวแบบการถดถอย ?ผมปฏิบัติตามกฎการแจกแจงแบบปกติโดยมีค่าความคาดหมายและความแปรปรวนทางคณิตศาสตร์เป็นศูนย์ จี2?:

?ผม~N(0; G2?),

ที่ไหน ? คือเมทริกซ์ความแปรปรวนร่วมของข้อผิดพลาดแบบสุ่ม

หากความแปรปรวนของข้อผิดพลาดแบบสุ่ม

แบบจำลองการถดถอยเป็นที่ทราบล่วงหน้า จากนั้นปัญหาของ heteroscedasticity จะถูกขจัดออกอย่างง่ายดาย อย่างไรก็ตาม ในกรณีส่วนใหญ่ ไม่เพียงแต่จะไม่ทราบความแปรปรวนของข้อผิดพลาดแบบสุ่มเท่านั้น แต่ยังไม่ทราบถึงฟังก์ชันของการพึ่งพาการถดถอยด้วย y=f(x),เพื่อสร้างและประเมินผล

สมมติฐานหลัก H0แสดงถึงความคงตัวของความแปรปรวนของข้อผิดพลาดแบบสุ่มของตัวแบบการถดถอย นั่นคือ การมีอยู่ของสภาวะ homoscedasticity ในแบบจำลอง:

ความแตกต่างของค่าคงเหลือของแบบจำลองการถดถอยสามารถนำไปสู่ผลด้านลบ:

2) มีความเป็นไปได้สูงที่ค่าประมาณ ข้อผิดพลาดมาตรฐานสัมประสิทธิ์ของตัวแบบการถดถอยจะถูกคำนวณอย่างไม่ถูกต้อง ซึ่งท้ายที่สุดอาจนำไปสู่การยืนยันสมมติฐานที่ไม่ถูกต้องเกี่ยวกับความสำคัญของสัมประสิทธิ์การถดถอยและความสำคัญของตัวแบบการถดถอยโดยรวม

จากหนังสือเฉลยตั๋วสอบทางเศรษฐมิติ ผู้เขียน Yakovleva Angelina Vitalievna

14. การประเมินสัมประสิทธิ์ของตัวแบบการถดถอยคู่โดยใช้ อัตราการสุ่มตัวอย่าง Regression Beyond Method สี่เหลี่ยมน้อยที่สุดซึ่งในกรณีส่วนใหญ่จะกำหนดพารามิเตอร์ที่ไม่รู้จักของตัวแบบการถดถอย ในกรณีของตัวแบบการถดถอยแบบคู่เชิงเส้น

จากหนังสือของผู้เขียน

15. การประมาณค่าความแปรปรวนของความคลาดเคลื่อนแบบสุ่มของตัวแบบการถดถอย การวิเคราะห์การถดถอยปัญหาหลักคือ ความแปรปรวนทั่วไปข้อผิดพลาดแบบสุ่มคือปริมาณที่ไม่ทราบสาเหตุ ซึ่งทำให้จำเป็นต้องคำนวณแบบไม่เอนเอียง

จากหนังสือของผู้เขียน

18. ลักษณะของคุณภาพของตัวแบบการถดถอย คุณภาพของตัวแบบการถดถอยคือความเพียงพอของตัวแบบที่สร้างขึ้นกับข้อมูลเบื้องต้น (ที่สังเกตได้) ตัวชี้วัดพิเศษใช้เพื่อประเมินคุณภาพของตัวแบบการถดถอย คุณภาพของคู่เชิงเส้น ตัวแบบถดถอย

จากหนังสือของผู้เขียน

35. การทดสอบสมมติฐานเกี่ยวกับความสำคัญของสัมประสิทธิ์การถดถอยและตัวแบบการถดถอยพหุคูณโดยรวม การทดสอบความสำคัญของสัมประสิทธิ์การถดถอยหมายถึงการทดสอบสมมติฐานหลักเกี่ยวกับความแตกต่างที่มีนัยสำคัญจากศูนย์

จากหนังสือของผู้เขียน

39. ตัวแบบการถดถอยแบบไม่เชิงเส้นในตัวแปรปัจจัย เมื่อศึกษาปรากฏการณ์และกระบวนการทางเศรษฐกิจและสังคม การพึ่งพาอาศัยกันทั้งหมดไม่สามารถอธิบายได้โดยใช้ การเชื่อมต่อเชิงเส้น. ดังนั้น ในการสร้างแบบจำลองทางเศรษฐมิติ คลาสของ nonlinear

จากหนังสือของผู้เขียน

40. ตัวแบบการถดถอยที่ไม่เป็นเชิงเส้นในแง่ของสัมประสิทธิ์โดยประมาณ

จากหนังสือของผู้เขียน

41. แบบจำลองการถดถอยพร้อมคำจำกัดความของเบรกพอยต์ ตัวแบบการถดถอยที่มีจุดหยุดเรียกว่าตัวแบบที่ไม่สามารถลดขนาดให้อยู่ในรูปแบบเชิงเส้นได้ เช่น ตัวแบบการถดถอยแบบไม่เชิงเส้นภายใน ตัวแบบการถดถอยแบ่งออกเป็นสองคลาส: 1) ตัวแบบการถดถอยเชิงเส้นแบบเป็นชิ้น 2)

จากหนังสือของผู้เขียน

44. วิธีการประมาณค่าสัมประสิทธิ์ของแบบจำลองการถดถอยแบบไม่เชิงเส้น ฟังก์ชันของการสูญเสียหรือข้อผิดพลาดเป็นฟังก์ชันของแบบฟอร์ม นอกจากนี้ ในฐานะที่เป็นฟังก์ชันการสูญเสีย ผลรวมของโมดูลของการเบี่ยงเบนของค่าที่สังเกตได้ของ คุณสมบัติที่มีประสิทธิภาพ y จากคุณสมบัติเชิงทฤษฎีสามารถใช้ได้

จากหนังสือของผู้เขียน

46. การทดสอบสมมติฐานเกี่ยวกับความสำคัญของแบบจำลองการถดถอยแบบไม่เชิงเส้น การทดสอบสมมติฐานเกี่ยวกับ การพึ่งพาอาศัยกันเชิงเส้นระหว่างตัวแปรตัวแบบการถดถอย กับตัวแบบการถดถอยแบบไม่เชิงเส้นที่เป็นเส้นตรงในตัว นั่นคือ ลดลงเป็น รูปแบบเชิงเส้น, แพร่กระจายทั้งหมด

จากหนังสือของผู้เขียน

58. การทดสอบ Glaser สำหรับตรวจจับ heteroscedasticity ของแบบจำลองการถดถอยที่เหลือ มีการทดสอบหลายอย่างสำหรับการตรวจจับความต่างของแบบจำลองการถดถอยที่เหลือ

จากหนังสือของผู้เขียน

59. การทดสอบ Goldfeld-Quandt เพื่อตรวจหา heteroscedasticity ของแบบจำลองการถดถอยที่เหลือ เงื่อนไขหลักสำหรับการทดสอบ Goldfeld-Quandt คือสมมติฐานที่ว่า กฎหมายปกติการกระจายข้อผิดพลาดแบบสุ่ม?i ของแบบจำลองการถดถอย พิจารณาการประยุกต์ใช้สิ่งนี้

จากหนังสือของผู้เขียน

60. การลบ heteroscedasticity ของตัวแบบการถดถอยที่เหลือ มีหลายวิธีในการกำจัด heteroscedasticity ของตัวแบบการถดถอยที่เหลือ ลองดูที่บางส่วนของพวกเขาส่วนใหญ่ วิธีง่ายๆการกำจัด heteroscedasticity ของส่วนที่เหลือของแบบจำลองการถดถอย

จากหนังสือของผู้เขียน

61. สหสัมพันธ์อัตโนมัติของแบบจำลองการถดถอยที่เหลือ ผลที่ตามมาของความสัมพันธ์อัตโนมัติ ฟังก์ชัน Autocorrelation Autocorrelation คือความสัมพันธ์ที่เกิดขึ้นระหว่างระดับของตัวแปรที่สนใจ เป็นความสัมพันธ์ที่แสดงขึ้นเมื่อเวลาผ่านไป การมี autocorrelation บ่อยที่สุด

จากหนังสือของผู้เขียน

62. การทดสอบ Durbin-Watson สำหรับตรวจจับความสัมพันธ์อัตโนมัติของแบบจำลองการถดถอยที่เหลือ นอกเหนือจาก autocorrelation และ private ฟังก์ชันสหสัมพันธ์อัตโนมัติในการตรวจจับความสัมพันธ์อัตโนมัติของส่วนที่เหลือของแบบจำลองการถดถอย จะใช้การทดสอบ Durbin-Watson อย่างไรก็ตาม เกณฑ์นี้

จากหนังสือของผู้เขียน

63. การกำจัด autocorrelation ของ regression model residual เนื่องจากการมีอยู่ในตัวแบบ regression ของ autocorrelation ระหว่าง model residual สามารถนำไปสู่ ผลลัพธ์เชิงลบของกระบวนการทั้งหมดของการประมาณค่าสัมประสิทธิ์ที่ไม่รู้จักของแบบจำลอง ความสัมพันธ์อัตโนมัติของสารตกค้าง

จากหนังสือของผู้เขียน

67. ตัวแบบการถดถอยที่มีโครงสร้างผันแปร ตัวแปรจำลอง เมื่อสร้างแบบจำลองการถดถอย สถานการณ์อาจเกิดขึ้นเมื่อจำเป็นต้องรวมไม่เพียงแต่เชิงปริมาณเท่านั้น แต่ยังรวมถึงตัวแปรเชิงคุณภาพด้วย (เช่น อายุ การศึกษา เพศ เชื้อชาติ

การประเมินความถูกต้องของตัวแบบการถดถอย

ในการประเมินความถูกต้อง มักใช้ตัวบ่งชี้สองตัว ซึ่งสำหรับเส้นตรงและสำหรับ โมเดลไม่เชิงเส้นดูเหมือน:

1. ข้อผิดพลาดในการประมาณค่าเฉลี่ย

2. ข้อผิดพลาดในการประมาณ RMS

8.1. สาระสำคัญและสาเหตุของ heteroscedasticity

เงื่อนไข Gauss-Markov ที่สองเกี่ยวกับ homoscedasticity นั่นคือ ความสมมูลของสารตกค้าง เป็นหนึ่งในข้อกำหนดเบื้องต้นที่สำคัญที่สุดสำหรับ LSM

เนื่องจากค่าเฉลี่ยของเศษที่เหลือในการสังเกตแต่ละครั้งเป็นศูนย์ ดังนั้นกำลังสองของเศษที่เหลือจึงสามารถใช้เป็นค่าประมาณความแปรปรวนได้

สี่เหลี่ยมที่เหลือเหล่านี้รวมอยู่ใน ESS(ซึ่งถูกย่อให้เล็กสุดใน LSM) ด้วยหน่วยตุ้มน้ำหนักที่เท่ากัน และนี่ไม่ได้เป็นสิ่งที่สมเหตุสมผลเสมอไป เนื่องจากในทางปฏิบัติ heteroskedasticity ไม่ได้หายากนัก

เช่น มีรายได้เพิ่มขึ้น ไม่ใช่แค่ ระดับกลางการบริโภค แต่ยังรวมถึงการเปลี่ยนแปลงในการบริโภค มีอยู่ในหน่วยงานที่มีรายได้สูง เนื่องจากมีขอบเขตการกระจายรายได้มากขึ้น ปัญหาของ heteroscedasticity เป็นเรื่องปกติสำหรับตัวอย่างเชิงพื้นที่ เห็นได้ชัดว่า เมื่อมี heteroscedasticity การสังเกตที่มีการกระจายตัวมากขึ้นควรเป็น ESSให้น้ำหนักน้อยกว่าและในทางกลับกัน และไม่ถือว่าให้น้ำหนักเท่ากัน เหมือนที่ทำในสี่เหลี่ยมน้อยที่สุดแบบคลาสสิก

จุดบน scatterplot ที่ได้มาจากการสังเกตที่มีความแปรปรวนน้อยกว่ากำหนดทิศทางของเส้นการถดถอยได้แม่นยำกว่าจุดจากการสังเกตที่มีความแปรปรวนมากกว่า

ความหมายของ heteroscedasticity คือ:

1. การประมาณค่าพารามิเตอร์จะไม่มีประสิทธิภาพ กล่าวคือ ค่าประมาณจะไม่มีความแปรปรวนน้อยที่สุดเมื่อเทียบกับค่าประมาณอื่นๆ อย่างไรก็ตาม พวกเขาจะยังคงเป็นกลาง

2. ความแปรปรวนของการประมาณค่าจะถูกเปลี่ยน เนื่องจากความแปรปรวนจะถูกเปลี่ยนโดยระดับความเป็นอิสระหนึ่งระดับ ซึ่งใช้ในการคำนวณค่าประมาณความแปรปรวนของสัมประสิทธิ์ทั้งหมด

3. ข้อสรุปมาจากการพองตัว Fและ tสถิติและ ประมาณการตามช่วงเวลาจะไม่น่าเชื่อถือ

8.2.บัตรประจำตัวของ heteroscedasticity

นี่ไม่ใช่งานง่าย การกระจายตัว σ 2 (ε ฉัน) มักจะไม่สามารถกำหนดได้ เนื่องจากสำหรับค่าหนึ่ง ตัวแปรอธิบาย x ฉันหรือค่าเวกเตอร์เฉพาะ xในการถดถอยพหุคูณ เรามีค่าตัวแปรตามเพียงค่าเดียว ผมและเราสามารถคำนวณเฉพาะค่าแบบจำลองของตัวแปรได้

อย่างไรก็ตาม มีการพัฒนาวิธีการและการทดสอบจำนวนหนึ่งเพื่อตรวจหา heteroscedasticity:

1. กราฟฟิค- เราได้กล่าวแล้วว่า เอ็ม(ε ฉัน)=0; นี่หมายความว่าความแปรปรวนของเศษที่เหลือสามารถถูกแทนที่ด้วยค่าประมาณของมัน และค่านี้สามารถนำมาเป็นค่าประมาณนี้ได้ ในกรณีนี้ คุณสามารถสร้างกราฟในพิกัด: มีฟังก์ชันของ x ฉันและใช้เพื่อศึกษาธรรมชาติของการพึ่งพาอาศัยกันนี้ หากมีตัวแปรอธิบายหลายตัว ให้ตรวจสอบการพึ่งพาแต่ละตัวแปร x jนั่นคือเราศึกษาการพึ่งพาอาศัยกัน

เรายังสามารถสำรวจการพึ่งพาได้เนื่องจากตัวแปร ที่คือผลรวมเชิงเส้นของตัวแปรอธิบายทั้งหมด

2. ทดสอบ ความสัมพันธ์ของอันดับสเปียร์แมน

ค่านิยม x ฉันและ ε ฉันเรียงลำดับจากน้อยไปมาก และสำหรับการสังเกตแต่ละครั้งในอนุกรม Xและต่อเนื่องกัน ε อันดับ (หมายเลข) ถูกกำหนดตามลำดับนี้ ความแตกต่าง ฉันระหว่างอันดับ xและ ε สำหรับแต่ละหมายเลขสังเกตจะคำนวณเป็น

จากนั้นคำนวณสัมประสิทธิ์สหสัมพันธ์อันดับ:

เป็นที่ทราบกันดีว่าถ้าเศษที่เหลือไม่สัมพันธ์กับตัวแปรอธิบาย สถิติ

มีการกระจายตัวของนักเรียนด้วยจำนวนองศาอิสระ

df = n−2.

ถ้าค่าที่คำนวณได้ t– สถิติเกินค่าวิกฤตแบบตารางที่ระดับนัยสำคัญที่กำหนด γ ของสมมติฐาน ชม 0 จากนั้นสมมติฐานของการไม่มี heteroscedasticity จะถูกปฏิเสธและ heteroscedasticity ได้รับการยอมรับว่ามีนัยสำคัญ ค่าวิกฤต t–สถิติกำหนดจากตารางเป็น

ในกรณีที่ตัวแบบการถดถอยมีพหุคูณ ให้ทดสอบสมมติฐาน ชม 0 ถูกดำเนินการสำหรับตัวแปรอธิบายแต่ละตัว

3. โกลด์เฟลด์ - การทดสอบ Quandt

สันนิษฐานว่าความแปรปรวนของค่าคงเหลือในการสังเกตแต่ละครั้งเป็นสัดส่วนหรือแปรผกผันกับตัวถดถอยของดอกเบี้ย สันนิษฐานด้วยว่าค่าคงเหลือมีการกระจายตามปกติและไม่มีสหสัมพันธ์ในตัวส่วนเหลือ

ในกรณีของการถดถอยพหุคูณ ขอแนะนำให้ทำการทดสอบตัวถดถอยแต่ละตัวแยกกัน

ลำดับการทดสอบ:

ก) การสังเกต (แถวของตาราง) ได้รับคำสั่งจากน้อยไปหามากของผู้ถดถอยที่เราสนใจ

b) ตัวอย่างที่สั่งด้วยวิธีนี้แบ่งออกเป็น 3 ตัวอย่างย่อยที่มีขนาด , , ค่าต่อไปนี้: n= 30, k = 11; n= 60, k = 22; n= 100, k= 36…38; n= 300, k = 110 และอื่นๆ (ดูตาราง 8.1)

เมื่อประมาณค่าพารามิเตอร์ของสมการถดถอย เราใช้วิธีกำลังสองน้อยที่สุด ในเวลาเดียวกัน เราตั้งสมมติฐานบางอย่างเกี่ยวกับองค์ประกอบสุ่ม  ในรุ่น

ที่ = เอ + ข 1  x + 

องค์ประกอบสุ่ม  เป็นปริมาณที่ไม่สามารถสังเกตได้ หลังจากประเมินพารามิเตอร์แบบจำลองแล้วโดยคำนวณความแตกต่างระหว่างค่าจริงและค่าทฤษฎีของคุณสมบัติที่มีประสิทธิภาพ ที่เราสามารถกำหนดค่าประมาณขององค์ประกอบสุ่มได้ ( ที่). เมื่อเปลี่ยนข้อกำหนดของแบบจำลอง เพิ่มข้อสังเกตใหม่ ประมาณการตัวอย่างที่เหลือ ผม, อาจมีการเปลี่ยนแปลง ดังนั้นงานของการวิเคราะห์การถดถอยจึงไม่เพียง แต่รวมถึงการสร้างแบบจำลองเท่านั้น แต่ยังรวมถึงการศึกษาการเบี่ยงเบนแบบสุ่มด้วย  ผม, เช่น. มูลค่าคงเหลือ

ส่วนก่อนหน้านี้พิจารณาการทดสอบอย่างเป็นทางการของความถูกต้องทางสถิติของการถดถอยและสัมประสิทธิ์สหสัมพันธ์โดยใช้ t-เกณฑ์ของนักเรียนและ F-เกณฑ์. เมื่อใช้เกณฑ์เหล่านี้ จะมีการตั้งสมมติฐานเกี่ยวกับพฤติกรรมของสิ่งตกค้าง  ผม. เศษที่เหลือเป็นตัวแปรสุ่มอิสระและค่าเฉลี่ยของมันคือ 0; พวกมันมีความแปรปรวน (คงที่) เท่ากันและติดตามการแจกแจงแบบปกติ

ค่าประมาณของพารามิเตอร์การถดถอยต้องเป็นไปตามเกณฑ์บางประการ: เป็นกลาง สม่ำเสมอ และมีประสิทธิภาพ

ประมาณการที่เป็นกลางหมายความว่าความคาดหวังของส่วนที่เหลือเป็นศูนย์ ดังนั้นด้วยค่าประมาณตัวอย่างจำนวนมาก สารตกค้างจะไม่สะสมและค่าพารามิเตอร์การถดถอยที่พบ ข ผมสามารถคิดได้ว่าเป็นค่าเฉลี่ยของการประมาณการที่เป็นกลางจำนวนมากที่เป็นไปได้

เพื่อวัตถุประสงค์ในทางปฏิบัติ ไม่เพียงแต่ความเป็นกลางเท่านั้นที่มีความสำคัญ แต่ยังรวมถึงประสิทธิภาพของการประมาณการด้วย ถือว่าเรตติ้งนะคะ มีประสิทธิภาพหากมีความแปรปรวนน้อยที่สุด

ระดับความสมจริงของช่วงความเชื่อมั่นของพารามิเตอร์การถดถอยจะมั่นใจได้หากการประมาณการไม่เพียงไม่ลำเอียงและมีประสิทธิภาพเท่านั้น แต่ยังรวมถึง ร่ำรวย. ความสอดคล้องของการประมาณค่ากำหนดลักษณะการเพิ่มขึ้นของความแม่นยำด้วยการเพิ่มขนาดตัวอย่าง

งานวิจัยที่เหลือ  ผมเกี่ยวข้องกับการตรวจสอบการมีอยู่ของสมมติฐาน LSM ห้าข้อต่อไปนี้ (ดูเงื่อนไขของ Gauss-Markov):

ลักษณะสุ่มของซาก

เมื่อต้องการทำสิ่งนี้ ให้พล็อตการพึ่งพาของที่เหลือ  ผมจากค่าทางทฤษฎีของคุณสมบัติที่มีประสิทธิภาพ . หากไม่มีทิศทางในตำแหน่งของจุดบนกราฟ  ผมแล้วส่วนที่เหลือ  ผมเป็นตัวแปรสุ่มและกำลังสองน้อยที่สุดคือค่าทางทฤษฎี ประมาณค่าจริงได้อย่างดี ที่.

ศูนย์ ค่าเฉลี่ยส่วนที่เหลือเป็นอิสระจาก X ผม .

สมมติฐาน OLS ที่สองเกี่ยวกับค่าเฉลี่ยของค่าคงเหลือเป็นศูนย์หมายความว่า ( ที่ ) = 0 สิ่งนี้เป็นไปได้สำหรับตัวแบบเชิงเส้นและตัวแบบที่ไม่เป็นเชิงเส้นเมื่อเทียบกับตัวแปรที่รวมอยู่ สำหรับแบบจำลองที่ไม่เป็นเชิงเส้นในแง่ของพารามิเตอร์ประมาณการและลดลงเป็นรูปแบบเชิงเส้นโดยใช้ลอการิทึม หมายถึงข้อผิดพลาดเป็นศูนย์สำหรับลอการิทึมของข้อมูลเดิม ดังนั้นสำหรับโมเดลของฟอร์ม

รักร่วมเพศ ความแปรปรวนของแต่ละส่วนเบี่ยงเบน ผม เท่ากันทุกประการX.

สมมติฐานที่สามของกำลังสองน้อยที่สุดกำหนดให้ความแปรปรวนของเศษเหลือเป็น รักร่วมเพศ. ซึ่งหมายความว่าสำหรับแต่ละค่าของตัวประกอบ X ผมส่วนที่เหลือมีความแปรปรวนเท่ากัน หากไม่ตรงตามเงื่อนไขสำหรับการสมัคร LSM เราก็มี ความแตกต่าง(รูปที่ 1).

Homoscedasticity of residuals หมายถึง ความแปรปรวนของสารตกค้าง  ผมเท่ากันทุกค่า X.

การปรากฏตัวของ heteroscedasticity ใน แต่ละกรณีสามารถนำไปสู่อคติในการประมาณค่าสัมประสิทธิ์การถดถอย แม้ว่าความไม่เอนเอียงของการประมาณค่าสัมประสิทธิ์การถดถอยส่วนใหญ่ขึ้นอยู่กับการปฏิบัติตามสมมติฐานที่สองของ LSM นั่นคือ ความเป็นอิสระของส่วนที่เหลือและค่าของปัจจัย

Heteroscedasticity จะส่งผลต่อการลดลงของประสิทธิภาพของการประมาณการ ข ผม. โดยเฉพาะการใช้สูตรความคลาดเคลื่อนมาตรฐานของสัมประสิทธิ์การถดถอยกลายเป็นเรื่องยาก ซึ่งถือว่าความแปรปรวนของค่าคงเหลือเดียวสำหรับค่าใด ๆ ของปัจจัย

พิจารณา การทดสอบซึ่งทำให้เราสามารถวิเคราะห์แบบจำลองสำหรับ homoscedasticity

ด้วยขนาดตัวอย่างที่เล็ก ซึ่งเป็นเรื่องปกติมากที่สุดสำหรับการศึกษาทางเศรษฐมิติ สามารถประเมินความต่างศักย์ได้โดยใช้ วิธีโกลด์เฟลด์  Quandta ซึ่งพัฒนาขึ้นในปี 1965 โดย Goldfeld และ Quandt ถือว่าเป็นแบบจำลองเชิงเส้นที่มีปัจจัยเดียวซึ่งความแปรปรวนของเศษเหลือเพิ่มขึ้นตามกำลังสองของตัวประกอบ เพื่อประเมินการละเมิด homoscedasticity พวกเขาเสนอ การทดสอบพารามิเตอร์ซึ่งรวมถึงขั้นตอนต่อไปนี้:

สั่งซื้อ พีการสังเกตเมื่อตัวแปรเพิ่มขึ้น X.

การยกเว้นจากการพิจารณา จากการสังเกตจากส่วนกลาง โดยที่ ( พี C)/2 > R, ที่ไหน R จำนวนพารามิเตอร์โดยประมาณ

จากการทดลองคำนวณโดยผู้เขียนวิธีการสำหรับกรณีหนึ่งปัจจัย ขอแนะนำสำหรับ พี= 30 ยอมรับ จาก= 8 ในขณะที่ พี= 60 - ตามลำดับ จาก = 16.

การแยกประชากรจาก ( พี  จาก) การสังเกตออกเป็นสองกลุ่ม (ตามลำดับโดยมีค่าตัวประกอบน้อยและใหญ่ X) และนิยามของสมการถดถอยแต่ละกลุ่ม

การกำหนดผลรวมคงเหลือของกำลังสองสำหรับครั้งแรก ( ส 1) และวินาที ( ส 2) จัดกลุ่มและค้นหาความสัมพันธ์: R = ส 1 /ส 2 ที่ไหน ส 1 > ส 2 .

ภายใต้สมมติฐานว่างของ homoscedasticity อัตราส่วน Rจะสนอง F-เกณฑ์ด้วย ( พีจาก2R)/2 องศาอิสระสำหรับแต่ละผลรวมของกำลังสองที่เหลือ ยิ่งค่า Rเกินค่าตาราง F-เกณฑ์ยิ่งมีการละเมิดหลักฐานความเท่าเทียมกันของการกระจายของมูลค่าคงเหลือมากขึ้น

การทดสอบ Goldfeld-Quandt ยังใช้ในการทดสอบเศษเหลือของการถดถอยพหุคูณสำหรับ heteroscedasticity

สามารถตรวจสอบการมีอยู่ของ heteroscedasticity ในการถดถอยที่เหลือได้โดยใช้ ความสัมพันธ์ของยศสเปียร์แมน . สาระสำคัญของการตรวจสอบคือในกรณีของ heteroscedasticity เศษเหลือสัมบูรณ์  ผมมีความสัมพันธ์กับค่าของปัจจัย X ผม. สหสัมพันธ์นี้สามารถวัดได้โดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมน:

, (31)

ที่ไหน d ความแตกต่างที่แน่นอนระหว่างอันดับของค่า X ผมและ | ผม |.

นัยสำคัญทางสถิติของ  สามารถประมาณได้โดยใช้ t-เกณฑ์:

. (32)

เปรียบเทียบค่านี้กับค่าตารางที่  = 0.05 และจำนวนองศาอิสระ ( พี  ม). สันนิษฐานว่าถ้า t  > t แล้วความสัมพันธ์ระหว่าง  ผมและ X ผมมีนัยสำคัญทางสถิติ กล่าวคือ มีความต่างกันของสารตกค้าง มิฉะนั้นจะยอมรับสมมติฐานของการไม่มี heteroscedasticity ของสารตกค้าง

เกณฑ์ที่พิจารณาไม่ได้ให้การประเมินเชิงปริมาณของการพึ่งพาความแปรปรวนข้อผิดพลาดการถดถอยในค่าที่สอดคล้องกันของปัจจัยที่รวมอยู่ในการถดถอย พวกเขาอนุญาตให้คนเดียวเท่านั้นที่จะกำหนดว่ามีหรือไม่มี heteroscedasticity ของสารตกค้าง ดังนั้น หากมีการสร้าง heteroscedasticity ของสารตกค้าง เป็นไปได้ที่จะหาปริมาณการพึ่งพาความแปรปรวนของข้อผิดพลาดการถดถอยบนค่าปัจจัย เพื่อจุดประสงค์นี้ สามารถใช้การทดสอบ White, Park, Glaser ฯลฯ ได้

การทดสอบสีขาว ถือว่าความแปรปรวนข้อผิดพลาดการถดถอยเป็นฟังก์ชันกำลังสองของค่าปัจจัยเช่น ต่อหน้าปัจจัยหนึ่ง  2 = เอ+ bx + cx 2 + ยูหรือหากมีปัจจัย:

 2 = เอ + ข 1 x 1 + ข 11 +ข 2 x 2 + ข 22 +ข 12 x 1 x 2 + … + ข พี x พี + ข pp + + ข 1 พี x 1 x พี + ข 2 พี x 2 x พี + … + ยู.

ดังนั้นโมเดลจึงไม่เพียงแต่รวมค่าของปัจจัยเท่านั้น แต่ยังรวมถึงกำลังสองของพวกมัน รวมถึงผลิตภัณฑ์ที่เป็นคู่ เนื่องจากแต่ละพารามิเตอร์ของโมเดล =ฉ(X ผม) ต้องคำนวณโดยพิจารณาจากจำนวนองศาอิสระที่เพียงพอ จากนั้นยิ่งปริมาตรของประชากรที่อยู่ภายใต้การศึกษาน้อยลงเท่าใด ฟังก์ชันกำลังสองก็จะยิ่งมีผลคูณของปัจจัยคู่น้อยลงเท่านั้น ตัวอย่างเช่น ถ้าการถดถอยสร้างขึ้นจากการสังเกต 30 ครั้งเป็น y ผม = เอ + ข 1 x +  ผมจากนั้นฟังก์ชันกำลังสองที่ตามมาสำหรับเศษที่เหลือสามารถแสดงเป็น .เท่านั้น

 2 = เอ + ข 1 x + ข 11 X 2 + ยู,

เพราะสำหรับแต่ละพารามิเตอร์ Xควรมีข้อสังเกตอย่างน้อย 6-7 ข้อ ปัจจุบัน การทดสอบของ White รวมอยู่ในโปรแกรมวิเคราะห์การถดถอยมาตรฐานในแพ็คเกจ Econometric Views การมีหรือไม่มี heteroscedasticity ของสารตกค้างจะถูกตัดสินโดยค่า F- เกณฑ์ของฟิชเชอร์สำหรับ ฟังก์ชันกำลังสองการถดถอยที่เหลือ ถ้ามูลค่าที่แท้จริง F-เกณฑ์สูงกว่าแบบตาราง ดังนั้นจึงมีความสัมพันธ์ที่ชัดเจนระหว่างความแปรปรวนของข้อผิดพลาดกับค่าของปัจจัยที่รวมอยู่ในการถดถอย และมีความแตกต่างกันของค่าคงเหลือ มิฉะนั้น ( Fข้อเท็จจริง< Fตาราง) สรุปว่าไม่มี heteroscedasticity ของการถดถอยที่เหลือ

การทดสอบอุทยาน ยังหมายถึงการทดสอบ heteroscedasticity ที่เป็นทางการ สันนิษฐานว่าความแปรปรวนของสารตกค้างเกี่ยวข้องกับค่าของปัจจัยของฟังก์ชัน ln  2 = เอ + ข ln X + และ. การถดถอยนี้สร้างขึ้นสำหรับแต่ละปัจจัยในเงื่อนไขของแบบจำลองหลายปัจจัย ตรวจสอบความสำคัญของสัมประสิทธิ์การถดถอย ขบน t-เกณฑ์ของนักเรียน หากสัมประสิทธิ์การถดถอยของสมการ ln 2 มีนัยสำคัญทางสถิติ ดังนั้นจึงมีการพึ่งพา ln 2 บน ln X, เช่น. สารตกค้างต่างกัน

หากการทดสอบ White and Park ออกแบบมาเพื่อประเมิน heteroskedasticity สำหรับส่วนที่เหลือกำลังสอง  2 แล้ว การทดสอบกลาเซอร์ อยู่บนพื้นฐานของการถดถอยของค่าสัมบูรณ์ของเศษที่เหลือ || เช่น ฟังก์ชัน | ผม | = เอ + ข + และ ผม. การถดถอย | ผม| จาก X ผมสร้างขึ้นที่ ความหมายต่างกันพารามิเตอร์ กับแล้วเลือกฟังก์ชันที่สัมประสิทธิ์การถดถอย ขกลายเป็นสิ่งที่สำคัญที่สุด กล่าวคือ มีค่าสูงสุด t-เกณฑ์ของนักเรียนหรือ F- เกณฑ์ของฟิชเชอร์และ R 2 .

เมื่อตรวจพบ heteroskedasticity ของการถดถอยที่เหลือ เป้าหมายคือการกำจัดมัน ซึ่งเป็นการใช้วิธีกำลังสองน้อยที่สุดทั่วไป (ดูด้านล่าง)

ไม่มีความสัมพันธ์อัตโนมัติของสารตกค้าง ค่าคงเหลือ ผม , แจกจ่ายอย่างอิสระ.

Autocorrelation of residuals หมายถึงการมีอยู่ของความสัมพันธ์ระหว่างสิ่งตกค้างของการสังเกตในปัจจุบันและก่อนหน้า (ที่ตามมา)

เมื่อสร้างแบบจำลองการถดถอย การปฏิบัติตามเงื่อนไขนี้เป็นสิ่งสำคัญอย่างยิ่ง ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง  ผมและ  ผม-1 โดยที่  ผม ส่วนที่เหลือจากการสังเกตปัจจุบัน  ผม-1  ส่วนที่เหลือจากการสังเกตก่อนหน้านี้สามารถกำหนดเป็น

, (33)

ซึ่งสอดคล้องกับสูตรสัมประสิทธิ์สหสัมพันธ์เชิงเส้น หากค่าสัมประสิทธิ์นี้แตกต่างจากศูนย์อย่างมีนัยสำคัญ แสดงว่าเศษที่เหลือจะสัมพันธ์กันโดยอัตโนมัติและฟังก์ชันความหนาแน่นของความน่าจะเป็น F() ขึ้นอยู่กับ เจจุดสังเกตและการกระจายค่าคงเหลือ ณ จุดสังเกตอื่น

การไม่มีความสัมพันธ์อัตโนมัติของค่าคงเหลือช่วยให้มั่นใจถึงความสม่ำเสมอและประสิทธิภาพของการประมาณค่าสัมประสิทธิ์การถดถอย เป็นสิ่งสำคัญอย่างยิ่งที่จะต้องสังเกตสมมติฐาน LSM นี้เมื่อสร้างแบบจำลองการถดถอยสำหรับอนุกรมเวลา โดยที่เมื่อมีแนวโน้ม ระดับที่ตามมาของอนุกรมเวลาจะขึ้นอยู่กับระดับก่อนหน้า

ส่วนที่เหลือเป็นไปตามการกระจายแบบปกติ

สมมติฐานของการแจกแจงแบบปกติของสารตกค้างช่วยให้สามารถทดสอบพารามิเตอร์การถดถอยและสหสัมพันธ์โดยใช้เกณฑ์ tและ F. ในขณะเดียวกัน การประมาณการถดถอยที่พบโดยใช้วิธีกำลังสองน้อยที่สุดก็มีคุณสมบัติที่ดี แม้ว่าจะไม่มีการแจกแจงเศษเหลือแบบปกติ กล่าวคือ เมื่อหลักฐานที่ห้าของวิธีกำลังสองน้อยที่สุดถูกละเมิด

นอกเหนือจากข้อกำหนดเบื้องต้นของวิธีกำลังสองน้อยที่สุดซึ่งเป็นวิธีการประมาณค่าพารามิเตอร์การถดถอย เมื่อสร้างแบบจำลองการถดถอย ต้องปฏิบัติตามข้อกำหนดบางประการเกี่ยวกับตัวแปรที่รวมอยู่ในแบบจำลองด้วย ประการแรก จำนวนของตัวแปร tไม่ควรเกิน
. มิฉะนั้น พารามิเตอร์การถดถอยจะไม่มีนัยสำคัญทางสถิติ ที่ ปริทัศน์การใช้กำลังสองน้อยที่สุดเป็นไปได้ถ้าจำนวนการสังเกต พีเกินจำนวนพารามิเตอร์โดยประมาณ t, เช่น. ระบบ สมการปกติมีทางออกก็ต่อเมื่อ พี > t.

หากไม่เป็นไปตามข้อกำหนดเบื้องต้นพื้นฐาน LSM จะต้องแก้ไขแบบจำลองโดยเปลี่ยนข้อกำหนด เพิ่ม (ยกเว้น) ปัจจัยบางอย่าง แปลงข้อมูลเบื้องต้นเพื่อให้ได้ค่าประมาณสัมประสิทธิ์การถดถอยที่มีคุณสมบัติเป็นกลางน้อยกว่า ความแปรปรวนคงเหลือและดังนั้นจึงให้การทดสอบทางสถิติที่มีประสิทธิภาพมากขึ้นของความสำคัญของพารามิเตอร์การถดถอย เป้าหมายนี้ดังที่ได้กล่าวไปแล้วคือการใช้วิธีการทั่วไปของกำลังสองน้อยที่สุด