ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

พารามิเตอร์ a ในสมการการถดถอยเชิงเส้นคู่ ช่วงความเชื่อมั่นสำหรับตัวแปรตาม

การส่งผลงานที่ดีของคุณไปยังฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง

งานที่ดีไปที่ไซต์">

นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง

โพสต์เมื่อ http:// www. ดีที่สุด. รุ/

กระทรวงศึกษาธิการและวิทยาศาสตร์แห่งสหพันธรัฐรัสเซีย

งบประมาณของรัฐบาลกลาง สถาบันการศึกษาอุดมศึกษา

"มหาวิทยาลัยเทคนิคแห่งรัฐ Komsomolsk-on-Amur"

คณะเศรษฐศาสตร์และการจัดการ

ภาควิชาเศรษฐศาสตร์การเงินและการบัญชี

การคำนวณและงานกราฟิก

ในสาขาวิชา "เศรษฐมิติ"

นักเรียนกลุ่ม

อ.ย. ไซเชนโก

ครู

ฉัน. อันโตโนวา

ตารางที่ 1

หมายเลขภูมิภาค

ค่าครองชีพเฉลี่ยต่อหัวต่อวันของคนฉกรรจ์หนึ่งคน, ถู.,

ค่าจ้างรายวันเฉลี่ย ถู.

ที่จำเป็น:

1. สร้างสมการเชิงเส้นของการถดถอยคู่จาก

3. ประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์โดยใช้การทดสอบฟิชเชอร์และการทดสอบนักเรียน

4. เรียกใช้การคาดการณ์ ค่าจ้างโดยมีค่าพยากรณ์ระดับการยังชีพเฉลี่ยต่อหัวเท่ากับร้อยละ 107 ของระดับเฉลี่ย

5. ประเมินความแม่นยำของการพยากรณ์โดยการคำนวณข้อผิดพลาดของการคาดการณ์และช่วงความเชื่อมั่น

6. พล็อตข้อมูลเริ่มต้นและเส้นตรงเชิงทฤษฎีบนกราฟเดียว

1. เพื่อคำนวณพารามิเตอร์ของสมการ การถดถอยเชิงเส้นสร้างตารางการคำนวณ 2. การถดถอยโดยประมาณสหสัมพันธ์เชิงเส้น

ตารางที่ 2

ค่าเฉลี่ย

สมการการถดถอยที่ได้รับคือ:

ด้วยการเพิ่มระดับการยังชีพเฉลี่ยต่อหัว 1 รูเบิล ค่าจ้างรายวันเฉลี่ยเพิ่มขึ้นโดยเฉลี่ย 0.89 รูเบิล

2. ความใกล้ชิดของการเชื่อมต่อเชิงเส้นจะถูกประเมินโดยค่าสัมประสิทธิ์สหสัมพันธ์:

ซึ่งหมายความว่า 51% ของการเปลี่ยนแปลงของค่าจ้าง () อธิบายได้จากการเปลี่ยนแปลงของปัจจัย - ค่าครองชีพโดยเฉลี่ยต่อหัว

คุณภาพของแบบจำลองถูกกำหนดโดยข้อผิดพลาดโดยเฉลี่ยของการประมาณ:

คุณภาพของแบบจำลองที่สร้างขึ้นได้รับการประเมินว่าดีเนื่องจากไม่เกิน 8-10%

3. เราจะประเมินความสำคัญของสมการการถดถอยโดยรวมโดยใช้เกณฑ์ฟิชเชอร์ มูลค่าที่แท้จริงของเกณฑ์:

ค่าตารางของเกณฑ์ที่ระดับนัยสำคัญห้าเปอร์เซ็นต์และระดับความเป็นอิสระคือ: เนื่องจากสมการการถดถอยถือว่ามีนัยสำคัญทางสถิติ

เราจะประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยโดยใช้สถิติของนักเรียน และโดยการคำนวณช่วงความเชื่อมั่นของตัวบ่งชี้แต่ละตัว

ค่าตารางของเกณฑ์สำหรับจำนวนองศาอิสระจะเป็น:

มากำหนดข้อผิดพลาดแบบสุ่ม:

ค่าจริงของสถิติเกินค่าตาราง:

ดังนั้นพารามิเตอร์จึงไม่แตกต่างจากศูนย์โดยบังเอิญ แต่มีนัยสำคัญทางสถิติ มาคำนวณช่วงความเชื่อมั่นสำหรับพารามิเตอร์การถดถอยและ การทำเช่นนี้เรากำหนด ข้อผิดพลาดเล็กน้อยสำหรับแต่ละตัวบ่งชี้:

ช่วงความมั่นใจ:

การวิเคราะห์ขีดจำกัดบนและล่างของช่วงความเชื่อมั่นนำไปสู่ข้อสรุปว่า ด้วยความน่าจะเป็น พารามิเตอร์และเมื่ออยู่ภายในขีดจำกัดที่ระบุ ไม่ยอมรับ ค่าศูนย์, เช่น. ไม่มีนัยสำคัญทางสถิติและแตกต่างจากศูนย์อย่างมีนัยสำคัญ

4. การประมาณค่าสมการถดถอยที่ได้รับทำให้สามารถนำไปใช้ในการพยากรณ์ได้ หากค่าครองชีพที่คาดการณ์ไว้คือ:

จากนั้นค่าคาดการณ์ค่าจ้างจะเป็น:

ข้อผิดพลาดในการคาดการณ์จะเป็น:

ข้อผิดพลาดการคาดการณ์สูงสุดซึ่งในกรณีนี้จะไม่เกินจะเป็น:

คาดการณ์ช่วงความเชื่อมั่น:

การคาดการณ์เงินเดือนเฉลี่ยที่เสร็จสมบูรณ์มีความน่าเชื่อถือ () และอยู่ในช่วง 131.66 รูเบิล มากถึง 190.62 ถู เพื่อสรุปวิธีแก้ปัญหา เรามาพล็อตข้อมูลเริ่มต้นและเส้นตรงทางทฤษฎีบนกราฟเดียว (รูปที่ 1)

รูปที่ 1

โพสต์บน Allbest.ru

เอกสารที่คล้ายกัน

    การก่อสร้าง สมการเชิงเส้นการคำนวณการถดถอยแบบคู่ ค่าสัมประสิทธิ์เชิงเส้นความสัมพันธ์คู่และ ข้อผิดพลาดโดยเฉลี่ยการประมาณ การหาค่าสัมประสิทธิ์สหสัมพันธ์และความยืดหยุ่น ดัชนีสหสัมพันธ์ สาระสำคัญของการประยุกต์ใช้เกณฑ์ฟิชเชอร์ในเศรษฐมิติ

    ทดสอบเพิ่มเมื่อ 05/05/2010

    การคำนวณพารามิเตอร์การถดถอยเชิงเส้นคู่ การประเมินนัยสำคัญทางสถิติของสมการการถดถอยและพารามิเตอร์โดยใช้การทดสอบฟิชเชอร์และนักเรียน การสร้างเมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์คู่ การวิเคราะห์ทางสถิติโดยใช้ซอฟต์แวร์ MS EXCEL

    ทดสอบเพิ่มเมื่อ 14/05/2551

    การคำนวณสัมประสิทธิ์เชิงเส้นของคู่และสหสัมพันธ์บางส่วน นัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์ การวิเคราะห์เขตข้อมูลสหสัมพันธ์ ความแม่นยำในการพยากรณ์ การคำนวณข้อผิดพลาด และช่วงความเชื่อมั่น ค่าสัมประสิทธิ์การตัดสินใจพหุคูณ

    ทดสอบเพิ่มเมื่อ 12/11/2010

    การตีความทางเศรษฐศาสตร์ของสัมประสิทธิ์การถดถอย ค้นหาผลรวมทางสถิติของกำลังสองและประมาณค่าความแปรปรวนของค่าคงเหลือ การตรวจสอบความสำคัญของพารามิเตอร์ของสมการถดถอยโดยใช้การทดสอบของนักเรียน การคำนวณค่าคลาดเคลื่อนสัมพัทธ์โดยเฉลี่ยของการประมาณ

    ทดสอบเพิ่มเมื่อ 23/03/2010

    การสร้างช่วงความเชื่อมั่นสำหรับสัมประสิทธิ์การถดถอย การหาข้อผิดพลาดในการประมาณ ดัชนีสหสัมพันธ์ และการทดสอบ F ของฟิชเชอร์ การประเมินความยืดหยุ่นของการเปลี่ยนแปลงความเข้มของวัสดุของผลิตภัณฑ์ การสร้างสมการเชิงเส้น การถดถอยหลายครั้ง.

    ทดสอบเพิ่มเมื่อ 04/11/2558

    การคำนวณพารามิเตอร์ของสมการถดถอยเชิงเส้น การประเมินความใกล้ชิดของความสัมพันธ์โดยใช้ตัวบ่งชี้สหสัมพันธ์และการกำหนด การหาค่าความคลาดเคลื่อนการประมาณค่าเฉลี่ย ความน่าเชื่อถือทางสถิติของการสร้างแบบจำลองโดยใช้การทดสอบ F-test ของฟิชเชอร์และการทดสอบ t-test ของนักเรียน

    ทดสอบเพิ่มเมื่อ 10/17/2552

    การกำหนดปริมาณการพึ่งพาเชิงปริมาณของมวลของสัตว์ที่มีขนตามอายุ การสร้างสมการถดถอยคู่ การคำนวณพารามิเตอร์ และการทวนสอบความเพียงพอ การประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอย การคำนวณช่วงความเชื่อมั่น

    งานห้องปฏิบัติการ เพิ่มเมื่อ 06/02/2014

    การสร้างสมมติฐานเกี่ยวกับรูปแบบของความเชื่อมโยงระหว่างรายได้ทางการเงินต่อหัวและการใช้จ่ายของผู้บริโภคในภูมิภาคอูราลและไซบีเรียตะวันตกของสหพันธรัฐรัสเซีย การคำนวณพารามิเตอร์ของสมการถดถอยคู่ การประเมินคุณภาพโดยใช้ความคลาดเคลื่อนเฉลี่ยของการประมาณ

    ทดสอบเพิ่มเมื่อ 11/05/2014

    การวิเคราะห์วิธีการ กำลังสองน้อยที่สุดสำหรับการถดถอยแบบคู่ ซึ่งเป็นวิธีการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้น การพิจารณาสมการเชิงเส้นของการถดถอยแบบคู่ การศึกษาการถดถอยเชิงเส้นพหุคูณ การศึกษาข้อผิดพลาดของสัมประสิทธิ์การถดถอย

    ทดสอบเพิ่มเมื่อ 28/03/2018

    การสร้างสนามความสัมพันธ์ การคำนวณพารามิเตอร์ของสมการถดถอยคู่ การขึ้นอยู่กับอายุขัยเฉลี่ยของปัจจัยบางประการ การศึกษา "เกณฑ์ฟิชเชอร์" การประเมินความใกล้ชิดของการเชื่อมต่อโดยใช้ตัวบ่งชี้ความสัมพันธ์และการกำหนด

100 รูเบิลโบนัสสำหรับการสั่งซื้อครั้งแรก

เลือกประเภทงาน วิทยานิพนธ์ งานหลักสูตรรายงานวิทยานิพนธ์ปริญญาโท เรื่อง การปฏิบัติ ทบทวนรายงานบทความ ทดสอบเอกสารการแก้ปัญหาแผนธุรกิจคำตอบสำหรับคำถาม งานสร้างสรรค์งานเขียนเรียงความ การแปล การนำเสนอ การพิมพ์ อื่นๆ เพิ่มความเป็นเอกลักษณ์ของข้อความ วิทยานิพนธ์ระดับปริญญาโท งานห้องปฏิบัติการความช่วยเหลือออนไลน์

ค้นหาราคา

การถดถอยคู่คือสมการความสัมพันธ์ระหว่างตัวแปรสองตัว

คุณ และ x วิดา = (x),

โดยที่ y เป็นตัวแปรตาม (แอตทริบิวต์ผลลัพธ์)

x เป็นตัวแปรอธิบายอิสระ (คุณลักษณะ-ปัจจัย)

มีการถดถอยเชิงเส้นและไม่เชิงเส้น

วิธีกำลังสองน้อยที่สุด

ในการประมาณค่าพารามิเตอร์ของการถดถอยที่เป็นเส้นตรงในพารามิเตอร์เหล่านี้ จะใช้วิธีกำลังสองน้อยที่สุด (OLS) . วิธีกำลังสองน้อยที่สุดช่วยให้เราได้รับการประมาณพารามิเตอร์ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของลักษณะผลลัพธ์ y จากค่าทางทฤษฎี ŷ xที่ค่าปัจจัยเดียวกัน xน้อยที่สุดนั่นคือ

5. การประเมินนัยสำคัญทางสถิติของตัวชี้วัดสหสัมพันธ์ พารามิเตอร์ของสมการถดถอยเชิงเส้นคู่ และสมการถดถอยโดยรวม

6. การประเมินระดับความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณ สัมประสิทธิ์ความแปรปรวนร่วม ตัวบ่งชี้สหสัมพันธ์: ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น, ดัชนีสหสัมพันธ์ (= อัตราส่วนสหสัมพันธ์ทางทฤษฎี)

สัมประสิทธิ์ความแปรปรวนร่วม

Mch(y) - นั่นคือ เราได้รับการพึ่งพาสหสัมพันธ์

การมีความสัมพันธ์ไม่สามารถตอบคำถามเกี่ยวกับสาเหตุของการเชื่อมต่อได้ ความสัมพันธ์กำหนดเพียงการวัดการเชื่อมต่อนี้เท่านั้น เช่น การวัดความแปรปรวนที่สอดคล้องกัน

การวัดความสัมพันธ์ระหว่างตัวแปรสองตัวสามารถพบได้โดยใช้ความแปรปรวนร่วม

, ,

ขนาดของดัชนีความแปรปรวนร่วมขึ้นอยู่กับหน่วยใน γ ของตัวแปรที่กำลังวัด ดังนั้น เพื่อประเมินระดับความแปรผันที่สอดคล้องกัน จึงใช้ค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งเป็นคุณลักษณะไร้มิติซึ่งมีช่วงของการแปรผันที่แน่นอน

7. ค่าสัมประสิทธิ์การตัดสินใจ ความคลาดเคลื่อนมาตรฐานของสมการถดถอย

ค่าสัมประสิทธิ์การกำหนด (rxy2) - แสดงลักษณะสัดส่วนของความแปรปรวนของคุณลักษณะผลลัพธ์ y อธิบายโดยความแปรปรวนใน ความแปรปรวนทั้งหมดสัญญาณที่มีประสิทธิภาพ ยิ่ง rxy2 ใกล้ถึง 1 มากเท่าไร โมเดลการถดถอยก็จะยิ่งดีเท่านั้น กล่าวคือ โมเดลดั้งเดิมจะประมาณค่าข้อมูลดั้งเดิมได้ดี

8. การประเมินนัยสำคัญทางสถิติของตัวบ่งชี้การแก้ไข พารามิเตอร์ของสมการการถดถอยเชิงเส้นคู่ และสมการถดถอยโดยรวม: ที-แบบทดสอบของนักเรียน เอฟ-เกณฑ์ชาวประมง

9. ตัวแบบการถดถอยแบบไม่เชิงเส้นและการทำให้เป็นเส้นตรง

การถดถอยแบบไม่เชิงเส้นแบ่งออกเป็นสองประเภท : การถดถอยที่ไม่เชิงเส้นตามตัวแปรอธิบายที่ไม่รวมอยู่ในการวิเคราะห์ แต่เป็นเชิงเส้นตามพารามิเตอร์ที่ประมาณไว้ และการถดถอยที่ไม่เชิงเส้นตามพารามิเตอร์ที่ประมาณไว้

ตัวอย่างของการถดถอย ไม่เชิงเส้นในตัวแปรอธิบาย, แต่เป็นเชิงเส้นในพารามิเตอร์โดยประมาณ:


ตัวแบบการถดถอยแบบไม่เชิงเส้นและการทำให้เชิงเส้นตรง

ด้วยการพึ่งพาแบบไม่เชิงเส้นของลักษณะซึ่งนำไปสู่ รูปแบบเชิงเส้น OLS ยังกำหนดพารามิเตอร์การถดถอยหลายรายการด้วย ข้อแตกต่างเพียงอย่างเดียวคือไม่ได้ใช้ ข้อมูลความเป็นมาแต่กับข้อมูลที่แปลงแล้ว ดังนั้นเมื่อพิจารณาถึงฟังก์ชันกำลัง

,

เราแปลงเป็นรูปแบบเชิงเส้น:

โดยที่ตัวแปรแสดงเป็นลอการิทึม

นอกจากนี้ การประมวลผล LSM ยังเหมือนเดิม: ระบบถูกสร้างขึ้น สมการปกติและมีการกำหนดพารามิเตอร์ที่ไม่รู้จัก โดยการเพิ่มศักยภาพของค่า เราจะพบพารามิเตอร์ และด้วยเหตุนี้ รูปแบบทั่วไปของสมการของฟังก์ชันกำลัง

โดยทั่วไปแล้ว การถดถอยแบบไม่เชิงเส้นขึ้นอยู่กับตัวแปรที่รวมไว้ไม่ก่อให้เกิดความยุ่งยากในการประมาณค่าพารามิเตอร์ การประมาณนี้ถูกกำหนดโดย OLS เช่นเดียวกับการถดถอยเชิงเส้น ดังนั้นในสมการการถดถอยไม่เชิงเส้นแบบสองปัจจัย

การทำให้เป็นเส้นตรงสามารถดำเนินการได้โดยการแนะนำตัวแปรใหม่ลงไป - ผลลัพธ์ที่ได้คือสมการการถดถอยเชิงเส้นสี่ปัจจัย

10.ความเป็นหลายเส้นตรง วิธีการกำจัด multicollinearity

ปัญหาที่ยิ่งใหญ่ที่สุดในการใช้เครื่องมือการถดถอยพหุคูณเกิดขึ้นเมื่อมีปัจจัยหลายเส้นตรง เมื่อมีปัจจัยมากกว่าสองปัจจัยเชื่อมโยงถึงกัน การพึ่งพาเชิงเส้น - การปรากฏตัวของหลายปัจจัยระหว่างปัจจัยอาจหมายความว่าปัจจัยบางอย่างจะดำเนินการพร้อมเพรียงกันเสมอ เป็นผลให้ความแปรผันของข้อมูลอินพุตไม่เป็นอิสระอย่างสมบูรณ์อีกต่อไป และไม่สามารถประเมินผลกระทบของแต่ละปัจจัยแยกกันได้

ยิ่งปัจจัยหลายเส้นตรงมีความเข้มข้นมากเท่าใด การประมาณค่าการกระจายตัวของจำนวนความแปรผันที่อธิบายไว้ระหว่างปัจจัยแต่ละตัวโดยใช้วิธีกำลังสองน้อยที่สุด (OLS) ก็มีความน่าเชื่อถือน้อยลงเท่านั้น

การรวมปัจจัยหลายสายในแบบจำลองเป็นสิ่งที่ไม่พึงประสงค์ด้วยเหตุผลต่อไปนี้:

ü เป็นการยากที่จะตีความพารามิเตอร์การถดถอยหลายตัว พารามิเตอร์การถดถอยเชิงเส้นสูญเสีย ความรู้สึกทางเศรษฐกิจ;

ü การประมาณค่าพารามิเตอร์ไม่น่าเชื่อถือ แสดงข้อผิดพลาดมาตรฐานขนาดใหญ่ และการเปลี่ยนแปลงตามการเปลี่ยนแปลงในปริมาณการสังเกต ซึ่งทำให้แบบจำลองไม่เหมาะสมสำหรับการวิเคราะห์และการพยากรณ์

วิธีการกำจัด multicollinearity

- การแยกตัวแปรออกจากแบบจำลอง

อย่างไรก็ตาม ต้องใช้ความระมัดระวังบางประการเมื่อใช้ วิธีนี้- ในสถานการณ์นี้ อาจเกิดข้อผิดพลาดเกี่ยวกับข้อกำหนดได้

- รับข้อมูลเพิ่มเติมหรือสร้างตัวอย่างใหม่

บางครั้ง เพื่อลด multicollinearity การเพิ่มขนาดตัวอย่างก็เพียงพอแล้ว ตัวอย่างเช่น หากคุณใช้ข้อมูลรายปี คุณสามารถย้ายไปยังข้อมูลรายไตรมาสได้ การเพิ่มปริมาณข้อมูลจะช่วยลดความแปรปรวนของสัมประสิทธิ์การถดถอย และทำให้นัยสำคัญทางสถิติเพิ่มขึ้น อย่างไรก็ตาม การได้รับตัวอย่างใหม่หรือขยายตัวอย่างเก่านั้นไม่สามารถทำได้เสมอไปหรือเกี่ยวข้องกับต้นทุนที่ร้ายแรง นอกจากนี้แนวทางนี้อาจเพิ่มขึ้น

ความสัมพันธ์อัตโนมัติ

- การเปลี่ยนแปลงข้อมูลจำเพาะของรุ่น

ในบางกรณี ปัญหาของ multicollinearity สามารถแก้ไขได้โดยการเปลี่ยนข้อมูลจำเพาะของโมเดล: เปลี่ยนรูปแบบของโมเดล หรือเพิ่มตัวแปรอธิบายใหม่ที่ไม่ได้คำนึงถึงในโมเดล

- การใช้ข้อมูลเบื้องต้นเกี่ยวกับพารามิเตอร์บางตัว

11.คลาสสิก โมเดลเชิงเส้นการลงทะเบียนหลายครั้ง (KLMMR) การกำหนดพารามิเตอร์ของระดับการลงทะเบียนหลายรายการโดยวิธีกำลังสองน้อยที่สุด

วัตถุประสงค์ของการบริการ- การใช้บริการใน โหมดออนไลน์สามารถพบได้:
  • พารามิเตอร์ของสมการการถดถอยเชิงเส้น y=a+bx สัมประสิทธิ์สหสัมพันธ์เชิงเส้นพร้อมการทดสอบนัยสำคัญ
  • ความใกล้ชิดของการเชื่อมต่อโดยใช้ตัวบ่งชี้สหสัมพันธ์และการกำหนด การประมาณค่า OLS ความน่าเชื่อถือคงที่ของการสร้างแบบจำลองการถดถอยโดยใช้การทดสอบ F ของฟิชเชอร์และการทดสอบทีของนักเรียน ช่วงความเชื่อมั่นของการพยากรณ์สำหรับระดับนัยสำคัญ α

สมการการถดถอยแบบคู่หมายถึง สมการการถดถอยลำดับที่หนึ่ง- หากแบบจำลองทางเศรษฐมิติมีตัวแปรอธิบายเพียงตัวแปรเดียว จะเรียกว่าการถดถอยแบบคู่ สมการการถดถอยลำดับที่สองและ สมการการถดถอยลำดับที่สามอ้างถึงสมการการถดถอยไม่เชิงเส้น

ตัวอย่าง. เลือกตัวแปรตาม (อธิบาย) และตัวแปรอธิบายเพื่อสร้างแบบจำลองการถดถอยคู่ ให้มัน. กำหนด สมการทางทฤษฎีการถดถอยแบบคู่ ประเมินความเพียงพอของแบบจำลองที่สร้างขึ้น (ตีความ R-squared, t-statistics, F-statistics)
สารละลายเราจะดำเนินการบนพื้นฐาน กระบวนการสร้างแบบจำลองทางเศรษฐมิติ.
ขั้นที่ 1 (คำแถลง) – การกำหนดเป้าหมายสุดท้ายของการสร้างแบบจำลอง ชุดของปัจจัยและตัวบ่งชี้ที่เข้าร่วมในแบบจำลอง และบทบาทของพวกเขา
ข้อกำหนดแบบจำลอง - การกำหนดวัตถุประสงค์ของการศึกษาและเลือกตัวแปรทางเศรษฐกิจของแบบจำลอง
งานตามสถานการณ์ (ภาคปฏิบัติ) สำหรับ 10 องค์กรในภูมิภาค การพึ่งพาผลผลิตต่อพนักงาน y (พันรูเบิล) ความถ่วงจำเพาะคนงาน มีคุณสมบัติสูงวี จำนวนทั้งหมดคนงาน x (เป็น%)
ขั้นที่ 2 (นิรนัย) – การวิเคราะห์ก่อนแบบจำลอง สาระสำคัญทางเศรษฐกิจปรากฏการณ์ที่กำลังศึกษา การก่อตัวและการจัดรูปแบบข้อมูลนิรนัยและการสันนิษฐานเบื้องต้น โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับธรรมชาติและการกำเนิดของข้อมูลทางสถิติเริ่มต้นและองค์ประกอบสุ่มที่เหลือในรูปแบบของสมมติฐานจำนวนหนึ่ง
ในขั้นตอนนี้ เราสามารถพูดคุยเกี่ยวกับการพึ่งพาระดับทักษะของผู้ปฏิบัติงานและผลงานของเขาได้อย่างชัดเจน เพราะยิ่งผู้ปฏิบัติงานมีประสบการณ์มากเท่าไร ผลผลิตก็จะยิ่งสูงขึ้นเท่านั้น แต่จะประเมินการพึ่งพานี้ได้อย่างไร?
การถดถอยคู่แสดงถึงการถดถอยระหว่างตัวแปรสองตัว - y และ x เช่น แบบจำลองของแบบฟอร์ม:

โดยที่ y คือตัวแปรตาม (แอตทริบิวต์ผลลัพธ์) x – ตัวแปรอิสระหรือเชิงอธิบาย (คุณลักษณะ-ปัจจัย) เครื่องหมาย “^” หมายความว่าไม่มีความสัมพันธ์เชิงฟังก์ชันที่เข้มงวดระหว่างตัวแปร x และ y ดังนั้นในเกือบทุกตัว กรณีพิเศษค่า y ประกอบด้วยคำศัพท์สองคำ:

โดยที่ y คือค่าที่แท้จริงของแอ็ตทริบิวต์ผลลัพธ์ y x – ค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ที่พบตามสมการการถดถอย ε เป็นตัวแปรสุ่มที่แสดงลักษณะความเบี่ยงเบนของค่าที่แท้จริงของคุณลักษณะที่มีประสิทธิผลจากค่าทางทฤษฎีที่พบโดยใช้สมการการถดถอย
เราจะแสดงความสัมพันธ์แบบถดถอยระหว่างผลผลิตต่อคนงานและส่วนแบ่งของคนงานที่มีคุณสมบัติสูงเป็นกราฟ


ขั้นตอนที่ 3 (การกำหนดพารามิเตอร์) – การสร้างแบบจำลองจริง เช่น ทางเลือก มุมมองทั่วไปรวมถึงองค์ประกอบและรูปแบบของความสัมพันธ์ระหว่างตัวแปรที่รวมอยู่ในนั้น การเลือกประเภทของการพึ่งพาฟังก์ชันในสมการถดถอยเรียกว่าการกำหนดพารามิเตอร์แบบจำลอง เลือก สมการถดถอยคู่, เช่น. ผลลัพธ์สุดท้าย y จะได้รับอิทธิพลจากปัจจัยเดียวเท่านั้น
ขั้นที่ 4 (ข้อมูล) – การรวบรวมสิ่งที่จำเป็น ข้อมูลทางสถิติ, เช่น. การลงทะเบียนค่าของปัจจัยและตัวชี้วัดที่เข้าร่วมในแบบจำลอง กลุ่มตัวอย่างประกอบด้วย 10 วิสาหกิจในอุตสาหกรรม
ขั้นที่ 5 (การระบุโมเดล) – การประมาณค่าพารามิเตอร์แบบจำลองที่ไม่รู้จักโดยใช้ข้อมูลทางสถิติที่มีอยู่
เราใช้เพื่อกำหนดพารามิเตอร์ของโมเดล OLS - วิธีกำลังสองน้อยที่สุด- ระบบสมการปกติจะมีลักษณะดังนี้:
n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
ในการคำนวณพารามิเตอร์การถดถอย เราจะสร้างตารางการคำนวณ (ตารางที่ 1)
xx2คุณ 2xy
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

เรานำข้อมูลจากตารางที่ 1 (แถวสุดท้าย) และด้วยเหตุนี้เราจึงได้:
10a + 171 ข = 77
171 ก + 3045 ข = 1356
เราแก้ SLAE นี้โดยใช้วิธี Cramer หรือวิธีเมทริกซ์ผกผัน
เราได้รับสัมประสิทธิ์การถดถอยเชิงประจักษ์: b = 0.3251, a = 2.1414
สมการการถดถอยเชิงประจักษ์คือ:
y = 0.3251 x + 2.1414
ขั้นตอนที่ 6 (การตรวจสอบโมเดล) – การเปรียบเทียบข้อมูลจริงและข้อมูลโมเดล การตรวจสอบความเพียงพอของโมเดล การประเมินความถูกต้องของข้อมูลโมเดล
เราทำการวิเคราะห์โดยใช้

1. คำจำกัดความและสูตรพื้นฐาน

การถดถอยคู่- การถดถอย (ความสัมพันธ์) ระหว่างสองตัวแปร ฯลฯ มุมมองแบบจำลอง:

ตัวแปรตามอยู่ที่ไหน (แอตทริบิวต์ผลลัพธ์);

- ตัวแปรอธิบายอิสระ (ปัจจัยลักษณะ)

ตัวแปรรบกวนหรือสุ่มซึ่งรวมถึงอิทธิพลของปัจจัยที่ไม่นำมาพิจารณาในแบบจำลอง

ในเกือบทุกกรณี ค่าจะประกอบด้วยคำศัพท์สองคำ:

โดยที่ค่าที่แท้จริงของแอตทริบิวต์ผลลัพธ์คือ

ค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ ซึ่งพบได้จากสมการการถดถอย เครื่องหมาย “^” หมายความว่าไม่มีความสัมพันธ์ในการทำงานที่เข้มงวดระหว่างตัวแปรและ

แยกแยะ เชิงเส้นและ ไม่เชิงเส้นการถดถอย

การถดถอยเชิงเส้นอธิบายด้วยสมการของเส้นตรง

การถดถอยแบบไม่เชิงเส้นแบ่งออกเป็นสองคลาส:

1) การถดถอย ไม่เชิงเส้นในตัวแปรอธิบาย แต่เป็นเชิงเส้นในพารามิเตอร์ที่ประมาณไว้, ตัวอย่างเช่น:

พหุนามขององศาที่ต่างกัน

ไฮเพอร์โบลาด้านเท่ากันหมด

2) การถดถอย ไม่เชิงเส้นในพารามิเตอร์โดยประมาณ, ตัวอย่างเช่น:

พลัง

บ่งชี้

เอ็กซ์โปเนนเชียล

ในการสร้างการถดถอยเชิงเส้นแบบคู่ จะมีการคำนวณปริมาณเสริม ( - จำนวนการสังเกต)

หมายถึงตัวอย่าง: และ

ความแปรปรวนร่วมตัวอย่างระหว่างและ

หรือ

ความแปรปรวนร่วม- นี้ ลักษณะเชิงตัวเลขการกระจายร่วมกันของทั้งสอง ตัวแปรสุ่ม.

ผลต่างตัวอย่างสำหรับ

หรือ

ผลต่างตัวอย่างสำหรับ

หรือ

ความแปรปรวนตัวอย่างกำหนดลักษณะระดับการกระจายตัวของค่าของตัวแปรสุ่มรอบค่าเฉลี่ย (ความแปรปรวน, ความแปรปรวน)

มีการประเมินความใกล้ชิดของการเชื่อมโยงระหว่างปรากฏการณ์ที่กำลังศึกษา ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างระหว่างและ

ค่าสัมประสิทธิ์สหสัมพันธ์จะแตกต่างกันไปตั้งแต่ -1 ถึง +1 ยิ่งใกล้จากโมดูโลถึง 1 ยิ่งใกล้มากขึ้น การพึ่งพาทางสถิติระหว่าง และ ถึงฟังก์ชันเชิงเส้น

ถ้า =0 แล้ว การเชื่อมต่อเชิงเส้นระหว่างและหายไป;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

ค่าบวกของสัมประสิทธิ์บ่งชี้ว่าความสัมพันธ์ระหว่างคุณลักษณะนั้นตรง (โดยการเติบโตค่าจะเพิ่มขึ้น) ค่าลบบ่งชี้ความสัมพันธ์แบบผกผัน (โดยการเติบโตค่าจะลดลง)

การสร้างการถดถอยเชิงเส้นลงมาเพื่อประมาณค่าพารามิเตอร์และวิธีการแบบคลาสสิกในการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นนั้นขึ้นอยู่กับ วิธีกำลังสองน้อยที่สุด(เอ็มเอ็นซี) วิธีกำลังสองน้อยที่สุดช่วยให้ได้รับการประมาณค่าพารามิเตอร์ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของคุณสมบัติผลลัพธ์จากค่าทางทฤษฎีมีค่าน้อยที่สุดนั่นคือ

สำหรับการถดถอยเชิงเส้น พารามิเตอร์ และ พบได้จากระบบสมการปกติ:

เราพบการแก้ปัญหาระบบ วีบน

และพารามิเตอร์

ค่าสัมประสิทธิ์โดยมีตัวแปรแฟคเตอร์แสดงว่าค่าเฉลี่ยจะเปลี่ยนแปลงไปเท่าใดเมื่อแฟคเตอร์เปลี่ยนแปลงตามหน่วยการวัด

พารามิเตอร์เมื่อ If ไม่สามารถเท่ากับ 0 ได้ แสดงว่าไม่มีความหมายทางเศรษฐกิจ คุณสามารถตีความเครื่องหมายได้ก็ต่อเมื่อการเปลี่ยนแปลงสัมพัทธ์ในผลลัพธ์เกิดขึ้นช้ากว่าการเปลี่ยนแปลงปัจจัย กล่าวคือ ความแปรผันของผลลัพธ์จะน้อยกว่าความแปรผันของปัจจัยและในทางกลับกัน

คุณสามารถใช้เพื่อประเมินคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น ค่าสัมประสิทธิ์การตัดสินใจหรือ ข้อผิดพลาดในการประมาณค่าเฉลี่ย.

ถึงค่าสัมประสิทธิ์การตัดสินใจ

หรือ

แสดงส่วนแบ่งของความแปรปรวนที่อธิบายโดยการถดถอยในความแปรปรวนรวมของลักษณะผลลัพธ์ ดังนั้นค่าจึงระบุถึงส่วนแบ่งของความแปรปรวนของตัวบ่งชี้ที่เกิดจากอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลองและเหตุผลอื่น ๆ

ยิ่งเข้าใกล้ 1 มากเท่าใด โมเดลการถดถอยก็จะยิ่งดีเท่านั้น เช่น แบบจำลองที่สร้างขึ้นนั้นใกล้เคียงกับข้อมูลดั้งเดิมเป็นอย่างดี

ข้อผิดพลาดในการประมาณค่าเฉลี่ย- นี่คือค่าเบี่ยงเบนสัมพัทธ์โดยเฉลี่ยของค่าทางทฤษฎีจากค่าจริงเช่น

สมการถดถอยที่สร้างขึ้นถือว่าน่าพอใจหากค่าไม่เกิน 10-12%

สำหรับการถดถอยเชิงเส้น ค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยพบได้จากสูตร:

ค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยแสดงโดยเปอร์เซ็นต์โดยเฉลี่ยที่ผลลัพธ์จะเปลี่ยนจากค่าของมัน เมื่อปัจจัยเปลี่ยนแปลง 1% ของมูลค่า

เรตติ้งนาชิโมสต์และสมการถดถอยโดยทั่วไปให้โดยใช้การทดสอบฟิชเชอร์ซึ่งประกอบด้วยการทดสอบสมมติฐานเกี่ยวกับความไม่สำคัญทางสถิติของสมการถดถอย . เมื่อต้องการทำเช่นนี้ จะทำการเปรียบเทียบ แท้จริงท้องฟ้าและ วิกฤต(ตาราง) ค่า - การทดสอบฟิชเชอร์ .

กำหนดจากอัตราส่วนของค่าปัจจัยและความแปรปรวนคงเหลือที่คำนวณตามระดับความเป็นอิสระ กล่าวคือ

- ค่าสูงสุดที่เป็นไปได้ของเกณฑ์ภายใต้อิทธิพลของปัจจัยสุ่มที่มีระดับความอิสระ =1, =-2 และระดับนัยสำคัญพบได้จากตารางเกณฑ์ฟิชเชอร์ (ตารางที่ 1 ของภาคผนวก)

ระดับความสำคัญ- นี่คือความน่าจะเป็นที่จะปฏิเสธสมมติฐานที่ถูกต้องเนื่องจากเป็นจริง

ถ้า จากนั้นสมมติฐานเกี่ยวกับการไม่มีการเชื่อมโยงระหว่างตัวบ่งชี้ที่ศึกษาและปัจจัยจะถูกปฏิเสธ และมีการสรุปเกี่ยวกับความสำคัญของการเชื่อมโยงนี้กับระดับนัยสำคัญ (เช่น สมการถดถอยมีนัยสำคัญ)

ถ้า จากนั้นสมมติฐานจะได้รับการยอมรับและตระหนักถึงความไม่มีนัยสำคัญทางสถิติและความไม่น่าเชื่อถือของสมการการถดถอย

สำหรับการถดถอยเชิงเส้น ความสำคัญค่าสัมประสิทธิ์การถดถอยประเมินการใช้งาน - การทดสอบของนักเรียนตามที่มีการเสนอสมมติฐานเกี่ยวกับลักษณะการสุ่มของตัวบ่งชี้ ได้แก่ เกี่ยวกับความแตกต่างเล็กน้อยจากศูนย์ ถัดไปค่าที่แท้จริงของเกณฑ์จะถูกคำนวณสำหรับแต่ละค่าสัมประสิทธิ์การถดถอยโดยประมาณเช่น

ที่ไหนและ - ข้อผิดพลาดมาตรฐานพารามิเตอร์การถดถอยเชิงเส้นถูกกำหนดโดยสูตร:

- ค่าสูงสุดที่เป็นไปได้ของการทดสอบของนักเรียนภายใต้อิทธิพลของปัจจัยสุ่มสำหรับระดับความอิสระที่กำหนด = -2 และระดับนัยสำคัญพบได้จากตารางการทดสอบของนักเรียน (ตารางที่ 2 ของภาคผนวก)

ถ้า จากนั้นสมมติฐานเกี่ยวกับความไม่สำคัญของสัมประสิทธิ์การถดถอยจะถูกปฏิเสธด้วยระดับนัยสำคัญเช่น ค่าสัมประสิทธิ์ (หรือ) ไม่ได้แตกต่างจากศูนย์โดยไม่ได้ตั้งใจและถูกสร้างขึ้นภายใต้อิทธิพลของปัจจัยที่ออกฤทธิ์อย่างเป็นระบบ

ถ้า จากนั้นสมมติฐานจะไม่ถูกปฏิเสธและลักษณะการสุ่มของการก่อตัวของพารามิเตอร์ได้รับการยอมรับ

ความสำคัญของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นตรวจสอบด้วย - การทดสอบของนักเรียนเช่น

สมมติฐานเกี่ยวกับความไม่มีนัยสำคัญของสัมประสิทธิ์สหสัมพันธ์ถูกปฏิเสธด้วยระดับนัยสำคัญหาก

ความคิดเห็นสำหรับการถดถอยคู่เชิงเส้น การทดสอบสมมติฐานเกี่ยวกับความสำคัญของสัมประสิทธิ์และสัมประสิทธิ์สหสัมพันธ์จะเทียบเท่ากับการทดสอบสมมติฐานเกี่ยวกับความสำคัญของสมการการถดถอยโดยรวม กล่าวคือ

ในการคำนวณช่วงความเชื่อมั่น ให้กำหนด ข้อผิดพลาดเล็กน้อยสำหรับแต่ละตัวชี้วัด ได้แก่

ช่วงความมั่นใจสำหรับค่าสัมประสิทธิ์การถดถอยเชิงเส้น:

หากศูนย์อยู่ในช่วงความเชื่อมั่น กล่าวคือ ขีดจำกัดล่างเป็นลบและขีดจำกัดบนเป็นค่าบวก จากนั้นพารามิเตอร์ที่ประมาณไว้จะถือเป็นศูนย์ เนื่องจาก ไม่สามารถรับความหมายทั้งเชิงบวกและเชิงลบในเวลาเดียวกันได้

ค่าพยากรณ์ถูกกำหนดโดยการแทนที่ค่าที่ทำนายไว้ที่สอดคล้องกันลงในสมการการถดถอย จากนั้นจึงคำนวณ หมายถึงข้อผิดพลาดมาตรฐานของการพยากรณ์

ที่ไหน

และกำลังถูกสร้างขึ้น คาดการณ์ช่วงความเชื่อมั่น

ช่วงเวลาอาจค่อนข้างกว้างเนื่องจากมีการสังเกตปริมาณน้อย

การถดถอย ไม่เชิงเส้นในตัวแปรที่รวมอยู่ , จะลดลงเป็นรูปแบบเชิงเส้นโดยการเปลี่ยนแปลงตัวแปรอย่างง่าย และการประมาณค่าพารามิเตอร์เพิ่มเติมจะดำเนินการโดยใช้กำลังสองน้อยที่สุด

ไฮเปอร์โบลาการถดถอยแบบอิคัล:

การรุกราน , ไม่เชิงเส้น ตามพารามิเตอร์ที่ประเมิน , แบ่งออกเป็น 2 ประเภท คือ ภายในไม่เชิงเส้นฯลฯ (ไม่ลดเป็นรูปแบบเชิงเส้น) และ เชิงเส้นภายใน(ลดเป็นรูปแบบเชิงเส้นโดยใช้การแปลงที่เหมาะสม) เช่น

การถดถอยเอ็กซ์โปเนนเชียล:

การแปลงเชิงเส้น:

การถดถอยของกำลัง:

การแปลงเชิงเส้น:

ตัวบ่งชี้การถดถอยใหม่:

การแปลงเชิงเส้น:

ลอการิทึมการถดถอย:

การแปลงเชิงเส้น:

2. แก้ไขปัญหาทั่วไป

ตัวอย่าง9 .1 . สำหรับวิสาหกิจทางการเกษตร 15 แห่ง (ตารางที่ 9.1) เป็นที่ทราบกันดังต่อไปนี้: - จำนวนอุปกรณ์ต่อหน่วยพื้นที่หว่าน (หน่วย/เฮกตาร์) และ - ปริมาณผลผลิตที่ปลูก (พันหน่วยการเงิน) จำเป็น:

1) กำหนดการพึ่งพา

2) สร้างเขตข้อมูลสหสัมพันธ์และกราฟของสมการถดถอยเชิงเส้นบน

3) สรุปเกี่ยวกับคุณภาพของแบบจำลองและคำนวณค่าพยากรณ์ด้วยค่าพยากรณ์ 112% ของระดับเฉลี่ย

ตารางที่ 9.1

สารละลาย:

1) ใน Excel สร้างตารางเสริม 9.2

ตารางที่ 9.2

ข้าว.9 .1. ตารางการคำนวณค่ากลาง

มาคำนวณจำนวนการวัดกัน โดยทำในเซลล์ บี19ใส่ = นับ(A2:A16 ) .

การใช้ฟังก์ชัน ∑ (ผลรวมอัตโนมัติ) บนแถบเครื่องมือ มาตรฐาน นายา หาผลรวมของทั้งหมด (เซลล์ B17) และ (เซลล์ ค17).

ข้าว. 9.2. การคำนวณผลรวมของค่าและค่าเฉลี่ย

ในการคำนวณค่าเฉลี่ย เราใช้ฟังก์ชัน MS Excel ในตัว AVERAGE() ช่วงของค่าในการกำหนดค่าเฉลี่ยจะแสดงอยู่ในวงเล็บ ดังนั้นปริมาณเฉลี่ยของผลิตภัณฑ์ที่ปลูกใน 15 ฟาร์มคือ 210.833 พันพัน หน่วย และจำนวนอุปกรณ์เฉลี่ย 6.248 หน่วย/เฮกตาร์

เพื่อเติมคอลัมน์ ดี, อี, เอฟใส่สูตรคำนวณผลคูณ: ลงในเซลล์ ดี2 ใส่ = B2*C2จากนั้นกด ENTER บนคีย์บอร์ดของคุณ คลิกซ้ายที่เซลล์ ดี2 และจับมุมขวาล่างของเซลล์นี้ (เครื่องหมายบวกสีดำ) แล้วดึงลงไปที่เซลล์ ดี16 - ช่วงจะถูกเติมโดยอัตโนมัติ ดี3 - ดี16 .

ในการคำนวณ เลือกสรรโอ้ ความแปรปรวนร่วมระหว่าง และ เราใช้สูตรคือ ไปที่เซลล์ บี21 ใส่ = ดี18- บี18* 18 และเราได้ 418.055 (รูปที่ 9.3)

ข้าว.9 .3. การคำนวณ

คัดเลือกว้าวการกระจายตัวคุณเพราะเราหาได้จากสูตร สำหรับสิ่งนี้ในเซลล์ บี22 ใส่ = E18-B18^2 (^- เครื่องหมายแสดงการยกกำลัง ) และเราได้ 11.337 ในทำนองเดียวกัน เรากำหนด =16745.05556 (รูปที่ 9.4)

ข้าว.9 .4. การคำนวณวาร์(x) และวาร์ ()

ต่อไป เมื่อใช้ฟังก์ชัน MS Excel มาตรฐาน "CORREL" เราจะคำนวณค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นสำหรับปัญหาของเรา โดยฟังก์ชันจะมีรูปแบบ "=CORREL(B2:B16;C2:C16)" และค่า rxy= 0.96. ค่าผลลัพธ์ของค่าสัมประสิทธิ์สหสัมพันธ์บ่งชี้ถึงความสัมพันธ์โดยตรงและแข็งแกร่งระหว่างความพร้อมของอุปกรณ์และปริมาณของผลิตภัณฑ์ที่ปลูก

เราพบ วีตัวอย่างสัมประสิทธิ์การถดถอยเชิงเส้น =36.87; พารามิเตอร์ = -17.78 ซึ่งหมายความว่าสมการการถดถอยเชิงเส้นคู่มีรูปแบบ =-17.78+36.87

ค่าสัมประสิทธิ์แสดงให้เห็นว่าเมื่อปริมาณอุปกรณ์เพิ่มขึ้น 1 หน่วย/เฮกตาร์ ปริมาณผลิตภัณฑ์ที่ปลูกจะเพิ่มขึ้นโดยเฉลี่ย 36.875 พันชิ้น หน่วย (รูปที่ 9.5)

ข้าว.9 .5. การคำนวณพารามิเตอร์สมการถดถอย

ดังนั้นสมการถดถอยจะมีลักษณะดังนี้:

เราแทนค่าจริงลงในสมการผลลัพธ์ x(ปริมาณของอุปกรณ์) เราค้นหาค่าทางทฤษฎีของปริมาตรของผลิตภัณฑ์ที่ปลูก (รูปที่ 9.6)

ข้าว.9 .6. การคำนวณค่าทางทฤษฎีของปริมาตรของผลิตภัณฑ์ที่ปลูก

โดยใช้ ตัวช่วยสร้างแผนภูมิเราสร้างฟิลด์สหสัมพันธ์ (เน้นคอลัมน์ด้วยค่า และ ) และสมการถดถอยเชิงเส้น (เน้นคอลัมน์ด้วยค่า และ ) การเลือกประเภทแผนภูมิ - ปรากฏการณ์ ในไดอะแกรมผลลัพธ์ ให้กรอกพารามิเตอร์ที่จำเป็น (ชื่อ ป้ายกำกับแกน คำอธิบาย ฯลฯ) เป็นผลให้เราได้กราฟที่แสดงในรูปที่ 1 9.7.

ข้าว.9 .7. กราฟของการพึ่งพาปริมาณของผลิตภัณฑ์ที่ปลูกกับจำนวนอุปกรณ์

เพื่อประเมินคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น เราคำนวณ:

. ถึงค่าสัมประสิทธิ์การตัดสินใจ=0.92 ซึ่งแสดงให้เห็นว่า 92% ของการเปลี่ยนแปลงต้นทุนการผลิตอธิบายได้จากการเปลี่ยนแปลงในปริมาณการผลิต และ 8% เกิดจากปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง ซึ่งบ่งบอกถึงคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น

. กับสีแดงยูยูข้อผิดพลาดที่การประมาณ. เมื่อต้องการทำเช่นนี้ในคอลัมน์ ชมลองคำนวณความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎี a ในคอลัมน์ ฉัน- การแสดงออก. โปรดทราบว่าฟังก์ชัน MS Excel มาตรฐาน "ABS" ใช้ในการคำนวณค่าโมดูโล เมื่อคูณค่าเฉลี่ย (เซลล์ ฉัน18 ) ที่ 100% เราได้ 18.2% ดังนั้นโดยเฉลี่ยแล้วค่าทางทฤษฎีจึงเบี่ยงเบนไปจากค่าจริง 18.2% (รูปที่ 1.8)

เราประมาณการโดยใช้เกณฑ์ฟิชเชอร์ ชม.นาชิโมสต์สมการลงทะเบียนกับสิ่งเหล่านี้โดยทั่วไป: 150,74.

ที่ระดับนัยสำคัญ 0.05 = 4.67 เราพิจารณาโดยใช้ฟังก์ชันทางสถิติในตัว เร็วขึ้น(รูปที่ 1.9) จำเป็นต้องจำไว้ว่า "Degrees_freedom1" เป็นตัวส่วนและ "Degrees_freedom2" เป็นตัวเศษโดยที่จำนวนพารามิเตอร์ในสมการการถดถอยคือ (เรามี 2) n- จำนวนคู่ค่าเริ่มต้น (เรามี 15)

เพราะ ดังนั้นสมการถดถอยจะมีนัยสำคัญที่ =0.05

ข้าว.9 .8. การหาค่าสัมประสิทธิ์การตัดสินใจและข้อผิดพลาดในการประมาณค่าเฉลี่ย

ข้าว. 9 . 9 . กล่องโต้ตอบฟังก์ชั่นเร็วขึ้น

ต่อไปเราจะกำหนด กับค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยตามสูตร ผลการวิจัยพบว่าเมื่อปริมาณผลิตภัณฑ์ที่ผลิตเพิ่มขึ้น 1% ต้นทุนการผลิตผลิตภัณฑ์เหล่านี้โดยเฉลี่ยโดยรวมจะเพิ่มขึ้น 1.093%

มาคำนวณกัน มูลค่าการคาดการณ์โดยแทนลงในสมการถดถอย =-19.559+36.8746 ค่าทำนายของตัวประกอบ =1.12=6.248*1.12=6.9978 เราได้ =238.48. ดังนั้นด้วยจำนวนอุปกรณ์จำนวน 6.9978 หน่วย/เฮกตาร์ ปริมาณผลผลิตจะอยู่ที่ 238.48 พันหน่วย หน่วย

มาหาความแปรปรวนที่เหลือ โดยคำนวณผลรวมของกำลังสองของความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎี =39.166 ใส่สูตรดังนี้ = รูท(J17/(B19-2))ไปที่เซลล์ ชม2 1 (รูปที่ 9.10)

ข้าว.9 .10. การหาค่าความแปรปรวนคงเหลือ

กับสีแดงญาญ่ามาตรฐานข้อผิดพลาดครั้งที่พยากรณ์:

ที่ระดับนัยสำคัญ = 0.05 โดยใช้ฟังก์ชันทางสถิติในตัว นักศึกษาลองกำหนด =2.1604 แล้วคำนวณค่าความคลาดเคลื่อนการคาดการณ์สูงสุด ซึ่งใน 95% ของกรณีจะไม่เกิน .

ดีคาดการณ์ช่วงความเชื่อมั่น:

หรือ .

การคาดการณ์ต้นทุนการผลิตที่สมบูรณ์มีความน่าเชื่อถือ (1-0.05 = 0.95) แต่ไม่ถูกต้อง เนื่องจากช่วงของขีดจำกัดบนและล่างของช่วงความเชื่อมั่นคือ ครั้ง สิ่งนี้เกิดขึ้นเนื่องจากการสังเกตปริมาณน้อย

จะต้องสังเกตว่า MS Excel มีฟังก์ชันทางสถิติในตัวซึ่งสามารถลดจำนวนการคำนวณระดับกลางได้อย่างมากเช่น (รูปที่ 9.11):

เพื่อคำนวณ วีเลือกสรรเอ็กซ์เฉลี่ยเอ็กซ์ใช้ฟังก์ชัน ค่าเฉลี่ย(หมายเลข 1:หมายเลขเอ็น) จากหมวดหมู่ เชิงสถิติ .

ความแปรปรวนร่วมตัวอย่างระหว่าง และ พบได้โดยใช้ฟังก์ชัน โควาร์(arrayเอ็กซ์;อาร์เรย์) จากหมวดหมู่ เชิงสถิติ .

คัดเลือกการกระจายตัวและกำหนดโดยฟังก์ชันทางสถิติ DISPR(หมายเลข 1:หมายเลขเอ็น) .

ข้าว.9 .11. การคำนวณผู้ให้บริการที่มีฟังก์ชันในตัวนางสาวเอ็กเซล

พารามิเตอร์การถดถอยเชิงเส้นใน Excel คุณสามารถกำหนดได้หลายวิธี

1 ทาง) การใช้ฟังก์ชันในตัว ไลน์- ขั้นตอนมีดังนี้:

1. เลือกพื้นที่ 5x2 ของเซลล์ว่าง (5 แถว 2 คอลัมน์) เพื่อแสดงผลลัพธ์ของสถิติการถดถอย หรือพื้นที่ 1x2 เพื่อให้ได้เฉพาะค่าสัมประสิทธิ์การถดถอย

2. ด้วย ตัวช่วยสร้างฟังก์ชั่นท่ามกลาง เชิงสถิติ เลือกฟังก์ชั่น ไลน์และกรอกข้อโต้แย้ง (รูปที่ 9.12):

ข้าว. 9 . 12 . กล่องโต้ตอบสำหรับป้อนอาร์กิวเมนต์ของฟังก์ชันไลน์

รู้จัก_ค่า_

รู้จัก_ค่า_x

- ค่าตรรกะ (1 หรือ 0) ซึ่งบ่งชี้ว่ามีหรือไม่มีคำศัพท์อิสระในสมการ ชุดที่ 1;

สถิติ- ค่าตรรกะ (1 หรือ 0) ซึ่งระบุว่าจะแสดงข้อมูลเพิ่มเติมเกี่ยวกับการวิเคราะห์การถดถอยหรือไม่ ตั้งเป็น 1

3. หมายเลขแรกของตารางจะปรากฏในเซลล์ด้านซ้ายบนของพื้นที่ที่เลือก หากต้องการเปิดทั้งตาราง ให้กดปุ่ม < เอฟ2> แล้ว - ไปที่คีย์ผสม < CTRL> + < กะ> + < เข้า> .

สถิติการถดถอยเพิ่มเติมจะแสดงเป็น (ตาราง 9.3):

ตารางที่ 9.3

ค่าสัมประสิทธิ์

ค่าสัมประสิทธิ์

อาร์เอ็มเอส
ส่วนเบี่ยงเบน

อาร์เอ็มเอส
ส่วนเบี่ยงเบน

ค่าสัมประสิทธิ์
การกำหนด

อาร์เอ็มเอส
ส่วนเบี่ยงเบน

สถิติ

จำนวนองศาความเป็นอิสระ

ผลรวมการถดถอยของกำลังสอง

ผลรวมที่เหลือของกำลังสอง

อันเป็นผลมาจากการประยุกต์ใช้ฟังก์ชัน ไลน์เราได้รับ:

( 2 ทาง) การใช้เครื่องมือวิเคราะห์ข้อมูล การถดถอย คุณสามารถรับผลลัพธ์ของสถิติการถดถอย การวิเคราะห์ความแปรปรวน, ช่วงความเชื่อมั่น, ค่าตกค้าง, กราฟการปรับเส้นการถดถอย, กราฟค่าตกค้าง และ ความน่าจะเป็นปกติ- ขั้นตอนมีดังนี้:

1. คุณต้องตรวจสอบการเข้าถึง แพ็คเกจการวิเคราะห์- โดยไปที่เมนูหลัก (ผ่านปุ่ม ไมโครซอฟต์ ออฟฟิศเข้าถึงตัวเลือก MS Excel) ในกล่องโต้ตอบตัวเลือก นางสาวเอ็กเซล» เลือกคำสั่ง “ส่วนเสริม” และเลือกส่วนเสริมทางด้านขวา การวิเคราะห์แพ็คเกจ จากนั้นคลิกปุ่ม "ไป" (รูปที่ 9.13) ในกล่องโต้ตอบที่เปิดขึ้น ให้ทำเครื่องหมายในช่องถัดจาก "แพ็คเกจการวิเคราะห์" และคลิก "ตกลง" (รูปที่ 9.14)

บนแท็บข้อมูล ในกลุ่มการวิเคราะห์ คุณจะสามารถเข้าถึง Add-in ที่ติดตั้งไว้ได้ (รูปที่ 9.15)

ข้าว.9 .13. เปิดใช้งานส่วนเสริมในนางสาวเอ็กเซล

ข้าว.9 .14. กล่องโต้ตอบ Add-Ins

ข้าว.9 .15. Add-in การวิเคราะห์ข้อมูลบน Ribbonนางสาวเอ็กเซล 2007 .

2. เลือก “ข้อมูล” ในกลุ่ม “การวิเคราะห์” และเลือกคำสั่ง การวิเคราะห์ใช่ n nykh ในกล่องโต้ตอบที่เปิดขึ้น เลือกเครื่องมือวิเคราะห์ "การถดถอย" และคลิก "ตกลง" (รูปที่ 9.16):

ข้าว.9 .16. กล่องโต้ตอบการวิเคราะห์ข้อมูล

ในกล่องโต้ตอบที่ปรากฏขึ้น (รูปที่ 9.17) ให้กรอกข้อมูลในฟิลด์:

ช่วงเวลาอินพุต- ช่วงที่มีข้อมูลของลักษณะผลลัพธ์ Y

ช่วงเวลาอินพุตเอ็กซ์- ช่วงที่มีข้อมูลที่มีลักษณะอธิบาย X;

แท็ก- ธงที่ระบุว่าบรรทัดแรกมีชื่อคอลัมน์หรือไม่

แอนต้า-ศูนย์- ธงแสดงการมีหรือไม่มีคำอิสระในสมการ

ช่วงเอาท์พุต- เพียงพอที่จะระบุเซลล์ด้านซ้ายบนของช่วงอนาคต

แผ่นงานใหม่- คุณสามารถตั้งชื่อที่กำหนดเองสำหรับแผ่นงานใหม่ที่จะแสดงผลลัพธ์

ข้าว.9 .17. กล่องโต้ตอบการถดถอย

หากต้องการรับข้อมูลเกี่ยวกับปริมาณคงเหลือ แปลงคงเหลือ ความเหมาะสม และความน่าจะเป็นปกติ คุณจะต้องทำเครื่องหมายในช่องที่เหมาะสมในกล่องโต้ตอบ

ข้าว. 9 . 18 . ผลลัพธ์จากการใช้เครื่องมือการถดถอย

ใน นางสาวเอ็กเซล เส้นแนวโน้มสามารถเพิ่มลงในแผนภูมิพื้นที่ฮิสโตแกรมหรือกราฟได้ เมื่อต้องการทำสิ่งนี้:

1. จำเป็นต้องเลือกพื้นที่การลงจุดแผนภูมิและเลือก "เค้าโครง" ใน Ribbon และในกลุ่มการวิเคราะห์ให้เลือกคำสั่ง "เส้นแนวโน้ม" (รูปที่ 9.19) เลือก "ตัวเลือกเส้นแนวโน้มขั้นสูง" จากรายการเมนูแบบเลื่อนลง

ข้าว. 1.19.ริบบิ้น

2. ในกล่องโต้ตอบที่ปรากฏขึ้น ให้เลือกค่าจริง จากนั้นกล่องโต้ตอบ "รูปแบบเส้นแนวโน้ม" จะเปิดขึ้น (รูปที่ 9.20) ซึ่งคุณเลือกประเภทของเส้นแนวโน้มและตั้งค่าพารามิเตอร์ที่เหมาะสม

ข้าว. 9 . 20 . กล่องโต้ตอบ"รูปแบบเส้นแนวโน้ม"

สำหรับแนวโน้มพหุนาม จำเป็นต้องกำหนดระดับของพหุนามโดยประมาณ การกรองเชิงเส้น- จำนวนคะแนนเฉลี่ย

เลือก เชิงเส้นเพื่อสร้างสมการถดถอยเชิงเส้น

เช่น ข้อมูลเพิ่มเติมสามารถ แสดงสมการใน diกรัมและ วางค่าบนไดอะแกรม(รูปที่ 9.21)

ข้าว. 9 . 21 . แนวโน้มเชิงเส้น

ตัวแบบการถดถอยแบบไม่เชิงเส้น จะแสดงไว้เมื่อคำนวณพารามิเตอร์ของสมการโดยใช้ฟังก์ชันทางสถิติที่เลือกใน Excel GRFPRIBL- ขั้นตอนการคำนวณเหมือนกับการใช้ฟังก์ชัน LINEST

รูปแบบการถดถอยที่ง่ายที่สุดจากมุมมองของความเข้าใจ การตีความ และเทคนิคการคำนวณคือรูปแบบการถดถอยเชิงเส้น

สมการการถดถอยคู่เชิงเส้น โดยที่

a 0 , a 1 เป็นพารามิเตอร์โมเดล ε i เป็นตัวแปรสุ่ม (ค่าส่วนที่เหลือ)

พารามิเตอร์โมเดลและเนื้อหา:


สมการถดถอยเสริมด้วยตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อ ตัวบ่งชี้ดังกล่าวคือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นซึ่งคำนวณโดยใช้สูตร:

หรือ .

เพื่อประเมินคุณภาพการคัดเลือก ฟังก์ชันเชิงเส้นกำลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นถูกคำนวณเรียกว่า ค่าสัมประสิทธิ์การตัดสินใจ- ค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของลักษณะที่มีประสิทธิผล อธิบายโดยการถดถอยของความแปรปรวนรวมของลักษณะที่มีประสิทธิผล:

,

ที่ไหน

.

ดังนั้น ค่านี้จะระบุถึงส่วนแบ่งของความแปรปรวนที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้นำมาพิจารณาในแบบจำลอง

หลังจากสร้างสมการการถดถอยแล้ว จะมีการตรวจสอบความเพียงพอและความแม่นยำของแบบจำลองโดยอาศัยการวิเคราะห์จำนวนคงเหลือ ε i (ค่าเบี่ยงเบนของค่าที่คำนวณจากค่าจริง)

ระดับชุดสารตกค้าง

ความสัมพันธ์และ การวิเคราะห์การถดถอยดำเนินการสำหรับประชากรจำนวนจำกัด ในเรื่องนี้ ตัวบ่งชี้การถดถอย ความสัมพันธ์ และการกำหนดอาจถูกบิดเบือนโดยการกระทำของปัจจัยสุ่ม ในการตรวจสอบว่าตัวบ่งชี้เหล่านี้มีลักษณะทั่วไปสำหรับประชากรทั้งหมดเพียงใด และไม่ว่าจะเป็นผลมาจากความบังเอิญของสถานการณ์สุ่มหรือไม่ จำเป็นต้องตรวจสอบความเพียงพอของแบบจำลองที่สร้างขึ้น

การตรวจสอบความเพียงพอของแบบจำลองประกอบด้วยการกำหนดความสำคัญของแบบจำลองและการกำหนดว่ามีหรือไม่มีอยู่ ข้อผิดพลาดอย่างเป็นระบบ.

ค่านิยม เวลา 1สอดคล้องกับข้อมูล เอ็กซ์ฉันตามค่าทางทฤษฎี 0และ 1,สุ่ม ค่าสัมประสิทธิ์ที่คำนวณจากนั้นจะเป็นแบบสุ่มเช่นกัน 0และ 1.

มีการตรวจสอบความสำคัญของสัมประสิทธิ์การถดถอยแต่ละรายการโดยใช้ แบบทดสอบของนักเรียนโดยทดสอบสมมติฐานว่าค่าสัมประสิทธิ์การถดถอยแต่ละค่ามีค่าเท่ากับศูนย์ ในเวลาเดียวกันพวกเขาพบว่าพารามิเตอร์ที่คำนวณนั้นโดยทั่วไปสำหรับการแสดงชุดเงื่อนไข: ค่าพารามิเตอร์ที่ได้รับนั้นเป็นผลมาจากการกระทำของตัวแปรสุ่มหรือไม่ สูตรที่เหมาะสมสำหรับค่าสัมประสิทธิ์การถดถอยที่สอดคล้องกัน

สูตรการพิจารณาค่าทีของนักเรียน

ที่ไหน

S a 0 ,S a 1 - ส่วนเบี่ยงเบนมาตรฐานของเทอมอิสระและสัมประสิทธิ์การถดถอย กำหนดโดยสูตร

ที่ไหน

ส ε - ส่วนเบี่ยงเบนมาตรฐานแบบจำลองคงเหลือ (ความคลาดเคลื่อนมาตรฐานของการประมาณค่า) ซึ่งกำหนดโดยสูตร

ค่าที่คำนวณได้ของการทดสอบทีจะถูกเปรียบเทียบกับค่าที่ทำเป็นตารางของเกณฑ์ ทีαγ ซึ่งถูกกำหนดเมื่อ (n - เค— 1) ระดับความเป็นอิสระและระดับนัยสำคัญที่สอดคล้องกัน α หากค่าที่คำนวณได้ของเกณฑ์ t เกินค่าตาราง ทีαγ ดังนั้นพารามิเตอร์จึงถือว่ามีนัยสำคัญ ในกรณีนี้แทบจะเป็นไปไม่ได้เลยที่ค่าพารามิเตอร์ที่พบนั้นเกิดจากความบังเอิญแบบสุ่มเท่านั้น

ความสำคัญของสมการการถดถอยโดยรวมได้รับการประเมินบนพื้นฐานของการทดสอบของฟิชเชอร์ ซึ่งนำหน้าด้วยการวิเคราะห์ความแปรปรวน

ผลรวมของการเบี่ยงเบนกำลังสองของตัวแปรจากค่าเฉลี่ยแบ่งออกเป็นสองส่วน - "อธิบาย" และ "ไม่ได้อธิบาย":

ผลรวมของการเบี่ยงเบนกำลังสอง

ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอย (หรือผลรวมตัวประกอบของการเบี่ยงเบนกำลังสอง)


- ผลรวมที่เหลือของการเบี่ยงเบนกำลังสองซึ่งแสดงถึงอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง

การวิเคราะห์รูปแบบความแปรปรวนมีรูปแบบที่นำเสนอในตารางที่ 35 ( - จำนวนการสังเกต - จำนวนพารามิเตอร์สำหรับตัวแปร)

ตารางที่ 35 - การวิเคราะห์รูปแบบความแปรปรวน

ส่วนประกอบความแปรปรวน ผลรวมของกำลังสอง จำนวนองศาความเป็นอิสระ การกระจายตัวต่อระดับความเป็นอิสระ
ทั่วไป
แฟกทอเรียล
สารตกค้าง

การกำหนดความแปรปรวนด้วยอิสระระดับหนึ่งจะทำให้ความแปรปรวนมีรูปแบบที่เทียบเคียงได้ เมื่อเปรียบเทียบปัจจัยและความแปรปรวนคงเหลือต่อระดับความเป็นอิสระ เราได้ค่าของเกณฑ์ฟิชเชอร์:

หากต้องการทดสอบความสำคัญของสมการการถดถอยโดยรวม ให้ใช้ การทดสอบ F ของฟิชเชอร์. ในกรณีของการถดถอยเชิงเส้นแบบคู่ ความสำคัญของแบบจำลองการถดถอยจะถูกกำหนดโดยสูตรต่อไปนี้: .

หาก ณ ระดับนัยสำคัญที่กำหนด หากค่าที่คำนวณได้ของเกณฑ์ F ที่มี γ 1 =k, γ 2 =( พี - เค - 1) ระดับความเป็นอิสระมากกว่าที่ตาราง จากนั้นถือว่าแบบจำลองมีนัยสำคัญ สมมติฐานเกี่ยวกับลักษณะสุ่มของคุณลักษณะที่ประมาณไว้ถูกปฏิเสธ และ นัยสำคัญทางสถิติและความน่าเชื่อถือ การตรวจสอบการมีหรือไม่มีข้อผิดพลาดอย่างเป็นระบบ (การปฏิบัติตามข้อกำหนดเบื้องต้นของวิธีกำลังสองน้อยที่สุด - LSM) ดำเนินการตามการวิเคราะห์จำนวนคงเหลือ การคำนวณข้อผิดพลาดแบบสุ่มของพารามิเตอร์การถดถอยเชิงเส้นและค่าสัมประสิทธิ์สหสัมพันธ์จะดำเนินการตามสูตร

,

หากต้องการทดสอบความสุ่มของชุดสารตกค้าง คุณสามารถใช้การทดสอบจุดเปลี่ยน (จุดสูงสุด) จุดถือเป็นจุดเปลี่ยนหาก: เงื่อนไขต่อไปนี้: ε ฉัน -1< ε i >ε ฉัน +1 หรือ ε ฉัน -1 > ε ฉัน< ε i +1

ถัดไปจะคำนวณจำนวนจุดเปลี่ยน p เกณฑ์การสุ่มที่มีระดับนัยสำคัญ 5% เช่น กับ ความน่าจะเป็นของความมั่นใจ 95% คือการเติมเต็มความไม่เท่าเทียมกัน:

วงเล็บเหลี่ยมหมายความว่าถูกยึดแล้ว ทั้งส่วนตัวเลขที่อยู่ในวงเล็บ หากความไม่เท่าเทียมกันเป็นที่พอใจ แสดงว่าแบบจำลองนั้นถือว่าเพียงพอ

เพื่อตรวจสอบความเท่าเทียมกัน ความคาดหวังทางคณิตศาสตร์สำหรับลำดับสารตกค้างที่เป็นศูนย์ จะมีการคำนวณค่าเฉลี่ยของสารตกค้างจำนวนหนึ่ง:

ถ้า = 0 จะถือว่าแบบจำลองไม่มีข้อผิดพลาดอย่างเป็นระบบคงที่ และเพียงพอตามเกณฑ์ค่าเฉลี่ยเป็นศูนย์

ถ้า ≠ 0 แสดงว่าสมมติฐานว่างที่ว่าความคาดหวังทางคณิตศาสตร์เท่ากับศูนย์จะถูกทดสอบ โดยคำนวณค่าทีทดสอบของนักเรียนโดยใช้สูตร:

โดยที่ S ε คือค่าเบี่ยงเบนมาตรฐานของแบบจำลองที่เหลือ (ข้อผิดพลาดมาตรฐาน)

ค่า t-criterion ถูกเปรียบเทียบกับ t αγที่ทำเป็นตาราง หากความไม่เท่าเทียมกัน t > t αγ เป็นที่พอใจ แสดงว่าแบบจำลองนั้นไม่เพียงพอตามเกณฑ์นี้

การกระจายตัวของระดับของสารตกค้างจำนวนหนึ่งควรเท่ากันในทุกค่า เอ็กซ์(คุณสมบัติ การรักร่วมเพศ).หากไม่ตรงตามเงื่อนไขนี้แล้ว ความไม่สมดุล .

หากต้องการประมาณค่าความต่างศักย์ต่างกันด้วยขนาดตัวอย่างขนาดเล็ก คุณสามารถใช้ได้ วิธีโกลด์เฟลด์-ควอนต์, สาระสำคัญก็คือมันจำเป็น:

จัดเรียงค่าตัวแปร เอ็กซ์ตามลำดับจากน้อยไปมาก;

แบ่งชุดของการสังเกตตามลำดับออกเป็นสองกลุ่ม

สำหรับการสังเกตแต่ละกลุ่ม ให้สร้างสมการถดถอย

กำหนดผลรวมที่เหลือของกำลังสองสำหรับกลุ่มที่หนึ่งและสองโดยใช้สูตร: ; , ที่ไหน

n 1 - จำนวนการสังเกตในกลุ่มแรก

n 2 - จำนวนการสังเกตในกลุ่มที่สอง

คำนวณเกณฑ์หรือ (ตัวเศษต้องมีผลรวมกำลังสองจำนวนมาก) เมื่อดำเนินการ สมมติฐานว่างเกี่ยวกับความเป็นเนื้อเดียวกันเกณฑ์การคำนวณ F จะเป็นไปตามเกณฑ์ F ด้วยองศาอิสระ γ 1 =n 1 -m, γ 2 =n - n 1 - m) สำหรับแต่ละ จำนวนคงเหลือสี่เหลี่ยม (โดยที่ ม จำนวนพารามิเตอร์โดยประมาณในสมการถดถอย) ยิ่งค่าที่คำนวณได้ F เกินค่าตารางของเกณฑ์ F ยิ่งมีการละเมิดสมมติฐานของความเท่าเทียมกันของความแปรปรวนของค่าคงเหลือมากขึ้น

ตรวจสอบความเป็นอิสระของลำดับของสารตกค้าง (ขาดความสัมพันธ์อัตโนมัติ) โดยใช้การทดสอบ Durbin-Watson d ถูกกำหนดโดยสูตร:

ค่าที่คำนวณได้ของเกณฑ์จะถูกเปรียบเทียบกับค่าวิกฤต d1 และ d2 ที่ต่ำกว่าของสถิติ Durbin-Watson เป็นไปได้ในกรณีต่อไปนี้:

1) ถ้า ง< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

2) ถ้า ง 1 < < วันที่ 2 (รวมถึงค่าเหล่านี้ด้วย) ถือว่าไม่มีเหตุผลเพียงพอที่จะสรุปอย่างใดอย่างหนึ่ง จะต้องถูกนำมาใช้ เกณฑ์เพิ่มเติมตัวอย่างเช่น ค่าสัมประสิทธิ์ความสัมพันธ์อัตโนมัติตัวแรก:

หากค่าที่คำนวณได้ของสัมประสิทธิ์ในโมดูลัสน้อยกว่าค่าในตาราง r 1cr แสดงว่าสมมติฐานของการไม่มีความสัมพันธ์อัตโนมัติได้รับการยอมรับ มิฉะนั้นสมมติฐานนี้จะถูกปฏิเสธ

3) ถ้า วันที่ 2 < < 2, จากนั้นจึงยอมรับสมมติฐานเกี่ยวกับความเป็นอิสระของสิ่งตกค้าง และแบบจำลองได้รับการยอมรับว่าเพียงพอตามเกณฑ์นี้

4) ถ้า d> 2 แสดงว่าสิ่งนี้บ่งชี้ ความสัมพันธ์อัตโนมัติเชิงลบของเหลือ ในกรณีนี้ ค่าที่คำนวณได้ของเกณฑ์จะต้องแปลงโดยใช้สูตร d′= 4 - d และเปรียบเทียบกับค่าวิกฤต d′ , ไม่ง.

การตรวจสอบว่าการกระจายของลำดับที่เหลือสอดคล้องกับกฎการกระจายแบบปกติหรือไม่สามารถทำได้โดยใช้เกณฑ์ R/S ซึ่งกำหนดโดยสูตร:

โดยที่ S ε คือค่าเบี่ยงเบนมาตรฐานของแบบจำลองที่เหลือ (ข้อผิดพลาดมาตรฐาน) เปรียบเทียบค่าที่คำนวณได้ของเกณฑ์ R/S ค่าตาราง(ขอบเขตล่างและบน ความสัมพันธ์นี้) และหากค่าไม่ตกอยู่ในช่วงระหว่างขอบเขตวิกฤต ดังนั้นด้วยระดับนัยสำคัญที่กำหนด สมมติฐานเกี่ยวกับความเป็นปกติของการแจกแจงจะถูกปฏิเสธ มิฉะนั้นสมมติฐานจะได้รับการยอมรับ

เพื่อประเมินคุณภาพ แบบจำลองการถดถอยขอแนะนำให้ใช้ด้วย ดัชนีความสัมพันธ์(สัมประสิทธิ์สหสัมพันธ์พหุคูณ)

สูตรกำหนดดัชนีสหสัมพันธ์

ที่ไหน

ผลรวมของการเบี่ยงเบนกำลังสองของตัวแปรตามจากค่าเฉลี่ย กำหนดโดยสูตร:

ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอย กำหนดโดยสูตร:

ผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง คำนวณโดยสูตร:

สมการ สามารถแสดงได้ดังนี้:

ดัชนีสหสัมพันธ์รับค่าตั้งแต่ 0 ถึง 1 ยิ่งค่าดัชนีสูงเท่าใด ค่าที่คำนวณได้ของคุณลักษณะผลลัพธ์ก็จะยิ่งใกล้เคียงกับค่าจริงมากขึ้นเท่านั้น ดัชนีสหสัมพันธ์ใช้สำหรับการเชื่อมต่อระหว่างตัวแปรทุกรูปแบบ ด้วยการถดถอยเชิงเส้นคู่จะเท่ากับ ค่าสัมประสิทธิ์คู่ความสัมพันธ์

คุณลักษณะความแม่นยำถูกใช้เป็นการวัดความแม่นยำของแบบจำลอง: ในการพิจารณาการวัดความแม่นยำของแบบจำลอง ให้คำนวณ:

- ข้อผิดพลาดสูงสุด- สอดคล้องกับค่าเบี่ยงเบนของค่าเบี่ยงเบนที่คำนวณได้ของค่าที่คำนวณได้จากค่าจริง

- เฉลี่ย ความผิดพลาดอย่างแน่นอน - ข้อผิดพลาดแสดงว่าค่าจริงโดยเฉลี่ยเบี่ยงเบนไปจากแบบจำลองเท่าใด

- ความแปรปรวนของอนุกรมสารตกค้าง (ความแปรปรวนที่เหลือ)

โดยที่คือค่าเฉลี่ยของชุดสารตกค้าง กำหนดโดยสูตร

- หมายถึงค่าคลาดเคลื่อนกำลังสอง- แสดงถึงรากที่สองของความแปรปรวน: , ยังไง มูลค่าน้อยลงข้อผิดพลาด ยิ่งแบบจำลองมีความแม่นยำมากขึ้น

- เฉลี่ย ข้อผิดพลาดที่เกี่ยวข้องการประมาณ.

ข้อผิดพลาดในการประมาณโดยเฉลี่ยไม่ควรเกิน 8-10%

หากแบบจำลองการถดถอยได้รับการพิจารณาว่าเพียงพอและพารามิเตอร์แบบจำลองมีนัยสำคัญ ให้ดำเนินการสร้างการคาดการณ์ต่อไป .

ค่าที่คาดการณ์ไว้ตัวแปร ที่ได้จากการแทนที่ค่าคาดหวังของตัวแปรอิสระลงในสมการการถดถอย เอ็กซ์พยากรณ์

พยากรณ์นี้เรียกว่า ตามจุดความน่าจะเป็นของการคาดการณ์จุดที่จะเกิดขึ้นจริงนั้นแทบจะเป็นศูนย์ ดังนั้นช่วงความเชื่อมั่นของการพยากรณ์จึงคำนวณด้วยความน่าเชื่อถือสูง

ช่วงความเชื่อมั่นสำหรับการคาดการณ์ขึ้นอยู่กับ ข้อผิดพลาดมาตรฐาน, การกำจัด เอ็กซ์วิ่งจากค่าเฉลี่ยของมัน , จำนวนการสังเกต nและระดับนัยสำคัญของการพยากรณ์ α ช่วงความเชื่อมั่นของการคาดการณ์คำนวณโดยใช้สูตร: หรือ

ที่ไหน

ทีตาราง - พิจารณาจากตารางการแจกแจงของนักเรียนสำหรับระดับนัยสำคัญ α และจำนวนองศาอิสระ γ=n-k-1

ตัวอย่างที่ 13.

จากการสำรวจครอบครัวทั้ง 8 กลุ่ม ทราบข้อมูลเกี่ยวกับความสัมพันธ์ระหว่างค่าใช้จ่ายด้านอาหารและรายได้ของครอบครัว (ตารางที่ 36)

ตารางที่ 36 - ความสัมพันธ์ระหว่างค่าใช้จ่ายด้านอาหารและระดับรายได้ของครอบครัว

ค่าอาหารพันรูเบิล 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
รายได้ของครอบครัวพันรูเบิล 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

สมมติว่าความสัมพันธ์ระหว่างรายได้ของครอบครัวกับรายจ่ายด้านอาหารนั้นเป็นเส้นตรง เพื่อยืนยันสมมติฐานของเรา เราจะสร้างฟิลด์สหสัมพันธ์ (รูปที่ 8)

กราฟแสดงให้เห็นว่าจุดต่างๆ เรียงกันเป็นเส้นตรงเส้นหนึ่ง

เพื่อความสะดวกในการคำนวณเพิ่มเติม เราจะรวบรวมตารางที่ 37

ลองคำนวณพารามิเตอร์ของสมการเชิงเส้นของการถดถอยคู่กัน - ในการทำสิ่งนี้ เราใช้สูตร:

รูปที่ 8 - ฟิลด์สหสัมพันธ์

เราได้สมการ:

เหล่านั้น. ด้วยรายได้ครอบครัวเพิ่มขึ้น 1,000 รูเบิล ค่าอาหารเพิ่มขึ้น 168 รูเบิล

การคำนวณสัมประสิทธิ์สหสัมพันธ์เชิงเส้น