พารามิเตอร์ a ในสมการการถดถอยเชิงเส้นคู่ ช่วงความเชื่อมั่นสำหรับตัวแปรตาม
การส่งผลงานที่ดีของคุณไปยังฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง
นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง
โพสต์เมื่อ http:// www. ดีที่สุด. รุ/
กระทรวงศึกษาธิการและวิทยาศาสตร์แห่งสหพันธรัฐรัสเซีย
งบประมาณของรัฐบาลกลาง สถาบันการศึกษาอุดมศึกษา
"มหาวิทยาลัยเทคนิคแห่งรัฐ Komsomolsk-on-Amur"
คณะเศรษฐศาสตร์และการจัดการ
ภาควิชาเศรษฐศาสตร์การเงินและการบัญชี
การคำนวณและงานกราฟิก
ในสาขาวิชา "เศรษฐมิติ"
นักเรียนกลุ่ม
อ.ย. ไซเชนโก
ครู
ฉัน. อันโตโนวา
ตารางที่ 1
หมายเลขภูมิภาค |
ค่าครองชีพเฉลี่ยต่อหัวต่อวันของคนฉกรรจ์หนึ่งคน, ถู., |
ค่าจ้างรายวันเฉลี่ย ถู. |
|
ที่จำเป็น:
1. สร้างสมการเชิงเส้นของการถดถอยคู่จาก
3. ประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์โดยใช้การทดสอบฟิชเชอร์และการทดสอบนักเรียน
4. เรียกใช้การคาดการณ์ ค่าจ้างโดยมีค่าพยากรณ์ระดับการยังชีพเฉลี่ยต่อหัวเท่ากับร้อยละ 107 ของระดับเฉลี่ย
5. ประเมินความแม่นยำของการพยากรณ์โดยการคำนวณข้อผิดพลาดของการคาดการณ์และช่วงความเชื่อมั่น
6. พล็อตข้อมูลเริ่มต้นและเส้นตรงเชิงทฤษฎีบนกราฟเดียว
1. เพื่อคำนวณพารามิเตอร์ของสมการ การถดถอยเชิงเส้นสร้างตารางการคำนวณ 2. การถดถอยโดยประมาณสหสัมพันธ์เชิงเส้น
ตารางที่ 2
ค่าเฉลี่ย |
|||||||||
สมการการถดถอยที่ได้รับคือ:
ด้วยการเพิ่มระดับการยังชีพเฉลี่ยต่อหัว 1 รูเบิล ค่าจ้างรายวันเฉลี่ยเพิ่มขึ้นโดยเฉลี่ย 0.89 รูเบิล
2. ความใกล้ชิดของการเชื่อมต่อเชิงเส้นจะถูกประเมินโดยค่าสัมประสิทธิ์สหสัมพันธ์:
ซึ่งหมายความว่า 51% ของการเปลี่ยนแปลงของค่าจ้าง () อธิบายได้จากการเปลี่ยนแปลงของปัจจัย - ค่าครองชีพโดยเฉลี่ยต่อหัว
คุณภาพของแบบจำลองถูกกำหนดโดยข้อผิดพลาดโดยเฉลี่ยของการประมาณ:
คุณภาพของแบบจำลองที่สร้างขึ้นได้รับการประเมินว่าดีเนื่องจากไม่เกิน 8-10%
3. เราจะประเมินความสำคัญของสมการการถดถอยโดยรวมโดยใช้เกณฑ์ฟิชเชอร์ มูลค่าที่แท้จริงของเกณฑ์:
ค่าตารางของเกณฑ์ที่ระดับนัยสำคัญห้าเปอร์เซ็นต์และระดับความเป็นอิสระคือ: เนื่องจากสมการการถดถอยถือว่ามีนัยสำคัญทางสถิติ
เราจะประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยโดยใช้สถิติของนักเรียน และโดยการคำนวณช่วงความเชื่อมั่นของตัวบ่งชี้แต่ละตัว
ค่าตารางของเกณฑ์สำหรับจำนวนองศาอิสระจะเป็น:
มากำหนดข้อผิดพลาดแบบสุ่ม:
ค่าจริงของสถิติเกินค่าตาราง:
ดังนั้นพารามิเตอร์จึงไม่แตกต่างจากศูนย์โดยบังเอิญ แต่มีนัยสำคัญทางสถิติ มาคำนวณช่วงความเชื่อมั่นสำหรับพารามิเตอร์การถดถอยและ การทำเช่นนี้เรากำหนด ข้อผิดพลาดเล็กน้อยสำหรับแต่ละตัวบ่งชี้:
การวิเคราะห์ขีดจำกัดบนและล่างของช่วงความเชื่อมั่นนำไปสู่ข้อสรุปว่า ด้วยความน่าจะเป็น พารามิเตอร์และเมื่ออยู่ภายในขีดจำกัดที่ระบุ ไม่ยอมรับ ค่าศูนย์, เช่น. ไม่มีนัยสำคัญทางสถิติและแตกต่างจากศูนย์อย่างมีนัยสำคัญ
4. การประมาณค่าสมการถดถอยที่ได้รับทำให้สามารถนำไปใช้ในการพยากรณ์ได้ หากค่าครองชีพที่คาดการณ์ไว้คือ:
จากนั้นค่าคาดการณ์ค่าจ้างจะเป็น:
ข้อผิดพลาดในการคาดการณ์จะเป็น:
ข้อผิดพลาดการคาดการณ์สูงสุดซึ่งในกรณีนี้จะไม่เกินจะเป็น:
คาดการณ์ช่วงความเชื่อมั่น:
การคาดการณ์เงินเดือนเฉลี่ยที่เสร็จสมบูรณ์มีความน่าเชื่อถือ () และอยู่ในช่วง 131.66 รูเบิล มากถึง 190.62 ถู เพื่อสรุปวิธีแก้ปัญหา เรามาพล็อตข้อมูลเริ่มต้นและเส้นตรงทางทฤษฎีบนกราฟเดียว (รูปที่ 1)
รูปที่ 1
โพสต์บน Allbest.ru
เอกสารที่คล้ายกัน
การก่อสร้าง สมการเชิงเส้นการคำนวณการถดถอยแบบคู่ ค่าสัมประสิทธิ์เชิงเส้นความสัมพันธ์คู่และ ข้อผิดพลาดโดยเฉลี่ยการประมาณ การหาค่าสัมประสิทธิ์สหสัมพันธ์และความยืดหยุ่น ดัชนีสหสัมพันธ์ สาระสำคัญของการประยุกต์ใช้เกณฑ์ฟิชเชอร์ในเศรษฐมิติ
ทดสอบเพิ่มเมื่อ 05/05/2010
การคำนวณพารามิเตอร์การถดถอยเชิงเส้นคู่ การประเมินนัยสำคัญทางสถิติของสมการการถดถอยและพารามิเตอร์โดยใช้การทดสอบฟิชเชอร์และนักเรียน การสร้างเมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์คู่ การวิเคราะห์ทางสถิติโดยใช้ซอฟต์แวร์ MS EXCEL
ทดสอบเพิ่มเมื่อ 14/05/2551
การคำนวณสัมประสิทธิ์เชิงเส้นของคู่และสหสัมพันธ์บางส่วน นัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์ การวิเคราะห์เขตข้อมูลสหสัมพันธ์ ความแม่นยำในการพยากรณ์ การคำนวณข้อผิดพลาด และช่วงความเชื่อมั่น ค่าสัมประสิทธิ์การตัดสินใจพหุคูณ
ทดสอบเพิ่มเมื่อ 12/11/2010
การตีความทางเศรษฐศาสตร์ของสัมประสิทธิ์การถดถอย ค้นหาผลรวมทางสถิติของกำลังสองและประมาณค่าความแปรปรวนของค่าคงเหลือ การตรวจสอบความสำคัญของพารามิเตอร์ของสมการถดถอยโดยใช้การทดสอบของนักเรียน การคำนวณค่าคลาดเคลื่อนสัมพัทธ์โดยเฉลี่ยของการประมาณ
ทดสอบเพิ่มเมื่อ 23/03/2010
การสร้างช่วงความเชื่อมั่นสำหรับสัมประสิทธิ์การถดถอย การหาข้อผิดพลาดในการประมาณ ดัชนีสหสัมพันธ์ และการทดสอบ F ของฟิชเชอร์ การประเมินความยืดหยุ่นของการเปลี่ยนแปลงความเข้มของวัสดุของผลิตภัณฑ์ การสร้างสมการเชิงเส้น การถดถอยหลายครั้ง.
ทดสอบเพิ่มเมื่อ 04/11/2558
การคำนวณพารามิเตอร์ของสมการถดถอยเชิงเส้น การประเมินความใกล้ชิดของความสัมพันธ์โดยใช้ตัวบ่งชี้สหสัมพันธ์และการกำหนด การหาค่าความคลาดเคลื่อนการประมาณค่าเฉลี่ย ความน่าเชื่อถือทางสถิติของการสร้างแบบจำลองโดยใช้การทดสอบ F-test ของฟิชเชอร์และการทดสอบ t-test ของนักเรียน
ทดสอบเพิ่มเมื่อ 10/17/2552
การกำหนดปริมาณการพึ่งพาเชิงปริมาณของมวลของสัตว์ที่มีขนตามอายุ การสร้างสมการถดถอยคู่ การคำนวณพารามิเตอร์ และการทวนสอบความเพียงพอ การประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอย การคำนวณช่วงความเชื่อมั่น
งานห้องปฏิบัติการ เพิ่มเมื่อ 06/02/2014
การสร้างสมมติฐานเกี่ยวกับรูปแบบของความเชื่อมโยงระหว่างรายได้ทางการเงินต่อหัวและการใช้จ่ายของผู้บริโภคในภูมิภาคอูราลและไซบีเรียตะวันตกของสหพันธรัฐรัสเซีย การคำนวณพารามิเตอร์ของสมการถดถอยคู่ การประเมินคุณภาพโดยใช้ความคลาดเคลื่อนเฉลี่ยของการประมาณ
ทดสอบเพิ่มเมื่อ 11/05/2014
การวิเคราะห์วิธีการ กำลังสองน้อยที่สุดสำหรับการถดถอยแบบคู่ ซึ่งเป็นวิธีการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้น การพิจารณาสมการเชิงเส้นของการถดถอยแบบคู่ การศึกษาการถดถอยเชิงเส้นพหุคูณ การศึกษาข้อผิดพลาดของสัมประสิทธิ์การถดถอย
ทดสอบเพิ่มเมื่อ 28/03/2018
การสร้างสนามความสัมพันธ์ การคำนวณพารามิเตอร์ของสมการถดถอยคู่ การขึ้นอยู่กับอายุขัยเฉลี่ยของปัจจัยบางประการ การศึกษา "เกณฑ์ฟิชเชอร์" การประเมินความใกล้ชิดของการเชื่อมต่อโดยใช้ตัวบ่งชี้ความสัมพันธ์และการกำหนด
100 รูเบิลโบนัสสำหรับการสั่งซื้อครั้งแรก
เลือกประเภทงาน วิทยานิพนธ์ งานหลักสูตรรายงานวิทยานิพนธ์ปริญญาโท เรื่อง การปฏิบัติ ทบทวนรายงานบทความ ทดสอบเอกสารการแก้ปัญหาแผนธุรกิจคำตอบสำหรับคำถาม งานสร้างสรรค์งานเขียนเรียงความ การแปล การนำเสนอ การพิมพ์ อื่นๆ เพิ่มความเป็นเอกลักษณ์ของข้อความ วิทยานิพนธ์ระดับปริญญาโท งานห้องปฏิบัติการความช่วยเหลือออนไลน์
ค้นหาราคา
การถดถอยคู่คือสมการความสัมพันธ์ระหว่างตัวแปรสองตัว
คุณ และ x วิดา ย= ฉ(x),
โดยที่ y เป็นตัวแปรตาม (แอตทริบิวต์ผลลัพธ์)
x เป็นตัวแปรอธิบายอิสระ (คุณลักษณะ-ปัจจัย)
มีการถดถอยเชิงเส้นและไม่เชิงเส้น
วิธีกำลังสองน้อยที่สุด
ในการประมาณค่าพารามิเตอร์ของการถดถอยที่เป็นเส้นตรงในพารามิเตอร์เหล่านี้ จะใช้วิธีกำลังสองน้อยที่สุด (OLS) . วิธีกำลังสองน้อยที่สุดช่วยให้เราได้รับการประมาณพารามิเตอร์ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของลักษณะผลลัพธ์ y จากค่าทางทฤษฎี ŷ xที่ค่าปัจจัยเดียวกัน xน้อยที่สุดนั่นคือ
5. การประเมินนัยสำคัญทางสถิติของตัวชี้วัดสหสัมพันธ์ พารามิเตอร์ของสมการถดถอยเชิงเส้นคู่ และสมการถดถอยโดยรวม
6. การประเมินระดับความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณ สัมประสิทธิ์ความแปรปรวนร่วม ตัวบ่งชี้สหสัมพันธ์: ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น, ดัชนีสหสัมพันธ์ (= อัตราส่วนสหสัมพันธ์ทางทฤษฎี)
สัมประสิทธิ์ความแปรปรวนร่วม
Mch(y) - นั่นคือ เราได้รับการพึ่งพาสหสัมพันธ์
การมีความสัมพันธ์ไม่สามารถตอบคำถามเกี่ยวกับสาเหตุของการเชื่อมต่อได้ ความสัมพันธ์กำหนดเพียงการวัดการเชื่อมต่อนี้เท่านั้น เช่น การวัดความแปรปรวนที่สอดคล้องกัน
การวัดความสัมพันธ์ระหว่างตัวแปรสองตัวสามารถพบได้โดยใช้ความแปรปรวนร่วม
, ,
ขนาดของดัชนีความแปรปรวนร่วมขึ้นอยู่กับหน่วยใน γ ของตัวแปรที่กำลังวัด ดังนั้น เพื่อประเมินระดับความแปรผันที่สอดคล้องกัน จึงใช้ค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งเป็นคุณลักษณะไร้มิติซึ่งมีช่วงของการแปรผันที่แน่นอน
7. ค่าสัมประสิทธิ์การตัดสินใจ ความคลาดเคลื่อนมาตรฐานของสมการถดถอย
ค่าสัมประสิทธิ์การกำหนด (rxy2) - แสดงลักษณะสัดส่วนของความแปรปรวนของคุณลักษณะผลลัพธ์ y อธิบายโดยความแปรปรวนใน ความแปรปรวนทั้งหมดสัญญาณที่มีประสิทธิภาพ ยิ่ง rxy2 ใกล้ถึง 1 มากเท่าไร โมเดลการถดถอยก็จะยิ่งดีเท่านั้น กล่าวคือ โมเดลดั้งเดิมจะประมาณค่าข้อมูลดั้งเดิมได้ดี
8. การประเมินนัยสำคัญทางสถิติของตัวบ่งชี้การแก้ไข พารามิเตอร์ของสมการการถดถอยเชิงเส้นคู่ และสมการถดถอยโดยรวม: ที-แบบทดสอบของนักเรียน เอฟ-เกณฑ์ชาวประมง
9. ตัวแบบการถดถอยแบบไม่เชิงเส้นและการทำให้เป็นเส้นตรง
การถดถอยแบบไม่เชิงเส้นแบ่งออกเป็นสองประเภท : การถดถอยที่ไม่เชิงเส้นตามตัวแปรอธิบายที่ไม่รวมอยู่ในการวิเคราะห์ แต่เป็นเชิงเส้นตามพารามิเตอร์ที่ประมาณไว้ และการถดถอยที่ไม่เชิงเส้นตามพารามิเตอร์ที่ประมาณไว้
ตัวอย่างของการถดถอย ไม่เชิงเส้นในตัวแปรอธิบาย, แต่เป็นเชิงเส้นในพารามิเตอร์โดยประมาณ:
ตัวแบบการถดถอยแบบไม่เชิงเส้นและการทำให้เชิงเส้นตรง
ด้วยการพึ่งพาแบบไม่เชิงเส้นของลักษณะซึ่งนำไปสู่ รูปแบบเชิงเส้น OLS ยังกำหนดพารามิเตอร์การถดถอยหลายรายการด้วย ข้อแตกต่างเพียงอย่างเดียวคือไม่ได้ใช้ ข้อมูลความเป็นมาแต่กับข้อมูลที่แปลงแล้ว ดังนั้นเมื่อพิจารณาถึงฟังก์ชันกำลัง
,
เราแปลงเป็นรูปแบบเชิงเส้น:
โดยที่ตัวแปรแสดงเป็นลอการิทึม
นอกจากนี้ การประมวลผล LSM ยังเหมือนเดิม: ระบบถูกสร้างขึ้น สมการปกติและมีการกำหนดพารามิเตอร์ที่ไม่รู้จัก โดยการเพิ่มศักยภาพของค่า เราจะพบพารามิเตอร์ กและด้วยเหตุนี้ รูปแบบทั่วไปของสมการของฟังก์ชันกำลัง
โดยทั่วไปแล้ว การถดถอยแบบไม่เชิงเส้นขึ้นอยู่กับตัวแปรที่รวมไว้ไม่ก่อให้เกิดความยุ่งยากในการประมาณค่าพารามิเตอร์ การประมาณนี้ถูกกำหนดโดย OLS เช่นเดียวกับการถดถอยเชิงเส้น ดังนั้นในสมการการถดถอยไม่เชิงเส้นแบบสองปัจจัย
การทำให้เป็นเส้นตรงสามารถดำเนินการได้โดยการแนะนำตัวแปรใหม่ลงไป - ผลลัพธ์ที่ได้คือสมการการถดถอยเชิงเส้นสี่ปัจจัย
10.ความเป็นหลายเส้นตรง วิธีการกำจัด multicollinearity
ปัญหาที่ยิ่งใหญ่ที่สุดในการใช้เครื่องมือการถดถอยพหุคูณเกิดขึ้นเมื่อมีปัจจัยหลายเส้นตรง เมื่อมีปัจจัยมากกว่าสองปัจจัยเชื่อมโยงถึงกัน การพึ่งพาเชิงเส้น - การปรากฏตัวของหลายปัจจัยระหว่างปัจจัยอาจหมายความว่าปัจจัยบางอย่างจะดำเนินการพร้อมเพรียงกันเสมอ เป็นผลให้ความแปรผันของข้อมูลอินพุตไม่เป็นอิสระอย่างสมบูรณ์อีกต่อไป และไม่สามารถประเมินผลกระทบของแต่ละปัจจัยแยกกันได้
ยิ่งปัจจัยหลายเส้นตรงมีความเข้มข้นมากเท่าใด การประมาณค่าการกระจายตัวของจำนวนความแปรผันที่อธิบายไว้ระหว่างปัจจัยแต่ละตัวโดยใช้วิธีกำลังสองน้อยที่สุด (OLS) ก็มีความน่าเชื่อถือน้อยลงเท่านั้น
การรวมปัจจัยหลายสายในแบบจำลองเป็นสิ่งที่ไม่พึงประสงค์ด้วยเหตุผลต่อไปนี้:
ü เป็นการยากที่จะตีความพารามิเตอร์การถดถอยหลายตัว พารามิเตอร์การถดถอยเชิงเส้นสูญเสีย ความรู้สึกทางเศรษฐกิจ;
ü การประมาณค่าพารามิเตอร์ไม่น่าเชื่อถือ แสดงข้อผิดพลาดมาตรฐานขนาดใหญ่ และการเปลี่ยนแปลงตามการเปลี่ยนแปลงในปริมาณการสังเกต ซึ่งทำให้แบบจำลองไม่เหมาะสมสำหรับการวิเคราะห์และการพยากรณ์
วิธีการกำจัด multicollinearity
- การแยกตัวแปรออกจากแบบจำลอง
อย่างไรก็ตาม ต้องใช้ความระมัดระวังบางประการเมื่อใช้ วิธีนี้- ในสถานการณ์นี้ อาจเกิดข้อผิดพลาดเกี่ยวกับข้อกำหนดได้
- รับข้อมูลเพิ่มเติมหรือสร้างตัวอย่างใหม่
บางครั้ง เพื่อลด multicollinearity การเพิ่มขนาดตัวอย่างก็เพียงพอแล้ว ตัวอย่างเช่น หากคุณใช้ข้อมูลรายปี คุณสามารถย้ายไปยังข้อมูลรายไตรมาสได้ การเพิ่มปริมาณข้อมูลจะช่วยลดความแปรปรวนของสัมประสิทธิ์การถดถอย และทำให้นัยสำคัญทางสถิติเพิ่มขึ้น อย่างไรก็ตาม การได้รับตัวอย่างใหม่หรือขยายตัวอย่างเก่านั้นไม่สามารถทำได้เสมอไปหรือเกี่ยวข้องกับต้นทุนที่ร้ายแรง นอกจากนี้แนวทางนี้อาจเพิ่มขึ้น
ความสัมพันธ์อัตโนมัติ
- การเปลี่ยนแปลงข้อมูลจำเพาะของรุ่น
ในบางกรณี ปัญหาของ multicollinearity สามารถแก้ไขได้โดยการเปลี่ยนข้อมูลจำเพาะของโมเดล: เปลี่ยนรูปแบบของโมเดล หรือเพิ่มตัวแปรอธิบายใหม่ที่ไม่ได้คำนึงถึงในโมเดล
- การใช้ข้อมูลเบื้องต้นเกี่ยวกับพารามิเตอร์บางตัว
11.คลาสสิก โมเดลเชิงเส้นการลงทะเบียนหลายครั้ง (KLMMR) การกำหนดพารามิเตอร์ของระดับการลงทะเบียนหลายรายการโดยวิธีกำลังสองน้อยที่สุด
วัตถุประสงค์ของการบริการ- การใช้บริการใน โหมดออนไลน์สามารถพบได้:- พารามิเตอร์ของสมการการถดถอยเชิงเส้น y=a+bx สัมประสิทธิ์สหสัมพันธ์เชิงเส้นพร้อมการทดสอบนัยสำคัญ
- ความใกล้ชิดของการเชื่อมต่อโดยใช้ตัวบ่งชี้สหสัมพันธ์และการกำหนด การประมาณค่า OLS ความน่าเชื่อถือคงที่ของการสร้างแบบจำลองการถดถอยโดยใช้การทดสอบ F ของฟิชเชอร์และการทดสอบทีของนักเรียน ช่วงความเชื่อมั่นของการพยากรณ์สำหรับระดับนัยสำคัญ α
สมการการถดถอยแบบคู่หมายถึง สมการการถดถอยลำดับที่หนึ่ง- หากแบบจำลองทางเศรษฐมิติมีตัวแปรอธิบายเพียงตัวแปรเดียว จะเรียกว่าการถดถอยแบบคู่ สมการการถดถอยลำดับที่สองและ สมการการถดถอยลำดับที่สามอ้างถึงสมการการถดถอยไม่เชิงเส้น
ตัวอย่าง. เลือกตัวแปรตาม (อธิบาย) และตัวแปรอธิบายเพื่อสร้างแบบจำลองการถดถอยคู่ ให้มัน. กำหนด สมการทางทฤษฎีการถดถอยแบบคู่ ประเมินความเพียงพอของแบบจำลองที่สร้างขึ้น (ตีความ R-squared, t-statistics, F-statistics)
สารละลายเราจะดำเนินการบนพื้นฐาน กระบวนการสร้างแบบจำลองทางเศรษฐมิติ.
ขั้นที่ 1 (คำแถลง) – การกำหนดเป้าหมายสุดท้ายของการสร้างแบบจำลอง ชุดของปัจจัยและตัวบ่งชี้ที่เข้าร่วมในแบบจำลอง และบทบาทของพวกเขา
ข้อกำหนดแบบจำลอง - การกำหนดวัตถุประสงค์ของการศึกษาและเลือกตัวแปรทางเศรษฐกิจของแบบจำลอง
งานตามสถานการณ์ (ภาคปฏิบัติ) สำหรับ 10 องค์กรในภูมิภาค การพึ่งพาผลผลิตต่อพนักงาน y (พันรูเบิล) ความถ่วงจำเพาะคนงาน มีคุณสมบัติสูงวี จำนวนทั้งหมดคนงาน x (เป็น%)
ขั้นที่ 2 (นิรนัย) – การวิเคราะห์ก่อนแบบจำลอง สาระสำคัญทางเศรษฐกิจปรากฏการณ์ที่กำลังศึกษา การก่อตัวและการจัดรูปแบบข้อมูลนิรนัยและการสันนิษฐานเบื้องต้น โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับธรรมชาติและการกำเนิดของข้อมูลทางสถิติเริ่มต้นและองค์ประกอบสุ่มที่เหลือในรูปแบบของสมมติฐานจำนวนหนึ่ง
ในขั้นตอนนี้ เราสามารถพูดคุยเกี่ยวกับการพึ่งพาระดับทักษะของผู้ปฏิบัติงานและผลงานของเขาได้อย่างชัดเจน เพราะยิ่งผู้ปฏิบัติงานมีประสบการณ์มากเท่าไร ผลผลิตก็จะยิ่งสูงขึ้นเท่านั้น แต่จะประเมินการพึ่งพานี้ได้อย่างไร?
การถดถอยคู่แสดงถึงการถดถอยระหว่างตัวแปรสองตัว - y และ x เช่น แบบจำลองของแบบฟอร์ม:
โดยที่ y คือตัวแปรตาม (แอตทริบิวต์ผลลัพธ์) x – ตัวแปรอิสระหรือเชิงอธิบาย (คุณลักษณะ-ปัจจัย) เครื่องหมาย “^” หมายความว่าไม่มีความสัมพันธ์เชิงฟังก์ชันที่เข้มงวดระหว่างตัวแปร x และ y ดังนั้นในเกือบทุกตัว กรณีพิเศษค่า y ประกอบด้วยคำศัพท์สองคำ:
โดยที่ y คือค่าที่แท้จริงของแอ็ตทริบิวต์ผลลัพธ์ y x – ค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ที่พบตามสมการการถดถอย ε เป็นตัวแปรสุ่มที่แสดงลักษณะความเบี่ยงเบนของค่าที่แท้จริงของคุณลักษณะที่มีประสิทธิผลจากค่าทางทฤษฎีที่พบโดยใช้สมการการถดถอย
เราจะแสดงความสัมพันธ์แบบถดถอยระหว่างผลผลิตต่อคนงานและส่วนแบ่งของคนงานที่มีคุณสมบัติสูงเป็นกราฟ
ขั้นตอนที่ 3 (การกำหนดพารามิเตอร์) – การสร้างแบบจำลองจริง เช่น ทางเลือก มุมมองทั่วไปรวมถึงองค์ประกอบและรูปแบบของความสัมพันธ์ระหว่างตัวแปรที่รวมอยู่ในนั้น การเลือกประเภทของการพึ่งพาฟังก์ชันในสมการถดถอยเรียกว่าการกำหนดพารามิเตอร์แบบจำลอง เลือก สมการถดถอยคู่, เช่น. ผลลัพธ์สุดท้าย y จะได้รับอิทธิพลจากปัจจัยเดียวเท่านั้น
ขั้นที่ 4 (ข้อมูล) – การรวบรวมสิ่งที่จำเป็น ข้อมูลทางสถิติ, เช่น. การลงทะเบียนค่าของปัจจัยและตัวชี้วัดที่เข้าร่วมในแบบจำลอง กลุ่มตัวอย่างประกอบด้วย 10 วิสาหกิจในอุตสาหกรรม
ขั้นที่ 5 (การระบุโมเดล) – การประมาณค่าพารามิเตอร์แบบจำลองที่ไม่รู้จักโดยใช้ข้อมูลทางสถิติที่มีอยู่
เราใช้เพื่อกำหนดพารามิเตอร์ของโมเดล OLS - วิธีกำลังสองน้อยที่สุด- ระบบสมการปกติจะมีลักษณะดังนี้:
n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
ในการคำนวณพารามิเตอร์การถดถอย เราจะสร้างตารางการคำนวณ (ตารางที่ 1)
x | ย | x2 | คุณ 2 | xy |
10 | 6 | 100 | 36 | 60 |
12 | 6 | 144 | 36 | 72 |
15 | 7 | 225 | 49 | 105 |
17 | 7 | 289 | 49 | 119 |
18 | 7 | 324 | 49 | 126 |
19 | 8 | 361 | 64 | 152 |
19 | 8 | 361 | 64 | 152 |
20 | 9 | 400 | 81 | 180 |
20 | 9 | 400 | 81 | 180 |
21 | 10 | 441 | 100 | 210 |
171 | 77 | 3045 | 609 | 1356 |
เรานำข้อมูลจากตารางที่ 1 (แถวสุดท้าย) และด้วยเหตุนี้เราจึงได้:
10a + 171 ข = 77
171 ก + 3045 ข = 1356
เราแก้ SLAE นี้โดยใช้วิธี Cramer หรือวิธีเมทริกซ์ผกผัน
เราได้รับสัมประสิทธิ์การถดถอยเชิงประจักษ์: b = 0.3251, a = 2.1414
สมการการถดถอยเชิงประจักษ์คือ:
y = 0.3251 x + 2.1414
ขั้นตอนที่ 6 (การตรวจสอบโมเดล) – การเปรียบเทียบข้อมูลจริงและข้อมูลโมเดล การตรวจสอบความเพียงพอของโมเดล การประเมินความถูกต้องของข้อมูลโมเดล
เราทำการวิเคราะห์โดยใช้
1. คำจำกัดความและสูตรพื้นฐาน
การถดถอยคู่- การถดถอย (ความสัมพันธ์) ระหว่างสองตัวแปร ฯลฯ มุมมองแบบจำลอง:
ตัวแปรตามอยู่ที่ไหน (แอตทริบิวต์ผลลัพธ์);
- ตัวแปรอธิบายอิสระ (ปัจจัยลักษณะ)
ตัวแปรรบกวนหรือสุ่มซึ่งรวมถึงอิทธิพลของปัจจัยที่ไม่นำมาพิจารณาในแบบจำลอง
ในเกือบทุกกรณี ค่าจะประกอบด้วยคำศัพท์สองคำ:
โดยที่ค่าที่แท้จริงของแอตทริบิวต์ผลลัพธ์คือ
ค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ ซึ่งพบได้จากสมการการถดถอย เครื่องหมาย “^” หมายความว่าไม่มีความสัมพันธ์ในการทำงานที่เข้มงวดระหว่างตัวแปรและ
แยกแยะ เชิงเส้นและ ไม่เชิงเส้นการถดถอย
การถดถอยเชิงเส้นอธิบายด้วยสมการของเส้นตรง
การถดถอยแบบไม่เชิงเส้นแบ่งออกเป็นสองคลาส:
1) การถดถอย ไม่เชิงเส้นในตัวแปรอธิบาย แต่เป็นเชิงเส้นในพารามิเตอร์ที่ประมาณไว้, ตัวอย่างเช่น:
พหุนามขององศาที่ต่างกัน
ไฮเพอร์โบลาด้านเท่ากันหมด
2) การถดถอย ไม่เชิงเส้นในพารามิเตอร์โดยประมาณ, ตัวอย่างเช่น:
พลัง
บ่งชี้
เอ็กซ์โปเนนเชียล
ในการสร้างการถดถอยเชิงเส้นแบบคู่ จะมีการคำนวณปริมาณเสริม ( - จำนวนการสังเกต)
หมายถึงตัวอย่าง: และ
ความแปรปรวนร่วมตัวอย่างระหว่างและ
หรือ
ความแปรปรวนร่วม- นี้ ลักษณะเชิงตัวเลขการกระจายร่วมกันของทั้งสอง ตัวแปรสุ่ม.
ผลต่างตัวอย่างสำหรับ
หรือ
ผลต่างตัวอย่างสำหรับ
หรือ
ความแปรปรวนตัวอย่างกำหนดลักษณะระดับการกระจายตัวของค่าของตัวแปรสุ่มรอบค่าเฉลี่ย (ความแปรปรวน, ความแปรปรวน)
มีการประเมินความใกล้ชิดของการเชื่อมโยงระหว่างปรากฏการณ์ที่กำลังศึกษา ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างระหว่างและ
ค่าสัมประสิทธิ์สหสัมพันธ์จะแตกต่างกันไปตั้งแต่ -1 ถึง +1 ยิ่งใกล้จากโมดูโลถึง 1 ยิ่งใกล้มากขึ้น การพึ่งพาทางสถิติระหว่าง และ ถึงฟังก์ชันเชิงเส้น
ถ้า =0 แล้ว การเชื่อมต่อเชิงเส้นระหว่างและหายไป;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.
ค่าบวกของสัมประสิทธิ์บ่งชี้ว่าความสัมพันธ์ระหว่างคุณลักษณะนั้นตรง (โดยการเติบโตค่าจะเพิ่มขึ้น) ค่าลบบ่งชี้ความสัมพันธ์แบบผกผัน (โดยการเติบโตค่าจะลดลง)
การสร้างการถดถอยเชิงเส้นลงมาเพื่อประมาณค่าพารามิเตอร์และวิธีการแบบคลาสสิกในการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นนั้นขึ้นอยู่กับ วิธีกำลังสองน้อยที่สุด(เอ็มเอ็นซี) วิธีกำลังสองน้อยที่สุดช่วยให้ได้รับการประมาณค่าพารามิเตอร์ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของคุณสมบัติผลลัพธ์จากค่าทางทฤษฎีมีค่าน้อยที่สุดนั่นคือ
สำหรับการถดถอยเชิงเส้น พารามิเตอร์ และ พบได้จากระบบสมการปกติ:
เราพบการแก้ปัญหาระบบ วีบน
และพารามิเตอร์
ค่าสัมประสิทธิ์โดยมีตัวแปรแฟคเตอร์แสดงว่าค่าเฉลี่ยจะเปลี่ยนแปลงไปเท่าใดเมื่อแฟคเตอร์เปลี่ยนแปลงตามหน่วยการวัด
พารามิเตอร์เมื่อ If ไม่สามารถเท่ากับ 0 ได้ แสดงว่าไม่มีความหมายทางเศรษฐกิจ คุณสามารถตีความเครื่องหมายได้ก็ต่อเมื่อการเปลี่ยนแปลงสัมพัทธ์ในผลลัพธ์เกิดขึ้นช้ากว่าการเปลี่ยนแปลงปัจจัย กล่าวคือ ความแปรผันของผลลัพธ์จะน้อยกว่าความแปรผันของปัจจัยและในทางกลับกัน
คุณสามารถใช้เพื่อประเมินคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น ค่าสัมประสิทธิ์การตัดสินใจหรือ ข้อผิดพลาดในการประมาณค่าเฉลี่ย.
ถึงค่าสัมประสิทธิ์การตัดสินใจ
หรือ
แสดงส่วนแบ่งของความแปรปรวนที่อธิบายโดยการถดถอยในความแปรปรวนรวมของลักษณะผลลัพธ์ ดังนั้นค่าจึงระบุถึงส่วนแบ่งของความแปรปรวนของตัวบ่งชี้ที่เกิดจากอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลองและเหตุผลอื่น ๆ
ยิ่งเข้าใกล้ 1 มากเท่าใด โมเดลการถดถอยก็จะยิ่งดีเท่านั้น เช่น แบบจำลองที่สร้างขึ้นนั้นใกล้เคียงกับข้อมูลดั้งเดิมเป็นอย่างดี
ข้อผิดพลาดในการประมาณค่าเฉลี่ย- นี่คือค่าเบี่ยงเบนสัมพัทธ์โดยเฉลี่ยของค่าทางทฤษฎีจากค่าจริงเช่น
สมการถดถอยที่สร้างขึ้นถือว่าน่าพอใจหากค่าไม่เกิน 10-12%
สำหรับการถดถอยเชิงเส้น ค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยพบได้จากสูตร:
ค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยแสดงโดยเปอร์เซ็นต์โดยเฉลี่ยที่ผลลัพธ์จะเปลี่ยนจากค่าของมัน เมื่อปัจจัยเปลี่ยนแปลง 1% ของมูลค่า
เรตติ้งนาชิโมสต์และสมการถดถอยโดยทั่วไปให้โดยใช้การทดสอบฟิชเชอร์ซึ่งประกอบด้วยการทดสอบสมมติฐานเกี่ยวกับความไม่สำคัญทางสถิติของสมการถดถอย . เมื่อต้องการทำเช่นนี้ จะทำการเปรียบเทียบ แท้จริงจท้องฟ้าและ วิกฤต(ตาราง) ค่า - การทดสอบฟิชเชอร์ .
กำหนดจากอัตราส่วนของค่าปัจจัยและความแปรปรวนคงเหลือที่คำนวณตามระดับความเป็นอิสระ กล่าวคือ
- ค่าสูงสุดที่เป็นไปได้ของเกณฑ์ภายใต้อิทธิพลของปัจจัยสุ่มที่มีระดับความอิสระ =1, =-2 และระดับนัยสำคัญพบได้จากตารางเกณฑ์ฟิชเชอร์ (ตารางที่ 1 ของภาคผนวก)
ระดับความสำคัญ- นี่คือความน่าจะเป็นที่จะปฏิเสธสมมติฐานที่ถูกต้องเนื่องจากเป็นจริง
ถ้า จากนั้นสมมติฐานเกี่ยวกับการไม่มีการเชื่อมโยงระหว่างตัวบ่งชี้ที่ศึกษาและปัจจัยจะถูกปฏิเสธ และมีการสรุปเกี่ยวกับความสำคัญของการเชื่อมโยงนี้กับระดับนัยสำคัญ (เช่น สมการถดถอยมีนัยสำคัญ)
ถ้า จากนั้นสมมติฐานจะได้รับการยอมรับและตระหนักถึงความไม่มีนัยสำคัญทางสถิติและความไม่น่าเชื่อถือของสมการการถดถอย
สำหรับการถดถอยเชิงเส้น ความสำคัญค่าสัมประสิทธิ์การถดถอยประเมินการใช้งาน - การทดสอบของนักเรียนตามที่มีการเสนอสมมติฐานเกี่ยวกับลักษณะการสุ่มของตัวบ่งชี้ ได้แก่ เกี่ยวกับความแตกต่างเล็กน้อยจากศูนย์ ถัดไปค่าที่แท้จริงของเกณฑ์จะถูกคำนวณสำหรับแต่ละค่าสัมประสิทธิ์การถดถอยโดยประมาณเช่น
ที่ไหนและ - ข้อผิดพลาดมาตรฐานพารามิเตอร์การถดถอยเชิงเส้นถูกกำหนดโดยสูตร:
- ค่าสูงสุดที่เป็นไปได้ของการทดสอบของนักเรียนภายใต้อิทธิพลของปัจจัยสุ่มสำหรับระดับความอิสระที่กำหนด = -2 และระดับนัยสำคัญพบได้จากตารางการทดสอบของนักเรียน (ตารางที่ 2 ของภาคผนวก)
ถ้า จากนั้นสมมติฐานเกี่ยวกับความไม่สำคัญของสัมประสิทธิ์การถดถอยจะถูกปฏิเสธด้วยระดับนัยสำคัญเช่น ค่าสัมประสิทธิ์ (หรือ) ไม่ได้แตกต่างจากศูนย์โดยไม่ได้ตั้งใจและถูกสร้างขึ้นภายใต้อิทธิพลของปัจจัยที่ออกฤทธิ์อย่างเป็นระบบ
ถ้า จากนั้นสมมติฐานจะไม่ถูกปฏิเสธและลักษณะการสุ่มของการก่อตัวของพารามิเตอร์ได้รับการยอมรับ
ความสำคัญของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นตรวจสอบด้วย - การทดสอบของนักเรียนเช่น
สมมติฐานเกี่ยวกับความไม่มีนัยสำคัญของสัมประสิทธิ์สหสัมพันธ์ถูกปฏิเสธด้วยระดับนัยสำคัญหาก
ความคิดเห็นสำหรับการถดถอยคู่เชิงเส้น การทดสอบสมมติฐานเกี่ยวกับความสำคัญของสัมประสิทธิ์และสัมประสิทธิ์สหสัมพันธ์จะเทียบเท่ากับการทดสอบสมมติฐานเกี่ยวกับความสำคัญของสมการการถดถอยโดยรวม กล่าวคือ
ในการคำนวณช่วงความเชื่อมั่น ให้กำหนด ข้อผิดพลาดเล็กน้อยสำหรับแต่ละตัวชี้วัด ได้แก่
ช่วงความมั่นใจสำหรับค่าสัมประสิทธิ์การถดถอยเชิงเส้น:
หากศูนย์อยู่ในช่วงความเชื่อมั่น กล่าวคือ ขีดจำกัดล่างเป็นลบและขีดจำกัดบนเป็นค่าบวก จากนั้นพารามิเตอร์ที่ประมาณไว้จะถือเป็นศูนย์ เนื่องจาก ไม่สามารถรับความหมายทั้งเชิงบวกและเชิงลบในเวลาเดียวกันได้
ค่าพยากรณ์ถูกกำหนดโดยการแทนที่ค่าที่ทำนายไว้ที่สอดคล้องกันลงในสมการการถดถอย จากนั้นจึงคำนวณ หมายถึงข้อผิดพลาดมาตรฐานของการพยากรณ์
ที่ไหน
และกำลังถูกสร้างขึ้น คาดการณ์ช่วงความเชื่อมั่น
ช่วงเวลาอาจค่อนข้างกว้างเนื่องจากมีการสังเกตปริมาณน้อย
การถดถอย ไม่เชิงเส้นในตัวแปรที่รวมอยู่ , จะลดลงเป็นรูปแบบเชิงเส้นโดยการเปลี่ยนแปลงตัวแปรอย่างง่าย และการประมาณค่าพารามิเตอร์เพิ่มเติมจะดำเนินการโดยใช้กำลังสองน้อยที่สุด
ชไฮเปอร์โบลาการถดถอยแบบอิคัล:
ร การรุกราน , ไม่เชิงเส้น จ ตามพารามิเตอร์ที่ประเมิน , แบ่งออกเป็น 2 ประเภท คือ ภายในไม่เชิงเส้นฯลฯ (ไม่ลดเป็นรูปแบบเชิงเส้น) และ เชิงเส้นภายใน(ลดเป็นรูปแบบเชิงเส้นโดยใช้การแปลงที่เหมาะสม) เช่น
การถดถอยเอ็กซ์โปเนนเชียล:
การแปลงเชิงเส้น:
การถดถอยของกำลัง:
การแปลงเชิงเส้น:
ตัวบ่งชี้การถดถอยใหม่:
การแปลงเชิงเส้น:
ลอการิทึมการถดถอย:
การแปลงเชิงเส้น:
2. แก้ไขปัญหาทั่วไป
ตัวอย่าง9 .1 . สำหรับวิสาหกิจทางการเกษตร 15 แห่ง (ตารางที่ 9.1) เป็นที่ทราบกันดังต่อไปนี้: - จำนวนอุปกรณ์ต่อหน่วยพื้นที่หว่าน (หน่วย/เฮกตาร์) และ - ปริมาณผลผลิตที่ปลูก (พันหน่วยการเงิน) จำเป็น:
1) กำหนดการพึ่งพา
2) สร้างเขตข้อมูลสหสัมพันธ์และกราฟของสมการถดถอยเชิงเส้นบน
3) สรุปเกี่ยวกับคุณภาพของแบบจำลองและคำนวณค่าพยากรณ์ด้วยค่าพยากรณ์ 112% ของระดับเฉลี่ย
ตารางที่ 9.1
สารละลาย:
1) ใน Excel สร้างตารางเสริม 9.2
ตารางที่ 9.2
ข้าว.9 .1. ตารางการคำนวณค่ากลาง
มาคำนวณจำนวนการวัดกัน โดยทำในเซลล์ บี19ใส่ = นับ(A2:A16 ) .
การใช้ฟังก์ชัน ∑ (ผลรวมอัตโนมัติ) บนแถบเครื่องมือ มาตรฐาน ต นายา หาผลรวมของทั้งหมด (เซลล์ B17) และ (เซลล์ ค17).
ข้าว. 9.2. การคำนวณผลรวมของค่าและค่าเฉลี่ย
ในการคำนวณค่าเฉลี่ย เราใช้ฟังก์ชัน MS Excel ในตัว AVERAGE() ช่วงของค่าในการกำหนดค่าเฉลี่ยจะแสดงอยู่ในวงเล็บ ดังนั้นปริมาณเฉลี่ยของผลิตภัณฑ์ที่ปลูกใน 15 ฟาร์มคือ 210.833 พันพัน หน่วย และจำนวนอุปกรณ์เฉลี่ย 6.248 หน่วย/เฮกตาร์
เพื่อเติมคอลัมน์ ดี, อี, เอฟใส่สูตรคำนวณผลคูณ: ลงในเซลล์ ดี2 ใส่ = B2*C2จากนั้นกด ENTER บนคีย์บอร์ดของคุณ คลิกซ้ายที่เซลล์ ดี2 และจับมุมขวาล่างของเซลล์นี้ (เครื่องหมายบวกสีดำ) แล้วดึงลงไปที่เซลล์ ดี16 - ช่วงจะถูกเติมโดยอัตโนมัติ ดี3 - ดี16 .
ในการคำนวณ เลือกสรรโอ้ ความแปรปรวนร่วมระหว่าง และ เราใช้สูตรคือ ไปที่เซลล์ บี21 ใส่ = ดี18- บี18* ค18 และเราได้ 418.055 (รูปที่ 9.3)
ข้าว.9 .3. การคำนวณ
คัดเลือกว้าวการกระจายตัวคุณเพราะเราหาได้จากสูตร สำหรับสิ่งนี้ในเซลล์ บี22 ใส่ = E18-B18^2 (^- เครื่องหมายแสดงการยกกำลัง ) และเราได้ 11.337 ในทำนองเดียวกัน เรากำหนด =16745.05556 (รูปที่ 9.4)
ข้าว.9 .4. การคำนวณวาร์(x) และวาร์ (ย)
ต่อไป เมื่อใช้ฟังก์ชัน MS Excel มาตรฐาน "CORREL" เราจะคำนวณค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นสำหรับปัญหาของเรา โดยฟังก์ชันจะมีรูปแบบ "=CORREL(B2:B16;C2:C16)" และค่า rxy= 0.96. ค่าผลลัพธ์ของค่าสัมประสิทธิ์สหสัมพันธ์บ่งชี้ถึงความสัมพันธ์โดยตรงและแข็งแกร่งระหว่างความพร้อมของอุปกรณ์และปริมาณของผลิตภัณฑ์ที่ปลูก
เราพบ วีตัวอย่างสัมประสิทธิ์การถดถอยเชิงเส้น =36.87; พารามิเตอร์ = -17.78 ซึ่งหมายความว่าสมการการถดถอยเชิงเส้นคู่มีรูปแบบ =-17.78+36.87
ค่าสัมประสิทธิ์แสดงให้เห็นว่าเมื่อปริมาณอุปกรณ์เพิ่มขึ้น 1 หน่วย/เฮกตาร์ ปริมาณผลิตภัณฑ์ที่ปลูกจะเพิ่มขึ้นโดยเฉลี่ย 36.875 พันชิ้น หน่วย (รูปที่ 9.5)
ข้าว.9 .5. การคำนวณพารามิเตอร์สมการถดถอย
ดังนั้นสมการถดถอยจะมีลักษณะดังนี้:
เราแทนค่าจริงลงในสมการผลลัพธ์ x(ปริมาณของอุปกรณ์) เราค้นหาค่าทางทฤษฎีของปริมาตรของผลิตภัณฑ์ที่ปลูก (รูปที่ 9.6)
ข้าว.9 .6. การคำนวณค่าทางทฤษฎีของปริมาตรของผลิตภัณฑ์ที่ปลูก
โดยใช้ ตัวช่วยสร้างแผนภูมิเราสร้างฟิลด์สหสัมพันธ์ (เน้นคอลัมน์ด้วยค่า และ ) และสมการถดถอยเชิงเส้น (เน้นคอลัมน์ด้วยค่า และ ) การเลือกประเภทแผนภูมิ - ต ปรากฏการณ์ ในไดอะแกรมผลลัพธ์ ให้กรอกพารามิเตอร์ที่จำเป็น (ชื่อ ป้ายกำกับแกน คำอธิบาย ฯลฯ) เป็นผลให้เราได้กราฟที่แสดงในรูปที่ 1 9.7.
ข้าว.9 .7. กราฟของการพึ่งพาปริมาณของผลิตภัณฑ์ที่ปลูกกับจำนวนอุปกรณ์
เพื่อประเมินคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น เราคำนวณ:
. ถึงค่าสัมประสิทธิ์การตัดสินใจ=0.92 ซึ่งแสดงให้เห็นว่า 92% ของการเปลี่ยนแปลงต้นทุนการผลิตอธิบายได้จากการเปลี่ยนแปลงในปริมาณการผลิต และ 8% เกิดจากปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง ซึ่งบ่งบอกถึงคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น
. กับสีแดงยูยูข้อผิดพลาดที่การประมาณ. เมื่อต้องการทำเช่นนี้ในคอลัมน์ ชมลองคำนวณความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎี a ในคอลัมน์ ฉัน- การแสดงออก. โปรดทราบว่าฟังก์ชัน MS Excel มาตรฐาน "ABS" ใช้ในการคำนวณค่าโมดูโล เมื่อคูณค่าเฉลี่ย (เซลล์ ฉัน18 ) ที่ 100% เราได้ 18.2% ดังนั้นโดยเฉลี่ยแล้วค่าทางทฤษฎีจึงเบี่ยงเบนไปจากค่าจริง 18.2% (รูปที่ 1.8)
เราประมาณการโดยใช้เกณฑ์ฟิชเชอร์ ชม.นาชิโมสต์ขสมการลงทะเบียนกับสิ่งเหล่านี้โดยทั่วไป: 150,74.
ที่ระดับนัยสำคัญ 0.05 = 4.67 เราพิจารณาโดยใช้ฟังก์ชันทางสถิติในตัว เร็วขึ้น(รูปที่ 1.9) จำเป็นต้องจำไว้ว่า "Degrees_freedom1" เป็นตัวส่วนและ "Degrees_freedom2" เป็นตัวเศษโดยที่จำนวนพารามิเตอร์ในสมการการถดถอยคือ (เรามี 2) n- จำนวนคู่ค่าเริ่มต้น (เรามี 15)
เพราะ ดังนั้นสมการถดถอยจะมีนัยสำคัญที่ =0.05
ข้าว.9 .8. การหาค่าสัมประสิทธิ์การตัดสินใจและข้อผิดพลาดในการประมาณค่าเฉลี่ย
ข้าว. 9 . 9 . กล่องโต้ตอบฟังก์ชั่นเร็วขึ้น
ต่อไปเราจะกำหนด กับค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยตามสูตร ผลการวิจัยพบว่าเมื่อปริมาณผลิตภัณฑ์ที่ผลิตเพิ่มขึ้น 1% ต้นทุนการผลิตผลิตภัณฑ์เหล่านี้โดยเฉลี่ยโดยรวมจะเพิ่มขึ้น 1.093%
มาคำนวณกัน มูลค่าการคาดการณ์โดยแทนลงในสมการถดถอย =-19.559+36.8746 ค่าทำนายของตัวประกอบ =1.12=6.248*1.12=6.9978 เราได้ =238.48. ดังนั้นด้วยจำนวนอุปกรณ์จำนวน 6.9978 หน่วย/เฮกตาร์ ปริมาณผลผลิตจะอยู่ที่ 238.48 พันหน่วย หน่วย
มาหาความแปรปรวนที่เหลือ โดยคำนวณผลรวมของกำลังสองของความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎี =39.166 ใส่สูตรดังนี้ = รูท(J17/(B19-2))ไปที่เซลล์ ชม2 1 (รูปที่ 9.10)
ข้าว.9 .10. การหาค่าความแปรปรวนคงเหลือ
กับสีแดงญาญ่ามาตรฐานข้อผิดพลาดครั้งที่พยากรณ์:
ที่ระดับนัยสำคัญ = 0.05 โดยใช้ฟังก์ชันทางสถิติในตัว นักศึกษาลองกำหนด =2.1604 แล้วคำนวณค่าความคลาดเคลื่อนการคาดการณ์สูงสุด ซึ่งใน 95% ของกรณีจะไม่เกิน .
ดีคาดการณ์ช่วงความเชื่อมั่น:
หรือ .
การคาดการณ์ต้นทุนการผลิตที่สมบูรณ์มีความน่าเชื่อถือ (1-0.05 = 0.95) แต่ไม่ถูกต้อง เนื่องจากช่วงของขีดจำกัดบนและล่างของช่วงความเชื่อมั่นคือ ครั้ง สิ่งนี้เกิดขึ้นเนื่องจากการสังเกตปริมาณน้อย
จะต้องสังเกตว่า MS Excel มีฟังก์ชันทางสถิติในตัวซึ่งสามารถลดจำนวนการคำนวณระดับกลางได้อย่างมากเช่น (รูปที่ 9.11):
เพื่อคำนวณ วีเลือกสรรเอ็กซ์เฉลี่ยเอ็กซ์ใช้ฟังก์ชัน ค่าเฉลี่ย(หมายเลข 1:หมายเลขเอ็น) จากหมวดหมู่ เชิงสถิติ .
ความแปรปรวนร่วมตัวอย่างระหว่าง และ พบได้โดยใช้ฟังก์ชัน โควาร์(arrayเอ็กซ์;อาร์เรย์ย) จากหมวดหมู่ เชิงสถิติ .
คัดเลือกสการกระจายตัวและกำหนดโดยฟังก์ชันทางสถิติ DISPR(หมายเลข 1:หมายเลขเอ็น) .
ข้าว.9 .11. การคำนวณผู้ให้บริการที่มีฟังก์ชันในตัวนางสาวเอ็กเซล
ปพารามิเตอร์สการถดถอยเชิงเส้นใน Excel คุณสามารถกำหนดได้หลายวิธี
1 ทาง) การใช้ฟังก์ชันในตัว ไลน์- ขั้นตอนมีดังนี้:
1. เลือกพื้นที่ 5x2 ของเซลล์ว่าง (5 แถว 2 คอลัมน์) เพื่อแสดงผลลัพธ์ของสถิติการถดถอย หรือพื้นที่ 1x2 เพื่อให้ได้เฉพาะค่าสัมประสิทธิ์การถดถอย
2. ด้วย ตัวช่วยสร้างฟังก์ชั่นท่ามกลาง เชิงสถิติ เลือกฟังก์ชั่น ไลน์และกรอกข้อโต้แย้ง (รูปที่ 9.12):
ข้าว. 9 . 12 . กล่องโต้ตอบสำหรับป้อนอาร์กิวเมนต์ของฟังก์ชันไลน์
รู้จัก_ค่า_ย
รู้จัก_ค่า_x
ต- ค่าตรรกะ (1 หรือ 0) ซึ่งบ่งชี้ว่ามีหรือไม่มีคำศัพท์อิสระในสมการ ชุดที่ 1;
สถิติ- ค่าตรรกะ (1 หรือ 0) ซึ่งระบุว่าจะแสดงข้อมูลเพิ่มเติมเกี่ยวกับการวิเคราะห์การถดถอยหรือไม่ ตั้งเป็น 1
3. หมายเลขแรกของตารางจะปรากฏในเซลล์ด้านซ้ายบนของพื้นที่ที่เลือก หากต้องการเปิดทั้งตาราง ให้กดปุ่ม < เอฟ2> แล้ว - ไปที่คีย์ผสม < CTRL> + < กะ> + < เข้า> .
สถิติการถดถอยเพิ่มเติมจะแสดงเป็น (ตาราง 9.3):
ตารางที่ 9.3
ค่าสัมประสิทธิ์ |
ค่าสัมประสิทธิ์ |
อาร์เอ็มเอส |
อาร์เอ็มเอส |
ค่าสัมประสิทธิ์ |
อาร์เอ็มเอส |
สถิติ |
จำนวนองศาความเป็นอิสระ |
ผลรวมการถดถอยของกำลังสอง |
ผลรวมที่เหลือของกำลังสอง |
อันเป็นผลมาจากการประยุกต์ใช้ฟังก์ชัน ไลน์เราได้รับ:
( 2 ทาง) การใช้เครื่องมือวิเคราะห์ข้อมูล การถดถอย คุณสามารถรับผลลัพธ์ของสถิติการถดถอย การวิเคราะห์ความแปรปรวน, ช่วงความเชื่อมั่น, ค่าตกค้าง, กราฟการปรับเส้นการถดถอย, กราฟค่าตกค้าง และ ความน่าจะเป็นปกติ- ขั้นตอนมีดังนี้:
1. คุณต้องตรวจสอบการเข้าถึง แพ็คเกจการวิเคราะห์- โดยไปที่เมนูหลัก (ผ่านปุ่ม ไมโครซอฟต์ ออฟฟิศเข้าถึงตัวเลือก MS Excel) ในกล่องโต้ตอบตัวเลือก นางสาวเอ็กเซล» เลือกคำสั่ง “ส่วนเสริม” และเลือกส่วนเสริมทางด้านขวา การวิเคราะห์แพ็คเกจ ก จากนั้นคลิกปุ่ม "ไป" (รูปที่ 9.13) ในกล่องโต้ตอบที่เปิดขึ้น ให้ทำเครื่องหมายในช่องถัดจาก "แพ็คเกจการวิเคราะห์" และคลิก "ตกลง" (รูปที่ 9.14)
บนแท็บข้อมูล ในกลุ่มการวิเคราะห์ คุณจะสามารถเข้าถึง Add-in ที่ติดตั้งไว้ได้ (รูปที่ 9.15)
ข้าว.9 .13. เปิดใช้งานส่วนเสริมในนางสาวเอ็กเซล
ข้าว.9 .14. กล่องโต้ตอบ Add-Ins
ข้าว.9 .15. Add-in การวิเคราะห์ข้อมูลบน Ribbonนางสาวเอ็กเซล 2007 .
2. เลือก “ข้อมูล” ในกลุ่ม “การวิเคราะห์” และเลือกคำสั่ง การวิเคราะห์ใช่ n nykh ในกล่องโต้ตอบที่เปิดขึ้น เลือกเครื่องมือวิเคราะห์ "การถดถอย" และคลิก "ตกลง" (รูปที่ 9.16):
ข้าว.9 .16. กล่องโต้ตอบการวิเคราะห์ข้อมูล
ในกล่องโต้ตอบที่ปรากฏขึ้น (รูปที่ 9.17) ให้กรอกข้อมูลในฟิลด์:
ช่วงเวลาอินพุตย- ช่วงที่มีข้อมูลของลักษณะผลลัพธ์ Y
ช่วงเวลาอินพุตเอ็กซ์- ช่วงที่มีข้อมูลที่มีลักษณะอธิบาย X;
แท็ก- ธงที่ระบุว่าบรรทัดแรกมีชื่อคอลัมน์หรือไม่
ตแอนต้า-ศูนย์- ธงแสดงการมีหรือไม่มีคำอิสระในสมการ
ช่วงเอาท์พุต- เพียงพอที่จะระบุเซลล์ด้านซ้ายบนของช่วงอนาคต
แผ่นงานใหม่- คุณสามารถตั้งชื่อที่กำหนดเองสำหรับแผ่นงานใหม่ที่จะแสดงผลลัพธ์
ข้าว.9 .17. กล่องโต้ตอบการถดถอย
หากต้องการรับข้อมูลเกี่ยวกับปริมาณคงเหลือ แปลงคงเหลือ ความเหมาะสม และความน่าจะเป็นปกติ คุณจะต้องทำเครื่องหมายในช่องที่เหมาะสมในกล่องโต้ตอบ
ข้าว. 9 . 18 . ผลลัพธ์จากการใช้เครื่องมือการถดถอย
ใน นางสาวเอ็กเซล เส้นแนวโน้มสามารถเพิ่มลงในแผนภูมิพื้นที่ฮิสโตแกรมหรือกราฟได้ เมื่อต้องการทำสิ่งนี้:
1. จำเป็นต้องเลือกพื้นที่การลงจุดแผนภูมิและเลือก "เค้าโครง" ใน Ribbon และในกลุ่มการวิเคราะห์ให้เลือกคำสั่ง "เส้นแนวโน้ม" (รูปที่ 9.19) เลือก "ตัวเลือกเส้นแนวโน้มขั้นสูง" จากรายการเมนูแบบเลื่อนลง
ข้าว. 1.19.ริบบิ้น
2. ในกล่องโต้ตอบที่ปรากฏขึ้น ให้เลือกค่าจริง จากนั้นกล่องโต้ตอบ "รูปแบบเส้นแนวโน้ม" จะเปิดขึ้น (รูปที่ 9.20) ซึ่งคุณเลือกประเภทของเส้นแนวโน้มและตั้งค่าพารามิเตอร์ที่เหมาะสม
ข้าว. 9 . 20 . กล่องโต้ตอบ"รูปแบบเส้นแนวโน้ม"
สำหรับแนวโน้มพหุนาม จำเป็นต้องกำหนดระดับของพหุนามโดยประมาณ การกรองเชิงเส้น- จำนวนคะแนนเฉลี่ย
เลือก เชิงเส้นเพื่อสร้างสมการถดถอยเชิงเส้น
เช่น ข้อมูลเพิ่มเติมสามารถ แสดงสมการใน diกกรัมและ วางค่าบนไดอะแกรม(รูปที่ 9.21)
ข้าว. 9 . 21 . แนวโน้มเชิงเส้น
ตัวแบบการถดถอยแบบไม่เชิงเส้น จะแสดงไว้เมื่อคำนวณพารามิเตอร์ของสมการโดยใช้ฟังก์ชันทางสถิติที่เลือกใน Excel ลGRFPRIBL- ขั้นตอนการคำนวณเหมือนกับการใช้ฟังก์ชัน LINEST
รูปแบบการถดถอยที่ง่ายที่สุดจากมุมมองของความเข้าใจ การตีความ และเทคนิคการคำนวณคือรูปแบบการถดถอยเชิงเส้น
สมการการถดถอยคู่เชิงเส้น โดยที่
a 0 , a 1 เป็นพารามิเตอร์โมเดล ε i เป็นตัวแปรสุ่ม (ค่าส่วนที่เหลือ)
พารามิเตอร์โมเดลและเนื้อหา:
สมการถดถอยเสริมด้วยตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อ ตัวบ่งชี้ดังกล่าวคือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นซึ่งคำนวณโดยใช้สูตร:
หรือ .
เพื่อประเมินคุณภาพการคัดเลือก ฟังก์ชันเชิงเส้นกำลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นถูกคำนวณเรียกว่า ค่าสัมประสิทธิ์การตัดสินใจ- ค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของลักษณะที่มีประสิทธิผล อธิบายโดยการถดถอยของความแปรปรวนรวมของลักษณะที่มีประสิทธิผล:
,
ที่ไหน
.
ดังนั้น ค่านี้จะระบุถึงส่วนแบ่งของความแปรปรวนที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้นำมาพิจารณาในแบบจำลอง
หลังจากสร้างสมการการถดถอยแล้ว จะมีการตรวจสอบความเพียงพอและความแม่นยำของแบบจำลองโดยอาศัยการวิเคราะห์จำนวนคงเหลือ ε i (ค่าเบี่ยงเบนของค่าที่คำนวณจากค่าจริง)
ระดับชุดสารตกค้าง
ความสัมพันธ์และ การวิเคราะห์การถดถอยดำเนินการสำหรับประชากรจำนวนจำกัด ในเรื่องนี้ ตัวบ่งชี้การถดถอย ความสัมพันธ์ และการกำหนดอาจถูกบิดเบือนโดยการกระทำของปัจจัยสุ่ม ในการตรวจสอบว่าตัวบ่งชี้เหล่านี้มีลักษณะทั่วไปสำหรับประชากรทั้งหมดเพียงใด และไม่ว่าจะเป็นผลมาจากความบังเอิญของสถานการณ์สุ่มหรือไม่ จำเป็นต้องตรวจสอบความเพียงพอของแบบจำลองที่สร้างขึ้น
การตรวจสอบความเพียงพอของแบบจำลองประกอบด้วยการกำหนดความสำคัญของแบบจำลองและการกำหนดว่ามีหรือไม่มีอยู่ ข้อผิดพลาดอย่างเป็นระบบ.
ค่านิยม เวลา 1สอดคล้องกับข้อมูล เอ็กซ์ฉันตามค่าทางทฤษฎี 0และ 1,สุ่ม ค่าสัมประสิทธิ์ที่คำนวณจากนั้นจะเป็นแบบสุ่มเช่นกัน 0และ 1.
มีการตรวจสอบความสำคัญของสัมประสิทธิ์การถดถอยแต่ละรายการโดยใช้ แบบทดสอบของนักเรียนโดยทดสอบสมมติฐานว่าค่าสัมประสิทธิ์การถดถอยแต่ละค่ามีค่าเท่ากับศูนย์ ในเวลาเดียวกันพวกเขาพบว่าพารามิเตอร์ที่คำนวณนั้นโดยทั่วไปสำหรับการแสดงชุดเงื่อนไข: ค่าพารามิเตอร์ที่ได้รับนั้นเป็นผลมาจากการกระทำของตัวแปรสุ่มหรือไม่ สูตรที่เหมาะสมสำหรับค่าสัมประสิทธิ์การถดถอยที่สอดคล้องกัน
สูตรการพิจารณาค่าทีของนักเรียน
ที่ไหน
S a 0 ,S a 1 - ส่วนเบี่ยงเบนมาตรฐานของเทอมอิสระและสัมประสิทธิ์การถดถอย กำหนดโดยสูตร
ที่ไหน
ส ε - ส่วนเบี่ยงเบนมาตรฐานแบบจำลองคงเหลือ (ความคลาดเคลื่อนมาตรฐานของการประมาณค่า) ซึ่งกำหนดโดยสูตร
ค่าที่คำนวณได้ของการทดสอบทีจะถูกเปรียบเทียบกับค่าที่ทำเป็นตารางของเกณฑ์ ทีαγ ซึ่งถูกกำหนดเมื่อ (n - เค— 1) ระดับความเป็นอิสระและระดับนัยสำคัญที่สอดคล้องกัน α หากค่าที่คำนวณได้ของเกณฑ์ t เกินค่าตาราง ทีαγ ดังนั้นพารามิเตอร์จึงถือว่ามีนัยสำคัญ ในกรณีนี้แทบจะเป็นไปไม่ได้เลยที่ค่าพารามิเตอร์ที่พบนั้นเกิดจากความบังเอิญแบบสุ่มเท่านั้น
ความสำคัญของสมการการถดถอยโดยรวมได้รับการประเมินบนพื้นฐานของการทดสอบของฟิชเชอร์ ซึ่งนำหน้าด้วยการวิเคราะห์ความแปรปรวน
ผลรวมของการเบี่ยงเบนกำลังสองของตัวแปรจากค่าเฉลี่ยแบ่งออกเป็นสองส่วน - "อธิบาย" และ "ไม่ได้อธิบาย":
ผลรวมของการเบี่ยงเบนกำลังสอง
ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอย (หรือผลรวมตัวประกอบของการเบี่ยงเบนกำลังสอง)
- ผลรวมที่เหลือของการเบี่ยงเบนกำลังสองซึ่งแสดงถึงอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง
การวิเคราะห์รูปแบบความแปรปรวนมีรูปแบบที่นำเสนอในตารางที่ 35 ( - จำนวนการสังเกต - จำนวนพารามิเตอร์สำหรับตัวแปร)
ตารางที่ 35 - การวิเคราะห์รูปแบบความแปรปรวน
ส่วนประกอบความแปรปรวน | ผลรวมของกำลังสอง | จำนวนองศาความเป็นอิสระ | การกระจายตัวต่อระดับความเป็นอิสระ |
ทั่วไป | |||
แฟกทอเรียล | |||
สารตกค้าง |
การกำหนดความแปรปรวนด้วยอิสระระดับหนึ่งจะทำให้ความแปรปรวนมีรูปแบบที่เทียบเคียงได้ เมื่อเปรียบเทียบปัจจัยและความแปรปรวนคงเหลือต่อระดับความเป็นอิสระ เราได้ค่าของเกณฑ์ฟิชเชอร์:
หากต้องการทดสอบความสำคัญของสมการการถดถอยโดยรวม ให้ใช้ การทดสอบ F ของฟิชเชอร์. ในกรณีของการถดถอยเชิงเส้นแบบคู่ ความสำคัญของแบบจำลองการถดถอยจะถูกกำหนดโดยสูตรต่อไปนี้: .
หาก ณ ระดับนัยสำคัญที่กำหนด หากค่าที่คำนวณได้ของเกณฑ์ F ที่มี γ 1 =k, γ 2 =( พี - เค - 1) ระดับความเป็นอิสระมากกว่าที่ตาราง จากนั้นถือว่าแบบจำลองมีนัยสำคัญ สมมติฐานเกี่ยวกับลักษณะสุ่มของคุณลักษณะที่ประมาณไว้ถูกปฏิเสธ และ นัยสำคัญทางสถิติและความน่าเชื่อถือ การตรวจสอบการมีหรือไม่มีข้อผิดพลาดอย่างเป็นระบบ (การปฏิบัติตามข้อกำหนดเบื้องต้นของวิธีกำลังสองน้อยที่สุด - LSM) ดำเนินการตามการวิเคราะห์จำนวนคงเหลือ การคำนวณข้อผิดพลาดแบบสุ่มของพารามิเตอร์การถดถอยเชิงเส้นและค่าสัมประสิทธิ์สหสัมพันธ์จะดำเนินการตามสูตร
,
หากต้องการทดสอบความสุ่มของชุดสารตกค้าง คุณสามารถใช้การทดสอบจุดเปลี่ยน (จุดสูงสุด) จุดถือเป็นจุดเปลี่ยนหาก: เงื่อนไขต่อไปนี้: ε ฉัน -1< ε i >ε ฉัน +1 หรือ ε ฉัน -1 > ε ฉัน< ε i +1
ถัดไปจะคำนวณจำนวนจุดเปลี่ยน p เกณฑ์การสุ่มที่มีระดับนัยสำคัญ 5% เช่น กับ ความน่าจะเป็นของความมั่นใจ 95% คือการเติมเต็มความไม่เท่าเทียมกัน:
วงเล็บเหลี่ยมหมายความว่าถูกยึดแล้ว ทั้งส่วนตัวเลขที่อยู่ในวงเล็บ หากความไม่เท่าเทียมกันเป็นที่พอใจ แสดงว่าแบบจำลองนั้นถือว่าเพียงพอ
เพื่อตรวจสอบความเท่าเทียมกัน ความคาดหวังทางคณิตศาสตร์สำหรับลำดับสารตกค้างที่เป็นศูนย์ จะมีการคำนวณค่าเฉลี่ยของสารตกค้างจำนวนหนึ่ง:
ถ้า = 0 จะถือว่าแบบจำลองไม่มีข้อผิดพลาดอย่างเป็นระบบคงที่ และเพียงพอตามเกณฑ์ค่าเฉลี่ยเป็นศูนย์
ถ้า ≠ 0 แสดงว่าสมมติฐานว่างที่ว่าความคาดหวังทางคณิตศาสตร์เท่ากับศูนย์จะถูกทดสอบ โดยคำนวณค่าทีทดสอบของนักเรียนโดยใช้สูตร:
โดยที่ S ε คือค่าเบี่ยงเบนมาตรฐานของแบบจำลองที่เหลือ (ข้อผิดพลาดมาตรฐาน)
ค่า t-criterion ถูกเปรียบเทียบกับ t αγที่ทำเป็นตาราง หากความไม่เท่าเทียมกัน t > t αγ เป็นที่พอใจ แสดงว่าแบบจำลองนั้นไม่เพียงพอตามเกณฑ์นี้
การกระจายตัวของระดับของสารตกค้างจำนวนหนึ่งควรเท่ากันในทุกค่า เอ็กซ์(คุณสมบัติ การรักร่วมเพศ).หากไม่ตรงตามเงื่อนไขนี้แล้ว ความไม่สมดุล .
หากต้องการประมาณค่าความต่างศักย์ต่างกันด้วยขนาดตัวอย่างขนาดเล็ก คุณสามารถใช้ได้ วิธีโกลด์เฟลด์-ควอนต์, สาระสำคัญก็คือมันจำเป็น:
จัดเรียงค่าตัวแปร เอ็กซ์ตามลำดับจากน้อยไปมาก;
แบ่งชุดของการสังเกตตามลำดับออกเป็นสองกลุ่ม
สำหรับการสังเกตแต่ละกลุ่ม ให้สร้างสมการถดถอย
กำหนดผลรวมที่เหลือของกำลังสองสำหรับกลุ่มที่หนึ่งและสองโดยใช้สูตร: ; , ที่ไหน
n 1 - จำนวนการสังเกตในกลุ่มแรก
n 2 - จำนวนการสังเกตในกลุ่มที่สอง
คำนวณเกณฑ์หรือ (ตัวเศษต้องมีผลรวมกำลังสองจำนวนมาก) เมื่อดำเนินการ สมมติฐานว่างเกี่ยวกับความเป็นเนื้อเดียวกันเกณฑ์การคำนวณ F จะเป็นไปตามเกณฑ์ F ด้วยองศาอิสระ γ 1 =n 1 -m, γ 2 =n - n 1 - m) สำหรับแต่ละ จำนวนคงเหลือสี่เหลี่ยม (โดยที่ ม — จำนวนพารามิเตอร์โดยประมาณในสมการถดถอย) ยิ่งค่าที่คำนวณได้ F เกินค่าตารางของเกณฑ์ F ยิ่งมีการละเมิดสมมติฐานของความเท่าเทียมกันของความแปรปรวนของค่าคงเหลือมากขึ้น
ตรวจสอบความเป็นอิสระของลำดับของสารตกค้าง (ขาดความสัมพันธ์อัตโนมัติ) โดยใช้การทดสอบ Durbin-Watson d ถูกกำหนดโดยสูตร:
ค่าที่คำนวณได้ของเกณฑ์จะถูกเปรียบเทียบกับค่าวิกฤต d1 และ d2 ที่ต่ำกว่าของสถิติ Durbin-Watson เป็นไปได้ในกรณีต่อไปนี้:
1) ถ้า ง< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;
2) ถ้า ง 1 < ง < วันที่ 2 (รวมถึงค่าเหล่านี้ด้วย) ถือว่าไม่มีเหตุผลเพียงพอที่จะสรุปอย่างใดอย่างหนึ่ง จะต้องถูกนำมาใช้ เกณฑ์เพิ่มเติมตัวอย่างเช่น ค่าสัมประสิทธิ์ความสัมพันธ์อัตโนมัติตัวแรก:
หากค่าที่คำนวณได้ของสัมประสิทธิ์ในโมดูลัสน้อยกว่าค่าในตาราง r 1cr แสดงว่าสมมติฐานของการไม่มีความสัมพันธ์อัตโนมัติได้รับการยอมรับ มิฉะนั้นสมมติฐานนี้จะถูกปฏิเสธ
3) ถ้า วันที่ 2 < ง < 2, จากนั้นจึงยอมรับสมมติฐานเกี่ยวกับความเป็นอิสระของสิ่งตกค้าง และแบบจำลองได้รับการยอมรับว่าเพียงพอตามเกณฑ์นี้
4) ถ้า d> 2 แสดงว่าสิ่งนี้บ่งชี้ ความสัมพันธ์อัตโนมัติเชิงลบของเหลือ ในกรณีนี้ ค่าที่คำนวณได้ของเกณฑ์จะต้องแปลงโดยใช้สูตร d′= 4 - d และเปรียบเทียบกับค่าวิกฤต d′ , ไม่ง.
การตรวจสอบว่าการกระจายของลำดับที่เหลือสอดคล้องกับกฎการกระจายแบบปกติหรือไม่สามารถทำได้โดยใช้เกณฑ์ R/S ซึ่งกำหนดโดยสูตร:
โดยที่ S ε คือค่าเบี่ยงเบนมาตรฐานของแบบจำลองที่เหลือ (ข้อผิดพลาดมาตรฐาน) เปรียบเทียบค่าที่คำนวณได้ของเกณฑ์ R/S ค่าตาราง(ขอบเขตล่างและบน ความสัมพันธ์นี้) และหากค่าไม่ตกอยู่ในช่วงระหว่างขอบเขตวิกฤต ดังนั้นด้วยระดับนัยสำคัญที่กำหนด สมมติฐานเกี่ยวกับความเป็นปกติของการแจกแจงจะถูกปฏิเสธ มิฉะนั้นสมมติฐานจะได้รับการยอมรับ
เพื่อประเมินคุณภาพ แบบจำลองการถดถอยขอแนะนำให้ใช้ด้วย ดัชนีความสัมพันธ์(สัมประสิทธิ์สหสัมพันธ์พหุคูณ)
สูตรกำหนดดัชนีสหสัมพันธ์
ที่ไหน
ผลรวมของการเบี่ยงเบนกำลังสองของตัวแปรตามจากค่าเฉลี่ย กำหนดโดยสูตร:
ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอย กำหนดโดยสูตร:
ผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง คำนวณโดยสูตร:
สมการ สามารถแสดงได้ดังนี้:
ดัชนีสหสัมพันธ์รับค่าตั้งแต่ 0 ถึง 1 ยิ่งค่าดัชนีสูงเท่าใด ค่าที่คำนวณได้ของคุณลักษณะผลลัพธ์ก็จะยิ่งใกล้เคียงกับค่าจริงมากขึ้นเท่านั้น ดัชนีสหสัมพันธ์ใช้สำหรับการเชื่อมต่อระหว่างตัวแปรทุกรูปแบบ ด้วยการถดถอยเชิงเส้นคู่จะเท่ากับ ค่าสัมประสิทธิ์คู่ความสัมพันธ์
คุณลักษณะความแม่นยำถูกใช้เป็นการวัดความแม่นยำของแบบจำลอง: ในการพิจารณาการวัดความแม่นยำของแบบจำลอง ให้คำนวณ:
- ข้อผิดพลาดสูงสุด- สอดคล้องกับค่าเบี่ยงเบนของค่าเบี่ยงเบนที่คำนวณได้ของค่าที่คำนวณได้จากค่าจริง
- เฉลี่ย ความผิดพลาดอย่างแน่นอน - ข้อผิดพลาดแสดงว่าค่าจริงโดยเฉลี่ยเบี่ยงเบนไปจากแบบจำลองเท่าใด
- ความแปรปรวนของอนุกรมสารตกค้าง (ความแปรปรวนที่เหลือ)
โดยที่คือค่าเฉลี่ยของชุดสารตกค้าง กำหนดโดยสูตร
- หมายถึงค่าคลาดเคลื่อนกำลังสอง- แสดงถึงรากที่สองของความแปรปรวน: , ยังไง มูลค่าน้อยลงข้อผิดพลาด ยิ่งแบบจำลองมีความแม่นยำมากขึ้น
- เฉลี่ย ข้อผิดพลาดที่เกี่ยวข้องการประมาณ.
ข้อผิดพลาดในการประมาณโดยเฉลี่ยไม่ควรเกิน 8-10%
หากแบบจำลองการถดถอยได้รับการพิจารณาว่าเพียงพอและพารามิเตอร์แบบจำลองมีนัยสำคัญ ให้ดำเนินการสร้างการคาดการณ์ต่อไป .
ค่าที่คาดการณ์ไว้ตัวแปร ที่ได้จากการแทนที่ค่าคาดหวังของตัวแปรอิสระลงในสมการการถดถอย เอ็กซ์พยากรณ์
พยากรณ์นี้เรียกว่า ตามจุดความน่าจะเป็นของการคาดการณ์จุดที่จะเกิดขึ้นจริงนั้นแทบจะเป็นศูนย์ ดังนั้นช่วงความเชื่อมั่นของการพยากรณ์จึงคำนวณด้วยความน่าเชื่อถือสูง
ช่วงความเชื่อมั่นสำหรับการคาดการณ์ขึ้นอยู่กับ ข้อผิดพลาดมาตรฐาน, การกำจัด เอ็กซ์วิ่งจากค่าเฉลี่ยของมัน , จำนวนการสังเกต nและระดับนัยสำคัญของการพยากรณ์ α ช่วงความเชื่อมั่นของการคาดการณ์คำนวณโดยใช้สูตร: หรือ
ที่ไหน
ทีตาราง - พิจารณาจากตารางการแจกแจงของนักเรียนสำหรับระดับนัยสำคัญ α และจำนวนองศาอิสระ γ=n-k-1
ตัวอย่างที่ 13.
จากการสำรวจครอบครัวทั้ง 8 กลุ่ม ทราบข้อมูลเกี่ยวกับความสัมพันธ์ระหว่างค่าใช้จ่ายด้านอาหารและรายได้ของครอบครัว (ตารางที่ 36)
ตารางที่ 36 - ความสัมพันธ์ระหว่างค่าใช้จ่ายด้านอาหารและระดับรายได้ของครอบครัว
ค่าอาหารพันรูเบิล | 0,9 | 1,2 | 1,8 | 2,2 | 2,6 | 2,9 | 3,3 | 3,8 |
รายได้ของครอบครัวพันรูเบิล | 1,2 | 3,1 | 5,3 | 7,4 | 9,6 | 11,8 | 14,5 | 18,7 |
สมมติว่าความสัมพันธ์ระหว่างรายได้ของครอบครัวกับรายจ่ายด้านอาหารนั้นเป็นเส้นตรง เพื่อยืนยันสมมติฐานของเรา เราจะสร้างฟิลด์สหสัมพันธ์ (รูปที่ 8)
กราฟแสดงให้เห็นว่าจุดต่างๆ เรียงกันเป็นเส้นตรงเส้นหนึ่ง
เพื่อความสะดวกในการคำนวณเพิ่มเติม เราจะรวบรวมตารางที่ 37
ลองคำนวณพารามิเตอร์ของสมการเชิงเส้นของการถดถอยคู่กัน - ในการทำสิ่งนี้ เราใช้สูตร:
รูปที่ 8 - ฟิลด์สหสัมพันธ์
เราได้สมการ:
เหล่านั้น. ด้วยรายได้ครอบครัวเพิ่มขึ้น 1,000 รูเบิล ค่าอาหารเพิ่มขึ้น 168 รูเบิล
การคำนวณสัมประสิทธิ์สหสัมพันธ์เชิงเส้น