ความสำคัญของสมการการถดถอยได้รับการประเมินตาม การประเมินนัยสำคัญทางสถิติของสมการถดถอยและพารามิเตอร์ต่างๆ
ในการวิจัยทางเศรษฐกิจและสังคม มักจำเป็นต้องทำงานในกลุ่มประชากรที่จำกัดหรือใช้ข้อมูลตัวอย่าง ดังนั้นหลังจากนั้น พารามิเตอร์ทางคณิตศาสตร์สมการถดถอยจำเป็นต้องประเมินค่าเหล่านั้นและสมการโดยรวมเพื่อนัยสำคัญทางสถิติ เช่น จำเป็นต้องตรวจสอบให้แน่ใจว่าสมการผลลัพธ์และพารามิเตอร์นั้นเกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สุ่ม
ประการแรก มีการประเมินนัยสำคัญทางสถิติของสมการโดยรวม โดยทั่วไปการประเมินจะดำเนินการโดยใช้การทดสอบ F ของฟิชเชอร์ การคำนวณเกณฑ์ F จะขึ้นอยู่กับกฎของการบวกผลต่าง กล่าวคือ ลักษณะการกระจายทั่วไป-ผลลัพธ์ = การกระจายตัวของปัจจัย + การกระจายตัวของสารตกค้าง
ราคาจริง
ราคาตามทฤษฎี
ด้วยการสร้างสมการการถดถอย คุณสามารถคำนวณค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ได้ เช่น คำนวณโดยใช้สมการถดถอยโดยคำนึงถึงพารามิเตอร์ของมัน
ค่าเหล่านี้จะกำหนดลักษณะของแอตทริบิวต์ผลลัพธ์ที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่รวมอยู่ในการวิเคราะห์
มีความคลาดเคลื่อน (ค่าคงเหลือ) เสมอระหว่างค่าจริงของแอตทริบิวต์ผลลัพธ์กับค่าที่คำนวณตามสมการการถดถอยเนื่องจากอิทธิพลของปัจจัยอื่น ๆ ที่ไม่รวมอยู่ในการวิเคราะห์
ความแตกต่างระหว่างค่าทางทฤษฎีและค่าจริงของคุณลักษณะผลลัพธ์เรียกว่าค่าคงเหลือ การเปลี่ยนแปลงทั่วไปผลลัพธ์แอตทริบิวต์:
ความแปรผันของคุณลักษณะผลลัพธ์ซึ่งเกิดจากการแปรผันในลักษณะของปัจจัยที่รวมอยู่ในการวิเคราะห์ได้รับการประเมินโดยการเปรียบเทียบค่าทางทฤษฎีของผลลัพธ์ ลักษณะเฉพาะและค่าเฉลี่ย ความแปรผันของสารตกค้างโดยการเปรียบเทียบค่าทางทฤษฎีและค่าที่แท้จริงของลักษณะผลลัพธ์ ผลต่างรวม, สารตกค้างและค่าจริงมีจำนวนองศาอิสระต่างกัน
ทั่วไป, n- จำนวนหน่วยของประชากรที่กำลังศึกษา
แท้จริง, n- จำนวนปัจจัยที่รวมอยู่ในการวิเคราะห์
สารตกค้าง
การทดสอบ F ของฟิชเชอร์คำนวณเป็นอัตราส่วนต่อ และคำนวณเพื่อความเป็นอิสระหนึ่งระดับ
การใช้การทดสอบฟิชเชอร์ F เพื่อประมาณนัยสำคัญทางสถิติของสมการการถดถอยนั้นสมเหตุสมผลมาก - นี่คือผลลัพธ์ ลักษณะที่กำหนดโดยปัจจัยที่รวมอยู่ในการวิเคราะห์ ได้แก่ นี่คือสัดส่วนของผลลัพธ์ที่อธิบาย เข้าสู่ระบบ. - นี่คือ (รูปแบบ) ของคุณลักษณะผลลัพธ์ที่เกิดจากปัจจัยที่ไม่คำนึงถึงอิทธิพล เช่น ไม่รวมอยู่ในการวิเคราะห์
ที่. F-test ได้รับการออกแบบมาเพื่อประเมิน สำคัญส่วนเกิน หากไม่ต่ำกว่าอย่างมีนัยสำคัญ และมากกว่านั้นหากเกิน การวิเคราะห์จะไม่รวมปัจจัยเหล่านั้นที่มีอิทธิพลต่อแอตทริบิวต์ผลลัพธ์อย่างแท้จริง
การทดสอบ F ของฟิชเชอร์จะถูกทำเป็นตาราง ค่าจริงจะถูกเปรียบเทียบกับค่าที่ทำเป็นตาราง ถ้า สมการถดถอยจะถือว่ามีนัยสำคัญทางสถิติ ในทางกลับกัน หากสมการไม่มีนัยสำคัญทางสถิติและไม่สามารถใช้ในทางปฏิบัติได้ ความสำคัญของสมการโดยรวมจะบ่งบอกถึงนัยสำคัญทางสถิติของตัวบ่งชี้สหสัมพันธ์
หลังจากประมาณสมการโดยรวมแล้ว จำเป็นต้องประเมินนัยสำคัญทางสถิติของพารามิเตอร์ของสมการ การประเมินนี้ดำเนินการโดยใช้สถิติของนักเรียน สถิติทีคำนวณเป็นอัตราส่วนของพารามิเตอร์ของสมการ (โมดูโล) ต่อค่าคลาดเคลื่อนกำลังสองมาตรฐานของค่าดังกล่าว หากมีการประมาณแบบจำลองปัจจัยเดียว จะมีการคำนวณสถิติ 2 รายการ
ในทั้งหมด โปรแกรมคอมพิวเตอร์การคำนวณข้อผิดพลาดมาตรฐานและสถิติ t สำหรับพารามิเตอร์จะดำเนินการด้วยการคำนวณพารามิเตอร์ด้วยตนเอง ตารางสถิติ T หากค่าเป็น แสดงว่าพารามิเตอร์ดังกล่าวมีนัยสำคัญทางสถิติ เช่น เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สุ่ม
การคำนวณสถิติทีโดยพื้นฐานแล้วหมายถึงการทดสอบสมมติฐานว่างว่าพารามิเตอร์ไม่มีนัยสำคัญ เช่น ความเท่าเทียมกันของมันถึงศูนย์ ด้วยแบบจำลองปัจจัยเดียว จะมีการประเมินสมมติฐาน 2 ข้อ: และ
ระดับนัยสำคัญของการยอมรับสมมติฐานว่างนั้นขึ้นอยู่กับระดับของการยอมรับ ความน่าจะเป็นของความมั่นใจ- ดังนั้นหากผู้วิจัยกำหนดระดับความน่าจะเป็นไว้ที่ 95% ระดับนัยสำคัญการยอมรับจะถูกคำนวณ ดังนั้น หากระดับนัยสำคัญคือ ≥ 0.05 ก็ถือว่ายอมรับและพารามิเตอร์ถือว่าไม่มีนัยสำคัญทางสถิติ ถ้า ดังนั้นทางเลือกอื่นจะถูกปฏิเสธและยอมรับ: และ
แพ็คเกจแอปพลิเคชันทางสถิติยังให้ระดับความสำคัญของการนำไปใช้อีกด้วย สมมติฐานว่าง- การประเมินความสำคัญของสมการถดถอยและพารามิเตอร์ของสมการสามารถให้ผลลัพธ์ดังต่อไปนี้:
ประการแรก สมการโดยรวมมีนัยสำคัญ (ตามการทดสอบ F) และพารามิเตอร์ทั้งหมดของสมการก็มีนัยสำคัญทางสถิติเช่นกัน ซึ่งหมายความว่าสมการผลลัพธ์สามารถใช้ทั้งสองอย่างได้ การตัดสินใจของฝ่ายบริหารและเพื่อการพยากรณ์
ประการที่สอง จากการทดสอบ F สมการนี้มีนัยสำคัญทางสถิติ แต่พารามิเตอร์อย่างน้อยหนึ่งตัวของสมการไม่มีนัยสำคัญ สมการนี้สามารถนำไปใช้ในการตัดสินใจของฝ่ายบริหารเกี่ยวกับปัจจัยที่กำลังวิเคราะห์ได้ แต่ไม่สามารถใช้สำหรับการพยากรณ์ได้
ประการที่สาม สมการไม่มีนัยสำคัญทางสถิติ หรือจากการทดสอบ F สมการนั้นมีนัยสำคัญ แต่พารามิเตอร์ทั้งหมดของสมการผลลัพธ์ไม่มีนัยสำคัญ สมการนี้ไม่สามารถใช้เพื่อวัตถุประสงค์ใดๆ ได้
เพื่อให้สมการการถดถอยได้รับการยอมรับว่าเป็นแบบจำลองของความสัมพันธ์ระหว่างคุณลักษณะผลลัพธ์และคุณลักษณะตัวประกอบ จำเป็นอย่างยิ่งที่ ปัจจัยที่สำคัญที่สุดกำหนดผลลัพธ์เพื่อให้การตีความพารามิเตอร์ของสมการมีความหมายสอดคล้องกับการเชื่อมโยงตามทฤษฎีในปรากฏการณ์ที่กำลังศึกษา ค่าสัมประสิทธิ์การตัดสินใจ R2 จะต้องเป็น > 0.5
เมื่อก่อสร้าง หลายสมการสำหรับการถดถอยขอแนะนำให้ประเมินโดยใช้ค่าสัมประสิทธิ์การตัดสินใจที่ปรับแล้ว (R 2) ค่าของ R2 (รวมถึงความสัมพันธ์) จะเพิ่มขึ้นตามจำนวนปัจจัยที่รวมอยู่ในการวิเคราะห์ ค่าสัมประสิทธิ์ถูกประเมินค่าสูงเกินไปโดยเฉพาะในประชากรขนาดเล็ก เพื่อเป็นการชำระหนี้ อิทธิพลเชิงลบ R 2 และความสัมพันธ์จะถูกปรับตามจำนวนระดับความเป็นอิสระเช่น จำนวนองค์ประกอบที่แตกต่างกันอย่างอิสระเมื่อรวมปัจจัยบางอย่างไว้ด้วย
ปรับค่าสัมประสิทธิ์การตัดสินใจแล้ว
n–ขนาดประชากร/จำนวนการสังเกต
เค– จำนวนปัจจัยที่รวมอยู่ในการวิเคราะห์
n-1– จำนวนองศาความเป็นอิสระ
(1-อาร์ 2)- ค่าของส่วนที่เหลือ/ความแปรปรวนที่ไม่สามารถอธิบายได้ของคุณลักษณะผลลัพธ์
น้อยลงเสมอ ร 2- โดยพื้นฐานแล้วสามารถเปรียบเทียบการประมาณค่าของสมการด้วย ตัวเลขที่แตกต่างกันปัจจัยที่วิเคราะห์
34. ปัญหาการศึกษาอนุกรมเวลา
อนุกรมเวลาเรียกว่าอนุกรมเวลาหรืออนุกรมเวลา อนุกรมเวลาคือลำดับตัวบ่งชี้ที่เรียงลำดับตามเวลาซึ่งแสดงถึงปรากฏการณ์เฉพาะ (ปริมาณ GDP จาก 90 ถึง 98) วัตถุประสงค์ของการศึกษาอนุกรมเวลาคือเพื่อระบุรูปแบบการพัฒนาของปรากฏการณ์ที่กำลังศึกษา (แนวโน้มหลัก) และการคาดการณ์บนพื้นฐานนี้ จากคำจำกัดความของ RD เป็นไปตามที่อนุกรมใด ๆ ประกอบด้วยสององค์ประกอบ: เวลา t และระดับของอนุกรม (ค่าเฉพาะเหล่านั้นของตัวบ่งชี้บนพื้นฐานของการสร้างซีรี่ส์ RD) ซีรี่ส์ DR สามารถเป็น 1) ช่วงเวลา - ซีรีส์ซึ่งตัวบ่งชี้ได้รับการแก้ไข ณ จุดเวลาหนึ่งที่ วันที่เจาะจง, 2) ช่วงเวลา - อนุกรมซึ่งตัวบ่งชี้ได้รับในช่วงระยะเวลาหนึ่ง (1. ประชากรของเซนต์ปีเตอร์สเบิร์ก 2. ปริมาณของ GDP สำหรับช่วงเวลานั้น) จำเป็นต้องแบ่งอนุกรมออกเป็นโมเมนต์และช่วงเวลา เนื่องจากจะเป็นตัวกำหนดลักษณะเฉพาะของการคำนวณตัวบ่งชี้บางตัวของซีรีย์ DR ผลรวมของระดับ ซีรีย์ช่วงเวลาให้ผลลัพธ์ที่ตีความได้อย่างมีความหมาย ซึ่งไม่สามารถพูดเกี่ยวกับการรวมระดับของอนุกรมโมเมนต์ได้ เนื่องจากอนุกรมหลังประกอบด้วยการนับซ้ำ ปัญหาที่สำคัญที่สุดในการวิเคราะห์อนุกรมเวลา มีปัญหาเรื่องความสามารถในการเปรียบเทียบระดับอนุกรม แนวคิดนี้มีความหลากหลายมาก ระดับจะต้องเปรียบเทียบได้ในแง่ของวิธีการคำนวณและในแง่ของอาณาเขตและความครอบคลุมของหน่วยประชากร หากซีรีส์ DR ถูกสร้างขึ้นในแง่ต้นทุน จะต้องแสดงหรือคำนวณทุกระดับในราคาที่เทียบเคียงได้ เมื่อสร้างอนุกรมช่วงเวลา ระดับต่างๆ จะต้องมีลักษณะเฉพาะของช่วงเวลาที่เหมือนกัน เมื่อสร้างอนุกรมโมเมนต์ ระดับจะต้องถูกบันทึกในวันเดียวกัน DR series อาจสมบูรณ์หรือไม่สมบูรณ์ก็ได้ มีการใช้แถวที่ไม่สมบูรณ์ในสิ่งพิมพ์อย่างเป็นทางการ (1980,1985,1990,1995,1996,1997,1998,1999...) การวิเคราะห์ที่ครอบคลุม RD รวมถึงการศึกษาประเด็นต่อไปนี้:
1. การคำนวณตัวบ่งชี้การเปลี่ยนแปลงในระดับ RD
2. การคำนวณตัวบ่งชี้ RD เฉลี่ย
3. ระบุแนวโน้มหลักของซีรีส์ การสร้างโมเดลเทรนด์
4. การประเมินความสัมพันธ์อัตโนมัติใน RD การสร้างแบบจำลองการถดถอยอัตโนมัติ
5. ความสัมพันธ์ของ RD (ศึกษาการเชื่อมต่อระหว่างซีรีย์ DR ของ m/y)
6. การพยากรณ์ทางขับ
35. ตัวบ่งชี้การเปลี่ยนแปลงในระดับอนุกรมเวลา .
ใน มุมมองทั่วไป RowD สามารถแสดงได้:
y – ระดับ DR, t – โมเมนต์หรือช่วงเวลาที่มีระดับ (ตัวบ่งชี้) อยู่, n – ความยาวของ DR Series (จำนวนช่วงเวลา) เมื่อศึกษาชุดของพลวัตจะมีการคำนวณตัวบ่งชี้ต่อไปนี้: 1. การเติบโตแบบสัมบูรณ์ 2. ค่าสัมประสิทธิ์การเติบโต (อัตราการเติบโต) 3. การเร่งความเร็ว 4. ค่าสัมประสิทธิ์การเติบโต (อัตราการเติบโต) 5. ค่าสัมบูรณ์เพิ่มขึ้น 1% ตัวบ่งชี้ที่คำนวณได้อาจเป็น: 1. ลูกโซ่ - ได้รับจากการเปรียบเทียบแต่ละระดับของชุดข้อมูลกับชุดก่อนหน้าทันที 2. พื้นฐาน - ได้รับจากการเปรียบเทียบกับระดับที่เลือกเป็นพื้นฐานสำหรับการเปรียบเทียบ (เว้นแต่จะระบุไว้โดยเฉพาะระดับที่ 1 ของ ซีรีส์นี้ถือเป็นฐาน) 1. การเพิ่มขึ้นแบบสัมบูรณ์ของเชน:- แสดงให้เห็นว่ามากหรือน้อยเพียงใด การเพิ่มขึ้นแบบสัมบูรณ์ของลูกโซ่เรียกว่าตัวบ่งชี้อัตราการเปลี่ยนแปลงในระดับ อนุกรมเวลา. การเติบโตแบบสัมบูรณ์พื้นฐาน- ถ้าเป็นซีรีย์ระดับนั้น ตัวชี้วัดที่เกี่ยวข้องแสดงเป็น % จากนั้นการเพิ่มขึ้นสัมบูรณ์จะแสดงเป็นจุดเปลี่ยน 2. อัตราการเติบโต (อัตราการเติบโต):คำนวณเป็นอัตราส่วนของระดับของซีรีส์ต่อระดับก่อนหน้า (สัมประสิทธิ์การเติบโตของห่วงโซ่) หรือระดับที่ใช้เป็นพื้นฐานของการเปรียบเทียบ (สัมประสิทธิ์การเติบโตพื้นฐาน): กำหนดลักษณะจำนวนครั้งในแต่ละระดับของซีรีส์ > หรือ< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. ขึ้นอยู่กับการเพิ่มขึ้นสัมบูรณ์ ตัวบ่งชี้จะถูกคำนวณ - การเร่งความเร็วของการเติบโตแบบสัมบูรณ์- ความเร่งคือการเพิ่มขึ้นแบบสัมบูรณ์ของการเพิ่มขึ้นแบบสัมบูรณ์ ประเมินว่ากำไรเปลี่ยนแปลงไปอย่างไร ไม่ว่าจะมีเสถียรภาพหรือเร่ง (เพิ่มขึ้น) 4.อัตราการเติบโตคืออัตราส่วนการเติบโตต่อฐานการเปรียบเทียบ แสดงเป็น %: ; - อัตราการเติบโตคืออัตราการเติบโตลบ 100% แสดงกี่ % ระดับนี้แถว > หรือ< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.
2. การคำนวณตัวบ่งชี้ RD เฉลี่ย ระดับแถวเฉลี่ย การเพิ่มขึ้นแบบสัมบูรณ์โดยเฉลี่ย อัตราการเติบโตเฉลี่ย และอัตราการเติบโตเฉลี่ยจะถูกคำนวณ ตัวบ่งชี้เฉลี่ยได้รับการคำนวณเพื่อสรุปข้อมูลและทำให้สามารถเปรียบเทียบระดับและตัวบ่งชี้การเปลี่ยนแปลงในชุดต่างๆ 1. ระดับกลางแถวก) สำหรับอนุกรมช่วงเวลาคำนวณโดยใช้ค่าเฉลี่ยเลขคณิตอย่างง่าย โดยที่ n คือจำนวนระดับในอนุกรมเวลา b) สำหรับอนุกรมช่วงเวลา ระดับเฉลี่ยจะคำนวณโดยใช้สูตรเฉพาะซึ่งเรียกว่าค่าเฉลี่ยตามลำดับเวลา: - 2. การเพิ่มขึ้นสัมบูรณ์โดยเฉลี่ยคำนวณบนพื้นฐานของการเพิ่มขึ้นแบบสัมบูรณ์ของลูกโซ่โดยอิงจากค่าเฉลี่ยเลขคณิตอย่างง่าย:
. 3. ค่าสัมประสิทธิ์เฉลี่ยการเจริญเติบโตคำนวณตามค่าสัมประสิทธิ์การเติบโตของลูกโซ่โดยใช้สูตรค่าเฉลี่ยทางเรขาคณิต: เมื่อแสดงความคิดเห็นเกี่ยวกับตัวบ่งชี้เฉลี่ยของซีรีย์ DR จำเป็นต้องระบุ 2 จุด: ช่วงเวลาที่แสดงลักษณะของตัวบ่งชี้ที่วิเคราะห์และช่วงเวลาที่สร้างซีรีย์ DR 4. อัตราการเติบโตเฉลี่ย: . 5.อัตราการเติบโตเฉลี่ย: .
เพื่อประเมินความสำคัญและความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ จะใช้แบบทดสอบของนักเรียน
พบข้อผิดพลาดเฉลี่ยของค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร:
เอ็น
และขึ้นอยู่กับข้อผิดพลาด เกณฑ์ t จะถูกคำนวณ:
ค่าทีทดสอบที่คำนวณได้จะถูกนำไปเปรียบเทียบกับค่าแบบตารางที่พบในตารางการแจกแจงของนักเรียนที่ระดับนัยสำคัญ 0.05 หรือ 0.01 และจำนวนองศาอิสระ n-1 หากค่าที่คำนวณได้ของการทดสอบทีมากกว่าค่าตาราง จะถือว่าค่าสัมประสิทธิ์สหสัมพันธ์มีนัยสำคัญ
ในกรณีของความสัมพันธ์แบบเส้นโค้ง การทดสอบ F ใช้เพื่อประเมินความสำคัญของความสัมพันธ์สหสัมพันธ์และสมการการถดถอย คำนวณโดยสูตร:
หรือ
โดยที่ η คืออัตราส่วนสหสัมพันธ์ n – จำนวนการสังเกต ม. – จำนวนพารามิเตอร์ในสมการการถดถอย
ค่า F ที่คำนวณได้จะถูกเปรียบเทียบกับค่าในตารางสำหรับระดับนัยสำคัญที่ยอมรับ α (0.05 หรือ 0.01) และจำนวนองศาอิสระ k 1 =m-1 และ k 2 =n-m หากค่า F ที่คำนวณได้เกินตารางหนึ่ง จะถือว่าความสัมพันธ์มีนัยสำคัญ
ความสำคัญของค่าสัมประสิทธิ์การถดถอยถูกกำหนดโดยใช้การทดสอบนักเรียน ซึ่งคำนวณโดยใช้สูตร:
โดยที่ σ 2 และ i คือความแปรปรวนของสัมประสิทธิ์การถดถอย
คำนวณโดยสูตร:
โดยที่ k คือจำนวนคุณลักษณะของตัวประกอบในสมการการถดถอย
ค่าสัมประสิทธิ์การถดถอยถือว่ามีนัยสำคัญหาก t a 1 ≥t cr
t cr พบได้ในตารางจุดวิกฤติของการแจกแจงของนักเรียนในระดับนัยสำคัญที่ยอมรับและจำนวนองศาอิสระ k=n-1
4.3 การวิเคราะห์สหสัมพันธ์และการถดถอยใน Excel – เรามาทำการวิเคราะห์ความสัมพันธ์และการถดถอยของความสัมพันธ์ระหว่างผลผลิตและต้นทุนแรงงานต่อเมล็ดข้าว 1 ควินตัน เมื่อต้องการทำสิ่งนี้ ให้เปิดแผ่นงาน Excel แล้วป้อนค่าของลักษณะปัจจัยในเซลล์ A1:A30
ผลผลิตของพืชเมล็ดพืชในเซลล์ B1:B30 มูลค่าของลักษณะผลลัพธ์คือต้นทุนแรงงานต่อเมล็ดข้าว 1 ควินตัน ในเมนูเครื่องมือ เลือกตัวเลือกการวิเคราะห์ข้อมูล เมื่อคลิกซ้ายที่รายการนี้ เราจะเปิดเครื่องมือการถดถอย คลิกปุ่มตกลงและกล่องโต้ตอบการถดถอยจะปรากฏขึ้นบนหน้าจอ ในฟิลด์ ช่วงอินพุต Y ให้ป้อนค่าของคุณลักษณะผลลัพธ์ (เน้นเซลล์ B1:B30) ในฟิลด์ ช่วงอินพุต X ให้ป้อนค่าของลักษณะเฉพาะของปัจจัย (เน้นเซลล์ A1:A30) ทำเครื่องหมายระดับความน่าจะเป็น 95% และเลือกแผ่นงานใหม่ คลิกที่ปุ่มตกลง ตาราง "สรุปผลลัพธ์" จะปรากฏบนแผ่นงานซึ่งแสดงผลการคำนวณพารามิเตอร์ของสมการถดถอย ค่าสัมประสิทธิ์สหสัมพันธ์ และตัวบ่งชี้อื่น ๆ ที่ช่วยให้คุณสามารถกำหนดความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์และพารามิเตอร์ของสมการการถดถอย | ||||||||
บทสรุปของผลลัพธ์ | ||||||||
สถิติการถดถอย | ||||||||
พหูพจน์ ร | ||||||||
R-สแควร์ | ||||||||
R-กำลังสองที่ทำให้เป็นมาตรฐาน | ||||||||
ข้อผิดพลาดมาตรฐาน | ||||||||
ข้อสังเกต | ||||||||
การวิเคราะห์ความแปรปรวน | ||||||||
ความสำคัญ F | ||||||||
การถดถอย |
ราคาต่อรอง |
ข้อผิดพลาดมาตรฐาน |
t-สถิติ |
ค่า P |
ด้านล่าง 95% |
สูงสุด 95% |
ล่าง 95.0% |
|
สูงสุด 95.0% | ||||||||
แยก Y |
จากข้อมูลในตาราง เราจะสร้างสมการถดถอย: y x = 2.836-0.067x ค่าสัมประสิทธิ์การถดถอย a 1 = -0.067 หมายความว่าเมื่อผลผลิตเมล็ดพืชเพิ่มขึ้น 1 c/เฮกตาร์ ต้นทุนค่าแรงต่อเมล็ดพืช 1 c ลดลง 0.067 ชั่วโมงการทำงาน
โดยมีค่าสัมประสิทธิ์สหสัมพันธ์คือ r=0.85>0.7 ดังนั้น ลักษณะความสัมพันธ์ระหว่างลักษณะที่ศึกษาในกลุ่มประชากรกลุ่มนี้จึงใกล้เคียงกัน ค่าสัมประสิทธิ์การกำหนด r 2 = 0.73 แสดงให้เห็นว่า 73% ของการเปลี่ยนแปลงในลักษณะที่มีประสิทธิผล (ต้นทุนแรงงานต่อ 1 ควินตาลของเมล็ดพืช) มีสาเหตุมาจากการกระทำของลักษณะปัจจัย (ผลผลิตของเมล็ดข้าว)
ในตาราง จุดวิกฤติการกระจายของฟิชเชอร์ - Snedekor เราพบค่าวิกฤตของการทดสอบ F ที่ระดับนัยสำคัญ 0.05 และจำนวนดีกรีอิสระถึง 1 =m-1=2-1=1 และ k 2 =n-m=30-2= 28 เท่ากับ 4.21 เนื่องจากค่าที่คำนวณได้ของเกณฑ์มากกว่าเกณฑ์ในตาราง (F=74.9896>4.21) สมการการถดถอยจึงถือว่ามีนัยสำคัญ
เพื่อประเมินความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ ให้คำนวณการทดสอบของนักเรียน:
ใน
ในตารางจุดวิกฤตของการแจกแจงของนักเรียน เราพบค่าวิกฤตของการทดสอบทีที่ระดับนัยสำคัญ 0.05 และจำนวนระดับความอิสระ n-1=30-1=29 ซึ่งเท่ากับ 2.0452 เนื่องจากค่าที่คำนวณได้มากกว่าค่าตาราง ค่าสัมประสิทธิ์สหสัมพันธ์จึงมีนัยสำคัญ
เพื่อทดสอบนัยสำคัญ จะมีการวิเคราะห์อัตราส่วนของสัมประสิทธิ์การถดถอยและส่วนเบี่ยงเบนมาตรฐาน อัตราส่วนนี้คือการกระจายตัวของนักเรียน นั่นคือเพื่อกำหนดนัยสำคัญที่เราใช้แบบทดสอบที:
- อาร์เอ็มเอสจากการกระจายตัวของสารตกค้าง
- ผลรวมของการเบี่ยงเบนจากค่าเฉลี่ย
ถ้าอย่างนั้น. >t แท็บ แล้วสัมประสิทธิ์ b i มีนัยสำคัญ
ช่วงความเชื่อมั่นถูกกำหนดโดยสูตร:
ขั้นตอนการปฏิบัติงาน
นำข้อมูลเบื้องต้นตามตัวเลือกงาน (ตามหมายเลขนักศึกษาในวารสาร) มีการระบุวัตถุควบคุมแบบคงที่ที่มีอินพุตสองตัว เอ็กซ์ 1 , เอ็กซ์ 2 และทางออกหนึ่งทาง ย- มีการทดลองแบบพาสซีฟที่โรงงานและได้รับตัวอย่าง 30 คะแนนที่มีค่าต่างๆ เอ็กซ์ 1 , เอ็กซ์ 2 และ ยสำหรับการทดลองแต่ละครั้ง
เปิดไฟล์ใหม่ใน Excel 2007 Enter ข้อมูลความเป็นมาลงในคอลัมน์ของตารางต้นฉบับ - ค่าของตัวแปรอินพุต เอ็กซ์ 1 , เอ็กซ์ 2 และตัวแปรเอาท์พุต ย.
เตรียมคอลัมน์เพิ่มเติมสองคอลัมน์สำหรับการป้อนค่าจากการคำนวณ ยและของเหลือ
เรียกโปรแกรม “การถดถอย”: ข้อมูล / การวิเคราะห์ข้อมูล / การถดถอย
ข้าว. 1. กล่องโต้ตอบการวิเคราะห์ข้อมูล
ป้อนที่อยู่ของแหล่งข้อมูลลงในกล่องโต้ตอบ "การถดถอย":
ช่วงเวลาอินพุต Y, ช่วงเวลาอินพุต X (2 คอลัมน์)
ตั้งค่าระดับความน่าเชื่อถือเป็น 95%
ในตัวเลือก "ช่วงเวลาเอาต์พุต" ระบุเซลล์ด้านซ้ายบนของตำแหน่งที่มีเอาต์พุตข้อมูลการวิเคราะห์การถดถอย (เซลล์แรกบนหน้าที่ 2 ของแผ่นงาน)
เปิดใช้งานตัวเลือก "ส่วนที่เหลือ" และ "กราฟที่เหลือ"
กดปุ่ม OK เพื่อเริ่มต้น การวิเคราะห์การถดถอย.
ข้าว. 2. กล่องโต้ตอบการถดถอย
Excel จะแสดงตาราง 4 ตารางและกราฟ 2 กราฟของการพึ่งพาค่าคงเหลือของตัวแปร X1และ X2.
จัดรูปแบบตาราง "ผลลัพธ์ของผลรวม" - ขยายคอลัมน์ด้วยชื่อของข้อมูลเอาต์พุตสร้างตัวเลขสำคัญ 3 หลักหลังจุดทศนิยมในคอลัมน์ที่สอง
จัดรูปแบบตาราง "การวิเคราะห์ความแปรปรวน" - ทำให้จำนวนตัวเลขนัยสำคัญหลังจุดทศนิยมง่ายต่อการอ่านและทำความเข้าใจ ย่อชื่อตัวแปรให้สั้นลง และปรับความกว้างของคอลัมน์
จัดรูปแบบตารางสัมประสิทธิ์สมการ - ย่อชื่อตัวแปรให้สั้นลงและปรับความกว้างของคอลัมน์หากจำเป็น ทำให้จำนวนหลักที่มีนัยสำคัญอ่านและเข้าใจได้ง่ายขึ้น ลบ 2 คอลัมน์สุดท้าย (ค่าและเค้าโครงตาราง)
ถ่ายโอนข้อมูลจากตาราง "เอาต์พุตที่เหลือ" ไปยังคอลัมน์ที่เตรียมไว้ของตารางต้นฉบับ จากนั้นลบตาราง "เอาต์พุตที่เหลือ" (ตัวเลือก "แทรกพิเศษ")
ป้อนการประมาณค่าสัมประสิทธิ์ที่ได้รับลงในตารางต้นฉบับ
ดึงตารางผลลัพธ์ไปที่ด้านบนของหน้า
สร้างแผนภูมิใต้ตาราง ยประสบการณ์, ยการคำนวณและการคาดการณ์ข้อผิดพลาด (ตกค้าง)
จัดรูปแบบแผนภูมิที่เหลือ ใช้กราฟผลลัพธ์ประเมินความถูกต้องของแบบจำลองตามอินพุต X1, X2.
พิมพ์ผลลัพธ์ของการวิเคราะห์การถดถอย
ทำความเข้าใจผลลัพธ์ของการวิเคราะห์การถดถอย
จัดทำรายงานการทำงาน.
ตัวอย่างประสิทธิภาพการทำงาน
วิธีการวิเคราะห์การถดถอยใน EXCEL แสดงไว้ในรูปที่ 3-5
ข้าว. 3. ตัวอย่างการวิเคราะห์การถดถอยในแพ็คเกจ EXCEL
รูปที่ 4. แปลงคงเหลือแบบแปรผัน X1, X2
ข้าว. 5. แผนภูมิ ยประสบการณ์,ยการคำนวณและการคาดการณ์ข้อผิดพลาด (ตกค้าง)
จากการวิเคราะห์การถดถอย เราสามารถพูดได้ว่า:
1. สมการการถดถอยที่ได้รับโดยใช้ Excel มีรูปแบบ:
ค่าสัมประสิทธิ์การกำหนด:
ความแปรผันของผลลัพธ์ 46.5% อธิบายได้จากการแปรผันของปัจจัย
การทดสอบ F ทั่วไปจะทดสอบสมมติฐานเกี่ยวกับนัยสำคัญทางสถิติของสมการการถดถอย การวิเคราะห์จะดำเนินการโดยการเปรียบเทียบค่าจริงและค่าตารางของการทดสอบ Fisher F
เนื่องจากมูลค่าจริงเกินตาราง
จากนั้นเราจะสรุปได้ว่าผลลัพธ์สมการถดถอยมีนัยสำคัญทางสถิติ
ค่าสัมประสิทธิ์ ความสัมพันธ์หลายประการ:
ข 0 :
แท็บ (29, 0.975)=2.05
ข 0 :
ช่วงความเชื่อมั่น:
กำหนดช่วงความเชื่อมั่นของค่าสัมประสิทธิ์ ข 1 :
การตรวจสอบความสำคัญของสัมประสิทธิ์ ข 1 :
ไม่ >t แท็บ , สัมประสิทธิ์ b 1 มีนัยสำคัญ
ช่วงความเชื่อมั่น:
กำหนดช่วงความเชื่อมั่นของค่าสัมประสิทธิ์ ข 2 :
การทดสอบนัยสำคัญสำหรับสัมประสิทธิ์ ข 2 :
กำหนดช่วงความเชื่อมั่น:
ตัวเลือกงาน
ตารางที่ 2. อ็อพชันภารกิจ
ตัวเลือกหมายเลข | |||||||||||||||
สัญญาณที่มีประสิทธิภาพ ย ฉัน |
ย 1 |
ย 1 |
ย 1 |
ย 1 |
ย 1 |
ย 1 |
ย 1 |
ย 1 |
ย 1 |
ย 1 |
ย 2 |
ย 2 |
ย 2 |
ย 2 |
ย 2 |
ปัจจัยหมายเลข เอ็กซ์ ฉัน | |||||||||||||||
ปัจจัยหมายเลข เอ็กซ์ ฉัน |
ความต่อเนื่องของตารางที่ 1
ตัวเลือกหมายเลข | |||||||||||||||
สัญญาณที่มีประสิทธิภาพ ย ฉัน |
ย 2 |
ย 2 |
ย 2 |
ย 2 |
ย 2 |
ย 3 |
ย 3 |
ย 3 |
ย 3 |
ย 3 |
ย 3 |
ย 3 |
ย 3 |
ย 3 |
ย 3 |
ปัจจัยหมายเลข เอ็กซ์ ฉัน | |||||||||||||||
ปัจจัยหมายเลข เอ็กซ์ ฉัน |
ตารางที่ 3. ข้อมูลเริ่มต้น
ย 1 |
ย 2 |
ย 3 |
เอ็กซ์ 1 |
เอ็กซ์ 2 |
เอ็กซ์ 3 |
เอ็กซ์ 4 |
เอ็กซ์ 5 |
|
คำถามสำหรับการควบคุมตนเอง
ปัญหาการวิเคราะห์การถดถอย
ข้อกำหนดเบื้องต้นสำหรับการวิเคราะห์การถดถอย
สมการพื้นฐาน การวิเคราะห์ความแปรปรวน.
อัตราส่วน F ของฟิชเชอร์แสดงอะไร
มันถูกกำหนดอย่างไร ค่าตารางการทดสอบของฟิชเชอร์?
ค่าสัมประสิทธิ์การตัดสินใจแสดงอะไร?
จะกำหนดความสำคัญของสัมประสิทธิ์การถดถอยได้อย่างไร?
จะกำหนดช่วงความเชื่อมั่นของสัมประสิทธิ์การถดถอยได้อย่างไร?
จะกำหนดค่าการทดสอบทีที่คำนวณได้อย่างไร?
จะกำหนดค่าตารางของ t-test ได้อย่างไร?
กำหนดแนวคิดหลักของการวิเคราะห์ความแปรปรวนเพื่อแก้ไขปัญหาใดที่มีประสิทธิภาพมากที่สุด?
หลักทฤษฎีพื้นฐานของการวิเคราะห์ความแปรปรวนคืออะไร?
ดำเนินการสลายตัว จำนวนเงินทั้งหมดการเบี่ยงเบนกำลังสองเป็นองค์ประกอบในการวิเคราะห์ความแปรปรวน
จะรับค่าประมาณความแปรปรวนจากผลรวมของส่วนเบี่ยงเบนกำลังสองได้อย่างไร
จะได้จำนวนองศาอิสระที่ต้องการได้อย่างไร?
ข้อผิดพลาดมาตรฐานถูกกำหนดอย่างไร?
อธิบายการออกแบบการวิเคราะห์ความแปรปรวนแบบสองปัจจัย
การจำแนกประเภทข้ามแตกต่างจากการจำแนกแบบลำดับชั้นอย่างไร
ความแตกต่างระหว่างข้อมูลที่สมดุลคืออะไร?
รายงานนี้จัดทำขึ้นในโปรแกรมแก้ไขข้อความ Word บนกระดาษ A4 GOST 6656-76 (210x297 มม.) และประกอบด้วย:
ผลการคำนวณ
ชื่อของงานห้องปฏิบัติการ
วัตถุประสงค์ของการทำงาน
เวลาที่อนุญาตให้ดำเนินการให้เสร็จสิ้น
งานห้องปฏิบัติการ
การเตรียมตัวเข้าทำงาน – 0.5 วิชาการ ชั่วโมง.
เสร็จสิ้นงาน – 0.5 วิชาการ ชั่วโมง.
การคำนวณทางคอมพิวเตอร์ – 0.5 วิชาการ ชั่วโมง.
การออกแบบงาน – 0.5 วิชาการ ชั่วโมง.
วรรณกรรม
การระบุวัตถุควบคุม / A.D. Semenov, D.V. Artamonov, A.V. Bryukhachev คู่มือการศึกษา - เพนซ่า: ม.อ., 2546. - 211 น.
พื้นฐาน การวิเคราะห์ทางสถิติ- การประชุมเชิงปฏิบัติการเกี่ยวกับ วิธีการทางสถิติและการวิจัยการดำเนินงานโดยใช้แพ็คเกจ STATISTIC และ EXCEL / วูโคลอฟ อี.เอ.บทช่วยสอน
- - ม.: ฟอรั่ม, 2551. - 464 หน้า
พื้นฐานของทฤษฎีการระบุวัตถุควบคุม / เอเอ อิกเนติเยฟ เอส.เอ. อิกเนติเยฟ. คู่มือการศึกษา - ซาราตอฟ: SSTU, 2551 - 44 น. ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์
- เชิงเส้น;
- พลัง;
- สาธิต;
- ไฮเปอร์โบลาด้านเท่ากันหมด
ในตัวอย่างและงานที่ใช้ EXCEL / จี.วี. โกเรโลวา, ไอ.เอ. คัตสโก. - Rostov ไม่มี: Phoenix, 2006.- 475 หน้า
เป้าหมาย 2
แนวคิดพื้นฐาน 2
สั่งงาน 6
คำถามเพื่อการควบคุมตนเอง 13
เวลาที่จัดสรรให้ทำงานให้เสร็จ 14
คุณสามารถตรวจสอบความสำคัญของพารามิเตอร์สมการถดถอยได้โดยใช้สถิติแบบ t
ออกกำลังกาย:
สำหรับกลุ่มองค์กรที่ผลิตผลิตภัณฑ์ประเภทเดียวกัน ฟังก์ชันต้นทุนจะได้รับการพิจารณา:
y = α + βx;
y = α x β ;
y = α β x ;
y = α + β / x;
โดยที่ y คือต้นทุนการผลิตพันหน่วย
x คือผลผลิตการผลิต, พันหน่วย
ที่จำเป็น:
1. สร้างสมการการถดถอยแบบคู่ y จาก x:
3. ประเมินนัยสำคัญทางสถิติของสมการถดถอยโดยรวม
4. ประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์
5. ดำเนินการคาดการณ์ต้นทุนการผลิตโดยมีผลผลิตคาดการณ์ 195% ของระดับเฉลี่ย
6. ประเมินความแม่นยำของการพยากรณ์ คำนวณข้อผิดพลาดของการคาดการณ์และช่วงความเชื่อมั่น
7. ประเมินโมเดลผ่าน ข้อผิดพลาดโดยเฉลี่ยการประมาณ
สารละลาย:
1. สมการคือ y = α + βx
1. พารามิเตอร์สมการถดถอย
ค่าเฉลี่ย
การกระจายตัว
ส่วนเบี่ยงเบนมาตรฐาน
ค่าสัมประสิทธิ์สหสัมพันธ์
ความสัมพันธ์ระหว่างลักษณะ Y และปัจจัย X นั้นแข็งแกร่งและตรงไปตรงมา
สมการถดถอย
ค่าสัมประสิทธิ์การตัดสินใจ
R 2 = 0.94 2 = 0.89 เช่น ใน 88.9774% ของกรณี การเปลี่ยนแปลงใน x นำไปสู่การเปลี่ยนแปลงใน y กล่าวอีกนัยหนึ่ง ความแม่นยำในการเลือกสมการถดถอยมีสูง
x | ย | x2 | คุณ 2 | x∙y | ใช่(x) | (ปปป) 2 | (ป-ป(x)) 2 | (x-x น) 2 |
78 | 133 | 6084 | 17689 | 10374 | 142.16 | 115.98 | 83.83 | 1 |
82 | 148 | 6724 | 21904 | 12136 | 148.61 | 17.9 | 0.37 | 9 |
87 | 134 | 7569 | 17956 | 11658 | 156.68 | 95.44 | 514.26 | 64 |
79 | 154 | 6241 | 23716 | 12166 | 143.77 | 104.67 | 104.67 | 0 |
89 | 162 | 7921 | 26244 | 14418 | 159.9 | 332.36 | 4.39 | 100 |
106 | 195 | 11236 | 38025 | 20670 | 187.33 | 2624.59 | 58.76 | 729 |
67 | 139 | 4489 | 19321 | 9313 | 124.41 | 22.75 | 212.95 | 144 |
88 | 158 | 7744 | 24964 | 13904 | 158.29 | 202.51 | 0.08 | 81 |
73 | 152 | 5329 | 23104 | 11096 | 134.09 | 67.75 | 320.84 | 36 |
87 | 162 | 7569 | 26244 | 14094 | 156.68 | 332.36 | 28.33 | 64 |
76 | 159 | 5776 | 25281 | 12084 | 138.93 | 231.98 | 402.86 | 9 |
115 | 173 | 13225 | 29929 | 19895 | 201.86 | 854.44 | 832.66 | 1296 |
0 | 0 | 0 | 16.3 | 20669.59 | 265.73 | 6241 | ||
1027 | 1869 | 89907 | 294377 | 161808 | 1869 | 25672.31 | 2829.74 | 8774 |
หมายเหตุ: ค่าของ y(x) พบได้จากสมการถดถอยผลลัพธ์:
y(1) = 4.01*1 + 99.18 = 103.19
y(2) = 4.01*2 + 99.18 = 107.2
... ... ...
2. การประมาณค่าพารามิเตอร์สมการถดถอย
ความสำคัญของสัมประสิทธิ์สหสัมพันธ์
ใช้ตารางของนักเรียนเราจะพบ Ttable
ตาราง T (n-m-1;α/2) = (11;0.05/2) = 1.796
เนื่องจาก Tob > Ttabl เราปฏิเสธสมมติฐานที่ว่าค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0 กล่าวอีกนัยหนึ่ง ค่าสัมประสิทธิ์สหสัมพันธ์มีนัยสำคัญทางสถิติ
การวิเคราะห์ความแม่นยำในการประมาณค่าสัมประสิทธิ์การถดถอย
ส=0.1712
ช่วงความเชื่อมั่นสำหรับตัวแปรตาม
ให้เราคำนวณขอบเขตของช่วงเวลาที่ 95% ของค่าที่เป็นไปได้ของ Y จะเข้มข้นไม่ จำกัด จำนวนมากการสังเกตและ X = 1
(-20.41;56.24)
การทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิ์ สมการเชิงเส้นการถดถอย
1) สถิติ t
นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย a ได้รับการยืนยันแล้ว
นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย b ไม่ได้รับการยืนยัน
ช่วงความมั่นใจสำหรับสัมประสิทธิ์สมการถดถอย
เรามากำหนดกัน ช่วงความมั่นใจค่าสัมประสิทธิ์การถดถอยซึ่งมีความน่าเชื่อถือ 95% จะเป็นดังนี้:
(ก - เสื้อ ส ก ; ก + เสื้อ ส ก)
(1.306;1.921)
(ข - t ข S ข ; ข + t ข S ข)
(-9.2733;41.876)
โดยที่ t = 1.796
2) สถิติ F
เอฟเคพี = 4.84
เนื่องจาก F > Fkp สัมประสิทธิ์การตัดสินใจจึงมีนัยสำคัญทางสถิติ