ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

ความสำคัญของสมการการถดถอยได้รับการประเมินตาม การประเมินนัยสำคัญทางสถิติของสมการถดถอยและพารามิเตอร์ต่างๆ

ในการวิจัยทางเศรษฐกิจและสังคม มักจำเป็นต้องทำงานในกลุ่มประชากรที่จำกัดหรือใช้ข้อมูลตัวอย่าง ดังนั้นหลังจากนั้น พารามิเตอร์ทางคณิตศาสตร์สมการถดถอยจำเป็นต้องประเมินค่าเหล่านั้นและสมการโดยรวมเพื่อนัยสำคัญทางสถิติ เช่น จำเป็นต้องตรวจสอบให้แน่ใจว่าสมการผลลัพธ์และพารามิเตอร์นั้นเกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สุ่ม

ประการแรก มีการประเมินนัยสำคัญทางสถิติของสมการโดยรวม โดยทั่วไปการประเมินจะดำเนินการโดยใช้การทดสอบ F ของฟิชเชอร์ การคำนวณเกณฑ์ F จะขึ้นอยู่กับกฎของการบวกผลต่าง กล่าวคือ ลักษณะการกระจายทั่วไป-ผลลัพธ์ = การกระจายตัวของปัจจัย + การกระจายตัวของสารตกค้าง

ราคาจริง

ราคาตามทฤษฎี
ด้วยการสร้างสมการการถดถอย คุณสามารถคำนวณค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ได้ เช่น คำนวณโดยใช้สมการถดถอยโดยคำนึงถึงพารามิเตอร์ของมัน

ค่าเหล่านี้จะกำหนดลักษณะของแอตทริบิวต์ผลลัพธ์ที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่รวมอยู่ในการวิเคราะห์

มีความคลาดเคลื่อน (ค่าคงเหลือ) เสมอระหว่างค่าจริงของแอตทริบิวต์ผลลัพธ์กับค่าที่คำนวณตามสมการการถดถอยเนื่องจากอิทธิพลของปัจจัยอื่น ๆ ที่ไม่รวมอยู่ในการวิเคราะห์

ความแตกต่างระหว่างค่าทางทฤษฎีและค่าจริงของคุณลักษณะผลลัพธ์เรียกว่าค่าคงเหลือ การเปลี่ยนแปลงทั่วไปผลลัพธ์แอตทริบิวต์:

ความแปรผันของคุณลักษณะผลลัพธ์ซึ่งเกิดจากการแปรผันในลักษณะของปัจจัยที่รวมอยู่ในการวิเคราะห์ได้รับการประเมินโดยการเปรียบเทียบค่าทางทฤษฎีของผลลัพธ์ ลักษณะเฉพาะและค่าเฉลี่ย ความแปรผันของสารตกค้างโดยการเปรียบเทียบค่าทางทฤษฎีและค่าที่แท้จริงของลักษณะผลลัพธ์ ผลต่างรวม, สารตกค้างและค่าจริงมีจำนวนองศาอิสระต่างกัน

ทั่วไป, n- จำนวนหน่วยของประชากรที่กำลังศึกษา

แท้จริง, n- จำนวนปัจจัยที่รวมอยู่ในการวิเคราะห์

สารตกค้าง

การทดสอบ F ของฟิชเชอร์คำนวณเป็นอัตราส่วนต่อ และคำนวณเพื่อความเป็นอิสระหนึ่งระดับ

การใช้การทดสอบฟิชเชอร์ F เพื่อประมาณนัยสำคัญทางสถิติของสมการการถดถอยนั้นสมเหตุสมผลมาก - นี่คือผลลัพธ์ ลักษณะที่กำหนดโดยปัจจัยที่รวมอยู่ในการวิเคราะห์ ได้แก่ นี่คือสัดส่วนของผลลัพธ์ที่อธิบาย เข้าสู่ระบบ. - นี่คือ (รูปแบบ) ของคุณลักษณะผลลัพธ์ที่เกิดจากปัจจัยที่ไม่คำนึงถึงอิทธิพล เช่น ไม่รวมอยู่ในการวิเคราะห์

ที่. F-test ได้รับการออกแบบมาเพื่อประเมิน สำคัญส่วนเกิน หากไม่ต่ำกว่าอย่างมีนัยสำคัญ และมากกว่านั้นหากเกิน การวิเคราะห์จะไม่รวมปัจจัยเหล่านั้นที่มีอิทธิพลต่อแอตทริบิวต์ผลลัพธ์อย่างแท้จริง

การทดสอบ F ของฟิชเชอร์จะถูกทำเป็นตาราง ค่าจริงจะถูกเปรียบเทียบกับค่าที่ทำเป็นตาราง ถ้า สมการถดถอยจะถือว่ามีนัยสำคัญทางสถิติ ในทางกลับกัน หากสมการไม่มีนัยสำคัญทางสถิติและไม่สามารถใช้ในทางปฏิบัติได้ ความสำคัญของสมการโดยรวมจะบ่งบอกถึงนัยสำคัญทางสถิติของตัวบ่งชี้สหสัมพันธ์

หลังจากประมาณสมการโดยรวมแล้ว จำเป็นต้องประเมินนัยสำคัญทางสถิติของพารามิเตอร์ของสมการ การประเมินนี้ดำเนินการโดยใช้สถิติของนักเรียน สถิติทีคำนวณเป็นอัตราส่วนของพารามิเตอร์ของสมการ (โมดูโล) ต่อค่าคลาดเคลื่อนกำลังสองมาตรฐานของค่าดังกล่าว หากมีการประมาณแบบจำลองปัจจัยเดียว จะมีการคำนวณสถิติ 2 รายการ

ในทั้งหมด โปรแกรมคอมพิวเตอร์การคำนวณข้อผิดพลาดมาตรฐานและสถิติ t สำหรับพารามิเตอร์จะดำเนินการด้วยการคำนวณพารามิเตอร์ด้วยตนเอง ตารางสถิติ T หากค่าเป็น แสดงว่าพารามิเตอร์ดังกล่าวมีนัยสำคัญทางสถิติ เช่น เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สุ่ม

การคำนวณสถิติทีโดยพื้นฐานแล้วหมายถึงการทดสอบสมมติฐานว่างว่าพารามิเตอร์ไม่มีนัยสำคัญ เช่น ความเท่าเทียมกันของมันถึงศูนย์ ด้วยแบบจำลองปัจจัยเดียว จะมีการประเมินสมมติฐาน 2 ข้อ: และ

ระดับนัยสำคัญของการยอมรับสมมติฐานว่างนั้นขึ้นอยู่กับระดับของการยอมรับ ความน่าจะเป็นของความมั่นใจ- ดังนั้นหากผู้วิจัยกำหนดระดับความน่าจะเป็นไว้ที่ 95% ระดับนัยสำคัญการยอมรับจะถูกคำนวณ ดังนั้น หากระดับนัยสำคัญคือ ≥ 0.05 ก็ถือว่ายอมรับและพารามิเตอร์ถือว่าไม่มีนัยสำคัญทางสถิติ ถ้า ดังนั้นทางเลือกอื่นจะถูกปฏิเสธและยอมรับ: และ

แพ็คเกจแอปพลิเคชันทางสถิติยังให้ระดับความสำคัญของการนำไปใช้อีกด้วย สมมติฐานว่าง- การประเมินความสำคัญของสมการถดถอยและพารามิเตอร์ของสมการสามารถให้ผลลัพธ์ดังต่อไปนี้:

ประการแรก สมการโดยรวมมีนัยสำคัญ (ตามการทดสอบ F) และพารามิเตอร์ทั้งหมดของสมการก็มีนัยสำคัญทางสถิติเช่นกัน ซึ่งหมายความว่าสมการผลลัพธ์สามารถใช้ทั้งสองอย่างได้ การตัดสินใจของฝ่ายบริหารและเพื่อการพยากรณ์

ประการที่สอง จากการทดสอบ F สมการนี้มีนัยสำคัญทางสถิติ แต่พารามิเตอร์อย่างน้อยหนึ่งตัวของสมการไม่มีนัยสำคัญ สมการนี้สามารถนำไปใช้ในการตัดสินใจของฝ่ายบริหารเกี่ยวกับปัจจัยที่กำลังวิเคราะห์ได้ แต่ไม่สามารถใช้สำหรับการพยากรณ์ได้

ประการที่สาม สมการไม่มีนัยสำคัญทางสถิติ หรือจากการทดสอบ F สมการนั้นมีนัยสำคัญ แต่พารามิเตอร์ทั้งหมดของสมการผลลัพธ์ไม่มีนัยสำคัญ สมการนี้ไม่สามารถใช้เพื่อวัตถุประสงค์ใดๆ ได้

เพื่อให้สมการการถดถอยได้รับการยอมรับว่าเป็นแบบจำลองของความสัมพันธ์ระหว่างคุณลักษณะผลลัพธ์และคุณลักษณะตัวประกอบ จำเป็นอย่างยิ่งที่ ปัจจัยที่สำคัญที่สุดกำหนดผลลัพธ์เพื่อให้การตีความพารามิเตอร์ของสมการมีความหมายสอดคล้องกับการเชื่อมโยงตามทฤษฎีในปรากฏการณ์ที่กำลังศึกษา ค่าสัมประสิทธิ์การตัดสินใจ R2 จะต้องเป็น > 0.5

เมื่อก่อสร้าง หลายสมการสำหรับการถดถอยขอแนะนำให้ประเมินโดยใช้ค่าสัมประสิทธิ์การตัดสินใจที่ปรับแล้ว (R 2) ค่าของ R2 (รวมถึงความสัมพันธ์) จะเพิ่มขึ้นตามจำนวนปัจจัยที่รวมอยู่ในการวิเคราะห์ ค่าสัมประสิทธิ์ถูกประเมินค่าสูงเกินไปโดยเฉพาะในประชากรขนาดเล็ก เพื่อเป็นการชำระหนี้ อิทธิพลเชิงลบ R 2 และความสัมพันธ์จะถูกปรับตามจำนวนระดับความเป็นอิสระเช่น จำนวนองค์ประกอบที่แตกต่างกันอย่างอิสระเมื่อรวมปัจจัยบางอย่างไว้ด้วย

ปรับค่าสัมประสิทธิ์การตัดสินใจแล้ว

n–ขนาดประชากร/จำนวนการสังเกต

เค– จำนวนปัจจัยที่รวมอยู่ในการวิเคราะห์

n-1– จำนวนองศาความเป็นอิสระ

(1-อาร์ 2)- ค่าของส่วนที่เหลือ/ความแปรปรวนที่ไม่สามารถอธิบายได้ของคุณลักษณะผลลัพธ์

น้อยลงเสมอ ร 2- โดยพื้นฐานแล้วสามารถเปรียบเทียบการประมาณค่าของสมการด้วย ตัวเลขที่แตกต่างกันปัจจัยที่วิเคราะห์

34. ปัญหาการศึกษาอนุกรมเวลา

อนุกรมเวลาเรียกว่าอนุกรมเวลาหรืออนุกรมเวลา อนุกรมเวลาคือลำดับตัวบ่งชี้ที่เรียงลำดับตามเวลาซึ่งแสดงถึงปรากฏการณ์เฉพาะ (ปริมาณ GDP จาก 90 ถึง 98) วัตถุประสงค์ของการศึกษาอนุกรมเวลาคือเพื่อระบุรูปแบบการพัฒนาของปรากฏการณ์ที่กำลังศึกษา (แนวโน้มหลัก) และการคาดการณ์บนพื้นฐานนี้ จากคำจำกัดความของ RD เป็นไปตามที่อนุกรมใด ๆ ประกอบด้วยสององค์ประกอบ: เวลา t และระดับของอนุกรม (ค่าเฉพาะเหล่านั้นของตัวบ่งชี้บนพื้นฐานของการสร้างซีรี่ส์ RD) ซีรี่ส์ DR สามารถเป็น 1) ช่วงเวลา - ซีรีส์ซึ่งตัวบ่งชี้ได้รับการแก้ไข ณ จุดเวลาหนึ่งที่ วันที่เจาะจง, 2) ช่วงเวลา - อนุกรมซึ่งตัวบ่งชี้ได้รับในช่วงระยะเวลาหนึ่ง (1. ประชากรของเซนต์ปีเตอร์สเบิร์ก 2. ปริมาณของ GDP สำหรับช่วงเวลานั้น) จำเป็นต้องแบ่งอนุกรมออกเป็นโมเมนต์และช่วงเวลา เนื่องจากจะเป็นตัวกำหนดลักษณะเฉพาะของการคำนวณตัวบ่งชี้บางตัวของซีรีย์ DR ผลรวมของระดับ ซีรีย์ช่วงเวลาให้ผลลัพธ์ที่ตีความได้อย่างมีความหมาย ซึ่งไม่สามารถพูดเกี่ยวกับการรวมระดับของอนุกรมโมเมนต์ได้ เนื่องจากอนุกรมหลังประกอบด้วยการนับซ้ำ ปัญหาที่สำคัญที่สุดในการวิเคราะห์อนุกรมเวลา มีปัญหาเรื่องความสามารถในการเปรียบเทียบระดับอนุกรม แนวคิดนี้มีความหลากหลายมาก ระดับจะต้องเปรียบเทียบได้ในแง่ของวิธีการคำนวณและในแง่ของอาณาเขตและความครอบคลุมของหน่วยประชากร หากซีรีส์ DR ถูกสร้างขึ้นในแง่ต้นทุน จะต้องแสดงหรือคำนวณทุกระดับในราคาที่เทียบเคียงได้ เมื่อสร้างอนุกรมช่วงเวลา ระดับต่างๆ จะต้องมีลักษณะเฉพาะของช่วงเวลาที่เหมือนกัน เมื่อสร้างอนุกรมโมเมนต์ ระดับจะต้องถูกบันทึกในวันเดียวกัน DR series อาจสมบูรณ์หรือไม่สมบูรณ์ก็ได้ มีการใช้แถวที่ไม่สมบูรณ์ในสิ่งพิมพ์อย่างเป็นทางการ (1980,1985,1990,1995,1996,1997,1998,1999...) การวิเคราะห์ที่ครอบคลุม RD รวมถึงการศึกษาประเด็นต่อไปนี้:

1. การคำนวณตัวบ่งชี้การเปลี่ยนแปลงในระดับ RD

2. การคำนวณตัวบ่งชี้ RD เฉลี่ย

3. ระบุแนวโน้มหลักของซีรีส์ การสร้างโมเดลเทรนด์

4. การประเมินความสัมพันธ์อัตโนมัติใน RD การสร้างแบบจำลองการถดถอยอัตโนมัติ

5. ความสัมพันธ์ของ RD (ศึกษาการเชื่อมต่อระหว่างซีรีย์ DR ของ m/y)

6. การพยากรณ์ทางขับ

35. ตัวบ่งชี้การเปลี่ยนแปลงในระดับอนุกรมเวลา .

ใน มุมมองทั่วไป RowD สามารถแสดงได้:

y – ระดับ DR, t – โมเมนต์หรือช่วงเวลาที่มีระดับ (ตัวบ่งชี้) อยู่, n – ความยาวของ DR Series (จำนวนช่วงเวลา) เมื่อศึกษาชุดของพลวัตจะมีการคำนวณตัวบ่งชี้ต่อไปนี้: 1. การเติบโตแบบสัมบูรณ์ 2. ค่าสัมประสิทธิ์การเติบโต (อัตราการเติบโต) 3. การเร่งความเร็ว 4. ค่าสัมประสิทธิ์การเติบโต (อัตราการเติบโต) 5. ค่าสัมบูรณ์เพิ่มขึ้น 1% ตัวบ่งชี้ที่คำนวณได้อาจเป็น: 1. ลูกโซ่ - ได้รับจากการเปรียบเทียบแต่ละระดับของชุดข้อมูลกับชุดก่อนหน้าทันที 2. พื้นฐาน - ได้รับจากการเปรียบเทียบกับระดับที่เลือกเป็นพื้นฐานสำหรับการเปรียบเทียบ (เว้นแต่จะระบุไว้โดยเฉพาะระดับที่ 1 ของ ซีรีส์นี้ถือเป็นฐาน) 1. การเพิ่มขึ้นแบบสัมบูรณ์ของเชน:- แสดงให้เห็นว่ามากหรือน้อยเพียงใด การเพิ่มขึ้นแบบสัมบูรณ์ของลูกโซ่เรียกว่าตัวบ่งชี้อัตราการเปลี่ยนแปลงในระดับ อนุกรมเวลา. การเติบโตแบบสัมบูรณ์พื้นฐาน- ถ้าเป็นซีรีย์ระดับนั้น ตัวชี้วัดที่เกี่ยวข้องแสดงเป็น % จากนั้นการเพิ่มขึ้นสัมบูรณ์จะแสดงเป็นจุดเปลี่ยน 2. อัตราการเติบโต (อัตราการเติบโต):คำนวณเป็นอัตราส่วนของระดับของซีรีส์ต่อระดับก่อนหน้า (สัมประสิทธิ์การเติบโตของห่วงโซ่) หรือระดับที่ใช้เป็นพื้นฐานของการเปรียบเทียบ (สัมประสิทธิ์การเติบโตพื้นฐาน): กำหนดลักษณะจำนวนครั้งในแต่ละระดับของซีรีส์ > หรือ< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. ขึ้นอยู่กับการเพิ่มขึ้นสัมบูรณ์ ตัวบ่งชี้จะถูกคำนวณ - การเร่งความเร็วของการเติบโตแบบสัมบูรณ์- ความเร่งคือการเพิ่มขึ้นแบบสัมบูรณ์ของการเพิ่มขึ้นแบบสัมบูรณ์ ประเมินว่ากำไรเปลี่ยนแปลงไปอย่างไร ไม่ว่าจะมีเสถียรภาพหรือเร่ง (เพิ่มขึ้น) 4.อัตราการเติบโตคืออัตราส่วนการเติบโตต่อฐานการเปรียบเทียบ แสดงเป็น %: ; - อัตราการเติบโตคืออัตราการเติบโตลบ 100% แสดงกี่ % ระดับนี้แถว > หรือ< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. การคำนวณตัวบ่งชี้ RD เฉลี่ย ระดับแถวเฉลี่ย การเพิ่มขึ้นแบบสัมบูรณ์โดยเฉลี่ย อัตราการเติบโตเฉลี่ย และอัตราการเติบโตเฉลี่ยจะถูกคำนวณ ตัวบ่งชี้เฉลี่ยได้รับการคำนวณเพื่อสรุปข้อมูลและทำให้สามารถเปรียบเทียบระดับและตัวบ่งชี้การเปลี่ยนแปลงในชุดต่างๆ 1. ระดับกลางแถวก) สำหรับอนุกรมช่วงเวลาคำนวณโดยใช้ค่าเฉลี่ยเลขคณิตอย่างง่าย โดยที่ n คือจำนวนระดับในอนุกรมเวลา b) สำหรับอนุกรมช่วงเวลา ระดับเฉลี่ยจะคำนวณโดยใช้สูตรเฉพาะซึ่งเรียกว่าค่าเฉลี่ยตามลำดับเวลา: - 2. การเพิ่มขึ้นสัมบูรณ์โดยเฉลี่ยคำนวณบนพื้นฐานของการเพิ่มขึ้นแบบสัมบูรณ์ของลูกโซ่โดยอิงจากค่าเฉลี่ยเลขคณิตอย่างง่าย:

. 3. ค่าสัมประสิทธิ์เฉลี่ยการเจริญเติบโตคำนวณตามค่าสัมประสิทธิ์การเติบโตของลูกโซ่โดยใช้สูตรค่าเฉลี่ยทางเรขาคณิต: เมื่อแสดงความคิดเห็นเกี่ยวกับตัวบ่งชี้เฉลี่ยของซีรีย์ DR จำเป็นต้องระบุ 2 จุด: ช่วงเวลาที่แสดงลักษณะของตัวบ่งชี้ที่วิเคราะห์และช่วงเวลาที่สร้างซีรีย์ DR 4. อัตราการเติบโตเฉลี่ย: . 5.อัตราการเติบโตเฉลี่ย: .

เพื่อประเมินความสำคัญและความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ จะใช้แบบทดสอบของนักเรียน

พบข้อผิดพลาดเฉลี่ยของค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร:

เอ็น
และขึ้นอยู่กับข้อผิดพลาด เกณฑ์ t จะถูกคำนวณ:

ค่าทีทดสอบที่คำนวณได้จะถูกนำไปเปรียบเทียบกับค่าแบบตารางที่พบในตารางการแจกแจงของนักเรียนที่ระดับนัยสำคัญ 0.05 หรือ 0.01 และจำนวนองศาอิสระ n-1 หากค่าที่คำนวณได้ของการทดสอบทีมากกว่าค่าตาราง จะถือว่าค่าสัมประสิทธิ์สหสัมพันธ์มีนัยสำคัญ

ในกรณีของความสัมพันธ์แบบเส้นโค้ง การทดสอบ F ใช้เพื่อประเมินความสำคัญของความสัมพันธ์สหสัมพันธ์และสมการการถดถอย คำนวณโดยสูตร:

หรือ

โดยที่ η คืออัตราส่วนสหสัมพันธ์ n – จำนวนการสังเกต ม. – จำนวนพารามิเตอร์ในสมการการถดถอย

ค่า F ที่คำนวณได้จะถูกเปรียบเทียบกับค่าในตารางสำหรับระดับนัยสำคัญที่ยอมรับ α (0.05 หรือ 0.01) และจำนวนองศาอิสระ k 1 =m-1 และ k 2 =n-m หากค่า F ที่คำนวณได้เกินตารางหนึ่ง จะถือว่าความสัมพันธ์มีนัยสำคัญ

ความสำคัญของค่าสัมประสิทธิ์การถดถอยถูกกำหนดโดยใช้การทดสอบนักเรียน ซึ่งคำนวณโดยใช้สูตร:

โดยที่ σ 2 และ i คือความแปรปรวนของสัมประสิทธิ์การถดถอย

คำนวณโดยสูตร:

โดยที่ k คือจำนวนคุณลักษณะของตัวประกอบในสมการการถดถอย

ค่าสัมประสิทธิ์การถดถอยถือว่ามีนัยสำคัญหาก t a 1 ≥t cr

t cr พบได้ในตารางจุดวิกฤติของการแจกแจงของนักเรียนในระดับนัยสำคัญที่ยอมรับและจำนวนองศาอิสระ k=n-1

4.3 การวิเคราะห์สหสัมพันธ์และการถดถอยใน Excel เรามาทำการวิเคราะห์ความสัมพันธ์และการถดถอยของความสัมพันธ์ระหว่างผลผลิตและต้นทุนแรงงานต่อเมล็ดข้าว 1 ควินตัน เมื่อต้องการทำสิ่งนี้ ให้เปิดแผ่นงาน Excel แล้วป้อนค่าของลักษณะปัจจัยในเซลล์ A1:A30

ผลผลิตของพืชเมล็ดพืชในเซลล์ B1:B30 มูลค่าของลักษณะผลลัพธ์คือต้นทุนแรงงานต่อเมล็ดข้าว 1 ควินตัน ในเมนูเครื่องมือ เลือกตัวเลือกการวิเคราะห์ข้อมูล เมื่อคลิกซ้ายที่รายการนี้ เราจะเปิดเครื่องมือการถดถอย คลิกปุ่มตกลงและกล่องโต้ตอบการถดถอยจะปรากฏขึ้นบนหน้าจอ ในฟิลด์ ช่วงอินพุต Y ให้ป้อนค่าของคุณลักษณะผลลัพธ์ (เน้นเซลล์ B1:B30) ในฟิลด์ ช่วงอินพุต X ให้ป้อนค่าของลักษณะเฉพาะของปัจจัย (เน้นเซลล์ A1:A30) ทำเครื่องหมายระดับความน่าจะเป็น 95% และเลือกแผ่นงานใหม่ คลิกที่ปุ่มตกลง ตาราง "สรุปผลลัพธ์" จะปรากฏบนแผ่นงานซึ่งแสดงผลการคำนวณพารามิเตอร์ของสมการถดถอย ค่าสัมประสิทธิ์สหสัมพันธ์ และตัวบ่งชี้อื่น ๆ ที่ช่วยให้คุณสามารถกำหนดความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์และพารามิเตอร์ของสมการการถดถอย

บทสรุปของผลลัพธ์

สถิติการถดถอย

พหูพจน์ ร

R-สแควร์

R-กำลังสองที่ทำให้เป็นมาตรฐาน

ข้อผิดพลาดมาตรฐาน

ข้อสังเกต

การวิเคราะห์ความแปรปรวน

ความสำคัญ F

การถดถอย

ราคาต่อรอง

ข้อผิดพลาดมาตรฐาน

t-สถิติ

ค่า P

ด้านล่าง 95%

สูงสุด 95%

ล่าง 95.0%

สูงสุด 95.0%

แยก Y

ตัวแปร X 1 ในตารางนี้ “Multiple R” คือค่าสัมประสิทธิ์สหสัมพันธ์ “R-squared” คือค่าสัมประสิทธิ์การกำหนด “สัมประสิทธิ์: จุดตัด Y” - เทอมอิสระของสมการถดถอย 2.836242; “ตัวแปร X1” – ค่าสัมประสิทธิ์การถดถอย -0.06654 นอกจากนี้ยังมีค่าของ Fisher's F-test 74.9876, Student's t-test 14.18042, "ข้อผิดพลาดมาตรฐาน

จากข้อมูลในตาราง เราจะสร้างสมการถดถอย: y x ​​​​= 2.836-0.067x ค่าสัมประสิทธิ์การถดถอย a 1 = -0.067 หมายความว่าเมื่อผลผลิตเมล็ดพืชเพิ่มขึ้น 1 c/เฮกตาร์ ต้นทุนค่าแรงต่อเมล็ดพืช 1 c ลดลง 0.067 ชั่วโมงการทำงาน

โดยมีค่าสัมประสิทธิ์สหสัมพันธ์คือ r=0.85>0.7 ดังนั้น ลักษณะความสัมพันธ์ระหว่างลักษณะที่ศึกษาในกลุ่มประชากรกลุ่มนี้จึงใกล้เคียงกัน ค่าสัมประสิทธิ์การกำหนด r 2 = 0.73 แสดงให้เห็นว่า 73% ของการเปลี่ยนแปลงในลักษณะที่มีประสิทธิผล (ต้นทุนแรงงานต่อ 1 ควินตาลของเมล็ดพืช) มีสาเหตุมาจากการกระทำของลักษณะปัจจัย (ผลผลิตของเมล็ดข้าว)

ในตาราง จุดวิกฤติการกระจายของฟิชเชอร์ - Snedekor เราพบค่าวิกฤตของการทดสอบ F ที่ระดับนัยสำคัญ 0.05 และจำนวนดีกรีอิสระถึง 1 =m-1=2-1=1 และ k 2 =n-m=30-2= 28 เท่ากับ 4.21 เนื่องจากค่าที่คำนวณได้ของเกณฑ์มากกว่าเกณฑ์ในตาราง (F=74.9896>4.21) สมการการถดถอยจึงถือว่ามีนัยสำคัญ

เพื่อประเมินความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ ให้คำนวณการทดสอบของนักเรียน:

ใน
ในตารางจุดวิกฤตของการแจกแจงของนักเรียน เราพบค่าวิกฤตของการทดสอบทีที่ระดับนัยสำคัญ 0.05 และจำนวนระดับความอิสระ n-1=30-1=29 ซึ่งเท่ากับ 2.0452 เนื่องจากค่าที่คำนวณได้มากกว่าค่าตาราง ค่าสัมประสิทธิ์สหสัมพันธ์จึงมีนัยสำคัญ

เพื่อทดสอบนัยสำคัญ จะมีการวิเคราะห์อัตราส่วนของสัมประสิทธิ์การถดถอยและส่วนเบี่ยงเบนมาตรฐาน อัตราส่วนนี้คือการกระจายตัวของนักเรียน นั่นคือเพื่อกำหนดนัยสำคัญที่เราใช้แบบทดสอบที:

- อาร์เอ็มเอสจากการกระจายตัวของสารตกค้าง

- ผลรวมของการเบี่ยงเบนจากค่าเฉลี่ย

ถ้าอย่างนั้น. >t แท็บ แล้วสัมประสิทธิ์ b i มีนัยสำคัญ

ช่วงความเชื่อมั่นถูกกำหนดโดยสูตร:

ขั้นตอนการปฏิบัติงาน

    นำข้อมูลเบื้องต้นตามตัวเลือกงาน (ตามหมายเลขนักศึกษาในวารสาร) มีการระบุวัตถุควบคุมแบบคงที่ที่มีอินพุตสองตัว เอ็กซ์ 1 , เอ็กซ์ 2 และทางออกหนึ่งทาง - มีการทดลองแบบพาสซีฟที่โรงงานและได้รับตัวอย่าง 30 คะแนนที่มีค่าต่างๆ เอ็กซ์ 1 , เอ็กซ์ 2 และ สำหรับการทดลองแต่ละครั้ง

    เปิดไฟล์ใหม่ใน Excel 2007 Enter ข้อมูลความเป็นมาลงในคอลัมน์ของตารางต้นฉบับ - ค่าของตัวแปรอินพุต เอ็กซ์ 1 , เอ็กซ์ 2 และตัวแปรเอาท์พุต .

    เตรียมคอลัมน์เพิ่มเติมสองคอลัมน์สำหรับการป้อนค่าจากการคำนวณ และของเหลือ

    เรียกโปรแกรม “การถดถอย”: ข้อมูล / การวิเคราะห์ข้อมูล / การถดถอย

ข้าว. 1. กล่องโต้ตอบการวิเคราะห์ข้อมูล

    ป้อนที่อยู่ของแหล่งข้อมูลลงในกล่องโต้ตอบ "การถดถอย":

    ช่วงเวลาอินพุต Y, ช่วงเวลาอินพุต X (2 คอลัมน์)

    ตั้งค่าระดับความน่าเชื่อถือเป็น 95%

    ในตัวเลือก "ช่วงเวลาเอาต์พุต" ระบุเซลล์ด้านซ้ายบนของตำแหน่งที่มีเอาต์พุตข้อมูลการวิเคราะห์การถดถอย (เซลล์แรกบนหน้าที่ 2 ของแผ่นงาน)

    เปิดใช้งานตัวเลือก "ส่วนที่เหลือ" และ "กราฟที่เหลือ"

    กดปุ่ม OK เพื่อเริ่มต้น การวิเคราะห์การถดถอย.

ข้าว. 2. กล่องโต้ตอบการถดถอย

    Excel จะแสดงตาราง 4 ตารางและกราฟ 2 กราฟของการพึ่งพาค่าคงเหลือของตัวแปร X1และ X2.

    จัดรูปแบบตาราง "ผลลัพธ์ของผลรวม" - ขยายคอลัมน์ด้วยชื่อของข้อมูลเอาต์พุตสร้างตัวเลขสำคัญ 3 หลักหลังจุดทศนิยมในคอลัมน์ที่สอง

    จัดรูปแบบตาราง "การวิเคราะห์ความแปรปรวน" - ทำให้จำนวนตัวเลขนัยสำคัญหลังจุดทศนิยมง่ายต่อการอ่านและทำความเข้าใจ ย่อชื่อตัวแปรให้สั้นลง และปรับความกว้างของคอลัมน์

    จัดรูปแบบตารางสัมประสิทธิ์สมการ - ย่อชื่อตัวแปรให้สั้นลงและปรับความกว้างของคอลัมน์หากจำเป็น ทำให้จำนวนหลักที่มีนัยสำคัญอ่านและเข้าใจได้ง่ายขึ้น ลบ 2 คอลัมน์สุดท้าย (ค่าและเค้าโครงตาราง)

    ถ่ายโอนข้อมูลจากตาราง "เอาต์พุตที่เหลือ" ไปยังคอลัมน์ที่เตรียมไว้ของตารางต้นฉบับ จากนั้นลบตาราง "เอาต์พุตที่เหลือ" (ตัวเลือก "แทรกพิเศษ")

    ป้อนการประมาณค่าสัมประสิทธิ์ที่ได้รับลงในตารางต้นฉบับ

    ดึงตารางผลลัพธ์ไปที่ด้านบนของหน้า

    สร้างแผนภูมิใต้ตาราง ประสบการณ์, การคำนวณและการคาดการณ์ข้อผิดพลาด (ตกค้าง)

    จัดรูปแบบแผนภูมิที่เหลือ ใช้กราฟผลลัพธ์ประเมินความถูกต้องของแบบจำลองตามอินพุต X1, X2.

    พิมพ์ผลลัพธ์ของการวิเคราะห์การถดถอย

    ทำความเข้าใจผลลัพธ์ของการวิเคราะห์การถดถอย

    จัดทำรายงานการทำงาน.

ตัวอย่างประสิทธิภาพการทำงาน

วิธีการวิเคราะห์การถดถอยใน EXCEL แสดงไว้ในรูปที่ 3-5

ข้าว. 3. ตัวอย่างการวิเคราะห์การถดถอยในแพ็คเกจ EXCEL


รูปที่ 4. แปลงคงเหลือแบบแปรผัน X1, X2

ข้าว. 5. แผนภูมิ ประสบการณ์,การคำนวณและการคาดการณ์ข้อผิดพลาด (ตกค้าง)

จากการวิเคราะห์การถดถอย เราสามารถพูดได้ว่า:

1. สมการการถดถอยที่ได้รับโดยใช้ Excel มีรูปแบบ:

    ค่าสัมประสิทธิ์การกำหนด:

ความแปรผันของผลลัพธ์ 46.5% อธิบายได้จากการแปรผันของปัจจัย

    การทดสอบ F ทั่วไปจะทดสอบสมมติฐานเกี่ยวกับนัยสำคัญทางสถิติของสมการการถดถอย การวิเคราะห์จะดำเนินการโดยการเปรียบเทียบค่าจริงและค่าตารางของการทดสอบ Fisher F

เนื่องจากมูลค่าจริงเกินตาราง
จากนั้นเราจะสรุปได้ว่าผลลัพธ์สมการถดถอยมีนัยสำคัญทางสถิติ

    ค่าสัมประสิทธิ์ ความสัมพันธ์หลายประการ:

    0 :

แท็บ (29, 0.975)=2.05

0 :

ช่วงความเชื่อมั่น:

    กำหนดช่วงความเชื่อมั่นของค่าสัมประสิทธิ์ 1 :

การตรวจสอบความสำคัญของสัมประสิทธิ์ 1 :

ไม่ >t แท็บ , สัมประสิทธิ์ b 1 มีนัยสำคัญ

ช่วงความเชื่อมั่น:

    กำหนดช่วงความเชื่อมั่นของค่าสัมประสิทธิ์ 2 :

การทดสอบนัยสำคัญสำหรับสัมประสิทธิ์ 2 :

กำหนดช่วงความเชื่อมั่น:

ตัวเลือกงาน

ตารางที่ 2. อ็อพชันภารกิจ

ตัวเลือกหมายเลข

สัญญาณที่มีประสิทธิภาพ ฉัน

1

1

1

1

1

1

1

1

1

1

2

2

2

2

2

ปัจจัยหมายเลข เอ็กซ์ ฉัน

ปัจจัยหมายเลข เอ็กซ์ ฉัน

ความต่อเนื่องของตารางที่ 1

ตัวเลือกหมายเลข

สัญญาณที่มีประสิทธิภาพ ฉัน

2

2

2

2

2

3

3

3

3

3

3

3

3

3

3

ปัจจัยหมายเลข เอ็กซ์ ฉัน

ปัจจัยหมายเลข เอ็กซ์ ฉัน

ตารางที่ 3. ข้อมูลเริ่มต้น

1

2

3

เอ็กซ์ 1

เอ็กซ์ 2

เอ็กซ์ 3

เอ็กซ์ 4

เอ็กซ์ 5

คำถามสำหรับการควบคุมตนเอง

    ปัญหาการวิเคราะห์การถดถอย

    ข้อกำหนดเบื้องต้นสำหรับการวิเคราะห์การถดถอย

    สมการพื้นฐาน การวิเคราะห์ความแปรปรวน.

    อัตราส่วน F ของฟิชเชอร์แสดงอะไร

    มันถูกกำหนดอย่างไร ค่าตารางการทดสอบของฟิชเชอร์?

    ค่าสัมประสิทธิ์การตัดสินใจแสดงอะไร?

    จะกำหนดความสำคัญของสัมประสิทธิ์การถดถอยได้อย่างไร?

    จะกำหนดช่วงความเชื่อมั่นของสัมประสิทธิ์การถดถอยได้อย่างไร?

    จะกำหนดค่าการทดสอบทีที่คำนวณได้อย่างไร?

    จะกำหนดค่าตารางของ t-test ได้อย่างไร?

    กำหนดแนวคิดหลักของการวิเคราะห์ความแปรปรวนเพื่อแก้ไขปัญหาใดที่มีประสิทธิภาพมากที่สุด?

    หลักทฤษฎีพื้นฐานของการวิเคราะห์ความแปรปรวนคืออะไร?

    ดำเนินการสลายตัว จำนวนเงินทั้งหมดการเบี่ยงเบนกำลังสองเป็นองค์ประกอบในการวิเคราะห์ความแปรปรวน

    จะรับค่าประมาณความแปรปรวนจากผลรวมของส่วนเบี่ยงเบนกำลังสองได้อย่างไร

    จะได้จำนวนองศาอิสระที่ต้องการได้อย่างไร?

    ข้อผิดพลาดมาตรฐานถูกกำหนดอย่างไร?

    อธิบายการออกแบบการวิเคราะห์ความแปรปรวนแบบสองปัจจัย

    การจำแนกประเภทข้ามแตกต่างจากการจำแนกแบบลำดับชั้นอย่างไร

    ความแตกต่างระหว่างข้อมูลที่สมดุลคืออะไร?

รายงานนี้จัดทำขึ้นในโปรแกรมแก้ไขข้อความ Word บนกระดาษ A4 GOST 6656-76 (210x297 มม.) และประกอบด้วย:

    ชื่อของงานห้องปฏิบัติการ

    วัตถุประสงค์ของการทำงาน

  1. ผลการคำนวณ

เวลาที่อนุญาตให้ดำเนินการให้เสร็จสิ้น

งานห้องปฏิบัติการ

การเตรียมตัวเข้าทำงาน – 0.5 วิชาการ ชั่วโมง.

เสร็จสิ้นงาน – 0.5 วิชาการ ชั่วโมง.

การคำนวณทางคอมพิวเตอร์ – 0.5 วิชาการ ชั่วโมง.

การออกแบบงาน – 0.5 วิชาการ ชั่วโมง.

วรรณกรรม

    การระบุวัตถุควบคุม / A.D. Semenov, D.V. Artamonov, A.V. Bryukhachev คู่มือการศึกษา - เพนซ่า: ม.อ., 2546. - 211 น.

    พื้นฐาน การวิเคราะห์ทางสถิติ- การประชุมเชิงปฏิบัติการเกี่ยวกับ วิธีการทางสถิติและการวิจัยการดำเนินงานโดยใช้แพ็คเกจ STATISTIC และ EXCEL / วูโคลอฟ อี.เอ.บทช่วยสอน

    - - ม.: ฟอรั่ม, 2551. - 464 หน้า

    พื้นฐานของทฤษฎีการระบุวัตถุควบคุม / เอเอ อิกเนติเยฟ เอส.เอ. อิกเนติเยฟ. คู่มือการศึกษา - ซาราตอฟ: SSTU, 2551 - 44 น. ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์

    ในตัวอย่างและงานที่ใช้ EXCEL / จี.วี. โกเรโลวา, ไอ.เอ. คัตสโก. - Rostov ไม่มี: Phoenix, 2006.- 475 หน้า

    เป้าหมาย 2

    แนวคิดพื้นฐาน 2

    สั่งงาน 6

    คำถามเพื่อการควบคุมตนเอง 13

    เวลาที่จัดสรรให้ทำงานให้เสร็จ 14

    คุณสามารถตรวจสอบความสำคัญของพารามิเตอร์สมการถดถอยได้โดยใช้สถิติแบบ t

    ออกกำลังกาย:
    สำหรับกลุ่มองค์กรที่ผลิตผลิตภัณฑ์ประเภทเดียวกัน ฟังก์ชันต้นทุนจะได้รับการพิจารณา:
    y = α + βx;
    y = α x β ;
    y = α β x ;
    y = α + β / x;
    โดยที่ y คือต้นทุนการผลิตพันหน่วย
    x คือผลผลิตการผลิต, พันหน่วย

    ที่จำเป็น:
    1. สร้างสมการการถดถอยแบบคู่ y จาก x:

    • เชิงเส้น;
    • พลัง;
    • สาธิต;
    • ไฮเปอร์โบลาด้านเท่ากันหมด
    2. คำนวณ ค่าสัมประสิทธิ์เชิงเส้นความสัมพันธ์คู่และสัมประสิทธิ์การตัดสินใจ วาดข้อสรุป
    3. ประเมินนัยสำคัญทางสถิติของสมการถดถอยโดยรวม
    4. ประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์
    5. ดำเนินการคาดการณ์ต้นทุนการผลิตโดยมีผลผลิตคาดการณ์ 195% ของระดับเฉลี่ย
    6. ประเมินความแม่นยำของการพยากรณ์ คำนวณข้อผิดพลาดของการคาดการณ์และช่วงความเชื่อมั่น
    7. ประเมินโมเดลผ่าน ข้อผิดพลาดโดยเฉลี่ยการประมาณ

    สารละลาย:

    1. สมการคือ y = α + βx
    1. พารามิเตอร์สมการถดถอย
    ค่าเฉลี่ย

    การกระจายตัว

    ส่วนเบี่ยงเบนมาตรฐาน

    ค่าสัมประสิทธิ์สหสัมพันธ์

    ความสัมพันธ์ระหว่างลักษณะ Y และปัจจัย X นั้นแข็งแกร่งและตรงไปตรงมา
    สมการถดถอย

    ค่าสัมประสิทธิ์การตัดสินใจ
    R 2 = 0.94 2 = 0.89 เช่น ใน 88.9774% ของกรณี การเปลี่ยนแปลงใน x นำไปสู่การเปลี่ยนแปลงใน y กล่าวอีกนัยหนึ่ง ความแม่นยำในการเลือกสมการถดถอยมีสูง

    x x2 คุณ 2 x∙y ใช่(x) (ปปป) 2 (ป-ป(x)) 2 (x-x น) 2
    78 133 6084 17689 10374 142.16 115.98 83.83 1
    82 148 6724 21904 12136 148.61 17.9 0.37 9
    87 134 7569 17956 11658 156.68 95.44 514.26 64
    79 154 6241 23716 12166 143.77 104.67 104.67 0
    89 162 7921 26244 14418 159.9 332.36 4.39 100
    106 195 11236 38025 20670 187.33 2624.59 58.76 729
    67 139 4489 19321 9313 124.41 22.75 212.95 144
    88 158 7744 24964 13904 158.29 202.51 0.08 81
    73 152 5329 23104 11096 134.09 67.75 320.84 36
    87 162 7569 26244 14094 156.68 332.36 28.33 64
    76 159 5776 25281 12084 138.93 231.98 402.86 9
    115 173 13225 29929 19895 201.86 854.44 832.66 1296
    0 0 0 16.3 20669.59 265.73 6241
    1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

    หมายเหตุ: ค่าของ y(x) พบได้จากสมการถดถอยผลลัพธ์:
    y(1) = 4.01*1 + 99.18 = 103.19
    y(2) = 4.01*2 + 99.18 = 107.2
    ... ... ...

    2. การประมาณค่าพารามิเตอร์สมการถดถอย
    ความสำคัญของสัมประสิทธิ์สหสัมพันธ์

    ใช้ตารางของนักเรียนเราจะพบ Ttable
    ตาราง T (n-m-1;α/2) = (11;0.05/2) = 1.796
    เนื่องจาก Tob > Ttabl เราปฏิเสธสมมติฐานที่ว่าค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0 กล่าวอีกนัยหนึ่ง ค่าสัมประสิทธิ์สหสัมพันธ์มีนัยสำคัญทางสถิติ

    การวิเคราะห์ความแม่นยำในการประมาณค่าสัมประสิทธิ์การถดถอย





    ส=0.1712
    ช่วงความเชื่อมั่นสำหรับตัวแปรตาม

    ให้เราคำนวณขอบเขตของช่วงเวลาที่ 95% ของค่าที่เป็นไปได้ของ Y จะเข้มข้นไม่ จำกัด จำนวนมากการสังเกตและ X = 1
    (-20.41;56.24)
    การทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิ์ สมการเชิงเส้นการถดถอย
    1) สถิติ t


    นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย a ได้รับการยืนยันแล้ว

    นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย b ไม่ได้รับการยืนยัน
    ช่วงความมั่นใจสำหรับสัมประสิทธิ์สมการถดถอย
    เรามากำหนดกัน ช่วงความมั่นใจค่าสัมประสิทธิ์การถดถอยซึ่งมีความน่าเชื่อถือ 95% จะเป็นดังนี้:
    (ก - เสื้อ ส ก ; ก + เสื้อ ส ก)
    (1.306;1.921)
    (ข - t ข S ข ; ข + t ข S ข)
    (-9.2733;41.876)
    โดยที่ t = 1.796
    2) สถิติ F


    เอฟเคพี = 4.84
    เนื่องจาก F > Fkp สัมประสิทธิ์การตัดสินใจจึงมีนัยสำคัญทางสถิติ