ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

โดยใช้วิธีกำลังสองน้อยที่สุดในการประมาณ การประมาณข้อมูลเบื้องต้นโดยการพึ่งพาเชิงเส้น

หลักสูตรการทำงาน

สาขาวิชา: สารสนเทศ

หัวข้อ: การประมาณค่าของฟังก์ชันโดยวิธี สี่เหลี่ยมน้อยที่สุด

บทนำ

1. คำชี้แจงปัญหา

2.สูตรคำนวณ

การคำนวณโดยใช้ตารางที่ทำโดยวิธี Microsoft Excel

แบบแผนอัลกอริทึม

การคำนวณใน MathCad

ผลลัพธ์เชิงเส้น

การนำเสนอผลลัพธ์ในรูปแบบกราฟ


บทนำ

วัตถุประสงค์ของหลักสูตรคือเพื่อเพิ่มพูนความรู้ด้านวิทยาการคอมพิวเตอร์ พัฒนาและรวมทักษะในการทำงานกับสเปรดชีต Microsoft Excel และ ผลิตภัณฑ์ซอฟต์แวร์ MathCAD และแอปพลิเคชันสำหรับแก้ปัญหาโดยใช้คอมพิวเตอร์จาก สาขาวิชาที่เกี่ยวข้องกับการวิจัย

การประมาณ (จากภาษาละติน "ประมาณ" - "แนวทาง") - นิพจน์โดยประมาณของใด ๆ วัตถุทางคณิตศาสตร์(เช่น ตัวเลขหรือฟังก์ชัน) ผ่านตัวอื่นๆ ที่ง่ายกว่า ใช้ง่ายกว่า หรือรู้จักกันดีกว่า ที่ การวิจัยทางวิทยาศาสตร์การประมาณใช้เพื่ออธิบาย วิเคราะห์ สรุป และใช้ผลลัพธ์เชิงประจักษ์ต่อไป

ดังที่ทราบกันดีอยู่แล้วว่าอาจมีความสัมพันธ์ (เชิงฟังก์ชัน) ที่แน่นอนระหว่างค่าต่างๆ เมื่อค่าหนึ่งของอาร์กิวเมนต์สอดคล้องกับค่าเฉพาะหนึ่งค่า และความสัมพันธ์ (สหสัมพันธ์) ที่แม่นยำน้อยกว่า เมื่อค่าเฉพาะของอาร์กิวเมนต์สอดคล้องกับค่าโดยประมาณ หรือชุดค่าฟังก์ชันบางชุดที่ใกล้เคียงกันมากหรือน้อย เมื่อทำการวิจัยทางวิทยาศาสตร์ ประมวลผลผลการสังเกตหรือการทดลอง คุณมักจะต้องจัดการกับตัวเลือกที่สอง

เมื่อศึกษาการพึ่งพาเชิงปริมาณของตัวบ่งชี้ต่าง ๆ ค่าที่กำหนดโดยเชิงประจักษ์ตามกฎแล้วมีความแปรปรวนบางอย่าง ส่วนหนึ่งถูกกำหนดโดยความแตกต่างของวัตถุที่ศึกษาซึ่งไม่มีชีวิตและโดยเฉพาะอย่างยิ่ง ธรรมชาติของสิ่งมีชีวิต และส่วนหนึ่งเกิดจากข้อผิดพลาดของการสังเกตและการประมวลผลเชิงปริมาณของวัสดุ ไม่สามารถกำจัดองค์ประกอบสุดท้ายได้อย่างสมบูรณ์เสมอไป สามารถทำได้โดยการเลือกวิธีการวิจัยที่เพียงพอและความแม่นยำในการทำงานอย่างรอบคอบเท่านั้น ดังนั้น เมื่อทำการวิจัยใดๆ ปัญหาจึงเกิดจากการระบุลักษณะที่แท้จริงของการพึ่งพาตัวบ่งชี้ที่ศึกษา ซึ่งระดับนี้หรือระดับนั้นถูกปกปิดโดยการละเลยความแปรปรวน: ค่านิยม สำหรับสิ่งนี้ ใช้การประมาณ - คำอธิบายโดยประมาณของการพึ่งพาสหสัมพันธ์ของตัวแปรโดยสมการการพึ่งพาฟังก์ชันที่เหมาะสมซึ่งสื่อถึงแนวโน้มหลักของการพึ่งพาอาศัยกัน (หรือ "แนวโน้ม")

เมื่อเลือกการประมาณ ควรดำเนินการจากงานเฉพาะของการศึกษา โดยปกติ ยิ่งสมการที่ใช้สำหรับการประมาณค่าที่ง่ายกว่ามากเท่าใด คำอธิบายที่ได้รับของการพึ่งพาอาศัยกันก็จะยิ่งใกล้เคียงมากขึ้นเท่านั้น ดังนั้นจึงเป็นเรื่องสำคัญที่จะต้องอ่านว่ามีความสำคัญอย่างไรและอะไรทำให้เกิดการเบี่ยงเบนของค่าเฉพาะจากแนวโน้มที่เกิดขึ้น เมื่ออธิบายการพึ่งพาอาศัยเชิงประจักษ์ ค่าบางอย่างสามารถทำได้อย่างแม่นยำมากขึ้นโดยใช้บางอย่างที่ซับซ้อนมากขึ้น สมการพาราเมตริก. อย่างไรก็ตาม มันไม่มีประโยชน์ที่จะพยายามถ่ายทอดค่าเบี่ยงเบนแบบสุ่มของค่าในชุดข้อมูลเชิงประจักษ์เฉพาะด้วยความแม่นยำสูงสุด การเข้าใจรูปแบบทั่วไปนั้นสำคัญกว่ามาก ซึ่งใน กรณีนี้มีเหตุผลมากที่สุดและด้วยความแม่นยำที่ยอมรับได้นั้นแสดงได้อย่างแม่นยำโดยสมการสองพารามิเตอร์ ฟังก์ชั่นพลังงาน. ดังนั้นเมื่อเลือกวิธีการประมาณค่า นักวิจัยมักจะประนีประนอม: เขาตัดสินใจว่าในกรณีนี้มันเหมาะสมและเหมาะสมที่จะ "เสียสละ" รายละเอียดและดังนั้นการพึ่งพาอาศัยกันของตัวแปรที่เปรียบเทียบควรแสดงออกอย่างไร พร้อมระบุลายพราง การเบี่ยงเบนแบบสุ่มหลักฐานเชิงประจักษ์จาก แบบทั่วไป, การประมาณยังช่วยให้แก้ได้หลายอย่าง งานสำคัญ: จัดระเบียบการพึ่งพาที่พบ; หา ค่าที่ไม่รู้จักตัวแปรตามด้วยการประมาณค่า หรือ การประมาณค่า (ถ้ามี)

ในแต่ละงาน จะมีการกำหนดเงื่อนไขของปัญหา ข้อมูลเบื้องต้น แบบฟอร์มการออกผลลัพธ์ การพึ่งพาทางคณิตศาสตร์หลักสำหรับการแก้ปัญหาจะถูกระบุ ตามวิธีการแก้ปัญหาจะมีการพัฒนาอัลกอริธึมการแก้ปัญหาซึ่งนำเสนอในรูปแบบกราฟิก

1. คำชี้แจงปัญหา

1. ใช้วิธีการกำลังสองน้อยที่สุด ประมาณฟังก์ชันที่ระบุในตาราง:

ก) พหุนามของดีกรีแรก;

b) พหุนามของดีกรีที่สอง;

c) การพึ่งพาแบบเลขชี้กำลัง

สำหรับการพึ่งพาแต่ละครั้ง ให้คำนวณค่าสัมประสิทธิ์ของการกำหนดระดับ

คำนวณสัมประสิทธิ์สหสัมพันธ์ (เฉพาะในกรณี a)

วาดเส้นแนวโน้มสำหรับการพึ่งพาแต่ละครั้ง

การใช้ฟังก์ชัน LINEST คำนวณ ลักษณะเชิงตัวเลขขึ้นอยู่กับ.

เปรียบเทียบการคำนวณของคุณกับผลลัพธ์ที่ได้จากฟังก์ชัน LINEST

ตัดสินใจว่าสูตรไหน วิธีที่ดีที่สุดใกล้เคียงกับฟังก์ชัน

เขียนโปรแกรมในภาษาโปรแกรมใดภาษาหนึ่งและเปรียบเทียบผลการคำนวณกับที่ได้รับข้างต้น

ตัวเลือกที่ 3 ฟังก์ชันได้รับในตาราง หนึ่ง.

ตารางที่ 1.

xyxyxyxyxyxy0.281.052.349.113.3329.434.2386.445.55187.540.872.872.6516.863.4137.454.8390.856.32200.451.656.432.7717.973.5542.444.9299.066.66212.971.998.962.8318.993.8556.945.14120.457.13275.742.088.08.50 25321.43

2. สูตรการคำนวณ

บ่อยครั้งเมื่อวิเคราะห์ข้อมูลเชิงประจักษ์ จำเป็นต้องค้นหาความสัมพันธ์เชิงฟังก์ชันระหว่างค่าของ x และ y ซึ่งได้มาจากประสบการณ์หรือการวัด

ซี ( ตัวแปรอิสระ) ถูกกำหนดโดยผู้ทดลอง และ yi เรียกว่าค่าเชิงประจักษ์หรือค่าทดลอง ได้มาจากผลของการทดลอง

รูปแบบการวิเคราะห์ของการพึ่งพาฟังก์ชันที่มีอยู่ระหว่างค่า x และ y มักไม่เป็นที่รู้จัก ดังนั้นจึงเป็นงานที่สำคัญในทางปฏิบัติ - เพื่อค้นหาสูตรเชิงประจักษ์

(พารามิเตอร์อยู่ที่ไหน) ค่าที่อาจแตกต่างเล็กน้อยจากค่าทดลอง

ตามวิธีกำลังสองน้อยที่สุด สัมประสิทธิ์ที่ดีที่สุดคือค่าที่เป็นผลรวมของการเบี่ยงเบนกำลังสองของฟังก์ชันเชิงประจักษ์ที่พบจาก setpointsฟังก์ชั่นจะน้อยที่สุด

โดยใช้ เงื่อนไขที่จำเป็นสุดขั้วของฟังก์ชันของตัวแปรหลายตัว - เท่ากับศูนย์ของอนุพันธ์ย่อยบางส่วน ค้นหาชุดของสัมประสิทธิ์ที่ให้ค่าต่ำสุดของฟังก์ชันที่กำหนดโดยสูตร (2) และรับ ระบบปกติเพื่อกำหนดสัมประสิทธิ์:

ดังนั้นการหาค่าสัมประสิทธิ์จึงลดเหลือระบบการแก้ (3)

ประเภทของระบบ (3) ขึ้นอยู่กับคลาส สูตรเชิงประจักษ์เรากำลังมองหาการพึ่งพา (1) ในกรณีของการพึ่งพาเชิงเส้น ระบบ (3) จะอยู่ในรูปแบบ:

ในกรณีของการพึ่งพากำลังสอง ระบบ (3) จะอยู่ในรูปแบบ:

ในบางกรณี ในฐานะที่เป็นสูตรเชิงประจักษ์ ฟังก์ชันจะถูกนำมาใช้ซึ่งสัมประสิทธิ์ที่ไม่แน่นอนป้อนแบบไม่เชิงเส้น ในกรณีนี้ บางครั้งปัญหาก็สามารถทำให้เป็นเส้นตรงได้ กล่าวคือ ลดเป็นเส้นตรง ท่ามกลางการพึ่งพาดังกล่าวคือการพึ่งพาแบบทวีคูณ

โดยที่ a1 และ a2 เป็นสัมประสิทธิ์ที่ไม่ได้กำหนดไว้

การทำให้เป็นลิเนียร์ทำได้โดยนำลอการิทึมของความเท่าเทียมกัน (6) หลังจากนั้นเราจะได้ความสัมพันธ์

แสดงว่าและตามลำดับโดยและจากนั้นขึ้นต่อกัน (6) สามารถเขียนในรูปแบบที่ช่วยให้เราสามารถใช้สูตร (4) โดยที่ a1 แทนที่ด้วยและโดย

กราฟของการพึ่งพาฟังก์ชันที่คืนค่า y(x) ตามผลของการวัด (xi, yi), i=1,2,…,n เรียกว่ากราฟการถดถอย ในการตรวจสอบข้อตกลงของเส้นโค้งการถดถอยที่สร้างขึ้นกับผลลัพธ์ของการทดลอง มักจะแนะนำคุณลักษณะเชิงตัวเลขต่อไปนี้: สัมประสิทธิ์สหสัมพันธ์ (การพึ่งพาเชิงเส้น) อัตราส่วนสหสัมพันธ์ และสัมประสิทธิ์ของการกำหนด

ค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัววัดความสัมพันธ์เชิงเส้นระหว่างความขึ้นต่อกัน ตัวแปรสุ่ม: มันแสดงให้เห็นว่า โดยเฉลี่ยแล้ว ปริมาณหนึ่งสามารถแสดงเป็นฟังก์ชันเชิงเส้นของอีกปริมาณหนึ่งได้ดีเพียงใด

ค่าสัมประสิทธิ์สหสัมพันธ์คำนวณโดยสูตร:

ค่าเฉลี่ยอยู่ที่ไหน ค่าเลขคณิตตามลำดับใน x, y

ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่มไม่เกิน 1 ในค่าสัมบูรณ์ ยิ่งใกล้ 1 ยิ่งใกล้ การเชื่อมต่อเชิงเส้นระหว่าง x และ y

ในกรณีของความสัมพันธ์ที่ไม่เป็นเชิงเส้น ค่าเฉลี่ยแบบมีเงื่อนไขจะอยู่ใกล้เส้นโค้ง ในกรณีนี้ แนะนำให้ใช้อัตราส่วนสหสัมพันธ์ (correlation ratio) ซึ่งเป็นลักษณะเฉพาะของความแรงของการเชื่อมต่อ ซึ่งการตีความไม่ได้ขึ้นอยู่กับประเภทของการพึ่งพาอาศัยกันในการศึกษา

อัตราส่วนสหสัมพันธ์คำนวณโดยสูตร:

โดยที่ตัวเศษแสดงลักษณะการกระจายตัวของค่าเฉลี่ยแบบมีเงื่อนไขรอบค่าเฉลี่ยแบบไม่มีเงื่อนไข

ตลอดเวลา. ความเท่าเทียมกัน = สอดคล้องกับตัวแปรสุ่มที่ไม่สัมพันธ์กัน = ถ้าและเฉพาะเมื่อมีความสัมพันธ์เชิงฟังก์ชันระหว่าง x และ y ในกรณีของการพึ่งพาเชิงเส้นของ y บน x อัตราส่วนสหสัมพันธ์จะตรงกับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ ค่านี้ใช้เป็นตัวบ่งชี้ความเบี่ยงเบนของการถดถอยจากความเป็นเส้นตรง

อัตราส่วนสหสัมพันธ์เป็นตัววัดความสัมพันธ์ yc x ในรูปแบบใด ๆ แต่ไม่สามารถให้แนวคิดเกี่ยวกับระดับความใกล้ชิดของข้อมูลเชิงประจักษ์ในรูปแบบพิเศษได้ เพื่อหาว่าเส้นโค้งที่สร้างขึ้นนั้นสะท้อนข้อมูลเชิงประจักษ์ได้แม่นยำเพียงใด จึงมีการแนะนำคุณลักษณะอีกประการหนึ่ง นั่นคือ สัมประสิทธิ์ของการกำหนด


โดยที่ Sost = - ยอดเงินคงเหลือสี่เหลี่ยมซึ่งกำหนดลักษณะการเบี่ยงเบนของข้อมูลการทดลองจากทฤษฎี เต็ม - ยอดรวมสี่เหลี่ยม โดยที่ค่าเฉลี่ยคือ yi

ผลรวมถดถอยของกำลังสองที่แสดงลักษณะการแพร่กระจายของข้อมูล

ผลรวมของกำลังสองที่น้อยกว่าเมื่อเทียบกับ จำนวนเงินทั้งหมดสี่เหลี่ยมหัวข้อ คุ้มค่ามากขึ้นสัมประสิทธิ์ของดีเทอร์มีนิซึม r2 ซึ่งแสดงว่าสมการที่ได้มาจากการใช้ การวิเคราะห์การถดถอยอธิบายความสัมพันธ์ระหว่างตัวแปร หากเท่ากับ 1 แสดงว่ามีความสัมพันธ์ที่สมบูรณ์กับแบบจำลอง กล่าวคือ ไม่มีความแตกต่างระหว่างค่าจริงและค่า y โดยประมาณ มิฉะนั้น หากสัมประสิทธิ์ของการกำหนดระดับเป็น 0 สมการถดถอยจะไม่สามารถทำนายค่า y ได้

ค่าสัมประสิทธิ์ของการกำหนดระดับจะไม่เกินอัตราส่วนสหสัมพันธ์เสมอ ในกรณีที่เกิดความเท่าเทียมกัน เราสามารถสรุปได้ว่าสูตรเชิงประจักษ์ที่สร้างขึ้นนั้นสะท้อนข้อมูลเชิงประจักษ์ได้แม่นยำที่สุด

3. การคำนวณโดยใช้ตารางที่สร้างโดยใช้ Microsoft Excel

สำหรับการคำนวณ ขอแนะนำให้จัดเรียงข้อมูลในรูปแบบตารางที่ 2 โดยใช้วิธีการ ตัวประมวลผลสเปรดชีตไมโครซอฟต์ เอ็กเซล

ตารางที่ 2

ABCDEFGHI10,281,050,07840,2940,0219520,0061470,082320,048790,01366120,872,870,75692,49690,6585030,5728982,1723031,0543120,91725131,656,432,722510,60954,4921257,406418607,505681 998,963,960117,83047,88059915,6823935,48252,192774,36361352,088,084,326416,80648,99891218,7177434,957312,0893924,34593562,349,115,475621,317412,812929,982249,371693,893 867,022544,67918,6096349,31551118,39942,8249447,48610182,7717,977,672949,776921,2539358,87339137,8822,8887048,00170992,8318,998,008953,741722,6651964,14248152,0892,9439 331272103,0623,759,363672,67528,6526287,677222,38553,1675839,692803113,3329,4311,088998,001936,92604122,9637326,34633,38201511,26211123,4137,4511,6281127,704539,65182135, 47233,62300712,35445133,5542,4412,6025150,66244,73888158,823534,85013,74809113,30572143,8556,9414,8225219,21957,06663219,7065843,99324,04199815,56169154,0175,0816,0801301,07 4812258,56961207,2944,31855417,3174164,2386,4417,8929365,641275,68697320,15591546,6624,45945 118,86348174,8390,8523,3289438,8055112,6786544,23762119,4314,5092121,77948184,9299,0624,2064487,3752119,0955585,94982397,8864,59572622,61097195,14120,4526,4196619,113135,7967697 99533182,2414,79123524,62695205,23139,6527,3529730,3695143,0557748,18113819,8324,93913925,8317215,55187,5430,80251040,847170,9539948,7945776,7015,23399229,04866226,9412200,4539, 844252,4361595,3958006,4545,30056533,49957236,66212,9744,35561418,38295,40831967,4199446,4125,36115135,70527247,13275,7450,83691966,026362,46712584,3914017,775,61945725320667 4352.562523300.368381.07812762.81616895.165.7727841.852652695.932089.99453.310511850.652417.56813982.9971327.3490.97713415.0797 ให้เราอธิบายวิธีการรวบรวมตารางที่ 2

ขั้นตอนที่ 1 ในเซลล์ A1:A25 เราป้อนค่า xi

ขั้นตอนที่ 2 ในเซลล์ B1:B25 เราป้อนค่าของ yi

ขั้นตอนที่ 3 ในเซลล์ C1 ให้ป้อนสูตร = A1 ^ 2

ขั้นตอนที่ 4 สูตรนี้ถูกคัดลอกลงในเซลล์ C1:C25

ขั้นตอนที่ 5. ในเซลล์ D1 ให้ป้อนสูตร = A1 * B1

ขั้นตอนที่ 6 สูตรนี้ถูกคัดลอกลงในเซลล์ D1:D25

ขั้นตอนที่ 7 ในเซลล์ F1 ให้ป้อนสูตร = A1 ^ 4

ขั้นตอนที่ 8 ในเซลล์ F1:F25 สูตรนี้จะถูกคัดลอก

ขั้นตอนที่ 9 ในเซลล์ G1 ให้ป้อนสูตร =A1^2*B1

ขั้นตอนที่ 10. สูตรนี้ถูกคัดลอกลงในเซลล์ G1:G25

ขั้นตอนที่ 11 ในเซลล์ H1 ให้ป้อนสูตร = LN (B1)

ขั้นตอนที่ 12. สูตรนี้ถูกคัดลอกลงในเซลล์ H1:H25

ขั้นตอนที่ 13 ในเซลล์ I1 ให้ป้อนสูตร = A1 * LN (B1)

ขั้นตอนที่ 14. สูตรนี้ถูกคัดลอกลงในเซลล์ I1:I25

เราทำตามขั้นตอนต่อไปนี้โดยใช้การรวมอัตโนมัติ .

ขั้นตอนที่ 15. ในเซลล์ A26 ให้ป้อนสูตร = SUM (A1: A25)

ขั้นตอนที่ 16. ในเซลล์ B26 ให้ป้อนสูตร = SUM (B1: B25)

ขั้นตอนที่ 17. ในเซลล์ C26 ป้อนสูตร = SUM (C1: C25)

ขั้นตอนที่ 18. ในเซลล์ D26 ป้อนสูตร = SUM (D1: D25)

ขั้นตอนที่ 19. ในเซลล์ E26 ให้ป้อนสูตร = SUM (E1: E25)

ขั้นตอนที่ 20 ในเซลล์ F26 ป้อนสูตร = SUM (F1: F25)

ขั้นตอนที่ 21 ในเซลล์ G26 ให้ป้อนสูตร = SUM (G1: G25)

ขั้นตอนที่ 22 ในเซลล์ H26 ป้อนสูตร = SUM(H1:H25)

ขั้นตอนที่ 23. ในเซลล์ I26 ให้ป้อนสูตร = SUM(I1:I25)

เราประมาณฟังก์ชัน ฟังก์ชันเชิงเส้น. เพื่อกำหนดสัมประสิทธิ์และเราใช้ระบบ (4) ใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A26, B26, C26 และ D26 เราเขียนระบบ (4) เป็น

การแก้ปัญหาที่เราได้รับและ

ระบบได้รับการแก้ไขโดยวิธีแครมเมอร์ ซึ่งมีสาระสำคัญดังนี้ พิจารณาระบบของ n พีชคณิต สมการเชิงเส้นกับ n ไม่ทราบ:

ดีเทอร์มีแนนต์ระบบคือดีเทอร์มิแนนต์ระบบเมทริกซ์:

แสดงถึง - ดีเทอร์มีแนนต์ที่จะได้รับจากดีเทอร์มีแนนต์ของระบบ Δ โดยการแทนที่คอลัมน์ j-th ด้วยคอลัมน์

ดังนั้นการประมาณเชิงเส้นจึงมีรูปแบบ

เราแก้ระบบ (11) โดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์ถูกนำเสนอในตารางที่ 3

ตารางที่ 3

ABCDE282595.932089.992995.93453.310511850.653031

ในตารางที่ 3 เซลล์ A32:B33 มีสูตร (=MOBR(A28:B29))

เซลล์ E32:E33 มีสูตร (=MULTI(A32:B33),(C28:C29))

ต่อไปเราจะประมาณฟังก์ชัน ฟังก์ชันกำลังสอง. ในการกำหนดสัมประสิทธิ์ a1, a2 และ a3 เราใช้ระบบ (5) ใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A26, B26, C26 , D26, E26, F26, G26 เราเขียนระบบ (5) เป็น

แก้ที่เราได้ a1=10.663624, และ

ดังนั้นการประมาณกำลังสองจึงมีรูปแบบ

เราแก้ระบบ (16) โดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์ถูกนำเสนอในตารางที่ 4

ตารางที่ 4

ABCDEF362595,93453,31052089,993795,93453,31052417,56811850,65538453,31052417,56813982,9971327,3453940Обратная матрица410,632687-0,314390,033846a1=10,6614362442,453 924512430.033846-0.021710.002728a3=8.0272305

ในตารางที่ 4 เซลล์ A41:C43 มีสูตร (=MOBR(A36:C38))

เซลล์ F41:F43 มีสูตร (=MMULT(A41:C43),(D36:D38))

ตอนนี้เราประมาณฟังก์ชันด้วยฟังก์ชันเลขชี้กำลัง เพื่อหาค่าสัมประสิทธิ์และใช้ลอการิทึมของค่าและใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A26, C26, H26 และ I26 เราได้รับระบบ

ระบบการแก้ปัญหา (18) เราได้รับและ

หลังจาก potentiation เราได้รับ

ดังนั้น การประมาณเลขชี้กำลังจึงมีรูปแบบ

เราแก้ระบบ (18) โดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์ถูกนำเสนอในตารางที่ 5

ตารางที่ 5

BCDEF462595.9390.977134795.93453.3105415.07974849 เมทริกซ์ผกผัน=0.667679 500.212802-0.04503a2=0.774368 51-0.045030.011736a1=1.949707

เซลล์ A50:B51 มีสูตร (=MOBR(A46:B47))

เซลล์ E51 มีสูตร=EXP(E49)

คำนวณค่าเฉลี่ยเลขคณิตและตามสูตร:

ผลการคำนวณและเครื่องมือ Microsoft Excel แสดงไว้ในตารางที่ 6

ตารางที่ 6

BC54Xav=3.837255Yav=83.5996

เซลล์ B54 มีสูตร =A26/25

เซลล์ B55 มีสูตร = B26/25

ตารางที่ 7

ABJKLMNO10,281,05293,645412,653676814,4365987,97624,444081,88177520,872,87239,54098,8042766517,2682774,7226,7334610,91071731,656,43168,78534,7838445955,14744820,035726, 998,96137,87433,4121485571,0770,7358817,368220,02062652,088,08132,7033,0877525703,2112,138714,2039422,82478262,349,11111,52582,2416085548,70151,488211,4985887,99584272,6516 8679,233251,4094444454,174178,5730,000622,83382582,7717,9770,039911,1389164307,244311,46313,4777091,73059692,8318,9965,074791,0144524174,4373,4915,7914362,382273,103,0623,7546 515110,604043581,975620,344117,375498,423061113,3329,4327,474820,2572522934,346983,819852,2462113,94466123,4137,4519,715110,18252129,786725,90914,090409102,2541133,551042,4411, 0824841694,113797,89844,861044143,3219143,8556,94-0,341240,000164710,7343741,750,023142342,3946154,0175,08-1,472190,0298672,58358265,3212126,0007996,9257164,2386,441, 1157090.1542928.067872219.6288148.75781214.778174.8390.857 1,172456239,0241103,718163,9776121,868195,14120,4548,00871,6972881357,952471,908425,17881258,6007205,23139,6578,0671,9398923141,64743,1629470,45155769,9408215,55187,54178,029 93368410803,61725,38421200,5291951,06226,32200,45290,11626,16429613654,0227,28786126,28273577,409236,66212,97365,18687,968216736,76,038755767,788515795,87247,13275,74632,679917 931944,47565,1469344766,92257,25321,43811,667611,647256563,37121,842677,966445516,82695,932089,93830,94585,207919964427404,823786,286115678,1Су мым чОнста การเปิดรับแสงสี่เหลี่ยมเชิงเส้น

มาอธิบายวิธีการทำ

เซลล์ A1:A26 และ B1:B26 เต็มแล้ว

ขั้นตอนที่ 1 ในเซลล์ J1 ป้อนสูตร = (A1-$B$54)*(B1-$B$55)

ขั้นตอนที่ 2 สูตรนี้ถูกคัดลอกลงในเซลล์ J2:J25

ขั้นตอนที่ 3 ในเซลล์ K1 ให้ป้อนสูตร = (A1-$B$54)^2

ขั้นตอนที่ 4 สูตรนี้ถูกคัดลอกลงในเซลล์ k2:K25

ขั้นตอนที่ 5 ในเซลล์ L1 ป้อนสูตร = (B1-$B$55)^2

ขั้นตอนที่ 6 สูตรนี้ถูกคัดลอกลงในเซลล์ L2:L25

ขั้นตอนที่ 7 ในเซลล์ M1 ป้อนสูตร = ($E$32+$E$33*A1-B1)^2

ขั้นตอนที่ 8 สูตรนี้ถูกคัดลอกลงในเซลล์ M2:M25

ขั้นตอนที่ 9 ในเซลล์ N1 ป้อนสูตร = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2

ขั้นตอนที่ 10. ในเซลล์ N2:N25 สูตรนี้จะถูกคัดลอก

ขั้นตอนที่ 11 ในเซลล์ O1 ป้อนสูตร = ($E$51*EXP($E$50*A1)-B1)^2

ขั้นตอนที่ 12. ในเซลล์ O2:O25 สูตรนี้จะถูกคัดลอก

เราทำตามขั้นตอนต่อไปนี้โดยใช้การรวมอัตโนมัติ .

ขั้นตอนที่ 13 ในเซลล์ J26 ป้อนสูตร = SUM (J1: J25)

ขั้นตอนที่ 14. ในเซลล์ K26 ป้อนสูตร = SUM(K1:K25)

ขั้นตอนที่ 15. ในเซลล์ L26 ป้อนสูตร = SUM (L1: L25)

ขั้นตอนที่ 16. ในเซลล์ M26 ป้อนสูตร = SUM(M1:M25)

ขั้นตอนที่ 17. ในเซลล์ N26 ให้ป้อนสูตร = SUM(N1:N25)

ขั้นตอนที่ 18. ในเซลล์ O26 ป้อนสูตร = SUM (O1: O25)

ตอนนี้ มาคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (8) (สำหรับการประมาณเชิงเส้นเท่านั้น) และค่าสัมประสิทธิ์การดีเทอร์มินิซึมโดยใช้สูตร (10) ผลการคำนวณโดยใช้ Microsoft Excel แสดงไว้ในตารางที่ 8

ตารางที่ 8

AB57 สัมประสิทธิ์สหสัมพันธ์ 0.92883358 สัมประสิทธิ์ของการกำหนด (ประมาณเชิงเส้น) 0.8627325960 สัมประสิทธิ์ของการกำหนด (ประมาณการกำลังสอง) 0.9810356162 สัมประสิทธิ์ของการกำหนด (การประมาณเลขชี้กำลัง) 0.42057863 เซลล์ E57 มีสูตร =J26/(K26*L26)^(1/2)

เซลล์ E59 มีสูตร=1-M26/L26

เซลล์ E61 มีสูตร=1-N26/L26

เซลล์ E63 มีสูตร=1-O26/L26

การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณค่ากำลังสองอธิบายข้อมูลการทดลองได้ดีที่สุด

แบบแผนอัลกอริทึม

ข้าว. 1. แบบแผนของอัลกอริทึมสำหรับโปรแกรมการคำนวณ

5. การคำนวณใน MathCad

การถดถอยเชิงเส้น

· เส้น (x, y) - เวกเตอร์สององค์ประกอบ (b, a) ของสัมประสิทธิ์การถดถอยเชิงเส้น b+ax;

· x คือเวกเตอร์ของข้อมูลจริงของการโต้แย้ง

· y เป็นเวกเตอร์ของค่าข้อมูลจริงที่มีขนาดเท่ากัน

รูปที่ 2

การถดถอยพหุนามหมายถึงการปรับข้อมูล (x1, y1) ด้วยพหุนาม องศาที่ kสำหรับ k=i พหุนามคือเส้นตรง สำหรับ k=2 มันคือพาราโบลา สำหรับ k=3 มันคือพาราโบลาลูกบาศก์เป็นต้น ตามกฎแล้ว k<5.

· การถดถอย (x,y,k) - เวกเตอร์ของสัมประสิทธิ์สำหรับการสร้างการถดถอยข้อมูลพหุนาม

· interp (s,x,y,t) - ผลลัพธ์ของการถดถอยพหุนาม

· s=regress(x,y,k);

· x เป็นเวกเตอร์ของข้อมูลอาร์กิวเมนต์จริง ซึ่งมีองค์ประกอบเรียงจากน้อยไปมาก

· y เป็นเวกเตอร์ของค่าข้อมูลจริงที่มีขนาดเท่ากัน

· k คือระดับของพหุนามการถดถอย (จำนวนเต็มบวก);

· t คือค่าของการโต้แย้งของพหุนามการถดถอย

รูปที่ 3

นอกเหนือจากที่พิจารณาแล้ว ยังมีการถดถอยสามพารามิเตอร์อีกหลายประเภทใน Mathcad การนำไปใช้จะค่อนข้างแตกต่างจากตัวเลือกการถดถอยข้างต้นที่นอกเหนือจากอาร์เรย์ข้อมูลแล้วยังต้องตั้งค่าเริ่มต้นบางอย่างของ สัมประสิทธิ์ a, b, c ใช้ประเภทการถดถอยที่เหมาะสมหากคุณมีความคิดที่ดีว่าการพึ่งพาใดที่อธิบายอาร์เรย์ข้อมูลของคุณ เมื่อประเภทของการถดถอยไม่สะท้อนถึงลำดับของข้อมูล ผลลัพธ์มักจะไม่เป็นที่น่าพอใจและแตกต่างกันมากขึ้นอยู่กับการเลือกค่าเริ่มต้น แต่ละฟังก์ชันสร้างเวกเตอร์ของพารามิเตอร์ที่กลั่นแล้ว a, b, c

ผลลัพธ์ LINEST

พิจารณาวัตถุประสงค์ของฟังก์ชัน LINEST

ฟังก์ชันนี้ใช้วิธีกำลังสองน้อยที่สุดในการคำนวณเส้นตรงที่เหมาะกับข้อมูลที่มีอยู่มากที่สุด

ฟังก์ชันส่งคืนอาร์เรย์ที่อธิบายบรรทัดผลลัพธ์ สมการของเส้นตรงคือ:

M1x1 + m2x2 + ... + b หรือ y = mx + b,

ซอฟต์แวร์ไมโครซอฟต์แบบตารางอัลกอริธึม

เพื่อให้ได้ผลลัพธ์ คุณต้องสร้างสูตรสเปรดชีตที่จะครอบคลุม 5 แถว 2 คอลัมน์ ช่วงเวลานี้สามารถวางได้ทุกที่บนเวิร์กชีต ในช่วงเวลานี้ คุณต้องป้อนฟังก์ชัน LINEST

ด้วยเหตุนี้ ควรเติมเซลล์ทั้งหมดของช่วง A65:B69 (ดังแสดงในตารางที่ 9)

ตารางที่ 9

АВ6544,95997-88,9208663,73946615,92346670,86273234,5183168144,55492369172239,227404,82

ให้เราอธิบายวัตถุประสงค์ของปริมาณบางส่วนที่อยู่ในตารางที่ 9

ค่าที่อยู่ในเซลล์ A65 และ B65 แสดงถึงความชันและการเปลี่ยนแปลงตามลำดับ - สัมประสิทธิ์ของการกำหนดระดับ - ค่าที่สังเกตได้จาก F - จำนวนองศาอิสระ

การนำเสนอผลลัพธ์ในรูปแบบกราฟ

ข้าว. 4. กราฟของการประมาณเชิงเส้น

ข้าว. 5. กราฟของการประมาณค่ากำลังสอง

ข้าว. 6. พล็อตของการประมาณเลขชี้กำลัง

ข้อสรุป

ให้เราสรุปผลตามผลลัพธ์ของข้อมูลที่ได้รับ

การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณค่ากำลังสองอธิบายข้อมูลการทดลองได้ดีที่สุดตั้งแต่ เส้นแนวโน้มสำหรับมันสะท้อนพฤติกรรมของฟังก์ชันในพื้นที่นี้ได้อย่างแม่นยำที่สุด

การเปรียบเทียบผลลัพธ์ที่ได้จากการใช้ฟังก์ชัน LINEST เราพบว่าผลลัพธ์นั้นตรงกับการคำนวณที่ดำเนินการข้างต้นอย่างสมบูรณ์ นี่แสดงว่าการคำนวณนั้นถูกต้อง

ผลลัพธ์ที่ได้จากโปรแกรม MathCad ตรงกับค่าที่ระบุด้านบน สิ่งนี้บ่งบอกถึงความถูกต้องของการคำนวณ

บรรณานุกรม

  1. บี.พี. เดมิโดวิช, ไอ.เอ. สีน้ำตาลแดง พื้นฐานของคณิตศาสตร์เชิงคำนวณ. M: สำนักพิมพ์ของรัฐวรรณกรรมทางกายภาพและคณิตศาสตร์
  2. สารสนเทศ: ตำรา, ed. ศ. เอ็น.วี. มาคาโรว่า ม: การเงินและสถิติ พ.ศ. 2550
  3. สารสนเทศ: การประชุมเชิงปฏิบัติการเกี่ยวกับเทคโนโลยีคอมพิวเตอร์ ed. ศ. เอ็น.วี. มาคาโรว่า ม: การเงินและสถิติ พ.ศ. 2553
  4. วีบี โกเมียกิน. การเขียนโปรแกรมใน Excel ใน Visual Basic อ: วิทยุและการสื่อสาร, 2550.
  5. น. นิโคล, อาร์. อัลเบรชท์. เอ็กเซล สเปรดชีต ม: เอ็ด "อีคอม", 2551.
  6. แนวทางการดำเนินการรายวิชาในวิทยาการคอมพิวเตอร์ Zhurova G. N. , SPbGGI(TU), 2011.

ค่าประมาณ, หรือ ค่าประมาณ- วิธีการทางวิทยาศาสตร์ที่ประกอบด้วยการแทนที่วัตถุบางอย่างด้วยสิ่งอื่น ในแง่หนึ่งหรืออย่างอื่นที่ใกล้เคียงกับต้นฉบับ แต่ง่ายกว่า

การประมาณช่วยให้คุณสำรวจลักษณะเชิงตัวเลขและคุณสมบัติเชิงคุณภาพของวัตถุ ลดปัญหาในการศึกษาวัตถุที่ง่ายกว่าหรือสะดวกกว่า (ตัวอย่างเช่น คุณสมบัติที่คำนวณได้ง่ายหรือมีคุณสมบัติที่ทราบอยู่แล้ว) ในทฤษฎีจำนวน มีการศึกษาการประมาณไดโอแฟนไทน์ โดยเฉพาะอย่างยิ่ง การประมาณจำนวนอตรรกยะโดยจำนวนตรรกยะ ในเรขาคณิต จะพิจารณาการประมาณเส้นโค้งโดยเส้นหัก บางส่วนของคณิตศาสตร์ส่วนใหญ่ทุ่มเทให้กับการประมาณ เช่น ทฤษฎีการประมาณของฟังก์ชัน วิธีการวิเคราะห์เชิงตัวเลข

ในความหมายโดยนัยใช้ในปรัชญาเช่น วิธีการประมาณ, สิ่งบ่งชี้ถึงลักษณะโดยประมาณที่ไม่สิ้นสุด ตัวอย่างเช่น ในแง่นี้ คำว่า "การประมาณ" ถูกใช้อย่างแข็งขันโดย Søren Kierkegaard (1813-1855) ใน "Final Unscientific Afterword..."

หากฟังก์ชันจะใช้สำหรับการแก้ไขเท่านั้น ก็เพียงพอที่จะประมาณจุดด้วยพหุนามเช่นระดับที่ห้า:

สถานการณ์จะซับซ้อนมากขึ้นหากข้อมูลภาคสนามข้างต้นเป็นจุดอ้างอิงสำหรับการเปิดเผยกฎแห่งการเปลี่ยนแปลงพร้อมเงื่อนไขขอบเขตที่ทราบ ตัวอย่างเช่น: และ . ที่นี่คุณภาพของผลลัพธ์ขึ้นอยู่กับความเป็นมืออาชีพของผู้วิจัย ในกรณีนี้ กฎหมายที่ยอมรับได้มากที่สุดคือ:

สำหรับการเลือกพารามิเตอร์ของสมการที่เหมาะสมที่สุด มักจะใช้วิธีกำลังสองน้อยที่สุด

วิธีกำลังสองน้อยที่สุด (LSM,ภาษาอังกฤษสามัญ น้อยที่สุด สี่เหลี่ยม , OLS ) - วิธีการทางคณิตศาสตร์ที่ใช้แก้ปัญหาต่างๆ โดยพิจารณาจากการลดผลรวมของกำลังสองของฟังก์ชันบางอย่างของตัวแปรที่ต้องการให้เหลือน้อยที่สุด สามารถใช้เพื่อ "แก้" ระบบสมการที่กำหนดมากเกินไป (เมื่อจำนวนสมการเกินจำนวนที่ไม่ทราบค่า) เพื่อค้นหาวิธีแก้ปัญหาในกรณีของระบบสมการไม่เชิงเส้นธรรมดา (ไม่ได้กำหนดมากเกินไป) เพื่อประมาณค่าจุดโดย ฟังก์ชั่นบางอย่าง OLS เป็นหนึ่งในวิธีพื้นฐานของการวิเคราะห์การถดถอยสำหรับการประมาณค่าพารามิเตอร์ที่ไม่รู้จักของตัวแบบการถดถอยจากข้อมูลตัวอย่าง

หากปริมาณทางกายภาพบางอย่างขึ้นอยู่กับปริมาณอื่น การพึ่งพาอาศัยกันนี้สามารถตรวจสอบได้โดยการวัดค่า y ที่ค่า x ที่แตกต่างกัน จากการวัดจะได้ชุดของค่า:

x 1 , x 2 , ..., x i , ... , x n ;

y 1 , y 2 , ..., y ฉัน , ... , y n .

จากข้อมูลของการทดลองดังกล่าว เป็นไปได้ที่จะพล็อตการพึ่งพา y = ƒ(x) เส้นโค้งที่ได้ทำให้สามารถตัดสินรูปแบบของฟังก์ชัน ƒ(x) ได้ อย่างไรก็ตาม ค่าสัมประสิทธิ์คงที่ที่เข้าสู่ฟังก์ชันนี้ยังไม่ทราบ สามารถกำหนดได้โดยใช้วิธีกำลังสองน้อยที่สุด ตามกฎแล้วจุดทดสอบไม่ได้อยู่บนเส้นโค้งอย่างแน่นอน วิธีการกำลังสองน้อยที่สุดต้องการให้ผลรวมของการเบี่ยงเบนกำลังสองของจุดทดลองจากเส้นโค้ง กล่าวคือ 2 มีขนาดเล็กที่สุด

ในทางปฏิบัติ วิธีนี้มักใช้บ่อยที่สุด (และง่ายที่สุด) ในกรณีของความสัมพันธ์เชิงเส้น กล่าวคือ เมื่อไร

y=kxหรือ y = a + bx

การพึ่งพาอาศัยกันเชิงเส้นเป็นที่แพร่หลายมากในวิชาฟิสิกส์ และแม้ว่าการพึ่งพาอาศัยกันไม่ใช่เชิงเส้น พวกเขามักจะพยายามสร้างกราฟเพื่อให้ได้เส้นตรง ตัวอย่างเช่น หากสันนิษฐานว่าดัชนีการหักเหของแสงของแก้ว n สัมพันธ์กับความยาวคลื่น λ ของคลื่นแสงโดยความสัมพันธ์ n = a + b/λ 2 การขึ้นต่อกันของ n บน λ -2 จะถูกพล็อตบนกราฟ .

พิจารณาการพึ่งพา y=kx(เส้นตรงผ่านจุดกำเนิด) เขียนค่า φ - ผลรวมของการเบี่ยงเบนกำลังสองของจุดของเราจากเส้นตรง

.

ค่าของ φ เป็นบวกเสมอ และกลายเป็นว่ามีค่าน้อยกว่า ยิ่งจุดของเราอยู่ใกล้เส้นตรงมากขึ้น วิธีกำลังสองน้อยที่สุดระบุว่าสำหรับ k ควรเลือกค่าดังกล่าวที่ φ มีค่าต่ำสุด

หรือ (19)

การคำนวณแสดงว่าข้อผิดพลาด root-mean-square ในการกำหนดค่าของ k เท่ากับ

, (20) โดยที่ – n คือจำนวนการวัด

ตอนนี้ให้เราพิจารณากรณีที่ค่อนข้างยากกว่าเมื่อคะแนนต้องเป็นไปตามสูตร y = a + bx(เส้นตรงไม่ผ่านจุดกำเนิด)

ภารกิจคือการหาค่าที่ดีที่สุดของ a และ b จากชุดของค่าที่กำหนด x ผม , y ผม .

อีกครั้งเราเขียนรูปแบบกำลังสอง φ เท่ากับผลรวมของการเบี่ยงเบนกำลังสองของจุด x ผม , y ผม จากเส้นตรง

และหาค่า a และ b ที่ φ มีค่าต่ำสุด

;

.

คำตอบร่วมของสมการเหล่านี้ให้

(21)

ข้อผิดพลาด root-mean-square ของการกำหนด a และ b เท่ากับ

(23)

. (24)

เมื่อประมวลผลผลการวัดด้วยวิธีนี้ จะสะดวกกว่าที่จะสรุปข้อมูลทั้งหมดในตารางที่มีการคำนวณผลรวมทั้งหมดที่รวมอยู่ในสูตร (19)–(24) รูปแบบของตารางเหล่านี้แสดงอยู่ในตัวอย่างด้านล่าง

ตัวอย่าง 1 ศึกษาสมการพื้นฐานของไดนามิกของการเคลื่อนที่แบบหมุน ε = M/J (เส้นตรงที่ลากผ่านจุดกำเนิด) สำหรับค่าต่างๆ ของโมเมนต์ M จะวัดความเร่งเชิงมุม ε ของวัตถุบางตัว จำเป็นต้องกำหนดโมเมนต์ความเฉื่อยของร่างกายนี้ ผลการวัดโมเมนต์ของแรงและความเร่งเชิงมุมแสดงอยู่ในคอลัมน์ที่สองและสาม โต๊ะ 5.

ตารางที่ 5

ตามสูตร (19) เรากำหนด:

.

เพื่อตรวจสอบข้อผิดพลาดของรูท - ค่าเฉลี่ย - สแควร์เราใช้สูตร (20)

0.005775 กิโลกรัม-หนึ่ง · -2 .

ตามสูตร (18) เรามี

SJ = (2.996 0.005775)/0.3337 = 0.05185 กิโลกรัม m 2 .

ด้วยความน่าเชื่อถือ P = 0.95 ตามตารางค่าสัมประสิทธิ์นักเรียนสำหรับ n = 5 เราพบ t = 2.78 และกำหนดข้อผิดพลาดแน่นอน ΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 กิโลกรัม m 2 .

เราเขียนผลลัพธ์ในรูปแบบ:

เจ = (3.0 ± 0.2) กิโลกรัม m 2 ;

ตัวอย่าง 2เราคำนวณค่าสัมประสิทธิ์อุณหภูมิของความต้านทานของโลหะโดยใช้วิธีกำลังสองน้อยที่สุด ความต้านทานขึ้นอยู่กับอุณหภูมิตามกฎเชิงเส้น

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °

ระยะอิสระกำหนดความต้านทาน R 0 ที่อุณหภูมิ 0 ° C และสัมประสิทธิ์เชิงมุมเป็นผลคูณของค่าสัมประสิทธิ์อุณหภูมิ α และความต้านทาน R 0 .

ผลการวัดและการคำนวณแสดงไว้ในตาราง ( ดูตาราง6).

ตารางที่ 6

(r - bt - a) 2,10 -6

โดยสูตร (21), (22) เรากำหนด

R 0 = ¯R- α R 0 ¯t = 1.4005 - 0.002645 85.83333 = 1.1735 โอห์ม .

ให้เราหาข้อผิดพลาดในคำจำกัดความของ α ตั้งแต่ จากนั้นตามสูตร (18) เรามี:

.

โดยใช้สูตร (23) (24) เรามี

;

0.014126 โอห์ม.

ด้วยความน่าเชื่อถือ P = 0.95 ตามตารางค่าสัมประสิทธิ์ของนักเรียนสำหรับ n = 6 เราพบ t = 2.57 และกำหนดข้อผิดพลาดสัมบูรณ์ Δα = 2.57 0.000132 = 0.000338 ลูกเห็บ -1 .

α = (23 ± 4) 10 -4 ลูกเห็บ-1 ที่ P = 0.95

ตัวอย่างที่ 3จำเป็นต้องกำหนดรัศมีความโค้งของเลนส์จากวงแหวนของนิวตัน วัดรัศมีของวงแหวนของนิวตัน r m และหาจำนวนของวงแหวนเหล่านี้ m รัศมีของวงแหวนของนิวตันสัมพันธ์กับรัศมีความโค้งของเลนส์ R และหมายเลขวงแหวนตามสมการ

r 2 m = mλR - 2d 0 R,

โดยที่ d 0 คือความหนาของช่องว่างระหว่างเลนส์กับเพลตขนานระนาบ (หรือการเสียรูปของเลนส์)

λ คือความยาวคลื่นของแสงตกกระทบ

λ = (600 ± 6) นาโนเมตร; r 2 m = y; ม. = x; λR = ข; -2d 0 R = a,

แล้วสมการจะอยู่ในรูป y = a + bx.

ผลลัพธ์ของการวัดและการคำนวณจะถูกป้อนใน ตารางที่ 7.

ตารางที่ 7

y \u003d r 2, 10 -2 มม. 2

y-bx-a, 10-4

(y - bx - a) 2, 10 -6

เราคาดว่า:

1. a และ b ตามสูตร (21), (22)

a = ¯r 2 - b¯m = (0.208548333 - 0.0594957 3.5) = 0.0003133 มม 2 .

2. คำนวณข้อผิดพลาด root-mean-square สำหรับค่า b และ a โดยใช้สูตร (23), (24)

3. ด้วยความน่าเชื่อถือ P = 0.95 ตามตารางค่าสัมประสิทธิ์นักเรียนสำหรับ n = 6 เราพบ t = 2.57 และกำหนดข้อผิดพลาดที่แน่นอน

Δb = 2.57 0.000211179 = 6 10 -4 มม 2 ;

Δa = 2.57 0.000822424 = 3 10 -3 มม 2 .

4. เขียนผลลัพธ์

b = (595 ± 6) 10 -4 มม 2 ที่ Р = 0.95;

a = (0.3 ± 3) 10 -3 มม 2 ที่ Р = 0.95;

จากผลการทดลองว่าภายในข้อผิดพลาดของการทดลองนี้ เส้นตรง r 2 m = ƒ(m) ผ่านจุดกำเนิดเพราะ หากข้อผิดพลาดของค่าของพารามิเตอร์ใด ๆ กลายเป็นค่าเปรียบเทียบหรือเกินกว่าค่าของพารามิเตอร์ นั่นหมายความว่ามีแนวโน้มมากที่สุด ค่าที่แท้จริงของพารามิเตอร์นี้เป็นศูนย์

ภายใต้เงื่อนไขของการทดลองนี้ ค่าของ a ไม่เป็นที่สนใจ ดังนั้นเราจะไม่จัดการกับมันอีกต่อไป

5. คำนวณรัศมีความโค้งของเลนส์:

R = b / λ = 594.5 / 6 = 99.1 มม.

6. เนื่องจากข้อผิดพลาดของระบบถูกกำหนดไว้สำหรับความยาวคลื่น เราจึงคำนวณข้อผิดพลาดที่เป็นระบบสำหรับ R ตามสูตร (16) โดยใช้ข้อผิดพลาดแบบสุ่ม Δb เป็นข้อผิดพลาดที่เป็นระบบของ b

เขียนผลลัพธ์สุดท้าย R = (99 ± 2) มมε ≈ 3% ที่ P = 0.95

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร Xและ ที่จะได้รับในตาราง

อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน

โดยใช้ วิธีกำลังสองน้อยที่สุด, ประมาณข้อมูลเหล่านี้ด้วยการพึ่งพาเชิงเส้น y=ax+b(ค้นหาพารามิเตอร์ เอและ ). ค้นหาว่าเส้นใดในสองบรรทัดดีกว่า (ในแง่ของวิธีกำลังสองน้อยที่สุด) ที่จัดแนวข้อมูลการทดลอง วาดรูป.

สาระสำคัญของวิธีการกำลังสองน้อยที่สุด (LSM)

ปัญหาคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งฟังก์ชันของตัวแปรสองตัว เอและ ใช้ค่าที่น้อยที่สุด นั่นคือเมื่อได้รับข้อมูล เอและ ผลรวมของค่าเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้น คำตอบของตัวอย่างจึงลดลงเหลือเพียงการหาค่าสุดโต่งของฟังก์ชันของตัวแปรสองตัว

ที่มาของสูตรการหาค่าสัมประสิทธิ์

ระบบของสมการสองสมการที่มีสองนิรนามถูกรวบรวมและแก้ไข การหาอนุพันธ์บางส่วนของฟังก์ชัน ตามตัวแปร เอและ เราให้อนุพันธ์เหล่านี้เท่ากับศูนย์

เราแก้ระบบผลลัพธ์ของสมการด้วยวิธีใดก็ได้ (เช่น วิธีการทดแทนหรือ วิธีการของแครมเมอร์) และรับสูตรการหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM)

ด้วยข้อมูล เอและ การทำงาน ใช้ค่าที่น้อยที่สุด หลักฐานของความเป็นจริงนี้จะได้รับ ใต้ข้อความท้ายหน้า.

นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาค่าพารามิเตอร์ เอมีผลรวม ,,, และพารามิเตอร์ - จำนวนข้อมูลการทดลอง แนะนำให้คำนวณค่าของผลรวมเหล่านี้แยกกัน ค่าสัมประสิทธิ์ พบหลังจากการคำนวณ เอ.

ถึงเวลาที่จะจำตัวอย่างเดิม

วิธีการแก้.

ในตัวอย่างของเรา n=5. เรากรอกตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของสัมประสิทธิ์ที่ต้องการ

ค่าในแถวที่สี่ของตารางนั้นได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ผม.

ค่าในแถวที่ห้าของตารางนั้นได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ผม.

ค่าของคอลัมน์สุดท้ายของตารางคือผลรวมของค่าในแถวต่างๆ

เราใช้สูตรของวิธีกำลังสองน้อยที่สุดเพื่อหาสัมประสิทธิ์ เอและ . เราแทนที่ค่าที่สอดคล้องกันจากคอลัมน์สุดท้ายของตาราง:

เพราะเหตุนี้, y=0.165x+2.184เป็นเส้นตรงโดยประมาณที่ต้องการ

มันยังคงที่จะหาว่าเส้นไหน y=0.165x+2.184หรือ ประมาณข้อมูลเดิมได้ดีขึ้น เช่น ประมาณการโดยใช้วิธีกำลังสองน้อยที่สุด

การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด

ในการทำเช่นนี้ คุณต้องคำนวณผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลดั้งเดิมจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ใกล้เคียงกับข้อมูลดั้งเดิมได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด

ตั้งแต่ แล้วบรรทัด y=0.165x+2.184ใกล้เคียงกับข้อมูลเดิมได้ดีขึ้น

ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LSM)

ทุกอย่างดูดีบนแผนภูมิ เส้นสีแดงคือเส้นที่พบ y=0.165x+2.184, เส้นสีน้ำเงินคือ , จุดสีชมพูเป็นข้อมูลดั้งเดิม

ในทางปฏิบัติ เมื่อสร้างแบบจำลองกระบวนการต่าง ๆ - โดยเฉพาะอย่างยิ่ง เศรษฐกิจ กายภาพ เทคนิค สังคม - วิธีหนึ่งในการคำนวณค่าโดยประมาณของฟังก์ชันจากค่าที่ทราบในบางจุดคงที่นั้นใช้กันอย่างแพร่หลาย

ปัญหาของการประมาณฟังก์ชันประเภทนี้มักเกิดขึ้น:

    เมื่อสร้างสูตรโดยประมาณสำหรับการคำนวณค่าปริมาณลักษณะของกระบวนการที่ศึกษาตามข้อมูลตารางที่ได้รับจากการทดลอง

    ในการรวมเชิงตัวเลข การแยกความแตกต่าง การแก้สมการเชิงอนุพันธ์ ฯลฯ

    หากจำเป็นต้องคำนวณค่าของฟังก์ชันที่จุดกึ่งกลางของช่วงเวลาที่พิจารณา

    เมื่อกำหนดค่าของปริมาณลักษณะของกระบวนการนอกช่วงเวลาที่พิจารณาโดยเฉพาะเมื่อคาดการณ์

ถ้าเพื่อสร้างแบบจำลองกระบวนการที่ระบุโดยตาราง ฟังก์ชันถูกสร้างขึ้นที่อธิบายกระบวนการนี้โดยประมาณโดยอิงจากวิธีกำลังสองน้อยที่สุด ฟังก์ชันนั้นจะถูกเรียกว่าฟังก์ชันประมาณ (การถดถอย) และงานสร้างฟังก์ชันการประมาณเองจะ เป็นปัญหาการประมาณ

บทความนี้กล่าวถึงความเป็นไปได้ของแพ็คเกจ MS Excel สำหรับการแก้ปัญหาดังกล่าว นอกจากนี้ยังมีวิธีการและเทคนิคในการสร้าง (การสร้าง) การถดถอยสำหรับฟังก์ชันที่กำหนดแบบตาราง (ซึ่งเป็นพื้นฐานของการวิเคราะห์การถดถอย)

มีสองตัวเลือกสำหรับการสร้างการถดถอยใน Excel

    การเพิ่มการถดถอยที่เลือก (เส้นแนวโน้ม) ลงในแผนภูมิที่สร้างขึ้นโดยใช้ตารางข้อมูลสำหรับลักษณะเฉพาะของกระบวนการที่ศึกษา (ใช้ได้เฉพาะเมื่อมีการสร้างแผนภูมิ)

    การใช้ฟังก์ชันทางสถิติในตัวของเวิร์กชีต Excel ซึ่งช่วยให้คุณรับการถดถอย (เส้นแนวโน้ม) ได้โดยตรงจากตารางข้อมูลต้นทาง

การเพิ่มเส้นแนวโน้มลงในแผนภูมิ

สำหรับตารางข้อมูลที่อธิบายกระบวนการบางอย่างและแสดงโดยไดอะแกรม Excel มีเครื่องมือวิเคราะห์การถดถอยที่มีประสิทธิภาพซึ่งช่วยให้คุณ:

    สร้างบนพื้นฐานของวิธีกำลังสองน้อยที่สุดและเพิ่มลงในไดอะแกรมการถดถอยห้าประเภทที่จำลองกระบวนการภายใต้การศึกษาด้วยระดับความแม่นยำที่แตกต่างกัน

    เพิ่มสมการการถดถอยที่สร้างขึ้นในไดอะแกรม

    กำหนดระดับความสอดคล้องของการถดถอยที่เลือกด้วยข้อมูลที่แสดงบนแผนภูมิ

ตามข้อมูลแผนภูมิ Excel ช่วยให้คุณได้รับประเภทการถดถอยเชิงเส้น พหุนาม ลอการิทึม เอ็กซ์โปเนนเชียล เอ็กซ์โปเนนเชียล ซึ่งกำหนดโดยสมการ:

y = y(x)

โดยที่ x เป็นตัวแปรอิสระ ซึ่งมักใช้ค่าของลำดับของตัวเลขธรรมชาติ (1; 2; 3; ...) และสร้างตัวอย่างเช่นการนับถอยหลังของเวลาของกระบวนการภายใต้การศึกษา (ลักษณะ) .

1 . การถดถอยเชิงเส้นเป็นสิ่งที่ดีในการสร้างแบบจำลองคุณลักษณะที่เพิ่มหรือลดลงในอัตราคงที่ นี่เป็นแบบจำลองที่ง่ายที่สุดของกระบวนการที่กำลังศึกษา มันถูกสร้างขึ้นตามสมการ:

y=mx+b

โดยที่ m คือแทนเจนต์ของความชันของการถดถอยเชิงเส้นกับแกน x b - พิกัดของจุดตัดของการถดถอยเชิงเส้นกับแกน y

2 . เส้นแนวโน้มของพหุนามมีประโยชน์สำหรับการอธิบายลักษณะเฉพาะที่มีความสุดขั้วที่แตกต่างกันหลายประการ (เสียงสูงและต่ำ) การเลือกระดับของพหุนามนั้นพิจารณาจากจำนวนสุดขั้วของคุณลักษณะที่กำลังศึกษา ดังนั้นพหุนามของดีกรีที่สองสามารถอธิบายกระบวนการที่มีค่าสูงสุดหรือต่ำสุดเพียงค่าเดียว พหุนามของดีกรีที่สาม - ไม่เกินสอง extrema; พหุนามของดีกรีที่สี่ - ไม่เกินสามสุดโต่ง ฯลฯ

ในกรณีนี้ เส้นแนวโน้มถูกสร้างขึ้นตามสมการ:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

โดยที่สัมประสิทธิ์ c0, c1, c2,... c6 เป็นค่าคงที่ซึ่งกำหนดค่าระหว่างการก่อสร้าง

3 . เส้นแนวโน้มลอการิทึมใช้สำเร็จในลักษณะการสร้างแบบจำลอง ค่าที่เปลี่ยนแปลงอย่างรวดเร็วในตอนแรก แล้วค่อยๆ เสถียร

y = c ln(x) + b

4 . เส้นแนวโน้มพลังงานให้ผลลัพธ์ที่ดีหากค่าของการพึ่งพาที่ศึกษานั้นมีลักษณะเฉพาะโดยการเปลี่ยนแปลงอัตราการเติบโตอย่างต่อเนื่อง ตัวอย่างของการพึ่งพาอาศัยกันดังกล่าวสามารถใช้เป็นกราฟของการเคลื่อนที่ที่เร่งอย่างสม่ำเสมอของรถ หากมีค่าเป็นศูนย์หรือค่าลบในข้อมูล คุณจะไม่สามารถใช้เส้นแนวโน้มกำลังได้

มันถูกสร้างขึ้นตามสมการ:

y = cxb

โดยที่สัมประสิทธิ์ b, c เป็นค่าคงที่

5 . ควรใช้เส้นแนวโน้มเลขชี้กำลังหากอัตราการเปลี่ยนแปลงในข้อมูลเพิ่มขึ้นอย่างต่อเนื่อง สำหรับข้อมูลที่มีค่าเป็นศูนย์หรือค่าลบ การประมาณแบบนี้ก็ใช้ไม่ได้เช่นกัน

มันถูกสร้างขึ้นตามสมการ:

y=cebx

โดยที่สัมประสิทธิ์ b, c เป็นค่าคงที่

เมื่อเลือกเส้นแนวโน้ม Excel จะคำนวณค่า R2 โดยอัตโนมัติ ซึ่งแสดงถึงความถูกต้องของการประมาณค่า ยิ่งค่า R2 ใกล้เคียงกับค่าหนึ่งเท่าใด เส้นแนวโน้มก็จะยิ่งใกล้เคียงกับกระบวนการที่ศึกษามากขึ้นเท่านั้น หากจำเป็น ค่าของ R2 จะแสดงบนไดอะแกรมเสมอ

กำหนดโดยสูตร:

ในการเพิ่มเส้นแนวโน้มให้กับชุดข้อมูล:

    เปิดใช้งานแผนภูมิที่สร้างขึ้นบนพื้นฐานของชุดข้อมูล กล่าวคือ คลิกภายในพื้นที่แผนภูมิ รายการแผนภูมิจะปรากฏในเมนูหลัก

    หลังจากคลิกที่รายการนี้ เมนูจะปรากฏขึ้นบนหน้าจอ ซึ่งคุณควรเลือกคำสั่งเพิ่มเส้นแนวโน้ม

การดำเนินการเดียวกันนี้สามารถทำได้ง่ายหากคุณวางเมาส์เหนือกราฟที่สอดคล้องกับชุดข้อมูลชุดใดชุดหนึ่งและคลิกขวา ในเมนูบริบทที่ปรากฏขึ้น ให้เลือกคำสั่ง เพิ่มเส้นแนวโน้ม ไดอะล็อกบ็อกซ์ Trendline จะปรากฏบนหน้าจอโดยเปิดแท็บ Type (รูปที่ 1)

หลังจากนั้นคุณต้องการ:

บนแท็บประเภท เลือกประเภทเส้นแนวโน้มที่ต้องการ (เลือกเชิงเส้นตามค่าเริ่มต้น) สำหรับประเภทพหุนาม ในฟิลด์ องศา ให้ระบุระดับของพหุนามที่เลือก

1 . ฟิลด์ Built on Series แสดงรายการชุดข้อมูลทั้งหมดในแผนภูมิที่เป็นปัญหา ในการเพิ่มเส้นแนวโน้มให้กับชุดข้อมูลเฉพาะ ให้เลือกชื่อในฟิลด์ สร้างจากชุดข้อมูล

หากจำเป็น โดยไปที่แท็บพารามิเตอร์ (รูปที่ 2) คุณสามารถตั้งค่าพารามิเตอร์ต่อไปนี้สำหรับเส้นแนวโน้มได้:

    เปลี่ยนชื่อของเส้นแนวโน้มในชื่อของฟิลด์เส้นโค้งโดยประมาณ (เรียบ)

    กำหนดจำนวนงวด (ไปข้างหน้าหรือข้างหลัง) สำหรับการคาดการณ์ในฟิลด์การพยากรณ์

    แสดงสมการของเส้นแนวโน้มในพื้นที่แผนภูมิ ซึ่งคุณควรเปิดใช้งานช่องทำเครื่องหมาย แสดงสมการบนแผนภูมิ

    แสดงค่าความน่าเชื่อถือโดยประมาณ R2 ในพื้นที่ไดอะแกรม ซึ่งคุณควรเปิดใช้งานช่องทำเครื่องหมาย ใส่ค่าของความน่าเชื่อถือโดยประมาณ (R^2) บนไดอะแกรม

    กำหนดจุดตัดของเส้นแนวโน้มด้วยแกน Y ซึ่งคุณควรเปิดใช้งานช่องทำเครื่องหมายจุดตัดของเส้นโค้งด้วยแกน Y ที่จุดหนึ่ง

    คลิกปุ่ม OK เพื่อปิดกล่องโต้ตอบ

มีสามวิธีในการเริ่มแก้ไขเส้นแนวโน้มที่สร้างไว้แล้ว:

    ใช้คำสั่ง Selected trend line จากเมนู Format หลังจากเลือกเส้นแนวโน้มแล้ว

    เลือกคำสั่ง Format Trendline จากเมนูบริบท ซึ่งเรียกโดยคลิกขวาที่เส้นแนวโน้ม

    โดยดับเบิลคลิกที่เส้นแนวโน้ม

กล่องโต้ตอบ Format Trendline จะปรากฏขึ้นบนหน้าจอ (รูปที่ 3) ประกอบด้วยแท็บ 3 แท็บ ได้แก่ View, Type, Parameters และเนื้อหาของสองรายการสุดท้ายตรงกับแท็บที่คล้ายกันของกล่องโต้ตอบ Trendline (รูปที่ 1-2) ). บนแท็บ มุมมอง คุณสามารถกำหนดประเภทเส้น สี และความหนาของเส้นได้

หากต้องการลบเส้นแนวโน้มที่สร้างไว้แล้ว ให้เลือกเส้นแนวโน้มที่จะลบและกดปุ่ม Delete

ข้อดีของเครื่องมือวิเคราะห์การถดถอยที่พิจารณาคือ:

    ความง่ายในการพล็อตเส้นแนวโน้มบนแผนภูมิโดยไม่ต้องสร้างตารางข้อมูล

    รายการประเภทเส้นแนวโน้มที่เสนอค่อนข้างกว้าง และรายการนี้รวมถึงประเภทการถดถอยที่ใช้บ่อยที่สุด

    ความเป็นไปได้ในการทำนายพฤติกรรมของกระบวนการภายใต้การศึกษาสำหรับจำนวนก้าวไปข้างหน้าและข้างหลังโดยพลการ (ตามสามัญสำนึก)

    ความเป็นไปได้ที่จะได้รับสมการของเส้นแนวโน้มในรูปแบบการวิเคราะห์

    ความเป็นไปได้หากจำเป็นในการได้รับการประเมินความน่าเชื่อถือของการประมาณ

ข้อเสียรวมถึงประเด็นต่อไปนี้:

    การสร้างเส้นแนวโน้มจะดำเนินการก็ต่อเมื่อมีแผนภูมิที่สร้างขึ้นจากชุดข้อมูล

    กระบวนการสร้างชุดข้อมูลสำหรับคุณลักษณะที่ศึกษาตามสมการเส้นแนวโน้มที่ได้รับค่อนข้างรก: สมการถดถอยที่ต้องการจะได้รับการอัปเดตด้วยการเปลี่ยนแปลงค่าของชุดข้อมูลเดิมแต่ละครั้ง แต่เฉพาะภายในพื้นที่แผนภูมิ ในขณะที่ชุดข้อมูลสร้างขึ้นบนพื้นฐานของแนวโน้มสมการเส้นเก่า ยังคงไม่เปลี่ยนแปลง

    ในรายงาน PivotChart เมื่อคุณเปลี่ยนมุมมองแผนภูมิหรือรายงาน PivotTable ที่เกี่ยวข้อง เส้นแนวโน้มที่มีอยู่จะไม่ถูกเก็บไว้ ดังนั้นคุณต้องแน่ใจว่าเค้าโครงของรายงานตรงตามความต้องการของคุณ ก่อนที่คุณจะวาดเส้นแนวโน้มหรือจัดรูปแบบรายงาน PivotChart

คุณสามารถเพิ่มเส้นแนวโน้มลงในชุดข้อมูลที่แสดงบนแผนภูมิได้ เช่น กราฟ ฮิสโตแกรม แผนภูมิพื้นที่ที่ไม่อยู่ในเกณฑ์ปกติ แท่ง แผนภูมิกระจาย ฟองสบู่ และหุ้น

คุณไม่สามารถเพิ่มเส้นแนวโน้มให้กับชุดข้อมูลบนแผนภูมิสามมิติ มาตรฐาน เรดาร์ พาย และโดนัท

การใช้ฟังก์ชัน Excel ในตัว

Excel ยังมีเครื่องมือวิเคราะห์การถดถอยสำหรับการพล็อตเส้นแนวโน้มนอกพื้นที่แผนภูมิ สามารถใช้ฟังก์ชันเวิร์กชีตทางสถิติจำนวนหนึ่งเพื่อจุดประสงค์นี้ได้ แต่ฟังก์ชันทั้งหมดนี้อนุญาตให้คุณสร้างเฉพาะการถดถอยเชิงเส้นหรือแบบเอ็กซ์โปเนนเชียลเท่านั้น

Excel มีฟังก์ชันหลายอย่างสำหรับสร้างการถดถอยเชิงเส้น โดยเฉพาะ:

    แนวโน้ม;

  • ความชันและการตัด

เช่นเดียวกับหลายฟังก์ชันสำหรับการสร้างเส้นแนวโน้มเลขชี้กำลัง โดยเฉพาะอย่างยิ่ง:

    LGRFP ประมาณ

ควรสังเกตว่าเทคนิคในการสร้างการถดถอยโดยใช้ฟังก์ชัน TREND และ GROWTH นั้นเหมือนกันทุกประการ สามารถพูดได้เหมือนกันเกี่ยวกับคู่ของฟังก์ชัน LINEST และ LGRFPRIBL สำหรับฟังก์ชันทั้งสี่นี้ เมื่อสร้างตารางค่า จะใช้ฟีเจอร์ของ Excel เช่น สูตรอาร์เรย์ ซึ่งทำให้กระบวนการสร้างการถดถอยค่อนข้างรก เรายังทราบด้วยว่าการสร้างการถดถอยเชิงเส้นตามความเห็นของเรานั้นง่ายที่สุดในการดำเนินการโดยใช้ฟังก์ชัน SLOPE และ INTERCEPT โดยที่ฟังก์ชันแรกกำหนดความชันของการถดถอยเชิงเส้น และส่วนที่สองกำหนดส่วนที่ถูกตัดออกโดยการถดถอย บนแกน y

ข้อดีของเครื่องมือฟังก์ชันในตัวสำหรับการวิเคราะห์การถดถอยคือ:

    กระบวนการที่ค่อนข้างง่ายของการสร้างชุดข้อมูลประเภทเดียวกันของลักษณะเฉพาะที่กำลังศึกษาสำหรับฟังก์ชันทางสถิติในตัวทั้งหมดที่กำหนดเส้นแนวโน้ม

    เทคนิคมาตรฐานสำหรับการสร้างเส้นแนวโน้มตามชุดข้อมูลที่สร้างขึ้น

    ความสามารถในการทำนายพฤติกรรมของกระบวนการภายใต้การศึกษาสำหรับจำนวนก้าวที่ต้องการไปข้างหน้าหรือข้างหลัง

และข้อเสียคือ Excel ไม่มีฟังก์ชันในตัวสำหรับสร้างเส้นแนวโน้มประเภทอื่น (ยกเว้นเส้นตรงและเลขชี้กำลัง) สถานการณ์นี้มักจะไม่อนุญาตให้เลือกแบบจำลองที่ถูกต้องเพียงพอของกระบวนการภายใต้การศึกษา เช่นเดียวกับการได้รับการคาดการณ์ที่ใกล้เคียงกับความเป็นจริง นอกจากนี้ เมื่อใช้ฟังก์ชัน TREND และ GROW จะไม่ทราบสมการของเส้นแนวโน้ม

ควรสังเกตว่าผู้เขียนไม่ได้กำหนดเป้าหมายของบทความเพื่อนำเสนอหลักสูตรการวิเคราะห์การถดถอยที่มีระดับความสมบูรณ์ที่แตกต่างกัน งานหลักคือการแสดงความสามารถของแพ็คเกจ Excel ในการแก้ปัญหาการประมาณโดยใช้ตัวอย่างเฉพาะ สาธิตเครื่องมือที่มีประสิทธิภาพของ Excel ในการสร้างการถดถอยและการคาดการณ์ แสดงให้เห็นว่าปัญหาดังกล่าวสามารถแก้ไขได้ง่ายเพียงใดโดยผู้ใช้ที่ไม่มีความรู้เชิงลึกเกี่ยวกับการวิเคราะห์การถดถอย

ตัวอย่างการแก้ปัญหาเฉพาะหน้า

พิจารณาวิธีแก้ปัญหาเฉพาะโดยใช้เครื่องมือที่อยู่ในรายการของแพ็คเกจ Excel

งาน 1

พร้อมตารางข้อมูลกำไรของบริษัทขนส่งทางรถยนต์สำหรับปี 2538-2545 คุณต้องทำสิ่งต่อไปนี้

    สร้างแผนภูมิ

    เพิ่มเส้นแนวโน้มเชิงเส้นและพหุนาม (กำลังสองและลูกบาศก์) ลงในแผนภูมิ

    ใช้สมการเส้นแนวโน้ม รับข้อมูลแบบตารางเกี่ยวกับกำไรขององค์กรสำหรับแต่ละเส้นแนวโน้มสำหรับปี 2538-2547

    ทำการพยากรณ์กำไรสำหรับองค์กรสำหรับปี 2546 และ 2547

ทางออกของปัญหา

    ในช่วงของเซลล์ A4:C11 ของแผ่นงาน Excel เราป้อนแผ่นงานที่แสดงในรูปที่ สี่.

    เมื่อเลือกช่วงของเซลล์ B4:C11 แล้ว เราจึงสร้างแผนภูมิ

    เราเปิดใช้งานแผนภูมิที่สร้างขึ้นและใช้วิธีการที่อธิบายไว้ข้างต้น หลังจากเลือกประเภทของเส้นแนวโน้มในกล่องโต้ตอบเส้นแนวโน้ม (ดูรูปที่ 1) เราจะเพิ่มเส้นแนวโน้มเชิงเส้น สมการกำลังสอง และลูกบาศก์ลงในแผนภูมิ ในกล่องโต้ตอบเดียวกัน ให้เปิดแท็บ Parameters (ดูรูปที่ 2) ในฟิลด์ Name of the approximating (smoothed) curve field ป้อนชื่อของเทรนด์ที่จะเพิ่ม และใน Forecast forward for: periods field, set ค่า 2 เนื่องจากมีการวางแผนเพื่อคาดการณ์กำไรสำหรับสองปีข้างหน้า ในการแสดงสมการถดถอยและค่าความน่าเชื่อถือโดยประมาณ R2 ในพื้นที่ไดอะแกรม ให้เปิดใช้งานช่องทำเครื่องหมาย แสดงสมการบนหน้าจอ และวางค่าความน่าเชื่อถือโดยประมาณ (R^2) บนไดอะแกรม เพื่อการรับรู้ภาพที่ดีขึ้น เราเปลี่ยนประเภท สี และความหนาของเส้นแนวโน้มที่ลงจุด ซึ่งเราใช้แท็บมุมมองของกล่องโต้ตอบรูปแบบเส้นแนวโน้ม (ดูรูปที่ 3) แผนภูมิผลลัพธ์ที่มีเส้นแนวโน้มเพิ่มจะแสดงในรูปที่ 5.

    เพื่อรับข้อมูลแบบตารางเกี่ยวกับผลกำไรขององค์กรสำหรับแต่ละเทรนด์ไลน์สำหรับปี 2538-2547 ลองใช้สมการของเส้นแนวโน้มที่แสดงในรูป 5. เมื่อต้องการทำเช่นนี้ ในเซลล์ของช่วง D3:F3 ให้ป้อนข้อมูลที่เป็นข้อความเกี่ยวกับประเภทของเส้นแนวโน้มที่เลือก: แนวโน้มเชิงเส้น แนวโน้มกำลังสอง แนวโน้มลูกบาศก์ ถัดไป ป้อนสูตรการถดถอยเชิงเส้นในเซลล์ D4 และใช้เครื่องหมายเติม คัดลอกสูตรนี้พร้อมการอ้างอิงแบบสัมพัทธ์ไปยังช่วงของเซลล์ D5:D13 ควรสังเกตว่าแต่ละเซลล์ที่มีสูตรการถดถอยเชิงเส้นจากช่วงของเซลล์ D4:D13 มีเซลล์ที่สอดคล้องกันจากช่วง A4:A13 เป็นอาร์กิวเมนต์ ในทำนองเดียวกัน สำหรับการถดถอยกำลังสอง ช่วงของเซลล์ E4:E13 จะถูกเติม และสำหรับการถดถอยลูกบาศก์ ช่วงของเซลล์ F4:F13 จะถูกเติม ดังนั้นจึงมีการคาดการณ์ผลกำไรขององค์กรในปี 2546 และ 2547 กับ 3 เทรนด์ ตารางค่าผลลัพธ์จะแสดงในรูปที่ 6.

งาน2

    สร้างแผนภูมิ

    เพิ่มเส้นแนวโน้มลอการิทึม เลขชี้กำลัง และเลขชี้กำลังลงในแผนภูมิ

    หาสมการของเส้นแนวโน้มที่ได้รับ รวมทั้งค่าความน่าเชื่อถือโดยประมาณ R2 สำหรับแต่ละเส้น

    ใช้สมการเส้นแนวโน้ม รับข้อมูลแบบตารางเกี่ยวกับกำไรขององค์กรสำหรับแต่ละเส้นแนวโน้มสำหรับปี 2538-2545

    พยากรณ์กำไรสำหรับธุรกิจในปี 2546 และ 2547 โดยใช้เส้นแนวโน้มเหล่านี้

ทางออกของปัญหา

ตามวิธีการที่กำหนดไว้ในการแก้ปัญหาที่ 1 เราได้รับไดอะแกรมที่มีเส้นแนวโน้มลอการิทึม เลขชี้กำลัง และเส้นแนวโน้มแบบเอ็กซ์โปเนนเชียลเพิ่มเติม (รูปที่ 7) นอกจากนี้ โดยใช้สมการเส้นแนวโน้มที่ได้รับ เรากรอกตารางค่าสำหรับผลกำไรขององค์กร รวมถึงค่าที่คาดการณ์ไว้สำหรับปี 2546 และ 2547 (รูปที่ 8)

ในรูป 5 และรูปที่ จะเห็นได้ว่าแบบจำลองที่มีแนวโน้มลอการิทึมสอดคล้องกับค่าต่ำสุดของความน่าเชื่อถือโดยประมาณ

R2 = 0.8659

ค่าสูงสุดของ R2 สอดคล้องกับแบบจำลองที่มีแนวโน้มพหุนาม: กำลังสอง (R2 = 0.9263) และลูกบาศก์ (R2 = 0.933)

งาน3

ด้วยตารางข้อมูลเกี่ยวกับผลกำไรขององค์กรการขนส่งทางรถยนต์สำหรับปี 2538-2545 ที่ระบุในภารกิจที่ 1 คุณต้องทำตามขั้นตอนต่อไปนี้

    รับชุดข้อมูลสำหรับเส้นแนวโน้มเชิงเส้นและเลขชี้กำลังโดยใช้ฟังก์ชัน TREND และ GROW

    ใช้ฟังก์ชัน TREND และ GROWTH ในการพยากรณ์กำไรสำหรับองค์กรในปี 2546 และ 2547

    สำหรับข้อมูลเริ่มต้นและชุดข้อมูลที่ได้รับ ให้สร้างไดอะแกรม

ทางออกของปัญหา

ลองใช้แผ่นงาน 1 (ดูรูปที่ 4) เริ่มต้นด้วยฟังก์ชัน TREND:

    เลือกช่วงของเซลล์ D4:D11 ซึ่งควรเติมด้วยค่าของฟังก์ชัน TREND ที่สอดคล้องกับข้อมูลที่ทราบเกี่ยวกับผลกำไรขององค์กร

    เรียกคำสั่ง Function จากเมนู Insert ในกล่องโต้ตอบตัวช่วยสร้างฟังก์ชันที่ปรากฏขึ้น ให้เลือกฟังก์ชัน TREND จากประเภทสถิติ จากนั้นคลิกปุ่ม OK การดำเนินการเดียวกันสามารถทำได้โดยกดปุ่ม (ฟังก์ชั่นแทรก) ของแถบเครื่องมือมาตรฐาน

    ในกล่องโต้ตอบอาร์กิวเมนต์ของฟังก์ชันที่ปรากฏขึ้น ให้ป้อนช่วงของเซลล์ C4:C11 ในฟิลด์ Known_values_y ในฟิลด์ Known_values_x - ช่วงของเซลล์ B4:B11;

    ในการทำให้สูตรที่ป้อนเป็นสูตรอาร์เรย์ ให้ใช้คีย์ผสม + +

สูตรที่เราป้อนในแถบสูตรจะมีลักษณะดังนี้: =(TREND(C4:C11;B4:B11))

เป็นผลให้ช่วงของเซลล์ D4:D11 เต็มไปด้วยค่าที่สอดคล้องกันของฟังก์ชัน TREND (รูปที่ 9)

เพื่อคาดการณ์กำไรของบริษัทในปี 2546 และ 2547 จำเป็น:

    เลือกช่วงของเซลล์ D12:D13 ซึ่งจะป้อนค่าที่คาดการณ์โดยฟังก์ชัน TREND

    เรียกใช้ฟังก์ชัน TREND และในกล่องโต้ตอบอาร์กิวเมนต์ของฟังก์ชันที่ปรากฏขึ้น ให้ป้อนในฟิลด์ Known_values_y - ช่วงของเซลล์ C4:C11; ในฟิลด์ Known_values_x - ช่วงของเซลล์ B4:B11; และในฟิลด์ New_values_x - ช่วงของเซลล์ B12:B13

    เปลี่ยนสูตรนี้เป็นสูตรอาร์เรย์โดยใช้แป้นพิมพ์ลัด Ctrl + Shift + Enter

    สูตรที่ป้อนจะมีลักษณะดังนี้: =(TREND(C4:C11;B4:B11;B12:B13)) และช่วงของเซลล์ D12:D13 จะถูกเติมด้วยค่าที่คาดการณ์ไว้ของฟังก์ชัน TREND (ดูรูปที่ 9).

ในทำนองเดียวกัน ชุดข้อมูลจะถูกเติมโดยใช้ฟังก์ชัน GROWTH ซึ่งใช้ในการวิเคราะห์การพึ่งพาแบบไม่เชิงเส้นและทำงานเหมือนกับ TREND ที่เป็นคู่ขนานกันทุกประการ

รูปที่ 10 แสดงตารางในโหมดแสดงสูตร

สำหรับข้อมูลเริ่มต้นและชุดข้อมูลที่ได้รับ แผนภาพแสดงในรูปที่ สิบเอ็ด

งาน 4

ด้วยตารางข้อมูลเกี่ยวกับการรับแอปพลิเคชันสำหรับบริการโดยบริการจัดส่งขององค์กรการขนส่งทางรถยนต์สำหรับช่วงเวลาตั้งแต่วันที่ 1 ถึงวันที่ 11 ของเดือนปัจจุบันจะต้องดำเนินการดังต่อไปนี้

    รับชุดข้อมูลสำหรับการถดถอยเชิงเส้น: ใช้ฟังก์ชัน SLOPE และ INTERCEPT โดยใช้ฟังก์ชัน LINEST

    ดึงชุดข้อมูลสำหรับการถดถอยแบบเอ็กซ์โปเนนเชียลโดยใช้ฟังก์ชัน LYFFPRIB

    ใช้ฟังก์ชันข้างต้น คาดการณ์เกี่ยวกับการรับแอปพลิเคชันไปยังบริการจัดส่งสำหรับรอบระยะเวลาตั้งแต่วันที่ 12 ถึงวันที่ 14 ของเดือนปัจจุบัน

    สำหรับชุดข้อมูลเดิมและที่ได้รับ ให้สร้างไดอะแกรม

ทางออกของปัญหา

โปรดทราบว่าไม่เหมือนกับฟังก์ชัน TREND และ GROW ไม่มีฟังก์ชันใดที่แสดงด้านบน (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) ที่เป็นการถดถอย ฟังก์ชันเหล่านี้มีบทบาทเสริมเท่านั้นโดยกำหนดพารามิเตอร์การถดถอยที่จำเป็น

สำหรับการถดถอยเชิงเส้นและเอ็กซ์โปเนนเชียลที่สร้างขึ้นโดยใช้ฟังก์ชัน SLOPE, INTERCEPT, LINEST, LGRFPRIB จะทราบลักษณะที่ปรากฏของสมการเสมอ ตรงกันข้ามกับการถดถอยเชิงเส้นและเอ็กซ์โพเนนเชียลที่สอดคล้องกับฟังก์ชัน TREND และ GROWTH

1 . มาสร้างการถดถอยเชิงเส้นที่มีสมการกัน:

y=mx+b

การใช้ฟังก์ชัน SLOPE และ INTERCEPT โดยความชันของการถดถอย m ถูกกำหนดโดยฟังก์ชัน SLOPE และพจน์คงที่ b - โดยฟังก์ชัน INTERCEPT

ในการดำเนินการนี้ เราดำเนินการดังต่อไปนี้:

    ป้อนตารางแหล่งที่มาในช่วงของเซลล์ A4:B14;

    ค่าของพารามิเตอร์ m จะถูกกำหนดในเซลล์ C19 เลือกจากหมวดสถิติที่ฟังก์ชันความชัน ป้อนช่วงของเซลล์ B4:B14 ในฟิลด์ที่รู้จัก_values_y และช่วงของเซลล์ A4:A14 ในช่องที่รู้จัก_values_x สูตรจะถูกป้อนลงในเซลล์ C19: =SLOPE(B4:B14;A4:A14);

    โดยใช้วิธีการที่คล้ายกัน ค่าของพารามิเตอร์ b ในเซลล์ D19 จะถูกกำหนด และเนื้อหาของมันจะมีลักษณะดังนี้: = INTERCEPT(B4:B14;A4:A14) ดังนั้น ค่าของพารามิเตอร์ m และ b ซึ่งจำเป็นสำหรับการสร้างการถดถอยเชิงเส้น จะถูกเก็บไว้ในเซลล์ C19, D19 ตามลำดับ

    จากนั้นเราป้อนสูตรการถดถอยเชิงเส้นในเซลล์ C4 ในรูปแบบ: = $ C * A4 + $ D ในสูตรนี้ เซลล์ C19 และ D19 ถูกเขียนด้วยการอ้างอิงแบบสัมบูรณ์ (ที่อยู่ของเซลล์ไม่ควรเปลี่ยนแปลงเมื่อคัดลอกได้) สามารถพิมพ์เครื่องหมายอ้างอิงแบบสัมบูรณ์ $ จากแป้นพิมพ์หรือใช้ปุ่ม F4 หลังจากวางเคอร์เซอร์บนที่อยู่เซลล์ ใช้จุดจับเติม คัดลอกสูตรนี้ไปยังช่วงของเซลล์ C4:C17 เราได้รับชุดข้อมูลที่ต้องการ (รูปที่ 12) เนื่องจากจำนวนคำขอเป็นจำนวนเต็ม คุณควรตั้งค่ารูปแบบตัวเลขบนแท็บตัวเลขของหน้าต่างรูปแบบเซลล์ด้วยจำนวนตำแหน่งทศนิยมเป็น 0

2 . ทีนี้มาสร้างการถดถอยเชิงเส้นจากสมการกัน:

y=mx+b

โดยใช้ฟังก์ชัน LINEST

สำหรับสิ่งนี้:

    ป้อนฟังก์ชัน LINEST เป็นสูตรอาร์เรย์ในช่วงของเซลล์ C20:D20: =(LINEST(B4:B14;A4:A14)) เป็นผลให้เราได้รับค่าของพารามิเตอร์ m ในเซลล์ C20 และค่าของพารามิเตอร์ b ในเซลล์ D20

    ป้อนสูตรในเซลล์ D4: =$C*A4+$D;

    คัดลอกสูตรนี้โดยใช้เครื่องหมายเติมไปยังช่วงของเซลล์ D4:D17 และรับชุดข้อมูลที่ต้องการ

3 . เราสร้างการถดถอยแบบเลขชี้กำลังที่มีสมการ:

ด้วยความช่วยเหลือของฟังก์ชัน LGRFPRIBL จะดำเนินการในลักษณะเดียวกัน:

    ในช่วงของเซลล์ C21:D21 ให้ป้อนฟังก์ชัน LGRFPRIBL เป็นสูตรอาร์เรย์: =( LGRFPRIBL (B4:B14;A4:A14)) ในกรณีนี้ ค่าของพารามิเตอร์ m จะถูกกำหนดในเซลล์ C21 และค่าของพารามิเตอร์ b จะถูกกำหนดในเซลล์ D21

    สูตรถูกป้อนลงในเซลล์ E4: =$D*$C^A4;

    โดยใช้เครื่องหมายเติม สูตรนี้จะถูกคัดลอกไปยังช่วงของเซลล์ E4:E17 ซึ่งจะมีชุดข้อมูลสำหรับการถดถอยแบบเอ็กซ์โพเนนเชียล (ดูรูปที่ 12)

ในรูป 13 แสดงตารางที่เราสามารถดูฟังก์ชันต่างๆ ที่เราใช้กับช่วงเซลล์ที่จำเป็น ตลอดจนสูตรต่างๆ

ค่า R 2 เรียกว่า ค่าสัมประสิทธิ์การกำหนด.

งานในการสร้างการพึ่งพาการถดถอยคือการหาเวกเตอร์ของสัมประสิทธิ์ m ของแบบจำลอง (1) โดยที่สัมประสิทธิ์ R รับค่าสูงสุด

ในการประเมินความสำคัญของ R จะใช้ Fisher's F-test คำนวณโดยสูตร

ที่ไหน - ขนาดตัวอย่าง (จำนวนการทดลอง)

k คือจำนวนสัมประสิทธิ์แบบจำลอง

ถ้า F เกินค่าวิกฤตบางอย่างสำหรับ data และ kและระดับความเชื่อมั่นที่ยอมรับได้ ค่า R ถือว่ามีนัยสำคัญ ตารางค่าวิกฤตของ F มีให้ในหนังสืออ้างอิงเกี่ยวกับสถิติทางคณิตศาสตร์

ดังนั้น ความสำคัญของ R ไม่ได้ถูกกำหนดโดยค่าของมันเท่านั้น แต่ยังกำหนดโดยอัตราส่วนระหว่างจำนวนการทดลองกับจำนวนสัมประสิทธิ์ (พารามิเตอร์) ของแบบจำลองด้วย แท้จริงแล้ว อัตราส่วนสหสัมพันธ์สำหรับ n=2 สำหรับแบบจำลองเชิงเส้นอย่างง่ายคือ 1 (ถึง 2 จุดบนระนาบ คุณสามารถวาดเส้นตรงเส้นเดียวได้เสมอ) อย่างไรก็ตาม หากข้อมูลการทดลองเป็นตัวแปรสุ่ม ค่า R ดังกล่าวควรได้รับการไว้วางใจด้วยความระมัดระวังอย่างยิ่ง โดยปกติ เพื่อให้ได้ค่า R ที่มีนัยสำคัญและการถดถอยที่เชื่อถือได้ มีจุดมุ่งหมายเพื่อให้แน่ใจว่าจำนวนการทดลองจะเกินจำนวนสัมประสิทธิ์แบบจำลอง (n>k) อย่างมีนัยสำคัญ

เพื่อสร้างเส้นตรง ตัวแบบถดถอยจำเป็น:

1) เตรียมรายการ n แถวและ m คอลัมน์ที่มีข้อมูลการทดลอง (คอลัมน์ที่มีค่าผลลัพธ์ Yต้องเป็นคนแรกหรือคนสุดท้ายในรายการ) เช่น นำข้อมูลของงานก่อนหน้ามาเพิ่มคอลัมน์ชื่อ "เลขงวด" นับจำนวนงวดตั้งแต่ 1 ถึง 12 (นี่จะเป็นค่า X)

2) ไปที่เมนู Data/Data Analysis/Regression

หากรายการ "การวิเคราะห์ข้อมูล" ในเมนู "เครื่องมือ" หายไป คุณควรไปที่รายการ "เพิ่มเติม" ของเมนูเดียวกันและทำเครื่องหมายที่ช่อง "แพ็คเกจการวิเคราะห์"

3) ในกล่องโต้ตอบ "การถดถอย" ให้ตั้งค่า:

ช่วงอินพุต Y;

ช่วงเวลาอินพุต X;

ช่วงเอาต์พุต - เซลล์ด้านซ้ายบนของช่วงเวลาที่วางผลการคำนวณ (แนะนำให้วางบนแผ่นงานใหม่)

4) คลิก "ตกลง" และวิเคราะห์ผลลัพธ์

คำชี้แจงปัญหาการประมาณกำลังสองน้อยที่สุด เงื่อนไขสำหรับการประมาณที่ดีที่สุด

หากได้รับชุดข้อมูลการทดลองโดยมีข้อผิดพลาดที่สำคัญ การแก้ไขก็ไม่จำเป็นเท่านั้น แต่ยังไม่เป็นที่พึงปรารถนาอีกด้วย! ในที่นี้ จำเป็นต้องสร้างเส้นโค้งที่จะสร้างกราฟของความสม่ำเสมอในการทดลองดั้งเดิม นั่นคือ จะอยู่ใกล้กับจุดทดลองมากที่สุด แต่ในขณะเดียวกันก็จะไม่ตอบสนองต่อค่าเบี่ยงเบนแบบสุ่มของค่าที่วัดได้

มาแนะนำ ฟังก์ชันต่อเนื่อง φ(x)เพื่อประมาณการพึ่งพาที่ไม่ต่อเนื่อง ฉ(xผม ) , ผม = 0… . เราจะถือว่า φ(x)สร้างตามเงื่อนไข การประมาณกำลังสองที่ดีที่สุด, ถ้า

. (1)

น้ำหนัก ρ สำหรับ ผม-จุดที่ให้ความหมายกับความแม่นยำในการวัด ค่าที่กำหนด: ยิ่ง ρ ยิ่งเส้นโค้งที่ใกล้เคียง "ถูกดึงดูด" ให้เข้าใกล้จุดที่กำหนด ต่อไปนี้เราจะถือว่าโดยปริยาย ρ = 1 สำหรับทุกจุด

พิจารณาคดี การประมาณเชิงเส้น:

φ(x) = ค 0 φ 0 (x) + ค 1 φ 1 (x) + … + c m φ ม. (x), (2)

ที่ไหน φ 0 …φ m– โดยพลการ ฟังก์ชันพื้นฐาน, ค 0 …ค ม– ค่าสัมประสิทธิ์ที่ไม่รู้จัก < . หากใช้จำนวนสัมประสิทธิ์การประมาณ เท่ากับจำนวนนอต การประมาณรูท-ค่าเฉลี่ย-กำลังสองจะตรงกับการแก้ไขลากรองจ์ และหากเราไม่คำนึงถึงข้อผิดพลาดในการคำนวณ Q = 0.

หากทราบข้อผิดพลาดของข้อมูลการทดลอง (เริ่มต้น) ξ แล้วเลือกจำนวนของสัมประสิทธิ์ นั่นคือ ค่า ถูกกำหนดโดยเงื่อนไข:

กล่าวอีกนัยหนึ่ง ถ้า จำนวนสัมประสิทธิ์การประมาณไม่เพียงพอที่จะสร้างกราฟได้อย่างถูกต้อง การพึ่งพาการทดลอง. ถ้า สัมประสิทธิ์จำนวนมากใน (2) จะไม่มีความหมายทางกายภาพ

เพื่อแก้ปัญหาการประมาณเชิงเส้นใน กรณีทั่วไปจำเป็นต้องหาเงื่อนไขสำหรับผลรวมของค่าเบี่ยงเบนกำลังสองขั้นต่ำสำหรับ (2) ปัญหาการหาค่าต่ำสุดจะลดลงเหลือปัญหาการหารากของระบบสมการ k = 0…. (4) .

การแทนที่ (2) เป็น (1) แล้วคำนวณ (4) จะนำไปสู่ ระบบถัดไป พีชคณิตเชิงเส้นสมการ:

ต่อไป คุณควรแก้ SLAE ที่ได้เทียบกับสัมประสิทธิ์ ค 0 …ค ม. ในการแก้ SLAE มักจะคอมไพล์เมทริกซ์สัมประสิทธิ์แบบขยาย ซึ่งเรียกว่า แกรมเมทริกซ์ซึ่งมีองค์ประกอบคือ ดอท โปรดักส์ฟังก์ชันพื้นฐานและคอลัมน์ของสัมประสิทธิ์อิสระ:

,

ที่ไหน , , เจ = 0… m, k = 0….

หลังจากใช้ เช่น วิธีเกาส์ สัมประสิทธิ์ ค 0 …ค มคุณสามารถสร้างเส้นโค้งโดยประมาณหรือคำนวณพิกัด คะแนนที่กำหนด. ดังนั้น ปัญหาการประมาณจะได้รับการแก้ไข

การประมาณโดยพหุนามบัญญัติ

เราเลือกฟังก์ชันพื้นฐานในรูปแบบของลำดับของกำลังของอาร์กิวเมนต์ x:

φ 0 (x) = x0 = 1; ฟาย 1 (x) = x 1 = x; φ ม. (x) = x ม, < .

แกรมเมทริกซ์แบบขยายสำหรับฐานกำลังจะมีลักษณะดังนี้:

ลักษณะเฉพาะของการคำนวณเมทริกซ์ดังกล่าว (เพื่อลดจำนวนการกระทำที่ทำ) คือจำเป็นต้องนับเฉพาะองค์ประกอบของแถวแรกและสองคอลัมน์สุดท้าย: องค์ประกอบที่เหลือจะถูกเติมโดยเลื่อนแถวก่อนหน้า (ยกเว้น สองคอลัมน์สุดท้าย) โดยหนึ่งตำแหน่งทางซ้าย ในภาษาโปรแกรมบางภาษา ซึ่งไม่มีขั้นตอนการยกกำลังแบบเร็ว อัลกอริทึมสำหรับการคำนวณเมทริกซ์แกรมที่แสดงด้านล่างนั้นมีประโยชน์

การเลือกฟังก์ชั่นพื้นฐานในรูปแบบของพลัง x ไม่เหมาะสมในแง่ของการบรรลุข้อผิดพลาดที่น้อยที่สุด นี่คือผลที่ตามมา ไม่ใช่มุมฉากฟังก์ชันพื้นฐานที่เลือก คุณสมบัติ มุมฉากอยู่ในความจริงที่ว่าสำหรับพหุนามแต่ละประเภทมีส่วน [ x 0, x น] ซึ่งผลคูณสเกลาร์ของพหุนามที่มีลำดับต่างกันหายไป:

, เจk, pเป็นฟังก์ชันน้ำหนักบางอย่าง

หากฟังก์ชันพื้นฐานเป็นมุมฉาก องค์ประกอบนอกแนวทแยงทั้งหมดของเมทริกซ์แกรมจะใกล้เคียงกับศูนย์ ซึ่งจะช่วยเพิ่มความแม่นยำในการคำนวณ มิฉะนั้น ที่ ดีเทอร์มีแนนต์ของเมทริกซ์แกรมมีแนวโน้มเป็นศูนย์อย่างรวดเร็ว กล่าวคือ ระบบจะกลายเป็นเงื่อนไขที่ไม่ดี

การประมาณโดยพหุนามคลาสสิกตั้งฉาก

พหุนามต่อไปนี้ที่เกี่ยวข้องกับ พหุนามจาโคบีมีคุณสมบัติของความเป็นมุมฉากในความหมายข้างต้น นั่นคือเพื่อให้บรรลุ ความแม่นยำสูงการคำนวณ ขอแนะนำให้เลือกฟังก์ชันพื้นฐานสำหรับการประมาณในรูปของพหุนามเหล่านี้

การประมาณ (จากภาษาละติน "ประมาณ" - "แนวทาง") - นิพจน์โดยประมาณของวัตถุทางคณิตศาสตร์ใดๆ (เช่น ตัวเลขหรือฟังก์ชัน) ผ่านรูปแบบอื่นๆ ที่ง่ายกว่า สะดวกกว่า หรือเป็นที่รู้จักมากกว่า ในการวิจัยทางวิทยาศาสตร์ การประมาณใช้เพื่ออธิบาย วิเคราะห์ สรุป และใช้ผลลัพธ์เชิงประจักษ์เพิ่มเติม

ดังที่ทราบกันดีอยู่แล้วว่าอาจมีการเชื่อมต่อ (เชิงฟังก์ชัน) ที่แน่นอนระหว่างค่าต่างๆ เมื่อค่าหนึ่งค่าหนึ่งตรงกับค่าหนึ่งของอาร์กิวเมนต์

เมื่อเลือกการประมาณ ควรดำเนินการจากงานเฉพาะของการศึกษา โดยปกติ ยิ่งสมการที่ใช้สำหรับการประมาณค่าที่ง่ายกว่ามากเท่าใด คำอธิบายที่ได้รับของการพึ่งพาอาศัยกันก็จะยิ่งใกล้เคียงมากขึ้นเท่านั้น ดังนั้นจึงเป็นเรื่องสำคัญที่จะต้องอ่านว่ามีความสำคัญอย่างไรและอะไรทำให้เกิดการเบี่ยงเบนของค่าเฉพาะจากแนวโน้มที่เกิดขึ้น เมื่ออธิบายการขึ้นต่อกันของค่าที่กำหนดโดยสังเกตุ สามารถทำได้อย่างแม่นยำมากขึ้นโดยใช้สมการหลายพารามิเตอร์ที่ซับซ้อนกว่า อย่างไรก็ตาม มันไม่มีประโยชน์ที่จะพยายามถ่ายทอดค่าเบี่ยงเบนแบบสุ่มของค่าในชุดข้อมูลเชิงประจักษ์เฉพาะด้วยความแม่นยำสูงสุด เมื่อเลือกวิธีการประมาณค่า นักวิจัยมักจะประนีประนอม: เขาตัดสินใจว่าในกรณีนี้มันเหมาะสมและเหมาะสมที่จะ "เสียสละ" รายละเอียดและดังนั้นการพึ่งพาอาศัยกันของตัวแปรเปรียบเทียบควรแสดงออกอย่างไร นอกจากรูปแบบการเปิดเผยข้อมูลเชิงประจักษ์ที่ปิดบังด้วยการเบี่ยงเบนแบบสุ่มจากรูปแบบทั่วไป การประมาณยังช่วยแก้ปัญหาที่สำคัญอื่นๆ อีกหลายประการ: ทำให้การพึ่งพาที่พบนั้นเป็นแบบแผน ค้นหาค่าที่ไม่รู้จักของตัวแปรตามด้วยการประมาณค่าหรือประมาณการหากมี

วัตถุประสงค์ของหลักสูตรนี้คือการเรียน รากฐานทางทฤษฎีการประมาณฟังก์ชันแบบตารางโดยวิธีกำลังสองน้อยที่สุด แล้วใช้ ความรู้เชิงทฤษฎี, การหาพหุนามโดยประมาณ การหาค่าพหุนามโดยประมาณในกรอบงานของหลักสูตรนี้ทำได้โดยการเขียนโปรแกรมในภาษาปาสกาลซึ่งใช้อัลกอริธึมที่พัฒนาขึ้นเพื่อค้นหาสัมประสิทธิ์ของพหุนามการประมาณ และยังแก้ปัญหาเดียวกันโดยใช้ MathCad

ในหลักสูตรนี้ โปรแกรม Pascal ได้รับการพัฒนาใน PascalABC shell เวอร์ชัน 1.0 เบต้า การแก้ปัญหาในสภาพแวดล้อม MathCad ดำเนินการใน Mathcad เวอร์ชัน 14.0.0.163

การกำหนดปัญหา

ในรายวิชานี้ คุณต้องทำสิ่งต่อไปนี้:

1. พัฒนาอัลกอริธึมในการหาค่าสัมประสิทธิ์ของพหุนามโดยประมาณสามตัว (พหุนาม) ของแบบฟอร์ม

สำหรับฟังก์ชันแบบตาราง y=f(x):

สำหรับดีกรีของพหุนาม n=2, 4, 5

2. สร้างบล็อกไดอะแกรมของอัลกอริทึม

3. สร้างโปรแกรม Pascal ที่ใช้อัลกอริทึมที่พัฒนาขึ้น

5. สร้างกราฟของฟังก์ชันประมาณ 3 ฟังก์ชันที่ได้รับในระบบพิกัดเดียว กราฟจะต้องมีจุดเริ่มต้นด้วย (X ผม , ฉัน ) .

6. แก้ปัญหาโดยใช้ MathCAD

ผลลัพธ์ของการแก้ปัญหาโดยใช้โปรแกรมที่สร้างขึ้นในภาษา Pascal และในสภาพแวดล้อมของ MathCAD จะต้องนำเสนอในรูปแบบของพหุนามสามตัวที่สร้างโดยใช้สัมประสิทธิ์ที่พบ ตารางที่มีค่าของฟังก์ชันที่ได้รับโดยใช้พหุนามที่พบที่จุด xi และส่วนเบี่ยงเบนมาตรฐาน

การสร้างสูตรเชิงประจักษ์โดยวิธีกำลังสองน้อยที่สุด

บ่อยครั้ง โดยเฉพาะอย่างยิ่งเมื่อวิเคราะห์ข้อมูลเชิงประจักษ์ จำเป็นต้องค้นหาความสัมพันธ์เชิงฟังก์ชันระหว่างค่า x และ y อย่างชัดเจน ซึ่งได้มาจากการวัด

ในการศึกษาเชิงวิเคราะห์ของความสัมพันธ์ระหว่างปริมาณสองปริมาณ x และ y จะมีการสังเกตแบบต่อเนื่องและผลลัพธ์ที่ได้คือตารางค่า:

x ¼ ¼
y ¼ ¼

ตารางนี้มักจะได้มาจากการทดลองบางอย่างซึ่ง