Tiểu sử Đặc trưng Phân tích

Sử dụng phương pháp bình phương nhỏ nhất để tính gần đúng. Tính gần đúng của dữ liệu ban đầu theo phụ thuộc tuyến tính

CÔNG VIỆC KHÓA HỌC

ngành: Tin học

Chủ đề: Tính gần đúng của một hàm số bằng một phương pháp bình phương nhỏ nhất

Giới thiệu

1. Phát biểu vấn đề

2.Công thức tính toán

Tính toán bằng cách sử dụng các bảng được lập bởi các phương tiện Microsoft Excel

Lược đồ thuật toán

Tính toán trong MathCad

Kết quả tuyến tính

Trình bày kết quả dưới dạng đồ thị


Giới thiệu

Mục đích của khóa học là đào sâu kiến ​​thức về khoa học máy tính, phát triển và củng cố các kỹ năng làm việc với bảng tính Microsoft Excel và sản phẩm phần mềm MathCAD và ứng dụng của chúng để giải các bài toán bằng máy tính từ môn học liên quan đến nghiên cứu.

Tính gần đúng (từ tiếng Latinh "gần đúng" - "cách tiếp cận") - một biểu thức gần đúng của bất kỳ các đối tượng toán học(ví dụ: số hoặc hàm) thông qua những cái khác đơn giản hơn, dễ sử dụng hơn hoặc đơn giản là được biết đến nhiều hơn. TẠI nghiên cứu khoa học xấp xỉ được sử dụng để mô tả, phân tích, tổng quát hóa và sử dụng thêm các kết quả thực nghiệm.

Như đã biết, có thể có một kết nối chính xác (chức năng) giữa các giá trị, khi một giá trị của đối số tương ứng với một giá trị cụ thể và kết nối kém chính xác hơn (tương quan), khi một giá trị cụ thể của đối số tương ứng với một giá trị gần đúng hoặc một số tập hợp các giá trị hàm ít nhiều gần nhau. Khi tiến hành nghiên cứu khoa học, xử lý kết quả của một quan sát hoặc thí nghiệm, bạn thường phải đối mặt với lựa chọn thứ hai.

Khi nghiên cứu sự phụ thuộc định lượng của các chỉ số khác nhau, các giá trị của chúng được xác định theo kinh nghiệm, như một quy luật, có một số thay đổi. Nó được xác định một phần bởi tính không đồng nhất của các đối tượng nghiên cứu là vật vô tri vô giác và đặc biệt là bản chất sống, và một phần do lỗi quan sát và xử lý định lượng vật liệu. Không phải lúc nào cũng có thể loại bỏ hoàn toàn thành phần cuối cùng; nó chỉ có thể được giảm thiểu bằng cách lựa chọn cẩn thận một phương pháp nghiên cứu thích hợp và độ chính xác của công việc. Do đó, khi thực hiện bất kỳ công việc nghiên cứu nào, vấn đề nảy sinh là xác định bản chất thực sự của sự phụ thuộc của các chỉ số được nghiên cứu, mức độ này hoặc mức độ kia bị che lấp bởi việc bỏ qua tính biến thiên: các giá trị. Đối với điều này, tính gần đúng được sử dụng - một mô tả gần đúng về sự phụ thuộc tương quan của các biến bằng một phương trình phụ thuộc hàm phù hợp truyền tải xu hướng chính của sự phụ thuộc (hoặc "xu hướng" của nó).

Khi chọn một giá trị gần đúng, người ta nên tiến hành từ nhiệm vụ cụ thể của nghiên cứu. Thông thường, phương trình dùng để tính gần đúng càng đơn giản thì mô tả về sự phụ thuộc thu được càng gần đúng. Do đó, điều quan trọng là phải đọc mức độ quan trọng và điều gì đã gây ra sự sai lệch của các giá trị cụ thể so với xu hướng kết quả. Khi mô tả sự phụ thuộc theo kinh nghiệm giá trị nhất định có thể đạt được độ chính xác cao hơn nhiều bằng cách sử dụng một số phương trình tham số. Tuy nhiên, không ích lợi gì khi cố gắng truyền tải độ lệch ngẫu nhiên của các giá trị trong chuỗi dữ liệu thực nghiệm cụ thể với độ chính xác tối đa. Điều quan trọng hơn là phải nắm được mô hình chung, trong đó trường hợp này một cách logic nhất và với độ chính xác có thể chấp nhận được được biểu thị chính xác bằng phương trình hai tham số chức năng quyền lực. Do đó, khi lựa chọn một phương pháp xấp xỉ, nhà nghiên cứu luôn thỏa hiệp: anh ta quyết định mức độ phù hợp và thích hợp trong trường hợp này để “hy sinh” các chi tiết và theo đó, mức độ khái quát của sự phụ thuộc của các biến được so sánh nên được thể hiện như thế nào. Cùng với việc xác định các mẫu được ngụy trang sai lệch ngẫu nhiên bằng chứng thực nghiệm từ Mô hình chung, tính gần đúng cũng cho phép giải quyết nhiều nhiệm vụ quan trọng: chính thức hóa sự phụ thuộc được tìm thấy; để tìm giá trị không xác định biến phụ thuộc bằng cách nội suy hoặc, nếu có, phép ngoại suy.

Trong mỗi nhiệm vụ, các điều kiện của vấn đề, dữ liệu ban đầu, hình thức đưa ra kết quả được xây dựng, các phụ thuộc toán học chính để giải quyết vấn đề được chỉ ra. Phù hợp với phương pháp giải bài toán, một thuật toán giải được phát triển, được trình bày dưới dạng đồ họa.

1. Phát biểu vấn đề

1. Sử dụng phương pháp bình phương nhỏ nhất, tính gần đúng hàm cho trong bảng:

a) một đa thức bậc nhất;

b) một đa thức bậc hai;

c) sự phụ thuộc vào cấp số nhân.

Đối với mỗi sự phụ thuộc, hãy tính hệ số xác định.

Tính hệ số tương quan (chỉ trong trường hợp a).

Vẽ một đường xu hướng cho mỗi sự phụ thuộc.

Sử dụng hàm LINEST tính toán đặc điểm số phụ thuộc vào.

So sánh các phép tính của bạn với kết quả thu được bằng hàm LINEST.

Quyết định công thức nào cách tốt nhất xấp xỉ hàm.

Viết chương trình bằng một trong các ngôn ngữ lập trình và so sánh kết quả tính toán với kết quả thu được ở trên.

Tùy chọn 3. Chức năng được đưa ra trong Bảng. một.

Bảng 1.

xyxyxyxyxy0.281.052.349.113.3329.434.2386.445.55187.540.872.872.6516.863.4137.454.8390.856.32200.451.656.432.7717.973.5542.444.9299.066.66212.971.998.962.872.6516.863.4137.454.8390.856.32200.451.656.432.7717.973.5542.444.9299.066.66212.971.998.962.8318.993.8556.085.183.083.062.8318.993.8556.945.183.083.057.1756. 25321,43

2. Các công thức tính toán

Thông thường, khi phân tích dữ liệu thực nghiệm, cần phải tìm ra mối quan hệ hàm số giữa các giá trị của x và y, những giá trị này thu được do kinh nghiệm hoặc phép đo.

Xi ( biến độc lập) do người thử nghiệm thiết lập và yi, được gọi là giá trị thực nghiệm hoặc thực nghiệm, nhận được do kết quả của thử nghiệm.

Dạng phân tích của sự phụ thuộc hàm tồn tại giữa các giá trị x và y thường không xác định, do đó, một nhiệm vụ thực tế quan trọng nảy sinh - tìm một công thức thực nghiệm

(các tham số ở đâu), các giá trị có thể sẽ khác một chút so với các giá trị thử nghiệm.

Theo phương pháp bình phương nhỏ nhất, các hệ số tốt nhất là hệ số mà tổng các độ lệch bình phương của hàm thực nghiệm tìm được từ thiết lập các điểm các chức năng sẽ được tối thiểu hóa.

Sử dụng Điều kiện cần thiết cực trị của một hàm nhiều biến - bằng 0 của đạo hàm riêng, tìm một tập hợp các hệ số cung cấp giá trị cực tiểu của hàm được xác định bởi công thức (2) và nhận được hệ thống bình thườngđể xác định các hệ số:

Do đó, việc tìm các hệ số rút gọn để giải hệ (3).

Loại hệ thống (3) phụ thuộc vào lớp nào Công thức thực nghiệm chúng tôi đang tìm kiếm sự phụ thuộc (1). Trong trường hợp phụ thuộc tuyến tính, hệ (3) sẽ có dạng:

Trong trường hợp phụ thuộc bậc hai, hệ (3) sẽ có dạng:

Trong một số trường hợp, như một công thức thực nghiệm, một hàm được sử dụng trong đó các hệ số không chắc chắn nhập vào không tuyến tính. Trong trường hợp này, đôi khi vấn đề có thể được tuyến tính hóa, tức là giảm xuống tuyến tính. Trong số những sự phụ thuộc đó là sự phụ thuộc theo cấp số nhân

trong đó a1 và a2 là các hệ số không xác định.

Sự tuyến tính hóa đạt được bằng cách lấy hằng đẳng thức logarit (6), sau đó chúng ta thu được quan hệ

Ký hiệu và, tương ứng, bởi và, khi đó sự phụ thuộc (6) có thể được viết dưới dạng cho phép chúng ta áp dụng công thức (4) với a1 được thay thế bởi và bởi.

Đồ thị của sự phụ thuộc hàm đã phục hồi y (x) dựa trên kết quả của các phép đo (xi, yi), i = 1,2,…, n được gọi là đường cong hồi quy. Để kiểm tra sự phù hợp của đường cong hồi quy đã xây dựng với kết quả của thực nghiệm, người ta thường đưa ra các đặc trưng số sau: hệ số tương quan (phụ thuộc tuyến tính), tỷ lệ tương quan và hệ số xác định.

Hệ số tương quan là thước đo mối quan hệ tuyến tính giữa phụ thuộc biến ngẫu nhiên: nó cho thấy mức độ trung bình, một trong các đại lượng có thể được biểu diễn dưới dạng hàm tuyến tính của đại lượng kia.

Hệ số tương quan được tính theo công thức:

trung bình ở đâu giá trị số học tương ứng theo x, y.

Hệ số tương quan giữa các biến ngẫu nhiên không vượt quá 1 về giá trị tuyệt đối, càng gần 1 thì càng gần kết nối tuyến tính giữa x và y.

Trong trường hợp tương quan phi tuyến tính, các giá trị trung bình có điều kiện nằm gần đường cong. Trong trường hợp này, như là một đặc trưng của độ bền của kết nối, nên sử dụng tỷ số tương quan, việc giải thích tỷ số này không phụ thuộc vào loại phụ thuộc đang nghiên cứu.

Tỷ lệ tương quan được tính theo công thức:

trong đó tử số đặc trưng cho sự phân tán của các giá trị trung bình có điều kiện xung quanh giá trị trung bình không điều kiện.

Luôn luôn. Bình đẳng = tương ứng với các biến ngẫu nhiên không tương quan; = nếu và chỉ khi có một mối quan hệ hàm chính xác giữa x và y. Trong trường hợp phụ thuộc tuyến tính của y vào x, tỷ lệ tương quan trùng với bình phương của hệ số tương quan. Giá trị được sử dụng như một chỉ báo về độ lệch của hồi quy so với tuyến tính.

Tỷ lệ tương quan là thước đo mối tương quan y c x ở bất kỳ dạng nào, nhưng không thể đưa ra ý tưởng về mức độ gần gũi của dữ liệu thực nghiệm với một dạng đặc biệt. Để tìm hiểu mức độ chính xác của đường cong được xây dựng phản ánh dữ liệu thực nghiệm, một đặc tính nữa được giới thiệu - hệ số xác định.


nơi Sost = - dư lượng hình vuông, đặc trưng cho độ lệch của dữ liệu thực nghiệm so với dữ liệu lý thuyết. full - tổng cộng hình vuông, trong đó giá trị trung bình là yi.

Tổng hồi quy của các bình phương đặc trưng cho sự trải rộng của dữ liệu.

Tổng số dư của các bình phương càng nhỏ so với Tổng số lượng hình vuông, chủ đề giá trị hơn hệ số xác định r2, cho thấy phương trình thu được tốt như thế nào khi sử dụng Phân tích hồi quy, giải thích các mối quan hệ giữa các biến. Nếu nó bằng 1, thì có mối tương quan hoàn toàn với mô hình, tức là không có sự khác biệt giữa giá trị y thực tế và ước tính. Ngược lại, nếu hệ số xác định là 0, thì phương trình hồi quy không dự đoán được các giá trị y.

Hệ số xác định luôn không vượt quá tỷ lệ tương quan. Trong trường hợp thỏa mãn đẳng thức, thì chúng ta có thể giả định rằng công thức thực nghiệm đã xây dựng phản ánh chính xác nhất dữ liệu thực nghiệm.

3. Tính toán bằng bảng được tạo bằng Microsoft Excel

Để tính toán, nên sắp xếp các số liệu dưới dạng bảng 2, sử dụng các phương bộ xử lý bảng tính Microsoft Excel.

ban 2

ABCDEFGHI10,281,050,07840,2940,0219520,0061470,082320,048790,01366120,872,870,75692,49690,6585030,5728982,1723031,0543120,91725131,656,432,722510,60954,4921257,41200617,501755681,81200617,505681.800617.505681.800617.505681.800617.50 998,963,960117,83047,88059915,6823935,48252,192774,36361352,088,084,326416,80648,99891218,7177434,957312,0893924,34593562,349,115,475621,317412,812929,982249,882722,2093735 867,022544,67918,6096349,31551118,39942,8249447,48610182,7717,977,672949,776921,2539358,87339137,8822,8887048,00170992,8318,998,008953,741722,6651964,14248152,0892,9 331272103,0623,759,363672,67528,6526287,677222,38553,1675839,692803113,3329,4311,088998,001936,92604122,9637326,34633,38201511,26211123,4137,4511,6281127,2135,274,674 47233.62300712.35445133,5542,4412,6025150,66244,73888158,823534,85013,74809113.30572143,8556,9414,8225219,21957,06663219,7065843,99324,04199815,56169154,0175,0816708801304,0175,081670801 4812258.56961207,2944,31855417,3174164,2386,4417,8929365,641275,68697320,15591546,6624,45945 118,86348174,8390,8523,3289438,8055112,6786544,23762119,4314,5092121,77948184,9299,0624,2064487,3752119,0955585,94982397,8864,59572622,61097195,14120,4526,419,76619,113135135,76619,113135 99533182,2414,79123524,62695205,23139,6527,3529730,3695143,0557748,18113819,8324,93913925,8317215,55187,5430,80251040,847170,9539948,7945776,7015,23399229,0481266226,7015,23399229,0481266226,7015,23399229,0481266226 844252.4361595.3958006.4545.30056533.49957236.66212,9744.35561418.38295.40831967,4199446,4125.36115135.70527247.13275,7450.83691966.026362.46712584.3914017.775.61945840.032174, 4352.56252330.368381.07812762.81616895.165.7727841.852652695.932089.99453.310511850.652417.56813982.9971327.3490.97713415.0797 Hãy để chúng tôi giải thích Bảng 2 được biên soạn như thế nào.

Bước 1. Tại các ô A1: A25 ta nhập các giá trị xi.

Bước 2. Tại các ô B1: B25, chúng ta nhập các giá trị của yi.

Bước 3. Trong ô C1, nhập công thức = A1 ^ 2.

Bước 4. Công thức này được sao chép vào các ô C1: C25.

Bước 5. Trong ô D1, nhập công thức = A1 * B1.

Bước 6. Công thức này được sao chép vào các ô D1: D25.

Bước 7. Trong ô F1, nhập công thức = A1 ^ 4.

Bước 8. Trong các ô F1: F25, công thức này được sao chép.

Bước 9. Trong ô G1, nhập công thức = A1 ^ 2 * B1.

Bước 10. Công thức này được sao chép vào các ô G1: G25.

Bước 11. Trong ô H1, nhập công thức = LN (B1).

Bước 12. Công thức này được sao chép vào các ô H1: H25.

Bước 13. Trong ô I1, nhập công thức = A1 * LN (B1).

Bước 14. Công thức này được sao chép vào các ô I1: I25.

Chúng tôi thực hiện các bước sau bằng cách sử dụng tính năng tự động thông báo S .

Bước 15. Trong ô A26, nhập công thức = SUM (A1: A25).

Bước 16. Trong ô B26, nhập công thức = SUM (B1: B25).

Bước 17. Trong ô C26, nhập công thức = SUM (C1: C25).

Bước 18. Trong ô D26, nhập công thức = SUM (D1: D25).

Bước 19. Trong ô E26, nhập công thức = SUM (E1: E25).

Bước 20. Trong ô F26, nhập công thức = SUM (F1: F25).

Bước 21. Trong ô G26, nhập công thức = SUM (G1: G25).

Bước 22. Trong ô H26, nhập công thức = SUM (H1: H25).

Bước 23. Trong ô I26, nhập công thức = SUM (I1: I25).

Chúng tôi ước tính hàm hàm tuyến tính. Để xác định các hệ số và chúng tôi sử dụng hệ thống (4). Sử dụng tổng của Bảng 2, nằm trong các ô A26, B26, C26 và D26, chúng tôi viết hệ thống (4) là

giải quyết mà, chúng tôi nhận được và.

Hệ thống đã được giải quyết bằng phương pháp Cramer. Bản chất của nó là như sau. Xét một hệ đại số n Các phương trình tuyến tính với n ẩn số:

Yếu tố quyết định hệ thống là yếu tố quyết định ma trận hệ thống:

Ký hiệu - định thức sẽ nhận được từ định thức của hệ Δ bằng cách thay thế cột thứ j bằng cột

Do đó, xấp xỉ tuyến tính có dạng

Chúng tôi giải quyết hệ thống (11) bằng công cụ Microsoft Excel. Kết quả được trình bày trong bảng 3.

bàn số 3

ABCDE282595.932089.992995.93453.310511850.653031

Trong bảng 3, các ô A32: B33 chứa công thức (= MOBR (A28: B29)).

Các ô E32: E33 chứa công thức (= MULTI (A32: B33), (C28: C29)).

Tiếp theo, chúng tôi ước tính hàm hàm bậc hai. Để xác định các hệ số a1, a2 và a3, ta sử dụng hệ thức (5). Sử dụng tổng của bảng 2, nằm trong các ô A26, B26, C26, D26, E26, F26, G26, chúng tôi viết hệ thống (5) là

giải quyết cái đó, chúng ta nhận được a1 = 10,663624, và

Như vậy, xấp xỉ bậc hai có dạng

Chúng tôi giải quyết hệ thống (16) bằng các công cụ Microsoft Excel. Kết quả được trình bày trong bảng 4.

Bảng 4

ABCDEF362595,93453,31052089,993795,93453,31052417,56811850,65538453,31052417,56813982.9971327,3453940Obratnaya matritsa410,632687-0,314390,033846a1 = 10,66362442-0,314390,184534-0 924512430.033846-0.021710.002728a3 = 8.0272305

Trong Bảng 4, các ô A41: C43 chứa công thức (= MOBR (A36: C38)).

Các ô F41: F43 chứa công thức (= MMULT (A41: C43), (D36: D38)).

Bây giờ chúng ta xấp xỉ hàm bằng một hàm số mũ. Để xác định các hệ số và lấy logarit của các giá trị và sử dụng các tổng của Bảng 2, nằm trong các ô A26, C26, H26 và I26, chúng ta có được hệ thống

Giải hệ thống (18), chúng tôi nhận được và.

Sau khi phân áp, chúng tôi nhận được

Do đó, xấp xỉ hàm mũ có dạng

Chúng tôi giải quyết hệ thống (18) bằng cách sử dụng các công cụ Microsoft Excel. Kết quả được trình bày trong bảng 5.

Bảng 5

BCDEF462595.9390.977134795.93453.3105415.07974849 Ma trận nghịch đảo = 0.667679 500.212802-0.04503a2 = 0.774368 51-0.045030.011736a1 = 1.949707

Các ô A50: B51 chứa công thức (= MOBR (A46: B47)).

Ô E51 chứa công thức = EXP (E49).

Tính trung bình cộng và theo công thức:

Kết quả tính toán và các công cụ Microsoft Excel được trình bày trong Bảng 6.

Bảng 6

BC54Xav = 3,837255Yav = 83,5996

Ô B54 chứa công thức = A26 / 25.

Ô B55 chứa công thức = B26 / 25

Bảng 7

ABJKLMNO10,281,05293,645412,653676814,4365987,97624,444081,88177520,872,87239,54098,8042766517,2682774,7226,7334610,91071731,656,43168,78534,7838445955,147448,035726,3955,147448,035726,395 998,96137,87433,4121485571,0770,7358817,368220,02062652,088,08132,7033,0877525703,2112,138714,2039422,82478262,349,11111,52582,2416085548,70151,488211,4985887,9958427, 8679,233251.4094444454,174178,5730,000622,83382582,7717,9770,039911,1389164307,244311,46313,4777091,73059692,8318,9965,074791,0144524174,4373,4915,7914362,382273103,0 515110,604043581,975620,344117,375498,423061113,3329,4327,474820,2572522934,346983,819852,2462113,94466123,4137,4519,715110,18252129,786725,90914.090409102,2541111 0824841694,113797,89844,861044143,3219143,8556,94-0,341240,000164710,7343741,750,023142342,3946154,0175,08-1,472190,0298672,58358265,3212126,0007996,9257164,2386,441, 1157090.1542928.067872219.6288148.75781214.778174.8390.857 1.172456239.0241103.718163.9776121.868195.14120.4548.00871,6972881357,952471,908425,17881258,6007205,23139,6578,0671,9398923141,64743,1629470,45155769,9408215,55187 93368410803,61725,38421200,5291951,06226,32200,45290,11626,16429613654,0227,28786126,28273577,409236,66212,97365,18687,968216736,76,038755767,788515795,87247,1379910,746 931944,47565,1469344766,92257,25321,43811,667611,647256563,37121,842677,966445516,82695,932089,93830,94585,207919964427404,823786,286115678,1S tính bằng m yOstatochnye summyXY tiếp xúc vuông tuyến tính

Hãy giải thích nó được tạo ra như thế nào.

Các ô A1: A26 và B1: B26 đã được điền.

Bước 1. Trong ô J1, nhập công thức = (A1- $ B $ 54) * (B1- $ B $ 55).

Bước 2. Công thức này được sao chép vào các ô J2: J25.

Bước 3. Trong ô K1, nhập công thức = (A1- $ B $ 54) ^ 2.

Bước 4. Công thức này được sao chép vào các ô k2: K25.

Bước 5. Trong ô L1, nhập công thức = (B1- $ B $ 55) ^ 2.

Bước 6. Công thức này được sao chép vào các ô L2: L25.

Bước 7. Trong ô M1, nhập công thức = ($ E $ 32 + $ E $ 33 * A1-B1) ^ 2.

Bước 8. Công thức này được sao chép vào các ô M2: M25.

Bước 9. Trong ô N1, nhập công thức = ($ F $ 41 + $ F $ 42 * A1 + $ F $ 43 * A1 ^ 2-B1) ^ 2.

Bước 10. Trong các ô N2: N25, công thức này được sao chép.

Bước 11. Trong ô O1, nhập công thức = ($ E $ 51 * EXP ($ E $ 50 * A1) -B1) ^ 2.

Bước 12. Trong các ô O2: O25, công thức này được sao chép.

Chúng tôi thực hiện các bước sau bằng cách sử dụng tự động tổng kết S .

Bước 13. Trong ô J26, nhập công thức = SUM (J1: J25).

Bước 14. Trong ô K26, nhập công thức = SUM (K1: K25).

Bước 15. Trong ô L26, nhập công thức = SUM (L1: L25).

Bước 16. Trong ô M26, nhập công thức = SUM (M1: M25).

Bước 17. Trong ô N26, nhập công thức = SUM (N1: N25).

Bước 18. Trong ô O26, nhập công thức = SUM (O1: O25).

Bây giờ chúng ta hãy tính hệ số tương quan bằng cách sử dụng công thức (8) (chỉ cho phép gần đúng tuyến tính) và hệ số xác định bằng cách sử dụng công thức (10). Kết quả tính toán bằng Microsoft Excel được trình bày trong Bảng 8.

Bảng 8

AB57 Hệ số tương quan 0,92883358 Hệ số xác định (xấp xỉ tuyến tính) 0,8627325960 Hệ số xác định (xấp xỉ bậc hai) 0,9810356162 Hệ số xác định (xấp xỉ hàm mũ) 0,42057863 Ô E57 chứa công thức = J26 / (K26 * L26) ^ (1/2).

Ô E59 chứa công thức = 1-M26 / L26.

Ô E61 chứa công thức = 1-N26 / L26.

Ô E63 chứa công thức = 1-O26 / L26.

Phân tích kết quả tính toán cho thấy rằng phép gần đúng bậc hai mô tả tốt nhất dữ liệu thực nghiệm.

Lược đồ thuật toán

Cơm. 1. Lược đồ của thuật toán cho chương trình tính toán.

5. Tính toán trong MathCad

Hồi quy tuyến tính

· dòng (x, y) - vectơ hai phần tử (b, a) của hệ số hồi quy tuyến tính b + ax;

· x là véc tơ dữ liệu thực của đối số;

· y là một vector các giá trị dữ liệu thực có cùng kích thước.

Hình 2.

Hồi quy đa thức có nghĩa là khớp dữ liệu (x1, y1) với một đa thức độ kĐối với k = i, đa thức là một đường thẳng, với k = 2, nó là một parabol, với k = 3, nó là một parabol bậc ba, v.v. Theo quy định, k<5.

· regress (x, y, k) - véc tơ các hệ số để xây dựng hồi quy dữ liệu đa thức;

· interp (s, x, y, t) - kết quả của hồi quy đa thức;

· s = hồi quy (x, y, k);

· x là một vector dữ liệu đối số thực, có các phần tử được sắp xếp theo thứ tự tăng dần;

· y là một vector các giá trị dữ liệu thực có cùng kích thước;

· k là bậc của đa thức hồi quy (một số nguyên dương);

· t là giá trị của đối số của đa thức hồi quy.

Hình 3

Ngoài những điều được xem xét, một số kiểu hồi quy ba tham số khác được tích hợp vào Mathcad, cách triển khai của chúng hơi khác so với các tùy chọn hồi quy ở trên ở chỗ đối với chúng, ngoài mảng dữ liệu, cần phải đặt một số giá trị ban đầu Của các hệ số a, b, c. Sử dụng kiểu hồi quy thích hợp nếu bạn biết rõ về sự phụ thuộc nào mô tả mảng dữ liệu của bạn. Khi kiểu hồi quy không phản ánh tốt chuỗi dữ liệu, thì kết quả của nó thường không đạt yêu cầu và thậm chí rất khác nhau tùy thuộc vào sự lựa chọn của các giá trị ban đầu. Mỗi hàm tạo ra một vectơ gồm các tham số đã được tinh chỉnh a, b, c.

Kết quả LINEST

Xem xét mục đích của hàm LINEST.

Hàm này sử dụng phương pháp bình phương nhỏ nhất để tính đường thẳng phù hợp nhất với dữ liệu có sẵn.

Hàm trả về một mảng mô tả dòng kết quả. Phương trình của một đường thẳng là:

M1x1 + m2x2 + ... + b hoặc y = mx + b,

phần mềm microsoft dạng bảng thuật toán

Để nhận được kết quả, bạn cần tạo một công thức bảng tính sẽ kéo dài 5 hàng và 2 cột. Khoảng này có thể được đặt ở bất kỳ đâu trên trang tính. Trong khoảng thời gian này, bạn cần nhập hàm LINEST.

Do đó, tất cả các ô của khoảng A65: B69 sẽ được lấp đầy (như thể hiện trong Bảng 9).

Bảng 9

АВ6544,95997-88,9208663,73946615,92346670,86273234,5183168144,55492369172239,227404,82

Hãy để chúng tôi giải thích mục đích của một số đại lượng trong Bảng 9.

Các giá trị nằm trong ô A65 và B65 lần lượt đặc trưng cho độ dốc và độ dịch chuyển. - Hệ số xác định - Giá trị quan sát F. - số bậc tự do.

Trình bày kết quả dưới dạng đồ thị

Cơm. 4. Đồ thị xấp xỉ tuyến tính

Cơm. 5. Đồ thị xấp xỉ bậc hai

Cơm. 6. Lô xấp xỉ hàm mũ

phát hiện

Hãy để chúng tôi đưa ra kết luận dựa trên kết quả của dữ liệu thu được.

Phân tích kết quả tính toán cho thấy rằng phép gần đúng bậc hai mô tả tốt nhất dữ liệu thực nghiệm, vì đường xu hướng cho nó phản ánh chính xác nhất hành vi của chức năng trong khu vực này.

So sánh các kết quả nhận được bằng cách sử dụng hàm LINEST, chúng tôi thấy rằng chúng hoàn toàn trùng khớp với các tính toán đã thực hiện ở trên. Điều này chỉ ra rằng các tính toán là chính xác.

Kết quả nhận được bằng chương trình MathCad hoàn toàn phù hợp với các giá trị đã cho ở trên. Điều này cho thấy tính đúng đắn của các phép tính.

Thư mục

  1. B.P. Demidovich, I.A. Bỏ rơi. Cơ bản của Toán tính toán. M: Nhà xuất bản nhà nước về tài liệu vật lý và toán học.
  2. Tin học: Sách giáo khoa, chủ biên. hồ sơ N.V. Makarova. M: Tài chính và thống kê, 2007.
  3. Tin học: Hội thảo về công nghệ máy tính, ed. hồ sơ N.V. Makarova. M: Tài chính và thống kê, 2010.
  4. V.B. Komyagin. Lập trình trong Excel trong Visual Basic. M: Đài phát thanh và truyền thông, 2007.
  5. N. Nicol, R. Albrecht. Excel. Bảng tính. M: Ed. "ECOM", 2008.
  6. Hướng dẫn thực hiện các môn học về khoa học máy tính (dành cho sinh viên khoa văn thư của tất cả các chuyên ngành), ed. Zhurova G. N., SPbGGI (TU), 2011.

Sự gần đúng, hoặc sự xấp xỉ- một phương pháp khoa học bao gồm việc thay thế một số đối tượng bằng những đối tượng khác, theo nghĩa này hay nghĩa khác gần với nguyên bản, nhưng đơn giản hơn.

Phép tính gần đúng cho phép bạn khám phá các đặc tính số và tính chất định tính của một đối tượng, giảm vấn đề xuống việc nghiên cứu các đối tượng đơn giản hơn hoặc thuận tiện hơn (ví dụ: những đối tượng có đặc tính dễ dàng tính toán hoặc đã biết các thuộc tính của chúng). Trong lý thuyết số, các phép gần đúng Diophantine được nghiên cứu, đặc biệt là các phép gần đúng của các số vô tỉ bằng các số hữu tỉ. Trong hình học, xấp xỉ của các đường cong bởi các đường đứt gãy được coi là. Một số phần của toán học về cơ bản hoàn toàn dành cho tính gần đúng, ví dụ, lý thuyết về tính gần đúng của các hàm, các phương pháp phân tích số.

Theo nghĩa bóng, nó được dùng trong triết học như phương pháp xấp xỉ, một dấu hiệu có tính chất gần đúng, không cuối cùng. Ví dụ, theo nghĩa này, thuật ngữ "xấp xỉ" đã được Søren Kierkegaard (1813-1855) tích cực sử dụng trong "Lời bạt cuối cùng của sự phản khoa học ..."

Nếu hàm sẽ chỉ được sử dụng để nội suy, thì nó đủ để tính gần đúng các điểm với một đa thức bậc năm:

Tình hình phức tạp hơn nhiều nếu dữ liệu trường ở trên đóng vai trò là điểm tham chiếu để tiết lộ quy luật thay đổi với các điều kiện biên đã biết. Ví dụ: và . Ở đây chất lượng của kết quả phụ thuộc vào tính chuyên nghiệp của nhà nghiên cứu. Trong trường hợp này, luật được chấp nhận nhất sẽ là:

Để lựa chọn tối ưu các tham số của phương trình, phương pháp bình phương nhỏ nhất thường được sử dụng.

Phương pháp bình phương tối thiểu (LSM,Tiếng AnhBình thường Ít nhất Hình vuông , OLS ) - một phương pháp toán học được sử dụng để giải quyết các vấn đề khác nhau, dựa trên việc tối thiểu hóa tổng bình phương của một số hàm của các biến mong muốn. Nó có thể được sử dụng để "giải" các hệ phương trình quá xác định (khi số phương trình vượt quá số ẩn số), để tìm lời giải trong trường hợp hệ phương trình phi tuyến thông thường (không quá xác định), để gần đúng giá trị điểm bằng một số chức năng. OLS là một trong những phương pháp cơ bản của phân tích hồi quy để ước lượng các tham số chưa biết của mô hình hồi quy từ dữ liệu mẫu.

Nếu một đại lượng vật lý nào đó phụ thuộc vào một đại lượng khác, thì sự phụ thuộc này có thể được khảo sát bằng cách đo y ở các giá trị khác nhau của x. Kết quả của các phép đo, một loạt các giá trị thu được:

x 1, x 2, ..., x i, ..., x n;

y 1, y 2, ..., y i, ..., y n.

Dựa trên dữ liệu của một thí nghiệm như vậy, có thể vẽ biểu đồ sự phụ thuộc y = ƒ (x). Đường cong kết quả giúp ta có thể đánh giá dạng của hàm ƒ (x). Tuy nhiên, các hệ số hằng nhập vào hàm này vẫn chưa được biết. Chúng có thể được xác định bằng phương pháp bình phương nhỏ nhất. Các điểm thực nghiệm, như một quy luật, không nằm chính xác trên đường cong. Phương pháp bình phương nhỏ nhất yêu cầu tổng bình phương độ lệch của các điểm thực nghiệm so với đường cong, tức là 2 là nhỏ nhất.

Trong thực tế, phương pháp này thường được sử dụng nhất (và đơn giản nhất) trong trường hợp có mối quan hệ tuyến tính, tức là khi nào

y = kx hoặc y = a + bx.

Sự phụ thuộc tuyến tính rất phổ biến trong vật lý. Và ngay cả khi sự phụ thuộc là phi tuyến tính, họ thường cố gắng xây dựng một đồ thị theo cách để có được một đường thẳng. Ví dụ, nếu giả sử chiết suất của thủy tinh n liên hệ với bước sóng λ của sóng ánh sáng theo quan hệ n = a + b / λ 2, thì sự phụ thuộc của n vào λ -2 được vẽ trên đồ thị .

Xem xét sự phụ thuộc y = kx(đường thẳng đi qua gốc tọa độ). Soạn giá trị φ - tổng bình phương độ lệch của các điểm của chúng ta so với đường thẳng

.

Giá trị của φ luôn dương và càng nhỏ thì điểm của chúng ta càng nằm gần đường thẳng. Phương pháp bình phương nhỏ nhất nói rằng với k người ta nên chọn một giá trị như vậy mà tại đó φ có giá trị nhỏ nhất

hoặc (19)

Tính toán cho thấy rằng sai số căn bậc hai khi xác định giá trị của k bằng

, (20) trong đó - n là số phép đo.

Bây giờ chúng ta hãy xem xét một trường hợp khó hơn một chút, khi các điểm phải thỏa mãn công thức y = a + bx(một đường thẳng không đi qua gốc tọa độ).

Nhiệm vụ là tìm giá trị tốt nhất của a và b từ tập giá trị x i, y i đã cho.

Một lần nữa, chúng ta lập một dạng bậc hai φ bằng tổng bình phương độ lệch của các điểm x i, y i từ đường thẳng

và tìm các giá trị a và b để φ có giá trị nhỏ nhất

;

.

Giải pháp chung của các phương trình này cho

(21)

Sai số căn bậc hai của việc xác định a và b là bằng nhau

(23)

. (24)

Khi xử lý kết quả đo bằng phương pháp này, thuận tiện khi tổng hợp tất cả dữ liệu trong một bảng, trong đó tất cả các tổng có trong công thức (19) - (24) được tính toán sơ bộ. Các hình thức của các bảng này được hiển thị trong các ví dụ dưới đây.

ví dụ 1 Phương trình cơ bản của động lực học chuyển động quay ε = M / J (một đường thẳng đi qua gốc tọa độ) đã được nghiên cứu. Đối với các giá trị khác nhau của thời điểm M, người ta đo gia tốc góc ε của một vật nhất định. Yêu cầu xác định mômen quán tính của vật này. Kết quả của các phép đo mômen của lực và gia tốc góc được liệt kê trong cột thứ hai và thứ ba bảng 5.

Bảng 5

Theo công thức (19) ta xác định được:

.

Để xác định lỗi căn bậc hai, chúng tôi sử dụng công thức (20)

0.005775 Kilôgam-một · m -2 .

Theo công thức (18) chúng ta có

SJ = (2,996 0,005775) /0,3337 = 0,05185 kg m 2 .

Với độ tin cậy P = 0,95, theo bảng hệ số Student cho n = 5, ta tìm được t = 2,78 và xác định được sai số tuyệt đối ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2 .

Chúng tôi viết kết quả dưới dạng:

J = (3,0 ± 0,2) kg m 2 ;

Ví dụ 2 Chúng tôi tính toán hệ số nhiệt độ của điện trở của kim loại bằng phương pháp bình phương nhỏ nhất. Điện trở phụ thuộc vào nhiệt độ theo quy luật tuyến tính

R t \ u003d R 0 (1 + α t °) \ u003d R 0 + R 0 α t °.

Số hạng tự do xác định điện trở R 0 ở nhiệt độ 0 ° C, và hệ số góc là tích của hệ số nhiệt độ α và điện trở R 0.

Kết quả của các phép đo và tính toán được cho trong bảng ( xem bảng 6).

Bảng 6

(r - bt - a) 2,10 -6

Bằng các công thức (21), (22) ta xác định được

R 0 = ¯R- α R 0 ¯t = 1.4005 - 0.002645 85.83333 = 1.1735 Om .

Hãy để chúng tôi tìm một lỗi trong định nghĩa của α. Từ đó theo công thức (18) ta có:

.

Sử dụng các công thức (23), (24) ta có

;

0.014126 Om.

Với độ tin cậy P = 0,95, theo bảng hệ số Student cho n = 6, ta tìm được t = 2,57 và xác định được sai số tuyệt đối Δα = 2,57 0,000132 = 0,000338 kêu -1 .

α = (23 ± 4) 10 -4 kêu-1 tại P = 0,95.

Ví dụ 3 Yêu cầu xác định bán kính cong của thấu kính từ các vành Newton. Người ta đo được bán kính của các vành Newton là r m và xác định số lượng m của những vành này. Bán kính của các vành Newton liên hệ với bán kính cong của thấu kính R và số vòng theo phương trình

r 2 m = mλR - 2d 0 R,

trong đó d 0 là độ dày của khe hở giữa thấu kính và tấm phẳng song song (hoặc biến dạng thấu kính),

λ là bước sóng của ánh sáng tới.

λ = (600 ± 6) nm; r 2 m = y; m = x; λR = b; -2d 0 R = a,

thì phương trình sẽ có dạng y = a + bx.

Kết quả của các phép đo và tính toán được nhập vào bảng 7.

Bảng 7

y \ u003d r 2, 10 -2 mm 2

y-bx-a, 10-4

(y - bx - a) 2, 10 -6

Chúng ta mong đợi:

1. a và b theo công thức (21), (22).

a = ¯r 2 - b¯m = (0,208548333 - 0,0594957 3,5) = 0,0003133 mm 2 .

2. Tính sai số căn bậc hai cho các giá trị b và a bằng công thức (23), (24)

3. Với độ tin cậy P = 0,95, theo bảng hệ số Student cho n = 6, ta tìm được t = 2,57 và xác định sai số tuyệt đối

Δb = 2,57 0,000211179 = 6 10 -4 mm 2 ;

Δa = 2,57 0,000822424 = 3 10 -3 mm 2 .

4. Viết ra kết quả

b = (595 ± 6) 10 -4 mm 2 tại Р = 0,95;

a = (0,3 ± 3) 10 -3 mm 2 tại Р = 0,95;

Theo kết quả của thí nghiệm, trong phạm vi sai số của thí nghiệm này, đường thẳng r 2 m = ƒ (m) đi qua gốc tọa độ, vì nếu sai số của giá trị của bất kỳ tham số nào hóa ra có thể so sánh được hoặc vượt quá giá trị của tham số, thì điều này có nghĩa là, rất có thể, giá trị thực của tham số này bằng không.

Trong các điều kiện của thử nghiệm này, giá trị của a không được quan tâm. Do đó, chúng tôi sẽ không đối phó với nó nữa.

5. Tính bán kính cong của thấu kính:

R = b / λ = 594,5 / 6 = 99,1 mm.

6. Vì sai số hệ thống được đưa ra cho bước sóng, chúng tôi cũng tính sai số hệ thống cho R theo công thức (16), lấy sai số ngẫu nhiên Δb của nó là sai số hệ thống của b.

Viết ra kết quả cuối cùng R = (99 ± 2) mmε ≈ 3% ở P = 0,95.

Ví dụ.

Dữ liệu thực nghiệm về giá trị của các biến Xtạiđược đưa ra trong bảng.

Do sự liên kết của chúng, hàm

Sử dụng phương pháp bình phương nhỏ nhất, tính gần đúng những dữ liệu này với sự phụ thuộc tuyến tính y = ax + b(tìm các tùy chọn mộtb). Tìm xem dòng nào tốt hơn (theo nghĩa của phương pháp bình phương nhỏ nhất) sắp xếp dữ liệu thực nghiệm. Vẽ tranh.

Bản chất của phương pháp bình phương nhỏ nhất (LSM).

Vấn đề là tìm các hệ số phụ thuộc tuyến tính mà hàm của hai biến mộtb nhận giá trị nhỏ nhất. Đó là, với dữ liệu mộtb tổng các độ lệch bình phương của dữ liệu thực nghiệm từ đường thẳng tìm được sẽ là nhỏ nhất. Đây là toàn bộ điểm của phương pháp bình phương nhỏ nhất.

Do đó, lời giải của ví dụ được rút gọn thành việc tìm cực trị của một hàm hai biến.

Suy ra công thức tìm hệ số.

Một hệ hai phương trình với hai ẩn số được biên soạn và giải. Tìm đạo hàm riêng của hàm bởi các biến mộtb, chúng tôi đánh đồng các đạo hàm này bằng không.

Chúng tôi giải hệ phương trình kết quả bằng bất kỳ phương pháp nào (ví dụ phương pháp thay thế hoặc Phương pháp của Cramer) và có được các công thức để tìm các hệ số bằng phương pháp bình phương nhỏ nhất (LSM).

Với dữ liệu mộtb hàm số nhận giá trị nhỏ nhất. Bằng chứng về thực tế này được đưa ra bên dưới văn bản ở cuối trang.

Đó là toàn bộ phương pháp bình phương nhỏ nhất. Công thức tìm tham số một chứa các tổng ,,, và tham số N- lượng dữ liệu thực nghiệm. Giá trị của các tổng này được khuyến nghị tính riêng. Hệ số b tìm thấy sau khi tính toán một.

Đã đến lúc nhớ lại ví dụ ban đầu.

Quyết định.

Trong ví dụ của chúng tôi n = 5. Chúng tôi điền vào bảng để thuận tiện cho việc tính toán các số tiền có trong công thức của các hệ số cần thiết.

Các giá trị trong hàng thứ tư của bảng nhận được bằng cách nhân các giá trị của hàng thứ 2 với giá trị của hàng thứ 3 cho mỗi số tôi.

Các giá trị trong hàng thứ năm của bảng nhận được bằng cách bình phương các giá trị của hàng thứ 2 cho mỗi số tôi.

Giá trị của cột cuối cùng của bảng là tổng các giá trị trên các hàng.

Chúng tôi sử dụng các công thức của phương pháp bình phương nhỏ nhất để tìm các hệ số mộtb. Chúng tôi thay thế chúng bằng các giá trị tương ứng từ cột cuối cùng của bảng:

Vì thế, y = 0,165x + 2,184 là đường thẳng ước lượng mong muốn.

Nó vẫn còn để tìm ra dòng nào trong số các dòng y = 0,165x + 2,184 hoặc gần đúng hơn với dữ liệu ban đầu, tức là để ước tính bằng phương pháp bình phương nhỏ nhất.

Ước lượng sai số của phương pháp bình phương nhỏ nhất.

Để làm điều này, bạn cần tính tổng độ lệch bình phương của dữ liệu ban đầu từ các dòng này , một giá trị nhỏ hơn tương ứng với một dòng gần đúng hơn với dữ liệu ban đầu theo phương pháp bình phương nhỏ nhất.

Kể từ đó, dòng y = 0,165x + 2,184 gần đúng với dữ liệu gốc tốt hơn.

Hình ảnh minh họa của phương pháp bình phương nhỏ nhất (LSM).

Mọi thứ trông tuyệt vời trên bảng xếp hạng. Dòng màu đỏ là dòng được tìm thấy y = 0,165x + 2,184, đường màu xanh lam là , các chấm màu hồng là dữ liệu gốc.

Trong thực tế, khi mô hình hóa các quá trình khác nhau - cụ thể là kinh tế, vật lý, kỹ thuật, xã hội - những phương pháp tính toán giá trị gần đúng của các hàm từ các giá trị đã biết của chúng tại một số điểm cố định được sử dụng rộng rãi.

Các vấn đề về tính gần đúng của các hàm dạng này thường phát sinh:

    khi xây dựng các công thức tính gần đúng để tính giá trị của các đại lượng đặc trưng của quá trình đang nghiên cứu theo dữ liệu dạng bảng thu được từ kết quả thí nghiệm;

    tích phân số, phân biệt, giải phương trình vi phân, v.v ...;

    nếu cần tính các giá trị của hàm số tại các điểm trung gian của khoảng đã xét;

    khi xác định các giá trị của các đại lượng đặc trưng của quá trình nằm ngoài khoảng đang xét, cụ thể là khi dự báo.

Nếu, để mô hình hóa một quá trình nhất định được chỉ định bởi một bảng, một hàm được xây dựng mô tả gần đúng quá trình này dựa trên phương pháp bình phương nhỏ nhất, nó sẽ được gọi là hàm xấp xỉ (hồi quy) và nhiệm vụ xây dựng các hàm xấp xỉ chính nó sẽ là một bài toán gần đúng.

Bài viết này thảo luận về các khả năng của gói MS Excel để giải quyết các vấn đề như vậy, ngoài ra, các phương pháp và kỹ thuật xây dựng (tạo) hồi quy cho các hàm đã cho theo bảng (là cơ sở của phân tích hồi quy) cũng được đưa ra.

Có hai tùy chọn để xây dựng hồi quy trong Excel.

    Thêm các hồi quy đã chọn (đường xu hướng) vào biểu đồ được xây dựng trên cơ sở bảng dữ liệu cho đặc tính quá trình được nghiên cứu (chỉ khả dụng nếu biểu đồ được xây dựng);

    Sử dụng các hàm thống kê có sẵn của trang tính Excel, cho phép bạn lấy các hồi quy (đường xu hướng) trực tiếp từ bảng dữ liệu nguồn.

Thêm đường xu hướng vào biểu đồ

Đối với một bảng dữ liệu mô tả một quy trình nhất định và được biểu diễn bằng biểu đồ, Excel có một công cụ phân tích hồi quy hiệu quả cho phép bạn:

    xây dựng trên cơ sở phương pháp bình phương nhỏ nhất và bổ sung vào biểu đồ năm loại hồi quy mô hình hóa quá trình đang nghiên cứu với các mức độ chính xác khác nhau;

    thêm một phương trình của hồi quy đã xây dựng vào sơ đồ;

    xác định mức độ tuân thủ của hồi quy đã chọn với dữ liệu hiển thị trên biểu đồ.

Dựa trên dữ liệu biểu đồ, Excel cho phép bạn lấy các loại hồi quy tuyến tính, đa thức, logarit, hàm mũ, lũy thừa, được đưa ra bởi phương trình:

y = y (x)

trong đó x là một biến độc lập, thường nhận các giá trị của một dãy số tự nhiên (1; 2; 3; ...) và tạo ra, ví dụ: đếm ngược thời gian của quá trình đang nghiên cứu (đặc điểm) .

1 . Hồi quy tuyến tính tốt trong việc mô hình hóa các đối tượng địa lý tăng hoặc giảm với tốc độ không đổi. Đây là mô hình đơn giản nhất của quy trình đang được nghiên cứu. Nó được xây dựng theo phương trình:

y = mx + b

trong đó m là tiếp tuyến của hệ số góc của hồi quy tuyến tính với trục x; b - tọa độ giao điểm của hồi quy tuyến tính với trục y.

2 . Đường xu hướng đa thức hữu ích để mô tả các đặc điểm có một số điểm cực trị riêng biệt (giá trị cao và điểm thấp nhất). Sự lựa chọn bậc của đa thức được xác định bởi số cực trị của đặc trưng đang nghiên cứu. Do đó, một đa thức bậc hai có thể mô tả tốt một quá trình chỉ có một cực đại hoặc cực tiểu; đa thức bậc ba - không quá hai cực trị; đa thức bậc 4 - không quá ba cực trị, v.v.

Trong trường hợp này, đường xu hướng được xây dựng theo phương trình:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

trong đó các hệ số c0, c1, c2, ... c6 là các hằng số mà giá trị của nó được xác định trong quá trình xây dựng.

3 . Đường xu hướng logarit được sử dụng thành công trong các đặc điểm mô hình hóa, các giá trị của chúng thay đổi nhanh chóng lúc đầu, và sau đó ổn định dần.

y = c ln (x) + b

4 . Đường xu hướng công suất cho kết quả tốt nếu các giá trị của sự phụ thuộc được nghiên cứu được đặc trưng bởi sự thay đổi liên tục trong tốc độ tăng trưởng. Ví dụ về sự phụ thuộc như vậy có thể dùng như một đồ thị về chuyển động có gia tốc đều của ô tô. Nếu có 0 hoặc giá trị âm trong dữ liệu, bạn không thể sử dụng đường xu hướng lũy ​​thừa.

Nó được xây dựng theo phương trình:

y = cxb

trong đó các hệ số b, c là hằng số.

5 . Đường xu hướng hàm mũ nên được sử dụng nếu tốc độ thay đổi trong dữ liệu liên tục tăng. Đối với dữ liệu có chứa giá trị bằng 0 hoặc âm, loại xấp xỉ này cũng không được áp dụng.

Nó được xây dựng theo phương trình:

y = cebx

trong đó các hệ số b, c là hằng số.

Khi chọn một đường xu hướng, Excel sẽ tự động tính toán giá trị của R2, đặc trưng cho độ chính xác của phép gần đúng: giá trị R2 càng gần một thì đường xu hướng càng gần đúng với quá trình đang nghiên cứu. Nếu cần, giá trị của R2 luôn có thể được hiển thị trên sơ đồ.

Được xác định theo công thức:

Để thêm đường xu hướng vào chuỗi dữ liệu:

    kích hoạt biểu đồ được xây dựng trên cơ sở chuỗi dữ liệu, tức là nhấp vào trong vùng biểu đồ. Mục Biểu đồ sẽ xuất hiện trong menu chính;

    Sau khi nhấp vào mục này, một menu sẽ xuất hiện trên màn hình, trong đó bạn nên chọn lệnh Thêm đường xu hướng.

Các hành động tương tự được thực hiện dễ dàng nếu bạn di chuột qua biểu đồ tương ứng với một trong các chuỗi dữ liệu và nhấp chuột phải; trong menu ngữ cảnh xuất hiện, hãy chọn lệnh Thêm đường xu hướng. Hộp thoại Đường xu hướng sẽ xuất hiện trên màn hình với tab Loại được mở (Hình 1).

Sau đó bạn cần:

Trên tab Loại, chọn loại đường xu hướng cần thiết (Tuyến tính được chọn theo mặc định). Đối với kiểu Đa thức, trong trường Độ, hãy chỉ định bậc của đa thức đã chọn.

1 . Trường Tích hợp trên Chuỗi liệt kê tất cả chuỗi dữ liệu trong biểu đồ được đề cập. Để thêm đường xu hướng vào một chuỗi dữ liệu cụ thể, hãy chọn tên của nó trong trường Được xây dựng trên chuỗi.

Nếu cần, bằng cách chuyển đến tab Tham số (Hình 2), bạn có thể đặt các tham số sau cho đường xu hướng:

    thay đổi tên của đường xu hướng trong Tên của trường đường cong xấp xỉ (làm mịn).

    đặt số khoảng thời gian (tiến hoặc lùi) cho dự báo trong trường Dự báo;

    hiển thị phương trình của đường xu hướng trong vùng biểu đồ mà bạn nên bật hộp kiểm hiển thị phương trình trên biểu đồ;

    hiển thị giá trị của độ tin cậy gần đúng R2 trong vùng sơ đồ, bạn nên bật hộp kiểm để đặt giá trị của độ tin cậy gần đúng (R ^ 2) trên biểu đồ;

    đặt điểm giao của đường xu hướng với trục Y, bạn nên bật hộp kiểm Giao điểm của đường cong với trục Y tại một điểm;

    nhấp vào nút OK để đóng hộp thoại.

Có ba cách để bắt đầu chỉnh sửa đường xu hướng đã được tạo sẵn:

    sử dụng lệnh Đường xu hướng đã chọn từ menu Định dạng, sau khi chọn đường xu hướng;

    chọn lệnh Định dạng Đường xu hướng từ trình đơn ngữ cảnh, lệnh này được gọi bằng cách nhấp chuột phải vào đường xu hướng;

    bằng cách nhấp đúp vào đường xu hướng.

Hộp thoại Đường xu hướng định dạng sẽ xuất hiện trên màn hình (Hình 3), chứa ba tab: Xem, Kiểu, Tham số và nội dung của hai tab cuối cùng hoàn toàn trùng khớp với các tab tương tự của hộp thoại Đường xu hướng (Hình 1-2 ). Trên tab Chế độ xem, bạn có thể đặt loại đường, màu sắc và độ dày của nó.

Để xóa một đường xu hướng đã được xây dựng, hãy chọn đường xu hướng cần xóa và nhấn phím Delete.

Ưu điểm của công cụ phân tích hồi quy được coi là:

    sự dễ dàng tương đối của việc vẽ đường xu hướng trên biểu đồ mà không cần tạo bảng dữ liệu cho nó;

    một danh sách khá rộng các loại đường xu hướng được đề xuất và danh sách này bao gồm các loại hồi quy được sử dụng phổ biến nhất;

    khả năng dự đoán hành vi của quá trình đang nghiên cứu đối với một số bước tùy ý (theo cách hiểu thông thường) về phía trước, cũng như lùi lại;

    khả năng thu được phương trình của đường xu hướng ở dạng phân tích;

    khả năng thu được đánh giá độ tin cậy của phép gần đúng, nếu cần.

Những bất lợi bao gồm các điểm sau:

    việc xây dựng đường xu hướng chỉ được thực hiện nếu có một biểu đồ được xây dựng trên một chuỗi dữ liệu;

    Quá trình tạo chuỗi dữ liệu cho đặc tính đang được nghiên cứu dựa trên phương trình đường xu hướng thu được hơi lộn xộn: các phương trình hồi quy bắt buộc được cập nhật với mỗi thay đổi trong giá trị của chuỗi dữ liệu gốc, nhưng chỉ trong vùng biểu đồ , trong khi chuỗi dữ liệu được hình thành trên cơ sở xu hướng phương trình đường cũ, vẫn không thay đổi;

    Trong báo cáo PivotChart, khi bạn thay đổi chế độ xem biểu đồ hoặc báo cáo PivotTable được liên kết, các đường xu hướng hiện có sẽ không được bảo toàn, vì vậy bạn phải đảm bảo rằng bố cục của báo cáo đáp ứng các yêu cầu của bạn trước khi bạn vẽ đường xu hướng hoặc định dạng báo cáo PivotChart.

Các đường xu hướng có thể được thêm vào chuỗi dữ liệu được trình bày trên biểu đồ như biểu đồ, biểu đồ, biểu đồ vùng không chuẩn hóa phẳng, biểu đồ thanh, phân tán, bong bóng và cổ phiếu.

Bạn không thể thêm đường xu hướng vào chuỗi dữ liệu trên biểu đồ 3-D, Chuẩn, Radar, Hình tròn và Bánh rán.

Sử dụng các hàm Excel tích hợp sẵn

Excel cũng cung cấp một công cụ phân tích hồi quy để vẽ các đường xu hướng bên ngoài vùng biểu đồ. Một số hàm trang tính thống kê có thể được sử dụng cho mục đích này, nhưng tất cả chúng đều cho phép bạn chỉ tạo các hồi quy tuyến tính hoặc hàm mũ.

Excel có một số hàm để xây dựng hồi quy tuyến tính, cụ thể là:

    XU HƯỚNG;

  • SLOPE và CUT.

Cũng như một số hàm để xây dựng đường xu hướng hàm mũ, cụ thể là:

    LGRFPapprox.

Cần lưu ý rằng các kỹ thuật xây dựng hồi quy bằng cách sử dụng các hàm TREND và GROWTH thực tế là giống nhau. Điều tương tự cũng có thể nói về cặp hàm LINEST và LGRFPRIBL. Đối với bốn hàm này, khi tạo bảng giá trị, các tính năng Excel như công thức mảng sẽ được sử dụng, điều này phần nào làm xáo trộn quá trình xây dựng hồi quy. Chúng tôi cũng lưu ý rằng việc xây dựng một hồi quy tuyến tính, theo quan điểm của chúng tôi, là dễ thực hiện nhất bằng cách sử dụng các hàm SLOPE và INTERCEPT, trong đó hàm đầu tiên xác định độ dốc của hồi quy tuyến tính và hàm thứ hai xác định đoạn bị cắt bởi hồi quy trên trục y.

Ưu điểm của công cụ chức năng tích hợp để phân tích hồi quy là:

    một quá trình khá đơn giản của cùng một kiểu hình thành chuỗi dữ liệu của đặc trưng đang được nghiên cứu cho tất cả các hàm thống kê cài sẵn thiết lập các đường xu hướng;

    một kỹ thuật tiêu chuẩn để xây dựng các đường xu hướng dựa trên chuỗi dữ liệu đã tạo;

    khả năng dự đoán hành vi của quá trình đang nghiên cứu đối với số bước tiến hoặc lùi cần thiết.

Và những bất lợi bao gồm thực tế là Excel không có các hàm tích hợp để tạo các loại đường xu hướng khác (ngoại trừ tuyến tính và hàm mũ). Tình huống này thường không cho phép lựa chọn một mô hình đủ chính xác của quá trình đang nghiên cứu, cũng như có được những dự báo sát với thực tế. Ngoài ra, khi sử dụng các hàm TREND và GROW, phương trình của các đường xu hướng không được biết.

Cần lưu ý rằng các tác giả đã không đặt mục tiêu của bài báo là trình bày quá trình phân tích hồi quy với các mức độ hoàn chỉnh khác nhau. Nhiệm vụ chính của nó là thể hiện khả năng của gói Excel trong việc giải các bài toán xấp xỉ bằng cách sử dụng các ví dụ cụ thể; chứng minh những công cụ hiệu quả nào mà Excel có để xây dựng hồi quy và dự báo; minh họa cách những vấn đề như vậy có thể được giải quyết một cách tương đối dễ dàng ngay cả bởi một người dùng không có kiến ​​thức sâu về phân tích hồi quy.

Ví dụ về giải quyết các vấn đề cụ thể

Xem xét giải pháp của các vấn đề cụ thể bằng cách sử dụng các công cụ được liệt kê của gói Excel.

Nhiệm vụ 1

Với bảng số liệu về lợi nhuận của doanh nghiệp vận tải cơ giới năm 1995-2002. bạn cần phải làm như sau.

    Xây dựng biểu đồ.

    Thêm các đường xu hướng tuyến tính và đa thức (bậc hai và bậc ba) vào biểu đồ.

    Sử dụng phương trình đường xu hướng, thu được dữ liệu dạng bảng về lợi nhuận của doanh nghiệp cho từng đường xu hướng trong giai đoạn 1995-2004.

    Lập dự báo lợi nhuận của doanh nghiệp cho năm 2003 và 2004.

Giải pháp của vấn đề

    Trong phạm vi ô A4: C11 của trang tính Excel, chúng tôi nhập trang tính được hiển thị trong Hình. 4.

    Sau khi chọn phạm vi ô B4: C11, chúng tôi xây dựng một biểu đồ.

    Chúng tôi kích hoạt biểu đồ đã xây dựng và theo phương pháp được mô tả ở trên, sau khi chọn loại đường xu hướng trong hộp thoại Đường xu hướng (xem Hình 1), chúng tôi lần lượt thêm các đường xu hướng tuyến tính, bậc hai và khối vào biểu đồ. Trong cùng một hộp thoại, hãy mở tab Tham số (xem Hình 2), trong Tên của trường đường cong xấp xỉ (làm mịn), hãy nhập tên của xu hướng được thêm vào và trong trường Dự báo chuyển tiếp cho: giai đoạn, hãy đặt giá trị 2, vì nó được lên kế hoạch đưa ra dự báo lợi nhuận cho hai năm tới. Để hiển thị phương trình hồi quy và giá trị độ tin cậy gần đúng R2 trong vùng sơ đồ, hãy bật hộp kiểm Hiển thị phương trình trên màn hình và đặt giá trị độ tin cậy gần đúng (R ^ 2) trên biểu đồ. Để nhận thức trực quan tốt hơn, chúng tôi thay đổi loại, màu sắc và độ dày của các đường xu hướng đã xây dựng, chúng tôi sử dụng tab View của hộp thoại Định dạng đường xu hướng (xem Hình 3). Biểu đồ kết quả với các đường xu hướng được bổ sung được hiển thị trong hình. 5.

    Để có được dữ liệu dạng bảng về lợi nhuận của doanh nghiệp cho từng đường xu hướng trong giai đoạn 1995-2004. Hãy sử dụng phương trình của các đường xu hướng được trình bày trong hình. 5. Để thực hiện việc này, trong các ô của phạm vi D3: F3, hãy nhập thông tin dạng văn bản về loại đường xu hướng đã chọn: Xu hướng tuyến tính, Xu hướng bậc hai, Xu hướng khối. Tiếp theo, nhập công thức hồi quy tuyến tính vào ô D4 và sử dụng điểm đánh dấu điền, sao chép công thức này với các tham chiếu tương đối đến phạm vi ô D5: D13. Cần lưu ý rằng mỗi ô có công thức hồi quy tuyến tính từ phạm vi ô D4: D13 có một ô tương ứng từ phạm vi A4: A13 làm đối số. Tương tự, đối với hồi quy bậc hai, phạm vi ô E4: E13 được lấp đầy và đối với hồi quy bậc ba, phạm vi ô F4: F13 được lấp đầy. Do đó, một dự báo về lợi nhuận của doanh nghiệp cho năm 2003 và 2004 đã được đưa ra. với ba xu hướng. Bảng giá trị kết quả được hiển thị trong hình. 6.

Nhiệm vụ 2

    Xây dựng biểu đồ.

    Thêm các đường xu hướng logarit, hàm mũ và hàm mũ vào biểu đồ.

    Suy ra phương trình của các đường xu hướng thu được, cũng như các giá trị của độ tin cậy gần đúng R2 cho từng đường đó.

    Sử dụng phương trình đường xu hướng, thu được dữ liệu dạng bảng về lợi nhuận của doanh nghiệp cho từng đường xu hướng trong giai đoạn 1995-2002.

    Lập dự báo lợi nhuận cho doanh nghiệp cho năm 2003 và 2004 bằng cách sử dụng các đường xu hướng này.

Giải pháp của vấn đề

Theo phương pháp được đưa ra khi giải quyết vấn đề 1, chúng ta thu được một sơ đồ có thêm các đường xu hướng logarit, hàm mũ và hàm mũ (Hình 7). Hơn nữa, sử dụng các phương trình đường xu hướng thu được, chúng tôi điền vào bảng giá trị lợi nhuận của doanh nghiệp, bao gồm các giá trị dự đoán cho năm 2003 và 2004. (Hình 8).

Trên hình. 5 và hình có thể thấy rằng mô hình có xu hướng logarit tương ứng với giá trị thấp nhất của độ tin cậy xấp xỉ

R2 = 0,8659

Các giá trị cao nhất của R2 tương ứng với các mô hình có xu hướng đa thức: bậc hai (R2 = 0,9263) và bậc ba (R2 = 0,933).

Nhiệm vụ 3

Với bảng số liệu về lợi nhuận của doanh nghiệp vận tải cơ giới giai đoạn 1995-2002 ở nhiệm vụ 1, bạn phải thực hiện các bước sau.

    Nhận chuỗi dữ liệu cho các đường xu hướng tuyến tính và hàm mũ bằng cách sử dụng các hàm TREND và GROW.

    Sử dụng các hàm TREND và TĂNG TRƯỞNG, hãy lập dự báo lợi nhuận cho doanh nghiệp trong năm 2003 và 2004.

    Đối với dữ liệu ban đầu và chuỗi dữ liệu nhận được, hãy xây dựng một sơ đồ.

Giải pháp của vấn đề

Hãy sử dụng trang tính của nhiệm vụ 1 (xem Hình 4). Hãy bắt đầu với hàm TREND:

    chọn dải ô D4: D11, ô này sẽ được điền các giá trị của hàm TREND tương ứng với dữ liệu đã biết về lợi nhuận của doanh nghiệp;

    gọi lệnh Hàm từ menu Chèn. Trong hộp thoại Trình hướng dẫn chức năng xuất hiện, hãy chọn chức năng TREND từ danh mục Thống kê, sau đó bấm vào nút OK. Thao tác tương tự có thể được thực hiện bằng cách nhấn nút (Chức năng chèn) của thanh công cụ tiêu chuẩn.

    Trong hộp thoại Đối số hàm xuất hiện, nhập phạm vi ô C4: C11 vào trường Đã biết_giá_trị_y; trong trường Giá_trị_x đã biết - phạm vi ô B4: B11;

    để biến công thức đã nhập thành công thức mảng, hãy sử dụng tổ hợp phím + +.

Công thức chúng ta đã nhập vào thanh công thức sẽ giống như sau: = (TREND (C4: C11; B4: B11)).

Kết quả là, phạm vi ô D4: D11 được lấp đầy bằng các giá trị tương ứng của hàm TREND (Hình 9).

Để đưa ra dự báo về lợi nhuận của công ty cho năm 2003 và 2004. cần thiết:

    chọn phạm vi ô D12: D13, nơi các giá trị được dự đoán bởi hàm TREND sẽ được nhập.

    gọi hàm TREND và trong hộp thoại Đối số hàm xuất hiện, hãy nhập vào trường Giá_trị_đã biết - phạm vi ô C4: C11; trong trường Giá_trị_x đã biết - phạm vi ô B4: B11; và trong trường New_values_x - phạm vi ô B12: B13.

    biến công thức này thành công thức mảng bằng cách sử dụng phím tắt Ctrl + Shift + Enter.

    Công thức đã nhập sẽ giống như sau: = (TREND (C4: C11; B4: B11; B12: B13)) và phạm vi ô D12: D13 sẽ được lấp đầy bởi các giá trị dự đoán của hàm TREND (xem Hình. 9).

Tương tự, một chuỗi dữ liệu được điền bằng cách sử dụng hàm GROWTH, được sử dụng trong phân tích các phụ thuộc phi tuyến tính và hoạt động giống hệt như TREND đối tác tuyến tính của nó.

Hình 10 cho thấy bảng ở chế độ hiển thị công thức.

Đối với dữ liệu ban đầu và chuỗi dữ liệu thu được, sơ đồ được hiển thị trong hình. mười một.

Nhiệm vụ 4

Với bảng số liệu tiếp nhận hồ sơ đăng ký dịch vụ của doanh nghiệp vận tải cơ giới từ ngày 01 đến ngày 11 của tháng hiện tại, phải thực hiện các thao tác sau.

    Lấy chuỗi dữ liệu cho hồi quy tuyến tính: sử dụng các hàm SLOPE và INTERCEPT; bằng cách sử dụng hàm LINEST.

    Truy xuất chuỗi dữ liệu cho hồi quy theo cấp số nhân bằng cách sử dụng hàm LYFFPRIB.

    Sử dụng các chức năng trên, lập dự báo về lượng nhận hồ sơ đến cơ quan dịch vụ công văn trong khoảng thời gian từ ngày 12 đến ngày 14 của tháng hiện tại.

    Đối với chuỗi dữ liệu gốc và đã nhận, hãy xây dựng một sơ đồ.

Giải pháp của vấn đề

Lưu ý rằng, không giống như các hàm TREND và GROW, không có hàm nào được liệt kê ở trên (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) là hồi quy. Các hàm này chỉ đóng vai trò phụ trợ, xác định các tham số hồi quy cần thiết.

Đối với các hồi quy tuyến tính và hàm mũ được xây dựng bằng cách sử dụng các hàm SLOPE, INTERCEPT, LINEST, LGRFINB, sự xuất hiện của các phương trình của chúng luôn được biết đến, trái ngược với các hồi quy tuyến tính và hàm mũ tương ứng với các hàm TREND và GROWTH.

1 . Hãy xây dựng một hồi quy tuyến tính có phương trình:

y = mx + b

bằng cách sử dụng các hàm SLOPE và INTERCEPT, với độ dốc của hồi quy m được xác định bởi hàm SLOPE và số hạng không đổi b - bởi hàm INTERCEPT.

Để làm điều này, chúng tôi thực hiện các hành động sau:

    nhập bảng nguồn trong phạm vi ô A4: B14;

    giá trị của tham số m sẽ được xác định trong ô C19. Chọn từ danh mục Thống kê, chức năng Độ dốc; nhập phạm vi ô B4: B14 trong trường giá_trị_y đã biết và phạm vi ô A4: A14 trong trường_giá_trị_x đã biết. Công thức sẽ được nhập vào ô C19: = SLOPE (B4: B14; A4: A14);

    bằng phương pháp tương tự, giá trị của tham số b trong ô D19 được xác định. Và nội dung của nó sẽ như thế này: = INTERCEPT (B4: B14; A4: A14). Do đó, các giá trị của tham số m và b, cần thiết để xây dựng một hồi quy tuyến tính, sẽ được lưu trữ tương ứng trong các ô C19, D19;

    sau đó ta nhập công thức hồi quy tuyến tính vào ô C4 có dạng: = $ C * A4 + $ D. Trong công thức này, các ô C19 và D19 được viết với tham chiếu tuyệt đối (địa chỉ ô không được thay đổi khi có thể sao chép). Dấu tham chiếu tuyệt đối $ có thể được nhập từ bàn phím hoặc sử dụng phím F4, sau khi đặt con trỏ vào địa chỉ ô. Sử dụng ô điều khiển điền, sao chép công thức này vào phạm vi ô C4: C17. Chúng tôi nhận được chuỗi dữ liệu mong muốn (Hình 12). Do số lượng yêu cầu là một số nguyên, bạn nên đặt định dạng số trên tab Số của cửa sổ Định dạng Ô với số vị trí thập phân là 0.

2 . Bây giờ chúng ta hãy xây dựng một hồi quy tuyến tính cho bởi phương trình:

y = mx + b

bằng cách sử dụng hàm LINEST.

Đối với điều này:

    nhập hàm LINEST dưới dạng công thức mảng vào phạm vi ô C20: D20: = (LINEST (B4: B14; A4: A14)). Kết quả là chúng ta nhận được giá trị của tham số m trong ô C20 và giá trị của tham số b trong ô D20;

    nhập công thức vào ô D4: = $ C * A4 + $ D;

    sao chép công thức này bằng cách sử dụng điểm đánh dấu điền vào phạm vi ô D4: D17 và nhận được chuỗi dữ liệu mong muốn.

3 . Chúng tôi xây dựng một hồi quy hàm mũ có phương trình:

với sự trợ giúp của hàm LGRFPRIBL, nó được thực hiện tương tự:

    trong phạm vi ô C21: D21, nhập hàm LGRFPRIBL dưới dạng công thức mảng: = (LGRFPRIBL (B4: B14; A4: A14)). Trong trường hợp này, giá trị của tham số m sẽ được xác định trong ô C21 và giá trị của tham số b sẽ được xác định trong ô D21;

    công thức được nhập vào ô E4: = $ D * $ C ^ A4;

    bằng cách sử dụng điểm đánh dấu điền, công thức này được sao chép vào phạm vi ô E4: E17, nơi đặt chuỗi dữ liệu cho hồi quy theo cấp số nhân (xem Hình 12).

Trên hình. 13 hiển thị một bảng hiển thị các hàm chúng tôi sử dụng với các phạm vi ô cần thiết, cũng như các công thức.

Giá trị R 2 triệu tập hệ số xác định.

Nhiệm vụ của việc xây dựng một phụ thuộc hồi quy là tìm vectơ các hệ số m của mô hình (1) mà tại đó hệ số R nhận giá trị lớn nhất.

Để đánh giá mức ý nghĩa của R, kiểm định F của Fisher được sử dụng, được tính bằng công thức

ở đâu N- cỡ mẫu (số lượng thí nghiệm);

k là số hệ số của mô hình.

Nếu F vượt quá một số giá trị quan trọng cho dữ liệu Nk và mức độ tin cậy được chấp nhận, khi đó giá trị của R được coi là đáng kể. Bảng giá trị tới hạn của F được đưa ra trong các sách tham khảo về thống kê toán học.

Vì vậy, ý nghĩa của R không chỉ được xác định bởi giá trị của nó, mà còn bởi tỷ số giữa số lượng thí nghiệm và số lượng hệ số (tham số) của mô hình. Thật vậy, tỷ lệ tương quan cho n = 2 đối với một mô hình tuyến tính đơn giản là 1 (thông qua 2 điểm trên mặt phẳng, bạn luôn có thể vẽ một đường thẳng duy nhất). Tuy nhiên, nếu dữ liệu thực nghiệm là các biến ngẫu nhiên, thì giá trị R như vậy cần được tin cậy một cách thận trọng. Thông thường, để thu được R đáng kể và hồi quy đáng tin cậy, nó nhằm đảm bảo rằng số lượng thử nghiệm vượt quá đáng kể số lượng hệ số của mô hình (n> k).

Để xây dựng một tuyến tính mô hình hồi quy cần thiết:

1) chuẩn bị một danh sách gồm n hàng và m cột chứa dữ liệu thử nghiệm (cột chứa giá trị đầu ra Y phải là đầu tiên hoặc cuối cùng trong danh sách); ví dụ: chúng ta hãy lấy dữ liệu của nhiệm vụ trước đó, thêm một cột được gọi là "số chu kỳ", đánh số các khoảng thời gian từ 1 đến 12 (đây sẽ là các giá trị X)

2) vào menu Dữ liệu / Phân tích dữ liệu / Hồi quy

Nếu thiếu mục "Phân tích dữ liệu" trong menu "Công cụ", thì bạn nên chuyển đến mục "Bổ trợ" của cùng menu và chọn hộp "Gói phân tích".

3) trong hộp thoại "Hồi quy", đặt:

khoảng thời gian đầu vào Y;

khoảng đầu vào X;

khoảng thời gian đầu ra - ô phía trên bên trái của khoảng thời gian mà kết quả tính toán sẽ được đặt (nên đặt nó trên một trang tính mới);

4) nhấp vào "Ok" và phân tích kết quả.

Phát biểu bài toán xấp xỉ bình phương nhỏ nhất. điều kiện để có giá trị gần đúng nhất.

Nếu một tập hợp dữ liệu thực nghiệm thu được với một sai số đáng kể, thì không những không cần thực hiện mà còn không mong muốn! Ở đây, yêu cầu phải xây dựng một đường cong sẽ tái tạo đồ thị của tính đều đặn thực nghiệm ban đầu, tức là sẽ càng gần các điểm thực nghiệm càng tốt, nhưng đồng thời cũng không nhạy cảm với các sai lệch ngẫu nhiên của giá trị đo được.

Hãy giới thiệu chức năng liên tục φ (x)để ước tính sự phụ thuộc rời rạc f (x tôi ) , tôi = 0… N. Chúng tôi sẽ giả định rằng φ (x)được xây dựng theo điều kiện xấp xỉ bậc hai tốt nhất, nếu

. (1)

trọng lượng ρ tôi-th điểm cung cấp ý nghĩa cho độ chính xác của phép đo giá trị cho trước: nhiều hơn ρ , đường cong gần đúng càng bị "hút" vào điểm đã cho. Theo mặc định, chúng tôi sẽ giả định ρ = 1 cho tất cả các điểm.

Hãy xem xét trường hợp xấp xỉ tuyến tính:

φ (x) = c 0 φ 0 (x) + c 1 φ 1 (x) + … + c m φ m (x), (2)

ở đâu φ 0… φ m- Bất kỳ chức năng cơ bản, c 0… c m- hệ số chưa biết, m < N. Nếu số lượng hệ số xấp xỉ được lấy bằng số hải lý, khi đó xấp xỉ căn bậc hai sẽ trùng với phép nội suy Lagrange, và nếu chúng ta không tính đến lỗi tính toán, Q = 0.

Nếu lỗi dữ liệu thử nghiệm (ban đầu) đã biết ξ , sau đó là lựa chọn số lượng hệ số, nghĩa là, các giá trị m, được xác định bởi điều kiện:

Nói cách khác, nếu, số lượng hệ số gần đúng không đủ để tái tạo chính xác biểu đồ sự phụ thuộc thực nghiệm. Nếu, nhiều hệ số trong (2) sẽ không có ý nghĩa vật lý.

Để giải quyết vấn đề xấp xỉ tuyến tính trong trường hợp chung nó là cần thiết để tìm các điều kiện để nhỏ nhất của tổng các độ lệch bình phương cho (2). Bài toán tìm cực tiểu có thể rút gọn thành bài toán tìm nghiệm nguyên của hệ phương trình, k = 0…m. (4) .

Việc thay thế (2) thành (1) và sau đó tính (4) cuối cùng sẽ dẫn đến hệ thống tiếp theo đại số tuyến tính phương trình:

Tiếp theo, bạn nên giải SLAE kết quả liên quan đến các hệ số c 0… c m. Để giải SLAE, một ma trận hệ số mở rộng thường được biên dịch, được gọi là Ma trận gram, phần tử của ai là sản phẩm chấm các hàm cơ sở và một cột hệ số tự do:

,

ở đâu , , j = 0… m, k = 0…m.

Sau khi sử dụng, ví dụ, phương pháp Gauss, các hệ số c 0… c m, bạn có thể xây dựng một đường cong gần đúng hoặc tính toán các tọa độ điểm đã cho. Như vậy, bài toán xấp xỉ đã được giải quyết.

Tính gần đúng của một đa thức chính tắc.

Chúng tôi chọn các hàm cơ sở dưới dạng một chuỗi lũy thừa của đối số x:

φ 0 (x) = x0 = 1; φ 1 (x) = x 1 = x; φ m (x) = x m, m < N.

Ma trận Gram mở rộng cho cơ sở lũy thừa sẽ trông như thế này:

Điểm đặc biệt của việc tính toán một ma trận như vậy (để giảm số lượng hành động được thực hiện) là chỉ cần đếm các phần tử của hàng đầu tiên và hai cột cuối cùng: các phần tử còn lại được điền bằng cách dịch chuyển hàng trước đó (ngoại trừ hai cột cuối cùng) bằng một vị trí bên trái. Trong một số ngôn ngữ lập trình, nơi không có quy trình lũy thừa nhanh, thuật toán tính ma trận Gram, được trình bày dưới đây, rất hữu ích.

Lựa chọn các chức năng cơ bản dưới dạng quyền hạn x không phải là tối ưu trong điều kiện đạt được sai số nhỏ nhất. Đây là một hệ quả không trực giao các chức năng cơ bản đã chọn. Bất động sản tính trực giao nằm ở chỗ đối với mỗi loại đa thức có một đoạn [ x 0, x n], trên đó tích vô hướng của các đa thức có bậc khác nhau biến mất:

, jk, p là một số hàm trọng lượng.

Nếu các hàm cơ sở là trực giao, thì tất cả các phần tử nằm ngoài đường chéo của ma trận Gram sẽ gần bằng 0, điều này sẽ làm tăng độ chính xác của các phép tính, nếu không, định thức của ma trận Gram có xu hướng về 0 rất nhanh, tức là. hệ thống trở nên kém điều hòa.

Tính gần đúng của đa thức cổ điển trực giao.

Các đa thức sau liên quan đến Đa thức Jacobi, có tính chất trực giao theo nghĩa trên. Đó là, để đạt được độ chính xác cao tính toán, nên chọn các hàm cơ sở để tính gần đúng ở dạng các đa thức này.

Tính gần đúng (từ tiếng Latinh "gần đúng" - "cách tiếp cận") - một biểu thức gần đúng của bất kỳ đối tượng toán học nào (ví dụ: số hoặc hàm) thông qua các đối tượng khác đơn giản hơn, thuận tiện hơn để sử dụng hoặc đơn giản là được biết đến nhiều hơn. Trong nghiên cứu khoa học, phép gần đúng được sử dụng để mô tả, phân tích, khái quát hóa và sử dụng thêm các kết quả thực nghiệm.

Như đã biết, có thể có một kết nối chính xác (chức năng) giữa các giá trị, khi một giá trị cụ thể tương ứng với một giá trị của đối số.

Khi chọn một giá trị gần đúng, người ta nên tiến hành từ nhiệm vụ cụ thể của nghiên cứu. Thông thường, phương trình dùng để tính gần đúng càng đơn giản thì mô tả về sự phụ thuộc thu được càng gần đúng. Do đó, điều quan trọng là phải đọc mức độ quan trọng và điều gì đã gây ra sự sai lệch của các giá trị cụ thể so với xu hướng kết quả. Khi mô tả sự phụ thuộc của các giá trị được xác định theo kinh nghiệm, có thể đạt được độ chính xác cao hơn nhiều bằng cách sử dụng một số phương trình đa tham số, phức tạp hơn. Tuy nhiên, không ích lợi gì khi cố gắng truyền tải độ lệch ngẫu nhiên của các giá trị trong chuỗi dữ liệu thực nghiệm cụ thể với độ chính xác tối đa. Khi chọn một phương pháp gần đúng, nhà nghiên cứu luôn thỏa hiệp: anh ta quyết định mức độ phù hợp và thích hợp trong trường hợp này để “hy sinh” các chi tiết và theo đó, mức độ tổng quát của sự phụ thuộc của các biến được so sánh nên được thể hiện như thế nào. Cùng với việc tiết lộ các mẫu dữ liệu thực nghiệm bị che khuất bởi độ lệch ngẫu nhiên so với mẫu chung, phép gần đúng còn cho phép giải quyết nhiều vấn đề quan trọng khác: chính thức hóa sự phụ thuộc tìm được; tìm các giá trị chưa biết của biến phụ thuộc bằng nội suy hoặc ngoại suy nếu có.

Mục đích của khóa học này là để nghiên cứu cơ sở lý thuyết xấp xỉ hàm được lập bảng bằng phương pháp bình phương nhỏ nhất và áp dụng kiến thức lý thuyết, tìm đa thức gần đúng. Việc tìm đa thức gần đúng trong khuôn khổ khóa học này được thực hiện bằng cách viết một chương trình trong Pascal thực hiện thuật toán đã phát triển để tìm hệ số của đa thức gần đúng và cũng giải quyết vấn đề tương tự bằng MathCad.

Trong khóa học này, chương trình Pascal được phát triển trong phiên bản beta của PascalABC shell 1.0. Lời giải của bài toán trong môi trường MathCad được thực hiện trên phiên bản Mathcad 14.0.0.163.

Công thức của vấn đề

Trong môn học này, bạn phải thực hiện những điều sau:

1. Xây dựng thuật toán tìm hệ số của ba đa thức (đa thức) xấp xỉ có dạng

cho hàm lập bảng y = f (x):

cho bậc của đa thức n = 2, 4, 5.

2. Xây dựng sơ đồ khối của thuật toán.

3. Tạo một chương trình Pascal thực hiện thuật toán đã phát triển.

5. Dựng đồ thị của 3 hàm số gần đúng thu được trong một hệ trục tọa độ. Biểu đồ cũng phải chứa các điểm bắt đầu. (X tôi , y tôi ) .

6. Giải bài toán bằng MathCAD.

Kết quả giải bài toán bằng chương trình đã tạo bằng ngôn ngữ Pascal và trong môi trường MathCAD phải được trình bày dưới dạng ba đa thức được xây dựng bằng hệ số tìm được; một bảng chứa các giá trị của hàm thu được bằng cách sử dụng các đa thức tìm được tại các điểm xi và độ lệch chuẩn.

Xây dựng công thức thực nghiệm bằng phương pháp bình phương nhỏ nhất

Thông thường, đặc biệt là khi phân tích dữ liệu thực nghiệm, cần phải tìm ra mối quan hệ hàm giữa các giá trị x và y một cách rõ ràng, thu được từ kết quả của các phép đo.

Trong một nghiên cứu phân tích về mối quan hệ giữa hai đại lượng x và y, một loạt các quan sát được thực hiện và kết quả là một bảng giá trị:

x ¼ ¼
y ¼ ¼

Bảng này thường thu được là kết quả của một số thí nghiệm trong đó