Tiểu sử Đặc điểm Phân tích

Theo phương pháp bình phương nhỏ nhất, biểu thức sau là cực tiểu. Tìm các tham số của đường hồi quy

Chúng tôi làm gần đúng hàm theo một đa thức bậc 2. Để làm điều này, chúng tôi tính toán các hệ số của hệ phương trình thông thường:

, ,

Hãy tạo một hệ thống bình thường bình phương nhỏ nhất, trông giống như:

Giải pháp của hệ thống rất dễ tìm:,,.

Do đó, đa thức bậc 2 được tìm thấy:.

Lý thuyết nền

Quay lại trang<Введение в вычислительную математику. Примеры>

Ví dụ 2. Tìm bậc tối ưu của đa thức.

Quay lại trang<Введение в вычислительную математику. Примеры>

Ví dụ 3. Suy ra một hệ phương trình thông thường để tìm các tham số của một phụ thuộc thực nghiệm.

Hãy để chúng tôi suy ra một hệ thống phương trình để xác định các hệ số và hàm , thực hiện phép xấp xỉ căn bậc hai chức năng nhất định bằng điểm. Soạn một hàm và viết cho cô ấy Điều kiện cần thiết cực đoan:

sau đó hệ thống bình thường sẽ có dạng:

Được hệ thống tuyến tính phương trình cho các tham số chưa biết và được giải một cách dễ dàng.

Lý thuyết nền

Quay lại trang<Введение в вычислительную математику. Примеры>

Thí dụ.

Dữ liệu thực nghiệm về giá trị của các biến Xtạiđược đưa ra trong bảng.

Do sự liên kết của chúng, hàm

Sử dụng phương pháp bình phương nhỏ nhất, tính gần đúng những dữ liệu này với sự phụ thuộc tuyến tính y = ax + b(tìm các tùy chọn mộtb). Tìm xem dòng nào tốt hơn (theo nghĩa của phương pháp bình phương nhỏ nhất) sắp xếp dữ liệu thực nghiệm. Vẽ tranh.

Bản chất của phương pháp bình phương nhỏ nhất (LSM).

Vấn đề là tìm các hệ số phụ thuộc tuyến tính, mà hàm của hai biến mộtbchấp nhận giá trị nhỏ nhất. Đó là, với dữ liệu mộtb tổng các độ lệch bình phương của dữ liệu thực nghiệm từ đường thẳng tìm được sẽ là nhỏ nhất. Đây là toàn bộ điểm của phương pháp bình phương nhỏ nhất.

Vì vậy, lời giải của ví dụ được rút gọn để tìm cực trị của một hàm hai biến.

Suy ra công thức tìm hệ số.

Một hệ hai phương trình với hai ẩn số được biên soạn và giải. Tìm đạo hàm riêng của hàm bởi các biến mộtb, chúng tôi đánh đồng các đạo hàm này bằng không.

Chúng tôi giải hệ phương trình kết quả bằng bất kỳ phương pháp nào (ví dụ phương pháp thay thế hoặc phương pháp của Cramer) và lấy công thức tìm hệ số bằng phương pháp bình phương nhỏ nhất (LSM).

Với dữ liệu mộtb hàm số nhận giá trị nhỏ nhất. Bằng chứng về thực tế này được đưa ra dưới đây trong văn bản ở cuối trang.

Đó là toàn bộ phương pháp bình phương nhỏ nhất. Công thức tìm tham số một chứa tổng và tham số N là lượng dữ liệu thực nghiệm. Giá trị của các tổng này được khuyến nghị tính riêng.

Hệ số b tìm thấy sau khi tính toán một.

Đã đến lúc nhớ lại ví dụ ban đầu.

Dung dịch.

Trong ví dụ của chúng tôi n = 5. Chúng tôi điền vào bảng để thuận tiện cho việc tính toán các số tiền có trong công thức của các hệ số cần thiết.

Các giá trị trong hàng thứ tư của bảng nhận được bằng cách nhân các giá trị của hàng thứ 2 với giá trị của hàng thứ 3 cho mỗi số tôi.

Các giá trị trong hàng thứ năm của bảng có được bằng cách bình phương các giá trị của hàng thứ 2 cho mỗi số tôi.

Giá trị của cột cuối cùng của bảng là tổng các giá trị trên các hàng.

Chúng tôi sử dụng các công thức của phương pháp bình phương nhỏ nhất để tìm các hệ số mộtb. Chúng tôi thay thế chúng bằng các giá trị tương ứng từ cột cuối cùng của bảng:

Do đó, y = 0,165x + 2,184 là đường thẳng ước lượng mong muốn.

Nó vẫn còn để tìm ra dòng nào trong số các dòng y = 0,165x + 2,184 hoặc gần đúng hơn với dữ liệu ban đầu, tức là để ước tính bằng phương pháp bình phương nhỏ nhất.

Ước lượng sai số của phương pháp bình phương nhỏ nhất.

Để thực hiện việc này, bạn cần tính tổng độ lệch bình phương của dữ liệu gốc từ các dòng này , một giá trị nhỏ hơn tương ứng với một dòng gần đúng hơn với dữ liệu ban đầu theo phương pháp bình phương nhỏ nhất.

Kể từ đó, dòng y = 0,165x + 2,184 gần đúng với dữ liệu gốc tốt hơn.

Hình ảnh minh họa của phương pháp bình phương nhỏ nhất (LSM).

Mọi thứ trông tuyệt vời trên bảng xếp hạng. Dòng màu đỏ là dòng được tìm thấy y = 0,165x + 2,184, đường màu xanh lam là , các chấm màu hồng là dữ liệu gốc.

Nó để làm gì, tất cả những ước tính này để làm gì?

Cá nhân tôi sử dụng để giải quyết các vấn đề làm mịn dữ liệu, các vấn đề nội suy và ngoại suy (trong ví dụ ban đầu, bạn có thể được yêu cầu tìm giá trị của giá trị được quan sát y tại x = 3 Hoặc khi nào x = 6 theo phương pháp MNC). Nhưng chúng ta sẽ nói nhiều hơn về điều này sau trong một phần khác của trang web.

Đầu trang

Bằng chứng.

Vì vậy, khi tìm thấy mộtb hàm số nhận giá trị nhỏ nhất thì lúc này ma trận có dạng bậc hai của vi phân cấp hai đối với hàm số là xác định tích cực. Hãy thể hiện nó.

Vi phân bậc hai có dạng:

Đó là

Do đó, ma trận của bậc hai có dạng

và giá trị của các phần tử không phụ thuộc vào mộtb.

Hãy để chúng tôi chứng minh rằng ma trận là xác định dương. Điều này đòi hỏi các trẻ vị thành niên ở góc độ phải tích cực.

Góc nhỏ của đơn hàng đầu tiên . Sự bất bình đẳng là nghiêm ngặt, vì các điểm không trùng nhau. Điều này sẽ được ngụ ý trong những gì sau đây.

Góc nhỏ của bậc thứ hai

Hãy chứng minh rằng phương pháp quy nạp toán học.

Sự kết luận: giá trị tìm thấy mộtb tương ứng với giá trị nhỏ nhất của hàm , do đó, là các tham số mong muốn cho phương pháp bình phương nhỏ nhất.

Bao giờ hiểu?
Đặt hàng một giải pháp

Đầu trang

Xây dựng dự báo bằng phương pháp bình phương nhỏ nhất. Ví dụ về giải pháp vấn đề

Ngoại suy là một phương pháp nghiên cứu khoa học, dựa trên sự phân bố các xu hướng, hình thái, mối quan hệ trong quá khứ và hiện tại với sự phát triển trong tương lai của đối tượng dự báo. Các phương pháp ngoại suy bao gồm phương pháp trung bình động, phương pháp làm mịn theo cấp số nhân, phương pháp bình phương nhỏ nhất.

Nước hoa phương pháp bình phương nhỏ nhất bao gồm tối thiểu hóa tổng độ lệch chuẩn giữa các giá trị quan sát và tính toán. Các giá trị tính toán được tìm thấy theo phương trình đã chọn - phương trình hồi quy. Khoảng cách giữa các giá trị thực tế và các giá trị được tính toán càng nhỏ thì dự báo dựa trên phương trình hồi quy càng chính xác.

Phân tích lý thuyết về bản chất của hiện tượng đang nghiên cứu, sự thay đổi được hiển thị bằng một chuỗi thời gian, là cơ sở để chọn một đường cong. Đôi khi người ta cũng tính đến việc cân nhắc về bản chất của sự phát triển các cấp độ của chuỗi. Do đó, nếu tăng trưởng sản lượng dự kiến ​​trong cấp số cộng, sau đó làm mịn được thực hiện theo đường thẳng. Nếu nó chỉ ra rằng tăng trưởng trong cấp số nhân, thì việc làm mịn sẽ được thực hiện theo hàm số mũ.

Công thức làm việc của phương pháp bình phương nhỏ nhất : Y t + 1 = a * X + b, trong đó t + 1 là khoảng thời gian dự báo; Уt + 1 - chỉ số dự đoán; a và b là các hệ số; X - Biểu tượng thời gian.

Hệ số a và b được tính theo công thức sau:

trong đó, Uf - giá trị thực của chuỗi động lực học; n là số mức trong chuỗi thời gian;

Việc làm mịn chuỗi thời gian bằng phương pháp bình phương nhỏ nhất dùng để phản ánh các mô hình phát triển của hiện tượng đang nghiên cứu. Trong biểu thức phân tích của một xu hướng, thời gian được coi là một biến độc lập và các mức của chuỗi hoạt động như một hàm của biến độc lập này.

Sự phát triển của một hiện tượng không phụ thuộc vào bao nhiêu năm đã trôi qua kể từ điểm xuất phát, mà phụ thuộc vào những yếu tố nào đã ảnh hưởng đến sự phát triển của nó, theo chiều hướng nào và cường độ ra sao. Từ đó, rõ ràng là sự phát triển của một hiện tượng trong thời gian xuất hiện là kết quả của hoạt động của các yếu tố này.

Thiết lập chính xác loại đường cong, loại phân tích phụ thuộc vào thời gian là một trong những nhiệm vụ đầy thử thách phân tích tiên đoán .

Việc lựa chọn loại hàm mô tả xu hướng, các tham số được xác định bằng phương pháp bình phương nhỏ nhất, trong hầu hết các trường hợp là thực nghiệm, bằng cách xây dựng một số hàm và so sánh chúng với nhau bằng giá trị của giá trị trung bình gốc -square lỗi được tính theo công thức:

trong đó Uf - giá trị thực của chuỗi động lực học; Ur - các giá trị được tính toán (làm mịn) của chuỗi thời gian; n là số mức trong chuỗi thời gian; p là số lượng các tham số được xác định trong các công thức mô tả xu hướng (xu hướng phát triển).

Nhược điểm của phương pháp bình phương nhỏ nhất :

  • khi cố gắng mô tả hiện tượng kinh tế đang nghiên cứu bằng cách sử dụng Phương trình toán học, dự báo sẽ chính xác trong một khoảng thời gian ngắn và phương trình hồi quy phải được tính toán lại khi có thông tin mới;
  • sự phức tạp của việc lựa chọn phương trình hồi quy, phương trình này có thể giải được bằng cách sử dụng các chương trình máy tính tiêu chuẩn.

Ví dụ về việc sử dụng phương pháp bình phương nhỏ nhất để phát triển dự báo

Một nhiệm vụ . Có dữ liệu đặc trưng cho mức độ thất nghiệp trong khu vực,%

  • Xây dựng dự báo tỷ lệ thất nghiệp trong khu vực cho các tháng 11, 12, 1, sử dụng các phương pháp: trung bình động, làm trơn hàm mũ, bình phương nhỏ nhất.
  • Tính toán các sai số trong các dự báo kết quả bằng cách sử dụng mỗi phương pháp.
  • So sánh kết quả thu được, rút ​​ra kết luận.

Giải pháp bình phương ít nhất

Đối với giải pháp, chúng tôi sẽ biên soạn một bảng trong đó chúng tôi sẽ thực hiện các tính toán cần thiết:

ε = 28,63 / 10 = 2,86% dự báo độ chính xác cao.

Sự kết luận : So sánh kết quả thu được trong các phép tính phương pháp trung bình động , làm mịn theo cấp số nhân và phương pháp bình phương nhỏ nhất, chúng ta có thể nói rằng giá trị trung bình sai số tương đối khi tính theo phương pháp làm trơn hàm mũ, nó rơi vào khoảng 20-50%. Điều này có nghĩa là độ chính xác của dự đoán trường hợp này là chỉ thỏa đáng.

Trong trường hợp thứ nhất và thứ ba, độ chính xác của dự báo cao, vì sai số tương đối trung bình nhỏ hơn 10%. Nhưng phương pháp trung bình động có thể thu được các kết quả đáng tin cậy hơn (dự báo cho tháng 11 - 1,52%, dự báo cho tháng 12 - 1,53%, dự báo cho tháng 1 - 1,49%), vì sai số tương đối trung bình khi sử dụng phương pháp này là nhỏ nhất - 1 , 13%.

Phương pháp bình phương tối thiểu

Các bài liên quan khác:

Danh sách các nguồn được sử dụng

  1. Các khuyến nghị khoa học và phương pháp luận về chẩn đoán rủi ro xã hội và dự báo các thách thức, mối đe dọa và hậu quả xã hội. Nhà nước Nga đại học xã hội. Matxcova. Năm 2010;
  2. Vladimirova L.P. Dự báo và lập kế hoạch trong điều kiện thị trường: Proc. phụ cấp. M.: Nhà xuất bản"Dashkov và Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Dự báo nền kinh tế quốc dân: Dụng cụ trợ giảng. Yekaterinburg: Nhà xuất bản Ural. tiểu bang nền kinh tế đại học, 2007;
  4. Slutskin L.N. Khóa học MBA về dự báo kinh doanh. Matxcơva: Sách kinh doanh Alpina, 2006.

Chương trình MNE

Nhập dữ liệu

Dữ liệu và Ước tính y = a + b x

tôi- số điểm thí nghiệm;
x tôi- giá trị của tham số cố định tại điểm tôi;
y tôi- giá trị của thông số đo tại điểm tôi;
ω tôi- trọng lượng đo tại điểm tôi;
y tôi, calc.- sự khác biệt giữa giá trị đo được và giá trị được tính toán từ hồi quy y tại điểm tôi;
S x i (x i)- ước tính lỗi x tôi khi đo lường y tại điểm tôi.

Dữ liệu và Ước tính y = k x

tôi x tôi y tôi ω tôi y tôi, calc. Δy tôi S x i (x i)

Bấm vào biểu đồ

Hướng dẫn sử dụng cho chương trình trực tuyến MNC.

Trong trường dữ liệu, nhập trên mỗi dòng riêng biệt các giá trị của `x` và` y` tại một điểm thử nghiệm. Các giá trị phải được phân tách bằng khoảng trắng (dấu cách hoặc tab).

Giá trị thứ ba có thể là trọng số của `w`. Nếu trọng lượng điểm không được chỉ định, thì nó bằng một. Trong phần lớn các trường hợp, trọng số của các điểm thí nghiệm không được biết hoặc không được tính toán; tất cả các dữ liệu thực nghiệm được coi là tương đương. Đôi khi trọng số trong phạm vi giá trị được nghiên cứu chắc chắn không tương đương và thậm chí có thể được tính toán theo lý thuyết. Ví dụ, trong phép đo quang phổ, trọng lượng có thể được tính bằng các công thức đơn giản, mặc dù về cơ bản mọi người đều bỏ qua điều này để giảm chi phí lao động.

Dữ liệu có thể được dán qua khay nhớ tạm từ bảng tính của bộ ứng dụng văn phòng, chẳng hạn như Excel từ Microsoft Office hoặc Calc từ Open Office. Đối với điều này trong bảng tínhđánh dấu phạm vi dữ liệu sẽ được sao chép, sao chép vào khay nhớ tạm và dán dữ liệu vào trường dữ liệu trên trang này.

Để tính theo phương pháp bình phương nhỏ nhất, cần có ít nhất hai điểm để xác định hai hệ số `b` - tiếp tuyến của góc nghiêng của đường thẳng và` a` - giá trị bị cắt bởi đường thẳng trên `y trục `.

Để ước tính sai số của các hệ số hồi quy đã tính toán, cần đặt số điểm thực nghiệm nhiều hơn hai.

Phương pháp bình phương tối thiểu (LSM).

Số điểm thí nghiệm càng lớn thì độ chính xác càng cao đánh giá thống kê hệ số (do hệ số Sinh viên giảm) và ước lượng càng gần với ước lượng của mẫu chung.

Việc thu được các giá trị tại mỗi điểm thử nghiệm thường đi kèm với chi phí lao động đáng kể, do đó, một số lượng thử nghiệm thỏa hiệp thường được thực hiện, đưa ra một ước tính dễ hiểu và không dẫn đến chi phí lao động quá mức. Theo quy định, số điểm thực nghiệm cho một phụ thuộc bình phương nhỏ nhất tuyến tính với hai hệ số được chọn trong vùng 5-7 điểm.

Lý thuyết ngắn gọn về bình phương nhỏ nhất cho sự phụ thuộc tuyến tính

Giả sử chúng ta có một tập dữ liệu thực nghiệm dưới dạng các cặp giá trị [`y_i`,` x_i`], trong đó `i` là số của một phép đo thực nghiệm từ 1 đến` n`; `y_i` - giá trị của giá trị đo được tại điểm` i`; `x_i` - giá trị của tham số chúng ta đặt tại điểm` i`.

Một ví dụ là hoạt động của định luật Ohm. Bằng cách thay đổi điện áp (hiệu điện thế) giữa các phần mạch điện, chúng tôi đo lượng dòng điện đi qua phần này. Vật lý cho chúng ta sự phụ thuộc được tìm thấy bằng thực nghiệm:

`I = U / R`,
ở đâu `I` - cường độ hiện tại; `R` - điện trở; `U` - hiệu điện thế.

Trong trường hợp này, `y_i` là giá trị dòng điện đo được và` x_i` là giá trị điện áp.

Ví dụ khác, hãy xem xét sự hấp thụ ánh sáng của một dung dịch của một chất trong dung dịch. Hóa học cho chúng ta công thức:

`A = εl C`,
trong đó `A` là mật độ quang của dung dịch; `ε` - độ truyền chất tan; `l` - chiều dài đường đi khi ánh sáng đi qua cuvet có dung dịch; `C` là nồng độ của chất tan.

Trong trường hợp này, `y_i` là mật độ quang đo được` A` và `x_i` là nồng độ của chất mà chúng ta đặt.

Chúng tôi sẽ xem xét trường hợp khi lỗi tương đối trong thiết lập `x_i` nhỏ hơn nhiều, sai số tương đối số đo `y_i`. Chúng tôi cũng sẽ giả định rằng tất cả các giá trị đo được của `y_i` là ngẫu nhiên và được phân phối chuẩn, tức là tuân theo luật bình thường phân bổ.

Trong trường hợp phụ thuộc tuyến tính của `y` vào` x`, chúng ta có thể viết sự phụ thuộc lý thuyết:
`y = a + bx`.

TỪ điểm hình học về quan điểm, hệ số `b` biểu thị tiếp tuyến của góc nghiêng của đường thẳng với trục` x` và hệ số `a` - giá trị của` y` tại giao điểm của đường thẳng với ` trục y` (đối với `x = 0`).

Tìm các tham số của đường hồi quy.

Trong thử nghiệm, các giá trị đo được của `y_i` không thể nằm chính xác trên đường lý thuyết do sai số đo lường, những giá trị này luôn cố hữu trong đời thực. Do đó, một phương trình tuyến tính phải được biểu diễn bằng một hệ phương trình:
`y_i = a + b x_i + ε_i` (1),
trong đó `ε_i` là sai số đo chưa biết của` y` trong thử nghiệm thứ `i`.

Sự phụ thuộc (1) còn được gọi là hồi quy, I E. sự phụ thuộc của hai đại lượng vào nhau có ý nghĩa thống kê.

Nhiệm vụ của việc khôi phục sự phụ thuộc là tìm các hệ số `a` và` b` từ các điểm nghiệm [`y_i`,` x_i`].

Để tìm các hệ số `a` và` b` thường được sử dụng phương pháp bình phương nhỏ nhất(MNK). Đó là một trường hợp đặc biệt của nguyên tắc khả năng xảy ra tối đa.

Hãy viết lại (1) thành `ε_i = y_i - a - b x_i`.

Khi đó, tổng các lỗi bình phương sẽ là
`Φ = sum_ (i = 1) ^ (n) ε_i ^ 2 = sum_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2`. (2)

Nguyên tắc của phương pháp bình phương nhỏ nhất là tối thiểu hóa tổng (2) đối với các tham số `a` và` b`.

Mức tối thiểu đạt được khi các đạo hàm riêng của tổng (2) đối với các hệ số `a` và` b` bằng 0:
`frac (một phần Φ) (một phần a) = frac (một phần tổng_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (một phần a) = 0`
`frac (một phần Φ) (một phần b) = frac (một phần tổng_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (một phần b) = 0`

Khai triển đạo hàm, ta thu được hệ hai phương trình với hai ẩn số:
`sum_ (i = 1) ^ (n) (2a + 2bx_i - 2y_i) = sum_ (i = 1) ^ (n) (a + bx_i - y_i) = 0`
`sum_ (i = 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) = sum_ (i = 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) = 0`

Chúng ta mở dấu ngoặc và chuyển các tổng độc lập với các hệ số mong muốn sang nửa còn lại, chúng ta sẽ có một hệ phương trình tuyến tính:
`sum_ (i = 1) ^ (n) y_i = a n + b sum_ (i = 1) ^ (n) bx_i`
`sum_ (i = 1) ^ (n) x_iy_i = a sum_ (i = 1) ^ (n) x_i + b sum_ (i = 1) ^ (n) x_i ^ 2`

Giải hệ kết quả, chúng tôi tìm thấy công thức cho các hệ số `a` và` b`:

`a = frac (sum_ (i = 1) ^ (n) y_i sum_ (i = 1) ^ (n) x_i ^ 2 - sum_ (i = 1) ^ (n) x_i sum_ (i = 1) ^ (n ) x_iy_i) (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) `(3.1)

`b = frac (n sum_ (i = 1) ^ (n) x_iy_i - sum_ (i = 1) ^ (n) x_i sum_ (i = 1) ^ (n) y_i) (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) `(3.2)

Các công thức này có nghiệm khi `n> 1` (đoạn thẳng có thể được vẽ bằng cách sử dụng ít nhất 2 điểm) và khi định thức` D = n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1 ) ^ (n) x_i) ^ 2! = 0`, tức là khi các điểm `x_i` trong thử nghiệm khác nhau (tức là khi đường thẳng không thẳng đứng).

Ước tính sai số trong các hệ số của đường hồi quy

Để có một ước tính chính xác hơn về sai số khi tính toán các hệ số `a` và` b`, điều này là mong muốn một số lượng lớnđiểm thực nghiệm. Khi `n = 2`, không thể ước tính sai số của các hệ số, bởi vì đường xấp xỉ sẽ đi qua hai điểm duy nhất.

Lỗi biến ngẫu nhiên`V` được định nghĩa luật tích lũy lỗi
`S_V ^ 2 = sum_ (i = 1) ^ p (frac (một phần f) (một phần z_i)) ^ 2 S_ (z_i) ^ 2`,
trong đó `p` là số tham số` z_i` có lỗi `S_ (z_i)` ảnh hưởng đến lỗi `S_V`;
`f` là một hàm phụ thuộc của` V` trên `z_i`.

Hãy viết luật tích lũy sai số cho sai số của các hệ số `a` và` b`
`S_a ^ 2 = sum_ (i = 1) ^ (n) (frac (một phần a) (một phần y_i)) ^ 2 S_ (y_i) ^ 2 + sum_ (i = 1) ^ (n) (frac (một phần a ) (một phần x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 sum_ (i = 1) ^ (n) (frac (một phần a) (một phần y_i)) ^ 2 `,
`S_b ^ 2 = sum_ (i = 1) ^ (n) (frac (một phần b) (một phần y_i)) ^ 2 S_ (y_i) ^ 2 + sum_ (i = 1) ^ (n) (frac (một phần b ) (một phần x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 sum_ (i = 1) ^ (n) (frac (một phần b) (một phần y_i)) ^ 2 ',
tại vì `S_ (x_i) ^ 2 = 0` (trước đây chúng tôi đã đặt trước rằng lỗi của` x` là không đáng kể).

`S_y ^ 2 = S_ (y_i) ^ 2` - lỗi (phương sai, bình phương độ lệch chuẩn) trong thứ nguyên `y`, giả sử rằng lỗi là đồng nhất cho tất cả các giá trị` y`.

Thay các công thức tính `a` và` b` vào biểu thức kết quả, ta được

`S_a ^ 2 = S_y ^ 2 frac (sum_ (i = 1) ^ (n) (sum_ (i = 1) ^ (n) x_i ^ 2 - x_i sum_ (i = 1) ^ (n) x_i) ^ 2 ) (D ^ 2) = S_y ^ 2 frac ((n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) sum_ (i = 1) ^ (n) x_i ^ 2) (D ^ 2) = S_y ^ 2 frac (sum_ (i = 1) ^ (n) x_i ^ 2) (D) `(4.1)

`S_b ^ 2 = S_y ^ 2 frac (sum_ (i = 1) ^ (n) (n x_i - sum_ (i = 1) ^ (n) x_i) ^ 2) (D ^ 2) = S_y ^ 2 frac ( n (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2)) (D ^ 2) = S_y ^ 2 frac (n) (D) `(4,2)

Trong hầu hết các thí nghiệm thực tế, giá trị của `Sy` không được đo lường. Để làm được điều này, cần phải thực hiện một số phép đo (thí nghiệm) song song tại một hoặc một số điểm của kế hoạch, điều này làm tăng thời gian (và có thể cả chi phí) của thí nghiệm. Do đó, người ta thường giả định rằng độ lệch của `y` so với đường hồi quy có thể được coi là ngẫu nhiên. Ước tính phương sai `y` trong trường hợp này được tính bằng công thức.

`S_y ^ 2 = S_ (y, rest) ^ 2 = frac (sum_ (i = 1) ^ n (y_i - a - b x_i) ^ 2) (n-2) '.

Ước số `n-2` xuất hiện vì chúng ta đã giảm số bậc tự do do tính toán hai hệ số cho cùng một mẫu dữ liệu thực nghiệm.

Ước tính này còn được gọi là phương sai còn lại so với đường hồi quy `S_ (y, rest) ^ 2`.

Việc đánh giá mức ý nghĩa của các hệ số được thực hiện theo tiêu chí Sinh viên

`t_a = frac (| a |) (S_a)`, `t_b = frac (| b |) (S_b)`

Nếu tiêu chí được tính toán `t_a`,` t_b` nhỏ hơn tiêu chí dạng bảng`t (P, n-2)` thì được coi là hệ số tương ứng không khác 0 đáng kể với xác suất cho trước `P`.

Để đánh giá chất lượng của mô tả mối quan hệ tuyến tính, bạn có thể so sánh `S_ (y, rest) ^ 2` và` S_ (bar y) `so với giá trị trung bình bằng cách sử dụng tiêu chí Fisher.

`S_ (thanh y) = frac (sum_ (i = 1) ^ n (y_i - thanh y) ^ 2) (n-1) = frac (sum_ (i = 1) ^ n (y_i - (sum_ (i = 1) ^ n y_i) / n) ^ 2) (n-1) `- đánh giá mẫu phương sai của `y` so với giá trị trung bình.

Để đánh giá hiệu quả của phương trình hồi quy mô tả sự phụ thuộc, hệ số Fisher được tính
`F = S_ (thanh y) / S_ (y, phần còn lại) ^ 2`,
được so sánh với hệ số Fisher dạng bảng `F (p, n-1, n-2) '.

Nếu `F> F (P, n-1, n-2)`, sự khác biệt giữa mô tả sự phụ thuộc `y = f (x)` sử dụng phương trình hồi quy và mô tả sử dụng giá trị trung bình được coi là có ý nghĩa thống kê với xác suất `P`. Những thứ kia. hồi quy mô tả sự phụ thuộc tốt hơn sự lan truyền của `y` xung quanh giá trị trung bình.

Bấm vào biểu đồ
để thêm các giá trị vào bảng

Phương pháp bình phương tối thiểu. Phương pháp bình phương nhỏ nhất có nghĩa là xác định các tham số a, b, c chưa biết, sự phụ thuộc hàm được chấp nhận

Phương pháp bình phương nhỏ nhất có nghĩa là xác định các tham số chưa biết a, b, c,… sự phụ thuộc chức năng được chấp nhận

y = f (x, a, b, c,…),

sẽ cung cấp tối thiểu bình phương trung bình (phương sai) của lỗi

, (24)

trong đó x i, y i - tập hợp các cặp số thu được từ thí nghiệm.

Vì điều kiện để đạt cực trị của một hàm nhiều biến là điều kiện để các đạo hàm riêng của nó bằng 0, nên các tham số a, b, c,…được xác định từ hệ phương trình:

; ; ; … (25)

Cần phải nhớ rằng phương pháp bình phương nhỏ nhất được sử dụng để chọn các tham số sau dạng của hàm y = f (x)được xác định.

Nếu không có kết luận nào có thể được rút ra từ những cân nhắc lý thuyết về những gì nên công thức thực nghiệm, sau đó người ta phải làm theo biểu diễn trực quan, chủ yếu là biểu diễn đồ họa của dữ liệu được quan sát.

Trong thực tế, hầu hết thường bị giới hạn ở các loại chức năng sau:

1) tuyến tính ;

2) bậc hai a.

Nếu một vài số lượng vật lý phụ thuộc vào một đại lượng khác, khi đó sự phụ thuộc này có thể được nghiên cứu bằng cách đo y tại các giá trị khác nhau x. Kết quả của các phép đo, một loạt các giá trị thu được:

x 1, x 2, ..., x i, ..., x n;

y 1, y 2, ..., y i, ..., y n.

Dựa trên dữ liệu của một thí nghiệm như vậy, có thể vẽ biểu đồ sự phụ thuộc y = ƒ (x). Đường cong kết quả giúp ta có thể đánh giá dạng của hàm ƒ (x). Tuy nhiên hệ số không đổi, được bao gồm trong chức năng này, vẫn chưa được biết. Chúng có thể được xác định bằng phương pháp bình phương nhỏ nhất. Các điểm thực nghiệm, như một quy luật, không nằm chính xác trên đường cong. Phương pháp bình phương nhỏ nhất yêu cầu tổng các độ lệch bình phương của các điểm thực nghiệm so với đường cong, tức là 2 là nhỏ nhất.

Trong thực tế, phương pháp này thường được sử dụng nhất (và đơn giản nhất) trong trường hợp có mối quan hệ tuyến tính, tức là khi nào

y = kx hoặc y = a + bx.

Sự phụ thuộc tuyến tính rất phổ biến trong vật lý. Và ngay cả khi sự phụ thuộc là phi tuyến tính, họ thường cố gắng xây dựng một đồ thị theo cách để có được một đường thẳng. Ví dụ, nếu giả sử rằng chiết suất của thủy tinh n liên hệ với bước sóng λ của sóng ánh sáng theo quan hệ n = a + b / λ 2, thì sự phụ thuộc của n vào λ -2 được vẽ trên đồ thị .

Xem xét sự phụ thuộc y = kx(đường thẳng đi qua gốc tọa độ). Hãy để chúng tôi tính giá trị φ tổng bình phương độ lệch của các điểm của chúng tôi so với đường thẳng

Giá trị của φ luôn dương và càng nhỏ thì điểm của chúng ta càng nằm gần đường thẳng. Phương pháp bình phương nhỏ nhất nói rằng với k người ta nên chọn một giá trị như vậy mà tại đó φ có giá trị nhỏ nhất


hoặc
(19)

Tính toán cho thấy rằng sai số căn bậc hai trong việc xác định giá trị của k bằng

, (20)
với n là số thứ nguyên.

Bây giờ chúng ta hãy xem xét thêm một số trường hợp khó khăn khi các điểm phải thỏa mãn công thức y = a + bx(một đường thẳng không đi qua gốc tọa độ).

Nhiệm vụ là tìm bộ giá trị x i, y i đã cho giá trị tốt nhất A và B.

Hãy sáng tác lại dạng bậc hai φ , bằng tổngđộ lệch bình phương của các điểm x i, y i từ một đường thẳng

và tìm các giá trị a và b để φ có giá trị nhỏ nhất

;

.

.

Quyết định chung những phương trình này cho

(21)

Sai số căn-trung-bình-phương của việc xác định a và b là bằng nhau

(23)

. & nbsp (24)

Khi xử lý kết quả đo bằng phương pháp này, thuận tiện khi tổng hợp tất cả dữ liệu trong một bảng, trong đó tất cả các giá trị có trong công thức (19) (24) được tính toán sơ bộ. Hình thức của các bảng này được hiển thị trong các ví dụ dưới đây.

ví dụ 1 Phương trình động lực học cơ bản đã được nghiên cứu chuyển động quayε = M / J (đường thẳng đi qua gốc tọa độ). Tại các giá trị khác nhau của thời điểm M, nó được đo gia tốc gócε của một số cơ thể. Yêu cầu xác định mômen quán tính của vật này. Kết quả của các phép đo mômen của lực và gia tốc góc được liệt kê trong cột thứ hai và thứ ba bảng 5.

Bảng 5
N M, N m ε, s-1 M2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Theo công thức (19) chúng tôi xác định được:

.

Để xác định lỗi căn bậc hai, chúng tôi sử dụng công thức (20)

0.005775Kilôgam-một · m -2 .

Theo công thức (18) chúng ta có

; .

SJ = (2,996 0,005775) /0,3337 = 0,05185 kg m 2.

Với độ tin cậy P = 0,95, theo bảng hệ số Student cho n = 5, ta tìm được t = 2,78 và xác định được sai số tuyệt đối ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2.

Chúng tôi viết kết quả dưới dạng:

J = (3,0 ± 0,2) kg m 2;


Ví dụ 2 Chúng tôi tính toán hệ số nhiệt độ của điện trở của kim loại bằng phương pháp bình phương nhỏ nhất. Điện trở phụ thuộc vào nhiệt độ theo quy luật tuyến tính

R t \ u003d R 0 (1 + α t °) \ u003d R 0 + R 0 α t °.

Số hạng tự do xác định điện trở R 0 ở nhiệt độ 0 ° C, và tích số hệ số nhiệt độα đến điện trở R 0.

Kết quả của các phép đo và tính toán được cho trong bảng ( xem bảng 6).

Bảng 6
N t °, s r, Ohm t-¯t (t-¯t) 2 (t-¯t) r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑ / n 85.83333 1.4005 – – – – –

Bằng các công thức (21), (22) ta xác định được

R 0 = ¯ R- α R 0 ¯ t = 1.4005 - 0.002645 85.83333 = 1.1735 Om.

Hãy để chúng tôi tìm một lỗi trong định nghĩa của α. Từ đó theo công thức (18) ta có:

.

Sử dụng các công thức (23), (24) ta có

;

0.014126 Om.

Với độ tin cậy P = 0,95, theo bảng hệ số Student cho n = 6, ta tìm được t = 2,57 và xác định được sai số tuyệt đối Δα = 2,57 0,000132 = 0,000338 độ -1.

α = (23 ± 4) 10 -4 kêu-1 tại P = 0,95.


Ví dụ 3 Yêu cầu xác định bán kính cong của thấu kính từ các vòng Newton. Người ta đo bán kính của các vành Newton là r m và xác định được số của các vành này m. Bán kính của các vành Newton liên hệ với bán kính cong của thấu kính R và số vòng theo phương trình

r 2 m = mλR - 2d 0 R,

trong đó d 0 độ dày của khe hở giữa thấu kính và tấm phẳng song song (hoặc biến dạng thấu kính),

λ là bước sóng của ánh sáng tới.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

thì phương trình sẽ có dạng y = a + bx.

.

Kết quả của các phép đo và tính toán được nhập vào bảng 7.

Bảng 7
N x = m y \ u003d r 2, 10 -2 mm 2 m-¯m (m-¯m) 2 (m-¯m) y y-bx-a, 10-4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑ / n 3.5 20.8548333 – – – – –

mà tìm thấy ứng dụng rộng nhất trong các lĩnh vực khác nhau khoa học và hoạt động thực tế. Nó có thể là vật lý, hóa học, sinh học, kinh tế học, xã hội học, tâm lý học, vân vân và vân vân. Theo ý muốn của số phận, tôi thường phải đối phó với kinh tế, và vì vậy hôm nay tôi sẽ sắp xếp cho bạn một tấm vé đến đất nước tuyệt vờiđược phép Kinh tế lượng=)… Làm thế nào để bạn không muốn điều đó?! Nó rất tốt ở đó - bạn chỉ cần quyết định! … Nhưng điều bạn chắc chắn muốn là học cách giải quyết vấn đề bình phương nhỏ nhất. Và đặc biệt là những độc giả siêng năng sẽ học cách giải chúng không chỉ chính xác mà còn RẤT NHANH CHÓNG ;-) Nhưng trước tiên tuyên bố chung của vấn đề+ ví dụ liên quan:

Cho vào một số môn học các chỉ số có biểu hiện định lượng được khảo sát. Đồng thời, có mọi lý do để tin rằng chỉ báo phụ thuộc vào chỉ báo. Giả định này có thể là giả thuyết khoa học và dựa trên cơ sở ý thức chung. Tuy nhiên, hãy để khoa học sang một bên và khám phá các khu vực hấp dẫn hơn - cụ thể là các cửa hàng tạp hóa. Biểu thị bởi:

- không gian bán lẻ của một cửa hàng tạp hóa, diện tích mét vuông,
- doanh thu hàng năm của một cửa hàng tạp hóa, triệu rúp.

Nó khá rõ ràng là gì nhiều khu vực hơn cửa hàng, doanh thu của nó càng lớn trong hầu hết các trường hợp.

Giả sử rằng sau khi tiến hành các quan sát / thí nghiệm / tính toán / nhảy múa với tambourine, chúng ta có dữ liệu số tùy ý:

Với các cửa hàng tạp hóa, tôi nghĩ mọi thứ đều rõ ràng: - đây là diện tích của cửa hàng thứ nhất, - doanh thu hàng năm, - diện tích cửa hàng thứ 2, - doanh thu hàng năm, v.v. Nhân tiện, không cần thiết phải có quyền truy cập vào vật liệu phân loại- đầy đủ ước tính chính xác doanh thu có thể đạt được bằng cách thống kê toán học. Tuy nhiên, đừng lơ là, quá trình làm gián điệp thương mại đã được trả giá rồi =)

Dữ liệu dạng bảng cũng có thể được viết dưới dạng điểm và được mô tả theo cách thông thường đối với chúng ta. Hệ thống Descartes .

Chúng tôi sẽ trả lời Câu hỏi quan trọng: bạn cần bao nhiêu điểm nghiên cứu định tính?

Càng to càng tốt. Tập hợp tối thiểu có thể nhận được bao gồm 5-6 điểm. Ngoài ra, với một lượng nhỏ dữ liệu, không nên đưa các kết quả “bất thường” vào mẫu. Vì vậy, ví dụ: một cửa hàng ưu tú nhỏ có thể giúp cung cấp các đơn đặt hàng lớn hơn "đồng nghiệp của họ", do đó làm sai lệch Mô hình chung, được tìm thấy!

Nếu nó khá đơn giản, chúng tôi cần chọn một chức năng, lịch trình càng gần điểm càng tốt . Một chức năng như vậy được gọi là xấp xỉ (gần đúng - gần đúng) hoặc chức năng lý thuyết . Nói chung, ở đây ngay lập tức xuất hiện "người nộp đơn" rõ ràng - đa thức bằng cấp cao, có đồ thị đi qua TẤT CẢ các điểm. Nhưng tùy chọn này phức tạp và thường không chính xác. (bởi vì biểu đồ sẽ luôn "làm mưa làm gió" và phản ánh kém xu hướng chính).

Do đó, hàm mong muốn phải đủ đơn giản và đồng thời phản ánh sự phụ thuộc một cách đầy đủ. Như bạn có thể đoán, một trong những phương pháp để tìm các hàm như vậy được gọi là bình phương nhỏ nhất. Trước tiên, hãy phân tích bản chất của nó trong nhìn chung. Để một số hàm gần đúng với dữ liệu thử nghiệm:


Làm thế nào để đánh giá độ chính xác của phép gần đúng này? Hãy cũng chúng tôi tính toán sự khác biệt (độ lệch) giữa thử nghiệm và giá trị chức năng (chúng tôi nghiên cứu bản vẽ). Suy nghĩ đầu tiên xuất hiện trong đầu là ước tính xem tổng lớn như thế nào, nhưng vấn đề là sự khác biệt có thể âm. (Ví dụ, ) và các sai lệch do kết quả của sự tổng kết như vậy sẽ triệt tiêu lẫn nhau. Do đó, như một ước tính về độ chính xác của phép gần đúng, nó tự đề xuất lấy tổng mô-đun sai lệch:

hoặc ở dạng gấp: (đột nhiên, ai không biết: là biểu tượng tổng và là một biến phụ - "bộ đếm", nhận các giá trị từ 1 đến).

Tính gần đúng các điểm thử nghiệm với các chức năng khác nhau, chúng ta sẽ thu được những nghĩa khác nhau, và rõ ràng, khi tổng này ít hơn, hàm đó chính xác hơn.

Một phương pháp như vậy tồn tại và được gọi là phương pháp mô đun ít nhất. Tuy nhiên, trong thực tế, nó đã trở nên phổ biến hơn nhiều. phương pháp bình phương nhỏ nhất, trong đó có thể giá trị âm không được loại bỏ bởi mô-đun, mà bằng cách bình phương độ lệch:

, sau đó các nỗ lực được hướng đến việc lựa chọn một hàm sao cho tổng các độ lệch bình phương càng nhỏ càng tốt. Trên thực tế, do đó tên của phương pháp.

Và bây giờ chúng ta trở lại với một tâm điểm: như đã lưu ý ở trên, chức năng được chọn phải khá đơn giản - nhưng cũng có nhiều chức năng như vậy: tuyến tính , hypebol, số mũ, lôgarit, bậc hai vân vân. Và, tất nhiên, ở đây tôi ngay lập tức muốn "giảm lĩnh vực hoạt động." Những lớp chức năng để chọn để nghiên cứu? Nguyên thủy nhưng tiếp nhận hiệu quả:

- Cách dễ nhất để vẽ điểm trên hình vẽ và phân tích vị trí của chúng. Nếu chúng có xu hướng nằm trên một đường thẳng, thì bạn nên tìm phương trình đường thẳng với các giá trị tối ưu và. Nói cách khác, nhiệm vụ là tìm các hệ số SUCH - sao cho tổng các độ lệch bình phương là nhỏ nhất.

Nếu các điểm được định vị, ví dụ, dọc theo cường điệu, thì rõ ràng là hàm tuyến tính sẽ cho giá trị gần đúng kém. Trong trường hợp này, chúng tôi đang tìm kiếm các hệ số "thuận lợi" nhất cho phương trình hyperbol - những cái cho tổng bình phương tối thiểu .

Bây giờ, hãy lưu ý rằng trong cả hai trường hợp, chúng ta đang nói về hàm của hai biến, đối số của ai các tùy chọn phụ thuộc đã tìm kiếm:

Và về bản chất, chúng ta cần giải quyết một vấn đề tiêu chuẩn - để tìm tối thiểu của một hàm có hai biến.

Nhớ lại ví dụ của chúng tôi: giả sử rằng các điểm "cửa hàng" có xu hướng nằm trên một đường thẳng và có mọi lý do để tin rằng sự hiện diện phụ thuộc tuyến tính doanh thu từ khu vực buôn bán. Hãy tìm hệ số SUCH "a" và "be" để tổng bình phương độ lệch là nhỏ nhất. Mọi thứ như thường lệ - đầu tiên đạo hàm riêng của bậc 1. Dựa theo quy tắc tuyến tính bạn có thể phân biệt ngay dưới biểu tượng tổng:

Nếu bạn muốn sử dụng thông tin này cho một bài luận hoặc một bài báo học kỳ - Tôi sẽ rất biết ơn liên kết trong danh sách các nguồn, bạn sẽ tìm thấy các phép tính chi tiết như vậy ở một vài nơi:

Hãy tạo một hệ thống tiêu chuẩn:

Chúng tôi giảm mỗi phương trình đi một "hai" và ngoài ra, "chia nhỏ" các tổng:

Ghi chú : phân tích độc lập tại sao có thể lấy "a" và "be" ra khỏi biểu tượng tổng. Nhân tiện, chính thức điều này có thể được thực hiện với tổng

Hãy viết lại hệ thống ở dạng "đã áp dụng":

sau đó thuật toán để giải quyết vấn đề của chúng ta bắt đầu được rút ra:

Chúng ta có biết tọa độ của các điểm? Chúng tôi biết. Sums chúng ta có thể tìm thấy? Một cách dễ dàng. Chúng tôi soạn đơn giản nhất hệ hai phương trình tuyến tính với hai ẩn số("a" và "beh"). Ví dụ, chúng tôi giải quyết hệ thống, Phương pháp của Cramer, dẫn đến điểm dừng. Kiểm tra điều kiện đủ cho một cực đoan, chúng tôi có thể xác minh rằng tại thời điểm này, hàm đạt được chính xác tối thiểu. Việc xác minh được liên kết với các tính toán bổ sung và do đó chúng tôi sẽ để lại hậu trường. (nếu cần, có thể xem khung bị thiếu). Chúng tôi rút ra kết luận cuối cùng:

Hàm số cách tốt nhất (ít nhất là so với bất kỳ hàm tuyến tính nào khác) mang các điểm thử nghiệm đến gần hơn . Nói một cách đại khái, đồ thị của nó đi càng gần những điểm này càng tốt. Trong truyền thống kinh tế lượng hàm xấp xỉ kết quả còn được gọi là cặp phương trình hồi quy tuyến tính .

Vấn đề đang được xem xét có một giá trị thực tiễn. Trong tình huống với ví dụ của chúng tôi, phương trình cho phép bạn dự đoán loại doanh thu ("yig") sẽ có mặt tại cửa hàng với một hoặc một giá trị khác của khu vực bán hàng (nghĩa này hoặc nghĩa khác của "x"). Đúng, dự báo kết quả sẽ chỉ là dự báo, nhưng trong nhiều trường hợp, nó sẽ trở nên khá chính xác.

Tôi sẽ chỉ phân tích một vấn đề với các con số "thực", vì không có khó khăn nào trong đó - tất cả các phép tính đều ở mức chương trình giáo dục Lớp 7-8. Trong 95% trường hợp, bạn sẽ được yêu cầu chỉ tìm một hàm tuyến tính, nhưng ở phần cuối của bài viết, tôi sẽ chỉ ra rằng việc tìm phương trình cho hyperbol tối ưu, số mũ và một số hàm khác không còn khó khăn hơn.

Trên thực tế, nó vẫn là phân phối các tính năng đã hứa - để bạn học cách giải các ví dụ như vậy không chỉ chính xác mà còn nhanh chóng. Chúng tôi nghiên cứu kỹ lưỡng tiêu chuẩn:

Một nhiệm vụ

Kết quả của việc nghiên cứu mối quan hệ giữa hai chỉ số, thu được các cặp số sau:

Sử dụng phương pháp bình phương nhỏ nhất, tìm hàm tuyến tính gần đúng nhất với thực nghiệm (có kinh nghiệm) dữ liệu. Vẽ một bản vẽ trong đó bằng Descartes hệ thống hình chữ nhật tọa độ xây dựng điểm nghiệm và đồ thị của hàm số xấp xỉ . Tìm tổng bình phương độ lệch giữa các giá trị thực nghiệm và lý thuyết. Tìm hiểu xem chức năng có tốt hơn không (theo phương pháp bình phương nhỏ nhất)điểm thực nghiệm gần đúng.

Lưu ý rằng các giá trị "x" là các giá trị tự nhiên, và điều này có một ý nghĩa đặc trưng, ​​mà tôi sẽ nói về một chút sau; nhưng chúng, tất nhiên, có thể là phân số. Ngoài ra, tùy thuộc vào nội dung của một nhiệm vụ cụ thể, cả hai giá trị "X" và "G" có thể âm hoàn toàn hoặc một phần. Chà, chúng tôi đã được giao một nhiệm vụ "vô diện" và chúng tôi bắt đầu nó dung dịch:

Chúng tôi tìm các hệ số của hàm tối ưu như một nghiệm của hệ thống:

Đối với mục đích của một ký hiệu nhỏ gọn hơn, biến "bộ đếm" có thể được bỏ qua, vì đã rõ ràng rằng việc tổng kết được thực hiện từ 1 đến.

Sẽ thuận tiện hơn khi tính toán số tiền cần thiết dưới dạng bảng:


Các phép tính có thể được thực hiện trên máy tính vi mô, nhưng sử dụng Excel sẽ tốt hơn nhiều - vừa nhanh hơn vừa không bị lỗi; xem một đoạn video ngắn:

Do đó, chúng tôi nhận được những điều sau hệ thống:

Ở đây bạn có thể nhân phương trình thứ hai với 3 và trừ số hạng thứ 2 khỏi số hạng phương trình thứ nhất theo số hạng. Nhưng đây là may mắn - trong thực tế, các hệ thống thường không có năng khiếu, và trong những trường hợp như vậy, nó tiết kiệm Phương pháp của Cramer:
, vì vậy hệ thống có một giải pháp duy nhất.

Hãy kiểm tra. Tôi hiểu rằng tôi không muốn, nhưng tại sao lại bỏ qua những sai lầm mà bạn hoàn toàn không thể bỏ qua? Thay nghiệm tìm được vào vế trái của mỗi phương trình của hệ:

Bên phải đã nhận phương trình tương ứng, có nghĩa là hệ thống được giải quyết chính xác.

Do đó, hàm ước lượng mong muốn: - from tất cả các hàm tuyến tính dữ liệu thực nghiệm được nó gần đúng nhất.

không giống dài sự phụ thuộc của doanh thu của cửa hàng vào khu vực của nó, sự phụ thuộc được tìm thấy là đảo ngược (nguyên tắc "càng nhiều - càng ít") và sự thật này ngay lập tức được tiết lộ bởi hệ số góc. Hàm số cho chúng ta biết rằng khi tăng một chỉ tiêu nào đó lên 1 đơn vị thì giá trị của chỉ tiêu phụ thuộc giảm trung bình tăng 0,65 đơn vị. Như họ nói, giá kiều mạch càng cao thì càng ít bán được.

Để vẽ biểu đồ của hàm gần đúng, chúng tôi tìm hai giá trị của nó:

và thực hiện bản vẽ:


Đường được xây dựng được gọi là đường xu hướng (cụ thể là đường xu hướng tuyến tính, tức là trường hợp chung xu hướng không nhất thiết phải là một đường thẳng). Mọi người đều quen thuộc với thành ngữ "để có xu hướng", và tôi nghĩ rằng thuật ngữ này không cần phải bình luận thêm.

Tính tổng bình phương độ lệch giữa các giá trị thực nghiệm và lý thuyết. Về mặt hình học, đây là tổng bình phương độ dài của các đoạn "màu đỏ thẫm" (hai trong số đó nhỏ đến mức bạn thậm chí không thể nhìn thấy chúng).

Hãy tóm tắt các phép tính trong một bảng:


Chúng một lần nữa có thể được thực hiện theo cách thủ công, đề phòng trường hợp tôi sẽ đưa ra một ví dụ cho điểm đầu tiên:

nhưng nó hiệu quả hơn nhiều để làm theo một cách nào đó:

Hãy lặp lại: ý nghĩa của kết quả là gì? Từ tất cả các hàm tuyến tính hàm số số mũ là nhỏ nhất, tức là nó là xấp xỉ tốt nhất trong họ của nó. Và đây, nhân tiện, không phải là ngẫu nhiên. câu hỏi cuối cùng vấn đề: điều gì sẽ xảy ra nếu hàm mũ được đề xuất sẽ tốt hơn nếu tính gần đúng các điểm thực nghiệm?

Hãy tìm tổng bình phương tương ứng của độ lệch bình phương - để phân biệt chúng, tôi sẽ chỉ định chúng bằng ký tự "epsilon". Kỹ thuật hoàn toàn giống nhau:


Và một lần nữa cho mỗi phép tính cháy cho điểm đầu tiên:

Trong Excel, chúng tôi sử dụng chức năng tiêu chuẩn EXP (Có thể tìm thấy cú pháp trong Trợ giúp Excel).

Sự kết luận:, do đó hàm số mũ xấp xỉ các điểm nghiệm kém hơn đường thẳng .

Nhưng cần lưu ý ở đây rằng "tệ hơn" là không có nghĩa là chưa, chuyện gì thế. Bây giờ tôi đã xây dựng một đồ thị của hàm số mũ này - và nó cũng đi gần đến các điểm - nhiều đến nỗi nếu không có một nghiên cứu phân tích thì rất khó để nói hàm nào chính xác hơn.

Điều này hoàn thành giải pháp, và tôi quay lại câu hỏi về các giá trị tự nhiên của đối số. Trong các nghiên cứu khác nhau, theo quy luật, kinh tế hoặc xã hội học, tháng, năm hoặc các khoảng thời gian bằng nhau khác được đánh số bằng chữ "X" tự nhiên. Ví dụ, hãy xem xét một vấn đề như vậy.

Nó có nhiều ứng dụng, vì nó cho phép biểu diễn gần đúng một hàm đã cho bằng những hàm khác đơn giản hơn. LSM có thể cực kỳ hữu ích trong việc xử lý các quan sát và nó được sử dụng tích cực để ước tính một số đại lượng từ kết quả của các phép đo của những người khác có chứa lỗi ngẫu nhiên. Trong bài viết này, bạn sẽ học cách thực hiện các phép tính bình phương nhỏ nhất trong Excel.

Tuyên bố vấn đề trên một ví dụ cụ thể

Giả sử có hai chỉ số X và Y. Hơn nữa, Y phụ thuộc vào X. Vì OLS được chúng ta quan tâm theo quan điểm của phân tích hồi quy (trong Excel, các phương pháp của nó được thực hiện bằng các hàm dựng sẵn), chúng ta nên tiến hành ngay lập tức. để xem xét một vấn đề cụ thể.

Vì vậy, hãy để X là khu vực giao dịch cửa hàng tạp hóa, được đo bằng mét vuông và Y là doanh thu hàng năm, được định nghĩa bằng hàng triệu rúp.

Cần phải đưa ra dự báo về doanh thu (Y) mà cửa hàng sẽ có nếu nó có một hoặc một không gian bán lẻ khác. Rõ ràng, hàm Y = f (X) đang tăng lên, vì đại siêu thị bán được nhiều hàng hơn quầy hàng.

Vài lời về tính đúng đắn của dữ liệu ban đầu được sử dụng để dự đoán

Giả sử chúng ta có một bảng được xây dựng với dữ liệu cho n cửa hàng.

Dựa theo thống kê toán học, kết quả sẽ ít nhiều đúng nếu dữ liệu của ít nhất 5-6 đối tượng được kiểm tra. Ngoài ra, không thể sử dụng kết quả "dị thường". Đặc biệt, một cửa hàng nhỏ ưu tú có thể có doanh thu lớn hơn nhiều lần so với doanh thu của các cửa hàng lớn thuộc hạng “masmarket”.

Bản chất của phương pháp

Dữ liệu bảng có thể được hiển thị trong Máy bay cartesian dưới dạng các điểm M 1 (x 1, y 1), ... M n (x n, y n). Bây giờ lời giải của bài toán sẽ được rút gọn thành việc chọn một hàm số gần đúng y = f (x), có đồ thị đi qua các điểm M 1, M 2, .. M n càng gần càng tốt.

Tất nhiên, bạn có thể sử dụng đa thức bậc cao, nhưng tùy chọn này không chỉ khó thực hiện mà còn không chính xác, vì nó sẽ không phản ánh xu hướng chính cần được phát hiện. Giải pháp hợp lý nhất là tìm kiếm đường thẳng y = ax + b, đường thẳng này gần đúng nhất với dữ liệu thực nghiệm, và chính xác hơn là các hệ số - a và b.

Điểm chính xác

Đối với bất kỳ giá trị gần đúng nào, việc đánh giá độ chính xác của nó có tầm quan trọng đặc biệt. Biểu thị bằng e i sự khác biệt (độ lệch) giữa các giá trị chức năng và thực nghiệm của điểm x i, tức là e i = y i - f (x i).

Rõ ràng, để đánh giá độ chính xác của phép gần đúng, bạn có thể sử dụng tổng độ lệch, tức là khi chọn một đường thẳng để biểu diễn gần đúng sự phụ thuộc của X vào Y, nên ưu tiên đường thẳng có giá trị nhỏ nhất là tổng e i tại tất cả các điểm đang xét. Tuy nhiên, không phải mọi thứ đều đơn giản như vậy, vì cùng với những sai lệch tích cực, thực tế sẽ có những sai lệch tiêu cực.

Bạn có thể giải quyết vấn đề bằng cách sử dụng các mô-đun độ lệch hoặc hình vuông của chúng. Phương thức cuối cùng nhận được nhiều nhất sử dụng rộng rãi. Nó được sử dụng trong nhiều lĩnh vực bao gồm Phân tích hồi quy(trong Excel, việc triển khai nó được thực hiện bằng hai hàm tích hợp sẵn) và từ lâu đã chứng minh được tính hiệu quả của nó.

Phương pháp bình phương tối thiểu

Trong Excel, như bạn đã biết, có một hàm autosum được tích hợp sẵn cho phép bạn tính giá trị của tất cả các giá trị nằm trong phạm vi đã chọn. Do đó, sẽ không có gì ngăn cản chúng ta tính giá trị của biểu thức (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Trong ký hiệu toán học, điều này trông giống như:

Vì quyết định ban đầu được đưa ra để tính gần đúng bằng cách sử dụng một đường thẳng, chúng tôi có:

Do đó, nhiệm vụ tìm một đường thẳng mô tả tốt nhất mối quan hệ cụ thể giữa X và Y tương đương với việc tính giá trị nhỏ nhất của một hàm có hai biến:

Điều này đòi hỏi phải cân bằng đạo hàm riêng bằng 0 đối với các biến a và b mới, đồng thời giải một hệ nguyên thủy gồm hai phương trình với 2 ẩn số có dạng:

Sau các phép biến đổi đơn giản, bao gồm chia cho 2 và thao tác với các tổng, chúng ta nhận được:

Ví dụ, giải nó bằng phương pháp Cramer, chúng ta thu được một điểm đứng yên với các hệ số a * và b * nhất định. Đây là mức tối thiểu, tức là, để dự đoán doanh thu mà cửa hàng sẽ có khi khu vực nhất định, đường thẳng y \ u003d a * x + b * sẽ làm được, đó là mô hình hồi quy cho ví dụ được đề cập. Tất nhiên cô ấy sẽ không để bạn tìm thấy kết quả chính xác, nhưng sẽ giúp bạn biết liệu việc mua tín dụng tại một cửa hàng cho một khu vực cụ thể có mang lại hiệu quả hay không.

Cách triển khai phương pháp bình phương nhỏ nhất trong Excel

Excel có một hàm để tính giá trị của các ô vuông nhỏ nhất. Cô bé có lần xem tiếp theo: "TREND" (giá trị Y đã biết; giá trị X đã biết; giá trị X mới; hằng số). Hãy áp dụng công thức tính OLS trong Excel cho bảng của chúng tôi.

Để thực hiện việc này, trong ô hiển thị kết quả của phép tính bằng phương pháp bình phương nhỏ nhất trong Excel, hãy nhập dấu “=” và chọn hàm “TREND”. Trong cửa sổ mở ra, hãy điền vào các trường thích hợp, tô sáng:

  • phạm vi giá trị đã biết của Y (trong trường hợp này là dữ liệu về doanh thu);
  • phạm vi x 1,… x n, tức là kích thước của không gian bán lẻ;
  • cả nổi tiếng và giá trị không xác định x, mà bạn cần tìm hiểu quy mô của doanh thu (để biết thông tin về vị trí của họ trên trang tính, xem bên dưới).

Ngoài ra, có một biến logic "Const" trong công thức. Nếu bạn nhập 1 vào trường tương ứng với nó, thì điều này có nghĩa là các phép tính sẽ được thực hiện, giả sử rằng b \ u003d 0.

Nếu bạn cần biết dự báo cho nhiều hơn một giá trị x, thì sau khi nhập công thức, bạn không nên nhấn "Enter", mà bạn cần gõ tổ hợp "Shift" + "Control" + "Enter" ("Enter" ) trên bàn phím.

Một số tính năng

Phân tích hồi quy có thể được truy cập ngay cả với hình nộm. Công thức Excelđể dự đoán giá trị của một mảng các biến chưa biết - "TREND" - có thể được sử dụng ngay cả đối với những người chưa bao giờ nghe nói về phương pháp bình phương nhỏ nhất. Chỉ cần biết một số tính năng về công việc của nó là đủ. Đặc biệt:

  • Nếu chúng ta sắp xếp phạm vi giá trị đã biết của biến y trong một hàng hoặc cột, thì mỗi hàng (cột) với giá trị đã biết x sẽ được chương trình coi như một biến riêng biệt.
  • Nếu phạm vi có x đã biết không được chỉ định trong cửa sổ "TREND", thì trong trường hợp sử dụng hàm trong Chương trình Excel sẽ coi nó như một mảng bao gồm các số nguyên, số tương ứng với phạm vi với các giá trị cho trước của biến y.
  • Để xuất một mảng các giá trị "dự đoán", biểu thức xu hướng phải được nhập dưới dạng công thức mảng.
  • Nếu không có giá trị x mới nào được chỉ định, thì hàm TREND coi chúng bằng những giá trị đã biết. Nếu chúng không được chỉ định, thì mảng 1 được lấy làm đối số; 2; 3; 4;…, tương xứng với phạm vi với các tham số y đã cho sẵn.
  • Phạm vi chứa các giá trị x mới phải bao gồm cùng hoặc hơn hàng hoặc cột, dưới dạng một dải ô với các giá trị y đã cho. Nói cách khác, nó phải tương xứng với các biến độc lập.
  • Một mảng với các giá trị x đã biết có thể chứa nhiều biến. Tuy nhiên, nếu chúng tôi đang nói chuyện chỉ khoảng một, thì các phạm vi với các giá trị đã cho của x và y phải tương xứng. Trong trường hợp có nhiều biến, phạm vi có các giá trị y đã cho phải nằm trong một cột hoặc một hàng.

Chức năng DỰ BÁO

Nó được thực hiện bằng cách sử dụng một số chức năng. Một trong số đó được gọi là "PREDICTION". Nó tương tự như TREND, tức là nó cho kết quả của các phép tính bằng phương pháp bình phương nhỏ nhất. Tuy nhiên, chỉ với một X, mà giá trị của Y là không xác định.

Bây giờ bạn đã biết các công thức Excel cho hình nộm cho phép bạn dự đoán giá trị của giá trị tương lai của một chỉ báo theo xu hướng tuyến tính.

Nó được sử dụng rộng rãi trong kinh tế lượng dưới hình thức giải thích kinh tế rõ ràng cho các tham số của nó.

Hồi quy tuyến tính được rút gọn để tìm một phương trình có dạng

hoặc

Loại phương trình cho phép đặt giá trị tham số X có các giá trị lý thuyết của đối tượng địa lý hiệu quả, thay thế các giá trị thực tế của yếu tố vào nó X.

Việc xây dựng một hồi quy tuyến tính phụ thuộc vào việc ước tính các tham số của nó - mộtTrong. Các ước lượng tham số hồi quy tuyến tính có thể được tìm thấy bằng các phương pháp khác nhau.

Phương pháp cổ điển để ước tính các tham số hồi quy tuyến tính dựa trên bình phương nhỏ nhất(MNK).

LSM cho phép một người có được các ước tính tham số như vậy mộtTrong, theo đó tổng các độ lệch bình phương của các giá trị thực của đặc điểm kết quả (y) từ tính toán (lý thuyết) cực tiểu:

Để tìm cực tiểu của một hàm, cần phải tính các đạo hàm riêng đối với từng tham số mộtb và đánh đồng chúng bằng 0.

Chứng tỏ qua S, sau đó:

Chuyển đổi công thức, chúng tôi nhận được hệ thống tiếp theo phương trình bình thườngđể ước tính tham số mộtTrong:

Giải hệ phương trình thông thường (3.5) bằng phương pháp loại trừ tuần tự các biến hoặc bằng phương pháp của các yếu tố quyết định, chúng tôi tìm thấy các ước lượng bắt buộc của các tham số mộtTrong.

Tham số Trongđược gọi là hệ số hồi quy. Giá trị của nó cho thấy sự thay đổi trung bình của kết quả với sự thay đổi của nhân tố theo một đơn vị.

Phương trình hồi quy luôn được bổ sung một chỉ báo về mức độ chặt chẽ của mối quan hệ. Khi sử dụng hồi quy tuyến tính, hệ số tương quan tuyến tính hoạt động như một chỉ báo. Có các phiên bản khác nhau của công thức hệ số tuyến tính các mối tương quan. Một số trong số họ được liệt kê dưới đây:

Như bạn đã biết, hệ số tương quan tuyến tính nằm trong giới hạn: -1 1.

Để đánh giá chất lượng của việc lựa chọn hàm tuyến tính hình vuông được tính toán

Hệ số tương quan tuyến tính được gọi là hệ số xác định. Hệ số xác định đặc trưng cho tỷ lệ phương sai của tính năng hữu hiệu y, giải thích bằng hồi quy tổng phương sai dấu hiệu hiệu quả:

Theo đó, giá trị 1 - đặc trưng cho tỷ lệ phân tán y, gây ra bởi ảnh hưởng của các yếu tố khác không được tính đến trong mô hình.

Câu hỏi để kiểm soát bản thân

1. Thực chất của phương pháp bình phương nhỏ nhất?

2. Có bao nhiêu biến cung cấp một hồi quy theo cặp?

3. Hệ số nào xác định độ chặt chẽ của mối liên kết giữa các thay đổi?

4. Hệ số xác định được xác định trong giới hạn nào?

5. Ước lượng tham số b trong phân tích tương quan-hồi quy?

1. Christopher Dougherty. Giới thiệu về kinh tế lượng. - M.: INFRA - M, 2001 - 402 tr.

2. S.A. Borodich. Kinh tế lượng. Minsk LLC "Kiến thức mới" 2001.


3. R.U. Rakhmetov Khóa học ngắn hạn trong kinh tế lượng. Hướng dẫn. Almaty. Năm 2004. -78 giây.

4. I.I. Eliseeva. Kinh tế lượng. - M.: "Tài chính và thống kê", 2002

5. Tạp chí thông tin và phân tích hàng tháng.

Các mô hình kinh tế phi tuyến. Các mô hình hồi quy phi tuyến. Biến đổi.

Phi tuyến tính mô hình kinh tế..

Biến đổi.

hệ số co giãn.

Nếu giữa hiện tượng kinh tế có các quan hệ phi tuyến tính, sau đó chúng được thể hiện bằng cách sử dụng chức năng phi tuyến: ví dụ, một hyperbola cạnh đều , parabolas bậc hai và vân vân.

Có hai loại hồi quy phi tuyến tính:

1. Hồi quy không tuyến tính đối với các biến giải thích được đưa vào phân tích, nhưng tuyến tính đối với các tham số ước tính, ví dụ:

Đa thức các mức độ khác nhau - , ;

Cường điệu bằng nhau -;

Hàm số bán nguyệt -.

2. Các hồi quy phi tuyến tính trong các tham số ước tính, ví dụ:

Quyền lực - ;

Biểu tình -;

Số mũ - .

Tổng bình phương độ lệch giá trị cá nhân tính năng hiệu quả tại từ giá trị trung bình là do ảnh hưởng của nhiều yếu tố. Theo điều kiện, chúng tôi chia toàn bộ lý do thành hai nhóm: yếu tố nghiên cứu xnhững yếu tố khác.

Nếu yếu tố không ảnh hưởng đến kết quả thì đường hồi quy trên đồ thị song song với trục Oh

Khi đó, toàn bộ sự phân tán của thuộc tính hiệu quả là do ảnh hưởng của các yếu tố khác và tổng cộngđộ lệch bình phương sẽ trùng với phần dư. Nếu các yếu tố khác không ảnh hưởng đến kết quả, thì bạn bị trói Với X về mặt chức năng và dư lượng hình vuông bằng không. Trong trường hợp này, tổng bình phương độ lệch được giải thích bởi hồi quy giống như tổng bình phương.

Vì không phải tất cả các điểm của trường tương quan đều nằm trên đường hồi quy, nên sự phân tán của chúng luôn diễn ra do ảnh hưởng của yếu tố X, tức là hồi quy tại trên X, và gây ra bởi hành động của các nguyên nhân khác (biến thể không giải thích được). Sự phù hợp của đường hồi quy để dự báo phụ thuộc vào phần nào biến thể chung dấu hiệu tại giải thích cho biến thể được giải thích

Rõ ràng, nếu tổng bình phương độ lệch do hồi quy lớn hơn tổng bình phương còn lại, thì phương trình hồi quy có ý nghĩa thống kê và hệ số X có ảnh hưởng đáng kể đến kết quả. y.

, tức là với số lượng tự do biến đổi độc lập của đối tượng địa lý. Số bậc tự do liên quan đến số đơn vị của tổng thể n và số hằng số được xác định từ nó. Liên quan đến vấn đề đang nghiên cứu, số bậc tự do phải cho thấy có bao nhiêu độ lệch độc lập so với P

Việc đánh giá tầm quan trọng của toàn bộ phương trình hồi quy được đưa ra với sự trợ giúp của F- Tiêu chí của Fisher. Trong trường hợp này, giả thuyết rỗng được đưa ra rằng hệ số hồi quy bằng 0, tức là b = 0 và do đó hệ số X không ảnh hưởng đến kết quả y.

Việc tính toán trực tiếp tiêu chí F được thực hiện trước bằng phân tích phương sai. Trọng tâm của nó là sự mở rộng tổng bình phương độ lệch của biến tại từ giá trị trung bình tại thành hai phần - "giải thích" và "không giải thích":

- tổng bình phương các sai lệch;

- tổng các độ lệch bình phương được giải thích bằng hồi quy;

là tổng dư của các bình phương của độ lệch.

Bất kỳ tổng bình phương nào của độ lệch bình phương đều liên quan đến số bậc tự do , tức là với số lượng tự do biến đổi độc lập của đối tượng địa lý. Số bậc tự do có liên quan đến số lượng đơn vị dân số N và với số lượng hằng số được xác định từ nó. Liên quan đến vấn đề đang nghiên cứu, số bậc tự do phải cho thấy có bao nhiêu độ lệch độc lập so với P có thể được yêu cầu để tạo thành một tổng bình phương cho trước.

Độ phân tán trên mỗi bậc tự doD.

Tỷ lệ F (tiêu chí F):

Nếu giả thuyết vô hiệu là đúng, sau đó là giai thừa và sự phân tán còn lại không khác biệt với nhau. Đối với H 0, một bác bỏ là cần thiết để phương sai của hệ số vượt quá phần dư vài lần. Nhà thống kê người Anh Snedecor đã phát triển các bảng giá trị tới hạn F-các mối quan hệ ở các mức độ trọng yếu khác nhau giả thuyết vô hiệunhiều số khác nhau bậc tự do. Bảng giá trị F- tiêu chuẩn là giá trị lớn nhất của tỷ lệ phương sai, có thể xảy ra trong trường hợp phân kỳ ngẫu nhiên của chúng đối với cấp độ nhất định xác suất có giả thuyết vô hiệu. Giá trị được tính toán F-Quan hệ tương quan được công nhận là đáng tin cậy nếu o lớn hơn giá trị ở dạng bảng.

Trong trường hợp này, giả thuyết vô hiệu về việc không có mối quan hệ của các đối tượng địa lý bị bác bỏ và một kết luận được đưa ra về tầm quan trọng của mối quan hệ này: F fact> F table H 0 bị từ chối.

Nếu giá trị nhỏ hơn bảng F fact ‹, bảng F, thì xác suất của giả thuyết rỗng cao hơn một mức cho trước và nó không thể bị bác bỏ nếu không có nguy cơ nghiêm trọng đưa ra kết luận sai về sự hiện diện của một mối quan hệ. Trong trường hợp này, phương trình hồi quy được coi là không có ý nghĩa thống kê. N o không lệch.

Sai số chuẩn của hệ số hồi quy

Để đánh giá tầm quan trọng của hệ số hồi quy, giá trị của nó được so sánh với lỗi tiêu chuẩn, tức là giá trị thực được xác định t-Tiêu chí của học sinh: sau đó được so sánh với bảng giá trịở một mức ý nghĩa nhất định và số bậc tự do ( N- 2).

Lỗi chuẩn tham số một:

Ý nghĩa của hệ số tương quan tuyến tính được kiểm tra dựa trên độ lớn của sai số Hệ số tương quan r:

Tổng phương sai của một đối tượng địa lý X:

Hồi quy nhiều tuyến tính

Xây dựng mô hình

Hồi quy nhiều lần là một hồi quy của đặc điểm kết quả với hai và một số lượng lớn các yếu tố, tức là mô hình chế độ xem

Hồi quy có thể cho kết quả tốt trong việc mô hình hóa nếu có thể bỏ qua ảnh hưởng của các yếu tố khác ảnh hưởng đến đối tượng nghiên cứu. Hành vi của các biến số kinh tế riêng lẻ không thể được kiểm soát, nghĩa là không thể đảm bảo sự bình đẳng của tất cả các điều kiện khác để đánh giá mức độ ảnh hưởng của một nhân tố đang nghiên cứu. Trong trường hợp này, bạn nên cố gắng xác định ảnh hưởng của các yếu tố khác bằng cách đưa chúng vào mô hình, tức là xây dựng phương trình hồi quy nhiều lần: y = a + b 1 x 1 + b 2 +… + b p x p + .

Mục tiêu chính của hồi quy bội là xây dựng một mô hình với một số lượng lớn các yếu tố, đồng thời xác định mức độ ảnh hưởng của từng yếu tố riêng lẻ, cũng như tác động tích lũy của chúng đối với chỉ số được mô hình hóa. Đặc điểm kỹ thuật của mô hình bao gồm hai lĩnh vực câu hỏi: lựa chọn các yếu tố và lựa chọn loại phương trình hồi quy