Giải pháp bình phương ít nhất. LSM trong trường hợp mô hình tuyến tính

Ví dụ.

Dữ liệu thực nghiệm về giá trị của các biến X và tạiđược đưa ra trong bảng.

Do sự liên kết của chúng, hàm

Sử dụng phương pháp bình phương nhỏ nhất , tính gần đúng những dữ liệu này với sự phụ thuộc tuyến tính y = ax + b(tìm các tùy chọn một và b). Tìm xem dòng nào tốt hơn (theo nghĩa của phương pháp bình phương nhỏ nhất) sắp xếp dữ liệu thực nghiệm. Vẽ tranh.

Bản chất của phương pháp bình phương nhỏ nhất (LSM).

Vấn đề là tìm các hệ số phụ thuộc tuyến tính mà hàm của hai biến một và b chấp nhận giá trị nhỏ nhất. Đó là, với dữ liệu một và b tổng các độ lệch bình phương của dữ liệu thực nghiệm từ đường thẳng tìm được sẽ là nhỏ nhất. Đây là toàn bộ điểm của phương pháp bình phương nhỏ nhất.

Do đó, lời giải của ví dụ được rút gọn thành việc tìm cực trị của một hàm hai biến.

Suy ra công thức tìm hệ số.

Một hệ hai phương trình với hai ẩn số được biên soạn và giải. Tìm đạo hàm riêng của hàm bởi các biến một và b, chúng tôi đánh đồng các đạo hàm này bằng không.

Chúng tôi giải hệ phương trình kết quả bằng bất kỳ phương pháp nào (ví dụ phương pháp thay thế hoặc Phương pháp của Cramer) và có được các công thức để tìm các hệ số bằng phương pháp bình phương nhỏ nhất (LSM).

Với dữ liệu một và b hàm số nhận giá trị nhỏ nhất. Bằng chứng về thực tế này được đưa ra bên dưới văn bản ở cuối trang.

Đó là toàn bộ phương pháp bình phương nhỏ nhất. Công thức tìm tham số một chứa các tổng ,,, và tham số N- lượng dữ liệu thực nghiệm. Giá trị của các tổng này được khuyến nghị tính riêng. Hệ số b tìm thấy sau khi tính toán một.

Đã đến lúc nhớ lại ví dụ ban đầu.

Quyết định.

Trong ví dụ của chúng tôi n = 5. Chúng tôi điền vào bảng để thuận tiện cho việc tính toán các số tiền có trong công thức của các hệ số cần thiết.

Các giá trị trong hàng thứ tư của bảng nhận được bằng cách nhân các giá trị của hàng thứ 2 với giá trị của hàng thứ 3 cho mỗi số tôi.

Các giá trị trong hàng thứ năm của bảng nhận được bằng cách bình phương các giá trị của hàng thứ 2 cho mỗi số tôi.

Giá trị của cột cuối cùng của bảng là tổng các giá trị trên các hàng.

Chúng tôi sử dụng các công thức của phương pháp bình phương nhỏ nhất để tìm các hệ số một và b. Chúng tôi thay thế chúng bằng các giá trị tương ứng từ cột cuối cùng của bảng:

Vì thế, y = 0,165x + 2,184 là đường thẳng ước lượng mong muốn.

Nó vẫn còn để tìm ra dòng nào trong số các dòng y = 0,165x + 2,184 hoặc gần đúng hơn với dữ liệu ban đầu, tức là để ước tính bằng phương pháp bình phương nhỏ nhất.

Ước lượng sai số của phương pháp bình phương nhỏ nhất.

Để làm điều này, bạn cần tính tổng độ lệch bình phương của dữ liệu ban đầu từ các dòng này và , một giá trị nhỏ hơn tương ứng với một dòng gần đúng hơn với dữ liệu ban đầu theo phương pháp bình phương nhỏ nhất.

Kể từ đó, dòng y = 0,165x + 2,184 gần đúng với dữ liệu gốc tốt hơn.

Hình ảnh minh họa của phương pháp bình phương nhỏ nhất (LSM).

Mọi thứ trông tuyệt vời trên bảng xếp hạng. Dòng màu đỏ là dòng được tìm thấy y = 0,165x + 2,184, đường màu xanh lam là , các chấm màu hồng là dữ liệu gốc.

Trong thực tế, khi mô hình hóa các quá trình khác nhau - cụ thể là kinh tế, vật lý, kỹ thuật, xã hội - những phương pháp tính toán giá trị gần đúng của các hàm từ các giá trị đã biết của chúng tại một số điểm cố định được sử dụng rộng rãi.

Các vấn đề về tính gần đúng của các hàm dạng này thường phát sinh:

khi xây dựng các công thức tính gần đúng để tính giá trị của các đại lượng đặc trưng của quá trình đang nghiên cứu theo dữ liệu dạng bảng thu được từ kết quả thí nghiệm;

tích phân số, phân biệt, giải phương trình vi phân vân vân.;

nếu cần tính các giá trị của hàm số tại các điểm trung gian của khoảng đã xét;

khi xác định các giá trị của các đại lượng đặc trưng của quá trình nằm ngoài khoảng đang xét, cụ thể là khi dự báo.

Nếu, để mô hình hóa một quá trình nhất định được chỉ định bởi một bảng, một hàm được xây dựng mô tả gần đúng quá trình này dựa trên phương pháp bình phương nhỏ nhất, nó sẽ được gọi là hàm xấp xỉ (hồi quy) và nhiệm vụ xây dựng các hàm xấp xỉ chính nó sẽ là một bài toán gần đúng.

Bài viết này thảo luận về các khả năng của gói MS Excel để giải quyết các vấn đề như vậy, ngoài ra, các phương pháp và kỹ thuật xây dựng (tạo) hồi quy cho các hàm đã cho theo bảng (là cơ sở của phân tích hồi quy) cũng được đưa ra.

Có hai tùy chọn để xây dựng hồi quy trong Excel.

Thêm các khu vực đã chọn ( đường xu hướng- đường xu hướng) thành biểu đồ được xây dựng trên cơ sở bảng dữ liệu cho đặc tính của quá trình đã nghiên cứu (chỉ có sẵn nếu biểu đồ được xây dựng);

Sử dụng các hàm thống kê có sẵn của trang tính Excel, cho phép bạn lấy các hồi quy (đường xu hướng) trực tiếp từ bảng dữ liệu nguồn.

Thêm đường xu hướng vào biểu đồ

Đối với một bảng dữ liệu mô tả một quy trình nhất định và được biểu diễn bằng biểu đồ, Excel có một công cụ phân tích hồi quy hiệu quả cho phép bạn:

xây dựng dựa trên phương pháp bình phương nhỏ nhất và thêm năm vào sơ đồ các loại hồi quy, với các mức độ chính xác khác nhau, mô hình hóa quá trình đang nghiên cứu;

thêm một phương trình của hồi quy đã xây dựng vào sơ đồ;

xác định mức độ tuân thủ của hồi quy đã chọn với dữ liệu hiển thị trên biểu đồ.

Dựa trên dữ liệu biểu đồ, Excel cho phép bạn lấy các loại hồi quy tuyến tính, đa thức, logarit, hàm mũ, lũy thừa, được đưa ra bởi phương trình:

y = y (x)

trong đó x là một biến độc lập, thường nhận các giá trị của một dãy số tự nhiên (1; 2; 3; ...) và tạo ra, ví dụ: đếm ngược thời gian của quá trình đang nghiên cứu (đặc điểm) .

1 . Hồi quy tuyến tính tốt trong việc mô hình hóa các đối tượng địa lý tăng hoặc giảm với tốc độ không đổi. Đây là mô hình đơn giản nhất của quy trình đang được nghiên cứu. Nó được xây dựng theo phương trình:

y = mx + b

trong đó m là tiếp tuyến của hệ số góc hồi quy tuyến tínhđến trục x; b - tọa độ giao điểm của hồi quy tuyến tính với trục y.

2 . Đường xu hướng đa thức hữu ích để mô tả các đặc điểm có một số điểm cực trị riêng biệt (giá trị cao và điểm thấp nhất). Sự lựa chọn bậc của đa thức được xác định bởi số cực trị của đặc trưng đang nghiên cứu. Do đó, một đa thức bậc hai có thể mô tả tốt một quá trình chỉ có một cực đại hoặc cực tiểu; đa thức bậc ba - không quá hai cực trị; đa thức bậc 4 - không quá ba cực trị, v.v.

Trong trường hợp này, đường xu hướng được xây dựng theo phương trình:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

trong đó các hệ số c0, c1, c2, ... c6 là các hằng số mà giá trị của nó được xác định trong quá trình xây dựng.

3 . Đường xu hướng logarit được sử dụng thành công trong các đặc điểm mô hình hóa, các giá trị của chúng thay đổi nhanh chóng lúc đầu, và sau đó ổn định dần.

y = c ln (x) + b

4 . Đường xu hướng công suất cho kết quả tốt nếu các giá trị của sự phụ thuộc được nghiên cứu được đặc trưng bởi sự thay đổi liên tục trong tốc độ tăng trưởng. Ví dụ về sự phụ thuộc như vậy có thể dùng như một đồ thị về chuyển động có gia tốc đều của ô tô. Nếu không có hoặc giá trị âm, bạn không thể sử dụng đường xu hướng công suất.

Nó được xây dựng theo phương trình:

y = cxb

trong đó các hệ số b, c là hằng số.

5 . Đường xu hướng hàm mũ nên được sử dụng nếu tốc độ thay đổi trong dữ liệu liên tục tăng. Đối với dữ liệu có chứa giá trị bằng 0 hoặc âm, loại xấp xỉ này cũng không được áp dụng.

Nó được xây dựng theo phương trình:

y = cebx

trong đó các hệ số b, c là hằng số.

Khi chọn một đường xu hướng, Excel sẽ tự động tính toán giá trị của R2, đặc trưng cho độ chính xác của phép gần đúng: giá trị R2 càng gần một thì đường xu hướng càng gần đúng với quá trình đang nghiên cứu. Nếu cần, giá trị của R2 luôn có thể được hiển thị trên sơ đồ.

Được xác định theo công thức:

Để thêm đường xu hướng vào chuỗi dữ liệu:

kích hoạt biểu đồ được xây dựng trên cơ sở chuỗi dữ liệu, tức là nhấp vào trong vùng biểu đồ. Mục Biểu đồ sẽ xuất hiện trong menu chính;

Sau khi nhấp vào mục này, một menu sẽ xuất hiện trên màn hình, trong đó bạn nên chọn lệnh Thêm đường xu hướng.

Các hành động tương tự được thực hiện dễ dàng nếu bạn di chuột qua biểu đồ tương ứng với một trong các chuỗi dữ liệu và nhấp chuột phải; trong menu ngữ cảnh xuất hiện, hãy chọn lệnh Thêm đường xu hướng. Hộp thoại Đường xu hướng sẽ xuất hiện trên màn hình với tab Loại được mở (Hình 1).

Sau đó bạn cần:

Trên tab Loại, chọn loại đường xu hướng cần thiết (Tuyến tính được chọn theo mặc định). Đối với kiểu Đa thức, trong trường Độ, hãy chỉ định bậc của đa thức đã chọn.

1 . Trường Tích hợp trên Chuỗi liệt kê tất cả chuỗi dữ liệu trong biểu đồ được đề cập. Để thêm đường xu hướng vào một chuỗi dữ liệu cụ thể, hãy chọn tên của nó trong trường Được xây dựng trên chuỗi.

Nếu cần, bằng cách chuyển đến tab Tham số (Hình 2), bạn có thể đặt các tham số sau cho đường xu hướng:

thay đổi tên của đường xu hướng trong Tên của trường đường cong xấp xỉ (làm mịn).

đặt số khoảng thời gian (tiến hoặc lùi) cho dự báo trong trường Dự báo;

hiển thị phương trình của đường xu hướng trong khu vực biểu đồ mà bạn nên bật hộp kiểm hiển thị phương trình trên biểu đồ;

hiển thị giá trị của độ tin cậy gần đúng R2 trong vùng sơ đồ, bạn nên bật hộp kiểm để đặt giá trị của độ tin cậy gần đúng (R ^ 2) trên biểu đồ;

đặt điểm giao của đường xu hướng với trục Y, mà bạn nên bật hộp kiểm Giao điểm của đường cong với trục Y tại một điểm;

nhấp vào nút OK để đóng hộp thoại.

Có ba cách để bắt đầu chỉnh sửa đường xu hướng đã được tạo sẵn:

sử dụng lệnh Đường xu hướng đã chọn từ menu Định dạng, sau khi chọn đường xu hướng;

chọn lệnh Định dạng Đường xu hướng từ trình đơn ngữ cảnh, lệnh này được gọi bằng cách nhấp chuột phải vào đường xu hướng;

bằng cách nhấp đúp vào đường xu hướng.

Hộp thoại Đường xu hướng định dạng sẽ xuất hiện trên màn hình (Hình 3), chứa ba tab: Xem, Kiểu, Tham số và nội dung của hai tab cuối cùng hoàn toàn trùng khớp với các tab tương tự của hộp thoại Đường xu hướng (Hình 1-2 ). Trên tab Chế độ xem, bạn có thể đặt loại đường, màu sắc và độ dày của nó.

Để xóa một đường xu hướng đã được xây dựng, hãy chọn đường xu hướng cần xóa và nhấn phím Delete.

Ưu điểm của công cụ phân tích hồi quy được coi là:

sự dễ dàng tương đối của việc vẽ đường xu hướng trên biểu đồ mà không cần tạo bảng dữ liệu cho nó;

một danh sách khá rộng các loại đường xu hướng được đề xuất và danh sách này bao gồm các loại hồi quy được sử dụng phổ biến nhất;

khả năng dự đoán hành vi của quá trình đang nghiên cứu cho một tùy ý (trong ý thức chung) số bước tiến cũng như lùi;

khả năng thu được phương trình của đường xu hướng ở dạng phân tích;

khả năng thu được đánh giá độ tin cậy của phép gần đúng, nếu cần.

Những bất lợi bao gồm các điểm sau:

việc xây dựng đường xu hướng chỉ được thực hiện nếu có một biểu đồ được xây dựng trên một chuỗi dữ liệu;

Quá trình tạo chuỗi dữ liệu cho đặc tính đang được nghiên cứu dựa trên phương trình đường xu hướng thu được hơi lộn xộn: các phương trình hồi quy bắt buộc được cập nhật với mỗi thay đổi trong giá trị của chuỗi dữ liệu gốc, nhưng chỉ trong vùng biểu đồ , trong khi chuỗi dữ liệu được hình thành trên cơ sở xu hướng phương trình đường cũ, vẫn không thay đổi;

Trong báo cáo PivotChart, khi bạn thay đổi chế độ xem biểu đồ hoặc báo cáo PivotTable được liên kết, các đường xu hướng hiện có sẽ không được bảo toàn, vì vậy bạn phải đảm bảo rằng bố cục của báo cáo đáp ứng các yêu cầu của bạn trước khi bạn vẽ đường xu hướng hoặc định dạng báo cáo PivotChart.

Các đường xu hướng có thể được thêm vào chuỗi dữ liệu được trình bày trên biểu đồ như biểu đồ, biểu đồ, biểu đồ vùng không chuẩn hóa phẳng, biểu đồ thanh, phân tán, bong bóng và cổ phiếu.

Bạn không thể thêm đường xu hướng vào chuỗi dữ liệu trên biểu đồ 3-D, Chuẩn, Radar, Hình tròn và Bánh rán.

Sử dụng các hàm Excel tích hợp sẵn

Excel cũng cung cấp một công cụ phân tích hồi quy để vẽ các đường xu hướng bên ngoài vùng biểu đồ. Một số hàm trang tính thống kê có thể được sử dụng cho mục đích này, nhưng tất cả chúng đều cho phép bạn chỉ tạo các hồi quy tuyến tính hoặc hàm mũ.

Excel có một số hàm để xây dựng hồi quy tuyến tính, cụ thể là:

XU HƯỚNG;

SLOPE và CUT.

Cũng như một số hàm để xây dựng đường xu hướng hàm mũ, cụ thể là:

LGRFPapprox.

Cần lưu ý rằng các kỹ thuật xây dựng hồi quy bằng cách sử dụng các hàm TREND và GROWTH thực tế là giống nhau. Điều tương tự cũng có thể nói về cặp hàm LINEST và LGRFPRIBL. Đối với bốn hàm này, khi tạo bảng giá trị, các tính năng Excel như công thức mảng sẽ được sử dụng, điều này phần nào làm xáo trộn quá trình xây dựng hồi quy. Chúng tôi cũng lưu ý rằng việc xây dựng một hồi quy tuyến tính, theo quan điểm của chúng tôi, là dễ thực hiện nhất bằng cách sử dụng các hàm SLOPE và INTERCEPT, trong đó hàm đầu tiên xác định độ dốc của hồi quy tuyến tính và hàm thứ hai xác định đoạn bị cắt bởi hồi quy trên trục y.

Ưu điểm của công cụ chức năng tích hợp để phân tích hồi quy là:

một quá trình khá đơn giản của cùng một kiểu hình thành chuỗi dữ liệu của đặc trưng đang được nghiên cứu cho tất cả các hàm thống kê cài sẵn thiết lập các đường xu hướng;

một kỹ thuật tiêu chuẩn để xây dựng các đường xu hướng dựa trên chuỗi dữ liệu đã tạo;

khả năng dự đoán hành vi của quá trình đang nghiên cứu về khối lượng bắt buộc bước tiến hoặc lùi.

Và những bất lợi bao gồm thực tế là Excel không có các hàm tích hợp để tạo các loại đường xu hướng khác (ngoại trừ tuyến tính và hàm mũ). Tình huống này thường không cho phép lựa chọn một mô hình đủ chính xác của quá trình đang nghiên cứu, cũng như có được những dự báo sát với thực tế. Ngoài ra, khi sử dụng các hàm TREND và GROW, phương trình của các đường xu hướng không được biết.

Cần lưu ý rằng các tác giả đã không đặt mục tiêu của bài báo là trình bày quá trình phân tích hồi quy với các mức độ hoàn chỉnh khác nhau. Nhiệm vụ chính của nó là thể hiện khả năng của gói Excel trong việc giải các bài toán xấp xỉ bằng cách sử dụng các ví dụ cụ thể; chứng minh những công cụ hiệu quả nào mà Excel có để xây dựng hồi quy và dự báo; minh họa cách những vấn đề như vậy có thể được giải quyết một cách tương đối dễ dàng ngay cả khi người dùng không có kiến thức sâu về phân tích hồi quy.

Ví dụ về giải quyết các vấn đề cụ thể

Xem xét giải pháp của các vấn đề cụ thể bằng cách sử dụng các công cụ được liệt kê của gói Excel.

Nhiệm vụ 1

Với bảng số liệu về lợi nhuận của doanh nghiệp vận tải cơ giới năm 1995-2002. bạn cần phải làm như sau.

Xây dựng biểu đồ.

Thêm các đường xu hướng tuyến tính và đa thức (bậc hai và bậc ba) vào biểu đồ.

Sử dụng phương trình đường xu hướng, thu được dữ liệu dạng bảng về lợi nhuận của doanh nghiệp cho từng đường xu hướng trong giai đoạn 1995-2004.

Lập dự báo lợi nhuận của doanh nghiệp cho năm 2003 và 2004.

Giải pháp của vấn đề

Trong phạm vi ô A4: C11 của trang tính Excel, chúng tôi nhập trang tính được hiển thị trong Hình. 4.

Sau khi chọn phạm vi ô B4: C11, chúng tôi xây dựng một biểu đồ.

Chúng tôi kích hoạt biểu đồ đã xây dựng và theo phương pháp được mô tả ở trên, sau khi chọn loại đường xu hướng trong hộp thoại Đường xu hướng (xem Hình 1), chúng tôi lần lượt thêm các đường xu hướng tuyến tính, bậc hai và khối vào biểu đồ. Trong cùng một hộp thoại, hãy mở tab Tham số (xem Hình 2), trong Tên của trường đường cong xấp xỉ (làm mịn), hãy nhập tên của xu hướng được thêm vào và trong trường Dự báo chuyển tiếp cho: giai đoạn, hãy đặt giá trị 2, vì nó được lên kế hoạch đưa ra dự báo lợi nhuận cho hai năm tới. Để hiển thị phương trình hồi quy và giá trị độ tin cậy gần đúng R2 trong vùng sơ đồ, hãy bật hộp kiểm Hiển thị phương trình trên màn hình và đặt giá trị độ tin cậy gần đúng (R ^ 2) trên biểu đồ. Để nhận thức trực quan tốt hơn, chúng tôi thay đổi loại, màu sắc và độ dày của các đường xu hướng đã xây dựng, chúng tôi sử dụng tab View của hộp thoại Định dạng đường xu hướng (xem Hình 3). Biểu đồ kết quả với các đường xu hướng được bổ sung được hiển thị trong hình. 5.

Để có được dữ liệu dạng bảng về lợi nhuận của doanh nghiệp cho từng đường xu hướng trong giai đoạn 1995-2004. Hãy sử dụng phương trình của các đường xu hướng được trình bày trong hình. 5. Để thực hiện việc này, trong các ô của phạm vi D3: F3, hãy nhập thông tin dạng văn bản về loại đường xu hướng đã chọn: Xu hướng tuyến tính, Xu hướng bậc hai, Xu hướng khối. Tiếp theo, nhập công thức hồi quy tuyến tính vào ô D4 và sử dụng điểm đánh dấu điền, sao chép công thức này với các tham chiếu tương đối đến phạm vi ô D5: D13. Cần lưu ý rằng mỗi ô có công thức hồi quy tuyến tính từ phạm vi ô D4: D13 có một ô tương ứng từ phạm vi A4: A13 làm đối số. Tương tự, đối với hồi quy bậc hai, phạm vi ô E4: E13 được lấp đầy và đối với hồi quy bậc ba, phạm vi ô F4: F13 được lấp đầy. Do đó, một dự báo về lợi nhuận của doanh nghiệp cho năm 2003 và 2004 đã được đưa ra. với ba xu hướng. Bảng giá trị kết quả được hiển thị trong hình. 6.

Nhiệm vụ 2

Xây dựng biểu đồ.

Thêm các đường xu hướng logarit, hàm mũ và hàm mũ vào biểu đồ.

Suy ra phương trình của các đường xu hướng thu được, cũng như các giá trị của độ tin cậy gần đúng R2 cho từng đường đó.

Sử dụng phương trình đường xu hướng, có được dữ liệu dạng bảng về lợi nhuận của doanh nghiệp cho từng đường xu hướng trong giai đoạn 1995-2002.

Lập dự báo lợi nhuận cho doanh nghiệp cho năm 2003 và 2004 bằng cách sử dụng các đường xu hướng này.

Giải pháp của vấn đề

Theo phương pháp được đưa ra khi giải quyết vấn đề 1, chúng ta thu được một sơ đồ có thêm các đường xu hướng logarit, hàm mũ và hàm mũ (Hình 7). Hơn nữa, sử dụng các phương trình đường xu hướng thu được, chúng tôi điền vào bảng giá trị lợi nhuận của doanh nghiệp, bao gồm các giá trị dự đoán cho năm 2003 và 2004. (Hình 8).

Trên hình. 5 và hình có thể thấy rằng mô hình có xu hướng logarit tương ứng với giá trị thấp nhất của độ tin cậy xấp xỉ

R2 = 0,8659

Các giá trị cao nhất của R2 tương ứng với các mô hình có xu hướng đa thức: bậc hai (R2 = 0,9263) và bậc ba (R2 = 0,933).

Nhiệm vụ 3

Với bảng số liệu về lợi nhuận của doanh nghiệp vận tải cơ giới giai đoạn 1995-2002 ở nhiệm vụ 1, bạn phải thực hiện các bước sau.

Nhận chuỗi dữ liệu cho các đường xu hướng tuyến tính và hàm mũ bằng cách sử dụng các hàm TREND và GROW.

Sử dụng các hàm TREND và TĂNG TRƯỞNG, hãy lập dự báo lợi nhuận cho doanh nghiệp trong năm 2003 và 2004.

Đối với dữ liệu ban đầu và chuỗi dữ liệu nhận được, hãy xây dựng một sơ đồ.

Giải pháp của vấn đề

Hãy sử dụng trang tính của nhiệm vụ 1 (xem Hình 4). Hãy bắt đầu với Hàm TREND:

chọn dải ô D4: D11, ô này sẽ được điền các giá trị của hàm TREND tương ứng với dữ liệu đã biết về lợi nhuận của doanh nghiệp;

gọi lệnh Hàm từ menu Chèn. Trong hộp thoại Trình hướng dẫn chức năng xuất hiện, hãy chọn chức năng TREND từ danh mục Thống kê, sau đó bấm vào nút OK. Thao tác tương tự có thể được thực hiện bằng cách nhấn nút (Chức năng chèn) của thanh công cụ tiêu chuẩn.

Trong hộp thoại Đối số hàm xuất hiện, nhập phạm vi ô C4: C11 vào trường Đã biết_giá_trị_y; trong trường Giá_trị_x đã biết - phạm vi ô B4: B11;

để biến công thức đã nhập thành công thức mảng, hãy sử dụng tổ hợp phím + +.

Công thức chúng ta đã nhập vào thanh công thức sẽ giống như sau: = (TREND (C4: C11; B4: B11)).

Kết quả là, phạm vi ô D4: D11 được lấp đầy bằng các giá trị tương ứng của hàm TREND (Hình 9).

Để đưa ra dự báo về lợi nhuận của công ty cho năm 2003 và 2004. cần thiết:

chọn phạm vi ô D12: D13, nơi các giá trị được dự đoán bởi hàm TREND sẽ được nhập.

gọi hàm TREND và trong hộp thoại Đối số hàm xuất hiện, hãy nhập vào trường Giá_trị_đã biết - phạm vi ô C4: C11; trong trường Giá_trị_x đã biết - phạm vi ô B4: B11; và trong trường New_values_x - phạm vi ô B12: B13.

biến công thức này thành công thức mảng bằng cách sử dụng phím tắt Ctrl + Shift + Enter.

Công thức đã nhập sẽ giống như sau: = (TREND (C4: C11; B4: B11; B12: B13)) và phạm vi ô D12: D13 sẽ được lấp đầy bởi các giá trị dự đoán của hàm TREND (xem Hình. 9).

Tương tự, một chuỗi dữ liệu được điền bằng cách sử dụng hàm GROWTH, được sử dụng trong phân tích các phụ thuộc phi tuyến tính và hoạt động giống hệt như TREND đối tác tuyến tính của nó.

Hình 10 cho thấy bảng ở chế độ hiển thị công thức.

Đối với dữ liệu ban đầu và chuỗi dữ liệu thu được, sơ đồ được hiển thị trong hình. mười một.

Nhiệm vụ 4

Với bảng số liệu tiếp nhận hồ sơ đăng ký dịch vụ của doanh nghiệp vận tải cơ giới từ ngày 01 đến ngày 11 của tháng hiện tại, phải thực hiện các thao tác sau.

Lấy chuỗi dữ liệu cho hồi quy tuyến tính: sử dụng các hàm SLOPE và INTERCEPT; bằng cách sử dụng hàm LINEST.

Truy xuất chuỗi dữ liệu cho hồi quy theo cấp số nhân bằng cách sử dụng hàm LYFFPRIB.

Sử dụng các chức năng trên, lập dự báo về lượng nhận hồ sơ đến cơ quan dịch vụ công văn trong khoảng thời gian từ ngày 12 đến ngày 14 của tháng hiện tại.

Đối với chuỗi dữ liệu gốc và đã nhận, hãy xây dựng một sơ đồ.

Giải pháp của vấn đề

Lưu ý rằng, không giống như các hàm TREND và GROW, không có hàm nào được liệt kê ở trên (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) là hồi quy. Các hàm này chỉ đóng vai trò phụ trợ, xác định các tham số hồi quy cần thiết.

Đối với các hồi quy tuyến tính và hàm mũ được xây dựng bằng cách sử dụng các hàm SLOPE, INTERCEPT, LINEST, LGRFPRIB, sự xuất hiện của các phương trình của chúng luôn được biết trước, trái ngược với các hồi quy tuyến tính và hàm mũ tương ứng với các hàm TREND và GROWTH.

1 . Hãy xây dựng một hồi quy tuyến tính có phương trình:

y = mx + b

sử dụng các hàm SLOPE và INTERCEPT, với độ dốc của hồi quy m được xác định bởi hàm SLOPE và số hạng không đổi b - bởi hàm INTERCEPT.

Để làm điều này, chúng tôi thực hiện các hành động sau:

nhập bảng nguồn trong phạm vi ô A4: B14;

giá trị của tham số m sẽ được xác định trong ô C19. Chọn từ danh mục Thống kê, chức năng Độ dốc; nhập phạm vi ô B4: B14 trong trường giá_trị_y đã biết và phạm vi ô A4: A14 trong trường_giá_trị_x đã biết. Công thức sẽ được nhập vào ô C19: = SLOPE (B4: B14; A4: A14);

bằng phương pháp tương tự, giá trị của tham số b trong ô D19 được xác định. Và nội dung của nó sẽ như thế này: = INTERCEPT (B4: B14; A4: A14). Do đó, các giá trị của tham số m và b, cần thiết để xây dựng một hồi quy tuyến tính, sẽ được lưu trữ tương ứng trong các ô C19, D19;

sau đó ta nhập công thức hồi quy tuyến tính vào ô C4 có dạng: = $ C * A4 + $ D. Trong công thức này, các ô C19 và D19 được viết với tham chiếu tuyệt đối (địa chỉ ô không được thay đổi khi có thể sao chép). Dấu tham chiếu tuyệt đối $ có thể được nhập từ bàn phím hoặc sử dụng phím F4, sau khi đặt con trỏ vào địa chỉ ô. Sử dụng ô điều khiển điền, sao chép công thức này vào phạm vi ô C4: C17. Chúng tôi nhận được chuỗi dữ liệu mong muốn (Hình 12). Do số lượng yêu cầu là một số nguyên, bạn nên đặt định dạng số trên tab Số của cửa sổ Định dạng Ô với số vị trí thập phân là 0.

2 . Bây giờ chúng ta hãy xây dựng một hồi quy tuyến tính cho bởi phương trình:

y = mx + b

bằng cách sử dụng hàm LINEST.

Đối với điều này:

nhập hàm LINEST dưới dạng công thức mảng vào phạm vi ô C20: D20: = (LINEST (B4: B14; A4: A14)). Kết quả là chúng ta nhận được giá trị của tham số m trong ô C20 và giá trị của tham số b trong ô D20;

nhập công thức vào ô D4: = $ C * A4 + $ D;

sao chép công thức này bằng cách sử dụng điểm đánh dấu điền vào phạm vi ô D4: D17 và nhận được chuỗi dữ liệu mong muốn.

3 . Chúng tôi xây dựng một hồi quy hàm mũ có phương trình:

với sự trợ giúp của hàm LGRFPRIBL, nó được thực hiện tương tự:

trong phạm vi ô C21: D21, nhập hàm LGRFPRIBL dưới dạng công thức mảng: = (LGRFPRIBL (B4: B14; A4: A14)). Trong trường hợp này, giá trị của tham số m sẽ được xác định trong ô C21 và giá trị của tham số b sẽ được xác định trong ô D21;

công thức được nhập vào ô E4: = $ D * $ C ^ A4;

bằng cách sử dụng điểm đánh dấu điền, công thức này được sao chép vào phạm vi ô E4: E17, nơi đặt chuỗi dữ liệu cho hồi quy theo cấp số nhân (xem Hình 12).

Trên hình. 13 hiển thị một bảng trong đó chúng ta có thể xem các hàm chúng ta sử dụng với các phạm vi ô cần thiết, cũng như các công thức.

Giá trị R 2 triệu tập hệ số xác định.

Nhiệm vụ của việc xây dựng một phụ thuộc hồi quy là tìm vectơ các hệ số m của mô hình (1) mà tại đó hệ số R nhận giá trị lớn nhất.

Để đánh giá mức ý nghĩa của R, kiểm định F của Fisher được sử dụng, được tính bằng công thức

ở đâu N- cỡ mẫu (số lượng thí nghiệm);

k là số hệ số của mô hình.

Nếu F vượt quá một số giá trị quan trọng cho dữ liệu N và k và mức độ tin cậy được chấp nhận, khi đó giá trị của R được coi là đáng kể. Bảng giá trị tới hạn của F được đưa ra trong các sách tham khảo về thống kê toán học.

Vì vậy, ý nghĩa của R không chỉ được xác định bởi giá trị của nó, mà còn bởi tỷ số giữa số lượng thí nghiệm và số lượng hệ số (tham số) của mô hình. Thật vậy, tỷ lệ tương quan cho n = 2 đối với một mô hình tuyến tính đơn giản là 1 (thông qua 2 điểm trên mặt phẳng, bạn luôn có thể vẽ một đường thẳng duy nhất). Tuy nhiên, nếu dữ liệu thực nghiệm là các biến ngẫu nhiên, thì giá trị R như vậy cần được tin cậy hết sức cẩn thận. Thông thường, để thu được R đáng kể và hồi quy đáng tin cậy, nó nhằm đảm bảo rằng số lượng thử nghiệm vượt quá đáng kể số lượng hệ số của mô hình (n> k).

Để xây dựng một mô hình hồi quy tuyến tính, bạn phải:

1) chuẩn bị một danh sách gồm n hàng và m cột chứa dữ liệu thử nghiệm (cột chứa giá trị đầu ra Y phải là đầu tiên hoặc cuối cùng trong danh sách); ví dụ: chúng ta hãy lấy dữ liệu của nhiệm vụ trước đó, thêm một cột được gọi là "số chu kỳ", đánh số các khoảng thời gian từ 1 đến 12 (đây sẽ là các giá trị X)

2) vào menu Dữ liệu / Phân tích dữ liệu / Hồi quy

Nếu thiếu mục "Phân tích dữ liệu" trong menu "Công cụ", thì bạn nên chuyển đến mục "Bổ trợ" của cùng menu và chọn hộp "Gói phân tích".

3) trong hộp thoại "Hồi quy", đặt:

khoảng thời gian đầu vào Y;

khoảng đầu vào X;

khoảng thời gian đầu ra - ô phía trên bên trái của khoảng thời gian mà kết quả tính toán sẽ được đặt (nên đặt nó trên một trang tính mới);

4) nhấp vào "Ok" và phân tích kết quả.

Nó có nhiều công dụng vì nó cho phép biểu diễn gần đúng chức năng nhất định những người khác đơn giản hơn. LSM có thể cực kỳ hữu ích trong việc xử lý các quan sát và nó được sử dụng tích cực để ước tính một số đại lượng từ kết quả của các phép đo của những người khác có chứa lỗi ngẫu nhiên. Trong bài viết này, bạn sẽ học cách thực hiện các phép tính bình phương nhỏ nhất trong Excel.

Tuyên bố vấn đề trên một ví dụ cụ thể

Giả sử có hai chỉ số X và Y. Hơn nữa, Y phụ thuộc vào X. Vì OLS được chúng ta quan tâm theo quan điểm phân tích hồi quy (trong Excel, các phương pháp của nó được thực hiện bằng các hàm dựng sẵn), chúng ta nên tiến hành ngay lập tức. để xem xét một vấn đề cụ thể.

Vì vậy, hãy để X là khu vực giao dịch cửa hàng tạp hóa, đo bằng mét vuông và Y là doanh thu hàng năm, được định nghĩa bằng hàng triệu rúp.

Cần phải đưa ra dự báo về doanh thu (Y) mà cửa hàng sẽ có nếu nó có một hoặc một khu vực bán hàng khác. Rõ ràng, hàm Y = f (X) đang tăng lên, vì đại siêu thị bán được nhiều hàng hơn quầy hàng.

Vài lời về tính đúng đắn của dữ liệu ban đầu được sử dụng để dự đoán

Giả sử chúng ta có một bảng được xây dựng với dữ liệu cho n cửa hàng.

Dựa theo thống kê toán học, kết quả sẽ ít nhiều đúng nếu dữ liệu của ít nhất 5-6 đối tượng được kiểm tra. Ngoài ra, không thể sử dụng kết quả "dị thường". Đặc biệt, một cửa hàng nhỏ ưu tú có thể có doanh thu lớn hơn nhiều lần so với doanh thu của các cửa hàng lớn thuộc hạng “masmarket”.

Bản chất của phương pháp

Dữ liệu bảng có thể được hiển thị trong Máy bay cartesian dưới dạng các điểm M 1 (x 1, y 1), ... M n (x n, y n). Bây giờ lời giải của bài toán sẽ được rút gọn thành việc chọn một hàm số gần đúng y = f (x), có đồ thị đi qua các điểm M 1, M 2, .. M n càng gần càng tốt.

Tất nhiên, bạn có thể sử dụng đa thức bằng cấp cao, nhưng tùy chọn này không chỉ khó thực hiện mà còn không chính xác, vì nó sẽ không phản ánh xu hướng chính cần được phát hiện. Giải pháp hợp lý nhất là tìm đường thẳng y = ax + b, gần đúng nhất với dữ liệu thực nghiệm, hay nói đúng hơn là các hệ số - a và b.

Điểm chính xác

Đối với bất kỳ giá trị gần đúng nào, việc đánh giá độ chính xác của nó có tầm quan trọng đặc biệt. Biểu thị bằng e i sự khác biệt (độ lệch) giữa các giá trị thực nghiệm và chức năng của điểm x i, tức là e i = y i - f (x i).

Rõ ràng, để đánh giá độ chính xác của phép gần đúng, bạn có thể sử dụng tổng các độ lệch, tức là khi chọn một đường thẳng để biểu diễn gần đúng sự phụ thuộc của X vào Y, nên ưu tiên đường thẳng có giá trị nhỏ nhất của tổng e i tại tất cả các điểm đang xét. Tuy nhiên, không phải mọi thứ đều đơn giản như vậy, vì cùng với những sai lệch tích cực, thực tế sẽ có những sai lệch tiêu cực.

Bạn có thể giải quyết vấn đề bằng cách sử dụng các mô-đun độ lệch hoặc hình vuông của chúng. Phương thức cuối cùng nhận được nhiều nhất sử dụng rộng rãi. Nó được sử dụng trong nhiều lĩnh vực, bao gồm cả phân tích hồi quy (trong Excel, việc triển khai nó được thực hiện bằng cách sử dụng hai hàm tích hợp sẵn), và từ lâu đã được chứng minh là có hiệu quả.

Phương pháp bình phương tối thiểu

Trong Excel, như bạn đã biết, có một hàm autosum được tích hợp sẵn cho phép bạn tính giá trị của tất cả các giá trị nằm trong phạm vi đã chọn. Do đó, sẽ không có gì ngăn cản chúng ta tính giá trị của biểu thức (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Trong ký hiệu toán học, điều này trông giống như:

Vì quyết định ban đầu được đưa ra để tính gần đúng bằng cách sử dụng một đường thẳng, chúng tôi có:

Do đó, nhiệm vụ tìm một đường thẳng mô tả tốt nhất mối quan hệ cụ thể giữa X và Y tương đương với việc tính giá trị nhỏ nhất của một hàm có hai biến:

Điều này đòi hỏi phải cân bằng đạo hàm riêng bằng 0 đối với các biến a và b mới, đồng thời giải một hệ nguyên thủy gồm hai phương trình với 2 ẩn số có dạng:

Sau các phép biến đổi đơn giản, bao gồm phép chia cho 2 và thao tác với các tổng, chúng ta nhận được:

Ví dụ: giải nó bằng phương pháp Cramer, chúng tôi thu được điểm dừng với một số hệ số a * và b *. Đây là mức tối thiểu, tức là, để dự đoán doanh thu mà cửa hàng sẽ có khi khu vực nhất định, đường thẳng y = a * x + b * sẽ làm mô hình hồi quy cho ví dụ được đề cập. Tất nhiên cô ấy sẽ không để bạn tìm thấy kết quả chính xác, nhưng nó sẽ giúp bạn biết liệu mua tín dụng tại một cửa hàng cho một khu vực cụ thể có được đền đáp hay không.

Cách triển khai phương pháp bình phương nhỏ nhất trong Excel

Excel có một hàm để tính giá trị của các ô vuông nhỏ nhất. Cô bé có lần xem tiếp theo: "TREND" (giá trị Y đã biết; giá trị X đã biết; giá trị X mới; hằng số). Hãy áp dụng công thức tính OLS trong Excel cho bảng của chúng tôi.

Để thực hiện việc này, trong ô hiển thị kết quả của phép tính bằng phương pháp bình phương nhỏ nhất trong Excel, hãy nhập dấu “=” và chọn hàm “TREND”. Trong cửa sổ mở ra, hãy điền vào các trường thích hợp, tô sáng:

phạm vi các giá trị đã biết cho Y (trong trường hợp này dữ liệu về kim ngạch thương mại);
phạm vi x 1,… x n, tức là kích thước của không gian bán lẻ;
cả nổi tiếng và giá trị không xác định x, mà bạn cần tìm hiểu quy mô của doanh thu (để biết thông tin về vị trí của họ trên trang tính, hãy xem bên dưới).

Ngoài ra, có một biến logic "Const" trong công thức. Nếu bạn nhập 1 vào trường tương ứng với nó, thì điều này có nghĩa là các phép tính sẽ được thực hiện, giả sử rằng b \ u003d 0.

Nếu bạn cần biết dự báo cho nhiều hơn một giá trị x, thì sau khi nhập công thức, bạn không nên nhấn "Enter" mà cần gõ tổ hợp "Shift" + "Control" + "Enter" ("Enter" ) trên bàn phím.

Một số tính năng

Phân tích hồi quy có thể được truy cập ngay cả bởi hình nộm. Công thức Excelđể dự đoán giá trị của một mảng các biến chưa biết - "TREND" - có thể được sử dụng ngay cả với những người chưa bao giờ nghe nói về phương pháp bình phương nhỏ nhất. Chỉ cần biết một số tính năng về công việc của nó là đủ. Đặc biệt:

Nếu chúng ta sắp xếp phạm vi giá trị đã biết của biến y trong một hàng hoặc cột, thì mỗi hàng (cột) với giá trị đã biết x sẽ được chương trình coi như một biến riêng biệt.
Nếu phạm vi có x đã biết không được chỉ định trong cửa sổ "XU HƯỚNG", thì trong trường hợp sử dụng hàm trong Chương trình Excel sẽ coi nó như một mảng bao gồm các số nguyên, số tương ứng với phạm vi có các giá trị cho trước của biến y.
Để xuất một mảng các giá trị "dự đoán", biểu thức xu hướng phải được nhập dưới dạng công thức mảng.
Nếu không có giá trị x mới nào được chỉ định, thì hàm TREND coi chúng bằng những giá trị đã biết. Nếu chúng không được chỉ định, thì mảng 1 được coi là đối số; 2; 3; 4;…, tương xứng với phạm vi với các tham số y đã cho sẵn.
Phạm vi chứa các giá trị x mới phải bao gồm cùng hoặc hơn hàng hoặc cột, dưới dạng một dải ô với các giá trị y đã cho. Nói cách khác, nó phải tương xứng với các biến độc lập.
Một mảng với các giá trị x đã biết có thể chứa nhiều biến. Tuy nhiên, nếu chúng tôi đang nói chuyện chỉ khoảng một, thì các phạm vi với các giá trị đã cho của x và y phải tương xứng. Trong trường hợp có nhiều biến, phạm vi có các giá trị y đã cho phải nằm trong một cột hoặc một hàng.

Chức năng DỰ BÁO

Nó được thực hiện bằng cách sử dụng một số chức năng. Một trong số đó được gọi là "PREDICTION". Nó tương tự như TREND, tức là nó cho kết quả của các phép tính bằng phương pháp bình phương nhỏ nhất. Tuy nhiên, chỉ với một X, mà giá trị của Y là không xác định.

Bây giờ bạn đã biết các công thức Excel cho hình nộm cho phép bạn dự đoán giá trị của giá trị tương lai của một chỉ số theo xu hướng tuyến tính.

Nó được sử dụng rộng rãi trong kinh tế lượng dưới hình thức giải thích kinh tế rõ ràng cho các tham số của nó.

Hồi quy tuyến tính được rút gọn để tìm một phương trình có dạng

hoặc

Loại phương trình cho phép đặt giá trị tham số X có các giá trị lý thuyết của đối tượng địa lý hiệu quả, thay thế các giá trị thực tế của yếu tố vào nó X.

Việc xây dựng một hồi quy tuyến tính phụ thuộc vào việc ước tính các tham số của nó - một và trong. Các ước lượng tham số hồi quy tuyến tính có thể được tìm thấy bằng các phương pháp khác nhau.

Phương pháp cổ điển để ước tính các tham số hồi quy tuyến tính dựa trên bình phương nhỏ nhất(MNK).

LSM cho phép một người có được các ước tính tham số như vậy một và trong, trong đó tổng các độ lệch bình phương của các giá trị thực tế của đặc điểm kết quả (y) từ tính toán (lý thuyết) cực tiểu:

Để tìm cực tiểu của một hàm, cần phải tính các đạo hàm riêng đối với từng tham số một và b và đánh đồng chúng bằng 0.

Chứng tỏ qua S, sau đó:

Chuyển đổi công thức, chúng tôi nhận được hệ thống tiếp theo phương trình bình thườngđể ước tính tham số một và trong:

Giải hệ phương trình thông thường (3.5) bằng phương pháp loại trừ tuần tự các biến hoặc bằng phương pháp của các yếu tố quyết định, chúng tôi tìm thấy các ước lượng bắt buộc của các tham số một và trong.

Tham số trongđược gọi là hệ số hồi quy. Giá trị của nó cho thấy sự thay đổi trung bình trong kết quả với sự thay đổi của nhân tố theo một đơn vị.

Phương trình hồi quy luôn được bổ sung một chỉ báo về mức độ chặt chẽ của mối quan hệ. Khi sử dụng hồi quy tuyến tính, hệ số tương quan tuyến tính hoạt động như một chỉ báo. Có các phiên bản khác nhau của công thức hệ số tuyến tính các mối tương quan. Một số trong số họ được liệt kê dưới đây:

Như bạn đã biết, hệ số tương quan tuyến tính nằm trong giới hạn: -1 ≤ ≤ 1.

Để đánh giá chất lượng của việc lựa chọn hàm tuyến tính hình vuông được tính toán

Hệ số tương quan tuyến tính được gọi là hệ số xác định. Hệ số xác định đặc trưng cho tỷ lệ phương sai của tính năng hữu hiệu y, giải thích bằng hồi quy tổng phương sai dấu hiệu hiệu quả:

Theo đó, giá trị 1 - đặc trưng cho tỷ lệ phân tán y, gây ra bởi ảnh hưởng của các yếu tố khác không được tính đến trong mô hình.

Câu hỏi để kiểm soát bản thân

1. Thực chất của phương pháp bình phương nhỏ nhất?

2. Có bao nhiêu biến cung cấp hồi quy theo cặp?

3. Hệ số nào xác định độ chặt chẽ của mối liên kết giữa các thay đổi?

4. Hệ số xác định được xác định trong giới hạn nào?

5. Ước lượng tham số b trong phân tích tương quan-hồi quy?

1. Christopher Dougherty. Giới thiệu về kinh tế lượng. - M.: INFRA - M, 2001 - 402 tr.

2. S.A. Borodich. Kinh tế lượng. Minsk LLC "Kiến thức mới" 2001.

3. R.U. Rakhmetov Khóa học ngắn hạn trong kinh tế lượng. Hướng dẫn. Almaty. Năm 2004. -78 giây.

4. I.I. Eliseeva. Kinh tế lượng. - M.: "Tài chính và thống kê", 2002

5. Tạp chí phân tích và thông tin hàng tháng.

Các mô hình kinh tế phi tuyến. Các mô hình hồi quy phi tuyến. Biến đổi.

Phi tuyến tính mô hình kinh tế..

Biến đổi.

hệ số co giãn.

Nếu giữa hiện tượng kinh tế có các quan hệ phi tuyến tính, sau đó chúng được thể hiện bằng cách sử dụng chức năng phi tuyến: ví dụ, một hyperbola cạnh đều , parabolas bậc hai và vân vân.

Có hai loại hồi quy phi tuyến tính:

1. Hồi quy không tuyến tính đối với các biến giải thích được đưa vào phân tích, nhưng tuyến tính đối với các tham số ước tính, ví dụ:

Đa thức các mức độ khác nhau - , ;

Cường điệu bằng nhau -;

Hàm số bán nguyệt -.

2. Các hồi quy phi tuyến tính trong các tham số ước tính, ví dụ:

Quyền lực - ;

Biểu tình -;

Số mũ - .

Tổng bình phương độ lệch giá trị cá nhân tính năng hiệu quả tại từ giá trị trung bình là do ảnh hưởng của nhiều yếu tố. Có điều kiện chúng tôi chia toàn bộ lý do thành hai nhóm: yếu tố nghiên cứu x và những yếu tố khác.

Nếu yếu tố không ảnh hưởng đến kết quả thì đường hồi quy trên đồ thị song song với trục ồ và

Khi đó, toàn bộ sự phân tán của thuộc tính hiệu quả là do ảnh hưởng của các yếu tố khác và tổng cộngđộ lệch bình phương sẽ trùng với phần dư. Nếu các yếu tố khác không ảnh hưởng đến kết quả, thì bạn bị trói với X về mặt chức năng và dư lượng hình vuông bằng không. Trong trường hợp này, tổng bình phương độ lệch được giải thích bằng hồi quy giống như tổng bình phương.

Vì không phải tất cả các điểm của trường tương quan đều nằm trên đường hồi quy, nên sự phân tán của chúng luôn diễn ra do ảnh hưởng của yếu tố X, tức là hồi quy tại trên X, và gây ra bởi hành động của các nguyên nhân khác (biến đổi không giải thích được). Sự phù hợp của đường hồi quy để dự báo phụ thuộc vào phần nào biến thể chung ký tên tại giải thích cho biến thể được giải thích

Rõ ràng, nếu tổng bình phương độ lệch do hồi quy lớn hơn tổng bình phương còn lại, thì phương trình hồi quy có ý nghĩa thống kê và hệ số X có ảnh hưởng đáng kể đến kết quả. y.

, tức là với số lượng tự do thay đổi độc lập của đối tượng địa lý. Số bậc tự do liên quan đến số đơn vị của tổng thể n và số hằng số được xác định từ nó. Liên quan đến vấn đề đang nghiên cứu, số bậc tự do phải cho thấy có bao nhiêu độ lệch độc lập so với P

Việc đánh giá tầm quan trọng của toàn bộ phương trình hồi quy được đưa ra với sự trợ giúp của F- Tiêu chí của Fisher. Trong trường hợp này, giả thuyết rỗng được đưa ra rằng hệ số hồi quy bằng 0, tức là b = 0 và do đó hệ số X không ảnh hưởng đến kết quả y.

Việc tính toán trực tiếp tiêu chí F được thực hiện trước bằng phân tích phương sai. Trọng tâm của nó là sự mở rộng tổng bình phương độ lệch của biến tại từ giá trị trung bình tại thành hai phần - "giải thích" và "không giải thích":

- tổng bình phương các sai lệch;

- tổng các độ lệch bình phương được giải thích bằng hồi quy;

là tổng dư của các bình phương của độ lệch.

Bất kỳ tổng bình phương nào của độ lệch bình phương đều liên quan đến số bậc tự do , tức là với số lượng tự do thay đổi độc lập của đối tượng địa lý. Số bậc tự do liên quan đến số lượng đơn vị dân số N và với số lượng hằng số được xác định từ nó. Liên quan đến vấn đề đang nghiên cứu, số bậc tự do phải cho thấy có bao nhiêu độ lệch độc lập so với P có thể được yêu cầu để tạo thành một tổng bình phương cho trước.

Độ phân tán trên mỗi bậc tự doD.

Tỷ lệ F (tiêu chí F):

Nếu giả thuyết vô hiệu là đúng, sau đó là giai thừa và sự phân tán còn lại không khác biệt với nhau. Đối với H 0, một bác bỏ là cần thiết để phương sai của hệ số vượt quá phần dư vài lần. Nhà thống kê người Anh Snedecor đã phát triển các bảng giá trị tới hạn F-các mối quan hệ ở các mức độ trọng yếu khác nhau giả thuyết vô hiệu và những con số khác nhau bậc tự do. Bảng giá trị F- tiêu chuẩn - đây là giá trị lớn nhất của tỷ lệ phương sai, có thể xảy ra trong trường hợp phân kỳ ngẫu nhiên của chúng đối với mức độ nhất định xác suất có giả thuyết vô hiệu. Giá trị được tính toán F-Quan hệ tương quan được công nhận là đáng tin cậy nếu o lớn hơn giá trị dạng bảng.

Trong trường hợp này, giả thuyết vô hiệu về việc không có mối quan hệ của các đối tượng địa lý bị bác bỏ và một kết luận được đưa ra về tầm quan trọng của mối quan hệ này: F fact> F table H 0 bị từ chối.

Nếu giá trị nhỏ hơn bảng F fact ‹, bảng F, thì xác suất của giả thuyết rỗng cao hơn một mức cho trước và nó không thể bị bác bỏ nếu không có nguy cơ nghiêm trọng đưa ra kết luận sai về sự hiện diện của một mối quan hệ. Trong trường hợp này, phương trình hồi quy được coi là không có ý nghĩa thống kê. N o không bị lệch.

Sai số tiêu chuẩn của hệ số hồi quy

Để đánh giá tầm quan trọng của hệ số hồi quy, giá trị của nó được so sánh với lỗi tiêu chuẩn, tức là giá trị thực được xác định t-Tiêu chí của học sinh: sau đó được so sánh với bảng giá trịở một mức ý nghĩa nhất định và số bậc tự do ( N- 2).

Lỗi chuẩn tham số một:

Ý nghĩa của hệ số tương quan tuyến tính được kiểm tra dựa trên độ lớn của sai số Hệ số tương quan r:

Tổng phương sai của một đối tượng địa lý X:

Hồi quy nhiều tuyến tính

Xây dựng mô hình

Hồi quy nhiều lần là một hồi quy của đặc điểm kết quả với hai và một số lượng lớn các yếu tố, tức là mô hình chế độ xem

hồi quy có thể cho kết quả tốt khi lập mô hình nếu bỏ qua ảnh hưởng của các yếu tố khác ảnh hưởng đến đối tượng nghiên cứu. Hành vi của các biến số kinh tế riêng lẻ không thể được kiểm soát, nghĩa là không thể đảm bảo sự bình đẳng của tất cả các điều kiện khác để đánh giá mức độ ảnh hưởng của một nhân tố đang nghiên cứu. Trong trường hợp này, bạn nên cố gắng xác định ảnh hưởng của các yếu tố khác bằng cách đưa chúng vào mô hình, tức là xây dựng phương trình hồi quy nhiều lần: y = a + b 1 x 1 + b 2 +… + b p x p + .

Mục tiêu chính của hồi quy bội là xây dựng một mô hình với số lượng lớn các yếu tố, đồng thời xác định mức độ ảnh hưởng của từng yếu tố riêng lẻ, cũng như tác động tích lũy của chúng đối với chỉ số được mô hình hóa. Đặc điểm kỹ thuật của mô hình bao gồm hai lĩnh vực câu hỏi: lựa chọn các yếu tố và lựa chọn loại phương trình hồi quy

Phương pháp bình phương tối thiểuđược sử dụng để ước lượng các tham số của phương trình hồi quy.

Một trong những phương pháp để nghiên cứu mối quan hệ ngẫu nhiên giữa các đối tượng địa lý là phân tích hồi quy.
Phân tích hồi quy là suy ra của một phương trình hồi quy, được sử dụng để tìm giá trị trung bình một biến ngẫu nhiên (đặc điểm-kết quả), nếu giá trị của một (hoặc các) biến khác (yếu tố đặc trưng) được biết đến. Nó bao gồm các bước sau:

lựa chọn hình thức giao tiếp (loại phương trình phân tích hồi quy);
ước lượng các tham số phương trình;
đánh giá chất lượng của phương trình hồi quy phân tích.

Thông thường, một dạng tuyến tính được sử dụng để mô tả mối quan hệ thống kê của các đối tượng địa lý. chú ý đến kết nối tuyến tínhđược giải thích bằng cách diễn giải kinh tế rõ ràng về các tham số của nó, bị giới hạn bởi sự thay đổi của các biến và thực tế là trong hầu hết các trường hợp, các dạng truyền thông phi tuyến tính được chuyển đổi (bằng cách lấy logarit hoặc thay đổi các biến) thành dạng tuyến tính để thực hiện các phép tính.
Trong trường hợp quan hệ cặp tuyến tính, phương trình hồi quy sẽ có dạng: y i = a + b · x i + u i. Tùy chọn phương trình đã cho a và b được ước tính từ dữ liệu quan sát thống kê x và y. Kết quả của việc đánh giá như vậy là phương trình:, trong đó, - ước lượng của các tham số a và b, - giá trị của tính năng hiệu quả (biến) thu được bằng phương trình hồi quy (giá trị được tính toán).

Cách phổ biến nhất được sử dụng để ước tính tham số là phương pháp bình phương nhỏ nhất (LSM).
Phương pháp bình phương nhỏ nhất đưa ra các ước lượng tốt nhất (nhất quán, hiệu quả và không chệch hướng) về các tham số của phương trình hồi quy. Nhưng chỉ khi các giả định nhất định về số hạng ngẫu nhiên (u) và biến độc lập (x) được đáp ứng (xem các giả định của OLS).

Vấn đề ước lượng các tham số của một tuyến tính cặp phương trình bình phương nhỏ nhất bao gồm những điều sau: để có được các ước lượng như vậy về các tham số, tại đó tổng các độ lệch bình phương của các giá trị thực của đối tượng địa lý hiệu quả - y i từ các giá trị được tính toán - là nhỏ nhất.
Chính thức Tiêu chí OLS có thể được viết như thế này: .

Phân loại các phương pháp bình phương nhỏ nhất

Phương pháp bình phương tối thiểu.
Phương pháp khả năng xảy ra tối đa (đối với mô hình hồi quy tuyến tính cổ điển thông thường, tính chuẩn của phần dư hồi quy được công nhận).
Phương pháp bình phương nhỏ nhất tổng quát của GLLS được sử dụng trong trường hợp tự tương quan sai số và trong trường hợp phương sai thay đổi.
Hình vuông nhỏ nhất có trọng số ( trương hợp đặc biệt GMS với dư lượng thay đổi đàn hồi).

Minh họa bản chất phương pháp cổ điển của bình phương nhỏ nhất bằng đồ thị. Để làm được điều này, chúng tôi sẽ xây dựng âm mưu phân tán theo quan sát (x i, y i, i = 1; n) trong hệ thống hình chữ nhật tọa độ (một biểu đồ phân tán như vậy được gọi là trường tương quan). Hãy cố gắng tìm một đường thẳng gần nhất với các điểm của trường tương quan. Theo phương pháp bình phương nhỏ nhất, đường được chọn sao cho tổng bình phương khoảng cách dọc giữa các điểm của trường tương quan và đường này là nhỏ nhất.

Ký hiệu toán học của vấn đề này: .
Chúng ta đã biết các giá trị của y i và x i = 1 ... n, đây là những dữ liệu quan sát. Trong hàm S chúng là hằng số. Các biến trong hàm này là các ước lượng bắt buộc của các tham số -,. Để tìm giá trị nhỏ nhất của một hàm có 2 biến, cần phải tính các đạo hàm riêng của hàm này đối với từng tham số và cho chúng bằng 0, tức là .
Kết quả là, chúng tôi thu được một hệ thống gồm 2 bình thường Các phương trình tuyến tính:
Quyết định hệ thống này, chúng tôi tìm thấy các ước tính tham số bắt buộc:

Có thể kiểm tra tính đúng đắn của việc tính toán các tham số của phương trình hồi quy bằng cách so sánh các tổng (có thể có một số sai lệch do làm tròn các phép tính).
Để tính toán ước lượng tham số, bạn có thể xây dựng Bảng 1.
Dấu của hệ số hồi quy b cho biết hướng của mối quan hệ (nếu b> 0, mối quan hệ là trực tiếp, nếu b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Về mặt hình thức, giá trị của tham số a là giá trị trung bình của y đối với x bằng không. Nếu hệ số dấu không và không thể có giá trị 0, thì cách giải thích trên của tham số a không có ý nghĩa.

Đánh giá mức độ chặt chẽ của mối quan hệ giữa các đối tượng địa lý được thực hiện bằng cách sử dụng hệ số tương quan cặp tuyến tính - r x, y. Nó có thể được tính bằng công thức: . Ngoài ra, hệ số tương quan cặp tuyến tính có thể được xác định thông qua hệ số hồi quy b: .
Phạm vi giá trị có thể chấp nhận của hệ số tương quan cặp tuyến tính là từ –1 đến +1. Dấu của hệ số tương quan cho biết hướng của mối quan hệ. Nếu r x, y> 0, thì kết nối là trực tiếp; nếu r x, y<0, то связь обратная.
Nếu hệ số này gần với sự thống nhất trong mô đun, thì mối quan hệ giữa các đối tượng địa lý có thể được hiểu là một mối quan hệ tuyến tính khá chặt chẽ. Nếu môđun của nó bằng một ê r x, y ê = 1, thì mối quan hệ giữa các đối tượng là hàm tuyến tính. Nếu các đối tượng x và y độc lập tuyến tính thì r x, y gần bằng 0.
Bảng 1 cũng có thể được sử dụng để tính r x, y.

Bảng 1

N quan sát	x tôi	y tôi	x tôi ∙ y tôi
1	x 1	y 1	x 1 y 1
2	x2	y2	x 2 y 2
...
N	x n	y n	x n y n
Tổng cột	∑x	∑y	∑x y
Nghĩa là

Để đánh giá chất lượng của phương trình hồi quy thu được, hệ số xác định lý thuyết được tính - R 2 yx:

,
trong đó d 2 là phương sai y được giải thích bằng phương trình hồi quy;
e 2 - phần dư (không giải thích được bằng phương trình hồi quy) phương sai y;
s 2 y - tổng (tổng) phương sai y.
Hệ số xác định đặc trưng cho tỷ lệ biến thiên (độ phân tán) của đặc điểm kết quả y, được giải thích bằng hồi quy (và do đó, hệ số x), trong tổng biến thể (độ phân tán) y. Hệ số xác định R 2 yx nhận các giá trị từ 0 đến 1. Theo đó, giá trị 1-R 2 yx đặc trưng cho tỷ lệ phương sai y gây ra bởi ảnh hưởng của các yếu tố khác không được tính đến trong mô hình và sai số đặc tả.
Với hồi quy tuyến tính theo cặp R 2 yx = r 2 yx.

100 r tiền thưởng đơn hàng đầu tiên

Chọn loại tác phẩm Công việc tốt nghiệp Bài báo cáo kỳ Tóm tắt Luận văn thạc sĩ Báo cáo thực tập Bài báo Nhận xét Công việc kiểm tra Chuyên khảo Giải quyết vấn đề Kế hoạch kinh doanh Trả lời câu hỏi Công việc sáng tạo Bài luận Vẽ Sáng tác Bản dịch Trình bày Đánh máy Khác Tăng tính độc đáo của văn bản Luận văn của ứng viên Công việc trong phòng thí nghiệm Trợ giúp về- đường kẻ

Hỏi giá

Phương pháp bình phương nhỏ nhất là một kỹ thuật toán học (toán học-thống kê) phục vụ cho việc cân bằng chuỗi thời gian, xác định dạng tương quan giữa các biến ngẫu nhiên, v.v. Nó bao gồm thực tế là hàm mô tả hiện tượng này được xấp xỉ bởi một hàm đơn giản hơn . Hơn nữa, cái sau được chọn theo cách sao cho độ lệch chuẩn (xem Phương sai) của các mức thực tế của hàm tại các điểm quan sát được từ các điểm đã được san bằng là nhỏ nhất.

Ví dụ, theo dữ liệu có sẵn ( xi,yi) (tôi = 1, 2, ..., N) một đường cong như vậy được xây dựng y = một + bx, trên đó đạt đến mức tối thiểu của tổng các độ lệch bình phương

tức là, một hàm được tối thiểu hóa phụ thuộc vào hai tham số: một- phân đoạn trên trục y và b- hệ số góc của đường thẳng.

Phương trình đưa ra các điều kiện cần thiết để tối thiểu hóa một hàm S(một,b), được gọi là phương trình bình thường. Vì các hàm xấp xỉ, không chỉ tuyến tính (liên kết dọc theo một đường thẳng) mà còn cả bậc hai, parabol, hàm mũ, v.v. được sử dụng. M.2, trong đó tổng các khoảng cách bình phương ( y 1 – ȳ 1)2 + (y 2 – ȳ 2) 2 .... là nhỏ nhất và đường thẳng kết quả phản ánh tốt nhất xu hướng của chuỗi quan sát động đối với một số chỉ báo theo thời gian.

Đối với các ước lượng OLS không chệch, cần và đủ để đáp ứng điều kiện quan trọng nhất của phân tích hồi quy: kỳ vọng toán học của một lỗi ngẫu nhiên có điều kiện đối với các yếu tố phải bằng không. Đặc biệt, điều kiện này được đáp ứng nếu: 1. kỳ vọng toán học của sai số ngẫu nhiên bằng 0, và 2. nhân tố và sai số ngẫu nhiên là các biến ngẫu nhiên độc lập. Điều kiện đầu tiên có thể được coi là luôn luôn thỏa mãn đối với các mô hình có hằng số, vì hằng số có một kỳ vọng toán học khác 0 về sai số. Điều kiện thứ hai - điều kiện của các yếu tố ngoại sinh - là cơ bản. Nếu tính chất này không được thỏa mãn, thì chúng ta có thể giả định rằng hầu hết mọi ước tính sẽ cực kỳ không đạt yêu cầu: chúng thậm chí sẽ không nhất quán (nghĩa là ngay cả một lượng rất lớn dữ liệu cũng không cho phép thu được các ước tính định tính trong trường hợp này).

Phổ biến nhất trong thực hành ước lượng thống kê các tham số của phương trình hồi quy là phương pháp bình phương nhỏ nhất. Phương pháp này dựa trên một số giả định về bản chất của dữ liệu và kết quả của việc xây dựng mô hình. Các biến chính là sự tách biệt rõ ràng các biến ban đầu thành các biến phụ thuộc và độc lập, sự không tương quan của các yếu tố được đưa vào phương trình, tính tuyến tính của mối quan hệ, không có tự tương quan của các phần dư, sự bằng nhau của các kỳ vọng toán học của chúng bằng 0 và độ phân tán không đổi.

Một trong những giả thuyết chính của LSM là giả định rằng sự phân tán của độ lệch ei là bằng nhau, tức là mức chênh lệch của chúng xung quanh giá trị trung bình (không) của chuỗi phải là một giá trị ổn định. Tính chất này được gọi là tính đồng biến. Trong thực tế, các phương sai của độ lệch thường không giống nhau, tức là phương sai thay đổi được quan sát thấy. Điều này có thể do nhiều lý do khác nhau. Ví dụ, có thể có sai sót trong dữ liệu gốc. Sự thiếu chính xác ngẫu nhiên trong thông tin nguồn, chẳng hạn như sai sót về thứ tự các con số, có thể có tác động đáng kể đến kết quả. Thường thì sự lan truyền sai lệch lớn hơn єi được quan sát thấy ở các giá trị lớn của biến phụ thuộc (các biến số). Nếu dữ liệu có một lỗi đáng kể, thì đương nhiên, độ lệch của giá trị mô hình được tính toán từ dữ liệu có sai sót cũng sẽ lớn. Để loại bỏ lỗi này, chúng ta cần giảm sự đóng góp của các dữ liệu này vào kết quả tính toán, đặt trọng số cho chúng thấp hơn so với tất cả các phần còn lại. Ý tưởng này được thực hiện trong các hình vuông nhỏ nhất có trọng số.