tiểu sử Đặc trưng Phân tích

Tham số a trong phương trình hồi quy tuyến tính ghép cặp. Khoảng tin cậy cho biến phụ thuộc

Gửi công việc tốt của bạn trong cơ sở kiến ​​thức là đơn giản. Sử dụng mẫu dưới đây

Làm tốt lắmđến trang web">

Các bạn sinh viên, nghiên cứu sinh, các nhà khoa học trẻ sử dụng nền tảng tri thức trong học tập và làm việc sẽ rất biết ơn bạn.

Đăng trên http:// www. tất cả tốt nhất. vi/

Bộ Giáo dục và Khoa học Liên bang Nga

ngân sách nhà nước liên bang cơ sở giáo dục giáo dục đại học

"Đại học Kỹ thuật Nhà nước Komsomolsk-on-Amur"

Khoa Kinh tế và Quản lý

Khoa Kinh tế Tài chính Kế toán

NHIỆM VỤ TÍNH TOÁN VÀ ĐỒ THỊ

trong môn học "Kinh tế lượng"

sinh viên nhóm

A.Yu. Zaichenko

Giáo viên

Tôi.I. Antonova

Bảng 1

số vùng

Sinh hoạt tối thiểu bình quân đầu người mỗi ngày cho một người khỏe mạnh, chà.,

Mức lương trung bình hàng ngày, chà.,

Yêu cầu:

1. Xây dựng phương trình hồi quy cặp tuyến tính từ.

3. Đánh giá ý nghĩa thống kê của các tham số hồi quy và tương quan bằng Fisher's t-test và Student's t-test.

4. Chạy dự đoán tiền công với giá trị dự đoán của mức sống tối thiểu bình quân đầu người, bằng 107% mức trung bình.

5. Đánh giá độ chính xác của dự báo bằng cách tính sai số dự báo và khoảng tin cậy của nó.

6. Vẽ dữ liệu ban đầu và đường lý thuyết trên một đồ thị.

1. Để tính các tham số của phương trình hồi quy tuyến tính xây dựng bảng tính 2. hồi quy xấp xỉ tương quan tuyến tính

ban 2

Giá trị trung bình

Phương trình hồi quy thu được:

Với mức tăng sinh hoạt phí bình quân đầu người tối thiểu 1 chà. tiền lương trung bình hàng ngày tăng trung bình 0,89 rúp.

2. Độ chặt chẽ của mối quan hệ tuyến tính sẽ được ước lượng bằng hệ số tương quan:

Điều này có nghĩa là 51% sự thay đổi của tiền lương () được giải thích bởi sự thay đổi của yếu tố - mức tối thiểu sinh hoạt bình quân đầu người.

Chất lượng của mô hình được xác định bởi sai số xấp xỉ trung bình:

Chất lượng của mô hình được xây dựng được đánh giá là tốt, vì nó không vượt quá 8-10%.

3. Chúng ta sẽ ước tính tầm quan trọng của toàn bộ phương trình hồi quy bằng cách sử dụng -criterion của Fisher. Giá trị thực - chỉ tiêu:

Giá trị dạng bảng của tiêu chí ở mức ý nghĩa 5% và bậc tự do và là. Vì phương trình hồi quy được coi là có ý nghĩa thống kê.

Chúng tôi sẽ đánh giá ý nghĩa thống kê của các tham số hồi quy bằng cách sử dụng thống kê t của Sinh viên và bằng cách tính khoảng tin cậy cho từng chỉ số.

Giá trị dạng bảng của tiêu chí về số bậc tự do và sẽ là.

Hãy xác định các lỗi ngẫu nhiên:

Các giá trị thực tế của -statistics vượt quá giá trị bảng:

do đó, các tham số và không khác 0 một cách ngẫu nhiên mà có ý nghĩa thống kê. Hãy tính khoảng tin cậy cho các tham số hồi quy và. Đối với điều này, chúng tôi xác định lỗi cận biên cho từng chỉ tiêu:

khoảng tin cậy:

Một phân tích về ranh giới trên và dưới của khoảng tin cậy dẫn đến kết luận rằng, với xác suất, các tham số và nằm trong ranh giới đã chỉ định, không chấp nhận giá trị bằng không, I E. không có ý nghĩa thống kê và khác 0 một cách có ý nghĩa.

4. Các ước tính thu được của phương trình hồi quy cho phép chúng ta sử dụng nó để dự báo. Nếu giá trị dự báo của mức sống tối thiểu là:

Sau đó, giá trị dự báo của tiền lương sẽ là:

Lỗi dự báo sẽ là:

Lỗi dự báo cận biên, trong trường hợp sẽ không bị vượt quá, sẽ là:

Khoảng tin cậy dự báo:

Dự báo đã hoàn thành về mức lương trung bình hàng tháng là đáng tin cậy () và nằm trong khoảng từ 131,66 rúp. lên tới 190,62 rúp. Tóm lại, chúng ta sẽ vẽ dữ liệu ban đầu và đường thẳng lý thuyết trên cùng một đồ thị (Hình 1)

Bức tranh 1

Được lưu trữ trên Allbest.ru

Tài liệu tương tự

    Xây dựng phương trình đường thẳng hồi quy cặp, tính toán hệ số tuyến tính tương quan cặp và lỗi trung bình xấp xỉ. Xác định hệ số tương quan và hệ số co giãn, chỉ số tương quan, bản chất của việc ứng dụng tiêu chí Fisher trong kinh tế lượng.

    kiểm tra, thêm 05/05/2010

    Tính toán các tham số của hồi quy tuyến tính ghép cặp. Đánh giá ý nghĩa thống kê của phương trình hồi quy và các tham số của nó bằng cách sử dụng các bài kiểm tra của Fisher và Sinh viên. Xây dựng ma trận các cặp hệ số tương quan. Phân tích thống kê sử dụng PPP MS EXCEL.

    kiểm tra, thêm 14/05/2008

    Tính toán hệ số tuyến tính của tương quan cặp và từng phần. Ý nghĩa thống kê của các tham số hồi quy và tương quan. Phân tích trường dữ liệu tương quan. Độ chính xác dự báo, tính toán lỗi và khoảng tin cậy. Nhiều hệ số xác định.

    công tác kiểm soát, bổ sung 12/11/2010

    Giải thích kinh tế của hệ số hồi quy. Tìm tổng bình phương phần dư và ước tính phương sai của phần dư. Kiểm tra ý nghĩa các tham số của phương trình hồi quy bằng t-test Student. Tính sai số xấp xỉ tương đối trung bình.

    kiểm tra, thêm 23/03/2010

    Xây dựng khoảng tin cậy cho hệ số hồi quy. Xác định sai số xấp xỉ, chỉ số tương quan và Fisher's F-test. Đánh giá tính co giãn của sự thay đổi mức tiêu hao nguyên vật liệu của sản phẩm. Xây dựng một phương trình tuyến tính hồi quy bội.

    kiểm tra, thêm 04/11/2015

    Tính toán các tham số của phương trình hồi quy tuyến tính, ước lượng mức độ chặt chẽ của mối quan hệ bằng các chỉ số tương quan và xác định. Xác định sai số xấp xỉ trung bình. Độ tin cậy thống kê của mô hình sử dụng Fisher's F-test và Student's t-test.

    kiểm tra, thêm 17/10/2009

    Xác định sự phụ thuộc định lượng của khối lượng của động vật có lông vào tuổi của nó. Xây dựng phương trình hồi quy cặp, tính toán các tham số của nó và xác minh tính thỏa đáng. Đánh giá ý nghĩa thống kê của các tham số hồi quy, tính khoảng tin cậy của chúng.

    công việc phòng thí nghiệm, thêm 02/06/2014

    Xây dựng giả thuyết về hình thức liên kết giữa thu nhập tiền mặt bình quân đầu người và chi tiêu của người tiêu dùng ở vùng Ural và Tây Siberia của Liên bang Nga. Tính toán các tham số của phương trình hồi quy cặp, đánh giá chất lượng của chúng bằng sai số xấp xỉ trung bình.

    kiểm tra, thêm 05/11/2014

    phương pháp phân tích bình phương nhỏ nhất cho hồi quy cặp như một phương pháp để ước tính các tham số hồi quy tuyến tính. Xét phương trình tuyến tính của hồi quy cặp. Nghiên cứu hồi quy tuyến tính bội. Nghiên cứu sai số của các hệ số hồi quy.

    kiểm tra, được thêm vào 28/03/2018

    Xây dựng trường tương quan. Tính toán các tham số của phương trình hồi quy ghép cặp. Sự phụ thuộc của tuổi thọ trung bình vào một số yếu tố. Nghiên cứu về "Tiêu chuẩn Fischer". Đánh giá độ chặt của kết nối bằng các chỉ số tương quan và xác định.

100 r tiền thưởng đơn hàng đầu tiên

Chọn loại công việc Công việc sau đại học công việc khóa học Tóm tắt Luận văn thạc sĩ Báo cáo thực tập Bài viết Báo cáo nhận xét Bài kiểm tra Chuyên khảo Giải quyết vấn đề Kế hoạch kinh doanh Trả lời câu hỏi Công việc có tính sáng tạo Tiểu luận Vẽ Bố cục Dịch thuật Thuyết trình Đánh máy Khác Tăng tính độc đáo cho văn bản Luận điểm của thí sinh công việc trong phòng thí nghiệm Trợ giúp trực tuyến

Hỏi giá

Hồi quy cặp là phương trình của mối quan hệ của hai biến

y và x Loài y= f(x),

trong đó y - biến phụ thuộc (dấu kết quả);

x là một biến giải thích độc lập (hệ số ký hiệu).

Có hồi quy tuyến tính và phi tuyến tính.

Phương pháp bình phương nhỏ nhất

Để ước lượng các tham số hồi quy tuyến tính trong các tham số này, phương pháp bình phương nhỏ nhất (LSM) được sử dụng . LSM cho phép có được các ước tính của các tham số theo đó tổng các độ lệch bình phương của các giá trị thực tế của tính năng kết quả y từ các giá trị lý thuyết ŷ x với cùng các giá trị của thừa số x tối thiểu, tức là

5. Đánh giá ý nghĩa thống kê của các chỉ tiêu tương quan, tham số của phương trình hồi quy tuyến tính ghép cặp, phương trình hồi quy tổng thể.

6. Đánh giá mức độ chặt chẽ của mối quan hệ giữa các biến định lượng. Hệ số hiệp phương sai. Các thước đo tương quan: hệ số tương quan tuyến tính, chỉ số tương quan (= hệ số tương quan lý thuyết).

hệ số hiệp phương sai

Mch (y) - tức là chúng tôi nhận được một sự phụ thuộc tương quan.

Sự hiện diện của một sự phụ thuộc tương quan không thể trả lời câu hỏi về nguyên nhân của mối quan hệ. Mối tương quan chỉ thiết lập thước đo của kết nối này, tức là một thước đo của sự thay đổi nhất quán.

Có thể tìm thấy thước đo mối quan hệ giữa mu 2 biến bằng cách sử dụng hiệp phương sai.

, ,

Giá trị của số mũ hiệp phương sai phụ thuộc vào các đơn vị trong biến γ được đo. Vì vậy, để đánh giá mức độ biến thiên nhất quán, người ta sử dụng hệ số tương quan - một đặc tính không thứ nguyên với những giới hạn biến thiên nhất định.

7. Hệ số xác định. Sai số chuẩn của phương trình hồi quy.

Hệ số xác định (rxy2) - đặc trưng cho tỷ lệ phương sai của tính năng kết quả y, được giải thích bởi phương sai, trong tổng phương sai dấu hiệu hiệu quả. Rxy2 càng gần 1 thì mô hình hồi quy càng tốt, tức là mô hình ban đầu xấp xỉ tốt với dữ liệu ban đầu.

8. Đánh giá ý nghĩa thống kê của các chỉ tiêu hiệu chỉnh, tham số của phương trình hồi quy tuyến tính ghép cặp, phương trình hồi quy tổng thể: t-Tiêu chí của học sinh, F- Tiêu chuẩn Fisher.

9. Các mô hình hồi quy phi tuyến và sự tuyến tính hóa của chúng.

Hồi quy phi tuyến tính được chia thành hai loại : hồi quy phi tuyến tính đối với các biến giải thích được loại trừ khỏi phân tích, nhưng tuyến tính đối với các tham số ước tính và hồi quy phi tuyến tính đối với các tham số ước tính.

ví dụ hồi quy, phi tuyến tính trong các biến giải thích, nhưng tuyến tính trong các tham số ước tính:


Mô hình hồi quy phi tuyến tính và tuyến tính hóa của chúng

Với sự phụ thuộc phi tuyến tính của các tính năng, giảm xuống dạng tuyến tính, các tham số của hồi quy bội cũng được xác định bởi các bình phương nhỏ nhất với sự khác biệt duy nhất là nó không được sử dụng để thông tin lai lịch, nhưng với dữ liệu được chuyển đổi. Vì vậy, xét hàm công suất

,

chúng tôi chuyển đổi nó thành dạng tuyến tính:

trong đó các biến được biểu thị bằng logarit.

Quá trình xử lý tiếp theo của các bình phương nhỏ nhất là như nhau: một hệ thống được xây dựng phương trình bình thường và các tham số chưa biết được xác định. Bằng cách tăng giá trị, chúng tôi tìm thấy tham số Một và theo đó là dạng tổng quát của phương trình hàm lũy thừa.

Nói chung, hồi quy phi tuyến tính trên các biến bao gồm không che giấu bất kỳ khó khăn nào trong việc ước tính các tham số của nó. Ước tính này được xác định, như trong hồi quy tuyến tính, bằng bình phương nhỏ nhất. Vì vậy, trong phương trình hồi quy phi tuyến tính hai yếu tố

tuyến tính hóa có thể được thực hiện bằng cách đưa các biến mới vào nó . Kết quả là một phương trình hồi quy tuyến tính bốn yếu tố

10.đa cộng tuyến. Các phương pháp khử đa cộng tuyến.

Những khó khăn lớn nhất trong việc sử dụng bộ máy hồi quy bội phát sinh khi có sự đa cộng tuyến của các yếu tố, khi có nhiều hơn hai yếu tố liên quan phụ thuộc tuyến tính . Sự hiện diện của đa cộng tuyến nhân tố có thể có nghĩa là một số nhân tố sẽ luôn hành động đồng nhất. Do đó, sự thay đổi trong dữ liệu ban đầu không còn độc lập hoàn toàn và không thể đánh giá tác động của từng yếu tố một cách riêng biệt.

Tính đa cộng tuyến của các nhân tố càng mạnh thì ước tính phân phối của tổng biến thiên được giải thích trên các nhân tố riêng lẻ càng kém tin cậy bằng cách sử dụng phương pháp bình phương nhỏ nhất (LSM).

Việc đưa các yếu tố đa cộng tuyến vào mô hình là không mong muốn vì những lý do sau:

ü khó diễn giải các tham số của hồi quy bội; mất tham số hồi quy tuyến tính ý nghĩa kinh tế;

ü ước lượng tham số không đáng tin cậy, sai số chuẩn lớn và thay đổi theo khối lượng quan sát, khiến mô hình không phù hợp để phân tích và dự báo

Các phương pháp loại trừ đa cộng tuyến

- loại trừ (các) biến khỏi mô hình;

Tuy nhiên, cần thận trọng khi áp dụng phương pháp này. Trong tình huống này, lỗi đặc điểm kỹ thuật là có thể.

- thu thập dữ liệu bổ sung hoặc xây dựng một mẫu mới;

Đôi khi, để giảm đa cộng tuyến, chỉ cần tăng cỡ mẫu là đủ. Ví dụ: nếu bạn đang sử dụng dữ liệu hàng năm, bạn có thể thay đổi thành dữ liệu hàng quý. Việc tăng lượng dữ liệu làm giảm phương sai của các hệ số hồi quy và do đó làm tăng ý nghĩa thống kê của chúng. Tuy nhiên, việc lấy mẫu mới hoặc mở rộng mẫu cũ không phải lúc nào cũng khả thi hoặc liên quan đến chi phí đáng kể. Hơn nữa, phương pháp này có thể tăng

tự tương quan.

- thay đổi đặc điểm kỹ thuật của mô hình;

Trong một số trường hợp, vấn đề đa cộng tuyến có thể được giải quyết bằng cách thay đổi đặc điểm kỹ thuật của mô hình: hình dạng của mô hình bị thay đổi hoặc các biến giải thích mới được thêm vào mà không được tính đến trong mô hình.

- sử dụng thông tin sơ bộ về một số tham số;

11. Cổ điển mô hình tuyến tính nhiều regr-ii (KLMMR). Xác định các tham số của ur-I của hồi quy bội bằng phương pháp bình phương.

phân công dịch vụ. Với sự giúp đỡ của dịch vụ chế độ online có thể được tìm thấy:
  • tham số phương trình hồi quy tuyến tính y=a+bx , hệ số tương quan tuyến tính với phép kiểm tra mức độ quan trọng của nó;
  • độ chặt chẽ của kết nối sử dụng các chỉ số tương quan và xác định, ước lượng bình phương nhỏ nhất, độ tin cậy tĩnh của mô hình hồi quy sử dụng Fisher's F-test và Student's t-test , khoảng tin cậy của dự báo cho mức ý nghĩa α

Phương trình hồi quy theo cặp đề cập đến phương trình hồi quy bậc nhất. Nếu một mô hình kinh tế lượng chỉ chứa một biến giải thích, thì nó được gọi là hồi quy theo cặp. Phương trình hồi quy bậc haiphương trình hồi quy bậc ba tham khảo các phương trình hồi quy phi tuyến tính.

Ví dụ. Chọn biến phụ thuộc (có giải thích) và biến giải thích để xây dựng mô hình hồi quy cặp. Đưa cho . Quyết tâm phương trình lý thuyết hồi quy cặp. Đánh giá tính đầy đủ của mô hình được xây dựng (diễn giải R-square, t-statistic, F-statistic).
Giải pháp sẽ được dựa trên quy trình lập mô hình kinh tế lượng.
Giai đoạn 1 (dàn dựng) – xác định các mục tiêu cuối cùng của mô hình, một tập hợp các yếu tố và chỉ số tham gia vào mô hình và vai trò của chúng.
Đặc tả mô hình - xác định mục đích nghiên cứu và lựa chọn các biến kinh tế của mô hình.
Nhiệm vụ tình huống (thực tế). Đối với 10 doanh nghiệp của vùng, sự phụ thuộc của sản lượng trên mỗi công nhân y (nghìn rúp) vào trọng lượng riêng công nhân chất lượng cao V tổng sức mạnh công nhân x (theo %).
Giai đoạn 2 (tiên nghiệm) - phân tích tiền mô hình bản chất kinh tế của hiện tượng đang nghiên cứu, sự hình thành và chính thức hóa thông tin tiên nghiệm và các giả định ban đầu, đặc biệt, liên quan đến bản chất và nguồn gốc của dữ liệu thống kê ban đầu và các thành phần dư ngẫu nhiên dưới dạng một số giả thuyết.
Ở giai đoạn này, chúng ta có thể nói về sự phụ thuộc rõ ràng giữa trình độ kỹ năng của công nhân và sản lượng của anh ta, bởi vì công nhân càng có kinh nghiệm thì năng suất của anh ta càng cao. Nhưng làm thế nào để đánh giá sự phụ thuộc này?
hồi quy cặp là một hồi quy giữa hai biến - y và x, tức là một mô hình có dạng:

Trong đó y là biến phụ thuộc (dấu kết quả); x là một biến độc lập hoặc biến giải thích (hệ số ký hiệu). Dấu "^" có nghĩa là không có sự phụ thuộc hàm chặt chẽ giữa các biến x và y, do đó, trong hầu hết mọi trường hợp riêng biệt giá trị của y bao gồm hai số hạng:

Trong đó y là giá trị thực tế của tính năng hiệu quả; y x là giá trị lý thuyết của tính năng hiệu quả, được tìm thấy trên cơ sở phương trình hồi quy; ε là biến ngẫu nhiên đặc trưng cho độ lệch của giá trị thực của đặc trưng thu được so với giá trị lý thuyết tìm được của phương trình hồi quy.
Chúng ta sẽ biểu diễn bằng đồ thị sự phụ thuộc hồi quy giữa sản lượng trên mỗi công nhân và tỷ lệ công nhân có tay nghề cao.


Giai đoạn 3 (tham số hóa) - mô hình hóa thực tế, tức là sự lựa chọn nhìn chung mô hình, bao gồm thành phần và hình thức của các mối quan hệ giữa các biến có trong nó. Việc lựa chọn loại phụ thuộc hàm trong phương trình hồi quy được gọi là tham số hóa mô hình. Chọn phương trình hồi quy cặp, I E. chỉ một yếu tố sẽ ảnh hưởng đến kết quả cuối cùng y.
Giai đoạn 4 (thông tin) - thu thập thông tin cần thiết thông tin thống kê, I E. đăng ký giá trị các nhân tố, chỉ tiêu tham gia mô hình. Mẫu bao gồm 10 doanh nghiệp trong ngành.
Giai đoạn 5 (xác định mô hình) – ước tính các tham số mô hình chưa biết bằng cách sử dụng dữ liệu thống kê có sẵn.
Để xác định các tham số của mô hình, chúng tôi sử dụng LSM - phương pháp bình phương nhỏ nhất. Hệ phương trình bình thường sẽ như thế này:
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Để tính toán các tham số hồi quy, chúng tôi sẽ xây dựng một bảng tính toán (Bảng 1).
xyx2y2x y
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

Chúng tôi lấy dữ liệu từ bảng 1 (hàng cuối cùng), kết quả là chúng tôi có:
10a + 171b = 77
171 a + 3045 b = 1356
SLAE này được giải bằng phương pháp Cramer hoặc phương pháp ma trận nghịch đảo.
Ta được các hệ số hồi quy thực nghiệm: b = 0,3251, a = 2,1414
Phương trình hồi quy thực nghiệm có dạng:
y = 0,3251 x + 2,1414
Giai đoạn 6 (xác minh mô hình) - so sánh dữ liệu thực và mô hình, xác minh tính đầy đủ của mô hình, đánh giá tính chính xác của dữ liệu mô hình.
Việc phân tích được thực hiện bằng cách sử dụng

1. Các định nghĩa và công thức cơ bản

hồi quy cặp- hồi quy (mối quan hệ) giữa hai biến, v.v. xem mô hình:

đâu là biến phụ thuộc (dấu hiệu kết quả);

- biến giải thích độc lập (sign-factor);

Biến nhiễu hoặc biến ngẫu nhiên, bao gồm ảnh hưởng của các yếu tố không được tính đến trong mô hình.

Trong hầu hết mọi trường hợp, giá trị bao gồm hai thuật ngữ:

đâu là giá trị thực tế của tính năng hiệu quả;

Giá trị lý thuyết của tính năng kết quả, được tìm thấy trên cơ sở phương trình hồi quy. Dấu "^" có nghĩa là không có mối quan hệ hàm chặt chẽ giữa các biến và.

Phân biệt tuyến tínhphi tuyến tính hồi quy.

hồi quy tuyến tínhđược mô tả bởi phương trình của một đường thẳng

Hồi quy phi tuyến tínhđược chia thành hai lớp:

1) hồi quy, phi tuyến tính trong các biến giải thích, nhưng tuyến tính trong các tham số ước tính, Ví dụ:

Đa thức bậc khác nhau

hyperbole đều

2) hồi quy, phi tuyến tính trong các tham số ước tính, Ví dụ:

Quyền lực

trình diễn

số mũ

Để xây dựng hồi quy tuyến tính theo cặp, các đại lượng phụ trợ được tính toán ( - số lượng quan sát).

phương tiện mẫu: Và

hiệp phương sai mẫu giữa và

hoặc

hiệp phương sai- Cái này đặc trưng số phân phối chung của hai biến ngẫu nhiên.

phương sai mẫu cho

hoặc

phương sai mẫu cho

hoặc

phương sai mẫuđặc trưng cho mức độ lan truyền các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình (độ khả biến, khả biến).

Mức độ gần gũi của mối liên hệ giữa các hiện tượng được nghiên cứu được ước tính bằng hệ số tương quan mẫu giữa và

Hệ số tương quan thay đổi từ -1 đến +1. Modulo càng gần 1, càng gần phụ thuộc thống kê giữa và với một hàm tuyến tính.

Nếu = 0 thì kết nối tuyến tính giữa và thiếu;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

Giá trị dương của hệ số cho biết mối quan hệ giữa các dấu hiệu là trực tiếp (giá trị tăng khi tăng trưởng), giá trị âm biểu thị mối quan hệ nghịch đảo (giá trị giảm khi tăng trưởng).

Xây dựng hồi quy tuyến tính giảm để ước tính các tham số của nó và Cách tiếp cận cổ điển để ước tính các tham số của hồi quy tuyến tính dựa trên bình phương nhỏ nhất(MNK). LSM cho phép có được các ước tính tham số như vậy, theo đó tổng độ lệch bình phương của các giá trị thực tế của tính năng kết quả so với các giá trị lý thuyết là tối thiểu, tức là

Đối với hồi quy tuyến tính, các tham số và được tìm thấy từ hệ phương trình bình thường:

Giải hệ, ta tìm được V TRÊN

và tham số

hệ số với một biến nhân tố cho thấy giá trị sẽ thay đổi trung bình bao nhiêu khi nhân tố thay đổi trên một đơn vị đo lường.

Tham số khi If không thể bằng 0 thì nó không có ý nghĩa kinh tế. Chỉ có thể giải thích dấu hiệu của nếu nếu thì sự thay đổi tương đối trong kết quả chậm hơn sự thay đổi trong yếu tố, tức là phương sai của kết quả nhỏ hơn phương sai của nhân tố và ngược lại.

Để đánh giá chất lượng của mô hình hồi quy được xây dựng, bạn có thể sử dụng hệ số xác định hoặc lỗi xấp xỉ trung bình.

ĐẾNhệ số xác định

Hoặc

hiển thị tỷ lệ phương sai được giải thích bằng hồi quy trong tổng phương sai của thuộc tính kết quả.. Theo đó, giá trị đặc trưng cho tỷ lệ phương sai của chỉ báo do ảnh hưởng của các yếu tố không được tính đến trong mô hình và các lý do khác.

Càng gần 1, mô hình hồi quy càng tốt, tức là mô hình được xây dựng gần đúng với dữ liệu ban đầu.

Lỗi xấp xỉ trung bình là độ lệch tương đối trung bình của các giá trị lý thuyết so với thực tế, tức là

Phương trình hồi quy xây dựng được coi là đạt yêu cầu nếu giá trị không vượt quá 10-12%.

Đối với hồi quy tuyến tính hệ số đàn hồi trung bìnhđược tìm theo công thức:

Hệ số đàn hồi trung bình cho biết trung bình bao nhiêu phần trăm trong tổng thể mà kết quả sẽ thay đổi so với giá trị của nó khi nhân tố thay đổi 1% so với giá trị của nó.

lớp hgần nhấtphương trình hồi quy thường được đưa ra bằng cách sử dụng Fisher -test, bao gồm việc kiểm tra giả thuyết về sự không có ý nghĩa thống kê của phương trình hồi quy . Đối với điều này, một so sánh được thực hiện thật sựebầu trờiphê bình(bảng) giá trị - Tiêu chuẩn Fisher .

được xác định từ tỷ lệ của các giá trị của nhân tố và phương sai còn lại được tính cho một bậc tự do, tức là

- Giá trị lớn nhất có thể có của tiêu chí dưới tác động của các yếu tố ngẫu nhiên có bậc tự do =1, =-2 và mức ý nghĩa được tra từ bảng tiêu chí Fisher (bảng 1 phần phụ lục).

Mức độ đáng kể- là xác suất bác bỏ một giả thuyết đúng, cho rằng nó đúng.

Nếu như thì giả thuyết về việc không có mối liên hệ giữa chỉ báo nghiên cứu và nhân tố bị bác bỏ và đưa ra kết luận về tầm quan trọng của mối liên hệ này với mức ý nghĩa (tức là phương trình hồi quy có ý nghĩa).

Nếu như thì giả thuyết được chấp nhận và ý nghĩa thống kê và độ tin cậy của phương trình hồi quy được công nhận.

Đối với hồi quy tuyến tính tầm quan trọnghệ số hồi quyđánh giá với - Tiêu chí của sinh viên, theo đó một giả thuyết được đưa ra về bản chất ngẫu nhiên của các chỉ số, tức là về sự khác biệt không đáng kể của họ từ con số không. Tiếp theo, các giá trị thực của tiêu chí được tính cho từng hệ số hồi quy ước tính, tức là

ở đâu và - lỗi tiêu chuẩn các tham số hồi quy tuyến tính được xác định bởi các công thức:

- giá trị lớn nhất có thể của tiêu chí Student dưới tác động của các yếu tố ngẫu nhiên với bậc tự do cho trước = -2 và mức ý nghĩa được tìm từ bảng tiêu chí Student (Bảng 2 của Phụ lục).

Nếu như thì giả thuyết về sự không đáng kể của hệ số hồi quy bị bác bỏ với mức ý nghĩa i.e. hệ số ( hoặc ) không vô tình khác 0 và được hình thành dưới tác động của một yếu tố tác động có hệ thống

Nếu như thì giả thuyết không bị bác bỏ và bản chất ngẫu nhiên của việc hình thành tham số được thừa nhận.

Ý nghĩa của hệ số tương quan tuyến tính cũng đã kiểm tra với - Tiêu chí của sinh viên, tức là

Giả thuyết về sự không có ý nghĩa của hệ số tương quan bị bác bỏ với mức ý nghĩa nếu

Bình luận.Đối với hồi quy tuyến tính theo cặp, việc kiểm định các giả thuyết về tầm quan trọng của hệ số và hệ số tương quan tương đương với việc kiểm định giả thuyết về tầm quan trọng của toàn bộ phương trình hồi quy, tức là

Để tính khoảng tin cậy, hãy xác định lỗi cận biên cho mỗi chỉ số, tức là

khoảng tin cậyđối với hệ số hồi quy tuyến tính:

Nếu số 0 nằm trong ranh giới của khoảng tin cậy, tức là giới hạn dưới là âm và giới hạn trên là dương, sau đó tham số ước tính được giả định bằng 0, vì nó không thể cùng lúc nhận cả giá trị dương và âm.

Giá trị dự báođược xác định bằng cách thay thế giá trị tiên đoán tương ứng vào phương trình hồi quy Sau đó, nó được tính toán sai số chuẩn trung bình của dự báo

Ở đâu

và đang được xây dựng khoảng tin cậy dự báo

Khoảng thời gian có thể khá rộng do khối lượng quan sát nhỏ.

hồi quy, phi tuyến tính trong các biến bao gồm , được rút gọn thành dạng tuyến tính bằng cách thay đổi biến đơn giản và ước tính thêm các tham số được thực hiện bằng phương pháp bình phương nhỏ nhất.

gsiêu bónghồi quy cơ bản:

r lối thoát hiểm , phi tuyến tính e theo các tham số ước tính được chia thành hai loại: nội bộ phi tuyến tínhvà như thế. (không được rút gọn thành dạng tuyến tính) và tuyến tính bên trong(được rút gọn thành dạng tuyến tính bằng cách sử dụng các phép biến đổi thích hợp), ví dụ:

Hồi quy hàm mũ:

Biến đổi tuyến tính hóa:

Hồi quy công suất:

Biến đổi tuyến tính hóa:

Mục lụchồi quy naya:

Biến đổi tuyến tính hóa:

logarithồi quy:

Biến đổi tuyến tính hóa:

2. Giải các bài toán điển hình

Ví dụ9 .1 . Đối với 15 doanh nghiệp nông nghiệp (Bảng 9.1), những điều sau đây được biết: - số lượng thiết bị trên một đơn vị diện tích gieo trồng (đơn vị / ha) và - khối lượng sản phẩm trồng trọt (nghìn đơn vị). Cần thiết:

1) xác định sự phụ thuộc vào

2) vẽ các trường tương quan và vẽ phương trình hồi quy tuyến tính trên

3) rút ra kết luận về chất lượng của mô hình và tính giá trị dự đoán với giá trị dự đoán bằng 112% mức trung bình.

Bảng 9.1

Giải pháp:

1) Trong Excel, chúng tôi sẽ lập một bảng phụ trợ 9.2.

Bảng 9.2

Cơm.9 .1. Bảng tính giá trị trung gian

Tính số lần đo Để làm điều này, trong một ô B19đặt = ĐẾM(A2:A16 ) .

Sử dụng chức năng ∑ (AutoSum) trên thanh công cụ Tiêu chuẩn t naya tìm tổng của tất cả (ô B17) và (ô C17).

Cơm. 9.2. Tính tổng các giá trị và trung bình cộng

Để tính giá trị trung bình, chúng tôi sử dụng hàm MS Excel AVERAGE() tích hợp sẵn, phạm vi giá trị để xác định giá trị trung bình được chỉ định trong ngoặc. Như vậy, sản lượng sản phẩm trồng trọt bình quân của 15 trang trại là 210,833 nghìn tấn. chiếc, số lượng xe trung bình là 6.248 chiếc/ha.

Để điền vào các cột Đ., e, F nhập công thức tính tích: vào ô Đ.2 đặt = B2*C2, sau đó nhấn ENTER trên bàn phím. Nhấp chuột trái vào ô Đ.2 và, nắm lấy góc dưới bên phải của ô này (dấu cộng màu đen), kéo xuống ô Đ.16 . Phạm vi sẽ được điền tự động. Đ.3 - Đ.16 .

Để tính toán trong chọn lọcồ hiệp phương sai giữa và sử dụng công thức i.e. vào một tế bào b21 đặt = Đ.18- b18* C18 và nhận được 418.055 (Hình 9.3).

Cơm.9 .3. phép tính

chọn lọcphân tánYuđể tìm theo công thức cho điều này trong một tế bào b22 đặt = E18-B18^2 (^- dấu chỉ số mũ ) và nhận được 11.337. Tương tự, chúng tôi xác định \u003d 16745.05556 (Hình 9.4)

Cơm.9 .4. phép tínhbiến(x) Vàbiến (y)

Ngoài ra, bằng cách sử dụng hàm MS Excel tiêu chuẩn “CORREL”, chúng tôi tính giá trị của hệ số tương quan tuyến tính cho nhiệm vụ của mình, hàm sẽ có dạng “=CORREL(B2:B16;C2:C16)”, và giá trị rxy=0,96 . Giá trị thu được của hệ số tương quan cho thấy mối quan hệ trực tiếp và mạnh mẽ giữa sự sẵn có của thiết bị và khối lượng sản phẩm được trồng.

Chúng ta tìm thấy Vhệ số mẫu hồi quy tuyến tính =36,87; tham số = -17,78. Vì vậy, phương trình hồi quy tuyến tính theo cặp có dạng = -17,78 + 36,87

Hệ số cho thấy với việc tăng số lượng thiết bị lên 1 đơn vị / ha, khối lượng sản phẩm trồng trọt sẽ tăng trung bình 36,875 nghìn đơn vị. các đơn vị (Hình 9.5)

Cơm.9 .5. Tính các tham số của phương trình hồi quy.

Do đó, phương trình hồi quy sẽ có dạng: .

Chúng tôi thay thế các giá trị thực tế vào phương trình kết quả x(số lượng thiết bị) chúng tôi tìm thấy các giá trị lý thuyết của khối lượng sản phẩm được trồng (Hình 9.6).

Cơm.9 .6. Tính toán các giá trị lý thuyết của khối lượng sản phẩm đã trưởng thành

sử dụng Trình hướng dẫn biểu đồ chúng tôi xây dựng các trường tương quan (chọn các cột có giá trị và ) và phương trình hồi quy tuyến tính (chọn các cột có giá trị và ). Chọn loại biểu đồ - t cảnh tượng Trong sơ đồ kết quả, điền vào các tham số cần thiết (tiêu đề, nhãn cho các trục, chú giải, v.v.). Kết quả là, chúng ta có được đồ thị như trong hình. 9.7.

Cơm.9 .7. Đồ thị sự phụ thuộc của khối lượng sản phẩm trồng trọt vào số lượng thiết bị

Để đánh giá chất lượng của mô hình hồi quy đã xây dựng, chúng tôi tính toán:

. ĐẾNhệ số xác định\u003d 0,92, cho thấy sự thay đổi trong chi phí sản xuất là 92% do thay đổi về khối lượng sản xuất và 8% do tỷ lệ các yếu tố không được tính đến trong mô hình, điều này cho thấy chất lượng của hồi quy được xây dựng người mẫu;

. Vớimàu đỏyuyulỗiTạixấp xỉ. Để làm điều này, trong cột h tính toán sự khác biệt giữa các giá trị thực tế và lý thuyết a trong cột TÔI- sự biểu lộ . Xin lưu ý rằng hàm "ABS" tiêu chuẩn của MS Excel được sử dụng để tính giá trị modulo. Khi nhân giá trị trung bình (ô TÔI18 ) ở mức 100%, chúng tôi nhận được 18,2%. Do đó, trung bình, các giá trị lý thuyết sai lệch so với thực tế là 18,2% (Hình 1.8).

Sử dụng tiêu chí Fisher, chúng tôi ước tính hgần nhấtbphương trìnhhối hậnVớinhững cái này nói chung: 150,74.

Với mức ý nghĩa 0,05 = 4,67, chúng tôi xác định bằng hàm thống kê có sẵn F PHÂN PHỐI(Hình 1.9). Đồng thời, cần nhớ rằng "Bậc_tự_do1" là mẫu số và "Bậc_tự_do2" là tử số, trong đó là số tham số trong phương trình hồi quy (ta có 2), N- số cặp giá trị ban đầu (ta có 15).

Bởi vì thì phương trình hồi quy có ý nghĩa ở mức = 0,05.

Cơm.9 .8. Xác định hệ số xác định vàlỗi xấp xỉ trung bình

Cơm. 9 . 9 . cửa sổ hộp thoạichức năngF PHÂN PHỐI

Tiếp theo, chúng tôi xác định Vớihệ số đàn hồi trung bình theo công thức. Phát hiện cho thấy rằng với khối lượng sản phẩm sản xuất tăng 1%, chi phí sản xuất các sản phẩm này sẽ tăng trung bình 1,093% trong tổng số.

Tính toán giá trị dự báo bằng cách thay thế giá trị dự đoán của nhân tố =1,12=6,248*1,12=6,9978 vào phương trình hồi quy =-19,559+36,8746. Chúng tôi nhận được = 238,48. Do đó, với số lượng thiết bị là 6,9978 đơn vị / ha, sản lượng sẽ là 238,48 nghìn đơn vị. các đơn vị

Tìm phương sai còn lại, đối với điều này, chúng tôi tính tổng bình phương của sự khác biệt giữa giá trị thực tế và lý thuyết. =39.166 bằng cách đặt công thức sau = GỐC(J17/(B19-2)) vào một tế bào h2 1 (Hình 9.10).

Cơm.9 .10. Xác định phương sai dư

VỚImàu đỏvângtiêu chuẩnsai lầmdự báo:

Với mức ý nghĩa = 0,05 sử dụng hàm thống kê có sẵn STEUDRESPOBR chúng tôi xác định =2,1604 và tính toán sai số dự báo cận biên, trong 95% trường hợp sẽ không vượt quá .

Đ.khoảng tin cậy dự báo:

Hoặc .

Dự báo về chi phí sản xuất hóa ra là đáng tin cậy (1-0,05=0,95), nhưng không chính xác, vì phạm vi của ranh giới trên và dưới của khoảng tin cậy là lần. Điều này xảy ra do khối lượng quan sát nhỏ.

Phải hủy bỏ rằng MS Excel có các hàm thống kê tích hợp có thể giảm đáng kể số lượng phép tính trung gian, ví dụ (Hình 9.11.):

Tính toán Vchọn lọcXtrung bìnhX sử dụng chức năng TRUNG BÌNH(số1:sốN) từ danh mục thống kê .

hiệp phương sai mẫu giữa và được tìm thấy bằng cách sử dụng chức năng COVAR(mảngX;mảngY) từ danh mục thống kê .

chọn lọcSphân tánđược xác định bởi hàm thống kê VARP(số1:sốN) .

Cơm.9 .mười một. máy tính nlập chỉ mục các chức năng tích hợpbệnh đa xơ cứngvượt trội

Ptham sốShồi quy tuyến tính trong Excel có thể được định nghĩa theo nhiều cách.

1 đường) Với chức năng tích hợp LINEST. Thủ tục như sau:

1. Chọn vùng ô trống 5x2 (5 hàng, 2 cột) để hiển thị kết quả thống kê hồi quy hoặc vùng 1x2 - để chỉ lấy hệ số hồi quy.

2. Sử dụng thuật sĩ chức năng giữa thống kê chọn chức năng LINEST và điền vào các đối số của nó (Hình 9.12):

Cơm. 9 . 12 . Hộp thoại nhập đối số chức năngLINEST

known_values_y

known_values_x

Konst- một giá trị logic (1 hoặc 0), cho biết sự hiện diện hay vắng mặt của một số hạng tự do trong phương trình; đặt 1;

Số liệu thống kê- giá trị boolean (1 hoặc 0) cho biết có hiển thị thông tin bổ sung về phân tích hồi quy hay không; đặt 1.

3. Số đầu tiên của bảng sẽ xuất hiện ở ô phía trên bên trái của vùng đã chọn. Nhấn nút để mở toàn bộ bảng. < F2> , và sau đó - trên tổ hợp phím < ĐIỀU KHIỂN> + < SỰ THAY ĐỔI> + < ĐI VÀO> .

Thống kê hồi quy bổ sung sẽ được hiển thị trong biểu mẫu (Bảng 9.3):

Bảng 9.3

giá trị hệ số

giá trị hệ số

RMS
độ lệch

RMS
độ lệch

hệ số
quyết tâm

RMS
độ lệch

Số liệu thống kê

Số bậc tự do

Hồi quy tổng bình phương

tổng bình phương dư

Kết quả của việc áp dụng chức năng LINEST chúng tôi nhận được:

( 2 đường) Sử dụng công cụ phân tích dữ liệu hồi quy bạn có thể nhận được kết quả thống kê hồi quy, phân tích phương sai, khoảng tin cậy, phần dư, biểu đồ phù hợp hồi quy, biểu đồ phần dư và xác suất bình thường. Thủ tục như sau:

1. Bạn cần kiểm tra quyền truy cập vào gói phân tích. Để làm điều này, trong menu chính (thông qua nút Microsoft Office truy cập các tùy chọn MS Excel) trong hộp thoại Tùy chọn. bệnh đa xơ cứngvượt trội» chọn lệnh "Tiện ích bổ sung" và chọn tiện ích bổ sung bên phải Phân tích gói MỘT sau đó nhấp vào nút "Go" (Hình 9.13). Trong hộp thoại mở ra, hãy chọn hộp bên cạnh "Gói phân tích" và nhấp vào "OK" (Hình 9.14).

Trên tab "Dữ liệu" trong nhóm "Phân tích", bạn sẽ có quyền truy cập vào phần bổ trợ đã cài đặt. (Hình 9.15).

Cơm.9 .13. Kích hoạt tiện ích bổ sung trongbệnh đa xơ cứngvượt trội

Cơm.9 .14. Hộp thoại Bổ trợ

Cơm.9 .15. Phần bổ trợ Phân tích Dữ liệu trên Dải băngbệnh đa xơ cứngvượt trội 2007 .

2. Chọn vào "Data" trong nhóm "Analysis", chọn lệnh Phân tích có N meo meo trong hộp thoại mở ra, chọn công cụ phân tích "Hồi quy" và nhấp vào "OK" (Hình 9.16):

Cơm.9 .16. Hộp thoại Phân tích Dữ liệu

Trong hộp thoại xuất hiện (Hình 9.17), hãy điền vào các trường:

khoảng thời gian đầu vàoY- phạm vi chứa dữ liệu của thuộc tính hiệu quả Y;

khoảng thời gian đầu vàoX- phạm vi chứa dữ liệu của thuộc tính giải thích X;

Thẻ- một cờ cho biết dòng đầu tiên có chứa tên của các cột hay không;

Konstkiến không- một cờ cho biết có hay không có số hạng tự do trong phương trình;

khoảng thời gian đầu ra- nó đủ để chỉ ra ô phía trên bên trái của phạm vi tương lai;

bảng tính mới- bạn có thể đặt tên tùy ý cho trang tính mới mà kết quả sẽ được hiển thị trên đó.

Cơm.9 .17. Hộp thoại hồi quy

Đối với Thông tin Dư, Sơ đồ Dư, Lắp và Xác suất Bình thường, hãy chọn các hộp kiểm thích hợp trong hộp thoại.

Cơm. 9 . 18 . Kết quả áp dụng công cụhồi quy

TRONG bệnh đa xơ cứngvượt trội đường xu hướng có thể được thêm vào biểu đồ thanh hoặc biểu đồ đường. Đối với điều này:

1. Cần chọn khu vực xây dựng biểu đồ và chọn "Bố cục" trong dải băng và chọn lệnh "Đường xu hướng" trong nhóm phân tích (Hình 9.19.). Trong mục menu thả xuống, chọn "Tùy chọn đường xu hướng nâng cao".

Cơm. 1.19.Ruy-băng

2. Trong hộp thoại xuất hiện, hãy chọn các giá trị thực tế, sau đó hộp thoại "Định dạng đường xu hướng" (Hình 9.20.) sẽ mở ra trong đó loại đường xu hướng được chọn và các tham số thích hợp được đặt.

Cơm. 9 . 20 . cửa sổ hộp thoại"Định dạng đường xu hướng"

Đối với xu hướng đa thức, bạn phải chỉ định bậc của đa thức gần đúng, đối với lọc tuyến tính- số điểm trung bình.

Chọn tuyến tínhđể xây dựng phương trình hồi quy tuyến tính.

BẰNG thông tin thêm Có thể hiển thị phương trình trên diMỘTgramđặt một giá trị trên sơ đồ(hình 9.21).

Cơm. 9 . 21 . xu hướng tuyến tính

Mô hình hồi quy phi tuyến tính được minh họa khi tính toán các tham số của phương trình bằng hàm thống kê được chọn trong Excel lGRFPRIBL. Quy trình tính toán tương tự như sử dụng hàm LINEST.

Đơn giản nhất về mặt hiểu biết, giải thích và kỹ thuật tính toán là dạng hồi quy tuyến tính.

Phương trình hồi quy cặp tuyến tính , trong đó

a 0 , a 1 - tham số mô hình, ε i - biến ngẫu nhiên (giá trị phần dư).

Thông số mô hình và nội dung của chúng:


Phương trình hồi quy được bổ sung một chỉ báo về mức độ chặt chẽ của mối quan hệ. Một chỉ số như vậy là hệ số tương quan tuyến tính, được tính theo công thức:

hoặc .

Để đánh giá chất lượng tuyển chọn hàm tuyến tính bình phương của hệ số tương quan tuyến tính được tính, được gọi là hệ số xác định. Hệ số xác định đặc trưng cho tỷ lệ phương sai của thuộc tính kết quả, được giải thích bằng hồi quy, trong tổng phương sai của thuộc tính kết quả:

,

Ở đâu

.

Theo đó, giá trị đặc trưng cho tỷ trọng phân tán do ảnh hưởng của các yếu tố khác không được tính đến trong mô hình.

Phương trình hồi quy sau khi được xây dựng sẽ được kiểm tra tính đầy đủ và chính xác, các tính chất này của mô hình được nghiên cứu trên cơ sở phân tích một số phần dư ε i (độ lệch của giá trị tính toán so với thực tế).

Dư lượng hàng cấp

tương quan và Phân tích hồi quy thực hiện cho một dân số hạn chế. Về vấn đề này, các chỉ số hồi quy, tương quan và xác định có thể bị bóp méo do tác động của các yếu tố ngẫu nhiên. Để kiểm tra xem các chỉ số này là điển hình cho toàn bộ dân số như thế nào, liệu chúng có phải là kết quả của sự kết hợp của các tình huống ngẫu nhiên hay không, cần kiểm tra tính đầy đủ của mô hình được xây dựng.

Kiểm tra tính đầy đủ của mô hình bao gồm việc xác định tầm quan trọng của mô hình và thiết lập sự hiện diện hay vắng mặt của lỗi hệ thống.

giá trị 1 dữ liệu có liên quan X tôi ở các giá trị lý thuyết một 0một 1 , ngẫu nhiên. Các giá trị của các hệ số được tính toán từ chúng cũng sẽ là ngẫu nhiên. một 0một 1 .

Việc kiểm tra mức ý nghĩa của các hệ số hồi quy riêng được thực hiện theo bài kiểm tra t của sinh viên bằng cách kiểm định giả thuyết rằng mỗi hệ số hồi quy bằng không. Đồng thời, tìm hiểu xem các tham số được tính toán đặc trưng như thế nào để hiển thị một tập hợp các điều kiện: liệu các giá trị tham số thu được có phải là kết quả của tác động của các biến ngẫu nhiên hay không. Các công thức thích hợp được sử dụng cho các hệ số hồi quy tương ứng.

Công thức xác định t-test của Student

Ở đâu

S a 0 ,S a 1 - độ lệch chuẩn của số hạng tự do và hệ số hồi quy. công thức

Ở đâu

S ε - độ lệch chuẩn phần dư mô hình (sai số chuẩn của ước lượng), được xác định theo công thức

Các giá trị tính toán của tiêu chí t được so sánh với giá trị bảng của tiêu chí tαγ , được xác định cho (n - k— 1) bậc tự do và mức ý nghĩa tương ứng α. Nếu giá trị được tính toán của tiêu chí t vượt quá giá trị trong bảng của nó tαγ , thì tham số được công nhận là có ý nghĩa. Trong trường hợp này, gần như không thể tin được rằng các giá trị được tìm thấy của các tham số chỉ là do sự trùng hợp ngẫu nhiên.

Việc đánh giá tầm quan trọng của toàn bộ phương trình hồi quy được thực hiện trên cơ sở - tiêu chí của Fisher, trước khi phân tích phương sai.

Tổng các bình phương độ lệch của biến so với giá trị trung bình được chia thành hai phần - "đã giải thích" và "không giải thích được":

Tổng bình phương độ lệch;

Tổng bình phương độ lệch được giải thích bằng hồi quy (hoặc tổng hệ số của bình phương độ lệch);


- tổng còn lại của độ lệch bình phương, đặc trưng cho ảnh hưởng của các yếu tố không được tính đến trong mô hình.

Sơ đồ phân tích độ phân tán có dạng được trình bày trong Bảng 35 ( - số quan sát, - số tham số với một biến).

Bảng 35 - Sơ đồ phân tích phương sai

thành phần phương sai Tổng bình phương Số bậc tự do Độ phân tán trên một bậc tự do
Tổng quan
yếu tố

Xác định độ phân tán trên một bậc tự do sẽ đưa độ phân tán về dạng so sánh được. So sánh phương sai giai thừa và phần dư trên một bậc tự do, chúng ta thu được giá trị của -criterion của Fisher:

Để kiểm tra ý nghĩa của toàn bộ phương trình hồi quy, hãy sử dụng Fisher F-thử nghiệm. Trong trường hợp hồi quy tuyến tính ghép cặp, ý nghĩa của mô hình hồi quy được xác định theo công thức sau: .

Nếu ở một mức ý nghĩa cho trước, giá trị tính được của tiêu chí F với γ 1 =k, γ 2 =( p-k- 1) bậc tự do lớn hơn dạng bảng, thì mô hình được coi là có ý nghĩa, giả thuyết về bản chất ngẫu nhiên của các đặc điểm ước tính bị bác bỏ và được công nhận là của chúng ý nghĩa thống kê và độ tin cậy. Việc kiểm tra sự có mặt hay vắng mặt của sai số hệ thống (việc đáp ứng các điều kiện tiên quyết của phương pháp bình phương nhỏ nhất - LSM) được thực hiện trên cơ sở phân tích một số phần dư. Việc tính toán sai số ngẫu nhiên của các tham số hồi quy tuyến tính và hệ số tương quan được thực hiện theo công thức

,

Để kiểm tra tính chất ngẫu nhiên của một loạt các phần dư, bạn có thể sử dụng tiêu chí về điểm ngoặt (đỉnh). Một điểm được coi là một bước ngoặt nếu điều kiện sau: ε tôi -1< ε i >ε i +1 hoặc ε i -1 > ε i< ε i +1

Tiếp theo, số điểm quay p được tính toán. Phép thử ngẫu nhiên với mức ý nghĩa 5%, tức là Với mức độ tự tin 95%, là sự thỏa mãn của bất đẳng thức:

Dấu ngoặc vuông có nghĩa là nó được lấy Toàn bộ phần số đặt trong ngoặc. Nếu bất đẳng thức được thỏa mãn thì mô hình được coi là phù hợp.

Để kiểm tra sự bình đẳng kỳ vọng toán học dãy số dư bằng không, giá trị trung bình cộng của dãy số dư được tính:

Nếu = 0 thì mô hình được coi là không có sai số hệ thống cố định và phù hợp với tiêu chí trung bình bằng 0.

Nếu ≠ 0, thì giả thuyết khống được kiểm định rằng kỳ vọng toán học bằng không. Để làm điều này, hãy tính t-test của Student theo công thức:

trong đó S ε là độ lệch chuẩn của phần dư mô hình (sai số chuẩn).

Giá trị của tiêu chí t được so sánh với bảng t αγ . Nếu bất đẳng thức t > t αγ được thỏa mãn thì mô hình không thỏa mãn theo tiêu chí này

Phương sai của các mức của một loạt dư lượng phải giống nhau đối với tất cả các giá trị X(tài sản tính đồng biến).Nếu điều kiện này không được đáp ứng, thì phương sai thay đổi .

Để đánh giá phương sai thay đổi với cỡ mẫu nhỏ, người ta có thể sử dụng Phương pháp Goldfeld–Quandt, bản chất của nó là nó là cần thiết:

Xác định vị trí các giá trị biến X theo thứ tự tăng dần;

Chia tập hợp các quan sát có thứ tự thành hai nhóm;

Với mỗi nhóm quan sát, hãy xây dựng phương trình hồi quy;

Xác định tổng bình phương còn lại cho nhóm thứ nhất và thứ hai bằng cách sử dụng các công thức: ; , Ở đâu

n 1 - số lượng quan sát trong nhóm đầu tiên;

n 2 - số lượng quan sát trong nhóm thứ hai.

Tính tiêu chí hoặc (tử số phải chứa một tổng bình phương lớn). bằng cách làm giả thuyết vô hiệu về phương sai đồng nhất, tiêu chí F calc sẽ thỏa mãn tiêu chí F với bậc tự do γ 1 =n 1 -m, γ 2 =n - n 1 - m) cho mỗi dư lượng hình vuông (trong đó m số tham số ước lượng trong phương trình hồi quy). Giá trị của Fcalc càng vượt quá giá trị bảng của tiêu chí F, tiền đề về sự bằng nhau của độ phân tán của phần dư càng bị vi phạm.

Việc kiểm tra tính độc lập của chuỗi dư lượng (thiếu tự tương quan) được thực hiện bằng phép thử d Durbin-Watson. Nó được xác định bởi công thức:

Giá trị tính toán của tiêu chí được so sánh với các giá trị tới hạn dưới d 1 và trên d 2 của thống kê Durbin–Watson. Các trường hợp sau đây là có thể:

1) nếu d< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

2) nếu d 1 < đ < d 2 (bao gồm cả các giá trị này), người ta cho rằng không có đủ cơ sở để đưa ra kết luận này hay kết luận khác. Cần thiết để sử dụng tiêu chí bổ sung, ví dụ hệ số tự tương quan thứ nhất:

Nếu giá trị tính toán của hệ số modulo nhỏ hơn giá trị bảng r 1kr, thì giả thuyết về việc không có tự tương quan được chấp nhận; mặt khác, giả thuyết này bị bác bỏ;

3) nếu d 2 < đ < 2, thì giả thuyết về tính độc lập của phần dư được chấp nhận và mô hình được công nhận là phù hợp theo tiêu chí này;

4) nếu d > 2, thì điều này cho thấy tự tương quan âm thức ăn thừa. Trong trường hợp này, giá trị tính toán của tiêu chí phải được quy đổi theo công thức d′= 4 - d và so sánh với giá trị tới hạn d′ , không d.

Kiểm tra sự tuân thủ của phân phối chuỗi dư với luật phân phối chuẩn có thể được thực hiện bằng cách sử dụng R / S - tiêu chí, được xác định theo công thức:

trong đó S ε là độ lệch chuẩn của phần dư mô hình (sai số chuẩn). Giá trị tính toán của R/S - tiêu chí được so sánh với bảng giá trị(giới hạn dưới và trên mối quan hệ nhất định), và nếu giá trị không nằm trong khoảng giữa các ranh giới tới hạn, thì với một mức ý nghĩa nhất định, giả thuyết về phân phối chuẩn bị bác bỏ; mặt khác giả thuyết được chấp nhận

Để đánh giá chất lượng mô hình hồi quy nó cũng được khuyến khích để sử dụng chỉ số tương quan(hệ số tương quan bội).

Công thức xác định chỉ số tương quan

Ở đâu

Tổng bình phương độ lệch của biến phụ thuộc so với giá trị trung bình của nó. Xác định theo công thức:

Tổng bình phương độ lệch được giải thích bằng hồi quy. Xác định theo công thức:

Tổng còn lại của bình phương độ lệch. Được tính theo công thức:

phương trình có thể được biểu diễn như sau:

Chỉ số tương quan nhận giá trị từ 0 đến 1. Giá trị chỉ số càng cao, giá trị tính toán của tính năng kết quả càng gần với giá trị thực tế. Chỉ số tương quan được sử dụng cho bất kỳ hình thức liên kết nào của các biến; với hồi quy tuyến tính ghép nối, nó bằng hệ số cặp tương quan.

Các đặc tính chính xác được sử dụng làm thước đo độ chính xác của mô hình: Để xác định thước đo độ chính xác của mô hình, các phép tính sau được tính toán:

- lỗi tối đa- tương ứng với độ lệch của độ lệch tính toán của các giá trị được tính toán so với thực tế

- trung bình lỗi tuyệt đối - lỗi hiển thị trung bình bao nhiêu giá trị thực tế sai lệch so với mô hình

- phương sai của một loạt các phần dư (phân tán còn lại)

ở đâu là giá trị trung bình của một loạt các dư lượng. Xác định theo công thức

- lỗi bình phương trung bình gốc. Nó là căn bậc hai của phương sai: , Làm sao ít giá trị hơn lỗi, mô hình càng chính xác

- trung bình sai số tương đối xấp xỉ.

Sai số xấp xỉ trung bình không được vượt quá 8-10%.

Nếu mô hình hồi quy được công nhận là đầy đủ và các tham số của mô hình là có ý nghĩa, thì tiến hành xây dựng dự báo .

giá trị dự đoán Biến đổi Tại thu được bằng cách thay thế giá trị kỳ vọng của biến độc lập vào phương trình hồi quy X progn.

Dự đoán này được gọi là điểm. Xác suất thực hiện dự báo điểm gần như bằng 0 nên khoảng tin cậy của dự báo được tính toán với độ tin cậy cao.

Khoảng tin cậy dự báo phụ thuộc vào lỗi tiêu chuẩn, xóa bỏ X chạy từ ý nghĩa của nó , số quan sát N và mức ý nghĩa của dự báo α. Khoảng tin cậy của dự báo được tính theo công thức: hoặc

Ở đâu

t bảng - xác định theo bảng phân phối Student cho mức ý nghĩa α và số bậc tự do γ=n-k-1.

Ví dụ13.

Theo khảo sát 8 nhóm gia đình, số liệu về mối quan hệ giữa chi tiêu của dân cư cho thực phẩm và mức thu nhập của gia đình đã được biết (Bảng 36).

Bảng 36 - Mối quan hệ giữa chi tiêu cho thực phẩm của hộ gia đình và thu nhập của hộ gia đình

Chi tiêu cho thực phẩm, ths.chà. 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
Thu nhập gia đình, nghìn rúp 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

Giả sử rằng mối quan hệ giữa thu nhập gia đình và chi tiêu cho thực phẩm là tuyến tính. Để xác nhận giả định của chúng tôi, chúng tôi xây dựng một trường tương quan (Hình 8).

Đồ thị cho thấy các điểm thẳng hàng với một số đường thẳng.

Để thuận tiện cho các tính toán tiếp theo, chúng tôi sẽ tổng hợp Bảng 37.

Tính các tham số của phương trình hồi quy cặp tuyến tính . Để làm điều này, chúng tôi sử dụng các công thức:

Hình 8 - Trường tương quan.

Ta được phương trình:

Những thứ kia. với mức tăng thu nhập gia đình thêm 1000 rúp. chi phí thực phẩm tăng 168 rúp.

Tính hệ số tương quan tuyến tính.