tiểu sử Đặc trưng Phân tích

Các tham số của phương trình hồi quy tuyến tính được tính toán dựa trên. Phương trình hồi quy

Chủ thể:Các yếu tố của lý thuyết tương quan

loạt đối tượng quần thể có một số đặc trưng X, Y,... cần nghiên cứu, có thể hiểu là một hệ các đại lượng có quan hệ với nhau. Ví dụ như: trọng lượng của động vật và lượng huyết sắc tố trong máu, chiều cao của một người đàn ông và thể tích của ngực, sự gia tăng các công việc trong nhà và tỷ lệ nhiễm vi-rút, lượng thuốc sử dụng và nồng độ của nó trong máu, v.v.

Rõ ràng, có một mối liên hệ giữa các đại lượng này, nhưng nó không thể là một sự phụ thuộc hàm nghiêm ngặt, vì sự thay đổi của một trong các đại lượng không chỉ bị ảnh hưởng bởi sự thay đổi của đại lượng thứ hai mà còn bởi các yếu tố khác. Trong những trường hợp như vậy, hai đại lượng được cho là có liên quan với nhau. ngẫu nhiên(tức là ngẫu nhiên) phụ thuộc. Chúng tôi sẽ học tập trương hợp đặc biệt phụ thuộc ngẫu nhiên - sự phụ thuộc tương quan.

SỰ ĐỊNH NGHĨA:ngẫu nhiên nếu sự thay đổi của một trong số chúng không chỉ bị ảnh hưởng bởi sự thay đổi của giá trị thứ hai mà còn bởi các yếu tố khác.

SỰ ĐỊNH NGHĨA: Sự phụ thuộc của các biến ngẫu nhiên được gọi là thống kê, nếu một sự thay đổi của một trong số chúng dẫn đến sự thay đổi trong quy luật phân phối của cái kia.

SỰ ĐỊNH NGHĨA: Nếu một sự thay đổi của một trong các biến ngẫu nhiên kéo theo sự thay đổi về giá trị trung bình của một biến ngẫu nhiên khác, thì sự phụ thuộc thống kê được gọi là tương quan.

ví dụ sự phụ thuộc tương quan là liên kết giữa:

trọng lượng cơ thể và chiều cao;

    liều lượng bức xạ ion hóa và số lượng đột biến;

    sắc tố tóc và màu mắt của con người;

    các chỉ số về mức sống của dân số và tỷ lệ tử vong;

    số tiết học sinh vắng mặt, điểm thi, v.v.

Đó là sự phụ thuộc tương quan thường được tìm thấy trong tự nhiên do ảnh hưởng lẫn nhau và sự đan xen chặt chẽ của rất nhiều yếu tố rất khác nhau quyết định giá trị của các chỉ số được nghiên cứu.

Kết quả quan sát được thực hiện trên một đối tượng sinh học cụ thể theo các dấu hiệu tương quan Y và X có thể được mô tả dưới dạng các điểm trên mặt phẳng bằng cách xây dựng một hệ tọa độ hình chữ nhật. Kết quả là thu được một biểu đồ phân tán nhất định, cho phép đánh giá hình thức và mức độ chặt chẽ của mối quan hệ giữa các tính năng khác nhau.

Nếu mối quan hệ này có thể được ước tính bằng một số đường cong, thì có thể dự đoán sự thay đổi ở một trong các tham số với sự thay đổi có mục đích ở một tham số khác.

sự phụ thuộc tương quan từ
có thể được mô tả bằng cách sử dụng một phương trình có dạng

(1)

g
de
nghĩa có điều kiện số lượng tương ứng với giá trị số lượng
, MỘT
chức năng nào đó. Phương trình (1) được gọi là TRÊN
.

Hình.1. hồi quy tuyến tính có ý nghĩa. Người mẫu
.

Chức năng
gọi điện hồi quy mẫu TRÊN
, và đồ thị của nó là đường hồi quy mẫu TRÊN
.

Hoàn toàn tương tự phương trình hồi quy mẫu
TRÊN là phương trình
.

Tùy thuộc vào loại phương trình hồi quy và hình dạng của đường hồi quy tương ứng, dạng phụ thuộc tương quan giữa các giá trị được xem xét được xác định - tuyến tính, bậc hai, cấp số nhân, cấp số nhân.

Quan trọng nhất là câu hỏi chọn loại hàm hồi quy
[hoặc
], chẳng hạn như tuyến tính hoặc phi tuyến tính (số mũ, logarit, v.v.)

Trong thực tế, dạng của hàm hồi quy có thể được xác định bằng cách xây dựng trên mặt phẳng tọa độ một tập hợp các điểm tương ứng với tất cả các cặp quan sát có sẵn (
).

Cơm. 2. Hồi quy tuyến tính không có ý nghĩa. Người mẫu
.

r
là. 3. Mô hình phi tuyến
.

Ví dụ, trong Hình.1. có một xu hướng tăng giá trị với sự tăng trưởng
, trong khi các giá trị trung bình nằm trực quan trên một đường thẳng. Thật hợp lý khi sử dụng một mô hình tuyến tính (loại phụ thuộc từ
được gọi là một mô hình) phụ thuộc từ
.

Trong Hình.2. giá trị trung bình không phụ thuộc vào , do đó, hồi quy tuyến tính là không đáng kể (hàm hồi quy là hằng số và bằng ).

Trên hình. 3. Mô hình có xu hướng phi tuyến tính.

Ví dụ về mối quan hệ đường thẳng:

    tăng lượng iốt tiêu thụ và giảm tỷ lệ mắc bệnh bướu cổ,

    tăng kinh nghiệm của công nhân và tăng năng suất.

Ví dụ phụ thuộc đường cong:

    với sự gia tăng lượng mưa, năng suất tăng, nhưng điều này xảy ra ở một giới hạn nhất định của lượng mưa. Sau điểm tới hạn, lượng mưa đã quá nhiều, đất bị úng nước và năng suất giảm,

    mối quan hệ giữa liều lượng clo dùng để khử trùng nước và số lượng vi khuẩn trong 1 ml. Nước. Khi tăng liều lượng clo, số lượng vi khuẩn trong nước sẽ giảm, nhưng khi đạt đến điểm tới hạn, số lượng vi khuẩn sẽ không đổi (hoặc hoàn toàn không có), cho dù chúng ta có tăng liều lượng clo như thế nào.

hồi quy tuyến tính

Chọn loại hàm hồi quy, tức là loại mô hình phụ thuộc đang được xem xét từ X (hoặc X từ Y), ví dụ, một mô hình tuyến tính
, cần xác định giá trị cụ thể của các hệ số của mô hình.

Đối với các giá trị khác nhau MỘT
có thể xây dựng vô số phụ thuộc có dạng
tức là trên mặt phẳng tọa độ có vô số dòng, nhưng chúng ta cần một sự phụ thuộc như vậy phù hợp với các giá trị được quan sát theo cách tốt nhất. Do đó, vấn đề được giảm xuống để lựa chọn các hệ số tốt nhất.

Bình phương nhỏ nhất (LSM)

hàm tuyến tính
chúng tôi tìm kiếm chỉ dựa trên một số quan sát có sẵn nhất định. Để tìm hàm phù hợp nhất với các giá trị quan sát được, chúng tôi sử dụng phương pháp bình phương nhỏ nhất.

Hình.4. Giải thích ước lượng các hệ số theo phương pháp bình phương nhỏ nhất

Chứng tỏ: - giá trị tính theo phương trình

- gia trị đo,

- sự khác biệt giữa các giá trị đo được và tính toán,

.

TRONG bình phương nhỏ nhất bắt buộc phải , sự khác biệt giữa các phép đo và các giá trị được tính bởi phương trình , là tối thiểu. Do đó, chúng tôi tìm cách chọn các hệ số MỘTsao cho tổng bình phương độ lệch của các giá trị quan sát được so với các giá trị trên đường hồi quy thẳng là nhỏ nhất:

Điều kiện này đạt được nếu các tham số MỘTsẽ được tính theo các công thức:

gọi điện hệ số hồi quy; gọi điện thành viên miễn phí phương trình hồi quy.

Đường thẳng kết quả là một ước tính cho đường hồi quy lý thuyết. Chúng ta có

Vì thế,
phương trình hồi quy tuyến tính.

Hồi quy có thể trực tiếp
và đảo ngược
.

SỰ ĐỊNH NGHĨA: Hồi quy ngược có nghĩa là khi một tham số tăng lên, các giá trị của tham số kia sẽ giảm xuống.

Hồi quy tuyến tính ghép nối

XƯỞNG

Hồi quy tuyến tính ghép nối: Hội thảo. -

Nghiên cứu về kinh tế lượng liên quan đến việc sinh viên tích lũy kinh nghiệm trong việc xây dựng các mô hình kinh tế lượng, đưa ra quyết định về đặc điểm kỹ thuật và xác định mô hình, chọn phương pháp ước tính các tham số mô hình, đánh giá chất lượng của nó, giải thích kết quả, thu được các ước tính dự đoán, v.v. Hội thảo sẽ giúp sinh viên có được những kỹ năng thực tế trong những vấn đề này.

Được sự đồng ý của hội đồng biên tập và xuất bản

Biên soạn: M.B. Perova, Tiến sĩ Kinh tế, Giáo sư

Các quy định chung

Nghiên cứu kinh tế lượng bắt đầu với một lý thuyết thiết lập mối quan hệ giữa các hiện tượng. Từ toàn bộ các yếu tố ảnh hưởng đến tính năng hiệu quả, các yếu tố quan trọng nhất được phân biệt. Sau khi xác định được sự hiện diện của mối quan hệ giữa các đặc điểm được nghiên cứu, dạng chính xác của mối quan hệ này được xác định bằng cách sử dụng Phân tích hồi quy.

Phân tích hồi quy là xác định một biểu thức giải tích (trong định nghĩa của hàm), trong đó sự thay đổi một giá trị (tính năng hiệu dụng) là do ảnh hưởng giá trị độc lập(dấu giai thừa). Mối quan hệ này có thể được định lượng bằng cách xây dựng phương trình hồi quy hoặc hàm hồi quy.

Mô hình hồi quy cơ bản là mô hình hồi quy cặp (một nhân tố). hồi quy cặp– phương trình kết nối của hai biến TạiX:

Ở đâu - biến phụ thuộc (dấu kết quả);

– biến độc lập, giải thích (dấu giai thừa).

Tùy thuộc vào bản chất của sự thay đổi Tại với sự thay đổi X phân biệt hồi quy tuyến tính và phi tuyến tính.

hồi quy tuyến tính

Hàm hồi quy này được gọi là đa thức bậc nhất và được sử dụng để mô tả các quá trình phát triển đồng đều theo thời gian.

Có một thành viên ngẫu nhiên (lỗi hồi quy) có liên quan đến tác động lên biến phụ thuộc của các yếu tố khác không được tính đến trong phương trình, với khả năng phi tuyến tính của mô hình, lỗi đo lường, do đó, xuất hiện phương trình lỗi ngẫu nhiên hồi quy có thể là do mục tiêu sau lý do:

1) tính không đại diện của mẫu. Mô hình hồi quy cặp bao gồm một yếu tố không thể giải thích đầy đủ sự thay đổi của biến kết quả, có thể bị ảnh hưởng bởi nhiều yếu tố khác (biến bị thiếu) ở mức độ lớn hơn nhiều. Việc làm, tiền lương có thể phụ thuộc, ngoài trình độ, vào trình độ học vấn, kinh nghiệm làm việc, giới tính, v.v.;

2) có khả năng các biến tham gia vào mô hình có thể được đo lường do lỗi. Ví dụ, dữ liệu về chi tiêu cho thực phẩm của gia đình được tổng hợp từ hồ sơ của những người tham gia khảo sát, những người được cho là sẽ ghi chép cẩn thận các khoản chi tiêu hàng ngày của họ. Tất nhiên, điều này có thể dẫn đến sai sót.

Dựa trên quan sát mẫu, phương trình hồi quy mẫu được ước tính ( đường Hồi quy):

,

Ở đâu
– ước lượng các tham số của phương trình hồi quy (
).

Dạng phân tích của sự phụ thuộc giữa cặp tính năng được nghiên cứu (hàm hồi quy) được xác định bằng cách sử dụng như sau phương pháp:

    Dựa trên lý thuyết và phân tích logic bản chất của các hiện tượng được nghiên cứu, bản chất kinh tế xã hội của chúng. Ví dụ, nếu nghiên cứu mối quan hệ giữa thu nhập của người dân và quy mô tiền gửi của người dân trong ngân hàng, thì rõ ràng là mối quan hệ này là trực tiếp.

    phương pháp đồ họa khi bản chất của mối quan hệ được đánh giá một cách trực quan.

Có thể thấy rõ sự phụ thuộc này nếu bạn xây dựng biểu đồ bằng cách vẽ giá trị của thuộc tính trên trục x X và trên trục y - các giá trị của tính năng Tại. Vẽ trên đồ thị các điểm tương ứng với các giá trị XTại, chúng tôi nhận được trường tương quan:

a) nếu các điểm nằm rải rác ngẫu nhiên trong trường, điều này cho thấy không có mối quan hệ giữa các đặc điểm này;

b) nếu các điểm tập trung xung quanh một trục kéo dài từ góc dưới bên trái lên góc trên bên phải, thì có một mối quan hệ trực tiếp giữa các dấu hiệu;

c) nếu các điểm tập trung quanh một trục chạy từ góc trên bên trái xuống góc dưới bên phải thì mối quan hệ nghịch đảo giữa các biển báo.

Nếu trên trường tương quan, chúng tôi kết nối các điểm với các đoạn thẳng, thì chúng tôi nhận được đường đứt đoạn với một số xu hướng tăng. Đây sẽ là một liên kết thực nghiệm hoặc đường hồi quy thực nghiệm. Bằng vẻ ngoài của nó, người ta có thể đánh giá không chỉ sự hiện diện mà còn cả hình thức của mối quan hệ giữa các đặc điểm được nghiên cứu.

Xây dựng phương trình hồi quy cặp

Việc xây dựng phương trình hồi quy được rút gọn thành việc ước lượng các tham số của nó. Các ước tính tham số này có thể được tìm thấy theo nhiều cách khác nhau. Một trong số đó là phương pháp bình phương nhỏ nhất (LSM). Bản chất của phương pháp là như sau. Mỗi giá trị tương ứng với giá trị thực nghiệm (quan sát) . Bằng cách xây dựng phương trình hồi quy, chẳng hạn phương trình đường thẳng, mỗi giá trị sẽ tương ứng với giá trị lý thuyết (tính toán) . Giá trị quan sát được không nằm chính xác trên đường hồi quy, tức là không phù hợp với . Chênh lệch giữa giá trị thực và giá trị tính toán của biến phụ thuộc được gọi là phần còn lại:

LSM cho phép bạn có được các ước tính tham số như vậy, trong đó tổng các độ lệch bình phương của các giá trị thực của tính năng hiệu quả Tại từ lý thuyết , I E. tổng bình phương của số dư, nhỏ nhất:

Đối với các phương trình tuyến tính và phương trình phi tuyến có thể rút gọn thành tuyến tính, hệ thức sau đây được giải đối với MỘTb:

Ở đâu N- cỡ mẫu.

Giải hệ phương trình, ta thu được các giá trị MỘTb, cho phép chúng ta viết phương trình hồi quy(phương trình hồi quy):

Ở đâu là biến giải thích (độc lập);

–biến (phụ thuộc) được giải thích;

Đường hồi quy đi qua điểm ( ,) và đẳng thức được thỏa mãn:

Bạn có thể sử dụng các công thức làm sẵn theo hệ phương trình này:

Ở đâu - giá trị trung bình của tính năng phụ thuộc;

là giá trị trung bình của một tính năng độc lập;

là trung bình cộng của tích các đối số phụ thuộc và độc lập;

là phương sai của một tính năng độc lập;

là hiệp phương sai giữa các tính năng phụ thuộc và độc lập.

hiệp phương sai mẫu hai biến X, Tại gọi điện giá trị trung bình tích của độ lệch của các biến này so với giá trị trung bình của chúng

Tham số b Tại X có một điều tuyệt vời giá trị thực tiễn và được gọi là hệ số hồi quy. Hệ số hồi quy cho biết giá trị thay đổi trung bình bao nhiêu đơn vị Tại X 1 đơn vị đo lường của nó.

dấu hiệu tham số b trong phương trình hồi quy cặp chỉ ra chiều của mối quan hệ:

Nếu như
, thì mối quan hệ giữa các chỉ số được nghiên cứu là trực tiếp, tức là với sự gia tăng trong dấu hiệu yếu tố X dấu hiệu kết quả tăng Tại, và ngược lại;

Nếu như
, thì mối quan hệ giữa các chỉ tiêu nghiên cứu là nghịch đảo, tức là với sự gia tăng trong dấu hiệu yếu tố X dấu hiệu hiệu quả Tại giảm và ngược lại.

Giá trị tham số MỘT trong phương trình hồi quy cặp trong một số trường hợp có thể được hiểu là giá trị ban đầu của tính năng hiệu quả Tại. Việc giải thích tham số này MỘT chỉ có thể nếu giá trị
có ý nghĩa.

Sau khi xây dựng phương trình hồi quy, các giá trị quan sát được y có thể được tưởng tượng như:

hài cốt , cũng như lỗi , là biến ngẫu nhiên, nhưng chúng trái ngược với lỗi , quan sát được. Phần còn lại là một phần của biến phụ thuộc y, không thể giải thích được bằng phương trình hồi quy.

Dựa vào phương trình hồi quy có thể tính giá trị lý thuyết X cho bất kỳ giá trị X.

Trong phân tích kinh tế, người ta thường sử dụng khái niệm hệ số co giãn của hàm số. chức năng đàn hồi
được tính là thay đổi tương đối y thay đổi tương đối x. Độ co giãn cho thấy hàm thay đổi bao nhiêu
khi biến độc lập thay đổi 1%.

Do tính đàn hồi của một hàm tuyến tính
không phải giá trị hiện có, nhưng phụ thuộc vào X, thì hệ số co giãn thường được tính là chỉ số co giãn trung bình.

hệ số đàn hồi hiển thị bao nhiêu phần trăm giá trị của thuộc tính hiệu quả sẽ thay đổi trung bình trong tổng số Tại khi đổi dấu thừa số X 1% giá trị trung bình của nó:

Ở đâu
– giá trị trung bình của các biến XTại trong mẫu.

Đánh giá chất lượng của mô hình hồi quy đã xây dựng

Chất lượng của mô hình hồi quy– tính đầy đủ của mô hình được xây dựng đối với dữ liệu ban đầu (được quan sát).

Để đo độ kín của kết nối, tức là. để đo mức độ gần với chức năng, bạn cần xác định phương sai đo độ lệch Tại từ Tại X và đặc trưng cho sự thay đổi còn lại do các yếu tố khác. Chúng làm cơ sở cho các chỉ báo đặc trưng cho chất lượng của mô hình hồi quy.

Chất lượng của hồi quy theo cặp được xác định bằng cách sử dụng các hệ số đặc trưng

1) độ chặt của kết nối - chỉ số tương quan, hệ số tương quan tuyến tính được ghép nối;

2) sai số gần đúng;

3) chất lượng của phương trình hồi quy và các tham số riêng lẻ của nó - sai số bình phương trung bình của toàn bộ phương trình hồi quy và các tham số riêng lẻ của nó.

Đối với phương trình hồi quy của bất kỳ loại nào được xác định chỉ số tương quan, chỉ đặc trưng cho mức độ chặt chẽ của sự phụ thuộc tương quan, tức là mức độ gần đúng của nó với một kết nối chức năng:

,

Ở đâu – phương sai giai thừa (lý thuyết);

là tổng phương sai.

Chỉ số tương quan nhận giá trị
, trong đó,

Nếu như

Nếu như
là mối quan hệ giữa các đặc điểm XTại là chức năng, càng gần đến 1, mối quan hệ giữa các tính trạng được nghiên cứu càng chặt chẽ. Nếu như
, thì mối quan hệ có thể được coi là gần gũi

Các phương sai cần thiết để tính toán các chỉ số về độ kín của kết nối được tính:

Tổng phương sai, đo lường biến thể phổ biến do tác động của tất cả các yếu tố:

Phương sai giai thừa (lý thuyết),đo lường sự biến đổi của đặc điểm kết quả Tại do hành động của một dấu hiệu yếu tố X:

phân tán dư, đặc trưng cho sự biến đổi của tính trạng Tại do tất cả các yếu tố ngoại trừ X(tức là với loại trừ X):

Khi đó, theo quy tắc cộng phương sai:

Chất lượng phòng xông hơi tuyến tính hồi quy cũng có thể được xác định bằng cách sử dụng cặp hệ số tương quan tuyến tính:

,

Ở đâu
- hiệp phương sai của các biến XTại;

– độ lệch chuẩn của một tính năng độc lập;

là độ lệch chuẩn của đặc trưng phụ thuộc.

Hệ số tương quan tuyến tính đặc trưng cho mức độ chặt chẽ và hướng của mối quan hệ giữa các đối tượng địa lý nghiên cứu. Nó được đo trong khoảng [-1; +1]:

Nếu như
- thì mối quan hệ giữa các dấu hiệu là trực tiếp;

Nếu như
- thì mối quan hệ giữa các dấu hiệu là nghịch đảo;

Nếu như
– sau đó không có kết nối giữa các dấu hiệu;

Nếu như
hoặc
- thì mối quan hệ giữa các tính năng là chức năng, tức là đặc trưng bởi sự kết hợp hoàn hảo giữa XTại. Gần gũi hơn đến 1, mối quan hệ giữa các tính trạng được nghiên cứu càng chặt chẽ.

Nếu bình phương chỉ số tương quan (hệ số tương quan tuyến tính ghép cặp) thì ta được hệ số xác định.

hệ số xác định- biểu thị tỷ lệ phương sai của yếu tố trong tổng số và cho biết có bao nhiêu phần trăm biến thể của thuộc tính kết quả Tạiđược giải thích bằng sự biến đổi của các đặc điểm nhân tố X:

Nó không bao gồm tất cả các biến thể. Tại từ một đặc điểm nhân tố X, nhưng chỉ một phần của nó tương ứng với phương trình hồi quy tuyến tính, tức là trình diễn trọng lượng riêng biến thể của đặc điểm kết quả, liên quan tuyến tính với sự biến đổi của đặc điểm nhân tố.

Giá trị
- tỷ lệ biến thể của thuộc tính kết quả mà mô hình hồi quy không thể tính đến.

Sự phân tán của các điểm trong trường tương quan có thể rất lớn và phương trình hồi quy được tính toán có thể gây ra sai số lớn trong việc ước tính chỉ báo được phân tích.

Lỗi xấp xỉ trung bình hiển thị độ lệch trung bình của các giá trị được tính toán so với thực tế:

Giá trị tối đa cho phép là 12–15%.

Sai số chuẩn được sử dụng như thước đo mức độ lan truyền của biến phụ thuộc xung quanh đường hồi quy. tiêu chuẩn (hiệu dụng) lỗi phương trình hồi quy, là độ lệch chuẩn của các giá trị thực tế Tại so với các giá trị lý thuyết được tính theo phương trình hồi quy Tại X .

,

Ở đâu
là số bậc tự do;

tôi là số tham số của phương trình hồi quy (đối với phương trình đường thẳng tôi=2).

Ước tính giá trị trung bình lỗi bậc hai bạn có thể so sánh nó

a) với giá trị trung bình của tính năng hiệu quả Tại;

b) với độ lệch chuẩn của đặc trưng Tại:

Nếu như
, thì việc sử dụng phương trình hồi quy này là phù hợp.

đánh giá riêng tiêu chuẩn (rms) lỗi của các tham số phương trình và chỉ số tương quan:

;
;
.

X- độ lệch chuẩn X.

Kiểm tra ý nghĩa của phương trình hồi quy và các chỉ số về độ kín của kết nối

Để mô hình đã xây dựng được sử dụng cho các tính toán kinh tế tiếp theo, việc kiểm tra chất lượng của mô hình đã xây dựng là chưa đủ. Cũng cần kiểm tra ý nghĩa (tầm quan trọng) của các ước tính của phương trình hồi quy và chỉ số về mức độ gần gũi của kết nối thu được bằng phương pháp bình phương nhỏ nhất, tức là cần phải kiểm tra xem chúng có tuân thủ các tham số thực của mối quan hệ hay không.

Điều này là do thực tế là các chỉ số được tính cho một dân số hạn chế giữ lại yếu tố ngẫu nhiên vốn có trong các giá trị riêng lẻ của thuộc tính. Do đó, chúng chỉ là ước tính của một quy tắc thống kê nhất định. Cần đánh giá mức độ chính xác và ý nghĩa (độ tin cậy, trọng yếu) của các tham số hồi quy. Dưới tầm quan trọng hiểu xác suất giá trị của tham số được kiểm tra không bằng 0 không bao gồm các giá trị trái dấu.

kiểm tra ý nghĩa– kiểm tra giả định rằng các tham số khác 0.

Đánh giá tầm quan trọng của phương trình hồi quy theo cặpđi xuống để kiểm tra các giả thuyết về tầm quan trọng của toàn bộ phương trình hồi quy và các tham số riêng lẻ của nó ( Một, b), cặp hệ số xác định hoặc chỉ số tương quan.

Trong trường hợp này, những điều sau đây có thể được đưa ra giả thuyết chínhh 0 :

1)
– các hệ số hồi quy không đáng kể và phương trình hồi quy cũng không đáng kể;

2)
– hệ số xác định cặp là không đáng kể và phương trình hồi quy cũng không đáng kể.

Thay thế (hoặc đảo ngược) là các giả thuyết sau:

1)
– các hệ số hồi quy khác 0 một cách đáng kể và phương trình hồi quy được xây dựng là có ý nghĩa;

2)
– hệ số xác định theo cặp khác 0 một cách đáng kể và phương trình hồi quy được xây dựng là có ý nghĩa.

Kiểm định giả thuyết về ý nghĩa của phương trình hồi quy cặp

Để kiểm định giả thuyết về sự không có ý nghĩa thống kê của phương trình hồi quy nói chung và hệ số xác định, chúng tôi sử dụng F-tiêu chuẩn(Tiêu chuẩn Fisher):

hoặc

Ở đâu k 1 = tôi–1 ; k 2 = Ntôi là số bậc tự do;

N là số đơn vị dân số;

tôi là số tham số của phương trình hồi quy;

– hệ số phân tán;

là phương sai còn lại.

Giả thuyết được kiểm định như sau:

1) nếu giá trị thực tế (được quan sát) F-tiêu chí lớn hơn giá trị (bảng) tới hạn của tiêu chí này
, sau đó với xác suất
giả thuyết chính về tầm quan trọng của phương trình hồi quy hoặc cặp hệ số xác định bị bác bỏ và phương trình hồi quy được công nhận là có ý nghĩa;

2) nếu giá trị thực tế (được quan sát) của tiêu chí F nhỏ hơn giá trị tới hạn của tiêu chí này
, sau đó với xác suất (
) giả thuyết chính về tầm quan trọng của phương trình hồi quy hoặc cặp hệ số xác định được chấp nhận và phương trình hồi quy đã xây dựng được công nhận là không đáng kể.

giá trị quan trọng F- tiêu chí tìm được theo các bảng tương ứng tuỳ theo mức ý nghĩa và số bậc tự do
.

Số bậc tự do- chỉ số, được định nghĩa là sự khác biệt giữa cỡ mẫu ( N) và số lượng tham số ước tính cho mẫu này ( tôi). Đối với mô hình hồi quy theo cặp, số bậc tự do được tính như sau
, vì hai tham số được ước tính từ mẫu (
).

Mức độ đáng kể - giá trị được xác định
,

Ở đâu là xác suất tin cậy mà tham số ước tính nằm trong khoảng tin cậy. Thường lấy 0,95. Như vậy là xác suất để tham số ước lượng không rơi vào khoảng tin cậy, bằng 0,05 (5%).

Sau đó, trong trường hợp đánh giá tầm quan trọng của phương trình hồi quy theo cặp, giá trị tới hạn của tiêu chí F được tính như sau
:

.

Kiểm định giả thuyết về ý nghĩa các tham số của phương trình hồi quy cặp và chỉ số tương quan

Khi kiểm tra tầm quan trọng của các tham số của phương trình (giả định rằng các tham số khác 0), giả thuyết chính được đưa ra về tầm quan trọng của các ước tính thu được (
. Là một giả thuyết thay thế (đảo ngược) được đưa ra về tầm quan trọng của các tham số của phương trình (
).

Để kiểm tra các giả thuyết đề xuất, chúng tôi sử dụng t -tiêu chuẩn (t-số liệu thống kê) Học sinh. Giá trị quan sát t-tiêu chí được so sánh với giá trị t-criterion được xác định bởi bảng phân phối của Student (giá trị tới hạn). giá trị quan trọng t- tiêu chuẩn
phụ thuộc vào hai tham số: mức ý nghĩa và số bậc tự do
.

Các giả thuyết đề xuất được kiểm định như sau:

1) nếu mô đun của giá trị quan sát được t-tiêu chí lớn hơn giá trị tới hạn t-tiêu chí, tức là
, sau đó với xác suất
giả thuyết chính về tầm quan trọng của các tham số hồi quy bị bác bỏ, tức là tham số hồi quy không bằng 0;

2) nếu mô đun của giá trị quan sát được t- tiêu chí nhỏ hơn hoặc bằng giá trị tới hạn t-tiêu chí, tức là
, sau đó với xác suất
giả thuyết chính về tầm quan trọng của các tham số hồi quy được chấp nhận, tức là tham số hồi quy hầu như không khác 0 hoặc bằng 0.

Việc đánh giá tầm quan trọng của các hệ số hồi quy bằng cách sử dụng bài kiểm tra của Học sinh được thực hiện bằng cách so sánh các ước tính của chúng với giá trị của sai số chuẩn:

;

Để đánh giá ý nghĩa thống kê của chỉ số (hệ số tuyến tính) của mối tương quan, người ta còn sử dụng t-Tiêu chí của học sinh.

Trong quá trình học tập, học sinh thường gặp nhiều dạng phương trình khác nhau. Một trong số đó - phương trình hồi quy - được xem xét trong bài viết này. Loại phương trình này được sử dụng đặc biệt để mô tả các đặc điểm của mối quan hệ giữa thông số toán học. Loại nàyđẳng thức được sử dụng trong thống kê và kinh tế lượng.

Định nghĩa hồi quy

Trong toán học, hồi quy được hiểu là một đại lượng nào đó mô tả sự phụ thuộc của giá trị trung bình của một tập dữ liệu vào các giá trị của một đại lượng khác. Phương trình hồi quy cho thấy, dưới dạng hàm của một tính năng cụ thể, giá trị trung bình của một tính năng khác. Hàm hồi quy có dạng phương trình đơn giản y \u003d x, trong đó y là biến phụ thuộc và x là biến độc lập (yếu tố đặc trưng). Trên thực tế, hồi quy được biểu thị dưới dạng y = f (x).

Các loại mối quan hệ giữa các biến

Nói chung, hai loại mối quan hệ trái ngược được phân biệt: tương quan và hồi quy.

Đầu tiên được đặc trưng bởi sự bình đẳng của các biến có điều kiện. TRONG trường hợp này người ta không biết chắc biến nào phụ thuộc vào biến kia.

Nếu không có sự bình đẳng giữa các biến và các điều kiện cho biết biến nào là giải thích và biến nào là phụ thuộc, thì chúng ta có thể nói về sự hiện diện của một kết nối loại thứ hai. Để xây dựng một phương trình hồi quy tuyến tính, cần phải tìm ra loại mối quan hệ nào được quan sát.

Các loại hồi quy

Cho đến nay, có 7 loại hồi quy khác nhau: hypebol, tuyến tính, bội số, phi tuyến tính, theo cặp, nghịch đảo, tuyến tính logarit.

Hyperbolic, tuyến tính và logarit

Phương trình hồi quy tuyến tính được sử dụng trong thống kê để giải thích rõ ràng các tham số của phương trình. Có vẻ như y = c + m * x + E. Phương trình hyperbol có dạng một hyperbola thông thường y \u003d c + m / x + E. Phương trình tuyến tính logarit biểu thị mối quan hệ bằng cách sử dụng hàm logarit: Trong y \u003d Trong c + t * Trong x + Trong E.

Nhiều và phi tuyến tính

hai nữa các loại phức tạp hồi quy là nhiều và phi tuyến tính. phương trình hồi quy bộiđược biểu thị bằng hàm y \u003d f (x 1, x 2 ... x c) + E. Trong tình huống này, y là biến phụ thuộc và x là biến giải thích. Biến E là ngẫu nhiên và bao gồm ảnh hưởng của các yếu tố khác trong phương trình. phương trình phi tuyến tính hồi quy là một chút không nhất quán. Một mặt, đối với các chỉ số được tính đến, nó không tuyến tính, mặt khác, với vai trò đánh giá các chỉ số, nó là tuyến tính.

Hồi quy nghịch đảo và theo cặp

Nghịch đảo là một loại hàm cần được chuyển đổi thành chế độ xem tuyến tính. Trong hầu hết các chương trình ứng dụng truyền thống, nó có dạng hàm y \u003d 1 / c + m * x + E. Phương trình hồi quy theo cặp cho thấy mối quan hệ giữa dữ liệu dưới dạng hàm của y = f(x) + E. Cũng giống như các phương trình khác, y phụ thuộc vào x và E là một tham số ngẫu nhiên.

Khái niệm tương quan

Đây là chỉ tiêu chứng tỏ sự tồn tại mối quan hệ giữa hai hiện tượng hay quá trình. Độ mạnh của mối quan hệ được thể hiện dưới dạng hệ số tương quan. Giá trị của nó dao động trong khoảng [-1;+1]. chỉ tiêu âm nói về sự hiện diện nhận xét, dương - về một đường thẳng. Nếu hệ số nhận giá trị bằng 0 thì không có quan hệ. Giá trị càng gần 1 - mối quan hệ giữa các tham số càng mạnh, càng gần 0 - càng yếu.

phương pháp

Các phương pháp tham số tương quan có thể ước tính mức độ chặt chẽ của mối quan hệ. Chúng được sử dụng trên cơ sở ước lượng phân phối để nghiên cứu các tham số tuân theo luật phân phối chuẩn.

Các tham số của phương trình hồi quy tuyến tính cần thiết để xác định dạng phụ thuộc, hàm của phương trình hồi quy và đánh giá các chỉ tiêu của công thức quan hệ đã chọn. Trường tương quan được sử dụng như một phương pháp để xác định mối quan hệ. Để làm điều này, tất cả dữ liệu hiện có phải được biểu diễn bằng đồ họa. Trong hệ tọa độ hai chiều hình chữ nhật, tất cả dữ liệu đã biết phải được vẽ trên đồ thị. Đây là cách trường tương quan được hình thành. Giá trị của yếu tố mô tả được đánh dấu dọc theo trục hoành, trong khi các giá trị của yếu tố phụ thuộc được đánh dấu dọc theo tọa độ. Nếu có một mối quan hệ chức năng giữa các tham số, chúng sẽ xếp hàng dưới dạng một dòng.

Nếu hệ số tương quan của dữ liệu đó nhỏ hơn 30%, thì chúng ta có thể nói về việc gần như hoàn toàn không có kết nối. Nếu nó nằm trong khoảng từ 30% đến 70%, thì điều này cho thấy sự hiện diện của các liên kết có độ kín trung bình. Chỉ báo 100% là bằng chứng về kết nối chức năng.

Phương trình hồi quy phi tuyến tính, giống như phương trình tuyến tính, phải được bổ sung chỉ số tương quan (R).

Tương quan cho nhiều hồi quy

Hệ số xác định là một chỉ số bình phương nhiều tương quan. Anh ấy nói về mối quan hệ chặt chẽ của bộ chỉ số được trình bày với đặc điểm đang được nghiên cứu. Nó cũng có thể nói về bản chất ảnh hưởng của các tham số đến kết quả. Phương trình hồi quy bội được đánh giá bằng chỉ số này.

Để tính chỉ số tương quan bội, cần tính chỉ số của nó.

Phương pháp bình phương nhỏ nhất

Phương pháp này là một cách ước lượng các nhân tố hồi quy. Bản chất của nó nằm ở việc giảm thiểu tổng các độ lệch bình phương thu được do sự phụ thuộc của thừa số vào hàm.

Một phương trình hồi quy tuyến tính được ghép nối có thể được ước tính bằng phương pháp như vậy. Loại phương trình này được sử dụng trong trường hợp phát hiện giữa các chỉ tiêu có mối quan hệ tuyến tính ghép đôi.

Tùy chọn phương trình

Mỗi tham số của hàm hồi quy tuyến tính có một ý nghĩa cụ thể. Phương trình hồi quy tuyến tính được ghép nối chứa hai tham số: c và m. Tham số t hiển thị mức thay đổi trung bình trong chỉ báo cuối cùng của hàm y, có thể giảm (tăng) trong biến x theo một đơn vị quy ước. Nếu biến x bằng 0 thì hàm bằng tham số c. Nếu biến x khác 0 thì thừa số c không mang ý nghĩa kinh tế. Ảnh hưởng duy nhất đến chức năng là dấu hiệu ở phía trước của yếu tố c. Nếu có một điểm trừ, thì chúng ta có thể nói về sự thay đổi chậm trong kết quả so với yếu tố. Nếu có một điểm cộng, thì điều này cho thấy kết quả có sự thay đổi nhanh chóng.

Mỗi tham số làm thay đổi giá trị của phương trình hồi quy có thể được biểu diễn dưới dạng một phương trình. Ví dụ, hệ số c có dạng c = y - mx.

Dữ liệu được nhóm

Có những điều kiện như vậy của vấn đề trong đó tất cả thông tin được nhóm theo thuộc tính x, nhưng đồng thời cho nhóm nhất định các giá trị trung bình tương ứng của chỉ số phụ thuộc được chỉ định. Trong trường hợp này, các giá trị trung bình đặc trưng cho mức độ phụ thuộc của chỉ báo vào x. Do đó, thông tin được nhóm lại giúp tìm ra phương trình hồi quy. Nó được sử dụng như một phân tích mối quan hệ. Tuy nhiên, phương pháp này có nhược điểm của nó. Thật không may, mức trung bình thường bị biến động bên ngoài. Những biến động này không phải là sự phản ánh các khuôn mẫu của mối quan hệ, chúng chỉ che đậy "tiếng ồn" của nó. Trung bình cho thấy các mẫu mối quan hệ tồi tệ hơn nhiều so với phương trình hồi quy tuyến tính. Tuy nhiên, chúng có thể được sử dụng làm cơ sở để tìm một phương trình. Bằng cách nhân quy mô của một dân số cụ thể với mức trung bình tương ứng, bạn có thể nhận được tổng của y trong nhóm. Tiếp theo, bạn cần loại bỏ tất cả số tiền nhận được và tìm chỉ số cuối cùng y. Sẽ khó hơn một chút khi thực hiện các phép tính với chỉ báo tổng xy. Trong trường hợp các khoảng nhỏ, chúng ta có thể lấy chỉ số x cho tất cả các đơn vị (trong nhóm) một cách có điều kiện như nhau. Nhân nó với tổng của y để tìm tổng các tích của x và y. Hơn nữa, tất cả các khoản tiền được gõ lại với nhau và hóa ra tổng cộng hu.

Hồi quy phương trình nhiều cặp: Đánh giá tầm quan trọng của một mối quan hệ

Như đã thảo luận trước đó, hồi quy bội có hàm dạng y \u003d f (x 1, x 2, ..., x m) + E. Thông thường, một phương trình như vậy được sử dụng để giải quyết vấn đề cung và cầu hàng hóa, thu nhập lãi từ cổ phiếu mua lại, nghiên cứu nguyên nhân và loại hàm chi phí sản xuất. Nó cũng được sử dụng tích cực trong nhiều nghiên cứu và tính toán kinh tế vĩ mô, nhưng ở cấp độ kinh tế vi mô, phương trình này được sử dụng ít thường xuyên hơn một chút.

Nhiệm vụ chính của hồi quy bội là xây dựng một mô hình dữ liệu chứa một lượng thông tin khổng lồ để xác định thêm điều gì ảnh hưởng đến từng yếu tố riêng lẻ và trong tổng thể của chúng đối với chỉ báo được mô hình hóa và các hệ số của nó. Phương trình hồi quy có thể nhận nhiều giá trị khác nhau. Trong trường hợp này, hai loại chức năng thường được sử dụng để đánh giá mối quan hệ: tuyến tính và phi tuyến tính.

Một hàm tuyến tính được mô tả dưới dạng một mối quan hệ như vậy: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Trong trường hợp này, a2, a m , được coi là các hệ số hồi quy "thuần túy". Họ cần phải mô tả sự thay đổi trung bình trong tham số y với sự thay đổi (giảm hoặc tăng) trong mỗi tham số x tương ứng theo một đơn vị, với điều kiện là giá trị ổn định của các chỉ số khác.

Các phương trình phi tuyến tính có dạng chức năng nguồn y=ax 1 b1 x 2 b2 ...x m bm . Trong trường hợp này, các chỉ số b 1, b 2 ..... b m - được gọi là hệ số co giãn, chúng cho biết kết quả sẽ thay đổi như thế nào (bao nhiêu %) khi chỉ số x tương ứng tăng (giảm) 1% và với một chỉ số ổn định của các yếu tố khác.

Những yếu tố nào cần được xem xét khi xây dựng hồi quy bội

Để xây dựng một hồi quy bội một cách chính xác, cần phải tìm ra những yếu tố nào cần được đặc biệt chú ý.

Cần phải có một số hiểu biết về bản chất của mối quan hệ giữa những yếu tố kinh tế và làm mẫu. Các yếu tố được đưa vào phải đáp ứng các tiêu chí sau:

  • Phải đo lường được. Để sử dụng một yếu tố mô tả chất lượng của một đối tượng, trong mọi trường hợp, nó phải được đưa ra dưới dạng định lượng.
  • Không nên có mối tương quan giữa các yếu tố, hoặc mối quan hệ chức năng. Những hành động như vậy thường dẫn đến hậu quả không thể đảo ngược - hệ thống phương trình thông thường trở nên vô điều kiện, và điều này kéo theo những đánh giá không đáng tin cậy và mờ nhạt của nó.
  • Trong trường hợp tồn tại một chỉ số tương quan lớn, không có cách nào để tìm ra ảnh hưởng riêng biệt của các yếu tố đối với kết quả cuối cùng chỉ báo, do đó, các hệ số trở nên không thể giải thích được.

Phương pháp xây dựng

tồn tại số lượng lớn các phương pháp và kỹ thuật giải thích cách bạn có thể chọn các thừa số cho phương trình. Tuy nhiên, tất cả các phương pháp này đều dựa trên việc lựa chọn các hệ số bằng cách sử dụng chỉ số tương quan. Trong số đó có:

  • Phương pháp loại trừ.
  • Bật phương pháp.
  • Phân tích hồi quy từng bước.

Phương pháp đầu tiên liên quan đến việc sàng lọc tất cả các hệ số từ tập hợp tổng hợp. Phương pháp thứ hai liên quan đến việc giới thiệu một bộ các yếu tố bổ sung. Chà, thứ ba là loại bỏ các yếu tố trước đây đã được áp dụng cho phương trình. Mỗi phương pháp này đều có quyền tồn tại. Chúng có những ưu và nhược điểm, nhưng chúng có thể giải quyết vấn đề sàng lọc các chỉ số không cần thiết theo cách riêng của chúng. Theo quy định, kết quả thu được của mỗi phương pháp riêng biệt là đủ gần.

Phương pháp phân tích đa biến

Các phương pháp xác định các yếu tố như vậy dựa trên việc xem xét các kết hợp riêng lẻ của các đặc điểm có liên quan với nhau. Chúng bao gồm phân tích phân biệt, nhận dạng mẫu, phân tích thành phần chính và phân tích cụm. Ngoài ra, còn có phân tích nhân tố, tuy nhiên, nó xuất hiện do sự phát triển của phương pháp thành phần. Tất cả chúng được áp dụng trong những trường hợp nhất định, trong những điều kiện và yếu tố nhất định.

x - được gọi là một yếu tố dự báo - một biến độc lập hoặc biến giải thích.

Đối với một đại lượng x cho trước, Y là giá trị của biến y (được gọi là biến phụ thuộc, đầu ra hoặc phản ứng) nằm trên đường ước lượng. Đây là giá trị chúng ta kỳ vọng cho y (trung bình) nếu chúng ta biết giá trị của x, và giá trị này được gọi là "giá trị dự đoán của y" (Hình 5).

a - thành viên tự do (giao nhau) của đường đánh giá; là giá trị của Y khi x = 0.

b- dốc hoặc độ dốc của đường ước tính; nó biểu thị lượng mà Y tăng trung bình nếu chúng ta tăng x lên một đơn vị (Hình 5). Hệ số b được gọi là hệ số hồi quy.

Ví dụ: với nhiệt độ cơ thể con người tăng 1 ° C, nhịp tim tăng trung bình 10 nhịp mỗi phút.

Hình 5. Đường hồi quy tuyến tính thể hiện hệ số MỘT và độ dốc b(tăng giá trị Y với sự gia tăng X trên mỗi đơn vị)

Về mặt toán học, giải pháp của phương trình hồi quy tuyến tính được rút gọn thành việc tính toán các tham số a và b sao cho các điểm của dữ liệu ban đầu của trường tương quan càng gần càng tốt với hồi quy trực tiếp .

Việc sử dụng từ "hồi quy" trong thống kê bắt nguồn từ một hiện tượng được gọi là hồi quy về giá trị trung bình, do Francis Galton (1889) thực hiện. Ông chỉ ra rằng trong khi những người bố cao thường có con trai cao, thì chiều cao trung bình của những người con trai lại thấp hơn chiều cao trung bình của những người cha cao. Chiều cao trung bình của con trai "thụt lùi" hoặc "đảo ngược" so với chiều cao trung bình của tất cả các ông bố trong dân số. Do đó, trung bình, những người cha cao có con trai thấp hơn (nhưng vẫn cao) và những người cha thấp có con trai cao hơn (nhưng vẫn hơi thấp).

Chúng tôi thấy hồi quy trung bình trong các thử nghiệm sàng lọc và lâm sàng trong đó một nhóm nhỏ bệnh nhân có thể được chọn để điều trị vì mức độ của một biến số cụ thể, chẳng hạn như cholesterol, rất cao (hoặc thấp). Nếu phép đo này được lặp lại theo thời gian, giá trị trung bình của nhóm phụ của lần đọc thứ hai thường thấp hơn giá trị lần đọc đầu tiên, có xu hướng (nghĩa là thoái lui) về giá trị trung bình phù hợp với độ tuổi và giới tính trong dân số, bất kể họ có thể nhận được cách điều trị nào. . Bệnh nhân được tuyển dụng vào một thử nghiệm lâm sàng dựa trên cấp độ cao mức cholesterol trong lần khám đầu tiên, do đó, có khả năng cho thấy mức cholesterol giảm trung bình trong lần khám thứ hai, ngay cả khi họ không được điều trị trong thời gian đó.

Thường phương pháp phân tích hồi quy được sử dụng để xây dựng các thang đo quy phạm, tiêu chuẩn phát triển thể chất.


Mức độ phù hợp của đường hồi quy với dữ liệu có thể được đánh giá bằng cách tính hệ số R (thường được biểu thị bằng phần trăm và được gọi là hệ số xác định), bằng bình phương của hệ số tương quan (r 2). Nó biểu thị tỷ lệ hoặc phần trăm phương sai của y có thể được giải thích bằng mối quan hệ với x, tức là tỷ lệ biến thể của tính trạng-kết quả đã phát triển dưới ảnh hưởng của một tính trạng độc lập. Nó có thể nhận các giá trị trong phạm vi từ 0 đến 1 hoặc tương ứng từ 0 đến 100%. Sự khác biệt (100% - R) là tỷ lệ phần trăm của phương sai trong y không thể giải thích được bằng tương tác này.

Ví dụ

Mối liên quan giữa chiều cao (đo bằng cm) và huyết áp tâm thu (SBP, đo bằng mmHg) ở trẻ em. Chúng tôi đã thực hiện phân tích hồi quy tuyến tính theo cặp của SBP so với chiều cao (Hình 6). Có một mối quan hệ tuyến tính đáng kể giữa chiều cao và SBP.

Hình 6. Đồ thị hai chiều thể hiện mối quan hệ giữa huyết áp tâm thu và chiều cao. Hiển thị là đường hồi quy ước tính, huyết áp tâm thu.

Phương trình đường hồi quy ước tính như sau:

VƯỜN \u003d 46,28 + 0,48 x chiều cao.

Trong ví dụ này, hệ số chặn không được quan tâm (việc tăng giá trị bằng 0 rõ ràng nằm ngoài phạm vi quan sát được trong nghiên cứu). Tuy nhiên, chúng ta có thể giải thích độ dốc; SBP được dự đoán sẽ tăng trung bình 0,48 mmHg ở những trẻ này. với chiều cao tăng thêm một cm

Chúng ta có thể áp dụng một phương trình hồi quy để dự đoán SBP mà chúng ta mong đợi ở một đứa trẻ ở một chiều cao nhất định. Ví dụ, một đứa trẻ cao 115 cm có SBP dự đoán là 46,28 + (0,48 x 115) = 101,48 mm Hg. Art., một đứa trẻ cao 130 có SBP dự đoán là 46,28 + (0,48 x 130) = 108,68 mm Hg. Nghệ thuật.

Khi tính toán hệ số tương quan, người ta thấy rằng nó bằng 0,55, điều này cho thấy mối tương quan trực tiếp sức mạnh trung bình. Trong trường hợp này, hệ số xác định r 2 \u003d 0,55 2 \u003d 0,3. Do đó, chúng ta có thể nói rằng tỷ lệ ảnh hưởng của tăng trưởng đến mức huyết áp ở trẻ em không vượt quá 30%, tương ứng 70% ảnh hưởng thuộc về tỷ lệ của các yếu tố khác.

Hồi quy tuyến tính (đơn giản) được giới hạn trong việc xem xét mối quan hệ giữa biến phụ thuộc và chỉ một biến độc lập. Nếu có nhiều hơn một biến độc lập trong mối quan hệ, thì chúng ta cần chuyển sang hồi quy bội. Phương trình cho một hồi quy như vậy trông như thế này:

y = a + bx 1 + b 2 x 2 + .... + b n x n

Người ta có thể quan tâm đến kết quả ảnh hưởng của một số biến độc lập x 1 , x 2 , .., x n lên biến trả lời y. Nếu chúng ta nghĩ rằng các x này có thể phụ thuộc lẫn nhau, thì chúng ta không được xem xét riêng tác động của việc thay đổi giá trị của một x theo y, mà phải tính đến đồng thời các giá trị của tất cả các x khác.

Ví dụ

Vì có mối quan hệ chặt chẽ giữa chiều cao và trọng lượng cơ thể của trẻ, người ta có thể thắc mắc liệu mối quan hệ giữa chiều cao và huyết áp tâm thu có thay đổi khi cân nặng và giới tính của trẻ cũng được tính đến hay không. Hồi quy tuyến tính bội kiểm tra tác động kết hợp của nhiều biến độc lập này đối với y.

Phương trình hồi quy bội trong trường hợp này có thể trông như thế này:

VƯỜN \u003d 79,44 - (0,03 x chiều cao) + (1,18 x cân nặng) + (4,23 x giới tính) *

* - (đối với giới tính, giá trị 0 - nam, 1 - nữ)

Theo phương trình này, một cô gái cao 115 cm và nặng 37 kg sẽ có SBP dự đoán:

VƯỜN \u003d 79,44 - (0,03 x 115) + (1,18 x 37) + (4,23 x 1) \u003d 123,88 mm Hg.

Hồi quy logistic rất giống với hồi quy tuyến tính; nó được sử dụng khi có một kết quả quan tâm nhị phân (nghĩa là có/không có triệu chứng hoặc một đối tượng mắc/không mắc bệnh) và một tập hợp các yếu tố dự báo. Từ phương trình hồi quy logistic, có thể xác định yếu tố dự đoán nào ảnh hưởng đến kết quả và sử dụng các giá trị của yếu tố dự đoán của bệnh nhân, ước tính khả năng anh ấy/cô ấy sẽ có một kết quả cụ thể. Ví dụ: có phát sinh biến chứng hay không, điều trị có hiệu quả hay không.

Bắt đầu tạo một biến nhị phân để biểu thị hai kết quả (ví dụ: "có bệnh" = 1, "không có bệnh" = 0). Tuy nhiên, chúng tôi không thể áp dụng hai giá trị này làm biến phụ thuộc trong phân tích hồi quy tuyến tính vì giả định về tính quy tắc bị vi phạm và chúng tôi không thể diễn giải các giá trị dự đoán không bằng 0 hoặc bằng 1.

Trên thực tế, thay vào đó, chúng tôi lấy xác suất mà đối tượng được phân loại vào danh mục gần nhất (tức là "mắc bệnh") của biến phụ thuộc và để khắc phục những khó khăn về toán học, chúng tôi áp dụng phép biến đổi logistic trong phương trình hồi quy - logarit tự nhiên tỷ lệ giữa xác suất "có bệnh" (p) với xác suất "không có bệnh" (1-p).

Một quy trình tích hợp được gọi là phương pháp khả năng tối đa, thay vì hồi quy thông thường (vì chúng ta không thể áp dụng quy trình hồi quy tuyến tính) tạo ra ước tính của phương trình hồi quy logistic từ dữ liệu mẫu

logit(p) = a + bx 1 + b 2 x 2 +.... + b n x n

logit (p) là ước tính giá trị của xác suất thực sự mà một bệnh nhân có một bộ giá trị riêng lẻ cho x 1 ... x n mắc bệnh;

a - đánh giá hằng số (số hạng tự do, giao điểm);

b 1 , b 2 ,... ,b n — ước tính của các hệ số hồi quy logistic.

1. Câu hỏi về chủ đề của bài học:

1. Đưa ra định nghĩa hàm số và tương quan.

2. Cho ví dụ về tương quan thuận và nghịch.

3. Cho biết độ lớn của các hệ số tương quan yếu, trung bình và kết nối mạnh mẽ giữa các biển báo.

4. Áp dụng trong trường hợp nào phương pháp xếp hạng tính hệ số tương quan?

5. Cách tính hệ số tương quan Pearson được áp dụng trong những trường hợp nào?

6. Các bước chính để tính hệ số tương quan theo phương pháp thứ hạng?

7. Định nghĩa "hồi quy". Thực chất của phương pháp hồi quy là gì?

8. Mô tả công thức của một phương trình hồi quy tuyến tính đơn giản.

9. Xác định hệ số hồi quy.

10. Có thể rút ra kết luận gì nếu hệ số hồi quy của cân nặng theo chiều cao là 0,26 kg/cm?

11. Công thức phương trình hồi quy dùng để làm gì?

12. Hệ số xác định là gì?

13. Phương trình hồi quy bội được sử dụng trong những trường hợp nào?

14. Phương pháp hồi quy logistic dùng để làm gì?

Bộ Giáo dục và Khoa học Liên bang Nga

Cơ quan Giáo dục Liên bang

Tình trạng cơ sở giáo dục giáo dục chuyên nghiệp cao hơn

Học viện tài chính và kinh tế toàn Nga

Chi nhánh tại Tula

Bài kiểm tra

trong môn học "Kinh tế lượng"

Tu La - 2010

Nhiệm vụ 2 (a, b)

Đối với các doanh nghiệp công nghiệp nhẹ, thông tin thu được đặc trưng cho sự phụ thuộc của khối lượng đầu ra (Y, triệu rúp) vào khối lượng đầu tư vốn (X, triệu rúp) Bảng. 1.

X 33 17 23 17 36 25 39 20 13 12
Y 43 27 32 29 45 35 47 32 22 24

Yêu cầu:

1. Tìm các tham số của phương trình hồi quy tuyến tính, đưa ra giải thích kinh tế của hệ số hồi quy.

2. Tính toán phần dư; tìm thấy dư lượng hình vuông; ước tính phương sai của phần dư

; vẽ phần dư.

3. Kiểm tra việc đáp ứng các điều kiện tiên quyết của LSM.

4. Kiểm tra ý nghĩa các tham số của phương trình hồi quy bằng kiểm định t Student (α=0,05).

5. Tính hệ số xác định, kiểm định mức ý nghĩa của phương trình hồi quy bằng kiểm định Fisher F (α=0,05), tìm sai số xấp xỉ trung bình tương đối. Đưa ra nhận định về chất lượng của mô hình.

6. Hãy dự đoán giá trị trung bình của chỉ tiêu Y với mức ý nghĩa α=0,1, nếu giá trị dự đoán của nhân tố X bằng 80% giá trị lớn nhất của nó.

7. Trình bày bằng đồ thị: các giá trị Y thực tế và mô hình, các điểm dự báo.

8. Soạn phương trình hồi quy phi tuyến tính:

hypebol;

quyền lực;

chỉ định.

Cho đồ thị của các phương trình hồi quy đã xây dựng.

9. Đối với các mô hình này, hãy tìm các hệ số xác định và giá trị trung bình lỗi tương đối xấp xỉ. So sánh các mô hình theo các đặc điểm này và rút ra kết luận.

1. mô hình tuyến tính giống như:

Các tham số của phương trình hồi quy tuyến tính có thể được tìm thấy bằng cách sử dụng các công thức

Việc tính toán các giá trị tham số được trình bày trong Bảng. 2.

t y x yx
1 43 33 1419 1089 42,236 0,764 0,584 90,25 88,36 0,018
2 27 17 459 289 27,692 -0,692 0,479 42,25 43,56 0,026
3 32 23 736 529 33,146 -1,146 1,313 0,25 2,56 0,036
4 29 17 493 289 27,692 1,308 1,711 42,25 21,16 0,045
5 45 36 1620 1296 44,963 0,037 0,001 156,25 129,96 0,001
6 35 25 875 625 34,964 0,036 0,001 2,25 1,96 0,001
7 47 39 1833 1521 47,69 -0,69 0,476 240,25 179,56 0,015
8 32 20 640 400 30,419 1,581 2,500 12,25 2,56 0,049
9 22 13 286 169 24,056 -2,056 4,227 110,25 134,56 0,093
10 24 12 288 144 23,147 0,853 0,728 132,25 92,16 0,036
336 235 8649 6351 12,020 828,5 696,4 0,32
Trung bình 33,6 23,5 864,9 635,1

Hãy để chúng tôi xác định các tham số của mô hình tuyến tính

Mô hình tuyến tính có dạng

Hệ số hồi quy

cho thấy sản lượng của Y tăng trung bình 0,909 triệu rúp. với sự gia tăng khối lượng đầu tư vốn X thêm 1 triệu rúp.

2. Tính số dư

, tổng bình phương còn lại , chúng tôi tìm thấy phân tán còn lại theo công thức:

Các tính toán được trình bày trong bảng. 2.


Cơm. 1. Đồ thị của phần dư ε.

3. Hãy kiểm tra việc đáp ứng các điều kiện tiên quyết của LSM dựa trên tiêu chí Durbin-Watson.

0,584
2,120 0,479
0,206 1,313
6,022 1,711
1,615 0,001
0,000 0,001
0,527 0,476
5,157 2,500
13,228 4,227
2,462 0,728
31,337 12,020

d1=0,88; d2=1,32 với α=0,05, n=10, k=1.

,

Điều này có nghĩa là một số phần dư không tương quan với nhau.

4. Kiểm tra ý nghĩa các tham số của phương trình dựa trên t-test của Student. (α=0,05).

cho v=8; α=0,05.

Tính toán giá trị

được sản xuất trong Bảng. 2. Ta có:
, thì chúng ta có thể kết luận rằng các hệ số hồi quy a và b là có ý nghĩa với xác suất là 0,95.

5. Tìm hệ số tương quan bằng công thức

Các tính toán sẽ được thực hiện trong bảng. 2.

. Cái đó. mối quan hệ giữa khối lượng đầu tư X và sản lượng Y có thể được coi là chặt chẽ, bởi vì .

Hệ số xác định được tìm theo công thức