Tiểu sử Đặc điểm Phân tích

Công thức tính giá trị thực nghiệm của thống kê Fisher. Tiêu chí φ * - Biến đổi góc của Fisher

Trên ví dụ này Chúng ta hãy xem xét độ tin cậy của phương trình hồi quy kết quả được ước tính như thế nào. Phép thử tương tự được sử dụng để kiểm tra giả thuyết rằng các hệ số hồi quy đều bằng 0, a = 0, b = 0. Nói cách khác, bản chất của các phép tính là trả lời câu hỏi: nó có thể được sử dụng để phân tích và dự báo sâu hơn không?

Sử dụng kiểm định t này để xác định sự giống nhau hoặc khác nhau giữa các phương sai trong hai mẫu.


Vì vậy, mục đích của phân tích là thu được một số ước lượng, với sự trợ giúp của nó, có thể khẳng định rằng, ở một mức α nhất định, phương trình hồi quy kết quả là đáng tin cậy về mặt thống kê. Đối với điều này hệ số xác định R 2 được sử dụng.
Ý nghĩa của mô hình hồi quy được kiểm tra bằng cách sử dụng kiểm định Fisher F, giá trị được tính toán của nó được tìm thấy là tỷ số giữa phương sai của chuỗi quan sát ban đầu của chỉ báo được nghiên cứu và ước tính không chệch về phương sai của chuỗi dư đối với Mô hình này.
Nếu giá trị tính toán với k 1 = (m) và k 2 = (n-m-1) bậc tự do lớn hơn giá trị bảng ở một mức ý nghĩa nhất định, thì mô hình được coi là có ý nghĩa.

trong đó m là số yếu tố trong mô hình.
Lớp ý nghĩa thống kê phòng tắm hơi hồi quy tuyến tínhđược sản xuất theo thuật toán sau:
1. Có thể thu vào giả thuyết vô hiệu rằng phương trình nói chung là không có ý nghĩa thống kê: H 0: R 2 = 0 ở mức ý nghĩa α.
2. Tiếp theo, xác định giá trị thực tế của tiêu chí F:


trong đó m = 1 cho hồi quy theo cặp.
3. Bảng giá trịđược xác định từ các bảng phân phối Fisher cho một mức ý nghĩa nhất định, có tính đến số bậc tự do cho tổng cộng bình phương (phương sai cao hơn) là 1 và số bậc tự do dư lượng bình phương (phương sai nhỏ hơn) trong hồi quy tuyến tính là n-2 (hoặc qua Hàm Excel FDISP (xác suất, 1, n-2)).
Bảng F là giá trị lớn nhất có thể có của tiêu chí dưới tác động của các yếu tố ngẫu nhiên đối với bậc tự do đã cho và mức ý nghĩa α. Mức ý nghĩa α - xác suất bác bỏ giả thuyết đúng, miễn là nó đúng. Thường α được lấy bằng 0,05 hoặc 0,01.
4. Nếu giá trị thực tế của tiêu chí F nhỏ hơn giá trị bảng, thì họ nói rằng không có lý do gì để bác bỏ giả thuyết không.
Nếu không, giả thuyết rỗng bị bác bỏ và giả thuyết thay thế về ý nghĩa thống kê của tổng thể phương trình được chấp nhận với xác suất (1-α).
Bảng giá trị của tiêu chí với bậc tự do k 1 = 1 và k 2 = 48, bảng F = 4

kết luận: Vì giá trị thực của bảng F> F nên hệ số xác định có ý nghĩa thống kê ( ước tính được tìm thấy của phương trình hồi quy là đáng tin cậy về mặt thống kê) .

Phân tích phương sai

.

Các chỉ tiêu chất lượng của phương trình hồi quy

Thí dụ. Dựa trên tổng số 25 doanh nghiệp thương mại, mối quan hệ giữa các dấu hiệu được nghiên cứu: X - giá hàng hóa A, nghìn rúp; Y - lợi nhuận của một doanh nghiệp thương mại, triệu rúp. Khi đánh giá mô hình hồi quy nhận được những điều sau đây kết quả trung gian: ∑ (y i -y x) 2 = 46000; ∑ (y i -y sr) 2 = 138000. Có thể xác định chỉ số tương quan nào từ những dữ liệu này? Tính giá trị của chỉ số này, dựa trên kết quả này và sử dụng Kiểm tra Fisher Fđưa ra kết luận về chất lượng của mô hình hồi quy.
Dung dịch. Dựa trên những dữ liệu này, có thể xác định mối tương quan theo kinh nghiệm: , trong đó ∑ (y cf -y x) 2 = ∑ (y i -y cf) 2 - ∑ (y i -y x) 2 = 138000 - 46000 = 92,000.
η 2 = 92000/138000 = 0,67, η = 0,816 (0,7< η < 0.9 - связь между X и Y высокая).

Kiểm tra Fisher F: n = 25, m = 1.
R 2 \ u003d 1 - 46000/138000 \ u003d 0,67, F \ u003d 0,67 / (1-0,67) x (25 - 1 - 1) \ u003d 46. Bảng F (1; 23) \ u003d 4,27
Vì giá trị thực của F> Ftabl, ước lượng tìm được của phương trình hồi quy là đáng tin cậy về mặt thống kê.

Câu hỏi: Thống kê nào được sử dụng để kiểm tra mức độ ý nghĩa của mô hình hồi quy?
Trả lời: Đối với mức độ quan trọng của toàn bộ mô hình, thống kê F (tiêu chí của Fisher) được sử dụng.

Tiêu chí của Fisher

Tiêu chí Fisher được sử dụng để kiểm tra giả thuyết rằng phương sai của hai quần thể nói chung là bằng nhau, được phân phối theo luật bình thường. Nó là một tiêu chí tham số.

Kiểm định F của Fisher được gọi là tỷ lệ phương sai, vì nó được hình thành là tỷ số của hai ước lượng không chệch được so sánh về phương sai.

Cho hai mẫu thu được là kết quả của các quan sát. Dựa trên chúng, các phương sai và đang có bậc tự do. Chúng tôi sẽ giả định rằng mẫu đầu tiên được lấy từ tổng thể chung với phương sai và thứ hai - từ tổng thể chung với phương sai . Giả thuyết rỗng được đưa ra về sự bằng nhau của hai phương sai, tức là H0:
hoặc . Để bác bỏ giả thuyết này, cần phải chứng minh ý nghĩa của sự khác biệt ở một mức ý nghĩa cho trước.
.

Giá trị tiêu chí được tính theo công thức:

Rõ ràng, nếu các phương sai bằng nhau, giá trị của tiêu chí sẽ bằng một. Trong các trường hợp khác, nó sẽ lớn hơn (nhỏ hơn) một.

Tiêu chí có phân phối Fisher
. Kiểm định của Fisher là kiểm định hai mặt và giả thuyết vô hiệu
từ chối để ủng hộ thay thế
nếu . Đây là đâu
lần lượt là thể tích của mẫu thứ nhất và thứ hai.

Hệ thống STATISTICA thực hiện kiểm tra Fisher một phía, tức là như luôn luôn có sự phân tán tối đa. Trong trường hợp này, giả thuyết vô hiệu bị bác bỏ để ủng hộ phương án thay thế nếu.

Thí dụ

Đặt nhiệm vụ là so sánh hiệu quả rèn luyện của hai nhóm học sinh. Mức độ tiến bộ đặc trưng cho trình độ quản lý quá trình học tập, và mức độ phân tán đặc trưng cho chất lượng quản lý học tập, mức độ tổ chức quá trình học tập. Cả hai chỉ số đều độc lập và trường hợp chung nên được xem xét chung. Mức độ tiến bộ (kỳ vọng toán học) của mỗi nhóm học sinh được đặc trưng bởi trung bình cộng và, và chất lượng được đặc trưng bởi các phương sai mẫu tương ứng của các ước tính: và. Khi đánh giá mức độ thực hiện hiện tại, hóa ra là cả hai học sinh đều như nhau: == 4,0. Phương sai mẫu:

. Số bậc tự do tương ứng với các ước lượng này:

. Do đó, để thiết lập sự khác biệt về hiệu quả đào tạo, chúng ta có thể sử dụng tính ổn định của kết quả học tập, tức là hãy kiểm tra giả thuyết.

Tính toán
(tử số phải có phương sai lớn) ,. Theo các bảng ( SỐ LIỆU THỐNG KÊXác suấtphân bổmáy tính) chúng tôi nhận thấy, ít hơn so với tính toán, do đó, giả thuyết rỗng phải được bác bỏ để có lợi cho phương án thay thế. Kết luận này có thể không làm hài lòng nhà nghiên cứu, vì anh ta quan tâm đến giá trị thực của tỷ lệ
(chúng ta luôn có một phương sai lớn trong tử số). Khi kiểm tra tiêu chí một phía, chúng ta nhận được, giá trị này nhỏ hơn giá trị đã tính ở trên. Vì vậy, giả thuyết vô hiệu phải được bác bỏ để ủng hộ phương án thay thế.

Kiểm tra của Fisher trong chương trình STATISTICA trong môi trường Windows

Đối với một ví dụ về việc kiểm tra một giả thuyết (tiêu chí của Fisher), chúng tôi sử dụng (tạo) một tệp có hai biến (fish.sta):

Cơm. 1. Bảng với hai biến độc lập

Để kiểm tra giả thuyết, cần thống kê cơ bản ( Nền tảngSố liệu thống kênhững cái bàn) chọn Kiểm định của Sinh viên cho các biến độc lập. ( kiểm định t, độc lập, bởi các biến).

Cơm. 2. Kiểm định giả thuyết tham số

Sau khi chọn các biến và nhấn phím Bản tóm tắt các giá trị của độ lệch chuẩn và kiểm định của Fisher được tính toán. Ngoài ra, mức độ ý nghĩa được xác định P, trong đó sự khác biệt là không đáng kể.

Cơm. 3. Kết quả kiểm định giả thuyết (F-test)

Sử dụng Xác suấtmáy tính và bằng cách thiết lập giá trị của các tham số, bạn có thể vẽ biểu đồ phân phối Fisher với một dấu của giá trị được tính toán.

Cơm. 4. Lĩnh vực chấp nhận (bác bỏ) giả thuyết (tiêu chí F)

Các nguồn.

    Kiểm định giả thuyết về mối quan hệ của hai phương sai

URL: /tryphonov3/terms3/testdi.htm

    Bài giảng 6.: 8080 / resources / math / mop / lices / lection_6.htm

    F - tiêu chí Fisher

URL: /home/portal/application/Multivariesadvisor/F-Fisheer/F-Fisheer.htm

    Lý thuyết và thực hành nghiên cứu xác suất và thống kê.

URL: /active/referats/read/doc-3663-1.html

    F - tiêu chí Fisher

Tiêu chí của Fisher cho phép bạn so sánh các giá trị của phương sai mẫu của hai mẫu độc lập. Để tính F emp, bạn cần tìm tỷ lệ phương sai của hai mẫu, và sao cho phương sai lớn hơn ở tử số và phương sai nhỏ hơn ở mẫu số. Công thức tính tiêu chí Fisher như sau:

phương sai của mẫu thứ nhất và thứ hai tương ứng là ở đâu.

Vì theo điều kiện của tiêu chí, giá trị của tử số phải lớn hơn hoặc bằng giá trị của mẫu số, giá trị của Femp sẽ luôn lớn hơn hoặc bằng một.

Số bậc tự do cũng được định nghĩa đơn giản:

k 1 = n l - 1 đối với mẫu đầu tiên (tức là đối với mẫu có phương sai lớn hơn) và k 2 = N 2 - 1 cho mẫu thứ hai.

Trong Phụ lục 1, các giá trị tới hạn của tiêu chí Fisher được tìm thấy bởi các giá trị k 1 (dòng trên cùng của bảng) và k 2 (cột bên trái của bảng).

Nếu t emp> t crit, thì giả thuyết vô hiệu được chấp nhận, nếu không thì phương án thay thế được chấp nhận.

Ví dụ 3 Kiểm tra được thực hiện ở hai lớp thứ ba phát triển tinh thần theo bài kiểm tra TURMSh của mười sinh viên. Các giá trị trung bình thu được không có sự khác biệt đáng kể, tuy nhiên, nhà tâm lý học quan tâm đến câu hỏi - có sự khác biệt về mức độ đồng nhất của các chỉ số phát triển tinh thần giữa các lớp không.

Dung dịch. Đối với kiểm định Fisher, cần phải so sánh các phương sai điểm kiểm traở cả hai lớp. Kết quả thử nghiệm được trình bày trong bảng:

bàn số 3

Số học sinh

Lớp một

Lớp thứ hai

Sau khi tính toán các phương sai cho các biến X và Y, chúng tôi nhận được:

S x 2 = 572,83; S y 2 =174,04

Sau đó, theo công thức (8) để tính toán theo tiêu chí F Fisher, chúng ta thấy:

Theo bảng từ Phụ lục 1 cho tiêu chí F với bậc tự do trong cả hai trường hợp đều bằng k = 10 - 1 = 9, ta thấy F crit = 3,18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 Thử nghiệm phi tham số

So sánh bằng mắt (theo tỷ lệ phần trăm) các kết quả trước và sau bất kỳ lần phơi nhiễm nào, nhà nghiên cứu đi đến kết luận rằng nếu quan sát thấy sự khác biệt, thì có sự khác biệt trong các mẫu được so sánh. Cách tiếp cận như vậy là không thể chấp nhận được về mặt phân loại, vì không thể xác định mức độ tin cậy về sự khác biệt đối với tỷ lệ phần trăm. Tỷ lệ phần trăm do chính họ lấy không làm cho chúng ta có thể đưa ra kết luận đáng tin cậy về mặt thống kê. Để chứng minh hiệu quả của bất kỳ tác động nào, cần phải xác định xu hướng có ý nghĩa thống kê trong sự thay đổi (dịch chuyển) của các chỉ số. Để giải quyết những vấn đề như vậy, nhà nghiên cứu có thể sử dụng một số tiêu chí về sự khác biệt. Dưới đây, các bài kiểm tra phi tham số sẽ được xem xét: bài kiểm tra dấu hiệu và bài kiểm tra chi-bình phương.

Để so sánh hai quần thể phân bố bình thường không có sự khác biệt về phương tiện mẫu, nhưng có sự khác biệt về phương sai, hãy sử dụng Tiêu chí của Fisher. Tiêu chí thực tế được tính theo công thức:

trong đó tử số là giá trị lớn hơn của phương sai mẫu và mẫu số là giá trị nhỏ hơn. Để suy ra tầm quan trọng của sự khác biệt giữa các mẫu, chúng tôi sử dụng NGUYÊN TẮC CƠ BẢN kiểm định các giả thuyết thống kê. Điểm quan trọng cho
được chứa trong bảng. Giả thuyết rỗng bị bác bỏ nếu giá trị thực
sẽ vượt quá hoặc bằng giá trị tới hạn (tiêu chuẩn)
giá trị này cho mức ý nghĩa được chấp nhận và số bậc tự do k 1 = N to lớn -1 ; k 2 = N ít hơn -1 .

Ví dụ: khi nghiên cứu ảnh hưởng của một loại thuốc nào đó đến tỷ lệ nảy mầm của hạt, người ta nhận thấy ở lô hạt thí nghiệm và lô đối chứng, tỷ lệ nảy mầm trung bình như nhau, nhưng có sự khác nhau về độ phân tán.
=1250,
= 417. Cỡ mẫu giống nhau và bằng 20.

= 2,12. Do đó, giả thuyết vô hiệu bị bác bỏ.

sự phụ thuộc tương quan. Hệ số tương quan và các tính chất của nó. Các phương trình hồi quy.

MỘT NHIỆM VỤ phân tích tương quan được giảm xuống:

    Thiết lập hướng và hình thức giao tiếp giữa các biển báo;

    đo độ kín của nó.

chức năng mối quan hệ 1-1 giữa các biến được gọi khi một giá trị nhất định của một biến (độc lập) X , được gọi là đối số, tương ứng với một giá trị nhất định của một biến (phụ thuộc) khác tại được gọi là một hàm. ( Thí dụ: sự phụ thuộc của tốc độ phản ứng hóa học vào nhiệt độ; sự phụ thuộc của lực hút vào khối lượng của các vật bị hút và khoảng cách giữa chúng).

tương quan Mối quan hệ giữa các biến có tính chất thống kê được gọi là khi một giá trị nhất định của một đối tượng địa lý (được coi là biến độc lập) tương ứng với toàn bộ chuỗi giá trị số của đối tượng địa lý khác. ( Thí dụ: mối quan hệ giữa sản lượng và lượng mưa; giữa chiều cao và cân nặng, v.v.).

Trường tương quan là tập hợp các điểm có tọa độ bằng các cặp giá trị biến đổi thu được bằng thực nghiệm X tại .

Bằng hình thức của trường tương quan, người ta có thể đánh giá sự hiện diện hay vắng mặt của một kết nối và kiểu của nó.



Kết nối được gọi là tích cực nếu tăng một biến sẽ làm tăng một biến khác.

Kết nối được gọi là phủ định khi tăng một biến thì giảm một biến khác.

Kết nối được gọi là tuyến tính , nếu nó có thể được biểu diễn phân tích như
.

Một chỉ báo về độ chặt chẽ của kết nối là Hệ số tương quan . Hệ số tương quan thực nghiệm được cho bởi:

Hệ số tương quan nằm trong phạm vi từ -1 trước 1 và đặc trưng cho mức độ gần gũi giữa các đại lượng x y . Nếu một:


Sự phụ thuộc tương quan giữa các tính năng có thể được mô tả theo nhiều cách khác nhau. Đặc biệt, bất kỳ dạng kết nối nào cũng có thể được biểu diễn bằng một phương trình tổng quát
. Loại phương trình

gọi là hồi quy . Phương trình hồi quy trực tiếp tại trên X nói chung có thể viết dưới dạng

Phương trình hồi quy trực tiếp X trên tại nói chung trông giống như

Giá trị có thể xảy ra nhất của các hệ số mộtTrong, Vớid có thể được tính toán, ví dụ, bằng cách sử dụng phương pháp bình phương nhỏ nhất.