Phân tích đơn biến bảng tương quan phương sai. So sánh nhiều lần: Quy trình Tukey-Kramer

Giả sử rằng trên một dây chuyền tự động, một số máy thực hiện song song cùng một thao tác. Để lập kế hoạch thích hợp cho quá trình chế biến tiếp theo, điều quan trọng là phải biết kích thước trung bình của các bộ phận thu được trên các máy song song là đồng nhất như thế nào. Chỉ có một yếu tố ảnh hưởng đến kích thước của các bộ phận, và đây là máy móc mà chúng được tạo ra. Cần phải tìm hiểu mức độ ảnh hưởng của yếu tố này đến kích thước của các bộ phận. Giả sử rằng tập hợp kích thước của các bộ phận được sản xuất trên mỗi máy có phân phối chuẩn và phương sai bằng nhau.

Do đó, chúng tôi có m máy, m tổng hợp hoặc cấp độ mà tại đó n 1, n 2, ..., n t quan sát. Để đơn giản hóa lý luận, chúng ta hãy giả định rằng n 1 \ u003d n 2 \ u003d ... \ u003d vv Kích thước của các bộ phận tạo nên n tôi quan sát trên tôi-cấp thứ, biểu thị x i 1, x tôi 2, ..., x in. Khi đó tất cả các quan sát có thể được biểu diễn dưới dạng một bảng, được gọi là ma trận các quan sát (Bảng 3.1).

Bảng 3.1

Các cấp độ	Kết quả quan sát
1	2	…	j	…	N
	x 11	x 12	…	x 1 j	…	x 1 n
	x 21	x 22	…	x 2 j	…	x 2 n
	x 31	x 32	…	x 3 j	…	x 3 n
…	…	…	…	…	…	…
tôi	x i1	x i2	…	x tôi j	…	x tôi n
…	…	…	…	…	…	…
m	x m1	x m2	…	x mj	…	xmn

Chúng tôi sẽ giả định rằng đối với tôi quan sát-cấp n có giá trị trung bình β tôi, bằng tổng trung bình chung µ và sự thay đổi của nó do tôi-cấp độ thứ của yếu tố, tức là β tôi = µ + tôi. Sau đó, một quan sát có thể được biểu diễn trong mẫu sau:

x tôi j = µ + tôi. + ε ij= βi + εij (3.1)

trong đó µ là giá trị trung bình tổng thể; tôi- hiệu ứng do tôi-cấp độ thứ của yếu tố; εij- sự thay đổi của kết quả trong một mức cụ thể.

Thành viên εijđặc trưng cho ảnh hưởng của tất cả các yếu tố mà mô hình (3.1) không tính đến. Theo vấn đề chung của phân tích phân tán, cần đánh giá mức độ ảnh hưởng của nhân tố γ đến kích thước của các bộ phận. Biến thể chung Biến đổi x tôi j có thể được chia nhỏ thành các phần, một trong số đó đặc trưng cho ảnh hưởng của yếu tố γ, phần kia - ảnh hưởng của các yếu tố không được tính toán. Để làm được điều này, cần phải tìm ước lượng cho giá trị trung bình tổng thể µ và ước lượng cho giá trị trung bình qua các mức β tôi. Rõ ràng là đánh giá β là trung bình cộng của n quan sát ở cấp độ thứ i, tức là

Dấu hoa thị trong chỉ mục tại x có nghĩa là các quan sát được cố định ở cấp thứ i. Giá trị trung bình số học của toàn bộ tập hợp các quan sát là ước tính của giá trị trung bình tổng thể µ, tức là

Tìm tổng bình phương độ lệch x tôi j từ, tức là

Chúng tôi biểu diễn nó ở dạng (3.2)

Và =

Nhưng = 0, vì đây là tổng độ lệch của các biến của một tổng thể so với giá trị trung bình cộng của cùng một tổng thể, tức là tổng toàn bộ bằng không. Chúng ta viết số hạng thứ hai của tổng (3.2) dưới dạng:

Hoặc

Thuật ngữ này là tổng của sự khác biệt bình phương giữa các mức trung bình và giá trị trung bình của toàn bộ tập hợp các quan sát. Tổng này được gọi là tổng bình phương độ lệch giữa các nhóm và đặc trưng cho sự khác biệt giữa các mức. Giá trị, còn được gọi là sự phân tán theo các yếu tố, tức là sự phân tán do yếu tố được nghiên cứu.

Thuật ngữ này là tổng của sự khác biệt bình phương giữa các quan sát riêng lẻ và giá trị trung bình của cấp thứ i. Tổng này được gọi là tổng bình phương độ lệch trong nhóm và đặc trưng cho sự khác biệt giữa các quan sát ở cấp thứ i. Giá trị còn được gọi là tán xạ dư, tức là sự phân tán do không tính đến các yếu tố.

Giá trị được gọi là tổng hoặc toàn bộ số tiềnđộ lệch bình phương của các quan sát riêng lẻ so với tổng giá trị trung bình.

Khi biết tổng bình phương SS, SS 1 và SS 2, có thể ước lượng ước lượng không chệch của các phương sai tương ứng - tổng, giữa các nhóm và trong nhóm (bảng 3.2).

Nếu mức độ ảnh hưởng của tất cả các mức của nhân tố γ là như nhau, thì và là ước tính của tổng phương sai.

Sau đó, để đánh giá mức độ ảnh hưởng của nhân tố γ, chỉ cần kiểm định giả thuyết vô hiệu H 0: =.

Để làm điều này, hãy tính tiêu chí Fisher F B =, với số bậc tự do k 1 = m - 1 và k 2 = m (n - 1). Sau đó, theo bảng phân phối F (xem bảng phân phối của tiêu chí Fisher), với mức ý nghĩa α, giá trị tới hạn của F cr được tìm thấy.

Bảng 3.2

Nếu F B> F cr thì giả thuyết vô hiệu bị bác bỏ và đưa ra kết luận về ảnh hưởng đáng kể của nhân tố γ.

Tại F B< F кр нет основания отвергать нулевую гипотезу и можно считать, что влияние фактора γ несущественно.

So sánh phương sai giữa các nhóm và phương sai dư, độ lớn của tỷ số của chúng được sử dụng để đánh giá mức độ ảnh hưởng của các nhân tố được biểu hiện mạnh mẽ như thế nào.

Ví dụ 3.1. Có bốn lô vải bảo hộ lao động. Năm mẫu được chọn từ mỗi lô và các thử nghiệm được thực hiện để xác định độ lớn của tải trọng kéo đứt. Kết quả thử nghiệm được đưa ra trong bảng. 3.3.

Bảng 3.3

Số lô, t

Cần phải tìm hiểu xem ảnh hưởng của các lô nguyên liệu thô khác nhau đến độ lớn của tải trọng đứt có đáng kể hay không.

Quyết định.

TẠI trường hợp này m = 4, n = 5. Trung bình cộng của mỗi hàng được tính theo công thức

Ta có: = (200 + 140 + 170 + 145 + 165) / 5 = 164; = 170; = 202; = 164.

Tìm trung bình cộng của toàn bộ tổng thể:

Hãy để chúng tôi tính toán các đại lượng cần thiết để xây dựng bảng. 3,4:

tổng bình phương độ lệch giữa các nhóm SS 1, với k 1 = t –1 =

4-1 = 3 bậc tự do:

tổng bình phương độ lệch trong nhóm SS 2 với k 2 = mp - m = = 20-4 = 16 bậc tự do:

tổng bình phương SS với k = mn-1 = 20-1 = 19 bậc tự do:

Dựa trên các giá trị tìm được, chúng ta ước tính phương sai, theo công thức (Bảng 3.2) chúng ta sẽ soạn (Bảng 3.4) cho ví dụ đang xét.

Bảng 3.4

Hãy thực hiện phân tích thống kê theo tiêu chí Fisher. Tính F B \ u003d \ u003d (4980 1/3) / (7270 1/16) \ u003d 1660 / 454,4 \ u003d 3,65.

Theo bảng phân phối F (xem phụ lục), chúng tôi tìm thấy giá trị của F Kp tại k 2 = 16 và k 1= 3 bậc tự do và mức ý nghĩa α = 0,01. Ta có F Kp = 5,29.

Giá trị tính toán của F B nhỏ hơn giá trị bảng, do đó có thể lập luận rằng giả thuyết rỗng không bị bác bỏ, có nghĩa là sự khác biệt giữa các mô trong lô không ảnh hưởng đến tải trọng kéo đứt.

Trong gói Phân tích Dữ liệu, công cụ ANOVA Một chiều được sử dụng để kiểm tra giả thuyết rằng giá trị trung bình của hai hoặc nhiều mẫu thuộc cùng một tổng thể là tương tự nhau. Hãy xem xét công việc của gói để phân tích phương sai một chiều.

Hãy giải ví dụ 3.1 bằng cách sử dụng công cụ ANOVA một chiều.

Việc sử dụng số liệu thống kê trong ghi chú này sẽ được hiển thị với một ví dụ xuyên suốt. Giả sử bạn là giám đốc sản xuất tại Perfect Parachute. Dù được làm từ sợi tổng hợp do bốn nhà cung cấp khác nhau cung cấp. Một trong những đặc điểm chính của dù là sức mạnh của nó. Bạn cần đảm bảo rằng tất cả các sợi được cung cấp đều có độ bền như nhau. Để trả lời câu hỏi này, cần thiết kế một thí nghiệm trong đó đo độ bền của vải dù dệt từ sợi tổng hợp từ các nhà cung cấp khác nhau. Thông tin thu được trong quá trình thử nghiệm này sẽ xác định nhà cung cấp nào cung cấp những chiếc dù bền nhất.

Nhiều ứng dụng liên quan đến các thí nghiệm trong đó một số nhóm hoặc mức độ của một yếu tố được xem xét. Một số yếu tố, chẳng hạn như nhiệt độ nung gốm, có thể có nhiều mức số (nghĩa là 300 °, 350 °, 400 ° và 450 °). Các yếu tố khác, chẳng hạn như vị trí của hàng hóa trong siêu thị, có thể có các mức phân loại (ví dụ: nhà cung cấp thứ nhất, nhà cung cấp thứ hai, nhà cung cấp thứ ba, nhà cung cấp thứ tư). Các thí nghiệm đơn biến trong đó các đơn vị thí nghiệm được gán ngẫu nhiên vào các nhóm hoặc các mức nhân tố được gọi là ngẫu nhiên hoàn toàn.

Cách sử dụngF-tiêu chuẩn để đánh giá sự khác biệt giữa một số kỳ vọng toán học

Nếu các phép đo bằng số của nhân tố trong các nhóm là liên tục và đáp ứng một số điều kiện bổ sung, để so sánh kỳ vọng toán học một số nhóm, phân tích phương sai (ANOVA - Một sự phân giải o f Va riance). Phân tích phương sai bằng cách sử dụng các thiết kế hoàn toàn ngẫu nhiên được gọi là ANOVA một chiều. Theo một nghĩa nào đó, thuật ngữ phân tích phương sai là sai lệch vì nó so sánh sự khác biệt giữa các giá trị trung bình của các nhóm, chứ không phải giữa các phương sai. Tuy nhiên, việc so sánh các kỳ vọng toán học được thực hiện chính xác trên cơ sở phân tích sự thay đổi của dữ liệu. Trong quy trình ANOVA, tổng biến động của các kết quả đo được chia thành giữa các nhóm và trong nhóm (Hình 1). Sự thay đổi trong nhóm được giải thích bằng sai số thực nghiệm, trong khi sự thay đổi giữa các nhóm được giải thích bằng ảnh hưởng của các điều kiện thực nghiệm. Biểu tượng với biểu thị số lượng nhóm.

Cơm. 1. Tách các biến thể trong một thử nghiệm hoàn toàn ngẫu nhiên

Tải xuống ghi chú ở định dạng hoặc, ví dụ ở định dạng

Hãy giả vờ như vậy với các nhóm được rút ra từ các quần thể độc lập có phân phối chuẩn và cùng phương sai. Giả thuyết vô hiệu là các kỳ vọng toán học của các quần thể là như nhau: H 0: μ 1 = μ 2 = ... = μ s. Giả thuyết thay thế nói rằng không phải tất cả các kỳ vọng toán học đều giống nhau: H 1: không phải tất cả μ j đều giống nhau j= 1, 2,…, s).

Trên hình. . Năm quần thể liên quan đến các cấp độ khác nhau các yếu tố giống hệt nhau. Do đó, chúng được xếp chồng lên nhau, có cùng kỳ vọng, biến thể và dạng toán học.

Cơm. 2. Năm quần thể có cùng kỳ vọng toán học: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

Mặt khác, giả sử rằng trên thực tế giả thuyết vô hiệu là sai và cấp độ thứ tư có kỳ vọng toán học lớn nhất, cấp độ đầu tiên có kỳ vọng toán học thấp hơn một chút, và các cấp độ còn lại có kỳ vọng toán học tương tự và thậm chí nhỏ hơn (Hình. 3). Lưu ý rằng, ngoại trừ độ lớn của giá trị trung bình, tất cả năm quần thể đều giống hệt nhau (tức là có cùng độ biến thiên và hình dạng).

Cơm. 3. Ảnh hưởng của các điều kiện thí nghiệm được quan sát thấy: μ 4> μ 1> μ 2 = μ 3 = μ 5

Khi kiểm tra giả thuyết về sự bình đẳng của các kỳ vọng toán học của một số quần thể chung, tổng biến động được chia thành hai phần: biến đổi giữa các nhóm, do sự khác biệt giữa các nhóm và biến đổi trong nhóm, do sự khác biệt giữa các phần tử thuộc cùng một nhóm. Tổng biến thiên được biểu thị bằng tổng bình phương (SST - tổng bình phương tổng). Vì giả thuyết vô hiệu là kỳ vọng của tất cả với các nhóm bằng nhau, tổng biến động bằng tổng bình phương chênh lệch giữa các quan sát riêng lẻ và tổng trung bình (giá trị trung bình) được tính cho tất cả các mẫu. Biến thể đầy đủ:

ở đâu - trung bình chung, Xij - tôi-chúng tôi xem trong j-nhóm hoặc cấp độ thứ, nj- số lượng quan sát trong j-nhóm thứ, N - toàn bộ quan sát trong tất cả các nhóm (tức là N = N 1 + n 2 + … + nc), với- số lượng nhóm hoặc cấp độ đã học.

Biến thể giữa các nhóm, thường được gọi là tổng bình phương giữa các nhóm (SSA), bằng tổng bình phương chênh lệch giữa trung bình mẫu của mỗi nhóm j và trung bình tổng thể nhân với khối lượng của nhóm tương ứng nj:

ở đâu với- số lượng nhóm hoặc cấp độ đã học, nj- số lượng quan sát trong j-nhóm thứ, j- nghĩa là j-nhóm thứ, - trung bình chung.

Biến thể trong nhóm, thường được gọi là tổng bình phương các nhóm (SSW), bằng tổng bình phương chênh lệch giữa các phần tử của mỗi nhóm và trung bình mẫu của nhóm này j:

ở đâu Xij - tôi phần tử thứ j-nhóm thứ, j- nghĩa là j-nhóm thứ.

Bởi vì chúng được so sánh với mức thừa số, tổng bình phương giữa các nhóm có s - 1 bậc tự do. Mỗi với cấp độ có nj – 1 bậc tự do, do đó, tổng bình phương trong nhóm có N- với bậc tự do và

Ngoài ra, tổng bình phương có N – 1 bậc tự do, vì mỗi lần quan sát Xij so với mức trung bình tổng thể được tính toán trên tất cả N quan sát. Nếu mỗi tổng này được chia cho số bậc tự do tương ứng, thì ba loại phân tán sẽ phát sinh: liên nhóm(bình phương trung bình giữa - MSA), trong nhóm(bình phương trung bình trong - MSW) và hoàn thành(tổng bình phương trung bình - MST):

Mặc dù thực tế là mục đích chính của việc phân tích phương sai là để so sánh các kỳ vọng toán học với nhóm để tiết lộ ảnh hưởng của các điều kiện thực nghiệm, tên của nó là do thực tế là công cụ chính là phân tích phương sai loại khác. Nếu giả thuyết rỗng là đúng và giữa các giá trị được mong đợi với các nhóm không có sự khác biệt đáng kể, cả ba phương sai - MSA, MSW và MST - là ước tính của phương sai σ2 vốn có trong dữ liệu được phân tích. Vì vậy, để kiểm tra giả thuyết không H 0: μ 1 = μ 2 = ... = μ s và giả thuyết thay thế H 1: không phải tất cả μ j đều giống nhau j = 1, 2, …, với), nó là cần thiết để tính toán các số liệu thống kê F-criterion, là tỷ số của hai phương sai, MSA và MSW. kiểm tra F- thống kê trong phân tích phương sai đơn biến

Số liệu thống kê F-criteria tuân theo F- phân phối với s - 1 bậc tự do trong tử số MSA và n - với bậc tự do ở mẫu số MSW. Đối với mức ý nghĩa cho trước α, giả thuyết rỗng bị bác bỏ nếu tính toán F FU vốn có F- phân phối với s - 1 n - với bậc tự do ở mẫu số. Vì vậy, như được hiển thị trong hình. 4, quy tắc quyết địnhđược xây dựng như sau: giả thuyết vô hiệu H 0 từ chối nếu F> FU; nếu không, nó không bị từ chối.

Cơm. 4. Khu vực quan trọng của việc phân tích phương sai khi kiểm tra một giả thuyết H 0

Nếu giả thuyết vô hiệu H 0 là sự thật, được tính toán F-thống kê gần bằng 1, vì tử số và mẫu số của nó là các ước tính của cùng một giá trị - phương sai σ 2 vốn có trong dữ liệu được phân tích. Nếu giả thuyết vô hiệu H 0 là sai (và có sự khác biệt đáng kể giữa các giá trị kỳ vọng của các nhóm khác nhau), được tính F- thống kê sẽ lớn hơn nhiều, bởi vì tử số của nó, MSA, ngoài sự biến thiên tự nhiên của dữ liệu, ước tính ảnh hưởng của các điều kiện thực nghiệm hoặc sự khác biệt giữa các nhóm, trong khi mẫu số MSW chỉ ước tính độ biến thiên tự nhiên của dữ liệu. Do đó, thủ tục ANOVA là F là một phép thử trong đó, ở mức ý nghĩa cho trước α, giả thuyết rỗng bị bác bỏ nếu F- thống kê lớn hơn giá trị quan trọng trên FU vốn có F- phân phối với s - 1 bậc tự do trong tử số và n - với bậc tự do trong mẫu số, như trong Hình. 4.

Để minh họa phân tích phương sai một chiều, chúng ta hãy quay lại tình huống được nêu ở phần đầu của ghi chú. Mục đích của thử nghiệm là để xác định xem liệu những chiếc dù dệt từ sợi tổng hợp thu được từ các nhà cung cấp khác nhau có cùng độ bền hay không. Mỗi nhóm có năm chiếc dù được dệt. Các nhóm được chia theo nhà cung cấp - Nhà cung cấp 1, Nhà cung cấp 2, Nhà cung cấp 3 và Nhà cung cấp 4. Độ bền của dù được đo bằng một thiết bị đặc biệt để kiểm tra độ rách của vải trên cả hai mặt. Lực cần thiết để phá vỡ một chiếc dù được đo trên một thang đo đặc biệt. Lực kéo đứt càng cao thì dù càng khỏe. Excel cho phép phân tích F-Thống kê với một cú nhấp chuột. Xem qua menu Dữ liệu → Phân tích dữ liệu và chọn dòng Phân tích phương sai một chiều, điền vào cửa sổ đã mở (Hình 5). Các kết quả của thử nghiệm (độ bền khe hở), một số thống kê mô tả và kết quả phân tích phương sai một chiều được thể hiện trong Hình. 6.

Cơm. 5. Cửa sổ Gói phân tích ANOVA một chiều vượt trội

Cơm. Hình 6. Các chỉ số độ bền của dù dệt từ sợi tổng hợp thu được từ các nhà cung cấp khác nhau, thống kê mô tả và kết quả phân tích phương sai một chiều

Phân tích Hình 6 cho thấy có một số khác biệt giữa các phương tiện mẫu. Độ bền trung bình của xơ thu được từ nhà cung cấp thứ nhất là 19,52, từ nhà cung cấp thứ hai - 24,26, từ nhà cung cấp thứ ba - 22,84 và từ nhà cung cấp thứ tư - 21,16. Sự khác biệt này có ý nghĩa thống kê không? Sự phân bố lực phá vỡ được thể hiện trong biểu đồ phân tán (Hình 7). Nó cho thấy rõ ràng sự khác biệt giữa các nhóm và bên trong họ. Nếu thể tích của mỗi nhóm lớn hơn, chúng có thể được phân tích bằng cách sử dụng biểu đồ thân và lá, biểu đồ hình hộp hoặc biểu đồ phân phối chuẩn.

Cơm. 7. Biểu đồ độ bền của dù dệt từ sợi tổng hợp thu được từ bốn nhà cung cấp

Giả thuyết rỗng nói rằng không có sự khác biệt đáng kể giữa các giá trị cường độ trung bình: H 0: μ 1 = μ 2 = μ 3 = μ 4. Một giả thuyết khác là có ít nhất một nhà cung cấp có độ bền sợi trung bình khác với những nhà cung cấp khác: H 1: không phải tất cả μ j đều giống nhau ( j = 1, 2, …, với).

Trung bình Tổng thể (Xem Hình 6) = AVERAGE (D12: D15) = 21,945; để xác định, bạn cũng có thể lấy giá trị trung bình của tất cả 20 số gốc: \ u003d AVERAGE (A3: D7). Giá trị phương sai được tính toán Gói phân tích và được phản ánh trong bảng Phân tích phương sai(xem Hình 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (xem cột SS những cái bàn Phân tích phương sai hình 6). Giá trị trung bình được tính bằng cách chia các tổng bình phương này cho số bậc tự do thích hợp. Trong chừng mực với= 4, và N= 20, chúng tôi nhận được các giá trị sau bậc tự do; cho SSA: s - 1= 3; cho SSW: n – c= 16; cho SST: n - 1= 19 (xem cột df). Như vậy: MSA = SSA / ( c - 1)= 21,095; MSW = SSW / ( n – c) = 6,094; MST = SST / ( n - 1) = 8.463 (xem cột CÔ). F- thống kê = MSA / MSW = 3,462 (xem cột F).

Giá trị quan trọng trên FU, đặc trưng cho F-phân phối, được xác định theo công thức = F. OBR (0,95; 3; 16) = 3,239. Tham số hàm = F.OBR (): α = 0,05, tử số có ba bậc tự do và mẫu số là 16. Như vậy, tính F-thống kê bằng 3,462 vượt quá giá trị tới hạn trên FU= 3,239, giả thuyết vô hiệu bị bác bỏ (Hình 8).

Cơm. 8. Vùng tới hạn của phép phân tích phương sai với mức ý nghĩa 0,05 nếu tử số có ba bậc tự do và mẫu số là -16

R-giá trị, tức là xác suất mà theo một giả thuyết rỗng thực sự F- thống kê không nhỏ hơn 3,46, bằng 0,041 hoặc 4,1% (xem cột giá trị p những cái bàn Phân tích phương sai hình 6). Vì giá trị này không vượt quá mức ý nghĩa α = 5% nên giả thuyết vô hiệu bị bác bỏ. Hơn nữa, R-value chỉ ra rằng xác suất tìm thấy như vậy hoặc một sự khác biệt lớn giữa các kỳ vọng toán học của các quần thể nói chung, với điều kiện là chúng thực sự giống nhau, là 4,1%.

Cho nên. Có một sự khác biệt giữa bốn phương tiện mẫu. Giả thuyết vô hiệu là tất cả các kỳ vọng toán học của bốn quần thể là bằng nhau. Trong các điều kiện này, thước đo tổng biến thiên (tức là tổng biến thiên SST) của sức mạnh của tất cả các dù được tính bằng cách tổng bình phương chênh lệch giữa mỗi lần quan sát Xij và trung bình tổng thể . Sau đó, tổng sự thay đổi được chia thành hai thành phần (xem Hình 1). Thành phần đầu tiên là sự thay đổi giữa các nhóm trong SSA và thành phần thứ hai là sự thay đổi trong nhóm trong SSW.

Điều gì giải thích sự thay đổi trong dữ liệu? Nói cách khác, tại sao tất cả các quan sát không giống nhau? Một lý do là các công ty khác nhau cung cấp các loại sợi có cường độ khác nhau. Điều này phần nào giải thích tại sao các nhóm có các giá trị kỳ vọng khác nhau: tác động của các điều kiện thí nghiệm càng mạnh thì sự khác biệt giữa các giá trị trung bình của các nhóm càng lớn. Một lý do khác cho sự thay đổi dữ liệu là sự biến thiên tự nhiên của bất kỳ quá trình nào, trong trường hợp này là sản xuất dù. Ngay cả khi tất cả các sợi được mua từ cùng một nhà cung cấp, độ bền của chúng sẽ không giống nhau trong các điều kiện khác. điều kiện bình đẳng. Vì hiệu ứng này xuất hiện trong mỗi nhóm, nó được gọi là biến thể trong nhóm.

Sự khác biệt giữa các phương tiện mẫu được gọi là sự biến đổi giữa các nhóm của SSA. Một phần của sự thay đổi trong nhóm, như đã đề cập, được giải thích là do dữ liệu thuộc các nhóm khác nhau. Tuy nhiên, ngay cả khi các nhóm hoàn toàn giống nhau (tức là giả thuyết rỗng sẽ đúng), vẫn sẽ có sự biến đổi giữa các nhóm. Lý do cho điều này nằm ở sự biến thiên tự nhiên của quá trình sản xuất dù. Vì các mẫu khác nhau, nghĩa là mẫu của chúng khác nhau. Do đó, nếu giả thuyết rỗng là đúng, thì cả hai nhóm và sự thay đổi trong nhómđại diện cho một ước tính về sự biến thiên của quần thể. Nếu giả thuyết rỗng là sai, thì giả thuyết giữa các nhóm sẽ lớn hơn. Chính thực tế này là cơ sở F- tiêu chí để so sánh sự khác biệt giữa các kỳ vọng toán học của một số nhóm.

Sau khi thực hiện ANOVA một chiều và tìm thấy sự khác biệt đáng kể giữa các công ty, vẫn chưa biết nhà cung cấp nào khác biệt đáng kể so với những nhà cung cấp khác. Chúng ta chỉ biết rằng các kỳ vọng toán học của các quần thể là không bằng nhau. Nói cách khác, ít nhất một trong những kỳ vọng toán học khác biệt đáng kể so với những kỳ vọng khác. Để xác định nhà cung cấp nào khác với những nhà cung cấp khác, bạn có thể sử dụng Thủ tục tukey, sử dụng so sánh theo cặp giữa các nhà cung cấp. Thủ tục này được phát triển bởi John Tukey. Sau đó, ông và C. Cramer đã sửa đổi quy trình này một cách độc lập cho các tình huống trong đó các cỡ mẫu khác nhau.

So sánh nhiều: Thủ tục Tukey-Kramer

Trong kịch bản của chúng tôi, phân tích phương sai một chiều được sử dụng để so sánh sức mạnh của dù. Khám phá sự khác biệt đáng kể giữa các kỳ vọng toán học của bốn nhóm, cần xác định nhóm nào khác biệt với nhau. Mặc dù có một số cách để giải quyết vấn đề này, chúng tôi sẽ chỉ mô tả quy trình so sánh nhiều Tukey-Kramer. Phương pháp này là một ví dụ về quy trình so sánh hậu kỳ, vì giả thuyết cần kiểm tra được hình thành sau khi phân tích dữ liệu. Quy trình Tukey-Kramer cho phép bạn so sánh đồng thời tất cả các cặp nhóm. Ở giai đoạn đầu tiên, sự khác biệt được tính Xj - Xj ’ , ở đâu j ≠j’ , giữa các kỳ vọng toán học s (s - 1) / 2 các nhóm. Khoảng thời gian tới hạn Quy trình Tukey-Kramer được tính theo công thức:

ở đâu Q U- giá trị quan trọng trên của phân phối của phạm vi được sinh viên hóa, có với bậc tự do trong tử số và N - với bậc tự do ở mẫu số.

Nếu kích thước mẫu không giống nhau, phạm vi tới hạn được tính toán riêng cho từng cặp kỳ vọng toán học. Ở giai đoạn cuối, mỗi s (s - 1) / 2 các cặp kỳ vọng toán học được so sánh với phạm vi tới hạn tương ứng. Các phần tử của một cặp được coi là khác biệt đáng kể nếu môđun của sự khác biệt | Xj - Xj ’ | giữa chúng vượt quá phạm vi tới hạn.

Chúng tôi áp dụng quy trình Tukey-Cramer cho vấn đề sức bền của dù. Vì công ty bán dù có bốn nhà cung cấp, nên thử nghiệm 4 (4 - 1) / 2 = 6 cặp nhà cung cấp (Hình 9).

Cơm. 9. So sánh theo cặp của các phương tiện mẫu

Vì tất cả các nhóm đều có cùng một khối lượng (tức là tất cả nj = nj ’ ), chỉ cần tính một phạm vi tới hạn là đủ. Để làm được điều này, theo bảng ANOVA(Hình 6) chúng tôi xác định giá trị của MSW = 6,094. Sau đó, chúng tôi tìm thấy giá trị Q U tại α = 0,05, với= 4 (số bậc tự do trong tử số) và N- với= 20 - 4 = 16 (số bậc tự do ở mẫu số). Thật không may, tôi không tìm thấy hàm tương ứng trong Excel, vì vậy tôi đã sử dụng bảng (Hình 10).

Cơm. 10. Giá trị quan trọng của phạm vi được sinh viên hóa Q U

Chúng tôi nhận được:

Vì chỉ 4,74> 4,47 (xem bảng dưới cùng trong Hình 9), nên có sự khác biệt có ý nghĩa thống kê giữa nhà cung cấp thứ nhất và thứ hai. Tất cả các cặp khác đều có phương tiện mẫu, không cho phép chúng tôi nói về sự khác biệt của chúng. Do đó, độ bền trung bình của dù dệt từ sợi mua từ nhà cung cấp thứ nhất kém hơn đáng kể so với độ bền trung bình của dù.

Điều kiện cần thiết để phân tích phương sai một chiều

Khi giải quyết vấn đề về độ bền của dù, chúng tôi đã không kiểm tra xem liệu các điều kiện có được đáp ứng hay không mà theo đó người ta có thể sử dụng hệ số một F-tiêu chuẩn. Làm thế nào để bạn biết nếu bạn có thể áp dụng một yếu tố F-tiêu chí trong việc phân tích dữ liệu thực nghiệm cụ thể? Yếu tố đơn lẻ F Chỉ có thể áp dụng -test nếu đáp ứng ba giả thiết cơ bản: dữ liệu thử nghiệm phải ngẫu nhiên và độc lập, có phân phối chuẩn và phương sai của chúng phải giống nhau.

Dự đoán đầu tiên là tính ngẫu nhiên và độc lập dữ liệu- luôn luôn nên được thực hiện, vì tính đúng đắn của bất kỳ thử nghiệm nào phụ thuộc vào tính ngẫu nhiên của lựa chọn và / hoặc quá trình ngẫu nhiên hóa. Để tránh làm sai lệch kết quả, cần phải trích xuất dữ liệu từ với các quần thể ngẫu nhiên và độc lập với nhau. Tương tự, dữ liệu phải được phân phối ngẫu nhiên trên với mức độ của yếu tố quan tâm đối với chúng tôi (nhóm thực nghiệm). Vi phạm các điều kiện này có thể làm sai lệch nghiêm trọng kết quả phân tích phương sai.

Dự đoán thứ hai là bình thường- có nghĩa là dữ liệu được lấy từ các quần thể phân bố bình thường. Đối với t-tiêu chuẩn, phân tích một chiều về phương sai dựa trên F-criterion tương đối không nhạy cảm với việc vi phạm điều kiện này. Nếu phân phối không quá xa so với bình thường, mức ý nghĩa F- tiêu chuẩn thay đổi ít, đặc biệt nếu kích thước mẫu đủ lớn. Nếu điều kiện của phân phối chuẩn bị vi phạm nghiêm trọng, nó nên được áp dụng.

Dự đoán thứ ba là tính đồng nhất của sự phân tán- có nghĩa là các phương sai của mỗi tổng thể chung bằng nhau (tức là σ 1 2 = σ 2 2 =… = σ j 2). Giả định này cho phép một người quyết định xem có nên tách biệt hoặc gộp các phương sai trong nhóm hay không. Nếu thể tích của các nhóm giống nhau, thì điều kiện về tính đồng nhất của phương sai ít ảnh hưởng đến kết luận thu được khi sử dụng F-tiêu chuẩn. Tuy nhiên, nếu các cỡ mẫu không giống nhau, việc vi phạm điều kiện bình đẳng của các phương sai có thể làm sai lệch nghiêm trọng kết quả phân tích phương sai. Do đó, người ta nên cố gắng đảm bảo rằng các cỡ mẫu là như nhau. Một trong những phương pháp để kiểm tra giả định về tính đồng nhất của phương sai là tiêu chí Levenayđược mô tả dưới đây.

Nếu, trong cả ba điều kiện, chỉ sự đồng nhất của điều kiện phân tán bị vi phạm, một quy trình tương tự như t-tiêu chuẩn sử dụng một phương sai riêng (để biết thêm chi tiết, xem). Tuy nhiên, nếu các giả định về phân phối chuẩn và tính đồng nhất của phương sai bị vi phạm đồng thời, thì cần phải chuẩn hóa dữ liệu và giảm sự khác biệt giữa các phương sai hoặc áp dụng quy trình phi tham số.

Tiêu chí của Leveney để kiểm tra tính đồng nhất của phương sai

Mặc dù thực tế là F- tiêu chí tương đối chống lại sự vi phạm điều kiện bình đẳng của các phương sai trong các nhóm, vi phạm tổng thể giả định này ảnh hưởng đáng kể đến mức độ ý nghĩa và sức mạnh của tiêu chí. Có lẽ một trong những tiêu chí mạnh mẽ nhất là Levenay. Để kiểm tra sự bình đẳng của các phương sai với quần thể nói chung, chúng tôi sẽ kiểm tra các giả thuyết sau:

H 0: σ 1 2 = σ 2 2 = ... = σj 2

H 1: Không phải tất cả σ j 2 giống nhau ( j = 1, 2, …, với)

Kiểm định Leveney sửa đổi dựa trên tuyên bố rằng nếu độ biến thiên trong các nhóm là như nhau, thì phân tích phương sai có thể được áp dụng để kiểm tra giả thuyết vô hiệu về sự bằng nhau của các phương sai. giá trị tuyệt đối sự khác biệt giữa quan sát và trung bình nhóm. Vì vậy, trước tiên, bạn nên tính toán các giá trị tuyệt đối của sự khác biệt giữa các quan sát và trung bình trong mỗi nhóm, sau đó thực hiện phân tích một chiều phương sai trên các giá trị tuyệt đối thu được của các chênh lệch. Để minh họa tiêu chí Levenay, chúng ta hãy quay trở lại kịch bản được nêu ở phần đầu của ghi chú. Sử dụng dữ liệu được trình bày trong Hình. 6, chúng tôi sẽ thực hiện một phân tích tương tự, nhưng đối với các mô-đun về sự khác biệt trong dữ liệu ban đầu và trung bình cho từng mẫu riêng biệt (Hình 11).

Phân tích phương sai là một tập hợp phương pháp thống kê, được thiết kế để kiểm tra các giả thuyết về mối quan hệ giữa các đặc điểm nhất định và các yếu tố được nghiên cứu mà không có mô tả định lượng, cũng như thiết lập mức độ ảnh hưởng của các yếu tố và sự tương tác của chúng. Trong tài liệu chuyên ngành, nó thường được gọi là ANOVA (từ tên tiếng Anh là Analysis of Variations). Phương pháp này được R. Fischer phát triển lần đầu tiên vào năm 1925.

Các loại và tiêu chí phân tích phương sai

Phương pháp này được sử dụng để điều tra mối quan hệ giữa các đặc trưng định tính (danh nghĩa) và một biến định lượng (liên tục). Trên thực tế, nó kiểm tra giả thuyết về sự bằng nhau của các phương tiện số học của một số mẫu. Vì vậy, nó có thể được coi là một tiêu chí tham số để so sánh các tâm của một số mẫu cùng một lúc. Nếu bạn sử dụng phương pháp này cho hai mẫu, thì kết quả phân tích phương sai sẽ giống với kết quả kiểm định t của Học sinh. Tuy nhiên, không giống như các tiêu chí khác, nghiên cứu này cho phép bạn nghiên cứu vấn đề một cách chi tiết hơn.

Phân tích phương sai trong thống kê dựa trên quy luật: tổng bình phương độ lệch của mẫu kết hợp bằng tổng bình phương của độ lệch trong nhóm và tổng bình phương của độ lệch giữa các nhóm. Đối với nghiên cứu, kiểm định của Fisher được sử dụng để thiết lập ý nghĩa của sự khác biệt giữa các phương sai giữa các nhóm và trong nhóm. Tuy nhiên, đối với điều này, các điều kiện tiên quyết cần thiết là tính chuẩn của phân phối và tính đồng biến (bình đẳng của các phương sai) của các mẫu. Phân biệt giữa phân tích phương sai một chiều (đơn nhân tố) và phân tích đa biến (đa nhân tố). Cách thứ nhất xem xét sự phụ thuộc của giá trị đang nghiên cứu vào một thuộc tính, cách thứ hai - vào nhiều thuộc tính cùng một lúc và cũng cho phép bạn xác định mối quan hệ giữa chúng.

Các nhân tố

Các yếu tố được gọi là hoàn cảnh được kiểm soát ảnh hưởng đến kết quả cuối cùng. Mức độ hoặc phương pháp xử lý của nó được gọi là giá trị đặc trưng cho biểu hiện cụ thể của tình trạng này. Các số liệu này thường được đưa ra trong thang đo danh nghĩa hoặc thứ tự. Thường thì các giá trị đầu ra được đo trên thang định lượng hoặc thứ tự. Sau đó, có vấn đề về nhóm dữ liệu đầu ra trong một loạt các quan sát, tương ứng với các Giá trị kiểu số. Nếu số lượng nhóm quá lớn, thì số lượng quan sát trong đó có thể không đủ để thu được kết quả đáng tin cậy. Nếu con số được lấy quá nhỏ, điều này có thể dẫn đến việc mất các tính năng thiết yếu có ảnh hưởng đến hệ thống. Phương pháp nhóm dữ liệu cụ thể phụ thuộc vào khối lượng và bản chất của sự biến đổi trong các giá trị. Số lượng và kích thước của các khoảng trong phân tích đơn biến thường được xác định bằng nguyên tắc các khoảng bằng nhau hoặc theo nguyên tắc tần số bằng nhau.

Nhiệm vụ của phân tích phân tán

Vì vậy, có những trường hợp khi bạn cần phải so sánh hai hoặc nhiều mẫu. Sau đó, nó được khuyến khích sử dụng phân tích phương sai. Tên của phương pháp chỉ ra rằng các kết luận được đưa ra trên cơ sở nghiên cứu các thành phần của phương sai. Bản chất của nghiên cứu là sự thay đổi tổng thể trong chỉ tiêu được chia thành các thành phần tương ứng với hành động của từng yếu tố riêng lẻ. Hãy xem xét một số vấn đề mà một phân tích phương sai điển hình sẽ giải quyết được.

ví dụ 1

Xưởng có một số máy công cụ - máy tự động sản xuất một bộ phận cụ thể. Kích thước của mỗi bộ phận là một giá trị ngẫu nhiên, giá trị này phụ thuộc vào cài đặt của từng máy và sai lệch ngẫu nhiên xảy ra trong quá trình sản xuất các bộ phận. Cần phải xác định từ các phép đo kích thước của các bộ phận xem các máy có được lắp đặt theo cùng một cách hay không.

Ví dụ 2

Trong quá trình sản xuất thiết bị điện, các loại giấy cách điện khác nhau được sử dụng: tụ điện, điện, v.v ... Thiết bị có thể được ngâm tẩm các chất khác nhau: nhựa epoxy, dầu bóng, nhựa ML-2, v.v ... Rò rỉ có thể được loại bỏ trong điều kiện chân không ở áp suất cao, khi gia nhiệt. Nó có thể được ngâm tẩm bằng cách ngâm trong dầu bóng, dưới một dòng dầu bóng liên tục, v.v. Toàn bộ thiết bị điện được đổ bằng một hợp chất nhất định, trong đó có một số tùy chọn. Các chỉ số chất lượng là độ bền điện môi của lớp cách điện, nhiệt độ quá nhiệt của cuộn dây ở chế độ vận hành và một số chỉ số khác. Trong quá trình luyện tập Quy trình công nghệ sản xuất thiết bị, cần phải xác định xem mỗi yếu tố được liệt kê ảnh hưởng như thế nào đến hoạt động của thiết bị.

Ví dụ 3

Tổng kho xe buýt phục vụ một số tuyến xe buýt. Họ vận hành xe đẩy các loại, và 125 thanh tra thu tiền vé. Ban lãnh đạo tổng kho quan tâm đến câu hỏi: làm thế nào để so sánh hiệu quả kinh tế của từng kiểm soát viên (doanh thu) với các tuyến đường khác nhau, các loại xe đẩy khác nhau? Làm thế nào để xác định tính khả thi về kinh tế của việc khởi động xe đẩy của một loại nhất định trên một tuyến đường cụ thể? Làm thế nào để thiết lập các yêu cầu hợp lý về mức doanh thu mà người soát vé mang lại trên mỗi tuyến đường bằng các loại xe đẩy?

Nhiệm vụ của việc lựa chọn một phương pháp là làm thế nào để có được thông tin tối đa về tác động đến kết quả cuối cùng của từng yếu tố, xác định các đặc trưng số của tác động đó, độ tin cậy của chúng với chi phí tối thiểu và tối đa một khoảng thời gian ngắn. Phương pháp phân tích phân tán cho phép giải quyết các vấn đề như vậy.

Phân tích đơn biến

Nghiên cứu nhằm mục đích đánh giá mức độ ảnh hưởng của một trường hợp cụ thể đối với đánh giá đang được phân tích. Một thách thức khác phân tích đơn biến Có thể so sánh hai hoặc nhiều hoàn cảnh với nhau để xác định sự khác biệt về ảnh hưởng của chúng đối với việc thu hồi. Nếu giả thuyết vô hiệu bị bác bỏ, thì bước tiếp theo là định lượng và xây dựng khoảng tin cậyđối với các đặc điểm thu được. Trong trường hợp không thể bác bỏ giả thuyết vô hiệu, nó thường được chấp nhận và đưa ra kết luận về bản chất của ảnh hưởng.

Phân tích phương sai một chiều có thể trở thành phương pháp tương tự không tham số của phương pháp xếp hạng Kruskal-Wallis. Nó được phát triển bởi nhà toán học người Mỹ William Kruskal và nhà kinh tế học Wilson Wallis vào năm 1952. Phép thử này nhằm kiểm tra giả thuyết vô hiệu rằng tác động của ảnh hưởng lên các mẫu được nghiên cứu là bằng nhau với các giá trị trung bình chưa biết nhưng bằng nhau. Trong trường hợp này, số lượng mẫu phải nhiều hơn hai.

Tiêu chí Jonkhier (Jonkhier-Terpstra) được đề xuất độc lập bởi nhà toán học Hà Lan T. J. Terpstrom và nhà tâm lý học người Anh E. R. Jonkhier vào năm 1954. Nó được sử dụng khi biết trước rằng các nhóm kết quả có sẵn được sắp xếp theo thứ tự tăng ảnh hưởng của yếu tố đang nghiên cứu, được đo lường trên thang thứ tự.

M - tiêu chí Bartlett, do nhà thống kê người Anh Maurice Stevenson Bartlett đề xuất vào năm 1937, được sử dụng để kiểm tra giả thuyết vô hiệu về sự bằng nhau của các phương sai của một số quần thể bình thường mà từ đó các mẫu nghiên cứu được lấy, trong trường hợp chung có các thể tích khác nhau (số lượng của mỗi mẫu ít nhất phải là bốn).

G là phép thử Cochran, được William Gemmel Cochran người Mỹ phát hiện vào năm 1941. Nó được sử dụng để kiểm tra giả thuyết vô hiệu về sự bằng nhau của các phương sai của các quần thể bình thường đối với các mẫu độc lập có kích thước bằng nhau.

Phép thử Levene phi tham số, do nhà toán học người Mỹ Howard Levene đề xuất vào năm 1960, là một phương án thay thế cho phép thử Bartlett trong điều kiện không chắc chắn rằng các mẫu đang nghiên cứu tuân theo phân phối chuẩn.

Năm 1974, các nhà thống kê người Mỹ Morton B. Brown và Alan B. Forsythe đề xuất một thử nghiệm (thử nghiệm Brown-Forsyth), nó có phần khác với thử nghiệm Levene.

Phân tích hai chiều

Phân tích phương sai hai chiều được sử dụng cho các mẫu phân phối chuẩn được liên kết. Trong thực tế, nó thường được sử dụng bảng phức tạp phương pháp này, cụ thể là những phương pháp trong đó mỗi ô chứa một tập hợp dữ liệu (các phép đo lặp lại) tương ứng với các giá trị mức cố định. Nếu các giả định cần thiết để áp dụng phân tích phương sai hai chiều không được đáp ứng, thì kiểm định thứ hạng phi tham số của Friedman (Friedman, Kendall và Smith), được phát triển bởi nhà kinh tế học người Mỹ Milton Friedman vào cuối năm 1930, được sử dụng. Tiêu chí này không phụ thuộc vào kiểu phân phối.

Người ta chỉ cho rằng sự phân bố của các đại lượng là như nhau và liên tục, và bản thân chúng độc lập với nhau. Khi kiểm tra giả thuyết rỗng, kết quả được đưa ra dưới dạng ma trận hình chữ nhật, trong đó các hàng tương ứng với mức của yếu tố B và các cột tương ứng với mức A. Mỗi ô của bảng (khối) có thể là kết quả của phép đo các thông số trên một đối tượng hoặc trên một nhóm đối tượng với hằng số. giá trị của các mức của cả hai yếu tố. Trong trường hợp này, dữ liệu tương ứng được trình bày dưới dạng giá trị trung bình của một tham số nhất định cho tất cả các phép đo hoặc đối tượng của mẫu đang nghiên cứu. Để áp dụng tiêu chí đầu ra, cần phải chuyển từ kết quả trực tiếp của các phép đo sang thứ hạng của chúng. Việc xếp hạng được thực hiện cho từng hàng riêng biệt, nghĩa là, các giá trị được sắp xếp theo thứ tự cho mỗi giá trị cố định.

Kiểm định Trang (L-test), do nhà thống kê người Mỹ E. B. Page đề xuất vào năm 1963, được thiết kế để kiểm tra giả thuyết không. Đối với các mẫu lớn, ước lượng Trang được sử dụng. Chúng tuân theo thực tế của các giả thuyết rỗng tương ứng, tuân theo phân phối chuẩn chuẩn. Trong trường hợp các hàng của bảng nguồn có các giá trị giống nhau thì cần sử dụng các bậc trung bình. Trong trường hợp này, độ chính xác của các kết luận sẽ kém hơn, số lượng các sự trùng hợp như vậy càng lớn.

Q - Tiêu chí Cochran, do V. Cochran đề xuất năm 1937. Nó được sử dụng trong trường hợp các nhóm đối tượng đồng nhất chịu nhiều hơn hai ảnh hưởng và có thể có hai lựa chọn để đánh giá - tiêu cực có điều kiện (0) và tích cực có điều kiện (1 ). Giả thuyết vô hiệu bao gồm sự bình đẳng của các hiệu ứng ảnh hưởng. Phân tích phương sai hai chiều cho phép xác định sự tồn tại của hiệu ứng xử lý, nhưng không giúp xác định được hiệu ứng này tồn tại ở những cột nào. Để giải quyết vấn đề này, phương pháp nhiều phương trình Scheffe cho các mẫu được liên kết.

Phân tích đa biến

Vấn đề phân tích phương sai đa biến nảy sinh khi cần xác định ảnh hưởng của hai hay nhiều điều kiện đến một biến ngẫu nhiên nào đó. Nghiên cứu cung cấp sự hiện diện của một người phụ thuộc biến ngẫu nhiên, được đo bằng tỷ lệ chênh lệch hoặc tỷ lệ, và một số biến độc lập, mỗi trong số đó được thể hiện trong một thang điểm tên hoặc trong một thang thứ hạng. Phân tích độ phân tán của dữ liệu là một phần khá phát triển thống kê toán học trong đó có rất nhiều lựa chọn. Khái niệm nghiên cứu chung cho cả nghiên cứu đơn biến và đa biến. Bản chất của nó là tổng phương saiđược chia thành các thành phần, tương ứng với một nhóm dữ liệu nhất định. Mỗi nhóm dữ liệu có một mô hình riêng. Ở đây, chúng tôi sẽ chỉ xem xét các điều khoản chính cần thiết để hiểu và công dụng thực tế các tùy chọn được sử dụng nhiều nhất.

Phân tích nhân tố của phương sai đòi hỏi sự chú ý cẩn thận đến việc thu thập và trình bày dữ liệu đầu vào, và đặc biệt là việc giải thích kết quả. Ngược lại với yếu tố một, các kết quả có thể được đặt theo điều kiện trong một trình tự nhất định, kết quả của hai yếu tố yêu cầu một cách trình bày phức tạp hơn. Hơn tình hình phức tạp hơn xảy ra khi có ba, bốn hoặc nhiều hoàn cảnh. Do đó, mô hình hiếm khi bao gồm nhiều hơn ba (bốn) điều kiện. Một ví dụ là sự xuất hiện của cộng hưởng tại một giá trị nhất định của điện dung và độ tự cảm của vòng tròn điện; biểu hiện của một phản ứng hóa học với một tập hợp các nguyên tố nhất định mà từ đó hệ thống được xây dựng; sự xuất hiện của các hiệu ứng bất thường trong các hệ thống phức tạp dưới một số hoàn cảnh trùng hợp nhất định. Sự hiện diện của tương tác có thể thay đổi hoàn toàn mô hình của hệ thống và đôi khi dẫn đến việc suy nghĩ lại về bản chất của các hiện tượng mà người thực nghiệm đang giải quyết.

Phân tích phương sai đa biến với các thử nghiệm lặp lại

Dữ liệu đo lường thường có thể được nhóm lại không phải theo hai mà bởi nhiều yếu tố hơn. Vì vậy, nếu chúng ta xem xét phân tích phân tán tuổi thọ của lốp xe cho bánh xe đẩy, có tính đến các trường hợp (nhà sản xuất và tuyến đường sử dụng lốp xe), thì chúng ta có thể coi đó là một điều kiện riêng biệt về mùa trong đó lốp được sử dụng (cụ thể là: hoạt động mùa đông và mùa hè). Kết quả là, chúng ta sẽ có bài toán của phương pháp ba yếu tố.

Khi có nhiều điều kiện hơn, cách tiếp cận cũng giống như trong phân tích hai chiều. Trong mọi trường hợp, mô hình đang cố gắng đơn giản hóa. Hiện tượng tương tác của hai yếu tố không thường xuyên xuất hiện, và tương tác bộ ba chỉ xảy ra trong những trường hợp cá biệt. Bao gồm những tương tác đã có thông tin trước đó và những lý do chính đáng để đưa nó vào mô hình. Quá trình cô lập các yếu tố riêng lẻ và tính đến chúng tương đối đơn giản. Do đó, thường có mong muốn làm nổi bật các tình tiết hơn. Bạn không nên quá lo lắng về điều này. Càng nhiều điều kiện, mô hình càng trở nên kém tin cậy và khả năng sai sót càng lớn. Bản thân mô hình, bao gồm một số lượng lớn các biến độc lập trở nên khá khó giải thích và không thuận tiện cho việc sử dụng thực tế.

Ý tưởng chung về phân tích phương sai

Phân tích phương sai trong thống kê là một phương pháp thu được kết quả của các quan sát phụ thuộc vào các trường hợp đồng thời khác nhau và đánh giá ảnh hưởng của chúng. Một biến được kiểm soát tương ứng với phương pháp tác động đến đối tượng nghiên cứu và trong một khoảng thời gian nhất định có được giá trị nhất định, được gọi là một thừa số. Chúng có thể là định tính và định lượng. Các mức điều kiện định lượng đạt được một giá trị nhất định trên thang số. Ví dụ như nhiệt độ, áp suất ép, lượng chất. Các yếu tố chất lượng là các chất khác nhau, các phương pháp công nghệ, thiết bị, chất độn khác nhau. Mức độ của chúng tương ứng với quy mô của tên.

Chất lượng cũng bao gồm loại vật liệu đóng gói, điều kiện bảo quản dạng bào chế. Cũng hợp lý khi bao gồm mức độ nghiền nguyên liệu thô, thành phần phân đoạn của hạt có giá trị định lượng, nhưng khó kiểm soát nếu sử dụng cân định lượng. Số lượng các yếu tố chất lượng phụ thuộc vào dạng bào chế, cũng như tính chất vật lý và công nghệ của dược chất. Ví dụ, viên nén có thể được lấy từ các chất kết tinh bằng cách nén trực tiếp. Trong trường hợp này, chỉ cần thực hiện việc lựa chọn các tác nhân trượt và bôi trơn là đủ.

Ví dụ về các yếu tố chất lượng đối với các loại dạng bào chế khác nhau

Hình ảnh. Thành phần chất chiết, loại máy chiết, phương pháp chuẩn bị nguyên liệu, phương pháp sản xuất, phương pháp lọc.
Chất chiết xuất (lỏng, đặc, khô). Thành phần của chất chiết, phương pháp chiết, kiểu lắp đặt, phương pháp loại bỏ chất chiết và dằn.
Thuốc. Thành phần của tá dược, chất độn, chất phân huỷ, chất kết dính, chất bôi trơn và chất bôi trơn. Phương pháp lấy viên, loại thiết bị công nghệ. Loại vỏ và các thành phần của nó, chất tạo màng, chất màu, thuốc nhuộm, chất hóa dẻo, dung môi.
dung dịch tiêm. Loại dung môi, phương pháp lọc, bản chất của chất ổn định và chất bảo quản, điều kiện tiệt trùng, phương pháp chiết rót ống thuốc.
Thuốc đạn. Thành phần của cơ sở thuốc đạn, phương pháp lấy thuốc đạn, chất độn, đóng gói.
Thuốc mỡ. thành phần cơ bản, thành phần cấu trúc, phương pháp chuẩn bị thuốc mỡ, loại thiết bị, bao bì.
Viên nang. Loại chất liệu vỏ, phương pháp lấy viên nang, loại chất hóa dẻo, chất bảo quản, thuốc nhuộm.
Áo lót. Phương pháp sản xuất, thành phần, loại thiết bị, loại chất nhũ hóa.
Đình chỉ. Loại dung môi, loại chất ổn định, phương pháp phân tán.

Ví dụ về các yếu tố chất lượng và mức độ của chúng được nghiên cứu trong quá trình sản xuất máy tính bảng

Bột nở. Tinh bột khoai tây, đất sét trắng, hỗn hợp của natri bicacbonat với axit xitric, magie cacbonat bazơ.
giải pháp ràng buộc. Nước, hồ tinh bột, xi-rô đường, dung dịch metylcellulose, dung dịch hydroxypropyl metylcellulose, dung dịch polyvinylpyrolidone, dung dịch rượu polyvinyl.
chất trượt. Aerosil, tinh bột, bột talc.
Chất làm đầy.Đường, glucose, lactose, natri clorua, canxi photphat.
Dầu nhờn. Axit stearic, polyetylen glicol, parafin.

Các mô hình phân tích phân tán trong nghiên cứu mức độ cạnh tranh của nhà nước

Một trong những tiêu chí quan trọng nhất để đánh giá tình trạng của nhà nước, được sử dụng để đánh giá mức độ phúc lợi và sự phát triển kinh tế - xã hội của nó, là khả năng cạnh tranh, tức là một tập hợp các thuộc tính vốn có của nền kinh tế quốc dân quyết định khả năng nhà nước để cạnh tranh với các nước khác. Khi xác định được vị trí và vai trò của nhà nước trên thị trường thế giới, thì mới có thể thiết lập chiến lược rõ ràng để đảm bảo an ninh kinh tế trên phạm vi quốc tế, bởi vì đó là chìa khóa cho quan hệ tích cực giữa Nga và tất cả các bên tham gia trên thị trường thế giới: các nhà đầu tư. , chủ nợ, chính quyền tiểu bang.

Để so sánh mức độ cạnh tranh của các bang, các quốc gia được xếp hạng bằng cách sử dụng các chỉ số phức tạp, bao gồm các chỉ số có trọng số khác nhau. Các chỉ số này dựa trên các yếu tố chính ảnh hưởng đến tình hình kinh tế, chính trị, v.v. Tổ hợp các mô hình nghiên cứu năng lực cạnh tranh của nhà nước cung cấp cho việc sử dụng các phương pháp phân tích thống kê đa chiều (cụ thể đây là phương pháp phân tích phương sai (thống kê), mô hình kinh tế lượng, ra quyết định) và bao gồm các giai đoạn chính sau:

Hình thành hệ thống chỉ tiêu - chỉ tiêu.
Đánh giá và dự báo các chỉ tiêu về năng lực cạnh tranh của nhà nước.
So sánh các chỉ số-chỉ số đánh giá năng lực cạnh tranh của các bang.

Và bây giờ chúng ta hãy xem xét nội dung của các mô hình của từng giai đoạn của khu phức hợp này.

Ở giai đoạn đầu tiên sử dụng phương pháp nghiên cứu của chuyên gia, một bộ chỉ tiêu kinh tế hợp lý để đánh giá năng lực cạnh tranh của nhà nước được hình thành, có tính đến các chi tiết cụ thể của sự phát triển của nhà nước trên cơ sở xếp hạng quốc tế và dữ liệu từ các cục thống kê, phản ánh tình trạng của hệ thống. nói chung và các quy trình của nó. Việc lựa chọn các chỉ số này là hợp lý bởi cần phải lựa chọn những chỉ số đầy đủ nhất, theo quan điểm thực tiễn, cho phép xác định mức độ của nhà nước, mức độ hấp dẫn đầu tư của nó và khả năng bản địa hóa tương đối các mối đe dọa tiềm năng và thực tế hiện có.

Các chỉ số-chỉ số chính của hệ thống xếp hạng quốc tế là các chỉ số:

Năng lực cạnh tranh toàn cầu (GCC).
Tự do kinh tế (IES).
Sự phát triển Tiềm năng của con người(HDI).
Nhận thức về Tham nhũng (CPI).
Các mối đe dọa bên trong và bên ngoài (IVZZ).
Tiềm năng Ảnh hưởng Quốc tế (IPIP).

Giai đoạn thứ hai cung cấp cho việc đánh giá và dự báo các chỉ số về năng lực cạnh tranh của nhà nước về xếp hạng quốc tế cho 139 tiểu bang được nghiên cứu trên thế giới.

Giai đoạn thứ ba cung cấp sự so sánh các điều kiện cho khả năng cạnh tranh của các quốc gia bằng cách sử dụng các phương pháp phân tích tương quan và hồi quy.

Sử dụng kết quả của nghiên cứu, có thể xác định bản chất của các quá trình nói chung và đối với các thành phần riêng lẻ của năng lực cạnh tranh của nhà nước; kiểm định giả thuyết về mức độ ảnh hưởng của các nhân tố và mối quan hệ của chúng ở mức ý nghĩa thích hợp.

Việc triển khai bộ mô hình được đề xuất sẽ không chỉ cho phép đánh giá thực trạng mức độ cạnh tranh và mức độ hấp dẫn đầu tư của các quốc gia, mà còn phân tích những thiếu sót trong quản lý, ngăn ngừa sai sót của các quyết định sai lầm, và ngăn chặn sự phát triển của khủng hoảng. trong bang.

Phân tích phương sai

1. Khái niệm về phân tích phương sai

Phân tích phương sai- đây là một phân tích về sự biến đổi của một tính trạng dưới ảnh hưởng của bất kỳ yếu tố biến kiểm soát nào. Trong tài liệu nước ngoài, phân tích phương sai thường được gọi là ANOVA, tạm dịch là phân tích phương sai (Analysis of Variance).

Nhiệm vụ của phân tích phương sai bao gồm việc cô lập sự biến đổi của một loại khác với sự biến đổi chung của tính trạng:

a) sự thay đổi do tác động của từng biến độc lập được nghiên cứu;

b) sự thay đổi do tương tác của các biến độc lập được nghiên cứu;

c) biến thiên ngẫu nhiên do tất cả các biến khác chưa biết.

Độ biến thiên do hoạt động của các biến được nghiên cứu và sự tương tác của chúng tương quan với độ biến thiên ngẫu nhiên. Một chỉ báo của tỷ lệ này là kiểm định F của Fisher.

Công thức để tính tiêu chí F bao gồm các ước lượng về phương sai, nghĩa là, các tham số phân phối của một đối tượng địa lý, do đó tiêu chí F là một tiêu chí tham số.

Hơn trong hơn sự biến đổi của một tính trạng là do các biến (nhân tố) được nghiên cứu hoặc sự tương tác của chúng, càng cao các giá trị thực nghiệm của tiêu chí.

Số không giả thuyết trong phân tích phương sai sẽ nói rằng các giá trị trung bình của đặc điểm hiệu quả được nghiên cứu trong tất cả các cấp là như nhau.

Thay thế giả thuyết sẽ nói rằng các giá trị trung bình của thuộc tính hiệu quả trong các bậc khác nhau của nhân tố được nghiên cứu là khác nhau.

Phân tích phương sai cho phép chúng ta chỉ ra sự thay đổi của một đặc điểm, nhưng không chỉ ra chiều hướng những thay đổi này.

Hãy bắt đầu phân tích phương sai với trường hợp đơn giản nhất, khi chúng ta nghiên cứu hành động của chỉ một biến (nhân tố đơn).

2. Phân tích một chiều phương sai cho các mẫu không liên quan

2.1. Mục đích của phương pháp

Phương pháp phân tích phương sai một nhân tố được sử dụng trong những trường hợp khi những thay đổi trong thuộc tính hiệu quả được nghiên cứu dưới ảnh hưởng của các điều kiện thay đổi hoặc sự phân cấp của bất kỳ nhân tố nào. Trong phiên bản của phương pháp này, ảnh hưởng của từng bậc của yếu tố là đa dạng mẫu đề kiểm tra. Phải có ít nhất ba bậc của yếu tố. (Có thể có hai cách phân cấp, nhưng trong trường hợp này chúng ta sẽ không thể thiết lập các phụ thuộc phi tuyến và có vẻ hợp lý hơn khi sử dụng các phụ thuộc đơn giản hơn).

Một biến thể không tham số của loại phân tích này là phép thử Kruskal-Wallis H.

Giả thuyết

H 0: Sự khác biệt giữa các cấp nhân tố (các điều kiện khác nhau) không rõ rệt hơn sự khác biệt ngẫu nhiên trong mỗi nhóm.

H 1: Sự khác biệt giữa các bậc nhân tố (các điều kiện khác nhau) rõ ràng hơn sự khác biệt ngẫu nhiên trong mỗi nhóm.

2.2. Hạn chế của phân tích phương sai đơn biến đối với các mẫu không liên quan

1. Phân tích đơn biến của phương sai yêu cầu ít nhất ba bậc của nhân tử và ít nhất hai môn học trong mỗi bậc.

2. Tính trạng kết quả phải được phân bố bình thường trong mẫu nghiên cứu.

Đúng, nó thường không được chỉ ra là chúng ta đang nói về sự phân bố của một đặc điểm trong toàn bộ mẫu được khảo sát hay ở một phần của nó tạo nên phức hợp phân tán.

3. Một ví dụ về giải bài toán bằng phương pháp phân tích phương sai một nhân tố cho các mẫu không liên quan bằng cách sử dụng ví dụ:

Ba nhóm sáu đối tượng khác nhau nhận được danh sách mười từ. Các từ được trình bày cho nhóm đầu tiên với tốc độ thấp là 1 từ trên 5 giây, cho nhóm thứ hai với tốc độ trung bình là 1 từ trên 2 giây và cho nhóm thứ ba với tốc độ cao là 1 từ trên giây. Hiệu suất sao chép được dự đoán phụ thuộc vào tốc độ trình bày từ. Kết quả được trình bày trong Bảng. một.

Số lượng từ được sao chép Bảng 1

số môn học	tốc độ thấp	tốc độ trung bình	tốc độ cao








tổng cộng

H 0: Sự khác biệt về khối lượng từ ở giữa các nhóm không rõ rệt hơn sự khác biệt ngẫu nhiên phía trong mỗi nhóm.

H1: Sự khác biệt về khối lượng từ ở giữa các nhóm rõ ràng hơn sự khác biệt ngẫu nhiên phía trong mỗi nhóm. Sử dụng các giá trị thực nghiệm được trình bày trong Bảng. 1, chúng tôi sẽ thiết lập một số giá trị cần thiết để tính tiêu chí F.

Việc tính toán các đại lượng chính để phân tích phương sai một chiều được trình bày trong bảng:

ban 2

bàn số 3

Trình tự hoạt động trong ANOVA một chiều cho các mẫu bị ngắt kết nối

Thường được sử dụng trong bảng này và các bảng tiếp theo, ký hiệu SS là từ viết tắt của "tổng các bình phương". Chữ viết tắt này thường được sử dụng nhất trong các nguồn đã dịch.

SS thực tế có nghĩa là sự biến đổi của tính trạng, do tác động của yếu tố được nghiên cứu;

SS phổ thông- sự biến đổi chung của tính trạng;

S CA- sự thay đổi do không tính đến các yếu tố, sự thay đổi "ngẫu nhiên" hoặc "phần dư".

CÔ - "hình vuông ở giữa", hoặc giá trị trung bình của tổng bình phương, giá trị trung bình của SS tương ứng.

df - số bậc tự do, khi xem xét các tiêu chí phi tham số, chúng tôi ký hiệu bằng chữ cái Hy Lạp v.

Kết luận: H 0 bị loại. H 1 được chấp nhận. Sự khác biệt về khối lượng tái tạo từ giữa các nhóm rõ rệt hơn sự khác biệt ngẫu nhiên trong mỗi nhóm (α = 0,05). Vì vậy, tốc độ trình bày của các từ ảnh hưởng đến khối lượng tái tạo của chúng.

Dưới đây là một ví dụ về cách giải quyết vấn đề trong Excel:

Dữ liệu ban đầu:

Sử dụng lệnh: Công cụ-> Phân tích dữ liệu-> Phân tích phương sai một chiều, ta nhận được kết quả sau:

Bài tập về toán học

Giới thiệu

Khái niệm phân tích phương sai

Phân tích phương sai một chiều (Triển khai thực tế trong Thống kê SPSS 20 của IBM)

Phân tích phương sai một chiều (Triển khai thực tế trong Microsoft Office 2013)

Sự kết luận

Danh sách các nguồn được sử dụng

Giới thiệu

Mức độ liên quan của chủ đề. Sự phát triển của thống kê toán học bắt đầu với công trình của nhà toán học nổi tiếng người Đức Carl Friedrich Gauss vào năm 1795 và vẫn đang tiếp tục phát triển. TẠI Phân tích thống kê có phương pháp tham số “Phân tích phương sai một nhân tố”. Hiện nay, nó được sử dụng trong kinh tế học khi thực hiện nghiên cứu thị trường để so sánh kết quả (ví dụ, khi thực hiện điều tra về mức tiêu thụ một sản phẩm ở các vùng khác nhau trong cả nước, cần đưa ra kết luận về mức độ khác nhau của số liệu điều tra hoặc làm không khác nhau; về tâm lý học, khi thực hiện các loại nghiên cứu khác nhau), khi biên soạn các bài kiểm tra so sánh khoa học hoặc nghiên cứu bất kỳ nhóm xã hội và để giải quyết các vấn đề trong thống kê.

Mục tiêu. Anh ta sẽ làm quen với một phương pháp thống kê như phân tích phương sai một chiều, cũng như việc triển khai nó trên PC trong các chương trình khác nhau và so sánh các chương trình này.

Để nghiên cứu lý thuyết về phân tích phương sai một chiều.

Nghiên cứu các chương trình giải các bài toán phân tích đơn nhân tố.

Hạnh kiểm phân tích so sánh các chương trình này.

Thành tích công việc: Phần thực hành Công việc hoàn toàn được thực hiện bởi tác giả: lựa chọn chương trình, lựa chọn nhiệm vụ, giải pháp của họ trên PC, sau đó tiến hành phân tích so sánh. Trong phần lý thuyết, việc phân loại các nhóm ANOVA đã được thực hiện. công việc nàyđã được thử nghiệm làm báo cáo tại buổi sinh viên khoa học "Câu hỏi chọn lọc toán học cao hơn và Phương pháp dạy học Toán "

Cơ cấu và phạm vi công việc. Tác phẩm gồm phần mở đầu, phần kết luận, phần nội dung và phần thư mục, gồm 4 đầu sách. Tổng tập của tác phẩm là 25 trang in. Công việc có 1 ví dụ được giải quyết bằng 2 chương trình.

Khái niệm phân tích phương sai

Thông thường cần điều tra ảnh hưởng của một hoặc nhiều biến độc lập (nhân tố) đến một hoặc nhiều biến phụ thuộc (dấu hiệu kết quả), những vấn đề này có thể được giải quyết bằng phương pháp phân tích phương sai, tác giả R. Fisher.

ANOVA phân tích phương sai - một tập hợp các phương pháp xử lý dữ liệu thống kê cho phép bạn phân tích sự biến đổi của một hoặc nhiều đối tượng địa lý hiệu quả dưới tác động của các yếu tố được kiểm soát (biến độc lập). Ở đây, yếu tố được hiểu là một giá trị nhất định xác định các thuộc tính của đối tượng hoặc hệ thống đang nghiên cứu, tức là lý do cho kết quả cuối cùng. Khi tiến hành phân tích phương sai, điều quan trọng là phải chọn đúng nguồn và đối tượng ảnh hưởng, tức là xác định các biến phụ thuộc và độc lập.

Tùy thuộc vào các dấu hiệu phân loại, một số nhóm phân loại phân tích phương sai được phân biệt (Bảng 1).

Theo số lượng các yếu tố được xét đến: Phân tích đơn biến - nghiên cứu ảnh hưởng của một yếu tố; Phân tích đa biến - nghiên cứu ảnh hưởng đồng thời của hai hoặc nhiều yếu tố. Bằng sự hiện diện của mối liên hệ giữa các mẫu giá trị: Phân tích không liên quan (khác nhau ) mẫu - được thực hiện khi có một số nhóm đối tượng nghiên cứu nằm trong điều kiện khác nhau. (Giả thuyết vô hiệu H0 được kiểm tra: giá trị trung bình của biến phụ thuộc là như nhau trong các điều kiện đo lường khác nhau, tức là không phụ thuộc vào nhân tố đang nghiên cứu.); Phân tích các mẫu liên quan (giống nhau) - được thực hiện cho hai hoặc nhiều hơn các phép đo được thực hiện trên cùng một nhóm đối tượng nghiên cứu trong các điều kiện khác nhau. Ở đây, có thể xảy ra ảnh hưởng của một nhân tố không được tính toán, có thể bị quy nhầm là do sự thay đổi của các điều kiện. Theo số lượng các biến phụ thuộc bị ảnh hưởng bởi các nhân tố. Phân tích đơn biến (ANOVA hoặc AMCOVA - phân tích hiệp phương sai) - một biến phụ thuộc bị ảnh hưởng bởi các nhân tố ; Phân tích đa biến (MANOVA - phân tích phương sai đa biến hoặc MANSOVA - phân tích hiệp phương sai đa biến) - một số biến phụ thuộc bị ảnh hưởng bởi các yếu tố. Tùy theo mục đích của nghiên cứu. Xác định - mức độ của tất cả các yếu tố đều được cố định trước và đó là ảnh hưởng của chúng được kiểm tra (giả thuyết H0 được kiểm tra về sự không có sự khác biệt giữa các mức trung bình); Ngẫu nhiên - các mức của mỗi yếu tố thu được là mẫu thử ngẫu nhiên từ tổng thể chung của các cấp độ yếu tố (giả thuyết H0 đang được kiểm định rằng độ phân tán của các giá trị phản hồi trung bình được tính toán cho các cấp độ yếu tố khác nhau là khác nhau);

Phân tích một chiều của kiểm tra phương sai ý nghĩa thống kê sự khác biệt giữa trung bình mẫu của hai hoặc nhiều quần thể đối với điều này, các giả thuyết được hình thành sơ bộ.

Giả thuyết không H0: các giá trị trung bình của tính năng hiệu quả trong tất cả các điều kiện của hành động yếu tố (hoặc phân cấp yếu tố) là như nhau

Giả thuyết thay thế H1: các giá trị trung bình của đặc điểm hiệu quả trong mọi điều kiện của yếu tố là khác nhau.

Phương pháp ANOVA có thể được sử dụng cho các quần thể phân bố bình thường (các chất tương tự đa biến của các phép thử tham số) và cho các quần thể không có phân bố xác định (các chất tương tự đa biến của các phép thử không tham số). Trong trường hợp đầu tiên, trước tiên cần xác định rằng sự phân bố của đối tượng địa lý kết quả là bình thường. Để kiểm tra tính bình thường của việc phân phối một đối tượng địa lý, bạn có thể sử dụng các chỉ số bất đối xứng A = , và kurtosis E = , , ở đâu , . - giá trị của tính năng hữu hiệu và giá trị trung bình của nó; - độ lệch chuẩn của đặc trưng kết quả; .

Số lần quan sát;

Sai số về tính đại diện cho các biện pháp A và E

Nếu các chỉ số lệch và kurtosis không vượt quá sai số về tính đại diện của chúng quá 3 lần, tức là NHƯNG<3тА и Е <3тЕ, то распределение можно считать нормальным. Для нормальных распределений показатели А и Е равны нулю.

Dữ liệu liên quan đến một điều kiện của yếu tố (đến một cấp độ) được gọi là phức phân tán. Khi tiến hành phân tích phương sai, cần quan sát sự bằng nhau của độ phân tán giữa các phức chất. Trong trường hợp này, việc lựa chọn các phần tử nên được thực hiện một cách ngẫu nhiên.

Trong trường hợp thứ hai, khi các quần thể mẫu có sự phân bố tùy ý, các phép tương tự (xếp hạng) không tham số của phân tích phương sai một chiều được sử dụng (tiêu chí Kruskal-Wallis, Friedman).

Hãy xem xét một minh họa đồ họa về sự phụ thuộc của tỷ suất lợi nhuận trên cổ phiếu vào tình hình hoạt động của nền kinh tế đất nước (Hình 1, a). Ở đây, yếu tố đang được nghiên cứu là mức độ trạng thái của nền kinh tế (chính xác hơn là ba mức độ trạng thái của nó), và đặc điểm hiệu quả là tỷ suất sinh lợi. Sự phân bổ trên cho thấy rằng yếu tố này có tác động đáng kể đến khả năng sinh lời, tức là Khi nền kinh tế cải thiện, lợi nhuận từ cổ phiếu cũng vậy, điều này không trái với lẽ thường.

Lưu ý rằng yếu tố đã chọn có sự phân cấp, tức là giá trị của nó đã thay đổi trong quá trình chuyển đổi từ bậc này sang bậc khác (từ trạng thái này sang trạng thái khác của nền kinh tế).

Cơm. 1. Tỷ lệ giữa mức độ ảnh hưởng của yếu tố và sự lan truyền trong nhóm: a - mức độ ảnh hưởng đáng kể của yếu tố; b - ảnh hưởng không đáng kể của yếu tố

Nhóm thang điểm của một yếu tố chỉ là một trường hợp đặc biệt, ngoài ra, một yếu tố có thể có các thang điểm được trình bày ngay cả trong một thang danh nghĩa. Do đó, họ thường không nói về sự phân cấp của một yếu tố, mà là về các điều kiện khác nhau của hoạt động của nó.

Bây giờ chúng ta hãy xem xét ý tưởng phân tích phương sai, dựa trên quy tắc cộng phương sai: tổng phương sai bằng tổng của giữa các nhóm và trung bình của các phương sai trong nhóm:

Tổng phương sai phát sinh do ảnh hưởng của tất cả các yếu tố

Sự phân tán giữa các nhóm do ảnh hưởng của tất cả các yếu tố khác;

Phương sai trung bình trong nhóm do ảnh hưởng của thuộc tính nhóm gây ra.

Ảnh hưởng của đặc điểm được nhóm lại có thể nhìn thấy rõ ràng trong Hình 1a, vì ảnh hưởng của yếu tố là đáng kể so với sự lan truyền trong nhóm, do đó, phương sai giữa các nhóm sẽ lớn hơn trong một nhóm ( > ), và trong Hình. 1, b, bức tranh ngược lại được quan sát: ở đây sự lan truyền trong nhóm chiếm ưu thế và ảnh hưởng của yếu tố thực tế không có.

Việc phân tích phương sai được xây dựng trên cùng một nguyên tắc, chỉ là nó không sử dụng phương sai, mà là giá trị trung bình của các độ lệch bình phương ( , , ), là các ước tính không chệch của các phương sai tương ứng. Chúng thu được bằng cách chia tổng các độ lệch bình phương cho số bậc tự do tương ứng

Uẩn như một toàn thể;

Giá trị trung bình trong nhóm;

Trung bình giữa các nhóm;

Trung bình chung cho tất cả các phép đo (cho tất cả các nhóm);

Trung bình nhóm cho phân loại thứ j của yếu tố.

Kỳ vọng toán học đối với tổng độ lệch bình phương trong nhóm và giữa các nhóm tương ứng được tính bằng công thức: (Mô hình yếu tố cố định),

E ( ) = E ( ) = , thì giả thuyết vô hiệu H0 về việc không có sự khác biệt giữa các phương tiện được xác nhận, do đó, yếu tố đang nghiên cứu không có ảnh hưởng đáng kể (xem Hình 1, b). Nếu giá trị thực tế của F-test F = E ( ) / E ( ) sẽ lớn hơn mức quan trọng thì giả thuyết vô hiệu H0 ở mức ý nghĩa , giả thuyết thay thế H1 bị bác bỏ và được chấp nhận - về tác động đáng kể của hình nhân tố. 1, a. .

Phân tích phương sai một chiều

Phân tích phương sai chỉ xem xét một biến được gọi là ANOVA Một chiều.

Có một nhóm n đối tượng quan sát với các giá trị đo được của một số biến đang được nghiên cứu . mỗi biến bị ảnh hưởng bởi một số yếu tố chất lượng Với một số các mức độ (sự phân cấp) của tác động. Các giá trị biến đo lường ở các cấp độ khác nhau của yếu tố được đưa ra trong Bảng 2 (chúng cũng có thể được trình bày dưới dạng ma trận).

Ban 2.

Dạng bảng xác định dữ liệu ban đầu để phân tích đơn biến

Số đối tượng quan sát () Các giá trị biến đổi ở cấp độ (phân cấp) của yếu tố (thấp nhất) (ngắn)… (cao nhất) 1 2… n … .Ở đây, mỗi cấp có thể chứa một số lượng phản hồi khác nhau được đo lường ở một cấp của yếu tố, sau đó mỗi cột sẽ có giá trị riêng của nó . Cần đánh giá mức độ ảnh hưởng của nhân tố này đến biến số đang nghiên cứu. Để giải quyết vấn đề này, có thể sử dụng mô hình phân tích phương sai một nhân tố. Mô hình phân tán một yếu tố.

Giá trị của biến đang nghiên cứu đối với đối tượng quan sát thứ-tại -cấp độ thứ của yếu tố;

Nhóm trung bình cho -cấp độ thứ của yếu tố;

Hiệu quả do ảnh hưởng của mức -th của yếu tố;

Thành phần ngẫu nhiên, hoặc nhiễu loạn do ảnh hưởng của các yếu tố không kiểm soát được. Vì vậy, hãy làm nổi bật những hạn chế chính của việc sử dụng ANOVA:

Bằng không của kỳ vọng toán học của một thành phần ngẫu nhiên: = 0.

Thành phần ngẫu nhiên , và do đó cũng có phân phối chuẩn.

Số bậc của các yếu tố phải ít nhất là ba.

Mô hình này, tùy thuộc vào các mức của yếu tố, sử dụng kiểm định F-của Fisher, cho phép bạn kiểm tra một trong các giả thuyết rỗng.

Khi thực hiện phân tích phương sai cho các mẫu liên quan, có thể kiểm định thêm một giả thuyết rỗng H0 (u) - sự khác biệt riêng lẻ giữa các đối tượng quan sát được thể hiện không nhiều hơn sự khác biệt do nguyên nhân ngẫu nhiên.

Phân tích phương sai một chiều

(Triển khai thực tế trong Thống kê SPSS của IBM 20)

Nhà nghiên cứu quan tâm đến câu hỏi làm thế nào một thuộc tính nhất định thay đổi trong các điều kiện khác nhau của hành động của một biến (yếu tố). Ảnh hưởng của chỉ một biến số (nhân tố) đến tính trạng đang nghiên cứu được nghiên cứu. Chúng tôi đã xem xét một ví dụ từ kinh tế học; bây giờ chúng tôi sẽ đưa ra một ví dụ từ tâm lý học, ví dụ, thời gian để giải quyết một vấn đề thay đổi như thế nào trong các điều kiện động cơ khác nhau của các đối tượng (động lực thấp, trung bình, cao) hoặc với các cách khác nhau trình bày nhiệm vụ (bằng miệng, bằng văn bản hoặc dưới dạng văn bản với đồ thị và hình ảnh minh họa), trong các điều kiện làm việc với nhiệm vụ khác nhau (một mình, trong phòng với giáo viên, trong lớp học). Trong trường hợp đầu tiên, yếu tố là động lực, trong trường hợp thứ hai - mức độ hiển thị, trong trường hợp thứ ba - yếu tố công khai.

Trong phiên bản của phương pháp này, các mẫu đối tượng khác nhau được tiếp xúc với ảnh hưởng của từng cấp độ. Phải có ít nhất ba bậc của yếu tố.

Ví dụ 1. Ba nhóm sáu đối tượng khác nhau được đưa ra danh sách mười từ. Các từ được trình bày cho nhóm đầu tiên với tốc độ thấp là 1 từ trên 5 giây, cho nhóm thứ hai với tốc độ trung bình là 1 từ trên 2 giây và cho nhóm thứ ba với tốc độ cao là 1 từ trên giây. Người ta dự đoán rằng hiệu suất tái tạo sẽ phụ thuộc vào tốc độ trình bày các từ (Bảng 3).

bàn số 3

Số lượng từ được sao chép

Chủ đề Nhóm 1 tốc độ thấp Nhóm 2 tốc độ trung bình Nhóm 3 tốc độ cao

Chúng tôi đưa ra giả thuyết: sự khác biệt về khối lượng tái tạo từ giữa các nhóm không rõ rệt hơn sự khác biệt ngẫu nhiên trong mỗi nhóm: Sự khác biệt về khối lượng tái tạo từ giữa các nhóm rõ rệt hơn sự khác biệt ngẫu nhiên trong mỗi nhóm.

Chúng tôi sẽ thực hiện giải pháp trong môi trường SPSS theo thuật toán sau

Hãy chạy chương trình SPSS

Nhập các giá trị số vào cửa sổ dữ liệu

Cơm. 1. Nhập giá trị trong SPSS

Trong cửa sổ Biến chúng tôi mô tả tất cả dữ liệu ban đầu, theo điều kiện

Nhiệm vụ

Hình 2 Cửa sổ biến

Để rõ ràng, trong cột nhãn, chúng tôi mô tả tên của các bảng

Trong đồ thị Giá trị mô tả số lượng của mỗi nhóm

Hình 3 Nhãn giá trị

Tất cả điều này được thực hiện để rõ ràng, tức là những cài đặt này có thể bị bỏ qua.

Trong đồ thị tỉ lệ , trong cột thứ hai, bạn cần đặt giá trị của danh nghĩa

Trong cửa sổ dữ liệu đặt hàng phân tích phương sai một chiều bằng cách sử dụng menu "Phân tích" So sánh trung bình

Phân tích phương sai một chiều…

Hình 4 Hàm ANOVA một chiều

Trong hộp thoại đã mở Phân tích phương sai một chiều chọn biến phụ thuộc và thêm nó vào danh sách những người phụ thuộc và yếu tố thay đổi trong yếu tố cửa sổ

Hình 5 làm nổi bật danh sách những người phụ thuộc và yếu tố

Thiết lập một số tham số để xuất dữ liệu chất lượng cao

Hình 6 Các thông số để suy luận dữ liệu định tính

Các phép tính cho thuật toán ANOVA một chiều đã chọn bắt đầu sau khi nhấp vào ĐƯỢC RỒI

Khi kết thúc phép tính, kết quả của phép tính được hiển thị trong cửa sổ xem.

Thống kê mô tảGroup NAverage Std. Độ lệch Std. Khoảng tin cậy lỗi 95% cho Trung bình Tối thiểu Tối đa Bảng 2. Thống kê mô tả

Bảng Thống kê mô tả hiển thị các chỉ số chính về tốc độ trong các nhóm và tổng giá trị của chúng.

Số lượng quan sát trong mỗi nhóm và tổng số

Mean - trung bình cộng của các quan sát trong mỗi nhóm và cho tất cả các nhóm cùng nhau

Std. Độ lệch, Std. Lỗi - độ lệch chuẩn và độ lệch chuẩn

% khoảng tin cậy cho giá trị trung bình - các khoảng này chính xác hơn cho từng nhóm và cho tất cả các nhóm cùng nhau, thay vì lấy các khoảng dưới hoặc trên các giới hạn này.

Tối thiểu, Tối đa - giá trị tối thiểu và tối đa cho mỗi nhóm mà các đối tượng đã nghe

phương sai đơn yếu tố ngẫu nhiên

Tiêu chí cho tính đồng nhất của nhóm phương sai Thống kê Livinast.st.1st.st.

Kiểm tra tính đồng nhất của Livin được sử dụng để kiểm tra độ phân tán về tính đồng nhất (đồng nhất). Trong trường hợp này, nó xác nhận sự khác biệt giữa các phương sai là không đáng kể, vì giá trị = 0,915, tức là, rõ ràng là lớn hơn 0,05. Do đó, kết quả thu được bằng cách phân tích phương sai được công nhận là đúng.

Bảng phân tích phương sai 1 chiều cho thấy kết quả của DA 1 chiều

Tổng bình phương "giữa các nhóm" là tổng bình phương của sự khác biệt giữa giá trị trung bình tổng thể và phương tiện trong mỗi nhóm, được tính theo số lượng đối tượng trong nhóm

"Trong các nhóm" là tổng của sự khác biệt bình phương giữa giá trị trung bình của mỗi nhóm và mỗi giá trị của nhóm đó

Cột "St. St." chứa số bậc tự do V:

Intergroup (v = số lượng nhóm - 1);

Intragroup (v = số đối tượng - số nhóm - 1);

"bình phương trung bình" chứa tỷ lệ giữa tổng bình phương với số bậc tự do.

Cột "F" hiển thị tỷ lệ bình phương trung bình giữa các nhóm với bình phương trung bình trong các nhóm.

Cột "giá trị" chứa giá trị xác suất mà các khác biệt quan sát được là ngẫu nhiên.

Bảng 4 Công thức

Đồ thị trung bình

Biểu đồ cho thấy nó đang giảm. Cũng có thể xác định từ bảng Fk k1 = 2, k2 = 15 giá trị thống kê dạng bảng là 3,68. Theo quy tắc, nếu , thì giả thuyết vô hiệu được chấp nhận, nếu không thì giả thuyết thay thế được chấp nhận. Ví dụ của chúng tôi (7,45> 3,68), do đó giả thuyết thay thế được chấp nhận. Như vậy, quay trở lại điều kiện của bài toán, chúng ta có thể kết luận giả thuyết vô hiệu bị từ chối và một giải pháp thay thế được chấp nhận. : sự khác biệt về lượng từ giữa các nhóm rõ ràng hơn so với sự khác biệt ngẫu nhiên trong mỗi nhóm ). Điều đó. tốc độ trình bày của các từ ảnh hưởng đến khối lượng tái tạo của chúng.

Phân tích phương sai một chiều

(Thực tế triển khai trong Microsoft Office 2013)

Trong cùng một ví dụ, hãy xem xét phân tích phương sai một chiều trong Microsoft Office 2013

Giải quyết sự cố trong Microsoft Excel

Hãy mở Microsoft Excel.

Hình 1. Ghi dữ liệu vào Excel

Hãy chuyển đổi dữ liệu thành định dạng số. Để làm điều này, trên tab chính có một mục Sự sắp xếp và nó có một đoạn con Định dạng ô . Cửa sổ Định dạng Ô xuất hiện trên màn hình. Cơm. 2 Chọn Định dạng số và dữ liệu đã nhập sẽ được chuyển đổi. Như trong hình 3

Hình 2 Chuyển đổi sang định dạng số

Hình 3 Kết quả sau khi chuyển đổi

Trên tab dữ liệu có một mục phân tích dữ liệu hãy nhấp vào nó.

Hãy chọn Phân tích phương sai một chiều

Hình 6 Phân tích dữ liệu

Cửa sổ phân tích phương sai một chiều sẽ xuất hiện trên màn hình để tiến hành phân tích phân tán dữ liệu (Hình 7). Hãy cấu hình các thông số

Cơm. 7 Cài đặt các tham số cho phân tích đơn biến

Bấm chuột vào trường Khoảng thời gian đầu vào. Chọn phạm vi ô B2 :: F9, dữ liệu mà bạn muốn phân tích. Trong trường Khoảng cách đầu vào của nhóm điều khiển Đầu vào, phạm vi được chỉ định sẽ xuất hiện.

Nếu chuyển đổi từng hàng không được đặt trong nhóm Điều khiển dữ liệu đầu vào, hãy chọn nó để chương trình Excel chấp nhận các nhóm dữ liệu theo hàng.

Tùy chọn Chọn hộp kiểm Nhãn ở Hàng đầu tiên trong nhóm điều khiển Đầu vào nếu cột đầu tiên của phạm vi dữ liệu đã chọn chứa tên hàng.

Theo mặc định, trong trường đầu vào Alpha của nhóm điều khiển Dữ liệu đầu vào, giá trị 0,05 được hiển thị, giá trị này được kết hợp với xác suất lỗi trong phân tích phương sai.

Nếu công tắc khoảng thời gian đầu ra không được đặt trong nhóm điều khiển Tham số đầu ra, thì hãy đặt nó hoặc chọn công tắc trang tính mới để dữ liệu được chuyển sang trang tính mới.

Nhấp vào nút OK để đóng cửa sổ ANOVA Một chiều. Kết quả phân tích phương sai sẽ xuất hiện (Hình 8).

Hình 8 Đầu ra dữ liệu

Trong phạm vi ô A4: E7 là kết quả thống kê mô tả. Dòng 4 chứa tên của các tham số, dòng 5 - 7 - giá trị thống kê tính theo lô. Trong cột "Tài khoản" là số lần đo, trong cột "Tổng" - tổng các giá trị, trong cột "Trung bình" - trung bình giá trị số học, trong cột "Dispersion" - sự phân tán.

Kết quả thu được cho thấy tải trọng kéo đứt trung bình cao nhất ở lô số 1 và tải trọng kéo đứt phân tán lớn nhất ở lô số 2, số 1.

Phạm vi ô A10: G15 hiển thị thông tin về tầm quan trọng của sự khác biệt giữa các nhóm dữ liệu. Dòng 11 chứa tên của phép phân tích các tham số phương sai, dòng 12 - kết quả xử lý giữa các nhóm, dòng 13 - kết quả xử lý trong nhóm và dòng 15 - tổng giá trị của hai dòng này.

Cột SS chứa các giá trị biến thể, tức là tổng bình phương trên tất cả các độ lệch. Sự biến đổi, như sự phân tán, đặc trưng cho sự lan truyền của dữ liệu.

Cột df chứa các giá trị của số bậc tự do. Những con số này cho biết số lượng các độ lệch độc lập mà phương sai sẽ được tính toán. Ví dụ, số bậc tự do giữa các nhóm bằng hiệu giữa số nhóm dữ liệu và một. Thế nào số lượng nhiều hơn bậc tự do thì độ tin cậy của các tham số phân tán càng cao. Dữ liệu bậc tự do trong bảng cho thấy kết quả trong nhóm đáng tin cậy hơn so với các tham số giữa nhóm.

Cột MS chứa các giá trị phân tán, được xác định bằng tỷ số biến thiên và số bậc tự do. Độ phân tán đặc trưng cho mức độ phân tán của dữ liệu, nhưng không giống như độ lớn của sự biến thiên, nó không có xu hướng trực tiếp tăng lên khi số bậc tự do tăng lên. Bảng cho thấy phương sai giữa các nhóm lớn hơn nhiều so với phương sai trong nhóm.

Cột F chứa giá trị của thống kê F, được tính bằng tỷ lệ của phương sai giữa các nhóm và trong nhóm.

Cột tới hạn F chứa giá trị tới hạn F được tính từ số bậc tự do và giá trị của Alpha. Thống kê F và giá trị tới hạn F sử dụng phép thử Fisher-Snedekor.

Nếu thống kê F lớn hơn giá trị tới hạn F, thì có thể lập luận rằng sự khác biệt giữa các nhóm dữ liệu không phải là ngẫu nhiên. những thứ kia. ở mức độ quan trọng α = 0 .05 (với độ tin cậy 0,95), giả thuyết vô hiệu bị bác bỏ và phương án thay thế được chấp nhận: rằng tốc độ trình bày của các từ ảnh hưởng đến khối lượng tái tạo của chúng. Cột giá trị P chứa xác suất sự khác biệt giữa các nhóm là ngẫu nhiên. Vì xác suất này rất nhỏ trong bảng, độ lệch giữa các nhóm không phải là ngẫu nhiên.

So sánh IBM SPSS Statistics 20 và Microsoft Office 2013

chương trình ngẫu nhiên phương sai một yếu tố

Hãy xem kết quả đầu ra của các chương trình, chúng ta sẽ xem lại ảnh chụp màn hình.

Phân tích một chiều của nhóm phương sai Tổng bình phương St.Lm Hình vuông trung bình FZn giữa các nhóm31.444215.7227.447.006 Trong các nhóm31.667152.111 Tổng số63.11117

Do đó, chương trình IBM SPSS Statistics 20 tạo ra điểm số tốt hơn, có thể làm tròn số, xây dựng đồ thị trực quan(cm. Giải pháp hoàn chỉnh) mà bạn có thể xác định câu trả lời, nó mô tả chi tiết hơn cả các điều kiện của vấn đề và giải pháp của chúng. Tất nhiên, Microsoft Office 2013 có những ưu điểm của nó, trước hết là sự phổ biến của nó, vì Microsoft Office 2013 được cài đặt trong hầu hết mọi máy tính, nó hiển thị Fcritical, không được cung cấp trong SPSS Statistics, và nó cũng đơn giản và thuận tiện để tính toán ở đó. Tuy nhiên, cả hai chương trình này đều rất phù hợp để giải quyết các vấn đề về phân tích phương sai một chiều, mỗi chương trình đều có ưu và nhược điểm của nó, nhưng nếu bạn tính nhiệm vụ lớn với nhiều điều kiện hơn sẽ đề xuất Thống kê SPSS.

Sự kết luận

Phân tích phương sai được áp dụng trong mọi lĩnh vực nghiên cứu khoa học, nơi cần phân tích ảnh hưởng các yếu tố khác nhau vào biến đang nghiên cứu. TẠI thế giới hiện đại Có nhiều nhiệm vụ để phân tích phương sai đơn nhân tố trong kinh tế học, tâm lý học và sinh học. Theo kết quả của việc học tài liệu lý thuyết người ta thấy rằng cơ sở của việc phân tích phương sai là định lý về phép cộng các phương sai, từ nhiều gói phần mềm trong đó bộ máy phân tích phương sai được thực hiện, những phần mềm tốt nhất đã được chọn và đưa vào công việc. Nhờ sự ra đời của công nghệ mới, mỗi chúng ta có thể tiến hành nghiên cứu (giải pháp), đồng thời tốn ít thời gian và công sức hơn cho việc tính toán, sử dụng máy tính. Trong quá trình làm việc, các mục tiêu đã được đặt ra, các nhiệm vụ đã đạt được.

danh sách văn học

Sidorenko, E.V. Phương pháp xử lý toán học trong tâm lý học [Văn bản] / St.Petersburg. 2011. - 256 tr.

Thống kê toán học cho nhà tâm lý học Ermolaev O.Yu [Text] / Moscow_2009 -336s

Bài giảng 7. Thống kê giải tích [ Tài nguyên điện tử]. , Ngày truy cập: 14/05/14

Lý thuyết xác suất và thống kê toán học [Văn bản] / Gmurman V.E 2010 -479s