Phương pháp nghiên cứu phân tích tương quan độ phân tán. PHƯƠNG PHÁP ANOVA

Phân tích phương sai

Phân tích phương sai- đây là một phân tích về sự biến đổi của một tính trạng dưới ảnh hưởng của bất kỳ yếu tố biến kiểm soát nào. Trong tài liệu nước ngoài, phân tích phương sai thường được gọi là ANOVA, tạm dịch là phân tích phương sai (Analysis of Variance).

Nhiệm vụ của phân tích phương sai bao gồm việc cô lập sự biến đổi của một loại khác với sự biến đổi chung của tính trạng:

a) sự thay đổi do tác động của từng biến độc lập được nghiên cứu;

b) sự thay đổi do tương tác của các biến độc lập được nghiên cứu;

c) biến thiên ngẫu nhiên do tất cả các biến khác chưa biết.

Độ biến thiên do hoạt động của các biến được nghiên cứu và sự tương tác của chúng tương quan với độ biến thiên ngẫu nhiên. Một chỉ báo của tỷ lệ này là kiểm định F của Fisher.

Công thức tính tiêu chí F bao gồm các ước lượng về phương sai, nghĩa là, các tham số phân phối của một dấu hiệu, do đó tiêu chí F là một tiêu chí tham số.

Hơn trong hơn sự biến đổi của một tính trạng là do các biến (nhân tố) được nghiên cứu hoặc sự tương tác của chúng, càng cao các giá trị thực nghiệm của tiêu chí.

Số không giả thuyết trong phân tích phương sai sẽ nói rằng các giá trị trung bình của đặc điểm hiệu quả được nghiên cứu ở tất cả các cấp là như nhau.

Thay thế giả thuyết sẽ nói rằng các giá trị trung bình của thuộc tính hiệu quả trong các bậc khác nhau của nhân tố được nghiên cứu là khác nhau.

Phân tích phương sai cho phép chúng ta chỉ ra sự thay đổi của một đặc điểm, nhưng không chỉ ra chiều hướng những thay đổi này.

Hãy bắt đầu phân tích phương sai với trường hợp đơn giản nhất, khi chúng ta nghiên cứu hành động của chỉ một biến (nhân tố đơn).

2. Phân tích phương sai một chiều cho các mẫu không liên quan

2.1. Mục đích của phương pháp

Phương pháp phân tích phương sai đơn biến được sử dụng trong trường hợp các thay đổi trong thuộc tính hiệu quả được nghiên cứu dưới ảnh hưởng của các điều kiện thay đổi hoặc sự phân cấp của bất kỳ yếu tố nào. Trong phiên bản của phương pháp này, ảnh hưởng của từng bậc của yếu tố là đa dạng mẫu đề kiểm tra. Phải có ít nhất ba bậc của yếu tố. (Có thể có hai cách phân cấp, nhưng trong trường hợp này chúng ta sẽ không thể thiết lập các phụ thuộc phi tuyến và có vẻ hợp lý hơn khi sử dụng các phụ thuộc đơn giản hơn).

Một biến thể không tham số của loại phân tích này là phép thử Kruskal-Wallis H.

Giả thuyết

H 0: Sự khác biệt giữa các cấp nhân tố (các điều kiện khác nhau) không rõ rệt hơn sự khác biệt ngẫu nhiên trong mỗi nhóm.

H 1: Sự khác biệt giữa các bậc nhân tố (các điều kiện khác nhau) rõ ràng hơn sự khác biệt ngẫu nhiên trong mỗi nhóm.

2.2. Hạn chế của phân tích phương sai đơn biến đối với các mẫu không liên quan

1. Phân tích đơn biến của phương sai yêu cầu ít nhất ba bậc của nhân tử và ít nhất hai môn học trong mỗi bậc.

2. Tính trạng kết quả phải được phân bố bình thường trong mẫu nghiên cứu.

Đúng, nó thường không được chỉ ra là chúng ta đang nói về sự phân bố của một đặc điểm trong toàn bộ mẫu được khảo sát hay ở một phần của nó tạo nên phức hợp phân tán.

3. Một ví dụ về giải bài toán bằng phương pháp phân tích phương sai một nhân tố cho các mẫu không liên quan bằng cách sử dụng ví dụ:

Ba nhóm sáu đối tượng khác nhau nhận được danh sách mười từ. Các từ được trình bày cho nhóm đầu tiên với tốc độ thấp là 1 từ trên 5 giây, cho nhóm thứ hai với tốc độ trung bình là 1 từ trên 2 giây và cho nhóm thứ ba với tốc độ cao là 1 từ trên giây. Hiệu suất sao chép được dự đoán phụ thuộc vào tốc độ trình bày từ. Kết quả được trình bày trong Bảng. một.

Số lượng từ được sao chép Bảng 1

số môn học	tốc độ thấp	tốc độ trung bình	tốc độ cao








tổng cộng

H 0: Sự khác biệt về khối lượng từ ở giữa các nhóm không rõ rệt hơn sự khác biệt ngẫu nhiên phía trong mỗi nhóm.

H1: Sự khác biệt về khối lượng từ ở giữa các nhóm rõ ràng hơn sự khác biệt ngẫu nhiên phía trong mỗi nhóm. Sử dụng các giá trị thực nghiệm được trình bày trong Bảng. 1, chúng tôi sẽ thiết lập một số giá trị cần thiết để tính tiêu chí F.

Việc tính toán các đại lượng chính để phân tích phương sai một chiều được trình bày trong bảng:

ban 2

bàn số 3

Trình tự hoạt động trong ANOVA một chiều cho các mẫu bị ngắt kết nối

Thường được sử dụng trong bảng này và các bảng tiếp theo, ký hiệu SS là từ viết tắt của "tổng các bình phương". Chữ viết tắt này thường được sử dụng nhất trong các nguồn đã dịch.

SS thực tế có nghĩa là sự biến đổi của tính trạng, do tác động của yếu tố được nghiên cứu;

SS phổ thông- sự biến đổi chung của tính trạng;

S CA- sự thay đổi do không tính đến các yếu tố, sự thay đổi "ngẫu nhiên" hoặc "phần dư".

CÔ - "hình vuông ở giữa", hoặc giá trị trung bình của tổng bình phương, giá trị trung bình của SS tương ứng.

df - số bậc tự do, khi xem xét các tiêu chí phi tham số, chúng tôi ký hiệu bằng chữ cái Hy Lạp v.

Kết luận: H 0 bị loại. H 1 được chấp nhận. Sự khác biệt về khối lượng tái tạo từ giữa các nhóm rõ rệt hơn sự khác biệt ngẫu nhiên trong mỗi nhóm (α = 0,05). Vì vậy, tốc độ trình bày của các từ ảnh hưởng đến khối lượng tái tạo của chúng.

Dưới đây là một ví dụ về cách giải quyết vấn đề trong Excel:

Dữ liệu ban đầu:

Sử dụng lệnh: Công cụ-> Phân tích dữ liệu-> Phân tích phương sai một chiều, ta nhận được kết quả sau:

Các phương pháp xác minh đã thảo luận ở trên giả thuyết thống kê về tầm quan trọng của sự khác biệt giữa hai giá trị trung bình trong thực tế được sử dụng hạn chế. Điều này là do thực tế là để xác định ảnh hưởng của tất cả các điều kiện và yếu tố có thể có đối với một thuộc tính sản xuất, lĩnh vực và thí nghiệm trong phòng thí nghiệm, như một quy luật, được thực hiện không sử dụng hai, mà là số lượng mẫu lớn hơn (1220 hoặc nhiều hơn).

Thông thường các nhà nghiên cứu so sánh phương tiện của một số mẫu được kết hợp trong phức hợp đơn. Ví dụ, nghiên cứu hiệu ứng các loại và liều lượng phân bón đối với năng suất cây trồng, các thí nghiệm được lặp lại trong các lựa chọn khác nhau. Trong những trường hợp này, việc so sánh theo từng cặp trở nên phức tạp và việc phân tích thống kê của toàn bộ phức hợp đòi hỏi phải sử dụng một phương pháp đặc biệt. Phương pháp này, được phát triển trong thống kê toán học, được gọi là phân tích phương sai. Nó được sử dụng lần đầu tiên bởi nhà thống kê người Anh R. Fisher khi xử lý kết quả của các thí nghiệm nông học (1938).

Phân tích phương sai là một phương pháp đánh giá thống kêđộ tin cậy của biểu hiện của sự phụ thuộc của tính năng hiệu quả vào một hoặc nhiều yếu tố. Sử dụng phương pháp phân tích phương sai, các giả thuyết thống kê được kiểm định về giá trị trung bình trong một số quần thể chung có phân phối chuẩn.

Phân tích phương sai là một trong những phương pháp thống kê đánh giá kết quả của một thử nghiệm. Nó cũng ngày càng được sử dụng nhiều hơn trong việc phân tích thông tin kinh tế. Việc phân tích phương sai giúp thiết lập các chỉ số chọn lọc về mối quan hệ giữa dấu hiệu hiệu quả và dấu hiệu nhân tố đủ để phổ biến dữ liệu thu được từ mẫu đến tổng thể chung. Ưu điểm của phương pháp này là nó cho kết luận khá đáng tin cậy từ các mẫu nhỏ.

Bằng cách kiểm tra sự biến đổi của thuộc tính kết quả dưới tác động của một hoặc nhiều yếu tố, sử dụng phân tích phương sai, người ta có thể thu được, ngoài các ước tính chung về ý nghĩa của các yếu tố phụ thuộc, còn có một đánh giá về sự khác biệt trong các giá trị trung bình được hình thành ở các mức độ khác nhau của các yếu tố, và tầm quan trọng của sự tương tác của các yếu tố. Phân tích phương sai được sử dụng để nghiên cứu sự phụ thuộc của cả định lượng và tính năng định tính, cũng như sự kết hợp của chúng.

Bản chất của phương pháp này là nghiên cứu thống kê xác suất ảnh hưởng của một hoặc nhiều yếu tố, cũng như sự tương tác của chúng đối với tính năng hiệu quả. Theo đó, với sự trợ giúp của phân tích phân tán, ba nhiệm vụ chính được giải quyết: 1) Tổng điểmý nghĩa của sự khác biệt giữa các phương tiện nhóm; 2) đánh giá xác suất tương tác của các yếu tố; 3) đánh giá ý nghĩa của sự khác biệt giữa các cặp phương tiện. Thông thường, các nhà nghiên cứu phải giải quyết những vấn đề như vậy khi tiến hành các thí nghiệm thực địa và kỹ thuật động vật, khi nghiên cứu ảnh hưởng của một số yếu tố đến tính trạng kết quả.

Sơ đồ nguyên tắc của phân tích phân tán bao gồm việc thiết lập các nguồn biến đổi chính của đặc tính hữu hiệu và xác định khối lượng biến thiên (tổng các độ lệch bình phương) bởi các nguồn hình thành của nó; xác định số bậc tự do ứng với các thành phần của tổng biến thiên; tính toán phương sai là tỷ số giữa các thể tích biến thiên tương ứng với số bậc tự do của chúng; phân tích mối quan hệ giữa các độ phân tán; đánh giá độ tin cậy của sự khác biệt giữa các giá trị trung bình và việc xây dựng các kết luận.

Lược đồ này được bảo toàn cả trong các mô hình ANOVA đơn giản, khi dữ liệu được nhóm theo một thuộc tính và trong các mô hình phức tạp, khi dữ liệu được nhóm theo hai và một số lượng lớn dấu hiệu. Tuy nhiên, với sự gia tăng số lượng các đặc trưng của nhóm, quá trình phân hủy của sự biến đổi chung theo các nguồn hình thành của nó trở nên phức tạp hơn.

Dựa theo sơ đồ mạch phân tích phương sai có thể được biểu diễn thành năm bước liên tiếp:

1) định nghĩa và phân tích sự biến đổi;

2) xác định số bậc tự do biến thiên;

3) tính toán độ phân tán và tỷ lệ của chúng;

4) phân tích độ phân tán và tỷ lệ của chúng;

5) đánh giá độ tin cậy của sự khác biệt giữa các phương tiện và việc xây dựng các kết luận về việc kiểm định giả thuyết vô hiệu.

Phần tốn nhiều thời gian nhất của việc phân tích phương sai là giai đoạn đầu tiên - định nghĩa và phân tách sự biến thiên theo các nguồn hình thành của nó. Thứ tự khai triển của tổng thể tích biến thiên đã được thảo luận chi tiết trong Chương 5.

Cơ sở để giải các bài toán về phân tích phân tán là quy luật khai triển (cộng) biến thiên, theo đó biến thể chung(biến động) của thuộc tính hữu hiệu được chia thành hai: biến động do tác động của yếu tố (các yếu tố) được nghiên cứu, và biến động do tác động của các nguyên nhân ngẫu nhiên, nghĩa là

Giả sử rằng dân số đang được nghiên cứu được chia theo một thuộc tính nhân tố thành nhiều nhóm, mỗi nhóm có đặc điểm riêng trung bình dấu hiệu hiệu quả. Đồng thời, sự thay đổi của các giá trị này có thể được giải thích bởi hai loại lý do: những lý do hoạt động một cách có hệ thống trên tính năng hiệu quả và có thể điều chỉnh được trong quá trình thử nghiệm và những lý do không thể điều chỉnh. Rõ ràng là sự biến đổi giữa các nhóm (giai thừa hoặc hệ thống) phụ thuộc chủ yếu vào hoạt động của yếu tố được nghiên cứu và trong nhóm (phần dư hoặc ngẫu nhiên) - vào hoạt động của các yếu tố ngẫu nhiên.

Để đánh giá tầm quan trọng của sự khác biệt giữa các phương tiện nhóm, cần phải xác định sự khác biệt giữa các nhóm và trong nhóm. Nếu sự biến đổi giữa các nhóm (giai thừa) vượt quá đáng kể sự biến đổi trong nhóm (phần dư), thì yếu tố ảnh hưởng đến đặc điểm kết quả, làm thay đổi đáng kể giá trị của các giá trị trung bình của nhóm. Nhưng câu hỏi đặt ra là, tỷ lệ giữa các biến thể giữa các nhóm và trong nhóm là bao nhiêu có thể được coi là đủ cho kết luận về độ tin cậy (ý nghĩa) của các khác biệt giữa các nhóm.

Để đánh giá ý nghĩa của sự khác biệt giữa các phương tiện và đưa ra kết luận về việc kiểm định giả thuyết vô hiệu (H0: x1 = x2 = ... = xn), việc phân tích phương sai sử dụng một loại tiêu chuẩn - tiêu chí G, luật phân phối của được thành lập bởi R. Fisher. Tiêu chí này là tỷ số của hai phương sai: giai thừa, được tạo ra bởi hoạt động của nhân tố đang nghiên cứu và phần dư, do tác động của các nguyên nhân ngẫu nhiên:

Tỷ lệ phân tán r = t> u : £ * 2 do nhà thống kê người Mỹ Snedecor đề xuất được ký hiệu bằng chữ G để vinh danh người phát minh ra phép phân tích phương sai R. Fisher.

Phương sai của ° 2 và io2 là ước tính của phương sai dân số. Nếu các mẫu có phương sai ° 2 ° 2 được lấy từ cùng một tổng thể chung, trong đó sự thay đổi về giá trị có nhân vật ngẫu nhiên, thì sự khác biệt về các giá trị của ° 2 ° 2 cũng là ngẫu nhiên.

Nếu thử nghiệm kiểm tra mức độ ảnh hưởng của một số yếu tố (A, B, C, v.v.) đến tính năng hiệu quả cùng một lúc, thì mức độ phân tán do tác động của từng yếu tố đó sẽ có thể so sánh với ° vdP, I E

Nếu giá trị của phương sai nhân tố lớn hơn đáng kể so với phần dư thì nhân tố đó ảnh hưởng đáng kể đến thuộc tính kết quả và ngược lại.

Trong các thí nghiệm đa nhân tố, ngoài sự biến thiên do tác động của từng yếu tố, hầu như luôn có sự thay đổi do tương tác của các yếu tố ($ av: ^ ls ^ ss $ liіs). Bản chất của sự tương tác là ảnh hưởng của một yếu tố thay đổi đáng kể đến các cấp độ khác nhau thứ hai (ví dụ, hiệu quả của chất lượng đất ở các liều lượng phân bón khác nhau).

Tương tác của các yếu tố cũng cần được đánh giá bằng cách so sánh các phương sai tương ứng 3 ^ w.gr:

Khi tính toán giá trị thực tế của tiêu chí B, giá trị lớn nhất trong số các phương sai được lấy ở tử số, do đó B> 1. Rõ ràng là tiêu chí B càng lớn thì sự khác biệt đáng kể hơn giữa các lần phân tán. Nếu B = 1, thì câu hỏi đánh giá mức độ ý nghĩa của sự khác biệt trong phương sai sẽ bị loại bỏ.

Để xác định giới hạn của biến động ngẫu nhiên, tỷ lệ phương sai G. Fisher đã phát triển các bảng đặc biệt của phân phối B (Phụ lục 4 và 5). Tiêu chí B có liên quan về mặt chức năng với xác suất và phụ thuộc vào số bậc tự do biến thiên k1 và k2 của hai phương sai so sánh. Hai bảng thường được sử dụng để rút ra kết luận về giới hạn giá trị cao tiêu chí cho mức ý nghĩa 0,05 và 0,01. Mức ý nghĩa 0,05 (hoặc 5%) có nghĩa là chỉ có 5 trường hợp trong số 100 trường hợp tiêu chí B có thể nhận giá trị bằng hoặc cao hơn giá trị được chỉ ra trong bảng. Mức ý nghĩa giảm từ 0,05 đến 0,01 dẫn đến tăng giá trị của tiêu chí B giữa hai phương sai do tác động của các nguyên nhân ngẫu nhiên.

Giá trị của tiêu chí cũng phụ thuộc trực tiếp vào số bậc tự do của hai độ phân tán được so sánh. Nếu số bậc tự do có xu hướng đến vô cùng (k-me), thì tỷ số của sẽ cho hai phân tán có xu hướng thống nhất.

Giá trị dạng bảng của tiêu chí B cho thấy giá trị ngẫu nhiên có thể có của tỷ số giữa hai phương sai ở mức ý nghĩa nhất định và số bậc tự do tương ứng cho mỗi phương sai được so sánh. Trong các bảng này, giá trị của B được đưa ra cho các mẫu được tạo ra từ cùng một tổng thể chung, trong đó lý do thay đổi giá trị chỉ là ngẫu nhiên.

Giá trị của G được tìm thấy từ các bảng (Phụ lục 4 và 5) tại giao điểm của cột tương ứng (số bậc tự do đối với độ phân tán lớn hơn - k1) và hàng (số bậc tự do đối với độ phân tán nhỏ hơn - k2). Vì vậy, nếu phương sai lớn hơn (tử số G) k1 = 4 và phương sai nhỏ hơn (mẫu số G) k2 = 9, thì Ga ở mức ý nghĩa a = 0,05 sẽ là 3,63 (ứng dụng 4). Vì vậy, do tác động của các nguyên nhân ngẫu nhiên, vì các mẫu nhỏ nên phương sai của một mẫu, với mức ý nghĩa 5%, có thể vượt quá phương sai của mẫu thứ hai 3,63 lần. Với mức ý nghĩa giảm từ 0,05 xuống 0,01, giá trị dạng bảng của tiêu chí D, như đã nêu ở trên, sẽ tăng lên. Vì vậy, với cùng bậc tự do k1 = 4 và k2 = 9 và a = 0,01, giá trị dạng bảng của tiêu chí G sẽ là 6,99 (ứng dụng. 5).

Xem xét quy trình xác định số bậc tự do trong phân tích phương sai. Số bậc tự do, tương ứng với tổng các độ lệch bình phương, được phân tích thành các thành phần tương ứng tương tự như việc phân tích các tổng độ lệch bình phương. Tổng số bậc tự do (k ") được phân tích thành số bậc tự do cho các biến thể giữa nhóm (k1) và trong nhóm (k2).

Vì vậy nếu khung lấy mẫu, bao gồm N quan sát chia cho t nhóm (số tùy chọn thử nghiệm) và P nhóm con (số lần lặp lại), thì số bậc tự do k tương ứng sẽ là:

va cho tổng cộngđộ lệch bình phương (d7zar)

b) cho tổng các độ lệch bình phương giữa các nhóm ^ m.gP)

c) cho tổng các độ lệch bình phương trong nhóm trong w.gr)

Theo quy tắc cộng biến thiên:

Ví dụ: nếu bốn biến thể của thử nghiệm được hình thành trong thử nghiệm (m = 4) trong năm lần lặp lại mỗi lần (n = 5), và toàn bộ quan sát N = = t o p \ u003d 4 * 5 \ u003d 20, thì số bậc tự do tương ứng bằng:

Biết tổng các độ lệch bình phương của số bậc tự do, có thể xác định các ước lượng không chệch (đã điều chỉnh) cho ba phương sai:

Giả thuyết vô hiệu H0 theo tiêu chí B được kiểm định theo cách tương tự như kiểm định u của Student. Để đưa ra quyết định kiểm tra H0, cần tính giá trị thực của chỉ tiêu và so sánh với giá trị dạng bảng Ba để biết mức ý nghĩa được chấp nhận a và số bậc tự do. k1 và k2 cho hai độ phân tán.

Nếu Bfakg> Ba, thì theo mức ý nghĩa được chấp nhận, chúng ta có thể kết luận rằng sự khác biệt về phương sai mẫu không chỉ được xác định bởi các yếu tố ngẫu nhiên; chúng rất quan trọng. Trong trường hợp này, giả thuyết rỗng bị bác bỏ và có lý do để tin rằng yếu tố ảnh hưởng đáng kể đến thuộc tính kết quả. Nếu< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Việc sử dụng một hay một mô hình ANOVA khác phụ thuộc cả vào số lượng nhân tố được nghiên cứu và phương pháp chọn mẫu.

Tùy thuộc vào số lượng các yếu tố xác định sự thay đổi của tính năng hiệu quả, các mẫu có thể được hình thành bởi một, hai hoặc nhiều yếu tố. Theo phân tích phương sai này được chia thành đơn nhân tố và đa nhân tố. Nếu không, nó còn được gọi là phức phân tán đơn nhân tố và đa nhân tố.

Sơ đồ phân hủy của sự biến đổi chung phụ thuộc vào sự hình thành của các nhóm. Nó có thể là ngẫu nhiên (quan sát của một nhóm không liên quan đến quan sát của nhóm thứ hai) và không ngẫu nhiên (quan sát của hai mẫu được kết nối với nhau bởi các điều kiện chung của thí nghiệm). Theo đó, thu được các mẫu độc lập và phụ thuộc. Các mẫu độc lập có thể được tạo thành với cả số lượng bằng nhau và không đồng đều. Việc hình thành các mẫu phụ thuộc giả định số lượng bằng nhau của chúng.

Nếu các nhóm được hình thành theo một trật tự bất bạo động, thì tổng số lượng biến thể của đặc điểm kết quả bao gồm, cùng với giai thừa (giữa các nhóm) và biến thể còn lại, biến thể của các lần lặp lại, nghĩa là

Trong thực tế, trong hầu hết các trường hợp, cần phải xem xét các mẫu phụ thuộc khi các điều kiện của nhóm và phân nhóm được cân bằng. Có, trong kinh nghiệm thực tế toàn bộ trang web được chia thành các khối, với các điều kiện virivnyanniya nhất. Đồng thời, mỗi biến thể của thử nghiệm có cơ hội như nhau để được đại diện trong tất cả các khối, điều này đạt được sự cân bằng các điều kiện cho tất cả các tùy chọn được thử nghiệm, trải nghiệm. Phương pháp xây dựng kinh nghiệm này được gọi là phương pháp khối ngẫu nhiên. Thí nghiệm với động vật cũng được thực hiện tương tự.

Khi xử lý dữ liệu kinh tế - xã hội theo phương pháp phân tích phân tán, cần lưu ý rằng, do số lượng nhân tố phong phú và mối quan hệ qua lại của chúng nên rất khó, ngay cả khi có sự liên kết chặt chẽ nhất của các điều kiện, để thiết lập mức độ ảnh hưởng khách quan của từng yếu tố riêng lẻ đến thuộc tính hiệu quả. Do đó, mức độ biến động còn lại không chỉ được xác định bởi các nguyên nhân ngẫu nhiên, mà còn bởi các yếu tố quan trọng không được tính đến khi xây dựng mô hình ANOVA. Kết quả là, sự phân tán còn lại làm cơ sở để so sánh đôi khi trở nên không phù hợp với mục đích của nó, rõ ràng nó được đánh giá quá cao về độ lớn và không thể đóng vai trò là tiêu chí cho mức độ ảnh hưởng của các yếu tố. Về vấn đề này, khi xây dựng các mô hình phân tích phương sai, nó trở thành vấn đề thực tế sự lựa chọn các yếu tố quan trọng và cân bằng các điều kiện cho sự biểu hiện của hành động của mỗi người trong số họ. Ngoài ra. việc sử dụng phân tích phương sai giả định bình thường hoặc gần với phân phối bình thường tổng hợp thống kê đã nghiên cứu. Nếu điều kiện này không được đáp ứng, thì các ước lượng thu được trong phân tích phương sai sẽ bị phóng đại.

Phân tích phương sai(từ tiếng Latinh Dispersio - phân tán / trong tiếng Anh là Analysis Of Variance - ANOVA) được sử dụng để nghiên cứu ảnh hưởng của một hoặc nhiều biến định tính (nhân tố) lên một biến định lượng phụ thuộc (phản ứng).

Việc phân tích phương sai dựa trên giả định rằng một số biến có thể được coi là nguyên nhân (nhân tố, biến độc lập), và những biến khác là hệ quả (biến phụ thuộc). Các biến độc lập đôi khi được gọi là các yếu tố điều chỉnh một cách chính xác vì trong thử nghiệm, nhà nghiên cứu có cơ hội thay đổi chúng và phân tích kết quả thu được.

mục tiêu chính phân tích phương sai(ANOVA) là nghiên cứu về tầm quan trọng của sự khác biệt giữa các phương tiện bằng cách so sánh (phân tích) các phương sai. Chia tổng phương sai thành nhiều nguồn cho phép người ta so sánh phương sai do sự khác biệt giữa các nhóm với phương sai do sự thay đổi trong nhóm. Nếu giả thuyết vô hiệu là đúng (về sự bằng nhau của các phương tiện trong một số nhóm quan sát được chọn từ tổng thể chung), thì ước tính phương sai liên quan đến độ biến thiên trong nhóm phải gần với ước lượng phương sai giữa các nhóm. Nếu bạn chỉ đơn giản so sánh giá trị trung bình của hai mẫu, việc phân tích phương sai sẽ cho kết quả tương tự như phép thử t mẫu độc lập thông thường (nếu bạn đang so sánh hai nhóm đối tượng hoặc quan sát độc lập) hoặc phép thử t mẫu phụ thuộc ( nếu bạn đang so sánh hai biến trên cùng một tập hợp các đối tượng hoặc quan sát).

Bản chất của phân tích phương sai nằm ở việc phân chia tổng phương sai của tính trạng nghiên cứu thành các thành phần riêng biệt do ảnh hưởng của các yếu tố cụ thể và kiểm định giả thuyết về mức độ ảnh hưởng của các yếu tố này đối với tính trạng được nghiên cứu. So sánh các thành phần của sự phân tán với nhau bằng cách sử dụng kiểm định F của Fisher, có thể xác định được tỷ lệ nào trong tổng độ biến thiên của tính trạng kết quả là do tác động của các yếu tố điều chỉnh.

Tài liệu nguồn để phân tích phương sai là dữ liệu của nghiên cứu của ba hoặc nhiều mẫu:, có thể bằng nhau hoặc không bằng nhau về số lượng, cả kết nối và ngắt kết nối. Theo số lượng các yếu tố điều chỉnh được xác định, phân tích phương sai có thể một yếu tố(đồng thời nghiên cứu ảnh hưởng của một yếu tố đến kết quả của thí nghiệm), hai yếu tố(khi nghiên cứu ảnh hưởng của hai yếu tố) và đa nhân tố(cho phép bạn đánh giá không chỉ ảnh hưởng của từng yếu tố một cách riêng biệt mà còn cả sự tương tác của chúng).

Phân tích phương sai thuộc nhóm phương pháp tham số và do đó nó chỉ được sử dụng khi chứng minh được rằng phân phối là chuẩn.

Phân tích phương sai được sử dụng nếu biến phụ thuộc được đo lường trên thang tỷ lệ, khoảng hoặc thứ tự và các biến ảnh hưởng không phải là số (thang tên).

Ví dụ về nhiệm vụ

Trong các bài toán được giải bằng cách phân tích phương sai, có một phản ứng có tính chất số, bị ảnh hưởng bởi một số biến có bản chất danh nghĩa. Ví dụ, một số loại khẩu phần vỗ béo vật nuôi hoặc hai cách giữ chúng, v.v.

Ví dụ 1: Trong tuần, một số ki-ốt hiệu thuốc hoạt động ở ba địa điểm khác nhau. Trong tương lai, chúng ta chỉ có thể để lại một chiếc. Cần xác định xem có sự chênh lệch có ý nghĩa thống kê giữa số lượng bán thuốc tại các ki-ốt hay không. Nếu có, chúng tôi sẽ chọn ki-ốt có doanh số bán hàng trung bình hàng ngày cao nhất. Nếu sự khác biệt về lượng bán hóa ra là không đáng kể về mặt thống kê, thì các chỉ số khác sẽ là cơ sở để lựa chọn ki-ốt.

Ví dụ 2: So sánh sự tương phản của các phương tiện nhóm. Bảy đảng phái chính trị được sắp xếp theo thứ tự từ cực kỳ tự do đến cực kỳ bảo thủ và sự tương phản tuyến tính được sử dụng để kiểm tra xem có xu hướng tăng khác không trong các nghĩa của nhóm — tức là, liệu có sự gia tăng tuyến tính đáng kể về tuổi trung bình khi xem xét các nhóm được sắp xếp theo hướng từ tự do sang bảo thủ.

Ví dụ 3: Phân tích phương sai hai chiều. Số lượng bán sản phẩm, ngoài quy mô của cửa hàng, thường bị ảnh hưởng bởi vị trí của các kệ với sản phẩm. Ví dụ này chứa số liệu bán hàng hàng tuần được đặc trưng bởi bốn cách bố trí kệ và ba kích thước cửa hàng. Kết quả phân tích cho thấy cả hai yếu tố - vị trí của các kệ hàng với hàng hóa và quy mô của cửa hàng - đều ảnh hưởng đến số lượng bán hàng, nhưng sự tương tác của chúng không đáng kể.

Ví dụ 4: ANOVA đơn biến: Thiết kế khối đầy đủ hai xử lý ngẫu nhiên. Ảnh hưởng đến việc nướng bánh mì của tất cả kết hợp có thể ba chất béo và ba dao gạt bột. Bốn mẫu bột được lấy từ bốn các nguồn khác nhau, đóng vai trò là các yếu tố ngăn chặn. Cần phải xác định tầm quan trọng của sự tương tác giữa chất béo. Sau đó, để xác định các tùy chọn khác nhau để chọn độ tương phản, cho phép bạn tìm ra sự kết hợp của các mức độ yếu tố khác nhau.

Ví dụ 5: Mô hình của một kế hoạch phân cấp (lồng nhau) với các hiệu ứng hỗn hợp. Nghiên cứu ảnh hưởng của bốn đầu được chọn ngẫu nhiên gắn trong máy công cụ đến sự biến dạng của giá đỡ catốt bằng thủy tinh được sản xuất. (Các đầu được tích hợp sẵn trong máy, vì vậy không thể sử dụng cùng một đầu trên các máy khác nhau.) Hiệu ứng đầu được coi là một yếu tố ngẫu nhiên. Thống kê của ANOVA cho thấy không có sự khác biệt đáng kể giữa các máy, nhưng có dấu hiệu cho thấy các đầu có thể khác nhau. Sự khác biệt giữa tất cả các máy là không đáng kể, nhưng đối với hai trong số chúng, sự khác biệt giữa các loại đầu là đáng kể.

Ví dụ 6: Phân tích các phép đo lặp lại đơn biến bằng cách sử dụng kế hoạch chia ô. Thí nghiệm này được thực hiện để xác định ảnh hưởng của xếp hạng mức độ lo lắng của một cá nhân đối với kết quả kỳ thi trong bốn lần thử liên tiếp. Dữ liệu được sắp xếp để chúng có thể được coi là nhóm các tập con của toàn bộ tập dữ liệu ("toàn bộ âm mưu"). Ảnh hưởng của lo lắng không đáng kể, trong khi tác dụng của cố gắng là đáng kể.

Danh sách các phương pháp

Các mô hình thực nghiệm giai thừa. Ví dụ: các yếu tố ảnh hưởng đến sự thành công của việc giải toán; các yếu tố ảnh hưởng đến khối lượng bán hàng.

Dữ liệu bao gồm một số chuỗi quan sát (quá trình xử lý), được coi là thực nghiệm của các mẫu độc lập. Giả thuyết ban đầu là không có sự khác biệt trong các phương pháp điều trị, tức là giả định rằng tất cả các quan sát có thể được coi là một mẫu từ tổng dân số:

Mô hình tham số một nhân tố: Phương pháp của Scheffe.
Mô hình phi tham số một nhân tố [Lagutin M.B., 237]: Tiêu chí Kruskal-Wallis [Hollender M., Wolf D.A., 131], Jonkheer tiêu chí [Lagutin M.B., 245].

Trường hợp tổng quát của một mô hình với các thừa số không đổi, định lý Cochran [Afifi A., Eisen S., 234].

Dữ liệu là những quan sát lặp lại hai lần:

Mô hình phi tham số hai yếu tố: Tiêu chí của Friedman [Lapach, 203], Tiêu chí của Page [Lagutin M.B., 263]. Ví dụ: so sánh hiệu quả của các phương pháp sản xuất, thực hành nông nghiệp.
Mô hình phi tham số hai yếu tố cho dữ liệu không đầy đủ

Câu chuyện

Tên đến từ đâu phân tích phương sai? Có vẻ lạ khi quy trình so sánh các phương tiện được gọi là phân tích phương sai. Trên thực tế, điều này là do khi kiểm tra ý nghĩa thống kê của sự khác biệt giữa các phương tiện của hai (hoặc một số) nhóm, chúng tôi thực sự đang so sánh (phân tích) phương sai mẫu. Khái niệm cơ bản về phân tích phương sai được đề xuất người câu cá vào năm 1920. Có lẽ một thuật ngữ tự nhiên hơn sẽ là tổng phân tích bình phương hoặc phân tích biến thiên, nhưng do truyền thống, thuật ngữ phân tích phương sai được sử dụng. Ban đầu, phân tích phương sai được phát triển để xử lý dữ liệu thu được trong quá trình thí nghiệm được thiết kế đặc biệt và được coi là phương pháp duy nhất khám phá chính xác các mối quan hệ nhân quả. Phương pháp này được sử dụng để đánh giá các thí nghiệm trong sản xuất cây trồng. Sau đó, ý nghĩa khoa học chung của phân tích phân tán đối với các thí nghiệm trong tâm lý học, sư phạm, y học, v.v., trở nên rõ ràng.

Văn chương

Cảnh sát trưởng G. Phân tích độ phân tán. - M., 1980.
Ahrens H. Leiter Yu. Phân tích phương sai đa biến.
Kobzar A.I.Đã áp dụng thống kê toán học. - M.: Fizmatlit, 2006.
Lapach S. N., Chubenko A. V., Babich P. N. Thống kê trong khoa học và kinh doanh. - Kyiv: Morion, 2002.
Lagutin M. B. Thống kê toán học trực quan. Trong hai tập. - M.: P. trung tâm, 2003.
Afifi A., Eisen S. Phân tích thống kê: Cách tiếp cận có sự hỗ trợ của máy tính.
Hollender M., Wolf D.A. Phương pháp thống kê phi tham số.

Liên kết

Phân tích độ phân tán - Sách giáo khoa điện tử statsoft.

Bình phương trung bình và s R 2 là các ước lượng không chệch của biến phụ thuộc, được điều khiển bởi biến hồi quy hoặc biến giải thích, tương ứng X và tác động của các yếu tố ngẫu nhiên và sai số; m là số tham số hồi quy ước lượng, n là số quan sát. Trong trường hợp không có mối quan hệ tuyến tính giữa biến phụ thuộc và biến giải thích (giai thừa), các biến ngẫu nhiên và s R 2 tương ứng có phân phối 2 với m-1 và n-m bậc tự do, và tỉ số F của chúng là một phân phối có cùng bậc tự do. Do đó, phương trình hồi quy có ý nghĩa ở cấp độ nếu giá trị quan sát thực tế của thống kê vượt quá giá trị bảng:

(5.11),

đâu là giá trị dạng bảng của F - kiểm định Fisher - Snedekor, được xác định ở mức ý nghĩa tại k1 = m-1 và k2 = n-m bậc tự do.

Với ý nghĩa của các giá trị và s R 2, chúng ta có thể nói rằng giá trị của F cho thấy ở mức độ nào mà hồi quy ước tính giá trị của biến phụ thuộc tốt hơn giá trị trung bình của nó.

Trong trường hợp phòng xông hơi ướt hồi quy tuyến tính m = 2, và phương trình hồi quy có ý nghĩa ở mức nếu

(5.12)

Tỷ lệ sau có thể được dùng làm thước đo tầm quan trọng của đường hồi quy:

trong đó ŷ i -i-e giá trị bằng nhau; -Trung bình giá trị số học y tôi; σ y.x - sai số trung bình căn bậc hai (sai số xấp xỉ) phương trình hồi quy, tính từ công thức nổi tiếng; n là số lượng các cặp giá trị đối tượng được so sánh; m là số đặc điểm của yếu tố.

Thật vậy, kết nối càng lớn, thì thước đo mức độ phân tán của đối tượng địa lý do hồi quy càng có ý nghĩa, vượt quá thước đo độ phân tán của độ lệch của các giá trị thực so với giá trị đã được san bằng.

Tỷ lệ này cho phép chúng tôi giải quyết vấn đề về tầm quan trọng của toàn bộ phương trình hồi quy, nghĩa là sự hiện diện của một cuộc sống thực sự phụ thuộc thống kê giữa các biến. Phương trình hồi quy có ý nghĩa, tức là có một mối quan hệ thống kê giữa các dấu hiệu, nếu cho mức độ nhất định mức ý nghĩa, giá trị được tính toán của tiêu chí F của Fisher vượt quá giá trị tới hạn F cr, giá trị này nằm ở giao điểm của cột thứ m và hàng thứ của bảng thống kê đặc biệt, được gọi là “Bảng giá trị tiêu chí F của Fisher ”.

Ví dụ. Hãy sử dụng tiêu chí của Fisher để đánh giá mức độ quan trọng của phương trình hồi quy được xây dựng trong bài giảng trước, tức là phương trình biểu thị mối quan hệ giữa thu hoạch và gieo hạt bình quân đầu người.

Thay vào công thức tính tiêu chí Fisher, dữ liệu của ví dụ trước, chúng ta nhận được

Tham khảo bảng phân phối F cho P = 0,95 (α = 1-P = 0,5) và tính đến n-2 = 21, m-1 = 1, trong bảng giá trị kiểm tra F cho các giao điểm của cột thứ nhất và hàng thứ 21, chúng tôi tìm thấy giá trị tới hạn F cr, bằng 4,32 với mức độ tin cậy P = 0,95. Vì giá trị được tính toán của tiêu chí F vượt quá đáng kể giá trị F cr, mối quan hệ tuyến tính được phát hiện là có ý nghĩa, tức là giả thuyết tiên nghiệm về sự hiện diện kết nối tuyến tínhđã xác nhận. Kết luận được đưa ra với mức độ tin cậy P = 0,95. Có thể kiểm tra rằng đầu ra trong trường hợp này sẽ không thay đổi nếu tăng độ tin cậy lên P = 0,99 (giá trị tương ứng của F cr = 8,02 với mức ý nghĩa α = 0,01).

Hệ số xác định. Với sự trợ giúp của tiêu chí F, chúng tôi đã xác định rằng có phụ thuộc tuyến tính giữa lượng thóc thu hoạch và lượng gieo hạt trên đầu người. Do đó, có thể lập luận rằng lượng ngũ cốc thu hoạch trên đầu người phụ thuộc tuyến tính vào lượng hạt gieo trên đầu người. Bây giờ là thích hợp để đặt ra một câu hỏi làm rõ - lượng gieo hạt trên đầu người quyết định lượng thu hoạch ngũ cốc trên đầu người ở mức độ nào? Câu hỏi này có thể được trả lời bằng cách tính toán phần nào sự biến đổi của tính trạng kết quả có thể được giải thích do ảnh hưởng của tính trạng nhân tố. Mục đích này được phục vụ bởi chỉ số (hoặc hệ số) của xác định R 2, giúp ước tính tỷ lệ phân tán được tính đến bằng hồi quy trong tổng phân tán của thuộc tính hiệu dụng. Hệ số xác định, bằng tỷ số giữa biến thiên giai thừa với tổng biến thể của đặc điểm, giúp ta có thể đánh giá loại hàm mô tả sự phụ thuộc thống kê thực được chọn “thành công” như thế nào.

Nếu hệ số xác định R 2 được biết, thì tiêu chí về mức độ quan trọng của phương trình hồi quy hoặc chính hệ số xác định (tiêu chí của Fisher) có thể được viết là:

Tiêu chí của Fisher cũng cho phép chúng tôi đánh giá mức độ hữu ích của việc bao gồm các yếu tố bổ sung vào mô hình cho phương trình hồi quy nhiều tuyến tính.

Trong kinh tế lượng, ngoài tiêu chí chung Fisher, khái niệm này cũng được sử dụng tiêu chí riêng tư . Tiêu chí F từng phần cho thấy mức độ ảnh hưởng của một biến độc lập bổ sung lên thuộc tính kết quả và có thể được sử dụng khi quyết định thêm biến độc lập này vào phương trình hay loại trừ biến độc lập khỏi nó.

Sự phân tán của đối tượng được giải thích bởi phương trình hồi quy hai yếu tố được xây dựng trước đó có thể được phân tách thành hai loại: 1) phân tán của đối tượng do biến độc lập x 1 và 2) phân tán của đối tượng do biến độc lập x 2 khi x 1 đã được đưa vào phương trình. Thành phần đầu tiên tương ứng với sự lan truyền của thuộc tính, được giải thích bằng phương trình, chỉ bao gồm biến x 1. Sự khác biệt giữa phân tán đối tượng do phương trình hồi quy tuyến tính theo cặp và phân tán đối tượng do phương trình hồi quy tuyến tính hai chiều sẽ xác định phần phân tán được giải thích bởi biến độc lập bổ sung x 2.

Tỷ lệ của sự khác biệt được chỉ định với sự phân tán của đối tượng địa lý, không được giải thích bằng hồi quy, là giá trị tiêu chí riêng. Một bài kiểm tra F cụ thể còn được gọi là tuần tự nếu đặc điểm thống kêđược xây dựng bằng cách thêm tuần tự các biến vào phương trình hồi quy.

Ví dụ.Đánh giá mức độ hữu ích của việc đưa thêm một biến "năng suất" vào phương trình hồi quy (theo dữ liệu và kết quả của các ví dụ đã xem xét trước đó).

Sự phân tán của đối tượng địa lý được giải thích bằng phương trình hồi quy nhiều lần và được tính bằng tổng của sự khác biệt bình phương của các giá trị đã cân bằng và giá trị trung bình của chúng, bằng 1623,8815. Mức chênh lệch của thuộc tính, được giải thích bằng phương trình hồi quy đơn giản, là 1545.1331.

Sự phân tán của đối tượng địa lý, không được giải thích bằng hồi quy, được xác định bằng bình phương của giá trị trung bình lỗi bậc hai phương trình và bằng 10,9948.

Sử dụng các đặc điểm này, chúng tôi tính toán tiêu chí F riêng

Với mức độ tin cậy là 0,95 (α = 0,05), giá trị dạng bảng F (1,20), tức là giá trị tại giao điểm của cột thứ nhất và hàng thứ 20 của bảng. Đơn 4A, bằng 4,35. Giá trị được tính toán của tiêu chí F vượt quá giá trị được lập bảng một cách đáng kể và do đó, việc đưa biến "năng suất" vào phương trình là có ý nghĩa.

Do đó, các kết luận được đưa ra trước đó về hệ số hồi quy là khá chính đáng.

lần thứ 4 câu hỏi nghiên cứu. Ước tính ý nghĩa của các tham số riêng lẻ của phương trình hồi quy bằng phép kiểm định t của Student.

Thông thường, trong kinh tế lượng, yêu cầu đánh giá mức độ quan trọng của hệ số tương quan r nghĩa là để xác định mức độ khác biệt của hệ số tương quan so với 0 có ý nghĩa như thế nào (ví dụ: khi phân tích đa cộng tuyến và ước tính hệ số tương quan cặp giữa các yếu tố trong một phương trình hồi quy bội).

Đồng thời, giả định rằng trong trường hợp không có mối tương quan, thống kê t,

Nó có t-Phân phối của học sinh với (n-2) bậc tự do.

Hệ số tương quan r xy có ý nghĩa ở mức độ, (nếu không, giả thuyết Н 0 về sự bằng nhau của hệ số tương quan tổng quát về 0 sẽ bị bác bỏ), nếu

(5.13),

Giá trị bảng ở đâu t-Tiêu chuẩn của sinh viên, được xác định ở mức ý nghĩa a với số bậc tự do (n-2).

Trong hồi quy tuyến tính, ý nghĩa của không chỉ phương trình nói chung mà còn cả các tham số riêng lẻ của nó thường được ước tính. Với mục đích này, sai số tiêu chuẩn của nó được xác định cho từng tham số. Quy trình đánh giá mức độ quan trọng của tham số này không khác với quy trình đã xét ở trên đối với hệ số hồi quy; Giá trị của tiêu chí t được tính toán, giá trị của nó được so sánh với giá trị dạng bảng ở (n-2) bậc tự do. Kiểm định giả thuyết về mức ý nghĩa của hệ số hồi quy và hệ số tương quan tương đương với việc kiểm định giả thuyết về mức ý nghĩa phương trình đường thẳng hồi quy.

Sự kết luận. Vì vậy, trong bài giảng này, chúng tôi đã xem xét quy tắc chung thử nghiệm các giả thuyết thống kê và công dụng thực tế khi đánh giá ý nghĩa của các phương trình hồi quy và các tham số riêng lẻ của chúng bằng cách sử dụng các tiêu chí Fisher và Student.

Phân tích phương sai

Khóa học làm việc theo kỷ luật: " Phân tích hệ thống»

Sinh viên biểu diễn gr. 99 ISE-2 Zhbanov V.V.

Orenburg Đại học Bang

Khoa công nghệ thông tin

Khoa Tin học Ứng dụng

Orenburg-2003

Giới thiệu

Mục đích của công việc: làm quen với một phương pháp thống kê như phân tích phương sai.

Phân tích độ phân tán (từ tiếng Latinh Dispersio - sự phân tán) - phương pháp thống kê, cho phép phân tích ảnh hưởng các yếu tố khác nhau vào biến đang nghiên cứu. Phương pháp này được phát triển bởi nhà sinh vật học R. Fisher vào năm 1925 và ban đầu được sử dụng để đánh giá các thí nghiệm trong sản xuất cây trồng. Sau đó, ý nghĩa khoa học chung của phân tích phân tán đối với các thí nghiệm trong tâm lý học, sư phạm, y học, v.v., trở nên rõ ràng.

Mục đích của việc phân tích phương sai là để kiểm tra mức độ ý nghĩa của sự khác biệt giữa các phương tiện bằng cách so sánh các phương sai. Phương sai của thuộc tính đo được phân tách thành các thuật ngữ độc lập, mỗi thuật ngữ đặc trưng cho ảnh hưởng của một yếu tố cụ thể hoặc sự tương tác của chúng. Việc so sánh tiếp theo các thuật ngữ như vậy cho phép chúng tôi đánh giá tầm quan trọng của từng yếu tố đang được nghiên cứu, cũng như sự kết hợp của chúng / 1 /.

Nếu giả thuyết rỗng là đúng (về sự bằng nhau của các phương tiện trong một số nhóm quan sát được chọn từ tổng thể chung), thì ước lượng phương sai liên quan đến độ biến thiên trong nhóm phải gần với ước lượng phương sai giữa các nhóm.

Khi thực hiện nghiên cứu thị trường, câu hỏi về khả năng so sánh của các kết quả thường đặt ra. Ví dụ: bằng cách thực hiện các cuộc khảo sát về việc tiêu thụ một sản phẩm ở các vùng khác nhau các nước, cần phải đưa ra kết luận về mức độ khác nhau của số liệu điều tra hoặc không khác nhau. so sánh các chỉ số cá nhân không có ý nghĩa và do đó thủ tục so sánh và đánh giá tiếp theo được thực hiện theo một số giá trị trung bình và độ lệch so với ước tính trung bình này. Sự biến đổi của tính trạng đang được nghiên cứu. Phương sai có thể được coi là một thước đo của sự thay đổi. Độ phân tán σ 2 là thước đo độ biến thiên, được định nghĩa là giá trị trung bình của các độ lệch của một đối tượng địa lý được bình phương.

Trong thực tế, các vấn đề thường nảy sinh chung- nhiệm vụ kiểm tra ý nghĩa của sự khác biệt trong giá trị trung bình của các mẫu mẫu của một số quần thể. Ví dụ, cần phải đánh giá ảnh hưởng của các loại nguyên liệu thô khác nhau đến chất lượng sản phẩm, giải quyết vấn đề ảnh hưởng của lượng phân bón đến năng suất nông sản.

Đôi khi phân tích phương sai được sử dụng để thiết lập tính đồng nhất của một số quần thể (phương sai của các quần thể này giống nhau theo giả định; nếu phân tích phương sai cho thấy rằng các kỳ vọng toán học là như nhau, thì các quần thể là đồng nhất theo nghĩa này). Các tập hợp đồng nhất có thể được kết hợp thành một và do đó có thêm thông tin về nó. đầy đủ thông tin, do đó, kết luận đáng tin cậy hơn / 2 /.

1 Phân tích phương sai

1.1 Các khái niệm cơ bản về phân tích phương sai

Trong quá trình quan sát đối tượng nghiên cứu, các yếu tố định tính thay đổi tùy ý hoặc không theo quy luật định trước. Việc thực hiện cụ thể một yếu tố (ví dụ, một chế độ nhiệt độ nhất định, thiết bị hoặc vật liệu đã chọn) được gọi là mức yếu tố hoặc phương pháp xử lý. Mô hình ANOVA với các mức nhân tố cố định được gọi là mô hình I, mô hình có các nhân tố ngẫu nhiên được gọi là mô hình II. Bằng cách thay đổi yếu tố, người ta có thể điều tra ảnh hưởng của nó đến mức độ của phản ứng. Hiện tại lý thuyết chung phân tích phương sai được phát triển cho các mô hình I.

Tùy thuộc vào số lượng nhân tố xác định sự biến đổi của đối tượng địa lý, phân tích phương sai được chia thành nhân tố đơn và nhân tố đa.

Các lược đồ chính để tổ chức dữ liệu ban đầu với hai hoặc nhiều yếu tố là:

Phân loại chéo, đặc trưng của mô hình I, trong đó mỗi mức của một yếu tố được kết hợp với mỗi mức của yếu tố khác khi lập kế hoạch thí nghiệm;

Phân loại theo thứ bậc (lồng nhau), đặc trưng của mô hình II, trong đó mỗi giá trị được chọn ngẫu nhiên của một nhân tố tương ứng với tập hợp con các giá trị của nhân tố thứ hai.

Nếu sự phụ thuộc của phản hồi vào các yếu tố định tính và định lượng được khảo sát đồng thời, tức là các yếu tố có bản chất hỗn hợp thì sử dụng phép phân tích hiệp phương sai / 3 /.

Do đó, các mô hình này khác nhau ở cách lựa chọn các cấp độ của nhân tố, rõ ràng là ảnh hưởng chủ yếu đến khả năng tổng quát hóa các kết quả thực nghiệm thu được. Đối với phân tích phương sai của các thí nghiệm đơn nhân tố, sự khác biệt giữa hai mô hình này không quá đáng kể, nhưng trong phân tích phương sai đa biến, nó có thể rất quan trọng.

Khi tiến hành phân tích phương sai, các giả thiết thống kê sau đây phải được đáp ứng: bất kể mức độ của nhân tố, các giá trị phản hồi đều có luật phân phối chuẩn (Gaussian) và cùng phương sai. Sự bình đẳng của sự phân tán này được gọi là sự đồng nhất. Do đó, việc thay đổi phương pháp xử lý chỉ ảnh hưởng đến vị trí của biến ngẫu nhiên phản hồi, được đặc trưng bởi giá trị trung bình hoặc giá trị trung vị. Do đó, tất cả các quan sát về phản ứng đều thuộc họ dịch chuyển của phân phối chuẩn.

Kỹ thuật ANOVA được cho là "mạnh mẽ". Thuật ngữ này, được sử dụng bởi các nhà thống kê, có nghĩa là những giả định này có thể bị vi phạm ở một mức độ nào đó, nhưng mặc dù vậy, kỹ thuật này vẫn có thể được sử dụng.

Khi quy luật phân phối các giá trị phản hồi không xác định, các phương pháp phân tích không tham số (thường là xếp hạng) được sử dụng.

Việc phân tích phương sai dựa trên việc phân chia phương sai thành các bộ phận hoặc thành phần. Sự thay đổi do ảnh hưởng của yếu tố cơ bản trong việc phân nhóm được đặc trưng bởi độ phân tán giữa các nhóm σ 2. Nó là thước đo sự thay đổi của trung bình từng phần đối với các nhóm xung quanh giá trị trung bình chung và được xác định theo công thức:

với k là số nhóm;

n j là số đơn vị trong nhóm thứ j;

Mức trung bình riêng cho nhóm thứ j;

Giá trị trung bình chung trên toàn bộ dân số của các đơn vị.

Sự thay đổi do ảnh hưởng của các yếu tố khác được đặc trưng trong mỗi nhóm bằng sự phân tán trong nhóm σ j 2.

Ở giữa tổng phương saiσ 0 2, phương sai nội nhóm σ 2 và phương sai giữa các nhóm có mối quan hệ:

σ 0 2 = + σ 2.

Phương sai nội nhóm giải thích ảnh hưởng của các yếu tố không được tính đến khi phân nhóm và phương sai giữa các nhóm giải thích ảnh hưởng của các yếu tố phân nhóm đến trung bình nhóm / 2 /.

1.2 Phân tích phương sai một chiều

Mô hình phân tán một yếu tố có dạng:

x ij = μ + F j + ε ij, (1)

trong đó x ij là giá trị của biến đang nghiên cứu, thu được trên cấp thứ i thừa số (i = 1,2, ..., m) với j-th số seri(j = 1,2, ..., n);

F i là hiệu do ảnh hưởng của mức thứ i của yếu tố;

εij - thành phần ngẫu nhiên, hoặc xáo trộn do ảnh hưởng của các yếu tố không kiểm soát được, tức là biến thể trong một cấp độ duy nhất.

Các điều kiện tiên quyết cơ bản để phân tích phương sai:

Kỳ vọng toán học của nhiễu loạn ε ij bằng 0 đối với bất kỳ i nào, tức là

M (ε ij) = 0; (2)

Những lo lắng ε ij là độc lập lẫn nhau;

Phương sai của biến x ij (hoặc nhiễu loạn ε ij) là không đổi đối với

bất kỳ tôi, j, tức là

D (ε ij) = σ 2; (3)

Biến x ij (hoặc nhiễu loạn ε ij) có luật bình thường

phân phối N (0; σ 2).

Ảnh hưởng của các mức nhân tố có thể cố định hoặc có hệ thống (Mô hình I) hoặc ngẫu nhiên (Mô hình II).

Ví dụ, cần phải tìm hiểu xem có sự khác biệt đáng kể giữa các lô sản phẩm về một số chỉ tiêu chất lượng hay không, tức là kiểm tra ảnh hưởng đến chất lượng của một yếu tố - một lô sản phẩm. Nếu tất cả các lô nguyên liệu thô được đưa vào nghiên cứu, thì ảnh hưởng của mức độ của yếu tố đó là có hệ thống (mô hình I) và các phát hiện chỉ có thể áp dụng cho các lô riêng lẻ đã tham gia vào nghiên cứu. Nếu chúng ta chỉ bao gồm một phần được chọn ngẫu nhiên của các bên, thì ảnh hưởng của nhân tố là ngẫu nhiên (mô hình II). Trong phức hợp đa yếu tố, có thể có một mô hình hỗn hợp III, trong đó một số yếu tố có mức ngẫu nhiên, trong khi những yếu tố khác là cố định.

Để có m lô sản phẩm. Từ mỗi lô, người ta chọn lần lượt n 1, n 2, ..., n m sản phẩm (để đơn giản, giả thiết rằng n 1 = n 2 = ... = n m = n). Các giá trị của chỉ tiêu chất lượng của các sản phẩm này được trình bày trong ma trận quan sát:

x 11 x 12… x 1n

x 21 x 22… x 2n

………………… = (x ij), (i = 1,2,…, m; j = 1,2,…, n).

x m 1 x m 2… x mn

Cần phải kiểm tra mức độ ảnh hưởng của các lô sản phẩm đến chất lượng của chúng.

Nếu chúng ta giả sử rằng các phần tử hàng của ma trận quan sát là các giá trị số biến ngẫu nhiênХ 1, Х 2, ..., Х m, thể hiện chất lượng của sản phẩm và có luật phân phối chuẩn với các kỳ vọng toán học tương ứng là 1, а 2, ..., а và các phương sai giống hệt σ 2, thì nhiệm vụ được giaođược rút gọn để kiểm tra giả thuyết rỗng H 0: a 1 = a 2 = ... = a m, được thực hiện trong phân tích phương sai.

Giá trị trung bình trên một số chỉ mục được biểu thị bằng dấu hoa thị (hoặc dấu chấm) thay vì chỉ mục, sau đó trung bình phẩm chất sản phẩm i-th lô, hoặc mức trung bình của nhóm đối với cấp thứ i của yếu tố, sẽ có dạng:

trong đó i * là giá trị trung bình trên các cột;

Ij là một phần tử của ma trận quan sát;

n là kích thước mẫu.

Và mức trung bình tổng thể:

. (5)

Tổng độ lệch bình phương của các quan sát x ij so với tổng giá trị trung bình ** có dạng như sau:

2 = 2 + 2 +

2 2 . (6)

Q \ u003d Q 1 + Q 2 + Q 3.

Số hạng cuối cùng bằng 0

vì tổng độ lệch của các giá trị của biến so với giá trị trung bình của nó bằng 0, tức là

2 =0.

Thuật ngữ đầu tiên có thể được viết là:

Kết quả là một danh tính:

Q = Q 1 + Q 2, (8)

ở đâu - tổng, hoặc tổng, tổng của các sai lệch bình phương;

- tổng các độ lệch bình phương của nhóm có nghĩa là từ tổng trung bình, hoặc tổng giữa các nhóm (giai thừa) của các độ lệch bình phương;

- tổng bình phương độ lệch của các quan sát từ giá trị trung bình của nhóm, hoặc tổng bình phương (còn lại) trong nhóm.

Phần mở rộng (8) chứa ý tưởng chính của việc phân tích phương sai. Liên quan đến vấn đề đang xem xét, đẳng thức (8) cho thấy rằng sự biến thiên tổng thể của chỉ tiêu chất lượng, được đo bằng tổng Q, bao gồm hai thành phần - Q 1 và Q 2, đặc trưng cho sự thay đổi của chỉ tiêu này giữa các lô (Q 1 ) và sự thay đổi trong các lô (Q 2), đặc trưng cho cùng một sự thay đổi đối với tất cả các lô dưới ảnh hưởng của các yếu tố không được tính toán.

Trong phân tích phương sai, không phải bản thân tổng các độ lệch bình phương được phân tích, mà là cái gọi là bình phương trung bình, là các ước lượng không chệch của các phương sai tương ứng, thu được bằng cách chia tổng các độ lệch bình phương cho số bậc tương ứng của sự tự do.

Số bậc tự do được định nghĩa là tổng số quan sát trừ đi số phương trình liên quan đến chúng. Do đó, đối với bình phương trung bình s 1 2, là ước lượng không chệch của phương sai giữa các nhóm, số bậc tự do k 1 = m-1, vì m nhóm có nghĩa là liên kết với nhau bởi một phương trình (5) được sử dụng trong tính toán của nó. Và đối với bình phương trung bình s22, là ước lượng không chệch của phương sai trong nhóm, số bậc tự do là k2 = mn-m, bởi vì nó được tính toán bằng cách sử dụng tất cả mn quan sát được kết nối với nhau bởi m phương trình (4).

Như vậy:

Nếu chúng ta tìm thấy các kỳ vọng toán học của các bình phương trung bình và, thay thế biểu thức xij (1) trong các công thức của chúng thông qua các tham số mô hình, chúng ta nhận được:

(9)

tại vì có tính đến các thuộc tính của kỳ vọng toán học

một

(10)

Đối với mô hình I với các mức cố định của hệ số F i (i = 1,2, ..., m) là các giá trị không ngẫu nhiên, do đó

M (S) = 2 / (m-1) + σ 2.

Giả thuyết H 0 có dạng F i = F * (i = 1,2, ..., m), tức là ảnh hưởng của tất cả các cấp độ của yếu tố là như nhau. Nếu giả thuyết này là đúng

M (S) = M (S) = σ 2.

Vì mô hình ngẫu nhiên Số hạng II F i trong biểu thức (1) là một giá trị ngẫu nhiên. Biểu thị nó theo phương sai

chúng tôi nhận được từ (9)

(11)

và, như trong mô hình I

Bảng 1.1 trình bày hình thức chung tính toán các giá trị, sử dụng phân tích phương sai.

Bảng 1.1 - Bảng phân tích phương sai cơ bản

Các thành phần phương sai	Tổng bình phương	Số bậc tự do	Hình vuông vừa	Kỳ vọng bình phương trung bình
Liên nhóm
Trong nhóm

Giả thuyết H 0 sẽ có dạng σ F 2 = 0. Nếu giả thuyết này là đúng

M (S) = M (S) = σ 2.

Trong trường hợp phức hợp một nhân tố cho cả mô hình I và mô hình II, các bình phương trung bình S 2 và S 2 là các ước lượng độc lập và không chệch của cùng một phương sai σ 2.

Do đó, việc kiểm định giả thuyết rỗng H 0 được giảm xuống để kiểm tra ý nghĩa của sự khác biệt giữa giá trị không chệch ước tính mẫuĐộ phân tán S và S σ 2.

Giả thuyết H 0 bị bác bỏ nếu giá trị thực tính được của thống kê F = S / S lớn hơn giá trị tới hạn F α: K 1: K 2 được xác định ở mức ý nghĩa α với số bậc tự do k 1 = m- 1 và k 2 = mn-m và được chấp nhận nếu F< F α: K 1: K 2 .

Phân phối Fisher F (cho x> 0) có chức năng tiếp theo mật độ (cho = 1, 2, ...; = 1, 2, ...):

ở đâu - bậc tự do;

G - hàm gamma.

Liên quan đến vấn đề này, việc bác bỏ giả thuyết H 0 có nghĩa là sự hiện diện của sự khác biệt đáng kể về chất lượng sản phẩm của các lô khác nhau ở mức ý nghĩa đang được xem xét.

Để tính tổng các bình phương Q 1, Q 2, Q, thường thuận tiện sử dụng các công thức sau:

(12)

(13)

(14)

những thứ kia. nói chung không cần thiết phải tự tìm các giá trị trung bình.

Do đó, quy trình phân tích phương sai một chiều bao gồm kiểm tra giả thuyết H 0 rằng có một nhóm dữ liệu thực nghiệm đồng nhất so với phương án thay thế có nhiều hơn một nhóm như vậy. Tính đồng nhất đề cập đến sự giống nhau của các phương tiện và phương sai trong bất kỳ tập hợp con nào của dữ liệu. Trong trường hợp này, các phương sai có thể được biết trước và chưa biết trước. Nếu có lý do để tin rằng phương sai đã biết hoặc chưa biết của các phép đo là giống nhau trong toàn bộ tập dữ liệu, thì nhiệm vụ phân tích phương sai một chiều được giảm xuống để nghiên cứu ý nghĩa của sự khác biệt về phương tiện trong các nhóm dữ liệu / 1 /.

1.3 Sự phân tán đa biến phân tích

Cần lưu ý ngay rằng không có sự khác biệt cơ bản giữa phân tích phương sai đa biến và đơn nhân tố. Phân tích đa biến không thay đổi logic thông thường phân tích phương sai, nhưng chỉ phức tạp một chút, vì ngoài việc tính đến ảnh hưởng đến biến phụ thuộc của từng nhân tố một cách riêng biệt, cần phải đánh giá hành động chung. Do đó, điều mới mà phân tích phương sai đa biến mang lại cho phân tích dữ liệu liên quan chủ yếu đến khả năng đánh giá tương tác giữa các yếu tố. Tuy nhiên, vẫn có thể đánh giá mức độ ảnh hưởng của từng yếu tố một cách riêng biệt. Theo nghĩa này, quy trình phân tích phương sai đa biến (trong biến thể sử dụng máy tính của nó) chắc chắn là kinh tế hơn, vì chỉ trong một lần chạy, nó giải quyết được hai vấn đề cùng một lúc: ảnh hưởng của từng yếu tố và sự tương tác của chúng được ước tính / 3 /.

Sơ đồ chung thử nghiệm hai yếu tố, dữ liệu được xử lý bằng cách phân tích phương sai, có dạng:

Hình 1.1 - Sơ đồ của một thí nghiệm hai yếu tố

Dữ liệu được phân tích đa biến về phương sai thường được dán nhãn theo số lượng nhân tố và mức độ của chúng.

Giả sử trong bài toán được xem xét về chất lượng của các lô m khác nhau, các sản phẩm được sản xuất trên các máy t khác nhau và cần phải tìm hiểu xem có sự khác biệt đáng kể về chất lượng của sản phẩm đối với từng yếu tố hay không:

A - một lô sản phẩm;

B - máy.

Kết quả là chuyển sang bài toán phân tích phương sai hai nhân tố.

Tất cả dữ liệu được trình bày trong bảng 1.2, trong đó các hàng - mức A i của yếu tố A, các cột - mức B j của yếu tố B và trong các ô tương ứng của bảng là giá trị của chỉ tiêu chất lượng sản phẩm x ijk (i = 1,2, ..., m; j = 1,2, ..., l; k = 1,2, ..., n).

Bảng 1.2 - Các chỉ tiêu chất lượng sản phẩm


x 11l,…, x 11k	x 12l,…, x 12k	x 1jl,…, x 1jk	x 1l,…, x 1lk
x 2 1l,…, x 2 1k	x 22l,…, x 22k	x 2jl,…, x 2jk	x 2l,…, x 2lk

x i1l,…, x i1k	x i2l,…, x i2k	xijl,…, xijk	xjll,…, xjlk

x m1l,…, x m1k	x m2l,…, x m2k	xmjl,…, xmjk	x mll,…, x mlk

Mô hình phân tán hai yếu tố có dạng:

x ijk = μ + F i + G j + I ij + ε ijk, (15)

trong đó x ijk là giá trị của quan sát trong ô ij với số k;

μ - trung bình chung;

F i - ảnh hưởng do ảnh hưởng của mức thứ i của yếu tố A;

G j - ảnh hưởng do ảnh hưởng của mức thứ j của yếu tố B;

I ij - ảnh hưởng do sự tương tác của hai yếu tố, tức là độ lệch từ giá trị trung bình cho các quan sát trong ô ij so với tổng của ba số hạng đầu tiên trong mô hình (15);

ε ijk - nhiễu loạn do sự thay đổi của biến trong một ô.

Giả định rằng ε ijk có phân phối chuẩn N (0; с 2) và tất cả các kỳ vọng toán học F *, G *, I i *, I * j đều bằng không.

Giá trị trung bình của nhóm được tìm thấy bằng các công thức:

Trong ô:

theo dòng:

theo cột:

trung bình chung:

Bảng 1.3 trình bày một cái nhìn chung về việc tính toán các giá trị bằng cách sử dụng phân tích phương sai.

Bảng 1.3 - Bảng phân tích phương sai cơ bản

Các thành phần phương sai	Tổng bình phương	Số bậc tự do	Hình vuông ở giữa
Liên nhóm (yếu tố A)
Liên nhóm (yếu tố B)
Sự tương tác
Dư

Việc kiểm tra các giả thuyết rỗng HA, HB, HAB về việc không có ảnh hưởng đến biến được xem xét của các yếu tố A, B và tương tác của chúng AB được thực hiện bằng cách so sánh các tỷ lệ, (đối với mô hình I với các mức nhân tố cố định) hoặc các quan hệ, (đối với mô hình ngẫu nhiên II) với bảng giá trị F - Tiêu chí Fisher-Snedecor. Đối với mô hình hỗn hợp III, việc kiểm định giả thuyết đối với các nhân tố có mức cố định được thực hiện giống như trong mô hình II và đối với các nhân tố có mức ngẫu nhiên, như trong mô hình I.

Nếu n = 1, tức là với một lần quan sát trong ô, khi đó không phải tất cả các giả thuyết rỗng đều có thể được kiểm tra, vì thành phần Q3 nằm ngoài tổng bình phương của tổng bình phương và với nó là bình phương trung bình, vì trong trường hợp này không thể có câu hỏi về sự tương tác của các nhân tố.

Theo quan điểm của kỹ thuật tính toán, để tìm tổng bình phương Q 1, Q 2, Q 3, Q 4, Q, sử dụng các công thức sẽ dễ dàng hơn:

Q 3 \ u003d Q - Q 1 - Q 2 - Q 4.

Sự sai lệch so với các điều kiện tiên quyết cơ bản của việc phân tích phương sai - tính bình thường của sự phân bố của biến số đang nghiên cứu và sự bình đẳng của phương sai trong các ô (nếu nó không quá mức) - không ảnh hưởng đáng kể đến kết quả phân tích phương sai với một số lượng quan sát bằng nhau trong các ô, nhưng có thể rất nhạy cảm nếu số lượng của chúng không bằng nhau. Ngoài ra, với số lượng quan sát không bằng nhau trong các ô, độ phức tạp của thiết bị phân tích phương sai tăng lên đáng kể. Do đó, nên lập kế hoạch với số lượng bằng nhau các quan sát trong các ô và nếu thiếu dữ liệu, thì bù cho chúng bằng các giá trị trung bình của các quan sát khác trong ô. Tuy nhiên, trong trường hợp này, dữ liệu bị thiếu được đưa vào một cách giả tạo không nên được tính đến khi tính toán số bậc tự do / 1 /.

2 Ứng dụng của ANOVA trong các quy trình khác nhau và nghiên cứu

2.1 Sử dụng phân tích phương sai trong nghiên cứu các quá trình di cư

Di cư phức tạp Hiện tượng xã hội mà phần lớn quyết định các khía cạnh kinh tế và chính trị của xã hội. Việc nghiên cứu các quá trình di cư gắn liền với việc xác định các yếu tố quan tâm, sự hài lòng với điều kiện lao động và đánh giá mức độ ảnh hưởng của các yếu tố thu được đối với sự di chuyển giữa các nhóm dân số.

λ ij = c i q ij a j,

trong đó λ ij là cường độ chuyển đổi từ nhóm ban đầu i (đầu ra) sang nhóm mới j (đầu vào);

c i - khả năng xảy ra và khả năng rời khỏi nhóm i (c i ≥0);

q ij - sức hấp dẫn nhóm mới so với ban đầu (0≤q ij ≤1);

a j - tính khả dụng của nhóm j (a j ≥0).

ν ij ≈ n i λ ij = n i c i q ij a j. (mười sáu)

Trong thực tế cho cá nhân xác suất p để chuyển sang nhóm khác là nhỏ, và số n của nhóm đang xét là lớn. Trong trường hợp này, luật sự kiện hiếm, nghĩa là, giới hạn ν ij là phân phối Poisson với tham số μ = np:

Khi μ tăng, phân bố tiến tới bình thường. Giá trị biến đổi √ν ij có thể được coi là phân phối chuẩn.

Nếu chúng ta lấy logarit của biểu thức (16) và thực hiện các thay đổi cần thiết của các biến, thì chúng ta có thể nhận được một phân tích của mô hình phương sai:

ln√ν ij = ½lnν ij = ½ (lnn i + lnc i + lnq ij + lna j) + ε ij,

X i, j = 2ln√ν ij -lnn i -lnq ij,

Xi, j = Ci + Aj + ε.

Các giá trị của C i và A j làm cho nó có thể thu được mô hình ANOVA hai chiều với một lần quan sát trên mỗi ô. chuyển đổi ngược lại các hệ số c i và a j được tính từ C i và A j.

Khi tiến hành phân tích phương sai, các giá trị sau đây phải được coi là giá trị của đặc tính hiệu dụng Y:

X \ u003d (X 1.1 + X 1.2 +: + X mi, mj) / mimj,

trong đó mimj là ước lượng của kỳ vọng toán học X i, j;

X mi và X mj - tương ứng là số lượng nhóm xuất và nhập.

Mức yếu tố I sẽ là nhóm lối ra mi, mức yếu tố J sẽ là nhóm đầu vào mj. Mi = mj = m được giả thiết. Vấn đề là kiểm định giả thuyết H I và H J về sự bằng nhau kỳ vọng toán học Giá trị Y ở mức I i và ở mức J j, i, j = 1,…, m. Kiểm định giả thuyết H I dựa trên việc so sánh các giá trị của các ước lượng không chệch của phương sai s I 2 và s o 2. Nếu giả thuyết H I đúng, thì giá trị F (I) = s I 2 / s o 2 có phân phối Fisher với số bậc tự do k 1 = m-1 và k 2 = (m-1) (m- 1). Với mức ý nghĩa cho trước α, bên phải Điểm cốt lõi x pr, α cr. Nếu một giá trị số F (I) số giá trị rơi vào khoảng (x pr, α kr, + ∞) thì giả thuyết H I bị bác bỏ và người ta tin rằng yếu tố I ảnh hưởng đến tính năng hiệu quả. Mức độ ảnh hưởng này theo kết quả quan sát được đo lường tỷ lệ lấy mẫu xác định, cho biết tỷ lệ phương sai của đặc điểm hiệu quả trong mẫu là do ảnh hưởng của yếu tố I đối với nó. Nếu F (I) là một số

2.2 Nguyên tắc phân tích toán học và thống kê dữ liệu nghiên cứu y sinh

Tùy thuộc vào nhiệm vụ, khối lượng và tính chất của vật liệu, loại dữ liệu và mối quan hệ của chúng mà có sự lựa chọn phương pháp xử lý toán học ở các giai đoạn sơ bộ (để đánh giá bản chất của sự phân bố trong mẫu nghiên cứu) và phân tích cuối cùng phù hợp với mục tiêu của nghiên cứu. Một khía cạnh cực kỳ quan trọng là xác minh tính đồng nhất của các nhóm quan sát đã chọn, bao gồm cả nhóm đối chứng, có thể được thực hiện bởi một chuyên gia hoặc bằng các phương pháp thống kê đa biến (ví dụ, sử dụng phân tích cụm). Nhưng bước đầu tiên là biên soạn một bảng câu hỏi cung cấp một mô tả chuẩn hóa về các đặc điểm. Đặc biệt là khi thực hiện các nghiên cứu dịch tễ học, nơi cần có sự thống nhất trong việc hiểu và mô tả các triệu chứng giống nhau của các bác sĩ khác nhau, bao gồm cả việc tính đến phạm vi thay đổi của chúng (mức độ nghiêm trọng). Nếu có sự khác biệt đáng kể trong việc đăng ký dữ liệu ban đầu (đánh giá chủ quan về bản chất của các biểu hiện bệnh lý bởi các bác sĩ chuyên khoa khác nhau) và không thể đưa chúng về một dạng duy nhất ở giai đoạn thu thập thông tin, thì cái gọi là hiệu chỉnh hiệp phương sai có thể được thực hiện, liên quan đến việc chuẩn hóa các biến, tức là loại bỏ các bất thường của các chỉ tiêu trong ma trận dữ liệu. "Phối hợp ý kiến" được thực hiện dựa trên chuyên môn và kinh nghiệm của bác sĩ, từ đó có thể so sánh kết quả khám của họ với nhau. Đối với điều này, có thể sử dụng phân tích đa biến phương sai và phân tích hồi quy.

Dấu hiệu có thể là cùng một loại, loại hiếm hoặc khác loại. Thuật ngữ này đề cập đến đánh giá đo lường khác nhau của họ. Dấu hiệu định lượng hay dấu hiệu số là những dấu hiệu được đo lường trên một quy mô nhất định và trên thang khoảng cách và tỷ lệ (nhóm dấu hiệu I). Định tính, xếp hạng hoặc cho điểm được sử dụng để thể hiện các thuật ngữ và khái niệm y tế không có giá trị số (ví dụ, mức độ nghiêm trọng của tình trạng) và được đo trên thang thứ tự (nhóm II của các dấu hiệu). Phân loại hoặc danh nghĩa (ví dụ, nghề nghiệp, nhóm máu) là những thứ được đo bằng thang của tên (nhóm III của các dấu hiệu).

Trong nhiều trường hợp, một nỗ lực được thực hiện để phân tích một số lượng cực lớn các tính năng, điều này sẽ giúp tăng hàm lượng thông tin của mẫu được trình bày. Tuy nhiên, việc lựa chọn thông tin hữu ích, tức là việc thực hiện lựa chọn tính năng, là một hoạt động hoàn toàn cần thiết, vì để giải quyết bất kỳ vấn đề phân loại nào, thông tin mang thông tin hữu ích cho nhiệm vụ này phải được lựa chọn. Trong trường hợp vì lý do nào đó mà nhà nghiên cứu không tự mình thực hiện hoặc không có tiêu chí đủ cơ sở để giảm kích thước của không gian đối tượng vì những lý do có ý nghĩa, thì cuộc chiến chống dư thừa thông tin đã được thực hiện bằng các phương pháp chính thức bằng cách đánh giá nội dung thông tin.

Phân tích phương sai cho phép bạn xác định mức độ ảnh hưởng của các yếu tố (điều kiện) khác nhau lên đặc điểm (hiện tượng) đang nghiên cứu, điều này đạt được bằng cách phân tích tổng độ biến thiên (độ phân tán được biểu thị bằng tổng bình phương độ lệch so với mức trung bình chung) thành các thành phần riêng lẻ gây ra bởi ảnh hưởng của các nguồn biến thiên khác nhau.

Với sự trợ giúp của phân tích phương sai, các mối đe dọa của bệnh được kiểm tra khi có các yếu tố nguy cơ. Khái niệm rủi ro tương đối xem xét mối quan hệ giữa bệnh nhân mắc một căn bệnh cụ thể và những người không mắc bệnh đó. Giá trị rủi ro tương đối giúp xác định xác suất mắc bệnh tăng lên bao nhiêu lần khi có mặt của nó, có thể được ước tính bằng cách sử dụng công thức đơn giản sau:

trong đó a là sự hiện diện của một đặc điểm trong nhóm nghiên cứu;

b - sự vắng mặt của một đặc điểm trong nhóm nghiên cứu;

c - sự hiện diện của một dấu hiệu trong nhóm so sánh (đối chứng);

d - không có dấu hiệu trong nhóm so sánh (đối chứng).

Điểm rủi ro thuộc tính (rA) được sử dụng để đánh giá tỷ lệ bệnh tật liên quan đến một yếu tố rủi ro nhất định:

trong đó Q là tần suất của đặc điểm đánh dấu nguy cơ trong quần thể;

r ”- rủi ro tương đối.

Xác định các yếu tố góp phần vào sự xuất hiện (biểu hiện) của bệnh, tức là Các yếu tố rủi ro có thể được thực hiện theo nhiều cách khác nhau, ví dụ, bằng cách đánh giá nội dung thông tin với xếp hạng tiếp theo của các dấu hiệu, tuy nhiên, điều này không chỉ ra tác động tích lũy của các thông số đã chọn, ngược lại với việc sử dụng hồi quy, phân tích yếu tố, các phương pháp của lý thuyết nhận dạng mẫu, giúp có thể thu được "các phức hợp có triệu chứng" của các yếu tố nguy cơ. Ngoài ra, các phương pháp phức tạp hơn giúp có thể phân tích mối quan hệ gián tiếp giữa các yếu tố nguy cơ và bệnh tật / 5 /.

2.3 Kiểm tra sinh học đất

Các chất ô nhiễm đa dạng, đi vào môi trường nông nghiệp, có thể trải qua nhiều biến đổi khác nhau trong đó, đồng thời làm tăng tác dụng độc hại của chúng. Vì lý do này, các phương pháp để đánh giá toàn diện chất lượng của các thành phần nông dược hóa ra là cần thiết. Các nghiên cứu được thực hiện trên cơ sở phân tích phương sai đa biến trong luân canh cây trồng ngũ cốc 11 ruộng. Trong thí nghiệm đã nghiên cứu ảnh hưởng của các yếu tố: độ phì nhiêu của đất (A), hệ thống phân bón (B), hệ thống bảo vệ thực vật (C). Độ phì nhiêu của đất, hệ thống phân bón và hệ thống bảo vệ thực vật được nghiên cứu ở liều lượng 0, 1, 2 và 3. Các phương án cơ bản được thể hiện bằng các tổ hợp sau:

000 - mức độ phì nhiêu ban đầu, không sử dụng phân bón và thuốc bảo vệ thực vật khỏi sâu, bệnh và cỏ dại;

111 - mức độ phì nhiêu trung bình của đất, liều lượng phân bón tối thiểu, khả năng bảo vệ sinh học của thực vật khỏi sâu bệnh;

222 - mức độ phì nhiêu ban đầu của đất, liều lượng phân bón trung bình, hóa chất bảo vệ thực vật khỏi cỏ dại;

333 - độ phì nhiêu của đất, liều lượng phân bón cao, hóa chất bảo vệ thực vật khỏi sâu bệnh.

Chúng tôi đã nghiên cứu các lựa chọn chỉ có một yếu tố:

200 - khả năng sinh sản:

020 - phân bón;

002 - thuốc bảo vệ thực vật.

Cũng như các tùy chọn với sự kết hợp khác nhau của các yếu tố - 111, 131, 133, 022, 220, 202, 331, 313, 311.

Mục đích của nghiên cứu là nghiên cứu sự ức chế của lục lạp và hệ số tăng trưởng tức thời, như các chỉ số của ô nhiễm đất, trong các biến thể khác nhau của một thí nghiệm đa yếu tố.

Sự ức chế quang điều hòa của lục lạp bèo tấm đã được nghiên cứu ở các tầng đất khác nhau: 0–20, 20–40 cm. Tỷ lệ phân tán trong tổng độ phì của đất là 39,7%, hệ thống phân bón - 30,7%, hệ thống bảo vệ thực vật - 30,7%.

Để nghiên cứu ảnh hưởng tổng hợp của các yếu tố đối với sự ức chế quang điều hòa của lục lạp, các tổ hợp khác nhau của các biến thể thử nghiệm đã được sử dụng: trong trường hợp đầu tiên - 000, 002, 022, 222, 220, 200, 202, 020, trong trường hợp thứ hai - 111, 333, 331, 313, 133, 311, 131.

Kết quả phân tích phương sai hai chiều cho thấy ảnh hưởng đáng kể của hệ thống tương tác giữa phân bón và thuốc bảo vệ thực vật đối với sự khác biệt về quang điều hòa đối với trường hợp đầu tiên (tỷ lệ trong tổng phương sai là 10,3%). Đối với trường hợp thứ hai, một ảnh hưởng đáng kể của sự tương tác giữa độ phì nhiêu của đất và hệ thống phân bón (53,2%) đã được tìm thấy.

Trong trường hợp đầu tiên, phân tích ba chiều của phương sai cho thấy ảnh hưởng đáng kể của sự tương tác của cả ba yếu tố. Tỷ trọng trong tổng lượng phân tán là 47,9%.

Hệ số tăng trưởng tức thời được nghiên cứu trong các biến thể khác nhau của thí nghiệm 000, 111, 222, 333, 002, 200, 220. Giai đoạn đầu của thử nghiệm là trước khi áp dụng thuốc diệt cỏ trên cây mì vụ đông (tháng 4), giai đoạn thứ hai là sau lần bón thuốc diệt cỏ (tháng 5) và đợt cuối vào thời kỳ thu hoạch (tháng 7). Tiền thân - hướng dương và ngô làm ngũ cốc.

Sự xuất hiện của các lá mới được quan sát thấy sau một giai đoạn trễ ngắn với thời gian tổng khối lượng tươi tăng gấp đôi là 2-4 ngày.

Trong đối chứng và trong mỗi biến thể, trên cơ sở kết quả thu được, hệ số tăng dân số tức thời r được tính toán, sau đó tính toán thời gian nhân đôi số lá (t gấp đôi).

t tăng gấp đôi \ u003d ln2 / r.

Việc tính toán các chỉ số này được thực hiện trong động lực học với việc phân tích các mẫu đất. Phân tích dữ liệu cho thấy thời gian nhân đôi của quần thể bèo tấm trước khi làm đất là ngắn nhất so với số liệu sau khi làm đất và tại thời điểm thu hoạch. Trong các động thái quan sát, phản ứng của đất sau khi sử dụng thuốc diệt cỏ và tại thời điểm thu hoạch được quan tâm nhiều hơn. Trước hết là sự tương tác với phân bón và mức độ phì nhiêu.

Đôi khi việc nhận được phản ứng trực tiếp đối với việc sử dụng các chế phẩm hóa học có thể phức tạp do sự tương tác của chế phẩm với phân bón, cả hữu cơ và khoáng. Dữ liệu thu được giúp bạn có thể theo dõi động thái phản ứng của các chế phẩm được ứng dụng, trong tất cả các biến thể có biện pháp bảo vệ hóa học, khi sự phát triển của chất chỉ thị bị dừng lại.

Dữ liệu phân tích phương sai một chiều cho thấy ảnh hưởng đáng kể của từng chỉ tiêu đến tốc độ sinh trưởng của bèo tấm ở giai đoạn đầu. Ở giai đoạn thứ hai, ảnh hưởng của sự khác biệt về độ phì của đất là 65,0%, ở hệ thống phân bón và hệ thống bảo vệ thực vật - 65,0% mỗi loại. Các yếu tố cho thấy sự khác biệt đáng kể giữa biến thể 222 và biến thể 000, 111, 333, trung bình về hệ số tăng trưởng tức thời. Ở giai đoạn thứ ba, tỷ lệ phân tán tổng độ phì của đất là 42,9%, hệ thống phân bón và thuốc bảo vệ thực vật hệ thống - 42,9% mỗi hệ thống. Một sự khác biệt đáng kể được ghi nhận trong các giá trị trung bình của các phương án 000 và 111, các phương án 333 và 222.

Các mẫu đất được nghiên cứu từ các phương án giám sát thực địa khác nhau về khả năng ức chế quang điều hòa. Ảnh hưởng của các yếu tố sinh sản được ghi nhận, hệ thống phân bón và thuốc bảo vệ thực vật có tỷ trọng lần lượt là 30,7 và 39,7% trong phân tích đơn nhân tố, trong phân tích hai nhân tố và ba nhân tố đã ghi nhận mức độ ảnh hưởng chung của các nhân tố.

Một phân tích kết quả thí nghiệm cho thấy sự khác biệt không đáng kể giữa các tầng đất về chỉ số ức chế phototaxis. Sự khác biệt được đánh dấu bằng các giá trị trung bình.

Ở tất cả các biến thể có sử dụng thuốc bảo vệ thực vật, ít quan sát thấy sự thay đổi vị trí của lục lạp và sự ngừng sinh trưởng của bèo tấm / 6 /.

2.4 Cúm làm tăng sản xuất histamine

Các nhà nghiên cứu tại Bệnh viện Nhi đồng Pittsburgh (Mỹ) đã nhận được bằng chứng đầu tiên cho thấy nồng độ histamine tăng lên khi nhiễm virus đường hô hấp cấp tính. Mặc dù thực tế là histamine trước đây đã được cho là có vai trò trong việc khởi phát các triệu chứng của nhiễm trùng hô hấp cấp tính ở đường hô hấp trên.

Các nhà khoa học quan tâm đến lý do tại sao nhiều người sử dụng thuốc kháng histamine, ở nhiều quốc gia được đưa vào danh mục thuốc OTC, để tự điều trị "cảm lạnh" và cảm lạnh thông thường. có sẵn mà không cần đơn của bác sĩ.

Mục đích của nghiên cứu này là để xác định xem liệu sản xuất histamine có tăng lên trong quá trình nhiễm vi rút cúm A thực nghiệm hay không.

15 tình nguyện viên khỏe mạnh đã được tiêm vi rút cúm A qua đường mũi và sau đó được quan sát sự phát triển của bệnh nhiễm trùng. Hàng ngày trong suốt quá trình của bệnh, phần nước tiểu buổi sáng được thu thập từ những người tình nguyện, sau đó xác định histamine và các chất chuyển hóa của nó, đồng thời tính toán tổng lượng histamine và các chất chuyển hóa của nó được bài tiết mỗi ngày.

Căn bệnh này phát triển ở tất cả 15 tình nguyện viên. Phân tích phương sai xác nhận mức độ histamine trong nước tiểu cao hơn đáng kể vào ngày thứ 2-5 của nhiễm virus (p<0,02) - период, когда симптомы «простуды» наиболее выражены. Парный анализ показал, что наиболее значительно уровень гистамина повышается на 2 день заболевания. Кроме этого, оказалось, что суточное количество гистамина и его метаболитов в моче при гриппе примерно такое же, как и при обострении аллергического заболевания.

Kết quả của nghiên cứu này là bằng chứng trực tiếp đầu tiên cho thấy nồng độ histamine tăng cao trong nhiễm trùng đường hô hấp cấp tính / 7 /.

Phân tích phương sai trong hóa học

Phân tích độ phân tán là một tập hợp các phương pháp để xác định độ phân tán, tức là các đặc điểm của kích thước hạt trong hệ phân tán. Phân tích độ phân tán bao gồm các phương pháp khác nhau để xác định kích thước của các hạt tự do trong môi trường lỏng và khí, kích thước của các kênh lỗ trong các thể xốp mịn (trong trường hợp này, khái niệm độ xốp tương đương được sử dụng thay cho khái niệm phân tán), cũng như diện tích bề mặt cụ thể. Một số phương pháp phân tích độ phân tán có thể thu được bức tranh toàn cảnh về sự phân bố của các hạt theo kích thước (thể tích), trong khi những phương pháp khác chỉ đưa ra đặc tính trung bình của độ phân tán (độ xốp).

Nhóm thứ nhất bao gồm, ví dụ, các phương pháp xác định kích thước của các hạt riêng lẻ bằng phép đo trực tiếp (phân tích sàng, kính hiển vi quang học và điện tử) hoặc bằng dữ liệu gián tiếp: tốc độ lắng của các hạt trong môi trường nhớt (phân tích lắng trong trường hấp dẫn và trong máy ly tâm), cường độ của các xung dòng điện, phát sinh từ việc các hạt đi qua một lỗ trên một vách ngăn không dẫn điện (phương pháp đo độ dẫn điện).

Nhóm phương pháp thứ hai kết hợp việc ước lượng kích thước trung bình của các hạt tự do và xác định diện tích bề mặt riêng của bột và thể xốp. Kích thước hạt trung bình được tìm thấy bằng cường độ ánh sáng tán xạ (phép đo nephelometry), sử dụng kính siêu hiển vi, phương pháp khuếch tán, v.v., bề mặt cụ thể được tìm thấy bằng sự hấp phụ của khí (hơi) hoặc các chất hòa tan, bằng tính thấm khí, tốc độ hòa tan, và các phương pháp khác. Dưới đây là các giới hạn về khả năng áp dụng của các phương pháp phân tích phương sai khác nhau (kích thước hạt tính bằng mét):

Phân tích rây - 10 -2 -10 -4

Phân tích trầm tích trong trường hấp dẫn - 10 -4 -10 -6

Phương pháp đo độ dẫn - 10 -4 -10 -6

Kính hiển vi - 10 -4-10-7

Phương pháp lọc - 10 -5-10 -7

Ly tâm - 10-6-10-8

Siêu ly tâm - 10-7-10-9

Soi siêu vi - 10 -7 -10 -9

Phép đo thận trọng - 10 -7 -10 -9

Kính hiển vi điện tử - 10 -7 -10 -9

Phương pháp khuếch tán - 10 -7 -10 -10

Phân tích phân tán được sử dụng rộng rãi trong các lĩnh vực khoa học và sản xuất công nghiệp khác nhau để đánh giá sự phân tán của các hệ thống (huyền phù, nhũ tương, dung môi, bột, chất hấp phụ, v.v.) với kích thước hạt từ vài mm (10 -3 m) đến vài nanomet (10 -9 m) / 8 /.

2.6 Việc sử dụng gợi ý trực tiếp có chủ đích ở trạng thái thức trong phương pháp giáo dục các tố chất thể lực

Rèn luyện thân thể là mặt cơ bản của huấn luyện thể thao, vì ở mức độ lớn hơn các khía cạnh khác của huấn luyện, nó được đặc trưng bởi tải trọng vật chất tác động đến các đặc tính hình thái và chức năng của cơ thể. Sự thành công của huấn luyện kỹ thuật, nội dung chiến thuật của vận động viên, việc thực hiện các tính chất cá nhân trong quá trình tập luyện và thi đấu phụ thuộc vào mức độ thể lực.

Một trong những nhiệm vụ chính của rèn luyện thân thể là giáo dục các tố chất thể lực. Về vấn đề này, cần phát triển các công cụ và phương pháp sư phạm cho phép tính đến đặc điểm lứa tuổi của các vận động viên trẻ mà bảo toàn được sức khỏe, không cần thêm thời gian, đồng thời kích thích tăng trưởng các tố chất thể lực và như một quả, tinh thần thể thao. Việc sử dụng dị ngôn trong quá trình đào tạo ở các nhóm đào tạo sơ cấp là một trong những lĩnh vực nghiên cứu đầy hứa hẹn về vấn đề này.

Một phân tích về lý thuyết và thực tiễn của việc thực hiện ảnh hưởng khác biệt bằng lời nói truyền cảm hứng cho thấy những mâu thuẫn chính:

Bằng chứng về việc sử dụng có hiệu quả các phương pháp cụ thể để gây rối bằng lời nói trong quá trình đào tạo và việc huấn luyện viên không thể sử dụng chúng trong thực tế;

Việc thừa nhận gợi ý có chủ đích trực tiếp (sau đây gọi là DSP) ở trạng thái thức như một trong những phương pháp chính của sự phản cảm bằng lời nói trong hoạt động sư phạm của một huấn luyện viên và thiếu cơ sở lý thuyết cho các tính năng phương pháp luận của việc sử dụng nó trong huấn luyện thể thao, và cụ thể là trong quá trình giáo dục các tố chất thể lực.

Liên quan đến những mâu thuẫn đã xác định và sự phát triển chưa đầy đủ, vấn đề sử dụng hệ thống các phương pháp giáo dục ngôn từ trong quá trình giáo dục tố chất thể lực của vận động viên đã xác định trước mục đích nghiên cứu - xây dựng các phương pháp PPV có mục tiêu hợp lý ở trạng thái thức, góp phần hoàn thiện quá trình giáo dục các tố chất thể lực trên cơ sở đánh giá trạng thái tinh thần, biểu hiện và tính năng động của các tố chất thể lực vận động viên judo các nhóm đào tạo sơ cấp.

Để kiểm tra và xác định hiệu quả của các phương pháp thực nghiệm PPV đối với sự phát triển tố chất thể lực của đô vật judo, một thực nghiệm sư phạm so sánh đã được tiến hành, trong đó bốn nhóm tham gia - ba thực nghiệm và một đối chứng. Trong nhóm thí nghiệm đầu tiên (EG), kỹ thuật PPV M1 được sử dụng, trong nhóm thứ hai - kỹ thuật PPV M2, trong nhóm thứ ba - kỹ thuật PPV M3. Trong nhóm đối chứng (CG), phương pháp PPV không được sử dụng.

Để xác định hiệu quả của tác động sư phạm của các phương pháp PPV trong quá trình giáo dục tố chất thể chất cho các judokas, một phân tích phương sai một nhân tố đã được thực hiện.

Mức độ ảnh hưởng của phương pháp luận PPV M1 trong quá trình giáo dục:

Độ bền:

a) sau tháng thứ ba là 11,1%;

Khả năng tốc độ:

a) sau tháng đầu tiên - 16,4%;

b) sau lần thứ hai - 26,5%;

c) sau lần thứ ba - 34,8%;

a) sau tháng thứ hai - 26,7%;

b) sau lần thứ ba - 35,3%;

Uyển chuyển:

a) sau tháng thứ ba - 20,8%;

a) Sau tháng thứ hai của đợt thực nghiệm sư phạm chính, mức độ ảnh hưởng của phương pháp là 6,4%;

b) sau lần thứ ba - 10,2%.

Do đó, các chỉ tiêu đánh giá mức độ phát triển các tố chất thể lực theo phương pháp PPV M1 được nhận thấy ở khả năng tốc độ và sức bền, mức độ ảnh hưởng của phương pháp này trong trường hợp này là lớn nhất. Mức độ ảnh hưởng ít nhất của phương pháp luận được tìm thấy trong quá trình giáo dục khả năng bền bỉ, linh hoạt và phối hợp, điều này tạo cơ sở để nói về hiệu quả không đầy đủ của việc sử dụng phương pháp PPV M1 trong việc giáo dục những phẩm chất này.

Mức độ ảnh hưởng của phương pháp PPV M2 trong quá trình giáo dục:

Sức bền

a) sau tháng đầu tiên của thử nghiệm - 12,6%;

b) sau lần thứ hai - 17,8%;

c) sau lần thứ ba - 20,3%.

Khả năng tốc độ:

a) Sau tháng đào tạo thứ ba - 28%.

a) sau tháng thứ hai - 27,9%;

b) sau lần thứ ba - 35,9%.

Uyển chuyển:

a) sau tháng huấn luyện thứ ba - 14,9%;

Khả năng phối hợp - 13,1%.

Kết quả thu được của phép phân tích phương sai đơn nhân tố của phương sai EG này cho phép chúng tôi kết luận rằng phương pháp PPV M2 là hiệu quả nhất trong việc phát triển sức bền và sức mạnh. Nó kém hiệu quả hơn trong quá trình phát triển tính linh hoạt, tốc độ và khả năng phối hợp.

Mức độ ảnh hưởng của phương pháp luận PPV M3 trong quá trình giáo dục:

Độ bền:

a) Sau tháng đầu thí nghiệm 16,8%;

b) sau lần thứ hai - 29,5%;

c) sau lần thứ ba - 37,6%.

Khả năng tốc độ:

a) sau tháng đầu tiên - 26,3%;

b) sau lần thứ hai - 31,3%;

c) sau lần thứ ba - 40,9%.

a) sau tháng đầu tiên - 18,7%;

b) sau lần thứ hai - 26,7%;

c) sau lần thứ ba - 32,3%.

Uyển chuyển:

a) sau lần đầu tiên - không có thay đổi nào;

b) sau lần thứ hai - 16,9%;

c) sau lần thứ ba - 23,5%.

Khả năng phối hợp:

a) không có thay đổi nào sau tháng đầu tiên;

b) sau lần thứ hai - 23,8%;

c) sau lần thứ ba - 91%.

Như vậy, phân tích phương sai một nhân tố cho thấy việc sử dụng phương pháp PPV M3 ở giai đoạn dự bị là có hiệu quả nhất trong quá trình giáo dục các tố chất thể lực, vì mức độ ảnh hưởng của nó tăng lên sau mỗi tháng thực nghiệm sư phạm. / 9 /.

2.7 Làm giảm các triệu chứng loạn thần cấp tính ở bệnh nhân tâm thần phân liệt bằng thuốc chống loạn thần không điển hình

Mục đích của nghiên cứu là nghiên cứu khả năng sử dụng rispolept để giảm rối loạn tâm thần cấp tính ở bệnh nhân được chẩn đoán là tâm thần phân liệt (loại hoang tưởng theo ICD-10) và rối loạn phân liệt. Đồng thời, chỉ số về thời gian tồn tại của các triệu chứng loạn thần khi điều trị bằng dược lý với rispolept (nhóm chính) và thuốc chống loạn thần cổ điển được sử dụng làm tiêu chí chính trong nghiên cứu.

Mục tiêu chính của nghiên cứu là xác định chỉ số về thời gian rối loạn tâm thần (còn gọi là rối loạn tâm thần thuần), được hiểu là việc duy trì các triệu chứng loạn thần có hiệu quả kể từ khi bắt đầu sử dụng thuốc chống loạn thần, tính bằng ngày. Chỉ số này được tính riêng cho nhóm risperidone và riêng cho nhóm chống loạn thần cổ điển.

Cùng với đó, nhiệm vụ được đặt ra là xác định tỷ lệ giảm các triệu chứng sản sinh dưới ảnh hưởng của risperidone so với các thuốc chống loạn thần cổ điển ở các giai đoạn điều trị khác nhau.

Tổng số 89 bệnh nhân (42 nam và 47 nữ) có các triệu chứng loạn thần cấp tính ở dạng hoang tưởng tâm thần phân liệt (49 bệnh nhân) và rối loạn phân liệt (40 bệnh nhân) đã được nghiên cứu.

Đợt đầu tiên và thời gian mắc bệnh lên đến 1 năm được ghi nhận ở 43 bệnh nhân, trong khi trong các trường hợp khác tại thời điểm nghiên cứu, các đợt tâm thần phân liệt tiếp theo được ghi nhận với thời gian bệnh kéo dài hơn 1 năm.

Liệu pháp Rispoleptom đã được 29 người tiếp nhận, trong đó có 15 bệnh nhân được gọi là đợt đầu tiên. Trị liệu bằng thuốc an thần kinh cổ điển được 60 người tiếp nhận, trong đó có 28 người khỏi đợt đầu. Liều rispolept thay đổi trong khoảng từ 1 đến 6 mg mỗi ngày và trung bình là 4 ± 0,4 mg / ngày. Risperidone được dùng hoàn toàn bằng đường uống sau bữa ăn mỗi ngày một lần vào buổi tối.

Điều trị bằng thuốc chống loạn thần cổ điển bao gồm sử dụng trifluoperazine (triftazine) với liều hàng ngày lên đến 30 mg tiêm bắp, haloperidol với liều hàng ngày lên đến 20 mg tiêm bắp, triperidol với liều hàng ngày lên đến 10 mg uống. Phần lớn bệnh nhân dùng thuốc chống loạn thần cổ điển dưới dạng đơn trị liệu trong hai tuần đầu tiên, sau đó họ chuyển sang dùng kết hợp một số thuốc chống loạn thần cổ điển nếu cần thiết (trong khi vẫn duy trì các triệu chứng hoang tưởng, ảo giác hoặc các triệu chứng sản sinh khác). Đồng thời, thuốc an thần kinh có tác dụng chống hoang tưởng và chống ảo giác rõ rệt (ví dụ: haloperidol hoặc triftazin) vẫn là loại thuốc chính, một loại thuốc có tác dụng gây ngủ khác biệt (chlorpromazine, tizercin, chlorprothixene với liều lượng lên đến 50-100 mg / ngày) được thêm vào nó vào buổi tối.

Trong nhóm dùng thuốc chống loạn thần cổ điển, người ta đã lên kế hoạch dùng thuốc điều chỉnh kháng cholinergic (Parkopan, Cyclodol) với liều lên đến 10-12 mg / ngày. Thuốc điều chỉnh được kê đơn trong trường hợp xuất hiện các tác dụng phụ ngoại tháp riêng biệt ở dạng loạn trương lực cơ cấp tính, bệnh parkinson do thuốc và chứng loạn thần kinh.

Bảng 2.1 trình bày dữ liệu về thời gian loạn thần trong điều trị rispolept và thuốc chống loạn thần cổ điển.

Bảng 2.1 - Thời gian rối loạn tâm thần ("rối loạn tâm thần thực") trong điều trị rispolept và thuốc chống loạn thần cổ điển

Như sau từ dữ liệu trong bảng, khi so sánh thời gian rối loạn tâm thần trong khi điều trị với thuốc chống loạn thần cổ điển và risperidone, thì thời gian của các triệu chứng loạn thần dưới ảnh hưởng của rispolept đã giảm gần hai lần. Điều quan trọng là cả yếu tố về số lần co giật cũng như bản chất của hình ảnh hội chứng hàng đầu đều không ảnh hưởng đến giá trị này của thời gian rối loạn tâm thần. Nói cách khác, thời gian rối loạn tâm thần chỉ được xác định bởi yếu tố trị liệu, tức là phụ thuộc vào loại thuốc được sử dụng, không phụ thuộc vào số thứ tự của cơn, thời gian của bệnh và bản chất của hội chứng tâm thần hàng đầu.

Để xác nhận sự đều đặn thu được, một phân tích phương sai hai nhân tố đã được thực hiện. Đồng thời, tương tác của yếu tố trị liệu và số thứ tự của cơn (giai đoạn 1) và tương tác của yếu tố trị liệu và bản chất của hội chứng hàng đầu (giai đoạn 2) đã được tính đến lần lượt. Kết quả phân tích phương sai khẳng định ảnh hưởng của yếu tố trị liệu đến thời gian loạn thần (F = 18,8) trong trường hợp không có ảnh hưởng của yếu tố số cơn (F = 2,5) và yếu tố loại hội chứng tâm thần (F = 1,7 ). Điều quan trọng là không có ảnh hưởng chung của yếu tố trị liệu và số cơn lên thời gian loạn thần, cũng như ảnh hưởng chung của yếu tố trị liệu và yếu tố hội chứng tâm thần.

Do đó, kết quả phân tích phương sai khẳng định ảnh hưởng của chỉ yếu tố của thuốc chống loạn thần được áp dụng. Rispolept rõ ràng đã dẫn đến việc giảm thời gian của các triệu chứng loạn thần so với các thuốc chống loạn thần truyền thống khoảng 2 lần. Điều quan trọng là hiệu quả này đã đạt được mặc dù đã dùng rispolept đường uống, trong khi các thuốc chống loạn thần cổ điển được sử dụng đường tiêm ở hầu hết bệnh nhân / 10 /.

2.8 Sự cong vênh của các sợi ưa thích với hiệu ứng di chuyển

Trường Đại học Công nghệ Bang Kostroma đã phát triển một cấu trúc ren có hình dạng mới với các thông số hình học thay đổi. Về vấn đề này, có một vấn đề trong việc xử lý sợi ưa thích trong quá trình sản xuất chuẩn bị. Nghiên cứu này được dành cho quá trình cong vênh về các vấn đề: sự lựa chọn của loại bộ căng, tạo ra độ căng giãn tối thiểu và sự liên kết của lực căng, các sợi có mật độ tuyến tính khác nhau dọc theo chiều rộng của trục cong.

Đối tượng nghiên cứu của đề tài là một sợi vải lanh có bốn biến thể của mật độ tuyến tính từ 140 đến 205 tex. Công việc của các thiết bị căng gồm ba loại được nghiên cứu: máy rửa sứ, hai vùng NS-1P và một vùng NS-1P. Một nghiên cứu thực nghiệm về sức căng của sợi cong vênh đã được thực hiện trên máy uốn cong SP-140-3L. Tốc độ cong vênh, trọng lượng của đĩa phanh tương ứng với các thông số công nghệ về độ cong vênh của sợi.

Để nghiên cứu sự phụ thuộc của lực căng của sợi định hình vào các thông số hình học trong quá trình cong vênh, người ta tiến hành phân tích hai yếu tố: X 1 - đường kính của tác dụng, X 2 - chiều dài của tác dụng. Các tham số đầu ra là lực căng Y 1 và dao động lực căng Y 2.

Các phương trình hồi quy kết quả phù hợp với dữ liệu thực nghiệm ở mức ý nghĩa 0,95, vì tiêu chí Fisher được tính toán cho tất cả các phương trình đều nhỏ hơn tiêu chí dạng bảng.

Để xác định mức độ ảnh hưởng của các yếu tố X 1 và X 2 đến các thông số Y 1 và Y 2, một phân tích phương sai đã được thực hiện, cho thấy rằng đường kính của tác động có ảnh hưởng lớn hơn đến mức độ và sự dao động của lực căng. .

Một phân tích so sánh của các tensogram thu được cho thấy rằng sự trải rộng tối thiểu của lực căng trong quá trình cong của sợi này được cung cấp bởi một thiết bị căng hai vùng NS-1P.

Người ta đã chứng minh rằng với sự gia tăng mật độ tuyến tính từ 105 lên 205 tex, thiết bị NS-1P chỉ tăng mức độ căng lên 23%, trong khi máy rửa sứ - 37%, NS-1P một vùng - tăng 53%.

Khi tạo hình các trục cong vênh, bao gồm cả ren định hình và ren "mịn", cần phải điều chỉnh riêng bộ căng bằng phương pháp truyền thống / 11 /.

2.9 Bệnh lý kèm theo mất răng hoàn toàn ở người già và người già

Sự mất răng hoàn toàn về mặt dịch tễ học và bệnh lý đồng thời của người già sống trong các viện dưỡng lão trên lãnh thổ Chuvashia đã được nghiên cứu. Việc khám được thực hiện bằng phương pháp khám răng và điền phiếu thống kê 784 người. Kết quả phân tích cho thấy tỷ lệ mất răng hoàn toàn cao, nặng thêm do bệnh lý chung của cơ thể. Điều này đặc trưng cho nhóm dân số được kiểm tra như một nhóm có nguy cơ nha khoa gia tăng và yêu cầu sửa đổi toàn bộ hệ thống chăm sóc răng miệng của họ.

Ở người cao tuổi, tỷ lệ mắc bệnh cao gấp hai lần, và ở tuổi già cao gấp sáu lần so với tỷ lệ mắc bệnh ở người trẻ tuổi.

Các bệnh chính của người già và người già là các bệnh về hệ tuần hoàn, hệ thần kinh và cơ quan cảm giác, cơ quan hô hấp, cơ quan tiêu hóa, xương và các cơ quan vận động, ung thư và chấn thương.

Mục đích của nghiên cứu là phát triển và thu thập thông tin về các bệnh đồng thời, hiệu quả của phục hình và nhu cầu điều trị chỉnh hình của người già và người già bị mất răng hoàn toàn.

Tổng số 784 người từ 45 đến 90 tuổi đã được khám. Tỷ lệ giữa nữ và nam là 2,8: 1.

Đánh giá mối quan hệ thống kê bằng cách sử dụng hệ số tương quan của các cấp bậc của Pearson có thể thiết lập ảnh hưởng lẫn nhau của việc không có răng đến tỷ lệ mắc bệnh đồng thời với mức độ tin cậy p = 0,0005. Người cao tuổi bị mất răng hoàn toàn mắc các bệnh đặc trưng của tuổi già, đó là xơ vữa động mạch não và tăng huyết áp.

Phân tích phương sai cho thấy tính đặc hiệu của bệnh đóng vai trò quyết định trong các điều kiện nghiên cứu. Vai trò của các dạng nosological trong các thời kỳ tuổi khác nhau dao động từ 52-60%. Tác động có ý nghĩa thống kê lớn nhất đối với việc không có răng là do các bệnh về hệ tiêu hóa và bệnh đái tháo đường.

Nhìn chung, nhóm bệnh nhân 75-89 tuổi được đặc trưng bởi một số lượng lớn các bệnh lý.

Trong nghiên cứu này, một nghiên cứu so sánh về tỷ lệ mắc bệnh đi kèm giữa những bệnh nhân mất răng hoàn toàn ở người già và người già sống trong viện dưỡng lão được thực hiện. Tỷ lệ mất răng cao ở những người trong độ tuổi này. Ở những bệnh nhân có tuyến phụ hoàn toàn, đặc điểm bệnh đi kèm của tuổi này được quan sát thấy. Xơ vữa động mạch và tăng huyết áp là những bệnh phổ biến nhất ở những người được khám. Tác động lên tình trạng khoang miệng của các bệnh như bệnh đường tiêu hóa và đái tháo đường là có ý nghĩa thống kê, tỷ lệ của các dạng nozoological khác nằm trong khoảng 52-60%. Việc sử dụng phân tích phương sai không xác nhận vai trò đáng kể của giới tính và nơi cư trú đối với các chỉ số về tình trạng khoang miệng.

Như vậy, kết luận, cần lưu ý rằng phân tích sự phân bố các bệnh đồng thời ở những người không có răng hoàn toàn ở người già và người già cho thấy rằng nhóm công dân này thuộc nhóm dân số đặc biệt cần được chăm sóc răng miệng đầy đủ. chăm sóc trong khuôn khổ hệ thống nha khoa hiện có / 12 /.

3 Phân tích phương sai trong bối cảnh của các phương pháp thống kê

Phương pháp phân tích thống kê là một phương pháp luận để đo lường kết quả hoạt động của con người, tức là chuyển các đặc điểm định tính thành định lượng.

Các bước chính trong phân tích thống kê:

Lập kế hoạch thu thập dữ liệu ban đầu - giá trị của các biến đầu vào (X 1, ..., X p), số lần quan sát n. Bước này được thực hiện khi thử nghiệm đã được lên kế hoạch tích cực.

Lấy dữ liệu ban đầu và nhập chúng vào máy tính. Ở giai đoạn này, các mảng số được hình thành (x 1i, ..., x pi; y 1i, ..., y qi), i = 1, ..., n, với n là cỡ mẫu.

Xử lý dữ liệu thống kê sơ cấp. Ở giai đoạn này, một mô tả thống kê về các tham số được xem xét được hình thành:

a) xây dựng và phân tích các phụ thuộc thống kê;

b) phân tích tương quan được thiết kế để đánh giá mức độ ảnh hưởng của các yếu tố (X 1, ..., X p) đến phản ứng Y;

c) phân tích phương sai được sử dụng để đánh giá ảnh hưởng của các yếu tố phi định lượng (X 1, ..., X p) đến phản ứng Y nhằm chọn ra yếu tố quan trọng nhất trong số đó;

d) phân tích hồi quy được thiết kế để xác định sự phụ thuộc phân tích của phản ứng Y vào các yếu tố định lượng X;

Giải thích các kết quả trong điều kiện của nhiệm vụ đặt ra / 13 /.

Bảng 3.1 trình bày các phương pháp thống kê mà các vấn đề phân tích được giải quyết. Các ô tương ứng của bảng chứa tần suất áp dụng các phương pháp thống kê:

Nhãn "-" - phương pháp không được áp dụng;

Nhãn "+" - phương thức được áp dụng;

Nhãn "++" - phương thức được sử dụng rộng rãi;

Nhãn "+++" - ứng dụng của phương pháp được quan tâm đặc biệt / 14 /.

Phân tích phương sai, giống như kiểm định t của Student, cho phép bạn đánh giá sự khác biệt giữa các phương tiện mẫu; tuy nhiên, không giống như thử nghiệm t, nó không có hạn chế về số lượng phương tiện được so sánh. Do đó, thay vì hỏi liệu hai phương tiện mẫu có khác nhau hay không, người ta có thể đánh giá xem hai, ba, bốn, năm hay k có khác nhau hay không.

ANOVA cho phép xử lý đồng thời hai hoặc nhiều biến độc lập (đặc trưng, nhân tố), không chỉ đánh giá tác động của từng biến một cách riêng biệt mà còn cả ảnh hưởng của sự tương tác giữa chúng / 15 /.

Bảng 3.1 - Ứng dụng của phương pháp thống kê trong giải các bài toán phân tích

Các nhiệm vụ phân tích phát sinh trong lĩnh vực kinh doanh, tài chính và quản lý	Phương pháp thống kê mô tả	Phương pháp xác minh các giả thuyết thống kê	Phương pháp phân tích hồi quy	Phương pháp phân tích độ phân tán	Phương pháp phân tích đa biến	Phương pháp phân tích phân biệt	cluster-nogo	Phương pháp phân tích khả năng sống sót	Phương pháp phân tích và dự báo chuỗi thời gian
Nhiệm vụ của phân tích theo chiều ngang (thời gian)
Nhiệm vụ của phân tích theo chiều dọc (cấu trúc)
Nhiệm vụ của phân tích và dự báo xu hướng
Nhiệm vụ phân tích các chỉ tiêu tương đối
Nhiệm vụ của phân tích so sánh (không gian)
Nhiệm vụ của phân tích nhân tố

Đối với hầu hết các hệ thống phức tạp, nguyên tắc Pareto được áp dụng, theo đó 20% các yếu tố quyết định các thuộc tính của hệ thống bằng 80%. Vì vậy, nhiệm vụ hàng đầu của người nghiên cứu mô hình mô phỏng là loại bỏ những yếu tố không đáng kể, điều này làm giảm chiều của bài toán tối ưu hóa mô hình.

Phân tích phương sai đánh giá độ lệch của các quan sát so với giá trị trung bình tổng thể. Sau đó, sự biến đổi được chia thành nhiều phần, mỗi phần đều có nguyên nhân riêng của nó. Phần dư của biến thể, không thể liên quan đến các điều kiện của thí nghiệm, được coi là sai số ngẫu nhiên của nó. Để xác nhận tầm quan trọng, một phép thử đặc biệt được sử dụng - F-Statistics.

Phân tích phương sai xác định xem có ảnh hưởng hay không. Phân tích hồi quy cho phép bạn dự đoán phản hồi (giá trị của hàm mục tiêu) tại một số điểm trong không gian tham số. Nhiệm vụ trước mắt của phân tích hồi quy là ước lượng các hệ số hồi quy / 16 /.

Cỡ mẫu quá lớn làm cho việc phân tích thống kê trở nên khó khăn, vì vậy việc giảm cỡ mẫu là rất hợp lý.

Bằng cách áp dụng phân tích phương sai, có thể xác định tầm quan trọng của ảnh hưởng của các yếu tố khác nhau đến biến số đang nghiên cứu. Nếu ảnh hưởng của một yếu tố hóa ra là không đáng kể, thì yếu tố này có thể được loại trừ khỏi quá trình xử lý tiếp theo.

Các nhà kinh tế lượng vĩ mô phải có khả năng giải quyết bốn vấn đề riêng biệt về mặt logic:

Mô tả dữ liệu;

Dự báo kinh tế vĩ mô;

Suy luận cấu trúc;

Phân tích chính sách.

Mô tả dữ liệu có nghĩa là mô tả các thuộc tính của một hoặc nhiều chuỗi thời gian và truyền đạt các thuộc tính này cho nhiều nhà kinh tế học. Dự báo kinh tế vĩ mô có nghĩa là dự đoán quá trình phát triển của nền kinh tế, thường là từ hai đến ba năm hoặc ít hơn (chủ yếu là do quá khó để dự báo trong tầm nhìn dài hơn). Suy luận cấu trúc có nghĩa là kiểm tra xem dữ liệu kinh tế vĩ mô có phù hợp với một lý thuyết kinh tế cụ thể hay không. Việc phân tích chính sách kinh tế lượng vĩ mô tiến hành theo nhiều hướng: một mặt, tác động lên nền kinh tế của một sự thay đổi giả định trong các công cụ chính sách (ví dụ, thuế suất hoặc lãi suất ngắn hạn), mặt khác, tác động của đánh giá sự thay đổi trong các quy tắc chính sách (ví dụ, sự chuyển đổi sang chế độ chính sách tiền tệ mới). Một dự án nghiên cứu kinh tế vĩ mô thực nghiệm có thể bao gồm một hoặc nhiều trong bốn nhiệm vụ này. Mỗi vấn đề phải được giải quyết theo cách có tính đến mối tương quan giữa các chuỗi thời gian.

Trong những năm 1970, những vấn đề này đã được giải quyết bằng nhiều phương pháp, mà nếu đánh giá từ các quan điểm hiện đại, thì không đủ vì một số lý do. Để mô tả động lực học của một chuỗi riêng lẻ, chỉ cần sử dụng mô hình một chiều của chuỗi thời gian là đủ, và để mô tả động lực học chung của hai chuỗi, chỉ cần sử dụng phân tích quang phổ là đủ. Tuy nhiên, không có ngôn ngữ chung nào phù hợp để mô tả một cách hệ thống các đặc tính động chung của một số chuỗi thời gian. Các dự báo kinh tế được đưa ra bằng cách sử dụng các mô hình đường trung bình động tự động hồi quy (ARMA) đơn giản hóa hoặc sử dụng các mô hình kinh tế lượng cấu trúc lớn phổ biến vào thời điểm đó. Suy luận cấu trúc dựa trên các mô hình đơn phương trình nhỏ hoặc trên các mô hình lớn mà việc xác định đạt được thông qua các ràng buộc loại trừ thiếu cơ sở và thường không bao gồm các kỳ vọng. Phân tích chính sách theo mô hình cấu trúc phụ thuộc vào các giả định xác định này.

Cuối cùng, sự gia tăng giá trong những năm 1970 được nhiều người coi là một trở ngại lớn đối với các mô hình lớn đang được sử dụng để đưa ra các khuyến nghị chính sách vào thời điểm đó. Đó là, đây là thời điểm thích hợp cho sự xuất hiện của một cấu trúc kinh tế lượng vĩ mô mới có thể giải quyết nhiều vấn đề này.

Vào năm 1980, một cấu trúc như vậy đã được tạo ra - tự động phá vỡ vectơ (VAR). Thoạt nhìn, VAR không gì khác hơn là sự tổng quát của phép tự hồi quy đơn biến thành trường hợp đa biến, và mỗi phương trình trong VAR chỉ là một hồi quy bình phương nhỏ nhất đơn giản của một biến trên các giá trị trễ của chính nó và các biến khác trong VAR. Nhưng công cụ có vẻ đơn giản này giúp nó có thể nắm bắt một cách nhất quán và nội bộ một cách có hệ thống các động lực phong phú của chuỗi thời gian đa biến, và bộ công cụ thống kê đi kèm với VAR tỏ ra thuận tiện và rất quan trọng là dễ diễn giải.

Có ba mô hình VAR khác nhau:

Dạng VAR rút gọn;

VAR đệ quy;

Cấu trúc VAR.

Cả ba đều là mô hình tuyến tính động liên hệ các giá trị hiện tại và quá khứ của vectơ Y t của một chuỗi thời gian n chiều. Dạng rút gọn và VAR đệ quy là các mô hình thống kê không sử dụng bất kỳ cân nhắc kinh tế nào ngoài việc lựa chọn các biến. Các VAR này được sử dụng để mô tả dữ liệu và dự báo. VAR cấu trúc bao gồm các ràng buộc xuất phát từ lý thuyết kinh tế vĩ mô và VAR này được sử dụng để suy luận cấu trúc và phân tích chính sách.

Dạng trên của VAR biểu thị Y t như một độ trễ quá khứ phân tán cộng với một thuật ngữ lỗi không tương quan nối tiếp, nghĩa là nó tổng quát hóa tự động phạm vi đơn biến đối với trường hợp của vectơ. Dạng rút gọn về mặt toán học của mô hình VAR là một hệ thống gồm n phương trình có thể được viết dưới dạng ma trận như sau:

trong đó  là n l vectơ của hằng số;

A 1, A 2, ..., A p là n n ma trận hệ số;

 t, là một vectơ nl của các lỗi không tương quan với nhau, được giả định là có giá trị trung bình bằng 0 và ma trận hiệp phương sai.

Sai số  t, trong (17) là động lực không mong muốn trong Y t, còn lại sau khi tính đến độ trễ phân phối tuyến tính của các giá trị trong quá khứ.

Dễ dàng ước lượng các tham số của dạng VAR rút gọn. Mỗi phương trình chứa cùng các bộ hồi quy (Y t – 1, ..., Y t – p) và không có hạn chế lẫn nhau giữa các phương trình. Do đó, ước lượng hiệu quả (phương pháp khả năng xảy ra tối đa với đầy đủ thông tin) được đơn giản hóa thành bình phương nhỏ nhất thông thường áp dụng cho mỗi phương trình. Ma trận hiệp phương sai có thể được ước lượng một cách hợp lý bằng ma trận hiệp phương sai mẫu thu được từ phần dư LSM.

Sự tinh tế duy nhất là xác định độ dài trễ p, nhưng điều này có thể được thực hiện bằng cách sử dụng một tiêu chí thông tin như AIC hoặc BIC.

Ở cấp phương trình ma trận, VAR đệ quy và cấu trúc trông giống nhau. Hai mô hình VAR này tính đến các tương tác đồng thời giữa các phần tử của Y t một cách rõ ràng, điều này dẫn đến việc thêm một số hạng đồng thời vào vế phải của phương trình (17). Theo đó, VAR đệ quy và VAR cấu trúc đều được biểu diễn ở dạng tổng quát sau:

trong đó  - vectơ của hằng số;

B 0, ..., B p - ma trận;

 t - lỗi.

Sự hiện diện của ma trận B 0 trong phương trình có nghĩa là khả năng xảy ra tương tác đồng thời giữa n biến; nghĩa là, B 0 cho phép bạn làm cho các biến này có liên quan đến cùng một thời điểm, được xác định cùng nhau.

VAR đệ quy có thể được ước tính theo hai cách. Cấu trúc đệ quy đưa ra một tập các phương trình đệ quy có thể được ước lượng bằng phương pháp bình phương nhỏ nhất. Một phương pháp ước lượng tương đương là các phương trình ở dạng rút gọn (17), được coi là một hệ thống, được nhân từ bên trái với ma trận tam giác dưới.

Phương pháp ước tính VAR cấu trúc phụ thuộc vào cách xác định chính xác B 0. Cách tiếp cận thông tin từng phần đòi hỏi việc sử dụng các phương pháp ước lượng phương trình đơn lẻ như bình phương nhỏ nhất hai bước. Cách tiếp cận thông tin đầy đủ đòi hỏi việc sử dụng các phương pháp ước lượng đa phương trình như bình phương nhỏ nhất ba bước.

Hãy lưu ý nhiều loại VAR khác nhau. Dạng rút gọn của VAR là duy nhất. Thứ tự của các biến trong Y t tương ứng với một VAR đệ quy duy nhất, nhưng có n! các đơn đặt hàng như vậy, tức là N! các VAR đệ quy khác nhau. Số lượng VAR cấu trúc - tức là tập hợp các giả định xác định mối quan hệ đồng thời giữa các biến - chỉ bị giới hạn bởi sự khéo léo của nhà nghiên cứu.

Vì ma trận của các hệ số VAR ước tính khó diễn giải trực tiếp, nên kết quả ước lượng VAR thường được biểu diễn bằng một số hàm của các ma trận này. Để phân tích thống kê như vậy của các lỗi dự báo.

Mở rộng phương sai sai dự báo được tính toán chủ yếu cho các hệ thống cấu trúc hoặc đệ quy. Sự phân tách phương sai này cho thấy mức độ quan trọng của sai số trong phương trình thứ j để giải thích những thay đổi không mong muốn trong biến thứ i. Khi các lỗi VAR không tương quan về mặt tương quan, phương sai của lỗi dự báo trong h khoảng thời gian phía trước có thể được viết dưới dạng tổng của các thành phần tạo ra từ mỗi lỗi này / 17 /.

3.2 Phân tích nhân tố

Trong thống kê hiện đại, phân tích nhân tố được hiểu là một tập hợp các phương pháp mà trên cơ sở mối quan hệ thực tế của các đối tượng (hoặc đối tượng), có thể xác định các đặc điểm khái quát tiềm ẩn của cơ cấu tổ chức và cơ chế phát triển của các hiện tượng, quá trình. học việc.

Khái niệm về độ trễ trong định nghĩa là chìa khóa. Nó có nghĩa là tính ẩn của các đặc điểm được bộc lộ bằng phương pháp phân tích nhân tố. Đầu tiên, chúng ta giải quyết một tập hợp các tính năng cơ bản X j, sự tương tác của chúng giả định trước sự hiện diện của một số nguyên nhân, điều kiện đặc biệt, tức là tồn tại của một số yếu tố tiềm ẩn. Các đặc điểm sau được thiết lập là kết quả của sự tổng quát hóa các tính năng cơ bản và hoạt động như các đặc tính tích hợp hoặc các tính năng, nhưng ở mức độ cao hơn. Đương nhiên, không chỉ các đối tượng tầm thường X j có thể tương quan mà còn với các đối tượng quan sát N i, vì vậy việc tìm kiếm các yếu tố tiềm ẩn về mặt lý thuyết là có thể thực hiện được cả theo dữ liệu đối tượng và đối tượng.

Nếu các đối tượng được đặc trưng bởi một số lượng đủ lớn các đối tượng cơ bản (m> 3), thì một giả thiết khác cũng hợp lý - sự tồn tại của các cụm điểm (đối tượng) dày đặc trong không gian của n đối tượng. Đồng thời, các trục mới không khái quát các đặc điểm của X j mà là các đối tượng n i tương ứng và các yếu tố tiềm ẩn F r sẽ được nhận biết bởi thành phần của các đối tượng quan sát:

F r = c 1 n 1 + c 2 n 2 + ... + c N n N,

trong đó c i là trọng lượng của vật n i trong hệ số F r.

Tùy thuộc vào loại tương quan nào được xem xét ở trên - các đặc điểm cơ bản hoặc các đối tượng quan sát - được nghiên cứu trong phân tích nhân tố, R và Q được phân biệt - các phương pháp kỹ thuật xử lý dữ liệu.

Tên của kỹ thuật R là phân tích dữ liệu thể tích theo m đối tượng, do đó thu được r tổ hợp tuyến tính (nhóm) đối tượng: F r = f (X j), (r = 1..m). Phân tích theo độ gần (kết nối) của n đối tượng quan sát được gọi là kỹ thuật Q và cho phép bạn xác định r tổ hợp tuyến tính (nhóm) của các đối tượng: F = f (n i), (i = l .. N).

Hiện nay, trên thực tế, hơn 90% bài toán được giải bằng kỹ thuật R.

Tập hợp các phương pháp phân tích nhân tố hiện nay khá lớn, nó bao gồm hàng chục cách tiếp cận và kỹ thuật xử lý dữ liệu khác nhau. Để tập trung vào việc lựa chọn chính xác các phương pháp trong nghiên cứu, cần phải trình bày các tính năng của chúng. Chúng tôi chia tất cả các phương pháp phân tích nhân tố thành một số nhóm phân loại:

Phương pháp thành phần chính. Nói một cách chính xác, nó không được phân loại là phân tích nhân tố, mặc dù nó có nhiều điểm chung với nó. Cụ thể, trước hết, trong quá trình tính toán quy trình, tất cả các thành phần chính được thu được đồng thời và số lượng của chúng ban đầu bằng số lượng các tính năng cơ bản. Thứ hai, khả năng phân hủy hoàn toàn sự phân tán của các đặc trưng cơ bản là mặc nhiên, hay nói cách khác là sự giải thích đầy đủ của nó thông qua các yếu tố tiềm ẩn (các đặc trưng khái quát).

Các phương pháp phân tích nhân tố. Phương sai của các đặc trưng cơ bản không được giải thích đầy đủ ở đây, người ta thừa nhận rằng một phần của phương sai vẫn chưa được công nhận là một đặc trưng. Các yếu tố thường được tách ra theo tuần tự: yếu tố đầu tiên giải thích tỷ lệ biến động lớn nhất trong các đối tượng địa lý cơ bản, sau đó là yếu tố thứ hai, giải thích phần nhỏ hơn của phương sai, yếu tố thứ hai sau yếu tố tiềm ẩn đầu tiên, yếu tố thứ ba, v.v. Quá trình trích xuất các yếu tố có thể bị gián đoạn ở bất kỳ bước nào nếu một quyết định được đưa ra về mức độ đầy đủ của tỷ lệ phương sai được giải thích của các đặc trưng cơ bản hoặc có tính đến khả năng diễn giải của các yếu tố tiềm ẩn.

Nên chia thêm các phương pháp phân tích nhân tố thành hai loại: phương pháp ước lượng đơn giản và phương pháp xấp xỉ hiện đại.

Các phương pháp phân tích nhân tố đơn giản chủ yếu gắn liền với những phát triển lý thuyết ban đầu. Họ có khả năng hạn chế trong việc xác định các yếu tố tiềm ẩn và các giải pháp giai thừa gần đúng. Bao gồm các:

Mô hình một nhân tố. Nó cho phép bạn chỉ chọn một yếu tố tiềm ẩn chung và một yếu tố đặc trưng. Đối với các yếu tố tiềm ẩn khác có thể đang tồn tại, một giả định được đưa ra về mức độ không đáng kể của chúng;

mô hình yếu tố sinh học. Cho phép ảnh hưởng đến sự thay đổi của các đặc điểm cơ bản của không phải một mà là một số yếu tố tiềm ẩn (thường là hai) và một yếu tố đặc trưng;

phương pháp centroid. Trong đó, mối tương quan giữa các biến được coi là một nhóm vectơ, và yếu tố tiềm ẩn được biểu diễn hình học như một vectơ cân bằng đi qua tâm của chùm này. : Phương pháp này cho phép bạn xác định một số yếu tố tiềm ẩn và đặc trưng, lần đầu tiên có thể xác định mối tương quan giữa quyết định giai thừa với dữ liệu ban đầu, tức là giải bài toán xấp xỉ ở dạng đơn giản nhất.

Các phương pháp xấp xỉ hiện đại thường giả định rằng giải pháp gần đúng đầu tiên đã được tìm thấy theo một cách nào đó, và giải pháp này được tối ưu hóa với các bước tiếp theo. Các phương pháp khác nhau về độ phức tạp của tính toán. Các phương pháp này bao gồm:

phương pháp nhóm. Giải pháp dựa trên các nhóm tính năng cơ bản được chọn trước theo một cách nào đó;

Phương pháp các yếu tố chính. Nó gần nhất với phương pháp của các thành phần chính, sự khác biệt nằm ở giả định về sự tồn tại của các đối tượng địa lý;

Khả năng xảy ra tối đa, số dư tối thiểu, phân tích một nhân tố, phân tích nhân tố chuẩn, tất cả đều tối ưu hóa.

Các phương pháp này giúp cải tiến một cách nhất quán các giải pháp đã tìm thấy trước đây dựa trên việc sử dụng các kỹ thuật thống kê để ước tính một biến ngẫu nhiên hoặc tiêu chí thống kê và yêu cầu một lượng lớn tính toán tốn thời gian. Triển vọng và thuận lợi nhất cho công việc ở nhóm này là phương pháp khả năng xảy ra tối đa.

Nhiệm vụ chính, được giải quyết bằng nhiều phương pháp phân tích nhân tố, bao gồm cả phương pháp thành phần chính, là nén thông tin, chuyển từ tập giá trị theo m đặc trưng cơ bản với lượng thông tin n x m thành một giới hạn. tập hợp các phần tử của ma trận ánh xạ nhân tố (m x r) hoặc ma trận các nhân tố giá trị tiềm ẩn cho mỗi đối tượng quan sát có kích thước n x r, và thường là r< m.

Phương pháp phân tích nhân tố cũng giúp bạn có thể hình dung cấu trúc của các hiện tượng và quá trình đang nghiên cứu, có nghĩa là xác định trạng thái của chúng và dự đoán sự phát triển của chúng. Cuối cùng, dữ liệu phân tích nhân tố cung cấp cơ sở để xác định đối tượng, tức là giải quyết vấn đề nhận dạng hình ảnh.

Phương pháp phân tích nhân tố có những đặc tính rất hấp dẫn để sử dụng chúng như một phần của các phương pháp thống kê khác, thường gặp nhất trong phân tích hồi quy tương quan, phân tích cụm, tỷ lệ đa biến, v.v. / 18 /.

3.3 Hồi quy cặp đôi. Bản chất xác suất của các mô hình hồi quy.

Nếu chúng ta xem xét vấn đề phân tích chi phí ăn uống trong các nhóm có cùng thu nhập, ví dụ $ 10.000 (x), thì đây là một giá trị xác định. Nhưng Y - phần tiền này được chi cho thực phẩm - là ngẫu nhiên và có thể thay đổi từ năm này sang năm khác. Do đó, đối với mỗi cá nhân thứ i:

trong đó ε i - lỗi ngẫu nhiên;

α và β là các hằng số (về mặt lý thuyết), mặc dù chúng có thể khác nhau giữa các mô hình.

Điều kiện tiên quyết cho hồi quy theo cặp:

X và Y liên quan tuyến tính;

X là biến không ngẫu nhiên có giá trị cố định;

- ε - sai số được phân phối chuẩn N (0, σ 2);

- .

Hình 3.1 cho thấy một mô hình hồi quy theo cặp.

Hình 3.1 - Mô hình hồi quy cặp

Các giả định này mô tả mô hình hồi quy tuyến tính cổ điển.

Nếu lỗi có giá trị trung bình khác 0, mô hình ban đầu sẽ tương đương với mô hình mới và điểm chặn khác, nhưng với giá trị trung bình bằng 0 đối với lỗi.

Nếu các điều kiện tiên quyết được thỏa mãn, thì các công cụ ước lượng bình phương nhỏ nhất và là các công cụ ước tính không chệch tuyến tính hiệu quả

Nếu chúng tôi chỉ định:

thực tế là kỳ vọng toán học và độ phân tán của các hệ số sẽ như sau:

Phương sai của các hệ số:

Nếu một thì chúng cũng được phân phối bình thường:

Từ đó nó dẫn đến:

Độ biến thiên β hoàn toàn được xác định bởi độ biến thiên ε;

Phương sai của X càng cao thì ước lượng của β càng tốt.

Tổng độ phân tán được xác định theo công thức:

Phương sai của các độ lệch trong dạng này là một ước lượng không chệch và được gọi là sai số chuẩn của hồi quy. N-2 - có thể hiểu là số bậc tự do.

Phân tích độ lệch khỏi đường hồi quy có thể cung cấp một thước đo hữu ích về mức độ phản ánh của hồi quy ước tính với dữ liệu thực. Một hồi quy tốt là giải thích một tỷ lệ đáng kể của phương sai trong Y và ngược lại, một hồi quy xấu không theo dõi hầu hết các biến động trong dữ liệu ban đầu. Trực quan rõ ràng rằng bất kỳ thông tin bổ sung nào sẽ cải thiện mô hình, nghĩa là, giảm tỷ lệ biến thiên không giải thích được Y. Để phân tích mô hình hồi quy, phương sai được phân tách thành các thành phần và hệ số xác định R 2 được xác định.

Tỷ lệ của hai phương sai được phân phối theo phân phối F, tức là nếu chúng ta kiểm tra ý nghĩa thống kê của sự khác biệt giữa phương sai của mô hình và phương sai của phần dư, chúng ta có thể kết luận rằng R 2 là có ý nghĩa.

Kiểm định giả thuyết về sự bằng nhau của các phương sai của hai mẫu này:

Nếu giả thuyết H 0 (đẳng thức phương sai của một số mẫu) là đúng, t có phân phối F với (m 1, m 2) = (n 1 -1, n 2 -1) bậc tự do.

Sau khi tính toán tỷ lệ F là tỷ số của hai độ phân tán và so sánh nó với giá trị bảng, chúng ta có thể kết luận rằng R 2/2 /, / 19 / là có ý nghĩa thống kê.

Sự kết luận

Các ứng dụng hiện đại của phân tích phương sai bao gồm một loạt các vấn đề trong kinh tế, sinh học, và công nghệ và thường được giải thích theo lý thuyết thống kê về sự khác biệt có hệ thống giữa các kết quả của các phép đo trực tiếp được thực hiện trong những điều kiện thay đổi nhất định.

Nhờ tự động hóa phân tích phương sai, một nhà nghiên cứu có thể thực hiện các nghiên cứu thống kê khác nhau bằng máy tính, đồng thời tốn ít thời gian và công sức hơn cho việc tính toán dữ liệu. Hiện nay, có rất nhiều gói phần mềm thực hiện bộ máy phân tích phân tán. Các sản phẩm phần mềm phổ biến nhất là:

Hầu hết các phương pháp thống kê đều được thực hiện trong các sản phẩm phần mềm thống kê hiện đại. Với sự phát triển của các ngôn ngữ lập trình thuật toán, có thể tạo ra các khối bổ sung để xử lý dữ liệu thống kê.

ANOVA là một phương pháp thống kê hiện đại mạnh mẽ để xử lý và phân tích dữ liệu thực nghiệm trong tâm lý học, sinh học, y học và các ngành khoa học khác. Nó liên quan rất chặt chẽ đến phương pháp luận cụ thể để lập kế hoạch và thực hiện các nghiên cứu thực nghiệm.

Phân tích phương sai được sử dụng trong tất cả các lĩnh vực nghiên cứu khoa học, nơi cần phân tích ảnh hưởng của các yếu tố khác nhau đến biến số đang nghiên cứu.

Thư mục

1 Kremer N.Sh. Lý thuyết xác suất và thống kê toán học. M.: Unity - Dana, 2002.-343s.

2 Gmurman V.E. Lý thuyết Xác suất và Thống kê Toán học. - M .: Trường Cao đẳng, 2003.-523s.

4 www.conf.mitme.ru

5 www.pedklin.ru

6 www.webcenter.ru

7 www.infilities.ru

8 www.encycl.yandex.ru

9 www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 Gusev A.N. Phân tích phân tán trong tâm lý học thực nghiệm. - M .: Nhà sưu tầm giáo dục và phương pháp luận "Tâm lý học", 2000.-136s.

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru