Tại sao tính hợp lệ về mặt thống kê lại có các mức tiểu luận. Chuẩn bị cho công việc

Nhiệm vụ của một nghiên cứu thống kê là xác định các mẫu nằm trong bản chất của các hiện tượng được nghiên cứu. Các chỉ số và giá trị trung bình phải phản ánh thực tế, để xác định mức độ tin cậy của chúng. Việc hiển thị đúng tập hợp mẫu của tổng thể chung được gọi là tính đại diện . Một thước đo độ chính xác và độ tin cậy của các giá trị thống kê mẫu là sai số trung bình của tính đại diện (tính đại diện), phụ thuộc vào kích thước của mẫu và mức độ đa dạng của tổng thể mẫu đối với tính trạng đang nghiên cứu.

Vì vậy, để xác định mức độ tin cậy của kết quả nghiên cứu thống kê, cần tính sai số trung bình tương ứng cho từng giá trị tương đối và trung bình. Sai số trung bình của chỉ tiêu m p được tính theo công thức:

Khi số lượng quan sát nhỏ hơn 30, trong đó

P - giá trị của chỉ báo tính bằng phần trăm, ppm, v.v.

q - thêm chỉ số này vào 100 nếu tính bằng phần trăm, thành 1000 nếu% 0, v.v. (tức là q = 100 – P, 1000 – P, v.v.)

Ví dụ, người ta biết rằng có 224 người bị bệnh lỵ trong vùng trong năm. Dân số là 33.000 người. Tỷ lệ mắc bệnh kiết lỵ ở

Sai số trung bình của chỉ số này

Để giải quyết vấn đề về mức độ tin cậy của chỉ báo, hệ số tin cậy (t) được xác định, bằng tỷ số của chỉ báo với sai số trung bình của nó, tức là

Trong ví dụ của chúng tôi

T càng cao thì mức độ tin cậy càng lớn. Tại t = 1, xác suất tin cậy của chỉ tiêu là 68,3%, t = 2 - 95,5%, t = 3 - 99,7%. Trong các nghiên cứu thống kê y tế, mức độ tin cậy (độ tin cậy) 95,5% –99,0% thường được sử dụng và trong những trường hợp đáng trách nhất - 99,7%. Do đó, trong ví dụ của chúng tôi, tỷ lệ mắc bệnh là đáng tin cậy.

Nếu số lần quan sát nhỏ hơn 30, giá trị của tiêu chí được xác định bởi bảng Sinh viên. Nếu giá trị thu được cao hơn hoặc bằng giá trị bảng, chỉ số đó là đáng tin cậy. Nếu nó thấp hơn, nó không hợp lệ.

Nếu cần so sánh hai chỉ tiêu đồng nhất, độ tin cậy của sự khác biệt của chúng được xác định theo công thức:

(trừ số nhỏ hơn cho số lớn hơn)

trong đó P 1 –P 2 là hiệu số giữa hai chỉ số được so sánh,

là sai số trung bình của sự khác biệt giữa hai chỉ số.

Ví dụ, ở quận B, 270 người bị bệnh lỵ trong năm. Dân số của huyện là 45.000 người, do đó tỷ lệ mắc bệnh kiết lỵ:

những thứ kia. tỷ lệ mắc bệnh là chính xác.

Như bạn có thể thấy, tỷ lệ mắc bệnh ở vùng B thấp hơn vùng A. Chúng tôi xác định độ tin cậy của sự khác biệt giữa hai chỉ số bằng công thức:

Nếu có một số lượng lớn các quan sát (hơn 30), sự khác biệt về các chỉ số là có ý nghĩa thống kê nếu t = 2 trở lên. Do đó, trong ví dụ của chúng tôi, tỷ lệ mắc bệnh ở vùng A cao hơn đáng kể, bởi vì hệ số tin cậy (t) lớn hơn 2.

Biết được giá trị sai số trung bình của chỉ tiêu, có thể xác định được các giới hạn tin cậy của chỉ tiêu này, phụ thuộc vào ảnh hưởng của các nguyên nhân ngẫu nhiên. Ranh giới tin cậy được xác định theo công thức:

P là một chỉ số;

m là lỗi trung bình của nó;

t là hệ số tin cậy được chọn tùy thuộc vào giá trị độ tin cậy yêu cầu: t = 1 ứng với độ tin cậy của kết quả trong 68,3% trường hợp, t = 2 - 95,5%, t = 2,6 - 99%, t = 3 - 99,7%. , t = 3,3 - 99,9 Giá trị được gọi là sai số biên.

Ví dụ, ở quận B, tỷ lệ mắc bệnh lỵ với độ chính xác 99,7-9% có thể dao động do các yếu tố ngẫu nhiên trong đó, tức là. từ 49,1 đến 70,9.

Kiểm tra giả thuyết được thực hiện bằng cách sử dụng phân tích thống kê. Ý nghĩa thống kê được tìm thấy bằng cách sử dụng giá trị P, tương ứng với xác suất của một sự kiện đã cho dưới giả thiết rằng một số phát biểu (giả thuyết không) là đúng. Nếu giá trị P nhỏ hơn một mức ý nghĩa thống kê nhất định (thường là 0,05), người thử nghiệm có thể kết luận một cách an toàn rằng giả thuyết vô hiệu là sai và chuyển sang xem xét giả thuyết thay thế. Sử dụng phép thử t của Student, bạn có thể tính giá trị P và xác định mức ý nghĩa cho hai tập dữ liệu.

Các bước

Phần 1

Thiết lập một thử nghiệm

Xác định giả thuyết của bạn. Bước đầu tiên để đánh giá ý nghĩa thống kê là chọn câu hỏi bạn muốn trả lời và hình thành giả thuyết. Giả thuyết là một tuyên bố về dữ liệu thực nghiệm, sự phân bố và tính chất của chúng. Đối với bất kỳ thử nghiệm nào, có cả giả thuyết không và giả thuyết thay thế. Nói chung, bạn sẽ phải so sánh hai bộ dữ liệu để xác định xem chúng giống nhau hay khác nhau.

Giả thuyết rỗng (H 0) thường nói rằng không có sự khác biệt giữa hai tập dữ liệu. Ví dụ: những học sinh đọc tài liệu trước khi đến lớp không đạt điểm cao hơn.
Giả thuyết thay thế (H a) ngược lại với giả thuyết vô hiệu và là một phát biểu cần được xác nhận với dữ liệu thực nghiệm. Ví dụ: những học sinh đọc tài liệu trước khi đến lớp sẽ được điểm cao hơn.

Đặt mức ý nghĩa để xác định mức độ phân bố của dữ liệu phải khác với mức độ thông thường để được coi là một kết quả quan trọng. Mức độ quan trọng (còn được gọi là α (\ displaystyle \ alpha)-level) là ngưỡng bạn xác định cho ý nghĩa thống kê. Nếu giá trị P nhỏ hơn hoặc bằng mức ý nghĩa, dữ liệu được coi là có ý nghĩa thống kê.
- Theo quy luật, mức độ ý nghĩa (giá trị α (\ displaystyle \ alpha)) được lấy bằng 0,05, trong trường hợp này xác suất phát hiện sự khác biệt ngẫu nhiên giữa các tập dữ liệu khác nhau chỉ là 5%.
- Mức ý nghĩa càng cao (và theo đó, giá trị P càng nhỏ) thì kết quả càng đáng tin cậy.
- Nếu bạn muốn có kết quả đáng tin cậy hơn, hãy giảm giá trị P xuống 0,01. Thông thường, các giá trị P thấp hơn được sử dụng trong sản xuất khi cần phát hiện các khuyết tật trong sản phẩm. Trong trường hợp này, cần phải có độ trung thực cao để đảm bảo rằng tất cả các bộ phận hoạt động như mong đợi.
- Đối với hầu hết các thí nghiệm về giả thuyết, mức ý nghĩa 0,05 là đủ.
Quyết định tiêu chí bạn sẽ sử dụng: một mặt hoặc hai mặt. Một trong những giả định trong phép thử t của Student là dữ liệu được phân phối bình thường. Phân phối chuẩn là một đường cong hình chuông với số kết quả lớn nhất ở giữa đường cong. Kiểm tra t của Student là một phương pháp xác thực dữ liệu toán học cho phép bạn xác định xem dữ liệu có nằm ngoài phân phối chuẩn hay không (nhiều hơn, ít hơn hoặc nằm trong "đuôi" của đường cong).
- Nếu bạn không chắc liệu dữ liệu nằm trên hay dưới nhóm kiểm soát, hãy sử dụng kiểm tra hai phía. Điều này sẽ cho phép bạn xác định tầm quan trọng theo cả hai hướng.
- Nếu bạn biết dữ liệu có thể nằm ngoài phân phối chuẩn theo hướng nào, hãy sử dụng kiểm tra một phía. Trong ví dụ trên, chúng tôi mong đợi điểm của học sinh sẽ tăng lên, vì vậy có thể sử dụng bài kiểm tra một bên.
Xác định kích thước mẫu bằng cách sử dụng sức mạnh thống kê. Sức mạnh thống kê của một nghiên cứu là xác suất mà một cỡ mẫu nhất định sẽ tạo ra kết quả mong đợi. Ngưỡng công suất phổ biến (hoặc β) là 80%. Phân tích công suất mà không có bất kỳ dữ liệu trước nào có thể phức tạp vì cần có một số thông tin về phương tiện dự kiến trong mỗi tập dữ liệu và độ lệch chuẩn của chúng. Sử dụng máy tính công suất thống kê trực tuyến để xác định kích thước mẫu tối ưu cho dữ liệu của bạn.
- Thông thường, các nhà nghiên cứu tiến hành một nghiên cứu thí điểm nhỏ nhằm cung cấp dữ liệu để phân tích công suất và xác định kích thước mẫu cần thiết cho một nghiên cứu lớn hơn và đầy đủ hơn.
- Nếu bạn không có cơ hội thực hiện một nghiên cứu thử nghiệm, hãy cố gắng ước tính các giá trị trung bình có thể có dựa trên dữ liệu tài liệu và kết quả của những người khác. Điều này có thể giúp bạn xác định kích thước mẫu tối ưu.
Phần 2
Tính toán độ lệch chuẩn
1. Viết công thức cho độ lệch chuẩn.Độ lệch chuẩn cho biết mức độ lan truyền của dữ liệu. Nó cho phép bạn kết luận mức độ gần gũi của dữ liệu thu được trên một mẫu cụ thể. Thoạt nhìn, công thức có vẻ khá phức tạp, nhưng những giải thích dưới đây sẽ giúp bạn hiểu nó. Công thức như sau: s = √∑ ((x i - µ) 2 / (N - 1)).
  - s - độ lệch chuẩn;
  - dấu ∑ chỉ ra rằng tất cả dữ liệu thu được trong mẫu phải được thêm vào;
  - x i tương ứng với giá trị thứ i, nghĩa là, một kết quả riêng biệt thu được;
  - µ là giá trị trung bình của nhóm này;
  - N là tổng số dữ liệu trong mẫu.
2. Tìm điểm trung bình trong mỗi nhóm.Để tính độ lệch chuẩn, trước tiên bạn phải tìm giá trị trung bình cho mỗi nhóm nghiên cứu. Giá trị trung bình được biểu thị bằng chữ cái Hy Lạp µ (mu). Để tìm giá trị trung bình, chỉ cần cộng tất cả các giá trị kết quả và chia chúng cho lượng dữ liệu (cỡ mẫu).
  - Ví dụ, để tìm điểm trung bình của một nhóm sinh viên nghiên cứu tài liệu trước khi đến lớp, hãy xem xét một tập dữ liệu nhỏ. Để đơn giản, chúng tôi sử dụng bộ năm điểm: 90, 91, 85, 83 và 94.
  - Hãy cộng tất cả các giá trị với nhau: 90 + 91 + 85 + 83 + 94 = 443.
  - Chia tổng cho số giá trị, N = 5: 443/5 = 88,6.
  - Như vậy, giá trị trung bình của nhóm này là 88,6.
3. Lấy giá trị trung bình trừ mỗi giá trị thu được. Bước tiếp theo là tính toán sự khác biệt (x i - µ). Để thực hiện việc này, hãy lấy giá trị trung bình được trừ đi từng giá trị thu được. Trong ví dụ của chúng tôi, chúng tôi cần tìm ra năm điểm khác biệt:
  - (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) và (94 - 88,6).
  - Kết quả là, chúng tôi nhận được các giá trị sau: 1,4, 2,4, -3,6, -5,6 và 5,4.
4. Bình phương mỗi giá trị thu được và cộng chúng lại với nhau. Mỗi đại lượng vừa tìm được phải được bình phương. Bước này sẽ loại bỏ tất cả các giá trị âm. Nếu sau bước này, bạn vẫn còn số âm, thì bạn đã quên bình phương chúng.
  - Ví dụ của chúng tôi, chúng tôi nhận được 1,96, 5,76, 12,96, 31,36 và 29,16.
  - Ta cộng các giá trị thu được: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
5. Chia cho cỡ mẫu trừ đi 1. Trong công thức, tổng chia cho N - 1 do ta không tính đến dân số chung mà lấy mẫu của tất cả học sinh để đánh giá.
  - Trừ: N - 1 = 5 - 1 = 4
  - Chia: 81,2 / 4 = 20,3
6. Lấy căn bậc hai. Sau khi chia tổng cho cỡ mẫu trừ đi một, lấy căn bậc hai của giá trị tìm được. Đây là bước cuối cùng trong việc tính toán độ lệch chuẩn. Có những chương trình thống kê, sau khi nhập dữ liệu ban đầu, thực hiện tất cả các phép tính cần thiết.
  - Trong ví dụ của chúng tôi, độ lệch chuẩn của điểm của những sinh viên đọc tài liệu trước khi đến lớp là s = √20,3 = 4,51.
  Phần 3
  Xác định ý nghĩa
  1. Tính phương sai giữa hai nhóm dữ liệu. Cho đến bước này, chúng tôi chỉ xem xét ví dụ cho một nhóm dữ liệu. Nếu bạn muốn so sánh hai nhóm, rõ ràng bạn nên lấy dữ liệu cho cả hai nhóm. Tính độ lệch chuẩn cho nhóm dữ liệu thứ hai và sau đó tìm phương sai giữa hai nhóm thực nghiệm. Độ phân tán được tính theo công thức sau: s d = √ ((s 1 / N 1) + (s 2 / N 2)).

CHỨC NĂNG TRẢ TIỀN. Tính năng ý nghĩa thống kê chỉ khả dụng với một số gói định giá. Kiểm tra xem nó có ở trong không.

Bạn có thể tìm hiểu xem có sự khác biệt đáng kể về mặt thống kê trong các câu trả lời nhận được từ các nhóm người trả lời khác nhau cho các câu hỏi trong cuộc khảo sát hay không. Để làm việc với hàm ý nghĩa thống kê trong SurveyMonkey, bạn phải:

Bật tính năng ý nghĩa thống kê khi thêm quy tắc so sánh vào câu hỏi trong khảo sát của bạn. Chọn Nhóm so sánh để sắp xếp kết quả khảo sát thành các nhóm để dễ so sánh.
Kiểm tra bảng dữ liệu cho các câu hỏi khảo sát của bạn để xác định liệu có sự khác biệt có ý nghĩa thống kê trong các câu trả lời nhận được từ các nhóm người trả lời khác nhau hay không.

Xem ý nghĩa thống kê

Bằng cách làm theo các bước bên dưới, bạn có thể tạo một khảo sát hiển thị ý nghĩa thống kê.

1. Thêm câu hỏi đã đóng vào bản khảo sát của bạn

Để hiển thị ý nghĩa thống kê trong quá trình phân tích kết quả, bạn sẽ cần áp dụng quy tắc so sánh cho bất kỳ câu hỏi nào từ cuộc khảo sát của mình.

Bạn có thể áp dụng quy tắc so sánh và tính toán ý nghĩa thống kê trong các câu trả lời nếu bạn sử dụng một trong các loại câu hỏi sau trong thiết kế khảo sát của mình:

Cần đảm bảo rằng các phương án trả lời được đề xuất có thể được chia thành các nhóm chính thức. Các lựa chọn câu trả lời bạn chọn để so sánh khi tạo quy tắc so sánh sẽ được sử dụng để đánh dấu chéo dữ liệu của bạn trong suốt cuộc khảo sát.

2. Thu thập câu trả lời

Khi bạn đã hoàn thành bản khảo sát của mình, hãy tạo một bộ sưu tập để phân phối nó. Có một số cách.

Bạn cần nhận được ít nhất 30 câu trả lời cho mỗi tùy chọn câu trả lời mà bạn định sử dụng trong quy tắc so sánh của mình để kích hoạt và xem ý nghĩa thống kê.

Ví dụ về cuộc thăm dò ý kiến

Bạn muốn biết liệu nam giới có hài lòng hơn đáng kể với sản phẩm của bạn so với phụ nữ hay không.

Thêm hai câu hỏi trắc nghiệm vào khảo sát của bạn:
Giới tính của bạn là gì? (Nam nữ)
Bạn hài lòng hay không hài lòng với sản phẩm của chúng tôi? (hài lòng (-flax), không hài lòng (-flax))
Đảm bảo rằng ít nhất 30 người trả lời chọn 'nam' cho câu hỏi giới tính VÀ CŨNG ít nhất 30 người trả lời chọn 'nữ' làm giới tính của họ.
Thêm quy tắc so sánh cho câu hỏi "Giới tính của bạn là gì?" và chọn cả hai câu trả lời làm nhóm của bạn.
Sử dụng biểu dữ liệu bên dưới biểu đồ câu hỏi "Bạn hài lòng hay không hài lòng với sản phẩm của chúng tôi?" để xem liệu có bất kỳ lựa chọn câu trả lời nào cho thấy sự khác biệt có ý nghĩa thống kê hay không

Sự khác biệt có ý nghĩa thống kê là gì?

Một sự khác biệt có ý nghĩa thống kê có nghĩa là, bằng cách sử dụng phân tích thống kê, có sự khác biệt đáng kể giữa câu trả lời của một nhóm người được hỏi và câu trả lời của nhóm khác. Ý nghĩa thống kê có nghĩa là các con số thu được là khác nhau đáng kể. Những kiến thức đó sẽ giúp bạn rất nhiều trong việc phân tích dữ liệu. Tuy nhiên, tầm quan trọng của kết quả thu được là do bạn quyết định. Chính bạn là người quyết định cách giải thích kết quả của các cuộc khảo sát và những hành động nào nên được thực hiện dựa trên chúng.

Ví dụ: bạn nhận được nhiều xác nhận quyền sở hữu từ những người mua sắm nữ hơn là từ những người mua sắm nam. Làm thế nào để xác định liệu sự khác biệt đó là có thật và liệu có cần phải hành động trong vấn đề này hay không? Một cách tuyệt vời để kiểm tra khả năng quan sát của bạn là thực hiện một cuộc khảo sát để cho bạn biết liệu khách hàng nam có hài lòng hơn đáng kể với sản phẩm của bạn hay không. Với sự trợ giúp của công thức thống kê, hàm ý nghĩa thống kê được đề xuất của chúng tôi sẽ cho phép bạn xác định liệu sản phẩm của mình có thực sự được nam giới yêu thích hơn phụ nữ hay không. Điều này sẽ cho phép bạn thực hiện hành động dựa trên sự kiện chứ không phải phỏng đoán.

Sự khác biệt đáng kể về mặt thống kê

Nếu kết quả của bạn được đánh dấu trong bảng dữ liệu, điều này có nghĩa là hai nhóm người trả lời khác nhau đáng kể. Thuật ngữ “đáng kể” không có nghĩa là các số liệu thu được có tầm quan trọng hoặc ý nghĩa đặc biệt, mà chỉ có nghĩa là có sự khác biệt về mặt thống kê giữa chúng.

Không có sự khác biệt có ý nghĩa thống kê

Nếu kết quả của bạn không được đánh dấu trong bảng dữ liệu tương ứng, điều này có nghĩa là, mặc dù có thể có sự khác biệt trong hai số liệu được so sánh, nhưng không có sự khác biệt thống kê giữa chúng.

Các câu trả lời không có sự khác biệt có ý nghĩa thống kê chứng tỏ rằng không có sự khác biệt đáng kể giữa hai mục được so sánh với cỡ mẫu mà bạn sử dụng, nhưng điều này không nhất thiết có nghĩa là chúng không quan trọng. Có lẽ bằng cách tăng kích thước mẫu, bạn sẽ có thể xác định được sự khác biệt có ý nghĩa thống kê.

Cỡ mẫu

Nếu bạn có cỡ mẫu rất nhỏ, chỉ có sự khác biệt rất lớn giữa hai nhóm sẽ là đáng kể. Nếu bạn có kích thước mẫu rất lớn, cả sự khác biệt nhỏ và lớn sẽ được tính là đáng kể.

Tuy nhiên, nếu hai con số khác nhau về mặt thống kê, điều này không có nghĩa là sự khác biệt giữa các kết quả có tầm quan trọng thực tế đối với bạn. Bạn sẽ phải tự mình quyết định xem sự khác biệt nào là quan trọng đối với cuộc khảo sát của bạn.

Tính toán ý nghĩa thống kê

Chúng tôi tính toán ý nghĩa thống kê bằng cách sử dụng mức tin cậy tiêu chuẩn 95%. Nếu tùy chọn câu trả lời được hiển thị là có ý nghĩa thống kê, điều đó có nghĩa là có ít hơn 5% cơ hội có sự khác biệt giữa hai nhóm do ngẫu nhiên hoặc lỗi lấy mẫu (thường được hiển thị là: p<0,05).

Để tính toán sự khác biệt có ý nghĩa thống kê giữa các nhóm, chúng tôi sử dụng các công thức sau:

Tham số	Sự miêu tả
a1	Tỷ lệ người tham gia từ nhóm đầu tiên trả lời câu hỏi theo một cách nhất định, nhân với cỡ mẫu của nhóm này.
b1	Tỷ lệ người tham gia từ nhóm thứ hai trả lời câu hỏi theo một cách nhất định nhân với cỡ mẫu của nhóm này.
Chia sẻ mẫu tổng hợp (p)	Tổng của hai cổ phiếu từ cả hai nhóm.
Lỗi tiêu chuẩn (SE)	Một thước đo về mức độ chia sẻ của bạn khác với chia sẻ thực tế của bạn. Giá trị nhỏ hơn có nghĩa là cổ phần gần với cổ phần thực tế, giá trị lớn hơn có nghĩa là cổ phần đó chênh lệch đáng kể so với thực tế.
Thống kê thử nghiệm (t)	Thử nghiệm thống kê. Số lượng giá trị độ lệch chuẩn mà giá trị này khác với giá trị trung bình.
Ý nghĩa thống kê	Nếu giá trị tuyệt đối của thống kê thử nghiệm vượt quá 1,96 * độ lệch chuẩn so với giá trị trung bình, thì đây được coi là sự khác biệt có ý nghĩa thống kê.

* 1,96 là giá trị được sử dụng cho mức độ tin cậy 95%, vì 95% phạm vi được xử lý bằng phép thử t của Student nằm trong 1,96 độ lệch chuẩn của giá trị trung bình.

Ví dụ tính toán

Tiếp tục với ví dụ được sử dụng ở trên, chúng ta hãy tìm hiểu xem liệu tỷ lệ nam giới nói rằng họ hài lòng với sản phẩm của bạn có thực sự cao hơn đáng kể so với tỷ lệ phụ nữ hay không.

Giả sử rằng 1.000 nam giới và 1.000 phụ nữ đã tham gia vào cuộc khảo sát của bạn và kết quả của cuộc khảo sát cho thấy 70% nam giới và 65% phụ nữ nói rằng họ hài lòng với sản phẩm của bạn. Điểm 70% có cao hơn đáng kể so với điểm 65% không?

Thay thế dữ liệu sau từ cuộc khảo sát thành các công thức được đề xuất:

p1 (% nam giới hài lòng với sản phẩm) = 0,7
p2 (% phụ nữ hài lòng với sản phẩm) = 0,65
n1 (số nam giới được phỏng vấn) = 1000
n2 (số phụ nữ được phỏng vấn) = 1000

Vì giá trị tuyệt đối của thống kê thử nghiệm lớn hơn 1,96, điều này có nghĩa là sự khác biệt giữa nam và nữ là có ý nghĩa. So với phụ nữ, nam giới có xu hướng hài lòng với sản phẩm của bạn hơn.

Ẩn ý nghĩa thống kê

Cách ẩn ý nghĩa thống kê cho tất cả các câu hỏi

Nhấp vào mũi tên xuống ở bên phải của quy tắc so sánh trong thanh bên trái.
Chọn một mục Chỉnh sửa quy tắc.
Tắt tính năng Hiển thị ý nghĩa thống kê bằng cách sử dụng công tắc.
Ấn nút Nộp đơn.

Để ẩn ý nghĩa thống kê cho một câu hỏi, bạn phải:

Ấn nút Điều chỉnh phía trên sơ đồ câu hỏi.
Mở một tab Tùy chọn hiển thị.
Bỏ chọn hộp bên cạnh Ý nghĩa thống kê.
Ấn nút Cứu.

Tùy chọn hiển thị tự động được bật khi hiển thị ý nghĩa thống kê được bật. Nếu bạn bỏ chọn tùy chọn hiển thị này, việc hiển thị ý nghĩa thống kê cũng sẽ bị tắt.

Bật tính năng ý nghĩa thống kê khi thêm quy tắc so sánh vào câu hỏi trong khảo sát của bạn. Kiểm tra các bảng dữ liệu cho các câu hỏi khảo sát của bạn để xác định bất kỳ sự khác biệt có ý nghĩa thống kê nào trong các câu trả lời nhận được từ các nhóm người trả lời khác nhau.

Ý nghĩa thống kê

Các kết quả thu được bằng cách sử dụng một quy trình nghiên cứu nhất định được gọi là ý nghĩa thống kê nếu xác suất xuất hiện ngẫu nhiên của chúng là rất nhỏ. Khái niệm này có thể được minh họa bằng ví dụ về việc tung đồng xu. Giả sử một đồng xu được lật 30 lần; Nó xuất hiện 17 lần đầu và 13 lần nó xuất hiện đuôi. Phải không có ý nghĩaĐây có phải là sự sai lệch so với kết quả dự kiến (15 đầu và 15 đuôi), hay đây là một sự trùng hợp? Ví dụ, để trả lời câu hỏi này, bạn có thể tung cùng một đồng xu nhiều lần, 30 lần liên tiếp, đồng thời lưu ý lặp lại bao nhiêu lần tỷ lệ đầu và sấp, bằng 17:13. Phân tích thống kê giúp chúng ta thoát khỏi quá trình tẻ nhạt này. Với sự trợ giúp của nó, sau 30 lần tung đồng xu đầu tiên, có thể ước tính số lần xuất hiện ngẫu nhiên của 17 đầu và 13 đuôi. Một ước tính như vậy được gọi là một tuyên bố xác suất.

Trong tài liệu khoa học về tâm lý học tổ chức-công nghiệp, một phát biểu xác suất ở dạng toán học được biểu thị bằng biểu thức R(xác suất)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0,01). Thực tế này rất quan trọng đối với việc hiểu tài liệu, nhưng không nên coi đó là điều vô nghĩa nếu đưa ra các nhận xét không đáp ứng các tiêu chuẩn này. Cái gọi là kết quả nghiên cứu không quan trọng (các quan sát có thể có được một cách tình cờ hơn một hoặc năm lần trong số 100) có thể rất hữu ích cho việc xác định các xu hướng và như một hướng dẫn cho các nghiên cứu trong tương lai.

Cũng cần lưu ý rằng không phải tất cả các nhà tâm lý học đều đồng ý với các tiêu chuẩn và quy trình truyền thống (ví dụ Cohen, 1994; Sauley & Bedeian, 1989). Bản thân các vấn đề đo lường là trọng tâm chính của nhiều nhà nghiên cứu khi nghiên cứu độ chính xác của các phương pháp đo lường và các giả định làm cơ sở cho các phương pháp và tiêu chuẩn hiện có, cũng như phát triển các loại thuốc và dụng cụ mới. Có lẽ một lúc nào đó trong tương lai, nghiên cứu trong khả năng này sẽ dẫn đến sự thay đổi trong các tiêu chuẩn truyền thống để đánh giá ý nghĩa thống kê, và những thay đổi này sẽ được mọi người chấp nhận. (Chương thứ năm của Hiệp hội Tâm lý Hoa Kỳ tập hợp các nhà tâm lý học chuyên nghiên cứu các đánh giá, đo lường và thống kê.)

Trong các báo cáo nghiên cứu, một tuyên bố xác suất như R< 0,05, do một số số liệu thống kê nghĩa là, một số thu được là kết quả của một tập hợp các thủ tục tính toán toán học nhất định. Xác nhận xác suất thu được bằng cách so sánh các thống kê này với dữ liệu từ các bảng đặc biệt được xuất bản cho mục đích này. Trong nghiên cứu tâm lý tổ chức-công nghiệp, các số liệu thống kê như r, F, t, r>(đọc "chi vuông") và R(đọc "nhiều R "). Trong mỗi trường hợp, số liệu thống kê (một số) thu được từ việc phân tích một loạt các quan sát có thể được so sánh với các số liệu từ bảng đã công bố. Sau đó, có thể hình thành một phát biểu xác suất về xác suất ngẫu nhiên có được con số này, nghĩa là rút ra kết luận về ý nghĩa của các quan sát.

Để hiểu các nghiên cứu được mô tả trong cuốn sách này, bạn cần hiểu rõ về khái niệm ý nghĩa thống kê và không nhất thiết phải biết cách tính toán các số liệu thống kê nêu trên. Tuy nhiên, sẽ rất hữu ích nếu thảo luận về một giả định làm cơ sở cho tất cả các quy trình này. Đây là giả định rằng tất cả các biến quan sát được phân phối xấp xỉ theo luật chuẩn. Ngoài ra, khi đọc các báo cáo về nghiên cứu tâm lý tổ chức - công nghiệp, thường có thêm ba khái niệm đóng vai trò quan trọng - thứ nhất là sự tương quan và tương quan, thứ hai là biến định thức / dự báo và "ANOVA" (phân tích phương sai), thứ ba là , một nhóm các phương pháp thống kê dưới tên chung là "phân tích tổng hợp".

Ngày nay, điều đó thực sự quá dễ dàng: bạn có thể bước tới máy tính mà không cần biết hoặc không biết mình đang làm gì, tạo ra những điều vô nghĩa với tốc độ thực sự đáng kinh ngạc. (J. Box)

Các thuật ngữ và khái niệm cơ bản của thống kê y tế

Trong bài viết này, chúng tôi trình bày một số khái niệm chính của thống kê có liên quan trong nghiên cứu y học. Các điều khoản được thảo luận chi tiết hơn trong các bài viết liên quan.

Biến thể

Sự định nghĩa. Mức độ phân tán của dữ liệu (giá trị dấu hiệu) trong phạm vi giá trị

Xác suất

Sự định nghĩa. Xác suất là mức độ mà một sự kiện nhất định có thể xảy ra trong những điều kiện nhất định.

Ví dụ. Hãy để chúng tôi giải thích định nghĩa của thuật ngữ trong câu "Xác suất khỏi bệnh khi sử dụng thuốc Arimidex là 70%". Sự kiện là “sự hồi phục của bệnh nhân”, tình trạng “bệnh nhân đang dùng Arimidex”, mức độ có thể xảy ra là 70% (nói đại khái, trong số 100 người dùng Arimidex thì 70 người khỏi bệnh).

Xác suất tích lũy

Sự định nghĩa. Xác suất sống sót tích lũy tại thời điểm t bằng với tỷ lệ bệnh nhân sống sót tại thời điểm đó.

Ví dụ. Nếu nói rằng xác suất sống sót tích lũy sau một đợt điều trị 5 năm là 0,7, thì điều này có nghĩa là trong nhóm bệnh nhân được xem xét, 70% số người ban đầu còn sống và 30% đã tử vong. Nói cách khác, cứ mỗi trăm người thì có 30 người chết trong vòng 5 năm đầu tiên.

Thời gian đến sự kiện

Sự định nghĩa. Thời gian để xảy ra sự kiện - đây là thời gian, được biểu thị bằng một số đơn vị, đã trôi qua kể từ thời điểm ban đầu cho đến khi xảy ra sự kiện nào đó.

Giải trình. Đơn vị thời gian trong nghiên cứu y học là ngày, tháng và năm.

Ví dụ điển hình về thời gian ban đầu:

bắt đầu theo dõi bệnh nhân

điều trị phẫu thuật

Ví dụ điển hình về các sự kiện được xem xét:

tiến triển của bệnh

sự tái xuất

bệnh nhân tử vong

Mẫu vật

Sự định nghĩa. Một phần của dân số thu được bằng cách chọn lọc.

Dựa trên kết quả phân tích mẫu, kết luận được rút ra về toàn bộ quần thể, kết luận này chỉ có giá trị nếu việc lựa chọn là ngẫu nhiên. Vì thực tế không thể chọn ngẫu nhiên từ một quần thể, nên người ta phải cố gắng đảm bảo rằng mẫu ít nhất là đại diện cho quần thể.

Mẫu phụ thuộc và độc lập

Sự định nghĩa. Các mẫu trong đó các đối tượng nghiên cứu được tuyển chọn độc lập với nhau. Một thay thế cho các mẫu độc lập là các mẫu phụ thuộc (kết nối, ghép nối).

Giả thuyết

Giả thuyết song phương và đơn phương

Trước tiên, chúng ta hãy giải thích việc sử dụng giả thuyết thuật ngữ trong thống kê.

Mục tiêu của hầu hết các nghiên cứu là để kiểm tra tính trung thực của một số tuyên bố. Mục đích của thử nghiệm thuốc thường là để kiểm tra giả thuyết rằng một loại thuốc này có hiệu quả hơn một loại thuốc khác (ví dụ: Arimidex hiệu quả hơn Tamoxifen).

Để truyền đạt tính chặt chẽ của nghiên cứu, tuyên bố đang được xác minh được thể hiện bằng toán học. Ví dụ, nếu A là số năm một bệnh nhân sử dụng Arimidex sẽ sống và T là số năm một bệnh nhân sẽ sống trên Tamoxifen, thì giả thuyết đang được kiểm định có thể được viết là A> T.

Sự định nghĩa. Giả thuyết được gọi là hai mặt nếu nó bao gồm sự bằng nhau của hai đại lượng.

Một ví dụ về giả thuyết hai mặt: A = T.

Sự định nghĩa. Giả thuyết được gọi là một phía (1 phía) nếu nó bao gồm bất đẳng thức của hai đại lượng.

Ví dụ về các giả thuyết một phía:

Dữ liệu lưỡng phân (nhị phân)

Sự định nghĩa. Dữ liệu chỉ được thể hiện bằng hai giá trị thay thế hợp lệ

Ví dụ: Bệnh nhân “khỏe” - “ốm”. Phù "là" - "không hiện".

Mức độ tin cậy

Sự định nghĩa. Khoảng tin cậy đối với một đại lượng nào đó là phạm vi xung quanh giá trị của đại lượng chứa giá trị thực của đại lượng đó (với một mức độ tin cậy nhất định).

Ví dụ. Gọi số lượng đang nghiên cứu là số lượng bệnh nhân mỗi năm. Trung bình, số của chúng là 500 và khoảng tin cậy 95% là (350, 900). Điều này có nghĩa là, rất có thể (với xác suất 95%), ít nhất 350 người và không quá 900 người sẽ liên hệ với phòng khám trong năm.

Chỉ định. Một cách viết tắt rất phổ biến là: KTC 95% (KTC 95%) là khoảng tin cậy với độ tin cậy là 95%.

Độ tin cậy, ý nghĩa thống kê (P - mức)

Sự định nghĩa.Ý nghĩa thống kê của một kết quả là thước đo độ tin cậy vào "sự thật" của nó.

Bất kỳ nghiên cứu nào cũng chỉ dựa trên một phần của các đối tượng. Nghiên cứu về hiệu quả của một loại thuốc không được thực hiện trên cơ sở tất cả bệnh nhân trên hành tinh nói chung mà chỉ trên một nhóm bệnh nhân nhất định (đơn giản là không thể tiến hành phân tích trên cơ sở tất cả bệnh nhân).

Chúng ta hãy giả định rằng một số kết luận đã được đưa ra do kết quả phân tích (ví dụ: việc sử dụng Arimidex như một liệu pháp thích hợp có hiệu quả gấp 2 lần so với Tamoxifen).

Câu hỏi cần được đặt ra là: “Bạn có thể tin tưởng vào kết quả này đến mức nào?”.

Hãy tưởng tượng rằng chúng tôi đang thực hiện một nghiên cứu chỉ dựa trên hai bệnh nhân. Tất nhiên, trong trường hợp này, kết quả nên được quan tâm. Nếu một số lượng lớn bệnh nhân đã được kiểm tra (giá trị bằng số của "một số lớn" tùy thuộc vào tình huống), thì kết luận rút ra có thể được tin cậy.

Vì vậy, mức độ tin cậy được xác định bởi giá trị của mức p (p-value).

Mức p cao hơn tương ứng với mức độ tin cậy thấp hơn đối với kết quả thu được từ việc phân tích mẫu. Ví dụ, mức p bằng 0,05 (5%) cho thấy kết luận được đưa ra trong quá trình phân tích một nhóm nhất định chỉ là một đặc điểm ngẫu nhiên của các đối tượng này với xác suất chỉ là 5%.

Nói cách khác, với xác suất rất cao (95%), kết luận có thể được mở rộng cho tất cả các đối tượng.

Trong nhiều nghiên cứu, 5% được coi là giá trị p chấp nhận được. Điều này có nghĩa là nếu, ví dụ, p = 0,01, thì kết quả có thể được tin cậy, nhưng nếu p = 0,06 thì không thể.

Học

Nghiên cứu tiềm năng là một nghiên cứu trong đó các mẫu được chọn dựa trên một yếu tố đầu vào và một số yếu tố kết quả được phân tích trong các mẫu.

Nghiên cứu hồi cứu là một nghiên cứu trong đó các mẫu được chọn dựa trên yếu tố kết quả và một số yếu tố đầu vào được phân tích trong các mẫu.

Ví dụ. Yếu tố ban đầu là một phụ nữ mang thai dưới 20 tuổi. Kết quả là đứa trẻ nhẹ hơn / nặng hơn 2,5 kg. Chúng ta phân tích xem cân nặng của trẻ có phụ thuộc vào độ tuổi của mẹ hay không.

Nếu chúng ta lấy 2 mẫu, một mẫu với các bà mẹ trẻ hơn 20 tuổi, mẫu còn lại với các bà mẹ lớn tuổi, rồi phân tích khối lượng trẻ em trong mỗi nhóm, thì đây là một nghiên cứu tiềm năng.

Nếu chúng tôi thu thập 2 mẫu, trong đó một mẫu - bà mẹ sinh con nhẹ hơn 2,5 kg, mẫu còn lại - nặng hơn, và sau đó chúng tôi phân tích tuổi của các bà mẹ trong mỗi nhóm, thì đây là một nghiên cứu hồi cứu (tất nhiên, như vậy nghiên cứu chỉ có thể được thực hiện khi thí nghiệm được hoàn thành, tức là tất cả trẻ em được sinh ra).

Cuộc di cư

Sự định nghĩa. Một sự kiện quan trọng về mặt lâm sàng, giá trị trong phòng thí nghiệm hoặc dấu hiệu mà nhà nghiên cứu quan tâm. Trong các thử nghiệm lâm sàng, kết quả đóng vai trò là tiêu chí đánh giá hiệu quả của một can thiệp điều trị hoặc dự phòng.

Dịch tễ học lâm sàng

Sự định nghĩa. Khoa học cho phép dự đoán một kết quả cụ thể cho một bệnh nhân cụ thể dựa trên nghiên cứu về diễn biến lâm sàng của bệnh trong những trường hợp tương tự, sử dụng các phương pháp khoa học nghiêm ngặt nghiên cứu bệnh nhân để đảm bảo dự đoán chính xác.

Đội quân

Sự định nghĩa. Một nhóm người tham gia vào một nghiên cứu, được thống nhất bởi một số đặc điểm chung tại thời điểm hình thành và được nghiên cứu trong một thời gian dài.

Sự kiểm soát

Kiểm soát lịch sử

Sự định nghĩa. Nhóm đối chứng được thành lập và kiểm tra trong khoảng thời gian trước khi nghiên cứu.

Điều khiển song song

Sự định nghĩa. Nhóm kiểm soát, được hình thành đồng thời với sự hình thành của nhóm chính.

Tương quan

Sự định nghĩa. Mối quan hệ thống kê của hai dấu hiệu (định lượng hoặc thứ tự), cho thấy rằng giá trị lớn hơn của một dấu hiệu trong một số trường hợp nhất định tương ứng với giá trị lớn hơn - trong trường hợp tương quan thuận (trực tiếp) - giá trị của dấu hiệu khác hoặc giá trị nhỏ hơn - trong trường hợp tương quan âm (nghịch).

Ví dụ. Một mối tương quan đáng kể đã được tìm thấy giữa mức độ tiểu cầu và bạch cầu trong máu của bệnh nhân. Hệ số tương quan là 0,76.

Tỷ lệ rủi ro (CR)

Sự định nghĩa. Tỷ lệ rủi ro (tỷ lệ rủi ro) là tỷ số giữa xác suất của một sự kiện nào đó ("xấu") đối với nhóm đối tượng thứ nhất với xác suất của cùng một sự kiện xảy ra đối với nhóm đối tượng thứ hai.

Ví dụ. Nếu những người không hút thuốc có 20% khả năng bị ung thư phổi và 100% khả năng bị ung thư phổi ở những người hút thuốc, thì CR sẽ là 1/5. Trong ví dụ này, nhóm đối tượng đầu tiên là những người không hút thuốc, nhóm thứ hai là những người hút thuốc, và sự xuất hiện của ung thư phổi được coi như một sự kiện “xấu”.

Hiển nhiên là:

1) nếu КР = 1, thì xác suất của sự kiện xảy ra trong các nhóm là như nhau

2) nếu КР> 1, thì sự kiện xảy ra với các đối tượng từ nhóm đầu tiên thường xuyên hơn so với đối tượng thứ hai

3) nếu CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Phân tích tổng hợp

Sự định nghĩa. Với phân tích thống kê tổng hợp kết quả của một số nghiên cứu điều tra cùng một vấn đề (thường là hiệu quả của các phương pháp điều trị, phòng ngừa, chẩn đoán). Nghiên cứu gộp cung cấp một mẫu lớn hơn để phân tích và sức mạnh thống kê lớn hơn của các nghiên cứu gộp. Được sử dụng để tăng bằng chứng hoặc sự tin tưởng vào kết luận về hiệu quả của phương pháp nghiên cứu.

Phương pháp Kaplan-Meier (Nhiều ước tính Kaplan-Meier)

Phương pháp này được phát minh bởi các nhà thống kê E. L. Kaplan và Paul Meyer.

Phương pháp được sử dụng để tính toán các đại lượng khác nhau liên quan đến thời gian quan sát của bệnh nhân. Ví dụ về các giá trị như vậy:

cơ hội phục hồi trong vòng một năm khi sử dụng thuốc

cơ hội tái phát sau phẫu thuật trong vòng ba năm sau phẫu thuật

tích lũy xác suất sống sót sau năm năm của bệnh nhân ung thư tuyến tiền liệt sau khi cắt bỏ nội tạng

Hãy để chúng tôi giải thích những lợi thế của việc sử dụng phương pháp Kaplan-Meier.

Giá trị của các giá trị trong phân tích "bình thường" (không sử dụng phương pháp Kaplan-Meier) được tính toán trên cơ sở chia khoảng thời gian được xem xét thành các khoảng.

Ví dụ, nếu chúng ta kiểm tra xác suất tử vong của một bệnh nhân trong vòng 5 năm, thì khoảng thời gian có thể được chia thành 5 phần (dưới 1 năm, 1-2 năm, 2-3 năm, 3-4 năm, 4). 5 năm), như vậy và 10 (mỗi nửa năm), hoặc một số khoảng thời gian khác. Kết quả sẽ khác nhau đối với các phân vùng khác nhau.

Lựa chọn phân vùng thích hợp nhất không phải là một việc dễ dàng.

Ước tính giá trị của các đại lượng thu được bằng phương pháp Kaplan-Meier không phụ thuộc vào việc chia thời gian quan sát thành các khoảng thời gian, mà chỉ phụ thuộc vào thời gian sống của từng bệnh nhân.

Do đó, nhà nghiên cứu thực hiện phân tích dễ dàng hơn, và kết quả thường có chất lượng cao hơn so với kết quả của phân tích “thông thường”.

Đường cong Kaplan-Meier là đồ thị của đường cong sống sót thu được bằng phương pháp Kaplan-Meier.

Mô hình Cox

Mô hình này được phát minh bởi Sir David Roxby Cox (sinh năm 1924), một nhà thống kê nổi tiếng người Anh, tác giả của hơn 300 bài báo và sách.

Mô hình Cox được sử dụng trong các tình huống mà các đại lượng được nghiên cứu trong phân tích sự sống sót phụ thuộc vào các hàm của thời gian. Ví dụ, xác suất tái diễn sau t năm (t = 1,2,…) có thể phụ thuộc vào logarit của log thời gian (t).

Một ưu điểm quan trọng của phương pháp do Cox đề xuất là khả năng áp dụng của phương pháp này trong một số lượng lớn các tình huống (mô hình không áp đặt các hạn chế nghiêm ngặt về bản chất hoặc hình thức của phân phối xác suất).

Dựa trên mô hình Cox, một phân tích (được gọi là phân tích Cox) có thể được thực hiện, kết quả là giá trị tỷ lệ rủi ro và khoảng tin cậy cho tỷ lệ rủi ro.

Phương pháp thống kê phi tham số

Sự định nghĩa. Một loại phương pháp thống kê được sử dụng chủ yếu để phân tích dữ liệu định lượng không được phân phối chuẩn, cũng như để phân tích dữ liệu định tính.

Ví dụ. Để xác định tầm quan trọng của sự khác biệt trong huyết áp tâm thu của bệnh nhân tùy thuộc vào loại điều trị, chúng tôi sẽ sử dụng thử nghiệm Mann-Whitney không đối xứng.

Tính năng (biến)

Sự định nghĩa. Xđặc điểm của đối tượng nghiên cứu (quan sát). Có đặc điểm định tính và định lượng.

Ngẫu nhiên hóa

Sự định nghĩa. Phương pháp phân bổ ngẫu nhiên các đối tượng nghiên cứu vào nhóm chính và nhóm đối chứng sử dụng các phương tiện đặc biệt (bảng hoặc máy đếm số ngẫu nhiên, tung đồng xu và các phương pháp khác để chỉ định ngẫu nhiên một số nhóm cho một quan sát bao gồm). Việc ngẫu nhiên hóa giảm thiểu sự khác biệt giữa các nhóm về các đặc điểm đã biết và chưa biết có khả năng ảnh hưởng đến kết quả đang được nghiên cứu.

Rủi ro

Thuộc tính- rủi ro bổ sung của một kết quả không thuận lợi (ví dụ, một căn bệnh) do sự hiện diện của một đặc tính nhất định (yếu tố nguy cơ) trong đối tượng nghiên cứu. Đây là phần nguy cơ phát triển bệnh có liên quan đến yếu tố nguy cơ này, được giải thích bởi nó và có thể được loại bỏ nếu yếu tố nguy cơ này được loại bỏ.

Rủi ro tương đối- tỷ lệ giữa rủi ro của một điều kiện không thuận lợi trong một nhóm này với rủi ro của điều kiện này trong một nhóm khác. Nó được sử dụng trong các nghiên cứu tương lai và quan sát khi các nhóm đã được thành lập trước, và sự xuất hiện của tình trạng được nghiên cứu chưa xảy ra.

thi cuốn chiếu

Sự định nghĩa. Một phương pháp để kiểm tra tính ổn định, độ tin cậy, hiệu suất (tính hợp lệ) của một mô hình thống kê bằng cách xóa liên tiếp các quan sát và tính toán lại mô hình. Các mô hình kết quả càng giống nhau, mô hình đó càng ổn định và đáng tin cậy.

Biến cố

Sự định nghĩa. Kết quả lâm sàng quan sát được trong nghiên cứu, chẳng hạn như sự xuất hiện của các biến chứng, tái phát, hồi phục, tử vong.

Sự phân tầng

Sự định nghĩa. M một phương pháp chọn mẫu trong đó tập hợp tất cả những người tham gia đáp ứng các tiêu chí bao gồm trong một nghiên cứu trước tiên được chia thành các nhóm (tầng lớp) dựa trên một hoặc nhiều đặc điểm (thường là giới tính, tuổi) có khả năng ảnh hưởng đến kết quả được nghiên cứu, sau đó từ mỗi trong số các nhóm này (tầng), những người tham gia được tuyển chọn độc lập vào các nhóm thử nghiệm và đối chứng. Điều này cho phép nhà nghiên cứu cân bằng các đặc điểm quan trọng giữa nhóm thực nghiệm và nhóm đối chứng.

Bảng dữ liệu thống kê

Sự định nghĩa. Một bảng tần số (số) tuyệt đối của các quan sát, các cột tương ứng với giá trị của một đối tượng địa lý và các hàng với giá trị của đối tượng địa lý khác (trong trường hợp bảng dự phòng hai chiều). Các giá trị của tần số tuyệt đối nằm trong các ô ở giao điểm của các hàng và cột.

Hãy để chúng tôi đưa ra một ví dụ về bảng dự phòng. Phẫu thuật túi phình được thực hiện trên 194 bệnh nhân. Một chỉ số đã biết về mức độ nghiêm trọng của phù nề ở bệnh nhân trước khi phẫu thuật.

Phù nề \ Kết quả
không phù nề	20	6	26
sưng vừa phải	27	15	42
phù nề rõ rệt	8	21	29
mj	55	42	194

Như vậy, trong số 26 bệnh nhân không bị phù, 20 bệnh nhân sống sót sau ca mổ, 6 bệnh nhân tử vong. Trong số 42 bệnh nhân phù vừa, 27 bệnh nhân sống sót, 15 bệnh nhân tử vong, v.v.

Kiểm định chi bình phương cho các bảng dự phòng

Để xác định ý nghĩa (độ tin cậy) của sự khác biệt trong một dấu hiệu phụ thuộc vào dấu hiệu khác (ví dụ, kết quả của một ca phẫu thuật tùy thuộc vào mức độ nghiêm trọng của phù nề), một phép thử chi bình phương được sử dụng cho các bảng dự phòng:

Cơ hội

Cho xác suất của một sự kiện nào đó bằng p. Khi đó xác suất để biến cố không xảy ra là 1-p.

Ví dụ, nếu xác suất bệnh nhân vẫn còn sống sau năm năm là 0,8 (80%), thì xác suất anh ta chết trong khoảng thời gian này là 0,2 (20%).

Sự định nghĩa. Cơ hội là tỷ số giữa xác suất một sự kiện sẽ xảy ra với xác suất sự kiện đó sẽ không xảy ra.

Ví dụ. Trong ví dụ của chúng tôi (về bệnh nhân), cơ hội là 4, vì 0,8 / 0,2 = 4

Như vậy, xác suất phục hồi gấp 4 lần xác suất tử vong.

Diễn giải giá trị của một đại lượng.

1) Nếu Cơ hội = 1, thì xác suất của sự kiện xảy ra bằng xác suất sự kiện đó sẽ không xảy ra;

2) nếu Cơ hội> 1, thì xác suất sự kiện xảy ra lớn hơn xác suất sự kiện không xảy ra;

3) nếu cơ hội<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

tỷ số chênh

Sự định nghĩa. Tỷ số chênh lệch là tỷ số giữa tỷ lệ chênh lệch của nhóm đối tượng thứ nhất với tỷ số chênh lệch của nhóm đối tượng thứ hai.

Ví dụ. Chúng ta hãy giả định rằng cả nam giới và phụ nữ đều trải qua một số điều trị.

Xác suất bệnh nhân nam còn sống sau 5 năm là 0,6 (60%); xác suất anh ta chết trong khoảng thời gian này là 0,4 (40%).

Xác suất tương tự đối với phụ nữ là 0,8 và 0,2.

Tỷ lệ chênh lệch trong ví dụ này là

Diễn giải giá trị của một đại lượng.

1) Nếu tỷ số chênh lệch = 1, thì cơ hội cho nhóm đầu tiên bằng cơ hội cho nhóm thứ hai

2) Nếu tỷ số chênh lệch> 1, thì cơ hội cho nhóm đầu tiên lớn hơn cơ hội cho nhóm thứ hai

3) Nếu tỷ lệ chênh lệch<1, то шанс для первой группы меньше шанса для второй группы