Độ tin cậy của công thức dữ liệu thống kê. Khái niệm ý nghĩa thống kê

Ngày nay, điều đó thực sự quá dễ dàng: bạn có thể bước tới máy tính mà không cần biết hoặc không biết mình đang làm gì, tạo ra những điều vô nghĩa với tốc độ thực sự đáng kinh ngạc. (J. Box)

Các thuật ngữ và khái niệm cơ bản của thống kê y tế

Trong bài viết này, chúng tôi trình bày một số khái niệm chính của thống kê có liên quan trong nghiên cứu y học. Các điều khoản được thảo luận chi tiết hơn trong các bài viết liên quan.

Biến thể

Sự định nghĩa. Mức độ phân tán của dữ liệu (giá trị dấu hiệu) trong phạm vi giá trị

Xác suất

Sự định nghĩa. Xác suất là mức độ mà một sự kiện nhất định có thể xảy ra trong những điều kiện nhất định.

Ví dụ. Hãy để chúng tôi giải thích định nghĩa của thuật ngữ trong câu "Xác suất khỏi bệnh khi sử dụng thuốc Arimidex là 70%". Sự kiện là "bệnh nhân bình phục", tình trạng "bệnh nhân đang dùng Arimidex", mức độ có thể xảy ra là 70% (nói đại khái là trong số 100 người dùng Arimidex thì có 70 người khỏi bệnh).

Xác suất tích lũy

Sự định nghĩa. Xác suất sống sót tích lũy tại thời điểm t bằng với tỷ lệ bệnh nhân sống sót tại thời điểm đó.

Ví dụ. Nếu nói rằng xác suất sống sót tích lũy sau một đợt điều trị 5 năm là 0,7, thì điều này có nghĩa là trong nhóm bệnh nhân được xem xét, 70% số người ban đầu còn sống và 30% đã tử vong. Nói cách khác, cứ một trăm người thì có 30 người chết trong vòng 5 năm đầu.

Thời gian để sự kiện

Sự định nghĩa. Thời gian để xảy ra sự kiện - đây là thời gian, được biểu thị bằng một số đơn vị, đã trôi qua kể từ thời điểm ban đầu cho đến khi xảy ra sự kiện nào đó.

Giải trình. Đơn vị thời gian trong nghiên cứu y học là ngày, tháng và năm.

Ví dụ điển hình về thời gian đầu:

bắt đầu theo dõi bệnh nhân

điều trị phẫu thuật

Ví dụ điển hình về các sự kiện được xem xét:

tiến triển của bệnh

sự tái xuất

bệnh nhân tử vong

Mẫu vật

Sự định nghĩa. Một phần của dân số thu được bằng cách chọn lọc.

Dựa trên kết quả phân tích mẫu, kết luận được rút ra về toàn bộ quần thể, kết luận này chỉ có giá trị nếu việc lựa chọn là ngẫu nhiên. Vì thực tế không thể chọn ngẫu nhiên từ một quần thể, nên người ta phải cố gắng đảm bảo rằng mẫu ít nhất là đại diện cho quần thể.

Mẫu phụ thuộc và độc lập

Sự định nghĩa. Các mẫu trong đó các đối tượng nghiên cứu được tuyển chọn độc lập với nhau. Một thay thế cho các mẫu độc lập là các mẫu phụ thuộc (kết nối, ghép nối).

Giả thuyết

Giả thuyết song phương và đơn phương

Trước tiên, chúng ta hãy giải thích việc sử dụng giả thuyết thuật ngữ trong thống kê.

Mục tiêu của hầu hết các nghiên cứu là để kiểm tra tính trung thực của một số tuyên bố. Mục đích của thử nghiệm thuốc thường là để kiểm tra giả thuyết rằng một loại thuốc này có hiệu quả hơn một loại thuốc khác (ví dụ: Arimidex hiệu quả hơn Tamoxifen).

Để truyền đạt tính chặt chẽ của nghiên cứu, tuyên bố đang được xác minh được thể hiện bằng toán học. Ví dụ, nếu A là số năm một bệnh nhân sử dụng Arimidex sẽ sống và T là số năm một bệnh nhân sẽ sống trên Tamoxifen, thì giả thuyết đang được kiểm định có thể được viết là A> T.

Sự định nghĩa. Giả thuyết được gọi là hai mặt nếu nó bao gồm sự bằng nhau của hai đại lượng.

Một ví dụ về giả thuyết hai mặt: A = T.

Sự định nghĩa. Giả thuyết được gọi là một phía (1 phía) nếu nó bao gồm bất đẳng thức của hai đại lượng.

Ví dụ về giả thuyết một phía:

Dữ liệu lưỡng phân (nhị phân)

Sự định nghĩa. Dữ liệu chỉ được thể hiện bằng hai giá trị thay thế hợp lệ

Ví dụ: Bệnh nhân “khỏe” - “ốm”. Phù "là" - "không hiện".

Mức độ tin cậy

Sự định nghĩa. Khoảng tin cậy đối với một số đại lượng là phạm vi xung quanh giá trị của đại lượng chứa giá trị thực của đại lượng đó (với một mức độ tin cậy nhất định).

Ví dụ. Gọi số lượng đang nghiên cứu là số lượng bệnh nhân mỗi năm. Trung bình, số của chúng là 500 và khoảng tin cậy 95% là (350, 900). Điều này có nghĩa là, rất có thể (với xác suất 95%), ít nhất 350 người và không quá 900 người sẽ liên hệ với phòng khám trong năm.

Chỉ định. Một cách viết tắt rất phổ biến là: KTC 95% (KTC 95%) là khoảng tin cậy với độ tin cậy là 95%.

Độ tin cậy, ý nghĩa thống kê (P - mức)

Sự định nghĩa.Ý nghĩa thống kê của một kết quả là thước đo độ tin cậy vào "sự thật" của nó.

Bất kỳ nghiên cứu nào cũng chỉ dựa trên một phần của các đối tượng. Nghiên cứu về hiệu quả của một loại thuốc không được thực hiện trên cơ sở tất cả bệnh nhân trên hành tinh nói chung mà chỉ trên một nhóm bệnh nhân nhất định (đơn giản là không thể tiến hành phân tích trên cơ sở tất cả bệnh nhân).

Hãy giả định rằng một số kết luận được đưa ra do kết quả của phân tích (ví dụ, việc sử dụng Arimidex như một liệu pháp thích hợp có hiệu quả gấp 2 lần so với Tamoxifen).

Câu hỏi cần được đặt ra là: “Bạn có thể tin tưởng vào kết quả này đến mức nào?”.

Hãy tưởng tượng rằng chúng tôi đang thực hiện một nghiên cứu chỉ dựa trên hai bệnh nhân. Tất nhiên, trong trường hợp này, kết quả nên được quan tâm. Nếu một số lượng lớn bệnh nhân đã được kiểm tra (giá trị của "một số lớn" tùy thuộc vào tình huống), thì kết luận rút ra có thể được tin cậy.

Vì vậy, mức độ tin cậy được xác định bởi giá trị của mức p (p-value).

Mức p cao hơn tương ứng với mức độ tin cậy thấp hơn trong kết quả thu được từ việc phân tích mẫu. Ví dụ, mức p bằng 0,05 (5%) cho thấy kết luận được đưa ra trong quá trình phân tích một nhóm nhất định chỉ là một đặc điểm ngẫu nhiên của các đối tượng này với xác suất chỉ là 5%.

Nói cách khác, với xác suất rất cao (95%), kết luận có thể được mở rộng cho tất cả các đối tượng.

Trong nhiều nghiên cứu, 5% được coi là giá trị p chấp nhận được. Điều này có nghĩa là nếu, ví dụ, p = 0,01, thì kết quả có thể được tin cậy, nhưng nếu p = 0,06 thì không thể.

Học

Nghiên cứu tiềm năng là một nghiên cứu trong đó các mẫu được chọn dựa trên một yếu tố đầu vào và một số yếu tố kết quả được phân tích trong các mẫu.

Nghiên cứu hồi cứu là một nghiên cứu trong đó các mẫu được chọn dựa trên yếu tố kết quả và một số yếu tố đầu vào được phân tích trong các mẫu.

Ví dụ. Yếu tố ban đầu là một phụ nữ mang thai dưới 20 tuổi. Kết quả là đứa trẻ nhẹ hơn / nặng hơn 2,5 kg. Chúng ta phân tích xem cân nặng của trẻ có phụ thuộc vào độ tuổi của mẹ hay không.

Nếu chúng ta lấy 2 mẫu, một mẫu với các bà mẹ trẻ hơn 20 tuổi, mẫu còn lại với các bà mẹ lớn tuổi, rồi phân tích khối lượng trẻ em trong mỗi nhóm, thì đây là một nghiên cứu tiềm năng.

Nếu chúng tôi thu thập 2 mẫu, trong đó một mẫu - bà mẹ sinh con nhẹ hơn 2,5 kg, mẫu còn lại - nặng hơn, và sau đó chúng tôi phân tích tuổi của các bà mẹ trong mỗi nhóm, thì đây là một nghiên cứu hồi cứu (tất nhiên, như vậy nghiên cứu chỉ có thể được thực hiện khi thí nghiệm được hoàn thành, tức là tất cả trẻ em được sinh ra).

Cuộc di cư

Sự định nghĩa. Một sự kiện quan trọng về mặt lâm sàng, giá trị trong phòng thí nghiệm hoặc dấu hiệu mà nhà nghiên cứu quan tâm. Trong các thử nghiệm lâm sàng, kết quả đóng vai trò là tiêu chí đánh giá hiệu quả của một can thiệp điều trị hoặc dự phòng.

Dịch tễ học lâm sàng

Sự định nghĩa. Khoa học cho phép dự đoán một kết quả cụ thể cho một bệnh nhân cụ thể dựa trên nghiên cứu về diễn biến lâm sàng của bệnh trong những trường hợp tương tự, sử dụng các phương pháp khoa học nghiêm ngặt nghiên cứu bệnh nhân để đảm bảo dự đoán chính xác.

Đội quân

Sự định nghĩa. Một nhóm người tham gia vào một nghiên cứu, được thống nhất bởi một số đặc điểm chung tại thời điểm hình thành và được nghiên cứu trong một thời gian dài.

Sự kiểm soát

Kiểm soát lịch sử

Sự định nghĩa. Nhóm đối chứng được thành lập và kiểm tra trong khoảng thời gian trước khi nghiên cứu.

Điều khiển song song

Sự định nghĩa. Nhóm kiểm soát, được hình thành đồng thời với sự hình thành của nhóm chính.

Tương quan

Sự định nghĩa. Mối quan hệ thống kê của hai dấu hiệu (định lượng hoặc thứ tự), cho thấy rằng giá trị lớn hơn của một dấu hiệu trong một số trường hợp nhất định tương ứng với giá trị lớn hơn - trong trường hợp tương quan thuận (trực tiếp) - giá trị của dấu hiệu khác hoặc giá trị nhỏ hơn - trong trường hợp tương quan âm (nghịch).

Ví dụ. Một mối tương quan đáng kể đã được tìm thấy giữa mức độ tiểu cầu và bạch cầu trong máu của bệnh nhân. Hệ số tương quan là 0,76.

Tỷ lệ rủi ro (CR)

Sự định nghĩa. Tỷ lệ rủi ro (tỷ lệ rủi ro) là tỷ số giữa xác suất của một sự kiện nào đó ("xấu") đối với nhóm đối tượng thứ nhất với xác suất của cùng một sự kiện xảy ra đối với nhóm đối tượng thứ hai.

Ví dụ. Nếu những người không hút thuốc có 20% khả năng bị ung thư phổi và 100% khả năng bị ung thư phổi ở những người hút thuốc, thì CR sẽ là 1/5. Trong ví dụ này, nhóm đối tượng thứ nhất là những người không hút thuốc, nhóm thứ hai là những người hút thuốc, và sự xuất hiện của ung thư phổi được coi như một sự kiện “xấu”.

Hiển nhiên là:

1) nếu КР = 1, thì xác suất của sự kiện xảy ra trong các nhóm là như nhau

2) nếu КР> 1, thì sự kiện xảy ra với các đối tượng từ nhóm đầu tiên thường xuyên hơn so với đối tượng thứ hai

3) nếu CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Phân tích tổng hợp

Sự định nghĩa. Với phân tích thống kê tổng hợp kết quả của một số nghiên cứu điều tra cùng một vấn đề (thường là hiệu quả của các phương pháp điều trị, phòng ngừa, chẩn đoán). Nghiên cứu gộp cung cấp một mẫu lớn hơn để phân tích và sức mạnh thống kê lớn hơn của các nghiên cứu gộp. Được sử dụng để tăng bằng chứng hoặc sự tin tưởng vào kết luận về hiệu quả của phương pháp nghiên cứu.

Phương pháp Kaplan-Meier (Nhiều ước tính Kaplan-Meier)

Phương pháp này được phát minh bởi các nhà thống kê E. L. Kaplan và Paul Meyer.

Phương pháp được sử dụng để tính toán các đại lượng khác nhau liên quan đến thời gian quan sát của bệnh nhân. Ví dụ về các giá trị như vậy:

cơ hội phục hồi trong vòng một năm khi sử dụng thuốc

cơ hội tái phát sau phẫu thuật trong vòng ba năm sau phẫu thuật

tích lũy xác suất sống sót sau năm năm của bệnh nhân ung thư tuyến tiền liệt sau khi cắt bỏ nội tạng

Hãy để chúng tôi giải thích những lợi thế của việc sử dụng phương pháp Kaplan-Meier.

Giá trị của các giá trị trong phân tích "bình thường" (không sử dụng phương pháp Kaplan-Meier) được tính toán trên cơ sở chia khoảng thời gian được xem xét thành các khoảng.

Ví dụ, nếu chúng ta kiểm tra xác suất tử vong của một bệnh nhân trong vòng 5 năm, thì khoảng thời gian có thể được chia thành 5 phần (dưới 1 năm, 1-2 năm, 2-3 năm, 3-4 năm, 4). 5 năm), như vậy và 10 (mỗi nửa năm), hoặc một số khoảng thời gian khác. Kết quả sẽ khác nhau đối với các phân vùng khác nhau.

Lựa chọn phân vùng thích hợp nhất không phải là một việc dễ dàng.

Việc ước lượng giá trị của các giá trị thu được bằng phương pháp Kaplan-Meier không phụ thuộc vào việc chia thời gian quan sát thành các khoảng, mà chỉ phụ thuộc vào thời gian sống của từng bệnh nhân.

Do đó, nhà nghiên cứu sẽ thực hiện phân tích dễ dàng hơn và kết quả thường có chất lượng cao hơn so với kết quả của phân tích “thông thường”.

Đường cong Kaplan-Meier là đồ thị của đường cong sống sót thu được bằng phương pháp Kaplan-Meier.

Mô hình Cox

Mô hình này được phát minh bởi Sir David Roxby Cox (sinh năm 1924), một nhà thống kê nổi tiếng người Anh, tác giả của hơn 300 bài báo và sách.

Mô hình Cox được sử dụng trong các tình huống mà các đại lượng được nghiên cứu trong phân tích sự sống sót phụ thuộc vào các hàm của thời gian. Ví dụ, xác suất tái diễn sau t năm (t = 1,2,…) có thể phụ thuộc vào logarit của log thời gian (t).

Một ưu điểm quan trọng của phương pháp do Cox đề xuất là khả năng áp dụng của phương pháp này trong một số lượng lớn các tình huống (mô hình không áp đặt các hạn chế nghiêm ngặt về bản chất hoặc hình thức của phân phối xác suất).

Dựa trên mô hình Cox, một phân tích (được gọi là phân tích Cox) có thể được thực hiện, kết quả là giá trị tỷ lệ rủi ro và khoảng tin cậy cho tỷ lệ rủi ro.

Phương pháp thống kê phi tham số

Sự định nghĩa. Một loại phương pháp thống kê được sử dụng chủ yếu để phân tích dữ liệu định lượng không được phân phối chuẩn, cũng như để phân tích dữ liệu định tính.

Ví dụ. Để xác định tầm quan trọng của sự khác biệt trong huyết áp tâm thu của bệnh nhân tùy thuộc vào loại điều trị, chúng tôi sẽ sử dụng thử nghiệm Mann-Whitney không đối xứng.

Tính năng (biến)

Sự định nghĩa. Xđặc điểm của đối tượng nghiên cứu (quan sát). Có đặc điểm định tính và định lượng.

Ngẫu nhiên hóa

Sự định nghĩa. Phương pháp phân bổ ngẫu nhiên các đối tượng nghiên cứu vào nhóm chính và nhóm đối chứng sử dụng các phương tiện đặc biệt (bảng hoặc máy đếm số ngẫu nhiên, tung đồng xu và các phương pháp khác để chỉ định ngẫu nhiên một số nhóm cho một quan sát bao gồm). Việc ngẫu nhiên hóa giảm thiểu sự khác biệt giữa các nhóm về các đặc điểm đã biết và chưa biết có khả năng ảnh hưởng đến kết quả đang được nghiên cứu.

Rủi ro

Thuộc tính- rủi ro bổ sung của một kết quả không thuận lợi (ví dụ, một căn bệnh) do sự hiện diện của một đặc tính nhất định (yếu tố nguy cơ) trong đối tượng nghiên cứu. Đây là phần nguy cơ phát triển bệnh có liên quan đến yếu tố nguy cơ này, được giải thích bởi nó và có thể được loại bỏ nếu yếu tố nguy cơ này được loại bỏ.

Rủi ro tương đối- tỷ lệ giữa rủi ro của một điều kiện không thuận lợi trong một nhóm này với rủi ro của điều kiện này trong một nhóm khác. Nó được sử dụng trong các nghiên cứu tương lai và quan sát khi các nhóm đã được thành lập trước, và sự xuất hiện của tình trạng được nghiên cứu chưa xảy ra.

thi cuốn chiếu

Sự định nghĩa. Một phương pháp để kiểm tra tính ổn định, độ tin cậy, hiệu suất (tính hợp lệ) của một mô hình thống kê bằng cách xóa liên tiếp các quan sát và tính toán lại mô hình. Các mô hình kết quả càng giống nhau, mô hình đó càng ổn định và đáng tin cậy.

Biến cố

Sự định nghĩa. Kết quả lâm sàng quan sát được trong nghiên cứu, chẳng hạn như sự xuất hiện của các biến chứng, tái phát, hồi phục, tử vong.

Sự phân tầng

Sự định nghĩa. M một phương pháp chọn mẫu trong đó tập hợp tất cả những người tham gia đáp ứng các tiêu chí bao gồm cho một nghiên cứu trước tiên được chia thành các nhóm (tầng lớp) dựa trên một hoặc nhiều đặc điểm (thường là giới tính, tuổi tác) có khả năng ảnh hưởng đến kết quả được nghiên cứu, và sau đó từ mỗi các nhóm này (tầng), những người tham gia được tuyển chọn một cách độc lập vào các nhóm thử nghiệm và đối chứng. Điều này cho phép nhà nghiên cứu cân bằng các đặc điểm quan trọng giữa nhóm thực nghiệm và nhóm đối chứng.

Bảng dữ liệu thống kê

Sự định nghĩa. Một bảng tần số (số) tuyệt đối của các quan sát, các cột tương ứng với giá trị của một đối tượng địa lý và các hàng với giá trị của đối tượng địa lý khác (trong trường hợp bảng dự phòng hai chiều). Các giá trị của tần số tuyệt đối nằm trong các ô ở giao điểm của các hàng và cột.

Hãy để chúng tôi đưa ra một ví dụ về bảng dự phòng. Phẫu thuật túi phình được thực hiện trên 194 bệnh nhân. Một chỉ số đã biết về mức độ nghiêm trọng của phù nề ở bệnh nhân trước khi phẫu thuật.

Phù nề \ Kết quả
không phù nề	20	6	26
sưng vừa phải	27	15	42
phù nề rõ rệt	8	21	29
mj	55	42	194

Như vậy, trong số 26 bệnh nhân không bị phù, 20 bệnh nhân sống sót sau ca mổ, 6 bệnh nhân tử vong. Trong số 42 bệnh nhân phù vừa, 27 bệnh nhân sống sót, 15 bệnh nhân tử vong, v.v.

Kiểm tra chi bình phương cho các bảng dự phòng

Để xác định ý nghĩa (độ tin cậy) của sự khác biệt trong một dấu hiệu phụ thuộc vào dấu hiệu khác (ví dụ, kết quả của một ca phẫu thuật tùy thuộc vào mức độ nghiêm trọng của phù nề), một phép thử chi bình phương được sử dụng cho các bảng dự phòng:

Cơ hội

Cho xác suất của một sự kiện nào đó bằng p. Khi đó xác suất để biến cố không xảy ra là 1-p.

Ví dụ, nếu xác suất bệnh nhân vẫn còn sống sau năm năm là 0,8 (80%), thì xác suất anh ta chết trong khoảng thời gian này là 0,2 (20%).

Sự định nghĩa. Cơ hội là tỷ số giữa xác suất một sự kiện sẽ xảy ra với xác suất sự kiện đó sẽ không xảy ra.

Ví dụ. Trong ví dụ của chúng tôi (về bệnh nhân), cơ hội là 4, vì 0,8 / 0,2 = 4

Như vậy, xác suất phục hồi gấp 4 lần xác suất tử vong.

Diễn giải giá trị của một đại lượng.

1) Nếu Cơ hội = 1, thì xác suất của sự kiện xảy ra bằng xác suất sự kiện đó sẽ không xảy ra;

2) nếu Cơ hội> 1, thì xác suất sự kiện xảy ra lớn hơn xác suất sự kiện không xảy ra;

3) nếu cơ hội<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

tỷ số chênh

Sự định nghĩa. Tỷ số chênh lệch là tỷ số giữa tỷ lệ chênh lệch của nhóm đối tượng thứ nhất với tỷ số chênh lệch của nhóm đối tượng thứ hai.

Ví dụ. Chúng ta hãy giả định rằng cả nam giới và phụ nữ đều trải qua một số điều trị.

Xác suất bệnh nhân nam còn sống sau 5 năm là 0,6 (60%); xác suất anh ta chết trong khoảng thời gian này là 0,4 (40%).

Xác suất tương tự đối với phụ nữ là 0,8 và 0,2.

Tỷ lệ chênh lệch trong ví dụ này là

Diễn giải giá trị của một đại lượng.

1) Nếu tỷ số chênh lệch = 1, thì cơ hội cho nhóm đầu tiên bằng cơ hội cho nhóm thứ hai

2) Nếu tỷ số chênh lệch> 1, thì cơ hội cho nhóm đầu tiên lớn hơn cơ hội cho nhóm thứ hai

3) Nếu tỷ lệ chênh lệch<1, то шанс для первой группы меньше шанса для второй группы

Hãy xem xét một ví dụ điển hình về việc áp dụng các phương pháp thống kê trong y học. Những người tạo ra thuốc cho rằng nó làm tăng bài niệu tương ứng với liều dùng. Để kiểm tra giả định này, họ cho 5 tình nguyện viên dùng các liều thuốc khác nhau.

Theo kết quả quan sát, biểu đồ của sự lợi tiểu so với liều lượng được vẽ (Hình 1.2A). Sự phụ thuộc có thể nhìn thấy bằng mắt thường. Các nhà nghiên cứu chúc mừng nhau về khám phá và thế giới về loại thuốc lợi tiểu mới.

Trên thực tế, dữ liệu cho phép chúng tôi chỉ ra một cách đáng tin cậy rằng sự phụ thuộc của bài niệu vào liều lượng đã được quan sát thấy ở năm tình nguyện viên này. Thực tế là sự phụ thuộc này sẽ thể hiện ở tất cả những người sẽ dùng thuốc không gì khác hơn là phỏng đoán.
WJ

với

zhenie. Không thể nói rằng nó là vô căn cứ - nếu không, tại sao lại là thí nghiệm?

Nhưng hiện nay thuốc đã có mặt trên thị trường. Ngày càng có nhiều người dùng nó với hy vọng tăng bài niệu của họ. Và chúng ta thấy gì? Chúng ta xem Hình 1.2B, cho thấy không có bất kỳ mối quan hệ nào giữa liều lượng thuốc và bài niệu. Các vòng tròn màu đen đại diện cho dữ liệu từ nghiên cứu ban đầu. Thống kê có các phương pháp để ước tính xác suất thu được một "không đại diện" như vậy, hơn nữa, mẫu gây nhầm lẫn. Nó chỉ ra rằng trong trường hợp không có mối quan hệ giữa bài niệu và liều lượng của thuốc, kết quả là "sự phụ thuộc" sẽ được quan sát thấy trong khoảng 5 trong số 1000 thí nghiệm. Vì vậy, trong trường hợp này, các nhà nghiên cứu đã gặp may. Ngay cả khi họ áp dụng ngay cả những phương pháp thống kê hoàn hảo nhất, nó vẫn không thể cứu họ khỏi sai sót.

Ví dụ này hư cấu nhưng không hề xa rời thực tế, chúng tôi trích dẫn không phải để chỉ ra sự vô dụng
số liệu thống kê. Anh ta nói về điều gì đó khác, về tính chất xác suất trong các kết luận của cô ấy. Kết quả của việc áp dụng phương pháp thống kê, chúng ta không nhận được chân lý cuối cùng, mà chỉ ước tính xác suất của một giả định cụ thể. Ngoài ra, mỗi phương pháp thống kê dựa trên mô hình toán học của riêng nó và kết quả của nó là chính xác trong chừng mực mà mô hình này tương ứng với thực tế.

Tìm hiểu thêm về ĐỘ TIN CẬY VÀ KÝ HIỆU THỐNG KÊ:

Sự khác biệt có ý nghĩa thống kê về các chỉ số chất lượng cuộc sống
Tổng hợp thống kê. Các dấu hiệu tài khoản. Khái niệm về nghiên cứu liên tục và có chọn lọc. Yêu cầu đối với dân số thống kê và việc sử dụng các tài liệu kế toán và báo cáo
BÀI VĂN. NGHIÊN CỨU ĐỘ TIN CẬY CỦA TONOMETER ĐỌC BÀI VIẾT ĐO ÁP SUẤT INTRAOCULAR QUA EYELID 2018, 2018

Trong bất kỳ tình huống khoa học và thực tiễn nào của một cuộc thí nghiệm (khảo sát), nhà nghiên cứu không thể nghiên cứu tất cả mọi người (dân số chung, dân số) mà chỉ nghiên cứu một mẫu nhất định. Ví dụ, ngay cả khi chúng tôi đang kiểm tra một nhóm tương đối nhỏ người, chẳng hạn như những người mắc một căn bệnh cụ thể, thì rất khó có khả năng chúng tôi có đủ nguồn lực hoặc nhu cầu xét nghiệm mọi bệnh nhân. Thay vào đó, một mẫu dân số thường được kiểm tra vì nó thuận tiện hơn và tốn ít thời gian hơn. Trong trường hợp đó, làm thế nào chúng ta biết rằng kết quả thu được từ mẫu đại diện cho cả nhóm? Hoặc, để sử dụng thuật ngữ chuyên môn, chúng tôi có thể chắc chắn rằng nghiên cứu của chúng tôi mô tả chính xác toàn bộ dân số, mẫu mà chúng tôi đã sử dụng?

Để trả lời câu hỏi này, cần xác định ý nghĩa thống kê của các kết quả thử nghiệm. Ý nghĩa thống kê (Mức độ đáng kể, viết tắt Dấu hiệu.), hoặc / 7-mức ý nghĩa (mức p) - là xác suất mà một kết quả nhất định đại diện chính xác cho dân số mà từ đó mẫu được nghiên cứu. Lưu ý rằng đây chỉ là xác suất- không thể nói một cách chắc chắn rằng nghiên cứu này mô tả chính xác toàn bộ dân số. Tốt nhất, người ta chỉ có thể kết luận từ mức độ ý nghĩa rằng điều này có khả năng xảy ra cao. Do đó, câu hỏi sau đây chắc chắn được đặt ra: mức ý nghĩa nên được coi là kết quả nào để coi kết quả này là một đặc điểm chính xác của quần thể?

Ví dụ, ở giá trị xác suất nào bạn sẵn sàng nói rằng tỷ lệ cược như vậy là đủ để chấp nhận rủi ro? Nếu cơ hội là 10 trên 100 hoặc 50 trên 100? Nhưng nếu xác suất này cao hơn thì sao? Còn tỷ lệ cược như 90 trên 100, 95 trên 100, hoặc 98 trên 100 thì sao? Đối với một tình huống gắn liền với rủi ro, lựa chọn này là khá khó khăn, bởi vì nó phụ thuộc vào đặc điểm cá nhân của một người.

Trong tâm lý học, theo truyền thống người ta tin rằng 95 hoặc hơn 100 cơ hội có nghĩa là xác suất đúng của kết quả đủ cao để được tổng quát hóa cho toàn bộ dân số. Con số này được xác lập trong quá trình hoạt động khoa học và thực tiễn - không có quy luật nào lấy nó làm kim chỉ nam (và quả thật, trong các ngành khoa học khác, đôi khi các giá trị khác cùng mức ý nghĩa được chọn).

Trong tâm lý học, xác suất này được xử lý theo một cách hơi khác thường. Thay vì xác suất mẫu đại diện cho một tổng thể, xác suất mẫu đó là không đại diện dân số. Nói cách khác, đó là xác suất mà mối quan hệ hoặc sự khác biệt được phát hiện là ngẫu nhiên và không phải là một thuộc tính của tổng thể. Do đó, thay vì nói rằng kết quả của một nghiên cứu là 95 trên 100 là đúng, các nhà tâm lý học nói rằng có 5 trong số 100 khả năng kết quả là sai (tương tự, 40 trong số 100 cơ hội ủng hộ kết quả là đúng có nghĩa là 60 trong số 100 cơ hội có lợi cho sự sai trái của họ). Giá trị xác suất đôi khi được biểu thị dưới dạng phần trăm, nhưng thường được viết dưới dạng phân số thập phân. Ví dụ: 10 cơ hội trong số 100 cơ hội được biểu diễn dưới dạng phân số thập phân 0,1; 5 trên 100 được viết là 0,05; 1 trên 100 - 0,01. Với hình thức ghi này, giá trị giới hạn là 0,05. Để một kết quả được coi là đúng, mức ý nghĩa của nó phải là phía dưới con số này (hãy nhớ rằng đây là xác suất mà kết quả không đúng mô tả dân số. Để loại bỏ thuật ngữ, chúng tôi thêm rằng "xác suất kết quả sai" (được gọi đúng hơn là mức độ đáng kể) thường được ký hiệu bằng chữ cái Latinh R. Mô tả các kết quả của thử nghiệm thường bao gồm một kết luận tóm tắt, chẳng hạn như "các kết quả có ý nghĩa ở mức ý nghĩa (R(p) nhỏ hơn 0,05 (tức là nhỏ hơn 5%).

Do đó, mức ý nghĩa ( R) cho biết xác suất mà kết quả không phảiđại diện cho dân số. Theo truyền thống trong tâm lý học, người ta tin rằng kết quả phản ánh một cách đáng tin cậy bức tranh tổng thể, nếu giá trị R nhỏ hơn 0,05 (tức là 5%). Tuy nhiên, đây chỉ là một tuyên bố xác suất, và hoàn toàn không phải là một sự đảm bảo vô điều kiện. Trong một số trường hợp, kết luận này có thể không chính xác. Trên thực tế, chúng ta có thể tính được tần suất điều này có thể xảy ra nếu chúng ta nhìn vào độ lớn của mức ý nghĩa. Với mức ý nghĩa 0,05, cứ 100 trường hợp thì có 5 trường hợp cho kết quả sai. 11a thoạt nhìn thì có vẻ như điều này không quá thường xuyên, nhưng nếu bạn nghĩ về nó, thì 5 trong số 100 cơ hội giống như 1 trên 20. Nói cách khác, cứ 20 trường hợp thì có một trường hợp kết quả ra là sai. Tỷ lệ cược như vậy có vẻ không đặc biệt thuận lợi và các nhà nghiên cứu nên cẩn thận khi phạm lỗi của loại đầu tiên.Đây là tên của lỗi xảy ra khi các nhà nghiên cứu nghĩ rằng họ đã tìm thấy kết quả thực sự, nhưng thực tế là không có. Các lỗi ngược lại, bao gồm việc các nhà nghiên cứu tin rằng họ không tìm thấy kết quả, nhưng thực tế là có một, được gọi là lỗi của loại thứ hai.

Những sai sót này phát sinh do không thể loại trừ khả năng phân tích thống kê không chính xác. Xác suất sai số phụ thuộc vào mức độ có ý nghĩa thống kê của các kết quả. Chúng tôi đã lưu ý rằng để kết quả được coi là đúng, mức ý nghĩa phải dưới 0,05. Tất nhiên, một số kết quả thấp hơn và không có gì lạ khi tìm thấy kết quả thấp tới 0,001 (giá trị 0,001 có nghĩa là có 1 trong 1.000 khả năng kết quả bị sai). Giá trị p càng nhỏ, niềm tin của chúng ta vào tính đúng đắn của kết quả càng cao.

Trong bảng. 7.2 cho thấy cách giải thích truyền thống của các mức ý nghĩa về khả năng suy luận thống kê và biện minh cho quyết định về sự hiện diện của mối liên hệ (sự khác biệt).

Bảng 7.2

Giải thích truyền thống về các cấp độ ý nghĩa được sử dụng trong tâm lý học

Dựa trên kinh nghiệm nghiên cứu thực tế, chúng tôi khuyến nghị rằng, để tránh sai sót của loại thứ nhất và thứ hai, khi đưa ra các kết luận có trách nhiệm, nên đưa ra các quyết định về sự hiện diện của các điểm khác biệt (các mối liên hệ), tập trung vào mức độ R dấu hiệu n.

Kiểm tra thống kê(Kiểm tra thống kê - nó là một công cụ để xác định mức độ có ý nghĩa thống kê. Đây là quy tắc quyết định đảm bảo rằng giả thuyết đúng được chấp nhận và giả thuyết sai bị bác bỏ với xác suất cao.

Chỉ tiêu thống kê cũng chỉ ra phương pháp tính một số nhất định và chính con số này. Tất cả các tiêu chí được sử dụng với một mục tiêu chính: xác định mức độ đáng kể dữ liệu mà họ phân tích (tức là khả năng dữ liệu phản ánh tác động thực sự thể hiện chính xác dân số mà từ đó mẫu được rút ra).

Một số tiêu chí chỉ có thể được sử dụng cho dữ liệu được phân phối bình thường (và nếu đối tượng địa lý được đo lường trên thang đo khoảng thời gian) - những tiêu chí này thường được gọi là tham số. Với sự trợ giúp của các tiêu chí khác, bạn có thể phân tích dữ liệu với hầu hết mọi luật phân phối - chúng được gọi là phi tham số.

Tiêu chí tham số - tiêu chí bao gồm các tham số phân phối trong công thức tính toán, tức là phương tiện và phương sai (Kiểm định t của Học sinh, Kiểm định F của Fisher, v.v.).

Tiêu chí phi tham số - tiêu chí không bao gồm các tham số phân phối trong công thức tính toán phân phối và dựa trên tần suất hoặc cấp bậc hoạt động (tiêu chí Q Rosenbaum, tiêu chí U Manna - Whitney

Ví dụ: khi chúng ta nói rằng tầm quan trọng của sự khác biệt được xác định bằng phép thử t của Sinh viên, chúng tôi muốn nói rằng phương pháp kiểm tra t của Sinh viên đã được sử dụng để tính toán giá trị thực nghiệm, sau đó được so sánh với giá trị dạng bảng (tới hạn).

Theo tỷ lệ giữa giá trị thực nghiệm (chúng tôi tính toán) và giá trị tới hạn của tiêu chí (bảng), chúng tôi có thể đánh giá liệu giả thuyết của chúng tôi được xác nhận hay bác bỏ. Trong hầu hết các trường hợp, để chúng tôi nhận ra sự khác biệt là đáng kể, thì giá trị thực nghiệm của tiêu chí phải vượt quá giá trị quan trọng, mặc dù có những tiêu chí (ví dụ, thử nghiệm Mann-Whitney hoặc thử nghiệm dấu hiệu) trong đó chúng ta phải tuân thủ quy tắc ngược lại.

Trong một số trường hợp, công thức tính toán của tiêu chí bao gồm số lượng quan sát trong mẫu nghiên cứu, được ký hiệu là P. Sử dụng một bảng đặc biệt, chúng tôi xác định mức ý nghĩa thống kê của sự khác biệt tương ứng với một giá trị thực nghiệm nhất định. Trong hầu hết các trường hợp, cùng một giá trị thực nghiệm của tiêu chí có thể là đáng kể hoặc không đáng kể, tùy thuộc vào số lượng quan sát trong mẫu nghiên cứu ( P ) hoặc từ cái gọi là số bậc tự do , được biểu thị là v (g>) hoặc cả hai df (thỉnh thoảng d).

Biết P hoặc số bậc tự do, chúng ta có thể xác định các giá trị tới hạn của tiêu chí bằng cách sử dụng các bảng đặc biệt (bảng chính được nêu trong Phụ lục 5) và so sánh giá trị thực nghiệm thu được với chúng. Nó thường được viết như thế này: n = 22 giá trị quan trọng của tiêu chí là tSt = 2.07 "hoặc" lúc v (d) = 2, các giá trị tới hạn của tiêu chí của Sinh viên là = 4,30 "và được gọi là.

Tuy nhiên, thông thường, ưu tiên được dành cho các tiêu chí tham số và chúng tôi tuân thủ quan điểm này. Chúng được coi là đáng tin cậy hơn và có thể cung cấp nhiều thông tin và phân tích sâu hơn. Đối với sự phức tạp của các phép tính toán học, khi sử dụng các chương trình máy tính, sự phức tạp này sẽ biến mất (tuy nhiên, một số khác lại xuất hiện, khá vượt trội).

Trong sách giáo khoa này, chúng tôi không đề cập chi tiết đến vấn đề thống kê
giả thuyết (không - R0 và thay thế - Hj) và các quyết định thống kê, vì sinh viên tâm lý học nghiên cứu điều này một cách riêng biệt trong chuyên ngành "Phương pháp toán học trong tâm lý học". Ngoài ra, cần lưu ý rằng khi chuẩn bị một báo cáo nghiên cứu (bài báo học kỳ hoặc luận án, công bố), các giả thuyết thống kê và giải pháp thống kê thường không được đưa ra. Thông thường, khi mô tả kết quả, một tiêu chí được chỉ ra, các thống kê mô tả cần thiết được đưa ra (phương tiện, sigma, hệ số tương quan, v.v.), các giá trị thực nghiệm của tiêu chí, bậc tự do và nhất thiết là mức ý nghĩa p. Sau đó, một kết luận có ý nghĩa được hình thành liên quan đến giả thuyết đang được kiểm tra, chỉ ra (thường ở dạng bất đẳng thức) mức ý nghĩa đạt được hoặc không đạt được.

THỐNG KÊ ĐỘ TIN CẬY

- Tiếng Anhđộ tin cậy / tính hợp lệ, tính thống kê; tiếng Đức Validitat, thống kê. Tính nhất quán, khách quan và không mơ hồ trong kiểm tra thống kê hoặc trong C.L. tập hợp các phép đo. D. s. có thể được kiểm tra bằng cách lặp lại cùng một bài kiểm tra (hoặc bảng câu hỏi) về cùng một đối tượng để xem có thu được cùng một kết quả hay không; hoặc bằng cách so sánh các phần khác nhau của thử nghiệm được cho là để đo cùng một đối tượng.

Antinazi. Bách khoa toàn thư về xã hội học, 2009

Xem "ĐỘ TIN CẬY THỐNG KÊ" trong các từ điển khác là gì:

THỐNG KÊ ĐỘ TIN CẬY- Tiếng Anh. độ tin cậy / tính hợp lệ, tính thống kê; tiếng Đức Validitat, thống kê. Tính nhất quán, khách quan và thiếu sự mơ hồ trong kiểm tra thống kê hoặc trong một s. tập hợp các phép đo. D. s. có thể được xác minh bằng cách lặp lại cùng một thử nghiệm (hoặc ... ... Từ điển Giải thích Xã hội học

Trong thống kê, một giá trị được gọi là có ý nghĩa thống kê nếu xác suất xuất hiện của nó một cách tình cờ hoặc thậm chí các giá trị cực đoan hơn là nhỏ. Ở đây, cực trị được hiểu là mức độ sai lệch của thống kê kiểm định so với giả thuyết vô hiệu. Sự khác biệt được gọi là ... ... Wikipedia

Hiện tượng vật lý của sự ổn định thống kê là khi kích thước mẫu tăng lên, tần suất của một sự kiện ngẫu nhiên hoặc giá trị trung bình của một đại lượng vật lý có xu hướng đến một số cố định nào đó. Hiện tượng thống kê ... ... Wikipedia

ĐỘ TIN CẬY CỦA SỰ KHÁC BIỆT (độ giống nhau)- quy trình phân tích và thống kê để thiết lập mức ý nghĩa của sự khác biệt hoặc giống nhau giữa các mẫu theo các chỉ số (biến) đã nghiên cứu ... Quá trình giáo dục hiện đại: các khái niệm và thuật ngữ cơ bản

BÁO CÁO, THỐNG KÊ Từ điển kế toán lớn

BÁO CÁO, THỐNG KÊ- một hình thức quan sát thống kê nhà nước, trong đó các cơ quan hữu quan nhận được từ các doanh nghiệp (tổ chức và cơ quan) thông tin họ cần dưới dạng các tài liệu báo cáo theo quy định của pháp luật (báo cáo thống kê) cho ... Từ điển kinh tế lớn

Một ngành khoa học nghiên cứu các phương pháp quan sát có hệ thống các hiện tượng hàng loạt của đời sống xã hội loài người, biên soạn các mô tả số của chúng và xử lý khoa học các mô tả này. Như vậy, thống kê lý thuyết là một khoa học ... Từ điển bách khoa F.A. Brockhaus và I.A. Efron

Hệ số tương quan- (Hệ số tương quan) Hệ số tương quan là chỉ tiêu thống kê về sự phụ thuộc của hai biến ngẫu nhiên Định nghĩa hệ số tương quan, các loại hệ số tương quan, tính chất của hệ số tương quan, cách tính và ứng dụng ... Bách khoa toàn thư của chủ đầu tư

Số liệu thống kê- (Thống kê) Thống kê là một môn khoa học lý thuyết tổng hợp nghiên cứu những thay đổi về lượng của các hiện tượng và quá trình. Thống kê nhà nước, dịch vụ thống kê, Rosstat (Goskomstat), dữ liệu thống kê, thống kê yêu cầu, thống kê bán hàng, ... ... Bách khoa toàn thư của chủ đầu tư

Tương quan- (Tương quan) Tương quan là quan hệ thống kê của hai hay nhiều biến ngẫu nhiên Khái niệm tương quan, các loại tương quan, hệ số tương quan, phân tích tương quan, tương quan giá, tương quan các cặp tiền tệ trên Forex Nội dung ... Bách khoa toàn thư của chủ đầu tư

Sách

Nghiên cứu về Toán học và Toán học trong Nghiên cứu: Tuyển tập Phương pháp luận về Hoạt động Nghiên cứu của Sinh viên, Borzenko V.I. Bộ sưu tập trình bày những phát triển phương pháp luận áp dụng trong việc tổ chức các hoạt động nghiên cứu của sinh viên. Phần đầu tiên của bộ sưu tập được dành cho việc áp dụng phương pháp nghiên cứu trong…

Khái niệm ý nghĩa thống kê

Hiệu lực thống kê là điều cần thiết trong thực hành tính toán của FCC. Trước đó đã lưu ý rằng nhiều mẫu có thể được chọn từ cùng một quần thể:

Nếu chúng được chọn đúng, thì các chỉ số trung bình của chúng và các chỉ số của tổng thể chung sẽ khác nhau một chút về độ lớn của sai số tính đại diện, có tính đến độ tin cậy được chấp nhận;

Nếu chúng được chọn từ các quần thể chung khác nhau, sự khác biệt giữa chúng hóa ra là đáng kể. So sánh các mẫu thường được xem xét trong thống kê;

Nếu chúng khác nhau không đáng kể, không quan trọng, không đáng kể, tức là chúng thực sự thuộc về cùng một quần thể chung, thì sự khác biệt giữa chúng được gọi là không đáng tin cậy về mặt thống kê.

ý nghĩa thống kê sự khác biệt về mẫu là một mẫu có sự khác biệt đáng kể và về cơ bản, tức là thuộc về các quần thể chung khác nhau.

Trong FCC, đánh giá ý nghĩa thống kê của sự khác biệt mẫu có nghĩa là giải quyết nhiều vấn đề thực tế. Ví dụ, việc đưa ra các phương pháp, chương trình dạy học mới, các bộ bài tập, bài kiểm tra, bài tập đối chứng gắn với việc kiểm chứng thực nghiệm của chúng, điều này cho thấy nhóm kiểm tra khác biệt cơ bản với nhóm đối chứng. Do đó, các phương pháp thống kê đặc biệt được sử dụng, được gọi là tiêu chí về ý nghĩa thống kê, cho phép phát hiện sự có mặt hoặc không có sự khác biệt có ý nghĩa thống kê giữa các mẫu.

Tất cả các tiêu chí được chia thành hai nhóm: tham số và phi tham số. Tiêu chí tham số quy định sự hiện diện bắt buộc của luật phân phối chuẩn, tức là điều này đề cập đến việc xác định bắt buộc các chỉ số chính của luật thông thường - trung bình cộng X và độ lệch chuẩn về. Tiêu chí tham số là chính xác và đúng đắn nhất. Kiểm tra phi tham số dựa trên sự khác biệt về thứ hạng (thứ tự) giữa các phần tử của mẫu.

Dưới đây là các tiêu chí có ý nghĩa thống kê chính được sử dụng trong thực hành của FCC: Bài kiểm tra của học sinh, bài kiểm tra của Fisher, bài kiểm tra của Wilcoxon, bài kiểm tra của White, bài kiểm tra của Van der Waerden (bài kiểm tra dấu hiệu).

Tiêu chí của sinh viênđược đặt theo tên của nhà khoa học người Anh C. Gosset (Student là bút danh), người đã phát hiện ra phương pháp này. Tiêu chí của sinh viên là tham số, dùng để so sánh các giá trị tuyệt đối của các mẫu. Các mẫu có thể khác nhau về kích thước.

Tiêu chí của sinh viên được xác định như sau.

1. Tìm tiêu chí của Học sinh t theo công thức sau:

ở đâu xi, x 2 - trung bình cộng của các mẫu được so sánh; / i b w 2 - sai số về tính đại diện được xác định trên cơ sở các chỉ số của các mẫu được so sánh.

2. Thực hành trong FCC đã cho thấy rằng đối với công việc thể thao, nó là đủ để chấp nhận độ tin cậy của điểm số R= 0,95.

63 Đối với độ tin cậy của tài khoản: P = 0,95 (a = 0,05), với số độ; sự tự do k= «! + n 2 - 2 theo bảng ứng dụng 4 ta tìm được giá trị \ tốt, giá trị biên của tiêu chí (^ gr).

3. Dựa vào các tính chất của luật phân phối chuẩn, thực hiện phép so sánh trong bài kiểm tra của Học sinh t và t ^.

4. Rút ra kết luận:

Nếu một t> ftp, thì sự khác biệt giữa các mẫu được so sánh là có ý nghĩa thống kê;

Nếu một t< 7 F, thì sự khác biệt không có ý nghĩa thống kê.

Đối với các nhà nghiên cứu trong lĩnh vực FCC, việc đánh giá ý nghĩa thống kê là bước đầu tiên để giải quyết một vấn đề cụ thể: sự khác nhau về cơ bản hoặc không cơ bản giữa; các mẫu có thể so sánh được. Bước tiếp theo là; đánh giá về sự khác biệt này theo quan điểm sư phạm, được xác định bởi điều kiện của vấn đề.