Thuật ngữ nào đề cập đến độ tin cậy của thông tin thống kê. Xem "độ tin cậy thống kê" là gì trong các từ điển khác

Các tính năng chính của bất kỳ mối quan hệ nào giữa các biến.

Hai đặc tính đơn giản nhất của mối quan hệ giữa các biến có thể được lưu ý: (a) độ lớn của mối quan hệ và (b) độ tin cậy của mối quan hệ.

- Giá trị . Độ lớn phụ thuộc dễ hiểu và dễ đo lường hơn độ tin cậy. Ví dụ, nếu bất kỳ nam nào trong mẫu có số lượng bạch cầu (WCC) cao hơn bất kỳ nữ nào, thì bạn có thể nói rằng mối quan hệ giữa hai biến số (Giới tính và WCC) là rất cao. Nói cách khác, bạn có thể dự đoán giá trị của một biến từ các giá trị của biến khác.

- độ tin cậy ("sự thật"). Độ tin cậy của sự phụ thuộc lẫn nhau là một khái niệm ít trực quan hơn độ lớn của sự phụ thuộc, nhưng nó cực kỳ quan trọng. Độ tin cậy của sự phụ thuộc liên quan trực tiếp đến tính đại diện của một mẫu nhất định, trên cơ sở đó rút ra kết luận. Nói cách khác, độ tin cậy đề cập đến khả năng mối quan hệ sẽ được phát hiện lại (nói cách khác là được xác nhận) trên dữ liệu từ một mẫu khác được lấy từ cùng một tổng thể.

Cần nhớ rằng mục tiêu cuối cùng hầu như không bao giờ là nghiên cứu về mẫu giá trị cụ thể này; một mẫu chỉ được quan tâm trong chừng mực nó cung cấp thông tin về toàn bộ dân số. Nếu nghiên cứu thỏa mãn một số tiêu chí đặc biệt, thì độ tin cậy của các mối quan hệ tìm được giữa các biến mẫu có thể được lượng hóa và trình bày bằng cách sử dụng thước đo thống kê tiêu chuẩn.

Độ lớn phụ thuộc và độ tin cậy thể hiện hai đặc điểm khác nhau của sự phụ thuộc giữa các biến. Tuy nhiên, không thể nói rằng chúng hoàn toàn độc lập. Mối quan hệ (mối quan hệ) giữa các biến trong mẫu có kích thước bình thường càng lớn thì độ tin cậy càng cao (xem phần tiếp theo).

Ý nghĩa thống kê của một kết quả (mức p) là một thước đo ước tính về độ tin cậy về độ "đúng" của nó (theo nghĩa "tính đại diện của mẫu"). Về mặt kỹ thuật, giá trị p là một phép đo có mối quan hệ giảm dần với độ tin cậy của kết quả. Mức p cao hơn tương ứng với mức độ tin cậy thấp hơn trong mối quan hệ giữa các biến được tìm thấy trong mẫu. Cụ thể, mức p biểu thị xác suất sai số liên quan đến phân phối kết quả quan sát được cho toàn bộ tổng thể.

Ví dụ, p-level = 0,05(tức là 1/20) cho thấy có 5% khả năng mối quan hệ giữa các biến được tìm thấy trong mẫu chỉ là một đặc điểm ngẫu nhiên của mẫu này. Trong nhiều nghiên cứu, mức p 0,05 được coi là "giới hạn có thể chấp nhận được" đối với mức độ sai số.

Không có cách nào để tránh sự tùy tiện trong việc quyết định mức ý nghĩa nào thực sự nên được coi là "đáng kể". Việc lựa chọn một mức ý nghĩa nhất định mà trên đó kết quả bị từ chối là sai là khá tùy tiện.

Trên thực tế, quyết định cuối cùng thường phụ thuộc vào việc kết quả được dự đoán là tiên nghiệm (tức là trước khi thử nghiệm được thực hiện) hay phát hiện ra hậu nghiệm do kết quả của nhiều phân tích và so sánh được thực hiện với nhiều dữ liệu, cũng như truyền thống tồn tại trong lĩnh vực nghiên cứu này.

Thông thường, trong nhiều lĩnh vực, kết quả của p .05 là giới hạn có ý nghĩa thống kê có thể chấp nhận được, tuy nhiên, cần nhớ rằng mức này vẫn bao gồm một xác suất sai sót khá lớn (5%).

Kết quả có ý nghĩa ở p .01 thường được coi là có ý nghĩa thống kê, trong khi kết quả ở p .005 hoặc p. 001 càng có ý nghĩa. Tuy nhiên, cần hiểu rằng cách phân loại mức ý nghĩa này khá tùy tiện và chỉ là một quy ước không chính thức dựa trên kinh nghiệm thực tế. trong một lĩnh vực nghiên cứu cụ thể.

Rõ ràng là số lượng phân tích được thực hiện với tập hợp dữ liệu được thu thập càng lớn thì số lượng kết quả có ý nghĩa (ở mức đã chọn) sẽ được tìm thấy hoàn toàn do ngẫu nhiên càng lớn.

Một số phương pháp thống kê liên quan đến nhiều phép so sánh và do đó có khả năng lặp lại loại lỗi này đáng kể, hãy thực hiện điều chỉnh hoặc sửa chữa đặc biệt cho tổng số phép so sánh. Tuy nhiên, nhiều phương pháp thống kê (đặc biệt là các phương pháp phân tích dữ liệu khám phá đơn giản) không đưa ra bất kỳ cách nào để giải quyết vấn đề này.

Nếu mối quan hệ giữa các biến là "khách quan" yếu, thì không có cách nào khác để kiểm tra mối quan hệ đó ngoại trừ bằng cách kiểm tra một mẫu lớn. Ngay cả khi mẫu là đại diện hoàn hảo, ảnh hưởng sẽ không có ý nghĩa thống kê nếu mẫu nhỏ. Tương tự, nếu một mối quan hệ "khách quan" rất mạnh, thì nó có thể được tìm thấy với mức độ ý nghĩa cao ngay cả trong một mẫu rất nhỏ.

Mối quan hệ giữa các biến càng yếu thì lượng mẫu cần thiết để phát hiện nó càng lớn.

Nhiều khác nhau liên kết giữa các biến. Việc lựa chọn một thước đo nhất định trong một nghiên cứu cụ thể phụ thuộc vào số lượng biến, thang đo được sử dụng, bản chất của các yếu tố phụ thuộc, v.v.

Tuy nhiên, hầu hết các thước đo này đều tuân theo một nguyên tắc chung: chúng cố gắng ước tính mối quan hệ được quan sát bằng cách so sánh nó với "mối quan hệ có thể tưởng tượng tối đa" giữa các biến đang được xem xét. Về mặt kỹ thuật, cách thông thường để đưa ra các ước tính như vậy là xem xét các giá trị của các biến khác nhau như thế nào và sau đó tính toán mức độ thay đổi trong tổng số biến thể tồn tại có thể được giải thích bằng sự hiện diện của biến thể "chung" ("chung"). trong hai (hoặc nhiều) biến.

Ý nghĩa phụ thuộc chủ yếu vào cỡ mẫu. Như đã giải thích, trong các mẫu rất lớn, các mối quan hệ thậm chí rất yếu giữa các biến sẽ có ý nghĩa, trong khi ở các mẫu nhỏ, các mối quan hệ thậm chí rất mạnh cũng không đáng tin cậy.

Do đó, để xác định mức ý nghĩa thống kê, cần có một hàm thể hiện mối quan hệ giữa "độ lớn" và "ý nghĩa" của mối quan hệ giữa các biến đối với mỗi cỡ mẫu.

Một hàm như vậy sẽ chỉ ra chính xác "khả năng có được sự phụ thuộc của một giá trị nhất định (hoặc nhiều hơn) trong một mẫu có kích thước nhất định, giả sử rằng không có sự phụ thuộc như vậy trong tổng thể." Nói cách khác, hàm này sẽ cung cấp một mức ý nghĩa
(mức p), và do đó, xác suất bác bỏ sai giả thiết rằng mối quan hệ này không tồn tại trong tổng thể.

Giả thuyết "thay thế" này (rằng không có sự phụ thuộc vào dân số) thường được gọi là giả thuyết vô hiệu.

Sẽ là lý tưởng nếu hàm tính toán xác suất lỗi là tuyến tính và chỉ có các độ dốc khác nhau cho các cỡ mẫu khác nhau. Thật không may, chức năng này phức tạp hơn nhiều và không phải lúc nào cũng hoàn toàn giống nhau. Tuy nhiên, trong hầu hết các trường hợp, hình dạng của nó được biết đến và có thể được sử dụng để xác định mức ý nghĩa khi kiểm tra các mẫu có kích thước nhất định. Hầu hết các chức năng này liên quan đến một lớp phân phối được gọi là thông thường .

Khi biện minh cho một suy luận thống kê, người ta nên quyết định đâu là ranh giới giữa việc chấp nhận và bác bỏ giả thuyết vô hiệu? Do sự hiện diện của các ảnh hưởng ngẫu nhiên trong thí nghiệm, ranh giới này không thể được vẽ chính xác một cách tuyệt đối. Nó dựa trên khái niệm mức độ đáng kể. Mức độ đáng kể là xác suất bác bỏ sai giả thuyết vô hiệu. Hay nói cách khác, mức độ đáng kể - là xác suất của lỗi Loại I trong quá trình ra quyết định. Để biểu thị xác suất này, theo quy tắc, họ sử dụng chữ cái Hy Lạp α hoặc chữ cái Latinh R. Trong phần tiếp theo, chúng tôi sẽ sử dụng chữ cái R.

Về mặt lịch sử, trong các ngành khoa học ứng dụng sử dụng thống kê, và đặc biệt trong tâm lý học, người ta coi mức thấp nhất của ý nghĩa thống kê là mức p = 0,05; đủ - mức độ R= 0,01 và mức cao nhất p = 0,001. Do đó, trong các bảng thống kê trong phần phụ lục của sách giáo khoa về thống kê, các giá trị dạng bảng \ u200b \ u200b thường được cung cấp cho các cấp p = 0,05, p = 0,01 và R= 0,001. Đôi khi các giá trị dạng bảng được cung cấp cho các cấp R - 0,025 và p = 0,005.

Các giá trị 0,05, 0,01 và 0,001 được gọi là mức tiêu chuẩn có ý nghĩa thống kê. Trong phân tích thống kê các số liệu thực nghiệm, nhà tâm lý học tùy theo mục tiêu và giả thuyết của nghiên cứu phải lựa chọn mức ý nghĩa yêu cầu. Như bạn có thể thấy, ở đây giá trị lớn nhất hoặc giới hạn dưới của mức ý nghĩa thống kê là 0,05 - điều này có nghĩa là năm lỗi được phép trong một mẫu gồm một trăm phần tử (trường hợp, đối tượng) hoặc một lỗi trong số hai mươi phần tử (vụ việc, chủ thể). Người ta tin rằng không phải sáu, bảy, cũng không nhiều hơn trong số một trăm lần, chúng ta có thể mắc sai lầm. Cái giá phải trả của những sai lầm như vậy sẽ quá cao.

Lưu ý rằng trong các gói phần mềm thống kê hiện đại trên máy tính không sử dụng mức ý nghĩa tiêu chuẩn mà là mức được tính toán trực tiếp trong quá trình làm việc với phương pháp thống kê tương ứng. Các cấp độ này, được ký hiệu bằng chữ cái R, có thể có một biểu thức số khác trong phạm vi từ 0 đến 1, ví dụ: p = 0,7, R= 0,23 hoặc R= 0,012. Rõ ràng là trong hai trường hợp đầu tiên, mức ý nghĩa thu được là quá cao và không thể nói rằng kết quả là đáng kể. Đồng thời, trong trường hợp thứ hai, kết quả có ý nghĩa ở mức 12 phần nghìn. Đây là mức hợp lệ.

Quy tắc chấp nhận một kết luận thống kê như sau: trên cơ sở dữ liệu thực nghiệm thu được, nhà tâm lý học tính toán cái gọi là thống kê thực nghiệm, hay giá trị thực nghiệm, sử dụng phương pháp thống kê do anh ta lựa chọn. Thật thuận tiện để biểu thị giá trị này là H trống rỗng . Sau đó, thống kê thực nghiệm H trống rỗng được so sánh với hai giá trị tới hạn, tương ứng với mức ý nghĩa 5% và 1% cho phương pháp thống kê đã chọn và được biểu thị là H kr . Số lượng H kr được tìm thấy cho một phương pháp thống kê nhất định theo các bảng tương ứng cho trong phụ lục của bất kỳ sách giáo khoa nào về thống kê. Các đại lượng này, theo quy luật, luôn khác nhau và để thuận tiện, chúng có thể được gọi thêm là H cr1 và H kr2 . Các giá trị quan trọng được tìm thấy từ các bảng H cr1 và H kr2 Nó là thuận tiện để biểu diễn trong ký hiệu tiêu chuẩn sau:

Tuy nhiên, chúng tôi nhấn mạnh rằng chúng tôi đã sử dụng ký hiệu H trống rỗng và H kr dưới dạng viết tắt của từ "số". Trong tất cả các phương pháp thống kê, các ký hiệu tượng trưng của chúng đối với tất cả các đại lượng này đều được chấp nhận: cả giá trị thực nghiệm được tính bằng phương pháp thống kê tương ứng và các giá trị tới hạn \ u200b \ u200b được tìm thấy từ các bảng tương ứng. Ví dụ: khi tính toán hệ số tương quan cấp bậc của Spearman từ bảng các giá trị tới hạn của hệ số này, các giá trị tới hạn sau đây được tìm thấy, đối với phương pháp này được ký hiệu bằng chữ cái Hy Lạp ρ ("ro") . Vì vậy đối với p = Giá trị 0,05 được tìm thấy theo bảng ρ kr 1 = 0,61 và cho p = 0,01 giá trị ρ kr 2 = 0,76.

Trong ký hiệu tiêu chuẩn được thông qua bên dưới, nó trông giống như sau:

Bây giờ chúng ta cần so sánh giá trị thực nghiệm của mình với hai giá trị quan trọng được tìm thấy trong bảng. Điều này được thực hiện tốt nhất bằng cách đặt cả ba số trên cái gọi là "trục ý nghĩa". “Trục ý nghĩa” là một đường thẳng, ở đầu bên trái của nó là 0, mặc dù theo quy luật, nó không được đánh dấu trên đường thẳng này và chuỗi số tăng từ trái sang phải. Trên thực tế, đây là trục x của trường học thông thường OH Hệ tọa độ Descartes. Tuy nhiên, điểm đặc biệt của trục này là ba phần, "khu vực", được phân biệt trên nó. Một vùng cực đoan được gọi là vùng không đáng kể, vùng cực đoan thứ hai được gọi là vùng có ý nghĩa và vùng trung gian được gọi là vùng không chắc chắn. Ranh giới của cả ba khu là H cr1 vì p = 0,05 và H kr2 vì p = 0,01, như trong hình.

Tùy thuộc vào quy tắc quyết định (quy tắc suy luận) được quy định trong phương pháp thống kê này, có thể có hai phương án.

Phương án 1: Giả thuyết thay thế được chấp nhận nếu H trống rỗng ≥H kr .

Hoặc lựa chọn thứ hai: giả thuyết thay thế được chấp nhận nếu H trống rỗng ≤H kr .

Đã đếm H trống rỗng theo một phương pháp thống kê nào đó, nó nhất thiết phải thuộc một trong ba vùng.

Nếu giá trị thực nghiệm rơi vào vùng không đáng kể thì giả thuyết H 0 về việc không có sự khác biệt được chấp nhận.

Nếu một H trống rỗng rơi vào vùng có ý nghĩa, giả thuyết thay thế H 1 được chấp nhận Về có sự khác biệt, và giả thuyết H 0 bị bác bỏ.

Nếu một H trống rỗng rơi vào vùng không chắc chắn, nhà nghiên cứu phải đối mặt với tình thế tiến thoái lưỡng nan. Vì vậy, tùy thuộc vào tầm quan trọng của vấn đề đang được giải quyết, anh ta có thể coi ước tính thống kê thu được là đáng tin cậy ở mức 5%, và do đó chấp nhận giả thuyết H 1, bác bỏ giả thuyết H 0 , hoặc - không đáng tin cậy ở mức 1%, do đó chấp nhận giả thuyết H 0. Tuy nhiên, chúng tôi nhấn mạnh rằng đây chính xác là trường hợp khi một nhà tâm lý học có thể mắc những sai lầm thuộc loại thứ nhất hoặc thứ hai. Như đã thảo luận ở trên, trong những trường hợp này, tốt nhất là tăng kích thước mẫu.

Chúng tôi cũng nhấn mạnh rằng giá trị H trống rỗng chính xác có thể phù hợp với một trong hai H cr1 hoặc H kr2 . Trong trường hợp đầu tiên, chúng ta có thể giả định rằng ước lượng chính xác đáng tin cậy ở mức 5% và chấp nhận giả thuyết H 1, hoặc ngược lại, chấp nhận giả thuyết H 0. Trong trường hợp thứ hai, theo quy luật, giả thuyết thay thế H 1 về sự hiện diện của sự khác biệt được chấp nhận và giả thuyết H 0 bị bác bỏ.

Khái niệm ý nghĩa thống kê

Hiệu lực thống kê là điều cần thiết trong thực hành tính toán của FCC. Trước đó đã lưu ý rằng nhiều mẫu có thể được chọn từ cùng một quần thể:

Nếu chúng được chọn đúng, thì các chỉ số trung bình của chúng và các chỉ số của tổng thể chung sẽ khác nhau một chút về mức độ sai số của tính đại diện, có tính đến độ tin cậy được chấp nhận;

Nếu chúng được chọn từ các quần thể chung khác nhau, sự khác biệt giữa chúng hóa ra là đáng kể. So sánh các mẫu thường được xem xét trong thống kê;

Nếu chúng khác nhau không đáng kể, không quan trọng, không đáng kể, tức là chúng thực sự thuộc về cùng một quần thể chung, thì sự khác biệt giữa chúng được gọi là không đáng tin cậy về mặt thống kê.

ý nghĩa thống kê sự khác biệt về mẫu là một mẫu có sự khác biệt đáng kể và về cơ bản, tức là thuộc về các quần thể chung khác nhau.

Trong FCC, đánh giá ý nghĩa thống kê của sự khác biệt mẫu có nghĩa là giải quyết nhiều vấn đề thực tế. Ví dụ, việc đưa ra các phương pháp, chương trình dạy học mới, các bộ bài tập, bài kiểm tra, bài tập đối chứng gắn liền với việc kiểm chứng thực nghiệm của chúng, điều này cho thấy nhóm kiểm tra khác biệt cơ bản với nhóm đối chứng. Do đó, các phương pháp thống kê đặc biệt được sử dụng, được gọi là tiêu chí về ý nghĩa thống kê, cho phép phát hiện sự có mặt hoặc không có sự khác biệt có ý nghĩa thống kê giữa các mẫu.

Tất cả các tiêu chí được chia thành hai nhóm: tham số và phi tham số. Tiêu chí tham số quy định sự hiện diện bắt buộc của luật phân phối chuẩn, tức là điều này đề cập đến việc xác định bắt buộc các chỉ số chính của luật thông thường - trung bình cộng X và độ lệch chuẩn về. Tiêu chí tham số là chính xác và đúng đắn nhất. Kiểm tra phi tham số dựa trên sự khác biệt về thứ hạng (thứ tự) giữa các phần tử của mẫu.

Dưới đây là các tiêu chí có ý nghĩa thống kê chính được sử dụng trong thực hành của FCC: Bài kiểm tra của học sinh, bài kiểm tra của Fisher, bài kiểm tra của Wilcoxon, bài kiểm tra của White, bài kiểm tra của Van der Waerden (bài kiểm tra dấu hiệu).

Tiêu chí của sinh viênđược đặt theo tên của nhà khoa học người Anh C. Gosset (Student là bút danh), người đã phát hiện ra phương pháp này. Tiêu chí của sinh viên là tham số, dùng để so sánh các giá trị tuyệt đối của các mẫu. Các mẫu có thể khác nhau về kích thước.

Tiêu chí của sinh viên được xác định như sau.

1. Tìm tiêu chí của Học sinh t theo công thức sau:

ở đâu xi, x 2 - trung bình cộng của các mẫu được so sánh; / i b w 2 - sai số về tính đại diện được xác định trên cơ sở các chỉ số của các mẫu được so sánh.

2. Thực hành trong FCC đã cho thấy rằng đối với công việc thể thao, nó đủ để chấp nhận độ tin cậy của điểm số R= 0,95.

63 Đối với độ tin cậy của tài khoản: P = 0,95 (a = 0,05), với số độ; sự tự do k= «! + n 2 - 2 theo bảng ứng dụng 4 ta tìm được giá trị \ tốt, giá trị biên của tiêu chí (^ gr).

3. Dựa vào các tính chất của luật phân phối chuẩn, thực hiện phép so sánh trong bài kiểm tra của Học sinh t và t ^.

4. Rút ra kết luận:

Nếu một t> ftp, thì sự khác biệt giữa các mẫu được so sánh có ý nghĩa thống kê;

Nếu một t< 7 F, thì sự khác biệt không có ý nghĩa thống kê.

Đối với các nhà nghiên cứu trong lĩnh vực FCC, việc đánh giá ý nghĩa thống kê là bước đầu tiên để giải quyết một vấn đề cụ thể: sự khác nhau về cơ bản hoặc không cơ bản giữa; các mẫu có thể so sánh được. Bước tiếp theo là; đánh giá về sự khác biệt này theo quan điểm sư phạm, được xác định bởi điều kiện của vấn đề.

Ý nghĩa thống kê

Các kết quả thu được bằng cách sử dụng một quy trình nghiên cứu nhất định được gọi là ý nghĩa thống kê nếu xác suất xuất hiện ngẫu nhiên của chúng là rất nhỏ. Khái niệm này có thể được minh họa bằng ví dụ về việc tung đồng xu. Giả sử một đồng xu được lật 30 lần; Nó xuất hiện 17 lần đầu và 13 lần nó xuất hiện đuôi. Là nó có ý nghĩaĐây có phải là sự sai lệch so với kết quả dự kiến (15 đầu và 15 đuôi), hay đây là một sự trùng hợp? Để trả lời câu hỏi này, bạn có thể, ví dụ, tung cùng một đồng xu nhiều lần 30 lần liên tiếp, đồng thời lưu ý lặp lại bao nhiêu lần tỷ lệ đầu và đuôi, bằng 17:13. Phân tích thống kê giúp chúng ta thoát khỏi quá trình tẻ nhạt này. Với sự trợ giúp của nó, sau 30 lần tung đồng xu đầu tiên, có thể ước tính số lần xuất hiện ngẫu nhiên của 17 đầu và 13 đuôi. Một ước tính như vậy được gọi là một tuyên bố xác suất.

Trong tài liệu khoa học về tâm lý học tổ chức-công nghiệp, một phát biểu xác suất ở dạng toán học được biểu thị bằng biểu thức R(xác suất)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0,01). Thực tế này rất quan trọng đối với việc hiểu tài liệu, nhưng không nên coi đó là điều vô nghĩa nếu đưa ra các nhận xét không đáp ứng các tiêu chuẩn này. Cái gọi là kết quả nghiên cứu không quan trọng (các quan sát có thể có được một cách tình cờ hơn một hoặc năm lần trong số 100) có thể rất hữu ích cho việc xác định các xu hướng và như một hướng dẫn cho các nghiên cứu trong tương lai.

Cũng cần lưu ý rằng không phải tất cả các nhà tâm lý học đều đồng ý với các tiêu chuẩn và quy trình truyền thống (ví dụ Cohen, 1994; Sauley & Bedeian, 1989). Bản thân các vấn đề đo lường là trọng tâm công việc của nhiều nhà nghiên cứu, những người nghiên cứu độ chính xác của các phương pháp đo lường và các giả định làm cơ sở cho các phương pháp và tiêu chuẩn hiện có, cũng như phát triển các loại thuốc và dụng cụ mới. Có thể một lúc nào đó trong tương lai, nghiên cứu trong khả năng này sẽ dẫn đến sự thay đổi trong các tiêu chuẩn truyền thống để đánh giá ý nghĩa thống kê, và những thay đổi này sẽ giành được sự chấp nhận rộng rãi. (Chương thứ năm của Hiệp hội Tâm lý Hoa Kỳ tập hợp các nhà tâm lý học chuyên nghiên cứu các đánh giá, đo lường và thống kê.)

Trong các báo cáo nghiên cứu, một tuyên bố xác suất như R< 0,05, do một số số liệu thống kê nghĩa là, một số thu được là kết quả của một tập hợp các thủ tục tính toán toán học nhất định. Xác nhận xác suất thu được bằng cách so sánh các thống kê này với dữ liệu từ các bảng đặc biệt được xuất bản cho mục đích này. Trong nghiên cứu tâm lý tổ chức-công nghiệp, các số liệu thống kê như r, F, t, r>(đọc "chi vuông") và R(đọc "nhiều R "). Trong mỗi trường hợp, số liệu thống kê (một số) thu được từ việc phân tích một loạt các quan sát có thể được so sánh với các số liệu từ bảng đã công bố. Sau đó, có thể hình thành một phát biểu xác suất về xác suất ngẫu nhiên có được con số này, nghĩa là rút ra kết luận về ý nghĩa của các quan sát.

Để hiểu các nghiên cứu được mô tả trong cuốn sách này, chỉ cần hiểu rõ ràng về khái niệm ý nghĩa thống kê là đủ và không nhất thiết phải biết cách tính toán các số liệu thống kê nêu trên. Tuy nhiên, sẽ rất hữu ích nếu thảo luận về một giả định làm cơ sở cho tất cả các thủ tục này. Đây là giả định rằng tất cả các biến quan sát được phân phối xấp xỉ theo luật chuẩn. Ngoài ra, khi đọc các báo cáo về nghiên cứu tâm lý tổ chức-công nghiệp, thường có thêm ba khái niệm đóng vai trò quan trọng - thứ nhất là sự tương quan và tương quan, thứ hai là biến định thức / dự báo và "ANOVA" (phân tích phương sai), thứ ba , một nhóm các phương pháp thống kê dưới tên chung là "phân tích tổng hợp".

Hãy xem xét một ví dụ điển hình về việc áp dụng các phương pháp thống kê trong y học. Những người tạo ra thuốc cho rằng nó làm tăng bài niệu tương ứng với liều dùng. Để kiểm tra giả định này, họ cho 5 tình nguyện viên dùng các liều thuốc khác nhau.

Theo kết quả quan sát, một biểu đồ của bài niệu so với liều lượng được vẽ (Hình 1.2A). Sự phụ thuộc có thể nhìn thấy bằng mắt thường. Các nhà nghiên cứu chúc mừng nhau về khám phá và thế giới về loại thuốc lợi tiểu mới.

Trên thực tế, dữ liệu cho phép chúng tôi chỉ ra một cách đáng tin cậy rằng sự phụ thuộc của bài niệu vào liều lượng đã được quan sát thấy ở năm tình nguyện viên này. Thực tế là sự phụ thuộc này sẽ biểu hiện ở tất cả những người sẽ dùng thuốc không hơn gì một phỏng đoán.
WJ

Với

zhenie. Không thể nói rằng nó là vô căn cứ - nếu không, tại sao lại là thí nghiệm?

Nhưng hiện nay thuốc đã có mặt trên thị trường. Ngày càng có nhiều người dùng nó với hy vọng tăng bài niệu của họ. Và chúng ta thấy gì? Chúng ta xem Hình 1.2B, cho thấy không có bất kỳ mối quan hệ nào giữa liều lượng thuốc và bài niệu. Các vòng tròn màu đen đại diện cho dữ liệu từ nghiên cứu ban đầu. Thống kê có các phương pháp để ước tính xác suất thu được một "không đại diện" như vậy, hơn nữa, mẫu gây nhầm lẫn. Nó chỉ ra rằng trong trường hợp không có mối quan hệ giữa bài niệu và liều lượng của thuốc, kết quả là "sự phụ thuộc" sẽ được quan sát thấy trong khoảng 5 trong số 1000 thí nghiệm. Vì vậy, trong trường hợp này, các nhà nghiên cứu đã gặp may. Ngay cả khi họ áp dụng ngay cả những phương pháp thống kê hoàn hảo nhất, nó vẫn không thể cứu họ khỏi sai sót.

Ví dụ này hư cấu, nhưng không hề xa rời thực tế, chúng tôi trích dẫn không phải để chỉ ra sự vô dụng
số liệu thống kê. Anh ta nói về điều gì đó khác, về tính chất xác suất của các kết luận của cô ấy. Kết quả của việc áp dụng phương pháp thống kê, chúng ta không nhận được chân lý cuối cùng, mà chỉ ước tính xác suất của một giả định cụ thể. Ngoài ra, mỗi phương pháp thống kê dựa trên mô hình toán học của riêng nó và kết quả của nó là chính xác đến mức mà mô hình này tương ứng với thực tế.

Tìm hiểu thêm về ĐỘ TIN CẬY VÀ KÝ HIỆU THỐNG KÊ:

Sự khác biệt có ý nghĩa thống kê về các chỉ số chất lượng cuộc sống
Tổng hợp thống kê. Các dấu hiệu tài khoản. Khái niệm về nghiên cứu liên tục và có chọn lọc. Yêu cầu đối với dân số thống kê và việc sử dụng tài liệu kế toán và báo cáo
BÀI VĂN. NGHIÊN CỨU ĐỘ TIN CẬY CỦA CÁC BÀI ĐỌC TONOMETER ĐỂ ĐO ÁP SUẤT INTRAOCULAR QUA EYELID 2018, 2018