Kebolehpercayaan formula data statistik. Konsep kepentingan statistik

Hari ini ia benar-benar terlalu mudah: anda boleh berjalan ke komputer dan, dengan sedikit atau tanpa pengetahuan tentang apa yang anda lakukan, mencipta kecerdasan dan karut dengan kelajuan yang benar-benar menakjubkan. (J. Kotak)

Istilah dan konsep asas statistik perubatan

Dalam artikel ini kami akan membentangkan beberapa konsep utama statistik yang berkaitan dengan penyelidikan perubatan. Terma dibincangkan dengan lebih terperinci dalam artikel yang berkaitan.

Variasi

Definisi. Tahap penyebaran data (nilai atribut) ke atas julat nilai

Kebarangkalian

Definisi. Kebarangkalian ialah darjah kemungkinan berlakunya kejadian tertentu dalam keadaan tertentu.

Contoh. Mari kita jelaskan definisi istilah dalam ayat “Kebarangkalian pemulihan apabila menggunakan produk perubatan Arimidex ialah 70%." Acara itu adalah "pemulihan pesakit", keadaan "pesakit mengambil Arimidex", tahap kemungkinan adalah 70% (secara kasarnya, daripada 100 orang yang mengambil Arimidex, 70 pulih).

Kebarangkalian kumulatif

Definisi. Kebarangkalian Terkumpul untuk bertahan pada masa t adalah sama dengan nisbah pesakit yang masih hidup pada masa itu.

Contoh. Jika dikatakan bahawa kebarangkalian terkumpul untuk hidup selepas kursus lima tahun rawatan adalah 0.7, maka ini bermakna 70% daripada kumpulan pesakit yang sedang dipertimbangkan masih hidup. kuantiti awal, dan 30% meninggal dunia. Dalam erti kata lain, daripada setiap ratus orang, 30 mati dalam tempoh 5 tahun pertama.

Masa sebelum acara

Definisi. Masa sebelum sesuatu peristiwa ialah masa, dinyatakan dalam beberapa unit, yang telah berlalu dari beberapa titik awal masa sehingga berlakunya sesuatu peristiwa.

Penjelasan. Sebagai unit masa dalam penyelidikan perubatan hari, bulan dan tahun muncul.

Contoh biasa detik-detik awal masa:

mula memantau pesakit

rawatan pembedahan

Contoh biasa peristiwa yang dipertimbangkan:

perkembangan penyakit

kejadian kambuh semula

kematian pesakit

Sampel

Definisi. Bahagian populasi yang diperoleh melalui pemilihan.

Berdasarkan keputusan analisis sampel, kesimpulan dibuat tentang keseluruhan populasi, yang sah hanya jika pemilihan adalah rawak. Memandangkan hampir mustahil untuk memilih secara rawak daripada populasi, usaha harus dibuat untuk memastikan sampel itu sekurang-kurangnya mewakili populasi.

Sampel bergantung dan bebas

Definisi. Sampel di mana subjek kajian direkrut secara bebas antara satu sama lain. Alternatif kepada sampel bebas ialah sampel bergantung (bersambung, berpasangan).

Hipotesis

Hipotesis dua belah dan satu pihak

Pertama, mari kita terangkan penggunaan istilah hipotesis dalam statistik.

Tujuan kebanyakan penyelidikan adalah untuk menguji kebenaran beberapa kenyataan. Tujuan ujian dadah adalah paling kerap untuk menguji hipotesis bahawa satu ubat lebih berkesan daripada yang lain (contohnya, Arimidex lebih berkesan daripada Tamoxifen).

Untuk memastikan ketelitian kajian, pernyataan yang disahkan dinyatakan secara matematik. Contohnya, jika A ialah bilangan tahun pesakit yang mengambil Arimidex akan hidup, dan T ialah bilangan tahun pesakit yang mengambil Tamoxifen akan hidup, maka hipotesis yang diuji boleh ditulis sebagai A>T.

Definisi. Hipotesis dipanggil dua sisi jika ia terdiri daripada kesamaan dua kuantiti.

Contoh hipotesis dua belah: A=T.

Definisi. Hipotesis dipanggil satu sisi (1 sisi) jika ia terdiri daripada ketaksamaan dua kuantiti.

Contoh hipotesis satu pihak:

Data dikotomi (perduaan).

Definisi. Data dinyatakan dengan hanya dua nilai alternatif yang sah

Contoh: Pesakit "sihat" - "sakit". Edema "adalah" - "tidak".

Selang keyakinan

Definisi. Selang keyakinan bagi sesuatu kuantiti ialah julat sekitar nilai kuantiti di mana ia terletak maksud sebenar nilai ini (dengan tahap keyakinan tertentu).

Contoh. Biarkan kuantiti yang dikaji ialah bilangan pesakit setahun. Secara purata, bilangan mereka ialah 500, dan 95% - selang keyakinan- (350, 900). Ini bermakna, kemungkinan besar (dengan kebarangkalian 95%), sekurang-kurangnya 350 dan tidak lebih daripada 900 orang akan menghubungi klinik pada tahun tersebut.

Jawatan. Singkatan yang sangat biasa digunakan ialah: CI 95% ialah selang keyakinan dengan tahap keyakinan 95%.

Kebolehpercayaan, kepentingan statistik (P - tahap)

Definisi. Kepentingan statistik hasilnya adalah ukuran keyakinan terhadap "kebenarannya".

Sebarang penyelidikan dijalankan berdasarkan hanya sebahagian daripada objek. Kajian tentang keberkesanan ubat dijalankan bukan berdasarkan semua pesakit di planet ini, tetapi hanya pada kumpulan pesakit tertentu (hanya mustahil untuk menjalankan analisis berdasarkan semua pesakit).

Mari kita anggap bahawa sebagai hasil analisis kesimpulan tertentu telah dibuat (contohnya, penggunaan Arimidex sebagai terapi yang mencukupi adalah 2 kali lebih berkesan daripada Tamoxifen).

Soalan yang perlu ditanya ialah: "Sejauh manakah anda boleh mempercayai keputusan ini?"

Bayangkan kami menjalankan kajian berdasarkan hanya dua pesakit. Sudah tentu, dalam kes ini hasilnya harus dirawat dengan berhati-hati. Jika sebilangan besar pesakit diperiksa (nilai berangka " kuantiti yang banyak“bergantung kepada keadaan), maka kesimpulan yang dibuat sudah boleh dipercayai.

Jadi, darjah kepercayaan ditentukan oleh nilai peringkat p (nilai p).

Tahap p yang lebih tinggi sepadan dengan lebih banyak tahap rendah keyakinan terhadap keputusan yang diperoleh daripada analisis sampel. Sebagai contoh, tahap p bersamaan dengan 0.05 (5%) menunjukkan bahawa kesimpulan yang dibuat daripada analisis kumpulan tertentu hanyalah ciri rawak objek ini dengan kebarangkalian hanya 5%.

Dengan kata lain, dengan kebarangkalian yang sangat tinggi (95%) kesimpulan boleh diperluaskan kepada semua objek.

Banyak kajian menganggap 5% sebagai nilai tahap p yang boleh diterima. Ini bermakna jika, sebagai contoh, p = 0.01, maka hasilnya boleh dipercayai, tetapi jika p = 0.06, maka anda tidak boleh.

Belajar

Kajian prospektif ialah kajian di mana sampel dipilih berdasarkan faktor awal, dan beberapa faktor yang terhasil dianalisis dalam sampel.

Kajian retrospektif ialah kajian di mana sampel dipilih berdasarkan faktor yang terhasil, dan beberapa faktor awal dianalisis dalam sampel.

Contoh. Faktor awal adalah wanita hamil muda/lebih 20 tahun. Faktor yang terhasil ialah anak lebih ringan/berat daripada 2.5 kg. Kami menganalisis sama ada berat kanak-kanak bergantung pada umur ibu.

Jika kita mengambil 2 sampel, satu dengan ibu di bawah umur 20 tahun, satu lagi dengan ibu yang lebih tua, dan kemudian menganalisis jisim kanak-kanak dalam setiap kumpulan, maka ini adalah kajian prospektif.

Jika kita merekrut 2 sampel, dalam satu - ibu yang melahirkan anak lebih ringan daripada 2.5 kg, yang lain - lebih berat, dan kemudian menganalisis umur ibu dalam setiap kumpulan, maka ini adalah kajian retrospektif (secara semula jadi, kajian sedemikian boleh dijalankan hanya apabila eksperimen selesai, iaitu semua kanak-kanak dilahirkan).

Keluaran

Definisi. Fenomena, penunjuk makmal atau tanda yang signifikan secara klinikal yang berfungsi sebagai objek yang menarik minat penyelidik. Apabila menjalankan ujian klinikal, hasil berfungsi sebagai kriteria untuk menilai keberkesanan intervensi terapeutik atau pencegahan.

Epidemiologi klinikal

Definisi. Sains yang memungkinkan untuk meramalkan hasil tertentu untuk setiap pesakit tertentu berdasarkan kajian perjalanan klinikal penyakit dalam kes yang sama menggunakan kaedah yang ketat. kaedah saintifik mengkaji pesakit untuk memastikan ketepatan ramalan.

kohort

Definisi. Sekumpulan peserta kajian yang disatukan oleh beberapa orang ciri umum pada masa pembentukannya dan dikaji dalam jangka masa yang panjang.

Kawalan

Kawalan sejarah

Definisi. Satu kumpulan kawalan dibentuk dan diperiksa dalam tempoh sebelum kajian.

Kawalan selari

Definisi. Kumpulan kawalan terbentuk serentak dengan pembentukan kumpulan utama.

Korelasi

Definisi. Hubungan statistik antara dua ciri (kuantitatif atau ordinal), menunjukkan bahawa nilai yang lebih tinggi Satu ciri dalam bahagian tertentu kes sepadan dengan nilai yang lebih besar - dalam kes korelasi positif (langsung) - nilai ciri lain, atau nilai yang lebih kecil - dalam kes korelasi negatif (terbalik).

Contoh. Korelasi yang ketara didapati antara tahap platelet dan leukosit dalam darah pesakit. Pekali korelasi ialah 0.76.

Pekali risiko (RR)

Definisi. Nisbah risiko ialah nisbah kebarangkalian berlakunya beberapa peristiwa (“buruk”) untuk kumpulan objek pertama kepada kebarangkalian kejadian yang sama untuk kumpulan objek kedua.

Contoh. Jika kebarangkalian untuk mengembangkan kanser paru-paru pada bukan perokok adalah 20%, dan pada perokok - 100%, maka CR akan sama dengan satu perlima. Dalam contoh ini, kumpulan objek pertama adalah bukan perokok, kumpulan kedua adalah perokok, dan kejadian kanser paru-paru dianggap sebagai peristiwa "buruk".

Adalah jelas bahawa:

1) jika KR = 1, maka kebarangkalian sesuatu kejadian berlaku dalam kumpulan adalah sama

2) jika KP>1, maka kejadian lebih kerap berlaku dengan objek dari kumpulan pertama daripada dari kedua

3) jika KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analisis

Definisi. DENGAN analisis statistik yang meringkaskan hasil beberapa kajian yang menyiasat masalah yang sama (biasanya keberkesanan rawatan, pencegahan, kaedah diagnostik). Kajian gabungan menyediakan sampel yang lebih besar untuk analisis dan kuasa statistik yang lebih besar untuk kajian gabungan. Digunakan untuk meningkatkan bukti atau keyakinan dalam kesimpulan tentang keberkesanan kaedah yang dikaji.

Kaedah Kaplan-Meier (anggaran pengganda Kaplan-Meier)

Kaedah ini dicipta oleh ahli statistik E.L. Kaplan dan Paul Meyer.

Kaedah ini digunakan untuk mengira pelbagai kuantiti yang berkaitan dengan masa pemerhatian pesakit. Contoh kuantiti tersebut:

kebarangkalian pemulihan dalam tempoh satu tahun apabila menggunakan dadah

peluang untuk berulang selepas pembedahan dalam tempoh tiga tahun selepas pembedahan

kebarangkalian kumulatif untuk hidup pada lima tahun di kalangan pesakit kanser prostat berikutan pemotongan organ

Mari kita terangkan kelebihan menggunakan kaedah Kaplan-Meier.

Nilai nilai dalam analisis "konvensional" (tidak menggunakan kaedah Kaplan-Meier) dikira berdasarkan pembahagian selang masa yang dipertimbangkan ke dalam selang.

Sebagai contoh, jika kita mengkaji kebarangkalian kematian pesakit dalam tempoh 5 tahun, maka selang masa boleh dibahagikan kepada 5 bahagian (kurang daripada 1 tahun, 1-2 tahun, 2-3 tahun, 3-4 tahun, 4- 5 tahun), jadi dan selama 10 (enam bulan setiap satu), atau untuk bilangan selang yang lain. Keputusan untuk partition berbeza akan berbeza.

Memilih partition yang paling sesuai bukanlah tugas yang mudah.

Anggaran nilai yang diperoleh menggunakan kaedah Kaplan-Meier tidak bergantung pada pembahagian masa pemerhatian kepada selang, tetapi hanya bergantung pada masa hidup setiap pesakit individu.

Oleh itu, lebih mudah bagi penyelidik untuk menjalankan analisis, dan keputusan selalunya lebih baik daripada keputusan analisis "konvensional".

Keluk Kaplan - Meier ialah graf keluk kemandirian yang diperoleh menggunakan kaedah Kaplan-Meier.

Model Cox

Model ini telah dicipta oleh Sir David Roxby Cox (b. 1924), seorang ahli statistik terkenal Inggeris, pengarang lebih daripada 300 artikel dan buku.

Model Cox digunakan dalam situasi di mana kuantiti yang dikaji dalam analisis survival bergantung pada fungsi masa. Sebagai contoh, kebarangkalian berulang selepas t tahun (t=1,2,...) mungkin bergantung kepada logaritma log masa(t).

Kelebihan penting kaedah yang dicadangkan oleh Cox ialah kebolehgunaan kaedah ini dalam sebilangan besar situasi (model tidak mengenakan sekatan ketat pada sifat atau bentuk taburan kebarangkalian).

Berdasarkan model Cox, analisis boleh dilakukan (dipanggil analisis Cox), yang hasilnya ialah nilai pekali risiko dan selang keyakinan bagi pekali risiko.

Kaedah statistik bukan parametrik

Definisi. Kelas kaedah statistik yang digunakan terutamanya untuk analisis data kuantitatif yang tidak membentuk taburan normal, serta untuk analisis data kualitatif.

Contoh. Untuk mengenal pasti kepentingan perbezaan dalam tekanan sistolik pesakit bergantung pada jenis rawatan, kami akan menggunakan ujian Mann-Whitney bukan parametrik.

Tanda (pembolehubah)

Definisi. X ciri-ciri objek kajian (pemerhatian). Terdapat ciri kualitatif dan kuantitatif.

Rawak

Definisi. Kaedah mengagihkan objek kajian secara rawak ke dalam kumpulan utama dan kawalan menggunakan cara khas (jadual atau pembilang nombor rawak, lambungan syiling dan kaedah lain untuk memberikan nombor kumpulan secara rawak kepada pemerhatian yang disertakan). Rawak meminimumkan perbezaan antara kumpulan pada ciri yang diketahui dan tidak diketahui yang berpotensi mempengaruhi hasil yang dikaji.

risiko

Bersifat- risiko tambahan hasil buruk (contohnya, penyakit) disebabkan oleh kehadiran ciri tertentu (faktor risiko) dalam subjek kajian. Ini adalah bahagian risiko membangunkan penyakit yang dikaitkan dengan, dijelaskan oleh, dan boleh dihapuskan jika faktor risiko dihapuskan.

Risiko relatif- nisbah risiko keadaan yang tidak menguntungkan dalam satu kumpulan kepada risiko keadaan ini dalam kumpulan lain. Digunakan dalam kajian prospektif dan pemerhatian apabila kumpulan dibentuk lebih awal dan kejadian keadaan yang dikaji masih belum berlaku.

peperiksaan bergolek

Definisi. Kaedah untuk menyemak kestabilan, kebolehpercayaan, prestasi (kesahan) model statistik dengan mengalih keluar pemerhatian secara berurutan dan mengira semula model. Lebih serupa model yang dihasilkan, lebih stabil dan boleh dipercayai model itu.

Peristiwa

Definisi. Hasil klinikal yang diperhatikan dalam kajian, seperti berlakunya komplikasi, kambuh, pemulihan, atau kematian.

Stratifikasi

Definisi. M teknik persampelan di mana populasi semua peserta yang memenuhi kriteria inklusi untuk kajian dibahagikan kepada kumpulan (strata) berdasarkan satu atau lebih ciri (biasanya jantina, umur) yang berpotensi mempengaruhi hasil minat, dan kemudian daripada setiap peserta kumpulan (stratum) ini direkrut secara bebas ke dalam kumpulan eksperimen dan kawalan. Ini membolehkan penyelidik mengimbangi ciri-ciri penting antara kumpulan eksperimen dan kawalan.

Jadual kontingensi

Definisi. Jadual kekerapan mutlak (nombor) pemerhatian, lajur yang sepadan dengan nilai satu ciri, dan baris - dengan nilai ciri lain (dalam kes jadual kontingensi dua dimensi). Nilai frekuensi mutlak terletak dalam sel di persimpangan baris dan lajur.

Mari kita berikan contoh jadual kontingensi. Pembedahan aneurisme dilakukan pada 194 pesakit. Keterukan edema pada pesakit sebelum pembedahan diketahui.

Edema\ Hasil
tiada bengkak	20	6	26
bengkak sederhana	27	15	42
edema yang ketara	8	21	29
m j	55	42	194

Oleh itu, daripada 26 pesakit tanpa edema, 20 pesakit terselamat selepas pembedahan, dan 6 pesakit meninggal dunia. Daripada 42 pesakit dengan edema sederhana, 27 pesakit terselamat, 15 meninggal dunia, dsb.

Ujian khi kuasa dua untuk jadual kontingensi

Untuk menentukan kepentingan (kebolehpercayaan) perbezaan dalam satu tanda bergantung pada yang lain (contohnya, hasil operasi bergantung pada keterukan edema), ujian khi kuasa dua digunakan untuk jadual kontingensi:

Peluang

Biarkan kebarangkalian sesuatu peristiwa sama dengan p. Maka kebarangkalian bahawa peristiwa itu tidak akan berlaku ialah 1-p.

Sebagai contoh, jika kebarangkalian pesakit akan kekal hidup selepas lima tahun ialah 0.8 (80%), maka kebarangkalian bahawa dia akan mati dalam tempoh masa ini ialah 0.2 (20%).

Definisi. Peluang ialah nisbah kebarangkalian sesuatu peristiwa akan berlaku kepada kebarangkalian bahawa peristiwa itu tidak akan berlaku.

Contoh. Dalam contoh kami (tentang pesakit), peluangnya ialah 4, kerana 0.8/0.2=4

Oleh itu, kebarangkalian pemulihan adalah 4 kali lebih besar daripada kebarangkalian kematian.

Tafsiran nilai sesuatu kuantiti.

1) Jika Peluang=1, maka kebarangkalian sesuatu peristiwa berlaku adalah sama dengan kebarangkalian bahawa peristiwa itu tidak akan berlaku;

2) jika Peluang >1, maka kebarangkalian peristiwa itu berlaku adalah lebih besar daripada kebarangkalian bahawa peristiwa itu tidak akan berlaku;

3) jika Peluang<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Nisbah odds

Definisi. Nisbah odds ialah nisbah odds untuk kumpulan objek pertama kepada nisbah odds untuk kumpulan objek kedua.

Contoh. Mari kita anggap bahawa kedua-dua lelaki dan wanita menjalani beberapa rawatan.

Kebarangkalian pesakit lelaki akan kekal hidup selepas lima tahun ialah 0.6 (60%); kebarangkalian bahawa dia akan mati dalam tempoh masa ini ialah 0.4 (40%).

Kebarangkalian yang sama untuk wanita ialah 0.8 dan 0.2.

Nisbah odds dalam contoh ini ialah

Tafsiran nilai sesuatu kuantiti.

1) Jika nisbah odds = 1, maka peluang untuk kumpulan pertama adalah sama dengan peluang untuk kumpulan kedua

2) Jika nisbah odds ialah >1, maka peluang untuk kumpulan pertama adalah lebih besar daripada peluang untuk kumpulan kedua

3) Jika nisbah odds<1, то шанс для первой группы меньше шанса для второй группы

Mari kita pertimbangkan contoh tipikal penggunaan kaedah statistik dalam perubatan. Pencipta ubat mencadangkan bahawa ia meningkatkan diuresis mengikut kadar dos yang diambil. Untuk menguji hipotesis ini, mereka memberi lima sukarelawan dos ubat yang berbeza.

Berdasarkan keputusan pemerhatian, graf diuresis berbanding dos diplotkan (Rajah 1.2A). Kebergantungan boleh dilihat dengan mata kasar. Penyelidik mengucapkan tahniah kepada satu sama lain atas penemuan itu, dan dunia pada diuretik baru.

Malah, data hanya membenarkan kami menyatakan dengan pasti bahawa diuresis bergantung kepada dos diperhatikan dalam lima sukarelawan ini. Hakikat bahawa pergantungan ini akan nyata dalam semua orang yang mengambil ubat itu tidak lebih daripada andaian.
ZY

Dengan

kehidupan Ia tidak boleh dikatakan bahawa ia tidak berasas - jika tidak, mengapa menjalankan eksperimen?

Tetapi dadah itu mula dijual. Semakin ramai orang mengambilnya dengan harapan dapat meningkatkan pengeluaran air kencing mereka. Jadi apa yang kita nampak? Kita lihat Rajah 1.2B, yang menunjukkan ketiadaan sebarang kaitan antara dos ubat dan diuresis. Lingkaran hitam menunjukkan data daripada kajian asal. Statistik mempunyai kaedah yang membolehkan kami menganggarkan kemungkinan mendapatkan sampel "tidak mewakili" sedemikian, dan sememangnya mengelirukan. Ternyata jika tiada hubungan antara diuresis dan dos ubat, "pergantungan" yang terhasil akan diperhatikan dalam kira-kira 5 daripada 1000 eksperimen. Jadi, dalam kes ini, penyelidik hanya bernasib malang. Jika mereka telah menggunakan walaupun yang paling maju kaedah statistik, ia masih tidak akan menyelamatkan mereka daripada melakukan kesilapan.

Kami memberikan contoh rekaan ini, tetapi tidak jauh dari realiti, bukan untuk menunjukkan ketidakbergunaan
kebolehan statistik. Dia bercakap tentang sesuatu yang lain, tentang sifat kebarangkalian kesimpulannya. Hasil daripada menggunakan kaedah statistik, kita tidak memperoleh kebenaran muktamad, tetapi hanya anggaran kebarangkalian andaian tertentu. Di samping itu, setiap kaedah statistik adalah berdasarkan model matematiknya sendiri dan keputusannya adalah betul setakat model ini sepadan dengan realiti.

Lebih lanjut mengenai topik KEBOLEHPERCAYAAN DAN KEPENTINGAN STATISTIK:

Perbezaan ketara secara statistik dalam penunjuk kualiti hidup
Statistik populasi. Ciri-ciri perakaunan. Konsep penyelidikan berterusan dan terpilih. Keperluan untuk data statistik dan penggunaan dokumen perakaunan dan pelaporan
ABSTRAK. KAJIAN KEBOLEHPERCAYAAN PETUNJUK TONOMETER UNTUK MENGUKUR TEKANAN INTRAOKULAR MELALUI KELOMPOK MATA 2018, 2018

Dalam mana-mana situasi saintifik dan praktikal sesuatu eksperimen (tinjauan), penyelidik boleh mengkaji bukan semua orang (populasi umum, populasi), tetapi hanya sampel tertentu. Sebagai contoh, walaupun kita sedang mengkaji kumpulan orang yang agak kecil, seperti mereka yang menghidap penyakit tertentu, masih sangat tidak mungkin kita mempunyai sumber yang sesuai atau keperluan untuk menguji setiap pesakit. Sebaliknya, adalah perkara biasa untuk menguji sampel daripada populasi kerana ia lebih mudah dan kurang memakan masa. Jika ya, bagaimana kita tahu bahawa keputusan yang diperoleh daripada sampel mewakili keseluruhan kumpulan? Atau, untuk menggunakan istilah profesional, bolehkah kami memastikan bahawa penyelidikan kami menerangkan keseluruhannya dengan betul penduduk, sampel yang kami gunakan?

Untuk menjawab soalan ini, adalah perlu untuk menentukan kepentingan statistik keputusan ujian. Kepentingan statistik (Tahap ketara, diringkaskan Sig.), atau /7-aras keertian (peringkat p) - ialah kebarangkalian bahawa keputusan yang diberikan mewakili populasi dengan betul dari mana kajian itu dijadikan sampel. Ambil perhatian bahawa ini sahaja kebarangkalian- adalah mustahil untuk mengatakan dengan pasti bahawa kajian yang diberikan dengan betul menggambarkan keseluruhan populasi. Paling baik, tahap kepentingan hanya boleh membuat kesimpulan bahawa ini sangat berkemungkinan. Oleh itu, persoalan seterusnya tidak dapat dielakkan timbul: apakah tahap kepentingan yang mesti ada sebelum keputusan yang diberikan boleh dianggap sebagai pencirian populasi yang betul?

Sebagai contoh, pada nilai kebarangkalian apakah yang anda sanggup katakan bahawa peluang tersebut sudah cukup untuk mengambil risiko? Bagaimana jika kemungkinannya adalah 10 daripada 100 atau 50 daripada 100? Bagaimana jika kebarangkalian ini lebih tinggi? Bagaimana pula dengan kemungkinan seperti 90 daripada 100, 95 daripada 100, atau 98 daripada 100? Untuk situasi yang melibatkan risiko, pilihan ini agak bermasalah, kerana ia bergantung pada ciri peribadi seseorang.

Dalam psikologi, secara tradisinya dipercayai bahawa peluang 95 atau lebih daripada 100 bermakna kebarangkalian keputusan itu betul adalah cukup tinggi untuk mereka boleh digeneralisasikan kepada seluruh populasi. Angka ini ditubuhkan dalam proses aktiviti saintifik dan praktikal - tidak ada undang-undang yang mengikutnya ia harus dipilih sebagai garis panduan (dan sememangnya, dalam sains lain kadang-kadang nilai lain dari tahap kepentingan dipilih).

Dalam psikologi, kebarangkalian ini dikendalikan dengan cara yang agak luar biasa. Daripada kebarangkalian sampel itu mewakili populasi, kebarangkalian sampel itu tidak mewakili penduduk. Dalam erti kata lain, ia adalah kebarangkalian bahawa hubungan atau perbezaan yang diperhatikan adalah rawak dan bukan harta populasi. Jadi, daripada mengatakan terdapat peluang 95 dalam 100 bahawa keputusan kajian adalah betul, ahli psikologi mengatakan bahawa terdapat 5 dalam 100 peluang bahawa keputusan itu salah (sama seperti peluang 40 dalam 100 bahawa keputusan itu betul bermakna peluang 60 dalam 100 memihak kepada ketidaktepatan mereka). Nilai kebarangkalian kadangkala dinyatakan sebagai peratusan, tetapi lebih kerap ia ditulis sebagai pecahan perpuluhan. Sebagai contoh, 10 peluang daripada 100 dinyatakan sebagai pecahan perpuluhan 0.1; 5 daripada 100 ditulis sebagai 0.05; 1 daripada 100 - 0.01. Dengan bentuk rakaman ini, nilai had ialah 0.05. Untuk keputusan dianggap betul, tahap keertiannya mestilah di bawah nombor ini (ingat, ini adalah kebarangkalian bahawa hasilnya salah menerangkan populasi). Untuk menyingkirkan terminologi, mari tambahkan bahawa "kebarangkalian keputusan tidak betul" (yang lebih tepat dipanggil aras keertian) biasanya dilambangkan dengan huruf Latin r. Perihalan keputusan eksperimen biasanya termasuk pernyataan ringkasan seperti "keputusan adalah signifikan pada tahap keyakinan (hlm(p) kurang daripada 0.05 (iaitu kurang daripada 5%).

Oleh itu, tahap keertian ( r) menunjukkan kemungkinan bahawa keputusan tidak mewakili penduduk. Secara tradisinya dalam psikologi, keputusan dianggap boleh dipercayai mencerminkan gambaran keseluruhan jika nilai r kurang daripada 0.05 (iaitu 5%). Walau bagaimanapun, ini hanyalah pernyataan kebarangkalian, dan bukan jaminan tanpa syarat. Dalam sesetengah kes kesimpulan ini mungkin tidak betul. Malah, kita boleh mengira kekerapan ini mungkin berlaku jika kita melihat pada magnitud tahap keertian. Pada tahap keertian 0.05, 5 daripada 100 kali keputusan mungkin tidak betul. 11a pada pandangan pertama nampaknya ini tidak begitu biasa, tetapi jika anda memikirkannya, maka 5 peluang daripada 100 adalah sama dengan 1 daripada 20. Dengan kata lain, dalam satu daripada setiap 20 kes, hasilnya akan tak betul. Kemungkinan sedemikian nampaknya tidak begitu menguntungkan, dan penyelidik harus berhati-hati daripada melakukan kesilapan jenis pertama. Ini adalah nama untuk ralat yang berlaku apabila penyelidik berpendapat mereka telah menemui hasil sebenar, tetapi sebenarnya mereka tidak. Kesilapan sebaliknya, yang terdiri daripada penyelidik percaya bahawa mereka tidak menemui hasil, tetapi sebenarnya ada satu, dipanggil kesilapan jenis kedua.

Kesilapan ini timbul kerana kemungkinan analisis statistik yang dilakukan tidak boleh diketepikan. Kebarangkalian ralat bergantung pada tahap kepentingan statistik keputusan. Kami telah menyatakan bahawa untuk keputusan dianggap betul, tahap keertian mestilah di bawah 0.05. Sudah tentu, sesetengah keputusan berada pada tahap yang lebih rendah, dan bukan sesuatu yang luar biasa untuk mencari keputusan serendah 0.001 (nilai 0.001 menunjukkan bahawa keputusan mempunyai peluang 1 dalam 1000 untuk salah). Semakin kecil nilai p, semakin kuat keyakinan kita terhadap ketepatan keputusan.

Dalam jadual 7.2 menunjukkan tafsiran tradisional tahap keertian tentang kemungkinan inferens statistik dan rasional untuk keputusan tentang kehadiran hubungan (perbezaan).

Jadual 7.2

Tafsiran tradisional tahap kepentingan yang digunakan dalam psikologi

Berdasarkan pengalaman penyelidikan praktikal, adalah disyorkan: untuk mengelakkan kesilapan jenis pertama dan kedua sebanyak mungkin, apabila membuat kesimpulan penting, keputusan harus dibuat tentang kehadiran perbezaan (sambungan), memfokuskan pada tahap r n tanda.

Ujian statistik(Ujian Statistik - ia adalah alat untuk menentukan tahap kepentingan statistik. Ini adalah peraturan penentu yang memastikan bahawa hipotesis benar diterima dan hipotesis palsu ditolak dengan kebarangkalian yang tinggi.

Kriteria statistik juga menunjukkan kaedah untuk mengira nombor tertentu dan nombor itu sendiri. Semua kriteria digunakan dengan satu tujuan utama: untuk menentukan aras keertian data yang mereka analisis (iaitu, kebarangkalian bahawa data mencerminkan kesan sebenar yang mewakili populasi dengan betul dari mana sampel diambil).

Sesetengah ujian hanya boleh digunakan untuk data taburan normal (dan jika sifat diukur pada skala selang) - ujian ini biasanya dipanggil parametrik. Menggunakan kriteria lain, anda boleh menganalisis data dengan hampir mana-mana undang-undang pengedaran - ia dipanggil bukan parametrik.

Kriteria parametrik ialah kriteria yang merangkumi parameter taburan dalam formula pengiraan, i.e. min dan varians (ujian-t pelajar, ujian F Fisher, dsb.).

Kriteria bukan parametrik ialah kriteria yang tidak termasuk parameter taburan dalam formula untuk mengira parameter taburan dan berdasarkan operasi dengan frekuensi atau pangkat (kriteria Q Kriteria Rosenbaum U Manna - Whitney

Sebagai contoh, apabila kita mengatakan bahawa kepentingan perbezaan ditentukan oleh ujian-t Pelajar, kita bermaksud bahawa kaedah ujian-t Pelajar digunakan untuk mengira nilai empirikal, yang kemudiannya dibandingkan dengan nilai jadual (kritikal).

Dengan nisbah empirikal (dikira oleh kami) dan nilai kritikal kriteria (jadual) kami boleh menilai sama ada hipotesis kami disahkan atau disangkal. Dalam kebanyakan kes, untuk kita mengiktiraf perbezaan sebagai ketara, nilai empirikal kriteria adalah perlu melebihi nilai kritikal, walaupun terdapat kriteria (contohnya, ujian Mann-Whitney atau ujian tanda) di mana kita mesti mematuhi peraturan yang bertentangan.

Dalam sesetengah kes, formula pengiraan untuk kriteria termasuk bilangan pemerhatian dalam sampel yang dikaji, dilambangkan sebagai hlm. Menggunakan jadual khas, kami menentukan tahap kepentingan statistik perbezaan yang sepadan dengan nilai empirikal yang diberikan. Dalam kebanyakan kes, nilai empirikal yang sama bagi kriteria mungkin signifikan atau tidak signifikan bergantung pada bilangan pemerhatian dalam sampel yang dikaji ( n ) atau daripada apa yang dipanggil bilangan darjah kebebasan , yang dilambangkan sebagai v (g>) atau bagaimana df (Kadang-kadang d).

Mengetahui n atau bilangan darjah kebebasan, menggunakan jadual khas (yang utama diberikan dalam Lampiran 5) kita boleh menentukan nilai kritikal kriteria dan membandingkan nilai empirikal yang diperolehi dengan mereka. Ini biasanya ditulis seperti ini: “bila n = 22 nilai kritikal bagi kriteria tersebut ialah t St = 2.07" atau "pada v (d) = 2 nilai kritikal ujian Pelajar ialah = 4.30”, dsb.

Biasanya, keutamaan masih diberikan kepada kriteria parametrik, dan kami mematuhi kedudukan ini. Mereka dianggap lebih dipercayai dan boleh memberikan lebih banyak maklumat dan analisis yang lebih mendalam. Berkenaan kesukaran pengiraan matematik, kemudian apabila menggunakan program komputer kesukaran ini hilang (tetapi beberapa yang lain kelihatan, bagaimanapun, agak boleh diatasi).

Dalam buku teks ini kami tidak mengambil kira secara terperinci masalah statistik
hipotesis (null - R0 dan alternatif - Hj) dan diterima penyelesaian statistik, memandangkan pelajar psikologi mempelajari ini secara berasingan dalam disiplin "Kaedah matematik dalam psikologi." Di samping itu, perlu diperhatikan bahawa semasa mendaftar laporan penyelidikan(kerja kursus atau tesis, penerbitan) hipotesis statistik dan penyelesaian statistik, sebagai peraturan, tidak diberikan. Biasanya, apabila menerangkan keputusan, kriteria ditunjukkan dan perlu statistik deskriptif(min, sigma, pekali korelasi, dll.), nilai empirikal kriteria, darjah kebebasan dan semestinya tahap keertian p. Kemudian kesimpulan yang bermakna dirumuskan mengenai hipotesis yang diuji, menunjukkan (biasanya dalam bentuk ketaksamaan) tahap keertian yang dicapai atau tidak dicapai.

KEBOLEHPERCAYAAN STATISTIK

- Inggeris kredibiliti/kesahan, statistik; Jerman Sah, statistik. Ketekalan, objektiviti dan kekurangan kekaburan dalam ujian statistik atau dalam q.l. set ukuran. D. s. boleh diuji dengan mengulang ujian (atau soal selidik) yang sama pada subjek yang sama untuk melihat sama ada keputusan yang sama diperoleh; atau perbandingan pelbagai bahagian ujian yang sepatutnya mengukur objek yang sama.

Antinazi. Ensiklopedia Sosiologi, 2009

Lihat apa "KEBOLEHPERCAYAAN STATISTIK" dalam kamus lain:

KEBOLEHPERCAYAAN STATISTIK- Bahasa Inggeris kredibiliti/kesahan, statistik; Jerman Sah, statistik. Ketekalan, objektiviti dan kekurangan kekaburan dalam ujian statistik atau dalam q.l. set ukuran. D. s. boleh disahkan dengan mengulangi ujian yang sama (atau... Kamus dalam Sosiologi

Dalam statistik, nilai dipanggil signifikan secara statistik jika kebarangkalian kejadiannya secara kebetulan atau nilai yang lebih ekstrem adalah rendah. Di sini, secara ekstrem kita maksudkan tahap sisihan statistik ujian daripada hipotesis nol. Perbezaannya dipanggil... ...Wikipedia

Fenomena fizikal kestabilan statistik ialah apabila saiz sampel bertambah, kekerapan peristiwa rawak atau purata kuantiti fizikal cenderung kepada beberapa nombor tetap. Fenomena statistik... ... Wikipedia

KEBOLEHPERCAYAAN PERBEZAAN (Persamaan)- prosedur statistik analitik untuk menetapkan tahap kepentingan perbezaan atau persamaan antara sampel mengikut penunjuk yang dikaji (pembolehubah) ... moden proses pendidikan: konsep dan istilah asas

PELAPORAN, STATISTIK Kamus Perakaunan yang Hebat

PELAPORAN, STATISTIK- bentuk negara pemerhatian statistik, di mana pihak berkuasa yang berkaitan menerima daripada perusahaan (organisasi dan institusi) maklumat yang mereka perlukan dalam bentuk dokumen pelaporan yang sah (laporan statistik) untuk... Kamus ekonomi yang besar

Sains yang berkaitan dengan kajian teknik pemerhatian yang sistematik habis fenomena jisim kehidupan sosial manusia, menyusun huraian berangka mereka dan pemprosesan saintifik huraian ini. Oleh itu, statistik teori adalah sains... ... Kamus Ensiklopedia F. Brockhaus dan I.A. Efron

Pekali korelasi- (Pekali korelasi) Pekali korelasi ialah penunjuk statistik tanggungan dua pembolehubah rawak Definisi pekali korelasi, jenis pekali korelasi, sifat pekali korelasi, pengiraan dan aplikasi... ... Ensiklopedia Pelabur

Perangkaan- (Statistik) Statistik ialah sains teori umum yang mengkaji perubahan kuantitatif dalam fenomena dan proses. Perangkaan negeri, perkhidmatan statistik, Rosstat (Goskomstat), data statistik, statistik pertanyaan, statistik jualan,... ... Ensiklopedia Pelabur

Korelasi- (Korelasi) Korelasi ialah hubungan statistik dua atau lebih pembolehubah rawak Konsep korelasi, jenis korelasi, pekali korelasi, analisis korelasi, korelasi harga, korelasi pasangan mata wang pada Kandungan Forex... ... Ensiklopedia Pelabur

Buku

Penyelidikan dalam matematik dan matematik dalam penyelidikan: Koleksi metodologi mengenai aktiviti penyelidikan pelajar, Borzenko V.I.. Koleksi membentangkan perkembangan metodologi, terpakai dalam organisasi aktiviti penyelidikan pelajar. Bahagian pertama koleksi dikhaskan untuk kegunaan pendekatan penyelidikan V…

Konsep kepentingan statistik

Kebolehpercayaan statistik adalah penting dalam amalan pengiraan FCC. Telah dinyatakan sebelum ini bahawa dari yang sama penduduk beberapa sampel boleh dipilih:

Jika mereka dipilih dengan betul, maka penunjuk purata mereka dan penunjuk populasi umum berbeza sedikit antara satu sama lain dalam magnitud ralat perwakilan, dengan mengambil kira kebolehpercayaan yang diterima;

Jika mereka dipilih daripada populasi yang berbeza, perbezaan antara mereka ternyata ketara. Statistik adalah tentang membandingkan sampel;

Jika mereka berbeza secara tidak ketara, tidak prinsipal, tidak ketara, iaitu mereka sebenarnya tergolong dalam populasi umum yang sama, perbezaan di antara mereka dipanggil tidak boleh dipercayai secara statistik.

Boleh dipercayai secara statistik Perbezaan sampel ialah sampel yang berbeza secara ketara dan asas, iaitu, ia tergolong dalam populasi umum yang berbeza.

Di FCC, menilai kepentingan statistik perbezaan sampel bermakna menyelesaikan banyak masalah praktikal. Sebagai contoh, pengenalan kaedah pengajaran baru, program, set latihan, ujian, latihan kawalan dikaitkan dengan ujian eksperimen mereka, yang sepatutnya menunjukkan bahawa kumpulan ujian pada asasnya berbeza daripada kumpulan kawalan. Oleh itu, kaedah statistik khas digunakan, dipanggil kriteria kebolehpercayaan statistik, membenarkan untuk mengesan kehadiran atau ketiadaan perbezaan yang signifikan secara statistik antara sampel.

Semua kriteria dibahagikan kepada dua kumpulan: parametrik dan bukan parametrik. Kriteria parametrik memperuntukkan kehadiran wajib undang-undang biasa pengedaran, i.e. ini bermakna penentuan mandatori penunjuk utama undang-undang biasa - purata nilai aritmetik X dan purata sisihan segi empat sama O. Kriteria parametrik adalah yang paling tepat dan betul. Ujian bukan parametrik berdasarkan perbezaan pangkat (ordinal) antara elemen sampel.

Berikut ialah kriteria utama untuk kepentingan statistik yang digunakan dalam amalan FCC: Ujian pelajar, ujian Fisher, ujian Wilcoxon, ujian White, ujian Van der Waerden (ujian tanda).

Ujian t pelajar dinamakan sempena saintis Inggeris K. Gosset (Pelajar - nama samaran), yang menemui kaedah ini. Ujian t pelajar ialah parametrik, digunakan untuk perbandingan penunjuk mutlak sampel. Sampel mungkin berbeza dari segi saiz.

Ujian-t Pelajar ditakrifkan seperti berikut.

1. Cari ujian-t Pelajar t mengikut formula berikut:

di mana Xi, x 2 - cara aritmetik sampel dibandingkan; /i ь w 2 - ralat keterwakilan dikenal pasti berdasarkan petunjuk sampel yang dibandingkan.

2. Latihan di FCC telah menunjukkan bahawa untuk kerja sukan sudah cukup untuk menerima kebolehpercayaan akaun R= 0,95.

63 Untuk kebolehpercayaan akaun: P= 0.95 (a = 0.05), dengan bilangan darjah; kebebasan k= «! + p 2 - 2, menggunakan jadual dalam Lampiran 4, kita dapati nilainya \ baik, nilai had bagi kriteria (^gr).

3. Berdasarkan sifat-sifat hukum taburan normal, perbandingan dibuat dalam ujian Pelajar t Dan t^.

4. Kami membuat kesimpulan:

Jika t> ftp, maka perbezaan antara sampel yang dibandingkan adalah signifikan secara statistik;

Jika t< 7 F, maka perbezaannya adalah tidak ketara secara statistik.

Bagi penyelidik FCS, menilai kepentingan statistik ialah langkah pertama dalam menyelesaikan masalah tertentu: sama ada terdapat perbezaan asas atau bukan asas antara; adalah sampel yang dibandingkan. Langkah seterusnya ialah; penilaian perbezaan ini dari sudut pandangan pedagogi, yang ditentukan oleh syarat tugas.