Biografi Ciri-ciri Analisis

Mengapakah kesahan statistik mempunyai tahap esei. Persediaan untuk bekerja

Tugas kajian statistik adalah untuk mengenal pasti corak yang terletak pada sifat fenomena yang dikaji. Penunjuk dan nilai purata harus berfungsi sebagai cerminan realiti, yang mana adalah perlu untuk menentukan tahap kebolehpercayaannya. Paparan yang betul bagi populasi sampel populasi umum dipanggil keterwakilan . Ukuran ketepatan dan kebolehpercayaan nilai statistik sampel ialah purata ralat keterwakilan (representativeness), yang bergantung pada saiz sampel dan tahap kepelbagaian populasi sampel untuk sifat yang dikaji.

Oleh itu, untuk menentukan tahap kebolehpercayaan keputusan kajian statistik, adalah perlu untuk mengira ralat purata yang sepadan untuk setiap nilai relatif dan purata. Ralat purata penunjuk m p dikira dengan formula:

Apabila bilangan cerapan kurang daripada 30, di mana

P - nilai penunjuk dalam peratus, ppm, dsb.

q - penambahan penunjuk ini kepada 100 jika ia dalam peratus, kepada 1000 jika % 0, dsb. (iaitu q = 100–P, 1000–P, dsb.)

Sebagai contoh, diketahui bahawa 224 orang jatuh sakit dengan disentri di rantau ini pada tahun itu. Populasinya ialah 33,000. Kadar kejadian disentri di

Ralat purata penunjuk ini

Untuk menyelesaikan isu tahap kebolehpercayaan penunjuk, pekali keyakinan (t) ditentukan, yang sama dengan nisbah penunjuk kepada ralat puratanya, i.e.

Dalam contoh kita

Semakin tinggi t, semakin tinggi tahap keyakinan. Pada t=1, kebarangkalian kebolehpercayaan penunjuk ialah 68.3%, pada t=2 - 95.5%, pada t=3 - 99.7%. Dalam kajian statistik perubatan, tahap keyakinan (kebolehpercayaan) 95.5%–99.0% biasanya digunakan, dan dalam kes yang paling bertanggungjawab - 99.7%. Oleh itu, dalam contoh kami, kadar kejadian boleh dipercayai.

Jika bilangan pemerhatian kurang daripada 30, nilai kriteria ditentukan oleh jadual Pelajar. Jika nilai yang diperoleh lebih tinggi atau sama dengan nilai jadual, penunjuk boleh dipercayai. Jika lebih rendah, ia tidak sah.

Sekiranya perlu membandingkan dua penunjuk homogen, kebolehpercayaan perbezaannya ditentukan oleh formula:

(tolak yang lebih kecil daripada nombor yang lebih besar)

di mana P 1 –P 2 ialah perbezaan antara dua penunjuk yang dibandingkan,

ialah ralat min perbezaan antara dua penunjuk.

Sebagai contoh, di daerah B, 270 orang jatuh sakit dengan disentri pada tahun itu. Penduduk daerah ini ialah 45,000. Oleh itu, kejadian disentri:

mereka. kadar kejadian adalah betul.

Seperti yang anda lihat, kejadian di rantau B adalah lebih rendah daripada di rantau A. Kami menentukan kebolehpercayaan perbezaan antara dua penunjuk menggunakan formula:

Sekiranya terdapat sejumlah besar pemerhatian (lebih daripada 30), perbezaan dalam penunjuk adalah signifikan secara statistik jika t = 2 atau lebih. Oleh itu, dalam contoh kami, kejadian di rantau A adalah lebih tinggi, kerana faktor keyakinan (t) lebih besar daripada 2.

Mengetahui nilai ralat purata penunjuk, adalah mungkin untuk menentukan had keyakinan penunjuk ini, bergantung pada pengaruh sebab rawak. Sempadan keyakinan ditentukan oleh formula:

P ialah penunjuk;

m ialah ralat min;

t ialah faktor keyakinan dipilih bergantung kepada nilai kebolehpercayaan yang diperlukan: t=1 sepadan dengan kebolehpercayaan keputusan dalam 68.3% kes, t=2 - 95.5%, t=2.6 - 99%, t=3 - 99.7 % , t=3.3 - 99.9 Nilai dipanggil ralat marginal.

Sebagai contoh, di daerah B, kadar kejadian disentri dengan ketepatan 99.7-9% mungkin berubah-ubah disebabkan oleh faktor rawak dalam i.e. dari 49.1 hingga 70.9.

Pengujian hipotesis dijalankan menggunakan analisis statistik. Kepentingan statistik didapati menggunakan nilai P, yang sepadan dengan kebarangkalian peristiwa tertentu di bawah andaian bahawa beberapa pernyataan (hipotesis nol) adalah benar. Jika nilai P kurang daripada tahap kepentingan statistik tertentu (biasanya 0.05), penguji boleh membuat kesimpulan dengan selamat bahawa hipotesis nol adalah palsu dan teruskan untuk mempertimbangkan hipotesis alternatif. Menggunakan ujian-t Pelajar, anda boleh mengira nilai-P dan menentukan kepentingan bagi dua set data.

Langkah-langkah

Bahagian 1

Menyediakan percubaan

    Tentukan hipotesis anda. Langkah pertama dalam menilai kepentingan statistik ialah memilih soalan yang anda ingin jawab dan merumuskan hipotesis. Hipotesis ialah pernyataan tentang data eksperimen, taburan dan sifatnya. Untuk mana-mana eksperimen, terdapat kedua-dua hipotesis nol dan alternatif. Secara umumnya, anda perlu membandingkan dua set data untuk menentukan sama ada ia serupa atau berbeza.

    • Hipotesis nol (H 0) biasanya menyatakan bahawa tiada perbezaan antara dua set data. Contohnya: pelajar yang membaca bahan sebelum kelas tidak mendapat markah yang lebih tinggi.
    • Hipotesis alternatif (H a) adalah bertentangan dengan hipotesis nol dan merupakan pernyataan yang perlu disahkan dengan data eksperimen. Contohnya: pelajar yang membaca bahan sebelum kelas mendapat markah yang lebih tinggi.
  1. Tetapkan tahap keertian untuk menentukan berapa banyak taburan data mesti berbeza daripada yang biasa untuk dianggap sebagai hasil yang ketara. Tahap keertian (juga dipanggil α (\displaystyle \alpha )-level) ialah ambang yang anda tentukan untuk kepentingan statistik. Jika nilai-P kurang daripada atau sama dengan aras keertian, data tersebut dianggap signifikan secara statistik.

    • Sebagai peraturan, tahap kepentingan (nilai α (\displaystyle \alpha )) diambil bersamaan dengan 0.05, di mana kebarangkalian untuk mengesan perbezaan rawak antara set data yang berbeza adalah hanya 5%.
    • Semakin tinggi tahap keertian (dan, oleh itu, semakin kecil nilai P), semakin dipercayai hasilnya.
    • Jika anda mahukan hasil yang lebih dipercayai, turunkan nilai P kepada 0.01. Biasanya, nilai-P yang lebih rendah digunakan dalam pengeluaran apabila perlu untuk mengesan kecacatan pada produk. Dalam kes ini, kesetiaan yang tinggi diperlukan untuk memastikan semua bahagian berfungsi seperti yang diharapkan.
    • Bagi kebanyakan eksperimen hipotesis, tahap keertian 0.05 adalah mencukupi.
  2. Tentukan kriteria yang akan anda gunakan: satu belah atau dua belah. Salah satu andaian dalam ujian-t Pelajar ialah data bertaburan normal. Taburan normal ialah lengkung berbentuk loceng dengan bilangan hasil maksimum di tengah lengkung. Ujian-t pelajar ialah kaedah pengesahan data matematik yang membolehkan anda menentukan sama ada data berada di luar taburan normal (lebih banyak, kurang atau dalam "ekor" lengkung).

    • Jika anda tidak pasti sama ada data berada di atas atau di bawah kumpulan kawalan, gunakan ujian dua hujung. Ini akan membolehkan anda menentukan kepentingan dalam kedua-dua arah.
    • Jika anda tahu ke arah mana data mungkin berada di luar taburan normal, gunakan ujian satu hujung. Dalam contoh di atas, kami menjangkakan gred pelajar akan meningkat, jadi ujian satu hujung boleh digunakan.
  3. Tentukan saiz sampel menggunakan kuasa statistik. Kuasa statistik kajian ialah kebarangkalian bahawa saiz sampel yang diberikan akan menghasilkan hasil yang diharapkan. Ambang kuasa biasa (atau β) ialah 80%. Analisis kuasa tanpa sebarang data terdahulu boleh menjadi rumit kerana beberapa maklumat tentang cara yang dijangkakan dalam setiap set data dan sisihan piawainya diperlukan. Gunakan kalkulator kuasa statistik dalam talian untuk menentukan saiz sampel yang optimum untuk data anda.

    • Biasanya, penyelidik menjalankan kajian rintis kecil untuk menyediakan data untuk analisis kuasa dan menentukan saiz sampel yang diperlukan untuk kajian yang lebih besar dan lebih lengkap.
    • Jika anda tidak mempunyai peluang untuk menjalankan kajian rintis, cuba anggaran nilai purata yang mungkin berdasarkan data literatur dan keputusan orang lain. Ini boleh membantu anda menentukan saiz sampel yang optimum.

    Bahagian 2

    Kira Sisihan Piawai
    1. Tuliskan formula bagi sisihan piawai. Sisihan piawai menunjukkan betapa besar penyebaran data. Ia membolehkan anda membuat kesimpulan sejauh mana data yang diperolehi pada sampel tertentu. Pada pandangan pertama, formula itu kelihatan agak rumit, tetapi penjelasan di bawah akan membantu anda memahaminya. Formulanya adalah seperti berikut: s = √∑((x i – µ) 2 /(N – 1)).

      • s - sisihan piawai;
      • tanda ∑ menunjukkan bahawa semua data yang diperolehi dalam sampel perlu ditambah;
      • x i sepadan dengan nilai ke-i, iaitu hasil berasingan yang diperolehi;
      • µ ialah nilai purata untuk kumpulan ini;
      • N ialah jumlah bilangan data dalam sampel.
    2. Cari purata dalam setiap kumpulan. Untuk mengira sisihan piawai, anda mesti mencari min bagi setiap kumpulan kajian terlebih dahulu. Nilai min dilambangkan dengan huruf Yunani µ (mu). Untuk mencari purata, hanya tambahkan semua nilai yang terhasil dan bahagikannya dengan jumlah data (saiz sampel).

      • Contohnya, untuk mencari gred purata dalam kumpulan pelajar yang mempelajari bahan sebelum kelas, pertimbangkan set data yang kecil. Untuk kesederhanaan, kami menggunakan satu set lima mata: 90, 91, 85, 83 dan 94.
      • Mari tambah semua nilai bersama-sama: 90 + 91 + 85 + 83 + 94 = 443.
      • Bahagikan hasil tambah dengan bilangan nilai, N = 5: 443/5 = 88.6.
      • Oleh itu, nilai purata bagi kumpulan ini ialah 88.6.
    3. Tolak setiap nilai yang diperoleh daripada purata. Langkah seterusnya ialah mengira perbezaan (x i - µ). Untuk melakukan ini, tolak setiap nilai yang diperoleh daripada nilai purata yang ditemui. Dalam contoh kita, kita perlu mencari lima perbezaan:

      • (90 - 88.6), (91 - 88.6), (85 - 88.6), (83 - 88.6) dan (94 - 88.6).
      • Hasilnya, kami mendapat nilai berikut: 1.4, 2.4, -3.6, -5.6 dan 5.4.
    4. Kuadratkan setiap nilai yang diperoleh dan tambahkannya bersama-sama. Setiap kuantiti yang baru ditemui hendaklah diduakan. Langkah ini akan mengalih keluar semua nilai negatif. Jika selepas langkah ini anda masih mempunyai nombor negatif, maka anda terlupa untuk mengduakannya.

      • Untuk contoh kami, kami mendapat 1.96, 5.76, 12.96, 31.36 dan 29.16.
      • Kami menambah nilai yang diperoleh: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2.
    5. Bahagikan dengan saiz sampel tolak 1. Dalam formula, jumlahnya dibahagikan dengan N - 1 kerana fakta bahawa kita tidak mengambil kira populasi umum, tetapi mengambil sampel semua pelajar untuk penilaian.

      • Tolak: N - 1 = 5 - 1 = 4
      • Bahagi: 81.2/4 = 20.3
    6. Ambil punca kuasa dua. Selepas membahagikan jumlah dengan saiz sampel tolak satu, ambil punca kuasa dua nilai yang ditemui. Ini adalah langkah terakhir dalam mengira sisihan piawai. Terdapat program statistik yang, selepas memasukkan data awal, melakukan semua pengiraan yang diperlukan.

      • Dalam contoh kami, sisihan piawai bagi markah pelajar yang membaca bahan sebelum kelas ialah s = √20.3 = 4.51.

      Bahagian 3

      Tentukan Kepentingan
      1. Kira varians antara dua kumpulan data. Sehingga langkah ini, kami telah mempertimbangkan contoh untuk hanya satu kumpulan data. Jika anda ingin membandingkan dua kumpulan, jelas anda harus mengambil data untuk kedua-dua kumpulan. Kira sisihan piawai bagi kumpulan data kedua dan kemudian cari varians antara dua kumpulan eksperimen. Serakan dikira menggunakan formula berikut: s d = √((s 1 /N 1) + (s 2 /N 2)).

FUNGSI BERBAYAR. Ciri kepentingan statistik hanya tersedia dengan beberapa pelan harga. Semak sama ada ia masuk.

Anda boleh mengetahui sama ada terdapat perbezaan yang signifikan secara statistik dalam jawapan yang diterima daripada kumpulan responden yang berbeza kepada soalan dalam tinjauan. Untuk bekerja dengan fungsi kepentingan statistik dalam SurveyMonkey, anda mesti:

  • Dayakan ciri kepentingan statistik apabila menambahkan peraturan perbandingan pada soalan dalam tinjauan anda. Pilih Kumpulan Perbandingan untuk mengisih hasil tinjauan ke dalam kumpulan untuk perbandingan yang mudah.
  • Periksa jadual data untuk soalan tinjauan anda untuk menentukan sama ada terdapat perbezaan yang signifikan secara statistik dalam respons yang diterima daripada kumpulan responden yang berbeza.

Melihat Kepentingan Statistik

Dengan mengikuti langkah di bawah, anda boleh membuat tinjauan yang memaparkan kepentingan statistik.

1. Tambahkan Soalan Tertutup pada Tinjauan Anda

Untuk memaparkan kepentingan statistik semasa analisis keputusan, anda perlu menggunakan peraturan perbandingan kepada sebarang soalan daripada tinjauan anda.

Anda boleh menggunakan peraturan perbandingan dan mengira kepentingan statistik dalam respons jika anda menggunakan salah satu daripada jenis soalan berikut dalam reka bentuk tinjauan anda:

Adalah perlu untuk memastikan bahawa pilihan jawapan yang dicadangkan boleh dibahagikan kepada kumpulan penuh. Pilihan jawapan yang anda pilih untuk perbandingan apabila anda membuat peraturan perbandingan akan digunakan untuk merentas data anda sepanjang tinjauan.

2. Kumpul respons

Setelah anda melengkapkan tinjauan anda, buat pengumpul untuk mengedarkannya. Terdapat beberapa cara.

Anda perlu mendapatkan sekurang-kurangnya 30 respons untuk setiap pilihan jawapan yang anda rancang untuk digunakan dalam peraturan perbandingan anda untuk mengaktifkan dan melihat kepentingan statistik.

Contoh tinjauan pendapat

Anda ingin tahu sama ada lelaki lebih berpuas hati dengan produk anda berbanding wanita.

  1. Tambahkan dua soalan aneka pilihan pada tinjauan anda:
    Apakah jantina anda? (lelaki Perempuan)
    Adakah anda berpuas hati atau tidak berpuas hati dengan produk kami? (berpuas hati (-flax), tidak berpuas hati (-flax))
  2. Pastikan sekurang-kurangnya 30 responden memilih 'lelaki' untuk soalan jantina, DAN JUGA sekurang-kurangnya 30 responden memilih 'perempuan' sebagai jantina mereka.
  3. Tambahkan peraturan perbandingan pada soalan "Apakah jantina anda?" dan pilih kedua-dua jawapan sebagai kumpulan anda.
  4. Gunakan lembaran data di bawah carta soalan "Adakah anda berpuas hati atau tidak berpuas hati dengan produk kami?" untuk melihat sama ada mana-mana pilihan jawapan menunjukkan perbezaan yang ketara secara statistik

Apakah perbezaan yang signifikan secara statistik?

Perbezaan yang signifikan secara statistik bermakna, menggunakan analisis statistik, terdapat perbezaan yang signifikan antara jawapan satu kumpulan responden dan jawapan kumpulan lain. Kepentingan statistik bermakna nombor yang diperolehi adalah berbeza dengan ketara. Pengetahuan sedemikian akan sangat membantu anda dalam analisis data. Walau bagaimanapun, kepentingan keputusan yang diperoleh ditentukan oleh anda. Anda sendiri yang memutuskan cara untuk mentafsir keputusan tinjauan dan tindakan yang perlu diambil berdasarkannya.

Sebagai contoh, anda mendapat lebih banyak tuntutan daripada pembeli wanita berbanding pembeli lelaki. Bagaimana untuk menentukan sama ada perbezaan tersebut adalah nyata dan sama ada tindakan diperlukan dalam hal ini? Satu cara terbaik untuk menguji pemerhatian anda adalah dengan menjalankan tinjauan yang akan menunjukkan kepada anda sama ada pelanggan lelaki lebih berpuas hati dengan produk anda atau tidak. Dengan bantuan formula statistik, fungsi kepentingan statistik kami yang dicadangkan akan membolehkan anda menentukan sama ada produk anda benar-benar disukai oleh lelaki lebih daripada wanita. Ini akan membolehkan anda mengambil tindakan berdasarkan fakta, bukan tekaan.

Perbezaan ketara secara statistik

Jika keputusan anda diserlahkan dalam jadual data, ini bermakna kedua-dua kumpulan responden adalah berbeza secara ketara antara satu sama lain. Istilah "secara ketara" tidak bermakna bahawa angka yang diperolehi mempunyai kepentingan atau kepentingan khusus, tetapi hanya terdapat perbezaan statistik antara mereka.

Tiada perbezaan ketara secara statistik

Jika keputusan anda tidak diserlahkan dalam jadual data yang sepadan, ini bermakna, walaupun terdapat kemungkinan perbezaan dalam kedua-dua angka yang dibandingkan, tiada perbezaan statistik antara mereka.

Respons tanpa perbezaan ketara secara statistik menunjukkan bahawa tidak terdapat perbezaan yang signifikan antara kedua-dua item yang dibandingkan dengan mengambil kira saiz sampel yang anda gunakan, tetapi ini tidak semestinya bermakna ia tidak penting. Mungkin dengan menambah saiz sampel, anda akan dapat mengenal pasti perbezaan yang ketara secara statistik.

Saiz sampel

Jika anda mempunyai saiz sampel yang sangat kecil, hanya perbezaan yang sangat besar antara kedua-dua kumpulan akan menjadi ketara. Jika anda mempunyai saiz sampel yang sangat besar, kedua-dua perbezaan kecil dan besar akan dikira sebagai ketara.

Walau bagaimanapun, jika dua nombor adalah berbeza secara statistik, ini tidak bermakna perbezaan antara keputusan adalah kepentingan praktikal kepada anda. Anda perlu memutuskan sendiri perbezaan mana yang penting untuk tinjauan anda.

Pengiraan kepentingan statistik

Kami mengira kepentingan statistik menggunakan tahap keyakinan standard 95%. Jika pilihan jawapan ditunjukkan sebagai signifikan secara statistik, ini bermakna terdapat kurang daripada 5% kemungkinan perbezaan antara kedua-dua kumpulan disebabkan oleh peluang atau ralat pensampelan sahaja (sering ditunjukkan sebagai: p<0,05).

Untuk mengira perbezaan ketara secara statistik antara kumpulan, kami menggunakan formula berikut:

Parameter

Penerangan

a1Peratusan peserta daripada kumpulan pertama yang menjawab soalan dengan cara tertentu, didarab dengan saiz sampel kumpulan ini.
b1Peratusan peserta daripada kumpulan kedua yang menjawab soalan dengan cara tertentu, didarab dengan saiz sampel kumpulan ini.
Bahagian sampel disatukan (p)Jumlah dua saham daripada kedua-dua kumpulan.
Ralat piawai (SE)Ukuran berapa banyak bahagian anda berbeza daripada bahagian sebenar anda. Nilai yang lebih kecil bermakna bahagian itu hampir dengan bahagian sebenar, nilai yang lebih besar bermakna bahagian itu berbeza dengan ketara daripada bahagian sebenar.
Statistik ujian (t)Statistik ujian. Bilangan nilai sisihan piawai yang mana nilai ini berbeza daripada min.
Kepentingan StatistikJika nilai mutlak statistik ujian melebihi 1.96* sisihan piawai daripada min, ini dianggap sebagai perbezaan yang signifikan secara statistik.

*1.96 ialah nilai yang digunakan untuk tahap keyakinan 95%, kerana 95% daripada julat yang diproses oleh ujian-t Pelajar terletak dalam 1.96 sisihan piawai bagi min.

Contoh pengiraan

Meneruskan contoh yang digunakan di atas, mari kita ketahui sama ada peratusan lelaki yang mengatakan mereka berpuas hati dengan produk anda sebenarnya jauh lebih tinggi daripada peratusan wanita.

Katakan 1,000 lelaki dan 1,000 wanita mengambil bahagian dalam tinjauan anda, dan hasil tinjauan itu ternyata 70% lelaki dan 65% wanita mengatakan bahawa mereka berpuas hati dengan produk anda. Adakah skor pada 70% jauh lebih tinggi daripada skor pada 65%?

Gantikan data berikut daripada tinjauan ke dalam formula yang dicadangkan:

  • p1 (% lelaki berpuas hati dengan produk) = 0.7
  • p2 (% wanita berpuas hati dengan produk) = 0.65
  • n1 (bilangan lelaki yang ditemu bual) = 1000
  • n2 (bilangan wanita yang ditemu bual) = 1000

Oleh kerana nilai mutlak statistik ujian adalah lebih besar daripada 1.96, ini bermakna perbezaan antara lelaki dan wanita adalah ketara. Berbanding wanita, lelaki lebih cenderung berpuas hati dengan produk anda.

Menyembunyikan kepentingan statistik

Bagaimana untuk menyembunyikan kepentingan statistik untuk semua soalan

  1. Klik anak panah ke bawah di sebelah kanan peraturan perbandingan di bar sisi kiri.
  2. Pilih item Edit Peraturan.
  3. Lumpuhkan ciri Tunjukkan kepentingan statistik menggunakan suis.
  4. Klik butang Mohon.

Untuk menyembunyikan kepentingan statistik bagi satu soalan, anda mesti:

  1. Klik butang Tune di atas rajah soalan.
  2. Buka tab pilihan paparan.
  3. Nyahtanda kotak di sebelah Kepentingan Statistik.
  4. Klik butang Jimat.

Pilihan paparan didayakan secara automatik apabila paparan kepentingan statistik didayakan. Jika anda menyahtanda pilihan paparan ini, paparan kepentingan statistik juga akan dilumpuhkan.

Hidupkan ciri kepentingan statistik apabila menambahkan peraturan perbandingan pada soalan dalam tinjauan anda. Periksa jadual data untuk soalan tinjauan anda untuk mengenal pasti sebarang perbezaan yang signifikan secara statistik dalam respons yang diterima daripada kumpulan responden yang berbeza.

Kepentingan Statistik

Keputusan yang diperoleh menggunakan prosedur penyelidikan tertentu dipanggil statistik yang signifikan jika kebarangkalian kejadian rawak mereka adalah sangat kecil. Konsep ini boleh digambarkan dengan contoh melambung duit syiling. Katakan syiling diterbalikkan 30 kali; Ia muncul 17 kali kepala dan 13 kali naik ekor. Adakah ia ketara Adakah ini penyelewengan daripada keputusan yang dijangkakan (15 kepala dan 15 ekor), atau adakah ini kebetulan? Untuk menjawab soalan ini, anda boleh, sebagai contoh, melambung duit syiling yang sama banyak kali 30 kali berturut-turut, dan pada masa yang sama perhatikan berapa kali nisbah kepala dan ekor, bersamaan dengan 17:13, diulang. Analisis statistik menyelamatkan kita daripada proses yang membosankan ini. Dengan bantuannya, selepas 30 lambungan syiling pertama, adalah mungkin untuk menganggarkan kemungkinan bilangan kejadian rawak 17 kepala dan 13 ekor. Anggaran sedemikian dipanggil pernyataan kebarangkalian.

Dalam kesusasteraan saintifik mengenai psikologi industri-organisasi, pernyataan kebarangkalian dalam bentuk matematik dilambangkan dengan ungkapan R(kebarangkalian)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0.01). Fakta ini penting untuk memahami kesusasteraan, tetapi tidak boleh dianggap sebagai sia-sia untuk membuat pemerhatian yang tidak memenuhi piawaian ini. Apa yang dipanggil hasil penyelidikan tidak penting (pemerhatian yang boleh diperolehi secara kebetulan lebih satu atau lima kali daripada 100) boleh menjadi sangat berguna untuk mengenal pasti trend dan sebagai panduan untuk penyelidikan masa depan.

Perlu diingatkan juga bahawa tidak semua ahli psikologi bersetuju dengan piawaian dan prosedur tradisional (cth Cohen, 1994; Sauley & Bedeian, 1989). Isu pengukuran sendiri merupakan fokus utama kerja bagi ramai penyelidik yang mengkaji ketepatan kaedah pengukuran dan andaian yang mendasari kaedah dan piawaian sedia ada, serta membangunkan ubat dan instrumen baharu. Mungkin pada masa akan datang, penyelidikan dalam kuasa ini akan membawa kepada perubahan dalam piawaian tradisional untuk menilai kepentingan statistik, dan perubahan ini akan memenangi penerimaan sejagat. (Bab Kelima Persatuan Psikologi Amerika menghimpunkan ahli psikologi yang pakar dalam kajian penilaian, pengukuran dan statistik.)

Dalam laporan penyelidikan, pernyataan kebarangkalian seperti R< 0.05, disebabkan oleh beberapa perkara perangkaan iaitu nombor yang diperoleh hasil daripada set prosedur pengiraan matematik tertentu. Pengesahan kebarangkalian diperoleh dengan membandingkan statistik ini dengan data daripada jadual khas yang diterbitkan untuk tujuan ini. Dalam penyelidikan psikologi industri-organisasi, statistik seperti r, F, t, r>(baca "chi square") dan R(baca "berbilang R"). Dalam setiap kes, statistik (satu nombor) yang diperoleh daripada analisis siri pemerhatian boleh dibandingkan dengan nombor daripada jadual yang diterbitkan. Selepas itu, adalah mungkin untuk merumuskan pernyataan kebarangkalian tentang kebarangkalian mendapatkan nombor ini secara rawak, iaitu, untuk membuat kesimpulan tentang kepentingan pemerhatian.

Untuk memahami kajian-kajian yang diterangkan dalam buku ini, cukuplah dengan pemahaman yang jelas tentang konsep kepentingan statistik dan tidak semestinya mengetahui bagaimana statistik yang dinyatakan di atas dikira. Walau bagaimanapun, adalah berguna untuk membincangkan satu andaian yang mendasari semua prosedur ini. Ini adalah andaian bahawa semua pembolehubah yang diperhatikan diedarkan kira-kira mengikut undang-undang biasa. Di samping itu, apabila membaca laporan mengenai penyelidikan psikologi industri-organisasi, selalunya terdapat tiga lagi konsep yang memainkan peranan penting - pertama, korelasi dan korelasi, kedua, pembolehubah penentu / peramal dan "ANOVA" (analisis varians), dalam Ketiga. , sekumpulan kaedah statistik di bawah nama umum "meta-analisis".

Hari ini ia adalah sangat mudah: anda boleh berjalan ke komputer dan dengan sedikit atau tiada pengetahuan tentang perkara yang anda lakukan, mencipta yang waras dan karut dengan kelajuan yang benar-benar menakjubkan. (J. Box)

Istilah dan konsep asas statistik perubatan

Dalam artikel ini, kami membentangkan beberapa konsep utama statistik yang relevan dalam penyelidikan perubatan. Terma dibincangkan dengan lebih terperinci dalam artikel yang berkaitan.

Variasi

Definisi. Tahap penyebaran data (nilai tanda) ke atas julat nilai

Kebarangkalian

Definisi. Kebarangkalian ialah tahap di mana peristiwa tertentu boleh berlaku dalam keadaan tertentu.

Contoh. Mari kita jelaskan definisi istilah dalam ayat "Kebarangkalian pemulihan apabila menggunakan ubat Arimidex ialah 70%". Acara itu adalah "pemulihan pesakit", keadaan "pesakit mengambil Arimidex", tahap kemungkinan adalah 70% (secara kasarnya, daripada 100 orang yang mengambil Arimidex, 70 pulih).

Kebarangkalian Terkumpul

Definisi. Kebarangkalian Terkumpul untuk Bertahan pada masa t adalah sama dengan nisbah pesakit yang terselamat pada masa itu.

Contoh. Jika dikatakan bahawa kebarangkalian terkumpul untuk hidup selepas kursus lima tahun rawatan adalah 0.7, maka ini bermakna kumpulan pesakit yang dipertimbangkan, 70% daripada bilangan awal masih hidup, dan 30% meninggal dunia. Dalam erti kata lain, daripada setiap ratus orang, 30 mati dalam tempoh 5 tahun pertama.

Masa untuk acara

Definisi. Masa ke peristiwa - ini ialah masa, dinyatakan dalam beberapa unit, berlalu dari beberapa masa awal sehingga berlakunya sesuatu peristiwa.

Penjelasan. Unit masa dalam penyelidikan perubatan ialah hari, bulan, dan tahun.

Contoh biasa masa awal:

    permulaan susulan pesakit

    rawatan pembedahan

Contoh biasa peristiwa yang dipertimbangkan:

    perkembangan penyakit

    berulang

    kematian pesakit

Sampel

Definisi. Sebahagian daripada populasi yang diperoleh melalui pemilihan.

Berdasarkan keputusan analisis sampel, kesimpulan dibuat tentang keseluruhan populasi, yang sah hanya jika pemilihan adalah rawak. Oleh kerana pemilihan rawak daripada populasi adalah mustahil, seseorang harus berusaha untuk memastikan bahawa sampel itu sekurang-kurangnya mewakili populasi.

Sampel bergantung dan bebas

Definisi. Sampel di mana objek kajian direkrut secara bebas antara satu sama lain. Alternatif kepada sampel bebas ialah sampel bergantung (bersambung, berpasangan).

Hipotesis

Hipotesis dua hala dan unilateral

Mari kita jelaskan dahulu penggunaan istilah hipotesis dalam statistik.

Matlamat kebanyakan penyelidikan adalah untuk menguji kebenaran beberapa kenyataan. Tujuan ujian dadah adalah paling kerap untuk menguji hipotesis bahawa satu ubat lebih berkesan daripada yang lain (contohnya, Arimidex lebih berkesan daripada Tamoxifen).

Untuk menyampaikan ketelitian kajian, pernyataan yang disahkan dinyatakan secara matematik. Sebagai contoh, jika A ialah bilangan tahun pesakit di Arimidex akan hidup dan T ialah bilangan tahun pesakit yang menggunakan Tamoxifen akan hidup, maka hipotesis yang akan diuji boleh ditulis sebagai A>T.

Definisi. Hipotesis dipanggil dua sisi jika ia terdiri daripada kesamaan dua kuantiti.

Contoh hipotesis dua belah: A=T.

Definisi. Hipotesis dipanggil satu sisi (1 sisi) jika ia terdiri daripada ketaksamaan dua kuantiti.

Contoh hipotesis satu pihak:

Data dikotomi (perduaan).

Definisi. Data dinyatakan dengan hanya dua nilai alternatif yang sah

Contoh: Pesakit "sihat" - "sakit". Edema "adalah" - "tidak hadir".

Selang keyakinan

Definisi. Selang keyakinan bagi sesetengah kuantiti ialah julat sekitar nilai kuantiti yang mengandungi nilai sebenar kuantiti tersebut (dengan tahap keyakinan tertentu).

Contoh. Biarkan kuantiti yang dikaji ialah bilangan pesakit setahun. Secara purata, bilangan mereka ialah 500, dan selang keyakinan 95% ialah (350, 900). Ini bermakna, kemungkinan besar (dengan kebarangkalian 95%), sekurang-kurangnya 350 dan tidak lebih daripada 900 orang akan menghubungi klinik pada tahun tersebut.

Jawatan. Singkatan yang sangat biasa ialah: 95% CI (95% CI) ialah selang keyakinan dengan tahap keyakinan 95%.

Kebolehpercayaan, kepentingan statistik (P - tahap)

Definisi. Kepentingan statistik hasil adalah ukuran keyakinan terhadap "kebenarannya".

Sebarang penyelidikan hanya berdasarkan sebahagian daripada objek. Kajian tentang keberkesanan ubat tidak dijalankan berdasarkan semua pesakit di planet ini secara umum, tetapi hanya pada kumpulan pesakit tertentu (hanya mustahil untuk menjalankan analisis berdasarkan semua pesakit).

Mari kita anggap bahawa beberapa kesimpulan dibuat sebagai hasil analisis (contohnya, penggunaan Arimidex sebagai terapi yang mencukupi adalah 2 kali lebih berkesan daripada Tamoxifen).

Soalan yang perlu ditanya ialah: "Sejauh manakah anda boleh mempercayai keputusan ini?".

Bayangkan bahawa kami menjalankan kajian berdasarkan hanya dua pesakit. Sudah tentu, dalam kes ini, hasilnya harus dirawat dengan kebimbangan. Sekiranya sejumlah besar pesakit diperiksa (nilai berangka "sebilangan besar" bergantung pada keadaan), maka kesimpulan yang dibuat sudah boleh dipercayai.

Jadi, tahap kepercayaan ditentukan oleh nilai tahap-p (nilai-p).

Tahap p yang lebih tinggi sepadan dengan tahap keyakinan yang lebih rendah dalam keputusan yang diperoleh daripada analisis sampel. Sebagai contoh, tahap p bersamaan dengan 0.05 (5%) menunjukkan bahawa kesimpulan yang dibuat semasa analisis kumpulan tertentu hanyalah ciri rawak objek ini dengan kebarangkalian hanya 5%.

Dengan kata lain, dengan kebarangkalian yang sangat tinggi (95%), kesimpulan boleh dilanjutkan kepada semua objek.

Dalam banyak kajian, 5% dianggap sebagai nilai p yang boleh diterima. Ini bermakna jika, sebagai contoh, p=0.01, maka keputusan boleh dipercayai, tetapi jika p=0.06, maka ia adalah mustahil.

Belajar

kajian prospektif ialah kajian di mana sampel dipilih berdasarkan faktor input, dan beberapa faktor yang terhasil dianalisis dalam sampel.

Kajian retrospektif ialah kajian di mana sampel dipilih berdasarkan faktor yang terhasil, dan beberapa faktor input dianalisis dalam sampel.

Contoh. Faktor awal adalah wanita hamil muda/lebih 20 tahun. Faktor yang terhasil ialah kanak-kanak lebih ringan/berat daripada 2.5 kg. Kami menganalisis sama ada berat kanak-kanak bergantung pada umur ibu.

Jika kita mengambil 2 sampel, satu dengan ibu yang berumur di bawah 20 tahun, satu lagi dengan yang lebih tua, dan kemudian menganalisis jisim kanak-kanak dalam setiap kumpulan, maka ini adalah kajian prospektif.

Jika kita mengumpul 2 sampel, dalam satu - ibu yang melahirkan anak lebih ringan daripada 2.5 kg, yang lain - lebih berat, dan kemudian kita menganalisis umur ibu dalam setiap kumpulan, maka ini adalah kajian retrospektif (secara semula jadi, kajian sedemikian boleh dijalankan hanya apabila eksperimen selesai, iaitu semua kanak-kanak dilahirkan).

Keluaran

Definisi. Peristiwa, nilai makmal atau tanda penting secara klinikal yang menarik minat penyelidik. Dalam ujian klinikal, hasil berfungsi sebagai kriteria untuk menilai keberkesanan intervensi terapeutik atau profilaksis.

Epidemiologi Klinikal

Definisi. Sains yang membenarkan ramalan hasil tertentu untuk setiap pesakit individu berdasarkan kajian perjalanan klinikal penyakit dalam kes yang sama, menggunakan kaedah saintifik yang ketat untuk mengkaji pesakit untuk memastikan ketepatan ramalan.

kohort

Definisi. Sekumpulan peserta dalam kajian, disatukan oleh beberapa ciri umum pada masa pembentukannya dan dikaji dalam jangka masa yang panjang.

Kawalan

Kawalan sejarah

Definisi. Kumpulan kawalan dibentuk dan diperiksa dalam tempoh sebelum kajian.

Kawalan selari

Definisi. Kumpulan kawalan, terbentuk serentak dengan pembentukan kumpulan utama.

Korelasi

Definisi. Hubungan statistik dua tanda (kuantitatif atau ordinal), menunjukkan bahawa nilai yang lebih besar bagi satu tanda dalam bahagian tertentu kes sepadan dengan yang lebih besar - dalam kes korelasi positif (langsung) - nilai tanda lain atau nilai yang lebih kecil - dalam kes korelasi negatif (songsang).

Contoh. Korelasi yang ketara didapati antara tahap platelet dan leukosit dalam darah pesakit. Pekali korelasi ialah 0.76.

Nisbah risiko (CR)

Definisi. Nisbah risiko (nisbah bahaya) ialah nisbah kebarangkalian kejadian tertentu ("buruk") untuk kumpulan objek pertama kepada kebarangkalian kejadian yang sama berlaku untuk kumpulan objek kedua.

Contoh. Jika bukan perokok mempunyai 20% peluang untuk mendapat kanser paru-paru dan 100% peluang untuk mendapat kanser paru-paru pada perokok, maka CR akan menjadi satu perlima. Dalam contoh ini, kumpulan objek pertama adalah bukan perokok, kumpulan kedua adalah perokok, dan kejadian kanser paru-paru dianggap sebagai peristiwa "buruk".

Jelas sekali bahawa:

1) jika КР=1, maka kebarangkalian kejadian yang berlaku dalam kumpulan adalah sama

2) jika КР>1, maka peristiwa itu berlaku lebih kerap dengan objek dari kumpulan pertama daripada dari yang kedua

3) jika CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analisis

Definisi. DARI analisis statistik meringkaskan hasil beberapa kajian yang menyiasat masalah yang sama (biasanya keberkesanan kaedah rawatan, pencegahan, diagnosis). Kajian gabungan menyediakan sampel yang lebih besar untuk analisis dan kuasa statistik yang lebih besar bagi kajian terkumpul. Digunakan untuk menambah bukti atau keyakinan terhadap kesimpulan tentang keberkesanan kaedah kajian.

Kaedah Kaplan-Meier (Berbilang anggaran Kaplan-Meier)

Kaedah ini dicipta oleh ahli statistik E. L. Kaplan dan Paul Meyer.

Kaedah ini digunakan untuk mengira pelbagai kuantiti yang berkaitan dengan masa pemerhatian pesakit. Contoh nilai tersebut:

    peluang untuk pulih dalam tempoh satu tahun apabila menggunakan dadah

    peluang berulang selepas pembedahan dalam tempoh tiga tahun selepas pembedahan

    kebarangkalian terkumpul untuk hidup pada lima tahun di kalangan pesakit kanser prostat selepas amputasi organ

Mari kita terangkan kelebihan menggunakan kaedah Kaplan-Meier.

Nilai nilai dalam analisis "normal" (tidak menggunakan kaedah Kaplan-Meier) dikira berdasarkan pembahagian selang masa yang dipertimbangkan ke dalam selang.

Sebagai contoh, jika kita meneliti kebarangkalian kematian pesakit dalam tempoh 5 tahun, maka selang masa boleh dibahagikan kepada 5 bahagian (kurang daripada 1 tahun, 1-2 tahun, 2-3 tahun, 3-4 tahun, 4- 5 tahun), jadi dan 10 (setengah tahun setiap satu), atau bilangan selang yang lain. Hasilnya akan berbeza untuk partition yang berbeza.

Memilih partition yang paling sesuai bukanlah tugas yang mudah.

Anggaran nilai kuantiti yang diperolehi oleh kaedah Kaplan-Meier tidak bergantung pada pembahagian masa pemerhatian kepada selang, tetapi hanya bergantung pada hayat setiap pesakit individu.

Oleh itu, lebih mudah bagi penyelidik untuk menjalankan analisis, dan hasilnya selalunya menjadi lebih berkualiti daripada hasil analisis "biasa".

Keluk Kaplan-Meier ialah graf keluk kemandirian yang diperoleh menggunakan kaedah Kaplan-Meier.

Model Cox

Model ini telah dicipta oleh Sir David Roxby Cox (b. 1924), seorang ahli statistik terkenal Inggeris, pengarang lebih 300 artikel dan buku.

Model Cox digunakan dalam situasi di mana kuantiti yang dikaji dalam analisis survival bergantung pada fungsi masa. Contohnya, kebarangkalian berulang selepas t tahun (t=1.2,…) mungkin bergantung pada logaritma log masa(t).

Kelebihan penting kaedah yang dicadangkan oleh Cox ialah kebolehgunaan kaedah ini dalam sebilangan besar situasi (model tidak mengenakan sekatan ketat pada sifat atau bentuk taburan kebarangkalian).

Berdasarkan model Cox, analisis (dipanggil analisis Cox) boleh dilakukan, yang menghasilkan nilai nisbah risiko dan selang keyakinan untuk nisbah risiko.

Kaedah statistik bukan parametrik

Definisi. Kelas kaedah statistik yang digunakan terutamanya untuk analisis data kuantitatif tidak teragih normal, serta untuk analisis data kualitatif.

Contoh. Untuk mengenal pasti kepentingan perbezaan dalam tekanan sistolik pesakit bergantung pada jenis rawatan, kami akan menggunakan ujian Mann-Whitney bukan parametrik.

Ciri (pembolehubah)

Definisi. X ciri-ciri objek kajian (pemerhatian). Terdapat ciri kualitatif dan kuantitatif.

Rawak

Definisi. Kaedah pengagihan rawak objek penyelidikan ke dalam kumpulan utama dan kawalan menggunakan cara khas (jadual atau pembilang nombor rawak, melambung syiling, dan kaedah lain secara rawak memberikan nombor kumpulan kepada pemerhatian yang disertakan). Rawak meminimumkan perbezaan antara kumpulan dari segi sifat yang diketahui dan tidak diketahui yang berpotensi mempengaruhi hasil yang dikaji.

risiko

Bersifat- risiko tambahan hasil yang tidak menguntungkan (contohnya, penyakit) disebabkan oleh kehadiran ciri tertentu (faktor risiko) dalam objek kajian. Ini adalah sebahagian daripada risiko mengembangkan penyakit yang dikaitkan dengan faktor risiko ini, dijelaskan olehnya dan boleh dihapuskan jika faktor risiko ini dihapuskan.

Risiko relatif- nisbah risiko keadaan yang tidak menguntungkan dalam satu kumpulan kepada risiko keadaan ini dalam kumpulan lain. Ia digunakan dalam kajian prospektif dan pemerhatian apabila kumpulan dibentuk lebih awal, dan kejadian keadaan yang dikaji belum berlaku.

peperiksaan bergolek

Definisi. Kaedah untuk menyemak kestabilan, kebolehpercayaan, prestasi (kesahan) model statistik dengan memadam pemerhatian dan mengira semula model secara berturut-turut. Lebih serupa model yang dihasilkan, model yang lebih stabil dan boleh dipercayai.

Peristiwa

Definisi. Hasil klinikal yang diperhatikan dalam kajian, seperti berlakunya komplikasi, kambuh, pemulihan, kematian.

Stratifikasi

Definisi. M kaedah persampelan di mana populasi semua peserta yang memenuhi kriteria kemasukan untuk kajian dibahagikan kepada kumpulan (strata) berdasarkan satu atau lebih ciri (biasanya jantina, umur) yang berpotensi mempengaruhi hasil yang dikaji, dan kemudian daripada setiap kumpulan ini (stratum), peserta direkrut secara bebas ke dalam kumpulan eksperimen dan kawalan. Ini membolehkan penyelidik mengimbangi ciri-ciri penting antara kumpulan eksperimen dan kawalan.

Jadual kontingensi

Definisi. Jadual frekuensi mutlak (nombor) pemerhatian, lajur yang sepadan dengan nilai satu ciri, dan baris dengan nilai ciri lain (dalam kes jadual kontingensi dua dimensi). Nilai frekuensi mutlak terletak dalam sel di persimpangan baris dan lajur.

Mari kita berikan contoh jadual kontingensi. Pembedahan aneurisme dilakukan pada 194 pesakit. Penunjuk yang diketahui tentang keterukan edema pada pesakit sebelum pembedahan.

Edema \ Hasil

tiada edema 20 6 26
bengkak sederhana 27 15 42
edema yang ketara 8 21 29
mj 55 42 194

Oleh itu, daripada 26 pesakit tanpa edema, 20 pesakit terselamat selepas pembedahan, 6 pesakit meninggal dunia. Daripada 42 pesakit dengan edema sederhana, 27 pesakit terselamat, 15 meninggal dunia, dsb.

Ujian khi kuasa dua untuk jadual kontingensi

Untuk menentukan kepentingan (kebolehpercayaan) perbezaan dalam satu tanda bergantung pada yang lain (contohnya, hasil operasi bergantung pada keterukan edema), ujian khi kuasa dua digunakan untuk jadual kontingensi:


Peluang

Biarkan kebarangkalian sesuatu peristiwa sama dengan p. Maka kebarangkalian bahawa peristiwa itu tidak akan berlaku ialah 1-p.

Sebagai contoh, jika kebarangkalian pesakit masih hidup selepas lima tahun ialah 0.8 (80%), maka kebarangkalian bahawa dia akan mati dalam tempoh masa ini ialah 0.2 (20%).

Definisi. Peluang ialah nisbah kebarangkalian sesuatu peristiwa akan berlaku kepada kebarangkalian bahawa peristiwa itu tidak akan berlaku.

Contoh. Dalam contoh kami (tentang pesakit), peluangnya ialah 4, kerana 0.8/0.2=4

Oleh itu, kebarangkalian pemulihan adalah 4 kali ganda kebarangkalian kematian.

Tafsiran nilai sesuatu kuantiti.

1) Jika Peluang=1, maka kebarangkalian peristiwa itu berlaku adalah sama dengan kebarangkalian bahawa peristiwa itu tidak akan berlaku;

2) jika Peluang >1, maka kebarangkalian peristiwa itu berlaku adalah lebih besar daripada kebarangkalian bahawa peristiwa itu tidak akan berlaku;

3) jika Peluang<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

nisbah odds

Definisi. Nisbah odds ialah nisbah kemungkinan untuk kumpulan objek pertama kepada nisbah odds untuk kumpulan objek kedua.

Contoh. Mari kita anggap bahawa kedua-dua lelaki dan wanita menjalani beberapa rawatan.

Kebarangkalian pesakit lelaki masih hidup selepas lima tahun ialah 0.6 (60%); kebarangkalian bahawa dia akan mati dalam tempoh masa ini ialah 0.4 (40%).

Kebarangkalian yang sama untuk wanita ialah 0.8 dan 0.2.

Nisbah odds dalam contoh ini ialah

Tafsiran nilai sesuatu kuantiti.

1) Jika nisbah odds = 1, maka peluang untuk kumpulan pertama adalah sama dengan peluang untuk kumpulan kedua

2) Jika nisbah odds ialah >1, maka peluang untuk kumpulan pertama adalah lebih besar daripada peluang untuk kumpulan kedua

3) Jika nisbah odds<1, то шанс для первой группы меньше шанса для второй группы