Pekali korelasi dalam excel. Bagaimanakah korelasi dilakukan dalam Excel? Matriks Pekali Korelasi Berpasangan dalam Excel
Ciri kuantitatif perhubungan boleh diperolehi dengan mengira pekali korelasi.
Analisis korelasi dalam Excel
Fungsi itu sendiri ada bentuk umum CORREL(array1, array2). Dalam medan "Array1", masukkan koordinat julat sel salah satu nilai, pergantungan yang harus ditentukan. Seperti yang anda lihat, pekali korelasi dalam bentuk nombor muncul dalam sel yang telah kita pilih sebelum ini. Tetingkap dengan parameter analisis korelasi terbuka. Tidak seperti kaedah sebelumnya, dalam medan "Selang input", kami memasukkan selang bukan untuk setiap lajur secara berasingan, tetapi untuk semua lajur yang mengambil bahagian dalam analisis. Seperti yang anda lihat, aplikasi Excel menawarkan dua kaedah analisis korelasi sekaligus.
carta korelasi dalam excel
6) Elemen pertama jadual akhir akan muncul di sel kiri atas kawasan yang dipilih. Oleh itu, hipotesis H0 ditolak, iaitu parameter regresi dan pekali korelasi tidak berbeza secara rawak daripada sifar, tetapi adalah signifikan secara statistik. 7. Anggaran persamaan regresi yang diperolehi membolehkan kita menggunakannya untuk peramalan.
Bagaimana untuk mengira pekali korelasi dalam Excel
Jika pekali ialah 0, ini menunjukkan bahawa tiada hubungan antara nilai. Untuk mencari hubungan antara pembolehubah dan y, gunakan fungsi terbina dalam Microsoft Excel "CORREL". Sebagai contoh, untuk "Array1" pilih nilai y, dan untuk "Array2" pilih nilai x. Hasilnya, anda akan mendapat pekali korelasi yang dikira oleh program. Seterusnya, anda perlu mengira perbezaan antara setiap x dan xav, dan yav. Dalam sel yang dipilih tulis formula x-x, y-. Jangan lupa untuk menyematkan sel dengan nilai purata. Hasil yang diperoleh akan menjadi pekali korelasi yang dikehendaki.
Formula di atas untuk mengira pekali Pearson menunjukkan betapa susahnya proses ini jika dilakukan secara manual. Kedua, sila syorkan jenis analisis korelasi yang boleh digunakan untuk sampel yang berbeza dengan serakan data yang besar? Bagaimanakah saya boleh membuktikan secara statistik perbezaan antara kumpulan lebih 60 dan orang lain?
Lakukan Sendiri: Mengira Korelasi Mata Wang Menggunakan Excel
Kami, sebagai contoh, menggunakan Microsoft Excel, tetapi sebarang program lain yang boleh menggunakan formula korelasi akan berjaya. 7. Selepas itu, pilih sel dengan data pada EUR/USD. 9. Tekan Enter untuk mengira pekali korelasi untuk EUR/USD dan USD/JPY. Ia tidak berbaloi untuk mengemas kini nombor setiap hari (baiklah, melainkan anda terobsesi dengan korelasi mata wang).
Anda telah pun menghadapi keperluan untuk mengira tahap hubungan antara dua perangkaan dan tentukan formula yang mengaitkannya? Untuk melakukan ini, saya menggunakan fungsi CORREL (CORREL) - terdapat sedikit maklumat mengenainya di sini. Ia mengembalikan tahap korelasi antara dua julat data. Secara teorinya, fungsi korelasi boleh diperhalusi dengan menukarnya daripada linear kepada eksponen atau logaritma. Analisis data dan graf korelasi boleh meningkatkan kebolehpercayaannya dengan sangat ketara.
Katakan sel B2 mengandungi pekali korelasi itu sendiri, sel B3 mengandungi bilangan pemerhatian lengkap. Adakah anda mempunyai pejabat berbahasa Rusia? By the way, saya juga mendapati kesilapan - kepentingannya tidak dikira untuk korelasi negatif. Jika kedua-dua pembolehubah adalah metrik dan mempunyai taburan normal, maka pilihannya adalah tepat. Dan, adakah mungkin untuk mencirikan kriteria persamaan lengkung menggunakan hanya satu QC? Anda tidak mempunyai persamaan "lengkung", tetapi persamaan dua siri, yang, pada dasarnya, boleh digambarkan oleh lengkung.
Adakah anda sudah menghadapi keperluan untuk mengira tahap hubungan antara dua kuantiti statistik dan menentukan formula yang mana ia mengaitkan? Orang biasa seseorang mungkin bertanya mengapa ini mungkin perlu sama sekali. Anehnya, ini benar-benar perlu. Mengetahui korelasi yang boleh dipercayai boleh membantu anda menjana kekayaan jika anda, katakan, seorang peniaga saham. Masalahnya ialah atas sebab tertentu tiada siapa yang mendedahkan korelasi ini (mengejutkan, bukan?).
Mari kita mengira mereka sendiri! Sebagai contoh, saya memutuskan untuk cuba mengira korelasi ruble terhadap dolar melalui euro. Mari lihat bagaimana ini dilakukan secara terperinci.
Artikel ini direka untuk tahap pengetahuan lanjutan tentang Microsoft Excel. Jika anda tidak mempunyai masa untuk membaca keseluruhan artikel, anda boleh memuat turun fail dan berurusan dengannya sendiri.
Jika anda sering mendapati diri anda perlu melakukan sesuatu seperti ini Saya amat mengesyorkan agar anda mempertimbangkan untuk membeli buku tersebut. Pengiraan Statistik dalam Excel.
Apa yang penting untuk diketahui tentang korelasi
Untuk mengira korelasi yang boleh dipercayai, adalah perlu untuk mempunyai sampel yang boleh dipercayai, semakin besar ia, semakin dipercayai hasilnya. Untuk tujuan contoh ini, saya telah mengambil sampel harian kadar pertukaran selama 10 tahun. Data tersedia secara percuma, saya mengambilnya dari tapak http://oanda.com.
Apa yang saya buat sebenarnya
(1) Apabila saya mempunyai data asal saya, saya mulakan dengan menyemak tahap korelasi antara dua set data. Untuk melakukan ini, saya menggunakan fungsi CORREL (CORREL) - terdapat sedikit maklumat mengenainya. Ia mengembalikan tahap korelasi antara dua julat data. Hasilnya, terus terang, tidak begitu mengagumkan (hanya kira-kira 70%). Secara umum, tahap korelasi antara dua nilai dianggap sebagai kuasa dua nilai ini, iaitu, korelasi ternyata boleh dipercayai kira-kira 49%. Ini sangat sedikit!
(2) Ia kelihatan sangat pelik kepada saya. Apakah ralat yang boleh masuk ke dalam pengiraan saya? Jadi saya memutuskan untuk membina graf dan melihat apa yang boleh berlaku. Carta itu sengaja disimpan ringkas, dipecahkan mengikut tahun supaya anda dapat melihat secara visual di mana korelasi itu terputus. Carta kelihatan seperti ini
(3) Daripada carta, jelas bahawa dalam julat kira-kira 35 rubel setiap euro, korelasi mula pecah kepada dua bahagian. Kerana ini, dia ternyata tidak boleh dipercayai. Ia adalah perlu untuk menentukan berkaitan dengan apa yang berlaku.
(4) Warna menunjukkan bahawa data ini merujuk kepada 2007, 2008, 2009. Sudah tentu! Tempoh kemuncak ekonomi dan kemelesetan biasanya tidak boleh dipercayai secara statistik, yang berlaku pada kes ini. Oleh itu, saya cuba mengecualikan tempoh ini daripada data (baik, untuk pengesahan, saya menyemak tahap korelasi data dalam tempoh ini). Darjah korelasi hanya data ini ialah 0.01%, iaitu tiada pada dasarnya. Tetapi tanpa mereka, data berkorelasi kira-kira 81%. Ini sudah menjadi korelasi yang agak boleh dipercayai. Berikut ialah graf dengan fungsi.
Langkah seterusnya
Secara teorinya, fungsi korelasi boleh diperhalusi dengan menukarnya daripada linear kepada eksponen atau logaritma. Di mana kesahan statistik korelasi berkembang kira-kira satu peratus, tetapi kerumitan penggunaan formula meningkat dengan ketara. Oleh itu, untuk diri saya sendiri, saya mengemukakan soalan: adakah ia benar-benar perlu? Anda membuat keputusan - untuk setiap kes tertentu.
Notis! Penyelesaian kepada masalah khusus anda akan kelihatan serupa contoh ini, termasuk semua jadual dan teks penerangan di bawah, tetapi mengambil kira data awal anda ...Satu tugas:
Terdapat sampel berkaitan 26 pasangan nilai (x k ,y k ):
k | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
x k | 25.20000 | 26.40000 | 26.00000 | 25.80000 | 24.90000 | 25.70000 | 25.70000 | 25.70000 | 26.10000 | 25.80000 |
y k | 30.80000 | 29.40000 | 30.20000 | 30.50000 | 31.40000 | 30.30000 | 30.40000 | 30.50000 | 29.90000 | 30.40000 |
k | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
x k | 25.90000 | 26.20000 | 25.60000 | 25.40000 | 26.60000 | 26.20000 | 26.00000 | 22.10000 | 25.90000 | 25.80000 |
y k | 30.30000 | 30.50000 | 30.60000 | 31.00000 | 29.60000 | 30.40000 | 30.70000 | 31.60000 | 30.50000 | 30.60000 |
k | 21 | 22 | 23 | 24 | 25 | 26 |
x k | 25.90000 | 26.30000 | 26.10000 | 26.00000 | 26.40000 | 25.80000 |
y k | 30.70000 | 30.10000 | 30.60000 | 30.50000 | 30.70000 | 30.80000 |
Ia diperlukan untuk mengira/membina:
- pekali korelasi;
- menguji hipotesis kebergantungan pembolehubah rawak X dan Y, pada aras keertian α = 0.05;
- pekali persamaan regresi linear;
- gambar rajah serakan (medan korelasi) dan graf garis regresi;
PENYELESAIAN:
1. Kira pekali korelasi.
Pekali korelasi ialah penunjuk pengaruh kebarangkalian bersama dua pembolehubah rawak. Pekali korelasi R boleh mengambil nilai daripada -1 sebelum ini +1 . Jika nilai mutlak lebih hampir kepada 1 , maka ini adalah bukti sambungan yang kuat antara nilai, dan jika lebih dekat dengan 0 - kemudian, ia menunjukkan sambungan yang lemah atau ketiadaannya. Jika nilai mutlak R sama dengan satu, maka kita boleh bercakap tentang hubungan fungsi antara kuantiti, iaitu, satu kuantiti boleh dinyatakan dalam sebutan yang lain menggunakan fungsi matematik.
Anda boleh mengira pekali korelasi menggunakan formula berikut:
n |
Σ |
k = 1 |
Mx | = |
|
| x k , | M y | = | atau mengikut formula
Dalam amalan, formula (1.4) lebih kerap digunakan untuk mengira pekali korelasi, kerana ia memerlukan kurang pengiraan. Walau bagaimanapun, jika kovarians sebelum ini dikira cov(X,Y), maka adalah lebih berfaedah untuk menggunakan formula (1.1), kerana sebagai tambahan kepada nilai sebenar kovarians, anda juga boleh menggunakan hasil pengiraan perantaraan. 1.1 Kira pekali korelasi menggunakan formula (1.4), untuk ini kita mengira nilai x k 2 , y k 2 dan x k y k dan masukkannya dalam jadual 1. Jadual 1
1.2. Kami mengira M x dengan formula (1.5). 1.2.1. x k x 1 + x 2 + ... + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000 1.2.2. 669.50000 / 26 = 25.75000 M x = 25.750000 1.3. Begitu juga, kita mengira M y. 1.3.1. Mari tambah semua elemen dalam urutan y k y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000 1.3.2. Bahagikan jumlah yang terhasil dengan bilangan elemen sampel 793.00000 / 26 = 30.50000 M y = 30.500000 1.4. Begitu juga, kita mengira M xy. 1.4.1. Kami menambah secara berurutan semua elemen lajur ke-6 jadual 1 776.16000 + 776.16000 + ... + 794.64000 = 20412.830000 1.4.2. Bahagikan hasil tambah dengan bilangan unsur 20412.83000 / 26 = 785.10885 M xy = 785.108846 1.5. Kira nilai S x 2 menggunakan formula (1.6.). 1.5.1. Kami menambah secara berurutan semua elemen lajur ke-4 jadual 1 635.04000 + 696.96000 + ... + 665.64000 = 17256.910000 1.5.2. Bahagikan hasil tambah dengan bilangan unsur 17256.91000 / 26 = 663.72731 1.5.3. Tolak daripada nombor terakhir kuasa dua nilai M x kita mendapat nilai untuk S x 2 S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481 1.6. Kira nilai S y 2 dengan formula (1.6.). 1.6.1. Kami menambah secara berurutan semua elemen lajur ke-5 jadual 1 948.64000 + 864.36000 + ... + 948.64000 = 24191.840000 1.6.2. Bahagikan hasil tambah dengan bilangan unsur 24191.84000 / 26 = 930.45538 1.6.3. Tolak daripada nombor terakhir kuasa dua M y , kita mendapat nilai untuk S y 2 S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538 1.7. Mari kita hitung hasil darab S x 2 dan S y 2. S x 2 S y 2 = 0.66481 0.20538 = 0.136541 1.8. Ekstrak nombor terakhir Punca kuasa dua, kita mendapat nilai S x S y. S x S y = 0.36951 1.9. Kira nilai pekali korelasi mengikut formula (1.4.). R = (785.10885 - 25.75000 30.50000) / 0.36951 = (785.10885 - 785.37500) / 0.36951 = -0.72028 JAWAPAN: Rx,y = -0.720279 2. Kami menyemak kepentingan pekali korelasi (kami menyemak hipotesis pergantungan).Oleh kerana anggaran pekali korelasi dikira pada sampel terhingga, dan oleh itu mungkin menyimpang daripada nilai amnya, adalah perlu untuk menyemak kepentingan pekali korelasi. Semakan dibuat menggunakan kriteria-t:
Nilai rawak t mengikut taburan-t Pelajar dan mengikut jadual taburan-t adalah perlu untuk mencari nilai kritikal bagi kriteria (t cr.α) pada aras keertian α yang diberikan. Jika modulo t yang dikira dengan formula (2.1) ternyata kurang daripada t cr.α , maka pergantungan antara pembolehubah rawak X dan Y bukan. Jika tidak, data eksperimen tidak bercanggah dengan hipotesis tentang pergantungan pembolehubah rawak. 2.1. Kira nilai kriteria t mengikut formula (2.1) yang kita dapat:
2.2. Mari kita tentukan nilai kritikal parameter t cr.α daripada jadual taburan-t Nilai t kr.α yang dikehendaki terletak di persimpangan baris yang sepadan dengan bilangan darjah kebebasan dan lajur yang sepadan dengan aras keertian α yang diberikan. jadual 2 pengagihan-t
2.2. Mari kita bandingkan nilai mutlak bagi t-kriteria dan t cr.α Nilai mutlak t-kriteria tidak kurang daripada kritikal t = 5.08680, tcr.α = 2.064, oleh itu data eksperimen, dengan kebarangkalian 0.95(1 - α ), jangan bercanggah dengan hipotesis pada pergantungan pembolehubah rawak X dan Y. 3. Kami mengira pekali persamaan regresi linear.Persamaan regresi linear ialah persamaan garis lurus yang menghampiri (kira-kira menerangkan) hubungan antara pembolehubah rawak X dan Y. Jika kita mengandaikan bahawa X adalah bebas dan Y bergantung kepada X, maka persamaan regresi akan ditulis seperti berikut. Y = a + b X (3.1), di mana:
Pekali dikira dengan formula (3.2) b dipanggil pekali regresi linear. Dalam beberapa sumber a dipanggil pekali malar regresi dan b mengikut pembolehubah. Ralat ramalan Y untuk nilai X yang diberikan dikira oleh formula: Nilai σ y/x (formula 3.4) juga dipanggil sisihan piawai baki, ia mencirikan pemergian Y daripada garis regresi yang diterangkan oleh persamaan (3.1) pada nilai tetap (diberi) X. | . |
S y / S x = 0.55582
3.3 Kira pekali b mengikut formula (3.2)
b = -0.72028 0.55582 = -0.40035
3.4 Kira pekali a mengikut formula (3.3)
a = 30.50000 - (-0.40035 25.75000) = 40.80894
3.5 Anggarkan ralat persamaan regresi.
3.5.1 Kami mengekstrak punca kuasa dua daripada S y 2 dan dapatkan:
3.5.4 Pengiraan ralat relatif mengikut formula (3.5)
δy/x = (0.31437 / 30.50000)100% = 1.03073%
4. Kami membina scatterplot (medan korelasi) dan graf garis regresi.
Taburan adalah imej grafik pasangan sepadan (x k , y k ) dalam bentuk titik satah, in koordinat segi empat tepat dengan paksi X dan Y. Medan korelasi ialah salah satu daripada perwakilan grafik sampel berpaut (berpasangan). Dalam sistem koordinat yang sama, graf garis regresi juga diplotkan. Skala dan titik permulaan pada paksi hendaklah dipilih dengan teliti supaya gambar rajah sejelas mungkin.4.1. Kami mendapati elemen minimum dan maksimum bagi sampel X ialah unsur ke-18 dan ke-15, masing-masing, x min = 22.10000 dan x max = 26.60000.
4.2. Kami mendapati unsur minimum dan maksimum bagi sampel Y ialah unsur ke-2 dan ke-18, masing-masing, y min = 29.40000 dan y maks = 31.60000.
4.3. Pada paksi abscissa, kami memilih titik permulaan hanya di sebelah kiri titik x 18 = 22.10000, dan skala sedemikian sehingga titik x 15 = 26.60000 sesuai pada paksi dan titik lain jelas dibezakan.
4.4. Pada paksi-y, kita memilih titik permulaan hanya di sebelah kiri titik y 2 = 29.40000, dan skala sedemikian sehingga titik y 18 = 31.60000 sesuai pada paksi dan titik-titik lain jelas dibezakan.
4.5. Pada paksi abscissa kita letakkan nilai x k , dan pada paksi ordinat kita letakkan nilai y k .
4.6. Kami meletakkan titik (x 1, y 1), (x 2, y 2), ..., (x 26, y 26 ) pada satah koordinat. Kami mendapat scatterplot (medan korelasi), ditunjukkan dalam rajah di bawah.
4.7. Mari kita lukis garis regresi.
Untuk melakukan ini, kami dapati dua pelbagai mata dengan koordinat (x r1 , y r1) dan (x r2 , y r2) memuaskan persamaan (3.6), kami meletakkannya pada satah koordinat dan melukis garis melaluinya. Mari kita ambil x min = 22.10000 sebagai absis mata pertama. Kami menggantikan nilai x min dalam persamaan (3.6), kami mendapat ordinat titik pertama. Oleh itu, kita mempunyai titik dengan koordinat (22.10000, 31.96127). Begitu juga, kita memperoleh koordinat titik kedua, menetapkan nilai x max = 26.60000 sebagai absis. Mata kedua ialah: (26.60000, 30.15970).
Garis regresi ditunjukkan dalam rajah di bawah dengan warna merah
Sila ambil perhatian bahawa garis regresi sentiasa melalui titik nilai purata X dan Y, i.e. dengan koordinat (M x , M y).
KERJA MAKMAL
ANALISIS KORELASI DALAMEXCEL
1.1 Analisis korelasi dalam MS Excel
Analisis korelasi terdiri dalam menentukan darjah sambungan antara dua pembolehubah rawak X dan Y. Pekali korelasi digunakan sebagai ukuran sambungan tersebut. Pekali korelasi dianggarkan daripada sampel volum n pasangan pemerhatian yang berkaitan (x i, y i) daripada populasi umum bersama X dan Y. Untuk menilai tahap hubungan antara X dan Y yang diukur dalam skala kuantitatif, kami menggunakan pekali korelasi linear(Pekali Pearson), dengan mengandaikan bahawa sampel X dan Y diedarkan mengikut hukum biasa.
Pekali korelasi berbeza daripada -1 (hubungan linear songsang yang ketat) kepada 1 (hubungan berkadar langsung yang ketat). Pada nilai 0, tiada hubungan linear antara kedua-dua sampel.
Klasifikasi umum korelasi (menurut Ivanter E.V., Korosov A.V., 1992):
Terdapat beberapa jenis pekali korelasi, bergantung kepada pembolehubah X dan Y, yang boleh diukur pada skala yang berbeza. Fakta inilah yang menentukan pilihan pekali korelasi yang sesuai (lihat Jadual 13):
Dalam MS Excel, fungsi khas digunakan untuk mengira pekali korelasi linear berpasangan CORREL(array1; array2),
№ mata pelajaran ujian | ||
Contoh 1: 10 orang murid sekolah diberi ujian untuk visual-figuratif dan pemikiran lisan. Purata masa untuk menyelesaikan tugasan ujian diukur dalam saat. Pengkaji berminat dengan soalan: adakah terdapat hubungan antara masa menyelesaikan masalah ini? Pembolehubah X menandakan purata masa untuk menyelesaikan ujian visual-kiasan, dan pembolehubah Y menandakan purata masa untuk menyelesaikan tugasan lisan ujian.
R Penyelesaian: Untuk mengenal pasti tahap hubungan, pertama sekali, adalah perlu untuk memasukkan data ke dalam jadual MS Excel (lihat Jadual, Rajah 1). Kemudian nilai pekali korelasi dikira. Untuk melakukan ini, letakkan kursor dalam sel C1. Pada bar alat, klik butang Sisipkan Fungsi (fx).
Dalam dialog Wizard Fungsi yang muncul, pilih kategori Statistik dan fungsi CORREL, kemudian klik OK. Gunakan penuding tetikus untuk memasukkan julat data sampel X dalam medan tatasusunan1 (A1:A10). Dalam medan tatasusunan2, masukkan julat data sampel Y (B1:B10). Klik OK. Dalam sel C1, nilai pekali korelasi akan muncul - 0.54119. Seterusnya, anda perlu melihat nombor mutlak pekali korelasi dan menentukan jenis hubungan (dekat, lemah, sederhana, dll.)
nasi. 1. Keputusan pengiraan pekali korelasi
Oleh itu, hubungan antara masa menyelesaikan tugas visual-kiasan dan lisan ujian belum terbukti.
Latihan 1. Data tersedia untuk 20 pegangan pertanian. Cari pekali korelasi antara hasil tanaman bijirin dan kualiti tanah dan menilai kepentingannya. Data diberikan dalam jadual.
Jadual 2. Kebergantungan hasil tanaman bijirin terhadap kualiti tanah
nombor rumah |
Kualiti tanah, skor |
Produktiviti, c/ha |
Tugasan 2. Tentukan jika terdapat hubungan antara masa operasi mesin kecergasan sukan (ribu jam) dan kos pembaikan (ribu rubel):
Masa operasi simulator (ribu jam) |
Kos pembaikan (ribu rubel) |
1.2 Korelasi Pelbagai dalam MS Excel
Pada bilangan yang besar pemerhatian, apabila pekali korelasi perlu dikira secara berurutan untuk beberapa sampel, untuk kemudahan, pekali yang terhasil diringkaskan dalam jadual yang dipanggil matriks korelasi.
Matriks korelasi ialah jadual segi empat sama di mana pada persilangan baris dan lajur yang sepadan adalah pekali korelasi antara parameter yang sepadan.
Dalam MS Excel, prosedur digunakan untuk mengira matriks korelasi korelasi daripada pakej Analisis data. Prosedur ini memungkinkan untuk mendapatkan matriks korelasi yang mengandungi pekali korelasi antara parameter yang berbeza.
Untuk melaksanakan prosedur, anda mesti:
1. menjalankan arahan Perkhidmatan - Analisis data;
2. dalam senarai yang muncul Alat Analisis pilih baris Korelasi dan tekan butang okey;
3. Dalam kotak dialog yang muncul, nyatakan selang input, iaitu, masukkan pautan ke sel yang mengandungi data yang dianalisis. Selang input mesti mengandungi sekurang-kurangnya dua lajur.
4. bahagian berkumpulan tetapkan suis mengikut data yang dimasukkan (mengikut lajur atau baris);
5. nyatakan hari cuti selang waktu, iaitu, masukkan rujukan kepada sel, bermula dari mana keputusan analisis akan ditunjukkan. Saiz julat output akan ditentukan secara automatik, dan mesej akan dipaparkan pada skrin jika julat output mungkin bertindih dengan data sumber. Tekan butang okey.
Matriks korelasi akan dipaparkan dalam julat keluaran, di mana pada persimpangan setiap baris dan lajur terdapat pekali korelasi antara parameter yang sepadan. Sel dalam julat output yang mempunyai koordinat baris dan lajur yang sama mengandungi nilai 1 kerana setiap lajur dalam julat input berkorelasi sepenuhnya dengan dirinya sendiri
Contoh 2 Data bulanan tersedia untuk pemerhatian keadaan cuaca dan lawatan ke muzium dan taman (lihat Jadual 3). Adalah perlu untuk menentukan sama ada terdapat hubungan antara keadaan cuaca dan kehadiran muzium dan taman.
Jadual 3. Hasil pemerhatian
Bilangan hari yang cerah |
Bilangan pelawat muzium |
Bilangan pelawat taman |
Penyelesaian. Untuk melakukan analisis korelasi, masukkan data awal ke dalam julat A1:G3 (Rajah 2). Kemudian pada menu Perkhidmatan pilih barang Analisis data dan kemudian tambah baris Korelasi. Dalam kotak dialog yang muncul, masukkan selang input(A2:C7). Tentukan bahawa data dipertimbangkan oleh lajur. Tentukan julat output (E1) dan tekan butang okey.
Pada rajah. 33 dapat dilihat bahawa korelasi antara keadaan cuaca dan kehadiran muzium ialah -0.92, dan antara keadaan cuaca dan kehadiran taman - 0.97, antara kehadiran taman dan muzium - 0.92.
Oleh itu, hasil daripada analisis, kebergantungan telah didedahkan: hubungan linear songsang yang kuat antara kehadiran muzium dan bilangan hari cerah dan hubungan hampir linear (langsung sangat kuat) antara kehadiran taman dan keadaan cuaca. Terdapat hubungan songsang yang kuat antara kehadiran muzium dan taman.
nasi. 2. Keputusan pengiraan matriks korelasi daripada contoh 2
Tugasan 3. 10 pengurus dinilai mengikut metodologi penilaian pakar terhadap ciri psikologi personaliti pemimpin. 15 pakar menilai setiap ciri psikologi mengikut sistem lima mata (lihat Jadual 4). Ahli psikologi berminat dengan persoalan apakah hubungan ciri-ciri pemimpin ini antara satu sama lain.
Jadual 4. Keputusan kajian
Mata pelajaran m/s |
kebijaksanaan |
ketepatan |
kritikal |
Dengan korelasi nilai yang sama dari satu atribut sepadan dengan nilai yang berbeza dari yang lain. Sebagai contoh: terdapat korelasi antara ketinggian dan berat, antara kejadian neoplasma malignan dan umur, dsb.
Terdapat 2 kaedah untuk mengira pekali korelasi: kaedah kuasa dua (Pearson), kaedah pangkat (Spearman).
Yang paling tepat ialah kaedah kuasa dua (Pearson), di mana pekali korelasi ditentukan oleh formula: , di mana
r xy ialah pekali korelasi antara siri statistik X dan Y.
d x ialah sisihan setiap nombor siri statistik X daripada min aritmetiknya.
d y ialah sisihan setiap nombor siri statistik Y daripada min aritmetiknya.
Bergantung kepada kekuatan sambungan dan arahnya, pekali korelasi boleh berkisar antara 0 hingga 1 (-1). Pekali korelasi 0 menunjukkan kekurangan sambungan sepenuhnya. Semakin hampir tahap pekali korelasi kepada 1 atau (-1), semakin besar, masing-masing, semakin hampir langsung atau maklum balas yang diukur olehnya. Dengan pekali korelasi sama dengan 1 atau (-1), sambungan itu lengkap, berfungsi.
Skim untuk menganggar kekuatan korelasi dengan pekali korelasi
Kekuatan sambungan |
Nilai pekali korelasi, jika ada |
|
sambungan langsung (+) |
maklum balas (-) |
|
Tiada sambungan | ||
Komunikasi adalah kecil (lemah) |
dari 0 hingga +0.29 |
0 hingga -0.29 |
Purata komunikasi (sederhana) |
+0.3 hingga +0.69 |
-0.3 hingga -0.69 |
Komunikasi besar (kuat) |
+0.7 hingga +0.99 |
-0.7 hingga -0.99 |
Komunikasi selesai (berfungsi) |
Untuk mengira pekali korelasi menggunakan kaedah segi empat sama, satu jadual 7 lajur disusun. Mari analisa proses pengiraan menggunakan contoh:
TENTUKAN KEKUATAN DAN SIFAT HUBUNGAN ANTARA
Ini masanya- ness goiter (V y ) |
d x= V x –M x |
d y= V y –M y |
d x d y |
d x 2 |
d y 2 |
|
Σ -1345 ,0 |
Σ 13996 ,0 |
Σ 313 , 47 |
1. Tentukan purata kandungan iodin dalam air (dalam mg/l).
mg/l
2. Tentukan purata kejadian goiter dalam%.
3. Tentukan sisihan setiap V x daripada M x, i.e. d x .
201–138=63; 178–138=40 dsb.
4. Begitu juga, kita menentukan sisihan setiap V y daripada M y, i.e. d
0.2–3.8=-3.6; 0.6–38=-3.2 dsb.
5. Kami menentukan hasil sisihan. Produk yang terhasil disimpulkan dan diperolehi.
6. Kami kuasa dua d x dan meringkaskan keputusan, kami dapat.
7. Begitu juga, kita kuasa dua d y, ringkaskan keputusan, kita dapat
8. Akhir sekali, kami menggantikan semua amaun yang diterima ke dalam formula:
Untuk menyelesaikan isu kebolehpercayaan pekali korelasi, ia ditentukan ralat purata mengikut formula:
(Jika bilangan cerapan kurang daripada 30, maka penyebutnya ialah n-1).
Dalam contoh kita
Nilai pekali korelasi dianggap boleh dipercayai jika ia sekurang-kurangnya 3 kali lebih tinggi daripada ralat min.
Dalam contoh kita
Oleh itu, pekali korelasi tidak boleh dipercayai, yang menjadikannya perlu untuk meningkatkan bilangan pemerhatian.
Pekali korelasi boleh ditentukan dengan cara yang agak kurang tepat, tetapi lebih mudah, kaedah pangkat (Spearman).
Kaedah tombak: P=1-(6∑d 2 /n-(n 2 -1))
buat dua baris ciri perbandingan yang berpasangan, masing-masing menetapkan baris pertama dan kedua, x dan y. Pada masa yang sama, tunjukkan baris pertama atribut dalam tertib menurun atau menaik, dan letakkan nilai berangka baris kedua bertentangan dengan nilai baris pertama yang sepadan dengannya
nilai ciri dalam setiap baris yang dibandingkan harus digantikan dengan nombor siri (pangkat). Kedudukan, atau nombor, menunjukkan tempat penunjuk (nilai) baris pertama dan kedua. Di mana nilai berangka daripada atribut kedua, pangkat mesti ditetapkan dalam susunan yang sama yang telah diterima pakai semasa mengagihkannya kepada nilai atribut pertama. Dengan nilai atribut yang sama dalam siri, kedudukan harus ditentukan sebagai nombor purata daripada jumlah nombor ordinal nilai ini
tentukan perbezaan pangkat antara x dan y (d): d = x - y
kuasa duakan perbezaan pangkat yang terhasil (d 2)
dapatkan jumlah kuasa dua beza (Σ d 2) dan gantikan nilai yang diperoleh ke dalam formula:
Contoh: menggunakan kaedah pangkat untuk menetapkan arah dan kekuatan hubungan antara tempoh perkhidmatan dalam tahun dan kekerapan kecederaan, jika data berikut diperoleh:
Rasional untuk memilih kaedah: untuk menyelesaikan masalah, hanya kaedah yang boleh dipilih korelasi pangkat, kerana baris pertama atribut "pengalaman kerja dalam tahun" mempunyai pilihan terbuka (pengalaman kerja sehingga 1 tahun dan 7 tahun atau lebih), yang tidak membenarkan penggunaan kaedah yang lebih tepat - kaedah segi empat sama - untuk mewujudkan hubungan antara ciri dibandingkan.
Penyelesaian. Urutan pengiraan diterangkan dalam teks, hasilnya dibentangkan dalam Jadual. 2.
jadual 2
Pengalaman kerja dalam tahun |
Bilangan kecederaan |
Nombor ordinal (pangkat) |
Perbezaan Pangkat |
perbezaan pangkat kuasa dua |
|
d(x-y) |
d 2 |
||||
Setiap baris tanda berpasangan dilambangkan dengan "x" dan dengan "y" (lajur 1-2).
Nilai setiap tanda digantikan dengan nombor pangkat (siri). Susunan pengagihan pangkat dalam siri "x" adalah seperti berikut: nilai minimum atribut (pengalaman sehingga 1 tahun) diberikan nombor siri "1", masing-masing varian berikutnya dari siri atribut yang sama. , dalam susunan nombor bersiri ke-2, ke-3, ke-4 dan ke-5 - pangkat (lihat lajur 3). Susunan serupa diperhatikan apabila mengagihkan pangkat kepada ciri kedua "y" (lajur 4). Dalam kes di mana terdapat beberapa varian saiz yang sama (contohnya, dalam tugas standard, ini adalah 12 dan 12 kecederaan bagi setiap 100 pekerja dengan pengalaman 3-4 tahun dan 5-6 tahun), nombor siri ditunjukkan dengan purata nombor daripada jumlah nombor bersiri mereka. Data ini mengenai bilangan kecederaan (12 kecederaan) dalam ranking harus mengambil tempat ke-2 dan ke-3, jadi purata bilangan mereka ialah (2 + 3) / 2 = 2.5. ) harus mengedarkan nombor kedudukan yang sama - "2.5" (lajur 4).
Tentukan perbezaan dalam pangkat d = (x - y) - (lajur 5)
Mengkuadratkan perbezaan dalam pangkat (d 2) dan mendapatkan hasil tambah kuasa dua perbezaan dalam pangkat Σ d 2 (lajur 6).
Kira pekali korelasi pangkat menggunakan formula:
di mana n ialah bilangan pasangan pilihan yang dipadankan dalam baris "x" dan baris "y"