Biografi Ciri-ciri Analisis

Pekali korelasi dalam excel. Bagaimanakah korelasi dilakukan dalam Excel? Matriks Pekali Korelasi Berpasangan dalam Excel

Ciri kuantitatif perhubungan boleh diperolehi dengan mengira pekali korelasi.

Analisis korelasi dalam Excel

Fungsi itu sendiri ada bentuk umum CORREL(array1, array2). Dalam medan "Array1", masukkan koordinat julat sel salah satu nilai, pergantungan yang harus ditentukan. Seperti yang anda lihat, pekali korelasi dalam bentuk nombor muncul dalam sel yang telah kita pilih sebelum ini. Tetingkap dengan parameter analisis korelasi terbuka. Tidak seperti kaedah sebelumnya, dalam medan "Selang input", kami memasukkan selang bukan untuk setiap lajur secara berasingan, tetapi untuk semua lajur yang mengambil bahagian dalam analisis. Seperti yang anda lihat, aplikasi Excel menawarkan dua kaedah analisis korelasi sekaligus.

carta korelasi dalam excel

6) Elemen pertama jadual akhir akan muncul di sel kiri atas kawasan yang dipilih. Oleh itu, hipotesis H0 ditolak, iaitu parameter regresi dan pekali korelasi tidak berbeza secara rawak daripada sifar, tetapi adalah signifikan secara statistik. 7. Anggaran persamaan regresi yang diperolehi membolehkan kita menggunakannya untuk peramalan.

Bagaimana untuk mengira pekali korelasi dalam Excel

Jika pekali ialah 0, ini menunjukkan bahawa tiada hubungan antara nilai. Untuk mencari hubungan antara pembolehubah dan y, gunakan fungsi terbina dalam Microsoft Excel "CORREL". Sebagai contoh, untuk "Array1" pilih nilai y, dan untuk "Array2" pilih nilai x. Hasilnya, anda akan mendapat pekali korelasi yang dikira oleh program. Seterusnya, anda perlu mengira perbezaan antara setiap x dan xav, dan yav. Dalam sel yang dipilih tulis formula x-x, y-. Jangan lupa untuk menyematkan sel dengan nilai purata. Hasil yang diperoleh akan menjadi pekali korelasi yang dikehendaki.

Formula di atas untuk mengira pekali Pearson menunjukkan betapa susahnya proses ini jika dilakukan secara manual. Kedua, sila syorkan jenis analisis korelasi yang boleh digunakan untuk sampel yang berbeza dengan serakan data yang besar? Bagaimanakah saya boleh membuktikan secara statistik perbezaan antara kumpulan lebih 60 dan orang lain?

Lakukan Sendiri: Mengira Korelasi Mata Wang Menggunakan Excel

Kami, sebagai contoh, menggunakan Microsoft Excel, tetapi sebarang program lain yang boleh menggunakan formula korelasi akan berjaya. 7. Selepas itu, pilih sel dengan data pada EUR/USD. 9. Tekan Enter untuk mengira pekali korelasi untuk EUR/USD dan USD/JPY. Ia tidak berbaloi untuk mengemas kini nombor setiap hari (baiklah, melainkan anda terobsesi dengan korelasi mata wang).

Anda telah pun menghadapi keperluan untuk mengira tahap hubungan antara dua perangkaan dan tentukan formula yang mengaitkannya? Untuk melakukan ini, saya menggunakan fungsi CORREL (CORREL) - terdapat sedikit maklumat mengenainya di sini. Ia mengembalikan tahap korelasi antara dua julat data. Secara teorinya, fungsi korelasi boleh diperhalusi dengan menukarnya daripada linear kepada eksponen atau logaritma. Analisis data dan graf korelasi boleh meningkatkan kebolehpercayaannya dengan sangat ketara.

Katakan sel B2 mengandungi pekali korelasi itu sendiri, sel B3 mengandungi bilangan pemerhatian lengkap. Adakah anda mempunyai pejabat berbahasa Rusia? By the way, saya juga mendapati kesilapan - kepentingannya tidak dikira untuk korelasi negatif. Jika kedua-dua pembolehubah adalah metrik dan mempunyai taburan normal, maka pilihannya adalah tepat. Dan, adakah mungkin untuk mencirikan kriteria persamaan lengkung menggunakan hanya satu QC? Anda tidak mempunyai persamaan "lengkung", tetapi persamaan dua siri, yang, pada dasarnya, boleh digambarkan oleh lengkung.

Adakah anda sudah menghadapi keperluan untuk mengira tahap hubungan antara dua kuantiti statistik dan menentukan formula yang mana ia mengaitkan? Orang biasa seseorang mungkin bertanya mengapa ini mungkin perlu sama sekali. Anehnya, ini benar-benar perlu. Mengetahui korelasi yang boleh dipercayai boleh membantu anda menjana kekayaan jika anda, katakan, seorang peniaga saham. Masalahnya ialah atas sebab tertentu tiada siapa yang mendedahkan korelasi ini (mengejutkan, bukan?).

Mari kita mengira mereka sendiri! Sebagai contoh, saya memutuskan untuk cuba mengira korelasi ruble terhadap dolar melalui euro. Mari lihat bagaimana ini dilakukan secara terperinci.

Artikel ini direka untuk tahap pengetahuan lanjutan tentang Microsoft Excel. Jika anda tidak mempunyai masa untuk membaca keseluruhan artikel, anda boleh memuat turun fail dan berurusan dengannya sendiri.

Jika anda sering mendapati diri anda perlu melakukan sesuatu seperti ini Saya amat mengesyorkan agar anda mempertimbangkan untuk membeli buku tersebut. Pengiraan Statistik dalam Excel.

Apa yang penting untuk diketahui tentang korelasi

Untuk mengira korelasi yang boleh dipercayai, adalah perlu untuk mempunyai sampel yang boleh dipercayai, semakin besar ia, semakin dipercayai hasilnya. Untuk tujuan contoh ini, saya telah mengambil sampel harian kadar pertukaran selama 10 tahun. Data tersedia secara percuma, saya mengambilnya dari tapak http://oanda.com.

Apa yang saya buat sebenarnya

(1) Apabila saya mempunyai data asal saya, saya mulakan dengan menyemak tahap korelasi antara dua set data. Untuk melakukan ini, saya menggunakan fungsi CORREL (CORREL) - terdapat sedikit maklumat mengenainya. Ia mengembalikan tahap korelasi antara dua julat data. Hasilnya, terus terang, tidak begitu mengagumkan (hanya kira-kira 70%). Secara umum, tahap korelasi antara dua nilai dianggap sebagai kuasa dua nilai ini, iaitu, korelasi ternyata boleh dipercayai kira-kira 49%. Ini sangat sedikit!

(2) Ia kelihatan sangat pelik kepada saya. Apakah ralat yang boleh masuk ke dalam pengiraan saya? Jadi saya memutuskan untuk membina graf dan melihat apa yang boleh berlaku. Carta itu sengaja disimpan ringkas, dipecahkan mengikut tahun supaya anda dapat melihat secara visual di mana korelasi itu terputus. Carta kelihatan seperti ini

(3) Daripada carta, jelas bahawa dalam julat kira-kira 35 rubel setiap euro, korelasi mula pecah kepada dua bahagian. Kerana ini, dia ternyata tidak boleh dipercayai. Ia adalah perlu untuk menentukan berkaitan dengan apa yang berlaku.

(4) Warna menunjukkan bahawa data ini merujuk kepada 2007, 2008, 2009. Sudah tentu! Tempoh kemuncak ekonomi dan kemelesetan biasanya tidak boleh dipercayai secara statistik, yang berlaku pada kes ini. Oleh itu, saya cuba mengecualikan tempoh ini daripada data (baik, untuk pengesahan, saya menyemak tahap korelasi data dalam tempoh ini). Darjah korelasi hanya data ini ialah 0.01%, iaitu tiada pada dasarnya. Tetapi tanpa mereka, data berkorelasi kira-kira 81%. Ini sudah menjadi korelasi yang agak boleh dipercayai. Berikut ialah graf dengan fungsi.

Langkah seterusnya

Secara teorinya, fungsi korelasi boleh diperhalusi dengan menukarnya daripada linear kepada eksponen atau logaritma. Di mana kesahan statistik korelasi berkembang kira-kira satu peratus, tetapi kerumitan penggunaan formula meningkat dengan ketara. Oleh itu, untuk diri saya sendiri, saya mengemukakan soalan: adakah ia benar-benar perlu? Anda membuat keputusan - untuk setiap kes tertentu.

Notis! Penyelesaian kepada masalah khusus anda akan kelihatan serupa contoh ini, termasuk semua jadual dan teks penerangan di bawah, tetapi mengambil kira data awal anda ...

Satu tugas:
Terdapat sampel berkaitan 26 pasangan nilai (x k ,y k ):

k 1 2 3 4 5 6 7 8 9 10
x k 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

k 11 12 13 14 15 16 17 18 19 20
x k 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

k 21 22 23 24 25 26
x k 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

Ia diperlukan untuk mengira/membina:
- pekali korelasi;
- menguji hipotesis kebergantungan pembolehubah rawak X dan Y, pada aras keertian α = 0.05;
- pekali persamaan regresi linear;
- gambar rajah serakan (medan korelasi) dan graf garis regresi;

PENYELESAIAN:

1. Kira pekali korelasi.

Pekali korelasi ialah penunjuk pengaruh kebarangkalian bersama dua pembolehubah rawak. Pekali korelasi R boleh mengambil nilai daripada -1 sebelum ini +1 . Jika nilai mutlak lebih hampir kepada 1 , maka ini adalah bukti sambungan yang kuat antara nilai, dan jika lebih dekat dengan 0 - kemudian, ia menunjukkan sambungan yang lemah atau ketiadaannya. Jika nilai mutlak R sama dengan satu, maka kita boleh bercakap tentang hubungan fungsi antara kuantiti, iaitu, satu kuantiti boleh dinyatakan dalam sebutan yang lain menggunakan fungsi matematik.


Anda boleh mengira pekali korelasi menggunakan formula berikut:
n
Σ
k = 1
(x k -M x) 2 , y 2 =
Mx =
1
n
n
Σ
k = 1
x k , M y =

atau mengikut formula

Rx,y =
M xy - M x M y
SxSy
(1.4), di mana:
Mx =
1
n
n
Σ
k = 1
x k , M y =
1
n
n
Σ
k = 1
y k , Mxy =
1
n
n
Σ
k = 1
x k y k (1.5)
S x 2 =
1
n
n
Σ
k = 1
x k 2 - M x 2, S y 2 =
1
n
n
Σ
k = 1
y k 2 - M y 2 (1.6)

Dalam amalan, formula (1.4) lebih kerap digunakan untuk mengira pekali korelasi, kerana ia memerlukan kurang pengiraan. Walau bagaimanapun, jika kovarians sebelum ini dikira cov(X,Y), maka adalah lebih berfaedah untuk menggunakan formula (1.1), kerana sebagai tambahan kepada nilai sebenar kovarians, anda juga boleh menggunakan hasil pengiraan perantaraan.

1.1 Kira pekali korelasi menggunakan formula (1.4), untuk ini kita mengira nilai x k 2 , y k 2 dan x k y k dan masukkannya dalam jadual 1.

Jadual 1


k
x k y k x k 2 y k 2 x ky k
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. Kami mengira M x dengan formula (1.5).

1.2.1. x k

x 1 + x 2 + ... + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000

1.2.2.

669.50000 / 26 = 25.75000

M x = 25.750000

1.3. Begitu juga, kita mengira M y.

1.3.1. Mari tambah semua elemen dalam urutan y k

y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000

1.3.2. Bahagikan jumlah yang terhasil dengan bilangan elemen sampel

793.00000 / 26 = 30.50000

M y = 30.500000

1.4. Begitu juga, kita mengira M xy.

1.4.1. Kami menambah secara berurutan semua elemen lajur ke-6 jadual 1

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. Bahagikan hasil tambah dengan bilangan unsur

20412.83000 / 26 = 785.10885

M xy = 785.108846

1.5. Kira nilai S x 2 menggunakan formula (1.6.).

1.5.1. Kami menambah secara berurutan semua elemen lajur ke-4 jadual 1

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. Bahagikan hasil tambah dengan bilangan unsur

17256.91000 / 26 = 663.72731

1.5.3. Tolak daripada nombor terakhir kuasa dua nilai M x kita mendapat nilai untuk S x 2

S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. Kira nilai S y 2 dengan formula (1.6.).

1.6.1. Kami menambah secara berurutan semua elemen lajur ke-5 jadual 1

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. Bahagikan hasil tambah dengan bilangan unsur

24191.84000 / 26 = 930.45538

1.6.3. Tolak daripada nombor terakhir kuasa dua M y , kita mendapat nilai untuk S y 2

S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. Mari kita hitung hasil darab S x 2 dan S y 2.

S x 2 S y 2 = 0.66481 0.20538 = 0.136541

1.8. Ekstrak nombor terakhir Punca kuasa dua, kita mendapat nilai S x S y.

S x S y = 0.36951

1.9. Kira nilai pekali korelasi mengikut formula (1.4.).

R = (785.10885 - 25.75000 30.50000) / 0.36951 = (785.10885 - 785.37500) / 0.36951 = -0.72028

JAWAPAN: Rx,y = -0.720279

2. Kami menyemak kepentingan pekali korelasi (kami menyemak hipotesis pergantungan).

Oleh kerana anggaran pekali korelasi dikira pada sampel terhingga, dan oleh itu mungkin menyimpang daripada nilai amnya, adalah perlu untuk menyemak kepentingan pekali korelasi. Semakan dibuat menggunakan kriteria-t:

t =
Rx,y
n - 2
1 - R 2 x,y
(2.1)

Nilai rawak t mengikut taburan-t Pelajar dan mengikut jadual taburan-t adalah perlu untuk mencari nilai kritikal bagi kriteria (t cr.α) pada aras keertian α yang diberikan. Jika modulo t yang dikira dengan formula (2.1) ternyata kurang daripada t cr.α , maka pergantungan antara pembolehubah rawak X dan Y bukan. Jika tidak, data eksperimen tidak bercanggah dengan hipotesis tentang pergantungan pembolehubah rawak.


2.1. Kira nilai kriteria t mengikut formula (2.1) yang kita dapat:
t =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. Mari kita tentukan nilai kritikal parameter t cr.α daripada jadual taburan-t

Nilai t kr.α yang dikehendaki terletak di persimpangan baris yang sepadan dengan bilangan darjah kebebasan dan lajur yang sepadan dengan aras keertian α yang diberikan.
Dalam kes kita, bilangan darjah kebebasan ialah n - 2 = 26 - 2 = 24 dan α = 0.05 , yang sepadan dengan nilai kritikal bagi kriteria t cr.α = 2.064 (lihat jadual 2)

jadual 2 pengagihan-t

Bilangan darjah kebebasan
(n - 2)
α = 0.1 α = 0.05 α = 0.02 α = 0.01 α = 0.002 α = 0.001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. Mari kita bandingkan nilai mutlak bagi t-kriteria dan t cr.α

Nilai mutlak t-kriteria tidak kurang daripada kritikal t = 5.08680, tcr.α = 2.064, oleh itu data eksperimen, dengan kebarangkalian 0.95(1 - α ), jangan bercanggah dengan hipotesis pada pergantungan pembolehubah rawak X dan Y.

3. Kami mengira pekali persamaan regresi linear.

Persamaan regresi linear ialah persamaan garis lurus yang menghampiri (kira-kira menerangkan) hubungan antara pembolehubah rawak X dan Y. Jika kita mengandaikan bahawa X adalah bebas dan Y bergantung kepada X, maka persamaan regresi akan ditulis seperti berikut.


Y = a + b X (3.1), di mana:

b=Rx,y
y
σ x
= Rx,y
Sy
S x
(3.2),
a = M y - b M x (3.3)

Pekali dikira dengan formula (3.2) b dipanggil pekali regresi linear. Dalam beberapa sumber a dipanggil pekali malar regresi dan b mengikut pembolehubah.

Ralat ramalan Y untuk nilai X yang diberikan dikira oleh formula:

Nilai σ y/x (formula 3.4) juga dipanggil sisihan piawai baki, ia mencirikan pemergian Y daripada garis regresi yang diterangkan oleh persamaan (3.1) pada nilai tetap (diberi) X.

.
S y 2 / S x 2 = 0.20538 / 0.66481 = 0.30894. Kami mengekstrak punca kuasa dua daripada nombor terakhir - kami mendapat:
S y / S x = 0.55582

3.3 Kira pekali b mengikut formula (3.2)

b = -0.72028 0.55582 = -0.40035

3.4 Kira pekali a mengikut formula (3.3)

a = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 Anggarkan ralat persamaan regresi.

3.5.1 Kami mengekstrak punca kuasa dua daripada S y 2 dan dapatkan:

= 0.31437
3.5.4 Pengiraan ralat relatif mengikut formula (3.5)

δy/x = (0.31437 / 30.50000)100% = 1.03073%

4. Kami membina scatterplot (medan korelasi) dan graf garis regresi.

Taburan adalah imej grafik pasangan sepadan (x k , y k ) dalam bentuk titik satah, in koordinat segi empat tepat dengan paksi X dan Y. Medan korelasi ialah salah satu daripada perwakilan grafik sampel berpaut (berpasangan). Dalam sistem koordinat yang sama, graf garis regresi juga diplotkan. Skala dan titik permulaan pada paksi hendaklah dipilih dengan teliti supaya gambar rajah sejelas mungkin.

4.1. Kami mendapati elemen minimum dan maksimum bagi sampel X ialah unsur ke-18 dan ke-15, masing-masing, x min = 22.10000 dan x max = 26.60000.

4.2. Kami mendapati unsur minimum dan maksimum bagi sampel Y ialah unsur ke-2 dan ke-18, masing-masing, y min = 29.40000 dan y maks = 31.60000.

4.3. Pada paksi abscissa, kami memilih titik permulaan hanya di sebelah kiri titik x 18 = 22.10000, dan skala sedemikian sehingga titik x 15 = 26.60000 sesuai pada paksi dan titik lain jelas dibezakan.

4.4. Pada paksi-y, kita memilih titik permulaan hanya di sebelah kiri titik y 2 = 29.40000, dan skala sedemikian sehingga titik y 18 = 31.60000 sesuai pada paksi dan titik-titik lain jelas dibezakan.

4.5. Pada paksi abscissa kita letakkan nilai x k , dan pada paksi ordinat kita letakkan nilai y k .

4.6. Kami meletakkan titik (x 1, y 1), (x 2, y 2), ..., (x 26, y 26 ) pada satah koordinat. Kami mendapat scatterplot (medan korelasi), ditunjukkan dalam rajah di bawah.

4.7. Mari kita lukis garis regresi.

Untuk melakukan ini, kami dapati dua pelbagai mata dengan koordinat (x r1 , y r1) dan (x r2 , y r2) memuaskan persamaan (3.6), kami meletakkannya pada satah koordinat dan melukis garis melaluinya. Mari kita ambil x min = 22.10000 sebagai absis mata pertama. Kami menggantikan nilai x min dalam persamaan (3.6), kami mendapat ordinat titik pertama. Oleh itu, kita mempunyai titik dengan koordinat (22.10000, 31.96127). Begitu juga, kita memperoleh koordinat titik kedua, menetapkan nilai x max = 26.60000 sebagai absis. Mata kedua ialah: (26.60000, 30.15970).

Garis regresi ditunjukkan dalam rajah di bawah dengan warna merah

Sila ambil perhatian bahawa garis regresi sentiasa melalui titik nilai purata X dan Y, i.e. dengan koordinat (M x , M y).

KERJA MAKMAL

ANALISIS KORELASI DALAMEXCEL

1.1 Analisis korelasi dalam MS Excel

Analisis korelasi terdiri dalam menentukan darjah sambungan antara dua pembolehubah rawak X dan Y. Pekali korelasi digunakan sebagai ukuran sambungan tersebut. Pekali korelasi dianggarkan daripada sampel volum n pasangan pemerhatian yang berkaitan (x i, y i) daripada populasi umum bersama X dan Y. Untuk menilai tahap hubungan antara X dan Y yang diukur dalam skala kuantitatif, kami menggunakan pekali korelasi linear(Pekali Pearson), dengan mengandaikan bahawa sampel X dan Y diedarkan mengikut hukum biasa.

Pekali korelasi berbeza daripada -1 (hubungan linear songsang yang ketat) kepada 1 (hubungan berkadar langsung yang ketat). Pada nilai 0, tiada hubungan linear antara kedua-dua sampel.

Klasifikasi umum korelasi (menurut Ivanter E.V., Korosov A.V., 1992):

Terdapat beberapa jenis pekali korelasi, bergantung kepada pembolehubah X dan Y, yang boleh diukur pada skala yang berbeza. Fakta inilah yang menentukan pilihan pekali korelasi yang sesuai (lihat Jadual 13):

Dalam MS Excel, fungsi khas digunakan untuk mengira pekali korelasi linear berpasangan CORREL(array1; array2),

mata pelajaran ujian

di mana tatasusunan1 ialah rujukan kepada julat sel bagi pemilihan pertama (X);

Contoh 1: 10 orang murid sekolah diberi ujian untuk visual-figuratif dan pemikiran lisan. Purata masa untuk menyelesaikan tugasan ujian diukur dalam saat. Pengkaji berminat dengan soalan: adakah terdapat hubungan antara masa menyelesaikan masalah ini? Pembolehubah X menandakan purata masa untuk menyelesaikan ujian visual-kiasan, dan pembolehubah Y menandakan purata masa untuk menyelesaikan tugasan lisan ujian.

R Penyelesaian: Untuk mengenal pasti tahap hubungan, pertama sekali, adalah perlu untuk memasukkan data ke dalam jadual MS Excel (lihat Jadual, Rajah 1). Kemudian nilai pekali korelasi dikira. Untuk melakukan ini, letakkan kursor dalam sel C1. Pada bar alat, klik butang Sisipkan Fungsi (fx).

Dalam dialog Wizard Fungsi yang muncul, pilih kategori Statistik dan fungsi CORREL, kemudian klik OK. Gunakan penuding tetikus untuk memasukkan julat data sampel X dalam medan tatasusunan1 (A1:A10). Dalam medan tatasusunan2, masukkan julat data sampel Y (B1:B10). Klik OK. Dalam sel C1, nilai pekali korelasi akan muncul - 0.54119. Seterusnya, anda perlu melihat nombor mutlak pekali korelasi dan menentukan jenis hubungan (dekat, lemah, sederhana, dll.)

nasi. 1. Keputusan pengiraan pekali korelasi

Oleh itu, hubungan antara masa menyelesaikan tugas visual-kiasan dan lisan ujian belum terbukti.

Latihan 1. Data tersedia untuk 20 pegangan pertanian. Cari pekali korelasi antara hasil tanaman bijirin dan kualiti tanah dan menilai kepentingannya. Data diberikan dalam jadual.

Jadual 2. Kebergantungan hasil tanaman bijirin terhadap kualiti tanah

nombor rumah

Kualiti tanah, skor

Produktiviti, c/ha


Tugasan 2. Tentukan jika terdapat hubungan antara masa operasi mesin kecergasan sukan (ribu jam) dan kos pembaikan (ribu rubel):

Masa operasi simulator (ribu jam)

Kos pembaikan (ribu rubel)

1.2 Korelasi Pelbagai dalam MS Excel

Pada bilangan yang besar pemerhatian, apabila pekali korelasi perlu dikira secara berurutan untuk beberapa sampel, untuk kemudahan, pekali yang terhasil diringkaskan dalam jadual yang dipanggil matriks korelasi.

Matriks korelasi ialah jadual segi empat sama di mana pada persilangan baris dan lajur yang sepadan adalah pekali korelasi antara parameter yang sepadan.

Dalam MS Excel, prosedur digunakan untuk mengira matriks korelasi korelasi daripada pakej Analisis data. Prosedur ini memungkinkan untuk mendapatkan matriks korelasi yang mengandungi pekali korelasi antara parameter yang berbeza.

Untuk melaksanakan prosedur, anda mesti:

1. menjalankan arahan Perkhidmatan - Analisis data;

2. dalam senarai yang muncul Alat Analisis pilih baris Korelasi dan tekan butang okey;

3. Dalam kotak dialog yang muncul, nyatakan selang input, iaitu, masukkan pautan ke sel yang mengandungi data yang dianalisis. Selang input mesti mengandungi sekurang-kurangnya dua lajur.

4. bahagian berkumpulan tetapkan suis mengikut data yang dimasukkan (mengikut lajur atau baris);

5. nyatakan hari cuti selang waktu, iaitu, masukkan rujukan kepada sel, bermula dari mana keputusan analisis akan ditunjukkan. Saiz julat output akan ditentukan secara automatik, dan mesej akan dipaparkan pada skrin jika julat output mungkin bertindih dengan data sumber. Tekan butang okey.

Matriks korelasi akan dipaparkan dalam julat keluaran, di mana pada persimpangan setiap baris dan lajur terdapat pekali korelasi antara parameter yang sepadan. Sel dalam julat output yang mempunyai koordinat baris dan lajur yang sama mengandungi nilai 1 kerana setiap lajur dalam julat input berkorelasi sepenuhnya dengan dirinya sendiri

Contoh 2 Data bulanan tersedia untuk pemerhatian keadaan cuaca dan lawatan ke muzium dan taman (lihat Jadual 3). Adalah perlu untuk menentukan sama ada terdapat hubungan antara keadaan cuaca dan kehadiran muzium dan taman.

Jadual 3. Hasil pemerhatian

Bilangan hari yang cerah

Bilangan pelawat muzium

Bilangan pelawat taman

Penyelesaian. Untuk melakukan analisis korelasi, masukkan data awal ke dalam julat A1:G3 (Rajah 2). Kemudian pada menu Perkhidmatan pilih barang Analisis data dan kemudian tambah baris Korelasi. Dalam kotak dialog yang muncul, masukkan selang input(A2:C7). Tentukan bahawa data dipertimbangkan oleh lajur. Tentukan julat output (E1) dan tekan butang okey.

Pada rajah. 33 dapat dilihat bahawa korelasi antara keadaan cuaca dan kehadiran muzium ialah -0.92, dan antara keadaan cuaca dan kehadiran taman - 0.97, antara kehadiran taman dan muzium - 0.92.

Oleh itu, hasil daripada analisis, kebergantungan telah didedahkan: hubungan linear songsang yang kuat antara kehadiran muzium dan bilangan hari cerah dan hubungan hampir linear (langsung sangat kuat) antara kehadiran taman dan keadaan cuaca. Terdapat hubungan songsang yang kuat antara kehadiran muzium dan taman.

nasi. 2. Keputusan pengiraan matriks korelasi daripada contoh 2

Tugasan 3. 10 pengurus dinilai mengikut metodologi penilaian pakar terhadap ciri psikologi personaliti pemimpin. 15 pakar menilai setiap ciri psikologi mengikut sistem lima mata (lihat Jadual 4). Ahli psikologi berminat dengan persoalan apakah hubungan ciri-ciri pemimpin ini antara satu sama lain.

Jadual 4. Keputusan kajian

Mata pelajaran m/s

kebijaksanaan

ketepatan

kritikal

Dengan korelasi nilai yang sama dari satu atribut sepadan dengan nilai yang berbeza dari yang lain. Sebagai contoh: terdapat korelasi antara ketinggian dan berat, antara kejadian neoplasma malignan dan umur, dsb.

Terdapat 2 kaedah untuk mengira pekali korelasi: kaedah kuasa dua (Pearson), kaedah pangkat (Spearman).

Yang paling tepat ialah kaedah kuasa dua (Pearson), di mana pekali korelasi ditentukan oleh formula: , di mana

r xy ialah pekali korelasi antara siri statistik X dan Y.

d x ialah sisihan setiap nombor siri statistik X daripada min aritmetiknya.

d y ialah sisihan setiap nombor siri statistik Y daripada min aritmetiknya.

Bergantung kepada kekuatan sambungan dan arahnya, pekali korelasi boleh berkisar antara 0 hingga 1 (-1). Pekali korelasi 0 menunjukkan kekurangan sambungan sepenuhnya. Semakin hampir tahap pekali korelasi kepada 1 atau (-1), semakin besar, masing-masing, semakin hampir langsung atau maklum balas yang diukur olehnya. Dengan pekali korelasi sama dengan 1 atau (-1), sambungan itu lengkap, berfungsi.

Skim untuk menganggar kekuatan korelasi dengan pekali korelasi

Kekuatan sambungan

Nilai pekali korelasi, jika ada

sambungan langsung (+)

maklum balas (-)

Tiada sambungan

Komunikasi adalah kecil (lemah)

dari 0 hingga +0.29

0 hingga -0.29

Purata komunikasi (sederhana)

+0.3 hingga +0.69

-0.3 hingga -0.69

Komunikasi besar (kuat)

+0.7 hingga +0.99

-0.7 hingga -0.99

Komunikasi selesai

(berfungsi)

Untuk mengira pekali korelasi menggunakan kaedah segi empat sama, satu jadual 7 lajur disusun. Mari analisa proses pengiraan menggunakan contoh:

TENTUKAN KEKUATAN DAN SIFAT HUBUNGAN ANTARA

Ini masanya-

ness

goiter

(V y )

d x= V xM x

d y= V yM y

d x d y

d x 2

d y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. Tentukan purata kandungan iodin dalam air (dalam mg/l).

mg/l

2. Tentukan purata kejadian goiter dalam%.

3. Tentukan sisihan setiap V x daripada M x, i.e. d x .

201–138=63; 178–138=40 dsb.

4. Begitu juga, kita menentukan sisihan setiap V y daripada M y, i.e. d

0.2–3.8=-3.6; 0.6–38=-3.2 dsb.

5. Kami menentukan hasil sisihan. Produk yang terhasil disimpulkan dan diperolehi.

6. Kami kuasa dua d x dan meringkaskan keputusan, kami dapat.

7. Begitu juga, kita kuasa dua d y, ringkaskan keputusan, kita dapat

8. Akhir sekali, kami menggantikan semua amaun yang diterima ke dalam formula:

Untuk menyelesaikan isu kebolehpercayaan pekali korelasi, ia ditentukan ralat purata mengikut formula:

(Jika bilangan cerapan kurang daripada 30, maka penyebutnya ialah n-1).

Dalam contoh kita

Nilai pekali korelasi dianggap boleh dipercayai jika ia sekurang-kurangnya 3 kali lebih tinggi daripada ralat min.

Dalam contoh kita

Oleh itu, pekali korelasi tidak boleh dipercayai, yang menjadikannya perlu untuk meningkatkan bilangan pemerhatian.

Pekali korelasi boleh ditentukan dengan cara yang agak kurang tepat, tetapi lebih mudah, kaedah pangkat (Spearman).

Kaedah tombak: P=1-(6∑d 2 /n-(n 2 -1))

buat dua baris ciri perbandingan yang berpasangan, masing-masing menetapkan baris pertama dan kedua, x dan y. Pada masa yang sama, tunjukkan baris pertama atribut dalam tertib menurun atau menaik, dan letakkan nilai berangka baris kedua bertentangan dengan nilai baris pertama yang sepadan dengannya

nilai ciri dalam setiap baris yang dibandingkan harus digantikan dengan nombor siri (pangkat). Kedudukan, atau nombor, menunjukkan tempat penunjuk (nilai) baris pertama dan kedua. Di mana nilai berangka daripada atribut kedua, pangkat mesti ditetapkan dalam susunan yang sama yang telah diterima pakai semasa mengagihkannya kepada nilai atribut pertama. Dengan nilai atribut yang sama dalam siri, kedudukan harus ditentukan sebagai nombor purata daripada jumlah nombor ordinal nilai ini

tentukan perbezaan pangkat antara x dan y (d): d = x - y

kuasa duakan perbezaan pangkat yang terhasil (d 2)

dapatkan jumlah kuasa dua beza (Σ d 2) dan gantikan nilai yang diperoleh ke dalam formula:

Contoh: menggunakan kaedah pangkat untuk menetapkan arah dan kekuatan hubungan antara tempoh perkhidmatan dalam tahun dan kekerapan kecederaan, jika data berikut diperoleh:

Rasional untuk memilih kaedah: untuk menyelesaikan masalah, hanya kaedah yang boleh dipilih korelasi pangkat, kerana baris pertama atribut "pengalaman kerja dalam tahun" mempunyai pilihan terbuka (pengalaman kerja sehingga 1 tahun dan 7 tahun atau lebih), yang tidak membenarkan penggunaan kaedah yang lebih tepat - kaedah segi empat sama - untuk mewujudkan hubungan antara ciri dibandingkan.

Penyelesaian. Urutan pengiraan diterangkan dalam teks, hasilnya dibentangkan dalam Jadual. 2.

jadual 2

Pengalaman kerja dalam tahun

Bilangan kecederaan

Nombor ordinal (pangkat)

Perbezaan Pangkat

perbezaan pangkat kuasa dua

d(x-y)

d 2

Setiap baris tanda berpasangan dilambangkan dengan "x" dan dengan "y" (lajur 1-2).

Nilai setiap tanda digantikan dengan nombor pangkat (siri). Susunan pengagihan pangkat dalam siri "x" adalah seperti berikut: nilai minimum atribut (pengalaman sehingga 1 tahun) diberikan nombor siri "1", masing-masing varian berikutnya dari siri atribut yang sama. , dalam susunan nombor bersiri ke-2, ke-3, ke-4 dan ke-5 - pangkat (lihat lajur 3). Susunan serupa diperhatikan apabila mengagihkan pangkat kepada ciri kedua "y" (lajur 4). Dalam kes di mana terdapat beberapa varian saiz yang sama (contohnya, dalam tugas standard, ini adalah 12 dan 12 kecederaan bagi setiap 100 pekerja dengan pengalaman 3-4 tahun dan 5-6 tahun), nombor siri ditunjukkan dengan purata nombor daripada jumlah nombor bersiri mereka. Data ini mengenai bilangan kecederaan (12 kecederaan) dalam ranking harus mengambil tempat ke-2 dan ke-3, jadi purata bilangan mereka ialah (2 + 3) / 2 = 2.5. ) harus mengedarkan nombor kedudukan yang sama - "2.5" (lajur 4).

Tentukan perbezaan dalam pangkat d = (x - y) - (lajur 5)

Mengkuadratkan perbezaan dalam pangkat (d 2) dan mendapatkan hasil tambah kuasa dua perbezaan dalam pangkat Σ d 2 (lajur 6).

Kira pekali korelasi pangkat menggunakan formula:

di mana n ialah bilangan pasangan pilihan yang dipadankan dalam baris "x" dan baris "y"