Biografi Ciri-ciri Analisis

Bagaimana untuk melakukan analisis sehala bagi varians dalam statistik. Kehomogenan varians dan kovarians

Kerja kursus matematik

pengenalan

Konsep analisis varians

Faktor tunggal analisis varians(Pelaksanaan praktikal dalam IBM SPSS Statistics 20)

Analisis varians sehala (Pelaksanaan praktikal dalam Microsoft Office 2013)

Kesimpulan

Senarai sumber yang digunakan

pengenalan

Perkaitan topik. Pembangunan statistik matematik bermula dengan karya ahli matematik Jerman terkenal Carl Friedrich Gauss pada tahun 1795 dan masih berkembang. Dalam analisis statistik, terdapat kaedah parametrik "Analisis varians sehala". Pada masa ini, ia digunakan dalam ekonomi semasa menjalankan penyelidikan pasaran untuk perbandingan hasil (contohnya, semasa menjalankan tinjauan tentang penggunaan produk di kawasan yang berbeza di negara ini, adalah perlu untuk membuat kesimpulan tentang perbezaan atau prestasi data tinjauan. tidak berbeza antara satu sama lain; dalam psikologi, semasa menjalankan pelbagai jenis penyelidikan), semasa menyusun ujian perbandingan saintifik, atau menyelidik mana-mana kumpulan sosial, dan untuk menyelesaikan masalah dalam statistik.

Objektif. Kenali kaedah statistik seperti analisis varians sehala, serta pelaksanaannya pada PC dalam pelbagai program dan bandingkan program ini.

Untuk mengkaji teori analisis varians sehala.

Untuk mengkaji program untuk menyelesaikan masalah untuk analisis faktor tunggal.

Berbelanja analisis perbandingan program-program ini.

Pencapaian kerja: Bahagian praktikal kerja telah dilakukan sepenuhnya oleh pengarang: pemilihan program, pemilihan tugas, penyelesaiannya pada PC, selepas itu analisis perbandingan dijalankan. Dalam bahagian teori, klasifikasi kumpulan ANOVA telah dijalankan. kerja ini telah diuji sebagai laporan pada sesi saintifik pelajar "Soalan terpilih matematik tinggi dan kaedah pengajaran matematik"

Struktur dan skop kerja. Karya terdiri daripada pengenalan, kesimpulan, kandungan dan bibliografi, termasuk 4 tajuk. Jumlah keseluruhan karya ialah 25 halaman bercetak. Kerja ini mengandungi 1 contoh yang diselesaikan oleh 2 program.

Konsep analisis varians

Selalunya terdapat keperluan untuk menyiasat pengaruh satu atau lebih pembolehubah tidak bersandar (faktor) pada satu atau lebih pembolehubah bersandar (ciri hasil), masalah sedemikian boleh diselesaikan dengan kaedah analisis varians, yang dikarang oleh R. Fisher.

Analisis varians ANOVA ialah satu set kaedah pemprosesan data statistik yang membolehkan anda menganalisis kebolehubahan satu atau lebih ciri berkesan di bawah pengaruh faktor terkawal (pembolehubah bebas). Di sini, faktor difahami sebagai nilai tertentu yang menentukan sifat objek atau sistem yang dikaji, i.e. sebab hasil akhirnya. Apabila menjalankan analisis varians, adalah penting untuk memilih sumber dan objek pengaruh yang betul, i.e. mengenal pasti pembolehubah bersandar dan bebas.

Bergantung kepada tanda-tanda pengelasan, beberapa kumpulan klasifikasi analisis varians dibezakan (Jadual 1).

Mengikut bilangan faktor yang diambil kira: Analisis univariat - pengaruh satu faktor dikaji; Analisis multivariate - pengaruh serentak dua atau lebih faktor dikaji. Dengan adanya hubungan antara sampel nilai: Analisis yang tidak berkaitan (berbeza ) sampel - dijalankan apabila terdapat beberapa kumpulan objek kajian terletak keadaan yang berbeza. (Hipotesis nol H0 disemak: nilai min pembolehubah bersandar adalah sama dalam keadaan pengukuran yang berbeza, iaitu tidak bergantung kepada faktor yang dikaji.); Analisis sampel yang berkaitan (sama) - dijalankan untuk dua atau lebih pengukuran yang diambil pada kumpulan yang sama objek yang dikaji dalam keadaan yang berbeza. Di sini, pengaruh faktor yang tidak diambil kira adalah mungkin, yang boleh dikaitkan secara salah kepada perubahan dalam keadaan. Dengan bilangan pembolehubah bersandar yang dipengaruhi oleh faktor. Analisis univariat (ANOVA atau AMCOVA - analisis kovarians) - satu pembolehubah bersandar dipengaruhi oleh faktor ; Analisis multivariate (MANOVA - analisis multivariate varians atau MANSOVA - analisis kovarian multivariate) - beberapa pembolehubah bersandar dipengaruhi oleh faktor. Mengikut tujuan kajian. Deterministik - tahap semua faktor ditetapkan terlebih dahulu dan ia adalah pengaruhnya yang diperiksa (hipotesis H0 disemak tentang ketiadaan perbezaan antara tahap purata); Rawak - tahap setiap faktor diperolehi sebagai sampel rawak daripada penduduk tahap faktor (hipotesis H0 diuji bahawa varians nilai tindak balas purata yang dikira untuk tahap faktor yang berbeza adalah bukan sifar);

Dalam analisis varians sehala, kepentingan statistik perbezaan dalam sampel bermakna dua atau lebih populasi diperiksa untuk ini, hipotesis dibentuk secara awal.

Hipotesis nol H0: nilai purata ciri berkesan dalam semua keadaan tindakan faktor (atau penggredan faktor) adalah sama

Hipotesis alternatif H1: nilai purata ciri berkesan dalam semua keadaan faktor adalah berbeza.

Kaedah ANOVA boleh digunakan untuk populasi taburan normal (analog berbilang bagi ujian parametrik) dan kepada populasi yang tidak mempunyai taburan pasti (analog berbilang bagi ujian bukan parametrik). Dalam kes pertama, perlu terlebih dahulu menetapkan bahawa pengedaran ciri yang terhasil adalah normal. Untuk menyemak kenormalan taburan ciri, anda boleh menggunakan penunjuk asimetri A = , , dan kurtosis E = , , di mana , . - nilai ciri berkesan dan nilai puratanya; - sisihan piawai ciri yang terhasil; .

Bilangan pemerhatian;

Ralat keterwakilan untuk ukuran A dan E

Jika penunjuk kecondongan dan kurtosis tidak melebihi kesilapan perwakilan mereka lebih daripada 3 kali, i.e. TAPI<3тА и Е <3тЕ, то распределение можно считать нормальным. Для нормальных распределений показатели А и Е равны нулю.

Data yang berkaitan dengan satu keadaan faktor (kepada satu penggredan) dipanggil kompleks penyebaran. Apabila menjalankan analisis varians, kesamaan serakan antara kompleks perlu diperhatikan. Dalam kes ini, pemilihan elemen perlu dilakukan secara rawak.

Dalam kes kedua, apabila populasi sampel mempunyai taburan sewenang-wenangnya, analog bukan parametrik (pangkat) analisis varians sehala digunakan (kriteria Kruskal-Wallis, Friedman).

Pertimbangkan ilustrasi grafik pergantungan kadar pulangan saham pada keadaan dalam ekonomi negara (Rajah 1, a). Di sini, faktor yang dikaji ialah tahap keadaan ekonomi (lebih tepat lagi, tiga tahap keadaannya), dan ciri berkesan ialah kadar pulangan. Pengagihan di atas menunjukkan bahawa faktor ini mempunyai kesan yang signifikan terhadap keuntungan, i.e. Apabila ekonomi bertambah baik, begitu juga pulangan saham, yang tidak bertentangan dengan akal sehat.

Perhatikan bahawa faktor yang dipilih mempunyai penggredan, i.e. nilainya berubah semasa peralihan dari satu penggredan ke yang lain (dari satu keadaan ekonomi ke yang lain).

nasi. 1. Nisbah pengaruh faktor dan penyebaran intra-kumpulan: a - pengaruh signifikan faktor; b - pengaruh faktor yang tidak ketara

Kumpulan penggredan faktor hanyalah kes khas, di samping itu, faktor boleh mempunyai penggredan yang dibentangkan walaupun dalam skala nominal. Oleh itu, lebih kerap mereka bercakap bukan tentang penggredan faktor, tetapi tentang pelbagai syarat tindakannya.

Sekarang mari kita pertimbangkan idea analisis varians, yang berdasarkan peraturan penambahan varians: jumlah varians adalah sama dengan jumlah antara kumpulan dan purata varians dalam kumpulan:

Jumlah varians yang timbul daripada pengaruh semua faktor

Penyerakan antara kumpulan disebabkan oleh pengaruh semua faktor lain;

Varians dalam kumpulan purata yang disebabkan oleh pengaruh atribut kumpulan.

Pengaruh sifat berkumpulan jelas dilihat dalam Rajah 1a, memandangkan pengaruh faktor adalah signifikan berbanding dengan serakan intrakumpulan, oleh itu, varians antara kumpulan akan lebih besar daripada intrakumpulan satu ( > ), dan dalam Rajah. 1, b, gambaran yang bertentangan diperhatikan: di sini penyebaran intrakumpulan berlaku dan pengaruh faktor secara praktikal tidak hadir.

Analisis varians dibina atas prinsip yang sama, cuma ia tidak menggunakan varians, tetapi purata sisihan kuasa dua ( , , ), yang merupakan anggaran tidak berat sebelah bagi varians yang sepadan. Ia diperoleh dengan membahagikan jumlah sisihan kuasa dua dengan bilangan darjah kebebasan yang sepadan

Agregat secara keseluruhan;

Purata dalam kumpulan;

Purata antara kumpulan;

Purata keseluruhan untuk semua ukuran (untuk semua kumpulan);

Purata kumpulan untuk penggredan ke-j bagi faktor.

Jangkaan matematik untuk jumlah sisihan kuasa dua antara kumpulan dan antara kumpulan, masing-masing, dikira dengan formula: (Model faktor tetap),

.

E ( ) = E ( ) = , maka hipotesis nol H0 tentang ketiadaan perbezaan antara min disahkan, oleh itu, faktor yang dikaji tidak mempunyai kesan yang ketara (lihat Rajah 1, b). Jika nilai sebenar ujian F Fisher F= E ( ) /E ( ) akan lebih besar daripada kritikal maka hipotesis nol H0 pada aras keertian , hipotesis alternatif H1 ditolak dan diterima - tentang kesan ketara faktor rajah. 1, a. .

Analisis varians sehala

Analisis varians yang menganggap hanya satu pembolehubah dipanggil ANOVA Sehala.

Terdapat sekumpulan n objek pemerhatian dengan nilai terukur beberapa pembolehubah yang dikaji . setiap pembolehubah dipengaruhi oleh beberapa faktor kualiti Dengan beberapa tahap (penggredan) impak. Nilai pembolehubah yang diukur pada tahap faktor yang berbeza diberikan dalam Jadual 2 (ia juga boleh dibentangkan dalam bentuk matriks).

Jadual 2.

Bentuk jadual untuk menentukan data awal untuk analisis univariat

Nombor objek pemerhatian ()Nilai boleh ubah pada tahap (penggredan) faktor (paling rendah) (pendek)… (tertinggi)1 2 … n .Di sini, setiap tahap boleh mengandungi bilangan respons berbeza yang diukur pada satu tahap faktor, maka setiap lajur akan mempunyai nilainya sendiri . Ia dikehendaki menilai kepentingan pengaruh faktor ini terhadap pembolehubah yang dikaji. Untuk menyelesaikan masalah ini, model analisis varians satu faktor boleh digunakan. Model penyebaran satu faktor.

Nilai pembolehubah yang dikaji untuk objek ke-kecerapan di -tahap faktor ke-;

Purata kumpulan untuk -tahap faktor ke-;

Kesan disebabkan oleh pengaruh tahap -th faktor;

Komponen rawak, atau gangguan yang disebabkan oleh pengaruh faktor yang tidak terkawal. Jadi mari kita serlahkan batasan utama menggunakan ANOVA:

Kesamaan kepada sifar jangkaan matematik bagi komponen rawak: = 0.

Komponen rawak , dan oleh itu juga mempunyai taburan normal.

Bilangan penggredan faktor mestilah sekurang-kurangnya tiga.

Model ini, bergantung pada tahap faktor, menggunakan ujian Fisher F, membolehkan anda menguji salah satu hipotesis nol.

Apabila melakukan analisis varians untuk sampel yang berkaitan, adalah mungkin untuk menguji satu lagi hipotesis nol H0(u) - perbezaan individu antara objek pemerhatian dinyatakan tidak lebih daripada perbezaan disebabkan oleh sebab rawak.

Analisis varians sehala

(Pelaksanaan praktikal dalam IBM SPSS Statistics 20)

Pengkaji berminat dengan persoalan bagaimana sesuatu atribut berubah dalam keadaan berbeza tindakan pembolehubah (faktor). Kesan hanya satu pembolehubah (faktor) terhadap sifat yang dikaji dikaji. Kami telah mempertimbangkan contoh dari ekonomi; sekarang kami akan memberikan contoh dari psikologi, sebagai contoh, bagaimana masa untuk menyelesaikan masalah berubah di bawah keadaan motivasi subjek yang berbeza (rendah, sederhana, motivasi tinggi) atau dengan cara yang berbeza. membentangkan tugasan (secara lisan, bertulis atau dalam bentuk teks dengan graf dan ilustrasi), dalam keadaan yang berbeza bekerja dengan tugasan (sendirian, di dalam bilik dengan guru, di dalam bilik darjah). Dalam kes pertama, faktornya adalah motivasi, dalam kedua - tahap keterlihatan, dalam ketiga - faktor publisiti.

Dalam versi kaedah ini, sampel subjek yang berbeza didedahkan kepada pengaruh setiap penggredan. Mesti ada sekurang-kurangnya tiga penggredan faktor.

Contoh 1. Tiga kumpulan berbeza daripada enam subjek telah diberikan senarai sepuluh perkataan. Perkataan disampaikan kepada kumpulan pertama pada kadar yang rendah iaitu 1 perkataan setiap 5 saat, kepada kumpulan kedua pada kadar purata 1 perkataan setiap 2 saat, dan kepada kumpulan ketiga pada kadar yang tinggi iaitu 1 perkataan sesaat. Diramalkan bahawa prestasi pembiakan akan bergantung pada kelajuan pembentangan perkataan (Jadual 3).

Jadual 3

Bilangan perkataan yang diterbitkan semula

SubjekKumpulan 1 kelajuan rendahKumpulan 2 kelajuan sederhanaKumpulan 3 kelajuan tinggi

Kami merumuskan hipotesis: perbezaan dalam jumlah pembiakan perkataan antara kumpulan tidak lebih ketara daripada perbezaan rawak dalam setiap kumpulan: Perbezaan dalam pembiakan perkataan antara kumpulan lebih ketara daripada perbezaan rawak dalam setiap kumpulan.

Kami akan menjalankan penyelesaian dalam persekitaran SPSS mengikut algoritma berikut

Jom jalankan program SPSS

Masukkan nilai berangka dalam tetingkap data

nasi. 1. Memasukkan nilai dalam SPSS

Di tingkap Pembolehubah kami menerangkan semua data awal, mengikut keadaan

Tugasan

Rajah 2 Tetingkap Pembolehubah

Untuk kejelasan, dalam lajur label, kami menerangkan nama jadual

Dalam graf Nilai terangkan bilangan setiap kumpulan

Rajah 3 Label Nilai

Semua ini dilakukan untuk kejelasan, i.e. tetapan ini boleh diabaikan.

Dalam graf skala , dalam lajur kedua anda perlu meletakkan nilai nominal

Di tingkap data pesan analisis varians sehala menggunakan menu "Analisis". Perbandingan Purata

Analisis varians sehala…

Rajah 4 Fungsi ANOVA Sehala

Dalam kotak dialog yang dibuka Analisis varians sehala pilih pembolehubah bersandar dan tambahkannya senarai tanggungan , dan faktor pembolehubah dalam faktor tetingkap

Rajah 5 menyerlahkan senarai tanggungan dan faktor

Sediakan beberapa parameter untuk output data berkualiti tinggi

Rajah 6 Parameter untuk inferens data kualitatif

Pengiraan untuk algoritma ANOVA sehala yang dipilih bermula selepas mengklik okey

Pada penghujung pengiraan, hasil pengiraan dipaparkan dalam tetingkap paparan.

Kumpulan Statistik Deskriptif NAverage Std. Sisihan Std. Ralat 95% selang keyakinan untuk min Minimum Maksimum Jadual 2. Statistik deskriptif

Jadual Statistik deskriptif menunjukkan penunjuk utama untuk kelajuan dalam kumpulan dan jumlah nilainya.

Bilangan pemerhatian dalam setiap kumpulan dan jumlahnya

Min - min aritmetik pemerhatian dalam setiap kumpulan dan untuk semua kumpulan bersama

Std. Sisihan, Std. Ralat - sisihan piawai dan sisihan piawai

% selang keyakinan untuk min - selang ini lebih tepat untuk setiap kumpulan dan untuk semua kumpulan bersama-sama, daripada mengambil selang di bawah atau melebihi had ini.

Minimum, Maksimum - nilai minimum dan maksimum untuk setiap kumpulan yang subjek dengar

rawak varians faktor tunggal

Kriteria untuk kehomogenan kumpulan varians Statistik Livinast.st.1st.st.

Ujian kehomogenan Livin digunakan untuk menguji serakan untuk kehomogenan (homogeniti). AT kes ini ia mengesahkan tidak signifikan perbezaan antara varians, kerana nilai = 0.915, iaitu, jelas lebih besar daripada 0.05. Oleh itu, keputusan yang diperoleh menggunakan analisis varians diiktiraf sebagai betul.

Jadual analisis varians 1 arah menunjukkan keputusan DA 1 hala

Jumlah kuasa dua "antara kumpulan" ialah jumlah kuasa dua perbezaan antara min keseluruhan dan min dalam setiap kumpulan, ditimbang dengan bilangan objek dalam kumpulan

"Dalam kumpulan" ialah jumlah perbezaan kuasa dua antara min setiap kumpulan dan setiap nilai kumpulan itu

Lajur "St. St." mengandungi bilangan darjah kebebasan V:

Antara kumpulan (v=bilangan kumpulan - 1);

Intragroup (v=bilangan objek - bilangan kumpulan - 1);

"min kuasa dua" mengandungi nisbah jumlah kuasa dua kepada bilangan darjah kebebasan.

Lajur "F" menunjukkan nisbah min kuasa dua antara kumpulan kepada min kuasa dua dalam kumpulan.

Lajur "nilai" mengandungi nilai kebarangkalian bahawa perbezaan yang diperhatikan adalah rawak.

Jadual 4 Formula

Graf purata

Graf menunjukkan bahawa ia semakin berkurangan. Ia juga mungkin untuk menentukan daripada jadual Fk k1=2, k2=15 nilai jadual statistik ialah 3.68. Mengikut peraturan, jika , maka hipotesis nol diterima, jika tidak, hipotesis alternatif diterima. Untuk contoh kita (7.45>3.68), maka hipotesis alternatif diterima. Oleh itu, kembali kepada keadaan masalah, kita boleh membuat kesimpulan hipotesis nol ditolak dan alternatif diterima. : perbezaan jumlah perkataan antara kumpulan adalah lebih ketara berbanding perbezaan rawak dalam setiap kumpulan ). Itu. kelajuan penyampaian perkataan mempengaruhi jumlah pembiakannya.

Analisis varians sehala

(Pelaksanaan praktikal dalam Microsoft Office 2013)

Dalam contoh yang sama, pertimbangkan analisis varians sehala dalam Microsoft Office 2013

Penyelesaian masalah dalam Microsoft Excel

Jom buka Microsoft Excel.


Rajah 1. Menulis data ke Excel

Mari tukar data kepada format nombor. Untuk melakukan ini, pada tab utama terdapat item Format dan ia mempunyai subperenggan Format Sel . Tetingkap Format Sel muncul pada skrin. nasi. 2 Mari kita pilih Format angka dan data yang dimasukkan ditukar. Seperti yang ditunjukkan dalam Rajah.3

Rajah 2 Tukar kepada Format Angka

Rajah 3 Keputusan selepas penukaran

Pada tab data terdapat item analisis data mari klik padanya.

Mari pilih Analisis varians sehala

Rajah 6 Analisis data

Tetingkap analisis varians sehala akan muncul pada skrin untuk menjalankan analisis serakan data (Rajah 7). Mari konfigurasikan parameter

nasi. 7 Menetapkan parameter untuk analisis univariate

Klik tetikus dalam medan Selang input. Pilih julat sel B2::F9, data yang anda ingin analisis. Dalam medan Jarak Input kumpulan kawalan Input, julat yang ditentukan muncul.

Jika suis baris demi baris tidak ditetapkan dalam kumpulan kawalan data Input, kemudian pilihnya supaya program Excel menerima kumpulan data mengikut baris.

Pilihan Pilih kotak semak Label dalam Baris Pertama dalam kumpulan kawalan Input jika lajur pertama julat data yang dipilih mengandungi nama baris.

Dalam medan input Alpha kumpulan kawalan data Input, secara lalai, nilai 0.05 dipaparkan, yang dikaitkan dengan kebarangkalian ralat dalam analisis varians.

Jika suis selang output tidak ditetapkan dalam kumpulan kawalan Parameter Output, kemudian tetapkannya atau pilih suis lembaran kerja baharu supaya data dipindahkan ke helaian baharu.

Klik butang OK untuk menutup tetingkap ANOVA Sehala. Keputusan analisis varians akan muncul (Rajah 8).

Rajah 8 Output data

Dalam julat sel A4:E7 adalah hasilnya Statistik deskriptif. Baris 4 mengandungi nama parameter, baris 5 - 7 - nilai statistik dikira mengikut kelompok. Dalam lajur "Akaun" ialah bilangan ukuran, dalam lajur "Jumlah" - jumlah nilai, dalam lajur "Purata" - purata nilai aritmetik, dalam lajur "Penyebaran" - penyebaran.

Keputusan yang diperolehi menunjukkan bahawa purata beban pecah tertinggi adalah dalam kelompok No. 1, dan serakan beban pecah terbesar adalah dalam kelompok No. 2, No. 1.

Julat sel A10:G15 memaparkan maklumat mengenai kepentingan percanggahan antara kumpulan data. Baris 11 mengandungi nama analisis parameter varians, baris 12 - hasil pemprosesan antara kumpulan, baris 13 - hasil pemprosesan intrakumpulan, dan baris 15 - jumlah nilai kedua-dua baris ini.

Lajur SS mengandungi nilai variasi, i.e. hasil tambah kuasa dua atas semua sisihan. Variasi, seperti serakan, mencirikan penyebaran data.

Lajur df mengandungi nilai bilangan darjah kebebasan. Nombor-nombor ini menunjukkan bilangan sisihan bebas yang mana varians akan dikira. Sebagai contoh, bilangan darjah kebebasan antara kumpulan adalah sama dengan perbezaan antara bilangan kumpulan data dan satu. Bagaimana lebih banyak nombor darjah kebebasan, semakin tinggi kebolehpercayaan parameter serakan. Data darjah kebebasan dalam jadual menunjukkan bahawa keputusan dalam kumpulan lebih dipercayai daripada parameter antara kumpulan.

Lajur MS mengandungi nilai serakan, yang ditentukan oleh nisbah variasi dan bilangan darjah kebebasan. Serakan mencirikan tahap serakan data, tetapi tidak seperti magnitud variasi, ia tidak mempunyai kecenderungan langsung untuk meningkat dengan peningkatan bilangan darjah kebebasan. Jadual menunjukkan bahawa varians antara kumpulan adalah jauh lebih besar daripada varians intrakumpulan.

Lajur F mengandungi nilai statistik F, dikira dengan nisbah varians antara kumpulan dan antara kumpulan.

Lajur F-kritikal mengandungi nilai kritikal F yang dikira daripada bilangan darjah kebebasan dan nilai Alpha. F-statistik dan nilai F-kritikal menggunakan ujian Fisher-Snedekor.

Jika statistik F lebih besar daripada nilai kritikal F, maka boleh dikatakan bahawa perbezaan antara kumpulan data tidak rawak. mereka. pada tahap kepentingan α = 0 .05 (dengan kebolehpercayaan 0.95), hipotesis nol ditolak dan alternatifnya diterima: bahawa kelajuan pembentangan perkataan mempengaruhi volum pembiakannya. Lajur P-nilai mengandungi kebarangkalian bahawa perbezaan antara kumpulan adalah rawak. Oleh kerana kebarangkalian ini sangat kecil dalam jadual, sisihan antara kumpulan adalah tidak rawak.

Perbandingan IBM SPSS Statistics 20 dan Microsoft Office 2013

atur cara rawak varians satu faktor

Mari kita lihat output program, untuk ini kita akan melihat semula tangkapan skrin.

Analisis sehala bagi kumpulan varians Jumlah Kuasa Dua St.Lm Min Square FZn Antara kumpulan31.444215.7227.447.006 Dalam kumpulan31.667152.111Jumlah63.11117

Oleh itu, program IBM SPSS Statistics 20 menghasilkan skor yang lebih baik, boleh membundarkan nombor, membina graf visual(cm. penyelesaian yang lengkap) yang mana anda boleh menentukan jawapannya, ia menerangkan dengan lebih terperinci kedua-dua keadaan masalah dan penyelesaiannya. Microsoft Office 2013 mempunyai kelebihannya, pertama sekali, sudah tentu, kelazimannya, kerana Microsoft Office 2013 dipasang di hampir setiap komputer, ia memaparkan Fcritical, yang tidak disediakan dalam Statistik SPSS, dan ia juga mudah dan mudah untuk dikira di sana. Namun, kedua-dua program ini sangat sesuai untuk menyelesaikan masalah untuk analisis varians sehala, setiap daripadanya mempunyai kebaikan dan keburukan, tetapi jika anda mengira tugas besar dengan lebih banyak syarat akan mengesyorkan Statistik SPSS.

Kesimpulan

Analisis varians digunakan dalam semua bidang penyelidikan saintifik, di mana ia adalah perlu untuk menganalisis pengaruh pelbagai faktor ke atas pembolehubah yang dikaji. AT dunia moden Terdapat banyak tugas untuk analisis faktor tunggal bagi varians dalam ekonomi, psikologi, dan biologi. Hasil daripada kajian bahan teori, didapati bahawa asas analisis varians ialah teorem penambahan varians, daripada banyak pakej perisian di mana radas analisis varians dilaksanakan, yang terbaik dipilih dan dimasukkan ke dalam kerja. Terima kasih kepada kemunculan teknologi baru, setiap daripada kita boleh menjalankan penyelidikan (keputusan), sambil menghabiskan lebih sedikit masa dan usaha untuk pengiraan, menggunakan komputer. Dalam proses kerja, matlamat ditetapkan, tugas yang dicapai.

senarai sastera

Sidorenko, E.V. Kaedah pemprosesan matematik dalam psikologi [Teks] / St. Petersburg. 2011. - 256 hlm.

Statistik matematik untuk ahli psikologi Ermolaev O.Yu [Teks] / Moscow_2009 -336s

Kuliah 7. Statistik analisis [ sumber elektronik]. , Tarikh capaian: 05/14/14

Teori kebarangkalian dan statistik matematik [Teks] / Gmurman V.E. 2010 -479s

Semua orang secara semula jadi mencari ilmu. (Aristotle. Metafizik)

Analisis varians

Gambaran keseluruhan pengenalan

Dalam bahagian ini, kami akan menyemak kaedah asas, andaian dan terminologi ANOVA.

Perhatikan bahawa dalam kesusasteraan Inggeris, analisis varians biasanya dipanggil analisis variasi. Oleh itu, secara ringkasnya, di bawah ini kadangkala kita akan menggunakan istilah tersebut ANOVA (An alysis o f va percampuran) untuk ANOVA konvensional dan istilah MANOVA untuk analisis pelbagai variasi bagi varians. Dalam bahagian ini, kita akan secara berurutan mempertimbangkan idea-idea utama analisis varians ( ANOVA), analisis kovarians ( ANCOVA), analisis pelbagai variasi varians ( MANOVA) dan analisis kovarians multivariat ( MANCOVA). Selepas perbincangan ringkas tentang merit analisis kontras dan kriteria post hoc Mari kita pertimbangkan andaian yang berdasarkan kaedah analisis varians. Menjelang penghujung bahagian ini, kelebihan pendekatan multivariate untuk analisis langkah berulang dijelaskan berbanding pendekatan satu dimensi tradisional.

Idea Utama

Tujuan analisis varians. Tujuan utama analisis varians adalah untuk mengkaji kepentingan perbezaan antara min. Bab (bab 8) mengandungi pengenalan ringkas dalam kajian kepentingan statistik. Jika anda hanya membandingkan cara dua sampel, analisis varians akan memberikan hasil yang sama seperti analisis biasa. t- kriteria untuk sampel bebas (jika dua kumpulan objek atau pemerhatian bebas dibandingkan), atau t- kriteria untuk sampel bersandar (jika dua pembolehubah dibandingkan pada set objek atau pemerhatian yang sama). Jika anda tidak biasa dengan kriteria ini, kami mengesyorkan anda merujuk kepada gambaran keseluruhan pengenalan bab tersebut (Bab 9).

Dari mana datangnya nama itu Analisis varians? Ia mungkin kelihatan aneh bahawa prosedur untuk membandingkan cara dipanggil analisis varians. Sebenarnya, ini disebabkan oleh fakta bahawa apabila kita mengkaji kepentingan statistik perbezaan antara min, kita sebenarnya menganalisis varians.

Membahagikan hasil tambah kuasa dua

Untuk saiz sampel n varians sampel dikira sebagai jumlah sisihan kuasa dua daripada min sampel dibahagikan dengan n-1 (saiz sampel tolak satu). Oleh itu, untuk saiz sampel tetap n, varians ialah fungsi jumlah kuasa dua (penyimpangan), dilambangkan, untuk ringkas, SS(dari bahasa Inggeris Sum of Squares - Sum of Squares). Analisis varians adalah berdasarkan pembahagian (atau pemisahan) varians kepada bahagian. Pertimbangkan set data berikut:

Cara kedua-dua kumpulan adalah berbeza secara ketara (masing-masing 2 dan 6). Jumlah sisihan kuasa dua dalam daripada setiap kumpulan ialah 2. Menambahnya bersama-sama, kita mendapat 4. Jika kita mengulangi pengiraan ini tidak termasuk keahlian kumpulan, iaitu jika kita mengira SS berdasarkan min gabungan kedua-dua sampel, kita mendapat 28. Dalam erti kata lain, varians (jumlah kuasa dua) berdasarkan kebolehubahan dalam kumpulan menghasilkan nilai yang jauh lebih kecil berbanding apabila dikira berdasarkan jumlah kebolehubahan (berbanding dengan keseluruhan min). Sebabnya adalah jelas perbezaan yang ketara antara purata, dan perbezaan antara purata ini menerangkan perbezaan sedia ada antara jumlah kuasa dua. Memang kalau kita guna modul Analisis varians, keputusan berikut akan diperolehi:

Seperti yang dapat dilihat daripada jadual, jumlah jumlah kuasa dua SS=28 dibahagikan kepada jumlah kuasa dua disebabkan oleh dalam kumpulan kebolehubahan ( 2+2=4 ; lihat baris kedua jadual) dan hasil tambah kuasa dua disebabkan oleh perbezaan nilai min. (28-(2+2)=24; lihat baris pertama jadual).

SS kesilapan danSS kesan. kebolehubahan dalam kumpulan ( SS) biasanya dipanggil varians kesilapan. Ini bermakna ia biasanya tidak boleh diramal atau dijelaskan apabila eksperimen dijalankan. Selain itu, SS kesan(atau kebolehubahan antara kumpulan) boleh dijelaskan dengan perbezaan antara min dalam kumpulan yang dikaji. Dengan kata lain, tergolong dalam kumpulan tertentu menerangkan kebolehubahan antara kumpulan, kerana kita tahu bahawa kumpulan ini mempunyai cara yang berbeza.

Semakan kepentingan. Idea utama ujian untuk kepentingan statistik dibincangkan dalam bab Konsep asas statistik(Bab 8). Bab yang sama menerangkan sebab mengapa banyak ujian menggunakan nisbah varians yang dijelaskan dan tidak dapat dijelaskan. Contoh penggunaan ini ialah analisis varians itu sendiri. Ujian kepentingan dalam ANOVA adalah berdasarkan membandingkan varians disebabkan oleh variasi antara kumpulan (dipanggil min kesan segi empat sama atau CIKKesan) dan penyebaran disebabkan oleh penyebaran dalam kumpulan (dipanggil min ralat kuasa dua atau CIKralat). Jika hipotesis nol adalah benar (kesamaan min dalam dua populasi), maka kita boleh menjangkakan perbezaan yang agak kecil dalam min sampel disebabkan oleh kebolehubahan rawak. Oleh itu, di bawah hipotesis nol, varians dalam kumpulan secara praktikal akan bertepatan dengan jumlah varians yang dikira tanpa mengambil kira keahlian kumpulan. Varians dalam kumpulan yang terhasil boleh dibandingkan menggunakan F- ujian yang memeriksa sama ada nisbah varians adalah lebih besar daripada 1. Dalam contoh di atas, F- Ujian menunjukkan bahawa perbezaan antara min adalah signifikan secara statistik.

Logik asas ANOVA. Kesimpulannya, kita boleh mengatakan bahawa tujuan analisis varians adalah untuk menguji kepentingan statistik perbezaan antara min (untuk kumpulan atau pembolehubah). Semakan ini dijalankan menggunakan analisis varians, i.e. dengan membahagikan jumlah varians (variasi) kepada bahagian, satu daripadanya disebabkan oleh ralat rawak (iaitu, kebolehubahan intrakumpulan), dan yang kedua dikaitkan dengan perbezaan nilai min. Komponen terakhir varians kemudiannya digunakan untuk menganalisis kepentingan statistik perbezaan antara min. Sekiranya perbezaan ini ketara, hipotesis nol ditolak dan hipotesis alternatif bahawa terdapat perbezaan antara min diterima.

Pembolehubah bersandar dan bebas. Pembolehubah yang nilainya ditentukan oleh pengukuran semasa eksperimen (contohnya, skor yang dijaringkan pada ujian) dipanggil bergantung pembolehubah. Pembolehubah yang boleh dimanipulasi dalam eksperimen (contohnya, kaedah latihan atau kriteria lain yang membolehkan anda membahagikan pemerhatian kepada kumpulan) dipanggil faktor atau bebas pembolehubah. Konsep-konsep ini diterangkan dengan lebih terperinci dalam bab Konsep asas statistik(Bab 8).

Analisis pelbagai variasi bagi varians

Dalam contoh mudah di atas, anda boleh mengira dengan segera sampel ujian-t bebas menggunakan pilihan modul yang sesuai Statistik dan jadual asas. Keputusan yang diperoleh, sudah tentu, bertepatan dengan keputusan analisis varians. Walau bagaimanapun, analisis varians mengandungi alat teknikal yang fleksibel dan berkuasa yang boleh digunakan untuk kajian yang lebih kompleks.

Banyak faktor. Dunia sememangnya kompleks dan pelbagai dimensi. Situasi di mana beberapa fenomena diterangkan sepenuhnya oleh satu pembolehubah adalah sangat jarang berlaku. Sebagai contoh, jika kita cuba belajar cara menanam tomato besar, kita harus mempertimbangkan faktor yang berkaitan dengan struktur genetik tumbuhan, jenis tanah, cahaya, suhu, dll. Oleh itu, apabila menjalankan eksperimen biasa, anda perlu berurusan dengan sejumlah besar faktor. Sebab utama mengapa penggunaan analisis varians adalah lebih baik daripada perbandingan berulang dua sampel apabila tahap yang berbeza faktor melalui t- kriteria adalah bahawa analisis varians adalah lebih berkesan dan, untuk sampel kecil, lebih bermaklumat.

Pengurusan faktor. Mari kita anggap bahawa dalam contoh analisis dua sampel yang dibincangkan di atas, kita menambah satu lagi faktor, sebagai contoh, Lantai- Jantina. Biarkan setiap kumpulan terdiri daripada 3 lelaki dan 3 perempuan. Reka bentuk eksperimen ini boleh dipersembahkan dalam bentuk jadual 2 dengan 2:

Eksperimen. Kumpulan 1 Eksperimen. Kumpulan 2
Lelaki2 6
3 7
1 5
Purata2 6
perempuan4 8
5 9
3 7
Purata4 8

Sebelum melakukan pengiraan, anda boleh melihat bahawa dalam contoh ini jumlah varians mempunyai sekurang-kurangnya tiga sumber:

(1) ralat rawak (dalam varians kumpulan),

(2) kebolehubahan yang dikaitkan dengan keahlian dalam kumpulan eksperimen, dan

(3) kebolehubahan disebabkan oleh jantina objek yang diperhatikan.

(Perhatikan bahawa terdapat satu lagi sumber kebolehubahan yang mungkin - interaksi faktor, yang akan kita bincangkan kemudian). Apa yang berlaku jika kita tidak sertakan lantaijantina sebagai faktor dalam analisis dan mengira yang biasa t-kriteria? Jika kita mengira jumlah kuasa dua, mengabaikan lantai -jantina(iaitu, menggabungkan objek berlainan jantina ke dalam satu kumpulan apabila mengira varians dalam kumpulan, sambil memperoleh jumlah kuasa dua untuk setiap kumpulan yang sama dengan SS=10, dan jumlah keseluruhan segi empat sama SS= 10+10 = 20), maka kita mendapat nilai serakan intrakumpulan yang lebih besar daripada analisis yang lebih tepat dengan pembahagian tambahan kepada subkumpulan mengikut separuh jantina(dalam kes ini, min antara kumpulan akan bersamaan dengan 2, dan jumlah jumlah kuasa dua dalam kumpulan akan sama dengan SS = 2+2+2+2 = 8). Perbezaan ini disebabkan oleh fakta bahawa nilai min untuk lelaki - jantan kurang daripada purata untuk wanita -perempuan, dan perbezaan min ini meningkatkan jumlah kebolehubahan dalam kumpulan jika jantina tidak diambil kira. Mengawal varians ralat meningkatkan sensitiviti (kuasa) ujian.

Contoh ini menunjukkan satu lagi kelebihan analisis varians berbanding analisis konvensional. t-kriteria untuk dua sampel. Analisis varians membolehkan anda mengkaji setiap faktor dengan mengawal nilai faktor lain. Ini, sebenarnya, adalah sebab utama kuasa statistiknya yang lebih besar (saiz sampel yang lebih kecil diperlukan untuk mendapatkan hasil yang bermakna). Atas sebab ini, analisis varians, walaupun pada sampel kecil, memberikan hasil statistik yang lebih ketara daripada yang mudah. t- kriteria.

Kesan interaksi

Terdapat satu lagi kelebihan menggunakan ANOVA berbanding analisis konvensional. t- kriteria: analisis varians membolehkan anda untuk mengesan interaksi antara faktor dan oleh itu membolehkan model yang lebih kompleks dikaji. Untuk menggambarkan, pertimbangkan contoh lain.

Kesan utama, interaksi berpasangan (dua faktor). Anggaplah terdapat dua kumpulan pelajar, dan secara psikologi pelajar kumpulan pertama ditala untuk memenuhi tugasan yang diberikan dan lebih bermatlamat daripada pelajar kumpulan kedua, yang terdiri daripada pelajar yang lebih malas. Mari bahagikan setiap kumpulan secara rawak kepada separuh dan tawarkan satu separuh daripada setiap kumpulan tugas yang sukar, dan satu lagi tugas yang mudah. Selepas itu, kami mengukur sejauh mana pelajar bekerja keras dalam tugasan ini. Purata untuk kajian (fiksyen) ini ditunjukkan dalam jadual:

Apakah kesimpulan yang boleh dibuat daripada keputusan ini? Adakah mungkin untuk membuat kesimpulan bahawa: (1) pelajar bekerja lebih keras pada tugas yang sukar; (2) adakah pelajar yang bermotivasi bekerja lebih keras daripada yang malas? Tiada satu pun daripada kenyataan ini menggambarkan intipati sistematik purata yang diberikan dalam jadual. Menganalisis keputusan, adalah lebih tepat untuk mengatakannya tugas yang sukar hanya pelajar yang bermotivasi bekerja lebih keras, manakala hanya pelajar yang malas bekerja lebih keras pada tugas yang mudah. Dengan kata lain, sifat pelajar dan kerumitan tugas berinteraksi satu sama lain mempengaruhi jumlah usaha yang diperlukan. Itu contoh interaksi pasangan antara sifat pelajar dan kerumitan tugas. Perhatikan bahawa pernyataan 1 dan 2 menerangkan kesan utama.

Interaksi urutan yang lebih tinggi. Walaupun interaksi berpasangan agak mudah untuk dijelaskan, interaksi peringkat tinggi adalah lebih sukar untuk dijelaskan. Mari kita bayangkan bahawa dalam contoh yang dipertimbangkan di atas, satu lagi faktor diperkenalkan lantai -Jantina dan kami mendapat jadual purata berikut:

Apakah kesimpulan yang boleh dibuat sekarang daripada keputusan yang diperolehi? Plot min memudahkan untuk mentafsir kesan yang kompleks. Analisis modul varians membolehkan anda membina graf ini dengan hampir satu klik.

Imej dalam graf di bawah mewakili interaksi tiga hala yang sedang dikaji.

Melihat graf, kita boleh memberitahu bahawa terdapat interaksi antara sifat dan kesukaran ujian untuk wanita: wanita yang bermotivasi bekerja lebih keras pada tugas yang sukar daripada yang mudah. Pada lelaki, interaksi yang sama diterbalikkan. Dapat dilihat bahawa penerangan tentang interaksi antara faktor menjadi lebih mengelirukan.

Cara umum penerangan tentang interaksi. Dalam kes umum, interaksi antara faktor digambarkan sebagai perubahan dalam satu kesan di bawah pengaruh yang lain. Dalam contoh yang dibincangkan di atas, interaksi dua faktor boleh digambarkan sebagai perubahan dalam kesan utama faktor yang mencirikan kerumitan tugas, di bawah pengaruh faktor yang menggambarkan watak pelajar. Untuk interaksi tiga faktor dari perenggan sebelumnya, kita boleh mengatakan bahawa interaksi dua faktor (kerumitan tugas dan watak pelajar) berubah di bawah pengaruh jantinaJantina. Jika interaksi empat faktor dikaji, kita boleh mengatakan bahawa interaksi tiga faktor berubah di bawah pengaruh faktor keempat, i.e. terdapat pelbagai jenis interaksi pada tahap faktor keempat yang berbeza. Ternyata di banyak kawasan interaksi lima atau bahkan lebih faktor tidak luar biasa.

Pelan yang kompleks

Pelan antara kumpulan dan antara kumpulan (pelan ukuran semula)

Apabila membandingkan dua kumpulan yang berbeza, satu biasanya menggunakan t- kriteria untuk sampel bebas (dari modul Statistik dan jadual asas). Apabila dua pembolehubah dibandingkan pada set objek yang sama (pemerhatian), ia digunakan t-kriteria untuk sampel bergantung. Untuk analisis varians, ia juga penting sama ada sampel bergantung atau tidak. Jika terdapat pengukuran berulang bagi pembolehubah yang sama (dalam keadaan berbeza atau dalam masa yang berbeza) untuk objek yang sama, kemudian mereka berkata tentang kehadiran faktor langkah berulang(juga dipanggil faktor intrakumpulan kerana jumlah kuasa dua dalam kumpulan dikira untuk menilai kepentingannya). Jika kumpulan objek yang berbeza dibandingkan (contohnya, lelaki dan wanita, tiga strain bakteria, dsb.), maka perbezaan antara kumpulan diterangkan. faktor antara kumpulan. Kaedah untuk mengira kriteria keertian bagi dua jenis faktor yang diterangkan adalah berbeza, tetapi logik dan tafsiran amnya adalah sama.

Pelan antara dan dalam kumpulan. Dalam kebanyakan kes, percubaan memerlukan kemasukan kedua-dua faktor antara kumpulan dan faktor ukuran berulang dalam reka bentuk. Sebagai contoh, kemahiran matematik pelajar perempuan dan lelaki diukur (di mana lantai -Jantina-faktor antara kumpulan) pada awal dan akhir semester. Dua dimensi kemahiran setiap pelajar membentuk faktor dalam kumpulan (faktor ukuran berulang). Tafsiran kesan utama dan interaksi untuk faktor langkah antara kumpulan dan berulang adalah sama, dan kedua-dua jenis faktor jelas boleh berinteraksi antara satu sama lain (contohnya, wanita memperoleh kemahiran semasa semester, dan lelaki kehilangannya).

Pelan yang tidak lengkap (bersarang).

Dalam banyak kes, kesan interaksi boleh diabaikan. Ini berlaku sama ada apabila diketahui bahawa tiada kesan interaksi dalam populasi, atau apabila pelaksanaan sepenuhnya faktorial rancangan adalah mustahil. Sebagai contoh, kesan empat bahan tambahan bahan api terhadap penggunaan bahan api sedang dikaji. Empat kereta dan empat pemandu dipilih. penuh faktorial percubaan memerlukan setiap kombinasi: tambahan, pemandu, kereta, muncul sekurang-kurangnya sekali. Ini memerlukan sekurang-kurangnya 4 x 4 x 4 = 64 kumpulan ujian, yang terlalu memakan masa. Di samping itu, hampir tidak terdapat sebarang interaksi antara pemandu dan bahan tambahan bahan api. Dengan ini, anda boleh menggunakan pelan tersebut segi empat sama latin, yang mengandungi hanya 16 kumpulan ujian (empat bahan tambahan ditetapkan oleh huruf A, B, C dan D):

Petak Latin diterangkan dalam kebanyakan buku reka bentuk eksperimen (cth Hays, 1988; Lindman, 1974; Milliken dan Johnson, 1984; Winer, 1962) dan tidak akan dibincangkan secara terperinci di sini. Perhatikan bahawa petak Latin adalah bukannpenuh rancangan yang tidak termasuk semua kombinasi peringkat faktor. Sebagai contoh, pemandu 1 memandu kereta 1 dengan bahan tambahan A sahaja, pemandu 3 memandu kereta 1 dengan bahan tambahan C sahaja. Tahap faktor bahan tambahan ( A, B, C dan D) bersarang dalam sel jadual kereta x pemandu - seperti telur dalam sarang. Peraturan mnemonik ini berguna untuk memahami sifat bersarang atau bersarang rancangan. Modul Analisis varians menyediakan cara mudah analisis rancangan jenis ini.

Analisis kovarians

Idea utama

Dalam bab Idea Utama terdapat perbincangan ringkas tentang idea mengawal faktor dan bagaimana kemasukan faktor tambahan dapat mengurangkan jumlah ralat kuasa dua dan meningkatkan kuasa statistik reka bentuk. Semua ini boleh diperluaskan kepada pembolehubah dengan set nilai berterusan. Apabila pembolehubah berterusan tersebut dimasukkan sebagai faktor dalam reka bentuk, ia dipanggil kovariat.

Kovariat tetap

Katakan kita sedang membandingkan kemahiran matematik dua kumpulan pelajar yang diajar daripada dua buku teks yang berbeza. Mari kita anggap juga bahawa kita mempunyai data kecerdasan kecerdasan (IQ) untuk setiap pelajar. Kita boleh menganggap bahawa IQ berkaitan dengan kemahiran matematik dan menggunakan maklumat ini. Bagi setiap dua kumpulan pelajar, pekali korelasi antara IQ dan kemahiran matematik boleh dikira. Dengan menggunakan pekali korelasi ini, adalah mungkin untuk membezakan antara bahagian varians dalam kumpulan yang dijelaskan oleh pengaruh IQ dan bahagian varians yang tidak dapat dijelaskan (lihat juga Konsep asas statistik(bab 8) dan Statistik dan jadual asas(Bab 9)). Baki pecahan varians digunakan dalam analisis sebagai varians ralat. Sekiranya terdapat korelasi antara IQ dan kemahiran matematik, maka varians ralat boleh dikurangkan dengan ketara. SS/(n-1) .

Kesan kovariat padaF- kriteria. F- kriteria menilai kepentingan statistik perbezaan antara nilai min dalam kumpulan, manakala nisbah varians antara kumpulan dikira ( CIKkesan) kepada varians ralat ( CIKralat) . Sekiranya CIKralat menurun, sebagai contoh, apabila mengambil kira faktor IQ, nilai F bertambah.

Banyak kovariat. Penaakulan yang digunakan di atas untuk kovariat tunggal (IQ) dengan mudah meluas kepada berbilang kovariat. Sebagai contoh, sebagai tambahan kepada IQ, anda boleh memasukkan pengukuran motivasi, pemikiran spatial, dll. Daripada pekali korelasi biasa, ia menggunakan pelbagai faktor korelasi.

Apabila nilaiF -kriteria berkurangan. Kadangkala pengenalan kovariat dalam reka bentuk eksperimen mengurangkan nilai F- kriteria . Ini biasanya menunjukkan bahawa kovariat bukan sahaja dikaitkan dengan pembolehubah bersandar (seperti kemahiran matematik) tetapi juga dengan faktor (seperti buku teks yang berbeza). Katakan IQ diukur pada akhir semester, selepas hampir latihan tahunan dua kumpulan pelajar pada dua buku teks yang berbeza. Walaupun pelajar dibahagikan kepada kumpulan secara rawak, mungkin ternyata perbezaan dalam buku teks sangat besar sehingga kedua-dua IQ dan kemahiran matematik dalam kumpulan yang berbeza akan sangat berbeza. Dalam kes ini, kovariat bukan sahaja mengurangkan varians ralat, tetapi juga varians antara kumpulan. Dengan kata lain, selepas mengawal perbezaan IQ antara kumpulan, perbezaan kemahiran matematik tidak lagi ketara. Ia boleh dikatakan sebaliknya. Selepas "menghapuskan" pengaruh IQ, pengaruh buku teks terhadap perkembangan kemahiran matematik secara tidak sengaja dikecualikan.

Purata diselaraskan. Apabila kovariat mempengaruhi faktor antara kumpulan, seseorang harus mengira purata terlaras, iaitu cara sedemikian, yang diperolehi selepas mengalih keluar semua anggaran kovariat.

Interaksi antara kovariat dan faktor. Sama seperti interaksi antara faktor diterokai, interaksi antara kovariat dan antara kumpulan faktor boleh diterokai. Katakan salah satu buku teks amat sesuai untuk pelajar pintar. Buku teks kedua membosankan untuk pelajar pintar, dan buku teks yang sama sukar untuk pelajar kurang pintar. Hasilnya, terdapat korelasi positif antara IQ dan hasil pembelajaran dalam kumpulan pertama (pelajar pintar, hasil yang lebih baik) dan sifar atau sedikit korelasi negatif dalam kumpulan kedua (daripada pelajar yang lebih bijak, semakin kecil kemungkinannya untuk memperoleh kemahiran matematik daripada buku teks kedua). Dalam beberapa kajian, situasi ini dibincangkan sebagai contoh pelanggaran andaian analisis kovarians. Walau bagaimanapun, oleh kerana modul Analisis Varians menggunakan kaedah analisis kovarians yang paling biasa, adalah mungkin, khususnya, untuk menilai kepentingan statistik interaksi antara faktor dan kovariat.

Kovariat boleh ubah

Walaupun kovariat tetap dibincangkan agak kerap dalam buku teks, kovariat pembolehubah kurang kerap disebut. Biasanya, apabila menjalankan eksperimen dengan pengukuran berulang, kami berminat dengan perbezaan dalam pengukuran kuantiti yang sama pada titik masa yang berbeza. Iaitu, kami berminat dengan kepentingan perbezaan ini. Jika pengukuran kovariat dijalankan pada masa yang sama dengan ukuran pembolehubah bersandar, korelasi antara kovariat dan pembolehubah bersandar boleh dikira.

Sebagai contoh, anda boleh belajar minat dalam matematik dan kemahiran matematik pada awal dan akhir semester. Adalah menarik untuk menyemak sama ada perubahan minat dalam matematik dikaitkan dengan perubahan dalam kemahiran matematik.

Modul Analisis varians dalam STATISTIK secara automatik menilai kepentingan statistik perubahan dalam kovariat dalam rancangan tersebut, jika boleh.

Reka Bentuk Multivariat: ANOVA dan Analisis Kovarian Pelbagai

Rancangan antara kumpulan

Semua contoh yang dipertimbangkan sebelum ini termasuk hanya satu pembolehubah bersandar. Apabila terdapat beberapa pembolehubah bersandar pada masa yang sama, hanya kerumitan pengiraan meningkat, dan kandungan serta prinsip asas tidak berubah.

Sebagai contoh, kajian sedang dijalankan ke atas dua buku teks yang berbeza. Pada masa yang sama, kejayaan pelajar dalam pelajaran fizik dan matematik dipelajari. Dalam kes ini, terdapat dua pembolehubah bersandar dan anda perlu mengetahui bagaimana dua buku teks berbeza mempengaruhinya secara serentak. Untuk melakukan ini, anda boleh menggunakan analisis varians multivariate (MANOVA). Daripada satu dimensi F kriteria, multidimensi F ujian (Wilks l-test) berdasarkan perbandingan matriks kovarians ralat dan matriks kovarians antara kumpulan.

Jika pembolehubah bersandar dikorelasi antara satu sama lain, maka korelasi ini perlu diambil kira semasa mengira ujian keertian. Jelas sekali, jika ukuran yang sama diulang dua kali, maka tiada yang baru boleh diperoleh dalam kes ini. Jika dimensi yang berkorelasi dengannya ditambah kepada dimensi sedia ada, maka beberapa maklumat baharu diperoleh, tetapi pembolehubah baharu mengandungi maklumat berlebihan, yang dicerminkan dalam kovarians antara pembolehubah.

Tafsiran keputusan. Jika kriteria multivariat keseluruhan adalah signifikan, kita boleh membuat kesimpulan bahawa kesan yang sepadan (contohnya jenis buku teks) adalah signifikan. Namun, mereka bangun soalan seterusnya. Adakah jenis buku teks mempengaruhi peningkatan hanya kemahiran matematik, hanya kemahiran fizikal, atau kedua-duanya. Malah, selepas memperoleh kriteria multivariate yang bermakna, untuk kesan atau interaksi utama tunggal, satu dimensi F kriteria. Dalam erti kata lain, pembolehubah bersandar yang menyumbang kepada kepentingan ujian multivariate diperiksa secara berasingan.

Pelan dengan ukuran berulang

Jika kemahiran matematik dan fizikal pelajar diukur pada awal semester dan pada akhir, maka ini adalah pengukuran berulang. Kajian tentang kriteria kepentingan dalam rancangan tersebut adalah perkembangan logik bagi kes satu dimensi. Ambil perhatian bahawa kaedah ANOVA multivariat juga biasa digunakan untuk menyiasat kepentingan faktor ukuran berulang univariat yang mempunyai lebih daripada dua tahap. Permohonan yang sepadan akan dibincangkan kemudian dalam bahagian ini.

Penjumlahan nilai pembolehubah dan analisis pelbagai variasi bagi varians

Malah pengguna berpengalaman ANOVA univariat dan multivariate sering keliru dengan mendapatkan hasil yang berbeza apabila menggunakan ANOVA multivariat kepada, katakan, tiga pembolehubah dan apabila menggunakan ANOVA univariat kepada jumlah tiga pembolehubah sebagai pembolehubah tunggal.

Idea penjumlahan pembolehubah ialah setiap pembolehubah mengandungi beberapa pembolehubah benar, yang disiasat, serta ralat rawak ukuran. Oleh itu, apabila purata nilai pembolehubah, ralat pengukuran akan lebih hampir kepada 0 untuk semua ukuran dan nilai purata akan lebih dipercayai. Malah, dalam kes ini, menggunakan ANOVA kepada jumlah pembolehubah adalah munasabah dan teknik yang berkuasa. Walau bagaimanapun, jika pembolehubah bersandar bersifat multivariate, penjumlahan nilai pembolehubah adalah tidak sesuai.

Sebagai contoh, biarkan pembolehubah bersandar terdiri daripada empat ukuran kejayaan dalam masyarakat. Setiap penunjuk mencirikan sisi bebas sepenuhnya Aktiviti manusia(contohnya, kejayaan profesional, kejayaan perniagaan, kesejahteraan keluarga, dsb.). Menambah pembolehubah ini bersama-sama adalah seperti menambah epal dan oren. Jumlah pembolehubah ini tidak akan menjadi ukuran univariate yang sesuai. Oleh itu, data sedemikian mesti dianggap sebagai penunjuk multidimensi dalam analisis pelbagai variasi bagi varians.

Analisis kontras dan ujian post hoc

Mengapakah set cara individu dibandingkan?

Biasanya hipotesis tentang data eksperimen dirumus bukan hanya dari segi kesan utama atau interaksi. Contohnya ialah hipotesis berikut: buku teks tertentu meningkatkan kemahiran matematik hanya dalam kalangan pelajar lelaki, manakala buku teks lain lebih kurang berkesan untuk kedua-dua jantina, tetapi masih kurang berkesan untuk lelaki. Ia boleh diramalkan bahawa prestasi buku teks berinteraksi dengan jantina pelajar. Walau bagaimanapun, ramalan ini juga terpakai alam semula jadi interaksi. Perbezaan yang ketara antara jantina dijangka untuk pelajar dalam satu buku, dan secara praktikalnya keputusan bebas jantina untuk pelajar dalam buku lain. Hipotesis jenis ini biasanya diterokai menggunakan analisis kontras.

Analisis Kontras

Ringkasnya, analisis kontras membolehkan kita menilai kepentingan statistik beberapa kombinasi linear kesan kompleks. Analisis kontras utama dan elemen yang diperlukan sebarang pelan ANOVA yang kompleks. Modul Analisis varians mempunyai pelbagai keupayaan analisis kontras yang membolehkan anda memilih dan menganalisis sebarang jenis perbandingan purata.

posterior perbandingan

Kadangkala, hasil daripada pemprosesan percubaan, kesan yang tidak dijangka ditemui. Walaupun dalam kebanyakan kes pengkaji kreatif boleh menjelaskan sebarang keputusan, ini tidak memberi peluang untuk analisis lanjut dan mendapatkan anggaran untuk ramalan. Masalah ini adalah salah satu daripadanya kriteria post hoc, iaitu kriteria yang tidak digunakan a priori hipotesis. Untuk menggambarkan, pertimbangkan eksperimen berikut. Katakan bahawa 100 kad mengandungi nombor dari 1 hingga 10. Setelah meletakkan semua kad ini ke dalam pengepala, kami secara rawak memilih 20 kali 5 kad, dan mengira nilai purata untuk setiap sampel (purata nombor yang ditulis pada kad). Bolehkah kita menjangkakan terdapat dua sampel yang caranya berbeza dengan ketara? Ini sangat masuk akal! Dengan memilih dua sampel dengan min maksimum dan minimum, seseorang boleh memperoleh perbezaan min yang sangat berbeza daripada perbezaan min, contohnya, dua sampel pertama. Perbezaan ini boleh disiasat, sebagai contoh, menggunakan analisis kontras. Tanpa pergi ke butiran, terdapat beberapa yang dipanggil posterior kriteria yang berdasarkan tepat pada senario pertama (mengambil purata ekstrem daripada 20 sampel), iaitu kriteria ini adalah berdasarkan memilih cara yang paling berbeza untuk membandingkan semua cara dalam reka bentuk. Kriteria ini digunakan untuk tidak mendapat kesan buatan semata-mata secara kebetulan, sebagai contoh, untuk mencari perbezaan yang ketara antara cara apabila tiada. Modul Analisis varians menawarkan pelbagai kriteria sedemikian. Apabila keputusan yang tidak dijangka ditemui dalam eksperimen yang melibatkan berbilang kumpulan, posterior prosedur untuk mengkaji kepentingan statistik keputusan yang diperolehi.

Jumlah kuasa dua jenis I, II, III dan IV

Regresi multivariate dan analisis varians

wujud hubungan rapat antara kaedah regresi multivariate dan analisis varians (analisis variasi). Dalam kedua-dua kaedah, model linear dikaji. Ringkasnya, hampir semua reka bentuk eksperimen boleh diterokai menggunakan regresi multivariate. Pertimbangkan pelan 2 x 2 kumpulan silang mudah berikut.

DV A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Lajur A dan B mengandungi kod yang mencirikan tahap faktor A dan B, lajur AxB mengandungi hasil darab dua lajur A dan B. Kita boleh menganalisis data ini menggunakan regresi multivariate. Pembolehubah DV ditakrifkan sebagai pembolehubah bersandar, pembolehubah daripada A sebelum ini AxB sebagai pembolehubah bebas. Kajian kepentingan bagi pekali regresi akan bertepatan dengan pengiraan dalam analisis varians kepentingan kesan utama faktor. A dan B dan kesan interaksi AxB.

Pelan Tidak Seimbang dan Seimbang

Apabila mengira matriks korelasi untuk semua pembolehubah, sebagai contoh, untuk data yang digambarkan di atas, dapat dilihat bahawa kesan utama faktor A dan B dan kesan interaksi AxB tidak berkorelasi. Sifat kesan ini juga dipanggil ortogonal. Mereka mengatakan bahawa kesan A dan B - ortogon atau bebas daripada satu sama lain. Jika semua kesan dalam pelan adalah ortogon antara satu sama lain, seperti dalam contoh di atas, maka pelan itu dikatakan sebagai seimbang.

Pelan seimbang mempunyai "harta yang baik." Pengiraan dalam analisis rancangan sedemikian adalah sangat mudah. Semua pengiraan dikurangkan untuk mengira korelasi antara kesan dan pembolehubah bersandar. Oleh kerana kesannya adalah ortogonal, korelasi separa (seperti sepenuhnya pelbagai dimensi regresi) tidak dikira. Walau bagaimanapun, dalam kehidupan sebenar, rancangan tidak selalu seimbang.

Pertimbangkan data sebenar dengan bilangan pemerhatian yang tidak sama dalam sel.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Jika kita mengekod data ini seperti di atas dan mengira matriks korelasi untuk semua pembolehubah, maka ternyata faktor reka bentuk berkorelasi antara satu sama lain. Faktor dalam pelan itu kini tidak ortogonal dan rancangan sedemikian dipanggil tidak seimbang. Ambil perhatian bahawa dalam contoh ini, korelasi antara faktor sepenuhnya berkaitan dengan perbezaan frekuensi 1 dan -1 dalam lajur matriks data. Dalam erti kata lain, reka bentuk eksperimen dengan volum sel yang tidak sama (lebih tepat, volum tidak seimbang) akan menjadi tidak seimbang, yang bermaksud bahawa kesan utama dan interaksi akan bercampur. Dalam kes ini, untuk mengira kepentingan statistik kesan, anda perlu mengira sepenuhnya regresi multivariate. Terdapat beberapa strategi di sini.

Jumlah kuasa dua jenis I, II, III dan IV

Jumlah jenis kuasa duasayadanIII. Untuk mengkaji kepentingan setiap faktor dalam model multivariat, seseorang boleh mengira korelasi separa bagi setiap faktor, dengan syarat semua faktor lain sudah diambil kira dalam model. Anda juga boleh memasukkan faktor ke dalam model secara langkah demi langkah, membetulkan semua faktor yang telah dimasukkan ke dalam model dan mengabaikan semua faktor lain. Secara umum, ini adalah perbezaan antara menaip III dan menaipsaya jumlah kuasa dua (istilah ini diperkenalkan dalam SAS, lihat contohnya SAS, 1982; perbincangan terperinci juga boleh didapati dalam Searle, 1987, hlm. 461; Woodward, Bonett, dan Brecht, 1990, hlm. 216; atau Milliken dan Johnson, 1984, hlm. 138).

Jumlah jenis kuasa duaII. Strategi pembentukan model "perantaraan" seterusnya ialah: untuk mengawal semua kesan utama dalam kajian kepentingan kesan utama tunggal; dalam kawalan semua kesan utama dan semua interaksi berpasangan, apabila kepentingan interaksi berpasangan tunggal diperiksa; dalam mengawal semua kesan utama semua interaksi berpasangan dan semua interaksi tiga faktor; dalam kajian interaksi berasingan tiga faktor, dsb. Jumlah kuasa dua untuk kesan yang dikira dengan cara ini dipanggil menaipII hasil tambah kuasa dua. Jadi, jenisII jumlah kuasa dua mengawal semua kesan susunan yang sama dan ke bawah, mengabaikan semua kesan susunan yang lebih tinggi.

Jumlah jenis kuasa duaIV. Akhir sekali, untuk beberapa pelan khas dengan sel yang hilang (pelan tidak lengkap), adalah mungkin untuk mengira apa yang dipanggil menaip IV hasil tambah kuasa dua. Kaedah ini akan dibincangkan kemudian berkaitan dengan pelan yang tidak lengkap (pelan dengan sel yang hilang).

Tafsiran tekaan hasil tambah kuasa dua jenis I, II dan III

jumlah persegi menaipIII paling mudah untuk ditafsirkan. Ingat bahawa jumlah kuasa dua menaipIII periksa kesan selepas mengawal semua kesan lain. Sebagai contoh, selepas menemui signifikan secara statistik menaipIII kesan untuk faktor A dalam modul Analisis varians, kita boleh mengatakan bahawa terdapat satu kesan ketara faktor tersebut A, selepas memperkenalkan semua kesan (faktor) lain dan mentafsir kesan ini dengan sewajarnya. Mungkin dalam 99% daripada semua aplikasi analisis varians, kriteria jenis ini menarik minat penyelidik. Jumlah kuasa dua jenis ini biasanya dikira dalam modul Analisis varians secara lalai, tidak kira sama ada pilihan itu dipilih Pendekatan Regresi atau tidak (pendekatan standard yang diterima pakai dalam modul Analisis varians dibincangkan di bawah).

Kesan ketara diperoleh menggunakan jumlah kuasa dua menaip atau menaipII jumlah kuasa dua tidak begitu mudah untuk ditafsirkan. Mereka paling baik ditafsirkan dalam konteks regresi multivariate berperingkat. Jika menggunakan hasil tambah kuasa dua menaipsaya kesan utama faktor B didapati signifikan (selepas memasukkan faktor A dalam model, tetapi sebelum menambah interaksi antara A dan B), boleh disimpulkan bahawa terdapat kesan utama faktor B yang signifikan, dengan syarat terdapat tiada interaksi antara faktor A dan B. (Jika menggunakan kriteria menaipIII, faktor B juga ternyata signifikan, maka kita boleh membuat kesimpulan bahawa terdapat kesan utama yang signifikan dari faktor B, selepas memperkenalkan semua faktor lain dan interaksinya ke dalam model).

Dari segi cara marginal hipotesis menaipsaya dan menaipII biasanya tidak mempunyai tafsiran yang mudah. Dalam kes ini, dikatakan bahawa seseorang tidak boleh mentafsir kepentingan kesan dengan mempertimbangkan cara marginal sahaja. agak dibentangkan hlm nilai min berkaitan dengan hipotesis kompleks yang menggabungkan min dan saiz sampel. Sebagai contoh, jenisII hipotesis untuk faktor A dalam contoh reka bentuk 2 x 2 mudah yang dibincangkan sebelum ini ialah (lihat Woodward, Bonett, dan Brecht, 1990, hlm. 219):

nij- bilangan pemerhatian dalam sel

uij- nilai purata dalam sel

n. j- purata marginal

Tanpa perincian (untuk butiran lanjut lihat Milliken dan Johnson, 1984, bab 10), adalah jelas bahawa ini bukanlah hipotesis mudah dan dalam kebanyakan kes tiada satu pun daripada mereka yang menarik minat penyelidik. Walau bagaimanapun, terdapat kes di mana hipotesis menaipsaya mungkin menarik.

Pendekatan pengiraan lalai dalam modul Analisis varians

Lalai jika pilihan tidak ditanda Pendekatan Regresi, modul Analisis varians kegunaan model purata sel. Ciri model ini ialah jumlah kuasa dua untuk kesan yang berbeza dikira untuk gabungan linear min sel. Dalam eksperimen faktorial penuh, ini menghasilkan jumlah kuasa dua yang sama dengan jumlah kuasa dua yang dibincangkan sebelum ini sebagai jenis III. Walau bagaimanapun, dalam pilihan Perbandingan Berjadual(dalam tingkap Analisis keputusan varians), pengguna boleh membuat hipotesis tentang sebarang kombinasi linear cara sel berwajaran atau tidak berwajaran. Oleh itu, pengguna boleh menguji bukan sahaja hipotesis menaipIII, tetapi sebarang jenis hipotesis (termasuk jenisIV). ini pendekatan umum amat berguna apabila memeriksa reka bentuk dengan sel yang hilang (kononnya reka bentuk tidak lengkap).

Untuk reka bentuk faktorial penuh, pendekatan ini juga berguna apabila seseorang ingin menganalisis cara marginal berwajaran. Sebagai contoh, katakan dalam reka bentuk 2 x 2 mudah yang dipertimbangkan sebelum ini, kita ingin membandingkan wajaran (dari segi tahap faktor) B) purata marginal untuk faktor A. Ini berguna apabila taburan cerapan ke atas sel tidak disediakan oleh penguji, tetapi dibina secara rawak, dan rawak ini ditunjukkan dalam taburan bilangan cerapan mengikut tahap faktor B dalam agregat .

Sebagai contoh, terdapat faktor - umur janda. Sampel responden yang mungkin dibahagikan kepada dua kumpulan: lebih muda daripada 40 dan lebih tua daripada 40 (faktor B). Faktor kedua (faktor A) dalam rancangan itu ialah sama ada balu menerima sokongan sosial daripada beberapa agensi atau tidak (manakala sesetengah balu dipilih secara rawak, yang lain bertindak sebagai kawalan). Dalam kes ini, taburan umur balu dalam sampel mencerminkan taburan umur sebenar balu dalam populasi. Menilai keberkesanan kumpulan sokongan sosial untuk balu semua peringkat umur akan sepadan dengan purata wajaran untuk dua kumpulan umur (dengan berat sepadan dengan bilangan pemerhatian dalam kumpulan).

Perbandingan Berjadual

Ambil perhatian bahawa jumlah nisbah kontras yang dimasukkan tidak semestinya sama dengan 0 (sifar). Sebaliknya, program akan membuat pelarasan secara automatik supaya hipotesis yang sepadan tidak bercampur dengan purata keseluruhan.

Untuk menggambarkan ini, mari kita kembali kepada pelan 2 x 2 mudah yang dibincangkan sebelum ini. Ingat bahawa kiraan sel bagi reka bentuk tidak seimbang ini ialah -1, 2, 3, dan 1. Katakan kita ingin membandingkan purata marginal berwajaran untuk faktor A (ditimbang dengan kekerapan tahap faktor B). Anda boleh memasukkan nisbah kontras:

Ambil perhatian bahawa pekali ini tidak menambah sehingga 0. Program ini akan menetapkan pekali supaya ia menambah sehingga 0, sambil mengekalkan pekalinya. nilai relatif, iaitu:

1/3 2/3 -3/4 -1/4

Perbezaan ini akan membandingkan purata wajaran untuk faktor A.

Hipotesis tentang min prinsipal. Hipotesis bahawa min prinsipal tidak berwajaran ialah 0 boleh diterokai menggunakan pekali:

Hipotesis bahawa min prinsipal berwajaran ialah 0 diuji dengan:

Program ini tidak akan membetulkan nisbah kontras.

Analisis rancangan dengan sel yang hilang (pelan tidak lengkap)

Reka bentuk faktor yang mengandungi sel kosong (pemprosesan gabungan sel yang tiada pemerhatian) dipanggil tidak lengkap. Dalam reka bentuk sedemikian, beberapa faktor biasanya tidak ortogon dan beberapa interaksi tidak boleh dikira. Secara umum, tiada kaedah yang lebih baik untuk menganalisis rancangan tersebut.

Pendekatan Regresi

Dalam beberapa program lama yang bergantung pada analisis reka bentuk ANOVA menggunakan regresi multivariate, faktor lalai dalam reka bentuk tidak lengkap diberikan oleh dengan cara biasa(seolah-olah rancangan itu selesai). Kemudian multivariate analisis regresi untuk faktor yang dikodkan secara rekaan ini. Malangnya, kaedah ini membawa kepada keputusan yang sangat sukar, jika tidak mustahil, untuk ditafsirkan kerana tidak jelas bagaimana setiap kesan menyumbang kepada gabungan linear cara. Pertimbangkan contoh mudah berikut.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 terlepas

Jika regresi multivariate borang Pembolehubah bersandar = Dimalarkan + Faktor A + Faktor B, maka hipotesis tentang kepentingan faktor A dan B dari segi kombinasi linear min kelihatan seperti ini:

Faktor A: Sel A1,B1 = Sel A2,B1

Faktor B: Sel A1,B1 = Sel A1,B2

Kes ini mudah sahaja. Dalam rancangan yang lebih kompleks, adalah mustahil untuk benar-benar menentukan apa sebenarnya yang akan diperiksa.

Min sel, analisis pendekatan varians , hipotesis jenis IV

Pendekatan yang disyorkan dalam kesusasteraan dan nampaknya lebih baik ialah kajian yang bermakna (dari segi tugas penyelidikan) a priori hipotesis tentang cara yang diperhatikan dalam sel rancangan. Perbincangan terperinci mengenai pendekatan ini boleh didapati dalam Dodge (1985), Heiberger (1989), Milliken dan Johnson (1984), Searle (1987), atau Woodward, Bonett, dan Brecht (1990). Jumlah kuasa dua yang dikaitkan dengan hipotesis tentang gabungan linear cara dalam reka bentuk yang tidak lengkap, menyiasat anggaran sebahagian daripada kesan, juga dipanggil jumlah kuasa dua. IV.

Penjanaan automatik jenis hipotesisIV. Apabila rancangan pelbagai faktor telah sifat kompleks sel yang hilang, adalah wajar untuk mentakrifkan hipotesis ortogonal (bebas), kajiannya bersamaan dengan kajian kesan atau interaksi utama. Strategi algoritma (pengiraan) (berdasarkan matriks reka bentuk pseudo-songsang) telah dibangunkan untuk menjana pemberat yang sesuai untuk perbandingan tersebut. Malangnya, hipotesis akhir tidak ditakrifkan secara unik. Sudah tentu, ia bergantung pada susunan kesan yang ditakrifkan dan jarang mudah untuk ditafsirkan. Oleh itu, adalah disyorkan untuk mengkaji dengan teliti sifat sel yang hilang, kemudian merumuskan hipotesis menaipIV, yang paling relevan dengan objektif kajian. Kemudian terokai hipotesis ini menggunakan pilihan Perbandingan Berjadual dalam tingkap keputusan. Paling Jalan mudah nyatakan perbandingan dalam kes ini - memerlukan pengenalan vektor kontras untuk semua faktor bersama-sama dalam tingkap Perbandingan berjadual. Selepas memanggil kotak dialog Perbandingan Berjadual semua kumpulan pelan semasa akan ditunjukkan dan kumpulan yang ditinggalkan akan ditanda.

Sel Dilangkau dan Semakan Kesan Khusus

Terdapat beberapa jenis pelan di mana lokasi sel yang hilang tidak rawak, tetapi dirancang dengan teliti, yang membolehkan analisis mudah kesan utama tanpa menjejaskan kesan lain. Contohnya, apabila bilangan sel yang diperlukan dalam pelan tidak tersedia, pelan sering digunakan. petak latin untuk menganggarkan kesan utama beberapa faktor dengan bilangan tahap yang besar. Sebagai contoh, reka bentuk faktorial 4 x 4 x 4 x 4 memerlukan 256 sel. Pada masa yang sama, anda boleh menggunakan Dataran Yunani-Latin untuk menganggarkan kesan utama, hanya mempunyai 16 sel dalam pelan (bab. Perancangan eksperimen, Jilid IV, mengandungi penerangan terperinci tentang rancangan tersebut). Reka bentuk yang tidak lengkap di mana kesan utama (dan beberapa interaksi) boleh dianggarkan menggunakan kombinasi linear mudah cara dipanggil rancangan tidak lengkap yang seimbang.

Dalam reka bentuk yang seimbang, kaedah standard (lalai) untuk menjana kontras (berat) untuk kesan utama dan interaksi kemudiannya akan menghasilkan analisis jadual varians di mana jumlah kuasa dua untuk kesan masing-masing tidak bercampur antara satu sama lain. Pilihan Kesan Khusus tingkap keputusan akan menjana kontras yang hilang dengan menulis sifar pada sel pelan yang hilang. Sejurus selepas pilihan diminta Kesan Khusus bagi pengguna yang mengkaji beberapa hipotesis, jadual keputusan muncul dengan pemberat sebenar. Ambil perhatian bahawa dalam reka bentuk yang seimbang, jumlah kuasa dua bagi kesan masing-masing dikira hanya jika kesan tersebut adalah ortogonal (bebas) kepada semua kesan dan interaksi utama yang lain. Jika tidak, gunakan pilihan Perbandingan Berjadual untuk meneroka perbandingan bermakna antara cara.

Sel Hilang dan Gabungan Kesan/Ahli Ralat

Jika pilihan Pendekatan regresi dalam panel pelancaran modul Analisis varians tidak dipilih, model purata sel akan digunakan apabila mengira jumlah kuasa dua untuk kesan (tetapan lalai). Jika reka bentuk tidak seimbang, maka apabila menggabungkan kesan bukan ortogon (lihat perbincangan di atas tentang pilihan Sel hilang dan kesan khusus) seseorang boleh mendapatkan jumlah segi empat sama yang terdiri daripada komponen bukan ortogon (atau bertindih). Keputusan yang diperoleh dengan cara ini biasanya tidak dapat ditafsirkan. Oleh itu, seseorang mesti berhati-hati apabila memilih dan melaksanakan reka bentuk eksperimen yang tidak lengkap yang kompleks.

Terdapat banyak buku dengan perbincangan terperinci tentang pelbagai jenis rancangan. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken dan Johnson, 1984; Searle, 1987; Woodward dan Bonett, 1990), tetapi maklumat jenis ini berada di luar skop buku teks ini. Walau bagaimanapun, kemudian dalam bahagian ini kami akan menunjukkan analisis pelbagai jenis rancangan.

Andaian dan Kesan Pelanggaran Andaian

Sisihan daripada andaian taburan normal

Andaikan pembolehubah bersandar diukur pada skala berangka. Mari kita anggap juga bahawa pembolehubah bersandar mempunyai taburan normal dalam setiap kumpulan. Analisis varians mengandungi pelbagai graf dan statistik untuk menyokong andaian ini.

Kesan pelanggaran. Secara amnya F kriteria ini sangat tahan terhadap penyelewengan daripada normal (lihat Lindman, 1974 untuk keputusan terperinci). Jika kurtosis lebih besar daripada 0, maka nilai statistik F mungkin menjadi sangat kecil. Hipotesis nol diterima, walaupun ia mungkin tidak benar. Keadaan menjadi terbalik apabila kurtosis kurang daripada 0. Kecondongan taburan biasanya mempunyai sedikit kesan pada F perangkaan. Jika bilangan cerapan dalam sel cukup besar, maka sisihan daripada normaliti mempunyai tidak kepentingan khusus Menurut kuasa teorem had pusat, mengikut mana, taburan nilai min adalah hampir normal, tanpa mengira taburan awal. Perbincangan terperinci tentang kemampanan F statistik boleh didapati dalam Box dan Anderson (1955), atau Lindman (1974).

Kehomogenan penyebaran

Andaian. Diandaikan bahawa varians kumpulan berbeza pelan adalah sama. Andaian ini dipanggil andaian kehomogenan serakan. Ingat bahawa pada permulaan bahagian ini, apabila menerangkan pengiraan jumlah ralat kuasa dua, kami melakukan penjumlahan dalam setiap kumpulan. Jika varians dalam dua kumpulan berbeza antara satu sama lain, maka menambahnya tidak begitu semula jadi dan tidak memberikan anggaran jumlah varians dalam kumpulan (kerana dalam kes ini tiada varians umum sama sekali). Modul Analisis penyebaran -ANOVA/MANOVA mengandungi satu set besar kriteria statistik pengesanan sisihan daripada andaian kehomogenan varians.

Kesan pelanggaran. Lindman (1974, hlm. 33) menunjukkan bahawa F kriterianya agak stabil berkenaan dengan pelanggaran andaian kehomogenan varians ( kepelbagaian penyebaran, lihat juga Box, 1954a, 1954b; Hsu, 1938).

Kes khas: korelasi min dan varians. Ada masanya F statistik boleh menyesatkan. Ini berlaku apabila nilai min dalam sel reka bentuk dikaitkan dengan varians. Modul Analisis varians membolehkan anda memplot varians atau petak serakan sisihan piawai terhadap cara untuk mengesan korelasi tersebut. Sebab mengapa korelasi sedemikian berbahaya adalah seperti berikut. Mari kita bayangkan bahawa terdapat 8 sel dalam pelan, 7 daripadanya mempunyai purata yang hampir sama, dan dalam satu sel puratanya jauh lebih besar daripada yang lain. Kemudian F ujian boleh mengesan kesan yang signifikan secara statistik. Tetapi andaikan bahawa dalam sel dengan nilai min yang besar dan variansnya jauh lebih besar daripada yang lain, i.e. min dan varians dalam sel adalah bergantung (lebih besar min, lebih besar varians). Dalam kes ini, min yang besar tidak boleh dipercayai, kerana ia mungkin disebabkan oleh varians yang besar dalam data. Namun begitu F statistik berdasarkan bersatu varians dalam sel akan menangkap min yang besar, walaupun kriteria berdasarkan varians dalam setiap sel tidak akan menganggap semua perbezaan dalam cara sebagai signifikan.

Sifat data ini (min besar dan varians besar) sering ditemui apabila terdapat pemerhatian terpencil. Satu atau dua pemerhatian outlier sangat mengalihkan min dan meningkatkan varians dengan ketara.

Kehomogenan varians dan kovarians

Andaian. Dalam reka bentuk multivariat, dengan ukuran bergantung multivariat, kehomogenan andaian varians yang diterangkan sebelum ini juga terpakai. Walau bagaimanapun, oleh kerana terdapat pembolehubah bersandar multivariate, ia juga dikehendaki bahawa korelasi silang (kovarian) adalah seragam merentas semua sel pelan. Modul Analisis varians tawaran cara yang berbeza menguji andaian ini.

Kesan pelanggaran. Analog berbilang dimensi F- kriteria - λ-ujian Wilks. Tidak banyak yang diketahui tentang kestabilan (kekukuhan) ujian Wilks λ berkenaan dengan pelanggaran andaian di atas. Walau bagaimanapun, sejak tafsiran hasil modul Analisis varians biasanya berdasarkan kepentingan kesan univariat (selepas mewujudkan kepentingan kriteria biasa), perbincangan tentang keteguhan membimbangkan terutamanya analisis varians univariat. Oleh itu, kepentingan kesan satu dimensi perlu diteliti dengan teliti.

Kes khas: analisis kovarians. Pelanggaran yang teruk terhadap kehomogenan varians/kovarian boleh berlaku apabila kovariat dimasukkan dalam reka bentuk. Khususnya, jika korelasi antara kovariat dan ukuran bergantung adalah berbeza dalam sel reka bentuk yang berbeza, salah tafsiran keputusan mungkin berlaku. Perlu diingat bahawa dalam analisis kovarians, pada dasarnya, analisis regresi dilakukan dalam setiap sel untuk mengasingkan bahagian varians yang sepadan dengan kovariat. Kehomogenan varians/kovarian andaian mengandaikan bahawa analisis regresi ini dilakukan di bawah kekangan berikut: semua persamaan regresi (cerun) untuk semua sel adalah sama. Jika ini tidak dimaksudkan, maka ralat besar mungkin berlaku. Modul Analisis varians mempunyai beberapa kriteria khas untuk menguji andaian ini. Ia mungkin dinasihatkan untuk menggunakan kriteria ini untuk memastikan persamaan regresi untuk sel yang berbeza adalah lebih kurang sama.

Sphericity dan simetri kompleks: sebab untuk menggunakan pendekatan langkah berulang multivariate dalam analisis varians

Dalam reka bentuk yang mengandungi faktor ukuran berulang dengan lebih daripada dua tahap, aplikasi analisis varians univariat memerlukan andaian tambahan: andaian simetri kompleks dan andaian sfera. Andaian ini jarang dipenuhi (lihat di bawah). Oleh itu, dalam beberapa tahun kebelakangan ini, analisis pelbagai variasi varians telah mendapat populariti dalam rancangan tersebut (kedua-dua pendekatan digabungkan dalam modul Analisis varians).

Andaian simetri kompleks Andaian simetri kompleks ialah varians (jumlah dalam kumpulan) dan kovarians (mengikut kumpulan) untuk ukuran berulang yang berbeza adalah seragam (sama). Ini adalah syarat yang mencukupi untuk ujian F univariate untuk langkah berulang supaya sah (iaitu, nilai F yang dilaporkan, secara purata, konsisten dengan taburan F). Walau bagaimanapun, dalam kes ini keadaan ini tidak diperlukan.

Andaian sfera. Andaian sfera adalah perlu dan keadaan yang mencukupi untuk ujian-F dibenarkan. Ia terdiri daripada fakta bahawa dalam kumpulan semua pemerhatian adalah bebas dan diagihkan sama rata. Sifat andaian ini, serta kesan pelanggarannya, biasanya tidak diterangkan dengan baik dalam buku tentang analisis varians - yang ini akan diterangkan dalam perenggan berikut. Ia juga akan menunjukkan bahawa keputusan pendekatan univariat mungkin berbeza daripada keputusan pendekatan multivariate dan menerangkan maksudnya.

Keperluan untuk kebebasan hipotesis. Cara umum untuk menganalisis data dalam analisis varians ialah sesuai model. Jika, berkenaan dengan model yang sepadan dengan data, terdapat beberapa a priori hipotesis, maka varians dipecahkan untuk menguji hipotesis ini (kriteria untuk kesan utama, interaksi). Dari sudut pengiraan, pendekatan ini menghasilkan beberapa set kontras (set perbandingan cara dalam reka bentuk). Walau bagaimanapun, jika kontras tidak bebas antara satu sama lain, pembahagian varians menjadi tidak bermakna. Sebagai contoh, jika dua kontras A dan B adalah sama dan bahagian yang sepadan dipilih daripada varians, kemudian bahagian yang sama dipilih dua kali. Sebagai contoh, adalah bodoh dan sia-sia untuk memilih dua hipotesis: "min dalam sel 1 adalah lebih tinggi daripada min dalam sel 2" dan "min dalam sel 1 adalah lebih tinggi daripada min dalam sel 2". Jadi hipotesis mestilah bebas atau ortogon.

Hipotesis bebas dalam pengukuran berulang. Algoritma umum, dilaksanakan dalam modul Analisis varians, akan cuba menjana kontras bebas (ortogon) untuk setiap kesan. Untuk faktor langkah berulang, kontras ini menimbulkan banyak hipotesis tentang perbezaan antara tahap faktor yang dipertimbangkan. Walau bagaimanapun, jika perbezaan ini dikaitkan dalam kumpulan, maka kontras yang terhasil tidak lagi bebas. Sebagai contoh, dalam latihan di mana pelajar diukur tiga kali dalam satu semester, mungkin berlaku perubahan antara dimensi pertama dan kedua berkorelasi negatif dengan perubahan antara dimensi kedua dan ketiga subjek. Orang-orang yang paling menguasai bahan antara dimensi 1 dan 2, menguasai bahagian yang lebih kecil dalam masa yang telah berlalu antara dimensi ke-2 dan ke-3. Malah, bagi kebanyakan kes di mana analisis varians digunakan dalam pengukuran berulang, boleh diandaikan bahawa perubahan dalam tahap berkorelasi merentas subjek. Walau bagaimanapun, apabila ini berlaku, andaian simetri dan sfera kompleks tidak dipenuhi dan kontras bebas tidak boleh dikira.

Kesan pelanggaran dan cara membetulkannya. Apabila andaian simetri atau sfera kompleks tidak dipenuhi, analisis varians boleh menghasilkan keputusan yang salah. Sebelum prosedur multivariate dibangunkan dengan secukupnya, beberapa andaian telah dibuat untuk mengimbangi pelanggaran andaian ini. (Lihat, sebagai contoh, Rumah Hijau & Geisser, 1959 dan Huynh & Feldt, 1970). Kaedah ini masih digunakan secara meluas hari ini (itulah sebabnya ia dibentangkan dalam modul Analisis varians).

Analisis pelbagai variasi pendekatan varians kepada langkah berulang. Secara umum, masalah simetri kompleks dan sfera merujuk kepada fakta bahawa set kontras yang termasuk dalam kajian kesan faktor langkah berulang (dengan lebih daripada 2 tahap) tidak bebas antara satu sama lain. Walau bagaimanapun, mereka tidak perlu berdikari jika digunakan. pelbagai dimensi kriteria untuk pengesahan serentak kepentingan statistik dua atau lebih kontras faktor ukuran berulang. Inilah sebab mengapa analisis pelbagai variasi kaedah varians telah semakin digunakan untuk menguji kepentingan faktor ukuran berulang univariat dengan lebih daripada 2 tahap. Pendekatan ini digunakan secara meluas kerana ia secara amnya tidak memerlukan andaian simetri kompleks dan andaian sfera.

Kes di mana analisis multivariat pendekatan varians tidak boleh digunakan. Terdapat contoh (pelan) apabila analisis multivariate pendekatan varians tidak boleh digunakan. Ini biasanya kes di mana terdapat sebilangan kecil subjek dalam reka bentuk dan banyak tahap dalam faktor langkah berulang. Kemudian mungkin terdapat terlalu sedikit pemerhatian untuk melakukan analisis multivariate. Sebagai contoh, jika terdapat 12 entiti, hlm = 4 faktor pengukuran berulang, dan setiap faktor mempunyai k = 3 peringkat. Maka interaksi 4 faktor akan "berbelanja" (k-1)P = 2 4 = 16 darjah kebebasan. Walau bagaimanapun, terdapat hanya 12 subjek, oleh itu ujian multivariate tidak boleh dilakukan dalam contoh ini. Modul Analisis varians akan mengesan pemerhatian ini secara bebas dan mengira kriteria satu dimensi sahaja.

Perbezaan hasil univariate dan multivariate. Jika kajian merangkumi sejumlah besar langkah berulang, mungkin terdapat kes di mana pendekatan langkah berulang univariat ANOVA menghasilkan keputusan yang sangat berbeza daripada yang diperoleh dengan pendekatan multivariat. Ini bermakna perbezaan antara tahap pengukuran berulang masing-masing adalah berkorelasi merentas subjek. Kadang-kadang fakta ini mempunyai kepentingan bebas.

Analisis pelbagai variasi bagi varians dan pemodelan struktur persamaan

Dalam beberapa tahun kebelakangan ini, pemodelan persamaan struktur telah menjadi popular sebagai alternatif kepada analisis serakan multivariate (lihat, sebagai contoh, Bagozzi dan Yi, 1989; Bagozzi, Yi, dan Singh, 1991; Cole, Maxwell, Arvey, dan Salas, 1993). Pendekatan ini membolehkan anda menguji hipotesis bukan sahaja tentang cara dalam kumpulan yang berbeza, tetapi juga tentang matriks korelasi pembolehubah bersandar. Sebagai contoh, anda boleh melonggarkan andaian tentang kehomogenan varians dan kovarians dan secara eksplisit memasukkan ralat dalam model untuk setiap kumpulan varians dan kovarians. Modul STATISTIKPemodelan Persamaan Struktur (SEPATH) (lihat Jilid III) membenarkan analisis sedemikian.

Analisis varians membolehkan anda meneroka perbezaan antara kumpulan data, untuk menentukan sama ada percanggahan ini adalah rawak atau disebabkan oleh keadaan tertentu. Sebagai contoh, jika jualan syarikat di salah satu wilayah telah menurun, kemudian menggunakan analisis varians, anda boleh mengetahui sama ada penurunan dalam perolehan di rantau ini adalah tidak sengaja berbanding yang lain, dan, jika perlu, buat perubahan organisasi. Apabila melakukan eksperimen dalam keadaan yang berbeza, analisis varians akan membantu menentukan berapa banyak pengaruh faktor luaran ukuran, atau sisihan adalah rawak. Jika dalam pengeluaran, untuk meningkatkan kualiti produk, mod proses diubah, maka analisis varians membolehkan kita menilai hasil kesan faktor ini.

Mengenai ini contoh kami menunjukkan cara melakukan ANOVA pada data eksperimen.

Latihan 1. Terdapat empat kelompok bahan mentah untuk industri tekstil. Lima sampel telah dipilih daripada setiap kumpulan dan ujian telah dijalankan untuk menentukan magnitud beban pecah. Keputusan ujian ditunjukkan dalam jadual.

71" height="29" bgcolor="white" style="border:.75pt solid black; vertical-align:top;background:white">

Rajah 1


> Buka hamparan Microsoft Excel. Klik pada label Helaian2 untuk beralih ke lembaran kerja lain.

> Masukkan data ANOVA yang ditunjukkan dalam Rajah 1.

> Tukar data kepada format nombor. Untuk melakukan ini, pilih perintah menu Format Cell. Tetingkap format sel akan muncul pada skrin (Gamb. 2). Pilih Format angka dan data yang dimasukkan akan ditukar kepada bentuk yang ditunjukkan dalam rajah. 3

> Pilih arahan menu Analisis Data Perkhidmatan (Alat * Analisis Data). Tetingkap Analisis Data (Analisis Data) akan muncul pada skrin (Gamb. 4).

> Klik pada baris Analisis faktor tunggal varians (Anova: Faktor Tunggal) dalam senarai Alat Analisis (Anova: Faktor Tunggal).

> Klik OK untuk menutup tetingkap Analisis Data (Analisis Data). Tetingkap analisis varians sehala akan muncul pada skrin untuk menjalankan analisis serakan data (Rajah 5).

https://pandia.ru/text/78/446/images/image006_46.jpg" width="311" height="214 src=">

Rajah.5

> Jika dalam kumpulan kawalan Input data(Input) suis mengikut baris tidak ditetapkan, kemudian tetapkannya supaya program Excel menerima kumpulan data mengikut baris - kelompok.

> Pasang Teg Kotak Semak dalam baris pertama (Label dalam Firts Rom) dalam kumpulan kawalan Input, jika lajur pertama julat data yang dipilih mengandungi nama baris.

> Dalam medan input Alfa Input Kumpulan Kawalan (A1pha) lalai kepada nilai 0.05, yang berkaitan dengan kebarangkalian ralat dalam analisis varians.

> Jika suis Nev Worksheet Ply tidak ditetapkan dalam kumpulan kawalan pilihan Input, kemudian tetapkannya supaya hasil analisis varians diletakkan pada lembaran kerja baharu

> Klik OK untuk menutup tetingkap Anova: Single Factor. Keputusan analisis varians akan muncul pada lembaran kerja baharu (Rajah 6).

Julat sel A4:E6 mengandungi keputusan statistik deskriptif. Baris 4 mengandungi nama parameter, baris mengandungi nilai statistik yang dikira oleh kelompok.

Dalam lajur Semak(Kiraan) ialah bilangan ukuran, dalam lajur Jumlah - jumlah nilai, dalam lajur Purata (Avegage) - nilai min aritmetik, dalam lajur Varians (Varians) - serakan.

Keputusan yang diperolehi menunjukkan bahawa purata beban pecah tertinggi adalah dalam kelompok #3, dan serakan terbesar beban pecah adalah dalam kelompok #1.

Dalam julat sel A11:G16 memaparkan maklumat mengenai kepentingan percanggahan antara kumpulan data. Baris 12 mengandungi nama analisis parameter varians, baris 13 - hasil pemprosesan antara kumpulan, baris 14 - hasil pemprosesan intrakumpulan, dan baris 16 - jumlah nilai dua baris yang disebutkan.

Dalam lajur SS (qi) nilai variasi terletak, iaitu, jumlah kuasa dua atas semua sisihan. Variasi, seperti serakan, mencirikan penyebaran data. Ia boleh dilihat daripada jadual bahawa sebaran antara kumpulan beban putus adalah lebih tinggi daripada variasi intrakumpulan.

Dalam lajur df (k) nilai bilangan darjah kebebasan ditemui. Nombor-nombor ini menunjukkan bilangan sisihan bebas yang mana varians akan dikira. Sebagai contoh, bilangan darjah kebebasan antara kumpulan adalah sama dengan perbezaan antara bilangan kumpulan data dan satu. Semakin besar bilangan darjah kebebasan, semakin tinggi kebolehpercayaan parameter serakan. Data darjah kebebasan dalam jadual menunjukkan bahawa keputusan dalam kumpulan lebih dipercayai daripada parameter antara kumpulan.

Dalam lajur CIK (S2 ) nilai serakan terletak, yang ditentukan oleh nisbah variasi dan bilangan darjah kebebasan. Serakan mencirikan tahap serakan data, tetapi tidak seperti magnitud variasi, ia tidak mempunyai kecenderungan langsung untuk meningkat dengan peningkatan bilangan darjah kebebasan. Jadual menunjukkan bahawa varians antara kumpulan adalah jauh lebih besar daripada varians intrakumpulan.

Dalam lajur F terletak, maksudnya F- perangkaan, dikira dengan nisbah varians antara kumpulan dan antara kumpulan.

Dalam lajur Fkritikal(F crit) nilai F-kritikal terletak, dikira daripada bilangan darjah kebebasan dan nilai Alpha (A1pha). Kriteria penggunaan F-statistik dan nilai kritikal F Fisher-Snedekora.

Jika statistik F lebih besar daripada nilai kritikal F, maka boleh dikatakan bahawa perbezaan antara kumpulan data tidak rawak. iaitu pada tahap keertian α = 0.05 (dengan kebolehpercayaan 0.95) hipotesis nol ditolak dan alternatifnya diterima: perbezaan antara kelompok bahan mentah mempunyai kesan yang ketara ke atas magnitud beban pecah.

Lajur P-value mengandungi nilai kebarangkalian bahawa percanggahan antara kumpulan adalah rawak. Oleh kerana kebarangkalian ini sangat kecil dalam jadual, sisihan antara kumpulan adalah tidak rawak.

2. Menyelesaikan masalah analisis dua hala bagi varians tanpa ulangan

Microsoft Excel mempunyai fungsi Anova: (Dua Faktor Tanpa Replikasi), yang digunakan untuk mengenal pasti fakta pengaruh faktor yang boleh dikawal TAPI dan AT pada atribut yang berkesan berdasarkan data sampel, dan setiap peringkat faktor TAPI dan AT hanya satu sampel yang sepadan. Untuk memanggil fungsi ini, pilih arahan pada bar menu Perkhidmatan – Analisis Data. Tetingkap akan dibuka pada skrin. Analisis data, di mana anda harus memilih nilai Analisis varians dua hala tanpa ulangan dan klik butang OK. Akibatnya, kotak dialog yang ditunjukkan dalam Rajah 1 akan dibuka pada skrin.

78" height="42" bgcolor="white" style="border:.75pt solid black; vertical-align:top;background:white">

2. Kotak semak Label ditetapkan jika baris pertama dalam julat input mengandungi tajuk lajur. Jika tiada pengepala, kotak semak hendaklah dikosongkan. Dalam kes ini, nama standard akan dijana secara automatik untuk data julat output.

3. Dalam medan Alpha, tahap kepentingan yang diterima dimasukkan. α , yang sepadan dengan kebarangkalian ralat jenis pertama.

4. Suis dalam kumpulan pilihan Output boleh ditetapkan kepada salah satu daripada tiga kedudukan: Julat Output, Lapik Lembaran Kerja Baharu atau Buku Kerja Baharu.

Contoh.

Analisis varians dua hala tanpa ulangan(Anova: Dua Faktor Tanpa Replikasi) dalam contoh berikut.

Pada imej. Rajah 2 menunjukkan hasil (c/ha) bagi empat jenis gandum (empat tahap faktor A) yang dicapai dengan lima jenis baja (lima tahap faktor B). Data diperolehi daripada 20 petak yang sama saiz dan penutup tanah yang serupa. Perlu mentakrifkan sama ada jenis dan jenis baja mempengaruhi hasil gandum.

Analisis varians dua hala tanpa ulangan ditunjukkan dalam Rajah 3.

Seperti yang dapat dilihat daripada keputusan, nilai pengiraan nilai statistik F untuk faktor A (jenis baja) FTAPI= l,67 , dan kawasan kritikal dibentuk oleh selang sebelah kanan (3.49; +∞). Kerana FTAPI= l,67 tidak termasuk dalam kawasan kritikal, hipotesis HA: a 1 = a 2 + = ak terima, iaitu, kami percaya bahawa dalam percubaan ini jenis baja tidak memberi kesan kepada hasil.

Anggaran nilai statistik F untuk faktor B (varieti gandum) FAT =2,03 , dan kawasan kritikal dibentuk oleh selang sebelah kanan (3.259;+∞).

Kerana FAT=2.03 tidak termasuk dalam kawasan kritikal, hipotesis HB: b1 = b2 = ... = bm

juga menerima, iaitu, kami percaya bahawa dalam hal ini Dalam eksperimen, varieti gandum juga tidak menjejaskan hasil.

2. Analisis varians dua halaculangan

Microsoft Excel mempunyai fungsi Anova: Dua Faktor Dengan Replikasi, yang juga digunakan untuk menentukan sama ada faktor terkawal A dan B mempengaruhi ciri prestasi berdasarkan data sampel, bagaimanapun, setiap tahap salah satu faktor A (atau B) sepadan dengan lebih daripada satu sampel data.

Pertimbangkan untuk menggunakan fungsi Analisis dua hala bagi varians dengan ulangan pada contoh seterusnya.

Contoh 2. dalam jadual. Rajah 6 menunjukkan pertambahan berat badan harian (g) bagi 18 ekor anak babi yang dikumpul untuk kajian, bergantung kepada kaedah pemeliharaan anak babi (faktor A) dan kualiti pemakanannya (faktor B).

75" height="33" bgcolor="white" style="border:.75pt solid black; vertical-align:top;background:white">

Kotak dialog ini menetapkan pilihan berikut.

1. Dalam medan Julat Input, masukkan rujukan kepada julat sel yang mengandungi data yang dianalisis. Pilih sel daripada G 4 sebelum ini saya 13.

2. Dalam medan Baris setiap sampel, takrifkan bilangan sampel untuk setiap peringkat salah satu faktor. Setiap peringkat faktor mesti mengandungi bilangan sampel yang sama (baris jadual). Dalam kes kami, bilangan baris ialah tiga.

3. Dalam medan Alfa, masukkan nilai tahap keertian yang diterima α , yang sama dengan kebarangkalian ralat Jenis I.

4. Suis dalam kumpulan pilihan Output boleh ditetapkan kepada salah satu daripada tiga kedudukan: Julat Output (Selang keluaran), Lapik Lembaran Kerja Baharu (Lembaran kerja baharu) atau Buku Kerja Baharu (Buku kerja baharu).

Keputusan analisis dua hala varians menggunakan fungsi Analisis dua hala bagi varians dengan pengulangan yang ketara. Merujuk kepada fakta bahawa interaksi faktor-faktor ini adalah tidak ketara (pada tahap 5%).

Kerja rumah

1. Dalam tempoh enam tahun, lima teknologi berbeza telah digunakan untuk menanam tanaman. Data eksperimen (dalam c/ha) diberikan dalam jadual:

https://pandia.ru/text/78/446/images/image024_11.jpg" lebar="642" ketinggian="190 src=">

Ia diperlukan pada tahap keertian α = 0.05 untuk mewujudkan pergantungan pengeluaran jubin berkualiti tinggi pada barisan pengeluaran (faktor A).

3. Data berikut tersedia mengenai hasil empat jenis gandum pada lima bidang tanah yang diperuntukkan (blok):

https://pandia.ru/text/78/446/images/image026_9.jpg" width="598" height="165 src=">

Ia diperlukan pada tahap keertian α = 0.05 untuk mewujudkan kesan ke atas produktiviti buruh teknologi (faktor A) dan perusahaan (faktor B).

) direka untuk membandingkan hanya dua populasi. Walau bagaimanapun, ia sering disalahgunakan untuk perbandingan berpasangan bagi lebih banyak kumpulan (Rajah 1), yang menyebabkan apa yang dipanggil. kesan daripada pelbagai perbandingan(Bahasa Inggeris) banyak perbandingan; Glantz 1999, hlm. 101-104). Kami akan bercakap tentang kesan ini dan cara menanganinya kemudian. Dalam jawatan ini saya akan menerangkan prinsip analisis varians univariate hanya direka untuk serentak perbandingan nilai purata dua atau lebih kumpulan. Prinsip ANOVA an alysis o f va riance, ANOVA) telah dibangunkan pada tahun 1920-an. Sir Ronald Aylmer Fisher Ronald Aylmer Fisher) - "seorang genius yang hampir seorang diri meletakkan asas statistik moden" (Separuh 1998).

Persoalannya mungkin timbul: mengapa kaedah yang digunakan untuk perbandingan sederhana nilai dipanggil tersebar analisis? Masalahnya ialah apabila mewujudkan perbezaan antara nilai purata, kita sebenarnya membandingkan varians populasi yang dianalisis. Namun, perkara pertama dahulu...

Perumusan masalah

Contoh di bawah diambil dari buku Maindonald & coklat(2010). Data berat tersedia untuk tomato (seluruh tumbuhan; berat , dalam kg) yang ditanam selama 2 bulan di bawah tiga keadaan eksperimen yang berbeza (trt , dari rawatan) - di atas air (air), dalam persekitaran dengan penambahan baja (nutrien), serta dalam persekitaran dengan penambahan baja dan herbisida 2,4-D (nutrien + 24D):

# Buat jadual dengan data: tomato<- data.frame (weight= c (1.5 , 1.9 , 1.3 , 1.5 , 2.4 , 1.5 , # water 1.5 , 1.2 , 1.2 , 2.1 , 2.9 , 1.6 , # nutrient 1.9 , 1.6 , 0.8 , 1.15 , 0.9 , 1.6 ) , # nutrient+24D trt = rep (c ("Water" , "Nutrient" , "Nutrient+24D" ) , c (6 , 6 , 6 ) ) ) # Lihat hasilnya: Berat Berat TRT 1 1.50 Air 2 1.90 Air 3 1.30 Air 4 1.50 Air 5 2.40 Air 6 1.50 Air 7 1.50 Nutrew 8 1.20 Nutrew 9 1.20 Nutrewen 11 2.90 Nutrew 12 1.60 Nutrent 13 1.90 Nutreent Nutreent+0.80 Nutrien+24d 16 1.15 Nutrien+24d 17 0.90 Nutrien+24D 18 1.60 Nutrien+24D


Pembolehubah trt ialah faktor dengan tiga tahap. Untuk perbandingan yang lebih visual tentang keadaan eksperimen pada masa hadapan, kami akan menjadikan aras "air" sebagai asas (eng. rujukan), iaitu tahap dengan mana R akan membandingkan semua tahap lain. Ini boleh dilakukan dengan fungsi relevel():


Untuk lebih memahami sifat data yang tersedia, kami memvisualisasikannya menggunakan perbezaan yang diperhatikan antara min kumpulan adalah tidak penting dan disebabkan oleh pengaruh faktor rawak (iaitu, sebenarnya, semua ukuran berat tumbuhan yang diperolehi datang daripada satu populasi umum yang bertaburan normal):

Kami menekankan sekali lagi bahawa contoh yang dipertimbangkan sepadan dengan kes itu satu faktor analisis varians: kita mengkaji kesan satu faktor - keadaan pertumbuhan (dengan tiga tahap - Air , Nutrien dan Nutrien + 24D ) pada pembolehubah tindak balas yang menarik minat kita - berat tumbuhan.

Malangnya, penyelidik hampir tidak mempunyai peluang untuk mengkaji keseluruhan populasi. Bagaimanakah kita boleh tahu jika hipotesis nol di atas adalah benar jika hanya data sampel? Kita boleh mengutarakan soalan ini secara berbeza: apakah kebarangkalian untuk memperoleh perbezaan yang diperhatikan antara cara kumpulan dengan menarik sampel rawak daripada satu populasi taburan normal? Untuk menjawab soalan ini, kita memerlukan ujian statistik yang secara kuantitatif akan mencirikan magnitud perbezaan antara kumpulan yang dibandingkan.

Senaman . Pelajar tahun 1 telah ditinjau untuk mengenal pasti aktiviti yang mereka luangkan masa lapang. Semak sama ada taburan keutamaan lisan dan bukan lisan pelajar berbeza.

Penyelesaian dijalankan menggunakan kalkulator.
Mencari purata kumpulan:

NP 1P 2
1 12 17
2 18 19
3 23 25
4 10 7
5 15 17
x rujuk 15.6 17

Mari kita nyatakan p - bilangan aras faktor (p=2). Bilangan ukuran pada setiap aras adalah sama dan sama dengan q=5.
Baris terakhir mengandungi bermakna kumpulan untuk setiap peringkat faktor.
Min keseluruhan boleh didapati sebagai min aritmetik kumpulan bermaksud:
(1)
Sebaran purata kumpulan peratusan kegagalan berbanding jumlah purata dipengaruhi oleh kedua-dua perubahan dalam tahap faktor yang dipertimbangkan dan faktor rawak.
Untuk mengambil kira pengaruh faktor ini, jumlah varians sampel dibahagikan kepada dua bahagian, yang pertama dipanggil faktorial S 2 f, dan yang kedua - baki S 2 baki.
Untuk mengambil kira komponen ini, jumlah jumlah sisihan kuasa dua varian daripada jumlah purata dikira dahulu:

dan jumlah faktor bagi sisihan kuasa dua kumpulan bermakna daripada jumlah min, yang mencirikan pengaruh faktor ini:

Ungkapan terakhir diperoleh dengan menggantikan setiap varian dalam ungkapan Rtot dengan min kumpulan untuk faktor yang diberikan.
Jumlah baki sisihan kuasa dua diperolehi sebagai perbezaan:
R rehat \u003d R jumlah - R f
Untuk menentukan jumlah varians sampel, adalah perlu untuk membahagikan Rtotal dengan bilangan ukuran pq:

dan untuk mendapatkan jumlah varians sampel yang tidak berat sebelah, ungkapan ini mesti didarab dengan pq/(pq-1):

Sehubungan itu, untuk varians sampel faktorial tidak berat sebelah:

di mana p-1 ialah bilangan darjah kebebasan bagi varians sampel faktorial tidak berat sebelah.
Untuk menilai pengaruh faktor pada perubahan dalam parameter yang sedang dipertimbangkan, nilai dikira:

Oleh kerana nisbah dua varians sampel S 2 f dan S 2 rem diedarkan mengikut undang-undang Fisher-Snedekor, nilai f obs yang terhasil dibandingkan dengan nilai fungsi taburan

pada titik genting f cr sepadan dengan aras keertian yang dipilih a.
Jika f obl >f cr, maka faktor tersebut mempunyai kesan yang ketara dan perlu diambil kira, jika tidak, ia mempunyai kesan yang tidak ketara yang boleh diabaikan.
Formula berikut juga boleh digunakan untuk mengira Robs dan Rf:
(4)
(5)
Kami mencari purata keseluruhan dengan formula (1):
Untuk mengira Rtot menggunakan formula (4), kami menyusun jadual pilihan 2 petak:
NP 2 1P 2 2
1 144 289
2 324 361
3 529 625
4 100 49
5 225 289
1322 1613

Purata keseluruhan dikira dengan formula (1):

Rtot = 1322 + 1613 - 5 2 16.3 2 = 278.1
Kami mencari R f mengikut formula (5):
R f \u003d 5 (15.6 2 + 17 2) - 2 16.3 2 \u003d 4.9
Kami mendapat rehat R: rehat R \u003d jumlah R - R f \u003d 278.1 - 4.9 \u003d 273.2
Kami menentukan varians faktorial dan baki:


Jika nilai min pembolehubah rawak yang dikira untuk sampel individu adalah sama, maka anggaran varians faktorial dan baki adalah anggaran tidak berat sebelah bagi varians am dan berbeza secara tidak ketara.
Kemudian perbandingan anggaran varians ini oleh kriteria Fisher harus menunjukkan bahawa hipotesis nol tidak ada sebab untuk menolak kesamaan varians faktorial dan baki.
Anggaran varians faktor adalah kurang daripada anggaran serakan sisa, jadi kita boleh segera menegaskan kesahihan hipotesis nol tentang kesamaan jangkaan matematik oleh lapisan sampel.
Dalam erti kata lain, dalam contoh ini, faktor Ф tidak mempengaruhi pembolehubah rawak dengan ketara.
Mari kita semak hipotesis nol H 0: kesamaan nilai purata x.
Cari f obl

Untuk aras keertian α=0.05, bilangan darjah kebebasan 1 dan 8, kita dapati f cr daripada jadual taburan Fisher-Snedekor.
f cr (0.05; 1; 8) = 5.32
Disebabkan oleh fakta bahawa f obs< f кр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов отклоняем.
Dengan kata lain, taburan keutamaan lisan dan bukan lisan pelajar berbeza.

Senaman. Kilang itu mempunyai empat baris untuk pengeluaran jubin menghadap. 10 jubin dipilih secara rawak dari setiap baris semasa peralihan dan ketebalannya (mm) diukur. Penyimpangan daripada saiz nominal diberikan dalam jadual. Ia diperlukan pada tahap keertian a = 0.05 untuk mewujudkan pergantungan pengeluaran jubin berkualiti tinggi pada barisan pengeluaran (faktor A).

Senaman. Pada aras keertian a = 0.05, siasat kesan warna cat pada hayat perkhidmatan salutan.

Contoh #1. 13 ujian telah dilakukan, di mana 4 berada pada tahap pertama faktor, 4 berada pada tahap kedua, 3 berada pada tahap ketiga dan 2 berada pada tahap keempat. Dengan menggunakan kaedah analisis varians pada aras keertian 0.05, semak hipotesis nol tentang kesamaan min kumpulan. Diandaikan bahawa sampel diambil daripada populasi normal dengan varians yang sama. Keputusan ujian ditunjukkan dalam jadual.

Penyelesaian:
Mencari purata kumpulan:

NP 1P 2P 3P 4
1 1.38 1.41 1.32 1.31
2 1.38 1.42 1.33 1.33
3 1.42 1.44 1.34 -
4 1.42 1.45 - -
5.6 5.72 3.99 2.64
x rujuk 1.4 1.43 1.33 1.32

Mari kita nyatakan p - bilangan aras faktor (p=4). Bilangan ukuran pada setiap peringkat ialah: 4,4,3,2
Baris terakhir mengandungi bermakna kumpulan untuk setiap peringkat faktor.
Purata keseluruhan dikira dengan formula:

Untuk mengira Stotal menggunakan formula (4), kami menyusun jadual pilihan 2 petak:

NP 2 1P 2 2P 2 3P 2 4
1 1.9 1.99 1.74 1.72
2 1.9 2.02 1.77 1.77
3 2.02 2.07 1.8 -
4 2.02 2.1 - -
7.84 8.18 5.31 3.49

Jumlah sisihan kuasa dua didapati dengan formula:


Kami mencari S f dengan formula:


Kami mendapat rehat S: rehat S \u003d Jumlah S - S f \u003d 0.0293 - 0.0263 \u003d 0.003
Tentukan varians faktor:

dan varians sisa:

Jika nilai min pembolehubah rawak yang dikira untuk sampel individu adalah sama, maka anggaran varians faktorial dan baki adalah anggaran tidak berat sebelah bagi varians am dan berbeza secara tidak ketara.
Kemudian perbandingan anggaran varians ini mengikut kriteria Fisher harus menunjukkan bahawa tidak ada sebab untuk menolak hipotesis nol tentang kesamaan varians faktorial dan baki.
Anggaran varians faktorial adalah lebih besar daripada anggaran varians baki, jadi kami boleh dengan segera menegaskan bahawa hipotesis nol tentang kesamaan jangkaan matematik untuk lapisan sampel adalah tidak benar.
Dalam erti kata lain, dalam contoh ini, faktor Ф mempunyai kesan yang ketara ke atas pembolehubah rawak.
Mari kita semak hipotesis nol H 0: kesamaan nilai purata x.
Cari f obl

Untuk aras keertian α=0.05, bilangan darjah kebebasan 3 dan 12, kita dapati f cr daripada jadual taburan Fisher-Snedekor.
f cr (0.05; 3; 12) = 3.49
Disebabkan fakta bahawa fobs > fcr, kami menerima hipotesis nol tentang pengaruh faktor yang ketara ke atas keputusan eksperimen (kami menolak hipotesis nol tentang kesamaan min kumpulan). Dalam erti kata lain, kumpulan bermakna secara keseluruhannya berbeza dengan ketara.

Contoh #2. Sekolah ini mempunyai 5 darjah enam. Pakar psikologi ditugaskan untuk menentukan sama ada tahap purata kebimbangan situasi di dalam bilik darjah. Untuk ini diberikan dalam jadual. Semak tahap keertian α=0.05, andaian bahawa purata kebimbangan situasi dalam kelas tidak berbeza.

Contoh #3. Untuk mengkaji nilai X, 4 ujian telah dilakukan pada setiap lima tahap faktor F. Keputusan ujian diberikan dalam jadual. Ketahui sama ada pengaruh faktor F terhadap nilai X adalah signifikan. Ambil α = 0.05. Diandaikan bahawa sampel diambil daripada populasi normal dengan varians yang sama.

Contoh #4. Mari kita anggap bahawa dalam eksperimen pedagogi Terdapat tiga kumpulan pelajar, masing-masing 10 orang. Kumpulan menggunakan kaedah pengajaran yang berbeza: dalam yang pertama - tradisional (F 1), dalam kedua - berdasarkan teknologi komputer (F 2), dalam ketiga - kaedah yang secara meluas menggunakan tugas untuk kerja bebas (F 3). Pengetahuan dinilai pada sistem sepuluh mata.
Ia dikehendaki memproses data yang diperolehi pada peperiksaan dan membuat rumusan sama ada pengaruh kaedah pengajaran adalah signifikan, dengan mengambil α=0.05 sebagai aras keertian.
Keputusan peperiksaan diberikan dalam jadual, F j - aras faktor x ij - penilaian pelajar ke-i pelajar mengikut kaedah F j .

Tahap faktor

Contoh nombor 5. Keputusan ujian varieti kompetitif tanaman ditunjukkan (hasil dalam c.d. ha). Setiap varieti telah diuji dalam empat plot. Gunakan kaedah analisis varians untuk mengkaji kesan varieti ke atas hasil. Tetapkan kepentingan pengaruh faktor (bahagian variasi antara kumpulan dalam jumlah variasi) dan kepentingan keputusan eksperimen pada tahap keertian 0.05.
Hasil dalam pelbagai plot ujian

Kepelbagaian Produktiviti pada ulangan c. dari ha
1 2 3 4
1
2
3
42,4
52,5
52,3
37,4
50,1
53,0
40,7
53,8
51,4
38,2
50,7
53,6