Biografi Ciri-ciri Analisis

Analisis varians sehala dalam talian. Analisis kontras dan ujian post hoc

Semua manusia secara fitrahnya berusaha mencari ilmu. (Aristotle. Metafizik)

Analisis varians

Gambaran keseluruhan pengenalan

Dalam bahagian ini, kami akan menyemak kaedah asas, andaian dan terminologi ANOVA.

Perhatikan bahawa dalam kesusasteraan bahasa Inggeris, analisis varians biasanya dipanggil analisis variasi. Oleh itu, secara ringkasnya, di bawah ini kadangkala kita akan menggunakan istilah tersebut ANOVA (An alysis o f va percampuran) untuk ANOVA biasa dan istilah MANOVA untuk analisis pelbagai variasi bagi varians. Dalam bahagian ini kita akan mengkaji secara berurutan idea-idea utama analisis varians ( ANOVA), analisis kovarians ( ANCOVA), analisis pelbagai variasi bagi varians ( MANOVA) dan analisis multivariate bagi kovarians ( MANCOVA). Selepas perbincangan ringkas tentang merit analisis kontras dan ujian post hoc, mari kita lihat andaian yang berasaskan kaedah ANOVA. Menjelang penghujung bahagian ini, kelebihan pendekatan multivariat untuk analisis langkah berulang berbanding pendekatan univariat tradisional diterangkan.

Idea Utama

Tujuan analisis varians. Tujuan utama analisis varians adalah untuk mengkaji kepentingan perbezaan antara min. Bab (bab 8) mengandungi pengenalan ringkas ke dalam kajian kepentingan statistik. Jika anda hanya membandingkan cara dua sampel, analisis varians akan memberikan hasil yang sama seperti analisis biasa. t- ujian untuk sampel bebas (jika dua kumpulan bebas objek atau pemerhatian dibandingkan) atau t- kriteria untuk sampel bersandar (jika dua pembolehubah dibandingkan pada set objek atau pemerhatian yang sama). Jika anda tidak biasa dengan kriteria ini, kami mengesyorkan anda merujuk kepada gambaran keseluruhan bab pengenalan (Bab 9).

Dari mana datangnya nama itu Analisis varians? Ia mungkin kelihatan aneh bahawa prosedur untuk membandingkan purata dipanggil analisis varians. Pada hakikatnya, ini adalah kerana apabila kita mengkaji kepentingan statistik perbezaan antara min, kita sebenarnya sedang menganalisis varians.

Membahagikan hasil tambah kuasa dua

Untuk saiz sampel n varians sampel dikira sebagai jumlah sisihan kuasa dua daripada min sampel dibahagikan dengan n-1 (saiz sampel tolak satu). Oleh itu, untuk saiz sampel tetap n, varians ialah fungsi jumlah kuasa dua (penyimpangan), dilambangkan, untuk ringkas, SS(dari bahasa Inggeris Sum of Squares - Sum of Squares). Asas analisis varians ialah pemisahan (atau pembahagian) varians kepada bahagian. Pertimbangkan set data berikut:

Cara kedua-dua kumpulan adalah berbeza secara ketara (masing-masing 2 dan 6). Jumlah sisihan kuasa dua dalam setiap kumpulan adalah sama dengan 2. Menambahnya, kita mendapat 4. Jika kita mengulangi pengiraan ini tidak termasuk keahlian kumpulan, iaitu jika kita mengira SS berdasarkan min keseluruhan kedua-dua sampel, kita mendapat 28. Dengan kata lain, varians (jumlah kuasa dua) berdasarkan kebolehubahan dalam kumpulan menghasilkan nilai yang jauh lebih kecil daripada apabila dikira berdasarkan kebolehubahan keseluruhan (berbanding dengan min keseluruhan). Sebabnya adalah jelas perbezaan yang ketara antara cara, dan perbezaan antara cara ini menjelaskan perbezaan yang sedia ada antara jumlah kuasa dua. Malah, jika anda menggunakan modul untuk menganalisis data yang diberikan Analisis varians, keputusan berikut akan diperolehi:

Seperti yang dapat dilihat daripada jadual, jumlah jumlah kuasa dua SS=28 dibahagikan dengan hasil tambah kuasa dua yang diberi oleh dalam kumpulan kebolehubahan ( 2+2=4 ; lihat baris kedua jadual) dan hasil tambah kuasa dua disebabkan oleh perbezaan nilai min. (28-(2+2)=24; lihat baris pertama jadual).

SS kesilapan danSS kesan. kebolehubahan dalam kumpulan ( SS) biasanya dipanggil serakan kesilapan. Ini bermakna bahawa ia biasanya tidak boleh diramalkan atau dijelaskan apabila eksperimen dilakukan. Di sisi lain, SS kesan(atau kebolehubahan antara kumpulan) boleh dijelaskan dengan perbezaan antara cara kumpulan kajian. Dengan kata lain, tergolong dalam kumpulan tertentu menerangkan kebolehubahan antara kumpulan, kerana kita tahu golongan ini mempunyai cara yang berbeza.

Semakan kepentingan. Idea asas ujian signifikan statistik dibincangkan dalam Bab Konsep asas statistik(Bab 8). Bab ini juga menerangkan sebab mengapa banyak ujian menggunakan nisbah varians yang dijelaskan kepada yang tidak dapat dijelaskan. Contoh penggunaan ini ialah analisis varians itu sendiri. Ujian untuk kepentingan dalam analisis varians adalah berdasarkan membandingkan varians disebabkan oleh varians antara kumpulan (dipanggil min kesan segi empat sama atau MSkesan) dan varians disebabkan oleh variasi dalam kumpulan (dipanggil min ralat kuasa dua atau MSkesilapan). Jika benar hipotesis nol(kesamaan min dalam dua populasi), maka kita boleh menjangkakan perbezaan yang agak sedikit dalam min sampel disebabkan oleh kebolehubahan rawak. Oleh itu, di bawah hipotesis nol, varians dalam kumpulan secara praktikal akan bertepatan dengan jumlah varians yang dikira tanpa mengambil kira keahlian kumpulan. Varians dalam kumpulan yang terhasil boleh dibandingkan menggunakan F- ujian yang menyemak sama ada nisbah varians adalah jauh lebih besar daripada 1. Dalam contoh yang dibincangkan di atas F- kriteria menunjukkan bahawa perbezaan antara min adalah signifikan secara statistik.

Logik asas analisis varians. Untuk meringkaskan, tujuan ANOVA adalah untuk menguji kepentingan statistik perbezaan antara min (untuk kumpulan atau pembolehubah). Semakan ini dijalankan menggunakan analisis varians, i.e. menggunakan partitioning jumlah varians(variasi) kepada bahagian, salah satunya disebabkan oleh ralat rawak (iaitu, kebolehubahan intrakumpulan), dan yang kedua dikaitkan dengan perbezaan dalam nilai min. Komponen varians terakhir kemudiannya digunakan untuk menganalisis kepentingan statistik perbezaan antara min. Sekiranya perbezaan ini ketara, hipotesis nol ditolak dan hipotesis alternatif bahawa terdapat perbezaan antara min diterima.

Pembolehubah bersandar dan bebas. Pembolehubah yang nilainya ditentukan oleh ukuran semasa percubaan (contohnya, skor ujian) dipanggil bergantung pembolehubah. Pembolehubah yang boleh dikawal dalam eksperimen (contohnya, kaedah pengajaran atau kriteria lain untuk membahagikan pemerhatian kepada kumpulan) dipanggil faktor atau berdikari pembolehubah. Konsep-konsep ini diterangkan dengan lebih terperinci dalam bab Konsep asas statistik(Bab 8).

Analisis pelbagai variasi bagi varians

Dalam contoh mudah di atas, anda boleh mengira ujian-t sampel bebas menggunakan pilihan modul yang sesuai Statistik dan jadual asas. Keputusan yang diperoleh secara semula jadi akan bertepatan dengan keputusan analisis varians. Walau bagaimanapun, ANOVA mengandungi fleksibel dan berkuasa cara teknikal, yang boleh digunakan untuk penyelidikan yang lebih kompleks.

Banyak faktor. Dunia ini kompleks dan bersifat multidimensi. Situasi apabila fenomena tertentu diterangkan sepenuhnya oleh satu pembolehubah adalah sangat jarang berlaku. Sebagai contoh, jika kita cuba mempelajari cara menanam tomato besar, kita harus mempertimbangkan faktor yang berkaitan dengan struktur genetik tumbuhan, jenis tanah, cahaya, suhu, dll. Oleh itu, apabila menjalankan eksperimen biasa, seseorang perlu berurusan dengan sejumlah besar faktor. Sebab utama mengapa menggunakan ANOVA adalah lebih baik daripada perbandingan berulang dua sampel apabila tahap yang berbeza faktor menggunakan t- kriteria ialah analisis varians adalah lebih berkesan dan, untuk sampel kecil, lebih bermaklumat.

Pengurusan faktor. Katakan dalam contoh analisis dua sampel yang dibincangkan di atas, kita menambah faktor lain, mis. Lantai- Jantina. Biarkan setiap kumpulan terdiri daripada 3 lelaki dan 3 perempuan. Reka bentuk eksperimen ini boleh dipersembahkan dalam bentuk jadual 2 dengan 2:

Eksperimen. Kumpulan 1 Eksperimen. Kumpulan 2
Lelaki2 6
3 7
1 5
Purata2 6
perempuan4 8
5 9
3 7
Purata4 8

Sebelum melakukan pengiraan, anda boleh perhatikan bahawa dalam contoh ini jumlah varians mempunyai sekurang-kurangnya tiga sumber:

(1) ralat rawak (dalam varians kumpulan),

(2) kebolehubahan yang dikaitkan dengan keahlian kumpulan eksperimen, dan

(3) kebolehubahan disebabkan oleh jantina objek pemerhatian.

(Perhatikan bahawa terdapat satu lagi sumber kebolehubahan yang mungkin - interaksi faktor, yang akan kita bincangkan kemudian). Apa yang berlaku jika kita tidak sertakan lantaijantina sebagai faktor dalam analisis dan mengira yang biasa t-kriteria? Jika kita mengira jumlah kuasa dua, mengabaikan lantai -jantina(iaitu, menggabungkan objek berlainan jantina ke dalam satu kumpulan apabila mengira varians dalam kumpulan, mendapatkan jumlah kuasa dua untuk setiap kumpulan yang sama dengan SS=10, dan jumlah keseluruhan segi empat sama SS= 10+10 = 20), maka kita dapat nilai yang lebih tinggi varians dalam kumpulan berbanding dengan analisis yang lebih tepat dengan subkumpulan tambahan mengikut separuh jantina(dalam kes ini, min dalam kumpulan akan bersamaan dengan 2, dan jumlah jumlah kuasa dua dalam kumpulan akan sama dengan SS = 2+2+2+2 = 8). Perbezaan ini disebabkan oleh fakta bahawa nilai purata untuk lelaki - jantan kurang daripada purata untuk wanita -perempuan, dan perbezaan dalam cara ini meningkatkan kebolehubahan keseluruhan dalam kumpulan apabila jantina tidak diambil kira. Mengawal varians ralat meningkatkan sensitiviti (kuasa) ujian.

Contoh ini menunjukkan satu lagi kelebihan analisis varians berbanding konvensional t- kriteria untuk dua sampel. Analisis varians membolehkan anda mengkaji setiap faktor dengan mengawal nilai faktor yang tinggal. Ini, sebenarnya, sebab utama kuasa statistiknya yang lebih besar (saiz sampel yang lebih kecil diperlukan untuk mendapatkan hasil yang bermakna). Atas sebab ini, analisis varians, walaupun pada sampel kecil, memberikan hasil statistik yang lebih ketara daripada mudah t- kriteria.

Kesan Interaksi

Terdapat satu lagi kelebihan menggunakan analisis varians berbanding analisis konvensional. t- kriteria: analisis varians membolehkan kita mengesan interaksi antara faktor dan oleh itu membolehkan kajian model yang lebih kompleks. Untuk menggambarkan, pertimbangkan contoh lain.

Kesan utama, interaksi berpasangan (dua faktor). Andaikan terdapat dua kumpulan pelajar, dan secara psikologi pelajar kumpulan pertama berazam untuk menyiapkan tugasan yang diberikan dan lebih bermatlamat berbanding pelajar kumpulan kedua, terdiri daripada pelajar yang lebih malas. Mari kita bahagikan setiap kumpulan secara rawak kepada separuh dan berikan satu separuh daripada setiap kumpulan tugas yang sukar dan separuh lagi tugas yang mudah. Kami kemudian akan mengukur sejauh mana pelajar bekerja keras dalam tugasan ini. Purata untuk kajian (fiksyen) ini ditunjukkan dalam jadual:

Apakah kesimpulan yang boleh dibuat daripada keputusan ini? Bolehkah kita membuat kesimpulan bahawa: (1) pelajar bekerja dengan lebih gigih pada tugas yang kompleks; (2) Adakah pelajar yang bermotivasi bekerja lebih keras daripada pelajar yang malas? Tiada satu pun daripada kenyataan ini menangkap intipati sifat sistematik cara yang ditunjukkan dalam jadual. Menganalisis keputusan, adalah lebih tepat untuk mengatakannya tugas yang sukar Hanya pelajar yang bermotivasi bekerja lebih keras, manakala hanya pelajar yang malas bekerja lebih keras pada tugasan yang mudah. Dengan kata lain, perwatakan pelajar dan kesukaran tugasan berinteraksi mempengaruhi antara satu sama lain terhadap usaha yang dibelanjakan. Ini adalah contoh interaksi pasangan antara perwatakan pelajar dengan kesukaran tugasan. Perhatikan bahawa pernyataan 1 dan 2 menerangkan kesan utama.

Interaksi peringkat tinggi. Walaupun interaksi berpasangan masih agak mudah untuk dijelaskan, interaksi peringkat lebih tinggi adalah lebih sukar untuk dijelaskan. Mari kita bayangkan bahawa dalam contoh yang dipertimbangkan di atas, faktor lain diperkenalkan lantai -Jantina dan kami mendapat jadual purata berikut:

Apakah kesimpulan yang boleh dibuat sekarang daripada keputusan yang diperoleh? Plot min memudahkan untuk mentafsir kesan yang kompleks. Modul ANOVA membolehkan anda membina graf ini dengan hampir satu klik tetikus.

Imej dalam graf di bawah mewakili interaksi tiga faktor yang sedang dikaji.

Melihat graf, kita boleh mengatakan bahawa untuk wanita terdapat interaksi antara watak dan kesukaran ujian: wanita yang bermotivasi bekerja pada tugas yang sukar lebih sengit daripada di atas paru-paru. Bagi lelaki, interaksi yang sama adalah terbalik. Dapat dilihat bahawa penerangan tentang interaksi antara faktor menjadi lebih mengelirukan.

Kaedah am penerangan tentang interaksi. Secara umum, interaksi antara faktor digambarkan sebagai perubahan dalam satu kesan di bawah pengaruh yang lain. Dalam contoh yang dibincangkan di atas, interaksi dua faktor boleh digambarkan sebagai perubahan dalam kesan utama faktor yang mencirikan kesukaran tugasan di bawah pengaruh faktor yang menggambarkan watak pelajar. Untuk interaksi tiga faktor dari perenggan sebelumnya, kita boleh mengatakan bahawa interaksi dua faktor (kesukaran tugas dan watak pelajar) berubah di bawah pengaruh jantinaJantina. Jika interaksi empat faktor dikaji, kita boleh mengatakan bahawa interaksi tiga faktor berubah di bawah pengaruh faktor keempat, i.e. Terdapat pelbagai jenis interaksi pada tahap faktor keempat yang berbeza. Ternyata di banyak kawasan interaksi lima atau bahkan lebih faktor tidak luar biasa.

Rancangan yang rumit

Reka bentuk antara kumpulan dan dalam kumpulan (reka bentuk ukuran berulang)

Apabila membandingkan dua pelbagai kumpulan biasa digunakan t- kriteria untuk sampel bebas (daripada modul Statistik dan jadual asas). Apabila dua pembolehubah dibandingkan pada set objek yang sama (pemerhatian), ia digunakan t-kriteria untuk sampel bergantung. Untuk analisis varians, ia juga penting sama ada sampel bergantung atau tidak. Jika terdapat pengukuran berulang bagi pembolehubah yang sama (dengan keadaan yang berbeza atau dalam masa yang berbeza) untuk objek yang sama, kemudian mereka bercakap tentang kehadiran faktor langkah berulang(juga dipanggil faktor intrakumpulan, kerana jumlah kuasa dua dalam kumpulan dikira untuk menilai kepentingannya). Jika kumpulan objek yang berbeza dibandingkan (contohnya, lelaki dan wanita, tiga strain bakteria, dsb.), maka perbezaan antara kumpulan diterangkan. faktor antara kumpulan. Kaedah untuk mengira kriteria keertian bagi dua jenis faktor yang diterangkan adalah berbeza, tetapi logik dan tafsiran amnya adalah sama.

Pelan antara dan dalam kumpulan. Dalam kebanyakan kes, percubaan memerlukan kemasukan kedua-dua faktor antara subjek dan faktor ukuran berulang dalam reka bentuk. Sebagai contoh, kemahiran matematik pelajar perempuan dan lelaki diukur (di mana lantai -Jantina-faktor antara kumpulan) pada awal dan akhir semester. Dua ukuran kemahiran setiap pelajar membentuk faktor dalam kumpulan (faktor ukuran berulang). Tafsiran kesan utama dan interaksi untuk antara subjek dan faktor ukuran berulang adalah konsisten, dan kedua-dua jenis faktor jelas boleh berinteraksi antara satu sama lain (cth., wanita memperoleh kemahiran sepanjang semester, manakala lelaki kehilangannya).

Pelan yang tidak lengkap (bersarang).

Dalam kebanyakan kes, kesan interaksi boleh diabaikan. Ini berlaku sama ada apabila diketahui bahawa tiada kesan interaksi dalam populasi, atau apabila pelaksanaan selesai faktorial rancangan adalah mustahil. Sebagai contoh, kesan empat bahan tambahan bahan api terhadap penggunaan bahan api sedang dikaji. Empat kereta dan empat pemandu dipilih. penuh faktorial percubaan memerlukan setiap kombinasi: bahan tambahan, pemandu, kereta - muncul sekurang-kurangnya sekali. Ini memerlukan sekurang-kurangnya 4 x 4 x 4 = 64 kumpulan ujian, yang terlalu memakan masa. Selain itu, tidak mungkin terdapat sebarang interaksi antara pemandu dan bahan tambahan bahan api. Dengan mengambil kira perkara ini, anda boleh menggunakan pelan tersebut petak Latin, yang mengandungi hanya 16 kumpulan ujian (empat bahan tambahan ditetapkan oleh huruf A, B, C dan D):

Petak Latin diterangkan dalam kebanyakan buku mengenai reka bentuk eksperimen (cth., Hays, 1988; Lindman, 1974; Milliken dan Johnson, 1984; Winer, 1962) dan tidak akan dibincangkan secara terperinci di sini. Perhatikan bahawa petak Latin adalah Tidaknpenuh reka bentuk di mana tidak semua gabungan tahap faktor disertakan. Sebagai contoh, pemandu 1 memandu kereta 1 sahaja dengan bahan tambahan A, pemandu 3 memandu kereta 1 sahaja dengan bahan tambahan C. Tahap faktor bahan tambahan ( A, B, C dan D) bersarang dalam sel jadual kereta x pemandu - seperti telur dalam sarang. Mnemonik ini berguna untuk memahami alam semula jadi bersarang atau bersarang rancangan. Modul Analisis varians menyediakan cara mudah untuk menganalisis jenis rancangan ini.

Analisis Kovarians

idea utama

Dalam bahagian Idea Utama Idea kawalan faktor dan bagaimana kemasukan faktor tambahan mengurangkan jumlah ralat kuasa dua dan meningkatkan kuasa statistik reka bentuk telah dibincangkan secara ringkas. Semua ini boleh diperluaskan kepada pembolehubah dengan set nilai berterusan. Apabila pembolehubah berterusan tersebut dimasukkan sebagai faktor dalam reka bentuk, ia dipanggil kovariat.

Kovariat tetap

Katakan kita membandingkan kemahiran matematik dua kumpulan pelajar yang diajar menggunakan dua buku teks yang berbeza. Mari kita anggap juga bahawa data kecerdasan kecerdasan (IQ) tersedia untuk setiap pelajar. Anda boleh menganggap bahawa IQ berkaitan dengan kemahiran matematik dan menggunakan maklumat tersebut. Bagi setiap dua kumpulan pelajar, pekali korelasi antara IQ dan kemahiran matematik boleh dikira. Menggunakan pekali korelasi ini, adalah mungkin untuk mengasingkan bahagian varians dalam kumpulan yang dijelaskan oleh pengaruh IQ dan bahagian varians yang tidak dapat dijelaskan (lihat juga Konsep asas statistik(Bab 8) dan Statistik dan jadual asas(bab 9)). Bahagian selebihnya varians digunakan dalam analisis sebagai varians ralat. Sekiranya terdapat perkaitan antara IQ dan kemahiran matematik, maka varians ralat dapat dikurangkan dengan ketara SS/(n-1) .

Kesan kovariat terhadapF- kriteria. F- kriteria menilai kepentingan statistik perbezaan dalam nilai min dalam kumpulan, dan nisbah varians antara kumpulan dikira ( MSkesan) kepada varians ralat ( MSkesilapan) . Jika MSkesilapan menurun, sebagai contoh, apabila mengambil kira faktor IQ, nilai F bertambah.

Banyak kovariat. Penaakulan yang digunakan di atas untuk satu kovariat (IQ) dengan mudah boleh diperluaskan kepada berbilang kovariat. Sebagai contoh, sebagai tambahan kepada IQ, anda boleh memasukkan ukuran motivasi, pemikiran spatial, dsb. Daripada pekali korelasi biasa, ia digunakan pekali berbilang korelasi.

Apabila nilaiF -kriteria berkurangan. Kadangkala memperkenalkan kovariat ke dalam reka bentuk eksperimen mengurangkan kepentingannya F-kriteria . Ini biasanya menunjukkan bahawa kovariat dikaitkan bukan sahaja dengan pembolehubah bersandar (cth., kemahiran matematik) tetapi juga dengan faktor (cth., buku teks yang berbeza). Mari kita anggap bahawa IQ diukur pada akhir semester, selepas hampir latihan tahunan dua kumpulan pelajar menggunakan dua buku teks yang berbeza. Walaupun pelajar ditugaskan kepada kumpulan secara rawak, mungkin perbezaan buku teks sangat besar sehingga kedua-dua kemahiran IQ dan matematik akan berbeza-beza antara kumpulan. Dalam kes ini, kovariat bukan sahaja mengurangkan varians ralat tetapi juga varians antara kumpulan. Dalam erti kata lain, selepas mengawal perbezaan dalam IQ merentas kumpulan, perbezaan dalam kemahiran matematik tidak lagi ketara. Anda boleh mengatakannya secara berbeza. Selepas "menolak" pengaruh IQ, pengaruh buku teks terhadap perkembangan kemahiran matematik secara tidak sengaja dikecualikan.

Purata diselaraskan. Apabila kovariat mempengaruhi faktor antara subjek, seseorang harus mengira cara diselaraskan, iaitu bermakna yang diperoleh selepas mengalih keluar semua anggaran kovariat.

Interaksi antara kovariat dan faktor. Sama seperti interaksi antara faktor diperiksa, interaksi antara kovariat dan antara kumpulan faktor boleh diperiksa. Katakan salah satu buku teks amat sesuai untuk pelajar pintar. Buku teks kedua membosankan untuk pelajar pintar, dan buku teks yang sama sukar untuk pelajar kurang pintar. Hasilnya, terdapat korelasi positif antara IQ dan hasil pembelajaran dalam kumpulan pertama (pelajar pintar, hasil yang lebih baik) dan sifar atau korelasi negatif kecil dalam kumpulan kedua (daripada pelajar yang lebih bijak, semakin kecil kemungkinannya untuk memperoleh kemahiran matematik daripada buku teks kedua). Beberapa kajian membincangkan situasi ini sebagai contoh pelanggaran andaian analisis kovarians. Walau bagaimanapun, kerana modul ANOVA menggunakan kaedah analisis kovarians yang paling biasa, adalah mungkin, khususnya, untuk menilai kepentingan statistik interaksi antara faktor dan kovariat.

Kovariat boleh ubah

Walaupun kovariat tetap dibincangkan agak kerap dalam buku teks, kovariat pembolehubah disebut lebih kurang kerap. Biasanya, apabila menjalankan eksperimen dengan pengukuran berulang, kami berminat dengan perbezaan dalam pengukuran kuantiti yang sama pada titik masa yang berbeza. Iaitu, kami berminat dengan kepentingan perbezaan ini. Jika kovariat diukur pada masa yang sama dengan ukuran pembolehubah bersandar, korelasi antara kovariat dan pembolehubah bersandar boleh dikira.

Sebagai contoh, minat matematik dan kemahiran matematik boleh diterokai pada awal dan akhir semester. Adalah menarik untuk menguji sama ada perubahan minat dalam matematik dikaitkan dengan perubahan dalam kemahiran matematik.

Modul Analisis varians V STATISTIKA secara automatik menilai kepentingan statistik perubahan dalam kovariat dalam reka bentuk jika boleh.

Reka bentuk pelbagai variasi: analisis pelbagai variasi bagi varians dan kovarians

Rancangan antara kumpulan

Semua contoh yang dibincangkan sebelum ini termasuk hanya satu pembolehubah bersandar. Apabila terdapat beberapa pembolehubah bersandar pada masa yang sama, hanya kerumitan pengiraan meningkat, tetapi kandungan dan prinsip asas tidak berubah.

Sebagai contoh, kajian dijalankan ke atas dua buku teks yang berbeza. Pada masa yang sama, kejayaan pelajar dalam mempelajari fizik dan matematik dipelajari. Dalam kes ini, terdapat dua pembolehubah bersandar dan anda perlu mengetahui bagaimana dua buku teks berbeza mempengaruhinya secara serentak. Untuk melakukan ini, anda boleh menggunakan analisis varians multivariate (MANOVA). Daripada satu dimensi F kriteria, yang berbilang dimensi digunakan F ujian (ujian Wilks' l), berdasarkan perbandingan matriks kovarians ralat dan matriks kovarians antara kumpulan.

Jika pembolehubah bersandar dikorelasi antara satu sama lain, maka korelasi ini perlu diambil kira semasa mengira kriteria keertian. Jelas sekali, jika ukuran yang sama diulang dua kali, maka tiada apa yang baru boleh diperolehi. Jika ukuran berkorelasi dengannya ditambah kepada ukuran sedia ada, maka beberapa maklumat baharu, tetapi pembolehubah baharu mengandungi maklumat berlebihan, yang dicerminkan dalam kovarians antara pembolehubah.

Tafsiran keputusan. Jika ujian multivariat keseluruhan adalah signifikan, kita boleh membuat kesimpulan bahawa kesan yang sepadan (cth., jenis buku teks) adalah signifikan. Namun, persoalan berikut timbul. Adakah jenis buku teks mempengaruhi peningkatan dalam kemahiran matematik sahaja, kemahiran fizikal sahaja, atau kedua-dua kemahiran? Malah, selepas mendapat ujian multivariat yang ketara, ujian univariat diperiksa untuk kesan atau interaksi utama individu. F kriteria. Dalam erti kata lain, pembolehubah bersandar yang menyumbang kepada kepentingan kriteria multivariate diperiksa secara berasingan.

Reka Bentuk Pengukuran Berulang

Jika kemahiran matematik dan fizik pelajar diukur pada awal semester dan pada penghujung, maka ini adalah ukuran berulang. Mempelajari kriteria kepentingan dalam rancangan tersebut adalah perkembangan logik kes satu dimensi. Ambil perhatian bahawa analisis multivariat bagi teknik varians juga biasa digunakan untuk mengkaji kepentingan faktor ukuran berulang univariat yang mempunyai lebih daripada dua tahap. Permohonan yang sepadan akan dibincangkan kemudian dalam bahagian ini.

Penjumlahan nilai pembolehubah dan analisis pelbagai variasi bagi varians

Malah pengguna berpengalaman dalam analisis varians univariat dan multivariate sering mendapati sukar untuk mendapatkan hasil yang berbeza apabila menggunakan analisis varians multivariate, sebagai contoh, kepada tiga pembolehubah, dan apabila menggunakan analisis varians univariate kepada jumlah ketiga-tiga pembolehubah ini, seolah-olah ia adalah pembolehubah tunggal.

Idea penjumlahan pembolehubah ialah setiap pembolehubah mengandungi beberapa pembolehubah benar, yang dikaji, serta ralat rawak ukuran. Oleh itu, apabila purata nilai pembolehubah, ralat pengukuran akan lebih hampir kepada 0 untuk semua ukuran dan nilai purata akan lebih dipercayai. Malah, dalam kes ini, menggunakan ANOVA kepada jumlah pembolehubah adalah munasabah dan teknik yang berkuasa. Walau bagaimanapun, jika pembolehubah bersandar bersifat multidimensi, penjumlahan nilai pembolehubah adalah tidak sesuai.

Sebagai contoh, biarkan pembolehubah bersandar terdiri daripada empat penunjuk kejayaan dalam masyarakat. Setiap penunjuk mencirikan aspek aktiviti manusia yang bebas sepenuhnya (contohnya, kejayaan profesional, kejayaan dalam perniagaan, kesejahteraan keluarga, dll.). Menambah pembolehubah ini adalah seperti menambah epal dan oren. Jumlah pembolehubah ini tidak akan menjadi ukuran satu dimensi yang sesuai. Oleh itu, data sedemikian mesti dianggap sebagai penunjuk multidimensi dalam analisis pelbagai variasi bagi varians.

Analisis kontras dan ujian post hoc

Mengapakah set purata yang berasingan dibandingkan?

Lazimnya, hipotesis tentang data eksperimen tidak hanya dirumuskan dari segi kesan utama atau interaksi. Contohnya ialah hipotesis ini: buku teks tertentu meningkatkan kemahiran matematik hanya dalam kalangan pelajar lelaki, manakala buku teks lain lebih kurang berkesan untuk kedua-dua jantina, tetapi masih kurang berkesan untuk lelaki. Ia boleh diramalkan bahawa keberkesanan buku teks berinteraksi dengan jantina pelajar. Walau bagaimanapun, ramalan ini juga terpakai alam semula jadi interaksi. Perbezaan yang ketara antara jantina dijangka bagi pelajar yang menggunakan satu buku dan keputusan hampir bebas mengikut jantina untuk pelajar yang menggunakan buku yang lain. Hipotesis jenis ini biasanya diperiksa menggunakan analisis kontras.

Analisis Kontras

Ringkasnya, analisis kontras membolehkan seseorang menilai kepentingan statistik kombinasi linear tertentu kesan kompleks. Analisis kontras adalah utama dan elemen yang diperlukan sebarang reka bentuk ANOVA yang kompleks. Modul Analisis varians sudah cukup pelbagai kemungkinan analisis kontras, yang membolehkan anda mengasingkan dan menganalisis sebarang jenis perbandingan cara.

Sebuah posterior perbandingan

Kadangkala, hasil daripada pemprosesan percubaan, kesan yang tidak dijangka ditemui. Walaupun dalam kebanyakan kes peneroka kreatif boleh menjelaskan sebarang keputusan, ini tidak memberi peluang untuk analisis lanjut dan mendapatkan anggaran untuk ramalan. Masalah ini adalah salah satu daripadanya kriteria posterior, iaitu kriteria yang tidak digunakan a priori hipotesis. Untuk menggambarkan, pertimbangkan eksperimen berikut. Mari kita anggap bahawa terdapat 100 kad yang mengandungi nombor dari 1 hingga 10. Meletakkan semua kad ini dalam topi, kita secara rawak memilih 5 kad 20 kali, dan mengira nilai purata (purata nombor yang ditulis pada kad) untuk setiap sampel. Bolehkah anda menjangkakan bahawa akan ada dua sampel yang caranya berbeza dengan ketara? Ini sangat masuk akal! Dengan memilih dua sampel dengan min maksimum dan minimum, anda boleh memperoleh perbezaan min yang sangat berbeza daripada perbezaan min, contohnya, dua sampel pertama. Perbezaan ini boleh diterokai, sebagai contoh, menggunakan analisis kontras. Tanpa pergi ke butiran, terdapat beberapa yang dipanggil posterior kriteria yang berdasarkan tepat pada senario pertama (mengambil cara yang melampau daripada 20 sampel), iaitu kriteria ini adalah berdasarkan memilih cara yang paling berbeza untuk membandingkan semua cara dalam reka bentuk. Kriteria ini digunakan untuk memastikan bahawa kesan buatan tidak diperoleh secara kebetulan semata-mata, sebagai contoh, untuk mengesan perbezaan yang ketara antara cara apabila tiada. Modul Analisis varians menawarkan pelbagai kriteria sedemikian. Apabila keputusan yang tidak dijangka ditemui dalam eksperimen yang melibatkan beberapa kumpulan, maka posterior prosedur untuk mengkaji kepentingan statistik keputusan yang diperolehi.

Jumlah kuasa dua jenis I, II, III dan IV

Regresi multivariate dan analisis varians

wujud hubungan rapat antara kaedah regresi multivariate dan analisis varians (analisis variasi). Dalam kedua-dua kaedah ia dikaji model linear. Ringkasnya, hampir semua reka bentuk eksperimen boleh diperiksa menggunakan regresi multivariate. Pertimbangkan reka bentuk 2 x 2 antara kumpulan mudah berikut.

D.V. A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Lajur A dan B mengandungi kod yang mencirikan tahap faktor A dan B, lajur AxB mengandungi hasil darab dua lajur A dan B. Kita boleh menganalisis data ini menggunakan regresi multivariate. Pembolehubah D.V. ditakrifkan sebagai pembolehubah bersandar, pembolehubah daripada A kepada AxB sebagai pembolehubah bebas. Kajian kepentingan bagi pekali regresi akan bertepatan dengan pengiraan dalam analisis varians kepentingan kesan utama faktor. A Dan B dan kesan interaksi AxB.

Pelan yang tidak seimbang dan seimbang

Apabila mengira matriks korelasi untuk semua pembolehubah, seperti data yang digambarkan di atas, anda akan melihat bahawa kesan utama faktor A Dan B dan kesan interaksi AxB tidak berkorelasi. Sifat kesan ini juga dipanggil ortogonal. Mereka mengatakan kesannya A Dan B - ortogon atau berdikari daripada satu sama lain. Jika semua kesan dalam pelan adalah ortogon antara satu sama lain, seperti dalam contoh di atas, maka pelan itu dikatakan sebagai seimbang.

Pelan seimbang mempunyai "harta yang baik." Pengiraan untuk menganalisis rancangan sedemikian adalah sangat mudah. Semua pengiraan bermula untuk mengira korelasi antara kesan dan pembolehubah bersandar. Oleh kerana kesannya adalah ortogonal, korelasi separa (seperti sepenuhnya pelbagai dimensi regresi) tidak dikira. Walau bagaimanapun, dalam kehidupan sebenar rancangan tidak selalu seimbang.

Mari kita pertimbangkan data sebenar dengan bilangan pemerhatian yang tidak sama dalam sel.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Jika kita mengodkan data ini seperti di atas dan mengira matriks korelasi untuk semua pembolehubah, kita dapati faktor reka bentuk berkorelasi antara satu sama lain. Faktor dalam rancangan tidak lagi ortogonal dan rancangan sedemikian dipanggil tidak seimbang. Ambil perhatian bahawa dalam contoh yang sedang dipertimbangkan, korelasi antara faktor sepenuhnya disebabkan oleh perbezaan frekuensi 1 dan -1 dalam lajur matriks data. Dalam erti kata lain, reka bentuk eksperimen dengan volum sel yang tidak sama (lebih tepat, volum tidak seimbang) akan menjadi tidak seimbang, bermakna kesan utama dan interaksi akan dikelirukan. Dalam kes ini, regresi multivariate penuh mesti dikira untuk mengira kepentingan statistik kesan. Terdapat beberapa strategi di sini.

Jumlah kuasa dua jenis I, II, III dan IV

Jumlah jenis kuasa duasayaDanIII. Untuk mengkaji kepentingan setiap faktor dalam model multivariat, korelasi separa bagi setiap faktor boleh dikira, dengan syarat semua faktor lain sudah diambil kira dalam model. Anda juga boleh memasukkan faktor ke dalam model langkah demi langkah, membetulkan semua faktor yang telah dimasukkan ke dalam model dan mengabaikan semua faktor lain. Secara umum, ini adalah perbezaan antara taip III Dan taipsaya jumlah segi empat sama (istilah ini diperkenalkan dalam SAS, lihat, sebagai contoh, SAS, 1982; perbincangan terperinci juga boleh didapati dalam Searle, 1987, hlm. 461; Woodward, Bonett, dan Brecht, 1990, hlm. 216; atau Milliken dan Johnson, 1984, hlm 138).

Jumlah jenis kuasa duaII. Strategi pembentukan model "perantaraan" seterusnya terdiri daripada: mengawal semua kesan utama apabila mengkaji kepentingan satu kesan utama; dalam mengawal semua kesan utama dan semua interaksi berpasangan apabila meneliti kepentingan interaksi berpasangan individu; dalam mengawal semua kesan utama semua interaksi berpasangan dan semua interaksi tiga faktor; apabila mengkaji interaksi individu tiga faktor, dsb. Jumlah kuasa dua untuk kesan yang dikira dengan cara ini dipanggil taipII jumlah kuasa dua. Jadi, taipII jumlah kuasa dua mengawal semua kesan tertib yang sama dan lebih rendah, sambil mengabaikan semua kesan tertib lebih tinggi.

Jumlah jenis kuasa duaIV. Akhir sekali, untuk beberapa pelan khas dengan sel yang hilang (pelan tidak lengkap), adalah mungkin untuk mengira apa yang dipanggil taip IV jumlah kuasa dua. Kaedah ini akan dibincangkan kemudian berkaitan dengan reka bentuk yang tidak lengkap (reka bentuk dengan sel yang hilang).

Tafsiran hipotesis hasil tambah kuasa dua jenis I, II, dan III

Jumlah kuasa dua taipIII paling mudah untuk ditafsirkan. Ingat bahawa jumlah kuasa dua taipIII periksa kesan selepas mengawal semua kesan lain. Sebagai contoh, selepas menemui signifikan secara statistik taipIII kesan untuk faktor A dalam modul Analisis varians, kita boleh mengatakan bahawa terdapat satu kesan ketara faktor tersebut A, selepas memperkenalkan semua kesan (faktor) lain dan mentafsir kesan ini dengan sewajarnya. Dalam mungkin 99% daripada semua aplikasi ANOVA, ini adalah jenis ujian yang penyelidik minati. Jenis jumlah kuasa dua ini biasanya dikira dalam modulo Analisis varians secara lalai, tidak kira sama ada pilihan itu dipilih Pendekatan regresi atau tidak (pendekatan standard yang diterima pakai dalam modul Analisis varians dibincangkan di bawah).

Kesan ketara diperoleh menggunakan jumlah kuasa dua taip atau taipII jumlah kuasa dua tidak begitu mudah untuk ditafsirkan. Mereka ditafsirkan dengan terbaik dalam konteks regresi multivariat berperingkat. Jika, apabila menggunakan jumlah kuasa dua taipsaya kesan utama faktor B adalah signifikan (selepas faktor A dimasukkan ke dalam model, tetapi sebelum interaksi antara A dan B ditambah), kita boleh membuat kesimpulan bahawa terdapat kesan utama faktor B yang signifikan, dengan syarat tiada interaksi antara faktor A dan B. (Jika menggunakan kriteria taipIII, faktor B juga ternyata signifikan, maka kita boleh membuat kesimpulan bahawa terdapat kesan utama yang signifikan dari faktor B, selepas memperkenalkan semua faktor lain dan interaksinya ke dalam model).

Dari segi marginal bermaksud hipotesis taipsaya Dan taipII biasanya tidak mempunyai tafsiran yang mudah. Dalam kes ini, dikatakan bahawa seseorang tidak boleh mentafsir kepentingan kesan dengan melihat hanya pada cara marginal. Sebaliknya dibentangkan hlm min adalah berkaitan dengan hipotesis kompleks yang menggabungkan min dan saiz sampel. Sebagai contoh, taipII hipotesis untuk faktor A dalam contoh mudah reka bentuk 2 x 2 yang dibincangkan sebelum ini ialah (lihat Woodward, Bonett, dan Brecht, 1990, hlm. 219):

nij- bilangan pemerhatian dalam sel

uij- nilai purata dalam sel

n. j- purata marginal

Tanpa perincian (untuk butiran lanjut, lihat Milliken dan Johnson, 1984, bab 10), adalah jelas bahawa ini bukanlah hipotesis mudah dan dalam kebanyakan kes tiada satu pun daripada mereka yang menarik minat penyelidik. Walau bagaimanapun, terdapat kes apabila hipotesis taipsaya mungkin menarik.

Pendekatan pengiraan lalai dalam modul Analisis varians

Lalai jika pilihan tidak ditanda Pendekatan regresi, modul Analisis varians kegunaan model purata sel. Ciri model ini ialah jumlah kuasa dua untuk kesan yang berbeza dikira untuk gabungan linear min sel. Dalam eksperimen faktorial penuh, ini menghasilkan jumlah kuasa dua yang sama dengan jumlah kuasa dua yang dibincangkan sebelum ini sebagai taip III. Walau bagaimanapun, dalam pilihan Perbandingan terancang(dalam tingkap keputusan ANOVA), pengguna boleh menguji hipotesis terhadap sebarang kombinasi linear bagi cara sel berwajaran atau tidak berwajaran. Oleh itu, pengguna boleh menguji bukan sahaja hipotesis taipIII, tetapi sebarang jenis hipotesis (termasuk taipIV). ini pendekatan umum amat berguna apabila memeriksa pelan dengan sel yang hilang (dipanggil pelan tidak lengkap).

Untuk reka bentuk faktorial penuh, pendekatan ini juga berguna apabila seseorang ingin menganalisis cara marginal berwajaran. Sebagai contoh, katakan dalam reka bentuk 2 x 2 mudah yang dipertimbangkan sebelum ini, kita perlu membandingkan wajaran (mengikut tahap faktor B) cara marginal untuk faktor A. Ini berguna apabila taburan cerapan merentas sel tidak disediakan oleh penguji, tetapi dibina secara rawak, dan rawak ini dicerminkan dalam taburan bilangan cerapan merentas tahap faktor B dalam agregat.

Sebagai contoh, terdapat faktor - umur janda. Sampel responden yang mungkin dibahagikan kepada dua kumpulan: bawah 40 tahun dan lebih 40 tahun (faktor B). Faktor kedua (Faktor A) dalam rancangan itu ialah sama ada balu menerima sokongan sosial daripada beberapa agensi atau tidak (sesetengah balu dipilih secara rawak, yang lain bertindak sebagai kawalan). Dalam kes ini, taburan balu mengikut umur dalam sampel menggambarkan taburan sebenar balu mengikut umur dalam populasi. Menilai keberkesanan kumpulan sokongan sosial untuk balu semua peringkat umur akan sepadan dengan purata wajaran kedua-duanya kumpulan umur(dengan pemberat sepadan dengan bilangan pemerhatian dalam kumpulan).

Perbandingan terancang

Ambil perhatian bahawa jumlah pekali kontras yang dimasukkan tidak semestinya sama dengan 0 (sifar). Sebaliknya, program akan membuat pelarasan secara automatik untuk memastikan bahawa hipotesis yang sepadan tidak dikelirukan dengan purata keseluruhan.

Untuk menggambarkan ini, mari kita kembali kepada pelan 2 x 2 mudah yang dibincangkan sebelum ini. Ingat bahawa bilangan cerapan dalam sel reka bentuk tidak seimbang ini ialah -1, 2, 3, dan 1. Katakan kita ingin membandingkan min marginal berwajaran untuk faktor A (ditimbang dengan kekerapan tahap faktor B). Anda boleh memasukkan pekali kontras:

Ambil perhatian bahawa pekali ini tidak menambah sehingga 0. Program ini akan menetapkan pekali supaya ia menambah sehingga 0, sambil mengekalkan pekalinya. nilai relatif, iaitu:

1/3 2/3 -3/4 -1/4

Perbezaan ini akan membandingkan min berwajaran untuk faktor A.

Hipotesis tentang purata prinsipal. Hipotesis bahawa min prinsipal tidak berwajaran ialah 0 boleh diterokai menggunakan pekali:

Hipotesis bahawa min prinsipal berwajaran ialah 0 diuji menggunakan:

Program ini tidak melaraskan nisbah kontras.

Analisis rancangan dengan sel yang hilang (pelan tidak lengkap)

Reka bentuk faktor yang mengandungi sel kosong (kombinasi pemprosesan sel yang tidak mempunyai pemerhatian) dipanggil tidak lengkap. Dalam reka bentuk sedemikian, beberapa faktor biasanya tidak ortogon dan beberapa interaksi tidak boleh dikira. Tidak wujud sama sekali kaedah terbaik analisis rancangan tersebut.

Pendekatan regresi

Dalam beberapa program lama yang berdasarkan analisis reka bentuk ANOVA menggunakan regresi multivariate, faktor dalam reka bentuk tidak lengkap ditetapkan secara lalai dengan cara biasa(seolah-olah rancangan itu telah selesai). Kemudian multidimensi analisis regresi untuk faktor berkod tiruan ini. Malangnya, kaedah ini menghasilkan keputusan yang sangat sukar, jika tidak mustahil, untuk ditafsirkan kerana tidak jelas bagaimana setiap kesan menyumbang kepada gabungan linear cara. Pertimbangkan contoh mudah berikut.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 terlepas

Jika kita melakukan regresi multivariate borang Pembolehubah Bersandar = Dimalarkan + Faktor A + Faktor B, maka hipotesis tentang kepentingan faktor A dan B dari segi kombinasi linear min kelihatan seperti ini:

Faktor A: Sel A1,B1 = Sel A2,B1

Faktor B: Sel A1,B1 = Sel A1,B2

Kes ini mudah sahaja. Dalam reka bentuk yang lebih kompleks, adalah mustahil untuk menentukan apa sebenarnya yang akan diperiksa.

Sel bermaksud, pendekatan ANOVA , Hipotesis jenis IV

Pendekatan yang disyorkan dalam kesusasteraan dan yang kelihatan lebih baik adalah untuk mengkaji yang bermakna (dari segi persoalan kajian) a priori hipotesis tentang cara yang diperhatikan dalam sel rancangan. Perbincangan terperinci mengenai pendekatan ini boleh didapati dalam Dodge (1985), Heiberger (1989), Milliken dan Johnson (1984), Searle (1987), atau Woodward, Bonett, dan Brecht (1990). Jumlah kuasa dua yang dikaitkan dengan hipotesis tentang gabungan linear min dalam reka bentuk tidak lengkap yang meneliti anggaran sebahagian daripada kesan juga dipanggil jumlah kuasa dua. IV.

Penjanaan automatik jenis hipotesisIV. Apabila rancangan multifaktorial telah watak yang kompleks sel yang hilang, adalah dinasihatkan untuk mentakrifkan hipotesis ortogonal (bebas), kajiannya bersamaan dengan kajian kesan atau interaksi utama. Strategi algoritma (pengiraan) (berdasarkan matriks reka bentuk pseudo-songsang) telah dibangunkan untuk menjana pemberat yang sesuai untuk perbandingan tersebut. Malangnya, hipotesis akhir tidak ditakrifkan dengan cara yang unik. Sudah tentu, mereka bergantung pada susunan kesan yang dikenal pasti dan jarang membenarkan tafsiran mudah. Oleh itu, adalah disyorkan untuk mengkaji dengan teliti sifat sel yang hilang, kemudian merumuskan hipotesis taipIV, yang paling bermakna sesuai dengan objektif kajian. Kemudian terokai hipotesis ini menggunakan pilihan Perbandingan terancang dalam tingkap Keputusan. Kebanyakan cara mudah nyatakan perbandingan dalam kes ini - memerlukan pengenalan vektor kontras untuk semua faktor bersama-sama dalam tingkap Perbandingan terancang. Selepas memanggil kotak dialog Perbandingan terancang Semua kumpulan dalam pelan semasa akan ditunjukkan dan kumpulan yang hilang akan ditanda.

Sel hilang dan ujian untuk kesan tertentu

Terdapat beberapa jenis reka bentuk di mana lokasi sel yang hilang tidak rawak, tetapi dirancang dengan teliti, membolehkan analisis mudah kesan utama tanpa menjejaskan kesan lain. Contohnya, apabila bilangan sel yang diperlukan dalam pelan tidak tersedia, pelan sering digunakan Petak Latin untuk menganggar kesan utama beberapa faktor dengan sebilangan besar peringkat. Sebagai contoh, reka bentuk faktorial 4 x 4 x 4 x 4 memerlukan 256 sel. Pada masa yang sama anda boleh menggunakan Dataran Yunani-Latin untuk menganggarkan kesan utama dengan hanya 16 sel dalam reka bentuk (Bab Perancangan eksperimen, jilid IV, mengandungi penerangan terperinci rancangan sedemikian). Reka bentuk yang tidak lengkap di mana kesan utama (dan beberapa interaksi) boleh dianggarkan menggunakan kombinasi linear mudah cara dipanggil rancangan yang tidak lengkap seimbang.

Dalam reka bentuk seimbang, kaedah piawai (lalai) untuk menjana kontras (berat) untuk kesan utama dan interaksi kemudiannya akan menghasilkan jadual analisis varians di mana jumlah kuasa dua untuk kesan masing-masing tidak dikelirukan antara satu sama lain. Pilihan Kesan khusus tingkap Keputusan akan menjana kontras yang hilang dengan menulis sifar pada sel pelan yang hilang. Sejurus selepas pilihan diminta Kesan khusus bagi pengguna yang memeriksa beberapa hipotesis, jadual keputusan muncul dengan pemberat sebenar. Ambil perhatian bahawa dalam reka bentuk yang seimbang, jumlah kuasa dua kesan yang sepadan hanya dikira jika kesan tersebut adalah ortogonal (bebas) kepada semua kesan dan interaksi utama yang lain. Jika tidak, anda perlu menggunakan pilihan Perbandingan terancang untuk meneroka perbandingan bermakna antara cara.

Sel hilang dan kesan terkumpul/istilah ralat

Jika pilihan Pendekatan regresi dalam panel permulaan modul Analisis varians tidak dipilih, model purata sel akan digunakan apabila mengira jumlah kuasa dua untuk kesan (tetapan lalai). Jika reka bentuk tidak seimbang, maka apabila menggabungkan kesan bukan ortogon (lihat perbincangan di atas tentang pilihan Sel terlepas dan kesan khusus) seseorang boleh mendapatkan jumlah segi empat sama yang terdiri daripada komponen bukan ortogon (atau bertindih). Keputusan yang diperoleh biasanya tidak dapat ditafsirkan. Oleh itu, seseorang mesti berhati-hati apabila memilih dan melaksanakan reka bentuk eksperimen yang tidak lengkap yang kompleks.

Terdapat banyak buku dengan perbincangan terperinci tentang rancangan jenis yang berbeza. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken dan Johnson, 1984; Searle, 1987; Woodward dan Bonett, 1990), tetapi jenis maklumat ini berada di luar skop buku teks ini. Walau bagaimanapun, analisis akan ditunjukkan kemudian dalam bahagian ini. pelbagai jenis rancangan.

Andaian dan kesan pelanggaran andaian

Sisihan daripada andaian taburan normal

Katakan pembolehubah bersandar diukur pada skala berangka. Mari kita juga andaikan bahawa pembolehubah bersandar mempunyai taburan normal dalam setiap kumpulan. Analisis varians mengandungi pelbagai graf dan statistik untuk menyokong andaian ini.

Kesan gangguan. sama sekali F ujian ini sangat teguh kepada penyelewengan daripada kenormalan (untuk keputusan terperinci, lihat Lindman, 1974). Jika kurtosis lebih besar daripada 0, maka nilai statistik ialah F mungkin menjadi sangat kecil. Hipotesis nol diterima, walaupun ia mungkin tidak benar. Keadaan menjadi terbalik apabila kurtosis kurang daripada 0. Kecondongan pengedaran biasanya mempunyai sedikit kesan pada F perangkaan. Jika bilangan cerapan dalam sel cukup besar, maka sisihan daripada normaliti tidak begitu ketara disebabkan oleh pusat teorem had , mengikut mana taburan nilai purata adalah hampir normal, tanpa mengira taburan awal. Perbincangan terperinci tentang kemampanan F statistik boleh didapati dalam Box dan Anderson (1955), atau Lindman (1974).

Keseragaman varians

Andaian. Diandaikan bahawa varians kumpulan reka bentuk yang berbeza adalah sama. Andaian ini dipanggil andaian kehomogenan varians. Ingat bahawa pada permulaan bahagian ini, apabila menerangkan pengiraan jumlah ralat kuasa dua, kami melakukan penjumlahan dalam setiap kumpulan. Jika varians dalam dua kumpulan berbeza antara satu sama lain, maka penambahannya adalah tidak begitu semula jadi dan tidak memberikan anggaran jumlah varians dalam kumpulan (kerana dalam kes ini tiada jumlah varians sama sekali). Modul Analisis varians -ANOVA/MANOVA mengandungi satu set besar kriteria statistik mengesan sisihan daripada kehomogenan andaian varians.

Kesan gangguan. Lindman (1974, hlm. 33) menunjukkan bahawa F kriterianya agak stabil berkenaan dengan pelanggaran andaian kehomogenan varians ( kepelbagaian varians, lihat juga Box, 1954a, 1954b; Hsu, 1938).

Kes khas: korelasi min dan varians. Ada masanya F statistik boleh menyesatkan. Ini berlaku apabila cara sel reka bentuk dikaitkan dengan varians. Modul Analisis varians membolehkan anda membina plot serakan atau sisihan piawai berbanding dengan purata untuk mengesan korelasi tersebut. Sebab mengapa korelasi ini berbahaya adalah seperti berikut. Mari kita bayangkan bahawa terdapat 8 sel dalam pelan, 7 daripadanya mempunyai purata yang hampir sama, dan dalam satu sel puratanya jauh lebih tinggi daripada yang lain. Kemudian F ujian mungkin mengesan kesan yang signifikan secara statistik. Tetapi andaikan bahawa dalam sel dengan nilai purata yang besar varians adalah jauh lebih besar daripada yang lain, i.e. nilai purata dan varians dalam sel adalah bergantung (lebih tinggi purata, lebih besar varians). Dalam kes ini, purata yang besar tidak boleh dipercayai kerana ia mungkin disebabkan oleh varians yang besar dalam data. Namun begitu F statistik berdasarkan bersatu varians dalam sel akan menangkap min besar, walaupun ujian berdasarkan varians dalam setiap sel tidak akan menganggap semua perbezaan dalam min sebagai signifikan.

Jenis data ini (min besar dan varians besar) sering berlaku apabila terdapat pemerhatian yang lebih jauh. Satu atau dua pemerhatian outlier sangat mengalihkan min dan meningkatkan varians.

Kehomogenan Varians dan Kovarians

Andaian. Reka bentuk multivariat dengan ukuran bergantung multivariat juga menggunakan andaian kehomogenan varians yang diterangkan sebelum ini. Walau bagaimanapun, oleh kerana terdapat pembolehubah bersandar multivariate, ia juga dikehendaki bahawa korelasi bersama mereka (kovarians) adalah seragam merentas semua sel reka bentuk. Modul Analisis varians menawarkan cara yang berbeza untuk menguji andaian ini.

Kesan gangguan. Analog pelbagai dimensi F- kriteria - Ujian λ Wilks. Tidak banyak yang diketahui tentang keteguhan ujian Wilks λ berkenaan dengan pelanggaran andaian di atas. Walau bagaimanapun, sejak tafsiran hasil modul Analisis varians biasanya berdasarkan kepentingan kesan univariat (selepas menentukan kepentingan kriteria umum), perbincangan tentang keteguhan membimbangkan terutamanya analisis varians univariat. Oleh itu, kepentingan kesan univariat perlu diperiksa dengan teliti.

Kes khas: analisis kovarians. Pelanggaran kehomogenan varians/kovarian yang teruk boleh berlaku apabila kovariat dimasukkan ke dalam reka bentuk. Khususnya, jika korelasi antara kovariat dan ukuran bergantung berbeza-beza merentasi sel dalam reka bentuk, salah tafsir keputusan mungkin berlaku. Ingat bahawa analisis kovarians pada asasnya melakukan analisis regresi dalam setiap sel untuk mengasingkan bahagian varians yang diambil kira oleh kovariat. Kehomogenan varians/andaian kovarians membayangkan bahawa analisis regresi ini dijalankan di bawah kekangan berikut: semua persamaan regresi(cerun) adalah sama untuk semua sel. Jika ini tidak dijangka, maka mungkin muncul kesilapan besar. Modul Analisis varians mempunyai beberapa kriteria khas untuk menguji andaian ini. Adalah dinasihatkan untuk menggunakan kriteria ini untuk memastikan persamaan regresi untuk sel yang berbeza adalah lebih kurang sama.

Sphericity dan simetri kompleks: sebab untuk menggunakan pendekatan multivariate untuk mengukur berulang dalam analisis varians

Dalam reka bentuk yang mengandungi faktor ukuran berulang dengan lebih daripada dua tahap, penggunaan ANOVA univariat memerlukan andaian tambahan: andaian simetri kompaun dan andaian sfera. Andaian ini jarang dipenuhi (lihat di bawah). Oleh itu, dalam tahun kebelakangan ini analisis multivariat varians telah mendapat populariti dalam reka bentuk sedemikian (kedua-dua pendekatan digabungkan dalam modul Analisis varians).

Andaian simetri kompleks Andaian simetri kompaun ialah varians (dikongsi dalam kumpulan) dan kovarians (dikongsi dalam kumpulan) untuk ukuran berulang yang berbeza adalah homogen (sama). Ini adalah syarat yang mencukupi untuk ujian F univariate untuk langkah berulang menjadi sah (iaitu, nilai F yang dilaporkan secara purata konsisten dengan taburan F). Walau bagaimanapun, dalam dalam kes ini syarat ini tidak perlu.

Andaian sfera. Andaian sfera adalah perlu dan keadaan yang mencukupi supaya ujian F menjadi sah. Ia terdiri daripada fakta bahawa dalam kumpulan semua pemerhatian adalah bebas dan diagihkan sama rata. Sifat andaian ini, dan kesan pelanggarannya, biasanya tidak diterangkan dengan baik dalam buku tentang ANOVA - ini akan dibincangkan dalam perenggan berikut. Ia juga akan ditunjukkan bahawa keputusan pendekatan univariat mungkin berbeza daripada hasil pendekatan multivariate, dan ia akan dijelaskan maksudnya.

Keperluan untuk kebebasan hipotesis. Cara umum untuk menganalisis data dalam ANOVA ialah pemasangan model. Jika, berbanding model yang sesuai dengan data, terdapat beberapa a priori hipotesis, maka varians dipecahkan untuk menguji hipotesis ini (ujian kesan utama, interaksi). Dari sudut pengiraan, pendekatan ini menghasilkan satu set kontras (satu set perbandingan cara pelan). Walau bagaimanapun, jika kontras tidak bebas antara satu sama lain, pembahagian varians menjadi tidak bermakna. Sebagai contoh, jika dua kontras A Dan B adalah sama dan bahagian varians yang sepadan diekstrak, kemudian bahagian yang sama diekstrak dua kali. Sebagai contoh, adalah bodoh dan sia-sia untuk mengenal pasti dua hipotesis: "min dalam sel 1 adalah lebih tinggi daripada min dalam sel 2" dan "min dalam sel 1 adalah lebih tinggi daripada min dalam sel 2." Jadi, hipotesis mestilah bebas atau ortogon.

Hipotesis bebas dalam langkah berulang. Algoritma umum, dilaksanakan dalam modul Analisis varians, akan cuba menjana kontras bebas (ortogon) untuk setiap kesan. Untuk faktor langkah berulang, kontras ini memberikan banyak hipotesis mengenai perbezaan antara tahap faktor yang dipertimbangkan. Walau bagaimanapun, jika perbezaan ini dikaitkan dalam kumpulan, maka kontras yang terhasil tidak lagi bebas. Sebagai contoh, dalam pengajaran di mana pelajar diukur tiga kali dalam satu semester, mungkin berlaku perubahan antara pengukuran pertama dan kedua berkorelasi negatif dengan perubahan antara pengukuran kedua dan ketiga subjek. Mereka yang kebanyakan menguasai bahan antara dimensi 1 dan 2, mereka menguasai bahagian yang lebih kecil sepanjang masa yang berlalu antara dimensi ke-2 dan ke-3. Malah, bagi kebanyakan kes di mana ANOVA digunakan untuk langkah berulang, perubahan merentas tahap boleh diandaikan berkorelasi merentas subjek. Walau bagaimanapun, apabila ini berlaku, andaian simetri kompleks dan andaian sfera tidak kekal dan kontras bebas tidak boleh dikira.

Kesan pelanggaran dan cara membetulkannya. Apabila andaian simetri atau sfera kompleks tidak dipenuhi, ANOVA mungkin menghasilkan keputusan yang salah. Sebelum prosedur multivariate dibangunkan dengan secukupnya, beberapa andaian telah dicadangkan untuk mengimbangi pelanggaran andaian ini. (Lihat, sebagai contoh, Rumah Hijau & Geisser, 1959 dan Huynh & Feldt, 1970). Kaedah ini masih digunakan secara meluas (itulah sebabnya ia dibentangkan dalam modul Analisis varians).

Analisis pelbagai variasi pendekatan varians kepada langkah berulang. Secara umum, masalah simetri kompleks dan sfera berkaitan dengan fakta bahawa set kontras yang termasuk dalam kajian kesan faktor langkah berulang (dengan lebih daripada 2 tahap) tidak bebas antara satu sama lain. Walau bagaimanapun, mereka tidak perlu berdikari jika digunakan pelbagai dimensi kriteria untuk pengesahan serentak kepentingan statistik dua atau lebih kontras faktor ukuran berulang. Inilah sebab mengapa analisis pelbagai variasi teknik varians telah semakin digunakan untuk menguji kepentingan faktor ukuran berulang univariat dengan lebih daripada 2 tahap. Pendekatan ini diterima secara meluas kerana ia secara amnya tidak memerlukan simetri atau sfera yang kompleks.

Kes di mana analisis multivariat pendekatan varians tidak boleh digunakan. Terdapat contoh (reka bentuk) di mana analisis multivariate pendekatan varians tidak boleh digunakan. Ini biasanya kes di mana terdapat sebilangan kecil subjek dalam reka bentuk dan banyak tahap dalam faktor langkah berulang. Mungkin terdapat terlalu sedikit pemerhatian untuk menjalankan analisis multivariate. Sebagai contoh, jika terdapat 12 mata pelajaran, hlm = 4 faktor ukuran berulang, dan setiap faktor mempunyai k = 3 peringkat. Maka interaksi 4 faktor akan "memakan" (k-1)P = 2 4 = 16 darjah kebebasan. Walau bagaimanapun, terdapat hanya 12 subjek, jadi ujian multivariate tidak boleh dilakukan dalam contoh ini. Modul Analisis varians akan mengesan pemerhatian ini secara bebas dan mengira kriteria satu dimensi sahaja.

Perbezaan hasil univariate dan multivariate. Sekiranya kajian melibatkan sejumlah besar langkah berulang, mungkin terdapat kes di mana pendekatan ANOVA langkah berulang univariat menghasilkan keputusan yang sangat berbeza daripada yang diperoleh dengan pendekatan multivariat. Ini bermakna perbezaan antara tahap langkah berulang yang sepadan adalah berkorelasi merentas subjek. Kadang-kadang fakta ini mempunyai kepentingan bebas.

Analisis pelbagai variasi bagi varians dan pemodelan persamaan struktur

Dalam beberapa tahun kebelakangan ini, pemodelan persamaan struktur telah menjadi popular sebagai alternatif kepada analisis pelbagai variasi varians (lihat, sebagai contoh, Bagozzi dan Yi, 1989; Bagozzi, Yi, dan Singh, 1991; Cole, Maxwell, Arvey, dan Salas, 1993) . Pendekatan ini membolehkan menguji hipotesis bukan sahaja tentang min dalam kumpulan yang berbeza, tetapi juga tentang matriks korelasi pembolehubah bersandar. Sebagai contoh, seseorang boleh melonggarkan andaian kehomogenan varians dan kovarians dan secara eksplisit memasukkan varians ralat dan kovarians dalam model untuk setiap kumpulan. Modul STATISTIKAPemodelan Persamaan Struktur (SEPATH) (lihat Jilid III) membenarkan analisis sedemikian.

Analisis varians

1. Konsep analisis varians

Analisis varians ialah analisis kebolehubahan sesuatu sifat di bawah pengaruh mana-mana faktor pembolehubah terkawal. Dalam kesusasteraan asing, analisis varians sering dirujuk sebagai ANOVA, yang diterjemahkan sebagai analisis kebolehubahan (Analysis of Variance).

masalah ANOVA terdiri dalam mengasingkan kebolehubahan jenis yang berbeza daripada kebolehubahan am sifat:

a) kebolehubahan disebabkan oleh tindakan setiap pembolehubah bebas yang dikaji;

b) kebolehubahan disebabkan oleh interaksi pembolehubah bebas yang dikaji;

c) kebolehubahan rawak disebabkan semua pembolehubah lain yang tidak diketahui.

Kebolehubahan disebabkan oleh tindakan pembolehubah yang dikaji dan interaksinya dikaitkan dengan kebolehubahan rawak. Penunjuk hubungan ini ialah ujian Fisher's F.

Formula untuk mengira kriteria F termasuk anggaran varians, iaitu, parameter taburan atribut, oleh itu kriteria F ialah kriteria parametrik.

Semakin banyak kebolehubahan sesuatu sifat disebabkan oleh pembolehubah (faktor) yang dikaji atau interaksinya, semakin tinggi nilai kriteria empirikal.

Sifar hipotesis dalam analisis varians akan menyatakan bahawa nilai purata ciri berkesan yang dikaji adalah sama dalam semua penggredan.

Alternatif hipotesis akan menyatakan bahawa nilai purata ciri yang terhasil dalam penggredan berbeza faktor yang dikaji adalah berbeza.

Analisis varians membolehkan kita menyatakan perubahan dalam ciri, tetapi tidak menunjukkan arah perubahan ini.

Mari kita mulakan pertimbangan analisis varians dengan kes paling mudah, apabila kita mengkaji tindakan hanya satu pembolehubah (satu faktor).

2. Analisis varians sehala untuk sampel yang tidak berkaitan

2.1. Tujuan kaedah

Kaedah analisis satu faktor varians digunakan dalam kes di mana perubahan dalam ciri berkesan dikaji di bawah pengaruh perubahan keadaan atau penggredan faktor. Dalam versi kaedah ini, pengaruh setiap penggredan faktor adalah berbeza sampel mata pelajaran. Mesti ada sekurang-kurangnya tiga penggredan faktor. (Mungkin terdapat dua penggredan, tetapi dalam kes ini kita tidak akan dapat mewujudkan kebergantungan bukan linear dan nampaknya lebih munasabah untuk menggunakan yang lebih mudah).

Versi bukan parametrik bagi jenis analisis ini ialah ujian Kruskal-Wallis H.

Hipotesis

H 0: Perbezaan antara gred faktor (keadaan berbeza) tidak lebih besar daripada perbezaan rawak dalam setiap kumpulan.

H 1: Perbezaan antara gred faktor (keadaan berbeza) adalah lebih besar daripada perbezaan rawak dalam setiap kumpulan.

2.2. Had Analisis Satu Hala Varians untuk Sampel Tidak Berkaitan

1. Analisis varians sehala memerlukan sekurang-kurangnya tiga penggredan faktor dan sekurang-kurangnya dua subjek dalam setiap penggredan.

2. Ciri yang terhasil mestilah diedarkan secara normal dalam sampel yang dikaji.

Benar, ia biasanya tidak ditunjukkan sama ada kita bercakap tentang pengedaran ciri dalam keseluruhan sampel yang dikaji atau di bahagian itu yang membentuk kompleks penyebaran.

3. Contoh penyelesaian masalah menggunakan kaedah analisis varians sehala bagi sampel yang tidak berkaitan menggunakan contoh:

Tiga kumpulan berbeza enam subjek telah diberikan senarai sepuluh perkataan. Kata-kata itu disampaikan kepada kumpulan pertama pada kelajuan rendah - 1 perkataan setiap 5 saat, kepada kumpulan kedua pada kelajuan purata - 1 perkataan setiap 2 saat, dan kepada kumpulan ketiga pada kelajuan tinggi - 1 perkataan sesaat. Prestasi pengeluaran semula diramalkan bergantung pada kelajuan penyampaian perkataan. Keputusan dibentangkan dalam Jadual. 1.

Bilangan perkataan yang diterbitkan semula Jadual 1

Subjek No.

kelajuan rendah

kelajuan purata

kelajuan tinggi

Jumlah keseluruhan

H 0: Perbezaan dalam jangka masa penghasilan perkataan antara kumpulan tidak lebih ketara daripada perbezaan rawak dalam setiap kumpulan.

H1: Perbezaan dalam jumlah pengeluaran perkataan antara kumpulan lebih ketara daripada perbezaan rawak dalam setiap kumpulan. Menggunakan nilai eksperimen yang dibentangkan dalam Jadual. 1, kami akan menetapkan beberapa nilai yang diperlukan untuk mengira kriteria F.

Pengiraan kuantiti utama untuk analisis varians sehala dibentangkan dalam jadual:

Jadual 2

Jadual 3

Urutan operasi dalam analisis varians sehala untuk sampel yang tidak berkaitan

Selalunya ditemui dalam jadual ini dan seterusnya, sebutan SS ialah singkatan untuk "jumlah kuasa dua." Singkatan ini paling kerap digunakan dalam sumber terjemahan.

SS fakta bermaksud kebolehubahan ciri disebabkan oleh tindakan faktor yang dikaji;

SS secara amnya- kebolehubahan umum sifat;

S C.A.-kebolehubahan disebabkan oleh faktor yang tidak diambil kira, kebolehubahan "rawak" atau "sisa".

MS - "persegi tengah", atau jangkaan matematik jumlah kuasa dua, nilai purata SS yang sepadan.

df - bilangan darjah kebebasan, yang, apabila mempertimbangkan kriteria bukan parametrik, kami dilambangkan dengan huruf Yunani v.

Kesimpulan: H 0 ditolak. H 1 diterima. Perbezaan dalam ingatan perkataan antara kumpulan adalah lebih besar daripada perbezaan rawak dalam setiap kumpulan (α=0.05). Jadi, kelajuan penyampaian perkataan mempengaruhi jumlah pembiakan mereka.

Contoh penyelesaian masalah dalam Excel dibentangkan di bawah:

Data awal:

Menggunakan arahan: Alat->Analisis Data->ANOVA Sehala, kami mendapat keputusan berikut:

Model varians satu faktor nampak macam

di mana Xjj- nilai pembolehubah yang dikaji diperoleh pada aras g faktor (r = 1, 2,..., T) nombor siri ke-su (j- 1,2,..., p);/y - kesan disebabkan oleh pengaruh tahap ke-i faktor; e^. - komponen rawak, atau gangguan yang disebabkan oleh pengaruh faktor yang tidak terkawal, i.e. variasi pembolehubah dalam peringkat individu.

Di bawah peringkat faktor merujuk kepada beberapa ukuran atau keadaannya, contohnya, jumlah baja yang digunakan, jenis lebur logam atau bilangan kelompok bahagian, dsb.

Premis asas analisis varians.

1. Jangkaan matematik gangguan ? (/ - adalah sama dengan sifar untuk sebarang i, mereka.

  • 2. Gangguan adalah saling bebas.
  • 3. Penyerakan gangguan (atau pembolehubah Xy) adalah malar untuk sebarang ij> mereka.

4. Gangguan e# (atau pembolehubah Xy) mempunyai undang-undang biasa taburan N( 0; a 2).

Pengaruh tahap faktor boleh seperti tetap, atau sistematik(model I), dan rawak(model II).

Katakan, sebagai contoh, adalah perlu untuk mengetahui sama ada terdapat perbezaan yang ketara antara kelompok produk dari segi beberapa penunjuk kualiti, i.e. semak pengaruh ke atas kualiti satu faktor - sekumpulan produk. Jika kita memasukkan semua kelompok bahan mentah dalam kajian, maka pengaruh tahap faktor tersebut adalah sistematik (model I), dan kesimpulan yang diperoleh hanya terpakai kepada kelompok individu yang terlibat dalam kajian; jika kita memasukkan hanya bahagian parti yang dipilih secara rawak, maka pengaruh faktor adalah rawak (model II). Dalam kompleks berbilang faktor, model campuran III adalah mungkin, di mana beberapa faktor mempunyai tahap rawak, manakala yang lain mempunyai tahap tetap.

Mari kita pertimbangkan tugas ini dengan lebih terperinci. Biarlah ada T kumpulan produk. Dipilih daripada setiap kumpulan dengan sewajarnya p L, p 2 ,p t produk (untuk kesederhanaan kami menganggap bahawa u = n 2 =... = p t = p). Kami membentangkan nilai penunjuk kualiti produk ini dalam bentuk matriks pemerhatian


Adalah perlu untuk menyemak kepentingan pengaruh kumpulan produk terhadap kualitinya.

Jika kita menganggap bahawa unsur-unsur baris matriks pemerhatian adalah nilai berangka (realisasi) pembolehubah rawak X t , X 2 ,..., X t, menyatakan kualiti produk dan mempunyai undang-undang pengedaran normal dengan jangkaan matematik, masing-masing a v a 2, ..., a t dan varians serupa a 2, kemudian tugasan ini turun untuk menguji hipotesis nol #0: a v = a 2l = ... = A t, dijalankan dalam analisis varians.

Mari kita nyatakan purata dengan mana-mana indeks dengan asterisk (atau titik) dan bukannya indeks, kemudian penunjuk kualiti purata produk kumpulan ke-1, atau purata kumpulan untuk tahap ke-tiga faktor, mengambil bentuk

A purata keseluruhan -

Mari kita pertimbangkan jumlah sisihan kuasa dua pemerhatian daripada purata keseluruhan x„:

atau Q = Q, + Q 2+ ?>з Penggal lepas

kerana jumlah sisihan nilai pembolehubah daripada puratanya, i.e. ? 1.g y - x) adalah sama dengan sifar. ) =x

Istilah pertama boleh ditulis dalam bentuk

Akibatnya, kami memperoleh identiti berikut:

dll. _

di mana Q = Y, X [ x ij _ x„, saya 2 - umum, atau penuh, jumlah sisihan kuasa dua; 7=1

Q, -n^)