Biografi Spesifikasi Analisis

Analisis univariat jadual korelasi varians. Perbandingan berbilang: Prosedur Tukey-Kramer

Katakan pada talian automatik, beberapa mesin melakukan operasi yang sama secara selari. Untuk perancangan yang betul bagi pemprosesan seterusnya, adalah penting untuk mengetahui betapa seragam dimensi purata bahagian yang diperoleh pada mesin selari. Terdapat hanya satu faktor yang mempengaruhi saiz bahagian, dan ini adalah mesin di mana ia dibuat. Adalah perlu untuk mengetahui betapa pentingnya pengaruh faktor ini pada dimensi bahagian. Andaikan set saiz bahagian yang dihasilkan pada setiap mesin mempunyai taburan normal dan varians yang sama.

Kami mempunyai m mesin, oleh itu, m agregat atau tahap di mana n 1 , n 2 ,..., n t pemerhatian. Untuk kesederhanaan penaakulan, mari kita anggap itu n 1 \u003d n 2 \u003d ... \u003d dsb. Dimensi bahagian yang membentuk n i pemerhatian pada i-tahap ke-, menandakan x i 1 , x saya 2,..., x dalam . Kemudian semua pemerhatian boleh diwakili dalam bentuk jadual, yang dipanggil matriks pemerhatian (Jadual 3.1).

Jadual 3.1

Tahap Hasil pemerhatian
1 2 j n
x 11 x 12 x 1 j x 1 n
x 21 x 22 x 2 j x 2 n
x 31 x 32 x 3 j x 3 n
i x i1 x i2 x i j x i n
m x m1 x m2 x mj xmn

Kami akan menganggap bahawa untuk i-peringkat ke n pemerhatian mempunyai purata βi, sama dengan jumlah purata am µ dan variasinya disebabkan oleh i-tahap faktor ke-, i.e. βi = µ + γ i. Kemudian satu pemerhatian boleh diwakili dalam borang berikut:

x i j = µ + γ i. +ε ij= βi +εij (3.1)

dengan µ ialah purata keseluruhan; γ i- kesan disebabkan oleh i-tahap faktor ke-; εij- variasi keputusan dalam tahap tertentu.

Ahli εij mencirikan pengaruh semua faktor yang tidak diambil kira oleh model (3.1). Menurut masalah umum analisis penyebaran, adalah perlu untuk menilai kepentingan pengaruh faktor γ pada dimensi bahagian. Variasi umum pembolehubah x i j boleh diuraikan kepada bahagian, salah satunya mencirikan pengaruh faktor γ, yang lain - pengaruh faktor yang tidak diambil kira. Untuk melakukan ini, adalah perlu untuk mencari anggaran untuk min keseluruhan µ dan anggaran untuk purata ke atas tahap βi. Adalah jelas bahawa penilaian β ialah min aritmetik bagi n cerapan aras ke-i, i.e.

Tanda bintang dalam indeks pada x bermakna pemerhatian ditetapkan pada tahap ke-i. Min aritmetik bagi keseluruhan set cerapan ialah anggaran bagi min keseluruhan µ, i.e.

Cari jumlah sisihan kuasa dua x i j daripada , i.e.

Kami mewakilinya dalam bentuk (3.2)

Dan =

Tetapi = 0, kerana ini adalah jumlah sisihan pembolehubah satu populasi daripada min aritmetik populasi yang sama, i.e. keseluruhannya ialah sifar. Kami menulis sebutan kedua jumlah (3.2) dalam bentuk:



Ataupun

Istilah ini ialah jumlah perbezaan kuasa dua antara tahap min dan min bagi keseluruhan set pemerhatian. Jumlah ini dipanggil jumlah sisihan kuasa dua antara kumpulan dan mencirikan percanggahan antara tahap. Nilai , juga dipanggil penyebaran oleh faktor, i.e. serakan kerana faktor yang dikaji.

Istilah ini ialah jumlah perbezaan kuasa dua antara pemerhatian individu dan purata tahap ke-i. Jumlah ini dipanggil jumlah sisihan kuasa dua dalam kumpulan dan mencirikan percanggahan antara pemerhatian tahap ke-i. Nilai itu juga dipanggil serakan sisa, i.e. serakan kerana faktor yang tidak diambil kira.

Nilai itu dipanggil jumlah atau jumlah penuh sisihan kuasa dua bagi pemerhatian individu daripada jumlah min.

Mengetahui jumlah kuasa dua SS, SS 1 dan SS 2, adalah mungkin untuk menganggarkan anggaran tidak berat sebelah bagi varians yang sepadan - jumlah, antara kumpulan dan intrakumpulan (jadual 3.2).

Jika pengaruh semua peringkat faktor γ adalah sama, maka dan adalah anggaran bagi jumlah varians.

Kemudian, untuk menilai kepentingan pengaruh faktor γ, ia memadai untuk menguji hipotesis nol H 0: = .

Untuk melakukan ini, kirakan kriteria Fisher F B = , dengan bilangan darjah kebebasan k 1 = m - 1 dan k 2 = m (n - 1). Kemudian, mengikut jadual taburan F (lihat jadual taburan kriteria Fisher), untuk tahap keertian α, nilai kritikal F cr ditemui.

Jadual 3.2

Jika F B > F cr maka hipotesis nol ditolak dan kesimpulan dibuat tentang pengaruh signifikan faktor γ.

Di F B< F кр нет основания отвергать нулевую гипотезу и можно считать, что влияние фактора γ несущественно.



Membandingkan antara kumpulan dan varians baki, magnitud nisbahnya digunakan untuk menilai seberapa kuat pengaruh faktor ditunjukkan.

Contoh 3.1. Terdapat empat kelompok fabrik pakaian kerja. Lima sampel telah dipilih daripada setiap kumpulan dan ujian telah dijalankan untuk menentukan magnitud beban pecah. Keputusan ujian diberikan dalam jadual. 3.3.

Jadual 3.3

Nombor kelompok, t

Ia diperlukan untuk mengetahui sama ada pengaruh kumpulan bahan mentah yang berbeza terhadap magnitud beban pecah adalah signifikan.

Keputusan.

AT kes ini m = 4, n = 5. Min aritmetik setiap baris dikira dengan formula

Kami ada: =(200+140+170+145+165)/5=164; =170; =202; = 164.

Cari min aritmetik bagi keseluruhan populasi:

Mari kita mengira kuantiti yang diperlukan untuk membina jadual. 3.4:

jumlah sisihan kuasa dua antara kumpulan SS 1 , dengan k 1 =t –1=

4-1=3 darjah kebebasan:

jumlah sisihan kuasa dua dalam kumpulan SS 2 dengan k 2 = mp - m = =20-4=16 darjah kebebasan:

jumlah jumlah kuasa dua SS dengan k=mn-1=20-1=19 darjah kebebasan:

Berdasarkan nilai yang ditemui, kami menganggarkan varians, mengikut formula (Jadual 3.2) kami akan menyusun (Jadual 3.4) untuk contoh yang sedang dipertimbangkan.

Jadual 3.4

Mari kita jalankan analisis statistik mengikut kriteria Fisher. Kira F B \u003d \u003d (4980 1/3) / (7270 1/16) \u003d 1660 / 454.4 \u003d 3.65.

Menurut jadual taburan F (lihat lampiran), kita dapati nilai F Kp pada k 2 = 16 dan k 1= 3 darjah kebebasan dan aras keertian α = 0.01. Kami mempunyai F Kp = 5.29.

Nilai pengiraan F B adalah kurang daripada nilai jadual, jadi boleh dikatakan bahawa hipotesis nol tidak ditolak, yang bermaksud bahawa perbezaan antara tisu dalam kelompok tidak menjejaskan beban pecah.

Dalam pakej Analisis Data, alat ANOVA Sehala digunakan untuk menguji hipotesis bahawa min dua atau lebih sampel yang tergolong dalam populasi yang sama adalah serupa. Mari kita pertimbangkan kerja pakej untuk analisis varians sehala.

Mari selesaikan Contoh 3.1 menggunakan alat ANOVA Sehala.

Penggunaan statistik dalam nota ini akan ditunjukkan dengan contoh silang. Katakan anda seorang pengurus pengeluaran di Perfect Parachute. Payung terjun diperbuat daripada gentian sintetik yang dibekalkan oleh empat pembekal berbeza. Salah satu ciri utama payung terjun ialah kekuatannya. Anda perlu memastikan bahawa semua gentian yang dibekalkan mempunyai kekuatan yang sama. Untuk menjawab soalan ini, adalah perlu untuk mereka bentuk eksperimen di mana kekuatan payung terjun yang ditenun daripada gentian sintetik daripada pembekal yang berbeza diukur. Maklumat yang diperoleh semasa eksperimen ini akan menentukan pembekal yang menyediakan payung terjun yang paling tahan lama.

Banyak aplikasi berkaitan dengan eksperimen di mana beberapa kumpulan atau tahap satu faktor dipertimbangkan. Sesetengah faktor, seperti suhu pembakaran seramik, mungkin mempunyai beberapa tahap berangka (iaitu 300°, 350°, 400° dan 450°). Faktor lain, seperti lokasi barang di pasar raya, mungkin mempunyai tahap kategori (cth, pembekal pertama, pembekal kedua, pembekal ketiga, pembekal keempat). Eksperimen faktor tunggal di mana unit eksperimen secara rawak diperuntukkan kepada kumpulan atau tahap faktor dipanggil rawak sepenuhnya.

PenggunaanF-kriteria untuk menilai perbezaan antara beberapa jangkaan matematik

Jika ukuran berangka faktor dalam kumpulan adalah berterusan dan beberapa syarat tambahan dipenuhi, sebagai perbandingan jangkaan matematik beberapa kumpulan, analisis varians (ANOVA - An alysis o f Va riance). Analisis varians menggunakan reka bentuk rawak sepenuhnya dipanggil ANOVA sehala. Dari satu segi, istilah analisis varians adalah mengelirukan kerana ia membandingkan perbezaan antara nilai min kumpulan, bukan antara varians. Walau bagaimanapun, perbandingan jangkaan matematik dijalankan dengan tepat berdasarkan analisis variasi data. Dalam prosedur ANOVA, jumlah variasi keputusan pengukuran dibahagikan kepada antara kumpulan dan intrakumpulan (Rajah 1). Variasi intrakumpulan dijelaskan oleh ralat eksperimen, manakala variasi antara kumpulan dijelaskan oleh kesan keadaan eksperimen. Simbol dengan menunjukkan bilangan kumpulan.

nasi. 1. Pengasingan Variasi dalam Eksperimen Rawak Penuh

Muat turun nota dalam atau format, contoh dalam format

Mari kita berpura-pura itu dengan kumpulan diambil daripada populasi bebas yang mempunyai taburan normal dan varians yang sama. Hipotesis nol ialah jangkaan matematik populasi adalah sama: H 0: μ 1 = μ 2 = ... = μ s. Hipotesis alternatif menyatakan bahawa tidak semua jangkaan matematik adalah sama: H 1: tidak semua μ j adalah sama j= 1, 2, …, s).

Pada rajah. Rajah 2 membentangkan hipotesis nol sebenar tentang jangkaan matematik bagi lima kumpulan yang dibandingkan, dengan syarat populasi umum mempunyai taburan normal dan varians yang sama. Lima populasi yang dikaitkan dengan tahap yang berbeza faktor adalah sama. Oleh itu, ia ditumpangkan antara satu sama lain, mempunyai jangkaan, variasi dan bentuk matematik yang sama.

nasi. 2. Lima populasi mempunyai jangkaan matematik yang sama: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

Sebaliknya, andaikan bahawa sebenarnya hipotesis nol adalah palsu, dan tahap keempat mempunyai jangkaan matematik terbesar, tahap pertama mempunyai jangkaan matematik yang lebih rendah sedikit, dan tahap yang selebihnya mempunyai jangkaan matematik yang sama malah lebih kecil (Rajah 1). 3). Ambil perhatian bahawa, dengan pengecualian nilai min, semua lima populasi adalah sama (iaitu, mempunyai kebolehubahan dan bentuk yang sama).

nasi. 3. Kesan keadaan eksperimen diperhatikan: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

Apabila menguji hipotesis kesamaan jangkaan matematik beberapa populasi umum, jumlah variasi dibahagikan kepada dua bahagian: variasi antara kumpulan, disebabkan perbezaan antara kumpulan, dan variasi intrakumpulan, disebabkan perbezaan antara unsur kepunyaan kumpulan yang sama. Jumlah variasi dinyatakan sebagai jumlah jumlah kuasa dua (SST - jumlah kuasa dua). Oleh kerana hipotesis nol adalah bahawa jangkaan semua dengan kumpulan adalah sama antara satu sama lain, jumlah variasi adalah sama dengan jumlah perbezaan kuasa dua antara pemerhatian individu dan jumlah min (min purata) yang dikira untuk semua sampel. Variasi penuh:

di mana - purata keseluruhan, Xij - i-e menonton masuk j-kumpulan atau peringkat ke-, n j- bilangan pemerhatian dalam j-kumpulan ke-, n - jumlah pemerhatian dalam semua kumpulan (iaitu. n = n 1 + n 2 + … + nc), dengan- bilangan kumpulan atau peringkat yang dipelajari.

Variasi antara kumpulan, biasanya dipanggil jumlah kuasa dua antara kumpulan (SSA), adalah sama dengan jumlah perbezaan kuasa dua antara min sampel setiap kumpulan j dan purata keseluruhan didarab dengan isipadu kumpulan yang sepadan n j:

di mana dengan- bilangan kumpulan atau tahap yang dipelajari, n j- bilangan pemerhatian dalam j-kumpulan ke-, j- nilai purata j-kumpulan ke-, - purata am.

Variasi dalam kumpulan, biasanya dipanggil jumlah kuasa dua dengan kumpulan (SSW), adalah sama dengan jumlah perbezaan kuasa dua antara unsur setiap kumpulan dan min sampel kumpulan ini j:

di mana Xij - i-elemen ke j-kumpulan ke-, j- nilai purata j-kumpulan ke.

Kerana mereka dibandingkan dengan tahap faktor, jumlah antara kumpulan kuasa dua mempunyai s - 1 darjah kebebasan. Setiap dengan peringkat mempunyai n j – 1 darjah kebebasan, jadi jumlah segiempat sama dalam kumpulan mempunyai n- dengan darjah kebebasan, dan

Di samping itu, jumlah jumlah kuasa dua mempunyai n – 1 darjah kebebasan, sejak setiap pemerhatian Xij berbanding dengan purata keseluruhan yang dikira ke atas semua n pemerhatian. Jika setiap jumlah ini dibahagikan dengan bilangan darjah kebebasan yang sepadan, tiga jenis serakan akan timbul: antara kumpulan(min segi empat sama antara - MSA), dalam kumpulan(min segi empat sama dalam - MSW) dan lengkap(min jumlah kuasa dua - MST):

Walaupun hakikat bahawa tujuan utama analisis varians adalah untuk membandingkan jangkaan matematik dengan kumpulan untuk mendedahkan kesan keadaan eksperimen, namanya adalah disebabkan oleh fakta bahawa alat utama adalah analisis varians jenis yang berbeza. Jika hipotesis nol adalah benar, dan antara nilai yang dijangkakan dengan kumpulan tidak terdapat perbezaan yang ketara, ketiga-tiga varians - MSA, MSW dan MST - adalah anggaran varians σ2 wujud dalam data yang dianalisis. Jadi untuk menguji hipotesis nol H 0: μ 1 = μ 2 = ... = μ s dan hipotesis alternatif H 1: tidak semua μ j adalah sama j = 1, 2, …, dengan), adalah perlu untuk mengira statistik F-kriteria, iaitu nisbah dua varians, MSA dan MSW. ujian F-statistik dalam analisis varians univariat

Perangkaan F-kriteria dipatuhi F- pengedaran dengan s - 1 darjah kebebasan dalam pengangka MSA dan n - dengan darjah kebebasan dalam penyebut MSW. Untuk tahap keertian α yang diberikan, hipotesis nol ditolak jika dikira F FU wujud F- pengedaran dengan s - 1 n - dengan darjah kebebasan dalam penyebut. Oleh itu, seperti yang ditunjukkan dalam rajah. 4, peraturan keputusan dirumuskan seperti berikut: hipotesis nol H 0 ditolak jika F > FU; jika tidak, ia tidak ditolak.

nasi. 4. Bidang kritikal analisis varians apabila menguji hipotesis H 0

Jika hipotesis nol H 0 adalah benar, dikira F-statistik hampir kepada 1, kerana pengangka dan penyebutnya adalah anggaran nilai yang sama - varians σ 2 yang wujud dalam data yang dianalisis. Jika hipotesis nol H 0 adalah palsu (dan terdapat perbezaan yang ketara antara nilai jangkaan kumpulan yang berbeza), dikira F-statistik akan lebih besar daripada satu, kerana pengangkanya, MSA, sebagai tambahan kepada kebolehubahan semula jadi data, menganggarkan kesan keadaan eksperimen atau perbezaan antara kumpulan, manakala penyebut MSW menganggarkan hanya kebolehubahan semula jadi data. Oleh itu, prosedur ANOVA adalah F ialah ujian di mana, pada tahap keertian tertentu α, hipotesis nol ditolak jika dikira F- statistik lebih besar daripada nilai kritikal atas FU wujud F- pengedaran dengan s - 1 darjah kebebasan dalam pengangka dan n - dengan darjah kebebasan dalam penyebut, seperti ditunjukkan dalam Rajah. 4.

Untuk menggambarkan analisis varians sehala, mari kita kembali kepada senario yang digariskan pada permulaan nota. Tujuan eksperimen adalah untuk menentukan sama ada payung terjun yang ditenun daripada gentian sintetik yang diperoleh daripada pembekal yang berbeza mempunyai kekuatan yang sama. Setiap kumpulan mempunyai lima payung terjun yang dianyam. Kumpulan dibahagikan mengikut pembekal - Pembekal 1, Pembekal 2, Pembekal 3 dan Pembekal 4. Kekuatan payung terjun diukur menggunakan peranti khas yang menguji fabrik untuk koyak di kedua-dua belah. Daya yang diperlukan untuk memecahkan payung terjun diukur pada skala khas. Semakin tinggi daya pecah, semakin kuat payung terjun. Excel membenarkan analisis F-Statistik dengan satu klik. Pergi melalui menu DataAnalisis data, dan pilih baris Analisis varians sehala, isi tetingkap yang dibuka (Gamb. 5). Keputusan eksperimen (kekuatan jurang), beberapa statistik deskriptif, dan keputusan analisis varians sehala ditunjukkan dalam Rajah. 6.

nasi. 5. Tingkap Pakej Analisis ANOVA Sehala cemerlang

nasi. Rajah 6. Penunjuk kekuatan payung terjun yang ditenun daripada gentian sintetik yang diperoleh daripada pembekal yang berbeza, statistik deskriptif dan keputusan analisis varians sehala

Analisis Rajah 6 menunjukkan terdapat sedikit perbezaan antara min sampel. Kekuatan purata gentian yang diperoleh daripada pembekal pertama ialah 19.52, dari yang kedua - 24.26, dari yang ketiga - 22.84 dan dari yang keempat - 21.16. Adakah perbezaan ini ketara secara statistik? Taburan daya pecah ditunjukkan dalam rajah serakan (Rajah 7). Ia jelas menunjukkan perbezaan kedua-dua kumpulan dan dalam mereka. Jika isipadu setiap kumpulan lebih besar, mereka boleh dianalisis menggunakan plot batang dan daun, plot kotak, atau plot taburan normal.

nasi. 7. Rajah sebaran kekuatan payung terjun yang ditenun daripada gentian sintetik yang diperoleh daripada empat pembekal

Hipotesis nol menyatakan bahawa tidak terdapat perbezaan yang signifikan antara nilai kekuatan min: H 0: μ 1 = μ 2 = μ 3 = μ 4. Hipotesis alternatif ialah terdapat sekurang-kurangnya satu pembekal yang kekuatan gentian puratanya berbeza daripada yang lain: H 1: tidak semua μ j adalah sama ( j = 1, 2, …, dengan).

Purata Keseluruhan (Lihat Rajah 6) = PURATA(D12:D15) = 21.945; untuk menentukan, anda juga boleh purata semua 20 nombor asal: \u003d PURATA (A3: D7). Nilai varians dikira Pakej analisis dan ditunjukkan dalam jadual Analisis varians(lihat Rajah 6): SSA = 63.286, SSW = 97.504, SST = 160.790 (lihat lajur SS meja Analisis varians rajah 6). Purata dikira dengan membahagikan jumlah kuasa dua ini dengan bilangan darjah kebebasan yang sesuai. Kerana ia dengan= 4, dan n= 20, kita dapat nilai berikut darjah kebebasan; untuk SSA: s - 1= 3; untuk SSW: n–c= 16; untuk SST: n - 1= 19 (lihat lajur df). Oleh itu: MSA = SSA / ( c - 1)= 21.095; MSW=SSW/( n–c) = 6.094; MST = SST / ( n - 1) = 8.463 (lihat lajur CIK). F-statistik = MSA / MSW = 3.462 (lihat lajur F).

Nilai kritikal atas FU, ciri untuk F-agihan, ditentukan oleh formula = F. OBR (0.95; 3; 16) = 3.239. Parameter fungsi =F.OBR(): α = 0.05, pengangka mempunyai tiga darjah kebebasan, dan penyebutnya ialah 16. Oleh itu, pengiraan F-statistik bersamaan dengan 3.462 melebihi nilai kritikal atas FU= 3.239, hipotesis nol ditolak (Rajah 8).

nasi. 8. Kawasan kritikal analisis varians pada tahap keertian 0.05 jika pengangka mempunyai tiga darjah kebebasan dan penyebutnya ialah -16

R-nilai, i.e. kebarangkalian bahawa di bawah hipotesis nol benar F- statistik tidak kurang daripada 3.46, bersamaan dengan 0.041 atau 4.1% (lihat lajur nilai-p meja Analisis varians rajah 6). Oleh kerana nilai ini tidak melebihi aras keertian α = 5%, hipotesis nol ditolak. Tambahan pula, R-nilai menunjukkan bahawa kebarangkalian untuk mencari perbezaan sedemikian atau besar antara jangkaan matematik populasi umum, dengan syarat mereka sebenarnya sama, ialah 4.1%.

Jadi. Terdapat perbezaan antara empat sampel min. Hipotesis nol ialah semua jangkaan matematik bagi empat populasi adalah sama. Di bawah keadaan ini, ukuran jumlah kebolehubahan (iaitu jumlah variasi SST) kekuatan semua payung terjun dikira dengan menjumlahkan perbezaan kuasa dua antara setiap cerapan Xij dan purata keseluruhan . Kemudian jumlah variasi dibahagikan kepada dua komponen (lihat Rajah 1). Komponen pertama ialah variasi antara kumpulan dalam SSA dan komponen kedua ialah variasi intrakumpulan dalam SSW.

Apakah yang menerangkan kebolehubahan dalam data? Dengan kata lain, mengapa semua pemerhatian tidak sama? Satu sebab ialah firma yang berbeza membekalkan gentian dengan kekuatan yang berbeza. Ini sebahagiannya menerangkan mengapa kumpulan mempunyai nilai jangkaan yang berbeza: semakin kuat kesan keadaan eksperimen, semakin besar perbezaan antara nilai min kumpulan. Satu lagi sebab untuk kebolehubahan data ialah kebolehubahan semula jadi mana-mana proses, dalam kes ini pengeluaran payung terjun. Walaupun semua gentian dibeli daripada pembekal yang sama, kekuatannya tidak akan sama dalam keadaan lain. syarat sama rata. Memandangkan kesan ini muncul dalam setiap kumpulan, ia dipanggil variasi dalam kumpulan.

Perbezaan antara cara sampel dipanggil variasi antara kumpulan SSA. Sebahagian daripada variasi intrakumpulan, seperti yang telah disebutkan, dijelaskan oleh fakta bahawa data tergolong dalam kumpulan yang berbeza. Walau bagaimanapun, walaupun kumpulan itu betul-betul sama (iaitu, hipotesis nol adalah benar), masih terdapat variasi antara kumpulan. Sebabnya terletak pada kebolehubahan semula jadi proses pembuatan payung terjun. Oleh kerana sampel adalah berbeza, sampel mereka bermakna berbeza antara satu sama lain. Oleh itu, jika hipotesis nol adalah benar, kedua-dua antara kumpulan dan kebolehubahan intrakumpulan mewakili anggaran kebolehubahan populasi. Jika hipotesis nol adalah palsu, hipotesis antara kumpulan akan menjadi lebih besar. Fakta inilah yang mendasarinya F-kriteria untuk membandingkan perbezaan antara jangkaan matematik beberapa kumpulan.

Selepas melaksanakan ANOVA sehala dan mendapati perbezaan yang ketara antara firma, masih tidak diketahui pembekal mana yang berbeza dengan ketara daripada yang lain. Kita hanya tahu bahawa jangkaan matematik populasi tidak sama. Dalam erti kata lain, sekurang-kurangnya satu jangkaan matematik berbeza dengan ketara daripada yang lain. Untuk menentukan penyedia mana yang berbeza daripada yang lain, anda boleh gunakan Prosedur Tukey, yang menggunakan perbandingan berpasangan antara pembekal. Prosedur ini telah dibangunkan oleh John Tukey. Selepas itu, dia dan C. Cramer mengubah suai prosedur ini secara bebas untuk situasi di mana saiz sampel berbeza antara satu sama lain.

Pelbagai Perbandingan: Prosedur Tukey-Kramer

Dalam senario kami, analisis varians sehala digunakan untuk membandingkan kekuatan payung terjun. Menemui perbezaan yang ketara antara jangkaan matematik keempat-empat kumpulan, adalah perlu untuk menentukan kumpulan yang berbeza antara satu sama lain. Walaupun terdapat beberapa cara untuk menyelesaikan masalah ini, kami hanya akan menerangkan prosedur perbandingan berbilang Tukey-Kramer. Kaedah ini adalah contoh prosedur perbandingan post hoc, kerana hipotesis yang akan diuji dirumus selepas analisis data. Prosedur Tukey-Kramer membolehkan anda membandingkan semua pasangan kumpulan secara serentak. Pada peringkat pertama, perbezaan dikira Xj – Xj, di mana j ≠j, antara jangkaan matematik s(s – 1)/2 kumpulan. Jangka Kritikal Prosedur Tukey-Kramer dikira dengan formula:

di mana Q U- nilai kritikal atas taburan julat pelajar, yang mempunyai dengan darjah kebebasan dalam pengangka dan n - dengan darjah kebebasan dalam penyebut.

Jika saiz sampel tidak sama, julat kritikal dikira untuk setiap pasangan jangkaan matematik secara berasingan. Pada peringkat terakhir, masing-masing s(s – 1)/2 pasangan jangkaan matematik dibandingkan dengan julat kritikal yang sepadan. Unsur-unsur pasangan dianggap berbeza dengan ketara jika modulus perbezaan | Xj – Xj| antara mereka melebihi julat kritikal.

Marilah kita menggunakan prosedur Tukey-Cramer untuk masalah kekuatan payung terjun. Memandangkan syarikat payung terjun mempunyai empat pembekal, 4(4 – 1)/2 = 6 pasang pembekal perlu diuji (Rajah 9).

nasi. 9. Perbandingan berpasangan bagi min sampel

Oleh kerana semua kumpulan mempunyai jumlah yang sama (iaitu semua n j = n j), adalah memadai untuk mengira hanya satu julat kritikal. Untuk melakukan ini, mengikut jadual ANOVA(Rajah 6) kita tentukan nilai MSW = 6.094. Kemudian kita dapati nilainya Q U pada α = 0.05, dengan= 4 (bilangan darjah kebebasan dalam pengangka) dan n- dengan= 20 – 4 = 16 (bilangan darjah kebebasan dalam penyebut). Malangnya, saya tidak menemui fungsi yang sepadan dalam Excel, jadi saya menggunakan jadual (Gamb. 10).

nasi. 10. Nilai kritikal julat pelajar Q U

Kita mendapatkan:

Oleh kerana hanya 4.74 > 4.47 (lihat jadual bawah dalam Rajah 9), perbezaan ketara secara statistik wujud antara pembekal pertama dan kedua. Semua pasangan lain mempunyai cara sampel, yang tidak membenarkan kita bercakap tentang perbezaannya. Akibatnya, kekuatan purata payung terjun yang ditenun daripada gentian yang dibeli daripada pembekal pertama adalah jauh lebih rendah daripada yang kedua.

Syarat yang diperlukan untuk analisis varians sehala

Apabila menyelesaikan masalah kekuatan payung terjun, kami tidak menyemak sama ada syarat dipenuhi di mana seseorang boleh menggunakan satu faktor F-kriteria. Bagaimana anda tahu jika anda boleh menggunakan faktor tunggal F-kriteria dalam analisis data eksperimen tertentu? Faktor tunggal F Ujian - hanya boleh digunakan jika tiga andaian asas dipenuhi: data eksperimen mestilah rawak dan bebas, mempunyai taburan normal, dan variansnya mestilah sama.

Tekaan pertama ialah rawak dan kebebasan data- hendaklah sentiasa dilakukan, kerana ketepatan mana-mana eksperimen bergantung pada rawak pilihan dan / atau proses rawak. Untuk mengelak daripada memesongkan keputusan, data perlu diekstrak daripada dengan populasi secara rawak dan bebas antara satu sama lain. Begitu juga, data hendaklah diedarkan secara rawak dengan tahap faktor yang menarik minat kita (kumpulan eksperimen). Pelanggaran syarat ini boleh memesongkan keputusan analisis varians dengan serius.

Tekaan kedua ialah kenormalan- bermakna data diambil daripada populasi taburan normal. Untuk t-kriteria, analisis sehala varians berdasarkan F-kriteria agak tidak sensitif terhadap pelanggaran syarat ini. Jika taburan tidak terlalu jauh dari normal, tahap keertian F-kriteria berubah sedikit, terutamanya jika saiz sampel cukup besar. Sekiranya keadaan taburan normal dilanggar dengan serius, ia harus digunakan.

Tekaan ketiga ialah keseragaman serakan- bermakna varians setiap populasi umum adalah sama antara satu sama lain (iaitu σ 1 2 = σ 2 2 = … = σ j 2). Andaian ini membolehkan seseorang memutuskan sama ada untuk memisahkan atau menggabungkan varians dalam kumpulan. Jika isipadu kumpulan adalah sama, keadaan kehomogenan varians mempunyai sedikit kesan ke atas kesimpulan yang diperoleh menggunakan F-kriteria. Walau bagaimanapun, jika saiz sampel tidak sama, pelanggaran syarat kesamaan varians boleh memesongkan keputusan analisis varians secara serius. Oleh itu, seseorang harus berusaha untuk memastikan bahawa saiz sampel adalah sama. Salah satu kaedah untuk menyemak andaian tentang kehomogenan varians ialah kriteria Levenay terangkan di bawah.

Jika, daripada ketiga-tiga syarat, hanya keseragaman keadaan penyebaran dilanggar, prosedur yang serupa dengan t-kriteria menggunakan varians berasingan (lihat butiran). Walau bagaimanapun, jika andaian taburan normal dan kehomogenan varians dilanggar pada masa yang sama, adalah perlu untuk menormalkan data dan mengurangkan perbezaan antara varians atau menggunakan prosedur bukan parametrik.

Kriteria Leveney untuk menyemak kehomogenan varians

Walaupun F- kriteria secara relatifnya tahan terhadap pelanggaran syarat kesamaan varians dalam kumpulan, pelanggaran kasar andaian ini dengan ketara mempengaruhi tahap kepentingan dan kuasa kriteria. Mungkin salah satu yang paling berkuasa ialah kriterianya Levenay. Untuk menyemak kesamaan varians dengan populasi umum, kami akan menguji hipotesis berikut:

H 0: σ 1 2 = σ 2 2 = ... = σj 2

H 1: Tidak semua σ j 2 sama ( j = 1, 2, …, dengan)

Ujian Leveney yang diubah suai adalah berdasarkan pernyataan bahawa jika kebolehubahan dalam kumpulan adalah sama, analisis varians boleh digunakan untuk menguji hipotesis nol kesamaan varians. nilai mutlak perbezaan antara pemerhatian dan median kumpulan. Jadi, mula-mula anda harus mengira nilai mutlak perbezaan antara pemerhatian dan median dalam setiap kumpulan, dan kemudian melakukan analisis sehala varians pada nilai mutlak perbezaan yang diperolehi. Untuk menggambarkan kriteria Levenay, mari kita kembali kepada senario yang digariskan pada permulaan nota. Menggunakan data yang dibentangkan dalam Rajah. 6, kami akan menjalankan analisis yang sama, tetapi berkenaan dengan modul perbezaan dalam data awal dan median untuk setiap sampel secara berasingan (Rajah 11).

Analisis varians ialah satu set kaedah statistik, direka untuk menguji hipotesis tentang hubungan antara ciri tertentu dan faktor yang dikaji yang tidak mempunyai penerangan kuantitatif, serta untuk mewujudkan tahap pengaruh faktor dan interaksinya. Dalam kesusasteraan khusus, ia sering dipanggil ANOVA (daripada nama Inggeris Analysis of Variations). Kaedah ini mula dibangunkan oleh R. Fischer pada tahun 1925.

Jenis dan kriteria untuk analisis varians

Kaedah ini digunakan untuk menyiasat hubungan antara ciri kualitatif (nominal) dan pembolehubah kuantitatif (berterusan). Malah, ia menguji hipotesis tentang kesamaan cara aritmetik beberapa sampel. Oleh itu, ia boleh dianggap sebagai kriteria parametrik untuk membandingkan pusat beberapa sampel sekaligus. Jika anda menggunakan kaedah ini untuk dua sampel, maka keputusan analisis varians akan sama dengan keputusan ujian-t Pelajar. Walau bagaimanapun, tidak seperti kriteria lain, kajian ini membolehkan anda mengkaji masalah dengan lebih terperinci.

Analisis varians dalam statistik adalah berdasarkan undang-undang: jumlah sisihan kuasa dua bagi sampel gabungan adalah sama dengan jumlah kuasa dua sisihan antara kumpulan dan jumlah kuasa dua sisihan antara kumpulan. Untuk kajian, ujian Fisher digunakan untuk menentukan kepentingan perbezaan antara varians antara kumpulan dan intrakumpulan. Walau bagaimanapun, untuk ini, prasyarat yang diperlukan ialah kenormalan taburan dan homoskedastisitas (kesamaan varians) sampel. Bezakan antara analisis varians satu dimensi (faktor tunggal) dan multivariat (multiffaktorial). Yang pertama menganggap pergantungan nilai yang dikaji pada satu atribut, yang kedua - pada banyak sekaligus, dan juga membolehkan anda mengenal pasti hubungan antara mereka.

Faktor

Faktor dipanggil keadaan terkawal yang mempengaruhi keputusan akhir. Tahap atau kaedah pemprosesannya dipanggil nilai yang mencirikan manifestasi khusus keadaan ini. Angka-angka ini biasanya diberikan dalam skala ukuran nominal atau ordinal. Selalunya nilai output diukur pada skala kuantitatif atau ordinal. Kemudian terdapat masalah mengumpulkan data output dalam satu siri pemerhatian, yang sepadan dengan lebih kurang sama nilai berangka. Jika bilangan kumpulan terlalu besar, maka bilangan pemerhatian di dalamnya mungkin tidak mencukupi untuk mendapatkan keputusan yang boleh dipercayai. Jika bilangannya diambil terlalu kecil, ini boleh menyebabkan kehilangan ciri penting pengaruh pada sistem. Kaedah khusus untuk mengumpulkan data bergantung pada volum dan sifat variasi dalam nilai. Bilangan dan saiz selang dalam analisis univariat paling kerap ditentukan oleh prinsip selang yang sama atau oleh prinsip frekuensi yang sama.

Tugas analisis penyebaran

Jadi, terdapat kes apabila anda perlu membandingkan dua atau lebih sampel. Maka adalah dinasihatkan untuk menggunakan analisis varians. Nama kaedah menunjukkan bahawa kesimpulan dibuat berdasarkan kajian komponen varians. Intipati kajian ialah perubahan keseluruhan dalam penunjuk dibahagikan kepada komponen yang sesuai dengan tindakan setiap faktor individu. Pertimbangkan beberapa masalah yang diselesaikan oleh analisis varians biasa.

Contoh 1

Bengkel ini mempunyai beberapa peralatan mesin - mesin automatik yang menghasilkan bahagian tertentu. Saiz setiap bahagian adalah nilai rawak, yang bergantung pada tetapan setiap mesin dan sisihan rawak yang berlaku semasa proses pembuatan bahagian. Ia adalah perlu untuk menentukan daripada ukuran dimensi bahagian sama ada mesin disediakan dengan cara yang sama.

Contoh 2

Semasa pembuatan radas elektrik, pelbagai jenis kertas penebat digunakan: kapasitor, elektrik, dll. Radas boleh diresapi pelbagai bahan: resin epoksi, varnis, resin ML-2, dsb. Kebocoran boleh disingkirkan di bawah vakum pada tekanan tinggi, apabila dipanaskan. Ia boleh diresapi dengan rendaman dalam varnis, di bawah aliran varnis yang berterusan, dsb. Alat elektrik secara keseluruhan dituangkan dengan sebatian tertentu, yang mana terdapat beberapa pilihan. Penunjuk kualiti ialah kekuatan dielektrik penebat, suhu terlalu panas penggulungan dalam mod operasi, dan beberapa yang lain. Semasa bersenam proses teknologi peranti pembuatan, adalah perlu untuk menentukan bagaimana setiap faktor yang disenaraikan mempengaruhi prestasi peranti.

Contoh 3

Depoh bas troli menyediakan beberapa laluan bas troli. Mereka mengendalikan bas troli pelbagai jenis, dan 125 pemeriksa mengutip tambang. Pengurusan depoh berminat dalam soalan: bagaimana untuk membandingkan prestasi ekonomi setiap pengawal (hasil) memandangkan laluan yang berbeza, jenis bas troli yang berbeza? Bagaimana untuk menentukan kemungkinan ekonomi untuk melancarkan bas troli jenis tertentu pada laluan tertentu? Bagaimana untuk mewujudkan keperluan yang munasabah untuk jumlah hasil yang dibawa oleh konduktor pada setiap laluan dalam pelbagai jenis bas troli?

Tugas memilih kaedah adalah bagaimana untuk mendapatkan maklumat maksimum mengenai kesan ke atas hasil akhir setiap faktor, menentukan ciri berangka kesan sedemikian, kebolehpercayaan mereka pada kos minimum dan untuk maksimum. masa yang singkat. Kaedah analisis penyebaran membolehkan untuk menyelesaikan masalah tersebut.

Analisis univariate

Kajian ini bertujuan untuk menilai magnitud kesan kes tertentu terhadap semakan yang dianalisis. Satu lagi cabaran analisis univariate mungkin terdapat perbandingan dua atau lebih keadaan antara satu sama lain untuk menentukan perbezaan pengaruhnya terhadap penarikan balik. Jika hipotesis nol ditolak, maka langkah seterusnya adalah untuk mengukur dan membina selang keyakinan untuk ciri-ciri yang diperolehi. Dalam kes apabila hipotesis nol tidak boleh ditolak, ia biasanya diterima dan kesimpulan dibuat tentang sifat pengaruh.

Analisis varians sehala boleh menjadi analog bukan parametrik bagi kaedah pangkat Kruskal-Wallis. Ia telah dibangunkan oleh ahli matematik Amerika William Kruskal dan ahli ekonomi Wilson Wallis pada tahun 1952. Ujian ini bertujuan untuk menguji hipotesis nol bahawa kesan pengaruh ke atas sampel yang dikaji adalah sama dengan nilai min yang tidak diketahui tetapi sama. Dalam kes ini, bilangan sampel mestilah lebih daripada dua.

Kriteria Jonkhier (Jonkhier-Terpstra) telah dicadangkan secara bebas oleh ahli matematik Belanda T. J. Terpstrom pada tahun 1952 dan ahli psikologi British E. R. Jonkhier pada tahun 1954. Ia digunakan apabila diketahui terlebih dahulu bahawa kumpulan keputusan yang ada disusun berdasarkan peningkatan dalam pengaruh faktor yang dikaji, yang diukur pada skala ordinal.

M - kriteria Bartlett, yang dicadangkan oleh ahli statistik British Maurice Stevenson Bartlett pada tahun 1937, digunakan untuk menguji hipotesis nol tentang kesamaan varians beberapa populasi normal dari mana sampel yang dikaji diambil, dalam kes am mempunyai isipadu yang berbeza (bilangan setiap sampel mestilah sekurang-kurangnya empat).

G ialah ujian Cochran, yang ditemui oleh William Gemmel Cochran Amerika pada tahun 1941. Ia digunakan untuk menguji hipotesis nol tentang kesamaan varians populasi normal untuk sampel bebas yang sama saiz.

Ujian Levene bukan parametrik, yang dicadangkan oleh ahli matematik Amerika Howard Levene pada tahun 1960, adalah alternatif kepada ujian Bartlett dalam keadaan di mana tidak ada kepastian bahawa sampel yang dikaji mengikut taburan normal.

Pada tahun 1974, ahli statistik Amerika Morton B. Brown dan Alan B. Forsythe mencadangkan ujian (ujian Brown-Forsyth), yang agak berbeza daripada ujian Levene.

Analisis dua hala

Analisis varians dua hala digunakan untuk sampel bertaburan normal yang dipautkan. Dalam amalan, ia sering digunakan jadual kompleks kaedah ini, khususnya yang mana setiap sel mengandungi set data (ukuran berulang) sepadan dengan nilai tahap tetap. Jika andaian yang perlu untuk menggunakan analisis dua hala bagi varians tidak dipenuhi, maka ujian peringkat Friedman bukan parametrik (Friedman, Kendall dan Smith), yang dibangunkan oleh ahli ekonomi Amerika Milton Friedman pada akhir tahun 1930, digunakan. kriteria tidak bergantung kepada jenis pengagihan.

Ia hanya diandaikan bahawa taburan kuantiti adalah sama dan berterusan, dan bahawa mereka sendiri adalah bebas antara satu sama lain. Apabila menguji hipotesis nol, output diberikan dalam bentuk matriks segi empat tepat, di mana baris sepadan dengan tahap faktor B, dan lajur sepadan dengan tahap A. Setiap sel jadual (blok) boleh menjadi hasil pengukuran parameter pada satu objek atau pada sekumpulan objek dengan pemalar nilai tahap kedua-dua faktor. Dalam kes ini, data yang sepadan dibentangkan sebagai nilai purata parameter tertentu untuk semua ukuran atau objek sampel yang dikaji. Untuk menggunakan kriteria output, adalah perlu untuk beralih dari hasil pengukuran langsung ke peringkat mereka. Kedudukan dijalankan untuk setiap baris secara berasingan, iaitu, nilai dipesan untuk setiap nilai tetap.

Ujian Halaman (Ujian L), yang dicadangkan oleh ahli statistik Amerika E. B. Page pada tahun 1963, direka untuk menguji hipotesis nol. Untuk sampel yang besar, anggaran Halaman digunakan. Mereka, tertakluk kepada realiti hipotesis nol yang sepadan, mematuhi taburan normal piawai. Dalam kes apabila baris jadual sumber mempunyai nilai yang sama, adalah perlu untuk menggunakan kedudukan purata. Dalam kes ini, ketepatan kesimpulan akan menjadi lebih teruk, semakin besar bilangan kebetulan tersebut.

Q - Kriteria Cochran, yang dicadangkan oleh V. Cochran pada tahun 1937. Ia digunakan dalam kes di mana kumpulan subjek homogen terdedah kepada lebih daripada dua pengaruh dan yang mana dua pilihan tindak balas adalah mungkin - negatif bersyarat (0) dan positif bersyarat (1) . Hipotesis nol terdiri daripada kesamaan kesan pengaruh. Analisis dua hala bagi varians memungkinkan untuk menentukan kewujudan kesan pemprosesan, tetapi tidak memungkinkan untuk menentukan lajur mana kesan ini wujud. Untuk menyelesaikan masalah ini, kaedah berbilang persamaan Scheffe untuk sampel terpaut.

Analisis pelbagai variasi

Masalah analisis pelbagai variasi bagi varians timbul apabila perlu untuk menentukan pengaruh dua atau lebih keadaan pada pembolehubah rawak tertentu. Kajian ini memperuntukkan kehadiran seorang tanggungan pembolehubah rawak, diukur dalam skala perbezaan atau nisbah, dan beberapa pembolehubah bebas, setiap satunya dinyatakan dalam skala nama atau dalam skala pangkat. Analisis penyebaran data adalah bahagian yang agak maju statistik matematik yang mempunyai banyak pilihan. Konsep kajian adalah biasa untuk kajian univariat dan multivariate. Intipatinya ialah jumlah varians dibahagikan kepada komponen, yang sepadan dengan kumpulan data tertentu. Setiap kumpulan data mempunyai modelnya sendiri. Di sini kita akan mempertimbangkan hanya peruntukan utama yang diperlukan untuk memahami dan kegunaan praktikal pilihan yang paling banyak digunakan.

Analisis faktor varians memerlukan perhatian yang teliti terhadap pengumpulan dan pembentangan data input, dan terutamanya kepada tafsiran keputusan. Berbeza dengan satu faktor, yang hasilnya boleh diletakkan secara bersyarat dalam urutan tertentu, hasil dua faktor memerlukan pembentangan yang lebih kompleks. Lagi keadaan menjadi lebih rumit berlaku apabila terdapat tiga, empat atau lebih keadaan. Oleh kerana itu, model jarang memasukkan lebih daripada tiga (empat) syarat. Contohnya ialah berlakunya resonans pada nilai kemuatan dan kearuhan bulatan elektrik tertentu; manifestasi tindak balas kimia dengan set unsur tertentu dari mana sistem itu dibina; berlakunya kesan anomali dalam sistem yang kompleks di bawah satu kebetulan keadaan tertentu. Kehadiran interaksi secara radikal boleh mengubah model sistem dan kadangkala membawa kepada pemikiran semula sifat fenomena yang sedang dihadapi oleh penguji.

Analisis pelbagai variasi varians dengan eksperimen berulang

Data ukuran selalunya boleh dikumpulkan bukan oleh dua, tetapi oleh lebih banyak faktor. Jadi, jika kita mempertimbangkan analisis penyebaran hayat perkhidmatan tayar untuk roda bas troli, dengan mengambil kira keadaan (pengeluar dan laluan di mana tayar digunakan), maka kita boleh memilih sebagai keadaan berasingan musim semasa tayar digunakan. digunakan (iaitu: operasi musim sejuk dan musim panas). Akibatnya, kita akan menghadapi masalah kaedah tiga faktor.

Dengan kehadiran lebih banyak keadaan, pendekatannya adalah sama seperti dalam analisis dua hala. Dalam semua kes, model cuba dipermudahkan. Fenomena interaksi dua faktor tidak muncul begitu kerap, dan interaksi tiga kali ganda hanya berlaku dalam kes luar biasa. Sertakan interaksi yang mempunyai maklumat terdahulu dan alasan yang baik untuk mengambil kiranya dalam model. Proses mengasingkan faktor individu dan mengambil kiranya agak mudah. Oleh itu, sering terdapat keinginan untuk menyerlahkan lebih banyak keadaan. Anda tidak sepatutnya terbawa-bawa dengan ini. Semakin banyak keadaan, semakin kurang boleh dipercayai model itu dan semakin besar kemungkinan ralat. Model itu sendiri, yang termasuk sejumlah besar pembolehubah bebas menjadi agak sukar untuk ditafsir dan menyusahkan untuk kegunaan praktikal.

Idea umum analisis varians

Analisis varians dalam statistik ialah kaedah untuk mendapatkan keputusan pemerhatian yang bergantung kepada pelbagai keadaan serentak dan menilai pengaruhnya. Pembolehubah terkawal yang sepadan dengan kaedah mempengaruhi objek kajian dan dalam tempoh masa tertentu memperoleh nilai tertentu, dipanggil faktor. Mereka boleh menjadi kualitatif dan kuantitatif. Tahap keadaan kuantitatif memperoleh nilai tertentu pada skala berangka. Contohnya ialah suhu, tekanan tekanan, jumlah bahan. Faktor kualiti ialah bahan yang berbeza, kaedah teknologi yang berbeza, peranti, pengisi. Tahap mereka sepadan dengan skala nama.

Kualiti juga termasuk jenis bahan pembungkusan, keadaan penyimpanan bentuk dos. Ia juga rasional untuk memasukkan tahap pengisaran bahan mentah, komposisi pecahan butiran yang mempunyai nilai kuantitatif, tetapi sukar dikawal jika skala kuantitatif digunakan. Bilangan faktor kualiti bergantung pada jenis bentuk dos, serta sifat fizikal dan teknologi bahan ubatan. Sebagai contoh, tablet boleh diperoleh daripada bahan kristal dengan pemampatan langsung. Dalam kes ini, adalah mencukupi untuk menjalankan pemilihan ejen gelongsor dan pelincir.

Contoh faktor kualiti untuk pelbagai jenis bentuk dos

  • Berwarna. Komposisi pengekstrak, jenis pengekstrak, kaedah penyediaan bahan mentah, kaedah pengeluaran, kaedah penapisan.
  • Ekstrak (cecair, tebal, kering). Komposisi pengekstrak, kaedah pengekstrakan, jenis pemasangan, kaedah penyingkiran bahan pengekstrak dan balast.
  • Tablet. Komposisi bahan bantu, pengisi, penyerai, pengikat, pelincir dan pelincir. Kaedah mendapatkan tablet, jenis peralatan teknologi. Jenis cangkerang dan komponennya, pembentuk filem, pigmen, pewarna, pemplastis, pelarut.
  • penyelesaian suntikan. Jenis pelarut, kaedah penapisan, sifat penstabil dan pengawet, keadaan pensterilan, kaedah mengisi ampul.
  • Suppositori. Komposisi asas suppositori, kaedah mendapatkan suppositori, pengisi, pembungkusan.
  • Salap. komposisi asas, komponen struktur, kaedah penyediaan salap, jenis peralatan, pembungkusan.
  • Kapsul. Jenis bahan cangkerang, kaedah mendapatkan kapsul, jenis plasticizer, pengawet, pewarna.
  • Liniments. Kaedah pengeluaran, komposisi, jenis peralatan, jenis pengemulsi.
  • Penggantungan. Jenis pelarut, jenis penstabil, kaedah penyebaran.

Contoh faktor kualiti dan tahapnya yang dikaji dalam proses pembuatan tablet

  • Serbuk penaik. Pati kentang, tanah liat putih, campuran natrium bikarbonat dengan asid sitrik, magnesium karbonat asas.
  • penyelesaian mengikat. Air, pes kanji, sirap gula, larutan metilselulosa, larutan hidroksipropil metilselulosa, larutan polivinilpirolidon, larutan polivinil alkohol.
  • bahan gelongsor. Aerosil, kanji, talc.
  • Pengisi. Gula, glukosa, laktosa, natrium klorida, kalsium fosfat.
  • Minyak pelincir. Asid stearik, polietilena glikol, parafin.

Model analisis serakan dalam kajian tahap daya saing negeri

Salah satu kriteria yang paling penting untuk menilai keadaan negeri, mengikut mana tahap kebajikan dan pembangunan sosio-ekonominya dinilai, adalah daya saing, iaitu satu set harta yang wujud dalam ekonomi negara yang menentukan keupayaan negeri untuk bersaing dengan negara lain. Setelah menentukan tempat dan peranan negara dalam pasaran dunia, adalah mungkin untuk mewujudkan strategi yang jelas untuk memastikan keselamatan ekonomi pada skala antarabangsa, kerana ia adalah kunci kepada hubungan positif antara Rusia dan semua pemain dalam pasaran dunia: pelabur , pemiutang, kerajaan negeri.

Untuk membandingkan tahap daya saing negeri, negara ditarafkan menggunakan indeks kompleks, yang merangkumi pelbagai penunjuk wajaran. Indeks ini adalah berdasarkan faktor utama yang mempengaruhi keadaan ekonomi, politik, dsb. Kompleks model untuk mengkaji daya saing negara menyediakan penggunaan kaedah analisis statistik multivariate (khususnya, ini adalah analisis varians (statistik), pemodelan ekonometrik, membuat keputusan) dan termasuk peringkat utama berikut:

  1. Pembentukan sistem penunjuk-penunjuk.
  2. Penilaian dan ramalan penunjuk daya saing negeri.
  3. Perbandingan penunjuk-penunjuk daya saing negeri.

Dan sekarang mari kita pertimbangkan kandungan model setiap peringkat kompleks ini.

Pada peringkat pertama dengan bantuan kaedah kajian pakar, satu set penunjuk ekonomi yang munasabah-petunjuk untuk menilai daya saing negara dibentuk, dengan mengambil kira spesifik perkembangannya berdasarkan penarafan antarabangsa dan data dari jabatan statistik, yang mencerminkan keadaan negara. sistem secara keseluruhan dan prosesnya. Pilihan penunjuk ini dibenarkan oleh keperluan untuk memilih mereka yang paling sepenuhnya, dari sudut pandangan amalan, membolehkan untuk menentukan tahap negeri, daya tarikan pelaburannya dan kemungkinan penyetempatan relatif potensi sedia ada dan ancaman sebenar.

Penunjuk-penunjuk utama sistem penarafan antarabangsa ialah indeks:

  1. Daya Saing Global (GCC).
  2. Kebebasan ekonomi (IES).
  3. Pembangunan potensi manusia(HDI).
  4. Persepsi Rasuah (CPI).
  5. Ancaman dalaman dan luaran (IVZZ).
  6. Potensi untuk Pengaruh Antarabangsa (IPIP).

Fasa kedua memperuntukkan penilaian dan ramalan penunjuk daya saing negeri dari segi penarafan antarabangsa untuk 139 negeri yang dikaji di dunia.

Peringkat ketiga memperuntukkan perbandingan syarat untuk daya saing negeri menggunakan kaedah korelasi dan analisis regresi.

Menggunakan hasil kajian, adalah mungkin untuk menentukan sifat proses secara umum dan untuk komponen individu daya saing negeri; menguji hipotesis tentang pengaruh faktor dan hubungannya pada tahap keertian yang sesuai.

Pelaksanaan set model yang dicadangkan akan membolehkan bukan sahaja untuk menilai keadaan semasa tahap daya saing dan daya tarikan pelaburan negeri, tetapi juga untuk menganalisis kelemahan pengurusan, mencegah kesilapan keputusan yang salah, dan mencegah perkembangan krisis. di negeri itu.

Analisis varians

1. Konsep analisis varians

Analisis varians- ini adalah analisis kebolehubahan sifat di bawah pengaruh mana-mana faktor pembolehubah terkawal. Dalam kesusasteraan asing, analisis varians sering dirujuk sebagai ANOVA, yang diterjemahkan sebagai analisis varians (Analysis of Variance).

Tugas analisis varians terdiri daripada mengasingkan kebolehubahan jenis yang berbeza daripada kebolehubahan am sifat:

a) kebolehubahan disebabkan oleh tindakan setiap pembolehubah bebas yang dikaji;

b) kebolehubahan disebabkan oleh interaksi pembolehubah bebas yang dikaji;

c) variasi rawak disebabkan semua pembolehubah lain yang tidak diketahui.

Kebolehubahan disebabkan oleh tindakan pembolehubah yang dikaji dan interaksinya berkorelasi dengan kebolehubahan rawak. Penunjuk nisbah ini ialah ujian Fisher's F.

Formula untuk mengira kriteria F termasuk anggaran varians, iaitu, parameter taburan ciri, oleh itu kriteria F ialah kriteria parametrik.

Daripada dalam lebih kebolehubahan sesuatu sifat adalah disebabkan oleh pembolehubah (faktor) yang dikaji atau interaksinya, semakin tinggi nilai empirikal kriteria.

Sifar hipotesis dalam analisis varians akan mengatakan bahawa nilai purata ciri berkesan yang dikaji dalam semua penggredan adalah sama.

Alternatif hipotesis akan menyatakan bahawa nilai purata atribut berkesan dalam penggredan berbeza faktor yang dikaji adalah berbeza.

Analisis varians membolehkan kita menyatakan perubahan dalam sifat, tetapi tidak menunjukkan arah perubahan ini.

Mari kita mulakan analisis varians dengan kes yang paling mudah, apabila kita mengkaji tindakan sahaja satu pembolehubah (faktor tunggal).

2. Analisis varians sehala bagi sampel yang tidak berkaitan

2.1. Tujuan kaedah

Kaedah analisis varians univariat digunakan dalam kes di mana perubahan dalam atribut berkesan dikaji di bawah pengaruh perubahan keadaan atau penggredan mana-mana faktor. Dalam versi kaedah ini, pengaruh setiap penggredan faktor adalah pelbagai sampel subjek ujian. Mesti ada sekurang-kurangnya tiga penggredan faktor. (Mungkin terdapat dua penggredan, tetapi dalam kes ini kita tidak akan dapat mewujudkan kebergantungan tak linear dan nampaknya lebih munasabah untuk menggunakan yang lebih mudah).

Varian bukan parametrik jenis analisis ini ialah ujian Kruskal-Wallis H.

Hipotesis

H 0: Perbezaan antara gred faktor (keadaan berbeza) tidak lebih ketara daripada perbezaan rawak dalam setiap kumpulan.

H 1: Perbezaan antara penggredan faktor (keadaan berbeza) lebih ketara daripada perbezaan rawak dalam setiap kumpulan.

2.2. Had analisis univariat varians untuk sampel yang tidak berkaitan

1. Analisis varians univariat memerlukan sekurang-kurangnya tiga penggredan faktor dan sekurang-kurangnya dua subjek dalam setiap penggredan.

2. Sifat terhasil mestilah diedarkan secara normal dalam sampel kajian.

Benar, ia biasanya tidak ditunjukkan sama ada kita bercakap tentang pengedaran sifat dalam keseluruhan sampel yang ditinjau atau di bahagian itu yang membentuk kompleks penyebaran.

3. Contoh penyelesaian masalah dengan kaedah analisis varians faktor tunggal bagi sampel yang tidak berkaitan menggunakan contoh:

Tiga kumpulan berbeza daripada enam subjek menerima senarai sepuluh perkataan. Perkataan disampaikan kepada kumpulan pertama pada kadar yang rendah iaitu 1 perkataan setiap 5 saat, kepada kumpulan kedua pada kadar purata 1 perkataan setiap 2 saat, dan kepada kumpulan ketiga pada kadar yang tinggi iaitu 1 perkataan sesaat. Prestasi pengeluaran semula diramalkan bergantung pada kelajuan penyampaian perkataan. Keputusan dibentangkan dalam Jadual. satu.

Bilangan perkataan yang diterbitkan semula Jadual 1

nombor subjek

kelajuan rendah

kelajuan purata

kelajuan tinggi

jumlah keseluruhan

H 0: Perbezaan isipadu perkataan antara kumpulan tidak lebih ketara daripada perbezaan rawak dalam setiap kumpulan.

H1: Perbezaan dalam jumlah perkataan antara kumpulan lebih ketara daripada perbezaan rawak dalam setiap kumpulan. Menggunakan nilai eksperimen yang dibentangkan dalam Jadual. 1, kami akan menetapkan beberapa nilai yang diperlukan untuk mengira kriteria F.

Pengiraan kuantiti utama untuk analisis varians sehala dibentangkan dalam jadual:

jadual 2

Jadual 3

Urutan Operasi dalam ANOVA Sehala untuk Sampel Terputus

Selalunya digunakan dalam jadual ini dan seterusnya, sebutan SS ialah singkatan untuk "jumlah kuasa dua". Singkatan ini paling kerap digunakan dalam sumber terjemahan.

SS fakta bermaksud kebolehubahan sifat, disebabkan oleh tindakan faktor yang dikaji;

SS biasa- kebolehubahan umum sifat;

S CA- kebolehubahan disebabkan oleh faktor yang tidak diambil kira, kebolehubahan "rawak" atau "sisa".

CIK - "persegi tengah", atau min jumlah kuasa dua, nilai purata SS yang sepadan.

df - bilangan darjah kebebasan, yang, apabila mempertimbangkan kriteria bukan parametrik, kami dilambangkan dengan huruf Yunani v.

Kesimpulan: H 0 ditolak. H 1 diterima. Perbezaan dalam jumlah pembiakan perkataan antara kumpulan adalah lebih ketara daripada perbezaan rawak dalam setiap kumpulan (α=0.05). Jadi, kelajuan penyampaian perkataan mempengaruhi jumlah pembiakan mereka.

Contoh penyelesaian masalah dalam Excel dibentangkan di bawah:

Data awal:

Menggunakan arahan: Alat->Analisis Data->Analisis varians sehala, kami mendapat keputusan berikut:

Kerja kursus dalam matematik

pengenalan

Konsep analisis varians

Analisis varians sehala (Pelaksanaan praktikal dalam IBM SPSS Statistics 20)

Analisis varians sehala (Pelaksanaan praktikal dalam Microsoft Office 2013)

Kesimpulan

Senarai sumber yang digunakan

pengenalan

Perkaitan topik. Perkembangan statistik matematik bermula dengan karya ahli matematik Jerman terkenal Carl Friedrich Gauss pada tahun 1795 dan masih berkembang. AT Analisis statistik terdapat kaedah parametrik "Analisis satu faktor varians". Pada masa ini, ia digunakan dalam ekonomi semasa menjalankan penyelidikan pasaran untuk perbandingan hasil (contohnya, semasa menjalankan tinjauan tentang penggunaan produk di kawasan yang berbeza di negara ini, adalah perlu untuk membuat kesimpulan tentang perbezaan atau prestasi data tinjauan. tidak berbeza antara satu sama lain; dalam psikologi, semasa menjalankan pelbagai jenis penyelidikan), semasa menyusun ujian perbandingan saintifik, atau menyelidik mana-mana kumpulan sosial, dan untuk menyelesaikan masalah dalam statistik.

Tujuan kerja. Kenali kaedah statistik seperti analisis varians sehala, serta pelaksanaannya pada PC dalam pelbagai program dan bandingkan program ini.

Untuk mengkaji teori analisis varians sehala.

Untuk mengkaji program untuk menyelesaikan masalah untuk analisis faktor tunggal.

Berbelanja analisis perbandingan program-program ini.

Pencapaian kerja: Bahagian praktikal Kerja itu dilakukan sepenuhnya oleh pengarang: pemilihan program, pemilihan tugas, penyelesaiannya pada PC, selepas itu analisis perbandingan dijalankan. Dalam bahagian teori, klasifikasi kumpulan ANOVA telah dijalankan. kerja ini telah diuji sebagai laporan pada sesi saintifik pelajar "Soalan terpilih matematik yang lebih tinggi dan Kaedah Pengajaran Matematik"

Struktur dan skop kerja. Karya terdiri daripada pengenalan, kesimpulan, kandungan dan bibliografi, termasuk 4 tajuk. Jumlah keseluruhan karya ialah 25 halaman bercetak. Kerja ini mengandungi 1 contoh yang diselesaikan oleh 2 program.

Konsep analisis varians

Selalunya terdapat keperluan untuk menyiasat pengaruh satu atau lebih pembolehubah tidak bersandar (faktor) pada satu atau lebih pembolehubah bersandar (ciri hasil), masalah sedemikian boleh diselesaikan dengan kaedah analisis varians, yang dikarang oleh R. Fisher.

Analisis varians ANOVA ialah satu set kaedah pemprosesan data statistik yang membolehkan anda menganalisis kebolehubahan satu atau lebih ciri berkesan di bawah pengaruh faktor terkawal (pembolehubah bebas). Di sini, faktor difahami sebagai nilai tertentu yang menentukan sifat objek atau sistem yang dikaji, i.e. sebab hasil akhirnya. Apabila menjalankan analisis varians, adalah penting untuk memilih sumber dan objek pengaruh yang betul, i.e. mengenal pasti pembolehubah bersandar dan bebas.

Bergantung kepada tanda-tanda pengelasan, beberapa kumpulan klasifikasi analisis varians dibezakan (Jadual 1).

Mengikut bilangan faktor yang diambil kira: Analisis univariat - pengaruh satu faktor dikaji; Analisis multivariate - pengaruh serentak dua atau lebih faktor dikaji. Dengan adanya hubungan antara sampel nilai: Analisis yang tidak berkaitan (berbeza ) sampel - dijalankan apabila terdapat beberapa kumpulan objek kajian terletak keadaan yang berbeza. (Hipotesis nol H0 disemak: nilai min pembolehubah bersandar adalah sama dalam keadaan pengukuran yang berbeza, iaitu tidak bergantung kepada faktor yang dikaji.); Analisis sampel yang berkaitan (sama) - dijalankan untuk dua atau lebih pengukuran yang diambil pada kumpulan yang sama objek yang dikaji dalam keadaan yang berbeza. Di sini, pengaruh faktor yang tidak diambil kira adalah mungkin, yang boleh dikaitkan secara salah kepada perubahan dalam keadaan. Dengan bilangan pembolehubah bersandar yang dipengaruhi oleh faktor. Analisis univariat (ANOVA atau AMCOVA - analisis kovarians) - satu pembolehubah bersandar dipengaruhi oleh faktor ; Analisis multivariate (MANOVA - analisis multivariate varians atau MANSOVA - analisis kovarian multivariate) - beberapa pembolehubah bersandar dipengaruhi oleh faktor. Mengikut tujuan kajian. Deterministik - tahap semua faktor ditetapkan terlebih dahulu dan ia adalah pengaruhnya yang disemak (hipotesis H0 disemak tentang ketiadaan perbezaan antara tahap purata); Rawak - tahap setiap faktor diperolehi sebagai sampel rawak daripada populasi umum tahap faktor (hipotesis H0 sedang diuji bahawa penyebaran nilai tindak balas purata yang dikira untuk tahap faktor yang berbeza adalah bukan sifar);

Analisis sehala bagi semakan varians kepentingan statistik perbezaan antara cara sampel dua atau lebih populasi untuk ini, hipotesis dibentuk secara awal.

Hipotesis nol H0: nilai purata ciri berkesan dalam semua keadaan tindakan faktor (atau penggredan faktor) adalah sama

Hipotesis alternatif H1: nilai purata ciri berkesan dalam semua keadaan faktor adalah berbeza.

Kaedah ANOVA boleh digunakan untuk populasi taburan normal (analog berbilang bagi ujian parametrik) dan kepada populasi yang tidak mempunyai taburan pasti (analog berbilang bagi ujian bukan parametrik). Dalam kes pertama, perlu terlebih dahulu menetapkan bahawa pengedaran ciri yang terhasil adalah normal. Untuk menyemak kenormalan taburan ciri, anda boleh menggunakan penunjuk asimetri A = , , dan kurtosis E = , , di mana , . - nilai ciri berkesan dan nilai puratanya; - sisihan piawai ciri yang terhasil; .

Bilangan pemerhatian;

Ralat keterwakilan untuk penunjuk A dan E

Jika penunjuk kecondongan dan kurtosis tidak melebihi kesilapan perwakilan mereka lebih daripada 3 kali, i.e. DAN<3тА и Е <3тЕ, то распределение можно считать нормальным. Для нормальных распределений показатели А и Е равны нулю.

Data yang berkaitan dengan satu keadaan faktor (kepada satu penggredan) dipanggil kompleks penyebaran. Apabila menjalankan analisis varians, kesamaan serakan antara kompleks perlu diperhatikan. Dalam kes ini, pemilihan elemen perlu dilakukan secara rawak.

Dalam kes kedua, apabila populasi sampel mempunyai taburan sewenang-wenangnya, analog bukan parametrik (pangkat) analisis varians sehala digunakan (kriteria Kruskal-Wallis, Friedman).

Pertimbangkan ilustrasi grafik pergantungan kadar pulangan saham pada keadaan dalam ekonomi negara (Rajah 1, a). Di sini, faktor yang dikaji ialah tahap keadaan ekonomi (lebih tepat lagi, tiga tahap keadaannya), dan ciri berkesan ialah kadar pulangan. Pengagihan di atas menunjukkan bahawa faktor ini mempunyai kesan yang signifikan terhadap keuntungan, i.e. Apabila ekonomi bertambah baik, begitu juga pulangan saham, yang tidak bertentangan dengan akal sehat.

Ambil perhatian bahawa faktor yang dipilih mempunyai penggredan, i.e. nilainya berubah semasa peralihan dari satu penggredan ke yang lain (dari satu keadaan ekonomi ke yang lain).

nasi. 1. Nisbah pengaruh faktor dan penyebaran intra-kumpulan: a - pengaruh signifikan faktor; b - pengaruh faktor yang tidak ketara

Kumpulan penggredan faktor hanyalah kes khas, di samping itu, faktor boleh mempunyai penggredan yang dibentangkan walaupun dalam skala nominal. Oleh itu, lebih kerap mereka bercakap bukan tentang penggredan faktor, tetapi tentang pelbagai syarat tindakannya.

Sekarang mari kita pertimbangkan idea analisis varians, yang berdasarkan peraturan penambahan varians: jumlah varians adalah sama dengan jumlah antara kumpulan dan purata varians dalam kumpulan:

Jumlah varians yang timbul daripada pengaruh semua faktor

Penyerakan antara kumpulan disebabkan oleh pengaruh semua faktor lain;

Varians dalam kumpulan purata yang disebabkan oleh pengaruh atribut kumpulan.

Pengaruh sifat berkumpulan jelas dilihat dalam Rajah 1a, kerana pengaruh faktor adalah signifikan berbanding dengan serakan intrakumpulan, oleh itu, varians antara kumpulan akan lebih besar daripada intrakumpulan satu ( > ), dan dalam Rajah. 1, b, gambaran yang bertentangan diperhatikan: di sini penyebaran intrakumpulan berlaku dan pengaruh faktor secara praktikal tidak hadir.

Analisis varians dibina atas prinsip yang sama, cuma ia tidak menggunakan varians, tetapi purata sisihan kuasa dua ( , , ), yang merupakan anggaran tidak berat sebelah bagi varians yang sepadan. Ia diperoleh dengan membahagikan jumlah sisihan kuasa dua dengan bilangan darjah kebebasan yang sepadan

Agregat secara keseluruhan;

Purata dalam kumpulan;

Purata antara kumpulan;

Purata keseluruhan untuk semua ukuran (untuk semua kumpulan);

Purata kumpulan untuk penggredan ke-j bagi faktor.

Jangkaan matematik untuk jumlah sisihan kuasa dua antara kumpulan dan antara kumpulan, masing-masing, dikira dengan formula: (Model faktor tetap),

.

E ( ) = E ( ) = , maka hipotesis nol H0 tentang ketiadaan perbezaan antara min disahkan, oleh itu, faktor yang dikaji tidak mempunyai kesan yang ketara (lihat Rajah 1, b). Jika nilai sebenar ujian F Fisher F= E ( ) /E ( ) akan lebih besar daripada kritikal maka hipotesis nol H0 pada aras keertian , hipotesis alternatif H1 ditolak dan diterima - tentang kesan ketara faktor rajah. 1, a. .

Analisis varians sehala

Analisis varians yang menganggap hanya satu pembolehubah dipanggil ANOVA Sehala.

Terdapat sekumpulan n objek pemerhatian dengan nilai terukur beberapa pembolehubah yang dikaji . setiap pembolehubah dipengaruhi oleh beberapa faktor kualiti Dengan beberapa tahap (penggredan) impak. Nilai pembolehubah yang diukur pada tahap faktor yang berbeza diberikan dalam Jadual 2 (ia juga boleh dibentangkan dalam bentuk matriks).

Jadual 2.

Bentuk jadual untuk menentukan data awal untuk analisis univariat

Nombor objek pemerhatian ()Nilai boleh ubah pada tahap (penggredan) faktor (paling rendah) (pendek)… (tertinggi)1 2 … n .Di sini, setiap tahap boleh mengandungi bilangan respons berbeza yang diukur pada satu tahap faktor, maka setiap lajur akan mempunyai nilainya sendiri . Ia dikehendaki menilai kepentingan pengaruh faktor ini terhadap pembolehubah yang dikaji. Untuk menyelesaikan masalah ini, model analisis varians satu faktor boleh digunakan. Model penyebaran satu faktor.

Nilai pembolehubah yang dikaji untuk objek ke-kecerapan di -tahap faktor ke-;

Purata kumpulan untuk -tahap faktor ke-;

Kesan disebabkan oleh pengaruh tahap -th faktor;

Komponen rawak, atau gangguan yang disebabkan oleh pengaruh faktor yang tidak terkawal. Jadi mari kita serlahkan batasan utama menggunakan ANOVA:

Kesamaan kepada sifar jangkaan matematik bagi komponen rawak: = 0.

Komponen rawak , dan oleh itu juga mempunyai taburan normal.

Bilangan penggredan faktor mestilah sekurang-kurangnya tiga.

Model ini, bergantung pada tahap faktor, menggunakan ujian Fisher F, membolehkan anda menguji salah satu hipotesis nol.

Apabila melakukan analisis varians untuk sampel yang berkaitan, adalah mungkin untuk menguji satu lagi hipotesis nol H0(u) - perbezaan individu antara objek pemerhatian dinyatakan tidak lebih daripada perbezaan disebabkan oleh sebab rawak.

Analisis varians sehala

(Pelaksanaan praktikal dalam IBM SPSS Statistics 20)

Pengkaji berminat dengan persoalan bagaimana sesuatu atribut berubah dalam keadaan berbeza tindakan pembolehubah (faktor). Kesan hanya satu pembolehubah (faktor) terhadap sifat yang dikaji dikaji. Kami telah mempertimbangkan contoh dari ekonomi; sekarang kami akan memberikan contoh dari psikologi, sebagai contoh, bagaimana masa untuk menyelesaikan masalah berubah di bawah keadaan motivasi subjek yang berbeza (rendah, sederhana, motivasi tinggi) atau dengan cara yang berbeza. membentangkan tugasan (secara lisan, bertulis atau dalam bentuk teks dengan graf dan ilustrasi), dalam keadaan yang berbeza bekerja dengan tugasan (sendirian, di dalam bilik dengan guru, di dalam bilik darjah). Dalam kes pertama, faktornya adalah motivasi, dalam kedua - tahap keterlihatan, dalam ketiga - faktor publisiti.

Dalam versi kaedah ini, sampel subjek yang berbeza didedahkan kepada pengaruh setiap penggredan. Mesti ada sekurang-kurangnya tiga penggredan faktor.

Contoh 1. Tiga kumpulan berbeza daripada enam subjek telah diberikan senarai sepuluh perkataan. Perkataan disampaikan kepada kumpulan pertama pada kadar yang rendah iaitu 1 perkataan setiap 5 saat, kepada kumpulan kedua pada kadar purata 1 perkataan setiap 2 saat, dan kepada kumpulan ketiga pada kadar yang tinggi iaitu 1 perkataan sesaat. Diramalkan bahawa prestasi pembiakan akan bergantung pada kelajuan pembentangan perkataan (Jadual 3).

Jadual 3

Bilangan perkataan yang diterbitkan semula

SubjekKumpulan 1 kelajuan rendahKumpulan 2 kelajuan sederhanaKumpulan 3 kelajuan tinggi

Kami merumuskan hipotesis: perbezaan dalam jumlah pembiakan perkataan antara kumpulan tidak lebih ketara daripada perbezaan rawak dalam setiap kumpulan: Perbezaan dalam pembiakan perkataan antara kumpulan lebih ketara daripada perbezaan rawak dalam setiap kumpulan.

Kami akan menjalankan penyelesaian dalam persekitaran SPSS mengikut algoritma berikut

Jom jalankan program SPSS

Masukkan nilai berangka dalam tetingkap data

nasi. 1. Memasukkan nilai dalam SPSS

Di tingkap Pembolehubah kami menerangkan semua data awal, mengikut keadaan

Tugasan

Rajah 2 Tetingkap Pembolehubah

Untuk kejelasan, dalam lajur label, kami menerangkan nama jadual

Dalam graf Nilai terangkan bilangan setiap kumpulan

Rajah 3 Label Nilai

Semua ini dilakukan untuk kejelasan, i.e. tetapan ini boleh diabaikan.

Dalam graf skala , dalam lajur kedua anda perlu meletakkan nilai nominal

Di tingkap data pesan analisis varians sehala menggunakan menu "Analisis". Perbandingan Purata

Analisis varians sehala…

Rajah 4 Fungsi ANOVA Sehala

Dalam kotak dialog yang dibuka Analisis varians sehala pilih pembolehubah bersandar dan tambahkannya senarai tanggungan , dan faktor pembolehubah dalam faktor tetingkap

Rajah 5 menyerlahkan senarai tanggungan dan faktor

Sediakan beberapa parameter untuk output data berkualiti tinggi

Rajah 6 Parameter untuk inferens data kualitatif

Pengiraan untuk algoritma ANOVA sehala yang dipilih bermula selepas mengklik okey

Pada penghujung pengiraan, hasil pengiraan dipaparkan dalam tetingkap paparan.

Kumpulan Statistik Deskriptif NAverage Std. Sisihan Std. Ralat 95% selang keyakinan untuk min Minimum Maksimum Jadual 2. Statistik deskriptif

Jadual Statistik deskriptif menunjukkan penunjuk utama untuk kelajuan dalam kumpulan dan jumlah nilainya.

Bilangan pemerhatian dalam setiap kumpulan dan jumlahnya

Min - min aritmetik pemerhatian dalam setiap kumpulan dan untuk semua kumpulan bersama

Std. Sisihan, Std. Ralat - sisihan piawai dan sisihan piawai

% selang keyakinan untuk min - selang ini lebih tepat untuk setiap kumpulan dan untuk semua kumpulan bersama-sama, daripada mengambil selang di bawah atau melebihi had ini.

Minimum, Maksimum - nilai minimum dan maksimum untuk setiap kumpulan yang subjek dengar

rawak varians faktor tunggal

Kriteria untuk kehomogenan kumpulan varians Statistik Livinast.st.1st.st.

Ujian kehomogenan Livin digunakan untuk menguji serakan untuk kehomogenan (homogeniti). Dalam kes ini, ia mengesahkan tidak signifikan perbezaan antara varians, kerana nilai = 0.915, iaitu, jelas lebih besar daripada 0.05. Oleh itu, keputusan yang diperoleh menggunakan analisis varians diiktiraf sebagai betul.

Jadual analisis varians 1 arah menunjukkan keputusan DA 1 hala

Jumlah kuasa dua "antara kumpulan" ialah jumlah kuasa dua perbezaan antara min keseluruhan dan min dalam setiap kumpulan, ditimbang dengan bilangan objek dalam kumpulan

"Dalam kumpulan" ialah jumlah perbezaan kuasa dua antara min setiap kumpulan dan setiap nilai kumpulan itu

Lajur "St. St." mengandungi bilangan darjah kebebasan V:

Antara kumpulan (v=bilangan kumpulan - 1);

Intragroup (v=bilangan objek - bilangan kumpulan - 1);

"min kuasa dua" mengandungi nisbah jumlah kuasa dua kepada bilangan darjah kebebasan.

Lajur "F" menunjukkan nisbah min kuasa dua antara kumpulan kepada min kuasa dua dalam kumpulan.

Lajur "nilai" mengandungi nilai kebarangkalian bahawa perbezaan yang diperhatikan adalah rawak.

Jadual 4 Formula

Graf purata

Graf menunjukkan bahawa ia semakin berkurangan. Ia juga mungkin untuk menentukan daripada jadual Fk k1=2, k2=15 nilai jadual statistik ialah 3.68. Mengikut peraturan, jika , maka hipotesis nol diterima, jika tidak, hipotesis alternatif diterima. Untuk contoh kita (7.45>3.68), maka hipotesis alternatif diterima. Oleh itu, kembali kepada keadaan masalah, kita boleh membuat kesimpulan hipotesis nol ditolak dan alternatif diterima. : perbezaan jumlah perkataan antara kumpulan adalah lebih ketara berbanding perbezaan rawak dalam setiap kumpulan ). Itu. kelajuan penyampaian perkataan mempengaruhi jumlah pembiakannya.

Analisis varians sehala

(Pelaksanaan praktikal dalam Microsoft Office 2013)

Dalam contoh yang sama, pertimbangkan analisis varians sehala dalam Microsoft Office 2013

Menyelesaikan masalah dalam Microsoft Excel

Jom buka Microsoft Excel.


Rajah 1. Menulis data ke Excel

Mari tukar data kepada format nombor. Untuk melakukan ini, pada tab utama terdapat item Format dan ia mempunyai subperenggan Format Sel . Tetingkap Format Sel muncul pada skrin. nasi. 2 Pilih Format nombor dan data yang dimasukkan ditukar. Seperti yang ditunjukkan dalam Rajah.3

Rajah 2 Tukar kepada Format Numerik

Rajah 3 Keputusan selepas penukaran

Pada tab data terdapat item analisis data mari klik padanya.

Mari pilih Analisis sehala bagi varians

Rajah 6 Analisis data

Tetingkap analisis varians sehala akan muncul pada skrin untuk menjalankan analisis serakan data (Rajah 7). Mari konfigurasikan parameter

nasi. 7 Menetapkan parameter untuk analisis univariate

Klik tetikus dalam medan Selang input. Pilih julat sel B2::F9, data yang anda ingin analisis. Dalam medan Jarak Input kumpulan kawalan Input, julat yang ditentukan muncul.

Jika suis baris demi baris tidak ditetapkan dalam kumpulan kawalan data Input, kemudian pilihnya supaya program Excel menerima kumpulan data mengikut baris.

Pilihan Pilih kotak semak Label dalam Baris Pertama dalam kumpulan kawalan Input jika lajur pertama julat data yang dipilih mengandungi nama baris.

Dalam medan input Alpha kumpulan kawalan data Input, secara lalai, nilai 0.05 dipaparkan, yang dikaitkan dengan kebarangkalian ralat dalam analisis varians.

Jika suis selang output tidak ditetapkan dalam kumpulan kawalan Parameter Output, kemudian tetapkannya atau pilih suis lembaran kerja baharu supaya data dipindahkan ke helaian baharu.

Klik butang OK untuk menutup tetingkap ANOVA Sehala. Keputusan analisis varians akan muncul (Rajah 8).

Rajah 8 Output data

Dalam julat sel A4:E7 adalah hasilnya Statistik deskriptif. Baris 4 mengandungi nama parameter, baris 5 - 7 - nilai statistik dikira mengikut kelompok. Dalam lajur "Akaun" ialah bilangan ukuran, dalam lajur "Jumlah" - jumlah nilai, dalam lajur "Purata" - purata nilai aritmetik, dalam lajur "Penyebaran" - penyebaran.

Keputusan yang diperoleh menunjukkan bahawa purata beban pecah tertinggi adalah dalam kumpulan No. 1, dan serakan beban pecah terbesar adalah dalam kelompok No. 2, No. 1.

Julat sel A10:G15 memaparkan maklumat mengenai kepentingan percanggahan antara kumpulan data. Baris 11 mengandungi nama-nama analisis parameter varians, baris 12 - hasil pemprosesan antara kumpulan, baris 13 - hasil pemprosesan intrakumpulan, dan baris 15 - jumlah nilai kedua-dua baris ini.

Lajur SS mengandungi nilai variasi, i.e. hasil tambah kuasa dua atas semua sisihan. Variasi, seperti serakan, mencirikan penyebaran data.

Lajur df mengandungi nilai bilangan darjah kebebasan. Nombor-nombor ini menunjukkan bilangan sisihan bebas yang mana varians akan dikira. Sebagai contoh, bilangan darjah kebebasan antara kumpulan adalah sama dengan perbezaan antara bilangan kumpulan data dan satu. Bagaimana lebih banyak nombor darjah kebebasan, semakin tinggi kebolehpercayaan parameter serakan. Data darjah kebebasan dalam jadual menunjukkan bahawa keputusan dalam kumpulan lebih dipercayai daripada parameter antara kumpulan.

Lajur MS mengandungi nilai serakan, yang ditentukan oleh nisbah variasi dan bilangan darjah kebebasan. Serakan mencirikan tahap serakan data, tetapi tidak seperti magnitud variasi, ia tidak mempunyai kecenderungan langsung untuk meningkat dengan peningkatan dalam bilangan darjah kebebasan. Jadual menunjukkan bahawa varians antara kumpulan adalah jauh lebih besar daripada varians intrakumpulan.

Lajur F mengandungi nilai statistik F, dikira dengan nisbah varians antara kumpulan dan antara kumpulan.

Lajur F-kritikal mengandungi nilai kritikal F yang dikira daripada bilangan darjah kebebasan dan nilai Alpha. F-statistik dan nilai F-kritikal menggunakan ujian Fisher-Snedekor.

Jika statistik F lebih besar daripada nilai kritikal F, maka boleh dikatakan bahawa perbezaan antara kumpulan data tidak rawak. mereka. pada tahap kepentingan α = 0 .05 (dengan kebolehpercayaan 0.95), hipotesis nol ditolak dan alternatifnya diterima: bahawa kelajuan pembentangan perkataan mempengaruhi volum pembiakannya. Lajur P-nilai mengandungi kebarangkalian bahawa perbezaan antara kumpulan adalah rawak. Oleh kerana kebarangkalian ini sangat kecil dalam jadual, sisihan antara kumpulan adalah tidak rawak.

Perbandingan IBM SPSS Statistics 20 dan Microsoft Office 2013

atur cara rawak varians satu faktor

Mari kita lihat output program, untuk ini kita akan melihat semula tangkapan skrin.

Analisis sehala bagi kumpulan varians Jumlah Kuasa Dua St.Lm Min Square FZn Antara kumpulan31.444215.7227.447.006 Dalam kumpulan31.667152.111Jumlah63.11117

Oleh itu, program IBM SPSS Statistics 20 menghasilkan skor yang lebih baik, boleh membundarkan nombor, membina graf visual(cm. penyelesaian yang lengkap) yang mana anda boleh menentukan jawapannya, ia menerangkan dengan lebih terperinci kedua-dua keadaan masalah dan penyelesaiannya. Microsoft Office 2013 mempunyai kelebihannya, pertama sekali, tentu saja, kelazimannya, kerana Microsoft Office 2013 dipasang di hampir setiap komputer, ia memaparkan Fcritical, yang tidak disediakan dalam Statistik SPSS, dan ia juga mudah dan mudah untuk dikira di sana. Namun, kedua-dua program ini sangat sesuai untuk menyelesaikan masalah bagi analisis varians sehala, setiap daripadanya mempunyai kebaikan dan keburukan, tetapi jika anda mengira tugas besar dengan lebih banyak syarat akan mengesyorkan Statistik SPSS.

Kesimpulan

Analisis varians digunakan dalam semua bidang kajian saintifik, di mana perlu untuk menganalisis pengaruh pelbagai faktor kepada pembolehubah yang dikaji. AT dunia moden Terdapat banyak tugas untuk analisis faktor tunggal bagi varians dalam ekonomi, psikologi, dan biologi. Hasil daripada belajar bahan teori didapati bahawa asas analisis varians adalah teorem mengenai penambahan varians, daripada banyak pakej perisian di mana radas analisis varians dilaksanakan, yang terbaik telah dipilih dan dimasukkan ke dalam kerja. Terima kasih kepada kemunculan teknologi baru, setiap daripada kita boleh menjalankan penyelidikan (keputusan), sambil menghabiskan lebih sedikit masa dan usaha untuk pengiraan, menggunakan komputer. Dalam proses kerja, matlamat ditetapkan, tugas yang dicapai.

senarai sastera

Sidorenko, E.V. Kaedah pemprosesan matematik dalam psikologi [Teks] / St. 2011. - 256 hlm.

Statistik matematik untuk ahli psikologi Ermolaev O.Yu [Teks] / Moscow_2009 -336s

Kuliah 7. Statistik analisis [ sumber elektronik]. , Tarikh capaian: 05/14/14

Teori kebarangkalian dan statistik matematik [Teks] / Gmurman V.E. 2010 -479s