Biografi Ciri-ciri Analisis

Kaedah pemprosesan maklumat dan ramalan untuk pelajar kepakaran: "Pengurusan Organisasi". Nilai jadual kriteria Irwin untuk unsur ekstrem siri variasi V.V.

Biarkan sampel yang diperhatikan dan biarkan siri variasi yang dibina daripadanya. Hipotesis yang diuji ialah semua orang adalah milik yang sama penduduk(tiada pelepasan). Hipotesis alternatif ialah terdapat outlier dalam sampel yang diperhatikan.

Menurut kriteria Chauvet, unsur sampel isipadu adalah outlier jika kebarangkalian sisihan daripada nilai min tidak lebih besar daripada .

Statistik Chauvin berikut disusun:

di manakah nilai purata,

Varians sampel

Mari kita tentukan apakah taburan statistik apabila hipotesis dipenuhi. Untuk melakukan ini, kami membuat andaian bahawa walaupun pada pembolehubah rawak kecil dan bebas, maka ketumpatan taburan pembolehubah rawak mempunyai bentuk:


Nilai fungsi pengedaran ini boleh dikira menggunakan pakej matematik Maple 14, menggantikan nilai yang diperoleh dan bukannya parameter yang tidak diketahui.

Jika statistik maka nilai () harus dianggap sebagai outlier. Nilai kritikal diberikan dalam jadual (lihat Lampiran A). Sebaliknya, kami menggantikan nilai ekstrem ke dalam formula (1.1) untuk memeriksa kehadiran outlier.

Kriteria Irvine

Kriteria ini digunakan apabila varians taburan diketahui terlebih dahulu.

Saiz sampel diekstrak daripada populasi normal, dan siri variasi disusun (disusun dalam tertib menaik). Hipotesis yang sama dan seperti dalam kriteria sebelumnya dipertimbangkan.

Apabila nilai terbesar (terkecil) diiktiraf sebagai outlier dengan kebarangkalian. Nilai kritikal disenaraikan dalam jadual.

Kriteria Grubbs

Biarkan sampel diekstrak dan siri variasi dibina daripadanya. Hipotesis yang diuji ialah semua () tergolong dalam populasi yang sama. Apabila menguji outlier bagi nilai sampel terbesar, hipotesis alternatif ialah ia tergolong dalam satu undang-undang, tetapi kepada beberapa undang-undang lain, beralih dengan ketara ke kanan. Apabila menyemak outlier bagi nilai sampel terbesar, statistik ujian Grubbs mempunyai borang

di mana dikira mengikut formula (1.2), dan - mengikut (1.3)

Apabila menguji outlier bagi nilai sampel terkecil, hipotesis alternatif mengandaikan bahawa ia tergolong dalam beberapa undang-undang lain, dengan ketara beralih ke kiri. DALAM dalam kes ini statistik yang dikira mengambil bentuk

di mana dikira menggunakan formula (1.2), dan - menggunakan (1.3).

Statistik atau digunakan apabila varians diketahui terlebih dahulu; statistik dan - apabila serakan dianggarkan daripada sampel menggunakan hubungan (1.3).

Maksimum atau elemen minimum sampel dianggap outlier jika nilai statistik yang sepadan melebihi nilai kritikal: atau, di manakah tahap keertian yang ditentukan. Nilai kritikal diberikan dalam jadual ringkasan (lihat Lampiran A). Statistik yang diperolehi dalam kriteria ini apabila hipotesis nol dipenuhi mempunyai taburan yang sama seperti statistik dalam kriteria Chauvin.

Untuk > 25, anggaran untuk nilai kritikal boleh digunakan

di mana - ialah kuantiti piawai taburan normal.

Dan ia dianggarkan seperti berikut

Jika varians () dan jangkaan matematik (µ - nilai purata) diketahui dalam sampel yang diekstrak, maka statistik digunakan

Nilai kritikal statistik ini juga dijadualkan. Jika, maka outlier dianggap penting dan hipotesis alternatif diterima.


Tugasan untuk belajar sendiri disiplin.

Tugasan 1. Selaras dengan pilihan, simulasi satu set data empirikal yang diperoleh hasil daripada mengukur ciri satu dimensi. Untuk melakukan ini, anda perlu menjadualkan fungsi:

, ,

dan menerima 15 – 20 data berturut-turut. Di sini, mungkin, ciri atribut (mencerminkan kecenderungan utama atribut), dan gangguan (kesilapan) pengukuran, yang merupakan hasil daripada manifestasi rawak pelbagai jenis.

Pilihan data sumber:

Kenal pasti tahap anomali siri data yang diperoleh semasa menjadualkan fungsi dan lakukan pelicinannya:

A). Kaedah Irwin, mengikut formula

,

.

Nilai yang dikira dibandingkan dengan nilai jadual kriteria Irvine:

Jadual kriteria Irvine

Jadual menunjukkan nilai kriteria Irwin untuk tahap keertian (dengan ralat 5%).

b). kaedah menyemak perbezaan dalam tahap purata, membahagikan siri masa data kepada lebih kurang dua bahagian yang sama dan mengira nilai min dan varians bagi setiap bahagian. Seterusnya, semak kesamaan varians kedua-dua bahagian menggunakan ujian Fisher. Jika hipotesis kesamaan varians diterima, teruskan untuk menguji hipotesis ketiadaan trend menggunakan ujian t Pelajar. Untuk mengira kepentingan empirikal statistik, gunakan formula:

,

di manakah purata sisihan piawai perbezaan min:

.

Bandingkan nilai pengiraan statistik dengan nilai jadual.

V). Kaedah Foster-Stewart.

2. Menjalankan pelicinan mekanikal tahap baris:

A). kaedah purata bergerak mudah;

b). kaedah purata bergerak berwajaran;

V). Kaedah pelicinan eksponen.

Tugasan 2. Dalam jadual data penunjuk ekonomi, siri masa volum pengangkutan bulanan (terikat pada kawasan tertentu) barangan pertanian dalam unit konvensional diberikan.

Menggunakan kaedah Chetverikov untuk mengasingkan komponen siri masa:

A). selaraskan siri empirikal menggunakan purata bergerak berpusat dengan tempoh pelicinan;

b). tolak anggaran awal aliran yang terhasil daripada siri empirikal asal: .

V). Kira bagi setiap tahun (mengikut baris) sisihan piawai nilai menggunakan formula

G). cari nilai awal bagi gelombang bermusim purata: .

d). dapatkan siri tanpa gelombang bermusim: .

e). lancarkan siri yang terhasil menggunakan purata bergerak mudah dengan selang pelicinan bersamaan dengan lima, dan dapatkan anggaran aliran baharu.

dan). hitung sisihan siri daripada siri empirikal asal:

.

h). sisihan yang terhasil hendaklah diproses mengikut perenggan. V). dan d). untuk mengenal pasti nilai gelombang bermusim baharu.

Dan). hitung pekali keamatan gelombang bermusim menggunakan formula dan seterusnya (pekali itu sendiri):

.

Pekali ketegangan tidak dikira untuk tahun pertama dan terakhir.

Kepada). Dengan menggunakan pekali tegangan, hitung nilai akhir komponen bermusim siri masa: .

Tugasan 3. Siri masa diberikan dalam jadual:

Mula-mula pilih keluk pertumbuhan terbaik:

A). kaedah perbezaan terhingga (Tintner);

b). kaedah ciri pertumbuhan.

2. Untuk siri asal, bina model linear , setelah menentukan parameternya menggunakan kaedah kuasa dua terkecil.

3. Untuk siri masa asal, bina model Brown adaptif dengan parameter pelicinan dan ; pilih nai model terbaik coklat , di manakah tempoh pendahuluan (bilangan langkah ke hadapan).

4. Menilai kecukupan model berdasarkan penyelidikan:

A). kedekatan jangkaan matematik komponen sisa sifar; menerima nilai kritikal statistik Pelajar (untuk kebarangkalian keyakinan 0,70);

b). sisihan rawak komponen baki mengikut kriteria puncak (titik pusingan); melakukan pengiraan berdasarkan nisbah ;

V). kebebasan (ketiadaan autokorelasi) tahap beberapa baki sama ada mengikut kriteria Durbin-Watson (gunakan tahap dan sebagai kritikal) atau mengikut pekali autokorelasi pertama (ambil tahap kritikal sama dengan );

G). kenormalan hukum taburan komponen baki berdasarkan kriteria RS (seperti tahap kritikal terima selang (2.7 – 3.7)).

5. Menilai ketepatan model menggunakan sisihan piawai dan min ralat relatif anggaran.

6. Berdasarkan analisis perbandingan kecukupan dan ketepatan model, pilih model terbaik untuk membina ramalan titik dan selang dua langkah ke hadapan (). Keputusan ramalan dipaparkan secara grafik.

Tugasan 4. Penilaian dibuat ke atas pemproses 10 stesen kerja rangkaian tempatan, dibina berdasarkan mesin yang lebih kurang jenis yang sama, tetapi daripada pengeluar yang berbeza (yang membayangkan beberapa penyelewengan dalam parameter operasi mesin daripada model asas). Untuk menguji operasi pemproses, campuran jenis ICOMP 2.0 digunakan, yang berdasarkan dua ujian utama:

1. 125.turb3D – ujian simulasi pergolakan dalam isipadu padu(perisian aplikasi);

2. NortonSI32 – program kejuruteraan taip AutoCaD

dan ujian tambahan untuk menormalkan masa pemprosesan data SPECint_base95. Pemproses dinilai menggunakan masa pelaksanaan berwajaran campuran, dinormalisasi oleh kecekapan pemproses asas, mengikut formula

di manakah masa pelaksanaan ujian ke;

berat ujian;

kecekapan pemproses asas pada ujian m.

Jika ungkapan (1) diambil secara logaritma, kita dapat:

dan selepas menamakan semula pembolehubah:

masa pemprosesan ujian asas SPECint_base95 ;

logaritma masa pemprosesan ujian pertama,

logaritma masa pemprosesan ujian kedua, pekali regresi yang diperoleh dalam penilaian (berat ujian);

pekali regresi – berat ujian untuk memproses operasi aritmetik dalam integer (ujian asas).

1. Berdasarkan data pengukuran yang diberikan dalam jadual, bina fungsi regresi (empirikal), anggaran pekali regresi dan semak model untuk kecukupan (kira matriks kovarians, pekali korelasi pasangan, pekali penentuan).

Pilihan data:

Pilihan 1.

Pilihan 2.

Pilihan 3.

Pilihan 4.

Apabila gelongsor relatif bahagian pasangan geseran berlaku, kerosakan pada permukaan yang bersentuhan berlaku. Jenis kerosakan pada isipadu permukaan bahagian ini dipanggil haus dan lusuh Kehilangan hanya seperseribu daripada berat mesin akibat haus membawa kepada kehilangan prestasi sepenuhnya. Setiap tiga tahun...
(Mekanik. Asas pengiraan dan reka bentuk bahagian mesin)
  • KRITERIA UNTUK KESTABILAN SISTEM DAN KAEDAH UNTUK MENENTUKAN BEBAN KRITIKAL
    Terdapat tiga kriteria utama untuk kestabilan struktur: dinamik, statik dan tenaga, yang juga menentukan metodologi untuk mengira kestabilan struktur. 1. Dinamik(menurut Lyapunov) kriteria adalah berdasarkan kajian penyelesaian kepada persamaan gerakan dinamik yang menyimpang daripada...
    (Mekanik struktur sistem batang rata)
  • KRITERIA PEMILIHAN SALURAN PENGEDARAN IKLAN
    Di antara semua keputusan yang dibuat semasa proses perancangan, yang paling penting ialah pemilihan media tertentu dalam setiap media. Sebagai peraturan, perancang media berusaha untuk memilih media yang membolehkan mereka mencapai matlamat berikut: 1) mencapai kekerapan pembentangan mesej pengiklanan yang diberikan...
    (Psikologi komunikasi massa)
  • Analisis korelasi dan regresi
    Korelasi dan regresi adalah kaedah untuk mengenal pasti pergantungan statistik antara pembolehubah yang dikaji. “Berdasarkan analisis data empirikal yang dikumpul semasa kajian, bukan sahaja fakta tentang kewujudan pergantungan statistik diterangkan, tetapi juga formula matematik bagi fungsi itu...
    (Penyelidikan Pemasaran)
  • KAEDAH KORELASI-REGRESI PENYELIDIKAN
    Salah satu kaedah pemodelan proses ekonomi ialah kaedah penyelidikan korelasi-regresi. Pemodelan ialah proses menyatakan saling berkaitan yang kompleks fenomena ekonomi bermakna formula matematik dan simbol. Gabungan analisis kualitatif menggunakan matematik...
    (Statistik am dan gunaan)
  • ANALISIS KORELASI DAN REGRESI
    Kajian statistik ekonomi dan proses teknologi kini adalah salah satu daripada alat penting apabila membangunkan sistem kawalan proses. Pengetahuan tentang hubungan antara parameter membolehkan kita mengenal pasti faktor utama yang mempengaruhi kualiti produk siap atau yang dikaji...
    (Matematik dan model ekonomi-matematik)

  • Kesilapan besar (kesilapan) merujuk kepada bilangan ralat yang berubah secara rawak dengan pemerhatian berulang. Mereka jelas melebihi ralat yang dibenarkan oleh keadaan eksperimen. Kesalahan difahami sebagai nilai ralat yang sisihan daripada pusat taburan dengan ketara melebihi nilai yang dibenarkan oleh keadaan pengukuran objektif. Oleh itu, dari sudut teori kebarangkalian, berlakunya miss adalah tidak mungkin.

    Punca ralat kasar boleh menjadi perubahan tidak terkawal dalam keadaan pengukuran, pincang tugas, ralat operator, dsb.

    Untuk menghapuskan ralat kasar, alat ujian hipotesis statistik digunakan.

    Dalam metrologi, hipotesis statistik digunakan, yang difahami sebagai hipotesis tentang bentuk taburan yang tidak diketahui, atau tentang parameter taburan yang diketahui.

    Contoh hipotesis statistik:

    · sampel yang sedang dipertimbangkan (atau keputusan individunya) adalah milik populasi umum;

    · populasi diagihkan merentasi undang-undang biasa;

    · varians dua populasi biasa adalah sama antara satu sama lain.

    Dua hipotesis pertama membuat andaian tentang jenis pengedaran yang tidak diketahui dan identiti keputusan individu (mencurigakan) spesies ini pengedaran, dan dalam yang ketiga - mengenai parameter dua pengedaran yang diketahui. Seiring dengan hipotesis yang dikemukakan, hipotesis yang bercanggah dengannya juga dipertimbangkan. Hipotesis nol (utama) dipanggil hipotesis yang dikemukakan. Dan yang bersaing (alternatif) adalah yang bercanggah dengan yang sifar.

    Apabila mengemukakan dan menerima hipotesis, empat kes berikut boleh berlaku:

    · hipotesis diterima, dan pada hakikatnya ia adalah betul;

    · hipotesis adalah betul, tetapi tersilap ditolak. Ralat yang timbul dalam kes ini dipanggil ralat jenis pertama, dan kebarangkalian kejadiannya dipanggil tahap keertian dan dilambangkan q(α );

    · hipotesis ditolak, dan sebenarnya ia tidak betul;

    · hipotesis tidak betul, tetapi tersilap diterima. Ralat yang timbul dalam kes ini dipanggil ralat jenis kedua, dan kebarangkalian kejadiannya dilambangkan dengan β .

    Magnitud 1 - β, iaitu, kebarangkalian bahawa hipotesis akan ditolak apabila ia palsu dipanggil kuasa kriteria.

    Perlu diingat bahawa dalam dokumentasi kawal selia tentang kawalan kualiti produk statistik dan buku teks pengurusan kualiti, kebarangkalian untuk mengiktiraf kumpulan produk yang baik sebagai tidak sesuai (iaitu, membuat ralat jenis I) dipanggil "risiko pengilang," dan kebarangkalian untuk menerima kumpulan yang tidak sesuai adalah "risiko pengguna."

    Semua kriteria statistik adalah pembolehubah rawak mengambil nilai-nilai tertentu(jadual nilai kritikal). Kawasan penerimaan hipotesis (kawasan nilai yang boleh diterima) memanggil set nilai kriteria di mana hipotesis diterima. Kritikal ialah set nilai kriteria di mana hipotesis nol ditolak. Kawasan penerimaan hipotesis dan kawasan kritikal dipisahkan oleh titik kritikal, yang merupakan nilai jadual kriteria.

    Kawasan penolakan hipotesis, seperti yang ditunjukkan dalam Rajah 1, boleh menjadi satu sisi (sebelah kanan atau sebelah kiri) atau dua sisi.

    tangan kanan

    K diperhatikan > k cr, Di mana k cr - nombor positif (Rajah 1, a).

    kidal dipanggil kawasan kritikal yang ditakrifkan oleh ketaksamaan

    K obs.< k кр, di mana k cr - nombor negatif (Rajah 1, b).

    Bermuka dua dipanggil kawasan kritikal yang ditakrifkan oleh ketaksamaan

    K obs > k 1 ; K obs. 2 di mana k 2 >k 1 .

    Jika titik kritikal simetri kira-kira sifar, kawasan kritikal dua belah ditentukan oleh ketaksamaan: K obs.<-k кр, K набл >k cr, atau ketaksamaan setara \K obs \>k cr(Rajah 1, c).

    Rajah 1 - Tafsiran grafik taburan kawasan penerimaan hipotesis

    Prinsip asas menguji hipotesis statistik dirumuskan seperti berikut: jika nilai cerapan (eksperimen) kriteria tergolong dalam kawasan kritikal, hipotesis ditolak, jika nilai cerapan kriteria tergolong dalam kawasan penerimaan hipotesis, hipotesis diterima.

    Hipotesis statistik diuji untuk tahap keertian yang diterima q(diambil bersamaan dengan 0.1; 0.05; 0.01, dsb.). Jadi tahap kepentingan yang diterima q = 0.05 bermakna lanjutan adalah sifar hipotesis statistik boleh diterima dengan kebarangkalian yakin P= 0.95. Atau terdapat kebarangkalian untuk menolak hipotesis ini (melakukan ralat jenis I) sama dengan P= 0,95.

    Hipotesis statistik nol mengesahkan bahawa hasil pengukuran "mencurigakan" yang diuji (pemerhatian) tergolong dalam kumpulan ukuran tertentu.

    Kriteria formal untuk anomali hasil pemerhatian (dan, akibatnya, asas untuk menerima hipotesis bersaing: keputusan "mencurigakan" tidak tergolong dalam kumpulan ukuran tertentu) ialah sempadan yang dipisahkan dari pusat taburan oleh jumlah tS, iaitu:

    (1)

    di mana x bawah– hasil pemerhatian, diperiksa untuk ralat kasar; t– pekali bergantung pada jenis dan hukum taburan, saiz sampel, tahap keertian; S - sisihan piawai.

    Oleh itu, margin ralat bergantung pada jenis pengedaran, saiz sampel dan tahap keyakinan yang dipilih.

    Apabila memproses hasil pemerhatian sedia ada, buang sewenang-wenangnya keputusan individu tidak boleh dilakukan, kerana ini boleh membawa kepada peningkatan rekaan dalam ketepatan hasil pengukuran. Sekumpulan ukuran (sampel) mungkin mengandungi beberapa ralat kasar dan penghapusan mereka dilakukan secara berurutan, satu demi satu.

    Semua kaedah untuk menghapuskan ralat kasar (miss) boleh dibahagikan kepada dua jenis utama:

    · kaedah pengecualian untuk MSE am yang diketahui;

    · kaedah pengecualian untuk sisihan piawai am yang tidak diketahui.

    Dalam kes pertama X c . r. dan sisihan piawai dikira berdasarkan keputusan keseluruhan sampel dalam kes kedua, keputusan yang mencurigakan dikeluarkan daripada sampel sebelum pengiraan.

    Dalam kes bilangan pemerhatian yang terhad dan (atau) kerumitan menganggar parameter undang-undang pengedaran, adalah disyorkan untuk mengecualikan ralat kasar menggunakan pekali anggaran jenis pengedaran. Ini tidak termasuk nilai x i< x r- Dan x i> x r+ , di mana x r - , x r+ – had kesilapan, ditentukan oleh ungkapan:

    (2),(3)

    di mana A– pekali, nilai yang dipilih bergantung pada kebarangkalian keyakinan yang ditentukan dalam julat dari 0.85 hingga 1.30 (adalah disyorkan untuk memilih nilai maksimum A sama dengan 1.3); γ – lebihan balas, nilainya bergantung pada bentuk hukum pengagihan kuantiti (VLD).

    Selepas menghapuskan ralat, operasi untuk menentukan anggaran pusat pengedaran dan sisihan piawai hasil pemerhatian dan pengukuran mesti diulang.

    Oleh kerana dalam amalan pengukuran dengan sisihan piawai yang tidak diketahui (bilangan pemerhatian terhad) adalah lebih biasa, manual mempertimbangkan kriteria berikut untuk menyemak hasil pemerhatian yang mencurigakan (dari sudut pandangan ralat): Irwin, Romanovsky, skop variasi, Dixon, Smirnov, Chauvin.

    Oleh kerana keperluan kriteria (pekali) yang menentukan sempadan yang melampauinya terdapat "kasar" (dalam erti kata ralat) hasil pemerhatian pengarang yang berbeza adalah berbeza, maka semakan hendaklah dilakukan menggunakan beberapa kriteria sekaligus (disyorkan untuk menggunakan sekurang-kurangnya tiga daripada yang dibincangkan di bawah). Kesimpulan akhir tentang kepunyaan keputusan "mencurigakan" kepada set pemerhatian yang dipertimbangkan hendaklah dibuat mengikut kebanyakan kriteria. Selain itu, pemilihan kriteria untuk menentukan ralat kasar perlu dibuat selepas membina histogram hasil pemerhatian. Berdasarkan jenis histogram, pengenalan awal jenis hukum taburan dilakukan (normal, hampir dengan normal, atau berbeza daripadanya).

    Kriteria Irwin. Untuk data eksperimen yang diperoleh, pekali ditentukan oleh formula:

    (4)

    di mana x n + 1, x nnilai tertinggi pembolehubah rawak; S– sisihan piawai dikira daripada semua nilai sampel.

    Pekali ini kemudiannya dibandingkan dengan nilai jadual λq, nilai yang mungkin diberikan dalam Jadual 1.

    Jadual 1 - Kriteria Irvine λq.

    Jika λ >λ q , maka hipotesis nol tidak disahkan, iaitu keputusannya adalah salah, dan ia harus dikecualikan semasa pemprosesan selanjutnya hasil pemerhatian.

    Kriteria Romanovsky. Hipotesis yang bersaing tentang kehadiran ralat besar dalam keputusan yang mencurigakan disahkan jika ketidaksamaan berlaku:

    (5)

    di mana tp- kuantiti taburan Pelajar pada tahap keyakinan tertentu dengan bilangan darjah kebebasan k = n -k n (k n - bilangan pemerhatian yang mencurigakan). Serpihan kuantil bagi taburan Pelajar dibentangkan dalam Jadual 2.

    Anggaran mata pengedaran dan RMS S keputusan

    pemerhatian dikira tanpa mengambil kira k n hasil pemerhatian yang mencurigakan.

    Jadual 2 - Ujian-t pelajar tp(Kuantil t pelajar)

    Kriteria julat variasi. Adalah salah satu daripada kaedah mudah menghapuskan ralat ukuran kasar (miss). Untuk menggunakannya, tentukan skop siri variasi set pemerhatian yang diperintahkan (x 1 ≤x 2 ≤...≤x k ≤...≤x n):

    Jika mana-mana ahli siri variasi, contohnya xk, berbeza dengan ketara daripada semua yang lain, kemudian semak menggunakan ketaksamaan berikut:

    (7)

    di mana X- purata sampel nilai aritmetik, dikira selepas tidak termasuk anggaran kehilangan; z- nilai kriteria.

    Hipotesis nol (tiada ralat kasar) diterima jika berkata ketidaksamaan sedang berjalan. Jika x k tidak memenuhi syarat (7), maka keputusan ini dikecualikan daripada siri variasi.

    Pekali z bergantung pada bilangan ahli siri variasi n, yang dibentangkan dalam jadual 3.

    Jadual 3 - Kriteria julat variasi

    Kriteria Dixon. Kriteria adalah berdasarkan andaian bahawa ralat pengukuran mematuhi undang-undang biasa (perlu membina histogram hasil pemerhatian) dan menguji hipotesis bahawa taburan itu tergolong dalam undang-undang biasa. Apabila menggunakan ujian, pekali Dixon (nilai pemerhatian ujian) dikira untuk menguji nilai ekstrem terbesar atau terkecil bergantung pada bilangan ukuran. Jadual 4 menunjukkan formula untuk mengira pekali. Kemungkinan r 10 , r 11 digunakan apabila terdapat satu outlier, dan r 21 dan r 22 - apabila terdapat dua pelepasan. Susunan awal hasil pengukuran (saiz sampel) diperlukan. Kriteria digunakan apabila sampel mungkin mengandungi lebih daripada satu ralat kasar.

    Jadual 4 – Formula pekali Dixon

    Nilai pekali Dixon dikira untuk sampel menggunakan formula r berbanding dengan nilai (jadual) yang diterima bagi kriteria Dixon r q(Jadual 5).

    Hipotesis nol tentang ketiadaan ralat kasar berpuas hati jika ketaksamaan itu berpuas hati r< r q.

    Jika r> r q, maka hasilnya dianggap sebagai ralat kasar dan

    dikecualikan daripada pemprosesan selanjutnya.

    Jadual 5 – Nilai kriteria pekali Dixon (pada tahap yang diterima

    kepentingan q)

    Kriteria Wright. Kriteria "peraturan tiga sigma" adalah salah satu yang paling mudah untuk menyemak keputusan yang mematuhi undang-undang taburan normal. Intipati peraturan tiga sigma: jika pembolehubah rawak diedarkan secara normal, maka nilai mutlak sisihan daripada jangkaan matematik tidak melebihi tiga kali sisihan piawai.

    Dalam amalan, peraturan tiga-sigma digunakan seperti berikut: jika taburan pembolehubah rawak yang dikaji tidak diketahui, tetapi syarat yang dinyatakan dalam peraturan di atas dipenuhi, maka ada sebab untuk menganggap bahawa pembolehubah yang dikaji adalah taburan normal. ; jika tidak ia tidak diedarkan secara normal. Untuk tujuan ini, pusat taburan dan anggaran sisihan piawai hasil cerapan dikira untuk sampel (termasuk keputusan yang mencurigakan). Keputusan yang memenuhi syarat

    ,

    dianggap mempunyai ralat kasar dan dialih keluar, dan ciri pengedaran yang dikira sebelum ini diperhalusi.

    Kriteria ini adalah serupa Kriteria Wright, berdasarkan fakta bahawa jika ralat baki lebih daripada empat sigma, maka hasil pengukuran ini adalah ralat kasar dan mesti dikecualikan semasa pemprosesan selanjutnya. Kedua-dua kriteria boleh dipercayai apabila bilangan ukuran lebih daripada 20...50. Ia boleh digunakan apabila nilai sisihan piawai am diketahui ( S).

    Ia mungkin ternyata dengan nilai baru dan S keputusan lain akan termasuk dalam kategori anomali.

    Kriteria Smirnov. Kriteria Smirnov digunakan untuk saiz sampel n≥ 25 atau bila nilai yang diketahui purata am dan RMS. Ia menetapkan had yang kurang ketat untuk ralat kasar. Untuk melaksanakan kriteria ini, nilai sebenar kuantiti taburan (nilai diperhatikan bagi kriteria) dikira menggunakan formula:

    (8)

    Nilai yang ditemui dibandingkan dengan nilai kriteria β k diberikan dalam jadual6

    Jadual 6 – Kuantil taburan β k

    Kriteria Chauvet. Kriteria Chauvet digunakan untuk undang-undang yang tidak bercanggah dengan undang-undang biasa, dan berdasarkan penentuan bilangan hasil pemerhatian yang dijangkakan n sejuk, yang mempunyai ralat sebesar ralat yang mencurigakan. Hipotesis tentang kehadiran ralat kasar diterima jika syarat berikut dipenuhi:

    Prosedur untuk menguji hipotesis adalah seperti berikut:

    1) min aritmetik dan sisihan piawai dikira S hasil pemerhatian untuk keseluruhan sampel;

    2) daripada jadual taburan normal ternormal (Lampiran 1 - fungsi kamiran taburan normal ternormal) mengikut nilai

    kebarangkalian keputusan yang mencurigakan muncul dalam populasi umum nombor ditentukan n:

    (9)

    3) bilangan hasil yang dijangkakan tolonglah ditentukan oleh formula:

    Kriteria di atas dalam banyak kes ternyata "ketat". Kemudian disyorkan untuk menggunakan kriteria ralat kasar " k", bergantung kepada saiz sampel n dan kebarangkalian keyakinan yang diterima R.

    Jadual 7 - Kebergantungan kepada kriteria ralat kasar k daripada saiz sampel n

    dan kebarangkalian keyakinan R

    Untuk taburan selain daripada biasa, kelas seperti dua komposisi bulat atas modal normal dan pengedaran diskret dengan kurtosis ε = 1.5 - 3.0; bimodal runcing; komposisi taburan dua nilai diskret dan taburan Laplace dengan kurtosis ε = 1.5 - 6.0; komposisi taburan seragam dengan taburan kurtosis eksponen ε = 1.8-6.0 dan kelas taburan eksponen dalam had perubahan dalam kurtosis ε = 1.8-6.0 had ralat kasar ditentukan oleh nilai ± (t gr . σ ) atau ±( t gr . S), Di mana:

    (11)

    di mana γ - lebihan balas;

    (12)

    Kesilapan dalam menentukan anggaran S SKO dan t sp berkorelasi negatif, iaitu meningkatkan sisihan piawai S disertai dengan penurunan t zp. Oleh itu, menentukan sempadan ralat kasar untuk undang-undang selain daripada biasa, dengan kurtosis ε < 6 menggunakan kriteria t zp adalah agak tepat dan boleh digunakan secara meluas dalam amalan.

    Penilaian, S Dan ε hendaklah dikira selepas mengecualikan keputusan yang mencurigakan daripada sampel. Selepas mengira sempadan ralat kasar, hasil pemerhatian yang termasuk dalam sempadan dikembalikan, dan ciri taburan yang ditemui sebelum ini diperhalusi.

    Untuk pengedaran seragam, sempadan ralat kasar boleh diambil sebagai ±1.8. S.

    Mari kita lihat satu contoh menggunakan kriteria untuk menghapuskan ralat kasar semasa mengukur kelajuan gelombang kejutan. Keputusan yang dibentangkan dalam Jadual 8 diperolehi.

    Jadual 8 - Keputusan pemerhatian

    Ia diperlukan untuk menentukan sama ada hasil pemerhatian mengandungi V=3.50 km/s ralat kasar.

    Untuk definisi grafik jenis hukum taburan, kami akan membina histogram. Apabila membina, kami membahagikan kepada selang sedemikian rupa sehingga nilai yang diukur menjadi pertengahan selang, seperti yang ditunjukkan dalam Rajah 2.

    Digunakan untuk menilai nilai sampel yang boleh dipersoalkan untuk ralat kasar. Urutan pemakaiannya adalah seperti berikut.

    Cari nilai pengiraan bagi kriteria tersebut λ calc = (|x k - x k sebelum |)/σ,

    di mana x k- makna yang meragukan, x kepada pra– nilai sebelumnya dalam siri variasi, jika x k dianggarkan daripada nilai maksimum siri variasi, atau yang berikutnya, jika x k dianggarkan daripada nilai minimum siri variasi (Irwin digunakan dalam kes am istilah "makna pertama"); σ – sisihan piawai am (RMSD) bagi pembolehubah rawak taburan normal berterusan.

    Jika λ calc > tab λ, x kkesilapan. Di sini λ jadual– nilai jadual (mata peratusan) bagi kriteria Irwin.

    Soalan-soalan yang timbul diterangkan pada halaman. Khususnya, dalam artikel asal, nilai jadual bagi kriteria dikira untuk pembolehubah rawak taburan normal dengan sisihan piawai umum (RMSD) yang diketahui. σ . Kerana σ selalunya tidak diketahui, Irvine mencadangkan penggunaan dalam pengiraan sebaliknya σ sisihan piawai sampel s, ditentukan oleh formula

    di mana n- saiz sampel, x i– elemen sampel, x Rabu– nilai min sampel.

    Pendekatan ini biasanya digunakan dalam amalan. Walau bagaimanapun, kebolehterimaan menggunakan sampel MSE, dan pada masa yang sama mata peratusan untuk MSE am, belum disahkan.

    Artikel ini membentangkan nilai jadual (mata peratusan) bagi kriteria Irwin, dikira dengan pemodelan komputer statistik menggunakan sisihan piawai sampel untuk nilai maksimum siri variasi dengan taburan normal piawai bagi pembolehubah rawak (dengan parameter lain taburan normal , dan juga untuk nilai minimum siri variasi, keputusan yang sama diperolehi). Bagi setiap saiz sampel n 10 6 sampel telah disimulasikan. Seperti yang ditunjukkan oleh pengiraan awal, dengan takrifan selari perbezaan dalam nilai mata peratusan boleh sebesar 0.003. Oleh kerana nilai telah dibundarkan kepada 0.01 yang terdekat, dalam kes yang meragukan 2 hingga 4 penentuan selari telah dilakukan.

    Di samping itu, berdasarkan data, kami mengira nilai jadual bagi kriteria Irvine untuk sisihan piawai umum yang diketahui dan membandingkannya dengan yang diberikan.

    Sejak bila aplikasi praktikal Kriteria Irwin sering menyebabkan kesukaran tertentu kerana kekurangan sumber sastera Nilai jadual bagi kriteria untuk saiz sampel tertentu dikira menggunakan kaedah pemodelan komputer statistik yang sama, beberapa nilai hilang daripada jadual.

    Adalah jelas bahawa dengan saiz sampel 2, menggunakan kriteria menggunakan sisihan piawai sampel tidak masuk akal. Ini disahkan oleh fakta bahawa penyederhanaan ungkapan untuk nilai pengiraan kriteria dengan sisihan piawai sampel memberikan punca kuasa dua daripada dua, yang jelas menunjukkan sia-sia menggunakan kriteria dengan saiz sampel 2 dan sisihan piawai sampel.

    Keputusan yang diperolehi ditunjukkan dalam jadual. 1.

    Jadual 1 - Nilai jadual kriteria Irwin untuk unsur melampau siri variasi.

    Saiz sampelMengikut sisihan piawai amMengikut sisihan piawai sampel
    Tahap keertian
    0,1 0,05 0,01 0,1 0,05 0,01
    2 2,33* 2,77* 3,64* - - -
    3 1,79* 2,17* 2,90* 1,62 1,68 1,72
    4 1,58 1,92 2,60 1,55 1,70 1,88
    5 1,45 1,77 2,43 1,45 1,64 1,93/
    6 1,37 1,67 2,30 1,38 1,60 1,94
    7 1,31 1,60 2,22 1,32 1,55 1,93
    8 1,26 1,55 2,14 1,27 1,51 1,92
    9 1,22 1,50 2,09 1,23 1,47 1,90
    10 1,18* 1,46* 2,04* 1,20 1,44 1,88
    11 1,15 1,43 2,00 1,17 1,42 1,87
    12 1,13 1,40 1,97 1,15 1,39 1,85
    13 1,11 1,38 1,94 1,13 1,37 1,83
    14 1,09 1,36 1,91 1,11 1,35 1,82
    15 1,08 1,34 1,89 1,09 1,33 1,80
    20 1,03* 1,27* 1,80* 1,03 1,27 1,75
    25 0,99 1,23 1,74 0,99 1,22 1,70
    30 0,96* 1,20* 1,70* 0,96 1,19 1,66
    35 0,93 1,17 1,66 0,94 1,16 1,63
    40 0,91* 1,15* 1,63* 0,92 1,14 1,61
    45 0,89 1,13 1,61 0,90 1,12 1,59
    50 0,88* 1,11* 1,59* 0,89 1,10 1,57
    60 0,86* 1,08* 1,56* 0,87 1,08 1,54
    70 0,84* 1,06* 1,53* 0,85 1,06 1,52
    80 0,83* 1,04* 1,51* 0,83 1,04 1,50
    90 0,82* 1,03* 1,49* 0,82 1,03 1,48
    100 0,81* 1,02* 1,47* 0,81 1,02 1,46
    200 0,75* 0,95* 1,38* 0,75 0,95 1,38
    300 0,72* 0,91* 1,33* 0,72 0,91 1,33
    500 0,69* 0,88* 1,28* 0,69 0,88 1,28
    1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
    Nota: nilai yang ditanda dengan asterisk dikira daripada data dan, jika perlu, diselaraskan secara statistik pemodelan komputer. Nilai selebihnya dikira menggunakan pemodelan komputer statistik.

    Jika kita membandingkan mata peratusan bagi sisihan piawai am yang terkenal yang diberikan dalam Jadual. 1, dengan mata peratusan yang sepadan diberikan dalam , maka mereka berbeza dalam beberapa kes sebanyak 0.01, dan dalam satu kes sebanyak 0.02. Nampaknya, mata peratusan yang diberikan dalam artikel ini adalah lebih tepat, kerana dalam kes yang meragukan ia telah disahkan oleh pemodelan komputer statistik.

    Daripada Jadual 1 dapat dilihat bahawa mata peratusan bagi kriteria Irvine apabila menggunakan sisihan piawai sampel dengan saiz sampel yang agak kecil berbeza dengan ketara daripada mata peratusan apabila menggunakan sisihan piawai am. Hanya dengan saiz sampel yang ketara, kira-kira 40, mata peratusan menjadi hampir. Oleh itu, apabila menggunakan kriteria Irvine, anda harus menggunakan mata peratusan yang diberikan dalam jadual. 1, dengan mengambil kira sama ada nilai yang dikira bagi kriteria itu diperolehi oleh sisihan piawai am atau sampel.

    KESUSASTERAAN

    1. Irvin J.O. Mengenai kriteria untuk penolakan pemerhatian terpencil //Biometrika.1925. V. 17. H. 238 – 250.

    2. Kobzar A.I. Digunakan statistik matematik. – M.: FIZMATLIT, 2006. – 816 p. © V.V. Zalyazhnykh
    Apabila menggunakan bahan, sila berikan pautan.