Βιογραφίες Χαρακτηριστικά Ανάλυση

Μέθοδοι επεξεργασίας και πρόβλεψης πληροφοριών για φοιτητές της ειδικότητας: «Διοίκηση Οργανισμού». Τιμές πίνακα του κριτηρίου Irwin για τα ακραία στοιχεία της σειράς παραλλαγής V.V.

Έστω το παρατηρούμενο δείγμα και έστω η σειρά παραλλαγής που κατασκευάστηκε από αυτό. Η υπόθεση που ελέγχεται είναι ότι όλοι ανήκουν στο ίδιο πληθυσμός(χωρίς εκπομπές). Μια εναλλακτική υπόθεση είναι ότι υπάρχουν ακραίες τιμές στο παρατηρούμενο δείγμα.

Σύμφωνα με το κριτήριο Chauvet, ένα στοιχείο ενός δείγματος όγκου είναι ακραίο εάν η πιθανότητα απόκλισής του από τη μέση τιμή δεν είναι μεγαλύτερη από .

Συγκεντρώνονται τα ακόλουθα στατιστικά στοιχεία Chauvin:

πού είναι η μέση τιμή,

Διακύμανση δείγματος

Ας προσδιορίσουμε ποια κατανομή έχουν τα στατιστικά στοιχεία όταν εκπληρώνεται η υπόθεση. Για να γίνει αυτό, κάνουμε την υπόθεση ότι ακόμη και σε μικρές τυχαίες μεταβλητές και είναι ανεξάρτητες, τότε η πυκνότητα κατανομής τυχαία μεταβλητήέχει τη μορφή:


Οι τιμές αυτής της συνάρτησης κατανομής μπορούν να υπολογιστούν χρησιμοποιώντας το μαθηματικό πακέτο Maple 14, αντικαθιστώντας τις λαμβανόμενες τιμές αντί για τις άγνωστες παραμέτρους.

Εάν τα στατιστικά στοιχεία, τότε η τιμή () θα πρέπει να θεωρείται ως ακραία τιμή. Οι κρίσιμες τιμές δίνονται στον πίνακα (βλ. Παράρτημα Α). Αντίθετα, αντικαθιστούμε τις ακραίες τιμές με τον τύπο (1.1) για να ελέγξουμε την παρουσία ακραίων τιμών.

Κριτήριο Irvine

Αυτό το κριτήριο χρησιμοποιείται όταν η διακύμανση της κατανομής είναι γνωστή εκ των προτέρων.

Ένα μέγεθος δείγματος εξάγεται από έναν κανονικό πληθυσμό και συντάσσεται μια σειρά παραλλαγών (ταξινομημένα σε αύξουσα σειρά). Εξετάζονται οι ίδιες υποθέσεις και όπως στο προηγούμενο κριτήριο.

Όταν η μεγαλύτερη (μικρότερη) τιμή αναγνωρίζεται ως ακραία τιμή με πιθανότητα. Οι κρίσιμες τιμές παρατίθενται στον πίνακα.

Κριτήριο Γκραμπς

Αφήστε ένα δείγμα να εξαχθεί και να κατασκευαστεί μια σειρά παραλλαγών από αυτό. Η υπόθεση που ελέγχεται είναι ότι όλα τα () ανήκουν στον ίδιο πληθυσμό. Κατά τον έλεγχο για ακραίες τιμές της μεγαλύτερης τιμής δείγματος, η εναλλακτική υπόθεση είναι ότι ανήκουν σε έναν νόμο και σε κάποιον άλλο νόμο, σημαντικά μετατοπισμένο προς τα δεξιά. Κατά τον έλεγχο για ακραίες τιμές της μεγαλύτερης τιμής δείγματος, τα στατιστικά στοιχεία της δοκιμής Grubbs έχουν τη μορφή

όπου υπολογίζεται σύμφωνα με τον τύπο (1.2) και - σύμφωνα με το (1.3)

Κατά τον έλεγχο για ακραίες τιμές της μικρότερης τιμής δείγματος, η εναλλακτική υπόθεση υποθέτει ότι ανήκει σε κάποιον άλλο νόμο, σημαντικά μετατοπισμένο προς τα αριστερά. ΣΕ σε αυτήν την περίπτωσητα υπολογισμένα στατιστικά στοιχεία λαμβάνουν τη μορφή

όπου υπολογίζεται σύμφωνα με τον τύπο (1.2) και - σύμφωνα με το (1.3).

Στατιστικά στοιχεία ή χρησιμοποιούνται όταν η απόκλιση είναι γνωστή εκ των προτέρων. στατιστικά και - όταν η διασπορά εκτιμάται από το δείγμα χρησιμοποιώντας τη σχέση (1.3).

Μέγιστο ή ελάχιστο στοιχείοένα δείγμα θεωρείται ακραίο εάν η τιμή των αντίστοιχων στατιστικών υπερβαίνει την κρίσιμη τιμή: ή, όπου είναι το καθορισμένο επίπεδο σημαντικότητας. Οι κρίσιμες τιμές δίνονται σε συνοπτικούς πίνακες (βλ. Παράρτημα Α). Τα στατιστικά στοιχεία που λαμβάνονται σε αυτό το κριτήριο όταν εκπληρώνεται η μηδενική υπόθεση έχουν την ίδια κατανομή με τα στατιστικά στοιχεία στο κριτήριο Chauvin.

Για > 25, μπορούν να χρησιμοποιηθούν προσεγγίσεις για κρίσιμες τιμές

όπου - είναι η ποσότητα του προτύπου κανονική κατανομή.

Και προσεγγίζεται ως εξής

Εάν η διακύμανση () και η μαθηματική προσδοκία (μ - η μέση τιμή) είναι γνωστές στο εξαγόμενο δείγμα, τότε χρησιμοποιείται στατιστική

Οι κρίσιμες τιμές αυτών των στατιστικών παρατίθενται επίσης σε πίνακα. Εάν, τότε η ακραία τιμή θεωρείται σημαντική και η εναλλακτική υπόθεση γίνεται αποδεκτή.


Καθήκοντα για αυτοδιδασκαλίαςπειθαρχίες.

Ασκηση 1.Σύμφωνα με την επιλογή, προσομοιώστε ένα σύνολο εμπειρικών δεδομένων που ελήφθησαν ως αποτέλεσμα της μέτρησης ενός μονοδιάστατου χαρακτηριστικού. Για να το κάνετε αυτό, πρέπει να καταθέσετε τη συνάρτηση σε πίνακα:

, ,

και λαμβάνουν 15 – 20 συνεχόμενα δεδομένα. Εδώ, πιθανώς, το χαρακτηριστικό του χαρακτηριστικού (αντανακλά την κύρια τάση του χαρακτηριστικού) και τις παρεμβολές (λάθη) μετρήσεων, που ήταν αποτέλεσμα της εκδήλωσης τυχαίας διαφόρων ειδών.

Επιλογές δεδομένων πηγής:

Προσδιορίστε τα ανώμαλα επίπεδα των σειρών δεδομένων που λαμβάνονται κατά τον πίνακα μιας συνάρτησης και εκτελέστε την εξομάλυνσή τους:

ΕΝΑ). Η μέθοδος του Irwin, σύμφωνα με τον τύπο

,

.

Οι υπολογισμένες τιμές συγκρίνονται με τις τιμές του πίνακα του κριτηρίου Irvine:

Πίνακας κριτηρίων Irvine

Ο πίνακας δείχνει τις τιμές του τεστ Irwin για το επίπεδο σημαντικότητας (με σφάλμα 5%).

σι). η μέθοδος ελέγχου διαφορών στα μέσα επίπεδα, διαίρεσης των χρονοσειρών δεδομένων σε περίπου δύο ίσα μέρη και υπολογισμού της μέσης τιμής και της διακύμανσης για κάθε μέρος. Στη συνέχεια, ελέγξτε την ισότητα των διακυμάνσεων και των δύο μερών χρησιμοποιώντας τη δοκιμή Fisher. Εάν η υπόθεση της ισότητας των διακυμάνσεων γίνει αποδεκτή, προχωρήστε στον έλεγχο της υπόθεσης της απουσίας τάσης χρησιμοποιώντας το τεστ Student's t. Να υπολογίσω εμπειρική σημασίαστατιστικά, χρησιμοποιήστε τύπους:

,

που είναι ο μέσος όρος τυπική απόκλισημέσες διαφορές:

.

Συγκρίνετε την υπολογιζόμενη τιμή των στατιστικών με την τιμή του πίνακα.

V). Μέθοδος Foster-Stewart.

2. Εκτελέστε μηχανική εξομάλυνση των επιπέδων σειρών:

ΕΝΑ). απλή μέθοδος κινούμενου μέσου όρου.

σι). Μέθοδος σταθμισμένου κινητού μέσου όρου.

V). Μέθοδος εκθετικής εξομάλυνσης.

Εργασία 2.Στον πίνακα δεδομένων οικονομικούς δείκτες, δίνεται μια χρονοσειρά μηνιαίων όγκων μεταφοράς (δεμένων με συγκεκριμένη περιοχή) αγροτικών αγαθών σε συμβατικές μονάδες.

Χρησιμοποιώντας τη μέθοδο του Chetverikov για την απομόνωση των συνιστωσών μιας χρονοσειράς:

ΕΝΑ). ευθυγραμμίστε την εμπειρική σειρά χρησιμοποιώντας έναν κεντραρισμένο κινητό μέσο όρο με μια περίοδο εξομάλυνσης.

σι). αφαιρέστε την προκύπτουσα προκαταρκτική εκτίμηση της τάσης από την αρχική εμπειρική σειρά: .

V). Υπολογίστε για κάθε έτος (ανά σειρά) την τυπική απόκλιση της τιμής χρησιμοποιώντας τον τύπο

ΣΟΛ). βρείτε την προκαταρκτική τιμή του μέσου εποχιακού κύματος: .

ρε). πάρτε μια σειρά χωρίς εποχιακό κύμα: .

μι). εξομαλύνετε τη σειρά που προκύπτει χρησιμοποιώντας έναν απλό κινητό μέσο όρο με διάστημα εξομάλυνσης ίσο με πέντε και αποκτήστε μια νέα εκτίμηση τάσης.

και). υπολογίστε τις αποκλίσεις της σειράς από την αρχική εμπειρική σειρά:

.

η). οι προκύπτουσες αποκλίσεις θα πρέπει να υποβάλλονται σε επεξεργασία σύμφωνα με τις παραγράφους. V). και δ). για τον εντοπισμό νέων τιμών εποχιακών κυμάτων.

Και). Υπολογίστε τον εποχιακό συντελεστή έντασης κύματος χρησιμοποιώντας τους τύπους και περαιτέρω (ο ίδιος ο συντελεστής):

.

Ο συντελεστής τάσης δεν υπολογίζεται για το πρώτο και το τελευταίο έτος.

Προς την). Χρησιμοποιώντας τον συντελεστή τάσης, υπολογίστε τις τελικές τιμές εποχιακό συστατικόχρονική σειρά: .

Εργασία 3.Οι χρονοσειρές δίνονται στον πίνακα:

Επιλέξτε προκαταρκτικά την καλύτερη καμπύλη ανάπτυξης:

ΕΝΑ). μέθοδος πεπερασμένης διαφοράς (Tintner);

σι). μέθοδος χαρακτηριστικών ανάπτυξης.

2. Για την αρχική σειρά, κατασκευή γραμμικό μοντέλο , έχοντας καθορίσει τις παραμέτρους του χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

3. Για την αρχική χρονοσειρά, δημιουργήστε ένα προσαρμοστικό μοντέλο Brown με την παράμετρο εξομάλυνσης και ; επιλέγω ναι καλύτερο μοντέλοκαφέ , πού είναι η περίοδος προόδου (αριθμός βημάτων προς τα εμπρός).

4. Αξιολογήστε την επάρκεια των μοντέλων με βάση την έρευνα:

ΕΝΑ). εγγύτητα μαθηματική προσδοκίαυπολειπόμενο συστατικό μηδέν. αποδεχτείτε την κρίσιμη αξία των στατιστικών του Μαθητή (για πιθανότητα εμπιστοσύνης 0,70);

σι). τυχαίες αποκλίσεις της υπολειπόμενης συνιστώσας σύμφωνα με το κριτήριο των κορυφών (σημεία καμπής). εκτελέστε υπολογισμούς με βάση την αναλογία ;

V). ανεξαρτησία (απουσία αυτοσυσχέτισης) των επιπέδων ενός αριθμού υπολειμμάτων είτε σύμφωνα με το κριτήριο Durbin-Watson (χρησιμοποιήστε τα επίπεδα και ως κρίσιμα) είτε σύμφωνα με τον πρώτο συντελεστή αυτοσυσχέτισης (πάρτε το κρίσιμο επίπεδο ίσο με ).

ΣΟΛ). κανονικότητα του νόμου κατανομής της υπολειπόμενης συνιστώσας με βάση το κριτήριο RS (όπως κρίσιμα επίπεδααποδεχτείτε το διάστημα (2,7 – 3,7)).

5. Αξιολογήστε την ακρίβεια των μοντέλων χρησιμοποιώντας την τυπική απόκλιση και τη μέση τιμή σχετικό σφάλμαπροσεγγίσεις.

6. Με βάση συγκριτική ανάλυσηεπάρκεια και ακρίβεια των μοντέλων, επιλέξτε το καλύτερο μοντέλο στο οποίο θα βασιστούν οι προβλέψεις σημείων και διαστημάτων δύο βήματα μπροστά (). Τα αποτελέσματα της πρόβλεψης εμφανίζονται γραφικά.

Εργασία 4.Έγινε αξιολόγηση των επεξεργαστών 10 σταθμών εργασίας τοπικού δικτύου, που κατασκευάστηκαν με βάση μηχανήματα του ίδιου περίπου τύπου, αλλά από διαφορετικούς κατασκευαστές (πράγμα που συνεπάγεται ορισμένες αποκλίσεις στις παραμέτρους λειτουργίας των μηχανών από το βασικό μοντέλο). Για τον έλεγχο της λειτουργίας των επεξεργαστών, χρησιμοποιήθηκε ένα μείγμα τύπου ICOMP 2.0, το οποίο βασίζεται σε δύο κύριες δοκιμές:

1. 125.turb3D – δοκιμή προσομοίωσης στροβιλισμού σε κυβικός όγκος(λογισμικό εφαρμογής);

2. NortonSI32 – πρόγραμμα μηχανικήςπληκτρολογήστε AutoCaD

και μια βοηθητική δοκιμή για την κανονικοποίηση του χρόνου επεξεργασίας των δεδομένων SPECint_base95. Οι επεξεργαστές αξιολογήθηκαν χρησιμοποιώντας το σταθμισμένο χρόνο εκτέλεσης του μείγματος, κανονικοποιημένο από την απόδοση του βασικού επεξεργαστή, σύμφωνα με τον τύπο

Πού είναι ο χρόνος εκτέλεσης του τεστ;

βάρος της δοκιμής·

απόδοση του βασικού επεξεργαστή στη δοκιμή m.

Εάν η έκφραση (1) ληφθεί λογαριθμικά, παίρνουμε:

και μετά τη μετονομασία των μεταβλητών:

βασικός χρόνος επεξεργασίας δοκιμής SPECint_base95 ;

λογάριθμος του χρόνου επεξεργασίας της πρώτης δοκιμής,

λογάριθμος του δεύτερου δοκιμαστικού χρόνου επεξεργασίας, συντελεστής παλινδρόμησης που λαμβάνεται στις αξιολογήσεις (βάρος δοκιμής).

Συντελεστής παλινδρόμησης – το βάρος της δοκιμής για την επεξεργασία αριθμητικών πράξεων σε ακέραιους αριθμούς (βασική δοκιμή).

1. Με βάση τα δεδομένα μέτρησης που δίνονται στον πίνακα, κατασκευάστε μια συνάρτηση παλινδρόμησης (εμπειρική), υπολογίστε τους συντελεστές παλινδρόμησης και ελέγξτε το μοντέλο για επάρκεια (υπολογίστε τον πίνακα συνδιακύμανσης, συντελεστές συσχέτισης ζεύγους, συντελεστή προσδιορισμού).

Επιλογές δεδομένων:

Επιλογή 1.

Επιλογή 2.

Επιλογή 3.

Επιλογή 4.

Όταν συμβαίνει σχετική ολίσθηση τμημάτων ζευγών τριβής, προκαλείται ζημιά στις επιφάνειες επαφής. Αυτός ο τύπος βλάβης στους επιφανειακούς όγκους ενός τμήματος ονομάζεται φθοράΗ απώλεια μόλις ενός χιλιοστού του βάρους του μηχανήματος ως αποτέλεσμα φθοράς οδηγεί σε πλήρη απώλεια απόδοσης. Κάθε τρία χρόνια...
(Μηχανική. Βασικές αρχές υπολογισμού και σχεδιασμού εξαρτημάτων μηχανών)
  • ΚΡΙΤΗΡΙΑ ΣΤΑΘΕΡΟΤΗΤΑΣ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΜΕΘΟΔΟΙ ΠΡΟΣΔΙΟΡΙΣΜΟΥ ΚΡΙΣΙΜΩΝ ΦΟΡΤΙΩΝ
    Υπάρχουν τρία βασικά κριτήρια για τη σταθερότητα των κατασκευών: το δυναμικό, το στατικό και το ενεργειακό, τα οποία καθορίζουν και τη μεθοδολογία υπολογισμού της ευστάθειας των κατασκευών. 1. Δυναμικός(σύμφωνα με τον Lyapunov) κριτήριοβασίζεται στη μελέτη λύσεων των εξισώσεων δυναμικής κίνησης που αποκλίνουν από την αρχική...
    (Δομική μηχανικήσυστήματα επίπεδων ράβδων)
  • ΚΡΙΤΗΡΙΑ ΕΠΙΛΟΓΗΣ ΔΙΑΦΗΜΙΣΤΙΚΩΝ ΚΑΝΑΛΙΩΝ ΔΙΑΝΟΜΗΣ
    Ανάμεσα σε όλες τις αποφάσεις που λαμβάνονται κατά τη διαδικασία σχεδιασμού, η πιο σημαντική είναι η επιλογή συγκεκριμένων μέσων μέσα σε κάθε μέσο. Κατά κανόνα, οι σχεδιαστές μέσων προσπαθούν να επιλέξουν εκείνα τα μέσα που τους επιτρέπουν να επιτύχουν τους ακόλουθους στόχους: 1) να επιτύχουν μια δεδομένη συχνότητα παρουσίασης του διαφημιστικού μηνύματος...
    (Ψυχολογία των Μαζικών Επικοινωνιών)
  • Ανάλυση συσχέτισης και παλινδρόμησης
    Η συσχέτιση και η παλινδρόμηση είναι μέθοδοι αναγνώρισης στατιστική εξάρτησημεταξύ των υπό μελέτη μεταβλητών. «Με βάση την ανάλυση των εμπειρικών δεδομένων που συλλέχθηκαν κατά τη διάρκεια της μελέτης, περιγράφεται όχι μόνο το ίδιο το γεγονός της ύπαρξης μιας στατιστικής εξάρτησης, αλλά και ο μαθηματικός τύπος της συνάρτησης...
    (Έρευνα μάρκετινγκ)
  • ΜΕΘΟΔΟΣ ΕΡΕΥΝΑΣ ΣΥΣΧΕΤΙΖΟΜΕΝΗΣ-ΠΑΡΑΔΡΟΜΗΣ
    Μία από τις μεθόδους μοντελοποίησης οικονομικές διαδικασίεςείναι μια ερευνητική μέθοδος συσχέτισης-παλίνδρομης. Η μοντελοποίηση είναι η διαδικασία έκφρασης σύνθετων αλληλένδετων οικονομικά φαινόμεναπου σημαίνει μαθηματικούς τύπουςκαι σύμβολα. Συνδυασμός ποιοτική ανάλυσηχρησιμοποιώντας μαθηματικά...
    (Γενικές και εφαρμοσμένες στατιστικές)
  • ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΖΟΜΕΝΗΣ ΚΑΙ ΠΑΡΙΣΤΡΟΦΗΣ
    Στατιστική μελέτη οικονομικών και τεχνολογικές διαδικασίεςείναι επί του παρόντος ένα από απαραίτητα εργαλείακατά την ανάπτυξη συστημάτων ελέγχου διεργασιών. Η γνώση των σχέσεων μεταξύ των παραμέτρων μας επιτρέπει να εντοπίσουμε βασικούς παράγοντες που επηρεάζουν την ποιότητα του τελικού προϊόντος ή του μελετώμενου...
    (Μαθηματικά και οικονομομαθηματικά μοντέλα)

  • Μεγάλα λάθη (αστοχίες)αναφέρεται στον αριθμό των σφαλμάτων που αλλάζουν τυχαία με επαναλαμβανόμενες παρατηρήσεις. Ξεπερνούν σαφώς τα σφάλματα που δικαιολογούνται από τις πειραματικές συνθήκες. Ως αστοχία νοείται μια τιμή σφάλματος της οποίας η απόκλιση από το κέντρο της κατανομής υπερβαίνει σημαντικά την τιμή που δικαιολογείται από αντικειμενικές συνθήκες μέτρησης. Επομένως, από την άποψη της θεωρίας πιθανοτήτων, η εμφάνιση αστοχίας είναι απίθανη.

    Οι αιτίες των μεγάλων σφαλμάτων μπορεί να είναι ανεξέλεγκτες αλλαγές στις συνθήκες μέτρησης, δυσλειτουργία, σφάλματα χειριστή κ.λπ.

    Για την εξάλειψη των χονδρών σφαλμάτων, χρησιμοποιείται μια συσκευή δοκιμής στατιστικών υποθέσεων.

    Στη μετρολογία χρησιμοποιούνται στατιστικές υποθέσεις, οι οποίες νοούνται ως υποθέσεις για τη μορφή μιας άγνωστης κατανομής ή για τις παραμέτρους γνωστών κατανομών.

    Παραδείγματα στατιστικών υποθέσεων:

    · το υπό εξέταση δείγμα (ή το ατομικό του αποτέλεσμα) ανήκει στον γενικό πληθυσμό.

    · ο πληθυσμός κατανέμεται μεταξύ τους κανονικός νόμος;

    · διακυμάνσεις των δύο κανονικούς πληθυσμούςείναι ίσα μεταξύ τους.

    Οι δύο πρώτες υποθέσεις κάνουν μια υπόθεση σχετικά με τον τύπο της άγνωστης κατανομής και την ταυτότητα των μεμονωμένων (ύποπτων) αποτελεσμάτων αυτό το είδοςκατανομές, και στην τρίτη - σχετικά με τις παραμέτρους δύο γνωστών κατανομών. Μαζί με την υπόθεση που διατυπώθηκε, εξετάζεται και μια υπόθεση που έρχεται σε αντίθεση με αυτήν. Η μηδενική (κύρια) υπόθεση ονομάζεται υπόθεση που υποβάλλεται. Και το ανταγωνιστικό (εναλλακτικό) είναι αυτό που έρχεται σε αντίθεση με το μηδενικό.

    Κατά την υποβολή και την αποδοχή μιας υπόθεσης, μπορούν να προκύψουν οι ακόλουθες τέσσερις περιπτώσεις:

    · η υπόθεση γίνεται αποδεκτή και στην πραγματικότητα είναι σωστή.

    · η υπόθεση είναι σωστή, αλλά κατά λάθος απορρίπτεται. Το σφάλμα που προκύπτει σε αυτή την περίπτωση ονομάζεται σφάλμα πρώτου τύπου και η πιθανότητα εμφάνισής του ονομάζεται επίπεδο σημαντικότητας και συμβολίζεται q(α );

    · η υπόθεση απορρίπτεται και στην πραγματικότητα είναι εσφαλμένη.

    · η υπόθεση είναι λανθασμένη, αλλά εσφαλμένα γίνεται αποδεκτή. Το σφάλμα που προκύπτει σε αυτήν την περίπτωση ονομάζεται σφάλμα δεύτερου τύπου και η πιθανότητα εμφάνισής του συμβολίζεται με β .

    Μέγεθος 1 - β, δηλ. ονομάζεται η πιθανότητα να απορριφθεί μια υπόθεση όταν είναι εσφαλμένη ισχύς κριτηρίου.

    Θα πρέπει να σημειωθεί ότι στην κανονιστική τεκμηρίωση για τον στατιστικό έλεγχο ποιότητας προϊόντων και τα εγχειρίδια διαχείρισης ποιότητας, η πιθανότητα αναγνώρισης μιας παρτίδας καλών προϊόντων ως ακατάλληλων (δηλαδή, η πραγματοποίηση σφάλματος τύπου Ι) ονομάζεται «κίνδυνος κατασκευαστή» και η πιθανότητα Η αποδοχή μιας ακατάλληλης παρτίδας είναι ο «κίνδυνος καταναλωτή».

    Ολα στατιστικά κριτήριαπαίρνουν τυχαίες μεταβλητές ορισμένες αξίες(πίνακες κρίσιμων τιμών). Η περιοχή αποδοχής της υπόθεσης (η περιοχή αποδεκτές τιμές) καλέστε το σύνολο των τιμών κριτηρίου στο οποίο γίνεται αποδεκτή η υπόθεση. Κρίσιμο είναι το σύνολο των τιμών κριτηρίου στο οποίο απορρίπτεται η μηδενική υπόθεση. Η περιοχή αποδοχής της υπόθεσης και η κρίσιμη περιοχή χωρίζονται από κρίσιμα σημεία, τα οποία είναι οι πινακικές τιμές των κριτηρίων.

    Η περιοχή απόρριψης της υπόθεσης, όπως φαίνεται στο Σχήμα 1, μπορεί να είναι μονόπλευρη (δεξιά ή αριστερή) ή διπλής όψης.

    Δεξιόχειρας

    Κ παρατηρήθηκε > k κρ, Οπου k cr -θετικός αριθμός (Εικόνα 1, α).

    Αριστερόχειραςκαλέστε την κρίσιμη περιοχή που ορίζεται από την ανισότητα

    K obs.< k кр, Οπου k cr -αρνητικός αριθμός (Εικόνα 1, β).

    Διπλής όψηςονομάζεται η κρίσιμη περιοχή που ορίζεται από τις ανισότητες

    K obs > k 1 ; K obs. 2 όπου k 2 > k 1 .

    Αν κρίσιμα σημείασυμμετρικά περίπου μηδέν, η αμφίπλευρη κρίσιμη περιοχή καθορίζεται από τις ανισότητες: K obs.<-k кр, K набл >k cr,ή ισοδύναμη ανισότητα \K obs \>k cr(Εικόνα 1, γ).

    Σχήμα 1 - Γραφική ερμηνεία της κατανομής της περιοχής αποδοχής υποθέσεων

    Η βασική αρχή του ελέγχου των στατιστικών υποθέσεων διατυπώνεται ως εξής: εάν η παρατηρούμενη (πειραματική) τιμή του κριτηρίου ανήκει στην κρίσιμη περιοχή, η υπόθεση απορρίπτεται, εάν η παρατηρούμενη τιμή του κριτηρίου ανήκει στην περιοχή αποδοχής της υπόθεσης, η υπόθεση γίνεται αποδεκτή.

    Η στατιστική υπόθεση ελέγχεται για το αποδεκτό επίπεδο σημαντικότητας q(λαμβανόμενο ίσο με 0,1, 0,05, 0,01, κ.λπ.). Άρα αποδεκτό επίπεδο σημασίας q = 0,05 σημαίνει ότι η επέκταση είναι μηδέν στατιστική υπόθεσημπορεί να γίνει δεκτό με πιθανότητα εμπιστοσύνης Π= 0,95. Ή υπάρχει πιθανότητα απόρριψης αυτής της υπόθεσης (διάπραξη σφάλματος τύπου Ι) ίση με Π= 0,95.

    Η μηδενική στατιστική υπόθεση επιβεβαιώνει ότι το δοκιμασμένο «ύποπτο» αποτέλεσμα μέτρησης (παρατήρηση) ανήκει σε μια δεδομένη ομάδα μετρήσεων.

    Το επίσημο κριτήριο για την ανωμαλία ενός αποτελέσματος παρατήρησης (και, κατά συνέπεια, η βάση για την αποδοχή μιας ανταγωνιστικής υπόθεσης: το «ύποπτο» αποτέλεσμα δεν ανήκει σε μια δεδομένη ομάδα μετρήσεων) είναι το όριο που χωρίζεται από το κέντρο της κατανομής από το ποσό tS, δηλαδή:

    (1)

    Οπου x υποχωρεί– αποτέλεσμα παρατήρησης, ελεγμένο για σοβαρό σφάλμα. t– συντελεστής ανάλογα με τον τύπο και τον νόμο κατανομής, το μέγεθος του δείγματος, το επίπεδο σημαντικότητας· S - τυπική απόκλιση.

    Έτσι, τα περιθώρια σφάλματος εξαρτώνται από τον τύπο κατανομής, το μέγεθος του δείγματος και το επιλεγμένο επίπεδο εμπιστοσύνης.

    Κατά την επεξεργασία των υπαρχόντων αποτελεσμάτων παρατήρησης, απορρίψτε αυθαίρετα μεμονωμένα αποτελέσματαδεν πρέπει να γίνει, καθώς αυτό μπορεί να οδηγήσει σε πλασματική αύξηση της ακρίβειας του αποτελέσματος της μέτρησης. Μια ομάδα μετρήσεων (δείγμα) μπορεί να περιέχει πολλά χονδροειδή σφάλματα και η εξάλειψή τους πραγματοποιείται διαδοχικά, μία κάθε φορά.

    Όλες οι μέθοδοι για την εξάλειψη των χονδρών σφαλμάτων (αστοχίες) μπορούν να χωριστούν σε δύο βασικοί τύποι:

    · μέθοδοι αποκλεισμού για ένα γνωστό γενικό MSE.

    · μέθοδοι αποκλεισμού για άγνωστη γενική τυπική απόκλιση.

    Στην πρώτη περίπτωση Χ γ . R. και η τυπική απόκλιση υπολογίζεται με βάση τα αποτελέσματα ολόκληρου του δείγματος· στη δεύτερη περίπτωση, τα ύποπτα αποτελέσματα αφαιρούνται από το δείγμα πριν από τον υπολογισμό.

    Σε περίπτωση περιορισμένου αριθμού παρατηρήσεων και (ή) της πολυπλοκότητας της εκτίμησης των παραμέτρων του νόμου κατανομής, συνιστάται να αποκλειστούν τα χονδροειδή σφάλματα χρησιμοποιώντας κατά προσέγγιση συντελεστές του τύπου διανομής. Αυτό αποκλείει τις τιμές x i< x r- Και x i> x r+ , όπου x r - , x r+ – όρια αστοχιών, που καθορίζονται από τις εκφράσεις:

    (2),(3)

    Οπου ΕΝΑ– συντελεστής, η τιμή του οποίου επιλέγεται ανάλογα με την καθορισμένη πιθανότητα εμπιστοσύνης στην περιοχή από 0,85 έως 1,30 (συνιστάται να επιλέξετε τη μέγιστη τιμή ΕΝΑίσο με 1,3); γ – αντίθετη υπέρβαση, η τιμή της οποίας εξαρτάται από τη μορφή του νόμου κατανομής ποσοτήτων (VLD).

    Μετά την εξάλειψη των σφαλμάτων, πρέπει να επαναληφθούν οι εργασίες για τον προσδιορισμό των εκτιμήσεων του κέντρου διανομής και της τυπικής απόκλισης των αποτελεσμάτων παρατήρησης και μέτρησης.

    Δεδομένου ότι στην πράξη οι μετρήσεις με άγνωστη τυπική απόκλιση (περιορισμένος αριθμός παρατηρήσεων) είναι πιο συνηθισμένες, το εγχειρίδιο λαμβάνει υπόψη τα ακόλουθα κριτήρια για τον έλεγχο των ύποπτων (από την άποψη των σφαλμάτων) αποτελεσμάτων παρατήρησης: Irwin, Romanovsky, μεταβλητό πεδίο εφαρμογής, Dixon, Smirnov, Chauvin.

    Δεδομένου ότι οι απαιτήσεις του κριτηρίου (συντελεστές) που καθορίζουν το όριο πέρα ​​από το οποίο υπάρχουν «ακατέργαστα» (με την έννοια των σφαλμάτων) προκύπτει η παρατήρηση διαφορετικών συγγραφέωνείναι διαφορετικά, τότε ο έλεγχος θα πρέπει να πραγματοποιείται χρησιμοποιώντας πολλά κριτήρια ταυτόχρονα (συνιστάται η χρήση τουλάχιστον τριών από αυτά που συζητούνται παρακάτω). Το τελικό συμπέρασμα σχετικά με την υπαγωγή των «ύποπτων» αποτελεσμάτων στο υπό εξέταση σύνολο παρατηρήσεων θα πρέπει να γίνει σύμφωνα με τα περισσότερα κριτήρια. Επιπλέον, η επιλογή του κριτηρίου για τον προσδιορισμό των χονδρών σφαλμάτων θα πρέπει να γίνεται μετά την κατασκευή ενός ιστογράμματος των αποτελεσμάτων παρατήρησης. Με βάση τον τύπο του ιστογράμματος, πραγματοποιείται μια προκαταρκτική αναγνώριση του τύπου του νόμου κατανομής (κανονικό, κοντά στο φυσιολογικό ή διαφορετικό από αυτό).

    Κριτήριο Irwin.Για τα ληφθέντα πειραματικά δεδομένα, ο συντελεστής προσδιορίζεται από τον τύπο:

    (4)

    Οπου x n + 1, x nυψηλότερες αξίεςτυχαία μεταβλητή; μικρό– τυπική απόκλιση που υπολογίζεται από όλες τις τιμές του δείγματος.

    Αυτός ο συντελεστής συγκρίνεται στη συνέχεια με την τιμή του πίνακα λq, οι πιθανές τιμές των οποίων δίνονται στον Πίνακα 1.

    Πίνακας 1 - Κριτήριο Irvine λq.

    Αν λ >λ q ,τότε η μηδενική υπόθεση δεν επιβεβαιώνεται, δηλαδή το αποτέλεσμα είναι λανθασμένο και θα πρέπει να αποκλειστεί κατά την περαιτέρω επεξεργασία των αποτελεσμάτων της παρατήρησης.

    Κριτήριο Romanovsky.Η ανταγωνιστική υπόθεση για την παρουσία χονδροειδών σφαλμάτων σε ύποπτα αποτελέσματα επιβεβαιώνεται εάν η ανισότητα ισχύει:

    (5)

    Οπου tp- ποσοστό της κατανομής των μαθητών σε ένα δεδομένο επίπεδο εμπιστοσύνης με τον αριθμό των βαθμών ελευθερίας k = n -k n (k n -αριθμός ύποπτων παρατηρήσεων). Στον Πίνακα 2 παρουσιάζεται ένα θραύσμα τεσσάρων για την κατανομή Student.

    Σημαντικές εκτιμήσειςδιανομή και RMS SΑποτελέσματα

    οι παρατηρήσεις υπολογίζονται χωρίς να λαμβάνονται υπόψη k nύποπτα αποτελέσματα παρατήρησης.

    Πίνακας 2 - Student's t-test tp(Τα ποσοστά μαθητή)

    Κριτήριο εύρους διακύμανσης.Είναι ένα από απλές μεθόδουςεξαλείφοντας το μεικτό σφάλμα μέτρησης (αστοχία). Για να το χρησιμοποιήσετε, καθορίστε το εύρος σειρά παραλλαγήςδιατεταγμένο σύνολο παρατηρήσεων (x 1 ≤x 2 ≤...≤x k ≤...≤x n):

    Εάν κάποιο μέλος της σειράς παραλλαγής, για παράδειγμα xk,διαφέρει απότομα από όλα τα άλλα και, στη συνέχεια, ελέγξτε χρησιμοποιώντας την ακόλουθη ανισότητα:

    (7)

    Οπου Χ- δείγμα μέσου όρου αριθμητική τιμή, υπολογίζεται αφού εξαιρεθεί η εκτιμώμενη απώλεια. z-τιμή κριτηρίου.

    Η μηδενική υπόθεση (σχετικά με την απουσία χονδροειδούς σφάλματος) γίνεται αποδεκτή εάν είπε η ανισότηταεκτελούνται. Αν x kδεν ικανοποιεί την προϋπόθεση (7), τότε αυτό το αποτέλεσμα εξαιρείται από τη σειρά παραλλαγής.

    Συντελεστής zεξαρτάται από τον αριθμό των μελών της σειράς παραλλαγής n, που παρουσιάζεται στον πίνακα 3.

    Πίνακας 3 - Κριτήριο εύρους διακύμανσης

    Κριτήριο Dixon.Το κριτήριο βασίζεται στην υπόθεση ότι τα σφάλματα μέτρησης υπακούουν στον κανονικό νόμο (πρώτα είναι απαραίτητο να κατασκευαστεί ένα ιστόγραμμα των αποτελεσμάτων της παρατήρησης) και ελέγχεται η υπόθεση ότι η κατανομή ανήκει στον κανονικό νόμο. Κατά τη χρήση της δοκιμής, ο συντελεστής Dixon (παρατηρούμενη τιμή της δοκιμής) υπολογίζεται για τη δοκιμή της μεγαλύτερης ή της μικρότερης ακραίας τιμής ανάλογα με τον αριθμό των μετρήσεων. Ο Πίνακας 4 δείχνει τους τύπους για τον υπολογισμό των συντελεστών. Πιθανότητα r 10 , r 11 χρησιμοποιείται όταν υπάρχει μία ακραία τιμή και r 21 και r 22 - όταν υπάρχουν δύο εκπομπές. Απαιτείται μια αρχική σειρά των αποτελεσμάτων της μέτρησης (μέγεθος δείγματος). Το κριτήριο εφαρμόζεται όταν το δείγμα μπορεί να περιέχει περισσότερα από ένα μεικτά σφάλματα.

    Πίνακας 4 – Τύποι συντελεστών Dixon

    Οι τιμές των συντελεστών Dixon υπολογίστηκαν για το δείγμα χρησιμοποιώντας τύπους rσε σύγκριση με την αποδεκτή (πίνακα) τιμή του κριτηρίου Dixon r q(Πίνακας 5).

    Μηδενική υπόθεσησχετικά με την απουσία χονδροειδούς σφάλματος ικανοποιείται εάν ικανοποιηθεί η ανισότητα r< r q.

    Αν r> r q, τότε το αποτέλεσμα θεωρείται χονδροειδές σφάλμα και

    εξαιρούνται από περαιτέρω επεξεργασία.

    Πίνακας 5 – Τιμές κριτηρίου των συντελεστών Dixon (στο αποδεκτό επίπεδο

    σημασία q)

    Τα κριτήρια του Ράιτ.Το κριτήριο του «κανόνα των τριών σίγμα» είναι ένα από τα απλούστερα για τον έλεγχο των αποτελεσμάτων που υπακούουν στον νόμο της κανονικής κατανομής. Η ουσία του κανόνα των τριών σίγμα: εάν μια τυχαία μεταβλητή κατανέμεται κανονικά, τότε απόλυτη τιμήη απόκλιση του από τη μαθηματική προσδοκία δεν υπερβαίνει το τριπλάσιο της τυπικής απόκλισης.

    Στην πράξη, ο κανόνας των τριών σιγμάτων εφαρμόζεται ως εξής: εάν η κατανομή της τυχαίας μεταβλητής που μελετάται είναι άγνωστη, αλλά πληρούται η προϋπόθεση που καθορίζεται στον παραπάνω κανόνα, τότε υπάρχει λόγος να υποθέσουμε ότι η μεταβλητή που μελετάται είναι κανονικά κατανεμημένη ; διαφορετικά δεν διανέμεται κανονικά. Για το σκοπό αυτό, υπολογίζεται το κέντρο κατανομής και η εκτίμηση της τυπικής απόκλισης του αποτελέσματος παρατήρησης για το δείγμα (συμπεριλαμβανομένου του ύποπτου αποτελέσματος). Αποτέλεσμα που ικανοποιεί την προϋπόθεση

    ,

    θεωρείται ότι έχει χονδρό σφάλμα και αφαιρείται και τα χαρακτηριστικά κατανομής που έχουν υπολογιστεί προηγουμένως βελτιστοποιούνται.

    Αυτό το κριτήριο είναι παρόμοιο Το κριτήριο του Ράιτ, με βάση το γεγονός ότι εάν το υπολειπόμενο σφάλμα είναι μεγαλύτερο από τέσσερα σίγμα, τότε αυτό το αποτέλεσμα μέτρησης είναι ένα μεγάλο σφάλμα και θα πρέπει να εξαιρεθεί κατά την περαιτέρω επεξεργασία. Και τα δύο κριτήρια είναι αξιόπιστα όταν ο αριθμός των μετρήσεων είναι μεγαλύτερος από 20...50. Μπορούν να χρησιμοποιηθούν όταν είναι γνωστή η τιμή της γενικής τυπικής απόκλισης ( μικρό).

    Μπορεί να αποδειχθεί ότι με νέες αξίες και μικρόάλλα αποτελέσματα θα εμπίπτουν στην κατηγορία των ανώμαλων.

    Κριτήριο Smirnov.Το κριτήριο Smirnov χρησιμοποιείται για τα μεγέθη του δείγματος Π≥ 25 ή πότε γνωστές αξίεςγενικός μέσος όρος και RMS. Θέτει λιγότερο αυστηρά όρια για το χονδροειδές σφάλμα. Για την εφαρμογή αυτού του κριτηρίου, υπολογίζονται οι πραγματικές τιμές των ποσοστών κατανομής (παρατηρούμενη τιμή του κριτηρίου) χρησιμοποιώντας τον τύπο:

    (8)

    Η τιμή που βρέθηκε συγκρίνεται με την τιμή κριτηρίου β kδίνεται στον πίνακα 6

    Πίνακας 6 – Ποσοστά κατανομής β k

    Κριτήριο Σοβέ.Το κριτήριο Chauvet χρησιμοποιείται για νόμους που δεν έρχονται σε αντίθεση με τον κανονικό και βασίζεται στον προσδιορισμό του αριθμού των αναμενόμενων αποτελεσμάτων παρατήρησης n δροσερό, τα οποία έχουν σφάλματα τόσο μεγάλα όσο το ύποπτο. Η υπόθεση για την παρουσία χονδροειδούς σφάλματος γίνεται αποδεκτή εάν πληρούται η ακόλουθη προϋπόθεση:

    Η διαδικασία για τον έλεγχο μιας υπόθεσης είναι η εξής:

    1) υπολογίζεται ο αριθμητικός μέσος όρος και η τυπική απόκλιση μικρόαποτελέσματα παρατήρησης για ολόκληρο το δείγμα·

    2) από τον πίνακα κανονικοποιημένης κανονικής κατανομής (Παράρτημα 1 - ολοκληρωμένη συνάρτηση κανονικοποιημένης κανονικής κατανομής) κατά τιμή

    προσδιορίζεται η πιθανότητα να εμφανιστεί ένα ύποπτο αποτέλεσμα στον γενικό πληθυσμό των αριθμών n:

    (9)

    3) αριθμός αναμενόμενων αποτελεσμάτων σας παρακαλούμεκαθορίζεται από τον τύπο:

    Τα παραπάνω κριτήρια σε πολλές περιπτώσεις αποδεικνύονται «αυστηρά». Στη συνέχεια, συνιστάται να χρησιμοποιήσετε το κριτήριο χονδρικού σφάλματος " κ", ανάλογα με το μέγεθος του δείγματος Πκαι την αποδεκτή πιθανότητα εμπιστοσύνης R.

    Πίνακας 7 - Εξάρτηση του κριτηρίου μεικτού σφάλματος καπό το μέγεθος του δείγματος Π

    και πιθανότητα εμπιστοσύνης R

    Για κατανομές διαφορετικές από τις κανονικές, κατηγορίες όπως δύο τροπικές συνθέσεις στρογγυλής κορυφής των κανονικών και διακριτή κατανομήμε κύρτωση ε = 1,5 - 3,0;μυτερή διτροπική? συνθέσεις διακριτής κατανομής δύο τιμών και κατανομής Laplace με κύρτωση ε = 1,5 - 6,0;συνθέσεις ομοιόμορφης κατανομής με εκθετική κατανομή κύρτωσης ε = 1,8-6,0και την κλάση των εκθετικών κατανομών εντός των ορίων της μεταβολής της κύρτωσης ε = 1,8-6,0το πρόχειρο όριο σφάλματος καθορίζεται από την τιμή ± (t gr . σ ) ή ±( t gr . μικρό), Οπου:

    (11)

    Οπου γ - αντίθετη υπερβολή.

    (12)

    Σφάλματα στον καθορισμό των εκτιμήσεων μικρό SKO και t sp συσχετίζονται αρνητικά, δηλαδή αυξάνουν την τυπική απόκλιση μικρόσυνοδεύεται από μείωση t zp. Ως εκ τούτου, ο καθορισμός των ορίων του χονδροειδούς σφάλματος για νόμους άλλους από τον κανονικό, με κύρτωση ε < 6 χρησιμοποιώντας κριτήριο t zp είναι αρκετά ακριβής και μπορεί να χρησιμοποιηθεί ευρέως στην πράξη.

    Ακροαματικότητα, μικρόΚαι ε θα πρέπει να υπολογίζονται αφού εξαιρεθούν ύποπτα αποτελέσματα από το δείγμα. Μετά τον υπολογισμό των ορίων του μεικτού σφάλματος, τα αποτελέσματα παρατήρησης που εμπίπτουν στα όρια επιστρέφονται και τα χαρακτηριστικά κατανομής που βρέθηκαν προηγουμένως βελτιώνονται.

    Για ομοιόμορφη κατανομή, τα όρια του χονδροειδούς σφάλματος μπορούν να ληφθούν ως ±1,8. ΜΙΚΡΟ.

    Ας δούμε ένα παράδειγμαεφαρμόζοντας κριτήρια για την εξάλειψη μεγάλων σφαλμάτων κατά τη μέτρηση της ταχύτητας κρουστικό κύμα. Τα αποτελέσματα που παρουσιάζονται στον Πίνακα 8 ελήφθησαν.

    Πίνακας 8 - Αποτελέσματα παρατήρησης

    Θέλετε να προσδιορίσετε εάν το αποτέλεσμα μιας παρατήρησης περιέχει V=3,50 km/s πρόχειρο σφάλμα.

    Για γραφικός ορισμόςτύπος νόμου κατανομής, θα κατασκευάσουμε ένα ιστόγραμμα. Κατά την κατασκευή, χωρίζουμε σε διαστήματα με τέτοιο τρόπο ώστε οι μετρούμενες τιμές να είναι το μέσο των διαστημάτων, όπως φαίνεται στο σχήμα 2.

    Χρησιμοποιείται για την αξιολόγηση αμφισβητούμενων τιμών δείγματος για χονδροειδή σφάλματα. Η σειρά εφαρμογής του έχει ως εξής.

    Βρείτε την υπολογιζόμενη τιμή του κριτηρίου λ calc = (|x k - x k prev |)/σ,

    Οπου x k- αμφίβολη έννοια, x έως προ– την προηγούμενη τιμή στη σειρά παραλλαγής, αν x kυπολογίζεται από τις μέγιστες τιμές της σειράς παραλλαγής, ή την επόμενη, εάν x kυπολογίζεται από τις ελάχιστες τιμές της σειράς παραλλαγής (το Irwin χρησιμοποιείται σε γενική περίπτωσηο όρος "πρώτη έννοια"). σ – γενική τυπική απόκλιση (RMSD) μιας συνεχούς κανονικά κατανεμημένης τυχαίας μεταβλητής.

    Αν λ calc > λ καρτέλα, x kγκάφα. Εδώ λ πίνακας– τιμή πίνακα (ποσοστιαία μονάδα) του κριτηρίου του Irwin.

    Οι ερωτήσεις που προκύπτουν περιγράφονται στη σελίδα. Συγκεκριμένα, στο αρχικό άρθρο, οι τιμές του πίνακα του κριτηρίου υπολογίζονται για μια κανονικά κατανεμημένη τυχαία μεταβλητή με γνωστή γενική τυπική απόκλιση (RMSD) σ . Επειδή η σ Τις περισσότερες φορές άγνωστο, ο Irwin πρότεινε τη χρήση στους υπολογισμούς σ τυπική απόκλιση δείγματος s, που προσδιορίζεται από τον τύπο

    Οπου n- το μέγεθος του δείγματος, x i– δείγματα στοιχείων, x Νυμφεύομαι– δείγμα μέσης τιμής.

    Αυτή η προσέγγιση χρησιμοποιείται συνήθως στην πράξη. Ωστόσο, η αποδοχή της χρήσης δείγματος MSE, και ταυτόχρονα ποσοστιαίων μονάδων για το γενικό MSE, δεν έχει επιβεβαιωθεί.

    Αυτό το άρθρο παρουσιάζει τιμές πίνακα (ποσοστιαίες μονάδες) του κριτηρίου Irvine, που υπολογίζονται με στατιστική μοντελοποίηση υπολογιστή χρησιμοποιώντας τυπική απόκλιση δείγματος για τη μέγιστη τιμή μιας σειράς παραλλαγής με τυπική κανονική κατανομή μιας τυχαίας μεταβλητής (με άλλες παραμέτρους της κανονικής κατανομής , καθώς και για ελάχιστη τιμήσειρές παραλλαγών, λαμβάνονται τα ίδια αποτελέσματα). Για κάθε μέγεθος δείγματος nΠροσομοιώθηκαν 10 6 δείγματα. Όπως έδειξαν οι προκαταρκτικοί υπολογισμοί, με παράλληλους ορισμούςοι διαφορές στις τιμές ποσοστιαίων μονάδων μπορεί να είναι τόσο μεγάλες όσο 0,003. Δεδομένου ότι οι τιμές στρογγυλοποιήθηκαν στο πλησιέστερο 0,01, σε αμφίβολες περιπτώσεις πραγματοποιήθηκαν 2 έως 4 παράλληλοι προσδιορισμοί.

    Επιπλέον, με βάση τα δεδομένα, υπολογίσαμε τις πινακοποιημένες τιμές του κριτηρίου Irvine για τη γνωστή γενική τυπική απόκλιση και τις συγκρίνουμε με αυτές που δίνονται στο .

    Από πότε Πρακτική εφαρμογηΤο κριτήριο του Irwin προκαλεί συχνά ορισμένες δυσκολίες λόγω της έλλειψης λογοτεχνικές πηγέςΟι τιμές πίνακα του κριτηρίου για ορισμένα μεγέθη δειγμάτων υπολογίστηκαν χρησιμοποιώντας την ίδια μέθοδο στατιστικής μοντελοποίησης υπολογιστή, ενώ ορισμένες από τις τιμές λείπουν από τους πίνακες.

    Είναι σαφές ότι με μέγεθος δείγματος 2, η εφαρμογή ενός κριτηρίου χρησιμοποιώντας τυπική απόκλιση δείγματος δεν έχει νόημα. Αυτό επιβεβαιώνεται από το γεγονός ότι η απλοποίηση της έκφρασης για την υπολογισμένη τιμή του κριτηρίου με τυπική απόκλιση δείγματος δίνει Τετραγωνική ρίζααπό δύο, γεγονός που δείχνει ξεκάθαρα την άσκοπη χρήση του κριτηρίου με μέγεθος δείγματος 2 και τυπική απόκλιση δείγματος.

    Τα αποτελέσματα που προέκυψαν φαίνονται στον πίνακα. 1.

    Πίνακας 1 - Πίνακες τιμών του κριτηρίου του Irwin για ακραία στοιχείασειρά παραλλαγής.

    Το μέγεθος του δείγματοςΣύμφωνα με τη γενική τυπική απόκλισηΣύμφωνα με την τυπική απόκλιση του δείγματος
    Επίπεδο σημασίας
    0,1 0,05 0,01 0,1 0,05 0,01
    2 2,33* 2,77* 3,64* - - -
    3 1,79* 2,17* 2,90* 1,62 1,68 1,72
    4 1,58 1,92 2,60 1,55 1,70 1,88
    5 1,45 1,77 2,43 1,45 1,64 1,93/
    6 1,37 1,67 2,30 1,38 1,60 1,94
    7 1,31 1,60 2,22 1,32 1,55 1,93
    8 1,26 1,55 2,14 1,27 1,51 1,92
    9 1,22 1,50 2,09 1,23 1,47 1,90
    10 1,18* 1,46* 2,04* 1,20 1,44 1,88
    11 1,15 1,43 2,00 1,17 1,42 1,87
    12 1,13 1,40 1,97 1,15 1,39 1,85
    13 1,11 1,38 1,94 1,13 1,37 1,83
    14 1,09 1,36 1,91 1,11 1,35 1,82
    15 1,08 1,34 1,89 1,09 1,33 1,80
    20 1,03* 1,27* 1,80* 1,03 1,27 1,75
    25 0,99 1,23 1,74 0,99 1,22 1,70
    30 0,96* 1,20* 1,70* 0,96 1,19 1,66
    35 0,93 1,17 1,66 0,94 1,16 1,63
    40 0,91* 1,15* 1,63* 0,92 1,14 1,61
    45 0,89 1,13 1,61 0,90 1,12 1,59
    50 0,88* 1,11* 1,59* 0,89 1,10 1,57
    60 0,86* 1,08* 1,56* 0,87 1,08 1,54
    70 0,84* 1,06* 1,53* 0,85 1,06 1,52
    80 0,83* 1,04* 1,51* 0,83 1,04 1,50
    90 0,82* 1,03* 1,49* 0,82 1,03 1,48
    100 0,81* 1,02* 1,47* 0,81 1,02 1,46
    200 0,75* 0,95* 1,38* 0,75 0,95 1,38
    300 0,72* 0,91* 1,33* 0,72 0,91 1,33
    500 0,69* 0,88* 1,28* 0,69 0,88 1,28
    1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
    Σημείωση: οι τιμές που σημειώνονται με αστερίσκο υπολογίζονται από τα δεδομένα και, εάν είναι απαραίτητο, προσαρμόζονται στατιστικά μοντελοποίηση υπολογιστή. Οι υπόλοιπες τιμές υπολογίστηκαν χρησιμοποιώντας στατιστική μοντελοποίηση υπολογιστή.

    Εάν συγκρίνουμε τις ποσοστιαίες μονάδες για τη γνωστή γενική τυπική απόκλιση που δίνεται στον Πίνακα. 1, με τις αντίστοιχες ποσοστιαίες μονάδες να δίνονται στο , τότε διαφέρουν σε αρκετές περιπτώσεις κατά 0,01 και σε μία περίπτωση κατά 0,02. Προφανώς, οι ποσοστιαίες μονάδες που δίνονται σε αυτό το άρθρο είναι πιο ακριβείς, αφού σε αμφίβολες περιπτώσεις επαληθεύτηκαν με στατιστική υπολογιστική μοντελοποίηση.

    Από τον Πίνακα 1 μπορεί να φανεί ότι οι ποσοστιαίες μονάδες του κριτηρίου Irvine όταν χρησιμοποιείται τυπική απόκλιση δείγματος με σχετικά μικρά μεγέθη δειγμάτων διαφέρουν σημαντικά από τις ποσοστιαίες μονάδες όταν χρησιμοποιείται η γενική τυπική απόκλιση. Μόνο με σημαντικά μεγέθη δειγμάτων, περίπου 40, οι ποσοστιαίες μονάδες πλησιάζουν. Έτσι, όταν χρησιμοποιείτε το κριτήριο Irvine, θα πρέπει να χρησιμοποιείτε τις ποσοστιαίες μονάδες που δίνονται στον πίνακα. 1, λαμβάνοντας υπόψη εάν η υπολογιζόμενη τιμή του κριτηρίου λήφθηκε με τυπική απόκλιση γενικής ή δείγματος.

    ΒΙΒΛΙΟΓΡΑΦΙΑ

    1. Irvin J.O. Για ένα κριτήριο για την απόρριψη της απομακρυσμένης παρατήρησης //Biometrika.1925. V. 17. Σ. 238 – 250.

    2. Kobzar A.I. Εφαρμοσμένος μαθηματικά στατιστικά. – Μ.: FIZMATLIT, 2006. – 816 σελ. © V.V. Zalyazhnykh
    Όταν χρησιμοποιείτε υλικά, δώστε έναν σύνδεσμο.