Βιογραφίες Προδιαγραφές Ανάλυση

Έλεγχος της υπόθεσης ότι ο μέσος όρος είναι ίσος με μια ορισμένη τιμή. Έλεγχος της υπόθεσης ότι ο μέσος όρος είναι ίσος με μια δεδομένη τιμή α

8.1. Η έννοια των εξαρτημένων και ανεξάρτητων δειγμάτων.

Επιλογή κριτηρίου για τον έλεγχο μιας υπόθεσης

καθορίζεται κυρίως από το εάν τα υπό εξέταση δείγματα είναι εξαρτημένα ή ανεξάρτητα. Ας εισαγάγουμε τους αντίστοιχους ορισμούς.

Def.Τα δείγματα ονομάζονται ανεξάρτητος, εάν η διαδικασία επιλογής μονάδων στο πρώτο δείγμα δεν συνδέεται σε καμία περίπτωση με τη διαδικασία επιλογής μονάδων στο δεύτερο δείγμα.

Ένα παράδειγμα δύο ανεξάρτητων δειγμάτων είναι τα προαναφερθέντα δείγματα ανδρών και γυναικών που εργάζονται στην ίδια επιχείρηση (στον ίδιο κλάδο κ.λπ.).

Σημειώστε ότι η ανεξαρτησία δύο δειγμάτων δεν σημαίνει ότι δεν υπάρχει απαίτηση για ένα συγκεκριμένο είδος ομοιότητας αυτών των δειγμάτων (την ομοιογένειά τους). Έτσι, μελετώντας το επίπεδο εισοδήματος ανδρών και γυναικών, είναι απίθανο να επιτρέψουμε μια τέτοια κατάσταση όταν οι άνδρες επιλέγονται από το περιβάλλον των επιχειρηματιών της Μόσχας και οι γυναίκες από τους αυτόχθονες της Αυστραλίας. Οι γυναίκες πρέπει επίσης να είναι Μοσχοβίτες και, επιπλέον, «επιχειρηματίες». Αλλά εδώ δεν μιλάμε για την εξάρτηση των δειγμάτων, αλλά για την απαίτηση ομοιογένειας του μελετημένου συνόλου αντικειμένων, η οποία πρέπει να ικανοποιείται τόσο στη συλλογή όσο και στην ανάλυση κοινωνιολογικών δεδομένων.

Def.Τα δείγματα ονομάζονται εξαρτώμενο ή ζευγαρωμένο,αν κάθε μονάδα ενός δείγματος «δένεται» με μια συγκεκριμένη μονάδα του δεύτερου δείγματος.

Ο τελευταίος ορισμός θα γίνει πιθανώς σαφέστερος εάν δώσουμε ένα παράδειγμα εξαρτημένων δειγμάτων.

Ας υποθέσουμε ότι θέλουμε να μάθουμε αν η κοινωνική θέση του πατέρα είναι κατά μέσο όρο χαμηλότερη από κοινωνική θέσηγιος (πιστεύουμε ότι μπορούμε να μετρήσουμε αυτό το περίπλοκο και διφορούμενο κοινωνικό χαρακτηριστικόπρόσωπο). Φαίνεται προφανές ότι σε μια τέτοια κατάσταση είναι σκόπιμο να επιλεγούν ζευγάρια ερωτηθέντων (πατέρας, γιος) και να υποθέσουμε ότι κάθε στοιχείο του πρώτου δείγματος (ένας από τους πατέρες) είναι «δεμένο» με ένα ορισμένο στοιχείο του δεύτερου δείγματος (του υιός). Αυτά τα δύο δείγματα θα ονομαστούν εξαρτημένα.

8.2. Έλεγχος υποθέσεων για ανεξάρτητα δείγματα

Για ανεξάρτητοςη επιλογή των κριτηρίων εξαρτάται από το αν γνωρίζουμε γενικές αποκλίσεις s 1 2 και s 2 2 του χαρακτηριστικού που εξετάζεται για τα δείγματα που μελετήθηκαν. Θεωρούμε αυτό το πρόβλημα λυμένο, υποθέτοντας ότι αποκλίσεις δείγματοςταιριάζουν με τα γενικά. Σε αυτήν την περίπτωση, το κριτήριο είναι η τιμή:

Πριν προχωρήσουμε σε συζήτηση της κατάστασης όταν οι γενικές αποκλίσεις (ή τουλάχιστον μία από αυτές) είναι άγνωστες σε εμάς, σημειώνουμε τα ακόλουθα.

Η λογική της χρήσης του κριτηρίου (8.1) είναι παρόμοια με αυτή που περιγράψαμε όταν εξετάσαμε το κριτήριο «Χι-τετράγωνο» (7.2). Υπάρχει μόνο μια θεμελιώδης διαφορά. Μιλώντας για την έννοια του κριτηρίου (7.2), εξετάσαμε έναν άπειρο αριθμό δειγμάτων μεγέθους n, «σκουπισμένων» από τον γενικό πληθυσμό μας. Εδώ, αναλύοντας την έννοια του κριτηρίου (8.1), περνάμε στη θεώρηση ενός άπειρου αριθμού ατμόςδείγματα μεγέθους n 1 και n 2 . Για κάθε ζεύγος και , υπολογίζεται μια στατιστική της μορφής (8.1). Το σύνολο των λαμβανόμενων τιμών τέτοιων στατιστικών, σύμφωνα με τη σημείωση μας, αντιστοιχεί κανονική κατανομή(όπως συμφωνήσαμε, το γράμμα z χρησιμοποιείται για να ορίσει ένα τέτοιο κριτήριο, το οποίο αντιστοιχεί στην κανονική κατανομή).

Έτσι, εάν οι γενικές αποκλίσεις είναι άγνωστες σε εμάς, τότε αναγκαζόμαστε να τις χρησιμοποιήσουμε αντ' αυτού. δειγματοληπτικές εκτιμήσεις s 1 2 και s 2 2 . Ωστόσο, σε αυτήν την περίπτωση, η κανονική κατανομή θα πρέπει να αντικατασταθεί από την κατανομή του μαθητή - το z θα πρέπει να αντικατασταθεί από το t (όπως συνέβη σε παρόμοια κατάσταση κατά την κατασκευή διάστημα εμπιστοσύνηςγια μαθηματική προσδοκία). Ωστόσο, για αρκετά μεγάλα μεγέθη δείγματος (n 1 , n 2 ³ 30), όπως ήδη γνωρίζουμε, η κατανομή του Μαθητή πρακτικά συμπίπτει με την κανονική. Με άλλα λόγια, με μεγάλα δείγματα, μπορούμε να συνεχίσουμε να χρησιμοποιούμε το κριτήριο:

Η κατάσταση είναι πιο περίπλοκη όταν και οι δύο αποκλίσεις είναι άγνωστες και το μέγεθος τουλάχιστον ενός δείγματος είναι μικρό. Στη συνέχεια, ένας άλλος παράγοντας μπαίνει στο παιχνίδι. Ο τύπος του κριτηρίου εξαρτάται από το αν μπορούμε να θεωρήσουμε ίσες τις άγνωστες διακυμάνσεις του εξεταζόμενου χαρακτηριστικού στα δύο δείγματα που αναλύθηκαν. Για να μάθουμε, πρέπει να ελέγξουμε την υπόθεση:

H 0: s 1 2 = s 2 2 . (8.3)

Για να ελεγχθεί αυτή η υπόθεση, χρησιμοποιείται το κριτήριο

Σχετικά με τις ιδιαιτερότητες της χρήσης αυτού του κριτηρίου θα συζητηθούνπαρακάτω, και τώρα θα συνεχίσουμε να συζητάμε τον αλγόριθμο για την επιλογή ενός κριτηρίου που χρησιμοποιείται για τον έλεγχο υποθέσεων σχετικά με την ισότητα των μαθηματικών προσδοκιών.

Εάν η υπόθεση (8.3) απορριφθεί, τότε το κριτήριο που μας ενδιαφέρει έχει τη μορφή:

(8.5)

(δηλαδή, διαφέρει από τη δοκιμή (8.2) που χρησιμοποιείται για μεγάλα δείγματα στο ότι η αντίστοιχη στατιστική δεν έχει κανονική κατανομή, αλλά κατανομή Student). Εάν η υπόθεση (8.3) γίνει αποδεκτή, τότε ο τύπος του κριτηρίου που χρησιμοποιείται αλλάζει:

(8.6)

Ας συνοψίσουμε πώς επιλέγεται το κριτήριο για να ελεγχθεί η υπόθεση της ισότητας των γενικών μαθηματικών προσδοκιών με βάση την ανάλυση δύο ανεξάρτητων δειγμάτων.

γνωστός

άγνωστος

το μέγεθος του δείγματος είναι μεγάλο

H 0: s 1 = s 2 απορρίπτεται

δεκτός

8.3. Έλεγχος υποθέσεων για εξαρτημένα δείγματα

Ας προχωρήσουμε στην εξέταση εξαρτημένων δειγμάτων. Έστω ακολουθίες αριθμών

X 1 , X 2 , … , X n ;

Y 1 , Y 2 , … , Y n –

αυτές είναι οι τιμές του θεωρούμενου τυχαίου για τα στοιχεία δύο εξαρτημένων δειγμάτων. Ας εισάγουμε τη σημειογραφία:

D i = X i - Y i , i = 1, ... , n.

Για εξαρτώμενοςκριτήριο δειγματοληψίας που σας επιτρέπει να ελέγξετε μια υπόθεση

ως εξής:

Σημειώστε ότι η έκφραση που μόλις δόθηκε για το s D δεν είναι παρά μια νέα έκφραση για γνωστός τύποςπου εκφράζει την τυπική απόκλιση. ΣΤΟ αυτή η υπόθεση μιλαμεσχετικά με την τυπική απόκλιση των τιμών D i . Παρόμοιος τύποςχρησιμοποιείται συχνά στην πράξη ως απλούστερη (σε σύγκριση με τον "μετωπικό" υπολογισμό του αθροίσματος των τετραγωνικών αποκλίσεων των τιμών της ποσότητας που εξετάζεται από τον αντίστοιχο αριθμητικό μέσο όρο) μέθοδος για τον υπολογισμό της διακύμανσης.

Εάν συγκρίνουμε τους παραπάνω τύπους με αυτούς που χρησιμοποιήσαμε όταν συζητήσαμε τις αρχές κατασκευής ενός διαστήματος εμπιστοσύνης, είναι εύκολο να δούμε ότι ο έλεγχος της υπόθεσης σχετικά με την ισότητα των μέσων για την περίπτωση εξαρτημένων δειγμάτων είναι ουσιαστικά ένας έλεγχος της ισότητας προς το μηδέν. της μαθηματικής προσδοκίας των τιμών D i . αξία

είναι η τυπική απόκλιση για το D i . Επομένως, η τιμή του κριτηρίου t n -1 που μόλις περιγράφηκε είναι ουσιαστικά ίση με την τιμή του D i εκφρασμένη σε κλάσματα του μέσου όρου τυπική απόκλιση. Όπως είπαμε παραπάνω (όταν συζητάμε μεθόδους για την κατασκευή διαστημάτων εμπιστοσύνης), αυτός ο δείκτης μπορεί να χρησιμοποιηθεί για να κρίνει την πιθανότητα της εξεταζόμενης τιμής D i . Η διαφορά είναι ότι παραπάνω μιλούσαμε για έναν απλό αριθμητικό μέσο όρο, κανονικά κατανεμημένο, και εδώ μιλάμε για μέσες διαφορές, τέτοιοι μέσοι όροι έχουν κατανομή Student. Ωστόσο, τα επιχειρήματα σχετικά με τη σχέση μεταξύ της πιθανότητας απόκλισης του αριθμητικού μέσου του δείγματος από το μηδέν (με μαθηματική προσδοκία ίση με μηδέν) και πόσες μονάδες του s είναι αυτή η απόκλιση παραμένουν έγκυρα.

Η σύγκριση των μέσων δύο πληθυσμών είναι σημαντική πρακτική αξία. Στην πράξη, υπάρχει συχνά μια περίπτωση όπου μέσο αποτέλεσμαμια σειρά πειραμάτων διαφέρει από το μέσο αποτέλεσμα μιας άλλης σειράς. Αυτό εγείρει το ερώτημα εάν είναι δυνατόν να εξηγηθεί η παρατηρούμενη απόκλιση μεταξύ των μέσων όρων με το αναπόφευκτο τυχαία λάθηπείραμα ή προκαλείται από κάποια μοτίβα. Στη βιομηχανία, το έργο της σύγκρισης μέσων όρων προκύπτει συχνά κατά τη δειγματοληψία της ποιότητας των προϊόντων που κατασκευάζονται σε διαφορετικές εγκαταστάσεις ή υπό διαφορετικά τεχνολογικά καθεστώτα, στη χρηματοοικονομική ανάλυση - κατά τη σύγκριση του επιπέδου κερδοφορίας διαφόρων περιουσιακών στοιχείων κ.λπ.

Ας διατυπώσουμε το πρόβλημα. Έστω δύο πληθυσμοί που χαρακτηρίζονται με γενικά μέσα και και γνωστές αποκλίσειςκαι. Είναι απαραίτητο να ελεγχθεί η υπόθεση για την ισότητα των γενικών μέσων όρων, δηλ. :=. Για να ελεγχθεί η υπόθεση, ελήφθησαν δύο ανεξάρτητα δείγματα όγκων από αυτούς τους πληθυσμούς, για τους οποίους βρέθηκαν οι αριθμητικοί μέσοι όροι και οι διακυμάνσεις του δείγματος. Με αρκετά μεγάλα μεγέθη δείγματος, το δείγμα σημαίνει και έχει έναν περίπου κανονικό νόμο κατανομής, αντίστοιχα, και Εάν η υπόθεση είναι αληθινή, η διαφορά - έχει έναν κανονικό νόμο κατανομής με μαθηματική προσδοκία και διασπορά.

Επομένως, όταν εκπληρωθεί η υπόθεση, τα στατιστικά

έχει τυπική κανονική κατανομή N(0; 1).

Έλεγχος υποθέσεων για αριθμητικές τιμέςΠαράμετροι

Υποθέσεις σχετικά με αριθμητικές τιμές εμφανίζονται σε διάφορα προβλήματα. Έστω οι τιμές κάποιας παραμέτρου προϊόντων που παράγονται από το αυτόματο μηχάνημα γραμμής και έστω η δεδομένη ονομαστική τιμή αυτής της παραμέτρου. Καθε ξεχωριστή τιμήμπορεί, φυσικά, να αποκλίνει κατά κάποιο τρόπο από τη δεδομένη ονομαστική αξία. Προφανώς, για να ελέγξετε τις σωστές ρυθμίσεις αυτού του μηχανήματος, πρέπει να βεβαιωθείτε ότι η μέση τιμή της παραμέτρου για τα προϊόντα που παράγονται σε αυτό θα αντιστοιχεί στην ονομαστική τιμή, δηλ. δοκιμάστε μια υπόθεση έναντι μιας εναλλακτικής, ή, ή

Με μια αυθαίρετη ρύθμιση της μηχανής, μπορεί να είναι απαραίτητο να ελεγχθεί η υπόθεση ότι η ακρίβεια των προϊόντων κατασκευής για μια δεδομένη παράμετρο, που δίνεται από τη διασπορά, είναι ίση με δεδομένη αξία, δηλ. ή, για παράδειγμα, το γεγονός ότι η αναλογία των ελαττωματικών προϊόντων που παράγονται από τη μηχανή είναι ίση με τη δεδομένη τιμή p 0, δηλ. και τα λοιπά.

Παρόμοια προβλήματα μπορεί να προκύψουν, για παράδειγμα, στη χρηματοοικονομική ανάλυση, όταν, σύμφωνα με τα δεδομένα του δείγματος, είναι απαραίτητο να καθοριστεί εάν είναι δυνατός ο υπολογισμός της απόδοσης ενός περιουσιακού στοιχείου ένα ορισμένο είδοςή ένα χαρτοφυλάκιο τίτλων, ή ο κίνδυνος του είναι ίσος με έναν δεδομένο αριθμό· ή, με βάση τα αποτελέσματα ενός επιλεκτικού ελέγχου παρόμοιων εγγράφων, πρέπει να βεβαιωθείτε εάν το ποσοστό των σφαλμάτων που έγιναν μπορεί να θεωρηθεί ίσο με την ονομαστική αξία κ.λπ.

ΣΤΟ γενική περίπτωσηυποθέσεις αυτός ο τύποςέχουν τη μορφή, όπου είναι μια συγκεκριμένη παράμετρος της υπό μελέτη κατανομής, και είναι το εμβαδόν των συγκεκριμένων τιμών της, που συνίσταται σε μια συγκεκριμένη περίπτωση μιας τιμής.

5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 Διάλεξη 6. Σύγκριση δύο δειγμάτων 6-1. Υπόθεση για την ισότητα των μέσων. Ζευγαρωμένα δείγματα 6-2. Διάστημα εμπιστοσύνης για τη μέση διαφορά. Ζευγαρωμένα δείγματα 6-3. Η Υπόθεση Ίσης Διακύμανσης 6-4. Η υπόθεση της ισότητας των μετοχών 6-5. Διάστημα εμπιστοσύνης για τη διαφορά των μετοχών


2 Ivanov O.V., 2005 Σε αυτή τη διάλεξη… Στην προηγούμενη διάλεξη δοκιμάσαμε την υπόθεση για την ισότητα των μέσων δύο γενικών πληθυσμών και δημιουργήσαμε ένα διάστημα εμπιστοσύνης για τη διαφορά των μέσων για την περίπτωση ανεξάρτητων δειγμάτων. Τώρα εξετάζουμε το κριτήριο για τον έλεγχο της υπόθεσης της ισότητας των μέσων και κατασκευάζουμε ένα διάστημα εμπιστοσύνης για τη διαφορά των μέσων στην περίπτωση ζευγαρωμένων (εξαρτημένων) δειγμάτων. Στη συνέχεια, στην ενότητα 6-3, θα ελεγχθεί η υπόθεση της ισότητας των αποκλίσεων, στην ενότητα 6-4, η υπόθεση της ισότητας των μετοχών. Τέλος, κατασκευάζουμε ένα διάστημα εμπιστοσύνης για τη διαφορά των μεριδίων.


5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 Υπόθεση ισότητας μέσων. Δείγματα ζευγαρώματος Δήλωση του προβλήματος Υποθέσεις και στατιστικές Ακολουθία ενεργειών Παράδειγμα


4 Ivanov O.V., 2005 Paired samples. Περιγραφή του προβλήματος Τι έχουμε 1. Δύο απλά τυχαία δείγματαπροέρχεται από δύο πληθυσμούς. Τα δείγματα είναι ζευγαρωμένα (εξαρτώμενα). 2. Και τα δύο δείγματα έχουν μέγεθος n 30. Εάν όχι, τότε και τα δύο δείγματα λαμβάνονται από κανονικά κατανεμημένους πληθυσμούς. Τι θέλουμε να δοκιμάσουμε την υπόθεση για τη διαφορά μεταξύ των μέσων δύο πληθυσμών:


5 Ivanov O.V., 2005 Στατιστικά για ζευγαρωμένα δείγματα Για τον έλεγχο μιας υπόθεσης, χρησιμοποιούνται στατιστικά: όπου - η διαφορά μεταξύ δύο τιμών σε ένα ζευγάρι - ο γενικός μέσος όρος για ζευγαρωμένες διαφορές - ο μέσος όρος του δείγματος για ζευγαρωμένες διαφορές - τυπική απόκλισηδιαφορές για το δείγμα - αριθμός ζευγών


6 Ivanov O.V., 2005 Παράδειγμα. Εκπαίδευση μαθητών Μια ομάδα 15 μαθητών έκανε το τεστ πριν και μετά την εκπαίδευση. Τα αποτελέσματα των δοκιμών στον πίνακα. Ας ελέγξουμε την υπόθεση για ζευγαρωμένα δείγματα για την απουσία της επίδρασης της εκπαίδευσης στην προετοιμασία των μαθητών σε επίπεδο σημαντικότητας 0,05. Απόφαση. Ας υπολογίσουμε τις διαφορές και τα τετράγωνά τους. StudentBeforeAfter Σ= 21 Σ= 145


7 Ivanov O.V., 2005 Λύση Βήμα 1. Κύριες και εναλλακτικές υποθέσεις: Βήμα 2. Ορίζεται το επίπεδο σημασίας =0,05. Βήμα 3. Σύμφωνα με τον πίνακα για df = 15 - 1=14, βρίσκουμε την κρίσιμη τιμή t = 2,145 και γράφουμε την κρίσιμη περιοχή: t > 2,145. 2.145."> 2.145."> 2.145." title="(!LANG:7 Ivanov O.V., 2005 Λύση Βήμα 1. Κύριες και εναλλακτικές υποθέσεις: Βήμα 2. Ορίζεται το επίπεδο σημασίας = 0,05. Βήμα 3. Με Στον πίνακα για df = 15 - 1=14 βρίσκουμε την κρίσιμη τιμή t = 2,145 και γράφουμε την κρίσιμη περιοχή: t > 2,145."> title="7 Ivanov O.V., 2005 Λύση Βήμα 1. Κύριες και εναλλακτικές υποθέσεις: Βήμα 2. Ορίζεται το επίπεδο σημασίας =0,05. Βήμα 3. Σύμφωνα με τον πίνακα για df = 15 - 1=14, βρίσκουμε την κρίσιμη τιμή t = 2,145 και γράφουμε την κρίσιμη περιοχή: t > 2,145."> !}




9 Ivanov O.V., 2005 Solution Statistics παίρνει την τιμή: Βήμα 5. Ας συγκρίνουμε την τιμή που προκύπτει με την κρίσιμη περιοχή. 1.889


5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 Διάστημα εμπιστοσύνης για τη μέση διαφορά. Ζευγαρωμένα δείγματα Δήλωση του προβλήματος Μέθοδος κατασκευής διαστήματος εμπιστοσύνης Παράδειγμα


11 Ivanov OV, 2005 Περιγραφή του προβλήματος Τι έχουμε Έχουμε δύο τυχαία ζευγαρωμένα (εξαρτημένα) δείγματα μεγέθους n από δύο γενικούς πληθυσμούς. Οι πληθυσμοί έχουν κανονική κατανομή με παραμέτρους 1, 1 και 2, 2, ή και τα δύο μεγέθη δείγματος είναι 30. Τι θέλουμε να εκτιμήσουμε τη μέση τιμή των διαφορών κατά ζεύγη για δύο πληθυσμούς. Για να το κάνετε αυτό, δημιουργήστε ένα διάστημα εμπιστοσύνης για το μέσο όρο στη μορφή:






5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 Υπόθεση ίσης διακύμανσης Δήλωση προβλήματος Υποθέσεις και στατιστικά Ακολουθία ενεργειών Παράδειγμα


15 Ivanov O.V., 2005 Κατά τη διάρκεια της μελέτης… Ο ερευνητής μπορεί να χρειαστεί να ελέγξει την υπόθεση ότι οι διακυμάνσεις των δύο πληθυσμών που μελετήθηκαν είναι ίσες. Στην περίπτωση που αυτοί οι γενικοί πληθυσμοί έχουν κανονική κατανομή, υπάρχει μια δοκιμή F για αυτό, που ονομάζεται επίσης δοκιμή Fisher. Σε αντίθεση με τον Student, ο Fischer δεν εργαζόταν σε ζυθοποιείο.


16 Ivanov OV, 2005 Περιγραφή του προβλήματος Τι έχουμε 1. Δύο απλά τυχαία δείγματα που ελήφθησαν από δύο κανονικά κατανεμημένους πληθυσμούς. 2. Τα δείγματα είναι ανεξάρτητα. Αυτό σημαίνει ότι δεν υπάρχει σχέση μεταξύ των υποκειμένων των δειγμάτων. Τι θέλουμε να ελέγξουμε την υπόθεση της ισότητας των διακυμάνσεων του πληθυσμού:














23 Ivanov OV, 2005 Παράδειγμα Ένας ιατρικός ερευνητής θέλει να ελέγξει εάν υπάρχει διαφορά μεταξύ του καρδιακού παλμού των καπνιστών και των μη καπνιστών (αριθμός παλμών ανά λεπτό). Τα αποτελέσματα δύο τυχαία επιλεγμένων ομάδων φαίνονται παρακάτω. Χρησιμοποιώντας α = 0,05, μάθετε αν ο γιατρός έχει δίκιο. Καπνιστές Μη καπνιστές


24 Ivanov O.V., 2005 Λύση Βήμα 1. Κύριες και εναλλακτικές υποθέσεις: Βήμα 2. Ορίζεται το επίπεδο σημασίας =0,05. Βήμα 3. Σύμφωνα με τον πίνακα για τον αριθμό των βαθμών ελευθερίας του αριθμητή 25 και του παρονομαστή 17, βρίσκουμε την κρίσιμη τιμή f = 2,19 και την κρίσιμη περιοχή: f > 2,19. Βήμα 4. Με βάση το δείγμα, υπολογίζουμε την τιμή των στατιστικών: 2.19. Βήμα 4. Με βάση το δείγμα, υπολογίζουμε την τιμή των στατιστικών: ">




5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 Υπόθεση ισότητας μετοχών Δήλωση προβλήματος Υποθέσεις και στατιστικά Ακολουθία ενεργειών Παράδειγμα


27 Ivanov OV, 2005 Ερώτηση Από τους 100 τυχαία επιλεγμένους φοιτητές της Κοινωνιολογικής Σχολής, οι 43 παρακολουθούν ειδικά μαθήματα. Από 200 τυχαία επιλεγμένους φοιτητές οικονομικών, 90 παρακολουθούν ειδικά μαθήματα. Διαφέρει το ποσοστό των φοιτητών που παρακολουθούν ειδικά μαθήματα στα τμήματα κοινωνιολογίας και οικονομίας; Δεν φαίνεται να διαφέρει σημαντικά. Πώς να το ελέγξω; Το μερίδιο όσων παρακολουθούν ειδικά μαθήματα είναι το μερίδιο του χαρακτηριστικού. 43 - ο αριθμός των "επιτυχιών". 43/100 - μερίδιο επιτυχίας. Η ορολογία είναι η ίδια όπως στο σχήμα Bernoulli.


28 Ivanov OV, 2005 Περιγραφή του προβλήματος Τι έχουμε 1. Δύο απλά τυχαία δείγματα που ελήφθησαν από δύο κανονικά κατανεμημένους πληθυσμούς. Τα δείγματα είναι ανεξάρτητα. 2. Για δείγματα, ικανοποιούνται τα np 5 και nq 5. Αυτό σημαίνει ότι τουλάχιστον 5 στοιχεία του δείγματος έχουν την τιμή χαρακτηριστικού που μελετάται και τουλάχιστον 5 όχι. Τι θέλουμε να ελέγξουμε την υπόθεση σχετικά με την ισότητα των μεριδίων του χαρακτηριστικού σε δύο γενικούς πληθυσμούς:






31 Ivanov O.V., 2005 Παράδειγμα. Ειδικά μαθήματα δύο σχολών Από τους 100 τυχαία επιλεγμένους φοιτητές της Κοινωνιολογικής Σχολής, οι 43 παρακολουθούν ειδικά μαθήματα. Από τους 200 φοιτητές οικονομικών, οι 90 παρακολουθούν ειδικά μαθήματα. Σε επίπεδο σημαντικότητας = 0,05, ελέγξτε την υπόθεση ότι δεν υπάρχει διαφορά μεταξύ του ποσοστού παρακολούθησης ειδικών μαθημάτων σε αυτές τις δύο σχολές. 33 Ivanov O.V., 2005 Λύση Βήμα 1. Κύριες και εναλλακτικές υποθέσεις: Βήμα 2. Ορίζεται το επίπεδο σημασίας =0,05. Βήμα 3. Σύμφωνα με τον πίνακα κανονικής κατανομής, βρίσκουμε τις κρίσιμες τιμές z = – 1,96 και z = 1,96 και κατασκευάζουμε την κρίσιμη περιοχή: z 1,96. Βήμα 4. Με βάση το δείγμα, υπολογίζουμε την αξία των στατιστικών.


34 Ivanov O.V., 2005 Λύση Βήμα 5. Ας συγκρίνουμε την τιμή που προκύπτει με την κρίσιμη περιοχή. Η προκύπτουσα στατιστική τιμή δεν εμπίπτει στην κρίσιμη περιοχή. Βήμα 6. Διατυπώνουμε το συμπέρασμα. Δεν υπάρχει λόγος να απορρίψουμε την κύρια υπόθεση. Το ποσοστό όσων παρακολουθούν ειδικά μαθήματα δεν διαφέρει στατιστικά σημαντικά.


5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012 5 Νοεμβρίου 2012





Ο έλεγχος της ομοιογένειας δύο δειγμάτων πραγματοποιείται με τη χρήση του Student's t-test (ή t- κριτήρια). Εξετάστε τη δήλωση του προβλήματος ελέγχου της ομοιογένειας δύο δειγμάτων. Έστω δύο δείγματα μεγέθους και . Χρειάζεται έλεγχος μηδενική υπόθεσηότι οι γενικοί μέσοι όροι των δύο δειγμάτων είναι ίσοι. Δηλαδή και . ν 1

Πριν εξετάσετε τη μεθοδολογία για την επίλυση του προβλήματος, εξετάστε μερικές θεωρητικές διατάξειςχρησιμοποιείται για την επίλυση του προβλήματος. Ο διάσημος μαθηματικός W.S. Ο Gosset (ο οποίος δημοσίευσε μια σειρά από έργα του με το ψευδώνυμο Student) απέδειξε ότι τα στατιστικά tΤο (6.4) υπακούει σε έναν ορισμένο νόμο διανομής, ο οποίος αργότερα ονομάστηκε νόμος διανομής του μαθητή (το δεύτερο όνομα του νόμου είναι " t- κατανομή").

Μέση τιμή μιας τυχαίας μεταβλητής Χ;

Αναμενόμενη αξίατυχαία μεταβλητή Χ;

Τυπική απόκλιση του μέσου όγκου δείγματος n.

Βαθμός τυπική απόκλισηο μέσος όρος υπολογίζεται από τον τύπο (6.5):

Η τυπική απόκλιση μιας τυχαίας μεταβλητής Χ.

Η κατανομή του μαθητή έχει μία παράμετρο - τον αριθμό των βαθμών ελευθερίας.

Ας επιστρέψουμε τώρα στην αρχική διατύπωση του προβλήματος των δύο δειγμάτων και ας εξετάσουμε τυχαία μεταβλητήίση με τη διαφορά μεταξύ των μέσων δύο δειγμάτων (6.6):

(6.6)

Υπό την προϋπόθεση ότι πληρούται η υπόθεση της ισότητας των γενικών μέσων, η (6.7) είναι αληθής:

(6.7)

Ας ξαναγράψουμε τη σχέση (6.4) για την περίπτωσή μας:

Μια εκτίμηση της τυπικής απόκλισης μπορεί να εκφραστεί ως εκτίμηση της συνδυασμένης τυπικής απόκλισης πληθυσμού (6.9):

(6.9)

Η εκτίμηση της διακύμανσης του συγκεντρωτικού πληθυσμού μπορεί να εκφραστεί με βάση τις εκτιμήσεις της διακύμανσης που υπολογίζονται από δύο δείγματα και:

(6.10)

Λαμβάνοντας υπόψη τον τύπο (6.10), η σχέση (6.9) μπορεί να ξαναγραφτεί στη μορφή (6.11). Η σχέση (6.9) είναι η κύρια τύπος υπολογισμούπροβλήματα σύγκρισης μέσων:

Όταν αντικαθιστούμε την τιμή στον τύπο (6.8), θα έχουμε μια τιμή δείγματος t-κριτήρια. Σύμφωνα με τους πίνακες κατανομής του Student με τον αριθμό των βαθμών ελευθερίας και μπορεί να προσδιοριστεί ένα δεδομένο επίπεδο σημασίας. Τώρα, αν , τότε η υπόθεση για την ισότητα των δύο μέσων απορρίπτεται.

Εξετάστε ένα παράδειγμα εκτέλεσης υπολογισμών για να ελέγξετε την υπόθεση της ισότητας δύο μέσων όρων στο EXCEL. Ας σχηματίσουμε έναν πίνακα δεδομένων (Εικ. 6.22). Θα δημιουργήσουμε δεδομένα χρησιμοποιώντας το πρόγραμμα παραγωγής τυχαίους αριθμούςπακέτο «Ανάλυση δεδομένων»:

Δείγμα Χ1 από κανονική κατανομή με παραμέτρους Ενταση ΗΧΟΥ ;

Το X2 είναι δείγμα από κανονική κατανομή με παραμέτρους όγκου.

Δείγμα Χ3 από κανονική κατανομή με παραμέτρους Ενταση ΗΧΟΥ ;

Δείγμα Χ4 από κανονική κατανομή με παραμέτρους Ενταση ΗΧΟΥ.


Ας ελέγξουμε την υπόθεση της ισότητας δύο μέσων (Χ1-Χ2), (Χ1-Χ3), (Χ1-Χ4). Στην αρχή υπολογίζουμε τις παραμέτρους των χαρακτηριστικών δειγμάτων X1-X4 (Εικ. 6.23). Στη συνέχεια υπολογίζουμε την τιμή t- κριτήρια. Οι υπολογισμοί θα εκτελεστούν χρησιμοποιώντας τους τύπους (6.6) - (6.9) στο EXCEL. Συνοψίζουμε τα αποτελέσματα των υπολογισμών σε έναν πίνακα (Εικ. 6.24).

Ρύζι. 6.22. πίνακας δεδομένων

Ρύζι. 6.23. Παράμετροι επιλογής χαρακτηριστικών X1-X4

Ρύζι. 6.24. Συνοπτικός πίνακας για τον υπολογισμό των τιμών t– κριτήρια για ζεύγη χαρακτηριστικών (X1-X2), (X1-X3), (X1-X4)

Σύμφωνα με τα αποτελέσματα που δίνονται στον πίνακα στο σχ. 6.24, μπορούμε να συμπεράνουμε ότι για ένα ζεύγος χαρακτηριστικών (Χ1-Χ2), η υπόθεση της ισότητας των μέσων όρων δύο χαρακτηριστικών απορρίπτεται και για ζεύγη χαρακτηριστικών (Χ1-Χ3), (Χ1-Χ4), η υπόθεση μπορεί να θεωρηθεί δίκαιο.

Τα ίδια αποτελέσματα μπορούν να ληφθούν χρησιμοποιώντας το πρόγραμμα "Two-sample t-τεστ με τις ίδιες διακυμάνσεις» του πακέτου Data Analysis. Η διεπαφή του προγράμματος φαίνεται στην εικ. 6.25.

Ρύζι. 6.25. Παράμετροι του προγράμματος «Δύο δείγμα t- δοκιμή με ίσες διακυμάνσεις»

Τα αποτελέσματα των υπολογισμών για τον έλεγχο των υποθέσεων ισότητας δύο μεσαίων ζευγών χαρακτηριστικών (X1-X2), (X1-X3), (X1-X4), που ελήφθησαν με τη χρήση του προγράμματος, φαίνονται στο σχ. 6,26-6,28.

Ρύζι. 6.26. Υπολογισμός Αξίας t– κριτήριο για ένα ζεύγος χαρακτηριστικών (X1-X2)

Ρύζι. 6.27. Υπολογισμός Αξίας t– κριτήριο για ένα ζεύγος χαρακτηριστικών (X1-X3)

Ρύζι. 6.28. Υπολογισμός Αξίας t– κριτήριο για ένα ζεύγος χαρακτηριστικών (X1-X4)

δύο δείγματα tονομάζεται επίσης δοκιμή με ίσες διακυμάνσεις t- δοκιμή με ανεξάρτητα δείγματα. Μεγάλη διανομήεπίσης έλαβε t-τεστ με εξαρτημένα δείγματα. Η κατάσταση όταν είναι απαραίτητο να εφαρμοστεί αυτό το κριτήριο προκύπτει όταν η ίδια τυχαία μεταβλητή μετράται δύο φορές. Ο αριθμός των παρατηρήσεων και στις δύο περιπτώσεις είναι ίδιος. Ας εισαγάγουμε τον συμβολισμό για δύο διαδοχικές μετρήσεις κάποιας ιδιότητας των ίδιων αντικειμένων και , , και δηλώνουμε τη διαφορά δύο διαδοχικών μετρήσεων ως:

Σε αυτήν την περίπτωση, ο τύπος για την τιμή δείγματος του κριτηρίου έχει τη μορφή:

, (6.13)

(6.15)

Σε αυτή την περίπτωση, ο αριθμός των βαθμών ελευθερίας είναι . Ο έλεγχος υποθέσεων μπορεί να πραγματοποιηθεί χρησιμοποιώντας το πρόγραμμα «Paired two-sample t-test» του πακέτου ανάλυσης δεδομένων (Εικ. 6.29).

Ρύζι. 6.29. Παράμετροι του προγράμματος «Paired two-samp t-δοκιμή"

6.5. Ανάλυση διακύμανσης - ταξινόμηση κατά ένα χαρακτηριστικό (F - κριτήριο)

Στην ανάλυση της διασποράς ελέγχεται μια υπόθεση, η οποία είναι μια γενίκευση της υπόθεσης της ισότητας δύο μέσων στην περίπτωση που ελέγχεται η υπόθεση της ισότητας πολλών μέσων ταυτόχρονα. Στην ανάλυση της διακύμανσης μελετάται ο βαθμός επιρροής ενός ή περισσότερων παραγόντων στο ενεργό πρόσημο. Ιδέα ανάλυση της διακύμανσηςανήκει στον R. Fischer. Το χρησιμοποίησε για να επεξεργαστεί τα αποτελέσματα γεωπονικών πειραμάτων. Η ανάλυση διακύμανσης χρησιμοποιείται για τον προσδιορισμό της σημασίας της επίδρασης παράγοντες ποιότηταςστην υπό μελέτη αξία. Η αγγλική συντομογραφία για την ανάλυση διασποράς είναι ANOVA (παραλλαγή ανάλυσης).

Γενική μορφήΗ παρουσίαση δεδομένων με ταξινόμηση σύμφωνα με ένα χαρακτηριστικό παρουσιάζεται στον πίνακα 6.1.

Πίνακας 6.1. Μορφή παρουσίασης δεδομένων με ταξινόμηση σύμφωνα με ένα κριτήριο

Θεωρήστε δύο ανεξάρτητα δείγματα x 1, x 2 , ….. , x n και y 1 , y 2 , … , y n που εξήχθησαν από κανονικούς γενικούς πληθυσμούς με τις ίδιες διακυμάνσεις, τα μεγέθη του δείγματος είναι n και m, αντίστοιχα, και οι μέσοι όροι μ x , μ y και η διακύμανση σ 2 είναι άγνωστες. Απαιτείται ο έλεγχος της κύριας υπόθεσης Н 0: μ x =μ y με την ανταγωνιστική Н 1: μ x μ y .

Όπως είναι γνωστό, το δείγμα σημαίνει και θα έχει τις ακόλουθες ιδιότητες: ~N(μ x , σ 2 /n), ~N(μ y , σ 2 /m).

Η διαφορά τους είναι κανονική τιμή με μέσο όρο και διακύμανση, άρα

~ (23).

Ας υποθέσουμε για λίγο ότι ισχύει η κύρια υπόθεση H 0: μ x –μ y =0. Επειτα και διαιρώντας την τιμή με την τυπική της απόκλιση, παίρνουμε την τυπική κανονική sl. η αξία ~N(0,1).

Παλαιότερα είχε σημειωθεί ότι μέγεθος κατανέμεται σύμφωνα με το νόμο με (ν-1)-ο βαθμό ελευθερίας, α - σύμφωνα με το νόμο με (μ-1) βαθμό ελευθερίας. Λαμβάνοντας υπόψη την ανεξαρτησία αυτών των δύο αθροισμάτων, προκύπτει ότι τους συνολικό ποσό κατανέμεται σύμφωνα με το νόμο με n+m-2 βαθμούς ελευθερίας.

Υπενθυμίζοντας το στοιχείο 7, βλέπουμε ότι το κλάσμα υπακούει στην κατανομή t (Μαθητής) με ν=m+n-2 βαθμούς ελευθερίας: Z=t. Αυτό το γεγονός λαμβάνει χώρα μόνο όταν η υπόθεση H 0 είναι αληθής.

Αντικαθιστώντας τα ξ και Q με τις εκφράσεις τους, παίρνουμε τον διευρυμένο τύπο για το Z:

(24)

Η επόμενη τιμή Z, που ονομάζεται στατιστικά του κριτηρίου, σας επιτρέπει να λάβετε μια απόφαση με την ακόλουθη σειρά ενεργειών:

1. Καθορίζεται η περιοχή D=[-t β,ν , +t β,ν ] που περιέχει β=1–α εμβαδά κάτω από την καμπύλη t ν -κατανομή (Πίνακας 10).

2. Η πειραματική τιμή Z στις στατιστικές Z υπολογίζεται με τον τύπο (24), για τον οποίο αντί για X 1 και Y 1 αντικαθίστανται οι τιμές x 1 και y 1 συγκεκριμένων δειγμάτων, καθώς και οι μέσοι όροι δειγμάτων τους και .

3. Εάν το Z στο D, τότε η υπόθεση H 0 θεωρείται ότι δεν έρχεται σε αντίθεση με τα πειραματικά δεδομένα και γίνεται αποδεκτή.

Εάν το Z στο D, τότε η υπόθεση H 1 γίνεται αποδεκτή.

Αν η υπόθεση H 0 είναι αληθής, τότε το Z υπακούει στη γνωστή t ν -κατανομή με μηδενικό μέσο όρο και με μεγάλη πιθανότητα β=1–α εμπίπτει στο D-πεδίο αποδοχής της υπόθεσης H 0 . Όταν το παρατηρούμενο, η πειραματική τιμή Z on εμπίπτει στο D. Το θεωρούμε ως απόδειξη υπέρ της υπόθεσης H 0 .

Όταν το Z 0 n βρίσκεται έξω από το D (όπως λένε, βρίσκεται στην κρίσιμη περιοχή K), κάτι που είναι φυσικό εάν η υπόθεση H 1 είναι αληθής, αλλά απίθανο, εάν το H 0 είναι αληθές, τότε πρέπει να απορρίψουμε την υπόθεση H 0 με αποδοχή Η 1 .

Παράδειγμα 31.

Συγκρίνονται δύο μάρκες βενζίνης: Α και Β. Σε 11 αυτοκίνητα της ίδιας ισχύος, η βενζίνη των κατηγοριών Α και Β δοκιμάστηκε μία φορά στον περιφερειακό αυτοκινητόδρομο. Ένα αυτοκίνητο χάλασε στο δρόμο και δεν υπάρχουν στοιχεία για τη βενζίνη Β για αυτό .

Κατανάλωση βενζίνης σε 100 χιλιόμετρα

Πίνακας 12

Εγώ
X i 10,51 11,86 10,5 9,1 9,21 10,74 10,75 10,3 11,3 11,8 10,9 n=11
Εγώ 13,22 13,0 11,5 10,4 11,8 11,6 10,64 12,3 11,1 11,6 - m=10

Η διασπορά κατανάλωσης των βαθμών Α και Β είναι άγνωστη και θεωρείται ότι είναι η ίδια. Είναι δυνατόν, σε επίπεδο σημαντικότητας α=0,05, να δεχθούμε την υπόθεση ότι το πραγματικό μέσο κόστος μ A και μ B αυτών των τύπων βενζίνης είναι το ίδιο;

Απόφαση. Δοκιμή της υπόθεσης H 0: μ A -μ B \u003d 0 με μια ανταγωνιστική. H 1: μ 1 μ 2 κάντε τα ακόλουθα σημεία:

1. Να βρείτε το μέσο του δείγματος και το άθροισμα των τετραγώνων αποκλίσεων Q.

;

;

2. Υπολογίστε την πειραματική τιμή της στατιστικής Ζ

3. Να βρείτε το όριο t β,ν από τον πίνακα 10 της κατανομής t, για τον αριθμό των βαθμών ελευθερίας ν=m+n–2=19 και β=1–α=0,95. Ο πίνακας 10 έχει t 0,95,20 = 2,09 και t 0,95,15 = 2,13 αλλά όχι t 0,95,19 . Βρίσκουμε με παρεμβολή t 0,95,19 =2,09+ =2,10.

4. Ελέγξτε ποια από τις δύο περιοχές D ή K περιέχει τον αριθμό Z στο . Ζώνη=-2,7 D=[-2,10; -2,10].

Εφόσον η παρατηρούμενη τιμή του Z on βρίσκεται στην κρίσιμη περιοχή, K=R\D, την απορρίπτουμε. H 0 και αποδεχτείτε την υπόθεση H 1 . Σε αυτή την περίπτωση, pro και λέγεται ότι έχουν σημαντική διαφορά. Εάν, υπό όλες τις συνθήκες αυτού του παραδείγματος, μόνο το Q επρόκειτο να αλλάξει, ας πούμε, το Q διπλασιαζόταν, τότε το συμπέρασμά μας θα άλλαζε επίσης. Ένας διπλασιασμός του Q θα οδηγούσε σε μείωση της τιμής του Z στις φορές, και τότε ο αριθμός Zon θα έπεφτε σε επιτρεπόμενη περιοχή D, έτσι ώστε η υπόθεση H 0 να περάσει το τεστ και να γίνει αποδεκτή. Σε αυτή την περίπτωση, η ασυμφωνία μεταξύ και θα εξηγηθεί από τη φυσική διασπορά των δεδομένων και όχι από το γεγονός ότι μ A μ B.

Η θεωρία των υποθέσεων δοκιμής είναι πολύ εκτεταμένη, οι υποθέσεις μπορεί να αφορούν τη μορφή του νόμου κατανομής, την ομοιογένεια των δειγμάτων, την ανεξαρτησία μιας τυχαίας τιμής κ.λπ.

ΚΡΙΤΗΡΙΟ γ 2 (PEARSON)

Το πιο συνηθισμένο κριτήριο για τον έλεγχο μιας απλής υπόθεσης στην πράξη. Ισχύει όταν ο νόμος διανομής είναι άγνωστος. Θεωρήστε μια τυχαία μεταβλητή X πάνω από την οποία n ανεξάρτητα τεστ. Λαμβάνεται η πραγματοποίηση x 1 , x 2 ,...,x n. Είναι απαραίτητο να ελεγχθεί η υπόθεση σχετικά με τον νόμο κατανομής αυτής της τυχαίας μεταβλητής.

Εξετάστε την περίπτωση μιας απλής υπόθεσης. Μια απλή υπόθεση ελέγχει την προσαρμογή του δείγματος με γενικός πληθυσμός, που έχει κανονική κατανομή (γνωστή). Με δείγματα κατασκευάζουμε σειρά παραλλαγής x(1) , x(2) , ..., x(n) . Το διάστημα χωρίζεται σε υποδιαστήματα. Έστω αυτά τα διαστήματα r. Τότε βρίσκουμε την πιθανότητα ότι το X εμπίπτει στο διάστημα Di, i=1 ,..., r ως αποτέλεσμα του τεστ, εάν η υπόθεση που ελέγχεται είναι αληθής.

Το κριτήριο δεν ελέγχει την αλήθεια της πυκνότητας πιθανότητας, αλλά την αλήθεια των αριθμών

Με κάθε διάστημα Di συσχετίζουμε τυχαίο συμβάνΈνα i - χτύπημα σε αυτό το διάστημα (χτύπημα ως αποτέλεσμα δοκιμής πάνω από το X του αποτελέσματος εφαρμογής του σε Di). Εισάγουμε τυχαίες μεταβλητές. m i - ο αριθμός των δοκιμών από n που πραγματοποιήθηκαν, στις οποίες συνέβη το συμβάν A i. Τα m i κατανέμονται σύμφωνα με τον διωνυμικό νόμο και στην περίπτωση της αλήθειας της υπόθεσης

Dm i =np i (1-p i)

Το κριτήριο γ 2 έχει τη μορφή

p 1 +p 2 +...+p r =1

m 1 +m 2 +...+m r =n

Εάν η υπόθεση που ελέγχεται είναι αληθής, τότε το m i αντιπροσωπεύει τη συχνότητα εμφάνισης ενός γεγονότος που έχει πιθανότητα p i σε κάθε έναν από τους n ελέγχους που πραγματοποιήθηκαν, επομένως, μπορούμε να θεωρήσουμε το m i ως μια τυχαία μεταβλητή που υπακούει στον διωνυμικό νόμο που επικεντρώνεται στο σημείο np i . Όταν το n είναι μεγάλο, τότε μπορούμε να υποθέσουμε ότι η συχνότητα είναι ασυμπτωτικά κανονικά κατανεμημένη με τις ίδιες παραμέτρους. Εάν η υπόθεση είναι σωστή, θα πρέπει να περιμένουμε ότι θα κατανεμηθεί ασυμπτωτικά κανονικά

που σχετίζονται μεταξύ τους

Ας εξετάσουμε την τιμή

c 2 - άθροισμα τετραγώνων ασυμπτωτικά κανονικές τιμέςσχετίζεται με γραμμική εξάρτηση. Έχουμε συναντήσει στο παρελθόν παρόμοια περίπτωση και γνωρίζουμε ότι η παρουσία γραμμική σύνδεσηοδήγησε σε μείωση κατά ένα στον αριθμό των βαθμών ελευθερίας.

Εάν η υπόθεση που ελέγχεται είναι αληθής, τότε το κριτήριο c 2 έχει μια κατανομή που τείνει στο n®¥ προς την κατανομή c 2 με r-1 βαθμούς ελευθερίας.

Ας πούμε ότι η υπόθεση είναι λάθος. Τότε υπάρχει μια τάση αύξησης των όρων στο άθροισμα, δηλ. Εάν η υπόθεση είναι εσφαλμένη, τότε αυτό το άθροισμα θα εμπίπτει σε μια συγκεκριμένη περιοχή μεγάλες αξίεςγ 2 . Ως κρίσιμη περιοχή, παίρνουμε την περιοχή θετικές αξίεςκριτήρια


Στην περίπτωση άγνωστων παραμέτρων κατανομής, κάθε παράμετρος μειώνει κατά ένα τον αριθμό των βαθμών ελευθερίας για το κριτήριο Pearson