Σχετικά δειγματοληπτικά σφάλματα. Δείγματα τύπων μέσου σφάλματος

Τύπος επίπεδο αυτοπεποίθησηςκατά την αξιολόγηση του γενικού Νώε κλάσμα του ζωδίου. Το μέσο τετραγωνικό σφάλμα των επαναλαμβανόμενων και χωρίς επαναδειγματοληψία και δημιουργία διαστήματος εμπιστοσύνης για το γενικό μερίδιο του χαρακτηριστικού.

Τύπος εμπιστοσύνης για την εκτίμηση του γενικού μέσου όρου. Το μέσο τετραγωνικό σφάλμα επαναλαμβανόμενων και μη δειγμάτων και κατασκευής διάστημα εμπιστοσύνηςγια τον γενικό μέσο όρο.

Κατασκευή διαστήματος εμπιστοσύνης για τον γενικό μέσο όρο και γενικό κλάσμα για μεγάλα δείγματα . Για την κατασκευή διαστημάτων εμπιστοσύνης για τις παραμέτρους των πληθυσμών, m.b. Υλοποιούνται 2 προσεγγίσεις που βασίζονται στη γνώση της ακριβούς (για ένα δεδομένο μέγεθος δείγματος n) ή της ασυμπτωτικής (όπως n → ∞) κατανομή των χαρακτηριστικών του δείγματος (ή ορισμένων συναρτήσεων τους). Η πρώτη προσέγγιση εφαρμόζεται περαιτέρω κατά την κατασκευή εκτιμήσεων παραμέτρων διαστήματος για μικρά δείγματα. Σε αυτήν την ενότητα, θεωρούμε τη δεύτερη προσέγγιση που εφαρμόζεται σε μεγάλα δείγματα (της τάξης των εκατοντάδων παρατηρήσεων).

Θεώρημα . Η πεποίθηση ότι η απόκλιση του μέσου όρου (ή του μεριδίου) του δείγματος από τον γενικό μέσο όρο (ή μερίδιο) δεν θα υπερβαίνει τον αριθμό Δ > 0 (σε απόλυτη τιμή) ισούται με:

Οπου

Οπου
.

Ф(t) - συνάρτηση (ολοκλήρωμα πιθανοτήτων) του Laplace.

Οι τύποι ονομάζονται Φόρμουλες Confidence Vert για Mean and Share .

Τυπική απόκλιση του μέσου όρου του δείγματος και δείγμα μεριδίου πράγματι- τυχαίο δείγμαπου ονομάζεται μέσο τετράγωνο (τυπικό) σφάλμα δείγματα (για μη επαναλαμβανόμενη δειγματοληψία, δηλώνουμε, αντίστοιχα, και ).

Συμπέρασμα 1 . Για ένα δεδομένο επίπεδο εμπιστοσύνης γ, το οριακό σφάλμα δειγματοληψίας είναι ίσο με την t-πλάσια τιμή του μέσου όρου τετραγωνικό σφάλμα, όπου Ф(t) = γ, δηλ.

Συνέπεια 2 . Οι εκτιμήσεις διαστήματος (διαστήματα εμπιστοσύνης) για τον γενικό μέσο όρο και τα γενικά μερίδια μπορούν να βρεθούν χρησιμοποιώντας τους τύπους:

Προσδιορισμός του απαιτούμενου όγκου επαναλαμβανόμενων και μη δειγμάτων κατά την εκτίμηση του γενικού μέσου όρου και της αναλογίας.

Για επιλεκτική παρατήρησηείναι πολύ σημαντικό να ρυθμίσετε σωστά το μέγεθος του δείγματος n, το οποίο καθορίζει σε μεγάλο βαθμό τον απαραίτητο χρόνο, το κόστος εργασίας και το κόστος για τον προσδιορισμό του n, είναι απαραίτητο να ορίσετε την αξιοπιστία (επίπεδο εμπιστοσύνης) της εκτίμησης γ και την ακρίβεια (οριακό σφάλμα δειγματοληψίας) Δ.

Εάν βρεθεί το μέγεθος επαναδειγματοληψίας n, τότε το μέγεθος του αντίστοιχου εκ νέου δείγματος n" μπορεί να προσδιοριστεί από τον τύπο:

Επειδή
, τότε για την ίδια ακρίβεια και αξιοπιστία των εκτιμήσεων, το μέγεθος του μη επαναλαμβανόμενου δείγματος n" είναι πάντα μικρότερο από το μέγεθος του εκ νέου δείγματος n.

Στατιστική υπόθεση και στατιστικός έλεγχος. Σφάλματα 1ου και 2ου είδους. Επίπεδο σημασίας και ισχύς της δοκιμής. Η αρχή της πρακτικής βεβαιότητας.

Ορισμός . Στατιστική υπόθεση Οποιαδήποτε υπόθεση σχετικά με τη μορφή ή τις παραμέτρους ενός άγνωστου νόμου κατανομής ονομάζεται.

Διάκριση μεταξύ απλών και πολύπλοκων στατιστικών υποθέσεων. απλή υπόθεση , σε αντίθεση με τη σύνθετη, καθορίζει πλήρως τη θεωρητική συνάρτηση κατανομής του SW.

Η υπόθεση που πρέπει να ελεγχθεί συνήθως ονομάζεται μηδενικό (ή βασικός ) και συμβολίζουμε H 0 . Μαζί με μηδενική υπόθεσησκεφτείτε εναλλακτική λύση , ή ανταγωνιστικές , η υπόθεση H 1 , η οποία είναι η λογική άρνηση του H 0 . Η μηδενική και η εναλλακτική υπόθεση είναι 2 επιλογές που γίνονται σε προβλήματα ελέγχου στατιστικών υποθέσεων.

Η ουσία του ελέγχου μιας στατιστικής υπόθεσης είναι ότι χρησιμοποιείται ένα ειδικά συγκεντρωμένο χαρακτηριστικό δείγματος (στατιστικές).
, που ελήφθη από το δείγμα
, του οποίου η ακριβής ή κατά προσέγγιση κατανομή είναι γνωστή.

Στη συνέχεια, σύμφωνα με αυτήν την κατανομή δείγματος, προσδιορίζεται η κρίσιμη τιμή - τέτοια ώστε αν η υπόθεση H 0 είναι αληθής, τότε το
μικρό; ώστε σύμφωνα με την αρχή της πρακτικής βεβαιότητας στις συνθήκες της παρούσας μελέτης το γεγονός
μπορεί (με κάποιο ρίσκο) να θεωρηθεί πρακτικά αδύνατο. Επομένως, εάν στη συγκεκριμένη περίπτωση διαπιστωθεί απόκλιση
, τότε η υπόθεση H 0 απορρίπτεται, ενώ η εμφάνιση της τιμής
, θεωρείται συμβατή με την υπόθεση H 0 , η οποία στη συνέχεια γίνεται αποδεκτή (ακριβέστερα, δεν απορρίπτεται). Ο κανόνας με τον οποίο απορρίπτεται ή γίνεται αποδεκτή η υπόθεση H 0 ονομάζεται στατιστικό κριτήριο ή στατιστική δοκιμή .

Η αρχή της πρακτικής βεβαιότητας:

Εάν η πιθανότητα του γεγονότος Α σε ένα δεδομένο τεστ είναι πολύ μικρή, τότε με μία μόνο εκτέλεση του τεστ, μπορείτε να είστε σίγουροι ότι το συμβάν Α δεν θα συμβεί και, πρακτικά, να συμπεριφέρεστε σαν το γεγονός Α να είναι καθόλου αδύνατο.

Έτσι, το σύνολο των πιθανών τιμών της στατιστικής - κριτήριο (κρίσιμη στατιστική) χωρίζεται σε 2 μη επικαλυπτόμενα υποσύνολα: κρίσιμη περιοχή(περιοχή απόρριψης της υπόθεσης) Wκαι εύρος ανοχής(περιοχή αποδοχής της υπόθεσης) . Εάν η πραγματική παρατηρούμενη τιμή του στατιστικού κριτηρίου εμπίπτει στην κρίσιμη περιοχή W, τότε η υπόθεση H 0 απορρίπτεται. Υπάρχουν τέσσερις πιθανές περιπτώσεις:

Ορισμός . Η πιθανότητα α να κάνει λάθος του lου είδους, δηλ. να απορρίψει την υπόθεση H 0 όταν είναι αληθής καλείται επίπεδο σημασίας , ή μέγεθος κριτηρίου .

Η πιθανότητα να γίνει σφάλμα τύπου 2, δηλ. αποδεχτείτε την υπόθεση H 0 όταν είναι εσφαλμένη, συνήθως συμβολίζεται με β.

Ορισμός . Πιθανότητα (1-β) να μην γίνει σφάλμα τύπου 2, δηλ. να απορρίψει την υπόθεση H 0 όταν είναι ψευδής καλείται εξουσία (ή λειτουργία ισχύος ) κριτήρια .

Είναι απαραίτητο να προτιμάτε την κρίσιμη περιοχή στην οποία η ισχύς του κριτηρίου θα είναι η μεγαλύτερη.

Όπως ήδη γνωρίζουμε, η αντιπροσωπευτικότητα είναι ιδιότητα πλαίσιο δειγματοληψίαςπαρουσιάζουν περιγραφή του γενικού. Εάν δεν υπάρχει αντιστοιχία, μιλούν για σφάλμα αντιπροσωπευτικότητας - ο βαθμός απόκλισης της στατιστικής δομής του δείγματος από τη δομή του αντίστοιχου πληθυσμός. Ας υποθέσουμε ότι το μέσο μηνιαίο οικογενειακό εισόδημα των συνταξιούχων στο γενικό πληθυσμό είναι 2 χιλιάδες ρούβλια και στο δείγμα - 6 χιλιάδες ρούβλια. Αυτό σημαίνει ότι ο κοινωνιολόγος πήρε συνεντεύξεις μόνο από το εύπορο μέρος των συνταξιούχων και ένα σφάλμα αντιπροσωπευτικότητας μπήκε στη μελέτη του. Με άλλα λόγια, το σφάλμα αντιπροσωπευτικότητας είναι η ασυμφωνία μεταξύ δύο συνόλων - του γενικού, στο οποίο στρέφεται το θεωρητικό ενδιαφέρον του κοινωνιολόγου και της ιδέας των ιδιοτήτων των οποίων θέλει να αποκτήσει τελικά, και του επιλεκτικού. , στο οποίο κατευθύνεται το πρακτικό ενδιαφέρον του κοινωνιολόγου, που λειτουργεί και ως αντικείμενο εξέτασης και ως μέσο απόκτησης πληροφοριών για τον γενικό πληθυσμό.

Μαζί με τον όρο "σφάλμα αντιπροσωπευτικότητας" στην εγχώρια βιβλιογραφία, μπορείτε να βρείτε ένα άλλο - "σφάλμα δειγματοληψίας". Μερικές φορές χρησιμοποιούνται εναλλακτικά και μερικές φορές χρησιμοποιείται «σφάλμα δειγματοληψίας» αντί για «σφάλμα αντιπροσωπευτικότητας» ως ποσοτικά πιο ακριβής έννοια.

Σφάλμα δειγματοληψίας είναι η απόκλιση των μέσων χαρακτηριστικών του πληθυσμού του δείγματος από τα μέσα χαρακτηριστικά του γενικού πληθυσμού.

Στην πράξη, το σφάλμα δειγματοληψίας προσδιορίζεται συγκρίνοντας τα γνωστά χαρακτηριστικά του πληθυσμού με τα μέσα δείγματος. Στην κοινωνιολογία, οι έρευνες για τον ενήλικο πληθυσμό χρησιμοποιούν συχνότερα δεδομένα από απογραφές πληθυσμού, τρέχοντα στατιστικά αρχεία και αποτελέσματα προηγούμενων ερευνών. Ως παράμετροι ελέγχου χρησιμοποιούνται συνήθως τα κοινωνικοδημογραφικά χαρακτηριστικά. Η σύγκριση των μέσων όρων του γενικού πληθυσμού και του πληθυσμού του δείγματος, με βάση αυτό, ο προσδιορισμός του δειγματοληπτικού σφάλματος και η μείωσή του ονομάζεται έλεγχος αντιπροσωπευτικότητας. Δεδομένου ότι στο τέλος της μελέτης μπορεί να γίνει σύγκριση των δεδομένων ενός ατόμου και άλλων ανθρώπων, αυτή η μέθοδος ελέγχου ονομάζεται εκ των υστέρων, δηλ. πραγματοποιείται μετά από εμπειρία.

Στις δημοσκοπήσεις του Gallup, η αντιπροσωπευτικότητα ελέγχεται από δεδομένα που είναι διαθέσιμα στις εθνικές απογραφές σχετικά με την κατανομή του πληθυσμού ανά φύλο, ηλικία, εκπαίδευση, εισόδημα, επάγγελμα, φυλή, τόπο διαμονής, μέγεθος τοποθεσία. Πανρωσικό Κέντρο Ερευνών κοινή γνώμη(VTsIOM) χρησιμοποιεί για σκοπούς τέτοιους δείκτες όπως φύλο, ηλικία, εκπαίδευση, τύπος οικισμού, οικογενειακή κατάσταση, σφαίρα απασχόλησης, επίσημη ιδιότητα του ερωτώμενου, τα οποία δανείζονται από την Κρατική Επιτροπή Στατιστικής της Ρωσικής Ομοσπονδίας. Και στις δύο περιπτώσεις ο πληθυσμός είναι γνωστός. Δεν μπορεί να διαπιστωθεί σφάλμα δειγματοληψίας εάν οι τιμές της μεταβλητής στο δείγμα και τον πληθυσμό είναι άγνωστες.

Κατά τη διάρκεια της ανάλυσης δεδομένων, οι ειδικοί του VTsIOM διασφαλίζουν τη διεξοδική επισκευή του δείγματος προκειμένου να ελαχιστοποιηθούν οι αποκλίσεις που προέκυψαν κατά τη έρευνα πεδίου. Ιδιαίτερα έντονες μετατοπίσεις παρατηρούνται ως προς το φύλο και την ηλικία. Αυτό εξηγείται από το γεγονός ότι οι γυναίκες και τα άτομα με ανώτερη εκπαίδευσηπερνούν περισσότερο χρόνο στο σπίτι και επικοινωνούν με τον ερευνητή πιο εύκολα. αποτελούν μια εύκολα προσβάσιμη ομάδα σε σύγκριση με τους άνδρες και τα άτομα που είναι «αμόρφωτα»35.

Το δειγματοληπτικό σφάλμα οφείλεται σε δύο παράγοντες: τη μέθοδο δειγματοληψίας και το μέγεθος του δείγματος.

Τα δειγματοληπτικά σφάλματα χωρίζονται σε δύο τύπους - τυχαία και συστηματικά. Το τυχαίο σφάλμα είναι η πιθανότητα ότι ο μέσος όρος του δείγματος θα (ή δεν θα) πέσει έξω από ένα δεδομένο διάστημα. Τα τυχαία σφάλματα περιλαμβάνουν στατιστικά σφάλματα που είναι εγγενή στην ίδια τη μέθοδο δειγματοληψίας. Μειώνονται καθώς αυξάνεται το μέγεθος του δείγματος.

Ο δεύτερος τύπος δειγματοληπτικού σφάλματος είναι συστηματικά λάθη. Αν κάποιος κοινωνιολόγος αποφάσιζε να μάθει τη γνώμη όλων των κατοίκων της πόλης για τα συνεχόμενα τοπικές αρχέςαρχές στην κοινωνική πολιτική, και πήραν συνέντευξη μόνο από όσους έχουν τηλέφωνο, τότε υπάρχει μια σκόπιμη μεροληψία στο δείγμα υπέρ των πλουσίων στρωμάτων, δηλ. συστηματικό λάθος.

Έτσι, τα συστηματικά σφάλματα είναι αποτέλεσμα της δραστηριότητας του ίδιου του ερευνητή. Είναι τα πιο επικίνδυνα, γιατί οδηγούν σε αρκετά σημαντικές προκαταλήψεις στα αποτελέσματα της μελέτης. Τα συστηματικά σφάλματα θεωρούνται χειρότερα από τα τυχαία και επειδή δεν μπορούν να ελεγχθούν και να μετρηθούν.

Προκύπτουν όταν, για παράδειγμα: 1) το δείγμα δεν πληροί τους στόχους της μελέτης (ο κοινωνιολόγος αποφάσισε να μελετήσει μόνο εργαζόμενους συνταξιούχους, αλλά πήρε συνέντευξη από όλους στη σειρά). 2) υπάρχει άγνοια της φύσης του γενικού πληθυσμού (ο κοινωνιολόγος πίστευε ότι το 70% όλων των συνταξιούχων δεν εργάζονται, αλλά αποδείχθηκε ότι μόνο το 10% δεν εργάζεται). 3) επιλέγονται μόνο «νικητές» στοιχεία του γενικού πληθυσμού (για παράδειγμα, μόνο πλούσιοι συνταξιούχοι).

Προσοχή! Σε αντίθεση με τα τυχαία σφάλματα, τα συστηματικά σφάλματα δεν μειώνονται με την αύξηση του μεγέθους του δείγματος.

Συνοψίζοντας όλες τις περιπτώσεις που συμβαίνουν συστηματικά λάθη, οι μεθοδολόγοι συνέταξαν ένα μητρώο αυτών. Πιστεύουν ότι η πηγή των ανεξέλεγκτων προκαταλήψεων στην κατανομή των δειγματοληπτικών παρατηρήσεων μπορεί να είναι τους ακόλουθους παράγοντες:
♦ μεθοδολογικούς και μεθοδολογικούς κανόνες διεξαγωγής κοινωνιολογική έρευνα;
♦ Επιλέχθηκαν ανεπαρκείς μέθοδοι δειγματοληψίας, συλλογή δεδομένων και μέθοδοι υπολογισμού.
♦ Έγινε αντικατάσταση των απαιτούμενων μονάδων παρατήρησης από άλλες, πιο προσιτές.
♦ Διαπιστώθηκε ελλιπής κάλυψη του δειγματοληπτικού πληθυσμού (έλλειψη ερωτηματολογίων, ελλιπής συμπλήρωση ερωτηματολογίων, αδυναμία πρόσβασης σε μονάδες παρατήρησης).

Οι κοινωνιολόγοι σπάνια κάνουν εσκεμμένα λάθη. Τις περισσότερες φορές, προκύπτουν σφάλματα επειδή ο κοινωνιολόγος δεν γνωρίζει καλά τη δομή του γενικού πληθυσμού: την κατανομή των ανθρώπων ανά ηλικία, επάγγελμα, εισόδημα κ.λπ.

Τα συστηματικά σφάλματα είναι πιο εύκολο να αποφευχθούν (σε σύγκριση με τα τυχαία), αλλά είναι πολύ δύσκολο να εξαλειφθούν. Είναι καλύτερο να αποτρέψετε τα συστηματικά σφάλματα προβλέποντας με ακρίβεια τις πηγές τους εκ των προτέρων - στην αρχή της μελέτης.

Ακολουθούν ορισμένοι τρόποι για την αποφυγή σφαλμάτων δειγματοληψίας:
♦ Κάθε μονάδα του γενικού πληθυσμού πρέπει να έχει ίση πιθανότητα να συμπεριληφθεί στο δείγμα.
♦ είναι επιθυμητό να επιλέξετε από ομοιογενείς πληθυσμούς.
♦ Πρέπει να γνωρίζουν τα χαρακτηριστικά του γενικού πληθυσμού.
♦ Τα τυχαία και συστηματικά σφάλματα θα πρέπει να λαμβάνονται υπόψη κατά τη συλλογή του δείγματος.

Εάν το δείγμα (ή απλώς το δείγμα) έχει καταρτιστεί σωστά, τότε ο κοινωνιολόγος αποκτά αξιόπιστα αποτελέσματα που χαρακτηρίζουν ολόκληρο τον πληθυσμό. Εάν έχει συνταχθεί λανθασμένα, τότε το σφάλμα που προέκυψε στο στάδιο της δειγματοληψίας πολλαπλασιάζεται σε κάθε επόμενο στάδιο της κοινωνιολογικής έρευνας και τελικά φτάνει σε μια τιμή που υπερβαίνει την αξία της μελέτης. Λέγεται ότι τέτοιες έρευνες κάνουν περισσότερο κακό παρά καλό.

Τέτοια σφάλματα μπορούν να προκύψουν μόνο με πληθυσμό δείγματος. Για να αποφύγετε ή να μειώσετε την πιθανότητα σφάλματος, ο ευκολότερος τρόπος είναι να αυξήσετε τα μεγέθη του δείγματος (ιδανικά μέχρι το μέγεθος του πληθυσμού: όταν και οι δύο πληθυσμοί ταιριάζουν, το σφάλμα δείγματος θα εξαφανιστεί εντελώς). Από οικονομική άποψη, αυτή η μέθοδος είναι αδύνατη. Υπάρχει ένας άλλος τρόπος - βελτίωση μαθηματικές μεθόδουςδειγματοληψία. Εφαρμόζονται στην πράξη. Αυτό είναι το πρώτο κανάλι διείσδυσης στην κοινωνιολογία των μαθηματικών. Δεύτερο κανάλι - μαθηματική επεξεργασίαδεδομένα.

Ειδικά σημαντικό θέμαΤα σφάλματα γίνονται στην έρευνα μάρκετινγκ, όπου χρησιμοποιούνται όχι πολύ μεγάλα δείγματα. Συνήθως αποτελούν αρκετές εκατοντάδες, λιγότερο συχνά - χίλιους ερωτηθέντες. Εδώ, το σημείο εκκίνησης για τον υπολογισμό του δείγματος είναι το ζήτημα του προσδιορισμού του μεγέθους του πληθυσμού του δείγματος. Το μέγεθος του δείγματος εξαρτάται από δύο παράγοντες: 1) το κόστος συλλογής πληροφοριών και 2) την προσπάθεια για έναν ορισμένο βαθμό στατιστική εγκυρότητααποτελέσματα που ελπίζει να αποκτήσει ο ερευνητής. Φυσικά, ακόμη και άτομα που δεν έχουν εμπειρία στη στατιστική και την κοινωνιολογία κατανοούν διαισθητικά ότι όσο μεγαλύτερο είναι το μέγεθος του δείγματος, δηλ. Όσο πιο κοντά βρίσκονται στο μέγεθος του γενικού πληθυσμού στο σύνολό του, τόσο πιο αξιόπιστα και αξιόπιστα είναι τα δεδομένα που λαμβάνονται. Ωστόσο, έχουμε ήδη μιλήσει παραπάνω για την πρακτική αδυναμία πλήρων ερευνών σε εκείνες τις περιπτώσεις που πραγματοποιούνται σε αντικείμενα των οποίων ο αριθμός υπερβαίνει τις δεκάδες, τις εκατοντάδες χιλιάδες και ακόμη και τα εκατομμύρια. Είναι σαφές ότι το κόστος συλλογής πληροφοριών (συμπεριλαμβανομένης της πληρωμής για την αναπαραγωγή εργαλείων, της εργασίας των ερωτηματολογίων, των διαχειριστών πεδίου και των χειριστών εισαγωγής υπολογιστών) εξαρτάται από το ποσό που είναι διατεθειμένος να διαθέσει ο πελάτης και εξαρτάται ελάχιστα από τους ερευνητές. Ως προς τον δεύτερο παράγοντα, θα σταθούμε σε αυτόν λίγο πιο αναλυτικά.

Επομένως, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερο είναι το πιθανό σφάλμα. Αν και πρέπει να σημειωθεί ότι αν θέλετε να διπλασιάσετε την ακρίβεια, θα πρέπει να αυξήσετε το δείγμα όχι κατά δύο, αλλά κατά τέσσερις φορές. Για παράδειγμα, να κάνετε διπλάσια ακριβής εκτίμησηδεδομένα που λαμβάνονται με συνέντευξη από 400 άτομα, πρέπει να κάνετε συνέντευξη όχι από 800, αλλά από 1600 άτομα. Ωστόσο, είναι απίθανο η έρευνα μάρκετινγκ να χρειάζεται 100% ακρίβεια. Εάν ένας ζυθοποιός πρέπει να ανακαλύψει ποιο ποσοστό των καταναλωτών μπύρας προτιμά το εμπορικό σήμα του και όχι την ποικιλία του ανταγωνιστή του - 60% ή 40%, τότε η διαφορά μεταξύ 57%, 60 ή 63% δεν θα επηρεάσει τα σχέδιά του.

Το δειγματοληπτικό σφάλμα μπορεί να εξαρτάται όχι μόνο από το μέγεθός του, αλλά και από το βαθμό διαφορών μεταξύ των επιμέρους μονάδων στο γενικό πληθυσμό που μελετάμε. Για παράδειγμα, εάν θέλουμε να μάθουμε πόση μπύρα καταναλώνεται, τότε διαπιστώνουμε ότι στον πληθυσμό μας, τα ποσοστά κατανάλωσης για διάφορα άτομαδιαφέρουν σημαντικά (ετερογενής γενικός πληθυσμός). Σε άλλη περίπτωση θα μελετήσουμε την κατανάλωση ψωμιού και θα το διαπιστώσουμε διαφορετικοί άνθρωποιδιαφέρει πολύ λιγότερο σημαντικά (ομογενής πληθυσμός). Όσο μεγαλύτερη είναι η διαφορά (ή η ετερογένεια) στο γενικό πληθυσμό, τόσο μεγαλύτερη είναι η αξία πιθανό σφάλμαδείγματα. Αυτή η κανονικότητα επιβεβαιώνει μόνο ό,τι το απλό ΚΟΙΝΗ ΛΟΓΙΚΗ. Έτσι, όπως σωστά αναφέρει ο V. Yadov, «το μέγεθος (όγκος) του δείγματος εξαρτάται από το επίπεδο ομοιογένειας ή ετερογένειας των υπό μελέτη αντικειμένων. Όσο πιο ομοιογενείς είναι, τόσο μικρότερος είναι ο αριθμός μπορεί να δώσει στατιστικά αξιόπιστα συμπεράσματα.

Ο προσδιορισμός του μεγέθους του δείγματος εξαρτάται επίσης από το επίπεδο του διαστήματος εμπιστοσύνης του επιτρεπόμενου στατιστικού σφάλματος. Εδώ εννοούμε τα λεγόμενα τυχαία σφάλματα, τα οποία σχετίζονται με τη φύση τυχόν στατιστικών σφαλμάτων. ΣΕ ΚΑΙ. Ο Paniotto δίνει τους παρακάτω υπολογισμούς αντιπροσωπευτικό δείγμαμε την υπόθεση σφάλματος 5%:
Αυτό σημαίνει ότι αν, έχοντας πάρει συνέντευξη, ας πούμε, από 400 άτομα σε μια επαρχιακή πόλη, όπου ο ενήλικος πληθυσμός διαλυτών είναι 100 χιλιάδες άτομα, διαπιστώσατε ότι το 33% των ερωτηθέντων αγοραστών προτιμά τα προϊόντα μιας τοπικής μονάδας επεξεργασίας κρέατος, τότε με 95 % πιθανότητα μπορείτε να πείτε ότι το 33+5% (δηλαδή από 28 έως 38%) των κατοίκων αυτής της πόλης είναι τακτικοί αγοραστές αυτών των προϊόντων.

Μπορείτε επίσης να χρησιμοποιήσετε τους υπολογισμούς του Gallup για να υπολογίσετε την αναλογία μεγεθών δειγμάτων και σφαλμάτων δειγματοληψίας.

Επιλεκτική παρατήρηση

Η έννοια της επιλεκτικής παρατήρησης

Μέθοδος δειγματοληψίαςχρησιμοποιείται όταν η χρήση της συνεχούς παρατήρησης είναι φυσικά αδύνατη λόγω του τεράστιου όγκου δεδομένων ή δεν είναι οικονομικά εφικτή. Η φυσική αδυναμία εμφανίζεται, για παράδειγμα, κατά τη μελέτη των ροών επιβατών, των τιμών της αγοράς, των οικογενειακών προϋπολογισμών. Οικονομική αναποτελεσματικότητα εμφανίζεται κατά την αξιολόγηση της ποιότητας των αγαθών που σχετίζονται με την καταστροφή τους. Για παράδειγμα, γευσιγνωσία, δοκιμή τούβλων για αντοχή κ.λπ. Η επιλεκτική παρατήρηση χρησιμοποιείται επίσης για τον έλεγχο των αποτελεσμάτων μιας συνεχούς.

Οι στατιστικές μονάδες που επιλέχθηκαν για παρατήρηση είναι εκλεκτικόςαδρανές ή δείγμα,και ολόκληρη η συστοιχία - γενικόςσετ (GS). Ο αριθμός των μονάδων στο δείγμα συμβολίζεται Π,σε όλο το ΕΣ Ν.Στάση n/nπου ονομάζεται σχετικό μέγεθος ή δείγμα μεριδίου.

Η ποιότητα των αποτελεσμάτων της δειγματοληψίας εξαρτάται από αντιπροσωπευτικότηταδείγματα, δηλ. για το πόσο αντιπροσωπευτικό είναι στο ΕΣ. Για να εξασφαλιστεί η αντιπροσωπευτικότητα του δείγματος, είναι απαραίτητο να τηρηθεί η αρχή της τυχαίας επιλογής μονάδων, η οποία προϋποθέτει ότι η συμπερίληψη μιας μονάδας HS στο δείγμα δεν μπορεί να επηρεαστεί από κανέναν άλλο παράγοντα εκτός από την τύχη.

Μέθοδοι δειγματοληψίας

1. Στην πραγματικότητα τυχαίοεπιλογή: όλες οι μονάδες HS είναι αριθμημένες και οι αριθμοί που κληρώθηκαν αντιστοιχούν στις μονάδες του δείγματος, με τον αριθμό των αριθμών να είναι ίσος με το προγραμματισμένο μέγεθος δείγματος. Στην πράξη, αντί για κλήρωση, χρησιμοποιούνται γεννήτριες τυχαίους αριθμούς. Αυτή η μέθοδοςεπιλογή μπορεί να είναι αλλεπάλληλος(όταν κάθε μονάδα που επιλέγεται στο δείγμα επιστρέφεται στο HS μετά από παρατήρηση και μπορεί να επανεξεταστεί) και ανεπανάληπτο(όταν οι επιθεωρημένες μονάδες στο ΕΣ δεν επιστρέφονται και δεν μπορούν να επανεξεταστούν). Με επαναλαμβανόμενη επιλογή, η πιθανότητα εισόδου στο δείγμα για κάθε μονάδα του HS παραμένει αμετάβλητη και με τη μη επαναλαμβανόμενη επιλογή, αλλάζει (αυξάνεται), αλλά για όσους παραμένουν στο HS αφού επιλεγούν αρκετές μονάδες από αυτό, η πιθανότητα του να μπεις στο δείγμα είναι το ίδιο.

2. Μηχανικόεπιλογή: οι μονάδες πληθυσμού επιλέγονται με σταθερό βήμα N/A. Έτσι, εάν περιέχει έναν γενικό πληθυσμό 100 χιλιάδων μονάδων και απαιτείται να επιλέξετε 1.000 μονάδες, τότε κάθε εκατοστή μονάδα θα εμπίπτει στο δείγμα.

3. στρωματοποιημένοςΗ (στρωματοποιημένη) επιλογή πραγματοποιείται από έναν ετερογενή γενικό πληθυσμό, όταν προηγουμένως χωρίζεται σε ομοιογενείς ομάδες, μετά την οποία η επιλογή των μονάδων από κάθε ομάδα του πληθυσμού του δείγματος πραγματοποιείται τυχαία ή μηχανικά σε αναλογία με τον αριθμό τους στον γενικό πληθυσμό.

4. Κατα συρροη(φωλιασμένη) επιλογή: τυχαία ή μηχανικά, δεν επιλέγονται μεμονωμένες μονάδες, αλλά ορισμένες σειρές (φωλιές), εντός των οποίων πραγματοποιείται συνεχής παρατήρηση.

Μέσο δειγματοληπτικό σφάλμα

Αφού ολοκληρώσουν την επιλογή του απαιτούμενου αριθμού μονάδων στο δείγμα και καταγράψουν τα χαρακτηριστικά αυτών των μονάδων που προβλέπει το πρόγραμμα παρατήρησης, προχωρούν στον υπολογισμό γενικευμένων δεικτών. Περιλαμβάνουν μέση αξίατου υπό μελέτη χαρακτηριστικού και της αναλογίας των μονάδων που έχουν κάποια αξία αυτού του χαρακτηριστικού. Ωστόσο, εάν το HS κάνει πολλά δείγματα, ενώ καθορίζει τα γενικευμένα χαρακτηριστικά τους, τότε μπορεί να διαπιστωθεί ότι οι τιμές τους θα είναι διαφορετικές, επιπλέον, θα διαφέρουν από την πραγματική τους τιμή στο HS, εάν αυτό προσδιορίζεται με συνεχή παρατήρηση . Με άλλα λόγια, τα γενικευτικά χαρακτηριστικά που υπολογίζονται από τα δεδομένα του δείγματος θα διαφέρουν από τις πραγματικές τους τιμές στο HS, επομένως εισάγουμε τα ακόλουθα σύμβολα (Πίνακας 8).

Πίνακας 8 συμβάσεις

Η διαφορά μεταξύ της τιμής των γενικευτικών χαρακτηριστικών του δείγματος και του γενικού πληθυσμού ονομάζεται δειγματοληπτικό σφάλμα,που υποδιαιρείται σε σφάλμα εγγραφήκαι σφάλμα αντιπροσωπευτικότητα. Το πρώτο προκύπτει λόγω λανθασμένων ή ανακριβών πληροφοριών λόγω παρανόησης της ουσίας του θέματος, απροσεξίας του έφορου κατά τη συμπλήρωση ερωτηματολογίων, εντύπων κ.λπ. Είναι αρκετά εύκολο να εντοπιστεί και να διορθωθεί. Το δεύτερο προκύπτει από τη μη συμμόρφωση με την αρχή της τυχαίας επιλογής των μονάδων στο δείγμα. Είναι πιο δύσκολο να εντοπιστεί και να εξαλειφθεί, είναι πολύ μεγαλύτερο από το πρώτο και επομένως η μέτρησή του είναι το κύριο καθήκον της επιλεκτικής παρατήρησης.

Για να μετρηθεί το σφάλμα δειγματοληψίας, το μέσο σφάλμα του προσδιορίζεται από τον τύπο (39) για επανεπιλογήκαι σύμφωνα με τον τύπο (40) - για μη επαναλαμβανόμενα:

= ;(39) = . (40)

Μπορεί να φανεί από τους τύπους (39) και (40) ότι το μέσο σφάλμα είναι μικρότερο για ένα μη επαναλαμβανόμενο δείγμα, γεγονός που καθορίζει την ευρύτερη εφαρμογή του.

Η έννοια και ο υπολογισμός του δειγματοληπτικού σφάλματος.

Το καθήκον της επιλεκτικής παρατήρησης είναι να δώσει σωστές ιδέες για τους συνοπτικούς δείκτες ολόκληρου του πληθυσμού με βάση κάποιο μέρος τους που υποβλήθηκε σε παρατήρηση. Η πιθανή απόκλιση του μεριδίου δείγματος και του μέσου όρου του δείγματος από το μερίδιο και το μέσο όρο στο γενικό πληθυσμό ονομάζεται σφάλμα δειγματοληψίας ή σφάλμα αντιπροσωπευτικότητας. Όσο μεγαλύτερη είναι η τιμή αυτού του σφάλματος, τόσο περισσότερο διαφέρουν οι δείκτες παρατήρησης του δείγματος από εκείνους του γενικού πληθυσμού.

Διαφέρω:

Σφάλματα δειγματοληψίας.

Σφάλματα εγγραφής.

Σφάλματα εγγραφήςσυμβαίνουν όταν ένα γεγονός διαπιστώνεται εσφαλμένα στη διαδικασία παρατήρησης. Είναι χαρακτηριστικά τόσο της συνεχούς παρατήρησης όσο και της επιλεκτικής παρατήρησης, αλλά είναι λιγότερο στην επιλεκτική παρατήρηση.

Η φύση του σφάλματος είναι:

Τεντενιστικός - εσκεμμένος, δηλ. επιλέχθηκαν είτε οι καλύτερες είτε οι χειρότερες μονάδες του πληθυσμού. Σε αυτή την περίπτωση, οι παρατηρήσεις χάνουν το νόημά τους.

Τυχαία - η κύρια οργανωτική αρχή της επιλεκτικής παρατήρησης είναι η αποτροπή της σκόπιμης επιλογής, δηλ. διασφαλίζει την αυστηρή τήρηση της αρχής της τυχαίας επιλογής.

Γενικός κανόναςτυχαία επιλογήείναι: μεμονωμένες μονάδες του γενικού πληθυσμού πρέπει να έχουν ακριβώς τις ίδιες συνθήκες και ευκαιρίες για να εμπίπτουν στον αριθμό των μονάδων που περιλαμβάνονται στο δείγμα. Αυτό χαρακτηρίζει την ανεξαρτησία του αποτελέσματος του δείγματος από τη βούληση του παρατηρητή. Η βούληση του παρατηρητή δημιουργεί τετριμμένα λάθη. Το σφάλμα δειγματοληψίας στην τυχαία επιλογή είναι τυχαίος χαρακτήρας. Χαρακτηρίζει το μέγεθος των αποκλίσεων των γενικών χαρακτηριστικών από τα δείγματα.

Λόγω του γεγονότος ότι τα χαρακτηριστικά στον υπό μελέτη πληθυσμό ποικίλλουν, η σύνθεση των μονάδων στο δείγμα μπορεί να μην συμπίπτει με τη σύνθεση των μονάδων ολόκληρου του πληθυσμού. Αυτό σημαίνει ότι Rκαι δεν ταιριάζουν με Wκαι . Η πιθανή απόκλιση μεταξύ αυτών των χαρακτηριστικών καθορίζεται από το σφάλμα δειγματοληψίας, το οποίο καθορίζεται από τον τύπο:

όπου - γενική διακύμανση.

πού είναι η διακύμανση του δείγματος.

Αυτό δείχνει από πού διαφέρει η γενική απόκλιση διακύμανση δείγματοςεγκαίρως.

Υπάρχει επαναλαμβανόμενη και μη επαναλαμβανόμενη επιλογή. Η ουσία της επανεπιλογής είναι ότι κάθε μονάδα του δείγματος, μετά από παρατήρηση, επιστρέφει στον γενικό πληθυσμό και μπορεί να επανεξεταστεί. Κατά την επαναδειγματοληψία, υπολογίζεται το μέσο σφάλμα δειγματοληψίας:

Για τον δείκτη του μεριδίου ενός εναλλακτικού χαρακτηριστικού, η διακύμανση του δείγματος προσδιορίζεται από τον τύπο:

Στην πράξη, η επανεπιλογή χρησιμοποιείται σπάνια. Με μη επαναλαμβανόμενη επιλογή, το μέγεθος του γενικού πληθυσμού Νμειώνεται κατά τη δειγματοληψία, ο τύπος μέσο σφάλμαδείγματα για ποσοτικό χαρακτηριστικόμοιάζει με:

, έπειτα

Μία από τις πιθανές τιμές στις οποίες μπορεί να είναι το μερίδιο του υπό μελέτη χαρακτηριστικού είναι ίση με:

όπου είναι το σφάλμα δειγματοληψίας του εναλλακτικού χαρακτηριστικού.

Παράδειγμα.

Κατά τη διάρκεια μιας δειγματοληπτικής έρευνας του 10% των προϊόντων μιας παρτίδας τελικών προϊόντων σύμφωνα με τη μέθοδο χωρίς επανεπιλογή, ελήφθησαν τα ακόλουθα δεδομένα για την περιεκτικότητα σε υγρασία στα δείγματα.

Προσδιορισμός Μέσης Υγρασίας %, Διακύμανσης, Μέσης τυπική απόκλιση, με πιθανότητα 0,954 πιθανά όρια, στο οποίο αναμένουμε βλ. % υγρασία όλων των τελικών προϊόντων, με πιθανότητα 0,987 πιθανά όρια ειδικό βάροςτυποποιημένα προϊόντα, υπό την προϋπόθεση ότι η μη τυποποιημένη παρτίδα περιλαμβάνει προϊόντα με περιεκτικότητα σε υγρασία έως 13 και άνω του 19%.

Μόνο με μια ορισμένη πιθανότητα μπορεί να υποστηριχθεί ότι το γενικό μερίδιο του δείγματος και ο γενικός μέσος όρος του δείγματος αποκλίνουν σε tμια φορά.

Στη στατιστική, αυτές οι αποκλίσεις ονομάζονται οριακά δειγματοληπτικά σφάλματα και σημειώνονται.

Η πιθανότητα κρίσεων μπορεί να αυξηθεί ή να μειωθεί tμια φορά. Με πιθανότητα 0,683, με 0,954, με 0,987, τότε οι δείκτες του γενικού πληθυσμού προσδιορίζονται από τους δείκτες του δείγματος.

Το μέσο δειγματοληπτικό σφάλμα δείχνει πόσο η παράμετρος του πληθυσμού του δείγματος αποκλίνει κατά μέσο όρο από την αντίστοιχη παράμετρο του γενικού πληθυσμού. Αν υπολογίσουμε τον μέσο όρο των σφαλμάτων όλων των πιθανών δειγμάτων ένα ορισμένο είδοςδεδομένου όγκου ( n) εξάγεται από τον ίδιο γενικό πληθυσμό, τότε παίρνουμε το γενικευτικό τους χαρακτηριστικό - μέσο δειγματοληπτικό σφάλμα ().

Στη θεωρία της επιλεκτικής παρατήρησης, τύποι για τον προσδιορισμό , οι οποίοι είναι ατομικοί για διαφορετικοί τρόποιεπιλογή (επαναλαμβανόμενη και μη), τύποι δειγμάτων που χρησιμοποιήθηκαν και τύποι εκτιμώμενων στατιστικών δεικτών.

Για παράδειγμα, εάν χρησιμοποιείται επαναλαμβανόμενη τυχαία δειγματοληψία, τότε ορίζεται ως:

Κατά την εκτίμηση της μέσης τιμής ενός χαρακτηριστικού,

Εάν το πρόσημο είναι εναλλακτικό, και το μερίδιο εκτιμάται.

Σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής, οι τύποι τροποποιούνται (1 - n/N):

- για τη μέση τιμή του χαρακτηριστικού·

- για μερίδιο.

Η πιθανότητα να ληφθεί ακριβώς μια τέτοια τιμή σφάλματος είναι πάντα ίση με 0,683. Στην πράξη, είναι προτιμότερο να λαμβάνονται δεδομένα με μεγαλύτερη πιθανότητα, αλλά αυτό οδηγεί σε αύξηση του μεγέθους του δειγματοληπτικού σφάλματος.

οριακό σφάλμαδειγματοληψία () ισούται με t επί του αριθμού των μέσων δειγματοληπτικών σφαλμάτων (στη δειγματοληπτική θεωρία, συνηθίζεται να λέγεται ο συντελεστής t συντελεστής εμπιστοσύνης):

Εάν το σφάλμα δειγματοληψίας διπλασιαστεί (t = 2), τότε έχουμε πολύ μεγαλύτερη πιθανότητα ότι δεν θα υπερβεί ένα ορισμένο όριο (στην περίπτωσή μας, διπλάσιο του μέσου σφάλματος) - 0,954. Εάν πάρουμε t \u003d 3, τότε το επίπεδο εμπιστοσύνης θα είναι 0,997 - πρακτικά βεβαιότητα.

Το οριακό επίπεδο σφάλματος δειγματοληψίας εξαρτάται από τους ακόλουθους παράγοντες:

ο βαθμός διακύμανσης των μονάδων του γενικού πληθυσμού·
το μέγεθος του δείγματος;
επιλεγμένα σχήματα επιλογής (η μη επαναλαμβανόμενη επιλογή δίνει μικρότερη τιμή σφάλματος).
επίπεδο αυτοπεποίθησης.

Εάν το μέγεθος του δείγματος είναι μεγαλύτερο από 30, τότε η τιμή του t προσδιορίζεται από τον πίνακα κανονική κατανομή, αν είναι λιγότερο - σύμφωνα με τον πίνακα κατανομής του Μαθητή.

Ακολουθούν ορισμένες τιμές του συντελεστή εμπιστοσύνης από τον πίνακα κανονικής κατανομής.

Το διάστημα εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού και για την αναλογία στον γενικό πληθυσμό ορίζεται ως εξής:

Έτσι, ο ορισμός των ορίων του γενικού μέσου όρου και του μεριδίου αποτελείται από τα ακόλουθα βήματα:

Σφάλματα δειγματοληψίας στο διάφοροι τύποιεπιλογή

Στην πραγματικότητα τυχαία και μηχανική δειγματοληψία. Το μέσο σφάλμα της πραγματικής τυχαίας και μηχανικής δειγματοληψίας βρίσκεται χρησιμοποιώντας τους τύπους που παρουσιάζονται στον Πίνακα. 11.3.

Παράδειγμα 11.2. Για τη μελέτη του επιπέδου απόδοσης των περιουσιακών στοιχείων, πραγματοποιήθηκε δειγματοληπτική έρευνα σε 90 επιχειρήσεις από τις 225 με τη μέθοδο της τυχαίας επαναδειγματοληψίας, ως αποτέλεσμα της οποίας προέκυψαν τα στοιχεία που παρουσιάζονται στον πίνακα.

Σε αυτό το παράδειγμα, έχουμε ένα δείγμα 40% (90: 225 = 0,4 ή 40%). Ας προσδιορίσουμε το οριακό του σφάλμα και τα όρια για τη μέση τιμή του χαρακτηριστικού στο γενικό πληθυσμό με τα βήματα του αλγορίθμου:

Με βάση τα αποτελέσματα της δειγματοληπτικής έρευνας, υπολογίζουμε τη μέση τιμή και τη διακύμανση στον πληθυσμό του δείγματος:

Πίνακας 11.5.

Αποτελέσματα παρατήρησης			Εκτιμώμενες τιμές
απόδοση περιουσιακών στοιχείων, τρίψιμο, x i	αριθμός επιχειρήσεων, f i	μέσο του διαστήματος, x i \xb4	x i \xb4 f i	x i \xb4 2 f i
Έως 1,4	13	1,3	16,9	21,97
1,4-1,6	15	1,5	22,5	33,75
1,6-1,8	17	1,7	28,9	49,13
1,8-2,0	15	1,9	28,5	54,15
2,0-2,2	16	2,1	33,6	70,56
2.2 και πάνω	14	2,3	32,2	74,06
Σύνολο	90	-	162,6	303,62

Δείγμα μέσου όρου

Δειγματική διακύμανση του υπό μελέτη χαρακτηριστικού

Για τα δεδομένα μας, ορίζουμε το οριακό δειγματοληπτικό σφάλμα, για παράδειγμα, με πιθανότητα 0,954. Σύμφωνα με τον πίνακα των τιμών πιθανότητας της συνάρτησης κανονικής κατανομής (βλ. απόσπασμα από αυτήν που δίνεται στο Παράρτημα 1), βρίσκουμε την τιμή του συντελεστή εμπιστοσύνης t που αντιστοιχεί στην πιθανότητα 0,954. Με πιθανότητα 0,954, ο συντελεστής t είναι 2.

Έτσι, σε 954 περιπτώσεις από τις 1000, η μέση απόδοση των περιουσιακών στοιχείων δεν θα υπερβαίνει τα 1,88 ρούβλια. και όχι λιγότερο από 1,74 ρούβλια.

Παραπάνω, χρησιμοποιήθηκε ένα επαναλαμβανόμενο σχήμα τυχαίας επιλογής. Ας δούμε αν αλλάζουν τα αποτελέσματα της έρευνας αν υποθέσουμε ότι η επιλογή πραγματοποιήθηκε σύμφωνα με το σχήμα μη επαναλαμβανόμενης επιλογής. Σε αυτήν την περίπτωση, το μέσο σφάλμα υπολογίζεται χρησιμοποιώντας τον τύπο

Τότε, με πιθανότητα ίση με 0,954, το οριακό σφάλμα δειγματοληψίας θα είναι:

Τα όρια εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής θα έχουν τις ακόλουθες τιμές:

Συγκρίνοντας τα αποτελέσματα των δύο σχημάτων επιλογής, μπορούμε να συμπεράνουμε ότι η χρήση της μη επαναλαμβανόμενης τυχαίας δειγματοληψίας δίνει περισσότερα ακριβή αποτελέσματασε σύγκριση με την εφαρμογή επαναλαμβανόμενης επιλογής στο ίδιο επίπεδο εμπιστοσύνης. Ταυτόχρονα, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο πιο σημαντικά στενεύουν τα όρια των μέσων τιμών κατά τη μετάβαση από το ένα σχήμα επιλογής στο άλλο.

Σύμφωνα με το παράδειγμα, καθορίζουμε τα όρια του μεριδίου των επιχειρήσεων με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει την αξία των 2,0 ρούβλια στο γενικό πληθυσμό:

Ας υπολογίσουμε το ποσοστό δειγματοληψίας.

Ο αριθμός των επιχειρήσεων στο δείγμα με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια είναι 60 μονάδες. Επειτα

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

υπολογίστε τη διακύμανση του μεριδίου στον πληθυσμό του δείγματος

μέσο σφάλμα δειγματοληψίας κατά τη χρήση επανασχεδιασμόςεπιλογή θα γίνει

Εάν υποθέσουμε ότι χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο σχήμα επιλογής, τότε το μέσο δειγματοληπτικό σφάλμα, λαμβάνοντας υπόψη τη διόρθωση για το πεπερασμένο του πληθυσμού, θα είναι

ορίζουμε την πιθανότητα εμπιστοσύνης και προσδιορίζουμε το οριακό δειγματοληπτικό σφάλμα.

Με τιμή πιθανότητας P = 0,997, σύμφωνα με τον πίνακα κανονικής κατανομής, λαμβάνουμε την τιμή για τον συντελεστή εμπιστοσύνης t = 3 (βλ. απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1):

Έτσι, με πιθανότητα 0,997, μπορεί να υποστηριχθεί ότι στον γενικό πληθυσμό το μερίδιο των επιχειρήσεων με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια δεν είναι λιγότερο από 54,7% και όχι περισσότερο από 78,7%.

Τυπικό δείγμα. Με ένα τυπικό δείγμα, ο γενικός πληθυσμός των αντικειμένων χωρίζεται σε k ομάδες, λοιπόν

N 1 + N 2 + ... + N i + ... + N k = N.

Ο όγκος των μονάδων που εξάγονται από κάθε τυπική ομάδα εξαρτάται από τη μέθοδο επιλογής που υιοθετείται. τους σύνολοσχηματίζει το απαιτούμενο μέγεθος δείγματος

n 1 + n 2 + … + n i + … + n k = n.

Υπάρχουν οι ακόλουθοι δύο τρόποι οργάνωσης της επιλογής σε μια τυπική ομάδα: ανάλογος με τον όγκο των τυπικών ομάδων και ανάλογος με τον βαθμό διακύμανσης των τιμών του χαρακτηριστικού σε μονάδες παρατήρησης σε ομάδες. Εξετάστε το πρώτο από αυτά, ως το πιο συχνά χρησιμοποιούμενο.

Η επιλογή ανάλογη με το μέγεθος των τυπικών ομάδων προϋποθέτει ότι σε καθεμία από αυτές θα επιλεγεί επόμενος αριθμόςπληθυσμιακές μονάδες:

n = n i N i /N

όπου n i είναι ο αριθμός των εξαγώγιμων μονάδων για ένα δείγμα από την i-η τυπική ομάδα.

n είναι το συνολικό μέγεθος του δείγματος.

N i - ο αριθμός των μονάδων του γενικού πληθυσμού που αποτελούσαν την i-η τυπική ομάδα.

N είναι ο συνολικός αριθμός μονάδων στο γενικό πληθυσμό.

Η επιλογή των μονάδων εντός των ομάδων γίνεται με τη μορφή τυχαίας ή μηχανικής δειγματοληψίας.

Οι τύποι για την εκτίμηση του μέσου δειγματοληπτικού σφάλματος για τον μέσο όρο και το μερίδιο παρουσιάζονται στον Πίνακα. 11.6.

Εδώ είναι ο μέσος όρος του ομαδικές διακυμάνσειςτυπικές ομάδες.

Παράδειγμα 11.3. Μια δειγματοληπτική έρευνα φοιτητών πραγματοποιήθηκε σε ένα από τα πανεπιστήμια της Μόσχας προκειμένου να προσδιοριστεί ο δείκτης της μέσης παρακολούθησης της πανεπιστημιακής βιβλιοθήκης από έναν φοιτητή ανά εξάμηνο. Για αυτό χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο τυπικό δείγμα 5%, οι τυπικές ομάδες του οποίου αντιστοιχούν στον αριθμό του μαθήματος. Κατά την επιλογή, ανάλογα με τον όγκο των τυπικών ομάδων, ελήφθησαν τα ακόλουθα δεδομένα:

Πίνακας 11.7.

Αριθμός μαθήματος	Σύνολο μαθητών, ατόμων, N i	Εξετάστηκε ως αποτέλεσμα επιλεκτικής παρατήρησης, άτομα, n i	Μέσος αριθμός επισκέψεων στη βιβλιοθήκη ανά φοιτητή ανά εξάμηνο, x i	Διακύμανση δείγματος εντός ομάδας,
1	650	33	11	6
2	610	31	8	15
3	580	29	5	18
4	360	18	6	24
5	350	17	10	12
Σύνολο	2 550	128	8	-

Ο αριθμός των μαθητών που θα εξεταστούν σε κάθε μάθημα υπολογίζεται ως εξής:

παρόμοια για άλλες ομάδες:

Η κατανομή των μέσων τιμών του δείγματος έχει πάντα κανονικός νόμοςκατανομή (ή την προσεγγίζει) για n > 100, ανεξάρτητα από τη φύση της κατανομής του πληθυσμού. Ωστόσο, στην περίπτωση των μικρών δειγμάτων, ισχύει διαφορετικός νόμος διανομής - Κατανομή μαθητή. Σε αυτήν την περίπτωση, ο συντελεστής εμπιστοσύνης βρίσκεται σύμφωνα με τον πίνακα κατανομής t του Student, ανάλογα με την τιμή της πιθανότητας εμπιστοσύνης P και το μέγεθος του δείγματος n. Το Παράρτημα 1 παρέχει ένα τμήμα του πίνακα κατανομής t του Student, που παρουσιάζεται ως εξάρτηση της πιθανότητας εμπιστοσύνης στο μέγεθος του δείγματος και του συντελεστή εμπιστοσύνης t.

Παράδειγμα 11.4. Ας υποθέσουμε ότι μια δειγματοληπτική έρευνα οκτώ φοιτητών της ακαδημίας έδειξε ότι κατά την προετοιμασία για εργασίες ελέγχουσύμφωνα με στατιστικά στοιχεία, πέρασαν τον ακόλουθο αριθμό ωρών: 8,5; 8.0; 7.8; 9.0; 7.2; 6.2; 8.4; 6.6.

Παράδειγμα 11.5. Ας υπολογίσουμε πόσα από τα 507 βιομηχανικές επιχειρήσειςθα πρέπει να ελεγχθεί η εφορία για να προσδιοριστεί το μερίδιο των επιχειρήσεων με φορολογικές παραβάσεις με πιθανότητα 0,997. Σύμφωνα με την προηγούμενη παρόμοια έρευνα, η τιμή της τυπικής απόκλισης ήταν 0,15. το μέγεθος του σφάλματος δειγματοληψίας δεν αναμένεται να είναι μεγαλύτερο από 0,05.

Όταν χρησιμοποιείτε επαναλαμβανόμενη τυχαία επιλογή, ελέγξτε

Σε μη επαναλαμβανόμενη τυχαία επιλογή, θα πρέπει να γίνει έλεγχος

Όπως μπορείτε να δείτε, η χρήση της μη επαναλαμβανόμενης δειγματοληψίας σας επιτρέπει να διεξάγετε μια έρευνα σε μεγάλο βαθμό λιγότεροιαντικείμενα.

Παράδειγμα 11.6. Προγραμματίζεται έρευνα μισθοίστις επιχειρήσεις του κλάδου με τη μέθοδο της τυχαίας μη επαναλαμβανόμενης επιλογής. Ποιο θα πρέπει να είναι το μέγεθος του δείγματος εάν τη στιγμή της έρευνας ο αριθμός των απασχολουμένων στον κλάδο ήταν 100.000 άτομα; Το οριακό σφάλμα δειγματοληψίας δεν πρέπει να υπερβαίνει τα 100 ρούβλια. με πιθανότητα 0,954. Με βάση τα αποτελέσματα προηγούμενων ερευνών για τους μισθούς στον κλάδο, είναι γνωστό ότι η τυπική απόκλιση είναι 500 ρούβλια.

Επομένως, για να λυθεί το πρόβλημα, είναι απαραίτητο να συμπεριληφθούν τουλάχιστον 100 άτομα στο δείγμα.

Σχετικά δειγματοληπτικά σφάλματα. Δείγματα τύπων μέσου σφάλματος

Προσδιορισμός του απαιτούμενου όγκου επαναλαμβανόμενων και μη δειγμάτων κατά την εκτίμηση του γενικού μέσου όρου και της αναλογίας.

Στατιστική υπόθεση και στατιστικός έλεγχος. Σφάλματα 1ου και 2ου είδους. Επίπεδο σημασίας και ισχύς της δοκιμής. Η αρχή της πρακτικής βεβαιότητας.