Το μέσο τετραγωνικό σφάλμα του δείγματος είναι μεγαλύτερο από. Μέσο τετράγωνο δείγμα τυπικού σφάλματος εξήγηση για

Το μέσο σφάλμα δείγματος δείχνει πόσο αποκλίνει η παράμετρος κατά μέσο όρο πλαίσιο δειγματοληψίαςαπό την αντίστοιχη γενική παράμετρο. Αν υπολογίσουμε τον μέσο όρο των σφαλμάτων όλων των πιθανών δειγμάτων ένα ορισμένο είδοςδεδομένου όγκου ( n) εξάγεται από τον ίδιο γενικό πληθυσμό, τότε παίρνουμε το γενικευτικό τους χαρακτηριστικό - μέσο δειγματοληπτικό σφάλμα ().

Στη θεωρία της επιλεκτικής παρατήρησης, τύποι για τον προσδιορισμό , οι οποίοι είναι ατομικοί για διαφορετικοί τρόποιεπιλογή (επαναλαμβανόμενη και μη), τύποι δειγμάτων που χρησιμοποιήθηκαν και τύποι εκτιμώμενων στατιστικών δεικτών.

Για παράδειγμα, εάν χρησιμοποιείται επαναλαμβανόμενη σωστή τυχαία δειγματοληψία, τότε ορίζεται ως:

Κατά την εκτίμηση της μέσης τιμής ενός χαρακτηριστικού,

Εάν το πρόσημο είναι εναλλακτικό, και το μερίδιο εκτιμάται.

Σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής, οι τύποι τροποποιούνται (1 - n/N):

- για τη μέση τιμή του χαρακτηριστικού·

- για μερίδιο.

Η πιθανότητα να ληφθεί ακριβώς μια τέτοια τιμή σφάλματος είναι πάντα ίση με 0,683. Στην πράξη, είναι προτιμότερο να λαμβάνονται δεδομένα με μεγαλύτερη πιθανότητα, αλλά αυτό οδηγεί σε αύξηση του μεγέθους του δειγματοληπτικού σφάλματος.

Το οριακό σφάλμα δειγματοληψίας () είναι ίσο με t επί του αριθμού των μέσων δειγματοληπτικών σφαλμάτων (στη θεωρία δειγματοληψίας, συνηθίζεται να ονομάζουμε τον συντελεστή t συντελεστή εμπιστοσύνης):

Εάν το σφάλμα δειγματοληψίας διπλασιαστεί (t = 2), τότε έχουμε πολύ μεγαλύτερη πιθανότητα να μην υπερβεί ένα ορισμένο όριο (στην περίπτωσή μας, διπλάσιο μέσο σφάλμα) - 0,954. Αν πάρουμε t = 3, τότε επίπεδο αυτοπεποίθησηςθα είναι 0,997 - πρακτικά βεβαιότητα.

Επίπεδο οριακό σφάλμαΗ δειγματοληψία εξαρτάται από τους ακόλουθους παράγοντες:

ο βαθμός διακύμανσης των μονάδων του γενικού πληθυσμού·
το μέγεθος του δείγματος;
επιλεγμένα σχήματα επιλογής (η μη επαναλαμβανόμενη επιλογή δίνει μικρότερη τιμή σφάλματος).
επίπεδο αυτοπεποίθησης.

Εάν το μέγεθος του δείγματος είναι μεγαλύτερο από 30, τότε η τιμή του t προσδιορίζεται από τον πίνακα κανονικής κατανομής, εάν είναι μικρότερος - από τον πίνακα κατανομής του Student.

Ακολουθούν ορισμένες τιμές του συντελεστή εμπιστοσύνης από τον πίνακα κανονικής κατανομής.

Το διάστημα εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού και για την αναλογία στον γενικό πληθυσμό ορίζεται ως εξής:

Έτσι, ο ορισμός των ορίων του γενικού μέσου όρου και του μεριδίου αποτελείται από τα ακόλουθα βήματα:

Σφάλματα δειγματοληψίας στο διάφοροι τύποιεπιλογή

Στην πραγματικότητα τυχαία και μηχανική δειγματοληψία. Το μέσο σφάλμα της πραγματικής τυχαίας και μηχανικής δειγματοληψίας βρίσκονται από τους τύπους που παρουσιάζονται στον Πίνακα. 11.3.

Παράδειγμα 11.2. Για τη μελέτη του επιπέδου απόδοσης των περιουσιακών στοιχείων, πραγματοποιήθηκε δειγματοληπτική έρευνα σε 90 επιχειρήσεις από τις 225 με τη μέθοδο της τυχαίας. επαναδειγματοληψία, από το οποίο προέκυψαν τα στοιχεία που παρουσιάζονται στον πίνακα.

Σε αυτό το παράδειγμα, έχουμε ένα δείγμα 40% (90: 225 = 0,4 ή 40%). Ας προσδιορίσουμε το οριακό του σφάλμα και τα όρια για τη μέση τιμή του χαρακτηριστικού στο γενικό πληθυσμό με τα βήματα του αλγορίθμου:

Με βάση τα αποτελέσματα της δειγματοληπτικής έρευνας, υπολογίζουμε τη μέση τιμή και τη διακύμανση στον πληθυσμό του δείγματος:

Πίνακας 11.5.

Αποτελέσματα παρατήρησης			Εκτιμώμενες τιμές
απόδοση περιουσιακών στοιχείων, τρίψιμο, x i	αριθμός επιχειρήσεων, f i	μέσο του διαστήματος, x i \xb4	x i \xb4 f i	x i \xb4 2 f i
Έως 1,4	13	1,3	16,9	21,97
1,4-1,6	15	1,5	22,5	33,75
1,6-1,8	17	1,7	28,9	49,13
1,8-2,0	15	1,9	28,5	54,15
2,0-2,2	16	2,1	33,6	70,56
2.2 και άνω	14	2,3	32,2	74,06
Σύνολο	90	-	162,6	303,62

Δείγμα μέσου όρου

Δειγματική διακύμανση του υπό μελέτη χαρακτηριστικού

Για τα δεδομένα μας, ορίζουμε το οριακό δειγματοληπτικό σφάλμα, για παράδειγμα, με πιθανότητα 0,954. Σύμφωνα με τον πίνακα των τιμών πιθανότητας της συνάρτησης κανονικής κατανομής (δείτε ένα απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1), βρίσκουμε την τιμή του συντελεστή εμπιστοσύνης t που αντιστοιχεί στην πιθανότητα 0,954. Με πιθανότητα 0,954, ο συντελεστής t είναι 2.

Έτσι, σε 954 περιπτώσεις από τις 1000, η μέση απόδοση των περιουσιακών στοιχείων δεν θα υπερβαίνει τα 1,88 ρούβλια. και όχι λιγότερο από 1,74 ρούβλια.

Παραπάνω, χρησιμοποιήθηκε ένα επαναλαμβανόμενο σχήμα τυχαίας επιλογής. Ας δούμε αν αλλάζουν τα αποτελέσματα της έρευνας αν υποθέσουμε ότι η επιλογή πραγματοποιήθηκε σύμφωνα με το σχήμα μη επαναλαμβανόμενης επιλογής. Σε αυτήν την περίπτωση, το μέσο σφάλμα υπολογίζεται χρησιμοποιώντας τον τύπο

Τότε, με πιθανότητα ίση με 0,954, το οριακό σφάλμα δειγματοληψίας θα είναι:

Τα όρια εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής θα έχουν τις ακόλουθες τιμές:

Συγκρίνοντας τα αποτελέσματα των δύο σχημάτων επιλογής, μπορούμε να συμπεράνουμε ότι η χρήση της μη επαναλαμβανόμενης τυχαίας δειγματοληψίας δίνει πιο ακριβή αποτελέσματα σε σύγκριση με τη χρήση επαναλαμβανόμενης επιλογής με το ίδιο επίπεδο εμπιστοσύνης. Ταυτόχρονα, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο πιο σημαντικά στενεύουν τα όρια των μέσων τιμών κατά τη μετάβαση από το ένα σχήμα επιλογής στο άλλο.

Σύμφωνα με το παράδειγμα, καθορίζουμε τα όρια του μεριδίου των επιχειρήσεων με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια στο γενικό πληθυσμό:

Ας υπολογίσουμε το ποσοστό δειγματοληψίας.

Ο αριθμός των επιχειρήσεων στο δείγμα με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια είναι 60 μονάδες. Επειτα

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

υπολογίστε τη διακύμανση του μεριδίου στον πληθυσμό του δείγματος

μέσο σφάλμα δειγματοληψίας κατά τη χρήση επανασχεδιασμόςεπιλογή θα γίνει

Εάν υποθέσουμε ότι χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο σχήμα επιλογής, τότε το μέσο δειγματοληπτικό σφάλμα, λαμβάνοντας υπόψη τη διόρθωση για το πεπερασμένο του πληθυσμού, θα είναι

ορίζουμε την πιθανότητα εμπιστοσύνης και προσδιορίζουμε το οριακό δειγματοληπτικό σφάλμα.

Με τιμή πιθανότητας P = 0,997, σύμφωνα με τον πίνακα κανονικής κατανομής, λαμβάνουμε την τιμή για τον συντελεστή εμπιστοσύνης t = 3 (βλ. απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1):

Έτσι, με πιθανότητα 0,997, μπορεί να υποστηριχθεί ότι στον γενικό πληθυσμό το μερίδιο των επιχειρήσεων με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια δεν είναι λιγότερο από 54,7% και όχι περισσότερο από 78,7%.

Τυπικό δείγμα. Με τυπικό δείγμα πληθυσμόςτα αντικείμενα χωρίζονται σε k ομάδες, λοιπόν

N 1 + N 2 + ... + N i + ... + N k = N.

Ο όγκος των μονάδων που εξάγονται από κάθε τυπική ομάδα εξαρτάται από τη μέθοδο επιλογής που υιοθετείται. τους σύνολοσχηματίζει το απαιτούμενο μέγεθος δείγματος

n 1 + n 2 + … + n i + … + n k = n.

Υπάρχουν οι ακόλουθοι δύο τρόποι οργάνωσης της επιλογής σε μια τυπική ομάδα: ανάλογος με τον όγκο των τυπικών ομάδων και ανάλογος με τον βαθμό διακύμανσης των τιμών του χαρακτηριστικού σε μονάδες παρατήρησης σε ομάδες. Εξετάστε το πρώτο από αυτά, ως το πιο συχνά χρησιμοποιούμενο.

Η επιλογή ανάλογη με το μέγεθος των τυπικών ομάδων προϋποθέτει ότι σε καθεμία από αυτές θα επιλεγεί επόμενος αριθμόςπληθυσμιακές μονάδες:

n = n i N i /N

όπου n i είναι ο αριθμός των εξαγώγιμων μονάδων για ένα δείγμα από την i-η τυπική ομάδα.

n είναι το συνολικό μέγεθος του δείγματος.

N i - ο αριθμός των μονάδων του γενικού πληθυσμού που αποτελούσαν την i-η τυπική ομάδα.

N είναι ο συνολικός αριθμός μονάδων στο γενικό πληθυσμό.

Η επιλογή των μονάδων εντός των ομάδων γίνεται με τη μορφή τυχαίας ή μηχανικής δειγματοληψίας.

Οι τύποι για την εκτίμηση του μέσου δειγματοληπτικού σφάλματος για τον μέσο όρο και το μερίδιο παρουσιάζονται στον Πίνακα. 11.6.

Εδώ, είναι ο μέσος όρος των ομαδικών διακυμάνσεων των τυπικών ομάδων.

Παράδειγμα 11.3. Διεξήχθη επιλεκτική έρευνα φοιτητών σε ένα από τα πανεπιστήμια της Μόσχας προκειμένου να προσδιοριστεί ο δείκτης της μέσης παρακολούθησης της πανεπιστημιακής βιβλιοθήκης κατά έναν φοιτητή ανά εξάμηνο. Για αυτό χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο τυπικό δείγμα 5%, οι τυπικές ομάδες του οποίου αντιστοιχούν στον αριθμό του μαθήματος. Κατά την επιλογή, ανάλογα με τον όγκο των τυπικών ομάδων, ελήφθησαν τα ακόλουθα δεδομένα:

Πίνακας 11.7.

Αριθμός μαθήματος	Σύνολο μαθητών, ατόμων, N i	Εξετάστηκε ως αποτέλεσμα επιλεκτικής παρατήρησης, άτομα, n i	Μέσος αριθμός επισκέψεων στη βιβλιοθήκη ανά φοιτητή ανά εξάμηνο, x i	Διακύμανση δείγματος εντός ομάδας,
1	650	33	11	6
2	610	31	8	15
3	580	29	5	18
4	360	18	6	24
5	350	17	10	12
Σύνολο	2 550	128	8	-

Ο αριθμός των φοιτητών που θα εξεταστούν σε κάθε μάθημα υπολογίζεται ως εξής:

παρόμοια για άλλες ομάδες:

Η κατανομή των τιμών των μέσων δείγματος έχει πάντα έναν κανονικό νόμο κατανομής (ή τον προσεγγίζει) για n > 100, ανεξάρτητα από τη φύση της κατανομής του γενικού πληθυσμού. Ωστόσο, στην περίπτωση των μικρών δειγμάτων, ισχύει διαφορετικός νόμος διανομής - Κατανομή μαθητή. Σε αυτήν την περίπτωση, ο συντελεστής εμπιστοσύνης βρίσκεται σύμφωνα με τον πίνακα κατανομής t του Student, ανάλογα με την τιμή της πιθανότητας εμπιστοσύνης P και το μέγεθος του δείγματος n. Το Παράρτημα 1 παρέχει ένα τμήμα του πίνακα κατανομής t του Student, που παρουσιάζεται ως εξάρτηση της πιθανότητας εμπιστοσύνης στο μέγεθος του δείγματος και του συντελεστή εμπιστοσύνης t.

Παράδειγμα 11.4. Ας υποθέσουμε ότι μια δειγματοληπτική έρευνα οκτώ φοιτητών της ακαδημίας έδειξε ότι κατά την προετοιμασία για εργασίες ελέγχουσύμφωνα με στατιστικά στοιχεία, πέρασαν τον ακόλουθο αριθμό ωρών: 8,5; 8.0; 7.8; 9.0; 7.2; 6.2; 8.4; 6.6.

Παράδειγμα 11.5. Ας υπολογίσουμε πόσα από τα 507 βιομηχανικές επιχειρήσειςθα πρέπει να ελεγχθεί η εφορία για να προσδιοριστεί το μερίδιο των επιχειρήσεων με φορολογικές παραβάσεις με πιθανότητα 0,997. Σύμφωνα με την προηγούμενη παρόμοια έρευνα, η τιμή της τυπικής απόκλισης ήταν 0,15. το μέγεθος του σφάλματος δειγματοληψίας δεν αναμένεται να είναι μεγαλύτερο από 0,05.

Όταν χρησιμοποιείτε επαναλαμβανόμενη τυχαία επιλογή, ελέγξτε

Σε μη επαναλαμβανόμενη τυχαία επιλογή, θα πρέπει να γίνει έλεγχος

Όπως μπορείτε να δείτε, η χρήση της μη επαναλαμβανόμενης δειγματοληψίας σας επιτρέπει να διεξάγετε μια έρευνα σε μεγάλο βαθμό λιγότεροιαντικείμενα.

Παράδειγμα 11.6. Προγραμματίζεται έρευνα μισθοίστις επιχειρήσεις του κλάδου με τη μέθοδο της τυχαίας μη επαναλαμβανόμενης επιλογής. Ποιο θα πρέπει να είναι το μέγεθος του δείγματος εάν κατά τη στιγμή της έρευνας ο αριθμός των απασχολουμένων στον κλάδο ήταν 100.000 άτομα; Το οριακό σφάλμα δειγματοληψίας δεν πρέπει να υπερβαίνει τα 100 ρούβλια. με πιθανότητα 0,954. Από προηγούμενες έρευνες για τους μισθούς στον κλάδο, είναι γνωστό ότι ο μέσος τυπική απόκλισηείναι 500 ρούβλια.

Επομένως, για να λυθεί το πρόβλημα, είναι απαραίτητο να συμπεριληφθούν τουλάχιστον 100 άτομα στο δείγμα.

Η ασυμφωνία μεταξύ των τιμών των δεικτών που λαμβάνονται από το δείγμα και των αντίστοιχων παραμέτρων του γενικού πληθυσμού ονομάζεται σφάλμα αντιπροσωπευτικότητας. Διακρίνετε μεταξύ συστηματικών και τυχαία σφάλματαδείγματα.

Τυχαία σφάλματα δεν εξηγείται αρκετά ενιαία εκπροσώπησησε ένα δειγματοληπτικό σύνολο διαφορετικών κατηγοριών μονάδων του γενικού πληθυσμού.

Συστηματικά λάθη μπορεί να σχετίζεται με παραβίαση των κανόνων επιλογής ή των προϋποθέσεων για την εφαρμογή του δείγματος.

Έτσι, κατά την αποτύπωση των προϋπολογισμών των νοικοκυριών, το πλαίσιο δειγματοληψίας κατασκευάστηκε για περισσότερα από 40 χρόνια με βάση την αρχή της εδαφικής-τομεακής επιλογής, η οποία οφειλόταν στον κύριο στόχο της δημοσιονομικής έρευνας - να χαρακτηρίσει το βιοτικό επίπεδο των εργαζομένων, των εργαζομένων. και τους συλλογικούς αγρότες. Το δείγμα κατανεμήθηκε μεταξύ των περιοχών και των τομέων της οικονομίας της RSFSR σε αναλογία με συνολική δύναμηαπασχολούνται? Για τη δημιουργία ενός δείγματος βιομηχανίας, χρησιμοποιήθηκε ένα τυπικό δείγμα με μηχανική επιλογή μονάδων εντός ομάδων.

Το κύριο κριτήριο επιλογής ήταν ο μέσος μηνιαίος μισθός. Η αρχή της επιλογής εξασφάλιζε την αναλογική εκπροσώπηση στο δείγμα εργαζομένων με διαφορετικά επίπεδα μισθών.

Με την έλευση του νέου Κοινωνικές Ομάδες(επιχειρηματίες, αγρότες, άνεργοι), η αντιπροσωπευτικότητα του δείγματος παραβιάστηκε όχι μόνο λόγω διαφορών με τη δομή του γενικού πληθυσμού, αλλά και λόγω συστηματικού σφάλματος που προέκυψε λόγω αναντιστοιχίας μεταξύ της μονάδας δειγματοληψίας (εργαζόμενος) και του μονάδα παρατήρησης (νοικοκυριό). Ένα νοικοκυριό με περισσότερα από ένα εργαζόμενα μέλη της οικογένειας ήταν επίσης πιο πιθανό να επιλεγεί από ένα νοικοκυριό με έναν εργαζόμενο. Οικογένειες που δεν απασχολούνταν στους τομείς της έρευνας έπεσαν εκτός του φάσματος των επιλεγμένων μονάδων (νοικοκυριά συνταξιούχων, αυτοαπασχολούμενα νοικοκυριά κ.λπ.). Ήταν δύσκολο να εκτιμηθεί η ακρίβεια των ληφθέντων αποτελεσμάτων (όρια διαστημάτων εμπιστοσύνης, σφάλματα δειγματοληψίας), καθώς δεν χρησιμοποιήθηκαν πιθανολογικά μοντέλα κατά την κατασκευή του δείγματος.

Το 1996-1997 εισήχθη θεμελιωδώς νέα προσέγγισηστη δειγματοληψία των νοικοκυριών. Ως βάση για την υλοποίησή της χρησιμοποιήθηκαν τα στοιχεία της μικροαπογραφής του 1994. Ο γενικός πληθυσμός στην επιλογή αποτελούνταν από όλα τα είδη νοικοκυριών, με εξαίρεση τα συλλογικά νοικοκυριά. Και το σύνολο δειγματοληψίας άρχισε να οργανώνεται λαμβάνοντας υπόψη την αντιπροσωπευτικότητα της σύνθεσης και των τύπων των νοικοκυριών σε κάθε θέμα της Ρωσικής Ομοσπονδίας.

Η μέτρηση των σφαλμάτων στην αντιπροσωπευτικότητα των δεικτών του δείγματος βασίζεται στην υπόθεση της τυχαίας φύσης της κατανομής τους στο άπειρο μεγάλοι αριθμοίδείγματα.

Η ποσοτικοποίηση της αξιοπιστίας ενός δείκτη δείγματος χρησιμοποιείται για να ληφθεί μια ιδέα για το γενικό χαρακτηριστικό. Αυτό πραγματοποιείται είτε με βάση έναν δείκτη δείγματος, λαμβάνοντας υπόψη το τυχαίο σφάλμα του, είτε με βάση μια συγκεκριμένη υπόθεση (σχετικά με την τιμή μέση διακύμανση, φύση διανομής, σύνδεση) σε σχέση με τις ιδιότητες του γενικού πληθυσμού.

Για να ελεγχθεί η υπόθεση, αξιολογείται η συνέπεια των εμπειρικών δεδομένων με τα υποθετικά δεδομένα.

Το μέγεθος του τυχαίου σφάλματος αντιπροσωπευτικότητας εξαρτάται από:

1) στο μέγεθος του δείγματος.
2) ο βαθμός διακύμανσης του γνωρίσματος που μελετήθηκε στον γενικό πληθυσμό.
3) την αποδεκτή μέθοδο σχηματισμού δειγματοληπτικού πληθυσμού.

Υπάρχουν μέσα (τυποποιημένα) και οριακά δειγματοληπτικά σφάλματα.

Μέσο σφάλμα χαρακτηρίζει το μέτρο αποκλίσεων δεικτών δείγματος από παρόμοιους δείκτες του γενικού πληθυσμού.

οριακό σφάλμα είναι σύνηθες να εξετάζεται η μέγιστη δυνατή απόκλιση μεταξύ του δείγματος και των γενικών χαρακτηριστικών, δηλ. μέγιστο σφάλμα για μια δεδομένη πιθανότητα εμφάνισής του.

Σύμφωνα με τον πληθυσμό του δείγματος, είναι δυνατή η αξιολόγηση διαφόρων δεικτών (παραμέτρων) του γενικού πληθυσμού. Οι βαθμολογίες που χρησιμοποιούνται πιο συχνά είναι:

– στρατηγός μεσαίο μέγεθοςτου χαρακτηριστικού που μελετάται (για μια πολυτιμή ποσοτικό χαρακτηριστικό);
– γενική μετοχή (για εναλλακτικό πρόσημο).

Η βασική αρχή εφαρμογής της μεθόδου δειγματοληψίας είναι η εξασφάλιση ίσων ευκαιριών για όλες τις μονάδες του γενικού πληθυσμού να επιλεγούν στον πληθυσμό του δείγματος. Με αυτή την προσέγγιση, τηρείται η απαίτηση της τυχαίας, αντικειμενικής επιλογής και, ως εκ τούτου, το δειγματοληπτικό σφάλμα καθορίζεται κυρίως από το μέγεθός του ( Π ). Με την αύξηση του τελευταίου, η τιμή του μέσου σφάλματος μειώνεται, τα χαρακτηριστικά του πληθυσμού του δείγματος προσεγγίζουν τα χαρακτηριστικά του γενικού πληθυσμού.

Με τον ίδιο αριθμό σετ δειγματοληψίας και άλλα ίσους όρουςτο σφάλμα δειγματοληψίας θα είναι μικρότερο στο goy από αυτά, το οποίο επιλέγεται από τον γενικό πληθυσμό με μικρότερη διαφοροποίηση στο χαρακτηριστικό που μελετήθηκε. Μείωση της παραλλαγής ενός χαρακτηριστικού σημαίνει μείωση της τιμής της διακύμανσης (για ένα ποσοτικό χαρακτηριστικό ή για ένα εναλλακτικό χαρακτηριστικό).

Η εξάρτηση του μεγέθους του δειγματοληπτικού σφάλματος από τις μεθόδους σχηματισμού του πληθυσμού του δείγματος καθορίζεται από τους τύπους για το μέσο δειγματοληπτικό σφάλμα (Πίνακας 5.2).

Ας συμπληρώσουμε τους δείκτες του Πίνακα. 5.2 με τις ακόλουθες επεξηγήσεις.

Η διακύμανση του δείγματος είναι ελαφρώς μικρότερη από τη γενική διακύμανση. μαθηματικές στατιστικέςαπέδειξε ότι

Πίνακας 5.2

Τύποι για τον υπολογισμό του μέσου δειγματοληπτικού σφάλματος mri διάφορους τρόπουςεπιλογή

Τύπος δείγματος
	επαναλαμβάνεται για	ανεπανάληπτο για

Πράγματι τυχαίος (απλός)
Κατα συρροη (με ίσο
Τυπικό (αναλογικά με το μέγεθος των ομάδων)

Εάν το δείγμα είναι μεγάλο (δηλ. Π αρκετά μεγάλο), τότε ο λόγος προσεγγίζει τη μονάδα και η διακύμανση του δείγματος πρακτικά συμπίπτει με τη γενική.

Το δείγμα θεωρείται άνευ όρων μεγάλο όταν n> 100 και άνευ όρων μικρό στο Π < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

Μπορούν να υπολογιστούν χρησιμοποιώντας τους ακόλουθους τύπους:

που είναι ο μέσος όρος Εγώ η σειρά? είναι ο συνολικός μέσος όρος για ολόκληρο το δείγμα.

όπου είναι η αναλογία των μονάδων μιας συγκεκριμένης κατηγορίας σε Εγώ η σειρά? - το μερίδιο των μονάδων αυτής της κατηγορίας σε ολόκληρο το δείγμα· r- αριθμός επιλεγμένων επεισοδίων.

4. Για τον προσδιορισμό του μέσου όρου σφάλματος ενός τυπικού δείγματος στην περίπτωση επιλογής μονάδων σε αναλογία με το μέγεθος κάθε ομάδας, ο μέσος όρος των διακυμάνσεις εντός της ομάδας(– για ένα ποσοτικό χαρακτηριστικό, για ένα εναλλακτικό χαρακτηριστικό). Σύμφωνα με τον κανόνα της προσθήκης διασποράς, η τιμή του μέσου όρου των διακυμάνσεων εντός της ομάδας είναι μικρότερη από την τιμή συνολική διακύμανση. Μέση τιμή πιθανό σφάλμαΗ τυπική δειγματοληψία είναι μικρότερη από το σφάλμα μιας απλής σωστής τυχαίας δειγματοληψίας.

Συχνά χρησιμοποιείται συνδυασμένη επιλογή: η ατομική επιλογή μονάδων συνδυάζεται με την ομαδική επιλογή, η τυπική επιλογή συνδυάζεται με την επιλογή σε σειρά. Με οποιαδήποτε μέθοδο επιλογής, με μια ορισμένη πιθανότητα, μπορεί να υποστηριχθεί ότι η απόκλιση του μέσου όρου (ή του μεριδίου) δείγματος από τον γενικό μέσο όρο (ή μερίδιο) δεν θα υπερβαίνει μια ορισμένη τιμή, η οποία ονομάζεται οριακό σφάλμα δείγματα.

Η αναλογία μεταξύ του ορίου σφάλματος δειγματοληψίας (Δ) είναι εγγυημένη με κάποια πιθανότητα F(t), και το μέσο δειγματοληπτικό σφάλμα έχει τη μορφή: ή , όπου t – συντελεστής εμπιστοσύνης, που προσδιορίζεται ανάλογα με το επίπεδο πιθανότητας F(t).

Τιμές συναρτήσεων F(t) και t καθορίζονται με βάση ειδικά καταρτισμένους μαθηματικούς πίνακες. Εδώ είναι μερικά από τα πιο συχνά χρησιμοποιούμενα:


t

Έτσι, το οριακό σφάλμα δειγματοληψίας απαντά στο ερώτημα της ακρίβειας δειγματοληψίας με μια ορισμένη πιθανότητα, η τιμή της οποίας εξαρτάται από την τιμή του συντελεστή εμπιστοσύνης t. Ναι, στο t = 1 πιθανότητα F(t ) η απόκλιση των χαρακτηριστικών του δείγματος από τα γενικά κατά την τιμή ενός απλού μέσου σφάλματος είναι 0,683. Συνεπώς, κατά μέσο όρο, από κάθε 1000 δείγματα, τα 683 θα δίνουν γενικευμένους δείκτες (μέσος όρος, μερίδιο), οι οποίοι θα διαφέρουν από τους γενικούς όχι περισσότερο από ένα μέσο σφάλμα. Στο t = 2 πιθανότητα F(t) είναι ίσο με 0,954, πράγμα που σημαίνει ότι από κάθε 1000 δείγματα, τα 954 θα δίνουν γενικευμένους δείκτες που θα διαφέρουν από τους γενικούς όχι περισσότερο από δύο φορές το μέσο δειγματοληπτικό σφάλμα κ.λπ.

Μαζί με απόλυτη τιμήυπολογίζεται το οριακό δειγματοληπτικό σφάλμα και σχετικό σφάλμα, που ορίζεται ως ποσοστόοριακό δειγματοληπτικό σφάλμα στο αντίστοιχο χαρακτηριστικό του πληθυσμού δειγματοληψίας:

Στην πράξη, συνηθίζεται να ορίζεται η τιμή του Δ, κατά κανόνα, εντός 10% του αναμενόμενου μέσου επιπέδου του χαρακτηριστικού.

Ο υπολογισμός των μέσων και των οριακών σφαλμάτων δειγματοληψίας σάς επιτρέπει να προσδιορίσετε τα όρια εντός των οποίων θα είναι τα χαρακτηριστικά του γενικού πληθυσμού:

Τα όρια στα οποία, με δεδομένο βαθμό πιθανότητας, θα περιέχεται μια άγνωστη τιμή του υπό μελέτη δείκτη στον γενικό πληθυσμό ονομάζονται διάστημα εμπιστοσύνης, και η πιθανότητα F(t) – πιθανότητα εμπιστοσύνης. Όσο μεγαλύτερη είναι η τιμή του Δ, τόσο μεγαλύτερη είναι η τιμή διάστημα εμπιστοσύνηςκαι ως εκ τούτου χαμηλότερη ακρίβεια εκτίμησης.

Εξετάστε το ακόλουθο παράδειγμα. Για τον προσδιορισμό του μέσου μεγέθους μιας κατάθεσης σε μια τράπεζα, επιλέχθηκαν 200 λογαριασμοί καταθετών σε ξένο νόμισμα με τη μέθοδο της επαναλαμβανόμενης τυχαίας δειγματοληψίας. Ως αποτέλεσμα, διαπιστώθηκε ότι το μέσο μέγεθοςκατάθεση - 60 χιλιάδες ρούβλια, η διασπορά ήταν 32. Ταυτόχρονα, 40 λογαριασμοί αποδείχθηκαν σε ζήτηση. Είναι απαραίτητο να καθοριστούν με πιθανότητα 0,954 τα όρια εντός των οποίων βρίσκεται το μέσο ποσό κατάθεσης σε λογαριασμούς σε ξένο νόμισμα στην τράπεζα και το μερίδιο των λογαριασμών ζήτησης.

Υπολογίστε το μέσο σφάλμα του μέσου όρου του δείγματος χρησιμοποιώντας τον τύπο επανεπιλογής

Το οριακό σφάλμα του μέσου όρου του δείγματος με πιθανότητα 0,954 θα είναι

Κατά συνέπεια, η μέση κατάθεση σε τραπεζικούς λογαριασμούς σε ξένο νόμισμα είναι εντός χιλίων ρούβλια:

Με πιθανότητα 0,954, μπορεί να υποστηριχθεί ότι η μέση κατάθεση σε τραπεζικούς λογαριασμούς σε ξένο νόμισμα κυμαίνεται από 59.200 έως 60.800 ρούβλια.

Ας προσδιορίσουμε το μερίδιο των καταθέσεων όψεως στον πληθυσμό του δείγματος:

Μέσο σφάλμα μεριδίου δείγματος

Το οριακό σφάλμα της μετοχής με πιθανότητα 0,954 θα είναι

Έτσι, το μερίδιο των λογαριασμών ζήτησης στο γενικό πληθυσμό είναι εντός w :

Με πιθανότητα 0,954, μπορεί να υποστηριχθεί ότι το μερίδιο των λογαριασμών ζήτησης στο σύνολο των λογαριασμών σε ξένο νόμισμα στην τράπεζα κυμαίνεται από 14,4 έως 25,6%.

Στο Οι περιπτωσιολογικές μελέτεςΕίναι σημαντικό να καθοριστεί η βέλτιστη αναλογία μεταξύ του μέτρου της αξιοπιστίας των αποτελεσμάτων που προέκυψαν και του μεγέθους του αποδεκτού σφάλματος δειγματοληψίας. Από αυτή την άποψη, κατά την οργάνωση μιας δειγματοληπτικής παρατήρησης, τίθεται το ερώτημα που σχετίζεται με τον προσδιορισμό του μεγέθους του δείγματος που είναι απαραίτητο για να επιτευχθεί η απαιτούμενη ακρίβεια των αποτελεσμάτων με δεδομένη πιθανότητα. Ο υπολογισμός του απαιτούμενου μεγέθους δείγματος πραγματοποιείται με βάση τους τύπους για το οριακό δειγματοληπτικό σφάλμα σύμφωνα με τον τύπο και τη μέθοδο επιλογής (Πίνακας 5.3).

Πίνακας 5.3

Τύποι για τον υπολογισμό του μεγέθους του δείγματος με σωστή μέθοδο τυχαίας επιλογής

Ας συνεχίσουμε το παράδειγμα, που παρουσιάζει τα αποτελέσματα δειγματοληπτικής έρευνας προσωπικών λογαριασμών τραπεζικών καταθετών.

Απαιτείται να προσδιοριστεί πόσοι λογαριασμοί πρέπει να εξεταστούν έτσι ώστε με πιθανότητα 0,977 το σφάλμα στον προσδιορισμό του μέσου μεγέθους κατάθεσης να μην υπερβαίνει τα 1,5 χιλιάδες ρούβλια. Ας εκφράσουμε από τον τύπο για το οριακό σφάλμα δειγματοληψίας για επανεπιλογή τον δείκτη του μεγέθους του δείγματος:

Κατά τον προσδιορισμό του απαιτούμενου μεγέθους δείγματος χρησιμοποιώντας τους παραπάνω τύπους, καθίσταται δύσκολο να βρεθούν οι τιμές του σ2 και ναι, καθώς αυτές οι τιμές μπορούν να ληφθούν μόνο μετά από δειγματοληπτική έρευνα. Από αυτή την άποψη, αντί για τις πραγματικές τιμές αυτών των δεικτών, αντικαθίστανται κατά προσέγγιση, οι οποίες θα μπορούσαν να προσδιοριστούν με βάση οποιαδήποτε δοκιμή δείγματα παρατηρήσεωνή από αναλυτικές προηγούμενες έρευνες.

Σε περιπτώσεις όπου ο στατιστικολόγος γνωρίζει τη μέση τιμή των χαρακτηριστικών που μελετώνται (για παράδειγμα, από οδηγίες, νομοθετικές πράξεις κ.λπ.) ή τα όρια στα οποία ποικίλλει αυτό το χαρακτηριστικό, μπορεί να εφαρμοστεί ο ακόλουθος υπολογισμός χρησιμοποιώντας κατά προσέγγιση τύπους:

και το γινόμενο w(1 – w) θα πρέπει να αντικατασταθεί από την τιμή 0,25 (w = 0,5).

Για να πάρετε περισσότερα ακριβές αποτέλεσμα, λάβετε τη μέγιστη δυνατή τιμή αυτών των δεικτών. Εάν η κατανομή ενός χαρακτηριστικού στο γενικό πληθυσμό υπακούει κανονικός νόμος, τότε το εύρος διακύμανσης είναι περίπου ίσο με 6σ ( ακραίες αξίεςχωρίζονται και στις δύο κατευθύνσεις από τον μέσο όρο σε απόσταση 3σ). Ως εκ τούτου, αλλά εάν η κατανομή είναι προφανώς ασύμμετρη, τότε .

Με οποιοδήποτε τύπο δείγματος, ο όγκος του αρχίζει να υπολογίζεται σύμφωνα με τον τύπο της επαναδειγματοληψίας

Εάν, ως αποτέλεσμα του υπολογισμού, το μερίδιο επιλογής ( n ) υπερβαίνει το 5%, τότε ο υπολογισμός πραγματοποιείται σύμφωνα με τον τύπο της μη επαναλαμβανόμενης επιλογής.

Για ένα τυπικό δείγμα, είναι απαραίτητο να διαιρεθεί ο συνολικός όγκος του πληθυσμού του δείγματος μεταξύ των επιλεγμένων τύπων μονάδων. Ο υπολογισμός του αριθμού των παρατηρήσεων από κάθε ομάδα εξαρτάται από τα προαναφερθέντα οργανωτικές μορφέςτυπικό δείγμα.

Στην τυπική επιλογή μονάδων δυσανάλογα προς τον αριθμό των ομάδων, ο συνολικός αριθμός των επιλεγμένων μονάδων διαιρείται με τον αριθμό των ομάδων, η τιμή που προκύπτει δίνει τον αριθμό των επιλογών από κάθε τυπική ομάδα:

όπου κ είναι ο αριθμός των προσδιοριζόμενων τυπικών ομάδων.

Όταν επιλέγετε μονάδες σε αναλογία με τον αριθμό των τυπικών ομάδων, ο αριθμός των παρατηρήσεων για κάθε ομάδα καθορίζεται από τον τύπο

από πού είναι το μέγεθος του δείγματος Εγώ -η ομάδα? - Ενταση ΗΧΟΥ Εγώ -η ομάδα.

Κατά την επιλογή, λαμβάνοντας υπόψη τη διακύμανση του χαρακτηριστικού, το ποσοστό του δείγματος από κάθε ομάδα θα πρέπει να είναι ανάλογο με την τυπική απόκλιση σε αυτήν την ομάδα (). Ο υπολογισμός του αριθμού () πραγματοποιείται σύμφωνα με τους τύπους

Στη σειριακή επιλογή, ο απαιτούμενος αριθμός επιλεγμένων σειρών προσδιορίζεται με τον ίδιο τρόπο όπως στη σωστή τυχαία επιλογή:

Επανεκλογή

Μη επαναλαμβανόμενη επιλογή

Σε αυτή την περίπτωση, οι διακυμάνσεις και τα σφάλματα δειγματοληψίας μπορούν να υπολογιστούν για τη μέση τιμή ή αναλογία του χαρακτηριστικού.

Όταν χρησιμοποιείται επιλεκτική παρατήρηση, τα χαρακτηριστικά των αποτελεσμάτων της είναι δυνατά με βάση τη σύγκριση των ληφθέντων ορίων σφάλματος των επιλεκτικών δεικτών με την τιμή του επιτρεπόμενου σφάλματος.

Από αυτή την άποψη, προκύπτει το πρόβλημα του προσδιορισμού της πιθανότητας το σφάλμα δειγματοληψίας να μην υπερβαίνει το επιτρεπόμενο σφάλμα. Η λύση αυτού του προβλήματος ανάγεται στον υπολογισμό με βάση τον τύπο για το οριακό δειγματοληπτικό σφάλμα της ποσότητας t.

Συνεχίζοντας την εξέταση ενός παραδείγματος μιας δειγματοληπτικής έρευνας προσωπικών λογαριασμών πελατών τραπεζών, θα βρούμε την πιθανότητα με την οποία μπορεί να υποστηριχθεί ότι το σφάλμα στον προσδιορισμό του μέσου μεγέθους κατάθεσης δεν θα υπερβαίνει τα 785 ρούβλια:

το αντίστοιχο επίπεδο εμπιστοσύνης είναι 0,95.

Επί του παρόντος, οι πρακτικές δειγματοληψίας περιλαμβάνουν στατιστικές παρατηρήσειςδιεξήχθη:

- σώματα της Rosstat.
– άλλα υπουργεία και υπηρεσίες (για παράδειγμα, παρακολούθηση επιχειρήσεων στο σύστημα της Τράπεζας της Ρωσίας).

Μια γνωστή γενίκευση της εμπειρίας στη διοργάνωση δειγματοληπτικών ερευνών μικρών επιχειρήσεων, πληθυσμού και νοικοκυριών παρουσιάζεται στις Μεθοδολογικές Διατάξεις για τη Στατιστική. Δίνουν περισσότερα ευρεία έννοιαπαρατήρηση δείγματος από αυτή που συζητήθηκε παραπάνω (Πίνακας 5.4).

Στη στατιστική πρακτική, χρησιμοποιούνται και οι τέσσερις τύποι δειγμάτων, που παρουσιάζονται στον Πίνακα. 5.4. Ωστόσο, συνήθως προτιμώνται τα πιθανολογικά (τυχαία) δείγματα που περιγράφονται παραπάνω, τα οποία είναι τα πιο αντικειμενικά, καθώς μπορούν να χρησιμοποιηθούν για την αξιολόγηση της ακρίβειας των αποτελεσμάτων που λαμβάνονται από τα δεδομένα του ίδιου του δείγματος.

Πίνακας 5.4

Τύποι δειγμάτων

Σε δείγματα οιονεί τυχαίος τύπος Η πιθανολογική επιλογή υποτίθεται με βάση το ότι ο ειδικός που εξετάζει το δείγμα το θεωρεί αποδεκτό. Ένα παράδειγμα χρήσης της οιονεί τυχαίας δειγματοληψίας στη στατιστική πρακτική είναι η «Δειγματική έρευνα μικρών επιχειρήσεων προς μελέτη κοινωνικές διαδικασίεςστις μικρές επιχειρήσεις", που πραγματοποιήθηκε το 1996 σε ορισμένες περιοχές της Ρωσίας. Οι μονάδες παρατήρησης (μικρές επιχειρήσεις) επιλέχθηκαν με έμπειρο τρόπο, λαμβάνοντας υπόψη την αντιπροσώπευση των οικονομικών τομέων από το ήδη σχηματισμένο δείγμα της έρευνας για τις χρηματοοικονομικές δραστηριότητες των μικρών επιχειρήσεων (το έντυπο «Πληροφορίες για τους κύριους δείκτες χρηματοπιστωτικής και οικονομικής δραστηριότητας μικρής επιχείρησης») Κατά τη σύνοψη των δεδομένων του δείγματος, θεωρήθηκε ότι το δείγμα σχηματίστηκε με τη μέθοδο της απλής τυχαίας επιλογής.

απευθείας χρήση της κρίσης των ειδικών Είναι το πιο γενική μέθοδοςσκόπιμη συμπερίληψη μονάδων στο δείγμα. Ένα παράδειγμα τέτοιας μεθόδου επιλογής είναι μονογραφική μέθοδος, η οποία περιλαμβάνει τη λήψη πληροφοριών από μία μόνο μονάδα παρατήρησης, η οποία είναι τυπική, κατά τη γνώμη του διοργανωτή της έρευνας - ενός ειδικού.

Δείγματα με βάση επιλογή κατεύθυνσης, υλοποιούνται χρησιμοποιώντας μια αντικειμενική διαδικασία, αλλά χωρίς τη χρήση πιθανοτικού μηχανισμού. Η μέθοδος της κύριας διάταξης είναι ευρέως γνωστή, στην οποία το δείγμα περιλαμβάνει τις μεγαλύτερες (ουσιώδεις) μονάδες παρατήρησης που παρέχουν την κύρια συμβολή στον δείκτη, για παράδειγμα συνολική αξίαένα χαρακτηριστικό που αντιπροσωπεύει τον κύριο σκοπό της έρευνας.

Στη στατιστική πρακτική, χρησιμοποιείται συχνά συνδυασμένη μέθοδος στατιστικής παρατήρησης. Ο συνδυασμός μεθόδων συνεχούς και επιλεκτικής παρατήρησης έχει δύο όψεις:

εναλλαγή στο χρόνο?
την ταυτόχρονη χρήση τους (μέρος του πληθυσμού παρατηρείται σε συνεχή βάση και εν μέρει επιλεκτικά).

εναλλαγή η περιοδική δειγματοληψία με σχετικά σπάνιες συνεχείς έρευνες ή απογραφές είναι απαραίτητη για την αποσαφήνιση της σύνθεσης του πληθυσμού που μελετήθηκε. Στη συνέχεια, αυτές οι πληροφορίες χρησιμοποιούνται ως στατιστική βάσηεπιλεκτική παρατήρηση. Παραδείγματα είναι οι απογραφές πληθυσμού και οι δειγματοληπτικές έρευνες των νοικοκυριών.

ΣΤΟ αυτή η υπόθεσηαπαιτούνται οι ακόλουθες εργασίες:

– προσδιορισμός της σύνθεσης των σημείων συνεχούς παρατήρησης, που διασφαλίζουν την οργάνωση του δείγματος·
– τεκμηρίωση περιόδων εναλλαγής, δηλ. όταν τα συνεχή δεδομένα δεν είναι πλέον σχετικά και απαιτούνται δαπάνες για την ενημέρωσή τους.

Ταυτόχρονη χρήση στο πλαίσιο μιας έρευνας συνεχών και δειγματοληπτικών παρατηρήσεων οφείλεται στην ετερογένεια των πληθυσμών που συναντώνται στη στατιστική πρακτική. Αυτό ισχύει ιδιαίτερα για έρευνες της οικονομικής δραστηριότητας ενός συνόλου επιχειρήσεων, οι οποίες χαρακτηρίζονται από λοξές κατανομές των υπό μελέτη χαρακτηριστικών, όταν ένας συγκεκριμένος αριθμός μονάδων έχει χαρακτηριστικά που διαφέρουν πολύ από το μεγαλύτερο μέρος των αξιών. Στην περίπτωση αυτή, τέτοιες μονάδες παρατηρούνται σε συνεχή βάση και το άλλο μέρος του πληθυσμού παρατηρείται επιλεκτικά.

Με αυτήν την οργάνωση των παρατηρήσεων, τα κύρια καθήκοντα είναι:

– καθορισμός της βέλτιστης αναλογίας τους·
– ανάπτυξη μεθόδων για την αξιολόγηση της ακρίβειας των αποτελεσμάτων.

Ένα χαρακτηριστικό παράδειγμα που δείχνει αυτή την πτυχή της εφαρμογής συνδυασμένη μέθοδος, είναι γενική αρχήδιεξαγωγή ερευνών του πληθυσμού των επιχειρήσεων, σύμφωνα με τις οποίες οι έρευνες του πληθυσμού των μεγάλων και μεσαίων επιχειρήσεων γίνονται κυρίως με συνεχή μέθοδο και των μικρών επιχειρήσεων με δειγματοληπτική μέθοδο.

Η περαιτέρω ανάπτυξη της μεθοδολογίας δειγματοληψίας πραγματοποιείται τόσο σε συνδυασμό με την οργάνωση συνεχούς παρατήρησης όσο και μέσω της οργάνωσης ειδικών ερευνών, η διεξαγωγή των οποίων υπαγορεύεται από την ανάγκη λήψης Επιπλέον πληροφορίεςγια την επίλυση συγκεκριμένων προβλημάτων. Έτσι, η οργάνωση ερευνών στον τομέα των συνθηκών και του βιοτικού επιπέδου του πληθυσμού προβλέπεται σε δύο πτυχές:

- υποχρεωτικά εξαρτήματα.
– επιπλέον ενότητες εντός ολοκληρωμένο σύστημαδείκτες.

Υποχρεωτικά στοιχεία μπορεί να είναι ετήσιες έρευνες για τα έσοδα, τις δαπάνες και την κατανάλωση (παρόμοια με τις έρευνες για τον προϋπολογισμό των νοικοκυριών), οι οποίες περιλαμβάνουν επίσης βασικούς δείκτες των συνθηκών διαβίωσης του πληθυσμού. Κάθε χρόνο, σύμφωνα με ειδικό σχέδιο, τα υποχρεωτικά στοιχεία πρέπει να συμπληρώνονται με εφάπαξ έρευνες (ενότητες) των συνθηκών διαβίωσης του πληθυσμού, με στόχο σε βάθος μελέτηοποιοδήποτε επιλεγμένο κοινωνικό θέμααπό αυτούς συνολικός αριθμός(π.χ. περιουσιακά στοιχεία του νοικοκυριού, υγεία, διατροφή, εκπαίδευση, συνθήκες εργασίας, στέγαση, αναψυχή, κοινωνική κινητικότητα, ασφάλεια, κ.λπ.) σε διαφορετικά χρονικά διαστήματα, που καθορίζονται από την ανάγκη για δείκτες και δυνατότητες πόρων.

Η έννοια και ο υπολογισμός του δειγματοληπτικού σφάλματος.

Το καθήκον της επιλεκτικής παρατήρησης είναι να δώσει σωστές ιδέες για τους συνοπτικούς δείκτες ολόκληρου του πληθυσμού με βάση κάποιο μέρος τους που υποβλήθηκε σε παρατήρηση. Η πιθανή απόκλιση του μεριδίου δείγματος και του μέσου όρου του δείγματος από το μερίδιο και το μέσο όρο στο γενικό πληθυσμό ονομάζεται σφάλμα δειγματοληψίας ή σφάλμα αντιπροσωπευτικότητας. Όσο μεγαλύτερη είναι η τιμή αυτού του σφάλματος, τόσο περισσότερο διαφέρουν οι δείκτες παρατήρησης του δείγματος από εκείνους του γενικού πληθυσμού.

Διαφέρω:

Σφάλματα δειγματοληψίας.

Σφάλματα εγγραφής.

Σφάλματα εγγραφήςσυμβαίνουν όταν ένα γεγονός διαπιστώνεται εσφαλμένα στη διαδικασία παρατήρησης. Είναι χαρακτηριστικά τόσο της συνεχούς παρατήρησης όσο και της επιλεκτικής παρατήρησης, αλλά είναι λιγότερο στην επιλεκτική παρατήρηση.

Η φύση του σφάλματος είναι:

Τεντενιστικός - εσκεμμένος, δηλ. επιλέχθηκαν είτε οι καλύτερες είτε οι χειρότερες μονάδες του πληθυσμού. Σε αυτή την περίπτωση, οι παρατηρήσεις χάνουν το νόημά τους.

Τυχαία - η κύρια οργανωτική αρχή της επιλεκτικής παρατήρησης είναι η αποτροπή της σκόπιμης επιλογής, δηλ. διασφαλίζει την αυστηρή τήρηση της αρχής της τυχαίας επιλογής.

Γενικός κανόναςτυχαία επιλογήείναι: μεμονωμένες μονάδες του γενικού πληθυσμού πρέπει να έχουν ακριβώς τις ίδιες συνθήκες και ευκαιρίες για να εμπίπτουν στον αριθμό των μονάδων που περιλαμβάνονται στο δείγμα. Αυτό χαρακτηρίζει την ανεξαρτησία του αποτελέσματος του δείγματος από τη βούληση του παρατηρητή. Η βούληση του παρατηρητή δημιουργεί τετριμμένα λάθη. Το σφάλμα δειγματοληψίας στην τυχαία επιλογή είναι τυχαίος χαρακτήρας. Χαρακτηρίζει το μέγεθος των αποκλίσεων των γενικών χαρακτηριστικών από τα δείγματα.

Λόγω του γεγονότος ότι τα χαρακτηριστικά στον υπό μελέτη πληθυσμό ποικίλλουν, η σύνθεση των μονάδων στο δείγμα μπορεί να μην συμπίπτει με τη σύνθεση των μονάδων ολόκληρου του πληθυσμού. Αυτό σημαίνει ότι Rκαι δεν ταιριάζουν με Wκαι . Η πιθανή απόκλιση μεταξύ αυτών των χαρακτηριστικών καθορίζεται από το σφάλμα δειγματοληψίας, το οποίο καθορίζεται από τον τύπο:

όπου - γενική διακύμανση.

πού είναι η διακύμανση του δείγματος.

Αυτό δείχνει από πού διαφέρει η γενική διακύμανση διακύμανση δείγματοςεγκαίρως.

Υπάρχει επαναλαμβανόμενη και μη επαναλαμβανόμενη επιλογή. Η ουσία της επανεπιλογής είναι ότι κάθε μονάδα του δείγματος, μετά από παρατήρηση, επιστρέφει στον γενικό πληθυσμό και μπορεί να επανεξεταστεί. Κατά την επαναδειγματοληψία, υπολογίζεται το μέσο σφάλμα δειγματοληψίας:

Για τον δείκτη του μεριδίου ενός εναλλακτικού χαρακτηριστικού, η διακύμανση του δείγματος προσδιορίζεται από τον τύπο:

Στην πράξη, η επανεπιλογή χρησιμοποιείται σπάνια. Στο μη επαναλαμβανόμενη επιλογή, μέγεθος πληθυσμού Νμειώνεται κατά τη δειγματοληψία, ο τύπος για το μέσο δειγματοληπτικό σφάλμα για ένα ποσοτικό χαρακτηριστικό είναι:

, έπειτα

Μία από τις πιθανές τιμές στις οποίες μπορεί να είναι το μερίδιο του υπό μελέτη χαρακτηριστικού είναι ίση με:

όπου είναι το σφάλμα δειγματοληψίας του εναλλακτικού χαρακτηριστικού.

Παράδειγμα.

Στο δείγμα έρευναςΤο 10% των προϊόντων της παρτίδας των τελικών προϊόντων σύμφωνα με τη μέθοδο χωρίς επανεπιλογή έλαβε τα ακόλουθα δεδομένα για την περιεκτικότητα σε υγρασία στα δείγματα.

Προσδιορίστε τη μέση υγρασία %, διακύμανση, τυπική απόκλιση, με πιθανότητα 0,954 πιθανά όρια, στο οποίο αναμένουμε βλ. % υγρασία όλων των τελικών προϊόντων, με πιθανότητα 0,987 πιθανά όρια ειδικό βάροςτυποποιημένα προϊόντα, υπό την προϋπόθεση ότι η μη τυποποιημένη παρτίδα περιλαμβάνει προϊόντα με περιεκτικότητα σε υγρασία έως 13 και άνω του 19%.

Μόνο με μια ορισμένη πιθανότητα μπορεί να υποστηριχθεί ότι το γενικό μερίδιο του δείγματος και ο γενικός μέσος όρος του δείγματος αποκλίνουν σε tμια φορά.

Στη στατιστική, αυτές οι αποκλίσεις ονομάζονται οριακά δειγματοληπτικά σφάλματα και σημειώνονται.

Η πιθανότητα κρίσεων μπορεί να αυξηθεί ή να μειωθεί tμια φορά. Με πιθανότητα 0,683, με 0,954, με 0,987, τότε οι δείκτες του γενικού πληθυσμού προσδιορίζονται από τους δείκτες του δείγματος.

Όπως ήδη γνωρίζουμε, η αντιπροσωπευτικότητα είναι η ιδιότητα ενός πληθυσμού δείγματος να αντιπροσωπεύει ένα χαρακτηριστικό του γενικού πληθυσμού. Εάν δεν υπάρχει αντιστοιχία, μιλούν για σφάλμα αντιπροσωπευτικότητας - το μέτρο της απόκλισης της στατιστικής δομής του δείγματος από τη δομή του αντίστοιχου γενικού πληθυσμού. Ας υποθέσουμε ότι το μέσο μηνιαίο οικογενειακό εισόδημα των συνταξιούχων στο γενικό πληθυσμό είναι 2 χιλιάδες ρούβλια και στο δείγμα - 6 χιλιάδες ρούβλια. Αυτό σημαίνει ότι ο κοινωνιολόγος πήρε συνεντεύξεις μόνο από το εύπορο μέρος των συνταξιούχων και ένα σφάλμα αντιπροσωπευτικότητας μπήκε στη μελέτη του. Με άλλα λόγια, το σφάλμα αντιπροσωπευτικότητας είναι η ασυμφωνία μεταξύ δύο συνόλων - του γενικού, στο οποίο στρέφεται το θεωρητικό ενδιαφέρον του κοινωνιολόγου και της ιδέας των ιδιοτήτων των οποίων θέλει να αποκτήσει τελικά, και του επιλεκτικού. , στο οποίο κατευθύνεται το πρακτικό ενδιαφέρον του κοινωνιολόγου, που λειτουργεί και ως αντικείμενο εξέτασης και ως μέσο απόκτησης πληροφοριών για τον γενικό πληθυσμό.

Μαζί με τον όρο "σφάλμα αντιπροσωπευτικότητας" στην εγχώρια βιβλιογραφία, μπορείτε να βρείτε ένα άλλο - "σφάλμα δειγματοληψίας". Μερικές φορές χρησιμοποιούνται εναλλακτικά και μερικές φορές χρησιμοποιείται «σφάλμα δειγματοληψίας» αντί για «σφάλμα αντιπροσωπευτικότητας» ως ποσοτικά πιο ακριβής έννοια.

Σφάλμα δειγματοληψίας είναι η απόκλιση των μέσων χαρακτηριστικών του πληθυσμού του δείγματος από τα μέσα χαρακτηριστικά του γενικού πληθυσμού.

Στην πράξη, το σφάλμα δειγματοληψίας προσδιορίζεται συγκρίνοντας τα γνωστά χαρακτηριστικά του πληθυσμού με τα μέσα δείγματος. Στην κοινωνιολογία, οι έρευνες για τον ενήλικο πληθυσμό χρησιμοποιούν συχνότερα δεδομένα από απογραφές πληθυσμού, τρέχοντα στατιστικά αρχεία και αποτελέσματα προηγούμενων ερευνών. Ως παράμετροι ελέγχου χρησιμοποιούνται συνήθως τα κοινωνικοδημογραφικά χαρακτηριστικά. Η σύγκριση των μέσων όρων του γενικού πληθυσμού και του πληθυσμού του δείγματος, με βάση αυτό, ο προσδιορισμός του δειγματοληπτικού σφάλματος και η μείωσή του ονομάζεται έλεγχος αντιπροσωπευτικότητας. Δεδομένου ότι στο τέλος της μελέτης μπορεί να γίνει σύγκριση των δεδομένων ενός ατόμου και άλλων ανθρώπων, αυτή η μέθοδος ελέγχου ονομάζεται εκ των υστέρων, δηλ. πραγματοποιείται μετά από εμπειρία.

Στις δημοσκοπήσεις του Gallup, η αντιπροσωπευτικότητα ελέγχεται από δεδομένα που είναι διαθέσιμα στις εθνικές απογραφές σχετικά με την κατανομή του πληθυσμού ανά φύλο, ηλικία, εκπαίδευση, εισόδημα, επάγγελμα, φυλή, τόπο διαμονής, μέγεθος τοποθεσία. Πανρωσικό Κέντρο Ερευνών κοινή γνώμη(VTsIOM) χρησιμοποιεί για σκοπούς τέτοιους δείκτες όπως φύλο, ηλικία, εκπαίδευση, τύπος οικισμού, οικογενειακή κατάσταση, σφαίρα απασχόλησης, επίσημη ιδιότητα του ερωτώμενου, τα οποία δανείζονται από την Κρατική Επιτροπή Στατιστικής της Ρωσικής Ομοσπονδίας. Και στις δύο περιπτώσεις, ο πληθυσμός είναι γνωστός. Δεν μπορεί να διαπιστωθεί σφάλμα δειγματοληψίας εάν οι τιμές της μεταβλητής στο δείγμα και τον πληθυσμό είναι άγνωστες.

Κατά τη διάρκεια της ανάλυσης δεδομένων, οι ειδικοί του VTsIOM διασφαλίζουν τη διεξοδική επισκευή του δείγματος προκειμένου να ελαχιστοποιηθούν οι αποκλίσεις που προέκυψαν κατά τη έρευνα πεδίου. Ιδιαίτερα έντονες μετατοπίσεις παρατηρούνται ως προς το φύλο και την ηλικία. Αυτό εξηγείται από το γεγονός ότι οι γυναίκες και τα άτομα με ανώτερη εκπαίδευσηπερνούν περισσότερο χρόνο στο σπίτι και επικοινωνούν με τον ερευνητή πιο εύκολα. αποτελούν μια εύκολα προσβάσιμη ομάδα σε σύγκριση με τους άνδρες και τα άτομα που είναι «αμόρφωτα»35.

Το σφάλμα δειγματοληψίας οφείλεται σε δύο παράγοντες: τη μέθοδο δειγματοληψίας και το μέγεθος του δείγματος.

Τα δειγματοληπτικά σφάλματα χωρίζονται σε δύο τύπους - τυχαία και συστηματικά. Το τυχαίο σφάλμα είναι η πιθανότητα να υπερβεί (ή όχι) η μέση τιμή του δείγματος καθορισμένο διάστημα. Τα τυχαία σφάλματα περιλαμβάνουν στατιστικά σφάλματα που είναι εγγενή στην ίδια τη μέθοδο δειγματοληψίας. Μειώνονται καθώς αυξάνεται το μέγεθος του δείγματος.

Ο δεύτερος τύπος δειγματοληπτικού σφάλματος είναι το συστηματικό σφάλμα. Αν κάποιος κοινωνιολόγος αποφάσιζε να μάθει τη γνώμη όλων των κατοίκων της πόλης για τα συνεχόμενα τοπικές αρχέςαρχές στην κοινωνική πολιτική, και πήραν συνέντευξη μόνο από όσους έχουν τηλέφωνο, τότε υπάρχει μια σκόπιμη μεροληψία στο δείγμα υπέρ των πλουσίων στρωμάτων, δηλ. συστηματικό λάθος.

Έτσι, τα συστηματικά σφάλματα είναι αποτέλεσμα της δραστηριότητας του ίδιου του ερευνητή. Είναι τα πιο επικίνδυνα, γιατί οδηγούν σε αρκετά σημαντικές προκαταλήψεις στα αποτελέσματα της μελέτης. Τα συστηματικά σφάλματα θεωρούνται χειρότερα από τα τυχαία και επειδή δεν μπορούν να ελεγχθούν και να μετρηθούν.

Προκύπτουν όταν, για παράδειγμα: 1) το δείγμα δεν πληροί τους στόχους της μελέτης (ο κοινωνιολόγος αποφάσισε να μελετήσει μόνο εργαζόμενους συνταξιούχους, αλλά πήρε συνέντευξη από όλους στη σειρά). 2) υπάρχει άγνοια της φύσης του γενικού πληθυσμού (ο κοινωνιολόγος πίστευε ότι το 70% όλων των συνταξιούχων δεν εργάζονταν, αλλά αποδείχθηκε ότι μόνο το 10% δεν εργάστηκε). 3) επιλέγονται μόνο «νικητές» στοιχεία του γενικού πληθυσμού (για παράδειγμα, μόνο πλούσιοι συνταξιούχοι).

Προσοχή! Σε αντίθεση με τα τυχαία σφάλματα, τα συστηματικά σφάλματα δεν μειώνονται με την αύξηση του μεγέθους του δείγματος.

Συνοψίζοντας όλες τις περιπτώσεις που συμβαίνουν συστηματικά σφάλματα, οι μεθοδολόγοι συνέταξαν ένα μητρώο αυτών. Πιστεύουν ότι η πηγή των ανεξέλεγκτων προκαταλήψεων στην κατανομή των δειγματοληπτικών παρατηρήσεων μπορεί να είναι τους ακόλουθους παράγοντες:
♦ μεθοδολογικούς και μεθοδολογικούς κανόνες διεξαγωγής κοινωνιολογική έρευνα;
♦ Επιλέχθηκαν ανεπαρκείς μέθοδοι δειγματοληψίας, συλλογή δεδομένων και μέθοδοι υπολογισμού.
♦ Έγινε αντικατάσταση των απαιτούμενων μονάδων παρατήρησης από άλλες, πιο προσιτές.
♦ Διαπιστώθηκε ελλιπής κάλυψη του δειγματοληπτικού πληθυσμού (έλλειψη ερωτηματολογίων, ελλιπής συμπλήρωση ερωτηματολογίων, αδυναμία πρόσβασης σε μονάδες παρατήρησης).

Οι κοινωνιολόγοι σπάνια κάνουν εσκεμμένα λάθη. Τις περισσότερες φορές, προκύπτουν σφάλματα επειδή ο κοινωνιολόγος δεν γνωρίζει καλά τη δομή του γενικού πληθυσμού: την κατανομή των ανθρώπων ανά ηλικία, επάγγελμα, εισόδημα κ.λπ.

Τα συστηματικά σφάλματα είναι πιο εύκολο να αποφευχθούν (σε σύγκριση με τα τυχαία), αλλά είναι πολύ δύσκολο να εξαλειφθούν. Είναι καλύτερο να αποτρέψετε τα συστηματικά σφάλματα προβλέποντας με ακρίβεια τις πηγές τους εκ των προτέρων - στην αρχή της μελέτης.

Ακολουθούν ορισμένοι τρόποι για την αποφυγή σφαλμάτων δειγματοληψίας:
♦ Κάθε μονάδα του γενικού πληθυσμού πρέπει να έχει ίση πιθανότητα να συμπεριληφθεί στο δείγμα.
♦ είναι επιθυμητό να επιλέξετε από ομοιογενείς πληθυσμούς.
♦ Πρέπει να γνωρίζουν τα χαρακτηριστικά του γενικού πληθυσμού.
♦ Τυχαία και συστηματικά σφάλματα πρέπει να λαμβάνονται υπόψη κατά την κατάρτιση του δείγματος.

Εάν το δείγμα (ή απλώς το δείγμα) έχει καταρτιστεί σωστά, τότε ο κοινωνιολόγος αποκτά αξιόπιστα αποτελέσματα που χαρακτηρίζουν ολόκληρο τον πληθυσμό. Εάν έχει συνταχθεί λανθασμένα, τότε το σφάλμα που προέκυψε στο στάδιο της δειγματοληψίας πολλαπλασιάζεται σε κάθε επόμενο στάδιο της κοινωνιολογικής έρευνας και τελικά φτάνει σε μια τιμή που υπερβαίνει την αξία της μελέτης. Λέγεται ότι τέτοιες έρευνες κάνουν περισσότερο κακό παρά καλό.

Τέτοια σφάλματα μπορούν να προκύψουν μόνο με πληθυσμό δείγματος. Για να αποφύγετε ή να μειώσετε την πιθανότητα σφάλματος, ο ευκολότερος τρόπος είναι να αυξήσετε τα μεγέθη του δείγματος (ιδανικά μέχρι το μέγεθος του πληθυσμού: όταν και οι δύο πληθυσμοί ταιριάζουν, το σφάλμα δειγματοληψίας θα εξαφανιστεί εντελώς). Από οικονομική άποψη, αυτή η μέθοδος είναι αδύνατη. Υπάρχει ένας άλλος τρόπος - να βελτιωθεί μαθηματικές μεθόδουςδειγματοληψία. Εφαρμόζονται στην πράξη. Αυτό είναι το πρώτο κανάλι διείσδυσης στην κοινωνιολογία των μαθηματικών. Δεύτερο κανάλι - μαθηματική επεξεργασίαδεδομένα.

Ειδικά σημαντικό θέμαΤα σφάλματα γίνονται στην έρευνα μάρκετινγκ, όπου χρησιμοποιούνται όχι πολύ μεγάλα δείγματα. Συνήθως αποτελούν αρκετές εκατοντάδες, λιγότερο συχνά - χίλιους ερωτηθέντες. Εδώ, το σημείο εκκίνησης για τον υπολογισμό του δείγματος είναι το ζήτημα του προσδιορισμού του μεγέθους του πληθυσμού του δείγματος. Το μέγεθος του δείγματος εξαρτάται από δύο παράγοντες: 1) το κόστος συλλογής πληροφοριών και 2) την προσπάθεια για έναν ορισμένο βαθμό στατιστική εγκυρότητααποτελέσματα που ελπίζει να αποκτήσει ο ερευνητής. Φυσικά, ακόμη και άτομα που δεν έχουν εμπειρία στη στατιστική και την κοινωνιολογία κατανοούν διαισθητικά ότι όσο μεγαλύτερο είναι το μέγεθος του δείγματος, δηλ. Όσο πιο κοντά βρίσκονται στο μέγεθος του γενικού πληθυσμού στο σύνολό του, τόσο πιο αξιόπιστα και αξιόπιστα είναι τα δεδομένα που λαμβάνονται. Ωστόσο, έχουμε ήδη μιλήσει παραπάνω για την πρακτική αδυναμία πλήρων ερευνών σε εκείνες τις περιπτώσεις που πραγματοποιούνται σε αντικείμενα των οποίων ο αριθμός υπερβαίνει τις δεκάδες, τις εκατοντάδες χιλιάδες και ακόμη και τα εκατομμύρια. Είναι σαφές ότι το κόστος συλλογής πληροφοριών (συμπεριλαμβανομένης της πληρωμής για την αναπαραγωγή εργαλείων, της εργασίας των ερωτηματολογίων, των διαχειριστών πεδίου και των χειριστών εισαγωγής υπολογιστών) εξαρτάται από το ποσό που ο πελάτης είναι διατεθειμένος να διαθέσει και εξαρτάται ελάχιστα από τους ερευνητές. Ως προς τον δεύτερο παράγοντα, θα σταθούμε σε αυτόν λίγο πιο αναλυτικά.

Επομένως, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερο είναι το πιθανό σφάλμα. Αν και πρέπει να σημειωθεί ότι αν θέλετε να διπλασιάσετε την ακρίβεια, θα πρέπει να αυξήσετε το δείγμα όχι κατά δύο, αλλά κατά τέσσερις φορές. Για παράδειγμα, να κάνετε διπλάσια ακριβής εκτίμησηδεδομένα που λαμβάνονται με συνέντευξη από 400 άτομα, πρέπει να κάνετε συνέντευξη όχι από 800, αλλά από 1600 άτομα. Ωστόσο, είναι απίθανο η έρευνα μάρκετινγκ να χρειάζεται 100% ακρίβεια. Εάν ένας ζυθοποιός πρέπει να ανακαλύψει ποιο ποσοστό των καταναλωτών μπύρας προτιμά το εμπορικό σήμα του και όχι την ποικιλία του ανταγωνιστή του - 60% ή 40%, τότε η διαφορά μεταξύ 57%, 60 ή 63% δεν θα επηρεάσει τα σχέδιά του.

Το δειγματοληπτικό σφάλμα μπορεί να εξαρτάται όχι μόνο από το μέγεθός του, αλλά και από το βαθμό διαφορών μεταξύ των επιμέρους μονάδων στο γενικό πληθυσμό που μελετάμε. Για παράδειγμα, εάν θέλουμε να μάθουμε πόση μπύρα καταναλώνεται, τότε διαπιστώνουμε ότι στον πληθυσμό μας, τα ποσοστά κατανάλωσης για διάφορα άτομαδιαφέρουν σημαντικά (ετερογενής γενικός πληθυσμός). Σε άλλη περίπτωση θα μελετήσουμε την κατανάλωση ψωμιού και θα το διαπιστώσουμε διαφορετικοί άνθρωποιδιαφέρει πολύ λιγότερο σημαντικά (ομογενής πληθυσμός). Όσο μεγαλύτερη είναι η διαφορά (ή η ετερογένεια) εντός του πληθυσμού, τόσο μεγαλύτερος είναι ο αριθμός πιθανών σφαλμάτων δειγματοληψίας. Αυτή η κανονικότητα επιβεβαιώνει μόνο το απλό ΚΟΙΝΗ ΛΟΓΙΚΗ. Έτσι, όπως σωστά αναφέρει ο V. Yadov, «το μέγεθος (όγκος) του δείγματος εξαρτάται από το επίπεδο ομοιογένειας ή ετερογένειας των μελετηθέντων αντικειμένων. Όσο πιο ομοιογενή είναι, τόσο μικρότερος είναι ο αριθμός που μπορεί να δώσει στατιστικά αξιόπιστα συμπεράσματα.

Ο προσδιορισμός του μεγέθους του δείγματος εξαρτάται επίσης από το επίπεδο του διαστήματος εμπιστοσύνης του επιτρεπόμενου στατιστικού σφάλματος. Εδώ εννοούμε τα λεγόμενα τυχαία σφάλματα, τα οποία σχετίζονται με τη φύση τυχόν στατιστικών σφαλμάτων. ΣΕ ΚΑΙ. Ο Paniotto δίνει τους παρακάτω υπολογισμούς αντιπροσωπευτικό δείγμαμε την υπόθεση σφάλματος 5%:
Αυτό σημαίνει ότι εάν, μετά από συνέντευξη, ας πούμε, από 400 άτομα σε μια επαρχιακή πόλη, όπου ο ενήλικος πληθυσμός διαλυτών είναι 100 χιλιάδες άτομα, διαπιστώσατε ότι το 33% των ερωτηθέντων αγοραστών προτιμά τα προϊόντα μιας τοπικής μονάδας επεξεργασίας κρέατος, τότε με 95 % πιθανότητα μπορείτε να πείτε ότι τακτικοί αγοραστές αυτών των προϊόντων είναι το 33 + 5% (δηλαδή, από 28 έως 38%) των κατοίκων αυτής της πόλης.

Μπορείτε επίσης να χρησιμοποιήσετε τους υπολογισμούς του Gallup για να υπολογίσετε την αναλογία μεγεθών δειγμάτων και σφαλμάτων δειγματοληψίας.