Το μέσο τετραγωνικό σφάλμα του δείγματος είναι μεγαλύτερο από. Μέσο τετράγωνο τυπικό δειγματοληπτικό σφάλμα εξήγηση για

Το μέσο σφάλμα δειγματοληψίας δείχνει πόσο η παράμετρος αποκλίνει από τον μέσο όρο πληθυσμό δείγματοςαπό την αντίστοιχη γενική παράμετρο. Αν υπολογίσουμε τον μέσο όρο των σφαλμάτων όλων των πιθανών δειγμάτων ορισμένου τύπουδεδομένου όγκου ( n), που εξάγονται από τον ίδιο γενικό πληθυσμό, λαμβάνουμε το γενικευτικό τους χαρακτηριστικό - μέσο δειγματοληπτικό σφάλμα().

Στη θεωρία της επιλεκτικής παρατήρησης, προκύπτουν τύποι για να καθοριστεί ποιοι είναι ατομικοί για διαφορετικοί τρόποιεπιλογή (επαναλαμβανόμενη και μη επανάληψη), τύποι δειγμάτων που χρησιμοποιήθηκαν και τύποι στατιστικών δεικτών που αξιολογήθηκαν.

Για παράδειγμα, εάν χρησιμοποιείται επαναλαμβανόμενη τυχαία δειγματοληψία, ορίζεται ως:

Κατά την εκτίμηση της μέσης τιμής ενός χαρακτηριστικού.

Εάν το χαρακτηριστικό είναι εναλλακτικό, και το μερίδιο εκτιμάται.

Σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής, γίνεται τροποποίηση των τύπων (1 - n/N):

- για τη μέση τιμή του χαρακτηριστικού.

- για μερίδιο.

Η πιθανότητα να ληφθεί ακριβώς αυτή η τιμή σφάλματος είναι πάντα ίση με 0,683. Στην πράξη, προτιμούν να λαμβάνουν δεδομένα με μεγαλύτερη πιθανότητα, αλλά αυτό οδηγεί σε αύξηση του μεγέθους του δειγματοληπτικού σφάλματος.

Το μέγιστο σφάλμα δειγματοληψίας () ισούται με t-πλάσια του αριθμού των μέσων δειγματοληπτικών σφαλμάτων (στη θεωρία δειγματοληψίας, ο συντελεστής t συνήθως ονομάζεται συντελεστής εμπιστοσύνης):

Εάν το σφάλμα δειγματοληψίας διπλασιαστεί (t = 2), τότε έχουμε πολύ μεγαλύτερη πιθανότητα να μην υπερβεί ένα ορισμένο όριο (στην περίπτωσή μας, διπλάσιο μέσο σφάλμα) - 0,954. Αν πάρουμε t = 3, τότε πιθανότητα εμπιστοσύνηςθα είναι 0,997 - σχεδόν βέβαιο.

Επίπεδο μέγιστο σφάλμαΗ δειγματοληψία εξαρτάται από τους ακόλουθους παράγοντες:

βαθμός διακύμανσης των μονάδων του γενικού πληθυσμού·
το μέγεθος του δείγματος;
επιλεγμένα σχήματα επιλογής (η μη επαναλαμβανόμενη επιλογή δίνει μικρότερο σφάλμα).
επίπεδο αυτοπεποίθησης.

Εάν το μέγεθος του δείγματος είναι μεγαλύτερο από 30, τότε η τιμή t προσδιορίζεται από τον πίνακα κανονικής κατανομής, εάν είναι μικρότερος - από τον πίνακα κατανομής Student.

Ας παρουσιάσουμε μερικές τιμές του συντελεστή εμπιστοσύνης από τον πίνακα κανονικής κατανομής.

Το διάστημα εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού και για το μερίδιο στον πληθυσμό καθορίζεται ως εξής:

Έτσι, ο προσδιορισμός των ορίων του γενικού μέσου όρου και του μεριδίου αποτελείται από τα ακόλουθα βήματα:

Σφάλματα δειγματοληψίας στο διάφοροι τύποιεπιλογή

Στην πραγματικότητα τυχαία και μηχανική δειγματοληψία. Το μέσο σφάλμα της πραγματικής τυχαίας και μηχανικής δειγματοληψίας βρίσκεται χρησιμοποιώντας τους τύπους που παρουσιάζονται στον Πίνακα. 11.3.

Παράδειγμα 11.2. Για τη μελέτη του επιπέδου παραγωγικότητας του κεφαλαίου, πραγματοποιήθηκε δειγματοληπτική έρευνα σε 90 επιχειρήσεις από 225 με τυχαία μέθοδο. επαναδειγματοληψία, από το οποίο προέκυψαν τα στοιχεία που παρουσιάζονται στον πίνακα.

Στο υπό εξέταση παράδειγμα, έχουμε δείγμα 40% (90: 225 = 0,4 ή 40%). Ας προσδιορίσουμε το μέγιστο σφάλμα και τα όριά του για τη μέση τιμή του χαρακτηριστικού στον πληθυσμό σύμφωνα με τα βήματα του αλγορίθμου:

Με βάση τα αποτελέσματα της δειγματοληπτικής έρευνας, υπολογίζουμε τη μέση τιμή και τη διακύμανση στον πληθυσμό του δείγματος:

Πίνακας 11.5.

Αποτελέσματα παρατήρησης			Υπολογιζόμενες τιμές
επίπεδο παραγωγικότητας κεφαλαίου, τρίψιμο, x i	αριθμός επιχειρήσεων, f i	μέσο του διαστήματος, x i \xb4	x i\xb4 f i	x i\xb4 2 f i
Έως 1,4	13	1,3	16,9	21,97
1,4-1,6	15	1,5	22,5	33,75
1,6-1,8	17	1,7	28,9	49,13
1,8-2,0	15	1,9	28,5	54,15
2,0-2,2	16	2,1	33,6	70,56
2.2 και άνω	14	2,3	32,2	74,06
Σύνολο	90	-	162,6	303,62

Δείγμα μέσου όρου

Δειγματική διακύμανση του υπό μελέτη γνωρίσματος

Για τα δεδομένα μας, προσδιορίζουμε το μέγιστο δειγματοληπτικό σφάλμα, για παράδειγμα, με πιθανότητα 0,954. Χρησιμοποιώντας τον πίνακα των τιμών πιθανότητας της συνάρτησης κανονικής κατανομής (δείτε ένα απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1), βρίσκουμε την τιμή του συντελεστή εμπιστοσύνης t, που αντιστοιχεί σε πιθανότητα 0,954. Με πιθανότητα 0,954, ο συντελεστής t είναι 2.

Έτσι, σε 954 περιπτώσεις από τις 1000, η μέση αξία της παραγωγικότητας του κεφαλαίου δεν θα είναι μεγαλύτερη από 1,88 ρούβλια. και όχι λιγότερο από 1,74 ρούβλια.

Ένα επαναλαμβανόμενο σχήμα τυχαίας δειγματοληψίας χρησιμοποιήθηκε παραπάνω. Ας δούμε αν αλλάζουν τα αποτελέσματα της έρευνας αν υποθέσουμε ότι η επιλογή πραγματοποιήθηκε σύμφωνα με ένα μη επαναλαμβανόμενο σχήμα επιλογής. Σε αυτήν την περίπτωση, το μέσο σφάλμα υπολογίζεται χρησιμοποιώντας τον τύπο

Τότε, με πιθανότητα ίση με 0,954, η τιμή του μέγιστου σφάλματος δειγματοληψίας θα είναι:

Τα όρια εμπιστοσύνης για τη μέση τιμή ενός χαρακτηριστικού κατά τη διάρκεια μη επαναλαμβανόμενης τυχαίας επιλογής θα έχουν τις ακόλουθες τιμές:

Έχοντας συγκρίνει τα αποτελέσματα των δύο σχημάτων επιλογής, μπορούμε να συμπεράνουμε ότι η χρήση της μη επαναλαμβανόμενης τυχαίας δειγματοληψίας δίνει πιο ακριβή αποτελέσματα σε σύγκριση με τη χρήση επαναλαμβανόμενης επιλογής με την ίδια πιθανότητα εμπιστοσύνης. Επιπλέον, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο πιο σημαντικά στενεύουν τα όρια των μέσων τιμών κατά τη μετάβαση από το ένα σχήμα επιλογής στο άλλο.

Χρησιμοποιώντας τα δεδομένα του παραδείγματος, προσδιορίζουμε μέσα σε ποια όρια βρίσκεται το μερίδιο των επιχειρήσεων με επίπεδο παραγωγικότητας κεφαλαίου που δεν υπερβαίνει τα 2,0 ρούβλια στον γενικό πληθυσμό:

Ας υπολογίσουμε το μερίδιο δείγματος.

Ο αριθμός των επιχειρήσεων στο δείγμα με επίπεδο παραγωγικότητας κεφαλαίου που δεν υπερβαίνει τα 2,0 ρούβλια είναι 60 μονάδες. Επειτα

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

υπολογίστε τη διακύμανση του μεριδίου στον πληθυσμό του δείγματος

μέσο σφάλμα δειγματοληψίας όταν χρησιμοποιείται επαναλαμβανόμενο σχήμαεπιλογή θα γίνει

Εάν υποθέσουμε ότι χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο σχήμα δειγματοληψίας, τότε το μέσο δειγματοληπτικό σφάλμα, λαμβάνοντας υπόψη τη διόρθωση για το πεπερασμένο του πληθυσμού, θα είναι

Ας ορίσουμε την πιθανότητα εμπιστοσύνης και ας προσδιορίσουμε το μέγιστο σφάλμα δειγματοληψίας.

Με τιμή πιθανότητας P = 0,997, σύμφωνα με τον πίνακα κανονικής κατανομής, λαμβάνουμε την τιμή για τον συντελεστή εμπιστοσύνης t = 3 (δείτε το απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1):

Έτσι, με πιθανότητα 0,997 μπορεί να δηλωθεί ότι στο γενικό πληθυσμό το μερίδιο των επιχειρήσεων με επίπεδο παραγωγικότητας κεφαλαίου που δεν υπερβαίνει τα 2,0 ρούβλια δεν είναι λιγότερο από 54,7% και όχι περισσότερο από 78,7%.

Τυπικό δείγμα. Με τυπικό δείγμα πληθυσμόςτα αντικείμενα χωρίζονται σε k ομάδες, λοιπόν

N 1 + N 2 + … + N i + … + N k = N.

Ο όγκος των μονάδων που εξάγονται από κάθε τυπική ομάδα εξαρτάται από τη μέθοδο δειγματοληψίας που υιοθετείται. δικα τους σύνολοσχηματίζει το απαιτούμενο μέγεθος δείγματος

n 1 + n 2 + … + n i + … + n k = n.

Υπάρχουν οι ακόλουθοι δύο τρόποι οργάνωσης της επιλογής σε μια τυπική ομάδα: ανάλογος με τον όγκο των τυπικών ομάδων και ανάλογος με τον βαθμό διακύμανσης των τιμών των χαρακτηριστικών μεταξύ των μονάδων παρατήρησης σε ομάδες. Ας εξετάσουμε το πρώτο από αυτά, ως το πιο συχνά χρησιμοποιούμενο.

Η επιλογή ανάλογη με το μέγεθος των τυπικών ομάδων προϋποθέτει ότι σε καθεμία από αυτές θα επιλεγούν επόμενος αριθμόςσυγκεντρωτικές μονάδες:

n = n i N i /N

όπου n i είναι ο αριθμός των μονάδων που εξήχθησαν για το δείγμα από την i-η τυπική ομάδα.

n - συνολικό μέγεθος δείγματος.

N i είναι ο αριθμός των μονάδων στο γενικό πληθυσμό που αποτελούσαν την i-η τυπική ομάδα.

N είναι ο συνολικός αριθμός μονάδων στον πληθυσμό.

Η επιλογή των μονάδων εντός των ομάδων γίνεται με τη μορφή τυχαίας ή μηχανικής δειγματοληψίας.

Οι τύποι για την εκτίμηση του μέσου δειγματοληπτικού σφάλματος για τον μέσο όρο και την αναλογία παρουσιάζονται στον Πίνακα. 11.6.

Εδώ είναι ο μέσος όρος των ομαδικών αποκλίσεων τυπικών ομάδων.

Παράδειγμα 11.3. Σε ένα από τα πανεπιστήμια της Μόσχας, διεξήχθη δειγματοληπτική έρευνα φοιτητών για να προσδιοριστεί η μέση παρακολούθηση της πανεπιστημιακής βιβλιοθήκης κατά έναν φοιτητή ανά εξάμηνο. Για το σκοπό αυτό χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο τυπικό δείγμα 5%, του οποίου οι τυπικές ομάδες αντιστοιχούν στον αριθμό του μαθήματος. Με επιλογή ανάλογη με το μέγεθος των τυπικών ομάδων, προέκυψαν τα ακόλουθα δεδομένα:

Πίνακας 11.7.

Αριθμός μαθήματος	Σύνολο μαθητών, ατόμων, N i	Εξετάστηκε ως αποτέλεσμα επιλεκτικής παρατήρησης, άτομα, n i	Μέσος αριθμός επισκέψεων στη βιβλιοθήκη ανά φοιτητή ανά εξάμηνο, x i	Διακύμανση δείγματος εντός της ομάδας,
1	650	33	11	6
2	610	31	8	15
3	580	29	5	18
4	360	18	6	24
5	350	17	10	12
Σύνολο	2 550	128	8	-

Ο αριθμός των φοιτητών που πρέπει να εξεταστούν σε κάθε μάθημα υπολογίζεται ως εξής:

ομοίως για άλλες ομάδες:

Η κατανομή των μέσων τιμών του δείγματος έχει πάντα έναν νόμο κανονικής κατανομής (ή τον προσεγγίζει) για n > 100, ανεξάρτητα από τη φύση της κατανομής του γενικού πληθυσμού. Ωστόσο, στην περίπτωση των μικρών δειγμάτων, ισχύει ένας διαφορετικός νόμος διανομής - η κατανομή Φοιτητών. Σε αυτήν την περίπτωση, ο συντελεστής εμπιστοσύνης βρίσκεται από τον πίνακα κατανομής Student t ανάλογα με την πιθανότητα εμπιστοσύνης P και το μέγεθος δείγματος n. Το Παράρτημα 1 παρέχει ένα τμήμα του πίνακα κατανομής Student t, που παρουσιάζεται ως εξάρτηση της πιθανότητας εμπιστοσύνης από το μέγεθος δείγματος και ο συντελεστής εμπιστοσύνης t.

Παράδειγμα 11.4. Ας υποθέσουμε ότι μια δειγματοληπτική έρευνα οκτώ φοιτητών ακαδημιών έδειξε ότι η προετοιμασία για δοκιμαστική εργασίαΣύμφωνα με στατιστικά στοιχεία, πέρασαν τον ακόλουθο αριθμό ωρών: 8,5; 8.0; 7.8; 9.0; 7.2; 6.2; 8.4; 6.6.

Παράδειγμα 11.5. Ας υπολογίσουμε πόσα από τα 507 βιομηχανικές επιχειρήσειςΗ φορολογική επιθεώρηση θα πρέπει να ελέγξει για να προσδιορίσει με πιθανότητα 0,997 το μερίδιο των επιχειρήσεων με παραβάσεις στην πληρωμή φόρων. Σύμφωνα με στοιχεία από προηγούμενη παρόμοια έρευνα, η τυπική απόκλιση ήταν 0,15. Το σφάλμα δειγματοληψίας αναμένεται να μην είναι μεγαλύτερο από 0,05.

Όταν χρησιμοποιείτε επαναλαμβανόμενη τυχαία δειγματοληψία, ελέγξτε

Σε περίπτωση επαναλαμβανόμενης τυχαίας επιλογής, θα χρειαστεί έλεγχος

Όπως μπορούμε να δούμε, η χρήση μη επαναλαμβανόμενης δειγματοληψίας καθιστά δυνατή τη διενέργεια εξετάσεων πολύ περισσότερο μικρότερο αριθμόαντικείμενα.

Παράδειγμα 11.6. Προγραμματίζεται έρευνα μισθοίσε επιχειρήσεις του κλάδου που χρησιμοποιούν τυχαία, μη επαναλαμβανόμενη δειγματοληψία. Ποιο θα πρέπει να είναι το μέγεθος του πληθυσμού του δείγματος εάν τη στιγμή της έρευνας ο αριθμός των εργαζομένων στον κλάδο ήταν 100.000 άτομα; Το μέγιστο σφάλμα δειγματοληψίας δεν πρέπει να υπερβαίνει τα 100 ρούβλια. με πιθανότητα 0,954. Με βάση τα αποτελέσματα προηγούμενων ερευνών για τους μισθούς του κλάδου, είναι γνωστό ότι ο μέσος όρος τυπική απόκλισηείναι 500 ρούβλια.

Επομένως, για να λυθεί αυτό το πρόβλημα, είναι απαραίτητο να συμπεριληφθούν τουλάχιστον 100 άτομα στο δείγμα.

Η ασυμφωνία μεταξύ των τιμών των δεικτών που λαμβάνονται από το δείγμα και των αντίστοιχων παραμέτρων του γενικού πληθυσμού ονομάζεται σφάλμα αντιπροσωπευτικότητας. Υπάρχουν συστηματικά και τυχαία σφάλματαδείγματα.

Τυχαία σφάλματα δεν εξηγείται αρκετά ομοιόμορφη παρουσίασησε δείγμα διαφορετικών κατηγοριών πληθυσμιακών μονάδων.

Συστηματικά λάθη μπορεί να σχετίζεται με παραβίαση των κανόνων επιλογής ή των συνθηκών δειγματοληψίας.

Έτσι, κατά την έρευνα των προϋπολογισμών των νοικοκυριών, ο πληθυσμός του δείγματος για περισσότερα από 40 χρόνια χτίστηκε με βάση την αρχή της εδαφικής-τομεακής επιλογής, η οποία οφειλόταν στον κύριο σκοπό της δημοσκοπικής έρευνας - να χαρακτηρίσει το βιοτικό επίπεδο των εργαζομένων, των εργαζομένων. και τους συλλογικούς αγρότες. Ο πληθυσμός του δείγματος κατανεμήθηκε ανάλογα με τις περιοχές και τους τομείς της οικονομίας της RSFSR αναλογικά συνολικός αριθμόςαπασχολημένος; Για τη δημιουργία ενός δείγματος βιομηχανίας χρησιμοποιήθηκε ένα τυπικό δείγμα με μηχανική επιλογή μονάδων εντός ομάδων.

Το κύριο κριτήριο επιλογής ήταν ο μέσος μηνιαίος μισθός. Η αρχή της επιλογής εξασφάλιζε την αναλογική εκπροσώπηση στον πληθυσμό του δείγματος των εργαζομένων με διαφορετικά επίπεδα μισθών.

Με την έλευση του νέου Κοινωνικές Ομάδες(επιχειρηματίες, αγρότες, άνεργοι), η αντιπροσωπευτικότητα του δείγματος παραβιάστηκε όχι μόνο λόγω διαφορών με τη δομή του γενικού πληθυσμού, αλλά και λόγω συστηματικού σφάλματος που προέκυψε λόγω της ασυμφωνίας μεταξύ της μονάδας επιλογής (εργαζόμενος) και της παρατήρησης μονάδα (νοικοκυριό). Ένα νοικοκυριό με περισσότερα από ένα εργαζόμενα μέλη ήταν επίσης πιο πιθανό να επιλεγεί από ένα νοικοκυριό με ένα εργαζόμενο μέλος. Οικογένειες που δεν εργάζονταν στους κλάδους της έρευνας εξαιρέθηκαν από το φάσμα των επιλεγμένων μονάδων (νοικοκυριά συνταξιούχων, νοικοκυριά που υφίστανται μέσω αυτοαπασχόλησης κ.λπ.). Η αξιολόγηση της ακρίβειας των αποτελεσμάτων που προέκυψαν (όρια διαστημάτων εμπιστοσύνης, δειγματοληπτικά σφάλματα) ήταν δύσκολη, καθώς δεν χρησιμοποιήθηκαν πιθανολογικά μοντέλα κατά την κατασκευή του δείγματος.

Το 1996-1997 εφαρμόστηκε κατ' αρχήν νέα προσέγγισηγια τη διαμόρφωση δείγματος νοικοκυριών. Ως βάση για την εφαρμογή της χρησιμοποιήθηκαν τα στοιχεία της μικροαπογραφής του 1994. Ο γενικός πληθυσμός για την επιλογή περιελάμβανε όλους τους τύπους νοικοκυριών, με εξαίρεση τα συλλογικά. Και ο πληθυσμός του δείγματος άρχισε να οργανώνεται λαμβάνοντας υπόψη την αντιπροσωπευτικότητα της σύνθεσης και των τύπων των νοικοκυριών σε κάθε θέμα της Ρωσικής Ομοσπονδίας.

Η μέτρηση των σφαλμάτων στην αντιπροσωπευτικότητα των δεικτών του δείγματος βασίζεται στην υπόθεση της τυχαίας φύσης της κατανομής τους στο άπειρο μεγάλος αριθμόςδείγματα.

Χρησιμοποιείται μια ποσοτική αξιολόγηση της αξιοπιστίας ενός δείκτη δείγματος για να ληφθεί μια ιδέα για το γενικό χαρακτηριστικό. Αυτό γίνεται είτε με βάση έναν δείκτη δείγματος, λαμβάνοντας υπόψη το τυχαίο σφάλμα του, είτε με βάση την υποβολή κάποιας υπόθεσης (σχετικά με την τιμή μέση διακύμανση, φύση διανομής, σύνδεση) σε σχέση με τις ιδιότητες του γενικού πληθυσμού.

Για τον έλεγχο μιας υπόθεσης, αξιολογείται η συνέπεια των εμπειρικών δεδομένων με τα υποθετικά δεδομένα.

Το μέγεθος του τυχαίου σφάλματος αντιπροσωπευτικότητας εξαρτάται από:

1) στο μέγεθος του δείγματος.
2) ο βαθμός διακύμανσης του χαρακτηριστικού που μελετάται στον γενικό πληθυσμό.
3) την αποδεκτή μέθοδο σχηματισμού δειγματοληπτικού πληθυσμού.

Υπάρχουν μέτρια (τυπικά) και μέγιστα δειγματοληπτικά σφάλματα.

Μέσο σφάλμα χαρακτηρίζει το μέτρο των αποκλίσεων δεικτών δείγματος από παρόμοιους δείκτες του γενικού πληθυσμού.

Απόλυτο λάθος Είναι γενικά αποδεκτό να λαμβάνεται υπόψη η μέγιστη δυνατή απόκλιση μεταξύ του δείγματος και των γενικών χαρακτηριστικών, δηλ. μέγιστο σφάλμα για μια δεδομένη πιθανότητα εμφάνισής του.

Με βάση τα δεδομένα από τον πληθυσμό του δείγματος, είναι δυνατό να εκτιμηθούν διάφοροι δείκτες (παράμετροι) του γενικού πληθυσμού. Η αξιολόγηση που χρησιμοποιείται πιο συχνά είναι:

– στρατηγός μέσο μέγεθοςτο χαρακτηριστικό που μελετάται (για πολλαπλές τιμές ποσοτικό χαρακτηριστικό);
– γενικό μερίδιο (για εναλλακτικό χαρακτηριστικό).

Η βασική αρχή της χρήσης της μεθόδου δειγματοληψίας είναι η εξασφάλιση ίσων ευκαιριών για όλες τις μονάδες του πληθυσμού που θα επιλεγούν στον πληθυσμό του δείγματος. Με αυτή την προσέγγιση, ικανοποιείται η απαίτηση της τυχαίας, αντικειμενικής επιλογής και, ως εκ τούτου, το δειγματοληπτικό σφάλμα καθορίζεται κυρίως από τον όγκο του ( Π ). Καθώς το τελευταίο αυξάνεται, το μέσο σφάλμα μειώνεται και τα χαρακτηριστικά του πληθυσμού του δείγματος πλησιάζουν εκείνα του γενικού πληθυσμού.

Με τον ίδιο αριθμό πληθυσμών δειγμάτων και άλλα ίσους όρουςΤο δειγματοληπτικό σφάλμα θα είναι μικρότερο σε ένα από αυτά, το οποίο επιλέγεται από τον γενικό πληθυσμό με μικρότερη διαφοροποίηση στο χαρακτηριστικό που μελετάται. Η μείωση της διακύμανσης ενός χαρακτηριστικού σημαίνει μείωση της ποσότητας διασποράς (για ένα ποσοτικό χαρακτηριστικό ή για ένα εναλλακτικό χαρακτηριστικό).

Η εξάρτηση του μεγέθους του δειγματοληπτικού σφάλματος από τις μεθόδους σχηματισμού του πληθυσμού του δείγματος προσδιορίζεται χρησιμοποιώντας τους τύπους για το μέσο δειγματοληπτικό σφάλμα (Πίνακας 5.2).

Ας προσθέσουμε τους δείκτες στον πίνακα. 5.2 με τις ακόλουθες επεξηγήσεις.

Η διακύμανση του δείγματος είναι ελαφρώς μικρότερη από τη γενική διακύμανση, in μαθηματικές στατιστικέςέχει αποδειχθεί ότι

Πίνακας 5.2

Τύποι για τον υπολογισμό του μέσου δειγματοληπτικού σφάλματος με διάφορους τρόπουςεπιλογή

Τύπος δείγματος
	επανάληψη για	επαναλαμβανόμενο για

Πράγματι τυχαίος (απλός)
Κατα συρροη (με ίσες διαστάσεις
Τυπικό (ανάλογα με το μέγεθος της ομάδας)

Εάν ο πληθυσμός του δείγματος είναι μεγάλος (δηλ. Π είναι αρκετά μεγάλο), τότε ο λόγος προσεγγίζει τη μονάδα και η διακύμανση του δείγματος πρακτικά συμπίπτει με τη γενική διακύμανση.

Το δείγμα θεωρείται άνευ όρων μεγάλο όταν p> 100 και σίγουρα μικρό στο Π < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

Μπορούν να υπολογιστούν χρησιμοποιώντας τους ακόλουθους τύπους:

που είναι ο μέσος όρος Εγώ -η σειρά? – συνολικός μέσος όρος για ολόκληρο τον πληθυσμό του δείγματος·

πού είναι το μερίδιο των μονάδων μιας συγκεκριμένης κατηγορίας Εγώ -η σειρά? – το ποσοστό των μονάδων αυτής της κατηγορίας σε ολόκληρο τον πληθυσμό του δείγματος· r – αριθμός επιλεγμένων επεισοδίων.

4. Για τον προσδιορισμό του μέσου όρου σφάλματος ενός τυπικού δείγματος στην περίπτωση επιλογής μονάδων σε αναλογία με το μέγεθος κάθε ομάδας, ο μέσος όρος των διακυμάνσεις εντός της ομάδας(– για ένα ποσοτικό χαρακτηριστικό, για ένα εναλλακτικό χαρακτηριστικό). Σύμφωνα με τον κανόνα για την προσθήκη διακυμάνσεων, η τιμή του μέσου όρου των ενδοομαδικών διακυμάνσεων είναι μικρότερη από την τιμή συνολική διακύμανση. Μέση αξία πιθανό σφάλμαενός τυπικού δείγματος είναι μικρότερο από το σφάλμα ενός απλού κατάλληλου τυχαίου δείγματος.

Συχνά χρησιμοποιείται συνδυασμένη επιλογή: η ατομική επιλογή μονάδων συνδυάζεται με την ομαδική επιλογή, η τυπική επιλογή συνδυάζεται με την επιλογή σε σειρά. Με οποιαδήποτε μέθοδο επιλογής, με μια ορισμένη πιθανότητα μπορεί να δηλωθεί ότι η απόκλιση του μέσου όρου του δείγματος (ή του μεριδίου) από τον γενικό μέσο όρο (ή μερίδιο) δεν θα υπερβαίνει μια ορισμένη τιμή, η οποία ονομάζεται ακραίο λάθος δείγματα.

Η σχέση μεταξύ του ορίου σφάλματος δειγματοληψίας (Δ) είναι εγγυημένη με κάποια πιθανότητα F(t), και το μέσο δειγματοληπτικό σφάλμα έχει τη μορφή: ή , όπου t – συντελεστής εμπιστοσύνης, που καθορίζεται ανάλογα με το επίπεδο πιθανότητας F(t).

Τιμές συνάρτησης F(t) Και t καθορίζονται με βάση ειδικά καταρτισμένους μαθηματικούς πίνακες. Εδώ είναι μερικά από αυτά που χρησιμοποιούνται πιο συχνά:


Τ

Έτσι, το οριακό σφάλμα δειγματοληψίας απαντά στην ερώτηση σχετικά με την ακρίβεια του δείγματος με μια ορισμένη πιθανότητα, η τιμή της οποίας εξαρτάται από την τιμή του συντελεστή εμπιστοσύνης t. Ναι όταν t = 1 πιθανότητα F(t ) η απόκλιση των χαρακτηριστικών του δείγματος από τα γενικά κατά την τιμή ενός απλού μέσου σφάλματος είναι 0,683. Κατά συνέπεια, κατά μέσο όρο, από κάθε 1000 δείγματα, τα 683 θα δίνουν γενικευμένους δείκτες (μέσος όρος, μερίδιο), οι οποίοι θα διαφέρουν από τους γενικούς κατά ένα μόνο μέσο σφάλμα. Στο t = 2 πιθανότητα F(t) είναι ίσο με 0,954, αυτό σημαίνει ότι από κάθε 1000 δείγματα, τα 954 θα δίνουν γενικούς δείκτες που θα διαφέρουν από τους γενικούς δείκτες όχι περισσότερο από δύο φορές το μέσο δειγματοληπτικό σφάλμα κ.λπ.

Μαζί με απόλυτη τιμήυπολογίζεται το μέγιστο σφάλμα δειγματοληψίας και σχετικό σφάλμα, που ορίζεται ως ποσοστόμέγιστο σφάλμα δειγματοληψίας στο αντίστοιχο χαρακτηριστικό του πληθυσμού του δείγματος:

Στην πράξη, συνηθίζεται να ορίζεται η τιμή του Δ, συνήθως εντός 10% του αναμενόμενου μέσου επιπέδου του χαρακτηριστικού.

Ο υπολογισμός του μέσου και του μέγιστου σφαλμάτων δειγματοληψίας μας επιτρέπει να προσδιορίσουμε τα όρια εντός των οποίων θα βρίσκονται τα χαρακτηριστικά του γενικού πληθυσμού:

Τα όρια εντός των οποίων η άγνωστη τιμή του υπό μελέτη δείκτη στον γενικό πληθυσμό θα περιέχεται με δεδομένο βαθμό πιθανότητας ονομάζονται διάστημα εμπιστοσύνης, και η πιθανότητα F(t) – πιθανότητα εμπιστοσύνης. Όσο μεγαλύτερη είναι η τιμή Δ, τόσο μεγαλύτερη είναι η τιμή διάστημα εμπιστοσύνηςκαι συνεπώς χαμηλότερη ακρίβεια εκτίμησης.

Εξετάστε το ακόλουθο παράδειγμα. Για τον προσδιορισμό του μέσου μεγέθους μιας κατάθεσης σε μια τράπεζα, επιλέχθηκαν 200 λογαριασμοί καταθετών σε ξένο νόμισμα με επαναλαμβανόμενη τυχαία δειγματοληψία. Ως αποτέλεσμα, διαπιστώθηκε ότι το μέσο μέγεθοςκατάθεση - 60 χιλιάδες ρούβλια, η απόκλιση ήταν 32. Ταυτόχρονα, 40 λογαριασμοί ήταν κατόπιν ζήτησης. Είναι απαραίτητο, με πιθανότητα 0,954, να καθοριστούν τα όρια εντός των οποίων βρίσκεται το μέσο μέγεθος των καταθέσεων σε λογαριασμούς ξένου νομίσματος σε μια τράπεζα και το μερίδιο των λογαριασμών ζήτησης.

Ας υπολογίσουμε το μέσο σφάλμα του μέσου όρου του δείγματος χρησιμοποιώντας τον τύπο για επαναλαμβανόμενη επιλογή

Το μέγιστο σφάλμα του μέσου όρου του δείγματος με πιθανότητα 0,954 θα είναι

Κατά συνέπεια, το μέσο μέγεθος μιας κατάθεσης σε λογαριασμούς ξένου νομίσματος σε μια τράπεζα είναι εντός χιλιάδων ρούβλια:

Με πιθανότητα 0,954, μπορεί να δηλωθεί ότι η μέση κατάθεση σε λογαριασμούς σε ξένο νόμισμα σε μια τράπεζα κυμαίνεται από 59.200 έως 60.800 ρούβλια.

Ας προσδιορίσουμε το μερίδιο των καταθέσεων όψεως στον πληθυσμό του δείγματος:

Μέσο σφάλμα κλάσματος δείγματος

Το οριακό σφάλμα της μετοχής με πιθανότητα 0,954 θα είναι

Έτσι, το μερίδιο των λογαριασμών ζήτησης στον πληθυσμό είναι εντός w :

Με πιθανότητα 0,954, μπορούμε να πούμε ότι το μερίδιο των λογαριασμών ζήτησης στο σύνολο των λογαριασμών σε ξένο νόμισμα στην τράπεζα κυμαίνεται από 14,4 έως 25,6%.

Στο Οι περιπτωσιολογικές μελέτεςΕίναι σημαντικό να καθοριστεί η βέλτιστη σχέση μεταξύ του μέτρου της αξιοπιστίας των αποτελεσμάτων που ελήφθησαν και του ποσού του επιτρεπόμενου δειγματοληπτικού σφάλματος. Από αυτή την άποψη, κατά την οργάνωση της παρατήρησης του δείγματος, τίθεται το ερώτημα που σχετίζεται με τον καθορισμό του μεγέθους του δείγματος που είναι απαραίτητο για την επίτευξη της απαιτούμενης ακρίβειας των αποτελεσμάτων με δεδομένη πιθανότητα. Ο υπολογισμός του απαιτούμενου μεγέθους δείγματος πραγματοποιείται με βάση τύπους για το μέγιστο δειγματοληπτικό σφάλμα σύμφωνα με τον τύπο και τη μέθοδο επιλογής (Πίνακας 5.3).

Πίνακας 5.3

Τύποι για τον υπολογισμό του μεγέθους του δείγματος χρησιμοποιώντας μια καθαρά τυχαία μέθοδο δειγματοληψίας

Ας συνεχίσουμε με το παράδειγμα, που παρουσιάζει τα αποτελέσματα δειγματοληπτικής έρευνας προσωπικών λογαριασμών τραπεζικών καταθετών.

Είναι απαραίτητο να καθοριστεί πόσοι λογαριασμοί πρέπει να εξεταστούν έτσι ώστε με πιθανότητα 0,977 το σφάλμα στον προσδιορισμό του μέσου μεγέθους κατάθεσης να μην υπερβαίνει τα 1,5 χιλιάδες ρούβλια. Ας εκφράσουμε τον δείκτη μεγέθους δείγματος από τον τύπο για το μέγιστο σφάλμα δειγματοληψίας για επαναλαμβανόμενη επιλογή:

Κατά τον προσδιορισμό του απαιτούμενου μεγέθους δείγματος χρησιμοποιώντας τους παραπάνω τύπους, προκύπτει δυσκολία στην εύρεση των τιμών του σ2 και ναι, καθώς αυτές οι τιμές μπορούν να ληφθούν μόνο μετά τη διεξαγωγή δειγματοληπτικής έρευνας. Από αυτή την άποψη, αντί για τις πραγματικές τιμές αυτών των δεικτών, αντικαθίστανται κατά προσέγγιση, οι οποίες θα μπορούσαν να προσδιοριστούν με βάση οποιαδήποτε δοκιμή δείγματα παρατηρήσεωνή από αναλυτικές προηγούμενες έρευνες.

Σε περιπτώσεις όπου ο στατιστικολόγος γνωρίζει τη μέση τιμή των χαρακτηριστικών που μελετώνται (για παράδειγμα, από οδηγίες, νομοθεσία κ.λπ.) ή τα όρια εντός των οποίων ποικίλλει αυτό το χαρακτηριστικό, μπορεί να εφαρμοστεί ο ακόλουθος υπολογισμός χρησιμοποιώντας κατά προσέγγιση τύπους:

και αντικαταστήστε το προϊόν w(1 – w) με την τιμή 0,25 (w = 0,5).

Για να πάρετε περισσότερα ακριβές αποτέλεσμα, λάβετε τη μέγιστη δυνατή τιμή αυτών των δεικτών. Αν η κατανομή ενός χαρακτηριστικού στον πληθυσμό υπακούει κανονικός νόμος, τότε το εύρος διακύμανσης είναι περίπου ίσο με 6σ ( ακραίες αξίεςαπέχουν εκατέρωθεν από τον μέσο όρο σε απόσταση 3σ). Ως εκ τούτου, αλλά εάν η κατανομή είναι προφανώς ασύμμετρη, τότε .

Για κάθε τύπο δείγματος, ο όγκος του αρχίζει να υπολογίζεται χρησιμοποιώντας τον τύπο επαναλαμβανόμενης επιλογής

Εάν, ως αποτέλεσμα του υπολογισμού, το μερίδιο επιλογής ( n ) υπερβαίνει το 5%, τότε ο υπολογισμός πραγματοποιείται χρησιμοποιώντας τον μη επαναλαμβανόμενο τύπο επιλογής.

Για ένα τυπικό δείγμα, είναι απαραίτητο να διαιρεθεί το συνολικό μέγεθος του δείγματος μεταξύ των επιλεγμένων τύπων μονάδων. Ο υπολογισμός του αριθμού των παρατηρήσεων από κάθε ομάδα εξαρτάται από τα προαναφερθέντα οργανωτικές μορφέςτυπικό δείγμα.

Με μια τυπική επιλογή μονάδων δυσανάλογη προς τον αριθμό των ομάδων, ο συνολικός αριθμός των επιλεγμένων μονάδων διαιρείται με τον αριθμό των ομάδων, η τιμή που προκύπτει δίνει τον αριθμό των επιλογών από κάθε τυπική ομάδα:

Οπου κ – αριθμός προσδιοριζόμενων τυπικών ομάδων.

Όταν επιλέγετε μονάδες σε αναλογία με τον αριθμό των τυπικών ομάδων, ο αριθμός των παρατηρήσεων για κάθε ομάδα καθορίζεται από τον τύπο

από πού είναι το μέγεθος του δείγματος Εγώ η ομάδα? - Ενταση ΗΧΟΥ Εγώ η ομάδα.

Κατά την επιλογή για παραλλαγή σε ένα χαρακτηριστικό, το ποσοστό του δείγματος από κάθε ομάδα θα πρέπει να είναι ανάλογο με την τυπική απόκλιση σε αυτήν την ομάδα (). Ο υπολογισμός του αριθμού () πραγματοποιείται σύμφωνα με τους τύπους

Με τη σειριακή επιλογή, ο απαιτούμενος αριθμός επιλεγμένων σειρών προσδιορίζεται με τον ίδιο τρόπο όπως και με τη σωστή τυχαία επιλογή:

Επανεπιλογή

Επαναλαμβανόμενη επιλογή

Σε αυτήν την περίπτωση, οι διακυμάνσεις και τα σφάλματα δειγματοληψίας μπορούν να υπολογιστούν για τη μέση τιμή ή αναλογία του χαρακτηριστικού.

Κατά τη χρήση παρατήρησης δειγμάτων, ο χαρακτηρισμός των αποτελεσμάτων της είναι δυνατός με βάση τη σύγκριση των ληφθέντων ορίων σφάλματος των δεικτών δείγματος με την τιμή του επιτρεπόμενου σφάλματος.

Από αυτή την άποψη, προκύπτει το καθήκον του προσδιορισμού της πιθανότητας το σφάλμα δειγματοληψίας να μην υπερβαίνει το επιτρεπόμενο σφάλμα. Η λύση σε αυτό το πρόβλημα καταλήγει στον υπολογισμό, με βάση τον τύπο για το μέγιστο δειγματοληπτικό σφάλμα, της τιμής t.

Συνεχίζοντας να εξετάζουμε το παράδειγμα μιας δειγματοληπτικής έρευνας προσωπικών λογαριασμών πελατών τραπεζών, θα βρούμε την πιθανότητα με την οποία μπορεί να δηλωθεί ότι το σφάλμα στον προσδιορισμό του μέσου μεγέθους κατάθεσης δεν θα υπερβαίνει τα 785 ρούβλια:

το αντίστοιχο επίπεδο εμπιστοσύνης θα είναι 0,95.

Επί του παρόντος, η πρακτική δειγματοληψίας περιλαμβάνει στατιστικές παρατηρήσειςδιεξήχθη:

– Σώματα Rosstat.
– άλλα υπουργεία και υπηρεσίες (για παράδειγμα, παρακολούθηση επιχειρήσεων στο σύστημα της Τράπεζας της Ρωσίας).

Μια γνωστή γενίκευση της εμπειρίας στη διοργάνωση δειγματοληπτικών ερευνών για τις μικρές επιχειρήσεις, τον πληθυσμό και τα νοικοκυριά παρουσιάζεται στις Μεθοδολογικές Διατάξεις για τη Στατιστική. Περιέχουν περισσότερα ευρεία έννοιαεπιλεκτική παρατήρηση από αυτή που συζητήθηκε παραπάνω (Πίνακας 5.4).

Στη στατιστική πρακτική χρησιμοποιούνται και οι τέσσερις τύποι δειγμάτων που παρουσιάζονται στον πίνακα. 5.4. Ωστόσο, συνήθως προτιμούν τα δείγματα πιθανοτήτων (τυχαία) που περιγράφονται παραπάνω, τα οποία είναι τα πιο αντικειμενικά, καθώς μπορούν να χρησιμοποιηθούν για την αξιολόγηση της ακρίβειας των αποτελεσμάτων που λαμβάνονται από τα δεδομένα του ίδιου του δείγματος.

Πίνακας 5.4

Τύποι δειγμάτων

Σε δείγματα οιονεί τυχαίος τύπος Η δειγματοληψία πιθανοτήτων θεωρείται ότι υπάρχει με βάση το ότι ο δειγματολήπτης τη θεωρεί αποδεκτή. Ένα παράδειγμα χρήσης της οιονεί τυχαίας δειγματοληψίας στη στατιστική πρακτική είναι η «Δειγματική έρευνα μικρών επιχειρήσεων προς μελέτη κοινωνικές διαδικασίεςσε μικρές επιχειρήσεις", που διεξήχθη το 1996 σε ορισμένες περιοχές της Ρωσίας. Μονάδες παρατήρησης (μικρές επιχειρήσεις) επιλέχθηκαν από ειδικούς, λαμβάνοντας υπόψη την εκπροσώπηση των οικονομικών τομέων από ένα ήδη σχηματισμένο δείγμα έρευνας για τις χρηματοοικονομικές δραστηριότητες των μικρών επιχειρήσεων ( έντυπο «Πληροφορίες για τους κύριους δείκτες χρηματοοικονομικών και οικονομικών δραστηριοτήτων μικρής επιχείρησης») Κατά τη σύνοψη των δεδομένων του δείγματος, θεωρήθηκε ότι ο πληθυσμός του δείγματος σχηματίστηκε με τη μέθοδο της απλής τυχαίας επιλογής.

Απευθείας χρήση της κρίσης των ειδικών Είναι το πιο γενική μέθοδοςσκόπιμη συμπερίληψη μονάδων στο δείγμα. Ένα παράδειγμα τέτοιας μεθόδου επιλογής είναι μονογραφική μέθοδος, που περιλαμβάνει τη λήψη πληροφοριών μόνο από μία μονάδα παρατήρησης, κάτι που είναι χαρακτηριστικό, κατά τη γνώμη του διοργανωτή της έρευνας - ενός ειδικού.

Δείγματα που σχηματίστηκαν με βάση κατευθυνόμενη επιλογή, υλοποιούνται με χρήση αντικειμενικής διαδικασίας, χωρίς όμως τη χρήση πιθανολογικού μηχανισμού. Η μέθοδος της κύριας διάταξης είναι ευρέως γνωστή, στην οποία οι μεγαλύτερες (σημαντικές) μονάδες παρατήρησης που παρέχουν την κύρια συμβολή στον δείκτη περιλαμβάνονται στο δείγμα, για παράδειγμα συνολική αξίαχαρακτηριστικό που αντιπροσωπεύει τον κύριο σκοπό της έρευνας.

Στη στατιστική πρακτική χρησιμοποιείται συχνά συνδυασμένη μέθοδος στατιστικής παρατήρησης. Ο συνδυασμός μεθόδων συνεχούς και επιλεκτικής παρατήρησης έχει δύο πτυχές:

εναλλαγή στο χρόνο?
την ταυτόχρονη χρήση τους (μέρος του πληθυσμού παρατηρείται σε συνεχή βάση, και μέρος παρατηρείται επιλεκτικά).

Εναλλαγή Τα περιοδικά δείγματα με σχετικά σπάνιες συνεχείς έρευνες ή απογραφές είναι απαραίτητα για την αποσαφήνιση της σύνθεσης του υπό μελέτη πληθυσμού. Στο μέλλον, αυτές οι πληροφορίες θα χρησιμοποιηθούν ως στατιστική βάσηεπιλεκτική παρατήρηση. Τα παραδείγματα περιλαμβάνουν απογραφές πληθυσμού και ενδιάμεσες δειγματοληπτικές έρευνες νοικοκυριών.

ΣΕ σε αυτήν την περίπτωσηπρέπει να επιλυθούν οι ακόλουθες εργασίες:

– προσδιορισμός της σύνθεσης των σημείων συνεχούς παρατήρησης που διασφαλίζουν την οργάνωση του δείγματος·
– αιτιολόγηση για περιόδους εναλλαγής, δηλ. όταν τα συνεχή δεδομένα χάνουν τη σημασία τους και απαιτείται κόστος για την ενημέρωσή τους.

Ταυτόχρονη χρήση στο πλαίσιο μιας έρευνας συνεχών και δειγματοληπτικών παρατηρήσεων οφείλεται στην ετερογένεια των πληθυσμών που συναντώνται στη στατιστική πρακτική. Αυτό ισχύει ιδιαίτερα για έρευνες της οικονομικής δραστηριότητας ενός πληθυσμού επιχειρήσεων, οι οποίες χαρακτηρίζονται από λοξές κατανομές των χαρακτηριστικών που μελετώνται, όταν ένας συγκεκριμένος αριθμός μονάδων έχει χαρακτηριστικά που είναι πολύ διαφορετικά από το μεγαλύτερο μέρος των τιμών. Στην περίπτωση αυτή, τέτοιες μονάδες παρατηρούνται σε συνεχή βάση και το άλλο μέρος του πληθυσμού παρατηρείται επιλεκτικά.

Με αυτήν την οργάνωση των παρατηρήσεων, τα κύρια καθήκοντα είναι:

– καθορισμός της βέλτιστης αναλογίας τους·
– ανάπτυξη μεθόδων για την αξιολόγηση της ακρίβειας των αποτελεσμάτων.

Ένα χαρακτηριστικό παράδειγμα που δείχνει αυτή την πτυχή της εφαρμογής συνδυασμένη μέθοδος, είναι γενική αρχήδιεξαγωγή ερευνών πληθυσμού επιχειρήσεων, σύμφωνα με τις οποίες οι έρευνες ενός πληθυσμού μεγάλων και μεσαίων επιχειρήσεων πραγματοποιούνται κυρίως με συνεχή μέθοδο και οι μικρές - με δειγματοληπτική μέθοδο.

Η περαιτέρω ανάπτυξη της μεθοδολογίας δειγματοληπτικής παρατήρησης πραγματοποιείται τόσο σε συνδυασμό με την οργάνωση συνεχούς παρατήρησης όσο και μέσω της οργάνωσης ειδικών ερευνών, η διεξαγωγή των οποίων υπαγορεύεται από την ανάγκη λήψης Επιπλέον πληροφορίεςγια την επίλυση συγκεκριμένων προβλημάτων. Έτσι, η οργάνωση ερευνών στον τομέα των συνθηκών διαβίωσης και του βιοτικού επιπέδου του πληθυσμού παρέχεται σε δύο πτυχές:

– απαιτούμενα εξαρτήματα.
– επιπλέον ενότητες εντός ολοκληρωμένο σύστημαδείκτες.

Οι υποχρεωτικές συνιστώσες μπορεί να περιλαμβάνουν ετήσιες έρευνες για τα έσοδα, τις δαπάνες και την κατανάλωση (ανάλογα με μια έρευνα για τους προϋπολογισμούς των νοικοκυριών), οι οποίες περιλαμβάνουν επίσης βασικούς δείκτες των συνθηκών διαβίωσης του πληθυσμού. Κάθε χρόνο, σύμφωνα με ειδικό σχέδιο, τα υποχρεωτικά στοιχεία πρέπει να συμπληρώνονται με εφάπαξ έρευνες (ενότητες) των συνθηκών διαβίωσης του πληθυσμού που στοχεύουν σε βάθος μελέτηοποιοδήποτε επιλεγμένο κοινωνικό θέμααπό αυτούς συνολικός αριθμός(π.χ. περιουσιακά στοιχεία του νοικοκυριού, υγεία, διατροφή, εκπαίδευση, συνθήκες εργασίας, συνθήκες στέγασης, αναψυχή, κοινωνική κινητικότητα, ασφάλεια, κ.λπ.) με ποικίλη συχνότητα, που καθορίζεται από την ανάγκη για δείκτες και δυνατότητες πόρων.

Έννοια και υπολογισμός του δειγματοληπτικού σφάλματος.

Το καθήκον της παρατήρησης του δείγματος είναι να δώσει σωστές ιδέες για τους συνοπτικούς δείκτες ολόκληρου του πληθυσμού με βάση κάποιο μέρος τους που υποβλήθηκε σε παρατήρηση. Η πιθανή απόκλιση της αναλογίας του δείγματος και του μέσου όρου του δείγματος από την αναλογία και τη μέση τιμή στον πληθυσμό ονομάζεται σφάλμα δειγματοληψίας ή σφάλμα αντιπροσωπευτικότητας. Όσο μεγαλύτερο είναι το μέγεθος αυτού του σφάλματος, τόσο περισσότερο διαφέρουν οι δείκτες παρατήρησης του δείγματος από τους δείκτες γενικού πληθυσμού.

Διαφέρουν:

Σφάλματα δειγματοληψίας.

Σφάλματα εγγραφής.

Σφάλματα εγγραφήςπροκύπτουν όταν ένα γεγονός διαπιστώνεται εσφαλμένα κατά τη διαδικασία παρατήρησης. Είναι χαρακτηριστικά τόσο της συνεχούς παρατήρησης όσο και της επιλεκτικής παρατήρησης, αλλά στην επιλεκτική παρατήρηση είναι λιγότερα.

Από τη φύση τους, τα σφάλματα είναι:

Τεντενιστικός – σκόπιμος, δηλ. Επιλέχθηκαν είτε οι καλύτερες είτε οι χειρότερες μονάδες στον πληθυσμό. Σε αυτή την περίπτωση, οι παρατηρήσεις χάνουν το νόημα.

Τυχαία – η βασική οργανωτική αρχή της δειγματοληπτικής παρατήρησης είναι η αποφυγή της σκόπιμης επιλογής, δηλ. διασφαλίζει την αυστηρή τήρηση της αρχής της τυχαίας επιλογής.

Γενικός κανόναςτυχαία επιλογήείναι: μεμονωμένες μονάδες του γενικού πληθυσμού πρέπει να έχουν ακριβώς τις ίδιες συνθήκες και ευκαιρίες για να εμπίπτουν στον αριθμό των μονάδων που περιλαμβάνονται στο δείγμα. Αυτό χαρακτηρίζει την ανεξαρτησία του αποτελέσματος της δειγματοληψίας από τη βούληση του παρατηρητή. Η βούληση του παρατηρητή γεννά προληπτικά λάθη. Το σφάλμα δειγματοληψίας στην τυχαία δειγματοληψία είναι τυχαία φύση. Χαρακτηρίζει το μέγεθος των αποκλίσεων των γενικών χαρακτηριστικών από τα χαρακτηριστικά του δείγματος.

Λόγω του γεγονότος ότι τα χαρακτηριστικά στον υπό μελέτη πληθυσμό ποικίλλουν, η σύνθεση των μονάδων που περιλαμβάνονται στο δείγμα ενδέχεται να μην συμπίπτει με τη σύνθεση των μονάδων ολόκληρου του πληθυσμού. Αυτό σημαίνει ότι Rκαι δεν συμπίπτουν με WΚαι . Η πιθανή απόκλιση μεταξύ αυτών των χαρακτηριστικών καθορίζεται από το σφάλμα δειγματοληψίας, το οποίο καθορίζεται από τον τύπο:

Οπου - γενική διακύμανση.

πού είναι η διακύμανση του δείγματος.

Αυτό δείχνει από πού διαφέρει η γενική απόκλιση διακύμανση δείγματοςεγκαίρως.

Υπάρχει επαναλαμβανόμενη και μη επαναλαμβανόμενη επιλογή. Η ουσία της επαναλαμβανόμενης επιλογής είναι ότι κάθε μονάδα που περιλαμβάνεται στο δείγμα, μετά από παρατήρηση, επιστρέφει στον γενικό πληθυσμό και μπορεί να επανεξεταστεί. Κατά την επαναδειγματοληψία, υπολογίζεται το μέσο σφάλμα δειγματοληψίας:

Για τον δείκτη του μεριδίου ενός εναλλακτικού χαρακτηριστικού, η διακύμανση του δείγματος προσδιορίζεται από τον τύπο:

Στην πράξη, η επαναλαμβανόμενη επιλογή χρησιμοποιείται σπάνια. Στο επαναλαμβανόμενη επιλογή, μέγεθος πληθυσμού Νμειώνεται κατά τη δειγματοληψία, ο τύπος για το μέσο δειγματοληπτικό σφάλμα για ένα ποσοτικό χαρακτηριστικό έχει τη μορφή:

, Επειτα

Μία από τις πιθανές τιμές στις οποίες το μερίδιο του μελετημένου χαρακτηριστικού μπορεί να είναι ίσο με:

όπου είναι το σφάλμα δειγματοληψίας του εναλλακτικού χαρακτηριστικού.

Παράδειγμα.

Στο δείγμα έρευναςΧρησιμοποιώντας τη μέθοδο χωρίς επαναλαμβανόμενες δειγματοληψίες, ελήφθησαν τα ακόλουθα δεδομένα για την περιεκτικότητα σε υγρασία στα δείγματα από το 10% της παρτίδας του τελικού προϊόντος.

Προσδιορίστε τη μέση % υγρασία, διακύμανση, τυπική απόκλιση, με πιθανότητα 0,954 πιθανά όρια, στην οποία αναμένεται μ.ο. % περιεκτικότητα σε υγρασία όλων των τελικών προϊόντων, με πιθανότητα 0,987 πιθανά όρια ειδικό βάροςτυποποιημένα προϊόντα, υπό την προϋπόθεση ότι η μη τυποποιημένη παρτίδα περιλαμβάνει προϊόντα με περιεκτικότητα σε υγρασία έως 13 και άνω του 19%.

Μόνο με μια ορισμένη πιθανότητα μπορούμε να πούμε ότι το γενικό μερίδιο από το μερίδιο δείγματος και ο γενικός μέσος όρος από το δείγμα αποκλίνει κατά tμια φορά.

Στη στατιστική αυτές οι αποκλίσεις ονομάζονται μέγιστα σφάλματα δειγματοληψίας και ορίζονται .

Η πιθανότητα κρίσεων μπορεί να αυξηθεί ή να μειωθεί ανάλογα tμια φορά. Με πιθανότητα 0,683, στο 0,954, στο 0,987, τότε οι δείκτες του γενικού πληθυσμού προσδιορίζονται από τους δείκτες του δείγματος.

Όπως ήδη γνωρίζουμε, η αντιπροσωπευτικότητα είναι η ιδιότητα ενός πληθυσμού δείγματος να αντιπροσωπεύει τα χαρακτηριστικά του γενικού πληθυσμού. Αν δεν υπάρχει αντιστοιχία, μιλούν για σφάλμα αντιπροσωπευτικότητας - μέτρο απόκλισης της στατιστικής δομής του δείγματος από τη δομή του αντίστοιχου γενικού πληθυσμού. Ας υποθέσουμε ότι το μέσο μηνιαίο οικογενειακό εισόδημα των συνταξιούχων στο γενικό πληθυσμό είναι 2 χιλιάδες ρούβλια και στον πληθυσμό του δείγματος - 6 χιλιάδες ρούβλια. Αυτό σημαίνει ότι ο κοινωνιολόγος πήρε συνέντευξη μόνο από το πλούσιο μέρος των συνταξιούχων και ένα σφάλμα αντιπροσωπευτικότητας μπήκε στη μελέτη του. Με άλλα λόγια, το σφάλμα αντιπροσωπευτικότητας είναι η ασυμφωνία μεταξύ δύο πληθυσμών - του γενικού πληθυσμού, στον οποίο στρέφεται το θεωρητικό ενδιαφέρον του κοινωνιολόγου και μιας ιδέας των ιδιοτήτων των οποίων τελικά θέλει να αποκτήσει, και του δείγματος στο οποίο ο κοινωνιολόγος κατευθύνεται το πρακτικό ενδιαφέρον, το οποίο λειτουργεί ταυτόχρονα ως αντικείμενο έρευνας και ως μέσο λήψης πληροφοριών για τον γενικό πληθυσμό.

Μαζί με τον όρο «σφάλμα αντιπροσωπευτικότητας», ένας άλλος όρος μπορεί να βρεθεί στην εγχώρια βιβλιογραφία: «σφάλμα δειγματοληψίας». Μερικές φορές χρησιμοποιούνται εναλλακτικά, και μερικές φορές χρησιμοποιείται "σφάλμα δειγματοληψίας" αντί για "αντιπροσωπευτικό σφάλμα" ως ποσοτικά πιο ακριβής έννοια.

Σφάλμα δειγματοληψίας είναι η απόκλιση των μέσων χαρακτηριστικών του πληθυσμού του δείγματος από τα μέσα χαρακτηριστικά του γενικού πληθυσμού.

Στην πράξη, το σφάλμα δειγματοληψίας προσδιορίζεται συγκρίνοντας τα γνωστά χαρακτηριστικά πληθυσμού με τα μέσα δείγματος. Στην κοινωνιολογία, κατά την έρευνα του ενήλικου πληθυσμού, χρησιμοποιούνται συχνότερα δεδομένα από απογραφές πληθυσμού, τρέχουσες στατιστικές και αποτελέσματα προηγούμενων ερευνών. Ως παράμετροι ελέγχου χρησιμοποιούνται συνήθως τα κοινωνικοδημογραφικά χαρακτηριστικά. Η σύγκριση των μέσων όρων του γενικού πληθυσμού και του πληθυσμού του δείγματος, με βάση αυτό, ο προσδιορισμός του δειγματοληπτικού σφάλματος και η μείωσή του ονομάζεται έλεγχος αντιπροσωπευτικότητας. Δεδομένου ότι η σύγκριση των δεδομένων ενός ατόμου και των δεδομένων άλλων ανθρώπων μπορεί να γίνει μετά την ολοκλήρωση της μελέτης, αυτή η μέθοδος ελέγχου ονομάζεται εκ των υστέρων, δηλ. πραγματοποιηθεί μετά την εμπειρία.

Στις δημοσκοπήσεις του Gallup, η αντιπροσωπευτικότητα ελέγχεται χρησιμοποιώντας δεδομένα που είναι διαθέσιμα σε εθνικές απογραφές σχετικά με την κατανομή του πληθυσμού ανά φύλο, ηλικία, εκπαίδευση, εισόδημα, επάγγελμα, φυλή, τόπο διαμονής, μέγεθος επίλυση. Πανρωσικό Κέντρο Μελετών κοινή γνώμη(VTsIOM) χρησιμοποιεί για σκοπούς τέτοιους δείκτες όπως φύλο, ηλικία, εκπαίδευση, τύπος οικισμού, Οικογενειακή κατάσταση, τομέας απασχόλησης, θέση εργασίας του ερωτώμενου, τα οποία δανείζονται από την Κρατική Επιτροπή Στατιστικής της Ρωσικής Ομοσπονδίας. Και στις δύο περιπτώσεις ο πληθυσμός είναι γνωστός. Το σφάλμα δειγματοληψίας δεν μπορεί να προσδιοριστεί εάν οι τιμές της μεταβλητής στο δείγμα και στον πληθυσμό είναι άγνωστες.

Οι ειδικοί του VTsIOM διασφαλίζουν την προσεκτική επισκευή του δείγματος κατά την ανάλυση δεδομένων, προκειμένου να ελαχιστοποιηθούν οι αποκλίσεις που προέκυψαν στο στάδιο έρευνα πεδίου. Ιδιαίτερα έντονες προκαταλήψεις παρατηρούνται ως προς το φύλο και την ηλικία. Αυτό εξηγείται από το γεγονός ότι οι γυναίκες και τα άτομα με ανώτερη εκπαίδευσηπερνούν περισσότερο χρόνο στο σπίτι και επικοινωνούν με τον συνεντευκτή πιο εύκολα, δηλ. αποτελούν μια εύκολα προσβάσιμη ομάδα σε σύγκριση με τους άνδρες και τα «αμόρφωτα» άτομα35.

Το δειγματοληπτικό σφάλμα προκαλείται από δύο παράγοντες: τη μέθοδο δειγματοληψίας και το μέγεθος του δείγματος.

Τα δειγματοληπτικά σφάλματα χωρίζονται σε δύο τύπους - τυχαία και συστηματικά. Το τυχαίο σφάλμα είναι η πιθανότητα ο μέσος όρος του δείγματος να πέσει (ή όχι) εκτός των ορίων καθορισμένο διάστημα. Τα τυχαία σφάλματα περιλαμβάνουν στατιστικά σφάλματα που είναι εγγενή στην ίδια τη μέθοδο δειγματοληψίας. Μειώνονται καθώς αυξάνεται το μέγεθος του δείγματος.

Ο δεύτερος τύπος δειγματοληπτικού σφάλματος είναι το συστηματικό σφάλμα. Αν κάποιος κοινωνιολόγος αποφάσιζε να μάθει τη γνώμη όλων των κατοίκων της πόλης για τα συνεχιζόμενα τοπικές αρχέςαρχές στην κοινωνική πολιτική, και ρωτήθηκαν μόνο όσοι έχουν τηλέφωνο, τότε υπάρχει μια σκόπιμη μεροληψία στο δείγμα υπέρ των εύπορων στρωμάτων, δηλ. συστηματικό λάθος.

Έτσι, τα συστηματικά σφάλματα είναι αποτέλεσμα των δραστηριοτήτων του ίδιου του ερευνητή. Είναι τα πιο επικίνδυνα γιατί οδηγούν σε αρκετά σημαντικές προκαταλήψεις στα αποτελέσματα της έρευνας. Τα συστηματικά σφάλματα θεωρούνται χειρότερα από τα τυχαία και επειδή δεν μπορούν να ελεγχθούν και να μετρηθούν.

Προκύπτουν όταν, για παράδειγμα: 1) το δείγμα δεν αντιστοιχεί στους στόχους της μελέτης (ο κοινωνιολόγος αποφάσισε να μελετήσει μόνο τους εργαζόμενους συνταξιούχους, αλλά πήρε συνέντευξη από όλους). 2) υπάρχει προφανής άγνοια της φύσης του γενικού πληθυσμού (ο κοινωνιολόγος πίστευε ότι το 70% όλων των συνταξιούχων δεν εργάζονταν, αλλά αποδείχθηκε ότι μόνο το 10% δεν εργάζονταν). 3) επιλέγονται μόνο «νικητές» στοιχεία του γενικού πληθυσμού (για παράδειγμα, μόνο πλούσιοι συνταξιούχοι).

Προσοχή! Σε αντίθεση με τα τυχαία σφάλματα, τα συστηματικά σφάλματα δεν μειώνονται με την αύξηση του μεγέθους του δείγματος.

Έχοντας συνοψίσει όλες τις περιπτώσεις που συμβαίνουν συστηματικά λάθη, οι μεθοδολόγοι συνέταξαν ένα μητρώο αυτών. Πιστεύουν ότι η πηγή των ανεξέλεγκτων στρεβλώσεων στην κατανομή των δειγματοληπτικών παρατηρήσεων μπορεί να είναι τους ακόλουθους παράγοντες:
♦ μεθοδολογικούς και μεθοδολογικούς κανόνες διεξαγωγής κοινωνιολογική έρευνα;
♦ Επιλέχθηκαν ανεπαρκείς μέθοδοι για τη διαμόρφωση δειγματοληπτικού πληθυσμού, μέθοδοι συλλογής και υπολογισμού δεδομένων.
♦ Οι απαιτούμενες μονάδες παρατήρησης αντικαταστάθηκαν από άλλες, πιο προσιτές.
♦ Διαπιστώθηκε ελλιπής κάλυψη του πληθυσμού του δείγματος (ανεπαρκής παραλαβή ερωτηματολογίων, ελλιπής συμπλήρωσή τους, αδυναμία πρόσβασης μονάδων παρατήρησης).

Ένας κοινωνιολόγος σπάνια κάνει εσκεμμένα λάθη. Συχνότερα, προκύπτουν σφάλματα λόγω του γεγονότος ότι ο κοινωνιολόγος δεν γνωρίζει καλά τη δομή του γενικού πληθυσμού: την κατανομή των ανθρώπων ανά ηλικία, επάγγελμα, εισόδημα κ.λπ.

Τα συστηματικά σφάλματα είναι πιο εύκολο να αποφευχθούν (σε σύγκριση με τα τυχαία), αλλά είναι πολύ δύσκολο να εξαλειφθούν. Είναι καλύτερο να αποτρέψετε τα συστηματικά σφάλματα προβλέποντας με ακρίβεια τις πηγές τους εκ των προτέρων - στην αρχή της μελέτης.

Ακολουθούν μερικοί τρόποι για την αποφυγή σφαλμάτων δειγματοληψίας:
♦ Κάθε μονάδα του πληθυσμού πρέπει να έχει ίση πιθανότητα να συμπεριληφθεί στο δείγμα.
♦ Συνιστάται η επιλογή από ομοιογενείς πληθυσμούς.
♦ Πρέπει να γνωρίζετε τα χαρακτηριστικά του γενικού πληθυσμού.
♦ Κατά τη σύνταξη ενός πληθυσμού δείγματος, πρέπει να λαμβάνονται υπόψη τυχαία και συστηματικά σφάλματα.

Εάν ο πληθυσμός του δείγματος (ή απλώς ένα δείγμα) συνταχθεί σωστά, τότε ο κοινωνιολόγος λαμβάνει αξιόπιστα αποτελέσματα που χαρακτηρίζουν ολόκληρο τον πληθυσμό. Εάν έχει συνταχθεί λανθασμένα, τότε το σφάλμα που προέκυψε στο στάδιο της δειγματοληψίας πολλαπλασιάζεται σε κάθε επόμενο στάδιο της κοινωνιολογικής έρευνας και τελικά φτάνει σε τέτοια τιμή που υπερβαίνει την αξία της έρευνας που διεξήχθη. Λένε ότι τέτοιες έρευνες κάνουν περισσότερο κακό παρά καλό.

Τέτοια σφάλματα μπορούν να προκύψουν μόνο με πληθυσμό δείγματος. Για να αποφύγετε ή να μειώσετε την πιθανότητα σφάλματος, ο ευκολότερος τρόπος είναι να αυξήσετε το μέγεθος του δείγματος (ιδανικά στο μέγεθος του γενικού δείγματος: όταν και οι δύο πληθυσμοί ταιριάζουν, το σφάλμα δειγματοληψίας θα εξαφανιστεί εντελώς). Οικονομικά, αυτή η μέθοδος είναι αδύνατη. Υπάρχει ένας άλλος τρόπος - να βελτιωθεί μαθηματικές μεθόδουςδειγματοληψία. Χρησιμοποιούνται στην πράξη. Αυτό είναι το πρώτο κανάλι διείσδυσης στην κοινωνιολογία των μαθηματικών. Δεύτερο κανάλι - μαθηματική επεξεργασίαδεδομένα.

Ειδικά σημαντικό πρόβλημασυμβαίνουν σφάλματα στην έρευνα μάρκετινγκ όπου χρησιμοποιούνται όχι πολύ μεγάλα δείγματα. Συνήθως αριθμούν αρκετές εκατοντάδες, λιγότερο συχνά - χίλιοι ερωτηθέντες. Εδώ, το σημείο εκκίνησης για τον υπολογισμό του δείγματος είναι το ζήτημα του προσδιορισμού του μεγέθους του πληθυσμού του δείγματος. Το μέγεθος του πληθυσμού του δείγματος εξαρτάται από δύο παράγοντες: 1) το κόστος συλλογής πληροφοριών και 2) την επιθυμία για έναν ορισμένο βαθμό στατιστική σημασίααποτελέσματα που ελπίζει να αποκτήσει ο ερευνητής. Φυσικά, ακόμη και άτομα που δεν έχουν εμπειρία στη στατιστική και την κοινωνιολογία κατανοούν διαισθητικά ότι όσο μεγαλύτερο είναι το μέγεθος του δείγματος, δηλ. Όσο πιο κοντά βρίσκονται στο μέγεθος του πληθυσμού στο σύνολό του, τόσο πιο αξιόπιστα και έγκυρα είναι τα δεδομένα που λαμβάνονται. Ωστόσο, έχουμε ήδη μιλήσει παραπάνω για την πρακτική αδυναμία συνεχών ερευνών σε περιπτώσεις που πραγματοποιούνται σε αντικείμενα των οποίων ο αριθμός ξεπερνά τις δεκάδες, τις εκατοντάδες χιλιάδες ακόμη και τα εκατομμύρια. Είναι σαφές ότι το κόστος συλλογής πληροφοριών (συμπεριλαμβανομένης της πληρωμής για την αναπαραγωγή εργαλείων, της εργασίας των ερωτηματολογίων, των διαχειριστών πεδίου και των χειριστών εισαγωγής υπολογιστών) εξαρτάται από το ποσό που είναι διατεθειμένος να διαθέσει ο πελάτης και εξαρτάται ελάχιστα από τους ερευνητές. Ως προς τον δεύτερο παράγοντα, θα σταθούμε σε αυτόν λίγο πιο αναλυτικά.

Επομένως, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερο είναι το πιθανό σφάλμα. Αν και πρέπει να σημειωθεί ότι αν θέλετε να διπλασιάσετε την ακρίβεια, θα πρέπει να αυξήσετε το δείγμα όχι κατά δύο, αλλά κατά τέσσερα. Για παράδειγμα, να κάνετε διπλάσια ακριβής αξιολόγησηδεδομένα που λαμβάνονται με έρευνα 400 ατόμων, θα χρειαστεί να ερευνήσετε όχι 800, αλλά 1600 άτομα. Ωστόσο, είναι απίθανο η έρευνα μάρκετινγκ να χρειάζεται 100% ακρίβεια. Εάν ένας ζυθοποιός χρειάζεται να ανακαλύψει ποιο ποσοστό των καταναλωτών μπύρας προτιμά το εμπορικό σήμα του έναντι του ανταγωνιστή του - 60% ή 40% - τότε τα σχέδιά του δεν θα επηρεαστούν με κανέναν τρόπο από τη διαφορά μεταξύ 57%, 60 ή 63%.

Το δειγματοληπτικό σφάλμα μπορεί να εξαρτάται όχι μόνο από το μέγεθός του, αλλά και από τον βαθμό διαφορών μεταξύ των επιμέρους μονάδων στον πληθυσμό που μελετάμε. Για παράδειγμα, αν θέλουμε να μάθουμε πόση μπύρα καταναλώνεται, θα διαπιστώσουμε ότι στον πληθυσμό μας τα ποσοστά κατανάλωσης διαφορετικοί άνθρωποιδιαφέρουν σημαντικά (ετερογενής πληθυσμός). Σε άλλη περίπτωση θα μελετήσουμε την κατανάλωση ψωμιού και θα το διαπιστώσουμε διαφορετικοί άνθρωποιδιαφέρει πολύ λιγότερο σημαντικά (ομογενής πληθυσμός). Όσο μεγαλύτερη είναι η διακύμανση (ή η ετερογένεια) μέσα σε έναν πληθυσμό, τόσο μεγαλύτερο είναι το μέγεθος του πιθανού σφάλματος δειγματοληψίας. Αυτό το μοτίβο επιβεβαιώνει μόνο το απλό ΚΟΙΝΗ ΛΟΓΙΚΗ. Έτσι, όπως σωστά αναφέρει ο V. Yadov, «το μέγεθος (όγκος) του δείγματος εξαρτάται από το επίπεδο ομοιογένειας ή ετερογένειας των αντικειμένων που μελετώνται. Όσο πιο ομοιογενείς είναι, τόσο μικρότεροι είναι οι αριθμοί που μπορούν να δώσουν στατιστικά αξιόπιστα συμπεράσματα».

Ο προσδιορισμός του μεγέθους του δείγματος εξαρτάται επίσης από το επίπεδο του διαστήματος εμπιστοσύνης του επιτρεπόμενου στατιστικού σφάλματος. Αυτό αναφέρεται στα λεγόμενα τυχαία σφάλματα, τα οποία σχετίζονται με τη φύση τυχόν στατιστικών σφαλμάτων. ΣΕ ΚΑΙ. Ο Paniotto δίνει τους παρακάτω υπολογισμούς αντιπροσωπευτικό δείγμαυποθέτοντας 5% σφάλμα:
Αυτό σημαίνει ότι εάν, έχοντας ερευνήσει, για παράδειγμα, 400 άτομα σε μια περιφερειακή πόλη, όπου ο ενήλικος πληθυσμός διαλυτών είναι 100 χιλιάδες άτομα, διαπιστώσατε ότι το 33% των ερωτηθέντων αγοραστών προτιμά τα προϊόντα μιας τοπικής μονάδας επεξεργασίας κρέατος, τότε με το 95% Πιθανότητα μπορείτε να πείτε ότι το 33+5% (δηλαδή από 28 έως 38%) των κατοίκων αυτής της πόλης είναι τακτικοί αγοραστές αυτών των προϊόντων.

Μπορείτε επίσης να χρησιμοποιήσετε τους υπολογισμούς του Gallup για να υπολογίσετε την αναλογία μεγέθους δείγματος και το σφάλμα δειγματοληψίας.