Πώς να υπολογίσετε το σφάλμα του μέσου όρου του δείγματος. Μέσος όρος σφαλμάτων επαναλαμβανόμενης και μη επαναλαμβανόμενης δειγματοληψίας

Είναι μια απόκλιση μεταξύ του μέσου όρου του δείγματος και του γενικού πληθυσμού που δεν ξεπερνά το ±6 (δέλτα).

Με βάση θεωρήματα του Chebyshev P. L. μέση τιμή σφάλματοςσε περίπτωση τυχαίας επαναλαμβανόμενης επιλογής, υπολογίζεται χρησιμοποιώντας τον τύπο (για τον μέσο όρο ποσοτικό χαρακτηριστικό):

όπου ο αριθμητής είναι η διακύμανση του χαρακτηριστικού x στον πληθυσμό του δείγματος.
n είναι το μέγεθος του πληθυσμού του δείγματος.

Για ένα εναλλακτικό χαρακτηριστικό, ο τύπος για το μέσο δειγματοληπτικό σφάλμα για την αναλογία από το θεώρημα του J. Bernoulliυπολογίζεται με τον τύπο:

όπου p(1- p) είναι η διασπορά του μεριδίου του χαρακτηριστικού σε πληθυσμός;
n - μέγεθος δείγματος.

Λόγω του ότι η διακύμανση ενός χαρακτηριστικού στον γενικό πληθυσμό δεν είναι επακριβώς γνωστή, στην πράξη χρησιμοποιείται η τιμή της διακύμανσης, η οποία υπολογίζεται για τον πληθυσμό του δείγματος με βάση νόμος μεγάλοι αριθμοί . Σύμφωνα με αυτός ο νόμος πληθυσμό δείγματοςμε μεγάλο μέγεθος δείγματος, αναπαράγει με αρκετή ακρίβεια τα χαρακτηριστικά του γενικού πληθυσμού.

Να γιατί τύποι υπολογισμού μέσο σφάλμα για τυχαία επαναδειγματοληψία θα μοιάζει με αυτό:

1. Για ένα μέσο ποσοτικό χαρακτηριστικό:

όπου S^2 είναι η διακύμανση του χαρακτηριστικού x στον πληθυσμό του δείγματος.
n - μέγεθος δείγματος.

όπου w (1 - w) είναι η διασπορά της αναλογίας του χαρακτηριστικού που μελετάται στον πληθυσμό του δείγματος.

Στη θεωρία πιθανοτήτων αποδείχθηκε ότι εκφράζεται μέσω του δείγματος σύμφωνα με τον τύπο:

Σε περιπτώσεις μικρό δείγμα, όταν ο όγκος του είναι μικρότερος από 30, είναι απαραίτητο να ληφθεί υπόψη ο συντελεστής n/(n-1). Στη συνέχεια, το μέσο σφάλμα ενός μικρού δείγματος υπολογίζεται χρησιμοποιώντας τον τύπο:

Δεδομένου ότι στη διαδικασία της μη επαναλαμβανόμενης δειγματοληψίας ο αριθμός των μονάδων στο γενικό πληθυσμό μειώνεται, τότε στους παραπάνω τύπους για τον υπολογισμό των μέσων σφαλμάτων δειγματοληψίας, η ριζική έκφραση πρέπει να πολλαπλασιαστεί με 1- (n/N).

Οι τύποι υπολογισμού για αυτόν τον τύπο δειγματοληψίας θα μοιάζουν με αυτό:

1. Για ένα μέσο ποσοτικό χαρακτηριστικό:

όπου N είναι ο όγκος του γενικού πληθυσμού. n - μέγεθος δείγματος.

2. Για μια μετοχή (εναλλακτικό χαρακτηριστικό):

όπου 1- (n/N) είναι η αναλογία των μονάδων στο γενικό πληθυσμό που δεν συμπεριλήφθηκαν στο δείγμα.

Εφόσον το n είναι πάντα μικρότερο από το Ν, ο πρόσθετος παράγοντας 1 - (n/N) θα είναι πάντα μικρότερος από ένα. Αυτό σημαίνει ότι μέσο σφάλμαμε επαναλαμβανόμενη επιλογή θα είναι πάντα λιγότερα από ό,τι με επαναλαμβανόμενη επιλογή. Όταν η αναλογία των μονάδων στο γενικό πληθυσμό που δεν συμπεριλήφθηκαν στο δείγμα είναι σημαντική, τότε η τιμή 1 - (n/N) είναι κοντά στο ένα και, στη συνέχεια, το μέσο σφάλμα υπολογίζεται χρησιμοποιώντας τον γενικό τύπο.

Το μέσο σφάλμα εξαρτάται από τους ακόλουθους παράγοντες:

1. Κατά την εφαρμογή της αρχής της τυχαίας επιλογής, το μέσο δειγματοληπτικό σφάλμα προσδιορίζεται πρώτα από το μέγεθος του δείγματος: περισσότερα νούμερα, τόσο μικρότερη είναι η τιμή μέσο δειγματοληπτικό σφάλμα. Ο γενικός πληθυσμός χαρακτηρίζεται με μεγαλύτερη ακρίβεια όταν περισσότερες μονάδες αυτού του πληθυσμού καλύπτονται από παρατήρηση δείγματος

2. Το μέσο σφάλμα εξαρτάται επίσης από το βαθμό διακύμανσης του χαρακτηριστικού. Ο βαθμός διακύμανσης χαρακτηρίζεται από. Όσο μικρότερη είναι η διακύμανση ενός χαρακτηριστικού (διασπορά), τόσο μικρότερο είναι το μέσο δειγματοληπτικό σφάλμα. Με μηδενική διακύμανση (το χαρακτηριστικό δεν μεταβάλλεται), το μέσο σφάλμα δειγματοληψίας είναι μηδέν, επομένως, οποιαδήποτε μονάδα στον πληθυσμό θα χαρακτηρίζει ολόκληρο τον πληθυσμό με αυτό το χαρακτηριστικό.

Στο επιλεκτική παρατήρησηπρέπει να διασφαλιστεί ατύχημαεπιλογή των μονάδων. Κάθε μονάδα πρέπει να έχει ίσες πιθανότητες να επιλεγεί. Σε αυτό βασίζεται ένα τυχαίο δείγμα.

ΠΡΟΣ ΤΗΝ πραγματικό τυχαίο δείγμα αναφέρεται στην επιλογή μονάδων από ολόκληρο τον πληθυσμό (χωρίς προηγουμένως να τον χωρίσετε σε ομάδες) με κλήρωση (κυρίως) ή κάποια άλλη παρόμοια μέθοδο, για παράδειγμα, χρησιμοποιώντας έναν πίνακα τυχαίους αριθμούς. Τυχαία επιλογή- αυτή η επιλογή δεν είναι τυχαία. Η αρχή της τυχαιότητας προϋποθέτει ότι η συμπερίληψη ή η εξαίρεση ενός αντικειμένου από το δείγμα δεν μπορεί να επηρεαστεί από κανέναν άλλο παράγοντα εκτός από την τύχη. Παράδειγμα στην πραγματικότητα τυχαίαΟι κληρώσεις που κερδίζουν μπορούν να χρησιμεύσουν ως επιλογή: από τον συνολικό αριθμό των εισιτηρίων που εκδόθηκαν, ένα συγκεκριμένο μέρος των αριθμών που αντιστοιχούν στα κέρδη επιλέγεται τυχαία. Επιπλέον, παρέχεται σε όλους τους αριθμούς ίσες ευκαιρίες να συμπεριληφθούν στο δείγμα. Σε αυτήν την περίπτωση, ο αριθμός των μονάδων που επιλέγονται στον πληθυσμό του δείγματος καθορίζεται συνήθως με βάση την αποδεκτή αναλογία δείγματος.

Μερίδιο δείγματος είναι ο λόγος του αριθμού των μονάδων στον πληθυσμό του δείγματος προς τον αριθμό των μονάδων στο γενικό πληθυσμό:

Έτσι, με ένα δείγμα 5% από μια παρτίδα εξαρτημάτων των 1000 μονάδων. το μέγεθος του δείγματος Πείναι 50 μονάδες και με δείγμα 10% - 100 μονάδες. και τα λοιπά. Με το δεξί επιστημονική οργάνωσηΤα δειγματοληπτικά σφάλματα αντιπροσωπευτικότητας μπορούν να περιοριστούν σε ελάχιστες τιμές, ως αποτέλεσμα, η επιλεκτική παρατήρηση γίνεται αρκετά ακριβής.

Στην πραγματικότητα τυχαία επιλογή «in καθαρή μορφή«Σπάνια χρησιμοποιείται στην πρακτική της επιλεκτικής παρατήρησης, αλλά είναι το πρωτότυπο μεταξύ όλων των άλλων τύπων επιλογής· περιέχει και εφαρμόζει τις βασικές αρχές της επιλεκτικής παρατήρησης.

Ας εξετάσουμε μερικές ερωτήσεις της θεωρίας της μεθόδου δειγματοληψίας και τους τύπους σφαλμάτων για απλούς τυχαίο δείγμα.

Όταν χρησιμοποιείται η μέθοδος δειγματοληψίας στις στατιστικές, συνήθως χρησιμοποιούνται δύο κύριοι τύποι γενικών δεικτών: μέση αξίαποσοτικό χαρακτηριστικόΚαι σχετικό μέγεθοςεναλλακτική πινακίδα(κοινή χρήση ή ειδικό βάροςμονάδες σε έναν στατιστικό πληθυσμό που διαφέρουν από όλες τις άλλες μονάδες αυτού του πληθυσμού μόνο από την παρουσία του χαρακτηριστικού που μελετάται).

Επιλεκτική μετοχή (w),ή συχνότητα, που καθορίζεται από την αναλογία του αριθμού των μονάδων που διαθέτουν το χαρακτηριστικό που μελετάται Τ,στον συνολικό αριθμό μονάδων του πληθυσμού του δείγματος Π:

Για παράδειγμα, εάν από τα 100 δείγματα λεπτομερειών ( n=100), 95 εξαρτήματα αποδείχτηκαν στάνταρ (Τ=95), μετά το κλάσμα δείγματος

w=95/100=0,95 .

Για να χαρακτηριστεί η αξιοπιστία των δεικτών του δείγματος, υπάρχουν μέση τιμήΚαι μέγιστο σφάλμα δειγματοληψίας.

Σφάλμα δειγματοληψίας ? ή, με άλλα λόγια, το σφάλμα αντιπροσωπευτικότητας είναι η διαφορά μεταξύ του αντίστοιχου δείγματος και των γενικών χαρακτηριστικών:

Το δειγματοληπτικό σφάλμα είναι χαρακτηριστικό μόνο των δειγματοληπτικών παρατηρήσεων. Πως μεγαλύτερη αξίααυτό το σφάλμα, τόσο περισσότερο οι δείκτες του δείγματος διαφέρουν από τους αντίστοιχους γενικούς δείκτες.

Ο μέσος όρος του δείγματος και το μερίδιο δείγματος είναι εγγενώς τυχαίες μεταβλητές, που μπορεί να λάβει διαφορετικές τιμές ανάλογα με το ποιες μονάδες του πληθυσμού περιλαμβάνονται στο δείγμα. Επομένως, τα σφάλματα δειγματοληψίας είναι επίσης τυχαίες μεταβλητές και μπορούν να ληφθούν διαφορετικές έννοιες. Επομένως, προσδιορίζεται ο μέσος όρος των πιθανών σφαλμάτων - το μέσο σφάλμα δειγματοληψίας.

Από τι εξαρτάται μέσο δειγματοληπτικό σφάλμα;Εάν τηρηθεί η αρχή της τυχαίας επιλογής, προσδιορίζεται πρώτα από όλα το μέσο δειγματοληπτικό σφάλμα το μέγεθος του δείγματος:τόσο μεγαλύτερος είναι ο αριθμός με άλλα ίσους όρους, τόσο μικρότερο είναι το μέσο δειγματοληπτικό σφάλμα. Καλύπτοντας τα πάντα με μια δειγματοληπτική έρευνα μεγάλη ποσότηταμονάδες του γενικού πληθυσμού, χαρακτηρίζουμε όλο τον γενικό πληθυσμό όλο και με μεγαλύτερη ακρίβεια.

Το μέσο σφάλμα δειγματοληψίας εξαρτάται επίσης από βαθμός διακύμανσηςτο χαρακτηριστικό που μελετάται. Ο βαθμός διακύμανσης, όπως είναι γνωστό, χαρακτηρίζεται από διασπορά; 2 ή w(1-w)-- για εναλλακτικό σήμα. Όσο μικρότερη είναι η διακύμανση του χαρακτηριστικού, άρα και η διασπορά, τόσο μικρότερο είναι το μέσο δειγματοληπτικό σφάλμα και αντίστροφα. Με μηδενική διασπορά (το χαρακτηριστικό δεν ποικίλλει), το μέσο σφάλμα δειγματοληψίας είναι μηδέν, δηλ. οποιαδήποτε μονάδα στον γενικό πληθυσμό θα χαρακτηρίσει με ακρίβεια ολόκληρο τον πληθυσμό σύμφωνα με αυτό το χαρακτηριστικό.

Η εξάρτηση του μέσου δειγματοληπτικού σφάλματος από τον όγκο του και τον βαθμό διακύμανσης του χαρακτηριστικού αντικατοπτρίζεται σε τύπους που μπορούν να χρησιμοποιηθούν για τον υπολογισμό του μέσου δειγματοληπτικού σφάλματος υπό συνθήκες επιλεκτικής παρατήρησης, όταν τα γενικά χαρακτηριστικά ( x,p)είναι άγνωστα, και επομένως, δεν φαίνεται δυνατό να βρεθεί το πραγματικό σφάλμα δειγματοληψίας απευθείας χρησιμοποιώντας τύπους (Form. 1), (Form. 2).

SH Με τυχαία επαναδειγματοληψία κατά μέσο όρο λάθηθεωρητικά υπολογίζεται χρησιμοποιώντας τους παρακάτω τύπους:

* για το μέσο ποσοτικό χαρακτηριστικό

* για μια μετοχή (εναλλακτικό χαρακτηριστικό)

Αφού πρακτικά η διακύμανση ενός χαρακτηριστικού στον πληθυσμό; 2 δεν είναι ακριβώς γνωστό, στην πράξη χρησιμοποιούν την τιμή της διασποράς S2, που υπολογίζεται για τον πληθυσμό του δείγματος με βάση το νόμο των μεγάλων αριθμών, σύμφωνα με τον οποίο ο πληθυσμός του δείγματος, με αρκετά μεγάλο μέγεθος δείγματος, αναπαράγει με ακρίβεια το χαρακτηριστικά του γενικού πληθυσμού.

Ετσι, τύποι υπολογισμού μέση τιμή δειγματοληπτικά σφάλματα με τυχαία επανεπιλογή, θα είναι τα εξής:

* για το μέσο ποσοτικό χαρακτηριστικό

* για μια μετοχή (εναλλακτικό χαρακτηριστικό)

Ωστόσο, η διασπορά του πληθυσμού του δείγματος δεν είναι ίση με τη διασπορά του γενικού πληθυσμού, και επομένως, τα μέσα δειγματοληπτικά σφάλματα που υπολογίζονται με χρήση των τύπων (Έντυπο 5) και (Έντυπο 6) θα είναι κατά προσέγγιση. Αλλά στη θεωρία πιθανοτήτων έχει αποδειχθεί ότι γενική διακύμανσηεκφράζεται μέσω του εκλογικού με την εξής σχέση:

Επειδή Π/(n-1) για αρκετά μεγάλο Π --Η τιμή είναι κοντά στη μονάδα, τότε μπορούμε να υποθέσουμε ότι, και ως εκ τούτου, σε πρακτικούς υπολογισμούς των μέσων δειγματοληπτικών σφαλμάτων, μπορούν να χρησιμοποιηθούν τύποι (Μορφή 5) και (Φόρμα 6). Και μόνο σε περιπτώσεις μικρού δείγματος (όταν το μέγεθος του δείγματος δεν υπερβαίνει τα 30) είναι απαραίτητο να ληφθεί υπόψη ο συντελεστής Π/(n-1) και υπολογίστε μικρό δείγμα μέσου σφάλματοςσύμφωνα με τον τύπο:

W X Με τυχαία μη επαναλαμβανόμενη επιλογή Στους παραπάνω τύπους για τον υπολογισμό των μέσων σφαλμάτων δειγματοληψίας, είναι απαραίτητο να πολλαπλασιαστεί η ριζική έκφραση με 1-(n/N), καθώς στη διαδικασία της μη επαναλαμβανόμενης δειγματοληψίας ο αριθμός των μονάδων στο γενικό πληθυσμό μειώνεται. Επομένως, για μη επαναλαμβανόμενες δειγματοληψίες τύποι υπολογισμού μέσο δειγματοληπτικό σφάλμα θα λάβει την εξής μορφή:

* για το μέσο ποσοτικό χαρακτηριστικό

* για μια μετοχή (εναλλακτικό χαρακτηριστικό)

. (έντυπο 10)

Επειδή Ππάντα λιγότερο Ν, τότε ο πρόσθετος παράγοντας 1-( n/N) θα είναι πάντα λιγότερο από ένα. Επομένως, το μέσο σφάλμα κατά τη μη επαναλαμβανόμενη επιλογή θα είναι πάντα μικρότερο από ό,τι κατά την επαναλαμβανόμενη επιλογή. Ταυτόχρονα, με ένα σχετικά μικρό ποσοστό του δείγματος, αυτός ο πολλαπλασιαστής είναι κοντά στη μονάδα (για παράδειγμα, με δείγμα 5% ισούται με 0,95, με δείγμα 2% είναι 0,98 κ.λπ.). Επομένως, μερικές φορές στην πράξη χρησιμοποιούν τύπους (Έντυπο 5) και (Φόρμα 6) χωρίς τον καθορισμένο πολλαπλασιαστή για τον προσδιορισμό του μέσου δειγματοληπτικού σφάλματος, αν και το δείγμα είναι οργανωμένο ως μη επαναλαμβανόμενο. Αυτό συμβαίνει σε περιπτώσεις όπου ο αριθμός των μονάδων στον πληθυσμό N είναι άγνωστος ή απεριόριστος ή πότε Ππολύ λίγο σε σύγκριση με Ν, και ουσιαστικά, η εισαγωγή ενός πρόσθετου πολλαπλασιαστή, κοντά σε τιμή στη μονάδα, δεν θα έχει ουσιαστικά καμία επίδραση στην τιμή του μέσου δειγματοληπτικού σφάλματος.

Μηχανική δειγματοληψία είναι ότι η επιλογή των μονάδων σε ένα δείγμα πληθυσμού από τον γενικό πληθυσμό, χωρίζεται σύμφωνα με ένα ουδέτερο κριτήριο σε ίσα διαστήματα(ομάδες), πραγματοποιείται με τέτοιο τρόπο ώστε από κάθε τέτοια ομάδα να επιλέγεται μόνο μία μονάδα για το δείγμα. Για να αποφευχθεί η μεροληψία, θα πρέπει να επιλεγεί η μονάδα που βρίσκεται στη μέση κάθε ομάδας.

Κατά την οργάνωση της μηχανικής επιλογής, οι μονάδες του πληθυσμού είναι προκαταρκτικά διατεταγμένες (συνήθως σε λίστα) με μια συγκεκριμένη σειρά (για παράδειγμα, κατά αλφάβητο, τοποθεσία, σε αύξουσα ή φθίνουσα σειρά των τιμών κάποιου δείκτη που δεν σχετίζεται με την ιδιοκτησία υπό μελέτη, κ.λπ.) κ.λπ.), μετά την οποία ένας δεδομένος αριθμός μονάδων επιλέγεται μηχανικά, σε ένα ορισμένο διάστημα. Σε αυτή την περίπτωση, το μέγεθος του διαστήματος στον πληθυσμό είναι ίσο με αμοιβαία αξίαδείγμα μετοχών. Έτσι, με δείγμα 2%, επιλέγεται και ελέγχεται κάθε 50η μονάδα (1: 0,02), με δείγμα 5% - κάθε 20η μονάδα (1: 0,05), για παράδειγμα, συγκλίνον τμήμα από το μηχάνημα.

Όταν αρκετά μεγάλο πληθυσμόΗ μηχανική επιλογή είναι σχεδόν καθαρά τυχαία όσον αφορά την ακρίβεια των αποτελεσμάτων της. Επομένως, για τον προσδιορισμό του μέσου σφάλματος της μηχανικής δειγματοληψίας, χρησιμοποιούνται οι τύποι για σωστή τυχαία μη επαναλαμβανόμενη δειγματοληψία (Έντυπο 9), (Έντυπο 10).

Για να επιλέξετε μονάδες από έναν ετερογενή πληθυσμό, τα λεγόμενα τυπικό δείγμα , που χρησιμοποιείται σε περιπτώσεις όπου όλες οι μονάδες του γενικού πληθυσμού μπορούν να χωριστούν σε πολλές ποιοτικά ομοιογενείς, παρόμοιες ομάδες σύμφωνα με χαρακτηριστικά που επηρεάζουν τους δείκτες που μελετώνται.

Κατά την έρευνα επιχειρήσεων, τέτοιες ομάδες μπορεί να είναι, για παράδειγμα, βιομηχανία και υποβιομηχανία, μορφές ιδιοκτησίας. Στη συνέχεια, από κάθε τυπική ομάδα, χρησιμοποιείται ένα καθαρά τυχαίο ή μηχανικό δείγμα για την επιλογή μεμονωμένων μονάδων στον πληθυσμό του δείγματος.

Συνήθως χρησιμοποιείται τυπική δειγματοληψία κατά τη μελέτη πολύπλοκων στατιστικών πληθυσμών. Για παράδειγμα, κατά τη διάρκεια μιας δειγματοληπτικής έρευνας των οικογενειακών προϋπολογισμών των εργαζομένων και των εργαζομένων σε ορισμένους τομείς της οικονομίας, η παραγωγικότητα της εργασίας των εργαζομένων στις επιχειρήσεις αντιπροσωπεύεται χωριστές ομάδεςσύμφωνα με τα προσόντα.

Ένα τυπικό δείγμα δίνει περισσότερα ακριβή αποτελέσματασε σύγκριση με άλλες μεθόδους επιλογής μονάδων σε έναν πληθυσμό δείγματος. Η πληκτρολόγηση του γενικού πληθυσμού διασφαλίζει την αντιπροσωπευτικότητα ενός τέτοιου δείγματος, την αναπαράσταση κάθε τυπολογικής ομάδας σε αυτό, γεγονός που καθιστά δυνατό τον αποκλεισμό της επίδρασης της διασποράς μεταξύ ομάδων στο μέσο δειγματοληπτικό σφάλμα.

Κατά τον καθορισμό μέσο σφάλμα ενός τυπικού δείγματοςλειτουργεί ως δείκτης διακύμανσης μέσος όρος από μέσα ομαδικές διακυμάνσεις.

Μέσο δειγματοληπτικό σφάλμα βρέθηκε χρησιμοποιώντας τους τύπους:

* για το μέσο ποσοτικό χαρακτηριστικό

(επαναεπιλογή) (έντυπο 11)

(μη αναστρέψιμη επιλογή) (έντυπο 12)

* για μια μετοχή (εναλλακτικό χαρακτηριστικό)

(επαναεπιλογή) (έντυπο.13)

(μη επαναλαμβανόμενη επιλογή), (φόρμα 14)

πού είναι ο μέσος όρος των διακυμάνσεων εντός της ομάδας για τον πληθυσμό του δείγματος;

Ο μέσος όρος των διακυμάνσεων εντός της ομάδας της αναλογίας (ενός εναλλακτικού χαρακτηριστικού) για τον πληθυσμό του δείγματος.

Σειριακή δειγματοληψία περιλαμβάνει τυχαία επιλογή από τον γενικό πληθυσμό όχι μεμονωμένων μονάδων, αλλά ίσων ομάδων τους (φωλιές, σειρές) προκειμένου να υποβληθούν όλες οι μονάδες σε τέτοιες ομάδες σε παρατήρηση χωρίς εξαίρεση.

Εφαρμογή σειριακή δειγματοληψίαλόγω του ότι πολλά εμπορεύματα για τη μεταφορά, αποθήκευση και πώλησή τους συσκευάζονται σε δέματα, κουτιά κ.λπ. Επομένως, κατά τον έλεγχο της ποιότητας των συσκευασμένων αγαθών, είναι πιο λογικό να ελέγχετε πολλά πακέτα (σειρές) παρά να επιλέγετε από όλα τα πακέτα απαιτούμενο ποσόεμπορεύματα.

Δεδομένου ότι εντός των ομάδων (σειρών) εξετάζονται όλες οι μονάδες χωρίς εξαίρεση, το μέσο σφάλμα δειγματοληψίας (όταν επιλέγουμε ίσες σειρές) εξαρτάται μόνο από τη διασπορά μεταξύ ομάδων (ενδιάμεσων σειρών).

SH Μέσο δειγματοληπτικό σφάλμα για το μέσο ποσοτικό χαρακτηριστικό κατά τη σειριακή επιλογή βρίσκονται χρησιμοποιώντας τους τύπους:

(επαναεπιλογή) (έντυπο.15)

(μη επαναλαμβανόμενη επιλογή), (φόρμα 16)

Οπου r-αριθμός επιλεγμένων επεισοδίων. R-συνολικός αριθμόςσειρά.

Η διακύμανση μεταξύ των ομάδων ενός σειριακού δείγματος υπολογίζεται ως εξής:

που είναι ο μέσος όρος Εγώ- η σειρά? - ο συνολικός μέσος όρος για ολόκληρο τον πληθυσμό του δείγματος.

SH Μέσο σφάλμα δειγματοληψίας για κοινή χρήση (εναλλακτικό χαρακτηριστικό) σε σειριακή επιλογή:

(επαναεπιλογή) (έντυπο 17)

(μη επαναλαμβανόμενη επιλογή). (έντυπο 18)

Διαομαδική(ενδιάμεση σειρά) διακύμανση του μεριδίου σειριακού δείγματοςκαθορίζεται από τον τύπο:

, (έντυπο 19)

πού είναι το μερίδιο του χαρακτηριστικού σε Εγώ-η σειρά? - το συνολικό μερίδιο του χαρακτηριστικού σε ολόκληρο τον πληθυσμό του δείγματος.

Στην πρακτική των στατιστικών ερευνών, εκτός από τις μεθόδους επιλογής που συζητήθηκαν προηγουμένως, χρησιμοποιείται ένας συνδυασμός αυτών (συνδυασμένη επιλογή).

Όπως ήδη γνωρίζουμε, η αντιπροσωπευτικότητα είναι η ιδιότητα ενός πληθυσμού δείγματος να αντιπροσωπεύει τα χαρακτηριστικά του γενικού πληθυσμού. Αν δεν υπάρχει αντιστοιχία, μιλούν για σφάλμα αντιπροσωπευτικότητας - μέτρο απόκλισης της στατιστικής δομής του δείγματος από τη δομή του αντίστοιχου γενικού πληθυσμού. Ας υποθέσουμε ότι το μέσο μηνιαίο οικογενειακό εισόδημα των συνταξιούχων στο γενικό πληθυσμό είναι 2 χιλιάδες ρούβλια και στον πληθυσμό του δείγματος - 6 χιλιάδες ρούβλια. Αυτό σημαίνει ότι ο κοινωνιολόγος πήρε συνέντευξη μόνο από το πλούσιο μέρος των συνταξιούχων και ένα σφάλμα αντιπροσωπευτικότητας μπήκε στη μελέτη του. Με άλλα λόγια, το σφάλμα αντιπροσωπευτικότητας είναι η ασυμφωνία μεταξύ δύο πληθυσμών - του γενικού πληθυσμού, στον οποίο στρέφεται το θεωρητικό ενδιαφέρον του κοινωνιολόγου και μιας ιδέας των ιδιοτήτων των οποίων τελικά θέλει να αποκτήσει, και του δείγματος στο οποίο ο κοινωνιολόγος κατευθύνεται το πρακτικό ενδιαφέρον, το οποίο λειτουργεί ταυτόχρονα ως αντικείμενο έρευνας και ως μέσο λήψης πληροφοριών για τον γενικό πληθυσμό.

Μαζί με τον όρο «σφάλμα αντιπροσωπευτικότητας», ένας άλλος όρος μπορεί να βρεθεί στην εγχώρια βιβλιογραφία: «σφάλμα δειγματοληψίας». Μερικές φορές χρησιμοποιούνται εναλλακτικά, και μερικές φορές χρησιμοποιείται «σφάλμα δειγματοληψίας» αντί για «αντιπροσωπευτικό σφάλμα» ως ποσοτικά πιο ακριβής έννοια.

Σφάλμα δειγματοληψίας είναι η απόκλιση των μέσων χαρακτηριστικών του πληθυσμού του δείγματος από τα μέσα χαρακτηριστικά του γενικού πληθυσμού.

Στην πράξη, το σφάλμα δειγματοληψίας προσδιορίζεται συγκρίνοντας τα γνωστά χαρακτηριστικά πληθυσμού με τα μέσα δείγματος. Στην κοινωνιολογία, κατά την έρευνα του ενήλικου πληθυσμού, χρησιμοποιούνται συχνότερα δεδομένα από απογραφές πληθυσμού, τρέχουσες στατιστικές και αποτελέσματα προηγούμενων ερευνών. Ως παράμετροι ελέγχου χρησιμοποιούνται συνήθως τα κοινωνικοδημογραφικά χαρακτηριστικά. Η σύγκριση των μέσων όρων του γενικού πληθυσμού και του πληθυσμού του δείγματος, με βάση αυτό, ο προσδιορισμός του δειγματοληπτικού σφάλματος και η μείωσή του ονομάζεται έλεγχος αντιπροσωπευτικότητας. Δεδομένου ότι η σύγκριση των δεδομένων ενός ατόμου και των δεδομένων άλλων ανθρώπων μπορεί να γίνει μετά την ολοκλήρωση της μελέτης, αυτή η μέθοδος ελέγχου ονομάζεται εκ των υστέρων, δηλ. πραγματοποιηθεί μετά την εμπειρία.

Στις δημοσκοπήσεις του Gallup, η αντιπροσωπευτικότητα ελέγχεται χρησιμοποιώντας δεδομένα που είναι διαθέσιμα σε εθνικές απογραφές σχετικά με την κατανομή του πληθυσμού ανά φύλο, ηλικία, εκπαίδευση, εισόδημα, επάγγελμα, φυλή, τόπο διαμονής, μέγεθος επίλυση. Πανρωσικό Κέντρο Μελετών κοινή γνώμη(VTsIOM) χρησιμοποιεί για σκοπούς τέτοιους δείκτες όπως φύλο, ηλικία, εκπαίδευση, τύπος οικισμού, Οικογενειακή κατάσταση, τομέας απασχόλησης, θέση εργασίας του ερωτώμενου, τα οποία δανείζονται από την Κρατική Επιτροπή Στατιστικής της Ρωσικής Ομοσπονδίας. Και στις δύο περιπτώσεις ο πληθυσμός είναι γνωστός. Το σφάλμα δειγματοληψίας δεν μπορεί να προσδιοριστεί εάν οι τιμές της μεταβλητής στο δείγμα και στον πληθυσμό είναι άγνωστες.

Οι ειδικοί του VTsIOM διασφαλίζουν την προσεκτική επισκευή του δείγματος κατά την ανάλυση δεδομένων, προκειμένου να ελαχιστοποιηθούν οι αποκλίσεις που προέκυψαν στο στάδιο έρευνα πεδίου. Ιδιαίτερα έντονες προκαταλήψεις παρατηρούνται ως προς το φύλο και την ηλικία. Αυτό εξηγείται από το γεγονός ότι οι γυναίκες και τα άτομα με ανώτερη εκπαίδευσηπερνούν περισσότερο χρόνο στο σπίτι και επικοινωνούν με τον συνεντευκτή πιο εύκολα, δηλ. αποτελούν μια εύκολα προσβάσιμη ομάδα σε σύγκριση με τους άνδρες και τα «αμόρφωτα» άτομα35.

Το δειγματοληπτικό σφάλμα προκαλείται από δύο παράγοντες: τη μέθοδο δειγματοληψίας και το μέγεθος του δείγματος.

Τα δειγματοληπτικά σφάλματα χωρίζονται σε δύο τύπους - τυχαία και συστηματικά. Το τυχαίο σφάλμα είναι η πιθανότητα ο μέσος όρος του δείγματος να πέσει (ή όχι) εκτός των ορίων καθορισμένο διάστημα. Τα τυχαία σφάλματα περιλαμβάνουν στατιστικά σφάλματα που είναι εγγενή στην ίδια τη μέθοδο δειγματοληψίας. Μειώνονται καθώς αυξάνεται το μέγεθος του δείγματος.

Ο δεύτερος τύπος δειγματοληπτικού σφάλματος είναι το συστηματικό σφάλμα. Αν κάποιος κοινωνιολόγος αποφάσιζε να μάθει τη γνώμη όλων των κατοίκων της πόλης για τα συνεχιζόμενα τοπικές αρχέςαρχές στην κοινωνική πολιτική, και ρωτήθηκαν μόνο όσοι έχουν τηλέφωνο, τότε υπάρχει μια σκόπιμη μεροληψία στο δείγμα υπέρ των εύπορων στρωμάτων, δηλ. συστηματικό λάθος.

Έτσι, τα συστηματικά σφάλματα είναι αποτέλεσμα των δραστηριοτήτων του ίδιου του ερευνητή. Είναι τα πιο επικίνδυνα γιατί οδηγούν σε αρκετά σημαντικές προκαταλήψεις στα αποτελέσματα της έρευνας. Τα συστηματικά σφάλματα θεωρούνται χειρότερα από τα τυχαία και επειδή δεν μπορούν να ελεγχθούν και να μετρηθούν.

Προκύπτουν όταν, για παράδειγμα: 1) το δείγμα δεν αντιστοιχεί στους στόχους της μελέτης (ο κοινωνιολόγος αποφάσισε να μελετήσει μόνο τους εργαζόμενους συνταξιούχους, αλλά πήρε συνέντευξη από όλους). 2) υπάρχει προφανής άγνοια της φύσης του γενικού πληθυσμού (ο κοινωνιολόγος πίστευε ότι το 70% όλων των συνταξιούχων δεν εργάζονταν, αλλά αποδείχθηκε ότι μόνο το 10% δεν εργάζονταν). 3) επιλέγονται μόνο «νικητές» στοιχεία του γενικού πληθυσμού (για παράδειγμα, μόνο πλούσιοι συνταξιούχοι).

Προσοχή! Σε αντίθεση με τα τυχαία σφάλματα, τα συστηματικά σφάλματα δεν μειώνονται με την αύξηση του μεγέθους του δείγματος.

Έχοντας συνοψίσει όλες τις περιπτώσεις που συμβαίνουν συστηματικά λάθη, οι μεθοδολόγοι συνέταξαν ένα μητρώο αυτών. Πιστεύουν ότι η πηγή των ανεξέλεγκτων στρεβλώσεων στην κατανομή των δειγματοληπτικών παρατηρήσεων μπορεί να είναι τους ακόλουθους παράγοντες:
♦ μεθοδολογικούς και μεθοδολογικούς κανόνες διεξαγωγής κοινωνιολογική έρευνα;
♦ Επιλέχθηκαν ανεπαρκείς μέθοδοι για τη διαμόρφωση δειγματοληπτικού πληθυσμού, μέθοδοι συλλογής και υπολογισμού δεδομένων.
♦ Οι απαιτούμενες μονάδες παρατήρησης αντικαταστάθηκαν από άλλες, πιο προσιτές.
♦ Διαπιστώθηκε ελλιπής κάλυψη του πληθυσμού του δείγματος (ανεπαρκής παραλαβή ερωτηματολογίων, ελλιπής συμπλήρωσή τους, αδυναμία πρόσβασης μονάδων παρατήρησης).

Ένας κοινωνιολόγος σπάνια κάνει εσκεμμένα λάθη. Συχνότερα, προκύπτουν σφάλματα λόγω του γεγονότος ότι ο κοινωνιολόγος δεν γνωρίζει καλά τη δομή του γενικού πληθυσμού: την κατανομή των ανθρώπων ανά ηλικία, επάγγελμα, εισόδημα κ.λπ.

Τα συστηματικά σφάλματα είναι πιο εύκολο να αποφευχθούν (σε σύγκριση με τα τυχαία), αλλά είναι πολύ δύσκολο να εξαλειφθούν. Είναι καλύτερο να αποτρέψετε τα συστηματικά σφάλματα προβλέποντας με ακρίβεια τις πηγές τους εκ των προτέρων - στην αρχή της μελέτης.

Ακολουθούν ορισμένοι τρόποι για την αποφυγή σφαλμάτων δειγματοληψίας:
♦ Κάθε μονάδα του πληθυσμού πρέπει να έχει ίση πιθανότητα να συμπεριληφθεί στο δείγμα.
♦ Συνιστάται να επιλέξετε από ομοιογενείς πληθυσμούς.
♦ Πρέπει να γνωρίζετε τα χαρακτηριστικά του γενικού πληθυσμού.
♦ Κατά τη σύνταξη ενός πληθυσμού δείγματος, πρέπει να λαμβάνονται υπόψη τυχαία και συστηματικά σφάλματα.

Εάν ο πληθυσμός του δείγματος (ή απλώς ένα δείγμα) συνταχθεί σωστά, τότε ο κοινωνιολόγος λαμβάνει αξιόπιστα αποτελέσματα που χαρακτηρίζουν ολόκληρο τον πληθυσμό. Εάν έχει συνταχθεί λανθασμένα, τότε το σφάλμα που προέκυψε στο στάδιο της δειγματοληψίας πολλαπλασιάζεται σε κάθε επόμενο στάδιο της κοινωνιολογικής έρευνας και τελικά φτάνει σε τέτοια τιμή που υπερβαίνει την αξία της έρευνας που διεξήχθη. Λένε ότι τέτοιες έρευνες κάνουν περισσότερο κακό παρά καλό.

Τέτοια σφάλματα μπορούν να προκύψουν μόνο με πληθυσμό δείγματος. Για να αποφύγετε ή να μειώσετε την πιθανότητα σφάλματος, ο ευκολότερος τρόπος είναι να αυξήσετε το μέγεθος του δείγματος (ιδανικά στο μέγεθος του γενικού δείγματος: όταν και οι δύο πληθυσμοί ταιριάζουν, το σφάλμα δειγματοληψίας θα εξαφανιστεί εντελώς). Από οικονομική άποψη, αυτή η μέθοδος είναι αδύνατη. Υπάρχει ένας άλλος τρόπος - να βελτιωθεί μαθηματικές μεθόδουςδειγματοληψία. Χρησιμοποιούνται στην πράξη. Αυτό είναι το πρώτο κανάλι διείσδυσης στην κοινωνιολογία των μαθηματικών. Δεύτερο κανάλι - μαθηματική επεξεργασίαδεδομένα.

Ειδικά σημαντικό πρόβλημασυμβαίνουν σφάλματα στην έρευνα μάρκετινγκ όπου χρησιμοποιούνται όχι πολύ μεγάλα δείγματα. Συνήθως αριθμούν αρκετές εκατοντάδες, λιγότερο συχνά - χίλιοι ερωτηθέντες. Εδώ, το σημείο εκκίνησης για τον υπολογισμό του δείγματος είναι το ζήτημα του προσδιορισμού του μεγέθους του πληθυσμού του δείγματος. Το μέγεθος του πληθυσμού του δείγματος εξαρτάται από δύο παράγοντες: 1) το κόστος συλλογής πληροφοριών και 2) την επιθυμία για έναν ορισμένο βαθμό στατιστική σημασίααποτελέσματα που ελπίζει να αποκτήσει ο ερευνητής. Φυσικά, ακόμη και άτομα που δεν έχουν εμπειρία στη στατιστική και την κοινωνιολογία κατανοούν διαισθητικά ότι όσο μεγαλύτερο είναι το μέγεθος του δείγματος, δηλ. Όσο πιο κοντά βρίσκονται στο μέγεθος του πληθυσμού στο σύνολό του, τόσο πιο αξιόπιστα και έγκυρα είναι τα δεδομένα που λαμβάνονται. Ωστόσο, έχουμε ήδη μιλήσει παραπάνω για την πρακτική αδυναμία συνεχών ερευνών σε περιπτώσεις που πραγματοποιούνται σε αντικείμενα των οποίων ο αριθμός ξεπερνά τις δεκάδες, τις εκατοντάδες χιλιάδες ακόμη και τα εκατομμύρια. Είναι σαφές ότι το κόστος συλλογής πληροφοριών (συμπεριλαμβανομένης της πληρωμής για την αναπαραγωγή εργαλείων, της εργασίας των ερωτηματολογίων, των διαχειριστών πεδίου και των χειριστών εισαγωγής υπολογιστών) εξαρτάται από το ποσό που είναι διατεθειμένος να διαθέσει ο πελάτης και εξαρτάται ελάχιστα από τους ερευνητές. Ως προς τον δεύτερο παράγοντα, θα σταθούμε σε αυτόν λίγο πιο αναλυτικά.

Επομένως, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερο είναι το πιθανό σφάλμα. Αν και πρέπει να σημειωθεί ότι αν θέλετε να διπλασιάσετε την ακρίβεια, θα πρέπει να αυξήσετε το δείγμα όχι κατά δύο, αλλά κατά τέσσερα. Για παράδειγμα, να κάνετε διπλάσια ακριβής αξιολόγησηδεδομένα που λαμβάνονται με έρευνα 400 ατόμων, θα χρειαστεί να ερευνήσετε όχι 800, αλλά 1600 άτομα. Ωστόσο, είναι απίθανο η έρευνα μάρκετινγκ να χρειάζεται 100% ακρίβεια. Εάν ένας ζυθοποιός χρειάζεται να ανακαλύψει ποιο ποσοστό των καταναλωτών μπύρας προτιμά το εμπορικό σήμα του έναντι του ανταγωνιστή του - 60% ή 40% - τότε τα σχέδιά του δεν θα επηρεαστούν με κανέναν τρόπο από τη διαφορά μεταξύ 57%, 60 ή 63%.

Το δειγματοληπτικό σφάλμα μπορεί να εξαρτάται όχι μόνο από το μέγεθός του, αλλά και από τον βαθμό διαφορών μεταξύ των επιμέρους μονάδων στον πληθυσμό που μελετάμε. Για παράδειγμα, αν θέλουμε να μάθουμε πόση μπύρα καταναλώνεται, θα διαπιστώσουμε ότι στον πληθυσμό μας τα ποσοστά κατανάλωσης διαφορετικοί άνθρωποιδιαφέρουν σημαντικά (ετερογενής πληθυσμός). Σε άλλη περίπτωση θα μελετήσουμε την κατανάλωση ψωμιού και θα το διαπιστώσουμε διαφορετικοί άνθρωποιδιαφέρει πολύ λιγότερο σημαντικά (ομογενής πληθυσμός). Όσο μεγαλύτερη είναι η διακύμανση (ή η ετερογένεια) μέσα σε έναν πληθυσμό, τόσο μεγαλύτερο είναι το μέγεθος του πιθανού σφάλματος δειγματοληψίας. Αυτό το μοτίβο επιβεβαιώνει μόνο το απλό ΚΟΙΝΗ ΛΟΓΙΚΗ. Έτσι, όπως σωστά αναφέρει ο V. Yadov, «το μέγεθος (όγκος) του δείγματος εξαρτάται από το επίπεδο ομοιογένειας ή ετερογένειας των αντικειμένων που μελετώνται. Όσο πιο ομοιογενείς είναι, τόσο μικρότεροι είναι οι αριθμοί που μπορούν να δώσουν στατιστικά αξιόπιστα συμπεράσματα».

Ο προσδιορισμός του μεγέθους του δείγματος εξαρτάται επίσης από το επίπεδο διάστημα εμπιστοσύνηςεπιτρεπόμενο στατιστικό σφάλμα. Αυτό αναφέρεται στα λεγόμενα τυχαία σφάλματα, τα οποία σχετίζονται με τη φύση τυχόν στατιστικών σφαλμάτων. ΣΕ ΚΑΙ. Ο Paniotto δίνει τους παρακάτω υπολογισμούς αντιπροσωπευτικό δείγμαυποθέτοντας 5% σφάλμα:
Αυτό σημαίνει ότι εάν, έχοντας ερευνήσει, για παράδειγμα, 400 άτομα σε μια περιφερειακή πόλη, όπου ο ενήλικος πληθυσμός διαλυτών είναι 100 χιλιάδες άτομα, διαπιστώσατε ότι το 33% των ερωτηθέντων αγοραστών προτιμά τα προϊόντα μιας τοπικής μονάδας επεξεργασίας κρέατος, τότε με το 95% Πιθανότητα μπορείτε να πείτε ότι το 33+5% (δηλαδή από 28 έως 38%) των κατοίκων αυτής της πόλης είναι τακτικοί αγοραστές αυτών των προϊόντων.

Μπορείτε επίσης να χρησιμοποιήσετε τους υπολογισμούς του Gallup για να υπολογίσετε την αναλογία μεγέθους δείγματος και το σφάλμα δειγματοληψίας.

Το μέσο σφάλμα δειγματοληψίας δείχνει πόσο αποκλίνει κατά μέσο όρο η παράμετρος πληθυσμού δείγματος από την αντίστοιχη παράμετρο πληθυσμού. Αν υπολογίσουμε τον μέσο όρο των σφαλμάτων όλων των πιθανών δειγμάτων ορισμένου τύπουδεδομένου όγκου ( n), που εξάγονται από τον ίδιο γενικό πληθυσμό, λαμβάνουμε το γενικευτικό τους χαρακτηριστικό - μέσο δειγματοληπτικό σφάλμα().

Στη θεωρία της επιλεκτικής παρατήρησης, προκύπτουν τύποι για να καθοριστεί ποιοι είναι ατομικοί για διαφορετικοί τρόποιεπιλογή (επαναλαμβανόμενη και μη επανάληψη), τύποι δειγμάτων που χρησιμοποιήθηκαν και τύποι στατιστικών δεικτών που αξιολογήθηκαν.

Για παράδειγμα, εάν χρησιμοποιείται επαναλαμβανόμενη τυχαία δειγματοληψία, ορίζεται ως:

Κατά την εκτίμηση της μέσης τιμής ενός χαρακτηριστικού.

Εάν το χαρακτηριστικό είναι εναλλακτικό, και το μερίδιο εκτιμάται.

Σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής, γίνεται τροποποίηση των τύπων (1 - n/N):

- για τη μέση τιμή του χαρακτηριστικού.

- για μερίδιο.

Η πιθανότητα να ληφθεί ακριβώς αυτή η τιμή σφάλματος είναι πάντα ίση με 0,683. Στην πράξη, προτιμούν να λαμβάνουν δεδομένα με μεγαλύτερη πιθανότητα, αλλά αυτό οδηγεί σε αύξηση του μεγέθους του δειγματοληπτικού σφάλματος.

Το μέγιστο σφάλμα δειγματοληψίας () ισούται με t-πλάσια του αριθμού των μέσων δειγματοληπτικών σφαλμάτων (στη θεωρία δειγματοληψίας, ο συντελεστής t συνήθως ονομάζεται συντελεστής εμπιστοσύνης):

Εάν το σφάλμα δειγματοληψίας διπλασιαστεί (t = 2), έχουμε πολύ μεγαλύτερη πιθανότητα να μην υπερβεί ένα ορισμένο όριο (στην περίπτωσή μας, διπλάσιο του μέσου σφάλματος) - 0,954. Αν πάρουμε t = 3, τότε η πιθανότητα εμπιστοσύνης θα είναι 0,997 - σχεδόν βεβαιότητα.

Το επίπεδο του οριακού σφάλματος δειγματοληψίας εξαρτάται από τους ακόλουθους παράγοντες:

βαθμός διακύμανσης των μονάδων του γενικού πληθυσμού·
το μέγεθος του δείγματος;
επιλεγμένα σχήματα επιλογής (η μη επαναλαμβανόμενη επιλογή δίνει μικρότερο σφάλμα).
επίπεδο αυτοπεποίθησης.

Εάν το μέγεθος του δείγματος είναι μεγαλύτερο από 30, τότε η τιμή t προσδιορίζεται από τον πίνακα κανονικής κατανομής, εάν είναι μικρότερος - από τον πίνακα κατανομής Student.

Ας παρουσιάσουμε μερικές τιμές του συντελεστή εμπιστοσύνης από τον πίνακα κανονικής κατανομής.

Το διάστημα εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού και για το μερίδιο στον πληθυσμό καθορίζεται ως εξής:

Έτσι, ο προσδιορισμός των ορίων του γενικού μέσου όρου και του μεριδίου αποτελείται από τα ακόλουθα βήματα:

Σφάλματα δειγματοληψίας στο διάφοροι τύποιεπιλογή

Στην πραγματικότητα τυχαία και μηχανική δειγματοληψία. Το μέσο σφάλμα της πραγματικής τυχαίας και μηχανικής δειγματοληψίας βρίσκεται χρησιμοποιώντας τους τύπους που παρουσιάζονται στον Πίνακα. 11.3.

Παράδειγμα 11.2. Για τη μελέτη του επιπέδου παραγωγικότητας του κεφαλαίου, πραγματοποιήθηκε δείγμα έρευνας 90 επιχειρήσεις από τις 225 με τυχαία μέθοδο επαναδειγματοληψίας, από την οποία προέκυψαν τα στοιχεία που παρουσιάζονται στον πίνακα.

Στο υπό εξέταση παράδειγμα, έχουμε δείγμα 40% (90: 225 = 0,4 ή 40%). Ας προσδιορίσουμε το μέγιστο σφάλμα και τα όριά του για τη μέση τιμή του χαρακτηριστικού στον πληθυσμό σύμφωνα με τα βήματα του αλγορίθμου:

Με βάση τα αποτελέσματα της δειγματοληπτικής έρευνας, υπολογίζουμε τη μέση τιμή και τη διακύμανση στον πληθυσμό του δείγματος:

Πίνακας 11.5.

Αποτελέσματα παρατήρησης			Υπολογιζόμενες τιμές
επίπεδο παραγωγικότητας κεφαλαίου, τρίψιμο, x i	αριθμός επιχειρήσεων, f i	μέσο του διαστήματος, x i \xb4	x i\xb4 f i	x i\xb4 2 f i
Έως 1,4	13	1,3	16,9	21,97
1,4-1,6	15	1,5	22,5	33,75
1,6-1,8	17	1,7	28,9	49,13
1,8-2,0	15	1,9	28,5	54,15
2,0-2,2	16	2,1	33,6	70,56
2.2 και άνω	14	2,3	32,2	74,06
Σύνολο	90	-	162,6	303,62

Δείγμα μέσου όρου

Δειγματική διακύμανση του υπό μελέτη χαρακτηριστικού

Για τα δεδομένα μας, προσδιορίζουμε το μέγιστο δειγματοληπτικό σφάλμα, για παράδειγμα, με πιθανότητα 0,954. Χρησιμοποιώντας τον πίνακα των τιμών πιθανότητας της συνάρτησης κανονικής κατανομής (δείτε ένα απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1), βρίσκουμε την τιμή του συντελεστή εμπιστοσύνης t, που αντιστοιχεί σε πιθανότητα 0,954. Με πιθανότητα 0,954, ο συντελεστής t είναι 2.

Έτσι, σε 954 περιπτώσεις από τις 1000, η μέση αξία της παραγωγικότητας του κεφαλαίου δεν θα είναι μεγαλύτερη από 1,88 ρούβλια. και όχι λιγότερο από 1,74 ρούβλια.

Ένα επαναλαμβανόμενο σχήμα τυχαίας δειγματοληψίας χρησιμοποιήθηκε παραπάνω. Ας δούμε αν αλλάζουν τα αποτελέσματα της έρευνας αν υποθέσουμε ότι η επιλογή πραγματοποιήθηκε σύμφωνα με το σχήμα επανεπιλογή. Σε αυτήν την περίπτωση, το μέσο σφάλμα υπολογίζεται χρησιμοποιώντας τον τύπο

Τότε, με πιθανότητα ίση με 0,954, η τιμή του μέγιστου σφάλματος δειγματοληψίας θα είναι:

Θα υπάρχουν όρια εμπιστοσύνης για τη μέση τιμή ενός χαρακτηριστικού κατά τη διάρκεια της μη επαναλαμβανόμενης τυχαίας επιλογής παρακάτω τιμές:

Έχοντας συγκρίνει τα αποτελέσματα των δύο σχημάτων επιλογής, μπορούμε να συμπεράνουμε ότι η χρήση της μη επαναλαμβανόμενης τυχαίας δειγματοληψίας δίνει πιο ακριβή αποτελέσματα σε σύγκριση με τη χρήση επαναλαμβανόμενης επιλογής με την ίδια πιθανότητα εμπιστοσύνης. Επιπλέον, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο πιο σημαντικά στενεύουν τα όρια των μέσων τιμών κατά τη μετάβαση από το ένα σχήμα επιλογής στο άλλο.

Χρησιμοποιώντας τα δεδομένα του παραδείγματος, προσδιορίζουμε μέσα σε ποια όρια βρίσκεται το μερίδιο των επιχειρήσεων με επίπεδο παραγωγικότητας κεφαλαίου που δεν υπερβαίνει τα 2,0 ρούβλια στον γενικό πληθυσμό:

Ας υπολογίσουμε το μερίδιο δείγματος.

Ο αριθμός των επιχειρήσεων στο δείγμα με επίπεδο παραγωγικότητας κεφαλαίου που δεν υπερβαίνει τα 2,0 ρούβλια είναι 60 μονάδες. Επειτα

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

υπολογίστε τη διακύμανση του μεριδίου στον πληθυσμό του δείγματος

μέσο σφάλμα δειγματοληψίας όταν χρησιμοποιείται επαναλαμβανόμενο σχήμαεπιλογή θα γίνει

Εάν υποθέσουμε ότι χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο σχήμα δειγματοληψίας, τότε το μέσο δειγματοληπτικό σφάλμα, λαμβάνοντας υπόψη τη διόρθωση για το πεπερασμένο του πληθυσμού, θα είναι

Ας ορίσουμε την πιθανότητα εμπιστοσύνης και ας προσδιορίσουμε το μέγιστο σφάλμα δειγματοληψίας.

Με τιμή πιθανότητας P = 0,997, σύμφωνα με τον πίνακα κανονικής κατανομής, λαμβάνουμε την τιμή για τον συντελεστή εμπιστοσύνης t = 3 (δείτε το απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1):

Έτσι, με πιθανότητα 0,997 μπορεί να δηλωθεί ότι στο γενικό πληθυσμό το μερίδιο των επιχειρήσεων με επίπεδο παραγωγικότητας κεφαλαίου που δεν υπερβαίνει τα 2,0 ρούβλια δεν είναι λιγότερο από 54,7% και όχι περισσότερο από 78,7%.

Τυπικό δείγμα. Με ένα τυπικό δείγμα, ο γενικός πληθυσμός των αντικειμένων χωρίζεται σε k ομάδες, λοιπόν

N 1 + N 2 + … + N i + … + N k = N.

Ο όγκος των μονάδων που εξάγονται από κάθε τυπική ομάδα εξαρτάται από τη μέθοδο δειγματοληψίας που υιοθετείται. δικα τους σύνολοσχηματίζει το απαιτούμενο μέγεθος δείγματος

n 1 + n 2 + … + n i + … + n k = n.

Υπάρχουν οι ακόλουθοι δύο τρόποι οργάνωσης της επιλογής σε μια τυπική ομάδα: ανάλογος με τον όγκο των τυπικών ομάδων και ανάλογος με τον βαθμό διακύμανσης των τιμών των χαρακτηριστικών μεταξύ των μονάδων παρατήρησης σε ομάδες. Ας εξετάσουμε το πρώτο από αυτά, ως το πιο συχνά χρησιμοποιούμενο.

Η επιλογή ανάλογη με το μέγεθος των τυπικών ομάδων προϋποθέτει ότι σε καθεμία από αυτές θα επιλεγούν επόμενος αριθμόςσυγκεντρωτικές μονάδες:

n = n i N i /N

όπου n i είναι ο αριθμός των μονάδων που εξήχθησαν για το δείγμα από την i-η τυπική ομάδα.

n - συνολικό μέγεθος δείγματος.

N i είναι ο αριθμός των μονάδων στο γενικό πληθυσμό που αποτελούσαν την i-η τυπική ομάδα.

N είναι ο συνολικός αριθμός μονάδων στον πληθυσμό.

Η επιλογή των μονάδων εντός των ομάδων γίνεται με τη μορφή τυχαίας ή μηχανικής δειγματοληψίας.

Οι τύποι για την εκτίμηση του μέσου δειγματοληπτικού σφάλματος για τον μέσο όρο και την αναλογία παρουσιάζονται στον Πίνακα. 11.6.

Εδώ είναι ο μέσος όρος των ομαδικών αποκλίσεων τυπικών ομάδων.

Παράδειγμα 11.3. Σε ένα από τα πανεπιστήμια της Μόσχας, διεξήχθη δειγματοληπτική έρευνα φοιτητών για να προσδιοριστεί η μέση παρακολούθηση της πανεπιστημιακής βιβλιοθήκης κατά έναν φοιτητή ανά εξάμηνο. Για το σκοπό αυτό χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο τυπικό δείγμα 5%, του οποίου οι τυπικές ομάδες αντιστοιχούν στον αριθμό του μαθήματος. Με επιλογή ανάλογη με το μέγεθος των τυπικών ομάδων, προέκυψαν τα ακόλουθα δεδομένα:

Πίνακας 11.7.

Αριθμός μαθήματος	Σύνολο μαθητών, ατόμων, N i	Εξετάστηκε ως αποτέλεσμα επιλεκτικής παρατήρησης, άτομα, n i	Μέσος αριθμός επισκέψεων στη βιβλιοθήκη ανά φοιτητή ανά εξάμηνο, x i	Διακύμανση δείγματος εντός της ομάδας,
1	650	33	11	6
2	610	31	8	15
3	580	29	5	18
4	360	18	6	24
5	350	17	10	12
Σύνολο	2 550	128	8	-

Ο αριθμός των φοιτητών που πρέπει να εξεταστούν σε κάθε μάθημα υπολογίζεται ως εξής:

ομοίως για άλλες ομάδες:

Η κατανομή των μέσων δείγματος έχει πάντα κανονικός νόμοςκατανομή (ή την προσεγγίζει) για n > 100, ανεξάρτητα από τη φύση της κατανομής του πληθυσμού. Ωστόσο, στην περίπτωση των μικρών δειγμάτων, ισχύει ένας διαφορετικός νόμος διανομής - η κατανομή Φοιτητών. Σε αυτήν την περίπτωση, ο συντελεστής εμπιστοσύνης βρίσκεται από τον πίνακα κατανομής Student t ανάλογα με την πιθανότητα εμπιστοσύνης P και το μέγεθος δείγματος n. Το Παράρτημα 1 παρέχει ένα τμήμα του πίνακα κατανομής Student t, που παρουσιάζεται ως εξάρτηση της πιθανότητας εμπιστοσύνης από το μέγεθος δείγματος και ο συντελεστής εμπιστοσύνης t.

Παράδειγμα 11.4. Ας υποθέσουμε ότι μια δειγματοληπτική έρευνα οκτώ φοιτητών ακαδημιών έδειξε ότι η προετοιμασία για δοκιμαστική εργασίαΣύμφωνα με στατιστικά στοιχεία, πέρασαν τον ακόλουθο αριθμό ωρών: 8,5; 8.0; 7.8; 9.0; 7.2; 6.2; 8.4; 6.6.

Παράδειγμα 11.5. Ας υπολογίσουμε πόσα από τα 507 βιομηχανικές επιχειρήσειςΗ φορολογική επιθεώρηση θα πρέπει να ελέγξει για να προσδιορίσει με πιθανότητα 0,997 το μερίδιο των επιχειρήσεων με παραβάσεις στην πληρωμή φόρων. Σύμφωνα με στοιχεία από προηγούμενη παρόμοια έρευνα, η τυπική απόκλιση ήταν 0,15. Το σφάλμα δειγματοληψίας αναμένεται να μην είναι μεγαλύτερο από 0,05.

Όταν χρησιμοποιείτε επαναλαμβανόμενη τυχαία δειγματοληψία, ελέγξτε

Σε περίπτωση επαναλαμβανόμενης τυχαίας επιλογής, θα χρειαστεί έλεγχος

Όπως μπορούμε να δούμε, η χρήση μη επαναλαμβανόμενης δειγματοληψίας καθιστά δυνατή τη διενέργεια εξετάσεων πολύ περισσότερο μικρότερο αριθμόαντικείμενα.

Παράδειγμα 11.6. Προγραμματίζεται έρευνα μισθοίσε επιχειρήσεις του κλάδου που χρησιμοποιούν τυχαία, μη επαναλαμβανόμενη δειγματοληψία. Ποιο θα πρέπει να είναι το μέγεθος του πληθυσμού του δείγματος εάν τη στιγμή της έρευνας ο αριθμός των εργαζομένων στον κλάδο ήταν 100.000 άτομα; Το μέγιστο σφάλμα δειγματοληψίας δεν πρέπει να υπερβαίνει τα 100 ρούβλια. με πιθανότητα 0,954. Με βάση τα αποτελέσματα προηγούμενων ερευνών για τους μισθούς του κλάδου, είναι γνωστό ότι ο μέσος όρος τυπική απόκλισηείναι 500 ρούβλια.

Επομένως, για να λυθεί αυτό το πρόβλημα, είναι απαραίτητο να συμπεριληφθούν τουλάχιστον 100 άτομα στο δείγμα.

Μέση και μέγιστα δειγματοληπτικά σφάλματα

Το κύριο πλεονέκτημα της παρατήρησης δειγμάτων μεταξύ άλλων είναι η ικανότητα υπολογισμού τυχαίο σφάλμαδείγματα.

Τα σφάλματα δειγματοληψίας μπορεί να είναι συστηματικά ή τυχαία.

Συστηματικός- στην περίπτωση που παραβιάζεται η βασική αρχή της δειγματοληψίας - τυχαιότητα. Τυχαίος- συνήθως προκύπτουν λόγω του γεγονότος ότι η δομή του πληθυσμού του δείγματος διαφέρει πάντα από τη δομή του γενικού πληθυσμού, ανεξάρτητα από το πόσο σωστά γίνεται η επιλογή, δηλαδή, παρά την αρχή της τυχαίας επιλογής των μονάδων πληθυσμού, εξακολουθούν να υπάρχουν αποκλίσεις μεταξύ των χαρακτηριστικών του δείγματος και του γενικού πληθυσμού. Η μελέτη και η μέτρηση των τυχαίων σφαλμάτων αντιπροσωπευτικότητας είναι το κύριο καθήκον της μεθόδου δειγματοληψίας.

Συνήθως, το σφάλμα του μέσου όρου και το σφάλμα της αναλογίας υπολογίζονται συχνότερα. Για τους υπολογισμούς χρησιμοποιούνται οι ακόλουθες συμβάσεις:

Μέσος όρος που υπολογίζεται εντός του πληθυσμού.

Ο μέσος όρος υπολογίζεται εντός του πληθυσμού του δείγματος.

R- το μερίδιο αυτής της ομάδας στο γενικό πληθυσμό.

w- το μερίδιο αυτής της ομάδας στον πληθυσμό του δείγματος.

Χρησιμοποιώντας σύμβολα, τα δειγματοληπτικά σφάλματα για τον μέσο όρο και για το κλάσμα μπορούν να γραφούν ως εξής:

Ο μέσος όρος του δείγματος και η αναλογία δείγματος είναι τυχαίες μεταβλητές που μπορούν να λάβουν οποιαδήποτε τιμή ανάλογα με τις μονάδες πληθυσμού που περιλαμβάνονται στο δείγμα. Επομένως, τα σφάλματα δειγματοληψίας είναι επίσης τυχαίες μεταβλητές και μπορούν να λάβουν διαφορετικές τιμές. Επομένως, προσδιορίστε τον μέσο όρο του πιθανά σφάλματα μ .

Σε αντίθεση με το συστηματικό σφάλμα, το τυχαίο σφάλμα μπορεί να προσδιοριστεί εκ των προτέρων, πριν από τη δειγματοληψία, σύμφωνα με οριακά θεωρήματα, που λαμβάνεται υπόψη στη μαθηματική στατιστική.

Το μέσο σφάλμα προσδιορίζεται με πιθανότητα 0,683. Σε περίπτωση διαφορετικής πιθανότητας, κάνουν λόγο για οριακό σφάλμα.

Το μέσο δειγματοληπτικό σφάλμα για τον μέσο όρο και για την αναλογία ορίζεται ως εξής:

Σε αυτούς τους τύπους, η διακύμανση ενός χαρακτηριστικού είναι χαρακτηριστικό του γενικού πληθυσμού, το οποίο είναι άγνωστο κατά την παρατήρηση του δείγματος. Στην πράξη, αντικαθίστανται από παρόμοια χαρακτηριστικά του πληθυσμού του δείγματος με βάση το νόμο των μεγάλων αριθμών, σύμφωνα με τον οποίο ο πληθυσμός του δείγματος αναπαράγει με ακρίβεια τα χαρακτηριστικά του γενικού πληθυσμού σε μεγάλες ποσότητες.

Τύποι για τον προσδιορισμό του μέσου σφάλματος για διαφορετικός τρόποςεπιλογή:

Μέθοδος επιλογής	Αλλεπάλληλος	Ανεπανάληπτο
σφάλμα μέσου όρου	σφάλμα κοινής χρήσης	σφάλμα μέσου όρου	σφάλμα κοινής χρήσης
Σωστά τυχαία και μηχανικά
Τυπικός
Κατα συρροη

μ - μέσο σφάλμα?

∆ - οριακό σφάλμα;

Π -το μέγεθος του δείγματος;

Ν-μέγεθος πληθυσμού;

Συνολική διακύμανση;

w-μερίδιο αυτής της κατηγορίας σε συνολικός αριθμόςδείγματα:

Μέσος όρος των διακυμάνσεις εντός της ομάδας;

Δ 2 - διασπορά μεταξύ ομάδων.

r-αριθμός σειρών στο δείγμα·

R- συνολικός αριθμός επεισοδίων.

Οριακό σφάλμαγια όλες τις μεθόδους δειγματοληψίας σχετίζεται με το μέσο δειγματοληπτικό σφάλμα ως εξής:

Οπου t- συντελεστής εμπιστοσύνης, λειτουργικά συνδεδεμένος με την πιθανότητα με την οποία διασφαλίζεται η μέγιστη τιμή σφάλματος. Ανάλογα με την πιθανότητα, ο συντελεστής εμπιστοσύνης t παίρνει τις ακόλουθες τιμές:

t	Π
	0,683
1,5	0,866
2,0	0,954
2,5	0,988
3,0	0,997
4,0	0,9999

Για παράδειγμα, η πιθανότητα σφάλματος είναι 0,683. Αυτό σημαίνει ότι ο γενικός μέσος όρος διαφέρει από τον μέσο όρο του δείγματος ως προς απόλυτη τιμήόχι περισσότερο από το ποσό μ με πιθανότητα 0,683, τότε αν είναι ο μέσος όρος του δείγματος, είναι ο γενικός μέσος όρος, τότε Μεπιθανότητα 0,683.

Αν θέλουμε να εξασφαλίσουμε μεγαλύτερη πιθανότητα συμπερασμάτων, αυξάνουμε έτσι τα περιθώρια τυχαίου λάθους.

Έτσι, το μέγεθος του μέγιστου σφάλματος εξαρτάται από τις ακόλουθες ποσότητες:

Διακυμάνσεις ενός χαρακτηριστικού (άμεση σχέση), το οποίο χαρακτηρίζεται από το μέγεθος της διασποράς.

Το μέγεθος του δείγματος ( Ανατροφοδότηση);

Πιθανότητα εμπιστοσύνης(απευθείας σύνδεση);

Μέθοδος επιλογής.

Ένα παράδειγμα υπολογισμού του σφάλματος του μέσου όρου και του σφάλματος της αναλογίας.

Για τον προσδιορισμό του μέσου αριθμού των παιδιών σε μια οικογένεια, επιλέχθηκαν 100 οικογένειες από 1000 οικογένειες χρησιμοποιώντας μια τυχαία μη επαναλαμβανόμενη μέθοδο δειγματοληψίας. Τα αποτελέσματα φαίνονται στον πίνακα:

Καθορίζω:.

- με πιθανότητα 0,997, το μέγιστο δειγματοληπτικό σφάλμα και τα όρια εντός των οποίων βρίσκεται ο μέσος αριθμός παιδιών σε μια οικογένεια.

- με πιθανότητα 0,954, τα όρια εντός των οποίων βρίσκεται η αναλογία των οικογενειών με δύο παιδιά.

1. Ας προσδιορίσουμε το μέγιστο σφάλμα του μέσου όρου με πιθανότητα 0,977. Για να απλοποιήσουμε τους υπολογισμούς, χρησιμοποιούμε τη μέθοδο των ροπών:

Π = 0,997 t= 3

μέσο σφάλμα του μέσου όρου, 0,116 - οριακό σφάλμα

2,12 – 0,116 ≤ ≤ 2,12+ 0,116

2,004 ≤ ≤ 2,236

Επομένως, με πιθανότητα 0,997, ο μέσος αριθμός παιδιών σε μια οικογένεια στο γενικό πληθυσμό, δηλαδή μεταξύ 1000 οικογενειών, κυμαίνεται μεταξύ 2.004 - 2.236.