Το οριακό επίπεδο σφάλματος δειγματοληψίας. Υπολογισμός μέσων και οριακών δειγματοληπτικών σφαλμάτων για διάφορους τύπους επιλογής

Πληθυσμός- ένα σύνολο μονάδων που έχουν μαζικό χαρακτήρα, τυπικότητα, ποιοτική ομοιομορφία και παρουσία παραλλαγής.

Ο στατιστικός πληθυσμός αποτελείται από υλικά υπάρχοντα αντικείμενα (Εργαζόμενοι, επιχειρήσεις, χώρες, περιοχές), είναι ένα αντικείμενο.

Πληθυσμιακή μονάδα- κάθε συγκεκριμένη μονάδα του στατιστικού πληθυσμού.

Ο ίδιος στατιστικός πληθυσμός μπορεί να είναι ομοιογενής σε ένα χαρακτηριστικό και ετερογενής σε ένα άλλο.

Ποιοτική ομοιομορφία- η ομοιότητα όλων των μονάδων του πληθυσμού για οποιοδήποτε χαρακτηριστικό και η ανομοιότητα για όλα τα υπόλοιπα.

Σε έναν στατιστικό πληθυσμό, οι διαφορές μιας μονάδας πληθυσμού από μια άλλη είναι πιο συχνά ποσοτικής φύσης. Οι ποσοτικές αλλαγές στις τιμές του χαρακτηριστικού διαφορετικών μονάδων του πληθυσμού ονομάζονται παραλλαγή.

Παραλλαγή χαρακτηριστικών- μια ποσοτική αλλαγή σε ένα χαρακτηριστικό (για ένα ποσοτικό χαρακτηριστικό) κατά τη μετάβαση από τη μια μονάδα του πληθυσμού στην άλλη.

σημάδι- πρόκειται για ιδιότητα, χαρακτηριστικό γνώρισμα ή άλλο χαρακτηριστικό μονάδων, αντικειμένων και φαινομένων που μπορούν να παρατηρηθούν ή να μετρηθούν. Τα σημάδια χωρίζονται σε ποσοτικά και ποιοτικά. Η ποικιλομορφία και η μεταβλητότητα της τιμής ενός χαρακτηριστικού σε μεμονωμένες μονάδες του πληθυσμού ονομάζεται παραλλαγή.

Τα χαρακτηριστικά (ποιοτικά) δεν είναι ποσοτικά μετρήσιμα (σύνθεση του πληθυσμού ανά φύλο). Τα ποσοτικά χαρακτηριστικά έχουν αριθμητική έκφραση (σύνθεση του πληθυσμού ανά ηλικία).

Δείκτης- αυτό είναι ένα γενικευτικό ποσοτικά ποιοτικό χαρακτηριστικό οποιασδήποτε ιδιότητας μονάδων ή ενός συνόλου στο σύνολό του σε συγκεκριμένες συνθήκες χρόνου και τόπου.

Πίνακας βαθμολογίαςείναι ένα σύνολο δεικτών που αντικατοπτρίζουν συνολικά το υπό μελέτη φαινόμενο.

Για παράδειγμα, σκεφτείτε τον μισθό:

Σημάδι - μισθοί
Στατιστικός πληθυσμός - όλοι οι εργαζόμενοι
Η μονάδα του πληθυσμού είναι ο κάθε εργαζόμενος
Ποιοτική ομοιογένεια - δεδουλευμένος μισθός
Παραλλαγή χαρακτηριστικών - μια σειρά αριθμών

Γενικός πληθυσμός και δείγμα από αυτόν

Η βάση είναι ένα σύνολο δεδομένων που λαμβάνονται ως αποτέλεσμα της μέτρησης ενός ή περισσότερων χαρακτηριστικών. Το πραγματικά παρατηρούμενο σύνολο αντικειμένων, που αντιπροσωπεύεται στατιστικά από έναν αριθμό παρατηρήσεων μιας τυχαίας μεταβλητής, είναι δειγματοληψία, και το υποθετικά υπάρχον (στοχευμένο) - γενικός πληθυσμός. Ο γενικός πληθυσμός μπορεί να είναι πεπερασμένος (αριθμός παρατηρήσεων Ν = συντ) ή άπειρο ( N = ∞), και ένα δείγμα από τον γενικό πληθυσμό είναι πάντα το αποτέλεσμα περιορισμένου αριθμού παρατηρήσεων. Ο αριθμός των παρατηρήσεων που αποτελούν ένα δείγμα ονομάζεται το μέγεθος του δείγματος. Εάν το μέγεθος του δείγματος είναι αρκετά μεγάλο n→∞) λαμβάνεται υπόψη το δείγμα μεγάλο, αλλιώς λέγεται δείγμα περιορισμένη ένταση. Το δείγμα λαμβάνεται υπόψη μικρό, εάν, κατά τη μέτρηση μιας μονοδιάστατης τυχαίας μεταβλητής, το μέγεθος του δείγματος δεν υπερβαίνει τα 30 ( n<= 30 ), και κατά την ταυτόχρονη μέτρηση πολλών ( κ) χαρακτηριστικά σε μια πολυδιάστατη σχέση χώρου nπρος την κλιγότερο από 10 (n/k< 10) . Τα έντυπα του δείγματος σειρά παραλλαγήςαν τα μέλη του είναι στατιστικά παραγγελιών, δηλαδή, δείγματα τιμών της τυχαίας μεταβλητής Χταξινομούνται με αύξουσα σειρά (κατάταξη), καλούνται οι τιμές του χαρακτηριστικού επιλογές.

Παράδειγμα. Σχεδόν το ίδιο τυχαία επιλεγμένο σύνολο αντικειμένων - εμπορικές τράπεζες μιας διοικητικής περιφέρειας της Μόσχας, μπορεί να θεωρηθεί ως δείγμα από τον γενικό πληθυσμό όλων των εμπορικών τραπεζών αυτής της περιοχής και ως δείγμα από τον γενικό πληθυσμό όλων των εμπορικών τραπεζών στη Μόσχα , καθώς και δείγμα εμπορικών τραπεζών της χώρας κ.λπ.

Βασικές μέθοδοι δειγματοληψίας

Η αξιοπιστία των στατιστικών συμπερασμάτων και η ουσιαστική ερμηνεία των αποτελεσμάτων εξαρτάται από αντιπροσωπευτικότηταδείγματα, δηλ. πληρότητα και επάρκεια της αναπαράστασης των ιδιοκτησιών του γενικού πληθυσμού, σε σχέση με τα οποία το δείγμα αυτό μπορεί να θεωρηθεί αντιπροσωπευτικό. Η μελέτη των στατιστικών ιδιοτήτων του πληθυσμού μπορεί να οργανωθεί με δύο τρόπους: χρησιμοποιώντας συνεχήςκαι διακεκομμένος. Συνεχής παρατήρησηπεριλαμβάνει εξέταση όλων μονάδεςμελετημένος αδρανή, ένα μη συνεχής (επιλεκτική) παρατήρηση- μόνο μέρη του.

Υπάρχουν πέντε κύριοι τρόποι οργάνωσης της δειγματοληψίας:

1. απλή τυχαία επιλογή, στο οποίο τα αντικείμενα εξάγονται τυχαία από τον γενικό πληθυσμό των αντικειμένων (για παράδειγμα, χρησιμοποιώντας έναν πίνακα ή μια γεννήτρια τυχαίων αριθμών) και καθένα από τα πιθανά δείγματα έχει ίση πιθανότητα. Τέτοια δείγματα ονομάζονται στην πραγματικότητα τυχαία;

2. απλή επιλογή μέσα από μια τακτική διαδικασίαεκτελείται χρησιμοποιώντας ένα μηχανικό εξάρτημα (για παράδειγμα, ημερομηνίες, ημέρες της εβδομάδας, αριθμούς διαμερισμάτων, γράμματα του αλφαβήτου κ.λπ.) και τα δείγματα που λαμβάνονται με αυτόν τον τρόπο ονομάζονται μηχανικός;

3. στρωματοποιημένοςη επιλογή συνίσταται στο γεγονός ότι ο γενικός πληθυσμός του τόμου υποδιαιρείται σε υποσύνολα ή στρώματα (στρώματα) του τόμου έτσι ώστε . Τα στρώματα είναι ομοιογενή αντικείμενα ως προς τα στατιστικά χαρακτηριστικά (για παράδειγμα, ο πληθυσμός χωρίζεται σε στρώματα ανά ηλικιακή ομάδα ή κοινωνική τάξη· επιχειρήσεις κατά κλάδο). Στην περίπτωση αυτή, τα δείγματα καλούνται στρωματοποιημένος(σε διαφορετική περίπτωση, στρωματοποιημένος, τυπικός, ζωνοποιημένος);

4. μέθοδοι κατα συρροηεπιλογή χρησιμοποιούνται για να σχηματίσουν κατα συρροηή ένθετα δείγματα. Είναι βολικό εάν είναι απαραίτητο να εξεταστεί ταυτόχρονα ένα "μπλοκ" ή μια σειρά αντικειμένων (για παράδειγμα, μια αποστολή αγαθών, προϊόντα μιας συγκεκριμένης σειράς ή ο πληθυσμός στην εδαφική-διοικητική διαίρεση της χώρας). Η επιλογή των σειρών μπορεί να γίνει με τυχαίο ή μηχανικό τρόπο. Ταυτόχρονα, πραγματοποιείται συνεχής επιθεώρηση μιας συγκεκριμένης παρτίδας αγαθών ή μιας ολόκληρης εδαφικής μονάδας (ένα κτίριο κατοικιών ή ένα τέταρτο).

5. σε συνδυασμόΗ (σταδιακή) επιλογή μπορεί να συνδυάσει πολλές μεθόδους επιλογής ταυτόχρονα (για παράδειγμα, στρωματοποιημένη και τυχαία ή τυχαία και μηχανική). ένα τέτοιο δείγμα ονομάζεται σε συνδυασμό.

Τύποι επιλογής

Με μυαλόυπάρχει ατομική, ομαδική και συνδυασμένη επιλογή. Στο ατομική επιλογήεπιλέγονται μεμονωμένες μονάδες του γενικού πληθυσμού στο σύνολο του δείγματος, με ομαδική επιλογήείναι ποιοτικά ομοιογενείς ομάδες (σειρές) μονάδων, και συνδυασμένη επιλογήπεριλαμβάνει συνδυασμό του πρώτου και του δεύτερου τύπου.

Με μέθοδοςεπιλογή διάκριση επαναλαμβανόμενο και μη επαναλαμβανόμενοδείγμα.

Ανεπανάληπτοονομάζεται επιλογή, κατά την οποία η μονάδα που έπεσε στο δείγμα δεν επιστρέφει στον αρχικό πληθυσμό και δεν συμμετέχει στην περαιτέρω επιλογή· ενώ ο αριθμός των μονάδων του γενικού πληθυσμού Νμειωθεί κατά τη διαδικασία επιλογής. Στο αλλεπάλληλοςεπιλογή πιασμέναστο δείγμα, η μονάδα μετά την εγγραφή επιστρέφεται στον γενικό πληθυσμό και έτσι διατηρεί ίσες ευκαιρίες, μαζί με άλλες μονάδες, να χρησιμοποιηθεί στην περαιτέρω διαδικασία επιλογής· ενώ ο αριθμός των μονάδων του γενικού πληθυσμού Νπαραμένει αμετάβλητη (η μέθοδος χρησιμοποιείται σπάνια σε κοινωνικοοικονομικές μελέτες). Ωστόσο, με ένα μεγάλο N (N → ∞)τύποι για ανεπανάληπτοη επιλογή είναι κοντά σε αυτές για αλλεπάλληλοςεπιλογή και τα τελευταία χρησιμοποιούνται σχεδόν πιο συχνά ( Ν = συντ).

Τα κύρια χαρακτηριστικά των παραμέτρων του γενικού και δειγματοληπτικού πληθυσμού

Η βάση των στατιστικών συμπερασμάτων της μελέτης είναι η κατανομή μιας τυχαίας μεταβλητής , ενώ οι παρατηρούμενες τιμές (x 1, x 2, ..., x n)ονομάζονται πραγματοποιήσεις της τυχαίας μεταβλητής Χ(n είναι το μέγεθος του δείγματος). Η κατανομή μιας τυχαίας μεταβλητής στον γενικό πληθυσμό είναι θεωρητική, ιδανική στη φύση και το δείγμα της αναλογικής της είναι εμπειρικόςδιανομή. Μερικές θεωρητικές κατανομές δίνονται αναλυτικά, δηλ. τους επιλογέςπροσδιορίστε την τιμή της συνάρτησης κατανομής σε κάθε σημείο στο χώρο των πιθανών τιμών της τυχαίας μεταβλητής. Επομένως, για ένα δείγμα, είναι δύσκολο, και μερικές φορές αδύνατο, να προσδιοριστεί η συνάρτηση κατανομής επιλογέςεκτιμώνται από εμπειρικά δεδομένα και στη συνέχεια αντικαθίστανται σε μια αναλυτική έκφραση που περιγράφει τη θεωρητική κατανομή. Σε αυτή την περίπτωση, η υπόθεση (ή υπόθεση) σχετικά με τον τύπο κατανομής μπορεί να είναι στατιστικά σωστή και λανθασμένη. Αλλά σε κάθε περίπτωση, η εμπειρική κατανομή που ανακατασκευάστηκε από το δείγμα μόνο κατά προσέγγιση χαρακτηρίζει την αληθινή. Οι πιο σημαντικές παράμετροι κατανομής είναι αναμενόμενη αξίακαι διασπορά.

Από τη φύση τους, οι διανομές είναι συνεχήςκαι διακεκριμένος. Η πιο γνωστή συνεχής κατανομή είναι κανονικός. Επιλεκτικά ανάλογα παραμέτρων και για αυτήν είναι: η μέση τιμή και η εμπειρική διακύμανση. Μεταξύ των διακριτών στις κοινωνικοοικονομικές μελέτες, το πιο συχνά χρησιμοποιούμενο εναλλακτική (διχοτομική)διανομή. Η παράμετρος προσδοκίας αυτής της κατανομής εκφράζει τη σχετική τιμή (ή μερίδιο) μονάδες του πληθυσμού που έχουν το υπό μελέτη χαρακτηριστικό (δηλώνεται με το γράμμα )· το ποσοστό του πληθυσμού που δεν έχει αυτό το χαρακτηριστικό υποδηλώνεται με το γράμμα q (q = 1 - p). Η διακύμανση της εναλλακτικής κατανομής έχει επίσης ένα εμπειρικό ανάλογο.

Ανάλογα με τον τύπο κατανομής και τη μέθοδο επιλογής των πληθυσμιακών μονάδων, τα χαρακτηριστικά των παραμέτρων κατανομής υπολογίζονται διαφορετικά. Οι κυριότερες για τις θεωρητικές και εμπειρικές κατανομές δίνονται στον Πίνακα. ένας.

Δείγμα μετοχής k nείναι ο λόγος του αριθμού των μονάδων του πληθυσμού του δείγματος προς τον αριθμό των μονάδων του γενικού πληθυσμού:

k n = n/N.

Μερίδιο δείγματος wείναι η αναλογία των μονάδων που έχουν το υπό μελέτη χαρακτηριστικό Χστο μέγεθος του δείγματος n:

w = n n / n.

Παράδειγμα.Σε μια παρτίδα εμπορευμάτων που περιέχει 1000 μονάδες, με δείγμα 5%. κλάσμα δείγματος k nσε απόλυτη τιμή είναι 50 μονάδες. (η = Ν*0,05); αν βρεθούν 2 ελαττωματικά προϊόντα σε αυτό το δείγμα, τότε κλάσμα δείγματος wθα είναι 0,04 (w = 2/50 = 0,04 ή 4%).

Δεδομένου ότι ο πληθυσμός του δείγματος είναι διαφορετικός από τον γενικό πληθυσμό, υπάρχουν δειγματοληπτικά σφάλματα.

Πίνακας 1. Βασικές παράμετροι του γενικού πληθυσμού και του πληθυσμού του δείγματος

Σφάλματα δειγματοληψίας

Με οποιαδήποτε (συμπαγή και επιλεκτικά) σφάλματα μπορεί να προκύψουν δύο τύπων: εγγραφή και αντιπροσωπευτικότητα. Λάθη εγγραφήμπορώ να έχω τυχαίοςκαι συστηματικόςχαρακτήρας. ΤυχαίοςΤα σφάλματα αποτελούνται από πολλές διαφορετικές ανεξέλεγκτες αιτίες, είναι ακούσια στη φύση και συνήθως εξισορροπούν το ένα το άλλο σε συνδυασμό (για παράδειγμα, αλλαγές στις ενδείξεις του οργάνου λόγω διακυμάνσεων της θερμοκρασίας στο δωμάτιο).

Συστηματικόςτα σφάλματα είναι προκατειλημμένα, καθώς παραβιάζουν τους κανόνες για την επιλογή αντικειμένων στο δείγμα (για παράδειγμα, αποκλίσεις στις μετρήσεις κατά την αλλαγή των ρυθμίσεων της συσκευής μέτρησης).

Παράδειγμα.Για την αξιολόγηση της κοινωνικής θέσης του πληθυσμού στην πόλη, προβλέπεται να εξεταστεί το 25% των οικογενειών. Εάν, ωστόσο, η επιλογή κάθε τέταρτου διαμερίσματος βασίζεται στον αριθμό του, τότε υπάρχει ο κίνδυνος επιλογής όλων των διαμερισμάτων ενός μόνο τύπου (για παράδειγμα, διαμερίσματα ενός δωματίου), γεγονός που θα εισάγει ένα συστηματικό σφάλμα και θα αλλοιώσει τα αποτελέσματα. Η επιλογή του αριθμού διαμερίσματος με κλήρωση είναι προτιμότερη, αφού το σφάλμα θα είναι τυχαίο.

Σφάλματα αντιπροσωπευτικότηταςεγγενείς μόνο στην επιλεκτική παρατήρηση, δεν μπορούν να αποφευχθούν και προκύπτουν ως αποτέλεσμα του γεγονότος ότι το δείγμα δεν αναπαράγει πλήρως το γενικό. Οι τιμές των δεικτών που λαμβάνονται από το δείγμα διαφέρουν από τους δείκτες των ίδιων τιμών στον γενικό πληθυσμό (ή που λαμβάνονται κατά τη συνεχή παρατήρηση).

Σφάλμα δειγματοληψίαςείναι η διαφορά μεταξύ της τιμής της παραμέτρου στον γενικό πληθυσμό και της τιμής του δείγματος. Για τη μέση τιμή ενός ποσοτικού χαρακτηριστικού, ισούται με: , και για το μερίδιο (εναλλακτικό χαρακτηριστικό) - .

Τα δειγματοληπτικά σφάλματα είναι εγγενή μόνο στις παρατηρήσεις του δείγματος. Όσο μεγαλύτερα είναι αυτά τα σφάλματα, τόσο περισσότερο διαφέρει η εμπειρική κατανομή από τη θεωρητική. Οι παράμετροι της εμπειρικής κατανομής είναι τυχαίες μεταβλητές, επομένως, τα σφάλματα δειγματοληψίας είναι επίσης τυχαίες μεταβλητές, μπορούν να λάβουν διαφορετικές τιμές για διαφορετικά δείγματα και επομένως είναι συνηθισμένο να υπολογίζονται μέσο σφάλμα.

Μέσο δειγματοληπτικό σφάλμαείναι μια τιμή που εκφράζει την τυπική απόκλιση του μέσου όρου του δείγματος από τη μαθηματική προσδοκία. Αυτή η τιμή, με την επιφύλαξη της αρχής της τυχαίας επιλογής, εξαρτάται πρωτίστως από το μέγεθος του δείγματος και από το βαθμό διακύμανσης του χαρακτηριστικού: όσο μεγαλύτερη και όσο μικρότερη είναι η διακύμανση του χαρακτηριστικού (άρα, η τιμή του ), τόσο μικρότερη είναι η τιμή του το μέσο δειγματοληπτικό σφάλμα. Η αναλογία μεταξύ των διακυμάνσεων του γενικού πληθυσμού και του πληθυσμού δείγματος εκφράζεται με τον τύπο:

εκείνοι. για αρκετά μεγάλο, μπορούμε να υποθέσουμε ότι . Το μέσο δειγματοληπτικό σφάλμα δείχνει τις πιθανές αποκλίσεις της παραμέτρου του πληθυσμού του δείγματος από την παράμετρο του γενικού πληθυσμού. Στον πίνακα. Το 2 δείχνει εκφράσεις για τον υπολογισμό του μέσου δειγματοληπτικού σφάλματος για διαφορετικές μεθόδους οργάνωσης της παρατήρησης.

Πίνακας 2. Μέσο σφάλμα (m) του μέσου όρου και της αναλογίας του δείγματος για διαφορετικούς τύπους δείγματος

Πού είναι ο μέσος όρος των διακυμάνσεων του δείγματος εντός ομάδας για ένα συνεχές χαρακτηριστικό;

Ο μέσος όρος των ενδοομιλικών διασπορών της μετοχής.

— αριθμός επιλεγμένων σειρών, — συνολικός αριθμός σειρών.

που είναι ο μέσος όρος της σειράς?

- ο γενικός μέσος όρος σε ολόκληρο το δείγμα για ένα συνεχές χαρακτηριστικό.

πού είναι η αναλογία του χαρακτηριστικού στη σειρά;

— το συνολικό μερίδιο του χαρακτηριστικού σε ολόκληρο το δείγμα.

Ωστόσο, το μέγεθος του μέσου σφάλματος μπορεί να κριθεί μόνο με μια ορισμένη πιθανότητα Р (Р ≤ 1). Lyapunov A.M. απέδειξε ότι η κατανομή των μέσων δειγμάτων, και επομένως οι αποκλίσεις τους από τη γενική μέση, με έναν αρκετά μεγάλο αριθμό, υπακούει κατά προσέγγιση στον νόμο της κανονικής κατανομής, με την προϋπόθεση ότι ο γενικός πληθυσμός έχει πεπερασμένο μέσο όρο και περιορισμένη διακύμανση.

Μαθηματικά, αυτή η δήλωση για το μέσο όρο εκφράζεται ως:

και για το κλάσμα, η έκφραση (1) θα έχει τη μορφή:

που - υπάρχει οριακό δειγματοληπτικό σφάλμα, το οποίο είναι πολλαπλάσιο του μέσου δειγματοληπτικού σφάλματος , και ο παράγοντας πολλαπλότητας είναι το κριτήριο του Student («συντελεστής εμπιστοσύνης»), που προτείνεται από τον W.S. Gosset (ψευδώνυμο "Μαθητής"); Οι τιμές για διαφορετικά μεγέθη δειγμάτων αποθηκεύονται σε ειδικό πίνακα.

Οι τιμές της συνάρτησης Ф(t) για ορισμένες τιμές του t είναι:

Επομένως, η έκφραση (3) μπορεί να διαβαστεί ως εξής: με πιθανότητα P = 0,683 (68,3%)μπορεί να υποστηριχθεί ότι η διαφορά μεταξύ του δείγματος και του γενικού μέσου όρου δεν θα υπερβαίνει τη μία τιμή του μέσου σφάλματος m(t=1), με πιθανότητα P = 0,954 (95,4%)— ότι δεν υπερβαίνει την τιμή δύο μέσων σφαλμάτων m (t = 2) ,με πιθανότητα P = 0,997 (99,7%)- δεν θα υπερβαίνει τις τρεις τιμές m (t = 3) .Έτσι, καθορίζεται η πιθανότητα αυτή η διαφορά να υπερβαίνει το τριπλάσιο της τιμής του μέσου σφάλματος επίπεδο σφάλματοςκαι δεν είναι περισσότερο από 0,3% .

Στον πίνακα. 3 δείχνει τους τύπους για τον υπολογισμό του οριακού σφάλματος δειγματοληψίας.

Πίνακας 3. Οριακό σφάλμα δειγματοληψίας (D) για τον μέσο όρο και την αναλογία (p) για διαφορετικούς τύπους παρατήρησης δείγματος

Επέκταση των αποτελεσμάτων δειγμάτων στον πληθυσμό

Ο απώτερος στόχος της δειγματοληπτικής παρατήρησης είναι ο χαρακτηρισμός του γενικού πληθυσμού. Για μικρά μεγέθη δείγματος, οι εμπειρικές εκτιμήσεις των παραμέτρων ( και ) ενδέχεται να αποκλίνουν σημαντικά από τις πραγματικές τους τιμές ( και ). Ως εκ τούτου, καθίσταται απαραίτητο να καθοριστούν τα όρια εντός των οποίων για τις τιμές δείγματος των παραμέτρων ( και ) βρίσκονται οι πραγματικές τιμές ( και ).

Διάστημα εμπιστοσύνηςοποιασδήποτε παραμέτρου θ του γενικού πληθυσμού ονομάζεται τυχαίο εύρος τιμών αυτής της παραμέτρου, το οποίο με πιθανότητα κοντά στο 1 ( αξιοπιστία) περιέχει την πραγματική τιμή αυτής της παραμέτρου.

οριακό σφάλμαδείγματα Δ σας επιτρέπει να προσδιορίσετε τις οριακές τιμές των χαρακτηριστικών του γενικού πληθυσμού και τους διαστήματα εμπιστοσύνης, που ισούνται με:

Συμπέρασμα διάστημα εμπιστοσύνηςπου προκύπτει με αφαίρεση οριακό σφάλμααπό το δείγμα μέσος όρος (μερίδιο) και το κορυφαίο προσθέτοντάς το.

Διάστημα εμπιστοσύνηςγια τον μέσο όρο, χρησιμοποιεί το οριακό σφάλμα δειγματοληψίας και για ένα δεδομένο επίπεδο εμπιστοσύνης προσδιορίζεται από τον τύπο:

Αυτό σημαίνει ότι με δεδομένη πιθανότητα R, το οποίο ονομάζεται επίπεδο εμπιστοσύνης και καθορίζεται μοναδικά από την τιμή t, μπορεί να υποστηριχθεί ότι η πραγματική τιμή του μέσου όρου βρίσκεται στο εύρος από , και η πραγματική αξία της μετοχής είναι στην περιοχή από

Κατά τον υπολογισμό του διαστήματος εμπιστοσύνης για τα τρία τυπικά επίπεδα εμπιστοσύνης P=95%, P=99% και P=99,9%Η τιμή επιλέγεται από . Εφαρμογές ανάλογα με τον αριθμό των βαθμών ελευθερίας. Εάν το μέγεθος του δείγματος είναι αρκετά μεγάλο, τότε οι τιμές που αντιστοιχούν σε αυτές τις πιθανότητες tείναι ίσα: 1,96, 2,58 και 3,29 . Έτσι, το οριακό σφάλμα δειγματοληψίας μας επιτρέπει να προσδιορίσουμε τις οριακές τιμές των χαρακτηριστικών του γενικού πληθυσμού και τα διαστήματα εμπιστοσύνης τους:

Η κατανομή των αποτελεσμάτων της επιλεκτικής παρατήρησης στον γενικό πληθυσμό στις κοινωνικοοικονομικές μελέτες έχει τα δικά της χαρακτηριστικά, αφού απαιτεί την πληρότητα της αντιπροσωπευτικότητας όλων των τύπων και ομάδων της. Η βάση για τη δυνατότητα μιας τέτοιας κατανομής είναι ο υπολογισμός σχετικό σφάλμα:

που Δ % - σχετικό οριακό σφάλμα δειγματοληψίας. , .

Υπάρχουν δύο κύριες μέθοδοι για την επέκταση μιας δειγματοληπτικής παρατήρησης στον πληθυσμό: άμεση μετατροπή και μέθοδος συντελεστών.

Ουσία άμεση μετατροπήείναι ο πολλαπλασιασμός του μέσου όρου του δείγματος!!\overline(x) με το μέγεθος του πληθυσμού .

Παράδειγμα. Ας υπολογιστεί με δειγματοληπτική μέθοδο ο μέσος αριθμός των νηπίων στην πόλη και ας ανέλθει σε ένα άτομο. Εάν υπάρχουν 1000 νέες οικογένειες στην πόλη, τότε ο αριθμός των θέσεων που απαιτούνται στο δημοτικό βρεφονηπιακό σταθμό προκύπτει πολλαπλασιάζοντας αυτόν τον μέσο όρο με το μέγεθος του γενικού πληθυσμού N = 1000, δηλ. θα είναι 1200 θέσεις.

Μέθοδος συντελεστώνΣυνιστάται να χρησιμοποιείται στην περίπτωση που πραγματοποιείται επιλεκτική παρατήρηση προκειμένου να διευκρινιστούν τα δεδομένα της συνεχούς παρατήρησης.

Για να το κάνετε αυτό, χρησιμοποιείται ο τύπος:

όπου όλες οι μεταβλητές είναι το μέγεθος του πληθυσμού:

Απαιτούμενο μέγεθος δείγματος

Πίνακας 4. Απαιτούμενο μέγεθος δείγματος (n) για διαφορετικούς τύπους οργάνωσης δειγματοληψίας

Όταν σχεδιάζετε μια δειγματοληπτική έρευνα με προκαθορισμένη τιμή του επιτρεπόμενου δειγματοληπτικού σφάλματος, είναι απαραίτητο να εκτιμήσετε σωστά το απαιτούμενο το μέγεθος του δείγματος. Αυτό το ποσό μπορεί να προσδιοριστεί με βάση το επιτρεπόμενο σφάλμα κατά την επιλεκτική παρατήρηση με βάση μια δεδομένη πιθανότητα που εγγυάται ένα αποδεκτό επίπεδο σφάλματος (λαμβάνοντας υπόψη τον τρόπο οργάνωσης της παρατήρησης). Οι τύποι για τον προσδιορισμό του απαιτούμενου μεγέθους δείγματος n μπορούν εύκολα να ληφθούν απευθείας από τους τύπους για το οριακό σφάλμα δειγματοληψίας. Έτσι, από την έκφραση για το οριακό σφάλμα:

το μέγεθος του δείγματος καθορίζεται άμεσα n:

Αυτός ο τύπος δείχνει ότι με τη μείωση του οριακού σφάλματος δειγματοληψίας Δ αυξάνει σημαντικά το απαιτούμενο μέγεθος δείγματος, το οποίο είναι ανάλογο με τη διακύμανση και το τετράγωνο του Student's t-test.

Για μια συγκεκριμένη μέθοδο οργάνωσης της παρατήρησης, το απαιτούμενο μέγεθος δείγματος υπολογίζεται σύμφωνα με τους τύπους που δίνονται στον Πίνακα. 9.4.

Παραδείγματα Πρακτικών Υπολογισμών

Παράδειγμα 1. Υπολογισμός της μέσης τιμής και του διαστήματος εμπιστοσύνης για ένα συνεχές ποσοτικό χαρακτηριστικό.

Για την αξιολόγηση της ταχύτητας διακανονισμού με τους πιστωτές στην τράπεζα, πραγματοποιήθηκε ένα τυχαίο δείγμα 10 παραστατικών πληρωμής. Οι τιμές τους αποδείχθηκαν ίσες (σε ημέρες): 10; 3; δεκαπέντε; δεκαπέντε; 22; 7; οκτώ; ένας; δεκαεννέα; 20.

Απαιτείται με πιθανότητα P = 0,954προσδιορισμός οριακού σφάλματος Δ μέσος όρος δείγματος και όρια εμπιστοσύνης του μέσου χρόνου υπολογισμού.

Απόφαση.Η μέση τιμή υπολογίζεται από τον τύπο από τον Πίνακα. 9.1 για τον πληθυσμό του δείγματος

Η διασπορά υπολογίζεται σύμφωνα με τον τύπο από τον Πίνακα. 9.1.

Το μέσο τετραγωνικό σφάλμα της ημέρας.

Το σφάλμα του μέσου όρου υπολογίζεται από τον τύπο:

εκείνοι. η μέση τιμή είναι x ± m = 12,0 ± 2,3 ημέρες.

Η αξιοπιστία του μέσου όρου ήταν

Το περιοριστικό σφάλμα υπολογίζεται από τον τύπο από τον Πίνακα. 9.3 για επανεκλογή, αφού το μέγεθος του πληθυσμού είναι άγνωστο, και για P = 0,954επίπεδο αυτοπεποίθησης.

Έτσι, η μέση τιμή είναι `x ± D = `x ± 2m = 12,0 ± 4,6, δηλ. Η πραγματική του τιμή κυμαίνεται από 7,4 έως 16,6 ημέρες.

Χρήση πίνακα μαθητή. Η εφαρμογή μας επιτρέπει να συμπεράνουμε ότι για n = 10 - 1 = 9 βαθμούς ελευθερίας η λαμβανόμενη τιμή είναι αξιόπιστη με επίπεδο σημαντικότητας £ 0,001, δηλ. η προκύπτουσα μέση τιμή είναι σημαντικά διαφορετική από το 0.

Παράδειγμα 2. Εκτίμηση της πιθανότητας (γενική μετοχή) r.

Με μια μέθοδο μηχανικής δειγματοληψίας για την έρευνα της κοινωνικής θέσης 1000 οικογενειών, αποκαλύφθηκε ότι το ποσοστό των οικογενειών με χαμηλό εισόδημα ήταν w = 0,3 (30%)(το δείγμα ήταν 2% , δηλ. n/N = 0,02). Απαιτείται με επίπεδο εμπιστοσύνης p = 0,997ορίστε έναν δείκτη Rοικογένειες με χαμηλό εισόδημα σε όλη την περιοχή.

Απόφαση.Σύμφωνα με τις τιμές συνάρτησης που παρουσιάζονται Ф(t)βρείτε για ένα δεδομένο επίπεδο εμπιστοσύνης P = 0,997έννοια t=3(βλ. τύπο 3). Οριακό σφάλμα κοινής χρήσης wπροσδιορίστε με τον τύπο από τον Πίνακα. 9.3 για μη επαναλαμβανόμενη δειγματοληψία (η μηχανική δειγματοληψία είναι πάντα μη επαναλαμβανόμενη):

Περιορισμός σχετικού σφάλματος δειγματοληψίας σε % θα είναι:

Η πιθανότητα (γενικό μερίδιο) των οικογενειών χαμηλού εισοδήματος στην περιοχή θα είναι p=w±Δw, και τα όρια εμπιστοσύνης p υπολογίζονται με βάση τη διπλή ανισότητα:

w — Δw ≤ p ≤ w — Δw, δηλ. η πραγματική τιμή του p βρίσκεται μέσα σε:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Έτσι, με πιθανότητα 0,997, μπορεί να υποστηριχθεί ότι το ποσοστό των οικογενειών με χαμηλό εισόδημα μεταξύ όλων των οικογενειών της περιοχής κυμαίνεται από 28,6% έως 31,4%.

Παράδειγμα 3Υπολογισμός της μέσης τιμής και του διαστήματος εμπιστοσύνης για ένα διακριτό χαρακτηριστικό που καθορίζεται από μια σειρά διαστημάτων.

Στον πίνακα. 5. Καθορίζεται η κατανομή των αιτήσεων για την παραγωγή παραγγελιών σύμφωνα με το χρονοδιάγραμμα υλοποίησης τους από την επιχείρηση.

Πίνακας 5. Κατανομή των παρατηρήσεων ανά χρόνο εμφάνισης

Απόφαση. Ο μέσος χρόνος ολοκλήρωσης της παραγγελίας υπολογίζεται από τον τύπο:

Ο μέσος χρόνος θα είναι:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 μήνες

Την ίδια απάντηση παίρνουμε αν χρησιμοποιήσουμε τα δεδομένα στο p i από την προτελευταία στήλη του Πίνακα. 9.5 χρησιμοποιώντας τον τύπο:

Σημειώστε ότι το μέσο του διαστήματος για την τελευταία διαβάθμιση βρίσκεται συμπληρώνοντάς το τεχνητά με το πλάτος του διαστήματος της προηγούμενης διαβάθμισης ίσο με 60 - 36 = 24 μήνες.

Η διασπορά υπολογίζεται με τον τύπο

που x i- το μέσο της σειράς διαστήματος.

Επομένως!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) και το τυπικό σφάλμα είναι .

Το σφάλμα του μέσου όρου υπολογίζεται με τον τύπο για μήνες, δηλ. ο μέσος όρος είναι!!\overline(x) ± m = 23,1 ± 13,4.

Το περιοριστικό σφάλμα υπολογίζεται από τον τύπο από τον Πίνακα. 9,3 για επανεπιλογή επειδή το μέγεθος του πληθυσμού είναι άγνωστο, για επίπεδο εμπιστοσύνης 0,954:

Ο μέσος όρος λοιπόν είναι:

εκείνοι. Η πραγματική του τιμή κυμαίνεται από 0 έως 50 μήνες.

Παράδειγμα 4Για να προσδιοριστεί η ταχύτητα των διακανονισμών με πιστωτές N = 500 επιχειρήσεων της εταιρείας σε μια εμπορική τράπεζα, είναι απαραίτητο να διεξαχθεί μια επιλεκτική μελέτη χρησιμοποιώντας τη μέθοδο της τυχαίας μη επαναλαμβανόμενης επιλογής. Προσδιορίστε το απαιτούμενο μέγεθος δείγματος n έτσι ώστε με πιθανότητα P = 0,954 το σφάλμα του μέσου όρου του δείγματος να μην υπερβαίνει τις 3 ημέρες, εάν οι δοκιμαστικές εκτιμήσεις έδειξαν ότι η τυπική απόκλιση s ήταν 10 ημέρες.

Απόφαση. Για να προσδιορίσουμε τον αριθμό των απαραίτητων μελετών n, χρησιμοποιούμε τον τύπο για μη επαναλαμβανόμενη επιλογή από τον Πίνακα. 9.4:

Σε αυτό, η τιμή του t προσδιορίζεται από για το επίπεδο εμπιστοσύνης Р = 0,954. Είναι ίσο με 2. Η μέση τετραγωνική τιμή s = 10, το μέγεθος του πληθυσμού N = 500 και το οριακό σφάλμα του μέσου όρου Δ x = 3. Αντικαθιστώντας αυτές τις τιμές στον τύπο, παίρνουμε:

εκείνοι. αρκεί να γίνει ένα δείγμα 41 επιχειρήσεων για να εκτιμηθεί η απαιτούμενη παράμετρος - η ταχύτητα των διακανονισμών με τους πιστωτές.

Οι αποκλίσεις μεταξύ της τιμής οποιουδήποτε δείκτη που εντοπίζεται μέσω της στατιστικής παρατήρησης και του πραγματικού μεγέθους του ονομάζονται λάθη παρατήρησης . Ανάλογα με τα αίτια εμφάνισης, διακρίνονται τα σφάλματα εγγραφής και τα σφάλματα αντιπροσωπευτικότητας.

Σφάλματα εγγραφής προκύπτουν ως αποτέλεσμα εσφαλμένης διαπίστωσης στοιχείων ή λανθασμένης καταγραφής κατά τη διαδικασία παρατήρησης ή συνέντευξης. Είναι τυχαίες ή συστηματικές. Τυχαία σφάλματα εγγραφής μπορούν να γίνουν τόσο από τους ερωτηθέντες στις απαντήσεις τους όσο και από τους καταχωρητές. Τα συστηματικά σφάλματα μπορεί να είναι τόσο σκόπιμα όσο και ακούσια. Εσκεμμένη - συνειδητή, προληπτική παραμόρφωση της πραγματικής κατάστασης πραγμάτων. Τα ακούσια προκαλούνται από διάφορους τυχαίους λόγους (αμέλεια, απροσεξία).

Σφάλματα αντιπροσωπευτικότητας (αντιπροσωπευτικότητα) προκύπτουν ως αποτέλεσμα μιας ελλιπούς έρευνας και εάν ο πληθυσμός της έρευνας δεν αναπαράγει πλήρως τον γενικό πληθυσμό. Μπορούν να είναι τυχαίες ή συστηματικές. Τα τυχαία σφάλματα αντιπροσωπευτικότητας είναι αποκλίσεις που συμβαίνουν κατά τη διάρκεια της μη συνεχούς παρατήρησης λόγω του γεγονότος ότι το σύνολο των επιλεγμένων μονάδων παρατήρησης (δείγμα) δεν αναπαράγει πλήρως ολόκληρο τον πληθυσμό ως σύνολο. Οι προκαταλήψεις αντιπροσωπευτικότητας είναι αποκλίσεις που προκύπτουν από παραβιάσεις των αρχών της τυχαίας επιλογής μονάδων. Τα σφάλματα αντιπροσωπευτικότητας είναι οργανικά εγγενή στην παρατήρηση του δείγματος και προκύπτουν λόγω του γεγονότος ότι ο πληθυσμός του δείγματος δεν αναπαράγει πλήρως τον γενικό πληθυσμό. Είναι αδύνατο να αποφευχθούν σφάλματα αντιπροσωπευτικότητας, ωστόσο, χρησιμοποιώντας τις μεθόδους της θεωρίας πιθανοτήτων που βασίζονται στη χρήση οριακών θεωρημάτων του νόμου των μεγάλων αριθμών, αυτά τα σφάλματα μπορούν να μειωθούν σε ελάχιστες τιμές, τα όρια των οποίων ορίζονται με αρκετά υψηλή ακρίβεια.

Σφάλματα δειγματοληψίας - τη διαφορά μεταξύ των χαρακτηριστικών του δείγματος και του γενικού πληθυσμού. Για τη μέση τιμή, το σφάλμα θα καθοριστεί από τον τύπο

που

αξία
που ονομάζεται οριακό σφάλμα δείγματα.

Το οριακό σφάλμα δειγματοληψίας είναι μια τυχαία τιμή. Τα οριακά θεωρήματα του νόμου των μεγάλων αριθμών είναι αφιερωμένα στη μελέτη προτύπων τυχαίων σφαλμάτων δειγματοληψίας. Αυτά τα μοτίβα αποκαλύπτονται πληρέστερα στα θεωρήματα των P. L. Chebyshev και A. M. Lyapunov.

Θεώρημα του P. L. Chebyshev σε σχέση με την υπό εξέταση μέθοδο, μπορεί να διατυπωθεί ως εξής: με έναν αρκετά μεγάλο αριθμό ανεξάρτητων παρατηρήσεων, είναι δυνατό να υποστηριχθεί με πιθανότητα κοντά στη μονάδα (δηλαδή σχεδόν με βεβαιότητα) ότι η απόκλιση του δείγματος σημαίνει από το γενικό θα είναι αυθαίρετα μικρό. Το θεώρημα του P. L. Chebyshev αποδεικνύει ότι η τιμή σφάλματος δεν πρέπει να υπερβαίνει . Με τη σειρά της, η αξία , που εκφράζει την τυπική απόκλιση του μέσου όρου του δείγματος από τον γενικό μέσο όρο, εξαρτάται από τη διακύμανση του χαρακτηριστικού στον γενικό πληθυσμό και τον αριθμό των επιλεγμένων μονάδων n. Αυτή η εξάρτηση εκφράζεται με τον τύπο

, (7.2)

που εξαρτάται επίσης από τη μέθοδο δειγματοληψίας.

η αξία =που ονομάζεται το μέσο δειγματοληπτικό σφάλμα. Σε αυτή την έκφραση είναι η γενική διακύμανση, nείναι το μέγεθος του δείγματος.

Ας εξετάσουμε πώς ο αριθμός των επιλεγμένων μονάδων επηρεάζει την τιμή του μέσου σφάλματος n. Είναι λογικά εύκολο να επαληθευτεί ότι όταν επιλέγεται ένας μεγάλος αριθμός μονάδων, οι αποκλίσεις μεταξύ των μέσων θα είναι μικρότερες, δηλ. υπάρχει αντίστροφη σχέση μεταξύ του μέσου δειγματοληπτικού σφάλματος και του αριθμού των επιλεγμένων μονάδων. Σε αυτήν την περίπτωση, δεν σχηματίζεται μόνο μια αντίστροφη μαθηματική εξάρτηση εδώ, αλλά μια τέτοια εξάρτηση, η οποία δείχνει ότι το τετράγωνο της απόκλισης μεταξύ των μέσων είναι αντιστρόφως ανάλογο με τον αριθμό των επιλεγμένων μονάδων.

Η αύξηση της μεταβλητότητας ενός σημείου συνεπάγεται αύξηση της τυπικής απόκλισης και, κατά συνέπεια, σφάλματα. Αν υποθέσουμε ότι όλες οι μονάδες θα έχουν την ίδια τιμή χαρακτηριστικού, τότε η τυπική απόκλιση θα γίνει μηδέν και το σφάλμα δειγματοληψίας θα εξαφανιστεί επίσης. Τότε δεν χρειάζεται να εφαρμοστεί δειγματοληψία. Ωστόσο, θα πρέπει να ληφθεί υπόψη ότι το μέγεθος της μεταβλητότητας του χαρακτηριστικού στον γενικό πληθυσμό είναι άγνωστο, αφού τα μεγέθη των μονάδων σε αυτό είναι άγνωστα. Είναι δυνατός ο υπολογισμός μόνο της μεταβλητότητας του χαρακτηριστικού στον πληθυσμό του δείγματος. Η αναλογία μεταξύ των διακυμάνσεων του γενικού πληθυσμού και του πληθυσμού δείγματος εκφράζεται με τον τύπο

Δεδομένου ότι η αξία για αρκετά μεγάλο nείναι κοντά στη μονάδα, μπορούμε περίπου να υποθέσουμε ότι η διακύμανση του δείγματος είναι ίση με τη γενική διακύμανση, δηλ.

Κατά συνέπεια, το μέσο δειγματοληπτικό σφάλμα δείχνει ποιες πιθανές αποκλίσεις των χαρακτηριστικών του πληθυσμού του δείγματος από τα αντίστοιχα χαρακτηριστικά του γενικού πληθυσμού. Ωστόσο, το μέγεθος αυτού του σφάλματος μπορεί να κριθεί με μια ορισμένη πιθανότητα. Ο πολλαπλασιαστής δείχνει την τιμή πιθανότητας

Θεώρημα του A. M. Lyapunov . Ο A. M. Lyapunov απέδειξε ότι η κατανομή των μέσων δειγμάτων (επομένως, οι αποκλίσεις τους από τον γενικό μέσο όρο) με έναν αρκετά μεγάλο αριθμό ανεξάρτητων παρατηρήσεων είναι περίπου φυσιολογική, υπό την προϋπόθεση ότι ο γενικός πληθυσμός έχει πεπερασμένο μέσο όρο και περιορισμένη διακύμανση.

Μαθηματικά Το θεώρημα του Lyapunovμπορεί να γραφτεί ως εξής:

(7.3)

που
, (7.4)

που
είναι μια μαθηματική σταθερά.

–οριακό δειγματοληπτικό σφάλμα , που καθιστά δυνατό να ανακαλύψουμε σε ποια όρια βρίσκεται η τιμή του γενικού μέσου όρου.

Οι τιμές αυτού του ολοκληρώματος για διαφορετικές τιμές του συντελεστή εμπιστοσύνης tυπολογίζονται και δίνονται σε ειδικούς μαθηματικούς πίνακες. Ειδικότερα, όταν:

Στο βαθμό που tυποδηλώνει την πιθανότητα ασυμφωνίας
, δηλ. η πιθανότητα πόσο θα διαφέρει ο γενικός μέσος όρος από τον μέσο όρο του δείγματος, τότε αυτό μπορεί να διαβαστεί ως εξής: με πιθανότητα 0,683 μπορεί να υποστηριχθεί ότι η διαφορά μεταξύ του δείγματος και του γενικού μέσου όρου δεν υπερβαίνει τη μία τιμή του μέσου δειγματοληπτικού σφάλματος. Με άλλα λόγια, στο 68,3% των περιπτώσεων, το σφάλμα αντιπροσωπευτικότητας δεν θα υπερβαίνει
Με πιθανότητα 0,954, μπορεί να υποστηριχθεί ότι το σφάλμα αντιπροσωπευτικότητας δεν υπερβαίνει
(δηλαδή στο 95% των περιπτώσεων). Με πιθανότητα 0,997, δηλαδή αρκετά κοντά στο ένα, μπορεί κανείς να αναμένει ότι η διαφορά μεταξύ του δείγματος και του γενικού μέσου όρου δεν θα υπερβαίνει το τριπλάσιο του μέσου σφάλματος δείγματος κ.λπ.

Λογικά, η σύνδεση εδώ φαίνεται αρκετά σαφής: όσο μεγαλύτερα είναι τα όρια εντός των οποίων επιτρέπεται ένα πιθανό σφάλμα, τόσο πιο πιθανό είναι να κριθεί το μέγεθός του.

Γνωρίζοντας τη μέση τιμή δείγματος του χαρακτηριστικού
και οριακό δειγματοληπτικό σφάλμα
, είναι δυνατό να καθοριστούν τα όρια (όρια) που περιέχουν τον γενικό μέσο όρο

1 . Αυτοτυχαία δειγματοληψία - αυτή η μέθοδος επικεντρώνεται σε μονάδες δειγματοληψίας από τον γενικό πληθυσμό χωρίς καμία διαίρεση σε μέρη ή ομάδες. Ταυτόχρονα, για τη συμμόρφωση με τη βασική αρχή της δειγματοληψίας - ίσες ευκαιρίες για επιλογή όλων των μονάδων του γενικού πληθυσμού - χρησιμοποιείται ένα σχήμα τυχαίας εξαγωγής μονάδων με κλήρωση (κλήρωση) ή πίνακας τυχαίων αριθμών. Είναι δυνατή η επαναλαμβανόμενη και η μη επαναλαμβανόμενη επιλογή μονάδων

Το μέσο σφάλμα ενός κατάλληλου τυχαίου δείγματος είναι η τυπική απόκλιση των πιθανών τιμών του μέσου όρου του δείγματος από τον γενικό μέσο όρο. Τα μέσα δειγματοληπτικά σφάλματα για τη μέθοδο τυχαίας επιλογής παρουσιάζονται στον Πίνακα. 7.2.

Πίνακας 7.2

Μέσο δειγματοληπτικό σφάλμα μ	Κατά την επιλογή
Μέσο δειγματοληπτικό σφάλμα μ	αλλεπάλληλος	μη επαναλαμβανόμενο
Για μεσαία

Στον πίνακα χρησιμοποιούνται οι ακόλουθες ονομασίες:

είναι η διακύμανση του δείγματος.

- το μέγεθος του δείγματος;

- το μέγεθος του γενικού πληθυσμού·

είναι η αναλογία δείγματος των μονάδων που έχουν το υπό μελέτη χαρακτηριστικό.

- τον αριθμό των μονάδων που έχουν το χαρακτηριστικό που μελετήθηκε.

- το μέγεθος του δείγματος.

Για να αυξήσετε την ακρίβεια αντί για πολλαπλασιαστή πάρτε τον πολλαπλασιαστή
, αλλά με μεγάλο αριθμό Νη διαφορά μεταξύ αυτών των εκφράσεων δεν έχει πρακτική σημασία.

Οριακό σφάλμα σωστής τυχαίας δειγματοληψίας
υπολογίζεται με τον τύπο

, (7.6)

που t – ο συντελεστής εμπιστοσύνης εξαρτάται από την τιμή της πιθανότητας.

Παράδειγμα.Κατά την εξέταση εκατό δειγμάτων προϊόντων που επιλέχθηκαν τυχαία από μια παρτίδα, τα 20 αποδείχθηκαν μη τυποποιημένα. Με πιθανότητα 0,954, καθορίστε τα όρια στα οποία βρίσκεται η αναλογία των μη τυποποιημένων προϊόντων στην παρτίδα.

Απόφαση. Υπολογίστε το συνολικό μερίδιο ( R):
.

Μερίδιο μη τυποποιημένων προϊόντων:
.

Το οριακό σφάλμα του κλάσματος δείγματος με πιθανότητα 0,954 υπολογίζεται από τον τύπο (7.6) χρησιμοποιώντας τον τύπο του Πίνακα. 7.2 για κοινή χρήση:

Με πιθανότητα 0,954, μπορεί να υποστηριχθεί ότι το μερίδιο των μη τυποποιημένων προϊόντων σε μια παρτίδα αγαθών είναι εντός 12% ≤ Π≤ 28 %.

Στην πρακτική του σχεδιασμού παρατήρησης δειγμάτων, υπάρχει ανάγκη να προσδιοριστεί το μέγεθος του δείγματος, το οποίο είναι απαραίτητο για να διασφαλιστεί μια ορισμένη ακρίβεια στον υπολογισμό των γενικών μέσων. Το οριακό δειγματοληπτικό σφάλμα και η πιθανότητα του δίνονται σε αυτή την περίπτωση. Από τον τύπο
και τους τύπους για τα μέσα δειγματοληπτικά σφάλματα, καθορίζεται το απαιτούμενο μέγεθος δείγματος. Τύποι για τον προσδιορισμό του μεγέθους του δείγματος ( n) εξαρτάται από τη μέθοδο επιλογής. Ο υπολογισμός του μεγέθους του δείγματος για το πραγματικό τυχαίο δείγμα δίνεται στον Πίνακα. 7.3.

Πίνακας 7.3

Προβλεπόμενη επιλογή
Προβλεπόμενη επιλογή	για μέση
Αλλεπάλληλος
μη επαναλαμβανόμενο

2 . Μηχανική δειγματοληψία - με αυτήν τη μέθοδο, προχωρούν στο να λαμβάνουν υπόψη ορισμένα χαρακτηριστικά της θέσης των αντικειμένων στον γενικό πληθυσμό, τη σειρά τους (σύμφωνα με τη λίστα, τον αριθμό, το αλφάβητο). Η μηχανική δειγματοληψία πραγματοποιείται με την επιλογή μεμονωμένων αντικειμένων του γενικού πληθυσμού σε ένα ορισμένο διάστημα (κάθε 10η ή 20η). Το διάστημα υπολογίζεται σε σχέση με , που n- το μέγεθος του δείγματος, Ν- το μέγεθος του γενικού πληθυσμού. Έτσι, εάν από έναν πληθυσμό 500.000 μονάδων υποτίθεται ότι λαμβάνεται δείγμα 2%, δηλαδή επιλέξει 10.000 μονάδες, τότε η αναλογία επιλογής θα είναι
Η επιλογή των μονάδων πραγματοποιείται σύμφωνα με την καθορισμένη αναλογία σε τακτά χρονικά διαστήματα. Εάν η θέση των αντικειμένων στον γενικό πληθυσμό είναι τυχαία, τότε η μηχανική δειγματοληψία είναι παρόμοια σε περιεχόμενο με την τυχαία επιλογή. Στη μηχανική επιλογή, χρησιμοποιείται μόνο μη επαναλαμβανόμενη δειγματοληψία.

Το μέσο σφάλμα και το μέγεθος του δείγματος στη μηχανική επιλογή υπολογίζεται σύμφωνα με τους τύπους της σωστής τυχαίας δειγματοληψίας (βλ. Πίνακες 7.2 και 7.3).

3 . Τυπικό δείγμα , όπου ο γενικός πληθυσμός χωρίζεται σύμφωνα με ορισμένα βασικά χαρακτηριστικά σε τυπικές ομάδες. Η επιλογή των μονάδων γίνεται από τυπικές ομάδες. Με αυτή τη μέθοδο επιλογής, ο γενικός πληθυσμός χωρίζεται σε ομάδες που είναι ομοιογενείς από ορισμένες απόψεις, οι οποίες έχουν τα δικά τους χαρακτηριστικά, και το ερώτημα περιορίζεται στον προσδιορισμό του μεγέθους των δειγμάτων από κάθε ομάδα. Μπορεί ομοιόμορφη δειγματοληψία - με αυτήν τη μέθοδο, επιλέγεται ο ίδιος αριθμός μονάδων από κάθε τυπική ομάδα
Μια τέτοια προσέγγιση δικαιολογείται μόνο εάν τα μεγέθη των αρχικών τυπικών ομάδων είναι ίσα. Στην τυπική επιλογή, δυσανάλογη με το μέγεθος των ομάδων, ο συνολικός αριθμός των επιλεγμένων μονάδων διαιρείται με τον αριθμό των τυπικών ομάδων, η τιμή που προκύπτει δίνει τον αριθμό των επιλογών από κάθε τυπική ομάδα.

Μια πιο προηγμένη μορφή επιλογής είναι αναλογική δειγματοληψία . Ένα τέτοιο σχήμα δειγματοληψίας ονομάζεται αναλογικό όταν ο αριθμός των δειγμάτων που λαμβάνονται από κάθε τυπική ομάδα στο γενικό πληθυσμό είναι ανάλογος με τους αριθμούς, τις διασπορές (ή συνδυαστικά και τους αριθμούς και τις διασπορές). Καθορίζουμε υπό όρους το μέγεθος του δείγματος των 100 μονάδων και επιλέγουμε μονάδες από τις ομάδες:

– σε αναλογία με το μέγεθος του γενικού πληθυσμού τους (Πίνακας 7.4). Ο πίνακας δείχνει:

Ν Εγώείναι το μέγεθος μιας τυπικής ομάδας.

ρε ι- μερίδιο ( ΝΕγώ / Ν);

Ν- το μέγεθος του γενικού πληθυσμού·

n Εγώ– το μέγεθος του δείγματος από μια τυπική ομάδα υπολογίζεται:

, (7.7)

nείναι το μέγεθος του δείγματος από τον γενικό πληθυσμό.

Πίνακας 7.4

Ν Εγώ	ρε ι	n Εγώ

– ανάλογη με την τυπική απόκλιση (Πίνακας 7.5).

εδώ  Εγώ– τυπική απόκλιση τυπικών ομάδων.

n Εγώ – το μέγεθος του δείγματος από μια τυπική ομάδα υπολογίζεται με τον τύπο

(7.8)

Πίνακας 7.5

Ν Εγώ			n Εγώ

– σε συνδυασμό (Πίνακας 7.6).

Το μέγεθος του δείγματος υπολογίζεται από τον τύπο

. (7.9)

Πίνακας 7.6

		 Εγώ Ν Εγώ

Κατά τη διεξαγωγή ενός τυπικού δείγματος, η απευθείας επιλογή από κάθε ομάδα πραγματοποιείται με τυχαία επιλογή.

Τα μέσα δειγματοληπτικά σφάλματα υπολογίζονται χρησιμοποιώντας τους τύπους στον Πίνακα. 7.7 ανάλογα με τη μέθοδο επιλογής από τυπικές ομάδες.

Πίνακας 7.7

Μέθοδος επιλογής	Αλλεπάλληλος		μη επαναλαμβανόμενο
Μέθοδος επιλογής	για μέση	για μερίδιο	για μέση	για μερίδιο
Δυσανάλογο με το μέγεθος της ομάδας
Ανάλογα με το μέγεθος της ομάδας
Αναλογική διακύμανση σε ομάδες (είναι η πιο ωφέλιμη)

εδώ
είναι ο μέσος όρος των ενδοομαδικών διακυμάνσεων των τυπικών ομάδων.

είναι η αναλογία των μονάδων που έχουν το υπό μελέτη χαρακτηριστικό.

είναι ο μέσος όρος των διακυμάνσεων εντός του ομίλου για τη μετοχή.

είναι η τυπική απόκλιση σε ένα δείγμα του Εγώ-η τυπική ομάδα?

είναι το μέγεθος του δείγματος από μια τυπική ομάδα.

είναι το συνολικό μέγεθος του δείγματος.

είναι ο όγκος μιας τυπικής ομάδας.

- τον όγκο του γενικού πληθυσμού.

Το μέγεθος του δείγματος από κάθε τυπική ομάδα θα πρέπει να είναι ανάλογο με την τυπική απόκλιση σε αυτήν την ομάδα.
.Αριθμητικός υπολογισμός
παράγονται σύμφωνα με τους τύπους που δίνονται στον Πίνακα. 7.8.

Πίνακας 7.8

4 . σειριακή δειγματοληψία - χρήσιμο σε περιπτώσεις όπου οι μονάδες του πληθυσμού ομαδοποιούνται σε μικρές ομάδες ή σειρές. Με ένα σειριακό δείγμα, ο πληθυσμός χωρίζεται σε ομάδες ίδιου μεγέθους - σειρών. Οι σειρές επιλέγονται στο σετ δειγμάτων. Η ουσία της σειριακής δειγματοληψίας έγκειται στην τυχαία ή μηχανική επιλογή σειρών, εντός της οποίας πραγματοποιείται πλήρης έρευνα των μονάδων. Το μέσο σφάλμα της σειριακής δειγματοληψίας με ίσες σειρές εξαρτάται μόνο από το μέγεθος της διασποράς μεταξύ ομάδων. Τα μέσα σφάλματα συνοψίζονται στον Πίνακα. 7.9.

Πίνακας 7.9

Μέθοδος επιλογής σειράς
Μέθοδος επιλογής σειράς	για μέση	για μερίδιο
Αλλεπάλληλος
μη επαναλαμβανόμενο

Εδώ Rείναι ο αριθμός των σειρών στο γενικό πληθυσμό.

r– αριθμός επιλεγμένων σειρών.

– διακύμανση μέσων ενδιάμεσων (διαομαδικών) μέσων.

– ενδιάμεση (διαομαδική) διακύμανση της μετοχής.

Με τη σειριακή επιλογή, ο απαιτούμενος αριθμός επιλεγμένων σειρών προσδιορίζεται με τον ίδιο τρόπο όπως και με τη σωστή μέθοδο τυχαίας επιλογής.

Ο υπολογισμός του αριθμού των σειριακών δειγμάτων γίνεται σύμφωνα με τους τύπους που δίνονται στον Πίνακα. 7.10.

Πίνακας 7.10

Παράδειγμα.Στο μηχανουργείο του εργοστασίου εργάζονται 100 εργάτες σε δέκα ομάδες. Προκειμένου να μελετηθούν τα προσόντα των εργαζομένων, έγινε ένα σειριακό μη επαναλαμβανόμενο δείγμα 20%, το οποίο περιελάμβανε δύο ομάδες. Ελήφθη η ακόλουθη κατανομή των ερωτηθέντων εργαζομένων ανά κατηγορία:

	Οι τάξεις των εργαζομένων στην ταξιαρχία 1	Οι τάξεις των εργαζομένων στην ταξιαρχία 2		Οι τάξεις των εργαζομένων στην ταξιαρχία 1	Οι τάξεις των εργαζομένων στην ταξιαρχία 2

Είναι απαραίτητο να προσδιοριστούν με πιθανότητα 0,997 τα όρια στα οποία βρίσκεται η μέση κατηγορία των εργαζομένων του μηχανουργείου.

Απόφαση.Ορίζουμε το δείγμα μέσου όρου για τις ομάδες και το συνολικό μέσο όρο ως σταθμισμένο μέσο όρο της ομάδας σημαίνει:

Ας προσδιορίσουμε τη διασπορά σειρών με τους τύπους (5.25):

Υπολογίζουμε το μέσο δειγματοληπτικό σφάλμα χρησιμοποιώντας τον τύπο στον Πίνακα. 7.9:

Ας υπολογίσουμε το οριακό δειγματοληπτικό σφάλμα με πιθανότητα 0,997:

Με πιθανότητα 0,997, μπορεί να υποστηριχθεί ότι η μέση κατάταξη των εργαζομένων σε ένα μηχανουργείο είναι εντός

Για να χαρακτηριστεί η αξιοπιστία των δεικτών του δείγματος, γίνεται διάκριση μεταξύ του μέσου όρου και των οριακών σφαλμάτων του δείγματος, τα οποία είναι χαρακτηριστικά μόνο των δειγματοληπτικών παρατηρήσεων. Αυτοί οι δείκτες αντικατοπτρίζουν τη διαφορά μεταξύ του δείγματος και των αντίστοιχων γενικών δεικτών.

Μέσο σφάλμα δείγματοςκαθορίζεται κυρίως από το μέγεθος του δείγματος και εξαρτάται από τη δομή και τον βαθμό διακύμανσης του υπό μελέτη χαρακτηριστικού.

Η έννοια του μέσου δειγματοληπτικού σφάλματος είναι η εξής. Οι υπολογισμένες τιμές του κλάσματος δείγματος (w) και του μέσου όρου του δείγματος () είναι από τη φύση τους τυχαίες μεταβλητές. Μπορούν να λάβουν διαφορετικές τιμές ανάλογα με το ποιες συγκεκριμένες μονάδες του γενικού πληθυσμού εμπίπτουν στο δείγμα. Για παράδειγμα, εάν, κατά τον προσδιορισμό της μέσης ηλικίας των εργαζομένων μιας επιχείρησης, περισσότεροι νέοι άνθρωποι περιλαμβάνονται σε ένα δείγμα και μεγαλύτεροι σε ηλικία εργαζόμενοι σε ένα άλλο, τότε οι μέσοι όροι του δείγματος και τα δειγματοληπτικά σφάλματα θα είναι διαφορετικά. Μέσο δειγματοληπτικό σφάλμακαθορίζεται από τον τύπο:

(27) ή - επαναδειγματοληψία. (28)

Όπου: μ είναι το μέσο δειγματοληπτικό σφάλμα.

σ είναι η τυπική απόκλιση ενός χαρακτηριστικού στο γενικό πληθυσμό.

n είναι το μέγεθος του δείγματος.

Η τιμή σφάλματος μ δείχνει πώς η μέση τιμή του χαρακτηριστικού, που καθορίστηκε από το δείγμα, διαφέρει από την πραγματική τιμή του χαρακτηριστικού στον γενικό πληθυσμό.

Από τον τύπο προκύπτει ότι το σφάλμα δειγματοληψίας είναι ευθέως ανάλογο με την τυπική απόκλιση και αντιστρόφως ανάλογο με την τετραγωνική ρίζα του αριθμού των μονάδων στο δείγμα. Αυτό σημαίνει, για παράδειγμα, ότι όσο μεγαλύτερη είναι η διασπορά των τιμών ενός χαρακτηριστικού στο γενικό πληθυσμό, δηλαδή όσο μεγαλύτερη είναι η διασπορά, τόσο μεγαλύτερο θα πρέπει να είναι το μέγεθος του δείγματος εάν θέλουμε να εμπιστευτούμε τα αποτελέσματα μιας δειγματοληπτικής έρευνας . Αντίθετα, με μια μικρή απόκλιση, μπορεί κανείς να περιοριστεί σε έναν μικρό αριθμό πληθυσμών δειγμάτων. Το σφάλμα δειγματοληψίας θα είναι τότε εντός αποδεκτών ορίων.

Δεδομένου ότι το μέγεθος του γενικού πληθυσμού N κατά τη δειγματοληψία μειώνεται κατά τη διάρκεια της μη επαναλαμβανόμενης επιλογής, ένας πρόσθετος παράγοντας περιλαμβάνεται στον τύπο για τον υπολογισμό του μέσου δειγματοληπτικού σφάλματος

(ένας- ). Ο τύπος για το μέσο δειγματοληπτικό σφάλμα έχει την ακόλουθη μορφή:

Το μέσο σφάλμα είναι μικρότερο για τη μη επαναλαμβανόμενη δειγματοληψία, γεγονός που το καθιστά ευρύτερα χρησιμοποιούμενο.

Τα πρακτικά συμπεράσματα απαιτούν χαρακτηρισμό του γενικού πληθυσμού με βάση τα αποτελέσματα του δείγματος. Τα μέσα και οι αναλογίες δειγμάτων εφαρμόζονται στο γενικό πληθυσμό, λαμβάνοντας υπόψη το όριο του πιθανού σφάλματός τους και με ένα επίπεδο πιθανότητας που το εγγυάται. Δεδομένου ενός συγκεκριμένου επιπέδου πιθανότητας, επιλέγεται η τιμή της κανονικοποιημένης απόκλισης και προσδιορίζεται το οριακό σφάλμα δειγματοληψίας.

Αξιοπιστία (πιθανότητα εμπιστοσύνης) εκτίμησης Χ επί Χ*που ονομάζεται πιθανότητα γ , με την οποία η ανισότητα

׀Х-Х*׀< δ, (30)

όπου δ είναι το οριακό δειγματοληπτικό σφάλμα που χαρακτηρίζει το πλάτος του διαστήματος στο οποίο βρίσκεται η τιμή της υπό μελέτη παραμέτρου του γενικού πληθυσμού με πιθανότητα γ.

Εμπιστοςκαλείται το διάστημα (X* - δ; X* + δ), το οποίο καλύπτει την εξεταζόμενη παράμετρο X (δηλαδή η τιμή της παραμέτρου X βρίσκεται μέσα σε αυτό το διάστημα) με δεδομένη αξιοπιστία γ.

Συνήθως, η αξιοπιστία της εκτίμησης ορίζεται εκ των προτέρων και ένας αριθμός κοντά στο ένα λαμβάνεται ως γ: 0,95; 0,99 ή 0,999.

Το περιοριστικό σφάλμα δ σχετίζεται με το μέσο σφάλμα μ ως εξής: , (31)

όπου: t είναι ο παράγοντας εμπιστοσύνης, ανάλογα με την πιθανότητα P, με την οποία μπορεί να υποστηριχθεί ότι το οριακό σφάλμα δ δεν θα υπερβαίνει το t-πλάσιο μέσο σφάλμα μ (λέγεται επίσης κρίσιμα σημεία ή ποσοστάσια κατανομής Student).

Όπως προκύπτει από τη σχέση , το οριακό σφάλμα είναι ευθέως ανάλογο με το μέσο δειγματοληπτικό σφάλμα και τον συντελεστή εμπιστοσύνης, ο οποίος εξαρτάται από το δεδομένο επίπεδο αξιοπιστίας της εκτίμησης.

Από τον τύπο για το μέσο δειγματοληπτικό σφάλμα και την αναλογία των οριακών και των μέσων σφαλμάτων, λαμβάνουμε:

Λαμβάνοντας υπόψη την πιθανότητα εμπιστοσύνης, αυτός ο τύπος θα λάβει τη μορφή.

Το μέσο δειγματοληπτικό σφάλμα δείχνει πόσο αποκλίνει κατά μέσο όρο η παράμετρος του πληθυσμού του δείγματος από την αντίστοιχη παράμετρο του γενικού πληθυσμού. Αν υπολογίσουμε τον μέσο όρο των σφαλμάτων όλων των πιθανών δειγμάτων ενός συγκεκριμένου τύπου ενός δεδομένου όγκου ( n) εξάγεται από τον ίδιο γενικό πληθυσμό, τότε παίρνουμε το γενικευτικό τους χαρακτηριστικό - μέσο δειγματοληπτικό σφάλμα ().

Στη θεωρία της επιλεκτικής παρατήρησης, έχουν προκύψει τύποι για τον προσδιορισμό, οι οποίοι είναι ατομικοί για διαφορετικές μεθόδους επιλογής (επαναλαμβανόμενες και μη), τύπους δειγμάτων που χρησιμοποιήθηκαν και τύπους εκτιμώμενων στατιστικών δεικτών.

Για παράδειγμα, εάν χρησιμοποιείται επαναλαμβανόμενη τυχαία δειγματοληψία, τότε ορίζεται ως:

Κατά την εκτίμηση της μέσης τιμής ενός χαρακτηριστικού,

Εάν το πρόσημο είναι εναλλακτικό, και το μερίδιο εκτιμάται.

Σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής, οι τύποι τροποποιούνται (1 - n/N):

- για τη μέση τιμή του χαρακτηριστικού·

- για μερίδιο.

Η πιθανότητα να ληφθεί ακριβώς μια τέτοια τιμή σφάλματος είναι πάντα ίση με 0,683. Στην πράξη, είναι προτιμότερο να λαμβάνονται δεδομένα με μεγαλύτερη πιθανότητα, αλλά αυτό οδηγεί σε αύξηση του μεγέθους του δειγματοληπτικού σφάλματος.

Το οριακό σφάλμα δειγματοληψίας () είναι ίσο με t επί του αριθμού των μέσων δειγματοληπτικών σφαλμάτων (στη θεωρία δειγματοληψίας συνηθίζεται να λέγεται ο συντελεστής t συντελεστής εμπιστοσύνης):

Εάν το σφάλμα δειγματοληψίας διπλασιαστεί (t = 2), τότε έχουμε πολύ μεγαλύτερη πιθανότητα ότι δεν θα υπερβεί ένα ορισμένο όριο (στην περίπτωσή μας, διπλάσιο του μέσου σφάλματος) - 0,954. Εάν πάρουμε t \u003d 3, τότε το επίπεδο εμπιστοσύνης θα είναι 0,997 - πρακτικά βεβαιότητα.

Το οριακό επίπεδο σφάλματος δειγματοληψίας εξαρτάται από τους ακόλουθους παράγοντες:

ο βαθμός διακύμανσης των μονάδων του γενικού πληθυσμού·
το μέγεθος του δείγματος;
επιλεγμένα σχήματα επιλογής (η μη επαναλαμβανόμενη επιλογή δίνει μικρότερη τιμή σφάλματος).
επίπεδο αυτοπεποίθησης.

Εάν το μέγεθος του δείγματος είναι μεγαλύτερο από 30, τότε η τιμή του t προσδιορίζεται από τον πίνακα κανονικής κατανομής, εάν είναι μικρότερος - από τον πίνακα κατανομής του Student.

Ακολουθούν ορισμένες τιμές του συντελεστή εμπιστοσύνης από τον πίνακα κανονικής κατανομής.

Το διάστημα εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού και για την αναλογία στον γενικό πληθυσμό ορίζεται ως εξής:

Έτσι, ο ορισμός των ορίων του γενικού μέσου όρου και του μεριδίου αποτελείται από τα ακόλουθα βήματα:

Σφάλματα δειγματοληψίας για διαφορετικούς τύπους επιλογής

Στην πραγματικότητα τυχαία και μηχανική δειγματοληψία. Το μέσο σφάλμα της πραγματικής τυχαίας και μηχανικής δειγματοληψίας βρίσκεται χρησιμοποιώντας τους τύπους που παρουσιάζονται στον Πίνακα. 11.3.

Παράδειγμα 11.2. Για τη μελέτη του επιπέδου απόδοσης των περιουσιακών στοιχείων, πραγματοποιήθηκε δειγματοληπτική έρευνα σε 90 επιχειρήσεις από τις 225 με τη μέθοδο της τυχαίας επαναδειγματοληψίας, ως αποτέλεσμα της οποίας προέκυψαν τα στοιχεία που παρουσιάζονται στον πίνακα.

Σε αυτό το παράδειγμα, έχουμε ένα δείγμα 40% (90: 225 = 0,4 ή 40%). Ας προσδιορίσουμε το οριακό του σφάλμα και τα όρια για τη μέση τιμή του χαρακτηριστικού στο γενικό πληθυσμό με τα βήματα του αλγορίθμου:

Με βάση τα αποτελέσματα της δειγματοληπτικής έρευνας, υπολογίζουμε τη μέση τιμή και τη διακύμανση στον πληθυσμό του δείγματος:

Πίνακας 11.5.

Αποτελέσματα παρατήρησης			Εκτιμώμενες τιμές
απόδοση περιουσιακών στοιχείων, τρίψιμο, x i	αριθμός επιχειρήσεων, f i	μέσο του διαστήματος, x i \xb4	x i \xb4 f i	x i \xb4 2 f i
Έως 1,4	13	1,3	16,9	21,97
1,4-1,6	15	1,5	22,5	33,75
1,6-1,8	17	1,7	28,9	49,13
1,8-2,0	15	1,9	28,5	54,15
2,0-2,2	16	2,1	33,6	70,56
2.2 και πάνω	14	2,3	32,2	74,06
Σύνολο	90	-	162,6	303,62

Δείγμα μέσου όρου

Δειγματική διακύμανση του υπό μελέτη χαρακτηριστικού

Για τα δεδομένα μας, ορίζουμε το οριακό δειγματοληπτικό σφάλμα, για παράδειγμα, με πιθανότητα 0,954. Σύμφωνα με τον πίνακα των τιμών πιθανότητας της συνάρτησης κανονικής κατανομής (βλ. απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1), βρίσκουμε την τιμή του συντελεστή εμπιστοσύνης t που αντιστοιχεί στην πιθανότητα 0,954. Με πιθανότητα 0,954, ο συντελεστής t είναι 2.

Έτσι, σε 954 περιπτώσεις από τις 1000, η μέση απόδοση των περιουσιακών στοιχείων δεν θα υπερβαίνει τα 1,88 ρούβλια. και όχι λιγότερο από 1,74 ρούβλια.

Παραπάνω, χρησιμοποιήθηκε ένα επαναλαμβανόμενο σχήμα τυχαίας επιλογής. Ας δούμε αν αλλάζουν τα αποτελέσματα της έρευνας αν υποθέσουμε ότι η επιλογή πραγματοποιήθηκε σύμφωνα με το σχήμα μη επαναλαμβανόμενης επιλογής. Σε αυτήν την περίπτωση, το μέσο σφάλμα υπολογίζεται χρησιμοποιώντας τον τύπο

Τότε, με πιθανότητα ίση με 0,954, το οριακό σφάλμα δειγματοληψίας θα είναι:

Τα όρια εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού σε περίπτωση μη επαναλαμβανόμενης τυχαίας επιλογής θα έχουν τις ακόλουθες τιμές:

Συγκρίνοντας τα αποτελέσματα των δύο σχημάτων επιλογής, μπορούμε να συμπεράνουμε ότι η χρήση της μη επαναλαμβανόμενης τυχαίας δειγματοληψίας δίνει πιο ακριβή αποτελέσματα σε σύγκριση με τη χρήση επαναλαμβανόμενης επιλογής με το ίδιο επίπεδο εμπιστοσύνης. Ταυτόχρονα, όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο πιο σημαντικά στενεύουν τα όρια των μέσων τιμών κατά τη μετάβαση από το ένα σχήμα επιλογής στο άλλο.

Σύμφωνα με το παράδειγμα, καθορίζουμε τα όρια του μεριδίου των επιχειρήσεων με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια στο γενικό πληθυσμό:

Ας υπολογίσουμε το ποσοστό δειγματοληψίας.

Ο αριθμός των επιχειρήσεων στο δείγμα με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια είναι 60 μονάδες. Τότε

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

υπολογίστε τη διακύμανση του μεριδίου στον πληθυσμό του δείγματος

το μέσο σφάλμα δειγματοληψίας κατά τη χρήση ενός σχήματος επαναλαμβανόμενης επιλογής θα είναι

Εάν υποθέσουμε ότι χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο σχήμα επιλογής, τότε το μέσο δειγματοληπτικό σφάλμα, λαμβάνοντας υπόψη τη διόρθωση για το πεπερασμένο του πληθυσμού, θα είναι

ορίζουμε την πιθανότητα εμπιστοσύνης και προσδιορίζουμε το οριακό δειγματοληπτικό σφάλμα.

Με τιμή πιθανότητας P = 0,997, σύμφωνα με τον πίνακα κανονικής κατανομής, λαμβάνουμε την τιμή για τον συντελεστή εμπιστοσύνης t = 3 (βλ. απόσπασμα από αυτόν που δίνεται στο Παράρτημα 1):

Έτσι, με πιθανότητα 0,997, μπορεί να υποστηριχθεί ότι στον γενικό πληθυσμό το μερίδιο των επιχειρήσεων με απόδοση περιουσιακών στοιχείων που δεν υπερβαίνει τα 2,0 ρούβλια δεν είναι λιγότερο από 54,7% και όχι περισσότερο από 78,7%.

Τυπικό δείγμα. Με ένα τυπικό δείγμα, ο γενικός πληθυσμός των αντικειμένων χωρίζεται σε k ομάδες, λοιπόν

N 1 + N 2 + ... + N i + ... + N k = N.

Ο όγκος των μονάδων που εξάγονται από κάθε τυπική ομάδα εξαρτάται από τη μέθοδο επιλογής που υιοθετείται. Ο συνολικός αριθμός τους αποτελεί το απαιτούμενο μέγεθος δείγματος

n 1 + n 2 + … + n i + … + n k = n.

Υπάρχουν οι ακόλουθοι δύο τρόποι οργάνωσης της επιλογής σε μια τυπική ομάδα: ανάλογος με τον όγκο των τυπικών ομάδων και ανάλογος με τον βαθμό διακύμανσης των τιμών του χαρακτηριστικού σε μονάδες παρατήρησης σε ομάδες. Εξετάστε το πρώτο από αυτά, ως το πιο συχνά χρησιμοποιούμενο.

Η επιλογή, ανάλογη με το μέγεθος των τυπικών ομάδων, προϋποθέτει ότι θα επιλεγεί ο ακόλουθος αριθμός πληθυσμιακών μονάδων σε καθεμία από αυτές:

n = n i N i /N

όπου n i είναι ο αριθμός των εξαχύσιμων μονάδων για ένα δείγμα από την i-η τυπική ομάδα.

n είναι το συνολικό μέγεθος του δείγματος.

N i - ο αριθμός των μονάδων του γενικού πληθυσμού που αποτελούσαν την i-η τυπική ομάδα.

N είναι ο συνολικός αριθμός μονάδων στο γενικό πληθυσμό.

Η επιλογή των μονάδων εντός των ομάδων γίνεται με τη μορφή τυχαίας ή μηχανικής δειγματοληψίας.

Οι τύποι για την εκτίμηση του μέσου δειγματοληπτικού σφάλματος για τον μέσο όρο και το μερίδιο παρουσιάζονται στον Πίνακα. 11.6.

Εδώ, είναι ο μέσος όρος των ομαδικών αποκλίσεων τυπικών ομάδων.

Παράδειγμα 11.3. Διεξήχθη επιλεκτική έρευνα φοιτητών σε ένα από τα πανεπιστήμια της Μόσχας προκειμένου να προσδιοριστεί ο δείκτης της μέσης παρακολούθησης της πανεπιστημιακής βιβλιοθήκης κατά έναν φοιτητή ανά εξάμηνο. Για αυτό χρησιμοποιήθηκε ένα μη επαναλαμβανόμενο τυπικό δείγμα 5%, οι τυπικές ομάδες του οποίου αντιστοιχούν στον αριθμό του μαθήματος. Κατά την επιλογή, ανάλογα με τον όγκο των τυπικών ομάδων, ελήφθησαν τα ακόλουθα δεδομένα:

Πίνακας 11.7.

Αριθμός μαθήματος	Σύνολο μαθητών, ατόμων, N i	Εξετάστηκε ως αποτέλεσμα επιλεκτικής παρατήρησης, άτομα, n i	Μέσος αριθμός επισκέψεων στη βιβλιοθήκη ανά φοιτητή ανά εξάμηνο, x i	Διακύμανση δείγματος εντός ομάδας,
1	650	33	11	6
2	610	31	8	15
3	580	29	5	18
4	360	18	6	24
5	350	17	10	12
Σύνολο	2 550	128	8	-

Ο αριθμός των μαθητών που θα εξεταστούν σε κάθε μάθημα υπολογίζεται ως εξής:

παρόμοια για άλλες ομάδες:

n 2 \u003d 31 (άτομα);

n 3 \u003d 29 (άτομα);

Η κατανομή των τιμών των μέσων δείγματος έχει πάντα έναν κανονικό νόμο κατανομής (ή τον προσεγγίζει) για n > 100, ανεξάρτητα από τη φύση της κατανομής του γενικού πληθυσμού. Ωστόσο, στην περίπτωση των μικρών δειγμάτων, ισχύει διαφορετικός νόμος διανομής - Κατανομή μαθητή. Σε αυτήν την περίπτωση, ο συντελεστής εμπιστοσύνης βρίσκεται σύμφωνα με τον πίνακα κατανομής t του Student, ανάλογα με την τιμή της πιθανότητας εμπιστοσύνης P και το μέγεθος του δείγματος n. Το Παράρτημα 1 παρέχει ένα τμήμα του πίνακα κατανομής t του Student, που παρουσιάζεται ως εξάρτηση της πιθανότητας εμπιστοσύνης στο μέγεθος του δείγματος και του συντελεστή εμπιστοσύνης t.

Παράδειγμα 11.4. Ας υποθέσουμε ότι μια δειγματοληπτική έρευνα οκτώ φοιτητών της ακαδημίας έδειξε ότι πέρασαν τον ακόλουθο αριθμό ωρών προετοιμασίας για μια δοκιμασία στα στατιστικά: 8,5; 8.0; 7.8; 9.0; 7.2; 6.2; 8.4; 6.6.

Ας υπολογίσουμε τον μέσο όρο του χρόνου που δαπανήθηκε στο δείγμα και ας δημιουργήσουμε ένα διάστημα εμπιστοσύνης για τη μέση τιμή του χαρακτηριστικού στο γενικό πληθυσμό, λαμβάνοντας την πιθανότητα εμπιστοσύνης ίση με 0,95.

Δηλαδή, με πιθανότητα 0,95, μπορεί να υποστηριχθεί ότι ο χρόνος που αφιερώνει ο μαθητής στην προετοιμασία για το τεστ κυμαίνεται από 6,9 έως 8,5 ώρες.

11.2.2. Προσδιορισμός του μεγέθους του δείγματος

Πριν από την άμεση δειγματοληψία, πάντα αποφασίζεται το ερώτημα πόσες μονάδες του υπό μελέτη πληθυσμού πρέπει να επιλεγούν για την έρευνα. Οι τύποι για τον προσδιορισμό του μεγέθους του δείγματος προέρχονται από τους τύπους για τα οριακά δειγματοληπτικά σφάλματα σύμφωνα με τις ακόλουθες παραδοχές (Πίνακας 11.7):

τον τύπο του προβλεπόμενου δείγματος·
μέθοδος επιλογής (επαναλαμβανόμενη ή μη)·
επιλογή της εκτιμώμενης παραμέτρου (μέση τιμή ενός στοιχείου ή μιας μετοχής).

Επιπλέον, είναι απαραίτητο να προσδιοριστεί εκ των προτέρων η τιμή του επιπέδου εμπιστοσύνης που ταιριάζει στον καταναλωτή πληροφοριών και το μέγεθος του επιτρεπόμενου οριακού σφάλματος δειγματοληψίας.

Σημείωση: όταν χρησιμοποιείτε τους τύπους που δίνονται στον πίνακα, συνιστάται το μέγεθος του δείγματος που προκύπτει να στρογγυλοποιείται προς τα πάνω για να παρέχεται κάποιο περιθώριο ακρίβειας.

Παράδειγμα 11.5. Ας υπολογίσουμε πόσες από τις 507 βιομηχανικές επιχειρήσεις θα πρέπει να ελεγχθούν από την εφορία για να διαπιστωθεί το ποσοστό των επιχειρήσεων με φορολογικές παραβάσεις με πιθανότητα 0,997. Σύμφωνα με την προηγούμενη παρόμοια έρευνα, η τιμή της τυπικής απόκλισης ήταν 0,15. το μέγεθος του δειγματοληπτικού σφάλματος αναμένεται να μην είναι μεγαλύτερο από 0,05.

Όταν χρησιμοποιείτε επαναλαμβανόμενη τυχαία επιλογή, ελέγξτε

Σε μη επαναλαμβανόμενη τυχαία επιλογή, θα πρέπει να γίνει έλεγχος

Όπως μπορούμε να δούμε, η χρήση της μη επαναλαμβανόμενης δειγματοληψίας μας επιτρέπει να ερευνήσουμε πολύ μικρότερο αριθμό αντικειμένων.

Παράδειγμα 11.6. Προβλέπεται η διεξαγωγή έρευνας των μισθών στις επιχειρήσεις του κλάδου με τη μέθοδο της τυχαίας μη επαναλαμβανόμενης επιλογής. Ποιο θα πρέπει να είναι το μέγεθος του δείγματος εάν κατά τη στιγμή της έρευνας ο αριθμός των απασχολουμένων στον κλάδο ήταν 100.000 άτομα; Το οριακό σφάλμα δειγματοληψίας δεν πρέπει να υπερβαίνει τα 100 ρούβλια. με πιθανότητα 0,954. Με βάση τα αποτελέσματα προηγούμενων ερευνών για τους μισθούς στον κλάδο, είναι γνωστό ότι η τυπική απόκλιση είναι 500 ρούβλια.

Επομένως, για να λυθεί το πρόβλημα, είναι απαραίτητο να συμπεριληφθούν τουλάχιστον 100 άτομα στο δείγμα.

Μέσο δειγματοληπτικό σφάλμα

Το σύνολο δειγματοληψίας μπορεί να διαμορφωθεί με βάση ένα ποσοτικό πρόσημο στατιστικών τιμών, καθώς και σε εναλλακτική ή αποδοτική βάση. Στην πρώτη περίπτωση, το γενικευτικό χαρακτηριστικό του δείγματος είναι δείγμα μέσου όρουυποδηλωμένη ποσότητα , και στο δεύτερο - δείγμα μεριδίουποσότητες, σημειώνονται w.Στο γενικό πληθυσμό, αντίστοιχα: γενικός μέσος όροςκαι γενικό μερίδιο του ποταμού.

Διαφορές -- και W-rπου ονομάζεται δειγματοληπτικό σφάλμα,που χωρίζεται σε σφάλμα εγγραφής και σε σφάλμα αντιπροσωπευτικότητας. Το πρώτο μέρος του δειγματοληπτικού σφάλματος προκύπτει λόγω λανθασμένων ή ανακριβών πληροφοριών λόγω παρανόησης της ουσίας του θέματος, απροσεξίας του καταχωρητή κατά τη συμπλήρωση ερωτηματολογίων, εντύπων κ.λπ. Είναι αρκετά εύκολο να εντοπιστεί και να διορθωθεί. Το δεύτερο μέρος του σφάλματος προκύπτει από τη συνεχή ή αυθόρμητη μη συμμόρφωση με την αρχή της τυχαίας επιλογής. Είναι δύσκολο να εντοπιστεί και να εξαλειφθεί, είναι πολύ μεγαλύτερο από το πρώτο και ως εκ τούτου δίνεται η κύρια προσοχή σε αυτό.

Η τιμή του σφάλματος δειγματοληψίας εξαρτάται από τη δομή του τελευταίου. Για παράδειγμα, εάν, κατά τον προσδιορισμό του μέσου όρου βαθμολογίας των φοιτητών ΔΕΠ, περισσότεροι άριστοι φοιτητές περιλαμβάνονται σε ένα δείγμα και περισσότεροι χαμένοι σε ένα άλλο, τότε οι μέσες βαθμολογίες του δείγματος και τα δειγματοληπτικά σφάλματα θα είναι διαφορετικά.

Επομένως, στις στατιστικές, το μέσο σφάλμα επαναλαμβανόμενης και μη επαναλαμβανόμενης δειγματοληψίας προσδιορίζεται με τη μορφή της ειδικής τυπικής απόκλισης σύμφωνα με τους τύπους

= - αλλεπάλληλος; (1,35)

= - μη επαναλαμβανόμενο? (1,36)

όπου Dv είναι η διακύμανση του δείγματος, που προσδιορίζεται με ένα ποσοτικό πρόσημο στατιστικών τιμών σύμφωνα με τους συνήθεις τύπους από το Κεφάλαιο 2.

Με ένα εναλλακτικό ή αποδοτικό πρόσημο, η διακύμανση του δείγματος προσδιορίζεται από τον τύπο

Dv \u003d w (1-w). (1.37)

Μπορεί να φανεί από τους τύπους (1.35) και (1.36) ότι το μέσο σφάλμα είναι μικρότερο για ένα μη επαναλαμβανόμενο δείγμα, γεγονός που καθορίζει την ευρύτερη εφαρμογή του.

Οριακό σφάλμα δειγματοληψίας

Λαμβάνοντας υπόψη ότι με βάση μια δειγματοληπτική έρευνα είναι αδύνατο να εκτιμηθεί με ακρίβεια η υπό μελέτη παράμετρος (για παράδειγμα, η μέση τιμή) του γενικού πληθυσμού, είναι απαραίτητο να βρεθούν τα όρια στα οποία βρίσκεται. Σε ένα συγκεκριμένο δείγμα, η διαφορά μπορεί να είναι μεγαλύτερη από, μικρότερη ή ίση με. Κάθε μία από τις αποκλίσεις από έχει μια ορισμένη πιθανότητα. Σε μια δειγματοληπτική έρευνα, η πραγματική αξία στον γενικό πληθυσμό είναι άγνωστη. Γνωρίζοντας το μέσο δειγματοληπτικό σφάλμα, με μια ορισμένη πιθανότητα είναι δυνατό να εκτιμηθεί η απόκλιση του μέσου όρου του δείγματος από τη γενική και να καθοριστούν τα όρια εντός των οποίων βρίσκεται η υπό μελέτη παράμετρος (στην περίπτωση αυτή, η μέση τιμή) στον γενικό πληθυσμό . Η απόκλιση του χαρακτηριστικού του δείγματος από το γενικό ονομάζεται οριακό δειγματοληπτικό σφάλμα.Ορίζεται ως ένα κλάσμα του μέσου λάθους με δεδομένη πιθανότητα, δηλ.

= t, (1.38)

που t - παράγοντας εμπιστοσύνης, ανάλογα με την πιθανότητα με την οποία προσδιορίζεται το οριακό δειγματοληπτικό σφάλμα.

Η πιθανότητα εμφάνισης ενός συγκεκριμένου δειγματοληπτικού σφάλματος βρίσκεται χρησιμοποιώντας θεωρήματα της θεωρίας πιθανοτήτων. Σύμφωνα με το θεώρημα του P. L. Chebyshev, με αρκετά μεγάλο μέγεθος δείγματος και περιορισμένη διακύμανση πληθυσμού, η πιθανότητα η διαφορά μεταξύ του μέσου όρου του δείγματος και του γενικού μέσου όρου να είναι αυθαίρετα μικρή είναι κοντά στο ένα:

Ο A. M. Lyapunov το απέδειξε αυτό ανεξάρτητα από τη φύση της κατανομής του γενικού πληθυσμού, με αύξηση του μεγέθους του δείγματος, η κατανομή πιθανότητας εμφάνισης μιας ή άλλης τιμής του μέσου όρου του δείγματος προσεγγίζει την κανονική κατανομή. Αυτό είναι το λεγόμενο θεώρημα κεντρικού ορίου. Επομένως, η πιθανότητα απόκλισης του μέσου όρου του δείγματος από τον γενικό μέσο όρο, δηλ. η πιθανότητα εμφάνισης ενός δεδομένου περιοριστικού σφάλματος υπακούει επίσης στον καθορισμένο νόμο και μπορεί να βρεθεί ως συνάρτηση του tχρησιμοποιώντας το ολοκλήρωμα πιθανότητας Laplace:

όπου είναι η κανονικοποιημένη απόκλιση του μέσου όρου του δείγματος από τον γενικό μέσο όρο.

Οι τιμές του ολοκληρώματος Laplace για διαφορετικά tυπολογίζεται και διατίθεται σε ειδικούς πίνακες, ένας συνδυασμός των οποίων χρησιμοποιείται ευρέως στις στατιστικές:

Πιθανότητα

Δεδομένου ενός συγκεκριμένου επιπέδου πιθανότητας, επιλέξτε την τιμή της κανονικοποιημένης απόκλισης tκαι προσδιορίστε το οριακό σφάλμα δειγματοληψίας με τον τύπο (1.38)

Σε αυτή την περίπτωση, = 0,95 και t= 1,96, δηλ. θεωρήστε ότι με πιθανότητα 95% το οριακό δειγματοληπτικό σφάλμα είναι διπλάσιο του μέσου όρου. Επομένως, στα στατιστικά, η αξία tμερικές φορές αναφέρεται ο συντελεστής πολλαπλότητας του οριακού σφάλματος σε σχέση με τον μέσο όρο.

Μετά τον υπολογισμό του οριακού σφάλματος, βρίσκεται το διάστημα εμπιστοσύνης του γενικευτικού χαρακτηριστικού του γενικού πληθυσμού. Ένα τέτοιο διάστημα για τον γενικό μέσο όρο έχει τη μορφή

(-) (+), (1.39)

και ομοίως για τη γενική μετοχή

(w-)p(w+). (1.40)

Κατά συνέπεια, κατά την επιλεκτική παρατήρηση, δεν προσδιορίζεται μία ακριβής τιμή του γενικευτικού χαρακτηριστικού του γενικού πληθυσμού, αλλά μόνο το διάστημα εμπιστοσύνης του με ένα δεδομένο επίπεδο πιθανότητας. Και αυτό είναι ένα σοβαρό μειονέκτημα της μεθόδου δειγματοληψίας των στατιστικών.

Προσδιορισμός του μεγέθους του δείγματος

Κατά την ανάπτυξη ενός προγράμματος επιλεκτικής παρατήρησης, μερικές φορές τους δίνεται μια συγκεκριμένη τιμή του οριακού σφάλματος με ένα επίπεδο πιθανότητας. Το ελάχιστο μέγεθος δείγματος που παρέχει τη δεδομένη ακρίβεια παραμένει άγνωστο. Μπορεί να ληφθεί από τους τύπους για τα μέσα και τα οριακά σφάλματα, ανάλογα με τον τύπο του δείγματος. Έτσι, αντικαθιστώντας τους τύπους πρώτα (1.35) και μετά (1.36) στον τύπο (1.38) και λύνοντάς τον σε σχέση με το μέγεθος του δείγματος, λαμβάνουμε τους ακόλουθους τύπους

για επαναδειγματοληψία

για μη επαναδειγματοληψία

Επιπλέον, για στατιστικές τιμές με ποσοτικά χαρακτηριστικά, πρέπει να γνωρίζουμε και τη διακύμανση του δείγματος, αλλά ούτε από την αρχή των υπολογισμών είναι γνωστή. Επομένως, λαμβάνεται περίπου με έναν από τους ακόλουθους τρόπους:

λαμβάνονται από προηγούμενες παρατηρήσεις δείγματος·

σύμφωνα με τον κανόνα ότι το εύρος διακύμανσης ταιριάζει περίπου έξι τυπικές αποκλίσεις (R/ = 6 ή R/ = 6; από εδώ D = R 2 /36);

Σύμφωνα με τον κανόνα "τρία σίγμα", σύμφωνα με τον οποίο περίπου τρεις τυπικές αποκλίσεις ταιριάζουν στη μέση τιμή (/ \u003d 3, επομένως \u003d / 3 ή D = 2 /9).

Κατά τη μελέτη μη αριθμητικών χαρακτηριστικών, ακόμη και αν δεν υπάρχουν κατά προσέγγιση πληροφορίες για το κλάσμα δείγματος, γίνεται αποδεκτό w= 0,5, το οποίο, σύμφωνα με τον τύπο (1,37), αντιστοιχεί στη διακύμανση του δείγματος στην ποσότητα Dv = 0,5(1-0,5) = 0,25.