Βιογραφίες Χαρακτηριστικά Ανάλυση

Δειγμα δεδομένων. Στατιστική δειγματοληψία

τύποι δειγμάτων:

Στην πραγματικότητα-τυχαία?

Μηχανικός;

τυπικός;

Κατα συρροη;

Σε συνδυασμό.

Αυτοτυχαία δειγματοληψίαείναι να επιλέξετε μονάδες από πληθυσμόςτυχαία ή τυχαία χωρίς κανένα στοιχείο συνέπειας. Ωστόσο, πριν κάνετε τη σωστή τυχαία επιλογή, είναι απαραίτητο να βεβαιωθείτε ότι όλες οι μονάδες του γενικού πληθυσμού χωρίς εξαίρεση έχουν απολύτως ίσες πιθανότητες να μπουν στο δείγμα, δεν υπάρχουν κενά στις λίστες ή τη λίστα, αγνοώντας μεμονωμένες μονάδες κ.λπ. Θα πρέπει επίσης να τεθούν σαφή όρια για τον πληθυσμό, ώστε να μην τίθεται υπό αμφισβήτηση η συμπερίληψη ή ο αποκλεισμός μεμονωμένων μονάδων. Έτσι, για παράδειγμα, κατά την εξέταση των μαθητών, είναι απαραίτητο να υποδεικνύεται εάν τα άτομα που βρίσκονται μέσα ακαδημαϊκή άδεια, Φοιτητές μη κρατικά πανεπιστήμια, στρατιωτικές σχολές κ.λπ. κατά την έρευνα εμπορικών εγκαταστάσεων, είναι σημαντικό να καθοριστεί εάν ο γενικός πληθυσμός θα περιλαμβάνει εμπορικά περίπτερα, εμπορικές σκηνές και άλλα παρόμοια αντικείμενα. Η αυτοτυχαία επιλογή μπορεί να είναι επαναλαμβανόμενη και μη. Για μη επαναλαμβανόμενη επιλογήκατά τη διάρκεια της κλήρωσης, οι κλήροι δεν επιστρέφονται στο αρχικό σετ και δεν συμμετέχουν στην περαιτέρω επιλογή. Όταν χρησιμοποιείτε πίνακες τυχαίους αριθμούςΗ μη επαναλαμβανόμενη επιλογή επιτυγχάνεται με παράβλεψη αριθμών εάν επαναληφθούν στην επιλεγμένη στήλη ή στήλες.

Μηχανική δειγματοληψίαχρησιμοποιείται σε περιπτώσεις όπου ο γενικός πληθυσμός είναι κατά κάποιο τρόπο διατεταγμένος, δηλ. υπάρχει μια ορισμένη σειρά στη διάταξη των μονάδων (αριθμοί μισθοδοσίας υπαλλήλων, εκλογικοί κατάλογοι, τηλεφωνικοί αριθμοίερωτηθέντες, αριθμός κατοικιών και διαμερισμάτων, κ.λπ.).

Ο γενικός πληθυσμός κατά τη μηχανική επιλογή μπορεί να ταξινομηθεί ή να ταξινομηθεί σύμφωνα με την τιμή του χαρακτηριστικού που μελετάται ή να συσχετιστεί με αυτό, γεγονός που θα αυξήσει την αντιπροσωπευτικότητα του δείγματος. Ωστόσο, σε αυτήν την περίπτωση, αυξάνεται ο κίνδυνος συστηματικού σφάλματος, που σχετίζεται με υποτίμηση των τιμών του υπό μελέτη χαρακτηριστικού (αν η πρώτη τιμή καταγράφεται από κάθε διάστημα) ή με την υπερεκτίμησή του (εάν τελευταία τιμή). Επομένως, καλό είναι να ξεκινήσετε την επιλογή από τη μέση του πρώτου διαστήματος

τυπική επιλογή.Αυτή η μέθοδος επιλογής χρησιμοποιείται σε περιπτώσεις όπου όλες οι μονάδες του γενικού πληθυσμού μπορούν να χωριστούν σε πολλές τυπικές ομάδες. Σε μια έρευνα πληθυσμού, τέτοιες ομάδες μπορεί να είναι, για παράδειγμα, περιφέρειες, κοινωνικές, ηλικιακές ή εκπαιδευτικές ομάδες, κατά την τοπογραφία επιχειρήσεων - βιομηχανίας ή υποτομέας, μορφή ιδιοκτησίας κ.λπ. Η τυπική επιλογή περιλαμβάνει την επιλογή των μονάδων από κάθε τυπική ομάδα με καθαρά τυχαίο ή μηχανικό τρόπο. Επειδή μέσα πλαίσιο δειγματοληψίαςοι εκπρόσωποι όλων των ομάδων αναγκαστικά εμπίπτουν σε μια ή την άλλη αναλογία, η τυποποίηση του γενικού πληθυσμού καθιστά δυνατό τον αποκλεισμό της επιρροής διαομαδική διακύμανσηστο μέσο σφάλμαδείγμα, το οποίο σε αυτή την περίπτωση προσδιορίζεται μόνο με ενδοομαδική παραλλαγή.

Η επιλογή των μονάδων σε ένα τυπικό δείγμα μπορεί να οργανωθεί είτε ανάλογα με τον όγκο των τυπικών ομάδων, είτε ανάλογα με την ενδοομαδική διαφοροποίηση ενός χαρακτηριστικού.

σειριακή επιλογή.Αυτή η μέθοδος επιλογής είναι βολική σε περιπτώσεις όπου οι πληθυσμιακές μονάδες ομαδοποιούνται σε μικρές ομάδες ή σειρές. Ως τέτοια σειρά, συσκευασίες με ορισμένη ποσότητα τελικών προϊόντων, παρτίδες εμπορευμάτων, μαθητικές ομάδες, ταξιαρχιών και άλλων ενώσεων. Η ουσία της σειριακής δειγματοληψίας έγκειται στην πραγματική τυχαία ή μηχανική επιλογή σειρών, εντός της οποίας πραγματοποιείται πλήρης έρευνα των μονάδων.

Συχνά συμβαίνει ότι είναι απαραίτητο να αναλυθεί ένα συγκεκριμένο κοινωνικό φαινόμενο και να ληφθούν πληροφορίες σχετικά με αυτό. Τέτοια καθήκοντα προκύπτουν συχνά στις στατιστικές και στη στατιστική έρευνα. Η επαλήθευση ενός πλήρως καθορισμένου κοινωνικού φαινομένου είναι συχνά αδύνατη. Για παράδειγμα, πώς να μάθετε τη γνώμη του πληθυσμού ή όλων των κατοίκων μιας συγκεκριμένης πόλης για οποιοδήποτε θέμα; Το να ρωτάς απολύτως όλους είναι σχεδόν αδύνατο και πολύ επίπονο. Σε τέτοιες περιπτώσεις χρειαζόμαστε δείγμα. Αυτή ακριβώς είναι η έννοια στην οποία βασίζεται σχεδόν όλη η έρευνα και η ανάλυση.

Τι είναι ένα δείγμα

Όταν αναλύετε ένα συγκεκριμένο κοινωνικό φαινόμενοπρέπει να λάβετε πληροφορίες σχετικά με αυτό. Αν κάνουμε οποιαδήποτε μελέτη, μπορούμε να δούμε ότι δεν υπόκειται σε έρευνα και ανάλυση κάθε μονάδα του συνόλου του αντικειμένου μελέτης. Μόνο ένα ορισμένο μέρος αυτής της ολότητας λαμβάνεται υπόψη. Αυτή η διαδικασία είναι δειγματοληψία: όταν εξετάζονται μόνο ορισμένες μονάδες από το σύνολο.

Φυσικά, πολλά εξαρτώνται από τον τύπο του δείγματος. Υπάρχουν όμως και βασικοί κανόνες. Η κύρια λέει ότι η επιλογή από τον πληθυσμό πρέπει να είναι απολύτως τυχαία. Οι μονάδες πληθυσμού που θα χρησιμοποιηθούν δεν πρέπει να επιλέγονται για κανένα κριτήριο. Σε γενικές γραμμές, εάν είναι απαραίτητο να συλλεχθεί ένας πληθυσμός από τον πληθυσμό μιας συγκεκριμένης πόλης και να επιλεγούν μόνο άνδρες, τότε θα υπάρξει σφάλμα στη μελέτη, επειδή η επιλογή δεν πραγματοποιήθηκε τυχαία, αλλά επιλέχθηκε σύμφωνα με το φύλο. Σχεδόν όλες οι μέθοδοι δειγματοληψίας βασίζονται σε αυτόν τον κανόνα.

Κανόνες δειγματοληψίας

Προκειμένου το επιλεγμένο σύνολο να αντικατοπτρίζει τις κύριες ιδιότητες ολόκληρου του φαινομένου, πρέπει να κατασκευαστεί σύμφωνα με συγκεκριμένους νόμους, όπου η κύρια προσοχή θα πρέπει να δοθεί στις ακόλουθες κατηγορίες:

  • δείγμα (πληθυσμός δείγματος)·
  • γενικός πληθυσμός;
  • αντιπροσωπευτικότητα;
  • Σφάλμα αντιπροσωπευτικότητας·
  • πληθυσμιακή μονάδα?
  • μεθόδους δειγματοληψίας.

Ιδιαιτερότητες επιλεκτική παρατήρησηκαι η δειγματοληψία έχει ως εξής:

  1. Όλα τα αποτελέσματα που προκύπτουν βασίζονται σε μαθηματικούς νόμους και κανόνες, δηλαδή, με τη σωστή διεξαγωγή της μελέτης και με τους σωστούς υπολογισμούς, τα αποτελέσματα δεν θα αλλοιωθούν σε υποκειμενική βάση
  2. Καθιστά δυνατή την επίτευξη ενός αποτελέσματος πολύ πιο γρήγορα και με λιγότερο χρόνο και πόρους, μελετώντας όχι ολόκληρη τη σειρά των γεγονότων, αλλά μόνο ένα μέρος τους.
  3. Μπορεί να χρησιμοποιηθεί για τη μελέτη διαφόρων αντικειμένων: από συγκεκριμένα θέματα, για παράδειγμα, ηλικία, φύλο της ομάδας που μας ενδιαφέρει, να σπουδάσουμε κοινή γνώμηή το επίπεδο υλικής υποστήριξης του πληθυσμού.

Επιλεκτική παρατήρηση

Επιλεκτική είναι στατιστική παρατήρηση, στο οποίο δεν υπόκειται σε έρευνα ολόκληρο το σύνολο του υπό μελέτη, αλλά μόνο ένα μέρος του, επιλεγμένο με συγκεκριμένο τρόπο, και τα αποτελέσματα της μελέτης αυτού του μέρους ισχύουν για ολόκληρο το σύνολο. Αυτό το τμήμα ονομάζεται πλαίσιο δειγματοληψίας. το ο μόνος τρόποςμελετώντας μια μεγάλη σειρά από το αντικείμενο μελέτης.

Αλλά η επιλεκτική παρατήρηση μπορεί να χρησιμοποιηθεί μόνο σε περιπτώσεις όπου είναι απαραίτητο να διερευνηθεί μόνο μικρή ομάδαμονάδες. Για παράδειγμα, κατά τη μελέτη της αναλογίας ανδρών προς γυναίκες στον κόσμο, θα χρησιμοποιηθεί επιλεκτική παρατήρηση. Για ευνόητους λόγους, είναι αδύνατο να ληφθεί υπόψη κάθε κάτοικος του πλανήτη μας.

Αλλά με την ίδια μελέτη, αλλά όχι όλοι οι κάτοικοι της γης, αλλά μια ορισμένη τάξη 2 "Α" στην συγκεκριμένο σχολείο, μια συγκεκριμένη πόλη, μια συγκεκριμένη χώρα, μπορεί να κάνει χωρίς τυχαία παρατήρηση. Εξάλλου, είναι πολύ πιθανό να αναλυθεί ολόκληρη η σειρά του αντικειμένου μελέτης. Είναι απαραίτητο να μετρήσουμε τα αγόρια και τα κορίτσια αυτής της τάξης - αυτή θα είναι η αναλογία.

Δείγμα και πληθυσμός

Στην πραγματικότητα δεν είναι τόσο δύσκολο όσο ακούγεται. Σε κάθε αντικείμενο μελέτης υπάρχουν δύο συστήματα: ο γενικός πληθυσμός και ο πληθυσμός του δείγματος. Τι είναι αυτό? Όλες οι μονάδες ανήκουν στον στρατηγό. Και στο δείγμα - εκείνες οι μονάδες του συνολικού πληθυσμού που ελήφθησαν για το δείγμα. Εάν όλα γίνονται σωστά, τότε το επιλεγμένο τμήμα θα είναι μια μειωμένη διάταξη ολόκληρου του (γενικού) πληθυσμού.

Αν μιλάμε για τον γενικό πληθυσμό, τότε μπορούμε να διακρίνουμε μόνο δύο από τις ποικιλίες του: οριστικό και αόριστο γενικό πληθυσμό. Εξαρτάται από το εάν ο συνολικός αριθμός των μονάδων ενός δεδομένου συστήματος είναι γνωστός ή όχι. Εάν πρόκειται για συγκεκριμένο πληθυσμό, τότε η δειγματοληψία θα είναι ευκολότερη λόγω του γεγονότος ότι είναι γνωστό σε ποιο ποσοστό σύνολοθα γίνει δειγματοληψία μονάδων.

Αυτή η στιγμή είναι πολύ απαραίτητη στην έρευνα. Για παράδειγμα, εάν είναι απαραίτητο να διερευνηθεί το ποσοστό των προϊόντων ζαχαροπλαστικής χαμηλής ποιότητας σε μια συγκεκριμένη μονάδα. Ας υποθέσουμε ότι ο πληθυσμός έχει ήδη καθοριστεί. Είναι γνωστό ότι αυτή η επιχείρηση παράγει 1000 προϊόντα ζαχαροπλαστικής ετησίως. Αν κάνουμε ένα δείγμα 100 τυχαίων προϊόντων ζαχαροπλαστικής από αυτά τα χίλια και τα στείλουμε για εξέταση, τότε το σφάλμα θα είναι ελάχιστο. Σε γενικές γραμμές, το 10% όλων των προϊόντων υποβλήθηκαν σε έρευνα και με βάση τα αποτελέσματα, λαμβάνοντας υπόψη το σφάλμα αντιπροσωπευτικότητας, μπορούμε να μιλήσουμε για κακή ποιότητα όλων των προϊόντων.

Και αν πάρετε ένα δείγμα 100 προϊόντων ζαχαροπλαστικής από έναν ακαθόριστο γενικό πληθυσμό, όπου στην πραγματικότητα υπήρχαν, ας πούμε, 1 εκατομμύριο μονάδες, τότε το αποτέλεσμα του δείγματος και της ίδιας της μελέτης θα είναι κρίσιμα απίθανο και ανακριβές. Νιώθεις τη διαφορά; Επομένως, η βεβαιότητα του γενικού πληθυσμού στις περισσότερες περιπτώσεις είναι εξαιρετικά σημαντική και επηρεάζει σε μεγάλο βαθμό το αποτέλεσμα της μελέτης.

Αντιπροσωπευτικότητα πληθυσμού

Λοιπόν, τώρα μια από τις πιο σημαντικές ερωτήσεις - ποιο θα πρέπει να είναι το δείγμα; Αυτό είναι το πιο κύριο σημείοέρευνα. Σε αυτό το στάδιο, είναι απαραίτητο να υπολογίσετε το δείγμα και να επιλέξετε μονάδες από συνολικός αριθμόςμέσα της. Ο πληθυσμός επιλέχθηκε σωστά εάν ορισμένα χαρακτηριστικά και χαρακτηριστικά του γενικού πληθυσμού παραμένουν στο δείγμα. Αυτό ονομάζεται αντιπροσωπευτικότητα.

Με άλλα λόγια, εάν, μετά την επιλογή, ένα μέρος διατηρεί τις ίδιες τάσεις και χαρακτηριστικά με ολόκληρη την ποσότητα του εξεταζόμενου, τότε ένας τέτοιος πληθυσμός ονομάζεται αντιπροσωπευτικός. Αλλά δεν μπορεί να επιλεγεί κάθε συγκεκριμένο δείγμα από έναν αντιπροσωπευτικό πληθυσμό. Υπάρχουν και τέτοια αντικείμενα έρευνας, το δείγμα των οποίων απλά δεν μπορεί να είναι αντιπροσωπευτικό. Από εδώ προέρχεται η έννοια του λάθους αντιπροσωπευτικότητας. Αλλά ας μιλήσουμε για αυτό λίγο περισσότερο.

Πώς να φτιάξετε ένα δείγμα

Έτσι, για να μεγιστοποιηθεί η αντιπροσωπευτικότητα, υπάρχουν τρεις βασικοί κανόνες δειγματοληψίας:


Λάθος (σφάλμα) αντιπροσωπευτικότητας

Κύριο χαρακτηριστικόΗ ποιότητα του επιλεγμένου δείγματος είναι η έννοια του «σφάλματος αντιπροσωπευτικότητας». Τι είναι αυτό? Πρόκειται για ορισμένες αποκλίσεις μεταξύ των δεικτών επιλεκτικής και συνεχούς παρατήρησης. Σύμφωνα με τους δείκτες σφάλματος, η αντιπροσωπευτικότητα χωρίζεται σε αξιόπιστη, συνηθισμένη και κατά προσέγγιση. Με άλλα λόγια, αποκλίσεις έως 3%, από 3 έως 10% και από 10 έως 20%, αντίστοιχα, είναι αποδεκτές. Αν και στις στατιστικές είναι επιθυμητό το σφάλμα να μην υπερβαίνει το 5-6%. Διαφορετικά, υπάρχει λόγος να μιλάμε για ανεπαρκή αντιπροσωπευτικότητα του δείγματος. Για τον υπολογισμό του σφάλματος αντιπροσωπευτικότητας και του τρόπου με τον οποίο αυτό επηρεάζει ένα δείγμα ή έναν πληθυσμό, λαμβάνονται υπόψη πολλοί παράγοντες:

  1. Η πιθανότητα με την οποία να πάρει ακριβές αποτέλεσμα.
  2. Αριθμός μονάδων δειγματοληψίας. Όπως αναφέρθηκε προηγουμένως, όσο μικρότερος είναι ο αριθμός των μονάδων στο δείγμα, τόσο μεγαλύτερο θα είναι το σφάλμα αντιπροσωπευτικότητας και αντίστροφα.
  3. Ομοιογένεια του πληθυσμού της μελέτης. Όσο πιο ετερογενής είναι ο πληθυσμός, τόσο μεγαλύτερο θα είναι το σφάλμα αντιπροσωπευτικότητας. Η ικανότητα ενός πληθυσμού να είναι αντιπροσωπευτικός εξαρτάται από την ομοιογένεια όλων των συστατικών του μονάδων.
  4. Μια μέθοδος επιλογής μονάδων σε έναν πληθυσμό δείγματος.

Σε μπετόν ανατεθειμένες μελέτεςτο ποσοστό σφάλματος του μέσου όρου συνήθως ορίζεται από τον ερευνητή με βάση το πρόγραμμα παρατήρησης και σύμφωνα με τα δεδομένα προηγούμενων μελετών. Κατά κανόνα, το μέγιστο δειγματοληπτικό σφάλμα (σφάλμα αντιπροσωπευτικότητας) εντός 3-5% θεωρείται αποδεκτό.

Το περισσότερο δεν είναι πάντα καλύτερο

Αξίζει επίσης να θυμόμαστε ότι το κύριο πράγμα στην οργάνωση της επιλεκτικής παρατήρησης είναι να φέρετε τον όγκο της σε ένα αποδεκτό ελάχιστο. Ταυτόχρονα, δεν πρέπει να επιδιώκεται η υπερβολική μείωση των ορίων δειγματοληπτικού σφάλματος, καθώς αυτό μπορεί να οδηγήσει σε αδικαιολόγητη αύξηση του όγκου των δεδομένων του δείγματος και, κατά συνέπεια, σε αύξηση του κόστους δειγματοληψίας.

Ταυτόχρονα, το μέγεθος του σφάλματος αντιπροσωπευτικότητας δεν πρέπει να αυξάνεται υπερβολικά. Άλλωστε, σε αυτή την περίπτωση, αν και θα υπάρξει μείωση του μεγέθους του δείγματος, αυτό θα οδηγήσει σε επιδείνωση της αξιοπιστίας των αποτελεσμάτων που προέκυψαν.

Ποιες ερωτήσεις τίθενται συνήθως από τον ερευνητή;

Οποιαδήποτε έρευνα, εάν πραγματοποιηθεί, είναι για κάποιο σκοπό και για την απόκτηση ορισμένων αποτελεσμάτων. Κατά τη διεξαγωγή δείγμα μελέτηςσυνήθως ορίζονται αρχικές ερωτήσεις:


Μέθοδοι επιλογής ερευνητικών μονάδων στο δείγμα

Δεν είναι κάθε δείγμα αντιπροσωπευτικό. Μερικές φορές ένα και το αυτό ζώδιο εκφράζεται διαφορετικά στο σύνολο και στο μέρος του. Για να επιτευχθούν οι απαιτήσεις αντιπροσωπευτικότητας, είναι σκόπιμο να χρησιμοποιηθούν διάφορες μέθοδοι δειγματοληψίας. Επιπλέον, η χρήση της μιας ή της άλλης μεθόδου εξαρτάται από τις συγκεκριμένες συνθήκες. Μερικές από αυτές τις μεθόδους δειγματοληψίας περιλαμβάνουν:

  • τυχαία επιλογή?
  • μηχανική επιλογή?
  • τυπική επιλογή?
  • σειριακή (ένθετη) επιλογή.

Η τυχαία επιλογή είναι ένα σύστημα δραστηριοτήτων που στοχεύουν στην τυχαία επιλογή μονάδων πληθυσμού, όταν η πιθανότητα να συμπεριληφθεί στο δείγμα είναι ίση για όλες τις μονάδες του γενικού πληθυσμού. Αυτή η τεχνική συνιστάται να εφαρμόζεται μόνο στην περίπτωση της ομοιογένειας και ενός μικρού αριθμού εγγενών χαρακτηριστικών της. Διαφορετικά, κάποιοι γνωρίσματα του χαρακτήρακινδυνεύει να μην συμπεριληφθεί στο δείγμα. Τα χαρακτηριστικά της τυχαίας επιλογής αποτελούν τη βάση όλων των άλλων μεθόδων δειγματοληψίας.

Με τη μηχανική επιλογή των μονάδων πραγματοποιείται σε ένα ορισμένο διάστημα. Εάν είναι απαραίτητο να σχηματιστεί δείγμα συγκεκριμένων εγκλημάτων, είναι δυνατή η αφαίρεση κάθε 5ης, 10ης ή 15ης κάρτας από όλα τα στατιστικά αρχεία καταγεγραμμένων εγκλημάτων, ανάλογα με τον συνολικό αριθμό τους και τα διαθέσιμα μεγέθη δείγματος. Το μειονέκτημα αυτής της μεθόδου είναι ότι πριν από την επιλογή είναι απαραίτητο να υπάρχει πλήρης απολογισμός των μονάδων του πληθυσμού, στη συνέχεια είναι απαραίτητο να πραγματοποιηθεί μια κατάταξη και μόνο μετά από αυτό είναι δυνατή η δειγματοληψία σε ένα ορισμένο διάστημα. Αυτή η μέθοδος απαιτεί πολύ χρόνο, επομένως δεν χρησιμοποιείται συχνά.

Τυπική (περιφερειακή) επιλογή - ένας τύπος δείγματος στο οποίο χωρίζεται ο γενικός πληθυσμός ομοιογενείς ομάδεςσε ορισμένη βάση. Μερικές φορές οι ερευνητές χρησιμοποιούν άλλους όρους αντί για "ομάδες": "περιοχές" και "ζώνες". Στη συνέχεια, ένας ορισμένος αριθμός μονάδων επιλέγεται τυχαία από κάθε ομάδα σε αναλογία με ειδικό βάροςομάδες του γενικού πληθυσμού. Μια τυπική επιλογή πραγματοποιείται συχνά σε διάφορα στάδια.

Η σειριακή δειγματοληψία είναι μια μέθοδος κατά την οποία η επιλογή των μονάδων πραγματοποιείται σε ομάδες (σειρές) και όλες οι μονάδες της επιλεγμένης ομάδας (σειράς) υπόκεινται σε εξέταση. Το πλεονέκτημα αυτής της μεθόδου είναι ότι μερικές φορές είναι πιο δύσκολο να επιλέξετε μεμονωμένες μονάδες παρά σειρές, για παράδειγμα, όταν μελετάτε ένα άτομο που εκτίει ποινή. Μέσα στις επιλεγμένες περιοχές, ζώνες, εφαρμόζεται η μελέτη όλων των μονάδων ανεξαιρέτως, για παράδειγμα, η μελέτη όλων των ατόμων που εκτίουν ποινές σε ένα συγκεκριμένο ίδρυμα.

Διαστημική εκτίμηση πιθανότητας γεγονότος. Τύποι για τον υπολογισμό του αριθμού των δειγμάτων στην περίπτωση μεθόδου τυχαίας επιλογής.

Για να προσδιορίσουμε τις πιθανότητες των γεγονότων που μας ενδιαφέρουν, χρησιμοποιούμε τη μέθοδο δειγματοληψίας: πραγματοποιούμε nανεξάρτητα πειράματα, σε καθένα από τα οποία το γεγονός Α μπορεί να συμβεί (ή να μην συμβεί) (πιθανότητα Rη εμφάνιση του γεγονότος Α σε κάθε πείραμα είναι σταθερή). Τότε η σχετική συχνότητα p* εμφανίσεων γεγονότων ΑΛΛΑσε μια σειρά από nοι δοκιμές γίνονται δεκτές ως βαθμολογική εκτίμησηγια πιθανότητα Πεμφάνιση ενός γεγονότος ΑΛΛΑσε ξεχωριστό τεστ. Σε αυτήν την περίπτωση, καλείται η τιμή p* δείγμα μεριδίου περιστατικά συμβάντων ΑΛΛΑ, και r - γενική μετοχή .

Δυνάμει συμπεράσματος από το κεντρικό οριακό θεώρημα(θεώρημα Moivre-Laplace) η σχετική συχνότητα ενός γεγονότος με μεγάλο μέγεθος δείγματος μπορεί να θεωρηθεί κανονικά κατανεμημένη με τις παραμέτρους M(p*)=p και

Επομένως, για n>30 διάστημα εμπιστοσύνηςγια τη γενική μετοχή μπορεί να κατασκευαστεί χρησιμοποιώντας τους τύπους:


όπου το u cr βρίσκεται σύμφωνα με τους πίνακες της συνάρτησης Laplace, λαμβάνοντας υπόψη τη δεδομένη πιθανότητα εμπιστοσύνης γ: 2Ф(u cr)=γ.

Με ένα μικρό μέγεθος δείγματος n≤30, το οριακό σφάλμα ε προσδιορίζεται από τον πίνακα κατανομής Student:
όπου t cr =t(k; α) και ο αριθμός βαθμών ελευθερίας k=n-1 πιθανότητα α=1-γ (εμβαδόν δύο όψεων).

Οι τύποι ισχύουν εάν η επιλογή πραγματοποιήθηκε τυχαία με επαναλαμβανόμενο τρόπο (ο γενικός πληθυσμός είναι άπειρος), διαφορετικά είναι απαραίτητο να γίνει διόρθωση για τη μη επαναλαμβανόμενη επιλογή (πίνακας).

Μέσο δειγματοληπτικό σφάλμα για τη γενική αναλογία

ΠληθυσμόςΑτελείωτεςαπόλυτος όγκος Ν
Τύπος επιλογήςΑλλεπάλληλοςμη επαναλαμβανόμενο
Μέσο δειγματοληπτικό σφάλμα

Τύποι για τον υπολογισμό του μεγέθους του δείγματος με σωστή μέθοδο τυχαίας επιλογής

Μέθοδος επιλογήςΤύποι μεγεθών δειγμάτων
για μέσηγια μερίδιο
Αλλεπάλληλος
μη επαναλαμβανόμενο
Μερίδιο μονάδων w = . Ακρίβεια ε = . Πιθανότητα γ =

Προβλήματα σχετικά με το γενικό μερίδιο

Στην ερώτηση "Η δεδομένη τιμή του p 0 καλύπτει το διάστημα εμπιστοσύνης;" - μπορεί να απαντηθεί με έλεγχο στατιστική υπόθεση H 0:p=p 0 . Υποτίθεται ότι τα πειράματα διεξάγονται σύμφωνα με το σχήμα δοκιμής Bernoulli (ανεξάρτητο, πιθανότητα Πεμφάνιση ενός γεγονότος ΑΛΛΑσυνεχής). Δείγμα όγκου nπροσδιορίστε τη σχετική συχνότητα p * εμφάνισης του γεγονότος Α: όπου Μ- αριθμός περιστατικών του συμβάντος ΑΛΛΑσε μια σειρά από nδοκιμές. Για να ελεγχθεί η υπόθεση H 0, χρησιμοποιούνται στατιστικές που, με ένα αρκετά μεγάλο μέγεθος δείγματος, έχουν το πρότυπο κανονική κατανομή(Τραπέζι 1).
Πίνακας 1 - Υποθέσεις για το γενικό μερίδιο

Υπόθεση

H0:p=p0H 0:p 1 \u003d p 2
ΥποθέσειςΣχέδιο δοκιμών BernoulliΣχέδιο δοκιμών Bernoulli
Δείγματα εκτιμήσεων
Στατιστική κ
Κατανομή στατιστικών στοιχείων κ Τυπικό κανονικό N(0,1)

Παράδειγμα #1. Χρησιμοποιώντας τυχαία επαναδειγματοληψία, η διοίκηση της εταιρείας πραγματοποίησε τυχαία έρευνα σε 900 υπαλλήλους της. Μεταξύ των ερωτηθέντων ήταν 270 γυναίκες. Σχεδιάστε ένα διάστημα εμπιστοσύνης που, με πιθανότητα 0,95, καλύπτει το πραγματικό ποσοστό των γυναικών σε ολόκληρη την ομάδα της εταιρείας.
Λύση. Ανάλογα με την προϋπόθεση, η αναλογία του δείγματος των γυναικών είναι (η σχετική συχνότητα των γυναικών μεταξύ όλων των ερωτηθέντων). Εφόσον η επιλογή επαναλαμβάνεται και το μέγεθος του δείγματος είναι μεγάλο (n=900), το οριακό σφάλμα δειγματοληψίας καθορίζεται από τον τύπο

Η τιμή του u cr βρίσκεται από τον πίνακα της συνάρτησης Laplace από τη σχέση 2Φ(u cr)=γ, δηλ. Η συνάρτηση Laplace (Παράρτημα 1) παίρνει την τιμή 0,475 στο u cr =1,96. Επομένως, το οριακό σφάλμα και το επιθυμητό διάστημα εμπιστοσύνης
(p – ε, p + ε) = (0,3 – 0,18; 0,3 + 0,18) = (0,12; 0,48)
Έτσι, με πιθανότητα 0,95, μπορούμε να εγγυηθούμε ότι το ποσοστό των γυναικών σε ολόκληρη την ομάδα της εταιρείας κυμαίνεται από 0,12 έως 0,48.

Παράδειγμα #2. Ο ιδιοκτήτης του πάρκινγκ θεωρεί την ημέρα «τυχερή» εάν ο χώρος στάθμευσης είναι γεμάτος περισσότερο από 80%. Κατά τη διάρκεια του έτους πραγματοποιήθηκαν 40 έλεγχοι στάθμευσης αυτοκινήτων, εκ των οποίων οι 24 ήταν «επιτυχείς». Με πιθανότητα 0,98, βρείτε το διάστημα εμπιστοσύνης για την εκτίμηση του πραγματικού ποσοστού των «τυχερών» ημερών κατά τη διάρκεια του έτους.
Λύση. Το κλάσμα δείγματος των «καλών» ημερών είναι
Σύμφωνα με τον πίνακα της συνάρτησης Laplace, βρίσκουμε την τιμή του u cr για ένα δεδομένο
επίπεδο αυτοπεποίθησης
Ф(2,23) = 0,49, u cr = 2,33.
Θεωρώντας ότι η επιλογή δεν είναι επαναλαμβανόμενη (δηλαδή, δύο έλεγχοι δεν πραγματοποιήθηκαν την ίδια ημέρα), βρίσκουμε το οριακό σφάλμα:
όπου n=40, Ν = 365 (ημέρες). Από εδώ
και διάστημα εμπιστοσύνης για το γενικό κλάσμα: (p – ε, p + ε) = (0,6 – 0,17; 0,6 + 0,17) = (0,43, 0,77)
Με πιθανότητα 0,98, μπορεί να αναμένεται ότι η αναλογία των «καλών» ημερών κατά τη διάρκεια του έτους κυμαίνεται από 0,43 έως 0,77.

Παράδειγμα #3. Αφού έλεγξαν 2500 είδη στην παρτίδα, διαπίστωσαν ότι 400 είδη ήταν της υψηλότερης ποιότητας, αλλά τα n-m δεν ήταν. Πόσα προϊόντα πρέπει να ελέγξετε για να προσδιορίσετε το μερίδιο του premium grade με ακρίβεια 0,01 με βεβαιότητα 95%;
Αναζητούμε λύση σύμφωνα με τον τύπο για τον προσδιορισμό του μεγέθους του δείγματος για επανεπιλογή.

Φ(t) = γ/2 = 0,95/2 = 0,475 και σύμφωνα με τον πίνακα Laplace η τιμή αυτή αντιστοιχεί σε t=1,96
Κλάσμα δείγματος w = 0,16; δειγματοληπτικό σφάλμα ε = 0,01

Παράδειγμα #4. Μια παρτίδα προϊόντων γίνεται αποδεκτή εάν η πιθανότητα το προϊόν να πληροί το πρότυπο είναι τουλάχιστον 0,97. Μεταξύ των 200 προϊόντων που επιλέχθηκαν τυχαία της παρτίδας που δοκιμάστηκε, βρέθηκαν 193 προϊόντα που πληρούν το πρότυπο. Είναι δυνατή η αποδοχή της παρτίδας στο επίπεδο σημαντικότητας α=0,02;
Λύση. Διατυπώνουμε τις κύριες και εναλλακτικές υποθέσεις.
H 0: p \u003d p 0 \u003d 0,97 - άγνωστο γενικό μερίδιο Πείναι ίσο με καθορισμένη τιμή p 0 =0,97. Σε σχέση με την συνθήκη - η πιθανότητα το τμήμα από τη δοκιμασμένη παρτίδα να είναι σύμφωνο με το πρότυπο είναι 0,97. εκείνοι. παρτίδα προϊόντων μπορεί να γίνει αποδεκτή.
Η1:σελ<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Παρατηρούμενη στατιστική τιμή κ(πίνακας) υπολογίστε για δεδομένες τιμές p 0 =0,97, n=200, m=193


Η κρίσιμη τιμή βρίσκεται από τον πίνακα της συνάρτησης Laplace από την ισότητα


Σύμφωνα με τη συνθήκη α=0,02, άρα F(Kcr)=0,48 και Kcr=2,05. Η κρίσιμη περιοχή είναι αριστερόχειρας, δηλ. είναι το διάστημα (-∞;-K kp)= (-∞;-2,05). Η παρατηρούμενη τιμή Kobs = -0,415 δεν ανήκει στην κρίσιμη περιοχή, επομένως, σε αυτό το επίπεδο σημασίας, δεν υπάρχει λόγος να απορριφθεί η κύρια υπόθεση. Μια παρτίδα προϊόντων μπορεί να γίνει δεκτή.

Παράδειγμα αριθμός 5. Δύο εργοστάσια παράγουν τον ίδιο τύπο ανταλλακτικών. Για την αξιολόγηση της ποιότητάς τους, ελήφθησαν δείγματα από τα προϊόντα αυτών των εργοστασίων και προέκυψαν τα ακόλουθα αποτελέσματα. Από τα 200 επιλεγμένα προϊόντα του πρώτου εργοστασίου, τα 20 ήταν ελαττωματικά και από τα 300 προϊόντα του δεύτερου εργοστασίου, τα 15 ήταν ελαττωματικά.
Σε επίπεδο σημαντικότητας 0,025, μάθετε εάν υπάρχει σημαντική διαφορά στην ποιότητα των ανταλλακτικών που κατασκευάζονται από αυτά τα εργοστάσια.

Σύμφωνα με τη συνθήκη α=0,025, άρα F(Kcr)=0,4875 και Kcr=2,24. Με μια εναλλακτική διπλής όψης, η περιοχή των αποδεκτών τιμών έχει τη μορφή (-2,24; 2,24). Η παρατηρούμενη τιμή Kobs =2,15 εμπίπτει σε αυτό το διάστημα, δηλ. σε αυτό το επίπεδο σημασίας, δεν υπάρχει λόγος να απορριφθεί η κύρια υπόθεση. Τα εργοστάσια παράγουν προϊόντα της ίδιας ποιότητας.


Σχέδιο

  • Εισαγωγή
  • 1. Ο ρόλος της δειγματοληψίας
  • συμπέρασμα
  • Βιβλιογραφία

Εισαγωγή

Η στατιστική είναι μια αναλυτική επιστήμη που είναι απαραίτητη για όλους τους σύγχρονους ειδικούς. Ένας σύγχρονος ειδικός δεν μπορεί να είναι εγγράμματος εάν δεν κατέχει στατιστική μεθοδολογία. Οι στατιστικές είναι το πιο σημαντικό εργαλείο επικοινωνίας μεταξύ μιας επιχείρησης και της κοινωνίας. Η στατιστική είναι ένας από τους σημαντικότερους κλάδους στο πρόγραμμα σπουδών όλων των ειδικοτήτων. Ο στατιστικός αλφαβητισμός αποτελεί αναπόσπαστο μέρος της τριτοβάθμιας εκπαίδευσης και ως προς τον αριθμό των ωρών που διατίθενται στο πρόγραμμα σπουδών, καταλαμβάνει μία από τις πρώτες θέσεις. Δουλεύοντας με αριθμούς, κάθε ειδικός πρέπει να γνωρίζει πώς ελήφθησαν ορισμένα δεδομένα, ποια είναι η φύση του υπολογισμού τους, πόσο πλήρη και αξιόπιστα είναι.

1. Ο ρόλος της δειγματοληψίας

Το σύνολο όλων των μονάδων του πληθυσμού που έχουν ένα συγκεκριμένο χαρακτηριστικό και υπόκεινται σε μελέτη ονομάζεται γενικός πληθυσμός στις στατιστικές.

Στην πράξη, για τον ένα ή τον άλλο λόγο, δεν είναι πάντα δυνατό ή μη πρακτικό να λαμβάνεται υπόψη ολόκληρος ο πληθυσμός. Στη συνέχεια περιορίζονται στη μελέτη μόνο κάποιου μέρους του, ο απώτερος στόχος του οποίου είναι να επεκτείνουν τα αποτελέσματα που προκύπτουν σε ολόκληρο τον γενικό πληθυσμό, δηλ. χρησιμοποιώντας μέθοδο δειγματοληψίας.

Για να γίνει αυτό, ένα μέρος των στοιχείων, το λεγόμενο δείγμα, επιλέγεται από τον γενικό πληθυσμό με ειδικό τρόπο και τα αποτελέσματα της επεξεργασίας των δεδομένων του δείγματος (για παράδειγμα, αριθμητικοί μέσοι όροι) γενικεύονται σε ολόκληρο τον πληθυσμό.

Η θεωρητική βάση της μεθόδου δειγματοληψίας είναι ο νόμος των μεγάλων αριθμών. Δυνάμει αυτού του νόμου, με περιορισμένη διασπορά ενός χαρακτηριστικού στο γενικό πληθυσμό και ένα αρκετά μεγάλο δείγμα με πιθανότητα κοντά στην πλήρη αξιοπιστία, ο μέσος όρος του δείγματος μπορεί να είναι αυθαίρετα κοντά στον γενικό μέσο όρο. Αυτός ο νόμος, που περιλαμβάνει μια ομάδα θεωρημάτων, έχει αποδειχθεί αυστηρά μαθηματικά. Έτσι, ο αριθμητικός μέσος όρος που υπολογίστηκε για το δείγμα μπορεί εύλογα να θεωρηθεί ως δείκτης που χαρακτηρίζει τον γενικό πληθυσμό στο σύνολό του.

2. Μέθοδοι πιθανολογικής επιλογής που εξασφαλίζουν αντιπροσωπευτικότητα

Για να μπορέσουμε να βγάλουμε συμπέρασμα για τις ιδιότητες του γενικού πληθυσμού από το δείγμα, το δείγμα πρέπει να είναι αντιπροσωπευτικό (αντιπροσωπευτικό), δηλ. πρέπει να αντιπροσωπεύει πλήρως και επαρκώς τις ιδιότητες του γενικού πληθυσμού. Η αντιπροσωπευτικότητα του δείγματος μπορεί να διασφαλιστεί μόνο εάν η επιλογή των δεδομένων είναι αντικειμενική.

Το σύνολο δειγμάτων σχηματίζεται σύμφωνα με την αρχή των διεργασιών μάζας πιθανοτήτων χωρίς καμία εξαίρεση από το αποδεκτό σχήμα επιλογής. είναι απαραίτητο να εξασφαλιστεί η σχετική ομοιογένεια του δείγματος ή η διαίρεση του σε ομοιογενείς ομάδες μονάδων. Κατά το σχηματισμό ενός πληθυσμού δείγματος, θα πρέπει να δίνεται σαφής ορισμός της μονάδας δειγματοληψίας. Είναι επιθυμητό περίπου το ίδιο μέγεθος μονάδων δειγματοληψίας και τα αποτελέσματα θα είναι πιο ακριβή, όσο μικρότερη είναι η μονάδα δειγματοληψίας.

Τρεις μέθοδοι επιλογής είναι δυνατές: τυχαία επιλογή, επιλογή μονάδων σύμφωνα με ένα συγκεκριμένο σχήμα, συνδυασμός της πρώτης και της δεύτερης μεθόδου.

Εάν η επιλογή σύμφωνα με το αποδεκτό σχήμα πραγματοποιείται από τον γενικό πληθυσμό, ο οποίος είχε προηγουμένως χωριστεί σε τύπους (στρώματα ή στρώματα), τότε ένα τέτοιο δείγμα ονομάζεται τυπικό (ή στρωματοποιημένο, ή στρωματοποιημένο ή ζωνοποιημένο). Μια άλλη διαίρεση του δείγματος ανά είδος καθορίζεται από τη μονάδα δειγματοληψίας: μια μονάδα παρατήρησης ή μια σειρά από μονάδες (μερικές φορές χρησιμοποιείται ο όρος "φωλιά"). Στην τελευταία περίπτωση, το δείγμα ονομάζεται σειριακό ή ένθετο. Στην πράξη, χρησιμοποιείται συχνά ένας συνδυασμός τυπικού δείγματος με επιλογή σειράς. Στη μαθηματική στατιστική, όταν συζητείται το πρόβλημα της επιλογής δεδομένων, είναι απαραίτητο να εισαχθεί η διαίρεση του δείγματος σε επαναλαμβανόμενα και μη. Το πρώτο αντιστοιχεί στο σχήμα μιας επιστρεφόμενης μπάλας, το δεύτερο - αμετάκλητο (όταν εξετάζετε τη διαδικασία επιλογής δεδομένων στο παράδειγμα επιλογής μπάλες διαφορετικών χρωμάτων από το δοχείο). Στις κοινωνικοοικονομικές στατιστικές, δεν έχει νόημα να χρησιμοποιείται επαναλαμβανόμενη δειγματοληψία, επομένως, κατά κανόνα, νοείται η μη επαναλαμβανόμενη δειγματοληψία.

Δεδομένου ότι τα κοινωνικοοικονομικά αντικείμενα έχουν πολύπλοκη δομή, μπορεί να είναι αρκετά δύσκολο να οργανωθεί ένα δείγμα. Για παράδειγμα, για να επιλέξετε νοικοκυριά όταν μελετάτε την κατανάλωση από τον πληθυσμό μιας μεγάλης πόλης, είναι ευκολότερο να επιλέξετε πρώτα εδαφικά κελιά, κτίρια κατοικιών, μετά διαμερίσματα ή νοικοκυριά και μετά τον ερωτώμενο. Ένα τέτοιο δείγμα ονομάζεται πολυστάδιο. Σε κάθε στάδιο, χρησιμοποιούνται διαφορετικές μονάδες δειγματοληψίας: μεγαλύτερες στα αρχικά στάδια, στο τελευταίο στάδιο, η μονάδα επιλογής συμπίπτει με τη μονάδα παρατήρησης.

Ένας άλλος τύπος παρατήρησης δειγμάτων είναι η δειγματοληψία πολλαπλών φάσεων. Ένα τέτοιο δείγμα περιλαμβάνει έναν ορισμένο αριθμό φάσεων, καθεμία από τις οποίες διαφέρει στη λεπτομέρεια του προγράμματος παρατήρησης. Για παράδειγμα, το 25% του συνόλου του γενικού πληθυσμού ερευνάται σύμφωνα με ένα σύντομο πρόγραμμα, κάθε 4η μονάδα από αυτό το δείγμα ερευνάται σύμφωνα με ένα πληρέστερο πρόγραμμα κ.λπ.

Για κάθε τύπο δείγματος, η επιλογή των μονάδων πραγματοποιείται με τρεις τρόπους. Εξετάστε μια διαδικασία τυχαίας επιλογής. Πρώτα απ 'όλα, καταρτίζεται μια λίστα με μονάδες πληθυσμού, στην οποία σε κάθε μονάδα εκχωρείται ένας ψηφιακός κωδικός (αριθμός ή ετικέτα). Στη συνέχεια γίνεται κλήρωση. Μπάλες με τους αντίστοιχους αριθμούς μπαίνουν στο τύμπανο, αναμειγνύονται και επιλέγονται οι μπάλες. Οι αριθμοί που έχουν πέσει έξω αντιστοιχούν στις μονάδες του δείγματος. ο αριθμός των αριθμών είναι ίσος με το προγραμματισμένο μέγεθος δείγματος.

Η επιλογή με κλήρωση μπορεί να υπόκειται σε προκαταλήψεις που προκαλούνται από τεχνικά ελαττώματα (ποιότητα μπάλες, τύμπανο) και άλλους λόγους. Πιο αξιόπιστη από την άποψη της αντικειμενικότητας είναι η επιλογή από έναν πίνακα τυχαίων αριθμών. Ένας τέτοιος πίνακας περιέχει μια σειρά αριθμών, που εναλλάσσονται τυχαία, που επιλέγονται από ηλεκτρονικά σήματα. Εφόσον χρησιμοποιούμε το δεκαδικό αριθμητικό σύστημα 0, 1, 2,., 9, η πιθανότητα εμφάνισης οποιουδήποτε ψηφίου είναι 1/10. Επομένως, εάν ήταν απαραίτητο να δημιουργηθεί ένας πίνακας τυχαίων αριθμών, που να περιλαμβάνει 500 χαρακτήρες, τότε περίπου 50 από αυτούς θα ήταν 0, ο ίδιος αριθμός θα ήταν 1 κ.ο.κ.

Η επιλογή σύμφωνα με κάποιο σχήμα (η λεγόμενη κατευθυνόμενη δειγματοληψία) χρησιμοποιείται συχνά. Το σύστημα επιλογής υιοθετείται με τέτοιο τρόπο ώστε να αντικατοπτρίζει τις κύριες ιδιότητες και αναλογίες του γενικού πληθυσμού. Ο απλούστερος τρόπος: σύμφωνα με τους καταλόγους των μονάδων του γενικού πληθυσμού, που συντάσσονται με τέτοιο τρόπο ώστε η ταξινόμηση των μονάδων να μην σχετίζεται με τις ιδιότητες που μελετώνται, πραγματοποιείται μηχανική επιλογή μονάδων με βήμα ίσο με N: ν. Συνήθως, η επιλογή δεν ξεκινά από την πρώτη μονάδα, αλλά υποχωρεί μισό βήμα για να μειωθεί η πιθανότητα μεροληψίας δείγματος. Η συχνότητα εμφάνισης ενοτήτων με συγκεκριμένα χαρακτηριστικά, για παράδειγμα, φοιτητές με συγκεκριμένο επίπεδο ακαδημαϊκών επιδόσεων, διαμονή σε ξενώνα κ.λπ. θα καθοριστεί από τη δομή που έχει αναπτυχθεί στον γενικό πληθυσμό.

Για να είμαστε πιο σίγουροι ότι το δείγμα θα αντικατοπτρίζει τη δομή του πληθυσμού, ο τελευταίος υποδιαιρείται σε τύπους (στρώματα ή περιοχές) και γίνεται μια τυχαία ή μηχανική επιλογή από κάθε τύπο. Ο συνολικός αριθμός των μονάδων που επιλέγονται από διαφορετικούς τύπους πρέπει να αντιστοιχεί στο μέγεθος του δείγματος.

Ιδιαίτερες δυσκολίες προκύπτουν όταν δεν υπάρχει κατάλογος μονάδων και η επιλογή πρέπει να γίνεται είτε στο έδαφος είτε από δείγματα προϊόντων στην αποθήκη τελικού προϊόντος. Σε αυτές τις περιπτώσεις, είναι σημαντικό να αναπτυχθεί λεπτομερώς το σχήμα προσανατολισμού για το έδαφος και το σχήμα επιλογής και να το ακολουθήσετε χωρίς να επιτρέπονται αποκλίσεις. Για παράδειγμα, ο μετρητής έχει εντολή να μετακινηθεί από μια συγκεκριμένη στάση λεωφορείου βόρεια στην άρτια πλευρά του δρόμου και, αφού μετρήσει δύο σπίτια από την πρώτη γωνία, να μπει στην τρίτη και να ψηφίσει κάθε 5η κατοικία. Η αυστηρή τήρηση του εγκεκριμένου σχήματος διασφαλίζει την εκπλήρωση της κύριας προϋπόθεσης για το σχηματισμό αντιπροσωπευτικού δείγματος - την αντικειμενικότητα της επιλογής των μονάδων.

Από τυχαίο δείγμαΘα πρέπει να γίνει διάκριση μεταξύ της επιλογής ποσοστώσεων, όταν το δείγμα κατασκευάζεται από μονάδες ορισμένων κατηγοριών (ποσοστώσεις), οι οποίες πρέπει να αντιπροσωπεύονται σε δεδομένες αναλογίες. Για παράδειγμα, σε μια έρευνα πελατών πολυκαταστήματος, μπορεί να προγραμματιστεί μια επιλογή 150 ερωτηθέντων, συμπεριλαμβανομένων 90 γυναικών, εκ των οποίων 25 είναι κορίτσια, 20 νέες γυναίκες με μικρά παιδιά, 35 μεσήλικες γυναίκες ντυμένες με επαγγελματικό κοστούμι, 10 είναι γυναίκες ηλικίας 50 ετών και άνω. Επιπλέον, σχεδιάστηκε έρευνα σε 70 άνδρες, εκ των οποίων οι 25 ήταν έφηβοι και νέοι άνδρες, οι 20 ήταν νέοι με παιδιά, οι 15 ήταν άνδρες ντυμένοι με κοστούμια, οι 10 ήταν άνδρες ντυμένοι με αθλητικά. Για να καθορίσουμε τους προσανατολισμούς και τις προτιμήσεις των καταναλωτών, ένα τέτοιο δείγμα μπορεί να είναι καλό, αλλά αν θέλουμε να καθορίσουμε το μέσο ποσό των αγορών, τη δομή τους, θα έχουμε μη αντιπροσωπευτικά αποτελέσματα. Αυτό συμβαίνει επειδή η δειγματοληψία ποσοστώσεων στοχεύει στην επιλογή ορισμένων κατηγοριών.

Το δείγμα μπορεί να μην είναι αντιπροσωπευτικό, ακόμα κι αν έχει διαμορφωθεί σύμφωνα με γνωστές αναλογίες του γενικού πληθυσμού, αλλά η επιλογή πραγματοποιείται χωρίς κανένα σχέδιο - οι μονάδες προσλαμβάνονται με οποιονδήποτε τρόπο, μόνο και μόνο για να διασφαλιστεί η αναλογία των κατηγοριών τους στις ίδιες αναλογίες όπως και στο γενικό πληθυσμό (για παράδειγμα, η αναλογία ανδρών και γυναικών, ερωτηθέντων ηλικίας μικρότερης και μεγαλύτερης ηλικίας από αρτιμελείς και αρτιμελείς κ.λπ.).

Αυτές οι παρατηρήσεις θα πρέπει να σας προειδοποιήσουν για τέτοιες προσεγγίσεις δειγματοληψίας και να τονίσουν εκ νέου την ανάγκη για αντικειμενική δειγματοληψία.

3. Οργανωτικά και μεθοδολογικά χαρακτηριστικά τυχαίας, μηχανικής, τυπικής και σειριακής δειγματοληψίας

Ανάλογα με τον τρόπο με τον οποίο πραγματοποιείται η επιλογή των στοιχείων του πληθυσμού στο δείγμα, υπάρχουν διάφοροι τύποι δειγματοληπτικών ερευνών. Η επιλογή μπορεί να είναι τυχαία, μηχανική, τυπική και σειριακή.

Η τυχαία επιλογή είναι μια τέτοια επιλογή στην οποία όλα τα στοιχεία του γενικού πληθυσμού έχουν ίσες ευκαιρίες να επιλεγούν. Με άλλα λόγια, κάθε στοιχείο του πληθυσμού έχει ίση πιθανότητα να συμπεριληφθεί στο δείγμα.

δειγματοληψία στατιστική πιθανοτική τυχαία

Η απαίτηση της τυχαίας επιλογής επιτυγχάνεται στην πράξη με τη βοήθεια παρτίδων ή πίνακα τυχαίων αριθμών.

Κατά την επιλογή με κλήρωση, όλα τα στοιχεία του γενικού πληθυσμού αριθμούνται προκαταρκτικά και οι αριθμοί τους τοποθετούνται στις κάρτες. Μετά από προσεκτική ανακάτεμα από το πακέτο με οποιονδήποτε τρόπο (σε σειρά ή με οποιαδήποτε άλλη σειρά), επιλέγεται ο απαιτούμενος αριθμός καρτών, που αντιστοιχεί στο μέγεθος του δείγματος. Σε αυτήν την περίπτωση, μπορείτε είτε να αφήσετε στην άκρη τις επιλεγμένες κάρτες (εκτελώντας έτσι τη λεγόμενη μη επαναλαμβανόμενη επιλογή) είτε, τραβώντας μια κάρτα, να σημειώσετε τον αριθμό της και να την επιστρέψετε στο πακέτο, δίνοντάς της έτσι την ευκαιρία να εμφανιστεί στο δείγμα ξανά (επαναλαμβανόμενη επιλογή). Κατά την εκ νέου επιλογή, κάθε φορά μετά την επιστροφή της κάρτας, το πακέτο πρέπει να ανακατεύεται προσεκτικά.

Η μέθοδος κλήρωσης χρησιμοποιείται σε περιπτώσεις όπου ο αριθμός των στοιχείων ολόκληρου του υπό μελέτη πληθυσμού είναι μικρός. Με μεγάλο όγκο του γενικού πληθυσμού, η υλοποίηση της τυχαίας επιλογής με κλήρωση γίνεται δύσκολη. Πιο αξιόπιστη και λιγότερο χρονοβόρα σε περίπτωση επεξεργασίας μεγάλου όγκου δεδομένων είναι η μέθοδος χρήσης πίνακα τυχαίων αριθμών.

Η μηχανική επιλογή πραγματοποιείται ως εξής. Εάν σχηματιστεί δείγμα 10%, π.χ. πρέπει να επιλεγεί ένα από τα δέκα στοιχεία και, στη συνέχεια, ολόκληρο το σύνολο χωρίζεται υπό όρους σε ίσα μέρη των 10 στοιχείων. Στη συνέχεια, ένα στοιχείο επιλέγεται τυχαία από την πρώτη δεκάδα. Για παράδειγμα, η κλήρωση έδειχνε τον ένατο αριθμό. Η επιλογή των υπολοίπων στοιχείων του δείγματος καθορίζεται πλήρως από την καθορισμένη αναλογία της επιλογής N από τον αριθμό του πρώτου επιλεγμένου στοιχείου. Στην υπό εξέταση περίπτωση, το δείγμα θα αποτελείται από τα στοιχεία 9, 19, 29 κ.λπ.

Η μηχανική επιλογή πρέπει να χρησιμοποιείται με προσοχή, καθώς υπάρχει πραγματικός κίνδυνος των λεγόμενων συστηματικών σφαλμάτων. Επομένως, πριν γίνει η μηχανική δειγματοληψία, είναι απαραίτητο να αναλυθεί ο πληθυσμός που μελετήθηκε. Εάν τα στοιχεία του βρίσκονται τυχαία, τότε το δείγμα που λαμβάνεται μηχανικά θα είναι τυχαίο. Ωστόσο, συχνά τα στοιχεία του αρχικού σετ είναι εν μέρει ή και πλήρως παραγγελμένα. Είναι εξαιρετικά ανεπιθύμητο για τη μηχανική επιλογή να υπάρχει μια σειρά στοιχείων που να έχει τη σωστή επαναληψιμότητα, η περίοδος της οποίας μπορεί να συμπίπτει με την περίοδο της μηχανικής δειγματοληψίας.

Συχνά, τα στοιχεία του πληθυσμού ταξινομούνται με βάση την τιμή του υπό μελέτη χαρακτηριστικού σε φθίνουσα ή αύξουσα σειρά και δεν έχουν περιοδικότητα. Η μηχανική επιλογή από έναν τέτοιο πληθυσμό αποκτά τον χαρακτήρα της κατευθυνόμενης επιλογής, αφού επιμέρους τμήματα του πληθυσμού αντιπροσωπεύονται στο δείγμα σε αναλογία με το μέγεθός τους σε ολόκληρο τον πληθυσμό, δηλ. Η επιλογή στοχεύει στο να γίνει το δείγμα αντιπροσωπευτικό.

Ένας άλλος τύπος επιλογής κατεύθυνσης είναι η τυπική επιλογή. Μια τυπική επιλογή πρέπει να διακρίνεται από την επιλογή τυπικών αντικειμένων. Η επιλογή τυπικών αντικειμένων χρησιμοποιήθηκε στα στατιστικά στοιχεία του zemstvo, καθώς και σε έρευνες προϋπολογισμού. Ταυτόχρονα, η επιλογή των «τυπικών χωριών» ή «τυπικών αγροκτημάτων» γινόταν σύμφωνα με ορισμένα οικονομικά χαρακτηριστικά, για παράδειγμα, ανάλογα με το μέγεθος της ιδιοκτησίας γης ανά νοικοκυριό, ανάλογα με το επάγγελμα των κατοίκων κ.λπ. . Η επιλογή αυτού του είδους δεν μπορεί να αποτελέσει τη βάση για την εφαρμογή της μεθόδου δειγματοληψίας, αφού εδώ δεν πληρούται η κύρια απαίτησή της - η τυχαία επιλογή.

Στην πραγματική τυπική επιλογή στη μέθοδο δειγματοληψίας, ο πληθυσμός χωρίζεται σε ομάδες που είναι ποιοτικά ομοιογενείς και στη συνέχεια γίνεται μια τυχαία επιλογή σε κάθε ομάδα. Η τυπική επιλογή είναι πιο δύσκολο να οργανωθεί από την ίδια την τυχαία επιλογή, καθώς απαιτείται συγκεκριμένη γνώση σχετικά με τη σύνθεση και τις ιδιότητες του γενικού πληθυσμού, αλλά δίνει πιο ακριβή αποτελέσματα.

Με τη σειριακή επιλογή, ολόκληρος ο πληθυσμός χωρίζεται σε ομάδες (σειρές). Στη συνέχεια, με τυχαία ή μηχανική επιλογή, απομονώνεται ένα συγκεκριμένο τμήμα αυτών των σειρών και πραγματοποιείται συνεχής επεξεργασία τους. Στην ουσία, η σειριακή επιλογή είναι μια τυχαία ή μηχανική επιλογή που πραγματοποιείται για διευρυμένα στοιχεία του αρχικού πληθυσμού.

Από θεωρητική άποψη, η σειριακή δειγματοληψία είναι η πιο ατελής από αυτές που εξετάζονται. Κατά κανόνα, δεν χρησιμοποιείται για επεξεργασία υλικού, αλλά παρουσιάζει ορισμένες ευκολίες στη διοργάνωση ερευνών, ειδικά στη μελέτη της γεωργίας. Για παράδειγμα, οι ετήσιες δειγματοληπτικές έρευνες των αγροκτημάτων των αγροτών κατά τα χρόνια που προηγήθηκαν της κολεκτιβοποίησης πραγματοποιήθηκαν με τη μέθοδο της σειριακής επιλογής. Είναι χρήσιμο να γνωρίζει ένας ιστορικός σειριακή δειγματοληψίακαθώς μπορεί να συναντηθεί με τα αποτελέσματα τέτοιων ερευνών.

Εκτός από τις κλασσικές μεθόδους επιλογής που περιγράφηκαν παραπάνω, άλλες μέθοδοι χρησιμοποιούνται επίσης στην πρακτική της δειγματοληπτικής μεθόδου. Ας εξετάσουμε δύο από αυτές.

Ο πληθυσμός που μελετήθηκε μπορεί να έχει πολυβάθμια δομή, μπορεί να αποτελείται από μονάδες του πρώτου σταδίου, οι οποίες, με τη σειρά τους, αποτελούνται από μονάδες του δεύτερου σταδίου κ.ο.κ. Για παράδειγμα, οι επαρχίες περιλαμβάνουν uyezd, οι uyezds μπορούν να θεωρηθούν ως μια συλλογή από volost, οι volost αποτελούνται από χωριά και τα χωριά αποτελούνται από νοικοκυριά.

Η επιλογή πολλαπλών σταδίων μπορεί να εφαρμοστεί σε τέτοιους πληθυσμούς, π.χ. επιλέξτε διαδοχικά σε κάθε στάδιο. Έτσι, από ένα σύνολο επαρχιών, με μια μηχανική, τυπική ή τυχαία μέθοδο, μπορεί κανείς να επιλέξει κομητείες (πρώτο στάδιο), στη συνέχεια να επιλέξει βολόστ (δεύτερο στάδιο) χρησιμοποιώντας μία από τις υποδεικνυόμενες μεθόδους, στη συνέχεια να επιλέξει χωριά (τρίτο στάδιο) και, τέλος, νοικοκυριά (τέταρτο στάδιο).

Ένα παράδειγμα μηχανικής επιλογής δύο σταδίων είναι η μακροχρόνια πρακτική επιλογή των προϋπολογισμών των εργαζομένων. Στο πρώτο στάδιο, οι επιχειρήσεις επιλέγονται μηχανικά, στο δεύτερο - οι εργαζόμενοι, των οποίων ο προϋπολογισμός εξετάζεται.

Η μεταβλητότητα των χαρακτηριστικών των αντικειμένων που μελετήθηκαν μπορεί να είναι διαφορετική. Για παράδειγμα, η παροχή αγροτικών αγροκτημάτων με το δικό τους εργατικό δυναμικό κυμαίνεται λιγότερο από, ας πούμε, το μέγεθος των καλλιεργειών τους. Επομένως, ένα μικρότερο δείγμα προσφοράς εργασίας θα είναι εξίσου αντιπροσωπευτικό με ένα μεγαλύτερο δείγμα δεδομένων μεγέθους καλλιέργειας. Σε αυτήν την περίπτωση, από το δείγμα που χρησιμοποιείται για τον προσδιορισμό του μεγέθους των καλλιεργειών, είναι δυνατό να δημιουργηθεί ένα δείγμα που να είναι αρκετά αντιπροσωπευτικό για να προσδιορίσει τη διαθεσιμότητα εργατικού δυναμικού, πραγματοποιώντας έτσι μια επιλογή δύο φάσεων. Στη γενική περίπτωση, μπορούν να προστεθούν και οι ακόλουθες φάσεις, δηλ. από το προκύπτον υποδείγμα, δημιουργήστε ένα άλλο υποδείγμα, και ούτω καθεξής. Η ίδια μέθοδος επιλογής χρησιμοποιείται σε περιπτώσεις όπου οι στόχοι της μελέτης απαιτούν διαφορετική ακρίβεια κατά τον υπολογισμό διαφορετικών δεικτών.

Εργασία 1. Περιγραφική στατιστική

Στην εξέταση, 20 μαθητές έλαβαν τους ακόλουθους βαθμούς (σε κλίμακα 100 βαθμών):

1) Δημιουργήστε μια σειρά από κατανομές συχνοτήτων, σχετικές και συσσωρευμένες συχνότητες για 5 διαστήματα.

2) Κατασκευάστε ένα πολύγωνο, ένα ιστόγραμμα και ένα αθροιστικό πολύγωνο.

3) Βρείτε τον αριθμητικό μέσο όρο, τον τρόπο, τον διάμεσο, το πρώτο και τρίτο τεταρτημόριο, το τριμηνιαίο εύρος, την τυπική απόκλιση και τους συντελεστές διακύμανσης. Αναλύστε τα δεδομένα χρησιμοποιώντας αυτά τα χαρακτηριστικά και υποδείξτε ένα διάστημα που περιλαμβάνει το 50% των κεντρικών τιμών των καθορισμένων τιμών.

1) x (min) =53, x (max) =98

R=x (max) - x (min) =98-53=45

h=R/1+3,32lgn, όπου n είναι το μέγεθος του δείγματος, n=20

h= 45/1+3,32*lg20= 9

α (i) - το κατώτερο όριο του διαστήματος, β (i) - το ανώτερο όριο του διαστήματος.

a (1) = x (min) - h/2, b (1) = a (1) + h, τότε αν b (i) είναι το ανώτερο όριο του i-ου διαστήματος (και a (i+1) =b (i)), μετά b (2) = a (2) + h, b (3) = a (3) + h, κ.λπ. Η κατασκευή των διαστημάτων συνεχίζεται μέχρι την αρχή του επόμενου διαστήματος με σειρά ίση ή μεγαλύτερη από x (max).

a(1) = 47,5 b(1) = 56,5

a(2) = 56,5 b(2) = 65,5

a(3) = 65,5 b(3) = 74,5

a(4) = 74,5 b(4) = 83,5

a(5) = 83,5 b(5) = 92,5

a(6) = 92,5 b(6) = 101,5

Διαστήματα, a (i) - b (i)

Καταμέτρηση συχνότητας

Συχνότητα, n(i)

Αθροιστική συχνότητα, n(hi)

2) Για να σχεδιάσουμε γραφήματα, γράφουμε τις σειρές μεταβλητής κατανομής (διάστημα και διακριτές) των σχετικών συχνοτήτων W (i) = n (i) / n, τις συσσωρευμένες σχετικές συχνότητες W (hi) και βρίσκουμε τον λόγο W (i) / h συμπληρώνοντας τον πίνακα.

x(i)=a(i)+b(i)/2; W(hi)=n(hi)/n

Σειρά στατιστικής κατανομής εκτιμήσεων:

Διαστήματα, a (i) - b (i)

Για να φτιάξουμε ένα ιστόγραμμα σχετικών συχνοτήτων κατά μήκος της τετμημένης, παραμερίζουμε μερικά διαστήματα, σε καθένα από τα οποία χτίζουμε ένα ορθογώνιο, το εμβαδόν του οποίου είναι ίσο με τη σχετική συχνότητα W (i) του δεδομένου i-ου διαστήματος. Τότε το ύψος του στοιχειώδους ορθογωνίου πρέπει να είναι ίσο με W (i) / h.

Ένα πολύγωνο της ίδιας κατανομής μπορεί να ληφθεί από το ιστόγραμμα εάν τα μέσα των άνω βάσεων των ορθογωνίων συνδέονται με ευθύγραμμα τμήματα.

Για να δημιουργήσουμε το άθροισμα μιας διακριτής σειράς, σχεδιάζουμε τις τιμές του χαρακτηριστικού κατά μήκος του άξονα της τετμημένης και τις σχετικές συσσωρευμένες συχνότητες W (hi) κατά μήκος του άξονα τεταγμένων. Τα σημεία που προκύπτουν συνδέονται με γραμμικά τμήματα. Για τη σειρά διαστημάτων κατά μήκος της τετμημένης, παραμερίζουμε τα ανώτερα όρια της ομαδοποίησης.

3) Η αριθμητική μέση τιμή βρίσκεται από τον τύπο:

Η λειτουργία υπολογίζεται από τον τύπο:

Το κατώτερο όριο του διαστήματος των τρόπων μεταφοράς. h - πλάτος διαστήματος ομαδοποίησης. - τροπική συχνότητα διαστήματος. - συχνότητα του διαστήματος που προηγείται του modal. - συχνότητα του διαστήματος που ακολουθεί το modal. = 23.125.

Ας βρούμε τη διάμεσο:

n=20: 53.58.59.59.63.67.68.69.71.73.78.79.85.86.87.89.91.91.98.98

Αντικαθιστώντας τις τιμές, παίρνουμε: Q1=65;

Η τιμή του δεύτερου τεταρτημορίου είναι ίδια με την τιμή της διάμεσης, άρα Q2=75,5; Q3=88.

Το τριμηνιαίο εύρος είναι:

Η μέση τετραγωνική (τυπική) απόκλιση ρίζας βρίσκεται με τον τύπο:

Ο συντελεστής διακύμανσης:

Από αυτούς τους υπολογισμούς φαίνεται ότι το 50% των κεντρικών τιμών των υποδεικνυόμενων ποσοτήτων περιλαμβάνει το διάστημα 74,5 - 83,5.

Εργασία 2. Στατιστικός έλεγχος υποθέσεων.

Οι αθλητικές προτιμήσεις για άνδρες, γυναίκες και εφήβους είναι οι εξής:

Ελέγξτε την υπόθεση της ανεξαρτησίας της προτίμησης από το φύλο και την ηλικία b = 0,05.

1) Έλεγχος της υπόθεσης για την ανεξαρτησία των προτιμήσεων στον αθλητισμό.

Συντελεστής Pearsen:

Η τιμή του πίνακα της δοκιμής chi-square με βαθμό ελευθερίας 4 στο b \u003d 0,05 είναι ίση με h 2 πίνακα \u003d 9,488.

Αφού η υπόθεση απορρίπτεται. Οι διαφορές στις προτιμήσεις είναι σημαντικές.

2. Υπόθεση συμμόρφωσης.

Το βόλεϊ ως άθλημα είναι πιο κοντά στο μπάσκετ. Ας ελέγξουμε την αντιστοιχία στις προτιμήσεις για άνδρες, γυναίκες και εφήβους.

Ф 2 = 0,1896+0,1531+0,1624+0,1786+0,1415+0,1533 = 0,979.

Σε επίπεδο σημαντικότητας b = 0,05 και βαθμό ελευθερίας k = 2, η τιμή του πίνακα h 2 tabl = 9,210.

Από Ф 2 >, οι διαφορές στις προτιμήσεις είναι σημαντικές.

Εργασία 3. Ανάλυση συσχέτισης και παλινδρόμησης.

Μια ανάλυση των τροχαίων ατυχημάτων έδωσε τα ακόλουθα στατιστικά στοιχεία σχετικά με το ποσοστό των οδηγών κάτω των 21 ετών και τον αριθμό των σοβαρών ατυχημάτων ανά 1.000 οδηγούς:

Πραγματοποιήστε μια γραφική ανάλυση και ανάλυση συσχέτισης-παλίνδρομου δεδομένων, προβλέψτε τον αριθμό των ατυχημάτων με σοβαρές συνέπειες για μια πόλη στην οποία ο αριθμός των οδηγών κάτω των 21 ετών είναι ίσος με το 20% του συνολικού αριθμού οδηγών.

Λαμβάνουμε ένα δείγμα μεγέθους n = 10.

x είναι το ποσοστό των οδηγών κάτω των 21 ετών,

y είναι ο αριθμός των ατυχημάτων ανά 1000 οδηγούς.

Η εξίσωση γραμμικής παλινδρόμησηςμοιάζει με:

Υπολογίζουμε διαδοχικά:

Ομοίως, βρίσκουμε

Συντελεστής παλινδρόμησης δείγματος

Η σύνδεση μεταξύ x, y είναι ισχυρή.

Η εξίσωση γραμμικής παλινδρόμησης έχει τη μορφή:

Στο εικόνα υποβλήθηκε πεδίο διασκόρπιση και πρόγραμμα γραμμικός οπισθοδρόμηση . Ξοδεύουμε πρόβλεψη Για Χ n =20 .

Παίρνουμε y n =0 .2 9*20-1 .4 6 = 4 .3 4 .

Προφητικός έννοια συνέβη περισσότερο όλα αξίες, υποβλήθηκε σε πρωτότυπο τραπέζι . το συνέπεια Να πάω, τι συσχέτιση εθισμός ευθεία και συντελεστής ισοδυναμεί 0,29 αρκετά μεγάλο . Στο κάθε μονάδα αυξήσεις Dx αυτός δίνει αύξηση Dy =0 .3

Ασκηση 4 . Ανάλυση προσωρινός τάξεις και πρόβλεψη .

προλέγωτιμές ευρετηρίου για την επόμενη εβδομάδα χρησιμοποιώντας:

α) τη μέθοδο του κινούμενου μέσου όρου, επιλέγοντας δεδομένα τριών εβδομάδων για τον υπολογισμό του·

β) εκθετικός σταθμισμένος μέσος όρος, επιλέγοντας ως b = 0,1.

Από τον πίνακα των τυχαίων αριθμών βρίσκουμε τους αριθμούς 41, 51, 69, 135, 124, 93, 91, 144, 10, 24.

Τα ταξινομούμε με αύξουσα σειρά: 10, 24, 41, 51, 69, 91, 93, 124, 135, 144.

Πραγματοποιούμε μια νέα αρίθμηση από το 1 έως το 10. Λαμβάνουμε τα αρχικά δεδομένα για δέκα εβδομάδες:

Η εκθετική εξομάλυνση στο b = 0,1 δίνει μόνο μία τιμή.

Για τα μέσα ολόκληρης της περιόδου, έχουμε τρεις προβλέψεις: 12.855; 1309; 12.895.

Υπάρχει συμφωνία μεταξύ αυτών των προβλέψεων.

Ασκηση 5 . δείκτης ανάλυση.

Η εταιρεία ασχολείται με τη μεταφορά εμπορευμάτων. Υπάρχουν στοιχεία επί σειρά ετών για τον όγκο μεταφοράς 4 τύπων φορτίου και το κόστος μεταφοράς μιας μονάδας φορτίου.

Προσδιορίστε απλούς δείκτες τιμής, ποσότητας και αξίας για κάθε τύπο προϊόντος, καθώς και δείκτες Laspeyres και Pasche και έναν δείκτη αξίας. Σχολιάστε τα αποτελέσματα που προέκυψαν με νόημα.

Λύση. Ας υπολογίσουμε απλούς δείκτες:

Δείκτης Laspeyres:

Ευρετήριο Πασά:

Κόστος Τουρκίας:

Οι επιμέρους δείκτες υποδεικνύουν τη διαφορά στις μεταβολές των τιμών και των ποσοτήτων για τα αγαθά Α, Β, Γ, Δ. Οι συγκεντρωτικοί δείκτες δείχνουν γενικές τάσεις μεταβολής. Γενικά, το κόστος των μεταφερόμενων εμπορευμάτων μειώθηκε κατά 13%. Ο λόγος είναι ότι το πιο ακριβό φορτίο έχει μειωθεί κατά 42% σε ποσότητα και το τιμολόγιο του δεν έχει αλλάξει πολύ.

Τα έτη 16-20 αριθμούνται με τη σειρά από το 1 έως το 5. Τα αρχικά δεδομένα έχουν τη μορφή:

Αρχικά, μελετάμε τη δυναμική της ποσότητας του φορτίου Α.

Δείκτης

Απόλυτα κέρδη

Ρυθμοί ανάπτυξης, %

Ρυθμός ανάπτυξης, %

Στο Αυτό βήμα ανάπτυξη κατά μέσο όρο επί ΜΑΘΗΜΑΤΙΚΟΙ τυποι :

, .

Για βήμα ανάπτυξη σε όποιος υπόθεση Τ και τα λοιπά R -1 .

Τώρα σκεφτείτε φορτίο ρε .

Δείκτης

Απόλυτα κέρδη

Ρυθμοί ανάπτυξης, %

Ρυθμός ανάπτυξης, %

συμπέρασμα

Οι μέσοι όροι και οι ποικιλίες τους παίζουν σημαντικό ρόλο στις στατιστικές. Οι μέσοι δείκτες χρησιμοποιούνται ευρέως στην ανάλυση, καθώς σε αυτούς εκδηλώνονται κανονικότητες. μαζικά φαινόμενακαι διεργασίες τόσο στο χρόνο όσο και στο χώρο. Έτσι, για παράδειγμα, το μοτίβο της αύξησης της παραγωγικότητας της εργασίας βρίσκει την έκφρασή του στατιστικήη αύξηση της μέσης παραγωγής ανά άτομο που εργάζεται στη βιομηχανία, η κανονικότητα της σταθερής αύξησης του επιπέδου ευημερίας του πληθυσμού εκδηλώνεται στους στατιστικούς δείκτες της αύξησης του μέσου εισοδήματος εργαζομένων και εργαζομένων κ.λπ.

Τέτοια περιγραφικά χαρακτηριστικά της κατανομής ενός μεταβλητού χαρακτηριστικού όπως ο τρόπος και η διάμεσος χρησιμοποιούνται ευρέως. Είναι συγκεκριμένα χαρακτηριστικά, η σημασία τους είναι οποιαδήποτε συγκεκριμένη επιλογή στη σειρά παραλλαγής.

Έτσι, για να χαρακτηριστεί η πιο κοινή τιμή ενός χαρακτηριστικού, χρησιμοποιείται ένας τρόπος και για να εμφανιστεί το ποσοτικό όριο της τιμής ενός μεταβλητού χαρακτηριστικού, το οποίο επιτυγχάνεται από τα μισά μέλη του πληθυσμού, η διάμεσος είναι μεταχειρισμένος.

Έτσι, οι μέσες τιμές βοηθούν στη μελέτη των προτύπων ανάπτυξης της βιομηχανίας, μιας συγκεκριμένης βιομηχανίας, της κοινωνίας και της χώρας στο σύνολό της.

Βιβλιογραφία

1. Θεωρία της στατιστικής: Σχολικό βιβλίο / R.A. Shmoylova, V.G. Minashkin, N.A. Sadovnikova, E.B. Shuvalov; Υπό τη σύνταξη του R.A. Shmoylova. - 4η έκδ., αναθεωρημένη. και επιπλέον - Μ.: Οικονομικά και στατιστική, 2005. - 656s.

2. Gusarov V.M. Στατιστική: Φροντιστήριογια τα πανεπιστήμια. - Μ.: UNITI-DANA, 2001.

4. Συλλογή εργασιών για τη θεωρία της στατιστικής: Σχολικό βιβλίο / Εκδ. καθ. V. V. Glinsky και Ph.D. PhD, Αναπλ. Λ.Κ. Serga. Εκδ. Ζ-ε. - Μ.: INFRA-M; Novosibirsk: Σιβηρική Συμφωνία, 2002.

5. Στατιστικά: Εγχειρίδιο / Kharchenko L-P., Dolzhenkova V.G., Ionin V.G. και άλλοι, εκδ. V.G. Ιονίνα. - Έκδ.2η, αναθεωρημένη. και επιπλέον - Μ.: INFRA-M. 2003.

Παρόμοια Έγγραφα

    Περιγραφική στατιστική και στατιστικά συμπεράσματα. Μέθοδοι επιλογής που διασφαλίζουν την αντιπροσωπευτικότητα του δείγματος. Επίδραση του τύπου του δείγματος στο μέγεθος του σφάλματος. Καθήκοντα στην εφαρμογή της μεθόδου δειγματοληψίας. Διανομή δεδομένων παρατήρησης στο γενικό πληθυσμό.

    δοκιμή, προστέθηκε στις 27/02/2011

    Μέθοδος δειγματοληψίας και ο ρόλος της. Ανάπτυξη σύγχρονη θεωρίαεπιλεκτική παρατήρηση. Τυπολογία μεθόδων επιλογής. Τρόποι πρακτικής εφαρμογής της απλής τυχαίας δειγματοληψίας. Οργάνωση τυπικού (στρωματοποιημένου) δείγματος. Μέγεθος δείγματος στην επιλογή ποσόστωσης.

    έκθεση, προστέθηκε 09/03/2011

    Σκοπός δειγματοληψίας και δειγματοληψίας. Χαρακτηριστικά οργάνωσης διάφορα είδηεπιλεκτική παρατήρηση. Λάθη επιλεκτική επιλογήκαι τις μεθόδους υπολογισμού τους. Εφαρμογή της μεθόδου δειγματοληψίας για την ανάλυση επιχειρήσεων του συγκροτήματος καυσίμων και ενέργειας.

    θητεία, προστέθηκε 10/06/2014

    Η επιλεκτική παρατήρηση ως μέθοδος στατιστική έρευνα, τα χαρακτηριστικά του. Τυχαία, μηχανικά, τυπικά και σειριακά είδη επιλογής στο σχηματισμό δειγματοληπτικών συνόλων. Η έννοια και τα αίτια του δειγματοληπτικού σφάλματος, μέθοδοι προσδιορισμού του.

    περίληψη, προστέθηκε 06/04/2010

    Η έννοια και ο ρόλος της στατιστικής στον μηχανισμό διαχείρισης σύγχρονη οικονομία. Συνεχής και μη συνεχής στατιστική παρατήρηση, περιγραφή της μεθόδου δειγματοληψίας. Τύποι επιλογής κατά την επιλεκτική παρατήρηση, δειγματοληπτικά σφάλματα. Παραγωγή και χρηματοοικονομικοί δείκτες.

    θητεία, προστέθηκε 17/03/2011

    Μελέτη εφαρμογής του σχεδίου. Μια έρευνα τυχαίας δειγματοληψίας 10%. Κόστος παραγωγής εργοστασίου. οριακό σφάλμαδείγματα. Δυναμική των μέσων τιμών και του όγκου πωλήσεων του προϊόντος. Δείκτης Τιμών Μεταβλητής Σύνθεσης.

    εργασίες ελέγχου, προστέθηκε 02/09/2009

    Λήψη δείγματος όγκου n-κανονική κατανομή τυχαία μεταβλητή. Εύρεση αριθμητικά χαρακτηριστικάδείγματα. ομαδοποίηση δεδομένων και σειρά παραλλαγής. Ιστόγραμμα συχνότητας. Εμπειρική συνάρτηση κατανομής. Στατιστική εκτίμηση παραμέτρων.

    εργαστηριακές εργασίες, προστέθηκε 31/03/2013

    Η ουσία των εννοιών της δειγματοληψίας και της δειγματοληπτικής παρατήρησης, οι κύριοι τύποι και κατηγορίες επιλογής. Προσδιορισμός του όγκου και του μεγέθους του δείγματος. Πρακτική χρήση Στατιστική ανάλυσηεπιλεκτική παρατήρηση. Υπολογισμός σφαλμάτων στο κλάσμα του δείγματος και στο μέσο όρο του δείγματος.

    θητεία, προστέθηκε 17/02/2015

    Η έννοια της επιλεκτικής παρατήρησης. Σφάλματα αντιπροσωπευτικότητας, μέτρηση δειγματοληπτικού σφάλματος. Προσδιορισμός του απαιτούμενου μεγέθους δείγματος. Η χρήση μεθόδου δειγματοληψίας αντί συνεχούς. Διασπορά στο γενικό πληθυσμό και σύγκριση δεικτών.

    δοκιμή, προστέθηκε στις 23/07/2009

    Τύποι σφαλμάτων επιλογής και παρατήρησης. Μέθοδοι επιλογής μονάδων σε πληθυσμό δείγματος. Χαρακτηριστικό γνώρισμα εμπορικές δραστηριότητεςεπιχειρήσεις. Δείγμα έρευναςκαταναλωτές προϊόντων. Κατανομή των χαρακτηριστικών του δείγματος στον γενικό πληθυσμό.

Μέρος των αντικειμένων από τον πληθυσμό επιλέχτηκε για μελέτη προκειμένου να εξαχθεί ένα συμπέρασμα για το σύνολο του πληθυσμού. Προκειμένου το συμπέρασμα που προκύπτει από τη μελέτη του δείγματος να επεκταθεί σε ολόκληρο τον πληθυσμό, το δείγμα πρέπει να έχει την ιδιότητα να είναι αντιπροσωπευτικό.

Αντιπροσωπευτικότητα δείγματος

Η ιδιότητα του δείγματος να αντικατοπτρίζει σωστά τον γενικό πληθυσμό. Το ίδιο δείγμα μπορεί να είναι ή να μην είναι αντιπροσωπευτικό διαφορετικών πληθυσμών.
Παράδειγμα:

Ένα δείγμα που αποτελείται εξ ολοκλήρου από Μοσχοβίτες που διαθέτουν αυτοκίνητο δεν αντιπροσωπεύει ολόκληρο τον πληθυσμό της Μόσχας.

Το δείγμα των ρωσικών επιχειρήσεων με έως και 100 υπαλλήλους δεν αντιπροσωπεύει όλες τις επιχειρήσεις στη Ρωσία.

Το δείγμα των Μοσχοβιτών που πραγματοποιούν αγορές στην αγορά δεν αντιπροσωπεύει την αγοραστική συμπεριφορά όλων των Μοσχοβιτών.

Ταυτόχρονα, αυτά τα δείγματα (υπό τους άλλους όρους) μπορούν να αντιπροσωπεύουν τέλεια Μοσχοβίτες ιδιοκτήτες αυτοκινήτων, μικρές και μεσαίες ρωσικές επιχειρήσεις και αγοραστές που πραγματοποιούν αγορές στις αγορές, αντίστοιχα.

Είναι σημαντικό να κατανοήσουμε ότι η αντιπροσωπευτικότητα του δείγματος και το δειγματοληπτικό σφάλμα είναι διαφορετικά φαινόμενα. Η αντιπροσωπευτικότητα, σε αντίθεση με το σφάλμα, δεν εξαρτάται από το μέγεθος του δείγματος.

Όσο κι αν αυξήσουμε τον αριθμό των ερωτηθέντων Μοσχοβιτών-ιδιοκτητών αυτοκινήτων, δεν θα μπορέσουμε να εκπροσωπήσουμε όλους τους Μοσχοβίτες με αυτό το δείγμα.

Σφάλμα δειγματοληψίας (διάστημα εμπιστοσύνης)

Η απόκλιση των αποτελεσμάτων που προέκυψαν με τη βοήθεια δειγματοληπτικής παρατήρησης από τα αληθινά δεδομένα του γενικού πληθυσμού.

Υπάρχουν δύο τύποι σφαλμάτων δειγματοληψίας: στατιστικό και συστηματικό. Το στατιστικό σφάλμα εξαρτάται από το μέγεθος του δείγματος. Όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο χαμηλότερο είναι.

Παράδειγμα:
Για ένα απλό τυχαίο δείγμα 400 μονάδων, το μέγιστο στατιστικό σφάλμα (από 95% επίπεδο αυτοπεποίθησης) είναι 5%, για δείγμα 600 μονάδων - 4%, για δείγμα 1100 μονάδων - 3%. Συνήθως, όταν μιλάνε για δειγματοληπτικό σφάλμα, εννοούν ακριβώς το στατιστικό σφάλμα.

Το συστηματικό σφάλμα εξαρτάται από διάφορους παράγοντεςπου έχουν μόνιμο αντίκτυπο στη μελέτη και μετατοπίζουν τα αποτελέσματα της μελέτης σε μια συγκεκριμένη κατεύθυνση.

Παράδειγμα:
- Η χρήση οποιουδήποτε δείγματος πιθανοτήτων υποτιμά το ποσοστό των ατόμων υψηλού εισοδήματος που ηγούνται ενεργή εικόναΖΩΗ. Αυτό συμβαίνει λόγω του γεγονότος ότι τέτοιοι άνθρωποι είναι πολύ πιο δύσκολο να βρεθούν σε οποιοδήποτε συγκεκριμένο μέρος (για παράδειγμα, στο σπίτι).

Το πρόβλημα των ερωτηθέντων που αρνούνται να απαντήσουν στις ερωτήσεις του ερωτηματολογίου (το μερίδιο των "refuseniks" στη Μόσχα, για διαφορετικές έρευνες, κυμαίνεται από 50% έως 80%)

Σε ορισμένες περιπτώσεις, όταν είναι γνωστές οι πραγματικές κατανομές, συστηματικό λάθοςμπορεί να ισοπεδωθεί με την εισαγωγή ποσοστώσεων ή την εκ νέου στάθμιση των δεδομένων, αλλά στις περισσότερες πραγματικές μελέτες, ακόμη και η αξιολόγησή τους μπορεί να είναι αρκετά προβληματική.

Τύποι δειγμάτων

Τα δείγματα χωρίζονται σε δύο τύπους:

πιθανολογικός

απιθανότητα

Δείγματα πιθανοτήτων

1.1 Τυχαία δειγματοληψία (απλή τυχαία επιλογή)

Ένα τέτοιο δείγμα προϋποθέτει την ομοιογένεια του γενικού πληθυσμού, την ίδια πιθανότητα διαθεσιμότητας όλων των στοιχείων, την παρουσία πλήρης λίσταόλα τα στοιχεία. Κατά την επιλογή στοιχείων, κατά κανόνα, χρησιμοποιείται ένας πίνακας τυχαίων αριθμών.
1.2 Μηχανική (συστηματική) δειγματοληψία

Ένα είδος τυχαίου δείγματος, ταξινομημένο κατά κάποιο χαρακτηριστικό (αλφαβητική σειρά, αριθμός τηλεφώνου, ημερομηνία γέννησης κ.λπ.). Το πρώτο στοιχείο επιλέγεται τυχαία και, στη συνέχεια, κάθε 'k' στοιχείο επιλέγεται σε προσαυξήσεις του 'n'. Το μέγεθος του γενικού πληθυσμού, ενώ - N=n*k

1.3 Στρωματοποιημένο (ζωνικό)

Χρησιμοποιείται σε περίπτωση ετερογένειας του γενικού πληθυσμού. Ο γενικός πληθυσμός χωρίζεται σε ομάδες (στρώματα). Σε κάθε στρώμα, η επιλογή πραγματοποιείται τυχαία ή μηχανικά.

1.4 Σειριακή (ένθετη ή ομαδοποιημένη) δειγματοληψία

Με τη σειριακή δειγματοληψία, οι μονάδες επιλογής δεν είναι τα ίδια τα αντικείμενα, αλλά οι ομάδες (συστάδες ή φωλιές). Οι ομάδες επιλέγονται τυχαία. Τα αντικείμενα εντός των ομάδων ερευνώνται παντού.

Απίστευτα δείγματα

Η επιλογή σε ένα τέτοιο δείγμα πραγματοποιείται όχι σύμφωνα με τις αρχές της τύχης, αλλά με υποκειμενικά κριτήρια - προσβασιμότητα, τυπικότητα, ίση εκπροσώπηση κ.λπ.

Δειγματοληψία ποσοστώσεων

Αρχικά, κατανέμεται ένας ορισμένος αριθμός ομάδων αντικειμένων (για παράδειγμα, άνδρες ηλικίας 20-30 ετών, 31-45 ετών και 46-60 ετών· άτομα με εισόδημα έως 30 χιλιάδες ρούβλια, με εισόδημα από 30 έως 60 χιλιάδες ρούβλια και με εισόδημα άνω των 60 χιλιάδων ρούβλια ) Για κάθε ομάδα, προσδιορίζεται ο αριθμός των αντικειμένων που πρόκειται να ερευνηθούν. Ο αριθμός των αντικειμένων που πρέπει να εμπίπτουν σε καθεμία από τις ομάδες ορίζεται, τις περισσότερες φορές, είτε σε αναλογία με το προηγουμένως γνωστό μερίδιο της ομάδας στον γενικό πληθυσμό, είτε ο ίδιος για κάθε ομάδα. Μέσα στις ομάδες, τα αντικείμενα επιλέγονται τυχαία. Τα δείγματα ποσοστώσεων χρησιμοποιούνται αρκετά συχνά στην έρευνα μάρκετινγκ.

Μέθοδος χιονοστιβάδας

Το δείγμα κατασκευάζεται ως εξής. Κάθε ερωτώμενος, ξεκινώντας από τον πρώτο, καλείται να επικοινωνήσει με τους φίλους, τους συναδέλφους, τους γνωστούς του που θα ταίριαζαν στις συνθήκες επιλογής και θα μπορούσαν να λάβουν μέρος στη μελέτη. Έτσι, με εξαίρεση το πρώτο βήμα, το δείγμα διαμορφώνεται με τη συμμετοχή των ίδιων των αντικειμένων της μελέτης. Η μέθοδος χρησιμοποιείται συχνά όταν είναι απαραίτητο να βρεθούν και να συνεντεύξεις δυσπρόσιτες ομάδες ερωτηθέντων (για παράδειγμα, ερωτηθέντες με υψηλό εισόδημα, ερωτηθέντες που ανήκουν στην ίδια επαγγελματική ομάδα, ερωτηθέντες που έχουν κάποια παρόμοια χόμπι / πάθη κ.λπ. )
2.3 Αυθόρμητη δειγματοληψία

Οι πιο προσιτοί ερωτηθέντες ερωτήθηκαν. Χαρακτηριστικά παραδείγματατυχαία δείγματα - έρευνες σε εφημερίδες / περιοδικά, ερωτηματολόγια που δίνονται στους ερωτηθέντες για αυτοσυμπλήρωση, οι περισσότερες έρευνες στο Διαδίκτυο. Το μέγεθος και η σύνθεση των αυθόρμητων δειγμάτων δεν είναι γνωστά εκ των προτέρων και καθορίζεται από μία μόνο παράμετρο - τη δραστηριότητα των ερωτηθέντων.
2.4 Δείγμα τυπικών περιπτώσεων

Επιλέγονται μονάδες του γενικού πληθυσμού που έχουν μια μέση (τυπική) τιμή του χαρακτηριστικού. Αυτό εγείρει το πρόβλημα της επιλογής ενός χαρακτηριστικού και του προσδιορισμού της τυπικής του τιμής.

Υλοποίηση του ερευνητικού σχεδίου

Αυτό το στάδιο, υπενθυμίζουμε, περιλαμβάνει τη συλλογή πληροφοριών και την ανάλυσή τους. Η διαδικασία υλοποίησης ενός σχεδίου έρευνας μάρκετινγκ απαιτεί συνήθως την περισσότερη έρευνα και είναι η πηγή του μεγαλύτερου λάθους.

Κατά τη συλλογή στατιστικών δεδομένων, προκύπτουν μια σειρά από ελλείψεις και προβλήματα:

Πρώτον, ορισμένοι ερωτηθέντες μπορεί να μην βρίσκονται στο συμφωνημένο μέρος και πρέπει να επικοινωνήσετε ξανά μαζί τους ή να αντικατασταθούν.

Δεύτερον, ορισμένοι ερωτηθέντες μπορεί να είναι μη συνεργάσιμοι ή να δίνουν μεροληπτικές, εν γνώσει τους ψευδείς απαντήσεις.

Χάρη στις σύγχρονες τεχνολογίες υπολογιστών και τηλεπικοινωνιών, οι μέθοδοι συλλογής δεδομένων αναπτύσσονται και βελτιώνονται.

Ορισμένες εταιρείες πραγματοποιούν έρευνες από ένα μόνο κέντρο. Σε αυτή την περίπτωση, οι επαγγελματίες συνεντεύξεις κάθονται στα γραφεία και καλούν τυχαίους αριθμούς τηλεφώνου. Εάν ακούσει την απάντηση των καλούντων, ο ερευνητής ζητά από το άτομο που απάντησε στο τηλέφωνο να απαντήσει σε μερικές ερωτήσεις. Τα τελευταία διαβάζονται από την οθόνη του υπολογιστή και οι απαντήσεις των ερωτηθέντων πληκτρολογούνται στο πληκτρολόγιο. Αυτή η μέθοδος εξαλείφει την ανάγκη για μορφοποίηση και κωδικοποίηση δεδομένων, μειώνει τον αριθμό των σφαλμάτων.