Βιογραφίες Προδιαγραφές Ανάλυση

Δείγμα από τον γενικό πληθυσμό. Γενικοί και δειγματοληπτικοί πληθυσμοί

Ένα σύνολο ομοιογενών αντικειμένων εξετάζεται συχνά σε σχέση με κάποιο χαρακτηριστικό που τα χαρακτηρίζει, μετρούμενο ποσοτικά ή ποιοτικά.

Για παράδειγμα, εάν υπάρχει μια παρτίδα εξαρτημάτων, τότε το μέγεθος του εξαρτήματος σύμφωνα με το GOST μπορεί να είναι ένα ποσοτικό σημάδι και η τυποποίηση του εξαρτήματος μπορεί να είναι ένα σημάδι ποιότητας.

Εάν είναι απαραίτητο, ελέγχονται για τη συμμόρφωση με τα πρότυπα, μερικές φορές καταφεύγουν σε μια πλήρη έρευνα, αλλά στην πράξη αυτό χρησιμοποιείται σπάνια. Για παράδειγμα, εάν ο γενικός πληθυσμός περιέχει έναν τεράστιο αριθμό υπό μελέτη αντικειμένων, τότε είναι πρακτικά αδύνατο να διεξαχθεί μια συνεχής έρευνα. Στην περίπτωση αυτή επιλέγεται ένας συγκεκριμένος αριθμός αντικειμένων (στοιχείων) από ολόκληρο τον πληθυσμό και εξετάζονται. Έτσι, υπάρχει ένας γενικός και δειγματοληπτικός πληθυσμός.

Το γενικό όνομα είναι το σύνολο όλων των αντικειμένων που υπόκεινται σε εξέταση ή μελέτη. Ο γενικός πληθυσμός, κατά κανόνα, περιέχει έναν πεπερασμένο αριθμό στοιχείων, αλλά αν είναι πολύ μεγάλος, τότε για να απλοποιηθούν οι μαθηματικοί υπολογισμοί, θεωρείται ότι ολόκληρος ο πληθυσμός αποτελείται από έναν αμέτρητο αριθμό αντικειμένων.

Ένα δείγμα ή πληθυσμός δείγματος είναι ένα μέρος των επιλεγμένων στοιχείων από ολόκληρο τον πληθυσμό. Η δειγματοληψία μπορεί να επαναληφθεί ή να μην επαναληφθεί. Στην πρώτη περίπτωση επιστρέφεται στον γενικό πληθυσμό, στη δεύτερη όχι. Στην πράξη, χρησιμοποιείται συχνότερα η μη επαναλαμβανόμενη τυχαία επιλογή.

Ο πληθυσμός και το δείγμα πρέπει να σχετίζονται μεταξύ τους με αντιπροσωπευτικότητα. Με άλλα λόγια, για να μπορέσουν τα χαρακτηριστικά του πληθυσμού του δείγματος να προσδιορίσουν με σιγουριά τα χαρακτηριστικά ολόκληρου του πληθυσμού, είναι απαραίτητο τα στοιχεία του δείγματος να τα αντιπροσωπεύουν όσο το δυνατόν ακριβέστερα. Με άλλα λόγια, το δείγμα πρέπει να είναι αντιπροσωπευτικό (αντιπροσωπευτικό).

Ένα δείγμα θα είναι περισσότερο ή λιγότερο αντιπροσωπευτικό εάν προέρχεται τυχαία από έναν πολύ μεγάλο αριθμό ολόκληρου του πληθυσμού. Αυτό μπορεί να υποστηριχθεί με βάση τον λεγόμενο νόμο των μεγάλων αριθμών. Στην περίπτωση αυτή, όλα τα στοιχεία έχουν ίση πιθανότητα να συμπεριληφθούν στο δείγμα.

Υπάρχουν διάφορες επιλογές επιλογής. Όλες αυτές οι μέθοδοι, καταρχήν, μπορούν να χωριστούν σε δύο επιλογές:

  • Επιλογή 1. Τα στοιχεία επιλέγονται όταν ο πληθυσμός δεν χωρίζεται σε μέρη. Αυτή η παραλλαγή περιλαμβάνει απλές τυχαίες επαναλαμβανόμενες και μη επαναλαμβανόμενες επιλογές.
  • Επιλογή 2. Ο γενικός πληθυσμός χωρίζεται σε μέρη και γίνεται η επιλογή των στοιχείων. Αυτές περιλαμβάνουν τυπικές, μηχανικές και σειριακές επιλογές.

Απλή τυχαία - επιλογή στην οποία τα στοιχεία εξάγονται ένα κάθε φορά από ολόκληρο τον πληθυσμό τυχαία.

Τυπική είναι μια επιλογή στην οποία τα στοιχεία επιλέγονται όχι από ολόκληρο τον πληθυσμό, αλλά από όλα τα «τυπικά» μέρη του.

Μηχανική - αυτή είναι μια τέτοια επιλογή, όταν ολόκληρος ο πληθυσμός χωρίζεται σε έναν αριθμό ομάδων ίσο με τον αριθμό των στοιχείων που πρέπει να υπάρχουν στο δείγμα και, κατά συνέπεια, επιλέγεται ένα στοιχείο από κάθε ομάδα. Για παράδειγμα, εάν είναι απαραίτητο να επιλέξετε το 25% των εξαρτημάτων που κατασκευάζονται από το μηχάνημα, τότε επιλέγεται κάθε τέταρτο εξάρτημα, και εάν απαιτείται το 4% των εξαρτημάτων, τότε επιλέγεται κάθε εικοστό πέμπτο μέρος κ.ο.κ. Ταυτόχρονα, πρέπει να ειπωθεί ότι μερικές φορές η μηχανική επιλογή μπορεί να μην παρέχει επαρκή

Σειριακή - αυτή είναι μια τέτοια επιλογή στην οποία επιλέγονται στοιχεία από ολόκληρο τον πληθυσμό σε "σειρές" που υποβάλλονται σε συνεχή έρευνα, και όχι ένα κάθε φορά. Για παράδειγμα, όταν τα ανταλλακτικά κατασκευάζονται από μεγάλο αριθμό αυτόματων μηχανών, τότε πραγματοποιείται πλήρης έρευνα μόνο σε σχέση με τα προϊόντα πολλών μηχανών. Η σειριακή επιλογή χρησιμοποιείται εάν το υπό μελέτη χαρακτηριστικό έχει μικρή μεταβλητότητα σε διαφορετικές σειρές.

Προκειμένου να μειωθεί το σφάλμα, χρησιμοποιούνται εκτιμήσεις του γενικού πληθυσμού με τη βοήθεια δείγματος. Επιπλέον, ο επιλεκτικός έλεγχος μπορεί να είναι τόσο μονοβάθμιος όσο και πολλαπλός, γεγονός που αυξάνει την αξιοπιστία της έρευνας.

Στη μαθηματική στατιστική, διακρίνονται δύο θεμελιώδεις έννοιες: ο γενικός πληθυσμός και το δείγμα.
Μια συλλογή είναι ένα πρακτικά μετρήσιμο σύνολο ορισμένων αντικειμένων ή στοιχείων που ενδιαφέρουν τον ερευνητή.
Μια ιδιότητα ενός αδρανούς είναι μια πραγματική ή φανταστική ιδιότητα εγγενής σε ορισμένα από όλα τα στοιχεία του. Η ιδιότητα μπορεί να είναι τυχαία ή μη.
Μια παράμετρος πληθυσμού είναι μια ιδιότητα που μπορεί να ποσοτικοποιηθεί ως σταθερά ή μεταβλητή.
Μια απλή συλλογή χαρακτηρίζεται από:
μια ξεχωριστή ιδιοκτησία (για παράδειγμα: όλοι οι φοιτητές της Ρωσίας).
μια ξεχωριστή παράμετρος με τη μορφή σταθεράς ή μεταβλητής (Όλες οι φοιτήτριες).
ένα σύστημα μη επικαλυπτόμενων (μη συμβατών) ιδιοκτησιών, για παράδειγμα: Όλοι οι δάσκαλοι και οι μαθητές των σχολείων στο Βλαδιβοστόκ.
Ένα σύνθετο σύνολο χαρακτηρίζεται από:
ένα σύστημα τουλάχιστον εν μέρει διασταυρούμενων ιδιοτήτων (Φοιτητές των ψυχολογικών και μαθηματικών σχολών του κρατικού πανεπιστημίου της Άπω Ανατολής που αποφοίτησαν από το σχολείο με χρυσό μετάλλιο).
ένα σύστημα ανεξάρτητων και εξαρτημένων παραμέτρων στο σύνολο· σε μια ολοκληρωμένη μελέτη της προσωπικότητας.
Ένα σύνολο ονομάζεται ομοιογενές ή ομοιογενές, όλα τα χαρακτηριστικά του οποίου είναι εγγενή σε καθένα από τα στοιχεία του.
Ετερογενές ή ετερογενές σύνολο είναι ένα σύνολο του οποίου τα χαρακτηριστικά συγκεντρώνονται σε ξεχωριστά υποσύνολα στοιχείων.
Μια σημαντική παράμετρος είναι ο όγκος του πληθυσμού - ο αριθμός των στοιχείων που τον σχηματίζουν. Το μέγεθος του τόμου εξαρτάται από το πώς ορίζεται ο ίδιος ο πληθυσμός και ποιες ερωτήσεις μας ενδιαφέρουν συγκεκριμένα. Ας υποθέσουμε ότι μας ενδιαφέρει η συναισθηματική κατάσταση ενός μαθητή του 1ου έτους κατά την περίοδο που δίνει μια συγκεκριμένη εξέταση σε μια συνεδρία. Τότε ο πληθυσμός εξαντλείται μέσα σε μισή ώρα. Αν μας ενδιαφέρει η συναισθηματική κατάσταση όλων των φοιτητών του 1ου έτους, τότε το σύνολο θα είναι πολύ μεγαλύτερο, και ακόμη περισσότερο αν πάρουμε τη συναισθηματική κατάσταση όλων των φοιτητών του πρώτου έτους ενός δεδομένου πανεπιστημίου κ.λπ. Είναι σαφές ότι τα μεγέθη μεγάλων όγκων μπορούν να ερευνηθούν μόνο επιλεκτικά.
Ένα δείγμα είναι ένα ορισμένο μέρος του γενικού πληθυσμού, κάτι που μελετάται άμεσα.
Τα δείγματα ταξινομούνται σύμφωνα με την αντιπροσωπευτικότητα, το μέγεθος, τη μέθοδο δειγματοληψίας και το σχέδιο δοκιμής.
Αντιπροσωπευτικό - δείγμα που αντικατοπτρίζει επαρκώς τον γενικό πληθυσμό σε ποιοτικούς και ποσοτικούς όρους. Το δείγμα πρέπει να αντικατοπτρίζει επαρκώς τον γενικό πληθυσμό, διαφορετικά τα αποτελέσματα δεν θα συμπίπτουν με τους στόχους της μελέτης.
Η αντιπροσωπευτικότητα εξαρτάται από τον όγκο, όσο μεγαλύτερος είναι ο όγκος, τόσο πιο αντιπροσωπευτικό είναι το δείγμα. Με μέθοδο επιλογής.
Τυχαία - εάν τα στοιχεία έχουν επιλεγεί τυχαία. Δεδομένου ότι οι περισσότερες μέθοδοι μαθηματικών στατιστικών βασίζονται στην έννοια του τυχαίου δείγματος, είναι φυσικό το δείγμα να είναι τυχαίο.
Μη τυχαίο δείγμα:
μηχανική επιλογή, όταν ολόκληρος ο πληθυσμός χωρίζεται σε τόσα μέρη όσα έχουν προγραμματιστεί μονάδες στο δείγμα, και στη συνέχεια επιλέγεται ένα στοιχείο από κάθε μέρος.
τυπική επιλογή - ο πληθυσμός χωρίζεται σε ομοιογενή μέρη και λαμβάνεται ένα τυχαίο δείγμα από το καθένα.
σειριακή επιλογή - ο πληθυσμός χωρίζεται σε μεγάλο αριθμό σειρών διαφορετικού μεγέθους και, στη συνέχεια, γίνεται ένα δείγμα μιας από οποιαδήποτε σειρά.
συνδυασμένη επιλογή - οι εξεταζόμενοι τύποι επιλογής συνδυάζονται σε διαφορετικά στάδια.
Σύμφωνα με το σχήμα δοκιμής, τα δείγματα μπορεί να είναι ανεξάρτητα και εξαρτημένα. Το μέγεθος του δείγματος χωρίζεται σε μικρό και μεγάλο. Τα μικρά δείγματα περιλαμβάνουν δείγματα στα οποία ο αριθμός των στοιχείων n 200 και το μέσο δείγμα ικανοποιεί τη συνθήκη 30. Μικρά δείγματα χρησιμοποιούνται για τον στατιστικό έλεγχο γνωστών ιδιοτήτων ήδη μελετημένων πληθυσμών.
Μεγάλα δείγματα χρησιμοποιούνται για τον καθορισμό άγνωστων ιδιοτήτων και παραμέτρων πληθυσμού.

Περισσότερα για το θέμα 1.3. Γενικός πληθυσμός και δείγμα:

  1. 7.2 Χαρακτηριστικά δείγματος και πληθυσμού
  2. 1.6. Εκτιμήσεις σημειακών και διαστημάτων των συντελεστών συσχέτισης ενός κανονικά κατανεμημένου γενικού πληθυσμού

Πληθυσμός - το σύνολο εκείνων των ανθρώπων για τους οποίους ο κοινωνιολόγος επιδιώκει να λάβει πληροφορίες στην έρευνά του. Ανάλογα με το πόσο ευρύ είναι το ερευνητικό θέμα, ο πληθυσμός θα είναι εξίσου ευρύς.

Πληθυσμός δείγματος – μειωμένο μοντέλο του γενικού πληθυσμού. αυτούς στους οποίους ο κοινωνιολόγος μοιράζει ερωτηματολόγια, που ονομάζονται ερωτηθέντες, που, τέλος, αποτελούν αντικείμενο κοινωνιολογικής έρευνας.

Το ποιος ακριβώς θα αναφέρεται στον γενικό πληθυσμό καθορίζεται από τους στόχους της μελέτης και ποιος θα συμπεριληφθεί στον πληθυσμό του δείγματος αποφασίζεται με μαθηματικές μεθόδους. Εάν ένας κοινωνιολόγος σκοπεύει να δει τον πόλεμο στο Αφγανιστάν μέσα από τα μάτια των συμμετεχόντων, ο πληθυσμός θα περιλαμβάνει όλους τους Αφγανούς πολεμιστές, αλλά θα πρέπει να πάρει συνέντευξη από ένα μικρό μέρος - τον πληθυσμό του δείγματος. Προκειμένου το δείγμα να αντικατοπτρίζει με ακρίβεια τον γενικό πληθυσμό, ο κοινωνιολόγος ακολουθεί τον κανόνα ότι οποιοσδήποτε Αφγανός πολεμιστής, ανεξάρτητα από τον τόπο διαμονής, τον τόπο εργασίας, την κατάσταση της υγείας και άλλες συνθήκες, πρέπει να έχει την ίδια πιθανότητα να συμπεριληφθεί τον πληθυσμό του δείγματος.

Μόλις ο κοινωνιολόγος αποφασίσει από ποιον θέλει να πάρει συνέντευξη, έχει αποφασίσει πλαίσιο δειγματοληψίας. Στη συνέχεια αποφασίζεται το ερώτημα του τύπου του δείγματος.

Τα δείγματα χωρίζονται σε τρεις μεγάλες κατηγορίες:

ένα) στερεός(απογραφές, δημοψηφίσματα). Όλες οι μονάδες από το γενικό πληθυσμό ανακρίνονται.

σι) τυχαίος;

σε) μη τυχαία.

Οι τυχαίοι και μη τυχαίοι τύποι δειγματοληψίας, με τη σειρά τους, χωρίζονται σε διάφορους τύπους.

Τα τυχαία είναι:

1) πιθανολογικο?

2) συστηματικός;

3) ζωνοποιημένο (στρωματοποιημένο);

4) φωλιάζοντας.

Τα μη τυχαία είναι:

1) "αυθόρμητος";

2) ποσοστό;

3) η μέθοδος "κύριος πίνακας".

Έντυπα πλήρους και ακριβούς λίστας μονάδων δειγματοληψίας πλαίσιο δειγματοληψίας . Τα στοιχεία που θα επιλεγούν καλούνται μονάδες επιλογής . Οι μονάδες δειγματοληψίας μπορεί να είναι ίδιες με τις μονάδες παρατήρησης γιατί μονάδα παρατήρησης λαμβάνεται υπόψη το στοιχείο του γενικού πληθυσμού από το οποίο συλλέγονται άμεσα οι πληροφορίες. Συνήθως η μονάδα παρατήρησης είναι το άτομο. Η επιλογή από μια λίστα γίνεται καλύτερα με την αρίθμηση μονάδων και τη χρήση πίνακα τυχαίων αριθμών, αν και χρησιμοποιείται συχνά μια σχεδόν τυχαία μέθοδος, όταν κάθε ντο στοιχείο λαμβάνεται από μια πρώτη λίστα.

Εάν το πλαίσιο δειγματοληψίας περιλαμβάνει έναν κατάλογο μονάδων δειγματοληψίας, τότε ο σχεδιασμός δειγματοληψίας συνεπάγεται την ομαδοποίησή τους σύμφωνα με ορισμένα σημαντικά χαρακτηριστικά, για παράδειγμα, την κατανομή των ατόμων ανά επάγγελμα, προσόντα, φύλο ή ηλικία. Εάν στον γενικό πληθυσμό, για παράδειγμα, το 30% των νέων, το 50% των μεσήλικων και το 20% των ηλικιωμένων, τότε θα πρέπει να τηρούνται οι ίδιες ποσοστιαίες αναλογίες των τριών ηλικιών στον πληθυσμό του δείγματος. Οι τάξεις, το φύλο, η εθνικότητα κ.λπ. μπορούν να προστεθούν στις ηλικίες. Για καθένα, καθορίζονται ποσοστιαίες αναλογίες στο γενικό πληθυσμό και στον πληθυσμό του δείγματος. Ετσι, δομή δείγματος - ποσοστιαίες αναλογίες των χαρακτηριστικών του αντικειμένου, βάσει των οποίων συντάσσεται το δείγμα.

Εάν ο τύπος δείγματος λέει πώς μπαίνουν οι άνθρωποι στο δείγμα, τότε το μέγεθος του δείγματος λέει πόσοι από αυτούς έφτασαν εκεί.

Το μέγεθος του δείγματος – τον ​​αριθμό των δειγματοληπτικών μονάδων. Δεδομένου ότι ο πληθυσμός του δείγματος είναι μέρος του γενικού πληθυσμού που επιλέγεται με ειδικές μεθόδους, ο όγκος του είναι πάντα μικρότερος από τον όγκο του γενικού πληθυσμού. Επομένως, είναι τόσο σημαντικό το μέρος να μην παραμορφώνει την ιδέα του συνόλου, δηλαδή να την αντιπροσωπεύει.

Η αξιοπιστία των δεδομένων επηρεάζεται όχι από τα ποσοτικά χαρακτηριστικά του πληθυσμού του δείγματος (ο όγκος του), αλλά από τα ποιοτικά χαρακτηριστικά του γενικού πληθυσμού - τον βαθμό της ομοιογένειάς του. Η ασυμφωνία μεταξύ του γενικού και του πληθυσμού δείγματος ονομάζεται σφάλμα αντιπροσωπευτικότητας , ανοχή - 5%.

Ακολουθούν μερικοί τρόποι για να αποφύγετε το σφάλμα:

    κάθε μονάδα του πληθυσμού πρέπει να έχει ίση πιθανότητα να συμπεριληφθεί στο δείγμα.

    είναι επιθυμητό να επιλέξετε από ομοιογενείς πληθυσμούς.

    πρέπει να γνωρίζετε τα χαρακτηριστικά του γενικού πληθυσμού.

    Κατά τη σύνταξη ενός πληθυσμού δείγματος, πρέπει να λαμβάνονται υπόψη τυχαία και συστηματικά σφάλματα.

Εάν το σύνολο δειγματοληψίας (δείγμα) συνταχθεί σωστά, τότε ο κοινωνιολόγος λαμβάνει αξιόπιστα αποτελέσματα που χαρακτηρίζουν ολόκληρο τον πληθυσμό.

Ποια είναι τα κύρια μεθόδους δειγματοληψίας?

Μέθοδος μηχανικής δειγματοληψίαςόταν ο απαιτούμενος αριθμός ερωτηθέντων επιλέγεται από τη γενική λίστα του γενικού πληθυσμού σε τακτά χρονικά διαστήματα (για παράδειγμα, κάθε 10η).

Μέθοδος σειριακής δειγματοληψίας. Σε αυτή την περίπτωση, ο γενικός πληθυσμός χωρίζεται σε ομοιογενή μέρη και οι μονάδες ανάλυσης επιλέγονται αναλογικά από το καθένα (για παράδειγμα, 20% ανδρών και γυναικών στην επιχείρηση).

Ένθετη μέθοδος δειγματοληψίας. Οι μονάδες επιλογής δεν είναι μεμονωμένοι ερωτηθέντες, αλλά ομάδες με μετέπειτα συνεχή έρευνα σε αυτές. Αυτό το δείγμα θα είναι αντιπροσωπευτικό εάν η σύνθεση των ομάδων είναι παρόμοια (για παράδειγμα, μια ομάδα φοιτητών από κάθε ρεύμα κάποιας σχολής του πανεπιστημίου).

Μέθοδος κύριας διάταξης– έρευνα στο 60–70% του γενικού πληθυσμού.

Μέθοδος δειγματοληψίας ποσοστώσεων. Η πιο σύνθετη μέθοδος, που απαιτεί τον προσδιορισμό τουλάχιστον τεσσάρων χαρακτηριστικών, σύμφωνα με τα οποία πραγματοποιείται η επιλογή των ερωτηθέντων. Συνήθως χρησιμοποιείται σε μεγάλο γενικό πληθυσμό.

Πληθυσμός (Στα Αγγλικά - πληθυσμός) - το σύνολο όλων των αντικειμένων (μονάδων), σχετικά με τα οποία ο επιστήμονας σκοπεύει να βγάλει συμπεράσματα όταν μελετά ένα συγκεκριμένο πρόβλημα.

Ο γενικός πληθυσμός αποτελείται από όλα τα αντικείμενα που υπόκεινται σε μελέτη. Η σύνθεση του γενικού πληθυσμού εξαρτάται από τους στόχους της μελέτης. Μερικές φορές ο γενικός πληθυσμός είναι ολόκληρος ο πληθυσμός μιας συγκεκριμένης περιοχής (για παράδειγμα, όταν μελετάται η αναλογία των πιθανών ψηφοφόρων προς έναν υποψήφιο), τις περισσότερες φορές τίθενται διάφορα κριτήρια που καθορίζουν το αντικείμενο μελέτης. Για παράδειγμα, άνδρες ηλικίας 30-50 ετών που χρησιμοποιούν μια συγκεκριμένη μάρκα ξυραφιού τουλάχιστον μία φορά την εβδομάδα και έχουν εισόδημα τουλάχιστον 100 $ ανά μέλος της οικογένειας.

Δείγμαή πλαίσιο δειγματοληψίας- ένα σύνολο περιπτώσεων (θέματα, αντικείμενα, γεγονότα, δείγματα), χρησιμοποιώντας μια συγκεκριμένη διαδικασία, επιλεγμένα από τον γενικό πληθυσμό για συμμετοχή στη μελέτη.

Χαρακτηριστικά δείγματος:

· Ποιοτικά χαρακτηριστικά του δείγματος - ποιον ακριβώς επιλέγουμε και ποιες μεθόδους κατασκευής δείγματος χρησιμοποιούμε για αυτό.

· Το ποσοτικό χαρακτηριστικό του δείγματος είναι πόσες περιπτώσεις επιλέγουμε, με άλλα λόγια, το μέγεθος του δείγματος.

Ανάγκη δειγματοληψίας

· Το αντικείμενο μελέτης είναι πολύ ευρύ. Για παράδειγμα, οι καταναλωτές των προϊόντων μιας παγκόσμιας εταιρείας είναι ένας τεράστιος αριθμός γεωγραφικά διασκορπισμένων αγορών.

· Υπάρχει ανάγκη συλλογής πρωτογενών πληροφοριών.

Το μέγεθος του δείγματος

Το μέγεθος του δείγματος- τον αριθμό των περιπτώσεων που περιλαμβάνονται στο δείγμα. Για στατιστικούς λόγους, συνιστάται ο αριθμός των κρουσμάτων να είναι τουλάχιστον 30-35.

Εξαρτημένα και ανεξάρτητα δείγματα

Κατά τη σύγκριση δύο (ή περισσότερων) δειγμάτων, η εξάρτησή τους είναι μια σημαντική παράμετρος. Εάν είναι δυνατόν να καθοριστεί ένα ομομορφικό ζεύγος (δηλαδή, όταν μια περίπτωση από το δείγμα Χ αντιστοιχεί σε μία και μόνο μια περίπτωση από το δείγμα Υ και αντίστροφα) για κάθε περίπτωση σε δύο δείγματα (και αυτή η βάση σχέσης είναι σημαντική για το χαρακτηριστικό μετρούνται στα δείγματα), τέτοια δείγματα ονομάζονται εξαρτώμενος. Παραδείγματα εξαρτημένων επιλογών:

· ζευγάρι διδύμων

· δύο μετρήσεις οποιουδήποτε χαρακτηριστικού πριν και μετά την πειραματική έκθεση,

· σύζυγοι

· και τα λοιπά.

Εάν δεν υπάρχει τέτοια σχέση μεταξύ των δειγμάτων, τότε αυτά τα δείγματα λαμβάνονται υπόψη ανεξάρτητος, π.χ:

· άντρες και γυναίκες,

· ψυχολόγους και μαθηματικούς.

Αντίστοιχα, τα εξαρτημένα δείγματα έχουν πάντα το ίδιο μέγεθος, ενώ το μέγεθος των ανεξάρτητων δειγμάτων μπορεί να διαφέρει.

Τα δείγματα συγκρίνονται χρησιμοποιώντας διάφορα στατιστικά κριτήρια:

· Student's t-test

· Τεστ Wilcoxon

· Τεστ Mann-Whitney U

· Κριτήριο σημείων

· και τα λοιπά.

Αντιπροσωπευτικότητα

Το δείγμα μπορεί να θεωρηθεί αντιπροσωπευτικό ή μη αντιπροσωπευτικό.

Παράδειγμα μη αντιπροσωπευτικού δείγματος

Στις Ηνωμένες Πολιτείες, ένα από τα πιο διάσημα ιστορικά παραδείγματα μη αντιπροσωπευτικής δειγματοληψίας θεωρείται ένα περιστατικό που συνέβη κατά τις προεδρικές εκλογές του 1936. Το Litrery Digest, το οποίο είχε προβλέψει επιτυχώς τα γεγονότα πολλών προηγούμενων εκλογών, δεν εκτίμησε σωστά τις προβλέψεις του στέλνοντας δέκα εκατομμύρια δοκιμαστικά ψηφοδέλτια στους συνδρομητές του, καθώς και σε άτομα που επιλέχθηκαν από τους τηλεφωνικούς καταλόγους ολόκληρης της χώρας και άτομα από λίστες κυκλοφορίας αυτοκινήτων. Στο 25% των επιστρεφόμενων ψηφοδελτίων (σχεδόν 2,5 εκατομμύρια), οι ψήφοι κατανεμήθηκαν ως εξής:

· Το 57% προτίμησε τον Ρεπουμπλικανό υποψήφιο Αλφ Λάντον

· Το 40% επέλεξε τον τότε Δημοκρατικό Πρόεδρο Φράνκλιν Ρούσβελτ

Ως γνωστόν, ο Ρούσβελτ κέρδισε τις πραγματικές εκλογές με περισσότερο από το 60% των ψήφων. Το λάθος του Litreary Digest ήταν το εξής: θέλοντας να αυξήσουν την αντιπροσωπευτικότητα του δείγματος - επειδή γνώριζαν ότι η πλειοψηφία των συνδρομητών τους θεωρούσε τους εαυτούς τους Ρεπουμπλικάνους - επέκτεινε το δείγμα με άτομα που επιλέχθηκαν από τηλεφωνικούς καταλόγους και λίστες εγγραφών. Ωστόσο, δεν έλαβαν υπόψη τη σύγχρονη πραγματικότητα και στην πραγματικότητα στρατολόγησαν ακόμη περισσότερους Ρεπουμπλικάνους: κατά τη διάρκεια της Μεγάλης Ύφεσης, ήταν κυρίως η μεσαία και ανώτερη τάξη (δηλαδή οι περισσότεροι Ρεπουμπλικάνοι, όχι οι Δημοκρατικοί) που μπορούσαν να αντέξουν οικονομικά να έχουν τηλέφωνα και αυτοκίνητα.

Τύποι σχεδίου για κτιριακές ομάδες από δείγματα

Υπάρχουν διάφοροι κύριοι τύποι ομαδικού σχεδίου δόμησης:

1. Μελέτη με πειραματικές ομάδες και ομάδες ελέγχου, οι οποίες τοποθετούνται σε διαφορετικές συνθήκες.

2. Μελέτη με πειραματικές ομάδες και ομάδες ελέγχου χρησιμοποιώντας στρατηγική επιλογής ζευγαριού

3. Μελέτη χρησιμοποιώντας μόνο μία ομάδα - πειραματική.

4. Μια μελέτη που χρησιμοποιεί ένα μικτό (παραγοντικό) σχέδιο - όλες οι ομάδες τοποθετούνται σε διαφορετικές συνθήκες.

Τύποι δειγμάτων

Τα δείγματα χωρίζονται σε δύο τύπους:

· πιθανολογικός

· απιθανότητα

Δείγματα πιθανοτήτων

1. Απλή δειγματοληψία πιθανοτήτων:

οΑπλή επαναδειγματοληψία. Η χρήση ενός τέτοιου δείγματος βασίζεται στην υπόθεση ότι κάθε ερωτώμενος είναι εξίσου πιθανό να συμπεριληφθεί στο δείγμα. Με βάση τη λίστα του γενικού πληθυσμού, συντάσσονται κάρτες με τους αριθμούς των ερωτηθέντων. Τοποθετούνται σε μια τράπουλα, ανακατεύονται και βγαίνουν τυχαία μια κάρτα, καταγράφεται ένας αριθμός και επιστρέφεται πίσω. Επιπλέον, η διαδικασία επαναλαμβάνεται όσες φορές το μέγεθος του δείγματος χρειαζόμαστε. Μείον: επανάληψη των μονάδων επιλογής.

Η διαδικασία για την κατασκευή ενός απλού τυχαίου δείγματος περιλαμβάνει τα ακόλουθα βήματα:

1. πρέπει να λάβετε μια πλήρη λίστα με τα μέλη του γενικού πληθυσμού και να αριθμήσετε αυτήν τη λίστα. Μια τέτοια λίστα, ανάκληση, ονομάζεται πλαίσιο δειγματοληψίας.

2. Προσδιορίστε το αναμενόμενο μέγεθος του δείγματος, δηλαδή τον αναμενόμενο αριθμό των ερωτηθέντων.

3. εξάγουμε από τον πίνακα τυχαίων αριθμών όσους αριθμούς χρειαζόμαστε δείγματα μονάδων. Εάν το δείγμα πρέπει να περιλαμβάνει 100 άτομα, λαμβάνονται 100 τυχαίοι αριθμοί από τον πίνακα. Αυτοί οι τυχαίοι αριθμοί μπορούν να δημιουργηθούν από ένα πρόγραμμα υπολογιστή.

4. επιλέξτε από τη βασική λίστα εκείνες τις παρατηρήσεις των οποίων οι αριθμοί αντιστοιχούν στους γραπτούς τυχαίους αριθμούς

· Ένα απλό τυχαίο δείγμα έχει προφανή πλεονεκτήματα. Αυτή η μέθοδος είναι εξαιρετικά εύκολη στην κατανόηση. Τα αποτελέσματα της μελέτης μπορούν να επεκταθούν στον πληθυσμό της μελέτης. Οι περισσότερες προσεγγίσεις στα στατιστικά συμπεράσματα περιλαμβάνουν τη συλλογή πληροφοριών χρησιμοποιώντας ένα απλό τυχαίο δείγμα. Ωστόσο, η απλή τυχαία μέθοδος δειγματοληψίας έχει τουλάχιστον τέσσερις σημαντικούς περιορισμούς:

1. Είναι συχνά δύσκολο να δημιουργηθεί ένα πλαίσιο δειγματοληψίας που θα επέτρεπε ένα απλό τυχαίο δείγμα.

2. Ένα απλό τυχαίο δείγμα μπορεί να οδηγήσει σε έναν μεγάλο πληθυσμό ή έναν πληθυσμό κατανεμημένο σε μια μεγάλη γεωγραφική περιοχή, γεγονός που αυξάνει σημαντικά τον χρόνο και το κόστος συλλογής δεδομένων.

3. Τα αποτελέσματα της εφαρμογής ενός απλού τυχαίου δείγματος συχνά χαρακτηρίζονται από χαμηλή ακρίβεια και μεγαλύτερο τυπικό σφάλμα από τα αποτελέσματα της εφαρμογής άλλων πιθανοτικών μεθόδων.

4. Ως αποτέλεσμα της εφαρμογής του SRS, μπορεί να σχηματιστεί μη αντιπροσωπευτικό δείγμα. Αν και τα δείγματα που λαμβάνονται με απλή τυχαία επιλογή, κατά μέσο όρο αντιπροσωπεύουν επαρκώς τον γενικό πληθυσμό, ορισμένα από αυτά αντιπροσωπεύουν εξαιρετικά εσφαλμένα τον υπό μελέτη πληθυσμό. Η πιθανότητα αυτού είναι ιδιαίτερα υψηλή με ένα μικρό μέγεθος δείγματος.

· Απλή μη επαναλαμβανόμενη δειγματοληψία. Η διαδικασία κατασκευής του δείγματος είναι η ίδια, μόνο οι κάρτες με τους αριθμούς των ερωτηθέντων δεν επιστρέφονται πίσω στην τράπουλα.

1. Συστηματική δειγματοληψία πιθανοτήτων. Είναι μια απλοποιημένη έκδοση ενός απλού δείγματος πιθανοτήτων. Με βάση τη λίστα του γενικού πληθυσμού, οι ερωτηθέντες επιλέγονται σε ένα συγκεκριμένο διάστημα (Κ). Η τιμή του Κ προσδιορίζεται τυχαία. Το πιο αξιόπιστο αποτέλεσμα επιτυγχάνεται με έναν ομοιογενή γενικό πληθυσμό, διαφορετικά το μέγεθος του βήματος και ορισμένα εσωτερικά κυκλικά μοτίβα του δείγματος μπορεί να συμπίπτουν (μίξη δειγμάτων). Μειονεκτήματα: το ίδιο όπως σε ένα απλό δείγμα πιθανοτήτων.

2. Σειριακή (ένθετη) δειγματοληψία. Οι δειγματοληπτικές μονάδες είναι στατιστικές σειρές (οικογένεια, σχολείο, ομάδα κ.λπ.). Τα επιλεγμένα στοιχεία υπόκεινται σε συνεχή εξέταση. Η επιλογή των στατιστικών μονάδων μπορεί να οργανωθεί ανάλογα με τον τύπο της τυχαίας ή συστηματικής δειγματοληψίας. Μειονεκτήματα: Πιθανότητα μεγαλύτερης ομοιογένειας από ότι στον γενικό πληθυσμό.

3. Ζωνοποιημένο δείγμα. Στην περίπτωση ενός ετερογενούς πληθυσμού, πριν από τη χρήση δειγματοληψίας πιθανοτήτων με οποιαδήποτε τεχνική επιλογής, συνιστάται η διαίρεση του πληθυσμού σε ομοιογενή μέρη, ένα τέτοιο δείγμα ονομάζεται δείγμα ζωνών. Οι ομάδες χωροθέτησης μπορούν να είναι τόσο φυσικοί σχηματισμοί (για παράδειγμα, συνοικίες πόλεων) όσο και οποιοδήποτε χαρακτηριστικό που βασίζεται στη μελέτη. Το σημάδι βάσει του οποίου πραγματοποιείται η διαίρεση ονομάζεται ζώδιο διαστρωμάτωσης και ζωνοποίησης.

4. "Βολική" επιλογή. Η διαδικασία δειγματοληψίας «βολικής» συνίσταται στη δημιουργία επαφών με «βολικές» μονάδες δειγματοληψίας - με μια ομάδα μαθητών, μια αθλητική ομάδα, με φίλους και γείτονες. Εάν είναι απαραίτητο να ληφθούν πληροφορίες σχετικά με τις αντιδράσεις των ανθρώπων σε μια νέα ιδέα, ένα τέτοιο δείγμα είναι αρκετά λογικό. Η δειγματοληψία «ευκολίας» χρησιμοποιείται συχνά για τον προκαταρκτικό έλεγχο των ερωτηματολογίων.

Απίστευτα δείγματα

Η επιλογή σε ένα τέτοιο δείγμα πραγματοποιείται όχι σύμφωνα με τις αρχές της τύχης, αλλά με υποκειμενικά κριτήρια - προσβασιμότητα, τυπικότητα, ίση εκπροσώπηση κ.λπ.

1. Δειγματοληψία ποσοστώσεων - η δειγματοληψία χτίζεται ως μοντέλο που αναπαράγει τη δομή του γενικού πληθυσμού με τη μορφή ποσοστώσεων (αναλογιών) των χαρακτηριστικών που μελετήθηκαν. Ο αριθμός των δειγματοληπτικών στοιχείων με διαφορετικό συνδυασμό των υπό μελέτη χαρακτηριστικών προσδιορίζεται με τέτοιο τρόπο ώστε να αντιστοιχεί στο μερίδιό τους (αναλογία) στο γενικό πληθυσμό. Έτσι, για παράδειγμα, εάν έχουμε έναν γενικό πληθυσμό 5.000 ατόμων, εκ των οποίων 2.000 γυναίκες και 3.000 άνδρες, τότε στο δείγμα ποσόστωσης θα έχουμε 20 γυναίκες και 30 άνδρες ή 200 γυναίκες και 300 άνδρες. Τα δείγματα ποσοστώσεων βασίζονται συχνότερα σε δημογραφικά κριτήρια: φύλο, ηλικία, περιοχή, εισόδημα, εκπαίδευση και άλλα. Μειονεκτήματα: συνήθως τέτοια δείγματα δεν είναι αντιπροσωπευτικά, γιατί είναι αδύνατο να ληφθούν υπόψη πολλές κοινωνικές παράμετροι ταυτόχρονα. Πλεονεκτήματα: εύκολα προσβάσιμο υλικό.

2. Μέθοδος χιονοστιβάδας. Το δείγμα κατασκευάζεται ως εξής. Κάθε ερωτώμενος, ξεκινώντας από τον πρώτο, καλείται να επικοινωνήσει με τους φίλους, τους συναδέλφους, τους γνωστούς του που θα ταίριαζαν στις συνθήκες επιλογής και θα μπορούσαν να λάβουν μέρος στη μελέτη. Έτσι, με εξαίρεση το πρώτο βήμα, το δείγμα διαμορφώνεται με τη συμμετοχή των ίδιων των αντικειμένων της μελέτης. Η μέθοδος χρησιμοποιείται συχνά όταν είναι απαραίτητο να βρεθούν και να συνεντεύξεις δυσπρόσιτες ομάδες ερωτηθέντων (για παράδειγμα, ερωτηθέντες με υψηλό εισόδημα, ερωτηθέντες που ανήκουν στην ίδια επαγγελματική ομάδα, ερωτηθέντες που έχουν κάποια παρόμοια χόμπι / πάθη κ.λπ. )

3. Αυθόρμητη δειγματοληψία - δειγματοληψία του λεγόμενου «πρώτου εισερχόμενου». Συχνά χρησιμοποιείται σε τηλεοπτικές και ραδιοφωνικές δημοσκοπήσεις. Το μέγεθος και η σύνθεση των αυθόρμητων δειγμάτων δεν είναι γνωστά εκ των προτέρων και καθορίζεται από μία μόνο παράμετρο - τη δραστηριότητα των ερωτηθέντων. Μειονεκτήματα: είναι αδύνατο να προσδιοριστεί ποιο είδος γενικού πληθυσμού αντιπροσωπεύουν οι ερωτηθέντες, και ως εκ τούτου, είναι αδύνατο να προσδιοριστεί η αντιπροσωπευτικότητα.

4. Έρευνα διαδρομής - χρησιμοποιείται συχνά εάν η μονάδα μελέτης είναι η οικογένεια. Στον χάρτη του οικισμού στον οποίο θα γίνει η έρευνα, όλες οι οδοί είναι αριθμημένες. Χρησιμοποιώντας έναν πίνακα (γεννήτρια) τυχαίων αριθμών, επιλέγονται μεγάλοι αριθμοί. Κάθε μεγάλος αριθμός θεωρείται ότι αποτελείται από 3 στοιχεία: αριθμός οδού (2-3 πρώτοι αριθμοί), αριθμός σπιτιού, αριθμός διαμερίσματος. Για παράδειγμα, ο αριθμός 14832: 14 είναι ο αριθμός της οδού στο χάρτη, 8 είναι ο αριθμός του σπιτιού, 32 είναι ο αριθμός του διαμερίσματος.

5. Ζωνοποιημένη δειγματοληψία με επιλογή τυπικών αντικειμένων. Εάν, μετά τη χωροθέτηση, επιλεγεί ένα τυπικό αντικείμενο από κάθε ομάδα, π.χ. ένα αντικείμενο που προσεγγίζει τον μέσο όρο ως προς τα περισσότερα από τα χαρακτηριστικά που μελετήθηκαν στη μελέτη, ένα τέτοιο δείγμα ονομάζεται ζώνες με την επιλογή τυπικών αντικειμένων.

Στρατηγικές οικοδόμησης ομάδας

Η επιλογή των ομάδων για τη συμμετοχή τους σε ένα ψυχολογικό πείραμα πραγματοποιείται χρησιμοποιώντας διάφορες στρατηγικές, οι οποίες είναι απαραίτητες για να εξασφαλιστεί η μεγαλύτερη δυνατή συμμόρφωση με την εσωτερική και εξωτερική εγκυρότητα.

· Τυχαιοποίηση (τυχαία επιλογή)

· Επιλογή κατά ζεύγη

· Στρατομετρική επιλογή

· Κατά προσέγγιση μοντελοποίηση

· Συμμετοχή πραγματικών ομάδων

Τυχαιοποίηση, ή τυχαία επιλογή, χρησιμοποιείται για τη δημιουργία απλών τυχαίων δειγμάτων. Η χρήση ενός τέτοιου δείγματος βασίζεται στην υπόθεση ότι κάθε μέλος του πληθυσμού είναι εξίσου πιθανό να συμπεριληφθεί στο δείγμα. Για παράδειγμα, για να δημιουργήσετε ένα τυχαίο δείγμα 100 φοιτητών πανεπιστημίου, μπορείτε να βάλετε κομμάτια χαρτιού με τα ονόματα όλων των φοιτητών σε ένα καπέλο και, στη συνέχεια, να βγάλετε 100 κομμάτια χαρτιού - αυτή θα είναι τυχαία επιλογή (Goodwin J. , σελ. 147).

Επιλογή κατά ζεύγη- μια στρατηγική για την κατασκευή ομάδων δειγμάτων, στην οποία ομάδες υποκειμένων αποτελούνται από υποκείμενα που είναι ισοδύναμα ως προς τις πλευρικές παραμέτρους που είναι σημαντικές για το πείραμα. Αυτή η στρατηγική είναι αποτελεσματική για πειράματα που χρησιμοποιούν πειραματικές ομάδες και ομάδες ελέγχου με την καλύτερη επιλογή - την προσέλκυση διδύμων ζευγών (μονο- και διζυγωτικών), καθώς σας επιτρέπει να δημιουργήσετε ...

Στρατομετρική επιλογή - τυχαιοποίηση με την κατανομή στρωμάτων (ή συστάδων). Με αυτή τη μέθοδο δειγματοληψίας, ο γενικός πληθυσμός χωρίζεται σε ομάδες (στρώματα) που έχουν συγκεκριμένα χαρακτηριστικά (φύλο, ηλικία, πολιτικές προτιμήσεις, μόρφωση, επίπεδο εισοδήματος κ.λπ.) και επιλέγονται άτομα με τα αντίστοιχα χαρακτηριστικά.

Κατά προσέγγιση μοντελοποίηση - σύνταξη περιορισμένων δειγμάτων και γενίκευση των συμπερασμάτων σχετικά με αυτό το δείγμα σε έναν ευρύτερο πληθυσμό. Για παράδειγμα, κατά τη συμμετοχή σε μια μελέτη φοιτητών στο 2ο έτος του πανεπιστημίου, τα δεδομένα αυτής της μελέτης επεκτείνονται σε «άτομα ηλικίας 17 έως 21 ετών». Το παραδεκτό τέτοιων γενικεύσεων είναι εξαιρετικά περιορισμένο.

Η κατά προσέγγιση μοντελοποίηση είναι ο σχηματισμός ενός μοντέλου που, για μια σαφώς καθορισμένη κατηγορία συστημάτων (διαδικασιών), περιγράφει τη συμπεριφορά του (ή τα επιθυμητά φαινόμενα) με αποδεκτή ακρίβεια.

Διάλεξη 6. Στοιχεία μαθηματικής στατιστικής

Ερωτήσεις για τον έλεγχο της γνώσης και τη σύνοψη της διάλεξης

1. Ορίστε μια τυχαία μεταβλητή.

2. Γράψτε τύπους για τη μαθηματική προσδοκία και διασπορά διακριτών και συνεχών τυχαίων μεταβλητών.

3. Δώστε έναν ορισμό του τοπικού ολοκληρωτικού οριακού θεωρήματος του Laplace

4. Να γράψετε τύπους για τη διωνυμική κατανομή, την υπεργεωμετρική κατανομή, την κατανομή Poisson, την ομοιόμορφη κατανομή και την κανονική κατανομή.

Σκοπός: Να μελετηθούν οι βασικές έννοιες της μαθηματικής στατιστικής

1. Πληθυσμός και δείγμα

2. Στατιστική κατανομή του δείγματος. Πολύγωνο. ραβδόγραμμα .

3. Εκτιμήσεις των παραμέτρων του γενικού πληθυσμού με βάση το δείγμα του

4. Γενικοί και δειγματοληπτικοί μέσοι όροι. Μέθοδοι υπολογισμού τους.

5. Γενικές και δειγματοληπτικές διακυμάνσεις.

6. Ερωτήσεις για τον έλεγχο της γνώσης και τη σύνοψη της διάλεξης

Αρχίζουμε να μελετάμε τα στοιχεία της μαθηματικής στατιστικής, στα οποία αναπτύσσονται επιστημονικά βασισμένες μέθοδοι συλλογής στατιστικών δεδομένων και επεξεργασίας τους.

1. Γενικός πληθυσμός και δείγμα.Ας απαιτείται η μελέτη ενός συνόλου ομοιογενών αντικειμένων (αυτό το σύνολο ονομάζεται στατιστικό σύνολο)σχετικά με κάποιο ποιοτικό ή ποσοτικό χαρακτηριστικό που χαρακτηρίζει αυτά τα αντικείμενα. Για παράδειγμα, εάν υπάρχει μια παρτίδα εξαρτημάτων, τότε το τυπικό μέρος μπορεί να χρησιμεύσει ως ποιοτικό σήμα και το ελεγχόμενο μέγεθος του εξαρτήματος μπορεί να χρησιμεύσει ως ποσοτικό πρόσημο.

Είναι καλύτερο να κάνετε μια συνεχή έρευνα, δηλ. εξερευνήστε κάθε στοιχείο. Ωστόσο, στις περισσότερες περιπτώσεις, για διάφορους λόγους, αυτό δεν είναι δυνατό. Ένας μεγάλος αριθμός αντικειμένων και η μη διαθεσιμότητα τους μπορεί να αποτρέψει μια συνεχή έρευνα. Αν, για παράδειγμα, πρέπει να γνωρίζουμε το μέσο βάθος της χοάνης κατά την έκρηξη ενός βλήματος από μια πειραματική παρτίδα, τότε κάνοντας μια πλήρη έρευνα, θα καταστρέψουμε ολόκληρη την παρτίδα.

Εάν δεν είναι δυνατή μια πλήρης έρευνα, τότε ένα μέρος των αντικειμένων επιλέγεται για μελέτη από ολόκληρο τον πληθυσμό.

Καλείται το στατιστικό σύνολο από το οποίο επιλέγονται ορισμένα από τα αντικείμενα ο γενικός πληθυσμός.Καλείται ένα σύνολο αντικειμένων που επιλέγονται τυχαία από τον γενικό πληθυσμό δείγμα.

Ο αριθμός των αντικειμένων στο γενικό πληθυσμό και το δείγμα καλείται, αντίστοιχα Ενταση ΗΧΟΥγενικός πληθυσμός και Ενταση ΗΧΟΥδείγματα.

Παράδειγμα 10.1.Οι καρποί ενός δέντρου (200 τεμάχια) εξετάζονται για την παρουσία μιας γεύσης ειδικής για αυτήν την ποικιλία. Για να το κάνετε αυτό, επιλέξτε 10 τεμ. Εδώ το 200 είναι το μέγεθος του πληθυσμού και το 10 το μέγεθος του δείγματος.

Εάν το δείγμα ληφθεί από ένα αντικείμενο, το οποίο εξετάζεται και επιστρέφεται στον γενικό πληθυσμό, τότε το δείγμα καλείται αλλεπάλληλος.Εάν τα αντικείμενα του δείγματος δεν επιστρέφονται πλέον στον γενικό πληθυσμό, τότε το δείγμα καλείται ανεπανάληπτο.



Στην πράξη, χρησιμοποιείται συχνότερα η μη επαναλαμβανόμενη δειγματοληψία. Εάν το μέγεθος του δείγματος είναι ένα μικρό κλάσμα του μεγέθους του πληθυσμού, τότε η διαφορά μεταξύ της επαναδειγματοληψίας και της μη επαναλαμβανόμενης δειγματοληψίας είναι αμελητέα.

Οι ιδιότητες των αντικειμένων στο δείγμα πρέπει να αντικατοπτρίζουν σωστά τις ιδιότητες των αντικειμένων στον πληθυσμό ή, όπως λένε, το δείγμα πρέπει να είναι εκπρόσωπος(εκπρόσωπος). Πιστεύεται ότι το δείγμα είναι αντιπροσωπευτικό εάν όλα τα αντικείμενα του γενικού πληθυσμού έχουν την ίδια πιθανότητα να συμπεριληφθούν στο δείγμα, δηλαδή η επιλογή γίνεται τυχαία. Για παράδειγμα, για να εκτιμηθεί η μελλοντική συγκομιδή, μπορεί κανείς να κάνει ένα δείγμα από τον γενικό πληθυσμό των φρούτων που δεν έχουν ακόμη ωριμάσει και να εξετάσει τα χαρακτηριστικά τους (βάρος, ποιότητα κ.λπ.). Εάν ολόκληρο το δείγμα ληφθεί από ένα δέντρο, τότε δεν θα είναι αντιπροσωπευτικό. Ένα αντιπροσωπευτικό δείγμα πρέπει να αποτελείται από τυχαία επιλεγμένους καρπούς από τυχαία επιλεγμένα δέντρα.

2. Στατιστική κατανομή του δείγματος. Πολύγωνο. Ραβδόγραμμα.Ας ληφθεί δείγμα από τον γενικό πληθυσμό, και Χ 1 παρατηρήθηκε n 1 φορά, Χ 2 - σελ 2μια φορά, ..., x k - n k φορές και n 1 +n 2 +…+ σελ κ= Π -το μέγεθος του δείγματος. Παρατηρούμενες τιμές Χ 1 , Χ 2 , …, x kπου ονομάζεται επιλογές,και η ακολουθία παραλλαγής, γραμμένη με αύξουσα σειρά, είναι σειρά παραλλαγής.Αριθμός παρατηρήσεων n 1 , n 2 , …, nkπου ονομάζεται συχνότητεςκαι τη σχέση τους με το μέγεθος του δείγματος , , …, - σχετικές συχνότητες.Σημειώστε ότι το άθροισμα των σχετικών συχνοτήτων είναι ίσο με ένα: .

Η στατιστική κατανομή του δείγματοςκαλέστε τη λίστα επιλογών και τις αντίστοιχες συχνότητες ή τις σχετικές συχνότητες. Η στατιστική κατανομή μπορεί επίσης να οριστεί ως μια ακολουθία διαστημάτων και των αντίστοιχων συχνοτήτων τους (συνεχής κατανομή). Ως συχνότητα που αντιστοιχεί στο διάστημα, πάρτε το άθροισμα των συχνοτήτων της παραλλαγής που έπεσε σε αυτό το διάστημα. Για μια γραφική αναπαράσταση της στατιστικής κατανομής, χρησιμοποιήστε πολύγωνακαι ιστογράμματα.

Να χτίσουμε ένα πολύγωνο στον άξονα Ωπαραμερίστε τις τιμές επιλογής Χ i , στον άξονα OU -τιμές συχνότητας Π i (σχετικές συχνότητες ).

Παράδειγμα 10.2.Στο σχ. Το 10.1 δείχνει το πολύγωνο της ακόλουθης κατανομής

Το πολύγωνο χρησιμοποιείται συνήθως στην περίπτωση μικρού αριθμού επιλογών. Στην περίπτωση μεγάλου αριθμού παραλλαγών και σε περίπτωση συνεχούς κατανομής του χαρακτηριστικού, κατασκευάζονται πιο συχνά ιστογράμματα. Για να γίνει αυτό, το διάστημα, το οποίο περιέχει όλες τις παρατηρούμενες τιμές του χαρακτηριστικού, χωρίζεται σε πολλά επιμέρους διαστήματα μήκους ηκαι βρείτε για κάθε μερικό διάστημα n i, - το άθροισμα των συχνοτήτων της παραλλαγής που έπεσε Εγώ-διάστημα. Στη συνέχεια, σε αυτά τα διαστήματα, όπως και σε βάσεις, χτίζουν ορθογώνια με ύψη (ή, όπου Π -το μέγεθος του δείγματος).

τετράγωνο Εγώμερικό ορθογώνιο είναι , ).

Επομένως, η περιοχή του ιστογράμματος είναι ίση με το άθροισμα όλων των συχνοτήτων (ή σχετικών συχνοτήτων), δηλ. μέγεθος δείγματος (ή μονάδα).

Παράδειγμα 10.3.Στο σχ. Το 10.2 δείχνει ένα ιστόγραμμα συνεχούς κατανομής όγκου n= 100 δίνεται στον παρακάτω πίνακα.