Βιογραφίες Χαρακτηριστικά Ανάλυση

Πώς να υπολογίσετε το δείγμα για τη μελέτη. Γενικός πληθυσμός και μέθοδος δειγματοληψίας

Ο παρακάτω τύπος για τον υπολογισμό το μέγεθος του δείγματοςχρησιμοποιείται σε περιπτώσεις όπου οι ερωτώμενοι (αποκριθέντες) τίθενται μόνο μία ερώτηση, στην οποία υπάρχουν μόνο δύο πιθανές απαντήσεις. Για παράδειγμα, "Ναι" και "Όχι". «Χρησιμοποιώ» και «Δεν χρησιμοποιώ». Φυσικά, αυτή τη φόρμουλαμπορεί να χρησιμοποιηθεί μόνο για απλή έρευνα. Εάν πρέπει να προσδιορίσετε το μέγεθος του δείγματος για περισσότερο από έρευνα μεγάλης κλίμακας, για παράδειγμα, ερωτηματολόγια και στη συνέχεια θα πρέπει να χρησιμοποιηθούν άλλοι τύποι.

Ένας απλός τύπος για τον υπολογισμό του μεγέθους του δείγματος

όπου: n- το μέγεθος του δείγματος;

zείναι η κανονικοποιημένη απόκλιση που προσδιορίζεται με βάση το επιλεγμένο επίπεδο εμπιστοσύνης. Αυτός ο δείκτης χαρακτηρίζει τη δυνατότητα, την πιθανότητα να ληφθούν απαντήσεις σε ένα ειδικό διάστημα εμπιστοσύνης. Στην πράξη, το επίπεδο εμπιστοσύνης συχνά λαμβάνεται ως 95% ή 99%. Τότε οι τιμές z θα είναι 1,96 και 2,58, αντίστοιχα.

Π– διακύμανση για το δείγμα, σε μετοχές. Στην ουσία, το p είναι η πιθανότητα οι ερωτώμενοι να επιλέξουν τη μία ή την άλλη επιλογή απάντησης. Ας υποθέσουμε ότι εάν πιστεύουμε ότι το ένα τέταρτο των ερωτηθέντων θα επιλέξει την απάντηση "Ναι", τότε το p θα είναι ίσο με 25%, δηλαδή, p = 0,25;

q= (1 – p);

μι– επιτρεπτό σφάλμα, σε κλάσματα.

Παράδειγμα υπολογισμού μεγέθους δείγματος

Η εταιρεία σχεδιάζει να κοινωνιολογική έρευναπροκειμένου να εντοπιστεί η αναλογία των καπνιστών στον πληθυσμό της πόλης. Για να γίνει αυτό, οι υπάλληλοι της εταιρείας θα κάνουν στους περαστικούς μια ερώτηση: «Καπνίζετε;». Πιθανές επιλογέςΕπομένως, υπάρχουν μόνο δύο απαντήσεις: «Ναι» και «Όχι».

Το μέγεθος του δείγματος σε αυτή την περίπτωση υπολογίζεται ως εξής. Το επίπεδο εμπιστοσύνης λαμβάνεται ως 95%, τότε η κανονικοποιημένη απόκλιση z = 1,96. Δεχόμαστε τη διακύμανση ως 50%, δηλαδή πιστεύουμε υπό όρους ότι οι μισοί από τους ερωτηθέντες μπορούν να απαντήσουν στην ερώτηση αν καπνίζουν - «Ναι». Επειτα p=0,5. Από εδώ βρίσκουμε q = 1 – p = 1 – 0,5 = 0,5 . Το αποδεκτό σφάλμα δειγματοληψίας λαμβάνεται ως 10%, δηλαδή e = 0,1.

Αντικαθιστούμε αυτά τα δεδομένα στον τύπο και υπολογίζουμε:

Λήψη του μεγέθους του δείγματος n = 96 άτομα.

Πεδίο εφαρμογής αυτού του τύπου

Κατά τη διεξαγωγή απλή έρευναόταν πρέπει να λάβετε απάντηση σε μια απλή ερώτηση. Σε αυτήν την περίπτωση, η κλίμακα των απαντήσεων, κατά κανόνα, είναι διχοτομικής φύσης. Δηλαδή, προσφέρονται (ή υπονοούμενες) απαντήσεις του τύπου «Ναι» - «Όχι», «Μαύρο» - «Λευκό» κ.λπ.

Χαρακτηριστικά αυτού του τύπου για τον υπολογισμό του μεγέθους του δείγματος

Galyautdinov R.R.


© Η αντιγραφή υλικού επιτρέπεται μόνο εάν καθορίσετε έναν άμεσο υπερσύνδεσμο προς

Το μέγεθος του δείγματος πρέπει να καθοριστεί πριν από την έναρξη των περισσότερων ποσοτικών μελετών. Δεν απαιτείται προσδιορισμός μεγέθους δείγματος για ποιοτική έρευνα(Σημειώστε ότι αυτό αναφέρεται σε τυπικά ποσοτικές μεθόδους όπως η ανάλυση περιεχομένου· τα απλά περιγραφικά έργα είναι ποσοτικά.) Ο υπολογισμός του μεγέθους του δείγματος ενδέχεται να μην πραγματοποιηθεί πριν από τη διεξαγωγή προκαταρκτικών, πιλοτικών μελετών (ωστόσο, τέτοιες μελέτες συνήθως εκτελούνται πριν από τον πραγματικό σχεδιασμό επιστημονική έρευνα). Εάν έχετε αμφιβολίες, φροντίστε να επικοινωνήσετε με το ίδρυμα που χρηματοδοτεί τη μελέτη ή τη συμπεριλαμβάνει στο ερευνητικό του σχέδιο - η έλλειψη δεδομένων για το μέγεθος του δείγματος είναι ένα από τα πιο κοινές αιτίεςάρνηση έγκρισης του θέματος

Γιατί το μέγεθος του δείγματος είναι σημαντικό για έναν ερευνητή;

Κατά τη διεξαγωγή μελετών που καθορίζουν τον επιπολασμό ενός χαρακτηριστικού σε έναν πληθυσμό (για παράδειγμα, τον επιπολασμό του άσθματος στα παιδιά), είναι απαραίτητος ο υπολογισμός του μεγέθους του δείγματος προκειμένου οι εκτιμήσεις που λαμβάνονται να έχουν τον επιθυμητό βαθμό ακρίβειας. Για παράδειγμα, ένας επιπολασμός ασθένειας 10% που λαμβάνεται από ένα μέγεθος δείγματος 20 θα είχε ένα διάστημα εμπιστοσύνης 95% από 1% έως 31%, το οποίο δεν είναι ούτε ακριβές ούτε ενημερωτικό. Από την άλλη πλευρά, ένας επιπολασμός της νόσου 10% που λαμβάνεται από ένα δείγμα 400 ατόμων θα είχε ένα διάστημα εμπιστοσύνης 95% από 7% έως 13%, το οποίο μπορεί να θεωρηθεί ως ένα αρκετά ακριβές αποτέλεσμα. Η εκτίμηση των μεγεθών του δείγματος αποφεύγει την πρώτη από αυτές τις δύο επιλογές.

Σε μελέτες που έχουν σχεδιαστεί για την ανίχνευση μιας επίδρασης (π.χ. διαφορά στην αποτελεσματικότητα μεταξύ δύο θεραπειών, σχετικός κίνδυνος ασθένειας με ή χωρίς παράγοντα κινδύνου), η εκτίμηση του μεγέθους του δείγματος είναι σημαντική για να διασφαλιστεί ότι εάν κλινικά ή βιολογικά σημαντικό αποτέλεσμαυπάρχει, τότε αυτό υψηλό βαθμόη πιθανότητα θα ανιχνευθεί, με άλλα λόγια, η ανάλυση θα δώσει στατιστικά σημαντικά αποτελέσματα. Εάν το μέγεθος του δείγματος είναι μικρό, τότε ακόμη και αν σημαντικές διαφορέςμεταξύ των ομάδων, θα είναι αδύνατο να αποδειχθεί ότι είναι αποτέλεσμα κάτι διαφορετικό από τη μεταβλητότητα του δείγματος.

Πληροφορίες που απαιτούνται για τον υπολογισμό του μεγέθους του δείγματος

Μέθοδοι για την εκτίμηση του μεγέθους του δείγματος περιγράφονται σε διάφορα εγχειρίδια για τη στατιστική, συμπεριλαμβανομένου του Altman, 1991. Bland, 2000; Armitage, Berry and Matthews, 2002. Δύο βιβλία ειδικεύονται στην περιγραφή μεθόδων για την εκτίμηση των μεγεθών δειγμάτων σε διαφορετικές καταστάσεις. Για ποιοτικές παραμέτρους, θα πρέπει να συμβουλευτείτε την εργασία των Manchin et al. (1998), για την ποιότητα - Lemeshow et al. (1996). Και τα δύο βιβλία παρέχουν πίνακες που βοηθούν στον υπολογισμό μεγεθών δειγμάτων. Στην περίπτωση των σειριακών δοκιμών, θα πρέπει να γίνει αναφορά στο Whitehead (1997) Οι υπολογισμοί του πραγματικού μεγέθους δείγματος μπορούν να πραγματοποιηθούν χρησιμοποιώντας ένα από τα πολλά προγράμματα υπολογιστή. Για παράδειγμα, το πρόγραμμα Stata σάς επιτρέπει να αναλύσετε το μέγεθος του δείγματος που απαιτείται για τη σύγκριση των μέσων και των αναλογιών, καθώς και την ανάλυση επιπολασμού. Πολύ μεγάλη ποσότηταΟι επιλογές προσφέρουν εξειδικευμένα πακέτα όπως το nQuery Advisor ή το UnifyPow.

Ο υπολογισμός του μεγέθους του δείγματος εξαρτάται από ακόλουθους παράγοντες, το οποίο θα πρέπει να αναφερθεί στον στατιστικολόγο-σύμβουλο:

  • Οι μεταβλητές που μελετήθηκαν στη μελέτη, συμπεριλαμβανομένων των τύπων τους
  • Απαιτούμενη ερευνητική δύναμη
  • Απαιτούμενο επίπεδο στατιστική σημασία
  • Μέγεθος επίδρασης που είναι κλινικά σχετικό
  • Τυπική απόκλιση για μεταβλητές κλίμακας
  • Εάν θα χρησιμοποιηθεί δοκιμή σημασίας με μία ή δύο ουρές
  • Ο σχεδιασμός της μελέτης, με άλλα λόγια, είναι η μελέτη:
    • τυχαιοποιημένη ελεγχόμενη δοκιμή
    • Τυχαιοποιημένη δοκιμή σε ομάδες
    • Έρευνα ισοδυναμίας
    • Μη τυχαιοποιημένη μελέτη παρέμβασης
    • μελέτη παρατήρησης
    • μελέτη επιπολασμού
    • Μελέτη της ευαισθησίας και της ειδικότητας του τεστ

Αυτό θα απαιτήσει απάντηση σε έναν αριθμό ΕΠΙΠΡΟΣΘΕΤΕΣ ΕΡΩΤΗΣΕΙΣ:

  • Συμπεριλαμβάνονται στη μελέτη ζευγαρωμένα δεδομένα;
  • Θα μετρήσει η μελέτη τις ίδιες μεταβλητές επανειλημμένα στο ίδιο άτομο;
  • Οι ομάδες που περιλαμβάνονται στη μελέτη είναι ίσες σε μέγεθος;
  • Είναι τα δεδομένα ιεραρχικά;

Θα πρέπει να ληφθεί υπόψη ότι οι μη τυχαιοποιημένες μελέτες διαφορών ή σχέσεων συνήθως απαιτούν σημαντικά μεγαλύτερο μέγεθος δείγματος προκειμένου να ληφθεί υπόψη η επίδραση τρίτων μεταβλητών στην ανάλυση. Ταυτόχρονα, ο ερευνητής ενδιαφέρεται για το απόλυτο μέγεθος του δείγματος και όχι για το ποσοστό που αποτελεί από τον πληθυσμό συνολικά.

Ποιοι στατιστικοί όροι χρησιμοποιούνται για να περιγράψουν τη διαδικασία σχεδιασμού μεγέθους δείγματος

Μηδενικές και εναλλακτικές υποθέσεις

πολλοί τύποι Στατιστική ανάλυσημε στόχο τη σύγκριση δύο είδη θεραπείας, διαδικασίες ή ομάδες ασθενών. Η αριθμητική τιμή που συνοψίζει τις διαφορές που ενδιαφέρουν τον ερευνητή ονομάζεται αποτέλεσμα. Σε άλλες μελέτες, το αποτέλεσμα μπορεί να είναι ένας συντελεστής συσχέτισης, λόγος πιθανοτήτων ή σχετικός κίνδυνος. Στη συνέχεια υποβάλλουμε τις μηδενικές και εναλλακτικές υποθέσεις. Συνήθως η μηδενική υπόθεση δηλώνει ότι δεν υπάρχει αποτέλεσμα (οι διαφορές μεταξύ των ομάδων είναι μηδέν, σχετικός κίνδυνος ίσο με ένα, ο συντελεστής συσχέτισης είναι μηδέν), η εναλλακτική υπόθεση υποδηλώνει ότι υπάρχει αποτέλεσμα.

Πιθανότητα εμπιστοσύνης (p-score)

Η τιμή p είναι η πιθανότητα να παρατηρηθεί το ίδιο ή μεγαλύτερο αποτέλεσμα σε μια μελέτη, δεδομένης της εγκυρότητας της μηδενικής υπόθεσης. Συνήθως εκφράζεται ως αναλογία (π.χ. p=0,03)

Επίπεδο σημασίας

Το επίπεδο σημαντικότητας είναι η τιμή κατωφλίου για το p-score κάτω από το οποίο πρέπει να απορριφθεί η μηδενική υπόθεση και συνάγεται το συμπέρασμα ότι υπάρχουν ενδείξεις επίδρασης. Τυπικά, το επίπεδο σημαντικότητας ορίζεται σε μια τιμή 5% (Το επίπεδο σημαντικότητας, παρά την άμεση σχέση με το p-score, εκφράζεται ως ποσοστό: ένα επίπεδο σημαντικότητας 5% ισοδυναμεί με p=0,05). Εάν η παρατηρούμενη τιμή είναι μικρότερη από 5%, τότε υπάρχει μικρή πιθανότητα η μελέτη να είχε τέτοια αποτελέσματα εάν δεν υπήρχε αληθινό αποτέλεσμα. Ως εκ τούτου, η υπόθεση της παρουσίας του αποτελέσματος γίνεται αποδεκτή.

Ένα επίπεδο σημαντικότητας 5% σημαίνει επίσης ότι υπάρχει σχεδόν 5% πιθανότητα να καταλήξουμε στο συμπέρασμα ότι υπάρχει αποτέλεσμα, ενώ στην πραγματικότητα δεν υπάρχει. Μερικές φορές είναι πιο κατάλληλο να χρησιμοποιηθεί ένα επίπεδο σημαντικότητας 1%, ειδικά εάν είναι πολύ σημαντικό να αποφευχθεί το συμπέρασμα ότι υπάρχει ένα αποτέλεσμα ενώ στην πραγματικότητα δεν υπάρχει.

Εξουσία

Η ισχύς είναι η πιθανότητα ότι μηδενική υπόθεσηθα απορριφθεί επαρκώς, με άλλα λόγια, όταν υπάρχουν πράγματι στοιχεία για πραγματικές διαφορές ή σχέσεις. Μπορεί να θεωρηθεί ως "100 τοις εκατό μείον την πιθανότητα να χάσετε το πραγματικό αποτέλεσμα". Επομένως, όσο μεγαλύτερη είναι η ισχύς, τόσο λιγότερο πιθανό είναι να χαθεί το πραγματικό αποτέλεσμα. Η ισχύς συνήθως καθορίζεται στο 80%, 90% ή 95%. Η ισχύς δεν πρέπει να είναι μικρότερη από 80%. Εάν είναι κρίσιμο να μην παραλείψει η μελέτη ένα υπάρχον αποτέλεσμα, θα πρέπει να στοχεύσετε σε ισχύ 90% ή περισσότερο.

Κλινικά σημαντικό μέγεθος επίδρασης

Αυτές είναι οι μικρότερες διαφορές μεταξύ του μέσου όρου της ομάδας ή των ποσοστών των γεγονότων εντός αυτών (αναλογίες πιθανοτήτων πλησιέστερα στον κίνδυνο μονάδας) που μπορούν ακόμα να θεωρηθούν βιολογικά ή κλινικά σημαντικές. Το μέγεθος του δείγματος θα πρέπει να είναι τέτοιο ώστε εάν υπάρχουν τέτοιες διαφορές, τότε η μελέτη θα παράγει στατιστικά σημαντικά αποτελέσματα.

Δοκιμή σημασίας μιας ουράς ή δύο ουρών

Σε ένα τεστ δύο ουρών, η μηδενική υπόθεση είναι ότι δεν υπάρχει διαφορά και η εναλλακτική υπόθεση είναι ότι οι διαφορές μεταξύ των ομάδων μπορούν να πάνε προς οποιαδήποτε κατεύθυνση. Σε ένα τεστ μιας ουράς, η εναλλακτική υπόθεση καθορίζει την επιδιωκόμενη κατεύθυνση της διαφοράς, όπως ότι η θεραπεία είναι καλύτερη από το εικονικό φάρμακο, και η μηδενική υπόθεση περιλαμβάνει καταστάσεις όπου η επίδραση του φαρμάκου και του εικονικού φαρμάκου είναι η ίδια και όπου τα αποτελέσματα του φαρμάκου σε χειρότερη έκβαση από το εικονικό φάρμακο.

Αν όχι σοβαρούς λόγουςΓια να μην γίνει αυτό, θα πρέπει κανείς να χρησιμοποιήσει μια υπόθεση δύο όψεων. Η προσδοκία ότι οι διαφορές θα πάνε προς τη μία ή την άλλη κατεύθυνση δεν είναι επαρκής λόγος για να χρησιμοποιήσουμε ένα τεστ μιας ουράς. Οι ιατροί ερευνητές συχνά εκπλήσσονται αν το αποτέλεσμα δεν είναι το αναμενόμενο, πολύ συχνά ένα τέτοιο εύρημα έχει άλλες συνέπειες από το να μην υπάρχει διαφορά, και ως εκ τούτου πρέπει να περιγράφεται επαρκώς. Μια μονόπλευρη δοκιμή δεν το επιτρέπει. Για παραδείγματα καταστάσεων στις οποίες μπορεί να είναι αποδεκτό ένα μονόπλευρο τεστ, βλέπε Bland and Altman (1994).

Ποιες μεταβλητές πρέπει να λαμβάνονται υπόψη κατά τον υπολογισμό του μεγέθους του δείγματος

Ο υπολογισμός του μεγέθους του δείγματος θα πρέπει να βασίζεται στην ανάλυση της κύριας μεταβλητής του αποτελέσματος σε αυτή τη μελέτη.

Εάν στη μελέτη περιλαμβάνονται πρόσθετες μεταβλητές, οι οποίες θεωρούνται επίσης σημαντικές επιστημονική σημασία, τότε το μέγεθος του δείγματος θα πρέπει να είναι τέτοιο που να επιτρέπει την επαρκή ανάλυση αυτών των μεταβλητών. Για όλα τα σημαντικά επιστημονικώςπρέπει να πραγματοποιηθούν μεταβλητές και να παρουσιαστεί ο υπολογισμός του μεγέθους του δείγματος.

Ποσοστό ανταπόκρισης και λογιστικής απώλειας επιτήρησης

Το εκτιμώμενο μέγεθος δείγματος υποδεικνύει τον αριθμό των ασθενών στην τελική ομάδα που αναλύθηκε στο τέλος της μελέτης. Επομένως, ο αριθμός των ατόμων που θα εγγραφούν στη μελέτη θα πρέπει να αυξηθεί σύμφωνα με την αναμενόμενη ανταπόκριση, την απώλεια παρακολούθησης, την αποτυχία τήρησης του πρωτοκόλλου και άλλους πιθανούς λόγους για την απώλεια των πειραματικών ατόμων. Η σχέση μεταξύ του αναμενόμενου αριθμού συμμετεχόντων και του μεγέθους του δείγματος που θα σχηματιστεί πρέπει να περιγράφεται με σαφήνεια.

Συμμόρφωση με τους στόχους της μελέτης και τις μεθόδους στατιστικής ανάλυσης

Η επάρκεια του μεγέθους του δείγματος θα πρέπει επίσης να αξιολογηθεί σύμφωνα με το σκοπό της μελέτης. Για παράδειγμα, εάν ο στόχος μιας μελέτης είναι να αποδείξει ότι ένα νέο φάρμακο είναι καλύτερο από ένα υπάρχον, είναι απαραίτητο να διασφαλιστεί ότι το μέγεθος του δείγματος επιτρέπει την ανίχνευση κλινικά σημαντικών διαφορών μεταξύ των δύο θεραπειών. Ωστόσο, μερικές φορές απαιτείται να αποδειχθεί ότι δύο φάρμακα είναι κλινικά ισοδύναμα. Αυτός ο τύπος μελέτης αναφέρεται συχνά ως δοκιμασία ισοδυναμίας ή «αρνητική». Τα ζητήματα μεγέθους δείγματος για αυτές τις μελέτες περιγράφονται λεπτομερώς στο Pocock (1983). Το μέγεθος του δείγματος σε μελέτες που στοχεύουν στην απόδειξη της ισοδυναμίας του φαρμάκου είναι μεγαλύτερο από ό,τι σε μελέτες που στοχεύουν στον εντοπισμό διαφορών στην αποτελεσματικότητα. Είναι επιτακτική ανάγκη να διασφαλιστεί ότι οι υπολογισμοί του μεγέθους του δείγματος σχετίζονται με τους στόχους και τους στόχους της μελέτης και βασίζονται σε δεδομένα για τη μεταβλητή του πρωτογενούς αποτελέσματος.

Τα μεγέθη δειγμάτων θα πρέπει επίσης να είναι επαρκή για τις μεθόδους ανάλυσης που χρησιμοποιούνται στη μελέτη, καθώς τόσο το μέγεθος του δείγματος όσο και η ανάλυση εξαρτώνται από τον επιλεγμένο σχεδιασμό της μελέτης. Είναι σημαντικό να διασφαλιστεί ότι οι προβλεπόμενες μέθοδοι ανάλυσης και οι υπολογισμοί μεγέθους δείγματος είναι συμβατοί μεταξύ τους.

Παραδείγματα υπολογισμού μεγέθους δείγματος.

Εάν η επιδιωκόμενη μελέτη απαιτεί μια ενιαία εκτίμηση συχνότητας, σύγκριση δύο μέσων ή σύγκριση δύο συχνοτήτων, οι υπολογισμοί του μεγέθους του δείγματος είναι (συνήθως) σχετικά απλοί και επομένως παρουσιάζονται παρακάτω. Ωστόσο, σας συνιστούμε να συμβουλεύεστε πάντα έναν στατιστικολόγο σχετικά με τους υπολογισμούς του μεγέθους του δείγματος.

Εκτίμηση μιας μεμονωμένης συχνότητας

Σημείωση: Ο παρακάτω τύπος βασίζεται στο λεγόμενο. "κατά προσέγγιση κανονική κατανομή" και, εκτός εάν σχεδιάζεται να δημιουργηθεί ένα πολύ μεγάλο δείγμα, δεν συνιστάται η εκτίμηση συχνοτήτων κοντά στο 0 ή 1 (0: ή 100%. Σε τέτοιες περιπτώσεις, θα πρέπει να χρησιμοποιούνται "ακριβείς" μέθοδοι. Παρόμοια κατάστασημπορεί να παρατηρηθεί κατά τη μελέτη της ευαισθησίας και της ειδικότητας μιας νέας διαγνωστικής μεθόδου, όπου αναμένεται η παρουσία συχνοτήτων κοντά στο 1 (100%). ΣΤΟ αυτή η υπόθεσηθα πρέπει να συμβουλευτείτε έναν στατιστικολόγο ή τουλάχιστον να χρησιμοποιηθούν εξειδικευμένα προγράμματα υπολογιστή.

Σενάριο: Χρησιμοποιήστε ένα ερωτηματολόγιο αλληλογραφίας για να αξιολογήσετε τον επιπολασμό των αναπνευστικών προβλημάτων σε ασθενείς με βρογχικό άσθμα υπό ιατρική επίβλεψη. γενική πρακτική(Thomas et al., 2001)

Απαιτούμενες πληροφορίες:

  • Πρωταρχική μεταβλητή έκβασης = παρουσία ή απουσία αναπνευστικής ανεπάρκειας
  • Εκτιμώμενη συχνότητα παραβάσεων = 30% (0,3)
  • Απαιτούμενο πλάτος διαστήματος εμπιστοσύνης 95% = 10% (δηλαδή +/-5% ή 25% έως 35%)

Ο τύπος για την εκτίμηση του μεγέθους του δείγματος μιας μεμονωμένης συχνότητας είναι:

n=15,4*p*(1-p)/W2

όπου n είναι το απαιτούμενο μέγεθος δείγματος, p είναι η αναμενόμενη συχνότητα του αποτελέσματος (στην περίπτωση αυτή 0,3) και W είναι το πλάτος του διαστήματος εμπιστοσύνης (στην περίπτωση αυτή 0,1)

Αντικαθιστώντας τις τιμές στον τύπο, παίρνουμε:

n=15,4*0,3*(1-0,3)/0,1 2 =324

"Για να επιτευχθεί ένα διάστημα εμπιστοσύνης +/-5% γύρω από μια εκτίμηση επιπολασμού 30%, θα απαιτηθεί ένα δείγμα 324 ατόμων. Δεδομένου του ποσοστού ανταπόκρισης 70% στην προσφορά συμμετοχής στη μελέτη, θα διανεμηθούν 480 ερωτηματολόγια".

Σύγκριση δύο συχνοτήτων

Σενάριο: Σχεδιάζεται μια τυχαιοποιημένη, ελεγχόμενη με εικονικό φάρμακο δοκιμή της αποτελεσματικότητας του παράγοντα διέγερσης αποικιών στη μείωση του κινδύνου σήψης σε πρόωρα βρέφη. Μια προηγούμενη μελέτη έδειξε ότι η συχνότητα της σήψης σε αυτά τα παιδιά είναι 50% εντός 2 εβδομάδων μετά τη γέννηση και οι ερευνητές πιστεύουν ότι η μείωση αυτής της συχνότητας στο 34% θα ήταν κλινικά σημαντική.

Απαιτούμενες πληροφορίες:

  • Πρωταρχική μεταβλητή έκβασης = παρουσία ή απουσία σήψης σε νεογνά 14 ημέρες μετά τη γέννηση (η θεραπεία χορηγείται το πολύ 72 ώρες μετά τη γέννηση). Αυτή είναι μια ποιοτική μεταβλητή που αντιπροσωπεύεται από συχνότητες.
  • Σημαντική διαφορά = 16% ή 0,16 (δηλ. 50%-34%)
  • Επίπεδο σημαντικότητας=5%
  • Ισχύς = 80%
  • Δοκιμή = διπλής όψης

Ο τύπος για τον υπολογισμό του μεγέθους του δείγματος κατά τη σύγκριση δύο συχνοτήτων είναι:

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

όπου n=μέγεθος δείγματος για κάθε ομάδα ( συνολικό μέγεθοςδιπλάσια δείγματα)

p 1 = πρώτη συχνότητα - σε αυτήν την περίπτωση 0,50

p 2 = δεύτερη συχνότητα - σε αυτήν την περίπτωση 0,34

p 1 -p 2 = κλινικά σημαντική διαφορά, σε αυτήν την περίπτωση 0,16

Πίνακας τιμών για τα Α και Β

Επίπεδο σημασίας

Εξουσία

Αντικαθιστώντας τις τιμές στον τύπο, παίρνουμε:

n= 2 *[(0,5*0,5+(0,34*0,66)]/ 2 =146

Έτσι, παίρνουμε τον αριθμό των παρατηρήσεων που απαιτούνται για να συμπεριληφθούν σε κάθε μία από τις ομάδες. Συνολικός πληθυσμόςτο δείγμα θα είναι διπλάσιο, δηλ. 292 παιδιά

Μια περιγραφή των αποτελεσμάτων του υπολογισμού του μεγέθους του δείγματος μπορεί να μοιάζει με αυτό:

"Ένα δείγμα 292 νεογνών (146 στις ομάδες θεραπείας και εικονικού φαρμάκου) θα ήταν αρκετό για να ανιχνεύσει διαφορά στο ποσοστό σήψης 16% με ισχύ 80% στο επίπεδο εμπιστοσύνης 5%. Η διαφορά 16% ισούται με τη διαφορά μεταξύ της σήψης 50% ποσοστό την ημέρα 14 στην ομάδα εικονικού φαρμάκου και 34% στην ομάδα θεραπείας."

Σύγκριση δύο μέσων

Σημείωση: Οι παρακάτω υπολογισμοί ισχύουν μόνο όταν οι δύο ομάδες έχουν το ίδιο μέγεθος.

Σενάριο: Σχεδιάζεται μια τυχαιοποιημένη ελεγχόμενη δοκιμή που συγκρίνει τη βραχυπρόθεσμη ψυχολογική θεραπεία με τη συμβατική θεραπεία για την καταπολέμηση των τάσεων αυτοκτονίας σε ασθενείς που νοσηλεύονται μετά από απόπειρα αυτοκτονίας. Οι τάσεις αυτοκτονίας μετρώνται χρησιμοποιώντας την κλίμακα Beck. Η τυπική απόκλιση για τις βαθμολογίες σε αυτήν την κλίμακα είναι 7,7 (δεδομένα από προηγούμενες μελέτες) και οι διαφορές 5 βαθμών στην κλίμακα Beck θεωρούνται κλινικά σημαντικές. Έως και το ένα τρίτο των ασθενών αναμένεται να εγκαταλείψουν την ομάδα θεραπείας (Guthrie et al., 2001)

Απαραίτητες πληροφορίες:

  • Μεταβλητή κύριας έκβασης = Κλίμακα αυτοκτονίας Beck. Συνεχής μεταβλητή που περιγράφεται με μέσα
  • Τυπική απόκλιση=7,7 βαθμοί
  • Μέγεθος κλινικά σημαντικού αποτελέσματος = 5 βαθμοί
  • Επίπεδο σημαντικότητας=5%
  • Ισχύς = 80%
  • Δοκιμή = διπλής όψης

Ο τύπος για τον υπολογισμό του μεγέθους του δείγματος κατά τη σύγκριση δύο μέσων έχει ως εξής:

n= 2 *2*SD 2 /DIFF 2

όπου n=μέγεθος δείγματος για κάθε ομάδα (το συνολικό μέγεθος δείγματος είναι διπλάσιο)

SD= τυπική απόκλιση για την κύρια μεταβλητή έκβασης, σε αυτήν την περίπτωση 7.7

DIFF=κλινικά σημαντικό αποτέλεσμα, σε αυτήν την περίπτωση 5.0

A - εξαρτάται από το επίπεδο σημαντικότητας (βλ. πίνακα) - σε αυτήν την περίπτωση 1,96

B - εξαρτάται από την ισχύ (βλ. πίνακα) - σε αυτήν την περίπτωση 0,84

Πίνακας τιμών για τα Α και Β

Επίπεδο σημασίας

Εξουσία

Αντικατάσταση απαιτούμενες τιμέςστον τύπο παίρνουμε:

n= 2 *2*7,7 2 /5,0 2 =38

Έτσι, παίρνουμε τον αριθμό των παρατηρήσεων που απαιτούνται για να συμπεριληφθούν σε κάθε μία από τις ομάδες. Το συνολικό μέγεθος του δείγματος θα είναι διπλάσιο, δηλ. 76 άτομα.

Μια επαρκής περιγραφή της εκτίμησης του μεγέθους του δείγματος θα ήταν η εξής:

"Για να ανιχνευθεί μια διαφορά 5 σημείων στην Κλίμακα Αυτοκτονικής Τάσης Beck στο επίπεδο σημαντικότητας 5% με ισχύ 80%, υποθέτοντας μια τυπική απόκλιση 7,7 βαθμών, θα χρειαζόταν 38 άτομα στην ομάδα παρέμβασης και ελέγχου. Αυτός ο αριθμός αυξήθηκε σε 60 στην ομάδα ( σύνολοπαρατηρήσεις 120), προκειμένου να αντισταθμιστεί η απώλεια στην παρατήρηση, η οποία είναι συνήθως περίπου το ένα τρίτο των υποκειμένων "

Απαιτούνται παραδείγματα ανεπαρκών περιγραφών των εκτιμώμενων μεγεθών δειγμάτων

Παράδειγμα 1

"Η προηγούμενη μελέτη σε αυτόν τον τομέα χρησιμοποίησε ένα δείγμα 150 ατόμων και έλαβε εξαιρετικά αξιόπιστα αποτελέσματα (p = 0,014), επομένως παρόμοιος αριθμός ασθενών περιλαμβάνεται σε αυτή τη μελέτη."

Προηγούμενες μελέτες μπορεί να ήταν απλώς «τυχερές» με την έννοια ότι τα σημαντικά αποτελέσματα που βρήκαν οφείλονται σε τυχαία διακύμανση των μέσων του δείγματος. Το μέγεθος του δείγματος πρέπει να υπολογιστεί αυτή η μελέτη- συμπεριλαμβανομένων λεπτομερειών όπως η ισχύς της μελέτης, το επίπεδο σημαντικότητας, η κύρια μεταβλητή που μελετήθηκε, το κλινικά σημαντικό μέγεθος επίδρασης, η τυπική απόκλιση (για ποσοτικές μεταβλητές) και το μέγεθος κάθε ομάδας εάν υπάρχουν πολλές ομάδες στη μελέτη

Παράδειγμα 2

«Το μέγεθος του δείγματος δεν υπολογίστηκε επειδή δεν υπήρχαν προκαταρκτικές πληροφορίες για την εκτίμηση του»

Η βιβλιογραφία θα πρέπει να αναθεωρηθεί προσεκτικά για να βρεθούν οι πληροφορίες που απαιτούνται για τον υπολογισμό του μεγέθους του δείγματος. Εάν αυτές οι πληροφορίες δεν είναι διαθέσιμες, μπορεί να οργανωθεί μια μικρή προκαταρκτική μελέτη για τη συλλογή αυτών των πληροφοριών.

Εάν δεν υπάρχουν πληροφορίες για την αξία τυπική απόκλιση, οι υπολογισμοί μεγέθους δείγματος μπορούν να δοθούν σε περισσότερα γενική εικόνα, για παράδειγμα, διαφορές που είναι κλινικά αποτελεσματικές μπορεί να μην περιγράφονται στο απόλυτες τιμές, αλλά σε μονάδες τυπικής απόκλισης.

Ωστόσο, εάν συντάσσεται μια πρόταση επιχορήγησης για τη χρηματοδότηση μιας πιλοτικής μελέτης για τη συλλογή πληροφοριών που απαιτούνται για τον υπολογισμό του μεγέθους του δείγματος μιας επόμενης μεγάλης μελέτης, τότε ο υπολογισμός του μεγέθους του δείγματος δεν πραγματοποιείται σε μια τέτοια πρόταση.

"Η κλινική δέχεται 50 ασθενείς με αυτή τη νόσο κατά τη διάρκεια του έτους. Περίπου το 10% από αυτούς ενδέχεται να αρνηθούν να συμμετάσχουν στη μελέτη. Επομένως, εντός δύο ετών θα είναι δυνατή η πρόσληψη δείγματος 90 ατόμων"

Αν και οι περισσότερες μελέτες πρέπει να εξισορροπούν το σχεδιασμό τους με την ισχύ, το μέγεθος του δείγματος δεν θα πρέπει να καθορίζεται αποκλειστικά με βάση τον αριθμό των ασθενών που είναι διαθέσιμοι για τη μελέτη.

Σε περιπτώσεις όπου ο αριθμός των ασθενών είναι περιοριστικός παράγοντας στο μέγεθος του δείγματος, θα πρέπει να γίνονται υπολογισμοί για να καθοριστεί α) η ισχύς μιας μελέτης με δεδομένο αριθμό ασθενών σε σχέση με κλινικά σημαντικές διαφορές ή β) το μέγεθος της επίδρασης που μπορεί να βρεθεί σε μια μελέτη δεδομένου μεγέθους.(λαμβάνοντας υπόψη τη δύναμή του).

Σε περιπτώσεις όπου ο διαθέσιμος αριθμός ασθενών είναι πολύ μικρός για να ανιχνευθούν κλινικά σχετικές διαφορές, μπορεί να εξεταστεί η παράταση της διάρκειας της μελέτης ή η διεξαγωγή μιας συλλογικής πολυκεντρικής δοκιμής με πολλούς ερευνητές.

Βιβλιογραφία

  1. Altman D.G. (1991) Practical Statistics for Medical Research. Chapman and Hall, Λονδίνο.
  2. Armitage P, Berry G, Matthews JNS. (2002) Statistical Methods in Medical Research, 4th ed. Blackwell, Οξφόρδη.
  3. Bland JM και Altman DG. (1994). Δοκιμές σημασίας μιας και δύο όψεων. British Medical Journal 309 248.
  4. Bland M. (2000) An Introduction to Medical Statistics, 3rd. εκδ. Oxford University Press, Οξφόρδη.
  5. Elashoff JD. (2000) nQuery Advisor Έκδοση 4.0 Οδηγός χρήστη Λος Άντζελες, Καλιφόρνια.
  6. Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) Τυχαιοποιημένη ελεγχόμενη δοκιμή σύντομης ψυχολογικής παρέμβασης μετά εσκεμμένη αυτοδηλητηρίαση. British Medical Journal 323, 135-138.
  7. Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (1996) Επάρκεια μεγέθους δείγματος σε μελέτες υγείας. John Wiley & Sons, Chichester.
  8. Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) Statistical Tables for the Design of Clinical Studies, Second Edition Blackwell, Oxford.
  9. Pocock SJ. (1983) Clinical Trials: A Practical Approach. John Wiley and Sons, Chichester.
  10. Thomas M, McKinley RK, Freeman E, Foy C. (2001) Επικράτηση της δυσλειτουργικής αναπνοής σε ασθενείς που έλαβαν θεραπεία για άσθμα στην πρωτοβάθμια περίθαλψη: διατομική έρευνα. British Medical Journal 322, 1098-1100.
  11. Whitehead, J. (1997) The Design and Analysis of Sequential Clinical Trials, αναθεωρημένη 2η. εκδ. Chichester, Wiley.
ΑΠΟΛΟΓΙΣΜΟΙ

Πληθυσμός

Ο συνολικός αριθμός των αντικειμένων παρατήρησης (άτομα, νοικοκυριά, επιχειρήσεις, οικισμοίκ.λπ.), τα οποία έχουν ένα ορισμένο σύνολο χαρακτηριστικών (φύλο, ηλικία, εισόδημα, αριθμό, κύκλο εργασιών κ.λπ.), περιορισμένα σε χώρο και χρόνο. Παραδείγματα πληθυσμών: - Όλοι οι κάτοικοι της Μόσχας (10,6 εκατομμύρια άνθρωποι σύμφωνα με την απογραφή του 2002) - Άνδρες Μοσχοβίτες (4,9 εκατομμύρια άνθρωποι σύμφωνα με την απογραφή του 2002) - Νομικά πρόσωπαΡωσία (2,2 εκατομμύρια στις αρχές του 2005) - Καταστήματα λιανικής πώλησης προϊόντων διατροφής (20 χιλιάδες στις αρχές του 2008) κ.λπ.

Δείγμα (πληθυσμός δείγματος)

Μέρος των αντικειμένων από τον πληθυσμό επιλέχτηκε για μελέτη προκειμένου να εξαχθεί ένα συμπέρασμα για το σύνολο του πληθυσμού. Προκειμένου το συμπέρασμα που προκύπτει από τη μελέτη του δείγματος να επεκταθεί σε ολόκληρο τον πληθυσμό, το δείγμα πρέπει να έχει την ιδιότητα να είναι αντιπροσωπευτικό.

Αντιπροσωπευτικότητα δείγματος

Η ιδιότητα του δείγματος να αντικατοπτρίζει σωστά τον γενικό πληθυσμό. Το ίδιο δείγμα μπορεί να είναι ή να μην είναι αντιπροσωπευτικό διαφορετικών πληθυσμών Παράδειγμα: - Ένα δείγμα που αποτελείται εξ ολοκλήρου από Μοσχοβίτες που διαθέτουν αυτοκίνητο δεν αντιπροσωπεύει ολόκληρο τον πληθυσμό της Μόσχας. - Ένα δείγμα ρωσικών επιχειρήσεων έως 100 ατόμων δεν αντιπροσωπεύει όλες τις επιχειρήσεις στη Ρωσία - Ένα δείγμα Μοσχοβιτών που πραγματοποιούν αγορές στην αγορά δεν αντιπροσωπεύει την αγοραστική συμπεριφορά όλων των Μοσχοβιτών. Ταυτόχρονα, αυτά τα δείγματα (με την επιφύλαξη άλλων συνθήκες) μπορεί να αντιπροσωπεύει τέλεια τους Μοσχοβίτες - ιδιοκτήτες αυτοκινήτων, μικρές και μεσαίες ρωσικές επιχειρήσεις και αγοραστές που ψωνίζουν στις αγορές, αντίστοιχα. Είναι σημαντικό να κατανοήσουμε ότι η αντιπροσωπευτικότητα του δείγματος και το σφάλμα δειγματοληψίας είναι διαφορετικά φαινόμενα. Η αντιπροσωπευτικότητα, σε αντίθεση με το σφάλμα, δεν εξαρτάται με κανέναν τρόπο από το μέγεθος του δείγματος Παράδειγμα: Ανεξάρτητα από το πόσο αυξάνουμε τον αριθμό των ερωτηθέντων Μοσχοβιτών-ιδιοκτητών αυτοκινήτων, δεν θα μπορούμε να εκπροσωπήσουμε όλους τους Μοσχοβίτες με αυτό το δείγμα.

Σφάλμα δειγματοληψίας (διάστημα εμπιστοσύνης)

Απόρριψη των αποτελεσμάτων που λαμβάνονται χρησιμοποιώντας επιλεκτική παρατήρησηαπό τα αληθινά δεδομένα του γενικού πληθυσμού Υπάρχουν δύο είδη δειγματοληπτικών σφαλμάτων - στατιστικό και συστηματικό. Το στατιστικό σφάλμα εξαρτάται από το μέγεθος του δείγματος. Όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο χαμηλότερο είναι Παράδειγμα: Για ένα απλό τυχαίο δείγμαμε μέγεθος 400 μονάδων, το μέγιστο στατιστικό σφάλμα (με πιθανότητα εμπιστοσύνης 95%) είναι 5%, για δείγμα 600 μονάδων - 4%, για δείγμα 1100 μονάδων - 3% από διάφορους παράγοντεςπου έχουν μόνιμη επίδραση στη μελέτη και προκατέχουν τα αποτελέσματα της μελέτης προς μια συγκεκριμένη κατεύθυνση. ενεργή εικόναΖΩΗ. Αυτό συμβαίνει λόγω του γεγονότος ότι είναι πολύ πιο δύσκολο να βρεθούν τέτοια άτομα σε οποιοδήποτε συγκεκριμένο μέρος (για παράδειγμα, στο σπίτι). 80%) Σε ορισμένες περιπτώσεις, όταν είναι γνωστές οι πραγματικές κατανομές, συστηματικό λάθοςμπορεί να ισοπεδωθεί με την εισαγωγή ποσοστώσεων ή την εκ νέου στάθμιση των δεδομένων, αλλά στις περισσότερες πραγματικές μελέτες, ακόμη και η αξιολόγησή τους μπορεί να είναι αρκετά προβληματική.

Τύποι δειγμάτων

Τα δείγματα χωρίζονται σε δύο τύπους:
- πιθανολογικό
- απιθανότητα

1. Δείγματα πιθανοτήτων
1.1 Τυχαία δειγματοληψία (απλή τυχαία επιλογή)
Ένα τέτοιο δείγμα προϋποθέτει την ομοιογένεια του γενικού πληθυσμού, την ίδια πιθανότητα διαθεσιμότητας όλων των στοιχείων, την παρουσία πλήρης λίσταόλα τα στοιχεία. Κατά την επιλογή στοιχείων, κατά κανόνα, χρησιμοποιείται ένας πίνακας τυχαίων αριθμών.
1.2 Μηχανική (συστηματική) δειγματοληψία
Ένα είδος τυχαίου δείγματος, ταξινομημένο κατά κάποιο χαρακτηριστικό (αλφαβητική σειρά, αριθμός τηλεφώνου, ημερομηνία γέννησης κ.λπ.). Το πρώτο στοιχείο επιλέγεται τυχαία και, στη συνέχεια, κάθε 'k' στοιχείο επιλέγεται σε προσαυξήσεις του 'n'. Το μέγεθος του γενικού πληθυσμού, ενώ - N=n*k
1.3 Στρωματοποιημένο (ζωνικό)
Χρησιμοποιείται σε περίπτωση ετερογένειας του γενικού πληθυσμού. Πληθυσμόςχωρισμένοι σε ομάδες (στρώματα). Σε κάθε στρώμα, η επιλογή πραγματοποιείται τυχαία ή μηχανικά.
1.4 Σειριακή (ένθετη ή ομαδοποιημένη) δειγματοληψία
Στο σειριακή δειγματοληψίαοι μονάδες επιλογής δεν είναι τα ίδια τα αντικείμενα, αλλά οι ομάδες (συστάδες ή φωλιές). Οι ομάδες επιλέγονται τυχαία. Τα αντικείμενα εντός των ομάδων ερευνώνται παντού.

2. Απίστευτα δείγματα
Η επιλογή σε ένα τέτοιο δείγμα πραγματοποιείται όχι σύμφωνα με τις αρχές της τύχης, αλλά με υποκειμενικά κριτήρια - προσβασιμότητα, τυπικότητα, ίση εκπροσώπηση κ.λπ.
2.1. Δειγματοληψία ποσοστώσεων
Αρχικά, κατανέμεται ένας ορισμένος αριθμός ομάδων αντικειμένων (για παράδειγμα, άνδρες ηλικίας 20-30 ετών, 31-45 ετών και 46-60 ετών· άτομα με εισόδημα έως 30 χιλιάδες ρούβλια, με εισόδημα από 30 έως 60 χιλιάδες ρούβλια και με εισόδημα άνω των 60 χιλιάδων ρούβλια ) Για κάθε ομάδα, προσδιορίζεται ο αριθμός των αντικειμένων που πρόκειται να ερευνηθούν. Ο αριθμός των αντικειμένων που πρέπει να εμπίπτουν σε καθεμία από τις ομάδες ορίζεται, τις περισσότερες φορές, είτε σε αναλογία με το προηγουμένως γνωστό μερίδιο της ομάδας στον γενικό πληθυσμό, είτε ο ίδιος για κάθε ομάδα. Μέσα στις ομάδες, τα αντικείμενα επιλέγονται τυχαία. Τα δείγματα ποσοστώσεων χρησιμοποιούνται αρκετά συχνά στην έρευνα μάρκετινγκ.
2.2. Μέθοδος χιονοστιβάδας
Το δείγμα κατασκευάζεται ως εξής. Κάθε ερωτώμενος, ξεκινώντας από τον πρώτο, καλείται να επικοινωνήσει με τους φίλους, τους συναδέλφους, τους γνωστούς του που θα ταίριαζαν στις συνθήκες επιλογής και θα μπορούσαν να λάβουν μέρος στη μελέτη. Έτσι, με εξαίρεση το πρώτο βήμα, το δείγμα διαμορφώνεται με τη συμμετοχή των ίδιων των αντικειμένων μελέτης. Η μέθοδος χρησιμοποιείται συχνά όταν είναι απαραίτητο να βρεθούν και να συνεντεύξεις δυσπρόσιτες ομάδες ερωτηθέντων (για παράδειγμα, ερωτηθέντες με υψηλό εισόδημα, ερωτηθέντες που ανήκουν στην ίδια επαγγελματική ομάδα, ερωτηθέντες που έχουν κάποια παρόμοια χόμπι / πάθη κ.λπ. )
2.3 Αυθόρμητη δειγματοληψία
Οι πιο προσιτοί ερωτηθέντες ερωτήθηκαν. Χαρακτηριστικά παραδείγματααυθόρμητα δείγματα - έρευνες σε εφημερίδες / περιοδικά, ερωτηματολόγια που δίνονται στους ερωτηθέντες για αυτοσυμπλήρωση, οι περισσότερες έρευνες στο Διαδίκτυο. Το μέγεθος και η σύνθεση των αυθόρμητων δειγμάτων δεν είναι γνωστά εκ των προτέρων και καθορίζεται από μία μόνο παράμετρο - τη δραστηριότητα των ερωτηθέντων.
2.4 Δείγμα τυπικών περιπτώσεων
Επιλέγονται μονάδες του γενικού πληθυσμού που έχουν μια μέση (τυπική) τιμή του χαρακτηριστικού. Αυτό εγείρει το πρόβλημα της επιλογής ενός χαρακτηριστικού και του προσδιορισμού της τυπικής του τιμής.

Υπολογιστής σφαλμάτων και μεγέθους δείγματος

(για ένα απλό τυχαίο δείγμα)

Επεξηγήσεις για τα πεδία:

Πιθανότητα εμπιστοσύνης
Η πιθανότητα το διάστημα εμπιστοσύνης να καλύπτει το άγνωστο πραγματική αξίαπαράμετρος που υπολογίζεται από δείγματα δεδομένων. Στην ερευνητική πρακτική, το επίπεδο εμπιστοσύνης 95% χρησιμοποιείται συχνότερα.

Σφάλμα δειγματοληψίας (διάστημα εμπιστοσύνης)
Ένα διάστημα που υπολογίζεται από δεδομένα δείγματος που, με δεδομένη πιθανότητα (εμπιστοσύνη), καλύπτει την άγνωστη πραγματική τιμή της εκτιμώμενης παραμέτρου κατανομής.

Κοινή χρήση δυνατοτήτων

Το αναμενόμενο μερίδιο του χαρακτηριστικού για το οποίο υπολογίζεται το σφάλμα. Εάν δεν υπάρχουν δεδομένα σχετικά με το μερίδιο του χαρακτηριστικού, είναι απαραίτητο να χρησιμοποιηθεί μια τιμή ίση με 50, στην οποία επιτυγχάνεται το μέγιστο σφάλμα.

Ένα από τα κύρια συστατικά μιας καλά σχεδιασμένης μελέτης είναι ο ορισμός του δείγματος και του τι είναι αντιπροσωπευτικό δείγμα. Είναι σαν το παράδειγμα της τούρτας. Τελικά, δεν είναι απαραίτητο να φάμε ολόκληρο το γλυκό για να καταλάβουμε τη γεύση του; Ένα μικρό μέρος είναι αρκετό.

Λοιπόν, η τούρτα είναι πληθυσμός (δηλαδή όλοι οι ερωτηθέντες που πληρούν τις προϋποθέσεις για την έρευνα). Μπορεί να εκφραστεί εδαφικά, για παράδειγμα, μόνο κάτοικοι της περιοχής της Μόσχας. Φύλο - μόνο γυναίκες. Ή έχουν περιορισμούς ηλικίας - οι Ρώσοι είναι άνω των 65 ετών.

Είναι δύσκολο να υπολογίσετε τον πληθυσμό: πρέπει να έχετε στοιχεία από την απογραφή του πληθυσμού ή τις προκαταρκτικές έρευνες αξιολόγησης. Επομένως, συνήθως ο γενικός πληθυσμός «εκτιμάται» και υπολογίζεται από τον αριθμό που προκύπτει πλαίσιο δειγματοληψίας ή δειγματοληψία.

Τι είναι ένα αντιπροσωπευτικό δείγμα;

Δείγμαείναι ένας καλά καθορισμένος αριθμός ερωτηθέντων. Η δομή του θα πρέπει να συμπίπτει όσο το δυνατόν περισσότερο με τη δομή του γενικού πληθυσμού ως προς τα κύρια χαρακτηριστικά της επιλογής.

Για παράδειγμα, εάν οι πιθανοί ερωτηθέντες είναι ολόκληρος ο πληθυσμός της Ρωσίας, όπου το 54% είναι γυναίκες και το 46% είναι άνδρες, τότε το δείγμα θα πρέπει να περιέχει ακριβώς το ίδιο ποσοστό. Εάν οι παράμετροι ταιριάζουν, τότε το δείγμα μπορεί να ονομαστεί αντιπροσωπευτικό. Αυτό σημαίνει ότι ελαχιστοποιούνται οι ανακρίβειες και τα λάθη στη μελέτη.

Το μέγεθος του δείγματος προσδιορίζεται λαμβάνοντας υπόψη τις απαιτήσεις ακρίβειας και οικονομίας. Αυτές οι απαιτήσεις είναι αντιστρόφως ανάλογες μεταξύ τους: όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο ακριβέστερα το αποτέλεσμα. Επιπλέον, όσο μεγαλύτερη είναι η ακρίβεια, τόσο μεγαλύτερο είναι το κόστος της μελέτης. Και αντίστροφα, όσο μικρότερο είναι το δείγμα, τόσο λιγότερο κοστίζει, τόσο λιγότερο ακριβή και πιο τυχαία αναπαράγονται οι ιδιότητες του γενικού πληθυσμού.

Επομένως, για να υπολογίσουν το μέγεθος της επιλογής, οι κοινωνιολόγοι επινόησαν έναν τύπο και δημιούργησαν ειδική αριθμομηχανή:

Πιθανότητα εμπιστοσύνηςκαι σφάλμα εμπιστοσύνης

Τι κάνουν οι όροι" επίπεδο αυτοπεποίθησης" και " σφάλμα εμπιστοσύνης"; Το επίπεδο εμπιστοσύνης είναι ένα μέτρο της ακρίβειας των μετρήσεων. Και το λάθος εμπιστοσύνης είναι πιθανό σφάλμαερευνητικά αποτελέσματα. Για παράδειγμα, με γενικό πληθυσμό άνω των 500,00 ατόμων (για παράδειγμα, που ζουν στο Novokuznetsk), το δείγμα θα είναι 384 άτομα με επίπεδο αυτοπεποίθησης 95% και σφάλματα 5% Ή (με διάστημα εμπιστοσύνης 95±5%).

Τι προκύπτει από αυτό; Κατά τη διεξαγωγή 100 μελετών με ένα τέτοιο δείγμα (384 άτομα), στο 95 τοις εκατό των περιπτώσεων, οι απαντήσεις που λαμβάνονται, σύμφωνα με τους νόμους της στατιστικής, θα είναι εντός ± 5% από την αρχική. Και θα πάρουμε αντιπροσωπευτικό δείγμαμε ελάχιστη πιθανότητα στατιστικού λάθους.

Αφού ολοκληρωθεί ο υπολογισμός του μεγέθους του δείγματος, μπορείτε να δείτε αν υπάρχουν αρκετοί ερωτηθέντες στην δοκιμαστική έκδοση του πίνακα ερωτηματολογίου. Μπορείτε να μάθετε περισσότερα σχετικά με τον τρόπο διεξαγωγής μιας έρευνας σε πάνελ.

Όταν κάνετε την ερώτηση, "Πόσους ερωτηθέντες χρειάζομαι για μια έρευνα;", ρωτάτε πραγματικά, "Πόσο μεγάλο πρέπει να είναι το δείγμα μου για να εκτιμήσω με ακρίβεια τον πληθυσμό μου;" Δεδομένης της πολυπλοκότητας αυτών των εννοιών, αναλύσαμε τη διαδικασία σε 5 βήματα, καθιστώντας σας εύκολο να υπολογίσετε το ιδανικό μέγεθος δείγματος και να διασφαλίσετε την ακρίβεια των αποτελεσμάτων της έρευνάς σας.

5 βήματα για να βεβαιωθείτε ότι το δείγμα σας εκτιμά με ακρίβεια τον πληθυσμό:

Βήμα 1

Ποιος είναι ο γενικός πληθυσμός σας;

Με τον όρο «γενικός πληθυσμός» εννοούμε ολόκληρη την ομάδα των ανθρώπων των οποίων τη γνώμη πρόκειται να ρωτήσετε (το δείγμα θα αποτελείται από μέλη αυτού του πληθυσμού που θα λάβουν πραγματικά μέρος στην έρευνα).

Για παράδειγμα, εάν θέλετε να καταλάβετε πώς να βρείτε μια αγορά για οδοντόκρεμα στη Γαλλία, ο πληθυσμός σας θα είναι οι κάτοικοι της Γαλλίας. Και αν προσπαθείτε να προσδιορίσετε πόσες ημέρες διακοπών θα ήθελαν να έχουν οι άνθρωποι που εργάζονται σε μια εταιρεία οδοντόκρεμας, τότε ο πληθυσμός σας είναι οι υπάλληλοι αυτής της εταιρείας.

Είτε πρόκειται για χώρα είτε για εταιρεία, η δημιουργία ενός πληθυσμού είναι ένα σημαντικό πρώτο βήμα. Αφού αποφασίσετε για τον πληθυσμό, ορίστε (περίπου) το μέγεθός του. Για παράδειγμα, η Γαλλία έχει περίπου 65 εκατομμύρια ανθρώπους, αλλά μια εταιρεία οδοντόκρεμας πιθανότατα έχει πολύ λιγότερους υπαλλήλους.

Πήρατε τον σωστό αριθμό; Εντάξει, τότε πάμε παρακάτω...

Βήμα 2

Ποια είναι η απαιτούμενη ακρίβεια;

Αυτό το βήμα είναι ένα είδος αξιολόγησης του πόσο κίνδυνο είστε διατεθειμένοι να αναλάβετε σχετικά με την πιθανότητα ανακριβών απαντήσεων στην έρευνα λόγω του γεγονότος ότι δεν ερευνάτε ολόκληρο τον πληθυσμό. Επομένως, θα πρέπει να απαντήσετε σε δύο ερωτήσεις:

  1. Πόσο σίγουροι πρέπει να είστε ότι οι απαντήσεις που λαμβάνετε αντικατοπτρίζουν τις απόψεις του γενικού πληθυσμού;
    Αυτό είναι το περιθώριο λάθους σας. Ας υποθέσουμε λοιπόν ότι στο 90% του δείγματος αρέσει η τσίχλα με γεύση σταφυλιού. Ένα περιθώριο σφάλματος 5% προσθέτει 5% σε κάθε πλευρά αυτού του αριθμού, πράγμα που σημαίνει ότι στην πραγματικότητα στο 85-95% του δείγματος αρέσει η τσίχλα με γεύση σταφυλιού. Το 5% είναι το πιο συχνά χρησιμοποιούμενο περιθώριο σφάλματος, αλλά μπορείτε να το ορίσετε μεταξύ 1% και 10% ανάλογα με την έρευνα. Δεν συνιστάται η αύξηση αυτού του ποσοστού πάνω από 10%.
  2. Πόσο σίγουροι πρέπει να είστε ότι το δείγμα αντιπροσωπεύει με ακρίβεια τον πληθυσμό;

    Αυτό είναι το επίπεδο εμπιστοσύνης σας. Το επίπεδο εμπιστοσύνης είναι η πιθανότητα ότι το δείγμα είναι σημαντικό για τα αποτελέσματα που λαμβάνονται. Ο υπολογισμός γίνεται συνήθως ως εξής. Εάν επιλέγατε τυχαία 30 περισσότερα δείγματα από αυτόν τον πληθυσμό, πόσο συχνά το αποτέλεσμά σας για ένα δείγμα θα διέφερε σημαντικά από τα αποτελέσματα για τα άλλα 30 δείγματα; Ένα επίπεδο εμπιστοσύνης 95% σημαίνει ότι το 95% των φορών τα αποτελέσματα θα ταιριάζουν. Το 95% είναι η πιο συχνά χρησιμοποιούμενη τιμή, αλλά μπορείτε να την ορίσετε σε 90% ή 99% ανάλογα με τη δημοσκόπηση. Δεν συνιστάται η μείωση της τιμής του επιπέδου εμπιστοσύνης κάτω από 90%.

Βήμα 3

Τι μέγεθος δείγματος χρειάζομαι;

Στον παρακάτω πίνακα, επιλέξτε ένα κατά προσέγγιση μέγεθος πληθυσμού στόχου και ένα περιθώριο σφάλματος για τον προσδιορισμό του απαιτούμενου αριθμού ολοκληρωμένων ερευνών.

Τώρα που έχετε τις τιμές stride 1 και stride 2, χρησιμοποιήστε τον παρακάτω εύχρηστο πίνακα για να προσδιορίσετε το μέγεθος του απαιτούμενου δείγματος...

Πληθυσμός Περιθώριο σφάλματος Επίπεδο εμπιστοσύνης
10% 5% 1% 90% 95% 99%
100 50 80 99 74 80 88
500 81 218 476 176 218 286
1000 88 278 906 215 278 400
10 000 96 370 4900 264 370 623
100 000 96 383 8763 270 383 660
1 000 000+ 97 384 9513 271 384 664

Σημείωση. Τα δεδομένα παρέχονται μόνο ως κατευθυντήρια γραμμή. Επίσης, για πληθυσμούς άνω του 1 εκατομμυρίου, οι αριθμοί μπορούν να στρογγυλοποιηθούν στην πλησιέστερη εκατοντάδα.

Βήμα 4

Πόσο ανταποκρινόμενοι θα είναι οι άνθρωποι;

Δυστυχώς, δεν θα λάβουν απάντηση όλοι όσοι στέλνετε μια έρευνα.

Το ποσοστό των ατόμων που συμπληρώνουν τη φόρμα έρευνας που λαμβάνουν αναφέρεται ως "ποσοστό απόκρισης". Ο προσδιορισμός του ποσοστού των ερωτηθέντων στην έρευνά σας θα σας βοηθήσει να προσδιορίσετε συνολικός αριθμόςπεριπτώσεις της έρευνας που πρέπει να σταλούν για να λάβετε τον απαιτούμενο αριθμό απαντήσεων.

Το ποσοστό των απαντήσεων εξαρτάται άμεσα από διάφορους παράγοντες, όπως οι σχέσεις με στοχευμένο κοινό, διάρκεια και πολυπλοκότητα της έρευνας, κίνητρα που προσφέρονται και θέμα της έρευνας. Για διαδικτυακές έρευνες όπου δεν έχει δημιουργηθεί προηγουμένως σχέση με τους παραλήπτες, ποσοστόΤα ποσοστά ανταπόκρισης 20-30% θεωρούνται πολύ υψηλά. Μια πιο συντηρητική και πιθανή τιμή είναι 10-14%, εάν δεν έχετε πραγματοποιήσει προηγουμένως έρευνα σε αυτόν τον πληθυσμό.

Βήμα 5

Σε πόσα άτομα λοιπόν πρέπει να στείλετε την έρευνα;

Αυτό είναι ένα εύκολο βήμα!

Απλώς διαιρέστε τον αριθμό που πήρατε στο βήμα 3 με τον αριθμό που πήρατε στο βήμα 4. Αυτός είναι ο μαγικός σας αριθμός.

Για παράδειγμα, εάν θέλετε 100 γυναίκες που χρησιμοποιούν σαμπουάν για να ολοκληρώσουν μια έρευνα και πιστεύετε ότι το 10% των γυναικών στις οποίες στέλνετε την έρευνα θα την ολοκληρώσουν, πρέπει να στείλετε την έρευνα σε 1000 γυναίκες (100/10%)!