Βιογραφίες Χαρακτηριστικά Ανάλυση

Πώς να βρείτε το παράδειγμα τυπικής απόκλισης. Τι είναι η τυπική απόκλιση - χρησιμοποιώντας τη συνάρτηση τυπικής απόκλισης για τον υπολογισμό της τυπικής απόκλισης στο excel

Κατά τον στατιστικό έλεγχο υποθέσεων, κατά τη μέτρηση μιας γραμμικής σχέσης μεταξύ τυχαίων μεταβλητών.

Τυπική απόκλιση:

Τυπική απόκλιση(εκτίμηση της τυπικής απόκλισης της τυχαίας μεταβλητής Δάπεδο, τοίχοι γύρω μας και η οροφή, Χσε σχέση με τη μαθηματική του προσδοκία που βασίζεται σε μια αμερόληπτη εκτίμηση της διακύμανσής του):

όπου - διακύμανση; - Το πάτωμα, οι τοίχοι γύρω μας και η οροφή, Εγώ-ο δείγμα στοιχείου? - το μέγεθος του δείγματος; - αριθμητικός μέσος όρος του δείγματος:

Πρέπει να σημειωθεί ότι και οι δύο εκτιμήσεις είναι μεροληπτικές. Στη γενική περίπτωση, είναι αδύνατο να κατασκευαστεί μια αμερόληπτη εκτίμηση. Ωστόσο, μια εκτίμηση που βασίζεται σε μια αμερόληπτη εκτίμηση διακύμανσης είναι συνεπής.

κανόνας τριών σίγμα

κανόνας τριών σίγμα() - σχεδόν όλες οι τιμές μιας κανονικά κατανεμημένης τυχαίας μεταβλητής βρίσκονται στο διάστημα . Πιο αυστηρά - με βεβαιότητα τουλάχιστον 99,7%, η τιμή μιας κανονικά κατανεμημένης τυχαίας μεταβλητής βρίσκεται στο καθορισμένο διάστημα (με την προϋπόθεση ότι η τιμή είναι αληθής και δεν λαμβάνεται ως αποτέλεσμα της επεξεργασίας του δείγματος).

Εάν η πραγματική τιμή είναι άγνωστη, τότε δεν πρέπει να χρησιμοποιήσετε, αλλά το πάτωμα, τους τοίχους γύρω μας και την οροφή, μικρό. Έτσι, ο κανόνας των τριών σίγμα μεταφράζεται στον κανόνα των τριών ορόφων, των τοίχων γύρω μας και της οροφής, μικρό .

Ερμηνεία της τιμής της τυπικής απόκλισης

Μια μεγάλη τιμή της τυπικής απόκλισης δείχνει μια μεγάλη διασπορά τιμών στο παρουσιαζόμενο σύνολο με τη μέση τιμή του συνόλου. μια μικρή τιμή, αντίστοιχα, δείχνει ότι οι τιμές στο σύνολο ομαδοποιούνται γύρω από τη μέση τιμή.

Για παράδειγμα, έχουμε τρία σύνολα αριθμών: (0, 0, 14, 14), (0, 6, 8, 14) και (6, 6, 8, 8). Και τα τρία σύνολα έχουν μέσες τιμές 7 και τυπικές αποκλίσεις 7, 5 και 1, αντίστοιχα. Το τελευταίο σύνολο έχει μια μικρή τυπική απόκλιση επειδή οι τιμές στο σύνολο συγκεντρώνονται γύρω από το μέσο όρο. το πρώτο σετ έχει τη μεγαλύτερη τιμή της τυπικής απόκλισης - οι τιμές εντός του συνόλου αποκλίνουν έντονα από τη μέση τιμή.

Σε γενικές γραμμές, η τυπική απόκλιση μπορεί να θεωρηθεί ως μέτρο αβεβαιότητας. Για παράδειγμα, στη φυσική, η τυπική απόκλιση χρησιμοποιείται για τον προσδιορισμό του σφάλματος μιας σειράς διαδοχικών μετρήσεων κάποιας ποσότητας. Αυτή η τιμή είναι πολύ σημαντική για τον προσδιορισμό της αληθοφάνειας του υπό μελέτη φαινομένου σε σύγκριση με την τιμή που προβλέπεται από τη θεωρία: εάν η μέση τιμή των μετρήσεων είναι πολύ διαφορετική από τις τιμές που προβλέπονται από τη θεωρία (μεγάλη τυπική απόκλιση), τότε οι λαμβανόμενες τιμές ή η μέθοδος απόκτησής τους θα πρέπει να επανελεγχθούν.

Πρακτική χρήση

Στην πράξη, η τυπική απόκλιση σάς επιτρέπει να προσδιορίσετε πόσο οι τιμές στο σετ μπορούν να διαφέρουν από τη μέση τιμή.

Κλίμα

Ας υποθέσουμε ότι υπάρχουν δύο πόλεις με την ίδια μέση ημερήσια μέγιστη θερμοκρασία, αλλά η μία βρίσκεται στην ακτή και η άλλη στην ενδοχώρα. Οι παράκτιες πόλεις είναι γνωστό ότι έχουν πολλές διαφορετικές ημερήσιες μέγιστες θερμοκρασίες χαμηλότερες από τις πόλεις της ενδοχώρας. Επομένως, η τυπική απόκλιση των μέγιστων ημερήσιων θερμοκρασιών στην παράκτια πόλη θα είναι μικρότερη από τη δεύτερη πόλη, παρά το γεγονός ότι έχουν την ίδια μέση τιμή αυτής της τιμής, που στην πράξη σημαίνει ότι η πιθανότητα η μέγιστη θερμοκρασία του αέρα κάθε συγκεκριμένη ημέρα του έτους θα είναι ισχυρότερη διαφορετική από τη μέση τιμή, υψηλότερη για μια πόλη που βρίσκεται εντός της ηπείρου.

Αθλημα

Ας υποθέσουμε ότι υπάρχουν πολλές ποδοσφαιρικές ομάδες που κατατάσσονται σύμφωνα με ορισμένες παραμέτρους, για παράδειγμα, ο αριθμός των γκολ που σημειώθηκαν και οι δέκτες, οι ευκαιρίες για γκολ κ.λπ. Είναι πολύ πιθανό η καλύτερη ομάδα σε αυτόν τον όμιλο να έχει τις καλύτερες τιμές σε περισσότερες παραμέτρους. Όσο μικρότερη είναι η τυπική απόκλιση της ομάδας για κάθε μία από τις παραμέτρους που παρουσιάζονται, τόσο πιο προβλέψιμο είναι το αποτέλεσμα της ομάδας, τέτοιες ομάδες είναι ισορροπημένες. Από την άλλη πλευρά, μια ομάδα με μεγάλη τυπική απόκλιση δυσκολεύεται να προβλέψει το αποτέλεσμα, κάτι που με τη σειρά του εξηγείται από μια ανισορροπία, για παράδειγμα, μια δυνατή άμυνα αλλά μια αδύναμη επίθεση.

Η χρήση της τυπικής απόκλισης των παραμέτρων της ομάδας επιτρέπει σε κάποιον να προβλέψει το αποτέλεσμα του αγώνα μεταξύ δύο ομάδων σε κάποιο βαθμό, αξιολογώντας τα δυνατά και τα αδύνατα σημεία των ομάδων και ως εκ τούτου τις επιλεγμένες μεθόδους αγώνα.

Τεχνική ανάλυση

δείτε επίσης

Βιβλιογραφία

* Borovikov, V.ΣΤΑΤΙΣΤΙΚΗ. Η τέχνη της ανάλυσης δεδομένων υπολογιστή: Για επαγγελματίες / V. Borovikov. - Αγία Πετρούπολη. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Μάθημα νούμερο 4

Θέμα: «Περιγραφική στατιστική. Δείκτες της ποικιλομορφίας του χαρακτηριστικού στο σύνολο "

Τα κύρια κριτήρια για την ποικιλομορφία ενός χαρακτηριστικού στον στατιστικό πληθυσμό είναι: όριο, πλάτος, τυπική απόκλιση, συντελεστής ταλάντωσης και συντελεστής διακύμανσης. Στο προηγούμενο μάθημα, συζητήθηκε ότι οι μέσες τιμές δίνουν μόνο ένα γενικευτικό χαρακτηριστικό του υπό μελέτη χαρακτηριστικού συνολικά και δεν λαμβάνουν υπόψη τις τιμές των επιμέρους παραλλαγών του: τις ελάχιστες και μέγιστες τιμές, πάνω από τον μέσο όρο , κάτω από το μέσο όρο κ.λπ.

Παράδειγμα. Μέσες τιμές δύο διαφορετικών αριθμητικών ακολουθιών: -100; -είκοσι; 100; 20 και 0,1; -0,2; Το 0,1 είναι ακριβώς το ίδιο και ίσοΟ.Ωστόσο, οι περιοχές διασποράς δεδομένων αυτών των σχετικών μέσων αλληλουχιών είναι πολύ διαφορετικές.

Ο ορισμός των παρατιθέμενων κριτηρίων για την ποικιλομορφία ενός χαρακτηριστικού πραγματοποιείται κυρίως λαμβάνοντας υπόψη την αξία του για μεμονωμένα στοιχεία του στατιστικού πληθυσμού.

Οι δείκτες μέτρησης της παραλλαγής ενός χαρακτηριστικού είναι απόλυτοςκαι συγγενής. Οι απόλυτοι δείκτες διακύμανσης περιλαμβάνουν: το εύρος διακύμανσης, όριο, τυπική απόκλιση, διακύμανση. Ο συντελεστής διακύμανσης και ο συντελεστής ταλάντωσης αναφέρονται σε σχετικά μέτρα διακύμανσης.

Όριο (lim) –αυτό είναι ένα κριτήριο που καθορίζεται από τις ακραίες τιμές της παραλλαγής στη σειρά παραλλαγών. Με άλλα λόγια, αυτό το κριτήριο περιορίζεται από τις ελάχιστες και μέγιστες τιμές του χαρακτηριστικού:

Πλάτος (Am)ή εύρος παραλλαγής -αυτή είναι η διαφορά μεταξύ των άκρων. Ο υπολογισμός αυτού του κριτηρίου πραγματοποιείται αφαιρώντας την ελάχιστη τιμή του από τη μέγιστη τιμή του χαρακτηριστικού, γεγονός που καθιστά δυνατή την εκτίμηση του βαθμού διασποράς της παραλλαγής:

Το μειονέκτημα του ορίου και του πλάτους ως κριτηρίων μεταβλητότητας είναι ότι εξαρτώνται πλήρως από τις ακραίες τιμές του χαρακτηριστικού στη σειρά παραλλαγής. Σε αυτήν την περίπτωση, οι διακυμάνσεις στις τιμές του χαρακτηριστικού εντός της σειράς δεν λαμβάνονται υπόψη.

Ο πληρέστερος χαρακτηρισμός της ποικιλομορφίας ενός χαρακτηριστικού σε έναν στατιστικό πληθυσμό δίνεται από το τυπική απόκλιση(σίγμα), το οποίο είναι ένα γενικό μέτρο της απόκλισης μιας παραλλαγής από τη μέση τιμή της. Η τυπική απόκλιση αναφέρεται επίσης συχνά ως τυπική απόκλιση.

Η βάση της τυπικής απόκλισης είναι η σύγκριση κάθε επιλογής με τον αριθμητικό μέσο όρο αυτού του πληθυσμού. Δεδομένου ότι στο σύνολο θα υπάρχουν πάντα επιλογές τόσο λιγότερες όσο και περισσότερες από αυτό, τότε το άθροισμα των αποκλίσεων που έχουν το σύμβολο "" θα εξοφληθεί με το άθροισμα των αποκλίσεων που έχουν το σύμβολο "", δηλ. το άθροισμα όλων των αποκλίσεων είναι μηδέν. Προκειμένου να αποφευχθεί η επιρροή των σημείων των διαφορών λαμβάνονται οι αποκλίσεις της παραλλαγής από τον αριθμητικό μέσο όρο στο τετράγωνο, δηλ. . Το άθροισμα των τετραγωνικών αποκλίσεων δεν είναι ίσο με μηδέν. Για να λάβετε έναν συντελεστή ικανό να μετρήσει τη μεταβλητότητα, πάρτε τον μέσο όρο του αθροίσματος των τετραγώνων - αυτή η τιμή ονομάζεται διασπορά:

Εξ ορισμού, η διακύμανση είναι το μέσο τετράγωνο των αποκλίσεων των επιμέρους τιμών ενός χαρακτηριστικού από τη μέση τιμή του. Διασπορά τετραγωνισμένη τυπική απόκλιση.

Η διασπορά είναι μια διαστατική ποσότητα (ονομασμένη). Έτσι, εάν οι παραλλαγές της σειράς αριθμών εκφράζονται σε μέτρα, τότε η διασπορά δίνει τετραγωνικά μέτρα. εάν οι παραλλαγές εκφράζονται σε χιλιόγραμμα, τότε η διακύμανση δίνει το τετράγωνο αυτού του μέτρου (kg 2) και ούτω καθεξής.

Τυπική απόκλισηείναι η τετραγωνική ρίζα της διακύμανσης:

, τότε κατά τον υπολογισμό της διακύμανσης και της τυπικής απόκλισης στον παρονομαστή του κλάσματος, αντί γιαείναι απαραίτητο να τεθεί.

Ο υπολογισμός της τυπικής απόκλισης μπορεί να χωριστεί σε έξι στάδια, τα οποία πρέπει να πραγματοποιηθούν με μια συγκεκριμένη σειρά:

Εφαρμογή τυπικής απόκλισης:

α) να κρίνει τη διακύμανση των μεταβλητών σειρών και μια συγκριτική εκτίμηση της τυπικότητας (αντιπροσωπευτικότητας) των αριθμητικών μέσων. Αυτό είναι απαραίτητο στη διαφορική διάγνωση κατά τον προσδιορισμό της σταθερότητας των σημείων.

β) για την ανακατασκευή της μεταβλητής σειράς, δηλ. επαναφορά της απόκρισης συχνότητάς του με βάση κανόνες τριών σίγμα. Στο διάστημα (М±3σ) υπάρχει το 99,7% όλων των παραλλαγών της σειράς, στο διάστημα (М±2σ) - 95,5% και στο διάστημα (М±1σ) - Επιλογή σειράς 68,3%.(Εικ. 1).

γ) για τον προσδιορισμό των "αναδυόμενων" επιλογών

δ) για τον προσδιορισμό των παραμέτρων του κανόνα και της παθολογίας χρησιμοποιώντας εκτιμήσεις σίγμα

ε) να υπολογιστεί ο συντελεστής διακύμανσης

ε) να υπολογίσετε το μέσο σφάλμα του αριθμητικού μέσου όρου.

Να χαρακτηρίσει κάθε γενικό πληθυσμό που έχειτύπος κανονικής κατανομής , αρκεί να γνωρίζουμε δύο παραμέτρους: τον αριθμητικό μέσο όρο και την τυπική απόκλιση.

Εικόνα 1. Κανόνας Τριών Σίγμα

Παράδειγμα.

Στην παιδιατρική, η τυπική απόκλιση χρησιμοποιείται για την αξιολόγηση της σωματικής ανάπτυξης των παιδιών συγκρίνοντας τα δεδομένα ενός συγκεκριμένου παιδιού με τους αντίστοιχους τυπικούς δείκτες. Ως πρότυπο λαμβάνονται οι αριθμητικοί μέσοι δείκτες της σωματικής ανάπτυξης υγιών παιδιών. Η σύγκριση των δεικτών με τα πρότυπα πραγματοποιείται σύμφωνα με ειδικούς πίνακες, στους οποίους δίνονται τα πρότυπα μαζί με τις αντίστοιχες κλίμακες σίγμα. Πιστεύεται ότι εάν ο δείκτης της φυσικής ανάπτυξης του παιδιού είναι εντός του προτύπου (αριθμητικός μέσος όρος) ±σ, τότε η σωματική ανάπτυξη του παιδιού (σύμφωνα με αυτόν τον δείκτη) αντιστοιχεί στον κανόνα. Εάν ο δείκτης είναι εντός του προτύπου ±2σ, τότε υπάρχει μια μικρή απόκλιση από τον κανόνα. Εάν ο δείκτης υπερβαίνει αυτά τα όρια, τότε η φυσική ανάπτυξη του παιδιού διαφέρει απότομα από τον κανόνα (η παθολογία είναι δυνατή).

Εκτός από τους δείκτες διακύμανσης που εκφράζονται σε απόλυτες τιμές, η στατιστική έρευνα χρησιμοποιεί δείκτες διακύμανσης που εκφράζονται σε σχετικές τιμές. Συντελεστής ταλάντωσης -αυτός είναι ο λόγος του εύρους διακύμανσης προς τη μέση τιμή του χαρακτηριστικού. Ο συντελεστής διακύμανσης -αυτός είναι ο λόγος της τυπικής απόκλισης προς τη μέση τιμή του χαρακτηριστικού. Συνήθως, αυτές οι τιμές εκφράζονται ως ποσοστό.

Τύποι για τον υπολογισμό των σχετικών δεικτών διακύμανσης:

Από τους παραπάνω τύπους φαίνεται ότι όσο μεγαλύτερος είναι ο συντελεστής V κοντά στο μηδέν, τόσο μικρότερη είναι η διακύμανση των τιμών των χαρακτηριστικών. Περισσότερο V, τόσο πιο μεταβλητό είναι το πρόσημο.

Στη στατιστική πρακτική, ο συντελεστής διακύμανσης χρησιμοποιείται συχνότερα. Χρησιμοποιείται όχι μόνο για μια συγκριτική αξιολόγηση της διακύμανσης, αλλά και για τον χαρακτηρισμό της ομοιογένειας του πληθυσμού. Το σύνολο θεωρείται ομοιογενές εάν ο συντελεστής διακύμανσης δεν υπερβαίνει το 33% (για κατανομές κοντά στο κανονικό). Αριθμητικά, ο λόγος του σ και του αριθμητικού μέσου όρου εξαλείφει την επίδραση της απόλυτης τιμής αυτών των χαρακτηριστικών και η ποσοστιαία αναλογία καθιστά τον συντελεστή διακύμανσης μια τιμή αδιάστατη (χωρίς όνομα).

Η λαμβανόμενη τιμή του συντελεστή διακύμανσης εκτιμάται σύμφωνα με τις κατά προσέγγιση διαβαθμίσεις του βαθμού ποικιλομορφίας του χαρακτηριστικού:

Αδύναμο - έως 10%

Μέσος όρος - 10 - 20%

Ισχυρό - περισσότερο από 20%

Η χρήση του συντελεστή διακύμανσης ενδείκνυται σε περιπτώσεις όπου είναι απαραίτητο να συγκριθούν χαρακτηριστικά που είναι διαφορετικά σε μέγεθος και διάσταση.

Η διαφορά μεταξύ του συντελεστή διακύμανσης και άλλων κριτηρίων διασποράς καταδεικνύεται ξεκάθαρα από παράδειγμα.

Τραπέζι 1

Σύνθεση εργαζομένων βιομηχανικής επιχείρησης

Με βάση τα στατιστικά χαρακτηριστικά που δίνονται στο παράδειγμα, μπορεί να συναχθεί το συμπέρασμα ότι η ηλικιακή σύνθεση και το μορφωτικό επίπεδο των εργαζομένων της επιχείρησης είναι σχετικά ομοιογενή, με χαμηλή επαγγελματική σταθερότητα του ερωτώμενου τμήματος. Είναι εύκολο να δει κανείς ότι μια προσπάθεια να κριθούν αυτές οι κοινωνικές τάσεις με βάση την τυπική απόκλιση θα οδηγούσε σε ένα εσφαλμένο συμπέρασμα και μια προσπάθεια σύγκρισης των λογιστικών χαρακτηριστικών "εργασιακή εμπειρία" και "ηλικία" με το λογιστικό χαρακτηριστικό "εκπαίδευση" θα ήταν γενικά λανθασμένη λόγω της ετερογένειας αυτών των χαρακτηριστικών.

Διάμεσος και εκατοστιαίες τιμές

Για τις τακτικές (κατάταξη) κατανομές, όπου το κριτήριο για το μέσο της σειράς είναι η διάμεσος, η τυπική απόκλιση και η διακύμανση δεν μπορούν να χρησιμεύσουν ως χαρακτηριστικά της διασποράς της παραλλαγής.

Το ίδιο ισχύει για τις ανοιχτές παραλλαγές σειρές. Η περίσταση αυτή οφείλεται στο γεγονός ότι οι αποκλίσεις, σύμφωνα με τις οποίες υπολογίζεται η διασπορά και το σ, υπολογίζονται από τον αριθμητικό μέσο όρο, ο οποίος δεν υπολογίζεται σε ανοιχτές μεταβλητές σειρές και στη σειρά κατανομών ποιοτικών χαρακτηριστικών. Επομένως, για μια συμπιεσμένη περιγραφή των διανομών, χρησιμοποιείται μια άλλη παράμετρος scatter - ποσοστό(συνώνυμο - «εκατοστηστό»), κατάλληλο για την περιγραφή ποιοτικών και ποσοτικών χαρακτηριστικών σε οποιαδήποτε μορφή κατανομής τους. Αυτή η παράμετρος μπορεί επίσης να χρησιμοποιηθεί για τη μετατροπή ποσοτικών χαρακτηριστικών σε ποιοτικά. Σε αυτήν την περίπτωση, τέτοιες βαθμολογίες εκχωρούνται ανάλογα με τη σειρά του ποσοστού που αντιστοιχεί σε μια ή την άλλη συγκεκριμένη επιλογή.

Στην πρακτική της βιοϊατρικής έρευνας, χρησιμοποιούνται συχνότερα τα ακόλουθα ποσοστά:

– διάμεσος

, είναι τεταρτημόρια (τέταρτα), πού είναι το κάτω τεταρτημόριο, κορυφαίο τεταρτημόριο.

Τα ποσοστά χωρίζουν την περιοχή των πιθανών αλλαγών σε μια μεταβλητή σειρά σε ορισμένα διαστήματα. Η διάμεσος (ποσοστό) είναι η παραλλαγή που βρίσκεται στο μέσο της σειράς παραλλαγής και χωρίζει αυτή τη σειρά στη μέση, σε δύο ίσα μέρη ( 0,5 και 0,5 ). Το τεταρτημόριο χωρίζει τη σειρά σε τέσσερα μέρη: το πρώτο μέρος (κάτω τεταρτημόριο) είναι η επιλογή που χωρίζει τις επιλογές των οποίων οι αριθμητικές τιμές δεν υπερβαίνουν το 25% του μέγιστου δυνατού σε αυτήν τη σειρά, το τεταρτημόριο διαχωρίζει επιλογές με αριθμητική τιμή έως 50 % του μέγιστου δυνατού. Το άνω τεταρτημόριο () διαχωρίζει τις επιλογές έως και το 75% των μέγιστων δυνατών τιμών.

Σε περίπτωση ασύμμετρης κατανομής μεταβλητή σε σχέση με τον αριθμητικό μέσο όρο, η διάμεσος και τα τεταρτημόρια χρησιμοποιούνται για τον χαρακτηρισμό της.Σε αυτήν την περίπτωση, χρησιμοποιείται η ακόλουθη μορφή εμφάνισης της μέσης τιμής - Μου (;). Για παράδειγμα, το υπό μελέτη χαρακτηριστικό - «η περίοδος κατά την οποία το παιδί άρχισε να περπατά ανεξάρτητα» - στην ομάδα μελέτης έχει ασύμμετρη κατανομή. Ταυτόχρονα, το κάτω τεταρτημόριο () αντιστοιχεί στην έναρξη του περπατήματος - 9,5 μήνες, το διάμεσο - 11 μήνες, το ανώτερο τεταρτημόριο () - 12 μήνες. Αντίστοιχα, το χαρακτηριστικό της μέσης τάσης του καθορισμένου χαρακτηριστικού θα παρουσιαστεί ως 11 (9,5; 12) μήνες.

Εκτίμηση της στατιστικής σημασίας των αποτελεσμάτων της μελέτης

Η στατιστική σημασία των δεδομένων νοείται ως ο βαθμός αντιστοιχίας τους με την εμφανιζόμενη πραγματικότητα, δηλ. Στατιστικά σημαντικά δεδομένα είναι αυτά που δεν διαστρεβλώνουν και αντικατοπτρίζουν σωστά την αντικειμενική πραγματικότητα.

Η αξιολόγηση της στατιστικής σημασίας των αποτελεσμάτων μιας μελέτης σημαίνει να προσδιοριστεί με ποια πιθανότητα είναι δυνατόν να μεταφερθούν τα αποτελέσματα που λαμβάνονται σε έναν πληθυσμό δείγματος σε ολόκληρο τον πληθυσμό. Μια αξιολόγηση της στατιστικής σημασίας είναι απαραίτητη για να κατανοήσουμε πόσο ένα μέρος του φαινομένου μπορεί να χρησιμοποιηθεί για να κριθεί το φαινόμενο ως σύνολο και τα μοτίβα του.

Η αξιολόγηση της στατιστικής σημασίας των αποτελεσμάτων της μελέτης αποτελείται από:

1. σφάλματα αντιπροσωπευτικότητας (λάθη μέσες και σχετικές τιμές) - Μ;

2. Όρια εμπιστοσύνης μέσες ή σχετικές τιμές.

3. αξιοπιστία της διαφοράς μεταξύ μέσων ή σχετικών τιμών σύμφωνα με το κριτήριο t.

Τυπικό σφάλμα του αριθμητικού μέσου όρουή σφάλμα αντιπροσωπευτικότηταςχαρακτηρίζει τις διακυμάνσεις του μέσου όρου. Θα πρέπει να σημειωθεί ότι όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερο είναι το spread των μέσων τιμών. Το τυπικό σφάλμα του μέσου όρου υπολογίζεται από τον τύπο:

Στη σύγχρονη επιστημονική βιβλιογραφία, ο αριθμητικός μέσος όρος γράφεται μαζί με το σφάλμα αντιπροσωπευτικότητας:

ή μαζί με την τυπική απόκλιση:

Για παράδειγμα, λάβετε υπόψη τα δεδομένα για 1.500 αστικές πολυκλινικές στη χώρα (γενικός πληθυσμός). Ο μέσος όρος των ασθενών που εξυπηρετούνται στην πολυκλινική είναι 18150 άτομα. Η τυχαία επιλογή του 10% των αντικειμένων (150 πολυκλινικές) δίνει έναν μέσο αριθμό ασθενών ίσο με 20051 άτομα. Το δειγματοληπτικό σφάλμα, που προφανώς σχετίζεται με το γεγονός ότι δεν συμπεριλήφθηκαν και οι 1500 πολυκλινικές στο δείγμα, είναι ίσο με τη διαφορά μεταξύ αυτών των μέσων όρων - ο γενικός μέσος όρος ( Μγονίδιο) και μέσος όρος δείγματος ( Μ sb). Εάν σχηματίσουμε ένα άλλο δείγμα ίδιου μεγέθους από τον πληθυσμό μας, θα δώσει διαφορετικό ποσό σφάλματος. Όλα αυτά τα μέσα δειγματοληψίας, με αρκετά μεγάλα δείγματα, κατανέμονται κανονικά γύρω από τον γενικό μέσο όρο με έναν αρκετά μεγάλο αριθμό επαναλήψεων ενός δείγματος του ίδιου αριθμού αντικειμένων από τον γενικό πληθυσμό. Τυπικό σφάλμα του μέσου όρου Μείναι η αναπόφευκτη εξάπλωση των μέσων δείγματος γύρω από τη γενική μέση τιμή.

Στην περίπτωση που τα αποτελέσματα της μελέτης αντιπροσωπεύονται από σχετικές τιμές (για παράδειγμα, ποσοστά), το κοινή χρήση τυπικού σφάλματος:

όπου P είναι ο δείκτης σε %, n είναι ο αριθμός των παρατηρήσεων.

Το αποτέλεσμα εμφανίζεται ως (Ρ ± m)%. Για παράδειγμα,το ποσοστό ανάρρωσης μεταξύ των ασθενών ήταν (95,2±2,5)%.

Αν ο αριθμός των στοιχείων στον πληθυσμό, τότε κατά τον υπολογισμό των τυπικών σφαλμάτων του μέσου όρου και του μεριδίου στον παρονομαστή του κλάσματος, αντί γιαείναι απαραίτητο να τεθεί.

Για μια κανονική κατανομή (η κατανομή του μέσου όρου του δείγματος είναι κανονική), είναι γνωστό πόσο από τον πληθυσμό εμπίπτει σε οποιοδήποτε διάστημα γύρω από τον μέσο όρο. Συγκεκριμένα:

Στην πράξη, το πρόβλημα έγκειται στο γεγονός ότι τα χαρακτηριστικά του γενικού πληθυσμού είναι άγνωστα σε εμάς και το δείγμα γίνεται ακριβώς για τον σκοπό της αξιολόγησής τους. Αυτό σημαίνει ότι αν πάρουμε δείγματα ίδιου μεγέθους nαπό τον γενικό πληθυσμό, τότε στο 68,3% των περιπτώσεων το διάστημα θα περιέχει την τιμή Μ(θα είναι στο μεσοδιάστημα στο 95,5% των περιπτώσεων και στο μεσοδιάστημα στο 99,7% των περιπτώσεων).

Δεδομένου ότι στην πραγματικότητα γίνεται μόνο ένα δείγμα, αυτή η δήλωση διατυπώνεται με όρους πιθανότητας: με πιθανότητα 68,3%, η μέση τιμή του χαρακτηριστικού στο γενικό πληθυσμό περιέχεται στο διάστημα, με πιθανότητα 95,5% - στο μεσοδιάστημα κ.λπ.

Στην πράξη, ένα τέτοιο διάστημα χτίζεται γύρω από την τιμή του δείγματος, το οποίο, με δεδομένη (αρκετά υψηλή) πιθανότητα - πιθανότητα εμπιστοσύνης -θα «κάλυπτε» την πραγματική τιμή αυτής της παραμέτρου στο γενικό πληθυσμό. Αυτό το διάστημα ονομάζεται διάστημα εμπιστοσύνης.

Πιθανότητα εμπιστοσύνηςΠ είναι ο βαθμός εμπιστοσύνης ότι το διάστημα εμπιστοσύνης θα περιέχει πράγματι την πραγματική (άγνωστη) τιμή της παραμέτρου στον πληθυσμό.

Για παράδειγμα, εάν το επίπεδο εμπιστοσύνης Rίσο με 90%, αυτό σημαίνει ότι 90 δείγματα από τα 100 θα δώσουν μια σωστή εκτίμηση της παραμέτρου στο γενικό πληθυσμό. Αντίστοιχα, η πιθανότητα λάθους, δηλ. λανθασμένη εκτίμηση του γενικού μέσου όρου για το δείγμα, είναι ίση σε ποσοστό: . Για αυτό το παράδειγμα, αυτό σημαίνει ότι 10 δείγματα από τα 100 θα δώσουν μια εσφαλμένη εκτίμηση.

Προφανώς, ο βαθμός εμπιστοσύνης (πιθανότητα εμπιστοσύνης) εξαρτάται από το μέγεθος του διαστήματος: όσο μεγαλύτερο είναι το διάστημα, τόσο μεγαλύτερη είναι η εμπιστοσύνη ότι μια άγνωστη τιμή για τον γενικό πληθυσμό θα εμπίπτει σε αυτό. Στην πράξη, λαμβάνεται τουλάχιστον το διπλάσιο του σφάλματος δειγματοληψίας για την κατασκευή ενός διαστήματος εμπιστοσύνης για την παροχή τουλάχιστον 95,5% εμπιστοσύνης.

Ο προσδιορισμός των ορίων εμπιστοσύνης των μέσων και των σχετικών τιμών μας επιτρέπει να βρούμε τις δύο ακραίες τιμές τους - την ελάχιστη δυνατή και τη μέγιστη δυνατή, εντός των οποίων ο υπό μελέτη δείκτης μπορεί να εμφανιστεί σε ολόκληρο τον γενικό πληθυσμό. Βασισμένο σε αυτό, όρια εμπιστοσύνης (ή διάστημα εμπιστοσύνης)- αυτά είναι τα όρια των μέσων ή σχετικών τιμών, η υπέρβαση των οποίων λόγω τυχαίων διακυμάνσεων έχει ασήμαντη πιθανότητα.

Το διάστημα εμπιστοσύνης μπορεί να ξαναγραφτεί ως: , όπου tείναι κριτήριο εμπιστοσύνης.

Τα όρια εμπιστοσύνης του αριθμητικού μέσου όρου στο γενικό πληθυσμό καθορίζονται από τον τύπο:

Μ γονίδιο = Μ επιλέγω + tm Μ

για σχετική τιμή:

R γονίδιο = Π επιλέγω + tm R

όπου Μ γονίδιοκαι R γονίδιο- τιμές του μέσου όρου και των σχετικών τιμών για το γενικό πληθυσμό. Μ επιλέγωκαι R επιλέγω- οι τιμές του μέσου όρου και των σχετικών τιμών που λαμβάνονται στον πληθυσμό του δείγματος· Μ Μκαι Μ Π- σφάλματα μέσες και σχετικές τιμές. t- κριτήριο εμπιστοσύνης (κριτήριο ακρίβειας, το οποίο ορίζεται κατά τον προγραμματισμό της μελέτης και μπορεί να είναι ίσο με 2 ή 3). tm- αυτό είναι το διάστημα εμπιστοσύνης ή Δ - το οριακό σφάλμα του δείκτη που λήφθηκε στη δειγματοληπτική μελέτη.

Πρέπει να σημειωθεί ότι η αξία του κριτηρίου tσε κάποιο βαθμό, σχετίζεται με την πιθανότητα μιας πρόβλεψης χωρίς σφάλματα (p), εκφρασμένη σε%. Επιλέγεται από τον ίδιο τον ερευνητή, με γνώμονα την ανάγκη απόκτησης ενός αποτελέσματος με τον απαιτούμενο βαθμό ακρίβειας. Άρα, για την πιθανότητα μιας πρόβλεψης χωρίς σφάλματα 95,5%, η τιμή του κριτηρίου tείναι 2, για 99,7% - 3.

Οι δεδομένες εκτιμήσεις του διαστήματος εμπιστοσύνης είναι αποδεκτές μόνο για στατιστικούς πληθυσμούς με περισσότερες από 30 παρατηρήσεις. Με μικρότερο μέγεθος πληθυσμού (μικρά δείγματα), χρησιμοποιούνται ειδικοί πίνακες για τον προσδιορισμό του κριτηρίου t. Σε αυτούς τους πίνακες, η επιθυμητή τιμή βρίσκεται στην τομή της γραμμής που αντιστοιχεί στο μέγεθος του πληθυσμού (n-1), και μια στήλη που αντιστοιχεί στο επίπεδο πιθανότητας μιας πρόβλεψης χωρίς σφάλματα (95,5%· 99,7%) που επιλέχτηκε από τον ερευνητή. Στην ιατρική έρευνα, κατά τον καθορισμό ορίων εμπιστοσύνης για οποιονδήποτε δείκτη, η πιθανότητα μιας πρόβλεψης χωρίς σφάλματα είναι 95,5% ή περισσότερο. Αυτό σημαίνει ότι η τιμή του δείκτη που λαμβάνεται στον πληθυσμό του δείγματος πρέπει να βρίσκεται στο γενικό πληθυσμό τουλάχιστον στο 95,5% των περιπτώσεων.

    Ερωτήσεις για το θέμα του μαθήματος:

    Η συνάφεια των δεικτών της διαφορετικότητας ενός χαρακτηριστικού στον στατιστικό πληθυσμό.

    Γενικά χαρακτηριστικά των απόλυτων δεικτών διακύμανσης.

    Τυπική απόκλιση, υπολογισμός, εφαρμογή.

    Σχετικοί δείκτες διακύμανσης.

    Διάμεσος, τεταρτημόριο βαθμολογία.

    Αξιολόγηση της στατιστικής σημασίας των αποτελεσμάτων της μελέτης.

    Τυπικό σφάλμα του αριθμητικού μέσου όρου, τύπος υπολογισμού, παράδειγμα χρήσης.

    Υπολογισμός της μετοχής και το τυπικό σφάλμα της.

    Η έννοια της πιθανότητας εμπιστοσύνης, ένα παράδειγμα χρήσης.

10. Η έννοια του διαστήματος εμπιστοσύνης, η εφαρμογή του.

    Δοκιμαστικές εργασίες για το θέμα με δείγματα απαντήσεων:

1. ΑΠΟΛΥΤΟΙ ΔΕΙΚΤΕΣ ΠΑΡΑΛΛΑΓΗΣ ΕΙΝΑΙ

1) συντελεστής διακύμανσης

2) συντελεστής ταλάντωσης

4) διάμεσος

2. ΣΧΕΤΙΚΟΙ ΔΕΙΚΤΕΣ ΠΑΡΑΛΛΑΓΗΣ ΕΙΝΑΙ

1) διασπορά

4) συντελεστής διακύμανσης

3. ΕΝΑ ΚΡΙΤΗΡΙΟ ΠΟΥ ΠΡΟΣΔΙΟΡΙΖΕΤΑΙ ΑΠΟ ΤΙΣ ΑΚΡΑΤΕΣ ΑΞΙΕΣ ΜΙΑΣ ΠΑΡΑΛΛΑΓΗΣ ΣΕ ΜΙΑ ΠΑΡΑΛΛΑΚΤΙΚΗ ΣΕΙΡΑ

2) πλάτος

3) διασπορά

4) συντελεστής διακύμανσης

4. Η ΔΙΑΦΟΡΑ ΤΗΣ ΕΞΑΙΡΕΤΙΚΗΣ ΕΠΙΛΟΓΗΣ ΕΙΝΑΙ

2) πλάτος

3) τυπική απόκλιση

4) συντελεστής διακύμανσης

5. ΜΕΣΟ ΤΕΤΡΑΓΩΝΟ ΑΠΟΚΛΙΣΕΩΝ ΜΕΜΟΝΩΜΕΝΩΝ ΣΗΜΑΝΤΙΚΩΝ ΤΙΜΩΝ ΑΠΟ ΤΗ ΜΕΣΗ ΤΙΜΗ ΤΟΥ ΕΙΝΑΙ

1) συντελεστής ταλάντωσης

2) διάμεσος

3) διασπορά

6. Ο ΛΟΓΟΣ ΤΟΥ ΕΜΒΑΣΜΑΤΟΣ ΠΑΡΑΛΛΑΓΗΣ ΠΡΟΣ ΤΗ ΜΕΣΗ ΤΙΜΗ ΕΝΟΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΕΙΝΑΙ

1) συντελεστής διακύμανσης

2) τυπική απόκλιση

4) συντελεστής ταλάντωσης

7. ΛΟΓΟΣ ΤΗΣ ΜΕΣΗΣ ΤΕΤΡΑΓΩΝΙΚΗΣ ΑΠΟΚΛΙΣΗΣ ΠΡΟΣ ΤΗ ΜΕΣΗ ΤΙΜΗ ΕΝΟΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΕΙΝΑΙ

1) διασπορά

2) συντελεστής διακύμανσης

3) συντελεστής ταλάντωσης

4) πλάτος

8. ΜΙΑ ΠΑΡΑΛΛΑΓΗ ΠΟΥ ΒΡΙΣΚΕΤΑΙ ΣΤΟ ΜΕΣΑ ΜΙΑΣ ΣΕΙΡΑΣ ΠΑΡΑΛΛΑΓΗΣ ΚΑΙ ΤΗΝ ΧΩΡΙΖΕΙ ΣΕ ΔΥΟ ΙΣΑ ΜΕΡΗ ΕΙΝΑΙ

1) διάμεσος

3) πλάτος

9. ΣΤΗΝ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ, ΟΤΑΝ ΚΑΘΟΡΙΣΤΟΥΝ ΟΡΙΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΟΠΟΙΟΥΔΗΠΟΤΕ ΔΕΙΚΤΗ, ΓΙΝΕΤΑΙ ΑΠΟΔΕΚΤΗ Η ΠΙΘΑΝΟΤΗΤΑ ΜΙΑΣ ΠΡΟΒΛΕΨΗΣ ΧΩΡΙΣ ΣΦΑΛΜΑΤΑ

10. ΑΝ 90 ΔΕΙΓΜΑΤΑ ΑΠΟ ΤΑ 100 ΔΙΝΟΥΝ ΣΩΣΤΗ ΕΚΤΙΜΗΣΗ ΜΙΑΣ ΠΑΡΑΜΕΤΡΟΥ ΣΕ ΓΕΝΙΚΟ ΠΛΗΘΥΣΜΟ, ΤΟΤΕ ΑΥΤΟ ΣΗΜΑΙΝΕΙ ΟΤΙ Η ΠΙΘΑΝΟΤΗΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΠΙΣΟΣ

11. ΣΕ ΠΕΡΙΠΤΩΣΗ ΑΝ 10 ΔΕΙΓΜΑΤΑ ΑΠΟ 100 ΔΙΝΟΥΝ ΛΑΘΟΣ ΕΚΤΙΜΗΣΗ, Η ΠΙΘΑΝΟΤΗΤΑ ΣΦΑΛΜΑΤΟΣ ΕΙΝΑΙ

.

1) διάστημα εμπιστοσύνης

2) πλάτος

4) συντελεστής διακύμανσης

13. ΜΙΚΡΟ ΔΕΙΓΜΑ ΘΕΩΡΕΙΤΑΙ Ο ΠΛΗΘΥΣΜΟΣ ΣΤΟΝ ΟΠΟΙΟ

1) το n είναι μικρότερο ή ίσο με 100

2) το n είναι μικρότερο ή ίσο με 30

3) το n είναι μικρότερο ή ίσο με 40

4) n είναι κοντά στο 0

14. ΓΙΑ ΤΗΝ ΠΙΘΑΝΟΤΗΤΑ ΠΡΟΒΛΕΨΗΣ ΧΩΡΙΣ ΣΦΑΛΜΑΤΑ 95% ΤΙΜΗ ΚΡΙΤΗΡΙΟΥ tΣΥΝΘΕΤΕΙ

15. ΓΙΑ ΤΗΝ ΠΙΘΑΝΟΤΗΤΑ ΠΡΟΒΛΕΨΗΣ ΧΩΡΙΣ ΣΦΑΛΜΑΤΑ 99% ΤΙΜΗ ΚΡΙΤΗΡΙΟΥ tΣΥΝΘΕΤΕΙ

16. ΓΙΑ ΚΑΤΑΝΟΜΕΣ ΠΛΗΣΙΟΝ ΣΤΟ ΚΑΝΟΝΙΚΟ Ο ΠΛΗΘΥΣΜΟΣ ΘΕΩΡΕΙΤΑΙ ΟΜΟΙΟΓΕΝΗΣ ΑΝ ΔΕΝ ΥΠΕΡΒΑΙΝΕΙ Ο ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΟΛΗΣ

17. ΕΠΙΛΟΓΗ ΔΙΑΧΩΡΙΣΜΟΥ ΠΑΡΑΛΛΑΓΩΝ ΠΟΥ ΟΙ ΑΡΙΘΜΗΤΙΚΕΣ ΤΙΜΕΣ ΔΕΝ ΥΠΕΡΒΑΙΝΟΥΝ ΤΟ 25% ΤΗΣ ΜΕΓΙΣΤΗΣ ΔΥΝΑΤΟΤΗΤΑΣ ΣΕ ΑΥΤΗ ΤΗ ΣΕΙΡΑ ΕΙΝΑΙ

2) κατώτερο τεταρτημόριο

3) άνω τεταρτημόριο

4) τεταρτημόριο

18. ΔΕΔΟΜΕΝΑ ΠΟΥ ΔΕΝ ΣΤΡΕΒΛΩΦΟΥΝ ΚΑΙ ΑΝΤΑΝΑΚΛΑΖΟΥΝ ΣΩΣΤΑ ΑΝΤΙΚΕΙΜΕΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ ΟΝΟΟΥΝΤΑΙ

1) αδύνατο

2) εξίσου δυνατό

3) αξιόπιστο

4) τυχαία

19. ΣΥΜΦΩΝΑ ΜΕ ΤΟΝ ΚΑΝΟΝΑ ΤΡΙΩΝ ΣΙΓΜΩΝ, ΜΕ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ ΣΗΜΕΙΟΥ ΕΝΤΟΣ
ΘΑ ΒΡΙΣΚΕΤΑΙ

1) Επιλογή 68,3%.

Για τον υπολογισμό της απλής γεωμετρικής μέσης, χρησιμοποιείται ο τύπος:

γεωμετρικά σταθμισμένα

Για τον προσδιορισμό του γεωμετρικού σταθμισμένου μέσου όρου, χρησιμοποιείται ο τύπος:

Οι μέσες διαμέτρους των τροχών, των σωλήνων, οι μέσες πλευρές των τετραγώνων προσδιορίζονται χρησιμοποιώντας το μέσο τετράγωνο της ρίζας.

Οι τιμές RMS χρησιμοποιούνται για τον υπολογισμό ορισμένων δεικτών, όπως ο συντελεστής διακύμανσης, ο οποίος χαρακτηρίζει τον ρυθμό της παραγωγής. Εδώ, η τυπική απόκλιση από την προγραμματισμένη παραγωγή για μια συγκεκριμένη περίοδο προσδιορίζεται από τον ακόλουθο τύπο:

Αυτές οι τιμές χαρακτηρίζουν με ακρίβεια τη μεταβολή των οικονομικών δεικτών σε σύγκριση με τη βασική τους αξία, λαμβανόμενη στη μέση τιμή της.

Τετραγωνικό απλό

Το μέσο τετράγωνο του απλού υπολογίζεται από τον τύπο:

Τετραγωνικό σταθμισμένο

Το σταθμισμένο μέσο τετράγωνο της ρίζας είναι:

22. Στα απόλυτα μέτρα παραλλαγής περιλαμβάνονται:

εύρος παραλλαγής

μέση γραμμική απόκλιση

διασπορά

τυπική απόκλιση

Εύρος διακύμανσης (r)

Παραλλαγή ανοιγμάτωνείναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του χαρακτηριστικού

Δείχνει τα όρια στα οποία αλλάζει η τιμή του χαρακτηριστικού στον υπό μελέτη πληθυσμό.

Η εργασιακή εμπειρία πέντε αιτούντων στην προηγούμενη θέση εργασίας είναι: 2,3,4,7 και 9 έτη. Λύση: εύρος διακύμανσης = 9 - 2 = 7 χρόνια.

Για ένα γενικευμένο χαρακτηριστικό των διαφορών στις τιμές του χαρακτηριστικού, οι μέσοι δείκτες διακύμανσης υπολογίζονται με βάση το περιθώριο για αποκλίσεις από τον αριθμητικό μέσο όρο. Η διαφορά λαμβάνεται ως απόκλιση από το μέσο όρο.

Ταυτόχρονα, για να αποφευχθεί η μετατροπή σε μηδέν του αθροίσματος των αποκλίσεων των επιλογών χαρακτηριστικών από τον μέσο όρο (η ιδιότητα μηδέν του μέσου όρου), πρέπει είτε να αγνοήσει κανείς τα σημάδια της απόκλισης, δηλαδή να λάβει αυτό το modulo αθροίσματος , ή τετράγωνο των τιμών απόκλισης

Μέση γραμμική και τετράγωνη απόκλιση

Μέση γραμμική απόκλισηείναι ο αριθμητικός μέσος όρος των απόλυτων αποκλίσεων των επιμέρους τιμών του χαρακτηριστικού από τον μέσο όρο.

Η μέση γραμμική απόκλιση είναι απλή:

Η εργασιακή εμπειρία πέντε αιτούντων στην προηγούμενη θέση εργασίας είναι: 2,3,4,7 και 9 έτη.

Στο παράδειγμά μας: χρόνια?

Απάντηση: 2,4 χρόνια.

Μέση σταθμισμένη γραμμική απόκλισηισχύει για ομαδοποιημένα δεδομένα:

Η μέση γραμμική απόκλιση, λόγω της συμβατικότητάς της, χρησιμοποιείται σχετικά σπάνια στην πράξη (ιδίως για τον χαρακτηρισμό της εκπλήρωσης των συμβατικών υποχρεώσεων ως προς την ομοιομορφία παράδοσης· στην ανάλυση της ποιότητας του προϊόντος, λαμβάνοντας υπόψη τα τεχνολογικά χαρακτηριστικά της παραγωγής ).

Τυπική απόκλιση

Το πιο τέλειο χαρακτηριστικό της παραλλαγής είναι η τυπική απόκλιση, η οποία ονομάζεται τυπική (ή τυπική απόκλιση). Τυπική απόκλιση() ισούται με την τετραγωνική ρίζα του μέσου τετραγώνου των αποκλίσεων των επιμέρους τιμών του χαρακτηριστικού από τον αριθμητικό μέσο όρο:

Η τυπική απόκλιση είναι απλή:

Η σταθμισμένη τυπική απόκλιση εφαρμόζεται για ομαδοποιημένα δεδομένα:

Μεταξύ του μέσου τετραγώνου και των μέσων γραμμικών αποκλίσεων υπό συνθήκες κανονικής κατανομής, λαμβάνει χώρα η ακόλουθη σχέση: ~ 1,25.

Η τυπική απόκλιση, ως το κύριο απόλυτο μέτρο διακύμανσης, χρησιμοποιείται για τον προσδιορισμό των τιμών των τεταγμένων της καμπύλης κανονικής κατανομής, σε υπολογισμούς που σχετίζονται με την οργάνωση της παρατήρησης του δείγματος και τον καθορισμό της ακρίβειας των χαρακτηριστικών του δείγματος, καθώς και αξιολόγηση των ορίων της παραλλαγής ενός χαρακτηριστικού σε έναν ομοιογενή πληθυσμό.

Σοφοί μαθηματικοί και στατιστικολόγοι κατέληξαν σε έναν πιο αξιόπιστο δείκτη, αν και για έναν ελαφρώς διαφορετικό σκοπό - μέση γραμμική απόκλιση. Αυτός ο δείκτης χαρακτηρίζει το μέτρο της εξάπλωσης των τιμών του συνόλου δεδομένων γύρω από τη μέση τιμή τους.

Για να δείξετε το μέτρο της εξάπλωσης των δεδομένων, πρέπει πρώτα να προσδιορίσετε σε τι σχέση θα θεωρείται αυτό το spread - συνήθως αυτή είναι η μέση τιμή. Στη συνέχεια, πρέπει να υπολογίσετε πόσο μακριά απέχουν οι τιμές του αναλυόμενου συνόλου δεδομένων από τον μέσο όρο. Είναι σαφές ότι κάθε τιμή αντιστοιχεί σε ένα ορισμένο ποσό απόκλισης, αλλά μας ενδιαφέρει επίσης μια γενική εκτίμηση που καλύπτει ολόκληρο τον πληθυσμό. Επομένως, η μέση απόκλιση υπολογίζεται χρησιμοποιώντας τον τύπο του συνηθισμένου αριθμητικού μέσου όρου. Αλλά! Αλλά για να υπολογιστεί ο μέσος όρος των αποκλίσεων, πρέπει πρώτα να προστεθούν. Και αν προσθέσουμε θετικούς και αρνητικούς αριθμούς, θα ακυρωθούν μεταξύ τους και το άθροισμά τους θα τείνει στο μηδέν. Για να αποφευχθεί αυτό, όλες οι αποκλίσεις λαμβάνονται modulo, δηλαδή όλοι οι αρνητικοί αριθμοί γίνονται θετικοί. Τώρα η μέση απόκλιση θα δείχνει ένα γενικευμένο μέτρο της εξάπλωσης των τιμών. Ως αποτέλεσμα, η μέση γραμμική απόκλιση θα υπολογιστεί από τον τύπο:

έναείναι η μέση γραμμική απόκλιση,

Χ- ο αναλυόμενος δείκτης, με μια παύλα στην κορυφή - η μέση τιμή του δείκτη,

nείναι ο αριθμός των τιμών στο σύνολο δεδομένων που αναλύθηκε,

ο τελεστής άθροισης, ελπίζω, να μην τρομάζει κανέναν.

Η μέση γραμμική απόκλιση που υπολογίζεται χρησιμοποιώντας τον καθορισμένο τύπο αντικατοπτρίζει τη μέση απόλυτη απόκλιση από τη μέση τιμή για αυτόν τον πληθυσμό.

Η κόκκινη γραμμή στην εικόνα είναι η μέση τιμή. Οι αποκλίσεις κάθε παρατήρησης από το μέσο όρο υποδεικνύονται με μικρά βέλη. Λαμβάνονται modulo και συνοψίζονται. Τότε όλα διαιρούνται με τον αριθμό των τιμών.

Για να ολοκληρωθεί η εικόνα, πρέπει να δοθεί ένα ακόμη παράδειγμα. Ας πούμε ότι υπάρχει μια εταιρεία που κατασκευάζει μοσχεύματα για φτυάρια. Κάθε κόψιμο πρέπει να έχει μήκος 1,5 μέτρο, αλλά, το πιο σημαντικό, πρέπει να είναι όλα ίδια ή τουλάχιστον συν ή πλην 5 εκ. Ωστόσο, οι αμελείς εργάτες θα κόψουν 1,2 μ. και μετά 1,8 μ. . Ο διευθυντής της εταιρείας αποφάσισε να πραγματοποιήσει μια στατιστική ανάλυση του μήκους των μοσχευμάτων. Διάλεξα 10 κομμάτια και μέτρησα το μήκος τους, βρήκα τον μέσο όρο και υπολόγισα τη μέση γραμμική απόκλιση. Ο μέσος όρος αποδείχθηκε ότι ήταν ακριβώς σωστός - 1,5 μ. Αλλά η μέση γραμμική απόκλιση αποδείχθηκε 0,16 μ. Έτσι αποδεικνύεται ότι κάθε κοπή είναι μακρύτερο ή μικρότερο από ό,τι χρειάζεται κατά μέσο όρο κατά 16 εκατοστά. Υπάρχει κάτι για να μιλήσουμε με εργάτες. Στην πραγματικότητα, δεν έχω δει την πραγματική χρήση αυτού του δείκτη, οπότε βρήκα ένα παράδειγμα μόνος μου. Ωστόσο, υπάρχει ένας τέτοιος δείκτης στα στατιστικά στοιχεία.

Διασπορά

Όπως η μέση γραμμική απόκλιση, η διακύμανση αντικατοπτρίζει επίσης τον βαθμό στον οποίο τα δεδομένα εξαπλώνονται γύρω από τον μέσο όρο.

Ο τύπος για τον υπολογισμό της διακύμανσης μοιάζει με αυτό:

(για σειρές παραλλαγών (σταθμισμένη διακύμανση))

(για μη ομαδοποιημένα δεδομένα (απλή διακύμανση))

Όπου: σ 2 - διασπορά, Xi– αναλύουμε τον δείκτη sq (τιμή χαρακτηριστικών), – τη μέση τιμή του δείκτη, f i – τον ​​αριθμό των τιμών στο αναλυόμενο σύνολο δεδομένων.

Η διακύμανση είναι το μέσο τετράγωνο των αποκλίσεων.

Αρχικά, υπολογίζεται ο μέσος όρος, στη συνέχεια λαμβάνεται η διαφορά μεταξύ κάθε γραμμής βάσης και μέσου όρου, τετραγωνίζεται, πολλαπλασιάζεται με τη συχνότητα της αντίστοιχης τιμής χαρακτηριστικού, προστίθεται και στη συνέχεια διαιρείται με τον αριθμό των τιμών στον πληθυσμό.

Ωστόσο, στην καθαρή της μορφή, όπως, για παράδειγμα, ο αριθμητικός μέσος όρος ή ο δείκτης, η διασπορά δεν χρησιμοποιείται. Είναι μάλλον ένας βοηθητικός και ενδιάμεσος δείκτης που χρησιμοποιείται για άλλους τύπους στατιστικών αναλύσεων.

Απλοποιημένος τρόπος υπολογισμού της διακύμανσης

τυπική απόκλιση

Για να χρησιμοποιηθεί η διακύμανση για την ανάλυση δεδομένων, λαμβάνεται μια τετραγωνική ρίζα από αυτήν. Αποδεικνύεται το λεγόμενο τυπική απόκλιση.

Παρεμπιπτόντως, η τυπική απόκλιση ονομάζεται επίσης σίγμα - από το ελληνικό γράμμα που τη δηλώνει.

Η τυπική απόκλιση προφανώς χαρακτηρίζει και το μέτρο της διασποράς δεδομένων, αλλά τώρα (σε αντίθεση με τη διασπορά) μπορεί να συγκριθεί με τα αρχικά δεδομένα. Κατά κανόνα, οι δείκτες μέσου τετραγώνου στα στατιστικά δίνουν πιο ακριβή αποτελέσματα από τους γραμμικούς. Επομένως, η τυπική απόκλιση είναι ένα πιο ακριβές μέτρο της διασποράς δεδομένων από τη μέση γραμμική απόκλιση.

Η τυπική απόκλιση είναι ένας κλασικός δείκτης μεταβλητότητας από την περιγραφική στατιστική.

Τυπική απόκλιση, τυπική απόκλιση, RMS, τυπική απόκλιση δείγματος (Αγγλικά τυπική απόκλιση, STD, STDev) είναι ένα πολύ κοινό μέτρο διασποράς σε περιγραφικές στατιστικές. Αλλά επειδή Η τεχνική ανάλυση είναι παρόμοια με τις στατιστικές, αυτός ο δείκτης μπορεί (και πρέπει) να χρησιμοποιηθεί στην τεχνική ανάλυση για τον εντοπισμό του βαθμού διασποράς της τιμής του αναλυόμενου οργάνου με την πάροδο του χρόνου. Συμβολίζεται με το ελληνικό σύμβολο Σίγμα «σ».

Ευχαριστούμε τον Karl Gauss και τον Pearson για το γεγονός ότι έχουμε την ευκαιρία να χρησιμοποιήσουμε την τυπική απόκλιση.

Χρησιμοποιώντας τυπική απόκλιση στην τεχνική ανάλυση, το γυρίζουμε αυτό «Δείκτης σκέδασης" σε "δείκτης μεταβλητότητας«Διατηρώντας το νόημα αλλά αλλάζοντας τους όρους.

Τι είναι η τυπική απόκλιση

Αλλά εκτός από τους ενδιάμεσους βοηθητικούς υπολογισμούς, Η τυπική απόκλιση είναι αρκετά αποδεκτή για αυτο-υπολογισμόκαι εφαρμογές στην τεχνική ανάλυση. Όπως σημειώνει ένας ενεργός αναγνώστης του περιοδικού μας κολλιτσίδα, " Εξακολουθώ να μην καταλαβαίνω γιατί το RMS δεν περιλαμβάνεται στο σύνολο των τυπικών δεικτών των εγχώριων κέντρων συναλλαγών«.

Πραγματικά, Η τυπική απόκλιση μπορεί με κλασικό και «καθαρό» τρόπο να μετρήσει τη μεταβλητότητα ενός οργάνου. Αλλά δυστυχώς, αυτός ο δείκτης δεν είναι τόσο συνηθισμένος στην ανάλυση τίτλων.

Εφαρμογή της τυπικής απόκλισης

Ο μη αυτόματος υπολογισμός της τυπικής απόκλισης δεν είναι πολύ ενδιαφέρον.αλλά χρήσιμο για εμπειρία. Η τυπική απόκλιση μπορεί να εκφραστείτύπος STD=√[(∑(x-x) 2)/n] , που ακούγεται σαν το άθροισμα των τετραγώνων των διαφορών μεταξύ των δειγμάτων και του μέσου όρου, διαιρούμενο με τον αριθμό των στοιχείων στο δείγμα.

Εάν ο αριθμός των στοιχείων στο δείγμα υπερβαίνει τα 30, τότε ο παρονομαστής του κλάσματος κάτω από τη ρίζα παίρνει την τιμή n-1. Διαφορετικά, χρησιμοποιείται το n.

βήμα βήμα υπολογισμός τυπικής απόκλισης:

  1. υπολογίστε τον αριθμητικό μέσο όρο του δείγματος δεδομένων
  2. αφαιρέστε αυτόν τον μέσο όρο από κάθε στοιχείο του δείγματος
  3. όλες οι προκύπτουσες διαφορές είναι στο τετράγωνο
  4. άθροισμα όλων των τετραγώνων που προκύπτουν
  5. διαιρέστε το άθροισμα που προκύπτει με τον αριθμό των στοιχείων στο δείγμα (ή με n-1 εάν n>30)
  6. υπολογίστε την τετραγωνική ρίζα του πηλίκου που προκύπτει (καλείται διασπορά)