Βιογραφίες Χαρακτηριστικά Ανάλυση

Βρείτε την τυπική απόκλιση. Διασπορά

Η τυπική απόκλιση είναι ένας κλασικός δείκτης μεταβλητότητας από την περιγραφική στατιστική.

Τυπική απόκλιση, τυπική απόκλιση, RMS, τυπική απόκλιση δείγματος (Αγγλικά τυπική απόκλιση, STD, STDev) είναι ένα πολύ κοινό μέτρο διασποράς σε περιγραφικές στατιστικές. Αλλά επειδή Η τεχνική ανάλυση είναι παρόμοια με τις στατιστικές, αυτός ο δείκτης μπορεί (και πρέπει) να χρησιμοποιηθεί στην τεχνική ανάλυση για τον εντοπισμό του βαθμού διασποράς της τιμής του αναλυόμενου οργάνου με την πάροδο του χρόνου. Συμβολίζεται με το ελληνικό σύμβολο Σίγμα «σ».

Ευχαριστούμε τον Karl Gauss και τον Pearson για το γεγονός ότι έχουμε την ευκαιρία να χρησιμοποιήσουμε την τυπική απόκλιση.

Χρησιμοποιώντας τυπική απόκλιση στην τεχνική ανάλυση, το γυρίζουμε αυτό «Δείκτης σκέδασης" σε "δείκτης μεταβλητότητας«Διατηρώντας το νόημα αλλά αλλάζοντας τους όρους.

Τι είναι η τυπική απόκλιση

Αλλά εκτός από τους ενδιάμεσους βοηθητικούς υπολογισμούς, Η τυπική απόκλιση είναι αρκετά αποδεκτή για αυτο-υπολογισμόκαι εφαρμογές στην τεχνική ανάλυση. Όπως σημειώνει ένας ενεργός αναγνώστης του περιοδικού μας κολλιτσίδα, " Εξακολουθώ να μην καταλαβαίνω γιατί το RMS δεν περιλαμβάνεται στο σύνολο των τυπικών δεικτών των εγχώριων κέντρων συναλλαγών«.

Πραγματικά, Η τυπική απόκλιση μπορεί με κλασικό και «καθαρό» τρόπο να μετρήσει τη μεταβλητότητα ενός οργάνου. Αλλά δυστυχώς, αυτός ο δείκτης δεν είναι τόσο συνηθισμένος στην ανάλυση τίτλων.

Εφαρμογή της τυπικής απόκλισης

Ο μη αυτόματος υπολογισμός της τυπικής απόκλισης δεν είναι πολύ ενδιαφέρον.αλλά χρήσιμο για εμπειρία. Η τυπική απόκλιση μπορεί να εκφραστείτύπος STD=√[(∑(x-x) 2)/n] , που ακούγεται σαν το άθροισμα των τετραγώνων των διαφορών μεταξύ των δειγμάτων και του μέσου όρου, διαιρούμενο με τον αριθμό των στοιχείων στο δείγμα.

Εάν ο αριθμός των στοιχείων στο δείγμα υπερβαίνει τα 30, τότε ο παρονομαστής του κλάσματος κάτω από τη ρίζα παίρνει την τιμή n-1. Διαφορετικά, χρησιμοποιείται το n.

βήμα βήμα υπολογισμός τυπικής απόκλισης:

  1. υπολογίστε τον αριθμητικό μέσο όρο του δείγματος δεδομένων
  2. αφαιρέστε αυτόν τον μέσο όρο από κάθε στοιχείο του δείγματος
  3. όλες οι προκύπτουσες διαφορές είναι στο τετράγωνο
  4. άθροισμα όλων των τετραγώνων που προκύπτουν
  5. διαιρέστε το άθροισμα που προκύπτει με τον αριθμό των στοιχείων στο δείγμα (ή με n-1 εάν n>30)
  6. υπολογίστε την τετραγωνική ρίζα του πηλίκου που προκύπτει (καλείται διασπορά)

Σύμφωνα με τη δειγματοληπτική έρευνα, οι καταθέτες ομαδοποιήθηκαν ανάλογα με το μέγεθος της κατάθεσης στη Sberbank της πόλης:

Καθορίζω:

1) εύρος παραλλαγής.

2) μέσο ποσό κατάθεσης.

3) μέση γραμμική απόκλιση.

4) διασπορά?

5) τυπική απόκλιση.

6) συντελεστής διακύμανσης εισφορών.

Λύση:

Αυτή η σειρά διανομής περιέχει ανοιχτά διαστήματα. Σε τέτοιες σειρές, η τιμή του διαστήματος της πρώτης ομάδας θεωρείται συμβατικά ότι είναι ίση με την τιμή του διαστήματος της επόμενης και η τιμή του διαστήματος της τελευταίας ομάδας είναι ίση με την τιμή του διαστήματος της προηγούμενης ένας.

Η τιμή διαστήματος της δεύτερης ομάδας είναι 200, επομένως, η τιμή της πρώτης ομάδας είναι επίσης 200. Η τιμή διαστήματος της προτελευταίας ομάδας είναι 200, που σημαίνει ότι και το τελευταίο διάστημα θα έχει τιμή ίση με 200.

1) Ορίστε το εύρος παραλλαγής ως τη διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής του χαρακτηριστικού:

Το εύρος διακύμανσης του μεγέθους της συνεισφοράς είναι 1000 ρούβλια.

2) Το μέσο μέγεθος της συνεισφοράς προσδιορίζεται από τον τύπο του αριθμητικού σταθμισμένου μέσου όρου.

Ας προσδιορίσουμε προκαταρκτικά τη διακριτή τιμή του χαρακτηριστικού σε κάθε διάστημα. Για να γίνει αυτό, χρησιμοποιώντας τον απλό αριθμητικό μέσο όρο, βρίσκουμε τα μέσα των διαστημάτων.

Η μέση τιμή του πρώτου διαστήματος θα είναι ίση με:

το δεύτερο - 500, κ.λπ.

Ας βάλουμε τα αποτελέσματα των υπολογισμών στον πίνακα:

Ποσό κατάθεσης, τρίψτε.Αριθμός συντελεστών, στΤο μέσο του διαστήματος, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Σύνολο 400 - 312000

Η μέση κατάθεση στην Sberbank της πόλης θα είναι 780 ρούβλια:

3) Η μέση γραμμική απόκλιση είναι ο αριθμητικός μέσος όρος των απόλυτων αποκλίσεων των επιμέρους τιμών του χαρακτηριστικού από τον συνολικό μέσο όρο:

Η διαδικασία για τον υπολογισμό της μέσης γραμμικής απόκλισης στη σειρά διαστημάτων κατανομής έχει ως εξής:

1. Υπολογίζεται ο αριθμητικός σταθμισμένος μέσος όρος, όπως φαίνεται στην παράγραφο 2).

2. Προσδιορίζονται οι απόλυτες αποκλίσεις της παραλλαγής από τον μέσο όρο:

3. Οι λαμβανόμενες αποκλίσεις πολλαπλασιάζονται με τις συχνότητες:

4. Το άθροισμα των σταθμισμένων αποκλίσεων βρίσκεται χωρίς να λαμβάνεται υπόψη το πρόσημο:

5. Το άθροισμα των σταθμισμένων αποκλίσεων διαιρείται με το άθροισμα των συχνοτήτων:

Είναι βολικό να χρησιμοποιήσετε τον πίνακα υπολογισμένων δεδομένων:

Ποσό κατάθεσης, τρίψτε.Αριθμός συντελεστών, στΤο μέσο του διαστήματος, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Σύνολο 400 - - - 81280

Η μέση γραμμική απόκλιση του μεγέθους της κατάθεσης των πελατών της Sberbank είναι 203,2 ρούβλια.

4) Διασπορά είναι ο αριθμητικός μέσος όρος των τετραγωνικών αποκλίσεων κάθε τιμής χαρακτηριστικού από τον αριθμητικό μέσο όρο.

Ο υπολογισμός της διακύμανσης στη σειρά κατανομής διαστήματος πραγματοποιείται σύμφωνα με τον τύπο:

Η διαδικασία για τον υπολογισμό της διακύμανσης σε αυτή την περίπτωση είναι η εξής:

1. Προσδιορίστε τον αριθμητικό σταθμισμένο μέσο όρο, όπως φαίνεται στην παράγραφο 2).

2. Βρείτε αποκλίσεις από το μέσο όρο:

3. Τετραγωνισμός της απόκλισης κάθε επιλογής από τη μέση τιμή:

4. Πολλαπλασιάστε τις αποκλίσεις στο τετράγωνο με τα βάρη (συχνότητες):

5. Συνοψίστε τα έργα που ελήφθησαν:

6. Το ποσό που προκύπτει διαιρείται με το άθροισμα των βαρών (συχνότητες):

Ας βάλουμε τους υπολογισμούς σε έναν πίνακα:

Ποσό κατάθεσης, τρίψτε.Αριθμός συντελεστών, στΤο μέσο του διαστήματος, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Σύνολο 400 - - - 23040000

Μάθημα νούμερο 4

Θέμα: «Περιγραφική στατιστική. Δείκτες της ποικιλομορφίας του χαρακτηριστικού στο σύνολο "

Τα κύρια κριτήρια για την ποικιλομορφία ενός χαρακτηριστικού στον στατιστικό πληθυσμό είναι: όριο, πλάτος, τυπική απόκλιση, συντελεστής ταλάντωσης και συντελεστής διακύμανσης. Στο προηγούμενο μάθημα, συζητήθηκε ότι οι μέσες τιμές δίνουν μόνο ένα γενικευτικό χαρακτηριστικό του υπό μελέτη χαρακτηριστικού συνολικά και δεν λαμβάνουν υπόψη τις τιμές των επιμέρους παραλλαγών του: τις ελάχιστες και μέγιστες τιμές, πάνω από τον μέσο όρο , κάτω από τον μέσο όρο κ.λπ.

Παράδειγμα. Μέσες τιμές δύο διαφορετικών αριθμητικών ακολουθιών: -100; -είκοσι; 100; 20 και 0,1; -0,2; Το 0,1 είναι ακριβώς το ίδιο και ίσοΟ.Ωστόσο, οι περιοχές διασποράς δεδομένων αυτών των σχετικών μέσων αλληλουχιών είναι πολύ διαφορετικές.

Ο ορισμός των παρατιθέμενων κριτηρίων για την ποικιλομορφία ενός χαρακτηριστικού πραγματοποιείται κυρίως λαμβάνοντας υπόψη την αξία του για μεμονωμένα στοιχεία του στατιστικού πληθυσμού.

Οι δείκτες μέτρησης της παραλλαγής ενός χαρακτηριστικού είναι απόλυτοςκαι συγγενής. Οι απόλυτοι δείκτες διακύμανσης περιλαμβάνουν: το εύρος διακύμανσης, όριο, τυπική απόκλιση, διακύμανση. Ο συντελεστής διακύμανσης και ο συντελεστής ταλάντωσης αναφέρονται σε σχετικά μέτρα διακύμανσης.

Όριο (lim)–αυτό είναι ένα κριτήριο που καθορίζεται από τις ακραίες τιμές της παραλλαγής στη σειρά παραλλαγής. Με άλλα λόγια, αυτό το κριτήριο περιορίζεται από τις ελάχιστες και μέγιστες τιμές του χαρακτηριστικού:

Πλάτος (Am)ή εύρος παραλλαγής -αυτή είναι η διαφορά μεταξύ των άκρων. Ο υπολογισμός αυτού του κριτηρίου πραγματοποιείται αφαιρώντας την ελάχιστη τιμή του από τη μέγιστη τιμή του χαρακτηριστικού, γεγονός που καθιστά δυνατή την εκτίμηση του βαθμού διασποράς της παραλλαγής:

Το μειονέκτημα του ορίου και του πλάτους ως κριτηρίων μεταβλητότητας είναι ότι εξαρτώνται πλήρως από τις ακραίες τιμές του χαρακτηριστικού στη σειρά παραλλαγής. Σε αυτήν την περίπτωση, οι διακυμάνσεις στις τιμές του χαρακτηριστικού εντός της σειράς δεν λαμβάνονται υπόψη.

Ο πληρέστερος χαρακτηρισμός της ποικιλομορφίας ενός χαρακτηριστικού σε έναν στατιστικό πληθυσμό δίνεται από το τυπική απόκλιση(σίγμα), το οποίο είναι ένα γενικό μέτρο της απόκλισης μιας παραλλαγής από τη μέση τιμή της. Η τυπική απόκλιση αναφέρεται επίσης συχνά ως τυπική απόκλιση.

Η βάση της τυπικής απόκλισης είναι η σύγκριση κάθε επιλογής με τον αριθμητικό μέσο όρο αυτού του πληθυσμού. Δεδομένου ότι στο σύνολο θα υπάρχουν πάντα επιλογές τόσο λιγότερες όσο και περισσότερες από αυτό, τότε το άθροισμα των αποκλίσεων που έχουν το σύμβολο "" θα εξοφληθεί με το άθροισμα των αποκλίσεων που έχουν το σύμβολο "", δηλ. το άθροισμα όλων των αποκλίσεων είναι μηδέν. Προκειμένου να αποφευχθεί η επιρροή των σημείων των διαφορών λαμβάνονται οι αποκλίσεις της παραλλαγής από τον αριθμητικό μέσο όρο στο τετράγωνο, δηλ. . Το άθροισμα των τετραγωνικών αποκλίσεων δεν είναι ίσο με μηδέν. Για να λάβετε έναν συντελεστή ικανό να μετρήσει τη μεταβλητότητα, πάρτε τον μέσο όρο του αθροίσματος των τετραγώνων - αυτή η τιμή ονομάζεται διασπορά:

Εξ ορισμού, η διακύμανση είναι το μέσο τετράγωνο των αποκλίσεων των μεμονωμένων τιμών ενός χαρακτηριστικού από τη μέση τιμή του. Διασπορά τετραγωνισμένη τυπική απόκλιση.

Η διασπορά είναι μια διαστατική ποσότητα (ονομασμένη). Έτσι, εάν οι παραλλαγές της σειράς αριθμών εκφράζονται σε μέτρα, τότε η διασπορά δίνει τετραγωνικά μέτρα. αν οι παραλλαγές εκφράζονται σε χιλιόγραμμα, τότε η διακύμανση δίνει το τετράγωνο αυτού του μέτρου (kg 2) και ούτω καθεξής.

Τυπική απόκλισηείναι η τετραγωνική ρίζα της διακύμανσης:

, τότε κατά τον υπολογισμό της διακύμανσης και της τυπικής απόκλισης στον παρονομαστή του κλάσματος, αντί γιαείναι απαραίτητο να τεθεί.

Ο υπολογισμός της τυπικής απόκλισης μπορεί να χωριστεί σε έξι βήματα, τα οποία πρέπει να πραγματοποιηθούν με μια συγκεκριμένη σειρά:

Εφαρμογή τυπικής απόκλισης:

α) να κρίνει τη διακύμανση των μεταβλητών σειρών και μια συγκριτική εκτίμηση της τυπικότητας (αντιπροσωπευτικότητας) των αριθμητικών μέσων. Αυτό είναι απαραίτητο στη διαφορική διάγνωση κατά τον προσδιορισμό της σταθερότητας των σημείων.

β) για την ανακατασκευή της μεταβλητής σειράς, δηλ. επαναφορά της απόκρισης συχνότητάς του με βάση κανόνες τριών σίγμα. Στο μεσοδιάστημα (М±3σ) υπάρχει το 99,7% όλων των παραλλαγών της σειράς, στο διάστημα (М±2σ) - 95,5% και στο διάστημα (М±1σ) - Επιλογή σειράς 68,3%.(Εικ. 1).

γ) για τον προσδιορισμό των "αναδυόμενων" επιλογών

δ) για τον προσδιορισμό των παραμέτρων του κανόνα και της παθολογίας χρησιμοποιώντας εκτιμήσεις σίγμα

ε) να υπολογιστεί ο συντελεστής διακύμανσης

ε) να υπολογιστεί το μέσο σφάλμα του αριθμητικού μέσου όρου.

Να χαρακτηρίσει κάθε γενικό πληθυσμό που έχειτύπος κανονικής κατανομής , αρκεί να γνωρίζουμε δύο παραμέτρους: τον αριθμητικό μέσο όρο και την τυπική απόκλιση.

Εικόνα 1. Κανόνας Τριών Σίγμα

Παράδειγμα.

Στην παιδιατρική, η τυπική απόκλιση χρησιμοποιείται για την αξιολόγηση της σωματικής ανάπτυξης των παιδιών συγκρίνοντας τα δεδομένα ενός συγκεκριμένου παιδιού με τους αντίστοιχους τυπικούς δείκτες. Ως πρότυπο λαμβάνονται οι αριθμητικοί μέσοι δείκτες της σωματικής ανάπτυξης υγιών παιδιών. Η σύγκριση των δεικτών με τα πρότυπα πραγματοποιείται σύμφωνα με ειδικούς πίνακες, στους οποίους δίνονται τα πρότυπα μαζί με τις αντίστοιχες κλίμακες σίγμα. Πιστεύεται ότι εάν ο δείκτης της φυσικής ανάπτυξης του παιδιού είναι εντός του προτύπου (αριθμητικός μέσος όρος) ± σ, τότε η σωματική ανάπτυξη του παιδιού (σύμφωνα με αυτόν τον δείκτη) αντιστοιχεί στον κανόνα. Εάν ο δείκτης είναι εντός του προτύπου ±2σ, τότε υπάρχει μια μικρή απόκλιση από τον κανόνα. Εάν ο δείκτης υπερβαίνει αυτά τα όρια, τότε η σωματική ανάπτυξη του παιδιού διαφέρει απότομα από τον κανόνα (η παθολογία είναι δυνατή).

Εκτός από τους δείκτες διακύμανσης που εκφράζονται σε απόλυτες τιμές, η στατιστική έρευνα χρησιμοποιεί δείκτες διακύμανσης που εκφράζονται σε σχετικές τιμές. Συντελεστής ταλάντωσης -αυτός είναι ο λόγος του εύρους διακύμανσης προς τη μέση τιμή του χαρακτηριστικού. Ο συντελεστής διακύμανσης -αυτός είναι ο λόγος της τυπικής απόκλισης προς τη μέση τιμή του χαρακτηριστικού. Συνήθως, αυτές οι τιμές εκφράζονται ως ποσοστό.

Τύποι για τον υπολογισμό των σχετικών δεικτών διακύμανσης:

Από τους παραπάνω τύπους φαίνεται ότι όσο μεγαλύτερος είναι ο συντελεστής V κοντά στο μηδέν, τόσο μικρότερη είναι η διακύμανση των τιμών των χαρακτηριστικών. Περισσότερο V, τόσο πιο μεταβλητό είναι το πρόσημο.

Στη στατιστική πρακτική, ο συντελεστής διακύμανσης χρησιμοποιείται συχνότερα. Χρησιμοποιείται όχι μόνο για μια συγκριτική αξιολόγηση της διακύμανσης, αλλά και για τον χαρακτηρισμό της ομοιογένειας του πληθυσμού. Το σύνολο θεωρείται ομοιογενές εάν ο συντελεστής διακύμανσης δεν υπερβαίνει το 33% (για κατανομές κοντά στο κανονικό). Αριθμητικά, η αναλογία του σ και του αριθμητικού μέσου ισοπεδώνει την επίδραση της απόλυτης τιμής αυτών των χαρακτηριστικών, και η ποσοστιαία αναλογία καθιστά τον συντελεστή διακύμανσης μια τιμή αδιάστατη (χωρίς όνομα).

Η λαμβανόμενη τιμή του συντελεστή διακύμανσης εκτιμάται σύμφωνα με τις κατά προσέγγιση διαβαθμίσεις του βαθμού ποικιλομορφίας του χαρακτηριστικού:

Αδύναμο - έως 10%

Μέσος όρος - 10 - 20%

Ισχυρό - περισσότερο από 20%

Η χρήση του συντελεστή διακύμανσης ενδείκνυται σε περιπτώσεις όπου είναι απαραίτητο να συγκριθούν χαρακτηριστικά που είναι διαφορετικά σε μέγεθος και διάσταση.

Η διαφορά μεταξύ του συντελεστή διακύμανσης και άλλων κριτηρίων διασποράς καταδεικνύεται ξεκάθαρα από παράδειγμα.

Τραπέζι 1

Σύνθεση εργαζομένων βιομηχανικής επιχείρησης

Με βάση τα στατιστικά χαρακτηριστικά που δίνονται στο παράδειγμα, συνάγεται το συμπέρασμα ότι η ηλικιακή σύνθεση και το μορφωτικό επίπεδο των εργαζομένων της επιχείρησης είναι σχετικά ομοιογενή, με χαμηλή επαγγελματική σταθερότητα του ερωτώμενου δυναμικού. Είναι εύκολο να δούμε ότι μια προσπάθεια να κριθούν αυτές οι κοινωνικές τάσεις με βάση την τυπική απόκλιση θα οδηγούσε σε ένα εσφαλμένο συμπέρασμα και μια προσπάθεια σύγκρισης των λογιστικών χαρακτηριστικών "εργασιακή εμπειρία" και "ηλικία" με το λογιστικό χαρακτηριστικό "εκπαίδευση" θα ήταν γενικά λανθασμένη λόγω της ετερογένειας αυτών των χαρακτηριστικών.

Διάμεσος και εκατοστιαίες τιμές

Για τις τακτικές (κατάταξη) κατανομές, όπου το κριτήριο για το μέσο της σειράς είναι η διάμεσος, η τυπική απόκλιση και η διακύμανση δεν μπορούν να χρησιμεύσουν ως χαρακτηριστικά της διασποράς της παραλλαγής.

Το ίδιο ισχύει για τις ανοιχτές παραλλαγές σειρές. Η περίσταση αυτή οφείλεται στο γεγονός ότι οι αποκλίσεις, σύμφωνα με τις οποίες υπολογίζεται η διασπορά και το σ, υπολογίζονται από τον αριθμητικό μέσο όρο, ο οποίος δεν υπολογίζεται σε ανοιχτές μεταβλητές σειρές και στη σειρά κατανομών ποιοτικών χαρακτηριστικών. Επομένως, για μια συμπιεσμένη περιγραφή των κατανομών, χρησιμοποιείται μια άλλη παράμετρος scatter - ποσοστό(συνώνυμο - «εκατοστηστό»), κατάλληλο για την περιγραφή ποιοτικών και ποσοτικών χαρακτηριστικών σε οποιαδήποτε μορφή κατανομής τους. Αυτή η παράμετρος μπορεί επίσης να χρησιμοποιηθεί για τη μετατροπή ποσοτικών χαρακτηριστικών σε ποιοτικά. Σε αυτήν την περίπτωση, τέτοιες βαθμολογίες εκχωρούνται ανάλογα με τη σειρά του ποσοστού που αντιστοιχεί σε μια ή την άλλη συγκεκριμένη επιλογή.

Στην πρακτική της βιοϊατρικής έρευνας, χρησιμοποιούνται συχνότερα τα ακόλουθα ποσοστά:

– διάμεσος

, είναι τεταρτημόρια (τέταρτα), όπου είναι το κάτω τεταρτημόριο, κορυφαίο τεταρτημόριο.

Τα ποσοστά χωρίζουν την περιοχή των πιθανών αλλαγών σε μια μεταβλητή σειρά σε ορισμένα διαστήματα. Η διάμεσος (ποσοστό) είναι η παραλλαγή που βρίσκεται στο μέσο της σειράς παραλλαγής και χωρίζει αυτή τη σειρά στη μέση, σε δύο ίσα μέρη ( 0,5 και 0,5 ). Το τεταρτημόριο χωρίζει τη σειρά σε τέσσερα μέρη: το πρώτο μέρος (κάτω τεταρτημόριο) είναι η επιλογή που χωρίζει τις επιλογές των οποίων οι αριθμητικές τιμές δεν υπερβαίνουν το 25% του μέγιστου δυνατού σε αυτήν τη σειρά, το τεταρτημόριο διαχωρίζει επιλογές με αριθμητική τιμή έως 50 % του μέγιστου δυνατού. Το ανώτερο τεταρτημόριο () διαχωρίζει τις επιλογές έως και το 75% των μέγιστων δυνατών τιμών.

Σε περίπτωση ασύμμετρης κατανομής μεταβλητή σε σχέση με τον αριθμητικό μέσο όρο, η διάμεσος και τα τεταρτημόρια χρησιμοποιούνται για τον χαρακτηρισμό της.Σε αυτήν την περίπτωση, χρησιμοποιείται η ακόλουθη μορφή εμφάνισης της μέσης τιμής - Μου (;). Για παράδειγμα, το υπό μελέτη χαρακτηριστικό - «η περίοδος κατά την οποία το παιδί άρχισε να περπατά ανεξάρτητα» - στην ομάδα μελέτης έχει ασύμμετρη κατανομή. Ταυτόχρονα, το κάτω τεταρτημόριο () αντιστοιχεί στην έναρξη του περπατήματος - 9,5 μήνες, το διάμεσο - 11 μήνες, το ανώτερο τεταρτημόριο () - 12 μήνες. Αντίστοιχα, το χαρακτηριστικό της μέσης τάσης του καθορισμένου χαρακτηριστικού θα παρουσιαστεί ως 11 (9,5; 12) μήνες.

Εκτίμηση της στατιστικής σημασίας των αποτελεσμάτων της μελέτης

Η στατιστική σημασία των δεδομένων νοείται ως ο βαθμός αντιστοιχίας τους με την εμφανιζόμενη πραγματικότητα, δηλ. Στατιστικά σημαντικά δεδομένα είναι αυτά που δεν διαστρεβλώνουν και αντικατοπτρίζουν σωστά την αντικειμενική πραγματικότητα.

Η αξιολόγηση της στατιστικής σημασίας των αποτελεσμάτων μιας μελέτης σημαίνει να προσδιοριστεί με ποια πιθανότητα είναι δυνατόν να μεταφερθούν τα αποτελέσματα που λαμβάνονται σε έναν πληθυσμό δείγματος σε ολόκληρο τον πληθυσμό. Μια αξιολόγηση της στατιστικής σημασίας είναι απαραίτητη για να κατανοήσουμε πόσο ένα μέρος του φαινομένου μπορεί να χρησιμοποιηθεί για να κριθεί το φαινόμενο στο σύνολό του και τα μοτίβα του.

Η αξιολόγηση της στατιστικής σημασίας των αποτελεσμάτων της μελέτης αποτελείται από:

1. σφάλματα αντιπροσωπευτικότητας (λάθη μέσες και σχετικές τιμές) - Μ;

2. Όρια εμπιστοσύνης μέσες ή σχετικές τιμές.

3. αξιοπιστία της διαφοράς μεταξύ μέσων ή σχετικών τιμών σύμφωνα με το κριτήριο t.

Τυπικό σφάλμα του αριθμητικού μέσου όρουή σφάλμα αντιπροσωπευτικότηταςχαρακτηρίζει τις διακυμάνσεις του μέσου όρου. Πρέπει να σημειωθεί ότι όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερο είναι το spread των μέσων τιμών. Το τυπικό σφάλμα του μέσου όρου υπολογίζεται από τον τύπο:

Στη σύγχρονη επιστημονική βιβλιογραφία, ο αριθμητικός μέσος όρος γράφεται μαζί με το σφάλμα αντιπροσωπευτικότητας:

ή μαζί με την τυπική απόκλιση:

Για παράδειγμα, λάβετε υπόψη δεδομένα για 1.500 αστικές πολυϊατρικές κλινικές στη χώρα (γενικός πληθυσμός). Ο μέσος όρος των ασθενών που εξυπηρετούνται στην πολυκλινική είναι 18150 άτομα. Η τυχαία επιλογή του 10% των αντικειμένων (150 πολυκλινικές) δίνει έναν μέσο αριθμό ασθενών ίσο με 20051 άτομα. Το δειγματοληπτικό σφάλμα, που προφανώς σχετίζεται με το γεγονός ότι δεν συμπεριλήφθηκαν και οι 1500 πολυκλινικές στο δείγμα, είναι ίσο με τη διαφορά μεταξύ αυτών των μέσων όρων - ο γενικός μέσος όρος ( Μγονίδιο) και μέσος όρος δείγματος ( Μ sb). Εάν σχηματίσουμε ένα άλλο δείγμα ίδιου μεγέθους από τον πληθυσμό μας, θα δώσει διαφορετικό ποσό σφάλματος. Όλα αυτά τα μέσα δειγματοληψίας, με αρκετά μεγάλα δείγματα, κανονικά κατανέμονται γύρω από τη γενική μέση τιμή με έναν αρκετά μεγάλο αριθμό επαναλήψεων ενός δείγματος του ίδιου αριθμού αντικειμένων από τον γενικό πληθυσμό. Τυπικό σφάλμα του μέσου όρου Μείναι η αναπόφευκτη εξάπλωση των μέσων δείγματος γύρω από τη γενική μέση τιμή.

Στην περίπτωση που τα αποτελέσματα της μελέτης παρουσιάζονται σε σχετικές τιμές (για παράδειγμα, ποσοστά), το κοινή χρήση τυπικού σφάλματος:

όπου P είναι ο δείκτης σε %, n είναι ο αριθμός των παρατηρήσεων.

Το αποτέλεσμα εμφανίζεται ως (Ρ ± m)%. Για παράδειγμα,το ποσοστό ανάρρωσης μεταξύ των ασθενών ήταν (95,2±2,5)%.

Αν ο αριθμός των στοιχείων στον πληθυσμό, τότε κατά τον υπολογισμό των τυπικών σφαλμάτων του μέσου όρου και του μεριδίου στον παρονομαστή του κλάσματος, αντί γιαείναι απαραίτητο να τεθεί.

Για μια κανονική κατανομή (η κατανομή του μέσου όρου του δείγματος είναι κανονική), είναι γνωστό πόσο από τον πληθυσμό εμπίπτει σε οποιοδήποτε διάστημα γύρω από τον μέσο όρο. Συγκεκριμένα:

Στην πράξη, το πρόβλημα έγκειται στο γεγονός ότι τα χαρακτηριστικά του γενικού πληθυσμού είναι άγνωστα σε εμάς και το δείγμα γίνεται ακριβώς για τον σκοπό της αξιολόγησής τους. Αυτό σημαίνει ότι αν πάρουμε δείγματα ίδιου μεγέθους nαπό τον γενικό πληθυσμό, τότε στο 68,3% των περιπτώσεων το διάστημα θα περιέχει την τιμή Μ(θα είναι στο μεσοδιάστημα στο 95,5% των περιπτώσεων και στο μεσοδιάστημα στο 99,7% των περιπτώσεων).

Δεδομένου ότι στην πραγματικότητα γίνεται μόνο ένα δείγμα, αυτή η δήλωση διατυπώνεται ως προς την πιθανότητα: με πιθανότητα 68,3%, η μέση τιμή του χαρακτηριστικού στο γενικό πληθυσμό περιέχεται στο διάστημα, με πιθανότητα 95,5% - στο μεσοδιάστημα κ.λπ.

Στην πράξη, ένα τέτοιο διάστημα χτίζεται γύρω από την τιμή του δείγματος, το οποίο, με δεδομένη (αρκετά υψηλή) πιθανότητα - πιθανότητα εμπιστοσύνης -θα «κάλυπτε» την πραγματική τιμή αυτής της παραμέτρου στον γενικό πληθυσμό. Αυτό το διάστημα ονομάζεται διάστημα εμπιστοσύνης.

Πιθανότητα εμπιστοσύνηςΠ είναι ο βαθμός εμπιστοσύνης ότι το διάστημα εμπιστοσύνης θα περιέχει πράγματι την πραγματική (άγνωστη) τιμή της παραμέτρου στον πληθυσμό.

Για παράδειγμα, εάν το επίπεδο εμπιστοσύνης Rίσο με 90%, αυτό σημαίνει ότι 90 δείγματα από τα 100 θα δώσουν μια σωστή εκτίμηση της παραμέτρου στο γενικό πληθυσμό. Αντίστοιχα, η πιθανότητα λάθους, δηλ. λανθασμένη εκτίμηση του γενικού μέσου όρου για το δείγμα, είναι ίση σε ποσοστό: . Για αυτό το παράδειγμα, αυτό σημαίνει ότι 10 δείγματα από τα 100 θα δώσουν μια εσφαλμένη εκτίμηση.

Προφανώς, ο βαθμός εμπιστοσύνης (πιθανότητα εμπιστοσύνης) εξαρτάται από το μέγεθος του διαστήματος: όσο μεγαλύτερο είναι το διάστημα, τόσο μεγαλύτερη είναι η εμπιστοσύνη ότι μια άγνωστη τιμή για τον γενικό πληθυσμό θα εμπίπτει σε αυτό. Στην πράξη, λαμβάνεται τουλάχιστον το διπλάσιο του σφάλματος δειγματοληψίας για την κατασκευή ενός διαστήματος εμπιστοσύνης για την παροχή τουλάχιστον 95,5% εμπιστοσύνης.

Ο προσδιορισμός των ορίων εμπιστοσύνης των μέσων και των σχετικών τιμών μας επιτρέπει να βρούμε τις δύο ακραίες τιμές τους - την ελάχιστη δυνατή και τη μέγιστη δυνατή, εντός των οποίων ο υπό μελέτη δείκτης μπορεί να εμφανιστεί σε ολόκληρο τον γενικό πληθυσμό. Βασισμένο σε αυτό, όρια εμπιστοσύνης (ή διάστημα εμπιστοσύνης)- αυτά είναι τα όρια των μέσων ή σχετικών τιμών, η υπέρβαση των οποίων λόγω τυχαίων διακυμάνσεων έχει ασήμαντη πιθανότητα.

Το διάστημα εμπιστοσύνης μπορεί να ξαναγραφτεί ως: , όπου tείναι κριτήριο εμπιστοσύνης.

Τα όρια εμπιστοσύνης του αριθμητικού μέσου όρου στο γενικό πληθυσμό καθορίζονται από τον τύπο:

Μ γονίδιο = Μ επιλέγω + tm Μ

για σχετική τιμή:

R γονίδιο = Π επιλέγω + tm R

όπου Μ γονίδιοκαι R γονίδιο- τιμές του μέσου όρου και των σχετικών τιμών για το γενικό πληθυσμό. Μ επιλέγωκαι R επιλέγω- οι τιμές του μέσου όρου και των σχετικών τιμών που λαμβάνονται στον πληθυσμό του δείγματος· Μ Μκαι Μ Π- σφάλματα μέσες και σχετικές τιμές. t- κριτήριο εμπιστοσύνης (κριτήριο ακρίβειας, το οποίο ορίζεται κατά τον προγραμματισμό της μελέτης και μπορεί να είναι ίσο με 2 ή 3). tm- αυτό είναι το διάστημα εμπιστοσύνης ή Δ - το οριακό σφάλμα του δείκτη που λήφθηκε στη δειγματοληπτική μελέτη.

Πρέπει να σημειωθεί ότι η αξία του κριτηρίου tσε κάποιο βαθμό, σχετίζεται με την πιθανότητα μιας πρόβλεψης χωρίς σφάλματα (p), εκφρασμένη σε%. Επιλέγεται από τον ίδιο τον ερευνητή, με γνώμονα την ανάγκη απόκτησης ενός αποτελέσματος με τον απαιτούμενο βαθμό ακρίβειας. Άρα, για την πιθανότητα μιας πρόβλεψης χωρίς σφάλματα 95,5%, η τιμή του κριτηρίου tείναι 2, για 99,7% - 3.

Οι δεδομένες εκτιμήσεις του διαστήματος εμπιστοσύνης είναι αποδεκτές μόνο για στατιστικούς πληθυσμούς με περισσότερες από 30 παρατηρήσεις. Με μικρότερο μέγεθος πληθυσμού (μικρά δείγματα), χρησιμοποιούνται ειδικοί πίνακες για τον προσδιορισμό του κριτηρίου t. Σε αυτούς τους πίνακες, η επιθυμητή τιμή βρίσκεται στην τομή της γραμμής που αντιστοιχεί στο μέγεθος του πληθυσμού (n-1), και μια στήλη που αντιστοιχεί στο επίπεδο πιθανότητας μιας πρόβλεψης χωρίς σφάλματα (95,5%· 99,7%) που επιλέχτηκε από τον ερευνητή. Στην ιατρική έρευνα, κατά τον καθορισμό ορίων εμπιστοσύνης για οποιονδήποτε δείκτη, η πιθανότητα μιας πρόβλεψης χωρίς σφάλματα είναι 95,5% ή περισσότερο. Αυτό σημαίνει ότι η τιμή του δείκτη που λαμβάνεται στον πληθυσμό του δείγματος θα πρέπει να βρίσκεται στο γενικό πληθυσμό τουλάχιστον στο 95,5% των περιπτώσεων.

    Ερωτήσεις για το θέμα του μαθήματος:

    Η συνάφεια των δεικτών της διαφορετικότητας ενός χαρακτηριστικού στον στατιστικό πληθυσμό.

    Γενικά χαρακτηριστικά των απόλυτων δεικτών διακύμανσης.

    Τυπική απόκλιση, υπολογισμός, εφαρμογή.

    Σχετικοί δείκτες διακύμανσης.

    Διάμεσος, τεταρτημόριο βαθμολογία.

    Αξιολόγηση της στατιστικής σημασίας των αποτελεσμάτων της μελέτης.

    Τυπικό σφάλμα του αριθμητικού μέσου όρου, τύπος υπολογισμού, παράδειγμα χρήσης.

    Υπολογισμός της μετοχής και το τυπικό σφάλμα της.

    Η έννοια της πιθανότητας εμπιστοσύνης, ένα παράδειγμα χρήσης.

10. Η έννοια του διαστήματος εμπιστοσύνης, η εφαρμογή του.

    Δοκιμαστικές εργασίες για το θέμα με δείγματα απαντήσεων:

1. ΑΠΟΛΥΤΟΙ ΔΕΙΚΤΕΣ ΠΑΡΑΛΛΑΓΗΣ ΕΙΝΑΙ

1) συντελεστής διακύμανσης

2) συντελεστής ταλάντωσης

4) διάμεσος

2. ΣΧΕΤΙΚΟΙ ΔΕΙΚΤΕΣ ΠΑΡΑΛΛΑΓΗΣ ΕΙΝΑΙ

1) διασπορά

4) συντελεστής διακύμανσης

3. ΕΝΑ ΚΡΙΤΗΡΙΟ ΠΟΥ ΠΡΟΣΔΙΟΡΙΖΕΤΑΙ ΑΠΟ ΤΙΣ ΑΚΡΑΤΕΣ ΑΞΙΕΣ ΜΙΑΣ ΠΑΡΑΛΛΑΓΗΣ ΣΕ ΜΙΑ ΠΑΡΑΛΛΑΚΤΙΚΗ ΣΕΙΡΑ

2) πλάτος

3) διασπορά

4) συντελεστής διακύμανσης

4. Η ΔΙΑΦΟΡΑ ΤΗΣ ΕΞΑΙΡΕΤΙΚΗΣ ΕΠΙΛΟΓΗΣ ΕΙΝΑΙ

2) πλάτος

3) τυπική απόκλιση

4) συντελεστής διακύμανσης

5. ΜΕΣΟ ΤΕΤΡΑΓΩΝΟ ΑΠΟΚΛΙΣΕΩΝ ΜΕΜΟΝΩΜΕΝΩΝ ΣΗΜΑΝΤΙΚΩΝ ΤΙΜΩΝ ΑΠΟ ΤΗ ΜΕΣΗ ΤΙΜΗ ΤΟΥ ΕΙΝΑΙ

1) συντελεστής ταλάντωσης

2) διάμεσος

3) διασπορά

6. Ο ΛΟΓΟΣ ΤΟΥ ΕΜΒΑΣΜΑΤΟΣ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΠΡΟΣ ΤΗ ΜΕΣΗ ΤΙΜΗ ΕΝΟΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΕΙΝΑΙ

1) συντελεστής διακύμανσης

2) τυπική απόκλιση

4) συντελεστής ταλάντωσης

7. ΛΟΓΟΣ ΤΗΣ ΜΕΣΗΣ ΤΕΤΡΑΓΩΝΙΚΗΣ ΑΠΟΚΛΙΣΗΣ ΠΡΟΣ ΤΗ ΜΕΣΗ ΤΙΜΗ ΕΝΟΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΕΙΝΑΙ

1) διασπορά

2) συντελεστής διακύμανσης

3) συντελεστής ταλάντωσης

4) πλάτος

8. ΜΙΑ ΠΑΡΑΛΛΑΓΗ ΠΟΥ ΒΡΙΣΚΕΤΑΙ ΣΤΟ ΜΕΣΑ ΜΙΑΣ ΣΕΙΡΑΣ ΠΑΡΑΛΛΑΓΗΣ ΚΑΙ ΤΗΝ ΧΩΡΙΖΕΙ ΣΕ ΔΥΟ ΙΣΑ ΜΕΡΗ ΕΙΝΑΙ

1) διάμεσος

3) πλάτος

9. ΣΤΗΝ ΙΑΤΡΙΚΗ ΕΡΕΥΝΑ, ΟΤΑΝ ΘΕΜΙΖΟΝΤΑΙ ΟΡΙΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΟΠΟΙΟΥΔΗΠΟΤΕ ΔΕΙΚΤΗ, ΓΙΝΕΤΑΙ ΑΠΟΔΕΚΤΗ Η ΠΙΘΑΝΟΤΗΤΑ ΜΙΑΣ ΠΡΟΒΛΕΨΗΣ ΧΩΡΙΣ ΣΦΑΛΜΑΤΑ

10. ΑΝ 90 ΔΕΙΓΜΑΤΑ ΑΠΟ ΤΑ 100 ΔΙΝΟΥΝ ΣΩΣΤΗ ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΟΥ ΣΕ ΓΕΝΙΚΟ ΠΛΗΘΥΣΜΟ, ΤΟΤΕ ΑΥΤΟ ΣΗΜΑΙΝΕΙ ΟΤΙ Η ΠΙΘΑΝΟΤΗΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΠΙΣΟΣ

11. ΣΕ ΠΕΡΙΠΤΩΣΗ ΑΝ 10 ΔΕΙΓΜΑΤΑ ΑΠΟ 100 ΔΙΝΟΥΝ ΛΑΘΟΣ ΕΚΤΙΜΗΣΗ, Η ΠΙΘΑΝΟΤΗΤΑ ΣΦΑΛΜΑΤΟΣ ΕΙΝΑΙ

.

1) διάστημα εμπιστοσύνης

2) πλάτος

4) συντελεστής διακύμανσης

13. ΜΙΚΡΟ ΔΕΙΓΜΑ ΘΕΩΡΕΙΤΑΙ Ο ΠΛΗΘΥΣΜΟΣ ΣΤΟΝ ΟΠΟΙΟ

1) το n είναι μικρότερο ή ίσο με 100

2) το n είναι μικρότερο ή ίσο με 30

3) το n είναι μικρότερο ή ίσο με 40

4) n είναι κοντά στο 0

14. ΓΙΑ ΤΗΝ ΠΙΘΑΝΟΤΗΤΑ ΠΡΟΒΛΕΨΗΣ ΧΩΡΙΣ ΣΦΑΛΜΑΤΑ 95% ΤΙΜΗ ΚΡΙΤΗΡΙΟΥ tΣΥΝΘΕΤΕΙ

15. ΓΙΑ ΤΗΝ ΠΙΘΑΝΟΤΗΤΑ ΠΡΟΒΛΕΨΗΣ ΧΩΡΙΣ ΣΦΑΛΜΑΤΑ 99% ΤΙΜΗ ΚΡΙΤΗΡΙΟΥ tΣΥΝΘΕΤΕΙ

16. ΓΙΑ ΚΑΤΑΝΟΜΕΣ ΠΛΗΣΙΟΝ ΣΤΟ ΚΑΝΟΝΙΚΟ Ο ΠΛΗΘΥΣΜΟΣ ΘΕΩΡΕΙΤΑΙ ΟΜΟΙΟΓΕΝΗΣ ΑΝ Ο ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΟΛΗΣ ΔΕΝ ΥΠΕΡΒΑΙΝΕΙ

17. ΕΠΙΛΟΓΗ ΔΙΑΧΩΡΙΣΜΟΥ ΠΑΡΑΛΛΑΓΩΝ ΠΟΥ ΟΙ ΑΡΙΘΜΗΤΙΚΕΣ ΤΙΜΕΣ ΔΕΝ ΥΠΕΡΒΑΙΝΟΥΝ ΤΟ 25% ΤΗΣ ΜΕΓΙΣΤΗΣ ΔΥΝΑΤΟΤΗΤΑΣ ΣΕ ΑΥΤΗ ΤΗ ΣΕΙΡΑ ΕΙΝΑΙ

2) κατώτερο τεταρτημόριο

3) άνω τεταρτημόριο

4) τεταρτημόριο

18. ΔΕΔΟΜΕΝΑ ΠΟΥ ΔΕΝ ΣΤΡΕΒΛΩΦΟΥΝ ΚΑΙ ΑΝΤΑΝΑΚΛΑΖΟΥΝ ΣΩΣΤΑ ΑΝΤΙΚΕΙΜΕΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ ΟΝΟΟΥΝΤΑΙ

1) αδύνατον

2) εξίσου δυνατό

3) αξιόπιστο

4) τυχαία

19. ΣΥΜΦΩΝΑ ΜΕ ΤΟΝ ΚΑΝΟΝΑ ΤΡΙΩΝ ΣΙΓΜΩΝ, ΜΕ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ ΣΗΜΕΙΟΥ ΕΝΤΟΣ
ΘΑ ΒΡΙΣΚΕΤΑΙ

1) Επιλογή 68,3%.

Σοφοί μαθηματικοί και στατιστικολόγοι κατέληξαν σε έναν πιο αξιόπιστο δείκτη, αν και για έναν ελαφρώς διαφορετικό σκοπό - μέση γραμμική απόκλιση. Αυτός ο δείκτης χαρακτηρίζει το μέτρο της εξάπλωσης των τιμών του συνόλου δεδομένων γύρω από τη μέση τιμή τους.

Για να δείξετε το μέτρο της εξάπλωσης των δεδομένων, πρέπει πρώτα να προσδιορίσετε σε τι σχέση θα θεωρείται αυτό το spread - συνήθως αυτή είναι η μέση τιμή. Στη συνέχεια, πρέπει να υπολογίσετε πόσο μακριά απέχουν οι τιμές του αναλυόμενου συνόλου δεδομένων από τον μέσο όρο. Είναι σαφές ότι κάθε τιμή αντιστοιχεί σε ένα ορισμένο ποσό απόκλισης, αλλά μας ενδιαφέρει επίσης μια γενική εκτίμηση που καλύπτει ολόκληρο τον πληθυσμό. Επομένως, η μέση απόκλιση υπολογίζεται χρησιμοποιώντας τον τύπο του συνηθισμένου αριθμητικού μέσου όρου. Αλλά! Αλλά για να υπολογιστεί ο μέσος όρος των αποκλίσεων, πρέπει πρώτα να προστεθούν. Και αν προσθέσουμε θετικούς και αρνητικούς αριθμούς, θα ακυρωθούν μεταξύ τους και το άθροισμά τους θα τείνει στο μηδέν. Για να αποφευχθεί αυτό, όλες οι αποκλίσεις λαμβάνονται modulo, δηλαδή όλοι οι αρνητικοί αριθμοί γίνονται θετικοί. Τώρα η μέση απόκλιση θα δείχνει ένα γενικευμένο μέτρο της εξάπλωσης των τιμών. Ως αποτέλεσμα, η μέση γραμμική απόκλιση θα υπολογιστεί από τον τύπο:

έναείναι η μέση γραμμική απόκλιση,

Χ- ο αναλυόμενος δείκτης, με μια παύλα στην κορυφή - η μέση τιμή του δείκτη,

nείναι ο αριθμός των τιμών στο σύνολο δεδομένων που αναλύθηκε,

ο τελεστής άθροισης, ελπίζω, να μην τρομάζει κανέναν.

Η μέση γραμμική απόκλιση που υπολογίζεται χρησιμοποιώντας τον καθορισμένο τύπο αντικατοπτρίζει τη μέση απόλυτη απόκλιση από τη μέση τιμή για αυτόν τον πληθυσμό.

Η κόκκινη γραμμή στην εικόνα είναι η μέση τιμή. Οι αποκλίσεις κάθε παρατήρησης από το μέσο όρο υποδεικνύονται με μικρά βέλη. Λαμβάνονται modulo και συνοψίζονται. Τότε όλα διαιρούνται με τον αριθμό των τιμών.

Για να ολοκληρωθεί η εικόνα, πρέπει να δοθεί ένα ακόμη παράδειγμα. Ας πούμε ότι υπάρχει μια εταιρεία που κατασκευάζει μοσχεύματα για φτυάρια. Κάθε κόψιμο πρέπει να έχει μήκος 1,5 μέτρο, αλλά, το πιο σημαντικό, να είναι όλα τα ίδια ή τουλάχιστον συν ή πλην 5 εκ. Ωστόσο, οι αμελείς εργάτες θα κόψουν 1,2 μ. και μετά 1,8 μ. . Ο διευθυντής της εταιρείας αποφάσισε να πραγματοποιήσει μια στατιστική ανάλυση του μήκους των μοσχευμάτων. Διάλεξα 10 κομμάτια και μέτρησα το μήκος τους, βρήκα τον μέσο όρο και υπολόγισα τη μέση γραμμική απόκλιση. Ο μέσος όρος αποδείχθηκε ότι ήταν ακριβώς αυτό που χρειάζεται - 1,5 μ. Αλλά η μέση γραμμική απόκλιση αποδείχθηκε ότι ήταν 0,16 μ. Έτσι αποδεικνύεται ότι κάθε κοπή είναι μακρύτερο ή μικρότερο από το απαραίτητο κατά μέσο όρο 16 εκ. Υπάρχει κάτι που συζητήστε με τους εργαζόμενους. Στην πραγματικότητα, δεν έχω δει την πραγματική χρήση αυτού του δείκτη, οπότε βρήκα ένα παράδειγμα μόνος μου. Ωστόσο, υπάρχει ένας τέτοιος δείκτης στα στατιστικά στοιχεία.

Διασπορά

Όπως η μέση γραμμική απόκλιση, η διακύμανση αντικατοπτρίζει επίσης τον βαθμό στον οποίο τα δεδομένα εξαπλώνονται γύρω από τον μέσο όρο.

Ο τύπος για τον υπολογισμό της διακύμανσης μοιάζει με αυτό:

(για σειρές παραλλαγών (σταθμισμένη διακύμανση))

(για μη ομαδοποιημένα δεδομένα (απλή διακύμανση))

Όπου: σ 2 - διασπορά, Xi– αναλύουμε τον δείκτη sq (τιμή χαρακτηριστικών), – τη μέση τιμή του δείκτη, f i – τον ​​αριθμό των τιμών στο αναλυόμενο σύνολο δεδομένων.

Η διακύμανση είναι το μέσο τετράγωνο των αποκλίσεων.

Αρχικά, υπολογίζεται ο μέσος όρος, στη συνέχεια λαμβάνεται η διαφορά μεταξύ κάθε γραμμής βάσης και μέσου όρου, τετραγωνίζεται, πολλαπλασιάζεται με τη συχνότητα της αντίστοιχης τιμής χαρακτηριστικού, προστίθεται και στη συνέχεια διαιρείται με τον αριθμό των τιμών στον πληθυσμό.

Ωστόσο, στην καθαρή της μορφή, όπως, για παράδειγμα, ο αριθμητικός μέσος όρος ή ο δείκτης, η διασπορά δεν χρησιμοποιείται. Είναι μάλλον ένας βοηθητικός και ενδιάμεσος δείκτης που χρησιμοποιείται για άλλους τύπους στατιστικών αναλύσεων.

Απλοποιημένος τρόπος υπολογισμού της διακύμανσης

τυπική απόκλιση

Για να χρησιμοποιηθεί η διακύμανση για την ανάλυση δεδομένων, λαμβάνεται μια τετραγωνική ρίζα από αυτήν. Αποδεικνύεται το λεγόμενο τυπική απόκλιση.

Παρεμπιπτόντως, η τυπική απόκλιση ονομάζεται επίσης σίγμα - από το ελληνικό γράμμα που τη δηλώνει.

Η τυπική απόκλιση προφανώς χαρακτηρίζει και το μέτρο της διασποράς δεδομένων, αλλά τώρα (σε αντίθεση με τη διασπορά) μπορεί να συγκριθεί με τα αρχικά δεδομένα. Κατά κανόνα, οι δείκτες μέσου τετραγώνου στα στατιστικά δίνουν πιο ακριβή αποτελέσματα από τους γραμμικούς. Επομένως, η τυπική απόκλιση είναι ένα πιο ακριβές μέτρο της διασποράς δεδομένων από τη μέση γραμμική απόκλιση.

Μαθηματική προσδοκία και διακύμανση

Ας μετρήσουμε μια τυχαία μεταβλητή Νφορές, για παράδειγμα, μετράμε την ταχύτητα του ανέμου δέκα φορές και θέλουμε να βρούμε τη μέση τιμή. Πώς σχετίζεται η μέση τιμή με τη συνάρτηση κατανομής;

Θα ρίξουμε τα ζάρια πολλές φορές. Ο αριθμός των πόντων που θα πέσει στο ζάρι κατά τη διάρκεια κάθε ρίψης είναι μια τυχαία μεταβλητή και μπορεί να πάρει οποιεσδήποτε φυσικές τιμές από 1 έως 6. Ντείνει σε έναν πολύ συγκεκριμένο αριθμό - τη μαθηματική προσδοκία Μ x. Σε αυτήν την περίπτωση Μ x = 3,5.

Πώς προέκυψε αυτή η τιμή; Αφήνω μέσα ΝΟι δοκιμές μία φορά έπεσαν από 1 βαθμό, μία φορά - 2 βαθμούς και ούτω καθεξής. Επειτα Ν→ ∞ ο αριθμός των αποτελεσμάτων στα οποία έπεσε ένας βαθμός, Ομοίως, Από εδώ

Μοντέλο 4.5. Ζάρια

Ας υποθέσουμε τώρα ότι γνωρίζουμε τον νόμο κατανομής της τυχαίας μεταβλητής Χ, δηλαδή γνωρίζουμε ότι η τυχαία μεταβλητή Χμπορεί να πάρει αξίες Χ 1 , Χ 2 , ..., x kμε πιθανότητες Π 1 , Π 2 , ..., σελ κ.

Αναμενόμενη αξία Μ xτυχαία μεταβλητή Χισούται με:

Απάντηση. 2,8.

Η μαθηματική προσδοκία δεν είναι πάντα μια λογική εκτίμηση κάποιας τυχαίας μεταβλητής. Έτσι, για να υπολογίσουμε τον μέσο μισθό, είναι πιο λογικό να χρησιμοποιήσουμε την έννοια του διάμεσου, δηλαδή τέτοια τιμή ώστε ο αριθμός των ατόμων που λαμβάνουν λιγότερο από τον διάμεσο μισθό και περισσότερο να είναι ο ίδιος.

Διάμεσοςμια τυχαία μεταβλητή ονομάζεται αριθμός Χ 1/2 τέτοιο που Π (Χ < Χ 1/2) = 1/2.

Με άλλα λόγια, η πιθανότητα Π 1 ότι η τυχαία μεταβλητή Χθα είναι λιγότερο Χ 1/2 , και η πιθανότητα Π 2 ότι μια τυχαία μεταβλητή Χθα είναι μεγαλύτερη ΧΤο 1/2 είναι ίδιο και ίσο με 1/2. Η διάμεσος δεν καθορίζεται μοναδικά για όλες τις κατανομές.

Επιστροφή στην τυχαία μεταβλητή Χ, το οποίο μπορεί να πάρει τις τιμές Χ 1 , Χ 2 , ..., x kμε πιθανότητες Π 1 , Π 2 , ..., σελ κ.

διασποράτυχαία μεταβλητή Χείναι η μέση τιμή της τετραγωνικής απόκλισης μιας τυχαίας μεταβλητής από τη μαθηματική της προσδοκία:

Παράδειγμα 2

Υπό τις συνθήκες του προηγούμενου παραδείγματος, υπολογίστε τη διακύμανση και την τυπική απόκλιση μιας τυχαίας μεταβλητής Χ.

Απάντηση. 0,16, 0,4.

Μοντέλο 4.6. σκοποβολή

Παράδειγμα 3

Βρείτε την κατανομή πιθανότητας του αριθμού των σημείων που κυλήθηκαν στο ζάρι από την πρώτη ρίψη, τη διάμεσο, τη μαθηματική προσδοκία, τη διακύμανση και την τυπική απόκλιση.

Η πτώση οποιουδήποτε προσώπου είναι εξίσου πιθανή, επομένως η κατανομή θα μοιάζει με αυτό:

Τυπική απόκλιση Μπορεί να φανεί ότι η απόκλιση της τιμής από τη μέση τιμή είναι πολύ μεγάλη.

Ιδιότητες της μαθηματικής προσδοκίας:

  • Η μαθηματική προσδοκία του αθροίσματος των ανεξάρτητων τυχαίων μεταβλητών είναι ίση με το άθροισμα των μαθηματικών προσδοκιών τους:

Παράδειγμα 4

Βρείτε τη μαθηματική προσδοκία του αθροίσματος και του γινόμενου των πόντων που ρίχνονται σε δύο ζάρια.

Στο παράδειγμα 3, βρήκαμε ότι για έναν κύβο Μ (Χ) = 3,5. Έτσι για δύο κύβους

Ιδιότητες διασποράς:

  • Η διακύμανση του αθροίσματος των ανεξάρτητων τυχαίων μεταβλητών είναι ίση με το άθροισμα των διακυμάνσεων:

Dx + y = Dx + Dy.

Αφήστε για Νζάρια yσημεία. Επειτα

Αυτό το αποτέλεσμα δεν ισχύει μόνο για τα ζάρια. Σε πολλές περιπτώσεις, καθορίζει την ακρίβεια της μέτρησης της μαθηματικής προσδοκίας εμπειρικά. Μπορεί να φανεί ότι με αύξηση του αριθμού των μετρήσεων Νη εξάπλωση των τιμών γύρω από τον μέσο όρο, δηλαδή την τυπική απόκλιση, μειώνεται αναλογικά

Η διακύμανση μιας τυχαίας μεταβλητής σχετίζεται με τη μαθηματική προσδοκία του τετραγώνου αυτής της τυχαίας μεταβλητής με την ακόλουθη σχέση:

Ας βρούμε τις μαθηματικές προσδοκίες και των δύο μερών αυτής της ισότητας. Εξ ορισμού,

Η μαθηματική προσδοκία της δεξιάς πλευράς της ισότητας, σύμφωνα με την ιδιότητα των μαθηματικών προσδοκιών, είναι ίση με

Τυπική απόκλιση

τυπική απόκλισηισούται με την τετραγωνική ρίζα της διακύμανσης:
Κατά τον προσδιορισμό της τυπικής απόκλισης για έναν αρκετά μεγάλο όγκο του πληθυσμού που μελετήθηκε (n> 30), χρησιμοποιούνται οι ακόλουθοι τύποι:

Παρόμοιες πληροφορίες.