Βιογραφίες Χαρακτηριστικά Ανάλυση

Αυτό ονομάζεται διακύμανση στα στατιστικά στοιχεία. Σειρά παραλλαγής και παραλλαγής, εύρος παραλλαγής

Η έννοια της παραλλαγής και η σημασία της

ΠαραλλαγήΑυτή είναι η διαφορά στις τιμές οποιουδήποτε χαρακτηριστικού μεταξύ διαφορετικών μονάδων ενός δεδομένου πληθυσμού την ίδια περίοδο ή χρονική στιγμή.

Για παράδειγμα, οι εργαζόμενοι μιας εταιρείας διαφέρουν ως προς το εισόδημα, τον χρόνο που αφιερώνουν στην εργασία, το ύψος, το βάρος κ.λπ.

Η παραλλαγή προκύπτει ως αποτέλεσμα του γεγονότος ότι οι μεμονωμένες τιμές ενός χαρακτηριστικού σχηματίζονται υπό τη συνδυασμένη επίδραση διαφόρων παραγόντων (συνθηκών), οι οποίοι συνδυάζονται διαφορετικά σε κάθε ειδική περίπτωση. Επομένως, το μέγεθος κάθε επιλογής είναι αντικειμενικό.

Η μελέτη της διακύμανσης στις στατιστικές έχει μεγάλης σημασίας, επειδή βοηθά στην κατανόηση της ουσίας του φαινομένου που μελετάται. Η μέτρηση της διακύμανσης, η ανακάλυψη της αιτίας της, ο εντοπισμός της επιρροής μεμονωμένων παραγόντων δίνει σημαντικές πληροφορίες(για παράδειγμα, σχετικά με το προσδόκιμο ζωής των ανθρώπων, τα έσοδα και τα έξοδα του πληθυσμού, την οικονομική κατάσταση μιας επιχείρησης κ.λπ.) για τη λήψη επιστημονικά τεκμηριωμένων αποφάσεων διαχείρισης.

Η μέση τιμή παρέχει ένα γενικό χαρακτηριστικό του χαρακτηριστικού του πληθυσμού που μελετάται, αλλά δεν αποκαλύπτει τη δομή του πληθυσμού, η οποία είναι πολύ σημαντική για τις γνώσεις του. Ο μέσος όρος δεν δείχνει πώς βρίσκονται γύρω του οι παραλλαγές του μέσου όρου χαρακτηριστικού, είτε συγκεντρώνονται κοντά στο μέσο όρο είτε αποκλίνουν σημαντικά από αυτόν. Επομένως, για να χαρακτηριστούν οι διακυμάνσεις ενός χαρακτηριστικού, χρησιμοποιούνται δείκτες διακύμανσης.

Δείκτες διακύμανσης και η σημασία τους στις στατιστικές

Για τη μέτρηση της διακύμανσης ενός χαρακτηριστικού σε πληθυσμούς, χρησιμοποιούνται οι ακόλουθοι γενικοί δείκτες διακύμανσης: εύρος διακύμανσης, μέση γραμμική απόκλιση, διασπορά και μέσος όρος τυπική απόκλιση .

1. Ο πιο συνηθισμένος απόλυτος δείκτης είναι εύρος παραλλαγής(), που ορίζεται ως η διαφορά μεταξύ της μεγαλύτερης () και της μικρότερης () τιμών των επιλογών.

. (5.1)

Αυτός ο δείκτης είναι εύκολο να υπολογιστεί, γι 'αυτό ευρεία χρήση. Ωστόσο, καταγράφει μόνο ακραίες αποκλίσεις και δεν αντικατοπτρίζει τις αποκλίσεις όλων των παραλλαγών της σειράς.

2. Για ένα γενικό χαρακτηριστικό της κατανομής των αποκλίσεων, υπολογίστε μέση γραμμική απόκλιση , ορίζεται ως ο αριθμητικός μέσος όρος των αποκλίσεων ατομικές αξίεςαπό τον μέσο όρο, χωρίς να λαμβάνεται υπόψη το πρόσημο αυτών των αποκλίσεων:

Μη σταθμισμένη μέση γραμμική απόκλιση:

, (5.2)

Σταθμισμένη μέση γραμμική απόκλιση:

. (5.3)

Σε αυτούς τους τύπους, οι διαφορές στον αριθμητή λαμβάνονται modulo, διαφορετικά ο αριθμητής θα έχει πάντα ένα μηδέν. Επομένως, η μέση γραμμική απόκλιση ως μέτρο διακύμανσης ενός χαρακτηριστικού χρησιμοποιείται σπάνια στη στατιστική πρακτική, μόνο σε περιπτώσεις όπου η άθροιση των δεικτών χωρίς να λαμβάνονται υπόψη τα σημάδια έχει οικονομική αίσθηση. Με τη βοήθειά του, για παράδειγμα, αναλύεται η σύνθεση του εργατικού δυναμικού, ο ρυθμός παραγωγής και ο τζίρος του εξωτερικού εμπορίου.

3. Το μέτρο της διακύμανσης αντικατοπτρίζεται πιο αντικειμενικά από τον δείκτη αποκλίσεις ( - μεσαίο τετράγωνοαποκλίσεις), ορίζεται ως ο μέσος όρος των αποκλίσεων στο τετράγωνο:

Αστάθμιση:

, (5.4)

Σταθμισμένα:

. (5.5)

Η διασπορά είναι σημαντική σε οικονομική ανάλυση. ΣΕ μαθηματικές στατιστικές σημαντικός ρόλοςΗ διασπορά τους παίζει ρόλο στον χαρακτηρισμό της ποιότητας των στατιστικών εκτιμήσεων.

4. Η τετραγωνική ρίζα της διακύμανσης της «μέσης τετραγωνικής απόκλισης» είναι τυπική απόκλιση:

Η τυπική απόκλιση είναι ένα γενικό χαρακτηριστικό του μεγέθους της διακύμανσης ενός χαρακτηριστικού στο σύνολο. Δείχνει πόσο, κατά μέσο όρο, συγκεκριμένες επιλογές αποκλίνουν από τη μέση τιμή τους. είναι απόλυτο μέτροη μεταβλητότητα του χαρακτηριστικού και εκφράζεται στις ίδιες μονάδες με τις παραλλαγές, επομένως ερμηνεύεται οικονομικά καλά.

Πως μικρότερη από την αξίαδιακύμανση και τυπική απόκλιση, όσο πιο ομοιογενής (ποσοτικά) είναι ο πληθυσμός και τόσο πιο τυπική θα είναι η μέση τιμή.

Στη στατιστική πρακτική, υπάρχει συχνά ανάγκη σύγκρισης διακυμάνσεων σε διάφορα χαρακτηριστικά (για παράδειγμα, σύγκριση των διακυμάνσεων της ηλικίας των εργαζομένων και των προσόντων τους, της εργασιακής εμπειρίας και του μεγέθους τους μισθοί).

Για να πραγματοποιήσετε αυτόν τον τύπο σύγκρισης, χρησιμοποιήστε τα παρακάτω σχετικούς δείκτες:

Συντελεστής ταλάντωσης– αντικατοπτρίζοντας σχετική διακύμανση ακραίες τιμέςσημάδι γύρω από τη μέση:

. (5.7)

Σχετική γραμμική απόκλισηχαρακτηρίζει το μερίδιο της μέσης τιμής των απόλυτων αποκλίσεων από τη μέση τιμή:

. (5.8)

Ο συντελεστής διακύμανσηςείναι ο πιο κοινός δείκτης μεταβλητότητας που χρησιμοποιείται για την αξιολόγηση της τυπικότητας μιας μέσης τιμής:

. (5.9)

Εάν , τότε αυτό υποδηλώνει μεγάλη μεταβλητότητα του χαρακτηριστικού στον πληθυσμό που μελετάται.

5.3 Διασπορά: ιδιότητες και μέθοδοι υπολογισμού

Η διασπορά έχει μια σειρά από ιδιότητες που καθιστούν δυνατή την απλοποίηση των υπολογισμών της.

1) Αν από όλες τις τιμές της επιλογής αφαιρέσουμε μερικές σταθερός αριθμός, τότε το μέσο τετράγωνο των αποκλίσεων από αυτό δεν θα αλλάξει:

. (5.10)

2) Εάν όλες οι τιμές της επιλογής διαιρεθούν με κάποιο σταθερό αριθμό, τότε το μέσο τετράγωνο των αποκλίσεων θα μειωθεί από αυτό κατά έναν παράγοντα και η τυπική απόκλιση κατά έναν παράγοντα.

. (5.11)

3) Εάν υπολογίσετε το μέσο τετράγωνο των αποκλίσεων από οποιαδήποτε τιμή που διαφέρει στον ένα ή τον άλλο βαθμό από τον αριθμητικό μέσο όρο, τότε θα είναι πάντα μεγαλύτερο από το μέσο τετράγωνο των αποκλίσεων που υπολογίζεται από τον αριθμητικό μέσο όρο:

Δηλαδή, το μέσο τετράγωνο των αποκλίσεων θα είναι μεγαλύτερο κατά το τετράγωνο της διαφοράς μεταξύ του μέσου όρου και αυτής της συμβατικά λαμβανόμενης τιμής, δηλ. επί :

Η απόκλιση από τη μέση έχει ιδιότητα μινιμαλισμού, δηλ. είναι πάντα μικρότερο από τις διακυμάνσεις που υπολογίζονται από οποιεσδήποτε άλλες ποσότητες. Σε αυτήν την περίπτωση, όταν ισούται με μηδέν, ο τύπος παίρνει τη μορφή:

. (5.14)

Χρησιμοποιώντας τη δεύτερη ιδιότητα της διασποράς, διαιρώντας όλες τις επιλογές με την τιμή του διαστήματος, λαμβάνουμε τον ακόλουθο τύπο για τον υπολογισμό της διασποράς σε σειρές παραλλαγών με σε ίσα διαστήματασύμφωνα με τη μέθοδο της ροπής:

, (5.15)

πού υπολογίζεται η διασπορά με τη μέθοδο των ροπών;

5.3. Δείκτες διακύμανσης

Σκοπός στατιστική έρευναείναι η ταυτοποίηση βασικές ιδιότητεςκαι πρότυπα του υπό μελέτη στατιστικού πληθυσμού. Κατά την επεξεργασία συνοπτικών δεδομένων στατιστική παρατήρησηχτίζουν σειρά διανομής.Υπάρχουν δύο τύποι σειρών διανομής - αποδοτικές και μεταβλητές, ανάλογα με το αν το χαρακτηριστικό που λαμβάνεται ως βάση για την ομαδοποίηση είναι ποιοτικό ή ποσοτικό.

Μεταβλητήονομάζονται σειρές διανομής που κατασκευάζονται σε ποσοτική βάση. Αξίες ποσοτικά χαρακτηριστικάγια μεμονωμένες μονάδες, τα συγκεντρωτικά στοιχεία δεν είναι σταθερά, διαφέρουν λίγο πολύ μεταξύ τους. Αυτή η διαφορά στην τιμή ενός χαρακτηριστικού ονομάζεται παραλλαγές.Ξεχωριστός αριθμητικές τιμέςχαρακτηριστικά που βρίσκονται στον υπό μελέτη πληθυσμό ονομάζονται παραλλαγές αξιών.Η παρουσία διακύμανσης σε μεμονωμένες μονάδες του πληθυσμού οφείλεται στην επίδραση μεγάλου αριθμού παραγόντων στο σχηματισμό του επιπέδου του χαρακτηριστικού. Η μελέτη της φύσης και του βαθμού διακύμανσης των χαρακτηριστικών σε επιμέρους μονάδες του πληθυσμού είναι το πιο σημαντικό θέμαοποιαδήποτε στατιστική έρευνα. Οι δείκτες διακύμανσης χρησιμοποιούνται για να περιγράψουν το μέτρο της μεταβλητότητας των χαρακτηριστικών.

Αλλο σημαντικό έργοΗ στατιστική έρευνα είναι να προσδιορίσει το ρόλο μεμονωμένων παραγόντων ή των ομάδων τους στη διακύμανση ορισμένων χαρακτηριστικών του πληθυσμού. Για να λύσουμε αυτό το πρόβλημα στα στατιστικά χρησιμοποιούμε ειδικές μεθόδουςμελέτες διακύμανσης που βασίζονται στη χρήση ενός συστήματος δεικτών βάσει των οποίων μετράται η διακύμανση. Στην πράξη, ο ερευνητής βρίσκεται αντιμέτωπος με αρκετά μεγάλο ποσόπαραλλαγές τιμών χαρακτηριστικών, που δεν δίνει μια ιδέα για την κατανομή των μονάδων ανά τιμή χαρακτηριστικού στο σύνολο. Για να το κάνετε αυτό, τακτοποιήστε όλες τις παραλλαγές των χαρακτηριστικών τιμών σε αύξουσα ή φθίνουσα σειρά. Αυτή η διαδικασία ονομάζεται κατάταξη της σειράς.Η σειρά κατάταξης δίνει αμέσως γενική ιδέασχετικά με τις τιμές που παίρνει ένα χαρακτηριστικό στο σύνολο.

Η ανεπάρκεια της μέσης τιμής για μια εξαντλητική περιγραφή του πληθυσμού μας αναγκάζει να συμπληρώσουμε τις μέσες τιμές με δείκτες που μας επιτρέπουν να εκτιμήσουμε την τυπικότητα αυτών των μέσων μετρήσεων μετρώντας τη μεταβλητότητα (παραλλαγή) του χαρακτηριστικού που μελετάται. Η χρήση αυτών των δεικτών διακύμανσης καθιστά δυνατή την πραγματοποίηση Στατιστική ανάλυσηπληρέστερη και ουσιαστικότερη και συνεπώς καλύτερη κατανόηση της ουσίας των κοινωνικών φαινομένων που μελετώνται.

Το περισσότερο απλά σημάδιαπαραλλαγές είναι ελάχιστοΚαι ανώτατο όριο -αυτό είναι το μικρότερο και υψηλότερη τιμήσημάδια στο σύνολο. Ο αριθμός των επαναλήψεων μεμονωμένων παραλλαγών χαρακτηριστικών τιμών ονομάζεται συχνότητα επανάληψης.Ας υποδηλώσουμε τη συχνότητα επανάληψης της τιμής του χαρακτηριστικού fi,το άθροισμα των συχνοτήτων ίσο με τον όγκο του πληθυσμού που μελετάται θα είναι:

Οπου κ– αριθμός επιλογών για τιμές χαρακτηριστικών. Είναι βολικό να αντικαταστήσετε τις συχνότητες με συχνότητες - wi. Συχνότητα– δείκτης σχετικής συχνότητας – μπορεί να εκφραστεί σε κλάσματα μονάδας ή ποσοστού και σας επιτρέπει να συγκρίνετε σειρές διακύμανσης με διαφορετικό αριθμόπαρατηρήσεις. Επίσημα έχουμε:

Για τη μέτρηση της διακύμανσης ενός χαρακτηριστικού, χρησιμοποιούνται διάφοροι απόλυτοι και σχετικοί δείκτες. Οι απόλυτοι δείκτες διακύμανσης περιλαμβάνουν τη μέση γραμμική απόκλιση, το εύρος διακύμανσης, τη διασπορά και την τυπική απόκλιση.

Εύρος παραλλαγώνΤο (R) αντιπροσωπεύει τη διαφορά μεταξύ των μέγιστων και ελάχιστων τιμών του χαρακτηριστικού στον πληθυσμό που μελετάται: R= Xmax – Xmin. Αυτός ο δείκτης δίνει μόνο την πιο γενική ιδέα για τη μεταβλητότητα του χαρακτηριστικού που μελετάται, καθώς δείχνει τη διαφορά μόνο μεταξύ των μέγιστων τιμών των επιλογών. Είναι εντελώς άσχετο με τις συχνότητες της σειράς παραλλαγών, δηλαδή με τη φύση της κατανομής και η εξάρτησή της μπορεί να την κάνει ασταθή, τυχαία φύσημόνο από τις ακραίες τιμές του χαρακτηριστικού. Το εύρος διακύμανσης δεν παρέχει καμία πληροφορία σχετικά με τα χαρακτηριστικά των πληθυσμών υπό μελέτη και δεν μας επιτρέπει να εκτιμήσουμε τον βαθμό τυπικότητας των λαμβανόμενων μέσων τιμών. Το πεδίο εφαρμογής αυτού του δείκτη περιορίζεται σε αρκετά ομοιογενείς πληθυσμούς· πιο συγκεκριμένα, χαρακτηρίζει την παραλλαγή ενός χαρακτηριστικού, ενός δείκτη που βασίζεται στη συνεκτίμηση της μεταβλητότητας όλων των τιμών του χαρακτηριστικού.

Για να χαρακτηριστεί η παραλλαγή ενός χαρακτηριστικού, είναι απαραίτητο να γενικευθούν οι αποκλίσεις όλων των τιμών από οποιαδήποτε τιμή τυπική για τον πληθυσμό που μελετάται. Τέτοιοι δείκτες

παραλλαγές, όπως η μέση γραμμική απόκλιση, η διασπορά και η τυπική απόκλιση, βασίζονται στην εξέταση των αποκλίσεων των χαρακτηριστικών τιμών των επιμέρους μονάδων του πληθυσμού από τον αριθμητικό μέσο όρο.

Μέση γραμμική απόκλισηαντιπροσωπεύει τον αριθμητικό μέσο όρο των απόλυτων τιμών των αποκλίσεων μεμονωμένων επιλογών από τον αριθμητικό μέσο όρο τους:


απόλυτη τιμή(μέτρο) απόκλιση της παραλλαγής από τον αριθμητικό μέσο όρο. φά-συχνότητα.

Ο πρώτος τύπος εφαρμόζεται εάν καθεμία από τις επιλογές εμφανίζεται συνολικά μόνο μία φορά και ο δεύτερος - σε σειρά με άνισες συχνότητες.

Υπάρχει ένας άλλος τρόπος υπολογισμού του μέσου όρου των αποκλίσεων των επιλογών από τον αριθμητικό μέσο όρο. Αυτή η πολύ κοινή μέθοδος στα στατιστικά καταλήγει στον υπολογισμό των τετραγωνικών αποκλίσεων των επιλογών από τη μέση τιμή με τον επακόλουθο μέσο όρο τους. Σε αυτή την περίπτωση, λαμβάνουμε έναν νέο δείκτη διακύμανσης - διασποράς.

Διασπορά(?2) – ο μέσος όρος των τετραγωνικών αποκλίσεων των επιλογών τιμής χαρακτηριστικών από τη μέση τιμή τους:

Ο δεύτερος τύπος εφαρμόζεται εάν οι επιλογές έχουν τα δικά τους βάρη (ή τις συχνότητες της σειράς παραλλαγών).

Στην οικονομική και στατιστική ανάλυση, είναι σύνηθες να αξιολογείται η διακύμανση ενός χαρακτηριστικού τις περισσότερες φορές χρησιμοποιώντας την τυπική απόκλιση. Τυπική απόκλισηΤο (?) αντιπροσωπεύει την τετραγωνική ρίζα της διακύμανσης:

Οι μέσες γραμμικές και τυπικές αποκλίσεις δείχνουν πόσο κυμαίνεται η τιμή ενός χαρακτηριστικού κατά μέσο όρο μεταξύ των μονάδων του υπό μελέτη πληθυσμού και εκφράζονται στις ίδιες μονάδες μέτρησης με τις επιλογές.

Στη στατιστική πρακτική, υπάρχει συχνά η ανάγκη σύγκρισης της διακύμανσης των διαφορετικών χαρακτηριστικών. Για παράδειγμα, μεγάλο ενδιαφέρονπαρουσιάζει μια σύγκριση των διακυμάνσεων της ηλικίας του προσωπικού και των προσόντων του, του χρόνου υπηρεσίας και του μισθού του κ.λπ. παρόμοιες συγκρίσειςΟι δείκτες απόλυτης μεταβλητότητας των σημείων - γραμμικός μέσος όρος και τυπική απόκλιση - δεν είναι κατάλληλοι. Στην πραγματικότητα, είναι αδύνατο να συγκριθεί η διακύμανση του χρόνου υπηρεσίας, εκφρασμένη σε χρόνια, με τη διακύμανση των μισθών, εκφρασμένη σε ρούβλια και καπίκια.

Όταν συγκρίνουμε τη μεταβλητότητα διαφόρων χαρακτηριστικών μαζί, είναι βολικό να χρησιμοποιούνται σχετικά μέτρα διακύμανσης. Αυτοί οι δείκτες υπολογίζονται ως ο λόγος των απόλυτων δεικτών προς τον αριθμητικό μέσο όρο (ή διάμεσο). Χρησιμοποιώντας το εύρος διακύμανσης, τη μέση γραμμική απόκλιση και την τυπική απόκλιση ως απόλυτο δείκτη διακύμανσης, λαμβάνονται σχετικοί δείκτες μεταβλητότητας:


– ο πιο συχνά χρησιμοποιούμενος δείκτης σχετικής μεταβλητότητας, που χαρακτηρίζει την ομοιογένεια του πληθυσμού. Ο πληθυσμός θεωρείται ομοιογενής εάν ο συντελεστής διακύμανσης δεν υπερβαίνει το 33% για κατανομές κοντά στο φυσιολογικό.

Παραλλαγή– πρόκειται για αλλαγή (διακύμανση) στις τιμές ενός χαρακτηριστικού εντός του υπό μελέτη πληθυσμού κατά τη μετακίνηση από ένα αντικείμενο (ομάδα αντικειμένων) ή από τη μια περίπτωση στην άλλη. Απόλυτοι και σχετικοί δείκτες διακύμανσης, που χαρακτηρίζουν τη μεταβλητότητα των τιμών ενός ποικίλου χαρακτηριστικού, καθιστούν δυνατή, ειδικότερα, τη μέτρηση του βαθμού σύνδεσης και αλληλεξάρτησης μεταξύ των χαρακτηριστικών, τον προσδιορισμό του βαθμού ομοιογένειας του πληθυσμού, τυπικότητας και σταθερότητα του μέσου όρου, να προσδιοριστεί το μέγεθος του δειγματοληπτικού σφάλματος, να αξιολογηθεί στατιστικά ο νόμος κατανομής του πληθυσμού κ.λπ.

Σε αυτό το θέμα, είναι απαραίτητο να κατανοήσουμε την ουσία (έννοια), τον σκοπό και τις μεθόδους υπολογισμού κάθε δείκτη διακύμανσης που εξετάζεται κατά τη διάρκεια της στατιστικής θεωρίας: εύρος διακύμανσης, μέση γραμμική απόκλιση, μέση τετραγωνική απόκλιση (διασπορά), τυπική απόκλιση, σχετικοί συντελεστές διακύμανσης (συντελεστής ταλάντωσης, συντελεστής μέσης γραμμικής απόκλισης, συντελεστής διακύμανσης).

Εύρος παραλλαγής (R) αντιπροσωπεύει τη διαφορά μεταξύ των μέγιστων (x max) και ελάχιστων (x min) τιμών του χαρακτηριστικού στο σύνολο (στη σειρά διανομής):

R = x max - x min. (5.1)

Το μέτρο άλλων δεικτών διακύμανσης δεν είναι η διαφορά μεταξύ των ακραίων τιμών του χαρακτηριστικού, αλλά η μέση διαφορά μεταξύ κάθε τιμής του χαρακτηριστικού και μέσο μέγεθοςαυτά τα σημάδια. Η διαφορά μεταξύ μιας μεμονωμένης τιμής ενός χαρακτηριστικού και του μέσου όρου ονομάζεται απόκλιση.

Μέση γραμμική απόκλισηυπολογίζεται χρησιμοποιώντας τους ακόλουθους τύπους:

με βάση μεμονωμένα (μη ομαδοποιημένα) δεδομένα

; (5.2)

κατά σειρά παραλλαγών (ομαδοποιημένα δεδομένα)

. (5.3)

Δεδομένου ότι το αλγεβρικό άθροισμα των αποκλίσεων των μεμονωμένων τιμών ενός χαρακτηριστικού από το μέσο όρο (σύμφωνα με την ιδιότητα μηδέν) είναι πάντα ίσο με μηδέν, κατά τον υπολογισμό της μέσης γραμμικής απόκλισης, χρησιμοποιείται το αριθμητικό άθροισμα των αποκλίσεων που λαμβάνονται modulo, δηλ.
.

Η μέση γραμμική απόκλιση έχει την ίδια διάσταση με το χαρακτηριστικό για το οποίο υπολογίζεται.

Διακύμανση και τυπική απόκλιση.Η μέση γραμμική απόκλιση χρησιμοποιείται σχετικά σπάνια για την αξιολόγηση της παραλλαγής ενός χαρακτηριστικού. Επομένως, συνήθως υπολογίζεται η διακύμανση ( 2) και η τυπική απόκλιση (). Αυτοί οι δείκτες χρησιμοποιούνται όχι μόνο για την αξιολόγηση της διακύμανσης ενός χαρακτηριστικού, αλλά και για τη μέτρηση της σχέσης μεταξύ τους, για την αξιολόγηση του μεγέθους του δειγματοληπτικού σφάλματος και για άλλους σκοπούς.

Διακύμανση ενός χαρακτηριστικούυπολογίζεται χρησιμοποιώντας τους τύπους:

σύμφωνα με πρωτογενή στοιχεία

; (5.4)

σύμφωνα με τη σειρά παραλλαγών

. (5.5)

Τυπική απόκλισηείναι η τετραγωνική ρίζα της διακύμανσης:

σύμφωνα με πρωτογενή στοιχεία

; (5.6)

σύμφωνα με τη σειρά παραλλαγών

. (5.7)

Η μέση τετραγωνική απόκλιση, όπως και η μέση γραμμική απόκλιση, έχει την ίδια διάσταση με το ίδιο το αρχικό χαρακτηριστικό.

Η διασπορά μπορεί επίσης να οριστεί ως η διαφορά μεταξύ του μέσου τετραγώνου των επιλογών και του τετραγώνου της μέσης τιμής τους, δηλ.
. (5.8)

Στην περίπτωση αυτή, σύμφωνα με τα πρωτογενή δεδομένα, η διακύμανση είναι ίση με:

(5.9)

Σε σχέση με ομαδοποιημένα δεδομένα, παρουσιάζουμε τον υπολογισμό της διακύμανσης χρησιμοποιώντας αυτή τη μέθοδο σε διευρυμένη μορφή ως εξής:

. (5.10)

Για σειρές κατανομής με ίσα διαστήματα, η τιμή διακύμανσης μπορεί να υπολογιστεί χρησιμοποιώντας τη μέθοδο των υπό συνθήκη ροπών, δηλ.

, (5.11)

Οπου
- η πρώτη υπό όρους στιγμή. (5.12)

- το δεύτερο υπό όρους σημείο. (5.13)

Η τυπική απόκλιση χρησιμοποιώντας τη μέθοδο των συμβατικών ροπών προσδιορίζεται από τον τύπο:

(5.14)

Μετασχηματίζοντας την έκφραση για τον υπολογισμό της διασποράς χρησιμοποιώντας τη μέθοδο των ροπών υπό όρους, λαμβάνουμε έναν τύπο της μορφής:
(5.15)

Με βάση τα ίδια αρχικά δεδομένα, λαμβάνουμε την ίδια τιμή διασποράς.

Οι σχετικοί δείκτες διακύμανσης υπολογίζονται ως ο λόγος ενός αριθμού απόλυτων δεικτών διακύμανσης προς τον αριθμητικό μέσο όρο τους και εκφράζονται ως ποσοστό:

συντελεστής ταλάντωσης -
; (5.16)

συντελεστής σχετικής γραμμικής απόκλισης -
; (5.17)

ο συντελεστής διακύμανσης -
. (5.18)

Πρόβλημα 1. Ας εξετάσουμε μεθόδους για τον υπολογισμό των δεικτών διακύμανσης με βάση τα δεδομένα του Πίνακα. 5.1.

Πίνακας 5.1.Αρχικά δεδομένα για τον υπολογισμό των δεικτών διακύμανσης

Χρόνος που δαπανάται για την παραγωγή ανταλλακτικών min

Αριθμός εξαρτημάτων, τεμ. (φά)

Μεσοδιάστημα (x)

; k = 2

Η δεδομένη σειρά διανομής κατατάσσεται, επομένως είναι εύκολο να βρείτε την ελάχιστη τιμή του χαρακτηριστικού εδώ· είναι ίση με 8 λεπτά. (10 - 2), και το μέγιστο ίσο με 18 λεπτά. (16 + 2). Αυτό σημαίνει ότι το εύρος διακύμανσης του χαρακτηριστικού σε αυτή τη σειρά θα είναι 10 λεπτά, δηλ.

R = x max – x min = 18 – 8 = 10 min.

Ας υπολογίσουμε τη μέση γραμμική απόκλιση. Πρώτα απ 'όλα, πρέπει να υπολογίσετε τη μέση τιμή . Θα πραγματοποιήσουμε όλους τους υπολογισμούς σε μορφή πίνακα (Πίνακας 5.1.), αντιστοιχίζοντας μια στήλη στον πίνακα για κάθε υπολογιστική πράξη.

Εφόσον τα αρχικά δεδομένα αντιπροσωπεύονται από μια σειρά διανομής, τότε

ελάχ.

ελάχ.

Ας δείξουμε πώς να υπολογίσουμε τη διακύμανση:

α) με τον συνήθη τρόπο (εξ ορισμού):

;

β) ως διαφορά μεταξύ του μέσου τετραγώνου και του τετραγώνου της μέσης τιμής:

Για να προσδιορίσετε την ποσότητα διασποράς χρησιμοποιώντας αυτόν τον τύπο, είναι απαραίτητο να υπολογίσετε το μέσο τετράγωνο των παραλλαγών των χαρακτηριστικών χρησιμοποιώντας τον τύπο:

;

 2 =178,6 – (13,2) 2 =4,36;

γ) σύμφωνα με τη μέθοδο των υπό συνθήκη ροπών:

;

;

δ) με βάση τον μετασχηματισμό του τύπου για τον υπολογισμό της διασποράς χρησιμοποιώντας τη μέθοδο των υπό συνθήκη ροπών, έχουμε:

Η διασπορά είναι ένας αφηρημένος αριθμός που δεν έχει μονάδες μέτρησης.

Υπολογίζουμε την τυπική απόκλιση παίρνοντας την τετραγωνική ρίζα της διακύμανσης:

ελάχ.

Χρησιμοποιώντας τη μέθοδο των υπό συνθήκη ροπών, προσδιορίζουμε την τιμή της τυπικής απόκλισης ως εξής:

Ας υπολογίσουμε τους σχετικούς δείκτες διακύμανσης:

%;

%;

%.

Ο κύριος σχετικός δείκτης διακύμανσης είναι ο συντελεστής διακύμανσης (V). Χρησιμοποιείται για τη συγκριτική αξιολόγηση του μέτρου της μεταβλητότητας των χαρακτηριστικών που εκφράζονται σε διαφορετικές μονάδες μέτρησης.

Μαζί με τη διακύμανση των ποσοτικών χαρακτηριστικών, μπορεί επίσης να παρατηρηθεί διακύμανση των ποιοτικών χαρακτηριστικών (ιδίως, εναλλακτική μεταβλητότητα στα ποιοτικά χαρακτηριστικά). Σε αυτή την περίπτωση, κάθε μονάδα του υπό μελέτη πληθυσμού είτε έχει κάποια ιδιοκτησία είτε δεν έχει (για παράδειγμα, κάθε ενήλικας είτε εργάζεται είτε όχι). Η παρουσία ενός χαρακτηριστικού στις πληθυσμιακές μονάδες συμβολίζεται με 1 και η απουσία με –0. η αναλογία των μονάδων στον πληθυσμό που κατέχουν το χαρακτηριστικό που μελετάται συμβολίζεται με p και εκείνων που δεν το κατέχουν με q. Η διακύμανση ενός εναλλακτικού χαρακτηριστικού καθορίζεται από τον τύπο:

; (5.19)

p + q = 1 (5,20)

Αν, για παράδειγμα, το μερίδιο των εισακτέων στο πανεπιστήμιο είναι 30%, και εκείνων που δεν μπήκαν είναι 70%, τότε η διασπορά είναι 0,21(0,3 · 0,7). η μέγιστη τιμή του προϊόντος pq είναι 0,25 (με την προϋπόθεση ότι η μία μισή μονάδα έχει αυτό το χαρακτηριστικό και η άλλη μισή όχι: (0,5 · 0,5 = 0,25).

Μέθοδος για την αποσύνθεση της συνολικής διακύμανσης.Για να αξιολογήσουμε την επίδραση διαφόρων παραγόντων που καθορίζουν τη μεταβλητότητα των μεμονωμένων τιμών ενός χαρακτηριστικού, χρησιμοποιούμε την αποσύνθεση της συνολικής διακύμανσης σε συστατικά: τη λεγόμενη ομαδική διακύμανση και τον μέσο όρο των διακυμάνσεων εντός της ομάδας:

, (5.21)

Οπου
συνολική διακύμανση, χαρακτηρίζοντας την παραλλαγή ενός χαρακτηριστικού ως αποτέλεσμα της επιρροής όλων των παραγόντων που καθορίζουν τις επιμέρους διαφορές μεταξύ των μονάδων του πληθυσμού.

Η διακύμανση ενός χαρακτηριστικού λόγω της επιρροής του παράγοντα που βρίσκεται κάτω από την ομαδοποίηση χαρακτηρίζεται από διασπορά μεταξύ ομάδων  2, η οποία είναι ένα μέτρο της μεταβλητότητας των μερικών μέσων ομαδικών μέσων
γύρω από τον γενικό μέσο όρο και υπολογίζεται από τον τύπο:

, (5.22)

όπου n j είναι ο αριθμός των πληθυσμιακών μονάδων σε κάθε ομάδα.

j – σειριακός αριθμόςομάδες.

Η παραλλαγή ενός χαρακτηριστικού λόγω της επιρροής όλων των άλλων παραγόντων εκτός από τον ομαδοποιητικό (παραγοντικό) χαρακτηρίζεται σε κάθε ομάδα από ενδοομαδική διακύμανση:

, (5.23)

όπου i είναι ο αύξων αριθμός των x και f σε κάθε ομάδα.

Για τον πληθυσμό στο σύνολό του, ο μέσος όρος των ενδοομαδικών αποκλίσεων καθορίζεται από τον τύπο:

(5.24)

Λόγος διαομαδικής διακύμανσης  2 προς το σύνολο
θα δώσει τον συντελεστή προσδιορισμού:

(5.25)

που χαρακτηρίζει την αναλογία διακύμανσης στο προκύπτον χαρακτηριστικό λόγω της διακύμανσης του χαρακτηριστικού παράγοντα που βρίσκεται κάτω από την ομαδοποίηση.

Ο δείκτης που λαμβάνεται ως τετραγωνική ρίζα του συντελεστή προσδιορισμού ονομάζεται συντελεστής αναλογίας εμπειρικής συσχέτισης, δηλ.:

(5.26)

Χαρακτηρίζει την εγγύτητα της σύνδεσης μεταξύ του προκύπτοντος και του παραγοντικού (στα οποία βασίζεται η ομαδοποίηση) χαρακτηριστικών. Η αριθμητική τιμή του εμπειρικού συντελεστή αναλογίας συσχέτισης έχει δύο πρόσημα: . Όταν αποφασίζετε με ποιο πρόσημο πρέπει να ληφθεί, είναι απαραίτητο να έχετε κατά νου: εάν η διακύμανση του παράγοντα και των χαρακτηριστικών που προκύπτουν πηγαίνουν συγχρονισμένα προς την ίδια κατεύθυνση (αυξάνεται ή μειώνεται), τότε ο λόγος συσχέτισης λαμβάνεται με πρόσημο συν. εάν η αλλαγή σε αυτά τα χαρακτηριστικά πηγαίνει προς αντίθετες κατευθύνσεις, τότε λαμβάνεται με ένα πρόσημο μείον.

Για να υπολογίσετε τις διακυμάνσεις ομάδας και μεταξύ ομάδων, μπορείτε να χρησιμοποιήσετε οποιαδήποτε από τις μεθόδους που περιγράφονται παραπάνω για τον υπολογισμό του μέσου τετραγώνου των αποκλίσεων.

Εργασία 2.Ας υπολογίσουμε όλες τις ονομαζόμενες διακυμάνσεις χρησιμοποιώντας τα αρχικά δεδομένα στον Πίνακα. 5.2.

Πίνακας 5.2.Κατανομή της σπαρμένης έκτασης χειμερινού σίτου ανά απόδοση

Αριθμός οικοπέδου

Παραγωγικότητα, c/ha

Σπαρμένη έκταση, χα

Ας υπολογίσουμε τη μέση απόδοση του χειμερινού σιταριού για όλες τις εκτάσεις (συνολικός μέσος όρος):

c/ha.

Βρίσκουμε τη συνολική διακύμανση χρησιμοποιώντας τον τύπο:

Σε γρ. 6 τραπέζια 5.2. Ας υπολογίσουμε τις τιμές για να υπολογίσουμε το μέσο τετράγωνο των επιλογών χαρακτηριστικών:

.

Βρίσκουμε τη συνολική διακύμανση:

Η παραγωγικότητα εξαρτάται από πολλούς παράγοντες (ποιότητα εδάφους, ποσότητα οργανικών και ορυκτών λιπασμάτων, ποιότητα σπόρων, χρόνος σποράς, φροντίδα της καλλιέργειας κ.λπ.) Η συνολική διακύμανση σε σε αυτήν την περίπτωσημετρά τη μεταβλητότητα της απόδοσης που οφείλεται σε όλους τους παράγοντες.

Εργασία 3.Ας χωρίσουμε το σύνολο των αγροτεμαχίων σε δύο ομάδες: Ομάδα Ι – σπαρμένες εκτάσεις όπου δεν χρησιμοποιήθηκαν οργανικά λιπάσματα. II – περιοχές όπου εισήχθησαν. Θα συμπεριλάβουμε τις περιοχές 1-4 στον πρώτο όμιλο και 4-8 στον δεύτερο όμιλο. Με βάση τα δεδομένα από αυτές τις ομάδες, θα υπολογίσουμε τις υπόλοιπες αποκλίσεις που χρειαζόμαστε, χρησιμοποιώντας αυτές που έχουν ήδη παραχθεί στον πίνακα. 5.2. υπολογισμούς.

Πίνακας 5.3. Εκτιμώμενα δεδομένα για τον υπολογισμό των αποκλίσεων μεταξύ ομάδων και ομάδων

Αριθμός οικοπέδου

Παραγωγικότητα, c/ha (x)

Καλλιεργούμενη έκταση, εκτάρια (στ)

Αριθμός οικοπέδου

Παραγωγικότητα, c/ha (x)

Καλλιεργούμενη έκταση, εκτάρια (στ)

Ορίζουμε:

για την ομάδα Ι:

για την ομάδα II:

α) ο μέσος όρος της ομάδας

α) ο μέσος όρος της ομάδας

c/ha;

c/ha;

β) μέσο τετράγωνο παραλλαγών χαρακτηριστικών

;

;

γ) ομαδική διακύμανση

γ) ομαδική διακύμανση

Καθορίζουμε τον μέσο όρο των διακυμάνσεων της ομάδας:

.

Βρίσκουμε τη διαομαδική διακύμανση:

Ο μέσος όρος των ομαδικών διακυμάνσεων μετρά τη μεταβλητότητα του χαρακτηριστικού λόγω όλων των άλλων παραγόντων εκτός από αυτόν που βρίσκεται κάτω από την ομαδοποίηση (διαφορά σε ομάδες) και τη διασπορά μεταξύ ομάδων - λόγω αυτού του συγκεκριμένου παράγοντα. Το άθροισμα αυτών των διακυμάνσεων θα πρέπει να δώσει τη συνολική διακύμανση, δηλαδή:

Ο λόγος της διαομαδικής διακύμανσης προς τη συνολική διακύμανση στο παράδειγμά μας θα δώσει την ακόλουθη τιμή του συντελεστή προσδιορισμού:

, ή 71,8%,

Δηλαδή, η διακύμανση της απόδοσης του χειμερινού σιταριού κατά 71,8% εξαρτάται από τη διακύμανση της ποσότητας του οργανικού λιπάσματος που εφαρμόζεται. Το υπόλοιπο 28,2% της διακύμανσης της απόδοσης εξαρτάται από την επίδραση όλων των άλλων παραγόντων, εκτός από την ποσότητα του οργανικού λιπάσματος που εφαρμόζεται.

Ο εμπειρικός συντελεστής συσχέτισης θα είναι:

.

Αυτό υποδηλώνει ότι η εφαρμογή οργανικών λιπασμάτων έχει πολύ σημαντική επίδραση στις αποδόσεις των καλλιεργειών.

Πώς να αποδείξετε ότι ένα μοτίβο που λαμβάνεται από τη μελέτη πειραματικών δεδομένων δεν είναι αποτέλεσμα σύμπτωσης ή λάθους ενός πειραματιστή, ότι είναι αξιόπιστο; Αυτό είναι ένα ερώτημα που αντιμετωπίζουν οι νέοι ερευνητές.Η περιγραφική στατιστική παρέχει εργαλεία για την επίλυση αυτών των προβλημάτων. Έχει δύο μεγάλες ενότητες - περιγραφή των δεδομένων και σύγκρισή τους σε ομάδες ή σε σειρά μεταξύ τους.

Δείκτες περιγραφικών στατιστικών

Υπάρχουν πολλά μέτρα που χρησιμοποιούν οι περιγραφικές στατιστικές.

Φανταστείτε λοιπόν ότι βρισκόμαστε αντιμέτωποι με το καθήκον να περιγράψουμε το ύψος όλων των μαθητών σε μια ομάδα δέκα ατόμων. Οπλισμένοι με έναν χάρακα και λαμβάνοντας μετρήσεις, παίρνουμε μια μικρή σειρά δέκα αριθμών (ύψος σε εκατοστά):

168, 171, 175, 177, 179, 187, 174, 176, 179, 169.

Αν κοιτάξετε προσεκτικάσε αυτήν τη γραμμική σειρά, τότε μπορούν να βρεθούν διάφορα μοτίβα:

  • Το πλάτος του διαστήματος όπου πέφτει το ύψος όλων των μαθητών είναι 18 cm.
  • Στην κατανομή, η ανάπτυξη είναι πιο κοντά στο μέσο αυτού του διαστήματος.
  • Υπάρχουν επίσης εξαιρέσεις που είναι πιο κοντά στο άνω ή κάτω όριο του διαστήματος.

Είναι σαφές ότι για να ολοκληρωθεί το έργο της περιγραφής της ανάπτυξης των μαθητών σε μια ομάδα, δεν είναι απαραίτητο να παρέχονται όλες οι τιμές που θα μετρηθούν. Για το σκοπό αυτό, αρκεί να δώσουμε μόνο δύο, που στη στατιστική ονομάζονται παράμετροι κατανομής. Αυτός είναι ο αριθμητικός μέσος όρος και τυπική απόκλισηαπό τον αριθμητικό μέσο όρο. Αν στραφούμε στην ανάπτυξη των μαθητών, ο τύπος θα μοιάζει με αυτό:

Αριθμητική μέση τιμή ύψους μαθητή = (Άθροισμα όλων των τιμών ύψους μαθητή) / (Αριθμός μαθητών που συμμετέχουν στη μέτρηση)

Αν αναγάγουμε τα πάντα σε αυστηρούς μαθηματικούς όρους, τότε ο ορισμός του αριθμητικού μέσου όρου (που συμβολίζεται με το ελληνικό γράμμα μ («mu»)) θα ακούγεται ως εξής:

Ο αριθμητικός μέσος όρος είναι ο λόγος του αθροίσματος όλων των τιμών ενός χαρακτηριστικού για όλα τα μέλη του πληθυσμού (X) προς τον αριθμό όλων των μελών του πληθυσμού (N).

Αν εφαρμόσουμε αυτόν τον τύπο στις μετρήσεις μας, διαπιστώνουμε ότι το μ για το ύψος των μαθητών της ομάδας είναι 175,5 cm.

Αν ρίξετε μια πιο προσεκτική ματιά στο ύψος των μαθητών, το οποίο μετρήσαμε στο προηγούμενο παράδειγμα, είναι σαφές ότι το ύψος κάθε ατόμου είναι κάπως διαφέρει από τον υπολογισμένο μέσο όρο(175,5 cm). Για να ολοκληρώσετε την περιγραφή, πρέπει να καταλάβετε ποια είναι η διαφορά μεταξύ του μέσου ύψους κάθε μαθητή και της μέσης τιμής.

Στο πρώτο στάδιο, υπολογίζουμε την παράμετρο διασποράς. Η διασπορά στη στατιστική (συμβολίζεται με σ 2 (σίγμα στο τετράγωνο)) είναι ο λόγος του αθροίσματος των τετραγώνων της διαφοράς μεταξύ του αριθμητικού μέσου όρου (μ) και της τιμής ενός μέλους σειράς (Χ) προς τον αριθμό όλων των μελών του πληθυσμού (Ν). Με τη μορφή τύπου, αυτό υπολογίζεται πιο ξεκάθαρα:

Θα παρουσιάσουμε τις τιμές που λαμβάνουμε ως αποτέλεσμα των υπολογισμών χρησιμοποιώντας αυτόν τον τύπο ως τετράγωνο της τιμής (στην περίπτωσή μας, τετραγωνικά εκατοστά). Το να χαρακτηρίζεις το ύψος σε εκατοστά με τετραγωνικά εκατοστά, θα συμφωνήσεις, είναι παράλογο. Επομένως, μπορούμε να διορθώσουμε, ή ακριβέστερα, να απλοποιήσουμε αυτήν την έκφραση και να λάβουμε τον μέσο όρο τυπική απόκλισητύπος και υπολογισμός, παράδειγμα:

Έτσι, λάβαμε την τιμή της τυπικής απόκλισης (ή τυπικής απόκλισης) - Τετραγωνική ρίζααπό τη διασπορά. Τώρα όλα είναι εντάξει με τις μονάδες μέτρησης, μπορούμε να υπολογίσουμε την τυπική απόκλιση για την ομάδα:

Αποδεικνύεται ότι η ομάδα των μαθητών μας υπολογίζεται με το ύψος με αυτόν τον τρόπο: 175,50±5,25 cm.

Η τυπική απόκλιση λειτουργεί καλά με σειρές στις οποίες η εξάπλωση των τιμών δεν είναι πολύ μεγάλη (αυτό φάνηκε ξεκάθαρα στο παράδειγμα της ανάπτυξης, όπου το διάστημα ήταν μόνο 18 cm). Εάν το εύρος των μετρήσεών μας ήταν μεγαλύτερο και η διακύμανση στο ύψος μεγαλύτερη, τότε η τυπική απόκλιση θα γινόταν ασήμαντη και θα χρειαζόμασταν ένα κριτήριο που θα μπορούσε να αντικατοπτρίζει την εξάπλωση σε σχετικές μονάδες (δηλαδή ως ποσοστό σε σχέση με τον μέσο όρο).

Για τους σκοπούς αυτούς, παρέχονται απόλυτοι και σχετικοί δείκτες διακύμανσης στα στατιστικά στοιχεία, που χαρακτηρίζουν τις κλίμακες διακύμανσης:

  • Πεδίο παραλλαγής.

Ο τετραγωνικός συντελεστής διακύμανσης (που συμβολίζεται ως Vσ) είναι ο λόγος της τυπικής απόκλισης προς την αριθμητική μέση τιμή, εκφρασμένος ως ποσοστό.

Για το παράδειγμά μας με τους μαθητές, δεν είναι δύσκολο να προσδιορίσουμε το Vσ - θα είναι ίσο με 3,18%. Ο κύριος κανόνας είναι ότι όσο περισσότερο αλλάζει η τιμή του συντελεστή, τόσο μεγαλύτερη είναι η διασπορά γύρω από τη μέση τιμή και τόσο λιγότερο ομοιογενές είναι το δείγμα.

Το πλεονέκτημα του συντελεστή διακύμανσης είναι ότι δείχνει την ομοιογένεια των τιμών (ασυμμετρία) σε μια σειρά από τις μετρήσεις μας, επιπλέον, δεν επηρεάζεται από την κλίμακα και τις μονάδες μέτρησης. Αυτοί οι παράγοντες καθιστούν τον συντελεστή διακύμανσης ιδιαίτερα δημοφιλή στη βιοϊατρική έρευνα. Θα ληφθεί υπόψηότι η τιμή κύρτωσης Vσ =33% διαχωρίζει τα ομογενή δείγματα από τα ετερογενή.

Εάν βρούμε τις μέγιστες και τις ελάχιστες τιμές στη σειρά των τιμών ανάπτυξης (το πρώτο παράδειγμα), θα λάβουμε το εύρος διακύμανσης (που συμβολίζεται ως R, μερικές φορές ονομάζεται επίσης μεταβλητότητα). Στο παράδειγμά μας, αυτή η τιμή θα είναι 18 εκ. Αυτό το χαρακτηριστικό χρησιμοποιείται για τον υπολογισμό του συντελεστή ταλάντωσης:

Συντελεστής ταλάντωσης - δείχνει πώς το εύρος διακύμανσης θα σχετίζεται με τον μέσο όρο αριθμητική σειράσε ποσοστιαίες τιμές.

Υπολογισμοί στο Microsoft Excel 2016

* - ο πίνακας δείχνει το εύρος A1:A10 ως παράδειγμα· όταν κάνετε υπολογισμούς, πρέπει να υποδείξετε το απαιτούμενο εύρος.

Λοιπόν, ας συνοψίσουμε τις πληροφορίες:

  1. Ο αριθμητικός μέσος όρος είναι μια τιμή που σας επιτρέπει να βρείτε τη μέση τιμή ενός δείκτη σε μια σειρά δεδομένων.
  2. Η διασπορά είναι η μέση τιμή των αποκλίσεων στο τετράγωνο.
  3. Τυπική απόκλιση ( τυπική απόκλιση) είναι η τετραγωνική ρίζα της διακύμανσης, για να φέρει τις μονάδες μέτρησης στο ίδιο επίπεδο με τον αριθμητικό μέσο όρο.
  4. Συντελεστής διακύμανσης – η τιμή των αποκλίσεων από τον μέσο όρο, εκφρασμένη σε σχετικές τιμές (%).

Ξεχωριστά, πρέπει να σημειωθεί ότι όλοι οι δείκτες που παρουσιάζονται στο άρθρο, κατά κανόνα, δεν έχουν τη δική τους σημασία και χρησιμοποιούνται για τη δημιουργία ενός πιο σύνθετου σχήματος ανάλυσης δεδομένων. Εξαίρεση σε αυτόν τον κανόνα είναι ο συντελεστής διακύμανσης, ο οποίος αποτελεί μέτρο της ομοιογένειας των δεδομένων.

Δείκτες διακύμανσης

Η μέση τιμή δεν επιτρέπει σε κάποιον να κρίνει τις διακυμάνσεις (παραλλαγές) στις οποίες υπόκειται το χαρακτηριστικό που μελετάται σε έναν δεδομένο πληθυσμό. Οι μέσες τιμές από μόνες τους δεν αρκούν για ανάλυση. Οι πληθυσμοί που είναι τελείως διαφορετικοί ως προς την εξάπλωσή τους γύρω από τον μέσο όρο μπορούν να έχουν τον ίδιο αριθμητικό μέσο όρο. Για να βρεθεί το μέγεθος της διακύμανσης στα στατιστικά στοιχεία, χρησιμοποιούνται ειδικοί δείκτες, οι οποίοι ονομάζονται δείκτες διακύμανσης. Η μελέτη της διακύμανσης στις στατιστικές έχει μεγάλη σημασία, καθώς βοηθά στην κατανόηση της ουσίας του φαινομένου που μελετάται.

Ας απαριθμήσουμε τους κύριους δείκτες διακύμανσης και ας παρέχουμε τύπους για τον υπολογισμό τους.

Για να χαρακτηρίσετε το μέγεθος της διακύμανσης στα στατιστικά στοιχεία, χρησιμοποιήστε απόλυτους δείκτεςπαραλλαγές: εύρος διακύμανσης, μέση γραμμική απόκλιση, τυπική απόκλιση, διασπορά.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ του μέγιστου και ελάχιστες τιμέςχαρακτηριστικό στον πληθυσμό που μελετάται, δηλ.

Το εύρος διακύμανσης εντοπίζεται εύκολα από τις τάξεις της σειράς διανομής κατάταξης.

Η διακύμανση χαρακτηρίζεται με μεγαλύτερη ακρίβεια από τη μέση γραμμική απόκλιση, η οποία βρίσκεται ως ο αριθμητικός μέσος όρος των αποκλίσεων των επιμέρους τιμών από τον μέσο όρο χωρίς να λαμβάνεται υπόψη το πρόσημο αυτών των αποκλίσεων, δηλ.

Εάν τα δεδομένα προέλευσης είναι ομαδοποιημένα, τότε μπορούμε να βρούμε τη σταθμισμένη μέση γραμμική απόκλιση και η συχνότητα (f) και η σχετική συχνότητα (/) μπορούν να χρησιμοποιηθούν ως βάρος.

Ένα πιο αντικειμενικό μέτρο διακύμανσης στην πράξη αντικατοπτρίζεται από τη διασπορά (το μέσο τετράγωνο των αποκλίσεων). Συζητήθηκε στο Κεφάλαιο 2. Στην προκειμένη περίπτωση μιλάμε γιασχετικά με τις εκτιμήσεις διακύμανσης, καθώς οι τιμές πιθανότητας είναι άγνωστες.

Εάν έχουμε μια μη ομαδοποιημένη σειρά διανομής, τότε η διακύμανση καθορίζεται από τον τύπο

Σημειώστε ότι η εκτίμηση της διακύμανσης που προκύπτει από τον τύπο (6.28) είναι μεροληπτική. Χρησιμοποιώντας το, θα εκτελέσουμε μερικά συστηματικό λάθοςσε μικρότερο βαθμό. Η αμερόληπτη εκτίμηση για τη διακύμανση βρίσκεται από τον τύπο

Κατά κανόνα, ο τύπος (6.30) χρησιμοποιείται σε περιπτώσεις όπου ο υπό μελέτη πληθυσμός είναι μικρός, όχι περισσότερο από 40 μονάδες. Σε περιπτώσεις όπου p> 40, χρησιμοποιήστε τον τύπο (6.29).

Όταν ομαδοποιούνται τα αρχικά δεδομένα, υπολογίζονται εκτιμήσεις σταθμισμένης διακύμανσης

Εξάγοντας την αριθμητική τετραγωνική ρίζα από τη διακύμανση, λαμβάνουμε ένα άλλο χαρακτηριστικό (αυτό συζητήθηκε επίσης στο Κεφάλαιο 2) - την τυπική απόκλιση ή τυπική (ακριβέστερα, την εκτίμησή της).

Εάν ο πληθυσμός που μελετάται είναι αρκετά μεγάλος, τότε συνήθως χωρίζεται σε ομάδες σύμφωνα με κάποιο χαρακτηριστικό. Επομένως, παράλληλα με τη μελέτη της παραλλαγής ενός χαρακτηριστικού σε ολόκληρο τον πληθυσμό στο σύνολό του, είναι δυνατό να μελετηθούν παραλλαγές για κάθε μία από τις ομάδες που το αποτελούν, καθώς και μεταξύ των ίδιων των ομάδων. Εάν ο πληθυσμός διαιρεθεί σύμφωνα με έναν παράγοντα, τότε η μελέτη της διακύμανσης επιτυγχάνεται με την εύρεση και ανάλυση τριών τύπων διακυμάνσεων: γενική, διαομαδική, ενδοομαδική.

Η συνολική διακύμανση (D x) καθορίζει τη διακύμανση σε ολόκληρο τον πληθυσμό υπό την επίδραση όλων των παραγόντων που προκάλεσαν αυτή τη διακύμανση. Είναι ίσο με το μέσο τετράγωνο των αποκλίσεων ατομικές αξίεςσημάδι Χ (x ar)και υπολογίζεται με τους τύπους (6.29), (6.31), (6.32).

Διαομαδική διακύμανση F Hmg)χαρακτηρίζει τη συστηματική παραλλαγή της προκύπτουσας σειράς, η οποία καθορίζεται από την επίδραση του χαρακτηριστικού που αποτελεί τη βάση της ομαδοποίησης. Είναι ίσο με τη μέση τετραγωνική απόκλιση των μέσων της ομάδας x argrαπό τον γενικό αριθμητικό μέσο όρο x ar,δηλ.

Οπου, Προς την- αριθμός ομάδων.

ντο. - συχνότητα (αριθμός μονάδων) στην ομάδα d.

/. - σχετική συχνότητα της ομάδας ΣΟΛ.

Διακύμανση εντός της ομάδας D Xezαντικατοπτρίζει την τυχαία διακύμανση (μέρος της παραλλαγής) λόγω της επιρροής ακαταλόγιστων παραγόντων και ανεξάρτητα από το χαρακτηριστικό που αποτελεί τη βάση της ομάδας. Είναι ίσο με τη μέση τετραγωνική απόκλιση των επιμέρους τιμών του χαρακτηριστικού εντός της ομάδας Χ.από τον αριθμητικό μέσο όρο αυτής της ομάδας x argrκαι βρίσκεται από τους τύπους:

εάν η ομάδα δεν περιέχει περισσότερες από 40 παρατηρήσεις·

εάν η ομάδα περιέχει περισσότερες από 40 παρατηρήσεις - τον αριθμό των μονάδων σε μια συγκεκριμένη ομάδα).

Χρησιμοποιούνται επίσης τύποι σταθμισμένης διακύμανσης:

Έχοντας βρει τις διακυμάνσεις εντός της ομάδας για κάθε ομάδα, μπορείτε να υπολογίσετε τον μέσο όρο των διακυμάνσεις εντός της ομάδαςσύμφωνα με τους τύπους:

ή χρησιμοποιώντας τη σχέση (6.13).

Σύμφωνα με τον κανόνα για την προσθήκη διακυμάνσεων, η συνολική διακύμανση πρέπει να είναι ίση με το άθροισμα των διακυμάνσεων μεταξύ ομάδας και μέσου όρου των διακυμάνσεων εντός της ομάδας, δηλ.

Η παραλλαγή ενός ποιοτικού (εναλλακτικού) χαρακτηριστικού (ένα χαρακτηριστικό που μπορεί ή δεν μπορεί να διαθέτει κάθε μονάδα του πληθυσμού) βρίσκεται χρησιμοποιώντας τη διασπορά:

Οπου μικρό- το ποσοστό των μονάδων στον πληθυσμό που έχουν ποιοτικό χαρακτηριστικό·

v- το ποσοστό των πληθυσμιακών μονάδων που δεν έχουν ποιοτικό χαρακτηριστικό.

σημειώσε ότι μικρό + v = 1.

Τυπική απόκλιση ποιοτικό πρόσημοβρίσκεται από τον τύπο

Για παράδειγμα, αν ανά 10.000 πληθυσμού ενός κέντρου περιφέρειας 3.500 έχουν ανώτερη εκπαίδευση, αλλά 6500 όχι, λοιπόν

Η διακύμανση ενός ποιοτικού χαρακτηριστικού είναι ίση με

Η μέγιστη τιμή της διασποράς ενός ποιοτικού χαρακτηριστικού προκύπτει εάν μικρό = v= 0,5. Θα είναι ίσο με 0,25.

Για να χαρακτηριστεί το μέτρο της διασποράς του χαρακτηριστικού που μελετάται, οι δείκτες διακύμανσης βρίσκονται σε σχετικές μονάδες. Θα παρουσιάσουμε μερικά από αυτά.

Ο συντελεστής ταλάντωσης αντανακλά τη σχετική εξάπλωση των ακραίων τιμών γύρω από τον αριθμητικό μέσο όρο

Η σχετική γραμμική απόκλιση χαρακτηρίζει την αναλογία της μέσης τιμής των απόλυτων αποκλίσεων από τον αριθμητικό μέσο όρο, δηλ.

Ο συντελεστής διακύμανσης, που είναι η σχετική τετραγωνική απόκλιση, δηλ.

Με βάση το μέγεθος του συντελεστή διακύμανσης, μπορεί κανείς να κρίνει την ένταση της παραλλαγής ενός χαρακτηριστικού, άρα και την ομοιογένεια της σύνθεσης του πληθυσμού που μελετάται. Όσο μεγαλύτερος είναι ο συντελεστής διακύμανσης, τόσο μεγαλύτερη είναι η εξάπλωση των τιμών των χαρακτηριστικών γύρω από τον αριθμητικό μέσο όρο και, κατά συνέπεια, τόσο μεγαλύτερη είναι η ετερογένεια του πληθυσμού. Υπάρχει μια κλίμακα για τον προσδιορισμό του βαθμού ομοιογένειας ενός πληθυσμού ανάλογα με την τιμή του συντελεστή διακύμανσης:

  • - αν V x
  • - εάν 30%
  • - εάν V x > 60%, τότε ο πληθυσμός θεωρείται ετερογενής.

Σημειώστε ότι η δεδομένη κλίμακα είναι αρκετά αυθαίρετη.

Τα κύρια χαρακτηριστικά του σχήματος κατανομής είναι η λοξότητα και η κύρτωση. Συζητήθηκαν λεπτομερώς στο Κεφάλαιο 2. Εδώ θα μιλήσουμεσχετικά με τις εκτιμήσεις τους, αφού ο αριθμός των διαστάσεων είναι πεπερασμένος και οι πιθανότητες άγνωστες. Θα υποδηλώσουμε την ασυμμετρία (λοξή) και την κύρτωση με τα ίδια γράμματα όπως στο Κεφάλαιο 2, αλλά θα προσθέσουμε ένα tilde (~) από πάνω.

Για να εκτιμηθεί ο βαθμός ασυμμετρίας κατανομής, χρησιμοποιείται συνήθως ο συντελεστής ασυμμετρίας ροπής, ο οποίος βρίσκεται από τον τύπο

όπου Dz είναι η εκτίμηση του τρίτου κεντρική στιγμή, το οποίο μπορεί να προσδιοριστεί από τους τύπους:

Ο βαθμός σημαντικότητας του συντελεστή ασυμμετρίας εκτιμάται χρησιμοποιώντας το μέσο τετραγωνικό σφάλμα του συντελεστή ασυμμετρίας, το οποίο εξαρτάται από το μέγεθος του πληθυσμού υπό μελέτη (n) και βρίσκεται χρησιμοποιώντας τον ακόλουθο τύπο:

Εάν ο λόγος είναι , τότε η ασυμμετρία θεωρείται σημαντική και αν , τότε η ασυμμετρία μπορεί να θεωρηθεί ασήμαντη, που προκαλείται από την επίδραση τυχαίων λόγων.

Το κύριο μειονέκτημα του συντελεστή ασυμμετρίας ροπής A x είναι ότι η τιμή του εξαρτάται από την παρουσία έντονα διακεκριμένων παραλλαγών στο σύνολο. Για τέτοια μεγέθη, αυτός ο συντελεστής είναι ελάχιστα χρήσιμος, καθώς η μεγάλη (απόλυτη) τιμή του εξηγείται από την κυρίαρχη συμβολή στην τιμή εκτίμησης της τρίτης κεντρικής στιγμής άτυπων τιμών και όχι από την ασυμμετρία της κατανομής του κύριου μέρους του η παραλλαγή.

Οι συντελεστές δομικής ασυμμετρίας χαρακτηρίζουν την ασυμμετρία μόνο στο κεντρικό τμήμα της κατανομής, δηλαδή στο μεγαλύτερο μέρος της παραλλαγής και, σε αντίθεση με τον συντελεστή ασυμμετρίας ροπής, δεν εξαρτώνται από τις ακραίες τιμές του χαρακτηριστικού.

Κατά κανόνα, χρησιμοποιείται ο συντελεστής δομικής ασυμμετρίας που προτείνει ο K. Pearson:

Ένα άλλο χαρακτηριστικό του σχήματος μιας κατανομής είναι η κύρτωση. Η εκτίμησή του σε στατιστικά στοιχεία μπορεί να ληφθεί χρησιμοποιώντας τον τύπο

όπου D 4 είναι η εκτίμηση της τέταρτης κεντρικής ροπής, η οποία μπορεί να βρεθεί χρησιμοποιώντας τους τύπους

Για να εκτιμήσετε τη σημασία της κύρτωσης της κατανομής, βρείτε τον μέσο όρο τετράγωνο σφάλμακύρτωση:

Εάν υπάρχει απόκλιση, τότε απόκλιση από το κανονικό

Η κατανομή θεωρείται σημαντική, διαφορετικά θεωρείται ασήμαντη και εξηγείται με τυχαίους λόγους.

Τώρα θα δώσουμε ένα συγκεκριμένο παράδειγμα υπολογισμού στο οποίο θα ορίσουμε μια σειρά από χαρακτηριστικά που δίνονται παραπάνω, και επίσης θα θίξουμε θέματα που δεν συζητούνται σε αυτό το κεφάλαιο. Σε αυτή την περίπτωση, μαζί με τους υπολογισμούς, θα εξετάσουμε συνοπτικά ορισμένα απαραίτητα θεωρητικά ζητήματα.

Σημειώστε ότι το συγκεκριμένο παράδειγμα είναι καθαρά εκπαιδευτικό· τα δεδομένα για αυτό λήφθηκαν, όπως λένε, "από τον αέρα". Επιπλέον, η υπό εξέταση σειρά παρατηρήσεων περιέχει μόνο 20 παρατηρήσεις για ευκολία υπολογισμού, επειδή πολλοί μαθητές έχουν δυσκολίες ακόμη και στον υπολογισμό των μέσων τιμών. Επί του παρόντος διαθέσιμο ένας μεγάλος αριθμός απόπακέτα λογισμικού για προσδιορισμό στατιστικά χαρακτηριστικά, επομένως κανείς δεν μετράει πλέον χειροκίνητα. Πρέπει να θυμόμαστε ότι η ποιότητα των δεδομένων πηγής έχει μεγάλη σημασία: εάν είναι κακής ποιότητας, τότε το αποτέλεσμα θα είναι το ίδιο· τα στατιστικά και τα μαθηματικά δεν θα βοηθήσουν σε αυτή την περίπτωση.

Παράδειγμα 6.2

Ας υποθέσουμε ότι έχουμε λάβει στατιστικό υλικόσχετικά με τον αριθμό των καταγεγραμμένων τροχαίων ατυχημάτων στο επαρχιακό κέντρο Ν. Παρουσιάζεται σε μορφή πίνακα (Πίνακας 6.3), τα στοιχεία σε αυτόν δίνονται για τις ημερομηνίες του τρέχοντος έτους.

Πίνακας 6.3

Αριθμός ατυχημάτων (x,)

Αριθμός ατυχημάτων (x.)

Σε αυτή την περίπτωση, ο αριθμός των ατυχημάτων είναι μια τυχαία μεταβλητή Χ και τα αποτελέσματα της παρατήρησης δίνονται στον πίνακα. 6.3 - το σύνολο τιμών που δέχεται αυτή η τυχαία μεταβλητή, δηλαδή X = (Xj, x 2 ..., x 20). Τα στοιχεία που δίνονται στον πίνακα. 6.3, είναι απαραίτητο να κανονίσετε, για παράδειγμα την τοποθεσία αναζωογονήστε τα σύμφωνα με τις αυξανόμενες τιμές του μελετημένου χαρακτηριστικού x. (r = 1,20). Εάν η ίδια τιμή επαναληφθεί πολλές φορές, τότε θα την επαναλάβουμε. Ως αποτέλεσμα παίρνουμε στατιστικές σειρέςκατανομές (βλ. Πίνακα 6.4).

Χρησιμοποιώντας τη σειρά κατάταξης (βλ. Πίνακα 6.4), είναι δυνατό να κατασκευαστεί, για παράδειγμα, η συνάρτηση στατιστικής κατανομής F(x), την οποία συζητήσαμε στο Κεφάλαιο 2.

Η F(x) είναι μια ασυνεχής συνάρτηση βήματος, συνεχής στα αριστερά και έχει n άλματα, (n είναι ο αριθμός των παρατηρήσεων) και η τιμή κάθε άλματος είναι 1 /Π.Εφόσον μερικές παρατηρήσεις συμπίπτουν, τα άλματα συγχωνεύονται και ο αριθμός τους θα είναι ίσος με τον αριθμό των παρατηρούμενων τιμών τυχαία μεταβλητήΧ. Στην περίπτωσή μας F(x)θα έχει 15 άλματα, από τα οποία προκύπτει ότι είναι παράλογο να κατασκευαστεί σύμφωνα με μια σειρά κατάταξης, αλλά αυτό θα πρέπει να γίνει σύμφωνα με μια ομαδοποιημένη σειρά, η οποία θα συζητηθεί λίγο αργότερα.

Πίνακας 6.4

Χρησιμοποιώντας τη σειρά κατάταξης (Πίνακας 6.4), είναι δυνατό να προσδιοριστούν εκτιμήσεις των αριθμητικών χαρακτηριστικών της παρατηρούμενης τυχαίας μεταβλητής X (αριθμός ατυχημάτων), για παράδειγμα, ο αριθμητικός μέσος όρος, η διασπορά, η τυπική απόκλιση, το εύρος διακύμανσης κ.λπ.

Ας υπολογίσουμε, για παράδειγμα, το εύρος διακύμανσης και τον αριθμητικό μέσο όρο:

Ολα αριθμητικά χαρακτηριστικάΘα το ορίσουμε σε ακέραιους αριθμούς, αφού δεν υπάρχουν δέκατα ή εκατοστά ενός ατυχήματος. Μπορείτε να υπολογίσετε άλλα αριθμητικά χαρακτηριστικά από τα δεδομένα του Πίνακα. 6.4, αλλά θα το κάνουμε σε μια ομαδοποιημένη σειρά.

Χρησιμοποιώντας τη στατιστική σειρά κατανομής, θα κατασκευάσουμε μια ομαδοποιημένη σειρά, η οποία συζητήθηκε στο Κεφάλαιο 4. Σημειώστε ότι τα μήκη των διαστημάτων σε αυτήν δεν χρειάζεται να είναι τα ίδια, αλλά καθένα από αυτά πρέπει να περιέχει παρατηρήσεις, δηλαδή δεν πρέπει να υπάρχουν άδεια διαστήματα. Εάν η τιμή της τυχαίας μεταβλητής X εμπίπτει στο όριο μεταξύ των ψηφίων, θα τη διαιρέσουμε εξίσου μεταξύ γειτονικών ψηφίων, δηλαδή προσθέτουμε 1/2 στην τιμή καθενός από αυτά.

Μπορείτε να βρείτε περίπου τον βέλτιστο αριθμό ομάδων (κατηγοριών) σε ίσα διαστήματα χρησιμοποιώντας τον τύπο Sturgess:

Οπου Προς την- αριθμός ψηφίων.

Π- αριθμός παρατηρήσεων.

Αλλά αυτή τη φόρμουλαισχύει εάν η κατανομή της τυχαίας μεταβλητής Χ υπό μελέτη προσεγγίζει την κανονική, αλλά δεν το γνωρίζουμε αυτό. Επομένως, δεν θα χρησιμοποιήσουμε τον τύπο Sturgess (στην περίπτωσή μας δίνει το ακόλουθο αποτέλεσμα Προς την« 5.3 « 5).

Η προκύπτουσα ομαδοποιημένη σειρά φαίνεται στον πίνακα. 6.5. Εκτός από ψηφία, συχνότητες, σχετικές συχνότητες, περιέχει επίσης πυκνότητες συχνοτήτων και θεωρητικές πιθανότητες που θα χρειαστούν αργότερα.

Πίνακας 6.5

σημειώσε ότι

Οπου φά*- σχετική πυκνότητα συχνότητας, δηλαδή ο λόγος της σχετικής συχνότητας προς το μήκος του διαστήματος (σε

Στην περίπτωσή μας, είναι το ίδιο για όλα τα ψηφία).

Έχοντας μια ομαδοποιημένη σειρά (βλ. Πίνακα 6.5), είναι δυνατό να κατασκευαστεί κατά προσέγγιση η συνάρτηση στατιστικής κατανομής F(x). Ας πάρουμε τα όρια των ψηφίων ως τις τιμές του X για τις οποίες προσδιορίζεται η F(x). Η συνάρτηση στατιστικής κατανομής για το παράδειγμά μας φαίνεται στο Σχ. 6.1.


Τώρα, χρησιμοποιώντας την ομαδοποιημένη σειρά (βλ. Πίνακα 6.5), θα κατασκευάσουμε ένα ιστόγραμμα, σχεδιάζοντας τα ψηφία στον άξονα της τετμημένης και τις αντίστοιχες πυκνότητες των σχετικών συχνοτήτων στον άξονα τεταγμένων fvΩς αποτέλεσμα, λαμβάνουμε ένα σύνολο ορθογωνίων, το εμβαδόν καθενός από τα οποία είναι ίσο με την αντίστοιχη σχετική συχνότητα (Εικ. 6.2.).

Σημειώστε ότι το ιστόγραμμα μπορεί να κατασκευαστεί χρησιμοποιώντας ψηφιακές συχνότητες.

Τώρα, χρησιμοποιώντας μια ομαδοποιημένη στατιστική σειρά, λαμβάνουμε τα απαιτούμενα αριθμητικά χαρακτηριστικά της τυχαίας μεταβλητής Χ που μελετάται (ο αριθμός των ατυχημάτων), δηλαδή τον αριθμητικό μέσο όρο και ορισμένους δείκτες διακύμανσης. Θα χρησιμοποιήσουμε τη σχετική συχνότητα / (συχνότητα) ως βάρος (μπορείτε να χρησιμοποιήσετε, όπως έχουμε ήδη πει, τη σχετική συχνότητα (α.) ως βάρος.

Ας υπολογίσουμε το μέσο αριθμητικό βάρος:

Οπως και Χ.πάρτε το μέσο του αντίστοιχου διαστήματος. σημειώσε ότι x arαποδείχθηκε το ίδιο όπως και στη σειρά κατάταξης.

Εύρεση της διακύμανσης:

Καθορίζουμε την τυπική απόκλιση:

Ας στρογγυλοποιήσουμε την τυπική απόκλιση στα δέκατα.

Εύρεση της μέσης γραμμικής απόκλισης:

Υπολογίζουμε τον συντελεστή διακύμανσης: δηλαδή ο πληθυσμός μας μπορεί να θεωρηθεί ομοιογενής.

Καθορίζουμε τον συντελεστή ταλάντωσης:

Χρησιμοποιώντας τους τύπους (6.21) και (6.23), υπολογίζουμε τον τρόπο και τη διάμεσο. Κατά τον υπολογισμό αυτών των χαρακτηριστικών, χρησιμοποιούμε τις c.frequences.

Βρίσκουμε τον συντελεστή ασυμμετρίας ροπής:

Για να γίνει αυτό, προσδιορίζουμε πρώτα την εκτίμηση της τρίτης κεντρικής στιγμής:

Να γιατί, Ένα x~ -0,031, δηλαδή έχουμε μια πολύ μικρή αρνητική ασυμμετρία.

Θα εκτιμήσουμε τον βαθμό σημαντικότητας της ασυμμετρίας χρησιμοποιώντας το μέσο τετραγωνικό σφάλμα του συντελεστή ασυμμετρίας σύμφωνα με τον τύπο

Επειδή , τότε η ασυμμετρία είναι ασήμαντη και προκαλείται από την επίδραση τυχαίων λόγων.

Τώρα υπολογίζουμε την κύρτωση χρησιμοποιώντας τον τύπο Για αυτό

Πρώτα βρίσκουμε μια εκτίμηση για την τέταρτη κεντρική στιγμή:

Επομένως, η κύρτωση είναι ίση. ε. η διανομή μας

ελαφρώς πιεσμένο στον άξονα x.

Για να προσδιορίσουμε τη σημασία της κύρτωσης της κατανομής, υπολογίζουμε το μέσο τετραγωνικό σφάλμα της χρησιμοποιώντας τον τύπο (6.55). Παίρνουμε

Από τη στάση λιγότερο από 3, μετά απόκλιση από

Σημειώστε ότι η τυπική απόκλιση σε μέγεθος είναι πάντα μεγαλύτερη από τη μέση γραμμική απόκλιση. Στην περίπτωσή μας

Η αναλογία εξαρτάται από την παρουσία έντονων αποκλίσεων στο σύνολο και μπορεί να είναι δείκτης του «φράξου» της με άτυπες μονάδες που ξεχωρίζουν από το μεγαλύτερο μέρος. Για κανονική κατανομή η αναλογία

Για το παράδειγμά μας έχουμε

Αντικαθιστώντας τα αριθμητικά χαρακτηριστικά μιας τυχαίας μεταβλητής με τις εκτιμήσεις τους, κάνουμε κάποιο λάθος. Είναι επιθυμητό να εκτιμηθεί αυτό το σφάλμα και να βρεθεί η πιθανότητα (αξιοπιστία) ότι δεν θα ξεπεράσει κάποια μικρά θετικά s (ακρίβεια).

Στο παράδειγμα που εξετάζουμε, αντικαταστήσαμε M[X]επί os ar,ΕΝΑ D[X]επί Dx.Ας αξιολογήσουμε την ακρίβεια και την αξιοπιστία αυτών των εκτιμήσεων με βάση τα αποτελέσματα του παραδείγματός μας.

Για να αξιολογήσετε την ακρίβεια και την αξιοπιστία μιας εκτίμησης, πρέπει να γνωρίζετε τον νόμο κατανομής της. Σε πολλές περιπτώσεις αυτός ο νόμος αποδεικνύεται ότι είναι κοντά στο κανονικό. Δεδομένου ότι ο μέσος όρος στατιστική σημασίαΗ τυχαία μεταβλητή X είναι το άθροισμα ενός αρκετά μεγάλου αριθμού ανεξάρτητων τυχαίων μεταβλητών, τότε σύμφωνα με την κεντρική οριακό θεώρημαη κατανομή είναι κοντά στο φυσιολογικό με μαθηματική προσδοκία

και διασπορά και επομένως με το πρότυπο

Προκειμένου να προσδιοριστούν οι παράμετροι της κανονικής κατανομής σύμφωνα με τις οποίες βρίσκεται η εκτίμηση x ar,αντικαθιστούμε τις αληθείς παραμέτρους στους τύπους (6.57)-(6.59) Μ[Χ], D και a(x) από τις εκτιμήσεις τους xap, Dx, d xκαι παίρνουμε

Υποθέτοντας ότι η τυχαία μεταβλητή x arέχει κανονική κατανομή με παραμέτρους M[x ar]Και ΡΕ,βρίσκουμε περίπου την πιθανότητα ότι η εκτίμηση x arαποκλίνει από το δικό του μαθηματική προσδοκίαλιγότερο από s.

όπου Ф 0 (x) είναι η κανονικοποιημένη συνάρτηση Laplace, η οποία συζητήθηκε ήδη στο Κεφάλαιο 2. Έχουν συνταχθεί πίνακες για αυτήν (βλ. Παράρτημα 5).

Ας χρησιμοποιήσουμε τα δεδομένα από το παράδειγμα που εξετάζουμε και ας αξιολογήσουμε την ακρίβεια και την αξιοπιστία x ar.Για το παράδειγμά μας έχουμε: x ar = 90; D x = 57,5; d x = 7.6. Ας βρούμε την πιθανότητα ότι, υποθέτοντας M[X] * x ar,δεν θα κάνουμε λάθος μεγαλύτερο από e - 3.

Χρησιμοποιώντας τους τύπους (6.60)-(6.62) πήραμε:

Από τον πίνακα στο Παράρτημα 5 βρίσκουμε F o (1,765) = 0,46164, δηλαδή την πιθανότητα λάθους από την αντικατάσταση του M[X] με x arδεν θα υπερβαίνει το 3 περίπου ίσο με 0,92 (92%). Αυτή η πιθανότητα μπορεί να θεωρηθεί επαρκής.

Είναι αποδεδειγμένο ότι όταν p> 20 βαθμολογία Dxανεξάρτητα από την κατανομή της τυχαίας μεταβλητής Χ κατανέμεται κατά προσέγγιση κανονικός νόμοςμε παραμέτρους:

Αντικατάσταση του D[X] στους τύπους (6.64)-(6.66) στατιστική αξιολόγηση Dxπαίρνουμε:

Χρησιμοποιώντας τα δεδομένα του παραδείγματος, χρησιμοποιώντας τους τύπους (6.67) και (6.69) λαμβάνουμε:

Τώρα, χρησιμοποιώντας τον τύπο (6.63), βρίσκουμε την πιθανότητα ότι η εκτίμηση Dxθα αποκλίνει από το δικό του αληθινό νόημαΤο D[X] είναι μικρότερο από e = 3.


Από τον πίνακα στο Παράρτημα 5 βρίσκουμε ФД0Д6) = 0,06356, δηλαδή την πιθανότητα η εκτίμηση από την αντικατάσταση του D[X] από Dxθα είναι μικρότερο από 3 ίσο με 0,13 (13%), το οποίο σαφώς δεν είναι αρκετό. Έχουμε μόνο 20 παρατηρήσεις και οι τύποι (6.64)-(6.66) λειτουργούν για n > 20.

Έχουμε ήδη πει ότι το παράδειγμά μας είναι εκπαιδευτικό. ΣΕ πραγματικά προβλήματαυπάρχουν πολύ περισσότερα δεδομένα, επομένως η πιθανότητα που προκύπτει από τον τύπο (6.63) θα είναι πολύ μεγαλύτερη.

Το ιστόγραμμα που λάβαμε (βλ. Εικ. 6.2.) είναι γραφική εικόναδιανομή μας. Αλλά χρησιμοποιήστε ένα ιστόγραμμα όταν περαιτέρω έρευναάβολος. Επομένως, τίθεται το ερώτημα σχετικά με το πώς να επιλέξουμε για μια δεδομένη συγκεκριμένη κατανομή μια αναλυτική εξάρτηση (τύπος) που θα εξέφραζε μόνο τα ουσιαστικά χαρακτηριστικά της διανομής μας. Αυτή η εργασίαπου ονομάζεται, ευθυγραμμίζουμε τις στατιστικές κατανομές. Συνήθως το ιστόγραμμα ισοπεδώνεται, δηλαδή αντικαθίσταται από κάποια θεωρητική καμπύλη που έχει μια συγκεκριμένη αναλυτική έκφραση. Και τότε αυτή η έκφραση λαμβάνεται ως η πυκνότητα κατανομής /(x).

Στο υπό εξέταση παράδειγμα, ευθυγραμμίζουμε το ιστόγραμμα που κατασκευάσαμε σύμφωνα με τον κανονικό νόμο με τις παραμέτρους x ar= 90; a x = 7,6, δηλαδή στην έκφραση για την πυκνότητα της κανονικής κατανομής

Αντικαθιστούμε τα M[X] και a[X] με τις εκτιμήσεις τους και παίρνουμε

Ως αξίες Χπαίρνουμε τα όρια των διαστημάτων στις ομαδοποιημένες σειρές μας, τα αντικαθιστούμε στον τύπο (6.70) και παίρνουμε:

Σχεδιάζουμε τα ληφθέντα δεδομένα στο Σχ. 6.2 και λαμβάνουμε μια ομαλή καμπύλη.

Τώρα ας ελέγξουμε την υπόθεση H o σχετικά με τον νόμο της κανονικής κατανομής με την πυκνότητα f(x).Η υπόθεση H o έρχεται σε αντίθεση με την εναλλακτική υπόθεση H 1, η οποία λέει ότι η τυχαία μεταβλητή X δεν υπακούει στον κανονικό νόμο με τις παραμέτρους x ar= 90; a x = 7,6.

Προκειμένου να συμπεράνουμε εάν τα δεδομένα παρατήρησης είναι συνεπή με την υπόθεση που έχουμε υποβάλει, χρησιμοποιείται ένα κριτήριο καλής προσαρμογής. Το κριτήριο της συμφωνίας είναι το κριτήριο για τον έλεγχο της υπόθεσης σχετικά με τον νόμο διανομής. Χρησιμοποιείται για τον έλεγχο της συμφωνίας του υποτιθέμενου τύπου νόμου διανομής με τα πειραματικά δεδομένα.

Υπάρχουν διάφορα κριτήρια συμφωνίας: Pearson, Fisher, Kolmogorov κ.λπ.

Κατά τον έλεγχο υποθέσεων, μπορούν να γίνουν δύο είδη σφαλμάτων. Ένα σφάλμα του πρώτου τύπου είναι ότι η αληθινή μηδενική υπόθεση H o απορρίπτεται. σφάλμα του δεύτερου τύπου - στο ότι η σωστή εναλλακτική υπόθεση N g απορρίπτεται

Η πιθανότητα ενός σφάλματος τύπου Ι (α) ονομάζεται επίπεδο σημαντικότητας του κριτηρίου. Όσο μικρότερο το α, τόσο λιγότερο πιθανό είναι να απορριφθεί η σωστή υπόθεση Νο. Το αποδεκτό α ορίζεται συνήθως εκ των προτέρων. Κατά κανόνα, χρησιμοποιούνται τυπικές τιμές a = 0,01. 0,05; 0.1.

Η πιθανότητα σφάλματος τύπου II συμβολίζεται με p. Η τιμή (1 - p) - η πιθανότητα αποφυγής σφάλματος δεύτερου τύπου (αποδοχή της σωστής υπόθεσης και απόρριψη της εσφαλμένης υπόθεσης H 0) - ονομάζεται ισχύς του κριτηρίου.

Πρώτα χρησιμοποιούμε για να ελέγξουμε την υπόθεση για κανονική κατανομήΚριτήριο Pearson (x 2) - Ας κάνουμε μια σύντομη θεωρητικές πληροφορίες. Ας υποθέσουμε ότι διεξάγονται n πειράματα σε καθένα από τα οποία παίρνει η τυχαία μεταβλητή X συγκεκριμένη τιμή, δηλ. x 1 x 2 ....., x k (Προς την- αριθμός πιθανών τιμών

τυχαία μεταβλητή X). Ως αποτέλεσμα, λαμβάνουμε μια στατιστική σειρά κατανομής (Πίνακας 6.6).

Πίνακας 6.6

όπου είναι οι αντίστοιχες πιθανότητες.

Πιστεύουμε ότι οι αποκλίσεις / από Rέχουν τυχαίες αιτίες. Για να ελέγξετε την αληθοφάνεια της υπόθεσης που διατυπώθηκε, είναι απαραίτητο να επιλέξετε κάποιο μέτρο της απόκλισης μεταξύ στατιστικών και θεωρητικών κατανομών.

Ως τέτοιο μέτρο ασυμφωνίας όταν χρησιμοποιείται το κριτήριο Pearson, το άθροισμα των τετραγωνικών αποκλίσεων (/. - R.),λαμβάνονται με μερικά βάρη ΜΕ ( ,δηλ.

Εισάγονται βαρίδια Σ., αφού αποκλίσεις σχετίζονται με διαφορετικές έννοιεςΤο R. δεν μπορεί να θεωρηθεί ίσο σε σημασία.

Ο Pearson απέδειξε ότι αν πάρεις

τότε πότε μεγάλος αριθμόςπειράματα Πνόμος της κατανομής της ποσότητας R aέχει τις ακόλουθες ιδιότητες: πρακτικά δεν εξαρτάται από τον νόμο κατανομής της τυχαίας μεταβλητής X, εξαρτάται ελάχιστα από τον αριθμό των πειραμάτων n, εξαρτάται μόνο από τον αριθμό των τιμών της τυχαίας μεταβλητής X(k)και στο ν -> Το oo προσεγγίζει την κατανομή x 2 Επομένως, το μέτρο της απόκλισης σε αυτή την περίπτωση συμβολίζεται % 2 , δηλ.

Εισάγουμε p κάτω από το σύμβολο του αθροίσματος, λαμβάνοντας υπόψη ότι, και μετά

μεταμορφώσεις που παίρνουμε

Η κατανομή του x2 εξαρτάται από μια παράμετρο που ονομάζεται αριθμός βαθμών ελευθερίας (rc), η οποία ορίζεται ως εξής:

Οπου S e-- ποσότητα ανεξάρτητες συνθήκες, οι οποίες υπερτίθενται στις σχετικές συχνότητες. Για το παράδειγμά μας S e= 3. Απαιτήσαμε να πληρούνται οι ακόλουθες προϋποθέσεις:

Για διανομή % 2 έχουν συνταχθεί πίνακες (βλ. Παράρτημα 6). Για το παράδειγμά μας, θα ελέγξουμε την υπόθεση της κανονικής κατανομής χρησιμοποιώντας το τεστ Pearson.

Ας επιστρέψουμε στο τραπέζι. 6.5, όπου απομένει μία κενή στήλη (R.) - αυτές είναι οι θεωρητικές πιθανότητες να πέσουμε στο διάστημα μιας τυχαίας μεταβλητής X που έχει κανονική κατανομή με παραμέτρους x ar = 90; a x = 7,6.

Για να τα βρούμε χρησιμοποιούμε τον τύπο (2.44). Παίρνουμε:

όπου Ф о (х) είναι η κανονικοποιημένη συνάρτηση Laplace, για την οποία, όπως έχουμε ήδη πει, έχουν συνταχθεί πίνακες (βλ. Παράρτημα 5).

Εισάγουμε τις λαμβανόμενες τιμές πιθανότητας στον πίνακα. 6.5. Στη συνέχεια, χρησιμοποιώντας τον τύπο (6.74), λαμβάνουμε:

Ο αριθμός των βαθμών ελευθερίας στην περίπτωσή μας είναι ίσος με r, = 6 - 3 = 3. Θεωρούμε ότι το επίπεδο σημαντικότητας είναι 0,1, δηλαδή a = 0,1. Χρησιμοποιώντας τον πίνακα κατανομής x2 (βλ. Παράρτημα 6), με επίπεδο σημαντικότητας a = 0,1 και με αριθμό βαθμών ελευθερίας r = 3, βρίσκουμε %m = 6,25.

Επειδή Xt > X P,τότε η υπόθεση της κανονικής κατανομής δεν έρχεται σε αντίθεση με τα δεδομένα παρατήρησης και μπορεί να γίνει αποδεκτή με επίπεδο σημαντικότητας 0,1. Εάν δεν έχετε διαθέσιμο πίνακα κατανομής x 2, για να αξιολογήσετε την τυχαιότητα της απόκλισης /. από R.μπορείτε να χρησιμοποιήσετε το κριτήριο Romanovsky

Εάν η αναλογία (6,76) είναι μικρότερη από τρεις, τότε η απόκλιση μεταξύ της πραγματικής και της θεωρητικής κατανομής είναι τυχαία, διαφορετικά είναι σημαντικές.

Για το παράδειγμα δεδομένα που έχουμε , επομένως μπορεί να γίνει αποδεκτή και η υπόθεση της κανονικής κατανομής.

Τώρα εφαρμόζουμε το τεστ καλής προσαρμογής του Kolmogorov για να ελέγξουμε την υπόθεση της κανονικής κατανομής.

Το κριτήριο Kolmogorov βασίζεται στην εύρεση της μέγιστης απόκλισης μεταξύ των συσσωρευμένων συχνοτήτων ή σχετικών συχνοτήτων της πειραματικής κατανομής και των πιθανοτήτων της θεωρητικής κατανομής. Καθορίζεται από τους τύπους:

εάν χρησιμοποιείτε συσσωρευμένες σχετικές συχνότητες.

αν χρησιμοποιήσουμε συσσωρευμένες συχνότητες, όπου δ Μ- τη μέγιστη τιμή των αποκλίσεων μεταξύ των συσσωρευμένων σχετικών συχνοτήτων και πιθανοτήτων.

Δ Μ- μέγιστη διαφορά μεταξύ πραγματικών και θεωρητικών συχνοτήτων.

Θα χρησιμοποιήσουμε τον τύπο (6.77) και θα τοποθετήσουμε τα απαραίτητα δεδομένα στον πίνακα. 6.8.

Από το τραπέζι 6.8 προκύπτει ότι, επομένως, σύμφωνα με τον τύπο

(6.75) παίρνουμε

Πίνακας 6.8

Συσσωρευμένος φάκαι π

Στη συνέχεια σύμφωνα με τους πίνακες R()(βλ. Παράρτημα 8) βρίσκουμε P(X k)= 1. Επομένως, μπορούμε να υποθέσουμε ότι οι αποκλίσεις μεταξύ των σχετικών συχνοτήτων και των θεωρητικών πιθανοτήτων είναι τυχαίας φύσης και, επομένως, η υπόθεση της κανονικής κατανομής δεν έρχεται σε αντίθεση με τα δεδομένα παρατήρησης.

Εν κατακλείδι, επαναλαμβάνουμε για άλλη μια φορά ότι το παράδειγμά μας είναι για εκπαιδευτικούς σκοπούς. Πρέπει να ληφθεί υπόψη ότι όταν χρησιμοποιείται το κριτήριο Pearson, ο αριθμός των παρατηρήσεων πρέπει να είναι τουλάχιστον αρκετές δεκάδες, κάθε κατηγορία πρέπει να έχει τουλάχιστον πέντε παρατηρήσεις και ο αριθμός των κατηγοριών πρέπει να είναι περίπου 10-15.

Ερωτήσεις αυτοδιαγνωστικού ελέγχου

  • 1. Τι τύποι μέσων όρων χρησιμοποιούνται στις στατιστικές;
  • 2. Πώς προσδιορίζονται οι αρμονικοί απλοί και σταθμισμένοι μέσοι όροι;
  • 3. Πώς προσδιορίζονται οι γεωμετρικοί απλοί και σταθμισμένοι μέσοι όροι;
  • 4. Πώς προσδιορίζεται ο απλός και σταθμισμένος αριθμητικός μέσος όρος;
  • 5. Πώς υπολογίζονται τα μέσα τετραγωνικά και τα μέσα κυβικά;
  • 6. Ποιους δείκτες διακύμανσης γνωρίζετε;
  • 7. Ποιο είναι το εύρος διακύμανσης και η μέση γραμμική απόκλιση; Ποιοι τύποι χρησιμοποιούνται για τον υπολογισμό τους;
  • 8. Τι είναι η διακύμανση και η τυπική απόκλιση; Ποιοι τύποι χρησιμοποιούνται για τον υπολογισμό τους;
  • 9. Ποιος τύπος χρησιμοποιείται για να βρεθεί η διακύμανση ενός ποιοτικού χαρακτηριστικού;
  • 10. Ποιος είναι ο συντελεστής διακύμανσης; Ποια είναι η σημασία του για την οικονομική ανάλυση;
  • 11. Ποιος είναι ο κανόνας για την προσθήκη διασποράς;
  • 12. Τι είναι η λοξότητα και η κύρτωση και ποιοι είναι οι τύποι για την εύρεση τους;