Βιογραφίες Χαρακτηριστικά Ανάλυση

Μέσος όρος. Προσδιορισμός τρόπου λειτουργίας και διάμεσου με γραφική μέθοδο

Το 1906, ο μεγάλος επιστήμονας και διάσημος ευγονιστής Francis Galton επισκέφτηκε την ετήσια έκθεση επιτευγμάτων στην κτηνοτροφία και την πτηνοτροφία στη δυτική Αγγλία, όπου, εντελώς τυχαία, πραγματοποίησε ένα ενδιαφέρον πείραμα.

Όπως σημειώνει ο James Surowiecki, συγγραφέας του The Wisdom of Crowds, στην έκθεση ο Galton ενδιαφερόταν για έναν διαγωνισμό στον οποίο οι άνθρωποι έπρεπε να μαντέψουν το βάρος ενός σφαγμένου βοδιού. Αυτός που κατονόμασε τους πλησιέστερους αληθινός αριθμόςανακηρύχθηκε νικητής.

Ο Γκάλτον ήταν διάσημος για την περιφρόνησή του διανοητικές ικανότητες απλοί άνθρωποι. Πίστευε ότι μόνο αληθινοί ειδικοί θα μπορούσαν να κάνουν ακριβείς δηλώσεις για το βάρος ενός βοδιού. Και 787 συμμετέχοντες στον διαγωνισμό δεν ήταν ειδικοί.

Ο επιστήμονας επρόκειτο να αποδείξει την ανικανότητα του πλήθους υπολογίζοντας τον μέσο όρο των απαντήσεων των συμμετεχόντων. Φανταστείτε την έκπληξή του όταν αποδείχθηκε ότι το αποτέλεσμα που έλαβε αντιστοιχούσε σχεδόν ακριβώς στο πραγματικό βάρος του ταύρου!

Μέσος όρος - Ύστερη Εφεύρεση

Φυσικά, η ακρίβεια της απάντησης εξέπληξε τον ερευνητή. Αλλά ακόμη πιο αξιοσημείωτο είναι το γεγονός ότι ο Galton σκέφτηκε ακόμη και να χρησιμοποιήσει τη μέση τιμή.

Στον σημερινό κόσμο, οι μέσοι όροι και οι λεγόμενοι διάμεσοι δείκτες βρίσκονται σε κάθε βήμα: μέση θερμοκρασίαΣτη Νέα Υόρκη τον Απρίλιο είναι 52 βαθμοί Φαρενάιτ. Ο Stephen Curry έχει μέσο όρο 30 πόντους ανά παιχνίδι. Το μεσαίο οικογενειακό εισόδημα στις ΗΠΑ είναι 51.939 $/έτος.

Ωστόσο, η ιδέα ότι πολλά διαφορετικά αποτελέσματα μπορούν να αναπαρασταθούν από έναν μόνο αριθμό είναι αρκετά νέα. Μέχρι τον 17ο αιώνα, οι μέσοι όροι δεν χρησιμοποιούνταν καθόλου.

Πώς προέκυψε και αναπτύχθηκε η έννοια των μέσων όρων και των διαμέσου; Και πώς κατάφερε να γίνει η κύρια τεχνική μέτρησης στην εποχή μας;

Η κυριαρχία των μέσων όρων έναντι των διαμέτρων είχε εκτεταμένες συνέπειες για την κατανόησή μας των πληροφοριών. Και συχνά παρέσυρε τους ανθρώπους.

Μέσες και διάμεσες τιμές

Φανταστείτε ότι λέτε μια ιστορία για τέσσερα άτομα που είχαν δείπνο μαζί σας σε ένα εστιατόριο χθες το βράδυ. Θα δίνατε σε έναν από αυτούς 20 χρόνια, σε άλλους 30, σε έναν τρίτο 40 και στον τέταρτο 50. Τι θα λέγατε για τις ηλικίες τους στην ιστορία σας;

Το πιο πιθανό είναι να τους αποκαλούσατε μέση ηλικία.

Ο μέσος όρος χρησιμοποιείται συχνά για να μεταφέρει πληροφορίες για κάτι, καθώς και για να περιγράψει ένα σύνολο μετρήσεων. Τεχνικά, ο μέσος όρος είναι αυτό που οι μαθηματικοί αποκαλούν «αριθμητικό μέσο»—το άθροισμα όλων των μετρήσεων διαιρεμένο με τον αριθμό των μετρήσεων.

Αν και η λέξη μέσος όρος χρησιμοποιείται συχνά ως συνώνυμο της διάμεσης τιμής, η τελευταία αναφέρεται πιο συχνά στη μέση κάποιου πράγματος. Αυτή η λέξη προέρχεται από το λατινικό "medianus", που σημαίνει "μέση".

Μέση τιμή σε Αρχαία Ελλάδα

Η ιστορία της διάμεσης αξίας ξεκινά με τις διδασκαλίες του αρχαίου Έλληνα μαθηματικού Πυθαγόρα. Για τον Πυθαγόρα και τη σχολή του, ο διάμεσος είχε έναν σαφή ορισμό και ήταν πολύ διαφορετικός από τον τρόπο που αντιλαμβανόμαστε τη μέση τιμή σήμερα. Χρησιμοποιήθηκε μόνο στα μαθηματικά, όχι στην ανάλυση δεδομένων.

Στο Πυθαγόρειο σχολείο διάμεση τιμήήταν ο μεσαίος αριθμός σε μια ακολουθία αριθμών τριών όρων, όντας σε «ίση» σχέση με γειτονικά μέλη. Μια «ισότιμη» σχέση θα μπορούσε να σημαίνει ίση απόσταση. Για παράδειγμα, ο αριθμός 4 στη σειρά 2,4,6. Ωστόσο, θα μπορούσε επίσης να εκφράσει γεωμετρική πρόοδος, για παράδειγμα 10 στην ακολουθία 1,10,100.

Ο στατιστικολόγος Churchill Eisenhart εξηγεί ότι στην αρχαία Ελλάδα, η διάμεση τιμή δεν χρησιμοποιήθηκε για να αναπαραστήσει ή να αντικαταστήσει οποιοδήποτε σύνολο αριθμών. Απλώς υποδήλωνε τη μέση και χρησιμοποιήθηκε συχνά σε μαθηματικές αποδείξεις.

Ο Άιζενχαρτ πέρασε δέκα χρόνια μελετώντας τη μέση και τη διάμεσο. Αρχικά προσπάθησε να βρει την αντιπροσωπευτική λειτουργία της διάμεσης στις πρώιμες επιστημονικές κατασκευές. Αντίθετα, ωστόσο, ανακάλυψε ότι οι περισσότεροι πρώιμοι φυσικοί και αστρονόμοι βασίζονταν σε μεμονωμένες, επιδέξια μετρήσεις και δεν είχαν μια μεθοδολογία που να τους επέτρεπε να επιλέξουν καλύτερο αποτέλεσμαανάμεσα σε πολλές παρατηρήσεις.

Οι σύγχρονοι ερευνητές βασίζουν τα συμπεράσματά τους στη συλλογή μεγάλων ποσοτήτων δεδομένων, όπως οι βιολόγοι που μελετούν το ανθρώπινο γονιδίωμα. Οι αρχαίοι επιστήμονες μπορούσαν να κάνουν πολλές μετρήσεις, αλλά επέλεξαν μόνο τις καλύτερες για να χτίσουν τις θεωρίες τους.

Όπως έγραψε ο ιστορικός της αστρονομίας Otto Neugebauer, «Αυτό είναι σύμφωνο με τη συνειδητή επιθυμία αρχαίοι άνθρωποιελαχιστοποιήστε τον όγκο των εμπειρικών δεδομένων στην επιστήμη επειδή δεν πίστευαν στην ακρίβεια των άμεσων παρατηρήσεων».

Για παράδειγμα, ο Έλληνας μαθηματικός και αστρονόμος Πτολεμαίος υπολόγισε τη γωνιακή διάμετρο της Σελήνης χρησιμοποιώντας μεθόδους παρατήρησης και τη θεωρία της κίνησης της γης. Το αποτέλεσμα του ήταν 31'20. Σήμερα γνωρίζουμε ότι η διάμετρος της Σελήνης κυμαίνεται από 29'20 έως 34'6 ανάλογα με την απόστασή της από τη Γη. Ο Πτολεμαίος χρησιμοποίησε λίγα δεδομένα στους υπολογισμούς του, αλλά είχε κάθε λόγο να πιστεύει ότι ήταν ακριβείς.

Ο Άιζενχαρτ γράφει: «Πρέπει να ληφθεί υπόψη ότι η σχέση μεταξύ παρατήρησης και θεωρίας ήταν διαφορετική στην αρχαιότητα από ό,τι σήμερα. Τα αποτελέσματα των παρατηρήσεων δεν έγιναν κατανοητά ως γεγονότα στα οποία θα έπρεπε να προσαρμοστεί η θεωρία, αλλά ως συγκεκριμένες περιπτώσεις που μπορούν να είναι χρήσιμες μόνο ως ενδεικτικά παραδείγματα της αλήθειας της θεωρίας».

Οι επιστήμονες θα στραφούν τελικά σε αντιπροσωπευτικά μέτρα δεδομένων, αλλά αρχικά δεν χρησιμοποιήθηκαν ούτε μέσα ούτε διάμεσοι για αυτόν τον ρόλο. Από την αρχαιότητα έως σήμεραΩς αντιπροσωπευτικό μέσο χρησιμοποιήθηκε μια άλλη μαθηματική έννοια - το μισό άθροισμα των ακραίων τιμών.

Μισό άθροισμα ακραίων τιμών

Νέος επιστημονικά μέσασχεδόν πάντα προκύπτουν από την ανάγκη επίλυσης ενός συγκεκριμένου προβλήματος σε κάποια πειθαρχία. Πρέπει να βρεθεί η καλύτερη αξίαμεταξύ πολλών μετρήσεων προέκυψε από την ανάγκη ακριβούς προσδιορισμού της γεωγραφικής θέσης.

Ο πνευματικός γίγαντας του 11ου αιώνα Al-Biruni είναι γνωστός ως ένας από τους πρώτους ανθρώπους που χρησιμοποίησαν τη μεθοδολογία των αντιπροσωπευτικών νοημάτων. Ο Al-Biruni έγραψε ότι όταν είχε πολλές μετρήσεις στη διάθεσή του και ήθελε να βρει την καλύτερη από αυτές, χρησιμοποίησε τον ακόλουθο «κανόνα»: πρέπει να βρείτε τον αριθμό που αντιστοιχεί στη μέση μεταξύ δύο ακραίων τιμών. Κατά τον υπολογισμό του μισού αθροίσματος των ακραίων τιμών, όλοι οι αριθμοί μεταξύ του μέγιστου και ελάχιστες τιμές, αλλά ο μέσος όρος βρίσκεται μόνο για αυτούς τους δύο αριθμούς.

Ο Al-Biruni χρησιμοποίησε αυτή τη μέθοδο σε διάφορους τομείς, συμπεριλαμβανομένου του υπολογισμού του γεωγραφικού μήκους της πόλης Ghazni, η οποία βρίσκεται στο σύγχρονο Αφγανιστάν, καθώς και στις μελέτες του για τις ιδιότητες των μετάλλων.

Ωστόσο, τους τελευταίους αιώνες, το μισό άθροισμα των ακραίων τιμών χρησιμοποιείται όλο και λιγότερο. Στην πραγματικότητα, σε σύγχρονη επιστήμηδεν είναι καθόλου σχετικό. Το μισό άθροισμα έχει αντικατασταθεί από τη διάμεση τιμή.

Μετάβαση στους μέσους όρους

Στις αρχές του 19ου αιώνα, η χρήση της διάμεσης/μέσης τιμής έγινε μια κοινή μέθοδος εύρεσης της ακριβέστερης αντιπροσωπευτικής τιμής από μια ομάδα δεδομένων. Ο Φρίντριχ φον Γκάους, ένας εξαιρετικός μαθηματικός της εποχής του, έγραψε το 1809: «Πιστευόταν ότι αν ένας συγκεκριμένος αριθμός καθοριζόταν από πολλές άμεσες παρατηρήσεις που έγιναν κάτω από ίδιες συνθήκες, τότε ο μέσος όρος αριθμητική τιμήείναι το πιο αληθινό νόημα. Εάν δεν είναι εντελώς αυστηρό, τότε τουλάχιστον είναι κοντά στην πραγματικότητα, και επομένως μπορείτε πάντα να βασίζεστε σε αυτό».

Γιατί συνέβη αυτή η αλλαγή στη μεθοδολογία;

Αυτή η ερώτηση είναι αρκετά δύσκολο να απαντηθεί. Στη μελέτη του, ο Churchill Eisenhart προτείνει ότι η μέθοδος εύρεσης του αριθμητικού μέσου όρου μπορεί να προήλθε από το πεδίο της μέτρησης της μαγνητικής απόκλισης, δηλαδή στην εύρεση της διαφοράς μεταξύ της κατεύθυνσης της βελόνας της πυξίδας που δείχνει τον βορρά και τον πραγματικό βορρά. Αυτή η διάσταση ήταν εξαιρετικά σημαντική κατά την Εποχή της Μεγάλης Γεωγραφικής Ανακάλυψης.

Ο Eisenhart διαπίστωσε ότι μέχρι τα τέλη του 16ου αιώνα, οι περισσότεροι επιστήμονες που μετρούσαν τη μαγνητική απόκλιση χρησιμοποιούσαν τη μέθοδο ad hoc (στα λατινικά "to this, for this case, for this purpose") στην επιλογή της πιο ακριβούς μέτρησης.

Όμως το 1580 επιστήμονας ΓουίλιαμΟ Boro προσέγγισε το πρόβλημα διαφορετικά. Πήρε οκτώ διαφορετικές μετρήσεις της εκτροπής και, αφού τις σύγκρινε, κατέληξε στο συμπέρασμα ότι η πιο ακριβής τιμή ήταν μεταξύ 11 ⅓ και 11 ¼ μοιρών. Μάλλον υπολόγισε έναν αριθμητικό μέσο όρο που ήταν σε αυτό το εύρος. Ωστόσο, ο ίδιος ο Boro δεν αποκάλεσε ανοιχτά την προσέγγισή του ως νέα μέθοδο.

Πριν από το 1635, δεν υπήρχαν σαφείς περιπτώσεις χρήσης του μέσου όρου ως αντιπροσωπευτικού αριθμού. Ωστόσο, τότε ήταν που ο Άγγλος αστρονόμος Henry Gellibrand έκανε δύο διαφορετικές μετρήσεις μαγνητικής εκτροπής. Το ένα από αυτά λήφθηκε το πρωί (11 βαθμοί) και το άλλο το απόγευμα (11 βαθμοί και 32 λεπτά). Υπολογίζοντας τα περισσότερα αληθινό νόημα, έγραψε:

«Αν βρούμε τον αριθμητικό μέσο όρο, μπορούμε να πούμε με μεγάλη πιθανότητα ότι το αποτέλεσμα μιας ακριβούς μέτρησης θα πρέπει να είναι περίπου 11 μοίρες και 16 λεπτά».

Είναι πιθανό ότι αυτή ήταν η πρώτη φορά που η μέση τιμή χρησιμοποιήθηκε ως η πλησιέστερη στην πραγματική τιμή!

Η λέξη "μέσος όρος" χρησιμοποιήθηκε σε αγγλική γλώσσαστις αρχές του 16ου αιώνα για να υποδηλώνει οικονομική ζημία από ζημιές που δέχτηκε ένα πλοίο ή ένα φορτίο κατά τη διάρκεια ενός ταξιδιού. Τα επόμενα εκατό χρόνια, όρισε ακριβώς αυτές τις απώλειες, οι οποίες υπολογίστηκαν ως ο αριθμητικός μέσος όρος. Για παράδειγμα, εάν ένα πλοίο υπέστη ζημιά κατά τη διάρκεια ενός ταξιδιού και το πλήρωμα έπρεπε να πετάξει κάποια αγαθά στη θάλασσα για να διατηρήσει το βάρος του, οι επενδυτές θα υποστούν οικονομικές απώλειες ισοδύναμες με το ποσό της επένδυσής τους - αυτές οι απώλειες υπολογίστηκαν με τον ίδιο τρόπο όπως τον αριθμητικό μέσο όρο. Έτσι σταδιακά οι τιμές του μέσου όρου και του αριθμητικού μέσου όρου πλησίασαν.

Μέση τιμή

Σήμερα, ο μέσος όρος ή ο αριθμητικός μέσος όρος χρησιμοποιείται ως η κύρια μέθοδος για την επιλογή μιας αντιπροσωπευτικής τιμής για ένα σύνολο μετρήσεων. Πως εγινε αυτο? Γιατί δεν δόθηκε αυτός ο ρόλος στη διάμεση τιμή;

Ο Φράνσις Γκάλτον ήταν ο πρωταθλητής της διάμεσης

Ο όρος "διάμεσος" - ο μεσαίος όρος σε μια σειρά αριθμών που διαιρεί τη σειρά στο μισό - εμφανίστηκε περίπου την ίδια στιγμή με τον αριθμητικό μέσο όρο. Το 1599, ο μαθηματικός Edward Wright, εργαζόμενος στο πρόβλημα της κανονικής απόκλισης πυξίδας, πρότεινε για πρώτη φορά τη χρήση της διάμεσης τιμής.

«...Ας υποθέσουμε ότι πολλοί τοξότες πυροβολούν έναν συγκεκριμένο στόχο. Ο στόχος αφαιρείται στη συνέχεια. Πώς μπορείτε να μάθετε πού ήταν ο στόχος; Πρέπει να βρείτε τη μεσαία θέση ανάμεσα σε όλα τα βέλη. Ομοίως, ανάμεσα σε πολλά αποτελέσματα παρατήρησης, αυτό που βρίσκεται στη μέση θα είναι πιο κοντά στην αλήθεια».

Ο διάμεσος χρησιμοποιήθηκε ευρέως τον δέκατο ένατο αιώνα, και έγινε απαραίτητο μέρος οποιασδήποτε ανάλυσης δεδομένων εκείνη την εποχή. Χρησιμοποιήθηκε επίσης από τον Francis Galton, έναν εξαιρετικό αναλυτή του δέκατου ένατου αιώνα. Στην ιστορία του ζυγίσματος του βοδιού που αναφέρθηκε στην αρχή αυτού του άρθρου, ο Galton αρχικά χρησιμοποίησε τη διάμεση τιμή ως αντιπροσώπευση της γνώμης του πλήθους.

Πολλοί αναλυτές, συμπεριλαμβανομένου του Galton, προτίμησαν τη διάμεσο επειδή είναι ευκολότερο να υπολογιστεί για μικρά σύνολα δεδομένων.

Ωστόσο, ο διάμεσος δεν ήταν ποτέ πιο δημοφιλής από τον μέσο όρο. Πιθανότατα, αυτό συνέβη λόγω ειδικών στατιστικές ιδιότητεςεγγενές στη μέση τιμή, καθώς και στη σχέση της με την κανονική κατανομή.

Σχέση μεταξύ μέσου όρου και κανονική κατανομή

Όταν κάνουμε πολλές μετρήσεις, τα αποτελέσματα είναι, όπως λένε οι στατιστικολόγοι, «κανονικά κατανεμημένα». Αυτό σημαίνει ότι εάν αυτά τα δεδομένα αποτυπωθούν σε ένα γράφημα, τα σημεία σε αυτό θα απεικονίσουν κάτι παρόμοιο με ένα κουδούνι. Εάν τα συνδέσετε, θα έχετε μια καμπύλη σε σχήμα καμπάνας. Πολλά στατιστικά στοιχεία αντιστοιχούν σε μια κανονική κατανομή, όπως το ύψος, η ευφυΐα και η υψηλότερη ετήσια θερμοκρασία.

Όταν τα δεδομένα διανέμονται κανονικά, ο μέσος όρος θα είναι πολύ κοντά στο το ΨΗΛΟΤΕΡΟ ΣΗΜΕΙΟσε μια καμπύλη σε σχήμα καμπάνας και ένας πολύ μεγάλος αριθμός μετρήσεων θα είναι κοντά στο μέσο όρο. Υπάρχει ακόμη και ένας τύπος που προβλέπει πόσες μετρήσεις θα πέσουν σε κάποια απόσταση από τον μέσο όρο.

Έτσι, ο υπολογισμός του μέσου όρου δίνει στους ερευνητές πολλές πρόσθετες πληροφορίες.

Σχέση μεταξύ μέσου όρου και τυπική απόκλισητου δίνει μεγάλο πλεονέκτημα, γιατί η διάμεση τιμή δεν έχει τέτοια σύνδεση. Αυτή η σύνδεση είναι σημαντικό μέροςανάλυση πειραματικών δεδομένων και στατιστική επεξεργασίαπληροφορίες. Αυτός είναι ο λόγος που ο μέσος όρος έχει γίνει ο πυρήνας των στατιστικών και όλων των επιστημών που βασίζονται σε πολλαπλά δεδομένα για να βγάλουν τα συμπεράσματά τους.

Το πλεονέκτημα του μέσου όρου οφείλεται και στο ότι υπολογίζεται εύκολα από υπολογιστές. Αν και η διάμεση τιμή για μια μικρή ομάδα δεδομένων είναι αρκετά εύκολο να υπολογιστεί μόνοι σας, είναι πολύ πιο εύκολο να γραφτεί πρόγραμμα υπολογιστή, που θα έβρισκε τη μέση τιμή. Εάν χρησιμοποιείτε Microsoft Excel, τότε μάλλον γνωρίζετε ότι η διάμεση συνάρτηση δεν είναι τόσο εύκολο να υπολογιστεί όσο η μέση συνάρτηση.

Στο τέλος, ευχαριστώ πολύ επιστημονική σημασίακαι ευκολία χρήσης, η μέση τιμή έγινε η κύρια αντιπροσωπευτική τιμή. Ωστόσο, αυτή η επιλογή δεν είναι πάντα η καλύτερη.

Πλεονεκτήματα της διάμεσης τιμής

Σε πολλές περιπτώσεις, όταν θέλουμε να υπολογίσουμε την κεντρική τιμή μιας διανομής, η διάμεση τιμή είναι καλύτερο μέτρο. Αυτό συμβαίνει επειδή ο μέσος όρος καθορίζεται σε μεγάλο βαθμό από ακραία αποτελέσματαΜετρήσεις.

Πολλοί αναλυτές πιστεύουν ότι η αλόγιστη χρήση των μέσων όρων έχει αρνητικό αντίκτυπο στην κατανόηση των ποσοτικών πληροφοριών. Οι άνθρωποι κοιτάζουν τον μέσο όρο και πιστεύουν ότι είναι «ο κανόνας». Αλλά στην πραγματικότητα μπορεί να οριστεί από έναν πολύ εξέχοντα ομοιογενείς σειρέςμέλος

Φανταστείτε έναν αναλυτή να θέλει να μάθει μια αντιπροσωπευτική αξία για πέντε σπίτια. Τέσσερα σπίτια αξίζουν 100.000 δολάρια και το πέμπτο αξίζει 900.000 δολάρια. Επομένως, ο μέσος όρος θα ήταν 200.000 $ και ο διάμεσος θα ήταν 100.000 $. Σε αυτή, όπως και σε πολλές άλλες περιπτώσεις, η διάμεση τιμή δίνει καλύτερη κατανόησηαυτό που μπορεί να ονομαστεί «πρότυπο».

Συνειδητοποιώντας πόσο ακραίες τιμέςμπορεί να επηρεάσει τον μέσο όρο, η διάμεσος χρησιμοποιείται για να αντικατοπτρίζει τις αλλαγές στο εισόδημα των νοικοκυριών στις ΗΠΑ.

Οι διάμεσοι είναι επίσης λιγότερο ευαίσθητοι στα βρώμικα δεδομένα με τα οποία ασχολούνται σήμερα οι αναλυτές. Πολλοί στατιστικολόγοι και αναλυτές συλλέγουν πληροφορίες ερευνώντας ανθρώπους στο Διαδίκτυο. Εάν ο χρήστης προσθέσει κατά λάθος ένα επιπλέον μηδέν στην απάντηση, το οποίο μετατρέπει το 100 σε 1000, τότε αυτό το σφάλμα θα έχει πολύ ισχυρότερο αντίκτυπο στη μέση τιμή παρά στη διάμεσο.

Μέσος όρος ή διάμεσος;

Η επιλογή μεταξύ της διάμεσης και της μέσης τιμής έχει εκτεταμένες συνέπειες, από την κατανόησή μας για τις επιπτώσεις των ναρκωτικών στην υγεία μέχρι τη γνώση μας για το τι θα πρέπει να είναι ένας τυπικός οικιακός προϋπολογισμός.

Καθώς η συλλογή και η ανάλυση δεδομένων διαμορφώνει όλο και περισσότερο τον τρόπο με τον οποίο κατανοούμε τον κόσμο, το ίδιο ισχύει και για την αξία των ποσοτήτων που χρησιμοποιούμε. Σε έναν ιδανικό κόσμο, οι αναλυτές θα χρησιμοποιούσαν τόσο τον μέσο όρο όσο και τον διάμεσο για να εκφράσουν τα δεδομένα γραφικά.

Ζούμε όμως σε συνθήκες περιορισμένου χρόνου και προσοχής. Λόγω αυτών των περιορισμών, συχνά χρειάζεται να επιλέγουμε μόνο ένα πράγμα. Και σε πολλές περιπτώσεις, η διάμεση τιμή είναι προτιμότερη.

Ο αριθμητικός μέσος όρος (εφεξής ο μέσος όρος) είναι ίσως η πιο δημοφιλής στατιστική παράμετρος. Αυτή η έννοια χρησιμοποιείται παντού - από το ρητό "μέση θερμοκρασία σε ένα νοσοκομείο" έως σοβαρό επιστημονικές εργασίες. Ωστόσο, παραδόξως, ο μέσος όρος είναι μια δύσκολη έννοια που συχνά παραπλανά αντί να παρέχει σαφήνεια και σαφήνεια.

Αν μιλήσουμε για επιστημονική εργασία, Οτι Στατιστική ανάλυσηδεδομένα χρησιμοποιούνται σχεδόν σε όλα εφαρμοσμένες επιστήμες, ακόμη και στις ανθρωπιστικές επιστήμες (για παράδειγμα, ψυχολογία). Η μέση τιμή υπολογίζεται για χαρακτηριστικά που μετρώνται σε λεγόμενες συνεχείς κλίμακες. Τέτοια σημάδια είναι, για παράδειγμα, οι συγκεντρώσεις ουσιών στον ορό του αίματος, το ύψος, το βάρος, η ηλικία. Ο αριθμητικός μέσος όρος μπορεί εύκολα να υπολογιστεί και αυτό διδάσκεται στο Λύκειο. Ωστόσο (σύμφωνα με τις διατάξεις μαθηματικές στατιστικές) η μέση τιμή είναι ένα επαρκές μέτρο της κεντρικής τάσης στο δείγμα μόνο στην περίπτωση μιας κανονικής (Gaussian) κατανομής του χαρακτηριστικού (Εικ. 1). Ρύζι. 1. Κανονική (Gaussian) κατανομή του χαρακτηριστικού στο δείγμα. Ο μέσος όρος (M) και ο διάμεσος (Me) είναι ο ίδιος

Εάν η κατανομή αποκλίνει από τον κανονικό νόμο, δεν είναι σωστό να χρησιμοποιείται η μέση τιμή, καθώς είναι πολύ ευαίσθητη παράμετρος στα λεγόμενα "outliers" - αχαρακτηριστικά για το δείγμα που μελετάται, μια τιμή που είναι πολύ μεγάλη ή πολύ μικρή (Εικ. 2). Σε αυτή την περίπτωση, μια άλλη παράμετρος, η διάμεσος, θα πρέπει να χρησιμοποιηθεί για να χαρακτηρίσει την κεντρική τάση στο δείγμα. Διάμεσος είναι η τιμή του χαρακτηριστικού στα δεξιά και στα αριστερά του οποίου είναι ισάριθμοςπαρατηρήσεις (50% η καθεμία). Αυτή η παράμετρος (σε αντίθεση με τη μέση τιμή) είναι ανθεκτική σε ακραίες τιμές. Σημειώστε επίσης ότι η διάμεσος μπορεί επίσης να χρησιμοποιηθεί στην περίπτωση μιας κανονικής κατανομής - σε αυτήν την περίπτωση, η διάμεσος συμπίπτει με τη μέση τιμή.

Ρύζι. 2. Η κατανομή του χαρακτηριστικού στο δείγμα είναι διαφορετική από την κανονική. Ο μέσος όρος (m) και ο διάμεσος (ME) δεν είναι ο ίδιος

Για να διαπιστωθεί εάν η κατανομή ενός χαρακτηριστικού σε ένα δείγμα είναι κανονική (Gaussian) ή όχι, δηλαδή για να βρεθεί ποια παράμετρος πρέπει να χρησιμοποιηθεί (μέση ή διάμεσος), υπάρχουν ειδικές στατιστικές δοκιμές.

Ας δώσουμε ένα παράδειγμα. Ο ρυθμός καθίζησης ερυθροκυττάρων στην ομάδα ασθενών με πρόσφατη πνευμονία είναι 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Η μέση τιμή για αυτό το δείγμα είναι 17,8, η διάμεση τιμή είναι 12. Κατανομή (σύμφωνα με τη δοκιμή Shapiro-Wilk) δεν είναι φυσιολογικό (Εικ. 3), επομένως πρέπει να χρησιμοποιηθεί η διάμεσος. Ρύζι. 3. Παράδειγμα

Παραδόξως, σε ορισμένους τομείς της οικονομίας ένας εξωτερικός παρατηρητής δεν μπορεί να παρατηρήσει κανένα ίχνος της σωστής εφαρμογής των μαθηματικών στατιστικών. Έτσι, μας λένε συνεχώς για τον μέσο μισθό (για παράδειγμα, σε ερευνητικά ιδρύματα) και αυτοί οι αριθμοί συνήθως εκπλήσσουν όχι μόνο τους απλούς υπαλλήλους, αλλά και τους επικεφαλής τμημάτων (τώρα ονομάζονται «μεσαία στελέχη»). Μας εκπλήσσει που ο μέσος μισθός στη Μόσχα είναι 40 χιλιάδες ρούβλια, αλλά, φυσικά, καταλαβαίνουμε ότι έχουμε «μέσο όρο» με τους ολιγάρχες. Ακολουθεί ένα παράδειγμα από τη ζωή των επιστημόνων: μισθοί των εργαζομένων στο εργαστήριο (χιλιάδες ρούβλια) - 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Η μέση τιμή είναι 17,8, η διάμεση τιμή είναι 12. Συμφωνήστε ότι πρόκειται για διαφορετικούς αριθμούς!

Φυσικά, δεν μπορεί να αποκλειστεί ότι η σιωπή για τα ακίνητα του μέσου όρου είναι ανειλικρινής, αφού είναι πάντα πιο επικερδές για τη διοίκηση να παρουσιάζει την κατάσταση με τους μισθούς των εργαζομένων ως καλύτερη από ό,τι στην πραγματικότητα.

Δεν είναι καιρός επιστημονική κοινότητακαλούμε τους ηγέτες μας να σταματήσουν την εσφαλμένη χρήση των μαθηματικών στατιστικών;

Όλγα Ρέμπροβα,
έγγρ. μέλι. Επιστημών, Αντιπρόεδρος
MOO "Κοινωνία Ειδικών Ιατρικής Βασισμένης σε Αποδείξεις"

Μισθοί σε διάφορους τομείς της οικονομίας, επίπεδα θερμοκρασίας και βροχοπτώσεων στην ίδια περιοχή για συγκρίσιμες χρονικές περιόδους, η απόδοση των καλλιεργειών σε διαφορετικές γεωγραφικών περιοχώνκλπ. Ωστόσο, ο μέσος όρος δεν είναι σε καμία περίπτωση ο μόνος γενικευμένος δείκτης - σε ορισμένες περιπτώσεις για περισσότερους ακριβής αξιολόγησηκατάλληλη τιμή είναι η διάμεσος. Στις στατιστικές, χρησιμοποιείται ευρέως ως βοηθητικό περιγραφικό χαρακτηριστικό της κατανομής ενός χαρακτηριστικού σε έναν συγκεκριμένο πληθυσμό. Ας καταλάβουμε πώς διαφέρει από το μέσο όρο, καθώς και γιατί είναι απαραίτητο να το χρησιμοποιήσετε.

Διάμεσος στις στατιστικές: ορισμός και ιδιότητες

Φανταστείτε την εξής κατάσταση: 10 άτομα δουλεύουν σε μια εταιρεία μαζί με τον διευθυντή. Οι απλοί εργαζόμενοι λαμβάνουν 1.000 UAH και ο διευθυντής τους, ο οποίος είναι και ο ιδιοκτήτης, λαμβάνει 10.000 UAH. Αν υπολογίσουμε τον αριθμητικό μέσο όρο, προκύπτει ότι κατά μέσο όρο ο μισθός είναι αυτή η επιχείρησηίσο με 1900 UAH. Θα είναι αλήθεια αυτή η δήλωση; Ή πάρτε αυτό το παράδειγμα, στο ίδιο νοσοκομειακή πτέρυγαΥπάρχουν εννέα άτομα με θερμοκρασία 36,6 °C και ένα άτομο του οποίου η θερμοκρασία είναι 41 °C. Ο αριθμητικός μέσος όρος σε αυτή την περίπτωση είναι ίσος με: (36,6*9+41)/10 = 37,04 °C. Αυτό όμως δεν σημαίνει ότι όλοι οι παρόντες είναι άρρωστοι. Όλα αυτά υποδηλώνουν ότι ο μέσος όρος από μόνος του συχνά δεν είναι αρκετός, και γι' αυτό χρησιμοποιείται και ο διάμεσος. Στα στατιστικά, αυτός ο δείκτης ονομάζεται η επιλογή που βρίσκεται ακριβώς στη μέση της σειράς διατεταγμένων παραλλαγών. Αν το υπολογίσουμε για τα παραδείγματά μας, παίρνουμε 1000 UAH, αντίστοιχα. και 36,6 °C. Με άλλα λόγια, διάμεσος στα στατιστικά είναι μια τιμή που διαιρεί μια σειρά στο μισό με τέτοιο τρόπο ώστε και στις δύο πλευρές της (κάτω ή πάνω) να υπάρχει τον ίδιο αριθμόμονάδες ενός δεδομένου πληθυσμού. Εξαιτίας αυτής της ιδιότητας, αυτός ο δείκτης έχει πολλά άλλα ονόματα: 50ο εκατοστημόριο ή 0,5 εκατοστημόριο.

Πώς να βρείτε τη διάμεσο στα στατιστικά

Η μέθοδος για τον υπολογισμό αυτής της τιμής εξαρτάται σε μεγάλο βαθμό από το είδος της σειράς παραλλαγών που έχουμε: διακριτή ή διαλειμματική. Στην πρώτη περίπτωση, η διάμεσος βρίσκεται πολύ απλά στα στατιστικά. Το μόνο που έχετε να κάνετε είναι να βρείτε το άθροισμα των συχνοτήτων, να το διαιρέσετε με το 2 και στη συνέχεια να προσθέσετε το ½ στο αποτέλεσμα. Θα ήταν καλύτερο να εξηγήσετε την αρχή υπολογισμού χρησιμοποιώντας το ακόλουθο παράδειγμα. Ας υποθέσουμε ότι έχουμε ομαδοποιήσει δεδομένα για τη γονιμότητα και θέλουμε να μάθουμε ποια είναι η διάμεσος.

Αριθμός ομάδας οικογένειας κατά αριθμό παιδιών

Αριθμός οικογενειών

Μετά από μερικούς απλούς υπολογισμούς, διαπιστώνουμε ότι ο απαιτούμενος δείκτης είναι: 195/2 + ½ = επιλογή. Για να μάθετε τι σημαίνει αυτό, θα πρέπει να συγκεντρώνετε διαδοχικά τις συχνότητες, ξεκινώντας από τις μικρότερες επιλογές. Άρα, το άθροισμα των δύο πρώτων γραμμών μας δίνει 30. Είναι σαφές ότι δεν υπάρχουν 98 επιλογές εδώ. Αλλά αν προσθέσετε τη συχνότητα της τρίτης επιλογής (70) στο αποτέλεσμα, θα λάβετε ένα άθροισμα ίσο με 100. Περιέχει ακριβώς την 98η επιλογή, που σημαίνει ότι η διάμεσος θα είναι μια οικογένεια που έχει δύο παιδιά.

Όσον αφορά τη σειρά διαστημάτων, συνήθως χρησιμοποιείται ο ακόλουθος τύπος:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me, στην οποία:

  • X Me - η πρώτη τιμή του διάμεσου διαστήματος.
  • ∑f - αριθμός σειρών (άθροισμα των συχνοτήτων της).
  • i Ме - η τιμή της διάμεσης περιοχής.
  • f Me - συχνότητα της διάμεσης περιοχής.
  • Το S Ме-1 είναι το άθροισμα των αθροιστικών συχνοτήτων στις περιοχές που προηγούνται της διάμεσης.

Και πάλι, είναι πολύ δύσκολο να το καταλάβεις χωρίς παράδειγμα. Ας υποθέσουμε ότι υπάρχουν δεδομένα για την τιμή

Μισθός, χιλιάδες ρούβλια.

Συσσωρευμένες συχνότητες

Για να χρησιμοποιήσουμε τον παραπάνω τύπο, πρέπει πρώτα να προσδιορίσουμε το διάμεσο διάστημα. Ως τέτοιο εύρος, επιλέξτε αυτό του οποίου η συσσωρευμένη συχνότητα υπερβαίνει το ήμισυ του συνολικού αθροίσματος των συχνοτήτων ή είναι ίση με αυτό. Έτσι, διαιρώντας το 510 με 2, διαπιστώνουμε ότι αυτό το κριτήριο αντιστοιχεί στο διάστημα με μισθολογική αξία 250.000 ρούβλια. έως 300.000 τρίψιμο. Τώρα μπορείτε να αντικαταστήσετε όλα τα δεδομένα στον τύπο:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me = 250 + 50 * (510/2 - 170) / 115 = 286,96 χιλιάδες ρούβλια.

Ελπίζουμε ότι το άρθρο μας ήταν χρήσιμο και τώρα έχετε κατανοήσει ξεκάθαρα τι σημαίνει διάμεσος στα στατιστικά στοιχεία και πώς πρέπει να υπολογίζεται.

Μαζί με τις μέσες τιμές όπως στατιστικά χαρακτηριστικάσειρά διακύμανσης κατανομής, υπολογίζονται οι διαρθρωτικοί μέσοι όροι - μόδαΚαι διάμεσος.
ΜόδαΤο (Mo) αντιπροσωπεύει την τιμή του χαρακτηριστικού που μελετάται, που επαναλαμβάνεται με τη μεγαλύτερη συχνότητα, δηλ. mode – η τιμή ενός χαρακτηριστικού που εμφανίζεται πιο συχνά.
Διάμεσος(Εγώ) είναι η τιμή του χαρακτηριστικού που βρίσκεται στη μέση του ταξινομημένου (διατεταγμένου) πληθυσμού, δηλ. διάμεσος είναι η κεντρική τιμή μιας σειράς παραλλαγής.
Η κύρια ιδιότητα της διάμεσης τιμής είναι ότι το άθροισμα των απόλυτων αποκλίσεων των τιμών των χαρακτηριστικών από τη διάμεσο είναι μικρότερο από οποιαδήποτε άλλη τιμή ∑|x i - Me|=min.

Καθορισμός τρόπου λειτουργίας και μέσης τιμής από μη ομαδοποιημένα δεδομένα

Ας σκεφτούμε προσδιορισμός τρόπου λειτουργίας και διάμεσου από μη ομαδοποιημένα δεδομένα. Ας υποθέσουμε ότι μια ομάδα εργασίας που αποτελείται από 9 άτομα έχει τις ακόλουθες κατηγορίες τιμών: 4 3 4 5 3 3 6 2 6. Δεδομένου ότι αυτή η ταξιαρχία έχει τους περισσότερους εργάτες της 3ης κατηγορίας, αυτή η τιμολογιακή κατηγορία θα είναι τροπική. Mo = 3.
Για να προσδιορίσετε τη διάμεσο, είναι απαραίτητο να πραγματοποιήσετε μια κατάταξη: 2 3 3 3 4 4 5 6 6 . Ο κεντρικός εργαζόμενος σε αυτή τη σειρά είναι εργαζόμενος της 4ης κατηγορίας, επομένως, αυτή η κατηγορία θα είναι η διάμεσος. Εάν η σειρά κατάταξης περιλαμβάνει ζυγό αριθμό μονάδων, τότε η διάμεσος ορίζεται ως ο μέσος όρος των δύο κεντρικών τιμών.
Εάν η λειτουργία αντικατοπτρίζει την πιο κοινή παραλλαγή της τιμής του χαρακτηριστικού, τότε η διάμεσος πρακτικά εκτελεί τις λειτουργίες του μέσου όρου για ένα ετερογενές, μη δευτερεύον κανονικός νόμοςκατανομές πληθυσμού. Ας επεξηγήσουμε τη γνωστική του σημασία με το ακόλουθο παράδειγμα.
Ας υποθέσουμε ότι πρέπει να χαρακτηρίσουμε το μέσο εισόδημα μιας ομάδας ατόμων που αποτελείται από 100 άτομα, εκ των οποίων τα 99 έχουν εισοδήματα από 100 έως 200 δολάρια το μήνα και το μηνιαίο εισόδημα των τελευταίων είναι 50.000 δολάρια (Πίνακας 1).
Πίνακας 1 - Μηνιαίο εισόδημα της υπό μελέτη ομάδας ατόμων. Αν χρησιμοποιήσουμε τον αριθμητικό μέσο όρο, παίρνουμε ένα μέσο εισόδημα περίπου $600 - $700, το οποίο έχει λίγα κοινά με το εισόδημα του κύριου μέρους της ομάδας. Ο διάμεσος, ίσος με σε αυτήν την περίπτωσηΕμένα = 163 δολάρια θα μας επιτρέψει να δώσουμε μια αντικειμενική περιγραφή του επιπέδου εισοδήματος του 99% αυτής της ομάδας ανθρώπων.
Ας εξετάσουμε τον προσδιορισμό του τρόπου λειτουργίας και της διάμεσης τιμής χρησιμοποιώντας ομαδοποιημένα δεδομένα (σειρές διανομής).
Ας υποθέσουμε ότι η κατανομή των εργαζομένων ολόκληρης της επιχείρησης στο σύνολό της σύμφωνα με την τιμολογιακή κατηγορία έχει επόμενη προβολή(Πίνακας 2).
Πίνακας 2 - Κατανομή εργαζομένων στις επιχειρήσεις ανά κατηγορία δασμών

Υπολογισμός κατάστασης λειτουργίας και διάμεσος για μια διακριτή σειρά

Υπολογισμός κατάστασης λειτουργίας και διάμεσος για σειρές διαστήματος

Υπολογισμός του τρόπου λειτουργίας και της μέσης τιμής για μια σειρά παραλλαγής

Προσδιορισμός του τρόπου λειτουργίας από μια διακριτή σειρά παραλλαγών

Χρησιμοποιείται μια προηγουμένως κατασκευασμένη σειρά τιμών χαρακτηριστικών, ταξινομημένων κατά τιμή. Εάν το μέγεθος του δείγματος είναι περιττό, παίρνουμε την κεντρική τιμή. Εάν το μέγεθος του δείγματος είναι άρτιο, παίρνουμε τον αριθμητικό μέσο όρο των δύο κεντρικών τιμών.
Προσδιορισμός του τρόπου λειτουργίας από μια διακριτή σειρά παραλλαγών: υψηλότερη συχνότητα(60 άτομα) έχει την 5η κατηγορία τιμολόγησης, επομένως, είναι modal. Mo = 5.
Για τον προσδιορισμό της διάμεσης τιμής ενός χαρακτηριστικού, ο αριθμός της διάμεσης μονάδας της σειράς (N Me) βρίσκεται χρησιμοποιώντας τον ακόλουθο τύπο: , όπου n είναι ο όγκος του πληθυσμού.
Στην περίπτωσή μας: .
Ελήφθη κλασματική τιμή, που εμφανίζεται πάντα όταν ο αριθμός των πληθυσμιακών μονάδων είναι ζυγός, υποδηλώνει ότι το ακριβές ενδιάμεσο σημείο είναι μεταξύ 95 και 96 εργαζομένων. Είναι απαραίτητο να καθοριστεί ποια ομάδα εργαζομένων με αυτά σειριακοί αριθμοί. Αυτό μπορεί να γίνει με τον υπολογισμό των συσσωρευμένων συχνοτήτων. Δεν υπάρχουν εργαζόμενοι με αυτούς τους αριθμούς στην πρώτη ομάδα, όπου υπάρχουν μόνο 12 άτομα, και δεν υπάρχει κανένας στη δεύτερη ομάδα (12+48=60). Οι εργαζόμενοι του 95ου και του 96ου βρίσκονται στην τρίτη ομάδα (12+48+56=116), επομένως, η διάμεσος είναι η 4η κατηγορία τιμολογίων.

Υπολογισμός τρόπου λειτουργίας και διάμεσου σε σειρές διαστήματος

Σε αντίθεση με τις σειρές διακριτών παραλλαγών, ο προσδιορισμός του τρόπου λειτουργίας και της διάμεσης τιμής από σειρές διαστήματος απαιτεί ορισμένους υπολογισμούς με βάση τους ακόλουθους τύπους:
, (5.6)
Οπου x 0– το κατώτερο όριο του διαστήματος των τρόπων (το διάστημα με την υψηλότερη συχνότητα ονομάζεται τροπικό)
Εγώ– την τιμή του διαστήματος των τρόπων μεταφοράς·
f Mo– συχνότητα του διαστήματος των τρόπων μεταφοράς·
f Mo -1– συχνότητα του διαστήματος που προηγείται του τροπικού.
f Mo +1– συχνότητα του διαστήματος που ακολουθεί το τροπικό.
(5.7)
Οπου x 0– κατώτερο όριο του διάμεσου διαστήματος (διάμεσος είναι το πρώτο διάστημα του οποίου η συσσωρευμένη συχνότητα υπερβαίνει το μισό συνολικό ποσόσυχνότητες)·
Εγώ– την τιμή του διάμεσου διαστήματος·
S Me -1– συσσωρευμένο διάστημα που προηγείται της διάμεσης τιμής·
στ Εγώ– συχνότητα του μέσου διαστήματος.
Ας επεξηγήσουμε την εφαρμογή αυτών των τύπων χρησιμοποιώντας τα δεδομένα στον Πίνακα. 3.
Το διάστημα με τα όρια 60 – 80 σε αυτή την κατανομή θα είναι τροπικό, γιατί έχει την υψηλότερη συχνότητα. Χρησιμοποιώντας τον τύπο (5.6), ορίζουμε τη λειτουργία:

Για να καθοριστεί το διάμεσο διάστημα, είναι απαραίτητο να προσδιοριστεί η συσσωρευμένη συχνότητα κάθε επόμενου διαστήματος έως ότου υπερβεί το ήμισυ του αθροίσματος των συσσωρευμένων συχνοτήτων (στην περίπτωσή μας, 50%) (Πίνακας 5.11).
Διαπιστώθηκε ότι η διάμεσος είναι το διάστημα με όρια 100 - 120 χιλιάδες ρούβλια. Ας προσδιορίσουμε τώρα τη διάμεσο:

Πίνακας 3 - Κατανομή του πληθυσμού της Ρωσικής Ομοσπονδίας κατά επίπεδο μέσου κατά κεφαλήν ονομαστικού νομισματικού εισοδήματος τον Μάρτιο του 1994.
Ομάδες κατά επίπεδο μέσου κατά κεφαλήν μηνιαίου εισοδήματος, χιλιάδες ρούβλια.Μερίδιο πληθυσμού, %
Μέχρι 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Πάνω από 3007,7
Σύνολο100,0

Πίνακας 4 - Προσδιορισμός διάμεσου διαστήματος
Έτσι, ο αριθμητικός μέσος όρος, ο τρόπος λειτουργίας και ο διάμεσος μπορούν να χρησιμοποιηθούν ως γενικευμένο χαρακτηριστικό των τιμών ενός συγκεκριμένου χαρακτηριστικού για μονάδες ενός ταξινομημένου πληθυσμού.
Το κύριο χαρακτηριστικό του κέντρου διανομής είναι ο αριθμητικός μέσος όρος, ο οποίος χαρακτηρίζεται από το γεγονός ότι όλες οι αποκλίσεις από αυτό (θετικές και αρνητικές) αθροίζονται στο μηδέν. Η διάμεσος χαρακτηρίζεται από το γεγονός ότι το άθροισμα των αποκλίσεων από αυτήν στο συντελεστή είναι ελάχιστο και ο τρόπος είναι η τιμή του χαρακτηριστικού που εμφανίζεται πιο συχνά.
Ο λόγος του τρόπου λειτουργίας, του μέσου όρου και του αριθμητικού μέσου όρου υποδεικνύει τη φύση της κατανομής του χαρακτηριστικού στο σύνολο και μας επιτρέπει να εκτιμήσουμε την ασυμμετρία του. Στις συμμετρικές κατανομές συμπίπτουν και τα τρία χαρακτηριστικά. Όσο μεγαλύτερη είναι η απόκλιση μεταξύ του τρόπου λειτουργίας και του αριθμητικού μέσου όρου, τόσο πιο ασύμμετρη είναι η σειρά. Για μέτρια ασύμμετρες σειρές, η διαφορά μεταξύ του τρόπου λειτουργίας και του αριθμητικού μέσου όρου είναι περίπου τρεις φορές μεγαλύτερη από τη διαφορά μεταξύ της διάμεσης και του μέσου όρου, δηλ.:
|Mo –`x| = 3 |Εγώ –`x|.

Προσδιορισμός τρόπου λειτουργίας και διάμεσου με γραφική μέθοδο

Λειτουργία και διάμεσος in σειρές μεσοδιαστημάτωνμπορεί να προσδιοριστεί γραφικά. Ο τρόπος λειτουργίας καθορίζεται από το ιστόγραμμα κατανομής. Για να το κάνετε αυτό, επιλέξτε το ψηλότερο ορθογώνιο, το οποίο σε αυτή την περίπτωση είναι modal. Στη συνέχεια συνδέουμε τη δεξιά κορυφή του τροπικού ορθογωνίου προς τα δεξιά πάνω γωνιάτο προηγούμενο ορθογώνιο. Και η αριστερή κορυφή του τροπικού ορθογωνίου - με την επάνω αριστερή γωνία του επόμενου ορθογωνίου. Από το σημείο τομής τους χαμηλώνουμε την κάθετη προς τον άξονα της τετμημένης. Η τετμημένη του σημείου τομής αυτών των γραμμών θα είναι ο τρόπος κατανομής (Εικ. 5.3).


Ρύζι. 5.3. Γραφικός ορισμόςτρόποι λειτουργίας σύμφωνα με το ιστόγραμμα.


Ρύζι. 5.4. Γραφικός προσδιορισμός της διάμεσης τιμής με αθροιστική
Για να προσδιοριστεί η διάμεσος από ένα σημείο της κλίμακας συσσωρευμένων συχνοτήτων (συχνοτήτων) που αντιστοιχεί στο 50%, χαράσσεται μια ευθεία γραμμή παράλληλη προς τον άξονα της τετμημένης έως ότου τέμνεται με τη σώρευση. Στη συνέχεια, από το σημείο τομής, μια κάθετη χαμηλώνεται στον άξονα x. Η τετμημένη του σημείου τομής είναι η διάμεσος.

τεταρτημόρια, δεκαδικά, εκατοστημόρια

Ομοίως, με την εύρεση της διάμεσης τιμής στη σειρά παραλλαγής της διανομής, μπορείτε να βρείτε την τιμή του χαρακτηριστικού για οποιαδήποτε μονάδα της σειράς κατάταξης. Έτσι, για παράδειγμα, μπορείτε να βρείτε την τιμή του χαρακτηριστικού για μονάδες που διαιρούν μια σειρά σε τέσσερα ίσα μέρη, σε 10 ή 100 μέρη. Αυτές οι τιμές ονομάζονται «τεταρτημόρια», «δεκατιανά», «εκατοστημόρια».
Τα τεταρτημόρια αντιπροσωπεύουν την τιμή ενός χαρακτηριστικού που χωρίζει τον ταξινομημένο πληθυσμό σε 4 ίσα μέρη.
Υπάρχει ένα χαμηλότερο τεταρτημόριο (Q 1), που χωρίζει το ¼ του πληθυσμού από χαμηλότερες τιμέςχαρακτηριστικό και το ανώτερο τεταρτημόριο (Q 3), αποκόπτοντας το ¼ του τμήματος με τις υψηλότερες τιμές του χαρακτηριστικού. Αυτό σημαίνει ότι το 25% των μονάδων στον πληθυσμό θα είναι μικρότερο σε τιμή Q 1 . Το 25% των μονάδων θα περιέχεται μεταξύ Q 1 και Q 2 . Το 25% είναι μεταξύ Q 2 και Q 3 και το υπόλοιπο 25% υπερβαίνει το Q 3. Το μεσαίο τεταρτημόριο του Q2 είναι το διάμεσο.
Για τον υπολογισμό των τεταρτημορίων χρησιμοποιώντας μια σειρά μεταβολών διαστήματος, χρησιμοποιούνται οι ακόλουθοι τύποι:
, ,
Οπου x Q 1– το κατώτερο όριο του διαστήματος που περιέχει το κατώτερο τεταρτημόριο (το διάστημα καθορίζεται από τη συσσωρευμένη συχνότητα, το πρώτο που υπερβαίνει το 25%).
x Q 3– το κατώτερο όριο του διαστήματος που περιέχει το ανώτερο τεταρτημόριο (το διάστημα καθορίζεται από τη συσσωρευμένη συχνότητα, το πρώτο που υπερβαίνει το 75%).
Εγώ– μέγεθος διαστήματος
S Q 1-1– συσσωρευμένη συχνότητα του διαστήματος που προηγείται του διαστήματος που περιέχει το κατώτερο τεταρτημόριο·
S Q 3-1– συσσωρευμένη συχνότητα του διαστήματος που προηγείται του διαστήματος που περιέχει το ανώτερο τεταρτημόριο·
f Q 1– συχνότητα του διαστήματος που περιέχει το κατώτερο τεταρτημόριο·
f Q 3– συχνότητα του διαστήματος που περιέχει το ανώτερο τεταρτημόριο.
Ας εξετάσουμε τον υπολογισμό του κάτω και του άνω τεταρτημορίου σύμφωνα με τα δεδομένα του Πίνακα. 5.10. Το κατώτερο τεταρτημόριο είναι στην περιοχή 60 – 80, η αθροιστική συχνότητα του οποίου είναι 33,5%. Το ανώτερο τεταρτημόριο βρίσκεται στην περιοχή 160 – 180 με συσσωρευμένη συχνότητα 75,8%. Λαμβάνοντας αυτό υπόψη παίρνουμε:
,
.
Εκτός από τα τεταρτημόρια, μπορούν να προσδιοριστούν δεκαδικά στα εύρη διακύμανσης της κατανομής - επιλογές που χωρίζουν τις σειρές κατάταξης παραλλαγών σε δέκα ίσα μέρη. Το πρώτο δεκαδικό (d 1) διαιρεί τον πληθυσμό σε αναλογία 1/10 προς 9/10, το δεύτερο δεκαδικό (d 1) - σε αναλογία 2/10 προς 8/10, κ.λπ.
Υπολογίζονται χρησιμοποιώντας τους τύπους:
, .
Οι χαρακτηριστικές τιμές που χωρίζουν τη σειρά σε εκατό μέρη ονομάζονται εκατοστημόρια. Οι λόγοι διάμεσων, τεταρτημορίων, δεκαδικών και εκατοστημόνων παρουσιάζονται στο Σχήμα. 5.5.

Η κεντρική τάση των δεδομένων μπορεί να θεωρηθεί όχι μόνο ως τιμή με μηδενική συνολική απόκλιση (αριθμητικός μέσος όρος) ή μέγιστη συχνότητα (τρόπος λειτουργίας), αλλά και ως ορισμένο σημείο (ορισμένο επίπεδο του αναλυόμενου δείκτη), που διαιρεί τα ταξινομημένα δεδομένα ( ταξινομημένο κατά αύξουσα ή φθίνουσα σειρά) σε δύο ίσα μέρη. Δηλαδή, τα μισά από τα αρχικά δεδομένα είναι μικρότερα από αυτό το σημάδι σε αξία και τα μισά είναι περισσότερα. Αυτό είναι διάμεσος. Λειτουργία και διάμεσος - σημαντικούς δείκτες, αντικατοπτρίζουν τη δομή των δεδομένων και μερικές φορές χρησιμοποιούνται αντί για τον αριθμητικό μέσο όρο.

Άρα, η διάμεσος είναι το επίπεδο του δείκτη που χωρίζει ένα συγκεκριμένο σύνολο δεδομένων σε δύο ίσα μισά. Ως παράδειγμα επίδειξης, ας δούμε ξανά το σετ τυχαίους αριθμούς. Αυτή η διανομή στο μεγάλες ποσότητεςνοήματα στη βιβλιογραφία περιγράφεται ως καθημερινό φαινόμενο. Εδώ είναι τα δεδομένα σε μορφή εικόνας.

Προφανώς, με μια συμμετρική κατανομή, η μέση, διαιρώντας τον πληθυσμό στο μισό, θα βρίσκεται στο κέντρο - στην ίδια θέση με τον αριθμητικό μέσο όρο (και τον τρόπο λειτουργίας). Αυτή είναι, ας πούμε, μια ιδανική κατάσταση όταν ο τρόπος λειτουργίας, ο διάμεσος και ο αριθμητικός μέσος όρος συμπίπτουν και όλες οι ιδιότητές τους πέφτουν σε ένα σημείο - μέγιστη συχνότητα, μείωση κατά το ήμισυ, μηδενικό άθροισμα αποκλίσεων - όλα σε ένα σημείο. Ωστόσο, η ζωή δεν είναι τόσο συμμετρική όσο μια κανονική κατανομή. Επομένως, ας δούμε την ασύμμετρη κατανομή και τι συμβαίνει εκεί με τις κεντρικές μας τάσεις.

Ας πούμε ότι έχουμε να κάνουμε με τεχνικές μετρήσεις αποκλίσεων από την αναμενόμενη τιμή κάτι (περιεχόμενο στοιχείων, απόσταση, επίπεδο, μάζα κ.λπ., κ.λπ.). Εάν όλα είναι εντάξει, τότε οι αποκλίσεις πιθανότατα θα κατανεμηθούν σύμφωνα με έναν νόμο κοντά στο κανονικό, περίπου όπως στο παραπάνω σχήμα (η πρακτική διαψεύδει μια τέτοια υπόθεση, αλλά ωχ καλά). Αλλά εάν υπάρχει κάποιος σημαντικός και μη ελεγχόμενος παράγοντας στην αναλυόμενη διαδικασία, τότε μπορεί να εμφανιστούν ανώμαλες τιμές στις παρατηρήσεις, οι οποίες θα επηρεάσουν σημαντικά τον αριθμητικό μέσο όρο, αλλά δύσκολα θα επηρεάσουν τη διάμεσο, η οποία είναι σαφώς ορατή στο ακόλουθο ιστόγραμμα.

Η διάμεσος είναι η κύρια εναλλακτική στον αριθμητικό μέσο όρο, γιατί είναι ανθεκτικό σε μη φυσιολογικές αποκλίσεις (ακραίες τιμές). Αυτό το άρθρο μιλά για το πώς συμπεριφέρεται ο αριθμητικός μέσος όρος κάτω από ανώμαλες τιμές και πώς να τον αντιμετωπίσουμε, δηλαδή πώς να τον κάνουμε λιγότερο εξαρτημένο από ακραίες τιμές. Οι κύριες επιλογές είναι η αύξηση του αριθμού των παρατηρήσεων ή/και η εξάλειψη των ανωμαλιών από το αναλυτικό δείγμα. Έτσι, η μετάβαση από τον αριθμητικό μέσο όρο στη διάμεσο είναι ένας άλλος τρόπος για να ληφθεί μια σταθερή (στιβαρή) εκτίμηση της μαθηματικής προσδοκίας. Ένα άλλο πράγμα είναι ότι οι ιδιότητες του αριθμητικού μέσου όρου θα χαθούν για πάντα, αλλά εδώ πρέπει να δούμε τι είναι πιο σημαντικό.

Τώρα παραδείγματα πραγματικής χρήσης του μέσου όρου στις στατιστικές. Κατά την ανάλυση του μέσου μισθού για μια χώρα, μπορεί να χρησιμοποιηθεί ο διάμεσος αντί για τον αριθμητικό μέσο όρο. Στους ανθρώπους δεν αρέσει όταν ο δικός τους μισθός είναι χαμηλότερος από τον μέσο όρο (αριθμητικός) για τη χώρα. Αυτό προκαλεί θύελλα συναισθημάτων και αποκαλύψεις λανθασμένων υπολογισμών. Όπως, ο μισθός μου είναι 100 ρούβλια και ο διευθυντής είναι 1000 ρούβλια, οπότε αποδεικνύεται ότι είναι κατά μέσο όρο 550 ρούβλια. Τι είναι, οι δυσαρεστημένοι πολίτες δεν ξέρουν και δεν ενδιαφέρονται. Αλλά αν χρησιμοποιήσετε τη διάμεσο, θα είναι σαφές ότι ο μισός πληθυσμός λαμβάνει εισόδημα μικρότερο από το διάμεσο και ο μισός περισσότερο.

Ο δείκτης αυτός χρησιμοποιείται επίσης σε δημογραφικές στατιστικές, στην ανάλυση διαφόρων ποσοτικών και ποιοτικά χαρακτηριστικά(αντοχή υλικού, περιεχόμενο στοιχείου, χρόνος λειτουργίας, αριθμός αστοχιών κ.λπ.). Ακόμη και οι έμποροι συναλλάγματος χρησιμοποιούν τη διάμεση τιμή ως κάποιο είδος μυστικού σήματος για να ξεκινήσουν δράση. Αν και αυτό δεν σώζει τους περισσότερους από αυτούς.

Μαθηματικός ιδιοκτησία της διάμεσηςείναι ότι το άθροισμα των απόλυτων (modulo) αποκλίσεων από τη διάμεση τιμή δίνει την ελάχιστη δυνατή τιμή σε σύγκριση με αποκλίσεις από οποιαδήποτε άλλη τιμή. Ακόμη λιγότερο από τον αριθμητικό μέσο όρο, ω πώς! Αυτό το γεγονόςβρίσκει την εφαρμογή του, για παράδειγμα, στην επίλυση εργασίες μεταφοράς, όταν πρέπει να υπολογίσετε το εργοτάξιο ενός αντικειμένου κοντά σε έναν δρόμο με τέτοιο τρόπο ώστε η συνολική διάρκεια πτήσεων προς αυτό από διαφορετικά μέρη να είναι ελάχιστη (στάσεις, βενζινάδικα, αποθήκες κ.λπ., κ.λπ.). Σημείωση για τους επιμελητές.

(ενότητα 111)

Διάμεση φόρμουλα για διακεκριμένοςΤα δεδομένα θυμίζουν κάπως μια φόρμουλα μόδας. Δηλαδή, επειδή δεν υπάρχει τύπος ως τέτοιος. Η διάμεση τιμή επιλέγεται από τα διαθέσιμα δεδομένα και μόνο εάν αυτό δεν είναι δυνατό, γίνεται ένας απλός υπολογισμός.

Πρώτα απ 'όλα, τα δεδομένα ταξινομούνται (ταξινομημένα σε φθίνουσα σειρά). Στη συνέχεια υπάρχουν δύο επιλογές. Εάν ο αριθμός των τιμών είναι περιττός, τότε η διάμεσος θα αντιστοιχεί στην κεντρική τιμή της σειράς, ο αριθμός της οποίας μπορεί να προσδιοριστεί από τον τύπο:

Όχι. Εγώ– αριθμός της τιμής που αντιστοιχεί στη διάμεσο,

Ν– τον ​​αριθμό των τιμών στο σύνολο δεδομένων.

Τότε η διάμεσος θα συμβολίζεται ως

Αυτή είναι η πρώτη επιλογή όταν υπάρχει μία κεντρική τιμή στα δεδομένα. Η δεύτερη επιλογή εμφανίζεται όταν ο αριθμός των δεδομένων είναι ζυγός, δηλαδή αντί για ένα υπάρχουν δύο κεντρικές τιμές. Η λύση είναι απλή: πάρτε τον αριθμητικό μέσο όρο των δύο κεντρικών τιμών:

Έτσι γίνεται μια αναζήτηση ή υπολογισμός σε διακριτά δεδομένα. Ωστόσο, τα δεδομένα μπορεί επίσης να είναι διάστημα, όπου δεν είναι δυνατή η επιλογή μιας συγκεκριμένης τιμής, αφού απλά δεν υπάρχουν συγκεκριμένες τιμές. Όπως και στη μόδα, η διάμεσος σε αυτή την περίπτωση υπολογίζεται σύμφωνα με κάποιον γενικά αποδεκτό κανόνα, με βάση μια συγκεκριμένη υπόθεση, δηλαδή με το μάτι. Και μια χαρά βγαίνει, σου λέω!

Αρχικά (μετά την κατάταξη των δεδομένων), βρείτε διάμεσο διάστημα. Αυτό είναι το διάστημα από το οποίο διέρχεται η επιθυμητή διάμεση τιμή. Προσδιορίζεται χρησιμοποιώντας το συσσωρευμένο μερίδιο των ταξινομημένων διαστημάτων. Όπου το συσσωρευμένο μερίδιο ξεπέρασε πρώτα το 50% όλων των αξιών, υπάρχει ένα διάμεσο διάστημα.

Δεν ξέρω ποιος βρήκε τον διάμεσο τύπο, αλλά ξεκάθαρα οδήγησε στην υπόθεση ότι η κατανομή των δεδομένων μέσα στο διάμεσο διάστημα είναι ομοιόμορφη (δηλαδή το 30% του πλάτους του διαστήματος είναι το 30% των τιμών, το 80% του το πλάτος είναι το 80% των τιμών κ.λπ.) . Από εδώ, γνωρίζοντας τον αριθμό των τιμών από την αρχή του διαμέσου διαστήματος έως το 50% όλων των τιμών στον πληθυσμό (η διαφορά μεταξύ του μισού αριθμού όλων των τιμών και της συσσωρευμένης συχνότητας του προ-ενδιάμεσου διαστήματος ), μπορείτε να βρείτε την αναλογία που καταλαμβάνουν σε ολόκληρο το διάμεσο διάστημα. Αυτό το μερίδιο μεταφέρεται ακριβώς στο πλάτος του διαμέσου διαστήματος, υποδεικνύοντας μια συγκεκριμένη τιμή, που στη συνέχεια ονομάζεται διάμεσος.

Χωρίς περαιτέρω καθυστέρηση, είναι καλύτερο να στραφείτε σε ένα οπτικό διάγραμμα - θα είναι πιο σαφές.

Αποδείχθηκε λίγο δυσκίνητο, αλλά τώρα, ελπίζω, όλα είναι ξεκάθαρα και κατανοητά. Για να αποφύγετε να σχεδιάζετε ένα τέτοιο γράφημα κάθε φορά κατά τον υπολογισμό, μπορείτε να χρησιμοποιήσετε έναν έτοιμο τύπο. Ο διάμεσος τύπος έχει ως εξής:

Οπου xMe- κατώτερο όριο του μέσου διαστήματος.

εγώ Εγώ- πλάτος του μέσου διαστήματος.

∑f/2- ο αριθμός όλων των τιμών διαιρεμένος με 2 (δύο).

S(Me-1)- ο συνολικός αριθμός των παρατηρήσεων που συγκεντρώθηκαν πριν από την έναρξη του διάμεσου διαστήματος, δηλ. συσσωρευμένη συχνότητα του προενδιάμεσου διαστήματος.

στ Εγώ- αριθμός παρατηρήσεων στο διάμεσο διάστημα.

Όπως γίνεται εύκολα αντιληπτό, ο διάμεσος τύπος αποτελείται από δύο όρους: 1 – την τιμή της αρχής του διάμεσου διαστήματος και 2 – το ίδιο το τμήμα που είναι ανάλογο με το συσσωρευμένο μερίδιο που λείπει έως και 50%. Κατά κάποιο τρόπο μοιάζει ακόμη και με μια φόρμουλα μόδας. Η διαφορά είναι στην αναζήτηση ενός σημείου μέσα σε ένα διάστημα.

Για παράδειγμα, ας υπολογίσουμε τη διάμεσο χρησιμοποιώντας τα ακόλουθα δεδομένα.

Πρέπει να βρείτε τη διάμεση τιμή, δηλαδή την τιμή που είναι φθηνότερη και ακριβότερη από τη μισή ποσότητα των αγαθών. Αρχικά, θα κάνουμε βοηθητικούς υπολογισμούς της συσσωρευμένης συχνότητας, του συσσωρευμένου μεριδίου, συνολικός αριθμόςεμπορεύματα. Τώρα ας δούμε ξανά τι έχουμε.

Χρησιμοποιώντας την τελευταία στήλη "Συσσωρευμένο μερίδιο" προσδιορίζουμε το διάμεσο διάστημα - 300-400 ρούβλια (το συσσωρευμένο μερίδιο είναι περισσότερο από 50% για πρώτη φορά). Πλάτος διαστήματος - 100 τρίψιμο. Τώρα το μόνο που μένει είναι να αντικαταστήσουμε τα δεδομένα στον παραπάνω τύπο και να υπολογίσουμε τη διάμεσο.

Δηλαδή, το ένα μισό των αγαθών έχει τιμή χαμηλότερη από 350 ρούβλια και το άλλο μισό έχει υψηλότερη τιμή. Είναι απλό. Ο αριθμητικός μέσος όρος, που υπολογίζεται με τα ίδια δεδομένα, είναι ίσος με 355 ρούβλια. Η διαφορά δεν είναι σημαντική, αλλά υπάρχει.

Υπολογίστε τη διάμεσο στο Excel

Στατιστικά στοιχεία χωρίς αυτόματους υπολογισμούς – προηγούμενος αιώνας. Η διάμεσος των αριθμών μπορεί να βρεθεί εύκολα χρησιμοποιώντας Λειτουργία Excel, που λέγεται MEDIAN. Είναι εξαιρετικά εύκολο στη χρήση. Το κελί για τον υπολογισμό ενεργοποιείται, καλείται η συνάρτηση, επιλέγεται το εύρος δεδομένων και «ΟΚ». Δεν υπάρχει τίποτα άλλο να συζητήσουμε. Κατάλληλο για ζυγό και μονό όγκο δεδομένων.

Τα δεδομένα διαστήματος είναι άλλο θέμα. Δεν υπάρχει αντίστοιχη λειτουργία στο Excel. Επομένως, πρέπει να χρησιμοποιήσετε τον παραπάνω τύπο. Τι μπορείς να κάνεις? Αλλά αυτό δεν είναι πολύ τραγικό, καθώς ο υπολογισμός της διάμεσης τιμής από δεδομένα διαστήματος είναι μια σπάνια περίπτωση. Μπορείτε να κάνετε τα μαθηματικά μία φορά σε μια αριθμομηχανή.

Παρεμπιπτόντως, το γεγονός ότι η διάμεσος χωρίζει τα δεδομένα σε δύο ίσα μέρη θυμίζει κάποιες μεθόδους ομαδοποίησης. Πράγματι, αφού βρούμε τη διάμεσο, παίρνουμε επίσης δύο ομάδες με ίσο αριθμό τιμών. Αναπτύσσοντας αυτή την ιδέα, η διαίρεση σε ομάδες μπορεί να γίνει όχι μόνο σύμφωνα με την αρχή 50/50, αλλά και σύμφωνα με άλλα μερίδια. Για παράδειγμα, 20% υψηλότερες αξίεςδεν είναι τίποτα άλλο από την ομάδα Α στην ανάλυση ABC. Σχετικά με άλλες κοινοποιήσεις κάποια στιγμή σε άλλο άρθρο. Βλέπετε πώς αλληλοεπικαλύπτονται οι φαινομενικά άσχετες μέθοδοι;

Η ιστορία μου φτάνει στο τέλος της στατιστικός δείκτηςδιάμεσος. Ελπίζω να μην ήταν κουραστικό. Τέλος, προτείνω ένα πρόβλημα στο στυλ της τηλεοπτικής εκπομπής κουίζ "Ποιος θέλει να γίνει εκατομμυριούχος;" Υπάρχει ένα σύνολο δεδομένων. 15, 5, 20, 5, 10. Ποιος είναι ο μέσος όρος; Τέσσερις επιλογές:

Προτείνω επίσης να παρακολουθήσετε ένα βίντεο με θέμα τον υπολογισμό της διάμεσης τιμής στο Excel.