Βιογραφίες Χαρακτηριστικά Ανάλυση

Βασικές στατιστικές κατηγορίες. Συντελεστές συσχέτισης ποιοτικών χαρακτηριστικών

Η μέθοδος ομαδοποίησης σας επιτρέπει να μελετήσετε την κατάσταση και τις σχέσεις οικονομικά φαινόμενα, εάν οι ομάδες χαρακτηρίζονται από δείκτες που αποκαλύπτουν τις πιο σημαντικές πτυχές του φαινομένου που μελετάται.

Κατά την ανάλυση και τον προγραμματισμό, είναι απαραίτητο να μην βασίζεστε σε τυχαία γεγονότα, αλλά σε δείκτες που εκφράζουν το βασικό, τυπικό, ριζοσπαστικό. Αυτό το χαρακτηριστικό είναι δεδομένο διαφορετικά είδημέσες τιμές, καθώς και τρόπο και διάμεσο.

Το ζήτημα της ομοιογένειας ενός πληθυσμού δεν πρέπει να αποφασίζεται επίσημα από τη μορφή κατανομής του. Αυτό, όπως και το ζήτημα του τυπικού μέσου όρου, πρέπει να αποφασιστεί με βάση τις αιτίες και τις συνθήκες που σχηματίζουν το άθροισμα. Ομογενές είναι ένα τέτοιο σύνολο, οι μονάδες του οποίου σχηματίζονται υπό την επίδραση κοινών κύριων αιτιών και συνθηκών που καθορίζουν γενικού επιπέδουενός δεδομένου χαρακτηριστικού που είναι χαρακτηριστικό ολόκληρου του πληθυσμού.

Σύμφωνα με τη θεωρία των τυπολογικών ομαδοποιήσεων, κρίσιμοςστην εκτίμηση της ομοιογένειας ενός πληθυσμού δεν ανήκει στο σχήμα της κατανομής, αλλά στο μέγεθος της παραλλαγής και στις συνθήκες σχηματισμού του. Ένας ποιοτικά ομοιογενής πληθυσμός χαρακτηρίζεται από διακύμανση εντός ορισμένων ορίων, μετά τα οποία αρχίζει μια νέα ποιότητα. Ταυτόχρονα, αυτά τα όρια για την αξιολόγηση της ποιοτικής ομοιογένειας ενός πληθυσμού πρέπει να προσεγγιστούν από τη σκοπιά της ουσίας του θέματος και όχι τυπικά, αφού η ίδια ποσότητα υπό διαφορετικές συνθήκες εκφράζει μια νέα ποιότητα. Για παράδειγμα, με τον ίδιο αριθμό εργαζομένων, οι επιχειρήσεις σε ορισμένους κλάδους είναι μεγάλες, ενώ άλλες μικρές.

Για μια ολοκληρωμένη και σε βάθος μελέτηφαινόμενα, για να χαρακτηριστούν αντικειμενικά τα είδη των φαινομένων, οι σχέσεις και οι διαδικασίες τους που καθορίζονται από την ανάπτυξη του συστήματος στο σύνολό του, είναι απαραίτητο να συνδυαστούν οι μέσοι όροι της ομάδας με τους γενικούς μέσους όρους. Ο συνδυασμός τέτοιων μέσων όρων είναι ένα από τα κύρια στοιχεία της ανάλυσης πολύπλοκων συστημάτων. Αυτός ο συνδυασμός ενώνει σε ένα ολόκληρο δύο οργανικά συμπληρωματικά στατιστική μέθοδος: μέθοδος μέσων όρων και μέθοδος ομαδοποίησης. Κατά τον υπολογισμό του μέσου όρου, οι μεμονωμένες τιμές που ποικίλλουν στην ομάδα αντικαθίστανται από μία μέση τιμή. Εν τυχαίες αποκλίσειςοι τιμές του χαρακτηριστικού για μεμονωμένες μονάδες, προς την κατεύθυνση της αύξησης ή της μείωσης, εξισορροπούνται αμοιβαία και αλληλοεξουδετερώνονται και η μέση τιμή αποκαλύπτει το τυπικό μέγεθος του χαρακτηριστικού μιας δεδομένης ομάδας. Η μέση τιμή χρησιμεύει ως χαρακτηριστικό της ολότητας και ταυτόχρονα αναφέρεται στο επιμέρους στοιχείο της - τον φορέα των ποιοτικών χαρακτηριστικών του φαινομένου. Η έννοια του μέσου όρου είναι αρκετά συγκεκριμένη, αλλά ταυτόχρονα αφηρημένη. λαμβάνεται με αφαίρεση από το τυχαίο άτομο για κάθε μονάδα προκειμένου να προσδιοριστεί το κοινό, τυπικό που είναι χαρακτηριστικό όλων των μονάδων και που σχηματίζει αυτό το σετ. Κατά τον υπολογισμό της μέσης τιμής, ο αριθμός των μονάδων στον πληθυσμό πρέπει να είναι αρκετά μεγάλος. Η μέση τιμή ορίζεται ως η αναλογία του συνολικού όγκου των φαινομένων προς τον αριθμό των πληθυσμιακών μονάδων στην ομάδα. Για μη ομαδοποιημένα δεδομένα, αυτός θα είναι ο απλός αριθμητικός μέσος όρος:

και για ομαδοποιημένα δεδομένα, όπου κάθε χαρακτηριστική τιμή έχει τη δική της συχνότητα, ο σταθμισμένος αριθμητικός μέσος όρος:

Οπου X i– τιμή του χαρακτηριστικού· φά Εγώ– συχνότητα αυτών των χαρακτηριστικών τιμών.

Δεδομένου ότι ο αριθμητικός μέσος όρος υπολογίζεται ως ο λόγος του αθροίσματος των χαρακτηριστικών τιμών προς συνολικός αριθμός, ποτέ δεν υπερβαίνει αυτές τις αξίες. Ο αριθμητικός μέσος όρος έχει μια σειρά από ιδιότητες που χρησιμοποιούνται ευρέως για τον εξορθολογισμό των υπολογισμών.

1. Άθροισμα αποκλίσεων ατομικές αξίεςχαρακτηριστικό της μέσης τιμής είναι πάντα μηδέν:

Απόδειξη. n

Διαιρώντας το αριστερό και σωστη πλευραεπί

2. Εάν αλλάξουν οι τιμές του χαρακτηριστικού (X i). κφορές, τότε ο αριθμητικός μέσος όρος θα αλλάξει επίσης κατά Χμια φορά.

Απόδειξη.

Δηλώνουμε τον αριθμητικό μέσο όρο των νέων τιμών του χαρακτηριστικού με Χ, τότε:

Σταθερή αξία 1/κμπορεί να αφαιρεθεί πέρα ​​από το σύμβολο του αθροίσματος, και τότε παίρνουμε:

3. Εάν από όλες τις τιμές του χαρακτηριστικού Χ Εγώαφαιρέστε ή προσθέστε τον ίδιο σταθερό αριθμό, τότε ο αριθμητικός μέσος όρος θα μειωθεί ή θα αυξηθεί κατά αυτό το ποσό.

Απόδειξη.

Ο μέσος όρος των αποκλίσεων των χαρακτηριστικών τιμών από σταθερός αριθμόςθα ισούται με:

Αυτό μπορεί να αποδειχθεί με τον ίδιο ακριβώς τρόπο στην περίπτωση προσθήκης ενός σταθερού αριθμού.

4. Εάν οι συχνότητες όλων των χαρακτηριστικών τιμών μειωθούν ή αυξηθούν κατά nφορές, τότε ο μέσος όρος δεν θα αλλάξει:

Εάν υπάρχουν δεδομένα για τον συνολικό όγκο και τις γνωστές τιμές του χαρακτηριστικού, αλλά άγνωστες συχνότητες, χρησιμοποιείται ο σταθμισμένος αριθμητικός μέσος τύπος για τον προσδιορισμό του μέσου όρου.

Για παράδειγμα, υπάρχουν στοιχεία για τις τιμές πώλησης του λάχανου και τα συνολικά έσοδα για διάφορες περιόδους πωλήσεων (Πίνακας 1).

Τραπέζι 1.

Τιμή πώλησης λάχανου και συνολικά έσοδα για διάφορες περιόδους πώλησης


Δεδομένου ότι η μέση τιμή αντιπροσωπεύει την αναλογία των συνολικών εσόδων προς τον συνολικό όγκο του λάχανου που πωλήθηκε, θα πρέπει πρώτα να καθορίσετε την ποσότητα του λάχανου που πωλήθηκε για διαφορετικές περιόδους πώλησης ως την αναλογία εσόδων προς τιμή και στη συνέχεια να καθορίσετε μέση τιμήπούλησε λάχανο.

Στο παράδειγμά μας, η μέση τιμή θα είναι:

Αν υπολογιστεί σε σε αυτήν την περίπτωσημέση τιμή πώλησης με βάση τον αριθμητικό απλό μέσο όρο, τότε θα έχουμε ένα διαφορετικό αποτέλεσμα, το οποίο θα διαστρεβλώσει την πραγματική κατάσταση και θα υπερεκτιμήσει τη μέση τιμή πώλησης, καθώς το γεγονός ότι μεγάλο μερίδιο των πωλήσεων πέφτει σε αργό λάχανο με χαμηλότερη τιμή δεν θα να ληφθούν υπόψη.

Μερικές φορές είναι απαραίτητο να προσδιοριστεί η μέση τιμή όταν οι χαρακτηριστικές τιμές δίνονται στη φόρμα κλασματικοί αριθμοί, δηλαδή αντίστροφα σε ακέραιους αριθμούς (για παράδειγμα, κατά τη μελέτη της παραγωγικότητας της εργασίας μέσω του αντίστροφου δείκτη της, της έντασης εργασίας). Σε τέτοιες περιπτώσεις, συνιστάται η χρήση του αρμονικού μέσου τύπου:

Έτσι, ο μέσος χρόνος που απαιτείται για την παραγωγή μιας μονάδας εξόδου είναι ο αρμονικός μέσος όρος. Αν Χ 1 = 1/4 ώρα, Χ 2 = 1/2 ώρα, Χ 3 = 1/3 ώρα, τότε ο αρμονικός μέσος όρος αυτών των αριθμών είναι:

Για τον υπολογισμό της μέσης τιμής από την αναλογία δύο δεικτών με το ίδιο όνομα, για παράδειγμα, ρυθμούς ανάπτυξης, χρησιμοποιείται ο γεωμετρικός μέσος όρος, ο οποίος υπολογίζεται σύμφωνα με τον τύπο:

όπου X 1 x X 2 ... x ... X 4 είναι η αναλογία δύο ποσοτήτων με το ίδιο όνομα, για παράδειγμα, ρυθμοί ανάπτυξης αλυσίδας. n– ο αριθμός του συνόλου των σχέσεων ρυθμού ανάπτυξης.

Οι θεωρούμενες μέσες τιμές έχουν την ιδιότητα του maorancy:

Ας έχουμε, για παράδειγμα, παρακάτω τιμές Χ(20; 40), τότε οι τύποι των μέσων τιμών που εξετάστηκαν προηγουμένως θα είναι ίσοι με:

Κατά τη μελέτη της σύνθεσης ενός πληθυσμού, το τυπικό μέγεθος ενός χαρακτηριστικού μπορεί να κριθεί από τα λεγόμενα δομικά μέσα - τρόπος και διάμεσος.

ΜόδαΗ πιο συχνά εμφανιζόμενη τιμή ενός χαρακτηριστικού στο σύνολο ονομάζεται.Στις σειρές παραλλαγής διαστήματος, εντοπίζεται πρώτα το τροπικό διάστημα. Στο ευρεθέν τροπικό διάστημα, η λειτουργία υπολογίζεται χρησιμοποιώντας τον τύπο:

όπου X 0 είναι το κατώτερο όριο του διαστήματος των τρόπων μεταφοράς. δ –μέγεθος διαστήματος? f 1, f 2, φά 3 – συχνότητες προτροπικών, τροπικών και μετατροπικών διαστημάτων.

Η έννοια της μόδας σε σειρές μεσοδιαστημάτωνμπορεί να βρεθεί αρκετά εύκολα με βάση το γράφημα. Για να το κάνετε αυτό, σχεδιάστε δύο γραμμές στην υψηλότερη στήλη του ιστογράμματος από τα όρια δύο γειτονικών στηλών. Από το σημείο τομής αυτών των γραμμών, μια κάθετη κατεβαίνει στον άξονα της τετμημένης. Η τιμή του χαρακτηριστικού στον άξονα x θα είναι η λειτουργία (Εικ. 2).


Ρύζι. 2

Για την επίλυση πρακτικών προβλημάτων μεγαλύτερο ενδιαφέρονσυνήθως αντιπροσωπεύει έναν τρόπο που εκφράζεται ως διάστημα και όχι ως διακριτός αριθμός. Αυτό εξηγείται από τον σκοπό του τρόπου λειτουργίας, ο οποίος θα πρέπει να αποκαλύψει τις πιο κοινές διαστάσεις του φαινομένου.

Ο μέσος όρος είναι μια τυπική τιμή για όλες τις μονάδες ενός ομοιογενούς πληθυσμού. Η λειτουργία είναι επίσης μια τυπική ποσότητα, αλλά καθορίζει άμεσα το μέγεθος του χαρακτηριστικού, το οποίο είναι χαρακτηριστικό, αν και σημαντικό μέρος, αλλά και πάλι όχι ολόκληρου του πληθυσμού. Αυτή έχει μεγάλης σημασίαςνα λύσει κάποια προβλήματα, για παράδειγμα, να προβλέψει ποια μεγέθη παπουτσιών, ρούχων θα πρέπει να σχεδιάζονται για μαζική παραγωγή κ.λπ.

Διάμεσος– την τιμή του χαρακτηριστικού που βρίσκεται στο μέσο της σειράς κατάταξης. Δείχνει το κέντρο της κατανομής των μονάδων στον πληθυσμό και το χωρίζει σε δύο ίσα μέρη.

Η διάμεσος είναι καλύτερο χαρακτηριστικόκεντρική τάση, όταν τα όρια των ακραίων διαστημάτων είναι ανοιχτά. Η διάμεσος είναι ένα πιο αποδεκτό χαρακτηριστικό του επιπέδου διανομής, ακόμη και αν υπάρχουν υπερβολικά μεγάλες ή υπερβολικά μικρές τιμές στη σειρά διανομής που έχουν αντίκτυπο στην ισχυρή επιρροήστη μέση τιμή, αλλά όχι στη διάμεση τιμή. Η διάμεσος, επιπλέον, έχει την ιδιότητα ενός γραμμικού ελάχιστου: το άθροισμα απόλυτες τιμέςοι αποκλίσεις της τιμής του χαρακτηριστικού για όλες τις μονάδες του πληθυσμού από τη διάμεσο είναι ελάχιστες, δηλ.

Αυτή η ιδιότητα έχει μεγάλη σημασία για την επίλυση ορισμένων πρακτικών προβλημάτων - για παράδειγμα, για τον υπολογισμό της μικρότερης δυνατής απόστασης για ΔΙΑΦΟΡΕΤΙΚΟΙ ΤΥΠΟΙμεταφοράς, για τον εντοπισμό πρατηρίων καυσίμων με τέτοιο τρόπο ώστε η απόσταση από όλα τα αυτοκίνητα που εξυπηρετούνται από ένα συγκεκριμένο πρατήριο να είναι ελάχιστη, κ.λπ.

Όταν βρίσκετε τη διάμεσο, προσδιορίστε πρώτα την σειριακός αριθμόςστη σειρά διανομής:

Στη συνέχεια, σύμφωνα με τον αύξοντα αριθμό, η ίδια η διάμεσος βρίσκεται από τις συσσωρευμένες συχνότητες της σειράς. ΣΕ διακριτές σειρές- χωρίς κανέναν υπολογισμό, αλλά στη σειρά διαστήματος, γνωρίζοντας τον αύξοντα αριθμό της διάμεσης, το διάμεσο διάστημα βρίσκεται χρησιμοποιώντας τις συσσωρευμένες συχνότητες, στις οποίες η τιμή της διάμεσης τιμής προσδιορίζεται με την απλούστερη μέθοδο παρεμβολής. Η διάμεσος υπολογίζεται με τον τύπο:

Οπου Χ 0 – κατώτερο όριο του μέσου διαστήματος. ρε– μέγεθος διαστήματος φά _ 1 – Συσσωρευμένη συχνότητα μέχρι το διάμεσο διάστημα. φά– συχνότητα του μέσου διαστήματος.

Ας υπολογίσουμε τη μέση τιμή, τρόπο λειτουργίας και διάμεσο χρησιμοποιώντας το παράδειγμα μιας κατανομής διαστήματος. Τα στοιχεία δίνονται στον πίνακα. 2.


Έτσι, διάφοροι δείκτες μπορούν να χρησιμοποιηθούν ως κέντρο διανομής: μέση τιμή, τρόπος λειτουργίας και διάμεσος,


και καθένα από αυτά τα χαρακτηριστικά έχει τα δικά του χαρακτηριστικά. Έτσι, είναι χαρακτηριστικό της μέσης τιμής ότι όλες οι αποκλίσεις από αυτήν ατομικές αξίεςχαρακτηριστικά αλληλοεξουδετερώνονται, δηλ.

Η διάμεσος χαρακτηρίζεται από το γεγονός ότι το άθροισμα των αποκλίσεων των μεμονωμένων τιμών ενός χαρακτηριστικού από αυτό (χωρίς να λαμβάνονται υπόψη τα σημάδια) είναι ελάχιστο. Η μόδα χαρακτηρίζει την πιο συχνά εμφανιζόμενη τιμή του χαρακτηριστικού. Επομένως, ανάλογα με το χαρακτηριστικό που ενδιαφέρει τον ερευνητή, θα πρέπει να επιλεγεί ένα από τα εξεταζόμενα χαρακτηριστικά. ΣΕ σε ορισμένες περιπτώσειςυπολογίζονται όλα τα χαρακτηριστικά.

Η σύγκρισή τους και ο εντοπισμός των σχέσεων μεταξύ τους βοηθά στην αποσαφήνιση των χαρακτηριστικών της κατανομής μιας συγκεκριμένης σειράς παραλλαγών. Έτσι, στις συμμετρικές σειρές, όπως και στην περίπτωσή μας, και τα τρία χαρακτηριστικά (μέσος όρος, τρόπος και διάμεσος) συμπίπτουν περίπου. Όσο μεγαλύτερη είναι η απόκλιση μεταξύ μόδας και μέσο μέγεθος, τόσο πιο ασύμμετρη είναι η σειρά. Έχει διαπιστωθεί ότι για μέτρια ασύμμετρες σειρές η διαφορά μεταξύ του τρόπου λειτουργίας και του αριθμητικού μέσου όρου είναι περίπου τρεις φορές μεγαλύτερη από τη διαφορά μεταξύ του μέσου και του αριθμητικού μέσου όρου:

Αυτή η αναλογία μπορεί να χρησιμοποιηθεί για τον προσδιορισμό ενός δείκτη από δύο γνωστούς. Από αυτό προκύπτει ότι ο συνδυασμός τρόπου λειτουργίας, διάμεσου και μέσου όρου είναι επίσης σημαντικός για τον χαρακτηρισμό του τύπου κατανομής.

Επιστήμη Υπολογιστών και Μαθηματικά - Θεωρητικά υλικάγια την πρώτη συνδιάσκεψη

1. Είδος μαθηματικές στατιστικές, τα κύρια τμήματα του. Εννοια του στατιστική κατανομή. Κανονική κατανομή. Κάτω από ποιες συνθήκες κατανέμεται κανονικά μια τυχαία μεταβλητή;

Η στατιστική είναι μια επιστήμη που μελετά το σύνολο. wt. φαινόμενα για τον εντοπισμό προτύπων. και να τα μελετήσουν χρησιμοποιώντας γενικευμένους δείκτες.

Όλες οι μέθοδοι μαθηματικής στατιστικής μπορούν να ταξινομηθούν σε δύο κύριες ενότητες: θεωρία εκτίμησης στατιστικών παραμέτρωνΚαι θεωρίες ελέγχου στατιστικών υποθέσεων.

Ενότητες:

1. περιγραφική στατιστική

2. μέθοδος δειγματοληψίας, διαστήματα εμπιστοσύνης

3. ανάλυση συσχέτισης

4. ανάλυση παλινδρόμησης

5. ανάλυση ποιοτικών χαρακτηριστικών

6. Πολυμεταβλητή στατιστική ανάλυση:

α) συστάδα

β) παραγοντική

7. ανάλυση χρονοσειρών

8. διαφορικές εξισώσεις

9. μαθηματική μοντελοποίηση ιστορικές διαδικασίες

Διανομή:

Θεωρητικά (υπάρχουν άπειρα αντικείμενα και συμπεριφέρονται ιδανικά)

Εμπειρικά (πραγματικά δεδομένα που μπορούν να απεικονιστούν σε ιστόγραμμα)

Κανονική κατανομή – όταν η φύση της κατανομής επηρεάζεται από πολλούς παράγοντες και κανένας από αυτούς δεν είναι καθοριστικός. Χρησιμοποιείται ιδιαίτερα συχνά στην πράξη.


2. Η κανονική κατανομή μπορεί να απεικονιστεί γραφικά ως μια συμμετρική καμπύλη μονής κορυφής, που μοιάζει με κουδούνι σε σχήμα. Το ύψος (τεταγμένη) κάθε σημείου αυτής της καμπύλης δείχνει πόσο συχνά εμφανίζεται η αντίστοιχη τιμή. Περιγραφικά στατιστικά. Μέσες τιμές - αριθμητικός μέσος όρος, διάμεσος, τρόπος λειτουργίας. Σε ποιες περιπτώσεις αυτά τα τρία μέτρα δίνουν παρόμοιες τιμές και σε ποιες περιπτώσεις διαφέρουν πολύ;

Περιγραφικά στατιστικά - Αυτά είναι περιγραφικά στατιστικά στοιχεία.

αριθμητικός μέσος όρος, διάμεσος, τρόπος - μέτρα μέσου όρου - συντελεστές που μπορούν να χαρακτηρίσουν ένα σύνολο αντικειμένων

· μέση (αριθμητική) τιμή - το άθροισμα όλων των τιμών που σχετίζονται με συνολικός αριθμόςπαρατηρήσεις ( αποδεκτές σημειώσεις: Σημαίνω ή ), δηλ. μέση τιμή αριθμητική τιμή ένα χαρακτηριστικό ονομάζεται ποσότητα

πού είναι η τιμή του χαρακτηριστικού Εγώ-ο αντικείμενο n- τον αριθμό των αντικειμένων στο σύνολο.

· mode – η πιο συχνά εμφανιζόμενη τιμή μιας μεταβλητής (M)

· διάμεσος – μέση τιμή κατά σειρά (αποδεκτός συμβολισμός: Διάμεσος, m). Η διάμεσος είναι η «μεσαία» τιμή του χαρακτηριστικού με την έννοια ότι τα μισά από τα αντικείμενα στον πληθυσμό έχουν τιμές αυτού του χαρακτηριστικού λιγότερες και τα άλλα μισά έχουν περισσότερες από τη διάμεσο. Μπορείτε να υπολογίσετε περίπου τη διάμεσο ταξινομώντας όλες τις τιμές του χαρακτηριστικού σε αύξουσα (φθίνουσα) σειρά και βρίσκοντας έναν αριθμό σε αυτήν τη σειρά παραλλαγής που είτε έχει τον αριθμό ( n+1)/2 - σε περίπτωση περιττών n, ή βρίσκεται στη μέση μεταξύ αριθμών με αριθμούς n/2 και ( n+1)/2 - σε περίπτωση ζυγού n.

Δεν μπορούν να υπολογιστούν όλα τα αναφερόμενα χαρακτηριστικά για ποιοτικά χαρακτηριστικά. Εάν το χαρακτηριστικό είναι ποιοτικό και ονομαστικό, τότε μόνο η λειτουργία μπορεί να βρεθεί για αυτό (η τιμή του θα είναι το όνομα της πιο συχνά εμφανιζόμενης κατηγορίας του ονομαστικού χαρακτηριστικού). Εάν το χαρακτηριστικό είναι κατάταξη, τότε εκτός από τη λειτουργία, μπορείτε επίσης να βρείτε τη διάμεσο για αυτό. Ο αριθμητικός μέσος όρος μπορεί να υπολογιστεί μόνο για ποσοτικά χαρακτηριστικά.

Στην περίπτωση ποσοτικών δεδομένων, όλα τα χαρακτηριστικά του μέσου επιπέδου μετρώνται στις ίδιες μονάδες με το ίδιο το αρχικό χαρακτηριστικό.

Οι τιμές των συντελεστών συμπίπτουν εάν το γράφημα κατανομής είναι συμμετρικό.


3. Δείκτες ετερογένειας - διασπορά, μέση τετραγωνική (τυπική) απόκλιση, συντελεστής διακύμανσης. ΣΕ Σε ποιες μονάδες μετρώνται; Γιατί εισάγεται η έννοια του συντελεστή διακύμανσης;

· μέσο τετράγωνο ή τυπική απόκλιση- ένα μέτρο της εξάπλωσης των χαρακτηριστικών τιμών γύρω από την αριθμητική μέση τιμή (αποδεκτή σημείωση: Std.Dev. ( τυπική απόκλιση), μικρό ή s). Το μέγεθος αυτής της απόκλισης υπολογίζεται από τον τύπο

.

· διακύμανση χαρακτηριστικών ( s 2 ή s 2 )

· συντελεστής διακύμανσης - ο λόγος της τυπικής απόκλισης προς τον αριθμητικό μέσο όρο, εκφρασμένος ως ποσοστό (που σημειώνεται στα στατιστικά με το γράμμα V). Ο συντελεστής υπολογίζεται με τον τύπο: .

ΟλαΑυτά τα μέτρα μπορούν να υπολογιστούν μόνο για ποσοτικά χαρακτηριστικά. Όλα δείχνουν πόσο ποικίλλουν οι τιμές ενός χαρακτηριστικού (ή μάλλον, οι αποκλίσεις τους από τον μέσο όρο) σε έναν δεδομένο πληθυσμό. Πως μικρότερη αξίαμέτρα διασποράς, τόσο πιο κοντά είναι οι τιμές των χαρακτηριστικών όλων των αντικειμένων στη μέση τιμή τους και επομένως μεταξύ τους. Εάν η τιμή του μέτρου διασποράς είναι μηδέν, οι τιμές των χαρακτηριστικών είναι ίδιες για όλα τα αντικείμενα.

Η πιο συχνά χρησιμοποιούμενη είναι η μέση τετραγωνική (ή τυπική) απόκλιση s. Μετριέται, όπως και ο αριθμητικός μέσος όρος, στις ίδιες μονάδες με το ίδιο το αρχικό χαρακτηριστικό. Εάν όλες οι τιμές ενός χαρακτηριστικού αλλάξουν πολλές φορές, η τυπική απόκλιση θα αλλάξει με τον ίδιο τρόπο, αλλά εάν όλες οι τιμές του χαρακτηριστικού αυξηθούν (μειωθούν) κατά ένα ορισμένο ποσό, η τυπική του απόκλιση Δεν θα αλλάξει. Μαζί με την τυπική απόκλιση χρησιμοποιείται συχνά η διασπορά (= το τετράγωνό της), αλλά στην πράξη είναι λιγότερο βολικό μέτρο, γιατί Οι μονάδες διακύμανσης δεν ταιριάζουν με τις μονάδες.

Η έννοια του συντελεστή διακύμανσης είναι ότι, σε αντίθεση με το s, μετρά όχι ένα απόλυτο, αλλά ένα σχετικό μέτρο της εξάπλωσης των τιμών των χαρακτηριστικών σε έναν στατιστικό πληθυσμό.

Το μεγαλύτερο V , τόσο λιγότερο ομοιογενής είναι ο πληθυσμός.

Ομογενής Μεταβατική Ανομοιογενής

V =0 – 30% V =30 – 50% V =50 – 100%

Ίσως »100% (υπερβολικά ετερογενής πληθυσμός).


4. Εννοια τουεπιλεκτική μέθοδος. Αντιπροσωπευτικό δείγμα, τις μεθόδους του σχηματισμός Δύο είδη δειγματοληπτικών σφαλμάτων. Πιθανότητα εμπιστοσύνης.

Δείγμα:

Εκπρόσωπος

Τυχαίος

Μηχανική δειγματοληψία – παρόμοια με τυχαίο δείγμα(κάθε 10η, 20η κ.λπ.).

Φυσική (τι απομένει από το HS με την πάροδο του χρόνου) δειγματοληψία.

Αντιπροσωπευτικό δείγμα - αντικατοπτρίζει με ακρίβεια τις ιδιότητες πληθυσμός.

Για να διασφαλιστεί ότι το δείγμα αντικατοπτρίζεται σωστά βασικές ιδιότητεςεγγενής στον γενικό πληθυσμό, αυτό πρέπει να είναι τυχαία, δηλ. όλα τα αντικείμενα του πληθυσμού πρέπει να έχουν ίσες πιθανότητες να συμπεριληφθούν στο δείγμα

Τα δείγματα σχηματίζονται με χρήση ειδικών τεχνικές. Η απλούστερη είναι η τυχαία επιλογή, για παράδειγμα, χρησιμοποιώντας τακτική κλήρωση (για μικρούς πληθυσμούς) ή τη χρήση πινάκων τυχαίους αριθμούς. Για πιο εκτεταμένους, αλλά αρκετά ομοιογενείς πληθυσμούς, χρησιμοποιείται μηχανική επιλογή (χρησιμοποιείται στις στατιστικές zemstvo). Για ετερογενείς πληθυσμούς με συγκεκριμένη δομή, η τυπική επιλογή χρησιμοποιείται συχνότερα. Υπάρχουν και άλλες μέθοδοι, συμπεριλαμβανομένων των συνδυασμών διαφορετικοί τρόποιεπιλογή σε διάφορα στάδια κατασκευής ενός πληθυσμού δείγματος.

Υπάρχουν πάντα σφάλματα στα αποτελέσματα του δείγματος. Αυτά τα σφάλματα μπορούν να χωριστούν σε δύο κατηγορίες: τυχαία και συστηματικά. Το πρώτο περιλαμβάνει τυχαίες αποκλίσεις των χαρακτηριστικών του δείγματος από τα γενικά, λόγω της ίδιας της φύσης της μεθόδου δειγματοληψίας. Το μέγεθος του τυχαίου σφάλματος μπορεί να υπολογιστεί (εκτιμηθεί). Τα συστηματικά λάθη, αντίθετα, δεν είναι τυχαίος; συνδέονται με την απόκλιση της δομής του δείγματος από την πραγματική δομή του πληθυσμού. Συστηματικά σφάλματα εμφανίζονται όταν παραβιάζεται ο βασικός κανόνας της τυχαίας επιλογής - διασφαλίζοντας ότι όλα τα αντικείμενα έχουν ίσες πιθανότητες να συμπεριληφθούν στο δείγμα. Οι στατιστικές δεν μπορούν να αξιολογήσουν σφάλματα αυτού του είδους.

Κύριες πηγές συστηματικά λάθηείναι: α) η ανεπάρκεια του σχηματιζόμενου δείγματος προς τους στόχους της μελέτης. β) άγνοια της φύσης της κατανομής στο γενικό πληθυσμό και, κατά συνέπεια, παραβίαση της δομής του γενικού πληθυσμού στο δείγμα· γ) συνειδητή επιλογή των πιο βολικών και συμφερόντων στοιχείων του γενικού πληθυσμού.

Πιθανότητα εμπιστοσύνης -


5. Πιθανότητα εμπιστοσύνης. Μεσαίο (στάνταρ) και οριακό δειγματοληπτικό σφάλμα. Διάστημα εμπιστοσύνηςγια να υπολογίσετε τη μέση τιμή σε γενικός πληθυσμός. Έλεγχος της υπόθεσης για στατιστική σημασία της διαφοράς μεταξύ δύο μέσων δειγμάτων.

Διάστημα εμπιστοσύνης - αυτή η τιμή του υπολογιζόμενου συντελεστή, στην οποία, πιστεύουμε, θα πρέπει να πέσει αυτή η τιμή για το γονίδιο. Σύνολο

Πιθανότητα εμπιστοσύνης - την πιθανότητα ότι η τιμή του υπολογισμένου συντελεστή για το γονίδιο. Ο πληθυσμός θα εμπίπτει στο διάστημα εμπιστοσύνης. Όσο μεγαλύτερο είναι το DV, τόσο μεγαλύτερο το DI.

Η αναπόφευκτη εξάπλωση των μέσων δειγμάτων γύρω από τον μεγάλο μέσο όρο (δηλαδή, η τυπική απόκλιση των μέσων δειγμάτων) ονομάζεται τυπικό σφάλμα δειγματοληψίας Μ, που εκφράζεται με τον τύπο (μικρό- μέση τιμή τυπική απόκλιση, n- το μέγεθος του δείγματος). το τυπικό σφάλμα του δείγματος είναι μικρότερο, τόσο μικρότερη είναι η τιμήμικρό(που χαρακτηρίζει την εξάπλωση των τιμών των χαρακτηριστικών) και όσο μεγαλύτερο είναι το μέγεθος του δείγματος n.

Εάν η μέθοδος δειγματοληψίας χρησιμοποιείται για εργασία με μη ποσοτικά δεδομένα, τότε ο ρόλος του αριθμητικού μέσου όρου στο σύνολο παίζεται από την αναλογία ή τη συχνότητα qσημάδι. Το μερίδιο υπολογίζεται ως ο λόγος του αριθμού των αντικειμένων που διαθέτουν ένα δεδομένο χαρακτηριστικό () προς τον αριθμό των αντικειμένων σε ολόκληρο τον πληθυσμό: . Το ρόλο του μέτρου της διασποράς παίζει η ποσότητα .

Σε αυτήν την περίπτωση το τυπικό σφάλμα δειγματοληψίας είναιΜυπολογίζεται με τον τύπο:

Η ακρίβεια και η αξιοπιστία της εκτίμησης των παραμέτρων πληθυσμού από ένα δείγμα είναι εντός του εύρους των αντίστροφη σχέση: όσο μεγαλύτερη είναι η ακρίβεια (δηλ. τόσο μικρότερη οριακό σφάλμακαι όσο πιο στενό είναι το διάστημα εμπιστοσύνης), τόσο χαμηλότερη είναι η αξιοπιστία μιας τέτοιας εκτίμησης (βαθμός εμπιστοσύνης). Και αντίστροφα - όσο χαμηλότερη είναι η ακρίβεια της αξιολόγησης, τόσο μεγαλύτερη είναι η αξιοπιστία της. Συχνά, κατασκευάζεται ένα διάστημα εμπιστοσύνης για αξιοπιστία 95%, κατά συνέπεια, το μέγιστο σφάλμα δειγματοληψίας είναι συνήθως ίσο με το διπλάσιο του μέσου σφάλματοςΜ..

Διάστημα εμπιστοσύνης για την εκτίμηση του μέσου πληθυσμού:

Χ(ζ.σ.) =Χ(επιλεγμένο) +-Δ =Χ(επιλεγμένο) +- = Χ(επιλεγμένο) +- σ(γ.σ.)/√n

Κριτήριο για τη διαφορά στις μέσες τιμές

Συχνά προκύπτει το έργο της σύγκρισης δύο μέσων δειγμάτων προκειμένου να ελεγχθεί η υπόθεση ότι αυτά τα δείγματα λαμβάνονται από τον ίδιο γενικό πληθυσμό και οι πραγματικές διαφορές στις τιμές των μέσων δειγμάτων εξηγούνται με την τυχαιότητα δειγματοληψίας.

Η υπόθεση που ελέγχεται μπορεί να διατυπωθεί ως εξής: η διαφορά μεταξύ των μέσων δειγμάτων είναι τυχαία, δηλ. τα γενικά μέσα είναι ίσα και στις δύο περιπτώσεις. Οπως και στατιστικά χαρακτηριστικάκαι πάλι χρησιμοποιείται η τιμή t, που είναι η διαφορά μεταξύ του μέσου όρου του δείγματος διαιρούμενο με το μέσο τυπικό σφάλμα του μέσου όρου και για τα δύο δείγματα.

Η πραγματική τιμή του στατιστικού χαρακτηριστικού συγκρίνεται με την κρίσιμη τιμή που αντιστοιχεί στο επιλεγμένο επίπεδο σημαντικότητας. Εάν η πραγματική τιμή είναι μεγαλύτερη από την κρίσιμη τιμή, η υπόθεση που ελέγχεται απορρίπτεται, δηλ. η διαφορά μεταξύ των μέσων θεωρείται σημαντική (σημαντική).


7. Συσχέτιση. Συντελεστής γραμμικής συσχέτισης, ο τύπος του, τα όρια των τιμών του. Συντελεστής προσδιορισμού, η ουσιαστική του σημασία. Εννοια του στατιστική σημασία του συντελεστή συσχέτισης.

Συντελεστής συσχέτισης δείχνει πόσο στενά συνδέονται δύο μεταβλητές μεταξύ τους .

Συντελεστής συσχέτισης r παίρνει τιμές στην περιοχή από -1 έως +1. Αν r= 1, τότε μεταξύ των δύο μεταβλητών υπάρχει ένα θετικό συνάρτησης γραμμική σύνδεση, δηλ. στο διάγραμμα διασποράς, τα αντίστοιχα σημεία βρίσκονται στην ίδια ευθεία με θετική κλίση. Αν r = -1, τότε υπάρχει μια λειτουργική αρνητική σχέση μεταξύ των δύο μεταβλητών. Αν r = 0, τότε οι εν λόγω μεταβλητές γραμμικά ανεξάρτητη, δηλ. σε μια διασπορά, το σύννεφο των σημείων «τεντώνεται οριζόντια».

Συνιστάται ο υπολογισμός της εξίσωσης παλινδρόμησης και του συντελεστή συσχέτισης μόνο εάν η σχέση μεταξύ των μεταβλητών μπορεί να θεωρηθεί τουλάχιστον κατά προσέγγιση γραμμική. Διαφορετικά, τα αποτελέσματα μπορεί να είναι εντελώς λανθασμένα· συγκεκριμένα, ο συντελεστής συσχέτισης μπορεί να είναι κοντά στο μηδέν παρουσία ισχυρής σχέσης. Αυτό ισχύει ιδιαίτερα για περιπτώσεις όπου η σχέση είναι σαφώς μη γραμμική (για παράδειγμα, η σχέση μεταξύ των μεταβλητών περιγράφεται κατά προσέγγιση από ένα ημιτονοειδές κύμα ή παραβολή). Σε πολλές περιπτώσεις, αυτό το πρόβλημα μπορεί να παρακαμφθεί μετατρέποντας τις αρχικές μεταβλητές. Ωστόσο, για να μαντέψουμε την ανάγκη για έναν τέτοιο μετασχηματισμό, δηλ. για να μάθετε τι μπορεί να περιέχουν τα δεδομένα σύνθετα σχήματαεξαρτήσεις, καλό είναι να τις «δείτε». Αυτός είναι ο λόγος για τον οποίο η εξέταση των σχέσεων μεταξύ ποσοτικών μεταβλητών θα πρέπει συνήθως να περιλαμβάνει την εξέταση των διαγραμμάτων διασποράς.

Οι συντελεστές συσχέτισης μπορούν να υπολογιστούν χωρίς πρώτα να κατασκευαστεί μια γραμμή παλινδρόμησης. Στην περίπτωση αυτή, το ζήτημα της ερμηνείας των σημείων ως αποτελεσματικών και παραγοντικών, δηλ. εξαρτώμενο και ανεξάρτητο δεν δηλώνεται και οι συσχετισμοί νοούνται ως συνέπεια ή συγχρονισμός των ταυτόχρονων αλλαγών στις τιμές των χαρακτηριστικών κατά τη μετακίνηση από αντικείμενο σε αντικείμενο.

Εάν τα αντικείμενα χαρακτηρίζονται από ένα ολόκληρο σύνολο ποσοτικών χαρακτηριστικών, μπορείτε να κατασκευάσετε αμέσως το λεγόμενο. πίνακας συσχέτισης, δηλ. έναν τετράγωνο πίνακα, ο αριθμός των σειρών και των στηλών του οποίου είναι ίσος με τον αριθμό των χαρακτηριστικών, και στη διασταύρωση κάθε γραμμής και στήλης υπάρχει ένας συντελεστής συσχέτισης του αντίστοιχου ζεύγους χαρακτηριστικών.

Ο συντελεστής συσχέτισης δεν έχει ουσιαστική ερμηνεία. Ωστόσο, η πλατεία του, που ονομάζεται συντελεστή προσδιορισμού(R 2), Εχει.

συντελεστής προσδιορισμού (R 2) είναι ένας δείκτης του πόσες αλλαγές σε ένα εξαρτημένο χαρακτηριστικό εξηγούνται από αλλαγές σε ένα ανεξάρτητο. Πιο συγκεκριμένα, αυτή είναι η αναλογία της διακύμανσης του ανεξάρτητου χαρακτηριστικού που εξηγείται από την επιρροή του εξαρτημένου .

Εάν δύο μεταβλητές είναι λειτουργικά γραμμικά εξαρτώμενες (τα σημεία στο διάγραμμα διασποράς βρίσκονται στην ίδια ευθεία γραμμή), τότε μπορούμε να πούμε ότι μια αλλαγή στη μεταβλητή yεξηγείται πλήρως από την αλλαγή της μεταβλητής Χ,και αυτό ακριβώς συμβαίνει όταν ο συντελεστής προσδιορισμού ίσο με ένα(σε αυτή την περίπτωση, ο συντελεστής συσχέτισης μπορεί να είναι ίσος με 1 ή -1). Εάν δύο μεταβλητές είναι γραμμικά ανεξάρτητες (μέθοδος ελάχιστα τετράγωναδίνει μια οριζόντια γραμμή), μετά τη μεταβλητή yΟι παραλλαγές του σε καμία περίπτωση δεν «οφείλονται» στη μεταβλητή Χ– στην περίπτωση αυτή ο συντελεστής προσδιορισμού είναι μηδέν. Σε ενδιάμεσες περιπτώσεις, ο συντελεστής προσδιορισμού δείχνει ποιο μέρος των μεταβολών της μεταβλητής yεξηγείται από μια αλλαγή στη μεταβλητή Χ(μερικές φορές είναι βολικό να αντιπροσωπεύεται αυτή η τιμή ως ποσοστό).


8. Ατμόλουτρο καιπολλαπλούς γραμμικής παλινδρόμησης. Συντελεστής πολλαπλή συσχέτιση. Η ουσιαστική σημασία του συντελεστή παλινδρόμησης, η σημασία του, η έννοια του t-στατιστική. Περιεχόμενη έννοια του συντελεστή προσδιορισμού R2.

Ανάλυση παλινδρόμησης - Μια στατιστική μέθοδος που σας επιτρέπει να δημιουργήσετε επεξηγηματικά μοντέλα με βάση την αλληλεπίδραση χαρακτηριστικών.

Το περισσότερο απλή υπόθεσησχέση είναι σχέση ζευγαριού, δηλ. σύνδεση μεταξύ δύο χαρακτηριστικών. Υποτίθεται ότι η σχέση μεταξύ δύο μεταβλητών είναι, κατά κανόνα, αιτιώδης φύση, δηλ. το ένα εξαρτάται από το άλλο. Το πρώτο (εξαρτώμενο) καλείται ανάλυση παλινδρόμησης με αποτέλεσμαδεύτερο (ανεξάρτητο) - παραγοντικό. Πρέπει να σημειωθεί ότι δεν είναι πάντα δυνατό να προσδιοριστεί με σαφήνεια ποια από τις δύο μεταβλητές είναι ανεξάρτητη και ποια εξαρτημένη. Συχνά η επικοινωνία μπορεί να θεωρηθεί αμφίδρομη.

Εξίσωση ζευγοποιημένης παλινδρόμησης : y = kx + σι.

Τις περισσότερες φορές, η εξαρτημένη μεταβλητή επηρεάζεται από πολλούς παράγοντες ταυτόχρονα, μεταξύ των οποίων είναι δύσκολο να ξεχωρίσουμε τον μοναδικό ή τον κύριο. Έτσι, για παράδειγμα, το εισόδημα μιας επιχείρησης εξαρτάται ΤΑΥΤΟΧΡΟΝΑαπό δύο συντελεστές παραγωγής - τον αριθμό των εργαζομένων και την παροχή ρεύματος. Επιπλέον, και οι δύο αυτοί παράγοντες δεν είναι ανεξάρτητοι μεταξύ τους.

Η εξίσωση πολλαπλή παλινδρόμηση : y = κ 1 · Χ 1 + κ 2 · Χ 2 + … + β,

Οπου x 1, x 2, . . . – ανεξάρτητες μεταβλητές από τις οποίες η μελετημένη (προκύπτουσα) μεταβλητή y εξαρτάται σε έναν ή τον άλλο βαθμό.

k 1 , k 2. . . – συντελεστές για τις αντίστοιχες μεταβλητές ( συντελεστές παλινδρόμησης), που δείχνει πόσο αλλάζει η τιμή της μεταβλητής που προκύπτει όταν μια ξεχωριστή ανεξάρτητη μεταβλητή αλλάζει κατά μία.

Η εξίσωση πολλαπλής παλινδρόμησης δίνει μοντέλο παλινδρόμησης, εξηγώντας τη συμπεριφορά της εξαρτημένης μεταβλητής. Κανένας μοντέλο παλινδρόμησηςδεν μπορεί να υποδείξει ποια μεταβλητή είναι εξαρτημένη (αποτέλεσμα) και ποια είναι ανεξάρτητη (αιτίες).

R – πολλαπλός συντελεστής συσχέτιση, μετρά το σύνολο της επιρροής των ανεξάρτητων χαρακτηριστικών, την εγγύτητα της σύνδεσης του προκύπτοντος χαρακτηριστικού με ολόκληρο το σύνολο των ανεξάρτητων χαρακτηριστικών, που εκφράζεται σε %.

Δείχνει ποια είναι η αναλογία των χαρακτηριστικών που λαμβάνονται υπόψη στο τμήμα αποτελεσμάτων, π.χ. Πόσο % της διακύμανσης στο χαρακτηριστικό y εξηγείται από τις παραλλαγές στα εξεταζόμενα χαρακτηριστικά X1, X2, X3.

Τ-στατιστικήδείχνει το επίπεδο κατάστασης. τη σημασία του καθενός συντελεστής παλινδρόμησης, δηλ. τη σταθερότητά του σε σχέση με το δείγμα.

Τ = σι/ Δb

Στατιστικά σημαντικό t >2. Όσο μεγαλύτερος είναι ο συντελεστής, τόσο το καλύτερο.

μέσω R - καταλήγουμε σε ένα συμπέρασμα σχετικά με το ποσοστό των λαμβανόμενων υπόψη χαρακτηριστικών που εξηγούν το αποτέλεσμα.


9.Πολυδιάστατες μέθοδοι Στατιστική ανάλυση. Ανάλυση συστάδων. Η εννοια του ιεραρχική μέθοδος και ΟΜέθοδος K-means. Πολυδιάστατη ταξινόμηση με χρησιμοποιώντας ασαφή σύνολα.

ΕΙΝΑΙ ΕΝΑ:

Ανάλυση συστάδων

Παραγοντική ανάλυση

Πολυδιάστατη κλιμάκωση

Ανάλυση συστάδων – συνδυασμός αντικειμένων σε μια ομάδα με κοινό στόχο (υπάρχουν πολλά σημάδια).

Μέθοδοι ανάλυσης συστάδων:

1. ιεραρχικός(δέντρο ιεραρχικής ανάλυσης):

κύρια ιδέα ιεραρχική μέθοδος συνίσταται στον διαδοχικό συνδυασμό ομαδοποιημένων αντικειμένων - πρώτα τα πλησιέστερα και μετά όλο και πιο απομακρυσμένα το ένα από το άλλο. Η διαδικασία για την κατασκευή μιας ταξινόμησης αποτελείται από διαδοχικά βήματα, σε καθεμία από τις οποίες συνδυάζονται οι δύο πλησιέστερες ομάδες αντικειμένων (συστάδες).

2. Μέθοδος K-means.

Απαιτεί προκαθορισμένες κλάσεις (clusters). Δίνει έμφαση στην ενδοταξική διακύμανση. με βάση μια υπόθεση για τον πιο πιθανό αριθμό τάξεων. Ο στόχος της μεθόδου είναι η κατασκευή ενός δεδομένου αριθμού συστάδων, οι οποίες θα πρέπει να είναι όσο το δυνατόν διαφορετικές μεταξύ τους.

Η διαδικασία ταξινόμησης ξεκινά με την κατασκευή ενός δεδομένου αριθμού συστάδων που λαμβάνονται με τυχαία ομαδοποίηση αντικειμένων. Κάθε σύμπλεγμα πρέπει να αποτελείται από αντικείμενα που είναι όσο το δυνατόν πιο «όμοια» και τα ίδια τα συμπλέγματα θα πρέπει να είναι όσο το δυνατόν πιο «ανόμοια» μεταξύ τους.

Τα αποτελέσματα αυτής της μεθόδου καθιστούν δυνατή την απόκτηση των κέντρων όλων των κατηγοριών (καθώς και άλλων παραμέτρων της περιγραφικής στατιστικής) για καθένα από τα αρχικά χαρακτηριστικά, και επίσης βλ. ΓΡΑΦΙΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗγια το πόσο και με ποιες παραμέτρους διαφέρουν οι κλάσεις που προκύπτουν.

Εάν τα αποτελέσματα της ταξινόμησης που λαμβάνονται με διαφορετικές μεθόδους συμπίπτουν, τότε αυτό επιβεβαιώνεται από την πραγματικότητα. Η ουσία των ομάδων (αξιοπιστία, εγκυρότητα).


10. Μέθοδοι πολυμεταβλητής στατιστικής ανάλυσης. Παραγοντική ανάλυση, σκοποί χρήσης της. Εννοια του κλίμακες παραγόντων, τα όριά τους αξίες; το ποσοστό της συνολικής διακύμανσης που εξηγείται από παράγοντες.

Πολυμεταβλητή στατιστική ανάλυση. Στόχος του: κατασκευή μιας απλοποιημένης διευρυμένης σειράς αντικειμένων.

ΕΙΝΑΙ ΕΝΑ:

Ανάλυση συστάδων

Παραγοντική ανάλυση

Πολυδιάστατη κλιμάκωση

Στον πυρήνα παραγοντική ανάλυσηκρύβεται η ιδέα ότι πίσω από τις πολύπλοκες σχέσεις των σαφώς καθορισμένων χαρακτηριστικών υπάρχει μια σχετικά απλούστερη δομή που αντανακλά τα πιο ουσιαστικά χαρακτηριστικά του φαινομένου που μελετάται και τα «εξωτερικά» χαρακτηριστικά είναι συναρτήσεις κρυφών. κοινούς παράγοντες, ορίζοντας αυτή τη δομή.

Στόχος: μετάβαση από περισσότεροσημάδια σε έναν μικρό αριθμό παραγόντων.

V παραγοντική ανάλυσηόλες οι τιμές που περιλαμβάνονται στο μοντέλο συντελεστών είναι τυποποιημένες, δηλ. είναι αδιάστατα μεγέθη με αριθμητικό μέσο όρο 0 και τυπική απόκλιση 1.

Ο συντελεστής σχέσης μεταξύ ενός συγκεκριμένου χαρακτηριστικού και ενός γενικού παράγοντα, που εκφράζει το μέτρο της επιρροής του παράγοντα στο χαρακτηριστικό, ονομάζεται συντελεστής φόρτισηςαυτού του χαρακτηριστικού σύμφωνα με αυτόν τον γενικό παράγοντα . Αυτός είναι ένας αριθμός μεταξύ -1 και 1. Όσο πιο μακριά από το 0, τόσο ισχυρότερη είναι η σύνδεση. Η τιμή του συντελεστή φόρτισης για έναν συγκεκριμένο παράγοντα, κοντά στο μηδέν, δείχνει ότι αυτός ο παράγοντας πρακτικά δεν έχει καμία επίδραση σε αυτό το χαρακτηριστικό.

Η τιμή (μέτρο εκδήλωσης) ενός παράγοντα σε ένα μεμονωμένο αντικείμενο ονομάζεται βάρος παράγοντααντικείμενο σύμφωνα με αυτόν τον παράγοντα. Τα βάρη παραγόντων σάς επιτρέπουν να ταξινομείτε και να ταξινομείτε αντικείμενα σύμφωνα με κάθε παράγοντα. Όσο μεγαλύτερο είναι το βάρος του παράγοντα ενός συγκεκριμένου αντικειμένου, τόσο περισσότερο εκδηλώνεται σε αυτό εκείνη η πλευρά του φαινομένου ή εκείνο το μοτίβο που αντανακλάται από αυτόν τον παράγοντα. Οι συντελεστές είναι τυποποιημένες ποσότητες και δεν μπορούν να είναι = μηδέν. Τα βάρη παραγόντων κοντά στο μηδέν δείχνουν μεσαίου βαθμούεκδηλώσεις του παράγοντα, θετικό - ότι αυτός ο βαθμός είναι πάνω από το μέσο όρο, αρνητικός - ότι. ότι είναι κάτω από το μέσο όρο.

Ο πίνακας συντελεστών βαρών έχει nσειρές ανά αριθμό αντικειμένων και κστήλες ανάλογα με τον αριθμό των κοινών παραγόντων. Η θέση των αντικειμένων στον άξονα κάθε παράγοντα δείχνει, αφενός, τη σειρά με την οποία ταξινομούνται από αυτόν τον παράγοντα και, αφετέρου, την ομοιομορφία ή την ανομοιομορφία στη θέση τους, την παρουσία συστάδων σημείων που απεικονίζουν αντικείμενα , που καθιστά δυνατή την οπτική ανάδειξη περισσότερο ή λιγότερο ομοιογενών ομάδων.


11. Τύποι ποιοτικών χαρακτηριστικών. Ονομαστικά χαρακτηριστικά, παραδείγματα από ιστορικές πηγές. Πίνακας έκτακτης ανάγκης. Ο συντελεστής σύνδεσης των ονομαστικών χαρακτηριστικών, τα όρια των τιμών του.

Ονομαστικά στοιχεία παρουσιάζονται ανά κατηγορίες για τις οποίες η παραγγελία είναι απολύτως ασήμαντη. Δεν υπάρχει άλλος τρόπος σύγκρισης που να τους ορίζεται εκτός από κυριολεκτική αντιστοίχιση/μη αντιστοίχιση.

Παραδείγματα ονομαστικών μεταβλητών:

· Εθνικότητα: Αγγλικά, Λευκορωσικά, Γερμανικά, Ρωσικά, Ιαπωνικά κ.λπ.

· Επάγγελμα: υπάλληλος, γιατρός, στρατιωτικός, δάσκαλος κ.λπ.

· Εκπαιδευτικό προφίλ: ανθρωπιστικό, τεχνικό, ιατρικό, νομικό κ.λπ.

Αν στην περίπτωση του επιπέδου εκπαίδευσης μπορούσαμε ακόμα να συγκρίνουμε τους ανθρώπους με όρους «καλύτερου-χειρότερου» ή «ανώτερου-χαμηλότερου», τώρα στερούμαστε ακόμη και αυτή την ευκαιρία. Ο μόνος σωστός τρόπος σύγκρισης είναι να πούμε ότι αυτές οι προσωπικότητες «όλες είναι ιστορικές» ή «όλες δεν είναι νομικοί».

Πίνακες έκτακτης ανάγκης

Ένας πίνακας έκτακτης ανάγκης είναι ένας ορθογώνιος πίνακας, οι σειρές του οποίου υποδεικνύουν τις κατηγορίες ενός χαρακτηριστικού (για παράδειγμα, διαφορετικές κοινωνικές ομάδες) και οι στήλες υποδεικνύουν τις κατηγορίες ενός άλλου (για παράδειγμα, κομματική ένταξη). Κάθε αντικείμενο στον πληθυσμό εμπίπτει σε ένα από τα κελιά αυτού του πίνακα σύμφωνα με την κατηγορία στην οποία ανήκει για καθένα από τα δύο χαρακτηριστικά. Έτσι, τα κελιά του πίνακα περιέχουν αριθμούς που αντιπροσωπεύουν τις συχνότητες συνύπαρξης κατηγοριών δύο χαρακτηριστικών (ο αριθμός των ατόμων που ανήκουν σε μια συγκεκριμένη κοινωνική ομάδα και των μελών ενός συγκεκριμένου κόμματος). Ανάλογα με τη φύση της κατανομής αυτών των συχνοτήτων μέσα στον πίνακα, μπορεί κανείς να κρίνει αν υπάρχει σχέση μεταξύ των χαρακτηριστικών. Τι κάνει η σύνδεση μεταξύ κοινωνική θέσηκαι την κομματική ένταξη; Σε αυτή την περίπτωση, η ύπαρξη μιας σύνδεσης θα αποδεικνυόταν από την παρουσία ορισμένων πολιτικών τάσεων μεταξύ μελών διαφορετικών Κοινωνικές Ομάδες. Επίσημα μιλώντας, αυτή η σύνδεση γίνεται κατανοητή ως μια πιο συχνή (ή, αντίθετα, πιο σπάνια) συνύπαρξη μεμονωμένων συνδυασμών κατηγοριών σε σύγκριση με την αναμενόμενη εμφάνιση - την κατάσταση μιας καθαρά τυχαίας εμφάνισης αντικειμένων εκεί (για παράδειγμα, υψηλότερο ποσοστό αγρότες στο Κόμμα Τρούντοβικ και ευγενείς στο Κόμμα των Κανετών, από τα μερίδια αυτών των κοινωνικών ομάδων σε ολόκληρο τον πληθυσμό των βουλευτών της Δούμας).


12. Τύποι ποιοτικών χαρακτηριστικών. Χαρακτηριστικά κατάταξης, παραδείγματα από ιστορικές πηγές. ΣΕ ποια είναι τα όρια των τιμών των συντελεστών; συσχέτιση κατάταξης? Ποιοι συντελεστές θα πρέπει να χρησιμοποιηθούν για την αξιολόγηση της σχέσης μεταξύ κατάταξης και ονομαστικά χαρακτηριστικά;

Τα ποιοτικά (ή κατηγορικά) δεδομένα χωρίζονται σε δύο τύπους: κατάταξη και ονομαστικά.

Δεδομένα κατάταξηςαντιπροσωπεύονται από κατηγορίες για τις οποίες μπορείτε να καθορίσετε τη σειρά, π.χ. Οι κατηγορίες συγκρίνονται σύμφωνα με την αρχή «περισσότερο-λιγότερο» ή «καλύτερο-χειρότερο».

Παραδείγματα μεταβλητών κατάταξης:

· Οι βαθμοί των εξετάσεων έχουν σαφώς καθορισμένο χαρακτήρα κατάταξης και εκφράζονται σε κατηγορίες όπως «άριστα», «καλά», «ικανοποιητικά» κ.λπ.

· Το επίπεδο εκπαίδευσης μπορεί να παρουσιαστεί ως σύνολο κατηγοριών: «ανώτερη», «δευτεροβάθμια» κ.λπ.

Σίγουρα μπορούμε να εισαγάγουμε μια κλίμακα κατάταξης και να τη χρησιμοποιήσουμε για να κατατάξουμε όλα τα άτομα για τα οποία γνωρίζουμε το μορφωτικό τους επίπεδο ή τη βαθμολογία των εξετάσεων. Ωστόσο, είναι αλήθεια ότι η βαθμολογία «καλή» είναι τόσο χειρότερη από την «άριστη» όσο η βαθμολογία «ικανοποιητική» είναι χειρότερη από την «καλή»; Παρά το γεγονός ότι τυπικά, στην περίπτωση των βαθμών, είναι δυνατό να ληφθεί διαφορά στους βαθμούς, δεν είναι καθόλου σωστό να μετρηθεί η απόσταση από έναν «άριστο μαθητή» σε έναν «καλό μαθητή» χρησιμοποιώντας τους ίδιους κανόνες όπως για την απόσταση από τη Μόσχα στην Αγία Πετρούπολη. Στην περίπτωση του μορφωτικού επιπέδου, είναι ιδιαίτερα σαφές ότι απλούς υπολογισμούςείναι αδύνατες, αφού δεν υπάρχει ενιαίος κανόνας για την αφαίρεση του «δευτεροβάθμιου» επιπέδου εκπαίδευσης από το «ανώτερο», ακόμη κι αν αποδώσουμε τον κωδικό «3» στην τριτοβάθμια εκπαίδευση και τον κωδικό «2» στη δευτεροβάθμια εκπαίδευση.

Η μοναδικότητα των ποιοτικών δεδομένων δεν σημαίνει ότι δεν μπορούν να αναλυθούν χρησιμοποιώντας μαθηματικές και στατιστικές μεθόδους.

Μια σειρά αντικειμένων που ταξινομούνται σύμφωνα με τον βαθμό εκδήλωσης μιας συγκεκριμένης ιδιότητας ονομάζεται κατάταξη· κάθε αριθμός μιας τέτοιας σειράς εκχωρείται τάξη.

Τα μέτρα της σχέσης μεταξύ ενός ζεύγους χαρακτηριστικών, καθένα από τα οποία κατατάσσει το υπό μελέτη σύνολο αντικειμένων, καλούνται στη στατιστική συντελεστές συσχέτισης κατάταξης .

Αυτοί οι συντελεστές κατασκευάζονται με βάση τις ακόλουθες τρεις ιδιότητες:

· εάν η κατάταξη σειρά και για τα δύο χαρακτηριστικά συμπίπτει πλήρως (δηλαδή, κάθε αντικείμενο καταλαμβάνει την ίδια θέση και στις δύο σειρές), τότε ο συντελεστής συσχέτισης κατάταξης πρέπει να είναι ίσος με +1, που σημαίνει πλήρη θετική συσχέτιση:

· εάν τα αντικείμενα της ίδιας σειράς βρίσκονται στο αντίστροφη σειράΣε σύγκριση με το δεύτερο, ο συντελεστής είναι -1, που σημαίνει πλήρη αρνητική συσχέτιση.

· σε άλλες περιπτώσεις, οι τιμές των συντελεστών βρίσκονται στο διάστημα [-1, +1]. Μια αύξηση στη μονάδα συντελεστή από 0 σε 1 χαρακτηρίζει μια αύξηση της αντιστοιχίας μεταξύ δύο σειρών κατάταξης.

Οι καθορισμένες ιδιότητεςέχουν συντελεστές συσχέτισης κατάταξης Ακοντιστής r Και Κεδάλλα t .

Ο συντελεστής Caedall παρέχει μια πιο συντηρητική εκτίμηση της συσχέτισης από τον συντελεστή Spearman (αριθμητική τιμήtπάντα λιγότερο απόr).

Συντελεστές συσχέτισης ποιοτικών χαρακτηριστικών

Για την αξιολόγηση της σχέσης μεταξύ των ποιοτικών χαρακτηριστικών, απαιτείται ένας συντελεστής, ο οποίος θα έχει ένα ορισμένο μέγιστο στην περίπτωση της μέγιστης σύνδεσης και θα επιτρέπει τη σύγκριση μεταξύ τους διαφορετικά τραπέζιααπό τη δύναμη της σύνδεσης μεταξύ των χαρακτηριστικών. Σε αυτή την περίπτωση μας ταιριάζει Συντελεστής Cramer V .

Με βάση την τιμή της δοκιμής chi-square, ο συντελεστής Cramer σάς επιτρέπει να μετρήσετε την ισχύ της σχέσης μεταξύ δύο κατηγοριοποιημένων μεταβλητών - μετρήστε τη με έναν αριθμό που παίρνει τιμές από 0 έως 1, δηλ. από την παντελή έλλειψη επικοινωνίας στο μέγιστο ισχυρή σύνδεση. Ο συντελεστής σάς επιτρέπει να συγκρίνετε τις εξαρτήσεις διαφορετικά σημάδια, προκειμένου να εντοπίσουμε όλο και λιγότερο ισχυρές συνδέσεις.


13. Μαθηματική μοντελοποίησηιστορικές διαδικασίες καιπρωτοφανής. Ορισμός της έννοιας «μοντέλο». Τρεις τύποι μοντέλων, παραδείγματα αυτώνχρήση σε ιστορική έρευνα.

14. Οι διαφορικές εξισώσεις ως κύριο εργαλείο κατασκευής μαθηματικά μοντέλαθεωρητικού τύπου. Τα χαρακτηριστικά τους σε σύγκριση με μοντέλα προσομοίωσης και στατιστικών τύπων. Ένα παράδειγμα τέτοιου μοντέλου.

Στείλτε την καλή δουλειά σας στη βάση γνώσεων είναι απλή. Χρησιμοποιήστε την παρακάτω φόρμα

Καλή δουλειάστον ιστότοπο">

Φοιτητές, μεταπτυχιακοί φοιτητές, νέοι επιστήμονες που χρησιμοποιούν τη βάση γνώσεων στις σπουδές και την εργασία τους θα σας είναι πολύ ευγνώμονες.

Δημοσιεύτηκε στις http://www.allbest.ru/

Πρόβλημα 1

Σε κάποια περιοχή του Αυτή την χρονιάΔιαπράχθηκαν 12.390 εγκλήματα, ενώ τον προηγούμενο χρόνο σημειώθηκαν 11.800 εγκλήματα. Υπολογίστε (σε %) τον ρυθμό αύξησης και τον ρυθμό αύξησης του αριθμού των εγκλημάτων που καταγράφηκαν το τρέχον έτος σε σχέση με το προηγούμενο. Υπολογίστε επίσης τα ποσοστά εγκληματικότητας για κάθε έτος εάν ο πληθυσμός της περιοχής στο τέλος προηγούμενο έτοςήταν 1.475.000, και στο τέλος του τρέχοντος έτους - 1.770.000 άτομα. Εξαγωγή συμπερασμάτων για τη δυναμική της εγκληματικότητας στην περιοχή.

Λύση:Για να αποκτήσετε μια ακριβή εικόνα του εγκλήματος, ένας τέτοιος δείκτης του εγκλήματος όπως η δυναμική, δηλαδή η αλλαγή με την πάροδο του χρόνου, έχει μεγάλη σημασία. Η δυναμική του εγκλήματος χαρακτηρίζεται από τις έννοιες της απόλυτης ανάπτυξης (ή παρακμής) και του ρυθμού αύξησης και αύξησης της εγκληματικότητας, για να καθοριστεί ποια αυτά τα χαρακτηριστικά υπολογίζονται σύμφωνα με ορισμένους τύπους.

Οι ρυθμοί αύξησης της εγκληματικότητας υπολογίζονται με βάση βασικούς δείκτες δυναμικής, οι οποίοι περιλαμβάνουν τη σύγκριση δεδομένων για πολλά χρόνια (και μερικές φορές δεκαετίες, εάν απαιτείται ευρεία κάλυψη του υλικού) με μια σταθερή βάση, η οποία νοείται ως το ποσοστό εγκληματικότητας στην αρχική περίοδο για ανάλυση. Αυτός ο υπολογισμός επιτρέπει στους εγκληματολόγους να εγγυηθούν σε μεγάλο βαθμό τη συγκρισιμότητα σχετικούς δείκτες, υπολογισμένα ως ποσοστό, που δείχνουν πώς το έγκλημα των επόμενων περιόδων σχετίζεται με το προηγούμενο.

Στον υπολογισμό, τα δεδομένα από το αρχικό έτος λαμβάνονται ως 100%. Οι δείκτες που λαμβάνονται για τα επόμενα έτη αντικατοπτρίζουν μόνο το ποσοστό της ανάπτυξης, γεγονός που καθιστά τον υπολογισμό ακριβή και την εικόνα πιο αντικειμενική. Όταν λειτουργεί με σχετικά δεδομένα, είναι δυνατό να αποκλειστεί ο αντίκτυπος στη μείωση ή την αύξηση της εγκληματικότητας από την αύξηση ή τη μείωση του αριθμού των κατοίκων που έχουν συμπληρώσει την ηλικία ποινικής ευθύνης.

Ο ρυθμός αύξησης της εγκληματικότητας υπολογίζεται ως ποσοστό. Ο ρυθμός αύξησης της εγκληματικότητας δείχνει πόσο αυξήθηκε ή μειώθηκε το επόμενο ποσοστό εγκληματικότητας σε σύγκριση με την προηγούμενη περίοδο. Αποδεκτό σύμβολοφορέας ρυθμού ανάπτυξης: αν ποσοστόαν αυξηθεί, τοποθετείται το πρόσημο, εάν μειώνεται, το σύμβολο μείον.

Σε σχέση με τις συνθήκες του προβλήματός μας, θα πρέπει να εφαρμόσουμε τους κατάλληλους τύπους και να υπολογίσουμε την αύξηση και την αύξηση της εγκληματικότητας.

1) Ο ρυθμός αύξησης της εγκληματικότητας υπολογίζεται με τον τύπο^

Tr=U/U2 * 100%,

όπου U είναι ο δείκτης ποσοστού εγκληματικότητας και U2 ο δείκτης ποσοστού εγκληματικότητας της προηγούμενης περιόδου. Άρα ο ρυθμός αύξησης της εγκληματικότητας σύμφωνα με τις συνθήκες του προβλήματος θα είναι - 12390/11800*100%=1,05%.

2) Ο ρυθμός αύξησης της εγκληματικότητας υπολογίζεται με τον ακόλουθο τύπο:

Tpr=Tr-100%.

Άρα ο ρυθμός ανάπτυξης σύμφωνα με τις συνθήκες του προβλήματος θα είναι 1,05% - 100% = 98,95%.

Το ποσοστό εγκληματικότητας είναι ένας ειδικός γενικός δείκτης συνολικός αριθμόςκαταγεγραμμένα εγκλήματα, συσχετισμένα με το μέγεθος του πληθυσμού. Αντιπροσωπεύει τον αριθμό των εγκλημάτων ανά 100 χιλιάδες, 10 χιλιάδες ή 1 χιλιάδες πληθυσμού και είναι ένα αντικειμενικό μέτρο της εγκληματικότητας, που επιτρέπει σε κάποιον να συγκρίνει τα επίπεδά του σε διαφορετικές περιοχές και σε διαφορετικά έτη.

Το ποσοστό εγκληματικότητας βοηθά στην πιο κατάλληλη αξιολόγηση της δυναμικής του ποσοστού εγκληματικότητας που υπολογίζεται κατά κεφαλήν.

Το ποσοστό εγκληματικότητας υπολογίζεται με τον τύπο:

KP = (P x 100000): N,

όπου P - απόλυτος αριθμόςκαταγεγραμμένα εγκλήματα· και Ν είναι το απόλυτο μέγεθος ολόκληρου του πληθυσμού.

Και οι δύο δείκτες λαμβάνονται στο ίδιο εδαφικό και χρονικό πεδίο. Ο αριθμός των εγκλημάτων υπολογίζεται συνήθως ανά 100 χιλιάδες πληθυσμό. Αλλά με μικρούς αριθμούς εγκλημάτων και πληθυσμού (σε πόλη, περιοχή, επιχείρηση), το ποσοστό εγκληματικότητας μπορεί να υπολογιστεί ανά 10 χιλιάδες ή ανά 1 χιλιάδες κατοίκους. Σε κάθε περίπτωση, αυτοί οι αριθμοί σημαίνουν τη διάσταση του υπό εξέταση συντελεστή, ο οποίος πρέπει να αναφέρεται: ο αριθμός των εγκλημάτων ανά 100 χιλιάδες ή 10 χιλιάδες πληθυσμού.

Ας υπολογίσουμε το ποσοστό εγκληματικότητας σε σχέση με τις συνθήκες του προβλήματός μας:

1) KP = (12390*100000): 1.770.000 άτομα. = 700 (το τρέχον έτος).

2) KP = (11800*100000): 1.475.000 = 800 (το προηγούμενο έτος).

Η εγκληματικότητα στην περιοχή μειώνεται, αφού, αναλύοντας τον συντελεστή εγκληματικότητας, μπορούμε να συμπεράνουμε ότι με αύξηση του πληθυσμού στην περιοχή (κατά 16,6%) και ελαφρά αύξηση του αριθμού των εγκλημάτων κατά 1,05%, γενικά, η Η αύξηση της εγκληματικότητας μειώνεται (-98,95 %).

Πρόβλημα 2

Η ηλικία των 11 νέων ειδικών του ιδρύματος που προσλήφθηκαν για υπηρεσία φέτος ήταν 19,25,21,23,23,23,25,20,18,20,21 ετών, αντίστοιχα. Συνοψίστε και ομαδοποιήστε τα δεδομένα με τη μορφή στατιστικού πίνακα συχνοτήτων. Για λόγους σαφήνειας, δημιουργήστε ένα πολύγωνο συχνότητας και βρείτε επίσης τον τρόπο, τη διάμεση και τη μέση ηλικία των μισθωτών.

Λύση: Ομαδοποίηση- αυτή είναι η διαίρεση ενός πληθυσμού σε ομάδες που είναι ομοιογενείς σύμφωνα με κάποιο χαρακτηριστικό. Από την άποψη των επιμέρους μονάδων του πληθυσμού, η ομαδοποίηση είναι η ενοποίηση μεμονωμένων μονάδων του πληθυσμού σε ομάδες που είναι ομοιογενείς σύμφωνα με ορισμένα χαρακτηριστικά.

Η μέθοδος ομαδοποίησης βασίζεται στις ακόλουθες κατηγορίες: χαρακτηριστικό ομαδοποίησης, διάστημα ομαδοποίησης και αριθμό ομάδων.

Σήμα ομαδοποίησης- αυτό είναι ένα σημάδι με το οποίο μεμονωμένες μονάδες ενός πληθυσμού ενώνονται σε ομοιογενείς ομάδες.

Το διάστημα σκιαγραφεί τα ποσοτικά όρια των ομάδων. Κατά κανόνα, αντιπροσωπεύει το χάσμα μεταξύ των μέγιστων και ελάχιστων τιμών ενός χαρακτηριστικού σε μια ομάδα.

Προσδιορισμός του αριθμού των ομάδων.

Ο αριθμός των ομάδων καθορίζεται κατά προσέγγιση από τον τύπο Sturgess:

n = 1 + 3,2log n = 1 + 3,2log(11) = 4.

Το πλάτος του διαστήματος θα είναι:

Xmax - μέγιστη αξίαχαρακτηριστικό ομαδοποίησης στο σύνολο. Xmin είναι η ελάχιστη τιμή του χαρακτηριστικού ομαδοποίησης. Ας ορίσουμε τα όρια της ομάδας.

Αριθμός ομάδας

Συμπέρασμα

Ανώτατο όριο

Η ίδια τιμή χαρακτηριστικού χρησιμεύει ως τα άνω και κάτω όρια δύο γειτονικών (προηγούμενων και επόμενων) ομάδων.

Για κάθε τιμή της σειράς, μετράμε πόσες φορές εμπίπτει σε ένα συγκεκριμένο διάστημα. Για να γίνει αυτό, ταξινομούμε τη σειρά σε αύξουσα σειρά.

Συλλογή αρ.

Συχνότητα fi

Ένα πολύγωνο συχνότητας είναι ένα διάγραμμα πυκνότητας και πιθανότητας τυχαία μεταβλητή, είναι μια διακεκομμένη γραμμή που συνδέει τα σημεία που αντιστοιχούν στις διάμεσες τιμές των διαστημάτων ομαδοποίησης και τις συχνότητες αυτών των διαστημάτων.

Μέση αξία:

Μόδαγραμμικό νόημα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

όπου x 0 είναι η αρχή του τροπικού διαστήματος. h - μέγεθος διαστήματος. f 2 - συχνότητα που αντιστοιχεί στο τροπικό διάστημα. f 1 - προτροπική συχνότητα. f 3 - μετατροπική συχνότητα.

Επιλέγουμε το 19,75 ως αρχή του διαστήματος, αφού αυτό το διάστημα αντιστοιχεί στον μεγαλύτερο αριθμό.

Η πιο κοινή τιμή της σειράς είναι 20,92.

Διάμεσος. Η διάμεσος χωρίζει το δείγμα σε δύο μέρη: η μισή επιλογή είναι μικρότερη από τη διάμεσο, η μισή είναι μεγαλύτερη.

Σε μια σειρά διανομής διαστήματος, μπορείτε να καθορίσετε αμέσως μόνο το διάστημα στο οποίο θα βρίσκεται ο τρόπος λειτουργίας ή η διάμεσος. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης. Η διάμεσος είναι το διάστημα 19,75-21,5, γιατί σε αυτό το διάστημα, η συσσωρευμένη συχνότητα S είναι μεγαλύτερη από τον διάμεσο αριθμό (η διάμεσος είναι το πρώτο διάστημα, του οποίου η συσσωρευμένη συχνότητα S υπερβαίνει το μισό συνολικό ποσόσυχνότητες).

Έτσι, το 50% των μονάδων στον πληθυσμό θα είναι μικρότερο από 21,28.

Πρόβλημα 3

Προσδιορίστε το απαιτούμενο μέγεθος δείγματος για τη μελέτη της μέσης ηλικίας των πιστοποιημένων υπαλλήλων της Ομοσπονδιακής Σωφρονιστικής Υπηρεσίας της Ρωσίας, υπό την προϋπόθεση ότι η τυπική απόκλιση είναι 10 έτη και το μέγιστο επιτρεπόμενο σφάλμα δειγματοληψίας δεν πρέπει να υπερβαίνει το 5%.

Αναζητούμε μια λύση χρησιμοποιώντας τον τύπο για τον προσδιορισμό του μεγέθους του δείγματος για εκ νέου επιλογή.

Ф(t) = r/2 = 0,95/2 = 0,475 και αυτή η τιμή σύμφωνα με τον πίνακα Laplace αντιστοιχεί σε t=1,96.

Εκτίμηση τυπικής απόκλισης s = 10; δειγματοληπτικό σφάλμα e = 5.

Πρόβλημα 4

Ο ακόλουθος πίνακας παρέχει επίσημες στατιστικές πληροφορίες του τμήματος σχετικά με την κατανομή των καταδίκων με όρους φυλάκισης (τιμωρίας) για το 2002-2011, που δημοσιεύτηκε στον επίσημο ιστότοπο της Ομοσπονδιακής Σωφρονιστικής Υπηρεσίας της Ρωσίας: www.fsin.su. Βρείτε το εύρος και τον συντελεστή διακύμανσης του αριθμού των καταδίκων για κάθε ημερολογιακό έτος και εξάγετε συμπεράσματα για την ομοιογένεια της δομής αυτού του στατιστικού χαρακτηριστικού.

Ο κύριος δείκτης που χαρακτηρίζει την ομοιογένεια των δεδομένων είναι ο συντελεστής διακύμανσης. Στις στατιστικές, είναι γενικά αποδεκτό ότι εάν η τιμή του συντελεστή είναι μικρότερη από 33%, τότε το σύνολο δεδομένων είναι ομοιογενές, εάν είναι μεγαλύτερο από 33%, τότε είναι ετερογενές.

Ο συντελεστής διακύμανσης

Από το v; 30%, τότε ο πληθυσμός είναι ομοιογενής και η διακύμανση είναι ασθενής. Τα αποτελέσματα που λαμβάνονται μπορούν να είναι αξιόπιστα.

Διάρκεια ποινής

Από 1 έως 3 ετών

Από 3 έως 5 ετών

Από 5 έως 10 ετών

Από 10 έως 15 ετών

Πάνω από 15 χρόνια

Μέγιστη τιμή (συνάρτηση MAX)

Ελάχιστη τιμή (συνάρτηση MIN)

Εύρος παραλλαγής

Μέση τιμή (Συνάρτηση AVERAGE)

Τυπική απόκλιση (συνάρτηση STANDARD WOMB)

Ο συντελεστής διακύμανσης

Απλός μέσος όρος:

Μόδακυριολεκτική σημασία

Διάμεσος

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 70580. Επομένως, η διάμεσος Me = 70580.

Δείκτες διακύμανσης. .

R = X max - X min.

R = 295916-2250 = 293666.

Μέση γραμμική απόκλιση

Κάθε τιμή στη σειρά διαφέρει από την άλλη κατά μέσο όρο 90895,71.

Διασπορά

(μέσο σφάλμαδείγματα).

Κάθε τιμή στη σειρά διαφέρει από τη μέση τιμή του 103008 κατά μέσο όρο 107169,83.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Αφού v>

ή

Συντελεστής ταλάντωσης

Απλός μέσος όρος:

Μόδα

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 76186. Επομένως, η διάμεσος Me = 76186.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min

R = 291112-3101 = 288011.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή στη σειρά διαφέρει από την άλλη κατά μέσο όρο 83422,69.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 97334,29 κατά μέσο όρο 100750,25.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικός συντελεστήςπαραλλαγές, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντανακλά σχετική διακύμανση ακραίες αξίεςυπογράψει γύρω από τον μέσο όρο.

Απλός μέσος όρος:

Μόδαγραμμικό νόημα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 71093. Επομένως, η διάμεσος Me = 71093.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min

R = 243852-3856 = 239996.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή της σειράς διαφέρει από την άλλη κατά μέσο όρο 68998,08.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 85765,57 κατά μέσο όρο 82541,55.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

:

Μόδα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 74588. Επομένως, η διάμεσος Me = 74588.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min,

R = 242984-5304 = 237680.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή στη σειρά διαφέρει από την άλλη κατά μέσο όρο 73148,73.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 92104,14 κατά μέσο όρο 82873,1.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

Απλός αριθμητικός μέσος όρος:

Μόδα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 76678. Επομένως, η διάμεσος Me = 76678

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min.

R = 249346-6536 = 242810.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή της σειράς διαφέρει από την άλλη κατά μέσο όρο 79680,53.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 99551,71 κατά μέσο όρο 87389,04.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

Απλός αριθμητικός μέσος όρος:

Μόδα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 76461. Επομένως, η διάμεσος Me = 76461.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min.

R = 254722-6704 = 248018.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή της σειράς διαφέρει από την άλλη κατά μέσο όρο 82302,82.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 102346,71 κατά μέσο όρο 89787,88.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

Απλός αριθμητικός μέσος όρος:

Μόδα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 78959. Επομένως, η διάμεσος Me = 78959.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min.

R = 261334-7635 = 253699.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή της σειράς διαφέρει από την άλλη κατά μέσο όρο 83791,55.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 104898,86 κατά μέσο όρο 91616,15.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

Απλός αριθμητικός μέσος όρος:

Μόδα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 75916. Επομένως, η διάμεσος Me = 75916.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min.

R = 263863-8145 = 255718.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή της σειράς διαφέρει από την άλλη κατά μέσο όρο 82767,96.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 103440,71 κατά μέσο όρο 91207,92.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

Απλός αριθμητικός μέσος όρος:

Μόδα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 78019. Επομένως, η διάμεσος Me = 78019.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min

R = 260094-7798 = 252296.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή της σειράς διαφέρει από την άλλη κατά μέσο όρο 77827,76.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 99212,29 κατά μέσο όρο 88081,39.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

Απλός αριθμητικός μέσος όρος:

Μόδα. Η λειτουργία είναι η πιο κοινή τιμή ενός χαρακτηριστικού μεταξύ των μονάδων ενός δεδομένου πληθυσμού.

Δεν υπάρχει λειτουργία (όλες οι τιμές της σειράς είναι μεμονωμένες).

Διάμεσος. Διάμεσος είναι η τιμή του χαρακτηριστικού που χωρίζει τις μονάδες της σειράς κατάταξης σε δύο μέρη. Η διάμεσος αντιστοιχεί στην επιλογή στη μέση της σειράς κατάταξης.

Βρίσκουμε το μέσο της σειράς κατάταξης: h = (n+1) / 2 = (7+1) / 2 = 4. Αυτός ο αριθμός αντιστοιχεί στην τιμή της σειράς 72248. Επομένως, η διάμεσος Me = 72248.

Δείκτες διακύμανσης. Απόλυτες παραλλαγές.

Το εύρος διακύμανσης είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του κύριου χαρακτηριστικού σειράς.

R = X max - X min.

R = 242137-7173 = 234964.

Μέση γραμμική απόκλιση- υπολογίζεται ώστε να λαμβάνονται υπόψη οι διαφορές όλων των μονάδων του υπό μελέτη πληθυσμού.

Κάθε τιμή της σειράς διαφέρει από την άλλη κατά μέσο όρο 70459,02.

Διασπορά- χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Τυπική απόκλιση(μέσο δειγματοληπτικό σφάλμα).

Κάθε τιμή της σειράς διαφέρει από τη μέση τιμή των 91375,14 κατά μέσο όρο 80674,43.

Σχετικά Μέτρα Μεταβολής. Οι σχετικοί δείκτες διακύμανσης περιλαμβάνουν: συντελεστή ταλάντωσης, γραμμικό συντελεστή διακύμανσης, σχετική γραμμική απόκλιση.

Ο συντελεστής διακύμανσης- ένα μέτρο της σχετικής διασποράς των τιμών του πληθυσμού: δείχνει ποια αναλογία της μέσης τιμής αυτής της τιμής είναι η μέση διασπορά της.

Δεδομένου ότι v>70%, ο πληθυσμός πλησιάζει το όριο της ετερογένειας και η διακύμανση είναι έντονη.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός. Σε αυτή την περίπτωση, στην πρακτική έρευνα, χρησιμοποιούνται διάφορες στατιστικές τεχνικές για να φέρουν τον πληθυσμό σε ομοιογενή μορφή.

Γραμμικός συντελεστής διακύμανσηςή Σχετική γραμμική απόκλιση- χαρακτηρίζει την αναλογία της μέσης τιμής του πρόσημου των απόλυτων αποκλίσεων από τη μέση τιμή.

Συντελεστής ταλάντωσης- αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών του χαρακτηριστικού γύρω από το μέσο όρο.

Πρόβλημα 5

Στις συνθήκες της προηγούμενης εργασίας, ανασυγκροτήστε τα δεδομένα διαστήματα προτάσεων για να βελτιώσετε τους σχετικούς δείκτες διακύμανσης του χαρακτηριστικού το 2010. Κατασκευάστε ιστογράμματα κατανομής καταδίκων ανά ποινή φυλάκισης (τιμωρίας) για το 2010 πριν και μετά την ομαδοποίηση των δεδομένων και εξαγωγή συμπερασμάτων για την ομοιογένεια της δομής του υπό μελέτη στατιστικού χαρακτηριστικού.

Λύση:

Αφού v>30%, αλλά v<70 %, то вариация умеренная.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός.

Ας αναδιατάξουμε τα δεδομένα ως εξής:

Η ομάδα 1) περιλαμβάνει ομάδες: έως ένα έτος, ένα έτος, από 1-3 έτη, αντίστοιχα 156978.

Η ομάδα 2) περιλαμβάνει από την ομάδα άνω των 3 έως 5 ετών πλήρως και το 1/5 από την ομάδα άνω των 5 έως 10 ετών παίρνουμε 1/5*260094+168651=220669,8.

Η ομάδα 3) περιλαμβάνει 3/5 γκρουπ από 5 έως 10 δηλ. 3\5*260094=156056.4.

Ομάδα 4) (1\5*260094)+(1\5*78019)=67622,6.

Ομάδα 5) 3\5*78019=46811.4.

Ομάδα 6 30744+(1\5*78019)=46347,8.

Ραβδόγραμμα. Για να βγάλουμε ένα συμπέρασμα σχετικά με την ομοιογένεια του στατιστικού χαρακτηριστικού που μελετάται, ας υπολογίσουμε τον συντελεστή διακύμανσης:

Αφού v>30%, αλλά v<70 %, то вариация умеренная.

Ο συντελεστής διακύμανσης είναι σημαντικά μεγαλύτερος από 33%. Κατά συνέπεια, ο υπό εξέταση πληθυσμός είναι ετερογενής και ο μέσος όρος για αυτόν δεν είναι αρκετά τυπικός.

Πρόβλημα 6

Παρουσιάστε σε σύντομη μορφή (αφηρημένα, σε 1-2 σελίδες) το περιεχόμενο και τα αποτελέσματα μιας πρόσφατης επίσημης στατιστικής μελέτης στον κοινωνικο-νομικό τομέα (θέμα - της επιλογής σας, σύνδεσμοι σε πόρους του Διαδικτύου - απαιτείται), εξάγετε συμπεράσματα και υποβάλετε τα κατάλληλα στατιστικές υποθέσεις για τη βραχυπρόθεσμη προοπτική.

Ως επίσημη στατιστική μελέτη ελήφθη μια μελέτη για τους ληξιπρόθεσμους μισθούς την 1η Δεκεμβρίου 2015.

Από την 1η Δεκεμβρίου 2015, σύμφωνα με πληροφορίες από οργανισμούς (που δεν σχετίζονται με μικρές επιχειρήσεις) συνολικό χρέοςγια τους μισθούς για το εύρος των παρατηρούμενων τύπων οικονομικής δραστηριότητας ανήλθαν σε 3900 εκατομμύρια ρούβλιασε αυτήκαι σε σύγκριση με την 1η Νοεμβρίου 2015, αυξήθηκε κατά 395 εκατομμύρια ρούβλια (11,3%).

Καθυστερημένοι μισθοί λόγω έλλειψης ιδίων κεφαλαίων των οργανισμώναπό την 1η Δεκεμβρίου 2015 ανήλθε σε 3818 εκατομμύρια ρούβλιασε αυτή, ή ποσοστό 97,9% του συνολικού ποσού των ληξιπρόθεσμων οφειλών. Σε σύγκριση με την 1η Νοεμβρίου 2015 αυξήθηκε κατά 389 εκατομμύρια ρούβλια (11,3%). Χρέος λόγω μη έγκαιρης λήψης κονδυλίων από προϋπολογισμούς όλων των βαθμίδωνανήλθε σε 82 εκατομμύρια ρούβλιασε αυτήκαι αυξήθηκε σε σχέση με την 1η Νοεμβρίου 2015. κατά 6 εκατομμύρια ρούβλια (κατά 7,7%), συμπεριλαμβανομένου του χρέους από την ομοσπονδιακή προϋπολογισμόςανήλθε σε 62 εκατομμύρια ρούβλια και μειώθηκε σε σύγκριση με την 1η Νοεμβρίου 2015. κατά 6 εκατομμύρια ρούβλια (κατά 8,6%), προϋπολογισμούς των συνιστωσών της Ρωσικής Ομοσπονδίαςανήλθε σε 1,1 εκατομμύρια ρούβλια (αύξηση 0,2 εκατομμύρια ρούβλια ή 20,7%), τοπικούς προϋπολογισμούς - 19 εκατομμύρια ρούβλια (αύξηση 12 εκατομμύρια ρούβλια ή 2,5 φορές).

Στα ορυχεία, τη μεταποίηση, την υγειονομική περίθαλψη και τις κοινωνικές υπηρεσίες, την αλιεία και την ιχθυοκαλλιέργεια, το 100% των καθυστερούμενων μισθών σχηματίζεται λόγω έλλειψης ιδίων κεφαλαίων μεταξύ των οργανισμών.

Στο συνολικό όγκο των ληξιπρόθεσμων μισθών, το 37% αντιστοιχεί στη μεταποίηση, το 29% στις κατασκευές, το 9% στην παραγωγή και διανομή ηλεκτρικής ενέργειας, αερίου και νερού, 7% στις μεταφορές, 6% στα ορυχεία, 5% στη γεωργία, το κυνήγι και η παροχή υπηρεσιών στις περιοχές αυτές, η υλοτομία.

Όγκος ληξιπρόθεσμων μισθών από 1 Δεκεμβρίου 2015 ανήλθε σε λιγότερο από το 1% του μηνιαίου μισθολογικού ταμείου των εργαζομένων στους παρατηρούμενους τύπους οικονομικής δραστηριότητας.

Καθυστερήσεις μισθών για τον τελευταίο μήνα, για τα οποία έγιναν δεδουλευμένα, στο συνολικό όγκο των ληξιπρόθεσμων οφειλών ανήλθε κατά μέσο όρο στο 29%: παραγωγή και διανομή ηλεκτρικής ενέργειας, αερίου και νερού - 75%, δραστηριότητες στον τομέα της εκπαίδευσης - 37%, υγειονομικής περίθαλψης και παροχής κοινωνικές υπηρεσίες - 35%, επιστημονική έρευνα και ανάπτυξη - 32%, κατασκευές - 29%, μεταφορές - 23%, μεταποίηση - 22%.

Από το συνολικό ποσό των μη καταβληθέντων μισθών, τα χρέη που προέκυψαν το 2014 αντιστοιχούσαν σε 457 εκατομμύρια ρούβλια (11,7%), το 2013. και νωρίτερα - 657 εκατομμύρια ρούβλια (16,8%).

Γενικά, παρατηρώντας την εικόνα των καθυστερήσεων μισθών στη δυναμική (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), μπορούμε να συμπεράνουμε ότι μια σημαντική μείωση θα πραγματοποιηθούν τον Ιανουάριο, Φεβρουάριο 2016.

Το κύριο ποσοστό του χρέους πέφτει στη μεταποίηση - 37%, 29% - στις κατασκευές, πιθανότατα αυτό οφείλεται στη μείωση της ζήτησης των καταναλωτών για προϊόντα και τα κέρδη μειώνονται ανάλογα.

Ας υποβάλουμε μια υπόθεση. Από τον Ιανουάριο του 2016, το ποσοστό του χρέους θα μειωθεί, λόγω της κατανομής του ετήσιου προϋπολογισμού για το επόμενο έτος, λαμβάνοντας υπόψη τη μερική αποπληρωμή των ληξιπρόθεσμων μισθών, και θα ανέλθει σε 2.700 εκατ.

Για να ελέγξουμε την υπόθεση (Λαμβάνουμε ως βάση αυτόν τον πίνακα http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Ας κατασκευάσουμε μια διακριτή σειρά παραλλαγών. Για να γίνει αυτό, ταξινομούμε τη σειρά σε αύξουσα σειρά και μετράμε τον αριθμό των επαναλήψεων για κάθε στοιχείο της σειράς.

Ας υπολογίσουμε τον μέσο όρο:

Ας υπολογίσουμε τη διακύμανση. Διασπορά - χαρακτηρίζει το μέτρο της διασποράς γύρω από τη μέση τιμή του (ένα μέτρο διασποράς, δηλ. απόκλιση από το μέσο όρο).

Χρησιμοποιώντας ένα μονόπλευρο τεστ με b = 0,05, ελέγξτε αυτήν την υπόθεση εάν σε ένα δείγμα n = 24 μηνών ο μέσος όρος ήταν ίσος με 2741,25 και η διακύμανση ήταν γνωστή και ίση με y = 193469,27

Λύση. Τυπική απόκλιση:

Προβάλλεται η μηδενική υπόθεση H 0 ότι η τιμή της μαθηματικής προσδοκίας του γενικού πληθυσμού είναι ίση με τον αριθμό m 0: = 2700.

Εναλλακτική υπόθεση:

H 1: m; 2700, κρίσιμη περιοχή - διπλής όψης.

Για να ελεγχθεί η μηδενική υπόθεση, χρησιμοποιείται μια τυχαία μεταβλητή:

όπου x είναι ο μέσος όρος του δείγματος. S είναι η τυπική απόκλιση του πληθυσμού.

Εάν η μηδενική υπόθεση είναι αληθής, τότε η τυχαία μεταβλητή T έχει τυπική κανονική κατανομή. Η κρίσιμη τιμή της στατιστικής Τ προσδιορίζεται με βάση τον τύπο της εναλλακτικής υπόθεσης:

Ρ(|Τ|

Ας βρούμε την πειραματική τιμή της στατιστικής Τ:

Δεδομένου ότι το μέγεθος του δείγματος είναι αρκετά μεγάλο (n>30), αντί για την πραγματική τιμή της τυπικής απόκλισης, μπορείτε να χρησιμοποιήσετε την εκτίμησή του S = 439,851.

F(t cr)=(1-b)/2 = (1-0,05)/2 = 0,475.

Χρησιμοποιώντας τον πίνακα συναρτήσεων Laplace, θα βρούμε σε τι t kp την τιμή Ф(t kp) = 0,475.

Η πειραματική τιμή του κριτηρίου Τ δεν εμπίπτει στην κρίσιμη περιοχή T? t kp , επομένως η μηδενική υπόθεση πρέπει να γίνει αποδεκτή. Η τιμή της μαθηματικής προσδοκίας του γενικού πληθυσμού μπορεί να ληφθεί ίση με 2700

Βιβλιογραφία

1. Kazantsev S.Ya. Νομικές στατιστικές: Σχολικό βιβλίο / Εκδ. S.Ya. Kazantseva, S.Ya. Lebedeva - M.: UNITY-DANA: Law and Law, 2009.

2. Kurys?v Κ.Ν. Βασικές αρχές της νομικής στατιστικής: εγχειρίδιο. επίδομα / Κ.Ν. Kurys?v; VUI FSIN της Ρωσίας. - Vladimir, 2005. - 44 σελ.

3. Makarova N.V. Στατιστικά στο Excel: σχολικό βιβλίο. επίδομα / N.V. Makarova, V.Ya. Τροφιμέτς. - Μ.: Οικονομικά και Στατιστική.

4. Kondratyuk L.V., Ovchinsky V.S. Εγκληματολογική μέτρηση /επιμ. Κ.Κ. Γκοργιάνοφ. - Μ.: Νόρμα, 2008.

5. Yakovlev V.B. Στατιστική. Υπολογισμοί στο Microsoft Excel: σχολικό βιβλίο. Εγχειρίδιο για πανεπιστήμια / V.B. Γιακόβλεφ. - Μ.: Κολοσσός, 2005. - 352 σελ.

Δημοσιεύτηκε στο Allbest.ru

...

Παρόμοια έγγραφα

    Μελέτη της νεανικής παραβατικότητας από τη σκοπιά του αντικειμένου της εγκληματολογικής έρευνας. Η σχέση μεταξύ του εφηβικού αλκοολισμού, της κατάχρησης ουσιών, του εθισμού στα ναρκωτικά και του εγκλήματος. Αιτίες και προϋποθέσεις και τρόποι πρόληψης της νεανικής παραβατικότητας.

    εργασία μαθήματος, προστέθηκε 04/08/2011

    Μεθοδολογία συγκεκριμένης εγκληματολογικής έρευνας. Εγκληματολογικά χαρακτηριστικά του βίαιου εγκλήματος και η πρόληψή του. Ο κοινωνικός κίνδυνος και η σοβαρότητα των συνεπειών των βίαιων εγκλημάτων. Στατιστικά εγκληματικότητας.

    δοκιμή, προστέθηκε στις 15/01/2011

    Φόρμουλα για τον υπολογισμό του ποσοστού εγκληματικότητας. Υπολογισμός του μέσου ετήσιου φόρτου εργασίας ανά δικαστή, η μέση περίοδος διερεύνησης ποινικών υποθέσεων, ο μέσος ετήσιος ρυθμός αύξησης της εγκληματικότητας. Υπολογισμός των δεικτών λειτουργίας, διάμεσου, διακύμανσης και τυπικής απόκλισης.

    δοκιμή, προστέθηκε στις 20/04/2011

    Μελετώντας τα βασικά του επίκτητου εγκλήματος: έννοια, στοιχεία, αντικείμενα και υποκειμενικές πτυχές. Περιγραφή κοινωνικής και ειδικής εγκληματολογικής πρόληψης του εγκλήματος για ιδιοτελείς λόγους. Ανάπτυξη δέσμης μέτρων για την πρόληψη εγκλημάτων.

    διατριβή, προστέθηκε 11/09/2012

    Η έννοια και το αντικείμενο της εγκληματολογικής πρόβλεψης. Καθιέρωση πιθανών αλλαγών στην κατάσταση, το επίπεδο, τη δομή και τη δυναμική της εγκληματικότητας στο μέλλον. Αξιολόγηση της εξέλιξης του εγκλήματος στο μέλλον. Σχεδιασμός καταπολέμησης του εγκλήματος, πρόληψή του.

    εργασία μαθήματος, προστέθηκε 29/05/2015

    Μελέτη ειδών εγκληματολογικής πρόβλεψης και σχεδιασμού στον τομέα του εγκλήματος. Χαρακτηριστικά της πρόβλεψης της νεανικής παραβατικότητας στη Δημοκρατία του Καζακστάν. Ανάπτυξη προγραμμάτων για την καταπολέμηση της εγκληματικότητας σε εθνικό επίπεδο.

    διατριβή, προστέθηκε 25/10/2015

    Η νεανική εγκληματικότητα ως αντικείμενο εγκληματολογικής έρευνας. Βασικά εγκληματολογικά χαρακτηριστικά της νεανικής παραβατικότητας. Κατάσταση εγκληματικότητας. Χαρακτηριστικά των προσωπικών χαρακτηριστικών των ανηλίκων.

    περίληψη, προστέθηκε 04/01/2003

    Τάσεις στην εγκληματική συμπεριφορά των σύγχρονων γυναικών: ανάπτυξη και σταθερό μερίδιο σοβαρών και επαναλαμβανόμενων εγκλημάτων, αναζωογόνηση εγκληματιών και αύξηση του αριθμού των ηλικιωμένων γυναικών μεταξύ των καταδίκων. Γενικά μέτρα για την πρόληψη του γυναικείου εγκλήματος.

    περίληψη, προστέθηκε 03/01/2014

    Υπολογισμός σχετικών δεικτών δομής και συντονισμού κατηγοριών καταδίκων ανάλογα με τη βαρύτητα των εγκλημάτων που διαπράχθηκαν. Ποσοστά εγκληματικότητας και ποινικά μητρώα για ομοσπονδιακές περιφέρειες και για τη Ρωσία συνολικά. Υπολογισμός δεικτών δυναμικής με χρήση MS Excel.

    δοκιμή, προστέθηκε 31/07/2011

    Έννοια, είδη, έννοιες, καθοριστικοί παράγοντες του λανθάνοντος εγκλήματος, αιτίες εμφάνισής του, μέθοδοι πρόληψης και μείωσης. Προσδιορισμός του επιπέδου και ανάλυση της εγκληματικής δομής. Μια συστηματική προσέγγιση στη μελέτη του λανθάνοντος εγκλήματος ως κοινωνικού φαινομένου.

Εκθεση ΙΔΕΩΝ

Μέσες τιμές και δείκτες διακύμανσης

1. Η ουσία των μέσων όρων στις στατιστικές

2. Τύποι μέσων τιμών και μέθοδοι υπολογισμού τους

3. Κύριοι δείκτες διακύμανσης και η σημασία τους στις στατιστικές

1. Η ουσία των μεσαίων βαρώνμεταμφιέσεις στα στατιστικά στοιχεία

Στη διαδικασία μελέτης των μαζικών κοινωνικοοικονομικών φαινομένων, προκύπτει η ανάγκη προσδιορισμού των γενικών ιδιοτήτων, των τυπικών μεγεθών και των χαρακτηριστικών τους. Η ανάγκη για γενικευμένο μέσο δείκτη προκύπτει όταν τα χαρακτηριστικά που χαρακτηρίζουν τις μονάδες του υπό μελέτη πληθυσμού ποικίλλουν ποσοτικά. Για παράδειγμα, το μέγεθος της ημερήσιας παραγωγής των υφαντών σε ένα εργοστάσιο κλωστοϋφαντουργίας εξαρτάται από τις γενικές συνθήκες παραγωγής· οι υφαντουργοί χρησιμοποιούν τις ίδιες πρώτες ύλες, εργάζονται στις ίδιες μηχανές κ.λπ. Ταυτόχρονα, η ωριαία παραγωγή μεμονωμένων υφαντών κυμαίνεται, δηλ. ποικίλλει, καθώς εξαρτάται από τα επιμέρους χαρακτηριστικά του κάθε υφαντή (τα προσόντα του, την επαγγελματική του εμπειρία κ.λπ.). Προκειμένου να χαρακτηριστεί η ημερήσια παραγωγή όλων των υφαντών της επιχείρησης, είναι απαραίτητο να υπολογιστεί η μέση τιμή της ημερήσιας παραγωγής, καθώς μόνο αυτός ο δείκτης θα αντικατοπτρίζει τις γενικές συνθήκες παραγωγής για τους υφαντές.

Έτσι, ο υπολογισμός των μέσων γενικευμένων δεικτών σημαίνει αφαίρεση (αφαίρεση) από τα χαρακτηριστικά που αντικατοπτρίζονται στην τιμή ενός χαρακτηριστικού σε μεμονωμένες μονάδες και προσδιορισμό τυπικών χαρακτηριστικών και ιδιοτήτων κοινών σε ένα δεδομένο σύνολο.

Έτσι, η μέση τιμή στις στατιστικές είναι ένα γενικευμένο, ποσοτικό χαρακτηριστικό ενός χαρακτηριστικού και ενός στατιστικού πληθυσμού. Εκφράζει τη χαρακτηριστική, τυπική αξία ενός χαρακτηριστικού σε μονάδες πληθυσμού που σχηματίζεται σε δεδομένες συνθήκες τόπου και χρόνου υπό την επίδραση ολόκληρου του συνόλου παραγόντων. Η δράση διαφόρων παραγόντων προκαλεί διακυμάνσεις και διακυμάνσεις του μέσου όρου του χαρακτηριστικού. Η μέση τιμή είναι ένα γενικό μέτρο της δράσης τους, το αποτέλεσμα όλων αυτών των παραγόντων. Η μέση τιμή χαρακτηρίζει τον πληθυσμό σύμφωνα με το χαρακτηριστικό που υπολογίζεται κατά μέσο όρο, αλλά αναφέρεται σε μια μονάδα του πληθυσμού. Για παράδειγμα, η μέση παραγωγή ανά εργαζόμενο μιας δεδομένης επιχείρησης είναι η αναλογία όλης της παραγωγής (για οποιαδήποτε χρονική περίοδο) προς τον συνολικό (μέσο όρο για την ίδια περίοδο) αριθμό των εργαζομένων της. Χαρακτηρίζει την παραγωγικότητα της εργασίας ενός δεδομένου πληθυσμού, αλλά αναφέρεται σε έναν εργαζόμενο. Στη μέση τιμή ενός φαινομένου μάζας, εξαλείφονται μεμονωμένες διαφορές μεταξύ μονάδων ενός στατιστικού πληθυσμού στις τιμές του μέσου όρου χαρακτηριστικού, που προκαλούνται από τυχαίες συνθήκες. Ως αποτέλεσμα αυτής της αμοιβαίας ακύρωσης, μια γενική, φυσική ιδιότητα ενός δεδομένου στατιστικού συνόλου φαινομένων εμφανίζεται στον μέσο όρο. Υπάρχει μια διαλεκτική σύνδεση μεταξύ του μέσου όρου και των επιμέρους τιμών του μέσου όρου χαρακτηριστικού, όπως μεταξύ του γενικού και του ατομικού. Ο μέσος όρος είναι η πιο σημαντική κατηγορία της στατιστικής επιστήμης και η πιο σημαντική μορφή γενικευτικών δεικτών. Πολλά φαινόμενα της κοινωνικής ζωής γίνονται ξεκάθαρα και οριστικά μόνο όταν γενικεύονται, με τη μορφή μέσων τιμών. Αυτά είναι, για παράδειγμα, η προαναφερθείσα παραγωγικότητα της εργασίας, ο συνολικός αριθμός εργαζομένων, οι αγροτικές αποδόσεις κ.λπ. Ο μέσος όρος είναι η πιο σημαντική μέθοδος επιστημονικής γενίκευσης στη στατιστική. Με αυτή την έννοια, μιλούν για τη μέθοδο των μέσων όρων, η οποία χρησιμοποιείται ευρέως στα οικονομικά. Πολλές κατηγορίες οικονομικών επιστημών ορίζονται χρησιμοποιώντας την έννοια του μέσου όρου.

Βασική προϋπόθεση για τη σωστή χρήση της μέσης τιμής είναι η ομοιογένεια του στατιστικού πληθυσμού σύμφωνα με το χαρακτηριστικό που υπολογίζεται κατά μέσο όρο. Ομοιογενής στατιστικός πληθυσμός είναι ένας πληθυσμός στον οποίο τα συστατικά στοιχεία (μονάδες) του είναι παρόμοια μεταξύ τους ως προς τα απαραίτητα χαρακτηριστικά για μια δεδομένη μελέτη και σχετίζονται με τον ίδιο τύπο φαινομένων. Ένας ομοιογενής πληθυσμός, όντας ομοιογενής σε ορισμένα χαρακτηριστικά, μπορεί να είναι ετερογενής σε άλλα. Μόνο στους μέσους όρους για τέτοια συγκεντρωτικά στοιχεία εμφανίζονται συγκεκριμένα χαρακτηριστικά και πρότυπα εξέλιξης του αναλυόμενου φαινομένου. Ο μέσος όρος που υπολογίζεται για έναν ετερογενή στατιστικό πληθυσμό, δηλ. ένα στο οποίο συνδυάζονται ποιοτικά διαφορετικά φαινόμενα χάνει την επιστημονική του σημασία. Τέτοιοι μέσοι όροι είναι πλασματικοί, όχι μόνο δεν δίνουν μια ιδέα της πραγματικότητας, αλλά και τη διαστρεβλώνουν. Για να σχηματιστούν ομοιογενή στατιστικά μεγέθη, πραγματοποιείται η κατάλληλη ομαδοποίηση. Με τη βοήθεια ομαδοποιήσεων και σε έναν ποιοτικά ομοιογενή πληθυσμό, μπορούν να εντοπιστούν ποσοτικά χαρακτηριστικές ομάδες. Για καθένα από αυτά, μπορεί να υπολογιστεί ο δικός του μέσος όρος, που ονομάζεται ομαδικός (συγκεκριμένος) μέσος όρος, σε αντίθεση με τον γενικό μέσο όρο (για τον πληθυσμό συνολικά).

2. Είδη μέσου όρου

Μεγάλη σημασία στη μεθοδολογία των μέσων όρων έχουν τα θέματα επιλογής της μορφής του μέσου όρου, δηλ. τον τύπο με τον οποίο μπορείτε να υπολογίσετε σωστά τη μέση τιμή και την επιλογή των βαρών για τον μέσο όρο. Πιο συχνά χρησιμοποιείται στις στατιστικές αθροιστικός μέσος όρος, αριθμητικός μέσος όρος, αρμονικός μέσος όρος, μέσος όροςγεωμετρικό, μέσο τετράγωνο, τρόπο και διάμεσο.Η χρήση ενός συγκεκριμένου τύπου εξαρτάται από το περιεχόμενο του μέσου όρου χαρακτηριστικού και τα συγκεκριμένα δεδομένα από τα οποία πρέπει να υπολογιστεί. Για να επιλέξετε το μέσο σχήμα, μπορείτε να χρησιμοποιήσετε τη λεγόμενη μέση αρχική αναλογία.

2.1 Αριθμητικός μέσος όρος

Ο αριθμητικός μέσος όρος είναι μια από τις πιο κοινές μορφές μέσου όρου. Ο αριθμητικός μέσος όρος υπολογίζεται ως το πηλίκο της διαίρεσης του αθροίσματος των επιμέρους τιμών (επιλογών) των μεταβλητών υπογράψτε στον αριθμό τους.Ο αριθμητικός μέσος όρος χρησιμοποιείται σε περιπτώσεις όπου ο όγκος ενός μεταβαλλόμενου χαρακτηριστικού φαινομένων σε έναν ομοιογενή στατιστικό πληθυσμό σχηματίζεται αθροίζοντας τις τιμές των χαρακτηριστικών όλων των μονάδων φαινομένων στον στατιστικό πληθυσμό. Διακρίνονται οι ακόλουθες αριθμητικές μέσες τιμές:

1) Απλός αριθμητικός μέσος όρος, το οποίο προσδιορίζεται απλά αθροίζοντας τις ποσοτικές τιμές των κυμαινόμενων χαρακτηριστικών και διαιρώντας αυτό το ποσό στις επιλογές τους και υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

X είναι η μέση τιμή του στατιστικού πληθυσμού,

x i - το άθροισμα των επιμέρους ποικίλων παραλλαγών των φαινομένων του στατιστικού πληθυσμού,

n i είναι ο αριθμός των μεταβαλλόμενων παραλλαγών των φαινομένων ενός στατιστικού πληθυσμού.

2) Αριθμητικός μέσος σταθμισμένος- η μέση τιμή του πρόσημου του φαινομένου, που υπολογίζεται λαμβάνοντας υπόψη τα βάρη. Τα βάρη των μέσων τιμών είναι οι συχνότητες με τις οποίες λαμβάνονται υπόψη μεμονωμένες τιμές του χαρακτηριστικού που υπολογίζεται κατά τον υπολογισμό της μέσης τιμής του. Η επιλογή των μέσων βαρών εξαρτάται από τη φύση του χαρακτηριστικού που υπολογίζεται κατά μέσο όρο και τη φύση των διαθέσιμων δεδομένων για τον υπολογισμό των μέσων τιμών. Ως βάρη των μέσων τιμών, μπορούν να υπάρχουν δείκτες του αριθμού των μονάδων ή των μεγεθών των τμημάτων ενός στατιστικού πληθυσμού (με τη μορφή απόλυτων ή σχετικών τιμών) που έχουν μια δεδομένη παραλλαγή (τιμή) του μέσου όρου χαρακτηριστικού του φαινομένου του στατιστικό πληθυσμό, καθώς και την τιμή του δείκτη που σχετίζεται με το μέσο όρο χαρακτηριστικό. Ο σταθμισμένος αριθμητικός μέσος όρος υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

X - σταθμισμένος αριθμητικός μέσος όρος,

x είναι η τιμή των επιμέρους μεταβλητών παραλλαγών των φαινομένων του στατιστικού πληθυσμού,

Ο σκοπός ενός απλού και σταθμισμένου αριθμητικού μέσου όρου είναι να προσδιορίσει τη μέση τιμή ενός μεταβαλλόμενου χαρακτηριστικού. Εάν στον υπό μελέτη στατιστικό πληθυσμό οι παραλλαγές των τιμών ενός χαρακτηριστικού εμφανίζονται μία φορά ή έχουν το ίδιο βάρος, τότε χρησιμοποιείται ένας απλός αριθμητικός μέσος όρος, αλλά εάν οι παραλλαγές των τιμών ενός δεδομένου χαρακτηριστικού εμφανίζονται στον υπό μελέτη πληθυσμό πολλές φορές ή έχουν διαφορετικά βάρη, ο αριθμητικός μέσος όρος χρησιμοποιείται για τον προσδιορισμό της μέσης τιμής του ποικίλου σταθμισμένου χαρακτηριστικού.

2.2 Αρμονική μέση

Ο αρμονικός μέσος όρος χρησιμοποιείται για τον υπολογισμό της μέσης τιμής όταν δεν υπάρχουν άμεσα δεδομένα για τα βάρη, αλλά οι παραλλαγές του χαρακτηριστικού υπολογίζονται κατά μέσο όρο (x) και το γινόμενο των τιμών των παραλλαγών με τον αριθμό των μονάδων με δεδομένο Η τιμή w (w = xf) είναι γνωστή.

Αυτός ο μέσος όρος υπολογίζεται χρησιμοποιώντας τους ακόλουθους τύπους:

1.) Μέση αρμονική απλή:

X - σημαίνει αρμονική απλή,

n είναι ο αριθμός των μεταβαλλόμενων παραλλαγών των φαινομένων ενός στατιστικού πληθυσμού.

2) Αρμονική μέση σταθμισμένη:

X - αρμονικός σταθμισμένος μέσος όρος,

x είναι το άθροισμα των επιμέρους μεταβλητών παραλλαγών των φαινομένων ενός στατιστικού πληθυσμού,

Όταν χρησιμοποιείται το αρμονικό σταθμισμένο, τα βάρη προσδιορίζονται και έτσι προκύπτει το ίδιο αποτέλεσμα που θα έδινε ο υπολογισμός χρησιμοποιώντας τον αριθμητικό σταθμισμένο μέσο όρο εάν ήταν γνωστά όλα τα απαραίτητα δεδομένα.

2.3 Μέσο άθροισμα

Το μέσο άθροισμα υπολογίζεται χρησιμοποιώντας τον τύπο:

X - μέσο άθροισμα,

x είναι το άθροισμα των επιμέρους μεταβλητών παραλλαγών των φαινομένων ενός στατιστικού πληθυσμού,

Το μέσο άθροισμα υπολογίζεται σε περιπτώσεις όπου είναι γνωστές (διαθέσιμες) οι τιμές του αριθμητή και του παρονομαστή της αρχικής αναλογίας του μέσου όρου.

2.4 Γεωμετρικός μέσος όρος

Ο γεωμετρικός μέσος όρος είναι μία από τις μορφές της μέσης τιμής και υπολογίζεται ως η ντη ρίζα του γινομένου μεμονωμένων τιμών - παραλλαγών του χαρακτηριστικού (x) και καθορίζεται από τον ακόλουθο τύπο:

Ο γεωμετρικός μέσος όρος χρησιμοποιείται κυρίως για τον υπολογισμό των μέσων ρυθμών ανάπτυξης.

2.5 Λειτουργία και διάμεσος

Μαζί με τους μέσους όρους που συζητήθηκαν παραπάνω, τα λεγόμενα δομικά μέσα - τρόπος και διάμεσος.

Ο τρόπος λειτουργίας (Mo) είναι η πιο συχνά εμφανιζόμενη τιμή ενός χαρακτηριστικού μεταξύ των πληθυσμιακών μονάδων. Για διακριτές σειρές, αυτή η επιλογή έχει την υψηλότερη συχνότητα.

Στις σειρές παραλλαγής διαστήματος, είναι δυνατό να προσδιοριστεί, πρώτα απ 'όλα, το διάστημα στο οποίο βρίσκεται η λειτουργία, δηλ. το λεγόμενο τροπικό διάστημα. Σε μια σειρά παραλλαγών με ίσα διαστήματα, το τροπικό διάστημα καθορίζεται από την υψηλότερη συχνότητα, σε σειρές με άνισα διαστήματα από την υψηλότερη πυκνότητα κατανομής.

Για να προσδιορίσετε τη λειτουργία σε σειρές με ίσα διαστήματα, χρησιμοποιήστε τον ακόλουθο τύπο:

Xn - κατώτερο όριο του τροπικού διαστήματος,

h - μέγεθος διαστήματος,

f 1 , f 2 , f 3 - συχνότητες (ή λεπτομέρειες) προτροπικών, τροπικών και μετατροπικών διαστημάτων, αντίστοιχα.

Σε μια σειρά διαστημάτων, η λειτουργία μπορεί να βρεθεί γραφικά. Για να το κάνετε αυτό, σχεδιάστε δύο γραμμές στην υψηλότερη στήλη του ιστογράμματος από τα όρια δύο γειτονικών στηλών. Στη συνέχεια, από το σημείο τομής τους, μια κάθετη κατεβαίνει στον άξονα της τετμημένης. Η τιμή του χαρακτηριστικού στον άξονα x που αντιστοιχεί στην κάθετο θα είναι η λειτουργία.

Σε πολλές περιπτώσεις, όταν χαρακτηρίζεται ένας πληθυσμός ως γενικευμένος δείκτης, προτιμάται ο τρόπος και όχι ο αριθμητικός μέσος όρος.

Έτσι, κατά τη μελέτη των τιμών στην αγορά, δεν καταγράφεται και μελετάται σε δυναμική η μέση τιμή για ορισμένα προϊόντα, αλλά η μέση τιμή. Κατά τη μελέτη της ζήτησης του πληθυσμού για ένα συγκεκριμένο μέγεθος παπουτσιών ή ρούχων, είναι ενδιαφέρον να προσδιοριστεί το τροπικό μέγεθος των παπουτσιών και το μέσο μέγεθος αυτό καθαυτό δεν έχει καμία σημασία εδώ. Η μόδα δεν έχει μόνο ανεξάρτητο ενδιαφέρον, αλλά παίζει και τον ρόλο ενός βοηθητικού δείκτη για τον μέσο όρο, χαρακτηρίζοντας την τυπικότητά του. Εάν ο αριθμητικός μέσος όρος είναι κοντά στην τιμή του τρόπου λειτουργίας, τότε είναι τυπικός.

Η διάμεσος (Me) είναι η τιμή του χαρακτηριστικού της μεσαίας μονάδας της σειράς κατάταξης. (Η κατάταξη είναι μια σειρά στην οποία οι χαρακτηριστικές τιμές γράφονται με αύξουσα ή φθίνουσα σειρά.)

Για να βρείτε τη διάμεσο, προσδιορίστε πρώτα τον τακτικό της αριθμό. Για να γίνει αυτό, εάν ο αριθμός των μονάδων είναι περιττός, προστίθεται μία στο άθροισμα όλων των συχνοτήτων και όλα διαιρούνται με δύο. Με ζυγό αριθμό μονάδων στη σειρά θα υπάρχουν δύο μεσαίες μονάδες και σύμφωνα με όλους τους κανόνες η διάμεσος θα πρέπει να ορίζεται ως ο μέσος όρος των τιμών αυτών των δύο μονάδων. Στην περίπτωση αυτή, πρακτικά με ζυγό αριθμό μονάδων, η διάμεσος βρίσκεται ως η τιμή του χαρακτηριστικού μιας μονάδας, ο σειριακός αριθμός της οποίας καθορίζεται από το συνολικό άθροισμα των συχνοτήτων διαιρούμενο με δύο. Γνωρίζοντας τον σειριακό αριθμό της διάμεσης, είναι εύκολο να βρείτε την τιμή του χρησιμοποιώντας τις συσσωρευμένες συχνότητες.

Στις σειρές διαστήματος, αφού προσδιοριστεί ο σειριακός αριθμός της διάμεσης με αθροιστικές συχνότητες (ιδιαίτερες), βρίσκεται το διάμεσο διάστημα και στη συνέχεια, χρησιμοποιώντας την απλούστερη τεχνική παρεμβολής, προσδιορίζεται η τιμή της ίδιας της διάμεσης. Αυτός ο υπολογισμός εκφράζεται με τον ακόλουθο τύπο:

X n - κατώτερο όριο του διάμεσου διαστήματος,

h - η τιμή του διάμεσου διαστήματος,

Τακτικός αριθμός της διάμεσης,

S Me - 1 συχνότητα (συχνότητα) συσσωρευμένη στο διάμεσο διάστημα,

F Me - συχνότητα (ιδιαιτερότητα) του διάμεσου διαστήματος.

Σύμφωνα με τον γραπτό τύπο, στο κατώτερο όριο του διάμεσου διαστήματος προστίθεται μέρος της τιμής του διαστήματος που εμπίπτει στο μερίδιο των μονάδων αυτής της ομάδας που λείπουν από τον αύξοντα αριθμό της διάμεσης τιμής. Με άλλα λόγια, ο υπολογισμός της διάμεσης τιμής βασίζεται στην υπόθεση ότι η αύξηση του χαρακτηριστικού μεταξύ των μονάδων κάθε ομάδας συμβαίνει ομοιόμορφα. Με βάση τα παραπάνω, μπορείτε να υπολογίσετε τη διάμεσο με άλλο τρόπο. Έχοντας καθορίσει το διάμεσο διάστημα, μπορείτε να αφαιρέσετε από το ανώτερο όριο του διαμέσου διαστήματος (Хв) εκείνο το μέρος του διαστήματος που εμπίπτει στο μερίδιο των μονάδων που υπερβαίνουν τον αύξοντα αριθμό της διάμεσης τιμής, δηλ. σύμφωνα με τον ακόλουθο τύπο:

Η διάμεσος μπορεί επίσης να προσδιοριστεί γραφικά. Για να γίνει αυτό, κατασκευάζεται μια σώρευση και από ένα σημείο της κλίμακας των συσσωρευμένων συχνοτήτων (ιδιαίτερων στοιχείων) που αντιστοιχεί στον τακτικό αριθμό της διάμεσης, μια ευθεία γραμμή σχεδιάζεται παράλληλη στον άξονα x έως ότου τέμνεται με τη σώρευση. Στη συνέχεια, από το σημείο τομής της υποδεικνυόμενης γραμμής με το αθροιστικό, μια κάθετη χαμηλώνεται στον άξονα της τετμημένης. Η τιμή του χαρακτηριστικού στον άξονα x που αντιστοιχεί στην σχεδιασμένη τεταγμένη (κάθετη) θα είναι η διάμεσος.

Χρησιμοποιώντας την ίδια αρχή, είναι εύκολο να βρείτε την τιμή ενός χαρακτηριστικού για οποιαδήποτε μονάδα σε μια σειρά κατάταξης.

Έτσι, για τον υπολογισμό της μέσης τιμής μιας σειράς παραλλαγών, μπορεί να χρησιμοποιηθεί ένα ολόκληρο σύνολο δεικτών.

3. Κύριοι δείκτεςκαι τη σημασία τους στη στατιστική

Κατά τη μελέτη ενός ποικίλου χαρακτηριστικού μεταξύ των μονάδων ενός πληθυσμού, δεν μπορεί κανείς να περιοριστεί στον υπολογισμό μόνο της μέσης τιμής από μεμονωμένες παραλλαγές, καθώς ο ίδιος μέσος όρος μπορεί να μην ισχύει για πληθυσμούς της ίδιας σύνθεσης. Αυτό μπορεί να επεξηγηθεί από το ακόλουθο υπό όρους παράδειγμα, που αντικατοπτρίζει δεδομένα σχετικά με τον αριθμό των νοικοκυριών σε γεωργικές εκμεταλλεύσεις σε δύο περιοχές:

Ο μέσος αριθμός νοικοκυριών σε γεωργικές εκμεταλλεύσεις στις δύο περιφέρειες είναι ο ίδιος - 160. Επιπλέον, η σύνθεση αυτών των γεωργικών εκμεταλλεύσεων στις δύο περιφέρειες απέχει πολύ από το ίδιο. Επομένως, υπάρχει ανάγκη να μετρηθεί η διακύμανση ενός χαρακτηριστικού στο σύνολο.

Για το σκοπό αυτό, οι στατιστικές υπολογίζουν έναν αριθμό χαρακτηριστικών, π.χ. δείκτες. Ο πιο βασικός δείκτης διακύμανσης σε ένα χαρακτηριστικό είναι εύρος παραλλαγής R, που είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής ενός χαρακτηριστικού σε μια δεδομένη σειρά παραλλαγών, δηλ. R = Xmax - Xmin. Στο παράδειγμά μας, στην 1η περιοχή R = 300 - 80 - 220, και στη δεύτερη περιοχή R = 180 - 145 = 35.

Ο δείκτης εύρους διακύμανσης δεν ισχύει πάντα, καθώς λαμβάνει υπόψη μόνο τις ακραίες τιμές ενός χαρακτηριστικού, το οποίο μπορεί να είναι πολύ διαφορετικό από όλες τις άλλες μονάδες. Μερικές φορές βρίσκουν την αναλογία του εύρους διακύμανσης προς τον αριθμητικό μέσο όρο και χρησιμοποιούν αυτήν την τιμή, αποκαλώντας την δείκτη ταλαντώσεις.

Είναι δυνατός ο ακριβέστερος προσδιορισμός της διακύμανσης σε μια σειρά χρησιμοποιώντας δείκτες που λαμβάνουν υπόψη τις αποκλίσεις όλων των επιλογών από τον αριθμητικό μέσο όρο. Υπάρχουν δύο τέτοιοι δείκτες στα στατιστικά στοιχεία - γραμμικός μέσος όρος και τυπική απόκλιση.

Μέση γραμμική απόκλισηαντιπροσωπεύει τον αριθμητικό μέσο όρο των απόλυτων τιμών των αποκλίσεων των επιλογών από τον μέσο όρο. Σε αυτή την περίπτωση, τα σημάδια των αποκλίσεων αγνοούνται, διαφορετικά το άθροισμα όλων των αποκλίσεων θα είναι ίσο με μηδέν. Αυτός ο δείκτης υπολογίζεται με τον τύπο:

β) για τη σειρά παραλλαγής:

Θα πρέπει να ληφθεί υπόψη ότι η μέση γραμμική απόκλιση θα είναι ελάχιστη εάν οι αποκλίσεις υπολογίζονται από τη διάμεσο, δηλ. σύμφωνα με τον τύπο:

Τυπική απόκλιση () υπολογίζεται ως εξής - κάθε απόκλιση από τον μέσο όρο τετράγωνεται, όλα τα τετράγωνα αθροίζονται (λαμβάνοντας υπόψη τα βάρη), μετά την οποία το άθροισμα των τετραγώνων διαιρείται με τον αριθμό των όρων της σειράς και η τετραγωνική ρίζα εξάγεται από το πηλίκο.

Όλες αυτές οι ενέργειες εκφράζονται με τους ακόλουθους τύπους:

α) για μη ομαδοποιημένα δεδομένα:

β) για τη σειρά παραλλαγής:

στ, δηλ. Η τυπική απόκλιση είναι η τετραγωνική ρίζα του αριθμητικού μέσου όρου των τετραγώνων των αποκλίσεων του μέσου όρου. Η έκφραση κάτω από τη ρίζα ονομάζεται διακύμανση. Η διασπορά έχει τη δική της έκφραση στα στατιστικά στοιχεία και είναι ένας από τους πιο σημαντικούς δείκτες διακύμανσης.

πού είναι οι μέγιστες και ελάχιστες τιμές του χαρακτηριστικού στο σύνολο, αντίστοιχα.

– αριθμός ομάδων.

Η σειρά διανομής μπορεί να αναπαρασταθεί οπτικά χρησιμοποιώντας τη γραφική τους αναπαράσταση. Για το σκοπό αυτό, κατασκευάζονται ένα πολύγωνο, ένα ιστόγραμμα, μια αθροιστική καμπύλη και μια ώθηση.

ΘΕΜΑ 4.Απόλυτες και σχετικές αξίες

Η έννοια του στατιστικού δείκτη και τα είδη του

Στατιστικός δείκτης– αυτό είναι ένα ποσοτικό και ποιοτικό γενικευτικό χαρακτηριστικό κάποιας ιδιότητας μιας ομάδας μονάδων ή του πληθυσμού συνολικά υπό συγκεκριμένες συνθήκες τόπου και χρόνου. Σε αντίθεση με ένα χαρακτηριστικό, ένας στατιστικός δείκτης λαμβάνεται με υπολογισμό. Αυτό μπορεί να είναι μια απλή καταμέτρηση των μονάδων πληθυσμού, η άθροιση των τιμών ενός χαρακτηριστικού, η σύγκριση δύο ή περισσότερων ποσοτήτων ή πιο σύνθετες συγκρίσεις.

1. Με βάση την κάλυψη των πληθυσμιακών μονάδων, οι στατιστικοί δείκτες χωρίζονται:


2. Σύμφωνα με τη μέθοδο υπολογισμού, οι στατιστικοί δείκτες χωρίζονται:

3. Σύμφωνα με τον χωρικό ορισμό, οι στατιστικοί δείκτες χωρίζονται:


Σύμφωνα με τη μορφή έκφρασης, οι στατιστικοί δείκτες χωρίζονται:

Απόλυτες αξίες

Απόλυτη τιμή (δείκτης)είναι ένας αριθμός που εκφράζει το μέγεθος, τον όγκο ενός φαινομένου σε συγκεκριμένες συνθήκες τόπου και χρόνου. Οι απόλυτες ποσότητες ονομάζονται πάντα ποσότητες, δηλαδή έχουν κάποιο είδος μονάδας μέτρησης. Ανάλογα με την επιλεγμένη μονάδα μέτρησης, διακρίνονται τα ακόλουθα: τύποι απόλυτων τιμών:

1. Φυσικός– χαρακτηρίζουν τον όγκο και το μέγεθος ενός φαινομένου ως προς το μήκος, το βάρος, τον όγκο, τον αριθμό των μονάδων, τον αριθμό των γεγονότων. Οι φυσικοί δείκτες χρησιμοποιούνται για τον χαρακτηρισμό του όγκου και του μεγέθους μεμονωμένων τύπων προϊόντων με το ίδιο όνομα και επομένως η χρήση τους είναι περιορισμένη.

2. Υπό όρους φυσικό– χρησιμοποιούνται εάν είναι απαραίτητο να μετατραπούν διαφορετικοί τύποι προϊόντων, αλλά της ίδιας αξίας, σε έναν δείκτη υπό όρους. Ο υπό όρους φυσικός δείκτης υπολογίζεται πολλαπλασιάζοντας τον φυσικό δείκτη με τον συντελεστή μετατροπής. Οι συντελεστές μετατροπής λαμβάνονται από βιβλία αναφοράς ή υπολογίζονται ανεξάρτητα. Οι υπό όρους φυσικοί δείκτες χρησιμοποιούνται για τον χαρακτηρισμό του όγκου και του μεγέθους των ομοιογενών προϊόντων και επομένως η χρήση τους είναι περιορισμένη.

3. Εργασία– έχουν τέτοιες μονάδες μέτρησης όπως ανθρωποώρα, ανθρωποημέρα. Χρησιμοποιείται για τον προσδιορισμό του κόστους του χρόνου εργασίας, για τον υπολογισμό των μισθών και της παραγωγικότητας της εργασίας.

4. Κόστος(καθολική) μετρώνται στις νομισματικές μονάδες της αντίστοιχης χώρας. Δείκτες κόστους = ποσότητα προϊόντων σε φυσικούς όρους * τιμή μονάδας. Οι δείκτες κόστους είναι καθολικοί, καθώς σας επιτρέπουν να προσδιορίσετε τον όγκο και το μέγεθος διαφορετικών τύπων προϊόντων.

Μειονεκτήματα των απόλυτων δεικτών: είναι αδύνατο να χαρακτηριστούν τα ποιοτικά χαρακτηριστικά και η δομή του φαινομένου που μελετάται· για αυτό, χρησιμοποιούνται σχετικοί δείκτες, οι οποίοι υπολογίζονται με βάση απόλυτους δείκτες.

Σχετικές αξίες

Σχετικός δείκτηςείναι ένας δείκτης που αντιπροσωπεύει το πηλίκο της διαίρεσης ενός απόλυτου δείκτη με έναν άλλο και δίνει ένα αριθμητικό μέτρο της σχέσης μεταξύ τους.


Ανώνυμος Ο.Π.

1. Ο συντελεστής προκύπτει εάν η βάση σύγκρισης είναι ίση με 1. Εάν ο συντελεστής είναι μεγαλύτερος από 1, τότε δείχνει πόσες φορές η συγκριτική τιμή είναι μεγαλύτερη από τη βάση σύγκρισης. Εάν ο συντελεστής είναι μικρότερος από 1, τότε δείχνει ποιο μέρος της βάσης σύγκρισης είναι η συγκριτική τιμή.

2. Το ποσοστό θα ληφθεί εάν η βάση σύγκρισης είναι 100. Το ποσοστό προκύπτει πολλαπλασιάζοντας τον συντελεστή επί 100.

3. Permille (‰) – εάν η βάση σύγκρισης είναι 1000. Λαμβάνεται πολλαπλασιάζοντας τον συντελεστή επί 1000. Το Permille χρησιμοποιείται για την αποφυγή κλασματικών τιμών των δεικτών. Χρησιμοποιούνται ευρέως στις δημογραφικές στατιστικές, όπου τα ποσοστά θνησιμότητας, γονιμότητας και γάμου καθορίζονται ανά 1000 άτομα.

4. Prodecimille (‰0) αν η βάση σύγκρισης είναι 10.000. Λαμβάνεται πολλαπλασιάζοντας τον συντελεστή επί 10.000. Για παράδειγμα, πόσοι γιατροί και νοσοκομειακές κλίνες υπάρχουν ανά 10.000 άτομα.

Τύποι σχετικών τιμών (δείκτες):

1. Δείκτης σχετικής δομής:

Αυτός ο δείκτης υπολογίζεται από ομαδοποιημένα δεδομένα και δείχνει το μερίδιο μεμονωμένων τμημάτων στο συνολικό όγκο του πληθυσμού. Μπορεί να εκφραστεί με τη μορφή συντελεστή (μερίδιο) ή ποσοστού (βάρος). Παράδειγμα, 0,4 είναι το μερίδιο, 40% το ειδικό βάρος. Το άθροισμα όλων των μετοχών είναι 1 και το ειδικό βάρος είναι 100%.

2. Δείκτης σχετικής δυναμικής:

.

Αυτός ο δείκτης δείχνει την αλλαγή του φαινομένου με την πάροδο του χρόνου. Εκφράζεται με τη μορφή συντελεστή - ο ρυθμός ανάπτυξης και με τη μορφή ποσοστού - ο ρυθμός ανάπτυξης.

3. Σχετικός δείκτης υλοποίησης του σχεδίου:

Αυτός ο δείκτης δείχνει τον βαθμό υλοποίησης του σχεδίου και εκφράζεται με τη μορφή %.

Σχετικός δείκτης του προγραμματισμένου στόχου:

Αυτός ο δείκτης δείχνει ποια είναι η προγραμματισμένη αλλαγή του δείκτη στο μέλλον σε σύγκριση με την προηγούμενη περίοδο και εκφράζεται με τη μορφή ποσοστού.

Σχέση μεταξύ δεικτών: .

5. Δείκτης σχετικού συντονισμού:

Αυτός ο δείκτης μπορεί να υπολογιστεί για 1, 10, 100 μονάδες και δείχνει πόσες μονάδες ενός μέρους είναι κατά μέσο όρο ανά 1, 10, 100 μονάδες ενός άλλου τμήματος. Για παράδειγμα, ο αριθμός αστικού πληθυσμού ανά 1, 10, 100 κατοίκους του χωριού

6. Δείκτης σχετικής έντασης:

Αυτός ο δείκτης υπολογίζεται συγκρίνοντας διαφορετικούς δείκτες που βρίσκονται σε συγκεκριμένη σχέση μεταξύ τους. Αυτός ο δείκτης μπορεί να υπολογιστεί σε 1, 10, 100 μονάδες και είναι ένας επώνυμος δείκτης. Για παράδειγμα, η πυκνότητα πληθυσμού είναι άνθρωποι/1, 10, 100 km2.

7. Δείκτης σχετικής σύγκρισης:

Αυτός ο δείκτης υπολογίζεται συγκρίνοντας δείκτες με το ίδιο όνομα που σχετίζονται με την ίδια χρονική περίοδο, αλλά με διαφορετικά αντικείμενα ή περιοχές. Εκφράζεται με τη μορφή συντελεστή και ποσοστού.

ΘΕΜΑ 5. Μέσες τιμές και δείκτες διακύμανσης

1. Μέση τιμή: έννοια και τύποι

Μέση αξία -Αυτός είναι ένας γενικός δείκτης που χαρακτηρίζει το τυπικό επίπεδο ενός μεταβαλλόμενου ποσοτικού χαρακτηριστικού ανά μονάδα πληθυσμού υπό ορισμένες συνθήκες τόπου και χρόνου.

Προϋποθέσεις για τον υπολογισμό της μέσης τιμής:

1. Ο πληθυσμός από τον οποίο υπολογίζεται η μέση τιμή πρέπει να είναι αρκετά μεγάλος, διαφορετικά οι τυχαίες αποκλίσεις στην τιμή του χαρακτηριστικού δεν θα ακυρωθούν και ο μέσος όρος δεν θα εμφανίσει τα μοτίβα που είναι εγγενή σε αυτήν τη διαδικασία.

2. Ο πληθυσμός από τον οποίο υπολογίζεται η μέση τιμή πρέπει να είναι ποιοτικά ομοιογενής, διαφορετικά όχι μόνο δεν θα έχουν καμία επιστημονική αξία, αλλά μπορεί επίσης να προκαλέσουν βλάβη παραμορφώνοντας την πραγματική φύση του φαινομένου που μελετάται.

3. Ο συνολικός μέσος όρος πρέπει να συμπληρώνεται με μέσους όρους ομάδας. Ο γενικός μέσος όρος δείχνει το τυπικό μέγεθος ολόκληρου του πληθυσμού και οι μέσοι όροι ομάδων δείχνουν τα επιμέρους μέρη του με συγκεκριμένες ιδιότητες.

4. Για μια ολοκληρωμένη περιγραφή του φαινομένου, πρέπει να υπολογιστεί ένα σύστημα μέσων δεικτών με βάση τα πιο σημαντικά χαρακτηριστικά.

Η μέση τιμή ονομάζεται πάντα· έχει την ίδια διάσταση με το χαρακτηριστικό που υπολογίζεται κατά μέσο όρο.

Τύποι μέσων όρων:

1. Μέσοι όροι ισχύος(αυτοί περιλαμβάνουν αριθμητικό μέσο, ​​αρμονικό μέσο, ​​τετραγωνικό μέσο, ​​γεωμετρικό μέσο όρο).

2. Διαρθρωτικοί μέσοι όροι(τρόπος λειτουργίας και διάμεσος).

Οι μέσοι όροι ισχύος υπολογίζονται χρησιμοποιώντας τον τύπο (ρίζα στην ισχύ R των μέσων όρων όλων των επιλογών που λαμβάνονται σε κάποιο βαθμό):

πού είναι η μέση τιμή ισχύος-νόμου του χαρακτηριστικού που μελετάται;

− ατομική τιμή του μέσου όρου χαρακτηριστικού.

− δείκτης μέσου βαθμού.

− αριθμός χαρακτηριστικών (ενιαίος πληθυσμός).

− ποσό.

Ανάλογα με τον βαθμό, προκύπτουν διαφορετικοί τύποι απλών μέσων όρων.

Εννοια

Όνομα απλού μέσου όρου

απλή αρμονική

όπου P είναι το γινόμενο

απλό γεωμετρικό

απλή αριθμητική

απλό τετραγωνικό

Όσο υψηλότερος είναι ο εκθέτης () στον μέσο όρο ισχύος, τόσο μεγαλύτερη είναι η τιμή του ίδιου του μέσου όρου. Αν υπολογίσουμε όλους αυτούς τους μέσους όρους χρησιμοποιώντας τα ίδια δεδομένα, παίρνουμε την ακόλουθη αναλογία:

Αυτή η ιδιότητα του μέσου όρου ισχύος να αυξάνεται με την αύξηση του εκθέτη της καθοριστικής συνάρτησης ονομάζεται κανόνας της πλειοψηφίας των μέσων.

Από αυτούς τους τύπους μέσων όρων, οι πιο συχνά χρησιμοποιούμενοι είναι ο αριθμητικός μέσος και ο αρμονικός μέσος όρος. Η επιλογή του τύπου μέσου όρου εξαρτάται από τις αρχικές πληροφορίες.

Αριθμητικός μέσος όρος: μέθοδοι υπολογισμού και οι ιδιότητές του

Ο αριθμητικός μέσος όρος είναι το πηλίκο διαίρεσης του αθροίσματος των επιμέρους τιμών ενός χαρακτηριστικού όλων των μονάδων του πληθυσμού με τον αριθμό των μονάδων του πληθυσμού.

Ο αριθμητικός μέσος όρος χρησιμοποιείται με τη μορφή απλού μέσου όρου και σταθμισμένου μέσου όρου. Απλός αριθμητικός μέσος όροςυπολογίζεται με τον τύπο:

πού είναι η μέση τιμή του χαρακτηριστικού?

− μεμονωμένες τιμές χαρακτηριστικών (επιλογές).

− αριθμός πληθυσμιακών μονάδων (επιλογή).

Ο απλός αριθμητικός μέσος όρος χρησιμοποιείται σε δύο περιπτώσεις:

· όταν κάθε επιλογή εμφανίζεται μόνο μία φορά στη σειρά διανομής.

· όταν όλες οι συχνότητες είναι ίσες μεταξύ τους.

Αριθμητικός μέσος όρος σταθμισμένοςχρησιμοποιείται όταν οι συχνότητες δεν είναι ίσες μεταξύ τους:

Οπου − συχνότητες ή βάρη (αριθμοί που δείχνουν πόσο

φορές που εμφανίζονται μεμονωμένες αξίες

σημάδι).

Ιδιότητες του αριθμητικού μέσου όρου(χωρίς αποδείξεις):

1. Η μέση τιμή μιας σταθερής τιμής ισούται με τον εαυτό της: .

2. Το γινόμενο της μέσης τιμής με το άθροισμα των συχνοτήτων ισούται με το άθροισμα του γινόμενου των δικαιωμάτων κατά τις συχνότητές τους: .

3. Εάν κάθε επιλογή αυξηθεί ή μειωθεί κατά το ίδιο ποσό, τότε η μέση τιμή θα αυξηθεί ή θα μειωθεί κατά το ίδιο ποσό: .

4. Εάν κάθε επιλογή αυξηθεί ή μειωθεί κατά τον ίδιο αριθμό φορές, τότε η μέση τιμή θα αυξηθεί ή θα μειωθεί κατά τον ίδιο αριθμό φορών: .

5. Εάν όλες οι συχνότητες αυξηθούν ή μειωθούν κατά τον ίδιο αριθμό φορές, η μέση τιμή δεν θα αλλάξει: .

6. Η μέση τιμή του αθροίσματος ισούται με το άθροισμα των μέσων τιμών: .

7. Το άθροισμα των αποκλίσεων όλων των τιμών των χαρακτηριστικών από τη μέση τιμή στο μηδέν.

3. Μέθοδοι υπολογισμού του αρμονικού μέσου όρου

Σε ορισμένες περιπτώσεις, η φύση των δεδομένων πηγής είναι τέτοια που ο υπολογισμός του αριθμητικού μέσου όρου χάνει το νόημά του και ο μόνος γενικευμένος δείκτης μπορεί να είναι ο αρμονικός μέσος όρος.

Τύποι αρμονικών μέσων:

1. Μέση αρμονική απλήυπολογίζεται με τον τύπο:

Ο απλός αρμονικός μέσος όρος χρησιμοποιείται πολύ σπάνια, μόνο για τον υπολογισμό του μέσου χρόνου που δαπανάται για την παραγωγή μιας μονάδας προϊόντος, υπό την προϋπόθεση ότι οι συχνότητες όλων των επιλογών είναι ίσες.

2. Αρμονική μέση σταθμισμένηυπολογίζεται με τον τύπο:

.

πού βρίσκεται όλος ο όγκος του φαινομένου.

Ο σταθμισμένος αρμονικός μέσος όρος χρησιμοποιείται εάν είναι γνωστός ολόκληρος ο όγκος του φαινομένου, αλλά οι συχνότητες δεν είναι γνωστές. Αυτή η αρμονική χρησιμοποιείται για τον υπολογισμό δεικτών μέσης ποιότητας: μέσος μισθός, μέση τιμή, μέσο κόστος, μέση απόδοση, μέση παραγωγικότητα εργασίας.

4. Διαρθρωτικοί μέσοι όροι: τρόπος λειτουργίας και διάμεσος

Οι δομικοί μέσοι όροι (τρόπος λειτουργίας, διάμεσος) χρησιμοποιούνται για τη μελέτη της εσωτερικής δομής και δομής της σειράς κατανομής τιμών χαρακτηριστικών.

Μόδα− η πιο κοινή τιμή του χαρακτηριστικού μεταξύ των μονάδων πληθυσμού. Σε μια σειρά διανομής όπου κάθε επιλογή εμφανίζεται μία φορά, η λειτουργία δεν υπολογίζεται. Σε μια διακριτή σειρά, η λειτουργία είναι η παραλλαγή με την υψηλότερη συχνότητα. Για μια σειρά διαστημάτων με ίσα διαστήματα, η λειτουργία υπολογίζεται χρησιμοποιώντας τον τύπο:

.

πού είναι το αρχικό (κατώτερο) όριο του διαστήματος των τρόπων;

− την τιμή των τροπικών, προ- και μετατροπικών διαστημάτων, αντίστοιχα

− συχνότητα τροπικών, προ και μετατροπικών διαστημάτων, αντίστοιχα.

Το τροπικό διάστημα είναι το διάστημα που έχει την υψηλότερη συχνότητα.

Διάμεσος– αυτή είναι η τιμή του χαρακτηριστικού, που βρίσκεται στο μέσο της σειράς κατάταξης και διαιρεί αυτήν τη σειρά σε δύο ίσα μέρη με βάση τον αριθμό των μονάδων: το ένα μέρος έχει τιμές χαρακτηριστικών μικρότερες από τη διάμεσο και το άλλο περισσότερες από το διάμεσος.

Σειρές κατάταξης- αυτή είναι η διάταξη των χαρακτηριστικών τιμών σε αύξουσα ή φθίνουσα σειρά.

Σε μια διακριτή σειρά κατάταξης, όπου κάθε επιλογή εμφανίζεται μία φορά και ο αριθμός των επιλογών δεν είναι ζυγός, ο διάμεσος αριθμός καθορίζεται από τον τύπο:

πού είναι ο αριθμός των όρων της σειράς.

Σε μια διακριτή σειρά κατάταξης, όπου κάθε επιλογή εμφανίζεται μία φορά και ο αριθμός των επιλογών είναι ζυγός, η διάμεσος θα είναι ο αριθμητικός μέσος όρος των δύο επιλογών που βρίσκονται στο μέσο της σειράς κατάταξης.

Σε μια διακριτή σειρά κατάταξης, όπου κάθε επιλογή εμφανίζεται πολλές φορές, ο διάμεσος αριθμός καθορίζεται από τον τύπο:

Στη συνέχεια, ξεκινώντας με την πρώτη επιλογή, οι συχνότητες αθροίζονται διαδοχικά μέχρι να λάβετε .

Για μια σειρά διαστήματος, η διάμεσος υπολογίζεται χρησιμοποιώντας τον τύπο:

,

πού είναι το κατώτερο όριο του διάμεσου διαστήματος;

− την τιμή του διάμεσου διαστήματος.

−συνολικός αριθμός πληθυσμιακών μονάδων.

− συσσωρευμένη συχνότητα μέχρι το διάμεσο διάστημα.

− συχνότητα του μέσου διαστήματος.

Ένα διάμεσο διάστημα είναι ένα διάστημα στο οποίο η συσσωρευμένη συχνότητά του είναι ίση ή μεγαλύτερη από το ήμισυ του αθροίσματος όλων των συχνοτήτων της σειράς.

5. Δείκτες διακύμανσης

Παραλλαγή ενός χαρακτηριστικούείναι η διαφορά στις επιμέρους τιμές ενός χαρακτηριστικού εντός του πληθυσμού που μελετάται. Η παραλλαγή ενός χαρακτηριστικού χαρακτηρίζεται από δείκτες διακύμανσης. Οι δείκτες διακύμανσης συμπληρώνουν τις μέσες τιμές, χαρακτηρίζουν τον βαθμό ομοιογένειας του στατιστικού πληθυσμού για ένα δεδομένο χαρακτηριστικό και τα όρια διακύμανσης του χαρακτηριστικού. Ο λόγος των δεικτών διακύμανσης καθορίζει τη σχέση μεταξύ των χαρακτηριστικών.

Οι δείκτες διακύμανσης χωρίζονται σε:

1) Απόλυτο: εύρος παραλλαγής. μέση γραμμική απόκλιση. τυπική απόκλιση; διασπορά. Έχουν τις ίδιες μονάδες μέτρησης με τις χαρακτηριστικές τιμές

2) Σχετική: συντελεστής ταλάντωσης, συντελεστής διακύμανσης, σχετική γραμμική απόκλιση.

Το εύρος διακύμανσης δείχνει κατά πόσο αλλάζει η τιμή του χαρακτηριστικού:

πού είναι η μέγιστη τιμή του χαρακτηριστικού;

– ελάχιστη τιμή του χαρακτηριστικού.

Η μέση γραμμική απόκλιση και η τυπική απόκλιση δείχνουν πόσο κατά μέσο όρο διαφέρουν οι μεμονωμένες τιμές ενός χαρακτηριστικού από τη μέση τιμή του.

Μέση γραμμική απόκλισηορίζεται:

- απλός; - σταθμισμένο.

Διασποράκαθορίζονται:

- απλός; – σταθμισμένο·

- απλός; - σταθμισμένο.

Εάν η μέση τιμή ενός χαρακτηριστικού υπολογίστηκε χρησιμοποιώντας απλή αριθμητική, τότε υπολογίζεται χρησιμοποιώντας έναν απλό τύπο· εάν ο μέσος όρος υπολογίστηκε χρησιμοποιώντας έναν σταθμισμένο τύπο, τότε υπολογίζεται χρησιμοποιώντας έναν σταθμισμένο τύπο.

Διασποράκαι τυπική απόκλισημπορεί επίσης να υπολογιστεί χρησιμοποιώντας έναν άλλο τύπο:

- απλός; - σταθμισμένο.

Για να συγκριθεί η διακύμανση διαφορετικών χαρακτηριστικών στον ίδιο πληθυσμό ή το ίδιο χαρακτηριστικό σε διαφορετικούς πληθυσμούς, υπολογίζεται ένας σχετικός δείκτης διακύμανσης, που ονομάζεται συντελεστής διακύμανσης:

Όσο μεγαλύτερος είναι ο συντελεστής διακύμανσης, τόσο μεγαλύτερη είναι η εξάπλωση των τιμών των χαρακτηριστικών γύρω από τον μέσο όρο, τόσο λιγότερο ομοιογενής είναι ο πληθυσμός στη σύνθεση και τόσο λιγότερο αντιπροσωπευτικός ο μέσος όρος. Ο πληθυσμός θεωρείται ομοιογενής εάν ο συντελεστής διακύμανσης δεν υπερβαίνει το 33%.

6. Είδη διασπορών και νόμος (κανόνας) προσθήκης διασπορών

Εάν ο υπό μελέτη πληθυσμός αποτελείται από πολλές ομάδες που σχηματίζονται με βάση οποιοδήποτε χαρακτηριστικό, τότε εκτός από τη γενική διακύμανση προσδιορίζεται και η διαομαδική διακύμανση

Σύμφωνα με κανόνας για την προσθήκη διακυμάνσεωνη συνολική διακύμανση είναι ίση με το άθροισμα του μέσου όρου των διακυμάνσεων εντός και μεταξύ των ομάδων:

Χρησιμοποιώντας τον κανόνα της προσθήκης διακυμάνσεων, μπορείτε πάντα να προσδιορίσετε τις τρίτες – άγνωστες – διακυμάνσεις από δύο γνωστές διακυμάνσεις και επίσης να κρίνετε την ισχύ της επιρροής του χαρακτηριστικού ομαδοποίησης.

Εμπειρικός συντελεστής προσδιορισμού δείχνει την αναλογία που οφείλεται στη διακύμανση ενός χαρακτηριστικού ομαδοποίησης στη συνολική διακύμανση του χαρακτηριστικού που μελετήθηκε:

Εμπειρική σχέση συσχέτισηςδείχνει την επίδραση του χαρακτηριστικού που αποτελεί τη βάση της ομάδας στην παραλλαγή του χαρακτηριστικού που προκύπτει:

Ο εμπειρικός λόγος συσχέτισης κυμαίνεται από 0 έως 1. Όταν δεν υπάρχει σύνδεση, όταν υπάρχει πλήρης σύνδεση. Οι ενδιάμεσες τιμές αξιολογούνται ανάλογα με την εγγύτητά τους με τις οριακές τιμές.

ΘΕΜΑ 6.Σειρά Dynamics

1. Δυναμική σειρά: έννοια και τύποι

Σειρά Dynamics (χρονολογική σειρά, δυναμική σειρά, χρονοσειρά) είναι μια σειρά από αριθμητικές τιμές ενός στατιστικού δείκτη που βρίσκεται σε χρονολογική σειρά. Η σειρά δυναμικής αποτελείται από δύο στοιχεία (γραφική παράσταση):

1. χρόνος (t) – πρόκειται για στιγμές (ημερομηνίες) ή περιόδους (έτη, τρίμηνα, μήνες, ημέρες) του χρόνου με τις οποίες σχετίζονται οι στατιστικοί δείκτες (επίπεδα σειρών).

2. Επίπεδο σειράς (y) – τιμές ενός στατιστικού δείκτη που χαρακτηρίζει την κατάσταση ενός φαινομένου σε μια καθορισμένη χρονική στιγμή ή σε μια χρονική περίοδο.

Επίπεδο σειράς y

Τύποι δυναμικών σειρών:

1. Κατά χρόνο:

Α) διάστημα – σειρές, τα επίπεδα των οποίων χαρακτηρίζουν το μέγεθος του φαινομένου σε μια χρονική περίοδο (ημέρα, μήνας, τρίμηνο, έτος). Ένα παράδειγμα μιας τέτοιας σειράς είναι τα δεδομένα για τη δυναμική της παραγωγής προϊόντων, τον αριθμό των ανθρωποημέρων εργασίας, κ.λπ. Τα απόλυτα επίπεδα μιας σειράς διαστήματος μπορούν να συνοψιστούν· το άθροισμα είναι λογικό, το οποίο επιτρέπει σε κάποιον να αποκτήσει δυναμικές σειρές για πιο διευρυμένες περιόδους.

Β) στιγμή - σειρές, τα επίπεδα της οποίας χαρακτηρίζουν το μέγεθος του φαινομένου την ημερομηνία (στιγμή) του χρόνου. Ένα παράδειγμα μιας τέτοιας σειράς είναι τα δεδομένα σχετικά με τη δυναμική του πληθυσμού, τον αριθμό των ζώων, το μέγεθος του αποθέματος, την αξία των πάγιων περιουσιακών στοιχείων, τα κυκλοφορούντα στοιχεία ενεργητικού κ.λπ. Τα επίπεδα μιας σειράς ροπών δεν μπορούν να συνοψιστούν· το άθροισμα δεν έχει νόημα, αφού το επόμενο επίπεδο περιλαμβάνει πλήρως ή εν μέρει το προηγούμενο επίπεδο.

2. Σύμφωνα με τη μορφή παρουσίασης (τρόπο έκφρασης) των επιπέδων:

Α) σειρά απόλυτων τιμών.

Β) σειρά σχετικών τιμών. Οι σχετικές αξίες χαρακτηρίζουν, για παράδειγμα, τη δυναμική του μεριδίου αστικών και αγροτικών πληθυσμών (%) και το ποσοστό ανεργίας.