Βιογραφίες Χαρακτηριστικά Ανάλυση

Η σημασία της εξίσωσης παλινδρόμησης εκτιμάται με βάση. Εκτίμηση της στατιστικής σημασίας της εξίσωσης παλινδρόμησης και των παραμέτρων της

Στην κοινωνικοοικονομική έρευνα είναι συχνά απαραίτητο να εργαστείτε σε περιορισμένο πληθυσμό ή με δεδομένα δείγματος. Επομένως μετά μαθηματικές παραμέτρουςη εξίσωση παλινδρόμησης πρέπει να τα αξιολογήσει και η εξίσωση στο σύνολό της για στατιστική σημασία, δηλ. είναι απαραίτητο να βεβαιωθείτε ότι η εξίσωση που προκύπτει και οι παράμετροί της σχηματίζονται υπό την επίδραση μη τυχαίων παραγόντων.

Πρώτα απ 'όλα, αξιολογείται η στατιστική σημασία της εξίσωσης στο σύνολό της. Η αξιολόγηση πραγματοποιείται συνήθως με τη χρήση του Fisher's F test. Ο υπολογισμός του κριτηρίου F βασίζεται στον κανόνα της πρόσθεσης διακυμάνσεων. Δηλαδή, το γενικό χαρακτηριστικό διασποράς-αποτέλεσμα = διασπορά παράγοντα + υπολειπόμενη διασπορά.

Πραγματική τιμή

Θεωρητική τιμή
Κατασκευάζοντας μια εξίσωση παλινδρόμησης, μπορείτε να υπολογίσετε τη θεωρητική τιμή του χαρακτηριστικού αποτελέσματος, δηλ. υπολογίζεται χρησιμοποιώντας την εξίσωση παλινδρόμησης λαμβάνοντας υπόψη τις παραμέτρους της.

Αυτές οι τιμές θα χαρακτηρίσουν το αποτέλεσμα-ιδιότητα, που σχηματίζεται υπό την επίδραση παραγόντων που περιλαμβάνονται στην ανάλυση.

Υπάρχουν πάντα αποκλίσεις (υπολείμματα) μεταξύ των πραγματικών τιμών του χαρακτηριστικού αποτελέσματος και εκείνων που υπολογίζονται με βάση την εξίσωση παλινδρόμησης, λόγω της επίδρασης άλλων παραγόντων που δεν περιλαμβάνονται στην ανάλυση.

Η διαφορά μεταξύ των θεωρητικών και των πραγματικών τιμών του χαρακτηριστικού αποτελέσματος ονομάζεται υπολειμματικά. Γενική παραλλαγήαποτέλεσμα-χαρακτηριστικό:

Η διακύμανση του χαρακτηριστικού αποτελέσματος, που προκαλείται από τη διακύμανση των χαρακτηριστικών των παραγόντων που περιλαμβάνονται στην ανάλυση, αξιολογείται μέσω συγκρίσεων των θεωρητικών τιμών των αποτελεσμάτων. χαρακτηριστικό και τις μέσες τιμές του. Υπολειμματική διακύμανση μέσω σύγκρισης θεωρητικών και πραγματικών τιμών του προκύπτοντος χαρακτηριστικού. Συνολική διακύμανση, υπολειπόμενο και πραγματικό έχουν διαφορετικούς αριθμούς βαθμών ελευθερίας.

Γενικός, Π- αριθμός μονάδων στον υπό μελέτη πληθυσμό

Πραγματικός, Π- αριθμός παραγόντων που περιλαμβάνονται στην ανάλυση

Υπολειπόμενο

Η δοκιμή F Fisher υπολογίζεται ως η αναλογία προς , και υπολογίζεται για έναν βαθμό ελευθερίας.

Η χρήση της δοκιμής Fisher F ως εκτίμηση της στατιστικής σημασίας μιας εξίσωσης παλινδρόμησης είναι πολύ λογική. - αυτό είναι το αποτέλεσμα. χαρακτηριστικό, που καθορίζεται από τους παράγοντες που περιλαμβάνονται στην ανάλυση, δηλ. αυτή είναι η αναλογία του αποτελέσματος που εξηγείται. σημάδι. - αυτή είναι μια (παραλλαγή) ενός χαρακτηριστικού αποτελέσματος που προκαλείται από παράγοντες των οποίων η επιρροή δεν λαμβάνεται υπόψη, π.χ. δεν περιλαμβάνονται στην ανάλυση.

Οτι. Το F-test έχει σχεδιαστεί για να αξιολογεί σημαντικόςυπέρβαση πάνω από . Εάν δεν είναι σημαντικά χαμηλότερο από , και ακόμη περισσότερο εάν υπερβαίνει το , τότε η ανάλυση δεν περιλαμβάνει εκείνους τους παράγοντες που επηρεάζουν πραγματικά το χαρακτηριστικό αποτέλεσμα.

Το τεστ F Fisher είναι πινακοποιημένο, η πραγματική τιμή συγκρίνεται με την πινακοποιημένη τιμή. Αν , τότε η εξίσωση παλινδρόμησης θεωρείται στατιστικά σημαντική. Αν, αντίθετα, η εξίσωση δεν είναι στατιστικά σημαντική και δεν μπορεί να χρησιμοποιηθεί στην πράξη, η σημασία της εξίσωσης στο σύνολό της υποδηλώνει τη στατιστική σημασία των δεικτών συσχέτισης.

Μετά την εκτίμηση της εξίσωσης στο σύνολό της, είναι απαραίτητο να αξιολογηθεί η στατιστική σημασία των παραμέτρων της εξίσωσης. Αυτή η αξιολόγηση πραγματοποιείται με τη χρήση στατιστικών t-student. Η στατιστική t υπολογίζεται ως ο λόγος των παραμέτρων της εξίσωσης (modulo) προς το τυπικό μέσο τετραγωνικό σφάλμα τους. Εάν εκτιμηθεί ένα μοντέλο ενός παράγοντα, τότε υπολογίζονται 2 στατιστικά στοιχεία.

Σε όλα προγράμματα υπολογιστήΟ υπολογισμός του τυπικού σφάλματος και των στατιστικών t για τις παραμέτρους πραγματοποιείται με τον υπολογισμό των ίδιων των παραμέτρων. T-statistics σε πίνακα. Εάν η τιμή είναι , τότε η παράμετρος θεωρείται στατιστικά σημαντική, δηλ. σχηματίζεται υπό την επίδραση μη τυχαίων παραγόντων.

Ο υπολογισμός των στατιστικών t σημαίνει ουσιαστικά τον έλεγχο της μηδενικής υπόθεσης ότι η παράμετρος είναι ασήμαντη, δηλ. ισότητα του με μηδέν. Με ένα μοντέλο ενός παράγοντα, αξιολογούνται 2 υποθέσεις: και

Το επίπεδο σημαντικότητας της αποδοχής της μηδενικής υπόθεσης εξαρτάται από το επίπεδο της αποδοχής πιθανότητα εμπιστοσύνης. Έτσι, εάν ο ερευνητής ορίσει το επίπεδο πιθανότητας στο 95%, θα υπολογιστεί το επίπεδο σημαντικότητας αποδοχής, επομένως, εάν το επίπεδο σημαντικότητας είναι ≥ 0,05, τότε γίνεται αποδεκτό και οι παράμετροι θεωρούνται στατιστικά ασήμαντες. Αν , τότε η εναλλακτική απορρίπτεται και γίνεται αποδεκτή: και .

Τα πακέτα στατιστικών εφαρμογών παρέχουν επίσης το επίπεδο σημαντικότητας της υιοθέτησης μηδενικές υποθέσεις. Η αξιολόγηση της σημασίας της εξίσωσης παλινδρόμησης και των παραμέτρων της μπορεί να δώσει τα ακόλουθα αποτελέσματα:

Πρώτον, η εξίσωση στο σύνολό της είναι σημαντική (σύμφωνα με το F-test) και όλες οι παράμετροι της εξίσωσης είναι επίσης στατιστικά σημαντικές. Αυτό σημαίνει ότι η εξίσωση που προκύπτει μπορεί να χρησιμοποιηθεί για να ληφθούν και τα δύο αποφάσεις διαχείρισηςκαι για την πρόβλεψη.

Δεύτερον, σύμφωνα με το F-test, η εξίσωση είναι στατιστικά σημαντική, αλλά τουλάχιστον μία από τις παραμέτρους της εξίσωσης δεν είναι σημαντική. Η εξίσωση μπορεί να χρησιμοποιηθεί για τη λήψη αποφάσεων διαχείρισης σχετικά με τους παράγοντες που αναλύονται, αλλά δεν μπορεί να χρησιμοποιηθεί για πρόβλεψη.

Τρίτον, η εξίσωση δεν είναι στατιστικά σημαντική ή σύμφωνα με το F-test η εξίσωση είναι σημαντική, αλλά όλες οι παράμετροι της εξίσωσης που προκύπτει δεν είναι σημαντικές. Η εξίσωση δεν μπορεί να χρησιμοποιηθεί για κανένα σκοπό.

Για να αναγνωριστεί η εξίσωση παλινδρόμησης ως μοντέλο της σχέσης μεταξύ του χαρακτηριστικού αποτελέσματος και των ιδιοτήτων παράγοντα, είναι απαραίτητο όλα τα τους σημαντικότερους παράγοντες, προσδιορίζοντας το αποτέλεσμα, ώστε η ουσιαστική ερμηνεία των παραμέτρων της εξίσωσης να αντιστοιχεί σε θεωρητικά βασισμένες συνδέσεις στο φαινόμενο που μελετάται. Ο συντελεστής προσδιορισμού R2 πρέπει να είναι > 0,5.

Κατά την κατασκευή πολλαπλή εξίσωσηΓια την παλινδρόμηση, είναι σκόπιμο να αξιολογηθεί χρησιμοποιώντας τον λεγόμενο προσαρμοσμένο συντελεστή προσδιορισμού (R 2). Η τιμή του R2 (καθώς και η συσχέτιση) αυξάνεται με τον αριθμό των παραγόντων που περιλαμβάνονται στην ανάλυση. Η τιμή του συντελεστή υπερεκτιμάται ιδιαίτερα σε μικρούς πληθυσμούς. Για να αποπληρωθεί κακή επιρροήΤο R 2 και οι συσχετίσεις προσαρμόζονται για τον αριθμό των βαθμών ελευθερίας, δηλ. ο αριθμός των ελεύθερα μεταβαλλόμενων στοιχείων όταν περιλαμβάνονται ορισμένοι παράγοντες.

Προσαρμοσμένος συντελεστής προσδιορισμού

Π–μέγεθος πληθυσμού/αριθμός παρατηρήσεων

κ– αριθμός παραγόντων που περιλαμβάνονται στην ανάλυση

n-1– αριθμός βαθμών ελευθερίας

(1-R 2)- την τιμή της υπόλοιπης/ανεξήγητης διακύμανσης του προκύπτοντος χαρακτηριστικού

Πάντα λιγότερο R 2. με βάση μπορεί κανείς να συγκρίνει τις εκτιμήσεις των εξισώσεων με διαφορετικούς αριθμούςαναλυόμενοι παράγοντες.

34. Προβλήματα μελέτης χρονοσειρών.

Οι χρονοσειρές ονομάζονται χρονοσειρές ή χρονοσειρές. Μια χρονοσειρά είναι μια χρονικά διατεταγμένη ακολουθία δεικτών που χαρακτηρίζουν ένα συγκεκριμένο φαινόμενο (όγκος ΑΕΠ από 90 έως 98). Σκοπός της μελέτης χρονοσειρών είναι ο προσδιορισμός του τρόπου εξέλιξης του υπό μελέτη φαινομένου (η κύρια τάση) και η πρόβλεψη σε αυτή τη βάση. Από τον ορισμό του RD προκύπτει ότι οποιαδήποτε σειρά αποτελείται από δύο στοιχεία: τον χρόνο t και το επίπεδο της σειράς (αυτές τις συγκεκριμένες τιμές του δείκτη βάσει των οποίων κατασκευάζεται η σειρά RD). Η σειρά DR μπορεί να είναι 1) σειρές ροπών, οι δείκτες της οποίας είναι σταθεροί σε ένα χρονικό σημείο, στο ΑΚΡΙΒΗΣ ΗΜΕΡΟΜΗΝΙΑ, 2) διάστημα - σειρές, οι δείκτες της οποίας λαμβάνονται για ορισμένο χρονικό διάστημα (1. πληθυσμός Αγίας Πετρούπολης, 2. όγκος ΑΕΠ για την περίοδο). Η διαίρεση των σειρών σε ροπές και διαστήματα είναι απαραίτητη, καθώς αυτό καθορίζει τις ιδιαιτερότητες του υπολογισμού ορισμένων δεικτών της σειράς DR. Άθροιση επιπέδων σειρές μεσοδιαστημάτωνδίνει ένα ουσιαστικά ερμηνεύσιμο αποτέλεσμα, το οποίο δεν μπορεί να ειπωθεί για την άθροιση των επιπέδων των σειρών ροπών, καθώς οι τελευταίες περιέχουν επαναλαμβανόμενη μέτρηση. Το πιο σημαντικό πρόβλημαΣτην ανάλυση των χρονοσειρών, υπάρχει πρόβλημα συγκρισιμότητας των επιπέδων σειρών. Αυτή η έννοια είναι πολύ διαφορετική. Τα επίπεδα πρέπει να είναι συγκρίσιμα ως προς τις μεθόδους υπολογισμού και ως προς την επικράτεια και την κάλυψη των πληθυσμιακών μονάδων. Εάν η σειρά DR κατασκευάζεται σε όρους κόστους, τότε όλα τα επίπεδα πρέπει να παρουσιάζονται ή να υπολογίζονται σε συγκρίσιμες τιμές. Κατά την κατασκευή διαστημικών σειρών, τα επίπεδα πρέπει να χαρακτηρίζουν ταυτόσημες χρονικές περιόδους. Κατά την κατασκευή σειρών ροπών, τα επίπεδα πρέπει να καταγράφονται την ίδια ημερομηνία. Η σειρά DR μπορεί να είναι πλήρης ή ατελής. Οι ημιτελείς σειρές χρησιμοποιούνται σε επίσημες δημοσιεύσεις (1980,1985,1990,1995,1996,1997,1998,1999...). Ολοκληρωμένη ανάλυσηΤο RD περιλαμβάνει τη μελέτη των ακόλουθων σημείων:

1. υπολογισμός δεικτών μεταβολών στα επίπεδα ΣΔ

2. υπολογισμός των μέσων δεικτών RD

3. εντοπισμός της κύριας τάσης της σειράς, δημιουργία μοντέλων τάσης

4. αξιολόγηση αυτοσυσχέτισης σε ΣΔ, κατασκευή αυτοπαλινδρομικών μοντέλων

5. Συσχέτιση RD (μελέτη συνδέσεων μεταξύ σειρών m/y DR)

6. πρόβλεψη τροχοδρόμων.

35. Δείκτες μεταβολών στα επίπεδα χρονοσειρών .

ΣΕ γενική εικόναΤο RowD μπορεί να αναπαρασταθεί:

y – επίπεδο DR, t – στιγμή ή χρονική περίοδος στην οποία ανήκει το επίπεδο (δείκτης), n – μήκος Σειράς DR (αριθμός περιόδων). κατά τη μελέτη μιας σειράς δυναμικών, υπολογίζονται οι ακόλουθοι δείκτες: 1. απόλυτη ανάπτυξη, 2. συντελεστής ανάπτυξης (ρυθμός ανάπτυξης), 3. επιτάχυνση, 4. συντελεστής ανάπτυξης (ρυθμός ανάπτυξης), 5. απόλυτη τιμή 1% αύξηση. Οι υπολογισμένοι δείκτες μπορούν να είναι: 1. αλυσιδωτοί - που λαμβάνονται συγκρίνοντας κάθε επίπεδο της σειράς με το αμέσως προηγούμενο, 2. βασικός - λαμβανόμενοι συγκρίνοντας με το επίπεδο που επιλέχθηκε ως βάση σύγκρισης (εκτός εάν αναφέρεται ρητά, το 1ο επίπεδο του Η σειρά λαμβάνεται ως βάση). 1. Αλυσίδες απόλυτες αυξήσεις:. Δείχνει πόσο περισσότερο ή λιγότερο. Οι αλυσιδωτές απόλυτες αυξήσεις ονομάζονται δείκτες του ρυθμού μεταβολής των επιπέδων χρονική σειρά. Βασική απόλυτη ανάπτυξη: . Αν τα επίπεδα σειράς είναι σχετικούς δείκτες, εκφρασμένο σε %, τότε η απόλυτη αύξηση εκφράζεται σε σημεία μεταβολής. 2. ρυθμός ανάπτυξης (ρυθμός ανάπτυξης):Υπολογίζεται ως ο λόγος των επιπέδων της σειράς προς τα αμέσως προηγούμενα (συντελεστές ανάπτυξης αλυσίδας) ή προς το επίπεδο που λαμβάνεται ως βάση σύγκρισης (βασικοί συντελεστές ανάπτυξης): . Χαρακτηρίζει πόσες φορές κάθε επίπεδο της σειράς > ή< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. με βάση τις απόλυτες αυξήσεις, ο δείκτης υπολογίζεται - επιτάχυνση της απόλυτης ανάπτυξης: . Η επιτάχυνση είναι μια απόλυτη αύξηση στις απόλυτες αυξήσεις. Αξιολογεί πώς αλλάζουν τα ίδια τα κέρδη, είτε είναι σταθερά είτε επιταχυνόμενα (αυξάνονται). 4. ρυθμός ανάπτυξηςείναι ο λόγος της ανάπτυξης προς τη βάση σύγκρισης. Εκφράζεται σε %: ; . Ο ρυθμός ανάπτυξης είναι ο ρυθμός ανάπτυξης μείον 100%. Δείχνει πόσο % αυτό το επίπεδοσειρά > ή< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Υπολογισμός μέσου όρου δεικτών RD Υπολογίζονται τα μέσα επίπεδα σειρών, οι μέσες απόλυτες αυξήσεις, οι μέσοι ρυθμοί ανάπτυξης και οι μέσοι ρυθμοί ανάπτυξης. Οι μέσοι δείκτες υπολογίζονται με σκοπό τη σύνοψη των πληροφοριών και τη δυνατότητα σύγκρισης των επιπέδων και των δεικτών της μεταβολής τους σε διάφορες σειρές. 1. μέσο επίπεδοσειράα) για χρονικές σειρές διαστήματος υπολογίζεται χρησιμοποιώντας τον απλό αριθμητικό μέσο όρο: , όπου n είναι ο αριθμός των επιπέδων στη χρονοσειρά. β) για τις σειρές ροπών, το μέσο επίπεδο υπολογίζεται χρησιμοποιώντας έναν συγκεκριμένο τύπο, ο οποίος ονομάζεται χρονολογικός μέσος όρος: . 2. μέση απόλυτη αύξησηυπολογίζεται με βάση τις απόλυτες αυξήσεις της αλυσίδας με βάση τον απλό αριθμητικό μέσο όρο:

. 3. Μέσος συντελεστήςανάπτυξηυπολογίζεται με βάση τους συντελεστές ανάπτυξης της αλυσίδας χρησιμοποιώντας τον γεωμετρικό μέσο τύπο: . Όταν σχολιάζετε τους μέσους δείκτες της σειράς DR, είναι απαραίτητο να αναφέρετε 2 σημεία: την περίοδο που χαρακτηρίζει τον αναλυόμενο δείκτη και το χρονικό διάστημα για το οποίο κατασκευάστηκε η σειρά DR. 4. Μέσος ρυθμός ανάπτυξης: . 5. μέσος ρυθμός ανάπτυξης: .

Για να εκτιμηθεί η σημασία και η σημασία του συντελεστή συσχέτισης, χρησιμοποιείται το Student's t-test.

Το μέσο σφάλμα του συντελεστή συσχέτισης βρίσκεται χρησιμοποιώντας τον τύπο:

Ν
και με βάση το σφάλμα υπολογίζεται το κριτήριο t:

Η υπολογισμένη τιμή t-test συγκρίνεται με την πινακοποιημένη τιμή που βρίσκεται στον πίνακα κατανομής Student σε επίπεδο σημαντικότητας 0,05 ή 0,01 και τον αριθμό βαθμών ελευθερίας n-1. Εάν η υπολογισμένη τιμή του τεστ t είναι μεγαλύτερη από την τιμή του πίνακα, τότε ο συντελεστής συσχέτισης θεωρείται σημαντικός.

Στην περίπτωση μιας καμπυλόγραμμης σχέσης, το F-test χρησιμοποιείται για την αξιολόγηση της σημασίας της σχέσης συσχέτισης και της εξίσωσης παλινδρόμησης. Υπολογίζεται με τον τύπο:

ή

όπου η είναι ο λόγος συσχέτισης. n – αριθμός παρατηρήσεων. m – αριθμός παραμέτρων στην εξίσωση παλινδρόμησης.

Η υπολογιζόμενη τιμή F συγκρίνεται με την πινακοποιημένη για το αποδεκτό επίπεδο σημαντικότητας α (0,05 ή 0,01) και τους αριθμούς βαθμών ελευθερίας k 1 =m-1 και k 2 =n-m. Εάν η υπολογιζόμενη τιμή F υπερβαίνει την πρώτη του πίνακα, η σχέση θεωρείται σημαντική.

Η σημασία του συντελεστή παλινδρόμησης καθορίζεται χρησιμοποιώντας το Student t-test, το οποίο υπολογίζεται χρησιμοποιώντας τον τύπο:

όπου σ 2 και i είναι η διακύμανση του συντελεστή παλινδρόμησης.

Υπολογίζεται με τον τύπο:

όπου k είναι ο αριθμός των χαρακτηριστικών παραγόντων στην εξίσωση παλινδρόμησης.

Ο συντελεστής παλινδρόμησης θεωρείται σημαντικός εάν t a 1 ≥t cr. Το t cr βρίσκεται στον πίνακα των κρίσιμων σημείων της κατανομής Student στο αποδεκτό επίπεδο σημαντικότητας και τον αριθμό βαθμών ελευθερίας k=n-1.

4.3 Ανάλυση συσχέτισης και παλινδρόμησης στο Excel

Ας διεξαγάγουμε μια ανάλυση συσχέτισης και παλινδρόμησης της σχέσης μεταξύ απόδοσης και κόστους εργασίας ανά 1 κουντόνι σιτηρών. Για να το κάνετε αυτό, ανοίξτε ένα φύλλο Excel και εισαγάγετε τις τιμές του χαρακτηριστικού παράγοντα στα κελιά A1:A30 η απόδοση των καλλιεργειών σιτηρών, στα κελιά Β1:Β30, η αξία του προκύπτοντος χαρακτηριστικού είναι το κόστος εργασίας ανά 1 κουντόνι σιτηρών. Στο μενού Εργαλεία, επιλέξτε την επιλογή Ανάλυση δεδομένων. Κάνοντας αριστερό κλικ σε αυτό το στοιχείο, θα ανοίξουμε το εργαλείο Regression. Κάντε κλικ στο κουμπί OK και το πλαίσιο διαλόγου Regression εμφανίζεται στην οθόνη. Στο πεδίο Input Interval Y, πληκτρολογήστε τις τιμές του προκύπτοντος χαρακτηριστικού (επισήμανση κελιών B1:B30), στο πεδίο Input interval X, εισαγάγετε τις τιμές του χαρακτηριστικού παράγοντα (επισήμανση κελιών A1:A30). Σημειώστε το επίπεδο πιθανότητας 95% και επιλέξτε Νέο φύλλο εργασίας. Κάντε κλικ στο κουμπί ΟΚ. Ο πίνακας "ΣΥΜΠΕΡΑΣΜΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ" εμφανίζεται στο φύλλο εργασίας, ο οποίος δείχνει τα αποτελέσματα του υπολογισμού των παραμέτρων της εξίσωσης παλινδρόμησης, του συντελεστή συσχέτισης και άλλων δεικτών που σας επιτρέπουν να προσδιορίσετε τη σημασία του συντελεστή συσχέτισης και τις παραμέτρους της εξίσωσης παλινδρόμησης.

ΣΥΜΠΕΡΑΣΜΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Στατιστικά παλινδρόμησης

Πληθυντικός R

R-τετράγωνο

Κανονικοποιημένο R-τετράγωνο

Τυπικό σφάλμα

Παρατηρήσεις

Ανάλυση της διακύμανσης

Σημασία ΣΤ

Οπισθοδρόμηση

Πιθανότητα

Τυπικό σφάλμα

t-statistic

P-Τιμή

Κάτω 95%

Κορυφαίο 95%

Κάτω 95,0%

Κορυφαίο 95,0%

Υ-τομή

Μεταβλητή X 1

Σε αυτόν τον πίνακα, το "Πολλαπλό R" είναι ο συντελεστής συσχέτισης, το "R-τετράγωνο" είναι ο συντελεστής προσδιορισμού. "Συντελεστές: Y-τομή" - ελεύθερος όρος της εξίσωσης παλινδρόμησης 2,836242; “Μεταβλητή X1” – συντελεστής παλινδρόμησης -0,06654. Υπάρχουν επίσης τιμές του Fisher's F-test 74.9876, Student's t-test 14.18042, " Τυπικό σφάλμα 0,112121”, τα οποία είναι απαραίτητα για την εκτίμηση της σημασίας του συντελεστή συσχέτισης, των παραμέτρων της εξίσωσης παλινδρόμησης και ολόκληρης της εξίσωσης.

Με βάση τα δεδομένα του πίνακα, θα κατασκευάσουμε μια εξίσωση παλινδρόμησης: y x ​​= 2,836-0,067x. Ο συντελεστής παλινδρόμησης a 1 = -0,067 σημαίνει ότι με αύξηση της απόδοσης των σιτηρών κατά 1 c/ha, το κόστος εργασίας ανά 1 c σιτηρών μειώνεται κατά 0,067 ανθρωποώρες.

Ο συντελεστής συσχέτισης είναι r=0,85>0,7, επομένως, η σχέση μεταξύ των χαρακτηριστικών που μελετήθηκαν σε αυτόν τον πληθυσμό είναι στενή. Ο συντελεστής προσδιορισμού r 2 =0,73 δείχνει ότι το 73% της διακύμανσης του αποτελεσματικού χαρακτηριστικού (κόστος εργασίας ανά 1 τεντόλι κόκκου) προκαλείται από τη δράση του χαρακτηριστικού παράγοντα (απόδοση κόκκου).

Στο τραπέζι κρίσιμα σημείακατανομή του Fisher - Snedekor βρίσκουμε την κρίσιμη τιμή του F-test σε επίπεδο σημαντικότητας 0,05 και τον αριθμό των βαθμών ελευθερίας σε 1 =m-1=2-1=1 και k 2 =n-m=30-2= 28, ισούται με 4,21. Δεδομένου ότι η υπολογισμένη τιμή του κριτηρίου είναι μεγαλύτερη από την πινακοποιημένη (F=74,9896>4,21), η εξίσωση παλινδρόμησης θεωρείται σημαντική.

Για να εκτιμήσουμε τη σημασία του συντελεστή συσχέτισης, ας υπολογίσουμε το Student’s t-test:

ΣΕ
Στον πίνακα των κρίσιμων σημείων της κατανομής Student, βρίσκουμε την κρίσιμη τιμή του t-test σε επίπεδο σημαντικότητας 0,05 και ο αριθμός των βαθμών ελευθερίας n-1=30-1=29, είναι ίσος με 2,0452. Δεδομένου ότι η υπολογιζόμενη τιμή είναι μεγαλύτερη από την τιμή του πίνακα, ο συντελεστής συσχέτισης είναι σημαντικός.

Για να ελεγχθεί η σημασία, αναλύεται ο λόγος του συντελεστή παλινδρόμησης και η τυπική απόκλιση του. Αυτή η αναλογία είναι μια κατανομή Student, δηλαδή, για να προσδιορίσουμε τη σημασία χρησιμοποιούμε το t-test:

- RMSαπό υπολειμματική διασπορά?

- άθροισμα αποκλίσεων από τη μέση τιμή

Αν τ ras. > καρτέλα t. , τότε ο συντελεστής b i είναι σημαντικός.

Το διάστημα εμπιστοσύνης καθορίζεται από τον τύπο:

ΔΙΑΔΙΚΑΣΙΑ ΕΚΤΕΛΕΣΗΣ ΤΗΣ ΕΡΓΑΣΙΑΣ

    Πάρτε τα αρχικά δεδομένα σύμφωνα με την επιλογή εργασίας (κατά αριθμό μαθητή στο ημερολόγιο). Καθορίζεται ένα αντικείμενο στατικού ελέγχου με δύο εισόδους Χ 1 , Χ 2 και μια έξοδο Υ. Ένα παθητικό πείραμα διεξήχθη στην εγκατάσταση και ελήφθη ένα δείγμα 30 σημείων που περιείχε τις τιμές Χ 1 , Χ 2 Και Υγια κάθε πείραμα.

    Ανοίξτε ένα νέο αρχείο στο Excel 2007. Εισαγάγετε γενικές πληροφορίεςστις στήλες του πίνακα πηγής - τις τιμές των μεταβλητών εισόδου Χ 1 , Χ 2 και μεταβλητή εξόδου Υ.

    Προετοιμάστε δύο πρόσθετες στήλες για την εισαγωγή των υπολογισμένων τιμών Υκαι υπολείμματα.

    Καλέστε το πρόγραμμα «Παλινδρόμηση»: Δεδομένα / Ανάλυση δεδομένων / Παλινδρόμηση.

Ρύζι. 1. Παράθυρο διαλόγου Ανάλυση δεδομένων.

    Πληκτρολογήστε τις διευθύνσεις των δεδομένων προέλευσης στο πλαίσιο διαλόγου "Παλινδρόμηση":

    διάστημα εισαγωγής Y, διάστημα εισαγωγής X (2 στήλες),

    ορίστε το επίπεδο αξιοπιστίας στο 95%,

    στην επιλογή "Διάστημα εξόδου", υποδείξτε το επάνω αριστερό κελί του τόπου όπου εξάγονται τα δεδομένα ανάλυσης παλινδρόμησης (το πρώτο κελί στη 2η σελίδα του φύλλου εργασίας),

    ενεργοποιήστε τις επιλογές "Υπόλοιπα" και "Υπόλοιπο γράφημα",

    πατήστε το κουμπί OK για να ξεκινήσετε ανάλυση παλινδρόμησης.

Ρύζι. 2. Πλαίσιο διαλόγου παλινδρόμησης.

    Το Excel θα εμφανίσει 4 πίνακες και 2 γραφήματα της εξάρτησης των υπολειμμάτων από μεταβλητές Χ1Και X2.

    Μορφοποιήστε τον πίνακα "Έξοδος συνόλων" - αναπτύξτε τη στήλη με τα ονόματα των δεδομένων εξόδου, κάντε 3 σημαντικά ψηφία μετά την υποδιαστολή στη δεύτερη στήλη.

    Μορφοποιήστε τον πίνακα "Ανάλυση διακύμανσης" - κάντε πιο ευανάγνωστο και κατανοητό τον αριθμό των σημαντικών ψηφίων μετά τις υποδιαστολές, συντομεύστε τα ονόματα των μεταβλητών και προσαρμόστε το πλάτος των στηλών.

    Μορφοποιήστε τον πίνακα των συντελεστών εξισώσεων - συντομεύστε τα ονόματα των μεταβλητών και προσαρμόστε το πλάτος των στηλών εάν είναι απαραίτητο, κάντε τον αριθμό των σημαντικών ψηφίων πιο ευανάγνωστα και κατανοητά, αφαιρέστε τις τελευταίες 2 στήλες (τιμές και διάταξη πίνακα).

    Μεταφέρετε τα δεδομένα από τον πίνακα "Εξόδου που απομένει" στις προετοιμασμένες στήλες του πίνακα προέλευσης και, στη συνέχεια, διαγράψτε τον πίνακα "Υπόλοιπη έξοδο" (την επιλογή "εισαγωγή ειδικού").

    Εισαγάγετε τις εκτιμήσεις των λαμβανόμενων συντελεστών στον πίνακα προέλευσης.

    Τραβήξτε τους πίνακες αποτελεσμάτων στην κορυφή της σελίδας.

    Δημιουργήστε γραφήματα κάτω από πίνακες Υexp, Υυπολογισμόςκαι σφάλματα πρόβλεψης (υπολειπόμενα).

    Μορφοποίηση υπολειπόμενων γραφημάτων. Χρησιμοποιώντας τα γραφήματα που προκύπτουν, αξιολογήστε την ορθότητα του μοντέλου με βάση τις εισόδους Χ1, Χ2.

    Εκτυπώστε τα αποτελέσματα της ανάλυσης παλινδρόμησης.

    Κατανοήστε τα αποτελέσματα της ανάλυσης παλινδρόμησης.

    Ετοιμάστε μια έκθεση εργασίας.

ΠΑΡΑΔΕΙΓΜΑ ΑΠΟΔΟΣΗΣ ΕΡΓΑΣΙΑΣ

Η μέθοδος για την εκτέλεση ανάλυσης παλινδρόμησης στο EXCEL παρουσιάζεται στα Σχήματα 3-5.

Ρύζι. 3. Παράδειγμα ανάλυσης παλινδρόμησης στο πακέτο EXCEL.


Εικ.4. Μεταβλητά υπολειμματικά οικόπεδα Χ1, Χ2

Ρύζι. 5. Διαγράμματα Υexp,Υυπολογισμόςκαι σφάλματα πρόβλεψης (υπολειπόμενα).

Σύμφωνα με την ανάλυση παλινδρόμησης, μπορούμε να πούμε:

1. Η εξίσωση παλινδρόμησης που λαμβάνεται χρησιμοποιώντας το Excel έχει τη μορφή:

    Συντελεστής προσδιορισμού:

Η διακύμανση του αποτελέσματος κατά 46,5% εξηγείται από τη διακύμανση των παραγόντων.

    Το γενικό τεστ F ελέγχει την υπόθεση σχετικά με τη στατιστική σημασία μιας εξίσωσης παλινδρόμησης. Η ανάλυση πραγματοποιείται συγκρίνοντας τις πραγματικές και τις πινακοποιημένες τιμές της δοκιμής Fisher F.

Δεδομένου ότι η πραγματική τιμή υπερβαίνει τον πίνακα
, τότε συμπεραίνουμε ότι η εξίσωση παλινδρόμησης που προκύπτει είναι στατιστικά σημαντική.

    Συντελεστής πολλαπλή συσχέτιση:

    σι 0 :

t καρτέλα. (29, 0,975)=2,05

σι 0 :

Διάστημα εμπιστοσύνης:

    Προσδιορίστε το διάστημα εμπιστοσύνης για τον συντελεστή σι 1 :

Έλεγχος της σημασίας του συντελεστή σι 1 :

t dis. > καρτέλα t. , ο συντελεστής b 1 είναι σημαντικός

Διάστημα εμπιστοσύνης:

    Προσδιορίστε το διάστημα εμπιστοσύνης για τον συντελεστή σι 2 :

Δοκιμή σημαντικότητας για συντελεστή σι 2 :

Προσδιορίστε το διάστημα εμπιστοσύνης:

ΕΠΙΛΟΓΕΣ ΕΡΓΑΣΙΩΝ

Πίνακας 2. Επιλογές εργασιών

Επιλογή Αρ.

Αποτελεσματικό σημάδι Υ Εγώ

Υ 1

Υ 1

Υ 1

Υ 1

Υ 1

Υ 1

Υ 1

Υ 1

Υ 1

Υ 1

Υ 2

Υ 2

Υ 2

Υ 2

Υ 2

Συντελεστής Αρ. Χ Εγώ

Συντελεστής Αρ. Χ Εγώ

Συνέχεια του Πίνακα 1

Επιλογή Αρ.

Αποτελεσματικό σημάδι Υ Εγώ

Υ 2

Υ 2

Υ 2

Υ 2

Υ 2

Υ 3

Υ 3

Υ 3

Υ 3

Υ 3

Υ 3

Υ 3

Υ 3

Υ 3

Υ 3

Συντελεστής Αρ. Χ Εγώ

Συντελεστής Αρ. Χ Εγώ

Πίνακας 3. Αρχικά στοιχεία

Υ 1

Υ 2

Υ 3

Χ 1

Χ 2

Χ 3

Χ 4

Χ 5

ΕΡΩΤΗΣΕΙΣ ΑΥΤΟΕΛΕΓΧΟΥ

    Προβλήματα ανάλυσης παλινδρόμησης.

    Προϋποθέσεις ανάλυσης παλινδρόμησης.

    Βασική εξίσωση ανάλυση της διακύμανσης.

    Τι δείχνει ο λόγος F του Fisher;

    Πώς καθορίζεται αξία πίνακαΤο τεστ του Fisher;

    Τι δείχνει ο συντελεστής προσδιορισμού;

    Πώς να προσδιορίσετε τη σημασία των συντελεστών παλινδρόμησης;

    Πώς να προσδιορίσετε το διάστημα εμπιστοσύνης των συντελεστών παλινδρόμησης;

    Πώς να προσδιορίσετε την υπολογισμένη τιμή t-test;

    Πώς να προσδιορίσετε την τιμή του πίνακα του τεστ t;

    Διατυπώστε την κύρια ιδέα της ανάλυσης διακύμανσης· για την επίλυση ποιων προβλημάτων είναι πιο αποτελεσματική;

    Ποιες είναι οι βασικές θεωρητικές προϋποθέσεις της ανάλυσης διασποράς;

    Εκτελέστε αποσύνθεση συνολικό ποσότετραγωνισμένες αποκλίσεις σε συνιστώσες στην ανάλυση διασποράς.

    Πώς να αποκτήσετε εκτιμήσεις διασποράς από αθροίσματα τετραγωνικών αποκλίσεων;

    Πώς επιτυγχάνονται οι απαιτούμενοι αριθμοί βαθμών ελευθερίας;

    Πώς προσδιορίζεται το τυπικό σφάλμα;

    Εξηγήστε τον σχεδιασμό της ανάλυσης διασποράς δύο παραγόντων.

    Πώς διαφέρει η διασταυρούμενη ταξινόμηση από την ιεραρχική ταξινόμηση;

    Ποια είναι η διαφορά μεταξύ των ισορροπημένων δεδομένων;

Η αναφορά προετοιμάζεται στο πρόγραμμα επεξεργασίας κειμένου Word σε χαρτί Α4 GOST 6656-76 (210x297 mm) και περιέχει:

    Όνομα της εργαστηριακής εργασίας.

    Στόχος της εργασίας.

  1. Αποτελέσματα υπολογισμού.

ΕΠΙΤΡΕΠΕΤΑΙ ΧΡΟΝΟΣ ΟΛΟΚΛΗΡΩΣΗΣ

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΕΡΓΑΣΙΕΣ

Προετοιμασία για εργασία – 0,5 ακαδημαϊκό. ώρες.

Ολοκλήρωση εργασίας – 0,5 ακαδημαϊκό. ώρες.

Υπολογισμοί υπολογιστή – 0,5 ακαδημαϊκό. ώρες.

Σχεδιασμός εργασίας – 0,5 ακαδημαϊκό. ώρες.

Βιβλιογραφία

    Αναγνώριση αντικειμένων ελέγχου. / A. D. Semenov, D. V. Artamonov, A. V. Bryukhachev. Φροντιστήριο. - Penza: PSU, 2003. - 211 p.

    Βασικά Στατιστική ανάλυση. Εργαστήριο για Στατιστικές μέθοδοικαι επιχειρησιακή έρευνα με χρήση πακέτων STATISTIC και EXCEL. / Vukolov E.A. Φροντιστήριο. - Μ.: ΦΟΡΟΥΜ, 2008. - 464 σελ.

    Βασικές αρχές της θεωρίας αναγνώρισης αντικειμένων ελέγχου. / Α.Α. Ignatiev, S.A. Ιγνάτιεφ. Φροντιστήριο. - Saratov: SSTU, 2008. - 44 σελ.

    Θεωρία πιθανοτήτων και μαθηματικά στατιστικάσε παραδείγματα και εργασίες χρησιμοποιώντας EXCEL. / G.V. Γκορέλοβα, Ι.Α. Κάτσκο. - Rostov n/d: Phoenix, 2006.- 475 p.

    Στόχος 2

    Βασικές έννοιες 2

    Εντολή εργασίας 6

    Παράδειγμα εργασίας 9

    Ερωτήσεις για αυτοέλεγχο 13

    Χρόνος που διατίθεται για την ολοκλήρωση της εργασίας 14

    Μπορείτε να ελέγξετε τη σημασία των παραμέτρων της εξίσωσης παλινδρόμησης χρησιμοποιώντας στατιστικές t.

    Ασκηση:
    Για μια ομάδα επιχειρήσεων που παράγουν τον ίδιο τύπο προϊόντος, οι συναρτήσεις κόστους θεωρούνται:
    y = α + βx;
    y = α x β ;
    y = α β x ;
    y = α + β / x;
    όπου y είναι το κόστος παραγωγής, χιλιάδες μονάδες.
    x – παραγωγή παραγωγής, χιλιάδες μονάδες.

    Απαιτείται:
    1. Κατασκευάστε εξισώσεις παλινδρόμησης ανά ζεύγη y από το x:

    • γραμμικός;
    • εξουσία;
    • εκδηλωτικός;
    • ισόπλευρη υπερβολή.
    2. Υπολογίστε γραμμικός συντελεστήςσυσχέτιση ζεύγους και συντελεστή προσδιορισμού. Βγαζω συμπερασματα.
    3. Εκτιμήστε τη στατιστική σημασία της εξίσωσης παλινδρόμησης στο σύνολό της.
    4. Αξιολογήστε τη στατιστική σημασία των παραμέτρων παλινδρόμησης και συσχέτισης.
    5. Πραγματοποιήστε πρόβλεψη κόστους παραγωγής με προβλεπόμενη απόδοση 195% του μέσου επιπέδου.
    6. Αξιολογήστε την ακρίβεια της πρόβλεψης, υπολογίστε το σφάλμα πρόβλεψης και το διάστημα εμπιστοσύνης του.
    7. Αξιολογήστε το μοντέλο μέσω μέσο σφάλμαπροσεγγίσεις.

    Λύση:

    1. Η εξίσωση είναι y = α + βx
    1. Παράμετροι εξίσωσης παλινδρόμησης.
    Μέσες τιμές

    Διασπορά

    Τυπική απόκλιση

    Συντελεστής συσχέτισης

    Η σχέση μεταξύ του χαρακτηριστικού Υ και του παράγοντα Χ είναι ισχυρή και άμεση
    Εξίσωση παλινδρόμησης

    Συντελεστής προσδιορισμού
    R2 = 0,94 2 = 0,89, δηλ. στο 88,9774% των περιπτώσεων, οι αλλαγές στο x οδηγούν σε αλλαγές στο y. Με άλλα λόγια, η ακρίβεια επιλογής της εξίσωσης παλινδρόμησης είναι υψηλή

    Χ y x 2 y 2 x∙y y(x) (y-y cp) 2 (y-y(x)) 2 (x-x p) 2
    78 133 6084 17689 10374 142.16 115.98 83.83 1
    82 148 6724 21904 12136 148.61 17.9 0.37 9
    87 134 7569 17956 11658 156.68 95.44 514.26 64
    79 154 6241 23716 12166 143.77 104.67 104.67 0
    89 162 7921 26244 14418 159.9 332.36 4.39 100
    106 195 11236 38025 20670 187.33 2624.59 58.76 729
    67 139 4489 19321 9313 124.41 22.75 212.95 144
    88 158 7744 24964 13904 158.29 202.51 0.08 81
    73 152 5329 23104 11096 134.09 67.75 320.84 36
    87 162 7569 26244 14094 156.68 332.36 28.33 64
    76 159 5776 25281 12084 138.93 231.98 402.86 9
    115 173 13225 29929 19895 201.86 854.44 832.66 1296
    0 0 0 16.3 20669.59 265.73 6241
    1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

    Σημείωση: οι τιμές του y(x) βρίσκονται από την προκύπτουσα εξίσωση παλινδρόμησης:
    y(1) = 4,01*1 + 99,18 = 103,19
    y(2) = 4,01*2 + 99,18 = 107,2
    ... ... ...

    2. Εκτίμηση παραμέτρων εξίσωσης παλινδρόμησης
    Σημασία του συντελεστή συσχέτισης

    Χρησιμοποιώντας τον πίνακα του Μαθητή βρίσκουμε τον Πίνακα
    T πίνακας (n-m-1;α/2) = (11;0.05/2) = 1.796
    Από το Tob > Ttabl, απορρίπτουμε την υπόθεση ότι ο συντελεστής συσχέτισης είναι ίσος με 0. Με άλλα λόγια, ο συντελεστής συσχέτισης είναι στατιστικά σημαντικός.

    Ανάλυση της ακρίβειας του προσδιορισμού των εκτιμήσεων των συντελεστών παλινδρόμησης





    S a = 0,1712
    Διαστήματα εμπιστοσύνης για την εξαρτημένη μεταβλητή

    Ας υπολογίσουμε τα όρια του διαστήματος στο οποίο θα συγκεντρωθεί το 95% των πιθανών τιμών του Y για απεριόριστο μεγάλος αριθμόςπαρατηρήσεις και Χ = 1
    (-20.41;56.24)
    Έλεγχος υποθέσεων σχετικά με συντελεστές γραμμική εξίσωσηοπισθοδρόμηση
    1) t-statistics


    Επιβεβαιώνεται η στατιστική σημασία του συντελεστή παλινδρόμησης α

    Η στατιστική σημασία του συντελεστή παλινδρόμησης b δεν επιβεβαιώνεται
    Διάστημα εμπιστοσύνης για συντελεστές εξίσωσης παλινδρόμησης
    Ας ορίσουμε διαστήματα εμπιστοσύνηςσυντελεστές παλινδρόμησης, οι οποίοι με αξιοπιστία 95% θα είναι οι εξής:
    (a - t S a ; a + t S a)
    (1.306;1.921)
    (b - t b S b ; b + t b S b)
    (-9.2733;41.876)
    όπου t = 1,796
    2) F-statistics


    Fkp = 4,84
    Δεδομένου ότι F > Fkp, ο συντελεστής προσδιορισμού είναι στατιστικά σημαντικός