Βιογραφίες Χαρακτηριστικά Ανάλυση

Παράμετρος α στην εξίσωση γραμμικής παλινδρόμησης ζευγαρωμένης. Διαστήματα εμπιστοσύνης για την εξαρτημένη μεταβλητή

Στείλτε την καλή δουλειά σας στη βάση γνώσεων είναι απλή. Χρησιμοποιήστε την παρακάτω φόρμα

Καλή δουλειάστον ιστότοπο">

Φοιτητές, μεταπτυχιακοί φοιτητές, νέοι επιστήμονες που χρησιμοποιούν τη βάση γνώσεων στις σπουδές και την εργασία τους θα σας είναι πολύ ευγνώμονες.

Δημοσιεύτηκε στις http:// www. όλα τα καλύτερα. ru/

Υπουργείο Παιδείας και Επιστημών της Ρωσικής Ομοσπονδίας

Ομοσπονδιακός κρατικός προϋπολογισμός εκπαιδευτικό ίδρυμαανώτερη εκπαίδευση

"Κρατικό Τεχνικό Πανεπιστήμιο Komsomolsk-on-Amur"

Σχολή Οικονομικών και Διοίκησης

Τμήμα Οικονομίας, Χρηματοοικονομικής και Λογιστικής

ΥΠΟΛΟΓΙΣΜΟΣ ΚΑΙ ΓΡΑΦΙΚΗ ΕΡΓΑΣΙΑ

στο γνωστικό αντικείμενο "Οικομετρία"

Ομαδικός μαθητής

A.Yu. Ζαϊτσένκο

Δάσκαλος

Ι.Ι. Αντόνοβα

Τραπέζι 1

Αριθμός περιοχής

Μέσος κατά κεφαλήν μισθός διαβίωσης ανά ημέρα ενός αρτιμελούς ατόμου, τρίψιμο,

Μέσος ημερομίσθιος, τρίψιμο,

Απαιτείται:

1. Κατασκευάστε μια γραμμική εξίσωση για παλινδρόμηση κατά ζεύγη από.

3. Εκτιμήστε τη στατιστική σημασία των παραμέτρων παλινδρόμησης και συσχέτισης χρησιμοποιώντας τη δοκιμή Fisher και τη δοκιμή Student t.

4. Εκτελέστε μια πρόβλεψη μισθοίμε την προβλεπόμενη τιμή του μέσου κατά κεφαλήν επιπέδου διαβίωσης να είναι 107% του μέσου επιπέδου.

5. Εκτιμήστε την ακρίβεια της πρόβλεψης υπολογίζοντας το σφάλμα πρόβλεψης και το διάστημα εμπιστοσύνης του.

6. Σχεδιάστε τα αρχικά δεδομένα και τη θεωρητική ευθεία σε ένα γράφημα.

1. Να υπολογίσετε τις παραμέτρους της εξίσωσης γραμμικής παλινδρόμησηςκατασκευή πίνακα υπολογισμού 2. γραμμική συσχέτιση προσέγγισης παλινδρόμηση

πίνακας 2

Μέση αξία

Η εξίσωση παλινδρόμησης που προκύπτει είναι:

Με αύξηση του μέσου κατά κεφαλήν επιπέδου διαβίωσης κατά 1 τρίψιμο. ο μέσος ημερομίσθιος αυξάνεται κατά μέσο όρο κατά 0,89 ρούβλια.

2. Η εγγύτητα της γραμμικής σύνδεσης θα εκτιμηθεί από τον συντελεστή συσχέτισης:

Αυτό σημαίνει ότι το 51% της διακύμανσης στους μισθούς () εξηγείται από τη διακύμανση του παράγοντα - το μέσο κατά κεφαλήν μισθό διαβίωσης.

Η ποιότητα του μοντέλου καθορίζεται από το μέσο σφάλμα προσέγγισης:

Η ποιότητα του κατασκευασμένου μοντέλου αξιολογείται ως καλή, καθώς δεν ξεπερνά το 8-10%.

3. Θα αξιολογήσουμε τη σημασία της εξίσωσης παλινδρόμησης στο σύνολό της χρησιμοποιώντας το κριτήριο Fisher. Πραγματική αξία του κριτηρίου:

Η πινακοποιημένη τιμή του κριτηρίου σε επίπεδο σημαντικότητας πέντε τοις εκατό και βαθμούς ελευθερίας είναι: Επειδή, η εξίσωση παλινδρόμησης θεωρείται στατιστικά σημαντική.

Θα εκτιμήσουμε τη στατιστική σημασία των παραμέτρων παλινδρόμησης χρησιμοποιώντας τη στατιστική t-student και υπολογίζοντας το διάστημα εμπιστοσύνης κάθε δείκτη.

Η πινακοποιημένη τιμή του κριτηρίου για τον αριθμό των βαθμών ελευθερίας θα είναι:

Ας ορίσουμε τα τυχαία σφάλματα:

Οι πραγματικές τιμές των στατιστικών υπερβαίνουν την τιμή του πίνακα:

Επομένως, οι παράμετροι δεν διαφέρουν από το μηδέν κατά τύχη, αλλά είναι στατιστικά σημαντικές. Ας υπολογίσουμε τα διαστήματα εμπιστοσύνης για τις παραμέτρους παλινδρόμησης και. Για να γίνει αυτό, ορίζουμε οριακό σφάλμαγια κάθε δείκτη:

Διαστήματα εμπιστοσύνης:

Η ανάλυση των άνω και κάτω ορίων των διαστημάτων εμπιστοσύνης οδηγεί στο συμπέρασμα ότι, κατά πάσα πιθανότητα, οι παράμετροι και, εντός των καθορισμένων ορίων, δεν αποδέχονται μηδενικές τιμές, δηλ. δεν είναι στατιστικά ασήμαντες και διαφέρουν σημαντικά από το μηδέν.

4. Οι ληφθείσες εκτιμήσεις της εξίσωσης παλινδρόμησης επιτρέπουν τη χρήση της για πρόβλεψη. Εάν το προβλεπόμενο κόστος ζωής είναι:

τότε η προβλεπόμενη αξία των μισθών θα είναι:

Το σφάλμα πρόβλεψης θα είναι:

Το μέγιστο σφάλμα πρόβλεψης, το οποίο σε περιπτώσεις που δεν θα ξεπεραστεί, θα είναι:

Διάστημα εμπιστοσύνης πρόβλεψης:

Η ολοκληρωμένη πρόβλεψη του μέσου μηνιαίου μισθού είναι αξιόπιστη () και κυμαίνεται από 131,66 ρούβλια. έως 190,62 τρίψτε. Για να ολοκληρώσουμε τη λύση του προβλήματος, ας σχεδιάσουμε τα αρχικά δεδομένα και τη θεωρητική ευθεία γραμμή σε ένα γράφημα (Εικόνα 1)

Εικόνα 1

Δημοσιεύτηκε στο Allbest.ru

Παρόμοια έγγραφα

    Κατασκευή γραμμική εξίσωσηυπολογισμός παλινδρόμησης κατά ζεύγη γραμμικός συντελεστήςσυσχέτιση ζεύγους και μέσο σφάλμαπροσεγγίσεις. Προσδιορισμός συντελεστών συσχέτισης και ελαστικότητας, δείκτης συσχέτισης, η ουσία της εφαρμογής του κριτηρίου Fisher στην οικονομετρία.

    δοκιμή, προστέθηκε 05/05/2010

    Υπολογισμός παραμέτρων γραμμικής παλινδρόμησης κατά ζεύγη. Εκτίμηση της στατιστικής σημασίας της εξίσωσης παλινδρόμησης και των παραμέτρων της χρησιμοποιώντας τεστ Fisher και Student. Κατασκευή πίνακα συντελεστών συσχέτισης ζεύγους. Στατιστική ανάλυσηχρησιμοποιώντας το λογισμικό MS EXCEL.

    δοκιμή, προστέθηκε 14/05/2008

    Υπολογισμός γραμμικού συντελεστή ζεύγους και μερικής συσχέτισης. Στατιστική σημασία των παραμέτρων παλινδρόμησης και συσχέτισης. Ανάλυση του πεδίου δεδομένων συσχέτισης. Ακρίβεια πρόβλεψης, υπολογισμός σφαλμάτων και διάστημα εμπιστοσύνης. Συντελεστής πολλαπλού προσδιορισμού.

    δοκιμή, προστέθηκε στις 11/12/2010

    Οικονομική ερμηνεία του συντελεστή παλινδρόμησης. Εύρεση του στατιστικού αθροίσματος τετραγώνων και εκτίμηση της διακύμανσης των υπολειμμάτων. Έλεγχος της σημασίας των παραμέτρων της εξίσωσης παλινδρόμησης με χρήση του Student's t-test. Υπολογισμός του μέσου σχετικού σφάλματος προσέγγισης.

    δοκιμή, προστέθηκε στις 23/03/2010

    Κατασκευή ενός διαστήματος εμπιστοσύνης για τον συντελεστή παλινδρόμησης. Προσδιορισμός σφάλματος προσέγγισης, δείκτης συσχέτισης και δοκιμή Fisher's F. Εκτίμηση της ελαστικότητας των αλλαγών στην ένταση του υλικού των προϊόντων. Κατασκευή Γραμμικής Εξίσωσης πολλαπλή παλινδρόμηση.

    δοκιμή, προστέθηκε 04/11/2015

    Υπολογισμός παραμέτρων της εξίσωσης γραμμικής παλινδρόμησης, εκτίμηση της εγγύτητας της σχέσης με χρήση δείκτες συσχέτισης και προσδιορισμού. Προσδιορισμός του μέσου σφάλματος προσέγγισης. Στατιστική αξιοπιστία μοντελοποίησης με τη χρήση Fisher's F-test και Student's t-test.

    δοκιμή, προστέθηκε στις 17/10/2009

    Προσδιορισμός της ποσοτικής εξάρτησης της μάζας ενός γουνοφόρα ζώου από την ηλικία του. Κατασκευή εξίσωσης ζευγαρωμένης παλινδρόμησης, υπολογισμός των παραμέτρων της και έλεγχος επάρκειας. Εκτίμηση της στατιστικής σημασίας παραμέτρων παλινδρόμησης, υπολογισμός του διαστήματος εμπιστοσύνης τους.

    εργαστηριακές εργασίες, προστέθηκε 06/02/2014

    Κατασκευάζοντας μια υπόθεση σχετικά με τη μορφή σύνδεσης μεταξύ του κατά κεφαλήν νομισματικού εισοδήματος και των καταναλωτικών δαπανών στις περιοχές των Ουραλίων και της Δυτικής Σιβηρίας της Ρωσικής Ομοσπονδίας. Υπολογισμός παραμέτρων ζευγαρωμένων εξισώσεων παλινδρόμησης, εκτίμηση της ποιότητάς τους με χρήση του μέσου σφάλματος προσέγγισης.

    δοκιμή, προστέθηκε 11/05/2014

    Ανάλυση της μεθόδου ελάχιστα τετράγωναγια παλινδρόμηση κατά ζεύγη, ως μέθοδος εκτίμησης παραμέτρων γραμμικής παλινδρόμησης. Θεώρηση της γραμμικής εξίσωσης παλινδρόμησης κατά ζεύγη. Μελέτη Πολλαπλής Γραμμικής Παλινδρόμησης. Μελέτη των σφαλμάτων των συντελεστών παλινδρόμησης.

    δοκιμή, προστέθηκε 28/03/2018

    Κατασκευή του πεδίου συσχέτισης. Υπολογισμός παραμέτρων ζευγαρωμένων εξισώσεων παλινδρόμησης. Εξάρτηση του μέσου προσδόκιμου ζωής από ορισμένους παράγοντες. Μελέτη του «κριτηρίου Fisher». Αξιολόγηση της εγγύτητας μιας σύνδεσης χρησιμοποιώντας δείκτες συσχέτισης και προσδιορισμού.

100 RURμπόνους για πρώτη παραγγελία

Επιλέξτε τύπο εργασίας Μεταπτυχιακή εργασία Εργασία μαθήματοςΠερίληψη Μεταπτυχιακή Διατριβή Έκθεση για την πρακτική Ανασκόπηση Αναφοράς άρθρου ΔοκιμήΜονογραφία Επίλυση προβλημάτων Επιχειρηματικού Σχεδίου Απαντήσεις σε Ερωτήσεις Δημιουργική εργασίαΔοκίμιο Σχέδιο Εργασίες Μετάφραση Παρουσιάσεις Δακτυλογράφηση Άλλο Αύξηση της μοναδικότητας του κειμένου Μεταπτυχιακή εργασία Εργαστηριακές εργασίεςΔιαδικτυακή βοήθεια

Μάθετε την τιμή

Η ζευγαρωμένη παλινδρόμηση είναι η εξίσωση της σχέσης μεταξύ δύο μεταβλητών

y και x Vida y= φά(Χ),

όπου y είναι η εξαρτημένη μεταβλητή (αποτελεσματικό χαρακτηριστικό).

Το x είναι μια ανεξάρτητη επεξηγηματική μεταβλητή (χαρακτηριστικό-συντελεστής).

Υπάρχουν γραμμικές και μη γραμμικές παλινδρομήσεις.

Μέθοδος ελαχίστων τετραγώνων

Για την εκτίμηση των παραμέτρων των παλινδρομήσεων που είναι γραμμικές σε αυτές τις παραμέτρους, χρησιμοποιείται η μέθοδος των ελαχίστων τετραγώνων (OLS). . Η μέθοδος των ελαχίστων τετραγώνων μας επιτρέπει να λάβουμε τέτοιες εκτιμήσεις παραμέτρων στις οποίες το άθροισμα των τετραγωνικών αποκλίσεων των πραγματικών τιμών του προκύπτοντος χαρακτηριστικού y από τις θεωρητικές τιμές ŷ Χστις ίδιες τιμές συντελεστών Χείναι ελάχιστη, δηλ.

5. Εκτίμηση της στατιστικής σημασίας των δεικτών συσχέτισης, των παραμέτρων της εξίσωσης ζευγαρωμένης γραμμικής παλινδρόμησης και της εξίσωσης παλινδρόμησης στο σύνολό της.

6. Εκτίμηση του βαθμού εγγύτητας της σχέσης μεταξύ ποσοτικών μεταβλητών. Συντελεστής συνδιακύμανσης. Δείκτες συσχέτισης: γραμμικός συντελεστής συσχέτισης, δείκτης συσχέτισης (= θεωρητικός λόγος συσχέτισης).

Συντελεστής συνδιακύμανσης

Mch(y) - Δηλαδή. λαμβάνουμε μια εξάρτηση συσχέτισης.

Η παρουσία συσχέτισης δεν μπορεί να απαντήσει στην ερώτηση σχετικά με την αιτία της σύνδεσης. Η συσχέτιση καθορίζει μόνο το μέτρο αυτής της σύνδεσης, δηλ. ένα μέτρο σταθερής διακύμανσης.

Το μέτρο της σχέσης μεταξύ δύο μεταβλητών μπορεί να βρεθεί χρησιμοποιώντας τη συνδιακύμανση.

, ,

Το μέγεθος του δείκτη συνδιακύμανσης εξαρτάται από τις μονάδες σε γ της μεταβλητής που μετράται. Επομένως, για να εκτιμηθεί ο βαθμός σταθερής διακύμανσης, χρησιμοποιείται ο συντελεστής συσχέτισης - ένα αδιάστατο χαρακτηριστικό που έχει ορισμένα όρια διακύμανσης.

7. Συντελεστής προσδιορισμού. Τυπικό σφάλμα της εξίσωσης παλινδρόμησης.

Συντελεστής προσδιορισμού (rxy2) - χαρακτηρίζει το ποσοστό της διακύμανσης του προκύπτοντος χαρακτηριστικού y που εξηγείται από τη διακύμανση σε συνολική διακύμανσηαποτελεσματικό σημάδι. Όσο πιο κοντά είναι το rxy2 στο 1, τόσο καλύτερο είναι το μοντέλο παλινδρόμησης, δηλαδή, το αρχικό μοντέλο προσεγγίζει καλά τα αρχικά δεδομένα.

8. Εκτίμηση της στατιστικής σημασίας των δεικτών διόρθωσης, των παραμέτρων της εξίσωσης ζευγαρωμένης γραμμικής παλινδρόμησης και της εξίσωσης παλινδρόμησης στο σύνολό της: t- Τεστ μαθητή, φά-Κριτήριο Fisher.

9. Μοντέλα μη γραμμικής παλινδρόμησης και γραμμικοποίησή τους.

Οι μη γραμμικές παλινδρομήσεις χωρίζονται σε δύο κατηγορίες : παλινδρομήσεις που είναι μη γραμμικές ως προς τις επεξηγηματικές μεταβλητές που εξαιρούνται από την ανάλυση, αλλά γραμμικές ως προς τις εκτιμώμενες παραμέτρους και παλινδρομήσεις που είναι μη γραμμικές ως προς τις εκτιμώμενες παραμέτρους.

Παραδείγματα παλινδρόμησης, μη γραμμικό στις επεξηγηματικές μεταβλητές, αλλά γραμμικό στις εκτιμώμενες παραμέτρους:


Μοντέλα μη γραμμικής παλινδρόμησης και γραμμικοποίησή τους

Με μια μη γραμμική εξάρτηση των χαρακτηριστικών, η οποία οδηγεί σε γραμμική μορφή, οι παράμετροι πολλαπλής παλινδρόμησης καθορίζονται επίσης από το OLS με τη μόνη διαφορά ότι δεν χρησιμοποιείται γενικές πληροφορίες, αλλά στα μετασχηματισμένα δεδομένα. Έτσι, λαμβάνοντας υπόψη τη συνάρτηση ισχύος

,

το μετατρέπουμε σε γραμμική μορφή:

όπου οι μεταβλητές εκφράζονται σε λογάριθμους.

Επιπλέον, η επεξεργασία LSM είναι η ίδια: δημιουργείται ένα σύστημα κανονικές εξισώσειςκαι προσδιορίζονται άγνωστες παράμετροι. Ενισχύοντας την τιμή, βρίσκουμε την παράμετρο ένακαι, κατά συνέπεια, τη γενική μορφή της εξίσωσης μιας συνάρτησης ισχύος.

Γενικά μιλώντας, μη γραμμική παλινδρόμησημε βάση τις συμπεριλαμβανόμενες μεταβλητές δεν δημιουργεί δυσκολίες στην εκτίμηση των παραμέτρων του. Αυτή η εκτίμηση προσδιορίζεται, όπως και στη γραμμική παλινδρόμηση, από το OLS. Έτσι, στην εξίσωση μη γραμμικής παλινδρόμησης δύο παραγόντων

Η γραμμικοποίηση μπορεί να πραγματοποιηθεί με την εισαγωγή νέων μεταβλητών σε αυτό . Το αποτέλεσμα είναι μια εξίσωση γραμμικής παλινδρόμησης τεσσάρων παραγόντων

10.Πολυσυγγραμμικότητα. Μέθοδοι για την εξάλειψη της πολυσυγγραμμικότητας.

Οι μεγαλύτερες δυσκολίες στη χρήση της συσκευής πολλαπλής παλινδρόμησης προκύπτουν με την παρουσία πολυσυγγραμμικότητας παραγόντων, όταν περισσότεροι από δύο παράγοντες συνδέονται μεταξύ τους γραμμική εξάρτηση . Η παρουσία πολυσυγγραμμικότητας μεταξύ των παραγόντων μπορεί να σημαίνει ότι ορισμένοι παράγοντες θα ενεργούν πάντα από κοινού. Ως αποτέλεσμα, η διακύμανση στα δεδομένα εισόδου δεν είναι πλέον εντελώς ανεξάρτητη και ο αντίκτυπος κάθε παράγοντα δεν μπορεί να αξιολογηθεί χωριστά.

Όσο ισχυρότερη είναι η πολυσυγγραμμικότητα των παραγόντων, τόσο λιγότερο αξιόπιστη είναι η εκτίμηση της κατανομής του ποσού της εξηγούμενης διακύμανσης μεταξύ των επιμέρους παραγόντων χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (OLS).

Η συμπερίληψη πολυσυγγραμμικών παραγόντων στο μοντέλο είναι ανεπιθύμητη για τους ακόλουθους λόγους:

ü είναι δύσκολο να ερμηνευτούν οι παράμετροι πολλαπλής παλινδρόμησης. οι παράμετροι γραμμικής παλινδρόμησης χάνουν οικονομική αίσθηση;

ü οι εκτιμήσεις παραμέτρων είναι αναξιόπιστες, παρουσιάζουν μεγάλα τυπικά σφάλματα και αλλάζουν με τις αλλαγές στον όγκο των παρατηρήσεων, γεγονός που καθιστά το μοντέλο ακατάλληλο για ανάλυση και πρόβλεψη

Μέθοδοι για την εξάλειψη της πολυσυγγραμμικότητας

- εξαίρεση μεταβλητών από το μοντέλο.

Ωστόσο, απαιτείται κάποια προσοχή κατά τη χρήση αυτή τη μέθοδο. Σε αυτήν την περίπτωση, είναι πιθανά σφάλματα προδιαγραφών.

- λήψη πρόσθετων δεδομένων ή κατασκευή νέου δείγματος.

Μερικές φορές, για να μειωθεί η πολυσυγγραμμικότητα, αρκεί να αυξηθεί το μέγεθος του δείγματος. Για παράδειγμα, εάν χρησιμοποιείτε ετήσια δεδομένα, μπορείτε να μεταβείτε σε τριμηνιαία δεδομένα. Η αύξηση του όγκου των δεδομένων μειώνει τη διακύμανση των συντελεστών παλινδρόμησης και ως εκ τούτου αυξάνει τη στατιστική τους σημασία. Ωστόσο, η απόκτηση ενός νέου δείγματος ή η επέκταση ενός παλιού δεν είναι πάντα δυνατή ή συνδέεται με σοβαρό κόστος. Επιπλέον, αυτή η προσέγγιση μπορεί να αυξηθεί

αυτοσυσχέτιση.

- αλλαγή στις προδιαγραφές του μοντέλου.

Σε ορισμένες περιπτώσεις, το πρόβλημα της πολυσυγγραμμικότητας μπορεί να λυθεί αλλάζοντας τις προδιαγραφές του μοντέλου: είτε αλλάζοντας τη μορφή του μοντέλου είτε προσθέτοντας νέες επεξηγηματικές μεταβλητές που δεν ελήφθησαν υπόψη στο μοντέλο.

- χρήση προκαταρκτικών πληροφοριών σχετικά με ορισμένες παραμέτρους.

11.Κλασικό γραμμικό μοντέλοπολλαπλή εγγραφή (KLMMR). Προσδιορισμός των παραμέτρων του επιπέδου πολλαπλής εγγραφής με τη μέθοδο των ελαχίστων τετραγώνων.

Σκοπός της υπηρεσίας. Χρήση της υπηρεσίας σε online λειτουργίαμπορεί να βρεθεί:
  • παράμετροι της εξίσωσης γραμμικής παλινδρόμησης y=a+bx, συντελεστής γραμμικής συσχέτισης με έλεγχο της σημασίας του.
  • εγγύτητα σύνδεσης με χρήση δεικτών συσχέτισης και προσδιορισμού, εκτίμηση OLS, στατική αξιοπιστία μοντελοποίησης παλινδρόμησης με τη χρήση Fisher's F-test και Student's t-test, διάστημα εμπιστοσύνης της πρόβλεψης για το επίπεδο σημαντικότητας α

Η εξίσωση παλινδρόμησης κατά ζεύγη αναφέρεται εξίσωση παλινδρόμησης πρώτης τάξης. Εάν ένα οικονομετρικό μοντέλο περιέχει μόνο μία επεξηγηματική μεταβλητή, τότε ονομάζεται παλινδρόμηση κατά ζεύγη. Εξίσωση παλινδρόμησης δεύτερης τάξηςΚαι εξίσωση παλινδρόμησης τρίτης τάξηςανατρέξτε σε εξισώσεις μη γραμμικής παλινδρόμησης.

Παράδειγμα. Επιλέξτε την εξαρτημένη (εξηγούμενη) και την επεξηγηματική μεταβλητή για να δημιουργήσετε ένα μοντέλο ζευγοποιημένης παλινδρόμησης. Δώσε. Καθορίζω θεωρητική εξίσωσηπαλινδρόμηση κατά ζεύγη. Αξιολογήστε την επάρκεια του κατασκευασμένου μοντέλου (ερμηνεύστε R-squared, t-statistics, F-statistics).
Λύσηθα πραγματοποιήσουμε στη βάση διαδικασία οικονομετρικής μοντελοποίησης.
1ο στάδιο (δήλωση) – προσδιορισμός των τελικών στόχων της μοντελοποίησης, του συνόλου των παραγόντων και των δεικτών που συμμετέχουν στο μοντέλο και του ρόλου τους.
Προδιαγραφή μοντέλου - καθορισμός του σκοπού της μελέτης και επιλογή των οικονομικών μεταβλητών του μοντέλου.
Καταστασιακή (πρακτική) εργασία. Για 10 επιχειρήσεις στην περιοχή, η εξάρτηση της παραγωγής ανά εργαζόμενο y (χιλιάδες ρούβλια) από ειδικό βάροςεργάτες υψηλά προσόντα V συνολικός αριθμόςεργαζόμενοι x (σε %).
Στάδιο 2 (a priori) – ανάλυση προ-μοντέλου οικονομική ουσίατο φαινόμενο που μελετάται, ο σχηματισμός και η επισημοποίηση εκ των προτέρων πληροφοριών και αρχικών υποθέσεων, ιδίως που σχετίζονται με τη φύση και τη γένεση των αρχικών στατιστικών δεδομένων και των τυχαίων υπολειμματικών συνιστωσών με τη μορφή ορισμένων υποθέσεων.
Ήδη σε αυτό το στάδιο, μπορούμε να μιλήσουμε για μια σαφή εξάρτηση του επιπέδου δεξιοτήτων του εργαζομένου και της παραγωγής του, γιατί όσο πιο έμπειρος είναι ο εργαζόμενος, τόσο μεγαλύτερη είναι η παραγωγικότητά του. Πώς όμως μπορεί να εκτιμηθεί αυτή η εξάρτηση;
Ζευγαρωμένη παλινδρόμησηαντιπροσωπεύει μια παλινδρόμηση μεταξύ δύο μεταβλητών - y και x, δηλαδή ένα μοντέλο της μορφής:

Όπου y είναι η εξαρτημένη μεταβλητή (αποτελεσματικό χαρακτηριστικό). x – ανεξάρτητη, ή επεξηγηματική, μεταβλητή (χαρακτηριστικό-συντελεστής). Το σύμβολο «^» σημαίνει ότι δεν υπάρχει αυστηρή συναρτησιακή σχέση μεταξύ των μεταβλητών x και y, επομένως σχεδόν σε κάθε ειδική περίπτωσηη τιμή y αποτελείται από δύο όρους:

Όπου y είναι η πραγματική τιμή του χαρακτηριστικού που προκύπτει. y x – θεωρητική τιμή του ενεργού χαρακτηριστικού, που βρέθηκε με βάση την εξίσωση παλινδρόμησης. Το ε είναι μια τυχαία μεταβλητή που χαρακτηρίζει την απόκλιση της πραγματικής τιμής του ενεργού χαρακτηριστικού από τη θεωρητική τιμή που βρέθηκε χρησιμοποιώντας την εξίσωση παλινδρόμησης.
Θα δείξουμε γραφικά τη σχέση παλινδρόμησης μεταξύ της παραγωγής ανά εργαζόμενο και του μεριδίου των εργαζομένων υψηλής εξειδίκευσης.


Στάδιο 3 (παραμετροποίηση) – πραγματική μοντελοποίηση, π.χ. επιλογή γενική εικόναμοντέλο, συμπεριλαμβανομένης της σύνθεσης και της μορφής των σχέσεων μεταξύ των μεταβλητών που περιλαμβάνονται σε αυτό. Η επιλογή του τύπου της συναρτησιακής εξάρτησης στην εξίσωση παλινδρόμησης ονομάζεται παραμετροποίηση μοντέλου. Επιλέγω εξίσωση παλινδρόμησης ζεύγους, δηλ. το τελικό αποτέλεσμα y θα επηρεαστεί από έναν μόνο παράγοντα.
Στάδιο 4 (πληροφορίες) – συλλογή των απαραίτητων στατιστικές πληροφορίες, δηλ. καταγραφή των τιμών των παραγόντων και των δεικτών που συμμετέχουν στο μοντέλο. Το δείγμα αποτελείται από 10 επιχειρήσεις του κλάδου.
Στάδιο 5 (αναγνώριση μοντέλου) – εκτίμηση άγνωστων παραμέτρων μοντέλου χρησιμοποιώντας διαθέσιμα στατιστικά δεδομένα.
Για να προσδιορίσουμε τις παραμέτρους του μοντέλου, χρησιμοποιούμε OLS - μέθοδος ελαχίστων τετραγώνων. Το σύστημα των κανονικών εξισώσεων θα μοιάζει με αυτό:
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Για να υπολογίσουμε τις παραμέτρους παλινδρόμησης, θα δημιουργήσουμε έναν πίνακα υπολογισμού (Πίνακας 1).
Χyx 2y 2x y
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

Παίρνουμε τα δεδομένα από τον Πίνακα 1 (τελευταία σειρά) και ως αποτέλεσμα έχουμε:
10a + 171 b = 77
171 a + 3045 b = 1356
Επιλύουμε αυτό το SLAE χρησιμοποιώντας τη μέθοδο Cramer ή τη μέθοδο του αντίστροφου πίνακα.
Λαμβάνουμε εμπειρικούς συντελεστές παλινδρόμησης: b = 0,3251, a = 2,1414
Η εμπειρική εξίσωση παλινδρόμησης είναι:
y = 0,3251 x + 2,1414
Στάδιο 6 (επαλήθευση μοντέλου) – σύγκριση πραγματικών δεδομένων και δεδομένων μοντέλου, έλεγχος της επάρκειας του μοντέλου, αξιολόγηση της ακρίβειας των δεδομένων του μοντέλου.
Πραγματοποιούμε την ανάλυση χρησιμοποιώντας

1. Βασικοί ορισμοί και τύποι

Ζευγαρωμένη παλινδρόμηση- παλινδρόμηση (σχέση) μεταξύ δύο μεταβλητών κ.λπ. προβολή μοντέλου:

πού είναι η εξαρτημένη μεταβλητή (αποτελεσματικό χαρακτηριστικό);

- ανεξάρτητη ερμηνευτική μεταβλητή (παράγοντας χαρακτηριστικών).

Μια διαταραχή ή μια στοχαστική μεταβλητή που περιλαμβάνει την επίδραση παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Σχεδόν σε κάθε μεμονωμένη περίπτωση, η τιμή αποτελείται από δύο όρους:

πού είναι η πραγματική τιμή του χαρακτηριστικού που προκύπτει;

Η θεωρητική τιμή του προκύπτοντος χαρακτηριστικού, που βρέθηκε με βάση την εξίσωση παλινδρόμησης. Το σύμβολο «^» σημαίνει ότι δεν υπάρχει αυστηρή λειτουργική σχέση μεταξύ των μεταβλητών και.

Διακρίνω γραμμικόςΚαι μη γραμμικόοπισθοδρόμηση.

Γραμμικής παλινδρόμησηςπεριγράφεται από την εξίσωση της γραμμής

Μη γραμμικές παλινδρομήσειςχωρίζονται σε δύο κατηγορίες:

1) παλινδρόμηση, μη γραμμικό στις επεξηγηματικές μεταβλητές, αλλά γραμμικό στις εκτιμώμενες παραμέτρους, Για παράδειγμα:

Πολυώνυμα διαφορετικών βαθμών

Ισόπλευρη υπερβολή

2) παλινδρόμηση, μη γραμμικό στις εκτιμώμενες παραμέτρους, Για παράδειγμα:

Εξουσία

Ενδεικτικός

Εκθετικός

Για την κατασκευή ζευγαρωμένης γραμμικής παλινδρόμησης, υπολογίζονται βοηθητικά μεγέθη ( - αριθμός παρατηρήσεων).

Δείγμα μέσα: Και

Συνδιακύμανση δείγματοςανάμεσα και

ή

Συνδιακύμανση- Αυτό αριθμητικό χαρακτηριστικόκοινή κατανομή των δύο τυχαίες μεταβλητές.

Δείγμα διακύμανσης για

ή

Δείγμα διακύμανσης για

ή

Διακύμανση δείγματοςχαρακτηρίζει τον βαθμό διασποράς των τιμών μιας τυχαίας μεταβλητής γύρω από τη μέση τιμή (μεταβλητότητα, μεταβλητότητα).

Αξιολογείται η στενότητα της σύνδεσης μεταξύ των φαινομένων που μελετώνται συντελεστής συσχέτισης δείγματοςανάμεσα και

Ο συντελεστής συσχέτισης κυμαίνεται από -1 έως +1. Όσο πιο κοντά από το modulo στο 1, τόσο πιο κοντά στατιστική εξάρτησημεταξύ και σε γραμμική λειτουργική.

Αν =0, τότε γραμμική σύνδεσημεταξύ και λείπει?<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

Μια θετική τιμή του συντελεστή δείχνει ότι η σχέση μεταξύ των χαρακτηριστικών είναι άμεση (με την ανάπτυξη η τιμή αυξάνεται), μια αρνητική τιμή δείχνει μια αντίστροφη σχέση (με την ανάπτυξη η τιμή μειώνεται).

Δόμηση Γραμμικής Παλινδρόμησηςκαταλήγει στην εκτίμηση των παραμέτρων του και η κλασική προσέγγιση για την εκτίμηση των παραμέτρων γραμμικής παλινδρόμησης βασίζεται σε μέθοδος ελαχίστων τετραγώνων(MNC). Η μέθοδος των ελαχίστων τετραγώνων μας επιτρέπει να λάβουμε τέτοιες εκτιμήσεις παραμέτρων στις οποίες το άθροισμα των τετραγωνικών αποκλίσεων των πραγματικών τιμών του προκύπτοντος χαρακτηριστικού από τις θεωρητικές είναι ελάχιστο, δηλ.

Για τη γραμμική παλινδρόμηση, οι παράμετροι και βρίσκονται από το σύστημα των κανονικών εξισώσεων:

Λύνοντας το σύστημα, βρίσκουμε Vεπί

και παράμετρος

Συντελεστήςμε μια μεταβλητή παράγοντα δείχνει πόσο θα αλλάξει η μέση τιμή όταν ο συντελεστής αλλάξει κατά μονάδα μέτρησης.

Η παράμετρος όταν το If δεν μπορεί να είναι ίση με 0, τότε δεν έχει οικονομική σημασία. Μπορείτε να ερμηνεύσετε το πρόσημο μόνο εάν τότε η σχετική αλλαγή στο αποτέλεσμα συμβαίνει πιο αργά από την αλλαγή στον παράγοντα, δηλ. η διακύμανση του αποτελέσματος είναι μικρότερη από τη διακύμανση του παράγοντα και το αντίστροφο.

Για να αξιολογήσετε την ποιότητα του κατασκευασμένου μοντέλου παλινδρόμησης, μπορείτε να χρησιμοποιήσετε συντελεστή προσδιορισμούή μέσο σφάλμα προσέγγισης.

ΠΡΟΣ ΤΗΝσυντελεστή προσδιορισμού

Ή

δείχνει το μερίδιο διακύμανσης που εξηγείται από παλινδρόμηση στη συνολική διακύμανση του προκύπτοντος χαρακτηριστικού.Αντίστοιχα, η τιμή χαρακτηρίζει το μερίδιο διακύμανσης στον δείκτη που προκαλείται από την επίδραση παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο και άλλους λόγους.

Όσο πιο κοντά στο 1, τόσο καλύτερο είναι το μοντέλο παλινδρόμησης, δηλ. το κατασκευασμένο μοντέλο προσεγγίζει καλά τα αρχικά δεδομένα.

Μέσο σφάλμα προσέγγισης- αυτή είναι η μέση σχετική απόκλιση των θεωρητικών τιμών από τις πραγματικές τιμές, δηλ.

Η κατασκευασμένη εξίσωση παλινδρόμησης θεωρείται ικανοποιητική εάν η τιμή δεν υπερβαίνει το 10-12%.

Για γραμμική παλινδρόμηση μέσος συντελεστής ελαστικότηταςβρίσκεται με τον τύπο:

Μέσος συντελεστής ελαστικότηταςδείχνει σε ποιο ποσοστό κατά μέσο όρο θα αλλάξει το αποτέλεσμα από την τιμή του όταν ο συντελεστής αλλάξει κατά 1% της τιμής του.

ΕκτίμησηnachimostΚαιεξισώσεις παλινδρόμησηςγενικά δίνεται χρησιμοποιώντας το Fisher test, το οποίο συνίσταται στον έλεγχο της υπόθεσης σχετικά με τη στατιστική ασημαντότητα της εξίσωσης παλινδρόμησης . Για να γίνει αυτό, γίνεται σύγκριση πραγματικόςμιουρανόςΚαι κρίσιμος(πίνακες) τιμές - Τεστ Fisher .

καθορίζεται από την αναλογία των τιμών του παράγοντα και των υπολειπόμενων διακυμάνσεων που υπολογίζονται ανά βαθμό ελευθερίας, δηλ.

- η μέγιστη δυνατή τιμή του κριτηρίου υπό την επίδραση τυχαίων παραγόντων με βαθμούς ελευθερίας =1, =-2 και το επίπεδο σημαντικότητας βρίσκεται από τον πίνακα του κριτηρίου Fisher (Πίνακας 1 του παραρτήματος).

Επίπεδο σημασίας- Αυτή είναι η πιθανότητα απόρριψης μιας σωστής υπόθεσης δεδομένου ότι είναι αληθινή.

Αν τότε απορρίπτεται η υπόθεση για την απουσία σύνδεσης μεταξύ του μελετημένου δείκτη και του παράγοντα και εξάγεται συμπέρασμα σχετικά με τη σημασία αυτής της σύνδεσης με το επίπεδο σημαντικότητας (δηλαδή, η εξίσωση παλινδρόμησης είναι σημαντική).

Αν τότε γίνεται αποδεκτή η υπόθεση και αναγνωρίζεται η στατιστική ασημαντότητα και αναξιοπιστία της εξίσωσης παλινδρόμησης.

Για γραμμική παλινδρόμηση σημασίασυντελεστές παλινδρόμησηςαξιολογείται χρησιμοποιώντας - Τεστ μαθητή, σύμφωνα με το οποίο διατυπώνεται μια υπόθεση για την τυχαία φύση των δεικτών, δηλ. για την ασήμαντη διαφορά τους από το μηδέν. Στη συνέχεια, υπολογίζονται οι πραγματικές τιμές του κριτηρίου για καθέναν από τους εκτιμώμενους συντελεστές παλινδρόμησης, δηλ.

που και - τυπικά σφάλματαΟι παράμετροι γραμμικής παλινδρόμησης καθορίζονται από τους τύπους:

- Η μέγιστη δυνατή τιμή της δοκιμής Student υπό την επίδραση τυχαίων παραγόντων για δεδομένο βαθμό ελευθερίας = -2 και επίπεδο σημαντικότητας βρίσκεται από τον πίνακα της δοκιμής Student (Πίνακας 2 του παραρτήματος).

Αν τότε απορρίπτεται η υπόθεση για την ασημαντότητα του συντελεστή παλινδρόμησης με το επίπεδο σημαντικότητας δηλ. ο συντελεστής ( ή ) δεν είναι τυχαία διαφορετικός από το μηδέν και σχηματίστηκε υπό την επίδραση ενός συστηματικά ενεργού παράγοντα

Αν τότε η υπόθεση δεν απορρίπτεται και αναγνωρίζεται η τυχαία φύση του σχηματισμού της παραμέτρου.

Σημασία γραμμικού συντελεστή συσχέτισηςελέγχεται επίσης με - Τεστ μαθητή, δηλ.

Η υπόθεση για την ασημαντότητα του συντελεστή συσχέτισης απορρίπτεται με επίπεδο σημαντικότητας εάν

Σχόλιο.Για την παλινδρόμηση γραμμικού ζεύγους, ο έλεγχος υποθέσεων σχετικά με τη σημασία του συντελεστή και του συντελεστή συσχέτισης είναι ισοδύναμος με τον έλεγχο της υπόθεσης σχετικά με τη σημασία της εξίσωσης παλινδρόμησης στο σύνολό της, δηλ.

Για να υπολογίσετε το διάστημα εμπιστοσύνης, προσδιορίστε οριακό σφάλμαγια κάθε δείκτη, δηλ.

Διαστήματα εμπιστοσύνηςγια συντελεστές γραμμικής παλινδρόμησης:

Εάν το μηδέν εμπίπτει στο διάστημα εμπιστοσύνης, δηλ. το κατώτερο όριο είναι αρνητικό και το ανώτερο θετικό, τότε η εκτιμώμενη παράμετρος λαμβάνεται ως μηδέν, επειδή δεν μπορεί να λάβει ταυτόχρονα θετική και αρνητική σημασία.

Προβλεπόμενη τιμήπροσδιορίζεται αντικαθιστώντας την αντίστοιχη προβλεπόμενη τιμή στην εξίσωση παλινδρόμησης και στη συνέχεια υπολογίζεται μέσο τυπικό σφάλμα πρόβλεψης

Οπου

και κατασκευάζεται διάστημα εμπιστοσύνης πρόβλεψης

Το διάστημα μπορεί να είναι αρκετά μεγάλο λόγω του μικρού όγκου των παρατηρήσεων.

παλινδρομήσεις, μη γραμμική στις συμπεριλαμβανόμενες μεταβλητές , ανάγονται σε γραμμική μορφή με μια απλή αλλαγή μεταβλητών και η περαιτέρω εκτίμηση των παραμέτρων πραγματοποιείται χρησιμοποιώντας ελάχιστα τετράγωνα.

σολυπερβολήπαθολογική παλινδρόμηση:

R εξόρμηση , μη γραμμικό μι σύμφωνα με τις αξιολογούμενες παραμέτρους , χωρίζονται σε δύο τύπους: εσωτερικά μη γραμμικόκαι ούτω καθεξής. (δεν ανάγεται σε γραμμική μορφή) και εσωτερικά γραμμικό(ανάγεται σε γραμμική μορφή χρησιμοποιώντας κατάλληλους μετασχηματισμούς), για παράδειγμα:

Εκθετική παλινδρόμηση:

Γραμμικοποίηση μετασχηματισμού:

Παλινδρόμηση ισχύος:

Γραμμικοποίηση μετασχηματισμού:

Δείκτηςνέα παλινδρόμηση:

Γραμμικοποίηση μετασχηματισμού:

Λογαριθμικήη παλινδρόμηση:

Γραμμικοποίηση μετασχηματισμού:

2. Επίλυση τυπικών προβλημάτων

Παράδειγμα9 .1 . Για 15 γεωργικές επιχειρήσεις (Πίνακας 9.1) είναι γνωστά τα ακόλουθα: - ο αριθμός του εξοπλισμού ανά μονάδα σπαρμένης έκτασης (μονάδες/ha) και - ο όγκος των καλλιεργούμενων προϊόντων (χιλιάδες χρηματικές μονάδες). Απαραίτητη:

1) προσδιορίστε την εξάρτηση από

2) να δημιουργήσετε πεδία συσχέτισης και ένα γράφημα της εξίσωσης γραμμικής παλινδρόμησης

3) εξάγετε ένα συμπέρασμα σχετικά με την ποιότητα του μοντέλου και υπολογίστε την τιμή πρόβλεψης με τιμή πρόβλεψης 112% του μέσου επιπέδου.

Πίνακας 9.1

Λύση:

1) Στο Excel, δημιουργήστε τον βοηθητικό πίνακα 9.2.

Πίνακας 9.2

Ρύζι.9 .1. Πίνακας υπολογισμού ενδιάμεσων τιμών

Ας υπολογίσουμε τον αριθμό των μετρήσεων Για να γίνει αυτό, στο κελί Β19βάζω = COUNT(A2:A16 ) .

Χρησιμοποιώντας τη συνάρτηση ∑ (AutoSum) στη γραμμή εργαλείων Πρότυπο Τ Νάγια βρείτε το άθροισμα όλων (κελί Β17) και (κελί C17).

Ρύζι. 9.2. Υπολογισμός του αθροίσματος των τιμών και των μέσων

Για τον υπολογισμό των μέσων τιμών, χρησιμοποιούμε την ενσωματωμένη συνάρτηση MS Excel AVERAGE()· το εύρος τιμών για τον προσδιορισμό του μέσου όρου υποδεικνύεται σε παρενθέσεις. Έτσι, ο μέσος όγκος των καλλιεργούμενων προϊόντων για 15 εκμεταλλεύσεις είναι 210.833 χιλιάδες. μονάδες και η μέση ποσότητα εξοπλισμού είναι 6.248 μονάδες/εκτάριο.

Για να γεμίσετε στήλες ρε, μι, φάεισάγετε τον τύπο για τον υπολογισμό του γινομένου: στο κελί ρε2 βάζω = B2*C2, μετά πατήστε ENTER στο πληκτρολόγιό σας. Αριστερό κλικ στο κελί ρε2 και, πιάνοντας την κάτω δεξιά γωνία αυτού του κελιού (μαύρο σύμβολο συν), τραβήξτε το προς τα κάτω στο κελί ρε16 . Το εύρος θα συμπληρωθεί αυτόματα ρε3 - ρε16 .

Για να υπολογίσετε σε επιλεκτικάω συνδιακύμανσημεταξύ και χρησιμοποιούμε τον τύπο δηλ. στο κελί σι21 βάζω = ρε18- σι18* ντο18 και παίρνουμε 418.055 (Εικ. 9.3).

Ρύζι.9 .3. Υπολογισμός

ΕκλεκτικόςΟυάουδιασποράYuγιατί βρίσκουμε χρησιμοποιώντας τον τύπο για αυτό στο κελί σι22 βάζω = Ε18-Β18^2 (^- σύμβολο που δηλώνει εκθετικότητα ) και παίρνουμε 11.337. Ομοίως, προσδιορίζουμε =16745.05556 (Εικ. 9.4)

Ρύζι.9 .4. ΥπολογισμόςVar(Χ) ΚαιVar (y)

Στη συνέχεια, χρησιμοποιώντας την τυπική συνάρτηση MS Excel "CORREL", υπολογίζουμε την τιμή του συντελεστή γραμμικής συσχέτισης για το πρόβλημά μας, η συνάρτηση θα έχει τη μορφή "=CORREL(B2:B16;C2:C16)" και την τιμή rxy= 0,96. Η προκύπτουσα τιμή του συντελεστή συσχέτισης δείχνει μια άμεση και ισχυρή σύνδεση μεταξύ της διαθεσιμότητας του εξοπλισμού και του όγκου των καλλιεργούμενων προϊόντων.

Βρίσκουμε Vδείγμα συντελεστή γραμμικής παλινδρόμησης =36,87; παράμετρος = -17,78. Αυτό σημαίνει ότι η εξίσωση ζευγαρωμένης γραμμικής παλινδρόμησης έχει τη μορφή =-17,78+36,87

Ο συντελεστής δείχνει ότι με αύξηση της ποσότητας του εξοπλισμού κατά 1 μονάδα/στρέμμα, ο όγκος των καλλιεργούμενων προϊόντων θα αυξηθεί κατά μέσο όρο κατά 36.875 χιλιάδες. μονάδες (Εικ. 9.5)

Ρύζι.9 .5. Υπολογισμός παραμέτρων εξίσωσης παλινδρόμησης.

Έτσι, η εξίσωση παλινδρόμησης θα μοιάζει με: .

Αντικαθιστούμε τις πραγματικές τιμές στην εξίσωση που προκύπτει Χ(ποσότητα εξοπλισμού) βρίσκουμε τις θεωρητικές τιμές των όγκων των καλλιεργούμενων προϊόντων (Εικ. 9.6).

Ρύζι.9 .6. Υπολογισμός θεωρητικών τιμών όγκων καλλιεργούμενων προϊόντων

Χρησιμοποιώντας Οδηγός γραφήματοςχτίζουμε πεδία συσχέτισης (επισήμανση στηλών με τιμές και ) και μια εξίσωση γραμμικής παλινδρόμησης (επισήμανση στηλών με τιμές και ). Επιλογή του τύπου γραφήματος - Τ θέαμα Στο διάγραμμα που προκύπτει, συμπληρώστε τις απαραίτητες παραμέτρους (τίτλος, ετικέτες αξόνων, υπόμνημα κ.λπ.). Ως αποτέλεσμα, λαμβάνουμε το γράφημα που φαίνεται στο Σχ. 9.7.

Ρύζι.9 .7. Γράφημα της εξάρτησης του όγκου των καλλιεργούμενων προϊόντων από την ποσότητα του εξοπλισμού

Για να αξιολογήσουμε την ποιότητα του κατασκευασμένου μοντέλου παλινδρόμησης, υπολογίζουμε:

. Προς τηνσυντελεστή προσδιορισμού=0,92, που δείχνει ότι η αλλαγή στο κόστος παραγωγής εξηγείται κατά 92% από τη μεταβολή του όγκου παραγωγής και το 8% οφείλεται σε παράγοντες που δεν λαμβάνονται υπόψη στο μοντέλο, γεγονός που υποδεικνύει την ποιότητα του κατασκευασμένου μοντέλου παλινδρόμησης.

. Μεκόκκινοyuyuλάθοςστοπροσεγγίσεις. Για να το κάνετε αυτό, στη στήλη HΑς υπολογίσουμε τη διαφορά μεταξύ των πραγματικών και των θεωρητικών τιμών a στη στήλη Εγώ- έκφραση. Λάβετε υπόψη ότι η τυπική συνάρτηση MS Excel "ABS" χρησιμοποιείται για τον υπολογισμό τιμών modulo. Κατά τον πολλαπλασιασμό της μέσης τιμής (κελί Εγώ18 ) στο 100% παίρνουμε 18,2%. Κατά συνέπεια, κατά μέσο όρο, οι θεωρητικές τιμές αποκλίνουν από τις πραγματικές κατά 18,2% (Εικ. 1.8).

Χρησιμοποιώντας το κριτήριο Fisher, υπολογίζουμε ηnachimostσιεξισώσειςκανω ΕΓΓΡΑΦΗΜεαυτά γενικά: 150,74.

Σε επίπεδο σημαντικότητας 0,05 = 4,67, προσδιορίζουμε χρησιμοποιώντας την ενσωματωμένη στατιστική συνάρτηση ΓΡΗΓΟΡΟΤΕΡΑ(Εικ. 1.9). Είναι απαραίτητο να θυμάστε ότι το "Degrees_freedom1" είναι ο παρονομαστής και το "Degrees_freedom2" είναι ο αριθμητής, όπου είναι ο αριθμός των παραμέτρων στην εξίσωση παλινδρόμησης (έχουμε 2), n- ο αριθμός των αρχικών ζευγών τιμών (έχουμε 15).

Επειδή τότε η εξίσωση παλινδρόμησης είναι σημαντική στο =0,05.

Ρύζι.9 .8. Προσδιορισμός του συντελεστή προσδιορισμού καιμέσο σφάλμα προσέγγισης

Ρύζι. 9 . 9 . Παράθυρο διαλόγουλειτουργίεςΓΡΗΓΟΡΟΤΕΡΑ

Στη συνέχεια ορίζουμε Μεμέσος συντελεστής ελαστικότηταςσύμφωνα με τον τύπο. Τα ευρήματα δείχνουν ότι με αύξηση του όγκου των βιομηχανικών προϊόντων κατά 1%, το κόστος παραγωγής αυτών των προϊόντων κατά μέσο όρο στο σύνολο θα αυξηθεί κατά 1,093%.

Ας υπολογίσουμε προβλεπόμενη τιμήαντικαθιστώντας στην εξίσωση παλινδρόμησης =-19,559+36,8746 την προβλεπόμενη τιμή του παράγοντα =1,12=6,248*1,12=6,9978. Παίρνουμε =238,48. Κατά συνέπεια, με την ποσότητα του εξοπλισμού στην ποσότητα των 6,9978 μονάδων/στρέμμα, ο όγκος της παραγωγής θα είναι 238,48 χιλιάδες. μονάδες

Ας βρούμε την υπολειπόμενη διακύμανση· για να γίνει αυτό, υπολογίζουμε το άθροισμα των τετραγώνων της διαφοράς μεταξύ της πραγματικής και της θεωρητικής τιμής. =39,166 βάζοντας τον ακόλουθο τύπο = ROOT(J17/(B19-2))στο κελί H2 1 (Εικ. 9.10).

Ρύζι.9 .10. Προσδιορισμός υπολειπόμενης διακύμανσης

ΜΕκόκκινογιάγιαπρότυποτο λάθοςπρόβλεψη:

Σε επίπεδο σημαντικότητας =0,05 με χρήση της ενσωματωμένης στατιστικής συνάρτησης ΜΕΛΕΤΗ ΑΝΑΚΑΛΥΨΗας ορίσουμε =2,1604 και ας υπολογίσουμε το μέγιστο σφάλμα πρόβλεψης, το οποίο στο 95% των περιπτώσεων δεν θα ξεπεράσει .

ρεδιάστημα εμπιστοσύνης πρόβλεψης:

Ή .

Η ολοκληρωμένη πρόβλεψη του κόστους παραγωγής αποδείχθηκε αξιόπιστη (1-0,05 = 0,95), αλλά ανακριβής, καθώς το εύρος των άνω και κάτω ορίων του διαστήματος εμπιστοσύνης είναι φορές. Αυτό συνέβη λόγω του μικρού όγκου των παρατηρήσεων.

Πρέπει να σημειωθεί ότι το MS Excel διαθέτει ενσωματωμένες στατιστικές συναρτήσεις που μπορούν να μειώσουν σημαντικά τον αριθμό των ενδιάμεσων υπολογισμών, για παράδειγμα (Εικ. 9.11.):

Να υπολογίσω VεκλεκτικόςΧμέση τιμήΧχρησιμοποιήστε τη λειτουργία AVERAGE(number1:numberΝ) από την κατηγορία Στατιστικός .

Συνδιακύμανση δείγματοςμεταξύ και βρίσκεται χρησιμοποιώντας τη συνάρτηση KOVAR(συστοιχΧ;πίνακαςΥ) από την κατηγορία Στατιστικός .

ΕκλεκτικόςμικρόδιασποράΚαικαθορίζεται από στατιστική συνάρτηση DISPR(αριθμός 1: αριθμόςΝ) .

Ρύζι.9 .έντεκα. Υπολογισμός nπαρόχους με ενσωματωμένες λειτουργίεςΚυρίαΠροέχω

ΠΠαράμετροςμικρόγραμμικής παλινδρόμησηςστο Excel μπορείτε να το ορίσετε με διάφορους τρόπους.

1 τρόπος) Χρησιμοποιώντας την ενσωματωμένη λειτουργία LINEST. Η διαδικασία είναι η εξής:

1. Επιλέξτε μια περιοχή 5x2 κενών κελιών (5 σειρές, 2 στήλες) για να εμφανίσετε τα αποτελέσματα των στατιστικών παλινδρόμησης ή μια περιοχή 1x2 για να λάβετε μόνο συντελεστές παλινδρόμησης.

2. Με Οδηγοί λειτουργιώναναμεταξύ Στατιστικός επιλέξτε λειτουργία LINESTκαι συμπληρώστε τα επιχειρήματά του (Εικ. 9.12):

Ρύζι. 9 . 12 . Πλαίσιο διαλόγου για την εισαγωγή ορισμάτων συνάρτησηςLINEST

Γνωστές_τιμές_y

Γνωστές_τιμές_Χ

Κωνστ- μια λογική τιμή (1 ή 0), η οποία υποδηλώνει την παρουσία ή την απουσία ενός ελεύθερου όρου στην εξίσωση. σετ 1?

Στατιστική- μια λογική τιμή (1 ή 0), η οποία υποδεικνύει εάν θα εμφανιστούν πρόσθετες πληροφορίες σχετικά με την ανάλυση παλινδρόμησης ή όχι. ρυθμίστε το σε 1.

3. Ο πρώτος αριθμός του πίνακα θα εμφανιστεί στο επάνω αριστερό κελί της επιλεγμένης περιοχής. Για να ανοίξετε ολόκληρο τον πίνακα, πατήστε το κουμπί < φά2> , και μετά - στον συνδυασμό πλήκτρων < CTRL> + < ΒΑΡΔΙΑ> + < ΕΙΣΑΓΩ> .

Τα πρόσθετα στατιστικά στοιχεία παλινδρόμησης θα εμφανίζονται ως (Πίνακας 9.3):

Πίνακας 9.3

Τιμή συντελεστή

Τιμή συντελεστή

RMS
απόκλιση

RMS
απόκλιση

Συντελεστής
προσδιορισμός

RMS
απόκλιση

Στατιστική

Αριθμός βαθμών ελευθερίας

Παλινδρόμηση τετραγώνων

Υπολειπόμενο άθροισμα τετραγώνων

Ως αποτέλεσμα της εφαρμογής της συνάρτησης LINESTπαίρνουμε:

( 2 τρόπος) Χρησιμοποιώντας ένα εργαλείο ανάλυσης δεδομένων Οπισθοδρόμηση μπορείτε να λάβετε τα αποτελέσματα των στατιστικών παλινδρόμησης, ανάλυση της διακύμανσης, διαστήματα εμπιστοσύνης, υπολείμματα, γραφήματα προσαρμογής γραμμής παλινδρόμησης, υπολειπόμενα γραφήματα και κανονική πιθανότητα. Η διαδικασία είναι η εξής:

1. Πρέπει να ελέγξετε την πρόσβαση σε Πακέτο ανάλυσης. Για να το κάνετε αυτό, στο κύριο μενού (μέσω του κουμπιού το γραφείο της Microsoftπρόσβαση στις επιλογές MS Excel) στο παράθυρο διαλόγου Επιλογές ΚυρίαΠροέχω» επιλέξτε την εντολή «Πρόσθετα» και επιλέξτε το πρόσθετο στα δεξιά Ανάλυση πακέτου ΕΝΑ στη συνέχεια κάντε κλικ στο κουμπί «Μετάβαση» (Εικ. 9.13). Στο παράθυρο διαλόγου που ανοίγει, επιλέξτε το πλαίσιο δίπλα στο «Πακέτο ανάλυσης» και κάντε κλικ στο «ΟΚ» (Εικ. 9.14).

Στην καρτέλα Δεδομένα, στην ομάδα Ανάλυση, θα έχετε πρόσβαση στο εγκατεστημένο πρόσθετο. (Εικ. 9.15).

Ρύζι.9 .13. Ενεργοποίηση πρόσθετων στοΚυρίαΠροέχω

Ρύζι.9 .14. Πλαίσιο διαλόγου πρόσθετων

Ρύζι.9 .15. Πρόσθετο ανάλυσης δεδομένων στην κορδέλαΚυρίαΠροέχω 2007 .

2. Επιλέξτε «Δεδομένα» στην ομάδα «Ανάλυση» και επιλέξτε την εντολή Ανάλυση ναι n νυχ στο παράθυρο διαλόγου που ανοίγει, επιλέξτε το εργαλείο ανάλυσης «Προσθήκη» και κάντε κλικ στο «ΟΚ» (Εικ. 9.16):

Ρύζι.9 .16. Πλαίσιο διαλόγου ανάλυσης δεδομένων

Στο παράθυρο διαλόγου που εμφανίζεται (Εικ. 9.17), συμπληρώστε τα πεδία:

Διάστημα εισαγωγήςΥ- εύρος που περιέχει δεδομένα του προκύπτοντος χαρακτηριστικού Y.

Διάστημα εισαγωγήςΧ- εύρος που περιέχει δεδομένα του επεξηγηματικού χαρακτηριστικού X.

Ετικέτες- μια σημαία που υποδεικνύει εάν η πρώτη γραμμή περιέχει ονόματα στηλών ή όχι.

Κωνσταντι-μηδέν- μια σημαία που υποδεικνύει την παρουσία ή την απουσία ενός ελεύθερου όρου στην εξίσωση.

Διάστημα εξόδου- αρκεί να υποδείξετε το επάνω αριστερό κελί της μελλοντικής περιοχής.

Νέο φύλλο εργασίας- μπορείτε να ορίσετε ένα αυθαίρετο όνομα για ένα νέο φύλλο στο οποίο θα εμφανίζονται τα αποτελέσματα.

Ρύζι.9 .17. Πλαίσιο διαλόγου παλινδρόμησης

Για να λάβετε πληροφορίες σχετικά με τα υπολείμματα, τα υπολειμματικά διαγράμματα, την προσαρμογή και την κανονική πιθανότητα, πρέπει να επιλέξετε τα κατάλληλα πλαίσια στο πλαίσιο διαλόγου.

Ρύζι. 9 . 18 . Αποτελέσματα χρήσης του εργαλείουΟπισθοδρόμηση

ΣΕ ΚυρίαΠροέχω γραμμή τάσηςμπορεί να προστεθεί σε διάγραμμα ή γράφημα περιοχής ιστογράμματος. Για αυτό:

1. Είναι απαραίτητο να επιλέξετε την περιοχή σχεδίασης του γραφήματος και να επιλέξετε «Διάταξη» στην κορδέλα και στην ομάδα Ανάλυση επιλέξτε την εντολή «Γραμμή τάσης» (Εικ. 9.19.). Επιλέξτε "Σύνθετες επιλογές γραμμής τάσεων" από το αναπτυσσόμενο στοιχείο μενού.

Ρύζι. 1.19.Ταινία

2. Στο παράθυρο διαλόγου που εμφανίζεται, επιλέξτε τις πραγματικές τιμές και στη συνέχεια θα ανοίξει το πλαίσιο διαλόγου «Μορφή γραμμής τάσης» (Εικ. 9.20.) στο οποίο επιλέγετε τον τύπο γραμμής τάσης και ορίζετε τις κατάλληλες παραμέτρους.

Ρύζι. 9 . 20 . Παράθυρο διαλόγου"Μορφή γραμμής τάσης"

Για μια πολυωνυμική τάση, είναι απαραίτητο να οριστεί ο βαθμός του προσεγγιστικού πολυωνύμου, για γραμμικό φιλτράρισμα- αριθμός σημείων κατά μέσο όρο.

Επιλέγω Γραμμικόςνα κατασκευάσουμε μια εξίσωση γραμμικής παλινδρόμησης.

Οπως και Επιπλέον πληροφορίεςΜπορώ δείξτε την εξίσωση σε διΕΝΑγραμμάριοΚαι τοποθετήστε μια τιμή στο διάγραμμα(Εικ.9.21).

Ρύζι. 9 . 21 . Γραμμική τάση

Μη γραμμικά μοντέλα παλινδρόμησης απεικονίζονται κατά τον υπολογισμό των παραμέτρων της εξίσωσης χρησιμοποιώντας τη στατιστική συνάρτηση που έχει επιλεγεί στο Excel μεγάλοGRFPRIBL. Η διαδικασία υπολογισμού είναι η ίδια με τη χρήση της συνάρτησης LINEST.

Η απλούστερη μορφή παλινδρόμησης από την άποψη των τεχνικών κατανόησης, ερμηνείας και υπολογισμού είναι η γραμμική μορφή παλινδρόμησης.

Εξίσωση γραμμικής παλινδρόμησης ζεύγους, όπου

a 0 , a 1 είναι παράμετροι του μοντέλου, το ε i είναι μια τυχαία μεταβλητή (υπόλοιπη τιμή).

Παράμετροι μοντέλου και το περιεχόμενό τους:


Η εξίσωση παλινδρόμησης συμπληρώνεται με έναν δείκτη της εγγύτητας της σύνδεσης. Ένας τέτοιος δείκτης είναι ο συντελεστής γραμμικής συσχέτισης, ο οποίος υπολογίζεται χρησιμοποιώντας τον τύπο:

ή .

Για την αξιολόγηση της ποιότητας της επιλογής γραμμική συνάρτησηυπολογίζεται το τετράγωνο του γραμμικού συντελεστή συσχέτισης, καλούμενο συντελεστή προσδιορισμού. Ο συντελεστής προσδιορισμού χαρακτηρίζει την αναλογία της διακύμανσης του αποτελεσματικού χαρακτηριστικού που εξηγείται με παλινδρόμηση στη συνολική διακύμανση του ενεργού χαρακτηριστικού:

,

Οπου

.

Αντίστοιχα, η τιμή χαρακτηρίζει το μερίδιο διακύμανσης που προκαλείται από την επίδραση άλλων παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Αφού κατασκευαστεί η εξίσωση παλινδρόμησης, ελέγχεται η επάρκεια και η ακρίβειά της.Οι ιδιότητες αυτές του μοντέλου μελετώνται με βάση την ανάλυση ενός αριθμού υπολειμμάτων ε i (αποκλίσεις των υπολογισμένων τιμών από τις πραγματικές).

Επίπεδο σειράς υπολειμμάτων

Συσχέτιση και ανάλυση παλινδρόμησηςπραγματοποιείται για περιορισμένο πληθυσμό. Από αυτή την άποψη, οι δείκτες παλινδρόμησης, συσχέτισης και προσδιορισμού μπορεί να παραμορφωθούν από τη δράση τυχαίων παραγόντων. Για να ελέγξετε πόσο τυπικοί είναι αυτοί οι δείκτες για ολόκληρο τον πληθυσμό και εάν είναι αποτέλεσμα σύμπτωσης τυχαίων περιστάσεων, είναι απαραίτητο να ελέγξετε την επάρκεια του κατασκευασμένου μοντέλου.

Ο έλεγχος της επάρκειας του μοντέλου συνίσταται στον προσδιορισμό της σημασίας του μοντέλου και στον προσδιορισμό της παρουσίας ή της απουσίας συστηματικό λάθος.

Αξίες στο 1που αντιστοιχεί στα δεδομένα Χ i σε θεωρητικές αξίες ένα 0Και Α'1,τυχαίος. Οι τιμές των συντελεστών που υπολογίζονται από αυτούς θα είναι επίσης τυχαίες. ένα 0Και Α'1.

Η σημασία των επιμέρους συντελεστών παλινδρόμησης ελέγχεται χρησιμοποιώντας Student's t-testελέγχοντας την υπόθεση ότι κάθε συντελεστής παλινδρόμησης είναι ίσος με μηδέν. Ταυτόχρονα, ανακαλύπτουν πόσο τυπικές είναι οι υπολογισμένες παράμετροι για την εμφάνιση ενός συνόλου συνθηκών: εάν οι τιμές παραμέτρων που λαμβάνονται είναι το αποτέλεσμα της δράσης τυχαίων μεταβλητών. Χρησιμοποιούνται κατάλληλοι τύποι για τους αντίστοιχους συντελεστές παλινδρόμησης.

Τύποι για τον προσδιορισμό του Student's t-test

Οπου

S a 0 ,S a 1 - τυπικές αποκλίσεις του ελεύθερου όρου και του συντελεστή παλινδρόμησης. Καθορίζεται από τύπους

Οπου

S ε - τυπική απόκλισηυπολείμματα μοντέλου (τυπικό σφάλμα εκτίμησης), το οποίο καθορίζεται από τον τύπο

Οι υπολογισμένες τιμές του τεστ t συγκρίνονται με την πινακοποιημένη τιμή του κριτηρίου tαγ , το οποίο καθορίζεται όταν (n - κ— 1) βαθμοί ελευθερίας και το αντίστοιχο επίπεδο σημασίας α. Εάν η υπολογιζόμενη τιμή του κριτηρίου t υπερβαίνει την τιμή του πίνακα tαγ, τότε η παράμετρος θεωρείται σημαντική. Σε αυτήν την περίπτωση, είναι σχεδόν αδύνατο οι τιμές των παραμέτρων που βρέθηκαν να οφείλονται μόνο σε τυχαίες συμπτώσεις.

Η σημασία της εξίσωσης παλινδρόμησης στο σύνολό της αξιολογείται με βάση το τεστ Fisher, του οποίου προηγείται ανάλυση διασποράς.

Το συνολικό άθροισμα των τετραγώνων αποκλίσεων μιας μεταβλητής από τη μέση τιμή διασπάται σε δύο μέρη - "εξήγηση" και "ανεξήγητο":

Συνολικό άθροισμα τετραγωνικών αποκλίσεων.

Το άθροισμα των τετραγωνικών αποκλίσεων που εξηγείται από την παλινδρόμηση (ή το άθροισμα των τετραγώνων των αποκλίσεων).


- το υπολειπόμενο άθροισμα των τετραγωνικών αποκλίσεων, που χαρακτηρίζει την επίδραση παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Το σχήμα ανάλυσης διασποράς έχει τη μορφή που παρουσιάζεται στον Πίνακα 35 ( - αριθμός παρατηρήσεων, - αριθμός παραμέτρων για τη μεταβλητή).

Πίνακας 35 - Σχήμα ανάλυσης διασποράς

Στοιχεία διακύμανσης Άθροισμα τετραγώνων Αριθμός βαθμών ελευθερίας Διασπορά ανά βαθμό ελευθερίας
Γενικός
Παραγοντικό
Υπολειπόμενο

Ο καθορισμός της διακύμανσης κατά έναν βαθμό ελευθερίας φέρνει τις διακυμάνσεις σε συγκρίσιμη μορφή. Συγκρίνοντας τον παράγοντα και τις υπολειπόμενες διακυμάνσεις ανά βαθμό ελευθερίας, λαμβάνουμε την τιμή του κριτηρίου Fisher:

Για να ελέγξετε τη σημασία της εξίσωσης παλινδρόμησης στο σύνολό της, χρησιμοποιήστε Τεστ F Fisher. Στην περίπτωση της γραμμικής παλινδρόμησης κατά ζεύγη, η σημασία του μοντέλου παλινδρόμησης προσδιορίζεται από τον ακόλουθο τύπο: .

Εάν, σε ένα δεδομένο επίπεδο σημαντικότητας, η υπολογιζόμενη τιμή της δοκιμής F με γ 1 =k, γ 2 =( p - k - 1) οι βαθμοί ελευθερίας είναι μεγαλύτεροι από τον πίνακα, τότε το μοντέλο θεωρείται σημαντικό, η υπόθεση για την τυχαία φύση των εκτιμώμενων χαρακτηριστικών απορρίπτεται και στατιστική σημασίακαι αξιοπιστία. Ο έλεγχος ύπαρξης ή απουσίας συστηματικού σφάλματος (εκπλήρωση των προαπαιτούμενων της μεθόδου των ελαχίστων τετραγώνων - LSM) πραγματοποιείται με βάση την ανάλυση ενός αριθμού υπολειμμάτων. Ο υπολογισμός των τυχαίων σφαλμάτων των παραμέτρων γραμμικής παλινδρόμησης και του συντελεστή συσχέτισης πραγματοποιείται σύμφωνα με τους τύπους

,

Για να ελέγξετε την τυχαιότητα μιας σειράς υπολειμμάτων, μπορείτε να χρησιμοποιήσετε τη δοκιμή σημείου καμπής (αιχμής). Ένα σημείο θεωρείται σημείο καμπής εάν: παρακάτω συνθήκες: ε i -1< ε i >ε i +1 ή ε i -1 > ε i< ε i +1

Στη συνέχεια, υπολογίζεται ο αριθμός των σημείων καμπής p. Κριτήριο τυχαιότητας με επίπεδο σημαντικότητας 5%, δηλ. Με πιθανότητα εμπιστοσύνης 95%, είναι η εκπλήρωση της ανισότητας:

Οι αγκύλες σημαίνουν ότι έχει ληφθεί ολόκληρο μέροςαριθμός που περικλείεται σε παρένθεση. Εάν η ανισότητα ικανοποιηθεί, τότε το μοντέλο θεωρείται επαρκές.

Για να ελέγξετε την ισότητα μαθηματική προσδοκίαΓια μια υπολειπόμενη ακολουθία μηδέν, υπολογίζεται η μέση τιμή ενός αριθμού υπολειμμάτων:

Αν = 0, τότε θεωρείται ότι το μοντέλο δεν περιέχει σταθερό συστηματικό σφάλμα και είναι επαρκές σύμφωνα με το μηδενικό μέσο κριτήριο.

Αν ≠ 0, τότε ελέγχεται η μηδενική υπόθεση ότι η μαθηματική προσδοκία είναι ίση με μηδέν. Για να το κάνετε αυτό, υπολογίστε το Student's t-test χρησιμοποιώντας τον τύπο:

όπου S ε είναι η τυπική απόκλιση των υπολειμμάτων του μοντέλου (τυπικό σφάλμα).

Η τιμή του κριτηρίου t συγκρίνεται με την πινακοποιημένη t αγ. Εάν η ανισότητα t > t αγ ικανοποιείται, τότε το μοντέλο είναι ανεπαρκές σύμφωνα με αυτό το κριτήριο

Η διασπορά των επιπέδων ενός αριθμού υπολειμμάτων πρέπει να είναι ίδια για όλες τις τιμές Χ(ιδιοκτησία ομοσκεδαστικότητα).Εάν δεν πληρούται αυτή η προϋπόθεση, τότε ετεροσκεδαστικότητα .

Για να εκτιμήσετε την ετεροσκεδαστικότητα με ένα μικρό μέγεθος δείγματος, μπορείτε να χρησιμοποιήσετε Μέθοδος Goldfeld-Quandt, η ουσία του οποίου είναι ότι είναι απαραίτητο:

Τακτοποίηση μεταβλητών τιμών Χμε αύξουσα σειρά?

Διαχωρίστε το σύνολο των διατεταγμένων παρατηρήσεων σε δύο ομάδες.

Για κάθε ομάδα παρατηρήσεων, κατασκευάστε εξισώσεις παλινδρόμησης.

Προσδιορίστε τα υπολειπόμενα αθροίσματα τετραγώνων για την πρώτη και τη δεύτερη ομάδα χρησιμοποιώντας τους τύπους: ; , Οπου

n 1 - αριθμός παρατηρήσεων στην πρώτη ομάδα.

n 2 - αριθμός παρατηρήσεων στη δεύτερη ομάδα.

Υπολογίστε το κριτήριο ή (ο αριθμητής πρέπει να περιέχει μεγάλο άθροισμα τετραγώνων). Κάνοντας μηδενική υπόθεσησχετικά με την ομοσκεδαστικότητα, το κριτήριο υπολογισμού F θα ικανοποιεί το κριτήριο F με βαθμούς ελευθερίας γ 1 =n 1 -m, γ 2 =n - n 1 - m) για κάθε υπολειπόμενο ποσότετράγωνα (όπου μ αριθμός εκτιμώμενων παραμέτρων στην εξίσωση παλινδρόμησης). Όσο περισσότερο η υπολογιζόμενη τιμή F υπερβαίνει την τιμή του πίνακα του κριτηρίου F, τόσο περισσότερο παραβιάζεται η προϋπόθεση της ισότητας των διακυμάνσεων των υπολειμματικών τιμών.

Η ανεξαρτησία της αλληλουχίας των υπολειμμάτων (έλλειψη αυτοσυσχέτισης) ελέγχεται χρησιμοποιώντας το Durbin-Watson d-test. Καθορίζεται από τον τύπο:

Η υπολογισμένη τιμή του κριτηρίου συγκρίνεται με τις χαμηλότερες d1 και ανώτερες d2 κρίσιμες τιμές των στατιστικών Durbin-Watson. Είναι δυνατές οι ακόλουθες περιπτώσεις:

1) αν δ< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

2) αν δ 1 < ρε < d 2 (συμπεριλαμβανομένων αυτών των τιμών), τότε θεωρείται ότι δεν υπάρχουν επαρκείς λόγοι για να εξαχθεί ένα ή άλλο συμπέρασμα. Απαραίτητο για χρήση πρόσθετο κριτήριο, για παράδειγμα ο πρώτος συντελεστής αυτοσυσχέτισης:

Εάν η υπολογισμένη τιμή του συντελεστή στο συντελεστή είναι μικρότερη από την πινακοποιημένη τιμή r 1cr, τότε γίνεται αποδεκτή η υπόθεση της απουσίας αυτοσυσχέτισης. Διαφορετικά αυτή η υπόθεση απορρίπτεται.

3) αν δ 2 < ρε < 2, τότε η υπόθεση για την ανεξαρτησία των υπολειμμάτων γίνεται αποδεκτή και το μοντέλο αναγνωρίζεται ως επαρκές σύμφωνα με αυτό το κριτήριο.

4) αν d> 2, τότε αυτό δείχνει αρνητική αυτοσυσχέτισηαποφάγια Σε αυτήν την περίπτωση, η υπολογισμένη τιμή του κριτηρίου πρέπει να μετατραπεί χρησιμοποιώντας τον τύπο d′= 4 - d και να συγκριθεί με την κρίσιμη τιμή d′ , όχι δ.

Ο έλεγχος εάν η κατανομή της υπολειπόμενης ακολουθίας αντιστοιχεί στον νόμο της κανονικής κατανομής μπορεί να γίνει χρησιμοποιώντας το κριτήριο R/S, το οποίο καθορίζεται από τον τύπο:

όπου S ε είναι η τυπική απόκλιση των υπολειμμάτων του μοντέλου (τυπικό σφάλμα). Η υπολογισμένη τιμή του κριτηρίου R/S συγκρίνεται με τιμές πίνακα(κάτω και άνω όρια αυτή η σχέση), και εάν η τιμή δεν εμπίπτει στο διάστημα μεταξύ των κρίσιμων ορίων, τότε με ένα δεδομένο επίπεδο σημασίας απορρίπτεται η υπόθεση για την κανονικότητα της κατανομής. διαφορετικά η υπόθεση γίνεται αποδεκτή

Για την αξιολόγηση της ποιότητας μοντέλα παλινδρόμησηςείναι επίσης σκόπιμο να χρησιμοποιηθεί δείκτης συσχέτισης(πολλαπλός συντελεστής συσχέτισης).

Τύπος για τον προσδιορισμό του δείκτη συσχέτισης

Οπου

Το συνολικό άθροισμα των τετραγωνικών αποκλίσεων μιας εξαρτημένης μεταβλητής από τον μέσο όρο της. Καθορίζεται από τον τύπο:

Το άθροισμα των τετραγωνικών αποκλίσεων που εξηγείται από την παλινδρόμηση. Καθορίζεται από τον τύπο:

Υπολειπόμενο άθροισμα τετραγωνικών αποκλίσεων. Υπολογίζεται με τον τύπο:

Η εξίσωση μπορεί να αναπαρασταθεί ως εξής:

Ο δείκτης συσχέτισης παίρνει μια τιμή από 0 έως 1. Όσο υψηλότερη είναι η τιμή του δείκτη, τόσο πιο κοντά στις πραγματικές είναι οι υπολογισμένες τιμές του προκύπτοντος χαρακτηριστικού. Ο δείκτης συσχέτισης χρησιμοποιείται για οποιαδήποτε μορφή σύνδεσης μεταξύ μεταβλητών. με ζευγαρωτή γραμμική παλινδρόμηση ισούται με συντελεστής ζεύγουςσυσχετίσεις.

Ως μέτρο της ακρίβειας του μοντέλου, χρησιμοποιούνται χαρακτηριστικά ακρίβειας: Για να προσδιορίσετε το μέτρο ακρίβειας μοντέλου, υπολογίστε:

- μέγιστο σφάλμα- αντιστοιχεί στην απόκλιση της υπολογισμένης απόκλισης των υπολογισμένων τιμών από τις πραγματικές

- μέση τιμή απόλυτο λάθος - το σφάλμα δείχνει πόσο κατά μέσο όρο αποκλίνουν οι πραγματικές τιμές από το μοντέλο

- διακύμανση της σειράς υπολειμμάτων (υπολειπόμενη διακύμανση)

όπου είναι η μέση τιμή μιας σειράς υπολειμμάτων. Καθορίζεται από τον τύπο

- μέσο τετραγωνικό σφάλμα. Αντιπροσωπεύει την τετραγωνική ρίζα της διακύμανσης: , πως μικρότερη αξίαλάθη, τόσο πιο ακριβές είναι το μοντέλο

- μέση τιμή σχετικό σφάλμαπροσεγγίσεις.

Το μέσο σφάλμα προσέγγισης δεν πρέπει να υπερβαίνει το 8-10%.

Εάν το μοντέλο παλινδρόμησης θεωρείται επαρκές και οι παράμετροι του μοντέλου είναι σημαντικές, τότε προχωρήστε στην κατασκευή μιας πρόβλεψης .

Προβλεπόμενη τιμήμεταβλητός στοπροκύπτει αντικαθιστώντας την αναμενόμενη τιμή της ανεξάρτητης μεταβλητής στην εξίσωση παλινδρόμησης Χ progn.

Αυτή η πρόβλεψη ονομάζεται κατά σημείο.Η πιθανότητα να πραγματοποιηθεί μια πρόβλεψη σημείου είναι πρακτικά μηδενική, επομένως το διάστημα εμπιστοσύνης της πρόβλεψης υπολογίζεται με μεγάλη αξιοπιστία.

Τα διαστήματα εμπιστοσύνης για την πρόβλεψη εξαρτώνται από τυπικό σφάλμα, αφαίρεση Χτρέχει από τη μέση τιμή του , αριθμός παρατηρήσεων nκαι το επίπεδο σημαντικότητας της πρόβλεψης α. Τα διαστήματα εμπιστοσύνης προβλέψεων υπολογίζονται χρησιμοποιώντας τον τύπο: ή

Οπου

tπίνακας - προσδιορίζεται από τον πίνακα κατανομής Student για το επίπεδο σημαντικότητας α και τον αριθμό των βαθμών ελευθερίας γ=n-k-1.

Παράδειγμα 13.

Σύμφωνα με έρευνα οκτώ ομάδων οικογενειών, είναι γνωστά στοιχεία για τη σχέση μεταξύ των δαπανών του πληθυσμού για τρόφιμα και του οικογενειακού εισοδήματος (Πίνακας 36).

Πίνακας 36 - Σχέσεις μεταξύ των δαπανών του πληθυσμού για τρόφιμα και επίπεδα οικογενειακού εισοδήματος

Έξοδα για φαγητό, χιλιάδες ρούβλια. 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
Οικογενειακό εισόδημα, χιλιάδες ρούβλια. 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

Ας υποθέσουμε ότι η σχέση μεταξύ του οικογενειακού εισοδήματος και των δαπανών διατροφής είναι γραμμική. Για να επιβεβαιώσουμε την υπόθεσή μας, θα κατασκευάσουμε ένα πεδίο συσχέτισης (Εικόνα 8).

Το γράφημα δείχνει ότι τα σημεία ευθυγραμμίζονται σε μια συγκεκριμένη ευθεία γραμμή.

Για τη διευκόλυνση των περαιτέρω υπολογισμών, θα καταρτίσουμε τον Πίνακα 37.

Ας υπολογίσουμε τις παραμέτρους της γραμμικής εξίσωσης παλινδρόμησης ζεύγους . Για να το κάνουμε αυτό, χρησιμοποιούμε τους τύπους:

Εικόνα 8 - Πεδίο συσχέτισης.

Πήραμε την εξίσωση:

Εκείνοι. με αύξηση του οικογενειακού εισοδήματος κατά 1000 ρούβλια. τα έξοδα διατροφής αυξάνονται κατά 168 ρούβλια.

Υπολογισμός γραμμικού συντελεστή συσχέτισης.