Βιογραφίες Χαρακτηριστικά Ανάλυση

Κατασκευάστε μια γραμμή παλινδρόμησης. Βασικά Γραμμική Παλινδρόμηση

Για τις περιοχές της περιοχής παρέχονται στοιχεία για το 200Χ.

Αριθμός περιοχής Μέσος κατά κεφαλήν ημερομίσθιο διαβίωσης ενός αρτιμελούς ατόμου, τρίψιμο, x Μέσος ημερομίσθιος, τρίψιμο, y
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Ασκηση:

1. Κατασκευάστε ένα πεδίο συσχέτισης και διατυπώστε μια υπόθεση για τη μορφή της σύνδεσης.

2. Υπολογίστε τις παραμέτρους της εξίσωσης γραμμικής παλινδρόμησης

4. Χρησιμοποιώντας τον μέσο (γενικό) συντελεστή ελαστικότητας, δώστε μια συγκριτική εκτίμηση της ισχύος της σχέσης μεταξύ του παράγοντα και του αποτελέσματος.

7. Υπολογίστε την προβλεπόμενη τιμή του αποτελέσματος εάν η προβλεπόμενη τιμή του παράγοντα αυξηθεί κατά 10% από το μέσο επίπεδό του. Προσδιορίστε το διάστημα εμπιστοσύνης πρόβλεψης για το επίπεδο σημαντικότητας.

Λύση:

Ας αποφασίσουμε αυτή η εργασίαχρησιμοποιώντας το Excel.

1. Συγκρίνοντας τα διαθέσιμα δεδομένα x και y, για παράδειγμα, ταξινομώντας τα με αύξουσα σειρά του παράγοντα x, μπορεί κανείς να παρατηρήσει την παρουσία μιας άμεσης σχέσης μεταξύ των χαρακτηριστικών, όταν μια αύξηση στο μέσο κατά κεφαλήν επίπεδο διαβίωσης αυξάνει τον μέσο ημερήσιο μισθός. Με βάση αυτό, μπορούμε να κάνουμε την υπόθεση ότι η σχέση μεταξύ των χαρακτηριστικών είναι άμεση και μπορεί να περιγραφεί με μια ευθύγραμμη εξίσωση. Το ίδιο συμπέρασμα επιβεβαιώνεται με βάση τη γραφική ανάλυση.

Για να δημιουργήσετε ένα πεδίο συσχέτισης, μπορείτε να χρησιμοποιήσετε το Excel PPP. Εισαγάγετε τα αρχικά δεδομένα με τη σειρά: πρώτα x και μετά y.

Επιλέξτε την περιοχή των κελιών που περιέχει δεδομένα.

Στη συνέχεια επιλέξτε: Εισαγωγή / Οικόπεδο Scatter / Scatter με δείκτεςόπως φαίνεται στο σχήμα 1.

Εικόνα 1 Κατασκευή του πεδίου συσχέτισης

Η ανάλυση του πεδίου συσχέτισης δείχνει την παρουσία σχεδόν άμεσης γραμμική εξάρτηση, αφού τα σημεία βρίσκονται σχεδόν σε ευθεία γραμμή.

2. Να υπολογιστούν οι παράμετροι της εξίσωσης γραμμικής παλινδρόμησης
Ας χρησιμοποιήσουμε την ενσωματωμένη στατιστική συνάρτηση LINEST.

Για αυτό:

1) Ανοίξτε ένα υπάρχον αρχείο που περιέχει τα δεδομένα που αναλύθηκαν.
2) Επιλέξτε μια περιοχή 5x2 κενών κελιών (5 σειρές, 2 στήλες) για να εμφανίσετε τα αποτελέσματα στατιστικές παλινδρόμησης.
3) Ενεργοποίηση Οδηγός λειτουργιών: στο κύριο μενού επιλέξτε Τύποι / Συνάρτηση εισαγωγής.
4) Στο παράθυρο Κατηγορίαπαίρνετε Στατιστικός, στο παράθυρο συνάρτησης - LINEST. Κάντε κλικ στο κουμπί Εντάξειόπως φαίνεται στο Σχήμα 2.

Εικόνα 2 Πλαίσιο διαλόγου Function Wizard

5) Συμπληρώστε τα ορίσματα συνάρτησης:

Γνωστές αξίες για

Γνωστές τιμές του x

Συνεχής- μια λογική τιμή που υποδεικνύει την παρουσία ή την απουσία ενός ελεύθερου όρου στην εξίσωση. αν Constant = 1, τότε υπολογίζεται ο εικονικός όρος με τον συνηθισμένο τρόπο, αν Constant = 0, τότε ο ελεύθερος όρος είναι 0.

Στατιστική- μια λογική τιμή που υποδεικνύει εάν θα εμφανιστούν πρόσθετες πληροφορίες σχετικά με την ανάλυση παλινδρόμησης ή όχι. Αν Στατιστικά = 1, τότε Επιπλέον πληροφορίεςεμφανίζεται, εάν Στατιστικά = 0, τότε εμφανίζονται μόνο εκτιμήσεις των παραμέτρων της εξίσωσης.

Κάντε κλικ στο κουμπί Εντάξει;

Εικόνα 3 Πλαίσιο διαλόγου επιχειρημάτων συνάρτησης LINEST

6) Το πρώτο στοιχείο του τελικού πίνακα θα εμφανιστεί στο επάνω αριστερό κελί της επιλεγμένης περιοχής. Για να ανοίξετε ολόκληρο τον πίνακα, πατήστε το κουμπί , και μετά στον συνδυασμό πλήκτρων ++ .

Πρόσθετα στατιστικά παλινδρόμησης θα εξαχθούν με τη σειρά που φαίνεται στο ακόλουθο διάγραμμα:

Τιμή συντελεστή β Συντελεστής μια τιμή
Τυπικό σφάλμα β Τυπικό σφάλμα α
Τυπικό σφάλμα y
Στατιστική F
Παλινδρόμηση τετραγώνων

Εικόνα 4 Αποτέλεσμα υπολογισμού της συνάρτησης LINEST

Πήραμε το επίπεδο παλινδρόμησης:

Καταλήγουμε στο συμπέρασμα: Με αύξηση του μέσου κατά κεφαλήν επιπέδου διαβίωσης κατά 1 τρίψιμο. ο μέσος ημερομίσθιος αυξάνεται κατά μέσο όρο κατά 0,92 ρούβλια.

Σημαίνει διακύμανση 52%. μισθοί(y) εξηγείται από τη διακύμανση του παράγοντα x - το μέσο κατά κεφαλήν επίπεδο διαβίωσης και 48% - από τη δράση άλλων παραγόντων που δεν περιλαμβάνονται στο μοντέλο.

Χρησιμοποιώντας τον υπολογισμένο συντελεστή προσδιορισμού, ο συντελεστής συσχέτισης μπορεί να υπολογιστεί: .

Η σύνδεση αξιολογείται ως στενή.

4. Χρησιμοποιώντας τον μέσο (γενικό) συντελεστή ελαστικότητας, προσδιορίζουμε την ισχύ της επίδρασης του παράγοντα στο αποτέλεσμα.

Για μια ευθύγραμμη εξίσωση, προσδιορίζουμε τον μέσο (ολικό) συντελεστή ελαστικότητας χρησιμοποιώντας τον τύπο:

Θα βρούμε τις μέσες τιμές επιλέγοντας την περιοχή των κελιών με τιμές x και επιλέγοντας Τύποι / AutoSum / Μέσος όρος, και θα κάνουμε το ίδιο με τις τιμές του y.

Σχήμα 5 Υπολογισμός των μέσων τιμών συνάρτησης και του ορίσματος

Έτσι, εάν το μέσο κατά κεφαλήν κόστος ζωής αλλάξει κατά 1% από τη μέση τιμή του, το μέσο ημερομίσθιο θα αλλάξει κατά μέσο όρο 0,51%.

Χρησιμοποιώντας ένα εργαλείο ανάλυσης δεδομένων Οπισθοδρόμησηδιαθέσιμος:
- αποτελέσματα στατιστικών παλινδρόμησης,
- Αποτελέσματα ανάλυση της διακύμανσης,
- αποτελέσματα των διαστημάτων εμπιστοσύνης,
- γραφήματα προσαρμογής υπολειμμάτων και γραμμών παλινδρόμησης,
- υπολείμματα και κανονική πιθανότητα.

Η διαδικασία είναι η εξής:

1) ελέγξτε την πρόσβαση σε Πακέτο ανάλυσης. Στο κύριο μενού, επιλέξτε: Αρχείο/Επιλογές/Πρόσθετα.

2) Στην αναπτυσσόμενη λίστα Ελεγχοςεπιλέξτε αντικείμενο Πρόσθετα Excelκαι πατήστε το κουμπί Πηγαίνω.

3) Στο παράθυρο Πρόσθετατσεκάρετε το πλαίσιο Πακέτο ανάλυσηςκαι μετά κάντε κλικ στο κουμπί Εντάξει.

Αν Πακέτο ανάλυσηςόχι στη λίστα πεδίων Διαθέσιμα πρόσθετα, πάτα το κουμπί Ανασκόπησηγια να πραγματοποιήσετε αναζήτηση.

Εάν λάβετε ένα μήνυμα που υποδεικνύει ότι το πακέτο ανάλυσης δεν είναι εγκατεστημένο στον υπολογιστή σας, κάντε κλικ Ναίγια να το εγκαταστήσετε.

4) Στο κύριο μενού, επιλέξτε: Δεδομένα / Ανάλυση Δεδομένων / Εργαλεία Ανάλυσης / Παλινδρόμησηκαι μετά κάντε κλικ στο κουμπί Εντάξει.

5) Συμπληρώστε το παράθυρο διαλόγου των παραμέτρων εισαγωγής και εξόδου δεδομένων:

Διάστημα εισαγωγής Υ- εύρος που περιέχει δεδομένα του προκύπτοντος χαρακτηριστικού.

Διάστημα εισαγωγής X- εύρος που περιέχει δεδομένα του χαρακτηριστικού παράγοντα.

Ετικέτες- μια σημαία που υποδεικνύει εάν η πρώτη γραμμή περιέχει ονόματα στηλών ή όχι.

Σταθερά - μηδέν- μια σημαία που υποδεικνύει την παρουσία ή την απουσία ενός ελεύθερου όρου στην εξίσωση.

Διάστημα εξόδου- αρκεί να υποδείξετε το επάνω αριστερό κελί της μελλοντικής περιοχής.

6) Νέο φύλλο εργασίας - μπορείτε να καθορίσετε ένα αυθαίρετο όνομα για το νέο φύλλο.

Στη συνέχεια κάντε κλικ στο κουμπί Εντάξει.

Εικόνα 6 Πλαίσιο διαλόγου για την εισαγωγή παραμέτρων για το εργαλείο παλινδρόμησης

Τα αποτελέσματα της ανάλυσης παλινδρόμησης για τα δεδομένα του προβλήματος παρουσιάζονται στο Σχήμα 7.

Εικόνα 7 Αποτέλεσμα χρήσης του εργαλείου παλινδρόμησης

5. Ας αξιολογήσουμε χρησιμοποιώντας μέσο σφάλμαποιότητα προσέγγισης των εξισώσεων. Ας χρησιμοποιήσουμε τα αποτελέσματα της ανάλυσης παλινδρόμησης που παρουσιάζεται στο Σχήμα 8.

Σχήμα 8 Αποτέλεσμα χρήσης του εργαλείου παλινδρόμησης "Ανάσυρση υπολοίπου"

Ας δημιουργήσουμε έναν νέο πίνακα όπως φαίνεται στο σχήμα 9. Στη στήλη Γ υπολογίζουμε σχετικό σφάλμαπροσεγγίσεις χρησιμοποιώντας τον τύπο:

Σχήμα 9 Υπολογισμός μέσου σφάλματος προσέγγισης

Το μέσο σφάλμα προσέγγισης υπολογίζεται χρησιμοποιώντας τον τύπο:

Η ποιότητα του κατασκευασμένου μοντέλου αξιολογείται ως καλή, αφού δεν ξεπερνά το 8 - 10%.

6. Από τον πίνακα με στατιστικά παλινδρόμησης (Εικόνα 4) καταγράφουμε την πραγματική τιμή του Fisher’s F-test:

Επειδή η σε επίπεδο σημαντικότητας 5%, τότε μπορούμε να συμπεράνουμε ότι η εξίσωση παλινδρόμησης είναι σημαντική (η σχέση έχει αποδειχθεί).

8. Αξιολόγηση στατιστική σημασίαΘα πραγματοποιήσουμε παραμέτρους παλινδρόμησης χρησιμοποιώντας τη στατιστική t-student και υπολογίζοντας το διάστημα εμπιστοσύνης κάθε δείκτη.

Υποβάλλουμε την υπόθεση H 0 σχετικά με μια στατιστικά ασήμαντη διαφορά μεταξύ των δεικτών και του μηδενός:

.

για τον αριθμό των βαθμών ελευθερίας

Το Σχήμα 7 έχει τις πραγματικές τιμές t-statistic:

Το τεστ t για τον συντελεστή συσχέτισης μπορεί να υπολογιστεί με δύο τρόπους:

Μέθοδος Ι:

Οπου - τυχαίο σφάλμασυντελεστής συσχέτισης.

Θα πάρουμε τα δεδομένα για υπολογισμό από τον πίνακα στο Σχήμα 7.

Μέθοδος II:

Οι πραγματικές τιμές t-statistic υπερβαίνουν τις τιμές του πίνακα:

Επομένως, η υπόθεση H 0 απορρίπτεται, δηλαδή οι παράμετροι παλινδρόμησης και ο συντελεστής συσχέτισης δεν διαφέρουν από το μηδέν τυχαία, αλλά είναι στατιστικά σημαντικές.

Το διάστημα εμπιστοσύνης για την παράμετρο a ορίζεται ως

Για την παράμετρο α, τα όρια 95% όπως φαίνεται στο Σχήμα 7 ήταν:

Το διάστημα εμπιστοσύνης για τον συντελεστή παλινδρόμησης ορίζεται ως

Για τον συντελεστή παλινδρόμησης b, τα όρια 95% όπως φαίνεται στο Σχήμα 7 ήταν:

Η ανάλυση των άνω και κάτω ορίων των διαστημάτων εμπιστοσύνης οδηγεί στο συμπέρασμα ότι με πιθανότητα οι παράμετροι α και β, που βρίσκονται εντός των καθορισμένων ορίων, δεν αποδέχονται μηδενικές τιμές, δηλ. δεν είναι στατιστικά ασήμαντες και διαφέρουν σημαντικά από το μηδέν.

7. Οι ληφθείσες εκτιμήσεις της εξίσωσης παλινδρόμησης επιτρέπουν τη χρήση της για πρόβλεψη. Εάν το προβλεπόμενο κόστος ζωής είναι:

Τότε η προβλεπόμενη αξία του κόστους ζωής θα είναι:

Υπολογίζουμε το σφάλμα πρόβλεψης χρησιμοποιώντας τον τύπο:

Οπου

Θα υπολογίσουμε επίσης τη διακύμανση χρησιμοποιώντας το Excel PPP. Για αυτό:

1) Ενεργοποίηση Οδηγός λειτουργιών: στο κύριο μενού επιλέξτε Τύποι / Συνάρτηση εισαγωγής.

3) Συμπληρώστε το εύρος που περιέχει τα αριθμητικά δεδομένα του χαρακτηριστικού του παράγοντα. Κάντε κλικ Εντάξει.

Σχήμα 10 Υπολογισμός διακύμανσης

Πήραμε την τιμή διακύμανσης

Για καταμέτρηση υπολειπόμενη διακύμανσηγια έναν βαθμό ελευθερίας, θα χρησιμοποιήσουμε τα αποτελέσματα της ανάλυσης διασποράς όπως φαίνεται στο Σχήμα 7.

Τα διαστήματα εμπιστοσύνης για την πρόβλεψη μεμονωμένων τιμών του y με πιθανότητα 0,95 καθορίζονται από την έκφραση:

Το διάστημα είναι αρκετά μεγάλο, κυρίως λόγω του μικρού όγκου των παρατηρήσεων. Σε γενικές γραμμές, η πρόβλεψη για τον μέσο μηνιαίο μισθό αποδείχθηκε αξιόπιστη.

Η συνθήκη του προβλήματος λαμβάνεται από: Εργαστήριο οικονομετρίας: Proc. επίδομα / Ι.Ι. Eliseeva, S.V. Kurysheva, N.M. Gordeenko και άλλοι. Εκδ. Ι.Ι. Ελισέεβα. - Μ.: Οικονομικά και Στατιστική, 2003. - 192 σελ.: ill.

Χρησιμοποιώντας τη γραφική μέθοδο.
Αυτή η μέθοδος χρησιμοποιείται για την οπτική απεικόνιση της μορφής σύνδεσης μεταξύ των μελετημένων οικονομικών δεικτών. Για το σκοπό αυτό στο ορθογώνιο σύστημασυντεταγμένες, σχεδιάζεται ένα γράφημα, κατά μήκος του άξονα τεταγμένων σχεδιάζονται ατομικές αξίεςπροκύπτον χαρακτηριστικό Υ και στον άξονα x - μεμονωμένες τιμές του χαρακτηριστικού παράγοντα X.
Το σύνολο των σημείων των χαρακτηριστικών που προκύπτουν και του παράγοντα ονομάζεται πεδίο συσχέτισης.
Με βάση το πεδίο συσχέτισης, μπορεί να διατυπωθεί μια υπόθεση (για πληθυσμός) ότι η σχέση μεταξύ όλων των πιθανών τιμών των X και Y είναι γραμμική.

Εξίσωση γραμμικής παλινδρόμησηςέχει τη μορφή y = bx + a + ε
Εδώ το ε είναι ένα τυχαίο σφάλμα (απόκλιση, διαταραχή).
Λόγοι για την ύπαρξη τυχαίου σφάλματος:
1. Αποτυχία συμπερίληψης σημαντικών επεξηγηματικών μεταβλητών στο μοντέλο παλινδρόμησης.
2. Συνάθροιση μεταβλητών. Για παράδειγμα, η συνάρτηση συνολικής κατανάλωσης είναι μια προσπάθεια έκφρασης γενικά του συνόλου των μεμονωμένων αποφάσεων δαπανών. Αυτό είναι απλώς μια προσέγγιση επιμέρους αναλογίες, τα οποία έχουν διαφορετικές παραμέτρους.
3. Λανθασμένη περιγραφή της δομής του μοντέλου.
4. Λανθασμένη λειτουργική προδιαγραφή.
5. Σφάλματα μέτρησης.
Εφόσον οι αποκλίσεις ε i για κάθε συγκεκριμένη παρατήρηση i είναι τυχαίες και οι τιμές τους στο δείγμα είναι άγνωστες, τότε:
1) από τις παρατηρήσεις x i και y i μπορούν να ληφθούν μόνο εκτιμήσεις των παραμέτρων α και β
2) Εκτιμήσεις των παραμέτρων α και β μοντέλο παλινδρόμησηςείναι αντίστοιχα οι ποσότητες a και b, που είναι τυχαία φύση, επειδή αντιστοιχούν σε τυχαίο δείγμα.
Στη συνέχεια, η εκτιμώμενη εξίσωση παλινδρόμησης (που κατασκευάζεται από δεδομένα δείγματος) θα έχει τη μορφή y = bx + a + ε, όπου e i είναι οι παρατηρούμενες τιμές (εκτιμήσεις) των σφαλμάτων ε i , και τα a και b είναι, αντίστοιχα, εκτιμήσεις του τις παραμέτρους α και β του μοντέλου παλινδρόμησης που πρέπει να βρεθούν.
Για την εκτίμηση των παραμέτρων α και β - χρησιμοποιείται η μέθοδος των ελαχίστων τετραγώνων (μέθοδος ελάχιστα τετράγωνα).
Σύστημα κανονικών εξισώσεων.

Για τα δεδομένα μας, το σύστημα εξισώσεων έχει τη μορφή:

10a + 356b = 49
356a + 2135b = 9485

Από την πρώτη εξίσωση εκφράζουμε το α και το αντικαθιστούμε στη δεύτερη εξίσωση
Παίρνουμε b = 68,16, a = 11,17

Εξίσωση παλινδρόμησης:
y = 68,16 x - 11,17

1. Παράμετροι εξίσωσης παλινδρόμησης.
Δείγμα μέσα.



Παραλλαγές δειγμάτων.


Μέση τιμή τυπική απόκλιση

1.1. Συντελεστής συσχέτισης
Υπολογίζουμε τον δείκτη εγγύτητας σύνδεσης. Αυτός ο δείκτης είναι ένα δείγμα γραμμικός συντελεστήςσυσχέτιση, η οποία υπολογίζεται από τον τύπο:

Ο συντελεστής γραμμικής συσχέτισης παίρνει τιμές από –1 έως +1.
Οι συνδέσεις μεταξύ των χαρακτηριστικών μπορεί να είναι αδύναμες και ισχυρές (στενές). Τα κριτήριά τους αξιολογούνται σύμφωνα με την κλίμακα Chaddock:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Στο παράδειγμά μας, η σύνδεση μεταξύ του χαρακτηριστικού Υ και του παράγοντα Χ είναι πολύ υψηλή και άμεση.

1.2. Εξίσωση παλινδρόμησης(εκτίμηση εξίσωσης παλινδρόμησης).

Η εξίσωση γραμμικής παλινδρόμησης είναι y = 68,16 x -11,17
Μπορούν να δοθούν οι συντελεστές της εξίσωσης γραμμικής παλινδρόμησης οικονομική αίσθηση. Συντελεστής εξίσωσης παλινδρόμησηςδείχνει πόσες μονάδες. το αποτέλεσμα θα αλλάξει όταν ο συντελεστής αλλάξει κατά 1 μονάδα.
Ο συντελεστής b = 68,16 δείχνει τη μέση μεταβολή του ενεργού δείκτη (σε μονάδες μέτρησης y) με αύξηση ή μείωση της τιμής του συντελεστή x ανά μονάδα μέτρησης. ΣΕ σε αυτό το παράδειγμαμε αύξηση 1 μονάδας, το y αυξάνεται κατά μέσο όρο 68,16.
Ο συντελεστής a = -11,17 δείχνει τυπικά το προβλεπόμενο επίπεδο του y, αλλά μόνο εάν το x = 0 είναι κοντά στις τιμές του δείγματος.
Αλλά εάν το x = 0 απέχει πολύ από τις τιμές του δείγματος του x, τότε μια κυριολεκτική ερμηνεία μπορεί να οδηγήσει σε λανθασμένα αποτελέσματα και ακόμη και αν η γραμμή παλινδρόμησης περιγράφει τις παρατηρούμενες τιμές του δείγματος με αρκετά ακρίβεια, δεν υπάρχει καμία εγγύηση ότι αυτό θα συμβαίνει όταν γίνεται παρέκταση αριστερά ή δεξιά.
Αντικαθιστώντας τις κατάλληλες τιμές x στην εξίσωση παλινδρόμησης, μπορούμε να προσδιορίσουμε τις ευθυγραμμισμένες (προβλεπόμενες) τιμές του δείκτη απόδοσης y(x) για κάθε παρατήρηση.
Η σχέση μεταξύ y και x καθορίζει το πρόσημο του συντελεστή παλινδρόμησης b (αν > 0 - άμεση σχέση, διαφορετικά - αντίστροφη). Στο παράδειγμά μας, η σύνδεση είναι άμεση.

1.3. Συντελεστής ελαστικότητας.
Δεν συνιστάται η χρήση συντελεστών παλινδρόμησης (στο παράδειγμα β) για την άμεση αξιολόγηση της επίδρασης παραγόντων σε ένα προκύπτον χαρακτηριστικό εάν υπάρχει διαφορά στις μονάδες μέτρησης του προκύπτοντος δείκτη y και του χαρακτηριστικού του παράγοντα x.
Για τους σκοπούς αυτούς, υπολογίζονται οι συντελεστές ελαστικότητας και οι συντελεστές βήτα. Ο συντελεστής ελαστικότητας βρίσκεται με τον τύπο:


Δείχνει σε ποιο ποσοστό κατά μέσο όρο αλλάζει το ενεργό χαρακτηριστικό y όταν το χαρακτηριστικό του παράγοντα x αλλάζει κατά 1%. Δεν λαμβάνει υπόψη τον βαθμό διακύμανσης των παραγόντων.
Στο παράδειγμά μας, ο συντελεστής ελαστικότητας είναι μεγαλύτερος από 1. Επομένως, εάν το X αλλάξει κατά 1%, το Y θα αλλάξει περισσότερο από 1%. Με άλλα λόγια, το Χ επηρεάζει σημαντικά το Υ.
Συντελεστής βήταδείχνει με ποιο μέρος της τιμής της τυπικής απόκλισης θα αλλάξει η μέση τιμή του προκύπτοντος χαρακτηριστικού όταν το χαρακτηριστικό του παράγοντα αλλάζει κατά την τιμή της τυπικής του απόκλισης με την τιμή των υπόλοιπων ανεξάρτητων μεταβλητών σταθερή σε σταθερό επίπεδο:

Εκείνοι. μια αύξηση στο x κατά την τυπική απόκλιση αυτού του δείκτη θα οδηγήσει σε αύξηση του μέσου όρου Y κατά 0,9796 τυπική απόκλισηαυτόν τον δείκτη.

1.4. Σφάλμα προσέγγισης.
Ας αξιολογήσουμε την ποιότητα της εξίσωσης παλινδρόμησης χρησιμοποιώντας το σφάλμα απόλυτης προσέγγισης.


Αφού το σφάλμα είναι πάνω από 15%, τότε δεδομένη εξίσωσηΔεν συνιστάται η χρήση του ως παλινδρόμηση.

1.6. Συντελεστής προσδιορισμού.
Το τετράγωνο του (πολλαπλού) συντελεστή συσχέτισης ονομάζεται συντελεστής προσδιορισμού, ο οποίος δείχνει την αναλογία διακύμανσης στο προκύπτον χαρακτηριστικό που εξηγείται από τη διακύμανση στο χαρακτηριστικό παράγοντα.
Τις περισσότερες φορές, κατά την ερμηνεία του συντελεστή προσδιορισμού, εκφράζεται ως ποσοστό.
R2 = 0,982 = 0,9596
εκείνοι. στο 95,96% των περιπτώσεων, οι αλλαγές στο x οδηγούν σε αλλαγές στο y. Με άλλα λόγια, η ακρίβεια επιλογής της εξίσωσης παλινδρόμησης είναι υψηλή. Το υπόλοιπο 4,04% της αλλαγής στο Y εξηγείται από παράγοντες που δεν λαμβάνονται υπόψη στο μοντέλο.

Χ y x 2 y 2 x y y(x) (y i -y cp) 2 (y-y(x)) 2 (x i -x cp) 2 |y - y x |:y
0.371 15.6 0.1376 243.36 5.79 14.11 780.89 2.21 0.1864 0.0953
0.399 19.9 0.1592 396.01 7.94 16.02 559.06 15.04 0.163 0.1949
0.502 22.7 0.252 515.29 11.4 23.04 434.49 0.1176 0.0905 0.0151
0.572 34.2 0.3272 1169.64 19.56 27.81 87.32 40.78 0.0533 0.1867
0.607 44.5 .3684 1980.25 27.01 30.2 0.9131 204.49 0.0383 0.3214
0.655 26.8 0.429 718.24 17.55 33.47 280.38 44.51 0.0218 0.2489
0.763 35.7 0.5822 1274.49 27.24 40.83 61.54 26.35 0.0016 0.1438
0.873 30.6 0.7621 936.36 26.71 48.33 167.56 314.39 0.0049 0.5794
2.48 161.9 6.17 26211.61 402 158.07 14008.04 14.66 2.82 0.0236
7.23 391.9 9.18 33445.25 545.2 391.9 16380.18 662.54 3.38 1.81

2. Εκτίμηση παραμέτρων εξίσωσης παλινδρόμησης.
2.1. Σημασία του συντελεστή συσχέτισης.

Χρησιμοποιώντας τον πίνακα Student με επίπεδο σημαντικότητας α=0,05 και βαθμούς ελευθερίας k=7, βρίσκουμε t κριτήριο:
t crit = (7;0,05) = 1,895
όπου m = 1 είναι ο αριθμός των επεξηγηματικών μεταβλητών.
Εάν το t παρατηρηθεί > t κρίσιμο, τότε η λαμβανόμενη τιμή του συντελεστή συσχέτισης θεωρείται σημαντική ( μηδενική υπόθεση, που βεβαιώνει ότι ο συντελεστής συσχέτισης είναι ίσος με μηδέν απορρίπτεται).
Εφόσον t obs > t crit, απορρίπτουμε την υπόθεση ότι ο συντελεστής συσχέτισης είναι ίσος με 0. Με άλλα λόγια, ο συντελεστής συσχέτισης είναι στατιστικά σημαντικός
Σε ζευγαρωμένη γραμμική παλινδρόμηση t 2 r = t 2 b και στη συνέχεια ο έλεγχος υποθέσεων σχετικά με τη σημασία της παλινδρόμησης και των συντελεστών συσχέτισης ισοδυναμεί με τον έλεγχο της υπόθεσης σχετικά με τη σημασία γραμμική εξίσωσηοπισθοδρόμηση.

2.3. Ανάλυση της ακρίβειας του προσδιορισμού των εκτιμήσεων των συντελεστών παλινδρόμησης.
Μια αμερόληπτη εκτίμηση της διασποράς των διαταραχών είναι η τιμή:


S 2 y = 94,6484 - ανεξήγητη διακύμανση (ένα μέτρο της εξάπλωσης της εξαρτημένης μεταβλητής γύρω από τη γραμμή παλινδρόμησης).
S y = 9,7287 - τυπικό σφάλμαεκτιμήσεις (τυπικό σφάλμα παλινδρόμησης).
ΑΝΩΝΥΜΗ ΕΤΑΙΡΙΑ - τυπική απόκλιση τυχαία μεταβλητήένα.


S b - τυπική απόκλιση τυχαίας μεταβλητής β.

2.4. Διαστήματα εμπιστοσύνης για την εξαρτημένη μεταβλητή.
Οι οικονομικές προβλέψεις που βασίζονται στο κατασκευασμένο μοντέλο προϋποθέτουν ότι οι προϋπάρχουσες σχέσεις μεταξύ των μεταβλητών διατηρούνται για τη χρονική περίοδο.
Για να προβλεφθεί η εξαρτημένη μεταβλητή του προκύπτοντος χαρακτηριστικού, είναι απαραίτητο να γνωρίζουμε τις προβλεπόμενες τιμές όλων των παραγόντων που περιλαμβάνονται στο μοντέλο.
Οι προβλεπόμενες τιμές των παραγόντων αντικαθίστανται στο μοντέλο και λαμβάνονται προγνωστικές σημειακές εκτιμήσεις του δείκτη που μελετάται. (a + bx p ± ε)
Οπου

Ας υπολογίσουμε τα όρια του διαστήματος στο οποίο θα συγκεντρωθεί το 95% των πιθανών τιμών του Y με απεριόριστο αριθμό παρατηρήσεων και X p = 1 (-11,17 + 68,16*1 ± 6,4554)
(50.53;63.44)

Ατομο διαστήματα εμπιστοσύνηςΓιαΥσε μια δεδομένη τιμήΧ.
(a + bx i ± ε)
Οπου

x i y = -11,17 + 68,16x i εi ymin ymax
0.371 14.11 19.91 -5.8 34.02
0.399 16.02 19.85 -3.83 35.87
0.502 23.04 19.67 3.38 42.71
0.572 27.81 19.57 8.24 47.38
0.607 30.2 19.53 10.67 49.73
0.655 33.47 19.49 13.98 52.96
0.763 40.83 19.44 21.4 60.27
0.873 48.33 19.45 28.88 67.78
2.48 158.07 25.72 132.36 183.79

Με πιθανότητα 95% είναι δυνατό να εγγυηθούμε ότι η τιμή Y για απεριόριστο αριθμό παρατηρήσεων δεν θα πέσει έξω από τα όρια των διαστημάτων που βρέθηκαν.

2.5. Έλεγχος υποθέσεων σχετικά με τους συντελεστές μιας εξίσωσης γραμμικής παλινδρόμησης.
1) t-statistics. Τεστ μαθητή.
Ας ελέγξουμε την υπόθεση H 0 σχετικά με την ισότητα των επιμέρους συντελεστών παλινδρόμησης στο μηδέν (αν η εναλλακτική λύση δεν είναι ίση με H 1) στο επίπεδο σημαντικότητας α=0,05.
t crit = (7;0,05) = 1,895


Από 12,8866 > 1,895, επιβεβαιώνεται η στατιστική σημασία του συντελεστή παλινδρόμησης b (απορρίπτουμε την υπόθεση ότι αυτός ο συντελεστής είναι ίσος με μηδέν).


Από 2,0914 > 1,895, επιβεβαιώνεται η στατιστική σημασία του συντελεστή παλινδρόμησης a (απορρίπτουμε την υπόθεση ότι αυτός ο συντελεστής είναι ίσος με μηδέν).

Διάστημα εμπιστοσύνης για συντελεστές εξίσωσης παλινδρόμησης.
Ας προσδιορίσουμε τα διαστήματα εμπιστοσύνης των συντελεστών παλινδρόμησης, τα οποία με αξιοπιστία 95% θα είναι τα εξής:
(b - t crit S b ; b + t crit S b)
(68.1618 - 1.895 5.2894; 68.1618 + 1.895 5.2894)
(58.1385;78.1852)
Με πιθανότητα 95% μπορεί να δηλωθεί ότι η τιμή αυτής της παραμέτρου θα βρίσκεται στο διάστημα που βρέθηκε.
(α - τ α)
(-11.1744 - 1.895 5.3429; -11.1744 + 1.895 5.3429)
(-21.2992;-1.0496)
Με πιθανότητα 95% μπορεί να δηλωθεί ότι η τιμή αυτής της παραμέτρου θα βρίσκεται στο διάστημα που βρέθηκε.

2) F-statistics. Κριτήριο Fisher.
Ο έλεγχος της σημασίας ενός μοντέλου παλινδρόμησης πραγματοποιείται χρησιμοποιώντας τη δοκιμή F Fisher, η υπολογισμένη τιμή της οποίας βρίσκεται ως ο λόγος της διακύμανσης της αρχικής σειράς παρατηρήσεων του δείκτη που μελετάται και η αμερόληπτη εκτίμηση της διακύμανσης της υπολειπόμενης ακολουθίας για αυτό το μοντέλο.
Εάν η υπολογιζόμενη τιμή με lang=EN-US>n-m-1) βαθμούς ελευθερίας είναι μεγαλύτερη από την τιμή του πίνακα σε ένα δεδομένο επίπεδο σημασίας, τότε το μοντέλο θεωρείται σημαντικό.

όπου m είναι ο αριθμός των παραγόντων στο μοντέλο.
Η στατιστική σημασία της ζευγαρωμένης γραμμικής παλινδρόμησης αξιολογείται χρησιμοποιώντας τον ακόλουθο αλγόριθμο:
1. Προβάλλεται μηδενική υπόθεση ότι η εξίσωση στο σύνολό της είναι στατιστικά ασήμαντη: H 0: R 2 =0 στο επίπεδο σημαντικότητας α.
2. Στη συνέχεια, προσδιορίστε την πραγματική τιμή του κριτηρίου F:


όπου m=1 για παλινδρόμηση κατά ζεύγη.
3. Τιμή πίνακαπροσδιορίζεται από τους πίνακες κατανομής Fisher για ένα δεδομένο επίπεδο σημαντικότητας, λαμβάνοντας υπόψη ότι ο αριθμός των βαθμών ελευθερίας για συνολικό ποσότετράγωνα (μεγαλύτερη διακύμανση) είναι 1 και ο αριθμός των βαθμών ελευθερίας υπολειπόμενο ποσόΤα τετράγωνα (λιγότερη διακύμανση) για γραμμική παλινδρόμηση είναι n-2.
4. Εάν η πραγματική τιμή του F-test είναι μικρότερη από την τιμή του πίνακα, τότε λένε ότι δεν υπάρχει λόγος να απορριφθεί η μηδενική υπόθεση.
Διαφορετικά, η μηδενική υπόθεση απορρίπτεται και η εναλλακτική υπόθεση για τη στατιστική σημασία της εξίσωσης στο σύνολό της γίνεται αποδεκτή με πιθανότητα (1-α).
Πίνακας τιμής του κριτηρίου με βαθμούς ελευθερίας k1=1 και k2=7, Fkp = 5,59
Δεδομένου ότι η πραγματική τιμή F > Fkp, ο συντελεστής προσδιορισμού είναι στατιστικά σημαντικός (Η ευρεθείσα εκτίμηση της εξίσωσης παλινδρόμησης είναι στατιστικά αξιόπιστη).

Έλεγχος για αυτοσυσχέτιση υπολειμμάτων.
Μια σημαντική προϋπόθεση για την κατασκευή ενός μοντέλου ποιοτικής παλινδρόμησης με χρήση OLS είναι η ανεξαρτησία των τιμών τυχαίες αποκλίσειςαπό τις τιμές απόκλισης σε όλες τις άλλες παρατηρήσεις. Αυτό διασφαλίζει ότι δεν υπάρχει συσχέτιση μεταξύ τυχόν αποκλίσεων και, ειδικότερα, μεταξύ παρακείμενων αποκλίσεων.
Αυτοσυσχέτιση (σειριακή συσχέτιση)ορίζεται ως η συσχέτιση μεταξύ των παρατηρούμενων δεικτών ταξινομημένων σε χρονική (χρονική σειρά) ή χώρο (διασταυρούμενη σειρά). Η αυτοσυσχέτιση των υπολειμμάτων (διακυμάνσεις) είναι κοινή στην ανάλυση παλινδρόμησης όταν χρησιμοποιούνται δεδομένα χρονοσειρών και πολύ σπάνια όταν χρησιμοποιούνται δεδομένα διατομής.
Στα οικονομικά προβλήματα είναι πολύ πιο συνηθισμένο θετική αυτοσυσχέτιση , παρά αρνητική αυτοσυσχέτιση. Στις περισσότερες περιπτώσεις, η θετική αυτοσυσχέτιση προκαλείται από την κατευθυντική σταθερή επιρροή ορισμένων παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.
Αρνητική αυτοσυσχέτισηστην πραγματικότητα σημαίνει ότι μια θετική απόκλιση ακολουθείται από μια αρνητική και αντίστροφα. Αυτή η κατάσταση μπορεί να προκύψει εάν ληφθεί υπόψη η ίδια σχέση μεταξύ της ζήτησης αναψυκτικών και του εισοδήματος σύμφωνα με τα εποχιακά δεδομένα (χειμώνα-καλοκαίρι).
Αναμεταξύ κύριοι λόγοι που προκαλούν αυτοσυσχέτιση, διακρίνονται τα ακόλουθα:
1. Σφάλματα προδιαγραφών. Η αποτυχία να ληφθεί υπόψη κάποια σημαντική επεξηγηματική μεταβλητή στο μοντέλο ή η εσφαλμένη επιλογή της μορφής εξάρτησης συνήθως οδηγεί σε συστημικές αποκλίσεις των σημείων παρατήρησης από τη γραμμή παλινδρόμησης, η οποία μπορεί να οδηγήσει σε αυτοσυσχέτιση.
2. Αδράνεια. Πολλά οικονομικούς δείκτες(πληθωρισμός, ανεργία, ΑΕΠ, κ.λπ.) έχουν μια ορισμένη κυκλική φύση που σχετίζεται με τα κύματα ΕΠΙΧΕΙΡΗΜΑΤΙΚΗ ΔΡΑΣΤΗΡΙΟΤΗΤΑ. Επομένως, η αλλαγή στους δείκτες δεν συμβαίνει αμέσως, αλλά έχει μια ορισμένη αδράνεια.
3. Εφέ ιστού αράχνης. Σε πολλούς μεταποιητικούς και άλλους τομείς, οι οικονομικοί δείκτες ανταποκρίνονται στις αλλαγές οικονομικές συνθήκεςμε καθυστέρηση (χρονική καθυστέρηση).
4. Εξομάλυνση δεδομένων. Συχνά, τα δεδομένα για μια ορισμένη μεγάλη χρονική περίοδο λαμβάνονται με τον μέσο όρο δεδομένων στα διαστήματα που την αποτελούν. Αυτό μπορεί να οδηγήσει σε μια ορισμένη εξομάλυνση των διακυμάνσεων που συνέβησαν εντός της υπό εξέταση περιόδου, η οποία με τη σειρά της μπορεί να προκαλέσει αυτοσυσχέτιση.
Οι συνέπειες της αυτοσυσχέτισης είναι παρόμοιες με τις συνέπειες της ετεροσκεδαστικότητας: τα συμπεράσματα από τις στατιστικές t και F που καθορίζουν τη σημασία του συντελεστή παλινδρόμησης και του συντελεστή προσδιορισμού είναι πιθανό να είναι λανθασμένα.

Ανίχνευση αυτοσυσχέτισης

1. Γραφική μέθοδος
Υπάρχει μια σειρά από επιλογές γραφικός ορισμόςαυτοσυσχέτιση. Ένα από αυτά συνδέει τις αποκλίσεις e i με τις στιγμές της παραλαβής τους i. Στην περίπτωση αυτή, ο άξονας της τετμημένης δείχνει είτε τον χρόνο λήψης στατιστικών δεδομένων, είτε σειριακός αριθμόςπαρατηρήσεις, και κατά μήκος της τεταγμένης - αποκλίσεις e i (ή εκτιμήσεις αποκλίσεων).
Είναι φυσικό να υποθέσουμε ότι εάν υπάρχει κάποια σύνδεση μεταξύ των αποκλίσεων, τότε λαμβάνει χώρα η αυτοσυσχέτιση. Η απουσία εξάρτησης πιθανότατα θα υποδηλώνει την απουσία αυτοσυσχέτισης.
Η αυτοσυσχέτιση γίνεται πιο σαφής εάν σχεδιάσετε την εξάρτηση του e i από το e i-1.

Δοκιμή Durbin-Watson.
Αυτό το κριτήριο είναι το πιο γνωστό για την ανίχνευση της αυτοσυσχέτισης.
Στο Στατιστική ανάλυσηεξισώσεις παλινδρόμησης στις αρχικό στάδιοσυχνά ελέγχουν τη σκοπιμότητα ενός προαπαιτούμενου: τις προϋποθέσεις για στατιστική ανεξαρτησία των αποκλίσεων μεταξύ τους. Σε αυτήν την περίπτωση, ελέγχεται η μη συσχέτιση των γειτονικών τιμών e i.

y y(x) e i = y-y(x) ε 2 (e i - e i-1) 2
15.6 14.11 1.49 2.21 0
19.9 16.02 3.88 15.04 5.72
22.7 23.04 -0.3429 0.1176 17.81
34.2 27.81 6.39 40.78 45.28
44.5 30.2 14.3 204.49 62.64
26.8 33.47 -6.67 44.51 439.82
35.7 40.83 -5.13 26.35 2.37
30.6 48.33 -17.73 314.39 158.7
161.9 158.07 3.83 14.66 464.81
662.54 1197.14

Για την ανάλυση της συσχέτισης των αποκλίσεων, χρησιμοποιούνται στατιστικές Durbin-Watson:

Οι κρίσιμες τιμές d 1 και d 2 προσδιορίζονται με βάση ειδικούς πίνακες για το απαιτούμενο επίπεδο σημαντικότητας α, τον αριθμό των παρατηρήσεων n = 9 και τον αριθμό των επεξηγηματικών μεταβλητών m = 1.
Δεν υπάρχει αυτοσυσχέτιση εάν πληρούται η ακόλουθη συνθήκη:
δ 1< DW и d 2 < DW < 4 - d 2 .
Χωρίς αναφορά σε πίνακες, μπορείτε να χρησιμοποιήσετε έναν κατά προσέγγιση κανόνα και να υποθέσετε ότι δεν υπάρχει αυτοσυσχέτιση των υπολειμμάτων εάν 1,5< DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.

Η ανάλυση παλινδρόμησης είναι μια από τις πιο δημοφιλείς μεθόδους στατιστική έρευνα. Μπορεί να χρησιμοποιηθεί για τον προσδιορισμό του βαθμού επιρροής ανεξάρτητες ποσότητεςστην εξαρτημένη μεταβλητή. Σε λειτουργικότητα Microsoft ExcelΥπάρχουν εργαλεία σχεδιασμένα για την εκτέλεση αυτού του τύπου ανάλυσης. Ας δούμε τι είναι και πώς να τα χρησιμοποιήσετε.

Ωστόσο, για να χρησιμοποιήσετε τη συνάρτηση που σας επιτρέπει να κάνετε ανάλυση παλινδρόμησης, πρέπει πρώτα να ενεργοποιήσετε το Πακέτο Ανάλυσης. Μόνο τότε τα απαραίτητα εργαλεία για αυτήν τη διαδικασία θα εμφανιστούν στην κορδέλα του Excel.


Τώρα όταν πάμε στην καρτέλα "Δεδομένα", στην κορδέλα στην εργαλειοθήκη "Ανάλυση"θα δούμε ένα νέο κουμπί - "Ανάλυση δεδομένων".

Τύποι Ανάλυσης Παλινδρόμησης

Υπάρχουν διάφοροι τύποι παλινδρόμησης:

  • παραβολικός;
  • ήσυχος;
  • λογαριθμική?
  • εκθετικός;
  • εκδηλωτικός;
  • υπερβολικός;
  • γραμμικής παλινδρόμησης.

Σχετικά με την εκτέλεση τελευταίος τύποςΘα μιλήσουμε για την ανάλυση παλινδρόμησης στο Excel με περισσότερες λεπτομέρειες αργότερα.

Γραμμική παλινδρόμηση στο Excel

Παρακάτω, για παράδειγμα, είναι ένας πίνακας που δείχνει τη μέση ημερήσια θερμοκρασία αέρα έξω και τον αριθμό των πελατών του καταστήματος για την αντίστοιχη εργάσιμη ημέρα. Ας μάθουμε χρησιμοποιώντας ανάλυση παλινδρόμησης ακριβώς πώς καιρόςμε τη μορφή της θερμοκρασίας του αέρα μπορεί να επηρεάσει την προσέλευση ενός καταστήματος λιανικής.

Η γενική εξίσωση γραμμικής παλινδρόμησης έχει ως εξής: Y = a0 + a1x1 +…+ akhk. Σε αυτή τη φόρμουλα Υσημαίνει μια μεταβλητή, την επίδραση των παραγόντων στους οποίους προσπαθούμε να μελετήσουμε. Στην περίπτωσή μας, αυτός είναι ο αριθμός των αγοραστών. Εννοια Χ- Αυτό διάφορους παράγοντες, επηρεάζοντας τη μεταβλητή. Επιλογές έναείναι συντελεστές παλινδρόμησης. Είναι δηλαδή αυτοί που καθορίζουν τη σημασία ενός συγκεκριμένου παράγοντα. Δείκτης κσημαίνει σύνολοαυτούς τους ίδιους παράγοντες.


Ανάλυση αποτελεσμάτων ανάλυσης

Τα αποτελέσματα της ανάλυσης παλινδρόμησης εμφανίζονται με τη μορφή πίνακα στη θέση που καθορίζεται στις ρυθμίσεις.

Ένας από τους κύριους δείκτες είναι R-τετράγωνο. Δείχνει την ποιότητα του μοντέλου. Στην περίπτωσή μας αυτόν τον συντελεστήίσο με 0,705 ή περίπου 70,5%. Αυτό είναι ένα αποδεκτό επίπεδο ποιότητας. Η εξάρτηση μικρότερη από 0,5 είναι κακή.

Αλλο σημαντικός δείκτηςπου βρίσκεται στο κελί στη διασταύρωση της γραμμής "Υ-τομή"και στήλη "Πιθανότητα". Αυτό υποδεικνύει ποια τιμή θα έχει το Y, και στην περίπτωσή μας, αυτός είναι ο αριθμός των αγοραστών, με όλους τους άλλους παράγοντες ίσους με μηδέν. Σε αυτόν τον πίνακα δεδομένη αξίαισούται με 58,04.

Τιμή στην τομή του γραφήματος "Μεταβλητή X1"Και "Πιθανότητα"δείχνει το επίπεδο εξάρτησης του Υ από το Χ. Στην περίπτωσή μας, αυτό είναι το επίπεδο εξάρτησης του αριθμού των πελατών του καταστήματος από τη θερμοκρασία. Ο συντελεστής 1,31 θεωρείται δείκτης αρκετά υψηλής επιρροής.

Όπως μπορούμε να δούμε, χρησιμοποιώντας προγράμματα της MicrosoftΤο Excel είναι αρκετά εύκολο να δημιουργήσετε έναν πίνακα ανάλυσης παλινδρόμησης. Αλλά μόνο ένα εκπαιδευμένο άτομο μπορεί να εργαστεί με τα δεδομένα εξόδου και να κατανοήσει την ουσία τους.

Έννοια της παλινδρόμησης. Εξάρτηση μεταξύ μεταβλητών ΧΚαι yμπορεί να περιγραφεί με διαφορετικούς τρόπους. Συγκεκριμένα, οποιαδήποτε μορφή σύνδεσης μπορεί να εκφραστεί με μια γενική εξίσωση, όπου yαντιμετωπίζεται ως εξαρτημένη μεταβλητή, ή λειτουργίεςαπό μια άλλη - ανεξάρτητη μεταβλητή x, που ονομάζεται διαφωνία. Η αντιστοιχία μεταξύ ενός ορίσματος και μιας συνάρτησης μπορεί να καθοριστεί από έναν πίνακα, έναν τύπο, ένα γράφημα κ.λπ. Η αλλαγή μιας συνάρτησης ανάλογα με μια αλλαγή σε ένα ή περισσότερα ορίσματα καλείται οπισθοδρόμηση. Όλα τα μέσα που χρησιμοποιούνται για την περιγραφή των συσχετισμών αποτελούν το περιεχόμενο ανάλυση παλινδρόμησης.

Για την έκφραση της παλινδρόμησης, των εξισώσεων συσχέτισης ή των εξισώσεων παλινδρόμησης, χρησιμοποιούνται εμπειρικές και θεωρητικά υπολογισμένες σειρές παλινδρόμησης, τα γραφήματα τους, που ονομάζονται γραμμές παλινδρόμησης, καθώς και γραμμικοί και μη γραμμικοί συντελεστές παλινδρόμησης.

Οι δείκτες παλινδρόμησης εκφράζουν τη σχέση συσχέτισης διμερώς, λαμβάνοντας υπόψη τις αλλαγές στις μέσες τιμές του χαρακτηριστικού Υκατά την αλλαγή τιμών Χ Εγώσημάδι Χκαι, αντιστρόφως, δείχνουν μια αλλαγή στις μέσες τιμές του χαρακτηριστικού Χσύμφωνα με τις αλλαγμένες τιμές y Εγώσημάδι Υ. Η εξαίρεση είναι οι χρονοσειρές ή χρονοσειρές, που εμφανίζουν αλλαγές στα χαρακτηριστικά με την πάροδο του χρόνου. Η παλινδρόμηση τέτοιων σειρών είναι μονόπλευρη.

Υπάρχουν πολλές διαφορετικές μορφές και είδη συσχετισμών. Η εργασία καταλήγει στον προσδιορισμό της μορφής της σύνδεσης σε κάθε συγκεκριμένη περίπτωση και στην έκφραση της με την αντίστοιχη εξίσωση συσχέτισης, η οποία μας επιτρέπει να προβλέψουμε πιθανές αλλαγές σε ένα χαρακτηριστικό Υμε βάση γνωστές αλλαγές σε άλλο Χ, που σχετίζεται με το πρώτο συσχετιστικά.

12.1 Γραμμική παλινδρόμηση

Εξίσωση παλινδρόμησης.Αποτελέσματα παρατηρήσεων που πραγματοποιήθηκαν σε συγκεκριμένο βιολογικό αντικείμενο με βάση τα συσχετισμένα χαρακτηριστικά ΧΚαι y, μπορεί να αναπαρασταθεί με σημεία στο επίπεδο κατασκευάζοντας ένα σύστημα ορθογώνιες συντεταγμένες. Το αποτέλεσμα είναι ένα είδος διαγράμματος διασποράς που επιτρέπει σε κάποιον να κρίνει τη μορφή και την εγγύτητα της σχέσης μεταξύ διαφορετικών χαρακτηριστικών. Πολύ συχνά αυτή η σχέση μοιάζει με μια ευθεία γραμμή ή μπορεί να προσεγγιστεί με μια ευθεία γραμμή.

Γραμμική σχέση μεταξύ μεταβλητών ΧΚαι yπεριγράφεται με μια γενική εξίσωση, όπου Α Β Γ Δ,... – παράμετροι της εξίσωσης που καθορίζουν τις σχέσεις μεταξύ των ορισμάτων Χ 1 , Χ 2 , Χ 3 , …, Χ Μκαι λειτουργίες.

Στην πράξη, δεν λαμβάνονται υπόψη όλα τα πιθανά επιχειρήματα, αλλά μόνο ορισμένα επιχειρήματα στην απλούστερη περίπτωση, μόνο ένα:

Στην εξίσωση γραμμικής παλινδρόμησης (1) έναείναι ο ελεύθερος όρος και η παράμετρος σικαθορίζει την κλίση της γραμμής παλινδρόμησης σε σχέση με τους ορθογώνιους άξονες συντεταγμένων. Στην αναλυτική γεωμετρία αυτή η παράμετρος ονομάζεται κλίσηκαι στα βιομετρικά – συντελεστής παλινδρόμησης. Μια οπτική αναπαράσταση αυτής της παραμέτρου και της θέσης των γραμμών παλινδρόμησης ΥΜε ΧΚαι ΧΜε Υστο ορθογώνιο σύστημα συντεταγμένων δίνει το σχήμα 1.

Ρύζι. 1 Γραμμές παλινδρόμησης του Υ κατά Χ και Χ κατά Υ στο σύστημα

ορθογώνιες συντεταγμένες

Οι γραμμές παλινδρόμησης, όπως φαίνεται στο Σχ. 1, τέμνονται στο σημείο O (,), που αντιστοιχεί στις μέσες αριθμητικές τιμές των χαρακτηριστικών που συσχετίζονται μεταξύ τους ΥΚαι Χ. Κατά την κατασκευή γραφημάτων παλινδρόμησης, οι τιμές της ανεξάρτητης μεταβλητής X σχεδιάζονται κατά μήκος του άξονα της τετμημένης και οι τιμές της εξαρτημένης μεταβλητής, ή της συνάρτησης Y, σχεδιάζονται κατά μήκος της γραμμής τεταγμένων AB που διέρχεται από το σημείο O (, ) αντιστοιχεί στην πλήρη (λειτουργική) σχέση μεταξύ των μεταβλητών ΥΚαι Χ, όταν ο συντελεστής συσχέτισης . Όσο ισχυρότερη είναι η σύνδεση μεταξύ ΥΚαι Χ, όσο πιο κοντά είναι οι γραμμές παλινδρόμησης στο ΑΒ και, αντίστροφα, τόσο πιο κοντά ασθενέστερη σύνδεσημεταξύ αυτών των τιμών, τόσο πιο απομακρυσμένες είναι οι γραμμές παλινδρόμησης από το AB. Εάν δεν υπάρχει σύνδεση μεταξύ των χαρακτηριστικών, οι γραμμές παλινδρόμησης βρίσκονται σε ορθή γωνία μεταξύ τους και .

Εφόσον οι δείκτες παλινδρόμησης εκφράζουν τη σχέση συσχέτισης διμερώς, η εξίσωση παλινδρόμησης (1) θα πρέπει να γραφτεί ως εξής:

Ο πρώτος τύπος καθορίζει τις μέσες τιμές όταν αλλάζει το χαρακτηριστικό Χανά μονάδα μέτρησης, για τη δεύτερη - μέσες τιμές κατά την αλλαγή κατά μία μονάδα μέτρησης του χαρακτηριστικού Υ.

Συντελεστής παλινδρόμησης.Ο συντελεστής παλινδρόμησης δείχνει πόσο κατά μέσο όρο είναι η τιμή ενός χαρακτηριστικού yαλλάζει όταν το μέτρο ενός άλλου, συσχετισμένο με, αλλάζει κατά ένα Υσημάδι Χ. Αυτός ο δείκτης καθορίζεται από τον τύπο

Εδώ είναι οι αξίες μικρόπολλαπλασιαζόμενο με το μέγεθος των διαστημάτων τάξης λ , εάν βρέθηκαν από σειρές παραλλαγών ή πίνακες συσχέτισης.

Ο συντελεστής παλινδρόμησης μπορεί να υπολογιστεί χωρίς τον υπολογισμό των μέσων όρων τετράγωνες αποκλίσεις μικρό yΚαι μικρό Χσύμφωνα με τον τύπο

Εάν ο συντελεστής συσχέτισης είναι άγνωστος, ο συντελεστής παλινδρόμησης προσδιορίζεται ως εξής:

Σχέση παλινδρόμησης και συντελεστών συσχέτισης.Συγκρίνοντας τους τύπους (11.1) (θέμα 11) και (12.5), βλέπουμε: ο αριθμητής τους έχει την ίδια τιμή, γεγονός που υποδεικνύει μια σύνδεση μεταξύ αυτών των δεικτών. Η σχέση αυτή εκφράζεται με την ισότητα

Έτσι, ο συντελεστής συσχέτισης είναι ίσος με τον γεωμετρικό μέσο όρο των συντελεστών σι yxΚαι σι xy. Ο τύπος (6) επιτρέπει, πρώτον, με βάση τις γνωστές τιμές των συντελεστών παλινδρόμησης σι yxΚαι σι xyπροσδιορίστε τον συντελεστή παλινδρόμησης R xy, και δεύτερον, ελέγξτε την ορθότητα του υπολογισμού αυτού του δείκτη συσχέτισης R xyμεταξύ διαφορετικών χαρακτηριστικών ΧΚαι Υ.

Όπως ο συντελεστής συσχέτισης, ο συντελεστής παλινδρόμησης χαρακτηρίζει μόνο μια γραμμική σχέση και συνοδεύεται από ένα πρόσημο συν για μια θετική σχέση και ένα πρόσημο μείον για μια αρνητική σχέση.

Προσδιορισμός παραμέτρων γραμμικής παλινδρόμησης.Είναι γνωστό ότι το άθροισμα των τετραγωνικών αποκλίσεων είναι μια παραλλαγή Χ Εγώαπό τον μέσο όρο είναι η μικρότερη τιμή, δηλαδή αυτό το θεώρημα αποτελεί τη βάση της μεθόδου των ελαχίστων τετραγώνων. Σχετικά με τη γραμμική παλινδρόμηση [βλ τύπος (1)] η απαίτηση αυτού του θεωρήματος ικανοποιείται από ένα ορισμένο σύστημα εξισώσεων που ονομάζεται κανονικός:

Κοινή λύση αυτών των εξισώσεων ως προς τις παραμέτρους έναΚαι σιοδηγεί στα ακόλουθα αποτελέσματα:

;

;

, από πού και.

Λαμβάνοντας υπόψη την αμφίδρομη φύση της σχέσης μεταξύ των μεταβλητών ΥΚαι Χ, τύπος για τον προσδιορισμό της παραμέτρου ΕΝΑπρέπει να εκφραστεί ως εξής:

Και . (7)

Παράμετρος σι, ή ο συντελεστής παλινδρόμησης, προσδιορίζεται από τους ακόλουθους τύπους:

Κατασκευή σειρών εμπειρικής παλινδρόμησης.Υπό την παρουσία του μεγάλος αριθμόςπαρατηρήσεις, η ανάλυση παλινδρόμησης ξεκινά με την κατασκευή εμπειρικών σειρών παλινδρόμησης. Σειρά εμπειρικής παλινδρόμησηςσχηματίζεται με τον υπολογισμό των τιμών ενός μεταβαλλόμενου χαρακτηριστικού Χμέσες τιμές ενός άλλου, συσχετισμένες με Χσημάδι Υ. Με άλλα λόγια, η κατασκευή των σειρών εμπειρικής παλινδρόμησης καταλήγει στην εύρεση ομαδικών μέσων όρων από τις αντίστοιχες τιμές των χαρακτηριστικών Y και X.

Μια σειρά εμπειρικής παλινδρόμησης είναι μια διπλή σειρά αριθμών που μπορεί να αναπαρασταθεί με σημεία σε ένα επίπεδο και στη συνέχεια, συνδέοντας αυτά τα σημεία με ευθύγραμμα τμήματα, μπορεί να ληφθεί μια εμπειρική γραμμή παλινδρόμησης. Οι σειρές εμπειρικής παλινδρόμησης, ειδικά τα γραφήματα τους, καλούνται γραμμές παλινδρόμησης, δώσε οπτική αναπαράστασησχετικά με τη μορφή και την εγγύτητα της συσχέτισης μεταξύ ποικίλων χαρακτηριστικών.

Ευθυγράμμιση σειρών εμπειρικής παλινδρόμησης.Τα γραφήματα των σειρών εμπειρικής παλινδρόμησης αποδεικνύονται ότι, κατά κανόνα, δεν κινούνται ομαλά, αλλά σπασμένες γραμμές. Αυτό εξηγείται από το γεγονός ότι, μαζί με τους κύριους λόγους που καθορίζουν το γενικό μοτίβο της μεταβλητότητας των συσχετισμένων χαρακτηριστικών, το μέγεθός τους επηρεάζεται από την επίδραση πολλών δευτερευόντων λόγων που προκαλούν τυχαίες διακυμάνσεις στα κομβικά σημεία παλινδρόμησης. Για να προσδιοριστεί η κύρια τάση (τάση) της συζυγούς παραλλαγής των συσχετισμένων χαρακτηριστικών, είναι απαραίτητο να αντικατασταθούν οι διακεκομμένες γραμμές με ομαλές, ομαλά τρέχουσες γραμμές παλινδρόμησης. Η διαδικασία αντικατάστασης σπασμένων γραμμών με λείες ονομάζεται ευθυγράμμιση εμπειρικών σειρώνΚαι γραμμές παλινδρόμησης.

Μέθοδος γραφικής ευθυγράμμισης.Αυτή είναι η απλούστερη μέθοδος που δεν απαιτεί υπολογιστική εργασία. Η ουσία του συνοψίζεται στα εξής. Η σειρά εμπειρικής παλινδρόμησης απεικονίζεται ως γραφική παράσταση σε ένα ορθογώνιο σύστημα συντεταγμένων. Στη συνέχεια σκιαγραφούνται οπτικά τα μεσαία σημεία παλινδρόμησης, κατά μήκος των οποίων χαράσσεται μια σταθερή γραμμή χρησιμοποιώντας έναν χάρακα ή ένα σχέδιο. Το μειονέκτημα αυτής της μεθόδου είναι προφανές: δεν αποκλείει την επίδραση των επιμέρους ιδιοτήτων του ερευνητή στα αποτελέσματα της ευθυγράμμισης των εμπειρικών γραμμών παλινδρόμησης. Επομένως, σε περιπτώσεις που χρειάζονται περισσότερα υψηλή ακρίβειαΚατά την αντικατάσταση σπασμένων γραμμών παλινδρόμησης με ομαλές, χρησιμοποιούνται άλλες μέθοδοι για την ευθυγράμμιση των εμπειρικών σειρών.

Μέθοδος κινητού μέσου όρου.Η ουσία αυτής της μεθόδου έγκειται στον διαδοχικό υπολογισμό των αριθμητικών μέσων όρων από δύο ή τρεις παρακείμενους όρους της εμπειρικής σειράς. Αυτή η μέθοδος είναι ιδιαίτερα βολική σε περιπτώσεις όπου η εμπειρική σειρά αντιπροσωπεύεται από μεγάλο αριθμό όρων, έτσι ώστε η απώλεια δύο από αυτούς - των ακραίων, η οποία είναι αναπόφευκτη με αυτήν τη μέθοδο ευθυγράμμισης, δεν θα επηρεάσει αισθητά τη δομή της.

Μέθοδος ελάχιστου τετραγώνου.Αυτή η μέθοδος προτάθηκε στις αρχές του 19ου αιώνα από τον A.M. Legendre και, ανεξάρτητα από αυτόν, K. Gauss. Σας επιτρέπει να ευθυγραμμίσετε με μεγαλύτερη ακρίβεια τις εμπειρικές σειρές. Αυτή η μέθοδος, όπως φαίνεται παραπάνω, βασίζεται στην υπόθεση ότι το άθροισμα των τετραγωνικών αποκλίσεων είναι μια επιλογή Χ Εγώ από τον μέσο όρο τους υπάρχει μια ελάχιστη τιμή, δηλαδή εξ ου και το όνομα της μεθόδου, η οποία χρησιμοποιείται όχι μόνο στην οικολογία, αλλά και στην τεχνολογία. Η μέθοδος των ελαχίστων τετραγώνων είναι αντικειμενική και καθολική, χρησιμοποιείται σε μια μεγάλη ποικιλία περιπτώσεων κατά την εύρεση εμπειρικών εξισώσεων για σειρές παλινδρόμησης και τον προσδιορισμό των παραμέτρων τους.

Η απαίτηση της μεθόδου των ελαχίστων τετραγώνων είναι αυτή θεωρητικά σημείαΟι γραμμές παλινδρόμησης πρέπει να λαμβάνονται με τέτοιο τρόπο ώστε το άθροισμα των τετραγωνικών αποκλίσεων από αυτά τα σημεία για εμπειρικές παρατηρήσεις y Εγώήταν ελάχιστη, δηλ.

Υπολογίζοντας το ελάχιστο αυτής της έκφρασης σύμφωνα με τις αρχές της μαθηματικής ανάλυσης και μετασχηματίζοντας το με έναν ορισμένο τρόπο, μπορεί κανείς να αποκτήσει ένα σύστημα των λεγόμενων κανονικές εξισώσεις, στην οποία οι άγνωστες τιμές είναι οι απαιτούμενες παράμετροι της εξίσωσης παλινδρόμησης και οι γνωστοί συντελεστές καθορίζονται από τις εμπειρικές τιμές των χαρακτηριστικών, συνήθως τα αθροίσματα των τιμών τους και τα διασταυρούμενα γινόμενα τους.

Πολλαπλή γραμμική παλινδρόμηση.Η σχέση μεταξύ πολλών μεταβλητών εκφράζεται συνήθως με μια εξίσωση πολλαπλής παλινδρόμησης, η οποία μπορεί να είναι γραμμικόςΚαι μη γραμμικό. Στην απλούστερη μορφή της, η πολλαπλή παλινδρόμηση εκφράζεται ως εξίσωση με δύο ανεξάρτητες μεταβλητές ( Χ, z):

Οπου ένα– ελεύθερος όρος της εξίσωσης. σιΚαι ντο– παράμετροι της εξίσωσης. Για την εύρεση των παραμέτρων της εξίσωσης (10) (με τη μέθοδο των ελαχίστων τετραγώνων), χρησιμοποιείται το ακόλουθο σύστημα κανονικών εξισώσεων:

Δυναμική σειρά. Ευθυγράμμιση σειρών.Οι αλλαγές στα χαρακτηριστικά με την πάροδο του χρόνου σχηματίζουν τα λεγόμενα χρονική σειράή δυναμική σειρά. Ένα χαρακτηριστικό γνώρισμα τέτοιων σειρών είναι ότι η ανεξάρτητη μεταβλητή X εδώ είναι πάντα ο παράγοντας χρόνου και η εξαρτημένη μεταβλητή Y είναι ένα μεταβαλλόμενο χαρακτηριστικό. Ανάλογα με τη σειρά παλινδρόμησης, η σχέση μεταξύ των μεταβλητών X και Y είναι μονόπλευρη, αφού ο παράγοντας χρόνος δεν εξαρτάται από τη μεταβλητότητα των χαρακτηριστικών. Παρά αυτά τα χαρακτηριστικά, οι σειρές δυναμικής μπορούν να παρομοιαστούν με σειρές παλινδρόμησης και να υποβληθούν σε επεξεργασία χρησιμοποιώντας τις ίδιες μεθόδους.

Όπως οι σειρές παλινδρόμησης, οι σειρές εμπειρικής δυναμικής επηρεάζονται όχι μόνο από τους κύριους, αλλά και από πολλούς δευτερεύοντες (τυχαίους) παράγοντες που συγκαλύπτουν την κύρια τάση στη μεταβλητότητα των χαρακτηριστικών, η οποία στη γλώσσα της στατιστικής ονομάζεται τάση.

Η ανάλυση των χρονοσειρών ξεκινά με τον προσδιορισμό του σχήματος της τάσης. Για να γίνει αυτό, η χρονοσειρά απεικονίζεται ως γραμμικό γράφημασε ένα ορθογώνιο σύστημα συντεταγμένων. Σε αυτήν την περίπτωση, τα χρονικά σημεία (έτη, μήνες και άλλες μονάδες χρόνου) σχεδιάζονται κατά μήκος του άξονα της τετμημένης και οι τιμές της εξαρτημένης μεταβλητής Υ απεικονίζονται κατά μήκος του άξονα τεταγμένων, εάν υπάρχει γραμμική σχέση μεταξύ των μεταβλητών X και Y (γραμμική τάση), η μέθοδος των ελαχίστων τετραγώνων είναι η καταλληλότερη για την ευθυγράμμιση της χρονοσειράς είναι μια εξίσωση παλινδρόμησης με τη μορφή αποκλίσεων των όρων της σειράς της εξαρτημένης μεταβλητής Y από τον αριθμητικό μέσο όρο της σειράς των ανεξάρτητων μεταβλητή Χ:

Εδώ είναι η παράμετρος γραμμικής παλινδρόμησης.

Αριθμητικά χαρακτηριστικά δυναμικών σειρών.Τα κύρια γενικευτικά αριθμητικά χαρακτηριστικά των δυναμικών σειρών περιλαμβάνουν γεωμετρικό μέσοκαι ένας αριθμητικός μέσος όρος κοντά σε αυτό. Χαρακτηρίζουν το μέσο ρυθμό με τον οποίο η τιμή της εξαρτημένης μεταβλητής αλλάζει σε ορισμένες χρονικές περιόδους:

Μια αξιολόγηση της μεταβλητότητας των μελών της σειράς δυναμικής είναι τυπική απόκλιση. Κατά την επιλογή εξισώσεων παλινδρόμησης για την περιγραφή χρονοσειρών, λαμβάνεται υπόψη το σχήμα της τάσης, το οποίο μπορεί να είναι γραμμικό (ή μειωμένο σε γραμμικό) και μη γραμμικό. Η ορθότητα της επιλογής της εξίσωσης παλινδρόμησης συνήθως κρίνεται από την ομοιότητα των εμπειρικά παρατηρούμενων και υπολογισμένων τιμών της εξαρτημένης μεταβλητής. Μια πιο ακριβής λύση σε αυτό το πρόβλημα είναι η μέθοδος ανάλυσης διακύμανσης παλινδρόμησης (θέμα 12, παράγραφος 4).

Συσχέτιση χρονοσειρών.Είναι συχνά απαραίτητο να συγκρίνουμε τη δυναμική των παράλληλων χρονοσειρών που σχετίζονται μεταξύ τους με ορισμένες γενικές συνθήκες, για παράδειγμα, για να ανακαλύψουμε τη σχέση μεταξύ της γεωργικής παραγωγής και της αύξησης του αριθμού των ζώων σε μια ορισμένη χρονική περίοδο. Σε τέτοιες περιπτώσεις, το χαρακτηριστικό της σχέσης μεταξύ των μεταβλητών X και Y είναι συντελεστής συσχέτισης R xy (παρουσία γραμμικής τάσης).

Είναι γνωστό ότι η τάση των χρονοσειρών συγκαλύπτεται, κατά κανόνα, από διακυμάνσεις στη σειρά της εξαρτημένης μεταβλητής Y. Αυτό δημιουργεί ένα διπλό πρόβλημα: τη μέτρηση της εξάρτησης μεταξύ των συγκριμένων σειρών, χωρίς να αποκλείεται η τάση, και η μέτρηση της εξάρτηση μεταξύ γειτονικών μελών της ίδιας σειράς, εξαιρουμένης της τάσης. Στην πρώτη περίπτωση, ο δείκτης της εγγύτητας της σύνδεσης μεταξύ των συγκριμένων χρονοσειρών είναι συντελεστής συσχέτισης(αν η σχέση είναι γραμμική), στο δεύτερο – συντελεστής αυτοσυσχέτισης. Αυτοί οι δείκτες έχουν διαφορετική σημασία, αν και υπολογίζονται χρησιμοποιώντας τους ίδιους τύπους (βλ. θέμα 11).

Είναι εύκολο να δούμε ότι η τιμή του συντελεστή αυτοσυσχέτισης επηρεάζεται από τη μεταβλητότητα των μελών της σειράς της εξαρτημένης μεταβλητής: όσο λιγότερο τα μέλη της σειράς αποκλίνουν από την τάση, τόσο υψηλότερος είναι ο συντελεστής αυτοσυσχέτισης και αντίστροφα.

Εργαστηριακή εργασία Νο 5. Ανάλυση παλινδρόμησης.

Η εργαστηριακή εργασία εκτελείται στο Excel 2007.

Σκοπός της εργασίας είναι η δημιουργία ενός πεδίου συσχέτισης, η εύρεση συντελεστών γραμμικής παλινδρόμησης και η κατασκευή μιας μέσης τετραγωνικής γραμμής παλινδρόμησης χρησιμοποιώντας το Excel.

Έχει καθοριστεί ένας πίνακας τιμών ελεγχόμενων τιμών Χ και τυχαία μεταβλητή Υ . Κατασκευάστε ένα πεδίο συσχέτισης. Βρείτε τις παραμέτρους της γραμμικής μέσης τετραγωνικής παλινδρόμησης. Κατασκευάστε μια γραμμή γραμμικής παλινδρόμησης.

1. Δημιουργήστε έναν πίνακα με τις τιμές της ελεγχόμενης μεταβλητής Χ και τυχαία μεταβλητή Υ , όπως φαίνεται στο Σχ. 1 και στη συνημμένη έκθεση.

Ρύζι. 1. Πίνακας αρχικών δεδομένων και παραμέτρων της εξίσωσης παλινδρόμησης.

Μια αναφορά για εργαστηριακές εργασίεςστο Excel/

2. Χρησιμοποιώντας τα αρχικά δεδομένα, κατασκευάστε ένα πεδίο συσχέτισης (έτσι λέγεται).

Ρύζι. 2. Γράφημα πεδίου συσχέτισης.

3. Η εξίσωση γραμμικής παλινδρόμησης έχει τη μορφή:

- γραμμική εξίσωση παλινδρόμησης.

Εξίσωση γραμμικής παλινδρόμησης ανάγεται σε μορφή εξίσωσης με κλίση.

Συντελεστής παλινδρόμησης δείγματος;

- σταθερά παλινδρόμησης δείγματος.

Χ ;

Τυπική απόκλιση Υ .

Συντελεστής συσχέτισης;

Ροπή συσχέτισης;

;

Χ ;

Προσδοκία τυχαίας μεταβλητής Υ .

4. Δημιουργήστε έναν πίνακα παραμέτρων της εξίσωσης παλινδρόμησης ,,,,(όπως φαίνεται στο Σχ. 1):

Για να υπολογίσετε τη μαθηματική προσδοκία, χρησιμοποιήστε τη συνάρτηση ΜΕΣΗ ΤΙΜΗαπό την κατηγορία Στατιστικός(και μην ρωτάτε πώς να το κάνετε).

Για να υπολογίσετε την τυπική απόκλιση, χρησιμοποιήστε τη συνάρτηση ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗαπό την κατηγορία Στατιστικός(πώς να το κάνετε αυτό, μπορείτε να ρωτήσετε τον δάσκαλο εάν δεν φοβάστε).

Για να υπολογίσετε τον συντελεστή συσχέτισης, χρησιμοποιήστε τη συνάρτηση CORREL από την κατηγορία Στατιστικός.

4. Στο κελί C2, εισαγάγετε τον τύπο , χρησιμοποιώντας τα αποτελέσματα των υπολογισμών των παραμέτρων,,, και, όπως φαίνεται στη γραμμή εισαγωγής του τύπου στο Σχ. 1.

Αναπαράγετε αυτόν τον τύπο σε μια στήλη κελιών C2:C6 με επισήμανση .

5. Προσθέστε μια γραμμή παλινδρόμησης στο γράφημα του πεδίου συσχέτισης.

Το Excel έχει έναν άλλο τρόπο για να βρει μια εξομαλυντική γραμμική σχέση και να δημιουργήσει μια γραμμή παλινδρόμησης.

6. Αντιγράψτε τα αρχικά δεδομένα στο κελί ΕΝΑ20 . Βρείτε τις παραμέτρους της εξίσωσης γραμμικής παλινδρόμησης ως εξής:

Ο συντελεστής παλινδρόμησης του δείγματος βρίσκεται χρησιμοποιώντας τη συνάρτηση ΚΛΙΝΩαπό την κατηγορία Στατιστικός;

Η σταθερά παλινδρόμησης του δείγματος βρίσκεται χρησιμοποιώντας τη συνάρτηση ΕΥΘΥΓΡΑΜΜΟ ΤΜΗΜΑαπό την κατηγορία Στατιστικός;

Τα αποτελέσματα των υπολογισμών φαίνονται στο παρακάτω σχήμα:

Ρύζι. 3. Πίνακας υπολογισμού παραμέτρων και δεδομένων y* για τη δημιουργία μιας γραμμής παλινδρόμησης

7. Κατασκευάστε ένα συνδυασμένο γράφημα του πεδίου συσχέτισης και της γραμμής παλινδρόμησης.

Μια άλλη συνάρτηση του Excel για την εύρεση γραμμικής παλινδρόμησης και τη γραφική παράσταση μιας γραμμής τάσης.

8. Επιλέξτε in Κυρίως μενούτους παρακάτω σελιδοδείκτες με τη σειρά Δεδομένα → Ανάλυση δεδομένων → Παλινδρόμηση.

Συμπληρώστε τα κενά πεδία στο πλαίσιο διαλόγου Οπισθοδρόμησησχετικά δεδομένα όπως φαίνεται στο Σχήμα 4:

Διάστημα εισαγωγής y: αρχικά δεδομένα y;

Διάστημα εισαγωγής Χ: αρχικά δεδομένα Χ;

Διάστημα εξόδου: ΕΝΑ47

Επιλέξτε το πλαίσιο χρονοδιαγράμματος επιλογής. ΕΝΤΑΞΕΙ!!!

Ρύζι. 4. Πλαίσιο διαλόγου Οπισθοδρόμηση

Διαδικασία Οπισθοδρόμησηεμφανίζει ένα γράφημα των αρχικών δεδομένων και μια γραμμή εξομάλυνσης παλινδρόμησης (το γράφημα πρέπει να είναι μορφοποιημένο).

ΣΕ τρίτοςτραπέζι ΣΥΜΠΕΡΑΣΜΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝβρίσκουμε τις παραμέτρους παλινδρόμησης που μας ενδιαφέρουν και - συντελεστές Υ-τομή και μεταβλητή Χ. Επιπλέον, η διαδικασία Οπισθοδρόμησηεμφανίζει μεγάλο αριθμό άλλων αποτελεσμάτων με τη μορφή πινάκων, τα οποία θα χρειαστούμε αργότερα κατά την επίλυση οικονομετρικών προβλημάτων.

Υπάρχουν δύο ακόμη τρόποι για να δημιουργήσετε μια γραμμή τάσεων στο Excel.

Αντιγράψτε τα αρχικά δεδομένα X και Y σε ένα μπλοκ που ξεκινά από το κελί A28 και σχεδιάστε ξανά το πεδίο συσχέτισης ( Εισαγωγή→Γράφημα→Τελεία)

Κάνοντας δεξί κλικ στον δείκτη ενός από τα σημεία στο γράφημα του πεδίου συσχέτισης, θα ενεργοποιηθεί το πλαίσιο διαλόγου μορφοποίησης δεδομένων σειράς. Επιλέξτε μια επιλογή Προσθήκη γραμμής τάσης... (όπως φαίνεται στο σχ. 5)

Στο παράθυρο που ανοίγει Μορφή γραμμής τάσηςεγκαθιστώ Επιλογές γραμμής τάσης:

- Γραμμικός

- Δείξτε την εξίσωση στο διάγραμμα

- Τοποθετήστε την τιμή αξιοπιστίας προσέγγισης στο διάγραμμα.

Όταν τσεκάρετε το πλαίσιο - Τοποθετήστε την τιμή αξιοπιστίας προσέγγισης στο διάγραμμα, η τιμή του συντελεστή προσδιορισμού εμφανίζεται στο διάγραμμα.

Όσο καλύτερη είναι η επιλογή της συνάρτησης παλινδρόμησης και όσο μικρότερη είναι η διαφορά μεταξύ των παρατηρούμενων και των υπολογισμένων τιμών, τόσο πιο κοντά είναι η ενότητα.

Ρύζι. 5. Πλαίσιο διαλόγου Οπισθοδρόμηση

Ρύζι. 6. Πλαίσιο διαλόγου Οπισθοδρόμηση

Μετά την ολοκλήρωση της διαδικασίας Προσθήκη γραμμής τάσης...Το γράφημα του πεδίου συσχέτισης θα έχει τη μορφή:

Ρύζι. 7. Γραφήματα του πεδίου συσχέτισης και της γραμμής τάσης με την εξίσωση παλινδρόμησης και τον συντελεστή προσδιορισμού.

Μορφοποιήστε το γράφημα και βγάλτε συμπεράσματα από την εργαστηριακή εργασία.

Υποβάλετε τα αποτελέσματα της εργασίας σας στον καθηγητή για βαθμολόγηση.

Επιλογές εργασιών.

Λαμβάνεται ένας πίνακας τιμών της ελεγχόμενης μεταβλητής X και της τυχαίας μεταβλητής Y Βρείτε την εξίσωση γραμμικής παλινδρόμησης. Σχεδιάστε τα αρχικά δεδομένα της τυχαίας μεταβλητής Y και σχεδιάστε τη γραμμή παλινδρόμησης.

Επιλογή 1.

Επιλογή 2.

Επιλογή 3.

Επιλογή 4.

Επιλογή 5.

Επιλογή 6.

Επιλογή 7.

Επιλογή 8.

Επιλογή 9.

Επιλογή 10.

Επιλογή 11.

Επιλογή 12.

Επιλογή 13.

Επιλογή 14.

Επιλογή 15.

Επιλογή 16.

Επιλογή 17.

Επιλογή 18.

Επιλογή 19.