Βιογραφίες Χαρακτηριστικά Ανάλυση

Ορισμός πολλαπλής παλινδρόμησης. Προδιαγραφές μοντέλου


Διάλεξη 3. Πολλαπλή παλινδρόμηση

    Προϋποθέσεις χρήσης της μεθόδου και περιορισμοί της

Η ζευγαρωμένη παλινδρόμηση μπορεί να δώσει καλά αποτελέσματα μοντελοποίησης εάν μπορεί να παραμεληθεί η επίδραση άλλων παραγόντων που επηρεάζουν το αντικείμενο μελέτης. Η συμπεριφορά των επιμέρους οικονομικών μεταβλητών δεν μπορεί να ελεγχθεί, δηλ. δεν είναι δυνατό να εξασφαλιστεί η ισότητα όλων των άλλων συνθηκών για την αξιολόγηση της επιρροής ενός υπό μελέτη παράγοντα. Σε αυτή την περίπτωση, θα πρέπει να προσπαθήσετε να προσδιορίσετε την επιρροή άλλων παραγόντων εισάγοντάς τους στο μοντέλο, π.χ. δημιουργήστε μια εξίσωση πολλαπλής παλινδρόμησης:

Ο κύριος στόχος της πολλαπλής παλινδρόμησης είναι η οικοδόμηση ενός μοντέλου με μεγάλο αριθμό παραγόντων, ενώ προσδιορίζεται η επιρροή καθενός από αυτούς ξεχωριστά, καθώς και η συνδυαστική τους επίδραση στον μοντελοποιημένο δείκτη. Η προδιαγραφή του μοντέλου περιλαμβάνει δύο σειρές θεμάτων: επιλογή παραγόντων και επιλογή του τύπου της εξίσωσης παλινδρόμησης.

Απαιτήσεις για παράγοντες:

    Πρέπει να είναι ποσοτικοποιήσιμο. Εάν είναι απαραίτητο, συμπεριλάβετε στο μοντέλο παράγοντας ποιότητας, το οποίο δεν έχει ποσοτική μέτρηση, χρειάζεται να του δοθεί ποσοτική βεβαιότητα (για παράδειγμα, σε ένα μοντέλο απόδοσης, η ποιότητα του εδάφους καθορίζεται με τη μορφή σημείων).

    Δεν πρέπει να αλληλοσυσχετίζονται, πολύ περισσότερο να είναι σε μια ακριβή λειτουργική σύνδεση. Ένταξη παραγόντων με υψηλή συσχέτιση στο μοντέλο όταν

για τον εθισμό

μπορεί να οδηγήσει σε ανεπιθύμητες συνέπειες και να οδηγήσει σε αστάθεια και αναξιοπιστία των εκτιμήσεων των συντελεστών παλινδρόμησης. Εάν υπάρχει υψηλή συσχέτιση μεταξύ παραγόντων, τότε η μεμονωμένη επιρροή τους στον δείκτη απόδοσης δεν μπορεί να προσδιοριστεί, επομένως οι παράμετροι της εξίσωσης παλινδρόμησης δεν ερμηνεύονται.

    Πολυσυγγραμμικότητα

Ειδική για τα πολυπαραγοντικά συστήματα είναι η προϋπόθεση του απαράδεκτου μιας πολύ στενής σύνδεσης μεταξύ των χαρακτηριστικών παραγόντων. Αυτή η κατάσταση αναφέρεται συχνά ως πρόβλημα συγγραμμικότητας παραγόντων. Συγγραμμικότητα σημαίνει μια αρκετά στενή μη τυχαία γραμμική συσχέτιση ορισμένων παραγόντων με άλλους. Συχνά συνιστάται να αποκλείεται ένας παράγοντας που σχετίζεται με άλλο παράγοντα όταν. Τα δύο είναι σφιχτά σχετικός φίλοςμε άλλους παράγοντες, είναι λογικό να αποκλειστεί ένας παράγοντας που σχετίζεται λιγότερο στενά με το χαρακτηριστικό που προκύπτει.

Απαιτείται μια πιο σύνθετη τεχνική για την εύρεση και τον αποκλεισμό ενός παράγοντα που δεν έχει στενή σύνδεση με κανέναν μεμονωμένο παράγοντα, αλλά έχει στενή πολυπαραγοντική σύνδεση με ένα σύμπλεγμα άλλων παραγόντων. Αυτή η κατάσταση ονομάζεται πολυσυγγραμμικότητα. Για τη μέτρησή του, οι πολλαπλοί συντελεστές συσχέτισης (ή προσδιορισμού) κάθε παράγοντα θα πρέπει να υπολογίζονται διαδοχικά (ως αποτέλεσμα) με όλους τους άλλους παράγοντες (ως επεξηγηματικές μεταβλητές). Έχοντας ανακαλύψει έναν πολυσυγγραμμικό παράγοντα ή αρκετούς από αυτούς, θα πρέπει να εξετάσουμε τη δυνατότητα αποκλεισμού του παράγοντα που εξαρτάται περισσότερο από το σύμπλεγμα άλλων παραγόντων, εάν αυτό δεν οδηγεί σε απώλεια της οικονομικής σημασίας του μοντέλου.

Η συγγραμμικότητα και η πολυσυγγραμμικότητα των παραγόντων στα οικονομικά συστήματα δεν προκύπτουν τυχαία. Σε ένα σύνολο ομοιογενών επιχειρήσεων ή περιοχών, κατά κανόνα, λόγω των νόμων της οικονομίας, προκύπτει μια παράλληλη παραλλαγή των χαρακτηριστικών παραγόντων: εκείνες οι επιχειρήσεις που έχουν τις καλύτερες τιμές ορισμένων παραγόντων, για παράδειγμα, τους καλύτερους φυσικές συνθήκες, ταυτόχρονα έχουν υψηλότερο κεφάλαιο και παροχή ρεύματος, υψηλότερα προσόντα προσωπικού, καλύτερη τεχνολογία κ.λπ. Εξ ου και η αναπόφευκτη μεγαλύτερη ή μικρότερη συγγραμμικότητα όλων των παραγόντων παραγωγής ή των κοινωνικοοικονομικών συνθηκών διαβίωσης.

Η παρουσία συγγραμμικότητας στο σύστημα επιδεινώνει τις μαθηματικές ιδιότητες του μοντέλου και μπορεί να οδηγήσει σε αστάθεια των παραμέτρων που προκύπτουν, οι οποίες αλλάζουν απότομα με μια μικρή αλλαγή στις τιμές των παραγόντων.

Ένα συγκεκριμένο πρόβλημα της πολυπαραγοντικής ανάλυσης είναι το ζήτημα της δυνατότητας αντικατάστασης ενός παράγοντα για τον οποίο δεν υπάρχουν πληροφορίες με άλλο παράγοντα και οι συνέπειες μιας τέτοιας αντικατάστασης.

Εάν είναι δυνατόν, θα πρέπει να βρείτε μια άλλη μεταβλητή της οποίας οι τιμές είναι γνωστές και επαρκείς στενή σύνδεσημε έναν παράγοντα που λείπει. Για παράδειγμα, εάν δεν υπάρχουν δεδομένα για την περιοχή σχετικά με τους μέσους μισθούς, τότε μπορούν να αντικατασταθούν από την αξία του κατά κεφαλήν ακαθάριστου περιφερειακού προϊόντος, λαμβάνοντας υπόψη ότι θα πρέπει να υπάρχει στενή (αν και όχι επακριβώς γνωστή) σχέση μεταξύ αυτών των οικονομικών Χαρακτηριστικά.

Είναι σημαντικό να ληφθεί υπόψη ο σκοπός για τον οποίο κατασκευάζεται το μοντέλο. Εάν ο στόχος είναι μόνο η πρόβλεψη ενός αποτελεσματικού χαρακτηριστικού, τότε η αντικατάσταση ενός παράγοντα με μια άλλη μεταβλητή εάν σχετίζεται στενά με τον παράγοντα που αντικαθίσταται δεν θα οδηγήσει σε σημαντικά σφάλματα. Αλλά αν ο στόχος του μοντέλου ήταν ο διαχειριστής να λάβει αποφάσεις σχετικά με την οικονομική του πολιτική, τότε η αντικατάσταση ενός ελεγχόμενου παράγοντα με έναν στενά συνδεδεμένο, αλλά ανεξέλεγκτο, παράγοντα αντικατάστασης στερεί από το μοντέλο νόημα, παρά την υψηλή αποφασιστικότητά του.

    Επιλογή του τύπου πολυπαραγοντικού μοντέλου και των χαρακτηριστικών παραγόντων

Σχέση του προκύπτοντος σημείου y με παράγοντες Χ 1 , Χ 2 , …, Χ κ εκφράζεται με την εξίσωση:

(22)

Οπου ένα– ελεύθερος όρος της εξίσωσης.

κ– αριθμός παραγόντων·

ι– αριθμός συντελεστή·

Εγώ– αριθμός της συνολικής μονάδας·

σι ι– συντελεστής υπό όρους καθαρής παλινδρόμησης με τον παράγοντα Χ ι, μέτρηση της μεταβολής του αποτελέσματος όταν ένας παράγοντας αλλάζει ανά μονάδα του και με άλλους παράγοντες που περιλαμβάνονται στο μοντέλο να παραμένουν σταθεροί.

ε Εγώ– τυχαία παραλλαγή y Εγώ, δεν εξηγείται από το μοντέλο.

Το μοντέλο στη μορφή (22) είναι προσθετικό. Αυτό σημαίνει ότι το μοντέλο βασίζεται στην υπόθεση ότι κάθε παράγοντας προσθέτει κάτι ή αφαιρεί κάτι από την τιμή του χαρακτηριστικού που προκύπτει. Αυτή η υπόθεση σχετικά με το είδος της σύνδεσης μεταξύ αιτίας και αποτελέσματος αντικατοπτρίζει πλήρως έναν αριθμό οικονομικών συστημάτων αλληλένδετων χαρακτηριστικών. Για παράδειγμα, εάν yείναι η απόδοση μιας γεωργικής καλλιέργειας, και Χ 1 , Χ 2 , …, Χ κ– αγροτεχνικοί παράγοντες: δόσεις διαφορετικών τύπων λιπασμάτων, αριθμός ζιζανίων, ποτίσματα, μερίδιο απωλειών κατά τη συγκομιδή, και μάλιστα, καθένας από αυτούς τους παράγοντες είτε αυξάνει είτε μειώνει την απόδοση και το αποτέλεσμα μπορεί να υπάρχει χωρίς κανέναν από τους αναφερόμενους παράγοντες .

Ωστόσο, το μοντέλο πρόσθετου δεν είναι κατάλληλο για όλες τις συνδέσεις στην οικονομία. Αν μελετήσουμε μια τέτοια σχέση όπως η εξάρτηση του όγκου παραγωγής μιας επιχείρησης yαπό την κατεχόμενη περιοχή Χ 1 , Αριθμός εργαζομένων Χ 2 , αξία παγίων Χ 3 (ή όλο το κεφάλαιο), τότε καθένας από τους παράγοντες είναι απαραίτητος για την ύπαρξη του αποτελέσματος και όχι προσθήκη σε αυτό. Σε τέτοιες περιπτώσεις, πρέπει να προχωρήσουμε από την υπόθεση της πολλαπλασιαστικής μορφής του μοντέλου:

(23)

Σύμφωνα με τους πρώτους δημιουργούς του, ένα τέτοιο μοντέλο ονομαζόταν «μοντέλο Cobb-Douglas».

Είναι επίσης δυνατή μια μικτή μορφή του μοντέλου, στην οποία ορισμένοι παράγοντες θα περιλαμβάνονται αθροιστικά και άλλοι πολλαπλασιαστικά.

Κατά την επιλογή των χαρακτηριστικών παραγόντων, θα πρέπει να ακολουθήσετε τις ακόλουθες διατάξεις.

    Οι παράγοντες πρέπει να είναι αιτίες και το σημάδι που προκύπτει πρέπει να είναι η συνέπειά τους. Είναι απαράδεκτο να περιλαμβάνεται μεταξύ των παραγόντων ένα χαρακτηριστικό που κατέχει θέση στην πραγματική οικονομία στην «παραγωγή» του συστήματος, δηλ. εξαρτάται από το μοντέλο. Για παράδειγμα, κατασκευάζεται ένα μοντέλο του κόστους ενός εκατό βάρους σιτηρών. Οι παράγοντες που λαμβάνονται είναι η απόδοση των σιτηρών και η ένταση εργασίας εκατό βάρους, αλλά ο συντελεστής προσδιορισμού είναι μικρός και το μοντέλο φτωχό. Για να «βελτιωθεί» η κερδοφορία της παραγωγής σιτηρών προστέθηκε στη λίστα των παραγόντων. Ο συντελεστής προσδιορισμού εκτινάχθηκε αμέσως στο 0,88. Αλλά το μοντέλο δεν βελτιώθηκε, έγινε χωρίς νόημα, καθώς η κερδοφορία εξαρτάται από το κόστος και όχι το αντίστροφο.

    Τα χαρακτηριστικά των παραγόντων δεν πρέπει να αποτελούν συστατικά του προκύπτοντος χαρακτηριστικού. Στο ίδιο μοντέλο κόστους, δεν μπορεί κανείς να εισαγάγει ως παράγοντες μισθούς ανά εκατό βάρος σιτηρών, κόστος μεταφοράς εκατό βάρους σιτηρών κ.λπ. η σύνδεση του συνόλου με το δομικά μέρηδεν πρέπει να αναλύονται χρησιμοποιώντας ανάλυση συσχέτισης, αλλά χρησιμοποιώντας συστήματα ευρετηρίου.

    Πρέπει να αποφεύγεται η επικάλυψη παραγόντων. Κάθε πραγματικός παράγοντας πρέπει να αντιπροσωπεύεται από έναν δείκτη. Για παράδειγμα, ο συντελεστής εργασίας σε ένα μοντέλο όγκου παραγωγής μπορεί να αναπαρασταθεί είτε από τον μέσο αριθμό εργαζομένων είτε από το κόστος ανθρωποημέρων (ανθρωποώρες) για την παραγωγή, αλλά όχι και από τους δύο δείκτες. Ο διπλασιασμός των παραγόντων οδηγεί σε κατακερματισμό επιρροή παράγοντα, και μπορεί να γίνει αναξιόπιστο λόγω αυτού του κατακερματισμού.

    Παράγοντες που σχετίζονται στενά με άλλους θα πρέπει να αποφεύγονται όποτε είναι δυνατόν.

    Παράγοντες ενός επιπέδου της ιεραρχίας θα πρέπει να περιλαμβάνονται παράγοντες υψηλότερου επιπέδου και οι υποπαράγοντες τους δεν πρέπει να περιλαμβάνονται. Για παράδειγμα, στο μοντέλο κόστους σιτηρών συμπεριλαμβάνουμε την απόδοση και την ένταση εργασίας, αλλά δεν προσθέτουμε βαθμολογία γονιμότητας, δόση λιπάσματος ή την παροχή ενέργειας των εργαζομένων, π.χ. υποπαράγοντες – λόγοι που επηρεάζουν την παραγωγικότητα και την ένταση της εργασίας. Η συμπερίληψη των υποπαραγόντων είναι επίσης επικάλυψη του παράγοντα.

    Υπάρχει λογική στην κατασκευή ενός μοντέλου με τέτοιο τρόπο ώστε όλα τα χαρακτηριστικά να αποδίδονται στην ίδια μονάδα του πληθυσμού, τόσο το χαρακτηριστικό που προκύπτει όσο και οι παράγοντες. Για παράδειγμα, εάν μοντελοποιηθεί ο όγκος παραγωγής μιας επιχείρησης, τότε οι παράγοντες πρέπει να σχετίζονται με την επιχείρηση: ο αριθμός των εργαζομένων, η έκταση γης, τα πάγια στοιχεία ενεργητικού κ.λπ. Αν κατασκευάζεται μοντέλο μισθοίεργαζόμενος, τότε οι παράγοντες πρέπει να σχετίζονται με τον εργαζόμενο: η προϋπηρεσία του, η ηλικία, η εκπαίδευση, η κατάταξη της κλίμακας τιμολογίων (κλίμακα), η παροχή ρεύματος κ.λπ.

    Ισχύει η αρχή της απλότητας του μοντέλου. Αν είναι δυνατόν να οικοδομήσουμε καλό μοντέλομε πέντε παράγοντες, τότε δεν πρέπει να κυνηγάς ιδανικό μοντέλομε δέκα παράγοντες, συνήθως επιπλέον παράγοντες επιδεινώνουν το μοντέλο.

    Συστήματα πολυμεταβλητών δεικτών συσχέτισης και παλινδρόμησης

Ας εξετάσουμε αυτό το σύστημα δεικτών χρησιμοποιώντας το παράδειγμα της σχέσης μεταξύ των αποδόσεων των καλλιεργειών σιτηρών σε 51 γεωργικές επιχειρήσεις στην περιοχή Oryol. Αρχικά, επιλέχθηκαν 8 χαρακτηριστικά παραγόντων που θα μπορούσαν να επηρεάσουν τη διακύμανση της απόδοσης:

Χ 1 – μέγεθος έκτασης καλλιέργειας σιτηρών, εκτάρια·

Χ 2 ειδικό βάροςσιτηρά σε συνολική έκταση, %;

Χ 3 – κόστος ανά 1 εκτάριο σποράς σιτηρών, χιλιάδες ρούβλια/εκτάριο.

Χ 4 – κόστος εργασίας ανά 1 εκτάριο, ανθρωποώρα.

Χ 5 – επίπεδο μισθού, τρίψιμο/ατομική ώρα.

Χ 6 – παροχή ενέργειας, hp/100 ha καλλιεργήσιμης γης.

Χ 7 – αριθμός συνδυαζόμενων ανά 1000 εκτάρια σιτηρών, τεμ.

Χ 8 – αριθμός οδηγών τρακτέρ ανά 100 εκτάρια καλλιεργήσιμης γης, άτομα.

Η αρχική εξίσωση παλινδρόμησης είναι:

Ωστόσο, μόνο οι συντελεστές στο Χ 3 (t-κριτήριο είναι 10,5) και πότε Χ 8 (t-το κριτήριο είναι 2,72). Μεγαλύτερη αξιοπιστία από άλλους παράγοντες και Χ 5 .

Μετά την εξάλειψη των αναξιόπιστων παραγόντων, π.χ. αφαιρώντας τα από την εξίσωση, η τελική εξίσωση παλινδρόμησης είναι:

Έτσι, η διαφορά στην απόδοση στα στοιχεία 51 γεωργικών επιχειρήσεων επηρεάστηκε ισχυρότερα και αξιόπιστα από τις διαφορές μεταξύ των επιχειρήσεων στο κόστος ανά 1 εκτάριο, στο επίπεδο των μισθών και στην παροχή ειδικευμένων εργαζομένων.

Καθένας από τους συντελεστές, που ονομάζονται συντελεστές καθαρής παλινδρόμησης, ερμηνεύονται ως το ποσό της μεταβολής της απόδοσης, υπό τον όρο ότι ο συντελεστής αλλάζει από την εγκεκριμένη μονάδα μέτρησης και οι άλλοι δύο παράγοντες παραμένουν σταθεροί στα μέσα επίπεδα. Για παράδειγμα, σι 3 σημαίνει ότι με αύξηση του κόστους ανά 1 στρέμμα σιτηρών και με σταθερούς μισθούς και διαθεσιμότητα οδηγών τρακτέρ, η απόδοση αυξήθηκε κατά μέσο όρο κατά 4,6 c/ha. Ο όρος «υπό όρους καθαρή παλινδρόμηση» σημαίνει ότι η επιρροή ενός μεμονωμένου παράγοντα απαλείφεται από τη συνοδευτική παραλλαγή μόνο εκείνων των παραγόντων που περιλαμβάνονται στην εξίσωση, αλλά δεν εκκαθαρίζεται από την πιθανή συνοδευτική παραλλαγή άλλων παραγόντων.

Το μέγεθος των συντελεστών της υπό όρους καθαρής παλινδρόμησης εξαρτάται από τις υιοθετούμενες μονάδες μέτρησης. Αν ήταν ένας παράγοντας Χ 3 μετρήθηκε όχι σε χιλιάδες ρούβλια ανά εκτάριο, αλλά σε ρούβλια ανά εκτάριο, τότε ο συντελεστής σι 3 θα ισούται με 0,00461 rub/ha. Επομένως, είναι αδύνατο να συγκριθούν οι συντελεστές της υπό όρους καθαρής παλινδρόμησης μεταξύ τους. Για να ληφθούν συγκρίσιμοι συντελεστές επιρροής της διακύμανσης των παραγόντων στη διακύμανση του αποτελέσματος, θα πρέπει να απαλλαγούμε από τις μονάδες μέτρησης και να τις μειώσουμε σε μία συμβατική μονάδα. Για να το κάνετε αυτό, μπορείτε να χρησιμοποιήσετε δύο μεθόδους.

Η πρώτη μέθοδος ονομάζεται τυποποίηση. Αυτός ο όρος προήλθε από αγγλικό όνοματυπική απόκλιση. Οι τυποποιημένοι συντελεστές παλινδρόμησης εκφράζονται σε αναλογίες ή τιμές, εάν υπερβαίνουν τις τιμές ενός σε σ y. Οι τυποποιημένοι συντελεστές συμβολίζονται με το ελληνικό γράμμα β και ονομάζονται συντελεστές βήτα. Ο τύπος τους είναι:

Στο παράδειγμά μας παίρνουμε:

β 3 = 0,772;

β 5 = 0,147;

β 8 = 0,223.

Η ερμηνεία των συντελεστών βήτα είναι η εξής: όταν αλλάζει ο παράγοντας Χ 3 κατά μία τυπική απόκλιση από τη μέση τιμή και με άλλους παράγοντες να παραμένουν σταθεροί, το ενεργό χαρακτηριστικό (απόδοση) θα αποκλίνει από το μέσο επίπεδό του κατά 0,772 της τυπικής απόκλισης. Εφόσον όλοι οι τυποποιημένοι συντελεστές εκφράζονται στις ίδιες μονάδες μέτρησης, σε σ y , είναι συγκρίσιμα μεταξύ τους και μπορούμε να συμπεράνουμε ότι η διακύμανση της απόδοσης επηρεάστηκε περισσότερο στο σύνολο των επιχειρήσεων που μελετήθηκαν από τη διακύμανση του κόστους ανά εκτάριο καλλιεργειών.

Ένας άλλος τρόπος για να κάνουμε τους συντελεστές παλινδρόμησης συγκρίσιμους είναι να τους μετατρέψουμε σε συντελεστές ελαστικότητας. Τύπος συντελεστή ελαστικότητας ℓ ι :

(25)

Ο συντελεστής ελαστικότητας ερμηνεύεται ως εξής: όταν ο συντελεστής αλλάζει Χ ιστο δικό του μέση αξίακαι αν άλλοι παράγοντες που περιλαμβάνονται στην εξίσωση είναι σταθεροί, το ενεργό πρόσημο θα αλλάξει κατά μέσο όρο κατά ℓ ιμέρος της μέσης τιμής του (ή ℓ ι μέσοι όροι εάν ℓ ι>1, που συμβαίνει λιγότερο συχνά). Λέγεται συχνά, «θα αλλάξει σε ℓ ιτοις εκατό ανά 1% αλλαγή συντελεστή."

Στο παράδειγμά μας έχουμε:

Οι συντελεστές ελαστικότητας εκφράζονται όπως β ι, στις ίδιες μονάδες και συγκρίσιμες μεταξύ τους. Είναι πιο βολικοί από τους β-συντελεστές για χρήση στον προγραμματισμό και την πρόβλεψη. Είναι απίθανο ένας διαχειριστής να σχεδιάσει να αυξήσει έναν συντελεστή, για παράδειγμα, επένδυση κατά 0,6 σίγμα. Συνήθως σχεδιάζουν να αλλάξουν τους παράγοντες, εάν είναι ελεγχόμενοι, κατά τόσο πολύ τοις εκατό του επιτυγχανόμενου επιπέδου. Για παράδειγμα, εάν σχεδιάζουμε να αυξήσουμε το κόστος ανά εκτάριο σιτηρών κατά 10%, το κόστος εργασίας κατά 30% και την παροχή ειδικευμένων οδηγών τρακτέρ κατά 20%, τότε μπορούμε να περιμένουμε μια αλλαγή στην απόδοση κατά
, Οπου κ ι– προγραμματισμένοι ρυθμοί ανάπτυξης παραγόντων.

Ας εξετάσουμε τώρα ένα σύστημα δεικτών της εγγύτητας των πολυπαραγοντικών συνδέσεων. Πρώτα απ 'όλα, κατασκευάζεται ένας πίνακας ζευγαρωμένων συντελεστών συσχέτισης (Πίνακας 1).

Πίνακας 1. Πίνακας συντελεστών συσχέτισης ζεύγους

Σημάδια

Χ 3

Χ 5

Χ 8

Χ 3

Χ 5

Χ 8

Ο πίνακας των συντελεστών συσχέτισης κατά ζεύγη παρέχει είσοδο για άλλα μέτρα ισχύος της σχέσης και για μια αρχική δοκιμή για συγγραμμικότητα. ΣΕ σε αυτήν την περίπτωσηΌλες οι συνδέσεις μεταξύ των παραγόντων είναι αδύναμες, η συγγραμμικότητα δεν θα χαλάσει το μοντέλο.

Ο πιο σημαντικός δείκτης της εγγύτητας της επικοινωνίας σε ένα πολυπαραγοντικό σύστημα είναι ο συντελεστής πολλαπλού προσδιορισμού R 2 . Μετρά τη συνολική στεγανότητα της σχέσης μεταξύ της παραλλαγής του χαρακτηριστικού που προκύπτει yμε παραλλαγή ολόκληρου του συστήματος παραγόντων που περιλαμβάνονται στο μοντέλο. Η τιμή του συντελεστή πολλαπλού προσδιορισμού μπορεί να υπολογιστεί με διάφορους τρόπους.

1. Υπολογισμός με βάση τον πίνακα συντελεστών συσχέτισης ζεύγους

,

όπου Δ * είναι η ορίζουσα του πίνακα.

, (26)

και Δ είναι η ορίζουσα ενός πίνακα που δεν περιλαμβάνει την πρώτη σειρά Δ * και την τελευταία στήλη, δηλ.:

Με δύο παράγοντες, προκύπτει ένας απλοποιημένος τύπος υπολογισμού:

(27)

Από την (27) προκύπτει ότι αν οι παράγοντες είναι ανεξάρτητοι μεταξύ τους, δηλ. , ο συντελεστής πολλαπλού προσδιορισμού είναι το άθροισμα των ζευγαρωμένων συντελεστών προσδιορισμού.

Χρησιμοποιώντας τον τύπο (27), μπορούμε να υπολογίσουμε τρεις πιθανούς συντελεστές προσδιορισμού δύο παραγόντων:

2.Υπολογισμός με βάση τους συντελεστές συσχέτισης ζευγών και τους β-συντελεστές:

Στο παράδειγμα: R 2 =0,86·0,772+0,35·0,147+0,433·0,223=0,8119.

3. Ο υπολογισμός ως σχέση συσχέτισης, δηλ. αναλογία διακύμανσης του προκύπτοντος χαρακτηριστικού yσχετίζεται με τη διακύμανση του συστήματος των παραγόντων που περιλαμβάνονται στο μοντέλο (στην εξίσωση παλινδρόμησης), σε ολόκληρη τη γενική παραλλαγή του προκύπτοντος χαρακτηριστικού:

. (30)

Ο αριθμητής του τύπου (30) είναι το άθροισμα των τετραγώνων των αποκλίσεων των μεμονωμένων υπολογισμένων τιμών του ενεργού χαρακτηριστικού από τον μέσο όρο του και ο παρονομαστής είναι το άθροισμα των τετραγώνων των πραγματικών τιμών του ενεργού χαρακτηριστικού από τον μέσο όρο, για όλες τις μονάδες του πληθυσμού.

Οι μερικοί συντελεστές προσδιορισμού είναι δείκτες που μετρούν με ποιο ποσοστό μειώνεται η ανεξήγητη διακύμανση από παράγοντες που υπάρχουν ήδη στο μοντέλο όταν ένας δεδομένος παράγοντας περιλαμβάνεται στο μοντέλο Χ Μ. Ο τύπος για τον μερικό συντελεστή προσδιορισμού είναι:

Στο παράδειγμά μας:

Η ερμηνεία είναι η εξής: συμπερίληψη του παράγοντα στο μοντέλο Χ 3 μετά Χ 5 Και Χ 8 yκατά 74%· συμπερίληψη παράγοντα Χ 5 μετά Χ 3 Και Χ 8 μειώνει την ανεξήγητη παραλλαγή yστο 10%? συμπερίληψη παράγοντα Χ 8 μετά Χ 3 Και Χ 5 μειώνει την ανεξήγητη παραλλαγή yκατά 20%.

Οι συντελεστές μερικού προσδιορισμού είναι ασύγκριτοι μεταξύ τους, αφού είναι μερίδια διαφορετικών ποσοτήτων παρονομαστή.

Λαμβάνοντας την τετραγωνική ρίζα οποιουδήποτε συντελεστή προσδιορισμού, προκύπτει ο συντελεστής της αντίστοιχης συσχέτισης: πολλαπλός, ζεύγος ή μερικός.

5. Ένταξη μη ποσοτικών παραγόντων στο πολυπαραγοντικό μοντέλο

Μη ποσοτικοί παράγοντες της αγροτικής παραγωγής είναι: φυσική περιοχή, μορφή ιδιοκτησίας επιχειρήσεων, κυρίαρχη κατεύθυνση παραγωγής (βιομηχανία) και άλλα. Είναι προτιμότερο να μην αναμειγνύονται στον αρχικό πληθυσμό επιχειρήσεις ή περιοχές που διαφέρουν ως προς αυτά τα ποιοτικά χαρακτηριστικά. Αλλά μπορεί επίσης να χρειαστεί να δημιουργηθεί ένα μοντέλο με ετερογενείς μονάδες του πληθυσμού, για παράδειγμα, εάν ο αριθμός των μονάδων που είναι ποιοτικά ομοιογενείς είναι πολύ μικρός για αξιόπιστη επικοινωνία. Μερικές φορές ο στόχος μπορεί να είναι η μέτρηση της καθαρής επιρροής ενός μη ποσοτικού παράγοντα, για παράδειγμα, της ιδιοκτησίας στα αποτελέσματα της παραγωγής, και αυτό απαιτεί τη συμπερίληψη ενός ποιοτικού παράγοντα σε ένα πολυπαραγοντικό μοντέλο.

Σε τέτοιες περιπτώσεις, οι ποιοτικές διαβαθμίσεις ενός χαρακτηριστικού μπορούν να κωδικοποιηθούν από ειδικές μεταβλητές, που συχνά ονομάζονται «εικονικές» ή «δομικές» μεταβλητές. Αντικατοπτρίζουν την ετερογένεια της ποιοτικής δομής του πληθυσμού. Ας υποθέσουμε ότι είναι απαραίτητο να οικοδομηθεί ένα μοντέλο παλινδρόμησης της κερδοφορίας των προϊόντων της επιχείρησης και στην περιοχή υπάρχουν 16 κρατικές επιχειρήσεις, 28 ιδιωτικές επιχειρήσεις και 13 συνεταιριστικές μορφές ιδιοκτησίας.

Εάν αγνοήσετε τις διαφορές που σχετίζονται με τη μορφή ιδιοκτησίας, τότε είτε θα πάνε σε υπολειπόμενη διακύμανση, επιδεινώνοντας το μοντέλο κερδοφορίας, είτε σε άγνωστη αναλογία θα αρχίσουν να αναμιγνύονται με την επίδραση ορισμένων ποιοτικών παραγόντων, αλλοιώνοντας το μέτρο της επιρροής τους .

Απαραίτητο για Μ εισάγουν μη ποσοτικούς παράγοντες ή διαβαθμίσεις ενός τέτοιου παράγοντα Μ-1 δομική μεταβλητή, την οποία συμβολίζουμε U ι. Τα δεδομένα για τον υπολογισμό θα μοιάζουν με αυτό: Μ=3 (Πίνακας 2).

Πίνακας 2. Αρχικά δεδομένα με δομικές μεταβλητές

Είδος ιδιοκτησίας

Μονάδα πληθυσμού

Ποσοτικά χαρακτηριστικά

Δομικές Μεταβλητές

Χ 1

Χ 2

Χ κ

U 1

U 2

κατάσταση

Οι έννοιες αυτών των σημείων

Οι έννοιες αυτών των σημείων

Συνεργατική

Οι έννοιες αυτών των σημείων

Ως αποτέλεσμα της λύσης, θα ληφθεί ένα μοντέλο της φόρμας:

Οπου Χ κ +1 αντιστοιχούν στη μεταβλητή U 1 , ΕΝΑ Χ κ +2 – μεταβλητή U 2 .

Ας ξαναγράψουμε το μοντέλο σε ειδική σημειογραφία:

Η σημασία των συντελεστών για τις δομικές μεταβλητές είναι η εξής: συντελεστής ντο 1 σημαίνει ότι οι ιδιωτικές επιχειρήσεις με τις ίδιες αξίες ποσοτικών συντελεστών Χ 1 Χ κέχουν κερδοφορία ντο 1 περισσότερο από τις κρατικές επιχειρήσεις, οι οποίες λαμβάνονται ως βάση σύγκρισης (δεν έχουν διαρθρωτικές μεταβλητές U 1 Και U 2 ). Οι επιχειρήσεις συνεταιριστικής ιδιοκτησίας έχουν κερδοφορία ντο 2 μεγαλύτερες από τις κρατικές. Ποσότητες ντο 1 Και ντο 2 μπορεί να είναι και θετικό και αρνητικό.

Αντί για ένα γενικό μοντέλο, μπορείτε να γράψετε τρία συγκεκριμένα μοντέλα για επιχειρήσεις χωριστές ομάδεςανά είδος ιδιοκτησίας, προσθέτοντας τον συντελεστή της δομικής μεταβλητής στον ελεύθερο όρο της εξίσωσης:

α) για επιχειρήσεις του δημόσιου τομέα

β) για επιχειρήσεις του ιδιωτικού τομέα

γ) για επιχειρήσεις του συνεταιριστικού τομέα

6.Εφαρμογή πολυπαραγοντικής μοντέλα παλινδρόμησηςγια την ανάλυση των επιχειρηματικών δραστηριοτήτων και τις προβλέψεις

Η αξιολόγηση της απόδοσης που βασίζεται σε ένα μοντέλο παλινδρόμησης σε σύγκριση με την απλούστερη μέθοδο τέτοιας αξιολόγησης - η σύγκριση του αποτελέσματος που επιτυγχάνεται από μια δεδομένη επιχείρηση με το μέσο αποτέλεσμα για έναν ομοιογενή πληθυσμό - παρέχει πρόσθετα πλεονεκτήματα.

Σύμφωνα με το παράδειγμά μας, η μέση απόδοση για 51 γεωργικές επιχειρήσεις ήταν 22,9 c/ha σιτηρών.

Η αγροτική επιχείρηση 1 έλαβε 17,6 c/ha. Επομένως, αυτή η εταιρεία είναι καθυστερημένη. Ωστόσο, τίθεται το ερώτημα: μήπως οι συνθήκες παραγωγής αυτής της εταιρείας ήταν χειρότερες από τον μέσο όρο; Η σύγκριση με τον συνολικό μέσο όρο αγνοεί εντελώς τη διαφορά στην «παροχή συντελεστών» των επιχειρήσεων και στην πραγματικότητα, οι επιχειρήσεις δεν βρίσκονται πάντα στις ίδιες συνθήκες.

Η αξιολόγηση της απόδοσης που βασίζεται σε ένα μοντέλο παλινδρόμησης περιλαμβάνει τη συνεκτίμηση της ανισότητας στις συνθήκες παραγωγής, για παράδειγμα, τη γονιμότητα του εδάφους, την οικονομική κατάσταση, τη διαθεσιμότητα ειδικευμένου προσωπικού και άλλα. Είναι αδύνατο να ληφθούν πλήρως υπόψη οι διαφορές στις συνθήκες παραγωγής μεταξύ των επιχειρήσεων, καθώς οποιοδήποτε μοντέλο δεν λαμβάνει υπόψη όλους τους παράγοντες διακύμανσης της απόδοσης. Μια αξιολόγηση με βάση το μοντέλο γίνεται συγκρίνοντας το πραγματικό αποτέλεσμα (απόδοση) με το αποτέλεσμα που θα είχε επιτύχει η επιχείρηση με τους πραγματικούς διαθέσιμους παράγοντες και τον συνολικό μέσο όρο της αποτελεσματικότητάς τους, εκφραζόμενο με συντελεστές παλινδρόμησης υπό όρους καθαρούς. Ας εξετάσουμε τα αποτελέσματα του υπολογισμού της απόδοσης δύο επιχειρήσεων (Πίνακας 3).

Πίνακας 3. Πραγματικά και εκτιμώμενα αποτελέσματα παραγωγής

Agrofirm

Χαρακτηριστικά παραγόντων

Παραγωγικότητα, c/ha

Χ 3

Χ 5

Χ 8

πραγματικός

υπολογίζεται

Μέσος όρος δείγματος

Και οι δύο εταιρείες έχουν χειρότερες τιμές των κύριων παραγόντων από τον μέσο όρο του δείγματος Χ 3 Και Χ 8 , και, κατά συνέπεια, οι υπολογισμένες τιμές απόδοσης είναι χαμηλότερες από τον μέσο όρο. Ταυτόχρονα όμως, η επιχείρηση 1 έχει πρακτικά την ίδια υπολογισμένη απόδοση με αυτή που πραγματικά ελήφθη. Δεν υπάρχει λόγος να θεωρήσουμε ότι αυτή η εταιρεία υστερεί. Η επιχείρηση 2 έχει πραγματική απόδοση χαμηλότερη από αυτή που υπολογίζεται με βάση τους διαθέσιμους παράγοντες. Αυτό σημαίνει ότι είτε αυτή η εταιρεία είχε άγνωστους παράγοντες που δεν περιλαμβάνονται στο μοντέλο και ήταν χειρότεροι από τον μέσο όρο είτε ο βαθμός χρήσης των κύριων παραγόντων - κόστος ανά εκτάριο και παροχή ειδικευμένων εργαζομένων - είναι χαμηλότερος από τον μέσο όρο.

Η πρόβλεψη που βασίζεται σε ένα μοντέλο παλινδρόμησης βασίζεται στην υπόθεση ότι οι παράγοντες είναι ελεγχόμενοι και μπορούν να λάβουν τη μία ή την άλλη προγραμματισμένη, αναμενόμενη τιμή και άλλες άγνωστες συνθήκες θα παραμείνουν στο μέσο επίπεδο για τον πληθυσμό. Η δυνατότητα ελέγχου των παραγόντων δεν σημαίνει ότι οποιαδήποτε από τις τιμές τους μπορεί να αντικατασταθεί στο μοντέλο κατά την πραγματοποίηση μιας πρόβλεψης. Η εξίσωση παλινδρόμησης αντικατοπτρίζει τις συνθήκες που υπήρχαν στον πληθυσμό από τον οποίο προήλθε η εξίσωση. Εάν οι τιμές των χαρακτηριστικών των παραγόντων ήταν 2-3 φορές υψηλότερες, τότε δεν μπορεί να υποστηριχθεί ότι οι συντελεστές της υπό όρους καθαρής παλινδρόμησης θα παρέμεναν οι ίδιοι.

Επομένως, όταν κάνετε πρόβλεψη χρησιμοποιώντας μια εξίσωση παλινδρόμησης, συνιστάται να μην υπερβείτε τις πραγματικά παρατηρούμενες τιμές των συντελεστών στο σύνολο ή να υπερβείτε αυτά τα όρια κατά όχι περισσότερο από 10-15% των μέσων τιμών. Μια εξίσου σημαντική απαίτηση κατά την πρόβλεψη είναι η απαίτηση συμμόρφωσης με τη συστηματική φύση των προβλεπόμενων τιμών των παραγόντων. Είναι απαραίτητο να ληφθεί υπόψη το πρόσημο και η εγγύτητα της σχέσης μεταξύ των παραγόντων. Για παράδειγμα, εάν προβλέπεται να αυξηθεί το επίπεδο παροχής με ειδικευμένους εργαζομένους, τότε είναι αδύνατο να μείνει αμετάβλητο, πολύ περισσότερο να μειωθεί, η προβλεπόμενη αξία του επιπέδου των μισθών. Όταν σχεδιάζετε να αυξήσετε την παροχή ρεύματος, είναι απαραίτητο να αυξήσετε την παροχή κεφαλαίου περίπου στην ίδια αναλογία.

Με βάση τις τιμές των παραγόντων που αναφέρονται στον Πίνακα 3, υποθέτουμε ότι κατά την πρόβλεψη της απόδοσης, σχεδιάζουμε κόστος ανά εκτάριο ( Χ 3 ) σε επίπεδο 3 χιλιάδων ρούβλια, η παρουσία οδηγών τρακτέρ ανά 100 εκτάρια καλλιεργήσιμης γης είναι 0,8. ωρομίσθιο στο ποσό των 20 ρούβλια. στη μία η ώρα. Αντικαθιστώντας αυτές τις τιμές στο μοντέλο παλινδρόμησης, λαμβάνουμε μια σημειακή πρόβλεψη για την απόδοση των σιτηρών:

Πρόβλεψη σημείου είναι η μαθηματική προσδοκία (μέσος όρος) των πιθανών τιμών του προβλεπόμενου χαρακτηριστικού με διαφορετικές πιθανότητες. Είναι απαραίτητο να συμπληρωθεί η πρόβλεψη σημείων με τον υπολογισμό των ορίων εμπιστοσύνης με αρκετά υψηλή πιθανότητα. Για να το κάνετε αυτό, θα πρέπει να χρησιμοποιήσετε την τιμή του μέσου τετραγωνικού σφάλματος προσέγγισης, η οποία υπολογίζεται από τον τύπο:

(33)

Ο αριθμητής της ριζικής έκφρασης είναι το υπολειπόμενο άθροισμα των τετραγωνικών αποκλίσεων του προκύπτοντος χαρακτηριστικού, που δεν εξηγείται από το μοντέλο, και ο παρονομαστής είναι ο αριθμός των βαθμών ελευθερίας της υπολειπόμενης διακύμανσης. Στο παράδειγμά μας, το υπολειπόμενο άθροισμα των τετραγωνικών αποκλίσεων είναι 814,3. Εχουμε:

Επομένως, με αξιοπιστία 0,95, η προβλεπόμενη απόδοση θα είναι 25,4±4,16·2, ή από 17,8 έως 33,72 c/ha. Όλοι αυτοί οι υπολογισμοί σχετίζονται με προβλέψεις απόδοσης για μεμονωμένες γεωργικές επιχειρήσεις. Αν μιλάμε γιαπερίπου τη μέση απόδοση για συνολικά 51 αγροτικές επιχειρήσεις μέσο σφάλμαο αριθμητικός μέσος όρος είναι ίσος με την τυπική απόκλιση διαιρούμενη με την τετραγωνική ρίζα του μεγέθους του δείγματος n, δηλ. θα είναι:

Η ερμηνεία αυτής της μέσης τιμής σφάλματος πρόβλεψης είναι η εξής: εάν παρέχουμε συντελεστές σε 51 γεωργικές επιχειρήσεις Χ 3 , Χ 5 , Χ 8 στα επίπεδα 3, 20, 0,8 αντίστοιχα, τότε θα ληφθεί η μέση συνολική απόδοση 25,4 ± 0,583 c/ha. Με πιθανότητα 0,95, η μέση συνολική αναμενόμενη απόδοση θα είναι 25,4±0,583·2, ή από 23,7 έως 27,1 c/ha.

Ένα μοντέλο οικονομετρικής συσχέτισης-παλίνδρομης ενός συστήματος αλληλένδετων χαρακτηριστικών του υπό μελέτη πληθυσμού είναι μια εξίσωση παλινδρόμησης που περιλαμβάνει τους κύριους παράγοντες που επηρεάζουν τη διακύμανση του προκύπτοντος χαρακτηριστικού στον πληθυσμό, υψηλή αξίασυντελεστής προσδιορισμού (όχι μικρότερος από 0,5), αξιόπιστος και σωστά ερμηνευμένος σύμφωνα (κατά πρόσημο και τάξη μεγέθους) με τη θεωρία του συστήματος που μελετάται με συντελεστές παλινδρόμησης και λόγω αυτών των ιδιοτήτων είναι κατάλληλος για την αξιολόγηση της δραστηριότητας των πληθυσμιακών μονάδων και για την πρόβλεψη.

Πολλαπλούς οπισθοδρόμηση (2)Περίληψη >> Μάρκετινγκ

Με την εισαγωγή τους στο μοντέλο, δηλ. την κατασκευή της εξίσωσης πολλαπλούς οπισθοδρόμηση. Πληθυντικός οπισθοδρόμησηχρησιμοποιείται ευρέως για την επίλυση προβλημάτων ζήτησης...

Κατά τη διάρκεια των σπουδών τους, οι μαθητές πολύ συχνά συναντούν ποικίλες εξισώσεις. Ένα από αυτά - η εξίσωση παλινδρόμησης - συζητείται σε αυτό το άρθρο. Αυτός ο τύπος εξίσωσης χρησιμοποιείται ειδικά για να περιγράψει τα χαρακτηριστικά της σχέσης μεταξύ μαθηματικές παραμέτρους. Αυτός ο τύπος ισότητας χρησιμοποιείται στη στατιστική και στην οικονομετρία.

Ορισμός παλινδρόμησης

Στα μαθηματικά, παλινδρόμηση σημαίνει μια ορισμένη ποσότητα που περιγράφει την εξάρτηση της μέσης τιμής ενός συνόλου δεδομένων από τις τιμές μιας άλλης ποσότητας. Η εξίσωση παλινδρόμησης δείχνει, σε συνάρτηση με ένα συγκεκριμένο χαρακτηριστικό, τη μέση τιμή ενός άλλου χαρακτηριστικού. Η συνάρτηση παλινδρόμησης έχει τη μορφή απλή εξίσωση y = x, στην οποία το y δρα ως εξαρτημένη μεταβλητή και το x ως ανεξάρτητη μεταβλητή (χαρακτηριστικό-συντελεστής). Στην πραγματικότητα, η παλινδρόμηση εκφράζεται ως y = f (x).

Ποιοι είναι οι τύποι σχέσεων μεταξύ μεταβλητών;

Γενικά, υπάρχουν δύο αντίθετοι τύποι σχέσεων: η συσχέτιση και η παλινδρόμηση.

Η πρώτη χαρακτηρίζεται από την ισότητα των μεταβλητών υπό όρους. Σε αυτή την περίπτωση, δεν είναι γνωστό με βεβαιότητα ποια μεταβλητή εξαρτάται από την άλλη.

Εάν δεν υπάρχει ισότητα μεταξύ των μεταβλητών και οι συνθήκες λένε ποια μεταβλητή είναι επεξηγηματική και ποια εξαρτημένη, τότε μπορούμε να μιλήσουμε για την ύπαρξη μιας σύνδεσης του δεύτερου τύπου. Προκειμένου να κατασκευαστεί η εξίσωση γραμμικής παλινδρόμησης, θα χρειαστεί να μάθετε ποιος τύπος σύνδεσης παρατηρείται.

Τύποι παλινδρόμησης

Σήμερα, υπάρχουν 7 διαφορετικοί τύποι παλινδρόμησης: υπερβολική, γραμμική, πολλαπλή, μη γραμμική, κατά ζεύγη, αντίστροφη, λογαριθμικά γραμμική.

Υπερβολικά, γραμμικά και λογαριθμικά

Η εξίσωση γραμμικής παλινδρόμησης χρησιμοποιείται στη στατιστική για να εξηγήσει με σαφήνεια τις παραμέτρους της εξίσωσης. Μοιάζει με y = c+t*x+E. Η υπερβολική εξίσωση έχει τη μορφή κανονικής υπερβολής y = c + m / x + E. Λογαριθμικά γραμμική εξίσωσηεκφράζει σχέσεις χρησιμοποιώντας λογαριθμική συνάρτηση: Σε y = Σε c + t* Σε x + Σε Ε.

Πολλαπλά και μη γραμμικά

Δύο ακόμα σύνθετους τύπουςΗ παλινδρόμηση είναι πολλαπλή και μη γραμμική. Η εξίσωση πολλαπλής παλινδρόμησης εκφράζεται με τη συνάρτηση y = f(x 1, x 2 ... x c) + E. Σε αυτήν την περίπτωση, η y δρα ως εξαρτημένη μεταβλητή και η x ως επεξηγηματική μεταβλητή. Η μεταβλητή Ε είναι στοχαστική και περιλαμβάνει την επίδραση άλλων παραγόντων στην εξίσωση. Μη γραμμική εξίσωσηΗ παλινδρόμηση είναι λίγο αμφιλεγόμενη. Αφενός, σε σχέση με τους δείκτες που λαμβάνονται υπόψη, δεν είναι γραμμικός, αφετέρου όμως, σε ρόλο αξιολόγησης δεικτών, είναι γραμμικός.

Αντίστροφοι και ζευγαρωμένοι τύποι παλινδρόμησης

Η αντίστροφη είναι ένας τύπος συνάρτησης που πρέπει να μετατραπεί σε γραμμική όψη. Στα πιο παραδοσιακά προγράμματα εφαρμογών, έχει τη μορφή συνάρτησης y = 1/c + m*x+E. Μια εξίσωση παλινδρόμησης κατά ζεύγη δείχνει τη σχέση μεταξύ των δεδομένων ως συνάρτηση του y = f (x) + E. Όπως και σε άλλες εξισώσεις, το y εξαρτάται από το x και το E είναι μια στοχαστική παράμετρος.

Έννοια της συσχέτισης

Αυτός είναι ένας δείκτης που καταδεικνύει την ύπαρξη σχέσης μεταξύ δύο φαινομένων ή διεργασιών. Η ισχύς της σχέσης εκφράζεται ως συντελεστής συσχέτισης. Η τιμή του κυμαίνεται στο διάστημα [-1;+1]. Αρνητικός δείκτηςδηλώνει διαθεσιμότητα ανατροφοδότηση, θετικό - για μια ευθεία γραμμή. Αν ο συντελεστής πάρει μια τιμή ίση με 0, τότε δεν υπάρχει σχέση. Όσο πιο κοντά είναι η τιμή στο 1, τόσο ισχυρότερη σύνδεσημεταξύ των παραμέτρων, όσο πιο κοντά στο 0, τόσο πιο αδύναμο είναι.

Μέθοδοι

Οι παραμετρικές μέθοδοι συσχέτισης μπορούν να αξιολογήσουν την ισχύ της σχέσης. Χρησιμοποιούνται με βάση την εκτίμηση της κατανομής για τη μελέτη παραμέτρων που υπακούουν στο νόμο της κανονικής κατανομής.

Οι παράμετροι της εξίσωσης γραμμικής παλινδρόμησης είναι απαραίτητες για τον προσδιορισμό του τύπου εξάρτησης, τη συνάρτηση της εξίσωσης παλινδρόμησης και την αξιολόγηση των δεικτών του επιλεγμένου τύπου σχέσης. Το πεδίο συσχέτισης χρησιμοποιείται ως μέθοδος αναγνώρισης σύνδεσης. Για να γίνει αυτό, όλα τα υπάρχοντα δεδομένα πρέπει να απεικονίζονται γραφικά. Όλα τα γνωστά δεδομένα πρέπει να απεικονίζονται σε ένα ορθογώνιο δισδιάστατο σύστημα συντεταγμένων. Έτσι σχηματίζεται ένα πεδίο συσχέτισης. Οι τιμές του συντελεστή περιγραφής σημειώνονται κατά μήκος του άξονα της τετμημένης, ενώ οι τιμές του εξαρτημένου παράγοντα σημειώνονται κατά μήκος του άξονα τεταγμένης. Εάν υπάρχει λειτουργική σχέση μεταξύ των παραμέτρων, αυτές παρατάσσονται με τη μορφή γραμμής.

Εάν ο συντελεστής συσχέτισης τέτοιων δεδομένων είναι μικρότερος από 30%, μπορούμε να μιλάμε για σχεδόν πλήρη απουσία σύνδεσης. Εάν είναι μεταξύ 30% και 70%, τότε αυτό υποδηλώνει την παρουσία συνδέσεων μεσαίου-κλειστού. Ένας δείκτης 100% είναι απόδειξη μιας λειτουργικής σύνδεσης.

Μια μη γραμμική εξίσωση παλινδρόμησης, ακριβώς όπως μια γραμμική, πρέπει να συμπληρωθεί με έναν δείκτη συσχέτισης (R).

Συσχέτιση για πολλαπλή παλινδρόμηση

Ο συντελεστής προσδιορισμού είναι ο τετραγωνικός εκθέτης πολλαπλή συσχέτιση. Μιλά για τη στενή σχέση του παρουσιαζόμενου συνόλου δεικτών με το χαρακτηριστικό που μελετάται. Μπορεί επίσης να μιλήσει για τη φύση της επιρροής των παραμέτρων στο αποτέλεσμα. Η εξίσωση πολλαπλής παλινδρόμησης εκτιμάται χρησιμοποιώντας αυτόν τον δείκτη.

Για να υπολογιστεί ο δείκτης πολλαπλής συσχέτισης, είναι απαραίτητο να υπολογιστεί ο δείκτης του.

Μέθοδος ελάχιστου τετραγώνου

Αυτή η μέθοδος είναι ένας τρόπος εκτίμησης των παραγόντων παλινδρόμησης. Η ουσία του είναι να ελαχιστοποιήσει το άθροισμα των τετραγωνικών αποκλίσεων που λαμβάνονται ως αποτέλεσμα της εξάρτησης του παράγοντα από τη συνάρτηση.

Μια κατά ζεύγη γραμμική εξίσωση παλινδρόμησης μπορεί να εκτιμηθεί χρησιμοποιώντας μια τέτοια μέθοδο. Αυτός ο τύπος εξισώσεων χρησιμοποιείται όταν ανιχνεύεται μια ζευγαρωμένη γραμμική σχέση μεταξύ των δεικτών.

Παράμετροι εξίσωσης

Κάθε παράμετρος της συνάρτησης γραμμικής παλινδρόμησης έχει μια συγκεκριμένη σημασία. Η εξίσωση ζευγαρωμένης γραμμικής παλινδρόμησης περιέχει δύο παραμέτρους: c και m Η παράμετρος m δείχνει τη μέση μεταβολή στον τελικό δείκτη της συνάρτησης y, με την προϋπόθεση ότι η μεταβλητή x μειώνεται (αυξάνεται) κατά μία συμβατική μονάδα. Αν η μεταβλητή x είναι μηδέν, τότε η συνάρτηση είναι ίση με την παράμετρο c. Εάν η μεταβλητή x δεν είναι μηδέν, τότε ο παράγοντας c δεν φέρει οικονομική αίσθηση. Η μόνη επιρροή στη συνάρτηση είναι το πρόσημο μπροστά από τον παράγοντα c. Εάν υπάρχει ένα μείον, τότε μπορούμε να πούμε ότι η αλλαγή στο αποτέλεσμα είναι αργή σε σύγκριση με τον παράγοντα. Εάν υπάρχει ένα συν, τότε αυτό δείχνει μια επιταχυνόμενη αλλαγή στο αποτέλεσμα.

Κάθε παράμετρος που αλλάζει την τιμή της εξίσωσης παλινδρόμησης μπορεί να εκφραστεί μέσω μιας εξίσωσης. Για παράδειγμα, ο παράγοντας c έχει τη μορφή c = y - mx.

Ομαδοποιημένα δεδομένα

Υπάρχουν τέτοιες συνθήκες του προβλήματος στις οποίες όλες οι πληροφορίες ομαδοποιούνται σύμφωνα με το χαρακτηριστικό x, αλλά ταυτόχρονα για ορισμένη ομάδαυποδεικνύονται οι αντίστοιχες μέσες τιμές του εξαρτημένου δείκτη. Σε αυτήν την περίπτωση, οι μέσες τιμές χαρακτηρίζουν πώς αλλάζει ο δείκτης ανάλογα με το x. Έτσι, οι ομαδοποιημένες πληροφορίες βοηθούν στην εύρεση της εξίσωσης παλινδρόμησης. Χρησιμοποιείται ως ανάλυση των σχέσεων. Ωστόσο, αυτή η μέθοδος έχει τα μειονεκτήματά της. Δυστυχώς, οι μέσοι δείκτες υπόκεινται συχνά σε εξωτερικές διακυμάνσεις. Αυτές οι διακυμάνσεις δεν αντικατοπτρίζουν το μοτίβο της σχέσης, απλώς συγκαλύπτουν τον «θόρυβο» της. Οι μέσοι όροι δείχνουν μοτίβα σχέσης πολύ χειρότερα από μια εξίσωση γραμμικής παλινδρόμησης. Ωστόσο, μπορούν να χρησιμοποιηθούν ως βάση για την εύρεση μιας εξίσωσης. Πολλαπλασιάζοντας τον αριθμό ενός μεμονωμένου πληθυσμού με τον αντίστοιχο μέσο όρο, μπορεί κανείς να πάρει το άθροισμα y εντός της ομάδας. Στη συνέχεια, πρέπει να αθροίσετε όλα τα ποσά που έχετε λάβει και να βρείτε τον τελικό δείκτη y. Είναι λίγο πιο δύσκολο να κάνουμε υπολογισμούς με τον δείκτη αθροίσματος xy. Εάν τα διαστήματα είναι μικρά, μπορούμε να πάρουμε υπό όρους τον δείκτη x για όλες τις μονάδες (εντός της ομάδας) να είναι ίδιος. Θα πρέπει να το πολλαπλασιάσετε με το άθροισμα του y για να βρείτε το άθροισμα των γινομένων των x και y. Στη συνέχεια, όλα τα ποσά αθροίζονται και προκύπτει συνολικό ποσό hu.

Εξίσωση παλινδρόμησης πολλαπλών ζευγαριών: αξιολόγηση της σημασίας μιας σχέσης

Όπως αναφέρθηκε προηγουμένως, η πολλαπλή παλινδρόμηση έχει μια συνάρτηση της μορφής y = f (x 1,x 2,…,x m)+E. Τις περισσότερες φορές, μια τέτοια εξίσωση χρησιμοποιείται για την επίλυση του προβλήματος της προσφοράς και της ζήτησης για ένα προϊόν, των εσόδων από τόκους από επαναγορασμένες μετοχές και για τη μελέτη των αιτιών και του τύπου της συνάρτησης κόστους παραγωγής. Χρησιμοποιείται επίσης ενεργά σε μια μεγάλη ποικιλία μακροοικονομικών μελετών και υπολογισμών, αλλά σε μικροοικονομικό επίπεδο αυτή η εξίσωση χρησιμοποιείται λίγο λιγότερο συχνά.

Το κύριο καθήκον της πολλαπλής παλινδρόμησης είναι η κατασκευή ενός μοντέλου δεδομένων που περιέχει τεράστιο όγκο πληροφοριών, προκειμένου να προσδιοριστεί περαιτέρω η επίδραση που ασκεί ο καθένας από τους παράγοντες ξεχωριστά και στο σύνολό τους στον δείκτη που πρέπει να μοντελοποιηθεί και στους συντελεστές του. Η εξίσωση παλινδρόμησης μπορεί να λάβει μια μεγάλη ποικιλία τιμών. Σε αυτή την περίπτωση, για την αξιολόγηση της σχέσης, χρησιμοποιούνται συνήθως δύο τύποι συναρτήσεων: γραμμικές και μη γραμμικές.

Η γραμμική συνάρτηση απεικονίζεται με τη μορφή της ακόλουθης σχέσης: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Στην περίπτωση αυτή, τα a2, a m θεωρούνται «καθαροί» συντελεστές παλινδρόμησης. Είναι απαραίτητα για τον χαρακτηρισμό της μέσης μεταβολής της παραμέτρου y με αλλαγή (μείωση ή αύξηση) σε κάθε αντίστοιχη παράμετρο x κατά μία μονάδα, με την προϋπόθεση των σταθερών τιμών άλλων δεικτών.

Οι μη γραμμικές εξισώσεις έχουν, για παράδειγμα, τη μορφή λειτουργία ισχύος y=ax 1 b1 x 2 b2 ...x m bm . Στην περίπτωση αυτή, οι δείκτες b 1, b 2 ..... b m ονομάζονται συντελεστές ελαστικότητας, δείχνουν πώς θα αλλάξει το αποτέλεσμα (κατά πόσο%) με αύξηση (μείωση) στον αντίστοιχο δείκτη x κατά 1% και με σταθερό δείκτη άλλων παραγόντων.

Ποιοι παράγοντες πρέπει να λαμβάνονται υπόψη κατά την κατασκευή πολλαπλής παλινδρόμησης

Προκειμένου να κατασκευαστεί σωστά η πολλαπλή παλινδρόμηση, είναι απαραίτητο να βρούμε σε ποιους παράγοντες πρέπει να δοθεί ιδιαίτερη προσοχή.

Είναι απαραίτητο να έχουμε κάποια κατανόηση της φύσης των σχέσεων μεταξύ οικονομικούς παράγοντεςκαι μοντελοποιούνται. Οι παράγοντες που θα πρέπει να συμπεριληφθούν πρέπει να πληρούν τα ακόλουθα κριτήρια:

  • Πρέπει να υπόκειται σε ποσοτική μέτρηση. Για να χρησιμοποιηθεί ένας παράγοντας που περιγράφει την ποιότητα ενός αντικειμένου, σε κάθε περίπτωση θα πρέπει να του δοθεί μια ποσοτική μορφή.
  • Δεν πρέπει να υπάρχει αλληλοσυσχέτιση παραγόντων ή λειτουργική σχέση. Τέτοιες ενέργειες οδηγούν τις περισσότερες φορές σε μη αναστρέψιμες συνέπειες - το σύστημα συνηθισμένες εξισώσειςκαθίσταται άνευ όρων, και αυτό συνεπάγεται την αναξιοπιστία και τις ασαφείς εκτιμήσεις του.
  • Στην περίπτωση ύπαρξης ενός τεράστιου δείκτη συσχέτισης, δεν υπάρχει τρόπος να προσδιοριστεί η μεμονωμένη επίδραση παραγόντων σε τελικό αποτέλεσμαδείκτης, επομένως, οι συντελεστές γίνονται ανερμήνευτοι.

Μέθοδοι κατασκευής

Υπάρχει μεγάλο ποσόμεθόδους και τεχνικές που εξηγούν πώς μπορούν να επιλεγούν παράγοντες για μια εξίσωση. Ωστόσο, όλες αυτές οι μέθοδοι βασίζονται στην επιλογή των συντελεστών χρησιμοποιώντας έναν δείκτη συσχέτισης. Μεταξύ αυτών είναι:

  • Μέθοδος εξάλειψης.
  • Μέθοδος εναλλαγής.
  • Ανάλυση παλινδρόμησης σταδιακά.

Η πρώτη μέθοδος περιλαμβάνει το φιλτράρισμα όλων των συντελεστών από το συνολικό σύνολο. Η δεύτερη μέθοδος περιλαμβάνει την εισαγωγή ενός συνόλου πρόσθετους παράγοντες. Λοιπόν, το τρίτο είναι η εξάλειψη των παραγόντων που χρησιμοποιήθηκαν προηγουμένως για την εξίσωση. Κάθε μία από αυτές τις μεθόδους έχει το δικαίωμα ύπαρξης. Έχουν τα πλεονεκτήματα και τα μειονεκτήματά τους, αλλά μπορούν όλοι να λύσουν το ζήτημα της εξάλειψης περιττών δεικτών με τον δικό τους τρόπο. Συνήθως, τα αποτελέσματα που προκύπτουν από το καθένα ξεχωριστή μέθοδος, είναι αρκετά κοντά.

Μέθοδοι πολυμεταβλητής ανάλυσης

Τέτοιες μέθοδοι για τον προσδιορισμό των παραγόντων βασίζονται στην εξέταση μεμονωμένων συνδυασμών αλληλένδετων χαρακτηριστικών. Αυτές περιλαμβάνουν ανάλυση διάκρισης, αναγνώριση σχήματος, ανάλυση κύριου συστατικού και ανάλυση συστάδων. Επιπλέον, υπάρχει και παραγοντική ανάλυση, αλλά εμφανίστηκε λόγω της ανάπτυξης της μεθόδου συστατικών. Όλα αυτά ισχύουν υπό ορισμένες συνθήκες, υπό ορισμένες προϋποθέσεις και παράγοντες.

Στην πραγματικότητα, κάθε φαινόμενο καθορίζεται από τη δράση όχι μιας αιτίας, αλλά πολλών, ακόμη και ενός συνόλου αιτιών. Δικα τους κοινή δράσημπορεί να επηρεάσει την έρευνα με διαφορετικούς τρόπους. «Ένα αποτέλεσμα δημιουργείται από τη συνδυασμένη δράση πολλών αιτιών. Ένας πολύπλοκος συνδυασμός αιτιών οδηγεί σε διαφορετικά αποτελέσματα. Ενεργώντας στην έρευνα προς την ίδια κατεύθυνση, ενισχύουν ο ένας την επιρροή του άλλου. Αν κάποιες από τις αιτίες έχουν αντίθετη κατεύθυνση σε σχέση με το αντικείμενο δράσης, τότε η κοινή τους επίδραση στο αποτέλεσμα εξασθενεί ή και εξαλείφεται. Μπορεί ακόμη και να προκύψει μια κατάσταση όταν μια καλά καθορισμένη, πραγματικά αποτελεσματική αιτία δεν έχει προφανές αποτέλεσμα. Αυτό σημαίνει ότι, μαζί με αυτή την αιτία, λειτουργεί και μια άλλη, απορροφώντας τη δράση της πρώτης». Επομένως, είναι απαραίτητο να μελετήσουμε τον αντίκτυπο ποικίλοι λόγοι, δηλαδή να μελετήσει την εξάρτηση ενός φαινομένου από μια σειρά από άλλα φαινόμενα που προκαλούν το πρώτο.

Είναι προφανές ότι δεν μπορούν να διερευνηθούν όλες οι αιτίες και οι παράγοντες που επηρεάζουν σε κάποιο βαθμό το υπό μελέτη φαινόμενο. Είμαστε αναγκασμένοι να περιοριστούμε μόνο σε σημαντικούς λόγους.

Ένα οικονομικό φαινόμενο καθορίζεται από πολλούς ταυτόχρονα και συλλογικά ενεργά αίτια. Επομένως, βρισκόμαστε αντιμέτωποι με το καθήκον να μελετήσουμε την εξάρτηση μιας εξαρτημένης μεταβλητής από πολλές επεξηγηματικές μεταβλητές υπό τις συνθήκες ενός συγκεκριμένου τόπου και συγκεκριμένου χρόνου. Αυτό το πρόβλημα μπορεί να λυθεί χρησιμοποιώντας πολλαπλή ή πολυμεταβλητή ανάλυση παλινδρόμησης. Σε αυτήν την περίπτωση, περιοριζόμαστε και πάλι στην εξέταση της γραμμικής σχέσης μεταξύ της εξαρτημένης μεταβλητής y και των επεξηγηματικών μεταβλητών xm. Θα συζητήσουμε επίσης τη χρήση της ανάλυσης παλινδρόμησης όταν υπάρχει μια μη γραμμική σχέση μεταξύ των μεταβλητών, αλλά μόνο για την περίπτωση όπου είναι δυνατή μια γραμμική προσέγγιση.

Έτσι, εάν υπάρχει γραμμική σχέση μεταξύ των μεταβλητών, η γενική έκφραση της εξίσωσης πολλαπλής παλινδρόμησης (2.1) γράφεται ως

Οι επεξηγηματικές μεταβλητές έχουν κοινή ταυτόχρονη επίδραση στην εξαρτημένη μεταβλητή y.

Όπως ειπώθηκε, δεν μπορούμε να καλύψουμε ολόκληρο το σύμπλεγμα των αιτιών και να λάβουμε υπόψη την τυχαιότητα που ενυπάρχει στον ένα ή τον άλλο βαθμό στην αιτιακή δράση και το αποτέλεσμα που καθορίζεται από αυτήν. Επομένως, περιοριζόμενοι στις πιο σημαντικές επεξηγηματικές μεταβλητές, εισάγουμε στην έκφραση της συνάρτησης παλινδρόμησης το αθροιστικό στοιχείο της ενοχλητικής μεταβλητής και, το οποίο δίνει τη συνολική επίδραση της επιρροής όλων των μη καταγεγραμμένων παραγόντων και ατυχημάτων. Οι εμπειρικές τιμές του y μπορούν επομένως να αναπαρασταθούν ως εξής:

Έτσι, η ενοχλητική μεταβλητή ερμηνεύεται με τον ίδιο τρόπο όπως στην απλή γραμμική παλινδρόμηση.

Στην έκφραση συνάρτησης, οι εκτιμώμενες τιμές παλινδρόμησης. Δείχνουν τις μέσες τιμές της μεταβλητής y σε ένα σημείο με σταθερές τιμές των επεξηγηματικών μεταβλητών, με την υπόθεση ότι μόνο αυτές οι μεταβλητές είναι η αιτία της αλλαγής της μεταβλητής y. Οι τιμές y είναι εκτιμήσεις των μέσων τιμών y για σταθερές τιμές των μεταβλητών σε ένα σημείο

Οι συντελεστές είναι παράμετροι παλινδρόμησης (2.42). Η σταθερή παλινδρόμηση εκτελεί πάλι μια συνάρτηση ισοπέδωσης στην εξίσωση παλινδρόμησης. Καθορίζει το σημείο τομής της υπερεπιφάνειας παλινδρόμησης με τον άξονα y.

Οι τιμές αντιπροσωπεύουν εκτιμήσεις των συντελεστών παλινδρόμησης. Ο δείκτης του συντελεστή αντιστοιχεί στον δείκτη της επεξηγηματικής μεταβλητής. Έτσι, δείχνει τη μέση μεταβολή στο y όταν αλλάζει κατά μία μονάδα, υπό την προϋπόθεση ότι οι άλλες μεταβλητές παραμένουν αμετάβλητες. δείχνει πόσες μονάδες, κατά μέσο όρο, θα άλλαζε το y εάν ​​η μεταβλητή άλλαζε κατά μία εάν οι μεταβλητές παρέμεναν αμετάβλητες, κ.λπ. Ενώ η παλινδρόμηση (2,42) καταγράφει τις σωρευτικές ταυτόχρονες επιδράσεις των επεξηγηματικών μεταβλητών, οι συντελεστές παλινδρόμησης υποδεικνύουν τον αντίστοιχο μέσο όρο μερικής επιρροές μεταβλητών με την υπόθεση ότι οι υπόλοιπες επεξηγηματικές μεταβλητές διατηρούνται σταθερές. Από άποψη στατιστική μεθοδολογία, επομένως, δεν υπάρχει διαφορά μεταξύ πολλαπλής και μερικής παλινδρόμησης. (Θα το συζητήσουμε λεπτομερέστερα στο επόμενη ενότητα.) Για το λόγο αυτό, στη βιβλιογραφία οι παράμετροι ονομάζονται και πολλαπλοί και μερικοί συντελεστές παλινδρόμησης.

Μια τέτοια ουσιαστική ερμηνεία των συντελεστών παλινδρόμησης θα μπορούσε να οδηγήσει στο λανθασμένο συμπέρασμα ότι αρκεί να προσδιορίσουμε αρκετές απλές γραμμικές παλινδρομήσεις της μεταβλητής y σε μεμονωμένες μεταβλητές. αν και καλύπτει την ταυτόχρονη δράση επεξηγηματικών μεταβλητών, ο συντελεστής παλινδρόμησης αποκλείει την επιρροή άλλων επεξηγηματικών μεταβλητών,

Αυτό δεν συμβαίνει με την απλή γραμμική παλινδρόμηση. Στην απλή γραμμική παλινδρόμηση, η επίδραση άλλων επεξηγηματικών μεταβλητών αντανακλάται εν μέρει στον συντελεστή παλινδρόμησης, ο οποίος μπορεί να εξηγηθεί από τη συχνά αμφίδρομη εξάρτηση των επεξηγηματικών μεταβλητών. Έτσι, εάν έχετε επαρκείς πληροφορίες και εμπειρικό αριθμητικό υλικό για διάφορους λόγους-παράγοντες για τη μεταβλητή y, τότε είναι πιο κατάλληλο και θεωρητικά σωστό να δημιουργήσετε πολλαπλή παλινδρόμηση. Στην Ενότητα 2.5, έχουμε ήδη επισημάνει ότι λόγω της διασποράς των τιμών των μεμονωμένων μεταβλητών, η συνάρτηση παλινδρόμησης είναι μη αναστρέψιμη ακόμη και όταν δικαιολογείται λογικά και δικαιολογείται από επαγγελματικούς λόγους. Η μη αναστρεψιμότητα είναι επίσης χαρακτηριστικό της πολλαπλής παλινδρόμησης. Εάν ενδιαφέρεστε όχι μόνο για την εξάρτηση της μεταβλητής y από το y αλλά και για την εξάρτηση της μεταβλητής από το y, τότε θα πρέπει να ορίσετε μια άλλη συνάρτηση (παλινδρόμηση του x στο y και Θεωρητικά, υπάρχουν συζυγείς ή εναλλακτικές παλινδρομήσεις. Ήδη εδώ εφιστούμε την προσοχή στο γεγονός ότι η πολυμερής εξάρτηση μεταξύ των μεταβλητών y και παραβιάζει τις βασικές προϋποθέσεις για την εφαρμογή της μεθόδου ελάχιστα τετράγωνα. Θα το συζητήσουμε λεπτομερώς στο Κεφάλαιο 12.

Ας εξετάσουμε τη διαδικασία για την κατασκευή πολλαπλής παλινδρόμησης χρησιμοποιώντας το παράδειγμα της παλινδρόμησης με δύο επεξηγηματικές μεταβλητές. Η συνάρτηση γραμμικής πολλαπλής παλινδρόμησης σε αυτή την περίπτωση γράφεται ως

Το καθήκον είναι η εκτίμηση των παραμέτρων παλινδρόμησης με βάση τα αποτελέσματα των δειγματοληπτικών παρατηρήσεων στις μεταβλητές που περιλαμβάνονται στην ανάλυση. Για το σκοπό αυτό, χρησιμοποιούμε και πάλι τη μέθοδο των ελαχίστων τετραγώνων. Ας θέσουμε την προϋπόθεση ότι η παλινδρόμηση θα πρέπει να συμφωνεί όσο το δυνατόν καλύτερα με τα Εμπειρικά δεδομένα. Επομένως, για τους ίδιους λόγους όπως στην ενότητα 2.4, θα υποβάλουμε την απαίτηση ότι το άθροισμα των τετραγωνικών αποκλίσεων όλων των παρατηρούμενων τιμών της εξαρτημένης μεταβλητής από τις τιμές που υπολογίζονται από την εξίσωση παλινδρόμησης (δηλ. το άθροισμα του τετραγώνου υπολείμματα) πρέπει να είναι ελάχιστα. Άρα, η απαίτηση πρέπει να εκπληρωθεί

Αντικαθιστώντας την έκφραση (2.43) παίρνουμε

Όπως και στην ενότητα 2.4, το 5 είναι συνάρτηση των άγνωστων παραμέτρων παλινδρόμησης. Απαραίτητη προϋπόθεσηεκπλήρωση της (2.45) είναι η μετατροπή σε μηδενικές μερικές παραγώγους της συνάρτησης ως προς κάθε μία από τις παραμέτρους Μετά την αντίστοιχη αλγεβρική

παίρνουμε υπολογισμούς το παρακάτω σύστημακανονικές εξισώσεις:

Εάν συγκρίνουμε αυτές τις εξισώσεις με κανονικές απλές εξισώσεις γραμμικής παλινδρόμησης, βλέπουμε μεγάλες ομοιότητες. Διαφέρουν μόνο ως προς τον όρο που λαμβάνει υπόψη τη νέα μεταβλητή, επομένως, η συμπερίληψη νέων μεταβλητών στην ανάλυση δεν παρουσιάζει μεγάλες δυσκολίες.

Διαιρώντας και τις δύο πλευρές της εξίσωσης (2.46) με την ακόλουθη παράσταση για τη σταθερά παλινδρόμησης

Αντικαθιστώντας το (2.49) στο (2.43), μετά από μερικούς απλούς μετασχηματισμούς λαμβάνουμε μια έκφραση παρόμοια με την (2.25):

Λύνοντας το σύστημα κανονικών εξισώσεων για άγνωστες παραμέτρους, παίρνουμε

Κατ' αναλογία με τον τύπο (2.27), για την απλή παλινδρόμηση, πολλαπλοί ή μερικοί συντελεστές παλινδρόμησης μπορούν να αναπαρασταθούν μέσω διακυμάνσεων και συνδιακυμάνσεων.

Αρχικά διαιρώντας και τις δύο πλευρές της κανονικής εξίσωσης (2.46) και πολλαπλασιάζοντάς τες με, τις αφαιρούμε αντίστοιχα από τα αριστερά και σωστά μέρηεξίσωση (2.47). Ως αποτέλεσμα παίρνουμε

Στη συνέχεια πολλαπλασιάζουμε και τις δύο πλευρές της κανονικής εξίσωσης (2.46) με αυτές που διαιρούνται προηγουμένως με και τις αφαιρούμε, αντίστοιχα, από την αριστερή και τη δεξιά πλευρά της εξίσωσης (2.48). Ως αποτέλεσμα παίρνουμε

Μπορούμε να αναπαραστήσουμε και τις δύο ισότητες ως εξής:

Διαιρώντας και τις δύο πλευρές των ισοτήτων (2.53) και (2.54) με, βρίσκουμε, λαμβάνοντας υπόψη τους ορισμούς της διασποράς και της συνδιακύμανσης, εκφράσεις για τους συντελεστές παλινδρόμησης:

Χρησιμοποιώντας τα παραδείγματα δεδομένων από την ενότητα 2.4, θα τα συμπληρώσουμε με τα αποτελέσματα των παρατηρήσεων για τη δεύτερη επεξηγηματική μεταβλητή - τη μέση ηλικία των εργαζομένων. Η μεταβλητή x που χρησιμοποιείται στο παράδειγμα της Ενότητας 2.4 θα συμβολίζεται τώρα με . Στον πίνακα Το 7 δείχνει τις τιμές που παίρνει η μεταβλητή και ενδιάμεσα αποτελέσματαυπολογισμούς που είναι απαραίτητοι για την εύρεση εκτιμήσεων των συντελεστών παλινδρόμησης.

Πίνακας 7. Μέση ηλικία εργαζομένων, μέσο ποσοστό εκπλήρωσης προτύπων σε 14 επιχειρήσεις και ενδιάμεσα αποτελέσματα που είναι απαραίτητα για την εύρεση εκτιμήσεων των παραμέτρων παλινδρόμησης (βλ. σάρωση)

Μεταβλητός μέσος όρος

Χρήση ενδιάμεσων αποτελεσμάτων από τον πίνακα. 3 και 7, χρησιμοποιώντας τους τύπους (2.51) και (2.52) υπολογίζουμε τους συντελεστές παλινδρόμησης:

Λαμβάνουμε τη σταθερά παλινδρόμησης χρησιμοποιώντας τον τύπο (2.49):

Έτσι, σύμφωνα με τον τύπο της συνάρτησης παλινδρόμησης (2.43), η εξίσωση παλινδρόμησης μπορεί να γραφτεί ως

Εάν λάβουμε υπόψη την εξάρτηση της παραγωγικότητας ταυτόχρονα από το επίπεδο μηχανοποίησης της εργασίας και από τη μέση ηλικία των εργαζομένων, τότε η παραγωγικότητα της εργασίας κατά μέσο όρο θα αλλάξει υπό την προϋπόθεση ότι το επίπεδο μηχανοποίησης της εργασίας μεταβάλλεται κατά ένα τοις εκατό, εξαιρουμένης της επίδρασης του μέσου όρου ηλικία των εργαζομένων. Εάν εξαιρέσουμε την επιρροή του επιπέδου μηχανοποίησης της εργασίας, τότε η παραγωγικότητα της εργασίας κατά μέσο όρο θα αλλάξει κατά ένα χρόνο εάν η μέση ηλικία των εργαζομένων αλλάξει κατά ένα έτος.

Σε σύγκριση με τον συντελεστή παλινδρόμησης σε μια εξίσωση με μία επεξηγηματική μεταβλητή, ο συντελεστής μερικής παλινδρόμησης μειώθηκε ελαφρά. Αυτό εξηγείται από το γεγονός ότι η μεταβλητή συσχετίζεται με την οποία θα επαληθεύσουμε αργότερα χρησιμοποιώντας έναν ποσοτικό δείκτη. Για το λόγο αυτό, η μεταβλητή επηρεάζει τη μεταβλητή y μέσω της οποίας εξασθενεί η ισχύς της εξάρτησης y από τις επεξηγηματικές μεταβλητές παραβιάζει μία από τις βασικές παραδοχές του γραμμικού μοντέλου ανάλυσης παλινδρόμησης. ειδικά προβλήματα. Θα συζητήσουμε αυτά τα θέματα με περισσότερες λεπτομέρειες στο Κεφάλαιο 9.

Αντικαθιστώντας διαδοχικά τις τιμές των μεταβλητών στην εξίσωση που προκύπτει, βρίσκουμε τις υπολογιζόμενες τιμές παλινδρόμησης. Αφαιρώντας τις από τις παρατηρούμενες τιμές της μεταβλητής y, λαμβάνουμε τα υπόλοιπα:

Από το μέγεθος αυτών των υπολειμμάτων, μπορεί να εξαχθεί ένα συμπέρασμα παρόμοιο με αυτό που συνάγεται στην Ενότητα 2.4 για την απλή γραμμική παλινδρόμηση.

Συγκρίνοντας τους τύπους (2.51) και (2.52) με τους (2.22) και (2.23), καθώς και τις διαδικασίες υπολογισμού, είμαστε πεπεισμένοι ότι η συμπερίληψη νέων επεξηγηματικών μεταβλητών στην παλινδρόμηση περιπλέκει τις αναλυτικές εκφράσεις των τύπων, και ταυτόχρονα τους υπολογισμούς. Η γενίκευση ενός μοντέλου πολλαπλής παλινδρόμησης σε επεξηγηματικές μεταβλητές απαιτεί τη χρήση σημειογραφίας πινάκων και γνώση των τεχνικών άλγεβρας πινάκων. Επιπλέον, αυτό είναι απαραίτητο για τη συμπαγή παρουσίαση και την εφαρμογή ορισμένων τυπικών υπολογιστικών διαδικασιών, οι οποίες διευκολύνουν και επιταχύνουν σημαντικά την ανάλυση των παρατηρούμενων τιμών των ορισμάτων.
σι- διάνυσμα - διάσταση στήλης [ (k+1) x 1] άγνωστες παράμετροι (συντελεστές παλινδρόμησης) του προς εκτίμηση μοντέλου.
μι- τυχαίο διάνυσμα - στήλη διάστασης (n x 1)λάθη παρατήρησης (υπολείμματα).

Προβλήματα Ανάλυσης Παλινδρόμησης
Το κύριο καθήκον της ανάλυσης παλινδρόμησης είναι η εύρεση από έναν όγκο δείγματος nεκτιμήσεις άγνωστων συντελεστών παλινδρόμησης b 0 , b 1 ,..., b k. Οι στόχοι της ανάλυσης παλινδρόμησης είναι η χρήση των διαθέσιμων στατιστικών δεδομένων για τις μεταβλητές X iΚαι Υ:

  • λάβετε τις καλύτερες εκτιμήσεις άγνωστων παραμέτρων b 0 , b 1 ,..., b k;
  • έλεγχος στατιστικές υποθέσειςσχετικά με τις παραμέτρους του μοντέλου.
  • ελέγξτε εάν το μοντέλο συμφωνεί αρκετά καλά με στατιστικά δεδομένα (καταλληλότητα του μοντέλου σε δεδομένα παρατήρησης).

Η κατασκευή μοντέλων πολλαπλής παλινδρόμησης αποτελείται από τα ακόλουθα βήματα:

  1. επιλογή της μορφής σύνδεσης (εξισώσεις παλινδρόμησης).
  2. τον προσδιορισμό των παραμέτρων της επιλεγμένης εξίσωσης.
  3. ανάλυση της ποιότητας της εξίσωσης και επαλήθευση της καταλληλότητας της εξίσωσης σε εμπειρικά δεδομένα, βελτίωση της εξίσωσης.
  • Πολλαπλή παλινδρόμηση με μία μεταβλητή
  • Πολλαπλή παλινδρόμηση με τρεις μεταβλητές

Οδηγίες. Καθορίστε τον όγκο των δεδομένων (αριθμός σειρών), τον αριθμό των μεταβλητών x κάντε κλικ στο Επόμενο.

Αριθμός παραγόντων (x) 1 2 3 4 5 6 7 8 9 10 Αριθμός γραμμών
.");">

Ένα παράδειγμα εύρεσης ενός μοντέλου πολλαπλής παλινδρόμησης

Πολλαπλή παλινδρόμηση με δύο μεταβλητές

Μοντέλο πολλαπλής παλινδρόμησηςτης μορφής Y = b 0 + b 1 X 1 + b 2 X 2 ;
1) Μπορούμε να βρούμε τους αγνώστους b 0 , b 1 , b 2 , ας λύσουμε ένα σύστημα τριών γραμμικών εξισώσεων με τρεις αγνώστους b 0 , b 1 , b 2:

Για να λύσετε το σύστημα μπορείτε να χρησιμοποιήσετε
2) Ή χρησιμοποιώντας τύπους


Για να γίνει αυτό, φτιάχνουμε έναν πίνακα όπως:

Υ x 1 x 2 (y-y μέσος όρος) 2 (x 1 -x 1sr) 2 (x 2 -x 2sr) 2 (y-y μέσος όρος)(x 1 -x 1 mg) (μέσος όρος y-y) (x 2 -x 2 μέσος όρος) (x 1 -x 1sr)(x 2 -x 2sr)

Οι δειγματοληπτικές διακυμάνσεις των εμπειρικών συντελεστών πολλαπλής παλινδρόμησης μπορούν να προσδιοριστούν ως εξής:

Εδώ z" jj είναι το j-ο διαγώνιο στοιχείο του πίνακα Z -1 =(X T X) -1.

Εν:

όπου m είναι ο αριθμός των επεξηγηματικών μεταβλητών του μοντέλου.
Ειδικότερα, για την εξίσωση πολλαπλής παλινδρόμησης Y = b 0 + b 1 X 1 + b 2 X 2 με δύο επεξηγηματικές μεταβλητές, χρησιμοποιούνται οι ακόλουθοι τύποι:


Ή

ή
,,.
Εδώ το r 12 είναι ο συντελεστής συσχέτισης του δείγματος μεταξύ των επεξηγηματικών μεταβλητών X 1 και X 2 . Sb j- τυπικό σφάλμασυντελεστής παλινδρόμησης; S - τυπικό σφάλμα πολλαπλής παλινδρόμησης (αμερόληπτη εκτίμηση).
Κατ' αναλογία με παλινδρόμηση κατά ζεύγη, μετά τον προσδιορισμό των σημειακών εκτιμήσεωνb j των συντελεστών β j (j=1,2,…,m) θεωρητική εξίσωσημπορεί να υπολογιστεί πολλαπλή παλινδρόμηση εκτιμήσεις διαστήματοςτους καθορισμένους συντελεστές.

Κάλυψη διαστήματος εμπιστοσύνης με αξιοπιστία (1-α) άγνωστη τιμήη παράμετρος β j ορίζεται ως

Πολλαπλή παλινδρόμηση στο Excel

Για να βρείτε πολλαπλές παραμέτρους παλινδρόμησης χρησιμοποιώντας το Excel, χρησιμοποιείται η συνάρτηση LINEST(Y;X;0;1),
όπου το Y είναι ένας πίνακας για τις τιμές Y
όπου το X είναι ένας πίνακας για τις τιμές X (υποδεικνύεται ως ενιαίος πίνακας για όλες τις τιμές X i)

Έλεγχος της στατιστικής σημασίας συντελεστών εξίσωσης πολλαπλής παλινδρόμησης

Όπως και με την πολλαπλή παλινδρόμηση, η στατιστική σημασία των πολλαπλών συντελεστών παλινδρόμησης με m επεξηγηματικές μεταβλητές ελέγχεται χρησιμοποιώντας τη στατιστική t:

που στην περίπτωση αυτή έχει κατανομή Student με τον αριθμό των βαθμών ελευθερίας v = n- m-1. Στο απαιτούμενο επίπεδο σημαντικότητας, η παρατηρούμενη τιμή της στατιστικής t συγκρίνεται με την κρίσιμη ακριβή τιμή της κατανομής t του Student.
Εάν , τότε επιβεβαιώνεται η στατιστική σημασία του αντίστοιχου συντελεστή πολλαπλής παλινδρόμησης. Αυτό σημαίνει ότι ο παράγοντας Xj σχετίζεται γραμμικά με την εξαρτημένη μεταβλητή Y. Εάν διαπιστωθεί το γεγονός ότι ο συντελεστής b j είναι ασήμαντος, τότε συνιστάται η εξαίρεση της μεταβλητής Xj από την εξίσωση. Αυτό δεν θα οδηγήσει σε σημαντική απώλεια της ποιότητας του μοντέλου, αλλά θα το κάνει πιο συγκεκριμένο.

Για το σκοπό αυτό, όπως και στην περίπτωση της πολλαπλής παλινδρόμησης, χρησιμοποιείται ο συντελεστής προσδιορισμού R2:

Δίκαιη αναλογία 0<=R2<=1. Чем ближе этот коэффициент к единице, тем περισσότερη εξίσωσηΗ πολλαπλή παλινδρόμηση εξηγεί τη συμπεριφορά του Υ.
Για πολλαπλή παλινδρόμησηο συντελεστής προσδιορισμού είναι μια μη φθίνουσα συνάρτηση του αριθμού των επεξηγηματικών μεταβλητών. Η προσθήκη μιας νέας επεξηγηματικής μεταβλητής δεν μειώνει ποτέ την τιμή της R2, καθώς κάθε επόμενη μεταβλητή μπορεί μόνο να προσθέσει, αλλά όχι να μειώσει, τις πληροφορίες που εξηγούν τη συμπεριφορά της εξαρτημένης μεταβλητής.

Η αναλογία μπορεί να αναπαρασταθεί σε την παρακάτω φόρμα:

για m>1. Όσο αυξάνεται η τιμή του m


Οι δείκτες F και R2 είναι ίσοι ή όχι ίσοι με μηδέν ταυτόχρονα. Εάν F=0, τότε R 2 =0, επομένως, η τιμή του Y δεν εξαρτάται γραμμικά από τα X1,X2,…,Xm.. Η υπολογισμένη τιμή του F συγκρίνεται με την κρίσιμη τιμή Fcr. Το Fcr, με βάση το απαιτούμενο επίπεδο σημασίας α και τους αριθμούς βαθμών ελευθερίας v1 = m και v2 = n - m - 1, προσδιορίζεται με βάση την κατανομή Fisher. Εάν F>Fcr, τότε το R2 είναι στατιστικά σημαντικό.

Έλεγχος της σκοπιμότητας των παραδοχών της πολλαπλής παλινδρόμησης OLS. Στατιστική Durbin-Watson για πολλαπλή παλινδρόμηση

Η στατιστική σημασία των πολλαπλών συντελεστών παλινδρόμησης και η τιμή του συντελεστή προσδιορισμού R2 κοντά στη μονάδα δεν εγγυώνται την υψηλή ποιότητα της εξίσωσης πολλαπλής παλινδρόμησης. Επομένως, το επόμενο βήμα στον έλεγχο της ποιότητας της εξίσωσης πολλαπλής παλινδρόμησης είναι ο έλεγχος της σκοπιμότητας των υποθέσεων OLS. Οι λόγοι και οι συνέπειες της αδυναμίας αυτών των υποθέσεων, οι μέθοδοι προσαρμογής των μοντέλων παλινδρόμησης θα συζητηθούν σε επόμενα κεφάλαια. Σε αυτή την παράγραφο θα εξετάσουμε το δημοφιλές ανάλυση παλινδρόμησηςΣτατιστικά στοιχεία Durbin-Watson.
Στο Στατιστική ανάλυσηεξισώσεις παλινδρόμησης στις αρχικό στάδιοσυχνά ελέγχουν τη σκοπιμότητα ενός προαπαιτούμενου: τις προϋποθέσεις για στατιστική ανεξαρτησία των αποκλίσεων μεταξύ τους.

Σε αυτή την περίπτωση ελέγχεται η μη συσχέτιση γειτονικών ποσοτήτων e i,i=1,2,…n..
Για την ανάλυση της συσχέτισης των αποκλίσεων, χρησιμοποιούνται στατιστικές Durbin-Watson:

Κρίσιμες αξίες δ 1Και δ 2καθορίζονται βάσει ειδικών πινάκων για το απαιτούμενο επίπεδο σημαντικότητας α , αριθμός παρατηρήσεων nκαι τον αριθμό των επεξηγηματικών μεταβλητών Μ.

Συντελεστές μερικής συσχέτισης για πολλαπλή παλινδρόμηση

Οι συντελεστές μερικής συσχέτισης (ή δείκτες) που μετρούν την επίδραση στο y του παράγοντα x i σε σταθερό επίπεδο άλλων παραγόντων καθορίζονται από τον τυπικό τύπο γραμμικός συντελεστήςσυσχετίσεις, δηλ. Τα ζεύγη yx 1 , yx 2 ,... , x 1 x 2 , x 1 x 3 και ούτω καθεξής λαμβάνονται διαδοχικά και ο συντελεστής συσχέτισης βρίσκεται για κάθε ζεύγος
Υπολογισμοί στο MS Excel. Ο πίνακας των ζευγών συντελεστών συσχέτισης των μεταβλητών μπορεί να υπολογιστεί χρησιμοποιώντας το εργαλείο ανάλυσης δεδομένων συσχέτισης. Για αυτό:
1) Εκτελέστε την εντολή Υπηρεσία / Ανάλυση Δεδομένων / Συσχέτιση.
2) Καθορίστε το εύρος δεδομένων.

Έλεγχος της συνολικής ποιότητας μιας εξίσωσης πολλαπλής παλινδρόμησης

Για το σκοπό αυτό, όπως και στην περίπτωση της πολλαπλής παλινδρόμησης, χρησιμοποιείται ο συντελεστής προσδιορισμού R 2:

Δίκαιη αναλογία 0 < =R 2 < = 1 . Όσο πιο κοντά είναι αυτός ο συντελεστής στο ένα, τόσο περισσότερο η εξίσωση πολλαπλής παλινδρόμησης εξηγεί τη συμπεριφορά Υ.
Για πολλαπλή παλινδρόμησηο συντελεστής προσδιορισμού είναι μια μη φθίνουσα συνάρτηση του αριθμού των επεξηγηματικών μεταβλητών. Η προσθήκη μιας νέας επεξηγηματικής μεταβλητής δεν μειώνει ποτέ την τιμή R 2, αφού κάθε επόμενη μεταβλητή μπορεί μόνο να συμπληρώσει, αλλά όχι να μειώσει, τις πληροφορίες που εξηγούν τη συμπεριφορά της εξαρτημένης μεταβλητής.
Μερικές φορές, κατά τον υπολογισμό του συντελεστή προσδιορισμού, για να ληφθούν αμερόληπτες εκτιμήσεις στον αριθμητή και στον παρονομαστή του κλάσματος που αφαιρείται από τη μονάδα, γίνεται μια προσαρμογή για τον αριθμό των βαθμών ελευθερίας, δηλ. εισάγεται ο λεγόμενος προσαρμοσμένος (διορθωμένος) συντελεστής προσδιορισμού:

Η σχέση μπορεί να αναπαρασταθεί ως εξής:

για m>1. Με αυξανόμενη τιμή m προσαρμοσμένο συντελεστή προσδιορισμούμεγαλώνει πιο αργά από το συνηθισμένο Προφανώς, μόνο όταν R 2 = 1. μπορεί να πάρει αρνητικές τιμές.
Έχει αποδειχθεί ότι αυξάνεται όταν προστίθεται μια νέα επεξηγηματική μεταβλητή εάν και μόνο εάν η στατιστική t για αυτή τη μεταβλητή είναι μεγαλύτερη από μία σε απόλυτη τιμή. Επομένως, νέες επεξηγηματικές μεταβλητές προστίθενται στο μοντέλο εφόσον αυξάνεται ο προσαρμοσμένος συντελεστής προσδιορισμού.
Συνιστάται, αφού ελεγχθεί η συνολική ποιότητα της εξίσωσης παλινδρόμησης, να γίνει ανάλυση της στατιστικής σημασίας της. Η στατιστική F χρησιμοποιείται για αυτό:
δείκτες φάΚαι R 2είναι ίσα ή όχι ίσα με μηδέν ταυτόχρονα. Αν F=0, τότε R 2 =0, επομένως, η τιμή Υδεν εξαρτάται γραμμικά από X 1 , X 2 ,…, X m.Υπολογιζόμενη αξία φάσε σύγκριση με την κριτική Fcr. Fcr, με βάση το απαιτούμενο επίπεδο σημασίας α και αριθμούς βαθμών ελευθερίας v 1 = mΚαι v 2 = n - m - 1, προσδιορίζεται με βάση την κατανομή Fisher. Αν F > Fcr, Οτι R 2στατιστικά σημαντικό.

Στόχος: μάθουν να προσδιορίζουν τις παραμέτρους μιας εξίσωσης πολλαπλής γραμμικής παλινδρόμησης χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων και να αναλύουν την κατασκευασμένη εξίσωση.

Κατευθυντήριες γραμμές

Απολύτως όλα είναι σημαντικά σε αυτό το κεφάλαιο. Πριν μελετήσετε, πρέπει να διαβάσετε το παρακάτω υλικό από ανάλυση μήτρας: πολλαπλασιασμός πίνακα, αντίστροφος πίνακας, επίλυση συστήματος γραμμικών εξισώσεων με τη μέθοδο αντίστροφη μήτρα. Αυτό το κεφάλαιο γενικεύει οτιδήποτε σχετίζεται με τη γραμμική παλινδρόμηση κατά ζεύγη στο πολλαπλό γραμμικό μοντέλο. Το πρώτο κεφάλαιο περιγράφει τις λειτουργίες του προγράμματος το γραφείο της Microsoft Excel, το οποίο σας επιτρέπει να εκτελείτε λειτουργίες με πίνακες. Σημειώστε ότι, σε σύγκριση με το προηγούμενο κεφάλαιο, για τον προσδιορισμό της κοινωνικοοικονομικής σημασίας των συντελεστών στις επεξηγηματικές μεταβλητές, είναι σημαντικό να μην υπάρχει πολυσυγγραμμικότητα (ισχυρή γραμμική σχέση) μεταξύ αυτών των μεταβλητών. Θυμηθείτε ότι ο τύπος για τον υπολογισμό των συντελεστών της εξίσωσης προκύπτει επίσης από την εφαρμογή της μεθόδου των ελαχίστων τετραγώνων. Θα πρέπει να μελετήσετε το παρακάτω παράδειγμα. Σημειώστε τη σχέση μεταξύ του μοντέλου στην αρχική και των τυποποιημένων μεταβλητών.

§ 1. Προσδιορισμός παραμέτρων της εξίσωσης παλινδρόμησης

Για κάθε οικονομικός δείκτηςΤις περισσότερες φορές, όχι ένας, αλλά πολλοί παράγοντες επηρεάζουν. Σε αυτήν την περίπτωση, αντί για ζευγοποιημένο reg-

M(Y x) = f(x) εξετάζεταιπολλαπλή παλινδρόμηση:

x1 ,x2 ,...,xm ) = f(x1 ,x2 ,...,xm ) .

Το πρόβλημα της εκτίμησης των στατιστικών σχέσεων

μεταβλητές

Υ και Χ = (Χ 1, Χ 2, ..., Χ m) διατυπώνεται παρόμοια

περίπτωση ζευγαριών

καμία παλινδρόμηση. Εξίσωση πολλαπλής παλινδρόμησης μπορεί να αναπαρασταθεί ως:

Y = f(β ,X) +ε ,

όπου Y και X = (X 1, X 2, ..., X m) - διάνυσμα ανεξάρτητων (επεξηγηματικών) μεταβλητών β = (β 0, β 1, β 2,..., β m) - διάνυσμα του Παράμετροι

(θα καθοριστεί) ε - τυχαίο σφάλμα(απόκλιση) Υ - εξαρτημένη (εξηγημένη) μεταβλητή. Υποτίθεται ότι για ένα δεδομένο πληθυσμόςείναι η συνάρτηση f που συνδέει τη μεταβλητή υπό μελέτη Υ με το διάνυσμα ανεξάρτητων μεταβλητών

Y και X= (X1, X2, ..., Xm) .

Ας εξετάσουμε το πιο χρησιμοποιούμενο και απλούστερο από τα μοντέλα πολλαπλής παλινδρόμησης - το μοντέλο πολλαπλής γραμμικής παλινδρόμησης.

Η θεωρητική γραμμική εξίσωση παλινδρόμησης είναι:

Εδώ το β = (β 0, β 1, β 2,..., β m) είναι διάνυσμα διάστασης (m +1) άγνωστων παραμέτρων β j, j = (1, 2, ..., m) λέγεται j - m θεωρητικά

Κινεζικός συντελεστής παλινδρόμησης (μερικός συντελεστής παλινδρόμησης). Χαρακτηρίζει την ευαισθησία της τιμής Y στις αλλαγές στο X j. Με άλλα λόγια, αντανακλά την επιρροή στα μαθηματικά υπό όρους

η προσδοκία M (Y x 1 ,x 2 ,...,x m ) της εξαρτημένης μεταβλητής Y εξηγεί

μεταβλητή X j, με την προϋπόθεση ότι όλες οι άλλες επεξηγηματικές μεταβλητές μοντέλουπαραμένει σταθερό, το β 0 είναι ελεύθερος όρος,

προσδιορίζοντας την τιμή του Y στην περίπτωση που όλες οι επεξηγηματικές μεταβλητές X j είναι ίσες με μηδέν.

Μετά την επιλογή γραμμική συνάρτησηΩς μοντέλο εξάρτησης, είναι απαραίτητο να εκτιμηθούν οι παράμετροι παλινδρόμησης.

Έστω ότι υπάρχουν n παρατηρήσεις ενός διανύσματος επεξηγηματικών μεταβλητών X = (X 1, X 2, ..., X m) και μιας εξαρτημένης μεταβλητής Y:

( xi 1 , xi 2 , ..., xim , yi ) , i= 1 ,2 , ..., n.

Για να λυθεί μοναδικά το πρόβλημα εύρεσης των παραμέτρων β 0, β 1, β 2,..., β m, πρέπει να ικανοποιηθεί η ανισότητα

n ≥ m + 1. Αν = m + 1, τότε υπολογίζονται οι συντελεστές του διανύσματος β

υπολογίζονται με μοναδικό τρόπο.

Εάν ο αριθμός των παρατηρήσεων είναι μεγαλύτερος από τον ελάχιστο απαιτούμενο: n > m + 1, τότε υπάρχει ανάγκη για βελτιστοποίηση, αξιολόγηση

οι παράμετροι β 0, β 1, β 2,..., β m, για τις οποίες ο τύπος δίνει το καλύτερο

προσέγγιση για υπάρχουσες παρατηρήσεις.

Στην περίπτωση αυτή καλείται ο αριθμός ν= n − m − 1 αριθμός βαθμών ελευθερίας. Η πιο κοινή μέθοδος για την εκτίμηση των παραμέτρων μιας εξίσωσης πολλαπλής γραμμικής παλινδρόμησης είναι μέθοδος ελάχιστου τετραγώνου(MNC). Ας θυμηθούμε ότι η ουσία του είναι να ελαχιστοποιήσει το άθροισμα των τετραγωνικών αποκλίσεων των παρατηρούμενων τιμών

εξαρτημένη μεταβλητή Y από τις τιμές της Y που λαμβάνονται από την εξίσωση παλινδρόμησης.

Σημειώστε ότι οι προαναφερθείσες προϋποθέσεις του OLS επιτρέπουν τη διεξαγωγή ανάλυσης στο πλαίσιο ενός κλασικού γραμμικού μοντέλου παλινδρόμησης.

Όπως και με την παλινδρόμηση κατά ζεύγη, αληθινές αξίεςΟι παράμετροι β j δεν μπορούν να ληφθούν από το δείγμα. Σε αυτή την περίπτωση, αντί για

η θεωρητική εξίσωση παλινδρόμησης (3.3) εκτιμάται λεγόμενη

Η εμπειρική εξίσωση παλινδρόμησης που αναπτύσσεται είναι:

Y = b0 + b1 X1 + b2 X2 + ...+ bm Xm + e.

b 0 , b 1 , ..., b m - εκτιμήσεις θεωρητικών

αξίες

β 0 ,β 1 , ...,β m

συντελεστές παλινδρόμησης (εμπειρικοί συντελεστές)

εντάσεις παλινδρόμησης, e -εκτίμηση της τυχαίας απόκλισης ε ). Για μεμονωμένες παρατηρήσεις έχουμε:

yi = b0 + b1 xi 1 + b2 xi 2 + ...+ bm xim + ei ,(i= 1 ,2 , ..., n) (3.6)

Η εκτιμώμενη εξίσωση πρέπει πρώτα από όλα να περιγράφει τη γενική τάση (κατεύθυνση) μεταβολής στην εξαρτημένη μεταβλητή Y. Σε αυτή την περίπτωση, είναι απαραίτητο να μπορείτε να υπολογίσετε τις αποκλίσεις από την καθορισμένη τάση.

Με βάση τον όγκο του δείγματος n:(xi 1 , xi 2 , ..., xim , yi ) , i= 1 ,2 , ..., n

απαιτείται η εκτίμηση των τιμών των παραμέτρων β j του διανύσματος β , δηλαδή η παραμετροποίηση του επιλεγμένου μοντέλου (herex ij , j = 1, 2, ..., m

την τιμή της μεταβλητής X j στην i-η παρατήρηση).

Όταν πληρούνται οι παραδοχές OLS σχετικά με τις τυχαίες αποκλίσεις ε i, οι εκτιμήσεις b 0 , b 1 , ..., b m των παραμέτρων β 0 , β 1 , ..., β m πολλαπλασιάζονται

Οι φυσικές γραμμικές παλινδρομήσεις OLS είναι αμερόληπτες, αποτελεσματικές και συνεπείς.

Με βάση την (3.6), η απόκλιση e i της τιμής y i της εξαρτημένης μεταβλητής από την τιμή του μοντέλουˆy i , που αντιστοιχεί στην εξίσωσηπαλινδρόμηση και i-παρατήρηση i = 1, 2, ..., n, υπολογίζεται χρησιμοποιώντας τον τύπο:

ei = yi − ˆyi = yi − b0 − b1 xi 1 − b2 xi 2 − ...− bm xim . (3.7)

§ 2. Υπολογισμός πολλαπλών γραμμικών συντελεστών παλινδρόμησης

Ας παρουσιάσουμε τα δεδομένα παρατήρησης και τους αντίστοιχους συντελεστές σε μορφή πίνακα.

xn 1

xn 2

Χ1μ

Χ2μ

Εδώ το Y είναι ένα n-διάστατο διάνυσμα στήλης παρατηρήσεων της εξαρτημένης μεταβλητής Y X είναι ένας πίνακας διάστασης n × (m + 1) στον οποίο η i-η σειρά i = 1, 2, ..., n αντιπροσωπεύει το i-η παρατήρηση του διανύσματος των τιμών των ανεξάρτητων μεταβλητών X 1 , X 2 , ..., X m , η μονάδα αντιστοιχεί στη μεταβλητή με τον ελεύθερο όρο b 0 ;B είναι μέγεθος διανύσματος στήλης-

αριθμός (m + 1) παραμέτρων της εξίσωσης παλινδρόμησης (3.5) e - διανυσματική στήλη διάστασης n αποκλίσεις των τιμών του δείγματος (πραγματικές) y i της εξαρτημένης μεταβλητής από τις τιμές ˆy i.

εξίσωση παλινδρόμησης:

i= 1

όπου e T = (e 1, e 2, ..., e n), δηλ. ο εκθέτης T σημαίνει μετα-

γυαλισμένη μήτρα.

Μπορεί να φανεί ότι η συνθήκη (3.10) ικανοποιείται εάν η διανυσματική στήλη των συντελεστών Β βρεθεί χρησιμοποιώντας τον τύπο:

B = (XT X) − 1 XT Y.

Εδώ το X T είναι ο πίνακας που μεταφέρεται στον πίνακα X,

(X T X ) − 1 είναι ο αντίστροφος πίνακας του (X T X ) . Σχέση (3.11)

ισχύει για εξισώσεις παλινδρόμησης με αυθαίρετο αριθμό m επεξηγηματικών μεταβλητών.

Παράδειγμα 3.1. Έστω ότι ο όγκος της προσφοράς κάποιου αγαθού Υ της εταιρείας εξαρτάται γραμμικά από την τιμή Χ 1 και τον μισθό Χ 2 των εργαζομένων που παράγουν αυτό το αγαθό (Πίνακας 3.1). Ας προσδιορίσουμε τους συντελεστές της εξίσωσης γραμμικής παλινδρόμησης. (Εδώ υποτίθεται η γνώση της άλγεβρας πινάκων).

Πίνακας 3.1

Δεδομένα πολλαπλής γραμμικής παλινδρόμησης

Οι πίνακες μοιάζουν με:

X T X= 318

7, 310816

− 0, 10049

− 0, 53537

−1

0, 001593

, (XT X)

= − 0, 10049

− 0, 006644,

− 0, 53537

− 0, 006644

0, 043213

X T Y = 23818,