Βιογραφίες Χαρακτηριστικά Ανάλυση

Προσδιορίστε τις παραμέτρους της εξίσωσης γραμμικής παλινδρόμησης κατά ζεύγη. Δείγμα διακύμανσης για

Ζευγαρωμένη Γραμμική Παλινδρόμηση

ΠΡΑΚΤΙΚΗ

Ζευγαρωμένη γραμμική παλινδρόμηση: Εργαστήριο. –

Η μελέτη της οικονομετρίας περιλαμβάνει την απόκτηση εμπειρίας από τους μαθητές στην κατασκευή οικονομετρικών μοντέλων, τη λήψη αποφάσεων σχετικά με την προδιαγραφή και τον προσδιορισμό ενός μοντέλου, την επιλογή μιας μεθόδου για την εκτίμηση των παραμέτρων του μοντέλου, την αξιολόγηση της ποιότητάς του, την ερμηνεία των αποτελεσμάτων, τη λήψη εκτιμήσεων προβλέψεων κ.λπ. Το εργαστήριο θα βοηθήσει τους μαθητές αποκτήσουν πρακτικές δεξιότητες σε αυτά τα θέματα.

Εγκρίθηκε από το συντακτικό και εκδοτικό συμβούλιο

Συντάκτης: M.B. Perova, Διδάκτωρ Οικονομικών Επιστημών, Καθηγήτρια

Γενικές προμήθειες

Η οικονομετρική έρευνα ξεκινά με μια θεωρία που καθιερώνει σχέσεις μεταξύ των φαινομένων. Από ολόκληρο το φάσμα των παραγόντων που επηρεάζουν το αποτελεσματικό χαρακτηριστικό, επισημαίνονται οι πιο σημαντικοί παράγοντες. Αφού εντοπιστεί η ύπαρξη σχέσης μεταξύ των χαρακτηριστικών που μελετήθηκαν, προσδιορίζεται ο ακριβής τύπος αυτής της σχέσης χρησιμοποιώντας ανάλυση παλινδρόμησης.

Ανάλυση παλινδρόμησηςσυνίσταται στον ορισμό μιας αναλυτικής έκφρασης (στον ορισμό μιας συνάρτησης), στην οποία μια αλλαγή σε μια τιμή (χαρακτηριστικό που προκύπτει) οφείλεται στην επιρροή ανεξάρτητη ποσότητα(παραγοντικό πρόσημο). Αυτή η σχέση μπορεί να ποσοτικοποιηθεί με την κατασκευή μιας εξίσωσης παλινδρόμησης ή μιας συνάρτησης παλινδρόμησης.

Το βασικό μοντέλο παλινδρόμησης είναι ένα μοντέλο παλινδρόμησης ζευγαριού (ενός παράγοντα). Ζευγαρωμένη παλινδρόμηση– εξίσωση σύνδεσης δύο μεταβλητών στοΚαι Χ:

Οπου – εξαρτημένη μεταβλητή (αποτελεσματικό χαρακτηριστικό).

– ανεξάρτητη, επεξηγηματική μεταβλητή (παραγοντικό χαρακτηριστικό).

Ανάλογα με τη φύση της αλλαγής στομε αλλαγή Χδιάκριση μεταξύ γραμμικής και μη γραμμικής παλινδρόμησης.

Γραμμικής παλινδρόμησης

Αυτή η συνάρτηση παλινδρόμησης ονομάζεται πολυώνυμο πρώτου βαθμού και χρησιμοποιείται για να περιγράψει διαδικασίες που αναπτύσσονται ομοιόμορφα με την πάροδο του χρόνου.

Έχοντας ένα τυχαίο μέλος (σφάλματα παλινδρόμησης) σχετίζεται με την επίδραση στην εξαρτημένη μεταβλητή άλλων παραγόντων που δεν λαμβάνονται υπόψη στην εξίσωση, με την πιθανή μη γραμμικότητα του μοντέλου, τα σφάλματα μέτρησης και συνεπώς την εμφάνιση εξίσωση τυχαίου λάθουςΗ παλινδρόμηση μπορεί να οφείλεται στον ακόλουθο στόχο αιτιολογικό:

1) μη αντιπροσωπευτικότητα του δείγματος. Το μοντέλο ζευγαρωμένης παλινδρόμησης περιλαμβάνει έναν παράγοντα που δεν μπορεί να εξηγήσει πλήρως τη διακύμανση του χαρακτηριστικού αποτελέσματος, ο οποίος μπορεί να επηρεαστεί από πολλούς άλλους παράγοντες (παραλειπόμενες μεταβλητές) σε πολύ μεγαλύτερο βαθμό. Για παράδειγμα, οι μισθοί μπορεί να εξαρτώνται, εκτός από τα προσόντα, από το επίπεδο εκπαίδευσης, την εργασιακή εμπειρία, το φύλο κ.λπ.

2) υπάρχει πιθανότητα οι μεταβλητές που εμπλέκονται στο μοντέλο να μετρηθούν με λάθος. Για παράδειγμα, τα στοιχεία για τις δαπάνες τροφίμων των νοικοκυριών συγκεντρώνονται από τα αρχεία των συμμετεχόντων στην έρευνα, οι οποίοι υποτίθεται ότι καταγράφουν προσεκτικά τις ημερήσιες δαπάνες τους. Φυσικά, είναι πιθανά λάθη.

Με βάση την παρατήρηση του δείγματος, εκτιμάται η εξίσωση παλινδρόμησης του δείγματος ( γραμμή παλινδρόμησης):

,

Οπου
– εκτιμήσεις των παραμέτρων της εξίσωσης παλινδρόμησης (
).

Αναλυτική μορφή εξάρτησηςμεταξύ του μελετημένου ζεύγους χαρακτηριστικών (συνάρτηση παλινδρόμησης) προσδιορίζεται χρησιμοποιώντας τα ακόλουθα μεθόδους:

    Βασισμένο σε θεωρητική και λογική ανάλυσητη φύση των φαινομένων που μελετώνται, την κοινωνικοοικονομική τους ουσία. Για παράδειγμα, εάν μελετηθεί η σχέση μεταξύ του εισοδήματος των νοικοκυριών και του μεγέθους των καταθέσεων των νοικοκυριών στις τράπεζες, τότε είναι προφανές ότι η σχέση είναι άμεση.

    Γραφική μέθοδος, όταν η φύση της σύνδεσης αξιολογείται οπτικά.

Αυτή η εξάρτηση μπορεί να φανεί ξεκάθαρα αν δημιουργήσετε ένα γράφημα, σχεδιάζοντας τις τιμές του χαρακτηριστικού στον άξονα x Χ, και στην τεταγμένη - οι τιμές του χαρακτηριστικού στο. Σχεδιάζοντας τα σημεία που αντιστοιχούν στις τιμές ΧΚαι στο, παίρνουμε πεδίο συσχέτισης:

α) εάν τα σημεία είναι τυχαία διασκορπισμένα σε όλο το πεδίο, αυτό υποδηλώνει την απουσία εξάρτησης μεταξύ αυτών των χαρακτηριστικών.

β) εάν τα σημεία είναι συγκεντρωμένα γύρω από έναν άξονα που πηγαίνει από την κάτω αριστερή γωνία προς την επάνω δεξιά, τότε υπάρχει άμεση σχέση μεταξύ των χαρακτηριστικών.

γ) εάν τα σημεία είναι συγκεντρωμένα γύρω από έναν άξονα που πηγαίνει από την επάνω αριστερή γωνία προς την κάτω δεξιά – τότε υπάρχει αντίστροφη σχέση μεταξύ των χαρακτηριστικών.

Αν συνδέσουμε τα σημεία στο πεδίο συσχέτισης με ευθύγραμμα τμήματα, παίρνουμε σπασμένη γραμμήμε κάποια ανοδική τάση. Αυτή θα είναι μια εμπειρική γραμμή επικοινωνίας ή εμπειρική γραμμή παλινδρόμησης. Από την εμφάνισή του μπορεί κανείς να κρίνει όχι μόνο την παρουσία, αλλά και τη μορφή εξάρτησης μεταξύ των μελετημένων χαρακτηριστικών.

Κατασκευή εξίσωσης ζευγοποιημένης παλινδρόμησης

Η κατασκευή μιας εξίσωσης παλινδρόμησης καταλήγει στην εκτίμηση των παραμέτρων της. Αυτές οι εκτιμήσεις παραμέτρων μπορούν να βρεθούν με διάφορους τρόπους. Ένα από αυτά είναι η μέθοδος ελάχιστα τετράγωνα(MNC). Η ουσία της μεθόδου είναι η εξής. Κάθε τιμή αντιστοιχεί στην εμπειρική (παρατηρούμενη) τιμή . Κατασκευάζοντας μια εξίσωση παλινδρόμησης, για παράδειγμα μια εξίσωση ευθείας γραμμής, για κάθε τιμή θα αντιστοιχεί στη θεωρητική (υπολογιζόμενη) τιμή . Παρατηρούμενες τιμές μην ξαπλώνετε ακριβώς στη γραμμή παλινδρόμησης, δηλ. δεν ταιριάζουν . Η διαφορά μεταξύ των πραγματικών και των υπολογισμένων τιμών της εξαρτημένης μεταβλητής ονομάζεται το υπόλοιπο:

Η μέθοδος των ελαχίστων τετραγώνων καθιστά δυνατή τη λήψη τέτοιων εκτιμήσεων παραμέτρων στις οποίες το άθροισμα των τετραγωνικών αποκλίσεων των πραγματικών τιμών του προκύπτοντος χαρακτηριστικού στοαπό θεωρητικό , δηλ. το άθροισμα των τετραγώνων των υπολοίπων είναι ελάχιστο:

Για γραμμικές εξισώσεις και μη γραμμικές εξισώσεις που μπορούν να αναχθούν σε γραμμικές, το ακόλουθο σύστημα λύνεται σε σχέση με ΕΝΑΚαι σι:

Οπου n- το μέγεθος του δείγματος.

Έχοντας λύσει το σύστημα των εξισώσεων, παίρνουμε τις τιμές ΕΝΑΚαι σι, που μας επιτρέπει να γράφουμε εξίσωση παλινδρόμησης(εξίσωση παλινδρόμησης):

Οπου – επεξηγηματική (ανεξάρτητη) μεταβλητή.

–εξηγημένη (εξαρτημένη) μεταβλητή.

Η γραμμή παλινδρόμησης διέρχεται από το σημείο ( ,) και ικανοποιούνται οι ισότητες:

Μπορείτε να χρησιμοποιήσετε έτοιμους τύπους που προκύπτουν από αυτό το σύστημα εξισώσεων:

Οπου – μέση τιμή του εξαρτημένου χαρακτηριστικού·

–μέση τιμή του ανεξάρτητου χαρακτηριστικού·

– αριθμητική μέση τιμή του γινομένου εξαρτημένων και ανεξάρτητων χαρακτηριστικών·

– διακύμανση του ανεξάρτητου χαρακτηριστικού·

– συνδιακύμανση μεταξύ εξαρτημένων και ανεξάρτητων χαρακτηριστικών.

Συνδιακύμανση δείγματοςδύο μεταβλητές Χ, στοπου ονομάζεται μέση αξίατο γινόμενο των αποκλίσεων αυτών των μεταβλητών από τους μέσους όρους τους

Παράμετρος σιστο Χέχει μια μεγάλη πρακτική σημασίακαι ονομάζεται συντελεστής παλινδρόμησης. Συντελεστής παλινδρόμησηςδείχνει πόσες μονάδες αλλάζει η τιμή κατά μέσο όρο στο Χανά 1 μονάδα της μέτρησής του.

Σημάδι παραμέτρου σισε μια εξίσωση παλινδρόμησης κατά ζεύγη υποδεικνύει την κατεύθυνση της σχέσης:

Αν
, τότε η σχέση μεταξύ των δεικτών που μελετήθηκαν είναι άμεση, δηλ. με πρόσημο αυξανόμενου παράγοντα Χτο αποτελεσματικό πρόσημο αυξάνεται επίσης στο, και αντίστροφα;

Αν
, τότε η σχέση μεταξύ των δεικτών που μελετήθηκαν είναι αντίστροφη, δηλ. με πρόσημο αυξανόμενου παράγοντα Χπροκύπτον σημάδι στομειώνεται και το αντίστροφο.

Τιμή παραμέτρου ΕΝΑσε μια εξίσωση ζευγαρωμένης παλινδρόμησης σε ορισμένες περιπτώσεις μπορεί να ερμηνευθεί ως η αρχική τιμή του προκύπτοντος χαρακτηριστικού στο. Αυτή η ερμηνεία της παραμέτρου ΕΝΑείναι δυνατή μόνο εάν η τιμή
έχει το νόημα.

Μετά την κατασκευή της εξίσωσης παλινδρόμησης, οι παρατηρούμενες τιμές yμπορεί να αναπαρασταθεί ως:

Αποφάγια , σαν λάθη , είναι τυχαίες μεταβλητές, ωστόσο, σε αντίθεση με τα σφάλματα , παρατηρήσιμο. Το υπόλοιπο είναι εκείνο το μέρος της εξαρτημένης μεταβλητής y, το οποίο δεν μπορεί να εξηγηθεί χρησιμοποιώντας μια εξίσωση παλινδρόμησης.

Με βάση την εξίσωση παλινδρόμησης μπορεί να υπολογιστεί θεωρητικές αξίες Χγια οποιεσδήποτε αξίες Χ.

Στην οικονομική ανάλυση, χρησιμοποιείται συχνά η έννοια της ελαστικότητας μιας συνάρτησης. Λειτουργία ελαστικότητας
υπολογίζεται ως σχετική μεταβολή yσε σχετική αλλαγή Χ. Η ελαστικότητα δείχνει σε ποιο ποσοστό αλλάζει η συνάρτηση
όταν η ανεξάρτητη μεταβλητή μεταβάλλεται κατά 1%.

Από ελαστικότητα γραμμική συνάρτηση
δεν είναι σταθερή τιμή, αλλά εξαρτάται από Χ, τότε ο συντελεστής ελαστικότητας συνήθως υπολογίζεται ως ο μέσος δείκτης ελαστικότητας.

Συντελεστής ελαστικότηταςδείχνει κατά πόσο θα αλλάξει κατά μέσο όρο η τιμή του χαρακτηριστικού που προκύπτει κατά μέσο όρο στοόταν αλλάζει ένα χαρακτηριστικό παράγοντα Χκατά 1% της μέσης τιμής του:

Οπου
– μέσες τιμές μεταβλητών ΧΚαι στοστο δείγμα.

Αξιολόγηση της ποιότητας του κατασκευασμένου μοντέλου παλινδρόμησης

Ποιότητα μοντέλου παλινδρόμησης– καταλληλότητα του κατασκευασμένου μοντέλου στα αρχικά (παρατηρούμενα) δεδομένα.

Για να μετρήσετε τη στεγανότητα της σύνδεσης, π.χ. για να μετρήσετε πόσο κοντά είναι στη λειτουργική, πρέπει να προσδιορίσετε τη διακύμανση, η οποία μετρά τις αποκλίσεις στοαπό στο Χκαι χαρακτηρίζοντας την υπολειπόμενη διακύμανση λόγω άλλων παραγόντων. Αποτελούν τη βάση δεικτών που χαρακτηρίζουν την ποιότητα ενός μοντέλου παλινδρόμησης.

Η ποιότητα της παλινδρόμησης κατά ζεύγη προσδιορίζεται χρησιμοποιώντας συντελεστές που χαρακτηρίζουν

1) εγγύτητα σύνδεσης - δείκτης συσχέτισης, ζευγαρωμένος γραμμικός συντελεστής συσχέτισης.

2) Σφάλμα προσέγγισης.

3) την ποιότητα της εξίσωσης παλινδρόμησης και τις επιμέρους παραμέτρους της - τα μέσα τετραγωνικά σφάλματα της εξίσωσης παλινδρόμησης στο σύνολό της και των επιμέρους παραμέτρων της.

Για εξισώσεις παλινδρόμησης οποιουδήποτε τύπου, προσδιορίζεται δείκτης συσχέτισης, που χαρακτηρίζει μόνο τη στενότητα της εξάρτησης συσχέτισης, δηλ. ο βαθμός προσέγγισής του σε μια λειτουργική σύνδεση:

,

Οπου – παραγοντική (θεωρητική) διασπορά.

– συνολική διακύμανση.

Ο δείκτης συσχέτισης παίρνει τιμές
, όπου,

Αν

Αν
- η σύνδεση μεταξύ των ζωδίων ΧΚαι στοείναι λειτουργικό, όσο πιο κοντά προς 1, τόσο πιο στενή θεωρείται η σχέση μεταξύ των χαρακτηριστικών που μελετήθηκαν. Αν
, τότε η σύνδεση μπορεί να θεωρηθεί στενή

Οι αποκλίσεις που απαιτούνται για τον υπολογισμό των δεικτών στεγανότητας ζεύξης υπολογίζονται:

Συνολική διακύμανση, μέτρηση γενική παραλλαγήλόγω της δράσης όλων των παραγόντων:

Παραγοντική (θεωρητική) διακύμανση,μέτρηση της διακύμανσης του χαρακτηριστικού που προκύπτει στολόγω της δράσης του σημείου του παράγοντα Χ:

Υπολειμματική διακύμανση, που χαρακτηρίζει την παραλλαγή του χαρακτηριστικού στολόγω όλων των παραγόντων εκτός Χ(δηλαδή με εξαιρέσεις Χ):

Στη συνέχεια, σύμφωνα με τον κανόνα της προσθήκης διακυμάνσεων:

Ποιότητα ατμόλουτρου γραμμικόςΗ παλινδρόμηση μπορεί επίσης να οριστεί χρησιμοποιώντας συντελεστής γραμμικής συσχέτισης ζεύγους:

,

Οπου
– συνδιακύμανση μεταβλητών ΧΚαι στο;

– τυπική απόκλιση του ανεξάρτητου χαρακτηριστικού.

– τυπική απόκλιση του εξαρτημένου χαρακτηριστικού.

Ο συντελεστής γραμμικής συσχέτισης χαρακτηρίζει την εγγύτητα και την κατεύθυνση της σχέσης μεταξύ των χαρακτηριστικών που μελετώνται. Μετριέται εντός [-1; +1]:

Αν
– τότε η σύνδεση μεταξύ των χαρακτηριστικών είναι άμεση.

Αν
– τότε η σχέση μεταξύ των ζωδίων είναι αντίστροφη.

Αν
– τότε δεν υπάρχει σύνδεση μεταξύ των χαρακτηριστικών·

Αν
ή
– τότε η σύνδεση μεταξύ των χαρακτηριστικών είναι λειτουργική, δηλ. χαρακτηρίζεται από πλήρη αντιστοιχία μεταξύ ΧΚαι στο. Όσο πιο κοντά προς 1, τόσο πιο στενή θεωρείται η σχέση μεταξύ των χαρακτηριστικών που μελετήθηκαν.

Εάν ο δείκτης συσχέτισης (ζευγοποιημένος γραμμικός συντελεστήςσυσχετίσεις) στο τετράγωνο, παίρνουμε τον συντελεστή προσδιορισμού.

Συντελεστής προσδιορισμού– αντιπροσωπεύει το μερίδιο της διακύμανσης παραγόντων στο σύνολο και δείχνει σε ποιο ποσοστό είναι η διακύμανση του προκύπτοντος χαρακτηριστικού στοεξηγείται από την παραλλαγή του χαρακτηριστικού του παράγοντα Χ:

Δεν χαρακτηρίζει ολόκληρη την παραλλαγή στοαπό χαρακτηριστικό παράγοντα Χ, αλλά μόνο εκείνο το τμήμα του που αντιστοιχεί στην εξίσωση γραμμικής παλινδρόμησης, δηλ. δείχνει ειδικό βάροςπαραλλαγή του προκύπτοντος χαρακτηριστικού, γραμμικά συνδεδεμένη με τη μεταβολή του χαρακτηριστικού παράγοντα.

Μέγεθος
– το ποσοστό διακύμανσης στο προκύπτον χαρακτηριστικό που δεν μπορούσε να λάβει υπόψη το μοντέλο παλινδρόμησης.

Η διασπορά των σημείων στο πεδίο συσχέτισης μπορεί να είναι πολύ μεγάλη και η υπολογιζόμενη εξίσωση παλινδρόμησης μπορεί να δώσει μεγάλο σφάλμα στην εκτίμηση του αναλυόμενου δείκτη.

Μέσο σφάλμα προσέγγισηςδείχνει τη μέση απόκλιση των υπολογισμένων τιμών από τις πραγματικές:

Η μέγιστη επιτρεπόμενη τιμή είναι 12–15%.

Το τυπικό σφάλμα είναι ένα μέτρο της εξάπλωσης της εξαρτημένης μεταβλητής γύρω από τη γραμμή παλινδρόμησης. Για ολόκληρο το σύνολο των παρατηρούμενων τιμών, υπολογίζεται τυπικό (rms) σφάλμα εξίσωσης παλινδρόμησης, που είναι η τυπική απόκλιση των πραγματικών τιμών στοσε σχέση με τις θεωρητικές τιμές που υπολογίζονται χρησιμοποιώντας την εξίσωση παλινδρόμησης στο Χ .

,

Οπου
– αριθμός βαθμών ελευθερίας.

Μ– αριθμός παραμέτρων της εξίσωσης παλινδρόμησης (για την ευθύγραμμη εξίσωση Μ=2).

Μπορείτε να υπολογίσετε την τιμή του μέσου τετραγώνου σφάλματος συγκρίνοντάς το

α) με τη μέση τιμή του χαρακτηριστικού που προκύπτει στο;

β) με την τυπική απόκλιση του χαρακτηριστικού στο:

Αν
, τότε η χρήση αυτής της εξίσωσης παλινδρόμησης είναι κατάλληλη.

Αξιολογούνται χωριστά πρότυπο (μέσο τετράγωνο) σφάλματα παραμέτρων εξίσωσης και δείκτη συσχέτισης:

;
;
.

Χ- τυπική απόκλιση Χ.

Έλεγχος της σημασίας της εξίσωσης παλινδρόμησης και των δεικτών στεγανότητας της σύνδεσης

Προκειμένου το κατασκευασμένο μοντέλο να χρησιμοποιηθεί για περαιτέρω οικονομικούς υπολογισμούς, ο έλεγχος της ποιότητας του κατασκευασμένου μοντέλου δεν αρκεί. Είναι επίσης απαραίτητο να ελεγχθεί η σημασία (σημαντικότητα) των εκτιμήσεων της εξίσωσης παλινδρόμησης που λαμβάνονται χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων και τον δείκτη ισχύος της σχέσης, δηλ. είναι απαραίτητο να τα ελέγξετε για συμμόρφωση με τις πραγματικές παραμέτρους της σχέσης.

Αυτό οφείλεται στο γεγονός ότι οι δείκτες που υπολογίζονται από έναν περιορισμένο πληθυσμό διατηρούν το στοιχείο της τυχαιότητας που είναι εγγενές στις επιμέρους τιμές του χαρακτηριστικού. Επομένως, είναι μόνο εκτιμήσεις ενός συγκεκριμένου στατιστικού προτύπου. Είναι απαραίτητο να εκτιμηθεί ο βαθμός ακρίβειας και σημαντικότητας (αξιοπιστία, σημασία) των παραμέτρων παλινδρόμησης. Κάτω από σημασίακατανοούν την πιθανότητα η τιμή της παραμέτρου που ελέγχεται να μην είναι μηδενική και να μην περιλαμβάνει τιμές αντίθετων προσώπων.

Έλεγχος σημασίας– έλεγχος της υπόθεσης ότι οι παράμετροι είναι διαφορετικές από το μηδέν.

Εκτίμηση της σημασίας μιας εξίσωσης ζευγαρωμένης παλινδρόμησηςκαταλήγει στον έλεγχο υποθέσεων σχετικά με τη σημασία της εξίσωσης παλινδρόμησης στο σύνολό της και των επιμέρους παραμέτρων της ( ένα, σι), συντελεστής ζεύγους προσδιορισμού ή δείκτης συσχέτισης.

Σε αυτήν την περίπτωση, μπορούν να προβληθούν τα ακόλουθα: κύριες υποθέσειςH 0 :

1)
– οι συντελεστές παλινδρόμησης είναι ασήμαντοι και η εξίσωση παλινδρόμησης είναι επίσης ασήμαντη.

2)
– ο ζευγαρωμένος συντελεστής προσδιορισμού είναι ασήμαντος και η εξίσωση παλινδρόμησης είναι επίσης ασήμαντη.

Οι ακόλουθες υποθέσεις είναι εναλλακτικές (ή αντίστροφες):

1)
– οι συντελεστές παλινδρόμησης διαφέρουν σημαντικά από το μηδέν και η κατασκευασμένη εξίσωση παλινδρόμησης είναι σημαντική.

2)
– ο ζευγαρωμένος συντελεστής προσδιορισμού είναι σημαντικά διαφορετικός από το μηδέν και η κατασκευασμένη εξίσωση παλινδρόμησης είναι σημαντική.

Έλεγχος της υπόθεσης για τη σημασία της εξίσωσης ζευγαρωμένης παλινδρόμησης

Για να ελέγξουμε την υπόθεση σχετικά με τη στατιστική ασημαντότητα της εξίσωσης παλινδρόμησης στο σύνολό της και του συντελεστή προσδιορισμού, χρησιμοποιούμε φά-κριτήριο(Τεστ Fisher):

ή

Οπου κ 1 = Μ–1 ; κ 2 = nΜ – αριθμός βαθμών ελευθερίας.

n– αριθμός πληθυσμιακών μονάδων·

Μ– αριθμός παραμέτρων εξίσωσης παλινδρόμησης.

– διασπορά παραγόντων.

– υπολειπόμενη διακύμανση.

Η υπόθεση ελέγχεται ως εξής:

1) εάν η πραγματική (παρατηρηθείσα) τιμή φά-το κριτήριο είναι μεγαλύτερο από την κρίσιμη (πίνακας) τιμή αυτού του κριτηρίου
, τότε με πιθανότητα
η κύρια υπόθεση σχετικά με τη μη σημασία της εξίσωσης παλινδρόμησης ή του ζευγαρωμένου συντελεστή προσδιορισμού απορρίπτεται και η εξίσωση παλινδρόμησης θεωρείται σημαντική.

2) εάν η πραγματική (παρατηρηθείσα) τιμή του κριτηρίου F είναι μικρότερη από την κρίσιμη τιμή αυτού του κριτηρίου
, τότε με πιθανότητα (
) γίνεται αποδεκτή η κύρια υπόθεση σχετικά με τη μη σημασία της εξίσωσης παλινδρόμησης ή του ζευγαρωμένου συντελεστή προσδιορισμού και η κατασκευασμένη εξίσωση παλινδρόμησης θεωρείται ασήμαντη.

Κρίσιμη αξία φά-κριτήρια βρίσκονται στους αντίστοιχους πίνακες ανάλογα με το επίπεδο σημαντικότητας και τον αριθμό των βαθμών ελευθερίας
.

Αριθμός βαθμών ελευθερίας– δείκτης, ο οποίος ορίζεται ως η διαφορά μεταξύ του μεγέθους του δείγματος ( n) και τον αριθμό των εκτιμώμενων παραμέτρων για ένα δεδομένο δείγμα ( Μ). Για ένα μοντέλο παλινδρόμησης κατά ζεύγη, ο αριθμός των βαθμών ελευθερίας υπολογίζεται ως
, δεδομένου ότι δύο παράμετροι υπολογίζονται από το δείγμα (
).

Επίπεδο σημασίας – καθορισμένη τιμή
,

Οπου – πιθανότητα εμπιστοσύνης της εκτιμώμενης παραμέτρου να εμπίπτει στο διάστημα εμπιστοσύνης. Συνήθως γίνεται δεκτό 0,95. Ετσι είναι η πιθανότητα η εκτιμώμενη παράμετρος να μην εμπίπτει στο διάστημα εμπιστοσύνης, ίσο με 0,05 (5%).

Στη συνέχεια, στην περίπτωση εκτίμησης της σημασίας της εξίσωσης ζευγαρωμένης παλινδρόμησης, η κρίσιμη τιμή του F-test υπολογίζεται ως
:

.

Έλεγχος της υπόθεσης σχετικά με τη σημασία των παραμέτρων της εξίσωσης ζευγαρωμένης παλινδρόμησης και του δείκτη συσχέτισης

Κατά τον έλεγχο της σημασίας των παραμέτρων της εξίσωσης (η υπόθεση ότι οι παράμετροι διαφέρουν από το μηδέν), διατυπώνεται η κύρια υπόθεση σχετικά με την ασήμαντη σημασία των ληφθέντων εκτιμήσεων.
. Ως εναλλακτική (αντίστροφη) υπόθεση προβάλλεται σχετικά με τη σημασία των παραμέτρων της εξίσωσης (
).

Για τον έλεγχο των υποθέσεων που προτάθηκαν, χρησιμοποιείται t -κριτήριο (t-στατιστική) Τεστ μαθητή. Παρατηρούμενη τιμή t-το κριτήριο συγκρίνεται με την τιμή t-κριτήριο που καθορίζεται από τον πίνακα κατανομής Student (κρίσιμη τιμή). Κρίσιμη αξία t-κριτήρια
εξαρτάται από δύο παραμέτρους: το επίπεδο σημαντικότητας και τον αριθμό των βαθμών ελευθερίας
.

Οι υποθέσεις που διατυπώνονται ελέγχονται ως εξής:

1) αν η απόλυτη τιμή της παρατηρούμενης τιμής t-κριτήρια μεγαλύτερα από την κρίσιμη τιμή t-κριτήρια, δηλ.
, τότε με πιθανότητα
απορρίπτεται η κύρια υπόθεση για την ασημαντότητα των παραμέτρων παλινδρόμησης, δηλ. Οι παράμετροι παλινδρόμησης δεν είναι ίσες με 0.

2) αν η απόλυτη τιμή της παρατηρούμενης τιμής t-το κριτήριο είναι μικρότερο ή ίσο με την κρίσιμη τιμή t-κριτήρια, δηλ.
, τότε με πιθανότητα
γίνεται αποδεκτή η κύρια υπόθεση για την ασημαντότητα των παραμέτρων παλινδρόμησης, δηλ. Οι παράμετροι παλινδρόμησης δεν διαφέρουν σχεδόν από 0 ή ίσες με 0.

Η αξιολόγηση της σημασίας των συντελεστών παλινδρόμησης χρησιμοποιώντας το τεστ Student πραγματοποιείται συγκρίνοντας τις εκτιμήσεις τους με την τιμή του τυπικού σφάλματος:

;

Για την αξιολόγηση της στατιστικής σημασίας του δείκτη συσχέτισης (γραμμικός συντελεστής), χρησιμοποιείται επίσης t-Τεστ μαθητή.

Η ζευγαρωμένη παλινδρόμηση χαρακτηρίζει τη σχέση μεταξύ δύο χαρακτηριστικών: προκύπτοντος και παραγοντικού. Ένα σημαντικό και μη τετριμμένο στάδιο στην κατασκευή ενός μοντέλου παλινδρόμησης είναι η επιλογή της εξίσωσης παλινδρόμησης. Η επιλογή αυτή βασίζεται σε θεωρητικά δεδομένα για το φαινόμενο που μελετάται και σε μια προκαταρκτική ανάλυση των διαθέσιμων στατιστικών δεδομένων.

Εξίσωση ζεύγους γραμμικής παλινδρόμησηςέχει τη μορφή:

πού είναι οι θεωρητικές τιμές του προκύπτοντος χαρακτηριστικού που λαμβάνονται από την εξίσωση παλινδρόμησης; - συντελεστές (παράμετροι) της εξίσωσης παλινδρόμησης.

Ένα μοντέλο παλινδρόμησης δημιουργείται με βάση στατιστικά δεδομένα και μπορεί να χρησιμοποιηθεί ως ατομικές αξίεςχαρακτηριστικό και ομαδοποιημένα δεδομένα. Για να προσδιορίσετε τη σύνδεση μεταξύ των χαρακτηριστικών, αρκεί ένας μεγάλος αριθμόςπαρατηρήσεις, τα στατιστικά δεδομένα ομαδοποιούνται προκαταρκτικά σύμφωνα με τα δύο χαρακτηριστικά και δημιουργείται ένας πίνακας συσχέτισης. Με βοήθεια πίνακας συσχέτισηςΕμφανίζεται μόνο η σχέση συσχέτισης ζευγαρώματος, δηλ. σύνδεση ενός αποτελεσματικού χαρακτηριστικού με έναν παράγοντα. Οι παράμετροι της εξίσωσης παλινδρόμησης εκτιμώνται χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, η οποία βασίζεται στην υπόθεση της ανεξαρτησίας των παρατηρήσεων του υπό μελέτη πληθυσμού και στην απαίτηση ότι το άθροισμα των τετραγωνικών αποκλίσεων των εμπειρικών δεδομένων από τις ευθυγραμμισμένες τιμές της αποτελεσματικής ο παράγοντας είναι ελάχιστος:

.

Για γραμμική εξίσωσηπαλινδρόμηση έχουμε:

Για να βρούμε το ελάχιστο αυτής της συνάρτησης, εξισώνουμε τις μερικές παράγωγές της με το μηδέν και παίρνουμε ένα σύστημα δύο γραμμικών εξισώσεων, το οποίο ονομάζεται σύστημα κανονικές εξισώσεις:

πού είναι ο όγκος του υπό μελέτη πληθυσμού (ο αριθμός των μονάδων παρατήρησης).

Η επίλυση ενός συστήματος κανονικών εξισώσεων σάς επιτρέπει να βρείτε τις παραμέτρους της εξίσωσης παλινδρόμησης.

Ο συντελεστής γραμμικής παλινδρόμησης κατά ζεύγη είναι η μέση τιμή στο σημείο , επομένως η οικονομική του ερμηνεία είναι δύσκολη. Η έννοια αυτού του συντελεστή μπορεί να ερμηνευθεί ως η μέση επιρροή των μη λογιστικών (μη επιλεγμένων για έρευνα) παραγόντων στο αποτελεσματικό χαρακτηριστικό. Ο συντελεστής δείχνει πόσο κατά μέσο όρο αλλάζει η τιμή του προκύπτοντος χαρακτηριστικού όταν το χαρακτηριστικό του παράγοντα μεταβάλλεται κατά ένα.

Μετά τη λήψη της εξίσωσης παλινδρόμησης, είναι απαραίτητο να ελεγχθεί η επάρκειά της, δηλαδή η συμμόρφωσή της με πραγματικά στατιστικά δεδομένα. Για το σκοπό αυτό, ελέγχεται η σημασία των συντελεστών παλινδρόμησης: διαπιστώνεται πόσο τυπικοί είναι αυτοί οι δείκτες για το σύνολο πληθυσμόςαν είναι αποτέλεσμα τυχαίου συνδυασμού περιστάσεων.

Για να ελεγχθεί η σημασία των απλών γραμμικών συντελεστών παλινδρόμησης όταν το μέγεθος του πληθυσμού είναι μικρότερο από 30 μονάδες, χρησιμοποιείται το Student's t test. Συγκρίνοντας την τιμή της παραμέτρου με το μέσο σφάλμα της, προσδιορίζεται η τιμή του κριτηρίου:


όπου είναι το μέσο σφάλμα της παραμέτρου.

Το μέσο σφάλμα των παραμέτρων και υπολογίζεται χρησιμοποιώντας τους ακόλουθους τύπους:

; ,

- το μέγεθος του δείγματος;

Τυπική απόκλιση του προκύπτοντος χαρακτηριστικού από τις ευθυγραμμισμένες τιμές.

Τυπική απόκλιση του χαρακτηριστικού παράγοντα από τον γενικό μέσο όρο:

ή

Τότε οι υπολογισμένες (πραγματικές) τιμές του κριτηρίου είναι αντίστοιχα ίσες με:

- για την παράμετρο.

- για την παράμετρο.

Οι υπολογισμένες τιμές του κριτηρίου συγκρίνονται με τις κρίσιμες τιμές, οι οποίες προσδιορίζονται χρησιμοποιώντας τον πίνακα του Μαθητή, λαμβάνοντας υπόψη το αποδεκτό επίπεδο σημαντικότητας και τον αριθμό των βαθμών ελευθερίας, όπου είναι το μέγεθος του δείγματος, -1 (είναι το αριθμός χαρακτηριστικών παραγόντων). Σε κοινωνικο-οικονομικές μελέτες, το επίπεδο σημαντικότητας συνήθως λαμβάνεται ως 0,05 ή 0,01. Μια παράμετρος θεωρείται σημαντική εάν (η υπόθεση ότι η παράμετρος μόνο λόγω τυχαίων περιστάσεων αποδείχθηκε ότι είναι ίση με την τιμή που λήφθηκε απορρίπτεται, αλλά στην πραγματικότητα είναι ίση με μηδέν).

Η επάρκεια του μοντέλου παλινδρόμησης μπορεί να εκτιμηθεί χρησιμοποιώντας τη δοκιμή Fisher. Η υπολογισμένη τιμή του κριτηρίου καθορίζεται από τον τύπο ,

πού είναι ο αριθμός των παραμέτρων του μοντέλου;

Το μέγεθος του δείγματος.

Ο πίνακας καθορίζει την κρίσιμη τιμή της δοκιμής Fisher για το αποδεκτό επίπεδο σημαντικότητας και τον αριθμό των βαθμών ελευθερίας . Εάν , τότε το μοντέλο παλινδρόμησης θεωρείται επαρκές σύμφωνα με αυτό το κριτήριο (απορρίπτεται η υπόθεση για την ασυμφωνία μεταξύ των σχέσεων που είναι εγγενείς στην εξίσωση και των πραγματικά υπαρχουσών).

Το δεύτερο καθήκον της ανάλυσης συσχέτισης-παλίνδρομης είναι η μέτρηση της εγγύτητας της σχέσης μεταξύ των χαρακτηριστικών που προκύπτουν και των παραγόντων.

Για όλους τους τύπους επικοινωνίας, το πρόβλημα της μέτρησης της στεγανότητας της εξάρτησης μπορεί να λυθεί χρησιμοποιώντας τον λογισμό της θεωρητικής αναλογίας συσχέτισης:

,

Οπου - διασπορά στη σειρά εξισωμένων τιμών του προκύπτοντος χαρακτηριστικού, λόγω του χαρακτηριστικού παράγοντα.

- διασπορά στη σειρά πραγματικών τιμών. Αυτή είναι η συνολική διακύμανση, η οποία αποτελείται από τη διακύμανση που οφείλεται στον παράγοντα (δηλαδή, διακύμανση παράγοντα) και τη διακύμανση του υπολοίπου (απόκλιση εμπειρικές αξίεςχαρακτηριστικά από τα ευθυγραμμισμένα θεωρητικά).

Με βάση τον κανόνα για την προσθήκη διακυμάνσεων η θεωρητική σχέση συσχέτισης μπορεί να εκφραστεί με όρους της υπολειπόμενης διακύμανσης:

.

Δεδομένου ότι η διασπορά αντανακλά τη διακύμανση στη σειρά μόνο λόγω της μεταβολής του παράγοντα, και η διασπορά αντανακλά τη διακύμανση που οφείλεται σε όλους τους παράγοντες, η αναλογία τους, που ονομάζεται θεωρητικός συντελεστής προσδιορισμού, δείχνει ποια αναλογία σε συνολική διακύμανσηΗ σειρά καταλαμβάνεται από τη διασπορά που προκαλείται από τη διακύμανση του παράγοντα. Τετραγωνική ρίζααπό την αναλογία αυτών των διακυμάνσεων δίνει τη θεωρητική αναλογία συσχέτισης. Για μη γραμμικές σχέσεις, η θεωρητική σχέση συσχέτισης ονομάζεται δείκτης συσχέτισης και συμβολίζεται με .

Εάν , τότε αυτό σημαίνει ότι δεν υπάρχει κανένας ρόλος άλλων παραγόντων στην παραλλαγή, υπολειπόμενη διακύμανσηισούται με μηδέν και ο λόγος σημαίνει πλήρης εξάρτησηπαραλλαγές από . Αν , τότε αυτό σημαίνει ότι η παραλλαγή δεν έχει καμία επίδραση στην παραλλαγή, και σε αυτήν την περίπτωση . Επομένως, ο λόγος συσχέτισης παίρνει τιμές από 0 έως 1. Όσο πιο κοντά είναι ο λόγος συσχέτισης στο 1, τόσο στενότερη σύνδεσηανάμεσα στα σημάδια.

Επιπλέον, με τη γραμμική μορφή της εξίσωσης επικοινωνίας, χρησιμοποιείται ένας άλλος δείκτης της εγγύτητας της σύνδεσης - ο συντελεστής γραμμικής συσχέτισης:

.

Ο συντελεστής γραμμικής συσχέτισης παίρνει τιμές από -1 έως 1. Αρνητικές αξίεςδείχνω αντίστροφη σχέση, θετικό – άμεσα. Όσο πιο κοντά είναι η μονάδα του συντελεστή συσχέτισης στο ένα, τόσο πιο στενή είναι η σχέση μεταξύ των χαρακτηριστικών.

Γίνονται αποδεκτές οι ακόλουθες εκτιμήσεις ορίων του συντελεστή γραμμικής συσχέτισης:

Δεν υπάρχει σύνδεση.

Η σύνδεση είναι αδύναμη.

Η επικοινωνία είναι μέτρια.

Η σύνδεση είναι ισχυρή.

Η σύνδεση είναι πολύ δυνατή.

Το τετράγωνο του γραμμικού συντελεστή συσχέτισης ονομάζεται γραμμικός συντελεστής προσδιορισμού.

Το γεγονός της σύμπτωσης ή της μη σύμπτωσης της θεωρητικής σχέσης συσχέτισης και του συντελεστή γραμμικής συσχέτισης χρησιμοποιείται για την εκτίμηση του σχήματος της εξάρτησης. Οι τιμές τους συμπίπτουν μόνο αν υπάρχει γραμμική σύνδεση. Η απόκλιση μεταξύ αυτών των τιμών υποδηλώνει τη μη γραμμικότητα της σχέσης μεταξύ των χαρακτηριστικών. Είναι γενικά αποδεκτό ότι αν , τότε η υπόθεση για τη γραμμικότητα της σχέσης μπορεί να θεωρηθεί επιβεβαιωμένη.

Οι δείκτες της εγγύτητας των συνδέσεων, ειδικά εκείνοι που υπολογίζονται από δεδομένα από έναν σχετικά μικρό στατιστικό πληθυσμό, μπορούν να παραμορφωθούν από τυχαίες αιτίες. Αυτό απαιτεί τον έλεγχο της αξιοπιστίας τους (σημαντικότητα), γεγονός που καθιστά δυνατή την επέκταση των συμπερασμάτων που προκύπτουν από τα δεδομένα του δείγματος στον γενικό πληθυσμό.

Για να γίνει αυτό, υπολογίστε το μέσο σφάλμα του συντελεστή συσχέτισης:

Πού είναι ο αριθμός των βαθμών ελευθερίας για μια γραμμική εξάρτηση.

Στη συνέχεια, βρίσκεται ο λόγος του συντελεστή συσχέτισης προς το μέσο σφάλμα του, δηλαδή, ο οποίος συγκρίνεται με την τιμή του πίνακα του τεστ Student.

Εάν η πραγματική (υπολογιζόμενη) τιμή είναι μεγαλύτερη από την πινακοποιημένη (κρίσιμη, κατώφλι), τότε ο συντελεστής γραμμικής συσχέτισης θεωρείται σημαντικός και η σχέση μεταξύ και θεωρείται πραγματική.

Αφού ελεγχθεί η επάρκεια του κατασκευασμένου μοντέλου (εξίσωση παλινδρόμησης), πρέπει να αναλυθεί. Για ευκολία ερμηνείας της παραμέτρου, χρησιμοποιείται ο συντελεστής ελαστικότητας. Δείχνει τη μέση μεταβολή στο ενεργό χαρακτηριστικό όταν το χαρακτηριστικό του παράγοντα αλλάζει κατά 1% και υπολογίζεται από τον τύπο:

Η ακρίβεια του προκύπτοντος μοντέλου μπορεί να εκτιμηθεί με βάση την τιμή μέσο σφάλμαπροσεγγίσεις:

Επιπλέον, σε ορισμένες περιπτώσεις, τα δεδομένα για τα υπολείμματα που χαρακτηρίζουν την απόκλιση των παρατηρήσεων από τις υπολογισμένες τιμές είναι ενημερωτικά. Ιδιαίτερο οικονομικό ενδιαφέρον παρουσιάζουν οι αξίες των οποίων τα υπολείμματα έχουν το μεγαλύτερο θετικό ή αρνητικές αποκλίσειςαπό το αναμενόμενο επίπεδο του αναλυόμενου δείκτη.

Η παλινδρόμηση γραμμικού ζεύγους χρησιμοποιείται ευρέως στην οικονομετρία με τη μορφή μιας ξεκάθαρης οικονομικής ερμηνείας των παραμέτρων της. Η γραμμική παλινδρόμηση καταλήγει στην εύρεση μιας εξίσωσης της μορφής

ή . (3.6)

Εξίσωση της φόρμας επιτρέπει δεδομένες τιμές παραγόντων Χέχουν θεωρητικές τιμές του προκύπτοντος χαρακτηριστικού, αντικαθιστώντας τις πραγματικές τιμές του παράγοντα σε αυτό Χ.

Η κατασκευή της ζευγαρωμένης γραμμικής παλινδρόμησης καταλήγει στην εκτίμηση των παραμέτρων της Και . Οι εκτιμήσεις παραμέτρων γραμμικής παλινδρόμησης μπορούν να βρεθούν χρησιμοποιώντας διαφορετικές μεθόδους. Για παράδειγμα, χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (LSM).

Σύμφωνα με τη μέθοδο των ελαχίστων τετραγώνων εκτίμησης παραμέτρων και επιλέγονται με τέτοιο τρόπο ώστε το άθροισμα των τετραγωνικών αποκλίσεων των πραγματικών τιμών του προκύπτοντος χαρακτηριστικού (y)από το υπολογισμένο (θεωρητικό, μοντέλο) ήταν ελάχιστο. Με άλλα λόγια, από ολόκληρο το σύνολο των γραμμών, η γραμμή παλινδρόμησης στο γράφημα επιλέγεται έτσι ώστε το άθροισμα των τετραγώνων των κάθετων αποστάσεων μεταξύ των σημείων και αυτής της γραμμής να είναι ελάχιστο (Εικ. 3.2):

, (3.7)

Ρύζι. 3.2. Γραμμή παλινδρόμησης με το ελάχιστο άθροισμα των τετραγώνων κάθετων αποστάσεων μεταξύ των σημείων και αυτής της ευθείας

Για περαιτέρω συμπεράσματα, αντικαθιστούμε την τιμή του μοντέλου στην έκφραση (3.7), δηλαδή παίρνουμε:

Για να βρείτε το ελάχιστο της συνάρτησης (3.8), είναι απαραίτητο να υπολογίσετε τις μερικές παραγώγους για κάθε μία από τις παραμέτρους Και και βάλε τα στο μηδέν:

Μετασχηματίζοντας αυτό το σύστημα, λαμβάνουμε το ακόλουθο σύστημα κανονικών εξισώσεων για την εκτίμηση των παραμέτρων Και :

. (3.9)

Η μορφή μήτρας για την εγγραφή αυτού του συστήματος έχει τη μορφή:

. (3.10)

Λύνοντας το σύστημα των κανονικών εξισώσεων (3.10) σε μορφή πίνακα παίρνουμε:

Η αλγεβρική μορφή της λύσης στο σύστημα (3.11) μπορεί να γραφτεί ως εξής:

Μετά από απλούς μετασχηματισμούς, ο τύπος (3.12) μπορεί να γραφτεί σε μια βολική μορφή:

Θα πρέπει να σημειωθεί ότι οι εκτιμήσεις των παραμέτρων της εξίσωσης παλινδρόμησης μπορούν να ληφθούν χρησιμοποιώντας άλλους τύπους, για παράδειγμα:

(3.14)

Εδώ είναι το δείγμα του συντελεστή γραμμικής συσχέτισης κατά ζεύγη.

Αφού υπολογίσουμε τις παραμέτρους παλινδρόμησης, μπορούμε να γράψουμε την εξίσωση του μαθηματικού μοντέλου οπισθοδρόμηση:

Πρέπει να σημειωθεί ότι η παράμετρος δείχνει τη μέση μεταβολή του αποτελέσματος με μεταβολή του συντελεστή κατά μία μονάδα. Έτσι, εάν στη συνάρτηση κόστους (y -κόστος (χιλιάδες ρούβλια), Χ- αριθμός μονάδων παραγωγής). Επομένως, με αύξηση του όγκου παραγωγής (Χ)για 1 μονάδα Το κόστος παραγωγής αυξάνεται κατά μέσο όρο κατά 2 χιλιάδες ρούβλια, δηλαδή μια πρόσθετη αύξηση της παραγωγής κατά 1 μονάδα. θα απαιτήσει αύξηση του κόστους κατά μέσο όρο 2 χιλιάδες ρούβλια.

Η δυνατότητα μιας ξεκάθαρης οικονομικής ερμηνείας του συντελεστή παλινδρόμησης έχει κάνει την εξίσωση γραμμικής παλινδρόμησης αρκετά κοινή στην οικονομετρική έρευνα.

Τυπικά - νόημα στοστο Χ= 0. Εάν το χαρακτηριστικό-παράγοντας δεν έχει και δεν μπορεί να έχει μηδενική τιμή, τότε η παραπάνω ερμηνεία του ελεύθερου όρου δεν έχει νόημα. Παράμετρος μπορεί να μην έχει οικονομικό περιεχόμενο. Προσπάθειες οικονομικής ερμηνείας της παραμέτρου μπορεί να οδηγήσει σε παραλογισμό, ειδικά όταν < 0.

Παράδειγμα 3.2. Ας υποθέσουμε ότι για μια ομάδα επιχειρήσεων που παράγουν τον ίδιο τύπο προϊόντος, λαμβάνουμε υπόψη τη συνάρτηση κόστους: . Πληροφορίες που απαιτούνται για τον υπολογισμό των εκτιμήσεων παραμέτρων Και , παρουσιάζεται στον πίνακα. 3.1.

Πίνακας 3.1

Υπολογίστηκετραπέζι

Επιχείρηση Αρ.

Παραγωγή προϊόντος, χιλιάδες μονάδες ()

Κόστος παραγωγής, εκατομμύρια ρούβλια. ()

Το σύστημα των κανονικών εξισώσεων θα μοιάζει με αυτό:

.

Η επίλυση αυτού του συστήματος χρησιμοποιώντας τον τύπο (4.13) δίνει το αποτέλεσμα:

Ας γράψουμε το μοντέλο εξίσωσης παλινδρόμησης (4.16):

Αντικατάσταση των τιμών στην εξίσωση Χ, ας βρούμε τις θεωρητικές (μοντέλες) τιμές y,(βλ. τελευταία στήλη του Πίνακα 3.1).

Σε αυτήν την περίπτωση, η τιμή της παραμέτρου δεν έχει κανένα οικονομικό νόημα.

Στο υπό εξέταση παράδειγμα έχουμε:

Η εξίσωση παλινδρόμησης συμπληρώνεται πάντα με έναν δείκτη της εγγύτητας της σύνδεσης. Όταν χρησιμοποιείται γραμμική παλινδρόμηση, ένας τέτοιος δείκτης είναι ο συντελεστής γραμμικής συσχέτισης. Υπάρχουν διαφορετικές τροποποιήσεις του τύπου του συντελεστή γραμμικής συσχέτισης. Μερικές από αυτές δίνονται παρακάτω:

Ως γνωστόν, ο συντελεστής γραμμικής συσχέτισης είναι εντός των ορίων: .

Εάν ο συντελεστής παλινδρόμησης είναι , τότε, και αντίστροφα, πότε .

Σύμφωνα με τον πίνακα. 4.1, η τιμή του συντελεστή γραμμικής συσχέτισης ήταν 0,993, που είναι αρκετά κοντά στο 1 και σημαίνει ότι υπάρχει πολύ στενή εξάρτηση του κόστους παραγωγής από τον όγκο της παραγωγής.

Θα πρέπει να ληφθεί υπόψη ότι η τιμή του συντελεστή γραμμικής συσχέτισης αξιολογεί την εγγύτητα της σύνδεσης μεταξύ των υπό εξέταση χαρακτηριστικών στη γραμμική του μορφή. Επομένως, η εγγύτητα της απόλυτης τιμής του συντελεστή γραμμικής συσχέτισης στο μηδέν δεν σημαίνει ότι δεν υπάρχει σύνδεση μεταξύ των χαρακτηριστικών. Με διαφορετικές προδιαγραφές του μοντέλου, η σχέση μεταξύ των χαρακτηριστικών μπορεί να αποδειχθεί αρκετά στενή.

Για να εκτιμηθεί η ποιότητα της προσαρμογής μιας γραμμικής συνάρτησης, υπολογίζεται το τετράγωνο του συντελεστή γραμμικής συσχέτισης, που ονομάζεται συντελεστή προσδιορισμού.Ο συντελεστής προσδιορισμού χαρακτηρίζει την αναλογία διακύμανσης του προκύπτοντος χαρακτηριστικού y,εξηγείται με παλινδρόμηση στη συνολική διακύμανση του προκύπτοντος χαρακτηριστικού.

Αντίστοιχα, η τιμή χαρακτηρίζει το μερίδιο διακύμανσης που προκαλείται από την επίδραση άλλων παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Στο παράδειγμά μας. Κατά συνέπεια, η εξίσωση παλινδρόμησης εξηγεί το 98,6% της διακύμανσης του αποτελεσματικού χαρακτηριστικού και άλλοι παράγοντες αντιπροσωπεύουν μόνο το 1,4% της διακύμανσής του (δηλαδή, η υπολειπόμενη διακύμανση). Η τιμή του συντελεστή προσδιορισμού χρησιμεύει ως ένα από τα κριτήρια για την αξιολόγηση της ποιότητας ενός γραμμικού μοντέλου. Όσο μεγαλύτερη είναι η αναλογία της επεξηγημένης διακύμανσης, τόσο μικρότερος είναι αντίστοιχα ο ρόλος άλλων παραγόντων και, κατά συνέπεια, γραμμικό μοντέλοπροσεγγίζει καλά τα δεδομένα πηγής και μπορεί να χρησιμοποιηθεί για την πρόβλεψη των τιμών του προκύπτοντος χαρακτηριστικού. Έτσι, υποθέτοντας ότι ο όγκος παραγωγής της επιχείρησης μπορεί να ανέλθει σε 6 χιλιάδες . μονάδες, η προβλεπόμενη αξία για το κόστος παραγωγής θα είναι 221,01 χιλιάδες ρούβλια.

Η απλούστερη μορφή παλινδρόμησης από την άποψη των τεχνικών κατανόησης, ερμηνείας και υπολογισμού είναι η γραμμική μορφή παλινδρόμησης.

Εξίσωση γραμμικής παλινδρόμησης ζεύγους, όπου

a 0 , a 1 είναι παράμετροι του μοντέλου, το ε i είναι μια τυχαία μεταβλητή (υπόλοιπη τιμή).

Παράμετροι μοντέλου και το περιεχόμενό τους:


Η εξίσωση παλινδρόμησης συμπληρώνεται με έναν δείκτη της εγγύτητας της σύνδεσης. Ένας τέτοιος δείκτης είναι ο συντελεστής γραμμικής συσχέτισης, ο οποίος υπολογίζεται χρησιμοποιώντας τον τύπο:

ή .

Για να εκτιμηθεί η ποιότητα της προσαρμογής μιας γραμμικής συνάρτησης, υπολογίζεται το τετράγωνο του συντελεστή γραμμικής συσχέτισης, που ονομάζεται συντελεστή προσδιορισμού. Ο συντελεστής προσδιορισμού χαρακτηρίζει την αναλογία της διακύμανσης του αποτελεσματικού χαρακτηριστικού που εξηγείται με παλινδρόμηση στη συνολική διακύμανση του ενεργού χαρακτηριστικού:

,

Οπου

.

Αντίστοιχα, η τιμή χαρακτηρίζει το μερίδιο διακύμανσης που προκαλείται από την επίδραση άλλων παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Αφού κατασκευαστεί η εξίσωση παλινδρόμησης, ελέγχεται η επάρκεια και η ακρίβειά της.Οι ιδιότητες αυτές του μοντέλου μελετώνται με βάση την ανάλυση ενός αριθμού υπολειμμάτων ε i (αποκλίσεις των υπολογισμένων τιμών από τις πραγματικές).

Επίπεδο σειράς υπολειμμάτων

Συσχέτιση και ανάλυση παλινδρόμησηςπραγματοποιείται για περιορισμένο πληθυσμό. Από αυτή την άποψη, οι δείκτες παλινδρόμησης, συσχέτισης και προσδιορισμού μπορεί να παραμορφωθούν από τη δράση τυχαίων παραγόντων. Για να ελέγξετε πόσο τυπικοί είναι αυτοί οι δείκτες για ολόκληρο τον πληθυσμό και εάν είναι αποτέλεσμα σύμπτωσης τυχαίων περιστάσεων, είναι απαραίτητο να ελέγξετε την επάρκεια του κατασκευασμένου μοντέλου.

Ο έλεγχος της επάρκειας του μοντέλου συνίσταται στον προσδιορισμό της σημασίας του μοντέλου και στον προσδιορισμό της παρουσίας ή απουσίας συστηματικού σφάλματος.

Αξίες στο 1που αντιστοιχεί στα δεδομένα Χ i σε θεωρητικές αξίες ένα 0Και Α'1,τυχαίος. Οι τιμές των συντελεστών που υπολογίζονται από αυτούς θα είναι επίσης τυχαίες. ένα 0Και Α'1.

Η σημασία των επιμέρους συντελεστών παλινδρόμησης ελέγχεται χρησιμοποιώντας Student's t-testελέγχοντας την υπόθεση ότι κάθε συντελεστής παλινδρόμησης είναι ίσος με μηδέν. Ταυτόχρονα, ανακαλύπτουν πόσο τυπικές είναι οι υπολογισμένες παράμετροι για την εμφάνιση ενός συνόλου συνθηκών: εάν οι τιμές παραμέτρων που λαμβάνονται είναι το αποτέλεσμα της ενέργειας τυχαίες μεταβλητές. Χρησιμοποιούνται κατάλληλοι τύποι για τους αντίστοιχους συντελεστές παλινδρόμησης.

Τύποι για τον προσδιορισμό του Student's t-test

Οπου

S a 0 ,S a 1 - τυπικές αποκλίσεις του ελεύθερου όρου και του συντελεστή παλινδρόμησης. Καθορίζεται από τύπους

Οπου

S ε - τυπική απόκλισηυπολείμματα μοντέλου (τυπικό σφάλμα εκτίμησης), το οποίο καθορίζεται από τον τύπο

Οι υπολογισμένες τιμές του τεστ t συγκρίνονται με την πινακοποιημένη τιμή του κριτηρίου tαγ , το οποίο καθορίζεται όταν (n - κ— 1) βαθμοί ελευθερίας και το αντίστοιχο επίπεδο σημασίας α. Εάν η υπολογιζόμενη τιμή του κριτηρίου t υπερβαίνει την τιμή του πίνακα tαγ, τότε η παράμετρος θεωρείται σημαντική. Σε αυτήν την περίπτωση, είναι σχεδόν αδύνατο οι τιμές των παραμέτρων που βρέθηκαν να οφείλονται μόνο σε τυχαίες συμπτώσεις.

Η σημασία της εξίσωσης παλινδρόμησης στο σύνολό της αξιολογείται με βάση το τεστ Fisher, του οποίου προηγείται ανάλυση διασποράς.

Το συνολικό άθροισμα των τετραγώνων αποκλίσεων μιας μεταβλητής από τη μέση τιμή διασπάται σε δύο μέρη - "εξήγηση" και "ανεξήγητο":

Συνολικό άθροισμα τετραγωνικών αποκλίσεων.

Το άθροισμα των τετραγωνικών αποκλίσεων που εξηγείται από την παλινδρόμηση (ή το άθροισμα των τετραγώνων των αποκλίσεων).


- το υπολειπόμενο άθροισμα των τετραγωνικών αποκλίσεων, που χαρακτηρίζει την επίδραση παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Σχέδιο ανάλυση της διακύμανσηςέχει τη μορφή που παρουσιάζεται στον Πίνακα 35 ( - αριθμός παρατηρήσεων, - αριθμός παραμέτρων για τη μεταβλητή).

Πίνακας 35 - Σχήμα ανάλυσης διασποράς

Στοιχεία διακύμανσης Άθροισμα τετραγώνων Αριθμός βαθμών ελευθερίας Διασπορά ανά βαθμό ελευθερίας
Γενικός
Παραγοντικό
Υπολειπόμενο

Ο καθορισμός της διακύμανσης κατά έναν βαθμό ελευθερίας φέρνει τις διακυμάνσεις σε συγκρίσιμη μορφή. Συγκρίνοντας τον παράγοντα και τις υπολειπόμενες διακυμάνσεις ανά βαθμό ελευθερίας, λαμβάνουμε την τιμή του κριτηρίου Fisher:

Για να ελέγξετε τη σημασία της εξίσωσης παλινδρόμησης στο σύνολό της, χρησιμοποιήστε Τεστ F Fisher. Στην περίπτωση της γραμμικής παλινδρόμησης κατά ζεύγη, η σημασία του μοντέλου παλινδρόμησης προσδιορίζεται από τον ακόλουθο τύπο: .

Εάν, σε ένα δεδομένο επίπεδο σημαντικότητας, η υπολογιζόμενη τιμή της δοκιμής F με γ 1 =k, γ 2 =( p - k - 1) οι βαθμοί ελευθερίας είναι μεγαλύτεροι από τον πίνακα, τότε το μοντέλο θεωρείται σημαντικό, η υπόθεση για την τυχαία φύση των εκτιμώμενων χαρακτηριστικών απορρίπτεται και αναγνωρίζεται η στατιστική σημασία και αξιοπιστία τους. Ο έλεγχος ύπαρξης ή απουσίας συστηματικού σφάλματος (εκπλήρωση των προαπαιτούμενων της μεθόδου των ελαχίστων τετραγώνων - LSM) πραγματοποιείται με βάση την ανάλυση ενός αριθμού υπολειμμάτων. Υπολογισμός τυχαία σφάλματαΟι παράμετροι γραμμικής παλινδρόμησης και ο συντελεστής συσχέτισης παράγονται σύμφωνα με τους τύπους

,

Για να ελέγξετε την τυχαιότητα μιας σειράς υπολειμμάτων, μπορείτε να χρησιμοποιήσετε τη δοκιμή σημείου καμπής (αιχμής). Ένα σημείο θεωρείται σημείο καμπής εάν: παρακάτω συνθήκες: ε i -1< ε i >ε i +1 ή ε i -1 > ε i< ε i +1

Στη συνέχεια, υπολογίζεται ο αριθμός των σημείων καμπής p. Κριτήριο τυχαιότητας με επίπεδο σημαντικότητας 5%, δηλ. Με πιθανότητα εμπιστοσύνης 95%, είναι η εκπλήρωση της ανισότητας:

Οι αγκύλες σημαίνουν ότι έχει ληφθεί ολόκληρο μέροςαριθμός που περικλείεται σε παρένθεση. Εάν η ανισότητα ικανοποιηθεί, τότε το μοντέλο θεωρείται επαρκές.

Για να ελέγξετε την ισότητα μαθηματική προσδοκίαΓια μια υπολειπόμενη ακολουθία μηδέν, υπολογίζεται η μέση τιμή ενός αριθμού υπολειμμάτων:

Αν = 0, τότε θεωρείται ότι το μοντέλο δεν περιέχει σταθερό συστηματικό σφάλμα και είναι επαρκές σύμφωνα με το μηδενικό μέσο κριτήριο.

Αν ≠ 0, τότε ελέγχεται η μηδενική υπόθεση ότι η μαθηματική προσδοκία είναι ίση με μηδέν. Για να το κάνετε αυτό, υπολογίστε το Student's t-test χρησιμοποιώντας τον τύπο:

όπου S ε είναι η τυπική απόκλιση των υπολειμμάτων του μοντέλου (τυπικό σφάλμα).

Η τιμή του κριτηρίου t συγκρίνεται με την πινακοποιημένη t αγ. Εάν η ανισότητα t > t αγ ικανοποιείται, τότε το μοντέλο είναι ανεπαρκές σύμφωνα με αυτό το κριτήριο

Η διασπορά των επιπέδων ενός αριθμού υπολειμμάτων πρέπει να είναι ίδια για όλες τις τιμές Χ(ιδιοκτησία ομοσκεδαστικότητα).Εάν δεν πληρούται αυτή η προϋπόθεση, τότε ετεροσκεδαστικότητα .

Για να εκτιμήσετε την ετεροσκεδαστικότητα με ένα μικρό μέγεθος δείγματος, μπορείτε να χρησιμοποιήσετε Μέθοδος Goldfeld-Quandt, η ουσία του οποίου είναι ότι είναι απαραίτητο:

Τακτοποίηση μεταβλητών τιμών Χμε αύξουσα σειρά?

Διαχωρίστε το σύνολο των διατεταγμένων παρατηρήσεων σε δύο ομάδες.

Για κάθε ομάδα παρατηρήσεων, κατασκευάστε εξισώσεις παλινδρόμησης.

Προσδιορίστε τα υπολειπόμενα αθροίσματα τετραγώνων για την πρώτη και τη δεύτερη ομάδα χρησιμοποιώντας τους τύπους: ; , Οπου

n 1 - αριθμός παρατηρήσεων στην πρώτη ομάδα.

n 2 - αριθμός παρατηρήσεων στη δεύτερη ομάδα.

Υπολογίστε το κριτήριο ή (ο αριθμητής πρέπει να περιέχει μεγάλο άθροισμα τετραγώνων). Κάνοντας μηδενική υπόθεσησχετικά με την ομοσκεδαστικότητα, το κριτήριο υπολογισμού F θα ικανοποιεί το κριτήριο F με βαθμούς ελευθερίας γ 1 =n 1 -m, γ 2 =n - n 1 - m) για κάθε υπολειπόμενο ποσότετράγωνα (όπου μ αριθμός εκτιμώμενων παραμέτρων στην εξίσωση παλινδρόμησης). Όσο περισσότερο η υπολογιζόμενη τιμή F υπερβαίνει την τιμή του πίνακα του κριτηρίου F, τόσο περισσότερο παραβιάζεται η προϋπόθεση της ισότητας των διακυμάνσεων των υπολειμματικών τιμών.

Η ανεξαρτησία της αλληλουχίας των υπολειμμάτων (έλλειψη αυτοσυσχέτισης) ελέγχεται χρησιμοποιώντας το Durbin-Watson d-test. Καθορίζεται από τον τύπο:

Η υπολογισμένη τιμή του κριτηρίου συγκρίνεται με τις χαμηλότερες d1 και ανώτερες d2 κρίσιμες τιμές των στατιστικών Durbin-Watson. Είναι δυνατές οι ακόλουθες περιπτώσεις:

1) αν δ< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

2) αν δ 1 < ρε < d 2 (συμπεριλαμβανομένων αυτών των τιμών), τότε θεωρείται ότι δεν υπάρχουν επαρκείς λόγοι για να εξαχθεί ένα ή άλλο συμπέρασμα. Απαραίτητο για χρήση πρόσθετο κριτήριο, για παράδειγμα ο πρώτος συντελεστής αυτοσυσχέτισης:

Εάν η υπολογισμένη τιμή του συντελεστή στο συντελεστή είναι μικρότερη από την πινακοποιημένη τιμή r 1cr, τότε γίνεται αποδεκτή η υπόθεση της απουσίας αυτοσυσχέτισης. Διαφορετικά αυτή η υπόθεση απορρίπτεται.

3) αν δ 2 < ρε < 2, τότε η υπόθεση για την ανεξαρτησία των υπολειμμάτων γίνεται αποδεκτή και το μοντέλο αναγνωρίζεται ως επαρκές σύμφωνα με αυτό το κριτήριο.

4) αν d> 2, τότε αυτό δείχνει αρνητική αυτοσυσχέτισηαποφάγια Σε αυτήν την περίπτωση, η υπολογισμένη τιμή του κριτηρίου πρέπει να μετατραπεί χρησιμοποιώντας τον τύπο d′= 4 - d και να συγκριθεί με την κρίσιμη τιμή d′ , όχι δ.

Έλεγχος της συνέπειας της κατανομής της υπολειπόμενης ακολουθίας κανονικός νόμοςοι κατανομές μπορούν να πραγματοποιηθούν χρησιμοποιώντας το κριτήριο R/S, το οποίο καθορίζεται από τον τύπο:

όπου S ε είναι η τυπική απόκλιση των υπολειμμάτων του μοντέλου (τυπικό σφάλμα). Η υπολογισμένη τιμή του κριτηρίου R/S συγκρίνεται με τιμές πίνακα(κάτω και άνω όρια αυτή η σχέση), και εάν η τιμή δεν εμπίπτει στο διάστημα μεταξύ των κρίσιμων ορίων, τότε με ένα δεδομένο επίπεδο σημασίας απορρίπτεται η υπόθεση για την κανονικότητα της κατανομής. διαφορετικά η υπόθεση γίνεται αποδεκτή

Για την αξιολόγηση της ποιότητας των μοντέλων παλινδρόμησης, συνιστάται επίσης η χρήση δείκτης συσχέτισης(πολλαπλός συντελεστής συσχέτισης).

Τύπος για τον προσδιορισμό του δείκτη συσχέτισης

Οπου

Το συνολικό άθροισμα των τετραγωνικών αποκλίσεων μιας εξαρτημένης μεταβλητής από τον μέσο όρο της. Καθορίζεται από τον τύπο:

Το άθροισμα των τετραγωνικών αποκλίσεων που εξηγείται από την παλινδρόμηση. Καθορίζεται από τον τύπο:

Υπολειπόμενο άθροισμα τετραγωνικών αποκλίσεων. Υπολογίζεται με τον τύπο:

Η εξίσωση μπορεί να αναπαρασταθεί ως εξής:

Ο δείκτης συσχέτισης παίρνει μια τιμή από 0 έως 1. Όσο υψηλότερη είναι η τιμή του δείκτη, τόσο πιο κοντά στις πραγματικές είναι οι υπολογισμένες τιμές του προκύπτοντος χαρακτηριστικού. Ο δείκτης συσχέτισης χρησιμοποιείται για οποιαδήποτε μορφή σύνδεσης μεταξύ μεταβλητών. με ζευγαρωτή γραμμική παλινδρόμηση ισούται με συντελεστής ζεύγουςσυσχετίσεις.

Ως μέτρο της ακρίβειας του μοντέλου, χρησιμοποιούνται χαρακτηριστικά ακρίβειας: Για να προσδιορίσετε το μέτρο ακρίβειας μοντέλου, υπολογίστε:

- μέγιστο σφάλμα- αντιστοιχεί στην απόκλιση της υπολογισμένης απόκλισης των υπολογισμένων τιμών από τις πραγματικές

- μέση τιμή απόλυτο λάθος - το σφάλμα δείχνει πόσο κατά μέσο όρο αποκλίνουν οι πραγματικές τιμές από το μοντέλο

- διακύμανση της σειράς υπολειμμάτων(υπολειπόμενη διακύμανση)

όπου είναι η μέση τιμή μιας σειράς υπολειμμάτων. Καθορίζεται από τον τύπο

- μέση τιμή τετράγωνο σφάλμα . Αντιπροσωπεύει την τετραγωνική ρίζα της διακύμανσης: , πως μικρότερη αξίαλάθη, τόσο πιο ακριβές είναι το μοντέλο

- μέση τιμή σχετικό σφάλμαπροσεγγίσεις.

Το μέσο σφάλμα προσέγγισης δεν πρέπει να υπερβαίνει το 8-10%.

Εάν το μοντέλο παλινδρόμησης θεωρείται επαρκές και οι παράμετροι του μοντέλου είναι σημαντικές, τότε προχωρήστε στην κατασκευή μιας πρόβλεψης .

Προβλεπόμενη τιμήμεταβλητός στοπροκύπτει αντικαθιστώντας την αναμενόμενη τιμή της ανεξάρτητης μεταβλητής στην εξίσωση παλινδρόμησης Χ progn.

Αυτή η πρόβλεψη ονομάζεται κατά σημείο.Η πιθανότητα να πραγματοποιηθεί μια πρόβλεψη σημείου είναι πρακτικά μηδενική, επομένως το διάστημα εμπιστοσύνης της πρόβλεψης υπολογίζεται με μεγάλη αξιοπιστία.

Διαστήματα εμπιστοσύνηςΟι προβλέψεις εξαρτώνται από το τυπικό σφάλμα, αφαίρεση Χτρέχει από τη μέση τιμή του , αριθμός παρατηρήσεων nκαι το επίπεδο σημαντικότητας της πρόβλεψης α. Τα διαστήματα εμπιστοσύνης προβλέψεων υπολογίζονται χρησιμοποιώντας τον τύπο: ή

Οπου

tπίνακας - προσδιορίζεται από τον πίνακα κατανομής Student για το επίπεδο σημαντικότητας α και τον αριθμό των βαθμών ελευθερίας γ=n-k-1.

Παράδειγμα 13.

Σύμφωνα με έρευνα οκτώ ομάδων οικογενειών, είναι γνωστά στοιχεία για τη σχέση μεταξύ των δαπανών του πληθυσμού για τρόφιμα και του οικογενειακού εισοδήματος (Πίνακας 36).

Πίνακας 36 - Σχέσεις μεταξύ των δαπανών του πληθυσμού για τρόφιμα και επίπεδα οικογενειακού εισοδήματος

Έξοδα για φαγητό, χιλιάδες ρούβλια. 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
Οικογενειακό εισόδημα, χιλιάδες ρούβλια. 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

Ας υποθέσουμε ότι η σχέση μεταξύ του οικογενειακού εισοδήματος και των δαπανών διατροφής είναι γραμμική. Για να επιβεβαιώσουμε την υπόθεσή μας, θα κατασκευάσουμε ένα πεδίο συσχέτισης (Εικόνα 8).

Το γράφημα δείχνει ότι τα σημεία ευθυγραμμίζονται σε μια συγκεκριμένη ευθεία γραμμή.

Για τη διευκόλυνση των περαιτέρω υπολογισμών, θα καταρτίσουμε τον Πίνακα 37.

Ας υπολογίσουμε τις παραμέτρους της γραμμικής εξίσωσης παλινδρόμησης ζεύγους . Για να το κάνουμε αυτό, χρησιμοποιούμε τους τύπους:

Εικόνα 8 - Πεδίο συσχέτισης.

Πήραμε την εξίσωση:

Εκείνοι. με αύξηση του οικογενειακού εισοδήματος κατά 1000 ρούβλια. τα έξοδα διατροφής αυξάνονται κατά 168 ρούβλια.

Υπολογισμός γραμμικού συντελεστή συσχέτισης.

100 RURμπόνους για πρώτη παραγγελία

Επιλέξτε τύπο εργασίας Μεταπτυχιακή εργασία Εργασία μαθήματοςΠερίληψη Μεταπτυχιακή Διατριβή Έκθεση για την πρακτική Ανασκόπηση Αναφοράς άρθρου ΔοκιμήΜονογραφία Επίλυση προβλημάτων Επιχειρηματικού Σχεδίου Απαντήσεις σε Ερωτήσεις Δημιουργική εργασίαΔοκίμιο Σχέδιο Εργασίες Μετάφραση Παρουσιάσεις Δακτυλογράφηση Άλλο Αύξηση της μοναδικότητας του κειμένου Μεταπτυχιακή εργασία Εργαστηριακές εργασίεςΔιαδικτυακή βοήθεια

Μάθετε την τιμή

Η ζευγαρωμένη παλινδρόμηση είναι η εξίσωση της σχέσης μεταξύ δύο μεταβλητών

y και x Vida y= φά(Χ),

όπου y είναι η εξαρτημένη μεταβλητή (αποτελεσματικό χαρακτηριστικό).

Το x είναι μια ανεξάρτητη επεξηγηματική μεταβλητή (χαρακτηριστικό-συντελεστής).

Υπάρχουν γραμμικές και μη γραμμικές παλινδρομήσεις.

Μέθοδος ελαχίστων τετραγώνων

Για την εκτίμηση των παραμέτρων των παλινδρομήσεων που είναι γραμμικές σε αυτές τις παραμέτρους, χρησιμοποιείται η μέθοδος των ελαχίστων τετραγώνων (OLS). . Η μέθοδος των ελαχίστων τετραγώνων μας επιτρέπει να λάβουμε τέτοιες εκτιμήσεις παραμέτρων στις οποίες το άθροισμα των τετραγωνικών αποκλίσεων των πραγματικών τιμών του προκύπτοντος χαρακτηριστικού y από τις θεωρητικές τιμές ŷ Χστις ίδιες τιμές συντελεστών Χείναι ελάχιστη, δηλ.

5. Εκτίμηση της στατιστικής σημασίας των δεικτών συσχέτισης, των παραμέτρων της εξίσωσης ζευγαρωμένης γραμμικής παλινδρόμησης και της εξίσωσης παλινδρόμησης στο σύνολό της.

6. Εκτίμηση του βαθμού εγγύτητας της σχέσης μεταξύ ποσοτικών μεταβλητών. Συντελεστής συνδιακύμανσης. Δείκτες συσχέτισης: γραμμικός συντελεστής συσχέτισης, δείκτης συσχέτισης (= θεωρητικός λόγος συσχέτισης).

Συντελεστής συνδιακύμανσης

Mch(y) - Δηλαδή. λαμβάνουμε μια εξάρτηση συσχέτισης.

Η παρουσία συσχέτισης δεν μπορεί να απαντήσει στην ερώτηση σχετικά με την αιτία της σύνδεσης. Η συσχέτιση καθορίζει μόνο το μέτρο αυτής της σύνδεσης, δηλ. ένα μέτρο σταθερής διακύμανσης.

Το μέτρο της σχέσης μεταξύ δύο μεταβλητών μπορεί να βρεθεί χρησιμοποιώντας τη συνδιακύμανση.

, ,

Το μέγεθος του δείκτη συνδιακύμανσης εξαρτάται από τις μονάδες σε γ της μεταβλητής που μετράται. Επομένως, για να εκτιμηθεί ο βαθμός σταθερής διακύμανσης, χρησιμοποιείται ο συντελεστής συσχέτισης - ένα αδιάστατο χαρακτηριστικό που έχει ορισμένα όρια διακύμανσης.

7. Συντελεστής προσδιορισμού. Τυπικό σφάλμα της εξίσωσης παλινδρόμησης.

Συντελεστής προσδιορισμού (rxy2) - χαρακτηρίζει το μερίδιο της διακύμανσης του προκύπτοντος χαρακτηριστικού y, που εξηγείται από τη διακύμανση, στη συνολική διακύμανση του προκύπτοντος χαρακτηριστικού. Όσο πιο κοντά είναι το rxy2 στο 1, τόσο καλύτερη είναι η ποιότητα μοντέλο παλινδρόμησης, δηλαδή, το αρχικό μοντέλο προσεγγίζει καλά τα αρχικά δεδομένα.

8. Εκτίμηση της στατιστικής σημασίας των δεικτών διόρθωσης, των παραμέτρων της εξίσωσης ζευγαρωμένης γραμμικής παλινδρόμησης και της εξίσωσης παλινδρόμησης στο σύνολό της: t- Τεστ μαθητή, φά-Κριτήριο Fisher.

9. Μη γραμμικά μοντέλαπαλινδρομήσεις και η γραμμικοποίησή τους.

Οι μη γραμμικές παλινδρομήσεις χωρίζονται σε δύο κατηγορίες : παλινδρομήσεις που είναι μη γραμμικές ως προς τις επεξηγηματικές μεταβλητές που εξαιρούνται από την ανάλυση, αλλά γραμμικές ως προς τις εκτιμώμενες παραμέτρους και παλινδρομήσεις που είναι μη γραμμικές ως προς τις εκτιμώμενες παραμέτρους.

Παραδείγματα παλινδρόμησης, μη γραμμικό στις επεξηγηματικές μεταβλητές, αλλά γραμμικό στις εκτιμώμενες παραμέτρους:


Μοντέλα μη γραμμικής παλινδρόμησης και γραμμικοποίησή τους

Με μια μη γραμμική εξάρτηση των χαρακτηριστικών, η οποία οδηγεί σε γραμμική μορφή, επιλογές πολλαπλή παλινδρόμησηκαθορίζονται επίσης με τη μέθοδο των ελαχίστων τετραγώνων με τη μόνη διαφορά ότι δεν χρησιμοποιείται γενικές πληροφορίες, αλλά στα μετασχηματισμένα δεδομένα. Έτσι, λαμβάνοντας υπόψη τη συνάρτηση ισχύος

,

το μετατρέπουμε σε γραμμική μορφή:

όπου οι μεταβλητές εκφράζονται σε λογάριθμους.

Επιπλέον, η επεξεργασία LSM είναι η ίδια: κατασκευάζεται ένα σύστημα κανονικών εξισώσεων και προσδιορίζονται άγνωστες παράμετροι. Ενισχύοντας την τιμή, βρίσκουμε την παράμετρο ένακαι αντίστοιχα γενική μορφήεξισώσεις συνάρτησης ισχύος.

Γενικά, η μη γραμμική παλινδρόμηση σε σχέση με τις συμπεριλαμβανόμενες μεταβλητές δεν δημιουργεί δυσκολίες στην εκτίμηση των παραμέτρων της. Αυτή η εκτίμηση προσδιορίζεται, όπως και στη γραμμική παλινδρόμηση, από το OLS. Έτσι, στην εξίσωση μη γραμμικής παλινδρόμησης δύο παραγόντων

Η γραμμικοποίηση μπορεί να πραγματοποιηθεί με την εισαγωγή νέων μεταβλητών σε αυτό . Το αποτέλεσμα είναι μια εξίσωση γραμμικής παλινδρόμησης τεσσάρων παραγόντων

10.Πολυσυγγραμμικότητα. Μέθοδοι για την εξάλειψη της πολυσυγγραμμικότητας.

Οι μεγαλύτερες δυσκολίες στη χρήση της συσκευής πολλαπλής παλινδρόμησης προκύπτουν με την παρουσία πολυσυγγραμμικότητας παραγόντων, όταν περισσότεροι από δύο παράγοντες συνδέονται μεταξύ τους γραμμική εξάρτηση . Η παρουσία πολυσυγγραμμικότητας μεταξύ των παραγόντων μπορεί να σημαίνει ότι ορισμένοι παράγοντες θα ενεργούν πάντα από κοινού. Ως αποτέλεσμα, η διακύμανση στα δεδομένα εισόδου δεν είναι πλέον εντελώς ανεξάρτητη και ο αντίκτυπος κάθε παράγοντα δεν μπορεί να αξιολογηθεί χωριστά.

Όσο ισχυρότερη είναι η πολυσυγγραμμικότητα των παραγόντων, τόσο λιγότερο αξιόπιστη είναι η εκτίμηση της κατανομής του ποσού της εξηγούμενης διακύμανσης μεταξύ των επιμέρους παραγόντων χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (OLS).

Η συμπερίληψη πολυσυγγραμμικών παραγόντων στο μοντέλο είναι ανεπιθύμητη για τους ακόλουθους λόγους:

ü είναι δύσκολο να ερμηνευτούν οι παράμετροι πολλαπλής παλινδρόμησης. οι παράμετροι γραμμικής παλινδρόμησης χάνουν οικονομική αίσθηση;

ü οι εκτιμήσεις παραμέτρων είναι αναξιόπιστες, παρουσιάζουν μεγάλα τυπικά σφάλματα και αλλάζουν με τις αλλαγές στον όγκο των παρατηρήσεων, γεγονός που καθιστά το μοντέλο ακατάλληλο για ανάλυση και πρόβλεψη

Μέθοδοι για την εξάλειψη της πολυσυγγραμμικότητας

- εξαίρεση μεταβλητών από το μοντέλο.

Ωστόσο, απαιτείται κάποια προσοχή κατά τη χρήση αυτή τη μέθοδο. Σε αυτήν την περίπτωση, είναι πιθανά σφάλματα προδιαγραφών.

- λήψη πρόσθετων δεδομένων ή κατασκευή νέου δείγματος.

Μερικές φορές, για να μειωθεί η πολυσυγγραμμικότητα, αρκεί να αυξηθεί το μέγεθος του δείγματος. Για παράδειγμα, εάν χρησιμοποιείτε ετήσια δεδομένα, μπορείτε να μεταβείτε σε τριμηνιαία δεδομένα. Η αύξηση του όγκου των δεδομένων μειώνει τη διακύμανση των συντελεστών παλινδρόμησης και ως εκ τούτου τους αυξάνει στατιστική σημασία. Ωστόσο, η απόκτηση ενός νέου δείγματος ή η επέκταση ενός παλιού δεν είναι πάντα δυνατή ή συνδέεται με σοβαρό κόστος. Επιπλέον, αυτή η προσέγγιση μπορεί να αυξηθεί

αυτοσυσχέτιση.

- αλλαγή στις προδιαγραφές του μοντέλου.

Σε ορισμένες περιπτώσεις, το πρόβλημα της πολυσυγγραμμικότητας μπορεί να λυθεί αλλάζοντας τις προδιαγραφές του μοντέλου: είτε αλλάζοντας τη μορφή του μοντέλου είτε προσθέτοντας νέες επεξηγηματικές μεταβλητές που δεν ελήφθησαν υπόψη στο μοντέλο.

- χρήση προκαταρκτικών πληροφοριών σχετικά με ορισμένες παραμέτρους.

11.Κλασσικό γραμμικό μοντέλο πολλαπλής παλινδρόμησης (CLMMR). Προσδιορισμός των παραμέτρων του επιπέδου πολλαπλής εγγραφής με τη μέθοδο των ελαχίστων τετραγώνων.