Βιογραφίες Χαρακτηριστικά Ανάλυση

Σύμφωνα με τη μέθοδο των ελαχίστων τετραγώνων, η ακόλουθη έκφραση ελαχιστοποιείται. Εύρεση παραμέτρων γραμμής παλινδρόμησης

Ας προσεγγίσουμε τη συνάρτηση με ένα πολυώνυμο βαθμού 2. Για να γίνει αυτό, υπολογίζουμε τους συντελεστές του κανονικού συστήματος εξισώσεων:

, ,

Ας δημιουργήσουμε ένα κανονικό σύστημα ελάχιστα τετράγωνα, που μοιάζει με:

Η λύση στο σύστημα είναι εύκολο να βρεθεί:, , .

Βρίσκεται λοιπόν πολυώνυμο 2ου βαθμού: .

Θεωρητικές πληροφορίες

Επιστροφή στη σελίδα<Введение в вычислительную математику. Примеры>

Παράδειγμα 2. Εύρεση του βέλτιστου βαθμού ενός πολυωνύμου.

Επιστροφή στη σελίδα<Введение в вычислительную математику. Примеры>

Παράδειγμα 3. Παραγωγή κανονικού συστήματος εξισώσεων για την εύρεση των παραμέτρων της εμπειρικής εξάρτησης.

Ας εξαγάγουμε ένα σύστημα εξισώσεων για τον προσδιορισμό των συντελεστών και των συναρτήσεων , το οποίο εκτελεί την προσέγγιση ρίζας-μέσος-τετράγωνο δεδομένη λειτουργίακατά πόντους. Ας συνθέσουμε μια συνάρτηση και να της το γράψεις απαραίτητη προϋπόθεσηακραίο:

Επειτα κανονικό σύστημαθα λάβει τη μορφή:

Πήρα γραμμικό σύστημαεξισώσεις για άγνωστες παραμέτρους και, που λύνεται εύκολα.

Θεωρητικές πληροφορίες

Επιστροφή στη σελίδα<Введение в вычислительную математику. Примеры>

Παράδειγμα.

Πειραματικά δεδομένα για τις τιμές των μεταβλητών ΧΚαι στοδίνονται στον πίνακα.

Ως αποτέλεσμα της ευθυγράμμισής τους, προκύπτει η συνάρτηση

Χρησιμοποιώντας μέθοδος ελάχιστου τετραγώνου, προσεγγίστε αυτά τα δεδομένα με μια γραμμική εξάρτηση y=ax+b(βρες παραμέτρους ΕΝΑΚαι σι). Μάθετε ποια από τις δύο γραμμές (με την έννοια της μεθόδου των ελαχίστων τετραγώνων) ευθυγραμμίζει καλύτερα τα πειραματικά δεδομένα. Κάντε ένα σχέδιο.

Η ουσία της μεθόδου των ελαχίστων τετραγώνων (LSM).

Το καθήκον είναι να βρούμε τους συντελεστές γραμμική εξάρτηση, για το οποίο η συνάρτηση δύο μεταβλητών ΕΝΑΚαι σιδέχεται μικρότερη τιμή. Δοσμένο δηλαδή ΕΝΑΚαι σιτο άθροισμα των τετραγωνικών αποκλίσεων των πειραματικών δεδομένων από την ευθεία που βρέθηκε θα είναι το μικρότερο. Αυτό είναι το όλο νόημα της μεθόδου των ελαχίστων τετραγώνων.

Έτσι, η επίλυση του παραδείγματος καταλήγει στην εύρεση του άκρου μιας συνάρτησης δύο μεταβλητών.

Εξαγωγή τύπων εύρεσης συντελεστών.

Καταρτίζεται και λύνεται ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Εύρεση των μερικών παραγώγων μιας συνάρτησης κατά μεταβλητές ΕΝΑΚαι σι, εξισώνουμε αυτές τις παραγώγους με μηδέν.

Επιλύουμε το προκύπτον σύστημα εξισώσεων χρησιμοποιώντας οποιαδήποτε μέθοδο (για παράδειγμα με μέθοδο αντικατάστασηςή τη μέθοδο Cramer) και λάβετε τύπους για την εύρεση συντελεστών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (LSM).

Δεδομένος ΕΝΑΚαι σιλειτουργία παίρνει τη μικρότερη τιμή. Η απόδειξη αυτού του γεγονότος δίνεται παρακάτω στο κείμενο στο τέλος της σελίδας.

Αυτή είναι η όλη μέθοδος των ελαχίστων τετραγώνων. Τύπος για την εύρεση της παραμέτρου έναπεριέχει τα αθροίσματα , , και την παράμετρο n— ποσότητα πειραματικών δεδομένων. Συνιστούμε τον υπολογισμό των τιμών αυτών των ποσών χωριστά.

Συντελεστής σιβρέθηκε μετά τον υπολογισμό ένα.

Ήρθε η ώρα να θυμηθούμε το αρχικό παράδειγμα.

Λύση.

Στο παράδειγμά μας n=5. Συμπληρώνουμε τον πίνακα για ευκολία στον υπολογισμό των ποσών που περιλαμβάνονται στους τύπους των απαιτούμενων συντελεστών.

Οι τιμές στην τέταρτη σειρά του πίνακα λαμβάνονται πολλαπλασιάζοντας τις τιμές της 2ης σειράς με τις τιμές της 3ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές στην πέμπτη σειρά του πίνακα λαμβάνονται με τον τετραγωνισμό των τιμών στη 2η σειρά για κάθε αριθμό Εγώ.

Οι τιμές στην τελευταία στήλη του πίνακα είναι τα αθροίσματα των τιμών στις σειρές.

Χρησιμοποιούμε τους τύπους της μεθόδου των ελαχίστων τετραγώνων για να βρούμε τους συντελεστές ΕΝΑΚαι σι. Αντικαθιστούμε τις αντίστοιχες τιμές από την τελευταία στήλη του πίνακα σε αυτές:

Ως εκ τούτου, y = 0,165x+2,184— την επιθυμητή κατά προσέγγιση ευθεία γραμμή.

Μένει να μάθουμε ποια από τις γραμμές y = 0,165x+2,184ή προσεγγίζει καλύτερα τα αρχικά δεδομένα, δηλαδή κάνει μια εκτίμηση χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Εκτίμηση σφάλματος της μεθόδου των ελαχίστων τετραγώνων.

Για να γίνει αυτό, πρέπει να υπολογίσετε το άθροισμα των τετραγωνικών αποκλίσεων των αρχικών δεδομένων από αυτές τις γραμμές Και , μια μικρότερη τιμή αντιστοιχεί σε μια γραμμή που προσεγγίζει καλύτερα τα αρχικά δεδομένα με την έννοια της μεθόδου των ελαχίστων τετραγώνων.

Από τότε κατευθείαν y = 0,165x+2,184προσεγγίζει καλύτερα τα αρχικά δεδομένα.

Γραφική απεικόνιση της μεθόδου των ελαχίστων τετραγώνων (LS).

Τα πάντα είναι ορατά στα γραφήματα. Η κόκκινη γραμμή είναι η ευθεία που βρέθηκε y = 0,165x+2,184, η μπλε γραμμή είναι , οι ροζ κουκκίδες είναι τα αρχικά δεδομένα.

Γιατί χρειάζεται αυτό, γιατί όλες αυτές οι προσεγγίσεις;

Προσωπικά το χρησιμοποιώ για την επίλυση προβλημάτων εξομάλυνσης δεδομένων, παρεμβολής και προβλημάτων παρέκτασης (στο αρχικό παράδειγμα μπορεί να τους ζητηθεί να βρουν την τιμή μιας παρατηρούμενης τιμής yστο x=3ή πότε x=6χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων). Αλλά θα μιλήσουμε περισσότερα για αυτό αργότερα σε άλλη ενότητα του ιστότοπου.

Αρχή σελίδας

Απόδειξη.

Έτσι όταν βρεθεί ΕΝΑΚαι σιη συνάρτηση παίρνει τη μικρότερη τιμή, είναι απαραίτητο σε αυτό το σημείο ο πίνακας της τετραγωνικής μορφής του διαφορικού δεύτερης τάξης για τη συνάρτηση ήταν θετική οριστική. Ας το δείξουμε.

Η διαφορά δεύτερης τάξης έχει τη μορφή:

Αυτό είναι

Επομένως, ο πίνακας της τετραγωνικής μορφής έχει τη μορφή

και οι τιμές των στοιχείων δεν εξαρτώνται από ΕΝΑΚαι σι.

Ας δείξουμε ότι ο πίνακας είναι θετικός ορισμένος. Για να γίνει αυτό, τα γωνιακά ανήλικα πρέπει να είναι θετικά.

Γωνιακό μινόρε πρώτης τάξης . Η ανισότητα είναι αυστηρή γιατί τα σημεία δεν συμπίπτουν. Σε όσα ακολουθούν θα το υπονοήσουμε αυτό.

Γωνιακό ελάσσονα δεύτερης τάξης

Ας το αποδείξουμε με τη μέθοδο της μαθηματικής επαγωγής.

συμπέρασμα: βρέθηκαν τιμές ΕΝΑΚαι σιαντιστοιχούν στη μικρότερη τιμή της συνάρτησης , επομένως, είναι οι απαιτούμενες παράμετροι για τη μέθοδο των ελαχίστων τετραγώνων.

Δεν υπάρχει χρόνος να το καταλάβω;
Παραγγείλετε μια λύση

Αρχή σελίδας

Ανάπτυξη πρόβλεψης με τη μέθοδο των ελαχίστων τετραγώνων. Παράδειγμα λύσης προβλήματος

Παρέκταση είναι μέθοδος επιστημονική έρευνα, το οποίο βασίζεται στη διάδοση των τάσεων του παρελθόντος και του παρόντος, των προτύπων, των συνδέσεων με τη μελλοντική ανάπτυξη του αντικειμένου πρόβλεψης. Οι μέθοδοι παρέκτασης περιλαμβάνουν μέθοδος κινούμενος μέσος όρος, μέθοδος εκθετική εξομάλυνση, μέθοδος ελάχιστου τετραγώνου.

Ουσία μέθοδος ελαχίστων τετραγώνων συνίσταται στην ελαχιστοποίηση του ποσού τετραγωνικές αποκλίσειςμεταξύ των παρατηρούμενων και των υπολογισμένων τιμών. Οι υπολογισμένες τιμές βρίσκονται χρησιμοποιώντας την επιλεγμένη εξίσωση - την εξίσωση παλινδρόμησης. Όσο μικρότερη είναι η απόσταση μεταξύ των πραγματικών τιμών και των υπολογισμένων, τόσο πιο ακριβής είναι η πρόβλεψη με βάση την εξίσωση παλινδρόμησης.

Μια θεωρητική ανάλυση της ουσίας του φαινομένου που μελετάται, η αλλαγή στο οποίο αντανακλάται από μια χρονοσειρά, χρησιμεύει ως βάση για την επιλογή μιας καμπύλης. Μερικές φορές λαμβάνονται υπόψη σκέψεις σχετικά με τη φύση της αύξησης των επιπέδων της σειράς. Έτσι, εάν αναμένεται αύξηση της παραγωγής σε αριθμητική πρόοδος, τότε η εξομάλυνση πραγματοποιείται σε ευθεία γραμμή. Αν αποδειχθεί ότι η ανάπτυξη είναι σε γεωμετρική πρόοδος, τότε η εξομάλυνση πρέπει να γίνει χρησιμοποιώντας μια εκθετική συνάρτηση.

Τύπος εργασίας για τη μέθοδο των ελαχίστων τετραγώνων : Y t+1 = a*X + b, όπου t + 1 – περίοδος πρόβλεψης. Уt+1 – προβλεπόμενος δείκτης. Τα α και β είναι συντελεστές. Χ - σύμβολοχρόνος.

Ο υπολογισμός των συντελεστών a και b πραγματοποιείται χρησιμοποιώντας τους ακόλουθους τύπους:

όπου, Uf – πραγματικές τιμές της σειράς δυναμικής. n – αριθμός επιπέδων χρονοσειρών.

Η εξομάλυνση χρονοσειρών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων χρησιμεύει για να αντικατοπτρίζει το πρότυπο ανάπτυξης του φαινομένου που μελετάται. Στην αναλυτική έκφραση μιας τάσης, ο χρόνος θεωρείται ως ανεξάρτητη μεταβλητή και τα επίπεδα της σειράς ενεργούν ως συνάρτηση αυτής της ανεξάρτητης μεταβλητής.

Η εξέλιξη ενός φαινομένου δεν εξαρτάται από το πόσα χρόνια έχουν περάσει από την αφετηρία, αλλά από το ποιοι παράγοντες επηρέασαν την εξέλιξή του, προς ποια κατεύθυνση και με ποια ένταση. Από εδώ είναι σαφές ότι η εξέλιξη ενός φαινομένου με την πάροδο του χρόνου είναι αποτέλεσμα της δράσης αυτών των παραγόντων.

Καθορίζοντας σωστά τον τύπο της καμπύλης, ο τύπος της αναλυτικής εξάρτησης από το χρόνο είναι ένας από τους πιο σύνθετες εργασίεςανάλυση προ προβλέψεων .

Η επιλογή του τύπου της συνάρτησης που περιγράφει την τάση, οι παράμετροι της οποίας καθορίζονται με τη μέθοδο των ελαχίστων τετραγώνων, πραγματοποιείται στις περισσότερες περιπτώσεις εμπειρικά, με την κατασκευή ενός αριθμού συναρτήσεων και τη σύγκριση μεταξύ τους σύμφωνα με την τιμή του μέσο τετραγωνικό σφάλμα, που υπολογίζεται με τον τύπο:

όπου UV είναι οι πραγματικές τιμές της σειράς δυναμικής. Ur – υπολογισμένες (εξομαλυνόμενες) τιμές της σειράς δυναμικής. n – αριθμός επιπέδων χρονοσειρών. p – ο αριθμός των παραμέτρων που ορίζονται σε τύπους που περιγράφουν την τάση (τάση ανάπτυξης).

Μειονεκτήματα της μεθόδου των ελαχίστων τετραγώνων :

  • όταν προσπαθεί να περιγράψει το οικονομικό φαινόμενο που μελετάται χρησιμοποιώντας μαθηματική εξίσωση, η πρόβλεψη θα είναι ακριβής για σύντομο χρονικό διάστημα και η εξίσωση παλινδρόμησης θα πρέπει να υπολογιστεί εκ νέου καθώς θα είναι διαθέσιμες νέες πληροφορίες.
  • την πολυπλοκότητα της επιλογής μιας εξίσωσης παλινδρόμησης που είναι επιλύσιμη χρησιμοποιώντας τυπικά προγράμματα υπολογιστή.

Ένα παράδειγμα χρήσης της μεθόδου των ελαχίστων τετραγώνων για την ανάπτυξη μιας πρόβλεψης

Εργο . Υπάρχουν στοιχεία που χαρακτηρίζουν το ποσοστό ανεργίας στην περιοχή, %

  • Κατασκευάστε μια πρόβλεψη του ποσοστού ανεργίας στην περιοχή για τον Νοέμβριο, τον Δεκέμβριο, τον Ιανουάριο χρησιμοποιώντας τις ακόλουθες μεθόδους: κινούμενος μέσος όρος, εκθετική εξομάλυνση, ελάχιστα τετράγωνα.
  • Υπολογίστε τα σφάλματα στις προκύπτουσες προβλέψεις χρησιμοποιώντας κάθε μέθοδο.
  • Συγκρίνετε τα αποτελέσματα και βγάλτε συμπεράσματα.

Λύση ελαχίστων τετραγώνων

Για να το λύσουμε αυτό, θα συντάξουμε έναν πίνακα στον οποίο θα κάνουμε τους απαραίτητους υπολογισμούς:

ε = 28,63/10 = 2,86% ακρίβεια πρόβλεψηςυψηλός.

συμπέρασμα : Σύγκριση των αποτελεσμάτων που προέκυψαν από τους υπολογισμούς μέθοδος κινούμενου μέσου όρου , μέθοδος εκθετικής εξομάλυνσης και χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, μπορούμε να πούμε ότι ο μέσος όρος σχετικό σφάλμαόταν υπολογίζεται με τη μέθοδο της εκθετικής εξομάλυνσης, εμπίπτει στο εύρος του 20-50%. Αυτό σημαίνει ότι η ακρίβεια της πρόβλεψης είναι σε αυτήν την περίπτωσηείναι μόνο ικανοποιητική.

Στην πρώτη και στην τρίτη περίπτωση, η ακρίβεια πρόβλεψης είναι υψηλή, αφού το μέσο σχετικό σφάλμα είναι μικρότερο από 10%. Αλλά η μέθοδος του κινούμενου μέσου όρου κατέστησε δυνατή την απόκτηση πιο αξιόπιστων αποτελεσμάτων (πρόβλεψη Νοεμβρίου - 1,52%, πρόβλεψη Δεκεμβρίου - 1,53%, πρόβλεψη Ιανουαρίου - 1,49%), καθώς το μέσο σχετικό σφάλμα κατά τη χρήση αυτής της μεθόδου είναι το μικρότερο - 1 ,13%.

Μέθοδος ελάχιστου τετραγώνου

Άλλα άρθρα σχετικά με αυτό το θέμα:

Κατάλογος πηγών που χρησιμοποιήθηκαν

  1. Επιστημονικές και μεθοδολογικές συστάσεις για τη διάγνωση κοινωνικών κινδύνων και την πρόβλεψη προκλήσεων, απειλών και κοινωνικές συνέπειες. Ρωσικό κράτος κοινωνικό πανεπιστήμιο. Μόσχα. 2010;
  2. Vladimirova L.P. Πρόβλεψη και προγραμματισμός σε συνθήκες αγοράς: Σχολικό βιβλίο. επίδομα. Μ.: Εκδοτικό οίκο"Dashkov and Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Πρόβλεψη Εθνική οικονομία: Εκπαιδευτικό και μεθοδολογικό εγχειρίδιο. Ekaterinburg: Ural Publishing House. κατάσταση οικον. Univ., 2007;
  4. Slutskin L.N. Μάθημα MBA για επιχειρηματικές προβλέψεις. Μ.: Alpina Business Books, 2006.

Πρόγραμμα MNC

Εισαγάγετε δεδομένα

Δεδομένα και προσέγγιση y = a + b x

Εγώ- αριθμός πειραματικών σημείων.
x i- τιμή μιας σταθερής παραμέτρου σε ένα σημείο Εγώ;
y i- τιμή της μετρούμενης παραμέτρου σε ένα σημείο Εγώ;
ωi- μέτρηση βάρους σε ένα σημείο Εγώ;
y i, υπολογ.- διαφορά μεταξύ μετρούμενης και υπολογιζόμενης τιμής παλινδρόμησης yστο σημείο Εγώ;
S x i (x i)- εκτίμηση σφάλματος x iκατά τη μέτρηση yστο σημείο Εγώ.

Δεδομένα και προσέγγιση y = k x

Εγώ x i y i ωi y i, υπολογ. Δy i S x i (x i)

Κάντε κλικ στο γράφημα

Εγχειρίδιο χρήστη για το διαδικτυακό πρόγραμμα MNC.

Στο πεδίο δεδομένων, εισαγάγετε σε κάθε ξεχωριστή γραμμή τις τιμές των «x» και «y» σε ένα πειραματικό σημείο. Οι τιμές πρέπει να διαχωρίζονται με έναν χαρακτήρα κενού διαστήματος (κενό ή καρτέλα).

Η τρίτη τιμή θα μπορούσε να είναι το βάρος του σημείου «w». Αν το βάρος ενός σημείου δεν προσδιορίζεται, είναι ίσο με ένα. Στη συντριπτική πλειοψηφία των περιπτώσεων, τα βάρη των πειραματικών σημείων είναι άγνωστα ή δεν υπολογίζονται, δηλ. όλα τα πειραματικά δεδομένα θεωρούνται ισοδύναμα. Μερικές φορές τα βάρη στο μελετημένο εύρος τιμών δεν είναι απολύτως ισοδύναμα και μπορούν ακόμη και να υπολογιστούν θεωρητικά. Για παράδειγμα, στη φασματοφωτομετρία, τα βάρη μπορούν να υπολογιστούν χρησιμοποιώντας απλούς τύπους, αν και αυτό συνήθως παραμελείται για τη μείωση του κόστους εργασίας.

Τα δεδομένα μπορούν να επικολληθούν μέσω του πρόχειρου από ένα υπολογιστικό φύλλο σε μια σουίτα γραφείου όπως το Excel από το Microsoft Office ή το Calc από το Open Office. Για το σκοπό αυτό στο υπολογιστικό φύλλοεπισημάνετε το εύρος των δεδομένων προς αντιγραφή, αντιγράψτε στο πρόχειρο και επικολλήστε τα δεδομένα στο πεδίο δεδομένων αυτής της σελίδας.

Για τον υπολογισμό με τη μέθοδο των ελαχίστων τετραγώνων, χρειάζονται τουλάχιστον δύο σημεία για τον προσδιορισμό δύο συντελεστών «b» - την εφαπτομένη της γωνίας κλίσης της ευθείας και «a» - την τιμή που τέμνεται από την ευθεία στον άξονα «y».

Για να υπολογίσετε το σφάλμα των υπολογισμένων συντελεστών παλινδρόμησης, πρέπει να ορίσετε τον αριθμό των πειραματικών σημείων σε περισσότερα από δύο.

Μέθοδος ελαχίστων τετραγώνων (LSM).

Όσο μεγαλύτερος είναι ο αριθμός των πειραματικών σημείων, τόσο πιο ακριβής στατιστική αξιολόγησησυντελεστές (λόγω μείωσης του συντελεστή Student) και όσο περισσότερο η εκτίμηση είναι κοντά στην εκτίμηση του γενικού δείγματος.

Η απόκτηση τιμών σε κάθε πειραματικό σημείο συνδέεται συχνά με σημαντικό εργατικό κόστος, επομένως πραγματοποιείται συχνά ένας συμβιβαστικός αριθμός πειραμάτων που δίνει μια διαχειρίσιμη εκτίμηση και δεν οδηγεί σε υπερβολικό κόστος εργασίας. Κατά κανόνα, ο αριθμός των πειραματικών σημείων για μια εξάρτηση γραμμικών ελαχίστων τετραγώνων με δύο συντελεστές επιλέγεται στην περιοχή 5-7 σημείων.

Μια σύντομη θεωρία των ελάχιστων τετραγώνων για γραμμικές σχέσεις

Ας υποθέσουμε ότι έχουμε ένα σύνολο πειραματικών δεδομένων με τη μορφή ζευγών τιμών [`y_i`, `x_i`], όπου το "i" είναι ο αριθμός μιας πειραματικής μέτρησης από το 1 έως το "n". `y_i` - η τιμή της μετρούμενης ποσότητας στο σημείο `i`. `x_i` - η τιμή της παραμέτρου που ορίσαμε στο σημείο `i`.

Ως παράδειγμα, εξετάστε τη λειτουργία του νόμου του Ohm. Μεταβάλλοντας την τάση (διαφορά δυναμικού) μεταξύ των τμημάτων ηλεκτρικό κύκλωμα, μετράμε την ποσότητα του ρεύματος που διέρχεται από αυτήν την περιοχή. Η φυσική μας δίνει μια εξάρτηση που βρέθηκε πειραματικά:

«I = U/R»,
όπου «εγώ» είναι η τρέχουσα δύναμη. `R` - αντίσταση; `U` - τάση.

Σε αυτήν την περίπτωση, «y_i» είναι η τρέχουσα τιμή που μετράται και «x_i» είναι η τιμή τάσης.

Ως άλλο παράδειγμα, εξετάστε την απορρόφηση του φωτός από ένα διάλυμα μιας ουσίας σε διάλυμα. Η Χημεία μας δίνει τον τύπο:

«A = ε l C»,
όπου «A» είναι η οπτική πυκνότητα του διαλύματος. «ε» - διαπερατότητα της διαλυμένης ουσίας. `l` - μήκος διαδρομής όταν το φως διέρχεται από μια κυψελίδα με διάλυμα. «C» είναι η συγκέντρωση της διαλυμένης ουσίας.

Σε αυτήν την περίπτωση, «y_i» είναι η μετρούμενη τιμή της οπτικής πυκνότητας «A» και «x_i» είναι η τιμή συγκέντρωσης της ουσίας που καθορίζουμε.

Θα εξετάσουμε την περίπτωση όταν το σχετικό σφάλμα στην εργασία «x_i» είναι σημαντικά μικρότερο, σχετικό σφάλμαδιαστάσεις `y_i`. Θα υποθέσουμε επίσης ότι όλες οι μετρούμενες τιμές `y_i` είναι τυχαίες και κανονικά κατανεμημένες, δηλ. υπακούω κανονικός νόμοςδιανομές.

Στην περίπτωση μιας γραμμικής εξάρτησης του «y» από το «x», μπορούμε να γράψουμε τη θεωρητική εξάρτηση:
`y = a + b x`.

ΜΕ γεωμετρικό σημείοΌσον αφορά την όραση, ο συντελεστής «b» υποδηλώνει την εφαπτομένη της γωνίας κλίσης της ευθείας στον άξονα «x» και ο συντελεστής «a» - την τιμή του «y» στο σημείο τομής της ευθείας με το « άξονας y (στο `x = 0`).

Εύρεση των παραμέτρων της γραμμής παλινδρόμησης.

Σε ένα πείραμα, οι μετρούμενες τιμές του «y_i» δεν μπορούν να βρίσκονται ακριβώς στη θεωρητική ευθεία λόγω σφαλμάτων μέτρησης, τα οποία είναι πάντα εγγενή πραγματική ζωή. Επομένως, μια γραμμική εξίσωση πρέπει να αντιπροσωπεύεται από ένα σύστημα εξισώσεων:
`y_i = a + b x_i + ε_i` (1),
όπου «ε_i» είναι το άγνωστο σφάλμα μέτρησης του «y» στο «i»-ο πείραμα.

Η εξάρτηση (1) ονομάζεται επίσης οπισθοδρόμηση, δηλ. η εξάρτηση δύο ποσοτήτων μεταξύ τους με στατιστική σημασία.

Το καθήκον της αποκατάστασης της εξάρτησης είναι να βρεθούν οι συντελεστές `a` και `b` από τα πειραματικά σημεία [`y_i`, `x_i`].

Για την εύρεση των συντελεστών «a» και «b» χρησιμοποιείται συνήθως μέθοδος ελάχιστου τετραγώνου(MNC). Είναι μια ειδική περίπτωση της αρχής της μέγιστης πιθανότητας.

Ας ξαναγράψουμε το (1) με τη μορφή `ε_i = y_i - a - b x_i`.

Τότε το άθροισμα των τετραγωνικών σφαλμάτων θα είναι
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

Η αρχή των ελαχίστων τετραγώνων (ελάχιστων τετραγώνων) είναι η ελαχιστοποίηση του αθροίσματος (2) σε σχέση με τις παραμέτρους «a» και «b».

Το ελάχιστο επιτυγχάνεται όταν οι μερικές παράγωγοι του αθροίσματος (2) ως προς τους συντελεστές «a» και «b» είναι ίσες με μηδέν:
`frac(μερικό Φ)(μερικό a) = frac(μερικό άθροισμα_(i=1)^(n) (y_i - a - b x_i)^2)(μερικό a) = 0`
`frac(μερικό Φ)(μερικό b) = frac(μερικό άθροισμα_(i=1)^(n) (y_i - a - b x_i)^2)(μερικό b) = 0`

Επεκτείνοντας τις παραγώγους, λαμβάνουμε ένα σύστημα δύο εξισώσεων με δύο αγνώστους:
`sum_(i=1)^(n) (2a + 2bx_i — 2y_i) = sum_(i=1)^(n) (a + bx_i — y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

Ανοίγουμε τις αγκύλες και μεταφέρουμε τα αθροίσματα ανεξάρτητα από τους απαιτούμενους συντελεστές στο άλλο μισό, παίρνουμε ένα σύστημα γραμμικών εξισώσεων:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

Λύνοντας το σύστημα που προκύπτει, βρίσκουμε τύπους για τους συντελεστές «a» και «b»:

`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 — sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (άθροισμα_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n sum_(i=1)^(n) x_iy_i — sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (n) x_i^2 — (άθροισμα_(i=1)^(n) x_i)^2)` (3.2)

Αυτοί οι τύποι έχουν λύσεις όταν `n > 1` (η γραμμή μπορεί να κατασκευαστεί χρησιμοποιώντας τουλάχιστον 2 σημεία) και όταν η ορίζουσα `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1 )^(n) x_i)^2 != 0`, δηλ. όταν τα σημεία `x_i` στο πείραμα είναι διαφορετικά (δηλαδή όταν η γραμμή δεν είναι κάθετη).

Εκτίμηση σφαλμάτων συντελεστών γραμμής παλινδρόμησης

Για ακριβέστερη εκτίμηση του σφάλματος στον υπολογισμό των συντελεστών «a» και «b» είναι επιθυμητό ένας μεγάλος αριθμός απόπειραματικά σημεία. Όταν `n = 2`, είναι αδύνατο να εκτιμηθεί το σφάλμα των συντελεστών, γιατί η κατά προσέγγιση γραμμή θα περάσει μοναδικά από δύο σημεία.

Λάθος τυχαία μεταβλητήΤο "V" ορίζεται νόμος της συσσώρευσης λάθους
`S_V^2 = άθροισμα_(i=1)^p (frac(μερικό f)(μερικό z_i))^2 S_(z_i)^2`,
όπου "p" είναι ο αριθμός των παραμέτρων "z_i" με σφάλμα "S_(z_i)", οι οποίες επηρεάζουν το σφάλμα "S_V".
Το `f` είναι συνάρτηση της εξάρτησης του `V` από το `z_i`.

Ας γράψουμε τον νόμο της συσσώρευσης σφάλματος για το σφάλμα των συντελεστών «a» και «b»
`S_a^2 = sum_(i=1)^(n)(frac(μερικό a)(μερικό y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(μερικό a )(μερικό x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(μερικό α)(μερικό y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(μερικό b)(μερικό y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(μερικό b )(μερικό x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(μερικό β)(μερικό y_i))^2 `,
επειδή `S_(x_i)^2 = 0` (προηγουμένως κάναμε κράτηση ότι το σφάλμα `x` είναι αμελητέο).

`S_y^2 = S_(y_i)^2` - σφάλμα (διακύμανση, τετράγωνο τυπική απόκλιση) στη μέτρηση του `y`, υποθέτοντας ότι το σφάλμα είναι ομοιόμορφο για όλες τις τιμές του `y`.

Αντικαθιστώντας τους τύπους για τον υπολογισμό των «a» και «b» στις παραστάσεις που προκύπτουν

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 — x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i — sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 — (άθροισμα_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

Στα περισσότερα πραγματικά πειράματα, η τιμή του «Sy» δεν μετριέται. Για να γίνει αυτό, είναι απαραίτητο να πραγματοποιηθούν πολλές παράλληλες μετρήσεις (πειράματα) σε ένα ή περισσότερα σημεία του σχεδίου, γεγονός που αυξάνει τον χρόνο (και πιθανώς το κόστος) του πειράματος. Επομένως, συνήθως θεωρείται ότι η απόκλιση του «y» από τη γραμμή παλινδρόμησης μπορεί να θεωρηθεί τυχαία. Η εκτίμηση της διακύμανσης `y` σε αυτήν την περίπτωση υπολογίζεται χρησιμοποιώντας τον τύπο.

`S_y^2 = S_(y, υπόλοιπο)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

Ο διαιρέτης `n-2` εμφανίζεται επειδή ο αριθμός των βαθμών ελευθερίας μας έχει μειωθεί λόγω του υπολογισμού δύο συντελεστών χρησιμοποιώντας το ίδιο δείγμα πειραματικών δεδομένων.

Αυτή η εκτίμηση ονομάζεται επίσης υπολειπόμενη διακύμανση σε σχέση με τη γραμμή παλινδρόμησης `S_(y, υπόλοιπο)^2`.

Η σημασία των συντελεστών αξιολογείται χρησιμοποιώντας το Student’s t test

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

Εάν τα υπολογιζόμενα κριτήρια `t_a`, `t_b` είναι λιγότερα κριτήρια πίνακα«t(P, n-2)», τότε θεωρείται ότι ο αντίστοιχος συντελεστής δεν διαφέρει σημαντικά από το μηδέν με δεδομένη πιθανότητα «P».

Για να αξιολογήσετε την ποιότητα της περιγραφής μιας γραμμικής σχέσης, μπορείτε να συγκρίνετε τα "S_(y, rest)^2" και "S_(bar y)" σε σχέση με τον μέσο όρο χρησιμοποιώντας το κριτήριο Fisher.

`S_(bar y) = frac(sum_(i=1)^n (y_i — bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i — (sum_(i= 1)^n y_i) /n)^2) (n-1)` - δείγμα αξιολόγησηςδιακύμανση του «y» σε σχέση με τον μέσο όρο.

Για να εκτιμηθεί η αποτελεσματικότητα της εξίσωσης παλινδρόμησης για την περιγραφή της εξάρτησης, υπολογίζεται ο συντελεστής Fisher
`F = S_(γραμμή y) / S_(y, υπόλοιπο)^2`,
που συγκρίνεται με τον πίνακα Fisher συντελεστή «F(p, n-1, n-2)».

Εάν «F > F(P, n-1, n-2)», η διαφορά μεταξύ της περιγραφής της σχέσης `y = f(x)` με χρήση της εξίσωσης παλινδρόμησης και της περιγραφής που χρησιμοποιεί το μέσο όρο θεωρείται στατιστικά σημαντική με πιθανότητα «Π». Εκείνοι. Η παλινδρόμηση περιγράφει την εξάρτηση καλύτερα από την εξάπλωση του «y» γύρω από το μέσο όρο.

Κάντε κλικ στο γράφημα
για να προσθέσετε τιμές στον πίνακα

Μέθοδος ελάχιστου τετραγώνου. Η μέθοδος ελαχίστων τετραγώνων σημαίνει τον προσδιορισμό άγνωστων παραμέτρων a, b, c, την αποδεκτή συναρτησιακή εξάρτηση

Η μέθοδος των ελαχίστων τετραγώνων αναφέρεται στον προσδιορισμό άγνωστων παραμέτρων α, β, γ,…αποδεκτή λειτουργική εξάρτηση

y = f(x,a,b,c,…),

που θα παρείχε ένα ελάχιστο του μέσου τετραγώνου (διακύμανση) του σφάλματος

, (24)

όπου x i, y i είναι ένα σύνολο ζευγών αριθμών που λαμβάνονται από το πείραμα.

Εφόσον η συνθήκη για το άκρο μιας συνάρτησης πολλών μεταβλητών είναι η συνθήκη ότι οι μερικές παράγωγοί της είναι ίσες με μηδέν, τότε οι παράμετροι α, β, γ,…καθορίζονται από το σύστημα των εξισώσεων:

; ; ; … (25)

Πρέπει να θυμόμαστε ότι η μέθοδος των ελαχίστων τετραγώνων χρησιμοποιείται για την επιλογή παραμέτρων μετά τον τύπο της συνάρτησης y = f(x)ορίζεται

Εάν, από θεωρητικές σκέψεις, δεν μπορούν να εξαχθούν συμπεράσματα σχετικά με το τι θα έπρεπε να είναι συνοπτικός τύπος, τότε πρέπει να καθοδηγηθείτε οπτικές αναπαραστάσεις, κυρίως μια γραφική αναπαράσταση των παρατηρούμενων δεδομένων.

Στην πράξη, τις περισσότερες φορές περιορίζονται στους ακόλουθους τύπους λειτουργιών:

1) γραμμικό ;

2) τετραγωνικός α.

Αν κάποιοι φυσική ποσότηταεξαρτάται από μια άλλη ποσότητα, τότε αυτή η εξάρτηση μπορεί να μελετηθεί μετρώντας το y at διαφορετικές έννοιεςΧ. Ως αποτέλεσμα των μετρήσεων, λαμβάνονται ορισμένες τιμές:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Με βάση τα δεδομένα ενός τέτοιου πειράματος, είναι δυνατό να κατασκευαστεί ένα γράφημα της εξάρτησης y = ƒ(x). Η καμπύλη που προκύπτει καθιστά δυνατή την κρίση της μορφής της συνάρτησης ƒ(x). Ωστόσο σταθερές πιθανότητες, τα οποία περιλαμβάνονται σε αυτή τη λειτουργία παραμένουν άγνωστα. Μπορούν να προσδιοριστούν χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Τα πειραματικά σημεία, κατά κανόνα, δεν βρίσκονται ακριβώς στην καμπύλη. Η μέθοδος των ελαχίστων τετραγώνων απαιτεί το άθροισμα των τετραγώνων των αποκλίσεων των πειραματικών σημείων από την καμπύλη, δηλ. Το 2 ήταν το μικρότερο.

Στην πράξη, αυτή η μέθοδος χρησιμοποιείται πιο συχνά (και πιο απλά) στην περίπτωση μιας γραμμικής σχέσης, δηλ. Οταν

y = kxή y = a + bx.

Η γραμμική εξάρτηση είναι πολύ διαδεδομένη στη φυσική. Και ακόμη και όταν η σχέση είναι μη γραμμική, συνήθως προσπαθούν να κατασκευάσουν ένα γράφημα έτσι ώστε να πάρουν μια ευθεία γραμμή. Για παράδειγμα, αν υποτεθεί ότι ο δείκτης διάθλασης του γυαλιού n σχετίζεται με το μήκος κύματος φωτός λ με τη σχέση n = a + b/λ 2, τότε η εξάρτηση του n από το λ -2 απεικονίζεται στο γράφημα.

Σκεφτείτε την εξάρτηση y = kx(ευθεία γραμμή που διέρχεται από την αρχή). Ας συνθέσουμε την τιμή φ το άθροισμα των τετραγώνων των αποκλίσεων των σημείων μας από την ευθεία

Η τιμή του φ είναι πάντα θετική και αποδεικνύεται μικρότερη όσο πιο κοντά είναι τα σημεία μας στην ευθεία. Η μέθοδος των ελαχίστων τετραγώνων δηλώνει ότι η τιμή για το k πρέπει να επιλεγεί έτσι ώστε το φ να έχει ένα ελάχιστο


ή
(19)

Ο υπολογισμός δείχνει ότι το σφάλμα ρίζας μέσου τετραγώνου στον προσδιορισμό της τιμής του k είναι ίσο με

, (20)
όπου n είναι ο αριθμός των μετρήσεων.

Ας εξετάσουμε τώρα λίγο περισσότερο δύσκολη υπόθεση, όταν τα σημεία πρέπει να ικανοποιούν τον τύπο y = a + bx(ευθεία που δεν διέρχεται από την αρχή).

Το καθήκον είναι να βρείτε, με δεδομένο ένα σύνολο τιμών x i, y i καλύτερες αξίεςα και β.

Ας το φτιάξουμε ξανά τετραγωνική μορφή φ , ίσο με το ποσότετράγωνες αποκλίσεις των σημείων x i, y i από την ευθεία

και βρείτε τις τιμές των a και b για τις οποίες το φ έχει ελάχιστο

;

.

.

Κοινή απόφασηαπό αυτές τις εξισώσεις δίνει

(21)

Τα ριζικά μέσα τετραγωνικά σφάλματα προσδιορισμού των a και b είναι ίσα

(23)

.  (24)

Κατά την επεξεργασία των αποτελεσμάτων των μετρήσεων χρησιμοποιώντας αυτή τη μέθοδο, είναι βολικό να συνοψίζονται όλα τα δεδομένα σε έναν πίνακα στον οποίο έχουν υπολογιστεί προκαταρκτικά όλα τα ποσά που περιλαμβάνονται στους τύπους (19)(24). Οι μορφές αυτών των πινάκων δίνονται στα παρακάτω παραδείγματα.

Παράδειγμα 1.Μελετήθηκε η βασική εξίσωση της δυναμικής περιστροφική κίνησηε = M/J (γραμμή που διέρχεται από την αρχή). Σε διάφορες τιμές της στιγμής M μετρήθηκε γωνιώδης επιτάχυνσηε κάποιου σώματος. Απαιτείται ο προσδιορισμός της ροπής αδράνειας αυτού του σώματος. Τα αποτελέσματα των μετρήσεων της ροπής δύναμης και της γωνιακής επιτάχυνσης παρατίθενται στη δεύτερη και τρίτη στήλη πίνακας 5.

Πίνακας 5
n Μ, Ν μ ε, s -1 Μ 2 Μ ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Χρησιμοποιώντας τον τύπο (19) προσδιορίζουμε:

.

Για να προσδιορίσουμε το ριζικό μέσο τετραγωνικό σφάλμα, χρησιμοποιούμε τον τύπο (20)

0.005775κιλό-1 · Μ -2 .

Σύμφωνα με τον τύπο (18) έχουμε

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Έχοντας ορίσει την αξιοπιστία P = 0,95, χρησιμοποιώντας τον πίνακα των συντελεστών Student για n = 5, βρίσκουμε t = 2,78 και προσδιορίζουμε το απόλυτο σφάλμα ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Ας γράψουμε τα αποτελέσματα στη μορφή:

J = (3,0 ± 0,2) kg m2;


Παράδειγμα 2.Ας υπολογίσουμε τον συντελεστή θερμοκρασίας της μεταλλικής αντίστασης χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Η αντίσταση εξαρτάται γραμμικά από τη θερμοκρασία

Rt = R0 (1 + α t°) = R0 + R0 α t°.

Ο ελεύθερος όρος καθορίζει την αντίσταση R 0 σε θερμοκρασία 0 ° C και ο γωνιακός συντελεστής είναι το γινόμενο συντελεστής θερμοκρασίαςα στην αντίσταση R 0 .

Τα αποτελέσματα των μετρήσεων και των υπολογισμών δίνονται στον πίνακα ( βλέπε πίνακα 6).

Πίνακας 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Χρησιμοποιώντας τους τύπους (21), (22) προσδιορίζουμε

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ωμ.

Ας βρούμε ένα σφάλμα στον ορισμό του α. Αφού , τότε σύμφωνα με τον τύπο (18) έχουμε:

.

Χρησιμοποιώντας τους τύπους (23), (24) έχουμε

;

0.014126 Ωμ.

Έχοντας ορίσει την αξιοπιστία σε P = 0,95, χρησιμοποιώντας τον πίνακα των συντελεστών Student για n = 6, βρίσκουμε t = 2,57 και προσδιορίζουμε το απόλυτο σφάλμα Δα = 2,57 0,000132 = 0,000338 μοίρα -1.

α = (23 ± 4) 10 -4 χαλάζι-1 στο P = 0,95.


Παράδειγμα 3.Απαιτείται ο προσδιορισμός της ακτίνας καμπυλότητας του φακού χρησιμοποιώντας τους δακτυλίους του Νεύτωνα. Μετρήθηκαν οι ακτίνες των δακτυλίων του Νεύτωνα r m και προσδιορίστηκαν οι αριθμοί αυτών των δακτυλίων m. Οι ακτίνες των δακτυλίων του Νεύτωνα σχετίζονται με την ακτίνα καμπυλότητας του φακού R και τον αριθμό του δακτυλίου από την εξίσωση

r 2 m = mλR - 2d 0 R,

όπου d 0 το πάχος του διακένου μεταξύ του φακού και της επίπεδης παράλληλης πλάκας (ή η παραμόρφωση του φακού),

λ μήκος κύματος προσπίπτοντος φωτός.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

τότε η εξίσωση θα πάρει τη μορφή y = a + bx.

.

Εισάγονται τα αποτελέσματα των μετρήσεων και των υπολογισμών πίνακας 7.

Πίνακας 7
n x = m y = r 2, 10 -2 mm 2 m -¯m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Το οποίο βρίσκει την ευρύτερη εφαρμογή σε διάφορες περιοχέςεπιστήμη και πρακτικές δραστηριότητες. Αυτό θα μπορούσε να είναι η φυσική, η χημεία, η βιολογία, η οικονομία, η κοινωνιολογία, η ψυχολογία, και ούτω καθεξής και ούτω καθεξής. Με τη θέληση της μοίρας, συχνά πρέπει να ασχοληθώ με την οικονομία, και ως εκ τούτου σήμερα θα σας εκδόσω ένα εισιτήριο για καταπληκτική χώραμε τίτλο Οικονομετρία=) ...Πώς να μην το θέλεις;! Είναι πολύ καλά εκεί - απλά πρέπει να αποφασίσετε! ...Αλλά αυτό που πιθανώς σίγουρα θέλετε είναι να μάθετε πώς να λύνετε προβλήματα μέθοδος ελαχίστων τετραγώνων. Και ιδιαίτερα οι επιμελείς αναγνώστες θα μάθουν να τα λύνουν όχι μόνο με ακρίβεια, αλλά και ΠΟΛΥ ΓΡΗΓΟΡΑ ;-) Αλλά πρώτα γενική δήλωση του προβλήματος+ συνοδευτικό παράδειγμα:

Αφήστε μερικά θεματική ενότηταμελετώνται δείκτες που έχουν ποσοτική έκφραση. Ταυτόχρονα, υπάρχει κάθε λόγος να πιστεύουμε ότι ο δείκτης εξαρτάται από τον δείκτη. Αυτή η υπόθεση θα μπορούσε να είναι σαν επιστημονική υπόθεση, και να βασίζεται σε στοιχειώδη ΚΟΙΝΗ ΛΟΓΙΚΗ. Ας αφήσουμε την επιστήμη στην άκρη, ωστόσο, και ας εξερευνήσουμε πιο ορεκτικές περιοχές - συγκεκριμένα, τα παντοπωλεία. Ας χαρακτηρίσουμε με:

– Χώρος λιανικής παντοπωλείου, τ.μ.,
– ετήσιος κύκλος εργασιών ενός παντοπωλείου, εκατομμύρια ρούβλια.

Είναι απολύτως σαφές τι μεγαλύτερη έκτασηκατάστημα, τόσο μεγαλύτερος θα είναι ο τζίρος του στις περισσότερες περιπτώσεις.

Ας υποθέσουμε ότι μετά από παρατηρήσεις/πειράματα/υπολογισμούς/χορούς με ντέφι έχουμε στη διάθεσή μας αριθμητικά δεδομένα:

Με τα παντοπωλεία, νομίζω ότι όλα είναι ξεκάθαρα: - αυτή είναι η περιοχή του 1ου καταστήματος, - ο ετήσιος τζίρος του, - η περιοχή του 2ου καταστήματος, - ο ετήσιος τζίρος του κ.λπ. Παρεμπιπτόντως, δεν είναι καθόλου απαραίτητο να έχετε πρόσβαση ταξινομημένα υλικά- αρκετά ακριβής αξιολόγησηο εμπορικός κύκλος εργασιών μπορεί να επιτευχθεί με μέσα μαθηματικές στατιστικές. Ωστόσο, ας μην αποσπαζόμαστε, το μάθημα εμπορικής κατασκοπείας είναι ήδη πληρωμένο =)

Τα δεδομένα πίνακα μπορούν επίσης να γραφτούν με τη μορφή σημείων και να απεικονιστούν με τη γνωστή μορφή Καρτεσιανό σύστημα .

Θα απαντήσουμε σημαντική ερώτηση: για πόσους βαθμούς χρειάζονται ποιοτική έρευνα?

Οσο μεγαλύτερο τόσο καλύτερα. Το ελάχιστο αποδεκτό σετ αποτελείται από 5-6 πόντους. Επιπλέον, όταν ο όγκος των δεδομένων είναι μικρός, τα «ανώμαλα» αποτελέσματα δεν μπορούν να συμπεριληφθούν στο δείγμα. Έτσι, για παράδειγμα, ένα μικρό κατάστημα ελίτ μπορεί να κερδίσει τάξεις μεγέθους περισσότερες από «τους συναδέλφους του», παραμορφώνοντας έτσι γενικό μοτίβο, που είναι αυτό που πρέπει να βρείτε!

Για να το θέσω πολύ απλά, πρέπει να επιλέξουμε μια συνάρτηση, πρόγραμμαπου περνά όσο πιο κοντά στα σημεία . Αυτή η συνάρτηση καλείται προσεγγίζοντας (προσέγγιση - προσέγγιση)ή θεωρητική λειτουργία . Σε γενικές γραμμές, εδώ εμφανίζεται αμέσως ένας προφανής «υποψήφιος» - το πολυώνυμο υψηλός βαθμός, του οποίου η γραφική παράσταση διέρχεται από ΟΛΑ τα σημεία. Αλλά αυτή η επιλογή είναι περίπλοκη και συχνά απλά εσφαλμένη. (καθώς το γράφημα θα "κυκλοφορεί" συνεχώς και θα αντικατοπτρίζει ελάχιστα την κύρια τάση).

Έτσι, η αναζητούμενη συνάρτηση πρέπει να είναι αρκετά απλή και ταυτόχρονα να αντικατοπτρίζει επαρκώς την εξάρτηση. Όπως μπορείτε να μαντέψετε, ονομάζεται μία από τις μεθόδους εύρεσης τέτοιων συναρτήσεων μέθοδος ελαχίστων τετραγώνων. Αρχικά, ας δούμε την ουσία του γενική εικόνα. Αφήστε κάποια συνάρτηση να προσεγγίσει τα πειραματικά δεδομένα:


Πώς να αξιολογήσετε την ακρίβεια αυτής της προσέγγισης; Ας υπολογίσουμε επίσης τις διαφορές (αποκλίσεις) μεταξύ των πειραματικών και λειτουργικές έννοιες (μελετούμε το σχέδιο). Η πρώτη σκέψη που έρχεται στο μυαλό είναι να υπολογίσουμε πόσο μεγάλο είναι το άθροισμα, αλλά το πρόβλημα είναι ότι οι διαφορές μπορεί να είναι αρνητικές (Για παράδειγμα, ) και οι αποκλίσεις ως αποτέλεσμα μιας τέτοιας άθροισης θα αλληλοεξουδετερωθούν. Επομένως, ως εκτίμηση της ακρίβειας της προσέγγισης, ζητά να ληφθεί το άθροισμα ενότητεςαποκλίσεις:

ή κατέρρευσε: (σε περίπτωση που κάποιος δεν ξέρει: – αυτό είναι το εικονίδιο αθροίσματος και – μια βοηθητική μεταβλητή – «μετρητής», που παίρνει τιμές από 1 έως ).

Προσεγγίζοντας πειραματικά σημεία με διάφορες συναρτήσεις, θα λάβουμε διαφορετικές έννοιες, και προφανώς, όπου αυτό το ποσό είναι μικρότερο, αυτή η συνάρτηση είναι πιο ακριβής.

Μια τέτοια μέθοδος υπάρχει και λέγεται μέθοδος ελάχιστου συντελεστή. Ωστόσο, στην πράξη έχει γίνει πολύ πιο διαδεδομένο μέθοδος ελάχιστου τετραγώνου, στην οποία είναι δυνατόν αρνητικές τιμέςεξαλείφονται όχι από τη μονάδα, αλλά με τον τετραγωνισμό των αποκλίσεων:

, μετά την οποία οι προσπάθειες στοχεύουν στην επιλογή μιας συνάρτησης τέτοιας ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν όσο το δυνατόν μικρότερο. Στην πραγματικότητα, από αυτό προέρχεται το όνομα της μεθόδου.

Και τώρα επιστρέφουμε σε κάτι άλλο σημαντικό σημείο: όπως σημειώθηκε παραπάνω, η επιλεγμένη συνάρτηση θα πρέπει να είναι αρκετά απλή - αλλά υπάρχουν και πολλές τέτοιες λειτουργίες: γραμμικός , υπερβολικός, εκθετικός, λογαριθμική, τετραγωνικός και τα λοιπά. Και, φυσικά, εδώ θα ήθελα αμέσως να «μειώσω το πεδίο δραστηριότητας». Ποια κατηγορία συναρτήσεων πρέπει να επιλέξω για έρευνα; Πρωτόγονη, αλλά αποτελεσματική τεχνική:

– Ο ευκολότερος τρόπος είναι να απεικονίσετε σημεία στο σχέδιο και αναλύστε τη θέση τους. Εάν τείνουν να τρέχουν σε ευθεία γραμμή, τότε θα πρέπει να ψάξετε εξίσωση μιας γραμμής με βέλτιστες τιμές και . Με άλλα λόγια, το καθήκον είναι να βρεθούν ΤΕΤΟΙΟΙ συντελεστές έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων να είναι το μικρότερο.

Εάν τα σημεία βρίσκονται, για παράδειγμα, κατά μήκος υπερβολή, τότε είναι προφανώς σαφές ότι η γραμμική συνάρτηση θα δώσει κακή προσέγγιση. Σε αυτή την περίπτωση, αναζητούμε τους πιο «ευνοϊκούς» συντελεστές για την εξίσωση της υπερβολής – αυτά που δίνουν το ελάχιστο άθροισμα τετραγώνων .

Τώρα σημειώστε ότι και στις δύο περιπτώσεις μιλάμε συναρτήσεις δύο μεταβλητών, των οποίων τα επιχειρήματα είναι αναζητήθηκαν παράμετροι εξάρτησης:

Και ουσιαστικά πρέπει να λύσουμε ένα τυπικό πρόβλημα - να βρούμε ελάχιστη συνάρτηση δύο μεταβλητών.

Ας θυμηθούμε το παράδειγμά μας: ας υποθέσουμε ότι τα σημεία «καταστήματος» τείνουν να βρίσκονται σε ευθεία γραμμή και υπάρχει κάθε λόγος να πιστεύουμε ότι γραμμική εξάρτησητζίρο από χώρους λιανικής. Ας βρούμε ΤΕΤΟΙΟΥΣ συντελεστές "a" και "be" τέτοιοι ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν το μικρότερο. Όλα είναι όπως συνήθως - πρώτα Μερικά παράγωγα 1ης τάξης. Σύμφωνα με κανόνας γραμμικότηταςΜπορείτε να διαφοροποιήσετε ακριβώς κάτω από το εικονίδιο άθροισης:

Εάν θέλετε να χρησιμοποιήσετε αυτή η πληροφορίαγια ένα δοκίμιο ή ένα μάθημα - θα είμαι πολύ ευγνώμων για τον σύνδεσμο στη λίστα των πηγών· θα βρείτε τέτοιους λεπτομερείς υπολογισμούς σε λίγα μέρη:

Ας δημιουργήσουμε ένα τυπικό σύστημα:

Μειώνουμε κάθε εξίσωση κατά "δύο" και, επιπλέον, "διασπάμε" τα αθροίσματα:

Σημείωση : αναλύστε ανεξάρτητα γιατί το «a» και το «be» μπορούν να αφαιρεθούν πέρα ​​από το εικονίδιο αθροίσματος. Παρεμπιπτόντως, τυπικά αυτό μπορεί να γίνει με το άθροισμα

Ας ξαναγράψουμε το σύστημα σε «εφαρμοσμένη» μορφή:

μετά από το οποίο αρχίζει να εμφανίζεται ο αλγόριθμος για την επίλυση του προβλήματός μας:

Γνωρίζουμε τις συντεταγμένες των σημείων; Ξέρουμε. Ποσά μπορούμε να το βρούμε; Εύκολα. Ας κάνουμε το πιο απλό σύστημα δύο γραμμικών εξισώσεων σε δύο αγνώστους(«α» και «είναι»). Λύνουμε το σύστημα, για παράδειγμα, Η μέθοδος του Cramer, με αποτέλεσμα να παίρνουμε ακίνητο σημείο. Ελεγχος επαρκής συνθήκη για εξτρέμ, μπορούμε να επαληθεύσουμε ότι σε αυτό το σημείο η συνάρτηση φτάνει ακριβώς ελάχιστο. Ο έλεγχος περιλαμβάνει πρόσθετους υπολογισμούς και ως εκ τούτου θα τον αφήσουμε στο παρασκήνιο (εάν είναι απαραίτητο, μπορείτε να δείτε το πλαίσιο που λείπει). Καταλήγουμε στο τελικό συμπέρασμα:

Λειτουργία ο καλύτερος τρόπος (τουλάχιστον σε σύγκριση με οποιαδήποτε άλλη γραμμική συνάρτηση)φέρνει πιο κοντά τα πειραματικά σημεία . Σε γενικές γραμμές, το γράφημά του περνά όσο το δυνατόν πιο κοντά σε αυτά τα σημεία. Στην παράδοση οικονομετρίακαλείται επίσης η συνάρτηση προσέγγισης που προκύπτει εξίσωση ζεύγους γραμμικής παλινδρόμησης .

Το υπό εξέταση πρόβλημα έχει μεγάλο πρακτική σημασία. Στο παράδειγμά μας, η εξ. σας επιτρέπει να προβλέψετε τι κύκλο εργασιών ("Igrek")το κατάστημα θα έχει στη μία ή την άλλη αξία του χώρου πώλησης (η μία ή η άλλη σημασία του "x"). Ναι, η πρόβλεψη που προκύπτει θα είναι μόνο μια πρόβλεψη, αλλά σε πολλές περιπτώσεις θα αποδειχθεί αρκετά ακριβής.

Θα αναλύσω μόνο ένα πρόβλημα με "πραγματικούς" αριθμούς, καθώς δεν υπάρχουν δυσκολίες - όλοι οι υπολογισμοί είναι στο επίπεδο σχολικό πρόγραμμα σπουδών 7-8 τάξεις. Στο 95 τοις εκατό των περιπτώσεων, θα σας ζητηθεί να βρείτε μόνο μια γραμμική συνάρτηση, αλλά στο τέλος του άρθρου θα δείξω ότι δεν είναι πιο δύσκολο να βρείτε τις εξισώσεις της βέλτιστης υπερβολής, της εκθετικής και ορισμένων άλλων συναρτήσεων.

Στην πραγματικότητα, το μόνο που μένει είναι να διανείμετε τα καλούδια που υποσχέθηκαν - ώστε να μάθετε να λύνετε τέτοια παραδείγματα όχι μόνο με ακρίβεια, αλλά και γρήγορα. Μελετάμε προσεκτικά το πρότυπο:

Εργο

Ως αποτέλεσμα της μελέτης της σχέσης μεταξύ δύο δεικτών, προέκυψαν τα ακόλουθα ζεύγη αριθμών:

Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, βρείτε τη γραμμική συνάρτηση που προσεγγίζει καλύτερα την εμπειρική (έμπειρος)δεδομένα. Κάντε ένα σχέδιο στο οποίο στα καρτεσιανά ορθογώνιο σύστημασυντεταγμένες, κατασκευάστε πειραματικά σημεία και μια γραφική παράσταση της συνάρτησης κατά προσέγγιση . Βρείτε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ των εμπειρικών και των θεωρητικών τιμών. Μάθετε αν το χαρακτηριστικό θα ήταν καλύτερο (από την άποψη της μεθόδου των ελαχίστων τετραγώνων)φέρνουν πιο κοντά τα πειραματικά σημεία.

Σημειώστε ότι οι έννοιες "x" είναι φυσικές, και αυτό έχει μια χαρακτηριστική σημασία, για την οποία θα μιλήσω λίγο αργότερα. αλλά φυσικά μπορούν να είναι και κλασματικά. Επιπλέον, ανάλογα με το περιεχόμενο μιας συγκεκριμένης εργασίας, τόσο οι τιμές "X" και "παιχνίδι" μπορεί να είναι εντελώς ή εν μέρει αρνητικές. Λοιπόν, μας έχει δοθεί μια «απρόσωπη» εργασία και την ξεκινάμε λύση:

Βρίσκουμε τους συντελεστές της βέλτιστης συνάρτησης ως λύση στο σύστημα:

Για λόγους πιο συμπαγούς εγγραφής, η μεταβλητή «counter» μπορεί να παραλειφθεί, καθώς είναι ήδη σαφές ότι η άθροιση πραγματοποιείται από το 1 έως το .

Είναι πιο βολικό να υπολογίσετε τα απαιτούμενα ποσά σε μορφή πίνακα:


Οι υπολογισμοί μπορούν να πραγματοποιηθούν σε μικροϋπολογιστή, αλλά είναι πολύ καλύτερο να χρησιμοποιείτε το Excel - τόσο πιο γρήγορα όσο και χωρίς σφάλματα. δείτε ένα σύντομο βίντεο:

Έτσι, παίρνουμε το εξής Σύστημα:

Εδώ μπορείτε να πολλαπλασιάσετε τη δεύτερη εξίσωση με 3 και αφαιρέστε το 2ο από την 1η εξίσωση όρο προς όρο. Αλλά αυτό είναι τύχη - στην πράξη, τα συστήματα συχνά δεν είναι δώρο, και σε τέτοιες περιπτώσεις εξοικονομεί Η μέθοδος του Cramer:
, πράγμα που σημαίνει ότι το σύστημα έχει μια μοναδική λύση.

Ας ελέγξουμε. Καταλαβαίνω ότι δεν θέλετε, αλλά γιατί να παραλείψετε σφάλματα όπου δεν μπορείτε να χάσετε; Ας αντικαταστήσουμε τη λύση που βρέθηκε στην αριστερή πλευρά κάθε εξίσωσης του συστήματος:

Λήφθηκαν οι δεξιές πλευρές αντίστοιχες εξισώσεις, που σημαίνει ότι το σύστημα έχει λυθεί σωστά.

Έτσι, η επιθυμητή συνάρτηση προσέγγισης: – από όλες τις γραμμικές συναρτήσειςΕίναι αυτή που προσεγγίζει καλύτερα τα πειραματικά δεδομένα.

Διαφορετικός ευθεία εξάρτηση του τζίρου του καταστήματος από την περιοχή του, η διαπιστωθείσα εξάρτηση είναι ΑΝΤΙΣΤΡΟΦΗ (αρχή «όσο περισσότερα, τόσο λιγότερο»), και το γεγονός αυτό αποκαλύπτεται αμέσως από το αρνητικό κλίση. Λειτουργία μας λέει ότι με αύξηση ενός συγκεκριμένου δείκτη κατά 1 μονάδα, η τιμή του εξαρτημένου δείκτη μειώνεται μέση τιμήκατά 0,65 μονάδες. Όπως λένε, όσο υψηλότερη είναι η τιμή του φαγόπυρου, τόσο λιγότερο πωλείται.

Για να σχεδιάσουμε τη γραφική παράσταση της συνάρτησης κατά προσέγγιση, βρίσκουμε τις δύο τιμές της:

και εκτελέστε το σχέδιο:


Η κατασκευασμένη ευθεία ονομάζεται γραμμή τάσης (δηλαδή, μια γραμμική γραμμή τάσης, δηλ. in γενική περίπτωσημια τάση δεν είναι απαραίτητα μια ευθεία γραμμή). Όλοι είναι εξοικειωμένοι με την έκφραση «να είσαι στην τάση» και νομίζω ότι αυτός ο όρος δεν χρειάζεται επιπλέον σχόλια.

Ας υπολογίσουμε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ εμπειρικών και θεωρητικών αξιών. Γεωμετρικά, αυτό είναι το άθροισμα των τετραγώνων των μηκών των τμημάτων "βατόμουρου" (δύο από τα οποία είναι τόσο μικρά που δεν φαίνονται καν).

Ας συνοψίσουμε τους υπολογισμούς σε έναν πίνακα:


Και πάλι, μπορούν να γίνουν χειροκίνητα· σε κάθε περίπτωση, θα δώσω ένα παράδειγμα για το 1ο σημείο:

αλλά είναι πολύ πιο αποτελεσματικό να το κάνεις ήδη με γνωστό τρόπο:

Επαναλαμβάνουμε για άλλη μια φορά: Ποιο είναι το νόημα του αποτελέσματος που προκύπτει;Από όλες τις γραμμικές συναρτήσειςσυνάρτηση y ο δείκτης είναι ο μικρότερος, δηλαδή στην οικογένειά του είναι η καλύτερη προσέγγιση. Και εδώ, παρεμπιπτόντως, δεν είναι τυχαίο τελευταία ερώτησηεργασίες: τι γίνεται αν η προτεινόμενη εκθετική συνάρτηση θα ήταν καλύτερα να φέρουμε τα πειραματικά σημεία πιο κοντά;

Ας βρούμε το αντίστοιχο άθροισμα των τετραγωνικών αποκλίσεων - για να τις διακρίνω, θα τις χαρακτηρίσω με το γράμμα «έψιλον». Η τεχνική είναι ακριβώς η ίδια:


Και πάλι, για παν ενδεχόμενο, οι υπολογισμοί για τον 1ο βαθμό:

Χρησιμοποιούμε Excel τυπική λειτουργία ΛΗΞΗ (η σύνταξη βρίσκεται στη Βοήθεια του Excel).

συμπέρασμα: , που σημαίνει ότι η εκθετική συνάρτηση προσεγγίζει τα πειραματικά σημεία χειρότερα από μια ευθεία γραμμή .

Αλλά εδώ πρέπει να σημειωθεί ότι το "χειρότερο" είναι δεν σημαίνει ακόμα, τι συμβαίνει. Τώρα έχω φτιάξει ένα γράφημα αυτής της εκθετικής συνάρτησης - και περνάει επίσης κοντά στα σημεία - τόσο πολύ που χωρίς αναλυτική έρευνα είναι δύσκολο να πούμε ποια συνάρτηση είναι πιο ακριβής.

Αυτό ολοκληρώνει τη λύση και επιστρέφω στο ζήτημα των φυσικών αξιών του επιχειρήματος. Σε διάφορες μελέτες, συνήθως οικονομικές ή κοινωνιολογικές, τα φυσικά «Χ» χρησιμοποιούνται για τον αριθμό μηνών, ετών ή άλλων ίσων χρονικών διαστημάτων. Σκεφτείτε, για παράδειγμα, το ακόλουθο πρόβλημα.

Έχει πολλές εφαρμογές, καθώς επιτρέπει μια κατά προσέγγιση αναπαράσταση μιας δεδομένης συνάρτησης από άλλες απλούστερες. Το LSM μπορεί να είναι εξαιρετικά χρήσιμο στην επεξεργασία των παρατηρήσεων και χρησιμοποιείται ενεργά για την εκτίμηση ορισμένων ποσοτήτων με βάση τα αποτελέσματα των μετρήσεων άλλων που περιέχουν τυχαία σφάλματα. Σε αυτό το άρθρο, θα μάθετε πώς να εφαρμόζετε υπολογισμούς ελαχίστων τετραγώνων στο Excel.

Δήλωση του προβλήματος χρησιμοποιώντας ένα συγκεκριμένο παράδειγμα

Ας υποθέσουμε ότι υπάρχουν δύο δείκτες X και Y. Επιπλέον, το Y εξαρτάται από το X. Επειδή το OLS μας ενδιαφέρει από την άποψη της ανάλυσης παλινδρόμησης (στο Excel οι μέθοδοί του υλοποιούνται χρησιμοποιώντας ενσωματωμένες συναρτήσεις), θα πρέπει να προχωρήσουμε αμέσως στην εξέταση ενός συγκεκριμένο πρόβλημα.

Ας είναι λοιπόν το Χ εμπορική περιοχήμπακάλικο, μετρημένο σε τετραγωνικά μέτρα, και το Y είναι ο ετήσιος κύκλος εργασιών, που προσδιορίζεται σε εκατομμύρια ρούβλια.

Απαιτείται να γίνει πρόβλεψη για το τι τζίρο (Υ) θα έχει το κατάστημα αν έχει αυτόν ή τον άλλο χώρο λιανικής. Προφανώς, η συνάρτηση Y = f (X) αυξάνεται, αφού η υπεραγορά πουλάει περισσότερα αγαθά από το περίπτερο.

Λίγα λόγια για την ορθότητα των αρχικών δεδομένων που χρησιμοποιούνται για την πρόβλεψη

Ας υποθέσουμε ότι έχουμε έναν πίνακα που έχει κατασκευαστεί χρησιμοποιώντας δεδομένα για n καταστήματα.

Σύμφωνα με μαθηματικές στατιστικές, τα αποτελέσματα θα είναι λίγο πολύ σωστά εάν εξεταστούν δεδομένα για τουλάχιστον 5-6 αντικείμενα. Επιπλέον, δεν μπορούν να χρησιμοποιηθούν «ανώμαλα» αποτελέσματα. Συγκεκριμένα, μια ελίτ μικρή μπουτίκ μπορεί να έχει τζίρο αρκετές φορές μεγαλύτερο από τον τζίρο μεγάλων καταστημάτων λιανικής της κατηγορίας «masmarket».

Η ουσία της μεθόδου

Τα δεδομένα του πίνακα μπορούν να απεικονιστούν Καρτεσιανό αεροπλάνομε τη μορφή σημείων M 1 (x 1, y 1), ... M n (x n, y n). Τώρα η λύση του προβλήματος θα περιοριστεί στην επιλογή μιας προσεγγιστικής συνάρτησης y = f (x), η οποία έχει μια γραφική παράσταση που περνά όσο το δυνατόν πιο κοντά στα σημεία M 1, M 2, .. M n.

Φυσικά, μπορείτε να χρησιμοποιήσετε ένα πολυώνυμο υψηλού βαθμού, αλλά αυτή η επιλογή δεν είναι μόνο δύσκολη στην εφαρμογή, αλλά και απλά λανθασμένη, καθώς δεν θα αντικατοπτρίζει την κύρια τάση που πρέπει να εντοπιστεί. Η πιο λογική λύση είναι να αναζητήσετε την ευθεία y = ax + b, η οποία προσεγγίζει καλύτερα τα πειραματικά δεδομένα, ή ακριβέστερα, τους συντελεστές a και b.

Αξιολόγηση ακρίβειας

Με οποιαδήποτε προσέγγιση, η αξιολόγηση της ακρίβειάς του έχει ιδιαίτερη σημασία. Ας συμβολίσουμε με e i τη διαφορά (απόκλιση) μεταξύ των λειτουργικών και πειραματικών τιμών για το σημείο x i, δηλαδή e i = y i - f (x i).

Προφανώς, για να εκτιμήσετε την ακρίβεια της προσέγγισης, μπορείτε να χρησιμοποιήσετε το άθροισμα των αποκλίσεων, δηλ., όταν επιλέγετε μια ευθεία γραμμή για μια κατά προσέγγιση αναπαράσταση της εξάρτησης του X από το Y, θα πρέπει να προτιμάτε αυτή με τη μικρότερη τιμή του άθροισμα e i σε όλα τα υπό εξέταση σημεία. Ωστόσο, δεν είναι όλα τόσο απλά, αφού μαζί με τις θετικές αποκλίσεις θα υπάρχουν και αρνητικές.

Το πρόβλημα μπορεί να λυθεί χρησιμοποιώντας μονάδες απόκλισης ή τα τετράγωνά τους. Η τελευταία μέθοδος έλαβε τα περισσότερα ευρεία χρήση. Χρησιμοποιείται σε πολλούς τομείς συμπεριλαμβανομένων ανάλυση παλινδρόμησης(στο Excel η υλοποίησή του πραγματοποιείται χρησιμοποιώντας δύο ενσωματωμένες λειτουργίες) και έχει αποδείξει εδώ και καιρό την αποτελεσματικότητά του.

Μέθοδος ελάχιστου τετραγώνου

Το Excel, όπως γνωρίζετε, έχει μια ενσωματωμένη λειτουργία AutoSum που σας επιτρέπει να υπολογίζετε τις τιμές όλων των τιμών που βρίσκονται στην επιλεγμένη περιοχή. Έτσι, τίποτα δεν θα μας εμποδίσει να υπολογίσουμε την τιμή της παράστασης (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Σε μαθηματική σημειογραφία, αυτό μοιάζει με:

Δεδομένου ότι αρχικά ελήφθη η απόφαση να γίνει προσέγγιση χρησιμοποιώντας μια ευθεία γραμμή, έχουμε:

Έτσι, το έργο της εύρεσης της ευθείας γραμμής που περιγράφει καλύτερα τη συγκεκριμένη εξάρτηση των μεγεθών X και Y καταλήγει στον υπολογισμό του ελάχιστου συνάρτησης δύο μεταβλητών:

Για να γίνει αυτό, πρέπει να εξισώσετε τις μερικές παραγώγους σε σχέση με τις νέες μεταβλητές a και b με μηδέν και να λύσετε ένα πρωτόγονο σύστημα που αποτελείται από δύο εξισώσεις με 2 άγνωστα της μορφής:

Μετά από μερικούς απλούς μετασχηματισμούς, συμπεριλαμβανομένης της διαίρεσης με το 2 και του χειρισμού των αθροισμάτων, έχουμε:

Λύνοντάς το, για παράδειγμα, χρησιμοποιώντας τη μέθοδο του Cramer, παίρνουμε ένα ακίνητο σημείο με ορισμένους συντελεστές a * και b *. Αυτό είναι το ελάχιστο, δηλαδή για την πρόβλεψη του τζίρου που θα έχει το κατάστημα ορισμένη περιοχή, η ευθεία y = a * x + b * είναι κατάλληλη, που είναι μοντέλο παλινδρόμησηςγια το εν λόγω παράδειγμα. Φυσικά δεν θα σε αφήσει να βρεις ακριβές αποτέλεσμα, αλλά θα σας βοηθήσει να πάρετε μια ιδέα για το εάν η αγορά μιας συγκεκριμένης περιοχής με πίστωση καταστήματος θα αποδώσει.

Πώς να εφαρμόσετε τα ελάχιστα τετράγωνα στο Excel

Το Excel έχει μια συνάρτηση για τον υπολογισμό τιμών με χρήση ελαχίστων τετραγώνων. Αυτή έχει επόμενη προβολή: «TREND» (γνωστές τιμές Y, γνωστές τιμές X, νέες τιμές X, σταθερά). Ας εφαρμόσουμε τον τύπο για τον υπολογισμό του OLS στο Excel στον πίνακά μας.

Για να το κάνετε αυτό, εισαγάγετε το σύμβολο "=" στο κελί στο οποίο θα πρέπει να εμφανίζεται το αποτέλεσμα του υπολογισμού με τη μέθοδο των ελαχίστων τετραγώνων στο Excel και επιλέξτε τη συνάρτηση "TREND". Στο παράθυρο που ανοίγει, συμπληρώστε τα κατάλληλα πεδία, επισημαίνοντας:

  • εύρος γνωστών τιμών για το Y (σε αυτήν την περίπτωση, δεδομένα για τον εμπορικό κύκλο εργασιών).
  • εύρος x 1 , …x n , δηλαδή το μέγεθος του χώρου λιανικής.
  • τόσο διάσημο όσο και άγνωστες τιμές x, για τα οποία πρέπει να μάθετε το μέγεθος του κύκλου εργασιών (για πληροφορίες σχετικά με τη θέση τους στο φύλλο εργασίας, δείτε παρακάτω).

Επιπλέον, ο τύπος περιέχει τη λογική μεταβλητή "Const". Εάν εισαγάγετε 1 στο αντίστοιχο πεδίο, αυτό θα σημαίνει ότι πρέπει να κάνετε τους υπολογισμούς, υποθέτοντας ότι b = 0.

Εάν πρέπει να μάθετε την πρόβλεψη για περισσότερες από μία τιμές x, τότε αφού εισαγάγετε τον τύπο δεν πρέπει να πατήσετε "Enter", αλλά πρέπει να πληκτρολογήσετε τον συνδυασμό "Shift" + "Control" + "Enter" στο πληκτρολόγιο.

Κάποια χαρακτηριστικά

Η ανάλυση παλινδρόμησης μπορεί να είναι προσβάσιμη ακόμη και σε ανδρείκελα. Φόρμουλα Excelγια την πρόβλεψη της τιμής ενός πίνακα άγνωστων μεταβλητών - "TREND" - μπορεί να χρησιμοποιηθεί ακόμη και από εκείνους που δεν έχουν ακούσει ποτέ για τη μέθοδο των ελαχίστων τετραγώνων. Αρκεί μόνο να γνωρίζουμε μερικά από τα χαρακτηριστικά της δουλειάς του. Συγκεκριμένα:

  • Εάν τακτοποιήσετε το εύρος των γνωστών τιμών της μεταβλητής y σε μία γραμμή ή στήλη, τότε κάθε σειρά (στήλη) με γνωστές αξίεςΤο x θα αντιμετωπίζεται από το πρόγραμμα ως ξεχωριστή μεταβλητή.
  • Εάν το παράθυρο TREND δεν υποδεικνύει εύρος με γνωστό x, τότε εάν η συνάρτηση χρησιμοποιείται σε Πρόγραμμα Excelθα τον αντιμετωπίσει ως έναν πίνακα που αποτελείται από ακέραιους, ο αριθμός των οποίων αντιστοιχεί στο εύρος με τις δεδομένες τιμές της μεταβλητής y.
  • Για να εξάγετε έναν πίνακα "προβλεπόμενων" τιμών, η έκφραση για τον υπολογισμό της τάσης πρέπει να εισαχθεί ως τύπος πίνακα.
  • Εάν δεν καθορίζονται νέες τιμές του x, τότε η συνάρτηση TREND τις θεωρεί ίσες με τις γνωστές. Εάν δεν καθορίζονται, τότε ο πίνακας 1 λαμβάνεται ως όρισμα. 2; 3; 4;…, το οποίο είναι ανάλογο με το εύρος με τις ήδη καθορισμένες παραμέτρους y.
  • Το εύρος που περιέχει τις νέες τιμές x πρέπει να αποτελείται από το ίδιο ή περισσότεροσειρές ή στήλες ως εύρος με δεδομένες τιμές y. Με άλλα λόγια, πρέπει να είναι ανάλογη με τις ανεξάρτητες μεταβλητές.
  • Ένας πίνακας με γνωστές τιμές x μπορεί να περιέχει πολλές μεταβλητές. Ωστόσο, εάν μιλάμε γιαπερίπου μόνο ένα, τότε απαιτείται οι περιοχές με δεδομένες τιμές x και y να είναι ανάλογες. Στην περίπτωση πολλών μεταβλητών, είναι απαραίτητο το εύρος με τις δεδομένες τιμές y να χωράει σε μία στήλη ή μία γραμμή.

Λειτουργία ΠΡΟΒΛΕΨΗΣ

Υλοποιήθηκε χρησιμοποιώντας πολλές λειτουργίες. Ένα από αυτά ονομάζεται «ΠΡΟΒΛΕΨΗ». Είναι παρόμοιο με το "TREND", δηλαδή δίνει το αποτέλεσμα των υπολογισμών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Ωστόσο, μόνο για ένα Χ, για το οποίο η τιμή του Υ είναι άγνωστη.

Τώρα γνωρίζετε τύπους στο Excel για ανδρείκελα που σας επιτρέπουν να προβλέψετε τη μελλοντική τιμή ενός συγκεκριμένου δείκτη σύμφωνα με μια γραμμική τάση.

Χρησιμοποιείται ευρέως στην οικονομετρία με τη μορφή μιας ξεκάθαρης οικονομικής ερμηνείας των παραμέτρων του.

Η γραμμική παλινδρόμηση καταλήγει στην εύρεση μιας εξίσωσης της μορφής

ή

Εξίσωση της φόρμας επιτρέπει για δεδομένες αξίεςπαράμετρος Χέχουν θεωρητικές τιμές του προκύπτοντος χαρακτηριστικού, αντικαθιστώντας τις πραγματικές τιμές του παράγοντα σε αυτό Χ.

Η κατασκευή της γραμμικής παλινδρόμησης καταλήγει στην εκτίμηση των παραμέτρων της - ΕΝΑΚαι V.Οι εκτιμήσεις παραμέτρων γραμμικής παλινδρόμησης μπορούν να βρεθούν χρησιμοποιώντας διαφορετικές μεθόδους.

Η κλασική προσέγγιση για την εκτίμηση των παραμέτρων γραμμικής παλινδρόμησης βασίζεται σε μέθοδος ελαχίστων τετραγώνων(MNC).

Η μέθοδος των ελαχίστων τετραγώνων μας επιτρέπει να λάβουμε τέτοιες εκτιμήσεις παραμέτρων ΕΝΑΚαι V,στο οποίο το άθροισμα των τετραγωνικών αποκλίσεων των πραγματικών τιμών του προκύπτοντος χαρακτηριστικού (y)από υπολογισμένο (θεωρητικό) ελάχιστο:

Για να βρείτε το ελάχιστο μιας συνάρτησης, πρέπει να υπολογίσετε τις μερικές παραγώγους για κάθε μία από τις παραμέτρους ΕΝΑΚαι σικαι να τα ορίσουμε ίσα με το μηδέν.

Ας υποδηλώσουμε μέσω S, τότε:

Μεταμορφώνοντας τον τύπο, παίρνουμε το παρακάτω σύστημα κανονικές εξισώσειςγια την εκτίμηση των παραμέτρων ΕΝΑΚαι V:

Επίλυση του συστήματος των κανονικών εξισώσεων (3.5) είτε με τη μέθοδο διαδοχική εξάλειψημεταβλητές, ή με τη μέθοδο των οριζόντων, βρίσκουμε τις απαιτούμενες εκτιμήσεις των παραμέτρων ΕΝΑΚαι V.

Παράμετρος Vονομάζεται συντελεστής παλινδρόμησης. Η τιμή του δείχνει τη μέση μεταβολή του αποτελέσματος με μεταβολή του συντελεστή κατά μία μονάδα.

Η εξίσωση παλινδρόμησης συμπληρώνεται πάντα με έναν δείκτη της εγγύτητας της σύνδεσης. Όταν χρησιμοποιείται γραμμική παλινδρόμηση, ένας τέτοιος δείκτης είναι ο συντελεστής γραμμικής συσχέτισης. Υπάρχουν διάφορες τροποποιήσεις του τύπου γραμμικός συντελεστήςσυσχετίσεις. Μερικές από αυτές δίνονται παρακάτω:

Ως γνωστόν, ο συντελεστής γραμμικής συσχέτισης είναι εντός των ορίων: -1 1.

Για την αξιολόγηση της ποιότητας της επιλογής γραμμική συνάρτησηυπολογίζεται το τετράγωνο

Καλείται γραμμικός συντελεστής συσχέτισης συντελεστή προσδιορισμού.Ο συντελεστής προσδιορισμού χαρακτηρίζει την αναλογία διακύμανσης του προκύπτοντος χαρακτηριστικού y,εξηγείται με παλινδρόμηση, σε συνολική διακύμανσηπροκύπτον σημάδι:

Αντίστοιχα, η τιμή 1 χαρακτηρίζει το μερίδιο διακύμανσης y,προκαλείται από την επίδραση άλλων παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Ερωτήσεις για αυτοέλεγχο

1. Η ουσία της μεθόδου των ελαχίστων τετραγώνων;

2. Πόσες μεταβλητές παρέχει η κατά ζεύγη παλινδρόμηση;

3. Ποιος συντελεστής καθορίζει τη στενότητα της σύνδεσης μεταξύ των αλλαγών;

4. Μέσα σε ποια όρια προσδιορίζεται ο συντελεστής προσδιορισμού;

5. Εκτίμηση της παραμέτρου b στην ανάλυση συσχέτισης-παλίνδρομης;

1. Christopher Dougherty. Εισαγωγή στην οικονομετρία. - M.: INFRA - M, 2001 - 402 p.

2. Α.Ε. Borodich. Οικονομετρία. Minsk LLC "New Knowledge" 2001.


3. R.U. Ραχμέτοβα Σύντομο μάθημαστην οικονομετρία. Φροντιστήριο. Αλμάτι. 2004. -78σ.

4. Ι.Ι. Eliseeva. Οικονομετρία. - Μ.: «Οικονομικά και Στατιστική», 2002

5. Μηνιαίο ενημερωτικό και αναλυτικό περιοδικό.

Μη γραμμικά οικονομικά μοντέλα. Μοντέλα μη γραμμικής παλινδρόμησης. Μετασχηματισμός μεταβλητών.

Μη γραμμικό οικονομικά μοντέλα..

Μετασχηματισμός μεταβλητών.

Συντελεστής ελαστικότητας.

Αν μεταξύ οικονομικά φαινόμεναυπάρχουν μη γραμμικές σχέσεις, εκφράζονται χρησιμοποιώντας την αντίστοιχη μη γραμμικές συναρτήσεις: για παράδειγμα, μια ισόπλευρη υπερβολή , παραβολές δευτέρου βαθμού και τα λοιπά.

Υπάρχουν δύο κατηγορίες μη γραμμικών παλινδρομήσεων:

1. Παλινδρομήσεις που είναι μη γραμμικές ως προς τις επεξηγηματικές μεταβλητές που περιλαμβάνονται στην ανάλυση, αλλά γραμμικές ως προς τις εκτιμώμενες παραμέτρους, για παράδειγμα:

Πολυώνυμα διάφορους βαθμούς - , ;

Ισόπλευρη υπερβολή - ;

Ημιλογαριθμική συνάρτηση - .

2. Παλινδρομήσεις που είναι μη γραμμικές στις παραμέτρους που εκτιμώνται, για παράδειγμα:

Εξουσία - ;

Επιδεικτικό - ;

Εκθετική - .

Συνολικό άθροισμα τετραγωνικών αποκλίσεων ατομικές αξίεςπροκύπτον σημάδι στοαπό τη μέση τιμή προκαλείται από την επίδραση πολλών λόγων. Ας χωρίσουμε υπό όρους ολόκληρο το σύνολο των λόγων σε δύο ομάδες: παράγοντας υπό μελέτη xΚαι άλλους παράγοντες.

Εάν ο παράγοντας δεν επηρεάζει το αποτέλεσμα, τότε η γραμμή παλινδρόμησης στο γράφημα είναι παράλληλη προς τον άξονα ΩΚαι

Τότε ολόκληρη η διακύμανση του προκύπτοντος χαρακτηριστικού οφείλεται στην επίδραση άλλων παραγόντων και συνολικό ποσότετράγωνες αποκλίσεις θα συμπίπτουν με το υπόλοιπο. Εάν άλλοι παράγοντες δεν επηρεάζουν το αποτέλεσμα, τότε y δεμέναΜε Χλειτουργικό και υπολειπόμενο ποσότετράγωνα είναι μηδέν. Σε αυτήν την περίπτωση, το άθροισμα των τετραγωνικών αποκλίσεων που εξηγείται από την παλινδρόμηση είναι το ίδιο με το συνολικό άθροισμα των τετραγώνων.

Δεδομένου ότι δεν βρίσκονται όλα τα σημεία του πεδίου συσχέτισης στη γραμμή παλινδρόμησης, η διασπορά τους εμφανίζεται πάντα ως αποτέλεσμα της επιρροής του παράγοντα Χ, δηλαδή παλινδρόμηση στοΜε Χ,και προκαλείται από άλλες αιτίες (ανεξήγητη παραλλαγή). Η καταλληλότητα της γραμμής παλινδρόμησης για πρόβλεψη εξαρτάται από ποιο μέρος συνολική παραλλαγήσημάδι στοεξηγεί την επεξηγημένη παραλλαγή

Προφανώς, εάν το άθροισμα των τετραγωνικών αποκλίσεων λόγω παλινδρόμησης είναι μεγαλύτερο από το υπολειπόμενο άθροισμα των τετραγώνων, τότε η εξίσωση παλινδρόμησης είναι στατιστικά σημαντική και ο παράγοντας Χέχει σημαντικό αντίκτυπο στο αποτέλεσμα u.

, δηλ. με τον αριθμό της ελευθερίας ανεξάρτητης παραλλαγής ενός χαρακτηριστικού. Ο αριθμός των βαθμών ελευθερίας σχετίζεται με τον αριθμό των μονάδων του πληθυσμού n και τον αριθμό των σταθερών που προσδιορίζονται από αυτόν. Σε σχέση με το υπό μελέτη πρόβλημα, ο αριθμός των βαθμών ελευθερίας θα πρέπει να δείχνει από πόσες ανεξάρτητες αποκλίσεις Π

Η εκτίμηση της σημασίας της εξίσωσης παλινδρόμησης στο σύνολό της δίνεται χρησιμοποιώντας φά-Κριτήριο Fisher. Σε αυτή την περίπτωση, τίθεται μια μηδενική υπόθεση ότι ο συντελεστής παλινδρόμησης είναι ίσος με μηδέν, δηλ. β = 0, και επομένως ο παράγοντας Χδεν επηρεάζει το αποτέλεσμα u.

Πριν από τον άμεσο υπολογισμό του F-test προηγείται ανάλυση διασποράς. Η κεντρική θέση σε αυτό καταλαμβάνεται από την αποσύνθεση του συνολικού αθροίσματος των τετραγωνικών αποκλίσεων μιας μεταβλητής στοαπό τη μέση τιμή στοσε δύο μέρη - «εξήγητο» και «ανεξήγητο»:

- συνολικό άθροισμα τετραγωνικών αποκλίσεων.

- άθροισμα τετραγωνικών αποκλίσεων που εξηγούνται με παλινδρόμηση.

- υπολειπόμενο άθροισμα τετραγωνικών αποκλίσεων.

Οποιοδήποτε άθροισμα τετραγωνικών αποκλίσεων σχετίζεται με τον αριθμό των βαθμών ελευθερίας , δηλ. με τον αριθμό της ελευθερίας ανεξάρτητης παραλλαγής ενός χαρακτηριστικού. Ο αριθμός των βαθμών ελευθερίας σχετίζεται με τον αριθμό των πληθυσμιακών μονάδων nκαι με τον αριθμό των σταθερών που προσδιορίζεται από αυτό. Σε σχέση με το υπό μελέτη πρόβλημα, ο αριθμός των βαθμών ελευθερίας θα πρέπει να δείχνει από πόσες ανεξάρτητες αποκλίσεις Ππιθανή απαιτείται για να σχηματιστεί ένα δεδομένο άθροισμα τετραγώνων.

Διασπορά ανά βαθμό ελευθερίαςρε.

Αναλογίες F (δοκιμή F):

Αν η μηδενική υπόθεση είναι αληθής, στη συνέχεια παραγοντική και υπολειπόμενη διακύμανσηδεν διαφέρουν μεταξύ τους. Για το H 0, είναι απαραίτητη μια διάψευση έτσι ώστε η διασπορά του παράγοντα να υπερβαίνει την υπολειπόμενη διασπορά αρκετές φορές. Ο Άγγλος στατιστικολόγος Snedekor ανέπτυξε πίνακες κρίσιμων τιμών φά-σχέσεις σε διαφορετικά επίπεδα σημασίας μηδενική υπόθεσηΚαι διάφορους αριθμούςβαθμοί ελευθερίας. Τιμή πίνακα φά-κριτήριο είναι η μέγιστη τιμή του λόγου των αποκλίσεων που μπορεί να προκύψει σε περίπτωση τυχαίας απόκλισης για αυτό το επίπεδοη πιθανότητα ύπαρξης μηδενικής υπόθεσης. Υπολογιζόμενη τιμή φά-οι σχέσεις θεωρούνται αξιόπιστες εάν το o είναι μεγαλύτερο από τον πίνακα.

Σε αυτή την περίπτωση, η μηδενική υπόθεση σχετικά με την απουσία σχέσης μεταξύ των σημείων απορρίπτεται και εξάγεται ένα συμπέρασμα σχετικά με τη σημασία αυτής της σχέσης: F fact > F πίνακαςΤο H 0 απορρίπτεται.

Εάν η τιμή είναι μικρότερη από την αναγραφόμενη στον πίνακα F fact ‹, F πίνακας, τότε η πιθανότητα της μηδενικής υπόθεσης είναι υψηλότερη από ένα καθορισμένο επίπεδο και δεν μπορεί να απορριφθεί χωρίς σοβαρό κίνδυνο εξαγωγής λανθασμένου συμπεράσματος σχετικά με την παρουσία μιας σχέσης. Σε αυτή την περίπτωση, η εξίσωση παλινδρόμησης θεωρείται στατιστικά ασήμαντη. Αλλά δεν παρεκκλίνει.

Τυπικό σφάλμα συντελεστή παλινδρόμησης

Για να εκτιμηθεί η σημασία του συντελεστή παλινδρόμησης, η τιμή του συγκρίνεται με αυτόν τυπικό σφάλμα, δηλαδή προσδιορίζεται η πραγματική τιμή t-Τεστ μαθητή: που στη συνέχεια συγκρίνεται με αξία πίνακασε ένα ορισμένο επίπεδο σημασίας και αριθμό βαθμών ελευθερίας ( n- 2).

Τυπικό σφάλμα παραμέτρου ΕΝΑ:

Η σημασία του συντελεστή γραμμικής συσχέτισης ελέγχεται με βάση το μέγεθος του σφάλματος συντελεστής συσχέτισης t r:

Συνολική διακύμανση χαρακτηριστικών Χ:

Πολλαπλή Γραμμική Παλινδρόμηση

Πρότυπο κτίριο

Πολλαπλή παλινδρόμησηαντιπροσωπεύει μια παλινδρόμηση του προκύπτοντος πρόσημου με δύο και ένας μεγάλος αριθμόςπαράγοντες, δηλαδή ένα μοντέλο της μορφής

Η παλινδρόμηση μπορεί να δώσει καλά αποτελέσματα στη μοντελοποίηση εάν μπορεί να παραμεληθεί η επίδραση άλλων παραγόντων που επηρεάζουν το αντικείμενο μελέτης. Η συμπεριφορά των επιμέρους οικονομικών μεταβλητών δεν μπορεί να ελεγχθεί, δηλαδή δεν είναι δυνατό να διασφαλιστεί η ισότητα όλων των άλλων συνθηκών για την αξιολόγηση της επιρροής ενός παράγοντα υπό μελέτη. Σε αυτήν την περίπτωση, θα πρέπει να προσπαθήσετε να προσδιορίσετε την επιρροή άλλων παραγόντων εισάγοντάς τους στο μοντέλο, δηλαδή να κατασκευάσετε μια εξίσωση πολλαπλή παλινδρόμηση: y = a+b 1 x 1 +b 2 +…+b p x p + .

Ο κύριος στόχος της πολλαπλής παλινδρόμησης είναι η οικοδόμηση ενός μοντέλου με μεγάλο αριθμό παραγόντων, ενώ προσδιορίζεται η επιρροή καθενός από αυτούς ξεχωριστά, καθώς και η συνδυαστική τους επίδραση στον μοντελοποιημένο δείκτη. Η προδιαγραφή του μοντέλου περιλαμβάνει δύο σειρές θεμάτων: επιλογή παραγόντων και επιλογή του τύπου της εξίσωσης παλινδρόμησης