Βιογραφίες Χαρακτηριστικά Ανάλυση

Πώς λειτουργεί η εκθετική εξομάλυνση. Μέθοδος εκθετικής εξομάλυνσης

Οι εργασίες πρόβλεψης βασίζονται στην αλλαγή ορισμένων δεδομένων με την πάροδο του χρόνου (πωλήσεις, ζήτηση, προσφορά, ΑΕΠ, εκπομπές άνθρακα, πληθυσμός ...) και την προβολή αυτών των αλλαγών στο μέλλον. Δυστυχώς, σύμφωνα με ιστορικά δεδομένα, οι τάσεις μπορούν να παραβιαστούν από πολλούς απρόβλεπτες περιστάσεις. Άρα τα δεδομένα στο μέλλον μπορεί να διαφέρουν σημαντικά από αυτά που συνέβησαν στο παρελθόν. Αυτό είναι το πρόβλημα με τις προβλέψεις.

Ωστόσο, υπάρχουν τεχνικές (που ονομάζονται εκθετική εξομάλυνση) που επιτρέπουν όχι μόνο να προσπαθήσουμε να προβλέψουμε το μέλλον, αλλά και να εκφράσουμε αριθμητικά την αβεβαιότητα για οτιδήποτε σχετίζεται με την πρόβλεψη. Η αριθμητική έκφραση της αβεβαιότητας με τη δημιουργία διαστημάτων πρόβλεψης είναι πραγματικά ανεκτίμητη, αλλά συχνά παραβλέπεται στον κόσμο των προβλέψεων.

Λήψη σημείωσης σε ή μορφή, παραδείγματα σε μορφή

Αρχικά στοιχεία

Ας υποθέσουμε ότι είστε θαυμαστής του Άρχοντα των Δαχτυλιδιών και φτιάχνετε και πουλάτε σπαθιά εδώ και τρία χρόνια (Εικόνα 1). Ας εμφανίσουμε τις πωλήσεις γραφικά (Εικ. 2). Η ζήτηση διπλασιάστηκε σε τρία χρόνια - ίσως αυτή είναι μια τάση; Θα επανέλθουμε σε αυτήν την ιδέα λίγο αργότερα. Υπάρχουν αρκετές κορυφές και κοιλάδες στο διάγραμμα, που μπορεί να είναι σημάδι εποχικότητας. Συγκεκριμένα, οι κορυφές είναι στους μήνες 12, 24 και 36, που τυχαίνει να είναι Δεκέμβριος. Μήπως όμως είναι απλά μια σύμπτωση; Ας ανακαλύψουμε.

Απλή εκθετική εξομάλυνση

Μέθοδοι εκθετική εξομάλυνσηβασίζονται στην πρόβλεψη του μέλλοντος από δεδομένα από το παρελθόν, όπου οι νεότερες παρατηρήσεις βαραίνουν περισσότερο από τις παλαιότερες. Αυτή η στάθμιση είναι δυνατή λόγω σταθερών εξομάλυνσης. Η πρώτη μέθοδος εκθετικής εξομάλυνσης που θα δοκιμάσουμε ονομάζεται απλή εκθετική εξομάλυνση (PES). εκθετική εξομάλυνση, SES). Χρησιμοποιεί μόνο μία σταθερά εξομάλυνσης.

Η απλή εκθετική εξομάλυνση προϋποθέτει ότι η χρονοσειρά δεδομένων σας έχει δύο στοιχεία: ένα επίπεδο (ή μέσο όρο) και κάποιο σφάλμα γύρω από αυτήν την τιμή. Δεν υπάρχει τάση ή εποχιακές διακυμάνσεις - υπάρχει απλώς ένα επίπεδο γύρω από το οποίο κυμαίνεται η ζήτηση, που περιβάλλεται από μικρά σφάλματα εδώ κι εκεί. Δίνοντας προτίμηση σε νεότερες παρατηρήσεις, το TEC μπορεί να προκαλέσει αλλαγές σε αυτό το επίπεδο. Στη γλώσσα των τύπων,

Ζήτηση τη χρονική στιγμή t = επίπεδο + τυχαίο σφάλμακοντά στο επίπεδο τη χρονική στιγμή t

Πώς λοιπόν βρίσκετε την κατά προσέγγιση τιμή του επιπέδου; Εάν δεχθούμε όλες τις χρονικές τιμές να έχουν την ίδια τιμή, τότε θα πρέπει απλώς να υπολογίσουμε τη μέση τιμή τους. Ωστόσο, αυτή είναι μια κακή ιδέα. Θα πρέπει να δοθεί μεγαλύτερη βαρύτητα στις πρόσφατες παρατηρήσεις.

Ας δημιουργήσουμε μερικά επίπεδα. Υπολογίστε τη γραμμή βάσης για το πρώτο έτος:

επίπεδο 0 = μέση ζήτηση για το πρώτο έτος (μήνες 1-12)

Για τη ζήτηση ξίφους, είναι 163. Χρησιμοποιούμε το επίπεδο 0 (163) ως πρόβλεψη ζήτησης για τον μήνα 1. Η ζήτηση τον μήνα 1 είναι 165, δηλαδή 2 σπαθιά πάνω από το επίπεδο 0. Αξίζει να ενημερώσετε την προσέγγιση της γραμμής βάσης. Απλή εκθετική εξίσωση εξομάλυνσης:

επίπεδο 1 = επίπεδο 0 + μερικά τοις εκατό × (ζήτηση 1 - επίπεδο 0)

επίπεδο 2 = επίπεδο 1 + μερικά τοις εκατό × (ζήτηση 2 - επίπεδο 1)

Και τα λοιπά. Το "λίγα τοις εκατό" ονομάζεται σταθερά εξομάλυνσης και συμβολίζεται με άλφα. Μπορεί να είναι οποιοσδήποτε αριθμός από 0 έως 100% (0 έως 1). Θα μάθετε πώς να επιλέξετε μια τιμή άλφα αργότερα. ΣΤΟ γενική περίπτωσητιμή για διαφορετικά χρονικά σημεία:

Επίπεδο τρέχουσα περίοδος = επίπεδο προηγούμενης περιόδου +
alpha × (ζήτηση τρέχουσα περίοδος - επίπεδο προηγούμενης περιόδου)

Η μελλοντική ζήτηση είναι ίση με το τελευταίο υπολογιζόμενο επίπεδο (Εικ. 3). Επειδή δεν ξέρετε τι είναι το άλφα, ορίστε το κελί C2 σε 0,5 για αρχή. Αφού κατασκευαστεί το μοντέλο, βρείτε ένα άλφα τέτοιο ώστε το άθροισμα των τετραγώνων του σφάλματος να είναι E2 (ή τυπική απόκλιση– F2) ήταν ελάχιστες. Για να το κάνετε αυτό, εκτελέστε την επιλογή Εύρεση λύσης. Για να το κάνετε αυτό, περάστε από το μενού ΔΕΔΟΜΕΝΑ –> Εύρεση λύσης, και ρυθμίστε στο παράθυρο Επιλογές αναζήτησης λύσεωναπαιτούμενες τιμές (Εικ. 4). Για να εμφανίσετε τα αποτελέσματα της πρόβλεψης στο γράφημα, επιλέξτε πρώτα το εύρος A6:B41 και δημιουργήστε ένα απλό γραμμικό γράφημα. Στη συνέχεια, κάντε δεξί κλικ στο διάγραμμα, επιλέξτε την επιλογή Επιλέξτε δεδομένα.Στο παράθυρο που ανοίγει, δημιουργήστε μια δεύτερη σειρά και εισαγάγετε προβλέψεις από την περιοχή A42:B53 σε αυτήν (Εικ. 5).

Ίσως έχετε μια τάση

Για να ελεγχθεί αυτή η υπόθεση, αρκεί να ταιριάζει γραμμικής παλινδρόμησηςκάτω από τα δεδομένα ζήτησης και εκτελέστε ένα τεστ t για την άνοδο αυτής της γραμμής τάσης (όπως στο ). Εάν η κλίση της γραμμής είναι μη μηδενική και στατιστικά σημαντική (στη δοκιμή του Student, η τιμή Rλιγότερο από 0,05), τα δεδομένα έχουν τάση (Εικ. 6).

Χρησιμοποιήσαμε τη συνάρτηση LINEST, η οποία επιστρέφει 10 περιγραφικά στατιστικά(αν δεν έχετε χρησιμοποιήσει αυτή τη συνάρτηση πριν, τη συνιστώ) και τη λειτουργία INDEX, η οποία σας επιτρέπει να «βγάλετε» μόνο τα τρία απαιτούμενα στατιστικά στοιχεία και όχι ολόκληρο το σετ. Αποδείχθηκε ότι η κλίση είναι 2,54 και είναι σημαντική, αφού η δοκιμή του Student έδειξε ότι το 0,000000012 είναι σημαντικά μικρότερο από το 0,05. Άρα, υπάρχει μια τάση και μένει να την συμπεριλάβουμε στην πρόβλεψη.

Εκθετική εξομάλυνση Holt με διόρθωση τάσης

Συχνά αναφέρεται ως διπλή εκθετική εξομάλυνση επειδή έχει δύο παραμέτρους εξομάλυνσης, την άλφα και όχι μία. Εάν η χρονική ακολουθία έχει γραμμική τάση, τότε:

ζήτηση με την πάροδο του χρόνου t = επίπεδο + t × τάση + τυχαία απόκλισηεπίπεδο τη χρονική στιγμή t

Το Holt Exponential Smoothing με διόρθωση τάσης έχει δύο νέες εξισώσεις, μία για το επίπεδο καθώς προχωρά στο χρόνο και μία για την τάση. Η εξίσωση επιπέδου περιέχει την παράμετρο εξομάλυνσης άλφα και η εξίσωση τάσης περιέχει γάμμα. Δείτε πώς φαίνεται η εξίσωση νέου επιπέδου:

επίπεδο 1 = επίπεδο 0 + τάση 0 + άλφα × (ζήτηση 1 - (επίπεδο 0 + τάση 0))

σημειώστε ότι επίπεδο 0 + τάση 0είναι μόνο μια πρόβλεψη ενός βήματος από τις αρχικές τιμές έως τον μήνα 1, έτσι ζήτηση 1 – (επίπεδο 0 + τάση 0)είναι μια απόκλιση ενός σταδίου. Έτσι, η εξίσωση προσέγγισης του βασικού επιπέδου θα είναι η εξής:

επίπεδο τρέχουσας περιόδου = επίπεδο προηγούμενης περιόδου + τάση προηγούμενης περιόδου + άλφα × (ζήτηση τρέχουσας περιόδου - (επίπεδο προηγούμενης περιόδου) + τάση προηγούμενης περιόδου))

Εξίσωση ενημέρωσης τάσης:

τρέχουσα περίοδος τάσης = τάση προηγούμενη περίοδος + γάμμα × άλφα × (τρέχουσα περίοδος ζήτησης – (επίπεδο προηγούμενη περίοδο) + τάση προηγούμενη περίοδος))

Η εξομάλυνση με ολτ στο Excel είναι παρόμοια με την απλή εξομάλυνση (Εικ. 7) και, όπως παραπάνω, ο στόχος είναι να βρεθούν δύο συντελεστές ελαχιστοποιώντας ταυτόχρονα το άθροισμα των τετραγωνικών σφαλμάτων (Εικ. 8). Για να λάβετε το αρχικό επίπεδο και τις τιμές τάσης (στα κελιά C5 και D5 στο Σχήμα 7), δημιουργήστε ένα γράφημα για τους πρώτους 18 μήνες των πωλήσεων και προσθέστε μια γραμμή τάσης με μια εξίσωση σε αυτό. Εισαγάγετε την αρχική τιμή τάσης 0,8369 και το αρχικό επίπεδο 155,88 στα κελιά C5 και D5. Τα δεδομένα πρόβλεψης μπορούν να παρουσιαστούν γραφικά (Εικ. 9).

Ρύζι. 7. Εκθετική εξομάλυνση Holt με διόρθωση τάσης. Για να μεγεθύνετε μια εικόνα, κάντε δεξί κλικ πάνω της και επιλέξτε Άνοιγμα εικόνας σε νέα καρτέλα

Εύρεση προτύπων σε δεδομένα

Υπάρχει ένας τρόπος να δοκιμάσετε το μοντέλο πρόβλεψης για αντοχή - να συγκρίνετε τα σφάλματα με τον εαυτό τους, μετατοπισμένα κατά ένα βήμα (ή πολλά βήματα). Εάν οι αποκλίσεις είναι τυχαίες, τότε το μοντέλο δεν μπορεί να βελτιωθεί. Ωστόσο, μπορεί να υπάρχει ένας εποχιακός παράγοντας στα δεδομένα της ζήτησης. Η έννοια ενός σφάλματος που συσχετίζεται με τη δική του έκδοση σε διαφορετική περίοδο ονομάζεται αυτοσυσχέτιση (για περισσότερα σχετικά με την αυτοσυσχέτιση, βλ. ). Για να υπολογίσετε την αυτοσυσχέτιση, ξεκινήστε με δεδομένα σφάλματος πρόβλεψης για κάθε περίοδο (μεταφέρετε τη στήλη F στο Σχήμα 7 στη στήλη Β στο Σχήμα 10). Επόμενος ορισμός μέσο σφάλμαπρόβλεψη (Εικόνα 10, κελί B39, τύπος στο κελί: =AVERAGE(B3:B38)). Στη στήλη Γ, υπολογίστε την απόκλιση του σφάλματος πρόβλεψης από τον μέσο όρο. τύπος στο κελί C3: =B3-B$39. Στη συνέχεια, μετατοπίστε διαδοχικά τη στήλη C μια στήλη προς τα δεξιά και μια γραμμή προς τα κάτω. Τύποι στα κελιά D39: =SUMPRODUCT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Τι μπορεί να σημαίνει η «σύγχρονη κίνηση» με τη στήλη Γ για μία από τις στήλες D: O. Για παράδειγμα, εάν οι στήλες Γ και Δ είναι σύγχρονες, τότε ένας αριθμός που είναι αρνητικός σε μία από αυτές πρέπει να είναι αρνητικός στην άλλη, θετικός στη μία , θετικός στον φίλο. Αυτό σημαίνει ότι το άθροισμα των γινομένων των δύο στηλών θα είναι σημαντικό (συσσωρεύονται οι διαφορές). Ή, που είναι το ίδιο, όσο πιο κοντά στο μηδέν είναι η τιμή στην περιοχή D41:O41, τόσο χαμηλότερη είναι η συσχέτιση της στήλης (αντίστοιχα από το D στο O) με τη στήλη C (Εικ. 11).

Μία αυτοσυσχέτιση είναι πάνω από την κρίσιμη τιμή. Το σφάλμα μετατόπισης του έτους συσχετίζεται με τον εαυτό του. Αυτό σημαίνει εποχιακό κύκλο 12 μηνών. Και αυτό δεν προκαλεί έκπληξη. Αν κοιτάξετε το γράφημα ζήτησης (Εικόνα 2), αποδεικνύεται ότι υπάρχουν κορυφές στη ζήτηση κάθε Χριστούγεννα και βουτιές τον Απρίλιο-Μάιο. Εξετάστε μια τεχνική πρόβλεψης που λαμβάνει υπόψη την εποχικότητα.

Πολλαπλασιαστική εκθετική εξομάλυνση Holt-Winters

Η μέθοδος ονομάζεται πολλαπλασιαστική (από πολλαπλασιάζω - πολλαπλασιάζω), επειδή χρησιμοποιεί τον πολλαπλασιασμό για να υπολογίσει την εποχικότητα:

Ζήτηση τη στιγμή t = (επίπεδο + t × τάση) × εποχιακή προσαρμογή τη χρονική στιγμή t × τυχόν υπολειπόμενες ακανόνιστες προσαρμογές που δεν μπορούμε να λάβουμε υπόψη

Η εξομάλυνση Holt-Winters ονομάζεται επίσης τριπλή εκθετική εξομάλυνση επειδή έχει τρεις παραμέτρους εξομάλυνσης (εποχιακός παράγοντας άλφα, γάμμα και δέλτα). Για παράδειγμα, εάν υπάρχει εποχιακός κύκλος 12 μηνών:

Μηνιαία πρόβλεψη 39 = (επίπεδο 36 + 3 × τάση 36) x εποχικότητα 27

Κατά την ανάλυση των δεδομένων, είναι απαραίτητο να μάθετε ποια είναι η τάση στις σειρές δεδομένων και ποια η εποχικότητα. Για να εκτελέσετε υπολογισμούς χρησιμοποιώντας τη μέθοδο Holt-Winters, πρέπει:

  • Ομαλά ιστορικά δεδομένα χρησιμοποιώντας τη μέθοδο κινητού μέσου όρου.
  • Συγκρίνετε την ομαλοποιημένη έκδοση της χρονοσειράς με την αρχική για να λάβετε μια πρόχειρη εκτίμηση της εποχικότητας.
  • Λάβετε νέα δεδομένα χωρίς εποχικό στοιχείο.
  • Βρείτε προσεγγίσεις επιπέδου και τάσεων με βάση αυτά τα νέα δεδομένα.

Ξεκινήστε με τα αρχικά δεδομένα (στήλες A και B στο Σχήμα 12) και προσθέστε τη στήλη C με εξομαλυνόμενες τιμές με βάση τον κινητό μέσο όρο. Δεδομένου ότι η εποχικότητα έχει κύκλους 12 μηνών, είναι λογικό να χρησιμοποιείται ένας μέσος όρος 12 μηνών. Υπάρχει ένα μικρό πρόβλημα με αυτόν τον μέσο όρο. Το 12 είναι ζυγός αριθμός. Εάν εξομαλύνετε τη ζήτηση για τον 7ο μήνα, θα πρέπει να θεωρείται η μέση ζήτηση από τον 1ο έως τον 12ο μήνα ή από τον 2ο έως τον 13ο μήνα; Για να αντιμετωπίσουμε αυτή τη δυσκολία, πρέπει να εξομαλύνουμε τη ζήτηση χρησιμοποιώντας έναν "κινούμενο μέσο όρο 2x12". Δηλαδή, πάρτε τους μισούς από τους δύο μέσους όρους από τους μήνες 1 έως 12 και από 2 έως 13. Ο τύπος στο κελί C8 είναι: =(AVERAGE(B3:B14)+AVERAGE(B2:B13))/2.

Δεν μπορούν να ληφθούν εξομαλυντικά δεδομένα για τους μήνες 1-6 και 31-36, επειδή δεν υπάρχουν αρκετές προηγούμενες και επόμενες περίοδοι. Για λόγους σαφήνειας, τα αρχικά και τα εξομαλυνόμενα δεδομένα μπορούν να παρουσιαστούν σε ένα διάγραμμα (Εικ. 13).

Τώρα, στη στήλη D, διαιρέστε την αρχική τιμή με την εξομαλυνόμενη τιμή για να λάβετε μια εκτίμηση της εποχικής προσαρμογής (στήλη D στο Σχήμα 12). Τύπος στο κελί D8: =B8/C8. Σημειώστε αιχμές 20% πάνω από την κανονική ζήτηση τους μήνες 12 και 24 (Δεκέμβριος) ενώ υπάρχουν πτώσεις την άνοιξη. Αυτή η τεχνική εξομάλυνσης σας έδωσε δύο σημειακές εκτιμήσειςγια κάθε μήνα (σύνολο 24 μήνες). Η στήλη Ε είναι ο μέσος όρος αυτών των δύο παραγόντων. Ο τύπος στο κελί E1 είναι: =AVERAGE(D14,D26). Για λόγους σαφήνειας, το επίπεδο των εποχιακών διακυμάνσεων μπορεί να αναπαρασταθεί γραφικά (Εικ. 14).

Τώρα μπορείτε να λάβετε προσαρμοσμένα δεδομένα εποχιακές διακυμάνσεις. Τύπος στο κελί G1: =B2/E2. Δημιουργήστε ένα γράφημα με βάση τα δεδομένα της στήλης G, συμπληρώστε το με μια γραμμή τάσης, εμφανίστε την εξίσωση τάσης στο γράφημα (Εικ. 15) και χρησιμοποιήστε τους συντελεστές σε επόμενους υπολογισμούς.

μορφή ΝΕΟ ΦΥΛΛΟ, όπως φαίνεται στο σχ. 16. Αντικαταστήστε τις τιμές στην περιοχή E5:E16 από το σχ. 12 περιοχές Ε2:Ε13. Πάρτε τις τιμές των C16 και D16 από την εξίσωση της γραμμής τάσης στο σχήμα. 15. Ορίστε τις τιμές των σταθερών εξομάλυνσης να ξεκινούν από περίπου 0,5. Αναπτύξτε τις τιμές στη σειρά 17 στο εύρος των μηνών 1 έως 36. Εκτέλεση Εύρεση λύσηςγια τη βελτιστοποίηση των συντελεστών εξομάλυνσης (Εικ. 18). Τύπος στο κελί B53: =(C$52+(A53-A$52)*D$52)*E41.

Τώρα στην πρόβλεψη που έγινε, πρέπει να ελέγξετε τις αυτοσυσχετίσεις (Εικ. 18). Δεδομένου ότι όλες οι τιμές βρίσκονται μεταξύ των άνω και κάτω ορίων, καταλαβαίνετε ότι το μοντέλο έκανε καλή δουλειά στην κατανόηση της δομής των τιμών ζήτησης.

Χτίζοντας ένα διάστημα εμπιστοσύνης για την πρόβλεψη

Έτσι, έχουμε μια αρκετά λειτουργική πρόβλεψη. Πώς ορίζετε τα πάνω και τα κάτω όρια που μπορούν να χρησιμοποιηθούν για να κάνετε ρεαλιστικές εικασίες; Η προσομοίωση Monte Carlo, την οποία έχετε ήδη γνωρίσει (δείτε επίσης ), θα σας βοηθήσει σε αυτό. Το θέμα είναι να δημιουργηθούν μελλοντικά σενάρια συμπεριφοράς ζήτησης και να προσδιοριστεί η ομάδα στην οποία ανήκει το 95% αυτών.

Αφαιρέστε από το φύλλο Πρόβλεψη Excelαπό τα κελιά B53:B64 (βλ. Εικ. 17). Θα γράψετε ζήτηση εκεί με βάση την προσομοίωση. Το τελευταίο μπορεί να δημιουργηθεί χρησιμοποιώντας τη συνάρτηση NORMINV. Για τους επόμενους μήνες, θα πρέπει απλώς να του παρέχετε τη μέση τιμή (0), την τυπική κατανομή (10,37 από το κελί $H$2) και τυχαίος αριθμόςαπό 0 έως 1. Η συνάρτηση θα επιστρέψει την απόκλιση με πιθανότητα που αντιστοιχεί στην καμπύλη καμπάνας. Βάλτε μια προσομοίωση σφάλματος ενός βήματος στο κελί G53: =NORMINV(RAND();0;H$2). Η επέκταση αυτού του τύπου στο G64 σάς παρέχει προσομοιώσεις του σφάλματος πρόβλεψης για μια πρόβλεψη ενός βήματος 12 μηνών (Εικόνα 19). Οι τιμές της προσομοίωσής σας θα διαφέρουν από αυτές που φαίνονται στο σχήμα (γι' αυτό είναι προσομοίωση!).

Με το Forecast Error, έχετε όλα όσα χρειάζεστε για να ενημερώσετε το επίπεδο, την τάση και τον εποχιακό παράγοντα. Επιλέξτε λοιπόν τα κελιά C52:F52 και τεντώστε τα στη σειρά 64. Ως αποτέλεσμα, έχετε ένα προσομοιωμένο σφάλμα πρόβλεψης και την ίδια την πρόβλεψη. Από το αντίθετο, είναι δυνατό να προβλεφθούν οι τιμές της ζήτησης. Εισαγάγετε τον τύπο στο κελί B53: =F53+G53 και τεντώστε τον στο B64 (Εικ. 20, περιοχή B53:F64). Τώρα μπορείτε να πατήσετε το κουμπί F9, κάθε φορά που ενημερώνετε την πρόβλεψη. Τοποθετήστε τα αποτελέσματα 1000 προσομοιώσεων στα κελιά A71:L1070, μεταφέροντας κάθε φορά τιμές από την περιοχή B53:B64 στην περιοχή A71:L71, A72:L72, ... A1070:L1070. Αν σας ενοχλεί, γράψτε τον κωδικό VBA.

Τώρα έχετε 1000 σενάρια για κάθε μήνα και μπορείτε να χρησιμοποιήσετε τη συνάρτηση PERCENTILE για να λάβετε τα άνω και κάτω όρια στη μέση του διαστήματος εμπιστοσύνης 95%. Στο κελί A66, ο τύπος είναι: =PERCENTILE(A71:A1070,0,975) και στο κελί A67: =PERCENTILE(A71:A1070,0,025).

Ως συνήθως, για λόγους σαφήνειας, τα δεδομένα μπορούν να παρουσιαστούν στο γραφική μορφή(Εικ. 21).

Υπάρχουν δύο ενδιαφέροντα σημεία στο διάγραμμα:

  • Το περιθώριο σφάλματος αυξάνεται με την πάροδο του χρόνου. Είναι λογικό. Η αβεβαιότητα συσσωρεύεται κάθε μήνα.
  • Με τον ίδιο τρόπο, το σφάλμα αυξάνεται στα ανταλλακτικά που εμπίπτουν σε περιόδους εποχικής αύξησης της ζήτησης. Με την επακόλουθη πτώση του, το σφάλμα συρρικνώνεται.

Βασισμένο σε υλικό από ένα βιβλίο του John Foreman. – M.: Alpina Publisher, 2016. – S. 329–381

Ο κινητός μέσος όρος σάς επιτρέπει να εξομαλύνετε τέλεια τα δεδομένα. Αλλά το κύριο μειονέκτημά του είναι ότι κάθε τιμή στα δεδομένα προέλευσης έχει την ίδια βαρύτητα για αυτήν. Για παράδειγμα, για έναν κινητό μέσο όρο που χρησιμοποιεί περίοδο έξι εβδομάδων, σε κάθε τιμή για κάθε εβδομάδα δίνεται το 1/6 του βάρους. Για ορισμένα συλλεγμένα στατιστικά στοιχεία, δίνεται μεγαλύτερη βαρύτητα στις πιο πρόσφατες τιμές. Επομένως, η εκθετική εξομάλυνση χρησιμοποιείται για να δώσει στα πιο πρόσφατα δεδομένα μεγαλύτερη βαρύτητα. Έτσι, αυτό το στατιστικό πρόβλημα λύνεται.

Τύπος υπολογισμού μεθόδου εκθετικής εξομάλυνσης στο Excel

Το παρακάτω σχήμα δείχνει μια αναφορά ζήτησης για ένα συγκεκριμένο προϊόν για 26 εβδομάδες. Η στήλη Ζήτηση περιέχει πληροφορίες σχετικά με την ποσότητα των αγαθών που πωλήθηκαν. Στη στήλη "Πρόβλεψη" - ο τύπος:

Η στήλη "Κινούμενος Μέσος όρος" ορίζει την προβλεπόμενη ζήτηση, που υπολογίζεται χρησιμοποιώντας τον συνήθη υπολογισμό του κινητού μέσου όρου με περίοδο 6 εβδομάδων:

Στην τελευταία στήλη «Πρόβλεψη», με τον τύπο που περιγράφεται παραπάνω, εφαρμόζεται η μέθοδος της εκθετικής εξομάλυνσης των δεδομένων στην οποία οι τιμές των τελευταίων εβδομάδων έχουν μεγαλύτερο βάρος από τις προηγούμενες.

Ο συντελεστής "Alpha:" εισάγεται στο κελί G1, σημαίνει το βάρος της εκχώρησης στα πιο πρόσφατα δεδομένα. ΣΤΟ αυτό το παράδειγμαέχει αξία 30%. Το υπόλοιπο 70% του βάρους κατανέμεται στα υπόλοιπα δεδομένα. Δηλαδή, η δεύτερη τιμή από πλευράς συνάφειας (από δεξιά προς τα αριστερά) έχει βάρος ίσο με το 30% του υπόλοιπου 70% του βάρους - αυτό είναι 21%, η τρίτη τιμή έχει βάρος ίσο με το 30% του υπολοίπου από το 70% του βάρους - 14,7% και ούτω καθεξής.



Οικόπεδο εκθετικής εξομάλυνσης

Το παρακάτω σχήμα δείχνει το γράφημα ζήτησης, τον κινητό μέσο όρο και την πρόβλεψη εκθετικής εξομάλυνσης, η οποία βασίζεται στις αρχικές τιμές:


Σημειώστε ότι η πρόβλεψη εκθετικής εξομάλυνσης ανταποκρίνεται περισσότερο στις αλλαγές στη ζήτηση από τη γραμμή του κινούμενου μέσου όρου.

Τα δεδομένα για τις διαδοχικές προηγούμενες εβδομάδες πολλαπλασιάζονται με τον παράγοντα άλφα και το αποτέλεσμα προστίθεται στο υπόλοιπο ποσοστό βάρους πολλαπλασιασμένο με την προηγούμενη προβλεπόμενη τιμή.

9 5. Μέθοδος εκθετικής εξομάλυνσης. Επιλογή σταθεράς εξομάλυνσης

Όταν χρησιμοποιείτε τη μέθοδο ελάχιστα τετράγωναγια τον προσδιορισμό της προγνωστικής τάσης (τάση), θεωρείται εκ των προτέρων ότι όλα τα αναδρομικά δεδομένα (παρατηρήσεις) έχουν το ίδιο περιεχόμενο πληροφοριών. Προφανώς, θα ήταν πιο λογικό να ληφθεί υπόψη η διαδικασία της έκπτωσης γενικές πληροφορίες, δηλαδή την ανισότητα αυτών των στοιχείων για την ανάπτυξη μιας πρόβλεψης. Αυτό επιτυγχάνεται με τη μέθοδο της εκθετικής εξομάλυνσης δίνοντας στις τελευταίες παρατηρήσεις της χρονοσειράς (δηλαδή τις τιμές που προηγούνται αμέσως πριν από την προβλεπόμενη περίοδο) πιο σημαντικά «βαρίδια» σε σύγκριση με τις αρχικές παρατηρήσεις. Τα πλεονεκτήματα της μεθόδου εκθετικής εξομάλυνσης θα πρέπει επίσης να περιλαμβάνουν την απλότητα των υπολογιστικών λειτουργιών και την ευελιξία στην περιγραφή των διαφόρων δυναμικών διεργασιών. Η μέθοδος έχει βρει τη μεγαλύτερη εφαρμογή για την υλοποίηση μεσοπρόθεσμων προβλέψεων.

5.1. Η ουσία της μεθόδου εκθετικής εξομάλυνσης

Η ουσία της μεθόδου είναι ότι δυναμική σειράεξομαλύνεται με σταθμισμένο «κινούμενο μέσο όρο» στον οποίο τα βάρη ακολουθούν έναν εκθετικό νόμο. Με άλλα λόγια, όσο πιο μακριά από το τέλος της χρονοσειράς είναι το σημείο για το οποίο υπολογίζεται ο σταθμισμένος κινητός μέσος όρος, τόσο λιγότερη «συμμετοχή» απαιτείται στην ανάπτυξη της πρόβλεψης.

Έστω ότι η αρχική δυναμική σειρά αποτελείται από επίπεδα (στοιχεία σειράς) y t , t = 1 , 2 ,...,n . Για κάθε m διαδοχικά επίπεδα αυτής της σειράς

δυναμική σειρά με βήμα ίσο με ένα. Εάν το m είναι ένας περιττός αριθμός και είναι προτιμότερο να ληφθεί ένας περιττός αριθμός επιπέδων, καθώς στην περίπτωση αυτή η υπολογισμένη τιμή επιπέδου θα βρίσκεται στο κέντρο του διαστήματος εξομάλυνσης και είναι εύκολο να αντικατασταθεί η πραγματική τιμή με αυτήν, τότε η Ο παρακάτω τύπος μπορεί να γραφτεί για να προσδιοριστεί ο κινητός μέσος όρος:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t−ξ

i= t−ξ

2ξ + 1

όπου y t είναι η τιμή του κινούμενου μέσου όρου για τη στιγμή t (t = 1 , 2 ,...,n )· y i είναι η πραγματική τιμή του επιπέδου τη στιγμή i ;

i είναι ο τακτικός αριθμός του επιπέδου στο διάστημα εξομάλυνσης.

Η τιμή του ξ προσδιορίζεται από τη διάρκεια του διαστήματος εξομάλυνσης.

Επειδή η

m =2 ξ +1

για μονό m, λοιπόν

ξ = m 2 − 1 .

Ο υπολογισμός του κινητού μέσου όρου για μεγάλο αριθμό επιπέδων μπορεί να απλοποιηθεί ορίζοντας διαδοχικές τιμές του κινητού μέσου όρου αναδρομικά:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Δεδομένου όμως του γεγονότος ότι στις τελευταίες παρατηρήσεις πρέπει να δοθεί μεγαλύτερη «βαρύτητα», ο κινητός μέσος όρος πρέπει να ερμηνευτεί διαφορετικά. Βρίσκεται στο γεγονός ότι η τιμή που προκύπτει με τον υπολογισμό του μέσου όρου δεν αντικαθιστά τον κεντρικό όρο του μέσου διαστήματος, αλλά τον τελευταίο όρο του. Κατά συνέπεια, η τελευταία έκφραση μπορεί να ξαναγραφτεί ως

Mi = Mi + 1

y i− y i− m

Εδώ ο κινητός μέσος όρος, που σχετίζεται με το τέλος του διαστήματος, συμβολίζεται με το νέο σύμβολο M i . Ουσιαστικά, το M i ισούται με y t μετατοπισμένα ξ βήματα προς τα δεξιά, δηλαδή M i = y t + ξ , όπου i = t + ξ .

Λαμβάνοντας υπόψη ότι το M i − 1 είναι μια εκτίμηση του y i − m , η έκφραση (5.1)

μπορεί να ξαναγραφτεί στη φόρμα

y i+ 1

M i − 1,

Το M i ορίζεται από την έκφραση (5.1).

όπου M i είναι η εκτίμηση

Εάν οι υπολογισμοί (5.2) επαναληφθούν καθώς έρχονται νέες πληροφορίες

και ξαναγράψουμε σε διαφορετική μορφή, τότε λαμβάνουμε μια εξομαλυνόμενη συνάρτηση παρατήρησης:

Q i= α y i+ (1 − α ) Q i− 1 ,

ή σε αντίστοιχη μορφή

Q t= α y t+ (1 − α ) Q t− 1

Οι υπολογισμοί που πραγματοποιούνται με την έκφραση (5.3) με κάθε νέα παρατήρηση ονομάζονται εκθετική εξομάλυνση. Στην τελευταία έκφραση, για να διακρίνουμε την εκθετική εξομάλυνση από τον κινούμενο μέσο όρο, εισάγεται ο συμβολισμός Q αντί του M . Η τιμή α , που είναι

ανάλογο του m 1 ονομάζεται σταθερά εξομάλυνσης. Οι τιμές του α βρίσκονται μέσα

διάστημα [0, 1]. Αν το α παριστάνεται ως σειρά

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

είναι εύκολο να δει κανείς ότι τα «βαρίδια» μειώνονται εκθετικά στο χρόνο. Για παράδειγμα, για α = 0 , 2 παίρνουμε

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Το άθροισμα της σειράς τείνει προς τη μονάδα και οι όροι του αθροίσματος μειώνονται με το χρόνο.

Η τιμή του Q t στην έκφραση (5.3) είναι ο εκθετικός μέσος όρος της πρώτης τάξης, δηλαδή ο μέσος όρος που λαμβάνεται απευθείας από

εξομάλυνση των δεδομένων παρατήρησης (πρωτογενής εξομάλυνση). Μερικές φορές κατά την ανάπτυξη στατιστικών μοντέλων είναι χρήσιμο να καταφεύγουμε στον υπολογισμό των εκθετικών μέσων όρων υψηλότερων τάξεων, δηλαδή των μέσων όρων που λαμβάνονται με επαναλαμβανόμενη εκθετική εξομάλυνση.

Ο γενικός συμβολισμός στην αναδρομική μορφή του εκθετικού μέσου της τάξης k είναι

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Η τιμή του k ποικίλλει εντός 1, 2, …, p ,p+1 , όπου p είναι η τάξη του προγνωστικού πολυωνύμου (γραμμικό, τετραγωνικό κ.λπ.).

Με βάση αυτόν τον τύπο, για τον εκθετικό μέσο όρο της πρώτης, δεύτερης και τρίτης τάξης, οι εκφράσεις

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Προσδιορισμός των παραμέτρων του προγνωστικού μοντέλου με τη μέθοδο της εκθετικής εξομάλυνσης

Προφανώς, για να αναπτυχθούν προγνωστικές τιμές με βάση τις δυναμικές σειρές χρησιμοποιώντας τη μέθοδο της εκθετικής εξομάλυνσης, είναι απαραίτητο να υπολογιστούν οι συντελεστές της εξίσωσης τάσης μέσω εκθετικών μέσων. Οι εκτιμήσεις των συντελεστών καθορίζονται από το θεμελιώδες θεώρημα των Brown-Meyer, το οποίο συσχετίζει τους συντελεστές του προγνωστικού πολυωνύμου με τους εκθετικούς μέσους όρους των αντίστοιχων τάξεων:

(− 1 )

aˆp

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑j

p=0

Π! (k− 1 ) !j = 0

όπου aˆ p είναι εκτιμήσεις των συντελεστών του πολυωνύμου του βαθμού p .

Οι συντελεστές βρίσκονται λύνοντας το σύστημα (p + 1 ) των εξισώσεων сp + 1

άγνωστος.

Έτσι, για ένα γραμμικό μοντέλο

aˆ 0 = 2 Q t (1 ) − Q t (2 ) ; aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

για ένα τετραγωνικό μοντέλο

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Η πρόβλεψη υλοποιείται σύμφωνα με το επιλεγμένο πολυώνυμο, αντίστοιχα, για το γραμμικό μοντέλο

ˆyt + τ = aˆ0 + aˆ1 τ ;

για ένα τετραγωνικό μοντέλο

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2,

όπου τ είναι το βήμα πρόβλεψης.

Πρέπει να σημειωθεί ότι οι εκθετικοί μέσοι όροι Q t (k ) μπορούν να υπολογιστούν μόνο με μια γνωστή (επιλεγμένη) παράμετρο, γνωρίζοντας τις αρχικές συνθήκες Q 0 (k ) .

Εκτιμήσεις αρχικών συνθηκών, ειδικότερα, για ένα γραμμικό μοντέλο

Q(1)= α

1 − α

Q(2 ) = a − 2 (1 − α ) a

για ένα τετραγωνικό μοντέλο

Q(1)= α

1 − α

+ (1 − α )(2 − α ) α

2(1−α )

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q(3)=a

3(1−α)

(1 − α )(4 − 3 α ) α

όπου οι συντελεστές a 0 και a 1 υπολογίζονται με τη μέθοδο των ελαχίστων τετραγώνων.

Η τιμή της παραμέτρου εξομάλυνσης α υπολογίζεται κατά προσέγγιση από τον τύπο

α ≈ m 2 + 1,

όπου m είναι ο αριθμός των παρατηρήσεων (τιμών) στο διάστημα εξομάλυνσης. Η ακολουθία υπολογισμού των προγνωστικών τιμών εμφανίζεται στο

Υπολογισμός συντελεστών μιας σειράς με τη μέθοδο των ελαχίστων τετραγώνων

Προσδιορισμός του διαστήματος εξομάλυνσης

Υπολογισμός της σταθεράς εξομάλυνσης

Υπολογισμός αρχικών συνθηκών

Υπολογισμός εκθετικών μέσων όρων

Υπολογισμός εκτιμήσεων a 0 , a 1 , κ.λπ.

Υπολογισμός προβλεπόμενων τιμών μιας σειράς

Ρύζι. 5.1. Η σειρά υπολογισμού των προβλεπόμενων τιμών

Ως παράδειγμα, εξετάστε τη διαδικασία για τη λήψη της προγνωστικής τιμής του χρόνου λειτουργίας του προϊόντος, που εκφράζεται με το χρόνο μεταξύ των αστοχιών.

Τα αρχικά δεδομένα συνοψίζονται στον πίνακα. 5.1.

Επιλέγουμε ένα γραμμικό μοντέλο πρόβλεψης με τη μορφή y t = a 0 + a 1 τ

Η λύση είναι εφικτή με τις ακόλουθες αρχικές τιμές:

a 0 , 0 = 64, 2; a 1, 0 = 31,5; α = 0,305.

Πίνακας 5.1. Αρχικά στοιχεία

Αριθμός παρατήρησης, t

Βήμα μήκος, πρόβλεψη, τ

MTBF, y (ώρα)

Για αυτές τις τιμές, οι υπολογισμένοι «εξομαλυνθέντες» συντελεστές για

y 2 τιμές θα είναι ίσες

= α Q (1 )− Q (2 )= 97 , 9 ;

[ Q (1 ) − Q (2 )

31, 9 ,

1−α

υπό αρχικές συνθήκες

1 − α

A 0 , 0 −

α 1, 0

= −7 , 6

1 − α

= −79 , 4

και εκθετικούς μέσους όρους

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q(2)

= α Q (1 )

+ (1 −α ) Q (2 ) = −47 , 5 .

Στη συνέχεια, η "εξομαλυνθείσα" τιμή y 2 υπολογίζεται από τον τύπο

Q i (1)

Q i (2)

a 0, i

a 1, i

ˆyt

Έτσι (Πίνακας 5.2), το γραμμικό μοντέλο πρόβλεψης έχει τη μορφή

ˆy t + τ = 224,5+ 32τ .

Ας υπολογίσουμε τις προβλεπόμενες τιμές για περιόδους μολύβδου 2 ετών (τ = 1 ), 4 ετών (τ = 2 ) και ούτω καθεξής, τον χρόνο μεταξύ των αστοχιών του προϊόντος (Πίνακας 5.3).

Πίνακας 5.3. Τιμές πρόβλεψηςˆy t

Η εξίσωση

t+2

t+4

t+6

t+8

t+20

οπισθοδρόμηση

(τ = 1)

(τ=2)

(τ = 3)

(τ=5)

τ =

ˆy t = 224,5+ 32τ

Πρέπει να σημειωθεί ότι το συνολικό "βάρος" των τελευταίων τιμών m της χρονοσειράς μπορεί να υπολογιστεί με τον τύπο

c = 1 − (m (− 1 ) m ) . m+ 1

Έτσι, για τις δύο τελευταίες παρατηρήσεις της σειράς (m = 2 ) η τιμή c = 1 − (2 2 − + 1 1 ) 2 = 0. 667 .

5.3. Επιλογή αρχικών συνθηκών και προσδιορισμός της σταθεράς εξομάλυνσης

Όπως προκύπτει από την έκφραση

Q t= α y t+ (1 − α ) Q t− 1 ,

όταν εκτελείτε εκθετική εξομάλυνση, είναι απαραίτητο να γνωρίζετε την αρχική (προηγούμενη) τιμή της εξομαλυνόμενης συνάρτησης. Σε ορισμένες περιπτώσεις, η πρώτη παρατήρηση μπορεί να ληφθεί ως αρχική τιμή· πιο συχνά, οι αρχικές συνθήκες καθορίζονται σύμφωνα με τις εκφράσεις (5.4) και (5.5). Σε αυτήν την περίπτωση, οι τιμές a 0, 0, a 1, 0

και a 2, 0 προσδιορίζονται με τη μέθοδο των ελαχίστων τετραγώνων.

Εάν δεν εμπιστευόμαστε πραγματικά την επιλεγμένη αρχική τιμή, τότε παίρνοντας μια μεγάλη τιμή της σταθεράς εξομάλυνσης α μέσω k παρατηρήσεων, θα φέρουμε

«βάρος» της αρχικής τιμής μέχρι την τιμή (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Έτσι, η επιλογή της σταθεράς εξομάλυνσης (ή του αριθμού των παρατηρήσεων στον κινητό μέσο όρο) συνεπάγεται ένα συμβιβασμό. Συνήθως, όπως δείχνει η πρακτική, η τιμή της σταθεράς εξομάλυνσης βρίσκεται στην περιοχή από 0,01 έως 0,3.

Είναι γνωστές αρκετές μεταβάσεις που επιτρέπουν σε κάποιον να βρει μια κατά προσέγγιση εκτίμηση του α . Το πρώτο προκύπτει από την προϋπόθεση ότι ο κινητός μέσος όρος και ο εκθετικός μέσος όρος είναι ίσοι

α \u003d m 2 + 1,

όπου m είναι ο αριθμός των παρατηρήσεων στο διάστημα εξομάλυνσης. Άλλες προσεγγίσεις σχετίζονται με την ακρίβεια της πρόβλεψης.

Έτσι, είναι δυνατός ο προσδιορισμός του α με βάση τη σχέση Meyer:

α ≈ S y,

όπου S y είναι το τυπικό σφάλμα του μοντέλου.

Το S 1 είναι το μέσο τετραγωνικό σφάλμα της αρχικής σειράς.

Ωστόσο, η χρήση της τελευταίας αναλογίας περιπλέκεται από το γεγονός ότι είναι πολύ δύσκολο να προσδιοριστούν αξιόπιστα τα S y και S 1 από τις αρχικές πληροφορίες.

Συχνά η παράμετρος εξομάλυνσης και ταυτόχρονα οι συντελεστές a 0 , 0 και a 0 , 1

επιλέγονται ως βέλτιστα ανάλογα με το κριτήριο

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j=0

λύνοντας το αλγεβρικό σύστημα εξισώσεων, το οποίο προκύπτει εξισώνοντας τις παραγώγους με το μηδέν

∂S2

∂S2

∂S2

∂a0, 0

∂ a 1, 0

∂a2, 0

Έτσι, για ένα γραμμικό μοντέλο πρόβλεψης, το αρχικό κριτήριο είναι ίσο με

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j=0

Η λύση αυτού του συστήματος με τη βοήθεια υπολογιστή δεν παρουσιάζει δυσκολίες.

Για μια λογική επιλογή του α, μπορείτε επίσης να χρησιμοποιήσετε τη διαδικασία γενικευμένης εξομάλυνσης, η οποία σας επιτρέπει να αποκτήσετε τις ακόλουθες σχέσεις που σχετίζονται με τη διακύμανση πρόβλεψης και την παράμετρο εξομάλυνσης για ένα γραμμικό μοντέλο:

S p 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

για ένα τετραγωνικό μοντέλο

S p 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

όπου β = 1 α ;μικρόy– Προσέγγιση RMS της αρχικής δυναμικής σειράς.

Θέμα 3. Εξομάλυνση και πρόβλεψη χρονοσειρών με βάση μοντέλα τάσεων

σκοπόςη μελέτη αυτού του θέματος είναι η δημιουργία μιας βασικής βάσης για την εκπαίδευση των διευθυντών στην ειδικότητα 080507 στον τομέα της κατασκευής μοντέλων διαφόρων εργασιών στον τομέα της οικονομίας, η διαμόρφωση μιας συστηματικής προσέγγισης για τον καθορισμό και την επίλυση προβλημάτων πρόβλεψης μεταξύ των μαθητών . Το προτεινόμενο μάθημα θα επιτρέψει στους ειδικούς να προσαρμοστούν γρήγορα στην πρακτική εργασία, να περιηγηθούν καλύτερα στις επιστημονικές και τεχνικές πληροφορίες και βιβλιογραφία της ειδικότητάς τους και να λάβουν πιο σίγουρες αποφάσεις που προκύπτουν στην εργασία τους.

Κύριος καθήκονταμελέτη του θέματος είναι: οι σπουδαστές αποκτούν εις βάθος θεωρητικές γνώσεις σχετικά με την εφαρμογή μοντέλων πρόβλεψης, απόκτηση σταθερών δεξιοτήτων στην εκτέλεση ερευνητικής εργασίας, ικανότητα επίλυσης πολύπλοκων επιστημονικών προβλημάτων που σχετίζονται με μοντέλα κατασκευής, συμπεριλαμβανομένων πολυδιάστατων, ικανότητα λογικής ανάλυσης αποτελέσματα που λαμβάνονται και καθορίζουν τρόπους εξεύρεσης αποδεκτών λύσεων.

Μια αρκετά απλή μέθοδος για τον προσδιορισμό των τάσεων ανάπτυξης είναι η εξομάλυνση των χρονοσειρών, δηλαδή η αντικατάσταση των πραγματικών επιπέδων με υπολογισμένα που έχουν μικρότερες διακυμάνσεις από τα αρχικά δεδομένα. Ο αντίστοιχος μετασχηματισμός ονομάζεται φιλτράρισμα. Ας εξετάσουμε διάφορες μεθόδους εξομάλυνσης.

3.1. απλοί μέσοι όροι

Ο στόχος της εξομάλυνσης είναι η οικοδόμηση ενός μοντέλου πρόβλεψης για μελλοντικές περιόδους με βάση τις προηγούμενες παρατηρήσεις. Στη μέθοδο των απλών μέσων όρων, οι τιμές της μεταβλητής λαμβάνονται ως αρχικά δεδομένα Υσε χρονικά σημεία t, και η τιμή πρόβλεψης καθορίζεται ως απλός μέσος όρος για την επόμενη χρονική περίοδο. Ο τύπος υπολογισμού έχει τη μορφή

όπου nαριθμός παρατηρήσεων.

Στην περίπτωση που διατίθεται νέα παρατήρηση, η πρόβλεψη που ελήφθη πρόσφατα θα πρέπει επίσης να λαμβάνεται υπόψη για την πρόβλεψη για την επόμενη περίοδο. Κατά τη χρήση αυτής της μεθόδου, η πρόβλεψη πραγματοποιείται με τον μέσο όρο όλων των προηγούμενων δεδομένων, ωστόσο, το μειονέκτημα μιας τέτοιας πρόβλεψης είναι η δυσκολία χρήσης της σε μοντέλα τάσεων.

3.2. Μέθοδος κινητού μέσου όρου

Αυτή η μέθοδος βασίζεται στην αναπαράσταση της σειράς ως άθροισμα μιας αρκετά ομαλής τάσης και μιας τυχαίας συνιστώσας. Η μέθοδος βασίζεται στην ιδέα του υπολογισμού της θεωρητικής τιμής με βάση μια τοπική προσέγγιση. Για να δημιουργήσετε μια εκτίμηση τάσης σε ένα σημείο tαπό τις τιμές της σειράς από το χρονικό διάστημα υπολογίστε τη θεωρητική τιμή της σειράς. Η πιο διαδεδομένη στην πρακτική εξομάλυνσης σειρών είναι η περίπτωση που όλα τα βάρη για τα στοιχεία του διαστήματος είναι ίσα μεταξύ τους. Για το λόγο αυτό, αυτή η μέθοδος ονομάζεται μέθοδος κινούμενου μέσου όρου,αφού όταν εκτελείται η διαδικασία, ένα παράθυρο με πλάτος του (2 m + 1)σε όλη τη σειρά. Το πλάτος του παραθύρου συνήθως λαμβάνεται μονό, αφού η θεωρητική τιμή υπολογίζεται για την κεντρική τιμή: τον αριθμό των όρων k = 2m + 1με τον ίδιο αριθμό επιπέδων αριστερά και δεξιά της στιγμής t.

Ο τύπος για τον υπολογισμό του κινητού μέσου όρου σε αυτήν την περίπτωση έχει τη μορφή:

Η διασπορά του κινητού μέσου όρου ορίζεται ως σ 2 /k,όπου μέσω σ2υποδηλώνει τη διακύμανση των αρχικών όρων της σειράς, και κδιάστημα εξομάλυνσης, επομένως όσο μεγαλύτερο είναι το διάστημα εξομάλυνσης, τόσο ισχυρότερος είναι ο μέσος όρος των δεδομένων και τόσο λιγότερο μεταβλητή είναι η τάση. Τις περισσότερες φορές, η εξομάλυνση εκτελείται σε τρία, πέντε και επτά μέλη της αρχικής σειράς. Σε αυτήν την περίπτωση, θα πρέπει να ληφθούν υπόψη τα ακόλουθα χαρακτηριστικά του κινητού μέσου όρου: εάν λάβουμε υπόψη μια σειρά με περιοδικές διακυμάνσεις σταθερού μήκους, τότε κατά την εξομάλυνση με βάση τον κινητό μέσο όρο με διάστημα εξομάλυνσης ίσο ή πολλαπλάσιο της περιόδου , οι διακυμάνσεις θα εξαλειφθούν πλήρως. Συχνά, η εξομάλυνση με βάση έναν κινητό μέσο όρο μετασχηματίζει τη σειρά τόσο έντονα που η τάση ανάπτυξης που προσδιορίζεται εμφανίζεται μόνο με τους πιο γενικούς όρους, ενώ εξαφανίζονται μικρότερες, αλλά σημαντικές για την ανάλυση λεπτομέρειες (κύματα, στροφές, κ.λπ.). μετά την εξομάλυνση, τα μικρά κύματα μπορούν μερικές φορές να αλλάξουν κατεύθυνση προς τα αντίθετα «κοίλώματα» εμφανίζονται στη θέση των «κορυφών» και αντίστροφα. Όλα αυτά απαιτούν προσοχή στη χρήση ενός απλού κινούμενου μέσου όρου και αναγκάζουν κάποιον να αναζητήσει πιο λεπτές μεθόδους περιγραφής.

Η μέθοδος κινητού μέσου όρου δεν δίνει τιμές τάσης για την πρώτη και την τελευταία Μμέλη της σειράς. Αυτή η έλλειψη είναι ιδιαίτερα αισθητή στην περίπτωση που το μήκος της σειράς είναι μικρό.

3.3. Εκθετική εξομάλυνση

Εκθετικός Μέσος όρος y tείναι ένα παράδειγμα ασύμμετρου σταθμισμένου κινητού μέσου όρου που λαμβάνει υπόψη τον βαθμό γήρανσης των δεδομένων: "παλαιότερες" πληροφορίες με μικρότερο βάρος εισέρχονται στον τύπο για τον υπολογισμό της εξομαλυνόμενης τιμής του επιπέδου της σειράς

Εδώ — εκθετικός μέσος που αντικαθιστά την παρατηρούμενη τιμή της σειράς y t(η εξομάλυνση περιλαμβάνει όλα τα δεδομένα που λαμβάνονται μέχρι την τρέχουσα στιγμή t), α παράμετρος εξομάλυνσης που χαρακτηρίζει το βάρος της τρέχουσας (νεότερης) παρατήρησης. 0< α <1.

Η μέθοδος χρησιμοποιείται για την πρόβλεψη μη στάσιμων χρονοσειρών με τυχαίες αλλαγές στο επίπεδο και την κλίση. Καθώς απομακρυνόμαστε από την τρέχουσα χρονική στιγμή στο παρελθόν, το βάρος του αντίστοιχου όρου της σειράς μειώνεται γρήγορα (εκθετικά) και πρακτικά παύει να έχει καμία επίδραση στην τιμή του .

Είναι εύκολο να δούμε ότι η τελευταία σχέση μας επιτρέπει να δώσουμε την ακόλουθη ερμηνεία του εκθετικού μέσου όρου: αν — πρόβλεψη τιμής σειράς y t, τότε η διαφορά είναι το σφάλμα πρόβλεψης. Η πρόβλεψη λοιπόν για το επόμενο χρονικό σημείο t+1λαμβάνει υπόψη όσα έγιναν γνωστά αυτή τη στιγμή tσφάλμα πρόβλεψης.

Επιλογή εξομάλυνσης α είναι ένας παράγοντας στάθμισης. Αν α κοντά στην ενότητα, τότε η πρόβλεψη λαμβάνει σημαντικά υπόψη το μέγεθος του σφάλματος της τελευταίας πρόβλεψης. Για μικρές αξίες α η προβλεπόμενη τιμή είναι κοντά στην προηγούμενη πρόβλεψη. Η επιλογή της παραμέτρου εξομάλυνσης είναι ένα αρκετά περίπλοκο πρόβλημα. Οι γενικές εκτιμήσεις είναι οι εξής: η μέθοδος είναι καλή για την πρόβλεψη επαρκώς ομαλών σειρών. Σε αυτήν την περίπτωση, μπορεί κανείς να επιλέξει μια σταθερά εξομάλυνσης ελαχιστοποιώντας το σφάλμα πρόβλεψης ενός βήματος μπροστά που εκτιμάται από το τελευταίο τρίτο της σειράς. Ορισμένοι ειδικοί δεν συνιστούν τη χρήση μεγάλων τιμών της παραμέτρου εξομάλυνσης. Στο σχ. Το 3.1 δείχνει ένα παράδειγμα εξομάλυνσης σειράς που χρησιμοποιεί τη μέθοδο εκθετικής εξομάλυνσης για α= 0,1.

Ρύζι. 3.1. Το αποτέλεσμα της εκθετικής εξομάλυνσης στο α =0,1
(1 πρωτότυπη σειρά, 2 λειασμένες σειρές, 3 υπολείμματα)

3.4. Εκθετική εξομάλυνση
βάσει τάσεων (μέθοδος Holt)

Αυτή η μέθοδος λαμβάνει υπόψη την τοπική γραμμική τάση που υπάρχει στις χρονοσειρές. Εάν υπάρχει ανοδική τάση στη χρονοσειρά, τότε μαζί με την εκτίμηση του τρέχοντος επιπέδου, είναι απαραίτητη και η εκτίμηση της κλίσης. Στην τεχνική Holt, οι τιμές στάθμης και κλίσης εξομαλύνονται απευθείας χρησιμοποιώντας διαφορετικές σταθερές για κάθε μία από τις παραμέτρους. Οι σταθερές εξομάλυνσης σάς επιτρέπουν να υπολογίζετε το τρέχον επίπεδο και κλίση, βελτιώνοντάς τα κάθε φορά που γίνονται νέες παρατηρήσεις.

Η μέθοδος Holt χρησιμοποιεί τρεις τύπους υπολογισμού:

  1. Εκθετικά εξομαλυνθείσα σειρά (εκτίμηση τρέχοντος επιπέδου)

(3.2)

  1. Αξιολόγηση τάσεων

(3.3)

  1. Πρόβλεψη για Rεπόμενες περιόδους

(3.4)

όπου α, β εξομάλυνση σταθερών από το διάστημα .

Η εξίσωση (3.2) είναι παρόμοια με την εξίσωση (3.1) για απλή εκθετική εξομάλυνση εκτός από τον όρο τάσης. Συνεχής β απαιτείται για την εξομάλυνση της εκτίμησης της τάσης. Στην εξίσωση πρόβλεψης (3.3), η εκτίμηση της τάσης πολλαπλασιάζεται με τον αριθμό των περιόδων R, στο οποίο βασίζεται η πρόβλεψη και, στη συνέχεια, αυτό το προϊόν προστίθεται στο τρέχον επίπεδο εξομάλυνσης δεδομένων.

Μόνιμος α και β επιλέγονται υποκειμενικά ή ελαχιστοποιώντας το σφάλμα πρόβλεψης. Όσο μεγαλύτερες είναι οι τιμές των βαρών που λαμβάνονται, τόσο πιο γρήγορα θα πραγματοποιείται η απόκριση στις συνεχείς αλλαγές και τα δεδομένα θα εξομαλύνονται. Τα μικρότερα βάρη κάνουν τη δομή των εξομαλυνόμενων τιμών λιγότερο επίπεδη.

Στο σχ. Το 3.2 δείχνει ένα παράδειγμα εξομάλυνσης μιας σειράς χρησιμοποιώντας τη μέθοδο Holt για τιμές α και β ίσο με 0,1.

Ρύζι. 3.2. Αποτέλεσμα λείανσης Holt
στο α = 0,1 και β = 0,1

3.5. Εκθετική εξομάλυνση με τάσεις και εποχιακές παραλλαγές (μέθοδος χειμώνα)

Εάν υπάρχουν εποχιακές διακυμάνσεις στη δομή δεδομένων, το μοντέλο εκθετικής εξομάλυνσης τριών παραμέτρων που προτείνεται από τον Winters χρησιμοποιείται για τη μείωση των σφαλμάτων πρόβλεψης. Αυτή η προσέγγιση είναι μια επέκταση του προηγούμενου μοντέλου Holt. Για να ληφθούν υπόψη οι εποχιακές διακυμάνσεις, χρησιμοποιείται εδώ μια πρόσθετη εξίσωση και αυτή η μέθοδος περιγράφεται πλήρως από τέσσερις εξισώσεις:

  1. Εκθετικά εξομαλυνθείσα σειρά

(3.5)

  1. Αξιολόγηση τάσεων

(3.6)

  1. Εκτίμηση εποχικότητας

.

(3.7)

  1. Πρόβλεψη για Rεπόμενες περιόδους

(3.8)

όπου α, β, γ σταθερή εξομάλυνση για επίπεδο, τάση και εποχικότητα, αντίστοιχα. μικρό- τη διάρκεια της περιόδου εποχικής διακύμανσης.

Η εξίσωση (3.5) διορθώνει την εξομαλυνόμενη σειρά. Σε αυτή την εξίσωση, ο όρος λαμβάνει υπόψη την εποχικότητα στα αρχικά δεδομένα. Αφού ληφθούν υπόψη η εποχικότητα και η τάση στις εξισώσεις (3.6), (3.7), οι εκτιμήσεις εξομαλύνονται και γίνεται μια πρόβλεψη στην εξίσωση (3.8).

Όπως και στην προηγούμενη μέθοδο, τα βάρη α, β, γ μπορεί να επιλεγεί υποκειμενικά ή ελαχιστοποιώντας το σφάλμα πρόβλεψης. Πριν από την εφαρμογή της εξίσωσης (3.5), είναι απαραίτητο να προσδιοριστούν οι αρχικές τιμές για την εξομαλυνόμενη σειρά L t, τάση T t, συντελεστές εποχικότητας S t. Συνήθως, η αρχική τιμή της εξομαλυνόμενης σειράς λαμβάνεται ίση με την πρώτη παρατήρηση, στη συνέχεια η τάση είναι μηδέν και οι εποχικοί συντελεστές ορίζονται ίσοι με ένα.

Στο σχ. Το 3.3 δείχνει ένα παράδειγμα εξομάλυνσης μιας σειράς χρησιμοποιώντας τη μέθοδο Winters.

Ρύζι. 3.3. Το αποτέλεσμα της εξομάλυνσης με τη μέθοδο Winters
στο α = 0,1 = 0,1; γ = 0,1(1- αρχική σειρά, 2 λειασμένες σειρές, 3 υπολείμματα)

3.6. Πρόβλεψη βασισμένη σε μοντέλα τάσεων

Αρκετά συχνά οι χρονοσειρές έχουν γραμμική τάση (τάση). Υποθέτοντας μια γραμμική τάση, πρέπει να δημιουργήσετε μια ευθεία γραμμή που θα αντικατοπτρίζει με μεγαλύτερη ακρίβεια τη μεταβολή της δυναμικής κατά την υπό εξέταση περίοδο. Υπάρχουν διάφορες μέθοδοι για την κατασκευή μιας ευθείας γραμμής, αλλά η πιο αντικειμενική από τυπική άποψη θα είναι μια κατασκευή που βασίζεται στην ελαχιστοποίηση του αθροίσματος των αρνητικών και θετικών αποκλίσεων των αρχικών τιμών της σειράς από μια ευθεία γραμμή.

Μια ευθεία γραμμή σε σύστημα δύο συντεταγμένων (x, y)μπορεί να οριστεί ως το σημείο τομής μιας από τις συντεταγμένες στοκαι η γωνία κλίσης προς τον άξονα Χ.Η εξίσωση για μια τέτοια ευθεία θα μοιάζει όπου ένα-Σημείο διασταύρωσης? σιγωνία κλίσης.

Προκειμένου η ευθεία γραμμή να αντικατοπτρίζει την πορεία της δυναμικής, είναι απαραίτητο να ελαχιστοποιηθεί το άθροισμα των κατακόρυφων αποκλίσεων. Όταν χρησιμοποιείται ως κριτήριο για την εκτίμηση της ελαχιστοποίησης ενός απλού αθροίσματος αποκλίσεων, το αποτέλεσμα δεν θα είναι πολύ καλό, αφού οι αρνητικές και οι θετικές αποκλίσεις αλληλοεξουδετερώνονται. Η ελαχιστοποίηση του αθροίσματος των απόλυτων τιμών δεν οδηγεί επίσης σε ικανοποιητικά αποτελέσματα, καθώς οι εκτιμήσεις παραμέτρων σε αυτήν την περίπτωση είναι ασταθείς, υπάρχουν επίσης υπολογιστικές δυσκολίες στην εφαρμογή μιας τέτοιας διαδικασίας εκτίμησης. Επομένως, η πιο συχνά χρησιμοποιούμενη διαδικασία είναι η ελαχιστοποίηση του αθροίσματος των τετραγωνικών αποκλίσεων ή μέθοδος ελάχιστου τετραγώνου(ΜΝΚ).

Δεδομένου ότι η σειρά των αρχικών τιμών έχει διακυμάνσεις, το μοντέλο της σειράς θα περιέχει σφάλματα, τα τετράγωνα των οποίων πρέπει να ελαχιστοποιηθούν

όπου y παρατήρησα τιμή. y i * θεωρητικές τιμές του μοντέλου. αριθμός παρατήρησης.

Όταν μοντελοποιούμε την τάση της αρχικής χρονοσειράς χρησιμοποιώντας μια γραμμική τάση, θα το υποθέσουμε

Διαιρώντας την πρώτη εξίσωση με n, φτάνουμε στο επόμενο

Αντικαθιστώντας την έκφραση που προκύπτει στη δεύτερη εξίσωση του συστήματος (3.10), για τον συντελεστή σι*παίρνουμε:

3.7. Έλεγχος προσαρμογής μοντέλου

Για παράδειγμα, στο σχ. Το 3.4 δείχνει ένα γράφημα γραμμικής παλινδρόμησης μεταξύ της ισχύος του αυτοκινήτου Χκαι το κόστος του στο.

Ρύζι. 3.4. Γράφημα γραμμικής παλινδρόμησης

Η εξίσωση για αυτή την περίπτωση είναι: στο=1455,3 + 13,4 Χ. Η οπτική ανάλυση αυτού του σχήματος δείχνει ότι για έναν αριθμό παρατηρήσεων υπάρχουν σημαντικές αποκλίσεις από τη θεωρητική καμπύλη. Το υπολειπόμενο γράφημα φαίνεται στο Σχ. 3.5.

Ρύζι. 3.5. Διάγραμμα υπολειμμάτων

Η ανάλυση των υπολειμμάτων της γραμμής παλινδρόμησης μπορεί να παρέχει ένα χρήσιμο μέτρο για το πόσο καλά η εκτιμώμενη παλινδρόμηση αντικατοπτρίζει τα πραγματικά δεδομένα. Μια καλή παλινδρόμηση είναι αυτή που εξηγεί μια σημαντική ποσότητα διακύμανσης και, αντιστρόφως, μια κακή παλινδρόμηση δεν παρακολουθεί μια μεγάλη ποσότητα διακυμάνσεων στα αρχικά δεδομένα. Είναι διαισθητικά σαφές ότι οποιαδήποτε πρόσθετη πληροφορία θα βελτιώσει το μοντέλο, δηλαδή θα μειώσει το ανεξήγητο κλάσμα της παραλλαγής της μεταβλητής στο. Για να αναλύσουμε την παλινδρόμηση, θα αποσυνθέσουμε τη διακύμανση σε συνιστώσες. Είναι προφανές ότι

Ο τελευταίος όρος θα είναι ίσος με μηδέν, αφού είναι το άθροισμα των υπολοίπων, οπότε καταλήγουμε στο εξής αποτέλεσμα

όπου SS0, SS1, SS2προσδιορίστε το σύνολο, την παλινδρόμηση και τα υπολειπόμενα αθροίσματα των τετραγώνων, αντίστοιχα.

Το άθροισμα της παλινδρόμησης των τετραγώνων μετρά το τμήμα της διακύμανσης που εξηγείται από μια γραμμική σχέση. υπολειπόμενο τμήμα της διασποράς, που δεν εξηγείται από μια γραμμική εξάρτηση.

Κάθε ένα από αυτά τα αθροίσματα χαρακτηρίζεται από έναν αντίστοιχο αριθμό βαθμών ελευθερίας (HR), ο οποίος καθορίζει τον αριθμό των μονάδων δεδομένων που είναι ανεξάρτητες μεταξύ τους. Με άλλα λόγια, ο καρδιακός ρυθμός σχετίζεται με τον αριθμό των παρατηρήσεων nκαι τον αριθμό των παραμέτρων που υπολογίζεται από το σύνολο αυτών των παραμέτρων. Στην υπό εξέταση περίπτωση να υπολογίσουμε SS0 προσδιορίζεται μόνο μία σταθερά (μέση τιμή), επομένως ο καρδιακός ρυθμός για SS0 θα είναι 1), καρδιακός ρυθμός για SS 2 - (n - 2)και καρδιακός ρυθμός για SS 1θα είναι n - (n - 1)=1, αφού υπάρχουν n - 1 σταθερά σημεία στην εξίσωση παλινδρόμησης. Ακριβώς όπως τα αθροίσματα των τετραγώνων, οι καρδιακοί παλμοί σχετίζονται με

Τα αθροίσματα των τετραγώνων που σχετίζονται με την αποσύνθεση της διακύμανσης, μαζί με τους αντίστοιχους καρδιακούς παλμούς, μπορούν να τοποθετηθούν στον λεγόμενο πίνακα ανάλυσης διακύμανσης (ANOVA ANAlysis Of VAriance table) (Πίνακας 3.1).

Πίνακας 3.1

τραπέζι ANOVA

Πηγή

Άθροισμα τετραγώνων

Μεσαίο τετράγωνο

Οπισθοδρόμηση

SS2/ (n-2)

Χρησιμοποιώντας την εισαγόμενη συντομογραφία για αθροίσματα τετραγώνων, ορίζουμε συντελεστή προσδιορισμούως ο λόγος του αθροίσματος της παλινδρόμησης των τετραγώνων προς το συνολικό άθροισμα των τετραγώνων ως

(3.13)

Ο συντελεστής προσδιορισμού μετρά την αναλογία μεταβλητότητας σε μια μεταβλητή Υ, το οποίο μπορεί να εξηγηθεί χρησιμοποιώντας πληροφορίες σχετικά με τη μεταβλητότητα της ανεξάρτητης μεταβλητής Χ.Ο συντελεστής προσδιορισμού αλλάζει από μηδέν όταν Χδεν επηρεάζει Υ,σε ένα όταν η αλλαγή Υεξηγείται πλήρως από την αλλαγή Χ.

3.8. Μοντέλο Πρόβλεψης Παλινδρόμησης

Η καλύτερη πρόβλεψη είναι αυτή με τη μικρότερη απόκλιση. Στην περίπτωσή μας, τα συμβατικά ελάχιστα τετράγωνα παράγουν την καλύτερη πρόβλεψη από όλες τις μεθόδους που δίνουν αμερόληπτες εκτιμήσεις βασισμένες σε γραμμικές εξισώσεις. Το σφάλμα πρόβλεψης που σχετίζεται με τη διαδικασία πρόβλεψης μπορεί να προέρχεται από τέσσερις πηγές.

Πρώτον, η τυχαία φύση των προσθετικών σφαλμάτων που χειρίζονται με γραμμική παλινδρόμηση διασφαλίζει ότι η πρόβλεψη θα αποκλίνει από τις πραγματικές τιμές, ακόμη κι αν το μοντέλο έχει καθοριστεί σωστά και οι παράμετροί του είναι επακριβώς γνωστές.

Δεύτερον, η ίδια η διαδικασία εκτίμησης εισάγει ένα σφάλμα στην εκτίμηση των παραμέτρων που σπάνια μπορεί να είναι ίσες με τις πραγματικές τιμές, αν και είναι ίσες με αυτές κατά μέσο όρο.

Τρίτον, στην περίπτωση μιας υπό όρους πρόβλεψης (στην περίπτωση άγνωστων ακριβών τιμών των ανεξάρτητων μεταβλητών), το σφάλμα εισάγεται με την πρόβλεψη των επεξηγηματικών μεταβλητών.

Τέταρτον, το σφάλμα μπορεί να εμφανιστεί επειδή οι προδιαγραφές του μοντέλου είναι ανακριβείς.

Ως αποτέλεσμα, οι πηγές σφαλμάτων μπορούν να ταξινομηθούν ως εξής:

  1. τη φύση της μεταβλητής·
  2. τη φύση του μοντέλου·
  3. το σφάλμα που εισάγεται από την πρόβλεψη ανεξάρτητων τυχαίων μεταβλητών.
  4. σφάλμα προδιαγραφών.

Θα εξετάσουμε μια άνευ όρων πρόβλεψη, όταν οι ανεξάρτητες μεταβλητές προβλέπονται εύκολα και με ακρίβεια. Ξεκινάμε την εξέταση του προβλήματος ποιότητας πρόβλεψης με την εξίσωση ζευγαρωμένης παλινδρόμησης.

Η δήλωση προβλήματος σε αυτή την περίπτωση μπορεί να διατυπωθεί ως εξής: ποια θα είναι η καλύτερη πρόβλεψη y T+1, υπό την προϋπόθεση ότι στο μοντέλο y = a + bxεπιλογές ένακαι σιεκτιμάται ακριβώς και η αξία xT+1γνωστός.

Τότε η προβλεπόμενη τιμή μπορεί να οριστεί ως

Το σφάλμα πρόβλεψης θα είναι τότε

.

Το σφάλμα πρόβλεψης έχει δύο ιδιότητες:

Η προκύπτουσα απόκλιση είναι ελάχιστη μεταξύ όλων των πιθανών εκτιμήσεων που βασίζονται σε γραμμικές εξισώσεις.

Παρόλο ένακαι β είναι γνωστά, το σφάλμα πρόβλεψης εμφανίζεται λόγω του γεγονότος ότι στο T+1μπορεί να μην βρίσκεται στη γραμμή παλινδρόμησης λόγω σφάλματος ε T+1, υπακούοντας σε μια κανονική κατανομή με μηδενικό μέσο όρο και διακύμανση σ2. Για να ελέγξουμε την ποιότητα της πρόβλεψης, εισάγουμε την κανονικοποιημένη τιμή

Το διάστημα εμπιστοσύνης 95% μπορεί στη συνέχεια να οριστεί ως εξής:

όπου β 0,05ποσοστά της κανονικής κατανομής.

Τα όρια του διαστήματος 95% μπορούν να οριστούν ως

Σημειώστε ότι σε αυτή την περίπτωση το πλάτος διάστημα εμπιστοσύνηςδεν εξαρτάται από το μέγεθος Χ,και τα όρια του διαστήματος είναι ευθείες παράλληλες προς τις γραμμές παλινδρόμησης.

Συχνότερα, κατά την κατασκευή μιας γραμμής παλινδρόμησης και τον έλεγχο της ποιότητας της πρόβλεψης, είναι απαραίτητο να αξιολογηθούν όχι μόνο οι παράμετροι παλινδρόμησης, αλλά και η διακύμανση του σφάλματος πρόβλεψης. Μπορεί να φανεί ότι σε αυτή την περίπτωση η διακύμανση του σφάλματος εξαρτάται από την τιμή (), όπου είναι η μέση τιμή της ανεξάρτητης μεταβλητής. Επιπλέον, όσο μεγαλύτερη είναι η σειρά, τόσο πιο ακριβής είναι η πρόβλεψη. Το σφάλμα πρόβλεψης μειώνεται εάν η τιμή του X T+1 είναι κοντά στη μέση τιμή της ανεξάρτητης μεταβλητής και, αντίθετα, όταν απομακρύνεται από τη μέση τιμή, η πρόβλεψη γίνεται λιγότερο ακριβής. Στο σχ. Το 3.6 δείχνει τα αποτελέσματα της πρόβλεψης χρησιμοποιώντας την εξίσωση γραμμικής παλινδρόμησης για 6 χρονικά διαστήματα μπροστά μαζί με διαστήματα εμπιστοσύνης.

Ρύζι. 3.6. Πρόβλεψη Γραμμικής Παλινδρόμησης

Όπως φαίνεται από το σχ. 3.6, αυτή η γραμμή παλινδρόμησης δεν περιγράφει καλά τα αρχικά δεδομένα: υπάρχει μεγάλη απόκλιση σε σχέση με τη γραμμή προσαρμογής. Η ποιότητα του μοντέλου μπορεί να κριθεί και από τα υπολείμματα, τα οποία, με ένα ικανοποιητικό μοντέλο, θα πρέπει να κατανεμηθούν κατά προσέγγιση σύμφωνα με τον κανονικό νόμο. Στο σχ. Το 3.7 δείχνει ένα γράφημα των υπολειμμάτων, κατασκευασμένο χρησιμοποιώντας μια κλίμακα πιθανοτήτων.

Εικ.3.7. Διάγραμμα υπολειμμάτων

Όταν χρησιμοποιείται μια τέτοια κλίμακα, τα δεδομένα που υπακούουν στον κανονικό νόμο θα πρέπει να βρίσκονται σε ευθεία γραμμή. Όπως προκύπτει από το σχήμα, τα σημεία στην αρχή και στο τέλος της περιόδου παρατήρησης αποκλίνουν κάπως από μια ευθεία γραμμή, γεγονός που υποδηλώνει μια ανεπαρκώς υψηλή ποιότητα του επιλεγμένου μοντέλου με τη μορφή εξίσωσης γραμμικής παλινδρόμησης.

Στον πίνακα. Ο Πίνακας 3.2 δείχνει τα αποτελέσματα πρόβλεψης (δεύτερη στήλη) μαζί με διαστήματα εμπιστοσύνης 95% (κάτω τρίτη και άνω τέταρτη στήλη, αντίστοιχα).

Πίνακας 3.2

Αποτελέσματα πρόβλεψης

3.9. Πολυμεταβλητό μοντέλο παλινδρόμησης

Στην πολυμεταβλητή παλινδρόμηση, τα δεδομένα για κάθε περίπτωση περιλαμβάνουν τις τιμές της εξαρτημένης μεταβλητής και κάθε ανεξάρτητης μεταβλητής. Εξαρτημένη μεταβλητή yείναι μια τυχαία μεταβλητή που σχετίζεται με τις ανεξάρτητες μεταβλητές με την ακόλουθη σχέση:

όπου πρέπει να καθοριστούν συντελεστές παλινδρόμησης· ε συνιστώσα σφάλματος που αντιστοιχεί στην απόκλιση των τιμών της εξαρτημένης μεταβλητής από την πραγματική αναλογία (υποτίθεται ότι τα σφάλματα είναι ανεξάρτητα και έχουν κανονική κατανομή με μηδενικό μέσο όρο και άγνωστη διακύμανση σ ).

Για ένα δεδομένο σύνολο δεδομένων, οι εκτιμήσεις των συντελεστών παλινδρόμησης μπορούν να βρεθούν χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Εάν οι εκτιμήσεις OLS συμβολίζονται με , τότε η αντίστοιχη συνάρτηση παλινδρόμησης θα μοιάζει με:

Τα υπολείμματα είναι εκτιμήσεις της συνιστώσας σφάλματος και είναι παρόμοια με τα υπολείμματα στην περίπτωση της απλής γραμμικής παλινδρόμησης.

Η στατιστική ανάλυση ενός μοντέλου πολυμεταβλητής παλινδρόμησης πραγματοποιείται παρόμοια με την ανάλυση μιας απλής γραμμικής παλινδρόμησης. Τα τυπικά πακέτα στατιστικών προγραμμάτων καθιστούν δυνατή τη λήψη εκτιμήσεων με ελάχιστα τετράγωνα για τις παραμέτρους του μοντέλου, εκτιμήσεις των τυπικών σφαλμάτων τους. Επίσης, μπορείτε να πάρετε την αξία t- στατιστικά για τον έλεγχο της σημασίας των επιμέρους όρων του μοντέλου παλινδρόμησης και της τιμής φά- στατιστικές για τον έλεγχο της σημασίας της εξάρτησης παλινδρόμησης.

Η μορφή διαίρεσης των αθροισμάτων των τετραγώνων στην περίπτωση πολυμεταβλητής παλινδρόμησης είναι παρόμοια με την έκφραση (3.13), αλλά η αναλογία για τον καρδιακό ρυθμό θα είναι η εξής

Το τονίζουμε ξανά αυτό nείναι ο όγκος των παρατηρήσεων, και καριθμός μεταβλητών στο μοντέλο. Η συνολική διακύμανση της εξαρτημένης μεταβλητής αποτελείται από δύο συνιστώσες: τη διακύμανση που εξηγείται από τις ανεξάρτητες μεταβλητές μέσω της συνάρτησης παλινδρόμησης και την ανεξήγητη διακύμανση.

Ο πίνακας ANOVA για την περίπτωση πολυμεταβλητής παλινδρόμησης θα έχει τη μορφή που φαίνεται στον Πίνακα. 3.3.

Πίνακας 3.3

τραπέζι ANOVA

Πηγή

Άθροισμα τετραγώνων

Μεσαίο τετράγωνο

Οπισθοδρόμηση

SS2/ (n-k-1)

Ως παράδειγμα πολυμεταβλητής παλινδρόμησης, θα χρησιμοποιήσουμε δεδομένα από το πακέτο Statistica (αρχείο δεδομένων φτώχεια.Στα)Τα στοιχεία που παρουσιάζονται βασίζονται σε σύγκριση των αποτελεσμάτων των απογραφών του 1960 και του 1970. για ένα τυχαίο δείγμα 30 χωρών. Τα ονόματα των χωρών έχουν εισαχθεί ως ονόματα συμβολοσειρών και τα ονόματα όλων των μεταβλητών σε αυτό το αρχείο παρατίθενται παρακάτω:

POP_CHNG πληθυσμιακή αλλαγή για το 1960-1970.

N_EMPLD τον αριθμό των ατόμων που απασχολούνται στη γεωργία·

PT_POOR ποσοστό οικογενειών που ζουν κάτω από το όριο της φτώχειας.

TAX_RATE φορολογικός συντελεστής.

PT_PHONE ποσοστό διαμερισμάτων με τηλέφωνο.

PT_RURAL ποσοστό αγροτικού πληθυσμού.

ΗΛΙΚΙΑ μέση ηλικία.

Ως εξαρτημένη μεταβλητή, επιλέγουμε το χαρακτηριστικό Pt_Poor, και ως ανεξάρτητο - όλα τα υπόλοιπα. Οι υπολογισμένοι συντελεστές παλινδρόμησης μεταξύ των επιλεγμένων μεταβλητών δίνονται στον Πίνακα. 3.4

Πίνακας 3.4

Συντελεστές παλινδρόμησης

Αυτός ο πίνακας δείχνει τους συντελεστές παλινδρόμησης ( ΣΤΟ) και τυποποιημένοι συντελεστές παλινδρόμησης ( βήτα). Με τη βοήθεια συντελεστών ΣΤΟορίζεται η μορφή της εξίσωσης παλινδρόμησης, η οποία σε αυτή την περίπτωση έχει τη μορφή:

Η συμπερίληψη στη δεξιά πλευρά μόνο αυτών των μεταβλητών οφείλεται στο γεγονός ότι μόνο αυτά τα χαρακτηριστικά έχουν τιμή πιθανότητας Rλιγότερο από 0,05 (βλ. τέταρτη στήλη του Πίνακα 3.4).

Βιβλιογραφία

  1. Basovsky L. E.Πρόβλεψη και προγραμματισμός σε συνθήκες αγοράς. - M .: Infra - M, 2003.
  2. Box J., Jenkins G.Ανάλυση χρονοσειρών. Τεύχος 1. Πρόβλεψη και διαχείριση. – Μ.: Μιρ, 1974.
  3. Borovikov V. P., Ivchenko G. I.Πρόβλεψη στο σύστημα Statistica σε περιβάλλον Windows. - Μ.: Οικονομικά και στατιστική, 1999.
  4. Δούκας W.Επεξεργασία δεδομένων σε υπολογιστή σε παραδείγματα. - Αγία Πετρούπολη: Peter, 1997.
  5. Ivchenko B. P., Martyshchenko L. A., Ivantsov I. B.Πληροφοριακή μικροοικονομία. Μέρος 1. Μέθοδοι ανάλυσης και πρόβλεψης. - Αγία Πετρούπολη: Nordmed-Izdat, 1997.
  6. Κριτσέφσκι Μ. Λ.Εισαγωγή στα τεχνητά νευρωνικά δίκτυα: Proc. επίδομα. - Αγία Πετρούπολη: Αγία Πετρούπολη. κατάσταση θαλάσσια τεχνολογία. un-t, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al.Πολυμεταβλητή στατιστική ανάλυση στα οικονομικά. – Μ.: Unity-Dana, 1999.

1. Βασικές μεθοδολογικές διατάξεις.

Η απλή μέθοδος εκθετικής εξομάλυνσης χρησιμοποιεί έναν σταθμισμένο (εκθετικά) κινητό μέσο όρο όλων των προηγούμενων παρατηρήσεων. Αυτό το μοντέλο εφαρμόζεται συχνότερα σε δεδομένα στα οποία είναι απαραίτητο να αξιολογηθεί η ύπαρξη σχέσης μεταξύ των αναλυόμενων δεικτών (τάση) ή η εξάρτηση των αναλυόμενων δεδομένων. Ο σκοπός της εκθετικής εξομάλυνσης είναι η εκτίμηση της τρέχουσας κατάστασης, τα αποτελέσματα της οποίας θα καθορίσουν όλες τις μελλοντικές προβλέψεις.

Η εκθετική εξομάλυνση παρέχεισυνεχής ενημέρωση του μοντέλου λόγω των πιο πρόσφατων δεδομένων. Αυτή η μέθοδος βασίζεται στον μέσο όρο (εξομάλυνση) της χρονοσειράς των προηγούμενων παρατηρήσεων σε καθοδική (εκθετική) κατεύθυνση. Δίνεται δηλαδή μεγαλύτερη βαρύτητα στα μεταγενέστερα γεγονότα. Το βάρος εκχωρείται ως εξής: για την τελευταία παρατήρηση, το βάρος θα είναι η τιμή α, για την προτελευταία - (1-α), για αυτήν που ήταν πριν - (1-α) 2 κ.λπ.

Σε εξομαλυνόμενη μορφή, η νέα πρόβλεψη (για τη χρονική περίοδο t + 1) μπορεί να αναπαρασταθεί ως σταθμισμένος μέσος όρος της τελευταίας παρατήρησης μιας ποσότητας τη στιγμή t και της προηγούμενης πρόβλεψής της για την ίδια περίοδο t. Επιπλέον, το βάρος α αποδίδεται στην παρατηρούμενη τιμή και το βάρος (1- α) αποδίδεται στην πρόβλεψη. υποτίθεται ότι 0< α<1. Это правило в общем виде можно записать следующим образом.

Νέα πρόβλεψη = [α*(τελευταία παρατήρηση)]+[(1- α)*τελευταία πρόβλεψη]

πού είναι η προβλεπόμενη τιμή για την επόμενη περίοδο;

α είναι η σταθερά εξομάλυνσης.

Y t είναι η παρατήρηση της τιμής για την τρέχουσα περίοδο t.

Η προηγούμενη εξομαλυνθείσα πρόβλεψη αυτής της τιμής για την περίοδο t.

Η εκθετική εξομάλυνση είναι μια διαδικασία για τη συνεχή αναθεώρηση των αποτελεσμάτων των προβλέψεων υπό το φως των πιο πρόσφατων εξελίξεων.

Η σταθερά εξομάλυνσης α είναι ένας σταθμισμένος παράγοντας. Η πραγματική του τιμή καθορίζεται από το βαθμό στον οποίο η τρέχουσα παρατήρηση θα πρέπει να επηρεάσει την προβλεπόμενη τιμή. Αν το α είναι κοντά στο 1, τότε η πρόβλεψη λαμβάνει υπόψη την τιμή του σφάλματος της τελευταίας πρόβλεψης. Αντίθετα, για μικρές τιμές του α, η προβλεπόμενη τιμή είναι πιο κοντά στην προηγούμενη πρόβλεψη. Μπορεί να θεωρηθεί ως ένας σταθμισμένος μέσος όρος όλων των προηγούμενων παρατηρήσεων με τα βάρη να μειώνονται εκθετικά με την «ηλικία» των δεδομένων.



Πίνακας 2.1

Σύγκριση της επίδρασης διαφορετικών τιμών σταθερών εξομάλυνσης

Η σταθερά α είναι το κλειδί για την ανάλυση δεδομένων. Εάν απαιτείται οι προβλεπόμενες τιμές να είναι σταθερές και οι τυχαίες αποκλίσεις να εξομαλυνθούν, είναι απαραίτητο να επιλέξετε μια μικρή τιμή του α. Μια μεγάλη τιμή της σταθεράς α έχει νόημα εάν χρειάζεστε μια γρήγορη απόκριση σε αλλαγές στο φάσμα παρατήρησης.

2. Ένα πρακτικό παράδειγμα εκθετικής εξομάλυνσης.

Παρουσιάζονται τα στοιχεία της εταιρείας σε όγκο πωλήσεων (χιλιάδες μονάδες) για επτά χρόνια, η σταθερά εξομάλυνσης λαμβάνεται ίση με 0,1 και 0,6. Δεδομένα για 7 χρόνια αποτελούν το μέρος της δοκιμής. σε αυτά είναι απαραίτητο να αξιολογηθεί η αποτελεσματικότητα καθενός από τα μοντέλα. Για την εκθετική εξομάλυνση της σειράς, η αρχική τιμή λαμβάνεται ίση με 500 (η πρώτη τιμή των πραγματικών δεδομένων ή η μέση τιμή για 3-5 περιόδους καταγράφεται στην εξομαλυνόμενη τιμή για το 2ο τρίμηνο).

Πίνακας 2.2

Αρχικά στοιχεία

χρόνος Πραγματική αξία (πραγματική) Απαλή τιμή Σφάλμα πρόβλεψης
έτος τέταρτο 0,1 0,1
προέχω σύμφωνα με τον τύπο
#Δ/Υ 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

Στο σχ. Το 2.1 δείχνει μια πρόβλεψη με βάση την εκθετική εξομάλυνση με σταθερά εξομάλυνσης 0,1.



Ρύζι. 2.1. Εκθετική εξομάλυνση

Λύση στο Excel.

1. Επιλέξτε το μενού "Εργαλεία" - "Ανάλυση δεδομένων". Από τη λίστα Εργαλεία ανάλυσης, επιλέξτε Εκθετική εξομάλυνση. Εάν δεν υπάρχει ανάλυση δεδομένων στο μενού "Εργαλεία", τότε πρέπει να εγκαταστήσετε το "Πακέτο ανάλυσης". Για να το κάνετε αυτό, βρείτε το στοιχείο "Ρυθμίσεις" στις "Παράμετροι" και στο παράθυρο διαλόγου που εμφανίζεται, επιλέξτε το πλαίσιο "Πακέτο ανάλυσης", κάντε κλικ στο OK.

2. Το πλαίσιο διαλόγου που φαίνεται στην εικ. 2.2.

3. Στο πεδίο "input interval", εισαγάγετε τις τιμές των αρχικών δεδομένων (συν ένα ελεύθερο κελί).

4. Επιλέξτε το πλαίσιο ελέγχου "ετικέτες" (εάν η περιοχή εισαγωγής περιέχει ονόματα στηλών).

5. Εισαγάγετε μια τιμή (1-α) στο πεδίο συντελεστής απόσβεσης.

6. Στο πεδίο "input interval", εισαγάγετε την τιμή του κελιού στο οποίο θέλετε να δείτε τις τιμές που έχετε λάβει.

7. Επιλέξτε το πλαίσιο "Επιλογές" - "Έξοδος γραφήματος" για αυτόματη δημιουργία.

Ρύζι. 2.2. Πλαίσιο διαλόγου για εκθετική εξομάλυνση

3. Το έργο της εργαστηριακής εργασίας.

Υπάρχουν αρχικά στοιχεία για τους όγκους παραγωγής μιας ελαιοπαραγωγικής επιχείρησης για 2 χρόνια, που παρουσιάζονται στον Πίνακα 2.3:

Πίνακας 2.3

Αρχικά στοιχεία

Εκτελέστε εκθετική εξομάλυνση της σειράς. Πάρτε τον εκθετικό συντελεστή εξομάλυνσης ίσο με 0,1. 0,2; 0.3. Σχολιάστε τα αποτελέσματα. Μπορείτε να χρησιμοποιήσετε τα στατιστικά στοιχεία που παρουσιάζονται στο Παράρτημα 1.