Βιογραφίες Χαρακτηριστικά Ανάλυση

Πίνακας συσχέτισης μονομεταβλητής ανάλυσης διασποράς. Πολυμεταβλητή ανάλυση διασποράς και δομική μοντελοποίηση εξισώσεων

Μοντέλο διασποράς ενός παράγονταέχει τη μορφή

που Xjj-την τιμή της υπό μελέτη μεταβλητής, που λαμβάνεται στις z-επίπεδοπαράγοντας (r = 1, 2,..., t)άθροισμα σειριακός αριθμός (j- 1,2,..., Π);/y - αποτέλεσμα λόγω της επιρροής του i-ου επιπέδου του παράγοντα. ε^. - τυχαίο συστατικό, ή διαταραχή που προκαλείται από την επίδραση μη ελεγχόμενων παραγόντων, π.χ. παραλλαγή μιας μεταβλητής σε ένα μόνο επίπεδο.

Κάτω από επίπεδο παράγοντακάποιο από το μέτρο ή την κατάστασή του είναι κατανοητό, για παράδειγμα, η ποσότητα των λιπασμάτων που εφαρμόζονται, ο τύπος της τήξης μετάλλων ή ο αριθμός παρτίδας των εξαρτημάτων κ.λπ.

Βασικές προϋποθέσεις ανάλυσης διασποράς.

1. Μαθηματική προσδοκία διαταραχής ? (/ - είναι μηδέν για οποιοδήποτε i,εκείνοι.

  • 2. Οι διαταραχές είναι αμοιβαία ανεξάρτητες.
  • 3. Η διασπορά της διαταραχής (ή της μεταβλητής Xu) είναι σταθερή για οποιοδήποτε ij>εκείνοι.

4. Η διαταραχή e# (ή η μεταβλητή Xu) έχει νόμο κανονικής κατανομής N( 0; Α2).

Η επίδραση των επιπέδων παραγόντων μπορεί να είναι ως σταθερός, ή συστηματικός(μοντέλο Ι), και τυχαίος(μοντέλο II).

Ας, για παράδειγμα, είναι απαραίτητο να μάθουμε εάν υπάρχουν σημαντικές διαφορές μεταξύ των παρτίδων προϊόντων ως προς κάποιο δείκτη ποιότητας, π.χ. ελέγξτε τον αντίκτυπο στην ποιότητα ενός παράγοντα - μιας παρτίδας προϊόντων. Εάν στη μελέτη περιλαμβάνονται όλες οι παρτίδες πρώτων υλών, τότε η επίδραση του επιπέδου ενός τέτοιου παράγοντα είναι συστηματική (μοντέλο I) και τα ευρήματα ισχύουν μόνο για τις μεμονωμένες παρτίδες που συμμετείχαν στη μελέτη. εάν περιλαμβάνεται μόνο ένα τυχαία επιλεγμένο μέρος των παρτίδων, τότε η επίδραση του παράγοντα είναι τυχαία (μοντέλο II). Σε πολυπαραγοντικά συμπλέγματα, είναι δυνατό ένα μικτό μοντέλο III, στο οποίο ορισμένοι παράγοντες έχουν τυχαία επίπεδα, ενώ άλλοι είναι σταθεροί.

Ας εξετάσουμε αυτό το πρόβλημα με περισσότερες λεπτομέρειες. Ας υπάρχει tπαρτίδες προϊόντων. Από κάθε παρτίδα που επιλέγεται ανάλογα p L, p 2 ,p tπροϊόντα (για λόγους απλότητας, υποθέτουμε ότι u = n 2 =... = n t = n).Αντιπροσωπεύουμε τις τιμές του δείκτη ποιότητας αυτών των προϊόντων με τη μορφή μιας μήτρας παρατηρήσεων


Είναι απαραίτητο να ελέγξετε τη σημασία της επίδρασης των παρτίδων προϊόντων στην ποιότητά τους.

Αν υποθέσουμε ότι τα στοιχεία των σειρών του πίνακα παρατήρησης είναι οι αριθμητικές τιμές (πραγματοποιήσεις) τυχαίων μεταβλητών X t, X 2 ,..., x t,εκφράζοντας την ποιότητα των προϊόντων και έχοντας έναν κανονικό νόμο διανομής με μαθηματικές προσδοκίες, αντίστοιχα a v a 2, ..., ένα τκαι ίσες διασπορές a 2 , τότε δοθείσα εργασίακαταλήγει στον έλεγχο της μηδενικής υπόθεσης #0: a v = a 2l = ... = ένα t, που πραγματοποιήθηκε στην ανάλυση διασποράς.

Ας υποδηλώσουμε τον μέσο όρο σε κάποιο δείκτη με έναν αστερίσκο (ή μια τελεία) αντί για έναν δείκτη, τότε μέση τιμήτην ποιότητα των προϊόντων της i-ης παρτίδας, ή ομαδικός μέσος όροςγια το i-ο επίπεδο του παράγοντα, παίρνει τη μορφή

ένα γενικός μέσος όρος -

Θεωρήστε το άθροισμα των τετραγώνων των αποκλίσεων των παρατηρήσεων από το συνολικό μέσο xn:

ή Q= Q+ Ε2+ ?>з Ο τελευταίος όρος

αφού το άθροισμα των αποκλίσεων των τιμών της μεταβλητής από το μέσο όρο της, δηλ. ? 1.g y - x) ισούται με μηδέν. ) =x

Ο πρώτος όρος μπορεί να γραφτεί ως

Ως αποτέλεσμα, παίρνουμε την ακόλουθη ταυτότητα:

t p. _

που Q=YΧ [ x ij _ x", I 2 - γενικός,ή πλήρης,άθροισμα τετραγωνικών αποκλίσεων. 7=1

Q, - n^, όπου προς τηνένας; k (n -1) - βαθμοί ελευθερίας ^ -κατανομή, 5 και εγώ 7]- ^-Το κριτήριο του Fisher. Παράδειγμα 6.1. Διακόσιες υποθέσεις ότι ο παράγοντας ταχύτητας παρουσίασης λέξεων επηρεάζει την απόδοση της αναπαραγωγής τους (στοιχεία στον πίνακα στο Σχ. 8.1). Ακολουθία λύσεων:

o Διατύπωση υποθέσεων.

H 0:ο παράγοντας ταχύτητας δεν είναι πιο έντονος από τυχαίος. H 1: Ο παράγοντας ρυθμός είναι πιο έντονος από τον τυχαίο.

o Έλεγχος υποθέσεων:διερευνηθείσα παράμετρος κανονικόςδιανομή; δείγματα άσχετο πανομοιότυποτόμοι? μετρήσεις σε κλίμακα αναλογιών.

o Ορισμός εμπειρικό κριτήριο G EMFβασίζεται στη σύγκριση των τετραγώνων των στηλών με το άθροισμα των τετραγώνων όλων των εμπειρικών τιμών. Κάθε στήλη αντιπροσωπεύει ένα δείγμα και αντιστοιχεί σε μια ορισμένη διαβάθμιση του συντελεστή ταχύτητας.

o Ονομασίες που εισήχθησαν:

Π= 6 - αριθμός παρατηρήσεων (σειρές)

προς την= 3 - αριθμός παραγόντων (μπάρες)

Η/Υ = 6-3 = 18 - σύνολοατομικές αξίες·

7 - ο δείκτης σειράς αλλάζει από 1 σε Π(7 = 1, 2, ..., n)

και- ο δείκτης στήλης αλλάζει από 1 σε προς (και= 1, 2, ..., k).

o Μαθηματικοί υπολογισμοί(βλ. εικ. 6.1 6.2):

i = 1 7 = 1 p m kp^ u = 1)

Υπάρχουν 1 = 6 2 + επτά 2 + 6 2 + 5 2 + _ + 5 2 + 5 2 = 432; και 2 = - (34 2 + +29 2 + 23 2) = 421;

και 3^^ (34 + 29 + 23) 2 = 410,89; 3 ή 6

Ρύζι. 6.1. Αποτελέσματα Εικ. 6.2. Τύποι υπολογισμού

ανάλυση διακύμανσης μονόδρομη ανάλυση διακύμανσης

o Κρίσιμη αξία^ kr μπορεί να ληφθεί χρησιμοποιώντας τη συνάρτηση

RDISP() για το επίπεδο σημαντικότητας για a = 0,05 (0,01) και τον αριθμό των βαθμών ελευθερίας προς την 1 \u003d 3-1 \u003d 2 και k (n -1) \u003d 3 (6-1) \u003d 15. G 0u05 ~ 3,68 και G 0u01 ~ 6,36.

o Λήψη αποφάσεων.Στο βαθμό που ¥ HMF> P 0; 01(6,89 > 6,36), μηδενική υπόθεση H 0αποκλίνει σε επίπεδο σημαντικότητας 0,01.

o Διατύπωση συμπερασμάτων.Οι διαφορές στον όγκο αναπαραγωγής λέξεων (συντελεστής ταχύτητας) είναι πιο έντονες από τις τυχαίες. Αυτή η σχέση μπορεί να αναπαρασταθεί γραφικά στο Σχ. 6.3.

Ρύζι. 6.3. Εξάρτηση του μέσου όγκου των αναπαραγόμενων λέξεων από την ταχύτητα παρουσίασης

Οι υπολογισμοί ενός μοντέλου ενός παράγοντα μπορούν να πραγματοποιηθούν χρησιμοποιώντας το πακέτο "Ανάλυση δεδομένων", ενότητα "Ανάλυση διακύμανσης ενός παράγοντα" (Εικ. 6.4).

Ρύζι. 6.4. Μενού πακέτου "Ανάλυση δεδομένων" Αφού εισαγάγετε τις κατάλληλες παραμέτρους (Εικ. 6.5), μπορείτε να λάβετε τα αποτελέσματα της μονόδρομης ανάλυσης διακύμανσης (Εικ. 6.6).

Ρύζι. 6.5. Παράθυρο διαλόγου

Ρύζι. 6.6. Αποτελέσματα μονόδρομης ανάλυσης διακύμανσης (a = 0,05)

Το ηλεκτρονικό πακέτο «Ανάλυση Δεδομένων» εκτελεί υπολογισμούς βασικών στατιστικών (αθροίσματα, μέσοι όροι, αποκλίσεις, τιμή εμπειρικών και θεωρητικών κριτηρίων κ.λπ.), γεγονός που δίνει στον ερευνητή αφορμή για στατιστικά συμπεράσματα.