Βιογραφίες Χαρακτηριστικά Ανάλυση

Υπολογίστε τη συσχέτιση στο excel. Πώς να υπολογίσετε τη συσχέτιση στο Microsoft Excel

Η ανάλυση συσχέτισης είναι μια δημοφιλής μέθοδος στατιστική έρευνα, που χρησιμοποιείται για τον προσδιορισμό του βαθμού εξάρτησης ενός δείκτη από έναν άλλο. ΣΤΟ Microsoft Excelυπάρχει ένα ειδικό εργαλείο σχεδιασμένο για την εκτέλεση αυτού του τύπου ανάλυσης. Ας μάθουμε πώς να χρησιμοποιήσετε αυτήν τη δυνατότητα.

Η ουσία της ανάλυσης συσχέτισης

σκοπός ανάλυση συσχέτισηςείναι ο προσδιορισμός της σχέσης μεταξύ διάφορους παράγοντες. Δηλαδή, καθορίζεται εάν μια μείωση ή αύξηση ενός δείκτη επηρεάζει τη μεταβολή σε έναν άλλο.

Εάν εδραιωθεί η εξάρτηση, τότε προσδιορίζεται ο συντελεστής συσχέτισης. Διαφορετικός ανάλυση παλινδρόμησης, είναι ο μόνος δείκτης που υπολογίζει αυτή τη μέθοδοστατιστική έρευνα. Ο συντελεστής συσχέτισης κυμαίνεται από +1 έως -1. Εάν υπάρχει θετική συσχέτιση, η αύξηση του ενός δείκτη συμβάλλει στην αύξηση του δεύτερου. Με αρνητική συσχέτιση, η αύξηση του ενός δείκτη συνεπάγεται μείωση του άλλου. Όσο μεγαλύτερο είναι το μέτρο του συντελεστή συσχέτισης, τόσο πιο αισθητή η αλλαγή σε έναν δείκτη αντανακλάται στη μεταβολή του δεύτερου. Με συντελεστή ίσο με 0, η μεταξύ τους εξάρτηση απουσιάζει εντελώς.

Υπολογισμός του συντελεστή συσχέτισης

Τώρα ας προσπαθήσουμε να υπολογίσουμε τον συντελεστή συσχέτισης συγκεκριμένο παράδειγμα. Έχουμε έναν πίνακα στον οποίο το κόστος της διαφήμισης και το ποσό των πωλήσεων είναι μηνιαίως ζωγραφισμένα σε ξεχωριστές στήλες. Πρέπει να μάθουμε τον βαθμό εξάρτησης του αριθμού των πωλήσεων από το χρηματικό ποσό που δαπανήθηκε για διαφήμιση.

Μέθοδος 1: Προσδιορισμός συσχέτισης μέσω του οδηγού συναρτήσεων

Ένας από τους τρόπους με τους οποίους μπορείτε να πραγματοποιήσετε μια ανάλυση συσχέτισης είναι να χρησιμοποιήσετε τη συνάρτηση CORREL. Η ίδια η λειτουργία έχει γενική μορφή CORREL(πίνακας1, πίνακας2).

  1. Επιλέξτε το κελί στο οποίο θα εμφανίζεται το αποτέλεσμα του υπολογισμού. Κάντε κλικ στο κουμπί "Εισαγωγή συνάρτησης", το οποίο βρίσκεται στα αριστερά της γραμμής τύπων.
  2. Στη λίστα, που παρουσιάζεται στο παράθυρο Οδηγός λειτουργιών, αναζητήστε και επιλέξτε τη συνάρτηση CORREL. Κάντε κλικ στο κουμπί "OK".
  3. Ανοίγει το παράθυρο ορισμάτων συνάρτησης. Στο πεδίο "Array1", εισαγάγετε τις συντεταγμένες του εύρους των κελιών μιας από τις τιμές, η εξάρτηση της οποίας πρέπει να καθοριστεί. Στην περίπτωσή μας, αυτές θα είναι οι τιμές στη στήλη "Ποσό πωλήσεων". Για να εισαγάγετε τη διεύθυνση του πίνακα στο πεδίο, απλώς επιλέξτε όλα τα κελιά με δεδομένα στην παραπάνω στήλη.

    Στο πεδίο "Array2", πρέπει να εισαγάγετε τις συντεταγμένες της δεύτερης στήλης. Έχουμε κόστος διαφήμισης. Με τον ίδιο τρόπο όπως και στην προηγούμενη περίπτωση, εισάγουμε τα δεδομένα στο πεδίο.

    Κάντε κλικ στο κουμπί "OK".

Όπως μπορείτε να δείτε, ο συντελεστής συσχέτισης με τη μορφή αριθμού εμφανίζεται στο κελί που έχουμε επιλέξει προηγουμένως. ΣΤΟ αυτή η υπόθεσηείναι ίσο με 0,97, που είναι πολύ υψηλό σημάδιεξάρτηση μιας ποσότητας από μια άλλη.

Μέθοδος 2: Υπολογίστε τη συσχέτιση χρησιμοποιώντας το πακέτο ανάλυσης

Επιπλέον, η συσχέτιση μπορεί να υπολογιστεί χρησιμοποιώντας ένα από τα εργαλεία που παρέχονται στο πακέτο ανάλυσης. Αλλά πρώτα πρέπει να ενεργοποιήσουμε αυτό το εργαλείο.

  1. Μεταβείτε στην καρτέλα "Αρχείο".
  2. Στο παράθυρο που ανοίγει, μεταβείτε στην ενότητα "Ρυθμίσεις".
  3. Στη συνέχεια, μεταβείτε στο στοιχείο "Πρόσθετα".
  4. Στο κάτω μέρος του επόμενου παραθύρου, στην ενότητα "Διαχείριση", μετακινήστε το διακόπτη στη θέση "Πρόσθετα Excel", εάν βρίσκεται σε διαφορετική θέση. Κάντε κλικ στο κουμπί "OK".
  5. Στο παράθυρο πρόσθετων, επιλέξτε το πλαίσιο δίπλα στο στοιχείο "Πακέτο ανάλυσης". Κάντε κλικ στο κουμπί "OK".
  6. Μετά από αυτό, ενεργοποιείται το πακέτο ανάλυσης. Μεταβείτε στην καρτέλα "Δεδομένα". Όπως μπορείτε να δείτε, εδώ εμφανίζεται ένα νέο μπλοκ εργαλείων στην κορδέλα - "Analysis". Κάντε κλικ στο κουμπί «Ανάλυση δεδομένων», που βρίσκεται σε αυτό.
  7. Η λίστα ανοίγει με διάφορες επιλογέςανάλυση δεδομένων. Επιλέξτε "Συσχέτιση". Κάντε κλικ στο κουμπί "OK".
  8. Ανοίγει ένα παράθυρο με παραμέτρους ανάλυσης συσχέτισης. Σε αντίθεση με την προηγούμενη μέθοδο, στο πεδίο «Input interval» εισάγουμε το διάστημα όχι για κάθε στήλη ξεχωριστά, αλλά για όλες τις στήλες που συμμετέχουν στην ανάλυση. Στην περίπτωσή μας, αυτά είναι τα δεδομένα στις στήλες "Δαπάνες διαφήμισης" και "Πωλήσεις".

    Αφήνουμε αμετάβλητη την παράμετρο "Ομαδοποίηση" - "Κατά στήλες", καθώς οι ομάδες δεδομένων μας χωρίζονται σε δύο στήλες. Εάν ήταν σπασμένα γραμμή προς γραμμή, τότε ο διακόπτης θα πρέπει να μετακινηθεί στη θέση "By lines".

    Από προεπιλογή, οι επιλογές εξόδου ορίζονται σε "Νέο φύλλο εργασίας", δηλαδή τα δεδομένα θα εμφανίζονται σε διαφορετικό φύλλο. Μπορείτε να αλλάξετε τη θέση μετακινώντας το διακόπτη. Αυτό μπορεί να είναι το τρέχον φύλλο (τότε θα χρειαστεί να καθορίσετε τις συντεταγμένες των κελιών εξόδου πληροφοριών) ή ένα νέο βιβλίο εργασίας (αρχείο).

    Όταν οριστούν όλες οι ρυθμίσεις, κάντε κλικ στο κουμπί "OK".

Δεδομένου ότι η θέση εξόδου των αποτελεσμάτων της ανάλυσης έμεινε από προεπιλογή, μεταβαίνουμε σε ΝΕΟ ΦΥΛΛΟ. Όπως μπορείτε να δείτε, εδώ είναι ο συντελεστής συσχέτισης. Φυσικά, είναι το ίδιο όπως όταν χρησιμοποιείτε την πρώτη μέθοδο - 0,97. Αυτό συμβαίνει επειδή και οι δύο επιλογές εκτελούν τους ίδιους υπολογισμούς, απλώς μπορούν να γίνουν με διαφορετικούς τρόπους.

Όπως μπορείτε να δείτε, η εφαρμογή Excel προσφέρει δύο μεθόδους ανάλυσης συσχέτισης ταυτόχρονα. Το αποτέλεσμα των υπολογισμών, εάν τα κάνετε όλα σωστά, θα είναι εντελώς πανομοιότυπο. Ωστόσο, κάθε χρήστης μπορεί να επιλέξει μια πιο βολική επιλογή υπολογισμού για αυτόν.

Χαιρόμαστε που μπορέσαμε να σας βοηθήσουμε να επιλύσετε το πρόβλημα.

Κάντε την ερώτησή σας στα σχόλια, περιγράφοντας λεπτομερώς την ουσία του προβλήματος. Οι ειδικοί μας θα προσπαθήσουν να απαντήσουν το συντομότερο δυνατό.

Σας βοήθησε αυτό το άρθρο;

Ανάλυση παλινδρόμησης και συσχέτισης - Στατιστικές μέθοδοιέρευνα. Αυτοί είναι οι πιο συνηθισμένοι τρόποι εμφάνισης της εξάρτησης μιας παραμέτρου από μία ή περισσότερες ανεξάρτητες μεταβλητές.

Παρακάτω σε συγκεκριμένα πρακτικά παραδείγματαΑς εξετάσουμε αυτές τις δύο πολύ δημοφιλείς αναλύσεις μεταξύ των οικονομολόγων. Θα δώσουμε επίσης ένα παράδειγμα απόκτησης αποτελεσμάτων όταν συνδυάζονται.

Ανάλυση παλινδρόμησης στο Excel

Δείχνει την επίδραση ορισμένων τιμών (ανεξάρτητων, ανεξάρτητων) στην εξαρτημένη μεταβλητή. Για παράδειγμα, πώς ο αριθμός του οικονομικά ενεργού πληθυσμού εξαρτάται από τον αριθμό των επιχειρήσεων, τους μισθούς και άλλες παραμέτρους. Ή: πώς οι ξένες επενδύσεις, οι τιμές της ενέργειας κ.λπ. επηρεάζουν το επίπεδο του ΑΕΠ.

Το αποτέλεσμα της ανάλυσης σας επιτρέπει να θέσετε προτεραιότητες. Και με βάση τους κύριους παράγοντες, να προβλέψουμε, να σχεδιάσουμε την ανάπτυξη τομείς προτεραιότηταςγια τη λήψη διοικητικών αποφάσεων.

Η παλινδρόμηση συμβαίνει:

  • γραμμικό (y = a + bx);
  • παραβολική (y = a + bx + cx2);
  • εκθετική (y = a * exp(bx));
  • ισχύς (y = a*x^b);
  • υπερβολική (y = b/x + a);
  • λογαριθμική (y = b * 1n(x) + a);
  • εκθετική (y = a * b^x).

Εξετάστε το παράδειγμα της κατασκευής μοντέλο παλινδρόμησηςστο Excel και ερμηνεία των αποτελεσμάτων. Ας πάρουμε γραμμικού τύπουοπισθοδρόμηση.

Μια εργασία. Σε 6 επιχειρήσεις ο μέσος μηνιαίος μισθόςκαι τον αριθμό των συνταξιούχων. Είναι απαραίτητο να προσδιοριστεί η εξάρτηση του αριθμού των συνταξιούχων από τον μέσο μισθό.

Το μοντέλο γραμμικής παλινδρόμησης έχει την ακόλουθη μορφή:

Y \u003d a0 + a1x1 + ... + akhk.

Όπου a είναι οι συντελεστές παλινδρόμησης, x οι μεταβλητές που επηρεάζουν και k είναι ο αριθμός των παραγόντων.

Στο παράδειγμά μας, το Y είναι ο δείκτης των εργαζομένων που εγκατέλειψαν. Ο παράγοντας που επηρεάζει είναι οι μισθοί (x).

Το Excel διαθέτει ενσωματωμένες συναρτήσεις που μπορούν να χρησιμοποιηθούν για τον υπολογισμό των παραμέτρων ενός μοντέλου γραμμικής παλινδρόμησης. Αλλά το πρόσθετο Analysis ToolPak θα το κάνει πιο γρήγορα.

Ενεργοποιήστε ένα ισχυρό αναλυτικό εργαλείο:

  1. Κάντε κλικ στο κουμπί "Office" και μεταβείτε στην καρτέλα "Επιλογές Excel". "Πρόσθετα".
  2. Στο κάτω μέρος, κάτω από την αναπτυσσόμενη λίστα, στο πεδίο "Διαχείριση", θα υπάρχει μια επιγραφή "Πρόσθετα Excel" (αν δεν υπάρχει, κάντε κλικ στο πλαίσιο ελέγχου στα δεξιά και επιλέξτε). Και ένα κουμπί Go. Κάντε κλικ.
  3. Ανοίγει μια λίστα με τα διαθέσιμα πρόσθετα. Επιλέξτε "Πακέτο ανάλυσης" και κάντε κλικ στο OK.

Μόλις ενεργοποιηθεί, το πρόσθετο θα είναι διαθέσιμο στην καρτέλα Δεδομένα.

Τώρα θα ασχοληθούμε άμεσα με την ανάλυση παλινδρόμησης.

  1. Ανοίξτε το μενού εργαλείου ανάλυσης δεδομένων. Επιλέξτε "Προσβολή".
  2. Θα ανοίξει ένα μενού για την επιλογή τιμών εισόδου και επιλογών εξόδου (πού θα εμφανιστεί το αποτέλεσμα). Στα πεδία για τα αρχικά δεδομένα, υποδεικνύουμε το εύρος της περιγραφόμενης παραμέτρου (Y) και τον παράγοντα που την επηρεάζει (X). Τα υπόλοιπα μπορεί να ολοκληρωθούν ή όχι.
  3. Αφού κάνετε κλικ στο OK, το πρόγραμμα θα εμφανίσει τους υπολογισμούς σε ένα νέο φύλλο (μπορείτε να επιλέξετε το διάστημα που θα εμφανιστεί στο τρέχον φύλλο ή να αντιστοιχίσετε την έξοδο σε ένα νέο βιβλίο εργασίας).

Πρώτα απ 'όλα, δίνουμε προσοχή στο R-τετράγωνο και τους συντελεστές.

Το R-τετράγωνο είναι ο συντελεστής προσδιορισμού. Στο παράδειγμά μας, είναι 0,755, ή 75,5%. Αυτό σημαίνει ότι οι υπολογισμένες παράμετροι του μοντέλου εξηγούν τη σχέση μεταξύ των παραμέτρων που μελετήθηκαν κατά 75,5%. Όσο μεγαλύτερος είναι ο συντελεστής προσδιορισμού, τόσο καλύτερο είναι το μοντέλο. Καλό - πάνω από 0,8. Κακή - λιγότερο από 0,5 (μια τέτοια ανάλυση δύσκολα μπορεί να θεωρηθεί λογική). Στο παράδειγμά μας - "όχι κακό".

Ο συντελεστής 64,1428 δείχνει τι θα είναι το Y εάν όλες οι μεταβλητές στο υπό εξέταση μοντέλο είναι ίσες με 0. Δηλαδή, άλλοι παράγοντες που δεν περιγράφονται στο μοντέλο επηρεάζουν επίσης την τιμή της παραμέτρου που αναλύθηκε.

Ο συντελεστής -0,16285 δείχνει το βάρος της μεταβλητής X στο Y. Δηλαδή, ο μέσος μηνιαίος μισθός σε αυτό το μοντέλο επηρεάζει τον αριθμό των παραιτητών με βάρος -0,16285 (αυτός είναι ένας μικρός βαθμός επιρροής). Το σύμβολο "-" υποδεικνύει κακή επιρροή: πως περισσότερο μισθότόσο λιγότεροι άνθρωποι που τα παράτησαν. Που είναι δίκαιο.

Ανάλυση συσχέτισης στο Excel

Η ανάλυση συσχέτισης βοηθά να διαπιστωθεί εάν υπάρχει σχέση μεταξύ δεικτών σε ένα ή δύο δείγματα. Για παράδειγμα, μεταξύ του χρόνου λειτουργίας του μηχανήματος και του κόστους των επισκευών, της τιμής του εξοπλισμού και της διάρκειας λειτουργίας, του ύψους και του βάρους των παιδιών κ.λπ.

Εάν υπάρχει σχέση, τότε αν μια αύξηση σε μια παράμετρο οδηγεί σε αύξηση (θετική συσχέτιση) ή μείωση (αρνητική) στην άλλη. Η ανάλυση συσχέτισης βοηθά τον αναλυτή να προσδιορίσει εάν η τιμή ενός δείκτη μπορεί να προβλέψει την πιθανή τιμή ενός άλλου.

Ο συντελεστής συσχέτισης συμβολίζεται με r. Διαφέρει από +1 έως -1. Η ταξινόμηση των συσχετισμών για διαφορετικές περιοχές θα είναι διαφορετική. Με τιμή συντελεστή 0 γραμμική εξάρτησηδεν υπάρχει μεταξύ δειγμάτων.

Ας δούμε πώς χρησιμοποιείται Εργαλεία Excelβρείτε τον συντελεστή συσχέτισης.

Η συνάρτηση CORREL χρησιμοποιείται για την εύρεση των ζευγαρωμένων συντελεστών.

Εργασία: Προσδιορίστε εάν υπάρχει σχέση μεταξύ του χρόνου λειτουργίας ενός τόρνου και του κόστους συντήρησής του.

Βάλτε τον κέρσορα σε οποιοδήποτε κελί και πατήστε το κουμπί fx.

  1. Στην κατηγορία "Στατιστικά", επιλέξτε τη συνάρτηση CORREL.
  2. Επιχείρημα "Array 1" - το πρώτο εύρος τιμών - ο χρόνος του μηχανήματος: A2: A14.
  3. Επιχείρημα "Array 2" - το δεύτερο εύρος τιμών - το κόστος των επισκευών: B2:B14. Κάντε κλικ στο OK.

Για να προσδιορίσετε τον τύπο σύνδεσης, πρέπει να κοιτάξετε απόλυτος αριθμόςσυντελεστής (κάθε τομέας δραστηριότητας έχει τη δική του κλίμακα).

Για ανάλυση συσχέτισης πολλών παραμέτρων (περισσότερες από 2), είναι πιο βολικό να χρησιμοποιήσετε το "Data Analysis" (πρόσθετο "Analysis Package"). Στη λίστα, πρέπει να επιλέξετε μια συσχέτιση και να ορίσετε έναν πίνακα. Ολα.

Οι προκύπτοντες συντελεστές θα εμφανιστούν στον πίνακα συσχέτισης. Σαν αυτό:

Ανάλυση συσχέτισης – παλινδρόμησης

Στην πράξη, αυτές οι δύο τεχνικές χρησιμοποιούνται συχνά μαζί.

  1. Κατασκευάζουμε ένα πεδίο συσχέτισης: "Εισαγωγή" - "Διάγραμμα" - "Σχέδιο διασποράς" (σας επιτρέπει να συγκρίνετε ζεύγη). Το εύρος τιμών είναι όλα τα αριθμητικά δεδομένα στον πίνακα.
  2. Κάντε αριστερό κλικ σε οποιοδήποτε σημείο του διαγράμματος. Τότε δεξιά. Στο μενού που ανοίγει, επιλέξτε "Προσθήκη γραμμής τάσης".
  3. Εκχωρήστε παραμέτρους για τη γραμμή. Τύπος - "Γραμμικό". Στο κάτω μέρος - "Εμφάνιση της εξίσωσης στο διάγραμμα."
  4. Κάντε κλικ στο "Κλείσιμο".

Τώρα τα δεδομένα της ανάλυσης παλινδρόμησης είναι ορατά.

1.Ανοίξτε το πρόγραμμα Excel

2. Δημιουργήστε στήλες με δεδομένα. Στο παράδειγμά μας, θα εξετάσουμε τη σχέση, ή τη συσχέτιση, μεταξύ επιθετικότητας και αυτο-αμφιβολίας στα παιδιά της πρώτης τάξης. Στο πείραμα συμμετείχαν 30 παιδιά, τα δεδομένα παρουσιάζονται στον πίνακα Excel:

1 στήλη - αριθμός του θέματος

2η στήλη - επιθετικότητα στα σημεία

3 στήλη - αμφιβολία για τον εαυτό σε πόντους

3. Στη συνέχεια, πρέπει να επιλέξετε ένα κενό κελί δίπλα στον πίνακα και να κάνετε κλικ στο εικονίδιο f(x)στον πίνακα Excel

4. Θα ανοίξει το μενού των λειτουργιών, ανάμεσα στις κατηγορίες που πρέπει να επιλέξετε Στατιστικός, και στη συνέχεια μεταξύ της λίστας των συναρτήσεων βρείτε αλφαβητικά CORRELκαι κάντε κλικ στο OK

5. Στη συνέχεια θα ανοίξει το μενού με τα ορίσματα συνάρτησης, το οποίο θα μας επιτρέψει να επιλέξουμε τις στήλες δεδομένων που χρειαζόμαστε. Για να επιλέξετε την πρώτη στήλη Επιθετικότηταπρέπει να κάνετε κλικ στο μπλε κουμπί δίπλα στη γραμμή Πίνακας 1

6. Ας επιλέξουμε τα δεδομένα για συστοιχία 1από στήλη Επιθετικότητακαι κάντε κλικ στο μπλε κουμπί στο παράθυρο διαλόγου

7. Στη συνέχεια, όπως και ο πίνακας 1, κάντε κλικ στο μπλε κουμπί δίπλα στη γραμμή Πίνακας 2

8. Ας επιλέξουμε τα δεδομένα για πίνακας2- στήλη Έλλειψη αυτοεκτίμησηςκαι πατήστε ξανά το μπλε κουμπί και μετά OK

9.Εδώ υπολογίζεται ο συντελεστής συσχέτισης r-Pearson και γράφεται στο επιλεγμένο κελί.Στην περίπτωσή μας είναι θετικός και περίπου ίσος. Αυτό μιλάει για μέτρια θετικήσυνδέσεις μεταξύ επιθετικότητας και αυτο-αμφιβολίας στα παιδιά της πρώτης τάξης

Με αυτόν τον τρόπο, στατιστικό συμπέρασμαΤο πείραμα θα είναι: r = 0,225, αποκαλύφθηκε μια μέτρια θετική σχέση μεταξύ των μεταβλητών επιθετικότητακαι έλλειψη αυτοεκτίμησης.

Σε ορισμένες μελέτες, απαιτείται να υποδεικνύεται το p-επίπεδο σημαντικότητας του συντελεστή συσχέτισης, ωστόσο Πρόγραμμα Excel, σε αντίθεση με το SPSS, δεν παρέχει αυτή τη δυνατότητα. Δεν πειράζει, υπάρχουν πίνακες κρίσιμων τιμών συσχετίσεων (A.D. Nasledov).

Μπορείτε επίσης να δημιουργήσετε μια γραμμή παλινδρόμησης στο Excel και να την επισυνάψετε στα αποτελέσματα της μελέτης.

Ο συντελεστής συσχέτισης αντικατοπτρίζει τον βαθμό σχέσης μεταξύ δύο δεικτών. Παίρνει πάντα μια τιμή από -1 έως 1. Εάν ο συντελεστής βρίσκεται κοντά στο 0, τότε λένε ότι δεν υπάρχει σύνδεση μεταξύ των μεταβλητών.

Εάν η τιμή είναι κοντά στο ένα (από 0,9, για παράδειγμα), τότε υπάρχει ισχυρή άμεση σχέση μεταξύ των παρατηρούμενων αντικειμένων. Αν ο συντελεστής είναι κοντά σε άλλον ακραίο σημείοεύρος (-1), τότε υπάρχει ισχυρή αντίστροφη σχέση μεταξύ των μεταβλητών. Όταν η τιμή είναι κάπου μεταξύ 0 έως 1 ή 0 έως -1, τότε μιλαμεσχετικά με αδύναμη σύνδεση(άμεση ή αντίστροφη). Αυτή η σχέση συνήθως δεν λαμβάνεται υπόψη: θεωρείται ότι δεν υπάρχει.

Υπολογισμός του συντελεστή συσχέτισης στο Excel

Εξετάστε, για παράδειγμα, μεθόδους για τον υπολογισμό του συντελεστή συσχέτισης, χαρακτηριστικά της άμεσης και της αντίστροφης σχέσης μεταξύ των μεταβλητών.

Τιμές των δεικτών x και y:

Y είναι η ανεξάρτητη μεταβλητή, x είναι η εξαρτημένη μεταβλητή. Είναι απαραίτητο να βρείτε τη δύναμη (ισχυρή / αδύναμη) και την κατεύθυνση (εμπρός / αντίστροφη) της σχέσης μεταξύ τους. Ο τύπος για τον συντελεστή συσχέτισης μοιάζει με αυτό:


Για να απλοποιήσουμε την κατανόησή του, θα το αναλύσουμε σε αρκετά απλά στοιχεία.

Υπάρχει ισχυρή άμεση σχέση μεταξύ των μεταβλητών.

Η ενσωματωμένη συνάρτηση CORREL αποφεύγει πολύπλοκους υπολογισμούς. Ας υπολογίσουμε τον συντελεστή συσχέτισης ζεύγους στο Excel χρησιμοποιώντας τον. Καλούμε τον κύριο των λειτουργιών. Βρίσκουμε αυτό που χρειαζόμαστε. Τα ορίσματα συνάρτησης είναι ένας πίνακας τιμών y και ένας πίνακας τιμών x:

Ας δείξουμε τις τιμές των μεταβλητών στο γράφημα:


Υπάρχει μια ισχυρή σχέση μεταξύ y και x, επειδή Οι γραμμές τρέχουν σχεδόν παράλληλες μεταξύ τους. Η σχέση είναι άμεση: αύξηση y - αύξηση x, φθίνουσα y - μείωση x.



Matrix of Pairwise Correlation Coefficients στο Excel

Ο πίνακας συσχέτισης είναι ένας πίνακας, στην τομή γραμμών και στηλών του οποίου υπάρχουν συντελεστές συσχέτισης μεταξύ των αντίστοιχων τιμών. Είναι λογικό να το δημιουργήσουμε για πολλές μεταβλητές.

Ο πίνακας των συντελεστών συσχέτισης στο Excel δημιουργείται χρησιμοποιώντας το εργαλείο "Συσχέτιση" από το πακέτο "Ανάλυση δεδομένων".


Βρέθηκε μια ισχυρή άμεση σχέση μεταξύ των τιμών του y και του x1. Μεταξύ x1 και x2 υπάρχει ένα ισχυρό Ανατροφοδότηση. Δεν υπάρχει ουσιαστικά καμία σύνδεση με τις τιμές στη στήλη x3.

1.Ανοίξτε το πρόγραμμα Excel

2. Δημιουργήστε στήλες με δεδομένα. Στο παράδειγμά μας, θα εξετάσουμε τη σχέση, ή τη συσχέτιση, μεταξύ επιθετικότητας και αυτο-αμφιβολίας στα παιδιά της πρώτης τάξης. Στο πείραμα συμμετείχαν 30 παιδιά, τα δεδομένα παρουσιάζονται στον πίνακα Excel:

1 στήλη - αριθμός του θέματος

2 στήλη - επιθετικότητασε σημεία

3 στήλη - έλλειψη αυτοεκτίμησηςσε σημεία

3. Στη συνέχεια, πρέπει να επιλέξετε ένα κενό κελί δίπλα στον πίνακα και να κάνετε κλικ στο εικονίδιο f(x)στον πίνακα Excel

4. Θα ανοίξει το μενού των λειτουργιών, ανάμεσα στις κατηγορίες που πρέπει να επιλέξετε Στατιστικός , και στη συνέχεια μεταξύ της λίστας των συναρτήσεων βρείτε αλφαβητικά CORRELκαι κάντε κλικ στο OK

5. Στη συνέχεια θα ανοίξει το μενού με τα ορίσματα συνάρτησης, το οποίο θα μας επιτρέψει να επιλέξουμε τις στήλες δεδομένων που χρειαζόμαστε. Για να επιλέξετε την πρώτη στήλη Επιθετικότηταπρέπει να κάνετε κλικ στο μπλε κουμπί δίπλα στη γραμμή Πίνακας 1

6. Ας επιλέξουμε τα δεδομένα για συστοιχία 1από στήλη Επιθετικότητακαι κάντε κλικ στο μπλε κουμπί στο παράθυρο διαλόγου

7. Στη συνέχεια, όπως και ο πίνακας 1, κάντε κλικ στο μπλε κουμπί δίπλα στη γραμμή Πίνακας 2

8. Ας επιλέξουμε τα δεδομένα για πίνακας2- στήλη Έλλειψη αυτοεκτίμησηςκαι πατήστε ξανά το μπλε κουμπί και μετά OK

9. Εδώ υπολογίζεται και γράφεται ο συντελεστής συσχέτισης r-Pearson στο επιλεγμένο κελί, στην περίπτωσή μας είναι θετικός και περίπου ίσος με 0,225 . Αυτό μιλάει για μέτρια θετικήσυνδέσεις μεταξύ επιθετικότητας και αυτο-αμφιβολίας στα παιδιά της πρώτης τάξης

Με αυτόν τον τρόπο, στατιστικό συμπέρασμαΤο πείραμα θα είναι: r = 0,225, αποκαλύφθηκε μια μέτρια θετική σχέση μεταξύ των μεταβλητών επιθετικότητακαι έλλειψη αυτοεκτίμησης.

Σε ορισμένες μελέτες, απαιτείται να υποδεικνύεται το επίπεδο p-significance του συντελεστή συσχέτισης, αλλά το Excel, σε αντίθεση με το SPSS, δεν παρέχει τέτοια ευκαιρία. Δεν πειράζει, υπάρχει (A.D. Nasledov).

Μπορείτε επίσης να το επισυνάψετε στα αποτελέσματα της μελέτης.

Συντελεστής συσχέτισης (ή γραμμικός συντελεστήςσυσχέτιση) συμβολίζεται ως "r" (σε σπάνιες περιπτώσεις, ως "ρ") και χαρακτηρίζει τη γραμμική συσχέτιση (δηλαδή τη σχέση που δίνεται από κάποια τιμή και κατεύθυνση) δύο ή περισσότερων μεταβλητών. Η τιμή του συντελεστή βρίσκεται μεταξύ -1 και +1, δηλαδή η συσχέτιση μπορεί να είναι θετική και αρνητική. Εάν ο συντελεστής συσχέτισης είναι -1, υπάρχει τέλεια αρνητική συσχέτιση. Εάν ο συντελεστής συσχέτισης είναι +1, υπάρχει τέλεια θετική συσχέτιση. Σε άλλες περιπτώσεις, υπάρχει θετική συσχέτιση, αρνητική συσχέτιση ή καμία συσχέτιση μεταξύ των δύο μεταβλητών. Ο συντελεστής συσχέτισης μπορεί να υπολογιστεί χειροκίνητα, με δωρεάν ηλεκτρονικές αριθμομηχανές ή με μια καλή αριθμομηχανή γραφικών.

Βήματα

Υπολογισμός του συντελεστή συσχέτισης χειροκίνητα

    Συλλογή δεδομένων.Πριν ξεκινήσετε τον υπολογισμό του συντελεστή συσχέτισης, εξετάστε το δεδομένο ζεύγος αριθμών. Είναι καλύτερα να τα γράψετε σε έναν πίνακα που μπορεί να τακτοποιηθεί κάθετα ή οριζόντια. Επισημάνετε κάθε γραμμή ή στήλη ως "x" και "y".

    • Για παράδειγμα, δίνονται τέσσερα ζεύγη τιμών (αριθμοί) των μεταβλητών "x" και "y". Μπορείτε να δημιουργήσετε τον παρακάτω πίνακα:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Υπολογίστε τον αριθμητικό μέσο όρο «x».Για να το κάνετε αυτό, προσθέστε όλες τις τιμές του "x" και, στη συνέχεια, διαιρέστε το αποτέλεσμα με τον αριθμό των τιμών.

    • Στο παράδειγμά μας, μας δίνονται τέσσερις τιμές για τη μεταβλητή "x". Για να υπολογίσετε τον αριθμητικό μέσο όρο "x", προσθέστε αυτές τις τιμές και, στη συνέχεια, διαιρέστε το άθροισμα με το 4. Οι υπολογισμοί θα γραφούν ως εξής:
    • μ x = (1 + 2 + 4 + 5) / 4 (\style display \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Βρείτε τον αριθμητικό μέσο όρο «y».Για να το κάνετε αυτό, ακολουθήστε τα ίδια βήματα, δηλαδή, προσθέστε όλες τις τιμές του "y" και, στη συνέχεια, διαιρέστε το άθροισμα με τον αριθμό των τιμών.

    • Στο παράδειγμά μας, μας δίνονται τέσσερις τιμές για τη μεταβλητή "y". Προσθέστε αυτές τις τιμές και, στη συνέχεια, διαιρέστε το άθροισμα με το 4. Οι υπολογισμοί θα γραφτούν ως εξής:
    • μ y = (1 + 3 + 5 + 7) / 4 (\style display \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Υπολογίστε την τυπική απόκλιση του "x".Αφού υπολογίσετε τους μέσους όρους των «x» και «y», βρείτε τυπικές αποκλίσειςαυτές οι μεταβλητές. Η τυπική απόκλιση υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10)))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1 , 83 (\displaystyle \sigma _(x)=1,83)
  4. Υπολογίστε την τυπική απόκλιση "y".Ακολουθήστε τα βήματα στο προηγούμενο βήμα. Χρησιμοποιήστε τον ίδιο τύπο, αλλά αντικαταστήστε τις τιμές "y" σε αυτόν.

    • Στο παράδειγμά μας, οι υπολογισμοί θα γραφτούν ως εξής:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2 , 58 (\displaystyle \sigma _(y)=2,58)
  5. Να γράψετε τον βασικό τύπο για τον υπολογισμό του συντελεστή συσχέτισης.Αυτός ο τύπος περιλαμβάνει μέσους όρους, τυπικές αποκλίσεις και τον αριθμό (n) των ζευγών αριθμών και των δύο μεταβλητών. Ο συντελεστής συσχέτισης συμβολίζεται ως "r" (σε σπάνιες περιπτώσεις, ως "ρ"). Αυτό το άρθρο χρησιμοποιεί τον τύπο για τον υπολογισμό του συντελεστή συσχέτισης Pearson.

    • Εδώ και σε άλλες πηγές, οι ποσότητες μπορούν να υποδηλωθούν με διαφορετικούς τρόπους. Για παράδειγμα, ορισμένοι τύποι έχουν "ρ" και "σ", ενώ άλλοι έχουν "r" και "s". Κάποια σχολικά βιβλία δίνουν άλλους τύπους, αλλά είναι μαθηματικά ανάλογατον παραπάνω τύπο.
  6. Έχετε υπολογίσει τους μέσους όρους και τις τυπικές αποκλίσεις και των δύο μεταβλητών, επομένως μπορείτε να χρησιμοποιήσετε τον τύπο για να υπολογίσετε τον συντελεστή συσχέτισης. Θυμηθείτε ότι το "n" είναι ο αριθμός των ζευγών τιμών και των δύο μεταβλητών. Η αξία των άλλων ποσοτήτων έχει υπολογιστεί προηγουμένως.

    • Στο παράδειγμά μας, οι υπολογισμοί θα γραφτούν ως εξής:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\δεξιά))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\right)*\left((\frac (1-4)(2.58))\right)+\left((\frac (2-3)(1.83))\right) *\αριστερά((\ frac (3-4)(2,58))\δεξιά))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3 )(1.83))\δεξιά)*\αριστερά((\frac (5-4)(2.58))\right)+\left((\frac (5-3)(1.83))\ right)*\left( (\frac (7-4)(2,58))\δεξιά))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6 +1+1+6)(4.721))\δεξιά))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0 . 988 (\displaystyle \rho =0,988)
  7. Αναλύστε το αποτέλεσμα.Στο παράδειγμά μας, ο συντελεστής συσχέτισης είναι 0,988. Αυτή η τιμή χαρακτηρίζει κατά κάποιο τρόπο ένα δεδομένο σύνολο ζευγών αριθμών. Δώστε προσοχή στο πρόσημο και το μέγεθος της τιμής.

    • Εφόσον η τιμή του συντελεστή συσχέτισης είναι θετική, υπάρχει θετική συσχέτιση μεταξύ των μεταβλητών "x" και "y". Δηλαδή, όταν αυξάνεται η τιμή του "x", αυξάνεται και η τιμή του "y".
    • Δεδομένου ότι η τιμή του συντελεστή συσχέτισης είναι πολύ κοντά στο +1, οι τιμές των μεταβλητών x και y συσχετίζονται σε μεγάλο βαθμό. Αν βάλεις τελείες επίπεδο συντεταγμένων, θα βρίσκονται κοντά σε κάποια ευθεία.

    Χρήση ηλεκτρονικών αριθμομηχανών για τον υπολογισμό του συντελεστή συσχέτισης

    1. Βρείτε μια αριθμομηχανή στο Διαδίκτυο για να υπολογίσετε τον συντελεστή συσχέτισης.Αυτός ο συντελεστής υπολογίζεται συχνά στα στατιστικά στοιχεία. Εάν υπάρχουν πολλά ζεύγη αριθμών, είναι πρακτικά αδύνατο να υπολογιστεί ο συντελεστής συσχέτισης με το χέρι. Επομένως, υπάρχουν ηλεκτρονικές αριθμομηχανές για τον υπολογισμό του συντελεστή συσχέτισης. Στη μηχανή αναζήτησης, πληκτρολογήστε "υπολογιστής συντελεστών συσχέτισης" (χωρίς εισαγωγικά).

    2. Εισαγάγετε δεδομένα.Διαβάστε τις οδηγίες στον ιστότοπο για να εισάγετε σωστά τα δεδομένα (ζεύγη αριθμών). Είναι εξαιρετικά σημαντικό να εισάγετε τα κατάλληλα ζεύγη αριθμών. αλλιώς θα έχεις λάθος αποτέλεσμα. Λάβετε υπόψη ότι διαφορετικοί ιστότοποι έχουν διαφορετικές μορφές εισαγωγής δεδομένων.

      • Για παράδειγμα, στον ιστότοπο http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, οι τιμές των μεταβλητών "x" και "y" εισάγονται σε δύο οριζόντιες γραμμές. Οι τιμές διαχωρίζονται με κόμμα. Δηλαδή, στο παράδειγμά μας, οι τιμές του "x" εισάγονται ως εξής: 1,2,4,5 και οι τιμές του "y" είναι ως εξής: 1,3,5,7.
      • Σε έναν άλλο ιστότοπο, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , τα δεδομένα εισάγονται κάθετα. Σε αυτήν την περίπτωση, μην συγχέετε τα αντίστοιχα ζεύγη αριθμών.
    3. Υπολογίστε τον συντελεστή συσχέτισης.Αφού εισαγάγετε τα δεδομένα, απλώς κάντε κλικ στο κουμπί «Υπολογισμός», «Υπολογισμός» ή παρόμοιο για να λάβετε το αποτέλεσμα.

      Χρήση Υπολογιστή γραφικών

      1. Εισαγάγετε δεδομένα.Πάρτε μια αριθμομηχανή γραφικών, μεταβείτε στη λειτουργία στατιστικού υπολογισμού και επιλέξτε την εντολή Επεξεργασία.

        • Σε διαφορετικές αριθμομηχανές, πρέπει να πατήσετε διαφορετικά πλήκτρα. Αυτό το άρθρο εστιάζει στον υπολογιστή Texas Instruments TI-86.
        • Για να μεταβείτε στη λειτουργία στατιστικού υπολογισμού, πατήστε - Stat (πάνω από το πλήκτρο "+"). Στη συνέχεια, πατήστε F2 - Επεξεργασία (Επεξεργασία).
      2. Διαγραφή προηγούμενων αποθηκευμένων δεδομένων.Οι περισσότερες αριθμομηχανές διατηρούν τα στατιστικά στοιχεία που έχετε καταχωρίσει μέχρι να τα διαγράψετε. Για να αποφύγετε τη σύγχυση των παλαιών δεδομένων με τα νέα δεδομένα, διαγράψτε πρώτα τυχόν αποθηκευμένες πληροφορίες.

        • Χρησιμοποιήστε τα πλήκτρα βέλους για να μετακινήσετε τον κέρσορα και να επισημάνετε την επικεφαλίδα "xStat". Στη συνέχεια, πατήστε Clear και Enter για να διαγράψετε όλες τις τιμές που έχουν εισαχθεί στη στήλη xStat.
        • Χρησιμοποιήστε τα πλήκτρα βέλους για να επισημάνετε την επικεφαλίδα "yStat". Στη συνέχεια, πατήστε Clear και Enter για να διαγράψετε όλες τις τιμές που έχουν εισαχθεί στη στήλη yStat.
      3. Εισαγάγετε τα αρχικά δεδομένα.Χρησιμοποιήστε τα πλήκτρα βέλους για να μετακινήσετε τον κέρσορα στο πρώτο κελί κάτω από την επικεφαλίδα "xStat". Εισαγάγετε την πρώτη τιμή και πατήστε Enter. Στο κάτω μέρος της οθόνης, θα εμφανιστεί η ένδειξη "xStat (1) = __", με την εισαγόμενη τιμή αντί για κενό. Αφού πατήσετε το Enter, η εισαγόμενη τιμή θα εμφανιστεί στον πίνακα και ο δρομέας θα μετακινηθεί στην επόμενη γραμμή. Αυτό θα εμφανίσει "xStat(2) = __" στο κάτω μέρος της οθόνης.

        • Εισαγάγετε όλες τις τιμές της μεταβλητής "x".
        • Αφού εισαγάγετε όλες τις τιμές για τη μεταβλητή x, χρησιμοποιήστε τα πλήκτρα βέλους για να μεταβείτε στη στήλη yStat και να εισαγάγετε τις τιμές για τη μεταβλητή y.
        • Αφού εισαγάγετε όλα τα ζεύγη αριθμών, πατήστε Έξοδος για να καθαρίσετε την οθόνη και να βγείτε από τη λειτουργία συγκέντρωσης.
      4. Υπολογίστε τον συντελεστή συσχέτισης.Χαρακτηρίζει πόσο κοντά είναι τα δεδομένα σε κάποια ευθεία γραμμή. Η αριθμομηχανή γραφικών μπορεί να προσδιορίσει γρήγορα την κατάλληλη ευθεία γραμμή και να υπολογίσει τον συντελεστή συσχέτισης.

        • Κάντε κλικ στο Stat (Στατιστικά στοιχεία) - Calc (Υπολογισμοί). Στο TI-86, πατήστε - - .
        • Επιλέξτε τη συνάρτηση "Γραμμική παλινδρόμηση" ( Γραμμικής παλινδρόμησης). Στο TI-86, πατήστε , το οποίο φέρει την ένδειξη "LinR". Η γραμμή "LinR _" θα εμφανιστεί στην οθόνη με έναν δρομέα που αναβοσβήνει.
        • Τώρα εισάγετε τα ονόματα δύο μεταβλητών: xStat και yStat.
          • Στο TI-86, ανοίξτε τη λίστα ονομάτων. για να το κάνετε αυτό πατήστε – – .
          • Οι διαθέσιμες μεταβλητές εμφανίζονται στην κάτω γραμμή της οθόνης. Επιλέξτε (πιθανότατα πατώντας F1 ή F2), πληκτρολογήστε ένα κόμμα και, στη συνέχεια, επιλέξτε .
          • Πατήστε Enter για να επεξεργαστείτε τα δεδομένα που έχετε εισάγει.
      5. Αναλύστε τα αποτελέσματα.Πατώντας Enter, στην οθόνη θα εμφανιστούν οι ακόλουθες πληροφορίες:

        • y = a + b x (\displaystyle y=a+bx): είναι μια συνάρτηση που περιγράφει μια ευθεία γραμμή. Σημειώστε ότι η συνάρτηση δεν είναι γραμμένη σε τυπική μορφή (y = kx + b).
        • a = (\displaystyle a=). Αυτή είναι η συντεταγμένη y του σημείου όπου η ευθεία τέμνεται με τον άξονα y.
        • b = (\displaystyle b=). το κλίσηευθεία.
        • corr = (\displaystyle (\text(corr))=). Αυτός είναι ο συντελεστής συσχέτισης.
        • n = (\displaystyle n=). Αυτός είναι ο αριθμός των ζευγών αριθμών που χρησιμοποιήθηκαν στους υπολογισμούς.

Όπου x y , x , y είναι οι μέσες τιμές των δειγμάτων. σ(x), σ(y) - τυπικές αποκλίσεις.
Επιπλέον, ο συντελεστής συσχέτισης γραμμικών ζευγών μπορεί να προσδιοριστεί μέσω του συντελεστή παλινδρόμησης b: a+bx .

Άλλες επιλογές τύπου:
ή

K xy - ροπή συσχέτισης (συντελεστής συνδιακύμανσης)

Ο συντελεστής γραμμικής συσχέτισης παίρνει τιμές από -1 έως +1 (δείτε την κλίμακα Chaddock). Για παράδειγμα, κατά την ανάλυση της στεγανότητας μιας γραμμικής συσχέτισης μεταξύ δύο μεταβλητών, προέκυψε ένας συντελεστής γραμμικής συσχέτισης ζεύγους ίσος με –1. Αυτό σημαίνει ότι υπάρχει μια ακριβής αντίστροφη γραμμική σχέση μεταξύ των μεταβλητών.

Η γεωμετρική σημασία του συντελεστή συσχέτισης: r xy δείχνει πόσο διαφέρει η κλίση των δύο γραμμών παλινδρόμησης: y(x) και x(y), πόσο διαφέρουν τα αποτελέσματα της ελαχιστοποίησης των αποκλίσεων σε x και σε y. Όσο μεγαλύτερη είναι η γωνία μεταξύ των γραμμών, τόσο μεγαλύτερη είναι η r xy .
Το πρόσημο του συντελεστή συσχέτισης συμπίπτει με το πρόσημο του συντελεστή παλινδρόμησης και καθορίζει την κλίση της γραμμής παλινδρόμησης, δηλ. γενικού προσανατολισμούεξαρτήσεις (αύξηση ή μείωση). Η απόλυτη τιμή του συντελεστή συσχέτισης καθορίζεται από το βαθμό εγγύτητας των σημείων στη γραμμή παλινδρόμησης.

Ιδιότητες του συντελεστή συσχέτισης

  1. |r xy | ≤ 1;
  2. Εάν τα X και Y είναι ανεξάρτητα, τότε r xy =0, το αντίθετο δεν ισχύει πάντα.
  3. αν |r xy |=1, τότε Y=aX+b, |r xy (X,aX+b)|=1, όπου τα a και b είναι σταθερά και ≠ 0;
  4. |r xy (X,Y)|=|r xy (a 1 X+b 1 , a 2 X+b 2)|, όπου a 1 , a 2 , b 1 , b 2 είναι σταθερές.

Εντολή. Καθορίστε τον όγκο των δεδομένων πηγής. Η λύση που προκύπτει αποθηκεύεται σε ένα αρχείο Word (δείτε Παράδειγμα εύρεσης εξίσωσης παλινδρόμησης). Ένα πρότυπο λύσης δημιουργείται επίσης αυτόματα στο Excel. .

Αριθμός γραμμών (αρχικά δεδομένα)
Δίνονται οι τελικές τιμές των μεγεθών (∑x, ∑x 2 , ∑xy, ∑y, ∑y 2)