Βιογραφίες Χαρακτηριστικά Ανάλυση

Εγκυρότητα μεθοδολογίας, είδη εγκυρότητας. Η ανάλυση συσχέτισης ως μία από τις μεθόδους για τον προσδιορισμό της αξιοπιστίας και της εγκυρότητας

Ένα άτομο χρησιμοποιεί διάφορες μεθόδους και εργαλεία για να ελέγξει ή να μετρήσει κάποιο είδος ποιότητας. Ο βαθμός στον οποίο αυτή η τεχνική και το εργαλείο είναι ικανά να παράγουν αποτελέσματα ποιοτικά υποδηλώνει την εγκυρότητά τους. Τι σημαίνει αυτή η έννοια στην ψυχολογία; Ποια είναι τα είδη εγκυρότητας; Στην ψυχολογία, αυτή η ιδιότητα είναι συνήθως εφαρμόσιμη σε τεστ και μεθόδους που χρησιμοποιούνται από ειδικούς.

Τι είναι εγκυρότητα;

Η έννοια που εξετάζουμε έχει πολλούς ορισμούς. Τι είναι εγκυρότητα; Αυτή είναι η καταλληλότητα και η εγκυρότητα της εφαρμογής κάποιας τεχνικής ή αποτελέσματος σε μια συγκεκριμένη κατάσταση. Η εφαρμοσμένη έννοια αυτής της λέξης είναι ο βαθμός συμμόρφωσης των αποτελεσμάτων και των μεθόδων με τις εργασίες που έχουν τεθεί.

Η εγκυρότητα είναι μια άλλη μέτρηση που μετρά συγκεκριμένες ιδιότητες. Έτσι, η τεχνική στοχεύει στη μέτρηση μιας συγκεκριμένης ποιότητας, όπως η νοημοσύνη, και η εγκυρότητά της θα πρέπει να υποδεικνύει πόσο καλά βοηθά η τεχνική στην απόκτηση αποτελεσμάτων.

Με άλλα λόγια, η εγκυρότητα μπορεί να ονομαστεί αξιοπιστία. Μετρά εκείνα τα τεστ και τις μεθόδους που μετρούν ορισμένες ψυχολογικές ιδιότητες. Όσο καλύτερα μετρούν τις ποιότητες που μετρούν, τόσο μεγαλύτερη είναι η εγκυρότητά τους.

Η εγκυρότητα είναι σημαντική σε δύο περιπτώσεις:

  1. Όταν αναπτύσσεται μια συγκεκριμένη τεχνική.
  2. Όταν μια συγκεκριμένη τεχνική δείχνει αποτελέσματα, και είναι απαραίτητο να εξακριβωθεί πόσο καλά είναι αυτά τα αποτελέσματα.

Έτσι, η εγκυρότητα είναι ένα χαρακτηριστικό που υποδεικνύει την καταλληλότητα μιας συγκεκριμένης τεχνικής για τη μέτρηση κάποιας ποιότητας και τη χρησιμότητα, την ποιότητα και την αποτελεσματικότητα αυτής της τεχνικής.

Συνήθως, χρησιμοποιούνται διάφοροι τύποι εγκυρότητας για την επικύρωση μιας συγκεκριμένης δοκιμής ή τεχνικής. Επίσης, συγκρίνει τους δείκτες που δίνονται από διαφορετικά εργαλεία. Υπάρχουν πολλοί τρόποι μέτρησης μιας συγκεκριμένης ψυχολογικής ποιότητας ή χαρακτηριστικού. Πιο συχνά, οι ψυχολόγοι θα χρησιμοποιήσουν τη μέθοδο που δίνει πιο αξιόπιστα αποτελέσματα. Αυτό θα δείξει την υψηλή εγκυρότητά του.

Μαζί με την εγκυρότητα, θεωρείται συχνά μια έννοια όπως η αξιοπιστία. Οι μέθοδοι και τα τεστ πρέπει να είναι αξιόπιστα, δηλαδή να είναι σταθερά, αξιόπιστα. Ο πειραματιστής πρέπει να είναι σίγουρος ότι εξετάζει ακριβώς την ποιότητα που θέλει να εξετάσει. Αυτός είναι ο λόγος για τον οποίο η αξιοπιστία μπορεί να μην είναι πάντα έγκυρη, αλλά η εγκυρότητα πρέπει να είναι πάντα αξιόπιστη.

Εγκυρότητα στην ψυχολογία

Η εγκυρότητα χρησιμοποιείται σε πολλούς τομείς της ζωής, όπου μετρώνται διάφοροι δείκτες. Στην ψυχολογία, η εγκυρότητα καθίσταται επίσης απαραίτητη, ειδικά στην πειραματική ψυχολογία. Η εγκυρότητα στην ψυχολογία είναι:

  • την εμπιστοσύνη του πειραματιστή ότι μετρά την ποιότητα που χρειάζεται.
  • αξιοπιστία των δεικτών που μετρούν αυτή την ποιότητα.

Εάν ο αναγνώστης έχει περάσει ποτέ ψυχολογικά τεστ, τότε γνωρίζει για την εσωτερική επιθυμία να πάρει μια συγκεκριμένη απάντηση στο ερώτημα που τίθεται. Η εγκυρότητα ενός τεστ δείχνει στον πειραματιστή το συγκεκριμένο αποτέλεσμα που επιτυγχάνει μέσω της δοκιμής. Εδώ είναι μια συγκεκριμένη εργασία, την απάντηση στην οποία πρέπει να λάβει αφού εκτελέσει όλες τις απαραίτητες ενέργειες.

Οι μέθοδοι και οι δοκιμές πρέπει να είναι χρήσιμες και έγκυρες, κάτι που μετριέται από την εγκυρότητά τους.

Υπάρχουν τρεις τρόποι για να ελέγξετε την εγκυρότητα:

  1. Η εκτίμηση της εγκυρότητας περιεχομένου είναι η αντιστοιχία των αποτελεσμάτων της αξιολόγησης του υποκειμένου με τις πραγματικές ιδιότητες που εμφανίζονται στην πραγματικότητα. Εδώ χρησιμοποιείται μια τέτοια έννοια όπως η εγκυρότητα του προσώπου - ένα άτομο πρέπει να δει μια πραγματική σύνδεση μεταξύ του περιεχομένου της ίδιας της μεθοδολογίας και των αποτελεσμάτων και της πραγματικότητας της, στην οποία εκδηλώνεται η μετρούμενη ποιότητα.
  2. Η αξιολόγηση της εγκυρότητας της κατασκευής είναι ο προσδιορισμός ότι η τεχνική υπολογίζει δομές που βασίζονται σε στοιχεία και προκαθορισμένες. Η συγκλίνουσα επικύρωση επιτρέπει τη χρήση πολλών τεχνικών που λαμβάνουν υπόψη παρόμοια χαρακτηριστικά και δίνουν πιο ακριβή αποτελέσματα της εξεταζόμενης ποιότητας. Η επικύρωση διάκρισης αποκλείει άλλες τεχνικές που εξετάζουν ποιότητες που δεν συσχετίζονται με την επιθυμητή ποιότητα.
  3. Η αξιολόγηση της εγκυρότητας του κριτηρίου είναι η αντιστοιχία των αποτελεσμάτων με τους αναμενόμενους δείκτες, οι οποίοι αποκαλύπτονται με άλλους τρόπους. Εδώ χρησιμοποιείται η προγνωστική εγκυρότητα, η οποία βοηθά στην πρόβλεψη της μελλοντικής συμπεριφοράς.

Τύποι εγκυρότητας

Υπάρχουν διάφοροι τύποι εγκυρότητας, τους οποίους θα συζητήσουμε παρακάτω:

  1. Η εξωτερική εγκυρότητα είναι μια γενίκευση του συμπεράσματος μιας κατάστασης, πληθυσμού, ανεξάρτητων μεταβλητών. Χωρίζεται σε:
  • λειτουργική εγκυρότητα.
  • Εγκυρότητα κατασκευής - μια εξήγηση της συμπεριφοράς ενός ατόμου τη στιγμή της επιτυχίας του τεστ.
  1. Εσωτερική εγκυρότητα - αλλαγή κατά τη διάρκεια του πειράματος υπό την επίδραση αμετάβλητων παραγόντων.
  2. διαφορική εγκυρότητα.
  3. αυξητική εγκυρότητα.
  4. Η οικολογική εγκυρότητα είναι ένας δείκτης ότι ένα άτομο είναι ικανό να εκτελέσει διάφορες ενέργειες που σε μια κατάσταση μπορεί να είναι επιτυχείς, αλλά όχι σε μια άλλη.

Αυτή η ταξινόμηση χρησιμοποιείται από την πειραματική ψυχολογία. Η οργανωσιακή ψυχολογία και η ψυχοδιαγνωστική χρησιμοποιούν διαφορετική ταξινόμηση:

  1. δομική εγκυρότητα. Χωρίζεται σε:
  • συγκλίνουσα εγκυρότητα.
  • αποκλίνουσα εγκυρότητα.
  1. Κριτήρια (εμπειρική) εγκυρότητα - υπολογισμός συσχέτισης ανά βαθμολογία στο τεστ εξωτερικής παραμέτρου που επιλέχθηκε ως έγκυρος δείκτης. Χωρίζεται σε:
  • Τρέχουσα εγκυρότητα - η μελέτη της παραμέτρου στον παρόντα χρόνο.
  • Αναδρομική ισχύς - κατάσταση ή γεγονός που συνέβη στο παρελθόν.
  • Προγνωστική εγκυρότητα - πρόβλεψη συμπεριφοράς, ποιότητας.
  1. Εγκυρότητα περιεχομένου - χρησιμοποιείται σε πειράματα όπου εξετάζεται κάποια αλληλεπίδραση, δραστηριότητα. Έχει ένα υποείδος:
  • προφανής εγκυρότητα.

Άλλοι τύποι εγκυρότητας είναι:

  • Εκ των προτέρων.
  • Σύμφωνος.
  • Σχετίζεται με.
  • Εποικοδομητικός.
  • Ομοφωνία.
  • Παραγοντικό.
  • θεωρητικά κλπ.

Τι είναι η εγκυρότητα του τεστ;

Πολλοί άνθρωποι υποβάλλονται σε εξετάσεις. Υπάρχουν ειδικά ψυχολογικά τεστ που χρησιμοποιούνται από ψυχολόγους, και άλλα τεστ ταμπλόιντ. Ποια είναι η εγκυρότητα του τεστ, που είναι το σημαντικό του κριτήριο; Αυτός είναι ένας δείκτης της αντιστοιχίας μιας χαρακτηριστικής, ποιότητας, ιδιότητας στη δοκιμή που τις μετρά.

Τα τεστ είναι διαφορετικά. Χρησιμοποιούνται για τη μέτρηση των ψυχοφυσιολογικών παραμέτρων ενός ατόμου. Η υψηλότερη εγκυρότητα παραμένει 80%. Η χρησιμότητα της χρήσης δοκιμών γίνεται όταν σας επιτρέπουν να αποκτήσετε ακριβή δεδομένα για ορισμένα συγκεκριμένα χαρακτηριστικά. Υπάρχουν διάφορες προσεγγίσεις για τη μελέτη της εγκυρότητας ενός τεστ:

  1. Εποικοδομητική εγκυρότητα, η οποία σας επιτρέπει να μελετήσετε βαθύτερα τις ιδιότητες ενός ατόμου σε μια κατάσταση, δραστηριότητα, σύστημα.
  2. Εγκυρότητα με κριτήριο - μελέτη της παραμέτρου στον παρόντα χρόνο και πρόβλεψή της στο μέλλον.
  3. Η εγκυρότητα περιεχομένου είναι η αντιστοιχία των ψυχολογικών κατασκευών, η ποικιλομορφία τους.
  4. Προγνωστική εγκυρότητα - προβλέπει την ανάπτυξη μιας συγκεκριμένης ποιότητας στο μέλλον, κάτι που είναι δύσκολο γιατί μπορεί να αναπτυχθεί διαφορετικά σε διαφορετικούς ανθρώπους.

Μέχρι να καθοριστεί η αξιοπιστία και η εγκυρότητα του τεστ, δεν χρησιμοποιείται στην ψυχολογική πρακτική. Πολλά εξαρτώνται από τους τομείς στους οποίους εφαρμόζονται οι δοκιμές. Υπάρχουν εκπαιδευτικά, επαγγελματικά και άλλα τεστ που χρησιμοποιούνται σε μεμονωμένα ιδρύματα για την πρόβλεψη και τον εντοπισμό των χαρακτηριστικών των υποψηφίων.

Στον ιστότοπο ψυχολογικής βοήθειας, μπορείτε επίσης να κάνετε τεστ που έχουν ήδη υψηλή εγκυρότητα και δείχνουν αξιόπιστα αποτελέσματα.

Τι είναι η εγκυρότητα της μεθόδου;

Τι είναι η εγκυρότητα της μεθόδου; Αυτός είναι ένας δείκτης που δείχνει εάν η υπό εξέταση τεχνική μελετά την ποιότητα, τα χαρακτηριστικά για τα οποία προορίζεται. Παράλληλα, δίνεται έμφαση στο γεγονός ότι το υποκείμενο που δοκιμάζεται μπορεί να δει και να χαρακτηριστεί διαφορετικά. Γι' αυτό τα αποτελέσματα δεν λαμβάνουν πάντα υπόψη τη γνώμη των ανθρώπων που μπορεί να μην παρατηρούν ορισμένα χαρακτηριστικά στον εαυτό τους.

Η επικύρωση είναι η επαλήθευση της εγκυρότητας μιας μεθοδολογίας. Για τον προσδιορισμό της αποτελεσματικότητας, της αποδοτικότητας, της πρακτικότητας της χρησιμοποιούμενης μεθοδολογίας, χρησιμοποιείται ένας εξωτερικός ανεξάρτητος δείκτης - μια ποιότητα που παρατηρείται στην καθημερινή ζωή. Υπάρχουν 4 τύποι εξωτερικών δεικτών:

  1. Το κριτήριο απόδοσης είναι ο χρόνος που δαπανάται, ο όγκος της εργασίας, το επίπεδο ακαδημαϊκών επιδόσεων, η ανάπτυξη των επαγγελματικών δεξιοτήτων κ.λπ.
  2. Υποκειμενικά κριτήρια - γνώμη, απόψεις, προτίμηση, στάση του υποκειμένου σε κάποιον ή κάτι. Εδώ χρησιμοποιούνται ερωτηματολόγια, συνεντεύξεις, ερωτηματολόγια.
  3. Φυσιολογικά κριτήρια - η επίδραση του εξωτερικού κόσμου στην ψυχή και το ανθρώπινο σώμα. Μετρά σφυγμό, αναπνευστικό ρυθμό, συμπτώματα κόπωσης κ.λπ.
  4. Το κριτήριο της τυχαιότητας - είναι δυνατόν, για παράδειγμα, να επιλεγούν άτομα που δεν είναι επιρρεπή σε ατυχήματα; Μελέτη των επιπτώσεων μιας συγκεκριμένης περίπτωσης.

Η θεωρητική προσέγγιση στη μέτρηση της εγκυρότητας των μεθόδων μας επιτρέπει να αναγνωρίσουμε εάν η τεχνολογία μελετά πραγματικά την ποιότητα για την οποία προοριζόταν.

Η εγκυρότητα καθορίζεται επίσης από την εμφάνιση της ποιότητας που μελετήθηκε. Είναι καλό αν είναι κοινό, πράγμα που κάνει την τεχνική απαραίτητη και χρήσιμη. Οι ηθικές και πολιτισμικές αλλαγές στην κοινωνία γίνονται επίσης σημαντικές.

Αποτέλεσμα

Στην ψυχολογική πρακτική, τα τεστ και οι τεχνικές χρησιμοποιούνται συχνά για να βοηθήσουν στη μελέτη της προσωπικότητας ενός ατόμου. Εδώ μιλάμε συγκεκριμένα για εσωτερικές παραμέτρους που δεν είναι ορατές στο μάτι. Οι ιδιότητες του χαρακτήρα, η συμπεριφορά, η πιθανή πρόβλεψη για το μέλλον, το τι θα είναι ένα άτομο και ποια θα είναι η ζωή του - όλα αυτά μελετώνται με διάφορα τεστ και μεθόδους που επιδιώκουν ένα μόνο αποτέλεσμα - τη μελέτη ενός ατόμου.

Το αποτέλεσμα ενός επιτυχούς προσδιορισμού της εγκυρότητας ενός συγκεκριμένου οργάνου είναι η επιτυχής γνώση του κάθε ατόμου, ανεξάρτητα από το πώς βλέπει τον εαυτό του. Οι άνθρωποι συχνά δεν παρατηρούν ορισμένες ιδιότητες στον εαυτό τους, σπάνια βλέπουν τον εαυτό τους με μια νηφάλια ματιά. Οι δοκιμές και οι τεχνικές σάς επιτρέπουν να αποκαλύψετε μεμονωμένες παραμέτρους.

Η πρόβλεψη έγκυρων τεστ και μεθόδων είναι μια γρήγορη και ποιοτική γνώση ενός άλλου ατόμου με την ικανότητα να τον βοηθήσει στην επίλυση οποιουδήποτε ψυχολογικού προβλήματος. Αυτό δεν επιτυγχάνεται σύντομα, αλλά τα διαθέσιμα εργαλεία έχουν ήδη δείξει την αποτελεσματικότητά τους. Συνήθως, αυτή η ερώτηση ενδιαφέρει μόνο εκείνους τους ανθρώπους που εμπλέκονται στον προσδιορισμό της ποιότητας των δοκιμών και των μεθόδων. Ωστόσο, θα είναι επίσης χρήσιμο για τους απλούς ανθρώπους να γνωρίζουν ποιες ασκήσεις πρέπει να εμπιστεύονται και ποιες όχι.

Αριθμός εισιτηρίου 9

Ερωτηματολόγια κινήτρων και τα χαρακτηριστικά τους.

Ερωτηματολόγια κινήτρων - μια ομάδα ερωτηματολογίων που έχουν σχεδιαστεί για τη διάγνωση της σφαίρας των κινήτρων-ανάγκων ενός ατόμου, που σας επιτρέπει να καθορίσετε σε τι στρέφεται η δραστηριότητα ενός ατόμου (κίνητρα ως λόγοι που καθορίζουν την επιλογή της κατεύθυνσης της συμπεριφοράς). Επιπλέον, το ερώτημα πώς ρυθμίζεται η δυναμική της συμπεριφοράς έχει μεγάλη σημασία. Σε αυτή την περίπτωση, συχνά καταφεύγει κανείς στη μέτρηση στάσεων. Η ανάπτυξη ερωτηματολογίων κινήτρων στην ψυχοδιαγνωστική σχετίζεται σε μεγάλο βαθμό με την ανάγκη αξιολόγησης της επιρροής του παράγοντα «κοινωνικής επιθυμίας», ο οποίος έχει στάσεις και μειώνει την αξιοπιστία των δεδομένων που λαμβάνονται με τη χρήση ερωτηματολογίων προσωπικότητας. Τα πιο διάσημα ερωτηματολόγια κινήτρων περιλαμβάνουν τη «Λίστα Προσωπικών Προτιμήσεων» που αναπτύχθηκε από τον A. Edwards (1954), η οποία έχει σχεδιαστεί για να μετρήσει την «ισχύ» των αναγκών που δανείστηκε από τη λίστα που πρότεινε ο G. Murray για το θεματικό τεστ αντίληψης. Αυτές οι ανάγκες περιλαμβάνουν, για παράδειγμα, την ανάγκη για επιτυχία, σεβασμό, ηγεσία κλπ. Η «δύναμη» κάθε ανάγκης εκφράζεται όχι με απόλυτους όρους, αλλά σε σχέση με τη «δύναμη» άλλων αναγκών, δηλ. χρησιμοποιούνται προσωπικοί δείκτες. Για τη μελέτη του ρόλου του παράγοντα «κοινωνικής επιθυμίας», ο A. Edwards (1957) πρότεινε ένα ειδικό ερωτηματολόγιο. Άλλα ερωτηματολόγια κινήτρων χρησιμοποιούνται επίσης ευρέως, για παράδειγμα, το Personality Study Form του D. Jackson (1967), τα ερωτηματολόγια του A. Mehrabyan (1970) κ.λπ.

Μετά την αξιοπιστία, ένα άλλο βασικό κριτήριο για την αξιολόγηση της ποιότητας των μεθόδων είναι η εγκυρότητα. Το ζήτημα της εγκυρότητας της μεθοδολογίας αποφασίζεται μόνο αφού διαπιστωθεί η επαρκής αξιοπιστία της, αφού μια αναξιόπιστη μεθοδολογία δεν μπορεί να είναι έγκυρη. Αλλά η πιο αξιόπιστη τεχνική χωρίς να γνωρίζουμε την εγκυρότητά της είναι πρακτικά άχρηστη.

Να σημειωθεί ότι το θέμα της εγκυρότητας μέχρι πρόσφατα φαίνεται να είναι από τα πιο δύσκολα. Ο πιο ριζωμένος ορισμός αυτής της έννοιας είναι αυτός που δίνεται στο βιβλίο της Α. Αναστάση: «Η εγκυρότητα ενός τεστ είναι μια έννοια που μας λέει τι μετρά το τεστ και πόσο καλά το κάνει».

Για το λόγο αυτό, δεν υπάρχει ενιαία καθολική προσέγγιση για τον προσδιορισμό της εγκυρότητας. Ανάλογα με την πλευρά της εγκυρότητας που θέλει να εξετάσει ο ερευνητής, χρησιμοποιούνται και διαφορετικές μέθοδοι απόδειξης. Με άλλα λόγια, η έννοια της εγκυρότητας περιλαμβάνει τους διαφορετικούς τύπους της, που έχουν τη δική τους ιδιαίτερη σημασία. Ο έλεγχος της εγκυρότητας μιας τεχνικής ονομάζεται επικύρωση.



Η εγκυρότητα με την πρώτη της έννοια σχετίζεται με την ίδια τη μεθοδολογία, δηλαδή είναι η εγκυρότητα του εργαλείου μέτρησης. Αυτός ο έλεγχος ονομάζεται θεωρητική επικύρωση. Η εγκυρότητα με τη δεύτερη έννοια αναφέρεται ήδη όχι τόσο στη μεθοδολογία όσο στον σκοπό της χρήσης της. Αυτή είναι ρεαλιστική επικύρωση.

Συνοψίζοντας, μπορούμε να πούμε τα εξής:

στη θεωρητική επικύρωση, ο ερευνητής ενδιαφέρεται για την ίδια την ιδιότητα που μετράται από την τεχνική. Αυτό, ουσιαστικά, σημαίνει ότι πραγματοποιείται η πραγματική ψυχολογική επικύρωση.

με πραγματιστική επικύρωση, η ουσία του θέματος της μέτρησης (ψυχολογική ιδιότητα) δεν φαίνεται. Η κύρια έμφαση δίνεται στην απόδειξη ότι κάτι που μετράται με τη μεθοδολογία έχει σχέση με ορισμένους τομείς πρακτικής.

Η διεξαγωγή θεωρητικής επικύρωσης, σε αντίθεση με την πραγματιστική επικύρωση, είναι μερικές φορές πολύ πιο δύσκολη. Χωρίς να υπεισέλθουμε σε συγκεκριμένες λεπτομέρειες προς το παρόν, ας σταθούμε γενικά στο πώς ελέγχεται η πραγματιστική εγκυρότητα: επιλέγεται κάποιο εξωτερικό κριτήριο ανεξάρτητο από τη μεθοδολογία που καθορίζει την επιτυχία σε μια συγκεκριμένη δραστηριότητα (εκπαιδευτική, επαγγελματική κ.λπ.) και μαζί του συγκρίνονται τα αποτελέσματα της διαγνωστικής τεχνικής. Εάν η μεταξύ τους σύνδεση αναγνωριστεί ως ικανοποιητική, τότε βγαίνει ένα συμπέρασμα σχετικά με την πρακτική σημασία, την αποτελεσματικότητα και την αποτελεσματικότητα της διαγνωστικής τεχνικής.

Για τον προσδιορισμό της θεωρητικής εγκυρότητας, είναι πολύ πιο δύσκολο να βρεθεί κάποιο ανεξάρτητο κριτήριο που να βρίσκεται εκτός της μεθοδολογίας. Επομένως, στα πρώτα στάδια της ανάπτυξης της τεστολογίας, όταν η έννοια της εγκυρότητας μόλις διαμορφωνόταν, υπήρχε μια διαισθητική ιδέα ότι το τεστ μετρά:

1) η τεχνική ονομάστηκε έγκυρη, αφού αυτό που μετρά είναι απλά προφανές.

2) η απόδειξη εγκυρότητας βασίστηκε στην εμπιστοσύνη του ερευνητή ότι η μέθοδός του καθιστά δυνατή την κατανόηση του θέματος.

3) η μεθοδολογία θεωρήθηκε έγκυρη (δηλαδή έγινε αποδεκτή η δήλωση ότι το τάδε τεστ μετρά την τάδε ποιότητα) μόνο επειδή η θεωρία βάσει της οποίας χτίστηκε η μεθοδολογία είναι πολύ καλή.

Η αποδοχή επί πίστης των ισχυρισμών σχετικά με την εγκυρότητα της μεθοδολογίας δεν μπορούσε να διαρκέσει για μεγάλο χρονικό διάστημα. Οι πρώτες εκδηλώσεις αληθινής επιστημονικής κριτικής απομυθοποίησαν αυτήν την προσέγγιση: ξεκίνησε η αναζήτηση επιστημονικά έγκυρων στοιχείων.

Έτσι, η διεξαγωγή μιας θεωρητικής επικύρωσης μιας μεθοδολογίας σημαίνει ότι η μεθοδολογία μετρά ακριβώς την ιδιότητα, την ποιότητα που, σύμφωνα με την πρόθεση του ερευνητή, θα έπρεπε να μετρήσει.

Έτσι, για παράδειγμα, εάν ένα τεστ αναπτύχθηκε για τη διάγνωση της νοητικής ανάπτυξης των παιδιών, είναι απαραίτητο να αναλυθεί εάν μετράει πραγματικά αυτή την ανάπτυξη και όχι κάποια άλλα χαρακτηριστικά (για παράδειγμα, προσωπικότητα, χαρακτήρας κ.λπ.). Έτσι, για τη θεωρητική επικύρωση, το βασικό πρόβλημα είναι η σχέση μεταξύ των ψυχολογικών φαινομένων και των δεικτών τους, μέσω των οποίων αυτά τα ψυχολογικά φαινόμενα προσπαθούν να γίνουν γνωστά. Αυτό δείχνει πόσο συμπίπτουν η πρόθεση του συγγραφέα και τα αποτελέσματα της μεθοδολογίας.

Δεν είναι τόσο δύσκολο να επικυρωθεί θεωρητικά μια νέα μέθοδος εάν υπάρχει ήδη μια μέθοδος με αποδεδειγμένη εγκυρότητα για τη μέτρηση μιας δεδομένης ιδιότητας. Η παρουσία συσχέτισης μεταξύ της νέας και παρόμοιας ήδη δοκιμασμένης μεθόδου δείχνει ότι η μέθοδος που αναπτύχθηκε μετρά την ίδια ψυχολογική ποιότητα με την αναφορά. Και αν η νέα μέθοδος αποδειχθεί ταυτόχρονα πιο συμπαγής και οικονομική στην εκτέλεση και την επεξεργασία των αποτελεσμάτων, τότε οι ψυχοδιαγνωστικοί έχουν την ευκαιρία να χρησιμοποιήσουν το νέο εργαλείο αντί για το παλιό.

Όμως η θεωρητική εγκυρότητα αποδεικνύεται όχι μόνο με σύγκριση με σχετικούς δείκτες, αλλά και με εκείνους όπου, βάσει της υπόθεσης, δεν θα έπρεπε να υπάρχουν σημαντικές σχέσεις. Έτσι, για τον έλεγχο της θεωρητικής εγκυρότητας, είναι σημαντικό, αφενός, να καθοριστεί ο βαθμός σύνδεσης με μια σχετική τεχνική (convergent validity) και η απουσία αυτής της σχέσης με μεθόδους που έχουν διαφορετική θεωρητική βάση (discriminant validity).

Είναι πολύ πιο δύσκολο να πραγματοποιηθεί η θεωρητική επικύρωση της μεθόδου όταν ένας τέτοιος τρόπος επαλήθευσης είναι αδύνατος. Τις περισσότερες φορές, αυτή είναι η κατάσταση που αντιμετωπίζει ο ερευνητής. Υπό αυτές τις συνθήκες, μόνο η σταδιακή συσσώρευση διαφόρων πληροφοριών σχετικά με το υπό μελέτη ακίνητο, η ανάλυση των θεωρητικών χώρων και των πειραματικών δεδομένων και η σημαντική εμπειρία στην εργασία με την τεχνική καθιστούν δυνατή την αποκάλυψη της ψυχολογικής της σημασίας.

Σημαντικό ρόλο στην κατανόηση του τι μετρά η μεθοδολογία παίζει η σύγκριση των δεικτών της με πρακτικές μορφές δραστηριότητας. Αλλά εδώ είναι ιδιαίτερα σημαντικό η μεθοδολογία να επεξεργασθεί διεξοδικά με θεωρητικούς όρους, δηλαδή να υπάρχει μια στέρεη, καλά τεκμηριωμένη επιστημονική βάση. Στη συνέχεια, κατά τη σύγκριση της μεθοδολογίας με ένα εξωτερικό κριτήριο που λαμβάνεται από την καθημερινή πρακτική, που αντιστοιχεί σε αυτό που μετρά, μπορούν να ληφθούν πληροφορίες που ενισχύουν θεωρητικές ιδέες για την ουσία της.

Είναι σημαντικό να θυμόμαστε ότι εάν αποδειχθεί η θεωρητική εγκυρότητα, τότε η ερμηνεία των δεικτών που λαμβάνονται γίνεται σαφέστερη και πιο σαφής και το όνομα της μεθοδολογίας αντιστοιχεί στο πεδίο εφαρμογής της. Όσον αφορά την πραγματιστική επικύρωση, συνεπάγεται τον έλεγχο της μεθοδολογίας όσον αφορά την πρακτική αποτελεσματικότητα, τη σημασία, τη χρησιμότητα της, καθώς είναι λογικό να χρησιμοποιείται μια διαγνωστική τεχνική μόνο όταν αποδεικνύεται ότι η ιδιότητα που μετράται εκδηλώνεται σε ορισμένες καταστάσεις ζωής, σε ορισμένους τύπους δραστηριότητας. Δίνεται μεγάλη σημασία, ειδικά όπου τίθεται θέμα επιλογής.

Αν στραφούμε ξανά στην ιστορία της ανάπτυξης της τεστολογίας, τότε μπορούμε να διακρίνουμε μια περίοδο (δεκαετία 20-30 του 20ού αιώνα) όπου το επιστημονικό περιεχόμενο των τεστ και οι θεωρητικές αποσκευές τους είχαν λιγότερο ενδιαφέρον. Ήταν σημαντικό ότι το τεστ λειτούργησε και βοήθησε στη γρήγορη επιλογή των πιο προετοιμασμένων ατόμων. Το εμπειρικό κριτήριο για την αξιολόγηση των δοκιμών θεωρήθηκε η μόνη αληθινή κατευθυντήρια γραμμή για την επίλυση επιστημονικών και εφαρμοσμένων προβλημάτων.

Η χρήση διαγνωστικών μεθόδων με καθαρά εμπειρική αιτιολόγηση, χωρίς σαφή θεωρητική βάση, συχνά οδηγούσε σε ψευδοεπιστημονικά συμπεράσματα και αδικαιολόγητες πρακτικές συστάσεις. Ήταν αδύνατο να ονομάσουμε με ακρίβεια εκείνα τα χαρακτηριστικά, τις ιδιότητες που αποκάλυψαν οι δοκιμές. Ουσιαστικά ήταν τυφλές δοκιμασίες.

Αυτή η προσέγγιση στο πρόβλημα της εγκυρότητας του τεστ ήταν τυπική μέχρι τις αρχές της δεκαετίας του 1950. 20ος αιώνας όχι μόνο στις ΗΠΑ, αλλά και σε άλλες χώρες. Η θεωρητική αδυναμία των μεθόδων εμπειρικής επικύρωσης δεν μπορούσε παρά να προκαλέσει κριτική από εκείνους τους επιστήμονες που, κατά την ανάπτυξη δοκιμών, ζήτησαν να βασίζονται όχι μόνο στον γυμνό εμπειρισμό και την πρακτική, αλλά και σε μια θεωρητική έννοια. Η πράξη χωρίς θεωρία είναι τυφλή και η θεωρία χωρίς πράξη είναι νεκρή. Επί του παρόντος, η θεωρητική και πρακτική αξιολόγηση της εγκυρότητας των μεθόδων γίνεται αντιληπτή ως η πιο παραγωγική.

Για τη διεξαγωγή πραγματιστικής επικύρωσης μιας μεθοδολογίας, δηλαδή για την αξιολόγηση της αποτελεσματικότητας, της αποδοτικότητας, της πρακτικής σημασίας της, χρησιμοποιείται συνήθως ένα ανεξάρτητο εξωτερικό κριτήριο - ένας δείκτης της εκδήλωσης της μελετημένης ιδιότητας στην καθημερινή ζωή. Ένα τέτοιο κριτήριο μπορεί να είναι η ακαδημαϊκή επίδοση (για τεστ μαθησιακής ικανότητας, τεστ επιτεύγματος, τεστ νοημοσύνης) και τα επιτεύγματα παραγωγής (για μεθόδους επαγγελματικού προσανατολισμού) και η αποτελεσματικότητα της πραγματικής δραστηριότητας - σχέδιο, μοντελοποίηση κ.λπ. (για τεστ ειδικών ικανοτήτων) , υποκειμενικές εκτιμήσεις (για τεστ προσωπικότητας).

Οι Αμερικανοί ερευνητές D. Tiffin και E. McCormick, αφού ανέλυσαν τα εξωτερικά κριτήρια που χρησιμοποιήθηκαν για την απόδειξη της εγκυρότητας, διακρίνουν τέσσερις τύπους από αυτά [σύμφωνα με 31):

1) κριτήρια απόδοσης (μπορεί να περιλαμβάνουν, όπως ο όγκος της εργασίας που εκτελείται, η ακαδημαϊκή επίδοση, ο χρόνος που αφιερώνεται στην εκπαίδευση, ο ρυθμός αύξησης των προσόντων κ.λπ.)

2) υποκειμενικά κριτήρια (περιλαμβάνουν διάφορους τύπους απαντήσεων που αντικατοπτρίζουν τη στάση ενός ατόμου για κάτι ή κάποιον, τη γνώμη, τις απόψεις, τις προτιμήσεις του· συνήθως τα υποκειμενικά κριτήρια λαμβάνονται μέσω συνεντεύξεων, ερωτηματολογίων, ερωτηματολογίων).

3) φυσιολογικά κριτήρια (χρησιμοποιούνται για τη μελέτη της επιρροής του περιβάλλοντος και άλλων περιστασιακών μεταβλητών στο ανθρώπινο σώμα και την ψυχή· μετρώνται ο ρυθμός παλμών, η αρτηριακή πίεση, η ηλεκτρική αντίσταση του δέρματος, τα συμπτώματα κόπωσης κ.λπ.).

4) κριτήρια τυχαιότητας (εφαρμόζονται όταν ο σκοπός της μελέτης αφορά, για παράδειγμα, το πρόβλημα της επιλογής για εργασία τέτοιων ατόμων που είναι λιγότερο επιρρεπή σε ατυχήματα).

Το εξωτερικό κριτήριο πρέπει να πληροί τρεις βασικές απαιτήσεις:

πρέπει να είναι σχετικό?

χωρίς παρεμβολές.

αξιόπιστος.

Η συνάφεια αναφέρεται στη σημασιολογική αντιστοιχία ενός διαγνωστικού εργαλείου με ένα ανεξάρτητο ζωτικό κριτήριο. Με άλλα λόγια, πρέπει να υπάρχει σιγουριά ότι τα κριτήρια αφορούν ακριβώς εκείνα τα χαρακτηριστικά του ατομικού ψυχισμού που μετρώνται και με τη διαγνωστική τεχνική. Το εξωτερικό κριτήριο και η διαγνωστική τεχνική πρέπει να βρίσκονται σε εσωτερική σημασιολογική αντιστοιχία μεταξύ τους, να είναι ποιοτικά ομοιογενή στην ψυχολογική ουσία. Εάν, για παράδειγμα, ένα τεστ μετρά τα μεμονωμένα χαρακτηριστικά της σκέψης, την ικανότητα εκτέλεσης λογικών ενεργειών με ορισμένα αντικείμενα, έννοιες, τότε στο κριτήριο θα πρέπει να αναζητήσετε την εκδήλωση ακριβώς αυτών των δεξιοτήτων. Αυτό ισχύει εξίσου για τις επαγγελματικές δραστηριότητες. Δεν έχει έναν, αλλά πολλούς στόχους, καθήκοντα, καθένα από τα οποία είναι συγκεκριμένο και επιβάλλει τους δικούς του όρους υλοποίησης. Αυτό συνεπάγεται την ύπαρξη πολλών κριτηρίων για την άσκηση επαγγελματικών δραστηριοτήτων. Επομένως, δεν πρέπει να συγκρίνει κανείς την επιτυχία των διαγνωστικών μεθόδων με την αποδοτικότητα της παραγωγής γενικά. Είναι απαραίτητο να βρεθεί ένα κριτήριο που, από τη φύση των εργασιών που εκτελούνται, είναι συγκρίσιμο με τη μεθοδολογία.

Εάν δεν είναι γνωστό σε σχέση με το εξωτερικό κριτήριο εάν σχετίζεται με τη μετρούμενη ιδιότητα ή όχι, τότε η σύγκριση των αποτελεσμάτων της ψυχοδιαγνωστικής τεχνικής με αυτήν καθίσταται πρακτικά άχρηστη. Δεν επιτρέπει την εξαγωγή συμπερασμάτων που θα μπορούσαν να αξιολογήσουν την εγκυρότητα της μεθοδολογίας.

Οι απαιτήσεις της ελευθερίας από παρεμβολές προκαλούνται από το γεγονός ότι, για παράδειγμα, η εκπαιδευτική ή βιομηχανική επιτυχία εξαρτάται από δύο μεταβλητές: από το ίδιο το άτομο, τα ατομικά του χαρακτηριστικά, μετρημένα με μεθόδους, και από την κατάσταση, τις συνθήκες σπουδών, εργασίας, που μπορεί να εισάγει παρεμβολές, να «μολύνει» το εφαρμοζόμενο κριτήριο . Για να αποφευχθεί αυτό σε κάποιο βαθμό, θα πρέπει να επιλεγούν για έρευνα ομάδες ανθρώπων που βρίσκονται σε λίγο πολύ τις ίδιες συνθήκες. Μπορείτε επίσης να χρησιμοποιήσετε μια άλλη μέθοδο. Συνίσταται στη διόρθωση της επιρροής των παρεμβολών. Αυτή η προσαρμογή έχει συνήθως στατιστικό χαρακτήρα. Έτσι, για παράδειγμα, η παραγωγικότητα δεν πρέπει να λαμβάνεται σε απόλυτες τιμές, αλλά σε σχέση με τη μέση παραγωγικότητα των εργαζομένων που εργάζονται σε παρόμοιες συνθήκες.

Όταν λέγεται ότι ένα κριτήριο πρέπει να έχει στατιστικά σημαντική αξιοπιστία, αυτό σημαίνει ότι πρέπει να αντικατοπτρίζει τη σταθερότητα και τη σταθερότητα της υπό μελέτη συνάρτησης.

Η αναζήτηση ενός επαρκούς και εύκολα αναγνωρίσιμου κριτηρίου είναι ένα από τα πιο σημαντικά και δύσκολα καθήκοντα επικύρωσης. Στη δυτική τεστολογία, πολλές μέθοδοι αποκλείονται μόνο επειδή δεν μπορούσαν να βρουν κατάλληλο κριτήριο για να τις δοκιμάσουν. Για παράδειγμα, για τα περισσότερα ερωτηματολόγια, τα δεδομένα για την εγκυρότητά τους είναι αμφισβητήσιμα, καθώς είναι δύσκολο να βρεθεί ένα επαρκές εξωτερικό κριτήριο που να αντιστοιχεί σε αυτό που μετρούν.

Η αξιολόγηση της εγκυρότητας των μεθόδων μπορεί να είναι ποσοτική και ποιοτική.

Για να υπολογιστεί ένας ποσοτικός δείκτης - ο συντελεστής εγκυρότητας - τα αποτελέσματα που λαμβάνονται χρησιμοποιώντας τη διαγνωστική τεχνική συγκρίνονται με τα δεδομένα που λαμβάνονται με το εξωτερικό κριτήριο των ίδιων προσώπων. Χρησιμοποιούνται διαφορετικοί τύποι γραμμικής συσχέτισης (σύμφωνα με τον Spearman, σύμφωνα με τον Pearson).

Πόσα θέματα χρειάζονται για τον υπολογισμό της εγκυρότητας;

Η πρακτική έχει δείξει ότι δεν πρέπει να είναι λιγότεροι από 50, αλλά είναι καλύτεροι περισσότεροι από 200. Συχνά τίθεται το ερώτημα, ποια πρέπει να είναι η τιμή του συντελεστή εγκυρότητας για να θεωρηθεί αποδεκτός; Σε γενικές γραμμές, σημειώνεται ότι αρκεί ο συντελεστής εγκυρότητας να είναι στατιστικά σημαντικός. Ένας συντελεστής εγκυρότητας περίπου 0,20-0,30 αναγνωρίζεται ως χαμηλός, 0,30-0,50 ως μεσαίος και άνω του 0,60 ως υψηλός.

Όμως, όπως τονίζουν οι A. Anastasi, K. M. Gurevich και άλλοι, δεν είναι πάντα σωστό να χρησιμοποιείται γραμμική συσχέτιση για τον υπολογισμό του συντελεστή εγκυρότητας. Αυτή η τεχνική δικαιολογείται μόνο όταν αποδειχθεί ότι η επιτυχία σε κάποια δραστηριότητα είναι ευθέως ανάλογη με την επιτυχία στη διενέργεια διαγνωστικού τεστ. Η θέση των ξένων τεστολόγων, ειδικά εκείνων που ασχολούνται με την επαγγελματική καταλληλότητα και την επαγγελματική επιλογή, συνήθως καταλήγει στην άνευ όρων αναγνώριση ότι αυτός που ολοκλήρωσε τις περισσότερες εργασίες στο τεστ είναι πιο κατάλληλος για το επάγγελμα. Αλλά μπορεί επίσης να είναι ότι για να είναι επιτυχής σε μια δραστηριότητα, είναι απαραίτητο να υπάρχει μια ιδιότητα στο επίπεδο του 40% του διαλύματος δοκιμής. Η περαιτέρω επιτυχία στο τεστ δεν έχει πλέον σημασία για το επάγγελμα. Ενδεικτικό παράδειγμα από τη μονογραφία του K. M. Gurevich: ένας ταχυδρόμος πρέπει να ξέρει να διαβάζει, αλλά το αν διαβάζει με κανονική ταχύτητα ή με πολύ μεγάλη ταχύτητα δεν έχει πλέον επαγγελματική σημασία. Με μια τέτοια συσχέτιση μεταξύ των δεικτών της μεθοδολογίας και του εξωτερικού κριτηρίου, ο καταλληλότερος τρόπος για να καθοριστεί η εγκυρότητα μπορεί να είναι το κριτήριο των διαφορών.

Μια άλλη περίπτωση είναι επίσης δυνατή: ένα υψηλότερο επίπεδο ιδιοκτησίας από αυτό που απαιτείται από το επάγγελμα παρεμβαίνει στην επαγγελματική επιτυχία. Έτσι, στην αυγή του 20ού αιώνα. ο Αμερικανός ερευνητής F. Taylor διαπίστωσε ότι οι πιο ανεπτυγμένοι εργαζόμενοι στην παραγωγή έχουν χαμηλή παραγωγικότητα εργασίας. Δηλαδή, το υψηλό επίπεδο της νοητικής τους ανάπτυξης τους εμπόδιζε να εργαστούν ιδιαίτερα παραγωγικά. Σε αυτή την περίπτωση, η ανάλυση διασποράς ή ο υπολογισμός των λόγων συσχέτισης θα ήταν καταλληλότερος για τον υπολογισμό του συντελεστή εγκυρότητας.

Όπως έχει δείξει η εμπειρία των ξένων τεστολόγων, καμία στατιστική διαδικασία δεν είναι σε θέση να αντικατοπτρίζει πλήρως την ποικιλομορφία των μεμονωμένων αξιολογήσεων. Ως εκ τούτου, ένα άλλο μοντέλο χρησιμοποιείται συχνά για την απόδειξη της εγκυρότητας των μεθόδων - κλινικές αξιολογήσεις. Αυτό δεν είναι τίποτα άλλο από μια ποιοτική περιγραφή της ουσίας της υπό μελέτη ιδιοκτησίας. Σε αυτή την περίπτωση, μιλάμε για χρήση τεχνικών που δεν βασίζονται σε στατιστική επεξεργασία.

Τύποι εγκυρότητας

Η εγκυρότητα στην ουσία της είναι ένα σύνθετο χαρακτηριστικό, που περιλαμβάνει, αφενός, πληροφορίες σχετικά με το εάν η τεχνική είναι κατάλληλη για τη μέτρηση για ποιο σκοπό δημιουργήθηκε και, αφετέρου, ποια είναι η αποτελεσματικότητα, η αποδοτικότητα και η πρακτική χρησιμότητα της.

Ο έλεγχος της εγκυρότητας μιας τεχνικής ονομάζεται επικύρωση.

Για τη διεξαγωγή πραγματιστικής επικύρωσης μιας μεθοδολογίας, δηλαδή για την αξιολόγηση της αποτελεσματικότητας, της αποδοτικότητας, της πρακτικής σημασίας της, χρησιμοποιείται συνήθως ένα ανεξάρτητο εξωτερικό κριτήριο - ένας δείκτης της εκδήλωσης της μελετημένης ιδιότητας στην καθημερινή ζωή. Ένα τέτοιο κριτήριο μπορεί να είναι η ακαδημαϊκή επίδοση (για τεστ μαθησιακής ικανότητας, τεστ επιτεύγματος, τεστ νοημοσύνης) και τα επιτεύγματα παραγωγής (για μεθόδους επαγγελματικού προσανατολισμού) και η αποτελεσματικότητα της πραγματικής δραστηριότητας - σχέδιο, μοντελοποίηση κ.λπ. (για τεστ ειδικών ικανοτήτων) , υποκειμενικές εκτιμήσεις (για τεστ προσωπικότητας).

4 είδη εξωτερικών κριτηρίων:

κριτήρια απόδοσης (αυτά μπορεί να περιλαμβάνουν, όπως ο όγκος της εργασίας που εκτελείται, η ακαδημαϊκή επίδοση, ο χρόνος που αφιερώνεται στην κατάρτιση, ο ρυθμός αύξησης των προσόντων κ.λπ.)·

υποκειμενικά κριτήρια (περιλαμβάνουν διάφορους τύπους απαντήσεων που αντικατοπτρίζουν τη στάση ενός ατόμου για κάτι ή κάποιον, τη γνώμη, τις απόψεις, τις προτιμήσεις του. συνήθως τα υποκειμενικά κριτήρια λαμβάνονται μέσω συνεντεύξεων, ερωτηματολογίων, ερωτηματολογίων).

φυσιολογικά κριτήρια (χρησιμοποιούνται για τη μελέτη της επίδρασης του περιβάλλοντος και άλλων περιστασιακών μεταβλητών στο ανθρώπινο σώμα και την ψυχή. μετρώνται ο ρυθμός παλμών, η αρτηριακή πίεση, η ηλεκτρική αντίσταση του δέρματος, τα συμπτώματα κόπωσης κ.λπ.).

κριτήρια τυχαιότητας (εφαρμόζονται όταν ο σκοπός της μελέτης αφορά, για παράδειγμα, το πρόβλημα της επιλογής για εργασία τέτοιων ατόμων που είναι λιγότερο επιρρεπή σε ατυχήματα).

εμπειρική εγκυρότητα.

Εάν, στην περίπτωση της εγκυρότητας περιεχομένου, το τεστ αξιολογείται από ειδικούς (οι οποίοι καθορίζουν την αντιστοιχία των στοιχείων δοκιμής με το περιεχόμενο του υποκειμένου της μέτρησης), τότε η εμπειρική εγκυρότητα μετράται πάντα χρησιμοποιώντας στατιστική συσχέτιση: τη συσχέτιση δύο σειρών τιμών υπολογίζεται - βαθμολογίες δοκιμής και δείκτες για μια εξωτερική παράμετρο που επιλέγεται ως κριτήριο εγκυρότητας.

δομική εγκυρότητα.

Η εγκυρότητα κατασκευής έχει να κάνει με το ίδιο το θεωρητικό κατασκεύασμα και περιλαμβάνει την αναζήτηση παραγόντων που εξηγούν τη συμπεριφορά κατά την εκτέλεση μιας δοκιμής. Ως ειδικός τύπος, η εγκυρότητα της κατασκευής καθιερώνεται σε ένα άρθρο των Cronbach και Mil (1955). Οι συγγραφείς αξιολόγησαν με αυτόν τον τύπο εγκυρότητας όλες τις δοκιμαστικές μελέτες που δεν στόχευαν άμεσα στην πρόβλεψη ορισμένων σημαντικών κριτηρίων. Η μελέτη περιείχε πληροφορίες σχετικά με ψυχολογικές κατασκευές.

Εγκυρότητα «κατά περιεχόμενο».

Η εγκυρότητα περιεχομένου απαιτεί κάθε στοιχείο, πρόβλημα ή ερώτηση που ανήκει σε μια συγκεκριμένη περιοχή να έχει ίσες πιθανότητες να είναι δοκιμαστικό στοιχείο. Η εγκυρότητα περιεχομένου αξιολογεί τη συμμόρφωση του περιεχομένου του τεστ (εργασίες, ερωτήσεις) με τη μετρούμενη περιοχή συμπεριφοράς. Δοκιμές που συντάσσονται από δύο ομάδες ανάπτυξης διεξάγονται σε ένα δείγμα θεμάτων. Η αξιοπιστία των δοκιμών υπολογίζεται χωρίζοντας τα στοιχεία σε δύο μέρη, με αποτέλεσμα έναν δείκτη εγκυρότητας περιεχομένου.

«Προγνωστική» εγκυρότητα.

Η "προβλεπτική" εγκυρότητα καθορίζεται επίσης από ένα αρκετά αξιόπιστο εξωτερικό κριτήριο, αλλά οι πληροφορίες σχετικά με αυτό συλλέγονται λίγο καιρό μετά τη δοκιμή. Το εξωτερικό κριτήριο είναι συνήθως η ικανότητα ενός ατόμου, που εκφράζεται σε ορισμένες αξιολογήσεις, στο είδος της δραστηριότητας για την οποία επιλέχθηκε με βάση τα αποτελέσματα των διαγνωστικών εξετάσεων. Αν και αυτή η τεχνική είναι η πλέον κατάλληλη για το έργο των διαγνωστικών τεχνικών - την πρόβλεψη της μελλοντικής επιτυχίας, είναι πολύ δύσκολο να εφαρμοστεί. Η ακρίβεια της πρόβλεψης σχετίζεται αντιστρόφως με το χρόνο που δίνεται για μια τέτοια πρόβλεψη. Όσο περισσότερος χρόνος περνά μετά τη μέτρηση, τόσο περισσότεροι παράγοντες πρέπει να λαμβάνονται υπόψη κατά την αξιολόγηση της προγνωστικής σημασίας της τεχνικής. Ωστόσο, είναι σχεδόν αδύνατο να ληφθούν υπόψη όλοι οι παράγοντες που επηρεάζουν την πρόβλεψη.

«Αναδρομική» εγκυρότητα.

Καθορίζεται με βάση ένα κριτήριο που αντικατοπτρίζει τα γεγονότα ή την κατάσταση ποιότητας στο παρελθόν. Μπορεί να χρησιμοποιηθεί για γρήγορη απόκτηση πληροφοριών σχετικά με τις προγνωστικές δυνατότητες της τεχνικής. Έτσι, για να ελεγχθεί ο βαθμός στον οποίο οι καλές βαθμολογίες σε ένα τεστ επάρκειας αντιστοιχούν στην ταχεία μάθηση, μπορεί κανείς να συγκρίνει τους προηγούμενους βαθμούς, τις προηγούμενες απόψεις ειδικών κ.λπ. σε άτομα με υψηλούς και χαμηλούς διαγνωστικούς δείκτες αυτή τη στιγμή.

συγκλίνουσα και διακριτική εγκυρότητα.

Ο τρόπος με τον οποίο ο ψυχολόγος ορίζει το διαγνωστικό κατασκεύασμα καθορίζει τη στρατηγική για τη συμπερίληψη ορισμένων στοιχείων στο τεστ. Εάν ο Eysenck ορίζει την ιδιότητα «νευρωτισμός» ως ανεξάρτητη από την εξωστρέφεια-εσωστρέφεια, τότε αυτό σημαίνει ότι στο ερωτηματολόγιό του θα πρέπει να υπάρχουν περίπου ίσοι αριθμοί στοιχείων με τα οποία θα συμφωνήσουν οι νευρωτικοί εσωστρεφείς και οι νευρωτικοί εξωστρεφείς. Εάν στην πράξη αποδειχθεί ότι το τεστ θα κυριαρχείται από στοιχεία από το τεταρτημόριο «Νευρωτισμός-Εσωστρέφεια», τότε, από τη σκοπιά της θεωρίας του Eysenck, αυτό σημαίνει ότι ο παράγοντας «νευρωτισμός» αποδεικνύεται ότι είναι φορτωμένος με ένα άσχετο παράγοντας - «εσωστρέφεια». (Ακριβώς το ίδιο αποτέλεσμα εμφανίζεται εάν υπάρχει προκατάληψη στο δείγμα - εάν υπάρχουν περισσότεροι νευρωτικοί εσωστρεφείς σε αυτό από νευρωτικούς εξωστρεφείς.)

Για να μην συναντήσουν τέτοιες δυσκολίες, οι ψυχολόγοι θα ήθελαν να ασχοληθούν με τέτοιους εμπειρικούς δείκτες (σημεία) που αναμφισβήτητα ενημερώνουν μόνο για έναν παράγοντα. Αλλά αυτή η απαίτηση δεν εκπληρώνεται ποτέ πραγματικά: οποιοσδήποτε εμπειρικός δείκτης αποδεικνύεται ότι καθορίζεται όχι μόνο από τον παράγοντα που χρειαζόμαστε, αλλά και από άλλους - άσχετους με την εργασία μέτρησης.

Έτσι, σε σχέση με παράγοντες που ορίζονται εννοιολογικά ως ορθογώνιοι προς το μετρούμενο (που συμβαίνουν σε όλους τους συνδυασμούς), ο δοκιμαστικός μεταγλωττιστής πρέπει να εφαρμόσει μια στρατηγική τεχνητής εξισορρόπησης κατά την επιλογή στοιχείων.

Η αντιστοιχία των στοιχείων με τον μετρούμενο παράγοντα διασφαλίζει τη συγκλίνουσα εγκυρότητα του τεστ. Η ισορροπία των στοιχείων σε σχέση με άσχετους παράγοντες παρέχει διακριτική εγκυρότητα. Εμπειρικά, εκφράζεται απουσία σημαντικής συσχέτισης με ένα τεστ που μετρά μια εννοιολογικά ανεξάρτητη ιδιότητα.

Τύποι εγκυρότητας

Υπάρχουν διάφοροι τύποι εγκυρότητας λόγω των ιδιαιτεροτήτων των διαγνωστικών μεθόδων, καθώς και της προσωρινής κατάστασης του εξωτερικού κριτηρίου. Στο Cherny, 1983; "General Psychodiagnostics", 1987, κ.λπ.) τα ακόλουθα ονομάζονται συχνότερα:

1. Εγκυρότητα «κατά περιεχόμενο». Αυτή η τεχνική χρησιμοποιείται κυρίως σε τεστ επίδοσης. Συνήθως, τα τεστ επίδοσης δεν περιλαμβάνουν όλη την ύλη που πέρασαν οι μαθητές, αλλά κάποιο μικρό μέρος αυτής (3-4 ερωτήσεις). Είναι δυνατόν να είμαστε σίγουροι ότι οι σωστές απαντήσεις σε αυτές τις λίγες ερωτήσεις μαρτυρούν την αφομοίωση όλης της ύλης. Αυτό πρέπει να απαντήσει ο έλεγχος εγκυρότητας περιεχομένου. Για να γίνει αυτό, πραγματοποιείται σύγκριση της επιτυχίας στο τεστ με αξιολογήσεις εμπειρογνωμόνων των δασκάλων (για αυτό το υλικό). Η εγκυρότητα "κατά περιεχόμενο" ισχύει επίσης για τεστ που βασίζονται σε κριτήρια. Αυτή η τεχνική μερικές φορές ονομάζεται λογική εγκυρότητα.

2. Η εγκυρότητα "Ταυτόχρονα" ή η τρέχουσα εγκυρότητα προσδιορίζεται από ένα εξωτερικό κριτήριο βάσει του οποίου οι πληροφορίες συλλέγονται ταυτόχρονα με τα πειράματα της μεθόδου δοκιμής. Με άλλα λόγια, συλλέγονται δεδομένα που σχετίζονται με την τρέχουσα χρονική επίδοση στην περίοδο δοκιμής, την απόδοση στην ίδια περίοδο κ.λπ. Τα αποτελέσματα επιτυχίας στο τεστ συσχετίζονται με αυτό.

3. "Προβλεπτική" εγκυρότητα (άλλο όνομα είναι "προβλεπτική" εγκυρότητα). Καθορίζεται επίσης από ένα αρκετά αξιόπιστο εξωτερικό κριτήριο, αλλά οι πληροφορίες σχετικά με αυτό συλλέγονται λίγο καιρό μετά τη δοκιμή. Το εξωτερικό κριτήριο είναι συνήθως η ικανότητα ενός ατόμου, που εκφράζεται σε ορισμένες αξιολογήσεις, στο είδος της δραστηριότητας για την οποία επιλέχθηκε με βάση τα αποτελέσματα των διαγνωστικών εξετάσεων. Αν και αυτή η τεχνική είναι η πλέον κατάλληλη για το έργο των διαγνωστικών τεχνικών - την πρόβλεψη της μελλοντικής επιτυχίας, είναι πολύ δύσκολο να εφαρμοστεί. Η ακρίβεια της πρόβλεψης σχετίζεται αντιστρόφως με το χρόνο που δίνεται για μια τέτοια πρόβλεψη. Όσο περισσότερος χρόνος περνά μετά τη μέτρηση, τόσο περισσότεροι παράγοντες πρέπει να λαμβάνονται υπόψη κατά την αξιολόγηση της προγνωστικής σημασίας της τεχνικής. Ωστόσο, είναι σχεδόν αδύνατο να ληφθούν υπόψη όλοι οι παράγοντες που επηρεάζουν την πρόβλεψη.

4. «Αναδρομική» ισχύς. Καθορίζεται με βάση ένα κριτήριο που αντικατοπτρίζει τα γεγονότα ή την κατάσταση ποιότητας στο παρελθόν. Μπορεί να χρησιμοποιηθεί για γρήγορη απόκτηση πληροφοριών σχετικά με τις προγνωστικές δυνατότητες της τεχνικής. Έτσι, για να ελεγχθεί ο βαθμός στον οποίο οι καλές βαθμολογίες σε ένα τεστ επάρκειας αντιστοιχούν στην ταχεία μάθηση, μπορεί κανείς να συγκρίνει τους προηγούμενους βαθμούς, τις προηγούμενες απόψεις ειδικών κ.λπ. σε άτομα με υψηλούς και χαμηλούς διαγνωστικούς δείκτες αυτή τη στιγμή.

Συσχέτιση

Συσχέτιση (εξάρτηση συσχέτισης) - μια στατιστική σχέση δύο ή περισσότερων τυχαίων μεταβλητών (ή μεταβλητών που μπορούν να θεωρηθούν ως τέτοιες με κάποιο αποδεκτό βαθμό ακρίβειας). Ταυτόχρονα, οι αλλαγές στις τιμές μιας ή περισσότερων από αυτές τις ποσότητες οδηγούν σε συστηματική αλλαγή στις τιμές μιας άλλης ή άλλων ποσοτήτων. Ένα μαθηματικό μέτρο της συσχέτισης δύο τυχαίων μεταβλητών είναι ο λόγος συσχέτισης ή ο συντελεστής συσχέτισης (ή). Εάν μια αλλαγή σε μια τυχαία μεταβλητή δεν οδηγεί σε κανονική αλλαγή σε μια άλλη τυχαία μεταβλητή, αλλά οδηγεί σε αλλαγή σε άλλο στατιστικό χαρακτηριστικό αυτής της τυχαίας μεταβλητής, τότε μια τέτοια σχέση δεν θεωρείται συσχέτιση, αν και είναι στατιστική.

Για πρώτη φορά, ο όρος «συσχέτιση» εισήχθη στην επιστημονική κυκλοφορία από τον Γάλλο παλαιοντολόγο Georges Cuvier τον 18ο αιώνα. Ανέπτυξε τον «νόμο της συσχέτισης» μερών και οργάνων των ζωντανών όντων, με τη βοήθεια του οποίου είναι δυνατή η αποκατάσταση της εμφάνισης ενός απολιθωμένου ζώου, έχοντας στη διάθεσή του μόνο ένα μέρος των υπολειμμάτων του. Στη στατιστική, η λέξη «συσχέτιση» χρησιμοποιήθηκε για πρώτη φορά από τον Άγγλο βιολόγο και στατιστικολόγο Φράνσις Γκάλτον στα τέλη του 19ου αιώνα.

Ορισμένοι τύποι συντελεστών συσχέτισης μπορεί να είναι θετικοί ή αρνητικοί (είναι επίσης πιθανό να μην υπάρχει στατιστική σχέση - για παράδειγμα, για ανεξάρτητες τυχαίες μεταβλητές). Εάν υποτεθεί ότι στις τιμές των μεταβλητών καθορίζεται μια σχέση αυστηρής τάξης, τότε αρνητική συσχέτιση είναι μια συσχέτιση στην οποία μια αύξηση σε μια μεταβλητή σχετίζεται με μείωση σε μια άλλη μεταβλητή, ενώ ο συντελεστής συσχέτισης μπορεί να είναι αρνητικός ; θετική συσχέτιση σε τέτοιες συνθήκες - μια συσχέτιση στην οποία μια αύξηση σε μια μεταβλητή σχετίζεται με αύξηση σε μια άλλη μεταβλητή, ενώ ο συντελεστής συσχέτισης μπορεί να είναι θετικός.

Η εγκυρότητα (από την αγγλική έγκυρη - "έγκυρο, κατάλληλο, έγκυρο") είναι ένα σύνθετο χαρακτηριστικό μιας μεθοδολογίας (δοκιμής), που περιλαμβάνει πληροφορίες σχετικά με την περιοχή των μελετώμενων φαινομένων και την αντιπροσωπευτικότητα της διαγνωστικής διαδικασίας σε σχέση με τους.

Στην απλούστερη και γενικότερη διατύπωσή του, η εγκυρότητα ενός τεστ είναι «μια έννοια που μας λέει τι μετρά το τεστ και πόσο καλά το κάνει». Στις τυπικές απαιτήσεις για ψυχολογικά και εκπαιδευτικά τεστ, η εγκυρότητα ορίζεται ως ένα σύνολο πληροφοριών σχετικά με το ποιες ομάδες ψυχολογικών ιδιοτήτων ενός ατόμου μπορούν να συναχθούν χρησιμοποιώντας τη μεθοδολογία, καθώς και ο βαθμός εγκυρότητας των συμπερασμάτων κατά τη χρήση συγκεκριμένων βαθμολογιών τεστ ή άλλες μορφές αξιολόγησης. Στην ψυχοδιαγνωστική, η εγκυρότητα είναι ένα υποχρεωτικό και πιο σημαντικό μέρος των πληροφοριών σχετικά με τη μεθοδολογία, συμπεριλαμβανομένων (μαζί με τα παραπάνω) δεδομένα σχετικά με τον βαθμό συνέπειας των αποτελεσμάτων των εξετάσεων με άλλες πληροφορίες για το άτομο που μελετάται, που λαμβάνονται από διάφορες πηγές (θεωρητικές προσδοκίες , παρατηρήσεις, αξιολογήσεις εμπειρογνωμόνων, αποτελέσματα άλλων μεθόδων, η αξιοπιστία των οποίων έχει τεκμηριωθεί κ.λπ.), μια κρίση σχετικά με την εγκυρότητα της πρόβλεψης για την ανάπτυξη της υπό μελέτη ποιότητας, τη σύνδεση της μελετημένης περιοχής συμπεριφοράς ή χαρακτηριστικά προσωπικότητας με ορισμένες ψυχολογικές κατασκευές. Η εγκυρότητα περιγράφει επίσης τον συγκεκριμένο προσανατολισμό της μεθοδολογίας (το ενδεχόμενο των θεμάτων ανά ηλικία, επίπεδο εκπαίδευσης, κοινωνικοπολιτισμική σχέση κ.λπ.) και τον βαθμό εγκυρότητας των συμπερασμάτων στις συγκεκριμένες συνθήκες χρήσης του τεστ. Το σύνολο των πληροφοριών που χαρακτηρίζουν την εγκυρότητα του τεστ περιέχει πληροφορίες σχετικά με την επάρκεια του εφαρμοσμένου μοντέλου δραστηριότητας όσον αφορά την αντανάκλαση των μελετημένων ψυχολογικών χαρακτηριστικών σε αυτό, σχετικά με τον βαθμό ομοιογένειας των εργασιών (υποδοκιμών) που περιλαμβάνονται στο τεστ, τη συγκρισιμότητα τους στο ποσοτική αξιολόγηση των αποτελεσμάτων των δοκιμών στο σύνολό τους.

Το πιο σημαντικό στοιχείο εγκυρότητας - ο ορισμός της περιοχής των μελετημένων ιδιοτήτων - έχει θεμελιώδη θεωρητική και πρακτική σημασία για την επιλογή μιας μεθοδολογίας έρευνας και την ερμηνεία των δεδομένων της. Οι πληροφορίες που περιέχονται στο όνομα του τεστ, κατά κανόνα, είναι ανεπαρκείς για να κριθεί το εύρος της εφαρμογής του. Αυτός είναι απλώς ένας προσδιορισμός, το «όνομα» μιας συγκεκριμένης ερευνητικής διαδικασίας.

Τύποι εγκυρότητας τεστ. Μέθοδοι για τον προσδιορισμό της εγκυρότητας

Σύμφωνα με τον ορισμό του Αμερικανού κειμενολόγου Α. Αναστάση, «η εγκυρότητα ενός τεστ είναι μια έννοια που μας λέει τι μετρά το τεστ και πόσο καλά το κάνει». Η εγκυρότητα υποδεικνύει εάν η τεχνική είναι κατάλληλη για τη μέτρηση ορισμένων ποιοτήτων, χαρακτηριστικών και πόσο αποτελεσματικά το κάνει αυτό. Ο πιο συνηθισμένος τρόπος για να βρεθεί η θεωρητική εγκυρότητα ενός τεστ (μέθοδος) είναι η συγκλίνουσα εγκυρότητα, δηλαδή η σύγκριση μιας δεδομένης τεχνικής με έγκυρες σχετικές μεθόδους και η απόδειξη σημαντικών δεσμών με αυτές.

Η σύγκριση με μεθόδους που έχουν διαφορετική θεωρητική βάση και η συνεχής έλλειψη σημαντικών σχέσεων μαζί τους ονομάζεται διακριτική εγκυρότητα. Ένας άλλος τύπος εγκυρότητας - πραγματιστική εγκυρότητα - έλεγχος της μεθοδολογίας ως προς την πρακτική σημασία, την αποτελεσματικότητα, τη χρησιμότητα της. Για τη διεξαγωγή ενός τέτοιου τεστ, κατά κανόνα χρησιμοποιούνται τα λεγόμενα ανεξάρτητα εξωτερικά κριτήρια, δηλαδή, χρησιμοποιείται μια εξωτερική πηγή πληροφοριών ανεξάρτητη από το τεστ σχετικά με την εκδήλωση στην πραγματική ζωή και τις δραστηριότητες των ανθρώπων μιας μετρημένης ψυχικής ιδιότητας. Μεταξύ αυτών των εξωτερικών κριτηρίων μπορεί να είναι η ακαδημαϊκή επίδοση, τα επαγγελματικά επιτεύγματα, η επιτυχία σε διάφορες δραστηριότητες, οι υποκειμενικές αξιολογήσεις (ή οι αυτοαξιολογήσεις). Εάν, για παράδειγμα, η μεθοδολογία μετρά τα χαρακτηριστικά της ανάπτυξης επαγγελματικά σημαντικών ιδιοτήτων, τότε για το κριτήριο είναι απαραίτητο να βρεθεί μια τέτοια δραστηριότητα ή μεμονωμένες λειτουργίες όπου πραγματοποιούνται αυτές οι ιδιότητες.

Για να ελέγξετε την εγκυρότητα του τεστ, μπορείτε να χρησιμοποιήσετε τη μέθοδο των γνωστών ομάδων, όταν προσκαλούνται άτομα για τα οποία είναι γνωστό σε ποια ομάδα σύμφωνα με το κριτήριο ανήκουν (για παράδειγμα, μια ομάδα "πολύ επιτυχημένων, πειθαρχημένων μαθητών" - ένα υψηλό κριτήριο και μια ομάδα "φτωχών, απειθάρχητων μαθητών" - ένα χαμηλό κριτήριο και οι μαθητές με μέσες τιμές δεν συμμετέχουν στη δοκιμή), διεξάγουν δοκιμές και βρίσκουν συσχέτιση μεταξύ των αποτελεσμάτων των εξετάσεων και του κριτηρίου.

Εδώ το a είναι ο αριθμός των υποκειμένων που έπεσαν στην υψηλή ομάδα σύμφωνα με το τεστ και σύμφωνα με το κριτήριο, c είναι ο αριθμός των υποκειμένων που έπεσαν στην υψηλή ομάδα σύμφωνα με το κριτήριο και έχουν χαμηλά αποτελέσματα δοκιμής. Εάν η δοκιμή είναι απολύτως έγκυρη, τα στοιχεία b και c πρέπει να είναι ίσα με μηδέν. Το μέτρο της σύμπτωσης, η συσχέτιση μεταξύ των ακραίων ομάδων σύμφωνα με το τεστ και το κριτήριο αξιολογούνται χρησιμοποιώντας τον συντελεστή Guilford phi. Υπάρχουν πολλοί διαφορετικοί τρόποι για να αποδειχθεί η εγκυρότητα ενός τεστ. Μια δοκιμή λέγεται ότι είναι έγκυρη εάν μετρά αυτό που προορίζεται να μετρήσει. Εξωτερική εγκυρότητα - σε σχέση με ψυχοδιαγνωστικές μεθόδους σημαίνει την αντιστοιχία των αποτελεσμάτων της ψυχοδιαγνωστικής που διενεργείται μέσω αυτής της μεθόδου με εξωτερικά σημεία, ανεξάρτητα από τη μέθοδο, που αποδίδονται στο αντικείμενο της έρευνας. Σημαίνει περίπου το ίδιο πράγμα με την εμπειρική εγκυρότητα, με τη διαφορά ότι εδώ μιλάμε για τη σχέση μεταξύ των δεικτών της μεθοδολογίας και των πιο σημαντικών, βασικών εξωτερικών χαρακτηριστικών που σχετίζονται με τη συμπεριφορά του υποκειμένου. Μια ψυχοδιαγνωστική τεχνική θεωρείται εξωτερικά έγκυρη εάν, για παράδειγμα, αξιολογεί τα χαρακτηριστικά του χαρακτήρα ενός ατόμου και η συμπεριφορά του που παρατηρείται εξωτερικά είναι συνεπής με τα αποτελέσματα του τεστ.

Η εγκυρότητα είναι εσωτερική - σε σχέση με τις ψυχοδιαγνωστικές μεθόδους, σημαίνει την αντιστοιχία των εργασιών, των υποδοκιμών που περιέχονται σε αυτήν. συμμόρφωση των αποτελεσμάτων των ψυχοδιαγνωστικών που πραγματοποιούνται μέσω αυτής της τεχνικής με τον ορισμό της αξιολογούμενης ψυχολογικής ιδιότητας που χρησιμοποιείται στην ίδια την τεχνική. Μια μεθοδολογία θεωρείται ότι δεν είναι εσωτερικά έγκυρη ή ανεπαρκώς έγκυρη όταν όλες ή μέρος των ερωτήσεων, των εργασιών και των επιμέρους δοκιμών που περιλαμβάνονται σε αυτήν δεν μετρούν αυτό που απαιτείται από αυτήν τη μεθοδολογία. Φαινομενική εγκυρότητα - περιγράφει την αντίληψη του τεστ που έχει αναπτυχθεί στο θέμα. Το τεστ θα πρέπει να εκλαμβάνεται από το υποκείμενο ως ένα σοβαρό εργαλείο για την κατανόηση της προσωπικότητάς του. Η προφανής εγκυρότητα έχει ιδιαίτερη σημασία στις σύγχρονες συνθήκες, όταν η ιδέα των δοκιμών στο κοινό διαμορφώνεται από πολυάριθμες δημοσιεύσεις σε δημοφιλείς εφημερίδες και περιοδικά των λεγόμενων οιονεί δοκιμών, με τη βοήθεια των οποίων ο αναγνώστης καλείται να καθορίστε οτιδήποτε: από την ευφυΐα μέχρι τη συμβατότητα με έναν μελλοντικό σύζυγο.

Η ανταγωνιστική εγκυρότητα αξιολογείται από τη συσχέτιση του ανεπτυγμένου τεστ με άλλα, η εγκυρότητα του οποίου σε σχέση με τη μετρούμενη παράμετρο έχει τεκμηριωθεί. Ο P. Kline σημειώνει ότι τα δεδομένα για την ανταγωνιστική εγκυρότητα είναι χρήσιμα όταν υπάρχουν μη ικανοποιητικά τεστ για τη μέτρηση κάποιων μεταβλητών και δημιουργούνται νέα προκειμένου να βελτιωθεί η ποιότητα της μέτρησης. Αλλά τίθεται το ερώτημα: εάν υπάρχει ήδη ένα αποτελεσματικό τεστ, γιατί χρειαζόμαστε το ίδιο νέο; Η προγνωστική εγκυρότητα καθιερώνεται από τη συσχέτιση μεταξύ των βαθμολογιών του τεστ και κάποιου κριτηρίου που χαρακτηρίζει την ιδιότητα που μετράται, αλλά σε μεταγενέστερο χρόνο. Για παράδειγμα, η προγνωστική εγκυρότητα ενός τεστ νοημοσύνης μπορεί να αποδειχθεί συσχετίζοντας τις βαθμολογίες του που λαμβάνονται από ένα μάθημα στην ηλικία των 10 ετών με τις ακαδημαϊκές επιδόσεις κατά την περίοδο της αποφοίτησης του γυμνασίου. Ο L. Cronbach θεωρεί ότι η προγνωστική εγκυρότητα είναι η πιο πειστική απόδειξη ότι το τεστ μετρά ακριβώς αυτό για το οποίο προοριζόταν. Το κύριο πρόβλημα που αντιμετωπίζει ένας ερευνητής που προσπαθεί να διαπιστώσει την προγνωστική εγκυρότητα του τεστ του είναι η επιλογή ενός εξωτερικού κριτηρίου. Ειδικότερα, αυτό αφορά τις περισσότερες φορές τη μέτρηση των μεταβλητών της προσωπικότητας, όπου η επιλογή ενός εξωτερικού κριτηρίου είναι μια εξαιρετικά δύσκολη υπόθεση, η επίλυση του οποίου απαιτεί σημαντική ευρηματικότητα. Η κατάσταση είναι κάπως πιο απλή κατά τον καθορισμό ενός εξωτερικού κριτηρίου για τα γνωστικά τεστ, ωστόσο, ακόμη και σε αυτήν την περίπτωση, ο ερευνητής πρέπει να «κλείσει το μάτι» σε πολλά προβλήματα. Έτσι, η ακαδημαϊκή επίδοση χρησιμοποιείται παραδοσιακά ως εξωτερικό κριτήριο για την επικύρωση των τεστ νοημοσύνης, αλλά ταυτόχρονα είναι ευρέως γνωστό ότι η ακαδημαϊκή επίδοση απέχει πολύ από το μόνο απόδειξη υψηλής νοημοσύνης. Η επαυξητική εγκυρότητα είναι περιορισμένης αξίας και αναφέρεται στην περίπτωση όπου μια δοκιμή από μια μπαταρία δοκιμών μπορεί να έχει χαμηλή συσχέτιση με ένα κριτήριο, αλλά να μην επικαλύπτεται με άλλες δοκιμές από την μπαταρία. Σε αυτή την περίπτωση, το τεστ έχει αυξητική εγκυρότητα. Αυτό μπορεί να είναι χρήσιμο κατά τη διεξαγωγή επαγγελματικής επιλογής χρησιμοποιώντας ψυχολογικά τεστ. Η διαφορική εγκυρότητα μπορεί να απεικονιστεί χρησιμοποιώντας τεστ ενδιαφέροντος. Τα τεστ ενδιαφέροντος συνήθως συσχετίζονται με τις ακαδημαϊκές επιδόσεις, αλλά με διαφορετικούς τρόπους για διαφορετικούς κλάδους. Η τιμή της διαφορικής εγκυρότητας, καθώς και της αυξητικής εγκυρότητας, είναι περιορισμένη.

Η εγκυρότητα περιεχομένου ορίζεται ως επιβεβαίωση ότι τα στοιχεία δοκιμής αντικατοπτρίζουν όλες τις πτυχές της περιοχής συμπεριφοράς που μελετάται. Συνήθως προσδιορίζεται σε τεστ επιτευγμάτων (η σημασία της μετρούμενης παραμέτρου είναι απολύτως σαφής), τα οποία, όπως αναφέρθηκε ήδη, στην πραγματικότητα δεν είναι ψυχολογικά τεστ. Στην πράξη, για να προσδιοριστεί η εγκυρότητα του περιεχομένου, επιλέγονται ειδικοί που υποδεικνύουν ποιος τομέας συμπεριφοράς είναι πιο σημαντικός, για παράδειγμα, για τις μουσικές ικανότητες, και στη συνέχεια, με βάση αυτό, δημιουργούνται στοιχεία δοκιμής, τα οποία αξιολογούνται και πάλι από ειδικούς. Η εγκυρότητα κατασκευής μιας δοκιμής αποδεικνύεται όσο το δυνατόν πληρέστερη περιγράφοντας τη μεταβλητή που προορίζεται να μετρήσει η δοκιμή. Στην πραγματικότητα, η εγκυρότητα κατασκευής περιλαμβάνει όλες τις προσεγγίσεις για τον προσδιορισμό της εγκυρότητας που αναφέρονται παραπάνω. Οι Cronbach και Meehl, οι οποίοι εισήγαγαν την έννοια της εγκυρότητας κατασκευής στην ψυχοδιαγνωστική, προσπάθησαν να λύσουν το πρόβλημα της επιλογής κριτηρίων για την επικύρωση του τεστ. Τόνισαν ότι σε πολλές περιπτώσεις κανένα μεμονωμένο κριτήριο δεν μπορεί να χρησιμεύσει για την επικύρωση ενός μόνο τεστ. Μπορούμε να υποθέσουμε ότι η λύση στο ερώτημα της εγκυρότητας κατασκευής του τεστ είναι η αναζήτηση μιας απάντησης σε δύο ερωτήσεις: 1) υπάρχει πράγματι μια συγκεκριμένη ιδιότητα; 2) εάν αυτή η δοκιμή μετρά αξιόπιστα τις ατομικές διαφορές σε αυτήν την ιδιότητα. Είναι αρκετά σαφές ότι το πρόβλημα της αντικειμενικότητας στην ερμηνεία των αποτελεσμάτων της μελέτης της εγκυρότητας κατασκευών σχετίζεται με την εγκυρότητα κατασκευής, αλλά αυτό το πρόβλημα είναι γενικό ψυχολογικό και υπερβαίνει την εγκυρότητα.

Προκειμένου ένα ψυχολογικό και παιδαγωγικό πείραμα να είναι ένα επαρκώς αξιόπιστο μέσο έρευνας και να επιτρέπει την απόκτηση απολύτως αξιόπιστων αποτελεσμάτων που μπορούν να εμπιστευτούν και βάσει των οποίων μπορούν να εξαχθούν σωστά πρακτικά συμπεράσματα, είναι απαραίτητο οι ψυχοδιαγνωστικές μέθοδοι που χρησιμοποιούνται σε αυτό να τεκμηριωθεί επιστημονικά. Θεωρούνται μέθοδοι που πληρούν τις ακόλουθες απαιτήσεις: εγκυρότητα, αξιοπιστία, σαφήνεια και ακρίβεια.

Ορος "εγκυρότητα" κυριολεκτικά σημαίνει: «γεμάτος», «κατάλληλος», «αντίστοιχος». Η εγκυρότητα είναι εγγενώς αυτό είναι ένα σύνθετο χαρακτηριστικό, που περιλαμβάνει, αφενός, πληροφορίες σχετικά με το εάν η τεχνική είναι κατάλληλη για τη μέτρηση για ποιο σκοπό δημιουργήθηκε και, αφετέρου, ποια είναι η αποτελεσματικότητά της, η αποδοτικότητά της. Ο έλεγχος της εγκυρότητας μιας τεχνικής ονομάζεται επικύρωση.

Υπάρχουν διάφορες ποικιλίες εγκυρότητας, καθεμία από τις οποίες θα πρέπει να εξεταστεί και να αξιολογηθεί ξεχωριστά όταν πρόκειται για τον προσδιορισμό της εγκυρότητας μιας ψυχοδιαγνωστικής τεχνικής. Η εγκυρότητα μπορεί να είναι θεωρητική και πρακτική (εμπειρική), εσωτερική και εξωτερική.

Θεωρητική εγκυρότητακαθορίζεται από την αντιστοιχία των δεικτών της υπό μελέτη ποιότητας, που λαμβάνονται με αυτήν τη μέθοδο, με τους δείκτες που λαμβάνονται με άλλες μεθόδους - αυτές με τους δείκτες των οποίων θα πρέπει να υπάρχει μια θεωρητικά αιτιολογημένη εξάρτηση. Η θεωρητική εγκυρότητα ελέγχεται με συσχετίσεις δεικτών της ίδιας ιδιότητας που λαμβάνονται χρησιμοποιώντας διαφορετικές μεθόδους που βασίζονται ή προέρχονται από την ίδια θεωρία.

Εμπειρική εγκυρότηταελέγχεται από την αντιστοιχία των διαγνωστικών δεικτών με την πραγματική συμπεριφορά, τις παρατηρούμενες ενέργειες και αντιδράσεις του υποκειμένου. Εάν, για παράδειγμα, με τη βοήθεια κάποιας μεθοδολογίας, αξιολογήσουμε τα χαρακτηριστικά χαρακτήρα ενός συγκεκριμένου θέματος, τότε η εφαρμοσμένη μεθοδολογία θα θεωρηθεί πρακτικά ή εμπειρικά έγκυρη όταν διαπιστωθεί ότι αυτό το άτομο συμπεριφέρεται στη ζωή ακριβώς όπως προβλέπει η μεθοδολογία, δηλ. ανάλογα με το χαρακτηριστικό της προσωπικότητάς του. Σύμφωνα με το κριτήριο της εμπειρικής εγκυρότητας, η μεθοδολογία ελέγχεται συγκρίνοντας τους δείκτες της με τη συμπεριφορά της πραγματικής ζωής ή τα αποτελέσματα των πρακτικών δραστηριοτήτων των ανθρώπων.

Η εγκυρότητα είναι εσωτερικήσημαίνει τη συμμόρφωση των εργασιών, υποδοκιμών, κρίσεων κ.λπ. που περιλαμβάνονται στη μεθοδολογία. ο γενικός στόχος και ο σχεδιασμός της μεθοδολογίας στο σύνολό της. Θεωρείται εσωτερικά άκυρη ή ανεπαρκώς εσωτερικά έγκυρη όταν όλες ή μέρος των ερωτήσεων, εργασιών ή επιμέρους δοκιμών που περιλαμβάνονται σε αυτό δεν μετρούν αυτό που απαιτείται από αυτήν τη μεθοδολογία.

Εξωτερική εγκυρότητα - αυτό είναι περίπου το ίδιο με την εμπειρική εγκυρότητα, με τη μόνη διαφορά ότι σε αυτή την περίπτωση μιλάμε για τη σχέση μεταξύ των δεικτών της μεθοδολογίας και των πιο σημαντικών, βασικών εξωτερικών χαρακτηριστικών που σχετίζονται με τη συμπεριφορά του υποκειμένου.


Κατά τη δημιουργία μιας μεθοδολογίας, είναι δύσκολο να αξιολογηθεί άμεσα η εγκυρότητά της. Συνήθως, η εγκυρότητα μιας μεθοδολογίας ελέγχεται και βελτιώνεται κατά τη διάρκεια της αρκετά μακροχρόνιας χρήσης της, ειδικά επειδή μιλάμε για επαλήθευση τουλάχιστον από τις τέσσερις πλευρές που περιγράφηκαν παραπάνω.

Δεν υπάρχει ενιαία καθολική προσέγγιση για τον ορισμό της εγκυρότητας. Ανάλογα με την πλευρά της εγκυρότητας που θέλει να εξετάσει ο ερευνητής, χρησιμοποιούνται και διαφορετικές μέθοδοι απόδειξης. Με άλλα λόγια, η έννοια της εγκυρότητας περιλαμβάνει τους διαφορετικούς τύπους της, που έχουν τη δική τους ιδιαίτερη σημασία.

Υπάρχουν τέσσερις τύποι εξωτερικά κριτήρια χρησιμοποιείται για να αποδείξει την εγκυρότητα:

1) κριτήρια απόδοσης (αυτά μπορεί να περιλαμβάνουν, όπως ο όγκος της εργασίας που εκτελείται, οι ακαδημαϊκές επιδόσεις, ο χρόνος που αφιερώνεται στην εκπαίδευση, ο ρυθμός αύξησης των προσόντων·

2) υποκειμενικά κριτήρια (περιλαμβάνουν διαφορετικά είδη απαντήσεων που
αντικατοπτρίζουν τη στάση ενός ατόμου για κάτι ή κάποιον, τη γνώμη, τις απόψεις του,
προτιμήσεις? συνήθως τα υποκειμενικά κριτήρια λαμβάνονται χρησιμοποιώντας συνεντεύξεις, ερωτηματολόγια, ερωτηματολόγια).

3) φυσιολογικά κριτήρια (χρησιμοποιούνται για τη μελέτη της επίδρασης του περιβάλλοντος και άλλων περιστασιακών μεταβλητών στο ανθρώπινο σώμα και την ψυχή. μετρώνται ο ρυθμός παλμών, η αρτηριακή πίεση, η ηλεκτρική αντίσταση του δέρματος, τα συμπτώματα κόπωσης κ.λπ.).

4) κριτήρια τυχαιότητας (χρησιμοποιείται όταν ο σκοπός της μελέτης αφορά, για παράδειγμα, το πρόβλημα της επιλογής για εργασία τέτοιων ατόμων που είναι λιγότερο επιρρεπή σε ατυχήματα).

Η αναζήτηση ενός επαρκούς και εύκολα αναγνωρίσιμου κριτηρίου είναι ένα από τα πιο σημαντικά και δύσκολα καθήκοντα επικύρωσης.

Υπάρχουν αρκετές είδη εγκυρότητας, λόγω των ιδιαιτεροτήτων των διαγνωστικών μεθόδων, καθώς και της προσωρινής κατάστασης ενός εξωτερικού κριτηρίου:

1) Εγκυρότητα «κατά περιεχόμενο». Αυτή η τεχνική χρησιμοποιείται κυρίως σε τεστ επίδοσης. Συνήθως, τα τεστ επίδοσης δεν περιλαμβάνουν όλη την ύλη που πέρασαν οι μαθητές, αλλά κάποιο μικρό μέρος αυτής (3-4 ερωτήσεις). Είναι δυνατόν να είμαστε σίγουροι ότι οι σωστές απαντήσεις σε αυτές τις λίγες ερωτήσεις μαρτυρούν την αφομοίωση όλης της ύλης. Αυτό πρέπει να απαντήσει ο έλεγχος εγκυρότητας περιεχομένου. Για να γίνει αυτό, πραγματοποιείται σύγκριση της επιτυχίας στο τεστ με αξιολογήσεις εμπειρογνωμόνων των δασκάλων (για αυτό το υλικό). Η εγκυρότητα "κατά περιεχόμενο" ισχύει επίσης για τεστ που βασίζονται σε κριτήρια. Μερικές φορές αυτή η τεχνική ονομάζεται λογική εγκυρότητα.

2) Εγκυρότητα "κατά ταυτόχρονη", ή τρέχουσα εγκυρότητα, καθορίζεται από ένα εξωτερικό κριτήριο, σύμφωνα με το οποίο οι πληροφορίες συλλέγονται ταυτόχρονα με
πειράματα σύμφωνα με τη δοκιμασμένη μέθοδο. Με άλλα λόγια, συλλέγονται δεδομένα που σχετίζονται με το παρόν (πρόοδος κατά τη δοκιμαστική περίοδο, απόδοση την ίδια περίοδο κ.λπ.). Συσχετίζονται με τα αποτελέσματα της επιτυχίας στο τεστ.

3) "προγνωστική εγκυρότητα . Καθορίζεται επίσης από ένα αρκετά αξιόπιστο εξωτερικό κριτήριο, αλλά οι πληροφορίες σχετικά με αυτό συλλέγονται λίγο καιρό μετά τη δοκιμή. Το εξωτερικό κριτήριο είναι συνήθως η ικανότητα ενός ατόμου, που εκφράζεται σε ορισμένες αξιολογήσεις, στο είδος της δραστηριότητας για την οποία επιλέχθηκε με βάση τα αποτελέσματα των διαγνωστικών εξετάσεων. Αν και αυτή η τεχνική είναι η πλέον κατάλληλη για το έργο των διαγνωστικών τεχνικών - την πρόβλεψη της μελλοντικής επιτυχίας, είναι πολύ δύσκολο να εφαρμοστεί. Η ακρίβεια της πρόβλεψης σχετίζεται αντιστρόφως με το χρόνο που δίνεται για μια τέτοια πρόβλεψη. Όσο περισσότερος χρόνος περνά μετά τη μέτρηση, τόσο περισσότεροι παράγοντες πρέπει να λαμβάνονται υπόψη κατά την αξιολόγηση της προγνωστικής σημασίας της τεχνικής. Ωστόσο, είναι σχεδόν αδύνατο να ληφθούν υπόψη όλοι οι παράγοντες που επηρεάζουν την πρόβλεψη.

4) «Αναδρομική» εγκυρότητα. Καθορίζεται με βάση τα κριτήρια
αντανακλώντας ένα γεγονός ή κατάσταση ποιότητας στο παρελθόν. Μπορεί να χρησιμοποιηθεί για γρήγορη απόκτηση πληροφοριών σχετικά με τις προγνωστικές δυνατότητες της τεχνικής. Έτσι, για να ελεγχθεί ο βαθμός στον οποίο οι καλές βαθμολογίες σε ένα τεστ επάρκειας αντιστοιχούν στην ταχεία μάθηση, μπορεί κανείς να συγκρίνει τους προηγούμενους βαθμούς, τις προηγούμενες απόψεις ειδικών κ.λπ. σε άτομα με υψηλούς και χαμηλούς διαγνωστικούς δείκτες αυτή τη στιγμή.

Κατά την παρουσίαση δεδομένων σχετικά με την εγκυρότητα της αναπτυγμένης μεθοδολογίας, είναι σημαντικό να διευκρινίζεται ακριβώς ποιος τύπος εγκυρότητας εννοείται (από περιεχόμενο, με ταυτόχρονο κ.λπ.). Είναι επίσης επιθυμητό να αναφέρονται πληροφορίες σχετικά με τον αριθμό και τα χαρακτηριστικά των ατόμων στα οποία πραγματοποιήθηκε η επικύρωση. Τέτοιες πληροφορίες επιτρέπουν στον ερευνητή που χρησιμοποιεί την τεχνική να αποφασίσει πόσο έγκυρη είναι αυτή η τεχνική για την ομάδα στην οποία
που σκοπεύει να το χρησιμοποιήσει. Όπως και με την αξιοπιστία, πρέπει να θυμόμαστε ότι μια τεχνική μπορεί να έχει υψηλή εγκυρότητα σε ένα δείγμα και χαμηλή εγκυρότητα σε άλλο. Επομένως, εάν ο ερευνητής σκοπεύει να χρησιμοποιήσει τη μεθοδολογία σε ένα δείγμα θεμάτων που είναι σημαντικά διαφορετικό από αυτό στο οποίο διεξήχθη το τεστ εγκυρότητας, πρέπει να επαναλάβει ένα τέτοιο τεστ.

Εκτός από τους τύπους εγκυρότητας, είναι σημαντικό να γνωρίζετε κριτήρια εγκυρότητας . Αυτά είναι τα κύρια σημάδια με τα οποία μπορεί κανείς πρακτικά να κρίνει αν αυτή η τεχνική ισχύει ή όχι. Αυτά τα κριτήρια μπορεί να είναι τα ακόλουθα:

1. Δείκτες συμπεριφοράς - αντιδράσεις, ενέργειες και πράξεις του υποκειμένου σε διάφορες καταστάσεις ζωής.

2. Επιτεύγματα του αντικειμένου σε διάφορες δραστηριότητες: εκπαιδευτικές, εργασιακές, δημιουργικές και άλλες.

3. Δεδομένα που υποδεικνύουν την απόδοση διαφόρων δειγμάτων ελέγχου και εργασιών.

4. Δεδομένα που λαμβάνονται με χρήση άλλων μεθόδων, η εγκυρότητα ή η σχέση των οποίων με τη δοκιμασμένη μέθοδο θεωρείται αξιόπιστα τεκμηριωμένη.

12. Η έννοια της εγκυρότητας, της αξιοπιστίας, της αξιοπιστίας στην ψυχοδιαγνωστική.

Αξιοπιστία- ένα από τα κριτήρια για τις μεθόδους δοκιμής. Στην ανάπτυξη αυτού του κριτηρίου συνέβαλαν οι A. Anastasi, Kronbach, Thorndike.

Η αξιοπιστία είναι η σχετική σταθερότητα, σταθερότητα, συνέπεια των αποτελεσμάτων των δοκιμών κατά τις αρχικές και επαναλαμβανόμενες μετρήσεις στα ίδια θέματα. Είναι απαραίτητο να επαναλάβετε τη μέτρηση στο ίδιο δείγμα. Διαφορές είναι πιθανές, αλλά θα πρέπει να είναι μικρές. Έτσι, η αξιοπιστία μιλά για την ακρίβεια και τη σταθερότητα των αποτελεσμάτων στη δράση τυχαίων παραγόντων.

Η συνολική εξάπλωση μπορεί να είναι αποτέλεσμα δύο ομάδων αιτιών:

    Η μεταβλητότητα που είναι εγγενής στο ίδιο το χαρακτηριστικό.

    Περιβαλλοντικοί παράγοντες που μπορεί να επηρεάσουν

Διαδικασίες υπολογισμού αξιοπιστίας:

    Διεξαγωγή της ίδιας μορφής δοκιμής. (επανεξέταση αξιοπιστία), υπολογισμός του συντελεστή συσχέτισης. Το διάστημα μεταξύ των δοκιμών είναι από έναν έως αρκετούς μήνες.

    Διεξαγωγή παράλληλων μορφών δοκιμών. Κατά τη διεξαγωγή μιας μελέτης χρησιμοποιώντας μια ισοδύναμη μορφή της δοκιμής, ο ειδικός είναι πεπεισμένος για την ορθότητα του επιλεγμένου χαρακτηριστικού. Για να θεωρούνται ισοδύναμα τα έντυπα δοκιμής, πρέπει να είναι ο ίδιος αριθμός εργασιών και στις δύο δοκιμασίες, οι εργασίες πρέπει να είναι ενοποιημένες, οι εργασίες πρέπει να είναι διατεταγμένες στον ίδιο βαθμό πολυπλοκότητας, να υπάρχει ο ίδιος μέσος όρος και πρότυπο απόκλιση. Δύο προσεγγίσεις χρησιμοποιούνται για τον υπολογισμό της αξιοπιστίας χρησιμοποιώντας παράλληλες μορφές δοκιμών:

    Τα ίδια θέματα εξετάζονται με το ίδιο τεστ. Και μετά άλλο, και αν ο συντελεστής συσχέτισης είναι μεγαλύτερος από 0,7, τότε η αξιοπιστία είναι υψηλή.

    Τα υποκείμενα χωρίζονται σε δύο ομάδες, η μία ομάδα περνά το τεστ Α, η άλλη δοκιμασία Β, μια εβδομάδα αργότερα - το αντίστροφο.

    Διαίρεση του τεστ και υπολογισμός του συντελεστή συσχέτισης. Τα υποκείμενα εκτελούν δύο μέρη του τεστ, τα οποία είναι ισοδύναμα. Όλες οι εργασίες με ζυγούς αριθμούς εμπίπτουν σε ένα μέρος, οι περιττοί στο άλλο. Αυτή η διαδικασία δείχνει τη σειρά του τεστ μέσα του, το μέτρο της επάρκειας της επιλογής των ερωτήσεων. Υπολογίζεται ο συντελεστής συσχέτισης.

Ο συντελεστής αξιοπιστίας αντιστοιχεί στον συντελεστή συσχέτισης Spearman ή Pisron.

Συντελεστής αξιοπιστίας-διασπορά - μια μέθοδος προσδιορισμού της αξιοπιστίας, με βάση την ανάλυση της διακύμανσης των αποτελεσμάτων της δοκιμής. Η αξιοπιστία του τεστ αντιστοιχεί στην αναλογία της πραγματικής διακύμανσης (δηλαδή, της διακύμανσης του υπό μελέτη παράγοντα) προς την εμπειρική διακύμανση που λαμβάνεται στην πραγματικότητα. Το τελευταίο είναι το άθροισμα της πραγματικής διακύμανσης και της διακύμανσης του σφάλματος μέτρησης. Η παραγοντική-αναλυτική προσέγγιση στον ορισμό της αξιοπιστίας διαμελίζει επιπλέον τη διασπορά του αληθινού δείκτη (J. Gilford, 1956).

Η διακύμανση του αληθινού δείκτη, με τη σειρά της, μπορεί να αποτελείται από τη διακύμανση του κοινού παράγοντα για ομάδες παρόμοιων δοκιμών, από συγκεκριμένους παράγοντες που παρέχουν δοκιμές συγκεκριμένης εστίασης και τη διακύμανση παραγόντων που είναι εγγενείς σε μια συγκεκριμένη μέθοδο δοκιμής. Επομένως, η συνολική διακύμανση του τεστ είναι ίση με το άθροισμα των αποκλίσεων για τους γενικούς, ειδικούς και μοναδιαίους παράγοντες συν τη διακύμανση σφάλματος

Η μέθοδος διακύμανσης παραγόντων για τον προσδιορισμό της αξιοπιστίας είναι κατάλληλη για την αξιολόγηση ενός ήδη παραγοντοποιημένου τεστ, αλλά όχι για δοκιμές που μετρούν ένα ευρύ φάσμα διαφόρων παραμέτρων, καθώς ορισμένες από αυτές μπορεί να μην περιλαμβάνονται στον καθιερωμένο τομέα εγκυρότητας της μεθοδολογίας.

Αξιοπιστία και επιτρεπόμενο σφάλμα μέτρησης:

Η αξιοπιστία καθορίζεται από το κριτήριο του σφάλματος μέτρησης. Το σφάλμα είναι ένα στατιστικό στοιχείο που χαρακτηρίζει τον βαθμό ακρίβειας των επιμέρους μετρήσεων. Υποτίθεται ότι για οποιοδήποτε χαρακτηριστικό, κάθε άτομο έχει μια πραγματική βαθμολογία. Οποιοσδήποτε δείκτης λαμβάνεται στη δοκιμή διαφέρει από την πραγματική του τιμή από κάποιο τυχαίο σφάλμα. Και αν δοκιμάσετε ένα άτομο πολλές φορές, θα έχετε μια εξάπλωση του δείκτη γύρω από την πραγματική τιμή. Αυτή η τιμή κυμαίνεται εντός ορισμένων ορίων. Η διακύμανση αυτής της τιμής μπορεί να εξαρτάται από συστηματικά και τυχαία σφάλματα. Οι λόγοι για τα συστηματικά σφάλματα μπορεί να είναι λανθασμένοι έλεγχοι, μη συμμόρφωση με τη διαδικασία, ανακρίβεια στην επεξεργασία, χαμηλή εγκυρότητα της μεθόδου. Τυχαία σφάλματα που σχετίζονται με τον ανθρώπινο παράγοντα είναι επίσης πιθανά. Εάν τέτοιες αστοχίες δεν περιλαμβάνονται στη μεθοδολογία, τότε δεν μπορεί να θεωρηθεί ακριβής. Με μεγάλο αριθμό παρατηρήσεων, μεμονωμένες εκτιμήσεις σχηματίζουν έναν ορισμένο τύπο κατανομής της στατιστικής, η οποία θα αποκαλύψει σφάλματα μέτρησης. Το σφάλμα μέτρησης καθορίζεται με στατιστικές μεθόδους - η τιμή της τετραγωνικής απόκλισης που σχετίζεται με τη διασπορά της κατανομής των μεμονωμένων μετρήσεων. Το σφάλμα δεν πρέπει να υπερβαίνει το 5%.

Εγκυρότητα:

Η εγκυρότητα είναι η ικανότητα ενός τεστ να μετρήσει αυτό που προορίζεται να μετρήσει. Αυτή η έννοια δεν αναφέρεται πλέον στη δοκιμή, αλλά στον σκοπό της. Μια δοκιμή μπορεί να είναι αξιόπιστη αλλά όχι έγκυρη. Αν όμως το τεστ είναι έγκυρο, τότε είναι αξιόπιστο.

Πηγές ιδεών εγκυρότητας:

    Οι πρώτες ιδέες εμφανίστηκαν ακόμη και πριν από τη δημιουργία δοκιμών. Συχνά, οι ερευνητές έχουν συνδέσει τα ερευνητικά ευρήματα με μελλοντικές επιτυχίες. Για παράδειγμα, ο Πυθαγόρας συνέδεσε τη σκέψη και τον λόγο με τη βοήθεια της διαίσθησης.

    Η ιδέα της ανάγκης για πρακτική επαλήθευση της καταλληλότητας του τεστ. Εκτός πρακτικής, το πρόβλημα της εγκυρότητας δεν μπορεί να υπάρξει.

    Φιλοσοφικές ιδέες: η αλήθεια είναι η αντιστοιχία της σκέψης με την πραγματικότητα. Το κριτήριο της αλήθειας είναι η χρησιμότητα.

    Οι μετρήσεις που κάνουμε δεν είναι προφανείς, απαιτούν μια θεωρητική βάση. Θεωρητικό = εμπειρική εγκυρότητα.

    Ανάπτυξη στατιστικής επιστήμης - συσχέτιση και παραγοντική ανάλυση.

Πέντε πηγές προκάλεσαν πέντε τύπους εγκυρότητας.

Στις αρχές του 20ου αιώνα, η διαίσθηση έπαιξε πρωταγωνιστικό ρόλο. Εάν ο δημιουργός του τεστ ήταν ένα διάσημο πρόσωπο, τότε η πίστη στην εγκυρότητα ελήφθη υπόψη.

Στις δεκαετίες του 1920 και του 1930, οι απαιτήσεις της πρακτικής αυξήθηκαν, άρχισαν να δημιουργούνται τεστ με βάση εμπειρικές πηγές. Τρεις εμπειρικές προσεγγίσεις έχουν αναπτυχθεί:

    Όλοι οι υποψήφιοι για εργασία ελέγχονται. Με την πάροδο του χρόνου μετράται η παραγωγικότητα και η αποτελεσματικότητά τους. Μετά ήρθε η συσχέτιση των δεικτών. Έτσι οι δοκιμές χρησιμοποιήθηκαν για χρησιμότητα.

    Πρώτα, ελέγχονται όσοι εργάζονται ήδη με επιτυχία και στη συνέχεια τα αποτελέσματα αυτής της δοκιμής συσχετίζονται με τα αποτελέσματα των υποψηφίων. Αν υπάρχει σχέση, τότε το τεστ είναι έγκυρο.

    Έργα των Binet και Simon. Για να βεβαιωθείτε ότι το τεστ μετρά τη νοημοσύνη. Όλες οι δοκιμαστικές εργασίες πραγματοποιήθηκαν σε δύο ομάδες, οι οποίες επιλέχθηκαν όχι από ψυχολόγους, αλλά από δασκάλους. Στην ομάδα 1 υπήρχαν παιδιά με υψηλές νοητικές ικανότητες, στην ομάδα 2 - με ανέκφραστες ικανότητες. Αυτή η μέθοδος ονομάστηκε «ειδικός». Πραγματοποιήθηκαν περαιτέρω δοκιμές. Και αν και στις δύο ομάδες η πλειοψηφία απάντησε σύμφωνα με τις προσδοκίες των συγγραφέων, τότε το τεστ αναγνωρίστηκε ως έγκυρο.

Έτσι, εμπειρικές μέθοδοι για την τεκμηρίωση της εγκυρότητας υπήρχαν μέχρι τη δεκαετία του 1950. Άρχισαν να πιστεύουν ότι είναι δυνατό να αποδειχθεί η εγκυρότητα όχι μόνο με τη βοήθεια της πρακτικής. Ανάλυση και αντιστοιχία θεωρίας και πράξης. Εγκυρότητα περιεχομένου, σύγκριση με το πρόγραμμα σπουδών και το περιεχόμενο του τεστ. Η σύγκριση διευκολύνεται όταν το πρόγραμμα τονίζει το πρόβλημα, τον σκοπό και τις βασικές έννοιες. Εννοιολογική εγκυρότητα, καθώς οι ψυχολόγοι ενδιαφέρονται να συσχετίσουν τις επιστημονικές έννοιες με εμπειρικά παρατηρούμενα γεγονότα.

Στις εμπειρικές μεθόδους απόδειξης της εγκυρότητας, ιδιαίτερο ρόλο παίζουν εξωτερικά κριτήρια που χρησιμεύουν ως απόδειξη εγκυρότητας. Οι Αμερικανοί ψυχολόγοι Tiffany και McCormick ανέλυσαν τη χρήση εξωτερικών κριτηρίων και προσδιόρισαν 4 τύπους αυτών:

    Κριτήριο απόδοσης - ο όγκος της εργασίας που εκτελείται, ο ρυθμός ανάπτυξης δεξιοτήτων

    Υποκειμενικό κριτήριο - η συμπερίληψη διαφόρων τύπων απαντήσεων που αντικατοπτρίζουν τη στάση απέναντι σε κάτι.

    Φυσιολογικό κριτήριο - χρησιμοποιείται στη μελέτη του περιβάλλοντος.

    Το κριτήριο της τυχαιότητας είναι η συνεκτίμηση πολλών παραγόντων.

Τα εξωτερικά κριτήρια πρέπει να πληρούν τις απαιτήσεις συνάφειας, απαλλαγής από παρεμβολές, αξιοπιστίας. Η συνάφεια είναι μια σημασιολογική αντιστοιχία μεταξύ ενός τεστ και ενός ζωτικού κριτηρίου ανεξάρτητου από αυτό. Η απαλλαγή από παρεμβολές (μόλυνση) θεωρείται σημαντική αφού η δραστηριότητα επηρεάζεται από το ίδιο το άτομο και τις συνθήκες εργασίας του. Αξιοπιστία – συνέπεια αποτελεσμάτων

Διαγνωστικό (αγωνιστικό) Β. αντανακλά την ικανότητα του τεστ να διαφοροποιεί τα υποκείμενα ανάλογα με το χαρακτηριστικό που μελετάται. Η ανάλυση του διαγνωστικού V. σχετίζεται με τη διαπίστωση της αντιστοιχίας μεταξύ των δεικτών δοκιμής και της πραγματικής κατάστασης των ψυχολογικών χαρακτηριστικών του υποκειμένου τη στιγμή της εξέτασης. Ένα παράδειγμα του ορισμού αυτού του τύπου V. μπορεί να είναι μια μελέτη που χρησιμοποιεί τη μέθοδο των ομάδων αντίθεσης. Η διεξαγωγή ενός τεστ νοημοσύνης σε φυσιολογικά αναπτυσσόμενα παιδιά και στους συνομηλίκους τους με νοητικές αναπηρίες μπορεί να αποκαλύψει βαθιές ποσοτικές και ποιοτικές διαφορές στην εκτέλεση των καθηκόντων από τις συγκρινόμενες ομάδες. Ο βαθμός αξιοπιστίας της διαφοροποίησης των παιδιών της πρώτης και δεύτερης ομάδας σύμφωνα με τα δεδομένα του τεστ θα είναι χαρακτηριστικό της διαγνωστικής V. αξιολόγησης της νοητικής ανάπτυξης που λαμβάνεται με τη χρήση αυτής της τεχνικής.

Εγκυρότητα περιεχομένου(εσωτερικό, λογικό) - ένα σύνολο πληροφοριών σχετικά με την αντιπροσωπευτικότητα των στοιχείων δοκιμής σε σχέση με τις ιδιότητες και τα χαρακτηριστικά που μετρήθηκαν. Μία από τις βασικές απαιτήσεις για την επικύρωση της μεθοδολογίας προς αυτή την κατεύθυνση είναι ο προβληματισμός στο περιεχόμενο του τεστ των βασικών πτυχών του μελετημένου ψυχολογικού φαινομένου. Εάν η περιοχή συμπεριφοράς ή χαρακτηριστικού είναι πολύ περίπλοκη, τότε το ουσιαστικό V. απαιτεί την παρουσίαση στις εργασίες του τεστ όλων των σημαντικότερων συστατικών στοιχείων του υπό μελέτη φαινομένου.

διαφορικός ΣΤΟ. - εγκυρότητα, η οποία εξετάζει τις εσωτερικές σχέσεις μεταξύ ψυχολογικών παραγόντων που διαγιγνώσκονται με χρήση ψυχοδιαγνωστικής τεχνικής. Περιεχόμενο D.V. μπορεί να απεικονιστεί με το παράδειγμα των τεστ ενδιαφέροντος, τα οποία ως επί το πλείστον συσχετίζονται συνήθως μέτρια με δείκτες της συνολικής ακαδημαϊκής επίδοσης, αλλά συνδέονται σε διαφορετικό βαθμό με τις επιδόσεις σε επιμέρους κλάδους. Το V. d. είναι ιδιαίτερα σημαντικό ως δείκτης της διαγνωστικής αξίας των τεχνικών που χρησιμοποιούνται στην επαγγελματική επιλογή.

απατηλό V.(ψευδή) - η ψευδαίσθηση της συμμόρφωσης του συμπεράσματος με βάση τα αποτελέσματα της δοκιμής με τα προσωπικά χαρακτηριστικά του υποκειμένου. Προκύπτει ως αποτέλεσμα της χρήσης εξαιρετικά γενικών και επομένως εφαρμόσιμων σε όλες σχεδόν τις διατυπώσεις που εξετάστηκαν, όπως, για παράδειγμα, «λογικό στην επιλογή ενός στόχου», «προσπαθεί για μια καλύτερη ζωή» κ.λπ. Τέτοιες δηλώσεις γίνονται δεκτές από σχεδόν όλοι οι άνθρωποι ως ακριβής περιγραφή των προσωπικοτήτων τους, που δημιουργεί τη βάση για τις δραστηριότητες διαφόρων ειδών μάντεων και μάντεων.

σταδιακή ΣΤΟ. - (Αγγλικά incremental - increment, profit) - ένα από τα στοιχεία της εγκυρότητας του κριτηρίου, της προγνωστικής εγκυρότητας του τεστ, που αντικατοπτρίζει την πρακτική αξία της μεθοδολογίας στην επιλογή. Σε και. μπορεί να ποσοτικοποιηθεί ως προς την εγκυρότητα του συντελεστή.

Συναίνεση Β. (συναινετική εγκυρότητα) - ένας τύπος εγκυρότητας που βασίζεται στη δημιουργία μιας σύνδεσης (συσχέτισης) δεδομένων δοκιμής με δεδομένα που λαμβάνονται από εξωτερικούς εμπειρογνώμονες που γνωρίζουν καλά τα άτομα που δοκιμάστηκαν. Η έννοια και η διαδικασία του V. to. εισήχθησαν από τον R. McCrae το 1982 προκειμένου να διασφαλιστεί η επικύρωση των ερωτηματολογίων προσωπικότητας, κάτι που είναι συχνά δύσκολο (και μερικές φορές αδύνατο) λόγω της έλλειψης κριτηρίων που είναι απαραίτητα για την τεκμηρίωση της εγκυρότητας.

Το Constructive V. είναι ένας από τους κύριους τύπους εγκυρότητας, που αντικατοπτρίζει τον βαθμό αναπαράστασης του μελετημένου ψυχολογικού κατασκευάσματος στα αποτελέσματα των τεστ. Η πρακτική ή λεκτική νοημοσύνη, η συναισθηματική αστάθεια, η εσωστρέφεια, η κατανόηση ομιλίας, η εναλλαγή της προσοχής κ.λπ. μπορούν να λειτουργήσουν ως κατασκεύασμα. Με άλλα λόγια, το V. to. ορίζει την περιοχή της θεωρητικής δομής των ψυχολογικών φαινομένων που μετράται από το τεστ .

Ωστόσο, πρέπει να σημειωθεί ότι, σε αντίθεση με την επικύρωση κριτηρίου, η ανάλυση του V. to. δεν απαιτεί υψηλό βαθμό σύνδεσης μεταξύ των αποτελεσμάτων δύο δοκιμών. Εάν αποδειχθεί ότι το νέο και το τεστ αναφοράς είναι σχεδόν πανομοιότυπα ως προς το περιεχόμενο και τα αποτελέσματα και η μεθοδολογία που αναπτύχθηκε δεν έχει τα πλεονεκτήματα της συντομίας ή της ευκολίας εφαρμογής, αυτό σημαίνει μόνο επανάληψη της δοκιμής, που δικαιολογείται μόνο από την άποψη. δημιουργώντας μια παράλληλη φόρμα δοκιμής. Το νόημα της διαδικασίας του V. to. είναι να διαπιστωθεί τόσο η ομοιότητα όσο και η διαφορά των ψυχολογικών φαινομένων που μετρήθηκαν από το νέο τεστ σε σύγκριση με το γνωστό.

Μια σημαντική πτυχή του V. to. είναι η εσωτερική συνέπεια, η οποία αντικατοπτρίζει τον τρόπο με τον οποίο ορισμένα στοιχεία (εργασίες, ερωτήσεις) που συνθέτουν το υλικό δοκιμής υποτάσσονται στην κύρια κατεύθυνση του τεστ στο σύνολό του, εστιάζοντας στη μελέτη των ίδιων δομών. Η ανάλυση της εσωτερικής συνέπειας πραγματοποιείται συσχετίζοντας τις απαντήσεις σε κάθε εργασία με το συνολικό αποτέλεσμα της δοκιμής. Κατά τον προσδιορισμό του V. έως. Σημαντική θέση ανήκει στη μελέτη της δυναμικής της μετρούμενης κατασκευής. Ταυτόχρονα, μπορούμε να βασιστούμε σε υποθέσεις σχετικά με την ηλικιακή του ανάπτυξη, τον αντίκτυπο της εκπαίδευσης, της κατάρτισης, της κατάκτησης ενός επαγγέλματος κ.λπ.

Κριτήρια V. - ένα σύνολο χαρακτηριστικών, συμπεριλαμβανομένης της εγκυρότητας των τρεχουσών και προγνωστικών μεθόδων και αντικατοπτρίζει τη συμμόρφωση της διάγνωσης και της πρόγνωσης με ένα συγκεκριμένο εύρος κριτηρίων για το φαινόμενο που μετράται. Η επικύρωση του κριτηρίου είναι ανεξάρτητη από τα αποτελέσματα των δοκιμών και τις άμεσες μετρήσεις της ποιότητας που μελετήθηκε, όπως το επίπεδο επιτυχίας σε οποιαδήποτε δραστηριότητα, ο βαθμός ανάπτυξης της ικανότητας, η σοβαρότητα ενός συγκεκριμένου χαρακτηριστικού προσωπικότητας κ.λπ. Κατά την επικύρωση του επιτεύγματος τεστ, το αποτέλεσμα της μέτρησης συγκρίνεται με τη γνώμη των εκπαιδευτικών σχετικά με τη γνώση που εξετάζεται σε μια συγκεκριμένη περιοχή, με ακαδημαϊκές αξιολογήσεις, τεστ ελέγχου κ.λπ. αξιολογήσεις εμπειρογνωμόνων των διευθυντών και με αντικειμενικούς δείκτες επιτευγμάτων στον επαγγελματικό τομέα.

Προφανές V. - μια ιδέα για το τεστ, το εύρος, την αποτελεσματικότητα και την προγνωστική του αξία, που εμφανίζεται στο υποκείμενο ή σε άλλο άτομο που δεν έχει ειδικές πληροφορίες σχετικά με τη φύση της χρήσης και τους στόχους της μεθοδολογίας. V. o. δεν αποτελεί συστατικό αντικειμενικά εδραιωμένης εγκυρότητας. Ταυτόχρονα υψηλό V. περίπου. στις περισσότερες περιπτώσεις είναι ιδιαίτερα επιθυμητό. Λειτουργεί ως παράγοντας που ενθαρρύνει τα υποκείμενα να εξετάσουν, συμβάλλει σε μια πιο σοβαρή και υπεύθυνη στάση στο έργο της ολοκλήρωσης των εργασιών του τεστ και στα συμπεράσματα που διατυπώνει ο ψυχολόγος.

Επαρκές επίπεδο V. περίπου. ιδιαίτερα σημαντική για τις μεθόδους εξέτασης ενηλίκων. Αναπαραστάσεις υποκειμένων και χρηστών ψυχοδιαγνωστικών πληροφοριών για τον V. o. σε μεγάλο βαθμό καθορίζεται από το όνομα της τεχνικής, καθώς αυτό το μέρος των πληροφοριών σχετικά με το τεστ είναι πιο προσιτό σε μη ειδικούς. V. o. βελτιώνει σημαντικά τη χρήση κατανοητών διατυπώσεων και όρων, καθώς και εργασιών που έχουν το πιο φυσικό περιεχόμενο, λαμβάνοντας υπόψη την ηλικία, το φύλο και τις επαγγελματικές ιδιαιτερότητες των θεμάτων. Ανεπαρκώς υπερεκτιμημένος V. περίπου. συμβάλλει σε πιο έντονη εκδήλωση της επίδρασης της μόλυνσης του κριτηρίου.

V. o. μερικές φορές ονομάζεται εξωτερική (face validity) ή «εμπιστοσύνη» (faith validity), εγκυρότητα.

V. Η ηλικιακή διαφοροποίηση είναι ένα από τα συστατικά της εγκυρότητας της κατασκευής, που σχετίζεται με τη δυναμική ηλικίας των αλλαγών στην υπό μελέτη ποιότητα. Ο χαρακτηρισμός της εγκυρότητας της κατασκευής εδώ συνίσταται στον προσδιορισμό της συμμόρφωσης των αποτελεσμάτων των δοκιμών με θεωρητικά αναμενόμενες και πρακτικά παρατηρούμενες αλλαγές που σχετίζονται με την ηλικία σε μια δεδομένη κατασκευή ή ιδιότητα.

Προγνωστικό V. - πληροφορίες σχετικά με τον βαθμό ακρίβειας και εγκυρότητας της τεχνικής (τεστ) σας επιτρέπουν να κρίνετε τη διαγνωσμένη ψυχολογική ποιότητα μετά από ορισμένο χρόνο μετά τη μέτρηση. Το V. p. αντικατοπτρίζει το χρονικό διάστημα στο οποίο εκτείνεται η λογική για μια τέτοια κρίση. Οι πληροφορίες σχετικά με το V. p. σχετίζονται πιο άμεσα με την αποκάλυψη της προγνωστικής ισχύος της τεχνικής, την αποσαφήνιση του βαθμού εγκυρότητας της άμεσης και πιο απομακρυσμένης πρόβλεψης που διατυπώθηκε στη βάση της, την ανάλυση της σημασίας των δεικτών που ελήφθησαν στο τεστ με το λεγόμενο. παρεκβολή αποτελεσμάτων για το μέλλον.

Ως επικύρωση κριτηρίου, δεν μπορούν να δράσουν μόνο οι δείκτες της πραγματικής συμπεριφοράς, αλλά και τα αναμενόμενα αποτελέσματα της δραστηριότητας, της θεραπείας, της εκπαίδευσης κ.λπ. το αποτέλεσμα της θεραπείας κ.λπ. Ταυτόχρονα, η διαφορά μεταξύ των δύο τύπων εγκυρότητας κριτηρίου είναι συνδέονται όχι μόνο με τα χρονικά όρια των συγκρίσεων κριτηρίων.Τρέχουσα εγκυρότητα και V. σ. ανάπτυξη ποιότητας ή επιτυχίας στη δραστηριότητα - από την άλλη.

Η σημασία των δεικτών του V. p. στην ανάλυση των διαδικασιών δοκιμής που στοχεύουν στην επιλογή τονίζεται με την εισαγωγή μιας ειδικής έννοιας της αυξητικής εγκυρότητας. Αυτός ο δείκτης V. p. παρέχει πληροφορίες για το πόσο βελτιώνεται η διαδικασία επιλογής χρησιμοποιώντας αυτό το τεστ σε σύγκριση με το παραδοσιακό (με βάση μόνο επίσημες πληροφορίες για προηγούμενες δραστηριότητες, ανάλυση προσωπικών αρχείων, συνομιλίες).

Το σύμπλεγμα πληροφοριών του V. με. παραδοσιακά έχει τη μεγαλύτερη αξία για τεστ που εξετάζουν δραστηριότητες που είναι κοντινές ή συμπίπτουν με πραγματικές (τις περισσότερες φορές εκπαιδευτικές ή επαγγελματικές). Η δραστηριότητα που μελετάται είναι, κατά κανόνα, συνθετική φύση, αποτελείται από πολλούς, μερικές φορές ετερογενείς παράγοντες (εκδηλώσεις προσωπικών χαρακτηριστικών, ένα σύνολο απαραίτητων γνώσεων και δεξιοτήτων, ειδικές ικανότητες κ.λπ.). Επομένως, ένα από τα πιο σημαντικά καθήκοντα για τη δημιουργία ενός επαρκούς μοντέλου της δοκιμασμένης δραστηριότητας είναι η επιλογή εργασιών που θα καλύπτουν τις κύριες πτυχές του υπό μελέτη φαινομένου στη σωστή αναλογία με την πραγματική δραστηριότητα στο σύνολό της.

Τρέχον V. (διαγνωστικό, ανταγωνιστικό) - ένα χαρακτηριστικό του τεστ, που αντικατοπτρίζει την ικανότητά του να διακρίνει μεταξύ των θεμάτων με βάση ένα διαγνωστικό χαρακτηριστικό που είναι το αντικείμενο μελέτης σε αυτήν την τεχνική. Τα επίπεδα γενικών ικανοτήτων, ισχυρισμών, λεκτικής νοημοσύνης, άγχους κ.λπ. μπορούν να λειτουργήσουν ως σημάδια. Με στενότερη έννοια, το V.t. είναι η διαπίστωση της συμμόρφωσης των αποτελεσμάτων ενός επικυρωμένου τεστ με ένα ανεξάρτητο κριτήριο που αντανακλά την κατάσταση της ποιότητας που μελετάται από το τεστ κατά τη στιγμή της μελέτης.

Ένα είδος δείκτη του V. t. είναι ένα σύνολο πληροφοριών σχετικά με το πόσο βολικό, οικονομικό είναι το τεστ σε σύγκριση με τη λήψη πληροφοριών σχετικά με την ποιότητα που μελετάται από άλλες πηγές (παρατήρηση, ανάλυση αντικειμενικών δεδομένων, αξιολόγηση από ομοτίμους κ.λπ.).

Οικολογικό V. - η εγκυρότητα της δοκιμής σε σχέση με τη μετρούμενη ιδιότητα στο πλαίσιο μιας συγκεκριμένης κατάστασης. V. e. είναι μια ιδιότητα του τεστ, που εκδηλώνεται στο γεγονός ότι η χρήση του στην επίλυση διαφόρων πρακτικών προβλημάτων οδηγεί σε μια ποιοτικά διαφορετική ερμηνεία των αποτελεσμάτων του τεστ (V. N. Druzhinin, 1990).

Εμπειρικό Β.-σύνολο χαρακτηριστικών της εγκυρότητας του τεστ, που προκύπτει με συγκριτική στατιστική μέθοδο αξιολόγησης. Σχετίζεται κυρίως με το πεδίο της εγκυρότητας του κριτηρίου και τους δύο τύπους του: τρέχουσα εγκυρότητα και προγνωστική εγκυρότητα. Εάν, κατά τον καθορισμό της εγκυρότητας μιας ουσιαστικής δοκιμής, η αξιολόγηση της δοκιμής πραγματοποιείται με τη χρήση διαφόρων ποιοτικών διαδικασιών για τη λήψη πληροφοριών με περιγραφικές μεθόδους χρησιμοποιώντας αξιολογήσεις εμπειρογνωμόνων και άλλες πηγές πληροφοριών (για να κριθεί η συμμόρφωση των εργασιών δοκιμής με την περιεχόμενο του θέματος μέτρησης), τότε V. e. μετριέται πάντα με στατιστική συσχέτιση. Πραγματοποιείται μια ανάλυση συσχέτισης της σχέσης μεταξύ δύο σειρών τιμών - βαθμολογίες δοκιμών και δείκτες για την εξωτερική παράμετρο της ιδιότητας που μελετάται (ή τα αποτελέσματα μιας άλλης δοκιμής, η εγκυρότητα της οποίας είναι γνωστή).