Theorien der TCT- und TRI-Tests
Die Tests werden in der Psychologie als Messinstrumente eingesetzt. Um sich dem Konzept ein wenig anzunähern und nicht völlig genau zu sein, genauso wie wir das Messgerät zur Längenmessung verwenden, könnten wir einen Test verwenden, um Intelligenz, Gedächtnis, Aufmerksamkeit ... zu messen. Einer der Unterschiede zwischen der einen und der anderen Aktion wäre das Die Tests sind nicht so einfach zu erstellen und zusätzlich so einfach, dass sie so einfach anzuwenden sind.
Ebenso wie eine einzelne Messung nicht erlaubt, über das Volumen eines Objekts zu sprechen, erlaubt die Verwaltung eines einzelnen Tests nicht, eine Diagnose zu stellen oder eine Intervention vorzuschlagen. So, Die Tests sind wichtig für die Bewertung, sie sind jedoch nicht bestimmend.
Hier spielt der Psychologe die wichtigste Rolle: In gewisser Weise muss er die Informationen, die er aus dem Test erhalten hat, und aus anderen Quellen dazu verwenden Form einer kohärenten Bewertung geben, die der Planung der Intervention Platz macht. Mit anderen Worten: Zum Zeitpunkt der Integration der Ergebnisse aus verschiedenen Quellen ist die Qualität des Fachmanns am deutlichsten. Wir sprechen von einer Fähigkeit, die mit Wissen, aber auch mit langjähriger Erfahrung erreicht wird.
Kurze Geschichte der Theorien der Tests
Der Ursprung der Tests wird normalerweise in Tests von chinesischen Kaisern angegeben in den Jahren 3000 vor Christus. Diese hatten daher das Ziel, die fachliche Kompetenz der Beamten zu bewerten, die ihren Dienst aufnehmen wollten. (1)
Die aktuellen Tests haben ihren Ursprung in den von Galton durchgeführten Tests (1822-1911) in seinem Labor. Es war jedoch James Cattell, der den Begriff zuerst verwendete mentaler Test, 1890. Da sich diese ersten Tests nicht als zu vorhersagend auf die kognitiven Fähigkeiten des Menschen erwiesen haben, führen Forscher wie Binet und Simon (1905) in ihrem neuen Maßstab kognitive Aufgaben ein, um Aspekte wie Urteilsvermögen, Verständnis und Begründung zu bewerten.
Die Binet-Skala eröffnet eine Tradition der individuellen Skalen. Neben kognitiven Tests werden bei Persönlichkeitstests große Fortschritte erzielt.
Warum sind die Theorien der Tests notwendig??
Bevor alle Fortschritte erzielt werden, beginnen sie, wiederum Messtheorien (Theorien der Tests) zu entwickeln, die die Tests direkt als Instrumente beeinflussen. Mit der Sorge, Instrumente zu erzeugen, die messen, was wir messen sollen, und dies mit dem geringstmöglichen Fehler zu tun, erscheint die Psychometrie. Eine Psychometrie, die jeden Test oder jedes Messinstrument erfordert, das behauptet, gültig und zuverlässig ist,
Erinnern Sie sich daran, dass die Zuverlässigkeit es wird die Stabilität oder Konsistenz der Messungen verstanden, wenn der Messvorgang wiederholt wird. Mit anderen Worten, ein Test ist zuverlässiger, je besser er die Ergebnisse reproduziert, wenn zwei Subjekte oder das gleiche Subjekt in verschiedenen Gelegenheiten gemessen werden, die das gleiche Niveau in den gemessenen haben. Für seinen Teil, Gültigkeit bezieht sich auf den Grad, in dem empirische Evidenz und Theorie die Interpretation von Scores unterstützen der Tests. (2)
Daher gibt es zwei große Theorien zu den Tests oder Ansätzen, wenn wir über die Analyse und den Aufbau dieser Art von Instrumenten sprechen: die klassische Theorie der Tests (TCT) und die Antworttheorie auf die Items (TRI).
Die klassische Theorie der Tests (TCT)
Es ist die vorherrschende Theorie bei der Konstruktion und Analyse der Tests. Die Schüssel: Es ist relativ einfach, Tests zu bauen, die den Mindestanforderungen dieses Paradigmas entsprechen. Die Bewertung des Tests selbst im Hinblick auf die genannten Parameter ist ebenfalls relativ einfach: Zuverlässigkeit und Gültigkeit.
Es hat seinen Ursprung in den Werken von Spearman zu Beginn des 20. Jahrhunderts. Dann, im Jahr 1968, forschen der Lord und die Novick-Forscher eine Neuformulierung dieser Theorie und eröffnen den Weg für den neuen Ansatz des TRI.
Diese Theorie basiert auf dem klassischen linearen Modell. Dieses Modell wurde von Spearman vorgeschlagen und besteht darin, dies anzunehmen Die Bewertung, die eine Person in einem Test erhält, die wir als empirische Bewertung bezeichnen, und die normalerweise mit dem Buchstaben X bezeichnet wird, besteht aus zwei Komponenten. (2)
Zum einen finden wir die tatsächliche Punktzahl des Subjekts im Test (V) und zum anderen den Fehler (e). Es wird wie folgt ausgedrückt: X = V + e.
Spearman fügt dieser Theorie drei Annahmen hinzu:
- Zuerst definieren Sie die wahre Punktzahl (V) als der mathematische Hoffnung der Empirische Punktzahl: Es ist die Punktzahl, die eine Person in einem Test hätte, wenn sie unendlich oft durchgeführt würde.
- Nein da ist Beziehung zwischen Anzahl der wahren Noten und die Größe der Fehler das beeinflusst diese Scores.
- Zum Schluss die Messfehler in einem Test das sind sie verwandt mit dem Messfehler in einem anderen Test unterschiedlich.
Um diese Theorie zu vervollständigen, definiert Spearman die parallele Tests Wie diese Tests, die dasselbe messen, aber mit unterschiedlichen Elementen.
Einschränkungen des klassischen Ansatzes
Die erste Einschränkung ist, dass die Messungen innerhalb dieser Theorie nicht invariant sind in Bezug auf das verwendete Instrument. Das heißt, wenn ein Psychologe die Intelligenz von drei Personen mit jeweils unterschiedlichen Tests bewertet, sind die Ergebnisse nicht vergleichbar. Aber warum passiert das??
Nun, die Ergebnisse der drei Messinstrumente sind nicht auf der gleichen Skala: Jeder Test hat eine eigene Skala. Um zum Beispiel die Intelligenz von X-Personen vergleichen zu können, die mit verschiedenen Intelligenztests bewertet wurden, ist es notwendig verwandeln die erzielten Ergebnisse direkt aus dem Test in anderen Skalen.
Das Problem dabei ist, dass wir durch die Umwandlung der Scores in Baremadas die normativen Gruppen annehmen, in denen sie erarbeitet wurden Die Skalen der verschiedenen Tests sind vergleichbar - gleicher Durchschnitt, gleiche Standardabweichung-, was in der Praxis schwer zu garantieren ist. (1) Der neue Ansatz des TRI sah daher einen großen Fortschritt in Bezug auf diese Tatsache vor. Das TRI wird somit erreichen, dass die Ergebnisse, die durch den Einsatz verschiedener Instrumente erzielt werden, im selben Maßstab liegen.
Die zweite Einschränkung dieses Ansatzes ist das Fehlen einer Invarianz der Testeigenschaften in Bezug auf die Menschen, die verwendet wurden, um es zu schätzen. Daher hängen im Rahmen der TCT die wichtigen psychometrischen Eigenschaften der Tests von der Art der zur Berechnung verwendeten Stichprobe ab. Dies ist eine Tatsache, die auch im TRI-Ansatz eine zumindest teilweise Lösung findet.
Die Item-Response-Theorie (TRI)
Die Theorie der Antwort auf Items (TRI) wird als Ergänzung zur Theorie der klassischen Tests geboren. Mit anderen Worten, der TCT und der TRI könnten denselben Test bewerten und für jeden der Punkte einen Score oder eine Relevanz festlegen, was wiederum zu einem unterschiedlichen Ergebnis für jede Person führen kann. Auf der anderen Seite, um darauf hinzuweisen, dass der TRI uns ein viel besser kalibriertes Instrument bieten würde, besteht das Problem darin, dass dieses Paradigma viel höhere Kosten und die Teilnahme von Fachleuten mit sich bringt..
Das TRI hat mehrere Annahmen, aber vielleicht sagt uns die wichtigste, dass jedes Messinstrument einer Idee entsprechen sollte: Es gibt eine eine funktionale Beziehung zwischen den Werten der Variablen, die die Elemente messen, und der Wahrscheinlichkeit, diese zu treffen. Diese Funktion wird aufgerufen Kennlinie des Artikels (CCI). Was vermuten wir dann??
Nun, etwas, das von außen sehr logisch erscheinen kann und von der TCT nicht bewertet wird. Das Schwierigste wäre zum Beispiel das, was nur die klügsten Leute beantworten. Auf der anderen Seite wäre ein Punkt, den alle Menschen gut beantworten, für uns nicht wert, weil er keine Diskriminierungsfähigkeit hätte. Mit anderen Worten, es würde keinerlei Informationen geben. Dies ist nur eine kleine Skizze der vom TRI vorgeschlagenen Revolution.
Um die Unterschiede zwischen den einzelnen Messmodellen etwas besser zu sehen, können wir die Tabelle von José Muñiz (2010) als Referenz heranziehen:
Tabelle 1. Unterschiede zwischen TCT und TRI (Muñiz, 2010)
Aspekte | TCT | TRI |
Modell | Linear | Nicht linear |
Annahmen | Schwach (für die Daten leicht zu treffen) | Stark (schwer von Daten zu erfüllen) |
Messinvarianz | Nein | Ja |
Invarianz der Testeigenschaften | Nein | Ja |
Skala der Ergebnisse | Zwischen 0 und dem Maximum im Test | Unendlichkeit |
Betonung | Test | Artikel |
Artikel-Test-Beziehung | Nicht angegeben | Kennlinie des Artikels |
Beschreibung der Elemente | Index für Schwierigkeit und Diskriminierung | Parameter a, b, c |
Messfehler | Typischer Messfehler für die gesamte Probe | Informationsfunktionen (variiert je nach Eignungsgrad) |
Probengröße | Es kann gut mit Proben zwischen ungefähr 200 und 500 Probanden arbeiten | Es werden mehr als 500 Fächer empfohlen |
So hängen beide Theorien der Tests zusammen. Obwohl es fast zeitgleich ist, scheint das klar zu sein TRI wurde als Reaktion auf die Einschränkungen oder Probleme geboren, die TCT entwickeln kann. Es scheint jedoch klar, dass die Forschung auf diesem Gebiet der Psychometrie noch einen langen Weg vor sich hat..
Psychologische Tests: Merkmale und Funktionsweise Die psychologischen Tests sind die Instrumente, die in der Psychologie verwendet werden, um die am Wissen interessierten Variablen zu messen. Lesen Sie mehr