Mara Santidrián Korff

5 April 2022

Kognitive Leistungstests in der Personalauswahl

In der Alltagspsychologie wird angenommen, dass es “soziale Kompetenz” gibt, nämlich die Fähigkeit, gut mit anderen Menschen zurechtzukommen. Ebenso wird angenommen, dass diese Fähigkeit klar von intellektuellen Fähigkeiten abzugrenzen ist. Aber was genau ist Intelligenz? 

“Intelligenz ist das, was ein Intelligenztest misst”, so der US-Psychologe Edward Boring. In der Personalauswahl werden häufig Intelligenztests (oder kognitive Leistungstest) eingesetzt, um  die kognitive Leistungsfähigkeit der Kandidat*innen isoliert von anderen Merkmalen (z.B. Geselligkeit) beurteilen zu können. Was es mit kongitiven Leistungstests auf sich hat und wie Du sie am besten für Deine Personalauswahl einsetzen kannst, erklären wir hier.

Geschichtlicher Hintergrund von Intelligenztests

Intelligenztest haben in der Psychologie eine lange Geschichte und eine große Entwicklung hinter sich. Francis Galton (1822 – 1911) gilt mit seinen sogenannten “mental tests” als Begründer der Intelligenzforschung. Er nahm an, dass man anhand der Geschwindigkeit der Sinneswahrnehmungen einen Rückschluss auf die Gedächtnisleistung ziehen könne. Seine Ergebnisse aus der Forschung konnten dies damals jedoch nicht bestätigten.

Seitdem entwickelten viele Forscher*innen unterschiedliche Annahmen, Methoden und Kriterien, um kognitive Leistung (oder Intelligenz) bestmöglich zu bestimmen und späteren (Lebens-)Erfolg vorhersagen zu können. Im Jahr 1912 begründete William Stern die moderne Intelligenzforschung und schuf den Begriff des sogenannten Intelligenzquotienten (auch bekannt als IQ), als den Quotienten aus dem Intelligenzalters und dem tatsächlichen Lebensalter. Auch diese Rechnung wurde seitdem modifiziert: beispielsweise 1939 vom rumänischen Psychologen David Wechsler. Er standardisierte den IQ-Test, sodass die eigene Altersgruppe als Referenzpunkt galt. Das heißt, ein IQ-Ergebnis ist immer altersabhängig. Dabei legte er den Mittelwert des IQs auf 100 und die Streuung (Standardabweichung) von 15 fest. Diese IQ-Skala wird auch heute noch verwendet, aber die Berechnung und Bewertung des IQ findet in anderer Form statt. 

Im Jahr 1904 entwickelte Charles Spearman (1836 – 1945) die Zwei-Faktoren-Theorie der Intelligenz. Dieser Theorie liegt die Annahme zugrunde, dass Intelligenz durch einen sogenannten “g-Faktor” und mehrere “S-Faktoren” gebildet wird. Dieser g-Faktor beschreibt einen generellen, alle Leistungsbereiche beeinflussenden Intelligenzfaktor (bestehend aus der Verarbeitungsgeschwindigkeit und der geistigen Kapazität), dem die S-Faktoren, also die bereichsspezifische Intelligenz für bestimmte Aufgaben, untergeordnet sind. Auch diese Theorie wurde nach ihrer Verbreitung weiterentwickelt, obwohl sie nie bestätigt wurde.

Beispielsweise wird eine Rechenaufgabe durch eine allgemeine Intelligenzfähigkeit (g-Faktor) und spezifischen Fähigkeiten, wie Rechenfähigkeit (S-Faktor) gelöst. 

Kongitive Leistungstests heute

Heute sind alle Intelligenztests altersspezifisch normiert, d.h. dass die Ergebnisse vor dem Hintergrund der eigenen Altersgruppe verglichen werden. Ob Kandidat*innen einen hohen oder niedrigen Wert erzielt haben, ist demnach immer in Relation zu ihrer Vergleichsgruppe zu interpretieren. Intelligenztests bilden die allgemeine Intelligenz und spezifische Intelligenzbereiche ab. Intelligenz wird häufig mit der mentalen Geschwindigkeit (mental speed), dem Arbeitsgedächtnis und dem Schul-, Studien-, oder Berufserfolg in Verbindung gebracht. Der aktuelle Forschungsstand bestätigt, dass eine starke Verbindung zwischen dem IQ und einer Vielzahl von Kriterien für ein erfolgreiche Lebensführung (Berufserfolg, Gesundheit, etc.) besteht.

Weit verbreitete Tests zur Intelligenzmessung sind die GMA (General mental ability) Tests. Wie der Name schon verrät, dienen sie der Erfassung der allgemeinen geistigen Fähigkeit, indem die verbalen, mechanischen, numerischen, sozialen und räumlichen Fähigkeiten getestet werden. GMA Tests stellten sich in der Vergangenheit als einer der validesten konstruktbasierten Prädiktoren (Vorhersagevariablen) für Arbeitsleistung und Berufserfolg heraus. Viele Studien und Meta-Analysen haben gezeigt, dass sie ausgezeichnete Prädiktoren für verschiedene berufsrelevante Kriterien sind, wie z.B. Bewertungen durch Vorgesetzte, Arbeitsproben, Erwerb von Berufswissen, Noten, Beförderungen, Verkäufe und Löhne.

Wie setzt man kognitive Leistungstests am besten für die Personalauswahl ein?

Wie oben erwähnt, werden Intelligenztests oft in der Personalauswahl eingesetzt, um möglichst die besten Kandidat*innen einstellen zu können. Wer einen Intelligenztest verwenden möchte, um Kandidat*innen besser einzuschätzen und zu filtern, sollte jedoch einige Aspekte beachten:

  1. Culture-Fair-Tests (kulturfaire Tests)

Trotz ihrer hohen Vorhersagekraft stehen Intelligenztests stehen teilweise wegen ihrer sprachgebundenen und sozialisationsbedingten Strukturen und Inhalte in der Kritik. Die Ergebnisse vieler Aufgaben werden oft durch kulturelle Faktoren wie z.B. Sprache, Bildungsstand oder soziale Herkunft beeinflusst. Diese Einflüsse sollten in einem Intelligenztest weitestgehend reduziert werden, um Intelligenz so gut wie möglich frei von kulturbedingten Merkmalen messen zu können. Erst durch sogenannte Culture-Fair-Tests (auch kulturfreie Tests genannt) kann ein Intelligenztest als kulturfair bezeichnet werden. Häufig angewendete sprachfreie und kulturfaire Intelligenztest sind zum Beispiel der der Bochumer Matrizentest (BOMAT), der die allgemeine Intelligenz misst (basierend auf Spearmans g-Faktor) oder der CFT-20 R, der ebenfalls die Grundintelligenz misst. Ein anderer weit verbreiteter Intelligenztest ist der Raven Progressive Matrices (RPM) zur Messung der intellektuelle Entwicklung und logischem Denken mittels Matrizenaufgaben.

Übrigens sind unter anderem die hier genannten Tests bei unserem Kooperationspartner Hogrefe erhältlich – und über die Integration auch bald in Applysia direkt verfügbar.

  1. Art des Tests

Man unterscheidet zwischen zwei Arten von Leistungstests, die die kognitiven Fähigkeiten auf unterschiedliche Weise bestimmen. Zum einen messen Geschwindigkeitstest (Speed Tests) die Schnelligkeit mit der die Aufgaben bearbeitet werden. Es handelt sich meistens um einfache Aufgaben, die mit ausreichend Zeit von der Mehrheit der Kandidat*innen gelöst werden könnten. Der Fokus liegt hier auf der begrenzten Bearbeitungszeit. Bearbeitet ein/e Kandidat*in in derselben Zeit mehr Aufgaben als ein/e andere/r, erreicht er*sie eine höhere Punktzahl. Schlechtere Leistungen sind hingegen eher schwierig zu interpretieren – hier ist es unklar, ob es an der mangelnden Fähigkeit von Kandidat*innen oder an einer zu langsamen oder zu sorgfältigen Bearbeitung liegt. Ein Beispiel für Geschwindigkeitstests stellen Konzentrationstests dar.

Die zweite Art von Leistungstests sind die  sogenannten Niveautests (Power Tests), die die Richtigkeit und Qualität der Lösung einer Aufgabe messen. Durch den hohen und sukzessiv steigenden Schwierigkeitsgrad können auch ohne Zeitbegrenzung nicht alle Kandidat*innen die Aufgaben lösen. Hierbei ist entscheidend, wie viele und welche Aufgaben richtig gelöst wurden, da sich die Aufgaben in ihrer Schwierigkeit unterscheiden. Ein Beispiel für Niveautests sind Wissenstests ohne Zeitbegrenzung.

Intelligenztest bilden eine Mischung aus beiden Arten der Leistungstests. Sowohl die kognitive Geschwindigkeit als auch die Richtigkeit der Aufgabenbearbeitung werden erfasst.

  1. Art des Antwortformats

Auch bei der Wahl des Antwortformates gibt es verschiedene Möglichkeiten:

Freies vs. gebundenes Antwortformat

  1. Freies Antwortformat

Freies Antwortformat (Aufgaben werden ohne Vorgaben beantwortet)

Beim freien Antwortformat beantworten die Kandidat*innen die Aufgaben ohne Vorgaben. Sie entscheiden selbstständig wie und was sie antworten. Die Antworten werden danach in “korrekt” und “inkorrekt” klassifiziert. Bei dem freien Antwortformat ist die Auswertungsobjektivität nicht ganz unproblematisch, da mehrere Auswerter*innen verschiedene Auswertungsstrategien anwenden und unterschiedliche Sichtweisen auf Form und Inhalt haben könnten. So könnte ein/e Auswerter*in A die Antwort eines/r Kandidat*in als vollständig und sehr gelungen bewerten, während ein/e andere Auswerter*in B die Antworten anders beurteilt und somit zu anderen Schlussfolgerungen kommen würde. Ein Vorteil des freien Antwortformats ist die hohe Akzeptanz von Kandidat*innen. Durch das freie Antwortformat haben die Kandidat*innen einen großen Antwortspielraum und werden in ihrer Aufgabenbeantwortung nicht eingeschränkt. Beispielsweise können Kurzaufsatzaufgaben oder Ergänzungsaufgaben hier eingesetzt werden. 

  1. Gebundenes Antwortformat 

Gebundenes Antwortformat (Multiple Choice Aufgaben) 

Das gebundene Antwortformat bietet Kandidat*innen vorgegeben Antwortalternativen, aus denen sie sich für jeweils eine Option entscheiden müssen. Die Auswertung dieses Antwortformates ist deutlich ökonomischer. Sie kann manuell, computergestützt oder komplett digital erfolgen. Die Auswertungsobjektivität fällt ebenfalls höher aus, da Kandidat*innen, die die richtige Antwort gewählt haben, zweifelsohne eine höhere Punktzahl erzielen. Hier wird zwischen verschiedenen Aufgabentypen gewählt (z.B. Ordnungsaufgaben, Zuordnungsaufgaben, Umordnungsaufgaben, etc.), die entweder eine Produktionsstrategie oder eine Falsifikationsstrategie erfordern. 

Bei der Produktionsstrategie generieren die Kandidat*innen in Gedanken die Antworten selbstständig und kreuzen die entsprechende Antwortalternative an. Das ist beispielsweise bei Zuordnungsaufgaben der Fall. Hier wählen Kandidat*innen die richtige Kombination aus zwei Elementen (z.B. Zahlen, Wörter, Formen) und entscheiden sich dann für die entsprechende Option . Eine Beispielaufgabe lautet hier: “Ordnen Sie jedem Land die korrekte Hauptstadt zu”. 

Bei der Falsifikationsstrategie werden die Antwortmöglichkeiten nach dem Ausschlussverfahren auf ihre Richtigkeit oder Plausibilität geprüft, bis nur noch eine Option übrig bleibt. Kandidat*innen können auf unterschiedliche Weise mit beiden Strategien erfolgreich sein. Welche der beiden Strategien angewendet wurde ist ohne explizites Nachfragen nicht zu überprüfen. 
  1. Durchführungsform

Computergestützt vs. Pen & Paper Methode 

Moderne Technologien ermöglichen es HRler*innen und Personalverantwortlichen Kandidat*innen und Tests einfacher vorzubereiten, zu administrieren, die Daten zu verarbeiten, auszuwerten und zu interpretieren. Eine computergestützte Personalauswahl ermöglicht zudem den Einsatz von sogenannten computer-adaptiven Tests (CATs). Ein großer Vorteil von CATs gegenüber herkömmlichen analogen Tests ist die Individualisierbarkeit des Testinhalts an die Kandidat*innen. 

Herkömmliche Tests bestehen aus einem festgelegten Inhalt (Items), der jedoch nicht an das Leistungsniveau der Kandidat*innen angepasst werden kann. Alle Kandidat*innen bearbeiten denselben Test, unabhängig von ihrem individuellen Niveau. 

Beispielsweise fallen Kandidat*in A die Aufgaben des Tests extrem leicht, während Kandidat*in B komplett überfordert ist.

CATs lösen dieses Problem, indem Kandidat*innen ihrem Leistungsniveau entsprechende Aufgaben bearbeiten müssen. Der Schwierigkeitsgrad der Aufgaben ist dabei individuell an das geschätzte Fähigkeitsniveau der Kandidat*innen angepasst. Anders als bei herkömmlichen Tests werden auf diese Weise Aufgaben gestellt, die viele Informationen über das Leistungsniveau der Kandidat*innen zulassen. Die Vorteile von computergestützten Tests sind vielseitig: Die Testökonomie (Kosten-Nutzen des Tests) ist besonders hoch, da Kandidat*innen nur Fragen beantworten, die viele Informationen über ihren Leistungsstand zulassen. 

Zurück zu unseren Beispielkandidat*innen: Kandidat*in A mit einem hohen geschätzten Fähigkeitsniveau überspringt in diesem Fall die leichteren Aufgaben und erhält seinem*ihrem Fähigkeitsniveau angemessene Optionen, während Kandidat*in B, der/die sich mit den schwierigeren Aufgaben überfordert fühlt, leichte Aufgaben erhält und keine Aufgaben, die weit über seinem/ihrem Fähigkeitsniveau liegen, bearbeiten muss. 

Zudem können Kandidat*innen aufgrund der Individualisierung die Antworten ihres*r Nachbar*in nicht abschreiben und Kandidat*innen, die den Test zu einem späteren Zeitpunkt bearbeiten, keinen Vorteil erzielen, indem sie auf Erfahrungsberichte von anderen zurückgreifen.

Kognitive Leistungstests oder Intelligenztests haben in der Vergangenheit gezeigt, dass sie ein zuverlässiger Indikator für Berufserfolg sind. Beachtet man, dass ein gewisses Maß an Intelligenz für die Lernfähigkeit, berufliches Wissen und die Fähigkeiten Probleme zu erkennen und zu lösen, erforderlich ist, sind die Ergebnisse aus zahlreichen Studien nachvollziehbar. Nichtsdestotrotz haben sich Intelligenztests stark weiterentwickelt, sodass Personalverantwortliche viele Alternativen haben, wie sie Intelligenztests für ihre Personalauswahl einsetzen. Dabei ist die Qualität der verwendeten Tests ausschlaggebend für die Validität (Zuverlässigkeit) der Ergebnisse. Alles zum Thema valider, effizienter und digitaler Personalauswahl findest Du auf www.applysia.de.

de_DEGerman