Vanessa Link
•5 November 2025
Kann KI Persönlichkeit erkennen? Chancen und Grenzen automatisierter Video-Interviews
Das Potential: Mehr Objektivität in der Personalauswahl?
Traditionelle Persönlichkeitsbewertungen basieren oft auf Fragebögen. Allerdings neigen Menschen in Bewerbungssituationen dazu, sich möglichst vorteilhaft darzustellen. Dadurch sind die Ergebnisse anfälliger für Verfälschungen.
Genau hier setzen automatisierte Video-Interviews an. Mithilfe von KI werden Sprache, Stimme und Mimik analysiert, um daraus Rückschlüsse auf die Persönlichkeit zu ziehen. Statt auf Selbstauskünfte stützen sich diese Verfahren auf beobachtbares Verhalten, was eine objektivere Grundlage schaffen könnte.
Die zentrale Frage: Kann KI wirklich Persönlichkeit beurteilen?
Die Idee klingt verlockend: Bewerber*innen beantworten Fragen vor der Kamera, Algorithmen werten das Gesagte und Gezeigte aus und am Ende steht ein Persönlichkeitsprofil. Dabei ist die entscheidende Frage weniger, ob Technik Persönlichkeit messen kann, sondern was sie dabei wirklich erfasst.
Werden in den Interviews tatsächlich verhaltensrelevante Hinweise (Cues) sichtbar, die zuverlässig mit stabilen Persönlichkeitsmerkmalen zusammenhängen? Oder identifiziert KI nur oberflächliche Muster wie etwa Redeweise, Betonung oder Blickrichtung, die zwar statistisch auffällig, aber psychologisch wenig aussagekräftig sind?
Die Studie: Ein Reality-Check
Hickman et al. (2022) untersuchten, wie zuverlässig und valide automatisierte Video-Interviews die Big Five Persönlichkeitsmerkmale (Offenheit, Gewissenhaftigkeit, Extraversion, Verträglichkeit und emotionale Stabilität) einschätzen.

Die Forschenden entwickelten mehrere KI-Modelle, die aus verbalen, paraverbalen (Stimme, Sprechtempo) und nonverbalen (Mimik, Blickverhalten) Merkmalen Rückschlüsse auf die Persönlichkeit zogen. Getestet wurden diese Modelle anhand von über 1.000 simulierten Vorstellungsgesprächen mit Studierenden und sogenannten Mechanical-Turk-Arbeitnehmenden. Diese sind Teilnehmende einer Onlineplattform, auf der Personen gegen Bezahlung kleine Aufgaben absolvieren oder an Studien teilnehmen. Es handelte sich also nicht um reale Auswahlgespräche, sondern um kontrollierte Simulationen, in denen die Versuchspersonen Bewerbungssituationen nachspielten.
Verglichen wurden die Ergebnisse mit klassischen Selbstauskünften und mit Einschätzungen menschlicher Beobachter*innen.
Die Ergebnisse: Ein gemischtes Bild
- Schwache Übereinstimmung mit Selbstauskünften: Automatisierte Video-Interviews konnten die Selbstauskünfte der Befragten nur schlecht abbilden. Insbesondere für die Merkmale Gewissenhaftigkeit (r = .09), Offenheit (r = .15) und emotionale Stabilität (r = .20) waren die Übereinstimmungen niedrig. Dies deutet darauf hin, dass die KI-basierte Methode und die Selbstbeurteilung unterschiedliche Aspekte der Persönlichkeit erfassen.
- Stärkere Übereinstimmung mit Fremdeinschätzungen: KI analysiert sichtbares Verhalten, also Informationen, die auch menschliche Beobachter*innen zur Einschätzung heranziehen. Daher zeigten die KI-Modelle deutlich bessere Ergebnisse, wenn sie auf Urteile von Beobachter*innen statt auf Selbstauskünften trainiert wurden. Besonders gut funktionierte dies bei Merkmalen, die sich im Verhalten deutlich ausdrücken, wie etwa Extraversion (r = .33) oder auch Verträglichkeit (r = .30).

- Teilweise konsistente Ergebnisse: Für einige Merkmale, insbesondere Extraversion und in geringerem Maße Gewissenhaftigkeit, zeigten die KI-Modelle eine moderate Test-Retest-Reliabilität. Wenn Personen zu unterschiedlichen Zeitpunkten ein Interview führten, lieferte die KI bei diesen Merkmalen ähnliche Einschätzungen. Bei weniger direkt beobachtbaren Eigenschaften wie emotionaler Stabilität oder Offenheit fielen die Ergebnisse dagegen deutlich schwankender aus. Das deutet darauf hin, dass solche Merkmale im beobachtbaren Verhalten weniger stabil zum Ausdruck kommen und damit für KI-basierte Analysen schwerer zugänglich sind.
- Aber auch Risiken: Automatisierte Video-Interviews erfassen in erster Linie sichtbares Verhalten, also Aspekte wie Wortwahl, Sprechtempo, Stimmlage, Blickrichtung oder Mimik. Diese Merkmale können jedoch stark durch den kulturellen Hintergrund, die sprachliche Ausdrucksfähigkeit oder die technische Erfahrung beeinflusst werden. So kann etwa ein zurückhaltender Kommunikationsstil, ein deutlicher Akzent oder ein unsicherer Blickkontakt von der KI fälschlicherweise als geringere Extraversion oder emotionale Instabilität interpretiert werden. Damit besteht das Risiko, dass Bewerber*innen nicht aufgrund ihrer tatsächlichen Persönlichkeit oder Eignung bewertet werden. Dies kann unbeabsichtigte Biases and Diskriminierungseffekte zur Folge haben.
Bedeutung für die Praxis
Automatisierte Video-Interviews sind kein Ersatz für menschliche Beurteilung, können aber in bestimmten Situationen echten Mehrwert bieten. Entscheidend ist, wie und wofür sie eingesetzt werden:
Sinnvoll sind sie, wenn …
- viele Bewerbungen in kurzer Zeit gesichtet werden müssen und eine erste, strukturierte Vorauswahl nötig ist,
- sichtbares Verhalten wie Kommunikationsstil, Ausdrucksfähigkeit oder Kundeninteraktion relevant für die Rolle ist,
- sie ergänzend zu etablierten Verfahren wie strukturierten Interviews oder psychologisch validierten Tests genutzt werden,
- und wenn das Verfahren transparent gestaltet ist, also Bewerber*innen wissen, welche Daten erhoben und wie sie interpretiert werden.
Weniger geeignet sind sie, wenn …
- die zu besetzende Position hohe psychologische Passgenauigkeit erfordert (z. B. Führung, Beratung),
- and cultural diversity groß ist oder auch nonverbale Verhaltensnormen stark variieren.
The Risiko solcher Fehlinterpretationen ist überall gegeben, wo die Trainingsdaten der KI nicht the tatsächliche Vielfalt der Bewerber*innenpopulation abbilden – also auch innerhalb eines Landes, wenn etwa Dialekte, Akzente oder Kommunikationsstile stark variieren.
Handlungsempfehlung
Am wirkungsvollsten sind automatisierte Video-Interviews in einer kombinierten Diagnostikstrategie, die auf mehreren, validierten Informationsquellen beruht:
- Structured Interviews zur Beurteilung berufsrelevanter Kompetenzen,
- valide Persönlichkeits- oder Eignungstests für stabile Merkmale,
- and automatisierte Video-Interviews als ergänzendes Instrument zur systematischen Verhaltensbeobachtung.
Wichtig: Die Studie von Hickman et al. (2022) basiert auf simulierten Interviews mit Personen, die keine echten Bewerbungsentscheidungen oder Konsequenzen zu erwarten hatten. Ihr Verhalten unterscheidet sich daher vermutlich von dem realer Bewerber*innen, die unter höherem Druck stehen und strategischer auftreten. Von daher gibt die Studie eine erste Indikation, ist aber kein endgültiger Nachweis.
Das bedeutet: Die bisherigen Befunde zeigen, dass die Technologie prinzipiell funktioniert. Es ist aber noch nicht belegt, dass KI in echten Auswahlprozessen zuverlässig und fair arbeitet.
Quelle: Hickman, L., Bosch, N., Ng, V., Saef, R., Tay, L. & Woo, S. E. (2022). Automated video interview personality assessments: Reliability, validity, and generalizability investigations. Journal of Applied Psychology, 107(8), 1323–1351. https://doi.org/10.1037/apl0000695
Wenn ihr wissen wollt, wie wir bei Applysia mit dem Thema KI in Bezug auf Fairness und Transparenz in der Personalauswahl umgehen, meldet euch bei uns! Weitere Informationen zu digitalen Assessments und Applysia findet ihr unter www.applysia.de.