Bias in der Personalauswahl – Part 3

Ein Interview mit Marvin Neumann

Marvin Neumann, Arbeits- und Organisationspsychologe und Doktorand für Psychometrie und Statistik an der Universität Groningen, diskutiert heute mit unserem Co-Founder Richard Hossiep über das Thema Urteilsfindung in der Personalauswahl und stellt zudem seine brandneuen Erkenntnisse aus der Forschung vor. Zum Schluss hören wir nochmal seine Best-Practices, um gezielt in der Datenauswertung und -gewichtung objektiv und datenbasiert zu arbeiten und so ein möglichst fehlerfreies Urteil zu erreichen.

Viel Spaß beim Hören!

In einem Assessment-Center geraten Beobachter*innen in viele Auswahl- und Entscheidungssituationen, in denen sie mehrere Übungen, Verhalten und Kompetenzen berücksichtigen müssen. Meist werden diese Informationen mithilfe verschiedener Instrumente gemessen, etwa ein Leistungstest, ein Interview oder eine Postkorbaufgabe zum erfassen mehrerer Dimensionen. Bei der Datenkombination gibt es in der Wissenschaft zwei Arten: die mechanische und die holistische Datenkombination. Was kann man unter diesen Arten verstehen?

Marvin: “Unter der holistischen Kombination verstehen wir eine gesamtheitliche Betrachtung der Informationen im Kopf, ohne auf explizite Regeln zurückzugreifen. Die Informationen werden dabei einfach zusammengeführt und ausgewertet. Bei der mechanischen oder statistischen Kombination dagegen folgt unser Urteil einer expliziten Entscheidungsregel, d.h. wir bestimmen vor der Datenerhebung welche Informationen wie gewichtet werden. Ein großes Missverständnis herrscht hier häufig im Glauben, dass einer mechanischen Datenkombination standardisierte Messinstrumente vorausgesetzt sind. Dies ist nicht der Fall – für die mechanische Datenkombination eignen sich auch subjektive Datenerhebungsmethoden, wie beispielsweise ein Interview. Wichtig ist hier nur die Quantifizierung der Informationen und die Nutzung einer expliziten Entscheidungsregel.”

Heißt das, dass holistische Datenkombination gleichzusetzen ist mit unserem Bauchgefühl?

Marvin: “So genau würde ich das nicht sagen. Das Bauchgefühl ist schon ein Extrem. Wenn ich die Entscheidung in meinem Kopf fälle, kann man von einer holistischen Kombination ausgehen, auch wenn ich davor meine Messinstrumente gut ausgewählt habe.”

In eurem Paper “A Tutorial on Mechanical Decision Making for Personnel and Educational Selection” habt ihr vier Schritte aufgestellt, um an eine möglichst fehlerfreie Urteilsfindung zu gelangen. Was beinhalten diese Schritte und worauf sollte man achten, um die geeignetste Person auszuwählen?

Marvin: “Wir haben unseren Artikel veröffentlicht in der Hoffnung, den Gap zwischen Theorie und Praxis schließen zu können, gerade bei einem so unterschätzten Thema. Der erste Schritt umfasst die Kriterienbeschreibung – was möchte man vorhersagen? Beispielsweise Job-Performance oder Jobzufriedenheit. Im zweiten Schritt wählt man seine Prädiktoren (also Instrumente wie z.B. Interview, Persönlichkeitsfragebogen etc.), die bestenfalls valide das Zielkriterium vorhersagen können. Man kann beispielsweise wissenschaftliche Literatur heranziehen, um die besten Prädiktoren zu finden. Im dritten Schritt wendet man die Methoden an, d.h. die tatsächliche Durchführung des Tests, Interviews oder der Rollensimulation zum Beispiel. Im letzten Schritt kommt es dann zur Datenkombination. Hier greift dann die mechanische Kombination anhand einer expliziten Entscheidungsregel.”

Wie relevant ist die Kombination wirklich? Reicht es theoretisch nicht, wenn ich valide Prädiktoren benutzte? Muss ich mir denn dann noch überlegen, wie ich die Daten kombiniere?

Marvin: “Auf jeden Fall! Hinsichtlich der prädiktiven Validität findet man in der Wissenschaft viele Hinweise darauf, dass die mechanische Kombination manchmal genauso gut und häufig besser als die holistische Kombination ist. Das ist darauf zurückzuführen, dass wir in der holistischen Entscheidungsfindung nicht durchgehend und über mehrere Kandidat*innen konsistent mit unseren Entscheidungen sind.”

Woher weiß ich denn, wie ich die Daten kombinieren und gewichten soll?

Marvin: “Es gibt verschiedene Ansätze. Klassischerweise werden Regressionsanalysen eingesetzt, d.h. wir bestätigen, dass unser Prädiktor unser Zielkriterium valide vorhersagt. Basierend auf den Ergebnissen ziehen wir unsere Gewichtung. Jedoch ist dieser Ansatz nicht immer anwendbar. Eine andere Möglichkeit ist die Einheitsgewichtung. Dort gewichten wir alle Daten und Instrumente gleich, und zwar mit 1. Die Forschung zeigt, dass besonders bei guten Prädiktoren die Einheitsgewichtung sehr erfolgreich ist und sogar die Regressionsanalyse übertreffen kann.”

Das bedeutet, die Einheitsgewichtung ist bei validen Prädiktoren der beste Weg, sofern ich das konsistent über alle Kandidat*innen mache, richtig?

Marvin: “Ganz genau. Eine Studie fand, dass mithilfe von ähnlich validen Prädiktoren, eine willkürlichen aber konsistenten Gewichtung über alle Kandidat*innen hinweg in den meisten Fällen sogar valider war als Expertenurteile von Personalberater*innen!”

Hast du noch konkrete Empfehlungen für die Praxis?

Marvin: “Ein großen Einfluss hat natürlich die Validität der Prädiktoren. Für eine valide Entscheidungsfindung wäre eine gute Faustregel: Benutze valide Prädiktoren und die Einheitsgewichtung! Ist das aber aus irgendeinem Grund nicht möglich, und nicht valide Prädiktoren werden verwendet, dann empfiehlt es sich ein kleines Gewicht für diesen Prädiktor zu verwenden. Außerdem könnte man immer die/den Personaler*in nach der Gewichtung fragen, denn selbst das kann zu validieren Entscheidungen führen, als eine rein holistische Datenkombination.”

Vielen Dank für das Interview Marvin!

Share on twitter
Share on linkedin