KI zur Persönlichkeitsanalyse Fragwürdige Personalauswahl mit Algorithmen

Anbieter neuer Software versprechen Vorstellungsgespräche, die vorurteilsfreier ablaufen sollen: Eine KI erstellt Persönlichkeitsprofile von Bewerbern anhand kurzer Videos. Doch die Technologie hat Schwächen, wie eine Analyse des BR zeigt.

Von Elisa Harlan, Uli Köppen, Oliver Schnuck und Lisa Wreschniok, BR

Mit Brille wirkt die Test-Bewerberin plötzlich weniger "gewissenhaft" als ohne, ihr Konkurrent erscheint vor einem Bücherregal sitzend "verträglicher" als vor einer weißen Wand. Zu diesen Ergebnissen kommt die Künstliche Intelligenz (KI) eines Münchner Start-Ups, mit der Datenjournalisten des Bayerischen Rundfunks zusammen mit dem Politmagazin report München verschiedene Experimente durchgeführt haben.

In einem Studio wurden für das Experiment verschiedene Bewerbungsvideos simuliert. Bild: BR-Recherche/ report München

Die KI-basierte Software soll anhand kurzer Videointerviews ein Persönlichkeitsprofil erstellen, aus dem Unternehmen ablesen können, ob eine Person auf die ausgeschriebene Stelle passt - oder eben nicht. Das Versprechen: Nicht nur schneller die richtigen Mitarbeiter finden, sondern auch die persönlichen, möglicherweise voreingenommenen Präferenzen eines Personalers im Bewerbungsprozess vermindern. Doch die Recherche des BR zeigt: Der Einsatz von KI zur Erstellung eines Persönlichkeitsprofils ist fragwürdig.

Deutsche KI-Unternehmen heiß begehrt

Seit einigen Jahren drängen Unternehmen auf den Markt, die Künstliche Intelligenz im Personalmanagement einsetzen wollen. Die jetzt untersuchte Software des Start-ups Retorio aus München, das nach eigenen Angaben namhafte Unternehmen aus dem DAX zu seinen Kunden zählt, verspricht, die Software könne, "Verhaltsweisen erkennen und darauf basierend ein Persönlichkeitsprofil erstellen".

Außerdem, so das Start-up, werde der Bewerbungsprozess "nicht nur schneller, sondern auch objektiver und fairer gestaltet". Die potentiellen neuen Mitarbeiter erhalten nach dem sogenannten Big-Five-Modell Bewertungen anhand von Sprache, Mimik und Gestik. Das daraus abgeleitete Persönlichkeitsprofil setzt sich aus Dimensionen wie Gewissenhaftigkeit, Offenheit oder Neurotizismus zusammen.

Experiment deutet auf Schwachstellen der KI hin

Bei den systematischen Versuchen des BR zeigten sich überraschende Ergebnisse, die den Einsatz von KI für Personalauswahl fragwürdig erscheinen lassen. Mit elf Testpersonen haben die Journalisten für das Experiment mehrere hundert Videos produziert, die von der KI anschließend bewertet wurden. Die Ergebnisse unterliegen augenscheinlich Schwankungen: Wechselt eine Probandin beispielsweise von Bluse und Jacket zu einem T-Shirt, verändert die Frisur oder legt die Brille ab, verschieben sich die Ergebnisse der Persönlichkeitsbewertung teilweise deutlich.

Die KI reagiert auch auf rein technische Veränderung eines Videos, wie ein weiterer Versuch der Datenjournalisten zeigt: Bei einem Austausch des Hintergrunds, erhält die Testperson für ein und denselben Bewerbungsclip eine andere Persönlichkeitseinschätzung. Statt "bodenständig" erscheint ein Proband beispielsweise plötzlich "interessiert", aus "zurückhaltend" wird "lebhaft" - lediglich mit einer Bücherwand im Hintergrund statt mit einer weißen Wand. Ähnliche unerwartbare Veränderungen ergeben sich bei leicht veränderten Helligkeits- oder Sättigungswerten im Video.

Zu den Abweichungen bei technischen Veränderungen äußert sich das Unternehmen auf Anfrage nicht im Detail, verweist aber darauf, dass der Bewerber selbst über die Qualität der hochgeladenen Videos entscheiden kann. Die veränderten Persönlichkeitsprofile, die die KI bei Outfit-Wechseln errechnet, verteidigt das Unternehmen: "Wie bei einem normalen Bewerbungsgespräch auch, fließen solche Faktoren in die Bewertung mit ein." Man messe die Wirkung, die Bewerber auf andere Menschen haben, so sei der Algorithmus trainiert.

Vorbehalte beim KI-Einsatz zur Persönlichkeitsbewertung

Uwe Kanning, Professor für Wirtschaftspsychologie an der Hochschule Osnabrück, stellt den Mehrwert einer Software, die sich von Äußerlichkeiten wie Outfits irritieren lässt, in Frage: "Die Software müsste eigentlich in der Lage sein, diese Informationen herauszufiltern, um besser zu sein, als das Bauchurteil irgendeines Menschen, der ebensolchen Einflüssen auf den Leim geht." Das Start-up gibt an, systematische Voreingenommenheiten herausrechnen zu können, wie den Eindruck von Alter, Geschlecht und Ethnie.

Psychologieprofessor Kanning hat Zweifel an der Nützlichkeit der Software. Bild: BR-Recherche/ report München

Informatikprofessorin Katharina Zweig von der Universität Kaiserslautern beunruhigen die Ergebnisse des BR-Versuchs. Als Mitglied der Enquete-Kommission Künstliche Intelligenz der Bundesregierung hat sie sich für eine KI nach europäischem Standard ausgesprochen. Auch wenn sie den Einsatz von KI grundsätzlich positiv sieht - im Bereich Persönlichkeitsbewertung hat Katharina Zweig Vorbehalte. "Grundsätzlich ist die künstliche Intelligenz ein wunderbares Werkzeug, und wir sollten sie nutzen", sagt Zweig. Schwierig werde es, wenn man versuche, menschliches Verhalten von einer KI beurteilen zu lassen.

Einsatz vor allem am US-Markt

In den USA wird KI zur Persönlichkeitseinschätzung im Bewerbungsprozess seit Jahren eingesetzt: Marktführer Hirevue arbeitet nach eigenen Angaben mit 700 Firmen. Sogar von US-Behörden werde die Software eingesetzt. Doch auch in den USA werden immer wieder Zweifel an der Wissenschaftlichkeit solcher KI-Systeme laut. Nach anhaltender Kritik gab Hirevue Anfang des Jahres bekannt, künftig auf die Analyse von visuellen Daten zu verzichten, es soll nur noch die Audiospur der Bewerbungsinterviews analysiert werden. Diese Technik, so das Unternehmen, erscheine nach eingehenden Studien vielversprechender.

Für die Versuche wurde das Angebot der kostenfreien Trialversion von Retorio genutzt. Die Experimente fanden Ende des Jahres 2020 statt, die Ergebnisse erheben keinen Anspruch auf Allgemeingültigkeit. Näheres zur Methodik hier.

