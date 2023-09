Körber-Preis 2023 Cordelia Schmid lehrt Computer das Sehen Stand: 08.09.2023 06:19 Uhr

Die Informatikerin Cordelia Schmid erhält den Körber-Preis für ihre Forschung in der Computer-Bildverarbeitung. Mit dem Preisgeld will sie eine Art sehfähigen Konkurrenten zum Chatbot ChatGPT entwickeln.

Von Lilly Zerbst, SWR

Wer online nach Bildern sucht, nutzt unbemerkt die innovativen Algorithmen von Cordelia Schmid. Die deutsche Informatikerin trug mit ihrer Forschung maßgeblich dazu bei, dass Computer blitzschnell Bilder erkennen und Objekte und Muster darin finden können.

In Zukunft könnte ihre Technologie dabei helfen, dass Computer optische Reize nicht nur erkennen, sondern auch inhaltlich verstehen und sinnvoll reagieren können. Mit dieser Fähigkeit könnten eines Tages beispielsweise Pflegeroboter Patienten assistieren, autonome Fahrzeuge Hindernisse erkennen oder Ärztinnen und Ärzte bei der medizinischen Diagnostik unterstützt werden, so die Visionen von Schmid.

Für ihre innovativen Ansätze und vielversprechenden Methoden wird sie nun mit dem renommierten Körber-Preis geehrt. Mit einer Million Euro Preisgeld gehört er zu den weltweit höchstdotierten Forschungspreisen.

Akademische Laufbahn der Preisträgerin

Cordelia Schmid studierte Informatik an der Universität Karlsruhe, dem heutigen KIT. Für ihre Promotion im Bereich der Computer-Bildsuche erhielt sie von ihrem damaligen Institut in Grenoble, Frankreich, den Preis für die beste Arbeit. Sie habilitierte am französischen Nationalen Forschungsinstitut für digitale Wissenschaften und Technologie (Inria) und ist dort seit 2004 Forschungsdirektorin.

Pionierarbeit in der Computer-Bilderkennung

Bereits in ihrer herausragenden Promotion am Institut National Polytechnique in Grenoble 1996 entwickelte Schmid grundlegend neue Verfahren der Bilderkennung. Damals konnten Computer zwar einfache geometrische Formen erkennen. Sie scheiterten aber, wenn die Formen teilweise verdeckt oder aus einer anderen Perspektive gezeigt wurden.

Um dieses Problem zu beheben, entwickelte Cordelia Schmid in den Folgejahren ein Verfahren, bei dem der Computer nicht nur das Bild als Ganzes erfasst, sondern auch sogenannte "markante Bildpunkte" identifiziert. Diese bieten dem System Orientierung, selbst wenn Teile des Bildes nicht erkennbar sind. Das Verfahren brachte der damals noch rudimentären Bilderkennung einen enormen Schub.

Es dient heute als Grundlage für die schnelle Bildsuche im Internet: Lässt man ein solches System beispielsweise nach dem Eiffelturm suchen, kann es anhand von charakteristischen Schlüsselpunkten aus Milliarden von Bildern diejenigen finden, die das gesuchte Objekt zeigen - selbst wenn dieses zum Beispiel teilweise durch einen Baum verdeckt ist, das Bild verzerrt ist oder aus einer noch nie zuvor gezeigten Perspektive fotografiert wurde.

Künstliche Intelligenz kann Handlungen vorhersagen

Basierend auf ihren Bilderkennungs-Algorithmen bringt Schmid heute KI-Systemen bei, Videoinhalte zu interpretieren und sogar Handlungen vorherzusagen. Dazu lässt sie ein KI-System namens VideoBert aktuell an Kochvideos aus dem Internet trainieren.

Im Training werden kurze Bild- oder Tonsequenzen aus den Videos herausgenommen. Die KI soll diese Lücken dann wieder sinnvoll füllen. VideoBert "sieht" beispielsweise ein Video zum Grillen und soll dann das Wort "Steak" passend zum gezeigten Bild ergänzen oder das fehlende Bild eines Steaks generieren, sobald das Wort fällt.

Mit diesem Training ist es mittlerweile gelungen, dass VideoBert bereits durch das "Sehen" der Zutaten erraten kann, welches Gericht im Video gekocht wird. Kommende Versionen des KI-Systems sollen sogar in der Lage sein, eigene Rezepte auf Basis gesehener Kochvideos zu schreiben.

Sehfähiger Konkurrent zu ChatGPT

Anders als ChatGPT kann VideoBert nicht nur Sprache verarbeiten und sinnvolle Ergänzungen rückmelden, sondern auch Bildinformationen interpretieren und mit dem Gesprochenen verknüpfen. Basierend auf diesem Bild- und Tonverständnis will Cordelia Schmid eine Art "sehfähigen" Konkurrenten zu ChatGPT entwickeln, der mit der physischen Welt interagieren kann - zum Beispiel einen Roboter, der gesprochene Kommandos verstehen kann und daraufhin handelt. Solche Roboter könnten in Zukunft in der Pflege eingesetzt werden, so die Vision der Preisträgerin. Mit den Mitteln der Körber-Stiftung möchte sie diesen Zielen nun näherkommen.

Preis fördert Forschung in Europa

Seit 1985 wird der Körber-Preis jährlich an Forschende in Europa verliehen, die in verschiedenen naturwissenschaftlichen Disziplinen innovative und vielversprechende Forschungsarbeit leisten. Die Preisträgerinnen und Preisträger erhalten ein Preisgeld von einer Million Euro. Damit sollen im jeweiligen Fachgebiet neue Forschungsprojekte in Europa vorangetrieben werden, die weitere Durchbrüche erwarten lassen. Der Körber-Preis gehört er zu den weltweit höchstdotierten Forschungspreisen. Bisher wurden acht Preisträgerinnen und Preisträger später auch mit dem Nobelpreis geehrt.