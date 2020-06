Google zeigt Trends zum Suchverhalten seiner Nutzer: Forscher, Journalisten und Ermittler vertrauen darauf. Eine Analyse zeigt aber, dass die Daten widersprüchlich sind und kaum ernsthafte Rückschlüsse zulassen.

Von E. Köhler, Isabel Lerch, Marvin Milatz und Jan Strozyk, NDR

Unter dem Stichwort "Google Trends" stellt der Tech-Konzern öffentlich abrufbare Statistiken zum Suchverhalten seiner Nutzerinnen und Nutzer ins Internet. "Wenn ihr wissen wollt, was im Netz gerade los ist, guckt ihr auf Google Trends" - so warb der Konzern für den Dienst im Zuge der Bundestagswahl 2017 in einem Video.

Wissenschaftler nutzen diese Daten ebenso wie Journalisten, Wirtschaftsexperten und Ermittler, um zu analysieren, wann in der Vergangenheit Menschen nach bestimmten Begriffen gesucht haben. Auch in der Corona-Krise haben Forscher und Redaktionen den Google-Dienst genutzt, etwa um zu schauen, wann das Interesse an "Kurzarbeit" gestiegen ist.

Eine Abfrage - viele unterschiedliche Ergebnisse

Allerdings ist fraglich, ob die von Google gelieferten Daten überhaupt eine Aussagekraft haben: Journalisten und Journalistinnen des NDR haben zusammen mit dem Big-Data-Beratungsunternehmen "Hase & Igel" sowie Wissenschaftlern der Universitäten Oldenburg und Hannover Hinweise darauf gefunden, dass die Daten, die Google Trends anzeigt, nicht zuverlässig sind. Immer wieder führten identische Suchabfragen, durchgeführt zu verschiedenen Zeitpunkten, zu teils eklatant unterschiedlichen Ergebnissen.

Datenbasis ist vorhanden

Dabei klingt die Methode von Google Trends bestechend einfach: Der Konzern, der als Quasi-Monopolist Milliarden von Suchanfragen im Internet verarbeitet, nutzt die gesammelten Informationen, um zu zeigen, für was sich Menschen interessieren. Ist das Stichwort "Trump" gerade besonders beliebt? Suchen die Menschen in einer Region derzeit häufig nach "trockener Husten" oder "Fieber"?

Bis in das Jahr 2015 betrieb Google sogar einen Dienst namens "Flu Trends", der den Verlauf von Grippewellen voraussagen sollte. Der Service wurde eingestellt, wohl, weil die Daten nicht zuverlässig waren.

1/4 Google Trends Vollbild So gleichmäßig sollte jede der folgenden Grafiken aussehen: Für jede Google-Trends-Abfrage (vertikale Achse) sollte für den Suchzeitraum (horizontale Achse) der “Google Index” identisch sein. | Bildquelle: NDR Recherche

Google Trends haben Einfluss

Das ist mehr als eine Spielerei: Vergleichswerte aus den Google-Trends veröffentlichte beispielsweise der Sachverständigenrat Wirtschaft für einen Corona-Report. Und an der Heinrich-Heine-Universität Düsseldorf haben Forscher eine Analyse zum zeitlichen Verlauf von Nasennebenhöhlenentzündungen durchgeführt.

Außerdem erklärte das Landeskriminalamt Bayern auf Anfrage des NDR, dass Recherchen mit Google Trends "regelmäßig im Rahmen von Ermittlungen durchgeführt" würden, auch wenn die Ergebnisse im Vergleich zu anderen Methoden einen geringen Stellenwert aufwiesen. Andere Landeskriminalämter bestätigten den Einsatz ebenfalls.

Validität mehr als fraglich

Die vom NDR und den anderen Analysten nun entdeckten Diskrepanzen in den Ergebnissen von Google Trends werfen die Frage auf, inwiefern die Daten überhaupt etwas über das Suchverhalten der Nutzer aussagen. In Hunderten automatisiert abgerufenen Stichproben konnten Reporterinnen und Reporter für einige Stichworte starke Schwankungen bei den Ergebnissen feststellen, auch bei historischen Daten.

Sah die Auswertung an einem Tag noch so aus, als hätten Menschen in der Vorwoche einen Suchbegriff stark abgefragt, zeigte der Trend für dasselbe Wort und den identischen Abfrage-Zeitraum am nächsten Tag nach unten.

Nicht nur deutsche Daten betroffen

Die Analyse bezieht sich vor allem auf die Google-Trend-Daten für Deutschland. Es gibt aber auch Hinweise darauf, dass Google Trends in den USA - etwa zum Suchbegriff Donald Trump - vom gleichen Phänomen betroffen sein könnte. Hier sind die Schwankungen vergleichsweise gering, aber dennoch vorhanden.

Das Problem besteht offenbar darin, dass Google nicht in der Lage ist, alle Suchanfragen systematisch aufzubereiten und daraus die Beliebtheit einzelner Begriffe zu errechnen. Daher behilft sich der Konzern mit Stichproben. Aus diesen sogenannten Samples rechnet Google dann auf das vermeintliche Gesamtvolumen hoch - offenbar allerdings sind die Samples derart unterschiedlich, dass sie nicht für einen Vergleich taugen.

Auf seiner eigenen Internetseite schreibt Google hingegen: "Anhand von Stichproben können wir einen Datensatz betrachten, der für alle Google-Suchanfragen repräsentativ ist (…)."

Höhere Abweichung bei geringem Suchvolumen?

In der Google-Suche werden jeden Tag Milliarden von Suchanfragen bearbeitet, deshalb ist die in Google Trends verwendete Stichprobe ausreichend. Würden wir in Google Trends nicht mit Stichproben sondern dem gesamten Datensatz aller Suchanfragen arbeiten, wäre eine Verarbeitung aufgrund der Datenmenge nicht mehr möglich.

Zu den Schwankungen schreibt Sonnenfeld: "Wenn ein Suchbegriff in der betrachteten Periode nur ein sehr geringes Suchvolumen aufweist, kann es hier zu kleinen Abweichungen auch in abgeschlossenen Zeiträumen kommen." Dazu gibt es jedoch auch andere Meinungen: Jan Schoenmakers, Geschäftsführer bei der Agentur "Hase & Igel", meint, dass gerade im Bereich Marketing und Webseitenoptimierung sich viele Menschen beruflich auf Google-Trends-Daten verließen. "Wenn ich darauf Entscheidungen aufbaue, kann ich in die Irre geführt werden."

Matthias Spielkamp beobachtet für die Organisation Algorithmwatch Tech-Konzerne wie Google. Dass die Daten von Google Trends teilweise unzuverlässig sind, überrascht ihn nicht. "Wir beobachten das ständig - es wird angekündigt, als könnte da nichts schief gehen und als seien die Dinge immer hundertprozentig zuverlässig. Wenn man sie dann aber testet, stellt man fest: Das ist überhaupt nicht so."

Deswegen fordert Spielkamp Zugang zu den Daten der Plattform, damit auch Außenstehende herausfinden können, ob etwas schief laufe. Das will Google jedoch nicht zulassen - aus Gründen des Geschäftsgeheimnisses und des Datenschutzes.