Smart Speaker

Alexa, Siri & Co. Die lauschenden Lautsprecher

Stand: 30.06.2020 17:24 Uhr

Sprachassistenten haben einer Studie zufolge häufig ohne Willen der Nutzer Gespräche aufgezeichnet. Im Test schalteten sich vor allem Amazon Lautsprecher oft ohne Aufforderung ein.

Von Svea Eckert, Eva Köhler, Jan Lukas Strozyk und Henning Wirtz, NDR

Sie erfreuen sich zunehmender Beliebtheit: sogenannte Smart Speaker, Lautsprecher mit eingebauten Sprachassistenten. Sie können einfache Fragen beantworten, per Sprache die Musikwiedergabe steuern oder das Licht im Raum anschalten. Mittlerweile nutzt fast die Hälfte der Deutschen laut einer Studie der Postbank solche Sprachassistenten über Smart Speaker oder Handys.

Sprachassistenten hören mit
tagesthemen 22:15 Uhr, 30.06.2020, Svea Eckert, NDR

Download der Videodatei

Wir bieten dieses Video in folgenden Formaten zum Download an:

Hinweis: Falls die Videodatei beim Klicken nicht automatisch gespeichert wird, können Sie mit der rechten Maustaste klicken und "Ziel speichern unter ..." auswählen.

Video einbetten

Nutzungsbedingungen Embedding Tagesschau: Durch Anklicken des Punktes „Einverstanden“ erkennt der Nutzer die vorliegenden AGB an. Damit wird dem Nutzer die Möglichkeit eingeräumt, unentgeltlich und nicht-exklusiv die Nutzung des tagesschau.de Video Players zum Embedding im eigenen Angebot. Der Nutzer erkennt ausdrücklich die freie redaktionelle Verantwortung für die bereitgestellten Inhalte der Tagesschau an und wird diese daher unverändert und in voller Länge nur im Rahmen der beantragten Nutzung verwenden. Der Nutzer darf insbesondere das Logo des NDR und der Tageschau im NDR Video Player nicht verändern. Darüber hinaus bedarf die Nutzung von Logos, Marken oder sonstigen Zeichen des NDR der vorherigen Zustimmung durch den NDR.
Der Nutzer garantiert, dass das überlassene Angebot werbefrei abgespielt bzw. dargestellt wird. Sofern der Nutzer Werbung im Umfeld des Videoplayers im eigenen Online-Auftritt präsentiert, ist diese so zu gestalten, dass zwischen dem NDR Video Player und den Werbeaussagen inhaltlich weder unmittelbar noch mittelbar ein Bezug hergestellt werden kann. Insbesondere ist es nicht gestattet, das überlassene Programmangebot durch Werbung zu unterbrechen oder sonstige online-typische Werbeformen zu verwenden, etwa durch Pre-Roll- oder Post-Roll-Darstellungen, Splitscreen oder Overlay. Der Video Player wird durch den Nutzer unverschlüsselt verfügbar gemacht. Der Nutzer wird von Dritten kein Entgelt für die Nutzung des NDR Video Players erheben. Vom Nutzer eingesetzte Digital Rights Managementsysteme dürfen nicht angewendet werden. Der Nutzer ist für die Einbindung der Inhalte der Tagesschau in seinem Online-Auftritt selbst verantwortlich.
Der Nutzer wird die eventuell notwendigen Rechte von den Verwertungsgesellschaften direkt lizenzieren und stellt den NDR von einer eventuellen Inanspruchnahme durch die Verwertungsgesellschaften bezüglich der Zugänglichmachung im Rahmen des Online-Auftritts frei oder wird dem NDR eventuell entstehende Kosten erstatten
Das Recht zur Widerrufung dieser Nutzungserlaubnis liegt insbesondere dann vor, wenn der Nutzer gegen die Vorgaben dieser AGB verstößt. Unabhängig davon endet die Nutzungsbefugnis für ein Video, wenn es der NDR aus rechtlichen (insbesondere urheber-, medien- oder presserechtlichen) Gründen nicht weiter zur Verbreitung bringen kann. In diesen Fällen wird der NDR das Angebot ohne Vorankündigung offline stellen. Dem Nutzer ist die Nutzung des entsprechenden Angebotes ab diesem Zeitpunkt untersagt. Der NDR kann die vorliegenden AGB nach Vorankündigung jederzeit ändern. Sie werden Bestandteil der Nutzungsbefugnis, wenn der Nutzer den geänderten AGB zustimmt.

Einverstanden

Zum einbetten einfach den HTML-Code kopieren und auf ihrer Seite einfügen.

Doch Recherchen von STRG_F, dem investigativen NDR-Format für funk, und der "Süddeutschen Zeitung" (SZ) zeigen, dass Smart Speaker häufig unbeabsichtigt aktiviert werden und private Gespräche übermitteln. Hersteller lassen oder ließen einige Aufzeichnungen von Menschen mithören, um zu prüfen, ob der Computer die Sprachbefehle richtig erkennt. Drei ehemalige Beschäftigte von Firmen, die für Apple und Amazon solche Aufnahmen überprüft haben, schildern, wie sie intime Momente aus der Menschen mitgehört haben. Sie berichten von abgelauschten Gesprächen mit medizinischem Personal, Geschäftsbesprechungen und aufgezeichneten Streits und Sex.

Lautsprecher Amazon Echo | Bildquelle: dpa
galerie

Zu hilfreich? Immer wieder springen "intelligente" Lautsprecher beim falschen Stichwort an.

Aktiv - auch ohne Schlüsselwort

Eigentlich sollen die Geräte nur Aufnahmen übermitteln, wenn sie mit speziellen Wörtern aktiviert werden - etwa mit "Ok, Google", "Hey Siri" oder "Alexa". Erst dann wird eine Verbindung zum Rechenzentrum hergestellt und der folgende Sprachbefehl verarbeitet. Doch eine neue Studie, die STRG_F und der SZ vorliegt, belegt, dass Smart Speaker häufig ungewollt Aufnahmen starten. Bei der aktuellen Untersuchung schalteten sich die Geräte auch bei anderen Wörtern ein.

Eine Forschergruppe der Ruhr-Universität Bochum und des Bochumer Max-Planck-Instituts für Sicherheit und Privatsphäre hat nun insgesamt elf Smart Speaker untersucht: Modelle von Apple, Google, Amazon, Microsoft, der Telekom und den chinesischen Firmen Xiaomi, Tencent und Baidu. Die Geräte beschallten sie mehr als 16 Tage lang mit englischsprachigen TV-Serien, Nachrichten sowie speziellen Tondatenbanken und registrierten dabei rund 735 fehlerhafte Auslöser. Nach zusätzlichen sieben Tagen deutschsprachiger Sendungen wurden die Geräte rund 180 Mal fälschlicherweise aktiviert.

"Risiko der Privatsphäre"

Der Hamburger Datenschutzbeauftragte Johannes Caspar fordert, dass die Unternehmen von sich aus auf dieses Problem aufmerksam machen. "Man muss vom Hersteller erwarten, dass er die Verbraucher im datenschutzrechtlichen Sinne aufklärt und darauf hinweist, dass es eben ein entsprechendes Risiko der Privatsphäre ist", sagte Caspar NDR und SZ. Das könne etwa über entsprechende Label oder Hinweise auf der Verpackung geschehen. Er setzt aber auch darauf, dass die Systeme mit der Zeit besser und ungewollte Aktivierungen seltener werden. "Künstliche Intelligenz lernt aus Fehlern", so Caspar.

Die Forscherinnen und Forscher der Bochumer Uni und des Max-Planck-Instituts hatten die Geräte für ihren Test unter anderem mit Nachrichtensendungen wie der Tagesschau oder Fernsehserien beschallt - etwa "Das Traumschiff", "Die Simpsons" oder "House of Cards". Zusätzlich haben sie spezielle Ton-Datenbanken verwendet, etwa vorgelesene Texte und Störgeräusche.

Google Home | Bildquelle: picture alliance / Frank Duenzl
galerie

"Ok Google" - auch diese Lautsprecher mussten sich dem Test stellen.

Aus "am Sonntag" wird "Amazon"

Dabei stellten sie signifikante Unterschiede zwischen den einzelnen Herstellern fest. Bei den englischsprachigen Tests startete Microsofts "Cortana"-Assistenzsystem am häufigsten eine Aufzeichnung, ohne ausdrücklich aktiviert worden zu sein. Weniger fehleranfällig zeigten sich Google und Apple. Bei den deutschsprachigen Systemen schalteten sich die Geräte von Amazon deutlich häufiger unbeabsichtigt ein als die von Google, Apple und Telekom.

Viele Fehler waren auf ähnlich klingende Worte zurückzuführen. Als im "Traumschiff" etwa ein "Daiquiri" bestellt wurde, fühlte sich das Apple-Gerät ("Hey Siri") angesprochen. Als es in  derselben Serie um "Botswana" ging, sprang die Microsoft-KI "Cortana" an. Amazons Gerät reagierte auf die Tagesschau-Vorhersage, dass es "am Sonntag" ("Amazon") gutes Wetter geben solle.

Auf Anfrage zu den Ergebnissen teilte Google mit, dass man derzeit keine Auswertung der Aufzeichnungen durch Mitarbeiter erfolge. In Zukunft will das Unternehmen aber wieder Menschen einsetzen, um die Sprachtechnologie zu verbessern. Die Nutzerinnen und Nutzer müssten sich dann aktiv dafür entscheiden, teilte das Unternehmen auf Anfrage mit. Grundsätzlich arbeite Google ständig daran, die Erkennungstechnologie für die Aktivierungswörter zu verbessern. Zudem könnten Nutzerinnen und Nutzer Aufnahmen löschen lassen, wenn sie erkennen, dass sich das Gerät unbeabsichtigt eingeschaltet hat.

Apple-Zentrale im kalifornischen Cupertino | Bildquelle: picture alliance / dpa
galerie

Apple verarbeitet die Daten unter einer zufälligen Kennung - ohne sie mit der Apple-ID oder einer Telefonnummer in Verbindung zu bringen.

Aufzeichnungen "ausschließlich" für Mitarbeiter zugänglich

Apple hat auf konkreten Fragen nicht geantwortet, sondern lediglich auf eine Stellungnahme vom September 2019 verwiesen. Darin heißt es, alle Daten von Siri würden unter einer zufälligen Kennung verarbeitet und nicht mit der Apple-ID oder der Telefonnummer verknüpft. Standardmäßig speichere das Unternehmen keine Audioaufzeichnungen mehr. Nutzer könnten dem aber aktiv zustimmen, um zu "einer Verbesserung" beizutragen. Die Aufnahmen bekämen dann "ausschließlich Apple-Mitarbeiter" zu hören, jede unbeabsichtigte Aufzeichnung solle gelöscht werden.

Amazon schrieb, die Erkennung des Aktivierungswortes und die Spracherkennung würden sich täglich verbessern und man investiere "weiterhin in die Verbesserung der entsprechenden Technologien". Ein kleiner "Bruchteil von einem Prozent der Alexa-Anfragen" werde durch Mitarbeiter bearbeitet. Die Aufnahmen seien dabei nicht mit Kundendaten verknüpft und nur eine begrenzte Anzahl von Mitarbeitern habe Zugriff. Anders als bei Google und Apple müssen Kunden dem aber nicht aktiv zustimmen. Sie haben aber die Möglichkeit, der Nutzung der Sprachaufzeichnungen zu widersprechen, so Amazon.

Amazons intelligenter persoenlicher Assistent Alexa wird getestet. | Bildquelle: picture alliance / Frank Duenzl
galerie

Wenn Worte "zu ähnlich" sind, kann der Lautsprecher anspringen.

Eigene Gespräche einsehen und löschen

Die Telekom teilte mit, dass eine Sicherheitsmaßnahme zum Schutz der Privatsphäre greife, sollten ähnlich klingende Worte zu einer versehentlichen Aktivierung führen. Die Sprachplattform überprüfe, ob wirklich das entsprechende Wort gesagt wurden. Die Menschen könnten auch den Verlauf der Gespräche einsehen, auf ungewollte Aufzeichnungen aufmerksam machen und diese löschen lassen. Zudem könnten sie die Mikrofone der Geräte mit einer Stumm-Taste ausschalten. Zur Sprachverbesserung würden "auf Datenschutz geschulte Mitarbeiter der Telekom" einige Textfiles analysieren. Die Aufnahmen würden zuvor anonymisiert. Wenn ein Kunde dies nicht wolle, könne er in der App dem widersprechen.

Microsoft hat auf die Anfrage nicht geantwortet. Der Softwarekonzern hat sein Spracherkennungssystem für Smart Speaker mittlerweile eingestellt. Xiaomi antwortete als einziger chinesischer Hersteller auf eine Anfrage und erklärte, dass die Geräte nicht für deutsch- oder englischsprachige Umgebungen optimiert seien. Alle der getesteten Sprachassistenten aus China werden offiziell nicht nach Europa verkauft.

Über dieses Thema berichtete die tagesschau am 30. Juni 2020 um 17:00 Uhr.

Darstellung: