Lautsprecherboxen mit eingebauten Sprachassistenten sind «das nächste Milliardengeschäft, das keiner hat kommen sehen». Diese Behauptung der News-Plattform «Business Insider» wird von den Analysten gestützt: 2016 haben diese «Smart Speakers» 992 Millionen US-Dollar umgesetzt. 2022 sollen es 4,8 Milliarden sein, prognostiziert der Chicagoer Marktforscher Arizton. In den USA verwenden bereits 44 Millionen oder 18 Prozent der Bevölkerung ein solches Gerät. Hierzulande ist die Produktkategorie wenig verbreitet. Das liegt daran, dass die populärsten Modelle noch gar nicht offiziell angeboten werden.

Ein smarter Lautsprecher nimmt Sprachbefehle entgegen und spielt auf Zuruf Musik, Hörbücher oder Podcasts ab. Amazon hatte schon 2011 die Idee, eine Lautsprecherbox per WLAN oder Bluetooth ins Internet zu bringen und mit einer digitalen Assistentin namens Alexa auszustatten.

«Business Insider» berichtet, dass Amazon-Chef Jeff Bezos damals ein grosser Verfechter des Projekts war. Doch er hatte auch hohe Erwartungen: Alexa musste reaktionsschnell sein und auf Anfragen des Nutzers extrem flink reagieren. Der Dialog sollte sich wie ein Gespräch mit einem Menschen anfühlen, verlangte Bezos.

Shopping per Zuruf

Im Juni 2015 war der Lautsprecher marktreif und kam als Amazon Echo in den Handel. Anfänglich konnte man mit ihm vor allem seine Musik steuern und nicht viel mehr. Doch der Internethändler erkannte die Möglichkeit, Echo als Shoppinghelfer aufzustellen, der Bestellungen für WC-Papier, Bier und Katzenfutter entgegennimmt.

Vor allem aber entpuppte sich Amazon Echo als entscheidendes Puzzleteilchen bei der Automatisierung des Eigenheims. Da der Lautsprecher ständig auf Kommandos lauscht und Befehle auch versteht, wenn sie zwei Zimmer weiter gesprochen werden, ist er ideal, um im «Smart Home» Heizung, Luftbefeuchter, WLAN-Glühbirnen oder das digitale Hausschloss zu steuern. Diverse Hersteller von internetaffinen Haushaltsgegenständen haben sich in den letzten Jahren für Echo und Alexa geöffnet.

Einen Fuss in der Tür des smarten Homes

Wenn der Internethändler einen Fuss im smarten Home hat, eröffnen sich ihm ungeahnte Möglichkeiten für die Zustellung: Über den Dienst namens Key können sich Kunden, die ein smartes Türschloss und eine Cloud-Sicherheitskamera besitzen, Lieferungen mitten in die Wohnung stellen lassen. Der Kunde gibt vor, wann der Kurier die Türe öffnen und das Paket deponieren darf. Via Kamera überwacht der Kunde, dass der Lieferant das auch ordnungsgemäss tut.

Der Erfolg von Amazon Echo und Alexa hat seit 2015 die Konkurrenz auf den Plan gerufen: Google lancierte im November 2016 den Home-Lautsprecher. Der dazu gehörende Helfer heisst Google Assistant. Er wurde Anfang Jahr an der Computermesse CES in Las Vegas im grossen Stil beworben. Apple verkauft seit Februar 2018 seinen Homepod, der die vom iPhone und iPad bekannte Assistentin Siri ins Wohnzimmer bringt. Auch Microsofts Windows-10-Assistentin Cortana verrichtet ihre Dienste im Wohnzimmer. Die Samsung-Tochter Harman Kardon verbaut sie seit Oktober 2017 im Lautsprecher Invoke.

Amazon ist die Nummer eins

Es gibt Anzeichen, dass Microsoft an einem eigenen Cortana-Lautsprecher arbeitet. Auch Facebook und Samsung wollen 2018 eigene Wohnzimmerassistenten auf den Markt bringen. Bis jetzt teilen sich in den USA Amazon mit 69 Prozent und Google mit 31 Prozent das Produktsegment. Das hat Marktforschers CIRP im Januar 2018 ermittelt.

Gehören die smarten Lautsprecher demnächst bald zur Standardausstattung der meisten Haushalte? Ein zunehmend grosses Hindernis bei der weiteren Verbreitung könnten die Bedenken in Sachen Schutz der Privatsphäre sein. Datenschützer weisen darauf hin, dass die Sprachbefehle nicht in den Geräten selbst, sondern auf den Servern der Hersteller verarbeitet werden. Dazu müssen die hochsensiblen Mikrofone der Lautsprecher konstant in den Raum hineinhorchen. Sie lassen sich zwar stummschalten, doch dadurch verliert der Lautsprecher die smarten Fähigkeiten.

Aufnahmen werden personalisiert gespeichert

Nicht nur das: Cnet.com weist darauf hin, dass im Fall von Echo die Aufnahmen bei Amazon gespeichert werden – und zwar nicht anonymisiert. Immerhin: Es gibt keinen konstanten Lauschangriff. Eine Übertragung findet erst statt, wenn der smarte Lautsprecher durch eine Aktivierungsphrase wie «Hey Siri», «Alexa...» oder «Okay Google» zum Zuhören aufgefordert wurde.

Es kommt jedoch durchaus vor, dass ein smarter Lautsprecher sich fälschlicherweise aktiviert. Im März 2018 sind Fälle bekannt geworden, bei denen Echo-Lautsprecher teils mitten in der Nacht in lautes, manisches Lachen ausgebrochen sind. Die Nachforschungen ergaben, dass eine Fehlinterpretation der Spracherkennung zu diesem bizarren Verhalten führen konnte: Die Lautsprecher hatten Sprachbefehle oder Umgebungsgeräusche als Aufforderung «Alexa, lache» verstanden.

Das sind nicht alle Mängel der Spracherkennung: Die rechtmässigen Besitzer werden bis jetzt nicht an der Stimme identifiziert. Das eröffnet Besuchern die Möglichkeit, in unbeachteten Momenten unerwünschte Aktionen auszulösen: «Alexa, lies mir meine letzten E-Mails vor!» Oder: «Alexa, sag mir meinen Kontostand.»

Unhörbare Kommandos

Es gibt noch ein grösseres und beunruhigenderes Missbrauchspotenzial. Die «New York Times» hat letzte Woche berichtet, wie Forscher der Unis von Kalifornien, Berkeley und Georgetown es geschafft haben, Kommandos akustisch zu maskieren. Diese Sprachbefehle sind für menschliche Ohren unhörbar, werden von den Lautsprechern aber problemlos verstanden.

Die Forscher haben sie ursprünglich in sogenanntem weissem Rauschen versteckt – das klingt dann so wie ein UKW-Radio, das auf eine «leere» Frequenz eingestellt ist. Inzwischen können die Forscher die geheimen Befehle in Aufnahmen von Musik oder Sprache «einimpfen». Das bedeutet, dass ein Youtube-Video eine akustische Internetwerbung oder sogar ein Radiospot die Aufforderung enthalten könnte, bestimmte Produkte auf die Einkaufsliste zu setzen oder Geldüberweisungen zu veranlassen.

Dem Einbrecher die Türe öffnen?

Wenn der Lautsprecher die Herrschaft über das «smart Home» innehat, liesse sich auch die Temperatur im Raum um fünf Grad erhöhen oder die Überwachungskamera abschalten und das elektronische Türschloss entriegeln.

Einer der Forscher hat ein Paper über diese audiophonen Angriffe übrigens mit «Cocaine Noodles» (Kokainnudeln) überschrieben – weil die smarten Lautsprecher diesen Begriff als «Okay Google» verstanden haben.