«Die künstliche Intelligenz hat noch immer nicht gesunden Menschenverstand, um unsere Sprache wirklich zu verstehen», hat die «Technology Review», das Magazin des Massachusetts Institute of Technology (MIT) letzte Woche geurteilt.

Grund für das harsche Urteil ist ein Test zum Begriffsvermögen: Bei diesem Winograd Schema Challenge bekommen die Programme viele Satzpaare vorgesetzt, die sich nur in einem Wort unterscheiden. Beim Satzpaar «Die Trophäe passt nicht in die Kiste, weil sie zu gross ist» – «Die Trophäe passt nicht in die Kiste, weil sie zu klein ist» leuchtet jedem menschlichen Leser ein, dass sich das Pronomen «sie» im ersten Satz auf die Trophäe, im zweiten Satz auf die Kiste bezieht.

Den Algorithmen hingegen ist das nicht so klar. Sie haben jüngst bei diesem Test markant schlechter abgeschnitten als menschliche Leser (zwischen 59 und 79 Prozent gegenüber 94 Prozent Genauigkeit). Die Forscher des Allen Institute of Artificial Intelligence, die den Test durchgeführt haben, kamen zu einem klaren Schluss: Dem menschlichen Verstand ist mit den aktuellen Mitteln der künstlichen Intelligenz nicht ­beizukommen.

Beeindruckende Fortschritte

Die heutigen Systeme setzen auf das Deep Learning, das mit statistischen Methoden in riesigen Datenbergen nach Mustern und Strukturen sucht. Es nutzt zusätzlich auch Modelle, die den Systemen das Wissen der Welt zugänglich machen.

Doch auch wenn die Algorithmen noch Verbesserungspotenzial haben: Die Fortschritte im letzten Jahrzehnt waren beeindruckend – wenn man bedenkt, wie die Anfänge ausgesehen haben. Ein erstes System war Audrey. Es wurde 1952 von Ingenieuren der Bell Labs konstruiert. Audrey konnte die Zahlen von 0 bis 9 mit mehr als 90 Prozent Genauigkeit erkennen – jedoch nur dann, wenn sie von bestimmten Sprechern gesprochen wurden.

1962 kam IBMs Erfindung Shoebox. Sie verstand die Ziffern, plus 16 englische Worte. Harpy, 1971 an der Carnegie-Mellon Universität in Pittsburgh entwickelt, hatte schon ein Verständnis für 1011 Wörter. Die erste Software, die kontinuierlich gesprochene Sprache verstehen konnte, war Dragon Dictate von 1997.

Auch Philosophen beschäftigen sich mit dem Verständnis von Sprache

Die grossen Durchbrüche erfolgten 2008 und 2011: Vor zwölf Jahren hat Google eine iPhone-App lanciert, die auf gesprochene Fragen reagierte. Vor neun Jahren, mit dem iPhone 4s, hat Apple Siri eingeführt. Die Fortschritte bei den Sprachfähigkeiten haben nicht nur den Smartphone-Assistenten, sondern auch den vernetzten Lautsprechern den Weg geebnet.

Die anfänglichen Schwellenängste der Nutzer sind in den letzten Jahren zurückgegangen. Laut einer Studie haben 2017 etwas mehr als die Hälfte der Amerikaner per Sprache mit ihrem Smartphone interagiert. In der Schweiz waren es vor einem Jahr 37 Prozent; so hat es eine Studie der Universität Luzern und der Kommunikationsagentur Farner ergeben.

Aber wie ist es für den Computer, menschliche Sprache verstehen zu müssen? Der Philosph John Searle hat dafür 1980 ein Gedankenexperiment entworfen: Es ist, wie wenn Sie allein in einem dunklen Raum sitzen würden. Ab und zu wird Ihnen durch einen Schlitz ein Zettel mit chinesischen Schriftzeichen zugeworfen. Es handelt sich um Fragen, die Sie allein anhand der Bücher, die um Sie herum aufgestapelt sind, entschlüsseln und beantworten müssen.

Und so gesehen schlagen sich die Computer bei der Kommunikation mit uns gar nicht mal so schlecht.