Das Zehnfinger-System hat keine Zukunft

Von Walter Jäggi. Aktualisiert am 07.09.2009 11 Kommentare

Computer und Handys sind schnell, ihre Benützer langsam. Weil die meisten Menschen schneller sprechen als tippen, wird die Spracherkennung die Tastatur ablösen – und das bald.

Vor allem Röntgenärzte nutzen die neue Technik und diktieren ihre Befunde direkt dem Computer. Wichtig ist, dass sie dabei diszipliniert sprechen.

Vor allem Röntgenärzte nutzen die neue Technik und diktieren ihre Befunde direkt dem Computer. Wichtig ist, dass sie dabei diszipliniert sprechen.
Bild: PD

Die menschliche Stimme ersetzt den Pin-Code

Spracherkennung kann auch Stimmerkennung sein. Die Stimme identifiziert ihren Besitzer so sicher wie der Fingerabdruck.

Patricia Kaas, Stephan Klapproth oder Trudi Gerster erkennt man problemlos an der Stimme. Aber nicht nur sie, die Stimme eines Menschen ist ein persönliches Unikat, bedingt durch die individuellen Strukturen des Kehlkopfs, der Zunge usw. Bei der Einführung der biometrischen Pässe standen als Sicherheitsmerkmal der Fingerabdruck, die Iris und das Gesichtsbild zur Diskussion, aber nie die Stimme. «Man hat das einfach vergessen», sagt Michael-Maria Bommer, der den Softwarehersteller Nuance vertritt.

Die Stimmerkennung ist, was inzwischen auch viele Unternehmen bestätigten, ein ebenso sicheres Identifizierungsmittel wie etwa der Fingerabdruck. Die Anwendung sei für den Benützer unkompliziert, kontaktlos und schnell, erläutert Bommer. In einem arabischen Land habe eine Bank das System unter dem Namen Voicepay bereits an den Geldautomaten eingeführt, weil zahlreiche Fremdarbeiter Analphabeten seien und mit der Tastatur Mühe hätten.

Für Anwendungen wie Diktate oder die Bedienung von Geräten soll die Spracherkennung möglichst breit funktionieren, so dass der Computer nicht auf seinen Benützer trainiert zu werden braucht. Umgekehrt muss der Computer eine Stimme eindeutig einer Person zuordnen, wenn sie als Passwort am Geldautomat oder bei der Passkontrolle eingesetzt wird. Stimmerkennung kann auch einen Anrufer bei einem Call-Center identifizieren, Türen freigeben oder als Autoschlüssel dienen.

Und was ist, wenn man Grippe hat?

Und was ist, wenn man erkältet ist? «Die Frage kommt immer sofort», sagt Bommer. Doch die Stimme werde auf 154 Kennzeichen analysiert, etwas Heiserkeit vertrage das System schon. Schwierig werde es, wenn die Stimme angesäuselt oder gar betrunken klinge. Aber bei vielen Anwendungen gelte die Stimme allein ohnehin nicht als elektronische Unterschrift, sie sei Teil einer ganzen Kette von Sicherheitsmerkmalen.

Computern gelingt es bereits ganz gut, Gespräche in schriftliche Daten zu übertragen und Stimmen bestimmten Personen zuzuordnen. Nun kommt der nächste Schritt: Der Computer soll die Informationen «verstehen». Mit künstlicher Intelligenz meinen die Informatiker, dass ein System Daten selbstständig so analysiert, dass es ohne gezieltes Programm Zusammenhänge herstellen kann. Man würde einem solchen Computer in Klartext eine Frage stellen und er würde auf Grund seiner Datenbanken die Antwort finden.

Die treibende Kraft hinter solchen Entwicklungen ist das Militär. Die Forschungsorganisation des US-Verteidigungsministeriums (Darpa) hat Aufträge ausgeschrieben, Systeme zu entwickeln, welche beliebige Textquellen direkt analysieren. An Informationen, so schreibt die Darpa, fehle es nicht. Im Gegenteil: Von Funkgesprächen der Versorgungstruppen bis zu den Resultaten von Spionagesatelliten schwappt eine Flut von Daten in die Zentralen. «Die Informationen sind vorhanden, aber selten in einer Form, die für Systeme der künstlichen Intelligenz verwendbar sind», heisst es in einem Darpa-Papier. Gesucht sind Systeme, welche natürliche Sprache und Text computertauglich machen.

Die Informationstechnik leidet an einem Engpass an der Schnittstelle zwischen Mensch und Maschine. In den meisten Fällen ist das heute eine Tastatur. Seit der Italiener Pellegrino Turri di Castelnuovo 1808 für die blinde Gräfin Carolina Vantoni eine Maschine zum Schreiben erfand, hat sich die Tastatur als Gerät allgemein verbreitet. Generationen von Kaufleuten, Sekretärinnen, Schriftstellern, Telegrafistinnen und Beamten mussten die Beherrschung des Zehnfinger-Blindsystems mühselig erlernen – woran sich bis heute nichts geändert hat.

Tastatur als Bremsklotz

Mitte des 20. Jahrhunderts wurde die Behandlung von Texten zum Bestandteil der elektronischen Datenverarbeitung (die zunächst nur zum Rechnen gedacht war). Nun fand die Schreibmaschinentastatur Anschluss an den Computer. Von da an war das System schneller als die flinkste Typistin, die Tastatur wurde sozusagen zum Bremsklotz.

Jetzt steht der nächste Schritt bevor: Der Computer hat gelernt, nicht nur aus Text Sprache zu machen, sondern auch gesprochene Sprache zu geschriebenem Text. Die Tastatur wird – jedenfalls zum Teil – überflüssig. Hinter der neuen Technik stehen jahrelange Versuche und Entwicklungen und diverse verfrühte Produkteinführungen, die hauptsächlich zu Heiterkeit bei den Benützern führten. Ein Paradebeispiel war vor Jahren die sprachgesteuerte Fahrplanauskunft der SBB. Die telefonischen Dialoge mit dem Computer waren oft kabarettreif. Inzwischen sind die Sprachsysteme erheblich besser geworden.

Aus Lauten werden Buchstaben

Entwickelt wurde die Software, die aus den akustischen Phonemen die entsprechenden Buchstaben ableitet, von Forschungslabors prominenter Unternehmen wie IBM und Philips. Inzwischen sind die Patente dieser Multis an die amerikanische Firma Nuance übergegangen, die auf Software für die Text- und Spracherkennung spezialisiert ist. Bekannt ist Omnipage, eine Software, die aus gescannten Textvorlagen bearbeitbare Dateien macht. Den gleichen Erfolg erhofft sich das Unternehmen nun mit Spracherkennungsprogrammen. Zunächst wurde die Technik – noch von IBM und Philips – in bestimmten Profi-Anwendungen eingesetzt, hauptsächlich in der Medizin und im Rechtswesen. Die Software wurde massgeschneidert, indem Fachausdrücke einbezogen wurden, was die Erkennungssicherheit verbessert.

In Deutschland bereits weit verbreitet, in der Schweiz im Universitätsspital Basel in der Einführungsphase ist die akustische Erfassung von Ärzteberichten. Vor allem die Radiologen nutzen die Technik, um ihre Kommentare zu Röntgenbildern direkt in den Computer zu diktieren. Im Sekretariat oder durch den Arzt selber werden am PC noch kleine Fehler verbessert. Sofort liegt der Bericht dann schriftlich vor, bei den früheren Arbeitsabläufen konnte das Tage dauern. Sehr viel Text zu verarbeiten gibt es auch bei Rechtsanwälten und an Gerichten. Auch in dieser Branche beginnt sich das Computerdiktat langsam, aber sicher durchzusetzen.

Diktieren üben statt tippen lernen

Für die Benützer ergeben sich neue Anforderungen, auf die künftig auch in der Ausbildung eingegangen werden muss. Diktieren ist nicht das gleiche wie tippen. Rationell ist ein elektronisches Diktat nur dann, wenn hinterher wenig Korrekturen vorgenommen werden müssen. Diszipliniertes Sprechen ist Voraussetzung für das Erzeugen guter Dokumente. Die Chefs alter Schule, die ihrer Sekretärin druckreife Texte diktieren konnten, sind aber ausgestorben, seit sich auch Führungskräfte persönlich an der Tastatur versuchen.

Michael-Maria Bommer, General Manager von Nuance für die Schweiz, hält die Spracherkennung nicht nur in bestimmten Branchen für zukunftsträchtig. Angewendet werden Nuance-Produkte bereits in Call-Centern, bei denen sich der Anrufer im Dialog mit dem System zur richtigen Information oder zur richtigen Person navigieren kann. Beim Fernsehen in verschiedenen Ländern werden damit Untertitel live getextet.

«handsfree» und «eyesfree»

Bei der britischen Polizei sind erste Beamte mit einem Blackberry-Handy ausgerüstet worden, über das sie Unfallrapporte direkt an einen Computer diktieren. Wenn sie nach einem Ausseneinsatz auf den Polizeiposten zurückkehren, können sie den Rapport schriftlich abrufen und fertigstellen. «Die Papierarbeit konnte so um 80 Prozent reduziert werden», sagt Bommer, der zahlreiche weitere Anwendungen im Visier hat. Es gebe bereits Unternehmen, welche als Dienstleistung anbieten, Telefondiktate entgegenzunehmen, daraus Dateien zu erzeugen und diese den Kunden zu mailen.

In einem speziellen Projekt wird die Sprachausgabe und -erkennung für die Schule erprobt. Und selbstverständlich hat sich das Militär die neue Technik schon zu Nutze gemacht: In Kampfflugzeugen soll ein Teil der Schalter künftig per Stimme bedient werden, damit die Piloten beide Hände frei behalten.

Weit verbreitet ist die Sprachsteuerung bei den GPS-Navigationshilfen im Auto, bei Handys und zunehmend bei der Unterhaltungselektronik – im Hintergrund sind auch da Produkte des unbekannten Softwareriesen Nuance im Einsatz. Bommer glaubt, dass die Informationstechnik künftig nicht mehr nur «handsfree», sondern auch «eyesfree» sein werde. Dank dem Dialog mit den Systemen in gewöhnlicher Sprache könne der Benützer die Technik vollständig vergessen. (Tages-Anzeiger)

Erstellt: 07.09.2009, 21:21 Uhr

11

Kommentar schreiben







 Ausland



Verbleibende Anzahl Zeichen:

Mit dem Absenden des Kommentars erklärt sich der Leser mit nachfolgenden Bedingungen einverstanden: Die Redaktion behält sich vor, Kommentare nicht zu publizieren. Dies gilt insbesondere für ehrverletzende, rassistische, unsachliche, themenfremde Kommentare oder solche in Mundart oder Fremdsprachen. Kommentare mit Fantasienamen oder mit ganz offensichtlich falschen Namen werden ebenfalls nicht veröffentlicht. Über die Entscheide der Redaktion wird keine Korrespondenz geführt. Telefonische Auskünfte werden keine erteilt. Ihr Kommentar kann auch auf Google und anderen Suchseiten gefunden werden.

11 Kommentare

Roger Crislack

08.09.2009, 09:25 Uhr
Melden

also ich liebe mein 10-Finger-System und bin damit ziemlich flot unterwegs, sollte die Stimmerkennung jedoch wirklich gut funktionieren (wir Schweizer sind da ja ein wenig vorbelastet mit unserem Dialekt) denke ich, dass es wohl einige sinnvolle Einsatzmöglichkeiten geben wird ! Antworten


Gero Rubli

08.09.2009, 09:53 Uhr
Melden

Natürlich hat das Zehnfingersystem weiterhin Zukunft. Oder wollen Sie in einem Büro arbeiten oder in einem Zug sitzen, wo alle wie wild auf ihre Computer einreden? Antworten



Digital

Populär auf Facebook Privatsphäre

Meistgelesen in der Rubrik Digital

Telefonbuch

Marktplatz

Facebook

Werden Sie Tagi-Fan.