Diktieren statt in den Computer tippen

Handys und Computer sind schnell, ihre Benützer langsam. Weil die meisten Menschen schneller sprechen als schreiben, wird die Spracherkennung die Tastatur ablösen – und das bald.

Vor allem Röntgenärzte nutzen sie: Die neue Technik, mit der ihre Befunde direkt dem Computer diktiert werden können. Wichtig ist, dass sie dabei diszipliniert sprechen.

Vor allem Röntgenärzte nutzen sie: Die neue Technik, mit der ihre Befunde direkt dem Computer diktiert werden können. Wichtig ist, dass sie dabei diszipliniert sprechen.
Bild: Nuance/PD

Die Informationstechnik leidet an einem Engpass an der Schnittstelle zwischen Mensch und Maschine. In den meisten Fällen ist das heute eine Tastatur. Seit der Italiener Pellegrino Turri di Castelnuovo 1808 für die blinde Gräfin Carolina Vantoni eine Maschine zum Schreiben erfand, hat sich die Tastatur als Gerät allgemein verbreitet. Generationen von Kaufleuten, Sekretärinnen, Schriftstellern, Telegrafistinnen und Beamten mussten die Beherrschung des Zehnfinger-Blindsystems mühselig erlernen – woran sich bis heute nichts geändert hat.

Mitte des 20. Jahrhunderts wurde die Behandlung von Texten zum Bestandteil der elektronischen Datenverarbeitung (die zunächst nur zum Rechnen gedacht war). Nun fand die Schreibmaschinentastatur Anschluss an den Computer. Von da an war das System schneller als die flinkste Typistin, die Tastatur wurde sozusagen zum Bremsklotz.

Jetzt steht der nächste Schritt bevor: Der Computer hat gelernt, nicht nur aus Text Sprache zu machen, sondern auch gesprochene Sprache zu geschriebenem Text. Die Tastatur wird – jedenfalls zum Teil – überflüssig. Hinter der neuen Technik stehen jahrelange Versuche und Entwicklungen und diverse verfrühte Produkteinführungen, die hauptsächlich zu Heiterkeit bei den Benützern führten. Ein Paradebeispiel war vor Jahren die sprachgesteuerte Fahrplanauskunft der SBB. Die telefonischen Dialoge mit dem Computer waren oft kabarettreif. Inzwischen sind die Sprachsysteme erheblich besser geworden.

Aus Lauten werden Buchstaben

Entwickelt wurde die Software, die aus den akustischen Phonemen die entsprechenden Buchstaben ableitet, von Forschungslabors prominenter Unternehmen wie IBM und Philips. Inzwischen sind die Patente dieser Multis an die amerikanische Firma Nuance übergegangen, die auf Software für die Text- und Spracherkennung spezialisiert ist. Bekannt ist Omnipage, eine Software, die aus gescannten Textvorlagen bearbeitbare Dateien macht. Den gleichen Erfolg erhofft sich das Unternehmen nun mit Spracherkennungsprogrammen. Zunächst wurde die Technik – noch von IBM und Philips – in bestimmten ProfiAnwendungen eingesetzt, hauptsächlich in der Medizin und im Rechtswesen. Die Software wurde massgeschneidert, indem Fachausdrücke einbezogen wurden, was die Erkennungssicherheit verbessert.

In Deutschland bereits weitverbreitet, in der Schweiz im Universitätsspital Basel in der Einführungsphase ist die akustische Erfassung von Ärzteberichten. Vor allem die Radiologen nutzen die Technik, um ihre Kommentare zu Röntgenbildern direkt in den Computer zu diktieren. Im Sekretariat oder durch den Arzt selber werden am PC noch kleine Fehler verbessert. Sofort liegt der Bericht dann schriftlich vor, bei den früheren Arbeitsabläufen konnte das Tage dauern. Sehr viel Text zu verarbeiten gibt es auch bei Rechtsanwälten und an Gerichten. Auch in dieser Branche beginnt sich das Computerdiktat langsam, aber sicher durchzusetzen.

Diktieren üben statt tippen lernen

Für die Benützer ergeben sich neue Anforderungen, auf die künftig auch in der Ausbildung eingegangen werden muss. Diktieren ist nicht das Gleiche wie tippen. Rationell ist ein elektronisches Diktat nur dann, wenn hinterher wenig Korrekturen vorgenommen werden müssen. Diszipliniertes Sprechen ist Voraussetzung für das Erzeugen guter Dokumente. Die Chefs alter Schule, die ihrer Sekretärin druckreife Texte diktieren konnten, sind aber ausgestorben, seit sich auch Führungskräfte persönlich an der Tastatur versuchen.

Michael-Maria Bommer, General Manager von Nuance für die Schweiz, hält die Spracherkennung nicht nur in bestimmten Branchen für zukunftsträchtig. Angewendet werden NuanceProdukte bereits in Callcentern, bei denen sich der Anrufer im Dialog mit dem System zur richtigen Information oder zur richtigen Person navigieren kann. Beim Fernsehen in verschiedenen Ländern werden damit Untertitel live getextet (TA vom 13. Mai).

Bei der britischen Polizei sind erste Beamte mit einem Blackberry-Handy ausgerüstet worden, über das sie Unfallrapporte direkt an einen Computer diktieren. Wenn sie nach einem Ausseneinsatz auf den Polizeiposten zurückkehren, können sie den Rapport schriftlich abrufen und fertigstellen. «Die Papierarbeit konnte so um 80 Prozent reduziert werden», sagt Bommer, der zahlreiche weitere Anwendungen im Visier hat. Es gebe bereits Unternehmen, welche als Dienstleistung anbieten, Telefondiktate entgegenzunehmen, daraus Dateien zu erzeugen und diese den Kunden zu mailen. In einem speziellen Projekt wird die Sprachausgabe und -erkennung für die Schule erprobt. Und selbstverständlich hat sich das Militär die neue Technik schon zunutze gemacht: In Kampfflugzeugen soll ein Teil der Schalter künftig per Stimme bedient werden, damit die Piloten beide Hände frei behalten.

Weit verbreitet ist die Sprachsteuerung bei den GPS-Navigationshilfen im Auto, bei Handys und zunehmend bei der Unterhaltungselektronik – im Hintergrund sind auch da Produkte des unbekannten Softwareriesen Nuance im Einsatz. Bommer glaubt, dass die Informationstechnik künftig nicht mehr nur «hands free», sondern auch «eyes free» sein werde. Dank dem Dialog mit den Systemen in gewöhnlicher Sprache könne der Benützer die Technik vollständig vergessen. (Tages-Anzeiger)

Erstellt: 08.09.2009, 12:52 Uhr

KOMMENTAR SCHREIBEN







 Ausland



Verbleibende Anzahl Zeichen:

Mit dem Absenden des Kommentars erklärt sich der Leser mit nachfolgenden Bedingungen einverstanden: Die Redaktion behält sich vor, Kommentare nicht zu publizieren. Dies gilt insbesondere für ehrverletzende, rassistische, unsachliche, themenfremde Kommentare oder solche in Mundart oder Fremdsprachen. Kommentare mit Fantasienamen oder mit ganz offensichtlich falschen Namen werden ebenfalls nicht veröffentlicht. Über die Entscheide der Redaktion wird keine Korrespondenz geführt. Telefonische Auskünfte werden keine erteilt. Ihr Kommentar kann auch auf Google und anderen Suchseiten gefunden werden.


Meistgelesen in der Rubrik Wissen

Die Top-Themen im

Neu: Alle Dossiers auf einen Blick

Lernpower

Heute vor...




© Tamedia AG 2010 Alle Rechte vorbehalten