Diktieren statt in den Computer tippen
Artikel zum Thema
Die Informationstechnik leidet an einem Engpass an der Schnittstelle zwischen Mensch und Maschine. In den meisten Fällen ist das heute eine Tastatur. Seit der Italiener Pellegrino Turri di Castelnuovo 1808 für die blinde Gräfin Carolina Vantoni eine Maschine zum Schreiben erfand, hat sich die Tastatur als Gerät allgemein verbreitet. Generationen von Kaufleuten, Sekretärinnen, Schriftstellern, Telegrafistinnen und Beamten mussten die Beherrschung des Zehnfinger-Blindsystems mühselig erlernen – woran sich bis heute nichts geändert hat.
Mitte des 20. Jahrhunderts wurde die Behandlung von Texten zum Bestandteil der elektronischen Datenverarbeitung (die zunächst nur zum Rechnen gedacht war). Nun fand die Schreibmaschinentastatur Anschluss an den Computer. Von da an war das System schneller als die flinkste Typistin, die Tastatur wurde sozusagen zum Bremsklotz.
Jetzt steht der nächste Schritt bevor: Der Computer hat gelernt, nicht nur aus Text Sprache zu machen, sondern auch gesprochene Sprache zu geschriebenem Text. Die Tastatur wird – jedenfalls zum Teil – überflüssig. Hinter der neuen Technik stehen jahrelange Versuche und Entwicklungen und diverse verfrühte Produkteinführungen, die hauptsächlich zu Heiterkeit bei den Benützern führten. Ein Paradebeispiel war vor Jahren die sprachgesteuerte Fahrplanauskunft der SBB. Die telefonischen Dialoge mit dem Computer waren oft kabarettreif. Inzwischen sind die Sprachsysteme erheblich besser geworden.
Aus Lauten werden Buchstaben
Entwickelt wurde die Software, die aus den akustischen Phonemen die entsprechenden Buchstaben ableitet, von Forschungslabors prominenter Unternehmen wie IBM und Philips. Inzwischen sind die Patente dieser Multis an die amerikanische Firma Nuance übergegangen, die auf Software für die Text- und Spracherkennung spezialisiert ist. Bekannt ist Omnipage, eine Software, die aus gescannten Textvorlagen bearbeitbare Dateien macht. Den gleichen Erfolg erhofft sich das Unternehmen nun mit Spracherkennungsprogrammen. Zunächst wurde die Technik – noch von IBM und Philips – in bestimmten ProfiAnwendungen eingesetzt, hauptsächlich in der Medizin und im Rechtswesen. Die Software wurde massgeschneidert, indem Fachausdrücke einbezogen wurden, was die Erkennungssicherheit verbessert.
In Deutschland bereits weitverbreitet, in der Schweiz im Universitätsspital Basel in der Einführungsphase ist die akustische Erfassung von Ärzteberichten. Vor allem die Radiologen nutzen die Technik, um ihre Kommentare zu Röntgenbildern direkt in den Computer zu diktieren. Im Sekretariat oder durch den Arzt selber werden am PC noch kleine Fehler verbessert. Sofort liegt der Bericht dann schriftlich vor, bei den früheren Arbeitsabläufen konnte das Tage dauern. Sehr viel Text zu verarbeiten gibt es auch bei Rechtsanwälten und an Gerichten. Auch in dieser Branche beginnt sich das Computerdiktat langsam, aber sicher durchzusetzen.
Diktieren üben statt tippen lernen
Für die Benützer ergeben sich neue Anforderungen, auf die künftig auch in der Ausbildung eingegangen werden muss. Diktieren ist nicht das Gleiche wie tippen. Rationell ist ein elektronisches Diktat nur dann, wenn hinterher wenig Korrekturen vorgenommen werden müssen. Diszipliniertes Sprechen ist Voraussetzung für das Erzeugen guter Dokumente. Die Chefs alter Schule, die ihrer Sekretärin druckreife Texte diktieren konnten, sind aber ausgestorben, seit sich auch Führungskräfte persönlich an der Tastatur versuchen.
Michael-Maria Bommer, General Manager von Nuance für die Schweiz, hält die Spracherkennung nicht nur in bestimmten Branchen für zukunftsträchtig. Angewendet werden NuanceProdukte bereits in Callcentern, bei denen sich der Anrufer im Dialog mit dem System zur richtigen Information oder zur richtigen Person navigieren kann. Beim Fernsehen in verschiedenen Ländern werden damit Untertitel live getextet (TA vom 13. Mai).
Bei der britischen Polizei sind erste Beamte mit einem Blackberry-Handy ausgerüstet worden, über das sie Unfallrapporte direkt an einen Computer diktieren. Wenn sie nach einem Ausseneinsatz auf den Polizeiposten zurückkehren, können sie den Rapport schriftlich abrufen und fertigstellen. «Die Papierarbeit konnte so um 80 Prozent reduziert werden», sagt Bommer, der zahlreiche weitere Anwendungen im Visier hat. Es gebe bereits Unternehmen, welche als Dienstleistung anbieten, Telefondiktate entgegenzunehmen, daraus Dateien zu erzeugen und diese den Kunden zu mailen. In einem speziellen Projekt wird die Sprachausgabe und -erkennung für die Schule erprobt. Und selbstverständlich hat sich das Militär die neue Technik schon zunutze gemacht: In Kampfflugzeugen soll ein Teil der Schalter künftig per Stimme bedient werden, damit die Piloten beide Hände frei behalten.
Weit verbreitet ist die Sprachsteuerung bei den GPS-Navigationshilfen im Auto, bei Handys und zunehmend bei der Unterhaltungselektronik – im Hintergrund sind auch da Produkte des unbekannten Softwareriesen Nuance im Einsatz. Bommer glaubt, dass die Informationstechnik künftig nicht mehr nur «hands free», sondern auch «eyes free» sein werde. Dank dem Dialog mit den Systemen in gewöhnlicher Sprache könne der Benützer die Technik vollständig vergessen. (Tages-Anzeiger)
Erstellt: 08.09.2009, 12:52 Uhr
KOMMENTAR SCHREIBEN
Wissen
Meistgelesen in der Rubrik Wissen
Die Top-Themen im 
Body Coach
-
Der BodyCoach hilft Ihnen, gesund und nachhaltig abzunehmen. Er stellt einen individuellen Ernährungsplan zusammen, erstellt Einkaufslisten, schlägt Rezepte vor und unterstützt Sie beim Training.









