Kuckucksrufe aus dem Computer

Digitale Geisteswissenschaft in Aktion: Analytische Textprogramme überführten J. K. Rowling als Autorin von «The Cuckoo’s Calling». Und sie können noch mehr, unheimlich viel mehr.

Wurde von einer Software entlarvt: Autorin Rowling. (16. Oktober 2012)

Wurde von einer Software entlarvt: Autorin Rowling. (16. Oktober 2012) Bild: Keystone

Feedback

Tragen Sie mit Hinweisen zu diesem Artikel bei oder melden Sie uns Fehler.

Endlich einmal einen Roman ohne Erwartungsdruck, Marketingschlachten und Massenhysterie schreiben: Für Joanne K. Rowling war ihr inkognito veröffentlichter Krimi «The Cuckoo’s Calling» eine wunderbare Erfahrung. Das war es auch für Peter Millican, Philosoph und Computerphilologe am Oxforder Hertford College: Signature, die von ihm entwickelte Software für statistische Stilanalysen, half zu beweisen, dass Rowling die Autorin war.

Signature und JPAAG, ein ähnliches Programm seines Pittsburgher Kollegen Patrick Juola, hatten unabhängig voneinander neun Bücher von Rowling und den englischen Krimiautorinnen Val McDermid, Ruth Rendell und P. D. James auf signifikante Muster wie Worthäufigkeiten, Satz- und Abschnittlänge überprüft und dabei Rowling mit einer Wahrscheinlichkeit von 16:1 als Autorin von «The Cuckoo’s Calling» identifiziert. Die Computerdetektive fanden zwar keine gerichtsfesten Beweise oder gar «smoking guns» (Juola), aber «robuste Hinweise». Genug für die «Sunday Times», um mit ihrem durch eine Twitter-Nachricht geweckten Verdacht an die Öffentlichkeit zu gehen.

Der Erfolg der stilometrischen Analysen ist Wasser auf die Mühlen der Digital Humanities, wie die computergestützten Geisteswissenschaften im akademischen Jargon heissen. Unter diesem Oberbegriff fasst man die Versuche von Literatur-, Kunst- und Kulturwissenschaftlern, mathematische Modelle und Algorithmen aus Natur- und Sozialwissenschaften auf kulturelle Produkte – Kunstwerke, Romane, historische Quellen, archäologische Fundstücke – anzuwenden.

Algorithmen statt Intuition

Die theoretischen Grundlagen dafür wurden schon im 19. Jahrhundert entwickelt, lange vor der Erfindung des Computers, und das Verfahren hat sich seither vielfach bewährt. Editionsphilologen analysieren mit digitalen Werkzeugen Überlieferungsvarianten, Gerichtspsychologen Drohbriefe, Sprachhistoriker lexikalische Veränderungen. 1996 wurde der US-Journalist Joe Klein durch Computer-Stilanalysen als Autor des Skandalromans «Primary Colors» überführt.

Es gibt mittlerweile zahlreiche Studiengänge, Lehrstühle, Zeitschriften und neuerdings auch einen Verband «Digital Humanities im deutschsprachigen Raum», aber noch immer stossen Literaturinformatiker und Computerlinguisten auf Skepsis und Naserümpfen. Nicht nur, weil die Grenzen und das Selbstverständnis des neuen Forschungszweigs noch unscharf sind.

Selbst die führenden Vertreter streiten noch darüber, ob sie technische Hilfstruppen der Geisteswissenschaften sind oder Vorreiter eines revolutionären Paradigmenwechsels: Von der Intuition zum Algorithmus, von der einfühlsamen, aber vagen und subjektiven Hermeneutik zur mathematisch exakten Berechnung von Mustern, Modellen und Wahrscheinlichkeiten.

Für Erez Aiden, der in Harvard eine (von Google gesponserte) «Sternwarte der Kultur» unterhält, ist die Sache klar: Wer auf die 500 Milliarden Wörter des Google-Kosmos zurückgreifen kann, kann den Literaturwissenschaftlern «ein paar interessante Brocken auf den Tisch legen». Aiden betreibt «Culturomics» nach dem Vorbild von Genetik, Biologie und Epidemiologie: Mit Big-Data-Analysen bestimmt er Abstammungs- und Verwandtschaftsbeziehungen, kulturelle Wanderungsbewegungen und Innovationsschübe.

Der Anspruch, Literatur durch schiere Rechenkraft wissenschaftlich zu erschliessen, ist eine schwere Kränkung für Dichter und Denker. Wenn Rechenknechte und bildungsferne Nerds dem Schönen, Guten und Wahren mehr Erkenntnisse abringen können als der solitäre Interpret in seiner Klause, kann die Literaturwissenschaft mit ihrem «close reading» einpacken.

Das dichte Lesen nahe am Text, die profane Version der theologischen Bibelexegese, ist die Existenzgrundlage jeder Philologie. Meisterdenker wie Jacques Derrida schrieben ganze Bücher über das Wort «Yes» im «Ulysses» oder die Funktion der Nähmaschine im Surrealismus. Aber selbst der fleissigste Literaturwissenschaftler kann nicht alles in allen Sprachen lesen. An diesem Punkt setzt die Computerphilologie an. Sie setzt auf «distant reading»: Je grösser die untersuchte Datenmenge und der Abstand zum Stoff, je feiner die Filter beim Surfen und Schürfen, desto mehr Wissensnuggets bleiben im Sieb hängen. Erkenntnis, so die Milchmädchenrechnung, wächst proportional mit der Quantität der Daten.

Digital Humanities sind demokratische Gleichmacher: Sie wenden dieselben Methoden auf eine Gebrauchsanleitung wie auf Goethes «Faust» an (was den Kritikern des eurozentrischen Bildungskanons nicht ungelegen kommt). Ihre Werkzeuge stehen prinzipiell jedem zur Verfügung. Sie scannen riesige Textmassen auf lexikalische, syntaktische und semantische Muster und spucken auf Knopfdruck hübsche Stammbäumchen, Kurven und Diagramme aus. Bisher richtete sich ihr Fokus meist auf tote Autoren und vergangene Epochen; bald schon werden sie Trends extrapolieren, Bestseller planen und Ereignisse vorhersagen wollen.

Literaturwissenschaft 2.0 liefert nützliche Erkenntnisse, aber man darf sie nicht überschätzen. So wurde beim Digital-Humanities-Kongress 2012 in Hamburg zweifelsfrei nachgewiesen, dass in Dickens’ Romanen auffällig viele Menschen mit Händen in den Hosentaschen vorkommen.

Signature und JGAAP erkannten markante Unterschiede zwischen Val McDermid und Joanne K. Rowling, aber die gewählten Parameter waren eher trivial und exotisch: Kommasetzung, durchschnittliche Wortlänge, sinnlose 4-Buchstaben-Kombinationen («character 4-grams») wie «nsid». Schon bei der Frage, was Plagiat, unbewusste Nachahmung oder souverän gestaltete Inspiration ist, gerät das Programm ins Schlingern, und bei der Auswertung des Datensalats muss die Stilometrie vollends passen. Ohne Menschen geht es noch nicht: Sie müssen die Computer anlernen und füttern, die richtigen Algorithmen entwickeln und am Ende eine schlüssige Interpretation oder wenigstens eine windige Hypothese bieten.

Wo ist der digitale Shakespeare?

Aber auch der Schachcomputer hat einmal klein angefangen und schlägt heute Weltmeister. Die Digital Humanities stecken noch in den Kinderschuhen, die Geisteswissenschaften schon seit Jahrzehnten in der Krise. Franco Moretti prophezeite der Literaturwissenschaft schon im Jahr 2000, sie werde immer mehr «eine Geschichte aus zweiter Hand werden, ein Patchwork aus der Forschung anderer ohne direkte Textlektüre». Noch weiter ging 2008 der «Wired»-Chefredaktor Chris Anderson: Algorithmen, Korrelationen und Symmetrien machten Thesen und Theorien bald gänzlich obsolet.

Er hat vielleicht nicht einmal ganz unrecht. Eine Literatur, die nur noch kurzatmig googelt, bloggt und quasi automatisch Textbausteine verarbeitet, kann problemlos maschinell gelesen werden. Schreibprogramme wie Narrative Science oder Automated Insights erstellen schon jetzt selbsttätig journalistische Texte oder experimentelle Lyrik. Ein digitaler Shakespeare (oder auch nur ein brillanter Literaturkritiker) ist allerdings noch nicht in Sicht.

Digital Humanities sind so faszinierend wie unheimlich. Sie stellen nicht nur unser Verständnis von Kultur, klassische Begriffe wie Originalität, Genie oder Kunstautonomie infrage, sondern liefern Literatur und Geist auch der erkennungsdienstlichen Behandlung aus. Programme, die Texte maschinell auf verdächtige Triggerwörter abtasten und Autorenprofile daraus erstellen, gibt es ja nicht nur in Oxford, sondern auch bei Google, Facebook und den Geheimdiensten. Der Grosse Bruder im Nacken aber bereitet Schriftstellern, Lesern und selbst Peter Millican eher Beklemmung: 2008 lehnte er das Ansinnen eines republikanischen US-Politikers ab, Barack Obama durch die stilometrische Durchleuchtung seiner Autobiografie als Lügner zu überführen.

Erstellt: 26.07.2013, 08:06 Uhr

Rowling, Joanne K. alias Galbraith, Robert, «The Cuckoo's Calling», Little, Brown Book Group, 384 Seiten, ISBN 978-1-4087-0400-4, CHF 29.90. Erscheint im Juli.

The Cuckoo's Calling

Artikel zum Thema

J. K. Rowling ist sauer

Die Anwaltskanzlei, welche die Rechte der Harry Potter-Autorin vertritt, ist schuld daran, dass ihr Autorendeckname aufflog. Mehr...

Angeblicher Ex-Polizist ist in Wahrheit J. K. Rowling

Drei Monate lang hat J. K. Rowling ihre Anonymität bewahrt – jetzt kam heraus, dass sie unter einem Pseudonym ein neues Buch schrieb. Ein schlauer PR-Coup? Oder tatsächlich die Erfüllung eines tiefen Wunsches? Mehr...

Die Redaktion auf Twitter

Stets informiert und aktuell. Folgen Sie uns auf dem Kurznachrichtendienst.

Weiterbildung

Gamen in der Schule

Die Schule bereitet Kinder auf die Arbeitswelt vor. Das Rüstzeug soll auch spielerisch vermittelt werden.

Kommentare

Die Welt in Bildern

Zum Anbeissen: Dieser Eisfischer in Peking versucht sein Glück mit mehreren Angeln. (7. Dezember 2019)
(Bild: Ma Wenxiao (VCG/Getty Images)) Mehr...