Computergestützte Literaturwissenschaft als
Kulturwissenschaft. Eine Wunschliste

Abstract

In view of the methodological premises informed by the cultural turn, researchers in literary and cultural studies are engaging in a promising critical endeavor that demands computer-assisted research techniques in order to fulfill its enormous potential. To analyze the delicate relationships between literary works and their cultural context(s) in a comprehensive and traceable manner scholars of literature and culture need convenient computational environments and standards that meet the specific needs of these fields of research. This article introduces a wish list to propose a number of basic requirements for computer-aided research practices and applications in literary and cultural studies and closes with an open invitation to critical discussion and continuation of that list.

[1] 

Literaturwissenschaft ist in der Praxis immer noch eine Disziplin, in der die Forschungsarbeit im Wesentlichen von Einzelpersonen vollzogen wird. Anders als in den Natur- und Sozialwissenschaften sind Projekte, in denen größere Gruppen mit einem gemeinsamen Erkenntnisziel forschen, in unserem Fach unüblich. Größere Forschungsverbünde, wie sie aufgrund der dominanten Förderungspolitik inzwischen unumgänglich geworden sind, bündeln in den Geisteswissenschaften thematisch mehr oder minder verwandte Einzelprojekte und resultieren in Sammelbänden, die nur in seltenen Fällen die Bedeutung der monographischen Arbeiten erreichen. Man wäre unter Literaturwissenschaftlern kaum in der Lage, Einigkeit über eine Liste drängender Forschungsfragen zu erzielen, die derzeit auf der Agenda stehen und irgendwann zur allgemeinen Zufriedenheit dann auch beantwortet sein werden.

[2] 

Das liegt natürlich zu einem Gutteil in der Natur des Faches begründet. Literarische Texte sind immer neu und in einer Vielzahl von Bezügen interpretierbar – ein Vorgang, der nicht zu einem abgeschlossenen Ergebnis führt und auch nicht darauf angelegt ist. Andererseits mag man darin aber auch eine gewisse Überschätzung der Findekunst und Verstehensleistung des einzelnen Forschers erkennen. Der Literaturwissenschaftler begreift sich ungern als Rädchen im Getriebe eines übergeordneten Erkenntnisprozesses, sondern häufig immer noch als eine Persönlichkeit, deren geistig-kultureller Horizont im hermeneutischen Verstehensakt mit dem des großen Kunstwerks verschmilzt – selbst wenn die dahinterstehende Wissenschaftsauffassung den meisten längst obsolet erscheinen dürfte.

[3] 

Spätestens mit dem cultural turn, der kulturwissenschaftlichen Wende in den Geisteswissenschaften zu Beginn der 1980er Jahre, hat sich jedoch auch die Material- und Sachlage literaturwissenschaftlicher Forschung noch einmal entscheidend gewandelt. Der literarische Text wird seither in einen kulturellen Kontext gestellt, der weit über die in der Fachbereichsbibliothek präsente Höhenkammliteratur hinausgeht, die man sich im Verlaufe eines Forscherlebens noch weitgehend aneignen konnte. Seit Konsens darüber besteht, dass die paradigmatische Achse, deren Rekonstruktion allererst die wissenschaftlich qualifizierte Lektüre eines Textes ermöglicht, im Prinzip in alle Bereiche der Kultur ragen kann, gilt: »even if one’s interests were exclusively with high culture, it would be important to cast one’s interpretive net broadly, to open up the windows of culture at large«. [1] Das Archiv, das der Literaturwissenschaftler im Prinzip bearbeiten müsste, um seinem Gegenstand gerecht zu werden, wird damit unüberschaubar groß, die Komplexität der in ihm möglichen relevanten Bezüge wächst ins Unermessliche.

[4] 

Aus der Fortführung der alten, individualisierten Wissenschaftspraxis vor diesem Hintergrund neuer methodologischer Prämissen aber ergibt sich, so haben wir andernorts schon ausführlich argumentiert, schlechte Wissenschaft. [2] Der kulturwissenschaftlich arbeitende Literaturwissenschaftler erschließt sich zwar in jahrelanger Archivarbeit ein (beispielsweise medizinhistorisches) Textarchiv, um seine literarischen Texte dazu in Bezug zu setzen. Dieses Archiv selbst jedoch gelangt nicht als solches, sondern nur in Form seiner eigenen Paraphrasen, Zitate und Bibliographie in den Wissenschaftsdiskurs. Kaum ein Kollege wird sich der Mühe dann noch einmal unterziehen, dieses Archiv zu rekonstruieren und zu rezipieren. Das bedeutet aber, dass die Ergebnisse der kulturwissenschaftlichen Arbeit zum einen nicht mehr seriös überprüfbar sind, zum anderen aber auch kaum mehr anschlussfähig für eine Forschung sind, die sinnvoll darauf aufbauen wollte.

[5] 

Dies ist in groben Zügen die Lage, in der sich die Literaturwissenschaften derzeit befinden. Aber auch im bibliothekarischen Bereich mögen noch nicht alle bemerkt haben: Die Zeit der Schlagwortkataloge und Indices ist vorbei. In absehbarer Zukunft wird das gesamte Textarchiv in digitaler Form zur Verfügung stehen – das Zeitalter der Volltextsuche bricht an. Kulturwissenschaftliche Fachzusammenhänge werden sich in Zukunft darüber definieren, welche Archive und Teilarchive mit welchen Suchbefehlen durchsucht werden und wie die jeweiligen Trefferlisten ausgewertet wurden.

[6] 

Es handelt sich um eine Situation, die nach einer neuen Ebene technischer Praxis, nämlich nach regelmäßiger Unterstützung durch Computertechnik verlangt. Der Forscher muss jederzeit mit den Archiven anderer arbeiten können, ohne deren Texte im Einzelnen bereits zu kennen. Das Desiderat einer kulturwissenschaftlich arbeitenden Literaturwissenschaft besteht darin, ihre Texte und Kontexte in Form großer Textarchive zur Verfügung zu haben und diese bearbeiten zu können, und zwar so, dass die Arbeitsschritte für andere Forscher stets nachvollziehbar, wiederholbar und damit überprüfbar, korrigierbar und ergänzbar bleiben. Damit sind Bedingungen für eine zukunftsfähige Literaturwissenschaft angesprochen, die derzeit weit davon entfernt sind, realisiert zu sein. Deshalb hat das Folgende den Charakter einer Wunschliste. [3]

[7] 

1. Digitales Volltextarchiv

[8] 

Alle Texte, die Gegenstand kulturwissenschaftlicher Forschung werden, sollen in Form digitaler Volltexte in einem Archiv vorliegen.

[9] 

An dieser elementaren Bedingung scheitern die bisherigen Ansätze zur computergestützten literaturwissenschaftlichen Arbeit. Wenn es überhaupt solche Projekte gibt, dann erstellen sie jeweils ihr eigenes Mikro-Archiv, eine Zusammenführung der Teilarchive in einem gemeinsamen Format findet nicht statt. Dabei würde nichts die deutsche Sprache, Literatur und Kultur sowie die ihnen jeweils entsprechenden Wissenschaften auf Dauer nachhaltiger fördern als eine komplette Digitalisierung ihrer Textbestände. In der englischsprachigen Welt hat man das bereits erkannt.

[10] 

Die Erarbeitung und Bereitstellung kultureller Feldtexte in digitaler Form (zum Beispiel als Nebenprodukt kulturwissenschaftlicher Dissertationen) sollte selbstverständlicher Bestandteil jedes kulturwissenschaftlichen Projektes sein, bevorzugt gefördert und akademisch belohnt werden. Derzeit stehen Förderinstitutionen wie die DFG Digitalisierungsprojekten eher zögerlich gegenüber, und wer seine Quellen anderen zur Verfügung stellt, wird eher bestraft als belohnt. Urheberrechte sind ein weiteres Hindernis.

[11] 

2. Kein Tagging, keine Indices

[12] 

Die Texte des Archivs sollen flexibel handhabbar und übertragbar bleiben. Eine Standardformatierung genügt. Das Archiv soll möglichst ohne Taggings und Indices auskommen.

[13] 

Was bisher von Taggings geleistet wurde und somit Veränderungen des Archivbestandes bewirkte, soll zukünftig allein über die Formulierung und Verwaltung von Suchbefehlen geleistet werden. Es kommt ja darauf an, zu finden, was bisher noch nicht gefunden wurde (und daher nicht indiziert sein kann). Das Archiv selbst bleibt auf diese Weise leicht handhabbar und kann ohne Probleme übertragen, übernommen, geteilt und ergänzt werden. Archive veralten nicht, Taggings, Indices und Formatierungen jedoch sehr wohl. Das bisherige Fehlen eines übergeordneten Digitalisierungsprojektes für deutschsprachige Texte hat seinen Grund auch in der Markierungspraxis, die sich natürlich je nach Projekt unterscheidet. Das ist der falsche Weg. Funde von Suchaufträgen sind Forschungsergebnisse. Wie in der bisherigen Forschung ist es nicht sinnvoll, diese in die Primärtexte selbst einzutragen. Es geht darum, eine Wissenschaftspraxis zu etablieren, die wesentlich im sinnvollen, progressiven und differenzierten Umgang mit Suchbefehlen und Fundlisten besteht.

[14] 

3. Kookkurrenzen

[15] 

Das gesamte System zur Erzeugung und Verwaltung von Suchbefehlen hätte eine besondere Sensibilität für Kookkurrenzen und ihre Wahrscheinlichkeit in gewissen Kontexten zu entwickeln.

[16] 

In der Regel wird eine Suche im kulturellen Archiv durch auffällige Fügungen im Syntagma des manifesten Textes ausgelöst (Regel: Erst finden, dann suchen!). Typischerweise würde man also das Archiv nach Kookkurrenzen durchsuchen, nach dem gemeinsamen Auftreten, nach Kontiguitätsverhältnissen zweier ›Types‹. Auch bei der Suche nach Einzelbegriffen kommt es letztlich ja auf das Finden von deren Kombinationsmöglichkeiten an; denn diese, nicht die immer identischen ›Token‹ des Begriffs, nach dem gesucht wurde, sind zueinander äquivalent, bilden also Paradigmen.

[17] 

4. Trefferliste

[18] 

Aufgrund ihrer paradigmatischen Natur sollen die Treffer in Form einer Liste dargestellt werden. Diese Liste enthält die Fundstellen (markiert) mit Minimalkontexten und den jeweiligen Fundtext.

[19] 

Dies ist bereits standardmäßiger Bestandteil von Suchfunktionen in digitalen Bibliotheken, und das ist kein Zufall: Die Liste (paradigmatisch), nicht der Hypertext (syntagmatisch) ist die sinnvolle Repräsentationsform diskursiver Zusammenhänge. Die Fundstellen ergeben einen Diskurs, die Fundtexte das Diskurskorpus. Die markierten Okkurrenzen in den Minimalkontexten sollten mit den Fundstellen im Diskurskorpus verlinkt sein. Zusätzlich müsste eine quantifizierende Auswertung mitlaufen (Anzahl der Treffer im Korpus, Anzahl der Treffer pro Text et cetera), die mit Visualisierungsfunktionen zur graphischen Darstellung relativer Verteilungen der Fundstellen im Archiv verknüpft ist.

[20] 

5. Verwaltung und Bearbeitung der Trefferlisten

[21] 

Wichtigstes Forschungsinstrument wäre ein System zur Verwaltung von Suchbefehlen und Trefferlisten.

[22] 

Erst finden, dann suchen! Dann findet man wieder etwas, nämlich in der Lektüre weiterer Texte des Diskurskorpus (Regel: Erst suchen, dann lesen!), woraufhin man weiß, wonach man weiter suchen soll (und wonach nicht). Suchbefehle und Trefferlisten können gemeinsam abgespeichert werden. Trefferlisten können bearbeitet werden (zum Beispiel mit Filtern) – letztlich sollte aber jeder Liste, auch zum Beispiel einer bereinigten, ein entsprechend komplexer Suchbefehl zugeordnet bleiben, der, auf dasselbe Archiv angewandt, diese Liste reproduziert. Nur so bleiben die Überprüfbarkeit und Anschlussfähigkeit gewährleistet, um die es hier geht.

[23] 

Es sollte sowohl die Kombination als auch der Abgleich (Vergleich der Übereinstimmung der Fundtexte, der Quantitäten; Schnittmengen et cetera) mit anderen Listen ermöglicht werden. Auf diese Weise kann die Arbeit an komplexen Suchbefehlen in literarhistorische Thesen und Befunde überführt werden, deren Geltung auch quantitativ – in Bezug auf das gesamte untersuchte Archiv – behauptet (und bestritten) werden kann. Solcherart gestützt und beglaubigt, kann die Darstellung der Forschungsergebnisse dann auch problemlos wieder mikrologisch-anekdotisch an wenigen konkreten Texten erfolgen, wie es ja das Erfolgsrezept des New Historicism war.

[24] 

6. Automatische Erweiterungsangebote

[25] 

Die individuellen Suchbefehle müssten aufgrund von früheren Sichtungen des Archivbestandes automatisch erweiterbar sein.

[26] 

Eine hilfreiche Einrichtung wäre es bereits, wenn ein Suchbegriff nach seiner Eingabe standardmäßig ein Menü auslösen könnte, das beispielsweise historische Schreibvarianten, Synonyme, fremdsprachliche Übersetzungen und Flexionsformen enthält und zur Sammelsuche anbietet. Es müsste darüber hinaus aufgrund quantifizierender Erhebungen möglich sein, Begriffe mit einer gewissen Wahrscheinlichkeit bestimmten Wortfeldern, kulturellen Frames, enzyklopädischen oder Diskurszusammenhängen zuzuordnen (zum Beispiel über WordNet). Das ermöglicht eine Erweiterung der Archivsuche um weitere Schlüsselbegriffe, die automatisch angeboten werden könnten. Wenn die Ausgangs-Kookkurrenz zum Beispiel die Elemente Zweiter Weltkrieg und Parfüm enthält, könnte man auch nach Konzentrationslager und Parfüm, Bombenkrieg und Parfüm et cetera suchen lassen.

[27] 

7. Intuitive Bedienbarkeit

[28] 

Die genannten Funktionen sollten über eine grafische Benutzeroberfläche intuitiv zugänglich und handhabbar gemacht werden.

[29] 

Eine computergestützte Rechercheumgebung müsste im Sinne der gewünschten Anforderungen die einzelnen Funktionsbereiche in einer Art und Weise zugänglich machen, die es Literatur- und Kulturwissenschaftlern erlaubt, auch ohne besondere Spezialkenntnisse und Schulung damit zu arbeiten. Insbesondere in den Geisteswissenschaften ist die regelmäßige Nutzung von Computern und computergestützten Analyseinstrumenten alles andere als eine tradierte und selbstverständliche Praxis. Gerade deshalb ist es um so wichtiger, dass der Umgang mit Programmfunktionen und der Zugriff auf Analyseergebnisse über grafische Benutzeroberflächen gewährleistet wird, deren Aufbau sich an verbreitenden Standards orientiert (übliche Windows/Office-Anwendungen) und deren Bedienung sich dem Anwender intuitiv erschließt. Nur so ist es möglich, Berührungsängsten gegenüber derart technischen Hilfsmitteln schon auf der Ebene der Benutzerführung mit einem Interface-Design entgegenzuwirken, das dem literaturwissenschaftlichen Interesse nicht opak im Wege steht. Integrierte und effizient platzierte Hilfefunktionen wären in diesem Zusammenhang ebenso wünschenswert wie ein integriertes Lernprogramm, das etwa anhand eines Beispielarchivs zum angeleiteten Ausprobieren der verschiedenen Funktionen einlädt und in der Lage ist, unkompliziert und spielerisch eine Einführung in die wichtigsten Zusammenhänge zu geben.

[30] 

Eine Diskussion ebenso wie eine Fortsetzung dieser Wunschliste ist ausdrücklich erwünscht. In der Zusammenarbeit mit Duisburger Computerlinguisten und Philologen arbeiten wir an einer praktischen Umsetzung einiger dieser Forderungen in Form der Kultur- und Literaturwissenschaftlichen Lern- und Arbeitsumgebung KUWALU. [4]


[1] 
Gallagher/Greenblatt (2000: 13).
[2] 
Baßler (2005: 321–332).
[3] 
Die Wunschliste beruht auf Baßler (2005) und wurde in einer ersten Form vorgestellt auf dem Workshop Suchbefehle analog/digital am Zentrum für Wissenschaftsforschung in Berlin im April 2007, organisiert von Moritz Baßler und Uwe Wirth.
[4] 
Vgl. dazu ausführlich: Butler/Höppner/Wagner 2007.