MATHIAS BERTRAM (HG.): Digitale Bibliothek: DEUTSCHE LITERATUR VON LESSING BIS KAFKA. DIRECTMEDIA: BERLIN 1997.

An der Entwicklung neuer Formen des Textzugriffs, die durch digitale Bibliotheken möglich geworden sind, hat die Germanistik bislang nur wenig Anteil genommen. Einer der Gründe dafür ist der Mangel an brauchbaren Texten in deutscher Sprache. Nun ist eine neue CD-ROM erschienen, die verspricht diesen Mangel zu beheben. Die CD-ROM trägt, wie bereits einige andere Projekte, einen Namen, der großes verheißt: Deutsche Literatur von Lessing bis Kafka. Anders als die Konkurrenz löst dieses Produkt das Versprechen aber auch wirklich ein. Über 70.000 Textseiten von über 60 Autoren sind auf der CD enthalten und sollen den Kanon der deutschen Literatur von der Aufklärung bis zur Moderne repräsentativ erfassen: 

Dies bedeutete zum einen, möglichst viele der immer wieder gelesenen, diskutierten und analysierten, kurz der kanonisierten Werke der deutschen Literatur zu erfassen, zum anderen aber auch, möglichst alle wichtigen literarischen Entwicklungen und Erscheinungen dieser Periode durch repräsentative Beispiele zu belegen. (Beiheft S. 4)

Die Auswahl konzentriert sich auf die poetischen Werke der Dichter, und – das zeigen die Stichproben – es ist dem Herausgeber meistens gelungen, eine überzeugende Selektion vorzunehmen. Die Prinzipien der Textauswahl sind recht transparent. Vollständigkeit wurde nicht angestrebt, sondern vom poetischen Werk der gewählten Autoren sollte möglichst alles, was sich noch in der (literaturwissenschaftlichen) Diskussion befindet, vorhanden sein; das kritische Werk wurde nur in den Fällen berücksichtigt, wo es ganz zentral zum Autorkorpus zu rechnen ist, zum Beispiel Schillers ästhetische Schriften oder Herders Aufsätze. Wie der Berliner Germanist Mathias Bertram, der die Textauswahl zu verantworten hat, selbst in seinem Vorwort betont, wird seine Auswahl immer einige unbefriedigt lassen. So fehlen neben den von ihm erwähnten Lyrikern Rückert und von Platen, auch Essayisten wie Ludwig Börne oder die kanonisierte Trivialliteratur von Kotzebue bis Karl May. Die Auswahl der modernen Autoren scheint eine morbide Vorliebe für Frühverstorbene wie Kafka und Trakl zu zeigen, während Benn oder Musil fehlen. Der Herausgeber macht kein Geheimnis aus dem Umstand, daß in diesen Fällen die Copyright-Gesetze eine Rolle gespielt haben. Kafkas Schriften sind schon frei, während Benn und Musil noch geschützt sind. Der beeindruckend günstige Preis hätte sich bei einer anderen Vorgehensweise aber wohl kaum halten lassen. Auch die Auswahl aus dem Werk eines Autors mag im Einzelfall zu diskutieren sein. Warum fehlen zum Beispiel gerade die Gedichte Fontanes? Aber solche Kleinigkeiten verblassen angesichts der ungeheuren Textmenge, die hier mit einem Schlag zur Verfügung gestellt wird, zur Bedeutungslosigkeit.

Ein großer Vorteil der »Digitalen Bibliothek« ist Verwendung und Nachweis zitierfähiger Ausgaben. Es handelt sich in den meisten Fällen um die modernisierten Standardausgaben der Klassiker aus den Verlagen Hanser, Winkler, Aufbau, Insel, die in den Bücherschränken von Germanisten zu finden sind. Die Benutzeroberfläche kann so eingestellt werden, daß die Bandangabe und Seitenzählung der Vorlage eingeblendet wird und die Fundstellen somit also sofort zitiert werden können. Allerdings haben die Copyright-Gesetze auch hier mitgewirkt: Der Verlag konnte nicht immer die neueste Auflage wählen. So liegt den Goethe-Texten zum Beispiel die Hamburger Ausgabe von 1959 zugrunde oder der Fontaneauswahl die Ausgabe von Peter Goldammer und anderen im Aufbau-Verlag von 1973. Hat sich nun in den neueren Drucken dieser Ausgabe der Satzspiegel verschoben, wie zum Beispiel im Falle der Fontane-Texte, wird man die Passage nicht in seiner Druckausgabe finden – zitieren kann man aber auch aus der elektronischen.

Die Texte sind ungekürzt und unbearbeitet wiedergegeben, dadurch sind notwendigerweise Inkonsistenzen der Schreibung innerhalb der Ausgabe entstanden, die bei der Suche nach Worten berücksichtigt werden müssen; man muß sowohl nach »Sein« als auch nach »Seyn« recherchieren. Die Fehlerquote im Vergleich zur gedruckten Vorlage wurde im Rahmen der vorliegenden Rezension nicht überprüft.[1] Aus nicht ganz verständlichen Gründen wurde auf die Wiedergabe von Abbildungen verzichtet. Passagen in griechischer Schrift sind transkribiert worden.

OBERFLäCHE UND NAVIGATION

Das Erschließungsprogramm ist eine Eigenentwicklung des Verlags.[2] Das merkt man dem Programm im Guten wie im Schlechten an. Vor allem im Guten. Die Oberfläche ist einfach gehalten und ermöglicht eine schnelle Orientierung ohne großen Lernaufwand. Zur Lektüre kann man sich mittels des Inhaltsverzeichnisses schnell durch den Text bewegen. Die Autorenliste ist alphabetisch sortiert und innerhalb eines Autorkorpus sind die Texte nach Gattungen gegliedert.[3]

Besonders gelungen sind die Programmöglichkeiten zur Lektüre im Text. Man kann das Funktionsregister ausblenden und auf diese Weise zwei Textseiten anzeigen lassen. Zur besseren Orierentierung lassen sich sogar noch mehr Textseiten (8, 16, 24 und so weiter) darstellen. Die Schrift der einzelnen Seite ist dann zwar bald so klein, daß man nichts mehr lesen kann, aber durch das Hinzuschalten einer Lupe läßt sich immer eine Seite auf Lesegröße heranholen. Auf diese Weise haben die Entwickler eines der großen Probleme elektronischer Editionen elegant gelöst: Wie kann man sich im digitalen Medium über seine Position im Text orientieren? Die grobe Positionsinformation kann man außerdem einem Schieberegler entnehmen, der die Seitenlage im jeweils geöffneten Text anzeigt.

Hat man Probleme mit der Verwendung des Programms, kann man über F1 die kontextsensitive Hilfe aufrufen. Ansonsten findet man das etwas versteckte Hilfeprogramm im Menüpunkt »Diverses«, in dem sich die Druck- und Darstellungsoptionen befinden. Die Hilfefunktion bietet knapp aber erschöpfend Auskunft über alle Aspekte des Programms und ersetzt ein umfangreicheres gedrucktes Handbuch. Das mitgelieferte CD-Büchlein beschreibt auf 12 Seiten Konzeption und grundlegende Verwendungsweise der Edition. Um dem Computernovizen den Umgang mit der elektronischen Edition schneller zu vermitteln, wurden in die Hilfefunktion filmähnliche Aufzeichnungen von Arbeitsabläufen integriert. Allerdings konnte der Rezensent auf einem Rechner den Film zwar sehen, ohne etwas zu hören, während auf einem anderen PC eine freundliche Stimme etwas erklärte, das nicht zu sehen war. Microsofts Camcorder, mit dem die Animation erstellt wurde, scheint etwas Probleme mit Microsofts Betriebssystem zu haben. 

SUCHEN

Doch elektronische Bücher sind nur in den seltensten Fällen zur Lektüre geeignet. Die digitale Edition erlaubt einen Zugriff auf den Text, der das Lesen nicht überflüssig macht, sondern es vorbereitet oder die Überprüfung von Lektürehypothesen erlaubt. Diese Einstellung zum E-Text teilen auch die Macher der CD-ROM, die sich damit wohltuend von anderen Produzenten, zum Beispiel denen der ersten Reclam-CDs, absetzen: 

Unsere ›Digitale Bibliothek‹ jedenfalls will gedruckte Bücher nicht ersetzen oder gar überflüssig machen, sondern die spezifischen, bislang kaum ausgeschöpften Möglichkeiten der elektronischen Erfassung und Verarbeitung von Texten nutzen, um die Welt der Bücher neu zu erschließen. (Beiheft S. 2)

Es kann daher gar nicht genug betont werden, daß vor allem die Such- und Recherchemöglichkeiten über die Brauchbarkeit eines E-Textes entscheidet. Die Macher der »Digitalen Bibliothek« bieten gleich zwei mächtige Suchmethoden an: eine »Normalsuche« und eine »Themensuche«. Die Normalsuche erlaubt die Recherche nach einer Zeichenkette oder mehreren Zeichenketten, die mittels Boolescher Operatoren kombiniert werden können. Anstelle der definiten Zeichenkette kann man auch Platzhalter für Einzelzeichen oder Gruppen verwenden, wie sie vielen schon von ihrem Betriebssystem DOS bekannt sind (* für ein oder mehrere beliebige Zeichen, ? für ein beliebiges Zeichen). Der Benutzer kann auch auswählen, wo er suchen will: im ganzen Text, nur im Werk eines Autors, nur in einer Gattung des Werks eines Autors und so weiter Da die Verwendung Boolescher Operatoren wie UND oder ODER nicht jedermanns Sache ist, wird der Abfrage-Assistent, in den man die gesuchten Begriffe nur noch eintragen muß, vielen willkommen sein. Eine Wortliste mit den überhaupt im Korpus vorhandenen Worten steht für die Formulierung der Abfragen nicht zur Verfügung. 

Mit der Kombination von Booleschen Operatoren und Platzhaltern lassen sich bereits recht komplexe Abfragen formulieren. Da die Schreibung der Texte nicht normiert ist, wird man sich sehr bald dieser Möglichkeiten bedienen, um seinen Suchauftrag so zu formulieren, daß die Worte in allen vorkommenden Schreibungen gefunden werden (so findet man nur zum Beispiel mit der Abfrage »Toren ODER Thoren« alle Fundstellen). Werden Kollokationen gesucht (zum Beispiel »Herz UND Schmerz«), kann man den Abstand festlegen, den die beiden Worte von einander haben müssen, damit die Stelle noch als Treffer gilt. Insgesamt also eine sehr leistungsfähige, wenn auch nur mäßig schnelle Suchmaschine.

Neben dieser Normalsuche gibt es noch eine »Themensuche«, wie die Produzenten der »Digitalen Bibliothek« ihre innovatorische Suchmaschine genannt haben. Der Anwender kann in ein Textfenster eine Reihe von Begriffen notieren, jeweils einen in eine Zeile. Die anschließende Suche ermittelt alle Treffer, in denen alle oder einige der Begriffe vorkommen. Die Besonderheit liegt darin, daß nicht alle Begriffe gefunden werden müssen und somit unscharfe Suchen möglich werden (Ein Verfahren, das sich bereits bei den Internet-Suchmaschinen bewährt hat). Die Reihenfolge, in der die Suchbegriffe in der Liste stehen, gewichtet zugleich die Begriffe (Oben ist wie immer wichtiger). Nimmt man noch hinzu, daß nicht nur nach Worten gesucht, sondern die komplexe Suchsyntax der Normalsuche einschließlich Boolescher Operatoren und Platzhalter verwendet werden kann, so wird deutlich, welch mächtiges Instrument hier zur Verfügung gestellt wird. Allerdings scheint es ein technisches Problem zu geben: Das Programm bricht im Fenster der Themensuche jede längere Zeile für die Bildschirmdarstellung um. Dadurch werden aber die Teile, die in die nächste Zeile gesetzt werden, ungewollt zu einer eigenen Abfragezeile. Bis dieses Programmproblem beseitigt ist, kann man nur relativ kurze Abfragen formulieren (Die Normalsuche ist davon nicht betroffen). Die Einheit, in der sich die Worte befinden müssen, um als Treffer zu gelten, kann vom Benutzer gewählt werden: Als Einstellungen sind eine oder mehrere Seiten sowie Bücher möglich. Insgesamt kann man sagen: Die Beherrschung der Themensuche will erst erlernt sein; eine Vorselektion von Texten aus dem Korpus läßt sich aber recht schnell erreichen.

Die Ergebnisse der Suche werden in einer Trefferliste angezeigt, die eine schnelle Navigation von einem Fundort zum nächsten erlaubt. Bei komplexen Suchen mit mehreren Worten wird allerdings immer nur eines der Worte farbig hervorgehoben, was die Auswertung erschwert. Die Fundstellen eines Suchvorgangs lassen sich angenehmer Weise zu den Ergebnissen einer früheren Suche hinzufügen. Auf diese Weise lassen sich komplexe Treffermengen aufbauen, die auch abgespeichert und wieder geladen werden können. Die Trefferliste der Themensuche zeigt außerdem noch in einer Prozentzahl an, wie gut der entsprechende Eintrag als Treffer ist. Leider kann man seine Fundstellenliste nur erweitern. Wünschenswert wäre bei einer solchen Menge Text, eine schrittweise Verkleinerung der Ergebnismenge, indem man nur in den Texten mit den Fundstellen suchen kann.

Angesichts von 70.000 Seiten diverser Textsorten aus über 150 Jahren ist es als wesentliche Einschränkung zu werten, daß der Benutzer diese Menge nur nach Autoren segmentieren kann. Man kann zwar nach Worten im vorhandenen Werk Goethes suchen, nicht aber nur in allen lyrischen Texten auf der CD oder nur in Texten vor 1790. Um es präziser zu formulieren: Technisch ist auch eine Suche in allen lyrischen Texten möglich. Dazu muß man in allen lyrischen Texten Brentanos suchen. Dieser Treffermenge fügt man dann die Ergebnisse einer Suche in der Lyrik Bürgers hinzu, dann Droste-Hülshoffs, Eichendorffs, Gellerts und so weiter So kommt man ebenfalls irgendwann ans Ziel – aber dieses Verfahren ist doch sehr mühsam. Gerade für solche geistlosen Wiederholungen ist der Computer doch eigentlich wie geschaffen. Hier hätte man sich andere Segmentierungsmöglichkeiten gewünscht, insbesondere da die dazu notwendigen Informationen, also Gattung oder Entstehungszeit, bereits in der Ausgabe vorhanden sind. Andere Editionen, wie zum Beispiel die Weimarer Ausgabe der Werke Goethes von Chadwyck-Healey, lassen Abfragen auf fast alle strukturellen Informationen zu – wenn auch oft nur in einem sehr komplexen Expertenmodus. Und wenn wir schon bei den Wünschen sind: Die Verwendung regulärer Ausdrücke in der Abfrage würde gerade die Suche nach alternativen Schreibungen vereinfachen.

EXPORTFUNKTION

Die Exportfunktion ist der schwächste Teil des Programms. Das beginnt bereits bei der Markierung von Passagen, um sie dann in eine Textverarbeitung zu kopieren. Hier scheint die Seitenorientierung des Programms zu stören, die zum Beispiel die Konkordanz mit den gedruckten Vorlagen so einfach macht. Man kann nämlich einen Abschnitt nicht über die Seitengrenze hinweg markieren. Vielmehr muß man dann zweimal markieren und kopieren, für jede Seite einmal: unerfreuliche Repetitionen, die eigentlich der Rechner erledigen sollte. Die Ergebnislisten lassen sich samt Werksigle und Seitenangabe abspeichern, aber nicht die gefundenen Textstellen selbst. Wünschenswert wäre hier die Möglichkeit, das gefundende Wort mit einem definierbaren Kontext samt Stellenangabe in eine Datei abzuspeichern. 

Völlig unmöglich scheint der Export ganzer Texte zu sein. Was wiederum eine erhebliche Einschränkung bedeutet. Elektronische Texte bestehen ja aus zwei Komponenten: dem Text und der Software, mit der man den Text liest und auswertet. Eine enge Verschmelzung des Textes mit dem Programm hat den Vorteil, daß der Anwender schnell und einfach auf den Text zugreifen kann. Der Nachteil besteht darin, daß der elektronische Text genau so lange verwendbar ist, wie das Programm noch kompatibel zu Hardware und Betriebssystem ist. Deshalb wurde für die Auszeichnung literarischer Texte von der Text Encoding Initiative (TEI) ein unabhängiger Auszeichnungsstandard entwickelt. Allerdings ist Software, die diesen Standards unterstützt, noch immer selten und auch teuer. Ein weiterer Standard des Datenaustausches ist der ASCII-Zeichensatz. Dieser hat allerdings den Nachteil, Strukturinformationen nicht von Textinformationen zu unterscheiden. Es ist eine deutliche Einschränkung, daß der Export von ganzen Texten in mindestens eines dieser Standardformate nicht möglich ist. Dadurch wird der Anwender auf die elektronischen Textauswertungsmöglichkeiten eingeschränkt, die das Programm ihm bietet. Texte für weitergehende Untersuchungen, zum Beispiel für die computergestützte Stilanalyse, muß sich der Literaturwissenschaftler dann anderorts besorgen.

FAZIT

Die »Digitale Bibliothek« bietet mit ihrer beeindruckenden Textmenge einen brauchbaren Querschnitt durch die deutsche Literatur von der Aufklärung bis zur klassischen Moderne. Die leicht erlernbare Oberfläche ist auf die Bedürfnisse und Kenntnisse von Philologen zugeschnitten und ermöglicht wohl auch dem Computerlaien sehr bald ein effektives Arbeiten. Leistungsfähige und innovative Konzepte zur Erschließung elektronischer Texte heben die CD-ROM weit über den Standard augenblicklich verfügbarer digitaler Editionen für Germanisten. Neben einer Reihe kleinerer Einschränkungen, von denen die knappe Zeilenbegrenzung in der Themensuche die gravierendste ist, muß vor allem die dürftige Exportfunktion bemängelt werden. Aber allein die Tatsache, daß mit einem Schlag und zu so einem Preis eine solche Menge der wichtigen Texte der neueren deutschen Literatur elektronisch zur Verfügung steht, hat das größte Handicap der Computerphilologie in diesem Land beseitigt: den Mangel oder die Unerreichbarkeit der Texte für den Literaturwissenschaftler. Man wird sehen, welche Folgen das hat.

Fotis Jannidis (München)


[1] Insgesamt ist die systematische Prüfung einer Edition auf ihre Korrektheit noch ein konzeptionelles Problem, da sich die Textmengen nur in ausreichend großen Stichproben prüfen lassen, solche Stichproben aber gleichmäßig über den Text verteilt sein müssen, während die meisten Tests einige wenige Textstellen zusammenhängend prüfen. Letztendlich sind Fehlerfunde zur Zeit meist Zufallsfunde, die kaum zuverlässige Aussagen über die Gesamtqualität des Textes zulassen. Die Verläßlichkeit gedruckter Editionen ist ebenso kaum untersucht – von systematischen Test ganz zu schweigen – und auch sehr viel teurere elektronische Editionen als die vorliegende weisen nicht eben wenige Fehler auf (vergleiche dazu die Rezension der elektronischen Weimarer Ausgabe von Goethe Werke von Chadwyck-Healey in Arbitrium 16,2 (1998), S. 192-201). Mit diesen Warnungen im Hinterkopf vergleiche zu den Fehlern in der Deutsche Literatur von Lessing bis Kafka den anschließenden Text von Katja Mellmann, S. 164.
[2] Systemvoraussetzungen: PC ab 486; 8 MB RAM, Grafikkarte ab 640x480, 256 Farben, CD-ROM-Laufwerk, MS-Windows (3.11, 95, NT). Preis: CD-ROM 99.- DM, DVD 148.- DM.
[3] Eine neue Version der Oberfläche erschließt zudem alle Bände der »Digitalen Bibliothek«, die inzwischen erschienen sind.

Jahrbuch für Computerphilologie 1 (1999) [Zurück zum Inhaltverzeichnis]