DIE ELEKTRONISCHE EDITION VON JEAN PAULS EXZERPTHEFTEN[1]
Abstract
The transcription and electronic edition of Jean Paul's Exzerpthefte (excerpts), initiated and directed by Helmut Pfotenhauer at the University of Würzburg, is a project which was first sponsored by the Fritz Thyssen Foundation and is now supported by the Deutsche Forschungsgemeinschaft.
The following article first gives a description of the manuscripts in question and outlines their special character and importance: in 45 years, Jean Paul has written down more than 12000 pages of excerpts, a very curious private encyclopaedia, which he intensively used during the writing of his novels and other texts. In a second part, the article delimits the philological and digital intentions of the edition: it is mainly conceived as a support for future editors of the revised historico-critical edition of Jean Paul's works, who will use it to comment the text and describe the author's writing method. In a third step, the article concentrates upon the digital realisation of the project, especially on the text markup, but also the used markup model designed by the Text Encoding Initiative (TEI) and the software used in different stages of the work (transcription, encoding, retrieval).
Seit Ende 1998 betreibt die Arbeitsstelle Jean-Paul-Edition an der Universität Würzburg (Leitung: Helmut Pfotenhauer) das Projekt der Transkription und elektronischen Edition von Jean Pauls Exzerptheften.[2] Die zunächst von der Fritz-Thyssen-Stiftung unterstützte Arbeit wird seit 2001 von der Deutschen Forschungsgemeinschaft gefördert und soll 2005 abgeschlossen sein. – Der folgende Beitrag skizziert zunächst die Eigenart und die Bedeutung der zu edierenden Texte, benennt dann die Ziele und Grenzen des Editionsprojekts und beschreibt schließlich dessen digitale Realisierung. Dabei wird auf die verwendete Auszeichnungssprache und das Strukturierungsmodell ebenso eingegangen wie auf die in den verschiedenen Arbeitsstadien eingesetzte Software.
»Bei Feuer sind die schwarzeingebundnen Exzerpten zuerst zu retten.«[3] – Mit dieser brieflichen Anweisung an seine Frau Caroline brachte Jean Paul unmissverständlich zum Ausdruck, dass ihm seine Lesefrüchte nicht nur mehr wert waren als andere irdische Güter, sondern auch mehr als alle anderen Textsammlungen und Vorarbeiten, die sich später in seinem Nachlass fanden. Dies muss nicht erstaunen, wenn man zum einen bedenkt, wie unendlich viel Zeit und Arbeit Jean Paul in die Verfertigung der über 12000 Seiten umfassenden Exzerpte samt ihrer Register investiert hat, und wenn man zum anderen die konstitutive Bedeutung dieser Sammlung für das Schreibverfahren des Autors zur Kenntnis nimmt. Bereits in den ersten Entwürfen zu seinen Werken erscheinen band- und seitengenaue Verweise auf die Exzerpte, in den veröffentlichten Romanen und Schriften wimmelt es gerade zu von expliziten und impliziten Bezugnahmen, und im Nachlass findet sich kaum eine Textsammlung oder ein Konvolut, in dem nicht explizit auf die Lesefrüchte verwiesen würde.
Es gibt keinen Jean-Paul-Leser, der mit den literarischen Folgen dieser Exzerpierwut noch nicht konfrontiert worden wäre, denn eigentlich immer, wenn der Autor zu einem seiner gewitzten Vergleiche oder zu einer kommentierenden Anmerkung ansetzt, wenn er abschweift und mit weit her Geholtem den Erzählfluss unterbricht, darf man sicher sein, dass die Exzerpthefte dabei eine Rolle gespielt haben. Sie sind ein wichtiger materieller Faktor im Schreibprozess Jean Pauls, der das Schreibverfahren prägt, ohne es jedoch ganz zu dominieren, denn es gibt in nahezu allen Texten des Autors auch seitenlange Passagen, die gänzlich frei von Exzerptbezügen sind. Letztlich sind aber gerade jene bibliographischen Fußnoten, jene meist in unerwartetem Kontext und oft mit satirischem Effekt ins Spiel gebrachten Anekdoten und polyhistorischen Wissensatome das Salz in der Suppe vieler Jean Paulscher Texte.
Was der Autor des Hesperus und des Titan, des Schulmeisterlein Wutz und der Rede des toten Christus zwischen 1778 und 1823 in über 100 Bänden sammelte, stammt, der enzyklopädischen Tradition folgend, aus allen erdenklichen Wissensgebieten. Alte und neue Geschichtsschreibung, Philosophie, Astronomie, Biologie, Medizin, Jura, Geographie, Ethnologie, Mythologie und Literatur sind nur die prominentesten darunter. Wollte man die circa 100000 Einzeleinträge etwas feinmaschiger kategorisieren, so käme eine mehr als stattliche Liste von Schlagwörtern zusammen, die dem Ordnungsmodell einer mittelgroßen Bibliothek ähneln würde. Hunderte, wenn nicht Tausende von Büchern und Zeitschriften sind in 45 Jahren durch Jean Pauls Hände gegangen, wurden genau studiert oder auch nur überflogen, um schließlich auf einige kurze, oft nur satzlange Auszüge reduziert und im Wissensspeicher des Autors konserviert zu werden.
Bei dem, was da aus Druckerzeugnissen aller Art herausgepflückt wurde, handelt es sich jedoch nicht zwangsläufig immer um die Quintessenz der jeweiligen Vorlage. Seit dem Jahr 1782, in dem der 19-jährige Jean Paul sich von der Theologie ab- und der Schriftstellerei zuwandte, erfolgt die Auswahl der exzerpierten Stellen stets im Hinblick auf ihre spätere literarische Verwertbarkeit, – zunächst in den satirischen Schriften, und dann ab 1793 in den Romanen und Aufsätzen. Funktionell gesehen greift der Begriff ›Privatenzyklopädie‹ also fehl, denn was hier versammelt wird, soll nicht etwa das Wissen aller Zeiten und Länder repräsentieren, weder auf allgemeine noch auf individuell-private Weise und dient auch nicht zum Nachschlagen in Fällen des Zweifels oder Nichtmehrwissens. Vielmehr handelt es sich um einen ausschließlich auf zukünftige literarische Arbeit ausgerichteten Materialspeicher, eine gigantische Datenbank des Exemplarischen, die vom Autor ständig benutzt, weiter angefüllt und ausgewertet wurde.
Wer so viele literarische Rohstoffe zusammenträgt, muss zwangsläufig Methoden der Wissensorganisation und des darauf aufbauenden Information Retrieval entwickeln, um wenigstens annähernd den Überblick zu behalten. Neben knappen Inhaltsverzeichnissen am Ende der durchschnittlich 60 bis 80 Seiten starken Hefte und einem Verweissystem, mit dem innerhalb der verschiedenen Vorarbeiten und Textsammlungen nach dem Muster »70/12« beispielsweise auf Seite 70 in Band 12 verwiesen wird, spielten dabei die sorgfältig verwalteten Schlagwortregister eine wichtige Rolle.[4] In mehreren Etappen durchkämmte Jean Paul die Bände nach Einträgen, bei denen der semantische Kern zu einem Oberbegriff wie »Tod«, »Essen«, »Fürst/Sklave« oder »Bücher« passte, und vermerkte das Ergebnis dieser Selektivlektüre in Registerartikeln. Im Lauf der Zeit wuchsen diese Register auf beinahe 2000 Manuskriptseiten an und wurden ihrerseits zur feineren Differenzierung nochmals durch Register erschlossen. Das Besondere an diesen Registern ist, dass unter den Lemmata nicht nur Angaben über die Band- und Seitenzahl beziehungsweise die Exzerptnummer, sondern auch Kurzfassungen der registrierten Exzerpte verzeichnet sind. In diesen Zwischendestillaten ist die Dekontextualisierung noch weiter vorangetrieben als in den Exzerpten selbst, was ihre assoziative Einbindung in neue Kontexte zweifellos erleichterte.
Neben dem systematischen Registrierverfahren gehörte jedoch auch das schlichte regelmäßige Lesen und Wiederlesen einzelner Exzerptbände zum festen Arbeitspensum des Berufsschriftstellers, der seine Arbeitsschritte häufig mit Monats- und Jahresangaben auf der Innenseite der Einbände vermerkte. In der unmittelbaren literarischen Arbeit hatten sowohl die Registerdestillate als auch die Exzerpte selbst ihre Funktion, da der Autor je nach Kontext und Absicht nicht nur detaillierte Fakten und Kuriositäten mit bibliographischen Nachweisen zur gewitzten Ausschmückung, sondern auch abstraktere semantische Einheiten zur Verbildlichung des Erzählten benötigte. Zahlreiche autobiographische Zeugnisse bestätigen die enorme Bedeutung des Exzerpierens in Jean Pauls literarischem Produktionsprozess. Sowohl das ständige Erweitern des Exzerptbestandes als auch seine systematische Auswertung und Verarbeitung werden immer wieder in den Listen der zu erledigenden Arbeiten und der Studierregeln[5] aufgeführt, und auch in den Briefen ist das Ausleihen von Büchern, ihr Lesen und Exzerpieren sowie ihre Rückgabe ein immer wiederkehrendes Thema.
Doch wie sieht diese so elementar wichtige Arbeit im Ergebnis aus? – Nach 1782 hat ein charakteristisches Exzerpt bei Jean Paul in etwa diese Gestalt:
48 Aus 1 Gran des Steins der Weisen kan man 304 1/2 Millionen Taler in Gold machen. – Das Stükgen eine Nus gros, das ein Adept vor Helvetius probierte, reichte zu 20 Tonnen Gold. Moehsens Leben von Thurneisser S. 18. |[6]
Auf die von Jean Paul vorgenommene Exzerptnummerierung folgt eine knappe Formulierung des bemerkenswerten Gegenstandes sowie eine ebenso kurze Quellenangabe. Diese verweist jedoch in diesem Fall nicht auf die tatsächliche bibliographische Herkunft des Exzerpierten, die erst durch den vertikalen Strich am Ende des Eintrags markiert wird. Er steht mit der Funktion eines ›Gänsefüßchens‹, Wiederholungszeichens für die weiter oben in demselben Exzerptenband zuletztgenannte Quelle, hier die von Ernst Gottfried Baldinger herausgegebene Zeitschrift für Ärzte, 5. Band, 5. Stück.[7] Das Exzerpt ist einer von 376 Einträgen, die Jean Paul zwischen dem 23. August 1797 und »Jenner 1798«[8] im 28. Band seiner mit »Geschichte« betitelten, 1782 beginnenden zweiten Exzerptreihe gesammelt hat.[9]
Dieses Jahr 1782 markiert einen wichtigen Einschnitt in Jean Pauls Exzerpierverfahren. Seit 1778 hatte er hauptsächlich aus Werken wie der Allgemeinen Deutschen Bibliothek und der Allgemeinen Theologischen Bibliothek exzerpiert, um sich auf sein Theologiestudium vorzubereiten. In längeren, meist mehrere Seiten umfassenden Einträgen hatte er theologische, philosophische und, in geringerem Maße, auch naturkundliche und literarische Beiträge und Rezensionen zusammengefasst, mit eigenen Worten zwar, aber oftmals auch längere Passagen wörtlich zitierend. Beinahe 3000, meist feinsäuberlich geschriebene Quartseiten mit detaillierten bibliographischen Quellennachweisen waren auf diese Weise zustande gekommen.
Mit der Lebensperspektive, das heißt mit dem Entschluss, das Theologiestudium abzubrechen und sich als Schriftsteller zu versuchen, ändert sich auch Jean Pauls Leseverhalten und seine Exzerpierweise. Er exzerpiert nun kaum noch theologische Texte, sondern vor allem Sachliteratur aus allen erdenklichen Wissensgebieten, aus Handbüchern, Enzyklopädien, Reiseberichten, Taschenkalendern, Zeitschriften und Zeitungen. Wie schon in den frühen Exzerpten bleiben Werke aus der ›schönen‹ Literatur dabei eher die Ausnahme.
An die Stelle der mehr oder weniger wörtlichen Wiedergabe in den frühen Jahren treten nun eigene Formulierungen, denen man zwar beinahe jegliche Literarität absprechen mag, auf die aber, wie die zahlreichen Sofortkorrekturen zeigen, doch einige Mühe verwandt wird. Dabei geraten sie immer kürzer und prägnanter, meist findet das Erwähnenswerte in einem einzigen Satz Platz, und als Quellenangabe fungiert oft nur noch der Name eines Autors beziehungsweise einer Zeitschrift oder ein Kurztitel. Häufig werden mehrere Vorlagen gleichzeitig exzerpiert, ein buntes Durcheinander voll schriller Kontraste, das meist nur notdürftig durch Unterstreichung des Exzerptanfangs sowie durch die erwähnten ›Gänsefüßchen‹ und andere Symbole strukturiert wird. Wenn eine Vorlage einmal eine größere Menge exzerpierenswerten Stoffes enthält, dann wird dieser sorgfältig auf mehrere separate Einträge aufgeteilt.
Als Jean Paul im Jahr 1797 dazu übergeht, die Seitenzählung seiner Bände durch eine – allerdings oftmals inkonsequente – Nummerierung der einzelnen Einträge zu ersetzen, nimmt diese Atomisierung endgültig die Struktur einer Datenbank an. Schon bevor er zu diesen dreigliedrigen ›Datensätzen‹ (Nummer – Eintrag – bibliographischer Kurznachweis) übergeht, entwickelt Jean Paul neben der schon immer eigenen und im Lauf der Zeit starken Veränderungen unterzogenen Orthographie auch eine individuelle Kurzschrift, die von Buchstabenauslassungen und Kürzungszeichen geprägt ist und ebenfalls über die Jahre hin mehreren systematischen Veränderungen unterzogen wird. Wer mit diesem an Stenographie grenzenden Verfahren nicht vertraut ist, sieht sich bei der Entzifferung handschriftlicher Aufzeichnungen Jean Pauls auch bei guter Kenntnis der Ende des 18. Jahrhunderts gepflegten deutschen Schrift zunächst einmal vor beträchtliche Probleme gestellt. Und wenn die vielbenutzten und oftmals stark gebräunten Quartblätter dann auch noch mit Tinten-, Wein- und Bierflecken verunstaltet sind, ist man mitunter geneigt, statt der Transkription ein Jean Paulsches Gedankenspiel in die Tat umzusetzen: »Vorschlag, alle meine Exzerpten zu versteigern«,[10] – eine Anregung übrigens, die Ernst Förster, der Schwiegersohn, Editor und partieller Nachlassverwalter Jean Pauls einst beim Wort nahm, als er nach dem Tod Caroline Richters im Jahre 1860 die Exzerpte öffentlich zum Verkauf anbot, allerdings ohne den gewünschten Erfolg.
Nachdem Jean Pauls Exzerpthefte lange Zeit mehr oder weniger unbeachtet in den Nachlasskisten der Staatsbibliothek zu Berlin gelegen hatten[11] und sie durch Götz Müllers Pioniergeist wieder ins Bewusstsein der Forschung gerückt wurden, stellte sich die Frage, wie mit diesem riesigen Handschriftenkorpus, der beinahe ein Drittel des gesamten Nachlasses ausmacht, editorisch zu verfahren sei. Nimmt man das Layout der im Verlag von Hermann Böhlaus Nachfolger erschienenen Nachlassbände als Maßstab, hätte eine Veröffentlichung in gedruckter Form unter Verzicht auf jegliche Kommentierung etwa acht bis zehn jeweils tausendseitige Bände erfordert. Auch angesichts der begrenzten potentiellen Leserschaft wurde schließlich eine rein elektronische Editionsform gewählt, die sich auf die Transkription der Texte und eine textinterne Verzeichnung der Lesarten beschränkt. Historisch-kritische Standards waren bei dieser großen Textmenge in überschaubarer Zeit nicht zu gewährleisten,[12] hätten sie doch auch eine äußerst komplexe Kommentierung erfordert: diese hätte nicht nur den genauen bibliographischen Nachweis aller Exzerpteinträge zu leisten gehabt, sondern auch die Weiterverarbeitung der Exzerpte über die verschiedenen Zwischenstufen und Varianten bis hinein in einzelne Textstellen des Jean Paulschen Werkes verfolgen müssen.
Diese Arbeit soll jedoch nicht von den Editoren der Exzerpthefte, sondern, aus entgegengesetzter Blickrichtung, von den Bearbeitern eines anderen, umfassenderen Editionsprojekts geleistet werden: der in Planung befindlichen historisch-kritischen Neuausgabe der zu Lebzeiten veröffentlichten größeren Werke Jean Pauls.[13] Anders als Eduard Berends erste historisch-kritische Jean-Paul-Ausgabe geht die revidierte Ausgabe von den Erstdrucken aus, verzeichnet gleichwohl alle späteren Modifikationen und präsentiert darüber hinaus auch sämtliche erhaltene Vorarbeiten des jeweiligen Textes. Zudem wird es erstmals möglich sein, den Anspielungsreichtum Jean Paulscher Texte, soweit er sich aus den Exzerptheften nährt, nahezu vollständig zu ergründen und zu dokumentieren. Da es trotz der vom Autor angefertigten thematischen Register unmöglich war, die Exzerptbände nach einem spezielleren Stichwort oder einem Personennamen abzusuchen, waren auch die historisch-kritischen Kommentare Jean Paulscher Texte bislang auf Zufallsfunde oder allgemeine enzyklopädische Sacherläuterungen beschränkt; direkte Verweise auf die Exzerpte erfolgten nur sporadisch. Die revidierte historisch-kritische Ausgabe wird dagegen aus dem Vollen schöpfen können. Ohne dass dies den Eigenwert der Exzerpthefte-Edition als Dokumentation des Jean-Paulschen Lektürepensums und Wissenshorizonts schmälern würde, so ist sie doch in erster Linie als stützende Vorarbeit dieses zukünftigen editorischen Großprojektes konzipiert.
Die elektronische Edition der Exzerpthefte soll den derzeitigen und zukünftigen Bearbeiterinnen und Bearbeitern der neuen Jean-Paul-Ausgabe auf Knopfdruck Auskunft darüber geben, welche Stichwörter, Wortbruchstücke, Personen- und Ortsnamen wo, wann und wie oft in den Exzerptheften vorkommen. Für die Kommentierung der teilweise sehr vertrackten Vergleiche und Anspielungen in Jean Pauls Werken ist dies eine unverzichtbare Hilfe. Die Rekonstruktion der Gedankengänge des Autors und das Nachvollziehen seiner gelegentlich sehr sprunghaften Assoziationen stellten schon für zeitgenössische Leser ein Problem dar und sind heute selbst von den beschlagensten Jean-Paul-Experten ohne Hilfestellung nicht mehr zu bewältigen.
Neben dieser im Resultat letztlich ›analogen‹ Verwendung im Rahmen der ja in Buchform erscheinenden revidierten historisch-kritischen Ausgabe soll sich die digitale Edition der Exzerpthefte aber auch für eine elektronische Weiterverarbeitung eignen. Das Projekt einer großen digitalen Jean-Paul-Gesamtausgabe ist zwar bis jetzt nur eine Vision, doch drängt es sich angesichts der vielfältigen digitalen Anstrengungen, die es derzeit in der Jean-Paul-Forschung gibt, geradezu auf.[14] Angesichts eines Gesamtwerks, das mit seiner Offenheit, seinen Verzweigungen und Verschachtelungen, seinen Wiederaufnahmen und Querverweisen, seinen mehrfachen Auflagen und Vorreden geradezu als ›Hypertext‹ angelegt ist, liegt eine digitale Nachbildung dieser komplexen Verhältnisse sehr nahe. Zudem spielt die elektronische Datenverarbeitung ohnehin schon bei allen neueren Jean-Paul-Projekten eine wichtige Rolle und garantiert die Verfügbarkeit großer, nicht mehr neu zu erfassender Textmengen in bester philologischer Qualität.[15]
Wie eigentlich jede seriöse elektronische Edition sollte eine digitale Gesamtausgabe der Werke, Vorarbeiten, Nachlasstexte und Briefe gar nicht erst versuchen, in Konkurrenz zu Buchausgaben zu treten, sondern primär das Ziel haben, die Leser bei ihrer ›analogen‹ Lektüre zu unterstützen. Neben den wichtigen Suchfunktionen könnte eine digitale Ausgabe die unterschiedlichsten Informationen und Zusammenhänge schnell organisieren und sichtbar machen und dem Leser dadurch helfen, die verstrickten Wege zu verfolgen, die beispielsweise ein Exzerpt über die Register, die Vorarbeiten und Textsammlungen hinweg bis in die nicht selten mehrfache Verwendung in den veröffentlichten Texten geht, und umgekehrt. Bei Interesse könnte man dann auf Mausklick die Briefe von und an Jean Paul parat haben und wertvolle Kontextinformationen erschließen. Verschiedene Auflagen der Werke wären unmittelbar zu vergleichen, könnten aber auch isoliert unter Hinzuziehung der jeweiligen Vorarbeiten oder des brieflichen Kontexts studiert werden, bei Bedarf vielleicht sogar unter Einschaltung des originalen Druckbilds der Erstausgaben. Nicht zuletzt wäre für die Texte aus Jean Pauls Nachlass eine direkte Anbindung an digitale Fotografien der Manuskripte und an den elektronisch erfassten Nachlasskatalog möglich. Diese geradezu paradiesischen philologischen Zustände sind durch den Einsatz digitaler Medien besser und auch etwas kostengünstiger zu erreichen als mit Faksimiles und Tausenden von gedruckten Seiten.
Eine digitale Gesamtausgabe dieser Dimension kann jedoch nicht einfach als zusätzliches Nebenprodukt der laufenden editorischen Arbeiten entstehen, sondern bedarf als eigenständiges Projekt in Kooperation mit den einzelnen digitalen Zuträgern einer sorgfältigen Konzeption und Regie. Ein erster Schritt in diese Richtung ist eine vereinheitlichte software- und plattformunabhängige Auszeichnung – das heißt in erster Linie Strukturierung – der elektronisch erfassten Texte. Bei älteren Projekten lässt sich diese, mit einigem Aufwand, auch nachträglich applizieren; alle neueren Editionsvorhaben sollten jedoch die spätere Weiterverarbeitung ihrer elektronischen Daten unbedingt schon von Beginn an mit berücksichtigen.
Um es zusammenzufassen: Vorgabe des Exzerpthefte-Projekts war und ist es, in möglichst kurzer Zeit mit begrenztem personellen und letztlich auch finanziellen Aufwand[16] eine philologisch zuverlässige, ad hoc verwendbare und später weiterverwertbare digitale Edition in einer neutralen, mittelfristig haltbaren Form zu erstellen.
Die rein elektronische Edition der Exzerpthefte war bei der ersten Antragstellung Anfang 1998 auf die Veröffentlichung in Form einer CD-ROM ausgerichtet. Dieses Ziel sowie die im Lauf der Arbeiten gereifte Absicht, die CD-ROM zusammen mit einem Findbuch zu veröffentlichen, das eine ausführliche Gebrauchsanleitung und ein gedrucktes Personenregister enthalten soll, wird beibehalten. Ergänzt und vorübergehend sogar ersetzt wird beides jetzt durch eine Veröffentlichung im Internet, die Einde 2003, also schon vor der endgültigen Fertigstellung des Gesamtprojekts, mit den frühen Exzerpten beginnen soll.
Die Transkription der Exzerpthefte basiert nicht auf den handschriftlichen Originalen, die in der Staatsbibliothek zu Berlin verwahrt werden, sondern auf Papierkopien, die von nur beschränkt ausleihbaren Mikrofilmen gezogen werden. Problematische, das heißt entweder schwer lesbare oder durch unvollständige Verfilmung weggefallene Stellen müssen daher am Original autopsiert werden. Solche Problemstellen treten sehr häufig auf: die bisherigen Erfahrungen haben gezeigt, dass für die Abklärung von 500 Manuskriptseiten jeweils eine Woche Arbeitszeit vor Ort anfiel. Ein vollständiges gewissenhaftes Gegenlesen der Transkription anhand der Originale wird daher wahrscheinlich aus finanziellen Gründen nicht zu realisieren sein. Möglicherweise wird aber die angestrebte digitale Neuverfilmung des gesamten Nachlasses dem Projekt kurz vor seiner Fertigstellung noch zugute kommen.
Im Einklang mit der an der Arbeitsstelle Jean-Paul-Edition der Universität Würzburg betriebenen Nachlassedition wurde die Transkriptionsarbeit im November 1998 zunächst mit dem Standardtextverarbeitungsprogramm Microsoft Word begonnen. Dabei wurden verschiedene den Text strukturierende Formatvorlagen angewendet, die eine spätere Konvertierung in andere Codierungssysteme erleichtern sollten. Parallel dazu wurde mit Microsoft Access eine Personendatenbank angelegt, in der die im Text vorkommenden historischen Personen mit ihren Lebensdaten und einer Kurzcharakterisierung eingetragen wurden. Mittels eindeutiger Identifikationsnummern für jede erfasste Person wurde dann die Brücke zu den Personennamen innerhalb des Word-Textes geschlagen. Da manche Personennamen in sehr unterschiedlichen Schreibungen und Abkürzungen begegnen, war dies eine wichtige Vorarbeit für die spätere Erstellung eines Personenregisters und für zuverlässige Suchläufe: die für die Datenverarbeitung problematische Inhomogenität der Daten wurde durch die Zuweisung der Kennziffern nivelliert.
Zwar stand von Beginn an fest, dass mit Word-Dateien keine sinnvoll nutzbare CD-ROM zu erstellen sein würde, doch brachte der vorübergehende Einsatz dieser Standardsoftware zunächst einmal einige Vorteile: zum einen konnte schon sehr frühzeitig mit der Transkription der zu edierenden Texte begonnen werden, wodurch es möglich war, deren codierungsrelevante Eigenheiten besser kennen zu lernen; zum anderen konnte die gewonnene Zeit dazu genutzt werden, nach alternativen Möglichkeiten der Textstrukturierung, aber auch der Texterfassung Ausschau zu halten. Die angestrebte Software- und Plattformunabhängigkeit schien am sichersten mit Hilfe einer SGML-konformen Auszeichnung zu erreichen zu sein. SGML steht für Structured Generalised Markup Language und ist eine neutrale, strukturorientierte Auszeichnungssprache, in der bestimmte Texteinheiten mit Hilfe von Start- und Endtags zu so genannten Elementen erklärt werden. So umschließen zum Beispiel die Tags <p> und </p> einen Textabsatz, ähnlich wie in der aus dem Internet bekannten Hypertext Markup Language (HTML), bei der es sich um eine – wenn auch sehr eng begrenzte – Untermenge von SGML handelt. Die Verschachtelbarkeit der Elemente wird in beiden Fällen durch eine Document Type Definition (DTD) festgelegt, die nichts anderes als eine Datei ist, in der alle Möglichkeiten und Regeln der Textauszeichnung definiert sind.
Da für die Exzerpthefte-Edition nicht nur eine solche SGML-konforme Textauszeichnung angestrebt wurde, sondern auch die Absicht bestand, das von der Text Encoding Initiative (TEI)[17] entwickelte vereinheitlichte Textstrukturierungsmodell anzuwenden, wurde als Auszeichnungssprache schließlich XML gewählt, eine Untermenge von SGML.[18] Seit 2000 bietet die TEI ihre beiden Document Type Definitions (DTDs) nicht nur für genuines SGML, sondern auch für XML an, das als die kommende lingua franca des Internet gleich mehrere bedeutende Vorteile mit sich bringt: erstens ist es einfacher strukturiert und daher leichter zu erlernen und anzuwenden als SGML; zweitens kostet die Software, die benötigt wird, um es anzuwenden, nur einen Bruchteil dessen, was für ›echte‹ SGML-Software aufzuwenden ist; und drittens können XML-Dokumente bei Bedarf so wie sie sind, das heißt ohne weitere Arbeitsschritte, im Internet veröffentlicht und von neueren Browsern gelesen werden.
Als Grundlage der Textstrukturierung wurde für die Edition von Jean Pauls Exzerptheften nicht die große Document Type Definition (DTD) der TEI gewählt, die Hunderte von Elementen für alle Auszeichnungseventualitäten enthält, sondern deren vereinfachte Ausgabe TEI Lite, die für Texte mit weniger differenzierter Strukturierung vorgesehen ist. Zusammen mit einer vorbildlich konzipierten Anleitung, die auch für einen Anfänger kaum Fragen offen lässt, kann die TEI-Lite-DTD kostenlos von der TEI-Website heruntergeladen werden. In ausführlichen Probeläufen stellte sich heraus, dass diese DTD mit ihren 143 Elementen für die Auszeichnung von Jean Pauls Exzerptheften bestens geeignet war. Ein einfaches Beispiel mit vier verwendeten Elementen:
<p><name>Lavoisier</name>erfand einen spiritus destructor, der all. zerstört, darüber selbst destruiert – (man weis ihn nicht mehr.) <bibl><title>Eleg. Zeitung</title></bibl>.</p>
Während das Element <p> einen Textabsatz definiert, kennzeichnet das Element <name> einen in diesem Textabsatz vorkommenden Namen. Mit dem Element <bibl> wird eine bibliographische Angabe ausgezeichnet, in der wiederum der Werktitel mit der Elementkennzeichnung <title> versehen wird. Würde die bibliographische Angabe »Klügels Enzyklopädie« lauten, müsste also das <bibl>-Element neben dem <title> auch noch ein <name>-Element enthalten:
<bibl><name>Klügels</name><title>Enzyklopädie</title>
<bibl>
Noch einige weitere Beispiele für die Verwendung der TEI-Lite-DTD im Rahmen der Edition von Jean Pauls Exzerptheften: Das TEI-Tag <abbr> verwenden wir zur Auszeichnung der äußerst zahlreichen Abkürzungen und Buchstabenauslassungen in Jean Pauls Handschrift. Zukünftige Benutzer der digitalen Edition werden durch ein entsprechendes Layout schnell erkennen können, welche Textpartikel vom Autor selbst stammen und welche vom Editor eingesetzt wurden, um die Lesbarkeit des Textes sicherzustellen. Da es bei der Auflösung von Kürzeln und bei der ›Reparatur‹ von Buchstabenauslassungen nicht selten mehrere Möglichkeiten gibt, wird dem Benutzer bei Bedarf eine andere Art des Lesens leicht gemacht. Mit dem Tag <corr> dokumentieren wir alle von Jean Paul im Text vorgenommenen Korrekturen, aber auch die Emendationen, die wir für nötig halten. In diesem Fall wird das Element <corr> durch das Attribut »resp« ergänzt, das Auskunft darüber gibt, wer für den vorgenommenen Eingriff verantwortlich ist: der Autor selbst oder sein Editor. Als besondere Formen der Korrektur werden Streichungen und nachträgliche Hinzufügungen mit den dafür vorgesehenen Elementen <del> und <add> ausgezeichnet.
Man kommt nicht umhin, die ja letzten Endes theoretischen Guidelines der TEI, vor allem die für TEI Lite entwickelten, in irgendeiner Weise auf ein praktisch zu realisierendes Editionsprojekt anzupassen. Es besteht in diesem System durchaus eine gewisse Auslegbarkeit und eine von den Entwicklern eingeräumte Freiheit der Anwendung. Und es bedarf auch immer einer Portion Pragmatismus, wenn beispielsweise zu entscheiden ist, bis zu welcher ›Erfassungstiefe‹ man bei der Strukturierung der zu erfassenden Texte geht. Im Falle der Jean Paulschen Exzerpthefte galt es, mit geringem Aufwand möglichst schnell verwendbare Daten für die Kommentierung der historisch-kritischen Neuausgabe zur Verfügung zu stellen. Daher wurden längst nicht alle Auszeichnungsmöglichkeiten ausgeschöpft, die das TEI-Modell vorsieht, und so ist das Inventar der in diesem Projekt eingesetzten TEI-Strukturierungselemente vergleichsweise schmal, obwohl mit Lyrik, Drama (beides fast ausschließlich in den frühen Exzerpten bis 1782) und Prosa alle Textgattungen vertreten sind.
Entscheidend für die sinnvolle Verwendbarkeit der Daten in der weiteren Editionsarbeit war und ist jedoch vor allem eine klare Identifikationsmöglichkeit für jedes einzelne Exzerpt, die in der digitalen Edition durch eine eindeutige, vom jeweiligen Band abhängige Attributkennziffer in den <div>-Tags gewährleistet wird. Zum anderen sollten die Register für Personen und exzerpierte Periodika so zuverlässig wie möglich sein, was durch die bereits erwähnte Registerdatenbank und wiederum durch den Einsatz von Kennziffern sichergestellt ist. Zum Dritten sollte die Transkription so transparent wie möglich angelegt werden und deutlich machen, dass in der Decodierung von Jean Pauls Kurzschrift vieles auch Auslegungssache ist. Dies wurde durch konsequente Auszeichnung aller von Seiten des Herausgebers eingesetzen Silben und Wortbruchstücke umgesetzt. In der fertigen Edition werden diese Ergänzungen farbig hervorgehoben und eventuell bei Bedarf auch ganz ausblendbar sein. – Verzichtet werden musste dagegen auf eine additive ›Normalisierung‹ der sehr unterschiedlichen von Jean Paul verwendeten Schreibweisen. Was bei den Personennamen sinnvoll und machbar erschien, war im ›normalen‹ Text leider nicht zu realisieren, und so kommen auch zukünftige Benutzer der elektronischen Edition nicht umhin, sich mit der eigenwilligen, im Lauf der Zeit wechselnden Orthographie Jean Pauls auseinander zu setzen, um bei der Suche nicht nur ihr »Glück«, sondern auch ihr »Glük« zu finden.
Neben der Wahl der Auszeichnungsweise sind im Rahmen eines digitalen Editionsprojekts noch zwei weitere wichtige konzeptionelle Entscheidungen zu treffen: zum einen, welche Software bei der Texterfassung und -strukturierung zu verwenden ist und zum anderen, welche Software für das Text-Retrieval des Endanwenders eingesetzt werden soll. Was die Erfassung und Auszeichnung der Texte angeht, so war und ist es in Editionsprojekten durchaus üblich, ein Standardtextverarbeitungsprogramm wie Microsoft Word oder das lange Zeit kostenlos verfügbare StarWriter zu verwenden. Mit Hilfe von Fußnoten und Formatvorlagen lassen sich Auszeichnungen für die Textdarstellung sowie für Apparat und Kommentar vergleichsweise bequem im Text unterbringen. Diese Arbeitsweise wirft allerdings eine ganze Reihe von Problemen auf, wenn die Konvertierung der proprietären Daten in eine neutrale Auszeichnungssprache ansteht. Je nach Textmenge und Differenziertheit der Auszeichnung kann dies sehr arbeitsaufwändig werden.
Obwohl in der ersten Projektphase bereits ein stattlicher Teil der Exzerpttexte mit Word transkribiert worden war, wurde Anfang 2000 ein anderes Programm für die Texterfassung gewählt: der XML-Editor XMetaL 2.0.[20] Diese Software, inzwischen in der geringfügig verbesserten Version 3.0 verfügbar, macht es möglich, das Strukturmodell der TEI in XML-Form bereits unmittelbar während der Texterfassung anzuwenden und bietet dabei einen Bedienungskomfort, der kaum hinter einem ›normalen‹ Textverarbeitungssystem zurücksteht.[21]
Der Einstieg in die Arbeit mit diesem Programm in Kombination mit TEI Lite ist schnell vollzogen: In einem neuen Dokument muss auf den Speicherort der TEI-Lite-DTD verwiesen werden, und schon kann die Arbeit beginnen. Von nun an gelten die Regeln der gewählten DTD, über die man sich in der mitgelieferten Anleitung der TEI ausgiebig informieren kann. Bereits in wenigen Stunden ist jeder Benutzer in der Lage, einen Text zu erfassen, der auf den Strukturregeln der TEI basiert. Die eigentliche Texteingabe ist identisch mit der von Standardtextverarbeitungsprogrammen. Während oder nach der Texteingabe können einzelne Textteile mit einer Elementauszeichnung versehen werden; in TEI Lite findet beispielsweise das Element <emph>...</emph> bei Hervorhebungen Anwendung. Die so auszuzeichnende Textstelle wird mit der Maus markiert und anschließend wird das gewünschte Element per Mausklick aus einer Liste der laut DTD an dieser Textstelle erlaubten Elemente ausgewählt. Bei jedem Speichervorgang wird das Dokument automatisch validiert; dabei wird überprüft, ob die Platzierung beziehungsweise Verschachtelung der Elemente den Regeln der DTD entspricht. Ist dies nicht der Fall, erfolgt eine eindringliche Warnung und ein Verweis auf die betreffende fehlerhafte Stelle.
Wenn bestimmte Auszeichnungen während der Texterfassung besonders häufig zugewiesen werden müssen, in der Exzerpthefte-Edition zum Beispiel das Tag <abbr>...</abbr> für Schreibkürzel Jean Pauls, dann empfiehlt sich der Einsatz von Makros und Tastenkombinationen. Die automatische Aufzeichnung von Arbeitsschritten in einem Makro und die Zuweisung von Tastenkombinationen zur schnellen Ausführung dieses Makros sind genauso einfach zu handhaben wie in Word oder ähnlichen Programmen. In XMetaL stehen zur Bearbeitung eines Dokuments insgesamt fünf verschiedene Ansichten zur Verfügung:
1. die reine Dokumentstruktur (Structure View), die lediglich die Verzweigung und Verschachtelung der Elemente anzeigt;
2. die reine Textansicht (Plain Text View), die den ›nackten‹, von Spitzklammern durchsetzten XML-Code präsentiert, in der aber die Elemente und Attribute farblich vom eigentlichen Text abgehoben sind;
3. die übersichtlichere Tag-Ansicht (Tag View), in der die verwendeten Element-Tags in Form von graphischen Symbolen angezeigt werden;
4. die Normal-Ansicht (Normal View), die der Bearbeitungsansicht eines Standardtextverarbeitungsprogramms sehr ähnlich ist;
5. die Browser-Ansicht (Browser View), die eine Vorschau auf die Darstellung des Dokuments in einem Web-Browser bietet.
Die Texteingabe kann je nach Bearbeitungsinteresse wahlweise in den Ansichten 2., 3. und 4. erfolgen. Wer es gewohnt ist, mit purem HTML-Code zu arbeiten, wird sich vielleicht mit der reinen Textansicht zufrieden geben. Wer einen besseren Überblick über die verwendeten Elemente und Attribute wünscht, wird mit der Tag-Ansicht zufriedengestellt. Wer sich über die Platzierung und Verschachtelung der Elemente mitsamt ihrer Attribute im Klaren ist und deren Anzeige während der Texteingabe als störend empfindet, ist mit der Normalansicht am besten beraten. Sie empfiehlt sich vor allem dann, wenn größere Mengen Text einzugeben und gleichzeitig auszuzeichnen sind.
Bei Bedarf kann der XML-Code mit Hilfe von programmintern leicht zu erstellenden Cascading Style Sheets (CSS) ansprechend gestaltet werden. Genau wie bei der Verwendung der CSS in Kombination mit HTML wird jedem Element und bei Bedarf auch einzelnen Element/Attribut-Kombinationen ein bestimmtes Layout zugewiesen, wobei weit reichende Gestaltungsmöglichkeiten zur Verfügung stehen. So wurde beispielsweise in der Exzerpthefte-Edition dem Element <emph> die Darstellung »unterstrichen« und dem Element <hi> die Darstellung »Kursivschrift« zugewiesen.[22] Bei der Arbeit mit XML wird also, anders als in Textverarbeitungsprogrammen und auch anders als in originärem HTML, die Textgestaltung immer zweitrangig behandelt. Jeder CSS-Gestaltung muss eine strukturelle Definition des betreffenden Worts oder Textabschnitts vorausgehen, während in Word die Auszeichnung »Fettschrift« nichts über den strukturellen Wert des ausgezeichneten Texts aussagt und grundsätzlich ein Kürzel genauso markieren kann wie ein fremdsprachliches Wort oder eine Hervorhebung. Dagegen bleibt der eigentliche XML-Code von einer CSS-Formatierung gänzlich unberührt, womit eine saubere Trennung von Text beziehungsweise Struktur und Gestaltung vollzogen ist.
Bis zur Fertigstellung dieser Projektskizze wurde noch keine Entscheidung darüber getroffen, welche Software für das Lesen, Navigieren, Durchsuchen und Auswerten der elektronischen Edition verwendet wird. Die plattform- und softwareneutrale Codierung der Texte, die eine unkomplizierte und schnelle Konvertierung in andere Systeme möglich macht, lässt hier beinahe alle Möglichkeiten offen. Da das Projekt bis zur Fertigstellung mehr Zeit benötigen wird als ursprünglich vorgesehen, ist es nicht dringend erforderlich, bereits jetzt eine feste Entscheidung über die zu verwendende Retrieval-Software zu treffen – angesichts der immer kürzeren Produktzyklen und einer besonders dynamischen Entwicklung gerade auf dem Bereich der XML-Software wäre dies vielleicht sogar gefährlich. Gleichwohl müssen bei einem Projekt dieser Größenordnung schon während der Transkription und editorischen Aufbereitung der Texte erste Probeläufe mit verschiedenen Softwarelösungen für die Endfassung der digitalen Edition stattfinden.
Getestet wurden bereits verschiedene HTML- und XML-orientierte lokale Suchmaschinen, die eine trunkierte, mit Platzhaltern arbeitende Suche ermöglichen und für die gefundenen Textstellen eine Trefferliste ausgeben, wie man dies von Internet-Suchmaschinen wie Altavista, Google oder Yahoo gewohnt ist. Was das Auffinden und Ausweisen von Textstellen angeht, sind die verschiedenen Produkte meist sehr zuverlässig. Ein bis jetzt nicht zufriedenstellend gelöstes Problem besteht jedoch darin, gefundene Stellen in einem größeren Text anzusteuern. Meist ist dafür ein nochmaliger, nur auf das ermittelte Dokument bezogener Suchlauf erforderlich, der bei größeren Dateien sehr umständlich und unkomfortabel ausfällt. Ebenso problematisch ist die gleichzeitige Suche nach mehreren Stichwörtern, die nur dann Treffer liefern soll, wenn die Stichwörter nahe aufeinander folgen oder sich im selben Textabsatz befinden. Die Vorteile einer solchen Suchmaschinen ähnlichen Retrieval-Software liegen in der Neutralität der im XML- oder HTML-Format angebotenen Daten, die für die Nutzung nur noch geringfügig bearbeitet werden müssen. Sollte in naher Zukunft ein solches Produkt erhältlich sein, wäre ihm zweifellos der Vorzug gegenüber einem proprietären System zu geben.
Kein Problem sind derlei komplexe Suchbedürfnisse für größere, auf Text-Retrieval spezialisierte, leider aber meist relativ teure Programme wie Folio Views, eine Software, die auch im CD-ROM-Teil der modellhaften Hybridedition Der junge Goethe in seiner Zeit[23] eingesetzt wurde. Folio Views bietet nicht nur einen komfortablen Überblick über die verfügbaren größeren Textgruppen und deren Strukturierung, sondern auch anspruchsvolle Suchmöglichkeiten. Eine vielfältige Textgestaltung und interne Verknüpfungen wie etwa die zu einem Personenregister sind genauso leicht realisierbar wie die Einbindung von Graphiken. Problematisch am Einsatz von Produkten wie Folio Views ist die Tatsache, dass man sich zwangsläufig von der plattform- und softwareunabhängigen Arbeitsweise mit XML entfernen und die Daten in ein proprietäres Format übertragen muss. Den größten Teil dieser Arbeit erledigt Folio Views im Rahmen einer automatischen Indexierung zwar selbstständig und zuverlässig, das Resultat ist dann jedoch eine Datenform, die nicht mehr die Unabhängigkeit einer HTML- oder XML-Datei gewährt, sondern nur noch für lizenzierte Besitzer der Software zugänglich ist. Der Kompromiss, den die Bearbeiter des elektronischen Jungen Goethe in seiner Zeit eingegangen sind, ist indes durchaus praktikabel: hier wurden die Daten sowohl in neutraler SGML/TEI-Codierung, als auch in Form einer proprietären Folio-Infobase auf der CD-ROM gespeichert, was sowohl eine optimale kurzfristige Nutzung als auch die mittelfristige Haltbarkeit der Daten sicherstellt.
Nach den geänderten Publikationsabsichten muss für die digitale Edition von Jean Pauls Exzerptheften nunmehr eine Software gefunden werden, die gleichermaßen für die CD-ROM-Publikation und für die Nutzung im Internet geeignet ist. Da es bei derlei Produkten schwer ist, von den Herstellern eine funktionsfähige Probeversion zu erhalten, stehen hier die ersten Tests und Probeläufe mit den Daten der Exzerpthefte noch aus. Leider sind Produkte dieses Leistungsumfangs noch teurer als nur lokal eingesetzte Retrieval-Software, die auf die CD-ROM-Nutzung beschränkt ist. Bedenkt man allerdings die Ersparnis gegenüber einer vielbändigen Buchausgabe, so mögen die hohen Preise nicht mehr so unangemessen wirken und müssten auch förderungstechnisch zu bewältigen sein. Geprüft wird derzeit auch eine mögliche Kooperation mit dem Verlag, in dem der gedruckte Begleitband zur digitalen Edition der Exzerpthefte erscheinen soll.
Mit der Publikation der Exzerpthefte im Internet würde sich auch auf besondere Weise ein Kreis schließen: Die Recherchemöglichkeiten der im World Wide Web verfügbaren Suchmaschinen, Datenbanken, Bibliothekskataloge und Textressourcen gehörten zur täglichen Arbeit der Transkribenten. Schon häufig gab es dabei die kuriose Situation, dass ein ungebräuchlicher, schwer lesbarer oder in irgendeiner Form seltsamer Name oder Begriff zur Überprüfung in eine Suchmaschine eingegeben wurde, und dass der einzige Hit, den die Suchmaschine ausgab, eine Stelle in einem Roman von Jean Paul war. Und zwar in einer der elektronischen Fassungen, die im großen und kostenlosen Online-Archiv von Gutenberg.DE enthalten sind.[24] Die in Frage stehende ›seltsame‹ Zeichenfolge hatte also bereits einen langen Weg hinter sich, aus Jean Pauls kurios-chaotischer Privatenzyklopädie, über die Registerartikel, Textsammlungen, Vorarbeiten und Zwischenstufen bis hin in den literarischen Text und gegebenenfalls dessen überarbeitete Zweitauflage, um schließlich in digitalisierter Form ihren Platz in der größten, chaotischsten und wahrscheinlich auch kuriosesten Enzyklopädie zu finden, die die Welt je hatte.
Michael Will (Würzburg)
Dr. Michael Will
Institut für Deutsche Philologie
der Universität Würzbug
Am Hubland
97074 Würzburg
michael.will@mail.uni-wuerzburg.de