Entwicklung und Einsatz einer TEI-konformen
Arbeitsumgebung für die Edition der Dramen von
Karl Ferdinand Gutzkow

Abstract

Digital methods are essential for production, revision and publication of philological editions. The TEI-guidelines for XML coding are considered an approved standard for the representation of literary texts. The research group responsible for publishing Karl Ferdinand Gutzkow’s (1811–1878) dramatic works and the Institute of Computer Science – both located at the Martin-Luther-University Halle-Wittenberg, Germany – are working together on a configurable platform that simplifies and automates the work of editors. The product of this cooperation is KRONOS, a TEI-conform platform supporting drama edition[1]. The tool offers a GUI adapted to the structure of drama, XML-encoding that is as easy as formatting text even without knowledge of XML/TEI, and the extraction of publication formats (HTML, PDF) at the push of a button.

Einleitung

Philologische Editionsprojekte sind ohne digitale Verfahren bei der Erstellung, Bearbeitung und Publikation heute nicht mehr denkbar. Für die Kodierung digitaler Ausgaben haben sich die XML-basierten TEI-Guidelines als Auszeichnungssystem für Philologen weitgehend durchgesetzt, jedoch existieren durch die notwendige Einarbeitung in XML-Editoren und die damit verbundene, technisch orientierte Herangehensweise Vorbehalte gegenüber deren Verwendung. Die Arbeitsgruppe Dramatische Werke des Editionsprojektes Karl Gutzkow[2] und das Institut für Informatik, Lehrstuhl Prof. Dr. Paul Molitor, der Martin-Luther-Universität Halle-Wittenberg arbeiten seit Juni 2006 an einer TEI-konformen Arbeitsumgebung, welche die editorische Arbeit vereinfachen und weitgehend automatisieren soll. Das erste Ergebnis dieser Zusammenarbeit ist die Arbeitsumgebung KRONOS [1][1], ein Werkzeug, das eine an die Textstruktur angepasste Erfassung, eine benutzerfreundliche XML-Auszeichnung und den Export in verschiedene Publikationsformate (PDF, HTML, LATEX) ermög­licht. Durch den gewählten Ansatz, die Erfassung und Auszeichnung formularbasiert durchzu­führen, unterscheidet sich dieses Werkzeug grundlegend von anderen Umgebungen. Im Ergeb­nis profitieren die Editoren von einer intuitiven Benutzeroberfläche, die eine effiziente Arbeitsweise, ohne langwierige Einarbeitungszeiten gestattet. In der Erprobungsphase galten die Editionsrichtlinien des Editionsprojektes Karl Gutzkow als Richtlinie für die Erstellung und Bearbeitung von Dramentexten, jedoch ermöglicht KRONOS flexible Satzeinstellungen für den Einsatz in anderen Drameneditionen und wird schrittweise für die Anwendung auf andere literarische Gattungen erweitert.

[1] 

Editionsprojekt Karl Gutzkow

[2] 

Das Editionsprojekt Karl Gutzkow hat sich die Erstellung einer kommentierten digitalen Gesamtausgabe der Werke und Briefe von Karl Ferdinand Gutzkow (1811–1878) zum Ziel gesetzt. Die Werkausgabe ist als Hybrid-Ausgabe konzipiert, die Texte und textkritischen Apparate er­scheinen digital im Portal des Editionsprojekts und nach Werkgruppen geordnet als gedruckte Ausgaben. [2] Der Schriftsteller und Journalist Karl Gutzkow war in der Mitte des 19. Jahrhunderts auch ein erfolgreicher Bühnenautor und Dramatiker, aus dessen Schaffen 36 Dramen und Dramenfragmente überliefert sind. Die zu Lebzeiten erschienenen Dramatischen Werke [3] versammeln nicht alle diese Texte, ebenfalls unvollständig sind die beiden vorliegenden Ausgaben der Gesammelten Werke [4] des Autors.

[3] 

Die Veröffentlichung der kritischen Apparate erfolgt im Editionsprojekt Karl Gutzkow als work-in-progress ausschließlich im Internet, einerseits um die Kommentare frühzeitig verfügbar zu machen und sie andererseits auch nach der Veröffentlichung aktualisieren und erweitern zu können. Neben Texten und Apparaten enthält das Gutzkow-Portal Bilder und Quellen zu Au­tor und Werk, ein Lexikon mit erläuternden Einträgen zu Sachkomplexen und Zeitgenossen, die für Gutzkows Schaffen relevant sind. Außerdem wird eine Datenbank für die Briefe des Autors aufgebaut, die die Vorstufe zur Edition des umfangreichen Briefwechsels des Schriftstellers darstellt [5].

[4] 

Gutzkows Dramen liegen in zahlreichen Be-und Überarbeitungen vor, die Herausgeber edie­ren den Bucherstdruck als Schnittstelle zwischen Produktion und Rezeption. Soweit überliefert, soll der Manuskriptdruck parallel im Netz verfügbar gemacht werden. Das Frühwerk ist durch formale Experimente und stilistische Inkongruenzen charakterisiert, in den ersten dramatischen Skizzen Marino Falieri (1834) und Hamlet in Wittenberg (1835) wechseln Vers- und Prosasequenzen innerhalb eines Aktes, die Lesedramen Nero (1835) und König Saul (1839) sind als Versdramen konzipiert. Überwiegend regelmäßig konstruierte Prosadramen erscheinen erst ab 1842 mit der Veröffentlichung von Karl Gutzkows dramatische Werke.

[5] 

In diesem Editionsvorhaben werden sowohl die elektronische Edition als auch der Drucksatz von den Herausgebern realisiert, die aus einer Datenquelle die HTML-Fassung generieren und die Texte als PDF-Dokumente druckfertig an den Verlag geben. Dabei stellte das Ziel, die in den Editionsprinzipien [6] festgelegten Layoutvorgaben in der gedruckten und elektronischen Fassung möglichst identisch darstellen zu können, eine besondere technische Herausforderung für die Arbeitsgruppe dar.

[6] 

Ausgangslage

[7] 

Die Arbeitsgruppe zur Edition der Dramatischen Werke Gutzkows begann 2001 mit der Digitalisierung der Dramen. Die Erstdrucke wurden mit einem Textverarbeitungsprogramm erfasst, damit wurde ebenfalls das Layout für den Drucksatz und die Auszeichnung mit Markup nach den HTML und dem XML-/TEI-Standard, das als versteckter Text in den Dokumenten enthalten war, hergestellt. Im Ergebnis dieser Vorgehensweise entstanden Dokumente, welche Drucksatzeinstellungen, HTML-Markup und TEI-Markup enthielten. Diese Vermischung war die Ursache vieler Fehler, die sich zum Beispiel in Form von Layoutinkonsistenzen, aber auch durch Verletzung der HTML-Konformität bei der Online-Ausgabe ausdrückten (vgl. Abbildung 1). Zudem zeichnete sich diese Arbeitsweise durch ein hohes Maß an Redundanz aus, da jedes Element als Formatierung im RTF-Dokument und durch entsprechendes HTML- beziehungsweise TEI-Markup gekennzeichnet werden musste. Die Entscheidung für die Erfassung der Originale als RTF-Dateien wurde innerhalb des Editionsprojektes als kleinster gemeinsamer Nenner getroffen, da keine geeignet erscheinenden Werkzeuge zur Verfügung standen. Die Texterfassung über eine OCR-Software, wie sie bei Prosatexten erfolgreich realisiert wurde, hat sich für die Digitalisierung der Dramen mit oft uneinheitlichem Layout nicht bewährt. Die Textgewinnung durch manuelles Erfassen erwies sich als schneller und weniger fehleranfällig. Eine Digitalisierung über das beispielsweise beim Heinrich-Heine-Portal [7] verwendete Double-Keying-Verfahren schied angesichts des vergleichsweise kleinen Textkorpus (3600 Druckseiten, ca. 5,4 Mio Zeichen) und der aufwändigen Einarbeitung in TUSTEP[3] ebenfalls aus.

[8] 

[9] 

Abbildung 1(a) RTF-Dokument in der Druckansicht mit versteckten Tags

[10] 

[11] 

Abbildung 1(b) Ansicht des RTF-Dokuments mit eingeblendeten Tags (fehlerhaft)

[12] 

Zu Abbildung 1: Der Auszug 1(a) stellt die mit Hilfe des Textverarbeitungsprogramms erfassten und ausgezeichneten Daten dar. Abgebildet ist eine Figurenrede aus dem Dramenfragment Die Gräfin Esther (1840/43) mit folgenden Formatierungen: Der Sprechername (GEELHARD) wurde in Kapitälchen, Seitenzahlen im Original als Editorenanmerkung kursiv ([6]) und Regieanweisungen 1pt kleiner als der restliche Text gesetzt (erschrocken auffahrend). Dabei dienten diese Formatierungen allein dem Drucksatz. Die Auszeichnung selbst wurde als verborgener Text durch Makros eingefügt und ist in Abbildung 1(b) zu sehen. Bereits in diesem kurzen Fragment ist die Vermischung von XML-/TEI- sowie HTML-Auszeichnung zu erkennen (gemäß den TEI-Guidelines müsste die Editorenanmerkung zum Seitenumbruch durch »‹add›[6]‹/add›« vertaggt sein, hier findet sich aber die HTML-Kodierung für Kursivierung.). Eine saubere Trennung von Inhalt und Layout wurde mit dieser Herangehensweise nicht erzielt.

[13] 

Die Textkonstitution in Form von RTF-Dateien ermöglichte – wenn auch nur rudimentär – das verteilte Arbeiten der Editoren. Jedoch gab es weder eine zentrale Datenhaltung noch eine wünschenswerte Versionsverwaltung. Auch bot diese Herangehensweise keinerlei Unterstützung bei der auf die Textgewinnung folgende Kommentierung beziehungsweise für die Verlinkung der Textstellen mit den zugehörigen Einzelstellenverweisen und Abschnitten im Globalkommentar. Der Rückgriff auf vorhandene Lösungen bestehender Editionsprojekte erwies sich ebenfalls als schwierig, da die meisten Editionsvorhaben mit projektbezogenen Einzellösungen arbeiten. Frei verfügbare Editionswerkzeuge – wie sie von TextGrid [8][4] konzipiert werden – sollen die editorische Arbeit zukünftig erleichtern, waren zu diesem Zeitpunkt jedoch noch nicht verfügbar.

[14] 

Dem Anspruch innerhalb einer integrierten Umgebung Texte für die Edition zu erfassen, automatisiert auszuzeichnen und in verschiedenen Formaten publikationsfertig auszugeben, konnte bislang kein Werkzeug gerecht werden.

[15] 

Die Arbeitsumgebung KRONOS

[16] 

Korpusanalyse In der Konzeptionsphase der Arbeitsumgebung KRONOS erfolgte eine Korpusanalyse und die Beschreibung der strukturellen Eigenarten der Texte. Die in Akte, Szenen und Auftritte gegliederten Dramen enthalten die Figurenrede als kleinstes Strukturelement. Figurenreden bestehen aus dem Namen des Sprechers, dem Redentext und häufig aus Regieanweisungen, die innerhalb der Rede verschieden positioniert sein können. Diese grundlegenden Textmerkmale sollten in jedem Fall durch eine Kodierung erfasst werden. Ebenfalls obligatorisch sollten die Seitengrenzen der Editionsgrundlage kodiert werden. Je nach Editionsziel ist es wünschenswert, neben allgemeinen Genrespezifika auch autor- und epochenspezifische Besonderheiten auszuzeichnen. Als häufig vorkommende Elemente wurden in den Gutzkow-Texten Lyrikeinschübe in Prosadramen, fremdsprachiger Text in der Figurenrede und gebrochene Verse über zwei oder drei Sprecher identifiziert, weshalb die Kodierung dieser Textelemente ebenfalls angestrebt wurde.

[17] 

Zur Auszeichnung von geisteswissenschaftlichen Editionen stellt die TextEncoding Initiative (TEI)[5] [ein Regelwerk zur Verfügung, welches sich zunehmend als Standard durchsetzt. Für die verschiedenen Textgattungen werden angepasste Schemata empfohlen, mit denen die sich aus der Analyse der Textgrundlage ergebenden Strukturen und Besonderheiten durch geeignete XML-Kodierungen abgebildet werden können. Diese Vorgehensweise zeichnet sich durch eine große Flexibilität aus, da auch Sonderfälle durch Hinzunahme von empfohlenen Auszeichnungen anderer Textgattungen abgedeckt werden können. Auch die Einschränkung des Markups einschließlich der Menge der erlaubten Attribute ist möglich, um eine Vereinheitlichung der verwendeten Tags bei verteilter Arbeitsweise zu erreichen [9].

[18] 

Üblicherweise schließt sich an die Dokumentenanalyse eine Erfassung des Korpus mit Hilfe eines gängigen XML-Editors an. Diese Programme ermöglichen schemakonforme Eingaben und garantieren durch die implizite Konsistenzprüfung valide und wohlgeformte Dokumente. Je komplexer die Textstruktur, desto mehr Markups enthalten die Dokumente, so dass der edierte Text in den Hintergrund rückt. Wünschenswert wäre jedoch eine Arbeitsumgebung, die den eigentlichen Inhalt in den Vordergrund stellt. Daher war es das Ziel des Projekts, den Editoren an die Struktur des Korpus angepasste Formulare zur Verfügung zu stellen, die eine automatische, strukturbasierte Auszeichnung ermöglichen. Die Auszeichnung von Textpassagen sollte wie bei der Formatierung in konventionellen Textverarbeitungssystemen erfolgen, wobei die XML-Auszeichnungen für die Bearbeiter durch modifizierten Schriftstil beziehungsweise durch veränderte Schriftart oder -farbe angezeigt werden, ohne dass das Markup selbst sichtbar wird.

[19] 

Texterfassung und Bearbeitung Diese Vorüberlegungen dienten als Grundlage für die Entwicklung einer TEI-konformen Arbeitsumgebung, die zunächst im Editionsprojekt Karl Gutzkow erprobt werden sollte. Da das Editionsprojekt bereits seit mehreren Jahren arbeitet, war es außerdem erforderlich, bereits digitalisierte Texte in die Arbeitsumgebung zu übernehmen. Hierzu wurde eine Importfunktionalität bereitgestellt, um die vorhandenen RTF-Dokumente mit genau definierten Formatierungen einzulesen und im Folgenden in der Arbeitsumgebung weiter zu bearbeiten. Auf der Basis der Layout-Formatierungen in den RTF-Dokumenten wurde sowohl strukturelles als auch semantisches Markup extrahiert.

[20] 

[21] 

Abbildung 2: Im Vergleich zu Abbildung 1 wird hier die auto­matisch generierte XML-/TEI-Auszeichnung der Figurenrede aus Die Gräfin Esther nach dem RTF-Import abgebildet.

[22] 

Nach dem Import der bereits digitalisierten Dramen konnte die weitere Arbeit im Editionsprojekt über KRONOS durchgeführt werden.

[23] 

[24] 

Zu Abbildung 3: Die Darstellung zeigt die Eingabemaske während der Bearbeitung des Dramas Werner oder Herz und Welt (1842). Im linken Fenster ist die Korpusstruktur hierarchisch abgebildet. Neben der Anzeige dient der Strukturbaum auch zur Navigation im Dokument. Die ausgewählte Erste Szene erscheint im Bearbeitungsfenster rechts. Zu erkennen sind verschiedene Formularfelder für einleitende Regieanweisungen, Figurenreden mit Regieanweisung nach dem Sprecher bzw. mit im Text eingebetteten Regieanweisungen. Eingebettete Regieanweisungen, fremdsprachiger Text oder Seitenumbrüche in der Editionsgrundlage werden durch Markierung und Typisierung über die Symbolleiste erstellt. Beispiel: Die Regieanweisung »(Deckt das Papier von dem Rahmen ab.)« wurde durch Markierung und den Schalter »Regieanweisung« der Symbolleiste ausgezeichnet und erscheint für den Bearbeiter grün. Die Darstellungsweisen (Schriftart, -schnitt, -farbe und -größe) können über die Konfigurationseinstellungen der Arbeitsumgebung angepasst werden.

[25] 

Die weitere Bearbeitung und Korrektur der importierten Dokumente und die Digitalisierung der verbleibenden Texte erfolgte nun formularbasiert über die Eingabemaske der Arbeitsumgebung (vgl. Abbildung 3). Durch die an die Struktur des Korpus angepasste Formulareingabe kann das strukturelle Markup automatisch generiert werden. Für den gezeigten Ausschnitt in Abbildung 2 betrifft dies das Markup ohne Fettung. Die durch Fettung hervorgehobene Auszeichnung wurde vom Bearbeiter durch Markieren und Auswahl des entsprechenden Auszeichnungstyps (via Symbolleiste oder Tastenkombination) erstellt. Schon dieses kurze Fragment zeigt deutlich, welche Arbeitserleichterung durch den gewählten Ansatz erzielt wird.

[26] 

Die Auszeichnung von semantisch relevanten Textstellen muss nicht während der Erfassung durchgeführt werden. Je nach Arbeitsweise der einzelnen Herausgeber kann diese auch im Anschluss an die Textgewinnung erfolgen.

[27] 

Textauszeichnung Die Textauszeichnung in der Arbeitsumgebung KRONOS ähnelt der Formatierung in konventionellen Textverarbeitungssystemen. Über die automatisch erzeugten Grundeinstellungen hinausgehende Auszeichnungen können durch das Markieren der betreffenden Textstellen und die Betätigung eine Schaltfläche in der Symbolleiste oder über eine Tastenkombination zugeordnet werden. Die Arbeitsumgebung generiert aus den vorgenommenen Markierungen das erforderliche XML-Markup, welches dem Benutzer verborgen bleibt (vgl. Abbildung 4). Damit steht eine elegante und schnelle Eingabemöglichkeit von häufig vorkommenden Markups zur Verfügung. Die aktuell verfügbaren Modi zur Auszeichnung orientieren sich an den Editionsrichtlinien des Gutzkow-Projekts und umfassen Hervorhebungen, Sprechernamen, Regieanweisungen, Editorenanmerkungen, fremdsprachigen Text und Fußnoten.

[28] 

Nach der Digitalisierung und der Auszeichnung in KRONOS liegen TEI-konforme Dokumente vor. Durch die Wahl des XML-Standards bietet sich ein breit gefächertes Feld an Möglichkeiten zur Weiterverarbeitung. Von großer Bedeutung ist hierbei neben Such- und Analyseoperationen die Konvertierung der Dokumente in verschiedene Publikationsformate.

[29] 

[30] 

Abbildung 4: Auszug aus dem generierten XML/TEI am Beispiel des politischen Schauspiels Patkul (1840) I,1

[31] 

Textpublikation Zahlreiche Editionsprojekte konzentrieren sich weiterhin auf kostenintensive gedruckte Werkausgaben, jedoch gewinnt die Veröffentlichung in digitaler Form zunehmend an Bedeutung. Mischformen, wie die als Hybridausgabe konzipierte Gutzkow-Gesamtausgabe, be­rücksichtigen beide Ansätze und veröffentlichen sowohl elektronische als auch gedruckte Texte. Die Erstellung des Drucksatzes für kritische Editionen obliegt zunehmend den Herausgebern, wobei die Druckvorlagen entweder über Textverarbeitungsprogramme erzeugt oder über kostenintensive Satzprogramme realisiert werden. Die Erzeugung einer Druckfahne aus dem digitalisierten Werk ist ein stark iterativer Prozess. Der Feinsatz verändert sich während der Kollation und der Korrekturen vor der Drucklegung mehrfach. Die Verwendung von Textverarbeitungsprogrammen hat zur Folge, dass der Satzspiegel nach jeder Änderung geprüft werden muss.

[32] 

Die automatische Generierung des Drucksatzes auf der Basis von festgelegten Editionsrichtlinien wäre hier wünschenswert und würde eine große Arbeitserleichterung für die Herausgeber bedeuten. Nach dem prüfenden Lesen des generierten Drucksatzes, beschränkt sich die Iteration auf das Einpfiegen der Korrekturen.

[33] 

Während sich statisches HTML, wie es beispielsweise für die elektronische Veröffentlichung der Gutzkow-Dramen benötigt wird, relativ problemlos aus den XML-Dokumenten generieren lässt, ist die Herstellung eines anspruchsvollen Drucksatzes mit zahlreichen Schwierigkeiten verbunden.

[34] 

Zur Erzeugung von W3C-konformem (X-)HTML[6] bieten sich funktionale Sprachen wie XSLT[7] an. Die Überführung nach PDF kann analog erfolgen (XSL-FO)[8]. Zum aktuellen Zeitpunkt scheidet diese Möglichkeit jedoch aus, da der für die exakte Referenzierbarkeit von Textstellen erforderliche Zeilenzähler von dieser Technologie nicht oder nur von proprietären XSL-Prozessoren unterstützt wird. Daher haben die Autoren das Satzsystem LATEX [10] in die Arbeitsumgebung KRONOS integriert. Eine Vielzahl von globalen Einstellungen für das Satzsystem erfolgt über die Konfigurationseinstellungen der Arbeitsumgebung und bleibt so für den Benutzer transparent. Exemplarisch seien hier Optionen für Zeilennummern, Seitenformate, Kopf- und Fußzeilen, Sperrungen, Trennungen, Metainformation genannt. Die vorgenommenen Einstellungen können als Formatvorlage abgespeichert und so für weitere Texte übernommen werden. Eine Einarbeitung in LATEX ist nicht erforderlich. Die Vorgaben können dialogbasiert vom Benutzer eingestellt werden.

[35] 

In KRONOS erfasste und ausgezeichnete Dokumente werden auf Knopfdruck in die unterstützten Publikationsformate überführt. Für die Buchpublikation wird eine fertige Druckfahne im PDF-Format erzeugt, welche die detaillierten Vorgaben der Editionsrichtlinien in hoher Qualität umsetzt. Über Konfigurationsoptionen ist es möglich, Satzelemente wie Einrückungen, Durchschüsse, Schriftgrößen und -formatierungen nach Bedarf zu verändern.

[36] 

Durch zusätzliche Konfigurationseinstellungen bietet die Arbeitsumgebung dem Satzsystem Hilfestellung zur Homogenisierung des Drucksatzes. Zur Veränderung des Druckbildes können manuelle Eingriffe im Layout vorgenommen werden, zum Beispiel lassen sich Zeilen- oder Seitenumbrüche manuell einfügen oder Textstellen zusätzlich stauchen, um das Druckbild zu verfeinern.

[37] 

Neben dieser allgemeinen Problematik beim Dramensatz stellten eine Vielzahl von textspezifischen Sonderfällen interessante Herausforderungen für die beteiligten Informatiker dar. Dazu gehören beispielsweise die exakte Darstellung von gebrochenen Versen, von gleichzeitiger Figurenrede sowie die Erstellung des Layouts für die Personenverzeichnisse. Alle drei genannten Textpassagen weisen zweidimensionale Strukturen auf. Hierbei gilt es zunächst, diese in XML abzubilden (beispielsweise durch Verwendung von ‹castGroup› für zusammengefasste Bezeichnungen innerhalb der Personenverzeichnisse). Aus der erhaltenen XML-Kodierung wird im Anschluss das Layout für Druck- und Onlineausgabe generiert.

[38] 

In Abbildung 5 ist beispielhaft der auf diese Weise erzeugte Drucksatz für die gebrochenen Verse der Editionsgrundlage gegenübergestellt. Der Beginn des zweiten Teils der Figurenrede »Noch eben sah ich ... « soll vertikal mit dem Ende des ersten Teils der Rede »Macht sich schon auf.« ausgerichtet sein. Dazu muss die Länge der ersten, bereits gesetzten Verszeile bestimmt werden, was bei Verwendung von LATEX durch den Befehl settowidth erreicht werden kann. Neben den eben erwähnten zweidimensionalen Strukturen waren eine Reihe von weiteren Detaillösungen für die Erzeugung eines anspruchsvollen Layouts erforderlich.

[39] 

[40] 

Abbildung 5(a): Erstdruck; 5(b): mit KRONOSerzeugte gebrochene Verse mit exakter vertikaler Ausrichtung

[41] 

Abbildung 5: Im Teil 5(a) ist ein Auszug aus I, 1 des Erstdrucks von König Saul (1839) zu sehen. Abgebildet sind gebrochene Verse, die sich über zwei Figurenreden erstrecken. Im rechten Teil 5(b) ist im generierten Drucksatz die exakte vertikale Ausrichtung dargestellt. Die Bearbeiter markieren die Versteile als Beginn, Mitte oder Ende eines gebrochenen Verses. Bei der Generierung des Drucksatzes wird die Länge der ersten Verszeile nach dem Satz bestimmt, um mit Hilfe dieser Längenangabe die Einrückung für die nachfolgende Zeile zu ermitteln.

[42] 

Als weiteres Beispiel für Detaillösungen im Drucksatz sei hier die Wiedergabe des Buchstabens Eszett in Kapitälchen erwähnt (vgl. Abbildung 6). Zu den handelnden Personen des Dramas Richard Savage oder Der Sohn einer Mutter (1842) gehört die Figur Miß Ellen. Durch die Konvention, Sprechernamen in Kapitälchen zu setzen, würde von Browsern und Satzsystemen der Buchstabe ß durch Doppel-S bzw. die Buchstabenfolge SZ ersetzt werden. Dies widerspricht jedoch den Editionsrichtlinien, welche keine Veränderung der Orthographie vorsehen. Tritt der Buchstabe ß in einem Sprechernamen auf, wird dieser beibehalten, aber durch Beeinflussung der Schriftgröße an das Schriftbild der Großbuchstaben angepasst. Alternativ kann auch ein Sondersymbol für das Versal-ß verwendet werden.

[43] 

[44] 

Abbildung 6(a): Ausschnitt aus der Editionsgrundlage, Abbildung 6(b): Ausschnitt aus der mit KRONOS generierten Druckfassung

Zu Abbildung 6: Auszug aus dem Personenverzeichnis von »Richard Savage oder Der Sohn einer Mutter« (1842). Durch die Großschreibung aller Sprechernamen ergibt sich für den Figurennamen »Miß Ellen« die Problematik des fehlenden Versal-ß. Die Verwendung der üblichen Ersatzschreibweise durch Doppel-S oder SZ widerspricht den Editionsrichtlinien, welche keine Korrektur bzw. Veränderung der Orthographie zulassen.
[45] 

Fazit und Ausblick

[46] 

Die am Institut für Informatik der Martin-Luther-Universität Halle-Wittenberg entwickelte TEI-konforme Arbeitsumgebung KRONOS stellt dem Editionsprojekt Karl Gutzkow eine elegante Möglichkeit zur Verfügung, die dramatischen Werke zu erfassen und auszuzeichnen. Mit der automatischen Generierung des fertigen Drucksatzes sowie der Online-Ausgabe wurde eine erhebliche Arbeitserleichterung für die Editoren erreicht. Durch die konsequente Umsetzung der an die Struktur der Editionsgrundlage angepassten formularbasierten Erfassung und Auszeichnung kann der überwiegende Teil des notwendigen Markups generiert werden. Während der Bearbeitung bleiben alle spitzen Klammern verborgen und die Philologen können sich auf die inhaltliche Arbeit konzentrieren.

[47] 

Die aktuelle Version von KRONOS ist auf die Verarbeitung von Dramen spezialisiert. Durch vielfältige Konfigurationsmöglichkeiten können jedoch für dieses Genre unterschiedlichste Editionsrichtlinien umgesetzt werden. Die weiteren Arbeiten konzentrieren sich auf die Verallgemeinerung des Ansatzes für andere literarische Genres. Durch die erfolgreiche Bearbeitung von Mischdramen, welche Einschübe von Lyrik und Prosa aufweisen, wurden hier erste Fortschritte erzielt.

[48] 

Als erfolgversprechend erweist sich der gewählte Ansatz auch in Bezug auf konkurrierende Hierarchien bei der Textauszeichnung. Die Arbeitsumgebung behält durch die Bereitstellung von verschiedenen Sichten das Konzept von Single Source Publishing bei und ermöglicht trotzdem die durch Markup-Sprachen wie XML nicht unterstützte verschränkte Schachtelung. Die konkrete Umsetzung durch die von den TEI-Guidelines vorgeschlagenen Methoden wie Meilensteine, Fragmentierung oder out-of-line markup kann die Arbeitsumgebung KRONOS übernehmen. Je nach Anforderung wird dann eine bestimmte Sicht (beispielsweise Akt, Szene, Rede oder Akt, Szene, Verszeile) oder die Gesamtheit der Auszeichnungen zur Weiterverarbeitung erzeugt.

[49] 

Eine weitere Entwicklungsrichtung zielt auf eine komfortable Unterstützung bei der sich an die Digitalisierung und Auszeichnung anschließenden Apparaterstellung ab. In enger Zusammenarbeit von Informatikern und Philologen der Halleschen Universität mit dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier werden Methoden entwickelt und erprobt, die analog zur Erfassung und Auszeichnung eine intuitive Herangehensweise für die Apparaterstellung bereit stellen. Die geplante Erweiterung der Arbeitsumgebung baut auf einer service-orientierten Architektur auf, die durch Web-Services umgesetzt wird [11]. Durch diesen Ansatz ist es möglich, bereits bestehende Werkzeuge wie beispielsweise die Suche über Wörterbücher und Wörterbuchnetze [12], die phonetische Suche [13] und ähnliches zu integrieren und die Arbeitsumgebung für im Aufbau befindliche Services – wie sie TextGrid konzipiert – offen zu halten sowie eigene Entwicklungen für TextGrid anzubieten.


[1] 
Hierzu auch Ritter/Schütz: 2007a, 2007b.
[2] 
Oktoberverlag Münster.
[3] 
Gutzkow 1857, 1863, 1872.
[4] 
Gutzkow 1852, 1876.
[5] 
Vonhoff 2000.
[6] 
Lauster/Vonhoff 2007.
[7] 
Vgl. Groß 2005.
[8] 
Siehe auch: Aschenbrenner/Gietz/Küster/Ludwig/Neuroth 2006.
[9] 
Mittelbach/Rath 2007.
[10] 
Hierzu: Knuth 1984; Lamport 1986.
[11] 
Vgl. Ritter/Stussak 2005.
[12] 
Vgl. hierzu: Rapp 2007; Burch/Rapp 2007.
[13] 
Duntze/Fritze 2007.