XML-Technologien als Grundlage dynamischer
Textpräsentation. Die digitale Quellenedition
Der Zürcher Sommer 1968

Abstract

Whereas editors of printed collections of historical sources have to decide whether to create a critical edition for a scientific audience or one for a wider audience, which is easier to read, digital editions have the potential to combine high standards of textual criticism with a high degree of readability. By means of an edition of primary sources on the 1968 movement in Zurich, Switzerland, the article introduces the utilization of XML as tool for the creation of dynamic documents. The application allows the user to switch between different modes of the representation of the sources ranging from a plain to a critically edited text with facsimile. Moreover, XML can be very useful for structuring and arranging large amounts of texts and present them in different modes. XML is thus an ideal markup language for critical editions, although minor problems concerning the processing of large data sets must be dealt with. The article illustrates, how XML and XSLT are put into practice. On the one hand XSLT is used to dynamically produce different views on the sources of the edition. On the other hand XSLT extracts meta information from the data to get the various indices and tables of content. By these means the edition organizes its source documents in different ways to ease the access for the users.

[1] 

1968 edieren – Erkenntnisinteresse und Publikum von Quelleneditionen zur 68er-Bewegung

[2] 

Die 68er-Bewegung ist ein intensiv beforschter, zugleich aber auch öffentlich stark diskutierter Gegenstand der Zeitgeschichte. Sowohl wissenschaftlicher Diskurs, als auch die öffentliche Auseinandersetzung erhalten immer wieder entscheidende Impulse durch Dokumentenfunde in den bislang nur unzureichend aufgearbeiteten Quellenbeständen der zeithistorischen Archive. Ein prominentes Beispiel ist die Debatte um das Verhältnis der 68er zur Frage revolutionärer Gewalt, die von Wolfgang Kraushaars Auswertung von Notizen im Nachlass des charismatischen SDS-Vordenkers Rudi Dutschke losgetreten wurde. [1] Quelleneditionen kommen in einem erinnerungspolitisch umkämpften Feld eine besondere Bedeutung zu: In wissenschaftlicher Perspektive sind sie Grundlage und Anregung für weitere Forschung. Für die interessierte Öffentlichkeit bilden sie wichtige Referenzpunkte, die eine selbstständige Orientierung jenseits der historiographischen Darstellungen, aber auch deren kritische Überprüfung ermöglichen. Aus der Tatsache freilich, dass 1968 ein Ort ist, an dem sich zeitgeschichtliches und öffentliches Interesse kreuzen, ergeben sich besondere Anforderungen an eine Quellenedition.

[3] 

Das öffentliche Interesse am Gegenstand erfordert einen möglichst einfachen Zugang zu den Texten, der nicht von einem aufwändigen Apparat oder umfangreichen Kommentaren verstellt werden sollte. Das wissenschaftliche Interesse verlangt nach dem Gegenteil, nämlich nach einer möglichst informationsgesättigten Präsentation der ausgewählten Dokumente. Verschärft wird dieses Problem noch dadurch, dass längst nicht mehr nur die Geschichtswissenschaft 1968 als Gegenstand entdeckt hat. Auch Kultur- und Medienwissenschaften geben der Erforschung der 68er-Bewegung entscheidende Impulse. [2] In diesen Wissenschaften werden andere Blicke auf die Quellen praktiziert: ihre Materialität, ihre Medialität, ihr Design und ihre sprachliche Beschaffenheit werden nicht nur als Beiwerk wahrgenommen, sondern rücken in den Fokus wissenschaftlicher Untersuchung. Dies macht es notwendig, die Quellen nicht als Texte, sondern als Dokumente aufzufassen und als solche zu edieren. Eine Edition zur 68er-Bewegung steht also vor der Aufgabe, hohe editorische Standards dokumentarischen Edierens mit der Benutzerfreundlichkeit und Zugänglichkeit einer Leseausgabe zu kombinieren.

[4] 

Wie haben die inzwischen in recht großer Zahl verfügbaren Quelleneditionen zur 68er-Bewegung im deutschsprachigen Raum diese Aufgabe gelöst? Soweit sie im zeitlichen Kontext der Bewegung oder aus der Bewegung heraus entstanden sind, sind die Editionen vor allem an den Inhalten der Texte und/oder Gespräche orientiert. Teilweise sind daher auch die abgedruckten Texte auf ihre als wesentlich betrachteten Passagen gekürzt, wodurch die Editionen selbst Quellencharakter erhalten. [3] Die zeithistorisch orientierten Quelleneditionen jüngeren Datums haben vor allem den Anspruch, zentrale Themenbereiche, wichtige Strömungen und unterschiedliche Phasen der 68er-Bewegung in den ausgewählten Quellen zu dokumentieren. Dabei werden als historisch bedeutsam und repräsentativ eingeschätzte Dokumente vor allem als Texte wiedergegeben, Faksimilierungen sind selten und haben eher Schmuckcharakter. Chronologien und umfangreiche Kommentare, in denen der historische Kontext erarbeitet wird, machen diese Editionen zu wichtigen Standardwerken für die geschichtswissenschaftliche Erforschung zur 68er-Bewegung. [4] Ähnlich verfahren auch die zeithistorischen Quelleneditionen, die für ein größeres Publikum konzipiert wurden. [5] Sie sind freilich erheblich sparsamer kommentiert, wodurch der historische und intertextuelle Zusammenhang, in dem die ausgewählten Quellen stehen, zugunsten eines kaleidoskopartigen Bildes von 1968 in den Hintergrund tritt. Weil in ihnen Quellentexte häufig gekürzt sind, sind sie für die Forschung nur sehr bedingt tauglich. [6] Die wenigen vorliegenden digitalen Editionen zielen auf eine möglichst vollständige Dokumentation eines besonderen Ereignis- oder Kommunikationszusammenhanges. So die vom Archiv für Soziale Bewegungen in Freiburg vorgelegte Edition gleich wird’s grün zu den Freiburger Fahrpreiskämpfen und die digitale Edition der Untergrundzeitschrift agit 883. [7] Beide präsentieren sämtliche Dokumente zwar als Faksimiles, jedoch nicht als Volltexte, was für den Nutzer eine schnelle Erschließung der überwiegend schriftlichen Dokumente erschwert – ein Malus für das wissenschaftliche Arbeiten –, und häufig auch ihre Lesbarkeit erheblich verringert, was interessierte Laien eher abschrecken dürfte.

[5] 

Den wenigsten Quelleneditionen zu 1968 gelingt also der Spagat zwischen einer rezeptionsfreundlichen und einer wissenschaftstauglichen Darstellung der Dokumente, die den Ansprüchen dokumentarischen Edierens genügen würde. Sie wenden sich entweder an ein wissenschaftliches Fachpublikum oder an interessierte Laien – ein Konflikt, der in der wissenschaftlichen und erinnerungspolitischen Auseinandersetzung mit 1968 angelegt scheint. Die am Deutschen Seminar in Zürich erarbeitete digitale Edition der Zürcher Sommer 1968 nutzt die Möglichkeiten digitalen Edierens, um dieses Dilemma zu umgehen. Mit ihr liegt erstmals eine Edition zu einer 68er-Bewegung vor, die den Bedürfnissen eines breiten Publikums ebenso entgegenkommt wie den Anforderungen unterschiedlichster wissenschaftlicher Disziplinen.

[6] 

Der Zürcher Sommer 1968 – Eine kommunikationsgeschichtliche Edition

[7] 

Auch digitale Quelleneditionen bedürfen Auswahlkriterien, nach denen entschieden wird, welche Dokumente in die Edition aufgenommen werden und welche nicht. Diese Kriterien sollten aus einem theoretischen Zugang abgeleitet werden, der sich für die Perspektivierung der historischen Ereignisse eignet. Für die Edition von Dokumenten zur Zürcher 68er-Bewegung wurde das Konzept der Kommunikationsgeschichte gewählt. Die Kommunikationsgeschichte fasst die gesellschaftliche Funktion der Kommunikation als einen zentralen Erklärungsfaktor für historische Prozesse auf. Als theoretischer Rahmen dienen ihr eine sprechakttheoretische Fundierung politischen Handelns und die identitätsstiftende und auf soziale Werte verpflichtende Funktion performativer kommunikativer Praktiken. Politisches Handeln ist demanch wesentlich kommunikativ. Es besteht im Vollzug performativer Akte, also solcher Sprachhandlungen, durch deren Vollzug Bedingungen gesetzt werden, unter denen künftige Handlungen als adäquat gelten. Ein Beispiel ist das Ultimatum: Es setzt einen Zeitpunkt, nach dessen Verstreichen eine bestimmte Handlungsweise als erforderlich gilt, eine andere hingegen als falsch und negative Konsequenzen fordert. Wichtige Kategorien, die die Motivation zu politischem Handeln erklären, sind Glaubwürdigkeit und ›face‹ (Goffman). Glaubwürdigkeit und ›face‹ sind sozial konstruierte Vorstellungen vom Wert eines Interaktionspartners. Um etwa glaubwürdig zu sein, darf man den Eindruck nicht entstehen lassen, man würde den Worten keine Taten folgen lassen. Weil politisches Handeln als kommunikatives Handeln auf mediale Vermittlung angewiesen ist, wird es durch relativ stark normierte Textsorten vollzogen, etwa durch Stellungnahmen oder Ankündigungen. Typische Sprachhandlungen sind die Aufforderung, die Verurteilung, die Erklärung, die Distanzierung et cetera. Kommunikative face-to-face-Interaktion hat zudem das Potenzial, auf Werte zu verpflichten und durch den körperlichen Vollzug soziale Identitäten zu vermitteln. Der öffentliche Vollzug kommunikativer Praktiken hat daher eine vergemeinschaftende Funktion; seine Störung hingegen verweist auf Dissens und agiert diesen symbolisch und konkret aus.

[8] 

Diese Modellierung politischer Prozesse bietet sich auch für die Ereignisse des Zürcher Sommers 1968 an. In den gesellschaftlichen Protesten ging es 1968 in Zürich ganz konkret um den Streit um die Einrichtung eines autonomen Jugendhauses und – im Vergleich zu anderen europäischen Ländern – weniger um große weltpolitische Themen. Bereits seit 1949 waren immer wieder Forderungen nach Jugendräumen und Kulturzentren für die Jugend laut geworden, doch diese wurden von der Stadt nie im Sinne der Jugendlichen zufriedenstellend erfüllt. Der öffentliche Kampf für die Anliegen der Jugend begann in Zürich am 15. Juni 1968, als Lehrlinge, Schüler und Studierende eine Kundgebung für ein autonomes Jugendhaus und gegen repressive Polizeieinsätze organisierten. Mit dieser Demonstration antworteten die Jugendlichen nicht zuletzt auch auf eine äußerst gewaltsame, polizeiliche Auflösung von Fanansammlungen bei einem Jimi-Hendrix-Konzert im Vormonat. Die Auseinandersetzungen zwischen Jugendorganisationen und dem damaligen Stadtrat spitzten sich in der Folge rasch zu und gipfelten – nach einem Ultimatum der Jugendlichen an den Stadtrat – am 29. Juni 1968 gewaltsam im sogenannten Globuskrawall. Im Stadtzentrum versammelten sich damals etwa 2000 Jugendliche zu einer Kundgebung und es kam zu schweren Auseinandersetzungen mit der Polizei. Der Zürcher Stadtrat reagierte am 1. Juli prompt mit einem Demonstrationsverbot auf die Unruhen. Zwecks Vermittlung zwischen Stadtrat und Jugendlichen gründeten Zürcher Intellektuelle am 2. Juli spontan eine Vereinigung namens Arbeitsgemeinschaft Zürcher Manifest. Diese Arbeitsgemeinschaft organisierte im Spätsommer unter anderem eine sechstägige Diskussionsveranstaltung – als Sechstagerennen bekannt – zu verschiedensten aktuellen Problemen. Trotzdem blieben die Wünsche der Jugendlichen Ende 1968 unerfüllt und auch die gemeinsamen Aktionen von Lehrlingen, Schülern und Studenten ohne Erfolg. Das im Laufe des Sommers entstandene Netzwerk von Jugendorganisationen löste sich gegen Ende Jahr langsam wieder auf, einige der zentralen Akteursgruppen waren in Grundsatzfragen zerstritten und arbeiteten mehr gegen- als miteinander.

[9] 

Betrachtet man die Ereignisse in Zürich aus kommunikationsgeschichtlicher Perspektive, dann ergibt sich das folgende Narrativ: In der ersten Phase des Jahres 1968 tragen protestierende Jugendliche, aber auch Stadtregierung und Presse dazu bei, dass eine konsensuelle Lösung der Jugendhausfrage allmählich unmöglich wird. Durch das Stellen von Ultimaten, das Fordern und Drohen mit staatlichen Repressionen, durch Demonstrationsverbote, aber auch durch Störungen öffentlicher Veranstaltungen und das Durchführen von Gegenveranstaltungen werden Handlungsspielräume immer mehr eingeschränkt, bis sich die unterschiedlichen Interessensgruppen unversöhnlich gegenüberstehen und die Spannungen sich in den Globuskrawallen entlädt. In einer zweiten Phase, die unmittelbar auf die Krawallnächte folgt, erscheint mit dem linksliberalen Stadtbürgertum ein weiterer Akteur, der sich um die sprachliche Öffnung von Handlungsspielräumen, das heißt um den gesellschaftlichen Dialog zur Findung gemeinsamer Problemlösungen bemüht. Es kommt zu Verurteilungen der polizeilichen Ausschreitungen, Appellen zur Aufnahme des Dialogs und zu friedlichem Verhalten, aber auch zu Vermittlungsversuchen zwischen Stadt und Jugendvertretern. Die angestoßenen gesellschaftlichen Debatten haben schließlich in einer dritten Phase die Funktion der kommunikativen Beschwichtigung der sozialen Bewegung. Die Stadtregierung spaltet die Bewegung dadurch, dass sie mit ihren radikalen Vertretern nicht verhandelt. Gemäßigte Akteure kanalisieren den gesellschaftlichen Protest in ein konsensorientiertes Gespräch im Kreis der Aktivisten, das die unterschiedlichen Interessen innerhalb der Bewegung zutage fördert. All dies führt dazu, dass die Bewegung schon im Herbst 1968 an Integrationskraft verliert und sich ähnlich wie in anderen Ländern in viele Splittergruppen spaltet, denen eine breite Mobilisierung wie im Sommer 1968 nicht mehr gelingt.

[10] 

Ausgehend von dieser Modellierung der Vorkommnisse im Zürcher Sommer 1968 wurden solche Dokumente für die Quellenedition ausgewählt, in denen die Einschränkung und Öffnung von Handlungsspielräumen durch Sprachhandlungen vollzogen wird; zum anderen sollten Dokumente zu Kommunikationsereignissen in die Edition aufgenommen werden, in denen gesellschaftlicher Konsens ausgehandelt beziehungsweise performativ aufgekündigt wurde.

[11] 

Die 958 in die Edition aufgenommenen Dokumente stammen aus verschiedenen Archiven in Zürich und ihre Entstehung lässt sich vorwiegend auf das Frühjahr und den Sommer 1968 datieren. Da die Edition die Aktivitäten nicht nur der linken Aktivisten, sondern auch weiterer Akteure wiedergibt, ist die Palette der edierten Dokumentengattungen recht breit. Die Dokumente lassen sich grob in drei Kategorien einteilen: (1) massenmediale Kommunikation, (2) Polizeiakten und Unterlagen der Stadtregierung aus dem Zürcher Stadtarchiv sowie (3) Dokumente der Protestierenden. Die erste Kategorie bezieht sich auf die Tagespresse, die sich mit den Ereignissen zu jener Zeit äußerst intensiv auseinandersetzte. Entsprechend groß ist die Zahl der Zeitungsartikel und -berichte. Die Polizeiakten enthalten einerseits Berichte von öffentlichen Diskussionen, an denen Beamte in Zivil teilnahmen, Darstellungen von Überwachungen, aber auch Berichte von Zusammenstößen zwischen Polizei und demonstrierenden Jugendlichen. Die Dokumente der Protestierenden stammen vor allem von Jugendlichen, die sich für die Einrichtung eines Jugendhauses einsetzten, aber auch von Gruppierungen, die sich dem Antikapitalismus, dem Antiimperialismus und der Schaffung einer neuen Gesellschaftsordnung verpflichtet fühlten. Zudem sind die Aktivitäten des linksliberalen Stadtbürgertums umfassend dokumentiert. Arbeitspapiere, Zirkulare oder Thesenpapiere spiegeln die interne Kommunikation der verschiedenen Gruppierungen. Dagegen dokumentieren Textgattungen wie Flugblätter, Broschüren, Briefe, Dossiers oder Berichte ihre externe Kommunikation. Im Rahmen der von der Arbeitsgemeinschaft Zürcher Manifest im Herbst 1968 veranstalteten Marathondiskussion entstanden zudem rund 300 großformatige Wandzeitungen, die vom Schweizerischen Sozialarchiv Zürich für die Nachwelt verwahrt wurden. Die Edition versammelt damit vornehmlich ›graue‹ Literatur, das heißt Dokumente, die niemals über den Buchhandel vertrieben wurden.

[12] 

Die digitale Aufbereitung der Quellen

[13] 

Die große Anzahl an Dokumenten, die Vielzahl unterschiedlicher Quellentypen und die unterschiedlichen Nutzergruppen gaben schließlich den Ausschlag dafür, dass einer digitalen Edition der Vorzug vor einer Edition in Buchform gegeben wurde. Denn digitale Editionen haben den Vorteil, dass sie umfangreicher und zugleich flexibler in der Präsentation der Dokumente sein können. Wie eingangs dargestellt, liegen die Anforderungen an eine digitale Quellenedition zur 68er-Bewegung einerseits darin, die Benutzerfreundlichkeit und einfache Zugänglichkeit einer Leseausgabe zu bieten, andererseits die hohen editorischen Anforderungen zu erfüllen, die an eine Edition von wissenschaftlicher Seite gestellt werden. Um beides miteinander verbinden zu können, wurden die Dokumente für die Edition Der Zürcher Sommer 1968 so aufbereitet, dass sie ein Umschalten zwischen verschiedenen Darstellungsweisen ermöglichen: Zwischen einer Darstellung als Faksimile und einer Volltextdarstellung, zwischen der Textpräsentation einer Leseausgabe, die lediglich bedeutungstragende Aspekte des Textdesigns abbildet und der Darstellungsweise einer historischen-kritischen Ausgabe, die eine dokumentarische Umschrift von Text und Textgenese und gegebenenfalls einen textkritischen Apparat enthält. Durch die Möglichkeit des Umschaltens zwischen verschiedenen Präsentationsmodi können die Bedürfnisse unterschiedlicher Nutzergruppen mit einer einzigen Edition befriedigt werden.

[14] 

Um die Darstellung der Dokumente flexibel handhaben zu können, müssen diese in einer Auszeichnungssprache kodiert werden. Neben einem System wie TUSTEP [1]kommen dafür vor allem die Varianten von XML in Frage. Für die Erstellung der digitalen Edition Der Zürcher Sommer 1968 wurde auf die Standards der Text Encoding Initiative zurückgegriffen. [8] Sie schlägt einen auf XML basierenden Annotationsstandard vor, der speziell für die Aufbereitung unterschiedlichster Sorten von Texten, zum Beispiel im Rahmen kritischer Editionen, gedacht ist. Hierbei lassen sich mittels spezifischer Tags beliebige Metainformationen zu einem Text spezifizieren, auf die später im Rahmen verschiedener Anwendungen problemlos zurückgegriffen werden kann. Auch können bestimmte Metainformationen bei der Textgenerierung im Anzeigemodus »Leseausgabe« ignoriert werden, während dieselben Metainformationen bei der Textgenerierung im Anzeigemodus »Kritische Ausgabe« genutzt werden können. Somit ist TEI das ideale Werkzeug für die hier vorgestellte Edition. Da die weniger umfangreiche TEI-Version TEI lite den Ansprüchen dieser Edition genügte, konnte durch den Rückgriff darauf unnötiger Kodierungsaufwand vermieden werden. Stellten die von TEI lite vorgeschlagenen Tags für unsere Zwecke keine Lösung dar, wurden neue Tags definiert. Damit setzt sich das Tagset sowohl aus englischsprachigen TEI-konformen Tags, als auch aus deutschsprachigen selbstdefinierten Tags zusammen. Das Tagset bildet den Rahmen für die Kodierung der textkritischen Informationen und legt zugleich die Parameter fest, nach denen das Quellenkorpus durchsucht werden kann. Neben diesen grundsätzlichen Anforderungen ergaben sich weitere technische Anforderungen:

[15] 

• Die Applikation soll unter allen gängigen Betriebssystemen lauffähig sein.

[16] 

• Die Applikation soll sowohl lokal auf einer DVD-ROM als auch über das Web ausführbar sein.

[17] 

• Installationsprozesse sollen möglichst vermieden werden: Die Applikation muss direkt von der DVD-ROM weg ausführbar sein.

[18] 

Als einfachste Möglichkeit, diese Anforderungen zu erfüllen, erweist sich eine Anwendung, die direkt in einem Browser der neueren Generation ausführbar ist. Allerdings produziert die Forderung nach sowohl lokaler Ausführbarkeit als auch Web-Nutzung einige Probleme: Ohne den Einsatz von komplexeren Java-Programmen sind keine Programmteile wie zum Beispiel die Nutzung von Datenbanken möglich, die bei Browser-Anwendungen meist serverbasiert sind. Die Anwendung muss sich auf die Client-orientierten Technologien HTML, CSS, XML mit XSLT-Stylesheets, Javascript et cetera beschränken. Allerdings bieten die neueren Standards dieser Technologien in Kombination mit aktuellen Browsern ein großes Potenzial. [9]

[19] 

Edieren mit dem TEI-Tagset

[20] 

Um ein anschauliches Bild der Quellenedition zu vermitteln und die Auswahl der Tags zu exemplifizieren, soll das Tagset nun in der konkreten Realisierung der digitalen Edition auf der Ebene eines einzelnen Dokuments vorgestellt werden. Ein Dokument, beispielsweise ein Flugblatt oder ein Zeitungsartikel, besteht in seiner edierten Fassung nicht nur eine Umschrift der in ihm enthaltenen textuellen oder graphischen Oberflächenphänomene, sondern macht zusätzlich eine Reihe von Aussagen über sich selbst: seine Beschaffenheit, seinen Fundort und seine Verortung innerhalb des historischen Zusammenhangs. Diese Informationen können für die Textanalyse und Textinterpretation von großer Bedeutung sein und werden im Dokumentkommentar, auch Header genannt, festgehalten. Dieser Header steht jedem Text voran und ermöglicht so sowohl die schnelle Orientierung über das Dokument, als auch dessen erste Beurteilung und Einordnung. Tags, die Informationen zu den Kategorien Autor, Titel, Datum, Fundort beziehungsweise Archiv, Dokumententyp, Größe, Farbe, Herstellungsart oder die Form der Vervielfältigung enthalten, sind darin versammelt. Zusätzlich wird das Dokument hier mit spezifischen Tags zu Ereignissen oder Themen geordnet und in die Chronologie eingebettet. Dem Header folgt der Text des Dokuments, der Body, dessen Abschrift so konzipiert ist, dass die Nähe zum Originaltext weitgehend erhalten bleibt und Informationsverlust möglichst vermieden wird. Da die ursprüngliche Form des Dokuments häufig nicht gänzlich imitiert werden konnte, besteht die Möglichkeit, sich ein Faksimile jedes Dokuments anzeigen zu lassen. Die Metainformationen, die in Bodytags festgehalten wurden, betreffen die grobe Textgliederung, das feinere Textbild, rein semantische Besonderheiten sowie morphologische Informationen. So wurden beispielsweise Titel und Zwischentitel, Absätze sowie gegebenenfalls der opener am Anfang des Textes, beziehungsweise dementsprechend der closer am Ende des Textes annotiert. Zudem sind Tabellen, Aufzählungen und Einrückungen ebenso wie die Zeilenumbrüche mit spezifischen Tags versehen. Hinsichtlich des Textbildes stehen die Abschriften den originalen Dokumenten sehr nah, da die verschiedenen Erscheinungsformen der Schrift und des Schriftbildes wiedergegeben werden. Als Besonderheiten der Schrift, die in spezifischen Bodytags festgehalten sind, können deren Größe und Farbe, außerdem die Schriftart sowie die Schriftformatierung, also beispielsweise fetter oder kursiver Druck, Majuskeln und Kapitälchen, Sperrung oder Unterstreichung angesehen werden. Viele solcher textuellen Besonderheiten haben einen besonderen semantischen Wert, da sie Teil der Aussage sind, die mit dem Dokument gemacht werden sollte. Diese bedeutungstragende Funktion bestimmter Formatierungen für den Text ist das wichtigste Kriterium für deren Markierung in der vorliegenden Edition. Auch Aspekte der Textgenese wie Streichungen oder Hinzufügungen, Marginalien oder nachträgliche Korrekturen wurden durch spezifische Tags annotiert.

[21] 

Neben der Annotation formaler Eigenschaften der Texte wurden auch semantische Aspekte mit eigenen Tags versehen, wodurch ebenfalls der Zugang zum Text und dessen Spezifika erleichtert wird, ohne dass jedoch Interpretationen vorweg genommen werden. So werden Zitate, Problematisierungen von Begriffen, zum Beispiel durch den Ausdruck »so genannt« oder durch das Setzen von Anführungszeichen, sowie Schlagwörter und Parolen, also Elemente mit besonderer kommunikativer Funktion, mit Tags gekennzeichnet. Personen-, Gruppen-, und Ortsnamen wurden ebenfalls in einem halbautomatischen Verfahren annotiert, wobei die Annotation auch den zugehörigen Type (ihre standardisierte Form) angibt.

[22] 

XML-TEI-Dateien als Ausgangspunkt für die Aufbereitung der Daten

[23] 

Die TEI-Dokumente sind ein idealer Ausgangspunkt, um die Daten für unterschiedliche Zwecke aufzubereiten. Über sog. XSLT-Stylesheets (Extensible Stylesheet Language)[4], also Stilvorlagen, die den XML-Code beliebig in anderen Code, zum Beispiel HTML übersetzen, kann jede gewünschte Information, die in den XML-Dokumenten codiert ist, extrahiert und in eine neue Ordnung gebracht werden. So werden die XML-Daten in der Edition Der Zürcher Sommer 1968 für folgende Zwecke verwendet:

[24] 

• Darstellung der Quellen als interaktive Dokumente im Browser.

[25] 

• Erstellung von Indizes und Verzeichnissen, zum Beispiel aller Autorinnen und Autoren, Textsorten, Themen oder Ereignissen, denen die Quellen zugeordnet wurden.

[26] 

• Erstellung einer Chronologie, bei der auf einem Zeitstrahl die zu bestimmten Ereignissen zugehörigen Dokumente aufgeführt werden.

[27] 

• Geografische Verortung der Dokumente auf einem Stadtplan.

[28] 

• Statistische Auswertung der Dokumente während der Entwicklungsphase, um einen Überblick über die Anzahl an Dokumenten eines bestimmten Typs oder Varianten von in TEI codierten Kategorien zu erfassen.

[29] 

Diese Informationen können, vorausgesetzt das jeweilige XSLT-Stylesheet existiert, automatisiert aus den XML-Daten extrahiert und aufbereitet werden.

[30] 

XSL-Transformationen können einerseits von einem Browser der neueren Generation vollzogen, oder auch mittels eines eigenständigen Prozessors [10] bereits vor der Darstellung im Browser auf die XML-Dokumente angewandt werden. Je nach Komplexität des XSLT-Stylesheets kann die Transformation im Browser sehr rechenintensiv sein, insbesondere dann, wenn ein Stylesheet jedes der 958 XML-Dokumente einlesen und nach bestimmten Informationen absuchen muss. Diese Funktion wird insbesondere bei der Erstellung von Verzeichnissen eingesetzt. In solchen Fällen ist es deshalb von Vorteil, die Transformationen nicht erst in der Anwendung durch den Browser des Benutzers/der Benutzerin erstellen zu lassen, sondern bereits vor Auslieferung der Applikation. In der fertigen Anwendung liegen dann statt XML-Dokumente mit zugehörigen XSLT-Stylesheets nur noch HTML-Dokumente vor, die von den Browsern rasch angezeigt werden können.

[31] 

Darstellung der Quellen

[32] 

Der Kern der Anwendung bildet die Darstellung der Quellen. Es liegen für jede Quelle deren annotierte Umschrift als TEI-Dokument, sowie ein Faksimile als Scan vor (vgl. Abbildung 1).

[33] 

[34] 

Abbildung 1: Die digitale Edition Der Zürcher Sommer 1968: Dokumentenansicht

[35] 

Bei der Darstellung der Quelle soll es nun der Anwenderin/dem Anwender möglich sein, beliebige Stufen des TEI-Dokuments zwischen Lesetext (ohne jegliche Metainformationen) und kritischer Edition (Anzeige aller Metainformationen) anzusehen. Natürlich ist es möglich, dafür entsprechende XSLT-Stylesheets zu programmieren, allerdings sind eine Vielzahl von Stylesheets nötig, wenn alle Kombinationsmöglichkeiten der sieben definierten Kategorien (als Zwischenstufen: mit oder ohne Auszeichnungen, mit oder ohne Kommentare et cetera) berücksichtigt werden müssen. Deshalb musste hierfür eine andere Lösung gefunden werden. Die Kombination von XSLT-Darstellung und Javascript erwies sich dafür als praktikabel: Das Quelldokument wird für alle Darstellungsstufen vom selben XSLT-Stylesheet in HTML umgesetzt. Die HTML-Darstellung wird über Cascading Stylesheets (CSS) geregelt. Über Javascript-Routinen können nun je nach Benutzereingabe die CSS-Darstellungsmodi verändert werden. Ein Beispiel soll dies illustrieren:

[36] 

Im TEI-Dokument existiert die Auszeichnung:

[37] 
<hi rend=»italic«/>
[38] 

Das XSLT-Stylesheet übersetzt diese in den HTML-Code:

[39] 
<span class=»italic«/>
[40] 

Im CSS-Stylesheet wird die Klasse »italic« definiert als:

[41] 
span.italic {font-style: italic;}
[42] 

Wenn der Benutzer/die Benutzerin jedoch eine Darstellungskategorie wählt, in der diese Auszeichnung nicht dargestellt werden soll, wird über Javascript die CSS-Klasse des entsprechenden HTML-Codes umdefiniert auf:

[43] 
<span class=»italic_off«/>
[44] 

Diese CSS-Klasse weist eine entsprechend andere Definition auf:

[45] 
span.italic_off {font-style: normal;}
[46] 

Nachdem die Javascript-Routine alle Vorkommen von <span/> mit der neuen Klassen-Definition versehen hat, wird der Text im Browser ohne Kursivierung dargestellt.

[47] 

Alle Auszeichnungen werden nach diesem Prinzip behandelt, auch die Zeilenschaltungen, die nur bei der zeilensynoptischen Darstellung sichtbar sein dürfen. Sie werden in HTML als

[48] 
<span class=»linebreak«/>
[49] 

umgesetzt, wobei das CSS-Stylesheet dafür entweder das Attribut »display: block« bzw. »display: inline« definiert und so die Zeilenschaltung sichtbar oder unsichtbar macht. Bei Worttrennungen und anderen Spezialfällen müssen besondere Behandlungen definiert sein.

[50] 

Ebenfalls über Javascript und Dynamic HTML (DOM-Scripting)[6]wird die Anzeige der Metainformationen im Text übersichtlicher gemacht: So erscheinen bei Berührung der Maus mit den entsprechenden Textstellen weitere Informationen in einem kleinen Fenster, ähnlich wie man es als kontextsensitive Hilfe in anderen Programmen kennt (vgl. Abbildung 2). So werden zum Beispiel Kommentare, sie sich auf eine einzelne Stelle innerhalb des Dokumentes beziehen, bei Berühren der betreffenden Stelle als Popup-Fenster sichbar, während Dokumentenkommentare fortwährend oberhalb des Dokumenttextes dargestellt werden.

[51] 

[52] 

Abbildung 2: Ausschnitt der Darstellung einer Quelle in TEI-Umschrift

[53] 

Über Dynamic HTML und Javascript werden auch die weiteren Bedienelemente der Dokumentanzeige erstellt. Neben einer Palette zur Regelung der Anzeige zwischen Lesetext und kritischer Edition, ist das eine weitere Palette, die die Faksimiles des Dokuments als Miniaturen anzeigt und die Links anbietet, um das Faksimile anzusehen. Die Paletten können verschoben und in der Größe minimiert werden, um dem Benutzer/der Benutzerin möglichst viele Freiheiten bei der Einrichtung der Darstellung zu lassen.

[54] 

Zugriff auf die Dokumente

[55] 

Die digitale Quellenedition bietet mehrere Möglichkeiten, um auf die Dokumente zuzugreifen (vgl. Abbildung 1). Die wichtigste Möglichkeit sind eine Reihe von Kategorien, nach denen in der Quellensammlung geblättert werden kann. Folgenden Kategorien stehen dabei zur Verfügung:

[56] 

1. Ereignisse/Themen

[57] 

2. Medientypen

[58] 

3. Autor/innen

[59] 

4. Personen

[60] 

5. Gruppierungen

[61] 

6. Orte

[62] 

7. Publikationsdatum

[63] 

8. Stichwortverzeichnis

[64] 

Jede dieser Kategorie öffnet Unterkategorien, zum Beispiel im Fall der Kategorie »Medientypen«:

[65] 

1. Arbeitspapier (11)

[66] 

2. Brief (12)

[67] 

3. Broschüre (3)

[68] 

4. Dossier/Berichte (21)

[69] 

5. Flugblatt (192)

[70] 

6. Foto (19)

[71] 

7. Informationsblatt (6)

[72] 

8. Plakat (7)

[73] 

9. Polizeiakte, KK III (97)

[74] 

10. Wandzeitung (305)

[75] 

11. Zeitungstext (285)

[76] 

In Klammern ist die Anzahl der Dokumente aufgeführt, die diesen Unterkategorien zugeordnet sind. Ein weiterer Klick auf eine dieser Unterkategorien zeigt eine Liste der zugehörigen Dokumente.

[77] 

Die Kategorien ermöglichen einen strukturierten und raschen Zugriff auf die Dokumente. Das Stichwortverzeichnis bietet einen Ersatz für eine Volltextsuche an, die aus technischen Gründen nicht in einer lokal im Browser lauffähigen Applikation realisiert werden kann.

[78] 

Mit Hilfe der XSLT-Stylesheets können diese Kategorien automatisch aus den XML-Daten generiert werden. So liest das Stylesheet zum Beispiel für »Medientypen« alle entsprechenden TEI-Tags aus, zählt und listet sie als Unterkategorien auf, und erstellt die Links zu den zugehörigen Dokumenten.

[79] 

Die zeitliche und geografische Verortung der Dokumente

[80] 

Die digitale Quellenedition enthält in der Rubrik »Chronologie« einen Zeitstrahl des Sommers 1968, der wichtige Ereignisse abbildet. In kurzen Texten werden die Ereignisse dargestellt und jene Dokumente aus der Edition aufgelistet, die mit den Ereignissen in Verbindung stehen. In den TEI-Dokumenten sind die Ereignisse, denen sie angehören, vermerkt. So können die für den Zeitstrahl nötigen Listen von Dokumenten, die zu einem Ereignis gehören, leicht über XSLT erzeugt werden.

[81] 

Einen alternativer Zugang zu den Daten bietet ein Stadtplan von Zürich (vgl. Abbildung 3). Darauf sind die Orte markiert, die in den Quellen erwähnt werden. Die Ortsbezeichnungen wurden nach Erstellung der TEI-Dokumente in einem halbautomatischen Verfahren ausgezeichnet. Die Marker auf dem Stadtplan bilden durch ihre Größe die Frequenz ab, mit der der entsprechende Ort in den Dokumenten erwähnt wurde. Ein Klick auf den Marker zeigt wiederum eine Liste der zugehörigen Dokumente an.

[82] 

[83] 

Abbildung 3: Die geografische Verortung der Quellen auf einem Stadtplan der Stadt Zürich

[84] 

Um den Stadtplan zu realisieren, mussten alle Orte georeferenziert werden. Erschwerend kam dabei hinzu, dass einige der Orte, die in den Dokumenten erwähnt sind, heute unbekannt sind. Dabei handelt es sich etwa um Lokale, die nicht mehr existieren, oder Orte, die heute einen anderen Namen tragen.

[85] 

Die Georeferenzierung erfolgte zu großen Teilen manuell, wobei über eine Programmierschnittstelle die Dienste von Google Maps[7] in Anspruch genommen werden konnten: Damit konnte auf einem Stadtplan von Zürich mit Mausklick der gewünschte Ort markiert und damit die zugehörigen Koordinaten gespeichert werden. [11]

[86] 

Aus den XML-Dokumenten wurde in Verbindung mit den Georeferenzen eine KML-Datei transformiert. Bei KML[8] (»Keyhole Markup Language«) handelt es sich um eine Auszeichnungssprache, um Punkte und grafische Figuren im Raum zu referenzieren. So werden zum Beispiel in Google Earth[9] Ebenen, auf denen Punkte georeferenziert sind, im KML-Format gespeichert. Eine Reihe von weiteren geografischen Anwendungen können KML-Dateien lesen oder eine KML-Datei kann leicht in ein anderes XML-basiertes Format übersetzt werden.

[87] 

In der Digitalen Edition wird die KML-Datei über Javascript eingelesen, das die Punkte auf dem Stadtplan einzeichnet. Durch den automatisierten Arbeitsablauf kann die KML-Datei bei veränderter Datengrundlage einfach aktualisiert werden.

[88] 

XSLT: Vor- und Nachteile in der Entwicklungsphase

[89] 

Wie die Ausführungen oben gezeigt haben, sind XML und XSLT die passenden Technologien, um Daten für unterschiedliche Zwecke aufzubereiten. So war es zum Beispiel während der Entwicklungsphase wichtig, Inhalte und deren Darstellung strikt zu trennen: Gleichzeitig mit der Aufbereitung der Daten wurde bereits die Applikation erstellt. Laufend mussten also neue Daten in die Applikation eingefügt werden. Durch die strikte Trennung von Inhalten und deren Darstellung mussten jeweils nur die XSL-Transformationen auf den aktualisierten Datenbestand angewendet werden, um eine aktualisierte Version der Edition zu erhalten. [12]

[90] 

Ein weiterer Vorteil zeigte sich während der Entwicklungsphase: Nach Bedarf konnten mit modifizierten XSLT-Stylesheets Darstellungen für spezifische Bedürfnisse dieser Editionsphase erstellt werden, so zum Beispiel eine Kategorie, in der die unterschiedlichen Bearbeiter/innen der Dokumente aufgeführt sind, um die Quellen nach diesem Kriterium durchsehen zu können. Die Realisierung solcher Ansichten ist, solange die entsprechenden Informationen in den XML-Dokumenten codiert sind, nicht aufwändig.

[91] 

Allerdings zeigten sich während der Entwicklung Geschwindigkeitsprobleme: Die XSL-Transformation können sehr lange dauern, wenn die knapp 1000 Dokumente verarbeitet werden müssen. Auch die Verteilung der Arbeit auf mehrere Prozessoren konnte den Rechenaufwand nicht auf ein erträgliches Maß reduzieren; die Erstellung aller Verzeichnisse für die Edition hätte mehrere Stunden bis zu einem Tag gedauert und der Vorteil, nach Eingang von neuen XML-Dokumenten die Edition rasch zu aktualisieren wäre dahin gewesen. Deshalb wurde als Ersatz für einen Teil der Transformationen, die besonders rechenintensiv sind, Perl-Scripte erstellt, die die XML-Dokumente unter Verwendung von Regulären Ausdrücken auslesen. Der Geschwindigkeitszuwachs durch diese Methode ist gewaltig. Die anderen Transformationen, die weniger rechenintensiv sind, wurden weiterhin durch XSLT durchgeführt. Mit dieser kombinierten Verarbeitung kann die Aktualisierung der ganzen Edition innerhalb von wenigen Minuten erledigt werden. [13]

[92] 

Fazit

[93] 

XML zeichnet sich durch eine einfache Handhabung und eine transparente Gestalt aus. Wenn die Datengrundlage in einem XML-Format codiert vorliegt, ist die Weiterverarbeitung auf vielfältige Weise möglich. XSLT ist zwar ein geeignetes Werkzeug, um XML in die unterschiedlichen Gestalten, wie HTML oder andere XML-Formate zu bringen. Bei umfangreichen Projekten kann die Transformationsgeschwindigkeit der XSL-Prozessoren aber (noch) ein Problem darstellen. Doch wiegt dieses Problem nicht allzu schwer, da viele Programmiersprachen, wie zum Beispiel Perl, sehr gut mit XML umgehen können und eine alternative Verarbeitungsweise möglich machen. Die digitale Quellenedition zeigt, wie unterschiedlich die immer gleiche Datenquelle, in TEI/XML codiert, aufbereitet werden kann, um für jeden Fall genau die Form des Dokuments zu generieren, die der Benutzerin/dem Benutzer die besten Dienste erweist.

[94] 

Zwar bedarf das Edieren in TEI-XML und die Programmierung eines XSLT-Stylesheets einiger Einarbeitungszeit. Dennoch hat es gegenüber anderen Softwareapplikationen für digitale Editionen mehrere entscheidende Vorteile:

[95] 

1. Es gibt kaum technische Grenzen für Editionen, denn TEI-XML kann für spezielle Bedürfnisse problemlos angepasst und erweitert werden.

[96] 

2. Die Daten können jederzeit problemlos in andere Formate umkodiert werden.

[97] 

3. Die Dokumente können via Internetbrowser ohne die Installation zusätzlicher Programme angezeigt werden.

[98] 

All diese Eigenschaften machen TEI-XML zu einem nachhaltigen Medium für digitale Editionen.


[1] 
Vgl. Kraushaar (2005).
[2] 
Vgl. die Beiträge in Klimke/Scharloth (2007).
[3] 
Vgl. Jacobsen/Dollinger (1969), Zollinger (1969) und Wolff/Windaus (1977).
[4] 
Vgl. vor allem Lönnendonker/Fichter (1975), Lönnendonker u.a. (1983) und Kraushaar (1998).
[5] 
Vgl. Miermeister/Staadt (1980), Otto (1989), Schulenburg (1998) und Sievers (2004).
[6] 
Daneben gibt es einige Quelleneditionen, die aus den Erkenntnisinteressen einzelner kulturwissenschaftlicher Disziplinen heraus entstanden sind: eine möglichst lückenlose Dokumentation der Entwicklung von Konzepten und Denkprozessen der neoavantgardistischen Subversiven Aktion (Böckelmann/Nagel (1976), einen literaturhistorischen Ausstellungskatalog (Ott/Pfäfflin (1998) und eine linguistisch interessierte Edition von Flugblättern (Brunotte (1973).
[7] 
Vgl. Archiv für Soziale Bewegungen (2003) und Rotaprint 25 (2003).
[8] 
Vgl. die Homepage des TEI-Konsortiums [2] und die Webseite zu TEI in der Praxis [3].
[9] 
Die digitale Quellenedition verlangt als Mindestanforderung einen der folgenden Browser: Firefox 2 (und kompatible wie z.B.zum Beispiel Mozilla und Abkömmlinge) und Safari 3.0 (Mac OS X). Die Kompatibilität mit Internet Explorer 7 erwies sich als kritisch; in einer ersten Phase wird dieser deshalb nicht unterstützt.
[10] 
Für die digitale Quellenedition wurde mit »xsltproc« gearbeitet, einem frei verfügbaren Programm des GNOME-Projekts [5].
[11] 
Die Google-API bietet auch den Service »Geocoding« an, mit dem eine Adresse an den Server geschickt werden kann, der anschließend die Koordinaten des Ortes zurück gibt. Allerdings funktionierte der Service nur bei einem kleinen Teil der Orte der Edition erfolgreich, da viele der Ortsbezeichnungen heute nicht mehr existieren.
[12] 
Ein in Perl programmierter Arbeitsablauf vereinfacht dieses Prozess: Nach dem Start des Perl-Scripts ruft dieses alle nötigen XSL-Transformationen auf und legt die entstandenen Dokumente in den korrekten Verzeichnissen ab.
[13] 
Die Verarbeitung der XSL-Transformationen könnte wahrscheinlich auch durch die Optimierung des Codes verbessert werden. Der beschriebene Weg, für einen Teil der Transformationen Perl zu verwenden, erwies sich jedoch bei diesem Projekt als zeitsparender.