Möglichkeiten der computergestützten Regionalsprachen-
forschung am Beispiel des Digitalen Wenker-Atlas (DiWA)

Abstract

The Digital Wenker Atlas (DiWA <http://www.diwa.info>) is primarily dedicated to the internet publication of 19th century language maps. Using satellite imaging technology, graphic files of about 1.6 GB each are linked to databases and placed at users' disposal via decompression on the fly. DiWA has grown to become a powerful information system that opens up hitherto unknown linguistic research possibilities. After an introduction to the technical aspects of the system and the range of contents, some of DiWA's capabilities are demonstrated in a case study.

Georg Wenkers Sprachatlas des Deutschen Reichs

Georg Wenkers in den Jahren 1876 bis 1923 entstandener Sprachatlas des Deutschen Reichs ist insofern ein Kuriosum, als dieses Kartenwerk zwar bis heute unbestritten als Grundstein und nahezu unerschöpfliche Quelle der Sprachgeographie gilt, es aber gleichzeitig niemals zur voll­ständigen Publikation gelangte. Die Gründe liegen in der Anlage, im Format und der farbigen Gestaltung der Sprachkarten: Wenkers Erhe­bungen er­streckten sich auf das gesamte deutsche Reich in den Grenzen nach 1871. Zwischen 1876 und 1888 sammelte er in einer Totalerhebung standardisierte Formulare mit Dialektübersetzungen in circa 45.000 Ort­schaften. Die Auswertung des Materials führte zum Beleg der typischen Dialektmerkmale jeder noch so kleinen Ortschaft des Reiches. Es war nunmehr möglich, wichtige ortsdialektale Charakteristika zu isolieren und Unterschiedlichkeiten der Dialektlandschaften offen zu legen. Um diese Raumstrukturen abbilden zu können, wurde ein Kartenformat not­wendig, das die Differenzierung der 45.000 Erhebungspunkte zu leisten im Stande war. Eine einzelne Karte hätte dabei ein Maß von circa 130 x 120 cm angenommen, ein Format also, das für den Handgebrauch nicht geeignet war. Wenker entschloss sich daher das Gebiet auf drei Teilkar­ten abzubilden, einem Nordost-, Nordwest- und Südwestblatt im Format von jeweils circa 70 x 70 cm. Auf jeder Karte wurde je ein Erhebungs­wort als Thema aufgearbeitet. Insgesamt liegen heute 576 Themen auf 1.619 Ein­zelkarten vor. Zur Veranschaulichung der Raumstrukturen und damit zur Auswertung der Daten entwickelte Wenker eine kombinierte Flächen- und Punktsymbolkartierung, die sowohl Farblinien und farbige Flä­chenmarkierungen als auch farbige geometrische Symbole verwendet. Aus der kleinräumigen Parzellierung der deutschen Dialektlandschaft ergibt sich der Umstand, dass die Karten rasch von einer besonderen Vielfarbigkeit von bis zu 22 Farben pro Karte geprägt waren.

Seit 1926 wurden mehrere Publikations- und Sicherungsversuche des Gesamtwerkes in Angriff genommen und teilweise abgeschlossen, in keinem Fall konnte jedoch eine vollständige Dokumentation des Materi­als geleistet werden. Sämtliche Versuche waren mit der Reduktion von Datenumfang und Ortsdichte verbunden. Dieser Umstand war insofern bedauerlich als die Karten in ihrer Funktion als elementare Arbeitsmate­rialien der (deutschen) Dialektologie bereits angegriffen waren. Vor allem die Farbvielfalt der Karten war altersbedingt in Auflösung begriffen. 2001 wurde daher an dem von Wenker begründeten Forschungsinstitut für deutsche Sprache – Deut­scher Sprachatlas in Marburg eine internetba­sierte Publikation angestrebt, die 2003 erfolgreich abgeschlossen werden konnte. Ziel ist es seither, den historischen Atlas als Grundlage eines modernen Forschungsinstrumentes nutzbar zu machen. Über die Bereit­stellung aller Themenkarten hinaus ist eine Aufbe­reitung des Materials nach den Erfordernissen der modernen Regional­sprachenforschung intendiert. Unterstützt wird der so benannte Digitale Wenker-Atlas (DiWA) von der Deutschen Forschungsgemeinschaft (DFG) im Rah­men der retrospektiven Digitalisierung gefährdeter Bibliotheksbestände. Sämtliche Karten stehen inzwischen unter <http://www.diwa.info> zur Verfügung, eine Vielzahl der Anwendungsmöglichkeiten ist implemen­tiert und funktionstüchtig.

Das Projekt Digitaler Wenker-Atlas – technische Umsetzung

Mit dem Projekt Digitaler Wenker-Atlas wurden ursprünglich zwei Haupt­ziele verfolgt: Das historische Material sollte einerseits gesichert und zu­kunftssicher archiviert werden, andererseits wurde eine voll­stän­dige, originalgetreue und zeitgemäße Publikation des Wenker-Atlasses im Internet angestrebt.

Georg Wenkers Sprachatlas des Deutschen Reichs liegt in zwei Exemplaren vor. Neben dem Marburger Kartensatz existiert ein (aller­dings unvoll­ständiger) zweiter in der Staatsbibliothek zu Berlin – Stif­tung Preußischer Kulturbesitz. Beide Bestände wurden zunächst unter Vergleich des qua­litativen Kartenzustands inventarisiert, wobei von je­weils zwei identi­schen Karten das Berliner Exemplar aufgrund der nied­rigeren Nutzungs­frequenz den besseren Erhaltungsgrad aufwies und für die Bearbeitung des DiWA ausgewählt wurde.

Die Kartenblätter wurden zunächst einzeln gescannt und als tif-Da­teien gespeichert, wobei die Abbildung selbst feinster Bilddetails durch eine Auflösung von 600 dpi und 24 Bit Farbtiefe gewährleistet wurde. Die durchschnittliche Größe einer solchen Bilddatei beträgt etwa 670 MB, weshalb schon das Öffnen einer einzelnen Datei eine gewisse Her­ausforderung für gebräuchliche Bildverarbeitungsprogramme dar­stellt. An eine Bearbeitung oder gar Webpublikation war in diesem For­mat nicht zu denken, aber durch eine konventionelle Reduktion der Bild­größe auf über das Internet transportable Abmessungen und den damit unweigerlich verbundenen Bilddetailverlust wären die Karten un­brauch­bar geworden. Es war also erforderlich, dem Anwender Funktio­nen zum Vergrößern und Verschieben der Kartenansicht zur Verfügung zu stel­len. Eine mög­liche und von mehreren Softwareherstellern ange­botene Lösung dieses Problems besteht in der Erzeugung von verschie­denen Ansichten des­selben Bilds in bis zur 1:1-Darstellung aufeinander­folgen­den Zoomstu­fen. Die dabei entstehenden Bilder werden in klein­forma­tige Kacheln zerlegt, von denen die den jeweils gewünschten Bild­aus­schnitt enthalten­den an den Client übermittelt und im Browser zu einem Mosaik kombi­niert werden. Dieses Konzept birgt unter anderem den Nachteil eines großen Verwaltungsoverheads: Für eine einzelne Karte im Wenker-For­mat müssen mehrere Tausend Bildsegmente er­zeugt und datenbankge­stützt in einer Dateistruktur verwaltet werden, jeder Client­zugriff auf eine Kartenansicht bedeutet eine Vielzahl von Dateioperatio­nen auf dem Server.

Für das DiWA-Projekt wurde indessen mit dem Image Web Server des australischen Herstellers ER Mapper eine erheblich leistungsfähigere und für den Anwender elegantere Alternative gewählt. Der Client kom­muniziert hierbei unter Verwendung eines Browser-Plugins oder Java-Applets mit dem Server über ein spezielles Protokoll.[1] Die zu publizie­renden Bilder liegen als einzelne Dateien auf dem Server im ECW-For­mat[2] vor. Manipuliert der Anwender den Bildausschnitt durch Vergrö­ßern oder Verschieben, extrahiert der Server die angeforderten Bildteile aus der Datei und übermittelt sie – aus Anwendersicht in Echtzeit – an den Client. Diese Lösung hat für den DiWA drei entscheidende Vorteile: Die zu publizierenden Bilder können von beliebiger (!) Größe sein, sie können georeferenziert werden und der Client kann mehrere Bilder in Layern mit frei definierbarer Transparenz übereinander darstellen. Der Sprachatlas des Deutschen Reichs konnte damit also nicht nur in der ange­strebten Qualität im Internet publiziert, sondern als Digitaler Wen­ker-Atlas sogar zu einem geographischen Informationssystem ausgebaut werden.

Auch für die Aufbereitung des Bildmaterials ergaben sich nun neue Möglichkeiten. Die erforderliche Software ER Mapper stammt vom glei­chen Hersteller wie die oben erwähnte Serverkomponente. Sie wird übli­cherweise in der Fernerkundung zur Verarbeitung und Analyse von Sa­telliten- und Luftbildern eingesetzt und erlaubt nicht nur die Bearbei­tung beliebig großer Bilddateien, sondern auch deren Georeferenzierung und das Zusammenfügen mehrerer Bilder zu einer Gesamtdatei.

Zur Georeferenzierung der Bilddateien wurden zunächst Passpunkte (GCPs: Ground Control Points) definiert, indem ausgewählten Bild­punkten deren geographische Sollkoordinaten zugeordnet wurden. Als hierfür gut geeignet erwiesen sich die Schnittpunkte der Gitternetzlinien, die sich exakter lokalisieren ließen als topographische Kartenelemente wie beispielsweise markante Küstenverläufe oder Flussmündungen. Al­tersbedingte Deformationen des Papiers und die daraus resultierenden Verzerrungen im Digitalisat machten dabei eine relativ große Anzahl von Passpunkten erforderlich. Anschließend wurden die Bilder in einem für jedes Kartenblatt mehrere Stunden dauernden Rechenprozess rektifi­ziert, also so entzerrt, dass alle Bildpunkte an ihrer kartographisch »rich­tigen« Position dargestellt wurden. Da hierzu die Angabe der Karten­projektion erforderlich war, musste diese zunächst in einem aufwändigen Prozess ermittelt werden.[3] Es wurde gezeigt, dass die von Wenker verwen­dete Grundkarte des Deutschen Reichs auf einer Lambert-1-Pro­jektion basiert; einer konformen konischen Abbildung, die besonders gut für Gebiete mittlerer Breite mit größerer West-Ost-Ausdehnung geeignet ist und bei der eine angenommene kegelförmige Projektionsfläche die Erdfigur in einem Breitenkreis berührt. Dieser Parallelkreis wurde vom Kartographen mit 51°00'00" N so gewählt, dass er in Nord-Süd-Rich­tung etwa in der Mitte des abzubildenden Gebiets lag, der Zentralmeri­dian teilte die Fläche in West-Ost-Richtung in 31°30'00".[4] Dieser Wert bezog sich allerdings auf den zum Zeitpunkt der Kartengestaltung ge­bräuchlichen Nullmeridian durch Ferro; im heutigen auf Greenwich bezogenen System liegt der Zentralmeridian in 13°50'14".

Nach der Rektifizierung wurden jeweils drei aneinander angrenzende Kartenblätter nahtlos zu einer Gesamtkarte zusammengefügt (Karten­konduktion), wobei störende Bild­elemente, wie etwa der jede Einzelkarte umgebende Rahmen mit Län­gen- und Breitengradangaben, an den Stoß­kanten ent­fernt wurden. Die Abmessungen einer solchen Karte betrugen 24.000 x 23.300 Pixel bei einer räumlichen Auflösung von 50 m, was sich in einer Dateigröße von etwa 1,6 GB niederschlug. Die resultierenden 576 Da­teien wurden schließlich im ECW-Format auf dem DiWA-Server gespei­chert und die dazugehörenden Metadaten in einer auf dem glei­chen Ser­ver betriebenen Datenbank gesammelt.

Image: abb01.jpg

Abb. 1: Rektifizierte und konduzierte Wenker-Karte Kleider

Benutzer des DiWA können diese Datenbank nach unterschiedlichen Kriterien und Systematiken durchsuchen, eine Karte auswählen und diese einzeln verwenden oder mit einer zweiten Karte kombinieren, wo­bei diese neben der ersten oder in einem zweiten, die erste Karte mit einstellbarer Transparenz überlagernden Layer dargestellt wird. Diese gleichzeitige Darstellung zweier Wenker-Karten erlaubt den direkten Vergleich der räumlichen Verbreitung sprachlicher Phänomene.

Zur Manipulation der Kartenansicht stehen intuitiv erfassbare Funk­tionen zum Vergrößern, Verkleinern und Verschieben des Kartenaus­schnitts zur Verfügung; in einer kombinierten Ansicht folgen alle Karten synchron einer solchen Aktion. Für jeden Kartenlayer können Helligkeit und Kontrast stufenlos eingestellt werden, was die alters- und nutzungs­bedingt beeinträchtigte Lesbarkeit mancher Karten erheblich verbessert. Zur Erleichterung der Auswertung einer Karte kann die Legende jedes Kartenblatts in einem separaten Fenster angezeigt werden. Außerdem ist das lokale Speichern und Drucken von Kartenansichten möglich.

In dieser ersten Ausbaustufe wurden im Oktober 2003 mit der erst­maligen vollständigen Veröffentlichung und Sicherung des Wenker-At­lasses die ursprünglichen Hauptziele des Projekts erreicht. Erst das In­ternet als Medium ermöglichte mehr als hundert Jahre nach dessen Ent­stehung die originalgetreue Publikation des Materials. Bisherige Publika­tionsversuche scheiterten, weil drucktechnische Reproduktionsverfahren dem Farb- und Detailreichtum der Vorlagen nicht gewachsen waren, oder gingen wie im Fall des Deutschen Sprachatlasses[5] oder des Kleinen Deutschen Sprachatlasses[6] mit starken Reduktionen des Umfangs der kartier­ten Phänomene, des Belegortsnetzes oder der Farbpalette einher.

Betrachtung der Karten

Aufgrund ihrer hohen Informationsdichte sind die Sprachkarten Wen­kers für Rezipienten ohne sprachwissenschaftliche Vorbildung nicht selbsterklärend. Neben farbigen Linien finden sich zahlreiche geometri­sche Symbole und lateinische Beschriftungen. Die Lesart ist dennoch einfach: Jede Karte ist einem bestimmten Erhebungswort zugehörig. Thema sind die Realisierungen dieses Wortes, mitunter auch spezifischer Einzelaspekte des Wortes, im geographischen Raum. Ein Erhebungs­wort nicht ist also mit all seinen Realisierungsformen im gesamten Erhe­bungsraum des Deutschen Reichs in der zweiten Hälfte des 19. Jahrhun­derts für circa 45.000 Erhebungsorte ausgewiesen. Die farbigen Linien, so genannte Isoglossen, stehen für Gebiete mit relativ konsistenter dia­lek­taler Ausprägung. Das von ihnen umschlossene Gebiet lässt sich typi­scherweise einer bestimmten Dialektform zuordnen, zum Beispiel einer Realisierung nischt oder nit. Dieser Realisierungstyp ist in lateinischer Schrift mittig eingezeichnet. Die innerhalb des Isoglossengebietes ver­merkten Symbole bezeichnen Abweichungen von dieser Leitform. Es kann sich dabei sowohl um alternative lautliche Realisierungen handeln (zum Beispiel nischt innerhalb des nit-Gebietes) als auch um Schreibva­rianten des Informanten (zum Beispiel nit versus nitt).

Das Ansetzen von Isoglossen ist ein subjektives Verfahren, das auf der wissenschaftlichen Analyse des Kartenzeichners basiert und seinem linguistischen Urteilsvermögen unterliegt. Daher ist für linguistisch unge­schulte Rezipienten bei der Arbeit mit den im DiWA publizierten Wen­ker-Karten grund­sätzlich mit Bedacht vorzugehen. Die kombinierte Flächen- und Punkt­symbolkartierung evoziert durch die mit markanten Farben dargestellten Leitformen oft einen ersten plakativen Eindruck der Kartensituation, der aber gewissenhaft hinterfragt und erst durch klein­räumige Betrachtung des Analysegebiets belegt werden muss. Es ist wichtig, die impliziten Interpretationsleistungen der Kartenzeichner nachzuvollziehen, die durch die Georeferenzierung des historischen Kartenmaterials offen gelegt werden können, wie hier wiederum am Erhebungswort nicht gezeigt werden soll.

Image: abb02a.jpg Image: abb02b.jpg

Abb. 2: Vergleich zweier Wenker-Karten zum Lemma nicht

So zeigt Abbildung 2 den Vergleich zweier Sprachkarten[7] mit dem Thema nicht im rheinfränkischen Dialektgebiet (links orange dominie­rend, rechts magenta). Der gesamte Sprachraum ist in nahezu identischer Weise dokumentiert, die vorherrschende Form ist das Wort nit. In der Mitte des Areals sowie im Nordwesten teilt ein Streifen die Karte, der eine Form net ausweist. Im Vergleich der beiden Karten ist südöstlich des Kartenmittelpunktes ein erheblicher Unterschied deutlich. Hier scheint es so zu sein, dass das südliche nit-Gebiet der rechten Karte, nach Nor­den hin deutlich verkürzt ist. In Wirklichkeit sind aber oberhalb der nördlichen Grenze auf dieser Abbildung rote Symbole zu erkennen, die auf Verwendung der Form nit hindeuten, es wurden lediglich die Sprach­raumgrenzen in unterschiedlicher Weise angesetzt. Was hier also begeg­net ist eine unterschiedliche Verfahrensweise der Kartenzeichner – im vorliegenden Fall die Zeichner Emil Maurmann (links) und Ferdinand Wrede (rechts) – und nicht etwa ein Phänomen sprachlicher Variabilität.

Für den Rezipienten stellt sich die Frage, bis zu welcher Grenze ein bestimmtes Dialektareal anzusetzen ist. Durch den direkten Vergleich werden die interpretativen Momente der Karten offen gelegt und dem heutigen Sprachwissenschaftler alternative Möglichkeiten der Sprach­raumbe­trachtung an die Hand gegeben. Während die linke Karte einen Raumeindruck vermittelt, der auf die sprachhistorischen Verdrängungs­prozesse abhebt (sprachhistorisch wurde hier nit durch net ersetzt), sug­geriert die rechte Karte eine weit reichende Konsistenz des sprachhisto­risch in dieser Ausdehnung jüngeren net-Gebietes. Es ist eine der Lei­stungen des DiWA, einen solch subjektiven Raumeindruck aufdecken zu können.

Erweiterungen des DiWA-Systems – technische Umsetzung

Die sich aus der Georeferenzierung der Rasterkarten ergebenden und über eine bloße Publikation weit hinausgehenden Möglichkeiten machen den DiWA zu einem mächtigen und effizienten Analyseinstrument.

Zur Erschließung solcher erweiterten Funktionen wurde zunächst eine Ortspunktreferenz benötigt. In Wenkers Grundkarte wurde jeder der circa 45.000 Erhebungsorte durch ein Kreissymbol dargestellt, auf­grund der hohen Ortsdichte verzichtete man allerdings auf Symbolbe­schriftungen für alle Orte, die in der administrativen Hierarchie unter der Kreisstadtebene lagen. Beim Anklicken eines Ortspunkts in der DiWA-Karte waren daher zwar die exakten geographischen Koordinaten der Mausposition be­kannt, nicht aber der Name des entsprechenden Orts. In dieser Situation erhielt das Projekt großzügige Unterstützung durch die Firma NAVTEQ, dem führenden Lieferanten von digitalen Landkarten für Fahrzeugnavigationssysteme, die den das Wenkergebiet repräsentie­ren­den Ausschnitt aus ihrer Geodatenbank für DiWA zur Verfügung stellte. Aus dieser Datenbank wurde die Punktdatenklasse Named Places extra­hiert und in Form einer Tabelle mit geographischen Koordinaten­paaren und Ortsnamen in die DiWA-Datenbank importiert. Diese Refe­renzta­belle ermöglichte es, auf einen Mausklick des Anwenders in der Karte mit einer Datenanforderung zu reagieren: Die der Mausposition entspre­chenden geographischen Koordinaten werden an eine Daten­bankabfrage übergeben, die alle innerhalb eines Kreises mit einem Ra­dius von 2,5 km liegenden Orte aus der Tabelle ermittelt. Liefert die Abfrage keine Da­tensätze, wird der Radius schrittweise verdoppelt, bis ein Ort gefunden wird oder der aufgrund der mittleren Ortsdichte in der Karte maximal erforderliche Wert von 40 km erreicht ist.[8] Die ermittel­ten Ortsnamen werden nach Entfernung von der Mausposition aufstei­gend sortiert, als html-Seite aufbereitet an den Client übergeben und in der DiWA-Oberfläche in einem dafür reservierten Fensterbereich ange­zeigt.

Der DiWA-Server verfügt neben einem Webserver und dem Image Web Server auch über ein relationales Datenbanksystem. In diesem wurde die Ortsreferenztabelle abgelegt, was die Herstellung von Bezie­hungen zwischen Ortsdatensätzen und beliebigen weiteren sinnvoll auf Ortspunkte beziehbaren Datenklassen ermöglichte.

In der zweiten Phase des DiWA-Projekts wurde die Datenbank um folgende Datenklassen erweitert:

Beim Anklicken eines Ortspunkts in der Karte werden nun nicht nur die nahegelegenen Orte ermittelt, sondern auch die damit verknüpften Zu­satzdaten: Ist eine Sprachprobe für diese Orte verfügbar, können die Dateien wiedergegeben werden; beschäftigen sich wissenschaftliche Pu­blikationen mit Sprachvariation in diesem Gebiet, kann die Bibliographie in einem externen Fenster abgerufen werden. Ebenso ist die Anzeige der Wenkerbögen für diese Orte möglich. Für die Fragebögen stehen über­dies die gleichen Werkzeuge wie für Karten zur Verfügung, es ist also möglich, einen beliebigen Ausschnitt zu vergrößern oder den Bogen lokal auszudrucken. Alle Zusatzdaten können selbstverständlich nicht nur über die Kartenansicht, sondern auch über entsprechende Kataloge durchsucht werden.

Zur Erleichterung der Arbeit mit einer Rasterkarte wurde der DiWA-Server um einen Webservice erweitert. Dieser ermittelt nach Übergabe der Eckkoordinaten eines Kartenausschnitts über eine Datenbankabfrage alle im Zielgebiet liegenden Ortspunkte sowie sämtliche damit ver­knüpften Daten in anderen Tabellen und liefert ein transparentes Over­lay mit farbigen Symbolen, die für die im gewählten Ausschnitt liegenden Orte verfügbare Zusatzdaten repräsentieren. Die Anzeige erfolgt maß­stabsab­hängig; so werden in einer Gesamtansicht einer Wenker-Karte nur Sym­bole für Sprachproben dargestellt, bei stufenweiser Ausschnitts­vergröße­rung folgen auf »00« endende Nummern von Wenkerbögen, Symbole für Monographien und schließlich für sämtliche ortsbezogenen Daten.

Image: abb03.jpg

Abb. 3: Grundkarte mit Datenbankanbindung

Abbildung 3 zeigt ein datenbankgestützt generiertes Overlay auf der Grundkarte des Wenker-Atlasses. Für Laubach wurde ein Eintrag in der Literaturdatenbank gefunden, für Klosterkumbd und Michelbach werden Sprachproben angeboten und für diese und die übrigen Wenker-Belegor­te können die Erhebungsbögen eingesehen werden. Hollnich, Gammels­hausen, Spesenroth und Bergenhausen sind offensichtlich keine Belegor­te, für sie werden nur die heutigen Ortsnamen angezeigt. Die in dieser Ansicht deutlich sichtbaren Abweichungen der Ortspunkte im Overlay von ihren historischen Pendants in der Rasterkarte erklären sich durch unterschiedliche Kartierungsverfahren. Während die Positionen der Ortspunkte für die von Wenker verwendete Grundkarte vom Karten­zeichner offenbar so optimiert wurden, dass sie im Hinblick auf die an­schließende handschriftliche Eintragung von Symbolen von möglichst großen Freiräumen umgeben waren, repräsentieren die NAVTEQ-Punkte die mit GPS-Unterstützung erfassten tatsächlichen Positionen der Ortszentren.

Eine zusätzliche Erweiterung verbessert die sprachwissenschaftliche Recherchierbarkeit des Kartenmaterials. Die Datenbank wurde um ein morphologisches und ein phonetisch-phonologisches Register sowie um Verknüpfungen zwischen den Karten-Metadaten und den Registerklas­sen ergänzt. So können nun beispielsweise im morphologischen Register morphologische Kategorien oder Wortbildungstypen als Suchkriterien ausgewählt und der Kartenbe­stand nach diesen Kriterien entsprechenden kartierten Phänomenen gefiltert werden.

Die Funktionen des DiWA

Im Folgenden werden an einem exemplarischen Fall grundlegende Funktionsweisen von DiWA erläutert. Die linguistische Fragestellung, von der wir ausgehen möchten, ist Folgende: Es liegt eine Dialektauf­nahme unbekannter Herkunft vor, in der hochsprachliche Wörter mit initialem h (zum Beispiel Hund) als Dialektvarianten ohne h (zum Bei­spiel _und) realisiert werden. Was hat es mit diesem Phänomen des h-Ausfalls auf sich? Die Forschungslage ist diesbezüglich nicht sehr güns­tig, es liegen keine ausführlichen Studien vor.[9]

Der DiWA führt insgesamt 27 Sprachkarten mit wortinitialem h, die für eine Untersuchung in Frage kommen.[10] Zur ersten Orientierung öff­nen wir die Karte Hund. Dort fallen lediglich zwei Regionen auf, in de­nen sich der h-Ausfall findet. Es handelt sich einerseits um ein größe­res Gebiet in der Lausitz (östliches Sachsen) und andererseits um ein kleine­res Gebiet um die Orte Wustrow und Lüchow (Teil des Lünebur­ger Wendlands). In den Abbildungen 4, 5 und 6 sind beide Gebiete am Bei­spiel der Karte Hund im Überblick und als Ausschnitte zu erkennen – dabei stehen für das genannte Phänomen blaue Kreissymbole am Ort.

Image: abb04.jpg

Abb. 4: Ausschnitt aus der Wenker-Karte für das Lemma Hund

Image: abb05.jpg Image: abb06.jpg

Abb. 5 und 6: Vergrößerungen der in Abb. 4 rot umrandeten Gebiete

Ein Blick auf die übrigen Dialektkarten (zum Beispiel die Lemmata ha­ben, hoch, hier), die als georeferenzierte Daten neben oder über die Aus­gangsgrafik gelegt werden können, führt zu den folgenden Beobach­tungen:

Die letztere Beobachtung lässt vermuten, dass sich Erklärungsansätze für diese sprachlichen Erscheinungen aus außersprachlichen Faktoren erge­ben, in diesem Fall dem Siedlungsgebiet der Volksgruppe der Sorben. Um eine solche Hypothese zu überprüfen, bietet das DiWA-System Karten mit soziodemographischen, kulturspezifischen oder politischen Interpretamenten an. Diese finden sich im Kartenverzeichnis als »histori­sche Interpretamente«. Abbildungen 7 und 8 zeigen die Ausschnitte aus der Wen­ker-Karte Hund (Lausitz) und einer Karte, in der die ethnogra­phischen Verhältnisse in Europa Mitte des 19. Jahrhunderts dargestellt sind.[13] Die historische Karte weist das betreffende Gebiet zur Erhebungs­zeit Wenkers als slawisches Siedelge­biet aus (blau umrandetes Gebiet im Osten von Leipzig). Für das Lüne­burger Wendland ist in der Karte für jene Zeit allerdings keine Besied­lung durch Slawen einge­tragen.

Image: abb07.jpg Image: abb08.jpg

Abb. 7 und 8: Ausschnitt aus der Wenker-Karte für das Lemma Hund und das gleiche Gebiet in der Karte Ethnographische Verhältnisse in Europa Mitte des 19. Jahrhunderts

Um nun den linguistischen Forschungsstand zu diesem Gebiet zu prü­fen, kann die in DiWA integrierte Georeferenzierte Online-Bibliographie Areallinguistik genutzt werden. Die Recherche führt uns unter anderem zu folgenden Titeln:

Diels, Paul

1914 Das Deutsche im Munde der hannoverschen Wen­den. – In: Jahresbericht der Schlesischen Gesellschaft für vaterländi­sche Cultur 92/1/IV/c, S. 27–36.

Goessgen, Waldemar

1902 Die Mundart von Dubraucke. Ein Beitrag zur Volkskunde der Lausitz. A. Grammatischer Teil. – Breslau (= MSV Beih. 2).

Selmer, Ernst Westerlund

1918 Sprachstudien im Lüneburger Wend­land. – Kristiania.

In den drei Beiträgen ist auch die sozio-kulturelle Entwicklung der Ge­biete aufgearbeitet. Folgende Angaben zur historischen Migration lassen sich extrahieren. Ab dem späten 6. und dem 7. Jahrhundert ist die Be­siedlung großer Teile Nord- und Ostdeutschlands (vor allem entlang der Elbe und der unteren Saale) durch Slawen (Wenden) zu beobachten.[14] Ab dem 11. Jahrhundert und vor allem in den beiden darauf folgenden Jahrhun­derten, in denen sich zunehmend auch deutsche Siedler in diesen Ge­bieten niederließen, kam es nicht nur zu einer Vermischung der Be­völke­rungsgruppen, sondern auch zu einem direkten Sprachkontakt, das heißt zunächst einem Nebeneinander deutscher und slawischer Dialekte. Nach und nach wurden in fast allen betreffenden Gebieten die slawi­schen Dialekte »verdrängt« (teilweise durch regelrechte »Gebrauchs­verbote«[15]). Diese Verdrängung erfolgte im Lüneburger Wendland erst relativ spät (18. Jahrhundert), ist aber zur Zeit von Wenkers Erhebung abgeschlos­sen.[16] Dies ist die Erklärung dafür, weshalb einerseits auf der Wenker-Karte dort keine drävano-polabischen Sonderformen verzeich­net sind und andererseits auf der historischen Karte kein Besiedlungs­vermerk zu finden ist.

Was ist in linguistischer Hinsicht erfahrbar? Die h-Prothese ist im Ge­biet der Lausitz nahezu identisch mit dem h-Ausfall distribuiert. Augen­fällig wird dies zum Beispiel, wenn die Kartenausschnitte für den Wort­stamm der Lemmata hinter und Affe nebeneinander gelegt werden (vgl. die Abbildungen 9 und 10). In der Forschungsliteratur zu den Mundar­ten der hier behandelten Gebiete werden h-Ausfall und h-Prothese als »Unsi­cherheit im Gebrauche des anlautenden h«[17] beziehungsweise als »Anlautsver­wechs­lungen«[18] zusammengefasst und auf den Sprachkontakt zurück­geführt:

Diese Verwirrung ist durch die Wenden veranlasst. ›Vokalischen Anlaut vermei­det das Wendische, indem es den einfachen Hauchlaut h vor die Vokale setzt‹ [...]. Demzufolge werden die Wenden das Bestreben haben, auch im Deutschen den vokali­schen Anlaut durch Vorsetzung von h zu vermeiden. Allmählich wird man sich an den deutschen vokalischen Anlaut gewöhnt, ihn aber dann, bestrebt es richtig zu machen, auch angewendet haben, wo ein h hingehört.[19]

Die h-Prothese ist also gegenüber dem h-Ausfall in den deutschen Dia­lekten älter. Sie hat ihren Ursprung im Sorbischen beziehungsweise – im Lüneburger Wendland – in den drävano-polabischen Dialekten. Bei der Bewertung des Phänomens muss nun die konkrete Kommunikationssi­tuation be­dacht werden. Ein Wort Haffe statt Affe wird im Gespräch sehr auffällig sein, ein Wort _und dagegen statt Hund eher nicht, wenn man bedenkt, dass gesprochene Sprache einer bestimmten Sprechge­schwindigkeit un­terliegt, die in der Artikulation von Wörtern und Sätzen stets zum Ver­lust von Einzelsegmenten oder gar Silben führt. Der Aus­fall einzelner Laute ist folglich häufig weniger auffällig als der Zusatz eines Segmentes. Der zusätzliche Laut weist seinen Sprecher als Nicht-Einheimischen aus. Unter Umständen kann dies in bestimmten Kom­munikationssituationen zu Sanktionen führen. Die bewusste oder unbe­wusste Reaktion der Sprecher dürfte die gewesen sein, etwa in der Un­terhaltung mit Spre­chern deutscher Dialekte, das unterhalb ihrer Auf­merksamkeitsschwelle liegende initiale h vor Vokalen generell wegzulas­sen. Ein Problem ergab sich für die Sprecher allerdings in dem Moment, in dem sie – vermutlich zu einem späteren Zeitpunkt – versuchten, die richtige Verteilung von h-losen und h-haltigen Formen des Deutschen umzusetzen. Da ihnen nicht bewusst war, in welchen Wörtern anlauten­des h der Norm entspricht, wurden die hochsprachlichen Formen mit anlautendem h teilweise eben­falls zu h-losen Formen generalisiert. Re­sultat sind genau die oben ge­nannten »Anlautsverwechslungen« – es sind also h-Ausfall und h-Pro­these zu einem bestimmten Stadium gleichzeitig zu beobachten. In mo­derner variationslinguistischer Terminologie spricht man in solchen Fäl­len von der hyperkorrekten Anwendung sprachlicher Formen.

Image: abb09.jpg Image: abb10.jpg

Abb. 9 und 10: Das gleiche Gebiet abbildende Ausschnitte aus den
Wenker-Karten für die Lemmata hinter und Affe

Welche sprachgeschichtlichen Veränderungen sind aus den Beobachtun­gen ableitbar? Es wurde bereits darauf hingewiesen, dass im Lüneburger Wendland zwar der h-Ausfall beobachtet werden kann, die h-Prothese aber weitgehend fehlt (vgl. die Abbildungen 9 und 10). Da wir wissen, dass die slawischen Dialekte dort bereits im 18. Jahrhundert zugunsten der deutschen Dialekte verdrängt worden sind, können wir die fehlende (sprachgeschichtlich ältere) h-Prothese auf einen fortgeschrittenen Sprachwandel zurückführen. Weitere Erkenntnisse können diesbezüglich aus dem DiWA – für das Gebiet der Lausitz – gewonnen werden, indem auf das komplementäre Phänomen des h-Ausfalls zurückgegriffen wird. Aus einer Überblendung der Karte Hause mit einer weiteren zeitgenössi­schen Karte des sorbischen Siedelgebietes um 1870, diesmal aus Andrees Hand­atlas von 1881, (Abbildung 11) ergibt sich, dass vor allem im Os­ten der sorbischen Sprachinsel die jeweils gängige Form der umgebenden deut­schen Dialekte verzeichnet ist. Dies sind Dialektformen mit initia­lem h. Die Sprecher an den Randzonen sind es also, die benachbarte Formen in ihr Sprachformenrepertoire aufnehmen und damit einen langwierigen Verdrängungsprozess fortführen. Dieser Umstand ist im Hinblick auf die Interpretation der Sprachdaten weiterhin nutzbar. Es wird erkennbar, auf welche Weise sich die Verdrängung vollzieht. Sie führt vom Inselrand in Richtung Zentrum.

Auffällig ist weiterhin, dass auf sämtlichen Karten für Lemmata mit initialem h der h-Ausfall wiederum an den Rändern und im benachbarten Raum außerhalb des sorbischen Areals, und zwar immer in (nord-) west­licher Richtung belegt ist. Genau in diesem Grenzbereich ist die Sprach­insel stark zerklüftet, was auf eine historische Gebietsverkleinerung, das heißt auf eine ehemals größere Ausdehnung an dieser Stelle hinweist. Folglich ist davon auszugehen, dass diese außerhalb der Sprachinsel vor­gefunden h-losen Formen Relikte des ehemaligen sorbischen Siedelge­bietes sind, über das wir aus der Literatur informiert sind. Selbstredend ist über die Analyse der Verbreitung des h-Ausfalls die frühere Ausdeh­nung des sorbischen Areals keineswegs rekonstruiert. Jedoch ist der Be­fund ein Indiz für einige jüngere Sprachwandelprozesse der Region, bei dem zunächst die älteren Formen der h-Prothese und zeitlich verzögert die jüngeren Formen des h-Ausfalls erfasst wurden.

Image: abb11.jpg

Abb. 11: Ausschnitt aus der Wenker-Karte für das Lemma Hause, kontrastiert
mit einer historischen Karte zum Siedelgebiet der Sorben

Es kann resümiert werden: Unsere Fragestellung ging von einer vorlie­genden Sprachprobe unbekannter Herkunft aus. Auffälliges regional­sprachli­ches Merkmal war der h-Ausfall. Nach Sichtung der über den DiWA zugänglichen Forschungsmaterialien können wir nunmehr eine Zuord­nung in das Gebiet vornehmen. Die Sprachprobe stammt mit größter Wahrscheinlichkeit aus dem ehemaligen beziehungsweise aktu­ellen Siedelgebiet der Sorben. Das Sorbische in der Lausitz bildet in der deutschen Dialekt­landschaft eine slawische Sprachinsel, deren Kernge­biet und Sprecher­zahl sich verkleinern. Dennoch hat sich hier das Sorbi­sche als slawischer Dialekt am längsten neben den deutschen Dialekten und der deutschen Hochsprache halten können. Die h-Ergänzungen sind Relikte des ehe­maligen Siedelgebiets, die h-losen Wortformen Symptome einer Überge­neralisierung, die aus dem Bestreben zur Übernahme der deutschen Dialekte resultiert. Das gesamte Phänomen ist Zeugnis der Auflösung einer fremdsprachlichen Enklave im Sprachraum des Deut­schen. Die Etappen der Verdrängung sind phänomenspezifisch und unterliegen einer unterschiedlichen Geschwindigkeit. Zunächst scheint die sprach­historisch ältere Erscheinung der h-Prothese zu schwinden, was im Lü­neburger Wendland praktisch abgeschlossen ist, bevor auch der histo­risch jüngere h-Ausfall vom Sprachwandel ergriffen wird.[20]

Um nun nachvollziehen zu können, ob und wie der Sprachwandel seit den Zeiten Wenkers vorangeschritten ist, bietet das DiWA-System schließlich Tonaufnahmen der Wenkersätze an, die überwiegend seit der Mitte des 20. Jahrhunderts erhoben wurden. Aus diesem, jüngeres Origi­nalmaterial repräsentierenden Zeitschnitt eröffnen sich Perspektiven für weitergehende Interpretationen. Für die hier besprochenen Gebiete lie­gen bisher wenige Aufnahmen vor. In keiner dieser Aufnahmen finden sich jedoch die Phänomene h-Ausfall beziehungsweise h-Prothese. Dies deutet dar­auf hin, dass die Sprachteilhaber inzwischen vermutlich über eine umfas­sende hochsprachliche Kompetenz verfügen und die korrekte Verteilung von anlautendem hochsprachlichem h sicher beherrschen. Eine endgül­tige Aussage darüber kann jedoch nur auf dem Weg einer ausführlichen Neuerhebung von Sprachdaten vor Ort erbracht werden. Die in der voran stehenden Analyse erzielten Ergebnisse sind für die Vorbereitung einer solchen Erhebung von höchstem Wert. Somit erweist sich die the­matisch umfassende Datenbasis des DiWA im Zusammen­hang mit den technischen Eigenschaften und Bedienfunktionen des Systems als lei­stungsfähiges Instrument der Regionalsprachenforschung, und zwar ausgehend von der bloßen Dokumentation sprachlicher Ver­hältnisse über die Interpretation dieser Daten bis hin zum Auffinden neuer For­schungsperspektiven.

Ausblick

Die problemlos skalierbare Architektur des DiWA eröffnet viele Per­spektiven für zukünftige Erweiterungen. Einerseits kann der Datenbe­stand um zusätzliche Vergleichskarten und orts- oder raumbezogene Materialien anderer Typen ergänzt werden, andererseits drängt sich die Weiterentwicklung der DiWA-Funktionen zu neuen, noch effektiveren Forschungsinstrumenten geradezu auf.

So erleichtert der DiWA zwar durch die Overlayfunktionen den Ver­gleich zweier Sprachkarten, die Analyse muss aber nach wie vor mit ho­hem Zeitaufwand Ort für Ort und unter manueller Protokollierung der Ergebnisse erfolgen. Im Rahmen eines angegliederten Projekts entsteht derzeit ein Informationssystem, das diese Arbeit erheblich erleichtern wird. Es ermöglicht Anwendern ohne jegliche GIS-Erfahrungen in einer personalisierbaren Webanwendung, Informationen aus existierenden Rasterkarten komfortabel in ein Data Warehouse zu übertragen oder neue Karten durch Erfassung oder Import eigener Erhebungsdaten zu erstel­len. Der Vergleich von zwei oder auch mehr Karten kann anschlie­ßend auf Basis der Daten automatisch erfolgen und das Ergebnis als Differenz­karte angezeigt werden, wobei der möglichen methodischen Heteroge­nität der verwendeten Quellen Rechnung getragen wird. So kann der Anwender uneinheitliche Datenklassendefinitionen oder nicht kongru­ente Ortsnetzdichten von Karten unterschiedlicher Herkunft durch wählbare Ausgleichsverfahren und -parameter aufeinander ab­stimmen. Auch die Form der Ergebnispräsentation kann bedarfsspezi­fisch ange­passt werden.

Image: abb12.jpg Image: abb13.jpg

Abb. 12 und 13: Unterschiedliche Darstellungsmöglichkeiten für die
Sonderkarte 545 werden – Infinitiv des MRhSA

Ein Beispiel für die Einsatzmöglichkeiten eines solchen sprachgeogra­phischen Informationssystems zeigt Abbildung 12. Nach Import der entsprechenden Quelldaten des Mittelrheinischen Sprachatlasses[21] zeigt ein Overlay über der digitalisierten Grundkarte an den Erhebungsorten die auch im Druckwerk verwendeten Symbole für die jeweiligen Varian­ten an. Im dargestellten Fall ist aber eine alternative Darstellung wie in Abbildung 13 überzeugender; sie kann mit wenigen Handgriffen durch Änderung der Kartierungsmethode erzeugt werden.

Nach dem Projektende ist an einen weiteren Ausbau des Systems ge­dacht. Während sich der DiWA auf die Ebene der Dialekte mit den Sy­stemebenen der Laut- und Formenlehre beschränkt, soll in einem Folge­projekt der gesamte regionalsprachliche Bereich unterhalb der deutschen Hochsprache auf allen Systemebenen (Syntax, Morphologie usw.) the­matisiert werden. Gerade der Bereich zwischen den Dialekten und der Standardsprache mit seinen sprachlichen Strukturen und Systemeigen­schaften, ist der Forschung nahezu unbekannt, obgleich gerade in diesem Bereich inzwischen die Mehrzahl der kommunikativen Handlungen der meisten Sprachteilhaber des Deutschen angesiedelt ist. Vor diesem Hin­tergrund soll die Arbeit, die Georg Wenker vor circa 130 Jahren begann, fortgeführt und nach den technischen Möglichkeiten unserer Zeit zu einem validen Gesamtbild der Sprache in ihren regionalen, systemischen und pragmatischen Bezügen umgesetzt werden.

Roland Kehrein, Alfred Lameli, Jost Nickel (Marburg)

Dr. Roland Kehrein, Dr. Alfred Lameli, Jost Nickel
Forschungsinstitut für deutsche Sprache
Deutscher Sprachatlas
35032 Marburg


(9. Januar 2006)

Bibliographie

Andree, Richard

1881 Richard Andree’s Allgemeiner Handatlas: in sechsundachtzig Karten mit erläuterndem Text. Bielefeld und Leipzig: Vellhagen & Klasing.

Bellmann, Günter u.a. (Hg.)

1994-2002 Mittelrheinischer Sprachatlas (MRhSA). 5 Bände. Tübingen: Niemeyer.

Deutscher Sprachatlas (DSA)

1927-1956 Auf Grund des Sprachatlas des deutschen Reichs von Georg Wenker, begon­nen v. Ferdinand Wrede, fortgesetzt v. Walther Mitzka u. Bernhard Martin. Marburg: Elwert.

Diels, Paul

1914 Das Deutsche im Munde der hannoverschen Wen­den. – In: Jahresbericht der Schlesischen Gesellschaft für vaterländi­sche Cultur 92/1/IV/c, S. 27–36.

Goessgen, Waldemar

1902 Die Mundart von Dubraucke. Ein Beitrag zur Volkskunde der Lausitz. A. Grammatischer Teil. – Breslau (= MSV Beih. 2).

Kleiner Deutscher Sprachatlas (KDSA)

1984-1999 Im Auftrag des Forschungsinstituts für deutsche Sprache – Deutscher Sprach­atlas – Marburg/Lahn. Dialektologisch bearb. von Werner H. Veith. Computativ bearb. von Wolfgang Putschke. Tübingen: Niemeyer.

Selmer, Ernst Westerlund

1918 Sprachstudien im Lüneburger Wend­land. – Kristiania.

Spruner, Karl von

1880 Hand-Atlas zur Geschichte des Mittelalters und der neueren Zeit. Gotha. Perthes.


[1]

ECWP: Enhanced Compressed Wavelet Protocol.

[2]

ECW: Enhanced Compressed Wavelet.

[3]

In diesem Arbeitsschritt wäre zwar die Transformation der Karten in eine beliebige Projektion möglich gewesen, die dazu nötigen Bildpunktinterpolationen hätten aber einen unnötigen Qualitätsverlust bewirkt.

[4]

Da in dieser Projektion der Zentralmeridian senkrecht und als einziger nicht gekrümmt dargestellt wird, wurde diese Linie auch als Schnittkante zwischen Nordwest- und Nordostblatt gewählt.

[5]

Deutscher Sprachatlas 1927-1956.

[6]

Kleiner Deutscher Sprachatlas 1984-1999.

[7]

Das Lemma nicht ist in den Wenkersätzen 16, 22 und 29 enthalten, die hier angespro­chenen Karten wurden zu den Varianten aus den Sätzen 16 und 22 gezeichnet.

[8]

In diesem Fall ist mit einiger Wahrscheinlichkeit anzunehmen, dass der Mausklick im Nord- oder Ostseegebiet erfolgte.

[9]

Zu Demonstrationszwecken sollen zur Beantwortung der Fragestellung nur solche Informationen verwertet werden, die aus DiWA gewonnen werden können. Selbstver­ständlich wären zur vollständigen wissenschaftlichen Aufarbeitung des Gegenstands weitere, vor allem historische Hilfsmittel miteinzubeziehen, worauf hier aber aus Gründen der Anschaulichkeit verzichtet werden kann.

[10]

Nicht in Frage kommen etwa Karten mit anlautendem h, die sich der Verteilung von Wortvarianten widmen.

[11]

Darüber hinaus ist eine so genannte »nordseegermanische h-Prothese« auf den Wen­ker-Karten für die friesischen Dialekte festzustellen (zum Beispiel hüm/hum für ihn, vgl. Englisch him). Mit dem Themenkomplex verwandt sind außerdem die h-Phäno­mene der romanischen Sprachen. Stellvertretend sei das so genannte »h aspiré« des Französischen genannt, das vor allem bei germanischen Lehnwörtern vorzufinden ist und unter Umständen bedeutungsunterscheidend wirkt (les héros vs. les zéros). Es dient außerdem der Segmentierung von Wortgrenzen, wenn zwei Vokale aufeinander treffen (Hiatus). Das h verhindert dann die Produktion eines vokalischen Übergangs (Diphthongbildung). Auf diese und ähnliche Phänomene wird nachfolgend aufgrund sprachtypologischer Unterschiede nicht weiter eingegangen.

[12]

In den Legenden der Wenker-Karten werden die Sonderformen in der Lausitz unter der Bezeichnung »Wendisch« aufgeführt. Im Folgenden wird der geläufigere Terminus »Sorbisch« beziehungsweise »Sorben« (als Bevölkerungsgruppe) verwendet.

[13]

Die Karte stammt aus dem Hand-Atlas zur Geschichte des Mittelalters und der neue­ren Zeit (hg. von Spruner/Menke 1880).

[14]

Diese Gebiete werden entsprechend auch als Germania Slavica bezeichnet.

[15]

Vgl. Selmer 1918: 21.

[16]

Selmer (1918: 19) beschreibt den sprachlichen Zustand in diesem Gebiet für 1918 folgendermaßen: »Die Sprache, die jetzt im Lb. Wdl. gesprochen wird, ist eine ziemlich reine niedersächsische Mundart, [...] aber mit eigentümlichen fremden Elementen durchsetzt, die auf eine alte polabische Sprache zurückweisen«, z.B. der h-Ausfall.

[17]

Goessgen (1902: 21).

[18]

Selmer (1918: 60).

[19]

Goessgen (1902: 21).

[20]

Der weitere Sprachwandel wäre dann eine h-Wiedereinführung, welche möglicherweise bereits in den Wenker-Karten enthalten, aber natürlich nicht auffällt, da diese Formen Normkonform sind (vgl. auch Selmer 1918: 64).

[21]

Bellmann (1994–2002).