Sprachforscher sagen unbekannte Wörter durch Sprachvergleich voraus

Ein neues linguistisches Experiment nutzt computergestützte Techniken für den historischen Sprachvergleich um zu zeigen, wie die Aussprache von nicht dokumentierten Wörtern vorhergesagt werden kann

28. April 2021

Forscher der Universität von London und des Max-Planck-Instituts für Menschheitsgeschichte haben in der renommierten Zeitschrift für historische Sprachforschung Diachronica einen Artikel veröffentlicht, in dem sie ein Experiment beschreiben, welches zeigt, wie die klassische Methode für die Rekonstruktion von nicht attestierten Sprachen dazu verwendet werden kann, um bisher nicht dokumentierte Wörter in unvollständig beschriebenen und gefährdeten Sprachen in Indien vorherzusagen.

Historische Linguistinnen und Linguisten haben die komparative Methode seit langer Zeit verwendet, um frühere Sprachstufen von Sprachen zu rekonstruieren, die nicht in geschriebener Form attestiert sind. Die Methode besteht im detaillierten Vergleichen von Wörtern in verwandten Sprachen und ermöglicht es, die ursprüngliche Aussprache von Wörtern, die in keiner Form dokumentiert wurden, in großer Detailtreue zu inferieren (erschließen). Dass die Methode auch verwendet werden kann, um zu inferieren, wie ein bisher undokumentiertes Wort in einer bestimmten Sprache klingen würde -- vorausgesetzt, dass zumindest ein wenig Information über die Sprache selbst und ihre verwandte Sprachen vorliegt -- war schon seit längerer Zeit bekannt, wurde bisher aber nicht experimentell getestet.

Zwei Forscher der SOAS University of London und des Max-Planck-Instituts für Menschheitsgeschichte haben vor kurzem einen Artikel in der renommierten internationalen Zeitschrift für historische Linguistik Diachronica veröffentlicht, in dem sie die Ergebnisse eines Experiments beschreiben, in dem sie die traditionelle komparative Methode verwendeten, um explizit die Aussprache von Wörtern in acht Varietäten der West-Kho-Bwa-Sprachgruppe in Indien vorauszusagen. Diese Sprachen, die zum sinotibetischen Sprachzweig gehören, wurden bisher nicht vollständig beschrieben und viele Wörter waren bisher nicht durch Feldforschung dokumentiert worden. Die Forscher nutzten für ihr Experiment einen bestehenden etymologischen Datensatz der Sprachvarietäten, der zuvor im Rahmen von Feldforschung im Bundesland Arunachal Pradesh von Indien zwischen 2012 und 2017 gesammelt worden war. Im Datensatz fanden die Autoren viele Lücken, die darauf hinwiesen, dass bestimmte Wörter, die bestimmte Konzepte ausdrücken, noch nicht abgefragt worden waren.

Orte, an denen West-Kho-Bwa Sprachen gesprochen werden.

© Johann-Mattis List

Orte, an denen West-Kho-Bwa Sprachen gesprochen werden.

© Johann-Mattis List

“Wenn man Feldforschung macht, ist es unvermeidbar, dass man einige Wörter vergisst zu dokumentieren. Das ist ärgerlich, wenn man es später bemerkt, aber in diesem Fall bemerkten wir, dass es eine perfekte Möglichkeit war, zu testen, wie gut die Methoden für die linguistische Rekonstruktion eigentlich funktionieren, sagt Timotheus A. Bodt, der erste der beiden Autoren der Studie.

Die Forscher erstellten daraufhin einen computergestützten Workflow, um fehlende Wortformen vorherzusagen. Die klassischen Methoden werden normalerweise manuell angewendet, aber neue Computertechniken erhöhen die Effizienz und Reliabilität des Prozesses. Alle Resultate wurden später noch einmal manuell überprüft und korrigiert. Um die Transparenz der Validierung zu erhöhen, registrierten die Forscher ihre Vorhersagen online.

“Die Registrierung ist inzwischen sehr wichtig in vielen Wissenschaftszweigen, da sie sicherstellt, dass Forscherinnen und Forscher sich an die korrekte wissenschaftliche Forschungspraxis halten. Soweit wir das jedoch wissen, wurde sie bisher nicht in der historischen Linguistik angewendet”, sagt Johann-Mattis List, der die Computeranalysen der Studie durchführte.

“Durch die Registrierung unserer Vorhersagen haben wir sichergestellt, dass wir unsere Vorhersagen nicht im Nachhinein noch ändern konnten”, fügt Bodt hinzu.

Um die vorhergesagten Wörter mit Hilfe von Muttersprachlern der West-Kho-Bwa-Sprachen zu vergleichen reiste Bodt nach Indien. Nachdem er die am Experiment teilnehmende Person gebeten hatte, die fehlenden Wörter zu nennen, verglichen die Forscher die attestierten Wörter mit ihren früheren Vorhersagen. Indem sie die Proportion von korrekt vorhergesagten Lauten zählten, konnten sie ermitteln, wie gut die Vorhersagen gewesen waren. Sie erreichten 76 Prozent, was ein sehr gutes Ergebnis ist, da ja nur limitierte Information über die Sprachen vorhanden gewesen war, mit der die Wortformen ursprünglich vorhergesagt worden waren. Darüber hinaus konnten die Forscher auch mehrere Gründe identifizieren, warum Vorhersagen falsch gewesen waren.

“Je mehr wir über eine Sprachfamilie wissen, desto besser können wir unbekannte Wörter voraussagen. Das ist deshalb möglich, weil Sprachen ihr Lautsystem auf überraschend regelmäßige Art und Weise ändern,” sagt List. “Obwohl so wenig über die West-Kho-Bwa-Sprachen und ihre Sprachgeschichte bekannt war, konnten wir durch unser Experiment zeigen, dass regelmäßiger Lautwandel zu vorhersagbaren Wortformen führt. Darüber hinaus hat das Experiment auch unser Wissen über die Sprachgeschichte der West-Kho-Bwa-Sprachen vertieft.”

Abgesehen davon, dass das Experiment als Beispiel für die Stärke der traditionellen Methodologie der historischen Linguistik dient, konnten die beiden Linguisten auch allgemeine Vorteile der Wörtervorhersage identifizieren.

“Wörter vorherzusagen erhöht die Transparenz und Effizienz unserer Forschung. Das ist sehr wichtig vor dem Hintergrund des raschen Verschwindens der Sprachen der Welt und der begrenzten Möglichkeiten, diese Forschung zu finanzieren. Darüber hinaus hat es auch einen didaktischen Effekt, da es Sprecherinnen und Sprecher von kleineren Sprachen dazu ermutigt, über ihr eigenes linguistisches Erbe nachzudenken” sagt Bodt.

Die Forscher hoffen, dass die Resultate ihres Experiments Kolleginnen und Kollegen, die linguistische Feldforschung oder linguistischen Sprachvergleich betreiben, dazu ermutigen, ebenfalls Wörter vorherzusagen, um expliziter und bewusster den Sprachwandel und die Regelmäßigkeit des Lautwandels zu erforschen.