In manchen Forschungsgebieten müssen regelmäßig große Mengen an Tonaufnahmen abgetippt werden. Etwa in der Soziologie, wenn Forschende Interviews mit Probanden machen, oder in der Linguistik, wenn Forschende den Gebrauch der Sprache untersuchen wollen.

Für viele Forschende ist dies eine lästige Vorarbeit, bevor die eigentliche Analyse des Gesprochenen beginnen kann. Kein Wunder also, dass viele Forschende diese Aufgabe an einen Computer abgeben. Ein Programm hört sich die Aufnahme an und produziert dann einen Text. Die Forschenden müssen diesen Text, dann nur noch einmal überlesen und nacharbeiten, bevor sie sich an ihre eigentliche Forschungsarbeit machen können.

Solche Programme gibt es bereits seit einiger Zeit für vielgesprochene Sprachen, wie Englisch, Französisch und Deutsch, aber eben nicht für Luxemburgisch. “Das lohnt sich für große Unternehmen wie Google nicht”, erklärt der Linguistikprofessor Peter Gilles, der hinter dem Projekt steht. Also hat er die Sache selber in die Hand genommen und zusammen mit zwei PhD-Studierenden der Computerwissenschaften ein solches Programm geschaffen.

Sprachentraining für den Computer

Dafür haben die drei Forschenden ein Neuronales Netzwerk (eine Form der künstlichen Intelligenz) mit aufbereiteten, bestehenden Tonaufnahmen und Transkripten gefüttert, um es zu trainieren. Das Resultat ist noch nicht perfekt, aber durchaus brauchbar. “Das war gar nicht so kompliziert”, so der Uni-Professor. Konkret wird seit zwei Jahren an dem Programm gearbeitet.

Zwei Features des Programmes sind, dass es unterschiedliche Sprecher erkennen kann und diese im Transkript kenntlich macht und dass es Zeitstempel im Text hinterlegt, sodass Forschende Stellen schneller im Video wiederfinden können.

“Einer der Studierenden hat die Luxemburger Fußballsprache untersucht”, erklärt Peter Gilles. Anstatt vor dem Fernseher zu sitzen und alles abzutippen, ließ er die Maschine die Videos in Textform bringen. Danach mussten die Texte nur noch überlesen werden.

Noch nicht perfekt

Laut Peter Gilles macht das Programm noch einige Fehler (10 auf 100 Wörter, Satzzeichen einbegriffen). Eine weitere “Schwäche” des Programmes ist, dass es die vielen Varianten der gesprochenen Luxemburger Sprache alle auf die gleiche Art transkribiert. (Das Programm transkribiert “gemaach” und “gemeet” auf die gleiche Art und Weise). Wenn eine Person eine weniger gängige Variante eines Wortes benutzt, dann transkribiert die KI entweder eine gängigere Variante “oder es kommt Quatsch dabei heraus”, so der Professor.

Eine andere Herausforderung im Luxemburgischen ist der Gebrauch von vielen Fremdwörtern in verschiedenen Kontexten. Im Parlament zum Beispiel benutzen die Abgeordneten oft französische Wörter (weil die Gesetzestexte auf Französisch geschrieben sind). Laut Peter Gilles, kann das Programm ganz gut französische oder englische Fremdwörter “heraushören” und korrekt übersetzen (die KI kennt diese Sprachen bereits). Mehr Probleme bereitet die gelegentliche deutsche Vokabel, wegen der nahen Verwandtschaft zwischen dem Deutschen und dem Luxemburgischen.

Auch wenn die Forschenden vor allem an sich selbst gedacht haben, als sie die KI trainiert haben, hat das Programm aber auch Anwendungsgebiete außerhalb der Uni. Wie der Professor erzählt, wird es derzeit von der Abgeordnetenkammer und von RTL getestet, um Untertitel für Videos zu erstellen. Ausprobieren kann man das Programm unter im Internet selber.

Jetzt soll das System kontinuierlich weiterentwickelt werden und neue Versionen werden erstellt. Derzeit wird daran gearbeitet, ein Verbesserungsprogramm einzubauen, das “seltsame Stellen” im Text identifizieren kann.

Auch beschäftigt sich derzeit ein anderes Projekt der Uni mit der umgekehrten Technologie, berichtet Professor Peter Gilles. Dort wollen die Forschenden eine KI erschaffen, die einen luxemburgischen Text fließend vorlesen kann.

Finden Sie unsere News auf Instagram