Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Morphological Inflection of Terminology for Constrained Neural Machine Translation
Organization Unit
Authors
  • Andreas Schaufelbühl
Supervisors
  • Samuel Läubli
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Number of Pages 67
Date 2019
Abstract Text Nowadays Neural Machine Translation systems generally achieve remarkable translation quality. Recently proposed constrained decoding approaches allow even the inclusion of pre-defined terms in Neural Machine Translation output. However, the appropriate inection of these terms is an open problem: Their base form is placed without any modication in the output, which may lead to grammatically incorrect results. We examine the use of a stand-alone sequence-to-sequence model to predict the correct inflected form of a term given its basic form in the target language and the source sentence. We show that good results can be achieved in terms of overall accuracy and that the method has limited success in handling rare word forms.
Zusammenfassung Aktuellste Neurale Maschinelle Übersetzungssysteme erreichen im Allgemeinen hohe Übersetzungsqualitat. JÜngste Methoden in \Constraint Decoding" erlauben sogar die Einbindung von lexikalischen Begriffen in der maschinell erzeugten Übersetzungsausgabe. Jedoch ist das korrekte Flektieren dieser Begriffe ein offenes und ungelöstes Problem: Die Basisform der Terminologie wird ohne Anpassung in das Ergebnis eingebunden, was zu grammatikalisch falschen Resultaten führen kann. Wir untersuchen die Anwendung eines eigenständigen Sequenz-zu-Sequenz-Modells, welches anhand der Basisform der Zielsprache und des Quellsatzes die korrekt flektiere Wortform vorhersagen kann. Wir zeigen auf, dass gute Resultate im Bezug auf Gesamtgenauigkeit (accuracy) erreicht werden und dass die Methode limitierten Erfolg mit raren Wortformen hat.
PDF File Download
Export BibTeX