Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Gender-Aware Neural Machine Translation
Organization Unit
Authors
  • Benjamin Suter
Supervisors
  • Martin Volk
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2022
Abstract Text This thesis addresses the issue of gender bias in machine translation. It presents a simple yet effective approach to controlling gender morphology in the target language. It focuses on gender morphology in the 1st and 2nd person (speaker and addressee) and suggests using gender tags at the sen- tence level to direct the model to the desired gender. Its main contributions are the creation of two gender-annotated parallel corpora for English–Russian and English–French, and several experiments analyzing the effect of gender tagging on translation quality. Experimental results show that the use of appropriate gender tags leads to a significant improvement in translation quality (at least +2.14 BLEU), with a particularly high improvement for sentences referring to a female per- son (up to +9.97 BLEU).
Zusammenfassung Diese Arbeit befasst sich mit dem Thema des Gender Bias in der maschi- nellen Übersetzung und stellt eine einfache, aber effektive Methode zur Kon- trolle der Genusmorphologie in der Zielsprache vor. Im Zentrum der Arbeit steht die Genusmorphologie in der 1. und 2. Person (Sprecher*in und Adres- sat*in) und es wird vorgeschlagen, Genus-Tags auf Satzebene zu verwen- den, um das Modell auf das gewünschte Genus zu lenken. Der Hauptbeitrag dieser Arbeit besteht in der Erstellung von zwei genus- annotierten parallelen Korpora für Englisch–Russisch und Englisch– Franzö- sisch sowie in der Durchführung mehrerer Experimente, in denen die Auswir- kung des Genus-Taggings auf die Übersetzungsqualität analysiert wird. Die Versuchsergebnisse zeigen, dass die Verwendung geeigneter Genus- Tags zu einer signifikanten Verbesserung der Übersetzungsqualität (min- destens +2.14 BLEU) führt. Eine besonders deutliche Verbesserung wird bei Sätzen erzielt, die sich auf eine weibliche Person beziehen (bis zu +9.97 BLEU).
PDF File Download
Export BibTeX