Portrait Lydia Nishimwe

Lydia Nishimwe

Lydia Nishimwe est doctorante en quatrième année à l'école doctorale Informatique, télécommunications et électronique. Elle est encadrée par Benoit Sagot au Centre Inria de Paris. 

Est-ce k'on pe amelio la trad auto des txt écri par les internaute ???!!

Traduction automatique robuste des contenus utilisateurs : vers des modèles plus adaptés aux textes du quotidien.

Aujourd’hui, la traduction automatique est partout : des moteurs de recherche aux applications de messagerie, en passant par les réseaux sociaux. Pourtant, lorsqu’on s’éloigne des textes bien écrits pour s’attaquer aux contenus produits par les utilisateurs (commentaires, tweets, avis en ligne), la qualité des traductions chute. Ces textes sont souvent pleins de fautes, d’abréviations et de tournures peu conventionnelles, rendant le travail des modèles de traduction beaucoup plus difficile.

L’objectif de ma thèse est de rendre la traduction automatique plus robuste face à ces défis. Pour cela, j'explore l'approche des modèles qui capturent l’essence globale d'une phrase sous forme d’un vecteur numérique unique, appelé plongement de phrase, plutôt que de traiter chaque mot individuellement.

L’idée clé est de travailler dans un espace sémantique de phrases, où les phrases ayant un sens proche sont aussi proches dans l’espace, et ce quelle que soit leur langue ou leur style d’écriture que ce soit une phrase en français, son équivalent en anglais, ou une version abrégée et pleine de fautes d’orthographe. Cette approche permet aux modèles de mieux gérer la diversité des formulations et de produire des traductions plus précises, même face à des textes non standard, facilitant ainsi la communication entre locuteurs de langues différentes sur les plateformes numériques.