La traduction automatique neuronale, ou NMT (« Neural Machine Translation »), est un phénomène relativement nouveau. En effet, avant que les systèmes NMT ne commencent à être utilisés, la traduction automatique avait connu plusieurs autres systèmes de traduction automatique. Toutefois, la recherche dans le domaine de l’intelligence artificielle progressant, une application à la traduction est tout naturellement envisagée.
L’histoire de la traduction automatique neuronale
Les applications de Deep Learning sont apparues dans les années 1990. Elles étaient alors exploitées, non pas en traduction, mais en reconnaissance vocale. C’est à cette époque que la traduction automatique a commencé à gagner du terrain, suite à l’abandon de presque toutes les études sur le sujet dans les années 1960. On estimait alors que la traduction automatique était trop coûteuse pour des résultats très médiocres. La traduction automatique basée sur des règles était alors le type de traduction automatique le plus utilisé. La traduction automatique statistique, de son côté, semblait gagner en importance.
Le premier article scientifique concernant l’utilisation des réseaux neuronaux dans la traduction automatique est paru en 2014. Après cela, le domaine a connu de nombreuses avancées.
En 2015, l’OpenMT, concours de traduction automatique, compte pour la première fois un système de NMT parmi ses concurrents. L’année suivante, il comptait déjà 90 % de systèmes de traduction automatique neuronal parmi ses gagnants.
En 2016, plusieurs systèmes de TA neuronale gratuits ont été lancés. DeepL Translator ou le système de NMT de Google (GNMT) pour Google Translate en sont les plus connus.
Comment cela fonctionne-t-il ?
Ces systèmes NMT sont constitués de neurones artificiels, connectés les uns aux autres et organisés en plusieurs couches. Ils s’inspirent des réseaux neuronaux biologiques. Ces derniers sont capables d’apprendre par eux-mêmes à partir des données reçues chaque fois que quelqu’un traduit un document. Le processus d’ « apprentissage » (learning) consiste à modifier le poids des neurones artificiels. Cette opération est répétée lors de chaque nouvelle traduction, afin d’optimiser constamment les poids, ainsi la qualité des traductions suivantes. Les systèmes NMT travaillent avec des corpus bilingues de documents source et cible préalablement traduits.
Une traduction en deux phases
Tout d’abord, il y a une phase d’analyse. Les mots du document source sont encodés sous la forme d’une séquence de vecteurs qui représentent le sens des mots. Un contexte est généré pour chaque mot, basé sur la relation entre le mot et le contexte du mot précédent. Ensuite, en utilisant ce nouveau contexte, la traduction correcte du mot est sélectionnée parmi toutes les traductions possibles. Puis vient la phase de transfert. Il s’agit d’une phase de décodage, où la phrase dans la langue cible est générée.
Le Deep Learning, ou apprentissage profond, plus efficace, mais pas encore parfait.
Bien que les systèmes de Deep Learning soient les meilleurs systèmes de traduction automatique qui existent à ce jour, ils ne sont pas parfaits et ne peuvent pas fonctionner complètement seuls. En effet, les langues sont utilisées tous les jours et évoluent constamment. Par conséquent, les systèmes de Deep Learning ont toujours besoin de progresser. On parle ici notamment des néologismes et les nouvelles expressions. Pour apprendre ces nouveaux éléments, ils devront toujours compter sur une aide humaine. Les humains travaillent donc directement sur les systèmes ou effectuent la post-édition des documents traduits.
Néanmoins, les systèmes capables « d’apprendre » par eux-mêmes représentent une amélioration considérable. Ce, en termes de traduction automatique, pour le traitement du langage naturel, ou encore en matière d’intelligence artificielle en général.
La traduction automatique neuronale requiert encore des recherches et des améliorations, c’est certain. Elle représente cependant un avenir prometteur pour la traduction automatique. Vous avez peut-être vous-même, consciemment ou non, déjà utilisé un système de traduction automatique neuronale.
Chez TRADUILI, nous proposons également une offre de post-édition pour certains contenus, adapté à vos projet et disponibles dans l’onglet « tarifs ».