Avec l’essor fulgurant de la traduction automatique ces dernières années, de nombreux médias ont annoncé « la mort du traducteur ». Si les nouveaux moteurs ont progressé en qualité et en efficacité en un temps record, ils sont encore loin d’égaler l’humain et son esprit critique.
En réalité, les contenus scientifiques, juridiques ou techniques sont aussi des produits culturels, empreints de multiples références, parfois même écrits avec un certain style.
Les annonces triomphales, et parfois alarmistes, sur les progrès phénoménaux de la TA et ses risques pour la profession de traducteur font suite à un nombre limité d’essais ou d’expériences dans des domaines d’activité spécifique. C’est le cas d’une équipe de Microsoft qui a traduit des extraits de journaux du chinois vers l’anglais avec son propre système, affirmant que celui-ci était aussi efficace qu’un humain. Pour certains comme Nicolas Bousquet, directeur scientifique de Quantmetry, l’entreprise qui a collaboré à la traduction de l’ouvrage de référence Deep Learning avec DeepL, la TA menace surtout les traducteurs de « notices d’aspirateurs », mais pas les traducteurs littéraires.
Cette vision simpliste trace une frontière entre la littérature et « le reste », comme s’il n’y avait rien entre le mode d’emploi d’une tondeuse à gazon et le roman. En réalité, les contenus scientifiques, juridiques ou techniques sont aussi des produits culturels, empreints de multiples références, parfois même écrits avec un certain style. Or, les machines ne comprennent pas le monde qui les entoure et, de ce fait, les allusions implicites qu’un humain reconnaît immédiatement. C’est le cas présentement avec les documents qui parlent de la COVID-19 : les moteurs ne reconnaissent pas la maladie. Les systèmes actuels sont dépourvus de sens commun, et reste à savoir si l’intelligence artificielle pourra un jour percer ce mystère.
Peu importe le domaine, il est souvent nécessaire de bien comprendre la situation de communication du texte à traduire et ses différents paramètres : public cible, préférences du client, spécificités locales, etc. Et c’est pourquoi la traduction automatique a encore tant besoin de l’humain.
Un autre problème plus concret concerne le fonctionnement même des moteurs, qui traduisent les phrases isolément. Or, de nombreuses considérations linguistiques s’étendent sur plusieurs phrases, et c’est toujours le contexte qui permet de comprendre. Si l’humain peut remonter ou descendre dans le texte pour trouver l’information dont il a besoin, la machine ne sait pas forcément si le « it » est masculin ou féminin. À ce manque de cohérence grammaticale s’ajoute un manque de cohésion stylistique. Les moteurs peuvent ainsi nous proposer différentes traductions pour le même mot, comme pour « outbreak », qu’ils traduiront alternativement par « épidémie », « foyer » ou « flambée ». Et contrairement aux traducteurs, ils ne fournissent jamais leurs sources, ce qui peut rendre la post-édition extrêmement laborieuse, voire contre-productive, alors même qu’il existe depuis longtemps des logiciels d’aide à la traduction très efficaces à cet égard.
Par ailleurs, la qualité du rendu de la TA dépend de l’entraînement de corpus fiables et volumineux, ce qui pose un défi non négligeable lorsqu’on veut adapter un entraînement à un projet, à un client, à certains créneaux ou à certaines langues. Ainsi, les textes disponibles en anglais et en français sont beaucoup plus nombreux que ceux en bulgare et en malais, par exemple, ce qui rend la traduction beaucoup plus précaire pour certains idiomes. Qui plus est, les corpus actuels sont constitués en grande partie d’écrits institutionnels, provenant par exemple de l’ONU et de divers organismes internationaux, ce qui n’aide certainement pas les machines à traduire le langage oral, les accroches publicitaires et les contenus de niche. Cela dit, peu importe le domaine, il est souvent nécessaire de bien comprendre la situation de communication du texte à traduire et ses différents paramètres : public cible, préférences du client, spécificités locales, etc. Et c’est pourquoi la traduction automatique a encore tant besoin de l’humain. D’un humain compétent.
L’étape de la validation, aussi appelée « post-édition », pose un défi de taille, qui consiste à réviser le texte en demeurant suffisamment alerte pour éviter tout automatisme ou idée reçue.
L’humain est indispensable à plusieurs niveaux : d’abord, pour alimenter continuellement la machine en corpus de qualité, en suivant l’évolution constante des langues et des connaissances. Puis, pour valider les traductions proposées par la machine, notamment chez les traducteurs qui utilisent la TA au travail. L’étape de la validation, aussi appelée « post-édition », pose un défi de taille, qui consiste à réviser le texte en demeurant suffisamment alerte pour éviter tout automatisme ou idée reçue. C’est en quelque sorte un travail de réviseur, qui exige un bon bagage linguistique, mais aussi théorique, culturel et technique, et pour lequel, en règle générale, on demande entre trois à cinq ans d’expérience comme traducteur.
La question se pose donc : comment intègre-t-on la post-édition dans le monde de la traduction? Et comment forme-t-on la prochaine génération de traducteurs? Pour le moment, les langagiers, jeunes et moins jeunes, s’adaptent progressivement à cette nouvelle réalité et recourent à la TA avec jugement. Une bonne pratique consiste, par exemple, à faire réviser le travail de post-édition d’un jeune professionnel par un réviseur chevronné. Quoi qu’il en soit, ces outils virtuels occupent une place croissante dans l’arsenal rédactionnel du traducteur et exercent une plus grande pression sur les compétences humaines requises.
Un accès accru aux connaissances issues de langues et de cultures variées contrebalancerait l’hégémonie de l’anglais, qui fait encore largement autorité, et permettrait à d’autres nations de se faire entendre, voire même de renforcer leur leadership dans le domaine de la diffusion de l’information et de la transmission des savoirs.
La formation des traducteurs doit certes les préparer à utiliser les nouvelles technologies disponibles, mais elle doit surtout mettre l’accent sur le plan cognitif : l’esprit critique, les différentes dimensions de la communication, la pluralité des savoirs, la spécialisation dans des domaines encore peu maîtrisés par la machine – et pas seulement la littérature, mais aussi tout type d’analyse pointue, les entrevues, les publications marketing, etc. Bref, elle doit mettre l’accent sur tout ce qui fait leur valeur ajoutée.
Yoshua Bengio, l’un des auteurs de Deep Learning, avance une autre idée intéressante pour l’avenir : on pourrait observer un véritable élan de la traduction à travers le monde, ainsi qu’un retour en force de l’usage de nombreuses langues, notamment dans les domaines scientifiques et techniques. Un accès accru aux connaissances issues de langues et de cultures variées contrebalancerait l’hégémonie de l’anglais, qui fait encore largement autorité, et permettrait à d’autres nations de se faire entendre, voire même de renforcer leur leadership dans le domaine de la diffusion de l’information et de la transmission des savoirs.
La principale menace pour le traducteur n’est pas l’essor de la traduction automatique, car il saura la mettre au service de son travail et de l’avenir de la profession; c’est plutôt la perception de la profession. Aux yeux du grand public et de clients avides de gains en rentabilité, celle-ci pourrait perdre de sa valeur, entrainant ainsi une baisse générale de la rémunération. Le plus grand défi consiste donc à corriger cette perception, encore trop souvent nourrie de préjugés sur un travail autrement plus varié et complexe qu’il en a l’air.
Cet article est le troisième de notre série sur la traduction automatique. Lisez les articles un et deux.