Traduction automatique et traduction assistée par ordinateur : une nouvelle façon de traduire ?
Le besoin de technologie de traduction
Les avancées dans la technologie de l'information (TI) se sont combinées avec les exigences modernes de communication pour favoriser l'automatisation de la traduction.
L'histoire de la relation entre la technologie et la traduction remonte aux débuts de la guerre froide, car dans les années 1950, la concurrence entre les États-Unis et l'Union soviétique était si intense à tous les niveaux que des milliers de documents ont été traduits du russe vers l'anglais et vice versa. Cependant, une telle demande élevée a révélé l'inefficacité du processus de traduction, surtout dans les domaines spécialisés du savoir, augmentant l'intérêt pour l'idée d'une machine de traduction. Bien que la guerre froide soit maintenant terminée, et malgré l'importance de la mondialisation, qui tend à briser les barrières culturelles, économiques et linguistiques, la traduction n'est pas devenue obsolète, en raison du désir des nations de conserver leur indépendance et leur identité culturelle, notamment à travers leur propre langue. Ce phénomène est clairement visible au sein de l'Union européenne, où la traduction reste une activité cruciale.
Internet, avec son accès universel à l'information et sa communication instantanée entre utilisateurs, a créé une liberté physique et géographique pour les traducteurs qui était inconcevable dans le passé.
La TI a produit une culture de l'écran qui tend à remplacer la culture de l'imprimé, les documents imprimés étant abandonnés et l'information étant accessible et relayée directement par les ordinateurs (e-mail, bases de données et autres informations stockées). Ces documents informatiques sont instantanément disponibles et peuvent être ouverts et traités avec une flexibilité bien plus grande que les documents papiers, si bien que le statut même de l'information a changé, devenant soit temporaire soit permanent selon les besoins. Au cours des deux dernières décennies, nous avons assisté à une croissance énorme de la technologie de l'information avec les avantages qui l'accompagnent : rapidité, impact visuel, facilité d'utilisation, commodité et rentabilité. En même temps, avec le développement du marché mondial, l'industrie et le commerce fonctionnent plus que jamais à l'échelle internationale, avec une liberté et une flexibilité accrues en termes d'échange de produits et de services. La nature et la fonction de la traduction sont inévitablement affectées par ces changements. Il est nécessaire que les pays coopèrent dans de nombreux domaines, tels que l'écologie (Greenpeace), l'économie (accords de libre-échange), l'humanitaire (Médecins sans frontières) et l'éducation (programmes d'échange), etc. Malgré l'importance de l'anglais, il est communément admis que les gens ont le droit d'utiliser leur propre langue, mais la diversité des langues ne doit pas être un obstacle à la compréhension mutuelle. Des solutions aux problèmes linguistiques doivent être trouvées pour permettre à l'information de circuler librement et pour faciliter les relations bilatérales et multilatérales.
Ainsi, différents aspects de la vie moderne ont conduit à la nécessité de méthodes de traduction plus efficaces. À l'heure actuelle, la demande de traductions n'est pas satisfaite parce qu'il n'y a pas assez de traducteurs humains, ou parce que les individus et les organisations ne reconnaissent pas la traduction comme une activité complexe nécessitant un haut niveau de compétence, et ne sont donc pas prêts à payer ce qu'elle vaut. En d'autres termes, la traduction est parfois évitée parce qu'elle est considérée comme trop coûteuse. En partie, la traduction humaine est coûteuse parce que la productivité d'un être humain est essentiellement limitée. Les statistiques varient, mais en général, pour produire une bonne traduction d'un texte difficile, un traducteur ne peut pas traiter plus de 4 à 6 pages ou 2 000 mots par jour. La nécessité économique de trouver une solution plus abordable pour l'échange international a entraîné des progrès technologiques constants, avec des outils de traduction conçus pour répondre au besoin des traducteurs d’accéder immédiatement à des informations et de consulter non linéairement des bases de données étendues.
Cet article vise à examiner les nouvelles technologies (traduction automatique, dictionnaires électroniques, bases de données terminologiques, textes bilingues, concordances grammaticales et mémoires de traduction) afin de déterminer si elles modifient la relation entre le traducteur et les textes, et si oui, de quelle manière. Nous essaierons de répondre aux questions suivantes :
- Quels outils informatiques sont réellement utiles aux traducteurs ?
- Les nouvelles technologies menacent-elles les moyens de subsistance des traducteurs ?
- L'automatisation implique-t-elle la disparition de la traduction telle que nous la connaissons ?
Une brève histoire de la traduction automatique
Ce n'est qu'au XXe siècle que l'idée de créer des dictionnaires automatiques est apparue comme une solution au problème des barrières linguistiques. Dans les années 1930, deux chercheurs ont travaillé indépendamment vers le même objectif : le Franco-Arménien George Artsrouni et le Russe Petr Smirnov-Troyanskii. Ce dernier était le plus important des deux car il a développé l'idée que trois étapes sont nécessaires pour un système de traduction automatique : d'abord un éditeur qui connaît la langue source analyse les mots et les convertit en formes de base selon leurs fonctions syntaxiques ; ensuite une machine organise les formes de base en séquences équivalentes dans la langue cible ; enfin, cette version brute est corrigée par un second éditeur, familier avec la langue cible. Malgré l'importance du travail de Troyanskii, il est resté généralement inconnu jusqu'à la fin des années 1950.
L'invention de l'ordinateur a très rapidement conduit à des tentatives de l'utiliser pour la traduction des langues naturelles.
Une lettre de Warren Weaver au spécialiste de l'informatique Norbert Wiener en mars 1947 est considérée comme marquant le début de ce processus. Deux ans plus tard, en juillet 1949, Weaver rendit publiques ses idées sur l’utilisation de l’ordinateur pour la traduction, et peu après, plusieurs universités américaines lancèrent des recherches dans le domaine de la traduction automatique. En 1954, le premier essai de faisabilité a été réalisé dans le cadre d'un projet conjoint entre IBM et l'Université de Georgetown. Bien que très limité dans sa portée, la démonstration a été considérée comme un succès, conduisant au financement d'autres projets, tant aux États-Unis que dans le reste du monde. Les premières versions des programmes de traduction automatique étaient basées sur des dictionnaires bilingues détaillés qui offraient un certain nombre de mots équivalents dans la langue cible pour chaque mot répertorié dans la langue source, ainsi qu'une série de règles sur l'ordre des mots. La complexité de la tâche a rendu nécessaire pour les développeurs de continuer à améliorer les programmes en raison du besoin d'une approche syntaxique plus systématique. Les projets étaient basés sur les avancées en linguistique, en particulier sur le développement de modèles de grammaire générative transformationnelle qui semblaient offrir de nouvelles possibilités pour la traduction automatique.
Cependant, l'optimisme initial a rapidement disparu. Les chercheurs ont commencé à penser que les barrières sémantiques étaient insurmontables et ne voyaient plus de solution à court terme au problème de la traduction automatique. IBM et l'Université de Washington ont produit un système d'exploitation appelé Mark II, mais les résultats étaient décevants. En 1964, le gouvernement américain était de plus en plus préoccupé par l'inefficacité des programmes de traduction automatique et a créé l'ALPAC (Automatic Language Processing Advisory Committee) pour les évaluer. En 1966, ce comité a produit un rapport très critique affirmant que la traduction automatique était lente, inefficace et deux fois plus coûteuse que la traduction humaine, concluant qu'il ne valait pas la peine d'investir de l'argent dans la recherche dans ce domaine. Néanmoins, le rapport a souligné la nécessité d'encourager le développement d'outils pour assister le processus de traduction, tels que les dictionnaires informatiques, les bases de données, etc. Bien qu'il ait été critiqué pour son manque d'objectivité et de vision, le rapport ALPAC a conduit à un gel de la recherche sur la traduction automatique aux États-Unis pendant plus d'une décennie. Cependant, la recherche a continué au Canada, en France et en Allemagne et deux systèmes de traduction automatique ont vu le jour plusieurs années plus tard : Systran, utilisé par la Commission de l'Union européenne et Taummétéo, créé par l'Université de Montréal pour traduire les prévisions météorologiques du français vers l'anglais. Des avancées importantes ont eu lieu au cours des années 1980. Les besoins administratifs et commerciaux des communautés multilingues ont stimulé la demande de traduction, ce qui a conduit au développement, dans des pays comme la France, l’Allemagne, le Canada et le Japon, de nouveaux systèmes de traduction automatique. Parmi eux, on trouve Logos (de l’allemand au français et inversement), le système interne de l’Organisation panaméricaine de la santé (de l’espagnol à l’anglais et inversement), ainsi qu’un certain nombre de systèmes créés par des entreprises informatiques japonaises. La recherche a également repris dans les années 1980, l’accès généralisé aux ordinateurs personnels et aux logiciels de traitement de texte ayant créé un marché pour des systèmes de traduction automatique meilleur marché. Des entreprises telles que ALPS, Weidner, Globalink (Amérique du Nord et Europe),
Sharp, NEC, Mitsubishi, Sanyo (Japon) avaient besoin de ces programmes. Certains des projets les plus importants étaient GETA-Ariane (Grenoble), SUSY (Sarrebruck), MU (Kyoto), et Eurotra (l'Union européenne). Le début des années 1990 a vu des développements vitaux dans la traduction automatique avec un changement radical de stratégie, passant de la traduction basée sur des règles grammaticales à celle basée sur des corpus de textes et des exemples (par exemple, le programme Reverso). La langue n'était plus perçue comme une entité statique régie par des règles fixes, mais comme un corpus dynamique qui change selon l'usage et les utilisateurs, évoluant au fil du temps et s'adaptant aux réalités sociales et culturelles. À ce jour, la traduction automatique continue de progresser. Les grandes entreprises l'utilisent désormais davantage, ce qui augmente également les ventes de logiciels au grand public. Cette situation a conduit à la création de services de traduction automatique en ligne tels qu'Altavista, qui offrent des services d’e-mail rapide, des pages Web, etc. dans la langue souhaitée, ainsi qu'à la disponibilité de dictionnaires multilingues, d'encyclopédies et de bases de données terminologiques gratuites et en accès direct.
Le marché de la traduction
Le développement de la traduction automatique repose sur l'offre et la demande. D'une part, il y a une nouvelle technologie disponible, et d'autre part, un besoin politique, social et économique de changement. Pourtant, malgré les avancées, la traduction automatique ne représente encore qu'un infime pourcentage du marché.
Au début des années 1990, le marché de la traduction était le suivant (Loffler-Laurian, 1996) :
TRADUCTION HUMAINE |
TRADUCTION AUTOMATIQUE |
|
Europe & les États-Unis |
300 millions de pages |
2,5 millions de pages |
Japon |
150 millions de pages |
3,5 millions de pages |
On peut voir que seulement 6 millions de pages ont été traduites par traduction automatique, comparé aux 450 millions par traduction humaine, c'est-à-dire que la TA ne représentait que 1,3 % du total. Les analystes du marché prédisent que ce pourcentage ne changera pas radicalement d'ici 2007. Ils disent que la traduction automatique ne représentera qu'environ 1 % d'un marché de la traduction de plus de 10 milliards de dollars américains (Oren, 2004). Les langues pour lesquelles il y avait le plus de demande de traduction en 1991 étaient :
EN | JP | FR | DE | RU | ES | Autre | |
En tant que langue source | 48 % | 32 % | 8 % | 5 % | 2 % | - | 5 % |
En tant que langue cible | 45 % | 24 % | 12 % | - | 5 % | 10 % | 4 % |
Comme prévu, l'anglais domine le marché. L'importance du japonais reflète le rôle du Japon dans les domaines de la technologie et du commerce extérieur, qui représentait à eux seuls les deux tiers du volume de traduction à la fin des années 1990 :
TI | Commerce extérieur | Science | Enseignement | Littérature | Revues | Administration des affaires |
40 % | 25 % | 10 % | 10 % | 5 % | 5 % | 5 % |
À ce stade, il est important de faire une distinction entre deux termes étroitement liés et qui tendent à confondre les non-spécialistes : traduction automatique (TA) et traduction assistée par ordinateur (TAO). Ces deux technologies sont la conséquence d'approches différentes.
Elles ne produisent pas les mêmes résultats et sont utilisées dans des contextes distincts. La TA vise à rassembler toutes les informations nécessaires à la traduction dans un seul programme afin qu'un texte puisse être traduit sans intervention humaine. Elle exploite la capacité de calcul de l’ordinateur pour analyser la structure d’un énoncé ou d’une phrase dans la langue source, le décomposer en éléments facilement traduisibles, puis générer un énoncé à la structure équivalente dans la langue cible. Elle s’appuie sur de vastes dictionnaires plurilingues, ainsi que sur des corpus de textes déjà traduits. Comme mentionné, dans les années 1980, la TA promettait beaucoup, mais elle a progressivement perdu du terrain face à la traduction assistée par ordinateur car cette dernière répond de manière plus réaliste aux besoins réels.
La TAO utilise un certain nombre d'outils pour aider le traducteur à travailler avec précision et rapidité. Comme prévu, l'anglais domine le marché. L'importance du japonais reflète le rôle du Japon dans les domaines de la technologie et du commerce extérieur, qui représentait à eux seuls les deux tiers du volume de traduction à la fin des années 1990 : dont les plus importants sont les bases de données terminologiques et les mémoires de traduction. Effectivement, l'ordinateur offre une nouvelle façon d'aborder le traitement des textes, tant du texte source que du texte cible. Travailler avec un document numérique nous donne un accès non séquentiel à l'information afin que nous puissions l'utiliser selon nos besoins. Il devient facile d'analyser les phrases du texte source, de vérifier le contexte dans lequel un mot ou un texte est utilisé, ou de créer un inventaire de termes, par exemple. De même, toute partie du texte cible peut être modifiée à tout moment et des versions parallèles peuvent être produites pour comparaison et évaluation. Tous ces aspects ont des implications profondes pour la traduction, notamment en termes d'évaluation des résultats, puisque le traducteur peut travailler de manière plus détendue grâce à une plus grande liberté de faire des modifications à tout moment pendant que le travail est en cours.
Il est important de souligner que les systèmes de traduction automatique ne sont pas encore capables de produire un texte immédiatement utilisable, car les langues dépendent fortement du contexte et des différentes dénotations et connotations des mots et des combinaisons de mots.
Il n'est pas toujours possible de fournir un contexte complet dans le texte lui-même, de sorte que la traduction automatique est limitée à des situations concrètes et est considérée principalement comme un moyen de gagner du temps, plutôt qu'un remplacement de l'activité humaine. Elle nécessite une post-édition pour produire un texte cible de qualité.
Processus cognitifs
Pour comprendre les principes essentiels sous-jacents à la traduction automatique, il est nécessaire de comprendre le fonctionnement du cerveau humain. La première étape de la traduction humaine est la compréhension complète du texte en langue source. Cette compréhension opère à plusieurs niveaux :
- Niveau sémantique : comprendre les mots hors contexte, comme dans un dictionnaire.
- Niveau syntaxique : comprendre les mots dans une phrase.
- Niveau pragmatique : comprendre les mots dans des situations et contextes.
De plus, il existe au moins cinq types de connaissances utilisées dans le processus de traduction :
- Connaissance de la langue source, qui nous permet de comprendre le texte original.
- Connaissance de la langue cible, qui permet de produire un texte cohérent dans cette langue.
- Connaissance des équivalents entre les langues source et cible.
- Connaissance du domaine ainsi que des connaissances générales, qui aident à la compréhension du texte en langue source.
- Connaissance des aspects socio-culturels, c'est-à-dire des coutumes et conventions des cultures source et cible.
- Étant donné la complexité des phénomènes qui soutiennent le travail d'un traducteur humain, il serait absurde de prétendre qu'une machine pourrait produire un texte cible de la même qualité que celui d'un être humain.
Cependant, il est clair que même un traducteur humain est rarement capable de produire une traduction soignée du premier coup. En réalité, le processus de traduction comprend deux étapes : d'abord, la production d'un texte brut ou d'une version préliminaire dans la langue cible, dans laquelle la plupart des problèmes de traduction sont résolus mais qui est loin d'être parfaite ; et ensuite, l'étape de révision, allant de la simple relecture du texte en apportant des ajustements mineurs à la mise en œuvre de changements radicaux. On pourrait donc dire que la TA vise à réaliser la première étape de ce processus de manière automatique, afin que le traducteur humain puisse ensuite passer directement à la seconde, en effectuant la tâche méticuleuse et exigeante de révision. Le problème est que le traducteur est maintenant confronté à un texte qui n'a pas été traduit par un cerveau humain mais par une machine, ce qui change l'approche requise car les erreurs sont différentes. Il devient nécessaire d'harmoniser la version de la machine avec les processus de pensée, les jugements et les expériences humaines. La traduction automatique est donc à la fois une aide et un piège pour les traducteurs : une aide parce qu'elle complète la première étape de la traduction ; un piège parce qu'il n'est pas toujours facile pour le traducteur de garder la distance critique nécessaire par rapport à un texte qui, au moins de manière rudimentaire, est déjà traduit, de sorte que des erreurs peuvent passer inaperçues. En aucun cas une traduction produite automatiquement ne doit être considérée comme finale, même si elle semble en surface cohérente et correcte.
Stratégies de traduction automatique
La traduction automatique est un système autonome avec des stratégies et des approches qui peuvent être classées comme suit :
- la stratégie directe
- la stratégie de transfert
- la stratégie de langue pivot
La stratégie directe, la première à être utilisée dans les systèmes de traduction automatique, implique un minimum de théorie linguistique. Cette approche est basée sur un binôme langue source-langue cible prédéfini dans lequel chaque mot du syntagme de la langue source est directement lié à une unité correspondante dans la langue cible avec une corrélation unidirectionnelle, par exemple de l'anglais vers l'espagnol mais pas l'inverse. Le représentant le plus connu de cette approche est le système créé par l'Université de Georgetown, testé pour la première fois en 1964 sur des traductions du russe vers l'anglais. Le système de Georgetown, comme tous les systèmes existants, est basé sur une approche directe avec une forte composante lexicale. Les mécanismes d'analyse morphologique sont très développés et les dictionnaires extrêmement complexes, mais les processus d'analyse syntaxique et de désambiguïsation sont limités, de sorte que les textes nécessitent une deuxième étape de traduction par des traducteurs humains. Voici un exemple qui suit le modèle de traduction directe :
Il existe un certain nombre de systèmes qui fonctionnent sur le même principe : par exemple SPANAM, utilisé pour la traduction espagnol-anglais depuis 1980, et SYSTRAN, développé aux États-Unis à des fins militaires pour traduire le russe en anglais. Après des modifications destinées à améliorer son fonctionnement, SYSTRAN a été adopté par la Communauté européenne en 1976. À l'heure actuelle, il peut être utilisé pour traduire les langues européennes suivantes :
- Langues sources : Anglais, français, allemand, espagnol, italien, portugais et grec.
- Langues cibles : Anglais, français, allemand, espagnol, italien, portugais, grec, néerlandais, finnois et suédois.
De plus, des programmes sont en cours de création pour d'autres langues européennes, telles que le hongrois, le polonais et le serbo-croate.
En dehors de son utilisation par la Commission européenne, SYSTRAN est également utilisé par l’OTAN et par Aérospatiale, l'entreprise aéronautique française, qui a participé activement au développement du système en apportant sa propre banque terminologique pour la traduction français-anglais et anglais-français et en finançant le domaine spécialisé relatif à l’aviation.
Texte en langue source | |||||
La | jeune | fille | a acheté | deux | livres |
Décomposition en langue source | |||||
La | jeune | fille | acheter | deux | livres |
Transfert lexical | |||||
The | young | girl | buy | two | book |
Adaptation en langue cible | |||||
The | young | girl | bought | two | books |
En dehors de l'Europe, SYSTRAN est utilisé par l'armée de l'air des États-Unis en raison de son intérêt pour la traduction russe-anglais, par la société XEROX, qui a adopté la traduction automatique à la fin des années 1970 et qui est l'entreprise privée qui a le plus contribué à l'expansion de la traduction automatique, et General Motors, qui grâce à une licence de Peter Toma est autorisée à développer et vendre les applications du système pour son propre compte. Il convient de noter qu'en général, les entreprises qui développent des systèmes de traduction automatique directe ne prétendent pas qu'ils sont conçus pour produire de bonnes traductions finales, mais plutôt pour faciliter le travail du traducteur en termes d'efficacité et de performance (Lab, p.24).
La stratégie de transfert se concentre sur le concept de « niveau de représentation » et implique trois étapes.
L'étape d'analyse décrit linguistiquement le document source et utilise un dictionnaire de la langue source. L'étape de transfert transforme les résultats de l'étape d'analyse et établit les équivalents linguistiques et structurels entre les deux langues.
Elle utilise un dictionnaire bilingue de la langue source à la langue cible. L'étape de génération produit un document dans la langue cible sur la base des données linguistiques de la langue source au moyen d'un dictionnaire de la langue cible.
La stratégie de transfert, développée par GETA (Groupe d'Étude pour la Traduction Automatique) à Grenoble, dirigée par B. Vauquois, a stimulé d'autres projets de recherche. Certains, comme le TAUMMÉTÉO canadien et le METAL américain, sont déjà fonctionnels. D'autres sont encore au stade expérimental, par exemple, SUSY en Allemagne et EUROTRA, qui est un projet européen conjoint. TAUM, acronyme de Traduction Automatique de l'Université de Montréal, a été créé par le gouvernement canadien en 1965. Il fonctionne pour traduire les prévisions météorologiques de l'anglais vers le français depuis 1977 et du français vers l'anglais depuis 1989. L'un des systèmes efficaces les plus anciens existants, TAUMMÉTÉO effectue à la fois une analyse syntaxique et sémantique et est efficace à 80 % car les prévisions météorologiques sont linguistiquement restreintes et clairement définies. Il fonctionne avec seulement 1 500 entrées lexicales, dont beaucoup sont des noms propres. En bref, il effectue des tâches répétitives limitées, traduisant des textes très spécifiques, avec un vocabulaire limité (bien qu'il utilise un dictionnaire exhaustif) et une syntaxe stéréotypée, et il y a une correspondance parfaite de structure à structure.
La stratégie de langue pivot repose sur l'idée de créer une représentation du texte indépendante de toute langue particulière. Cette représentation fonctionne comme un axe central neutre et universel distinct à la fois de la langue source et de la langue cible. En théorie, cette méthode réduit le processus de traduction automatique à seulement deux étapes : analyse et génération. L'analyse du texte source conduit à une représentation conceptuelle, dont les divers composants sont appariés par le module de génération à leurs équivalents dans la langue cible. La recherche sur cette stratégie est liée à l'intelligence artificielle et à la représentation des connaissances. Les systèmes basés sur l'idée d'une langue pivot ne visent pas la traduction directe, mais reformulent plutôt le texte source à partir des informations essentielles. À l'heure actuelle, les stratégies de transfert et de langue pivot génèrent le plus de recherches dans le domaine de la traduction automatique. En ce qui concerne la stratégie de langue pivot, il convient de mentionner le projet néerlandais DLT (Distributed Language Translation), mené de 1985 à 1990, qui utilisait l’espéranto comme langue pivot pour la traduction de 12 langues européennes.
Il convient de répéter que, sauf si les systèmes fonctionnent dans une sphère rigoureusement définie, comme c'est le cas avec TAUM-MÉTÉO, la traduction automatique n'offre en aucun cas un produit fini. Comme le dit Christian Boitet, directeur de GETA (Grenoble) dans une interview donnée à la revue Le français dans le monde Nº314 dans laquelle il résume les aspects les plus importants de la TA, elle permet aux traducteurs de se concentrer sur la production d'un texte cible de haute qualité. Peut-être alors que « traduction automatique » n'est pas un terme approprié, puisque la machine ne complète que la première étape du processus. Il serait plus exact de parler d'un outil qui aide le processus de traduction, plutôt que d'un système de traduction indépendant. Voici une classification relativement récente de certains programmes de TA basée sur les résultats obtenus à partir d'une série de tests qui se sont concentrés sur les erreurs et l'intelligibilité dans les textes cibles (Poudat, p.51) :
Traducteur | Adresse | Caractéristiques | |
Alphaworks® | www.alphaworks.ibm.com | Traduit l'anglais en sept langues ; méthode de transfert | 3. |
E-lingo® | www.elingo.com | Vingt paires de langues disponibles ; méthode de transfert | 2. |
Reverso® | www.trans.voila.fr | Treize paires de langues disponibles ; méthode de transfert | 1. |
Systran® | https://www.systransoft.com/fr/ | Douze paires de langues disponibles ; méthode de transfert | 4. |
Analyse de certaines erreurs dans les textes traduits par machine
Dans le but d'analyser les erreurs dans les textes traduits par machine, il est révélateur de comparer une telle traduction avec celle faite par un traducteur humain. Un article du Monde Diplomatique a été choisi, car c'est un journal qui est à l'origine écrit en français mais qui est ensuite traduit en 17 autres langues. Dans ce cas, nous comparerons les traductions du français vers l'anglais produites par Systran, Reverso et un traducteur humain.
TEXTE SOURCE : Le Monde Diplomatique, septembre 2002 Depuis le 11 septembre 2001, l'esprit guerrier qui souffle sur Washington semble avoir balayé ces scrupules. Désormais comme l'a dit le président George W. Bush, « qui n'est pas avec nous est avec les terroristes ».
Systran | Reverso | Traduction humaine |
Since September 11, 2001, the warlike spirit which blowson Washington seems to have swept these scruples. From now on, like said it the president George W Bush, “which is not with us is with the terrorists”. (37 mots) |
Since September 11, 2001, the warlike spirit which blows on Washington seems to have swept (annihilated) these scruples. Henceforth, as said it the president George W. Bush, “which (who) is not with us is with the terrorists”. (35 + 2 mots) |
Since 11 September 2001 the warmongering mood in Washington seems to have swept away such scruples. From that point, as President George Bush put it, “either you are with us or you are with the terrorists.” (36 mots) |
Le premier point à souligner est que la TA est une méthode de traduction qui se concentre sur la langue source, tandis que la traduction humaine vise à la compréhension de la langue cible. Les traductions automatiques sont donc souvent inexactes car elles prennent les mots d'un dictionnaire et suivent les limitations situationnelles fixées par le concepteur du programme. Divers types d'erreurs peuvent être observés dans les traductions ci-dessus.
- Erreurs qui changent le sens du lexème
- Mots ou phrases apparemment corrects mais qui ne traduisent pas le sens dans le contexte :
Original : l'esprit guerrier
Systran : the warlike spirit
Reverso : the warlike spirit
TH : the warmongering mood
- Mots sans signification :
Original : comme l'a dit le président George W. Bush
Systran : like said it the president George W. Bush
Reverso : as said it the president George W. Bush
TH : as President George Bush put it
Bien que la traduction de Reverso ne soit pas complètement correcte, elle traduit comme par « as », ce qui est le choix correct pour ce contexte.
- Erreurs d'usage
La traduction est compréhensible dans la mesure où la TA transmet le sens, mais sans respecter l’usage :
Original : semble avoir balayé ces scrupules
Systran : seems to have swept these scruples
Reverso : seems to have swept (annihilated) these scruples
TH : seems to have swept away such scruples
Original : qui n'est pas avec nous est avec les terroristes
Systran : which is not with us is with the terrorists
Reverso : which (who) is not with us is with the terrorists
TH : either you are with us or with the terrorists
Comme déjà mentionné, la traduction humaine se concentre sur la langue cible, préférant s'écarter de la langue source, si nécessaire, pour reproduire le sens. Par exemple, le traducteur humain a clairement choisi « the warmongering mood in Washington » comme une meilleure traduction contextuelle de l'esprit guerrier qui souffle sur Washington que les versions plus littérales vues dans les traductions automatiques.
Parce que la TA vise principalement à la compréhension et non à la production d'un texte cible parfait, il est important de suivre deux règles de base pour tirer le meilleur parti des programmes. Premièrement, nous devons reconnaître que certains types de textes, comme la poésie, par exemple, ne conviennent pas à la TA. Deuxièmement, il est essentiel de corriger le texte source, car même une lettre peut radicalement changer le sens, comme dans l'exemple suivant : We shook hand se traduit par « Nous avons secoué la main » ; mais We shook hands devient « Nous nous sommes serrés la main ». L'omission d'un s dans le texte source suffit à rendre la traduction automatique incompréhensible. Il est également intéressant de noter que le s final de serrés est une erreur car le programme de TA ne prend pas en compte les subtilités de la grammaire française en ce qui concerne l'accord du participe passé.
Traduction assistée par ordinateur
En pratique, la traduction assistée par ordinateur est un processus complexe impliquant des outils et des technologies spécifiques adaptables aux besoins du traducteur, qui est impliqué dans l'ensemble du processus et pas seulement dans l'étape de l'édition. L'ordinateur devient un poste de travail où le traducteur a accès à une variété de textes, d'outils et de programmes : par exemple, des dictionnaires monolingues et bilingues, des textes parallèles, des textes traduits dans une variété de langues source et cible, et des bases de données terminologiques. Chaque traducteur peut créer un environnement de travail personnel et le transformer selon les besoins de la tâche spécifique. Ainsi, la traduction assistée par ordinateur offre au traducteur une flexibilité et une liberté de mouvement immédiates, ainsi qu'un accès immédiat à une gamme étonnante d'informations à jour. Le résultat est un gain de temps énorme.
Voici les outils informatiques les plus importants dans le lieu de travail du traducteur, du plus élémentaire au plus complexe :
Dictionnaires électroniques, glossaires et bases de données terminologiques
Consulter des dictionnaires électroniques ou numériques sur l'ordinateur ne semble pas au premier abord radicalement différent de l'utilisation de dictionnaires papier. Cependant, les avantages deviennent rapidement évidents. Il faut beaucoup moins de temps pour taper un mot sur l'ordinateur et recevoir une réponse que de chercher dans un dictionnaire papier ; il y a un accès immédiat aux données connexes via des liens ; et il est possible d'utiliser plusieurs dictionnaires simultanément en travaillant avec plusieurs documents.
Les dictionnaires électroniques sont disponibles sous plusieurs formes : en tant que logiciels pouvant être installés dans l'ordinateur ; en tant que CD-ROM et, surtout, via Internet. Le moteur de recherche Google, par exemple, donne accès à une grande variété de dictionnaires monolingues et bilingues dans de nombreuses langues, bien qu’un abonnement en ligne soit parfois nécessaire, comme c’est le cas pour l’Oxford English Dictionary. Les dictionnaires en ligne organisent le matériel pour nous à partir de leur corpus car ils ne sont pas simplement une collection de mots isolés. Par exemple, nous pouvons demander tous les mots liés à un mot clé, ou tous les mots provenant d'une langue particulière.
C'est-à-dire qu'ils permettent un accès croisé immédiat à l'information. Pour obtenir de l'aide avec une terminologie spécifique, il existe une large gamme de dictionnaires, glossaires et bases de données sur Internet. Le Nouveau Grand Dictionnaire Terminologique, développé au Québec (Canada), contient 3 millions de termes en français et en anglais appartenant à 200 domaines. Une autre ressource importante est EURODICAUTOM, une base de données terminologique multilingue créée par l’Union européenne en 1973, qui couvre une grande variété de domaines spécialisés, scientifiques comme non scientifiques (la liste commence par : Agriculture, Arts, Automatisation...). De plus, il existe des sites Web qui offrent des informations sur la terminologie qui sont utiles aux traducteurs. Tel que celui du centre de recherche TERMISTI rattaché à l'Institut supérieur des traducteurs et interprètes (ISTI) à Bruxelles (http://www.termisti.refer.org) qui fournit des informations sur les éléments suivants :
- Dictionnaires disponibles sur Internet tels que ceux mentionnés.
- Réseaux terminologiques tels que RIFAL (Réseau international francophone d'aménagement linguistique), RITERM (Red Iberoamericana de Terminología)
- Projets terminologiques européens tels que Technologies de la langue humaine, Technologies de la société de l'information.
- Écoles de traduction
- Forums et listes de diffusion/discussion
- Conférences
- Revues telles que l'International Journal of Lexicography, La banque des mots, L'actualité terminologique, Méta, Terminogramme, Terminologies nouvelles, Terminology, Terminometro, Translation Journal, Apuntes.
Concordances
Les concordances informatiques ne remplacent pas des outils tels que les dictionnaires et les glossaires, mais fournissent une méthode supplémentaire de traitement des textes pour la traduction. Ce sont des programmes de traitement de texte qui produisent une liste de toutes les occurrences d'une chaîne de lettres dans un corpus défini dans le but d'établir des modèles qui ne sont autrement pas clairs. Ces lettres peuvent faire partie d'un mot, comme un préfixe ou un suffixe par exemple, ou un mot complet, ou un groupe de mots. Les fonctions spécifiques des concordanciers incluent la présentation de données statistiques sur le nombre de mots ou de propositions, la classification des mots selon leur fréquence ou par ordre alphabétique et, surtout peut-être, l’identification du contexte exact dans lequel ces mots apparaissent. L'information peut être accumulée et stockée à mesure que de plus en plus de textes sont traduits, produisant une base de données disponible pour consultation à tout moment de manière non séquentielle.
Les concordances sont particulièrement précieuses pour traduire des textes spécialisés avec un vocabulaire et des expressions fixes qui ont un sens clairement défini. Elles assurent la cohérence terminologique, offrant au traducteur un meilleur contrôle sur le texte, quelle que soit sa longueur et sa complexité.
Cependant, elles ne sont pas aussi utiles aux traducteurs littéraires, qui sont constamment confrontés à des problèmes liés à l'utilisation polysémique et métaphorique du langage.
Néanmoins, certains traducteurs littéraires utilisent des concordances car elles ont clairement un rôle potentiel dans tous les types de traduction.
Textes bilingues en ligne
Un corpus bilingue se compose normalement d'un texte source plus sa traduction, préalablement effectuée par des traducteurs humains. Ce type de document, qui est stocké électroniquement, est appelé un bi-texte. Il facilite les traductions ultérieures en fournissant des solutions prêtes à l'emploi pour les expressions fixes, automatisant ainsi une partie du processus.
La croissance du marché de la traduction a conduit à un intérêt accru de la part des entreprises et des organisations internationales pour les collections de textes ou de corpus dans différentes langues stockées systématiquement en ligne et disponibles pour consultation immédiate.
Mémoires de traduction
Les mémoires de traduction représentent l'une des applications les plus importantes des textes bilingues en ligne, remontant au début des années 1980 avec le système pionnier TSS d'ALPS, qui deviendra plus tard Alpnet. Cela a été suivi au début des années 90 par des programmes tels que Translator Manager, Translator's Workbench, Optimizer, Déjà Vu, Trados et Eurolang, entre autres. Dans sa forme la plus simple, une mémoire de traduction est une base de données dans laquelle un traducteur stocke des traductions pour une réutilisation future, soit dans le même texte, soit dans d'autres textes. Fondamentalement, le programme enregistre des paires bilingues : un segment de langue source (généralement une phrase) combiné à un segment de langue cible. Si un segment de langue source identique ou similaire apparaît plus tard, le programme de mémoire de traduction trouvera le segment précédemment traduit et le proposera automatiquement pour la nouvelle traduction. Le traducteur est libre de l'accepter sans changement, de le modifier pour l'adapter au contexte actuel, ou de le rejeter complètement. La plupart des programmes trouvent non seulement des correspondances parfaites mais aussi des segments partiellement correspondants. Cet outil de traduction assistée par ordinateur est le plus utile avec des textes possédant les caractéristiques suivantes :
- Homogénéité terminologique : Le sens des termes ne varie pas.
- Homogénéité phraséologique : Les idées ou actions sont exprimées ou décrites avec les mêmes mots
- Phrases courtes et simples : Celles-ci augmentent la probabilité de répétition et réduisent l'ambiguïté.
Une mémoire de traduction peut être utilisée de deux manières :
- En mode interactif : Le texte à traduire est à l'écran de l'ordinateur et le traducteur sélectionne les segments un par un pour les traduire. Après chaque sélection, le programme recherche dans sa mémoire des segments identiques ou similaires et produit des traductions possibles dans une fenêtre séparée. Le traducteur accepte, modifie ou rejette les suggestions.
- En mode automatique : Le programme traite automatiquement l'ensemble du texte en langue source et insère dans le texte en langue cible les traductions qu'il trouve dans la mémoire. C'est un mode plus utile s'il y a beaucoup de répétitions car il évite de traiter chaque segment dans une opération distincte.
Un programme de mémoire de traduction est normalement composé des éléments suivants :
- Un éditeur de traduction, qui protège le format du texte cible.
- Un localisateur de segments de texte.
- Un outil terminologique pour la gestion des dictionnaires.
- Un système automatique d'analyse pour les nouveaux textes.
- Un outil statistique qui indique le nombre de mots traduits et à traduire, la langue, etc.
Ainsi, les programmes de mémoire de traduction sont basés sur l'accumulation et le stockage de connaissances qui sont recyclées selon les besoins, automatisant l'utilisation de la terminologie et l'accès aux dictionnaires. Lorsque les tâches de traduction se répètent, les mémoires font gagner au traducteur un temps précieux et même un effort physique : par exemple, l'utilisation du clavier peut être réduite de 70 % avec certains textes. Les mémoires simplifient également la gestion de projet et la traduction en équipe en assurant la cohérence. Cependant, les mémoires de traduction ne peuvent traiter un texte que de manière simpliste en termes de segments linguistiques ; elles ne peuvent pas, contrairement au traducteur humain, avoir une vision du texte dans son ensemble en ce qui concerne les idées et les concepts ou le message global. Un traducteur humain peut choisir de réorganiser ou de redistribuer l'information dans le texte source parce que la langue et la culture cibles exigent une relation de contenu différente pour créer la cohérence ou faciliter la compréhension. Un autre inconvénient des mémoires est que le temps de formation est essentiel pour une utilisation efficace et que, même dans ce cas, il faut du temps pour constituer une base de données étendue, c'est-à-dire qu'elles ne permettent pas de gagner du temps immédiatement. Enfin, il convient de souligner que les programmes de mémoire de traduction sont conçus pour augmenter la qualité et l'efficacité du processus de traduction, en particulier en ce qui concerne les textes spécialisés avec un langage non figuratif et des constructions grammaticales fixes, mais ils ne sont pas conçus pour remplacer le traducteur humain.
Conclusion : L'impact des nouvelles
technologies sur les traducteurs. Il a longtemps été sujet de discussion de savoir si la traduction automatique et la traduction assistée par ordinateur pourraient transformer les traducteurs en simples éditeurs, les rendant moins importants que les programmes informatiques. La crainte que cela se produise a conduit à un certain rejet des nouvelles technologies de la part des traducteurs, non seulement en raison d'une possible perte de travail et de prestige professionnel, mais aussi en raison de préoccupations concernant une baisse de la qualité de la production.
Certains traducteurs rejettent totalement la traduction automatique car ils l'associent au point de vue selon lequel la traduction n'est qu'un produit commercialisable de plus basé sur un calcul d'investissement par rapport aux profits. Ils définissent la traduction comme un art qui possède ses propres critères esthétiques qui n'ont rien à voir avec le profit et la perte, mais sont plutôt liés à la créativité et au pouvoir de l'imagination. Cela s'applique principalement, cependant, à certains types de traduction, comme celle des textes littéraires, où la polysémie, la connotation et le style jouent un rôle crucial. Il est clair que les ordinateurs ne pourraient même pas commencer à remplacer les traducteurs humains avec de tels textes. Même avec d'autres types de textes, notre analyse des rôles et des capacités de la TA et de la TAO montre qu'aucune n'est suffisamment efficace et précise pour éliminer la nécessité des traducteurs humains. En fait, la soi-disant traduction automatique serait plus précisément décrite comme une traduction assistée par ordinateur également. Les traducteurs devraient reconnaître et apprendre à exploiter le potentiel des nouvelles technologies pour les aider à être plus rigoureux, cohérents et productifs sans se sentir menacés.
Certains se demandent si les nouvelles technologies ont créé une nouvelle profession. On pourrait prétendre que les ressources disponibles pour le traducteur grâce à la technologie de l'information impliquent un changement dans la relation entre le traducteur et le texte, c'est-à-dire une nouvelle façon de traduire, mais cela ne signifie pas que le résultat est une nouvelle profession. Cependant, il y a clairement le développement de nouvelles capacités, ce qui nous amène à souligner un certain nombre d'aspects essentiels de la situation actuelle. Traduire avec l'aide de l'ordinateur n'est certainement pas la même chose que de travailler exclusivement sur papier et avec des produits papier tels que des dictionnaires conventionnels, car les outils informatiques nous fournissent une relation avec le texte qui est beaucoup plus flexible qu'une lecture purement linéaire. De plus, Internet, avec son accès universel à l'information et sa communication instantanée entre utilisateurs, a créé une liberté physique et géographique pour les traducteurs qui était inconcevable dans le passé. Nous partageons la conviction que la traduction n'est pas devenue une nouvelle profession, mais les changements sont là pour durer et continueront d'évoluer. Les traducteurs doivent accepter les nouvelles technologies et apprendre à les utiliser à leur plein potentiel comme moyen d'augmenter la productivité et d'améliorer la qualité.
Références
ARNOLD, Doug, BALKAN, Lorna et al. Traduction automatique : Un guide introductif. URL : http://clwww.essex.ac.uk.MTbook/HTML/ (consulté le 13 mai 2002).
BEDARD, Claude. Ce qu'il faut savoir sur les mémoires de traduction. URL : www.terminotix.com/Terminotixfr/info/art_5html (consulté le 17 juin 2002).
BERTRAND-GASTALDY, Suzanne. La traduction automatique ou assistée par ordinateur. URL : www.esi.umontreal.ca/~moalv/blt 6134/index.html (consulté le 6 juin 2002).
CHAMPOLLION, Yves. Traduction automatique (TA et avenir de l'industrie de la traduction). URL : http://accurapid.com/journal/15mt.htm (consulté le 2 mai 2002).
DELISLE, Cynthia. La traduction automatique : espoirs ou déboires ? URL : www.cafi.org/colloques/compterendumard-2000.html (consulté le 14 juin 2002).
DISTRIBUTED LANGUAGE TRANSLATION (DLT)www.fb10.uni-bremen.de/linguistik/khwagner/mt/ppt/DLT.ppt (consulté le 19 oct. 2003).
HUTCHINS, W. John. Traduction Technology and the Translator.URL : www.bcs.org.uk/siggroup/nalatran/nalamtr7/nalamt76.htm (consulté le 9 mai 2002).
HUTCHINS, W. John. Systèmes et outils de traduction assistée par ordinateur. URL : www.eamt.org/archive/hutchins_intro.html (consulté le 8 juillet 2002).
HUTCHINS, W. John. L'état de la traduction automatique en Europe et perspectives d'avenir. URL : www.hltcentral.org/page (voir l’article en anglais)
RICO PEREZ, Celia. New Trends in Machine Translation, Meta, XLII, 4, 1997. URL : www.erudit.org/erudit/meta/v42n 04 (consulté le 9 mai 2002).
RICO PEREZ, Celia. From Novelty to Ubiquity : Computers and Translation at the Close of the Industrial Age. URL : http://accurapid.com/journal/15mt2.htm (consulté le 9 mai 2002).
RICO PEREZ, Celia. Universals of Language, Sublanguage and Artifi cial Languages : May the Machine Compete with the Translator? URL : www.ccl.umist.ac.uk/events/conference/multimedia1.htm (consulté le 18 mai 2002).
ROSEN, Mariam et TSAO, Claude. Demain, la traduction automatique. URL : www.mondediplomatique.fr/mav/Internet/ROSEN/traduction.html (consulté le 19 juillet 2002).
SAMUELSON-BROWN, G. A Practical Guide for Translators (2nd Ed.). Londres : Multilingual Matters Ltd, 1995.
SEVERINI, Alfiero. Mise au point d'un système de traduction automatique italien-français. Université Paris 13, 2001. Traduction—terminotique -Lexicographie. URL : http://www.owil.org/traduc.htm (consulté le 28 juillet 2002).
TRUJILLO, A. Translation engines: techniques for machine translation. Londres : Springer, 1999. URL : http://www.ccl.umist.ac.uk/staff/iat/transeng (consulté le 30 sept. 2003).
TRUJILLO, A. Estrategias de traducción automática.
URL : http://www.imim.es/quark/num19/019053.htm (consulté le 13 oct. 2003).
ZIMINA, Maria. Alignement de textes bilingues par classification ascendante hiérarchique. URL : http://www.cavi.univ-paris3.fr/lexicometrica/jadt/jadt20 00/pdf/77/77.pdf (consulté le 3 août 2002).
Auteur : Olivia Craciunescu
E-mail : olivia_craciunescu@yahoo.com
Auteur : Constanza Gerding-Salas
E-mail : cgerding@udec.cl
Auteur : Susan Stringer-O’Keeffe
E-mail : sstringer@udec.cl
Source : http://www.translationdirectory.com (voir l’article en anglais)
Ces articles pourraient vous intéresser :

Ajouter un commentaire