Une approche pratique du travail terminologique
1. Introduction
Le présent document vise à être une proposition pratique pour le travail terminologique basée sur l'expérience pratique, ayant pour scénario un traducteur individuel ou une petite équipe de traducteurs. La terminologie est l'une des tâches les plus chronophages impliquées dans un projet de traduction. Pour relever le défi que pose la terminologie aux traducteurs, il est nécessaire non seulement de connaître un ensemble d'outils appropriés, mais aussi de garder à l'esprit des stratégies qui permettront de livrer le travail à temps et dans le budget de temps du traducteur.
Il est important de prendre en compte que la recherche et la gestion de la terminologie sont deux tâches spécialisées, qui justifient pleinement le rôle des traducteurs en tant que rédacteurs techniques par rapport aux spécialistes du sujet. Pour un examen de l'importance des ressources linguistiques dans la profession de traducteur, voir Yuste (2002). Si nous nous limitons à un domaine particulier de connaissance
(par exemple, la médecine), nous ne pouvons pas nous attendre à ce qu'un spécialiste connaisse tous les aspects de son domaine de connaissance. Les traducteurs doivent être spécialisés, mais l'objectif important est qu'ils aient la compétence pour enquêter et traiter tout texte lié au domaine de leur spécialisation grâce à leurs capacités de documentation et de recherche terminologique.
Ce document s'adresse aux nouveaux venus dans la profession et aux traducteurs expérimentés souhaitant réviser leurs stratégies de recherche terminologique. Les exemples pratiques illustrés dans ce document utiliseront
la combinaison linguistique anglais-espagnol.
2. OUTILS DE RECHERCHE TERMINOLOGIQUE
Sources primaires : Textes parallèles et spécialistes
Une source primaire (SP) est fondamentalement tout type de texte oral ou écrit original produit par un locuteur natif. Des exemples de sources primaires sont les manuels, les journaux, la documentation technique, les livres de fiction, les sites Web, etc. Le travail terminologique utilisant des sources primaires se concentrera sur la recherche de contextes où la terminologie de la langue source (LS) est utilisée dans le texte de la langue cible (LC).
Traditionnellement, les livres imprimés ont été la principale ressource des SP. De nos jours, les copies électroniques et principalement Internet modifient la nature des SP, et ce changement est encore plus important pour le travail terminologique effectué lors d'un projet de traduction. Notez que le traitement des données électroniques permet d'utilisation des applications logicielles pour gérer rapidement et automatiquement d'énormes lots de données
(par exemple, extraction automatique de terminologie, recherches rapides de termes, etc.). Comme l'objectif de ce document est d'être un guide pratique pour les traducteurs professionnels, nous considérerons les plus grandes bases de connaissances actuelles disponibles à portée de main des traducteurs, c'est-à-dire les moteurs de recherche Internet. Veuillez consulter la section 5, Utilisation des ressources basées sur Internet pour plus d'informations.
Une SP polyvalente et importante est la connaissance accumulée par les spécialistes du domaine. Tout traducteur compétitif qui vise à être un véritable spécialiste dans un domaine spécifique devrait avoir un ensemble de spécialistes liés à son domaine de spécialisation disponibles pour consultation. Atteindre cet objectif peut être vu comme un signe de maturité en tant que traducteur spécialisé et, en aucun cas, un coup de chance ; les médecins, les avocats compétents, les ingénieurs ou tout autre professionnel hautement spécialisé et bien informé sont généralement trop occupés et bien payés pour établir une relation d'affaires mutuellement bénéfique avec les traducteurs. Peut-être que le traducteur devrait chercher des professionnels retraités qui pourraient être adaptés et disposés à être le soutien spécialisé aux traducteurs. De plus, nous devons évaluer et vérifier la terminologie qu'un professionnel particulier peut utiliser ; souvent, le principe d'économie du langage fait que les professionnels s'éloignent des termes plus formels et standardisés dans le langage écrit, qui sont les plus appropriés pour la traduction.
Sources secondaires : Dictionnaires et glossaires (copie papier, copie électronique et Internet)
Les sources secondaires sont essentiellement des dictionnaires et glossaires monolingues et bilingues. Ils peuvent être trouvés dans leurs versions papier, électronique ou en ligne. Une source secondaire complète et orientée vers la qualité est le rêve de tout traducteur. Ils peuvent rendre la recherche terminologique vraiment facile.
De nos jours, nous trouvons des éditeurs qui publient des dictionnaires dans les différents formats mentionnés ci-dessus. Par exemple, nous pouvons trouver l'Encyclopædia Britannica en ligne (www.britannica), sur CD ou dans sa version papier traditionnelle. Même si nous pensons que les livres imprimés sont romantiques, la réalité est qu'une recherche de terme dans la version électronique ou en ligne d'un dictionnaire est beaucoup plus rapide. En tant que professionnels, nous devons considérer cela comme un facteur très pertinent.
Que ce soit en utilisant une source primaire ou secondaire, il est important de considérer leur fiabilité. Nous devons souligner ici que les publications imprimées seront normalement mieux classées lorsqu'il s'agit de considérer la fiabilité de la source. Ce n'est pas un critère fixe car il existe d'excellentes ressources disponibles en format électronique et, en même temps, il existe de mauvaises publications imprimées qui peuvent être le résultat d'un mauvais travail de traduction ou d'une compilation terminologique de mauvaise qualité. De plus, nous trouvons de plus en plus de données reproduites en versions électroniques et papier. Les critères de base pour évaluer la fiabilité d'une source sont :
¾ Réputation de l'auteur
(bien connu, spécialiste, fiable)
- Type de publication (magazine spécialisé, thèse, documentation technique originale...)
- Si la source est originale ou une traduction
- Prestige de l'éditeur (institutions publiques, universités...). Le tableau suivant présente la liste de vérification CARS de Harris (Harris, 1997), qui peut nous aider à évaluer plus en profondeur les ressources trouvées sur le Web
Crédibilité
Source fiable, références de l'auteur, preuve de contrôle de qualité, autorité connue ou respectée, soutien organisationnel. Objectif : une source faisant autorité, une source qui fournit de bonnes preuves permettant de lui faire confiance.
Exactitude
À jour, factuel, détaillé, exact, complet, le public et le but reflètent les intentions de complétude et d'exactitude. Objectif : une source qui est correcte aujourd'hui (pas hier), une source qui donne toute la vérité.
Raisonnabilité
Équitable, équilibré, objectif, raisonné, pas de conflit d'intérêts, absence de sophismes ou de ton biaisé. Objectif : une source qui aborde le sujet de manière réfléchie et raisonnable, soucieuse de la vérité.
Soutien
Sources listées, informations de contact, corroboration disponible, revendications soutenues, documentation fournie. Objectif : une source qui fournit des preuves convaincantes pour les affirmations faites, une source que vous pouvez trianguler (trouver au moins deux autres sources qui la soutiennent).
3. UN MODÈLE DE GESTION TERMINOLOGIQUE
Lorsqu'on aborde le travail terminologique d'un point de vue professionnel, il y a un équilibre quelque peu compliqué entre le temps et
la qualité. En tant que professionnels cherchant à maintenir, élargir ou améliorer notre éventail de clients, nous ne pouvons livrer que de la qualité mais, en même temps, nous devons livrer cette qualité compétitive dans un délai raisonnable et rentable. Pour atteindre cet objectif, il y a certains points que nous devons prendre en compte lors de la réalisation d'un travail terminologique dans tout projet de traduction :
- Si le développement d'un glossaire vaut l'effort
- Extraction automatique de terminologie versus extraction humaine traditionnelle
- Établir des priorités
- Stratégies pour surmonter l'incertitude terminologique
- Récupération de la terminologie
3.1 Si le développement d'un glossaire vaut l'effort
Selon la nature du projet de traduction et notre client, nous pouvons estimer que le temps investi dans la création d'un glossaire sera rentable dans de futures missions ou dans le même projet, non seulement en ce qui concerne le temps de recherche terminologique mais aussi en qualité grâce à la cohérence et à l'exactitude. En règle générale, si nous avons une relation à long terme avec notre client ou si nous la recherchons, la création d'un glossaire sera un facteur clé pour rendre un travail de qualité et rentable. D'autre part, si la traduction doit être effectuée par une équipe de traducteurs, signifiant que nous traitons un grand projet, la création d'un glossaire sera fortement recommandée pour économiser le temps requis pour le projet en évitant les recherches de termes redondantes et pour fournir une plus grande cohérence.
La création d'un glossaire sera tout aussi importante si nous envisageons de traduire en utilisant un système de traduction automatique. La plupart de ces applications nous permettront de créer un dictionnaire personnalisé qui sera utilisé pendant la traduction. Comme décrit par Kübler (2002), cette méthode peut produire des résultats de bonne qualité.
3.2. Extraction automatique de terminologie versus extraction humaine traditionnelle
Une fois que nous avons décidé de créer un glossaire, il existe au moins trois approches différentes pour la compilation de la liste de termes de la LS : extraction automatique de terminologie, extraction humaine de terminologie avant ou extraction humaine de terminologie pendant la traduction.
Extraction automatique de terminologie
C'est une technologie qui est un bon candidat pour devenir une norme dans l'industrie. L'extraction automatique de terminologie est basée sur les principes de la linguistique de corpus, c'est-à-dire l'étude de la langue reposant sur de grandes bases de données textuelles (ou corpus) à l'aide d'applications logicielles. Cela permet une approche statistique de la langue à travers l'étude des fréquences de mots et des modèles de concordance, entre autres variables.
Les applications d'extraction terminologique utilisent généralement les fréquences de mots pour proposer une liste de mots candidats. Le principe est simple : si un terme est répété plusieurs fois dans un texte, il peut être un terme spécifique à ce domaine particulier. Après cette sélection automatique de termes potentiels, le traducteur doit la parcourir et sélectionner les termes qu'il considère comme pertinents pour être inclus dans le glossaire.
Cette technologie est loin de fournir des résultats exacts. Par exemple, des termes pertinents peuvent avoir une faible fréquence et ne seront donc pas inclus dans la liste des candidats. Le fait est que pour les grands projets, cela pourrait être un gain de temps important. Une application commerciale utilisant ce principe de base est par exemple TerminologyExtractor ou Trados Term Extract. Ce dernier propose une fonction pour les termes d'exclusion (par exemple, les termes déjà stockés dans une base de données MultiTerm). Termight, un autre outil d'extraction terminologique, utilise des étiqueteurs et un ensemble de modèles syntaxiques définis par des expressions régulières pour identifier les termes et expressions candidats. Il propose également une interface montrant la concordance des termes pour aider l'utilisateur à décider si un mot doit être considéré comme un terme.
Cette approche devrait être sérieusement envisagée si nous nous occupons de grands projets car elle aidera à livrer rapidement un glossaire à une équipe de traducteurs. L'inconvénient d'avoir certains termes laissés de côté du glossaire peut être géré en incluant ces termes pendant la traduction. Dans tous les cas, ces termes ne sont probablement pas d'un grand impact en raison de leur faible fréquence.
Extraction humaine de terminologie avant traduction
C'est la pratique actuelle et consiste à lire le document à traduire, en se concentrant sur les tableaux, les figures, les index, les tables des matières et d'autres éléments de texte clés afin d'établir quels termes sont de bons candidats (Dagan et Church, 1994). Comme cela se produit avec l'extraction automatique, cette approche peut être défectueuse en raison d'erreurs humaines, nous pouvons donc également nous attendre à ce que certains termes soient laissés de côté du glossaire. L'avantage de cette approche traditionnelle est que le traducteur aura le contexte disponible à tout moment, ce qui peut être un facteur clé pour décider de la pertinence d'un mot à ajouter au glossaire. Notez que certaines applications d'extraction terminologique automatique offrent des solutions pratiques pour rendre le contexte disponible. Un inconvénient de cette méthode est qu'elle est très chronophage par rapport à l'approche automatique. Malgré cela, nous pouvons supposer que cette méthode sera valable pour des projets relativement petits car l'extraction automatique de terminologie devrait être plus efficace lorsqu'il s'agit de grands projets.
Un conseil pratique pour minimiser le temps nécessaire pour créer un glossaire monolingue lors de l'utilisation d'un traitement de texte est de créer une macro (ainsi appelée dans MS Word) qui copie et colle automatiquement le mot ou l'expression sélectionné dans un tableau créé dans un autre fichier. De cette façon, nous évitons la tâche distrayante et chronophage de copier et coller ou de taper entrée par entrée.
Que ce soit avec cette approche ou en utilisant certains des outils d'extraction terminologique automatique existants sur le marché, nous devrons établir des stratégies pour exclure de notre liste de termes ceux que nous avons déjà dans une base de données de termes existante. Une procédure possible serait de rechercher tout terme individuel dans la base de données. Une méthode moins chronophage consiste à copier et coller les termes candidats mis en évidence d'un tableau dans un autre tableau contenant tous les termes de la base de données. Si nous trions ce tableau par ordre alphabétique, nous pourrions facilement discerner les termes redondants.
Extraction humaine de terminologie pendant la traduction
Une autre option possible est d'introduire des termes dans le glossaire en même temps que nous effectuons la traduction. Je n'ai pas trouvé d'étude empirique comparant les ratios de mots de traduction pour évaluer la productivité incluant la terminologie lors de la création du glossaire avant ou pendant la traduction. Nous pouvons supposer que lors de la création de glossaires bilingues avant la traduction, les difficultés pour apporter certaines solutions peuvent être plus grandes ou plus chronophages car le traducteur aura généralement une compréhension plus superficielle du terme, mais, lors de la traduction, nous aurons moins d'interruptions dues aux recherches terminologiques qui peuvent aider à mieux se concentrer et à produire des traductions plus cohérentes.
D'autre part, la création de glossaires pendant la traduction nous aidera à produire directement des glossaires bilingues avec une connaissance plus approfondie du contexte. En utilisant de nombreux outils de traduction mémoire disponibles dans le commerce (par exemple, Start Transit, SDLX ou la dernière version de Trados), il sera relativement facile d'ajouter un nouveau terme à une base de données de termes existante, en vérifiant simultanément si ce terme a déjà été collecté. Notez que même en utilisant l'extraction terminologique automatique ou l'extraction humaine avant les stratégies de traduction, l'utilisation de cette fonctionnalité d'extraction de termes en cours est très probable. Dans tous les cas, l'utilisation de l'extraction humaine de terminologie pendant la traduction est déconseillée si nous nous occupons d’un grand projet impliquant une équipe de traducteurs, car nous ne pouvons pas garantir la cohérence des termes et cela devra être vérifié minutieusement par la suite.
3.3. Établir des priorités
Idéalement, nous rechercherons une liste de termes pour résoudre tout le travail terminologique jusqu'à ce que nous soyons pleinement documentés et satisfaits des résultats. Cela signifie que nous pouvons faire une recherche de quatre heures pour un seul terme, selon l'efficacité de notre recherche et les ressources disponibles (nous pouvons avoir besoin de visiter certaines bibliothèques ou d'attendre de contacter un spécialiste fiable). Mais souvent, le travail est déjà en retard avant même d’avoir commencé ; ainsi, définir clairement les priorités de recherche constitue un moyen pertinent d’obtenir les meilleurs résultats possibles dans un délai restreint. Voici quelques lignes directrices qui peuvent aider à juger quels termes devraient être considérés comme les plus importants :
- Termes apparaissant dans un index, un glossaire de contenus, des titres et d'autres éléments de texte pertinents
- Termes répétitifs
- Termes que nous estimons être des formules établies et fixes dans la LC dans une industrie, indépendamment de la fréquence ou de l'endroit où ils apparaissent.
Par exemple, il semble assez évident qu'un nom de produit dans un manuel d'instructions aura une priorité maximale. Il est probable que ce terme apparaisse dans le titre des publications et que la fréquence d'occurrence dans le texte soit assez élevée ; il est également très probable que le terme ait une solution de traduction standard dans la LC.
D'autre part, lorsqu'on traite de la terminologie, nous pouvons trouver des termes qui ne sont pas cohérents dans leur utilisation dans la LC dans un domaine spécifique de connaissance. Lorsqu'on est confronté à ces termes (et les reconnaître nécessite parfois l'intuition d'un traducteur expérimenté), nous pouvons les traduire avec une solution qui transmet le sens et semble naturelle, économisant le temps de consulter un dictionnaire ou de rechercher dans des textes parallèles. D'autre part, nous devons reconnaître ces termes dont l'utilisation peut être bien standardisée dans un jargon spécialisé particulier et qui nécessiteront une recherche terminologique exhaustive.
3.4. Stratégies pour surmonter l'incertitude terminologique
Dans la profession de traducteur, un travail doit souvent être livré au client mais certains termes peuvent ne pas avoir été résolus de manière satisfaisante. Cela entraîne différents scénarios et nécessite différentes stratégies :
- Scénario 1 : Le terme est bien compris mais aucune solution validée (via une source primaire) n'a été trouvée. Stratégie : Paraphraser ou utiliser un terme naturel, en s'assurant qu'il sera compris par le lecteur cible.
- Scénario 2 : Le terme n’est pas compris et aucune solution validée n’a été trouvée. Nous devrions faire tous les efforts possibles pour éviter de telles circonstances, mais tout traducteur expérimenté sera tôt ou tard confronté à cette situation compromettante. Stratégie : 1) Traduction littérale ; Malheureusement, le marché est inondé de traductions douteuses qui sont enclin à être littérales, évitant la responsabilité et l'effort de comprendre le texte de la LS et de standardiser l'utilisation de ces calques ou traductions empruntées ; en dehors de cela, c'est aussi la tendance parmi les spécialistes d'utiliser des termes hautement techniques créés dans une LS (bien sûr, c'est particulièrement vrai pour les traductions de l'anglais, en raison de l'utilisation de cette langue comme lingua franca). Ainsi, les chances d'être compris par le lecteur cible sont élevées, surtout si l'on traduit pour un public spécialisé. Selon le type de texte, il peut être acceptable de mettre le terme de la LC entre parenthèses, afin d'élargir nos chances d'être compris, car il peut y avoir des cas où le lecteur cible connaît la terminologie dans la LC (par exemple, ce sera le cas si l'on traduit un magazine de logiciels de l'anglais vers l'espagnol) ; 2) Sous-traduction ; Cette solution peut être rendue lorsque le terme n'a pas été entièrement compris mais que, en raison du contexte, il peut être classé comme un terme appartenant à une certaine catégorie. Par exemple, si nous savons que le terme spécifique est un outil, il y aura des occasions où une telle sous-traduction fonctionnera car le contexte fournira au lecteur cible la représentation ou le sens du terme spécialisé que nous évitons de mal traduire.
3.5. Bases de données terminologiques
Une fois que nous avons un glossaire bilingue, nous devons réfléchir à un moyen de récupérer les termes lorsque nous en avons besoin. En tenant compte du fait que la traduction littéraire peut représenter 2 à 3 % du marché de la traduction, je crois que les traducteurs devraient posséder l'un des programmes de mémoire de traduction commerciale actuels qui amélioreront les performances dans la plupart des projets de traduction. Les mémoires de traduction sont un outil efficace pour gagner en cohérence et gagner du temps. Elles sont une banque de données de mots de toutes les traductions précédentes qui peuvent ensuite être réutilisées ou où des termes déjà traduits peuvent être recherchés. Mais le point important concernant le travail terminologique est que les MT sont intégrées avec des bases de données terminologiques. Cette intégration permet une fonctionnalité dans les MT qui reconnaît automatiquement les termes stockés dans notre base de données. Ainsi, pendant que nous traduisons, nous aurons une fenêtre où les termes déjà trouvés dans la base de données terminologique seront affichés. Ci-dessous, j'ai inséré une capture d'écran montrant comment cela est présenté dans Trados WorkBench : Dans le coin inférieur gauche de cette capture d'écran apparaît la fenêtre de reconnaissance terminologique, qui apparaîtra lorsque les termes seront détectés dans un nouveau segment ouvert (boîte bleue) et existant dans le fichier de base de données ouvert.
Cette fonctionnalité est un pas en avant dans la gestion terminologique. La méthode traditionnelle implique au mieux une recherche automatique utilisant la fonction Rechercher pour localiser un terme dans un glossaire produit avec un traitement de texte ou un tableur. Cette méthode de recherche terminologique dans un glossaire s'avère plus chronophage que la fonctionnalité de reconnaissance automatique offerte par les applications de mémoire de traduction actuelles, non seulement parce qu’elle exige de copier-coller ou de saisir manuellement le terme à rechercher, mais aussi parce qu’il arrive que l’on consacre du temps à chercher un terme en pensant qu’il figure dans le glossaire, pour finalement constater qu’il n’y est pas.
Par ailleurs, la fonctionnalité de reconnaissance terminologique des applications de MT permet d’effectuer des recherches floues. Cela signifie que si un mot dans le glossaire ou dans le texte source est mal orthographié, le programme recherchera toujours des termes très proches des mots mal orthographiés, assurant qu'ils seront reconnus ou que les noms pluriels seront détectés si l'entrée dans le glossaire était la forme singulière.
Normalement, nous pourrons facilement importer notre glossaire d'un traitement de texte ou d'une feuille de données dans la base de données terminologique, bien que nous devions convertir le fichier du glossaire en un fichier .txt et effectuer quelques modifications. Notez que les bases de données terminologiques intégrées aux applications MT sont des produits sophistiqués. Cela signifie que nous pouvons créer un nombre beaucoup plus grand de champs (y compris des graphiques) que notre approche pratique ne le suggérera.
4. UN MODÈLE DE RECHERCHE TERMINOLOGIQUE
Selon l'étape à laquelle nous décidons de créer le glossaire, nous pouvons avoir une liste de termes que nous devons comprendre et traduire. Nous supposerons que la décision a été de créer le glossaire avant la traduction, auquel cas nous pouvons procéder comme suit :
- Contexte : Une fois que nous avons isolé le terme dans un glossaire, nous pouvons avoir besoin de revenir à ce terme dans son contexte. Pour ce faire, nous pouvons simplement effectuer une recherche sur le document électronique avec lequel nous travaillons. Si le projet est composé de plusieurs fichiers, il est conseillé de trouver un moyen de revoir le contexte avec une recherche unique. Par exemple, si nous avons un lot de fichiers texte, nous pourrions créer un fichier avec tout le contenu. Au fur et à mesure que nous procédons à rendre une traduction pour les différentes entrées du glossaire, il est important de pouvoir accéder au contexte des termes de la liste pour déterminer dans quel sens le terme est utilisé dans le texte de la LS.
- Comprendre le terme de la LS : Il est clair que, pour proposer la meilleure solution possible et éviter toute erreur d’interprétation, il est indispensable de comprendre le terme employé dans la LS. Il existe essentiellement trois approches pour cela : a) dictionnaires généraux, dictionnaires spécialisés et glossaires monolingues, b) source primaire écrite de la LS, et c) consultation de spécialistes. Notez qu'il sera possible de prendre une définition d'un terme applicable à notre contexte, car nous pouvons accéder à ce contexte pour déterminer quelle définition s'applique.
- Trouver une traduction : Ici, nous trouvons à nouveau trois façons possibles de fournir une solution : a) dictionnaires généraux bilingues, dictionnaires spécialisés bilingues et glossaires bilingues, b) source primaire écrite de la LC, et c) consultation de spécialistes. Notez que lors de la recherche d'une solution dans une source secondaire, nous devrons valider cette solution dans une source primaire. Il n’est pas rare que nous soyons confrontés à une impasse, les ressources disponibles ne proposant aucune solution fiable, souvent parce que le terme en question n’a pas encore été rendu dans la LC. Veuillez consulter la section Stratégies pour surmonter l'incertitude terminologique.
- Saisie d'informations dans le glossaire : Nous devrons entrer dans le glossaire toutes les informations que nous avons trouvées. Je suggérerais de créer des champs optionnels dans le glossaire tels que contexte, définition et éléments non verbaux.
Idéalement, au moins ces champs devraient être insérés dans un glossaire, mais la réalité est que pour de nombreux professionnels, cela prend trop de temps pour être rentable. Néanmoins, il sera judicieux de créer ces champs pour les termes qui peuvent être jugés particulièrement compliqués, pertinents ou répétitifs. Parfois, nous pouvons constater que le même mot est utilisé comme terme technique avec des significations différentes, et éventuellement des traductions différentes, nous avons donc besoin d'une définition ou d'un contexte pour faire une distinction. D'autre part, si le glossaire créé sera utilisé par une équipe, il sera raisonnable d'ajouter le maximum d'informations possible.
Ces quatre étapes de base sont souvent interconnectées et, selon les circonstances individuelles, peuvent être effectuées complètement ou partiellement et dans un ordre différent. Cela sera toujours justifié tant qu'une solution optimale est atteinte dans le plus court délai possible.
5. UTILISATION DES RESSOURCES BASÉES SUR INTERNET
Cette section présentera un ensemble de ressources pratiques que nous pouvons trouver sur Internet. Suivant l'esprit de ce document, cette section ne vise pas à être une présentation exhaustive des ressources basées sur le Web et des stratégies possibles ; au lieu de cela, elle cherche à être une vue informative et stimulante du type de ressources que nous pouvons trouver sur le Web.
Sur Internet, nous pouvons trouver un grand nombre de toutes sortes de ressources décrites dans la section 2. Internet nous donne accès à une telle variété de ressources que le traducteur doit faire preuve de prudence pour ne pas se perdre dans cette myriade de données. Gagner du temps en livrant de la qualité est l'objectif, nous devrons donc nous concentrer sur les ressources qui donnent les meilleurs résultats. La plupart des traducteurs expérimentés sélectionneront finalement les ressources qu'ils ont trouvées les plus utiles.
Un point très pratique à garder à l'esprit lors de l'utilisation d'Internet est le type de connexion que nous avons. Notez qu'une connexion par modem peut être 5 à 10 fois plus lente qu'une connexion par câble ou ADSL, ce qui se reflète directement dans le nombre de recherches que l'on peut effectuer par heure selon le type de connexion.
Les moteurs de recherche et les annuaires nous aideront à localiser les pages Web qui peuvent contenir les informations qui nous intéressent. Les annuaires (comme Yahoo!) classent les sites Web en catégories ; bien que cela puisse être un moyen efficace de localiser des informations, les moteurs de recherche sont un outil plus rapide et plus complet à cette fin. Il existe une large gamme de moteurs de recherche que nous pouvons utiliser : Google, Yahoo, AltaVista, Lycos, MSN,
Excite, HotBot, LookSmart, AOL, WebCrawler, InfoSeek et bien d'autres. Beaucoup d'entre eux ne seront qu'un changement d'interface mais rendront les mêmes recherches, par exemple les recherches Yahoo! sont basées sur les algorithmes de Google ; MSN et AOL sont alimentés par Inktomi (le deuxième générateur de trafic Internet), HotBot nous donne la possibilité d'utiliser Inktomi, Google ou Teoma pour effectuer une recherche. Comme dit précédemment, on peut facilement se perdre face à cette variété d'options. J'ai commencé à chercher avec Yahoo!, j'ai changé pour Altavista et finalement je suis resté avec Google. Google a gagné beaucoup de parts de marché des moteurs de recherche, malgré son apparition dans l'industrie bien après Yahoo! ou Altavista. En fait, maintenant Yahoo! est alimenté par Google, et Altavista a perdu beaucoup de surfeurs au profit de Google. Le fait est que les algorithmes de Google semblent offrir des recherches plus pertinentes, en plus d'avoir l'une des plus grandes bases de données de sites Web et de permettre des recherches avancées sophistiquées. Ci-dessous, une vue des différentes options pour effectuer des recherches avancées avec Google. Vous accédez à cette fenêtre en allant sur www.google.com et en cliquant sur le lien appelé « Recherche avancée ». Veuillez lire l'écran pour vous familiariser avec ces options.
Bien que toutes les options puissent être pratiques lors d'une recherche, voici un résumé de celles qui sont le plus généralement utilisées. Notez que pour effectuer des requêtes plus rapides, Google donne la possibilité de taper dans la boîte de recherche principale certains codes d'options de recherche, nous évitant ainsi d'avoir à aller sur la page de recherche avancée. L'utilisation de ces codes est fortement recommandée pour minimiser encore le temps de recherche.
Chaque fois que nous effectuons une recherche avec Google en entrant plus d'un mot, Google trouvera des pages qui contiennent au moins tous les mots tapés, ne considérant pas pour la recherche des mots très courants tels que « le », « de », « est », « sont » et autres.
Code : +
Ce code sera utile lorsque nous voulons qu'un mot très courant soit inclus dans la recherche. Par exemple, lorsqu'un acronyme est orthographié comme un mot très courant
(par exemple, CA peut signifier Chiffre d’affaire ou AN pour Assemblée nationale).
La capture d'écran suivante illustre une recherche avec 4 mots en anglais, « as », « in », « associate » et « science ». Comme nous avons introduit le code + avec « as » et « in », Google prendra en compte ces mots lors de la recherche, et comme nous avons introduit « associate » et « science », il est probable que nous obtenions des pages où « AS » signifie « Associate in Science ».
Code : - Lorsque nous utilisons ce code, nous obtiendrons des pages où les mots codés avec - n'apparaîtront pas. Cela peut être utile lorsque nous obtenons un grand nombre de pages et que nous voulons affiner davantage la recherche. En examinant la capture d’écran des pages Internet ci-dessus, nous verrons que nous avons obtenu des recherches avec « of », ce qui perturbe la qualité dans notre recherche. Avec le code -, nous pouvons nous débarrasser de ce mot très courant dans notre recherche et obtenir ainsi une réponse plus pertinente. Comme nous le verrons maintenant dans la capture d'écran suivante, les quatre premières recherches montrent « Associate in Science », alors qu'avant nous n'avions que deux pages avec ce modèle de mot.
Code : « »
C'est probablement l'une des options de recherche les plus utiles que nous ayons dans Google. En fait, nous trouvons cette option dans la plupart des moteurs de recherche. Elle est très utile pour valider des expressions ou rechercher des contenus Web spécialisés. Par exemple, dans l'exemple éducatif fourni ci-dessus, nous pourrions simplement entrer une recherche en utilisant des guillemets tels que « associate in science (AS) » comme le montre cette capture d'écran : L'utilisation de guillemets nous donne la possibilité de rechercher des définitions, que nous n'avons peut-être pas trouvées dans un dictionnaire, en les localisant dans des textes spécialisés ou en trouvant des contextes qui nous aideront à inférer une définition. L'exemple suivant illustre ce point : Code : site:domaine
Dans Google, nous pouvons effectuer une recherche dans un seul domaine. Cela peut être utile lorsque nous n'avons pas de glossaire du client mais que nous devons être cohérents avec la terminologie des clients, avec Google et cette fonction, nous pouvons facilement vérifier si un terme est utilisé sur le site Web des clients. Par exemple, nous pourrions vérifier si motherboard est traduit sur le site d'Intel par placa madre ou placa base, deux solutions envisageables. Nous pourrions utiliser cette terminologie en entrant dans la boîte de recherche de Google : site:intel.com « placa base » ; et dans une deuxième recherche, site:intel.com « placa madre ».
Le code site:domaine est très utile pour explorer les différentes variantes d'une langue. Par exemple, si nous traduisons pour un public international, ce qui arrive souvent lors de la traduction en espagnol ou en anglais, nous pouvons avoir besoin de savoir si un terme est utilisé dans un lieu ou a des utilisations différentes dans d'autres variantes. Si nous enquêtons sur le mot computer en espagnol, qui devrait être traduit par computadora pour l'Amérique latine et par ordenador pour l'Espagne, nous verrons que computadora apparaît dans 11 500 pages dans les domaines « .es » (« es » est le domaine régional pour l'Espagne) contre 69 300 pages dans les pages du domaine « .mx » (« mx » est le domaine régional pour le Mexique), d'autre part, ordenador apparaît dans 137 000 pages « .es » contre 4 110 pages « .mx ».
Ce type de contrainte peut être très utile pour trouver des ressources plus pertinentes et fiables. En utilisant le code site:domaine, nous pouvons filtrer de nombreux sites Web, généralement moins fiables que ceux produits par des spécialistes de langue maternelle. Les domaines régionaux sont plus chers, nous pouvons donc nous attendre à plus de qualité dans les pages Web régionales. Un autre exemple, si nous recherchons de la documentation en anglais, est de limiter la recherche aux sites Web en « .edu », qui appartiendront à des institutions d’enseignement supérieur accréditées aux États-Unis.
Code : - site:domaine
Cette option est simplement l'option inversée de la précédente. Il peut y avoir des cas où il est utile de pouvoir éviter les pages d'un domaine spécifié.
Code : OR
En utilisant le code OR, nous obtiendrons des pages qui contiennent l'un des deux mots ou expressions recherchés. Nous pouvons utiliser OR pour rechercher simultanément dans divers domaines. Par exemple, nous pouvons choisir de valider notre terminologie IT en consultant les sites espagnols de trois grands fournisseurs du secteur, tels que Microsoft, Intel et Hewlett Packard, en partant du principe que leur envergure multinationale et leur influence ont contribué à standardiser l’usage de certains termes techniques. La capture d'écran suivante illustre cela : Glossaires et dictionnaires
Sur Internet, nous trouvons un grand nombre de dictionnaires spécialisés disponibles en ligne, surtout si notre LS ou LC est l'anglais. Ici, nous trouvons des dictionnaires en ligne de haute qualité tels que les dictionnaires médicaux de Dorland et Stedman ou What is? et les dictionnaires informatiques CCI.
Une ressource merveilleuse pour trouver des définitions dans des dictionnaires monolingues anglais est Onelook, un portail qui agit comme une passerelle vers 933 dictionnaires en ligne. Nous pouvons nous attendre à ce type de portails dans d'autres langues, et sinon, il est très probable que ce type de solution sera populaire dans quelques années. À ce stade, il n'existe pas de ressource comparable à Onelook pour la langue espagnole.
Les dictionnaires multilingues ou bilingues ne sont pas aussi complets en général. Nous trouvons un exemple pratique de cela en espagnol. Deux bonnes ressources sont Eurodicautom, le dictionnaire officiel de l'UE, et LOGOS, un dictionnaire multilingue mis à disposition sur le Web par la société de traduction du même nom. Onelook offre également la possibilité de rendre des traductions pour des recherches de termes, bien que ce ne soit pas très efficace. Ces sources ne sont pas aussi fiables que des dictionnaires bilingues publiés de qualité. Malheureusement, nous pouvons trouver de très mauvaises traductions dans les dictionnaires en ligne mentionnés. Dans tous les cas, comme nous l'avons dit dans la section 2, les sources secondaires doivent toujours être validées par une SP, d'autant plus si nous traitons de SS trouvées sur Internet.
Un outil impressionnant pour localiser des dictionnaires spécialisés dans un grand nombre de combinaisons linguistiques est Lexicool, qui a indexé plus de 3 000 dictionnaires Internet. La capture d'écran suivante illustre le type de résultats de recherche que nous pouvons obtenir avec Lexicool : En ce qui concerne les glossaires, nous pouvons trouver de nombreux glossaires spécialisés publiés sur le Web par des organisations publiques et privées. Souvent, une recherche avec le terme et le mot « glossaire » peut renvoyer vers une page avec un glossaire et le mot lui-même. Voir l'exemple : Notez que cette recherche a été effectuée uniquement sur des sites Web avec le domaine « .edu » afin d'augmenter nos chances d'obtenir une source fiable.
Sites Web professionnels
De nos jours, il existe un certain nombre de sites Web pour traducteurs offrant aux indépendants et aux agences d'apparaître dans leur annuaire de services (www.proz.com ;
www.gotranslators.com ; www.aquarius.net et bien d'autres). Le principal site Web pour traducteurs est Proz.com, vous y trouverez un grand glossaire de termes saisis par d'autres collègues, en plus vous pouvez poster une requête en temps réel à tous les traducteurs qui acceptent de répondre aux questions. Ce même concept a été mis en œuvre par Aquarius, mais à l’heure actuelle, l'activité terminologique sur Proz.com est beaucoup plus élevée. Les traducteurs sont motivés à répondre car ils marqueront des points pour montrer aux clients potentiels leur expertise, donc les réponses doivent être prises avec prudence et toujours validées.
6. Bibliographie.
Dagan, I. et Church, K. 1994. Termight : identifying and translating technical terminology. In Proceedings of Applied Language Processing, pp. 34-40.
El Hadi, M et al. 2001. The ARC A3 Project: Terminology Acqusition Tools: Evaluation Method and Task. In ACL-2001 Workshop on Evaluation Methodologies from Language and Dialog Systems, pp. 42-51.
Harris, R. 1997. Evaluating Internet Research Sources. Ici http://www.virtualsalt.com/evalu8it.htm
Kübler, N. 2002. Creating a Term Base to Customise and MT System: Reusability of Resources and Tools from the Translator's Point of View. Proceedings of the First International Workshop in Language Resources for Translation Work and Research. Paris : ELRA (European Association for Language Resources).
Yuste, E. 2002. Language Resources and the Language Professional. Par Yuste, E.(.) Proceedings of the First International Workshop in Language Resources for Translation Work and Research. Paris : ELRA (European Association for Language Resources).
Ces articles pourraient vous intéresser :

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.
Ajouter un commentaire