|
|

Technologie linguistique

×

Message d'erreur

  • Deprecated function : Creation of dynamic property EntityTranslationUserHandler::$revisionId is deprecated dans EntityTranslationDefaultHandler->setEntity() (ligne 1013 dans sites/all/modules/entity_translation/includes/translation.handler.inc).
  • Deprecated function : Creation of dynamic property EntityTranslationUserHandler::$revisionId is deprecated dans EntityTranslationDefaultHandler->setEntity() (ligne 1013 dans sites/all/modules/entity_translation/includes/translation.handler.inc).
  • Deprecated function : Creation of dynamic property EntityTranslationUserHandler::$revisionId is deprecated dans EntityTranslationDefaultHandler->setEntity() (ligne 1013 dans sites/all/modules/entity_translation/includes/translation.handler.inc).
  • Deprecated function : Creation of dynamic property EntityTranslationUserHandler::$revisionId is deprecated dans EntityTranslationDefaultHandler->setEntity() (ligne 1013 dans sites/all/modules/entity_translation/includes/translation.handler.inc).
Publié le 04/08/2025

Dans un monde globalisé où la communication multilingue est cruciale, ChatGPT est devenu un outil puissant pour des traductions rapides et rentables. Bien que ses capacités soient impressionnantes, en particulier lorsqu'il s'agit des modèles les plus récents, les traductions prêtes à l'emploi ne répondent pas toujours aux normes professionnelles, en particulier lorsqu'il s'agit de contenus nuancés, de termes techniques ou du maintien de la cohérence.

La bonne nouvelle ? Avec seulement quelques ajustements stratégiques, vous pouvez améliorer de manière significative la qualité et la précision des traductions produites par ChatGPT.

Voici trois façons pratiques d'obtenir de meilleurs résultats lorsque vous utilisez ChatGPT pour des tâches de traduction.

1. Utilisez le dernier modèle (GPT-4o) pour de meilleurs résultats

Toutes les versions de ChatGPT ne sont pas égales. Si votre objectif est la précision de la traduction, optez toujours pour le modèle GPT-4o (disponible pour les utilisateurs de ChatGPT Plus). Cette dernière version offre une gestion nettement améliorée de la grammaire, de la syntaxe, des expressions idiomatiques et du déroulement des phrases dans de nombreuses langues par rapport à GPT-3.5 ou à des modèles antérieurs.

Le modèle GPT-4o est également plus performant en ce qui concerne la conservation du contexte et la cohérence des documents longs. Il est particulièrement performant dans les langues largement parlées comme l'anglais britannique ou américain , l'espagnol européen, le français canadien, l'allemand, le portugais brésilien, l'italien et le néerlandais.

Toutefois, la prudence est de mise lorsque vous travaillez avec des langues qui disposent de moins de ressources, comme le hongrois, le finnois, le thaï, le coréen ou l'arabe, où les résultats peuvent être moins fiables sans l'intervention de l'utilisateur.

2. Fournir un contexte et ajouter un glossaire

ChatGPT se nourrit d'informations contextuelles. Des instructions génériques telles que « Traduis ceci en français » peuvent fonctionner pour des phrases simples, mais la traduction professionnelle doit viser des entrées beaucoup plus détaillées. Avant de demander une traduction, fournissez les informations suivantes :

  • L'objet du contenu (par exemple, une brochure médicale, un contrat juridique, un site web)
  • Le public cible (par exemple, les patients, les ingénieurs, les utilisateurs finaux)
  • Toute préférence de style ou de ton (par exemple, formel, neutre, amical)

En outre, la fourniture d'un glossaire propre à l'entreprise ou d'une liste de termes approuvés peut considérablement améliorer la cohérence terminologique. Pour les secteurs réglementés tels que les soins de santé, la finance ou les services juridiques, cela est particulièrement important.

Exemple :

« Tu es un traducteur professionnel. Traduis le contenu marketing suivant en allemand pour un public général. Utilise un ton amical. Veille à ce que les noms de produits et les termes clés du glossaire ci-joint sont conservés. »

3. Révision et post-édition avec supervision humaine

Même avec des modèles performants et des instructions détaillées, les traductions fournies par ChatGPT ne sont pas exemptes d'erreurs à 100 %. L'orthographe peut être parfaite, mais des changements sémantiques, des expressions idiomatiques mal traduites ou des incohérences de style peuvent se glisser, en particulier dans les documents longs ou les textes hautement spécialisés.

C'est pourquoi la post-édition humaine reste essentielle pour obtenir des résultats de qualité professionnelle. Qu'il s'agisse d'un communiqué de presse, d'un document réglementaire ou d'un manuel technique, demandez à un locuteur natif ou à un expert en la matière de réviser le résultat.

ChatGPT peut même contribuer au processus de révision en signalant les incohérences ou en proposant d'autres formulations.

Conclusion

Vous n'avez pas besoin d'être un expert en langues pour obtenir de bonnes traductions avec ChatGPT. En prenant des mesures supplémentaires, telles que l'utilisation du bon modèle GPT, la présentation du contexte et une révision rapide, vous pouvez passer de résultats ordinaires à des traductions de haute qualité qui semblent naturelles et professionnelles.

Que vous travailliez sur des documents marketing, des e-mails internes ou des informations sur des produits, ces conseils simples vous aideront à tirer le meilleur parti de ChatGPT, rapidement et en toute confiance.

Chez AbroadLink Translations nous allons encore plus loin. Avec notre aiHubLink nous connectons la puissance d’OpenAI aux flux de travail des traducteurs professionnels. Cela signifie que vos traductions peuvent bénéficier non seulement de la rapidité de l'intelligence artificielle, mais aussi de la mémoire de traduction, de la cohérence terminologique et du contrôle de qualité humain. Si vous cherchez à combiner le meilleur des deux mondes (l'intelligence artificielle et la précision professionnelle) contactez-nous pour savoir comment aiHubLink peut rationaliser et améliorer votre communication multilingue.

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 18/06/2025
aiHubLink : Révolutionner la traduction avec l'intégration des LLMs | AbroadLink

aiHubLink, l'application web interne d'AbroadLink qui intègre de manière transparente les Large Language Models (LLMs) dans la gestion des projets de traduction. En couplant les capacités avancées d'IA avec des systèmes de gestion de projet de pointe, aiHubLink nous permet, en tant que prestataire de services de traduction, d'atteindre des niveaux de qualité, d’efficacité et d’adaptabilité sans précédent dans nos processus de traduction.

[TOC]

Processus de traduction améliorés grâce à l'intégration de l'IA

aiHubLink est la pierre angulaire façonnant nos processus de traduction en exploitant les LLMs pour rationaliser les tâches critiques, associant l'IA à l'intervention humaine de manière fluide. Les applications clés incluent :

  • Traduction par IA : Autrefois connue sous le nom de traduction automatique, la traduction par IA maximise la précision et la fluidité, comblant les lacunes linguistiques avec des gains de qualité remarquables par rapport à la technologie précédente (traduction automatique neuronale, connue sous le nom de NMT).
  • Extraction de terminologie : Extraction de termes spécifiques au domaine, garantissant que les traductions restent contextuellement précises.
  • Cohérence terminologique : En exploitant les LLMs, aiHubLink minimise les incohérences dans les projets de traduction, améliorant l'uniformité et la fiabilité.
  • Personnalisation : Des processus de traduction sur mesure répondent aux objectifs spécifiques des clients, adaptant les flux de travail aux exigences individuelles de manière fluide.
  • Assurance qualité linguistique (LQA) : Les fonctionnalités LQA intégrées garantissent que les traductions répondent aux normes les plus strictes en matière de précision linguistique et contextuelle.

Cette combinaison de fonctionnalités non seulement parachève les flux de travail, mais garantit également une qualité optimale dans chaque projet de traduction.

Gestion de la traduction à l'épreuve du temps

L'un des avantages les plus significatifs de aiHubLink est sa connectivité aux LLMs et aux systèmes de gestion de projet via des API. Cette approche stratégique garantit :

  • Adaptabilité rapide : Alors que le paysage de la technologie des LLM évolue, aiHubLink est opérationnel pour intégrer de nouveaux prétendants qui pourraient surpasser les leaders actuels, tels qu'OpenAI.
  • Connectivité multi-modèles : aiHubLink permet des connexions à plusieurs LLMs, permettant des comparaisons, une utilisation de modèles spécifiques de tâches et maximisant leurs forces éprouvées.
  • Croissance et évolutivité : L'architecture flexible de aiHubLink admet l'incorporation fluide de nouvelles capacités et de fonctionnalités étendues, garantissant une pertinence à long terme.

Cette approche dynamique permet à notre entreprise de rester à la pointe des solutions de traduction pilotées par l'IA.

Solutions personnalisées pour des besoins clients uniques

Une autre caractéristique remarquable d'aiHubLink est sa capacité à s'adapter aux besoins spécifiques de nos clients. En intégrant des flux de travail personnalisés, nous fournissons des solutions sur mesure telles que :

  • Modèles spécifiques aux clients : Connection aux LLMs entrainés par nos clients pour relever les défis linguistiques et ceux liés aux spécificités du domaine.
  • Intégration des tâches : Créez des tâches sur mesure répondant aux exigences de traduction, que ce soit pour les industries juridiques, médicales, ou techniques.
  • Collaboration renforcée : Permettre aux clients de jouer un rôle central dans le processus de traduction, renforçant les partenariats et les résultats.

Cette polyvalence garantit que, quelle que soit la complexité du projet ou les exigences du client, aiHubLink se montre à la hauteur.

En conclusion, aiHubLink illustre le mariage des technologies avancées d'IA avec l'excellence opérationnelle, transformant le paysage de la traduction. Avec son adaptabilité, son intégration multi-modèles et son approche centrée sur le client, aiHubLink positionne notre entreprise comme un leader prêt à répondre aux demandes évolutives de l'industrie mondiale de la traduction.

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 12/05/2025

Dans le monde rapide de la diffusion de contenu mondial, l'intégration transparente entre votre système de gestion de la traduction (TMS) et les référentiels de contenu tels que CMS, PIM ou DAM pour centraliser le contenu n'est plus un luxe, mais un véritable besoin.

Les connecteurs TMS en temps réel servent de lien vital, automatisant le flux de contenu entre les systèmes, réduisant les tâches manuelles et assurant la cohérence entre les langues et les plateformes.

Ce type d'intégration permet aux responsables des départements de traduction dans les entreprises multinationales de rationaliser les flux de travail, d'améliorer l'efficacité et de maintenir l'intégrité de la marque dans le monde entier.

Nous présentons ci-dessous les connecteurs TMS les plus pertinents, indépendants des plateformes et des LSP.

[TOC]

BeLazy

BeLazy est spécialisé dans l'automatisation des flux de travail de traduction en connectant les plateformes TMS avec les portails de fournisseurs et les systèmes de gestion d'entreprise. Il est conçu pour réduire les charges de gestion de projet, ce qui le rend idéal pour les organisations cherchant à étendre efficacement leurs efforts de localisation.

  • Il prend en charge l'intégration avec des plateformes TMS telles que XTRF, Plunet et Protemos.
  • Automatise les processus de création, d'attribution et de livraison de projets.
  • Offre un accès API pour des intégrations personnalisées.

Plans tarifaires :

  • BeCurious : Plan gratuit avec 20 jetons/mois, adapté pour tester les capacités d'automatisation.
  • BePrepared : 299 €/mois, inclut 150 jetons et des fonctionnalités supplémentaires telles que la consultation commerciale et la gestion du succès client.
  • BeEfficient : 499 €/mois, offre 300 jetons et prend en charge jusqu'à 3 connexions TMS.
  • BeLean : 499 €/mois, fournit 500 jetons avec un accès utilisateur illimité.
  • BeInvincible : Tarification personnalisée pour les entreprises nécessitant des intégrations et un support étendus.

Blackbird.io

Blackbird.io est une plateforme d'intégration de contenu en tant que service (iPaaS) conçue pour orchestrer des flux de travail multilingues et automatiser les processus pilotés par l'IA. Elle permet aux organisations de connecter divers systèmes, facilitant ainsi le flux de données sans faille et l'automatisation des processus.

  • Elle prend en charge plus de 100 connecteurs, y compris les plateformes CMS, PIM et TMS.
  • Elle offre un éditeur de flux de travail visuel pour concevoir et gérer les intégrations.
  • Elle fournit un SDK pour créer des applications personnalisées.
  • Elle assure la conformité aux normes SOC2 et offre une intégration SSO.

Tarification : À partir de 10 000 $ par an, incluant des utilisateurs illimités, des flux de travail et l'accès à tous les connecteurs.

iLangL

iLangL propose des connecteurs robustes qui relient les plateformes CMS aux outils de TAO, rationalisant le processus de localisation pour les sites web multilingues. Il est particulièrement bénéfique pour les équipes gérant des flux de travail de localisation complexes sur diverses plateformes.

  • Il s'intègre avec des plateformes CMS comme Contentful, Sitecore et Optimizely.
  • Il prend en charge des outils de TAO tels que memoQ et Phrase.
  • Il fournit une API REST pour des intégrations personnalisées.
  • Il offre des options d'hébergement cloud et d'installation sur site.

Plans tarifaires :

  • Starter : 234 €/mois, adapté aux petites équipes avec jusqu'à 15 000 mots livrés.
  • Business : 612 €/mois, adapté aux équipes en pleine croissance avec jusqu'à 50 000 mots.
  • Entreprise : Tarification personnalisée pour les organisations ayant des besoins de localisation étendus.

Intento

Le Hub Linguistique d'Entreprise d'Intento exploite des agents IA et la traduction automatique pour automatiser les processus de localisation pour les entreprises mondiales. Il est conçu pour offrir des expériences linguistiques cohérentes et authentiques à tous les points de contact client.

  • Il s'intègre avec plus de 15 plateformes TMS et divers systèmes de gestion de contenu.
  • Il utilise des agents IA pour gérer des exigences de traduction complexes, y compris le ton et la terminologie.
  • Il fournit une estimation automatique de la qualité et une post-édition.
  • Il offre des retours détaillés via Intento LQA pour une amélioration continue.

Tarification : L'abonnement Starter inclut 1 million de caractères par mois, avec des options mensuelles et annuelles.

Tableau comparatif

Intégrer votre TMS avec CMS, PIM ou d'autres référentiels de contenu est essentiel pour une localisation efficace et évolutive. Des solutions comme BeLazy, Blackbird.io, iLangL et Intento offrent des capacités diverses pour répondre aux besoins organisationnels variés.

En sélectionnant le bon connecteur, les responsables des départements de traduction peuvent améliorer l'efficacité des flux de travail, réduire les interventions manuelles et assurer une diffusion cohérente du contenu à l'échelle mondiale.

Prêt à optimiser vos flux de travail de traduction ? Découvrez comment notre entreprise de traduction peut vous aider à sélectionner et à mettre en œuvre le connecteur TMS idéal pour votre organisation.

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 28/04/2025

Donner une réponse brève, concise et directe : pour le marketing et les attentes du marché. Le terme « IA » se vend. Après le boom de l'IA générative dans les médias, les entreprises de traduction ne veulent pas sembler être laissées pour compte dans la vague technologique. Bien qu'à une époque, la « traduction automatique neuronale » (NMT) semblait à la pointe, aujourd'hui cette étiquette est éclipsée par l'attrait de l'acronyme « IA ».

En conséquence, de nombreuses entreprises continuent d'utiliser leurs moteurs NMT habituels, mais les promeuvent désormais comme des solutions de traduction « alimentées par l'IA ». Par exemple, DeepL décrit sa plateforme comme « la solution de traduction ultime alimentée par l'IA pour les entreprises ». Sur leur site web, ils déclarent : Notre IA est capable de traduire avec précision...

En pratique, la technologie centrale de DeepL reste un traducteur neuronal hautement entraîné avec des données bilingues (et récemment élargi avec un LLM). Ils n'ont pas cessé d'utiliser les réseaux neuronaux ni découvert une nouvelle forme d'alchimie ; ils ont simplement commencé à la commercialiser sous le terme plus large de « IA ».

Pourquoi ce changement de marque ? Il y a plusieurs raisons :

[Table des matières]

Profiter de la tendance

Les clients de tous les secteurs sont enthousiasmés par l'intelligence artificielle. Si une entreprise de traduction parle leur langue (littéralement) et leur promet une « traduction IA », cela semble plus innovant que de dire « traduction automatique ». Le terme « traduction automatique » peut évoquer des images de traductions trop littérales ou d'erreurs comiques du passé, tandis que « IA » suggère intelligence, apprentissage et modernité.

Informer le client

Paradoxalement, de nombreux utilisateurs ne savent pas que la traduction automatique moderne était déjà de l'IA. Après ChatGPT, certains dirigeants ou clients ont commencé à demander aux entreprises : « Utilisez-vous l'IA pour traduire ? ». Si l'entreprise devait répondre : « Non, nous utilisons la NMT », le client pourrait ne pas comprendre que c'est en fait la même chose. Pour simplifier les choses, ils disent « Oui, nous utilisons l'IA ». En ce sens, beaucoup de gens demandent si l'IA peut traduire sans réaliser que cette capacité n'est ni nouvelle ni exclusive aux récents LLM, puisque la NMT le faisait déjà. Ainsi, les entreprises se clarifient et disent : « Oui, nous offrons l'IA dans les traductions (nous avions la NMT, qui est de l'IA) ».

Maintenir la pertinence

Après ChatGPT, il y a une croyance qu'une entreprise ne mentionnant pas l'IA est à la traîne. Même si elles continuent d'utiliser les mêmes outils, mettre l'accent sur « l'intelligence artificielle » dans leur proposition de valeur leur permet de se positionner comme faisant partie de la transformation numérique actuelle.

En résumé, les entreprises de traduction continuent d'utiliser principalement la NMT, mais elles la « rebrandent » comme IA pour capter l'attention. C'est plus un changement de discours que de technologie sous-jacente. Évidemment, cela ne signifie pas qu'elles trompent sur ses capacités (un bon moteur NMT est en effet une IA puissante). Cependant, cela peut prêter à confusion si les clients supposent que l'utilisation de « l'IA » garantit une « qualité immédiate semblable à celle d'un humain » dans les traductions ou implique que des systèmes tels que GPT-4 sont utilisés alors qu'ils ne le sont pas. Pour cette raison, il vaut la peine de comprendre ce que l'étiquette « IA » représente réellement dans chaque situation.

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 21/04/2025

À première vue, « traduction assistée par IA » et « IA de traduction » peuvent sembler similaires, et en pratique, de nombreuses entreprises utilisent les deux termes de manière interchangeable. Cependant, nous pouvons clarifier la distinction entre eux :

[Table des matières]

Traduction assistée par IA

Fait référence au processus de traduction en s'appuyant sur des outils ou systèmes d'intelligence artificielle. Cela implique que la traduction est réalisée avec l'aide de l'IA ; par exemple, un traducteur humain utilisant un moteur de machine comme support, ou un contenu entièrement traduit par une IA (ChatGPT, DeepL, etc.). En d'autres termes, cela décrit l'action d'utiliser l'IA pour traduire du texte. Par exemple, un article de presse pourrait dire « traduction par IA » pour indiquer qu'un système automatique a été utilisé.

IA de traduction

Fait référence au système ou à la technologie elle-même, c'est-à-dire une intelligence artificielle conçue pour traduire. Dans ce cas, l'IA est le sujet : un modèle de traduction automatique ou un algorithme d'IA spécialisé dans la traduction. Nous pourrions dire « les IA de traduction actuelles » pour désigner des systèmes tels que Google Traduction, DeepL ou ChatGPT lorsqu’il est utilisé pour traduire.

Essentiellement, la différence réside dans l'accent mis sur l'agent par rapport à l'action. D'une part, « assistée par IA » met l'accent sur la traduction en tant que service ou tâche soutenue par l'IA ; d'autre part, « IA de traduction » se réfère à l'IA elle-même en tant qu'outil ou agent. Cependant, dans la communication marketing quotidienne, cette distinction devient floue. Il est courant de voir des déclarations promotionnelles telles que « Boostez votre entreprise avec la traduction assistée par IA » ou « Notre IA de traduction apprend avec vous ».

Alors pourquoi la différence est-elle importante ?

Parce que « traduction assistée par IA » peut impliquer une utilisation flexible de différentes IA (par exemple, utiliser un modèle généraliste comme ChatGPT pour traduire), tandis que « IA de traduction » suggère une spécialisation. Par exemple, utiliser ChatGPT pour traduire serait une « traduction assistée par IA » puisqu'une IA est utilisée pour traduire. Cependant, nous appellerions difficilement ChatGPT une « pure IA de traduction », étant donné qu'il s'agit d'un modèle à usage général. En d'autres termes, bien qu'il n'ait pas été créé exclusivement pour la traduction, il est capable de le faire. En revanche, DeepL pourrait effectivement être considéré comme une « IA de traduction » spécialisée.

En fin de compte, la terminologie a causé une certaine confusion. De nombreuses entreprises parlent simplement d'« IA » pour décrire des technologies qu'elles utilisent depuis des années. Ne vous laissez pas tromper par le jargon ; il vaut la peine de se demander quel type d’IA se cache réellement derrière la solution de traduction offerte.

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 31/03/2025
traducteur-robot

Dans un monde où la traduction devient de plus en plus essentielle pour les entreprises et les individus, les outils de Traduction Assistée par Ordinateur (TAO) jouent un rôle clé dans l'amélioration de la productivité et de la qualité du travail des traducteurs professionnels.

Contrairement à la traduction automatique (appelée depuis l'apparition de ChatGPT, traduction avec IA), qui génère une traduction brute, les programmes TAO permettent aux traducteurs humains de travailler plus efficacement grâce à des mémoires de traduction, des bases de données terminologiques et d'autres fonctionnalités avancées.

Mais quels sont les meilleurs logiciels TAO disponibles en 2025 ? Voici notre sélection des outils les plus efficaces.

[TOC]

Qu'est-ce qu'un outil TAO ?

Un outil TAO (Traduction Assistée par Ordinateur), appelé en anglais CAT tool (Computer-Assisted Translation tool), est un programme informatique conçu pour aider les traducteurs dans leur travail, notamment pour améliorer la rentabilité et la qualité, et en plus le rendre plus agréable et cohérent.

Il ne s'agit pas de traduction automatique comme celle de Google Translate, DeepL ou ChatGPT, mais d'un outil qui assiste le traducteur en proposant des suggestions basées sur des traductions réalisées auparavant par lui‑même ou d'autres traducteurs. Cette aide technique est précieuse et permet de gagner un temps considérable, notamment pour des travaux volumineux dans des domaines techniques.

Les fonctionnalités principales d'un outil TAO incluent :

  • Mémoire de traduction (MT) : stocke les segments de texte déjà traduits pour les réutiliser ou effectuer des recherches de termes.
  • Base de données terminologique : permet d'assurer la cohérence des termes inclus dans un glossaire.
  • Segmentation du texte : divise un texte en segments (phrases, paragraphes) pour faciliter la traduction.
  • Alignement de texte : établit la correspondance entre textes source et cible pour créer une mémoire de traduction.
  • Support de divers formats : permet de traduire des fichiers Word, Excel, HTML, XML, etc., en préservant le format.
  • Correcteur orthographique : comme dans les outils de traitement de texte, l'outil TAO détecte et signale les erreurs possibles et les fautes de frappe.

Il existe sur le marché un grand nombre d'outils TAO...

Il existe sur le marché un grand nombre d'outils TAO... Certains sont dédiés à un usage public tandis que d'autres, plus sophistiqués, sont destinés aux professionnels de la traduction. Tout dépend du besoin et de l'utilisation. Quelques exemples sont :

Ces outils sont largement utilisés dans l'industrie de la traduction pour améliorer la productivité et la cohérence des traductions. Chacun répond à des besoins différents et tous ont leurs avantages et inconvénients.

En tant qu'agence de traduction, AbroadLink utilise les deux poids lourds du marché : Trados et MemoQ. Ces outils payants sont destinés aux professionnels des services linguistiques et disposent de fonctionnalités avancées. Leur puissance et leur performance les rendent indispensables pour la réalisation de grands projets de traduction.

Différence avec l'IA

Grâxe à l'arrivée de ChatGPT et à l'accès à l'intelligence artificielle, le grand public a découvert la puissance des outils de traduction avec IA, qui offrent des résultats assez satisfaisants (qu'il s'agisse de traduction automatique neuronale ou générative). Nous pouvons donc parler aussi bien de ChatGPT que d'outils comme Google Translate ou DeepL.

Quelle est la différence entre les outils TAO et la traduction avec IA ?

Comme leurs nom l'indique, les outils TAO sont des outils qui aident le traducteur par des suggestions ou des consultations à partir d'une base de données alimentée par des traductions humaines, tandis que la traduction avec IA est une traduction 100 % automatique sans intervention humaine.

Fondamentalement, la différence réside dans le fait que les outils TAO se basent sur un système de mémoire de traduction et savent reconnaître des segments déjà traduits avec intervention humaine, tandis que la traduction avec IA base son résultat sur un calcul de probabilité basé sur un grand nombre de phrases de manière totalement automatique.

En fait, l'une des fonctions des outils TAO est de s'intégrer avec des systèmes de traduction avec IA, tels que ChatGPT, DeepL ou Google Translate, ainsi que beaucoup d'autres systèmes moins connus du grand public. Nous pouvons donc dire qu'il s'agit de technologies complémentaires qui ne se font pas concurrence.

Conclusion

La technologie IA est utilisée depuis de nombreuses années dans le domaine de la traduction. Les premiers outils de TAO remontent aux années 1980-1990 et bien que rudimentaires, ils s'appuyaient déjà sur l'assistance d'un ordinateur. En évolution permanente, ces technologies apportent toujours de nouvelles solutions basées sur des approches différentes, et qui sont souvent complémentaires. Un bon fournisseur de services linguistiques saura les combiner de la meilleure manière pour fournir la meilleure qualité de traduction possible.

Portrait de Alex Le Baut
Alex Le Baut

Issu d’une formation en Marketing et Commerce International, Alex a toujours exprimé un attrait pour les langues et intérêt pour les différentes cultures. Originaire de Bretagne en France, il a vécu en Irlande et au Mexique avant de repasser un temps par la France puis s’établir définitivement en Espagne.

1
Publié le 15/11/2024
La segmentación en traducción y el formato estándar SRX

Derrière une bonne segmentation du texte se cachent de nombreux aspects qui font la différence entre une bonne et une mauvaise gestion de projets. Parmi ceux-ci, je soulignerais : le budget, la gestion des mémoires de traduction et la qualité de la traduction.

Nous aborderons dans cet article certains de ces sujets, allant des aspects les plus généraux de la segmentation à d'autres plus concrets et techniques.

[TOC]

Qu'est-ce que la segmentation ?

Lorsque nous importons un fichier pour sa traduction dans un outil TAO comme Trados Studio ou memoQ, celui-ci divise le texte traduisible en segments. Chacun de ces segments correspond généralement à une phrase, identifiée par l'outil grâce aux points et aux signes d'exclamation et d'interrogation. 

Une fois le texte segmenté, la tâche du traducteur consistera à fournir une traduction pour chaque segment, également appelé unité de traduction. Cette segmentation est essentielle pour travailler avec des mémoires de traduction, car la division du texte facilite l'identification de correspondances, c'est-à-dire, des unités de traduction déjà présentes dans la mémoire de traduction ou qui se répètent dans le texte, permettant ainsi d'automatiser leur traduction.

Comme nous l'avons mentionné, le critère de base pour déterminer la manière dont un texte est segmenté est la ponctuation. En réalité, les règles de segmentation sont plus complexes, et chaque outil peut se baser sur une configuration différente. Par exemple, SDL Trados Studio les détermine à partir de la mémoire de traduction appliquée au projet, tandis que memoQ les applique directement au projet. De plus, chaque outil offre ses propres modalités pour modifier ces règles, nous y reviendrons plus tard.

En général, les règles de segmentation déterminent deux aspects : d'une part, les signes de ponctuation qui marquent la fin d'un segment et, d'autre part, les exceptions à ces règles.

Pour donner un exemple typique, si nous établissons qu'après un point, un saut de segment doit être effectué, nous pouvons indiquer une série d'abréviations suivies d'un point pour que, lorsqu'elles apparaissent, l'outil maintienne le même segment jusqu'au point suivant.

Enfin, il convient de noter que les règles de segmentation constituent une ressource linguistique. Elles comportent une série d'éléments communs à toutes les langues, comme le point à la fin de chaque segment, mais d'autres sont spécifiques à chacune et leur modification doit être effectuée individuellement.

Standardisation des règles de segmentation : le format SRX

Segmentation Rules eXchange (SRX) est un format standardisé et ouvert basée sur XML. Il fournit un ensemble commun d'expressions régulières pour définir et partager les règles de segmentation. Tout comme le format TMX, le SRX a été développé par la Localization Industry Standards Association (LISA) et maintenu depuis 2011 par la Global and Localization Association (GALA). Il a vu le jour pour pallier le fait qu'un outil TAO pouvait réaliser une segmentation différente à celle de la mémoire de traduction, altérant ainsi la bonne application de celle-ci.

Le format SRX est basé sur des expressions régulières, celles-ci étant utilisées pour définir les règles de segmentation. Les expressions régulières sont des motifs basés sur le codage Unicode qui permettent de déterminer et de localiser une série de caractères dans un texte. Ainsi, pour le cas des règles de segmentation, les expressions régulières nous permettent d’enjoindre au programme de localiser les minuscules, majuscules, crochets et guillemets, chiffres et tout autre signe de ponctuation, et de les utiliser comme critère pour savoir quand effectuer un saut de segment.

Cependant, certains programmes disposent d'options simplifiées pour pouvoir introduire ces caractères sans avoir recours aux expressions régulières complexes. Celles-ci peuvent toujours être utilisées pour une configuration plus avancée des règles de segmentation.

Outre la possibilité de modifier les règles de segmentation, la mise en œuvre de la norme SRX dans les outils TAO permet d'exporter et d'importer des fichiers, afin de pouvoir appliquer les mêmes règles de segmentation dans un autre projet ou outil. Maintenant, voyons plus en détail les possibilités qu’offre le format SRX dans deux des principaux outils : SDL Trados Studio et memoQ.

Mise en œuvre du format SRX dans Trados Studio

Trados Studio n'a pas incorporé le format standardisé SRX, cependant, lors de l'ouverture d'un fichier pour traduction dans SDL Trados Studio, le programme effectue une segmentation basée sur les règles de segmentation par défaut.

Pour modifier les règles de segmentation dans SDL Trados Studio, nous faisons un clic droit sur la mémoire de traduction et ouvrons le panneau de configuration. Une fois que nous y sommes, dans « ressources linguistiques » nous avons accès aux options de configuration pour chacune d'elles. Nous recherchons la colonne des règles de segmentation et accédons à l'éditeur dans la langue pour laquelle nous voulons les modifier.

Apparaît alors une première option de segmentation basée sur le paragraphe, utilisant les marques de paragraphe propres à chaque type de fichier, et une seconde basée sur la phrase, laquelle nous pouvons modifier. Les règles de segmentation appliquées par défaut sont le point, les deux points, et les signes d'interrogation et d'exclamation, et incluent l'exception lorsque ces signes sont suivis d’une minuscule.

Dans ce panneau de configuration nous pouvons supprimer ou modifier ces règles, en ajoutant des caractères avant et après le saut, ainsi que des exceptions, à l’aide des expressions régulières. Il nous est également possible d’ajouter de nouvelles règles, en suivant la même procédure.

Ainsi, dans Trados Studio, les règles de segmentation sont associées à la mémoire de traduction et non à un type de fichier, et il n'est donc pas possible de les importer ou de les exporter dans un fichier SRX.

Mise en œuvre du format SRX dans memoQ

Les règles de segmentation dans memoQ sont établies par défaut et peuvent être modifiées pour chaque projet spécifique. Pour cela, nous ouvrons le projet et accédons à la fenêtre des options. Nous sélectionnons alors l'icône des règles de segmentation — représentant des ciseaux — et sélectionnons l'ensemble de règles de segmentation de la langue que nous voulons. S'ouvrira alors un menu dans lequel nous pourrons modifier ces règles. Nous trouverons une vue simple, où nous pouvons ajouter des signes de ponctuation, des noms propres commençant par une minuscule et des abréviations suivies de chiffres. Dans la vue avancée, nous trouverons l'option d'utiliser des expressions régulières pour une configuration plus complexe des règles de segmentation.

Dans la même fenêtre, nous aurons les options d'exportation et d'importation de fichiers SRX, ce qui permet d’utiliser les mêmes règles de segmentation dans d'autres projets et outils. Il est important de noter qu'en exportant un fichier SRX, certaines informations sur les exceptions aux règles de segmentation peuvent être perdues, car celles‑ci sont plus sophistiquées dans memoQ que celles prises en charge par le format SRX.

Ces articles pourraient vous intéresser :

Portrait de Iván Vázquez
Iván Vázquez

Diplômé en traduction et interprétation de l'université de Grenade, spécialisé en français et en chinois. Il a travaillé sur plusieurs projets de traduction littéraire et de traduction web en Espagne et en France. Il est actuellement assistant de gestion de projet et rédacteur de contenu chez AbroadLink.

1
Publié le 05/10/2024
Traduction automatique avec IA = Traduction générative

Chez AbroadLink Traductions, nous repoussons constamment les limites de la technologie pour offrir les solutions linguistiques les plus avancées. Nous avons développé une application web intégrée à XTRF, un système de gestion de traduction de premier plan, qui se connecte via API aux modèles d'OpenAI (GPT-3.5, GPT-4 et GPT-4o mini) pour la traduction automatique, également appelée traduction générative dans ce contexte. Cette intégration rend possible non seulement des traductions automatiques de haute qualité, mais aussi d'entraîner les modèles en utilisant les traductions antérieures du client pour des résultats plus personnalisés.

[TOC]

1. La puissance de la traduction générative

Notre intégration avec OpenAI exploite les grands modèles de langage (LLM), offrant une approche de traduction générative qui dépasse les systèmes de traduction automatique neuronale traditionnels, tels que ceux utilisés par Google Translator ou DeepL. Avec la possibilité d'entraîner les modèles en utilisant des mémoires de traduction spécifiques aux clients, nous pouvons adapter les traductions à la terminologie, au ton et au style exacts requis par chaque entreprise.

L'une des caractéristiques qui rend ce système véritablement innovant est que nos chefs de projet peuvent personnaliser les traductions en introduisant des prompts, qu'ils travaillent avec des modèles génériques ou des versions entraînées par les clients.

Dans une étude comparative menée par AbroadLink Translations en avril 2024, le modèle GPT-3.5 — amélioré avec des prompts personnalisés — s'est classé deuxième, juste derrière Google AutoML, et a surpassé DeepL. Cette flexibilité nous permet de fournir des traductions contextuellement précises et spécifiques à une industrie donnée.

2. Traduction personnalisée à un coût abordable

L'un des principaux avantages de notre système est qu'il rend la traduction automatique personnalisée plus accessible, même pour les entreprises avec des volumes de contenu plus petits. Bien que des plateformes comme Google AutoML ou Microsoft offrent des traductions automatiques personnalisées, les coûts peuvent être exorbitants pour les entreprises ayant des besoins de traduction limités. Avec notre intégration OpenAI, nous pouvons offrir le même niveau de personnalisation, en utilisant la mémoire de traduction de chaque client, mais à un coût beaucoup plus avantageux.

Cette solution économique garantit aux entreprises de toutes tailles la possibilité de bénéficier de traductions personnalisées, sans avoir à sacrifier la qualité ou la précision. Que votre entreprise s'étende à l'international ou ait simplement besoin de traductions périodiques, notre système est conçu pour répondre à vos besoins de manière efficace et abordable.

3. Confidentialité des données et l'avenir de la traduction automatique

Nous comprenons que la confidentialité des données est une préoccupation majeure pour de nombreuses entreprises, notamment lorsqu'il s'agit d'informations sensibles. AbroadLink Translations a mis en place des mesures de sécurité strictes pour garantir que toutes les données clients soient traitées avec la plus grande sûreté. OpenAI n'utilise pas les données des clients pour entraîner ses modèles, sauf autorisation expresse de leur part, garantissant ainsi la confidentialité de toutes les informations.

À l'avenir, il est très probable que la traduction générative, la traduction automatique alimentée par les LLM, — popularisé par des outils comme ChatGPT — devienne la figure de proue de l'industrie. Cependant, bien que cette technologie évolue rapidement, elle fait encore face à des défis tels que le coût et la rapidité, et des problèmes comme les hallucinations (où l'IA génère un contenu inexact ou insensé). Malgré ces obstacles, le potentiel est immense, ouvrant de nouvelles applications dans les évaluations d’Assurance de la Qualité Linguistique (LQA), l'extraction de terminologie, l'alignement des traductions héritées ou la maintenance des mémoires de traductions (TM).

Il est également important de souligner que la traduction générative est un outil qui améliore la productivité et la qualité, mais ne peut remplacer l'expertise des traducteurs professionnels natifs spécialisés. La supervision humaine reste essentielle pour garantir que les traductions soient culturellement appropriées, techniquement précises et exemptes d'erreurs. L’alliance d'outils alimentés par l'IA à l'expertise humaine nous permets de garantir un niveau de traductions optimum à nos clients.

Cet équilibre entre la technologie de pointe de la traduction générative et l'expertise des traducteurs humains permet à AbroadLink Translations de fournir des prestations d’excellence tout en garantissant la sécurité des données et l'accessibilité financière à tous nos clients.

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 10/05/2024

Alors que les outils de traduction automatique continuent de gagner en popularité et en sophistication, une question se pose : quel sera l'avenir des agences de traduction dans ce paysage en constante évolution ? Les agences de traduction jouent un rôle essentiel dans la fourniture de services linguistiques de haute qualité, et leur importance ne peut être sous-estimée, même à l'ère de la traduction automatique. Dans cet article, nous examinerons le rôle des agences de traduction dans un monde dominé par la technologie.

[TOC]

Expertise et qualité

L'un des principaux avantages des agences de traduction réside dans leur capacité à fournir des services de haute qualité grâce à l'expertise de traducteurs professionnels. Contrairement aux traductions automatiques, qui peuvent parfois manquer de nuances et de précision, les traducteurs humains des agences possèdent une connaissance approfondie des langues étrangères, des cultures et des domaines spécialisés. Leur capacité à comprendre le contexte et à produire des traductions précises est inestimable, surtout dans des secteurs tels que le droit, la médecine et la finance, où la précision est primordiale.

Adaptabilité et flexibilité

Les agences de traduction offrent également un niveau élevé d'adaptabilité et de flexibilité pour répondre aux besoins spécifiques de leurs clients. Elles peuvent gérer une grande variété de projets, qu'il s'agisse de traductions de documents juridiques, de localisation de sites web ou d'interprétation lors d'événements internationaux. Leur capacité à personnaliser les services en fonction des exigences linguistiques et des délais serrés fait des agences de traduction des partenaires précieux pour les entreprises et les organisations.

Confidentialité et sécurité des données

La confidentialité et la sécurité des données sont des préoccupations majeures dans le domaine de la traduction, en particulier pour les entreprises traitant des informations sensibles. Les agences de traduction sont soumises à des normes strictes en matière de confidentialité et de protection des données, garantissant que les informations confidentielles de leurs clients restent sécurisées et protégées. Contrairement aux traductions automatiques en ligne, qui peuvent compromettre la confidentialité des données, les agences de traduction assurent un niveau élevé de sécurité pour les documents et les informations sensibles.

Collaboration harmonieuse avec la technologie

Plutôt que de voir les outils de traduction automatique comme une menace, de nombreuses agences de traduction, comme AbroadLink, intègrent la traduction assistée par ordinateur dans leur processus de travail pour améliorer l'efficacité et la productivité. Les outils de traduction automatique peuvent être utilisés comme aides à la traduction pour accélérer le processus et réduire les coûts, tout en laissant aux traducteurs humains le soin de finaliser et de peaufiner les traductions. Cette collaboration harmonieuse entre la technologie et l'expertise humaine permet aux agences de traduction de rester compétitives dans un marché en constante évolution, notamment avec l'émergence de l'intelligence artificielle qui offre, au fur et à mesure, une nouvelle facette aux logiciels de traduction en ligne.

Conclusion

Bien que les outils de traduction automatique offrent des avantages en termes de rapidité et de commodité, les agences de traduction continuent de jouer un rôle crucial dans la fourniture de services linguistiques de haute qualité. Leur expertise, leur adaptabilité et leur engagement envers la confidentialité et la sécurité des données en font des partenaires précieux pour les entreprises et les organisations du monde entier. En collaborant avec la technologie et en capitalisant sur les forces de chaque partie, les agences de traduction sont bien positionnées pour prospérer dans un environnement multilingue et mondialisé. Si vous avez des besoins de traduction, nous vous conseillons donc de faire appel à des agences de traduction professionnelles pour vous assurer une qualité de traduction optimale.

Portrait de Virginia Pacheco
Virginia Pacheco

Rédactrice de blogs et responsable de communauté intéressée par le multiculturalisme et la diversité linguistique. Depuis sa Vénézuela natale, elle a beaucoup voyagé et vécu en France, en Allemagne, au Cameroun et en Espagne, transmettant ses expériences interculturelles à sa passion pour l'écriture.

1
Publié le 04/06/2021

Si vous avez déjà demandé un devis de traduction pour vos documents rédigés en arabe, les responsables de projets de traduction vous ont sûrement déjà posé la question suivante :

Vous n'avez pas le fichier dans un format modifiable?

Bien que cela puisse ne pas en avoir l'air, nous savons à quel point cette question peut être agaçante, surtout si vous faites partie de ces clients qui envoient toujours tous les documents dans leur format d'origine.

Mais vous devez aussi comprendre qu'il est beaucoup plus facile, plus rapide et moins cher pour les entreprises de traduction de traiter et de préparer les fichiers envoyés dans un format modifiable.

Et bien, malgré tout, un document qui a été scanné et converti en PDF tombera toujours entre vos mains. Je pense sincèrement que c'est le pire format pour travailler, ce qui ne veut pas dire qu’il est impossible de l’utiliser.

Dans cet article, je vais comparer certains programmes avec lesquels les sociétés de traduction travaillent habituellement pour gérer et traiter ce type de documentation écrite en arabe. J'ai choisi l'arabe parce qu'il s'agit d'une langue très traduite et que tous les programmes ne sont pas capables de travailler avec cette langue, il faut donc creuser un peu plus loin dans le monde des programmes d'extraction de texte.

[TOC]

1. Que signifie OCR ?

OCR

Lorsque nous travaillons avec des fichiers qui sont convertis en images lors de leur numérisation et que le texte ne peut pas être sélectionné avec la souris, nous ne pouvons pas utiliser un simple programme d'extraction de texte comme dans le cas des fichiers PDF dans lesquels le texte peut être sélectionné. Voici deux exemples où vous pouvez voir la différence :

  • PDF en format modifiable

PDF en format modifiable

  • PDF en format non modifiable

PDF en format non modifiable

Le premier texte est sélectionnable et le fait qu'il soit sélectionnable indique que tout programme d'extraction de texte, gratuit ou non, peut extraire le texte sans aucun problème. Dans le second cas, le fichier PDF ne nous permet de sélectionner qu'une zone du document, mais pas une partie du texte lui-même, de sorte qu'un programme d'extraction de texte ne sera pas non plus en mesure de reconnaître les caractères présents dans le document.

Vous pouvez essayer n'importe quel programme d'extraction de texte, ils vous donneront tous des résultats similaires.

Toutefois, parmi la multitude de programmes d'extraction de texte disponibles sur le marché aujourd'hui, ceux qui font la différence lorsqu'il s'agit de convertir des fichiers PDF non éditables sont les programmes d'extraction OCR. OCR est l'abréviation de « Optical Character Recognition », ce qui en français serait la « Reconnaissance optique des caractères ». Comme leur nom l'indique, ces programmes reconnaissent non seulement les caractères éditables d'un document, mais peuvent également détecter le texte dans un document numérisé, par exemple.

Et vous me direz : Très bien, alors problème réglé. Pas si vite... car aussi bons que soient ces programmes, ils laissent encore beaucoup à désirer. Il est vrai qu'ils peuvent vous donner une idée approximative du volume de travail, mais il n'est pas conseillé de travailler avec ces derniers pour traduire.

Vous pouvez vérifier ci-dessous les résultats obtenus avec différents programmes d'extraction de texte.

2. Adobe Acrobat Pro DC

Adobe Acrobat Pro DC

Le premier programme que je voudrais vous présenter est Adobe Acrobat Pro DC. Si vous avez l'habitude de travailler avec l'ordinateur, c'est un programme qui ne doit pas manquer dans votre liste d'outils, car Adobe vous permet non seulement de visualiser, mais aussi de créer, d'éditer, d'organiser les pages, de commenter, de remplir, de signer et de corriger tout document au format PDF.

Il permet également d'extraire le texte et c'est assez pratique, car lorsque je reçois un document PDF et que je l'ouvre, il s'ouvre directement dans ce programme et l'extraction du texte se fait en deux clics. C'est généralement le premier que j'essaie.

En prenant comme référence le document non modifiable que vous avez vu dans l'exemple ci-dessus, voici à quoi ressemblerait la conversion dans Adobe Acrobat Pro DC:

Adobe Acrobat Pro

Oui, oui, je ne plaisante pas. Un programme aussi puissant que celui-ci donne des résultats médiocres lorsqu'il s'agit d'extraire du texte écrit en arabe.

Cela s’explique peut-être par le fait qu'il n'est pas possible d'indiquer dans quelle langue le texte est écrit, le programme le « reconnaît » automatiquement. En facilitant le travail de détection de la langue pour le programme, celui-ci ne recherche dans sa base de données que les caractères de la langue X au lieu de la base de données contenant les caractères de toutes les langues.

En tout cas, je ne recommande pas du tout ce programme pour l'extraction de texte écrit en arabe.

3. OmniPage Ultimate

OmniPage Ultimate

La deuxième application que j'essaie généralement après avoir échoué à extraire du texte avec Adobe est l'application OmniPage Ultimate 19.0.

Contrairement à Adobe, OmniPage vous permet de sélectionner la langue du document par un simple clic droit sur le fichier. Quel est le problème alors ? L'arabe n'apparaît pas dans la liste des langues. Le wolof et le zoulou apparaissent mais pas l'arabe. Dans ces cas, vous pouvez essayer d'utiliser l'option « Détecter la langue automatiquement » et vous obtiendrez ce résultat :

Traduction

Comme vous pouvez le constater, ce n'est pas non plus ce que nous recherchons, même si je dois admettre qu'Adobe et OmniPage fonctionnent très bien pour extraire du texte dans d'autres langues.

3. Readiris 17

Readiris 17

La troisième option pour extraire notre texte arabe et le convertir dans un format éditable est Readiris 17.

Il s'agit d'un programme un peu plus sophistiqué qu'Adobe et OmniPage pour extraire du texte écrit de droite à gauche, comme l'arabe. Le programme vous permet d'indiquer sur chaque page quelle section correspond au texte, quelle section correspond aux images, etc.

Il est vrai que cela demande un peu plus de temps de préparation par rapport aux autres programmes qui n'offrent pas cette option de sélection sur la page, mais en voyant le résultat, il est clair que l'effort en vaut la peine :

Arabe

Il offre de meilleurs résultats que les deux programmes précédents, bien que pour les documents plus longs, il ne soit toujours pas à la hauteur, car il a tendance à insérer de nombreux sauts de paragraphe qui n'apparaissent pas dans le document d'origine, ainsi que d'autres incohérences dans le formatage qui entraînent beaucoup de travail de mise en page.

4. ABBYY FineReader

ABBYY FineReader

Le dernier programme que je voudrais présenter et qui, à mon avis, est le meilleur programme pour extraire du texte non modifiable écrit en arabe est ABBYY Fine Reader.

Il s'agit d'un programme payant, comme tous les autres que j'ai présentés dans ce blog, qui vous permet d'indiquer page par page quelles sections sont du texte, quelles sections comprennent des images et quelles sections sont des tableaux de texte.

En fonction de la précision de vos indications, le programme générera un document plus ou moins précis. Je n'ai pas modifié grand chose et le résultat a été le suivant :

Arabe

Par rapport au document original, nous pouvons dire qu'ils sont presque identiques :

Arabe

Tant pour la budgétisation que pour la traduction de ce document , nous obtiendrons des résultats beaucoup plus précis qu'avec n'importe quel autre programme que vous avez vu dans ce blog. Pour moi, ABBYY est donc le grand gagnant lorsqu'il s'agit d'extraire du texte non modifiable écrit en arabe.

5. Conclusion

Conclusion

Comme vous pouvez le constater, tous les programmes qui vous permettent d'extraire du texte de fichiers au format non modifiable n'offrent pas les mêmes résultats, du moins lorsqu'il s'agit de texte écrit en arabe. Je travaille souvent avec tous ces programmes et, à moins qu'il ne s'agisse d'un format vraiment problématique impliquant une langue peu commune, ils ne posent généralement aucun problème. Au contraire !

Je ne recommande pas l'utilisation d'extracteurs de texte gratuits, car vous ne pouvez pas savoir où vos fichiers vont atterrir. S'il s'agit d'un document non confidentiel à usage privé, ce n'est pas important, mais j'éviterais de télécharger sur ces sites gratuits des fichiers importants de l'entreprise contenant des informations confidentielles.

J'espère vous avoir fait découvrir une infime partie du quotidien des gestionnaires de projets de traduction dans leur lutte acharnée contre les fichiers PDF numérisés. La prochaine fois que l'on vous enverra un PDF à traduire, demandez d'abord si votre entreprise dispose encore du format original du fichier. De cette façon, non seulement vous réduirez les coûts, mais le format final de la traduction sera également bien meilleur. Sans parler de l'énorme faveur que vous nous rendez à nous, gestionnaires de projets !

1