|
|

Mise en page

Publié le 06/06/2024

Le format TMX s'est imposé comme le moyen standard d'échanger des mémoires de traduction entre les systèmes de traduction, même ceux installés sur des systèmes d'exploitation différents. En 2007, lorsque notre directeur marketing actuel a rédigé l'article « Testing the implementation of the TMX standards » pour le magazine MultiLingual, la plupart des programmes offraient la possibilité d'utiliser le format txt créé dans la version de RWS Trados Studio de l'époque.

Aujourd'hui, cet article n'aurait aucun sens. Lisez la suite de cet article pour en savoir plus sur l'une des normes de l’industrie les plus largement adoptées avec le format XLIFF.

Qu'est-ce que le format TMX ?

Le format Translation Memory eXchange est une norme ouverte basée sur XML conçue pour stocker des mémoires de traduction (TM) et les échanger entre différents outils et applications de traduction assistée par ordinateur (TAO). Une mémoire de traduction est une base de données qui stocke des segments de textes déjà traduits afin de les réutiliser dans les traductions futures, ce qui permet d'accélérer le travail en garantissant la cohérence du style et de la terminologie ; ces segments peuvent être soit des correspondances à 100 %, soit des correspondances partielles (souvent appelées fuzzy matches dans le jargon professionnel)

Le format TMX, hérité de la LISA (Localization Industry Standards Association) avant sa disparition en 2011, a depuis été largement adopté par de multiples outils de traduction et de localisation. Son principal objectif est de fournir une standardisation dans le stockage des mémoires de traduction, facilitant ainsi leur interopérabilité entre les différentes plateformes.

Structure du format TMX

Les fichiers TMX sont basés sur XML, ce qui implique l'utilisation de balises pour coder les informations afin qu'elles puissent être lues à la fois par les humains et les machines. En général, sa structure se compose d’un en-tête (header en anglais) suivi d'une ou plusieurs sections ou corps (body en anglais) contenant les unités de traduction (UT), c'est-à-dire chacun des segments de texte précédemment traduits.

L'en-tête contient des informations descriptives sur la mémoire de traduction, telles que le nom, la langue source et la ou les langues cibles, ainsi que des informations supplémentaires telles que l'outil avec lequel elle a été créée, la date de création ou les éventuelles révisions effectuées.

Les sections restantes contiennent l'UT, y compris le segment en texte brut original et sa traduction dans une ou plusieurs langues, ainsi que les balises de formatage (en fonction du niveau d’implémentation du format TMX, que nous évoquerons plus loin). Des informations supplémentaires, telles que le contexte d'utilisation du segment ou les annotations du traducteur, peuvent également être incluses.

Fichiers TMX multilingues et bilingues

Comme indiqué ci-dessus, les fichiers TMX peuvent être multilingues ou bilingues, en fonction du nombre de langues cibles incluses :

  • Fichiers TMX bilingues: ils contiennent des segments de texte dans deux langues, la langue source et la langue cible. Ce sont les plus courants et ils sont principalement utilisés dans le cadre de projets de traduction spécifiques.
  • Fichiers TMX multilingues: ils contiennent des segments de texte dans plusieurs langues, ce qui vous permet de gérer et de réutiliser des traductions dans plusieurs langues à partir d'un seul fichier. Ils sont utiles pour les projets de localisation volumineux.

Métadonnées dans un fichier TMX

En plus des segments de texte traduits, les fichiers TMX peuvent contenir divers types de métadonnées qui fournissent des informations supplémentaires sur les unités de traduction et facilitent la gestion et l'utilisation des mémoires de traduction. Nous en avons déjà mentionné quelques-uns, mais voici une liste complète des plus courants :

  • Langue source et langue cible : spécifie les langues du segment original et de sa traduction. Ce paramètre est essentiel pour s’assurer que les unités de traduction sont correctement utilisées dans des contextes multilingues, en filtrant et en appliquant uniquement celles qui correspondent aux langues spécifiques du projet en cours.
  • Auteur et date de création : indique qui a créé le segment et quand, ce qui facilite l'attribution des responsabilités, le suivi de la qualité de la traduction et la communication entre professionnels.
  • Client et projet : informations pertinentes sur le client et le projet associé à la mémoire de traduction. Lorsque vous travaillez sur un projet spécifique, les unités de traduction précédemment utilisées pour le même client peuvent être classées par ordre de priorité, ce qui garantit la cohérence terminologique et stylistique.
  • Statut de la traduction : indique si la traduction a été révisée, approuvée ou si elle est en attente de révision, facilitant la gestion du flux de travail de la société de traduction.
  • Notes et commentaires : permet d'ajouter des annotations supplémentaires qui peuvent aider les futurs traducteurs et réviseurs à prendre certaines décisions.
  • Contexte et segmentation : informations sur le contexte du segment dans le texte source, ce qui permet de maintenir la cohérence et la précision des traductions futures.

Implémentation du format TMX

La mise en œuvre du format TMX dans les différents outils de traduction assistée par ordinateur se fait à trois niveaux différents, en fonction du type de codes de formatage et de balises qui peuvent être reconnus. En d'autres termes, les niveaux d’implémentation déterminent la complexité et la quantité d'informations qui peuvent être incluses dans un fichier. Ces niveaux sont les suivants :

  • Niveau 1 (texte brut uniquement) : c'est le niveau le plus basique, il garantit la compatibilité entre les différents outils de TAO. Il comprend des informations de base, telles que des paires de segments de texte en langue source et en langue cible. C'est l'option la plus simple lorsqu’il s’agit de rechercher des équivalences entre les paires, car la lecture des segments n'est pas perturbée par la présence d'étiquettes.
  • Niveau 2 (marqueurs méta) : ce niveau considère les informations de la balise dans son format TMX, en tenant compte des détails de la mise en forme du texte (gras, italique, souligné...)
  • Niveau 3 (marqueurs natifs) : c'est le niveau le plus avancé, il permet de reconnaître à la fois les balises TMX et le code natif de chaque élément, sans perdre aucune information. Cela implique la possibilité de recréer la structure et le formatage exacts du document original dans la traduction en utilisant uniquement le fichier TMX.

Problèmes de compatibilité des formats TMX avec les outils de TAO

Bien qu'il s'agisse d'une norme ouverte, les fichiers TMX peuvent rencontrer des problèmes de compatibilité entre les différents outils de TAO. Voici quelques-uns des problèmes les plus courants :

  • Différents niveaux d’implémentation : tous les outils ne sont pas capables d'interpréter le même type de données contenues dans un fichier TMX, comme nous l'avons vu dans les niveaux d’implémentation, ce qui peut engendrer la perte possible d'informations importantes d'un outil à un autre.
  • Différences dans l'analyse XML : certains outils n'utilisent pas d'analyseurs XML standards, ce qui peut conduire au rejet de certains TMX valides.
  • Génération de fichiers TMX non valides : même s'ils peuvent lire correctement le XML, certains outils ne sont pas en mesure de générer des fichiers TMX valides, ce qui peut compromettre leur lecture par d'autres programmes par la suite.
  • Nouvelles versions de XML : il existe encore des outils qui travaillent avec des versions plus anciennes de XML ; ils ne pourront donc pas lire les fichiers TMX plus récents.
  • TMX multilingues : certains outils limitent le nombre de langues autorisées à deux et ne prennent pas en charge les fichiers TMX multilingues.

Conclusion

Le format TMX est un outil indispensable tant pour les traducteurs professionnels que pour les agences de traduction, car il offre un stockage standardisé des mémoires, facilitant ainsi l'échange de mémoires entre traducteurs professionnels, quel que soit l'outil de TAO utilisé. Cependant, les utilisateurs doivent être conscients des niveaux d'implémentation et des potentiels problèmes de compatibilité afin d'éviter de perdre des informations. De plus, savoir manipuler et gérer les fichiers TMX, et connaître toutes les informations qu'ils peuvent contenir, peut parfois nous permettre d'accélérer le processus de traduction, d'économiser du temps et des efforts, ainsi qu’améliorer notre travail.

Portrait de Iván Vázquez
Iván Vázquez

Diplômé en traduction et interprétation de l'université de Grenade, spécialisé en français et en chinois. Il a travaillé sur plusieurs projets de traduction littéraire et de traduction web en Espagne et en France. Il est actuellement assistant de gestion de projet et rédacteur de contenu chez AbroadLink.

1
Publié le 31/05/2024

La communication entre entreprises de différentes cultures et langues est aujourd’hui devenue une nécessité courante. Pour les entreprises cherchant à se développer à l'international, il est crucial de comprendre les spécificités linguistiques et culturelles de leurs marchés cibles. L'une de ces spécificités souvent négligées est la direction de lecture. 

Saviez-vous que certaines cultures lisent de droite à gauche ? Ce détail peut sembler mineur, mais il a un impact significatif sur la mise en page des documents et des supports marketing.

[TOC]

Pourquoi la direction de lecture est-elle importante ?

Lorsque nous concevons des documents, des sites web, ou toute autre forme de communication visuelle, nous le faisons en tenant compte des habitudes de lecture de notre audience. Dans la plupart des cultures occidentales, nous lisons de gauche à droite. Cependant, dans plusieurs cultures, notamment celles utilisant l'arabe, l'hébreu et le persan, la lecture se fait de droite à gauche.

Cette différence de direction de lecture implique bien plus qu'un simple ajustement de texte. En effet, elle affecte la structure visuelle globale d'un document, la mise en page, l'alignement des éléments, et même l'ordre dans lequel l'information est perçue et assimilée.

Les défis de la mise en page pour les langues RTL

1. Alignement et structure

Dans les langues RTL (right-to-left), l'alignement principal doit être à droite, à l’inverse des langues LTR (left-to-right). Cela signifie que les titres, les paragraphes, et même les images doivent être alignés différemment. Par exemple, un document en anglais aura typiquement des titres alignés à gauche et un flux de texte allant de gauche à droite. En arabe, ce même document devra être réorganisé pour que le texte commence à droite et se déroule vers la gauche.

2. Images et graphiques

Les éléments graphiques comme les images et les graphiques nécessitent également une attention particulière. Si une image contient du texte, ce texte doit être traduit et réorienté pour suivre le sens de lecture de la langue cible. De plus, la direction du flux visuel des graphiques et des diagrammes peut devoir être inversée. Par exemple, un graphique montrant une progression temporelle de gauche à droite devra être modifié pour montrer cette progression de droite à gauche dans une langue RTL.

3. Interface utilisateur (UI) et expérience utilisateur (UX)

Pour les entreprises numériques, adapter les interfaces utilisateur pour les langues RTL est essentiel. Cela inclut les menus, les boutons, et même les icônes. Un site web ou une application doit être complètement reconfiguré pour offrir une expérience utilisateur intuitive et naturelle pour les lecteurs RTL. Les menus de navigation doivent être déplacés vers la droite, et les éléments interactifs doivent être réorganisés en conséquence.

Exemples d'adaptations réussies

Prenons l'exemple de grandes entreprises comme Apple ou Google, qui ont parfaitement intégré la compatibilité RTL dans leurs produits. Les systèmes d'exploitation comme iOS et Android prennent en charge les langues RTL, permettant une expérience utilisateur fluide et cohérente pour les utilisateurs ayant ces langues comme langue maternelle.

Ces entreprises montrent qu'une attention particulière aux détails de la mise en page et de l'interface utilisateur peut faire une grande différence dans l'acceptation et l'utilisation de leurs produits dans les marchés RTL.

Comment une agence de traduction peut vous aider

Toute société de traduction professionnelle doit comprendre l'importance d'une adaptation culturelle et linguistique précise. Leurs services de traduction ne se limitent pas à la traduction de mots, mais englobent une approche holistique de la localisation. Ils vous assurent que vos documents et vos supports numériques sont parfaitement adaptés aux habitudes de lecture et aux attentes culturelles de vos marchés cibles grâce à des traductions de qualité. Faire appel à leurs services linguistiques permet de renforcer votre image de marque.

Services offerts :

  1. Traduction et localisation de documents : elles adaptent vos documents pour qu'ils soient parfaitement lisibles et esthétiquement plaisants que ce soit pour les lecteurs LTR ou RTL.
  2. Conception graphique adaptée : en travaillant en collaboration avec des traducteurs professionnels, elles s’occupent de réorienter les images, les graphiques et les diagrammes.
  3. Adaptation de l’interface utilisateur : les professionnels de la traduction aident à reconfigurer vos sites web et applications pour qu'ils offrent une expérience utilisateur optimale.

Conclusion

La direction de lecture est un aspect fondamental de la communication interculturelle souvent négligé. Pour les entreprises souhaitant s'étendre dans les régions utilisant des langues RTL, comprendre et s'adapter à ces différences peut faire toute la différence. Les agences de traduction sont là pour vous guider à chaque étape de votre projet de traduction, en veillant à ce que votre message soit non seulement compris, mais également apprécié dans toute sa subtilité culturelle.

Investir dans une adaptation précise et respectueuse des spécificités culturelles montre à vos clients que vous vous souciez de leurs besoins et que vous êtes prêt à faire un effort supplémentaire pour les servir. Contactez notre entreprise de traduction dès aujourd'hui pour découvrir comment nous pouvons vous aider à réussir à l'international !

Portrait de Virginia Pacheco
Virginia Pacheco

Rédactrice de blogs et responsable de communauté intéressée par le multiculturalisme et la diversité linguistique. Depuis sa Vénézuela natale, elle a beaucoup voyagé et vécu en France, en Allemagne, au Cameroun et en Espagne, transmettant ses expériences interculturelles à sa passion pour l'écriture.

1
Publié le 05/11/2020

Les fichiers PDF sont l'un des formats les plus répandus pour l'affichage de contenu textuel dans les documents. C'est pourquoi c'est souvent le seul format dont nous disposons pour traduire un contrat, une brochure, une fiche technique ou un notice. Toutefois, les fichiers PDF ne sont que des fichiers d'échange de contenu. En fait, PDF signifie Portable Document Format.

La seule raison d'être d'un fichier PDF est que nous pouvons le voir et le partager sans problème de compatibilité. Il est important de comprendre cela. Un fichier PDF peut être modifié, mais il n'est pas réellement destiné à être modifié.

[TOC]

Voyons ici ce que nous devons faire pour pouvoir traduire un PDF à l'aide des programmes de traduction assistée par ordinateur utilisés par les traducteurs professionnels et les agences de traduction. Ou pour utiliser facilement un traducteur automatique comme Google Translator, si nous n'avons pas besoin d'une traduction fiable à 100 %. Ou même si nous voulons simplement traduire à l'ancienne, en écrasant le texte, mais en conservant le format du document.

Pour utiliser la technologie linguistique, nous devrons disposer du fichier PDF dans un format modifiable que nous pourrons facilement manipuler. La façon la plus normale de les traduire est de les convertir en Word. Il peut s'agir d'un document .doc ou .docx.

1. Quelle est la solution idéale pour traduire un fichier PDF ?

Quelle est la solution idéale pour traduire un fichier PDF

Cela va sembler un peu stupide, mais la meilleure façon de traduire un fichier PDF est de ne pas le traduire. Il vaut mieux ne pas traduire le fichier PDF mais le fichier original, modifiable, avec lequel le PDF a été créé.

Par exemple, si ce fichier PDF a été créé en Word, il est préférable d'utiliser le fichier Word original. S'il a été créé avec FrameMaker ou InDesign, il est préférable d'utiliser ces formats. Si vous avez des fichiers InDesign et que vous pouvez oublier le PDF, notre blog pourrait vous intéresser : « Traduction : fichiers InDesign »

Cependant, il est tout à fait possible que votre entreprise ne sache plus où se trouvent les fichiers originaux ou qui les a créés. Ou, si vous êtes un distributeur ou un importateur, il est possible que le fabricant ne vous ait fourni que les fichiers PDF pour faire la traduction.

Cependant, il vaut la peine d'investir un peu de temps pour vérifier si quelqu'un les possède encore, ou d'insister pour que le fabricant nous les envoie. Cela nous évitera bien des maux de tête pendant la traduction. Quand je parle des maux de tête, je veux dire comme d'habitude : du temps et de l'argent.

Lorsque nous voulons préserver le format du texte original, il est encore plus important d'obtenir les originaux. Les fichiers PDF sont généralement créés en version basse résolution, ils ne fonctionneront donc pas si nous en avons besoin pour l'impression.

D'autre part, lorsque nous convertirons les fichiers PDF en Word pour la traduction, nous constaterons que le format (je fais ici référence à la composition des textes et des images) peut changer considérablement. Il peut donc être très laborieux et coûteux de reproduire 100% du format original.

En bref, les meilleurs résultats en termes de qualité et de temps/argent pour le texte traduit seront obtenus en travaillant à partir des originaux. Cependant, vous ne seriez probablement pas en train de lire cet article si vous le faisiez, n'est-ce pas ?

2. Comment savez-vous avec quel programme le PDF a été créé ?

Comment connaître le programme utilisé pour créer le PDF

En général, nous pourrons facilement savoir avec quel programme le PDF original a été créé. Si nous ouvrons le PDF avec Acrobat ou Acrobat Reader et que nous allons dans Fichiers>Propriétés, nous pouvons voir l'application utilisée pour le créer. Voici un exemple de PDF créé en Word :

Acrobat Reader

Comme nous le voyons, nous pouvons également voir qui est l'auteur et la date de création, ce qui peut nous donner un indice sur qui demander les originaux.

3. Pourquoi convertir un PDF en Word pour la traduction ?

Comme je l'ai dit, la solution standard pour la traduction des fichiers PDF utilisés par les agences de traduction est de passer par Word. Cependant, quelqu'un pourrait penser que cela n'a pas de sens car les fichiers PDF peuvent être édités.

Eh bien, c'est vrai dans une certaine mesure. Tout d'abord, oui, ils peuvent être modifiés, mais pour cela, nous devons disposer de la version professionnelle payante d'Acrobat. La plupart des traducteurs disposent de la version gratuite : Acrobat Reader. Cette version gratuite est limitée à quelques fonctions.

Deuxièmement, même si nous faisons appel à un traducteur qui dispose de la version professionnelle, la modification du texte dans Acrobat prendra beaucoup plus de temps. Nous pourrons peut-être convaincre les traducteurs débutants de travailler de cette manière à leur tarif habituel.
Cependant, les traducteurs professionnels plus expérimentés sont susceptibles de nous demander un supplément. Dans le pire des cas, ils rejetteront directement un projet de traduction dans ces conditions.

Ces deux problèmes peuvent être résolus en envoyant un fichier Word à traduire. En outre, les fichiers Word permettront aux traducteurs ou aux agences de traduction d'utiliser des outils d'aide à la traduction. Ces outils permettent de créer une base de données des traductions effectuées par le traducteur professionnel.

Ces outils vous permettent également d'analyser la quantité de texte répété des documents à traduire. Cela est particulièrement important lorsqu'il s'agit de traduire des notices techniques.

Les notices techniques comportent souvent beaucoup de textes répétés, tant dans le même notice qu'entre les notices de produits similaires. De nombreux traducteurs ou agences de traduction, comme nous, accepteront d'offrir des réductions en fonction du volume de texte répété.

La conversion d'un PDF en Word peut être une étape très simple et efficace. Il y a aussi des cas où ce sera un véritable casse-tête. Ensuite, nous expliquerons comment créer un fichier Word en fonction du type de PDF dont nous disposons.

4. Comment traduire un fichier PDF éditable

Comment traduire un fichier PDF éditable

Une fois que nous nous serons assurés de ne pas avoir les fichiers originaux, il n'y aura pas d'autre choix que d'utiliser les fichiers PDF pour les traduire. La meilleure situation que l'on puisse trouver est que les fichiers sont modifiables.

Lorsque nous disons qu'ils sont modifiables, nous voulons dire que le texte du PDF peut être facilement modifié. C'est-à-dire qu'il ne s'agira pas d'une image comme dans le cas des PDF scannés ou des textes dessinés. Nous examinerons ces cas plus tard.

La meilleure solution sera de convertir le PDF en un document Microsoft Word. Ce format de fichier est pratiquement une norme aujourd'hui. Cela signifie que nous pouvons les envoyer à n'importe quel traducteur ou société de traduction. Aujourd'hui, tous les professionnels de la traduction disposent de Word ou d'un programme compatible.

Les documents Word sont également facilement manipulables par les programmes de traduction. Par programmes de traduction, j'entends à la fois les outils de traduction assistée par ordinateur (tels que SDL ou memoQ) et les outils de traduction automatique (tels que Google Translator).

Le secret pour obtenir une bonne conversion de PDF en Word est le programme que nous utilisons. Il existe sur le marché toute une série de programmes appelés OCR qui font des conversions très décentes. Il s'agit de programmes qui sont sur le marché depuis des années et qui ont atteint leur maturité.

D'après notre expérience dans notre agence de traduction, les meilleurs programmes sont Adobe Acrobat, Omnipage et Abbyy FineReader. Il existe également d'autres bons programmes. Voir d'autres programmes sur ce blog : Les 6 meilleurs programmes OCR pour la numérisation de documents.

La meilleure pratique consiste à avoir plusieurs de ces programmes, si notre budget le permet. Selon le document, il arrive qu'Adobe Acrobat nous donne un résultat optimal. D'autres fois, il s'agira d'OmniPage ou d'Abby FineReader.

Une fois que nous aurons le document converti, nous devrons revoir le format et le modifier si nécessaire. Par exemple, le convertisseur peut avoir placé une marque de paragraphe en scindant les phrases. Ce format compliquera le processus de traduction et doit être évité.

5. Comment puis-je traduire un fichier PDF scanné (ou tracé)

Comment puis-je traduire un fichier PDF scanné (ou tracé)

La conversion d'un PDF scanné ne diffère pas de celle d'un PDF éditable, sauf pour le résultat que l'on peut attendre. En général, les PDF scannés auront de moins bons résultats.

Pour OmniPage, vous pouvez demander au programme de vous aider à interpréter votre document scanné. Vous pouvez en gros lui dire s'il y a un tableau, si c'est un paragraphe de texte ou si c'est une image. Il vous permet également d'indiquer l'orientation du texte lorsqu'il change. Ces instructions de base permettent d'optimiser le texte à traduire.

Un problème qui peut être insurmontable est lorsque la résolution du PDF scanné n'est pas suffisante pour effectuer une OCR. Les programmes OCR devront avoir une résolution minimale pour fonctionner. Si nous rencontrons ce problème, nous devrons demander que les documents soient rescannés à une résolution plus élevée. Si ce n'est pas possible, nous pouvons imprimer les documents et les scanner nous-mêmes, cela fonctionne parfois.

Un cas similaire de PDF scannés est celui des PDF dont le texte a été converti en traits. Dans les programmes de design tels qu'Illustrator, InDesign ou Corel, il y a la fonction de passer le texte à des graphiques courbes, perdant ainsi la possibilité de les éditer pour les traduire. Ceci est fait pour éviter d'avoir à envoyer les sources. En général, ce type de PDF permet une bonne conversion du texte.

6. PDF générés à partir de bases de données

PDF générés à partir de bases de données

Il existe de nombreux programmes qui utilisent le format PDF pour créer des documents à partir des informations contenues dans la base de données. Un exemple de cela pourrait être une simple facture ou un rapport généré à partir d'un ERP ou d'un CMR.

Les fiches de données de sécurité sont un exemple typique que l'on trouve habituellement dans les entreprises de traduction. La plupart des fiches de données de sécurité des produits sont générées à partir d'un programme de gestion qui dispose de toutes les informations nécessaires.

Étant donné que ces PDF ne sont pas générés à partir d'une conception précédente que vous pouvez avoir dans Word ou InDesign, ils ont tendance à générer des conversions plus problématiques. Les problèmes typiques sont le texte dans des zones de texte divisées, les colonnes dont le texte ne suit pas un ordre logique, les phrases coupées par des marques de paragraphe.

Les watermarks sont généralement le plus gros problème que l'on peut rencontrer dans ce type de documents lorsque l'on veut les traduire, car ils sont généralement placés là précisément pour éviter la conversion du document en un format éditable.

En conclusion, la traduction des fichiers PDF est souvent un casse-tête pour les chefs de projet des agences de traduction. Il existe une grande variété de problèmes possibles, et leur gestion peut parfois nécessiter un effort important en parallèle avec la traduction. Il est important que vous, en tant que client, soyez clair sur les résultats qui peuvent être obtenus à partir de la traduction d'un PDF. Dans de nombreux cas, obtenir le même format que l'original implique un important travail de mise en page que quelqu'un doit payer.

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 29/05/2019

Bien qu’il existe encore des départements marketing qui envoient des documents Word en vue de traduire des fichiers créés avec InDesign, un grand nombre d'entre eux savent déjà qu’ils peuvent envoyer directement les fichiers InDesign. Aujourd'hui, les logiciels de traduction assistée (TAO) utilisés par les traducteurs professionnels et les agences de traduction sont capables de filtrer le contenu des fichiers InDesign. Ce processus s’avère plus efficace puisqu'il évite la méthode manuelle du copier-coller, qui demande plus de temps et entraîne plus de risques en termes d’erreurs humaines. Voici quelques recommandations à prendre en compte pour intégrer de manière optimale la création de documents avec InDesign et la traduction de ces derniers.

[TOC]

Les conseils de ce blog peuvent et doivent modifier la méthode de travail du département de production pour permettre un flux de travail plus efficace dans l’ensemble de la chaîne de production multilingue. Il est donc primordial que les designers et les maquettistes comprennent le fonctionnement des traductions et les changements qu’elles entraînent afin d'être conscients que leur travail de design ou de mise en page peut modifier aussi bien la qualité que le coût de la traduction.

1. Comment les agences de traduction et les traducteurs professionnels traduisent-ils les fichiers InDesign ?

Aujourd'hui, et depuis plus de 30 ans, les traductions techniques et commerciales professionnelles sont presque entièrement réalisées à l'aide de logiciels de traduction assistée. Deux grandes caractéristiques distinguent ces logiciels : 1. Ils créent une base de données intégrant les traductions afin de pouvoir les réutiliser efficacement et permettre la recherche pertinente de termes déjà traduits ; 2. Ils sont capables d'extraire le texte à partir d'un grand nombre de formats, y compris InDesign, et de segmenter le contenu pour offrir une interface de traduction homogène qui comporte généralement deux colonnes.

Vous trouverez ci-dessous une capture d'écran de Trados SDL Studio, la référence du secteur et l'outil de traduction que nous utilisons principalement dans notre agence de traduction, bien qu’il existe des nombreuses alternatives :

Comme vous pouvez observer, le texte est structuré par segments. Le format des fichiers InDesign joue un rôle fondamental dans la façon dont ces segments sont créés. En général, un segment correspond à une phrase, mais dans tout les cas, il est préférable que le segment corresponde au moins à une unité grammaticale complète.

2. Les formats à éviter pour réussir une traduction de fichiers InDesign

La façon dont les fichiers InDesign ont été formatés peut affecter deux des fondements de la traduction : les segments traduits par le traducteur et la capacité de l'outil de TAO à identifier les répétitions dans le texte. Le premier aspect peut altérer la qualité de la traduction, tandis que le deuxième peut modifier la cohérence et le coût de la traduction. Cela est particulièrement vrai dans la traduction de manuels techniques ou d'autres documents comportant beaucoup de répétitions, que ce soit la traduction médicale ou d’autres domaines spécialisés. Dans d'autres cas, comme dans la traduction commerciale ou juridique, cet aspect n'aura pas beaucoup d'importance, car ce type de document ne contient généralement pas beaucoup de répétitions.

En général, les options de mise en page à éviter sont celles qui sont introduites au milieu d'une phrase. Les tabulations, les marques de paragraphe et les sauts de ligne sont des fonctions fréquemment utilisées pour ajuster le texte lors de la mise en page. Prenons par exemple un texte sur InDesign dans lequel ces fonctions ont été utilisées, puis intéressons-nous à leur effet sur la segmentation générée par l’outil de traduction. En général, les options de mise en page à éviter sont celles qui sont introduites au milieu d'une phrase. Les tabulations, les marques de paragraphe et les sauts de ligne sont des fonctions fréquemment utilisées pour ajuster le texte lors de la mise en page. Prenons par exemple un texte sur InDesign dans lequel ces fonctions ont été utilisées, puis intéressons-nous à leur effet sur la segmentation générée par l’outil de traduction.

Vous trouverez ci-dessous un aperçu de ce texte après que le fichier IDML d'InDesign ait été traité avec un outil de traduction assistée :

Nous observons donc dans ce cas une phrase qui se divise en plusieurs segments. Cela se doit principalement à l'utilisation des marques de paragraphe dans le but de couper des phrases pour des raisons de mise en page. Dans ces cas, il vaut mieux utiliser des sauts de ligne, qui auront une incidence sur la détection des répétitions par rapport à des phrases similaires où ils n'ont pas été utilisés, mais dont l’ajout n'entraînera pas la division d'une phrase en plusieurs segments.

Voici un exemple de la manière dont ce texte aurait pu être mis en page pour obtenir un format similaire et une segmentation qui peut simplifier le travail du traducteur tout en augmentant les probabilités de détecter les répétitions.

Nous observons ici le résultat final du texte suite à son traitement. Nous voyons que chaque phrase ou titre correspond à un segment :

3. Concevoir la mise en page en tenant compte de la longueur des traductions

Il va de soi que chaque langue a besoin d'un espace différent pour pouvoir transcrire la même information. Si cet aspect est pris en compte pendant l'étape de production des documents, cela pourrait améliorer la fluidité du processus de production des documents traduits, tout en réduisant le temps nécessaire pour adapter le texte traduit à la mise en page d’origine.

Si nous prenons l'anglais comme langue source, nous pouvons nous attendre à ce que la teneur du texte augmente de 20 % lors d’une traduction vers le français, de 30 % pour l’allemand, d'entre 20 % et 30 % pour l’espagnol et de 10 % pour l'italien, etc. Lors de la mise en page des fichiers InDesign traduits, le problème principal apparaît lorsque le fichier d'origine présente une structure de texte très étroite, avec de très petites tailles de police et un interlignage très réduit. Dans ces cas, davantage de temps sera nécessaire pendant la phase de mise en page afin de trouver des solutions permettant d'adapter une traduction plus dense, ce qui revient souvent à réduire les standards de mise en page du document original.

4. Zones de texte sur les images

Voici une autre recommandation qui concerne le traitement des images et des illustrations qui apparaissent sur les brochures publicitaires, catalogues et manuels. Cependant, cette option a un fort impact sur les ressources dont nous aurons ensuite besoin pour traduire ces documents.

L'ajout du texte à une image ou à une illustration qu'on va ensuite relier ou intégrer dans nos fichiers InDesign peut se faire de deux manières. La façon la plus rapide, et la plus naturelle, est d'ajouter le texte directement dans le programme d'édition d'image que nous utilisons (par exemple, Photoshop ou Illustrator). Dans ce cas, nous aurons besoin de traiter chacune des images avec le texte de chaque langue à traduire, que ce soit par copier-coller ou par le biais d'une application pour exporter/importer le texte de façon automatique (voir notre blog sur la traduction de fichiers Illustrator). Quoi qu'il en soit, les textes des images peuvent représenter une charge de travail importante. Par exemple, si nous avons un catalogue comportant 100 images avec du texte et que nous souhaitons le traduire dans 10 langues, sachant que nous consacrerions en moyenne 3 minutes pour la gestion et la mise en page, nous aurions besoin de 50 heures de travail. Par contre, si vous suivez notre conseil, vous pourrez réduire ce délai à 5-10 heures.

Dans les cas où, par des raisons de mise en page, il n'est pas nécessaire d'introduire le texte dans le programme d'édition d'image/illustration, la mise en page des traductions sera plus performante si nous ajoutons le texte directement dans des zones de texte sur les images liées dans le programme InDesign. Chez AbroadLink Traductions, lorsque nos clients font appel à nos services de traduction combinés à la mise en page multilingue afin traduire en plusieurs langues des fichiers InDesign avec des textes sur des images, la première étape pour préparer le document en vue de sa traduction sera la création de zones de texte, si possible, sur les images liées à InDesign. L’objectif ? Réduire le délai de livraison et le coût total du projet.

5. Conserver des versions d’images et d’illustrations comportant du texte modifiable

Lorsque, pour des raisons de mise en page, il est nécessaire d'utiliser le texte directement dans le programme d'édition, il est très important de disposer du fichier image avec le texte au format modifiable pendant l'étape de traduction. Il arrive souvent que, tout au long de la chaîne de production des documents, les fichiers au format modifiable à partir desquels les archives .jpg, .tiff ou .png ont été crées ne soient pas disponibles. Il s'agit de fichiers bitmap qui ne permettent pas d'éditer l'image séparément du texte. La localisation de ces archives est donc presque impossible, sauf si le texte se trouve sur un fond homogène. C'est le cas de brochures publicitaires, ou encore des catalogues, où le texte est placé sur une photographie créative. Le problème est souvent identique pour les fichiers d'images vectorielles (.eps ou .ai) qui permettent aux designers d’apporter des modifications créatives sur les textes. Ils utilisent généralement la version non modifiable du fichier pour contourner l’absence éventuelle des polices utilisées dans le fichier d’origine.

Le problème de la mise en page des traductions lorsqu'on ne dispose pas des fichiers modifiables, c'est que la recréation des fichiers à traduire à partir de ces fichiers augmente le temps du travail. De plus, on devra parfois se tourner vers des solutions qui changent la mise en page. En fin de compte, cela implique plus de temps, davantage de coûts et donnent parfois un résultat de mauvaise qualité.

6. Externalisation de la mise en page des versions traduites à des entreprises de traduction

Beaucoup d'entreprises ou agences de traduction telles qu’AbroadLink Traductions offrent aux clients des solutions complètes qui incluent la mise en page des fichiers traduits. Ces prestations ne sont pas des services de mise en page à proprement parler, car elles s’appuient sur les modèles des documents originaux pour introduire le texte traduit. Si nous externalisons des traductions à des entreprises de traduction, nous devrons leur envoyer les fichiers InDesign ainsi que les graphiques et les polices utilisées dans la mise en page. Comme nous l’avons expliqué précédemment, il est préférable de fournir les graphiques au format modifiable pour réduire les coûts et le temps de travail.

Le principal avantage de cette méthode par rapport à l'externalisation de la mise en page à des entreprises de design ou des agences de publicité, est que les entreprises de traduction ont généralement plus d'expérience dans la résolution des problèmes liés à la mise en page multilingue, tels que l’adaptation des textes traduits à l'espace disponible, la gestion des langues écrites de droite à gauche (comme l'hébreu ou l'arabe) ou l’utilisation des nouvelles polices Unicode qui comportent les caractères requis pour la langue cible.

Que faire si l'agence de publicité avec laquelle nous travaillons ne nous fournit pas les fichiers InDesign avec les éléments de la mise en page ?
 

Lorsque les brochures publicitaires ou les manuels ont été produits par une agence de publicité, il arrive fréquemment que, pour respecter les termes du contrat, vous ne soyez pas en mesure de fournir à l'entreprise de traduction les fichiers InDesign avec les polices et les graphiques correspondants. Dans ces cas, l'agence choisie devra également se charger de la mise en page des versions traduites. Cependant, il est possible que vous puissiez fournir à l'entreprise de traduction les fichiers au format IDML, ce qui lui permettra de vous livrer les fichiers traduits dans le même format en vue de sa future mise en page. Ce processus simplifie le travail de l'agence de publicité par rapport à l’envoi de traductions au format Word et permet de négocier une réduction du tarif de la mise en page.

7. Conclusion

La manière la plus efficace de traduire des fichiers InDesign est de les traiter au format IDML à l’aide d’outils de traduction assistée. Suivre une série de bonnes pratiques peut avoir un effet positif sur la qualité et le coût des traductions et sur la mise en page des versions traduites.

Avez-vous trouvé ce blog utile ? Aidez-nous et partagez-le sur les réseaux sociaux.

Vous travaillez avec une agence de traduction qui n'applique pas de réductions pour les répétitions ou qui n'offre pas de service de mise en page intégré au processus de traduction ? Pour votre prochain projet, n’hésitez pas à nous demander un devis de traduction et profitez de ces avantages.

Ces articles pourraient vous intéresser :

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 14/11/2017

AbroadLink avance un peu plus dans sa stratégie fondée sur sa philosophie d'entreprise : avancer grâce à la technologie. Au mois de février 2014, l’entreprise a réalisé les premiers projets pilotes avec SDL Trados Studio 2011, le logiciel de mémoire de traduction détenant la plus grosse part du marché et qui était intégré dans le logiciel de gestion en place dans l’entreprise depuis le mois de février 2013.

Plus connus sous le nom de « mémoires de traduction » ou d’ « outils de traduction assistée » ces logiciels créent une base de données composées de toutes les traductions effectuées par un traducteur professionnel.

Ces programmes rendent également possible l’extraction de texte pour les traductions de fichiers sous différentes formes (MS Word, PowerPoint, FrameMaker, InDesign, QuarkXpress...) et disposent de fonctions destinées à aider le traducteur (récupération de textes traduit antérieurement, recherche de termes dans la base de données, etc.).

Suzanne Bromly, chef de projet, confirme : « Ce nouveau processus de travail basé sur la relation entre le système de gestion et la mémoire de traduction, permet de renforcer la productivité et l'efficacité de la gestion, et garantie également un processus systématique de mise à jour des mémoires de traduction. »

L'entreprise espère atteindre d'ici fin juin la capacité maximale de cette installation, lorsque tous les réglages nécessaires concernant les fournisseurs et les clients auront été mise en place. Actuellement, des essais sont effectués sur l’ultime version du logiciel, « SDL Trados Studio 2014 » qui paraît pouvoir diminuer le temps de traitement.

Ce changement suppose aussi une avancée incontestable dans la course à la compétitivité comparé aux autres entreprises présentes sur le marché. L’utilisation de ces systèmes permet à l’entreprise d’être plus concurrentielle et d’arriver à des accords plus compétitifs pour les clients qui ont beaucoup de projets de petite taille, dont les frais de gestion sont parfois 50 % supérieurs aux coûts du projet.

Ces articles pourraient vous intéresser :

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1
Publié le 17/03/2017

Comment traiter des fichiers AutoCAD pour les traduire avec des outils de traduction assistée par ordinateur tels que Trados SDL Studio, memoQ, WordFast, Start Transit, Déjà Vu, etc Il contient aussi des recommandations pour anticiper certains problèmes que nous pourrons rencontrer durant le processus d'exportation et d'importation ou pour mettre en page les fichiers AutoCAD une fois traduits.

[TOC]

TranslateCAD : une application pour extraire le texte des fichiers AutoCAD qui marche!

Je ne connais aucun programme à ce jour qui ne présente pas d'erreurs, et c'est aussi le cas de cette application, TranslateCAD, mais le jour où nous l'avons découvert, les projets de mise en page sous AutoCAD ont commencé à être moins imprévisibles et plus rentables, ce qui nous permet de proposer des devis plus compétitifs. Une grande découverte donc !

Capture d'écran de TranslateCAD

Il s'agit d'une application assez intuitive et facile à manipuler. Je ne vais pas essayer de faire un exposé détaillé sur la manipulation du programme. Vous pourrez trouver des informations à cet égard sur le site du programmeur. Mais j'aimerais souligner que le programme ne fonctionne pas directement avec des fichiers natifs d'AutoCAD, qui ont l'extension DWG, mais avec le format d'échange de fichiers DXF. Par conséquent, la première chose à faire est de passer les fichiers AutoCAD en ce format. Cela peut être fait directement en ouvrant les fichiers AutoCAD et en les exportant sous ce format. Il existe aussi différentes applications pour faire cette conversion, dont certaines sont gratuites. Je parlerai ci-dessous de celle que nous utilisons et qui nous a permis d'obtemir de bons résultats.

À partir des fichiers DXF, le programme créé deux fichiers TXT : 1) le premier contient le texte extrait (avec le suffixe –trans1) que nous enverrons pour la traduction; 2) le second contient le code du fichier DXF (-trans2).

Une fois les fichiers TXT traduits reçus, nous inverserons le processus en important le texte et en obtenant les fichiers DXF avec les traductions. C'est alors que nous pourrons les ouvrir sous AutoCAD et les sauvegarder sous leur format original, DWG, dans la même version d'AutoCAD que celle dans laquelle nous les avons reçus. Ceci peut aussi être réalisé avec les programmes de conversion.

Il est possible d'acheter TranslateCAD ici. Le prix auquel est affiché cet article actuellement est de 26,5 €(29USD), ce qui suppose un petit investissement qui nous permettra de traduire des fichiers AutoCAD plus efficacement et professionnellement. Son coût sera amorti avec seulement quelques fichiers AutoCAD.

Qu'est-ce que les fichiers DXF?

DXF sont les initiales en anglais de Drawing Exchange Format (format d'échange de dessins). Il s'agit d'un format pour échanger des fichiers de dessin technique et industriel entre différents programmes de design. Il a été créé à la base pour pouvoir échanger des fichiers entre la principale application de dessin technique, AutoCAD, avec les autres programmes du marché. Pour obtenir plus d'informations sur les programmes qui permettent d'échanger des données à travers le format DXF, vous pouvez consulter l'entrée de Wikipedia.

Comment convertir les fichiers originaux AutoCAD (.DWG) en format d'échange (.DXF)?

Pour un processus facile de conversion des fichiers d'AutoCAD (.DWG). en format d'échange (.DXF), il est conseillé d'utiliser un programme de conversion. Si nous manipulons des dizaines ou des centaines de fichiers, ceci nous permettra d'économiser des heures de travail.

Nous avons obtenu de bons résultats avec l'application open source Teigha d'Open Design Alliance, qui convertit les fichiers DWG en format DXF et vice-versa, qui est un complément indispensable pour travailler efficacement avec TranslateCAD. Ce programme peut être obtenu ici gratuitement pour différentes plateformes. Pour Windows, il peut être téléchargé directement sur le site de l'Open Design Alliance en cliquant ici.  

Recommandation 1 : vérifier que la conversion en DXF fonctionne correctement.

L'un des problèmes que nous pouvons rencontrer est que la conversion en format DXF échoue, que ce soit en le créant avec un convertisseur ou avec AutoCAD même. Quand cela arrive, en général, nous obtiendrons une erreur en essayant d'extraire le texte avec TranslateCAD.

 

Il est aussi conseillé d'ouvrir le fichier DXF obtenu sous AutoCAD pour vérifier que le fichier est le même que l'original et qu'aucune information n'est perdue. De cette façon, nous éviterons de mauvaises surprises avant que cela ne soit trop tard.

L'impossibilité de convertir le format DWG à DXF peut être insurmontable. L'évolution rapide et complexe du format DWG fait qu'il existe des caractéristiques de ce fichier qui ne peuvent être traduites en format DXF. Cela va arriver avec des fichiers AutoCAD qui utilisent des fonctions avancées et complexes du programme. Quand cela arrive, nous n'allons pas pouvoir travailler avec TranslateCAD.

Recommandation 2 : préparer le texte pour une traduction facile

À de nombreuses occasions, le texte en AutoCAD apparaît dans des phrases entrecoupées, avec des marques de paragraphes. Cela complique la tâche du traducteur, qui devra disposer du document en PDF pour disposer du contexte et comprendre correctement l'ordre des segments. Des fois, cela impliquera de devoir inverser l'ordre des traductions dans les segments de texte.

En fonction du nombre de fichiers, du budget et du temps, l'idéal est de changer le format du texte pour que toutes les phrases apparaissent dans un seul segment, ce qui aidera le traducteur.

Inclusion de coordonnées

Le programme inclut une option pour aider le traducteur à localiser le texte s'il doit connaître le contexte. Les coordonnées X et Y sont incluses dans ce but si nous cochons l'option correspondante.

Recommandation 3 : vérifier s'il y a du texte tracé ou bitmap

De même que dans tout autre travail d'extraction de texte avec des filtres ou de mise en page, nous allons procéder à rechercher les éléments tracés (il s'agit d'images vectorielles) ou qui sont en bitmap (image matricielle). Comme ce texte n'est pas éditable en format d'image, TranslateCAD ne pourra pas extraire le texte pour le traduire. Nous devrons extraire le texte manuellement et le rendre éditable.

Rencontrer ce type de texte en format d'image est une mauvaise pratique quand les fichiers vont être traduits et manipulés. Il est conseillé de communiquer cela si nous travaillons régulièrement avec le créateur des fichiers, pour rendre le processus le plus économique et le plus rapide possible. Cette recommandation est aussi valable pour d'autres types de fichiers, tels que Word, QuarkXpress, Illustrator, FrameMaker ou InDesign, entre autres.

Recommandation 4, éliminer les codes ##numéro##

TranslateCAD inclura une ligne de code, dans le fichier TXT qui est envoyé au traducteur, qui est attribuée à chaque segment en utilisant la marque “##”. Bien que certains programmes d'aide à la traduction ne compteront pas ces lignes (comme dans le cas des versions de Trados et WordFast qui travaillent depuis l'interface de Word), il est conseillé d'effacer ces lignes pour réaliser le décompte et l'analyse de mots. SDL Studio, par exemple, comprendra que ces lignes de code sont du texte à traduire, ce qui augmentera sensiblement le décompte et la facture de la traduction.

 

Bien qu'il soit possible de créer un document Word avec les fichiers TXT et avec une macro, marquer ces lignes comme invisibles, ce processus peut prendre beaucoup de temps. Nous utilisons Notepad++, un éditeur de fichiers TXT avancé open source, qui nous permet d'éliminer rapidement ces séquences pour créer les fichiers que nous allons analyser par rapport aux bases de données avec les traductions (mémoire de traduction, dans le langage professionnel) pour utiliser une expression courante. Consulter la capture d'écran précédente pour voir comment cela est réalisé. Les traducteurs devront nécessairement travailler avec les fichiers qui présentent des lignes de code avec ce processus. Ces lignes de code ne supposent pas un grand problème pour le traducteur qui travaille avec un outil de traduction, étant donné que, une fois inséré le premier segment, celui-ci se propagera dans tous les segments avec des lignes de code.

Recommandation 5 : vérifier que les fichiers TXT traduits ont le codage UTF.

Notre expérience nous a démontré qu'il existe des programmes de traduction assistée qui ne rendent pas un TXT en format Unicode. Cela peut supposer un problème pour convertir à nouveau le fichier en format DXF une fois les fichiers traduits reçus. Il est possible de vérifier cela en ouvrant un fichier avec le bloc notes de Windows et en cliquant sur “Sauvegarder comme”. Nous pourrons voir la codification du fichier. Dans le cas de Notepad**, que j'ai mentionné dans le paragraphe précédent, il est possible de consulter ces informations directement dans le menu principal.

Conclusion

TranslateCAD, utilisé avec Teigha, est une solution qui fonctionne pour le traitement en lots de fichiers AutoCAD qui doivent être traduits et mis en page. Le processus est compatible virtuellement avec toutes les langues, car il utilise une codification Unicode. La plus grande limitation du processus est l'impossibilité de convertir des fichiers DWG en DXF.

J'espère que cette article a été utile à ceux qui recherchent une solution pour les fichiers AutoCAD.

Ces articles pourraient vous intéresser :

Portrait de Josh Gambin
Josh Gambin

Josh Gambin est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AbroadLink et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo
1