|
|

Problèmes et solutions pour la traduction des fichiers PDF

Publié le 05/11/2020

Les fichiers PDF sont l'un des formats les plus répandus pour l'affichage de contenu textuel dans les documents. C'est pourquoi c'est souvent le seul format dont nous disposons pour traduire un contrat, une brochure, une fiche technique ou un notice. Toutefois, les fichiers PDF ne sont que des fichiers d'échange de contenu. En fait, PDF signifie Portable Document Format.

La seule raison d'être d'un fichier PDF est que nous pouvons le voir et le partager sans problème de compatibilité. Il est important de comprendre cela. Un fichier PDF peut être modifié, mais il n'est pas réellement destiné à être modifié.

Voyons ici ce que nous devons faire pour pouvoir traduire un PDF à l'aide des programmes de traduction assistée par ordinateur utilisés par les traducteurs professionnels et les agences de traduction. Ou pour utiliser facilement un traducteur automatique comme Google Translator, si nous n'avons pas besoin d'une traduction fiable à 100 %. Ou même si nous voulons simplement traduire à l'ancienne, en écrasant le texte, mais en conservant le format du document.

Pour utiliser la technologie linguistique, nous devrons disposer du fichier PDF dans un format modifiable que nous pourrons facilement manipuler. La façon la plus normale de les traduire est de les convertir en Word. Il peut s'agir d'un document .doc ou .docx.

1. Quelle est la solution idéale pour traduire un fichier PDF ?

Quelle est la solution idéale pour traduire un fichier PDF

Cela va sembler un peu stupide, mais la meilleure façon de traduire un fichier PDF est de ne pas le traduire. Il vaut mieux ne pas traduire le fichier PDF mais le fichier original, modifiable, avec lequel le PDF a été créé.

Par exemple, si ce fichier PDF a été créé en Word, il est préférable d'utiliser le fichier Word original. S'il a été créé avec FrameMaker ou InDesign, il est préférable d'utiliser ces formats. Si vous avez des fichiers InDesign et que vous pouvez oublier le PDF, notre blog pourrait vous intéresser : « Traduction : fichiers InDesign »

Cependant, il est tout à fait possible que votre entreprise ne sache plus où se trouvent les fichiers originaux ou qui les a créés. Ou, si vous êtes un distributeur ou un importateur, il est possible que le fabricant ne vous ait fourni que les fichiers PDF pour faire la traduction.

Cependant, il vaut la peine d'investir un peu de temps pour vérifier si quelqu'un les possède encore, ou d'insister pour que le fabricant nous les envoie. Cela nous évitera bien des maux de tête pendant la traduction. Quand je parle des maux de tête, je veux dire comme d'habitude : du temps et de l'argent.

Lorsque nous voulons préserver le format du texte original, il est encore plus important d'obtenir les originaux. Les fichiers PDF sont généralement créés en version basse résolution, ils ne fonctionneront donc pas si nous en avons besoin pour l'impression.

D'autre part, lorsque nous convertirons les fichiers PDF en Word pour la traduction, nous constaterons que le format (je fais ici référence à la composition des textes et des images) peut changer considérablement. Il peut donc être très laborieux et coûteux de reproduire 100% du format original.

En bref, les meilleurs résultats en termes de qualité et de temps/argent pour le texte traduit seront obtenus en travaillant à partir des originaux. Cependant, vous ne seriez probablement pas en train de lire cet article si vous le faisiez, n'est-ce pas ?

2. Comment savez-vous avec quel programme le PDF a été créé ?

Comment connaître le programme utilisé pour créer le PDF

En général, nous pourrons facilement savoir avec quel programme le PDF original a été créé. Si nous ouvrons le PDF avec Acrobat ou Acrobat Reader et que nous allons dans Fichiers>Propriétés, nous pouvons voir l'application utilisée pour le créer. Voici un exemple de PDF créé en Word :

Acrobat Reader

Comme nous le voyons, nous pouvons également voir qui est l'auteur et la date de création, ce qui peut nous donner un indice sur qui demander les originaux.

3. Pourquoi convertir un PDF en Word pour la traduction ?

Comme je l'ai dit, la solution standard pour la traduction des fichiers PDF utilisés par les sociétés de traduction est de passer par Word. Cependant, quelqu'un pourrait penser que cela n'a pas de sens car les fichiers PDF peuvent être édités.

Eh bien, c'est vrai dans une certaine mesure. Tout d'abord, oui, ils peuvent être modifiés, mais pour cela, nous devons disposer de la version professionnelle payante d'Acrobat. La plupart des traducteurs disposent de la version gratuite : Acrobat Reader. Cette version gratuite est limitée à quelques fonctions.

Deuxièmement, même si nous faisons appel à un traducteur qui dispose de la version professionnelle, la modification du texte dans Acrobat prendra beaucoup plus de temps. Nous pourrons peut-être convaincre les traducteurs débutants de travailler de cette manière à leur tarif habituel.
Cependant, les traducteurs professionnels plus expérimentés sont susceptibles de nous demander un supplément. Dans le pire des cas, ils rejetteront directement un projet de traduction dans ces conditions.

Ces deux problèmes peuvent être résolus en envoyant un fichier Word à traduire. En outre, les fichiers Word permettront aux traducteurs ou aux agences de traduction d'utiliser des outils d'aide à la traduction. Ces outils permettent de créer une base de données des traductions effectuées par le traducteur professionnel.

Ces outils vous permettent également d'analyser la quantité de texte répété des documents à traduire. Cela est particulièrement important lorsqu'il s'agit de traduire des notices techniques.

Les notices techniques comportent souvent beaucoup de textes répétés, tant dans le même notice qu'entre les notices de produits similaires. De nombreux traducteurs ou agences de traduction, comme nous, accepteront d'offrir des réductions en fonction du volume de texte répété.

La conversion d'un PDF en Word peut être une étape très simple et efficace. Il y a aussi des cas où ce sera un véritable casse-tête. Ensuite, nous expliquerons comment créer un fichier Word en fonction du type de PDF dont nous disposons.

4. Comment traduire un fichier PDF éditable

Comment traduire un fichier PDF éditable

Une fois que nous nous serons assurés de ne pas avoir les fichiers originaux, il n'y aura pas d'autre choix que d'utiliser les fichiers PDF pour les traduire. La meilleure situation que l'on puisse trouver est que les fichiers sont modifiables.

Lorsque nous disons qu'ils sont modifiables, nous voulons dire que le texte du PDF peut être facilement modifié. C'est-à-dire qu'il ne s'agira pas d'une image comme dans le cas des PDF scannés ou des textes dessinés. Nous examinerons ces cas plus tard.

La meilleure solution sera de convertir le PDF en un document Microsoft Word. Ce format de fichier est pratiquement une norme aujourd'hui. Cela signifie que nous pouvons les envoyer à n'importe quel traducteur ou société de traduction. Aujourd'hui, tous les professionnels de la traduction disposent de Word ou d'un programme compatible.

Les documents Word sont également facilement manipulables par les programmes de traduction. Par programmes de traduction, j'entends à la fois les outils de traduction assistée par ordinateur (tels que SDL ou memoQ) et les outils de traduction automatique (tels que Google Translator).

Le secret pour obtenir une bonne conversion de PDF en Word est le programme que nous utilisons. Il existe sur le marché toute une série de programmes appelés OCR qui font des conversions très décentes. Il s'agit de programmes qui sont sur le marché depuis des années et qui ont atteint leur maturité.

D'après notre expérience dans notre agence de traduction, les meilleurs programmes sont Adobe Acrobat, Omnipage et Abbyy FineReader. Il existe également d'autres bons programmes. Voir d'autres programmes sur ce blog : Les 6 meilleurs programmes OCR pour la numérisation de documents.

La meilleure pratique consiste à avoir plusieurs de ces programmes, si notre budget le permet. Selon le document, il arrive qu'Adobe Acrobat nous donne un résultat optimal. D'autres fois, il s'agira d'OmniPage ou d'Abby FineReader.

Une fois que nous aurons le document converti, nous devrons revoir le format et le modifier si nécessaire. Par exemple, le convertisseur peut avoir placé une marque de paragraphe en scindant les phrases. Ce format compliquera le processus de traduction et doit être évité.

5. Comment puis-je traduire un fichier PDF scanné (ou tracé)

Comment puis-je traduire un fichier PDF scanné (ou tracé)

La conversion d'un PDF scanné ne diffère pas de celle d'un PDF éditable, sauf pour le résultat que l'on peut attendre. En général, les PDF scannés auront de moins bons résultats.

Pour OmniPage, vous pouvez demander au programme de vous aider à interpréter votre document scanné. Vous pouvez en gros lui dire s'il y a un tableau, si c'est un paragraphe de texte ou si c'est une image. Il vous permet également d'indiquer l'orientation du texte lorsqu'il change. Ces instructions de base permettent d'optimiser le texte à traduire.

Un problème qui peut être insurmontable est lorsque la résolution du PDF scanné n'est pas suffisante pour effectuer une OCR. Les programmes OCR devront avoir une résolution minimale pour fonctionner. Si nous rencontrons ce problème, nous devrons demander que les documents soient rescannés à une résolution plus élevée. Si ce n'est pas possible, nous pouvons imprimer les documents et les scanner nous-mêmes, cela fonctionne parfois.

Un cas similaire de PDF scannés est celui des PDF dont le texte a été converti en traits. Dans les programmes de design tels qu'Illustrator, InDesign ou Corel, il y a la fonction de passer le texte à des graphiques courbes, perdant ainsi la possibilité de les éditer pour les traduire. Ceci est fait pour éviter d'avoir à envoyer les sources. En général, ce type de PDF permet une bonne conversion du texte.

6. PDF générés à partir de bases de données

PDF générés à partir de bases de données

Il existe de nombreux programmes qui utilisent le format PDF pour créer des documents à partir des informations contenues dans la base de données. Un exemple de cela pourrait être une simple facture ou un rapport généré à partir d'un ERP ou d'un CMR.

Les fiches de données de sécurité sont un exemple typique que l'on trouve habituellement dans les entreprises de traduction. La plupart des fiches de données de sécurité des produits sont générées à partir d'un programme de gestion qui dispose de toutes les informations nécessaires.

Étant donné que ces PDF ne sont pas générés à partir d'une conception précédente que vous pouvez avoir dans Word ou InDesign, ils ont tendance à générer des conversions plus problématiques. Les problèmes typiques sont le texte dans des zones de texte divisées, les colonnes dont le texte ne suit pas un ordre logique, les phrases coupées par des marques de paragraphe.

Les watermarks sont généralement le plus gros problème que l'on peut rencontrer dans ce type de documents lorsque l'on veut les traduire, car ils sont généralement placés là précisément pour éviter la conversion du document en un format éditable.

En conclusion, la traduction des fichiers PDF est souvent un casse-tête pour les chefs de projet des agences de traduction. Il existe une grande variété de problèmes possibles, et leur gestion peut parfois nécessiter un effort important en parallèle avec la traduction. Il est important que vous, en tant que client, soyez clair sur les résultats qui peuvent être obtenus à partir de la traduction d'un PDF. Dans de nombreux cas, obtenir le même format que l'original implique un important travail de mise en page que quelqu'un doit payer.

Portrait de José Gambín
José Gambín

José Gambín Asensio est diplômé en sciences biologiques à l’université de Valence et en traduction et interprétation à l’université de Grenade. Il a occupé diverses fonctions comme chef de projets, maquettiste ainsi que traducteur free-lance. Depuis 2002, il est l’un des fondateurs de AL Traductions et occupe actuellement le poste de Directeur des Ventes et du Marketing.

linkedin logo

Ajouter un commentaire