Le livre 010101 (1971-2015)

Une information plurilingue

Des logiciels de traduction

Dès décembre 1997, le moteur de recherche AltaVista lance Babel Fish Translation, un logiciel de traduction automatique de l’anglais vers cinq autres langues (allemand, espagnol, français, italien, portugais) et vice versa. Alimenté par un dictionnaire multilingue de 2,5 millions de mots, ce service gratuit est l’œuvre de Systran, société pionnière en traitement automatique des langues. Le texte à traduire doit être de trois pages maximum et la traduction apparaît en vis-à-vis sur l’écran. La traduction étant entièrement automatisée, elle est évidemment très approximative. Si cet outil a ses limites, il est immédiatement plébicité par les usagers non anglophones et il préfigure les outils développés les années suivantes par Systran, Alis Technologies, Globalink et Lernout & Hauspie, avec des versions en accès libre.

Le but d’un logiciel de traduction est d’analyser le texte dans la langue source (texte à traduire) et de générer automatiquement le texte correspondant dans la langue cible (texte traduit), en utilisant des règles précises pour le transfert de la structure grammaticale. Comme l’explique l’EAMT (European Association for Machine Translation) en 1998 sur son site web, «il existe aujourd’hui un certain nombre de systèmes produisant un résultat qui, s’il n’est pas parfait, est de qualité suffisante pour être utile dans certaines applications spécifiques, en général dans le domaine de la documentation technique. De plus, les logiciels de traduction, qui sont essentiellement destinés à aider le traducteur humain à produire des traductions, jouissent d’une popularité croissante auprès des organismes professionnels de traduction.»

À la même date, un historique de la traduction automatique est présent sur le site de Globalink, société spécialisée dans les produits et services de traduction. Le site a depuis disparu, Globalink ayant été racheté en 1999 par Lernout & Hauspie, lui-même racheté en 2002 par ScanSoft, mais voici cet historique résumé dans le paragraphe suivant.

La traduction automatique et le traitement de la langue naturelle font leur apparition à la fin des années 1930, et progressent ensuite de pair avec l’évolution de l’informatique quantitative. Pendant la deuxième guerre mondiale, le développement des premiers ordinateurs programmables bénéficie des progrès de la cryptographie et des efforts faits pour tenter de fissurer les codes secrets allemands et autres codes de guerre. Le secteur émergent des technologies de l’information continue ensuite de s’intéresser de près à la traduction et à l’analyse du texte en langue naturelle. Les recherches portent surtout sur la traduction littérale, à savoir la traduction mot à mot sans prise en compte des règles linguistiques. Un projet de l’Université de Georgetown (États-Unis) débuté en 1950 représente la première tentative systématique visant à créer un système de traduction automatique utilisable de l’anglais vers le russe. Quelques recherches du même genre sont également menées en Europe. En 1965, les progrès rapides en linguistique théorique culminent avec la publication de l’ouvrage Aspects de la théorie syntaxique de Noam Chomsky, qui propose de nouvelles définitions pour la phonologie, la morphologie, la syntaxe et la sémantique du langage humain. En 1966, un rapport officiel américain donne une estimation prématurément négative des systèmes de traduction automatique, mettant fin au financement et à l’expérimentation dans ce domaine pour la décennie suivante. Il faut attendre la fin des années 1970 pour que des expériences sérieuses soient à nouveau entreprises, parallèlement aux progrès de l’informatique et des technologies des langues. Cette période voit le développement de systèmes de transfert d’une langue à l’autre et le lancement des premières tentatives commerciales. Des sociétés comme Systran et Metal sont persuadées de la viabilité et de l’utilité d’un tel marché. Elles mettent sur pied des produits et services de traduction automatique reliés à un serveur central. Mais les problèmes restent nombreux, par exemple les coûts élevés en recherche et développement, un énorme travail lexicographique, la difficulté de proposer de nouvelles combinaisons de langues et l’inaccessibilité de tels systèmes pour l’utilisateur moyen.

En 2000, la généralisation de l’internet et les débuts du commerce électronique entraînent la naissance d’un véritable marché. Trois sociétés – Systran, Softissimo et Lernout & Hauspie – lancent des produits à destination du grand public, des professionnels et des industriels. Systran développe un logiciel de traduction utilisé notamment par le moteur de recherche AltaVista. Softissimo commercialise la série de logiciels de traduction Reverso, à côté de produits d’écriture multilingue, de dictionnaires électroniques et de méthodes de langues. Reverso est utilisé par exemple par Voilà, le moteur de recherche de France Télécom. Lernout & Hauspie (racheté depuis par ScanSoft) propose des produits et services en dictée, traduction, compression vocale, synthèse vocale et documentation industrielle.

Mais la tâche est titanesque pour ne pas se limiter à l’anglais et à quelques autres langues. Comme le souligne en février 2001 Pierre-Noël Favennec, expert à la direction scientifique de France Télécom R&D, «les recherches sur la traduction automatique devraient permettre une traduction automatique dans les langues souhaitées, mais avec des applications pour toutes les langues et non les seules dominantes (ex.: diffusion de documents en japonais, si l’émetteur est de langue japonaise, et lecture en breton, si le récepteur est de langue bretonne...). Il y a donc beaucoup de travaux à faire dans le domaine de la traduction automatique et écrite de toutes les langues.»

En mars 2001, IBM se lance à son tour dans un marché en pleine expansion avec un produit professionnel haut de gamme, le WebSphere Translation Server. Ce logiciel traduit instantanément en huit langues (allemand, anglais, chinois, coréen, espagnol, français, italien, japonais) les pages web, les courriels et les dialogues en direct (chats). Il interprète 500 mots à la seconde et permet l’ajout de vocabulaires spécifiques. D’autres langues viennent ensuite s’ajouter aux huit langues de base.

Wordfast – lancé dès 1999 à Paris par Yves Champollion - est un logiciel de traduction avec gestion de la terminologie en temps réel et contrôle typographique. Il est compatible avec d'autres logiciels très utilisés comme le WebSphere Translation Server d'IBM et les logiciels de Trados. Une version simplifiée de Wordfast est même téléchargeable gratuitement, avec un manuel d'utilisation disponible en seize langues, bien avant une application gratuite sur le web. En 2010, Wordfast est le numéro un mondial des logiciels de traduction utilisables aussi bien sur plateforme Windows (Microsoft) que sur plateforme Mac OS (Apple), et le numéro deux mondial en nombre de ventes (après SDL Trados), avec 20.000 clients dans le monde, dont les Nations Unies, Nomura Securities, la NASA (National Aeronautics and Space Administration) et McGraw-Hill.

Table des matières