|
||||||||||||||||
|
La
question de l’intelligence des ordinateurs (Michel
Volle) par Michel Volle "These machines have no common sense; they do exactly as they are told, no more and no less. This fact is the hardest concept to grasp when one first tries to use a computer" (Donald E. Knuth, The Art of Computer Programming, Addison Wesley 1997, volume 1, p. v) Parmi les fausses questions que conduit à se poser un concept mal bâti, se trouve la fameuse question de l’" intelligence " des ordinateurs. La plupart des ingénieurs qui conçoivent les ordinateurs font une distinction précise entre l’ordinateur et l’être humain. L'ordinateur a une mémoire parfaite (et aussi volumineuse que l’on veut), une vitesse de calcul élevée, une grande discipline dans l’exécution de tâches répétitives, et une totale insensibilité à la fatigue. Par contre il a besoin de recevoir des consignes précises et exactes : si le programme contient une erreur de frappe ou de syntaxe, il ne saura pas la corriger et s’arrêtera (ou il commettra une erreur). L’ordinateur ne sait pas réaliser des choses que l'être humain apprend à faire lors des premières années de sa vie : il ne comprend pas le langage humain ordinaire, avec ses allusions et ses connotations. Il ne sait pas faire la synthèse d’un ensemble de faits et en tirer la conclusion. Il ne sait pas prendre de décision. Il n’a pas d’imagination. Si l’on a l’impression qu’il sait faire tout cela, c’est que l’on commet une erreur classique : celle qui consiste à dire " l’ordinateur calcule " quand on utilise l’ordinateur pour faire un calcul, ou que "l'ordinateur décide" quand on l'utilise pour aider la décision. En fait ce n’est pas l’ordinateur qui calcule, mais l’utilisateur qui se fait aider par l’ordinateur pour calculer. Les écrivains de science fiction, les cinéastes, créent un monde imaginaire ; il leur est facile d’y doter les ordinateurs de facultés extraordinaires, comme l’a fait Stanley Kubrick dans " 2001 : odyssée de l’espace ", ou de mettre en scène des robots qui se comportent comme des êtres humains. Ils sculptent ainsi un imaginaire fallacieux. Certes chacun est libre d’imaginer qu’un jour les ordinateurs pourront avoir toutes les facultés qu’un être humain a héritées de quatre milliards d’années de vie, de trois millions d’années d’humanité. Mais on peut aussi imaginer qu’il existe, entre l’automate programmable qu’est l’ordinateur et l’être humain, une différence essentielle. Admettons que le choix entre ces deux hypothèses soit indécidable, et remettons-nous à la pratique pour décider laquelle est la plus efficace : dans le monde d’aujourd’hui, dans notre relation avec l’informatique, quelle est la meilleure des deux hypothèses, la plus féconde ? il me paraît clair que c’est la seconde. En effet, nous devons pouvoir penser la relation entre l’être humain et l’ordinateur, puisque cette machine est devenue notre outil de travail quotidien. Et si notre imagination s’amuse à confondre leurs facultés, comment pourrons-nous penser cette relation et l’organiser ? On ne peut pas penser la relation entre deux êtres " au fond " identiques. On ne peut penser de relation qu’entre des êtres différents, et qu'à partir du moment où l'on pense cette différence. Il arrive souvent, observons-le, que l’on croie devoir fusionner sous un même concept des êtres qui entretiennent une relation forte en disant " tout cela c’est pareil, puisqu’ils sont en forte relation ". C’est une erreur : il faut les distinguer pour pouvoir décrire la façon dont ils s’articulent. Les philosophes saisis par la modernité ont pris avec une légèreté coupable le relais des écrivains de science fiction. Ainsi Michel Serres : " Aujourd’hui notre mémoire est dans le disque dur. De même, grâce au logiciel, nous n’avons plus besoin de savoir calculer ou imaginer. L’humain a la faculté de déposer les fonctions de son corps dans les objets. Et il en profite pour faire autre chose. " Ou encore Pierre Levy : " Tout autant que la recherche utilitaire d'information, c'est la sensation vertigineuse de plonger dans le cerveau commun et d'y participer qui explique l'engouement pour Internet. Naviguer dans le cyberespace revient à promener un regard conscient sur l'intériorité chaotique, le ronronnement inlassable, les banales futilités et les fulgurations planétaires de l'intelligence collective. L'accès au processus intellectuel du tout informe celui de chaque partie, individu ou groupe, et alimente en retour celui de l'ensemble. " D’autres, comme Neil Postman, sont plus nuancés, plus prudents et sans doute plus raisonnables : " Il est sous-entendu que l’ordinateur a une volonté, des intentions, des raisons - ce qui signifie que les humains sont délivrés de toute responsabilité à l’égard des décisions de l’ordinateur. Par une curieuse forme d’alchimie grammaticale, la phrase " Nous nous servons de l’ordinateur pour calculer " en vient à signifier " L’ordinateur calcule ". Si un ordinateur calcule, alors il peut décider de se tromper ou de ne pas calculer du tout. C’est ce que veulent dire les employés de banque quand ils vous disent qu’ils ne peuvent pas vous indiquer combien vous avez sur votre compte en banque, parce que " les ordinateurs sont plantés ". Cela sous-entend, bien sûr, que personne dans la banque n’est responsable. " Pour progresser dans l’utilisation de l’ordinateur, il faut se rappeler qu’il s’agit d’un " automate programmable " ; il obéit à la lettre, sans initiative ni interprétation, aux ordres qui lui sont donnés ; il apporte à l’être humain une aide précieuse, mais bien délimitée. L’expression " assisté par ordinateur ", que l’on utilise pour le dessin, la gestion, la conception etc., a une portée générale : en tout et pour tout, l’ordinateur nous assiste ; les utilisations les plus intelligentes de l’informatique sont celles qui cultivent cette relation entre l’ordinateur et nous, en partant d'une claire conscience de la différence qui nous sépare de lui. Un exemple : la traduction " automatique "La " traduction automatique " est un mythe : la mise au point d’un logiciel capable de traduire automatiquement des textes littéraires d’une langue à l’autre serait très coûteuse, et sa recherche a abouti à des résultats décevants. En fait la traduction automatique ne donne de résultat satisfaisant qu’avec des textes formalisés, techniques, qui ne comportent aucune surprise du point de vue de la syntaxe et qui ne font aucun recours aux connotations. Par contre les textes littéraires, proches de la langue ordinaire, donnent des résultats ridicules lorsqu’ils sont soumis à la traduction automatique. Illustrons la qualité des logiciels de traduction en appliquant le logiciel utilisé par AltaVista à un paragraphe de la lettre de Bill Gates de 1976 : To me, the most critical thing in the hobby market right now is the lack of good software courses, books and software itself. Without good software and an owner who understands programming, a hobby computer is wasted. Will quality software be written for the hobby market? On obtient ceci : À moi, la chose la plus critique sur le marché de passe-temps est en ce moment le manque de bons cours, de livres et de logiciel de logiciel lui-même. Sans bon logiciel et propriétaire qui comprend programmant, un ordinateur de passe-temps est gaspillé. Le logiciel de qualité sera-t-il écrit pour le marché de passe-temps? Il est beaucoup plus facile d’écrire un bon logiciel de traduction assistée par ordinateur, qui aidera à faire de bonnes traductions un traducteur connaissant bien la langue de départ et très bien la langue d’arrivée. Mais comme on a été aveuglé par le mythe de l’automatisation, on a dépensé des fortunes à mettre au point la traduction automatique au lieu de chercher comment aider au mieux les traducteurs. La traduction automatique peut être utilisée pour balayer un ensemble de textes écrits dans une langue que l'on ignore et repérer ceux qui méritent d'être traduits ; ensuite la traduction sera faite par un être humain assisté par l'ordinateur. On est loin, avec cette utilisation - réelle, mais relativement modeste - des ambitions initiales et si onéreuses de la traduction automatique. Source : Michel Volle copyright 15 décembre 2000 [Le Figaro - 1er juillet 1998] Digital fournit depuis peu aux internautes un logiciel de traduction en "ligne" sur le site de son "moteur de recherche" Altavista (http://www.altavista.digital.com), dans la rubrique "services". Les utilisateurs pourront traduire de l'anglais vers le français, l'allemand, l'espagnol, l'italien et le portugais. Il sera possible d'aller de chacune de ces langues vers l'anglais. Mais il n'est malheureusement pas possible de passer directement de l'une à l'autre en évitant la langue de Shakespeare. Les résultats sont assez convaincants. Mais on constate des approximations pour toutes les formulations un peu particulières. Toutefois, le logiciel comprend mieux l'argot que les gallicismes. Ceux qui seront séduits pourront télécharger les logiciels de Systran, le fournisseur de cette technologie, et traduire leurs textes. ***** Nous avons testé pour vous... Vous souvenez-vous du " lifeblood pour la survie dans today’s le monde qui rapide-changeant " ? Il s’agissait d’une traduction mémorable que nous avait faite le service de traduction automatique payant de CompuServe. Service de traduction automatique parfaitement inutile et qui serait comique si nos métiers n’étaient pas dévalorisés par ce type de service qui fait croire à tort au grand public qu’il peut faire l’économie d’un traducteur professionnel " humain ". Alors quand est-il de ce système Systran de traduction automatique dont nous parle le Figaro dans cet article ? J’ai soumis le système à un petit test. Voici les résultats : Traduction générale de l’anglais vers le français : "Monica Lewinsky is reportedly prepared to testify that she and President Clinton discussed ways of concealing an alleged sexual relationship. Lewinsky’s lawyers announced that she has received a complete immunity deal for her full and truthful testimony." "Monica Lewinsky est censément disposé à témoigner qu'elle et le Président Clinton ont discuté des voies de cacher un rapport sexuel allégué. Les avocats de Lewinsky ont annoncé qu'elle a reçu une affaire complète d'immunité pour son plein et véridique témoignage". Traduction technique de l’anglais vers le français : "Until synchronization is complete, failover cannot take place. As soon as static replication is complete and the data on each server is identical, the secondary server is ready to stand in for the primary if a failover occurs." "Jusqu'à ce que la synchronisation soit complète, le failover ne peut pas avoir lieu. Dès que la réplique statique sera complète et les données sur chaque serveur sont identiques, le serveur secondaire est prêt à remplacer le primaire si un failover se produit". Force est de constater que nous avons ici à faire à une nouvelle génération d’outils de traduction automatique et que les résultats obtenus se sont considérablement améliorés. Nous pouvons constater que cet outil, même s’il ne maîtrise pas la terminologie spécialisée, est doté d’une certaine capacité d’analyse grammaticale qui permet d’obtenir un texte brut à peu près compréhensible, ce qui n’était pas le cas auparavant. Il faut également souligné que les traductions ci-dessus ont été effectuées gratuitement et à une vitesse foudroyante (cinq à dix secondes). Les résultats obtenus sont assez troublants car on peut imaginer que l’on demande bientôt aux traducteurs de se transformer, pour certains types de travaux, en réviseurs de traduction automatique, ce qui ferait subir à notre métier une mutation sans précédent : notre travail consistant alors à vérifier la traduction automatique et à reformuler le texte obtenu. Est-ce l’avenir de la traduction ? Je vous invite à aller tester cet outil de traduction automatique et à nous envoyer vos commentaires ! Olivier André Ouaibe et traduction - Que craindre du Systran ? Un article de Jacques Lesca, membre AAE-ESIT (T83). Invitées par l'article d'Olivier André et provoquées par la reproduction de l'article du Figaro de juillet 98 dans le précédent bulletin (p.15), les lignes ci-après cherchent à faire (provisoirement) le point sur le système de traduction automatique SYSTRAN. A la suite de quelques essais déplorables, je m'en étais désintéressé, mais les articles précités m'ont incité à reprendre mes essais de façon systématique afin d'étoffer mon argumentation. Celle-ci se fonde uniquement sur l'analyse des essais mentionnés, car les bases linguistiques et informatiques sur lesquelles il a été créé, présentées de façon fort convaincante dans le fichier http://www.systransoft.com/howworks.html, sont loin de présenter des résultats aussi convaincants. Si, dans son état actuel, ce système n'est pas prêt d'avoir notre peau, reste à savoir quelle part de notre marché il sera capable de subtiliser. Outre des exemples ponctuels qui seront cités au fil de l'argumentation, le texte suivant m'a permis de dégager trois caractéristiques plaidant en défaveur du système, à savoir : 1) sa sensibilité à l'orthographe, 2) son mauvais découpage syntaxique (parsing) et 3) son ignorance de la spécificité des langues. Comme je n'ai pas trouvé au système d'autre point positif que celui que sa rapidité (à condition que le serveur ne soit pas trop surchargé, évidemment), je ne me sens pas en mesure de vanter ses qualités, si elles existent, et serais heureux de recevoir des échos de mes collègues à cet égard. Proposé aux bons offices du SYSTRAN (adresse ouaibe http://babelfish.altavista.digital.com/ cgi-bin/translate? - que l'on peut aussi obtenir à partir du site systransoft.com précité), le texte ci-dessous a été extrait d'un projet de publication d'une organisation spécialisée de l'ONU. S'il peut paraître "technique" à première lecture, c'est à dessein : je n'ai pas cherché à mettre le SYSTRAN en défaut sur des questions de vocabulaire, mais de syntaxe. En vérité, aucun des termes de ce texte ne pose de problème de "traduction technique", puisqu'ils sont, à peu de chose près, semblables en anglais et en français. C'est donc un texte quasi idéal pour un test de traduction : pas d'interprétation hilarante jouant sur les connotations, mais uniquement un essai de rendu syntaxique. Voici donc le texte : Oxygen concentration and combustible gas levels should be monitored simultaneously, since oxygen-deficiency can affect the proper functioning of the combustible gas detectors. The presence of toxic gases can be detected by trace gas analyzers such as colourimetric tubes, photoionisation and flame ionization detectors, pH and starch papers.[...] Colorimetric tubes indicate a positive result by undergoing a change of color. The air is pumped through a glass tube containing a granular material coated with a reagent, which changes color when in the presence of a contaminant. Photoionisation and flame ionization detectors are portable instruments which can be calibrated to a specific substance, to determine the appropriate concentration of that substance. Et sa traduction SYSTRAN : La concentration d'oxygène et les niveaux combustibles de gaz devraient être surveillés simultanément, puisque l'oxygène-insuffisance peut affecter le fonctionnement approprié des détecteurs combustibles de gaz. La présence des gaz toxiques peut être détectée par des analyseurs de gaz de trace tels que les détecteurs colourimetric de tubes, de photoionisation et d'ionisation de la flamme, pH et papiers d'amidon. [...] Les tubes colorimétriques indiquent un résultat positif en subissant un changement de couleur. L'air est pompé par un tube de verre contenant un matériel granulaire enduit d'un réactif, qui change la couleur quand en présence d'un contaminant. Les détecteurs de photoionisation et d'ionisation de la flamme sont des instruments portatifs qui peuvent être calibrés à une substance spécifique, pour déterminer la concentration appropriée de cette substance. 1. Sensibilité à l'orthographe Le texte proposé devait, comme le veut l'ONU, être écrit en anglais britannique. C'est-à-dire que, à l'exception des terminaisons tolérées -ization au lieu de -isation, les rédacteurs doivent donner colour-, labour, etc, plutôt que color-, labor, etc. Or le SYSTRAN ne reconnaît que les formes américaines de la graphie anglo-saxonne. Il a donc pris colourimetric pour un terme inconnu et l'a reproduit tel quel (c'est effectivement une des particularités du système que de reproduire l'original en plein texte s'il ne possède pas d'équivalent dans sa banque de données). Quand j'ai, par curiosité, modifié l'orthographe du terme en colorimetric (voir la 2ème partie après [...]), j'ai obtenu une traduction correcte du point de vue de la forme ET de l'accord (colorimétriques), mais la syntaxe n'en a pas été adaptée pour autant. Pour une raison rédactionnelle ou erreur dactylographique quelconque, le texte donne oxygen-deficiency avec un trait d'union qui n'a lieu d'être ni en anglais britannique ni en américain. Or le système prend ce trait d'union pour argent comptant lorsqu'il produit l'oxygène-insuffisance. Après que j'ai supprimé le trait d'union intempestif, le système m'a donné : l'insuffisance de l'oxygène, qui est certes meilleur, mais qui ne justifie pas la présence de l'article défini avant oxygène. Les syntagmes "oxygen concentration" au début du texte et "oxygen deficiency" sont rigoureusement identiques du point de vue syntaxique. Il faut donc croire que le système établit en quelque sorte une relation - de mauvais aloi mais "intelligente" - entre l'oxygène dont on a déjà parlé dans oxygen concentration et celui dont on parle dans oxygen deficiency. Or il n'en est rien. La puissance d'analyse du système est bien loin de telles subtilités. Pour vérification, j'ai entré successivement sur le site Altavista les termes "oxygen deficiency/ depletion/ supply/ attack/ love/ etc." hors contexte, et tous ces termes ont été traduits littéralement, suivis de "de l'oxygène". Ce qui tend à prouver que "oxygen" placé avant un nom est systématiquement traduit par "de l'oxygène". Sauf, bizarrement, dans "oxygen concentration" et dans "oxygen content = contenu d'oxygène" (plutôt que "teneur en oxygène"). Si, pour la beauté du geste, on essaie "oxygen input" et "oxygen output", on a respectivement "l'oxygène entrent" (sic) et "l'oxygène sorti", mais "oxygen input/output = entrée-sortie de l'oxygène". Comme quoi la barre oblique peut avoir son signifiant propre. Passons sur la logique qui sous-tend les règles linguistiques attribuées aux signes typographiques, mais entre "their oxygen needs = leur oxygène a besoin" et "their oxygen need = leur besoin de l'oxygène", on peut se permettre de dépasser le stade de la pure orthographe pour aborder celui de la syntaxe. 2. Mauvais découpage syntaxique Le gros problème (en traduction) des syntagmes anglais à trois termes génétiquement liés (c'est-à-dire de savoir si, par exemple, l'adjectif du début modifie les deux autres ou seulement le premier, si ces deux autres sont indépendants ou forment un complément de nom, etc) est traité selon un cadre systématique rigide ne tenant pas compte, quoi qu'en dise le site ouaibe, des rapports sémantiques entre termes. Exemple : combustible gas levels et combustible gas detectors sont traités comme le seraient significant gas levels et electronic gas detectors, c'est-à-dire que le système assume que l'adjectif qualifie le dernier terme et non le second, comme c'est le cas ici. J'ai fait d'autres essais systématiques afin de vérifier la chose et me contente d'en reproduire une partie ci-dessous. La plupart confirment mon analyse, à part les exemples ayant trait aux enseignants, qui tendent à prouver que la base de donnée du système comporte des "blocs" de traduction toute faite dans le domaine de l'enseignement, comme on peut en trouver dans n'importe quel dictionnaire bilingue, mais que toute autre association de termes est à la merci de la systématisation bornée de l'outil. toxic fumes detector = détecteur toxique de vapeurs primary school teacher = instituteur secondary school teacher = professeur d'école secondaire nuclear physics researcher/scientist = chercheur/scientifique nucléaire de physique nuclear waste disposal = nucléaire de rebut disposition disposal of nuclear waste = élimination nucléaire de perte toxic waste dumping = vider toxique de perte Exaspéré, je me suis dit qu'il valait peut-être mieux entrer des phrases en bonne et due forme plutôt que des syntagmes isolés. Poursuivant ma lancée, j'ai donc essayé : When it came to toxic waste dumping, all the parties disagreed. = Quand il est venu à la perte toxique vidant, toutes les parties étaient en désaccord. Où l'on note une nette amélioration du rendu syntaxique par rapport à "vider toxique de perte". Cherchant toujours à obtenir "déchets" pour "waste", j'ai fait plusieurs autres essais, mais en vain. Me rappelant soudain que "waste" était non comptable, je me suis dit qu'il était peut-être étiqueté par le système comme devant avoir un verbe au pluriel, à l'instar de "police", bien que ce ne fût pas la règle dans ce cas. J'ai donc entré : Industrial waste have become a major environmental problem. = La perte industrielle sont devenues un problème écologique important. Bon. Puis j'ai vu dans un dictionnaire que waste, en ce sens, pouvait prendre un "s" en américain. Ce devait être ça, le "glitch"! Hélas, j'ai obtenu Les pertes industrielles... Que la composition de tels syntagmes à trois termes se complique n'intimide pas du tout le systématique traducteur. Dans such as colorimetric tubes, photoionisation and flame ionisation detectors, "detectors" est pris comme facteur commun de tout ce qui le précède depuis "such as", alors qu'il ne régit que "photoionisation et flame ionisation", le "colorimetric tubes" étant un détecteur en soi. La traduction de ce même syntagme montre que le rapport entre termes anglais juxtaposés est systématiquement compris comme un génitif ("of") et ne fait pas la distinction entre la qualité ou l'objet ("de") et la fonction ("à"), d'où "détecteur de..." au lieu de "...à photoionisation/à ionisation de flamme". Lorsque les trois termes de tels syntagmes ne sont plus constitués d'un adjectif et de deux noms mais de trois noms, le systématique traducteur ne se pose plus de questions : c'est tout génitif! Autrement dit, la liaison entre les termes est systématiquement assimilée à une ellipse de "of" et rendue en conséquence par "de", avec inversion obligée des termes : trace gas analysers = analyseurs de gaz de trace. Par curiosité, bien que ce ne soit pas mon propos, j'ai exploré la version français-anglais du système en lui demandant de traduire détecteurs de gaz à l'état de traces. J'ai obtenu gas-detectors to the state of traces. Pour confirmation, j'ai proposé la chose sous forme de phrase : Ils ont mis en place des détecteurs de gaz à l'état de traces. Et j'ai eu : They installed gas-detectors at the state of traces. Mise à part la bizarrerie de la traduction, ce changement intempestif de préposition "to/at" prouve que le système n'est pas dépourvu de fantaisie. Ce qui est grave si l'on imagine qu'il suffit de repérer ses seuls "systématismes" pour en corriger rapidement les erreurs. Il n'est sans doute pas utile d'affirmer ici que cette question des prépositions est une des bêtes noires de la traduction anglais-français (on pourrait par exemple admettre comme preuve de cela les très longs articles des dictionnaires bilingues consacrés aux prépositions : pas un n'échappe à la solution d'une multitude d'exemples qui prouvent l'impossibilité d'une traduction générique), mais on peut se demander comment elle a été traitée par les concepteurs du SYSTRAN. Savoir cela permettrait peut-être de connaître les rouages du système, et par là, les écueils sur lesquels il butte invariablement, comme, dans le texte proposé, pour calibrated to a specific substance = calibrés à une substance spécifique et The air is pumped through a glass tube = L'air est pompé par un tube de verre. Dans le premier exemple, il semble que "to" soit traduit aussi systématiquement que dans "travelling to Paris" (ie, to = à, indication de mouvement). Dans le second, "par" est également tiré d'une analyse fondée sur le mouvement (to go through a town = passer par une ville plutôt qu'à travers). Or "par", à la suite d'un passif comme "is pumped" implique que le nom qui suit est l'agent du verbe. En l'occurrence, ce serait le tube de verre qui pompe l'air, alors que l'air ne fait que passer à travers. Si cette erreur d'interprétation peut être aisément corrigée par un réviseur attentif, elle peut passer inaperçue dans d'autres contextes. Bref, ce n'est pas seulement "là où l'on attend l'erreur" que le réviseur doit être vigilant, mais dans les moindres détails de tout le texte. Dans ces conditions, la question se pose aussitôt de savoir quel gain de temps permet un tel outil. Je n'y répondrai pas ici car je n'ai pas échantillonné suffisamment de types de textes pour juger l'ensemble du système de façon approfondie. Si cette question de temps est typique d'un traducteur professionnel, il en est une autre qu'il a moins tendance à se poser, à savoir : dans quelle mesure le système peut-il aider quelqu'un qui, justement, ne connaît pas ou connaît mal la langue d'arrivée? Par exemple, un élève devant faire un devoir de classe ou un commerçant ne comprenant pas un mode d'emploi et ne sachant pas qu'il existe des spécialistes de la traduction (ou le sachant mais frisant la crise cardiaque devant nos tarifs et sachant qu'il existe un logiciel gratuit à portée de main). N'étant pas journaliste, je n'ose non plus répondre à cette question, qui demanderait enquêtes et statistiques. 3. Spécificité des langues Dans le texte proposé, on a by undergoing a change of colour. Syntaxiquement, la traduction est acceptable. Mais, s'il est évident que le simple libellé en changeant de couleur viendrait plus naturellement à l'esprit d'un francophone - surtout qu'il ne s'agit pas vraiment de "subir" un changement - j'ai fait d'autres essais avec cet ennuyeux terme de "undergo", en tirant mes exemples des dictionnaires bilingues courants (Robert-Collins, Larousse, Oxford-Hachette) : she underwent surgery = elle a subi la chirurgie our house underwent/is undergoing repairs = notre maison a subi/subit des réparations I underwent treatment for measles = j'ai subi le traitement pour la rougeole she underwent a major heart operation = elle a subi une exécution importante de coeur Là, très intrigué par le traitement de "operation", j'ai abandonné l'ennuyeux "undergo = subir" et ai vainement essayé d'obtenir "opération": the whole operation failed = l'exécution entière est tombée en panne the surgical operation failed = l'exécution chirurgicale tombée en panne they can't even perform the basic mathematical operations = ils ne peuvent pas même exécuter de base mathématiques les exécutions Sachant que, quel que soit le contexte, "undergo = subir", "operation = exécution", "fail = tomber en panne" et "waste = perte/de rebut", faisons encore un petit bout d'essai avec "cry" et "suggest" : she cried for help = elle a pleuré pour l'aide he suggested that there might be a bug in the program = il a proposé qu'il pourrait y a une anomalie dans le programme - passons sur le "y a" pour louer le fait que le calque "suggest = suggérer" a été évité (quoique j'eusse préféré "a laissé entendre"), mais : "There might be a bug in the program" he suggested = "Il pourrait y a une anomalie dans le programme" qu'il a suggéré. Comme quoi la syntaxe a des effets pernicieux sur la sémantique. Effets qu'on n'oserait imaginer, même dans un cerveau de traducteur en mal de calques pour se faire rire la bouche. Reprenant les questions d'orthographe mentionnées plus haut, j'ai fait des essais avec les noms propres. Dans l'article cité par Olivier André, on parle de Monica Lewinski. Si son nom est reproduit correctement (c'est-à-dire tel quel), c'est qu'il n'est pas "traduisible" par le système; en d'autres termes, qu'il n'est pas constitué de noms communs entrés dans sa base de données. En effet, le système ne reconnaît pas les majuscules en milieu de phrase comme signes caractéristiques des noms propres, mais, fait étonnant, il est sensible aux "titres" (les Mr/Mrs/etc). Qu'on en juge : Under the chairmanship of Mrs Jenny Hawthorn = Sous la présidence de Mme Jenny Hawthorn Under the chairmanship of Jenny Hawthorn = Sous la présidence de l'aubépine de bourrique Of the two girls, Jenny was the most feminine = Des deux filles, la bourrique était la plus féminine When Jenny took off her bra, his eyes went bulging = Quand la bourrique a enlevé son bra, ses yeux sont allés s'enfler Take them off, Jenny! = Enlevez-les, bourrique! Take ‘em off, Jenny! = Fin de support de prise' hors fonction, bourrique! he took her half-slip off = il a pris son demi-glissant hors fonction Où l'on découvre que "off" isolé est systématiquement rendu par "hors fonction". Pour le reste, je baisse les bras. Tout de même intrigué que le système ne reconnaisse pas le très commun, bien que familier, "bra", alors que l'article du Figaro laissait entendre que "le logiciel comprend mieux l'argot que les gallicismes", je ne me suis pas privé de faire des essais en ce sens. D'anglais en français, on a vu ce que ça donne. De français en anglais, cherchant à obtenir "up yours", j'ai entré "va te faire foutre" puis, plus modérément, "va te faire voir". Dans les deux cas, j'ai obtenu à l'écran une page spéciale ainsi libellée : <server error 100> An unknown error occurred during translation Refusant de croire que le système était capable de reconnaître les expressions triviales et d'en rougir au point de se bloquer, j'y suis carrément allé - qu'on excuse cet essai purement scientifique - d'un "va te faire enculer" et ai reçu "will make you enculer". A tout hasard, pour m'assurer de la syntaxe, j'ai entré la vieille expression "Va te faire tâter chez les Grecs!" et ai obtenu "Will make you touch among Greeks!" (à ce propos, erreur amusante mais qui en dit long sur le logiciel du système et qui intéressera peut-être les informaticiens-linguistes, j'ai oublié, en entrant la phrase, que le site s'ouvrait par défaut sur le module de traduction anglais-français et que j'aurais d'abord dû appeler le module français-anglais. Prenant donc le texte pour de l'anglais, le système l'a consciencieusement "traduit" en français, ce qui a donné "Les Grecs de chez de tâter de faire de te de la Virginie!"). Abandonnant mes prétentions à l'argotisme et aux expressions idiomatiques, je me suis contenté d'un très simple "I had a dream". Je ne sais pas si Luther-King s'est retourné dans sa tombe, mais le système lui a fait dire "j'ai eu un rêveur". Tous mes essais avec "a dream" se sont traduits par "un rêveur". Si "dream" tout seul et "dreams" m'ont donné "rêve" et "rêves", je n'ai pas poursuivi la recherche, estimant que tous ces petits exemples fastidieux suffisaient à former mon point de vue sur le système. En effet, si de telles banalités peuvent produire de telles monstruosités, quelle crédibilité peut-on accorder au système dans son ensemble? Il fait totalement fi des rapports sémantiques, il n'analyse que très superficiellement le problème des rapports syntaxiques et en particulier celui des prépositions, et il paraît étroitement dépendant d'artifices typographiques tels que les majuscules et les traits d'union. En d'autres termes, il ne s'agit pas d'un système "expert", c'est-à-dire pourvu d'une intelligence artificielle lui permettant de reconnaître les divergences par rapport à une norme et de "passer dessus", mais d'un simple dictionnaire - qui plus est incomplet - géré par un logiciel structuraliste de bas étage qui semble se limiter à associer les étiquettes marquant chaque entrée du dictionnaire selon un processus trop simple pour rendre compte de la créativité d'une langue, comme pourrait le faire un système fondé sur la linguistique transformationnelle. Évidemment, appliquer celle-ci à un système informatique exigerait un programme énorme et très touffu qui allongerait considérablement le temps de traduction, mais tiendrait compte des structures sous-jacentes et des compatibilités sémantiques entre termes et entre formes de termes. La rapidité du SYSTRAN et ses inconséquences sont sans doute liées au fait qu'il est vraisemblablement fondé sur une analyse structurale du texte, c'est-à-dire un découpage rapide des phrases en petits groupes de termes traduits en bloc sans approfondissement des relations entre blocs. Sans vouloir me vanter, comme dirait Philippe Meyer, je suis parvenu à ces conclusions avant d'avoir consulté le fichier SYSTRAN's MT ARCHITECTURE (dont j'ai inséré après coup l'adresse au début de cet article - MT = machine translation), où il est dit : "SYSTRAN's methodology is a sentence by sentence approach, concentrating first on individual words and their dictionary data, then on the parse of the sentence unit, followed by the translation of the parsed sentence" (c'est moi qui souligne). Bien sûr, il convient de nuancer ses critiques. Si en soulignant, j'exprime une critique indirecte de la méthode consistant à consulter d'abord le dictionnaire puis à effectuer le découpage syntaxique de la phrase, il faut dire qu'il ne s'agit pas d'un travail de potache qui se jette sur le dictionnaire bilingue dès le premier mot du titre avant d'avoir compris de quoi parlait le texte. Il faut savoir ce qu'ils entendent par "dictionnaire". Il y en a deux de base : un "dictionnaire élémentaire" (stem dictionary) où, comme je l'avais subodoré, les mots sont entrés isolément avec des étiquettes (codes) indiquant leurs fonctions possibles des points de vue syntaxique et sémantique (c'est sans doute là que le bât blesse); et un "dictionnaire d'expressions" où sont rassemblés des syntagmes entiers (sans doute du genre "Mr + noun" ou "primary school teacher" vus plus haut - où le bât, encore moins mal dégrossi, blesse encore plus ). Ensuite, deux logiciels viennent traiter les mots repérés dans le texte. L'un, succinctement défini (system software), semble responsable de la reconnaissance orthographique - on a constaté ses prouesses. L'autre, de loin le plus important (linguistic software), traite à lui seul du découpage sémantique (le paragraphe au sujet de cette fonction ["parser", responsable de l'analyse syntaxique et sémantique de la langue source] noie le vouloir-faire et le pouvoir-faire dans un bain confus de considérations sur le déterminisme), du passage d'une langue à l'autre ("transfer module", responsable des équivalences sémantiques entre langues) et de la mise en forme du produit fini en langue cible ("synthesis module", responsable de la syntaxe et de l'ordre des mots). Pour intéressant qu'il soit à première vue, cet article tend plutôt à vanter la marchandise qu'il n'en révèle les rouages et procédures qui éclaireraient un(e) professionnel(le) des langues. Mais je suis peut-être un peu trop curieux de technique. Savoir "comment ça marche" explique peut-être pourquoi ça marche mal au niveau de la traduction professionnelle, mais est sans doute moins préoccupant que de savoir "pourquoi ça marche" auprès d'utilisateurs peu scrupuleux (en admettant que ça marche vraiment, mais je n'ai pas de statistiques pour m'en assurer). La gratuité et la rapidité du système sont sans doute les premières raisons qu'on puisse avancer. Les secondes sont que des produits mal finis mais grosso modo compréhensibles suffisent aux besoins de tels utilisateurs, plus pressés, dans le cadre de leur commerce/industrie, d'avoir une idée approximative sur le sujet, que de discutailler de sa forme et de son style. En d'autres termes, si l'utilisation du SYSTRAN est impensable au niveau des textes de conventions internationales ou autres morceaux juridiques où chaque virgule a son importance, il est tout à fait compréhensible que des hommes ou femmes d'affaires, toujours pressé(e)s, se contentent d'une traduction minable qui leur donnent l'essentiel du contenu à défaut de la forme. L'ennui, c'est que cet "essentiel" n'est pas non plus à l'abri d'erreurs. Autre ennui, les sociétés produisant ces systèmes de traduction automatique ont, par rapport aux traducteurs professionnels, même en associations, de gros moyens pour se faire de la publicité, voire l'introduire dans des revues comme SVM. Faudrait-il donc que notre profession fasse de la contre-publicité en citant sur des pages ouaibe quelques "perles" du type de celles que j'ai relevées ici? Et aussi, évidemment, de la publicité positive, voire agressive, pour le travail bien fait. Ou faudrait-il faire appel à l'État pour imposer lois et règlements? Mais l'État, même providence, ne peut rien contre le ouaibe et les publicités de ses moteurs de recherche. Quand bien même il le pourrait en France, ça ne protégerait qu'une bien maigre partie du marché de la traduction professionnelle mondiale, désormais lancée sur les "autoroutes de l'information". Le fait que celles-ci soient totalement dénuées de statut juridique présente l'avantage qu'on peut y conduire n'importe comment et y faire toutes les queues de poisson imaginables. Quand les donneurs d'ouvrage en auront marre, ne sachant plus distinguer les as du volant des chauffards (traducteurs à la petite semaine), ils finiront peut-être par se méfier de cette jungle éthérée et reviendront sur le plancher des vaches. En attendant, il faut veiller à ne pas se laisser mettre sur une voie de garage. Appuyons d'abord sur le champignon - il en sortira peut-être du jus. Le SYSTRAN aux prises avec lui-même
© Copyright 1998 - Association des Anciens Elèves de l'Ecole Supérieure d'Interprètes et de Traducteurs de l'Université de Paris - Tous droits réservés.
Est-ce que la traduction automatique est une aubaine? Il y a à peine un an, une importante firme de logiciels de traduction offrait un service de traduction automatique sur l'Internet pour aussi peu que cinq cents du mot. Elle prétendait y parvenir en tenant compte des difficultés de la langue, telles que le genre, le pluriel, la conjuguaison de verbes et les autres pièges grammaticaux. On retrouve aussi sur l'Internet les opinions de traducteurs chevronnés qui estiment que la traduction par logiciel, ou traduction automatique, ne peut aider aucunement le procédé de traduction et peut même y nuire. Peu importe l'utilité de la traduction automatique, on s'entend à l'unanimité pour dire que les traducteurs seront appelés à jouer un rôle important au cours des prochaines années. Les entreprises de logiciels de traduction affirment que la traduction automatique ne leur permet de fournir qu'une ébauche du texte d'arrivée. C'est ainsi qu'elles offrent les services de traducteurs! En plus de posséder des compétences de base, les traducteurs doivent comprendre à fond le sujet du texte de départ. Ce critère de base revêt une importance primordiale encore plus lorsqu'il s'agit d'une traduction dans un domaine spécialisé où l'exactitude est la qualité essentielle. Vu sa compréhension totale du texte de départ, le traducteur compétent pourra y dépister les erreurs. Il est évident qu'un tel but ne peut être atteint en utilisant la traduction automatique ou les services de traducteurs non-expérimentés dans le domaine spécialisé. Une clientèle à la recherche de traduction de qualité devrait faire appel à des traducteurs compétents. Ces traducteurs devraient posséder une grande expérience dans le domaine spécialisé approprié si le texte de départ relève de ce domaine. Copyright © Tradtec 1995. Mise à jour : le 08 juillet 1998. Tous droits réservés. Ce texte peut être reproduit en format électronique dans la mesure où il est reproduit en entier et où cet avis est inclus.
Les promesses de la traduction automatique La tour de Babel La majeure partie de l'information qui circule aujourd'hui sur Internet est encore en anglais, mais le besoin de communication en d'autres langues se fait sentir de manière croissante. Les problèmes posés par la communication entre deux internautes de même langue sont quasiment résolus. On a d'abord offert des solutions ad hoc pour la transmission et l'affichage des caractères en différentes langues. Ces techniques deviennent caduques avec la généralisation de la norme Unicode, qui fait passer le support multilingue dans le domaine public. Le problème de la communication entre deux internautes qui ne comprennent pas la même langue demeure entier. Les progrès prodigieux de la micro-informatique au cours des vingt dernières années nous ont habitués aux miracles et certains pensent sans hésitation à des solutions comme le traducteur universel de Star Trek. N'en déplaise aux investisseurs qui gravitent autour d'Internet, la seule chose dont on est sûr après plus de quarante ans de recherche et développement en traduction automatique, c'est que ce n'est pas demain la veille. L'histoire de la traduction automatique est en partie celle d'utilisateurs
potentiels qui n'ont pas su faire la différence entre leurs besoins
et l'état de développement de la technologie. Les vestiges de la guerre froide La plupart des grands projets de traduction automatique sont nés entre 1958 et 1966 des besoins de traduction à partir du russe engendrés par la guerre froide. Le meilleur exemple est celui de l'utilisation du système Systran par la Foreign Technology Division de l'armée de l'air américaine. Ce système a été utilisé pendant plus de vingt ans pour traiter la totalité des textes en langue russe sur lesquels les services de renseignements pouvaient mettre la main. Il était doté d'énormes dictionnaires russe-anglais couvrant un grand nombre de domaines et le charabia produit par le système était examiné par des spécialistes qui étaient chargés d'isoler les textes ayant une valeur stratégique ou scientifique. Cette application n'est pas sans rappeler Internet, mais s'agit-il de traduction automatique ou de filtrage en langue étrangère ? La réponse devient claire quand on sait que la plupart des textes retenus étaient ensuite traduits manuellement. La recherche en traduction automatique a connu un coup d'arrêt en 1966 avec la sortie du rapport ALPAC de la National Science Foundation qui concluait à l'impossibilité d'une traduction automatique de qualité. La plupart des chercheurs américains se sont alors tournés vers une science émergente : l'intelligence artificielle. La technologie n'en a pas moins évolué au cours des ans. Les développeurs de la fin des années cinquante concevaient la traduction automatique comme un simple problème de décryptage. À chaque mot du texte incompréhensible correspondait un mot de la langue connue. Ils ont vite découvert que la traduction n'était pas biunivoque, qu'un même mot pouvait avoir plusieurs catégories grammaticales et qu'à chaque catégorie grammaticale pouvaient correspondre plusieurs sens. Des tests de compréhension ont alors révélé que si un locuteur humain lisait un texte en déplaçant une feuille de carton avec un trou qui laissait paraître quelques mots contigus, beaucoup d'ambiguïtés pouvaient être levées. Ceci a donné naissance à l'analyse par micro-contexte, qui est le principe de fonctionnement des systèmes de traduction automatique dits de première génération. La deuxième génération à la rescousse Les chercheurs du GETA (Groupe d'étude pour la traduction automatique) à Grenoble ont été les premiers à jeter les bases d'une nouvelle génération. La traduction humaine peut se décomposer en trois étapes : la compréhension du message en langue source, la transposition de la teneur du message en langue cible et la formulation du message selon les règles de la langue cible. Parallèlement, un système de traduction automatique de deuxième génération opère au niveau de la phrase et la traite en trois étapes : l'analyse, le transfert et la génération. Le premier système de traduction automatique de deuxième génération est entré en exploitation le 24 mai 1977 à Montréal; il s'agit du système METEO ®. Aussi raisonnable que puisse paraître cette approche, personne n'est parvenu à développer un système général de traduction automatique de deuxième génération, même en se limitant aux textes scientifiques et techniques. La première étape suppose qu'on sache bâtir un analyseur d'une langue qui soit un tant soit peu exhaustif. Or ce n'est pas possible sans faire intervenir le sens et on ne sait toujours pas comment représenter et traiter le sens en dehors d'un domaine restreint. La seconde étape est plus ambitieuse encore car elle suppose une manipulation du sens dans la mesure où le transfert est la transposition d'idées et non simplement de structures syntaxiques. Paradoxalement, la troisième étape pose peu de problèmes car elle applique les règles syntaxiques et morphologiques d'une langue de manière déterministe. On sait déjà que même avec une composante syntaxique, le système de deuxième génération ne suffirait pas à la tâche. En particulier, la phrase n'est pas un contexte suffisant pour résoudre certains problèmes de traduction et d'autres ne peuvent être tranchés qu'avec une compréhension du texte et une connaissance du monde. Les logiciels grand public Les logiciels de traduction automatique disponibles dans les magasins ont tous pour objectif de traduire un texte quelconque d'une langue dans une autre. Les vendeurs de ces logiciels prétendent que les traducteurs mettent la barre trop haut pour protéger leur profession et que les utilisateurs peuvent se contenter d'une mauvaise traduction. La véritable question est de savoir quel est l'objectif visé. Si l'objectif est de se faire une idée du sujet d'un texte écrit dans une langue qu'on ne comprend pas, la technologie existe, mais donnons-lui plutôt un nom qui n'induise pas les utilisateurs en erreur : logiciel de filtrage ou de dépistage de l'information. Si l'objectif est d'obtenir une traduction totalement compréhensible d'un texte en langue étrangère, aucun système sur le marché ne satisfait à cette exigence. Si l'objectif est de fournir un outil qui facilite le travail de traduction, quelques clarifications s'imposent. Quand on parle d'industries de la langue, la technologie est tellement embryonnaire par rapport à l'objectif à atteindre que les outils disponibles ne doivent pas être mis entre les mains d'utilisateurs qui n'ont pas les connaissances nécessaires pour faire preuve de sens critique. De même qu'un correcteur grammatical n'est utile qu'à une personne qui sait écrire, un logiciel de traduction automatique est un outil de travail pour celui ou celle qui sait traduire. Ceci étant dit, les logiciels de traduction automatique sont-ils utiles pour le traducteur de métier ? En règle générale, non ! Quand on donne un texte à traduire à un traducteur qu'on ne connaît pas, on reçoit en général un texte qui est diffusable avec un minimum de révision. Plus rarement, on reçoit un texte mal traduit. Le travail a été bâclé ou l'auteur de la traduction ne comprend rien au domaine et a fait des contresens majeurs ou encore, ce n'est pas un traducteur de métier. Dans ce cas, cela prend souvent moins de temps de retraduire le texte au complet que d'essayer de le réviser. Le traducteur humain a en général le même sentiment face à la sortie d'un logiciel de traduction automatique, d'autant plus que la correction des fautes faites par ces logiciels nécessite beaucoup de manipulations. Un aveu d'échec L'informatique a fait plus de progrès en vingt ans que la traduction automatique. On peut acheter aujourd'hui pour quelques centaines de dollars une version micro-ordinateur des systèmes développés à coup de millions sur les plus gros ordinateurs disponibles pendant la guerre froide. Certes les dictionnaires sont plus complets, les interfaces sont plus conviviales et il y a plus de langues offertes, mais la qualité de traduction est sensiblement la même. La plupart des grands organismes multilingues ont envisagé la traduction automatique à tour de rôle. Certains sont allés jusqu'à financer de nouvelles recherches. Mais ils ont tous dû se rendre à l'évidence et se tournent aujourd'hui vers des solutions plus modestes comme les outils d'aide à la traduction. Le Bureau de la traduction du gouvernement canadien a lui aussi dépensé des millions de dollars au cours des ans à évaluer des systèmes comme Systran, Weidner et Logos. Un essai de cinq ans du système Logos a démontré que la traduction automatique avait coûté trois fois plus cher que la traduction manuelle. Le Bureau en est venu à la conclusion qu'aucun logiciel commercial ne pouvait répondre à ses besoins. On sait désormais que la traduction automatique générale n'est pas viable, mais on sait également quand la traduction automatique peut rendre de réels services. L'objectif initial était trop ambitieux dans l'état actuel de la technique. Pourquoi ne pas restreindre l'objectif en se limitant à certains types de textes, à certains domaines ou encore en réduisant l'ambiguïté des textes lors de leur rédaction ? La mémoire de traduction À Montréal en 1990, la compagnie d'assurances Confédération-Vie prenait livraison d'un système dédié d'aide à la traduction qui lui permettait d'assembler la version française d'une police d'assurance-vie à partir de la version anglaise en vingt minutes au lieu de quatre heures. Le système Général TAO, utilisé aujourd'hui par ManuVie, remplace les clauses types d'un document par leur traduction tout en générant la mise en page désirée. Il ne s'agit pas à proprement parler de traduction automatique, mais d'une mémorisation des phrases répétitives. Depuis, des systèmes commerciaux de mémoire de traduction ont vu le jour comme Translation Manager 2 d'IBM ou Translator's Workbench de Trados qui mémorisent toutes les phrases au fur et à mesure de leur traduction. L'ordinateur distingue très bien ce qui est semblable de ce qui est identique et reproduit avec exactitude les sommes et les dates là où l'humain peut laisser passer des erreurs coûteuses en travaillant par couper-coller. Mais si les systèmes de mémoire de traduction sont réellement utiles sur du texte répétitif comme les contrats d'assurances, les conventions collectives ou les descriptions de tâches, ils sont complètement inutiles ailleurs. De plus, la notion de répétitivité est subjective à un point tel que même le traducteur peut s'y tromper. Quoi de plus répétitif que des bulletins météorologiques me direz-vous ? C'est ce qu'affirmait dernièrement l'équipe de traducteurs qui travaille au Centre météorologique du Québec à Montréal. Une étude d'une classe de bulletins pendant six mois démontre cependant que sur plus de 40 000 phrases traitées, seulement 700 d'entre elles se répètent. Les sous-langages On appelle sous-langage un sous-ensemble de la langue ayant ses propres règles syntaxiques et un vocabulaire limité dont les relations sémantiques sont cernables. L'exemple le plus connu de l'application de la traduction automatique à un sous-langage est le système METEO qui sert à traduire les prévisions publiques, agricoles et maritimes émises par Environnement Canada. Le système est entré en exploitation sur un super-ordinateur du Centre météorologique canadien il y a plus de vingt ans et tourne aujourd'hui sur un réseau de quatre micro-ordinateurs. La production du système METEO dépassera 30 millions de mots cette année avec un taux d'intervention humaine inférieur à 5 % sur les textes traduits automatiquement. Certains textes comme les avis, les veilles et les avertissements échappent malgré tout encore à la traduction automatique et sont traduits manuellement en partant des émissions précédentes, ce qui allège quand même le travail de traduction de près de 60 %. La solution est viable parce que le volume traité permet de justifier un développement continuel des composantes linguistiques et informatiques. Le système METEO assure à lui seul près de 15 % du volume du Bureau de la traduction du gouvernement fédéral à un prix de revient de 0,5 cent du mot machine brut avant révision. La solution est d'autant plus justifiée que c'est le seul moyen d'assurer la disponibilité quasi simultanée de l'information dans les deux langues. La longueur moyenne d'un bulletin est de 250 mots, soit une petite heure de travail pour un traducteur humain alors que le système METEO le renvoie à destination en moyenne quatre minutes après réception. Les langages contrôlés Si on ne peut pas traduire n'importe quel texte, pourquoi ne pas écrire en fonction de la machine quand on sait que le texte devra être disponible en plusieurs langues. C'est ce que fait depuis longtemps l'Institut textile de France à Lyon avec un système développé par un étudiant du Massachusetts Institute of Technology. Le système TITUS sert à alimenter une banque multilingue de résumés scientifiques dans le domaine du textile. Chaque texte est entré dans sa langue d'origine en respectant les contraintes lexicales et grammaticales du système et devient automatiquement disponible dans cinq autres langues. Certains constructeurs ont même utilisé des systèmes généraux de traduction automatique avec cette approche : ce fut le cas de Mitel, il y a quelques années, avec le système Weidner et, plus récemment, de Xerox avec le système Systran. Mais les systèmes dédiés donnent toujours de meilleurs résultats, comme le démontre le système développé par l'université Carnegie Mellon pour Caterpillar. Ce système permet de traduire plus rapidement et à un coût moindre des manuels rédigés en « Caterpillar English ». La plus grande surprise nous vient d'Atlanta, où une version spéciale du système METEO a été utilisée pour traduire en français les bulletins émis pendant la durée des derniers Jeux olympiques. Il y avait également deux types de textes à traduire, à cette différence près que les prévisions publiques étaient produites en langage contrôlé par un logiciel de prévision. Malgré une période de mise au point de très courte durée, METEO 96 a traduit 162 745 mots de prévisions publiques avec 99,4 % d'exactitude. Un record toutes catégories ! Un projet prometteur Les premières recherches sur les langages contrôlés ont porté sur l'anglais technique, le but étant d'obtenir des documentations non ambiguës tant pour des utilisateurs anglophones que pour des utilisateurs dont l'anglais n'est pas la langue maternelle. Un bon exemple est le « Simplified English » développé par l'AECMA (Association européenne de constructeurs de matériel aéronautique) et dont l'usage est recommandé par l'ATA (American Transport Association). Le GIFAS (Groupement des Industries Françaises Aéronautiques et Spatiales) mène depuis quelques années des travaux similaires sur le « français rationalisé ». Il suffit de penser à l'accident de la gare de Lyon, qui aurait été dû à une ambiguïté de lecture de la procédure de remontage des freins de la locomotive, pour réaliser qu'une documentation technique non ambiguë n'a pas de prix. Un projet de Guide de rédaction, visant la langue administrative, a été déposé par l'Office de la langue française à la Table de concertation sur les industries de la langue en 1993. Ce projet a été repris par l'Observatoire québécois des industries de la langue qui a jugé préférable, après un survol de l'état de la situation, de l'appliquer à un domaine où il y avait déjà eu des efforts importants, soit l'aéronautique. L'approche par langage contrôlé consiste à réduire l'ambiguïté des textes en limitant la complexité syntaxique des phrases et en employant les termes dans un sens seulement et avec une seule fonction grammaticale. Le volet syntaxique du projet consiste à compléter les travaux sur le « français rationalisé » en collaboration avec le GIFAS. Le volet lexical quant à lui consiste en un inventaire de la terminologie en usage chez les constructeurs québécois et européens. Parallèlement, des comités d'harmonisation comme celui du professeur Poitevin de l'École nationale d'aérotechnique à Saint-Hubert font des recommandations d'usage. Le but du projet est de parvenir à définir un ensemble de règles de rédaction technique permettant de rédiger des manuels d'entretien non ambigus pour l'humain et pour la machine, se prêtant par là-même à la traduction automatique. Si l'ordinateur ne comprend pas ce que nous écrivons, écrivons dans un langage qu'il comprend et laissons la littérature aux humains...
|
|
© 2002-2004 Webtraduction. Tous droits réservés |