Le manuscrit dit de Copiale, entièrement crypté, vient d’être « cassé » par un logiciel utilisant des méthodes… de traduction. Verdict : ce long texte est une description de rites étranges organisés par une société secrète du XVIIIe siècle.

au sommaire


    La couverture décorée du livre manuscrit de Copiale. © Kevin Knight/Beáta Megyesi/Christiane Schaefer

    La couverture décorée du livre manuscrit de Copiale. © Kevin Knight/Beáta Megyesi/Christiane Schaefer

    Baptisé Copiale (un de ses rares mots écrits en clair), ce livret de 105 pages retrouvé dans des archives de l'ex-Allemagne de l'Est défiait les spécialistes de la cryptographie. Il faut dire que l'on y trouve pêle-mêle des caractères latins, grecs et symboliques. On repère par exemple le signe désignant le sexe femelle ou celui qui, en mathématique, indique l'infini, ou encore des formes géométriques variées.

    L'équipe réunie autour du « code Copiale » est composée de linguistes. Kevin Knight est Américain, Beáta Megyesi et Christiane Schaefer sont Suédois. Ils n'ont pas utilisé les armes de la cryptographie mais celles de la traduction. En somme, il s'agit de considérer un texte codé comme s'il était écrit dans une langue étrangère. L'idée n'est pas nouvelle et a été émise par Warren Weaver, un théoricien de la traduction, qui a proposé de rapprocher les méthodes de la cryptographie et de la traduction (on peut remarquer que Kevin Knight travaille à la SDL Weaver, née de la fusionfusion de SDL et Language Weaver Inc.).

    Les dernières pages du document (en bas à droite, la signature, où on lit plutôt <em>Copiales</em>). Le site Web de l'équipe donne le scan complet du <a href="http://stp.lingfil.uu.se/~bea/copiale/copiale150.pdf" title="Scan du manuscrit de Copiale" target="_blank">manuscrit Copiale</a> (PDF de 26 Mo). © Kevin Knight/Beáta Megyesi/Christiane Schaefer

    Les dernières pages du document (en bas à droite, la signature, où on lit plutôt Copiales). Le site Web de l'équipe donne le scan complet du manuscrit Copiale (PDF de 26 Mo). © Kevin Knight/Beáta Megyesi/Christiane Schaefer

    Cryptographie subtile

    Les outils de l'équipe sont ceux de la traduction statistique. Alors que la méthode linguistique analyse la syntaxe des phrases, la traduction statistique puise dans des bases de données les plus vastes possibles pour dénicher des traductions déjà faites. Google s'est fait le champion de cette voie en utilisant sans limite le travail déjà réalisé par des traducteurs humains ou informatiques.

    Pour l'appliquer au texte de Copiale, l'équipe a d'abord fait l'hypothèse que seuls les caractères latins avaient une signification. Devant l'échec, les linguistes ont postulé l'inverse, considérant qu'ils n'étaient là que pour embrouiller le problème (ces caractères sont des « nulles » dans le jargon de la cryptographie). Il a ensuite semblé que le code était « homophonique », c'est-à-dire qu'un caractère originel peut être codé par plusieurs signes, dont le nombre est proportionnel à la fréquence habituelle de ce caractère dans la langue originelle.

    Quelques clés du code (<em>cipher </em>en anglais). On remarque que la plupart des  lettres sont codées par plusieurs caractères. © Kevin Knight/Beáta Megyesi/Christiane Schaefer

    Quelques clés du code (cipher en anglais). On remarque que la plupart des  lettres sont codées par plusieurs caractères. © Kevin Knight/Beáta Megyesi/Christiane Schaefer

    Des manuscrits anciens encore à découvrir

    En considérant que le texte était en allemand et en comprenant que le signe « : » doublait la consonne précédente, les linguistes ont finalement abouti à un texte en clair. Sur son site Web, l'équipe donne toutes les indications et on y trouve également les versions en allemand et en anglais du code Copiale. (Voir les liens en bas de l'article.)

    On comprend que ce document décrit les étranges pratiques d'une secte secrète inconnue particulièrement intéressée par l'ophtalmologieophtalmologie. On y apprend dans le détail le déroulement de cérémonies d'intronisations de nouveaux membres.

    Le décryptage de ce genre de textes est donc davantage qu'un jeu. Il apporte aussi du grain à moudre pour les historienshistoriens. Kevin Knight s'est attaqué cette année à un autre document, encore plus célèbre, le manuscrit de Voynich. Ce long texte écrit avec des caractères inconnus, qui daterait du XIVe siècle, défie à ce point les tentatives de décryptage que certains concluent à une supercherie. D'après Kevin Knight, c'est bien un texte réel mais son code résiste encore. Les méthodes de traduction statistiques en viendront-elles à bout ?