Tech

Le code Copiale : un manuscrit mystérieux décrypté par l’informatique

ActualitéClassé sous :informatique , Homme , code Copiale

Le manuscrit dit de Copiale, entièrement crypté, vient d'être « cassé » par un logiciel utilisant des méthodes... de traduction. Verdict : ce long texte est une description de rites étranges organisés par une société secrète du XVIIIe siècle.

La couverture décorée du livre manuscrit de Copiale. © Kevin Knight/Beáta Megyesi/Christiane Schaefer

Baptisé Copiale (un de ses rares mots écrits en clair), ce livret de 105 pages retrouvé dans des archives de l'ex-Allemagne de l'Est défiait les spécialistes de la cryptographie. Il faut dire que l'on y trouve pêle-mêle des caractères latins, grecs et symboliques. On repère par exemple le signe désignant le sexe femelle ou celui qui, en mathématique, indique l'infini, ou encore des formes géométriques variées.

L'équipe réunie autour du « code Copiale » est composée de linguistes. Kevin Knight est Américain, Beáta Megyesi et Christiane Schaefer sont Suédois. Ils n'ont pas utilisé les armes de la cryptographie mais celles de la traduction. En somme, il s'agit de considérer un texte codé comme s'il était écrit dans une langue étrangère. L'idée n'est pas nouvelle et a été émise par Warren Weaver, un théoricien de la traduction, qui a proposé de rapprocher les méthodes de la cryptographie et de la traduction (on peut remarquer que Kevin Knight travaille à la SDL Weaver, née de la fusion de SDL et Language Weaver Inc.).

Les dernières pages du document (en bas à droite, la signature, où on lit plutôt Copiales). Le site Web de l'équipe donne le scan complet du manuscrit Copiale (PDF de 26 Mo). © Kevin Knight/Beáta Megyesi/Christiane Schaefer

Cryptographie subtile

Les outils de l'équipe sont ceux de la traduction statistique. Alors que la méthode linguistique analyse la syntaxe des phrases, la traduction statistique puise dans des bases de données les plus vastes possibles pour dénicher des traductions déjà faites. Google s'est fait le champion de cette voie en utilisant sans limite le travail déjà réalisé par des traducteurs humains ou informatiques.

Pour l'appliquer au texte de Copiale, l'équipe a d'abord fait l'hypothèse que seuls les caractères latins avaient une signification. Devant l'échec, les linguistes ont postulé l'inverse, considérant qu'ils n'étaient là que pour embrouiller le problème (ces caractères sont des « nulles » dans le jargon de la cryptographie). Il a ensuite semblé que le code était « homophonique », c'est-à-dire qu'un caractère originel peut être codé par plusieurs signes, dont le nombre est proportionnel à la fréquence habituelle de ce caractère dans la langue originelle.

Quelques clés du code (cipher en anglais). On remarque que la plupart des lettres sont codées par plusieurs caractères. © Kevin Knight/Beáta Megyesi/Christiane Schaefer

Des manuscrits anciens encore à découvrir

En considérant que le texte était en allemand et en comprenant que le signe « : » doublait la consonne précédente, les linguistes ont finalement abouti à un texte en clair. Sur son site Web, l'équipe donne toutes les indications et on y trouve également les versions en allemand et en anglais du code Copiale. (Voir les liens en bas de l'article.)

On comprend que ce document décrit les étranges pratiques d'une secte secrète inconnue particulièrement intéressée par l'ophtalmologie. On y apprend dans le détail le déroulement de cérémonies d'intronisations de nouveaux membres.

Le décryptage de ce genre de textes est donc davantage qu'un jeu. Il apporte aussi du grain à moudre pour les historiens. Kevin Knight s'est attaqué cette année à un autre document, encore plus célèbre, le manuscrit de Voynich. Ce long texte écrit avec des caractères inconnus, qui daterait du XIVe siècle, défie à ce point les tentatives de décryptage que certains concluent à une supercherie. D'après Kevin Knight, c'est bien un texte réel mais son code résiste encore. Les méthodes de traduction statistiques en viendront-elles à bout ? 

Abonnez-vous à la lettre d'information La quotidienne : nos dernières actualités du jour.

!

Merci pour votre inscription.
Heureux de vous compter parmi nos lecteurs !

Cela vous intéressera aussi