Dans le cadre d’un challenge, pour la première fois, trois étudiants sont parvenus à déchiffrer grâce à une IA le texte d’un rouleau de papyrus calciné par l’éruption du Vésuve à Herculanum il y a près de 2 000 ans.


au sommaire


    Il y a près de 2 000 ans, le Vésuve dévastait Pompéi et Herculanum. Lors de fouilles menées lors du XVIIIe siècle dans cette dernière cité, plus de 1 000 rouleaux de papyruspapyrus manuscrits ont été récupérés. Ils étaient conservés, à Herculanum, dans la bibliothèque d'une luxueuse villa romaine qui appartenait dans le passé à Lucius Calpurnius Piso Caesoninus, encore appelé Pison, beau-père de Jules César, et protecteur des arts et de la philosophie. 

    Autant de témoignages d'une époque qui ne pouvaient pas être exploités, car l’encre noire était illisible sur les papyrus carbonisés. Les tentatives pour dérouler ces parchemins les réduisent systématiquement en cendres. Dès lors, ces rares écrits conservés à l'Institut de France à Paris et à la Bibliothèque nationale de Naples, n'ont pas pu être analysés depuis l'incendie de la villa.

    L’un des deux papyrus d'Herculanum de l’Institut de France numérisé avec les rayons X de la Diamond Light Source. © <em>Digital Restoration Initiative</em>, <em>University of Kentucky</em>
    L’un des deux papyrus d'Herculanum de l’Institut de France numérisé avec les rayons X de la Diamond Light Source. © Digital Restoration Initiative, University of Kentucky

    C'était sans compter sur le développement des intelligences artificielles et sur la prouesse de trois étudiants qui n'ont rien à voir avec des spécialistes de l'Antiquité. Youssef Nader, doctorant à Berlin, Luke Farritor, stagiaire à SpaceXSpaceX et Julian Schilliger, un étudiant suisse en robotique ont remporté une prime de 700 000 dollars dans le cadre d'un concours baptisé « Vesuvius Challenge ». Il consistait justement à déchiffrer le contenu de ces parchemins. Les rouleaux ont été préalablement numérisés en haute définition à partir de tomodensitogrammes. Avec ces modélisationsmodélisations qui permettent de « dérouler » virtuellement les parchemins, et une massemasse colossale de travail, les étudiants ont créé un algorithme d'IA qui, in fine, a permis de déchiffrer 2 000 lettres grecques d'un parchemin.

    Scan des couches d’un rouleau de papyrus. Déchiffrer les textes de ces parchemins enroulés et calcinés pourrait bien bouleverser l’histoire du monde antique. ©

    L'IA entraînée à détecter l'encre et à identifier les lettres

    L'IA a été entraînée à détecter la présence de l'encre et, avec les occurrences de forme, repérer les lettres. Mais, dès octobre, les trois étudiants avaient déjà pu identifier un mot grec ancien signifiant « violet » sur un parchemin grâce à leur IA. Quelques mois après, avec l'entraînement, ce sont donc 2 000 caractères qui ont pu être reconstitués. En réalité, cela fait des années que des ébauches d'algorithmes permettant de dérouler les rouleaux numériquement et de détecter les traces d'encre dans les fibres du papyrus sont développées. Mais les étudiants sont parvenus à les améliorer et l'IA bien entraînée a fait le reste. Pour les spécialistes de l'Antiquité, le texte qui traite des sources du plaisir aurait été rédigé par le philosophe épicurien Philodemus ou Philodème de Gadara.

    Le fait de pouvoir lire ces parchemins calcinés est une véritable révolution pour les chercheurs, car ils présentent la seule bibliothèque qui nous soit parvenue de l'époque romaine. Les textes pourraient même réécrire l'histoire que l'on connait du monde antique. Cette découverte pourrait bien engendrer la conduite de nouvelles fouilles sur le site archéologique de la villa, où les experts pensent que de nombreux autres manuscrits pourraient être enterrés. En attendant, le challenge va se poursuivre avec comme objectif de parvenir à déchiffrer 85 % d'un manuscrit. Les scientifiques vont notamment devoir améliorer la détection de l'encre sur les parties les plus endommagées.


    Un papyrus de 2 000 ans déchiffré par l’intelligence artificielle !

    Réussir à lire un rouleau de papyrus calciné sans avoir à le toucher ? Voilà en gros le défi lancé par l'université du Kentucky. Il n'en fallait pas plus pour motiver de jeunes étudiants en informatique. En améliorant un programme d'apprentissage automatique, l'un d'entre eux a réussi à extraire le premier mot de ce texte écrit il y a 2 000 ans.

    Article de Morgane GillardMorgane Gillard publié le 15 octobre 2023

    On dirait un morceau de boisbois calciné et pourtant, cet objet n'est autre qu'un papyrus vieux de 2 000 ans ayant brûlé lors de la célèbre éruption du Vésuve qui détruisit les villes de Pompéi et d’Herculanum en l'an 79. Ce fragile rouleau a ainsi été retrouvé au XVIIIe siècle sur les ruines de cette ancienne cité romaine, dans ce qui fut la bibliothèque personnelle de Lucius Clapurnius Piso Caesonius... autrement dit le beau-père de Jules César ! 1 800 autres papyrus ont également été exhumés lors des fouilles. Une mine d'or pour les archéologues, qui ne rêvent que de pouvoir lire les secrets qu'ils renferment.

    Des fragments de papyrus calciné ont déjà pu être déchiffrés, mais ce n'est pas le cas des rouleaux. © Sara Stabile, Francesca Palermo, Inna Bukreeva, Daniela Mele, Vincenzo Formoso, Roberto Bartolino & Alessia Cedola, Wikimedia Commons, CC by 4.0
    Des fragments de papyrus calciné ont déjà pu être déchiffrés, mais ce n'est pas le cas des rouleaux. © Sara Stabile, Francesca Palermo, Inna Bukreeva, Daniela Mele, Vincenzo Formoso, Roberto Bartolino & Alessia Cedola, Wikimedia Commons, CC by 4.0

    Des rouleaux calcinés passés aux rayons X

    Oui mais voilà... Impossible de dérouler ces précieux rouleaux carbonisés sous peine de les voir tomber en poussière. Les scientifiques avaient donc devant eux un formidable défi technique : réussir à scanner les mots inscrits sur les papyrus sans avoir à les dérouler. Une solution est alors apparue : les rayons Xrayons X (voir l'article ci-dessous). Deux rouleaux de papyrus sont ainsi allés faire un tour au synchrotron du Diamond Light Source, près d'Oxford. Des milliers d'images de tomographietomographie 3D ont ainsi été obtenues. Un nouveau challenge s'est alors présenté : réussir à identifier les lettres contenues dans cette importante masse de données.

    Détecter les lettres grâce à l’intelligence artificielle

    Des chercheurs se sont alors tournés vers l’intelligence artificielle pour automatiser le processus, en apprenant à l'algorithme à détecter les subtiles différences de structures du papyrus produites par l'encre utilisée. Si les premiers résultats sont très encourageants et permettent de déchiffrer certains fragments, le professeur Brent Seales de l'université du Kentucky veut aller plus vite. Il organise donc une compétition, le Vesuvius challenge, dont l'objectif est d'améliorer l'algorithme et la capacité de l'IA à déchiffrer les textes antiques cachés dans les deux papyrus calcinés. Un étudiant de l'université du Nebraska-Lincoln réussit ainsi à améliorer le processus d'apprentissage automatique et est le premier à déchiffrer le mot « πορφύραc » (« violet » en grec ancien) dans un rouleau carbonisé dont aucune lettre n'avait encore pu être extraite.

    L'aventure continue

    La compétition est cependant loin d'être terminée, le but étant désormais de continuer le déchiffrage de ce texte scellé dans les cendres depuis 2 000 ans. Parmi les papyrus déjà déchiffrés par Seales et ses collègues, nombreux sont ceux à relater des textes grecs issus du courant philosophique épicurien. Des textes d'Épicure lui-même ainsi que d'un autre philosophe nommé Philodème de Gadara ont été retrouvés. Mais pour savoir qui est l'auteur de ce fameux rouleau où apparaît le mot « violet » et de quel sujet il traite, il faudra certainement attendre encore un peu !


    Les secrets des papyrus calcinés d'Herculanum bientôt révélés par les rayons X ?

    Une équipe internationale veut utiliser une technique issue de l'apprentissage automatique pour décrypter des images 3D par rayons X afin de tenter de percer les secrets des célèbres papyrus d'Herculanum. Ces papyrus pourraient révéler des ouvrages philosophiques inédits datant de l'Antiquité gréco-romaine.

    Article de Laurent SaccoLaurent Sacco, publié le 4 octobre 2019

    Bien des textes, ou fragments de textes, datant de l'Antiquité gréco-romaine nous sont parvenus. Ils sont disponibles en langue grecque et avec leurs traductions comme jamais grâce au Web, qui constitue pour nous un outil qui aurait rendu profondément jaloux les lettrés, philosophes et savants de la bibliothèque d'Alexandrie s'ils en avaient connu l'existence. Nous pouvons ainsi lire le Banquet de Platon, des fragments de l'œuvre d'Archytas de Tarente ou encore les fameux écrits en mathématique, mécanique et astronomie d'Archimède.

    Par contre, nous savons que de nombreux textes ne sont pas passés à la postérité, les traités d'Héraclite et Démocrite par exemple ou bien encore la majorité des tragédies de Sophocle (seulement 7 sur plus d'une centaine nous sont parvenues). On ne sait pas très bien pourquoi mais on peut suspecter que, parfois, leur contenu n'était pas du goût des autorités monothéistes du début de notre ère.

    Toutefois, il existe une unique bibliothèque datant de l'Antiquité qui nous est parvenue dans laquelle on espère trouver des trésors peut-être insoupçonnés. Il s'agit d'un ensemble de près de 1.800 papyrus que l'on a commencé à découvrir entre 1752 et 1754, lors des fouilles du site d'Herculanum, près de Naples. Mais, comme l'expliquait plus en détail Futura dans le précédent article ci-dessous, ces papyrus qui faisaient partie de la bibliothèque de Lucius Calpurnius Piso Caesoninus, le beau-père de Jules César, ont été carbonisés lors de l'éruption du Vésuve en 79 après Jésus-Christ.

    Une partie de l'alphabet reconstitué depuis l'un des rouleaux de papyrus. Les lettres trouvées grâce à la tomographie X en contraste de phase sont sur la première et deuxième ligne. Sur la troisième ligne se trouvent les lettres obtenues par infrarouge à partir d'un autre papyrus. La comparaison des deux alphabets a permis l'identification du style d'écriture du rouleau. La quatrième ligne présente les caractères grecs en majuscules d'impression. © CNRS-IRHT UPR 841, ESRF, CNR-IMM Unité de Naples
    Une partie de l'alphabet reconstitué depuis l'un des rouleaux de papyrus. Les lettres trouvées grâce à la tomographie X en contraste de phase sont sur la première et deuxième ligne. Sur la troisième ligne se trouvent les lettres obtenues par infrarouge à partir d'un autre papyrus. La comparaison des deux alphabets a permis l'identification du style d'écriture du rouleau. La quatrième ligne présente les caractères grecs en majuscules d'impression. © CNRS-IRHT UPR 841, ESRF, CNR-IMM Unité de Naples

    On a tenté de dérouler ces papyrus mais ils sont tellement fragiles que les opérations généralement effectuées avant le XXIe siècle conduisaient plutôt à leur destruction, même s'il a toutefois été possible de découvrir que certains de ces rouleaux contenaient des textes de Philodème de Gadara, un philosophe épicurien (cela n'était guère surprenant, Pison, le nom parfois donné au beau-père de Jules César, était un protecteur des arts et de la philosophie). Nous disposons heureusement maintenant d'un puissant moyen d'investigation non invasifinvasif, à savoir les lignes de lumièrelumière des synchrotrons sous forme de rayons X qui permettent de faire de la tomographie avec des objets précieux dans le domaine de l'archéologie et de la paléontologiepaléontologie, en plus de permettre de faire de la cristallographiecristallographie pour des matériaux savants et des molécules biologiques d’intérêts.

    L'intelligence artificielle et des rayons X pour ressusciter l'Antiquité

    Il y a quelques années déjà, comme l'expliquait Futura toujours dans l'article ci-dessous, une des lignes de lumière disponible avec l'ESRF (European Synchrotron Radiation FacilityEuropean Synchrotron Radiation Facility), le célèbre synchrotron de Grenoble, avait été utilisée pour tenter de percer certains des secrets des papyrus d'Herculanum. L'équipe internationale engagée dans cette entreprise, et qui comprenait des chercheurs du CNRS (Institut de recherche et d'histoire des textes) et du CNR italien, avait en particulier réussi à identifier des lettres grecques.

    On espère aller plus loin aujourd'hui en utilisant des techniques d'analyse des données issues des développements fulgurants de l'apprentissage automatique (en anglais machine learning, littéralement « apprentissage machine »). C'est ce que se propose de faire avec des collègues le professeur Brent Seales, directeur de la « DigitalDigital Restoration Initiative » de l'université du Kentucky (États-Unis), un programme de recherche consacré au développement d'outils logiciels permettant la récupération de textes fragiles et illisibles.


    Une présentation de la saga associée au décryptage des papyrus d'Herculanum avec des rayons X. Pour obtenir une traduction en français assez fidèle, cliquez sur le rectangle blanc en bas à droite. Les sous-titres en anglais devraient alors apparaître. Cliquez ensuite sur l'écrou à droite du rectangle, puis sur « Sous-titres » et enfin sur « Traduire automatiquement ». Choisissez « Français ». © VisCenter

    Le problème avec les papyrus d'Herculanum, c'est que certains ont été écrits en utilisant une encre non-métallique et donc basée sur le carbonecarbone, de sorte qu'il est très difficile de faire la différence entre les caractères couchés sur le papyrus carbonisé et ce papyrus lui-même. Toutefois, les chercheurs pensent que des algorithmes issus de l'apprentissage automatique peuvent voir des différences sur des images que ne remarquerait pas un observateur humain.

    Il faut toutefois de nouvelles données plus précises à exploiter et c'est pour cela que plusieurs des papyrus offerts en 1802 par le roi de Naples à Napoléon Bonaparte, et qui sont conservés à la bibliothèque de l'Institut de France à Paris, ont franchi la Manche pour être étudiés avec les rayons X fournis cette fois-ci par le synchrotron Diamond Light Source situé dans l'Oxfordshire au Royaume-Uni. Des images en 3D à très haute résolution sont rendues possibles, comme jamais pour ces papyrus, avec la ligne de lumière I12 de ce synchrotron.

    Comme l'explique dans un communiqué de l'AFP Michel Zink, secrétaire perpétuel de l'Académie des Inscriptions et Belles lettres, on sait que certains des papyrus « contiennent pour l'essentiel des écrits grecs, chez une personne intéressée par la philosophie épicurienne... Contrairement à la philosophie stoïcienne, dont les textes, jugés compatibles avec le christianisme, ont été recopiés au Moyen Âge, l'épicurisme n'était pas en odeur de sainteté, et ses textes ont rarement été conservés... C'est pourquoi ces rouleaux présentent, sur le fond, une telle importance » conclut Michel Zink, car « on peut espérer réussir à lire des phrases entières, et peut-être un jour, un texte entier ».

    On pourrait peut-être alors découvrir des informations fascinantes dans la droite ligne des idées de Michel Serres exposées dans son fameux ouvrage La Naissance de la physique dans le texte de Lucrèce.


    Lire les papyrus d'Herculanum grâce aux rayons X

    Article de Laurent Sacco, publié le 22/01/2015

    Une équipe internationale comprenant des chercheurs du CNRS (Institut de recherche et d'histoire des textes), du CNR italien et de l'ESRF (synchrotron de Grenoble) a utilisé une nouvelle technique d'imagerie non invasive par rayons X pour tenter de percer les secrets des célèbres papyrus d'Herculanum. L'équipe a ainsi réussi à identifier des lettres grecques sans avoir à dérouler les rouleaux carbonisés par l'éruption du VésuveVésuve en 79 après J.C. Ces papyrus, contenus dans la seule bibliothèque antique qui nous soit parvenue à ce jour, pourront probablement tous être décryptés grâce cette technique.

    Les célèbres papyrus d'Herculanum ont été retrouvés à partir de 1752 dans l'une des villas d'Herculanum. Cette cité a été préservée pour les générations futures en même temps que celle de Pompéi en 79 après J.C. lors des éruptions du Vésuse. Nous savons aujourd'hui que ces papyrus faisaient partie de la bibliothèque de Lucius Calpurnius Piso Caesoninus, encore appelé Pison. En plus d'être le beau-père de Jules César et un politicien influant dans la Rome antique, Pison était un protecteur des arts et de la philosophie.

    Sa bibliothèque, la seule de l'Antiquité qui nous soit parvenue complète, contenait notamment des textes rédigés en grec exposant les idées de Philodème de Gadara, un philosophe épicurien d'origine syrienne, mais très hellénisé. Il a en effet étudié à Athènes auprès de Zénon de Sidon, alors à la tête de l'école épicurienne avant notre ère.

    L'un des deux rouleaux de papyrus d'Herculanum mis à disposition des physiciens par l’Institut de France. Pour les spécialistes, son petit nom est PHerc.Paris.4. Ces rouleaux avaient été donnés à Napoléon en 1802 par le roi de Naples. © Emmanuel Brun
    L'un des deux rouleaux de papyrus d'Herculanum mis à disposition des physiciens par l’Institut de France. Pour les spécialistes, son petit nom est PHerc.Paris.4. Ces rouleaux avaient été donnés à Napoléon en 1802 par le roi de Naples. © Emmanuel Brun

    Des papyrus chauffés et carbonisés à plus de 300 °C

    Contrairement à Pompéi qui a été ensevelie sous des cendres, Herculanum l'a été par des coulées de boue dont les températures devaient avoisiner les 300 à 330 °C. Les papyrus que contenait la Villa dite « des Pison » ou « des Papyrus » ont donc été largement carbonisés. Mais par la suite, la boue les a protégés de l'action de l'oxygène et de l'humidité, ce qui n'a pas été le cas des écrits qui se trouvaient à Pompéi, détruits par les cendres chaudes. Les spécialistes ont rapidement essayé de lire ces papyrus mais l'entreprise s'est révélée délicate car bien des tentatives et des méthodes utilisées pour les dérouler conduisent à la dégradation, quand ce n'est pas à la destruction pure et simple des papyrus.

    Environ 400 des rouleaux exhumés ont tout de même pu être explorés. Leurs longueurs sont comprises entre 3 et 15 mètres. Plusieurs découvertes ont été faites. Les textes de Philodème contenaient en effet des fragments d'œuvres perdues appartenant au corpus de la philosophie stoïcienne mais aussi des extraits des œuvres d'AristoteAristote et de Théophraste.

    Il reste encore des centaines de rouleaux à décrypter et ils pourraient bien contenir quelques surprises, sans compter qu'une partie de la Villa des Papyrus dort encore dans la boue volcanique. Les archéologues se sont adjoint l'aide des physiciensphysiciens pour tenter de lire ces rouleaux sans avoir besoin de les dérouler afin de conserver intact le plus d'informations possible.


    Cette vidéo donne une idée de la performance réalisée par les physiciens de l'ESRF avec les papyrus d'Herculanum. Un rouleau carbonisé devient lisible sans être ouvert. Les lettres redeviennent visibles à l'aide de rayons X et d'algorithmes de traitement de l'image. © YouTube, Emmanuel Brun

    De la tomographie X en contraste de phase pour lire Philodème

    Les chercheurs ont mis à profit une idée ingénieuse afin de distinguer l'encre des lettres sur les papyrus à l'aide de rayons X. En effet, l'encre utilisée à l'époque était fabriquée à partir de carbone issu des résidus de fumée ce qui rend sa densité quasi identique à celle des feuilles de papyrus carbonisée. Mais il existe tout de même une différence d'indice de réfractionindice de réfraction pour ces deux matériaux avec des rayons X qui ne s'y propagent donc pas à la même vitessevitesse.

    Comme ils l'expliquent dans un article publié dans Nature Communications, les chercheurs ont utilisé cette caractéristique pour faire des expériences avec l'une des lignes de lumière disponible avec l'ESRF (European Synchrotron Radiation Facility), le célèbre synchrotron de Grenoble. En outre, l'encre n'ayant pas pénétré dans les fibres végétales des papyrus, les lettres dépassent de la surface des rouleaux de quelques centaines de micronsmicrons, ce qui permet d'utiliser la tomographie X en contraste de phase (XPCT) sur deux des rouleaux d'Herculanum.

    Les résultats obtenus sont prometteurs. Il a été possible de reconstituer un alphabet grec presque complet et aussi de lire quelques mots. Après comparaison avec ceux déjà déchiffrés sur d'autres papyrus qui ont été déroulés, il semble que celui-ci puisse également être attribué à Philodème.

    Il reste encore beaucoup de travail à faire selon les chercheurs mais il semble qu'un verrouverrou a bel et bien sauté qui empêchait d'imaginer pouvoir lire toute la bibliothèque de Pison sans avoir à ouvrir les rouleaux qu'elle contient.