Minoru Harada, professeur à l'université d'Aoyama a développé un programme qui génère rapidement des résumés de qualité à partir de documents écrits en langue japonaise.

au sommaire


    Le programme utilise le dictionnaire électronique EDR et un algorithme spécial qui donne la priorité aux éléments supposés les plus importants du texte. Le dictionnaire électronique EDR est une base de données de mots et de concepts de mots conçue entre autre pour faciliter la reconnaissance automatique de parole. Le nouveau logiciellogiciel de création de résumé utilise ce dictionnaire afin de comparer les différentes significations d'un mot puis déterminer la plus appropriée en analysant la relation de ce mot avec les autres éléments du texte. Les mots ayant des sens identiques et apparaissant souvent dans un texte sont ainsi supposés importants dans le contexte du document et seront inclus de préférence dans le résumé.

    L'une des utilisations possible d'un tel programme est la création de résumés pour les entreprises qui doivent effectuer des recherches dans des quantités importantes de documents. Il peut également permettre d'extraire automatiquement le sens de questionnaires en ligne dans lesquels les sondés sont autorisés à répondre par des phrases complètes et libres.