Unicode est un système de codage spécifiant un nombre unique pour chaque caractère © Freephotos9091, Pixabay

Tech

Unicode

DéfinitionClassé sous :Tech , caractère Unicode , Codeurs décodeurs

Unicode est un système de codage créé en 1998, qui spécifie un nombre unique pour chaque caractère, quels que soient la plate-forme, le logiciel et la langue utilisés. Alors que l'ASCII (American Standard Code for Information Interchange) étendu à 8 bits pouvait prendre en compte un maximum de 256 caractères, Unicode traduit chaque caractère en 16 bits et peut donc analyser plus de 65 000 caractères uniques, et traiter informatiquement tous les systèmes d'écriture de la planète.

C'est ainsi une norme universelle de codage de caractères. Elle est utilisée pour prendre en charge les caractères dans des scripts non ASCII. À l'origine, Internet a été construit en ASCII, et donc basé sur l'alphabet anglais et ne comporte que 128 caractères. Unicode supporte toutes les langues du monde grâce à ses jeux de caractères uniques. 

D'où vient Unicode ?

Dès le début de 1990, Microsoft commence à participer aux réunions Unicode. En juin, c'est au tour d'IBM de les rejoindre. La même année, les travaux de formation d'un consortium standard se lancent. Le 3 janvier 1991, le consortium Unicode est fondé en Californie, aux États-Unis. Il s'agit d'une organisation à but non lucratif qui coordonne la norme, et a pour objectif de remplacer un jour les schémas de codage de caractères existants par des schémas de transformation Unicode normalisés (appelés Format de transformation Unicode, ou UTF). Il est développé en collaboration avec l'Organisation internationale de normalisation (ISO).

Les 2 types d'Unicode

Il existe différents types d'Unicode, dont l'UTF-8 et l'UTF-16, les deux plus courants. L'UTF-8 est devenu la règle typique utilisée sur Internet, car elle ajuste le nombre de bits utilisés en fonction du caractère. Cela signifie que les caractères ASCII en UTF-8 n'occupent que les bits qui doivent être traités.

Unicode a présenté un grand succès dans l'unification de caractères, ce qui a conduit à une utilisation généralisée et prédominante dans l'internationalisation des programmes informatiques. Cette norme a ainsi été appliquée dans de nombreuses technologies récentes, notamment XML, Java et les systèmes d'exploitation modernes.

Cela vous intéressera aussi
Abonnez-vous à la lettre d'information La quotidienne : nos dernières actualités du jour. Toutes nos lettres d’information

!

Merci pour votre inscription.
Heureux de vous compter parmi nos lecteurs !