Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.
Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme "U+...." (où "...." correspond à un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF).
Plans réservés supplémentaires
Les tables suivantes listent tous les blocs de points de code alloués dans ce plan dans les normes ISO/CEI 10646 et Unicode.
Légende des conventions de couleurs et de style
|
Les blocs affichés sur fond clair sont alloués et contiennent des caractères affichables et normalisés. Certains de ces blocs peuvent également contenir des signes diacritiques.
|
Les blocs affichés sur fond bleu sont alloués et contiennent des signes diacritiques normalisés qui se combinent avec d’autres caractères de base après lesquels ils sont codés dans les textes.
|
Les blocs affichés sur fond jaune pâle sont alloués et contiennent des caractères affichables et normalisés pour des écritures de droite à gauche (ils nécessitent la prise en charge des écritures bidirectionnelles pour un rendu correct ; certains de ces caractères, mais pas tous, peuvent nécessiter une présentation en miroir selon le contexte directionnel). Certains de ces blocs peuvent également contenir des signes diacritiques.
|
Les blocs affichés sur fond vert sont alloués définitivement et attribués à des caractères à usage privé et libre, mais non interopérables.
|
Les blocs affichés sur fond rouge sont alloués définitivement mais les points de codes ne sont pas attribués à des caractères affichables (ce sont des caractères spéciaux ou de contrôle).
|
Les blocs affichés sur fond gris foncé ne sont pas encore attribués officiellement (dans la version actuelle Unicode 16.0). Parmi ceux-ci :
- les blocs nommés « (en caractères droits entre parenthèses) » sont acceptés par les groupes de travail de normalisation Unicode et/ou ISO et en cours de validation finale pour une normalisation prochaine, cependant la liste exacte et l’ordre des caractères qui seront retenus n’est pas encore définitive, des unifications, distinctions ou ajouts étant encore possibles ;
- les blocs nommés « (en italique entre parenthèses) » ont seulement fait l’objet d’une proposition formelle et sont en cours de validation par les groupes de travail de normalisation Unicode et/ou ISO, pour une normalisation ultérieure, la liste précise et l’ordre des caractères n’est qu’indicative ;
- les blocs nommés « ¿en italique entre points d’interrogation? » sont en projet et peuvent être encore déplacés, leur taille étant seulement estimée s’ils sont finalement retenus.
|
Les blocs affichés sur fond noir sont pour des points de codes réservés de façon permanente à des « non-caractères ».
- Ils peuvent servir uniquement pour des représentations ou encodages nécessaires à des opérations ou transformations internes, propres à certains processus ou protocoles (qui les utilise avec des règles spécifiques). De tels points de codes sont interdits pour représenter un quelconque caractère dans des textes valides encodés dans une forme UTF normalisée par Unicode ou compatible. En dehors de cet usage interne pour de tels processus ou protocoles, ils ne sont pas interopérables et pas transformables librement entre toutes les formes de codage UTF normalisées.
- Noter qu'il existe également deux points de code réservés de façon permanente à des « non-caractères » à la fin de chacun des 17 plans dans un petit sous-bloc « spécial » affiché sur fond rouge dans les tableaux ci-dessous.
|
- Afin de limiter la taille des pages sur Wikipédia, chaque plan Unicode est subdivisé ici en 16 plages arbitraires de 4 096 points de code chacun, décrits dans des sous-pages plus complètes accessibles par la palette de navigation en haut des pages, ou bien via les liens dans la première colonne des tables ci-dessous.
- Lorsqu’un bloc officiel d’Unicode s’étend sur plusieurs plages, les liens nommant les blocs dans les tables ci-dessous pointent seulement vers la première partie du bloc, et les autres parties sont liées entre elles et listées chacune dans les sous-pages des plages de 4 096 points de code.
|
Plan supplémentaire numéro 4
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+40000 ... U+4EF00
|
(plan supplémentaire 4, réservé)
|
U+4F000 ... U+4FE00
|
U+4FF00
|
|
Sp.
|
Plan supplémentaire numéro 5
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+50000 ... U+5EF00
|
(plan supplémentaire 5, réservé)
|
U+5F000 ... U+5FE00
|
U+5FF00
|
|
Sp.
|
Plan supplémentaire numéro 6
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+60000 ... U+6EF00
|
(plan supplémentaire 6, réservé)
|
U+6F000 ... U+6FE00
|
U+6FF00
|
|
Sp.
|
Plan supplémentaire numéro 7
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+70000 ... U+7EF00
|
(plan supplémentaire 7, réservé)
|
U+7F000 ... U+7FE00
|
U+7FF00
|
|
Sp.
|
Plan supplémentaire numéro 8
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+80000 ... U+8EF00
|
(plan supplémentaire 8, réservé)
|
U+8F000 ... U+8FE00
|
U+8FF00
|
|
Sp.
|
Plan supplémentaire numéro 9
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+90000 ... U+9EF00
|
(plan supplémentaire 9, réservé)
|
U+9F000 ... U+9FE00
|
U+9FF00
|
|
Sp.
|
Plan supplémentaire numéro 10
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+A0000 ... U+AEF00
|
(plan supplémentaire 10, réservé)
|
U+AF000 ... U+AFE00
|
U+AFF00
|
|
Sp.
|
Plan supplémentaire numéro 11
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+B0000 ... U+BEF00
|
(plan supplémentaire 11, réservé)
|
U+BF000 ... U+BFE00
|
U+BFF00
|
|
Sp.
|
Plan supplémentaire numéro 12
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+C0000 ... U+CEF00
|
(plan supplémentaire 12, réservé)
|
U+CF000 ... U+CFE00
|
U+CFF00
|
|
Sp.
|
Plan supplémentaire numéro 13
|
+00 |
+10 |
+20 |
+30 |
+40 |
+50 |
+60 |
+70 |
+80 |
+90 |
+A0 |
+B0 |
+C0 |
+D0 |
+E0 |
+F0
|
U+D0000 ... U+DEF00
|
(plan supplémentaire 13, réservé)
|
U+DF000 ... U+DFE00
|
U+DFF00
|
|
Sp.
|
Voir aussi
Liens externes
- Tables de caractères classées par écriture, sur le site officiel Unicode (dernière version normalisée) :
Articles connexes
|
Jeux de caractères de base |
|
|
Codification de fichiers et protocoles |
|
Adaptations de référence |
|
Équivalences standards |
- NFC (forme précomposée, recommandée)
- NFD (forme décomposée)
- NFKC (forme précomposée de compatibilité)
- NFKD (forme décomposée de compatibilité)
|
Propriétés et algorithmes |
|
Transformations |
|
Standards et normes liés |
- BCP 47 (étiquettes IETF d’identification de langues)
- ISO 639 (codes pour la représentation des noms de langues ou groupes de langues)
- ISO 15924 (codes pour la représentation des noms d’écritures)
- ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde)
- ISO 4217 (codes pour la représentation des noms de devises monétaires)
|
Mises en œuvre et applications |
|