Charset/ISO8859-15
| ISO 8859-15 | |
|---|---|
| Nom | ISO 8859-15 |
| Description | Jeu supplémentaire latin pour l’Europe (« latin 9 ») |
| Nombre de caractères | 96 |
| Famille | ISO 8859 |
| Langues | allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes). |
| État du projet | normalisé |
| Plates-formes possibles | Unix/Linux |
| Développeur | ISO/ Canada (Standards Council of Canada/Conseil canadien des normes), Danemark (Dansk
Standard), Finlande (SFS – STY/Tieke), France (AFNOR – Association française de normalisation), Irlande (NSAI – National Standards Authority of Ireland) |
| Séquences d'échappement | G1: ESC 02/13 06/02 G2: ESC 02/14 06/02 G3: ESC 02/15 06/02 |
| Numéro d'enregistrement | 203 |
| Unité de codage | 7 à 8 bits |
| Date de première version | 16 septembre 1998 |
| Site web | http://www.itscj.ipsj.or.jp/ISO-IR/203.pdf |
L'ISO/CEI 8859-15 (aussi connue comme Latin-9 et non officiellement comme Latin-0, mais jamais comme Latin-15) est la Modèle:15e partie de la norme de codage de caractères ISO 8859 de l'Organisation internationale de normalisation (ISO).
Cette norme donne un code numérique tenant sur Modèle:Unité aux caractères de l'alphabet latin utilisés en allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes).
Historique et perspectives
Modèle:... Il peut être considéré comme une mise à jour de la norme ISO 8859-1 : il est identique, à l'exception de huit caractères. Il ajoute entre autres le caractère de l'euro (€) et les caractères Œ, œ et Ÿ qui manquaient pour l'écriture du français, les caractères Š et š qui manquaient pour l'écriture du tchèque. Il enlève en échange quelques caractères peu utilisés.
- standardisation du 16 septembre 1998
Apports et limitations
Note : les codes numériques sont donnés en base hexadécimale.
| Position | 0xA4 | 0xA6 | 0xA8 | 0xB4 | 0xB8 | 0xBC | 0xBD | 0xBE |
|---|---|---|---|---|---|---|---|---|
| 8859-1 | ¤ | ¦ | ¨ | ´ | ¸ | ¼ | ½ | ¾ |
| 8859-15 | € | Š | š | Ž | ž | Œ | œ | Ÿ |
| ISO/CEI 8859-15 | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
| 0x | non utilisé | |||||||||||||||
| 1x | ||||||||||||||||
| 2x | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
| 5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
| 6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
| 7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
| 8x | non utilisé | |||||||||||||||
| 9x | ||||||||||||||||
| Ax | ¡ | ¢ | £ | € | ¥ | Š | § | š | © | ª | « | ¬ | | ® | ¯ | |
| Bx | ° | ± | ² | ³ | Ž | µ | ¶ | · | ž | ¹ | º | » | Œ | œ | Ÿ | ¿ |
| Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
| Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
| Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
| Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Dans la table ci-dessus, 20 est l'espace standard, A0 est l'espace insécable.
Les valeurs 00-1F, 7F, et 80-9F ne sont pas assignées à des caractères par l'ISO/CEI 8859-15.
Carte complète de l'ISO 8859-15 avec les différences par rapport à l'ISO 8859-1 marquées en jaune :
| ISO 8859-15 | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
| 0x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
| 1x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
| 2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
| 5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
| 6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
| 7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
| 8x | PAD | HOP | BPH | NBH | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | RI | SS2 | SS3 |
| 9x | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | SOS | SGCI | SCI | CSI | ST | OSC | PM | APC |
| Ax | NBSP | ¡ | ¢ | £ | € | ¥ | Š | § | š | © | ª | « | ¬ | | ® | ¯ |
| Bx | ° | ± | ² | ³ | Ž | µ | ¶ | · | ž | ¹ | º | » | Œ | œ | Ÿ | ¿ |
| Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
| Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
| Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
| Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Standardisation et normalisation
Le nom officiel de ce système de codage est « Jeu supplémentaire latin pour l’Europe (« latin 9 ») ». Ce jeu définit 96 caractères graphiques.
Ce jeu de caractères est utilisables avec l’IRV de l’ISO/CEI 646 (ISO-IR 6) que ce soit dans un contexte 8 bits ou 7 bits, au travers de la technologie de l’ISO/CEI 2022. Il dérive du «latin no 1 (ISO-IR 100)» dont certains caractères ont été remplacés pour le français, le finnois, et le symbole Euro (€).
La standardisation du 16 septembre 1998 définit trois séquences d'échappement[1]:
- G1: ESC 02/13 06/02
- G2: ESC 02/14 06/02
- G3: ESC 02/15 06/02
En mode 8 bits, il est plus ou moins interopérable avec le windows-1252, dans la mesure où certains caractères sont affectés identiquement.
Usages et applications
Avec l'arrivée de l'Euro, ce jeu s'est imposé en Europe comme le standard Unix/Linux, avant l'arrivée d'UTF-8. La plupart des logiciels fonctionnant avec des caractères mono-octets et ne dépendant pas d'un ordre spécifique des caractères ont pu continuer à fonctionner à l'identique.
Aujourd'hui, son usage s'efface au profit de l'UTF-8.
Aspects économiques et sociaux
La norme a été sponsorisée par le Canada (Standards Council of Canada/Conseil canadien des normes), la Danemark (Dansk Standard), la Finlande (SFS – STY/Tieke), la France (AFNOR – Association française de normalisation), et l'Irlande (NSAI – National Standards Authority of Ireland).
La norme est disponible en langues françaises et anglaise, elle est vendue à 66 francs suisses[2].
La coexistence de normes de codages partiellement incompatibles conduit à la disparition du symbole euro de certains documents.
En informatique, il n’est pas exceptionnel de rencontrer un usage fautif du code 128 de Windows-1252 là où les normes stipulent que le codage Unicode ou ISO 8859-1 est utilisé. En particulier, en HTML et XML, l’entité numérique € n’est pas valable ; le symbole euro doit être représenté avec l’entité numérique €. En outre, dans un texte codé en ISO 8859-1 ou ISO 8859-15, le code 128 ne représente pas le symbole euro ; ISO 8859-1 ne permet pas de représenter le symbole euro et ISO 8859-15 utilise le code 164.