Code ASCII

American Standard Code for Information Interchange
Code Standard américain pour l'échange d'information

Introduite en 1961 par Bob Bemer, cette norme définit 128 caractères numérotés de 0 à 127. Un caractère est ainsi codé sur 7 bits : à .

En pratique, l'octet étant l'élément de base d'une mémoire d'ordinateur, les caractères d'un texte codé en ASCII sont tous stockés sur 8 bits, avec le bit de poids fort systématiquement positionné à zéro.

Table des caractères ASCII

Décimal HexadécimalCaractère
0 00 NUL
1 01 SOH
2 02 STX
3 03ETX
4 04EOT
5 05ENQ
6 06ACK
7 07BEL
8 08BS
9 09HT
10 0ALF
11 0BVT
12 0CFF
13 0DCR
14 0ESO
15 0FSI
16 10DLE
17 11DC1
18 12DC2
19 13DC3
20 14DC4
21 15NAK
22 16SYN
23 17ETB
24 18CAN
25 19EM
26 1ASUB
27 1BESC
28 1CFS
29 1DGS
30 1ERS
31 1F US
Décimal HexadécimalCaractère
32 20SP
33 21!
34 22"
35 23#
36 24$
37 25%
38 26&
39 27'
40 28(
41 29)
42 2A*
43 2B+
44 2C,
45 2D-
46 2E.
47 2F/
48 300
49 311
50 322
51 333
52 344
53 355
54 366
55 377
56 388
57 399
58 3A:
59 3B;
60 3C<
61 3D=
62 3E>
63 3F?
Décimal HexadécimalCaractère
64 40@
65 41A
66 42B
67 43C
68 44D
69 45E
70 46F
71 47G
7248H
7349I
744AJ
754BK
764CL
774DM
784EN
794FO
8050P
8151Q
8252R
8353S
8454T
8555U
8656V
8757W
8858X
8959Y
905AZ
915B[
925C\
935D]
945E^
955F_
Décimal HexadécimalCaractère
9660`
9761a
9862b
9963c
10064d
10165e
10266f
10367g
10468h
10569i
1066Aj
1076Bk
1086Cl
1096Dm
1106En
1116Fo
11270p
11371q
11472r
11573s
11674t
11775u
11876v
11977w
12078x
12179y
1227Az
1237B{
1247C|
1257D}
1267E~
1277FDEL

ASCII étendu

Comme son nom l'indique, il s'agit d'une extension du standard ASCII : en ASCII étendu, les caractères ont un code de 8 bits, dont la valeur peut donc aller de 0 à 255.

Il existe de nombreuses versions de l'ASCII étendu, certaines normalisées (les différentes parties de la norme ISO-8859), d'autres pas (Windows-1252). Ceci ne facilite pas les échanges lorsque l'on ne connait pas la version utilisée pour créer un texte.
Exemple : ISO-8859-1. Parmi les plus répandus, ce jeu de caractères étend l'ASCII par de nombreux caractères (notamment les caractères accentués) utilisés dans les pays d'Europe de l'Ouest. Une version mise à jour de ce jeu de caractères est ISO-8859-15, qui répare certains oublis comme le caractère œ, et ajoute des caractères "inventés" récemment comme le caractère .

Unicode

Créé pour remplacer par une norme unique les nombreuses versions de l'ASCII étendu, l'Unicode va au delà de la simple association code-caractère, et définit, outre un jeu de caractères global (près de 250 000 caractères, incluant également symboles, idéogrammes...), de nombreuses propriétés pour chaque caractère. Il existe plusieurs implémentations informatiques (appelées transformations) de l'Unicode :

Pour en savoir plus : Consortium Unicode

Exercices sur le code ASCII

Résolvez les exercices ci-dessous sans consulter la table des codes ASCII.

Rappels :

Exercices sur le code UTF-8

A partir des valeurs de leurs octets, donnez le nombre de caractères des chaînes encodées en UTF-8 suivantes.