Databac

Rubrique Représentation des données : Types et valeurs de base III. Représentation d’un texte en machine.

Publié le 10/03/2024

Extrait du document

« Rubrique Représentation des données : Types et valeurs de base III.

Représentation d’un texte en machine. 1 SPE-NSI Les lettres ? Toutes des nombres ! Dans ce chapitre, nous voyons comment sont représentés les caractères et les textes de toutes les langues du monde. Les caractères sont des données non numériques, ce sont des symboles alphanumériques. Nous expliquons pourquoi il existe plusieurs codes tels ASCII, ISO-8859-1, Unicode. Samuel Morse (1791 - 1872) 2 SPE-NSI 1.

Codage numérique du texte Charset et Encoding Binaire = suite de bits (0,1) En télécommunications et en informatique, un jeu de caractères codés (charset encoding en anglais) est un code qui associe un jeu de caractères d'un alphabet avec une représentation numérique pour chaque caractère de ce jeu. Le jeu de caractère est nommé charset (character set) et le code qui relie chaque caractère à un nombre est nommé encoding. Par exemple, le code Morse (qui associe l’alphabet latin à une série de pressions longues et de pressions courtes sur le manipulateur morse du télégraphe) est l’un des premiers jeux de caractères codés. 3 SPE-NSI 2.

Le code ASCII ([askiː]) Norme Règle 2.1 Un peu d’histoire Les ordinateurs ne sachant pas manipuler autre chose que des 0 et des 1, il y a eu nécessité de traduire le texte en binaire afin de pouvoir envoyer des emails, créer des pages web, etc. En théorie, c’est très simple : il suffit d’associer un nombre entier unique à chaque caractère.

En pratique, le choix de l’encodage doit respecter certaines contraintes. Tout d’abord, il faut que tous les ordinateurs utilisent le même encodage.

Ensuite, il doit permettre de représenter le plus de caractères possibles.

Enfin, il doit être le plus compacte possible pour économiser la mémoire ou le volume des échanges réseaux. 4 SPE-NSI Au début des années 1960, l’ANSI (American National Standards Institute) propose une norme de codage de caractères appelée ASCII (pour American Standard Code Information Interchange). 5 SPE-NSI 2.2 Représentation des caractères : Principes de la norme ASCII Nous nous intéressons, dans ce chapitre, à la représentation des textes, c’est-à-dire des suites de caractères, éventuellement enrichies d’informations typographiques.

Mise en page Puisqu’un texte est une suite de caractères, nous commençons par nous intéresser à la représentation des caractères, c’est-à-dire entre autres choses aux lettres minuscules et majuscules, aux chiffres, aux signes de ponctuation et aux symboles mathématiques. Pour représenter ces caractères, on attribue un nombre entier à chacun. Le code ASCII, par exemple, attribue le nombre 65 à la lettre « A », le nombre 66 à la lettre « B », le nombre 97 à la lettre « a » et le nombre 98 à la lettre« b ».

Il représente 95 caractères imprimables : les 26 lettres minuscules, les 26 lettres majuscules, les 10 chiffres, les 32 symboles ! " # $ % & ’ ( ) * + , – .

/ : ; < = > ? @ [ \ ] ^ _ ` { | } ~ et 1 signe d’espace. Il représente aussi 33 autres symboles (0 à 31 et le 127) de mise en page (de contrôle), par exemple le retour chariot qui signale la fin de la ligne et le saut de page qui signale le passage à la page suivante.

Le code ASCII représente donc 95 + 33 = 128 = 𝟐𝟕 caractères, représentés par des nombres qui peuvent eux mêmes être représentés en binaire par des mots de sept bits.

Ils sont en fait représentés par des mots de huit bits, le 8ème bit étant toujours un zéro. Le code ASCII était à l’origine conçu pour des textes écrits en anglais, comme l’indique son nom, American Standard Code for Information Interchange. . 6 SPE-NSI La construction de la table ASCII  Le code ASCII est un code sur 7 bits, il y a donc 27 = 128 codages possibles.  Il y a 33 caractères de contrôle, retenons surtout l’espace ou fin de ligne.  Les lettres se suivent dans l’ordre alphabétique. * Les majuscules codée de 65 à 90 * Les minuscules codée de 97 à 122 * Pour passer de majuscule à minuscule on ajoute 32 = 25 Cela revient alors à modifier le 6ème bit :  G codé 71 = 0100 0111 en base 2 devient g codé 103 = 71 + 32 = 0110 0111 en binaire 7 SPE-NSI 2.3 La représentation des textes simples Un texte étant une suite de caractères, on peut le représenter en écrivant les caractères les uns après les autres. SAVOIR-FAIRE : Trouver la représentation en ASCII binaire d’un texte en utilisant une table, on cherche le code ASCII de chaque caractère.

Puis on traduit chacun de ces nombres en représentation binaire. Exemple: Trouver la représentation binaire en ASCII du texte « Je pense, donc je suis.

» On cherche la table des codes ASCII sur le Web de manière à traduire le texte, caractère par caractère : 74, 101, 32, 112, 101, 110, 115, 101, 44, 32, 100, 111, 110, 99, 32, 106, 101, 32, 115, 117, 105, 115, 46.

On exprime ensuite chacun de ces nombres en binaire sur huit bits : 01001010 01100101 00100000 01110000 01100101 01101110 01110011 01100101 00101100 00100000 01100100 01101111 01101110 01100011 00100000 01101010.... »

↓↓↓ APERÇU DU DOCUMENT ↓↓↓

Liens utiles