Codifiche numeriche: Codice ASCII

Codice ASCII

ASCII (acronimo di American Standard Code for Information Interchange, Codice Standard Americano per lo Scambio di Informazioni) è un codice per la codifica di caratteri. La standard ASCII è stato pubblicato dall'American National Standards Institute (ANSI) nel 1968. Ha 8 bit.

Con US-ASCII si intende un sistema di codifica dei caratteri a 7 bit, comunemente utilizzato nei calcolatori, proposto dall'ingegnere dell'IBM Bob Bemer nel 1961, e successivamente accettato come standard dall'ISO, con il nome di ISO/IEC 646.

Alla specifica iniziale basata su codici di 7 bit fecero seguito negli anni molte proposte di estensione ad 8 bit, con lo scopo di raddoppiare il numero di caratteri rappresentabili.

Lo standard che sta prendendo piede e che dovrebbe essere il successore di ASCII è UTF-8, specie da quando è diventato la codifica principale di Unicode per internet secondo il W3C, che pur non impedendo altre codifiche (purché correttamente dichiarate), lo consiglia e lo usa quasi sistematicamente negli esempi del suo sito fornendo anche le istruzioni per convertire i documenti (cosa che non fornisce per tutte le codifiche). Questa codifica di Unicode che ormai è universalmente accettata da ogni nuovo programma offre caratteristiche interessanti grazie al fatto di sfruttare il bit di controllo del vecchio ASCII in modo più efficiente.

 Dal n° 0 al n° 31 sono dei caratteri di controllo per periferiche,
dal n° 32 al n° 47 vari caratteri,
dal n° 48 al n° 57 cifre decimali,
dal n° 58 al n° 64 vari caratteri,
dal n° 65 al n° 90 lettere maiuscole dell'alfabeto,
dal n° 91 al n° 96 vari caratteri,
dal n° 97 al n° 122 lettere minuscole dell'alfabeto,
dal n° 123 al n° 127 vari caratteri.

Tabella dei caratteri ASCII esteso

Il codice ASCII è stato elaborato per la lingua inglese, non contiene quindi dei caratteri accentuati, né dei caratteri specifici ad una lingua. Per la codifica di questo tipo di carattere bisogna ricorrere ad un altro codice. Il codice ASCII è stato quindi esteso a 8 bit per poter codificare più caratteri (si parla quindi di codice ASCII esteso). Questo codice attribuisce i valori da 0 a 255 (il cui codice su 8 bit alle lettere maiuscole e minuscole, alle cifre, alla punteggiatura e agli altri simboli (caratteri accentuati in caso di codice iso-latin 1).

Il codice ASCII esteso non è unico e dipende fortemente dalla piattaforma utilizzata.
I due set di caratteri ASCII esteso usati più frequentemente sono:

Il codice ASCII esteso OEM, quello che equipara i primi terminali di tipo IMB PC:

Il codice ASCII esteso ANSI, utilizzato dai sistemi operativi recenti:

Il codice EBCDIC

Il codice EBCDIC (Extended Binary-Coded Decimal Interchange Code), sviluppato da IBM, permette di codificare i caratteri ad 8 bit. Anche se largamente diffuso sui terminali IBM, non c'è stato il successo che invece ha riscontrato il codice ASCII.

Unicode

Il codice Unicode è un sistema di codifica dei caratteri a 16 bit elaborato nel 1991. Il sistema Unicode permette di rappresentare tutti i caratteri attraverso un codice a 16 bit, indipendentemente da qualsiasi sistema operativo o linguaggio di programmazione. Esso raggruppa la quasi totalità degli alfabeti esistenti (arabo, armeno, cirillico, greco, ebraico, latino, ecc.) ed è compatibile con il codice ASCII.

Tabella Caratteri Unicode


Ultime modifiche: domenica, 8 marzo 2020, 16:34