Qual è la differenza tra ASCII e testo Unicode?

Qual è la differenza tra ASCII e testo Unicode?

ASCII e Unicode sono entrambi standard che si riferiscono alla rappresentazione digitale del testo, in particolare ai caratteri che compongono il testo. Tuttavia, i due standard sono significativamente diversi, con molte proprietà che riflettono il rispettivo ordine di creazione.

L'America contro l'universo

L'American Standard Code for Information Interchange (ASCII), ovviamente, si rivolge a un pubblico americano, scrivendo in alfabeto inglese. Si occupa di lettere non accentate, come AZ e az, oltre a un piccolo numero di simboli di punteggiatura e caratteri di controllo.

Qual è la differenza tra ASCII e testo Unicode?

In particolare, non c'è modo di rappresentare  in ASCII parole di prestito adottate da altre lingue, come café , senza anglicizzare le stesse sostituendo caratteri accentati (es.  cafe ). Le estensioni ASCII localizzate sono state sviluppate per soddisfare le esigenze di vari linguaggi, ma questi sforzi hanno reso l'interoperabilità imbarazzante e hanno chiaramente ampliato le capacità di ASCII.

Al contrario, l'Universal Coded Character Set (Unicode) si trova all'estremità opposta della scala dell'ambizione. Unicode tenta di soddisfare il maggior numero possibile di sistemi di scrittura del mondo, nella misura in cui copre le lingue antiche e il set di simboli espressivi preferito da tutti, le emoji.

Set di caratteri o codifica dei caratteri?

In parole povere, un set di caratteri è una selezione di caratteri (ad es. AZ) mentre una codifica di caratteri è una mappatura tra un set di caratteri e un valore che può essere rappresentato digitalmente (ad es. A=1, B=2).

Lo standard ASCII è effettivamente entrambi: definisce l'insieme di caratteri che rappresenta e un metodo per mappare ciascun carattere a un valore numerico.

Al contrario, la parola Unicode viene utilizzata in diversi contesti per significare cose diverse. Puoi pensarlo come un termine onnicomprensivo, come ASCII, per riferirsi a un set di caratteri e a un numero di codifiche. Tuttavia, poiché esistono diverse codifiche, il termine Unicode viene spesso utilizzato per riferirsi all'insieme complessivo di caratteri, piuttosto che al modo in cui sono mappati.

Taglia

A causa del suo ambito, Unicode rappresenta molti più caratteri di ASCII. L'ASCII standard utilizza un intervallo di 7 bit per codificare 128 caratteri distinti . Unicode, d'altra parte, è così grande che abbiamo bisogno di usare una terminologia diversa solo per parlarne!

Unicode si rivolge a 1.111.998 punti di codice indirizzabili .  Un punto di codice è più o meno analogo a uno spazio riservato a un personaggio, ma la situazione è molto più complicata di così quando inizi ad approfondire i dettagli!

Un confronto più utile è quanti script (o sistemi di scrittura) sono attualmente supportati. Naturalmente, ASCII gestisce solo l'alfabeto inglese, essenzialmente la scrittura latina o romana. La versione di Unicode prodotta nel 2020 va molto oltre: include il supporto per un totale di 154 script.

Qual è la differenza tra ASCII e testo Unicode?

Magazzinaggio

L'intervallo di 7 bit di ASCII significa che ogni carattere è memorizzato in un singolo byte di 8 bit; il bit di riserva non è utilizzato nello standard ASCII. Ciò rende banali i calcoli delle dimensioni: la lunghezza del testo, in caratteri, è la dimensione del file in byte.

Puoi confermarlo con la seguente sequenza di comandi bash. Innanzitutto, creiamo un file contenente 12 lettere di testo:

$ echo -n 'Hello, world' > foo

Per verificare che il testo sia nella codifica ASCII, possiamo usare il comando file :

$ file foo foo: ASCII text, with no line terminators

Infine, per ottenere il numero esatto di byte occupati dal file, utilizziamo il comando stat :

$ stat -f%z foo 12

Poiché lo standard Unicode si occupa di una gamma di caratteri molto più ampia, un file Unicode occupa naturalmente più spazio di archiviazione. Esattamente quanto dipende dalla codifica.

Ripetendo lo stesso insieme di comandi di prima, utilizzando un carattere che non può essere rappresentato in ASCII, si ottiene quanto segue:

$ echo -n '€' > foo $ file foo foo: UTF-8 Unicode text, with no line terminators $ stat -f%z foo 3

Quel singolo carattere occupa 3 byte in un file Unicode. Nota che bash ha creato automaticamente un file UTF-8 poiché un file ASCII non può memorizzare il carattere scelto (€). UTF-8 è di gran lunga la codifica dei caratteri più comune per Unicode; UTF-16 e UTF-32 sono due codifiche alternative, ma vengono utilizzate molto meno.

UTF-8 è una codifica a larghezza variabile, il che significa che utilizza diverse quantità di memoria per diversi punti di codice. Ogni punto di codice occuperà tra uno e quattro byte, con l'intento che i caratteri più comuni richiedono meno spazio, fornendo un tipo di compressione incorporata. Lo svantaggio è che la determinazione dei requisiti di lunghezza o dimensione di una determinata porzione di testo diventa molto più complicata.

ASCII è Unicode, ma Unicode non è ASCII

Per compatibilità con le versioni precedenti, i primi 128 punti di codice Unicode rappresentano i caratteri ASCII equivalenti. Poiché UTF-8 codifica ciascuno di questi caratteri con un singolo byte, qualsiasi testo ASCII è anche un testo UTF-8. Unicode è un superset di ASCII.

Tuttavia, come mostrato sopra, molti file Unicode non possono essere utilizzati in un contesto ASCII. Qualsiasi carattere fuori limite verrà visualizzato in modo imprevisto, spesso con caratteri sostituiti completamente diversi da quelli previsti.

Uso moderno

Per la maggior parte degli scopi, ASCII è in gran parte considerato uno standard legacy. Anche in situazioni che supportano solo lo script latino, dove non è necessario il pieno supporto per le complessità di Unicode, ad esempio, di solito è più conveniente usare UTF-8 e sfruttare la sua compatibilità ASCII.

In particolare, le pagine Web dovrebbero essere salvate e trasmesse utilizzando UTF-8, che è l'impostazione predefinita per HTML5. Questo è in contrasto con il web precedente, che si occupava di ASCII per impostazione predefinita prima che fosse sostituito dal latino 1.

Uno standard che sta cambiando

L'ultima revisione di ASCII ha avuto luogo nel 1986.

Al contrario, Unicode continua ad essere aggiornato ogni anno. Nuovi script, personaggi e, in particolare, nuove emoji vengono aggiunti regolarmente. Con solo una piccola parte di questi assegnati, è probabile che l'intero set di caratteri cresca e cresca per il prossimo futuro.

Correlati:  spiegati i 100 emoji più popolari

ASCII contro Unicode

ASCII ha servito il suo scopo per molti decenni, ma Unicode lo ha ora efficacemente sostituito per tutti gli scopi pratici diversi dai sistemi legacy. Unicode è più grande e, quindi, più espressivo. Rappresenta uno sforzo collaborativo mondiale e offre una flessibilità di gran lunga maggiore, anche se a scapito di una certa complessità.


Che cosè la crittografia omomorfa?

Che cosè la crittografia omomorfa?

Una parola che sta saltando fuori spesso ultimamente è crittografia omomorfa. Molte aziende e servizi online stanno trasformando il loro modello di crittografia in un tipo di crittografia omomorfica, pubblicizzando che è per una migliore privacy e sicurezza degli utenti.

Che cosè unimmagine bitmap?

Che cosè unimmagine bitmap?

Per la maggior parte delle persone, i media digitali fanno parte della vita di tutti i giorni. Ma non sempre pensiamo a come viene creato.

Qual è la differenza tra Android TV e Google TV?

Qual è la differenza tra Android TV e Google TV?

Considerando che il sistema operativo Android è stato sviluppato da Google, è comprensibile che potresti essere confuso sulle differenze tra Google TV e Android TV. È la stessa cosa?

Cosa sono i display a campo chiaro e come funzionano?

Cosa sono i display a campo chiaro e come funzionano?

I display a campo luminoso stanno gradualmente cambiando il modo in cui vediamo il mondo che ci circonda. O meglio, come vediamo il mondo che non è intorno a noi. Dalla fotografia classica all'istruzione avanzata e alla diagnostica, alla presenza e all'intrattenimento remoti, questo articolo esaminerà che cos'è un display a campo luminoso, come funzionano i diversi tipi di display e come vengono utilizzati.

Che cosè il protocollo Matrix e come funziona?

Che cosè il protocollo Matrix e come funziona?

La maggior parte delle piattaforme che utilizziamo per comunicare tra loro online sono legate a un unico provider. Ma non c'è ragione tecnica per cui le cose stiano così. Esistono modi per chattare online che offrono un maggior grado di privacy e libertà. Matrix è uno di quei modi.

Come funzionano le comunicazioni seriali UART, SPI e I2C e perché le usiamo ancora

Come funzionano le comunicazioni seriali UART, SPI e I2C e perché le usiamo ancora

Che si tratti di periferiche per computer, elettrodomestici intelligenti, dispositivi Internet of Things (IoT) o strumenti di misurazione elettronica, utilizzano tutti protocolli di comunicazione seriale per collegare insieme diversi componenti elettronici.

Che cosè il cyberbullismo e come affrontarlo?

Che cosè il cyberbullismo e come affrontarlo?

Internet ha permesso a più persone di connettersi che mai, nel bene e nel male. Per quanto le persone utilizzino Internet per scopi costruttivi e divertenti, altri lo usano per eseguire un nuovo tipo di bullismo: il cyberbullismo.

Spiegazione dei 99 termini di criptovaluta: ogni definizione di criptovaluta di cui hai bisogno

Spiegazione dei 99 termini di criptovaluta: ogni definizione di criptovaluta di cui hai bisogno

Le criptovalute sono valute digitali che funzionano su reti informatiche decentralizzate chiamate blockchain. Alcune delle criptovalute più importanti e ampiamente accettate sono Bitcoin, Ethereum, Tether, Cardano, Binance Coin e USD Coin.

Che cosè un hypervisor? È diverso da una macchina virtuale?

Che cosè un hypervisor? È diverso da una macchina virtuale?

Un hypervisor è un software utilizzato per creare macchine virtuali. Una macchina virtuale è un'emulazione di un computer. Le macchine virtuali vengono utilizzate per creare più ambienti di elaborazione su un singolo componente hardware.

Punto di accesso e router: qual è la differenza?

Punto di accesso e router: qual è la differenza?

Configurare il Wi-Fi per la tua casa o la tua azienda può diventare facilmente opprimente e confuso. Ci sono diversi termini e dispositivi coinvolti nel processo e ogni situazione Wi-Fi è unica. Una grande azienda con una tonnellata di dispositivi collegati a una rete su una vasta area avrà bisogno di cose drasticamente diverse rispetto a una semplice casa con pochi dispositivi.

Gli 8 migliori portafogli di criptovalute software per archiviare le tue risorse

Gli 8 migliori portafogli di criptovalute software per archiviare le tue risorse

Se possiedi una qualsiasi quantità di criptovaluta, potresti chiederti come conservarla in modo più sicuro e protetto. Dato che una criptovaluta è una forma di denaro digitale, non puoi semplicemente inserirla nel cassetto del comodino o in una cassaforte. Invece, deve essere memorizzato su un pezzo di hardware o software.

Come funzionano i pesi digitali delle piste tonali e nordiche?

Come funzionano i pesi digitali delle piste tonali e nordiche?

Hai visto spot pubblicitari per macchine per esercizi che utilizzano il peso digitale e ti sei chiesto cosa diavolo fosse? O hai guardato queste nuove macchine eleganti e ordinate e ti sei chiesto da dove provenisse tutta la resistenza?

10 domande comuni sulle auto elettriche che avresti sempre voluto porre

10 domande comuni sulle auto elettriche che avresti sempre voluto porre

I veicoli elettrici (EV) stanno diventando molto più popolari. A partire dal 2020, negli Stati Uniti c'erano circa 1,8 milioni di veicoli elettrici immatricolati, tre volte di più rispetto al 2016. In tutto il mondo, nel 2020 c'erano circa 10,2 milioni di veicoli elettrici.

Perché le GPU Nvidias serie 30 sono migliori di AMD?

Perché le GPU Nvidias serie 30 sono migliori di AMD?

Nvidia è uno dei due nomi di fiducia nello sviluppo di schede grafiche. O hai una GPU Nvidia o opti per una GPU AMD. A seconda di chi chiedi, Nvidia è sempre leggermente più avanti di AMD quando si tratta di GPU. Più veloce, più grande, più forte, più innovativo.

Audio a 16 bit vs. 24 bit vs. 32 bit

Audio a 16 bit vs. 24 bit vs. 32 bit

Quando hai a che fare con l'audio digitale, vedrai spesso termini come risoluzione audio, frequenza di campionamento e altri che descrivono le caratteristiche di un file. È importante sapere cosa separa un buon audio da un audio scadente, quindi sarebbe utile avere familiarità con questi termini.

Adattatore Powerline contro Wi-Fi Mesh: cosa è meglio per la tua casa?

Adattatore Powerline contro Wi-Fi Mesh: cosa è meglio per la tua casa?

Se non riesci a connetterti a Internet in alcune aree della tua casa, ci sono diversi modi per risolvere il problema. Due delle opzioni più popolari sono gli adattatori powerline e il Wi-Fi mesh.

Perché vedi inchiostro nel tuo schermo rotto?

Perché vedi inchiostro nel tuo schermo rotto?

Non è insolito vedere macchie nere o violacee che sembrano inchiostro sullo schermo del tuo dispositivo rotto (telefono, tablet o laptop). Ma c'è davvero inchiostro nel tuo schermo?

5 delle migliori invenzioni di Nikola Tesla e come hanno plasmato il mondo

5 delle migliori invenzioni di Nikola Tesla e come hanno plasmato il mondo

Quando pensi alla parola Tesla, è naturale che compaiano immagini di auto elettriche e miliardari. Tuttavia, l'inventore Nikola Tesla, che Elon Musk ha chiamato la sua azienda, ha svolto un ruolo enorme nella storia e ha cambiato il corso della vita di molte persone. Quindi, chi era Nikola Tesla e di quali invenzioni chiave era responsabile?

Starlink vs Viasat vs HughsNet: Internet satellitare a confronto

Starlink vs Viasat vs HughsNet: Internet satellitare a confronto

Internet via satellite è spesso l'unica opzione nelle regioni montuose, rurali e in altre regioni scarsamente popolate. Tradizionalmente, le soluzioni Internet via satellite sono più costose sia della rete fissa che dell'Internet mobile. Allo stesso tempo, si distingue per una connessione ad alta latenza, che lo rende una scelta sbagliata per i giocatori online.

Cosa sono gli errori di runtime e come risolverli?

Cosa sono gli errori di runtime e come risolverli?

Non odi quando stai cercando di avviare un programma e ricevi un messaggio di errore che dice Errore di runtime? Sfortunatamente, nonostante le persone regolarmente fastidiose, il temuto errore di runtime non fa un ottimo lavoro spiegando se stesso e cosa è successo esattamente.

Che cosè la crittografia omomorfa?

Che cosè la crittografia omomorfa?

Una parola che sta saltando fuori spesso ultimamente è crittografia omomorfa. Molte aziende e servizi online stanno trasformando il loro modello di crittografia in un tipo di crittografia omomorfica, pubblicizzando che è per una migliore privacy e sicurezza degli utenti.

Che cosè unimmagine bitmap?

Che cosè unimmagine bitmap?

Per la maggior parte delle persone, i media digitali fanno parte della vita di tutti i giorni. Ma non sempre pensiamo a come viene creato.

Cosa sono i display a campo chiaro e come funzionano?

Cosa sono i display a campo chiaro e come funzionano?

I display a campo luminoso stanno gradualmente cambiando il modo in cui vediamo il mondo che ci circonda. O meglio, come vediamo il mondo che non è intorno a noi. Dalla fotografia classica all'istruzione avanzata e alla diagnostica, alla presenza e all'intrattenimento remoti, questo articolo esaminerà che cos'è un display a campo luminoso, come funzionano i diversi tipi di display e come vengono utilizzati.

Che cosè il protocollo Matrix e come funziona?

Che cosè il protocollo Matrix e come funziona?

La maggior parte delle piattaforme che utilizziamo per comunicare tra loro online sono legate a un unico provider. Ma non c'è ragione tecnica per cui le cose stiano così. Esistono modi per chattare online che offrono un maggior grado di privacy e libertà. Matrix è uno di quei modi.

Come funzionano le comunicazioni seriali UART, SPI e I2C e perché le usiamo ancora

Come funzionano le comunicazioni seriali UART, SPI e I2C e perché le usiamo ancora

Che si tratti di periferiche per computer, elettrodomestici intelligenti, dispositivi Internet of Things (IoT) o strumenti di misurazione elettronica, utilizzano tutti protocolli di comunicazione seriale per collegare insieme diversi componenti elettronici.

Che cosè il cyberbullismo e come affrontarlo?

Che cosè il cyberbullismo e come affrontarlo?

Internet ha permesso a più persone di connettersi che mai, nel bene e nel male. Per quanto le persone utilizzino Internet per scopi costruttivi e divertenti, altri lo usano per eseguire un nuovo tipo di bullismo: il cyberbullismo.

Spiegazione dei 99 termini di criptovaluta: ogni definizione di criptovaluta di cui hai bisogno

Spiegazione dei 99 termini di criptovaluta: ogni definizione di criptovaluta di cui hai bisogno

Le criptovalute sono valute digitali che funzionano su reti informatiche decentralizzate chiamate blockchain. Alcune delle criptovalute più importanti e ampiamente accettate sono Bitcoin, Ethereum, Tether, Cardano, Binance Coin e USD Coin.

Che cosè un hypervisor? È diverso da una macchina virtuale?

Che cosè un hypervisor? È diverso da una macchina virtuale?

Un hypervisor è un software utilizzato per creare macchine virtuali. Una macchina virtuale è un'emulazione di un computer. Le macchine virtuali vengono utilizzate per creare più ambienti di elaborazione su un singolo componente hardware.

Punto di accesso e router: qual è la differenza?

Punto di accesso e router: qual è la differenza?

Configurare il Wi-Fi per la tua casa o la tua azienda può diventare facilmente opprimente e confuso. Ci sono diversi termini e dispositivi coinvolti nel processo e ogni situazione Wi-Fi è unica. Una grande azienda con una tonnellata di dispositivi collegati a una rete su una vasta area avrà bisogno di cose drasticamente diverse rispetto a una semplice casa con pochi dispositivi.

Gli 8 migliori portafogli di criptovalute software per archiviare le tue risorse

Gli 8 migliori portafogli di criptovalute software per archiviare le tue risorse

Se possiedi una qualsiasi quantità di criptovaluta, potresti chiederti come conservarla in modo più sicuro e protetto. Dato che una criptovaluta è una forma di denaro digitale, non puoi semplicemente inserirla nel cassetto del comodino o in una cassaforte. Invece, deve essere memorizzato su un pezzo di hardware o software.