Was ist der Unterschied zwischen ASCII- und Unicode-Text?

Was ist der Unterschied zwischen ASCII- und Unicode-Text?

ASCII und Unicode sind beides Standards, die sich auf die digitale Darstellung von Text beziehen, insbesondere Zeichen, aus denen Text besteht. Die beiden Standards unterscheiden sich jedoch erheblich, wobei viele Eigenschaften ihre jeweilige Erstellungsreihenfolge widerspiegeln.

Amerika gegen das Universum

Es überrascht nicht, dass der American Standard Code for Information Interchange (ASCII) ein amerikanisches Publikum anspricht und im englischen Alphabet schreibt. Es behandelt Buchstaben ohne Akzent, wie AZ und az, sowie eine kleine Anzahl von Satzzeichen und Steuerzeichen.

Was ist der Unterschied zwischen ASCII- und Unicode-Text?

Insbesondere gibt es keine Möglichkeit, aus anderen Sprachen übernommene Lehnwörter wie Café  in ASCII darzustellen , ohne sie durch Ersetzen von Akzentzeichen (zB cafe ) anglisieren zu lassen  . Lokalisierte ASCII-Erweiterungen wurden entwickelt, um den Bedürfnissen verschiedener Sprachen gerecht zu werden, aber diese Bemühungen machten die Interoperabilität umständlich und dehnte die Fähigkeiten von ASCII deutlich aus.

Dagegen liegt der Universal Coded Character Set (Unicode) am anderen Ende der Ambitionsskala. Unicode versucht, so viele Schriftsysteme der Welt wie möglich zu bedienen, insofern es alte Sprachen und die beliebtesten ausdrucksstarken Symbole aller, Emojis, abdeckt.

Zeichensatz oder Zeichenkodierung?

Einfach ausgedrückt ist ein Zeichensatz eine Auswahl von Zeichen (zB AZ), während eine Zeichenkodierung eine Abbildung zwischen einem Zeichensatz und einem digital darstellbaren Wert (zB A=1, B=2) ist.

Der ASCII-Standard ist effektiv beides: Er definiert den Satz von Zeichen, den er darstellt, und eine Methode, jedes Zeichen einem numerischen Wert zuzuordnen.

Im Gegensatz dazu wird das Wort Unicode in verschiedenen Kontexten verwendet, um verschiedene Dinge zu bedeuten. Sie können es sich als einen allumfassenden Begriff vorstellen, der sich wie ASCII auf einen Zeichensatz und eine Reihe von Codierungen bezieht. Da es jedoch mehrere Kodierungen gibt, wird der Begriff Unicode oft verwendet, um sich auf den Gesamtsatz von Zeichen zu beziehen und nicht darauf, wie sie zugeordnet sind.

Größe

Aufgrund seines Umfangs repräsentiert Unicode weit mehr Zeichen als ASCII. Standard-ASCII verwendet einen 7-Bit-Bereich, um 128 verschiedene Zeichen zu codieren . Unicode hingegen ist so umfangreich, dass wir eine andere Terminologie verwenden müssen, nur um darüber zu sprechen!

Unicode bietet 1.111.998 adressierbare Codepunkte.  Ein Codepunkt ist ungefähr analog zu einem Platz, der für ein Zeichen reserviert ist, aber die Situation ist viel komplizierter, wenn Sie beginnen, sich in die Details zu vertiefen!

Ein nützlicherer Vergleich ist, wie viele Skripte (oder Schreibsysteme) derzeit unterstützt werden. ASCII behandelt natürlich nur das englische Alphabet, im Wesentlichen die lateinische oder römische Schrift. Die 2020 produzierte Unicode-Version geht noch viel weiter: Sie unterstützt insgesamt 154 Skripte.

Was ist der Unterschied zwischen ASCII- und Unicode-Text?

Lagerung

Der 7-Bit-Bereich von ASCII bedeutet, dass jedes Zeichen in einem einzelnen 8-Bit-Byte gespeichert wird; das Reservebit wird im Standard-ASCII nicht verwendet. Dies macht Größenberechnungen trivial: Die Textlänge in Zeichen entspricht der Dateigröße in Bytes.

Sie können dies mit der folgenden Abfolge von Bash-Befehlen bestätigen. Zuerst erstellen wir eine Datei mit 12 Buchstaben Text:

$ echo -n 'Hello, world' > foo

Um zu überprüfen, ob der Text in der ASCII-Kodierung vorliegt, können wir den Dateibefehl verwenden :

$ file foo foo: ASCII text, with no line terminators

Um schließlich die genaue Anzahl der Bytes zu ermitteln, die die Datei belegt, verwenden wir den Befehl stat :

$ stat -f%z foo 12

Da der Unicode-Standard mit einem weitaus größeren Zeichenbereich umgeht, nimmt eine Unicode-Datei naturgemäß mehr Speicherplatz ein. Wie viel hängt von der Codierung ab.

Das Wiederholen des gleichen Befehlssatzes von zuvor mit einem Zeichen, das nicht in ASCII dargestellt werden kann, ergibt Folgendes:

$ echo -n '€' > foo $ file foo foo: UTF-8 Unicode text, with no line terminators $ stat -f%z foo 3

Dieses einzelne Zeichen belegt in einer Unicode-Datei 3 Byte. Beachten Sie, dass bash automatisch eine UTF-8-Datei erstellt hat, da eine ASCII-Datei das gewählte Zeichen (€) nicht speichern kann. UTF-8 ist bei weitem die gebräuchlichste Zeichencodierung für Unicode; UTF-16 und UTF-32 sind zwei alternative Kodierungen, die jedoch weit weniger verwendet werden.

UTF-8 ist eine Codierung mit variabler Breite, was bedeutet, dass für verschiedene Codepunkte unterschiedliche Speichermengen verwendet werden. Jeder Codepunkt belegt zwischen einem und vier Bytes, mit der Absicht, dass häufigere Zeichen weniger Platz benötigen, wodurch eine Art integrierte Komprimierung bereitgestellt wird. Der Nachteil besteht darin, dass die Bestimmung der Längen- oder Größenanforderungen eines bestimmten Textabschnitts viel komplizierter wird.

ASCII ist Unicode, aber Unicode ist nicht ASCII

Aus Gründen der Abwärtskompatibilität stellen die ersten 128 Unicode-Codepunkte die entsprechenden ASCII-Zeichen dar. Da UTF-8 jedes dieser Zeichen mit einem einzigen Byte codiert, ist jeder ASCII-Text auch ein UTF-8-Text. Unicode ist eine Obermenge von ASCII.

Wie oben gezeigt, können viele Unicode-Dateien jedoch nicht in einem ASCII-Kontext verwendet werden. Jedes Zeichen, das außerhalb der Grenzen liegt, wird auf unerwartete Weise angezeigt, oft mit Ersatzzeichen, die sich völlig von den beabsichtigten unterscheiden.

Moderne Nutzung

Für die meisten Zwecke wird ASCII weitgehend als Legacy-Standard angesehen. Selbst in Situationen, die nur die lateinische Schrift unterstützen – wo beispielsweise die vollständige Unterstützung der Komplexität von Unicode nicht erforderlich ist – ist es normalerweise bequemer, UTF-8 zu verwenden und seine ASCII-Kompatibilität zu nutzen.

Insbesondere sollten Webseiten mit UTF-8, dem Standard für HTML5, gespeichert und übertragen werden. Dies steht im Gegensatz zum früheren Web, das standardmäßig mit ASCII behandelt wurde, bevor es durch Latin 1 ersetzt wurde.

Ein Standard, der sich verändert

Die letzte Überarbeitung von ASCII fand 1986 statt.

Im Gegensatz dazu wird Unicode weiterhin jährlich aktualisiert. Regelmäßig werden neue Skripte, Charaktere und vor allem neue Emojis hinzugefügt. Da nur ein kleiner Bruchteil davon zugewiesen ist, wird der vollständige Zeichensatz wahrscheinlich auf absehbare Zeit wachsen und wachsen.

Verwandte:  Die 100 beliebtesten Emojis erklärt

ASCII im Vergleich zu Unicode

ASCII hat viele Jahrzehnte lang seinen Zweck erfüllt, aber Unicode hat es jetzt für alle praktischen Zwecke außer für Legacy-Systeme effektiv ersetzt. Unicode ist größer und daher ausdrucksstärker. Es stellt eine weltweite, kollaborative Anstrengung dar und bietet eine weitaus größere Flexibilität, wenn auch auf Kosten einer gewissen Komplexität.


Was ist homomorphe Verschlüsselung?

Was ist homomorphe Verschlüsselung?

Ein Wort, das in letzter Zeit häufig auftaucht, ist die homomorphe Verschlüsselung. Viele Unternehmen und Online-Dienste stellen ihr Verschlüsselungsmodell auf eine Art homomorpher Verschlüsselung um und werben damit, dass dies der Privatsphäre und Sicherheit der Benutzer dient.

Was ist ein Bitmap-Bild?

Was ist ein Bitmap-Bild?

Für die meisten Menschen gehören digitale Medien zum Alltag. Aber wir denken nicht immer daran, wie es entsteht.

Was ist der Unterschied zwischen Android TV und Google TV?

Was ist der Unterschied zwischen Android TV und Google TV?

Wenn man bedenkt, dass das Android-Betriebssystem von Google entwickelt wurde, ist es verständlich, dass Sie über die Unterschiede zwischen Google TV und Android TV verwirrt sind. Ist es dasselbe?

Was sind Lichtfeldanzeigen und wie funktionieren sie?

Was sind Lichtfeldanzeigen und wie funktionieren sie?

Lichtfelddisplays verändern allmählich, wie wir die Welt um uns herum sehen. Oder besser gesagt, wie wir die Welt sehen, die uns nicht umgibt. Von klassischer Fotografie über Weiterbildung und Diagnostik bis hin zu Remote-Präsenz und Unterhaltung – in diesem Artikel wird untersucht, was ein Lichtfeld-Display ist, wie verschiedene Display-Typen funktionieren und wie sie verwendet werden.

Was ist das Matrix-Protokoll und wie funktioniert es?

Was ist das Matrix-Protokoll und wie funktioniert es?

Die meisten Plattformen, über die wir online miteinander kommunizieren, sind an einen einzigen Anbieter gebunden. Aber es gibt keinen technischen Grund dafür, dass dies so ist. Es gibt Möglichkeiten, online zu chatten, die ein höheres Maß an Privatsphäre und Freiheit bieten. Matrix ist eine dieser Möglichkeiten.

Wie die serielle UART-, SPI- und I2C-Kommunikation funktioniert und warum wir sie immer noch verwenden

Wie die serielle UART-, SPI- und I2C-Kommunikation funktioniert und warum wir sie immer noch verwenden

Ob Computerperipherie, Smart Appliances, Internet of Things (IoT)-Geräte oder elektronische Messgeräte – sie alle verwenden serielle Kommunikationsprotokolle, um verschiedene elektronische Komponenten miteinander zu verbinden.

Was ist Cybermobbing und wie kann man damit umgehen?

Was ist Cybermobbing und wie kann man damit umgehen?

Das Internet hat mehr Menschen als je zuvor ermöglicht, sich zu verbinden, sei es zum Guten oder zum Schlechten. So sehr Menschen das Internet für konstruktive und unterhaltsame Zwecke nutzen, andere nutzen es, um eine neue Art von Mobbing zu betreiben: Cybermobbing.

99 Kryptowährungsbegriffe erklärt: Jede Krypto-Definition, die Sie brauchen

99 Kryptowährungsbegriffe erklärt: Jede Krypto-Definition, die Sie brauchen

Kryptowährungen sind digitale Währungen, die auf dezentralen Computernetzwerken, sogenannten Blockchains, laufen. Einige der wichtigsten und am weitesten verbreiteten Kryptowährungen sind Bitcoin, Ethereum, Tether, Cardano, Binance Coin und USD Coin.

Was ist ein Hypervisor? Unterscheidet es sich von einer virtuellen Maschine?

Was ist ein Hypervisor? Unterscheidet es sich von einer virtuellen Maschine?

Ein Hypervisor ist eine Software zum Erstellen virtueller Maschinen. Eine virtuelle Maschine ist eine Emulation eines Computers. Virtuelle Maschinen werden verwendet, um mehrere Computerumgebungen auf einer einzigen Hardware zu erstellen.

Access Point vs. Router – Was ist der Unterschied?

Access Point vs. Router – Was ist der Unterschied?

Das Einrichten von Wi-Fi für Ihr Zuhause oder Ihr Unternehmen kann schnell überwältigend und verwirrend werden. Dabei spielen viele verschiedene Begriffe und Geräte eine Rolle, und jede WLAN-Situation ist einzigartig. Ein großes Unternehmen mit einer Vielzahl von Geräten, die über einen großen Bereich mit einem Netzwerk verbunden sind, benötigt drastisch andere Dinge als ein einfaches Zuhause mit wenigen Geräten.

Die 8 besten Software-Crypto-Wallets zum Speichern Ihrer Vermögenswerte

Die 8 besten Software-Crypto-Wallets zum Speichern Ihrer Vermögenswerte

Wenn Sie Kryptowährungen besitzen, fragen Sie sich vielleicht, wie Sie diese am sichersten aufbewahren können. Da es sich bei einer Kryptowährung um eine digitale Geldform handelt, können Sie sie nicht einfach in Ihre Nachttischschublade oder einen Safe stecken. Stattdessen muss es auf einem Stück Hardware oder Software gespeichert werden.

10 häufige Fragen zu Elektroautos, die Sie schon immer stellen wollten

10 häufige Fragen zu Elektroautos, die Sie schon immer stellen wollten

Elektrofahrzeuge (EVs) werden immer beliebter. Im Jahr 2020 gab es in den USA rund 1,8 Millionen registrierte Elektrofahrzeuge – dreimal so viele wie 2016. Weltweit gab es im Jahr 2020 schätzungsweise 10,2 Millionen Elektrofahrzeuge.

Eine Mac mini eGPU macht es möglich, die Grafikleistung zu steigern

Eine Mac mini eGPU macht es möglich, die Grafikleistung zu steigern

Die Verwendung einer eGPU mit Ihrem Mac mini kann eine hervorragende Möglichkeit sein, das kleine Gehäuse optimal zu nutzen und gleichzeitig eine hervorragende Grafikleistung für Aufgaben wie Spiele und Bildverarbeitung zu erzielen. Erklären Sie in diesem Handbuch, was eine eGPU zu Ihrem Setup hinzufügen kann, wie sie funktioniert und ob es sich lohnt, für dieses nette kleine Kit etwas mehr Geld zu investieren.

So installieren Sie eine Dashcam in Ihrem Auto

So installieren Sie eine Dashcam in Ihrem Auto

Wenn Sie eine Dashcam haben, kann das Anbringen etwas mühsam erscheinen. In einigen Fällen ist es nicht so einfach, wie Sie möchten, aber der Einbau einer Dashcam in Ihr Auto ist jede Minute wert, die Sie damit verbringen.

Warum GPUs der 30er-Serie von Nvidias besser sind als AMD

Warum GPUs der 30er-Serie von Nvidias besser sind als AMD

Nvidia ist einer von zwei vertrauenswürdigen Namen in der Grafikkartenentwicklung. Entweder hast du eine Nvidia-GPU oder du entscheidest dich für eine AMD-GPU. Je nachdem, wen man fragt, ist Nvidia AMD bei GPUs immer etwas voraus. Schneller, größer, stärker, innovativer.

16-Bit vs. 24-Bit vs. 32-Bit Audio

16-Bit vs. 24-Bit vs. 32-Bit Audio

Beim Umgang mit digitalem Audio werden Sie häufig Begriffe wie Audioauflösung, Abtastrate und andere sehen, die die Eigenschaften einer Datei beschreiben. Es ist wichtig zu wissen, was gutes von schlechtem Audio unterscheidet, daher ist es hilfreich, mit diesen Begriffen vertraut zu sein.

Xbox Series X vs. PS5: Welches hat die meisten Teraflops?

Xbox Series X vs. PS5: Welches hat die meisten Teraflops?

Eine neue Konsolengeneration steht vor der Tür. Die Einführung der PlayStation 5 und der Xbox Series X markiert den nächsten Schritt in Richtung Konsolenspiele. Wie zu erwarten, möchten Gamer wissen, welche Konsole besser ist? Welche Spieloption bietet auf absehbare Zeit das beste Preis-Leistungs-Verhältnis?

Powerline-Adapter vs. Mesh-WLAN: Was ist das Beste für Ihr Zuhause?

Powerline-Adapter vs. Mesh-WLAN: Was ist das Beste für Ihr Zuhause?

Wenn Sie in bestimmten Bereichen Ihres Hauses keine Internetverbindung herstellen können, gibt es mehrere Möglichkeiten, das Problem zu lösen. Zwei der beliebtesten Optionen sind Powerline-Adapter und Mesh-WLAN.

Warum Sie Tinte in Ihrem kaputten Bildschirm sehen

Warum Sie Tinte in Ihrem kaputten Bildschirm sehen

Es ist nicht ungewöhnlich, auf dem Bildschirm Ihres defekten Geräts (Telefon, Tablet oder Laptop) schwarze oder violette Flecken zu sehen, die wie Tinte aussehen. Aber ist wirklich Tinte auf Ihrem Bildschirm?

Wie machen Force- und Haptic-Feedback Spiele immersiver?

Wie machen Force- und Haptic-Feedback Spiele immersiver?

Ein großer Teil unserer Spielfreude ist das Eintauchen, das es Ihnen erlaubt, in eine virtuelle Welt einzutauchen, als ob Sie wirklich dort wären. Eine Sache, die Ihr Eintauchen verbessern kann, ist die Simulation realer physischer Berührungen, die Sie der virtuellen Welt nahe bringt.

Was ist homomorphe Verschlüsselung?

Was ist homomorphe Verschlüsselung?

Ein Wort, das in letzter Zeit häufig auftaucht, ist die homomorphe Verschlüsselung. Viele Unternehmen und Online-Dienste stellen ihr Verschlüsselungsmodell auf eine Art homomorpher Verschlüsselung um und werben damit, dass dies der Privatsphäre und Sicherheit der Benutzer dient.

Was ist ein Bitmap-Bild?

Was ist ein Bitmap-Bild?

Für die meisten Menschen gehören digitale Medien zum Alltag. Aber wir denken nicht immer daran, wie es entsteht.

Was sind Lichtfeldanzeigen und wie funktionieren sie?

Was sind Lichtfeldanzeigen und wie funktionieren sie?

Lichtfelddisplays verändern allmählich, wie wir die Welt um uns herum sehen. Oder besser gesagt, wie wir die Welt sehen, die uns nicht umgibt. Von klassischer Fotografie über Weiterbildung und Diagnostik bis hin zu Remote-Präsenz und Unterhaltung – in diesem Artikel wird untersucht, was ein Lichtfeld-Display ist, wie verschiedene Display-Typen funktionieren und wie sie verwendet werden.

Was ist das Matrix-Protokoll und wie funktioniert es?

Was ist das Matrix-Protokoll und wie funktioniert es?

Die meisten Plattformen, über die wir online miteinander kommunizieren, sind an einen einzigen Anbieter gebunden. Aber es gibt keinen technischen Grund dafür, dass dies so ist. Es gibt Möglichkeiten, online zu chatten, die ein höheres Maß an Privatsphäre und Freiheit bieten. Matrix ist eine dieser Möglichkeiten.

Wie die serielle UART-, SPI- und I2C-Kommunikation funktioniert und warum wir sie immer noch verwenden

Wie die serielle UART-, SPI- und I2C-Kommunikation funktioniert und warum wir sie immer noch verwenden

Ob Computerperipherie, Smart Appliances, Internet of Things (IoT)-Geräte oder elektronische Messgeräte – sie alle verwenden serielle Kommunikationsprotokolle, um verschiedene elektronische Komponenten miteinander zu verbinden.

Was ist Cybermobbing und wie kann man damit umgehen?

Was ist Cybermobbing und wie kann man damit umgehen?

Das Internet hat mehr Menschen als je zuvor ermöglicht, sich zu verbinden, sei es zum Guten oder zum Schlechten. So sehr Menschen das Internet für konstruktive und unterhaltsame Zwecke nutzen, andere nutzen es, um eine neue Art von Mobbing zu betreiben: Cybermobbing.

99 Kryptowährungsbegriffe erklärt: Jede Krypto-Definition, die Sie brauchen

99 Kryptowährungsbegriffe erklärt: Jede Krypto-Definition, die Sie brauchen

Kryptowährungen sind digitale Währungen, die auf dezentralen Computernetzwerken, sogenannten Blockchains, laufen. Einige der wichtigsten und am weitesten verbreiteten Kryptowährungen sind Bitcoin, Ethereum, Tether, Cardano, Binance Coin und USD Coin.

Was ist ein Hypervisor? Unterscheidet es sich von einer virtuellen Maschine?

Was ist ein Hypervisor? Unterscheidet es sich von einer virtuellen Maschine?

Ein Hypervisor ist eine Software zum Erstellen virtueller Maschinen. Eine virtuelle Maschine ist eine Emulation eines Computers. Virtuelle Maschinen werden verwendet, um mehrere Computerumgebungen auf einer einzigen Hardware zu erstellen.

Access Point vs. Router – Was ist der Unterschied?

Access Point vs. Router – Was ist der Unterschied?

Das Einrichten von Wi-Fi für Ihr Zuhause oder Ihr Unternehmen kann schnell überwältigend und verwirrend werden. Dabei spielen viele verschiedene Begriffe und Geräte eine Rolle, und jede WLAN-Situation ist einzigartig. Ein großes Unternehmen mit einer Vielzahl von Geräten, die über einen großen Bereich mit einem Netzwerk verbunden sind, benötigt drastisch andere Dinge als ein einfaches Zuhause mit wenigen Geräten.

Die 8 besten Software-Crypto-Wallets zum Speichern Ihrer Vermögenswerte

Die 8 besten Software-Crypto-Wallets zum Speichern Ihrer Vermögenswerte

Wenn Sie Kryptowährungen besitzen, fragen Sie sich vielleicht, wie Sie diese am sichersten aufbewahren können. Da es sich bei einer Kryptowährung um eine digitale Geldform handelt, können Sie sie nicht einfach in Ihre Nachttischschublade oder einen Safe stecken. Stattdessen muss es auf einem Stück Hardware oder Software gespeichert werden.