Jaka jest różnica między tekstem ASCII a tekstem Unicode?

Jaka jest różnica między tekstem ASCII a tekstem Unicode?

ASCII i Unicode to oba standardy, które odnoszą się do cyfrowej reprezentacji tekstu, w szczególności znaków tworzących tekst. Jednak te dwa standardy znacznie się różnią, a wiele właściwości odzwierciedla ich kolejność tworzenia.

Ameryka kontra Wszechświat

Nic dziwnego, że American Standard Code for Information Interchange (ASCII) jest przeznaczony dla odbiorców amerykańskich, pisząc alfabetem angielskim. Zajmuje się literami bez akcentów, takimi jak AZ i az, a także niewielką liczbą znaków interpunkcyjnych i znaków sterujących.

Jaka jest różnica między tekstem ASCII a tekstem Unicode?

W szczególności nie ma możliwości przedstawienia wyrazów zapożyczonych zapożyczonych z innych języków, takich jak cafe  w ASCII, bez ich zangalizowania przez zastąpienie znaków akcentowanych (np.  cafe ). Zlokalizowane rozszerzenia ASCII zostały opracowane w celu zaspokojenia potrzeb różnych języków, ale te wysiłki sprawiły, że interoperacyjność była niewygodna i wyraźnie rozszerzała możliwości ASCII.

W przeciwieństwie do tego, Universal Coded Character Set (Unicode) znajduje się na przeciwległym końcu skali ambicji. Unicode stara się obsłużyć jak najwięcej systemów pisma na świecie, do tego stopnia, że ​​obejmuje starożytne języki i ulubiony przez wszystkich zestaw ekspresyjnych symboli, emoji.

Zestaw znaków czy kodowanie znaków?

Mówiąc prościej, zestaw znaków to wybór znaków (np. AZ), podczas gdy kodowanie znaków to odwzorowanie między zestawem znaków a wartością, którą można przedstawić cyfrowo (np. A=1, B=2).

Standard ASCII jest w rzeczywistości zarówno: definiuje zestaw znaków, które reprezentuje, jak i metodę mapowania każdego znaku na wartość liczbową.

Natomiast słowo Unicode jest używane w kilku różnych kontekstach, aby oznaczać różne rzeczy. Możesz myśleć o tym jako o wszechogarniającym terminie, takim jak ASCII, odnoszącym się do zestawu znaków i wielu kodowań. Ale ponieważ istnieje kilka kodowań, termin Unicode jest często używany w odniesieniu do ogólnego zestawu znaków, a nie sposobu ich mapowania.

Rozmiar

Ze względu na swój zakres Unicode reprezentuje znacznie więcej znaków niż ASCII. Standardowy ASCII używa zakresu 7-bitowego do kodowania 128 różnych znaków . Z drugiej strony Unicode jest tak duży, że musimy używać innej terminologii tylko po to, by o tym mówić!

Unicode obsługuje 1111998 adresowalnych punktów kodowych.  Punkt kodowy jest z grubsza analogiczny do miejsca zarezerwowanego dla postaci, ale sytuacja jest o wiele bardziej skomplikowana niż ta, gdy zaczynasz zagłębiać się w szczegóły!

Bardziej przydatnym porównaniem jest liczba obsługiwanych obecnie skryptów (lub systemów pisania). Oczywiście ASCII obsługuje tylko alfabet angielski, zasadniczo pismo łacińskie lub rzymskie. Wersja Unicode wyprodukowana w 2020 roku idzie znacznie dalej: obejmuje obsługę łącznie 154 skryptów.

Jaka jest różnica między tekstem ASCII a tekstem Unicode?

Składowanie

7-bitowy zakres ASCII oznacza, że ​​każdy znak jest przechowywany w pojedynczym 8-bitowym bajcie; zapasowy bit nie jest używany w standardowym ASCII. To sprawia, że ​​obliczenia rozmiaru są trywialne: długość tekstu w znakach to rozmiar pliku w bajtach.

Możesz to potwierdzić za pomocą następującej sekwencji poleceń bash. Najpierw tworzymy plik zawierający 12 liter tekstu:

$ echo -n 'Hello, world' > foo

Aby sprawdzić, czy tekst jest zakodowany w ASCII, możemy użyć polecenia file :

$ file foo foo: ASCII text, with no line terminators

Na koniec, aby uzyskać dokładną liczbę bajtów zajmowanych przez plik, używamy polecenia stat :

$ stat -f%z foo 12

Ponieważ standard Unicode zajmuje się znacznie większym zakresem znaków, plik Unicode naturalnie zajmuje więcej miejsca. Dokładnie ile zależy od kodowania.

Powtarzanie tego samego zestawu poleceń co wcześniej, przy użyciu znaku, którego nie można przedstawić w ASCII, daje następujące wyniki:

$ echo -n '€' > foo $ file foo foo: UTF-8 Unicode text, with no line terminators $ stat -f%z foo 3

Ten pojedynczy znak zajmuje 3 bajty w pliku Unicode. Zauważ, że bash automatycznie utworzył plik UTF-8, ponieważ plik ASCII nie może przechowywać wybranego znaku (€). UTF-8 jest zdecydowanie najbardziej powszechnym kodowaniem znaków dla Unicode; UTF-16 i UTF-32 to dwa alternatywne kodowania, ale są one używane znacznie rzadziej.

UTF-8 to kodowanie o zmiennej szerokości, co oznacza, że ​​używa różnych ilości pamięci dla różnych punktów kodowych. Każdy punkt kodowy zajmie od jednego do czterech bajtów, z zamiarem, aby bardziej popularne znaki wymagały mniej miejsca, zapewniając rodzaj wbudowanej kompresji. Wadą jest to, że określenie wymagań dotyczących długości lub rozmiaru danego fragmentu tekstu staje się znacznie bardziej skomplikowane.

ASCII to Unicode, ale Unicode to nie ASCII

Aby zapewnić zgodność z poprzednimi wersjami, pierwsze 128 punktów kodowych Unicode reprezentują równoważne znaki ASCII. Ponieważ UTF-8 koduje każdy z tych znaków za pomocą jednego bajtu, każdy tekst ASCII jest również tekstem UTF-8. Unicode to nadzbiór ASCII.

Jednak, jak pokazano powyżej, wielu plików Unicode nie można używać w kontekście ASCII. Każdy znak, który jest poza granicami, zostanie wyświetlony w nieoczekiwany sposób, często z podstawionymi znakami, które są zupełnie inne niż te, które były zamierzone.

Nowoczesne zastosowanie

W większości przypadków ASCII jest w dużej mierze uważany za przestarzały standard. Nawet w sytuacjach, które obsługują tylko skrypt łaciński — gdzie na przykład pełna obsługa złożoności Unicode jest niepotrzebna — zwykle wygodniej jest używać UTF-8 i korzystać z jego kompatybilności z ASCII.

W szczególności strony internetowe powinny być zapisywane i przesyłane przy użyciu UTF-8, który jest domyślny dla HTML5. Jest to w przeciwieństwie do wcześniejszej sieci, która domyślnie zajmowała się ASCII, zanim została zastąpiona przez Latin 1.

Standard, który się zmienia

Ostatnia rewizja ASCII miała miejsce w 1986 roku.

W przeciwieństwie do tego, Unicode jest aktualizowany co roku. Regularnie dodawane są nowe skrypty, postacie, a zwłaszcza nowe emoji. Mając tylko niewielką część tych przydzielonych, pełny zestaw znaków prawdopodobnie będzie rósł i rósł w dającej się przewidzieć przyszłości.

Powiązane:  Wyjaśnienie 100 najpopularniejszych emotikonów

ASCII kontra Unicode

ASCII służył swojemu celowi przez wiele dziesięcioleci, ale Unicode teraz skutecznie zastąpił go we wszystkich praktycznych celach innych niż starsze systemy. Unicode jest większy, a przez to bardziej wyrazisty. Stanowi ogólnoświatowy, wspólny wysiłek i oferuje znacznie większą elastyczność, aczkolwiek kosztem pewnej złożoności.


Czym do cholery jest Dogecoin, czy Chia jest naprawdę zielona, ​​a co to jest komputer internetowy?

Czym do cholery jest Dogecoin, czy Chia jest naprawdę zielona, ​​a co to jest komputer internetowy?

Świat kryptowalut po prostu nie przestaje się zmieniać. Mając w obiegu ponad 5000 różnych kryptowalut, nowe cyfrowe jednostki wartości muszą wyróżniać się z tłumu, aby generować jakąkolwiek przyczepność.

Nvidia DLSS kontra AMD FidelityFX: na czym polega różnica i co wygląda lepiej?

Nvidia DLSS kontra AMD FidelityFX: na czym polega różnica i co wygląda lepiej?

Technologia Nvidias DLSS znacznie zmniejszyła potrzebę posiadania najdroższego sprzętu graficznego z najwyższej półki. Zamiast renderować grafikę w pełnej rozdzielczości, Twój GPU może zamiast tego renderować ją w niższej rozdzielczości i skalować w górę. Chociaż takie podejście było nie do pomyślenia lata temu, Nvidia przybiła do głowy technologię. W zależności od gry, gołym okiem może wyglądać nie do odróżnienia od natywnej rozdzielczości.

Czym są portfele z wieloma podpisami?

Czym są portfele z wieloma podpisami?

Głównym problemem dla posiadaczy kryptowalut jest bezpieczeństwo. Obawy dotyczące bezpieczeństwa często dotyczą protokołów bezpieczeństwa i bezpieczeństwa portfeli kryptowalut, które stanowią poważne zagrożenie dla funduszy, które mogą zostać zmanipulowane lub skradzione przez hakerów.

IEM a wkładki douszne: co to są IEM? Czy są lepsze niż wkładki douszne?

IEM a wkładki douszne: co to są IEM? Czy są lepsze niż wkładki douszne?

Słuchanie to bardzo osobiste doświadczenie. Niezależnie od tego, czy grasz ze swoją ulubioną listą odtwarzania, oglądasz filmy, czy zanurzasz się w rozgrywce, dźwięk odgrywa ogromną rolę w podnoszeniu ogólnego wrażenia.

5 najlepszych wynalazków Nikoli Teslasa i jak ukształtowały świat

5 najlepszych wynalazków Nikoli Teslasa i jak ukształtowały świat

Kiedy pomyślisz o słowie Tesla, w naturalny sposób pojawiają się obrazy samochodów elektrycznych i miliarderów. Jednak wynalazca Nikola Tesla, od którego imienia Elon Musk nazwał swoją firmę, odegrał ogromną rolę w historii i zmienił bieg życia wielu narodów. Kim więc był Nikola Tesla i za jakie kluczowe wynalazki był odpowiedzialny?

Co to jest termostat Nest i jak działa?

Co to jest termostat Nest i jak działa?

Wszyscy przeżyliśmy ten moment, kiedy wracamy do domu po długim dniu pracy do mroźnego lub upalnego domu. Dzięki Nest Thermostat te stresujące doświadczenia należą już do przeszłości.

5 najlepszych miejsc, w których można kupić Cardano (ADA)

5 najlepszych miejsc, w których można kupić Cardano (ADA)

Śledziłeś boom na kryptowaluty i chcesz się zaangażować. Po przeprowadzeniu niewielkich badań zdecydowałeś, że Cardano (ADA) jest odpowiednią monetą dla Ciebie.

Jak sprawdzać podejrzane linki za pomocą wbudowanych narzędzi przeglądarki

Jak sprawdzać podejrzane linki za pomocą wbudowanych narzędzi przeglądarki

Pomyśl, ile witryn odwiedzasz danego dnia. Teraz pomyśl, ile adresów URL sam wpisujesz w przeglądarce. Są szanse, że odwiedzasz o wiele więcej stron internetowych, niż wyszukujesz ręcznie. Większość z nas robi to poprzez linki.

Co to jest HDMI-CEC i do czego służy?

Co to jest HDMI-CEC i do czego służy?

HDMI od pewnego czasu jest standardowym kablem do podłączania urządzeń audio i wideo, ale nie wszystkie jego funkcje są dobrze znane. Być może widziałeś opcję HDMI-CEC na swoim telewizorze, systemie kina domowego lub podobnym i zastanawiałeś się, co to robi.

Scena dźwiękowa a obrazowanie audio: co jest ważniejsze dla najlepszego dźwięku?

Scena dźwiękowa a obrazowanie audio: co jest ważniejsze dla najlepszego dźwięku?

Jeśli kiedykolwiek oglądałeś filmy z recenzjami na YouTube o słuchawkach, musiałeś zauważyć, że recenzenci używają wielu terminów. To prawie tak, jakby audiofile mieli własny słownik.

Co to jest VoLTE i jak można je wyłączyć?

Co to jest VoLTE i jak można je wyłączyć?

VoLTE to skrót od Voice Over LTE, gdzie LTE oznacza Long Term Evolution. Jak sama nazwa wskazuje, VoLTE to połączenie głosowe realizowane w sieci 4G LTE. Pozwala na nawiązanie połączenia za pośrednictwem sieci LTE, a nie standardowej sieci.

Jak działa what3words i czy jest lepszy niż prawdziwy adres?

Jak działa what3words i czy jest lepszy niż prawdziwy adres?

Ludzie mieszają adresy, odkąd zostały wynalezione. Łatwo jest podać adres budynku na podstawie obszaru, ulicy i numeru budynku, ale to nie odpowiada, o którym dokładnie miejscu mówisz.

Czym są wyświetlacze pola świetlnego i jak działają?

Czym są wyświetlacze pola świetlnego i jak działają?

Pokazy pól świetlnych stopniowo zmieniają sposób, w jaki postrzegamy otaczający nas świat. A raczej jak widzimy świat, którego nie ma wokół nas. Od klasycznej fotografii, przez zaawansowaną edukację i diagnostykę, po zdalną obecność i rozrywkę — w tym artykule przyjrzymy się, czym jest wyświetlacz z polem świetlnym, jak działają różne typy wyświetlaczy i jak są używane.

Co to jest cybernękanie i jak sobie z nim radzić?

Co to jest cybernękanie i jak sobie z nim radzić?

Internet pozwolił połączyć się większej liczbie osób niż kiedykolwiek wcześniej, niezależnie od tego, czy jest to dobre, czy złe. O ile ludzie używają Internetu do konstruktywnych i zabawnych celów, inni używają go do nowego rodzaju nękania: cyberprzemocy.

Maszyna wirtualna a kontener: na czym polega różnica?

Maszyna wirtualna a kontener: na czym polega różnica?

Maszyny wirtualne i kontenery to rodzaje wirtualizacji, które umożliwiają wdrażanie aplikacji w środowiskach odizolowanych od podstawowego sprzętu.

Jak działa Groupon i czy to legalne?

Jak działa Groupon i czy to legalne?

Kupony i bony rabatowe są dostępne tak długo, jak sklepy wysyłkowe i nowoczesne sklepy detaliczne. Tylko dlatego, że ludzie przeszli na zakupy online, nie oznacza to, że przestaną szukać następnej najlepszej oferty, aby zaoszczędzić pieniądze.

Co to są komponenty Chrome? Jak mogą naprawić problemy z Netflix DRM?

Co to są komponenty Chrome? Jak mogą naprawić problemy z Netflix DRM?

Google Chrome pozostaje najpopularniejszą przeglądarką internetową na świecie. Jak każda przeglądarka, ma sprawiedliwy udział w problemach – i to bez wchodzenia w kwestie prywatności.

Jak działają cyfrowe obciążniki Tonal i Nordic Tracks?

Jak działają cyfrowe obciążniki Tonal i Nordic Tracks?

Czy widziałeś reklamy maszyn do ćwiczeń, które wykorzystują wagę cyfrową i zastanawiałeś się, co to było? A może spojrzałeś na te smukłe i schludne nowe maszyny i zastanawiałeś się, skąd wziął się cały opór?

Czy ARCore lub ARKit są lepsze do tworzenia doświadczeń w rozszerzonej rzeczywistości?

Czy ARCore lub ARKit są lepsze do tworzenia doświadczeń w rozszerzonej rzeczywistości?

Niektóre z najczęściej omawianych aplikacji mobilnych i doświadczeń w dzisiejszych czasach wykorzystują technologię rozszerzonej rzeczywistości. Podczas gdy niektóre z tych doświadczeń mogą działać na praktycznie każdym urządzeniu mobilnym, inne działają tylko na nowszych i droższych modelach. Tworzenie i używanie tych bardziej zaawansowanych środowisk wymaga ARCore i ARKit.

16-bitowy vs. 24-bitowy vs. 32-bitowy dźwięk

16-bitowy vs. 24-bitowy vs. 32-bitowy dźwięk

Mając do czynienia z dźwiękiem cyfrowym, często pojawiają się terminy takie jak rozdzielczość dźwięku, częstotliwość próbkowania i inne, które opisują charakterystykę plików. Ważne jest, aby wiedzieć, co oddziela dobry dźwięk od złego, dlatego warto zapoznać się z tymi terminami.

Czym do cholery jest Dogecoin, czy Chia jest naprawdę zielona, ​​a co to jest komputer internetowy?

Czym do cholery jest Dogecoin, czy Chia jest naprawdę zielona, ​​a co to jest komputer internetowy?

Świat kryptowalut po prostu nie przestaje się zmieniać. Mając w obiegu ponad 5000 różnych kryptowalut, nowe cyfrowe jednostki wartości muszą wyróżniać się z tłumu, aby generować jakąkolwiek przyczepność.

Nvidia DLSS kontra AMD FidelityFX: na czym polega różnica i co wygląda lepiej?

Nvidia DLSS kontra AMD FidelityFX: na czym polega różnica i co wygląda lepiej?

Technologia Nvidias DLSS znacznie zmniejszyła potrzebę posiadania najdroższego sprzętu graficznego z najwyższej półki. Zamiast renderować grafikę w pełnej rozdzielczości, Twój GPU może zamiast tego renderować ją w niższej rozdzielczości i skalować w górę. Chociaż takie podejście było nie do pomyślenia lata temu, Nvidia przybiła do głowy technologię. W zależności od gry, gołym okiem może wyglądać nie do odróżnienia od natywnej rozdzielczości.

Czym są portfele z wieloma podpisami?

Czym są portfele z wieloma podpisami?

Głównym problemem dla posiadaczy kryptowalut jest bezpieczeństwo. Obawy dotyczące bezpieczeństwa często dotyczą protokołów bezpieczeństwa i bezpieczeństwa portfeli kryptowalut, które stanowią poważne zagrożenie dla funduszy, które mogą zostać zmanipulowane lub skradzione przez hakerów.

IEM a wkładki douszne: co to są IEM? Czy są lepsze niż wkładki douszne?

IEM a wkładki douszne: co to są IEM? Czy są lepsze niż wkładki douszne?

Słuchanie to bardzo osobiste doświadczenie. Niezależnie od tego, czy grasz ze swoją ulubioną listą odtwarzania, oglądasz filmy, czy zanurzasz się w rozgrywce, dźwięk odgrywa ogromną rolę w podnoszeniu ogólnego wrażenia.

5 najlepszych wynalazków Nikoli Teslasa i jak ukształtowały świat

5 najlepszych wynalazków Nikoli Teslasa i jak ukształtowały świat

Kiedy pomyślisz o słowie Tesla, w naturalny sposób pojawiają się obrazy samochodów elektrycznych i miliarderów. Jednak wynalazca Nikola Tesla, od którego imienia Elon Musk nazwał swoją firmę, odegrał ogromną rolę w historii i zmienił bieg życia wielu narodów. Kim więc był Nikola Tesla i za jakie kluczowe wynalazki był odpowiedzialny?

5 najlepszych miejsc, w których można kupić Cardano (ADA)

5 najlepszych miejsc, w których można kupić Cardano (ADA)

Śledziłeś boom na kryptowaluty i chcesz się zaangażować. Po przeprowadzeniu niewielkich badań zdecydowałeś, że Cardano (ADA) jest odpowiednią monetą dla Ciebie.

Jak sprawdzać podejrzane linki za pomocą wbudowanych narzędzi przeglądarki

Jak sprawdzać podejrzane linki za pomocą wbudowanych narzędzi przeglądarki

Pomyśl, ile witryn odwiedzasz danego dnia. Teraz pomyśl, ile adresów URL sam wpisujesz w przeglądarce. Są szanse, że odwiedzasz o wiele więcej stron internetowych, niż wyszukujesz ręcznie. Większość z nas robi to poprzez linki.

Co to jest HDMI-CEC i do czego służy?

Co to jest HDMI-CEC i do czego służy?

HDMI od pewnego czasu jest standardowym kablem do podłączania urządzeń audio i wideo, ale nie wszystkie jego funkcje są dobrze znane. Być może widziałeś opcję HDMI-CEC na swoim telewizorze, systemie kina domowego lub podobnym i zastanawiałeś się, co to robi.

Scena dźwiękowa a obrazowanie audio: co jest ważniejsze dla najlepszego dźwięku?

Scena dźwiękowa a obrazowanie audio: co jest ważniejsze dla najlepszego dźwięku?

Jeśli kiedykolwiek oglądałeś filmy z recenzjami na YouTube o słuchawkach, musiałeś zauważyć, że recenzenci używają wielu terminów. To prawie tak, jakby audiofile mieli własny słownik.

Jak siła i haptyczne sprzężenie zwrotne sprawiają, że gry są bardziej wciągające?

Jak siła i haptyczne sprzężenie zwrotne sprawiają, że gry są bardziej wciągające?

Dużą częścią naszej radości z gier jest zanurzenie się w świecie wirtualnym, tak jakbyś naprawdę tam był. Jedną z rzeczy, które mogą zwiększyć Twoje wrażenia, jest symulacja fizycznego dotyku w świecie rzeczywistym, zbliżając Cię do świata wirtualnego.