ASCII와 유니코드 텍스트의 차이점은 무엇입니까?

ASCII와 유니코드 텍스트의 차이점은 무엇입니까?

ASCII와 유니코드는 모두 텍스트의 디지털 표현, 특히 텍스트를 구성하는 문자를 나타내는 표준입니다. 그러나 두 표준은 상당히 다르며 많은 속성이 각각의 생성 순서를 반영합니다.

미국 대 우주

ASCII(American Standard Code for Information Interchange)는 당연히 영어 알파벳으로 작성되어 미국 청중을 대상으로 합니다. AZ 및 az와 같은 악센트가 없는 문자와 소수의 구두점 기호 및 제어 문자를 처리합니다.

ASCII와 유니코드 텍스트의 차이점은 무엇입니까?

특히, 카페 와 같이 다른 언어에서 채택된 차용어  를 ASCII로 표시하지 않고는 악센트가 있는 문자(예: 카페 ) 로 대체하지 않고  는 표현할 방법이 없습니다 . 현지화 된 ASCII 확장은 다양한 언어의 요구를 충족시키기 위해 개발되었지만 이러한 노력은 상호 운용성을 어렵게 만들고 ASCII의 기능을 분명히 확장했습니다.

대조적으로, 유니코드(Universal Coded Character Set)는 야망 규모의 반대편에 있습니다. 유니코드는 고대 언어와 모두가 좋아하는 표현 기호 세트인 이모티콘을 포괄하는 범위 내에서 가능한 한 많은 세계 문자 체계를 수용하려고 시도합니다.

문자 집합 또는 문자 인코딩?

간단히 말해서, 문자 세트는 문자(예: AZ)의 선택인 반면 문자 인코딩은 문자 세트와 디지털로 표현될 수 있는 값(예: A=1, B=2) 간의 매핑입니다.

ASCII 표준은 실제로 나타내는 문자 집합과 각 문자를 숫자 값으로 매핑하는 방법을 정의합니다.

대조적으로, 유니코드라는 단어는 여러 가지 다른 상황에서 다른 것을 의미하는 데 사용됩니다. ASCII와 같이 문자 집합과 여러 인코딩을 나타내는 포괄적인 용어로 생각할 수 있습니다. 그러나 여러 인코딩이 있기 때문에 유니코드라는 용어는 문자가 매핑되는 방식보다는 전체 문자 집합을 나타내는 데 자주 사용됩니다.

크기

범위 때문에 유니코드는 ASCII보다 훨씬 더 많은 문자를 나타냅니다. 표준 ASCII는 7비트 범위를 사용하여 128개의 고유한 문자 를 인코딩 합니다 . 반면 유니코드는 너무 커서 이야기하기 위해 다른 용어를 사용해야 합니다!

유니코드는 1,111,998개의 주소 지정 가능한 코드 포인트를 지원합니다.  코드 포인트는 문자를 위해 예약된 공간과 대략 유사하지만 세부 사항을 탐구하기 시작할 때 상황은 훨씬 더 복잡합니다!

더 유용한 비교는 현재 지원되는 스크립트(또는 쓰기 시스템)의 수입니다. 물론 ASCII는 영어 알파벳, 본질적으로 라틴어 또는 로마 문자만 처리합니다. 2020년에 생산된 유니코드 버전은 훨씬 더 나아가 총 154개의 스크립트에 대한 지원을 포함합니다.

ASCII와 유니코드 텍스트의 차이점은 무엇입니까?

저장

ASCII의 7비트 범위는 각 문자가 단일 8비트 바이트에 저장됨을 의미합니다. 스페어 비트는 표준 ASCII에서 사용되지 않습니다. 이것은 크기 계산을 간단하게 만듭니다. 텍스트의 길이(문자)는 파일의 크기(바이트)입니다.

다음 bash 명령 시퀀스로 이를 확인할 수 있습니다. 먼저 12개의 텍스트가 포함된 파일을 만듭니다.

$ echo -n 'Hello, world' > foo

텍스트가 ASCII 인코딩인지 확인하기 위해 file 명령을 사용할 수 있습니다 .

$ file foo foo: ASCII text, with no line terminators

마지막으로 파일이 차지하는 정확한 바이트 수를 얻으려면 stat 명령을 사용합니다 .

$ stat -f%z foo 12

유니코드 표준은 훨씬 더 넓은 범위의 문자를 다루기 때문에 유니코드 파일은 자연스럽게 더 많은 저장 공간을 차지합니다. 정확히 얼마는 인코딩에 따라 다릅니다.

ASCII로 표현할 수 없는 문자를 사용하여 이전의 동일한 명령 집합을 반복하면 다음이 제공됩니다.

$ echo -n '€' > foo $ file foo foo: UTF-8 Unicode text, with no line terminators $ stat -f%z foo 3

해당 단일 문자는 유니코드 파일에서 3바이트를 차지합니다. ASCII 파일은 선택한 문자(€)를 저장할 수 없기 때문에 bash는 자동으로 UTF-8 파일을 생성했습니다. UTF-8은 단연코 유니코드에 대한 가장 일반적인 문자 인코딩입니다. UTF-16 및 UTF-32는 두 가지 대체 인코딩이지만 훨씬 덜 사용됩니다.

UTF-8은 가변 너비 인코딩입니다. 즉, 서로 다른 코드 포인트에 대해 서로 다른 저장 공간을 사용합니다. 각 코드 포인트는 1바이트에서 4바이트 사이를 차지하며 더 일반적인 문자는 더 적은 공간을 필요로 하여 일종의 기본 제공 압축을 제공합니다. 단점은 주어진 텍스트 청크의 길이 또는 크기 요구 사항을 결정하는 것이 훨씬 더 복잡해진다는 것입니다.

ASCII는 유니코드이지만 유니코드는 ASCII가 아닙니다.

이전 버전과의 호환성을 위해 처음 128개의 유니코드 코드 포인트는 동등한 ASCII 문자를 나타냅니다. UTF-8은 이러한 각 문자를 단일 바이트로 인코딩하므로 모든 ASCII 텍스트도 UTF-8 텍스트입니다. 유니코드는 ASCII의 상위 집합입니다.

그러나 위에 표시된 것처럼 많은 유니코드 파일은 ASCII 컨텍스트에서 사용할 수 없습니다. 범위를 벗어난 모든 문자는 예상치 못한 방식으로 표시되며, 종종 의도한 것과 완전히 다른 대체 문자로 표시됩니다.

현대적인 사용법

대부분의 경우 ASCII는 대부분 레거시 표준으로 간주됩니다. 예를 들어 복잡한 유니코드에 대한 완전한 지원이 필요하지 않은 라틴 스크립트만 지원하는 상황에서도 일반적으로 UTF-8을 사용하고 ASCII 호환성을 활용하는 것이 더 편리합니다.

특히 HTML5의 기본값인 UTF-8을 사용하여 웹페이지를 저장하고 전송해야 합니다. 이것은 라틴어 1로 대체되기 전에 기본적으로 ASCII를 처리했던 이전 웹과 대조됩니다.

변화하는 표준

ASCII의 마지막 개정은 1986년에 이루어졌습니다.

대조적으로 유니코드는 매년 계속 업데이트됩니다. 새로운 스크립트, 캐릭터, 특히 새로운 이모티콘이 정기적으로 추가됩니다. 이들 중 극히 일부만 할당된 상태에서 전체 문자 집합은 가까운 장래에 계속 성장할 것입니다.

관련:  가장 인기 있는 100가지 이모티콘 설명

ASCII 대 유니코드

ASCII는 수십 년 동안 그 목적을 수행했지만 이제 유니코드는 레거시 시스템 이외의 모든 실용적인 목적을 위해 이를 효과적으로 대체했습니다. 유니코드는 더 크므로 표현력이 뛰어납니다. 이는 전 세계적인 공동 작업을 나타내며 약간의 복잡성을 희생하더라도 훨씬 더 큰 유연성을 제공합니다.


동형 암호화란 무엇입니까?

동형 암호화란 무엇입니까?

최근에 많이 등장하는 단어는 동형 암호화입니다. 많은 회사와 온라인 서비스에서 암호화 모델을 동형 암호화 유형으로 전환하고 있으며 더 나은 사용자 개인 정보 보호 및 보안을 위한 광고입니다.

비트맵 이미지란 무엇입니까?

비트맵 이미지란 무엇입니까?

대부분의 사람들에게 디지털 미디어는 일상 생활의 일부입니다. 그러나 우리는 그것이 어떻게 만들어졌는지 항상 생각하지는 않습니다.

Android TV와 Google TV의 차이점은 무엇인가요?

Android TV와 Google TV의 차이점은 무엇인가요?

Android 운영 체제는 Google에서 개발한 것이므로 Google TV와 Android TV의 차이점에 대해 혼란스러워 하실 수 있습니다. 그것은 같은 것입니까?

라이트 필드 디스플레이란 무엇이며 어떻게 작동합니까?

라이트 필드 디스플레이란 무엇이며 어떻게 작동합니까?

라이트 필드 디스플레이는 우리가 주변 세계를 보는 방식을 점차적으로 변화시키고 있습니다. 또는 오히려, 우리가 우리 주변에 없는 세상을 어떻게 보는지. 클래식 사진에서 고급 교육 및 진단, 원격 존재 및 엔터테인먼트에 이르기까지 이 기사에서는 라이트 필드 디스플레이가 무엇인지, 다양한 디스플레이 유형이 작동하는 방식 및 사용 방법을 살펴봅니다.

매트릭스 프로토콜이란 무엇이며 어떻게 작동합니까?

매트릭스 프로토콜이란 무엇이며 어떻게 작동합니까?

우리가 온라인에서 서로 통신하는 데 사용하는 대부분의 플랫폼은 단일 공급자에 연결되어 있습니다. 그러나 상황이 이런 식으로 될 기술적 이유는 없습니다. 더 높은 수준의 개인 정보 보호와 자유를 제공하는 온라인 채팅 방법이 있습니다. 매트릭스는 그러한 방법 중 하나입니다.

UART, SPI 및 I2C 직렬 통신 작동 방식 및 여전히 사용하는 이유

UART, SPI 및 I2C 직렬 통신 작동 방식 및 여전히 사용하는 이유

컴퓨터 주변 장치, 스마트 기기, 사물 인터넷(IoT) 장치 또는 전자 측정 도구 등 모두 직렬 통신 프로토콜을 사용하여 서로 다른 전자 부품을 연결합니다.

사이버 괴롭힘이란 무엇이며 어떻게 대처할 수 있습니까?

사이버 괴롭힘이란 무엇이며 어떻게 대처할 수 있습니까?

인터넷은 좋든 나쁘든 그 어느 때보다 많은 사람들이 연결할 수 있게 해주었습니다. 사람들이 건설적이고 재미있는 목적으로 인터넷을 사용하는 만큼 다른 사람들은 인터넷을 사용하여 새로운 종류의 괴롭힘인 사이버 괴롭힘을 수행합니다.

99가지 암호화폐 용어 설명: 필요한 모든 암호화 정의

99가지 암호화폐 용어 설명: 필요한 모든 암호화 정의

암호화폐는 블록체인이라는 분산된 컴퓨터 네트워크에서 실행되는 디지털 통화입니다. 가장 중요하고 널리 인정되는 암호화폐는 비트코인, 이더리움, 테더, 카르다노, 바이낸스 코인 및 USD 코인입니다.

하이퍼바이저란 무엇입니까? 가상 머신과 다른가요?

하이퍼바이저란 무엇입니까? 가상 머신과 다른가요?

하이퍼바이저는 가상 머신을 생성하는 데 사용되는 소프트웨어입니다. 가상 머신은 컴퓨터의 에뮬레이션입니다. 가상 머신은 단일 하드웨어에서 여러 컴퓨팅 환경을 만드는 데 사용됩니다.

액세스 포인트 대 라우터—차이점은 무엇입니까?

액세스 포인트 대 라우터—차이점은 무엇입니까?

집이나 회사에 Wi-Fi를 설정하는 것은 너무 어렵고 혼란스러울 수 있습니다. 이 과정에는 상당히 다양한 용어와 장치가 포함되어 있으며 모든 Wi-Fi 상황은 고유합니다. 많은 장치가 넓은 지역의 네트워크에 연결된 대기업은 몇 개의 장치가 있는 단순한 가정과 크게 다른 것이 필요합니다.

자산을 저장하는 8가지 최고의 소프트웨어 암호화폐 지갑

자산을 저장하는 8가지 최고의 소프트웨어 암호화폐 지갑

암호화폐를 얼마든지 소유하고 있다면 가장 안전하고 안전하게 보관하는 방법이 궁금할 것입니다. 암호화폐가 디지털 형태의 화폐라는 점을 감안할 때 머리맡 서랍이나 금고에 넣어둘 수는 없습니다. 대신 하드웨어나 소프트웨어에 저장해야 합니다.

톤 및 노르딕 트랙 디지털 가중치는 어떻게 작동합니까?

톤 및 노르딕 트랙 디지털 가중치는 어떻게 작동합니까?

디지털 웨이트를 사용하는 운동 기구의 광고를 보았고 그것이 도대체 무엇인지 궁금했던 적이 있습니까? 아니면 이 매끄럽고 깔끔한 새 기계를 보고 그 모든 저항이 어디에서 온 것인지 궁금해 한 적이 있습니까?

항상 묻고 싶었던 전기 자동차에 대한 10가지 일반적인 질문

항상 묻고 싶었던 전기 자동차에 대한 10가지 일반적인 질문

전기 자동차(EV)가 훨씬 더 대중화되고 있습니다. 2020년 기준으로 미국에는 약 180만 대의 EV가 등록되어 있으며 이는 2016년의 3배입니다. 전 세계적으로 2020년에는 1020만 대의 EV가 있는 것으로 추산됩니다.

Mac mini eGPU로 그래픽 성능 향상 가능

Mac mini eGPU로 그래픽 성능 향상 가능

Mac mini와 함께 eGPU를 사용하면 게임 및 이미지 처리와 같은 작업을 위한 뛰어난 그래픽 성능을 유지하면서 작은 인클로저를 최대한 활용할 수 있는 훌륭한 방법이 될 수 있습니다. 이 가이드에서는 eGPU가 설정에 추가할 수 있는 것, 작동 방식, 이 깔끔한 작은 키트에 추가 현금을 쏟을 가치가 있는지 잘 설명합니다.

자동차에 Dashcam을 설치하는 방법

자동차에 Dashcam을 설치하는 방법

대시캠이 있는 경우 장착하는 것이 약간의 귀찮은 일처럼 보일 수 있습니다. 어떤 경우에는 원하는 만큼 간단하지 않지만 차에 대시캠을 설치하는 것은 시간을 투자할 가치가 있습니다.

Nvidias 30 시리즈 GPU가 AMD보다 나은 이유

Nvidias 30 시리즈 GPU가 AMD보다 나은 이유

Nvidia는 그래픽 카드 개발에서 신뢰할 수 있는 두 이름 중 하나입니다. Nvidia GPU가 있거나 AMD GPU를 선택합니다. 누구에게 물어보느냐에 따라 Nvidia는 GPU와 관련하여 항상 AMD보다 약간 앞서 있습니다. 더 빠르고, 더 크고, 더 강력하고, 더 혁신적입니다.

16비트 vs. 24비트 vs. 32비트 오디오

16비트 vs. 24비트 vs. 32비트 오디오

디지털 오디오를 다룰 때 오디오 해상도, 샘플 속도 및 기타 파일 특성을 설명하는 용어를 자주 보게 됩니다. 좋은 오디오와 나쁜 오디오를 구분하는 것이 무엇인지 아는 것이 중요하므로 이러한 용어에 익숙해지는 것이 도움이 됩니다.

Xbox Series X vs. PS5: 가장 많은 테라플롭이 있는 것은 무엇입니까?

Xbox Series X vs. PS5: 가장 많은 테라플롭이 있는 것은 무엇입니까?

새로운 콘솔 세대가 도래했습니다. PlayStation 5와 Xbox Series X의 출시는 콘솔 게임의 다음 단계를 의미합니다. 예상대로 게이머는 어떤 콘솔이 더 나은지 알고 싶어합니까? 어떤 게임 옵션이 가까운 장래에 최고의 가치를 제공할 것입니까?

전력선 어댑터 대 메시 Wi-Fi: 가정에 가장 적합한 것은?

전력선 어댑터 대 메시 Wi-Fi: 가정에 가장 적합한 것은?

집의 특정 영역에서 인터넷에 연결할 수 없는 경우 여러 가지 방법으로 문제를 해결할 수 있습니다. 가장 인기 있는 두 가지 옵션은 전력선 어댑터와 메시 Wi-Fi입니다.

깨진 화면에 잉크가 보이는 이유

깨진 화면에 잉크가 보이는 이유

고장난 장치(휴대폰, 태블릿 또는 노트북)의 화면에서 잉크처럼 보이는 검은색 또는 보라색 얼룩을 보는 것은 드문 일이 아닙니다. 하지만 화면에 정말 잉크가 있습니까?

동형 암호화란 무엇입니까?

동형 암호화란 무엇입니까?

최근에 많이 등장하는 단어는 동형 암호화입니다. 많은 회사와 온라인 서비스에서 암호화 모델을 동형 암호화 유형으로 전환하고 있으며 더 나은 사용자 개인 정보 보호 및 보안을 위한 광고입니다.

비트맵 이미지란 무엇입니까?

비트맵 이미지란 무엇입니까?

대부분의 사람들에게 디지털 미디어는 일상 생활의 일부입니다. 그러나 우리는 그것이 어떻게 만들어졌는지 항상 생각하지는 않습니다.

라이트 필드 디스플레이란 무엇이며 어떻게 작동합니까?

라이트 필드 디스플레이란 무엇이며 어떻게 작동합니까?

라이트 필드 디스플레이는 우리가 주변 세계를 보는 방식을 점차적으로 변화시키고 있습니다. 또는 오히려, 우리가 우리 주변에 없는 세상을 어떻게 보는지. 클래식 사진에서 고급 교육 및 진단, 원격 존재 및 엔터테인먼트에 이르기까지 이 기사에서는 라이트 필드 디스플레이가 무엇인지, 다양한 디스플레이 유형이 작동하는 방식 및 사용 방법을 살펴봅니다.

매트릭스 프로토콜이란 무엇이며 어떻게 작동합니까?

매트릭스 프로토콜이란 무엇이며 어떻게 작동합니까?

우리가 온라인에서 서로 통신하는 데 사용하는 대부분의 플랫폼은 단일 공급자에 연결되어 있습니다. 그러나 상황이 이런 식으로 될 기술적 이유는 없습니다. 더 높은 수준의 개인 정보 보호와 자유를 제공하는 온라인 채팅 방법이 있습니다. 매트릭스는 그러한 방법 중 하나입니다.

UART, SPI 및 I2C 직렬 통신 작동 방식 및 여전히 사용하는 이유

UART, SPI 및 I2C 직렬 통신 작동 방식 및 여전히 사용하는 이유

컴퓨터 주변 장치, 스마트 기기, 사물 인터넷(IoT) 장치 또는 전자 측정 도구 등 모두 직렬 통신 프로토콜을 사용하여 서로 다른 전자 부품을 연결합니다.

사이버 괴롭힘이란 무엇이며 어떻게 대처할 수 있습니까?

사이버 괴롭힘이란 무엇이며 어떻게 대처할 수 있습니까?

인터넷은 좋든 나쁘든 그 어느 때보다 많은 사람들이 연결할 수 있게 해주었습니다. 사람들이 건설적이고 재미있는 목적으로 인터넷을 사용하는 만큼 다른 사람들은 인터넷을 사용하여 새로운 종류의 괴롭힘인 사이버 괴롭힘을 수행합니다.

99가지 암호화폐 용어 설명: 필요한 모든 암호화 정의

99가지 암호화폐 용어 설명: 필요한 모든 암호화 정의

암호화폐는 블록체인이라는 분산된 컴퓨터 네트워크에서 실행되는 디지털 통화입니다. 가장 중요하고 널리 인정되는 암호화폐는 비트코인, 이더리움, 테더, 카르다노, 바이낸스 코인 및 USD 코인입니다.

하이퍼바이저란 무엇입니까? 가상 머신과 다른가요?

하이퍼바이저란 무엇입니까? 가상 머신과 다른가요?

하이퍼바이저는 가상 머신을 생성하는 데 사용되는 소프트웨어입니다. 가상 머신은 컴퓨터의 에뮬레이션입니다. 가상 머신은 단일 하드웨어에서 여러 컴퓨팅 환경을 만드는 데 사용됩니다.

액세스 포인트 대 라우터—차이점은 무엇입니까?

액세스 포인트 대 라우터—차이점은 무엇입니까?

집이나 회사에 Wi-Fi를 설정하는 것은 너무 어렵고 혼란스러울 수 있습니다. 이 과정에는 상당히 다양한 용어와 장치가 포함되어 있으며 모든 Wi-Fi 상황은 고유합니다. 많은 장치가 넓은 지역의 네트워크에 연결된 대기업은 몇 개의 장치가 있는 단순한 가정과 크게 다른 것이 필요합니다.

자산을 저장하는 8가지 최고의 소프트웨어 암호화폐 지갑

자산을 저장하는 8가지 최고의 소프트웨어 암호화폐 지갑

암호화폐를 얼마든지 소유하고 있다면 가장 안전하고 안전하게 보관하는 방법이 궁금할 것입니다. 암호화폐가 디지털 형태의 화폐라는 점을 감안할 때 머리맡 서랍이나 금고에 넣어둘 수는 없습니다. 대신 하드웨어나 소프트웨어에 저장해야 합니다.