ASCII, Unicode의 기초 개념

조성철 (JoSworkS)·2020년 4월 2일
0

TIL(Today I Learned)

목록 보기
49/73
post-thumbnail

ASCII 란?

ASCII 코드란 'American Standard Code for Information Interchange'의 약자이며, 아스키 코드라고 읽는다.

아스키 코드는 문자에 대해 각각의 번호를 지정하여 관리하고 있는 집합체이며, 가장 기초가 되는 문자 코드라고 할 수 있다.

프로그램이나 다른 컴퓨터와 통신하기 위하여 문자와 기호가 숫자 표현으로 변환될 필요가 생겼고, 그에 따라 개발된 것이 아스키 코드이다. 아스키 코드에서는 7비트 부호로 128개의 숫자가 알파벳, 숫자, 특수문자, 제어문자가 할당되어 있다.

Unicode 란?

유니코드(Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이며, 유니코드 협회(Unicode Consortium)가 제정한다. 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자들을 다루기 위한 알고리즘 등을 포함하고 있다.
출처: https://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C

즉, Unicode는 아스키 코드와 같이 집합체의 한 종류이며, 전 세계의 문자에 대해 각각의 번호를 지정하여 관리하고 있기 위해 만들어진 집합체라고 할 수 있다.

각 문자에 대해 지정된 번호는 '코드 포인트'라고 하며, 이는 문자 집합체 내의 부호의 위치이다. 그리고 각 코드 포인트는 16진수로 표시하며 문자 앞에 'U'을 붙여서 사용한다.

글자와 코드가 1:1 매핑되어 있으며 운영체제나 프로그램 언어에 관계없이 문자마다 고유한 코드 값을 제공한다. 언어와 상관 없이 모든 문자를 16비트로 표현하여 최대 65,536자 까지 표현할 수 있다.

참고 자료

0개의 댓글