#42 TIL 유니코드란?

장석진·2021년 7월 1일
0

유니코드?

유니코드(Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업표준이며, 유니코드 협회(Unicode consortium)가 재정한다.
또한 이 표준에는 ISO 10646문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자들을 다루기 위한 알고리즘 등을 포함하고 있다.
유니코드가 있긴 전에는, 같은 한글이 적힌 텍스트 파일이라도 표현하는 방법이 제각각이어서, 어떤 파일이 지원하지 않는 다른 인코딩 형식으로 저장되어 있는 경우,
제대로 파잉을 불러올 수 없었습니다. 기본적으로 유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것

인코딩(부호화)란?

인코딩이란 어떤 문자나 기호를 컴퓨터나가 이용할 수 있는 신호로 만드는 것
이 신호를 입력하는 인코딩과 문자르 해독하는 디코딩을 하기 위해서는 미리 정해진 기준을 바탕으로 이벽과 해독이 처리되어야 하는데, 이를 문자열 세트 또는 문자셋(charset)이라고 한다,. 이 문자 셋의 국제 표준이 유니코드이다

ASCII 문자란?

영문 앞파벳을 사용하는 대표적인 문자 인코딩으로 7비트로 표현이 가능하다. 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자, 그리고 하나의 공백 문자를 포함한다.
유니코드는 ASCII를 확장한 형태

UTF-8과 UTF-16의 차이점은 무엇인가요?

UTF-8과 UTF-16은 인코딩 방식의 차이를 의미합니다. UTF-8은 Universal Coded Character Set + Transformation Format – 8-bit의 약자로, UTF- 뒤에 등장하는 숫자는 bit입니다.

profile
개발자가 되고 싶은 새내기

0개의 댓글