문자열

YoungJoon Suh·2022년 4월 19일
0

unicode란?
유니코드는 유니코드 협회가 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업표준입니다. 유니코드의 목적은 현존하는 문자 인코딩 방법을 모두 유니코드로 교체하는 것입니다.

인코딩이란?
인코딩이란 어떤 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것입니다. 이 신호를 입력하는 인코딩과 문자를 해독하는 디코딩을 하기 위해서는 미리 정해진 기준을 바탕으로 입력과 해독이 처리되어야 합니다.
이렇게 인코딩과 디코딩의 기준을 문자열 세트 또는 문자셋(charset)이라고 합니다. 이 문자셋의 국제 표준이 유니코드입니다.

ASCII 문자
영문 알파벳을 사용하는 대표적인 문자 인코딩으로 7비트로 모든 영어 알파벳을 표현할 수 있습니다. 유니코드는 ASCII를 확장한 형태입니다.

UTF-8과 UTF-16의 차이점
UTF-8과 UTF-16은 인코딩 방식의 차이를 의미합니다. UTF-8은 Universal Coded Character Set + Transformation Format - 8 bit의 약자로, UTF- 뒤에 등장하는 숫자는 비트(bit)입니다.

profile
저는 서영준 입니다.

0개의 댓글