Unicode Transformation Format
유니코드 변환 형식
특정 코드를 사용해 문자나 이모티콘 등을 나타내는 국제 표준(약속) 문자표.
이 코드는 결과적으로 0과 1로 변환됨.
A라는 문자(Character)를 놓고 봤을 때,
- A의 유니코드 : U+0041
- A의 바이너리 : 01010101 00101011 00110000 00110000 00110100 00110001
이진법을 의미.
0과 1만을 사용해 수를 나타내는 진법으로, 컴퓨터가 사용.
8은 비트(1 또는 0)의 사용 방법을 지정함. 바이너리 열을 보면 8비트 그룹이 있는 것을 알 수 있다.
유니코드를 통해 코드표가 정의되었으니 그 코드를 컴퓨터가 이해할 수 있도록 컴퓨터에 저장하는 방법(인코딩)이 필요.
즉, UTF-8은 유니코드를 인코딩하는 방식.