( CS) UTF-8

호두파파·2021년 8월 24일
0

Node.js

목록 보기
19/25
post-custom-banner

개요

UTF-8은 가장 많이 사용되는 가변 길이 유니코드 인코딩이다.
유니코드를 통해 코드표가 정의되었고, 남은 것은 그 '코드'가 컴퓨터에 어떻게 저장되어야 하는 것이다. 다른말로 인코딩(encoding)이라고 하는데, 컴퓨터가 이해할 수 있는 형태로 바꿔주는 것이다.

글자당, 1 byte로 할당해 4 byte로 저장할 수 있고, 2byte로 저장할 수도 있다.

UTF-8은 유니코드를 인코딩(encoding)하는 방식이다.

UTF-8은 가변 인코딩방식이다. 쉬운말로 글자마다 byte길이가 다르다.

알파벳의 경우, UTF-8 인코딩 시 1 byte를 차지하므로 1씩 증가하지만,
한글의 경우, 3byte를 차지하므로 3씩 증가한다.


정리

**유니코드는 국제표준 문자표이고,UTF-8은 인코딩 방식이다.


출처

Unicode와 UTF-8 간단히 이해하기

profile
안녕하세요 주니어 프론트엔드 개발자 양윤성입니다.
post-custom-banner

0개의 댓글