UTF-8은 가장 많이 사용되는 가변 길이 유니코드 인코딩이다.
유니코드를 통해 코드표가 정의되었고, 남은 것은 그 '코드'가 컴퓨터에 어떻게 저장되어야 하는 것이다. 다른말로 인코딩(encoding)이라고 하는데, 컴퓨터가 이해할 수 있는 형태로 바꿔주는 것이다.
글자당, 1 byte로 할당해 4 byte로 저장할 수 있고, 2byte로 저장할 수도 있다.
UTF-8은 유니코드를 인코딩(encoding)하는 방식이다.
UTF-8은 가변 인코딩방식이다. 쉬운말로 글자마다 byte길이가 다르다.
알파벳의 경우, UTF-8 인코딩 시 1 byte를 차지하므로 1씩 증가하지만,
한글의 경우, 3byte를 차지하므로 3씩 증가한다.
**유니코드는 국제표준 문자표이고,UTF-8은 인코딩 방식이다.