영어권 문자들은 ASCII코드로 표현이 가능하였다.하지만 아시아권으로 넘어오면서 7bit로 표현이 불가능하였다.
아시아권으로 넘어오면서 문자들을 16bit로 표현이 가능해졌다.
한글과 일어는 가능했으나, 한자는 10만자 이상이므로 2^16 = 65355 경우의 수로도 표현이 불가능하였다.
UTF-8은 현대 문자열인코딩 방법중 가장 보편적이 방법이다.
ASCII + Unicode 형태를 조합하여 표현하는 방법이다.
왼쪽(메모장) , 오른쪽(HXD)
오른쪽(HXD)
E5 95 88 - 안
E8 85 95 - 녕
0D 0A - /r/n 개행문자
유니코드 도표 참고 사이트 : https://jjeong.tistory.com/696
모든 문자열을 ASCII코드로 표현하고 2byte씩 맞춰서 표기한다.
31 00 - 숫자 1
32 00 - 숫자 2
48 c5 - 안 (ascii)
B1 55 - 녕 (ascii)
문자열 체계를 6bit로 표현