인코딩(ASCII,UNICODE,UTF-8)

홍성우·2023년 6월 20일

알아두면 좋은것

목록 보기
1/1

1.ASCII(7bit) - unsigned int 0 ~ 255 표현

영어권 문자들은 ASCII코드로 표현이 가능하였다.하지만 아시아권으로 넘어오면서 7bit로 표현이 불가능하였다.

2.unicode(16bit)

아시아권으로 넘어오면서 문자들을 16bit로 표현이 가능해졌다.
한글과 일어는 가능했으나, 한자는 10만자 이상이므로 2^16 = 65355 경우의 수로도 표현이 불가능하였다.

3.UTF-8(24bit)

UTF-8은 현대 문자열인코딩 방법중 가장 보편적이 방법이다.
ASCII + Unicode 형태를 조합하여 표현하는 방법이다.


왼쪽(메모장) , 오른쪽(HXD)

오른쪽(HXD)
E5 95 88 - 안
E8 85 95 - 녕
0D 0A - /r/n 개행문자

유니코드 도표 참고 사이트 : https://jjeong.tistory.com/696

4.UTF-16

모든 문자열을 ASCII코드로 표현하고 2byte씩 맞춰서 표기한다.
31 00 - 숫자 1
32 00 - 숫자 2
48 c5 - 안 (ascii)
B1 55 - 녕 (ascii)

5.Base64

문자열 체계를 6bit로 표현

profile
제 블로그를 방문해 주셔서 감사합니다

0개의 댓글