문자집합: 컴퓨터가 이해 가능한 문자의 모음
인코딩
: 문자를 0과 1로 이뤄진 문자코드로 변환하는 과정
디코딩
: 0과 1로 표현된 문자코드를 문자로 변환하는 과정
아스키 코드
: 초창기 문자집합 중 하나
한글 인코딩
완성형 인코딩
: 글자 하나하나에 코드를 부여
ex) EUC-KR
-> 글자 하나에 2바이트 크기의 코드 부여 (2byte -> 16bit -> 4자리 십육진수)
-> 230여개의 한글표현 가능하나 여전히 부족
조합형 인코딩
: 자음모음에 코들를 부여
유니코드
: 통일된 문자집합으로 한글, 영어, 화살표등의 특수문자, 이모티콘 표현가능 현대 문자표현에 매우 중요한 위치하고 있으며 유니코드는 문자 하나하나에 고유한 십육진수가 부여되어있다.
*유니코드 인코딩 방식
-> utf-8, utf-16, utf-32
UTF-8
*글자가 깨지는등의 문제 : 인코딩 방식 또는 사용이 불가능한 문자집합인지를 확인