한글 인코딩 관련 정리

murkgom·2023년 4월 4일
0
post-custom-banner

조합형

= NFD(Normalization Form Decomposition)
ㄱ+ㅏ+ㅇ 으로 저장 후 조합해서 구현
MacOS 에서 사용
UTF-8...

완성형

= NFC(Normalization Form Composition)
강 으로 저장 후 리턴
Windows, Linux에서 사용
EUC-KR, CP949...

유니코드

Universal Character Set + 인코딩 방법들(UTF-8, UTF-16, UTF-32)

cp949

sort 배열이 자기멋대로 되어있음

MacOs -> Windows 한글명 파일 전달시 자모 나뉘는 이유

BOM(Byte Order Mark)
UTF-8 사용시 Linux, MacOs에서는 BOM 생략
Windows는 첫머리에 필요
So, 적절히 transcoding해주지 않는 프로그램 사용시 난리난리

Ref

post-custom-banner

0개의 댓글