🌸 ASCII
- 미국 표준 협회(ANSI)가 제정했다.
- 7비트로 구성된 128종의 기호를 표현할 수 있다.
- 1바이트로 하나의 문자를 표현한다.
- 제어 부호 33자, 그래픽 기호 33자, 숫자 10자, 알파벳 대소문자 52자
- 제어 부호는 통신의 시작과 종료, 라인 피드 등을 표시할 수 있다.
→ 데이터 통신에도 이용된다.
🌸 EBCDIC
- IBMS/390 서버의 운영체제인 OS/390에서 사용되는 텍스트 파일용 코드이다.
- 알파벳이나 숫자를 8비트로 표현하고, 256개의 문자가 정의되어 있다.
🌸 한글
✔️ 조합형 코드
- 완성형 코드가 발표되기 전까지 사용된 코드이다.
- 이론 상 한글 11,172자를 모두 표현할 수 있다.
✔️ 완성형 코드 (EUC - KR)
- 2바이트 완성형 코드이다.
- 11,172자 중 2,350자만 표현할 수 있다.
✔️ 확장 완성형 코드 (CP949)
- 완성형 코드에 표현할 수 있는 글자를 추가한 것이다.
🌸 유니코드
- 한글은 1996년 유니코드 2.0에서부터 11,172자가 모두 포함되었다.
- 31비트의 문자 세트이다.
- 특수한 문자를 제외한 전 세계 모든 문자들은 하위 16비트의 영역 안에 정의되어 있다.
✔️ UTF - 8
- 31비트의 유니코드를 1~6개의 바이트에 나누어 저장한다.
- 첫 번째 바이트를 통해 몇 개의 바이트로 구성된 것인지 알 수 있다.
- ASCII 영역은 1바이트, 한글은 보통 3바이트로 표현한다.
✔️ UTF - 16
✔️ UTF - 32