[디지털 데이터의 표현] 문자

Fruit·2023년 4월 4일

📖 Hello Certificate!

목록 보기
5/24
post-thumbnail

🌸 ASCII

  • 미국 표준 협회(ANSI)가 제정했다.
  • 7비트로 구성된 128종의 기호를 표현할 수 있다.
  • 1바이트로 하나의 문자를 표현한다.
  • 제어 부호 33자, 그래픽 기호 33자, 숫자 10자, 알파벳 대소문자 52자
  • 제어 부호는 통신의 시작과 종료, 라인 피드 등을 표시할 수 있다.
    → 데이터 통신에도 이용된다.



🌸 EBCDIC

  • IBMS/390 서버의 운영체제인 OS/390에서 사용되는 텍스트 파일용 코드이다.
  • 알파벳이나 숫자를 8비트로 표현하고, 256개의 문자가 정의되어 있다.


🌸 한글

✔️ 조합형 코드

  • 완성형 코드가 발표되기 전까지 사용된 코드이다.
  • 이론 상 한글 11,172자를 모두 표현할 수 있다.

✔️ 완성형 코드 (EUC - KR)

  • 2바이트 완성형 코드이다.
  • 11,172자 중 2,350자만 표현할 수 있다.

✔️ 확장 완성형 코드 (CP949)

  • 완성형 코드에 표현할 수 있는 글자를 추가한 것이다.


🌸 유니코드

  • 한글은 1996년 유니코드 2.0에서부터 11,172자가 모두 포함되었다.
  • 31비트의 문자 세트이다.
  • 특수한 문자를 제외한 전 세계 모든 문자들은 하위 16비트의 영역 안에 정의되어 있다.

✔️ UTF - 8

  • 31비트의 유니코드를 1~6개의 바이트에 나누어 저장한다.
  • 첫 번째 바이트를 통해 몇 개의 바이트로 구성된 것인지 알 수 있다.
  • ASCII 영역은 1바이트, 한글은 보통 3바이트로 표현한다.

✔️ UTF - 16

  • 한중일 문자를 2바이트로 표현한다.

✔️ UTF - 32

  • 각 문자를 4바이트로 표현한다.
profile
🌼인생 참 🌻꽃🌻 같다🌼

0개의 댓글