0과 1로 문자를 표기하는 방법

EHminShoov2J·2023년 10월 12일
0

Computer Science

목록 보기
3/12
post-thumbnail

1. 문자 집합과 인코딩

  • 문자 집합 : 컴퓨터가 이해할수 있는 문자의 모음
  • 인코딩 : 코드화 하는 과정. 문자를 0과 1로 이루어진 문자 코드로 변환하는 과정
  • 디코딩 : 코드를 해석하는 과정. 0과 1로 표현된 문자 코드를 문자로 변환

2. 아스키 코드

  • 초창기 문자 집합으로 알파벳, 아라비아 숫자, 일부 특수 및 제어 문자
  • 7비트로 하나의 문자 표현 : 8bit 중 1비트는 페리티 비트로 오류를 검출하는데 사용. 128개의 문자를 표현 가능하다.

3. 한글 인코딩: 완성형 VS 조합형 인코딩

  • 한글을 위한 인코딩이 필요하다.
  • EUC-KR : 완성형 인코딩. 글자 하나에 2바이트의 코드를 부여. 2300 개정도만 가능하며 이로 인해 모든 한글을 표현하지는 못한다.
  • UTF-8 : 유니코드란 통일된 문자 집합을 의미한다. 이를 인코딩 하는 방식중의 하나. 한글, 영어, 화살표, 이모티콘등 다양한 문자를 표현할 수 있다는 장점을 가지고 있다.
    가변길이 인코딩으로 1~4바이트 까지의 크기를 가질 수 있다.

0개의 댓글