문자 인코딩이란?

MJ·2022년 7월 2일
0

[개발용어]

목록 보기
4/11

1. 문자 인코딩이란?

  • 사용자가 입력한 문자나 기호들을 컴퓨터가 이용할 수 있는 신호로 만드는 것
  • 컴퓨터는 2진수 0과 1의 데이터, 바이너리로만 문자및 특수기호를 이해 합니다.
    그래서 2진수에 해당하는 문자셋을(문자표)를 만들어서, 사용자가 문자를 입력하면 2진수로 변환하여 문자표와 매핑해서 문자표에 있는 문자를 사용자에게 전달하게 됩니다.

    인코딩이 제대로 이루어지지 않는다면, 문자나 기호가 깨져서 표시 됩니다.


1.1 인코딩이 필요한 이유는?

컴퓨터는 모든 정보를 0과 1인 숫자로만 저장합니다. (바이너리라고도 합니다)
사용자가 문서 작업을 하면서 작성한 한글,영문,특수기호 등은 컴퓨터가 이해할 수 없습니다.
이떄, 컴퓨터가 이해할 수 있는 신호로 변환해주는 과정을 인코딩이라고 합니다. (바이너리 데이터)
만약 인코딩이 제대로 이루어지지 않는다면, 컴퓨터는 우리가 작업한 문서에 문자들을 이해할 수 없기 떄문에 문자깨짐 현상이 나타나게 됩니다.


1.2 문자 셋 (Character Set)

인코딩을 할 떄 참조하는 문자 매핑표
대표적으로 아스키코드 유니코드 UTF-8등이 있습니다.

바이너리 데이터로 변환하는 인코딩과 반대로 문자에서 데이터로 변환하는 디코딩
미리 정해진 규칙에 의해서 수행됩니다.
이렇게 미리 정해진 규칙을 문자 셋이라고 하며, 초기 표준 문자열은 아스키코드등이 있습니다.

인터넷이 전 세계적으로 많이 보급되고 표현해야할 문자량이 증가하면서 전 국가에서 공통적으로 사용할 문자 셋을 표준화 시켰는데, 이를 유니코드라고 합니다.


1.3 유니코드와 문자셋의 차이점

종류내용
문자 인코딩문자를 컴퓨터가 이해할 수 있는 신호로 변환해주는 작업
컴퓨터가 이해할 수 있는 바이너리로, 어떠한 방법을 사용해도 상관없다.
문자 셋인코딩과 디코딩 작업을 위해 정해진 규칙
문자를 숫자로 매핑해주는 표이다.
profile
프론트엔드 개발자가 되기 위한 학습 과정을 정리하는 블로그

0개의 댓글