문자셋과 인코딩

carlkim·2023년 12월 22일
0

시스템엔지니어링

목록 보기
14/35

문자셋이란?

하나의 언어권에서 사용하는 언어를 표현하기 위한 모든 문자들의 집합을 문자셋(Charactor Set)이라고 하며 byte의 길이에 따라 다음과 같이 분류한다.

-- SBCS(Single Byte Charactor Set) : 문자 표현에 있어서 1byte만 사용하는 방식 (ASCII)
-- MBCS(Multi Byte Charactor Set) : 문자 표현에 있어서 문자마다 가변적인 byte의 길이를 사용하는 방식
-- WBCS(Wide Byte Charactor Set) : 모든 문자 표현을 2bytes만 사용하는 방식 (Unicode)

인코딩이란?

정보를 컴퓨터에서 사용할 수 있는 형식으로 변환하는 프로세스를 나타냅니다.

인코딩(Encoding)은 정의된 문자셋을 컴퓨터가 이해할 수 있도록 byte와 맵핑하는 과정이자 규칙이다. 예를 들자면, ASCII 코드 문자 A의 코드 65를 컴퓨터가 이해할 수 있도록 byte code로 변환해주는 것이다.

이는 주로 텍스트 문자나 다른 데이터를 비트 또는 바이트의 순서로 표현하는 과정을 포함.

다양한 종류의 인코딩이 다양한 목적과 환경에서 사용되며, 특정 언어의 문자나 특수 기호를 표현하는 규칙을 정의합니다.

profile
기본부터 가면 됩니다.

0개의 댓글