인코딩과 디코딩, charset, UTF-8, ASCII 기본개념

박다영·2022년 11월 15일
0

매일의 개발기록

목록 보기
13/28

문자, 기호, 숫자 데이터 : 인간언어
컴퓨터 부호 (0100101...) : 컴퓨터언어

1. 인코딩과 디코딩

인간언어를 컴퓨터언어로 번역하는 것 : 인코딩
컴퓨터언어를 인간언어로 번역하는 것 : 디코딩

2. UTF-8 이란?

UTF-8는 지구상에 존재하는 다양한 언어 ( 영어, 한국어, 아랍어 ..) 를 인코딩하는 방식 중 하나이다.

3. ASCII vs 유니코드

옛날엔 컴퓨터에서 영어와 특수문자 몇 개만 사용했기에
영어만 할당된 ASCII 코드표가 쓰였으나,
전세계 사람들이 컴퓨터를 사용하면서 점점 자국어를 표현하기를 원했고,
규격이 달라 생기는 깨짐현상을 막기위해 국제적인 기준이 되는 국제 표준 문자표인 유니코드가 등장했다.
이 유니코드를 인코딩하는 방식이 UTF-8 이다.

<head>
    <meta charset="UTF-8" />

따라서 html 문서 맨 위에 적힌 다음과 같은 코드는
이 문서의 문자를 utf-8 방식으로 인코딩한다는 뜻이다.

profile
개발과 디자인 두마리 토끼를!

1개의 댓글

comment-user-thumbnail
2022년 11월 16일

너무 깔끔한 정리...!
굿입니다!

답글 달기