드림 코딩 - 비트와 바이트 문자인코딩 개념 정리 10분 🙆♀️ | 컴공 기본 상식 가좌아 (메가와 메비의 차이를 알고 있뉘?)
( 이미지 클릭시 영상 이동)
코딩 외에도 게임이나 기타 인터넷에서 한글이 깨지는 경우를 많이 보았는데 그게 텍스트 인코딩 관련 문제임을 대충은 알고 있지만 좀 더 공부하고 싶어서 선택하였다.
0 과 1
컴퓨터가 이해할 수 있는 최소 정보단위로, 신호가 있는 것과 없는 것으로 생각된다. 2진수라고도 불린다.
1바이트 = 8비트
비트가 8개 모인 것으로 컴퓨터에서 데이터를 처리할 때 가장 기본 단위이다. 숫자로는 0 (00000000)부터 시작하면 255 (11111111)까지 표현할 수 있다.
문자 표시 방법!
문자도 비슷하게 이진수를 이용해서 표현한다.
초창기 영어의 경우 1바이트를 사용해서 미국정보교환표준부호(American Standard Code for Information Interchange) 또는 ASCII 라는 것을 사용했는데, 다양한 언어를 사용하는 것이 필요해지며 2바이트를 사용하는 유니코드가 등장하게 되었다.
이 세상의 모든 문자를 표현할거야!
현존하는 문자들을 이진수 형태로 나타낼 것인지 그 규격을 약속하는 것이 텍스트 인코딩인데, 나라마다 서로 다른 인코딩들을 해결하기 위해 등장한 UTF-8은 가변길이 유니코드 인코딩 방식을 사용하고 있다.
기본적으로 아즈키코드는 1바이트를 사용해 표현하고, 유니코드는 4바이트까지, 필요한 데이터의 범위를 늘려가며 표현하는 방식이다.