Bit와 Byte

yesang·2024년 5월 29일

movie

컴퓨터는 0과 1 두가지의 종류 중 하나만 담을 수 있는 비트라는 가장 최소의 단위를 가지고 있고 이 비트를 여러개 묶어서 더 많은 데이터를 저장할 수 있다. 그리고 컴퓨터 프로그래밍에서는 1byte를 가장 최소의 단위로 잡는다.

만약 29를 2진수로 나타내려면 2로 나누어지지 않을 때까지 계속해서 2로 나누면 된다. 다시 2진수를 10진수로 변환하고 싶다면 나누기 했던 것과 반대로 각각의 bit의 위치를 2^0, 2^1과 같이 숫자를 증가시키면서 곱한 다음 곱한 결과값을 모두 더하면 10진수로 만들 수 있다.


ASCII
아스키 코드의 한계점은 이 세상에는 다양한 다국어와 문자열들이 많은데 아스키 코드에는 그런 다양한 문자열이 들어있지 않다.

유니코드
우리 지구상에서 만날 수 있는 다양한 문자열을 포함하는 것
유니코드에 들어있는 문자열은 1바이트에 다 담을 수 없기 때문에 2바이트 또는 그 이상의 바이트를 이용해서 전체적인 문자열을 나타낼 수 있다.

Text Encoding

텍스트 인코딩은 우리가 어떻게 현존하는 많은 문자열들의 바이너리 형태로 나타낼 것인지 그 규격을 약속하는 것이 텍스트 인코딩이라 한다.

UTF-8(Unicode Transformation Format(8 bit))

가변 길이 유니코드 인코딩 방식이다. 즉, 길이가 정해져 있지 않고 필요에 의해서 길어질 수 있는 것을 말한다.

0개의 댓글