[CS] 영상후기 - 비트와 바이트 문자인코딩 개념 정리 🙆‍♀️ | 컴공 기본 상식 가좌아 (메가와 메비의 차이를 알고 있뉘?)

0

movie

Bit와 Byte

컴퓨터는 0과 1의 조합으로 이루어진 정보를 처리
Bit : 컴퓨터가 처리할 수 있는 가장 작은 단위의 정보를 나타내는 것 (0 또는 1의 정보를 담을 수 있음)

Bit를 여러 개 묶어서 많은 데이터를 저장할 수 있음

1bit는 2가지의 정보를 담을 수 있음
2bits는 22(4)가지의 정보를 담을 수 있음
3bits는 2
2*2(8)가지의 정보를 담을 수 있음
...
8bits는 2^8(256)가지의 정보를 담을 수 있음

프로그래밍에서 데이터를 처리할 때 기본적인 단위 1Byte = 8bits(0~255)

숫자는 2로 나눈 나머지를 통해 표현할 수 있음
'A'와 같은 문자는 아스키코드를 통해 표현할 수 있음
한글과 같은 다양한 문자는 유니코드를 통해 표현할 수 있음

프로그래밍에서 변수를 선언할 때, 어떤 데이터타입이냐에 따라서 메모리에 얼마나 크게 공간이 확보되는지 정해짐
-> 데이터타입을 알맞게 선택해서 효율적으로 사용


1Byte 이상의 크기들

운영체제에서 크기를 확인할 때 사용
1KB = 1024Byte (2^10 Bytes)
1MB = 1024KByte (2^20 Bytes)
1GB = 1024MByte (2^30 Bytes)
1TB = 1024GByte (2^40 Bytes)

외장 디스크, usb의 크기를 확인할 때 사용
1KB = 1000Byte (1000 Bytes)
1MB = 1000KByte (1000^2 Bytes)
1GB = 1000MByte (1000^3 Bytes)
1TB = 1000GByte (1000^4 Bytes)

1KB에 대해 Byte의 크기가 다르므로 IEC에서 새롭게 지정
10진수에 대한 것은 그대로 두고, Binary에 대해 부를 때는 bi를 넣어서 부름
kibibyte 1KB = 1024Byte
mebibyte 1MB = 1024Byte


텍스트 인코딩

현존하는 문자열들을 binary로 나타낼 규격을 약속하는 것

언어마다 다양한 텍스트 인코딩이 존재
-> 서로 다른 인코딩 규격으로 웹사이트가 깨지거나 한글 문서가 읽어지지 않는 문제 발생
-> 해결하기 위해 UTF-8(Unicode Transformation For mat) 사용

UTF-8
아스키, 유니코드를 나타낼 수 있는 텍스트 인코딩
가변길이 유니코드 인코딩 (필요에 의해 길어짐

profile
초심 잃지 않기

0개의 댓글