비트(Bit)
- Binary Digit의 약어이다.
- 정보의 최소 단위로 2진수 0 또는 1로 표현한다.
니블(Nibble)
- 4개의 비트가 모여 1개의 니블을 구성한다.
- 1니블로는 2^4가지의 정보를 표현할 수 있다.
바이트(Byte)
- 문자를 표현하는 기본 단위로, 8개의 비트가 모여 1바이트를 구성한다.
- 1바이트로는 2^8가지의 정보를 표현할 수 있다.
워드(Word)
- 한번에 처리할 수 있는 명령 단위이다.
필드(Field): 자료 처리의 최소 단위이다.
레코드(Record): 여러 개의 필드가 모여서 구성된 단위이다.
파일(File): 관련된 레코드의 집합이다.
데이터베이스(Database): 관련된 데이터 파일들의 집합이다.
(1) 문자의 표현
BCD 코드
- 하나의 문자가 2비트의 Zone 부분과 4비트의 Digit 부분으로 구성된다.
- 2^6가지의 문자를 표현할 수 있다.
- 영문 소문자는 표현할 수 없다.
EBBCDIC 코드
- 하나의 문자가 4비트의 Zone 부분과 4비트의 Digit 부분으로 구성된다.
- 확장 이진화 10진 코드로 BCD 코드를 확장한 형태이다.
- 2^8가지의 문자를 표현할 수 있다.
- 특수 문자 및 소문자 표현이 가능하다.
ASCII 코드
- 하나의 문자가 3비트의 Zone 부분과 4비트의 Digit 부분으로 구성된다.
- 2^7가지의 문자를 표현할 수 있다.
- 확장 ASCII 코드는 8비트를 사용한다.
- 주로 개인용 컴퓨터와 데이터 통신에서 사용한다.
유니코드(Unicode)
- 컴퓨터에서 세계 각국의 언어를 통일된 방법으로 표현할 수 있도록 고안된 국제 표준 코드이다.
- 한글, 한자, 영문, 숫자 모든 글자를 16비트(2바이트)로 표현한다.
① 세 개의 Zone 비트와 네 개의 Digit 비트로 하나의 표현한다.
② 데이터 통신용으로 사용하며, 128가지의 문자를 표현할 수 있다.
● 2비트의 에러 검출 및 1비트의 에러 교정 비트를 포함한다.
→ 아스키코드는 1비트를 확장하여 에러 검출 비트를 포함할 수 있지만, 2비트의 에러 검출은 불가능하다.
④ 확장 ASCII 코드는 8비트를 사용하여 문자를 표현한다.
① 확장 이진화 10진 코드로, BCD 코드를 확장한 것이다.
② 특수 문자 및 소문자 표현이 가능하다.
③ 4비트의 존 부분과 4비트의 디지트 부분으로 구성된다.
● 최대 64개의 문자 표현이 가능하다.
→ EBCDIC 코드는 8비트로 구성되어 최대 256개의 문자를 표현할 수 있다.
① 세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약의 이름이다.
● 8비트 문자 코드인 아스키(ASCII)코드를 32비트로 확장하여 전 세계의 모든 문자를 표현하는 표준 코드이다.
③ 한글은 조합형, 완성형, 옛글자를 모두 표현할 수 있다.
④ 최대 65,536자의 글자를 코드화할 수 있다.
① EBCDIC 코드는 4개의 Zone 비트와 4개의 Digit 비트로 구성되며, 256개의 문자를 표현할 수 있다.
● 표준 BCD 코드는 2개의 Zone 비트와 4개의 Digit 비트로 구성되며, 영문 대문자와 소문자를 포함하여 64개의 문자를 표현할 수 있다.
→ BCD 코드는 6비트로 구성되며 64개의 문자를 표현할 수 있지만, 영문 소문자는 표현할 수 없다.
③ 해밍 코드는 잘못된 정보를 체크하고 오류를 검출하여 다시 교정할 수 있는 코드이다.
④ 유니코드는 전 세계의 모든 문자를 2바이트로 표현하는 국제 표준 코드이다.
① 부호 비트 이외의 정수 부분을 그대로 표현하는 부호화 절대치 방식이 있다.
● 부호를 포함한 모든 비트를 1은 0으로, 0은 1로 바꾸는 0의 보수 방식이 있다.(1의 보수 방식이다)
③ 부호화 절대치에서 부호 비트 이외의 비트를 반대로 취하는 부호화 1의 보수 방식이 있다.
④ 1의 보수의 오른쪽 마지막 비트에 1을 더해 표시하는 부호화 2의 보수 방식이 있다.