+) 이진수의 음수 표현
십육진법 : 수가 15를 넘어가는 시점에 자리 올림을 하는 표현 방식
10부터 A, B, C, D, E, F(15)로 표현
구별 : 아래첨자(16)을 붙이거나(수학적) 숫자 앞에 0x를 붙여(코드상) 구분
십육진수를 이진수로 변환하기
이진수를 십육진수로 변환하기
기본 과제 p.65 3번
Q. 1101(2)의 음수를 2의 보수 표현법으로 구해 보세요.
A. 1101 > 0010 > 0011(2)
/
아스키 : 초창기 문자 집합 중 하나. 영어, 아라비아 숫자, 일부 특수 문자를 포함. 아스키 문자 집합에 속한 문자들은 각각 7비트로 표현되어 총 128개 문자를 표현할 수 있음
아스키 코드표
아스키 코드 : 아스키 문자에 대응된 고유한 수
확장 아스키 : 아스키 코드에 1비트를 추가한 8비트
한글 인코딩 방식
KS X 1001, KS X 1003이라는 문자 집합을 기반으로 하는 대표적인 완성형 인코딩 방식. EUC-KR 인코딩은 초성, 중성, 종성이 모두 결합된 한글 단어에 2바이트 크기의 코드를 부여
완성형(한글 완성형 인코딩) : 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 방식
조합형(한글 조합형 인코딩) : 초성, 중성, 종성을 위한 비트열을 할당해 그것들의 조합으로 하나의 글자 코드를 완성하는 인코딩 방식. 각 성에 해당하는 코드를 합해 하나의 글자 코드를 만드는 인코딩 방식.
문제점 : 모든 한글을 표현할 수 없다는 것. 문자 집합에 정의되지 않은 쀍, 쀓, 믜 표현 불가.
해결 방안 : CP949(EUC-KR의 확장 버전, 하지만 한글 전체를 표현하기에 넉넉하진 않음)
유니코드 문자 집합 : EUC-KR보다 훨씬 다양한 한글을 포함해 대부분 나라의 문자, 특수문자, 이모티콘까지도 코드로 표현 가능한 통일된 문자 집합
사용 방식 : 글자에 부여된 값 자체를 인코딩된 값으로 삼지 않고 이 값을 다양한 방법으로 인코딩 함. 이런 방식에는 크게 UTF-8, -16, -32 등이 있음. 이는 유니코드 문자에 부여된 값을 인코딩하는 방식
UTF-8