1. 문자도 정수 표현 가능
- 어떤 문자를 컴퓨터 내부에서 표현하기 위해 특정 정수 값을 정의
- A는 65
- 'A'를 인코딩하면 65
- 65를 디코딩하면 'A'
- 문자세트: 각 문자를 얼마로 표현할 것인지 코드값을 모아둔 것
- ASCII, euc-kr, utf-8, utf-16 등
2.자바에서의 문자표현
- 자바는 문자를 나타내기 위해 전세계 표주인 unicode 사용
- utf-16 인코딩을 사용(모든 문자를 2바이트로 표시)
3. 문자형 변수 선언과 사용
- 문자를 위한 데이터형 char ch = 'A';
- 내부적으로 숫자로 표현되므로 숫자를 넣어도 문자가 출력될 수 있음.
- 소스
public class CharacterTest {
public static void main(String[] args) {
char ch1 = 'A';
System.out.println(ch1);
System.out.println((int)ch1);
char ch2 = 66;
System.out.println(ch2);
int ch3 = 67;
System.out.println(ch3);
System.out.println((char)ch3);
char ch5 = '한';
char ch6 = '\uD55C';
System.out.println(ch5);
System.out.println(ch6);
}
}
참고
- character set: 문자를 숫자로 변환한 값의 세트
- encoding: 문자가 숫자로 변환되는 것
- decoding: 숫자에서 다시 문자로 변환되는 것
- ASCII code: 알파벳과 숫자 특수 문자등을 1바이트에 표현하는데 사용하는 문자세트
- UNICODE: 전 세계 표준으로 만든 문자 세트
- UTF-8: 1바이트에서 4바이트까지 다양하게 문자를 표현할 수 있음
- UTF-16: 2바이트로 문자를 표현
- 한글 유니코드 표