2022.05.24
문자는 프로그램에서 어떻게 표현할까?
문자도 정수로 표현한다!
어떤 문자를 컴퓨터 내부에서 표현하기 위해 특정 정수 값을 정의
A는 65
문자세트 : 각 문자를 얼마로 표현할 것인지 코드 값을 모아둔 것을 문자세트(character set)라고 한다 ex)ASKII, euc-kr, utf-8, utf-16 등
*참고하기
character set: 문자를 숫자로 변환한 값의 세트
encoding: 문자가 숫자로 변환
decoding: 숫자에서 다시 문자로 변환
ASKII code: 알파벳과 숫자, 특수 문자등을 1바이트에 표현하는데 사용하는 문자세트
unicode: 전 세계 표준으로 만든 문자 세트
utf-8: 1바이트에서 4바이트까지 다양하게 문자 표현 가능
utf-16: 2바이트로 문자를 표현자바에서는 문자가 어떻게 표현될까?
자바는 문자를 나타내기 위해 전세계 표준인 UNICODE를 사용
utf-16 인코딩을 사용(모든 문자를 2바이트로 표시)문자형 변수 선언과 사용
문자를 위한 데이터 타입 char ch = 'A';
내부적으로 숫자로 표현되므로 숫자를 넣어도 문자가 출력될 수 있음
char ch2 = 66;
출력결과 ch1을 정수(int)로 변환시 숫자가 출력되었고 char ch2 = 66 출력시 B가 출력되었다
유니코드를 이용하여 \uD55C 출력시 한 이라는 글자가 출력되었다