자료형(data type) - 문자

일상 코딩·2022년 7월 26일

Java 프로그래밍

목록 보기
6/19

01.문자도 정수로 표현합니다.

  • 어떤 문자를 컴퓨터 내부에서 표현하기 위해 특정 정수 값을 정의
  • A65
  • 문자세트 : 각 문자를 얼마로 표현할 것인지 코드 값을 모아둔 것을 문자세트(charater set)라 함 (ex. ASKII, euc-kr, utf-8, utf-16)

참고

  • character set: 문자를 숫자로 변환한 값의 세트
  • encoding: 문자가 숫자로 변환되는 것
  • decoding: 숫자에서 다시 문자로 변환되는 것
  • ASKII code: 알파벳과 숫자 특수 문자등을 1바이트에 표현하는데 사용하는 문자세트
  • UNICODE: 전 세계 표준으로 만든 문자 세트
  • UTF-8: 1바이트에서 4바이트까지 다양하게 문자를 표현할 수 있음
  • UTF-16: 2바이트로 문자를 표현
  • 한글 유니코드 표

02.자바에서는 문자가 어떻게 표현되나요?

  • 자바는 문자를 나타내기 위해 전세계 표준인 UNICODE를 사용
  • utf-16 인코딩을 사용 (모든 문자를 2Byte로 표시)

03.문자형 변수 선언과 사용하기

  • 문자를 위한 데이터 타입 char ch = 'A';
  • 내부적으로 숫자료 표현되므로 숫자를 넣어도 문자가 출력될 수 있음 (ex. char ch2 = 66;)
package ch08;

public class CharaterTest {

	public static void main(String[] args) {
	    // 문자 A -> 숫자 65
		char ch1 = 'A';		
		System.out.println(ch1);
		System.out.println((int)ch1);
		
		// 숫자 66 -> 문자 B
		char ch2 = 66;		
		System.out.println(ch2);
		System.out.println((int)ch2);
		
		// 숫자 67 -> 문자 C
		int ch3 = 67;		
		System.out.println((char)ch3);
		System.out.println(ch3);
		
		// char ch4 = -66;  음수는 대입 할 수 없음
		// char ch5 = 123456; 2byte 크기 이상 넘어가는 숫자는 대입 할 수 없음
		
		char han = '한';
		char ch6 = '\uD55C'; // UNICODE (한)
	
		System.out.println(han);
		System.out.println(ch6);
	}
}

출력 결과

profile
일취월장(日就月將) - 「날마다 달마다 성장하고 발전한다.」

0개의 댓글