데이터 타입 - 문자형

hyuko·2022년 10월 28일
0

Java

목록 보기
2/26

Java에서의 데이터 타입중 문자형

  • char 예약어를 사용한다.
  • 간단히 문자 자료형의 선언과 출력에 대해 알아보고 시작한다.
    public class DataType02{
    	public static void main(String[] args){
       	// 기본 자료형 - 문자 자료형
           char name; // 변수의 선언 (메모리 안에 name이라는 공간을 할당한다.)
           char a;
           char initial;
           </br>
           // 값을 넣는 방법 (초기화 한다.)
           name = 'A';
           a = 'B';
           initial = 'C';
       }
    }
  • 기본적으로 문자자료형은 문자를 저장하기 위한 변수이다.
    char 타입의 변수는 단 한개의 문자만 저장할 수 있다.

    ※ 문자열 String과 헷갈리지 않아야 한다.

  • 이 문자들은 유니코드(정수)로 저장된다.
    이 문자들을 숫자로 얼마로 표현 할 것 인지를 모아 둔 것을
    문자세트 (character set)라고 한다.

    이 문자 세트의 종류로는(ASKII, Euc-kr, UTF-8, UTF-16)등이 있다.

    • ASKII(American Standard Code for information interchange) :
      미국 표준협회에서 제시한 표준 코드체계, 아스키 코드는 각 문자를 7비트로 표현하므로
      총 128개의 문자를 표현할 수 있다. ( 프린터나 전송 제어용/ 숫자/로마글자/
      도량형기호/문장기호)

    • Euc-kr : KS X 1001 와 KS X 1003을 사용하는 8비트 문자 인코딩, EUC의 일종
      대표적인 한글 완성형 인코딩이기 때문에 보통 완성형이라고 부른다.

    • utf-8 : 유니코드를 위한 가변 길이 문자 인코딩 방식중 하나
      켄 톰프슨과 롭파이크가 만들었다.
      utf-8 인코딩은 유니코드 한 문자를 나타내기 위해 1byte ~ 4byte까지를
      사용한다.

    • utf-16 : 2byte로 문자를 표현
      자바에서는 전 세계 표준인 유니코드사용 utf-16 인코딩을 이용한다



  • 용어 정리
    • 인코딩: 문자가 숫자로 변환되는 것(문자형 기준)
    • 디코딩: 숫자에서 다시 문자로 변환되는 것
    • 유니코드: 전 세계 표준으로 만든 문자 세트
profile
백엔드 개발자 준비중

0개의 댓글