아스키, 유니코드, 인코딩

etc

목록 보기
9/19
  • ASCII(아스키) : 1byte, 영어 서유럽국가문자 처리 / 영문 알파벳을 사용하는 대표적인 문자 인코딩
    ↳ 2byte 이상의 다양한 코드들을 표현할 수 없기 때문에 현대에는 유니코드를 더 많이 사용함

  • Multi-byte char set (EUC-KR, KSC5601, MS949, SHIFT-JIS) : 2byte

    • 각 나라별 문자 조합
  • UNICODE : 2byte 체계의 표준 문자 조합 / 전 세계 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준

  • 문자 인코딩 : 사용자가 입력한 문자나 기호들을 컴퓨터가 이용할 수 있는 신호로 만드는 것.
    즉, 복잡한 신호를 0과 1의 디지털 신호(2진수)로 변환하는 것을 의미

  • UTF : 유니코드 문자를 인코딩하는 방식을 나타낸다.

    • UTF 는 몇 bit를 사용하여 index를 표현할 것인가를 뜻한다.
    • UTF-8 은 8bit를 사용해 1개의 index를 표현함

참고할 만한 자료

profile
백엔드를 공부하고 있습니다.

0개의 댓글