python 바이트와 유니코드, encode

Haein Kim·2021년 9월 19일
0

TIL

목록 보기
3/14
>>> val = '객체'
>>> val
'객체'
>>> val_utf = val.encode('utf-8')
>>> val_utf
b'\xea\xb0\x9d\xec\xb2\xb4'
>>> type(val)
<class 'str'>
>>> type(val_utf)
<class 'bytes'>
>>> val_utf.decode('utf-8')
'객체'
>>> val_utf
b'\xea\xb0\x9d\xec\xb2\xb4'
  • 유니코드 인코딩을 알고 있으면 decode 메서드를 사용해서 되돌릴 수도 있다.

  • 파이썬 3.0부터는 아스키와 비-아스키 텍스트를 일관되게 다루기 위해 유니코드가 최상위 문자열 타입이 되었다.

  • 파이썬 구 버전에서 문자열은 유니코드 인코딩을 명시하지 않은 바이트였다.

profile
콘텐츠를 사랑하는 데이터 분석가

0개의 댓글