우리가 사용하는 텍스트 데이터를 컴퓨터가 이해할 수 있는 형태로 변환하기 위해, 텍스트 데이터는 문자열로 나타내고 문자열은 다시 인코딩 과정을 거쳐야 합니다.
0과 1로 인코딩 된 문자열을 텍스트로 디코딩 할 때 코드 규약은 주로 UTF-8을 사용합니다. 특히 파이썬은 기본적으로 문자열을 UTF-8을 사용합니다.
텍스트 데이터의 변환 과정(Encoding, Decoding)은 여러 대의 컴퓨터에서 데이터를 교환하는 작업에서도 진행됩니다.
인터넷을 통해 사용자 컴퓨터와 구글의 서버 컴퓨터 사이 정보 교환 방법을 도식화한 그림을 봅시다.
데이터를 웹, 인터넷을 통해 얻습니다. 인터넷을 통해 데이터를 주고 받을 때는 어떤 규약에 따라 데이터를 교환하며, 이런 데이터 교환 과정에서의 규악을 프로토콜(protocol)이라 합니다.
프로토콜(protocol): 컴퓨터들 간의 원활한 통신을 위해 지키기로 약속한 규약. 프로토콜에는 신호 처리법, 오류처리, 암호, 인증, 주소 등을 포함한다.
웹은 HTTP라는 프로토콜에 따라 데이터를 주고 받습니다.
우리는 주로 웹을 통해 데이터를 원격으로 주고 받습니다. 이때 쓰이는 Text가 HyperText입니다. 프로토콜은 HTTP라고 정리하면 됩니다.
수많은 컴퓨터들 사이의 네트워크로 연결된 웹은 인터넷상에서 제공되는 서비스이고, 웹의 프로토콜인 HTTP 역시 인터넷 프로토콜인 TCP/IP를 기반으로 정의된 것입니다.