URL Encoding

장서연·2022년 1월 20일
0
post-thumbnail

웹사이트의 주소 뒤에 URL 파라미터를 넣어서 서버에 인자를 보낼 수 있다.

구글에 뭔가를 검색할 때,
https://www.google.com/search?q=banana+영어
이렇게 검색하면,

실제로는 아래와 같은 텍스트로 인코딩된다.

URL에는 아스키 코드의 문자집합만 사용할 수 있게되어있다.
그렇기 때문에 한글과 스페이스 등을 포함한 문자열을 banana+%EC%98%81%EC%96%B4 이렇게 아스키로 치환해서 서버로 전송하도록 하는 것이 URL Encoding이라는 것이다.

참고

utf8 everywhere

유니코드를 UTF-8같은 것으로 인코딩해서 사용!

유니코드란, 각 문자마다 숫자를 정해놓은 표이다. 그리고 UTF-8은 이것을 인코딩하는 방식이다.

  • 1000001 // 7비트만 쓰는 방식
  • 01000001 // 한 바이트로 쓰는 방식
  • 00000000 01000001 // 두 바이트로 쓰는 방식


유니코드의 각 문자마다 숫자가 다 주어져있기는 한데, 이 숫자들을 어떤 방식으로 컴퓨터에 0이랑 1로 집어넣는지를 결정하는 것이 인코딩 방식이다. UTF-8은 그 중에 하나인 것이고!

유니코드 이전에, 한글에 많이 쓰였던 'EUC-KR' 도 한글 표를 읽는 인코딩 방식이다.
유니코드란 문자열 셋의 인코딩 방식으로는 UCS-2, UCS-4, UTF-32, UTF-16, UTF-8등 여러가지가 있는데, 문자마다 적절한 바이트수를 차지하도록 해서 다른 방식들보다 일반적으로 적은 용량만 쓰면서도 호환 문제도 가장 덜 발생하는 UTF-8을 전세계적으로 가장 널리 사용한다.

앞으로 인코딩을 고를 일이 있으면, 웬만하면 UTF-8을 고르면 된다.

0개의 댓글