
URL 인코딩은 문자열을 URL에 적합한 형식으로 변환하는 과정을 말합니다. URL에 사용되는 문자들 중 일부는 URL 인코딩이 필요합니다. 예를 들어, URL에서 공백은 %20으로, 물음표는 %3F로 인코딩됩니다.
urllib.parse 혹은 requests를 이용하여 URL에서 허용되는 문자로 인코딩할 수 있습니다.
import urllib.parse
import requests
url = "hello=월드&URL=3C0D!ng"
print(urllib.parse.quote(url)) # hello%3D%EC%9B%94%EB%93%9C%26URL%3D3C0D%21ng
print(requests.utils.quote(url)) # hello%3D%EC%9B%94%EB%93%9C%26URL%3D3C0D%21ng
URL 디코딩은 URL에 대한 인코딩된 문자열을 원래의 ASCII 문자열로 변환하는 과정을 말합니다.
urllib.parse 혹은 requests를 이용하여 인코딩된 문자열을 읽을 수 있는 문자로 디코딩할 수 있습니다.
import urllib.parse
import requests
url = "hello%3D%EC%9B%94%EB%93%9C%26URL%3D3C0D%21ng"
print(urllib.parse.unquote(url)) # hello=월드&URL=3C0D!ng
print(requests.utils.unquote(url)) # hello=월드&URL=3C0D!ng