문자 인코딩이란 사람의 문자를 컴퓨터가 알아볼 수 있도록 바이너리 신호로 바꾸어 주는 것.
문자별로 숫자로 대응시켜서 그 숫자를 1000001 같은 컴퓨터 언어로 바꾸어준다.
유니코드란?
초창기에 미국에서 만들어진 아스키 코드가 있었는데 아스키 코드에는 미국에서 사용되는 숫자,알파벳만 들어있었기 때문에 한글이나 한자, 유럽 등에서 사용되는 확장자들도 표현할 수 없었다.
그래서 전세계 문자들을 넣어서 만든 것이 유니코드이다.
UTF-8 은 유니코드를 인코딩하는 방식이다. 유니코드에 각 문자마다 이진법 숫자가 대응되어 있긴 한데, 이 숫자를 컴퓨터에 어떻게 전달하느냐 를 결정하는게 인코딩 방식이다.
문자마다 적절한 바이트 수를 차지하도록 해서 다른 방식들보다 일반적으로 적은 용량을 쓰면서도 호환 문제도 가장 덜 발생하는 UTF-8이 전세계적으로 가장 많이 사용됨.
URL 인코딩은 URL에는 아스키 코드의 문자 집합만 사용할 수 있게 되어있는데, 스페이스바나 한글 등을 포함한 문자열을 약속된 방식으로 아스키로 치환해서 서버로 전송하도록 하는게 URL 인코딩이다.