유니코드에 대해서 학습했다. 유니 코드는 전 세계의 모든 문자를 컴퓨터에서 모두 표현하고 다룰 수 있도록 만든 표준이다. 유니코드 협회에서 제정한다고 한다. 이 표준에는 문자 인코딩과 정보 데이터베이스와 알고리즘을 포함하고 있다. 유니코드를 사용하기 전에는 표현 방법이 일정하지 않아서 읽고 불러오고 쓰기가 제한되어 있었다. 그러다가 많은 언어를 표현할 수 있는 유니코드를 많이 사용하고 있다. UTF-8, UTF-16 이런 텍스트 양식을 본적이 있을 것이다. 이것이 유니코드 형식이다. 한글은 UTF-8을 사용하고 있다. UTf-8과 UTF-16은 인코딩 방식이 다르다. 인코딩은 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것을 인코딩이라고 한다. 그리고 컴퓨터가 이용할 수 있는 신호를 사람이 이해할 수 있게 만드는 것을 디코딩이라고 한다.
개발 공부를 하기 전에 메모장을 이용할 때 저장 인코딩 방식을 정해서 저장했던 기억이 있다. 우선 영어는 ASCII 로 하고 한글은 UTF-8로 저장하라는 인터넷의 글을 보고 그대로 한적이 있었다. 당시에는 그 저장방식이 무슨 의미인지 인코딩은 뭔지도 모르고 그냥 하라는대로 했었는데 오늘 공부하고 나서 보니 무슨 이유로 그 저장 방식을 선택하는지 알 수 있었다. 모든 인코딩 방식을 다 아는 것은 아니지만 그래도 적어도 UTF-8의 인코딩 과정은 이해할 수 있어서 재미있었다. 과정에 이유를 생각하기엔 너무 많은 것을 알아야 하기 때문에 받아들이면서 넘어간 부분이 있다. 요즘은 그냥 받아들이는 것이 필요할 때가 있는 것을 많이 느낀다. 정말 넓은 분야와 한없는 깊이의 학문이기에 더 어느정도는 받아들이는 것이 중요하다는 것을 체험하고 있다. 그래서 중간을 다 이해하지 못한 부분도 있지만 계속 된 공부로 메워지는 순간이 올거라고 생각한다.