책을 읽었다. 너무나도 감명깊은 나머지 친구에게 전화를 걸어 이 책을 소개하고싶다. 이 때 해야 할 일로 알맞은 것은?
1번을 선택하는 경우 친구는 이해심이 깊고 본인의 목소리가 성우 뺨치는 경우일지도 모르겠다. 그렇지만 대부분의 경우에는 2번이라고 가정하고 생각을 조금 더 풀어보려 한다.
자료는 쌓일수록 좋다고 한다. 자료를 다루는 전문가들은 자료의 전처리나 퀄리티를 따지겠지만 나같은 초보에게는 다다익선이다. 돈도 많을 수록 좋다.
그런데 이런 자료가 쌓이다보면 눈에 한 번에 안 들어온다. 숫자 다섯 개야 눈으로 보고 머릿속에서 숫자들이 보여주는 경향성을 읽어낼 수 있지만 5000개의 숫자가 들어왔다고 가정한다면, 그걸 한 번에 다 보고 자료가 가진 정보를 읽어낼 수 있는 사람은 드물 것 같다.
요약이 필요한 이유는 여기서 기인한다. 깔끔하게, 한눈에 보기 쉽게. 수많은 양의 자료가 가지고 있는 정보를 압축하는게 통계가 하는 일이고, 이걸 시각적으로 한번에 보여주는 게 그래프가 하는 일이다.
파이썬에는 자료를 다양하게 표현할 수 있는 시각화툴이 여러가지가 있다고 한다. 배우면서 정리할 겸 포스트로 느긋하게 정리해봐야겠다.