자료의 요약이란

[TBD]·2022년 2월 6일
0

책을 읽었다. 너무나도 감명깊은 나머지 친구에게 전화를 걸어 이 책을 소개하고싶다. 이 때 해야 할 일로 알맞은 것은?

    1. 친구에게 책 커버 앞면부터 바코드와 가격이 있는 뒷면까지 읽어준다.
    1. 친구에게 제목과 줄거리를 간단히 요약해준다.
    1. 해당이 없다. 나는 친구가 없기 때문

1번을 선택하는 경우 친구는 이해심이 깊고 본인의 목소리가 성우 뺨치는 경우일지도 모르겠다. 그렇지만 대부분의 경우에는 2번이라고 가정하고 생각을 조금 더 풀어보려 한다.

자료는 쌓일수록 좋다고 한다. 자료를 다루는 전문가들은 자료의 전처리나 퀄리티를 따지겠지만 나같은 초보에게는 다다익선이다. 돈도 많을 수록 좋다.

그런데 이런 자료가 쌓이다보면 눈에 한 번에 안 들어온다. 숫자 다섯 개야 눈으로 보고 머릿속에서 숫자들이 보여주는 경향성을 읽어낼 수 있지만 5000개의 숫자가 들어왔다고 가정한다면, 그걸 한 번에 다 보고 자료가 가진 정보를 읽어낼 수 있는 사람은 드물 것 같다.

요약이 필요한 이유는 여기서 기인한다. 깔끔하게, 한눈에 보기 쉽게. 수많은 양의 자료가 가지고 있는 정보를 압축하는게 통계가 하는 일이고, 이걸 시각적으로 한번에 보여주는 게 그래프가 하는 일이다.

파이썬에는 자료를 다양하게 표현할 수 있는 시각화툴이 여러가지가 있다고 한다. 배우면서 정리할 겸 포스트로 느긋하게 정리해봐야겠다.

profile
꿈꾸는 몽상가

0개의 댓글