[시각화 정리 | Preview] 코드도 한 편의 글이다.

0

시각화 정리

목록 보기
1/1

📕 Kaggle notebook을 쓴다는 것은

머신러닝 혹은 데이터를 공부해본 사람이라면 Kaggle을 한 번쯤은 들어봤을 것이다. Kaggle에는 다양한 Dataset과 해당 데이터를 가지고 만든 자신의 코드를 담은 Notebook들이 있다. 독자들은 notebook들을 읽으며 좋은 글들에는 추천을 누른다. 결국, 이 역시 한 편의 글이라는 것이다.

notebook 작성 방법은 좋은 글을 작성하는 방법으로 귀결될 것이다. 독자의 입장을 고려하는 작문을 할 때 보통 좋은 글이 된다. 그리고 그 중 대표적인 방법이 적절한 시각 자료 배치라고 생각한다. "백문이 불여일견"이라는 말이 있듯, 적절한 시각화는 읽는 이의 이해를 돕고 긴장을 이완시켜준다.

📊 시각화 그중 데이터 시각화란

데이터 분석을 할 때, feature 개수는 많게는 수백개가 된다. 당연히 모든 것에 대해 시각화할 필요가 없다. 데이터 시각화는 그냥 하는 것이 아니다. 그 데이터를 시각화해야만 하는 이유가 있어야 한다.

필자 역시 데이터를 다루면서 시각화를 직접 구현해보기도 했다. 하지만 그럴 때마다 기계적으로 수행하기만 했지 "왜 해야 하는가"에 대해 깊게 생각하지 않았던 것 같다. '없으면 심심하니까' 혹은 '남들이 다 하니까'라는 생각으로 시각화를 진행해왔다.

시각화의 방향성 역시 독자를 향해있어야 한다. 데이터 시각화의 경우 해당 데이터를 직접 다룬 notebook의 저자와 간접적으로만 정보를 접한 독자와의 지식의 차이가 존재한다. 이 간극을 시각화를 통해 좁혀줘야 하는 것이다.

💡 좋은 데이터 시각화를 하고 싶다면

데이터 시각화는 보통 목적, 독자, 다루는 데이터, 스토리, 방법, 디자인 등을 고려해야 한다고 한다. 이 모든 것을 고려하는 것이 쉬운 일은 아니다. 데이터 시각화 실력을 기르고 싶다면 어떻게 해야할까?

신문사에서 교육을 받을 당시, 좋은 글들을 많이 읽어야만 그에 상응하는 글을 작성할 수 있다는 말을 자주 들었다. 좋은 데이터 시각화를 하기 위해서도 동일하다. 높은 평가를 받는 데이터 시각화를 자주 접하며 안목을 길러나가고 그 흐름을 익혀나가는 것이다.

아래는 필자가 네이버 부스트캠프를 하며 추천받은 시각화 사이트이다.

✏️ 나의 로드맵

본인 역시 시각화를 잘하는 편이 아니다. 글쓰기 실력이 한 순간에 늘지 않듯, 시각화 역시 부단한 노력이 필요할 것이다. 그렇기에 조금씩 시각화를 정리하는 포스트를 작성하며 실력을 기르고자 한다.

profile
프리미어와 IDE만 있다면 무엇이든 만들 수 있어

0개의 댓글