[TIL] Introduction to Data Visualization

ReadyMadeLife·2022년 2월 3일
0

Hi There 👋

네이버 부스트캠프 3주차 주제는 Data Biz, 즉 데이터 시각화를 배운다.

설 연휴가 끝나고 오늘 배운 내용은 데이터 시각화에 대한 기본 내용과 Bar, Line, Scatter Plot을 배웠고,

각 내용은 다음 포스트에 차근차근 서술해보려고 한다.

Introduction to Visualization

데이터 시각화란 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것이다.

데이터 시각화는 육하원칙과 비슷하게 목적, 독자, 데이터, 스토리, 방법, 디자인을 고려해야한다. (쓸데없이 있어보이려고 하면 안된다)

데이터 시각화는 "데이터""시각화"를 분리해서 이해할 필요가 있다.

데이터 시각화는 당연하게도 데이터가 필수적이고 어떻게 독자가 쉽게 이해할 수 있는지 시각화하는 방법도 데이터와 동일하게 중요하다.

데이터

데이터는 데이터셋 관점 (global), 개별 데이터 관점 (local) 에 따라서 어떻게 시각화를 진행하는게 좋을지 달라진다.

우선 데이터셋을 보면, 아래와 같이 분류할 수 있다. 이 중, 특징적인 부분을 서술하자면,

  • 정형 데이터
  • 시계열 데이터
  • 지리 데이터
  • 관계형 (네트워크) 데이터
    • 관계형 데이터는 시각화시 보기 힘드므로, 노드 배치, 색상 등 보기 쉽게 표현해야한다.
    • 보통 휴리스틱하게 노드 배치를 구성한다.
  • 계층적 데이터
    • 관계형 데이터 중 포함 관계가 분명한 데이터
    • tree, treemap, sunburst 등이 대표적이다.
  • 다양한 비정형 데이터

그리고 또 세부적으로 들어가자면, 아래와 같다.

  • 수치형 (numerical)
    • 연속형 (continuous) : 길이, 무게, 온도
    • 이산형 (discrete) : 주사위 눈금, 사람 수
  • 범주형 (categorial)
    • 명목형 (normial) : 혈액형, 종교
    • 순서형 (ordinal) : 학년, 별점, 등급

시각화

시각화는 MarkChannel로 구성된다.

  • Mark는 시각화를 하기 위한 요소, 즉, 점, 선, 면을 의미한다.

  • Channel은 위와 같은 마크를 변경할 수 있는 요소를 의미한다.

위 2가지 요소를 사용해서 적절히 사용해서 우리는 효과적인 시각화를 할 수 있다.

위와 같이 단순 점, 선, 면으로만 효과적으로 독자들에게 인지시켜줄 수 있는 이유는 바로 전주의적 속성 (Pre-attentive Attribute) 때문이다.

전주의적 속성은 따로 언급, 주의를 주지 않아도 저절로 인지하게 되는 요소를 의미한다.

이를 활용하면 250밀리 초 내에 차트나 장면에 대한 해석이 가능하다고 한다. 예시는 아래와 같다.

한 차트에 많은 전주의적 속성을 활용하면 좋지 않을까라고 생각할 수 있다. 하지만 동시에 사용하면 인지하는데 오히려 역효과가 발생한다.

따라서, 이를 적절하게 사용할 때, 시각적 분리 (visual popout)을 통해 효과적으로 독자에게 우리가 말하고 싶은 바를 전달할 수 있다.

profile
레디메이드인생

0개의 댓글