[Data Viz] 시각화의 요소

hyunsooo·2022년 10월 6일
0

Contents

  1. 데이터 이해하기
    1.1 데이터 시각화
    1.2 데이터셋의 종류
    1.3 데이터의 종류

  2. 시각화 이해하기
    2.1 마크와 채널
    2.2 전주의적 속성

데이터 이해하기

1.1 데이터 시각화

  • 데이터 시각화를 위해서는 데이터가 우선적으로 필요

  • 시각화를 진행할 데이터

    1. 데이터셋 관점 (global)
    2. 개별 데이터의 관점 (local)
  • 어떤 데이터들이 있는지, 어떤 내용을 전달할 수 있을지 확인하기

1.2 데이터셋의 종류

  • 정형 데이터

    • 테이블 형태로 제공되는 데이터로 일반적으로 csv, tsv파일

    • Row가 데이터 1개 item

    • Column은 attribute(feature)

    • 통계적 특성과 feature 사이 관계를 나타내기 좋음

    • 데이터 간 관계, 데이터 간 비교 가능

  • 시계열 데이터

    • 시간 흐름에 따른 데이터를 Time-Series라고 한다.

    • 기온, 주가 등 정형데이터와 음성, 비디오와 같은 비정형 데이터 존재

    • 시간 흐름에 따른 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 등을 살핌

  • 지리 데이터

    • 지도 정보와 보고자 하는 정보 간의 조화가 중요하다.

    • 지도 정보를 단순화 시키는 경우도 존재

    • 거리, 경로, 분포 등 다양하게 사용가능 함

  • 관계형(네트워크) 데이터

    • 객체와 객체 간의 관계를 시각화 (Graph, Network Visualization)

    • 객체는 Node로 관계는 Link로 표현할 수 있다.

    • 크기, 색, 수 등으로 객체와 관계의 가중치를 표현

    • 휴리스틱하게 노드 배치를 구성

  • 계층적 데이터

    • 관계 중에서도 포함관계가 분명한 데이터

    • Tree, Treemap, Sunburst등이 대표적이다.

  • 다양한 비정형 데이터


데이터의 종류는 다양하게 분류 가능

  • 대표적으로 4가지로 분류

    • 수치형(numerical)

      • 연속형(continuous): 길이, 무게, 온도 등
      • 이산형(discrete): 주사위 눈금, 사람 수 등
    • 범주형(categorical)

      • 명목형(nominal): 혈액형, 종교 등
      • 순서형(ordinal): 학년, 별점, 등급 등

시각화 이해하기

2.1 마크와 채널

  • A mark is a basic graphical element in an image

    • 점, 선, 면으로 이루어진 데이터 시각화
  • A visual channel is a way to control the appearance of marks, independent of the dimensionality of the geometric primitive.

    • 각 마크를 변경할 수 있는 요소들
    • Position, Color, Shape, Size 등

전주의적 속성

  • 변경시킬 수 있는 요소 중 우리가 주의를 주지 않아도 인지하게 되는 요소
  • 동시에 사용하면 인지하기 어려움

  • visual pop-out(시각적 분리)를 잘 사용하는 것이 중요

  • 기울기, 길이, 두께, 크기, 모양, 곡선, 색 등

profile
지식 공유

0개의 댓글