Data Viz 1강) 데이터와 시각화란?

한량·2021년 8월 9일
1

데이터 시각화란?

  • 데이터그래픽 요소매핑하여 시각적으로 표현하는 것
  • 데이터를 그대로 표현하는 것이 아니라 원하는 정보를 추출해서 보여줘야 하기 때문에 전처리, 흐름을 잘 알아야 한다

참고자료


시각화의 요소

데이터의 이해

  • 정형 데이터
    • 테이블의 형태로 제공되는 데이터
      일반적으로 csv, tsv 파일로 제공
    • row가 데이터 1개 item, column은 attribute(feature)
    • 가장 쉽게 시각화할 수 있는 데이터셋
      • 통계적 특성과 feaure 사이의 관계
      • 데이터 간 관계
      • 데이터 간 비교

  • 시계열데이터(Time-Series)
    • 시간 흐름에 따른 데이터
    • 기온, 주가 등 정형데이터와 음성, 비디오와 같은 비정형데이터로 존재
    • 시간 흐름에 따른 추세(trend), 계절성(seasonality), 주기성(cycle)등을 살핌

  • 지리/지도 데이터
    • 지도 정보와 보고자 하는 정보 간의 조화가 중요 + 지도 정보를 단순화 시키는 경우도 존재
    • 거리, 경로, 분포 등 다양한 실사용

  • 관계 데이터
    • 객체와 객체 간의 관계를 시각화
      • Graph Visualization / Network Visualization
    • 객체는 Node, 관계는 Link
    • 크기, 색, 수 등으로 객체과 관계의 가중치를 표현
    • 휴리스틱하게 노드 배치를 구성

  • 계층적 데이터
    • 관계 중에서도 포함관계가 분명한 데이터
      • 네트워크 시각화로도 표현 가능
    • Tree, Treemap, Sunburst 등이 대표적

데이터의 종류

  • 수치형(numerical)
    • 연속형(continuous): 길이, 온도, 무게 등
    • 이산형(discrete): 주사위 눈금, 사람 수 등
  • 범주형(categorical)
    • 명목형(nominal): 혈액형, 종교 등
    • 순서형(ordinal): 학년, 별점, 등급 등

시각화의 이해

  • 마크: 점, 선, 면으로 이루어진 데이터 시각화

  • 채널: 각 마크를 변경할 수 있는 요소들

  • 전주의적 속성(Pre-attentive Attribute)
    • 주의를 주지 않아도 인지하게 되는 요소
      시각적으로 다양한 전주의적 속성이 존재
    • 동시에 사용하면 인지하기 어려움
      적절하게 사용할 때, 시각적 분리(visual pop-out)
profile
놀고 먹으면서 개발하기

0개의 댓글