[시각화] 1. 데이터와 시각화 이해하기

hj choi·2022년 10월 7일
0

시각화

목록 보기
1/2

1.데이터 이해하기

1.1 '데이터' 시각화

  • 시각화를 진행할 데이터
    1. 데이터셋 관점(global)
    2. 개별 데이터의 관점(local)

1.2 데이터셋의 종류

  • 정형 데이터
  • 시계열 데이터
  • 지리 데이터
  • 관계형(네트워크) 데이터
  • 계층적 데이터
  • 다양한 비정형 데이터

1.2 데이터셋의 종류(정형데이터)

  • 테이블 형태로 제공되는 데이터. 일반적으로 csv, tsv파일로 제공

  • row 데이터가 1개 item

  • column attribute(feature)

  • 가장 쉽게 시각화할 수 있는 데이터셋

    • 통계적 특성과 feature 사이 관계
    • 데이터 간 관계
    • 데이터 간 비교

1.2 데이터셋의 종류(시계열데이터)

  • 시간 흐름에 따른 데이터를 Time-Series
  • 기온, 주가 등 정형데이터와 음성, 비디오와 같은 비정형 데이터 존재
  • 시간 흐름에 따른 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 등을 살핌

1.2 데이터셋의 종류(지리/지도 데이터)

  • 지도 정보와 보고자 하는 정보 간의 조화 중요 + 지도 정보를 단순화 시키느 경우도 존재
  • 거리, 경로, 분포 등 다양한 실사용

1.2 데이터셋의 종류(관계형(네트워크) 데이터)

  • 객체와 객체 간의 관계를 시각화
    • Graph Visualization / Network Visualization
  • 객체는 Node로, 관계는 Link로
  • 크기, 색, 수 등으로 객체와 관계의 가중치를 표현
  • 휴리스틱하게 노드 배치를 구성

1.2 데이터셋의 종류 (계층적 데이터)

  • 관계 중에서도 포함관계가 분명한 데이터
    • 네트워크 시각화로도 표현가능
  • Tree, Treemap, Sunburst 등이 대표적

1.3 데이터의 종류

  • 수치형(numerical)

    • 연속형(continuous) : 길이, 무게, 온도 등
    • 이산형(discrete) : 주사위 눈금, 사람 수 등
  • 범주형(categorical)

    • 명목형(nominal) : 혈액형, 종교 등
    • 순서형(ordinal) : 학년, 별점, 등급 등

시각화 이해하기

2.1 마크와 채널

  • 마크는 그래픽 이미지에서 가장 기본적인 요소이다.

    • 점, 선, 면으로 이루어진 데이터 시각화

  • 시각화 채널은 마크의 외관을 기하학적인 원시성의 차원과 무관하게 제어하는 방법이다.

    • 각 마크를 변경할 수 있는 요소들

2.2 전주의적 속성

  • Pre-attentive Arrtibute

  • 주의를 주지 않아도 인지하게 되는 요소

    • 시각적으로 다양한 전주의적 속성이 존재
  • 동시에 사용하면 인지하기 어려움

    • 적절하게 사용할 때, 시각적 분리(visual pop-out)

0개의 댓글

관련 채용 정보