공부 내용
데이터 이해
데이터 시각화
-
데이터 시각화를 위해서는 데이터가 필요
-
데이터 시각화 관점
- 전체 데이터셋 관점(global)
- 개별 데이터 관점(local)
데이터셋 종류
정형 데이터
- 테이블 형태로 제공되는 데이터
-> csv, tsv 파일 형태
- Row : 데이터 1개 item
- Column : attribute(feature)
시계열 데이터(Time-Series)
- 시간 흐름에 따른 데이터
- 데이터 형태
- 정형 데이터 : 기온, 주가 등
- 비정형 데이터 : 음성, 비디오 등
- 시간 흐름에 따른 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 등 시계열적 특성 확인
지리/지도 데이터
- 지도 정보와 확인하고자 하는 정보 간의 조화가 중요
- 지도 정보를 단순화 시키는 경우도 있음
- 거리, 경로, 분포 등 다양하게 사용
관계 데이터
- 객체와 객체 간의 관계 시각화
-> Graph(Network) Visualization
- 객체는 Node, 관계는 Link로 표시
- 다른 데이터도 관계가 있다면 관계 데이터로 표현 가능
- 크기, 색, 수 등으로 객체 사이의 가중치 표현
- 노드 배치할 때 휴리스틱 방법 많이 사용
데이터 출처 : http://www.martingrandjean.ch/network-visualization-shakespeare/
계층 데이터
- 관계 중에서도 계층을 가진 데이터
- ex) 회사 조직도, 가계도 등
- 네트워크 시각화로도 표현 가능(하지만 계층 존재)
- Tree, Treemap, Sunburst 등 사용
데이터 종류
대표적으로 4가지로 분류
- 수치형(numerical) : 수로 표현 가능
- 연속형(continuous) : 연속적인 데이터
- 이산형(discrete) : 한 단위가 하나의 값인 데이터(절대적인 수치)
- 범주형(categorical) : 텍스트로 표현
- 명목형(nominal) : 순서가 중요하지 않은 데이터
- 순서형(ordinal) : 순서가 중요한 데이터
시각화 이해
마크와 채널
- 마크는 그래픽 이미지에서 기본적인 요소
-> 점, 선, 면으로 이루어짐
- 채널은 마크에 대해 다양성을 줄 수 있는 요소들
-> 위치, 색깔, 모양, 크기, 기울기 등
전주의적 속성(Pre-attentive Attribute)
- 주의를 주지 않아도 인지하게 되는 요소
-> 다양한 전주의적 속성 존재
- 동시에 여러 속성 사용하면 인지하기 어려움
-> 적절히 사용하여 시각적 분리 해 줘야 함(visual pop-out)