데이터 이해하기
1.1 데이터 시각화
1.2 데이터셋의 종류
1.3 데이터의 종류
시각화 이해하기
2.1 마크와 채널
2.2 전주의적 속성
데이터 시각화를 위해서는 데이터가 우선적으로 필요
시각화를 진행할 데이터
어떤 데이터들이 있는지, 어떤 내용을 전달할 수 있을지 확인하기
정형 데이터
테이블 형태로 제공되는 데이터로 일반적으로 csv, tsv파일
Row가 데이터 1개 item
Column은 attribute(feature)
통계적 특성과 feature 사이 관계를 나타내기 좋음
데이터 간 관계, 데이터 간 비교 가능
시계열 데이터
시간 흐름에 따른 데이터를 Time-Series라고 한다.
기온, 주가 등 정형데이터와 음성, 비디오와 같은 비정형 데이터 존재
시간 흐름에 따른 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 등을 살핌
지리 데이터
지도 정보와 보고자 하는 정보 간의 조화가 중요하다.
지도 정보를 단순화 시키는 경우도 존재
거리, 경로, 분포 등 다양하게 사용가능 함
관계형(네트워크) 데이터
객체와 객체 간의 관계를 시각화 (Graph, Network Visualization)
객체는 Node로 관계는 Link로 표현할 수 있다.
크기, 색, 수 등으로 객체와 관계의 가중치를 표현
휴리스틱하게 노드 배치를 구성
계층적 데이터
관계 중에서도 포함관계가 분명한 데이터
Tree, Treemap, Sunburst등이 대표적이다.
다양한 비정형 데이터
데이터의 종류는 다양하게 분류 가능
대표적으로 4가지로 분류
수치형(numerical)
범주형(categorical)
A mark is a basic graphical element in an image
A visual channel is a way to control the appearance of marks, independent of the dimensionality of the geometric primitive.
동시에 사용하면 인지하기 어려움
visual pop-out(시각적 분리)를 잘 사용하는 것이 중요
기울기, 길이, 두께, 크기, 모양, 곡선, 색 등