1장 시각화 인사이트 프로세스
DIKW
- Data
- 연구나 발견 결과인 일종의 기초자료
- 위계도 : 시각화
- Information
- 생산자와 사용자 관점에 따라 다름, 형태와 형식, 자기 조직화 되지 않은 일반적인 의미
- 위계도 : 디자인
- knowledge
- 다른 영역의 정보가 자기 조직화해 획득할 수 있는 것
- 위계도 : 맵핑
- Wisdom
- 자기 내면화한 지식이기 때문에 명시적인 언어로 상대방에게 전달 어려움
시각화와 인사이트
- 시각화 인사이트 프로세스 : 시각화를 통해 통찰을 추출하는 과정
- 탐색 (관계 발견)
- 모든 데이터는 기본적으로 하나 이상의 측정값, 하나 이상의 차원을 갖고 차원과 측정값는 분석형태에 따라 달라질 수 있다
- 데이터 구성원리
- 이벤트 기록 접근 (어떤 이벤트로 생성 구성 되었는지)
- 객체지향 관점에서 접근 (데이터 구조 설계 생성 후 통찰)
- 연결고리 확인
- 공통요소로 변환 (형태를 변환하여 연결고리)
- 탐색 범위의 설정
- 분석 (관계 규명)
- 평균에 대한 검정 및 추정 : t검정
- 비율에 대한 검정 및 추정 : F분포법, 직접 확률 계산법
- 분할표의 검정 : 카이제곱, Fisher 직접 확률 검정, 잔차 분석
- 변수간 상관관계 : 상관분석
- 변수간 선형/비선형 인과관계 및 강도 추출 : 회귀, 다중회귀, 로지스틱, 판별분석
- 결과에 영향을 끼치는 요인들 사이 관계 : 요인분석, 주성분 분석
- 대상 기준값에 따라 분류 및 다차원 공간 배치 : 군집분석, 다차원 척도법
- 패턴이 비슷한 측정값과 그렇지 않은 측정값 분류 : 대응 분석
- 시간의 흐름에 따라 변하는 데이터 : 시계열 분석
- 활용 (활용-통찰 검증 및 보안)
- 인사이트 발전과 확장
- 처음 살펴볼 때 : 보텀업
- 적용하는 과정에서 추가로 얻어낸 정보 : 탑다운
- 잘라보기 달리보기 내려다보기 올려다보기
2장 시각화 디자인
시각화 분류와 구분
-
데이터 시각화
- 그래픽 의미를 이용해 명확하고 효과적으로 커뮤니케이션 위함
-
정보 시각화
- SW시스템 라이브러리, DB 코드 같은 비수치정보, 인터넷 네트워크 관계 등 큰 범위 집합 시각적 표현
- 분기도, 수지도, 히트맵, 트리맵
-
정보 디자인
- 복잡하고 구조적이지 않은 기술 데이터를 시각적 표현
- 양적 정보 디자인은 데이터 객관적 비교해 인과관계를 왜곡 없이 전달 초점
-
인포그래픽
- 중요한 정보를 한 장의 그래픽으로 표현해 보는 사람들도 손쉽게 해당 정보 이해
- raw data를 취급하지 않음
- 정보형 메세지와 설득형 메세지
시각화 프로세스
빅데이터 시각화 프로세스 - 벤 프라이 7단계 방법론
- 원하는 데이터를 직접 획득하여 상호작용까지 모든 단계를 아우르는 프로세싱
- 정보 획득 : 파일 디스크 등 정보 수집
- 분해 : 의미를 바탕으로 카테고리화
- 선별 : 불필요한 정보 제거
- 마이닝 : 데이터 분석 및 정보 추출 알고리즘 도출
- 표현 : 얻은 정보를 효율적 표출 방법 연구
- 정제 : 정보를 시각적으로 정제
- 상호작용 : 정보를 다양한 시각에서 시뮬레이션
빅데이터 시각화 프로세스
1단계 : 정보구조화 = 데이터를 수집하고 정제
2단계 : 정보 시각화 = 분석 도구 그래프나 분석 도구 특성에 따른 시각화 ex) 태블로, power BI
3단계 : 정보 시각표현 = 분석 도구에서 만든 결과물에 별도 그래픽 요소 추가
시각화 방법
1. 정보구조화
- 정보의 조직화 : 분류 배열 관계 맺기
- 데이터 수집 및 탐색
- 데이터 분류하기 : 구분 텍스트(CSV, TSV), JSON, XML
- 데이터 배열하기 : LATCH (location, alphabet, time, category, hierarchy)
- 데이터 재배열 (사용자가 인식하기 쉽게 재배열)
2. 정보시각화
- 시간시각화 : 막대, 누적막대, 점그래프
- 분포시각화: 파이차트, 도넛차트, 트리맵, 누적 연속 그래프
- 관계시각화: 스캐터 플롯, 버블차트, 히스토그램
- 비교시각화: 히트맵, 체르노프 페이스, 스타차트, 평행 좌표계, 다차원 척도법
- 공간시각화: 지도 매핑
- 여러 변수 비교
3. 정보 시각표현
1. 그래픽 7요소
2. 그래픽 디자인 기본원리
- 타이포그래피
- 서체, 무게, 크기, 스타일, 색체, 간격
- 색상
- 그리드
- 상단 왼쪽부터 오른쪽 하단
- 정보의 역피라미드 : 가장 강력한 정보 맨위
- 망 그리드 : 일관성 및 정확하게 개체 배치, 디자인 쉬움
- 3등분 법칙 : 미학적 균형 및 역동성
- 아이소타이프
- 상징적 도형이나 정해진 기호를 조합해 시각적이고 직접적 방식
3. 인터랙션
- 데이터를 의미있고 이해할수있으며 유용한 기술과 방법인 인터랙션이 많이 이용되며 시각화 툴 자체가 인터랙션 형태
- 인터랙션 위에 구현된 정보 디자인은 비선형적, 정보제시 순서가 고정되지 않고 사용자가 임의로 접근 및 선택
4. 시각정보 디자인 7원칙
- 시각적 비교를 강화하라
- 인과관계를 제시하라
- 다중변수를 표시하라
- 텍스트, 그래픽, 데이터를 한 화면에 조화롭게 배치하라
- 콘텐츠의 질과 연관성 진실성을 분명히 하라
- 시간순이 아닌 공간순으로 나열하라
- 정량적 자료의 정량성을 제거하지 마라
빅데이터와 시각화 디자인의 방향
- 현재 데이터 시각화가 무엇이고 주체는 누구이며 회사의 직무도 많이 않음
- 최신의 기술과 도구를 사용해 분석
- 특정 시각화 기술이 줄 수 있는 한계에 대해서 이해
- 정보 디자인의 의도와 방향성이 목적과 어긋나지 않도록 하기
- 데이터의 범주 안에서 정보를 보고 사용자를 위한 시각화 목적 설정 및 끝까지 고수
- 정보형 메세지의 경우 적합한 데이터 수집 가공 그래프 연결 처리 전문성 필수
- 시각화의 아름다움에서 정보성이 결여된담녀 효율성과 참신성이 떨어짐
3장 시각화 구현
시각화 플랫폼
- Tableau, Gephi, ~~ Intelligence, ~~ Insight
시각화 라이브러리
- D3.js, Tangle, jQuery Visualize
인포그래픽스
- iCharts, Visualize Free, Visual.ly