빅데이터 시각화
빅데이터 시각화
- 빅데이터는 대규모 데이터가 존재하기 때문에 많은 양의 데이터를 직관적으로 전달할 수 있는 방법이 필요하다.
- 빅데이터 시각화는 빅데이터 분석을 통해서 얻은 결과를 누구나 이해하기 쉽게 시각적으로 표현하는 것이다.
시각화의 필요성
- 데이터 시각화는 많은 양의 데이터를 하나의 차트를 활용해서 전달할 수 가 있다.
- 많은 양의 데이터 중에서 중요한 데이터를 집중적으로 표현해서 차트에 대한 핵심적인 내용을 확인 할 수가 있다.
- 요약 통계보다 정확한 데이터 분석 결과를 도출하고 전달력이 좋아진다.
- 효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다.
정보 시각화 방법
- 정보 시각화는 수치, 색깔, 이미지 등을 활용해서 시각화할 수가 있다.
정보의 시각화
- 시간 시각화
- 분포 시각화
- 파이차트, 도우넛 차트, 트리맵, 누적 연속 그래프
- 관계 시각화
- 비교 시각화
- 히트맵, 스타차트, 평행 좌표계, 다차원 척도법
- 공간 시각화
시간 시각화
- 시간 시각화는 시간 흐름에 따른 변화를 보기 위해서 시각화 한다.
- 특히 연간 인구 증감, 년도별 환율 추이, 종합주가 지수 같은 곳에 활용될 수 있다.
- 네이버 주가(선 그래프)
관계 시각화
- 빅데이터는 통계적 분석기법을 사용한다. 통계적 분석깁버에서 상관성 분석기법을 사용할 수가 있다.
- 관계 시각화에서 상관성 분석은 2개의 연속변수 간의 분산을 확인해서 얼마나 평균으로부터 뭉쳐있는지 확인 할 수 있다.
- 버블차트 예시
공간 시각화
- 공간 시각화는 지도를 활용해서 공간에 대한 직관성을 높이기 위한 방법이다.
- 시각화를 통해서 지역정보를 확인할 수 있는 것이 특징이다.
- 공간 시각화 예시
분포 시각화
- 시계열 데이터와 매우 유사하다.
- 분포 시각화는 시간, 분류, 세부 분류, 가짓수 등으로 데이터를 분포하여 전체 분포, 최대, 최소 분포 등을 확인할 수 가 있다.
- 분포시각화 예시