요즘 데이터 시각화에 대해서 알아보고 있습니다. 공간 정보에 관심이 많은데, 결국 이 분야도 데이터 시각화에 기초하고 있다고 생각했습니다. 어느 정도 데이터 시각화를 익히면 3D를 활용한 공간 정보도 잘 표현할 수 있지 않을까 하는 생각입니다. 그리고 D3를 배우면서 차트의 종류가 정말 많고, 각 차트들을 어떻게 활용할지 막막했습니다. 그래서 기본적으로 데이터 시각화란 무엇인지부터 정리하려고 합니다!
해당 내용은 다음의 AWS 링크를 참고하여 정리하였습니다!
AWS 데이터 시각화 >
📝 차트, 그래프 또는 맵과 같은 시각적 요소를 사용해 데이터를 표시하는 프로세스
데이터를 이해하기 쉽게 전달하기 위해 데이터를 구조화하는 것
데이터를 통해 전달하고자 하는 스토리, 목적을 정확하게 합니다.
적절한 데이터를 선별해야 합니다. 데이터 형식을 수정하고, 정리하고, 이상값을 제거하고, 추가 분석을 하는 등 데이터 시각화 이전에 데이터를 가공합니다.
가장 적합한 시각화 방법을 선택합니다. 데이터를 체계적으로 제시하는 효율적인 방법을 생각합니다.
차트와 그래프가 가장 일반적이지만 다양한 방법을 사용할 수 있습니다. 5가지 주요 유형에 대해 설명하겠습니다!
데이터: 선 그래프, 선 차트 또는 타임라인과 같은 선형 1차원 객체
여러 선을 사용하여 다양한 요인의 변화를 나타내는 꺽은선형 차트
데이터: 서로 다른 유형의 관련 데이터 간의 복잡한 관계
데이터를 그래프의 점으로 나타내는 산점도
산점도에 세 번째 데이터 요소를 추가하는 거품형 차트
다양한 크기의 단어를 사용하여 단어 빈도를 나타내는 워드 클라우드
데이터: 상위 항목에 대한 공통 연결점이 있는 항목 그룹 또는 항목 집합
정보 클러스터를 표시할 수 있는 데이터 트리
데이터: 둘 이상의 데이터 변수를 단일 2D 또는 3D 이미지로 나타낼 수 있는 데이터
둘 이상의 데이터 요소를 비교하고 일정 기간 동안 변화를 보여주는 막대 차트, 파이 차트 및 누적 막대 그래프
데이터: 실제 위치와 관련된 데이터
열 지도, 밀도 지도, 지도 도표 등
데이터 시각화의 장단점을 정리해본 것이 좋았습니다. 데이터 시각화를 할 때 어떤 기준을 가지고 해야할지도 생각해볼 수 있었습니다. 정확한 목적을 가지고 어떤 대상에게 보여줄 것인지 먼저 생각을 해보고 접근을 하되, 데이터를 의도적으로 편집하지 않고 여러 케이스들을 추가하여 편향된 결정이 아닌 보다 정확한 결정이 될 수 있도록 데이터 시각화를 해야한다는 것을 알았습니다. 이제 데이터를 효과적으로 시각화하는 방법에 대해서도 조사를 해보고 싶어졌습니다.ㅎㅎ