추상적인 것을 구체화 시켜 시각적으로 표현하는 것은 정말 매력적인 일로 느껴집니다.
디자인 전공으로 공부를 하면서 UI UX 디자인, 사람의 행동을 이해하고 플렛폼에 맞춰 편리한 디자인을 제공하는 것에 관심이 많았고 구현하는 것에 관심이 생겨 개발 공부를 하면서 디자인한 UI를 직접 개발해 보니 어렵지만 재미있었습니다. 최근 데이터 시각화를 하는 라이브러리인 d3.js 공부를 시작하면서 데이터에 대해 많은 관심이 생겨 정리합니다.

Data Visualizing

빅데이터 시대에 굉장한 규모의 수많은 정보가 쏟아지면서, 이 정보들 중에서 필요한 자료를 정리하고 다양한 분석 결과를 모두가 쉽게 알아볼 수 있도록 효과적으로 전달하기 위한 방식들을 고민하고있다.

데이터의 시각화는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하여 전달하는 과정을 말하는 것으로 다양한 시각화 방법을 통해 보는 사람의 흥미를 유발하고, 정보를 습득하는 시간을 단축 시켜 빠른 상황판단을 할 수 있게 돕는다. 무엇보다 정보에 대해 효과적으로 커뮤니케이션 할 수 있다.

"데이터를 사용해 의사결정을 내리는 사람들과 이들이 필요로 하는 데이터를 제공하는 IT 관계자 사이에는 커다란 간극이 있다. 데이터를 이해하는 사람과 조직에서 데이터를 분배하기 위해 갖고 있는 기술을 이해하는 사람을 찾기란 매우 힘들다. 그리고 두 가지를 모두 잘하는 사람은 더욱 찾기 어렵다"

"중요한 것은 데이터 시각화 기술이 아니라 비쥬얼 인식의 심리적인 부분을 아는 것"

"데이터 시각화의 본질 가운데 하나는 사물을 바라보는 방식을 바꿈으로써 의사결정권자들이 예전에는 질문하지 못했던 것을 하게 만드는 것이다. 성공적인 데이터 시각화가 이뤄지면, 사람들은 더 심층적인 질문을 하게 되고 이는 뛰어난 전략으로 이어져 궁극적으로는 기업에 도움이 된다"

데이터 시각화를 다룬다는 것

데이터 시각화를 다룬다는 것

  • 데이터와 사용자를 이해, 어떤 메시지를 전달할 것인지 결정

  • 메시지 전달에 필요한 핵심 내용을 제외한 나머지는 생략

  • 최선의 표현 방법을 결정

  • 단순, 명료, 정확한 커뮤니케이션을 위해 화면을 디자인

  • 데이터를 토대로 어떤 행동을 취해야 하는지에 대해 설명하라. 대부분의 양적 정보는 단순히 정보 전달뿐만 아니라 유용한 반응을 이끌어 내기 위해서 제시된다.

좋은 데이터 시각화에 필요한 특징

  • 어려운 문제 풀기를 즐기고 데이터를 받아드린다
  • 사용자와 사용자가 원하는 정보가 무엇인지에 대해 이해
  • 인내심을 갖고 새로운 도구나 디스플레이 표기방법의 차이에 대해 이해
  • 예술과 비주얼 디자인에 대한 이해와 관심

데이터를 잘 활용하는 방법

데이터 활용 역량은 크게 보면 데이터 분석시각적 스토리텔링이다.

데이터 분석 = 기술적으로 데이터를 수집하고 정제하는 데이터 가공 단계부터 분석 기법을 활용한 데이터 분석에 이르는 과정에 필요한 능력.

시각적 스토리텔링 = 데이터 분석 결과를 시각적으로 표현해 스토리텔링을 하는 능력.

최근은 데이터 시각화를 통해 두 가지 역량을 만족할 수 있게된다.
데이터 시각화는 기술적으로 데이터를 다루는 전문 역량이 없어도, 시각적 스토리텔링을 위한 디자인 역량이 없더라도 데이터를 활용한 인사이트 발굴, 스토리텔링을 할 수 있도록 돕는다.

효율적인 데이터 시각화는 형식과 기능 간의 섬세하고 균형 잡힌 작업으로, 아주 간단한 그래프는 지루하지만 강력한 요지를 전달할 수 있다. 반면, 아름답고 멋진 그래프는 비주얼이 뛰어나나 적절한 메시지 전달에는 완전히 실패할 수 있다.
데이터와 시각적 요소는 함께 연계되어야 하고, 훌륭한 분석을 휼륭한 스토리텔링과 결합하는 기술이 중요하다.

많은 양의 데이터를 한눈에 볼 수 있다

image.png

데이터 시각화는 많은 양의 데이터를 시각적 요소를 활용해서 요약해 표현한다. 한눈에 볼 수 없는 많은 양의 데이터를 한 번에 볼 수 있도록 하고, 빅데이터의 활용에 데이터 시각화가 강조되는 이유도 여기에 있다. 금융, 교통, 의료 등 빅데이터가 생산되는 다양한 분야에서 시각화 없이 데이터로 현상을 파악하고 예측하기 어렵다.

데이터 시각화에는 다양한 형태의 유형이 있는데 이들은 데이터가 의미하는 바를 쉽게 찾고, 이해할 수 있도록 돕는다. 우리는 차트에 활용된 도형의 크기, 위치나 색의 정도를 바탕으로 데이터를 크기를 비교하고, 분포를 파악하거나 관련성을 찾는다. 즉, 데이터 안에 숨겨진 유의미한 이야기, 데이터 인사이트를 발견할 수 있다.

데이터 시각화와 유사한 개념으로 언급되는 인포그래픽과의 차이를 알면, 왜 ‘데이터 시각화’를 해야 하는지 더욱 공감할 수 있다. 인포그래픽은 주로 정적인 형태의 차트 이미지로, 사용자에게 데이터 분석 결과에 대한 고정적인 메시지를 전달한다. 반면, 데이터 시각화는 정렬, 필터, 확대·축소 등의 인터랙티브 기능을 사용자에게 제공한다. 사용자는 이를 활용해 시각화 결과물과 상호작용 하며, 데이터를 탐색할 수 있다. 즉, 고정적인 데이터 인사이트를 수동적으로 수용하는 것이 아니라, 데이터 탐색을 바탕으로 자신만의 데이터 인사이트를 발견할 수 있는 것이다.
데이터 활용도를 높이기 위해서 데이터 시각화가 필요하다고 정리할 수 있다.

데이터 분석에 대한 전문 지식이 없어도, 누구나 쉽게 데이터 인사이트를 찾을 수 있다

인간은 매우 시각적인 동물이다. 인간은 자연적으로 시각적 입력을 다른 어떤 방법보다도 빠르게 인지하는데 그만큼 우리에게 시각이 중요하다는 의미이다. 보통 사람이 감각기관을 통해 획득하는 정보의 80% 이상이 시각을 통해 얻어진다고 한다. 우리에게 왜 데이터 시각화가 효과적인지 이해할 수 있다.

정확한 데이터 인사이트 전달을 위해서는 다양한 시각화 차트 중 어떤 유형이 적합한지에 대한 이해도 필요하다. 시각화 차트는 데이터를 어떤 목적으로 보여줄 것이냐를 기준으로 나눌 수 있고,
시각화의 기본적인 목적인 ‘비교’를 위해서는 막대 차트, 버블 차트 등을 사용한다. ‘시간 흐름에 따른 데이터의 변화’를 보기 위해서는 선 차트, 영역 차트, 타임라인 차트, 간트 차트 등을 사용한다.
전체 데이터 중 특정 항목이 차지하는 ‘비중’을 보기 위해서는 파이 차트, 트리맵 차트 등을 활용하고 데이터 간의 관계를 보기 위해서 산점도, 네트워크 시각화 유형을 한다. 위치 데이터를 포함한 경우, 지도 시각화 유형을 활용하면 지리적 배경 정보를 종합한 데이터 인사이트를 발견할 수 있다.

image.png

데이터 시각화 차트를 활용하고, 차트의 시각적 패턴을 근거로 한 스토리텔링은 사람들의 기억에 오래 남는다. 데이터를 기반으로 내가 찾은 인사이트를 다른 사람에게 강력하게 전달하기 위해서 시각화를 활용해야 한다.

정확한 데이터 인사이트를 전달하기 위해서는 시각화 차트를 만들 때 인지적 오류가 있지는 않은지 유의해야 할 필요가 있다. (‘데이터 시각화의 일반적인 실수 7가지’)

요약 통계보다 정확한 데이터 분석 결과를 도출할 수 있다

사람들은 일반적으로 데이터 시각화는 데이터 분석 결과를 다른 사람들에게 전달하기 위한 ‘보여주기’ 용도로 생각한다. 하지만 데이터 시각화는 단순히 데이터 분석 결과를 전달하기 위한 목적뿐만 아니라 정확한 분석을 위한 데이터 탐색 방법으로 활용된다. 즉, 데이터 분석 과정에서 시각화는 중요한 역할을 한다.

image.png

동일한 요약 통계(평균, 표준편차, 상관관계)를 가진 4개의 데이터셋을 산점도로 시각화하였을 때, 시각적 패턴이 명확히 다르다는 것을 입증한다. 이는 요약 통계 정보만으로는 데이터를 정확하게 볼 수 없다는 것을 의미한다고도 이해할 수 있다.

요약 통계만 믿지 말고, 데이터를 시각화하라!
– Alberto Cairo

효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다

데이터 활용 방안으로서 시각화는 첫 번째, 데이터 분석 과정 중 인사이트 도출을 위해 활용되고, 그다음으로는 데이터 인사이트를 많은 사람과 공유하는 데 활용된다. 보고서, 프레젠테이션 문서에 삽입된 시각화 차트는, 메시지 전달을 효과적으로 뒷받침하는 근거 자료로 역할을 한다.
시각화 자료는 사람들의 머릿속에 빠르게 인지되고 기억될 뿐만 아니라, 메시지의 스토리텔링에 대한 공감을 더 한다.

image.png

데이터 시각화 결과를 공유하는 또 하나의 방법은 데이터 대시보드를 활용하는 것이다.
데이터 대시보드란 여러 시각화 차트와 표 등으로 구성된 판(board)로, 중요한 데이터 지표(KPI)를 모니터링하는 용도로 사용된다. 대부분의 데이터 대시보드는 데이터 조회 기간을 선택하거나, 특정 기준으로 데이터를 필터링할 수 있는 인터랙티브 기능을 제공해, 이를 이용하면 사용자는 자유롭게 데이터 탐색을 할 수 있다.

데이터 대시보드의 활용은 기업 혹은 조직 단위에서 매우 유용하다. 다수의 조직 구성원이 공동의 데이터 대시보드를 공유하고, 각기 다른 관점에서 데이터를 탐색하고 인사이트를 도출할 수 있다. 특히 데이터 대시보드는 시각화 차트로 구성된다는 점에서, 조직 내 전문적인 데이터 분석 기술을 가진 분석가뿐만 아니라 그렇지 않은 사람까지도 데이터 활용이 가능하다. 이를 바탕으로 조직은 쉽게 발견하지 못했던 새로운 기회를 찾을 수 있고, 감이 아닌 데이터를 근거로 중요한 의사결정을 할 수 있다.

데이터와 스토리를 함께 활용하면 지적 측면과 정서적 측면 모두에서 관객과 공감할 수 있습니다.
– Stanford University Professor of Marketing Jennifer L.Aaker

데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다

대표적 사례는 정부의 데이터 개방 정책과 맞물려 데이터 활용 활성화 방법으로 제공되고 있는 시각화 서비스이다.
누구나 데이터 개방 포털에 접속해 개인이 보유한 데이터를 활용해 시각화 차트를 만들 수 있다.

산업 및 기업 차원에서는 보유 데이터의 활용도를 높이기 위해 데이터 시각화를 도입하고 있다. 사내 KPI 지표 등 성과 지표 추적, 데이터 기반의 마케팅 활성화 등을 위한 목적으로 데이터 대시보드를 구축하고 활용하는 것이 일반이다.

인공 지능 분야에서도 데이터 시각화를 활용한 시각적 분석을 시도하고, 인공지능 학습 결과를 시각적으로 보여주는 방법 등으로 활용하고 있다.

우리가 일상생활에서 데이터 시각화를 쉽게 접하고 있는 부분으로는 언론을 이야기할 수 있습니다. 언론은 데이터를 기반으로 한 스토리텔링에 방점을 두고, ‘데이터저널리즘’을 실현하는 데 데이터 시각화를 적극적으로 활용한다.

정리

데이터란 무엇인가 생각해보면 광범위한, 쉽게 알아볼 수 없는, 정보들의 모음이란 생각이 듭니다.
관련 정보들이 모여있는 집합으로 정보에 맞는 데이터를 시각적으로 표현해 보는사람에게 효과적으로 정보를 전달하는 역할은 굉장히 중요하고 매력적인 일로 느껴지는 것 같습니다. 앞으로 이런 데이터를 효과적으로 나타낼 수 있는 D3.js 자바스크립트 라이브러리를 차근차근 공부하며 효율적인 정보 전달 하는 방법을 공부할 예정입니다.

다음 시리즈 - D3.js 란

참조


http://www.bloter.net/archives/329334
10개의 최고 데이터 시각화 블로그