시각화란 무엇인가?

John Bae·2023년 9월 8일
1

Visualization

목록 보기
1/2
post-thumbnail

최종 업데이트 일자: 2023년 9월 8일

1. 시각화란?

시각화(Visualization)는 데이터나 정보를 시각적인 형태로 표현하는 과정 또는 결과물을 말합니다. 시각화를 통해 숫자와 텍스트로 표현되는 정보를 그래프, 차트, 그림, 도표 등의 시각적 요소로 변환하고, 이를 통해 데이터 패턴, 관계, 추세 등을 쉽게 파악할 수 있습니다.

시각화를 하는 목적은 크게 3가지 입니다.

  1. 데이터의 이해: 우리가 보통 처음 받아보는 데이터는 엑셀과 같은 Table 형식의 데이터입니다. 이런 데이터는 한눈에 파악하기 어려운 특징을 가지고 있습니다. 따라서 이런 복잡한 데이터를 시각적으로 표현해서 데이터의 특성과 구조를 빠르게 파악하기 위해 시각화를 진행합니다.

  2. 판단과 의사결정: 데이터의 핵심 내용을 이해하고 앞으로 어떻게 분석을 진행할 지 계획을 짤 수도 있습니다. 시각화를 통해 추세, 이상치, 관련성 등을 빠르게 식별할 수 있습니다. 데이터를 시각적으로 표현하면 추후에 어떻게 모델링을 진행할 지 등과 같은 다양한 의사결정을 내릴 때 더 정확하고 효율적으로 판단할 수 있습니다.

  3. 인사이트 도출 및 보고: 모델링과 검증이 끝나고 나서 결과를 해석할 때 사용하기도 합니다. 또한 나중에 데이터 분석을 요구한 클라이언트들에게 보고할 때나 의견을 표현할 때 이렇게 시각화된 자료를 활용하여 자신의 의견과 결과를 효과적으로 전달할 때도 사용할 수 있습니다.

차트, 그래프, 지도, 다이어그램, 히트맵, 워드 클라우드 등 다양한 형태의 시각적 표현을 생성할 수 있습니다. 데이터 시각화는 데이터 과학, 비즈니스 분석, 보고서 작성, 연구 등 다양한 분야에서 활용되며, 정보를 보다 효과적으로 이해하고 활용할 수 있도록 도와줍니다.

2. 시각화하기 위한 도구

시각화를 하는 도구에는 여러가지가 있습니다. 일단 간단한 단계에서 시작하면 Microsoft Excel (https://www.microsoft.com/ko-kr/microsoft-365/excel) 에서 바차트(Bar Chart), 파이차트(Pie Chart)와 같은 다양한 시각화 도표들을 제공합니다. Excel을 이용하여 정말 빠르고 간단하게 시각화가 가능하지만, 데이터의 량이 많아질 때 느려지거나, 정말 단순한 시각화만을 제공한다는 단점 또한 존재합니다.

Microsoft에서도 더 다양한 시각화 도구를 제공하기 위해 PowerBI (https://powerbi.microsoft.com/ko-kr/)라는 툴을 제공했습니다. 또한 PowerBI의 강력한 경쟁자로는 Tableau (https://www.tableau.com/ko-kr)
라는 툴도 있습니다. 쉽고 빠르게 시각화가 가능하지만, 유료라는 단점이 있습니다.

마지막으로 Python이 있습니다. Python은 프로그래밍 언어이기 때문에 배우는 것이 상대적으로 어렵지만(타 프로그래밍 언어보다는 나름(?) 쉽습니다), 무료로 사용할 수 있으면서 상당히 큰 데이터도 처리가 가능합니다.

제가 앞으로 작성하는 글들에서는 시각화를 위해 Python을 활용할 것입니다. Python에서는 정말 다양한 라이브러리들을 활용하여 시각화를 진행할 수 있습니다. 가장 대표적인 예시로 Matplotlib이라는 라이브러리와 Seaborn이라는 라이브러리가 있습니다.

다음 글들부터 많은 라이브러리들과 함께 다양한 그래프를 그려보는 작업을 포스팅할 에정입니다.

profile
데이터를 공부하는 경영학도

0개의 댓글