다음 대시보드를 함께 봅시다. 몇 가지 유형의 차트가 있는지 아십니까?

6-1.gif
대시보드-출처:파인리포트

DT 시대에 우리는 매일 홍수처럼 밀려드는 해량 데이터를 받는데 그것들은 우리의 앞선 행동에 대한 피드백이지만 사람들은 데이터를 소화할 수 있는 능력은 제한되어 있습니다. 데이터 속의 의미를 어떻게 빠르게 파악하는가? 이럴 때에는 데이터 시각화 도구를 필요합니다.

6-2.jpg

이것도 왜 우리가 데이터 시각화 그래프를 만드는 이유입니다.

그러나 그래프의 유형이 무척 다양한데 어떻게 올바른 선택을 해서 "천 말디 말보다 한 번 보는 게 다 낫다"라는 효과를 볼 수 있을까요?

6-3.jpg

차트 유형

1. 데이터의 5가지 관계

이 부분은 지반 번에 얘기했던 지식입니다.
6-1.gif

앞서 언급한 5가지 관계는 간단히 아래와 같이 요약할 수 있습니다:

1.1 구성: 전체 백분율을 차지하다

1.2 비교: 프로젝트의 순의

1.3 추세: 데이터는 어떻게 시간의 흐름에 따라 변하는지?

1.4 분포: 프로젝트의 주파수 상황

1.5 관계: 변수 간의 관계

다음에 뎅데이터 시각화 도구-파인리포트로 14가지 유형의 차트를 알아보도록 하겠습니다. 국내 개인 사용자 체험판 무료 라이선스 배포할 수 있습니다

필요하시는 분들: 홈페이지에 확인해보세요

2. 차트 유형

2.1 막대그래프(BAR CHART)

막대그래프는 조사한 수를 막대로 나타내고 표에 비해 여러 항목의 수량을 전체적으로 비교하기 쉬워요. 사람의 눈은 높이 차이에 민감함으로써 집간 간의 데이터의 차이를 표현할 때, 최고가, 최저가, 종가 모두가 필요할 때 사용 된니다.

6-4.gif

적용:분류 데이터를 대비하기

한계:분루가 많으면 데이터 특성 전시를 못함

애플리케이션 시나리오:데이터 비교

2. 선 도표(LINE CHART)

선 도표는 좌표 축의 점들로 데이터를 나타내고, 이 점들을 연결하여 시간에 따른 데이터의 변화를 직선적으로 관찰할 수 있는 것입니다.

주의하셔야 될 것은 막대그래프보다 증가폭, 성장치가 더 적합하는데 절대치가 잘 맞지 않습니다. 그리고 선 도표의 데이터 기록 수가 2 초과해야 하고 빅데이터양의 추세를 비교 가능합니다. 동시에 동일한 그래프에서 최고 5개의 굴절선을 넘어서는 안 됩니다.

6-6.gif

적용: 질서 있는 카테고리,

한계:무질서한 카테고리는 데이터 특성을 전시하지 못함.

애플리케이션 시나리오: 시리즈 추세의 비교

4. 면적그래프(AREA CHART)

일반적으로 통계 그래프라고 하면 선 그래프나 막대그래프를 많이 사용한다. 그러나 선이나 점이 아닌 도형의 면적을 이용하여 통계 수치의 크기를 나타낼 수도 있는데 이를 면적그래프라 합니다.

면적그래프는 자료의 구분을 쉽게 하기 위해 적절한 색을 칠할 수도 있고 빗살무늬 등의 무늬로 면적을 표시할 수도 있다.

일반적으로 면적을 표시할 때 채울 색은 일정한 투명도를 가져야 합니다.통명도는 사용자가 서로 부동한 시리즈 간의 중첩 관계를 관찰하도록 도와드립니다.

6-8.gif

5. 원그래프/파이도(PIE CHART)

비례 관계를 구성할 때는 파이그래프를 사용하여 전체적인 이미지를 보여도고, 각 부분이 차지하는 전체의 백분율을 보여줄 수 있다.

파이그래프가 최대한 작용하도록 하기 위해서는 6가지 성분을 넘어서는 안됩니다. 서랍의 시선은 시계방향으로 관찰하는 것이 상대적으로 익숫하기 때문에 가장 중요한 부분을 12시 위치에 두어야 합니다. 만약에 특변한 중요한 부분이 없다면 크기별로 배열하는 것을 고려해야 합니다.

원그래프/파이도(PIE CHART)-출처:파인리포트

적용:데이터 분보 상황을 이해하기

6-10.gif

한계:분류가 많으면 많을수록 부채꼴이 작음으로 그래프를 보여줄 수 없음

애플리케이션 시나리오:직렬비

잠깐!! ATTENTION!

파이그래프는 적용되지 않는 경우:

파이그래프는 면적을 통해 데이터 변화에 전시하고 각 지표가 차지하는 비율이 비슷한 경우, 면적의 크기를 직관적으로 판단할 수 없으며, 이때 막대그래프는 더 좋은 선택입니다.파이그래프는 최소로 사용해야 하는 그래프이며, 모든 보고서에서 5%보다 적게 사용되어야 합니다.

잘못된 차트 유형:

6-11.png

적당한 차트 유형:

6-12.jpg

6. 산점도 (Scatter Plot)

산점도에서 데이터점의 분포를 살펴봄으로써 변수 간의 상관성을 초혼할 수 있습니다. 변수 간의 상호 관계가 존재하지 않으면 산점도에서는 이산점을 랜덤하게 분포하는 것으로 표현되다는 반면에 어떤 연관성이 있으면 대부분의 데이터점은 상대적으로 밀집되어 어떤 추세로 나타날 것입니다.

6-13.gif
산점도 Scatter Plot-출처:파인리포트

애플리케이션 시나리오:수치를 표시하고 비교하는 데 사용되어 추세 외에도 데이터 클러스터의 모양을 보여드리고 데이터 클라우드에서 각 데이터 지점의 관계를 나타낼 수 있습니다.

7. 바블 차트( Bubble Chart)

바블 차트는 데이터의 흐름을 평가하는 시스템 분석에 사용되어 있습니다. 계통도나 플로차트 대신 버블 차트를 사용하는 것은 각 부분 간의 구조적, 순차적 또는 절차상의 관계를 보여드리기 위해서입니다. 바블마다 부동한 색이나 라벨, 그리고 버블점 크기는 다 하니의 위도를 변영되어 있습니다. 일반적으로 사용률은 10%입니다.

바블 차트는 산점도와 비슷하며 다른 점은 바블 차트는 그래프에 크기를 표시된 변수를 별도로 너허 비교하는 것을 허용합니다.

6-15.gif

8. 방사형 그래프(RADER CHART)

방사형 그래프는 한 사이클 수치의 변화를 나타내는 데 사용될 수 있고 특정 대상 -주요 변수의 상대적인 관계를 나타내는 데도 사용됩니다. 방사형 그래프는 재무분석에서 자우 사용되고, 기업 부채 능력, 운영 능력, 영리 및 발전능력 등의 지표를 분석하기 위해서입니다. 여러 가지 분류된 데이터양을 좌표 축에 투영하여 한 항목의 다른 속성 특징을 대비시킵니다.

6-16.gif

적용:동일한 카테고리의 부동한 속성에 대한 종합적인 상황을 알아보거나 부동한 카테고리의 동일한 속성 차이를 대비하는 것

한계:분류가 너무 많거나 변수가 너무 많은 경우에는 혼란스러울 수 있다.

9. 프레임 다이어그램(FRAME DIAGRAM)

프레임 다이어그램은 트리 구조로 계층적 구조를 표시하는 시각화 방법의 일종으로 계층적 관계를 분명하게 보여줍니다.

6-18.png

10. 깔때기 도표(funnel plot)

깔때기 도표는 한층한층 분석하는 과정에서 사용됩니다. 이로써 총 값(맨 꼭대기)에서 무관심한 부분을 끊임없이 제거하고 결국 관심의 값을 얻는 과정입니다. 사다리꼴 면적으로 어떤 고리의 업무량과 위의 고리 사시의 차이를 표시합니다.

6-19.png

적용:업무 프로세스가 규범적이고, 주기가 길고, 고리가 많은 프로세스 분석에 많이 사용되며, 각 세션의 크기를 대비함으로써 직관적으로 문제점을 파악합니다.

한계:무질서한 카테고리 또는 프로세스 관계가 없는 변수.

깔때기 도표(funnel plot)-출처:파인리포트

11. 워드 클라우드 차트(Word Cloud Chart)

워드 클라우드는 데이터 중의 키워드, 개념 등을 직관적으로 파악할 수 있도록 핵심 단어를 시각적으로 돋보이게 하는 차트입니다. 빅데이터(bigdata)를 분석할 때 데이터의 특징을 도출하기 위해 활용합니다.

적용:대량 텍스트에서 키워드를 추출합니다.

한계:데이터 너무 적거나 데이터 구분이 뚜렷하지 않는 텍스트에 적용되지 않습니다.


6-21.gif

12. 간트 차트(Gantt chart)

간트 차트는 현대 기업 프로젝트 관리 분야에서 가장 광범위적으로 운영하는 차트입니다. 이 차트는 관리자가 작업 프로세스를 명확하게 파악할 수 있도록 지원함으로써 기업의 운영 효율성을 향상시킵니다.

6-22.gif

13. 지도/맵

지도는 구역 지도, 포인트 맵, 플로 맵 등 3가지로 나뉘고 색상을 사용하여 지도 파티션에 있는 특정 범위의 값의 분포를 나타내는 지도다.

구역 지도는 색으로 지도 영역에 어떤 값의 범위적인 지도를 나타내는 것입니다.

6-23.gif

포인트 맵은 지리적 배경에 똑같은 크기의 점을 그려 데이터의 지리적 분포를 표시하는 방법입니다.

이런 분포는 데이터의 전체 분포를 쉽게 파악할 수 있게 하지만 단신은 단일 특정 데이터를 살펴볼 필요하면 안 될 것입니다.

그런데 당신은 포인트를 대신 버블을 사용한다면 포인트 맵은 분포를 나타낼 뿐만 아니라 구역당 데이터 크기를 대충 비교할 수도 있습니다.

6-24.gif
플로 맵은 유출 구역과 유입 구역 사이의 상호작용 데이터를 나타냅니다.

플로 맵은 일반적으로 공간 원소의 기하학적 중심을 연결하는 직선으로 표시됩니다. 선의 폭이나 색상은 흐름 값을 표시합니다.

6-25.gif

플로 맵은 지리적 이전 분포를 설명하는 데 도움이 되며, 동적 선을 사용하면 시각적 혼란을 줄일 수 있습니다.

14. 열지도(heatmap)

열지도는 지리적 구역에 있는 각 점의 가중치를 나타내고 특별히 하이라이트 형식으로 방문객이 자무 방문하는 영역 및 방문객이 있는 지리적 영역을 표시합니다. 열지도의 색상은 일반적으로 밀도를 의미합니다.


6-26.gif

3. 요약

앞서 14가지 차트 유형의 간단한 소개를 언급했습니다. 당신이 데이터 시각화를 공부하려면 배우기 쉬운 소프트를 먼저 공부하기 좋을 것 같은데요.