무료 버전인 tableau desktop으로 학습을 진행하였습니다.
'BI(Buisiness Intelligence) 도구'는 데이터를 시각화하여, 기업의 의사결정에 도움을 주기 위해 활용됩니다. 보고서나 프레젠테이션에 사용하여 강조하고 싶은 내용을 어필할 수 있습니다.
데이터 분석가는 BI 툴을 적극적으로 사용하는데요. 타부서의 반복된 데이터 추출 요청에 대응하는 방법으로도 활용됩니다. 매일 변경되는 데이터를 타부서 에서도 쉽게 조회할 수 있도록 대시보드를 만들어 공유할 수 있습니다.
우선, 태블로(tableau)를 사용하기 위해서는 원본 데이터를 연결해야 합니다. 원본 데이터 연결방식은 다양합니다. 실습에서는 엑셀 파일을 연결하여 진행했습니다. 데이터가 자주 업데이트 되지않거나, 일회성 분석을 하는 경우에는 파일에 연결하여 작업을 합니다.
다른 경우도 있습니다. 데이터가 자주 업데이트 되거나, 혹은 매일 변경되는 수치를 확인하는 경우에는 다른 방식으로 원본 데이터를 연결합니다. 구글 빅쿼리와 같은 서버에 연결하기도 하고, 구글 스프레드 시트와 연결하여 작업을 수행하기도 합니다.
태블로(Tableau) 활용에 있어 기초적인 개념을 정리해보았습니다.
구분 | 내용 |
---|---|
차원 | 범주형 데이터 |
측정값 | 수치형 데이터 |
측정값을 차원으로 나누어 확인할 때, 보다 유의미한 인사이트를 도출할 수 있습니다.
예로 들어 매출, 선거 득표수, 교통사고 데이터(측정값)가 있습니다. 이 데이터를 범주형 데이터로(차원)으로 나누어 확인해보면 더 다채로운 분석이 가능해집니다.
연도별 매출, 성별 득표수, 지역별 교통사고 등 측정값만 있었을 때보다는, 더 유의미한 인사이트를 도출해낼 수 있습니다.
구분 | 연속형 | 불연속형 |
---|---|---|
표기 | 초록색 (Green Pills) | 파란색 (Blue Pills) |
정렬 | 오름차순, 내림차순 정렬 불가능 | 오름차순, 내림차순 정렬 가능 |
색상 | 그라데이션으로 반영 | 데이터에 각각 반영 |
태블로(Tableau) 좌측에 데이터 패널을 확인해보면, 차원과 측정값으로 데이터가 구분되어 있습니다. 그래서 차원은 파란색, 측정값은 초록색이라고 착각을 하는 경우가 많습니다. 하지만, 데이터 패널에 표기되어 있는 색상은 연속형 데이터와 불연속형을 구분하는 데 사용됩니다. 이 내용을 주의해주시기 바랍니다.
연속형 데이터는 초록색으로 표기되며, 명확하게 구분할 수 있는 데이터가 아닙니다. 그래서 정렬을 할 수도 없고, 색상을 적용해도 그라데이션으로 반영됩니다. 반대로 불연속형 데이터는 파란색으로 표기되며, 명확하게 구분할 수 있습니다. 그래서 정렬이 가능하며, 색상도 데이터 각각에 반영할 수 있습니다.
본 게시물은 패스트캠퍼스에서 "세계 3등에게 배우는 실무 밀착 데이터 시각화" 강의에 기반하여 작성되었습니다.