데이터 시각화

의미

  • 상대방에게 효율적으로 데이터의 의미를 전달하기 위함

  • 쉽게 이해할수 있고 커뮤니케이션에 초점
    cf. 가시화 : 보이지 않는 것을 보이게 함

  • 활용 :

    1. EDA : 탐색적 데이터 분석

    2. 가설검증

    3. KPI : 정기적인 모니터링
      https://www.tableau.com/ko-kr/learn/articles/types-and-examples-of-kpis

    4. 조직 내 보고

좋은 데이터 시각화

  • 많은 정보가 아니라 한 눈에 들어오는 정보를 전달
  • 불필요한 장식을 없애고 심플하게
  • 정확하게 비교할 수 있는 순서
    위치 > 길이 > 방향 > 각도 > 면적 > 부피 > 채도
    따라서, 막대차트(길이)가 일반적으로 사용
    -> 여백보다 폭이 넓어야 함. 파이(각도)차트나 영역(면적) 차트는 잘 사용되지 않음. 파이 < 도넛(길이와 텍스트까지) 차트 사용 多
  • 산포도는 가로 "원인" , 세로 "결과" -> 인과관계를 나타내지는 않지만 쉬운 해석을 위해
  • "시간"은 대부분 가로 축
  • 라인 그래프는 시간의 흐름을 나타낼 때

열과 행을 동시활성화 시키면 태블로 자체에서 추천하는 차트 존재

-여러개의 레이블을 사용하지 않는다. -> 최소값과 최대값 정도만

핵심개념

  1. 차원과 측정값
    • 차원 : 나눠서 볼 기준 (숫자를 자르는 기준)
      예) 지역, 연도, 성별
    • 측정값 : 값 (숫자)
      예) 매출, 수익
  2. 연속형과 불연속형

    불연속형 : 개별적으로 구분되는 데이터 , 올림/내림차순 정렬 가능, 머리글
    연속형 : 연속적 순서가 있는 데이터, 오름/내림차수 정렬 불가능, 축
    불연속형 : 파란색 / 연속형이 초록색

profile
비전공자 Will be 전문가

0개의 댓글