250508 TIL

수이·2025년 5월 8일

🟡 TIL

목록 보기
55/60
post-thumbnail

개인스터디

실습으로 배우는 태블로 1주차

BI(Business Intelligence)

  • 데이터 기반 의사결정을 돕는 분석 및 시각화 도구
  • 활용 사례: 통계청 인포그래픽, 아이폰 건강앱, 기상청 날씨예보

실무 활용

  • 워크플로우
    데이터 레이크 → 웨어하우스 → 마트 → BI 툴

    데이터 레이크 : 모든 Raw data
    데이터 웨어하우스 : 장기적 보존용으로 통합,정제,분석하여 정리한 저장소
    데이터 마트 : 부서별, 목적별 분석용으로 만든 웨어하우스의 일부분

  • 담당 역할

    • 데이터 엔지니어 → DW, DM 설계
    • 분석가/BI 분석가 → 대시보드 시각화
    • 경영진/PO → 대시보드 뷰어로 의사결정

Tableau 특징

  • 장점
    • Excel/CSV 등 다양한 포맷 지원
    • Drag & Drop으로 쉬운 시각화
    • 커뮤니티, 템플릿, 무료강의 등 다양
  • 단점
    • 대시보드 용량이 크거나 양이 많아지면 로딩 속도가 느려짐
    • 다른 BI툴과 비교해 가격이 비쌈

이외 툴

실습으로 배우는 태블로 2주차

태블로 구조

구성설명
Tableau Prep데이터 전처리
Tableau Desktop데이터 시각화
Tableau Cloud / Server공유 및 게시 플랫폼
  • Creator : 전체 권한 보유
  • Explorer : 대시보드 편집, 게시
  • Viewer : 접근 권한이 있거나 공유된 통합 문서 대시보드 보기만 가능

데이터 연결


  • 🟢 이 사이트 기반 : 기본 제공 데이터

  • 🟡 파일 : 데스크탑에서 파일 가져오기(csv, xlsx 등)

  • 🔵 커넥터 : 클라우드, 빅쿼리, DB 등 연동

  • 라이브 : 원본 파일이 바뀌면 연동됨

  • 추출 : 데이터만 로컬로 가져오는 것

    • Big Query 라이브 연결 시 과금될 수 있어 추출로 해서 연결
    • 데이터 크기가 큰 경우 유리(속도)

구성 및 기능

  • 워크시트 : 기본 작업공간
  • 대시보드 : 여러 워크시트 통합
  • 스토리 : 대시보드 + 설명으로 구성된 보고서(인포그래픽 형태)

  • 🔵 차원(dimension) : 측정 기준 또는 분석 기준
  • 🟢 측정값(metric) : 측정하는 값 또는 항목

  • 🔵 연속형 : 하나로 연결되어 이어진 데이터
  • 🟢 불연속형 : 이어지지 않고 각각 구분되는 개별적인 데이터


  • 계산된 필드 : 파생컬럼 생성

  • 매개변수 : 사용자 설정값 반영

실습

Superstore (기본 제공) 데이터 연동

csv 파일 연동

전처리

  • 필요없는 컬럼 버리기

  • 데이터 유형 변경

  • 관계 생성


  • 테이블 병합 방식

    • 관계(Relationship): 유연, 추천 방식
    • 조인(Join): SQL과 동일
    • 유니온(Union): 행 기준 병합
    • 블렌딩(Blending): 물리적 병합 없이 분석

Big Query 연동

  • 워드 클라우드 시각화

태블로 개인과제

필수 1 ) 데이터 연결 및 준비
WHR_2023.csv 데이터 연결

필수 2 ) Big Numbers

  • Happiness Score, GDP per Capita, Healthy Life Expectancy의 평균값을 나타내는 세 개의 Big Numbers를 만들어주세요.
  • 평균값을 소수점 둘째 자리까지 표시하고, 적절한 제목을 추가해주세요.
  • 각 시각화 별 별도의 Worksheet 에 작성해주세요.



필수 3 ) 지역별 비교 시각화 (Bar Chart)

  • Region별 평균 Happiness Score를 나타내는 Bar Chart를 생성해주세요.
  • 막대그래프에 Happiness Score를 내림차순으로 정렬해주세요.
  • 그래프에 각 값의 라벨을 추가하여 점수를 명확히 표시해주세요.

필수 4 ) 비교 분석 (Scatter Plot)

  • GDP per Capita와 Happiness Score 간의 관계를 분석하는 Scatter Plot을 생성해주세요.
  • GDP per Capita를 X축, Happiness Score를 Y축으로 설정해주세요.
  • Region(지역)별 색상을 추가하여 지역별 패턴을 비교해주세요.

필수 5 ) 대시보드 제작

  • 앞에서 제작한 Worksheet를 결합하여 대시보드를 제작해주세요.
  • 대시보드에는 다음 요소를 포함해주세요:
    • 제목: “세계 행복 보고서 대시보드”
    • 필수 1-4에서 만들었던 시각화를 추가해주세요.
    • 대시보드 필터:
      • Region 필드를 기반으로 모든 Worksheet에 적용되는 범위 필터
      • 다중값 (드롭다운)
    • 적절한 레이아웃과 시각적 일관성

도전 1 ) LOD Expressions을 활용한 분석

  • 지역(Region)별 1인당 GDP(GDP per capita)가 해당 국가의 지역 평균보다 높은지 여부를 나타내는 새로운 계산 필드를 생성하고 대시보드에 적용해주세요.
    • 이 값을 기준으로 평균 초과 또는 평균 미만 값을 표시하는 새로운 계산된 필드를 생성해주세요.
    • 이름은 “지역 평균 GDP 필터”으로 정의해주세요.

도전 2 ) 변수간 관계 분석

  • 필수 4: 비교 분석에서 여러 지표를 추가로 생성해주세요.
    • X축 평균, Y축 평균 값을 추가해주세요.
    • Trend Line(추세선)을 추가하여 관계를 시각화해주세요.


최종 완성본 ✨

일기

  • 태블로 4주차 ✅ 1-2주차 내용정리 ✅ 개인과제 ✅

우수프로젝트에 선정되었습니다 😶‍🌫️ 고생한 보람이 있다 있어~~ 발표 B반에서 극찬을 받은 조가 있다고 해서 아마 그 조가 수강생 투표 1등일 것 같다 싶긴 했는데 역시나였따

운영진 투표 결과가 크게 작용한 것 같은데 왕왕 뿌듯하고요.. 모두모두 감사합니다 ~ ~ 이번 프로젝트도 파이팅해봐야지

2개의 댓글

comment-user-thumbnail
2025년 5월 8일

우와아아 축하해요 수2님🥳 파이티잉💪💪

답글 달기
comment-user-thumbnail
2025년 5월 13일

역시 수이님이닷!!!!!!!!!!!!!!!!!!!!!!!!!!!! 포데이토의 자랑!!!!(은근쓸쩍 끼워넣기

답글 달기