실습으로 배우는 태블로-1

오정연(DATA_2기)·2024년 6월 30일
0

태블로

목록 보기
1/3
post-thumbnail

https://teamsparta.notion.site/75e97c9bbb44477d9bbd691fcf20b615

Tableau와 친해지기

Tableau 소개



태블릿 백서(참고)
https://www.tableau.com/ko-kr/learn/whitepapers

데이터 연결와 전처리하기

데이터 연결 방식

기본 제공 데이터, 파일(csv, xlsx 등), 커넥터(클라우드, 빅쿼리, DB 등 연동) 3가지를 활용합니다.

데이터 원본 연결 형태

커넥터 연동시 특히 SQL 쿼리를 사용할 경우, 라이브 연결 대신 추출 연결로 선택하는 것이 태블로 대시보드 만드는 시간을 줄일 수 있어요!

csv 파일 연동

🏡 실습 데이터 다운(보스턴 지역의 에어비앤비 데이터)

➡️ Airbnb Dataset

3가지 csv 파일을 모두 다운 받아주세요!

  • calendar.csv: 해당 날짜의 가격과 예약 가능한 일수 데이터
  • listings.csv: 전체 ****숙소 데이터
  • reviews.csv: 숙소 리뷰 데이터

[실습] 데이터 전처리하기

  • 컬럼 숨기기
    태블로는 데이터 원본을 연결하면 원본의 컬럼을 삭제할 수 없어요. 실습에서 사용 안하는 컬럼들은 숨기기 기능을 활용해봅시다!
    ⬇️ 아래 컬럼들을 숨겨주세요❗️
    'listing_url', last_scraped', 'scrape_id', 'thumbnail_url', 'medium_url',
    'picture_url', 'xl_picture_url', 'host_thumbnail_url', 'host_picture_url'

  • 데이터 유형 변경 예시

[연습 문제] 테이블 관계 만들기

  • 테이블 병합 방식❗️

총 4가지 종류(관계, 유니온, 조인, 블렌딩)의 병합 방식이 있어요~🙂

  • 관계: 조인과 달리 관계는 하나의 테이블로 병합하지 않고 테이블간 관계를 설정해서 뷰에서 필드를 사용할 수 있어요.
    조인보다 유연하고 동적인 방법으로 효율적이에요. 실무에서는 조인보다 관계를 많이 활용합니다!
    참고 - 관계와 조인의 차이점
  • 유니온: 테이블 구조가 같은 형태인 경우, 유니온으로 테이블을 병합할 수 있어요. SQL UNION과 비슷한 개념입니다.
    2023년 10월, 2023년 11월, 2023년 12월 판매 데이터(테이블 구조가 동일한 형식)를 유니온으로 3가지 테이블을 병합할 수 있어요.
  • 조인: 테이블은 항상 하나의 테이블로 병합됩니다.
    SQL의 조인과 비슷한 개념으로 Left join, inner join 등 종류가 있어요. 2개 이상의 테이블을 하나의 테이블로 연결하도록 병합합니다.
  • 블렌딩: 물리적으로 테이블을 병합하지 않고, 워크시트 화면에 두 테이블이 같이 있는 형태입니다. 블렌딩은 하나의 테이블을 병합하는 것이 아니라 서로 다른 데이터 베이스에서 데이터를 불러오고 임시로 분석할때 사용하는 방법이에요!
**💁 [연습 문제] 3가지 csv 파일 연동하기 실습에 이어서 데이터 원본 탭에서 3가지 데이터베이스간 관계(Relation)를 만들어봅시다!

✅ listings 테이블의 공통키를 중심으로 3가지 테이블의 관계를 만들어주세요!**


커넥터 연동: 구글 빅쿼리 (선택)

*구글 클라우드 GCP 빅쿼리 계정이 필요해요. 매월 무료 데이터 1TB 제공합니다. 신규 계정의 경우, 무료 크레딧 300달러 제공됩니다.

(유료 계정의 경우, 과금을 주의해주세요!)

[실습] 빅쿼리 공개 데이터 연동하기

Tableau Server에 구글 빅쿼리를 연결합니다.

*참고: 구글 빅쿼리 공개 데이터셋 문서

[실습] 워드 클라우드 시각화 맛보기

[실습] 셰익스피어의 워드 클라우드 시각화
아래 요구 사항을 드래그앤 드랍해주세요!

📍 요구 사항
✅ 텍스트: Corpus
✅ 크기: 카운트(shakespeare)
✅ 색상: 합계(Word Count)


corpus 는 텍스트 혹은 레이블에
shakespeare 은 크기 에 넣으면
트리맵 차트 형식이 나옴.

여기서 텍스트로 변경하면 워드 클라우드형식으로 나옴

Tableau 구성 및 기능 소개

Tableau 구성


(2) 마크 활용법

📍마크는 색상, 크기, 텍스트, 세부정보, 도구 설명으로 이루어져 있습니다.

도구설명은 이렇게 편집을 할수있어

이렇게 마우스오버를 하면 정보가 표시가 되는!

Tableau 기능과 용어

차원(dimension) vs 측정값(metric)

측정값은 집 계함수(SUM, AVG, COUNT 등)를 활용해서 계산하고 비교합니다.


차원과 측정값은 열이나 행에 드래그앤드롭으로 활용

연속형과 불연속형

계산된 필드

기존 컬럼을 계산해서 새로운 컬럼을 생성합니다. 계산된 필드를 사용하면 데이터 원본에 있는 데이터에서 새 로운 필드를 만들 수 있어요!

상단 분석 → [계산된 필드 만들기]를 활용할 수 있습니다~🤓
실무에서 많이 사용하고 계산된 필드를 활용하여 지표를 선정을 하거나 지표에 대한 기준이 변경이 되거나 이럴때 계산된 필드로 활용해 지표에 대한 작업을 함 그래서 실무에서 많이 사용.



매개변수

계산, 필터 또는 참조선에서 상수 값으로 대체할 수 있는 숫자, 날짜 또는 문자열과 같은 통합 문서 변수를 말합니다. 매개변수는 사용자가 대시보드와 워크시트의 데이터를 필터링하거나 조정할 수 있는 기능입니다! 계산된 필드에 추가해서 사용합니다.

예를 들어, 날짜 범위를 선택하거나 상위 고객(Top Customers)을 필터링하여 작업을 할 수 있습니다.

매개변수를 워크시트 화면에 추가할 수 있어요!



profile
데이터 새내기

0개의 댓글