이커머스 데이터를 통한 사업 현황 파악 - BigQuery

dpwl·2024년 5월 11일
0

Data Analysis with SQL

목록 보기
46/120

1. Data Warehouse

Big Query는 구글에서 제공하는 클라우드 기반 데이터 웨어하우스이다. BI 툴인 Looker Studio와 마찬가지로 Google Cloud Platform(GCP) 제품군에 속해 있다.

데이터 웨어하우스는 서비스에 보여야할 부분이 데이터 웨어하우스에 있다. 예를 들어, 강의 데이터베이스, 리뷰 데이터베이스, 회원 데이터베이스 등을 가지고 있을 것이다. 서비스에 연결되어 있는 데이터베이스를 분석에 활용한다고 가정을 하였을 때 데이터 분석가들이 데이터베이스를 활용하여 쿼리를 날리다 문제가 생길시 데이터베이스에도 문제가 생길 것이다. 하지만 데이터베이스는 실제 서비스에 연결되어 있기 때문에 데이터베이스에 문제가 생기면 서비스에도 문제가 생긴다.

이러한 문제를 해결하기 위해서 등장한 개념이 바로 데이터 웨어하우스이다.

서비스와 연결되어 있던 데이터베이스에서 분석용으로 사용할 수 있게 데이터를 가져와서 중앙 창고에 모아두면 데이터가 필요한 분석가들은 서비스와 직접적으로 연결되어 있는 데이터베이스가 아닌 데이터 웨어하우스에 쿼리를 날려서 값을 받아오는 방식으로 작업을 하는 것이다. 따라서 분석가라면 데이터 웨어하우스를 사용할 수 밖에 없다.

데이터 웨어하우스에서도 대표적으로 amazon REDSHIFT 또는 Google BigQuery가 있다.

데이터 웨어하우스는 기본적으로 SQL 문법에 따라서 쿼리를 날리고, 분석가들은 데이터 웨어하우스에서 데이터를 받아올 수 있다.

2. Big Query

Big Query는 클라우드 기반 데이터 웨어하우스이기 때문에 별도의 설치가 필요하지 않는다.

구글 클라우드 플랫폼 안내 페이지가 뜰 것이다.

1) 왼쪽 상단 햄버거 표시 클릭

2) 오른쪽 상단의 프로젝트 만들기 클릭
3) 새 프로젝트에서 프로젝트 이름 입력

4) 만들기 버튼 클릭
5) 환영 안내 문구가 뜨면 완료 클릭
6) SQL 쿼리 만들기 버튼 클릭

7) 새 페이지에서 쿼리 작성

select 'hi BigQuery!'

8) 실행 버튼 클릭

위와 같이 쿼리 결과가 나오면 정상적으로 BigQuery를 사용할 있다는 의미이다.

아래 이미지와 같이 두개의 쿼리를 입력하고 실행하면 하단 결과에 두개의 작업 결과를 볼 수 있다.

그리고 각각의 쿼리 결과는 결과 보기를 클릭하여 볼 수 있다.

빅쿼리는 여러개의 쿼리를 실행시킬 수 있고 만약 여러개의 쿼리를 작성했지만 하나의 쿼리만 실행시키고 싶다면 실행하고 싶은 쿼리만 블록으로 지정하여 실행 버튼을 누르면 아래 이미지와 같이 블럭으로 지정한 쿼리만 실행되어 결과를 볼 수 있다.

SQL 쿼리 만들기 버튼을 클릭하면 새로운 페이지가 생성이 되며 쿼리를 작성할 수 있다.

탭의 오른쪽 마우스를 클릭하여 탭을 오른쪽 창으로 이동을 선택하면 쿼리를 쓸 수 있는 페이지가 왼쪽에 하나 오른쪽에 하나로 분할되는 것을 볼 수 있다.

profile
거북선통통통통

0개의 댓글