Big Query는
구글에서 제공하는 서비스 중 하나로써, 대용량 Dataset을 대회식으로 분석할 수 있는 웹 서비스이다.
대규모 데이터 저장 및 분석 플롯폼으로 일종의 데이터 웨어하우스라고 불린다.
(엄청나게 큰 DB의 일종으로 생각하면 편할 듯 싶다...)
최대 페타바이트 급의 데이터를 저장해서 관리 할 수 있을 정도로 수용가능한 데이터량이 어마어마하다...(KMGTP 할 때 그 P)
확장이 가능하며, 사용이 간편해서 개발자와 기업은 필요할 때 강력한 데이터 분석을 Big Query를 사용해서 수행 할 수 있다.
특징으로는
기존에 RDBMS에서 사용되는 SQL 언어를 그대로 사용한다.
다른 서비스 (Hadoop이나 Spark등)들은 사용하는데 전문성이 어느정도 필요하지만, Big Query는 로그인 후 SQL만 수행하면 되기 때문에 상대적으로는 쉽게 사용 할 수 있다.
RDBMS는 레코드 단위로 데이터를 저장 / Big Query는 컬럼 단위로 데이터를 뜯어내어 저장
즉, RDBMS는 데이터들은 선회하며 레코드 단위로 전체를 조회하지만
Big Query는 컬럼 기반 저장 방식이기 때문에 해당 컬럼(amount)만 조회하면 되서 빠른 검색이 가능하다.
또한 컬럼 단위로 저장된다는 점에서 데이터양이 늘어나도 같은 타입의 데이터들이 몰려서 저장되기 때문에 데이터 압축성도 높아 결과적으로 트래픽을 최소화 시킬 수 있게 된다.
3개의 복제본이 서로 다른 데이터 센터에 분산되어 저장되기 때문에 데이터 유실에 대한 위험이 적다.