[Study] Big Query

조혜인·2022년 8월 16일
0
post-thumbnail

Big Query란?

  • Google Cloud platform에서 제공하는 페타 바이트급의 데이터 저장 및 분석용 클라우드 서비스 중 하나이다.

    💡 페타 바이트 : 1000의 5승 값으로 TB(테라바이트) 다음의 바이트 크기이다.

  • 즉, 페타 바이트급의 데이터를 저장해놓고, 쿼리를 통해서 조회나 통계 작업 등을 할 수 있는 데이터 베이스이다. (페타바이트 급이라도 빠르게 분석할 수 있다!)


특징

  • 클라우드 서비스(GCP)로 설치/운영이 필요 없음. 우리가 관리를 해줄 필요가 없다.(대신 비용이 들어감!)

  • SQL 언어를 그대로 사용하기 때문에 사용이 매우 쉽다. 아래와 같이 편집기에서 SQL언어를 동일하게 사용하는 걸 확인할 수 있다.

  • 검색 속도가 굉장히 빠르다 -> 대략 4TB 용량의 데이터를 핸들링하는데 약 30초가 걸린다!!😱

  • 굉장히 안전하다 -> 3개의 복제된 데이터가 서로 다른 3개의 데이터 센터에 분산되어 저장되기 때문에 데이터 유실 위험이 적다.


한계점

  • Big Query는 Database 자체적으로 운영되는 시스템이라기 보다는 Data를 분석하고 의미있는 정보로 치환하거나 복잡한 모델링을 가능하게끔 하는 분석 방법이다. 따라서 네트워크 상의 사용자들의 Database에 대한 일괄적인 트랜잭션 처리에는 부적합하다. 트랜잭션은 Grouping된 연산 실패 시 Rollback으로 통하여 이전 상태로 되돌려주는 특징을 가지고 있는데, Big Query에서는 그러한 기능들을 지원하기 어렵다.
profile
코딩은 역시 재밌군

0개의 댓글