빅데이터를 지탱하는 기술 책을 읽다가 Ad Hoc이라는 단어가 종종 등장해서 찾아보면서 정리했습니다.
일반적으로 특정한 목적이나 계획에 따라 미리 정의된 쿼리나 분석이 아니라, 필요에 따라 임시로 데이터를 분석하거나 나타내는것을 의미합니다.
비구조적 : 데이터 미리 정의 없이 활용 가능한 분석
즉각적인 요구 : 긴급 문제 해결 및 특별 질문에 활용
유연성 : 유연한 데이터 접근과 빠른 분석 가능
일회성 : 일회성 작업, 결과물을 재사용하는 경우는 많지 않습니다.
즉, 주기적으로 들어오는 데이터로 시각화하여 모니터링하는 것과는 다르게 데이터 요청에 따라서 일회성으로 지표를 보는것이라고 할수 있습니다.
Ad Hoc분석은 데이터를 통한 의사결정의 핵심이기 때문입니다.
Ad Hoc 분석은 결과 해석과 전략 도출 역량을 향상시켜줍니다.
로그 데이터가 지속적으로 빅쿼리에 적재됩니다.
데이터는 대시보드 도구(예: Tableau, Google Data Studio 등)에서 사용되어 시각화 대시보드를 생성하거나 보고서를 만들기 위해 활용됩니다.
이 시나리오는 주로 실시간 또는 정기적인 데이터 모니터링 및 보고에 적합합니다. 데이터가 지속적으로 업데이트되고 시각화가 자동화되므로 사용자는 대시보드를 통해 지속적인 인사이트를 얻을 수 있습니다.
빅쿼리를 사용하여 필요한 시점에 원하는 쿼리를 실행하고 데이터를 추출합니다.
주로 특정 문제 해결, 예기치 않은 이벤트 조사 또는 비즈니스 의사 결정을 위한 일회성 분석에 활용됩니다.
이 시나리오에서는 쿼리를 통해 데이터를 탐색하고 필요한 지표를 추출하며, 결과를 시각적으로 표현하는 대시보드나 보고서를 만들기보다는 분석 결과 자체가 중요합니다.
두 시나리오 모두 빅쿼리를 활용하며, 어떤 시나리오를 선택할지는 사용자의 요구 사항과 목적에 따라 달라집니다. 대시보드화된 분석은 데이터를 지속적으로 모니터링하고 관찰하며, 애드혹 분석은 특정 문제를 해결하거나 질문에 대한 답을 찾는 데 사용됩니다.