1. Snowflake 플랫폼 아키텍처
Snowflake의 고유한 플랫폼 아키텍처를 핵심 구성 요소와 특성을 중심으로 간결하게 보여줍니다.
이 아키텍처는 Snowflake가 데이터 웨어하우스, 데이터 레이크, 데이터 엔지니어링, AI/ML 워크로드를 통합하여 처리할 수 있다는 점을 강조하고 있습니다.

2. 엔드투엔드 통합 AI/ML 플랫폼
Snowflake 아키텍처에 포함된 AI/ML에 대해 조금 더 자세히 알아봅니다

-
APP DEVELOPMENT (앱 개발)
- 개발자가 Snowflake 내에서 직접 SQL/파이썬 노트북을 사용하거나, Streamlit을 이용해 대화형 데이터 및 ML 앱을 쉽게 구축하고 배포할 수 있도록 지원합니다
-
GENERATIVE AI (Cortex AI)
- Snowflake에 통합된 AI 서비스로, 사용자가 복잡한 LLM(대규모 언어 모델)을 직접 구축할 필요 없이 SQL 함수를 사용하듯이 생성형 AI 모델에 접근하고 활용할 수 있게 합니다.
- 예시: 복잡한 텍스트를 요약하거나, 자연어 프롬프트를 통해 SQL 코드를 생성하는 등.
-
MACHINE LEARNING (Snowflake ML)
- MLOps 기능을 포함하여 데이터 과학자들이 Snowflake 내에서 특성 공학, 모델 학습, 추론 등을 수행할 수 있도록 합니다
- 이는 데이터가 이동하지 않고 저장된 위치에서 바로 ML 작업을 수행할 수 있게 하여 보안과 효율성을 높입니다
-
AI INFRASTRUCTURE (AI 인프라)
- Container Runtime은 Snowflake가 관리하는 컨테이너 환경에서 파이썬 워크로드나 복잡한 ML 라이브러리를 Snowflake 내에서 실행할 수 있게 합니다
- GPUs(그래픽 처리 장치) 지원은 모델 학습과 같은 고성능 컴퓨팅 작업의 속도를 획기적으로 향상시킵니다
-
DATA & MODEL GOVERNANCE (데이터 및 모델 거버넌스)
- Snowflake Horizon은 데이터 액세스, 거버넌스, 보안, 개인 정보 보호를 위한 통합 프레임워크입니다.
- Model Registry는 개발된 ML 모델들을 중앙에서 등록, 버전 관리, 추적하여 거버넌스를 확보할 수 있게 합니다.
3. Cortex AI 의 특징
Snowflake Cortex AI는 다음과 같이 기업의 AI 도입을 간소화합니다.
- Easy: 서버리스 인프라로 인프라 관리 부담을 없애고, 간단한 SQL/API로 AI에 접근합니다.
- Connected: 모든 종류의 데이터와 다양한 모델, 그리고 개방형 에이전트 도구를 통해 플랫폼을 확장합니다.
- Trusted: 데이터가 Snowflake를 떠나지 않도록 보호하고, RBAC 및 콘텐츠 안전 필터링을 통해 엔터프라이즈 수준의 보안과 거버넌스를 보장합니다.

-
EASY
- SERVERLESS INFRASTRUCTURE
- 사용자는 인프라 구성이나 확장에 신경 쓸 필요 없이, Snowflake가 제공하는 최적화된 고성능 GPU 인프라를 통해 LLM을 즉시 사용할 수 있습니다.
- USER-FRIENDLY INTERFACES
- 다양한 사용 사례(요약, 감정 분석, 번역 등)를 위한 사전 학습된 LLM 함수를 제공하여 AI 접근성을 높입니다.
- COMPREHENSIVE AI STACK
- 데이터 거버넌스, 보안, 컴퓨팅이 통합된 Snowflake 플랫폼 내에서 AI 기능을 제공하여 복잡성을 줄입니다.

-
Connected:
- DATA
- Snowflake는 정형, 반정형(JSON, XML), 비정형 데이터(문서, 이미지 등)를 모두 통합 관리합니다.
- Cortex AI는 이 모든 유형의 데이터에 접근하여 분석 및 생성 작업을 수행할 수 있습니다.
- MODELS (모델)
- 복잡한 ML 프레임워크 대신, 간단한 SQL 함수(예: CORTEX.SUMMARIZE())나 직관적인 API 호출을 통해 LLM을 활용할 수 있습니다.
- 이는 AI 모델 사용의 진입 장벽을 대폭 낮춥니다.
- TOOLS & AGENTS
- 개방형 표준을 통한 상호 운용성 (MCP, A2A).
- Cortex AI를 활용하여 구축된 에이전트(Agent)나 도구들이 다양한 애플리케이션 및 시스템과 원활하게 통신할 수 있도록 개방형 표준을 지원하여 확장성을 보장합니다.

-
Trusted:
- Data protection (데이터 보호)
- AI를 사용할 때 데이터가 Snowflake를 떠나지 않습니다.
- Cortex AI는 Snowflake 환경 내에서 실행되므로, 민감한 기업 데이터가 외부 클라우드나 서비스로 유출될 위험이 없습니다.
- 이는 데이터 주권을 보장합니다.
- RBAC (역할 기반 접근 제어)
- 데이터에 대한 세분화된 제어. 미세 조정된 LLM, ML 모델 및 AI.
- Snowflake의 강력한 RBAC 프레임워크를 그대로 활용하여, 특정 역할(Role)을 가진 사용자만이 특정 데이터, 모델, 또는 AI 기능에 접근할 수 있도록 세밀하게 제어합니다.
- High accuracy (높은 정확도)
- 업계 최고의 검색 정확도 제공.
- RAG(Retrieval-Augmented Generation)와 같은 기술을 통해 LLM이 기업 데이터의 맥락을 기반으로 답변을 생성하여, 환각(Hallucination)을 줄이고 답변의 정확도와 신뢰성을 높입니다.
- Content safety (콘텐츠 안전)
- 유해한 콘텐츠가 LLM으로 생성되는 것을 필터링.
- LLM이 부적절하거나 유해한 정보를 생성하는 것을 방지하기 위한 필터링 및 검증 메커니즘을 내장하여 안전한 사용을 보장합니다.
- Observability (관측 가능성)
- 내장된 시각적 인터페이스를 통해 모든 앱에 대해 평가, 모니터링.
- Cortex AI를 사용하여 구축된 LLM 기반 애플리케이션의 성능, 비용, 사용량을 쉽게 모니터링하고 평가할 수 있는 도구를 제공하여 투명성을 확보합니다.

참고링크
Snowflake Intelligence 처음부터 시작해보기 (1편) — Cortex Analyst와 Intelligence Agent 연동
Snowflake Intelligence 처음부터 시작해보기 (2편) — Cortex Search로 문서 기반 질의응답 구축하기
Snowflake Intelligence 처음부터 시작해보기 (3편) — Custom Tools로 외부 API 연동하기