Snowflake Cortex는 Snowflake가 제공하는 완전 관리형 AI/ML 서비스 플랫폼이다.
별도 인프라 구축 없이 Snowflake 안에서 LLM을 활용한 애플리케이션을 구축할 수 있다.
핵심 메시지: "Snowflake 데이터를 벗어나지 않고, AI 기능을 바로 사용한다"
| Cortex Analyst | Cortex Search | Cortex Fine-tuning | |
|---|---|---|---|
| 한 줄 정의 | 자연어 → SQL 변환 | 텍스트 퍼지 검색 | LLM 도메인 특화 조정 |
| 대상 데이터 | 구조화 데이터 (테이블) | 비정형 텍스트 | 학습 데이터 (prompt/completion) |
| 핵심 키워드 | Text-to-SQL, Semantic View | Hybrid Search, RAG | PEFT, Adaptor |
| 주요 사용 사례 | 비기술 사용자의 데이터 질의 | 문서 검색, 챗봇 지식 기반 | 도메인 특화 모델 성능 향상 |
| 언제 쓰는가 | SQL 없이 데이터 분석이 필요할 때 | 텍스트를 의미 기반으로 검색할 때 | 특정 업무에 맞게 LLM을 조정할 때 |
완전 관리형 LLM 기반 기능. SQL 없이 자연어로 구조화 데이터에 질문하고 답변을 받는다.
Cortex Analyst가 정확한 SQL을 생성하기 위한 비즈니스 의미 레이어다.
"데이터베이스 스키마 + 비즈니스 언어"를 연결해주는 역할.
구성 요소 5가지:
messages, role 등)낮은 지연시간의 하이브리드(벡터 + 키워드) 검색 서비스.
임베딩·인프라 걱정 없이 텍스트 검색 엔진을 수 분 만에 구축한다.
두 가지 사용 사례만 기억:
| 사용 사례 | 설명 |
|---|---|
| RAG 엔진 | LLM 챗봇에 최신 데이터 컨텍스트를 제공 |
| 엔터프라이즈 검색 | 앱 내 고품질 검색창 백엔드 |
Cortex Search는 3단계 하이브리드 방식을 사용한다:
1. Vector Search — 의미(semantic)가 유사한 문서 검색
2. Keyword Search — 단어가 유사한 문서 검색
3. Semantic Reranking — 두 결과를 합쳐 최적 순서로 재정렬
→ 시험에서 "Cortex Search가 정확도가 높은 이유"를 묻는다면: 하이브리드 + 리랭킹
PEFT(Parameter-Efficient Fine-Tuning) 기반 완전 관리형 서비스.
기존 LLM을 도메인 특화 작업에 맞게 예시 데이터로 조정한다.
이 3가지 상황을 비교해서 "언제 Fine-tuning이 정답인가"를 알아야 한다:
| 방법 | 언제 적합 |
|---|---|
| 프롬프트 엔지니어링 | 간단한 작업, 빠른 적용 |
| RAG | 최신 데이터·문서 기반 검색이 필요할 때 |
| Fine-tuning | 도메인 특화 작업에서 더 나은 정확도·낮은 지연시간이 필요할 때 |
→ "처음부터 모델을 훈련하지 않아도 된다"는 점이 Fine-tuning의 핵심 장점
prompt (입력) + completion (기대 출력)비즈니스 사용자가 SQL 없이 데이터를 조회하고 싶다
→ Cortex Analyst
문서·텍스트를 의미 기반으로 검색하거나 RAG 챗봇을 만들고 싶다
→ Cortex Search
특정 도메인 작업에서 LLM 성능을 높이고 싶다
→ Cortex Fine-tuning
| 함정 | 정답 |
|---|---|
| Cortex Analyst가 SQL을 직접 실행한다? | ❌ SQL을 생성하고, 실행은 웨어하우스가 한다 |
| Cortex Search는 키워드 검색만 한다? | ❌ 벡터 + 키워드 + 리랭킹 하이브리드 |
| Fine-tuning은 모델을 처음부터 훈련한다? | ❌ 기존 모델에 어댑터를 추가하는 PEFT 방식 |
| Cortex 기능 사용 시 데이터가 외부로 전송된다? | ❌ Snowflake 거버넌스 경계 내에서만 처리 |