
인공지능 기술의 발전과 함께 기업들은 자사의 데이터를 활용하여 생성형 AI 애플리케이션을 구축하고자 하는 니즈가 급증하고 있습니다. 그러나 기업 환경에서 프로덕션 품질의 생성형 AI를 구축하는 것은 데이터 준비, 모델 선택, 훈련, 평가, 배포, 그리고 거버넌스까지 복잡한 과정을 필요로 합니다. 데이터브릭스의 모자이크AI는 이러한 전체 AI 수명 주기를 통합적으로 관리하고 프로덕션 품질의 AI 애플리케이션을 구축할 수 있도록 지원하는 종합 솔루션입니다.
모자이크AI는 예측 ML 모델부터 최신 생성형 AI 솔루션에 이르기까지, 프로덕션 품질의 AI 에이전트 시스템과 ML 애플리케이션을 구축, 배포, 평가, 관리하는 데 도움이 되는 데이터브릭스의 통합 AI 플랫폼입니다. 데이터를 AI 모델과 안전하게 연결하여 전문 분야별로 정확한 애플리케이션을 구축할 수 있도록 설계되었습니다.
2023년 데이터브릭스가 MosaicML을 13억 달러에 인수한 이후, 모자이크AI라는 이름으로 재브랜딩되어 데이터브릭스 AI 플랫폼의 핵심 요소가 되었습니다.
데이터브릭스는 최근 모자이크AI에 다음과 같은 새로운 기능들을 추가하여 기업들이 더 쉽게 생성형 AI 애플리케이션을 구축할 수 있도록 지원하고 있습니다:

에이전트 프레임워크는 개발자가 고품질의 생성형 AI 애플리케이션을 구축하고 배포할 수 있도록 지원하는 도구 세트입니다. 특히 검색 증강 생성(RAG) 애플리케이션 구축을 위한 종합적인 도구를 제공합니다. 이를 통해 기업은 자사의 독점 데이터를 안전하게 활용하여 Unity Catalog에서 관리되는 AI 시스템을 구축할 수 있습니다.
함수 호출(Function-Calling) 기능을 통해 개발자는 Llama 3-70B와 같은 인기 있는 오픈 소스 모델을 에이전트의 추론 엔진으로 사용할 수 있습니다.

에이전트 평가는 개발자가 AI 시스템의 품질을 정의하고, 측정하고, 반복할 수 있도록 돕는 기능입니다. 이 도구는 다음과 같은 기능을 제공합니다:
모자이크 AI 툴 카탈로그는 기업이 일반적인 함수(내부 또는 외부)의 엔터프라이즈 레지스트리를 생성하고 조직 전체에서 AI 애플리케이션에 사용할 수 있도록 이러한 도구를 공유할 수 있게 해줍니다. 도구는 SQL 함수, Python 함수, 모델 엔드포인트, 원격 함수 또는 검색기(retrievers)가 될 수 있습니다.

모델 트레이닝은 소규모 데이터셋에서 모델을 미세 조정하거나, DBRX와 같이 3,000개 이상의 GPU에서 수조 개의 토큰으로 모델을 사전 훈련시키는 등의 작업을 위한 쉽게 사용할 수 있는 관리형 API를 제공합니다. 기업은 자사의 비공개 데이터를 활용하여 오픈 소스 기반 모델을 미세 조정함으로써 특정 도메인이나 업무에 특화된 지식을 제공할 수 있습니다.
고객들은 기업 업무에서 GPT-4 성능과 일치하면서도 비용과 지연 시간을 줄이기 위해 시스템 구성 요소용 소형 오픈 소스 모델을 미세 조정하여 성공을 거두고 있습니다.
모자이크 AI 게이트웨이는 조직 내에서 생성형 AI 모델 및 에이전트의 사용 및 관리를 간소화하도록 설계되었습니다. 이 기능은 다음과 같은 이점을 제공합니다:
또한 AI 가드레일(Guardrails)을 통해 안전하지 않은 응답을 방지하거나 민감한 데이터 유출을 방지하는 PII 감지 필터를 추가할 수 있습니다.
일반 AI 모델에 의존하지 않고, 데이터브릭스는 데이터에 기반한 정확한 결과물을 제공하는 에이전트 시스템을 구축할 수 있는 도구를 제공합니다.
여러 시스템 전반에서 기업 데이터에 맞게 조정된 에이전트를 빠르게 개발할 수 있습니다. 기존 ML부터 생성형 AI에 이르기까지, 어떤 모델이든 응용 분야의 요구에 가장 적합한 솔루션을 적용할 수 있습니다.
모자이크 AI는 에이전트를 위한 평가를 기본 제공하며 모든 AI 모델을 지원합니다. AI 판단(AI Judges)을 통해 에이전트 결과의 품질을 측정하고, 수정 사항을 평가하고, 신속하게 재배포할 수 있습니다.
에이전트를 위한 엔드투엔드 거버넌스로 데이터 보안을 유지할 수 있습니다. 모든 모델에 가드레일을 적용하고, 액세스 제어를 자동화하고, 비율 제한을 설정하고, 전체 워크플로에서 데이터 리니지를 추적할 수 있습니다.
모자이크AI를 활용한 주요 기업들의 성공 사례는 다음과 같습니다:
최근 연구에 따르면, 최첨단 AI 결과는 점점 더 모놀리식 모델이 아닌 여러 구성 요소를 가진 복합 시스템을 통해 얻어지고 있습니다. 모자이크AI는 이러한 복합 AI 시스템을 구축하고 배포하기 위한 최적의 플랫폼을 제공합니다.
예를 들어, FactSet이 금융 공식 변환 사용 사례에 상용 LLM을 배포했을 때 생성된 공식의 정확도는 55%에 불과했지만, 모델을 복합 시스템으로 모듈화하여 각 작업을 전문화함으로써 85%의 정확도를 달성할 수 있었습니다.
데이터브릭스의 모자이크AI는 기업이 데이터에서 인공지능으로의 여정을 간소화하고 가속화할 수 있도록 도와주는 종합적인 플랫폼입니다. 데이터 준비부터 모델 훈련, 평가, 배포, 그리고 거버넌스까지 AI 애플리케이션 개발의 전체 라이프사이클을 지원합니다.
모자이크AI를 통해 기업은 일반 인공지능에서 데이터 인텔리전스로 전환하여 기업 데이터를 활용한 더 관련성 높은 인사이트를 더 빠르게 얻을 수 있습니다. 중앙 집중식 거버넌스와 훈련, 추적, 평가, 스왑 및 배포를 위한 통합 인터페이스를 갖춘 단일 플랫폼에서 복합 AI 시스템을 구축하고 협업할 수 있도록 팀을 지원합니다.
데이터브릭스는 복합 AI 시스템 구축 지원, 모델 품질 개선 기능 및 새로운 AI 거버넌스 도구라는 세 가지 핵심 영역에 계속 투자하고 있으며, 이를 통해 기업들이 더 쉽게 생성형 AI를 도입하고 활용할 수 있도록 지원하고 있습니다.