
Databricks를 처음 도입하거나 운영하는 조직에서 가장 자주 마주치는 질문 중 하나는 "누가 어떤 권한을 가져야 하는가?"입니다. Databricks는 엔터프라이즈급 데이터 플랫폼으로, 다양한 관리자 역할을 제공하여 조직의 보안과 운영 효율성을 보장합니다.
각 역할의 책임 범위를 명확히 이해하지 못하면, 불필요하게 높은 권한을 부여하거나 반대로 필요한 권한이 부족하여 업무가 지연되는 문제가 발생할 수 있습니다. 이 글에서는 Databricks의 주요 관리자 역할들을 계층별로 정리하고, 각 역할이 담당하는 영역과 실무에서의 활용 방법을 설명합니다.
Databricks의 관리자 역할은 크게 네 가지 계층으로 구분할 수 있습니다:
주요 책임:
실무 관점:
Cloud Administrator는 Databricks가 아닌 클라우드 플랫폼(AWS, Azure, GCP) 레벨에서 작업합니다. 예를 들어, Databricks가 S3 버킷에 접근하기 위한 IAM 역할을 생성하거나, Azure Storage Account에 대한 접근 권한을 설정하는 것이 이 역할의 주요 업무입니다.
언제 필요한가?
주요 책임:
실무 관점:
대규모 조직에서는 수백 명의 사용자를 수동으로 관리하기 어렵습니다. Identity Administrator는 SAML 또는 SCIM 프로토콜을 통해 기업의 Active Directory나 Okta 같은 IdP와 Databricks를 연동하여, 사용자 추가/삭제/권한 변경을 자동화합니다.
언제 필요한가?
주요 책임:
실무 관점:
Account Administrator는 Databricks 계정의 최상위 관리자입니다. 이 역할은 조직 내에서 매우 제한적으로 부여되어야 하며, 보통 데이터 플랫폼 팀의 리더나 IT 관리자가 담당합니다. 모든 데이터 객체를 관리할 수 있는 권한을 가지므로, 신중하게 권한을 부여해야 합니다.
언제 필요한가?
주요 책임:
실무 관점:
Workspace Administrator는 특정 워크스페이스의 "관리자"입니다. 예를 들어, "개발 워크스페이스"와 "프로덕션 워크스페이스"가 있다면, 각각 별도의 Workspace Administrator를 둘 수 있습니다. 이 역할은 개발자들이 필요한 리소스를 사용할 수 있도록 환경을 구성하고, 비용 관리를 위한 클러스터 정책을 설정합니다.
언제 필요한가?
주요 책임:
실무 관점:
Metastore Administrator는 데이터 거버넌스의 핵심 역할입니다. Unity Catalog를 통해 데이터 레이크의 모든 데이터에 대한 접근 제어를 관리합니다. 예를 들어, "마케팅 팀은 sales 데이터베이스의 특정 테이블만 읽을 수 있다"와 같은 정책을 설정하고 관리합니다.
언제 필요한가?
주요 책임:
실무 관점:
Marketplace Administrator는 조직이 Databricks Marketplace를 통해 데이터를 공유하거나 판매할 때 필요한 역할입니다. 데이터 제품을 마켓플레이스에 등록하고, 다른 조직과 데이터를 공유하는 비즈니스를 관리합니다.
언제 필요한가?
주요 책임:
실무 관점:
Billing Administrator는 Databricks 사용 비용을 관리하는 역할입니다. 각 워크스페이스나 사용자 그룹별로 예산을 설정하고, 예산 초과 시 알림을 받아 비용을 제어합니다. 재무팀이나 IT 관리팀의 담당자가 주로 이 역할을 수행합니다.
언제 필요한가?
정의:
메타스토어 내의 각 데이터 객체(테이블, 뷰, 함수 등)를 생성한 주체이거나, 소유권을 이전받은 주체입니다.
권한:
실무 관점:
Owner는 역할(Role)이 아니라 객체별로 부여되는 개념입니다. 예를 들어, 데이터 엔지니어가 새로운 테이블을 생성하면 자동으로 그 테이블의 Owner가 됩니다. Owner는 해당 객체에 대한 완전한 제어권을 가지므로, 퇴사자나 역할 변경 시 소유권 이전을 고려해야 합니다.
| 구분 | 역할명 | 주요 관리 대상 | 권한 범위 |
|---|---|---|---|
| 인프라 | Cloud Admin | 클라우드 자원 (S3, IAM 등) | 클라우드 플랫폼 레벨 |
| 계정 | Account Admin | 워크스페이스, 메타스토어, 계정 전체 | 계정 전체 |
| 보안 | Identity Admin | 사용자 ID 연동 및 프로비저닝 | 계정 전체 |
| 데이터 | Metastore Admin | 카탈로그, 권한 체계, 데이터 거버넌스 | 메타스토어 범위 |
| 실행 | Workspace Admin | 워크스페이스 내 자산 (클러스터, 노트북) | 워크스페이스 범위 |
| 비용 | Billing Admin | 예산, 결제, 사용량 모니터링 | 계정 전체 |
| 공유 | Marketplace Admin | 데이터 공유 및 마켓플레이스 관리 | 계정 전체 |
| 객체 | Owner | 개별 데이터 객체 (테이블, 뷰 등) | 객체별 |
시나리오: 중소규모 조직의 Databricks 도입
초기 설정 단계
운영 단계
일반 사용자
Databricks의 관리자 역할 체계는 조직의 규모와 요구사항에 따라 유연하게 구성할 수 있습니다. 각 역할의 책임 범위를 명확히 이해하고, 조직의 구조에 맞게 권한을 부여하는 것이 안전하고 효율적인 Databricks 운영의 핵심입니다.
특히 계정 관리자(Account Admin)와 워크스페이스 관리자(Workspace Admin)의 차이, 그리고 메타스토어 관리자(Metastore Admin)의 데이터 거버넌스 역할을 이해하는 것이 중요합니다. 이러한 역할들을 적절히 조합하면, 보안을 유지하면서도 개발자들이 필요한 리소스에 자유롭게 접근할 수 있는 환경을 구축할 수 있습니다.
참고 자료: