| 역할 | 목적 |
|---|---|
| 시스템 설계 기준 제공 | 빅데이터 시스템의 일관성, 확장성, 표준화 확보 |
| 기술 선택 가이드 | 다양한 기술·솔루션 조합 시 최적 구조 제시 |
| 데이터 흐름 명확화 | 데이터 수집→저장→처리→분석→활용 전 과정 체계화 |
| 계층 | 주요 역할 | 대표 기술 |
|---|---|---|
| 데이터 소스 | 데이터 발생 | IoT, SNS, DB, 로그 등 |
| 데이터 수집 | 데이터 수집·적재 | Kafka, Flume, Sqoop 등 |
| 데이터 저장 | 대용량 저장 | HDFS, NoSQL, RDBMS 등 |
| 데이터 처리/분석 | 데이터 처리·분석 | Spark, Hadoop, Hive 등 |
| 데이터 활용 | 시각화·서비스 | BI, Dashboard, API 등 |
| 용어 | 영문 | 설명 |
|---|---|---|
| BDRA | Big Data Reference Architecture | 빅데이터 참조 아키텍처 |
| HDFS | Hadoop Distributed File System | 분산 파일 시스템 |
| ETL | Extract, Transform, Load | 데이터 추출·변환·적재 |
| NoSQL | Not Only SQL | 비관계형 데이터베이스 |
| BI | Business Intelligence | 비즈니스 인텔리전스 |
| 구분 | 전통적 데이터 아키텍처 | 빅데이터 참조 아키텍처 |
|---|---|---|
| 데이터 유형 | 정형 데이터 중심 | 정형·비정형·반정형 모두 |
| 처리 방식 | 배치 중심 | 실시간·배치 혼합 |
| 확장성 | 제한적 | 수평적 확장 용이 |
| 장점 | 단점 |
|---|---|
| 표준화로 설계 용이 | 복잡한 기술 조합 필요 |
| 확장성·유연성 | 초기 도입 비용 높음 |
| 다양한 데이터 처리 | 기술 변화에 민감 |
| 항목 | 내용 요약 |
|---|---|
| 개념 | 빅데이터 시스템 설계 표준 구조 |
| 목적 | 일관성·확장성·표준화 확보 |
| 구조 | 5계층(소스-수집-저장-처리-활용) |
| 특징 | 모듈화, 확장성, 다양한 기술 적용 |
| 최신 트렌드 | 클라우드, AI/ML 통합, 보안 강화 |