역할 | 목적 |
---|---|
시스템 설계 기준 제공 | 빅데이터 시스템의 일관성, 확장성, 표준화 확보 |
기술 선택 가이드 | 다양한 기술·솔루션 조합 시 최적 구조 제시 |
데이터 흐름 명확화 | 데이터 수집→저장→처리→분석→활용 전 과정 체계화 |
계층 | 주요 역할 | 대표 기술 |
---|---|---|
데이터 소스 | 데이터 발생 | IoT, SNS, DB, 로그 등 |
데이터 수집 | 데이터 수집·적재 | Kafka, Flume, Sqoop 등 |
데이터 저장 | 대용량 저장 | HDFS, NoSQL, RDBMS 등 |
데이터 처리/분석 | 데이터 처리·분석 | Spark, Hadoop, Hive 등 |
데이터 활용 | 시각화·서비스 | BI, Dashboard, API 등 |
용어 | 영문 | 설명 |
---|---|---|
BDRA | Big Data Reference Architecture | 빅데이터 참조 아키텍처 |
HDFS | Hadoop Distributed File System | 분산 파일 시스템 |
ETL | Extract, Transform, Load | 데이터 추출·변환·적재 |
NoSQL | Not Only SQL | 비관계형 데이터베이스 |
BI | Business Intelligence | 비즈니스 인텔리전스 |
구분 | 전통적 데이터 아키텍처 | 빅데이터 참조 아키텍처 |
---|---|---|
데이터 유형 | 정형 데이터 중심 | 정형·비정형·반정형 모두 |
처리 방식 | 배치 중심 | 실시간·배치 혼합 |
확장성 | 제한적 | 수평적 확장 용이 |
장점 | 단점 |
---|---|
표준화로 설계 용이 | 복잡한 기술 조합 필요 |
확장성·유연성 | 초기 도입 비용 높음 |
다양한 데이터 처리 | 기술 변화에 민감 |
항목 | 내용 요약 |
---|---|
개념 | 빅데이터 시스템 설계 표준 구조 |
목적 | 일관성·확장성·표준화 확보 |
구조 | 5계층(소스-수집-저장-처리-활용) |
특징 | 모듈화, 확장성, 다양한 기술 적용 |
최신 트렌드 | 클라우드, AI/ML 통합, 보안 강화 |