문제: 빅데이터(Big Data)의 주요 요소기술인 수집, 공유, 저장·관리, 처리, 분석 및 지식 시각화에 대하여 설명하시오.
요소기술 | 설명 및 대표 기술(약어/풀네임) |
---|---|
수집(Collection) | 다양한 소스에서 데이터 취득 (센서, 로그 등) - Flume, Sqoop, Kafka 등 |
공유(Sharing) | 데이터의 유통 및 접근성 확보 - API, 데이터 마켓, 데이터 거버넌스 등 |
저장·관리(Storage & Management) | 대용량 데이터의 효율적 저장 및 관리 - HDFS(Hadoop Distributed File System), NoSQL, RDBMS 등 |
처리(Processing) | 데이터의 정제, 변환, 집계 등 - MapReduce, Spark, ETL(Extract, Transform, Load) 등 |
분석(Analysis) | 통계, 머신러닝, 데이터마이닝 등 - R, Python, SAS, ML 알고리즘 등 |
지식 시각화(Visualization) | 분석 결과를 시각적으로 표현 - Tableau, PowerBI, D3.js 등 |
단계 | 대표 기술(약어/풀네임) |
---|---|
수집 | Flume, Kafka, Sqoop |
공유 | API, 데이터 마켓, 데이터 거버넌스 |
저장·관리 | HDFS, NoSQL, RDBMS |
처리 | MapReduce, Spark, ETL |
분석 | R, Python, SAS, ML 알고리즘 |
시각화 | Tableau, PowerBI, D3.js |
요소기술 | 전통적 방식 | 빅데이터 방식 |
---|---|---|
저장 | 단일 서버, RDBMS | 분산 파일 시스템, NoSQL |
처리 | 배치 처리 | 실시간·병렬 처리 |
분석 | 단순 통계 | 고급 분석, ML |
시각화 | 기본 차트 | 인터랙티브, 대시보드 |
장점 | 단점 |
---|---|
대용량·다양한 데이터 처리 | 복잡한 인프라, 비용 증가 |
실시간 분석 가능 | 보안·프라이버시 이슈 |
고급 분석·예측 지원 | 전문 인력 필요 |
단계 | 주요 기술/특징 |
---|---|
수집 | Flume, Kafka, Sqoop |
공유 | API, 데이터 마켓 |
저장·관리 | HDFS, NoSQL, RDBMS |
처리 | MapReduce, Spark, ETL |
분석 | R, Python, ML 알고리즘 |
시각화 | Tableau, PowerBI, D3.js |
단계 | 대표 기술(영문/한글) | 한 줄 설명 |
---|---|---|
수집 | Kafka, Flume, Sqoop | 다양한 데이터 빠르게 모으기 |
공유 | API, Data Catalog | 데이터 쉽게 나누기 |
저장·관리 | HDFS, NoSQL, Data Lake | 안전하게 보관·관리하기 |
처리 | Spark, MapReduce | 빠르고 똑똑하게 가공하기 |
분석 | ML, R, Python | 데이터에서 답 찾기 |
시각화 | Tableau, Power BI | 보기 쉽게 보여주기 |