기출 빅데이터(Big Data)의 주요 요소 기술

agnusdei·2025년 7월 10일
0

ICT

목록 보기
7/92

빅데이터(Big Data)의 주요 요소 기술

문제: 빅데이터(Big Data)의 주요 요소 기술(수집, 공유, 저장·관리, 처리, 분석, 시각화)에 대해 각 단계별 대표 기술의 개념과 특징을 구체적으로 설명하시오.


답변

1. 개념

  • 빅데이터(Big Data): 기존 시스템으로 처리 어려운 대용량·다양성·고속 데이터.
  • 각 단계별로 특화된 기술이 존재하며, 대표 기술의 원리와 특징 이해가 중요함.

2. 단계별 주요 요소 기술 상세

단계대표 기술(영문/한글)개념 및 특징 요약
수집Kafka(카프카)분산 스트리밍 플랫폼, 대용량 실시간 데이터 처리, 내결함성, 확장성 우수
Flume(플룸)로그/이벤트 데이터 수집, 스트리밍 데이터 파이프라인 구축에 최적화
Sqoop(스쿱)RDBMS와 하둡(Hadoop) 간 대용량 데이터 전송 자동화
Logstash(로그스태시)다양한 소스의 로그 수집·변환, ELK 스택 연동에 강점
공유API(응용프로그램 인터페이스)표준화된 데이터 접근, 시스템 간 연동, 실시간 데이터 제공
Data Catalog(데이터 카탈로그)메타데이터 관리, 데이터 검색·분류·품질 관리 지원
Data Virtualization(데이터 가상화)물리적 위치와 무관하게 데이터 통합 제공
저장·관리HDFS(하둡 분산 파일 시스템)대용량 파일 분산 저장, 장애 복구, 확장성 우수
NoSQL DB(비관계형 DB)유연한 스키마, 수평 확장, 다양한 데이터 유형 지원(Redis, MongoDB 등)
Data Lake(데이터 레이크)원시 데이터 저장, 정형·비정형 데이터 모두 수용
DW(데이터 웨어하우스)구조화 데이터 저장, 분석 최적화, ETL 기반
처리Spark(스파크)인메모리 분산 처리, 실시간·배치 모두 지원, 빠른 속도
MapReduce(맵리듀스)분산 병렬 처리 모델, 대용량 배치 처리에 강점
Flink(플링크)실시간 스트림·배치 통합 처리, 이벤트 기반 분석
ETL(추출·변환·적재)데이터 정제·변환·적재 자동화, DW/분석 준비
분석ML(기계학습)데이터 기반 예측·분류·군집화, scikit-learn 등 활용
DL(딥러닝)신경망 기반 고차원 데이터 분석, TensorFlow 등 활용
R, Python(파이썬)통계·수치분석, 데이터 과학 라이브러리 풍부
BI(비즈니스 인텔리전스)시각적 분석, 대시보드, 의사결정 지원
시각화Tableau(태블로)대화형 시각화, 드래그앤드롭, 다양한 데이터 소스 지원
Power BI(파워 BI)MS 생태계 연동, 실시간 대시보드, 협업 기능
D3.js웹 기반 맞춤형 시각화, 인터랙티브 그래프
Kibana(키바나)로그·시계열 데이터 시각화, ELK 스택 연동

3. 한눈에 보는 도식

[수집: Kafka, Flume, Sqoop, Logstash]
   ↓
[공유: API, Data Catalog, Data Virtualization]
   ↓
[저장·관리: HDFS, NoSQL, Data Lake, DW]
   ↓
[처리: Spark, MapReduce, Flink, ETL]
   ↓
[분석: ML, DL, R, Python, BI]
   ↓
[시각화: Tableau, Power BI, D3.js, Kibana]

4. 최신 트렌드

  • 실시간 스트림 처리, 클라우드 네이티브, AI/ML 통합, 데이터 거버넌스 강화

5. 어린이 버전 요약

  • 카프카는 빠르게 데이터를 모으고, 하둡은 데이터를 안전하게 보관해요. 스파크는 데이터를 똑똑하게 가공하고, 태블로는 멋진 그림으로 보여줘요!

6. 요약표

단계대표 기술(영문/한글)한 줄 설명
수집Kafka, Flume, Sqoop다양한 데이터 빠르게 모으기
공유API, Data Catalog데이터 쉽게 나누기
저장·관리HDFS, NoSQL, Data Lake안전하게 보관·관리하기
처리Spark, MapReduce빠르고 똑똑하게 가공하기
분석ML, R, Python데이터에서 답 찾기
시각화Tableau, Power BI보기 쉽게 보여주기
profile
DevSecOps ⚙️ + Pentest 🚩

0개의 댓글