ETT 는 Extraction(추출), Transformation(변환), Transprotation(전송) 의 약자로, 데이터를 수집, 정제, 변환하여 최종 목적지(DB)에 저장하는 프로세스
| 단계 | 설명 |
|---|---|
| 추출 (Extraction) | 원본 데이터에서 유용한 데이터를 추출 |
| 변환 (Transformation) | 데이터를 정제 및 변환하여 일관성 유지 |
| 전송 (Transprotation) | 정제된 데이터를 타깃 데이터베이스로 전송 |
💡 데이터 웨어하우스의 주요 특징
💡 데이터 레이크의 장점
| 수집 방법 | 설명 |
|---|---|
| 웹 크롤링(Web Crawling) | 웹사이트 데이터를 자동으로 가져오는 방법 |
| API 연동(API Integration) | 제공되는 API를 활용하여 데이터를 수집 |
| DB 연동(DB Synchronization) | 데이터베이스 간 연동을 통해 데이터 가져오기 |
| 로그 및 센서 데이터(Log/Sensor Data) | 시스템 로그 및 IoT 센서에서 데이터 수집 |
| 연동 방식 | 설명 |
|---|---|
| 소켓(Socket) | 실시간 통신을 위한 네트워크 기반 연동 |
| 스트리밍(Streaming) | 지속적으로 들어오는 데이터 처리 |
| FTP(File Transfer Protocol) | 파일 기반 데이터 전송 |
| HTTP API | RESTful API 를 통한 데이터 요청 및 응답 |