요구사항
요구사항 1
- 차량의 다양한 장치로부터 발생하는 로그 파일을 수집해서 기능별 상태를 점검

요구사항 2
- 운전자의 운행 정보가 담긴 로그를 실시간으로 수집해서 주행 패턴을 분석

요구사항 정리

데이터셋

1. 스마트카 상태 정보 데이터
- 스마트카의 각종 센서부터 발생하는 차량의 상태 정보 데이터셋. 요구사항 1과 직접적인 관련이 있으며, 로그 시뮬레이터를 통해 생성
- 스마트카 운전 운행 데이터
- 스마트카 운전자의 운전 패턴/운행 정보가 담긴 데이터셋. 요구사항 2와 직접적인 관련이 있으며 로그 시뮬레이터를 통해 생성
- 스마트카 마스터 데이터
- 스마트카 운전자의 프로파일 정보가 담긴 데이터셋. 요구사항 1,2와 관련된 분석 데이터셋을 만들 때 활용.
- 스마트카 물품 구매 이력 데이터
- 스마트카 운전자가 차량 내의 스마트 스크린을 통해 쇼핑몰에서 구입한 차량 물품 구매 목록 데이터셋. 요구사항 1,2와 관련된 분석 데이터셋을 만들 때 활용
소프트웨어 아키텍처
1. 수집 레이어

2. 적재 레이어

- 플럼 -> 하둡 (배치 데이터)
- 스톰 -> HBase, 레디스 (실시간 데이터) / 특정 이벤트는 레디스로 적재
3. 처리/탐색 레이어

4. 분석/응용 레이어

전체구성도
3개의 VM과 Cloudera Manager를 이용하여 실습환경을 구축했다.
