업무 데이터 : 업무에 필요한 데이터
로그 데이터 : 업무에 직접적으로 필요하지는 않지만 분석을 위해 추출해야 하는 데이터
업무 데이터
: 서비스와 시스템을 운용하기 위한 목적으로 구축된 데이터베이스에 존재하는 데이터. '트랜젝션 데이터'와 '마스터 데이터'로 분류할 수 있다.업무 데이터의 특징
1) 데이터의 정밀도가 높다
: 여러 데이터 처리를 하는 중에 문제가 발생하면, 트랜잭션과 롤백이라는 기능을 사용해 이러한 문제를 제거할 수 있다. 따라서 데이터의 정합성이 보증된다.
2) 갱신형 데이터
: 매일 다양한 데이터 추가, 갱신, 제거 등이 실행된다. 따라서 데이터를 추출하는 시점에 따라 바뀔 수 있다는 점을 의식해야 한다.
3) 다뤄야 하는 테이블의 수가 많다트랜잭션 데이터
: 구매, 리뷰, 게임 플레이 데이터처럼 서비스와 시스템을 통해 사용자의 행동을 기록한 데이터.
마스터 데이터
: 마테고리 마스터, 상품 마스터처럼 서비스와 시스템이 정의하고 있는 데이터.트랜잭션 데이터는 회원 ID와 상품 코드 등이 저장되어 있으므로, 트랜잭션 데이터만으로는 잘 팔리는 상품의 명칭 또는 카테고리 등을 알 수 없는 경우가 많다. 따라서 트랜잭션 데이터의 상품 ID와 마스터 데이터를 결합해서 상품이름, 상품 카테고리, 발매일 등을 명확하게 만들어야 리포트 업무의 폭을 넓힐 수 있다.
로그 데이터
: 통계 또는 분석을 주 용도로 설계된 데이터, 특정 태그를 포함해서 전송된 데이터, 특정 행동을 서버 측에 출력한 데이터. 누적형 데이터 이므로 로그 출력 이후에 가격이 변경되거나 사용자 정보가 변경되더라도 기존의 데이터를 수정하지 않는다.로그 데이터의 특징
1) 시간, 사용자 엔드 포인트, IP, URL, 레퍼러, Cookie 등의 정보 저장하기
: 업무 데이터는 서비스와 시스템을 구축할 때 필요한 데이터이지만, 로그 데이터는 서비스의 처리에 영향이 거의 없는 정보를 저장한 것이다.
2) 로그 데이터는 추출 방법에 따라 데이터의 정밀도가 달라진다
3) 계속 기록을 추가하는 것뿐이므로 과거의 데이터가 변경되지 않음