이 글은 아래 글을 읽은 사람을 대상으로 쓰여졌습니다.
- 1편 : Feature Store - why?
- 2편 : Feature store 핵심 개념
Feature store는 1편, 2편에서 얘기했던 것처럼 2개의 데이터 베이스가 필요하다.
첫번째로 배치처리에 뛰어나고 모든 시점의 데이터를 가지고 있어야할 대용량 Offline store.
두번째로는 latency가 매우 낮고, 최신의 데이터만 가지고 있을 streaming 데이터 처리에 뛰어난 online store
적절한 online store 후보는 다음과 같다.
적절한 offline store는 다음과 같다.
Offline 스토어는 보통 hive 처럼 파일 기반으로 DB이기 때문에 아주 작은 단위의 데이터를 매우 높은 빈도로 쓰게 되면 성능 문제가 생긴다.
자동으로 이 작업이 이뤄지는 feature store(aws)가 있기도 하고 유저가 직접 제어해야 하는 feature store(feast)도 있다.