사내에 유일한 데이터분석가로,
6개월차를 지나고 있습니다.
초반 5개월 정도는 이렇다할 분석환경을 갖추고 있지 못했습니다.
신입이다보니 어떤 환경이 좋은지, 보통 어떤 환경을 구성하는지 조차 아는 것이 없었기에,
어떤 환경을 구성해달라고 말도 할 수 없었던 것 같습니다.
이제는 회사에서 지속가능한 분석환경에 대한 필요성을 느꼈는지,
모든 데이터를 한 곳에 모으고,
가공하고 분석할 수 있는 환경을 구성하고 있습니다.
현재 제가 다니고 있는 회사는 MongoDB, AWS S3에 모든 데이터를 넣고 있습니다.
Eventlog 및 큰 용량의 데이터는 S3에, 그외의 데이터는 MongoDB에 있습니다.
앞으로는 저희가 시도한 환경구성과,
그 환경을 제가 직접 테스트하며 최적의 프로세스를 찾으려고 한 과정,
그리고 현재의 상황을 순서대로 포스팅하겠습니다.