데이터 정제하는 과정에서 다양한 스킬들을 익혀보고 싶다는 생각에 구입했다. 유용한 스킬들이 많았고 현재 현업에도 잘 적용하고 있다.
열을 지정하는 데에 있어서도 [’열 이름‘], [[’열 이름’]], loc, iloc 등에 따라 나오는 결과물이 다른 데, 이러한 부분들을 상세히 알 수 있어서 유익했다. 쿡 거리나 K-NN, 아이솔레이트 포레스트를 통한 이상치 식별 프로세스 등을 통한 이상치 식별하는 방법도 처음 접하는 내용이어서 관심이 갔다.
머리 속으로는 하고 싶었는 데 구현이 어려웠던 조건별로 카테고리를 추출하거나, 디렉토리 내 모든 파일 수직 결합, 날짜 데이터 추출 등도 현업에서 많은 도움이 되었다,
현업에서는 바이올린 차트를 활용해 제형별 가격대, 리뷰 수 등을 측정하는 작업과 로드샵 매출과 상관관계를 도출하기 위해 히트맵 차트를 작성해보았다.