Day 24 (23.08.18)
한 주의 마지막날이다.
오늘은 풀타임 온라인 강의 날로 기초 코스와 A코스 강의를 듣게 되었다. 두 코스 모두 실전예시 EDA 과정으로 앞서 배웠던 라이브러리들을 이용하여 EDA를 실시하는 과정이었다. 다양한 예시 데이터들을 이용하여 실습하게 되니 EDA에 대한 어느 정도 갈피를 잡는데 도움이 되었다. 실제로 데이콘 참여를 할 때 내가 주로 쓰던 방법은 pandas의 메서드들을 이용하여 데이터프레임 구조의 정형데이터에 대한 EDA를 했었는데 seaborn등을 이용한 시각화를 통한 인사이트 도출은 이미 공유된 그래프를 통하여 한 편이어서 좀 더 보충을 해야겠다고 생각이 되었다. 통계학과에 재학하던 시절 교수님들께서도 몇번이고 시각화의 중요성을 말씀하셨던게 기억이 난다. 이러한 부분이 앞으로 있을 프로젝트를 통해 좀 더 체화되었으면 좋겠다. 그리고 강의 도중에 강사님이 말씀하셨던 나만의 EDA 프로세스를 만든다는 부분에서 나 또한 아주 깊이 필요로 하고 있다. EDA의 원활한 진행에 따라서 data preprocessing이 어떤 방식으로 어떻게 매끄럽게 진행될 지 가이드해준다고 생각하기에 정말 중요하게 생각한다.
(좋은 data preprocessing은 모델의 좋은 학습으로 이는 또 모델의 좋은 outcome으로 이어지기에!)
이제 EDA프로젝트가 멀지 않았다. 좀 더 정진하자!
추가적으로 확실하게 선형대수학과 sql에 대해서 추가 학습하고자 결정하였다!