내일(7.15)은 마이다스 데이터 분석 직무 역량 평가 날이다. 어떤 게 문제로 나올까? 일단 오늘, 내일은 Django 공부를 쉬고, 데이터 분석 공부에 집중해야겠다.
네이버웹툰 과제 테스트를 참고해서 예상해보자면, 데이터 정제, 시각화, Feature Engineering, 간단한 Modeling이 실기 시험으로 나올 수 있을 것 같다. 그리고 직무 면접이 없다는 것을 고려했을 때, 직무 면접 질문이 테스트에 나올 수도 있을 것 같다.
평가 시간에 따라서 어떤 게 문제로 나올 지 알 수 있을 것으로 보인다. 30분 이내라면 간단한, 수학, 데이터 문제 풀이나, 직무 관련 질문일 수 있을 것 같고, 2시간 이상이라면, 네이버 웹툰과 같은 코딩 문제일 것 같다.
그렇다면 내가 약한 부분은 무엇인가? 수학에서도 통계와 확률 분야와, 데이터 크롤링, 머신 러닝 모델에 대한 이해다. 데이터를 크롤링할 때 어떠한 형태의 데이터가 주로 다뤄지는 지 알아야한다. 데이터 시각화 툴(matplotlib) 활용 실력도 그리 좋지 않다. 그리고 아직은 머신 러닝 모델을 막 쓸 줄만 안다. 모델의 효율을 극대화하기 위해서는 모델에 대해서 자세하게 알아야하고, sklearn ML모델의 파라미터가 어떠한 것을 의미하는지 알아야한다.
일단 데이터 '분석' 직무이기 때문에, 깊은 모델은 나오지 않을 것으로 보인다. 오늘은 데이터 크롤링과 시각화에 초점을 두자