[TIL]데이터 분석 부트캠프(4기) 39일차
0. 들어가며
- 심화 프로젝트..!
- 전처리가 중요한데 다행스럽게도 어느정도 전처리가 된 것 같다!
- 내일은 오늘 정리한 내용을 다시 깔끔하게 정리 및 모델링 시작
1. 오전 일과
1-1 코드카타 및 내용 정리
내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-55-Restaurant-Growth
- 코드카타 1문제 풀이 완료
- limit와 offset를 활용한 정렬
- sum() over을 통한 누적합
1-2 심화 프로젝트
- 데이터 전처리를 위한 EDA 진행
- 결측치에 대해서는 dropna()를 활용하여 제거
- 그리고 이후 분석에서 활용할 수 있는 파생변수 생성
2. 오후 일과
2-1 심화 프로젝트(이어서)
- 이상치 제거
- 튜터님께 질문 후 이상치에 대해서 z-score와 IQR에 근거하여 진행하는 것도 좋지만
팀의 특정한 기준에 의한 제거를 진행하여도 된다고 하셨기에 팀의 기준을 선정하여 제거
3. 마치며
- 비지도 학습은 답이 없는 만큼 데이터 전처리가 중요하다.
- 오늘 전처리를 통해 결측치와 이상치를 제거하였으며, 이를 통해 내일부터 모델링 예정