[TIL]데이터 분석 부트캠프(4기) 41일차
0. 들어가며
- 비지도학습..!
- 군집분석..!
- 적절한 K값은 몇일까..?
1. 오전 일과
1-1 코드카타 및 내용 정리
내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-56-Investments-in-2016
- 코드카타 1문제 풀이 완료
- 문제를 이해하는데 시간이 오래 걸린 문제
- 손으로 코드를 빠르게 작성하는 것도 좋지만 문제를 이해하고
어떻게 해결하는지를 최우선적으로 생각하기!
2-2 심화 프로젝트 ( 계속 )
- 모델링 진행
- K 값 5를 맡아서 진행
- 변수는 7개 전체를 포함한 진행 + 1개씩 빼서 6개로도 진행
2. 오후 일과
2-1 심화프로젝트 ( 계속 )
- 모델링 진행
- K 값 5를 맡아서 진행
- 변수 5개와 4개로 나누어서 진행
- 피드백 간단 내용 정리
- 피쳐는 연속형 변수를 활용하여 진행
- 피쳐는 많으면 많을수록 좋음
- 범주형 변수는 연속형 변수로 설명이 안될 때 추가 여부를 고려!
- 군집한 스캐터 그래프보다 라인 그래프에서 컬럼들로 군집을 어떻게 설명할 수 있는지가 중요
- 실루엣 계수가 전체를 설명해주는 것은 아니기 때문에 참고용으로만 활용
3. 마치며
- 라인 그래프를 해석하는 방법 중요!
- 군집이 나뉘어진 스캐터 그래프도 중요하지만 라인 그래프를 보면서
컬럼을 잘 설명하는 것이 지금은 더 중요하다!
- 실루엣 계수는 참고용으로만 사용하기!
- 그 이뉴는 실루엣 계수가 모든 것을 설명해주는 것이 아니기 때문에
유의미 여부를 참고하는 용도로만 사용하기!
- 적절한 K값이 몇인지 계속 생각해보기!