[TIL]데이터 분석 부트캠프(4기) 42일차
0. 들어가며
- 실루엣 계수 시각화 그래프...
- DBScan...
- 컴퓨터의 수명을 갉아먹는 주범...
- 실험하는 것도 좋지만 노트북이 죽어간다.
1. 오전 일과
1-1 코드카타 및 내용 정리
내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-57-Department-Top-Three-Salaries
- 코드카타 1문제 풀이 완료
- dense_rank() 함수를 사용하여 중복값에 이어서 순위 진행
1-2 심화 프로젝트 ( 계속 )
- 초기 k값 설정의 논리를 위한 작업
- elbow의 sree plot
- distance map
- silhouette score 시각화 그래프
- 위 작업을 통해 k값 설정 + line plot 해석을 위한 k값 결정!
2. 오후 일과
2-1 심화 프로젝트 ( 계속 )
- 모델링 실험 진행
- DBScan을 모델링하면서 유의미한 값이 나오는지 실험 진행
- K-Means 군집과 비교하는 참고용으로만 활용 예정
- 계속 실험을 진행하고 있으며 유의미한 값을 찾는 중..!
3. 마치며
- DBScan은 컴퓨터의 수명을 갉아먹는다...
- 하는 건 좋지만 컴퓨터 사양에 따라 계산 속도의 차이가 크다..
- 유의미한 변수 생성 완료
- 지금까지 정리한 내용을 PPT 순서에 맞게 정리가 필요!
- 내일 하루는 PPT 정리 및 스크립트 작성으로 기한 내에 제출 하는 것을 목표로 가자!