[TIL]데이터 분석 부트캠프(4기) 41일차

Data_Student·2024년 12월 4일
0

TIL

목록 보기
41/54

[TIL]데이터 분석 부트캠프(4기) 41일차


0. 들어가며

  • 비지도학습..!
  • 군집분석..!
  • 적절한 K값은 몇일까..?

1. 오전 일과

1-1 코드카타 및 내용 정리

내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-56-Investments-in-2016

  • 코드카타 1문제 풀이 완료
    • 문제를 이해하는데 시간이 오래 걸린 문제
    • 손으로 코드를 빠르게 작성하는 것도 좋지만 문제를 이해하고
      어떻게 해결하는지를 최우선적으로 생각하기!

2-2 심화 프로젝트 ( 계속 )

  • 모델링 진행
    • K 값 5를 맡아서 진행
    • 변수는 7개 전체를 포함한 진행 + 1개씩 빼서 6개로도 진행

2. 오후 일과

2-1 심화프로젝트 ( 계속 )

  • 모델링 진행
    • K 값 5를 맡아서 진행
    • 변수 5개와 4개로 나누어서 진행
  • 피드백 간단 내용 정리
    • 피쳐는 연속형 변수를 활용하여 진행
    • 피쳐는 많으면 많을수록 좋음
    • 범주형 변수는 연속형 변수로 설명이 안될 때 추가 여부를 고려!
    • 군집한 스캐터 그래프보다 라인 그래프에서 컬럼들로 군집을 어떻게 설명할 수 있는지가 중요
    • 실루엣 계수가 전체를 설명해주는 것은 아니기 때문에 참고용으로만 활용

3. 마치며

  • 라인 그래프를 해석하는 방법 중요!
  • 군집이 나뉘어진 스캐터 그래프도 중요하지만 라인 그래프를 보면서
    컬럼을 잘 설명하는 것이 지금은 더 중요하다!
  • 실루엣 계수는 참고용으로만 사용하기!
  • 그 이뉴는 실루엣 계수가 모든 것을 설명해주는 것이 아니기 때문에
    유의미 여부를 참고하는 용도로만 사용하기!
  • 적절한 K값이 몇인지 계속 생각해보기!

0개의 댓글