TIL_2024.3.18

김희정·2024년 3월 19일

TIL

목록 보기
50/57
post-thumbnail

오늘 한 것

  • 태블로 5일차 과제 제출
  • 스파크 실습 ( 하차 ㅎㅎ...)
  • pycaret 써보기

태블로 신병훈련소에서 새로운 것을 배웠다.

바로

태블로 엑셀러레이터_공식문서
태블로 탬플릿

태블로 엑셀러레이터란 미리 작성된 샘플 대시보드로 특정 산업 및 엔터프라이즈 응용 프로그램에 맞게 사용자 고유의 데이터로 바꿀 수 있는 기능을 가진 대시보드다!

한마디로 대시보드 탬플릿이며, 안에 데이터 파일만 교체하면 자동으로 대시보드가 완성되는 것!!

하지만 한가지 단점이라고 할만한게,
기존 대시보드에 사용된 데이터 파일의 형식?이 완벽히 매칭되어야 한다.

데이터 매핑만 된다면, 대시보드 디자인 고민없이 자동으로 완성되니 나중에 한번 써봐야겠다.


미니프로젝트에서 Pycaret을 다뤄봤다.
Pycaret이란 머신러닝 workflow를 자동화하는 오픈소스 라이브러리이다.

분류 모델이라 classification으로 넣고 돌렸을때 평가지표인 AUC가 0.000으로 나오는데,

이점은 좀더 찾아보니 데이터의 불균형, 즉 내가 쓰고 있는 데이터셋에서 양품 데이터가 불량 데이터보다 훨씬 많은 경우, 모델은 단순히 모든 샘플을 양품으로 분류해도 높은 정확도를 달성할 수 있기 때문에 AUC가 0.000으로 나오는 거라고 한다.

하지만 직접 ROC 그래프를 그렸을때는 또 잘나와서 왜 위의 표에서만 다 양품이라고 판단하는 건지 잘 모르겠다..

profile
데이터 애널리스트가 되고 싶은

0개의 댓글