오늘은 AI를 공부해보면서 Seaborn을 이용한 시각화 연습한 것 중 Relational 그래프를 다뤄보려한다.Seaborn은 파이썬 데이터 시각화 라이브러리이고, Matplotlib을 기반으로 한 통계 그래픽스 패키지이다.scatterplot : 산점도lineplo
AI를 공부하면서 배운 Feature Cleaning에 대해 정리해보려 한다. Missing values (누락된 값) > 정의 : 변수 내의 특정 값이 저장되어있지 않는 것 누락된 데이터가 중요한 이유 누락된 값이 있는 경우 특정 알고리즘이 작동하지 않음 누락된
데이터를 처리할때 유용하게 사용되는 Numpy에 대해 정리해보려한다. Numpy란? > Numpy는 파이썬 프로그래밍 언어를 위한 오픈 소스 수치 계산 라이브러리이며, 고성능의 다차원 배열 및 행렬 연산을 지원한다. Numpy는 데이터 분석, 과학적인 연구, 기계 학
분류(Classification)에서의 성능 평가 지표에 대해 정리해보려한다. 분류(Classification) 성능 평가 지표 > + 정확도(Accuracy) 오차행렬(Confusion Matrix) 정밀도(Precision) 재현율(Recall) F1 스코어 R
데이터를 처리할때 유용하게 사용되는 Pandas에 대해 정리해보려한다. Pandas란? > Pandas는 파이썬 프로그래밍 언어를 위한 데이터 분석 및 조작 라이브러리이다. Pandas는 구조화된 데이터를 쉽게 처리하고 분석하는 데 도움이 되는 강력한 도구와 데이터
다항회귀를 이용한 과소적합(underfitting)과 과대적합(overfitting)에 대해 정리해보려한다. 과소적합(Underfitting)이란? > 과소적합은 모델이 주어진 데이터를 충분히 학습하지 못해 훈련 데이터와 테스트 데이터 모두에서 성능이 낮은 상태를