
그럼 불균형 데이터를 처리하는 여러 샘플링 기법들에 대해서 알아보겠습니다.불균형 데이터란 정상 범주의 관측치 수와 이상 범주의 관측치 수가 현저히 차이나는 데이터를 말합니다.예를 들면, 암 발생 환자가 암에 걸리지 않은 사람보다 현저히 적고, 신용카드 사기 거래인 경우

\*\*1. MAE (Mean Absolute Error)\*\*실제 값과 예측 값의 차이(Error)를 절대값으로 변환해 평균화을 낸 값이다. 작을 수록 좋은 성능을 나타내지만, 해당 모델이 과적합일 수 도 있다.MAE는 에러에 절대값을 취하기 때문에 에러의 크기 그

Natural Breaks는 그룹의 개수를 딱 지정하면, 값이 비슷한 녀석들끼리 그룹을 만들어주는 알고리즘이다. 수학적으로 표현하면, 각각의 그룹 내의 분산은 최소화하고, 그룹 간의 분산은 최대화하는 작업을 수행해 준다. \[공간 데이터의 이해 - 내추럴 브레이크 (N