ML 데이터 스케일링 정리

Joo·2024년 5월 23일
0

MLDL 101

목록 보기
3/17
  • LabelEncoder : 범주형 데이터를 숫자형 레이블로
  • MinMaxScaler : 다양한 연속형 데이터 범위 0-1로 맞추기 (정규화 기법)
  • StandardScaler : 다양한 연속형 데이터 표준화 (표준 정규 분포화)
    • 아웃라이어가 더 튀게 나타날 수 있음
  • RobustScaler : 다양한 연속형 데이터 아웃라이어 처리 (중앙값 0, IQR 1)

그 외에 one-hot encoding, 차원 축소(PCA, LDA 등), feature selection이 있긴 함
추후 추가 예정

profile
적당히 공부한 거 정리하는 곳

0개의 댓글

관련 채용 정보