Min Max Scaling 이란

jun hyeon·2023년 10월 18일
0

Machine Learning

목록 보기
1/5

Min-Max 스케일링은 데이터를 특정 범위, 일반적으로 0과 1 사이로 재조정하는 기술입니다. 이 기술은 각 데이터 포인트에서 최솟값을 뺀 후, 최댓값과 최솟값의 차이로 나누는 공식을 사용합니다.

수식

Scaled Value = Value−Min / Max−Min

이러한 스케일링 방법의 주된 이유는 다양한 특징의 스케일을 통일시키고, 알고리즘이 더 잘 작동하도록 하기 위함입니다. 또한, 이 방법은 이상치에 덜 민감하며, 데이터의 분포를 유지할 수 있습니다.

import pandas as pd

df=pd.DataFrame( {
    'A' : ['a', 'b', 'c', 'a', 'b'],
    'B' : [1, 2, 3, 1, 0]
})

df
from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()
le.fit_transform(df['A'])

출력

GPT : 이해를 돕자면, 키와 몸무게를 비교할 때 키는 일반적으로 높은 값을 가지고, 몸무게는 상대적으로 낮은 값을 가집니다. 이 두 특성을 비교하려면 스케일링을 통해 두 값을 비슷한 범위로 만들어야 합니다. Min-Max 스케일링은 이를 수행하며, 모든 값을 0과 1 사이의 범위로 변환하여 알고리즘이 두 특성을 공정하게 비교할 수 있도록 합니다.

0개의 댓글

관련 채용 정보