분포의 비대칭정도를 나타내는 지표
평균을 기준으로 어느방향으로 얼마나 치우쳐져있는가를 나타낸다
왜도 < 0 : 음의 왜도(왼쪽)
왜도 = 0 : 정규분포
왜도 > 0 : 양의 왜도(오른쪽)

장점
데이터의 비대칭, 이상치,편향을 탐지하기 좋다


데이터가 치우쳐져있을때 처리방법
data = np.random.exponential(scale=2.0, size=1000) # 양의 왜도 데이터
log_transformed = np.log1p(data) # 로그 변환

data = np.random.exponential(scale=2.0, size=1000) # 양의 왜도 데이터
sqrt_transformed = np.sqrt(data) # 제곱근 변환

data = np.random.exponential(scale=2.0, size=1000)
# 박스-콕스 변환
data_positive = data + 1e-5 # 0 이상이어야 함
boxcox_transformed, lambda_val = boxcox(data_positive)

# 극단값 포함 데이터 생성
data = np.random.normal(loc=0, scale=1, size=1000)
data = np.append(data, [10, 15, -10, -15]) # 극단값 추가
# 데이터 자르기
clipped_data = np.clip(data, -3, 3)

분포의 꼬리의 두껍고 뾰족한 정도를 나타내는 지표

