이상값을 찾고 처리하는 방법에 대해 학습하였다.
일반적인 데이터 분포에서 벗어난 값, 즉 다른 데이터와 차이가 큰 값을 가진 데이터 포인트.
극단적으로 크거나 작은 값일 수 있다.
데이터분석에서의 이상값
* 사용할 원본 데이터

q1 = airbnb_df['price'].quantile(0.25) # 1사분위 수 계산
q3 = airbnb_df['price'].quantile(0.75) # 3사분위 수 계산
iqr = q3 - q1
min_limit = q1 - 1.5 * iqr
max_limit = q3 + 1.5 * iqr
airbnb_df[airbnb_df['price'] < min_limit]
airbnb_df[airbnb_df['price'] > max_limit]
airbnb_df[(airbnb_df['price'] < min_limit) | (airbnb_df['price'] > max_limit)]

* 이상값 처리하기 -> 불린 인덱싱 활용
condition1 = airbnb_df['price'] >= min_limit
condition2 = airbnb_df['price'] <= max_limit
airbnb_df[(airbnb_df['price'] >= min_limit) & (airbnb_df['price'] <= max_limit)]

=> 이상값이 처리된 것을 확인할 수 있다.