
위와 같은 테이블을 보면 email이있고 고객id도 있는데 6살? 2살? 91살? 상식에서 벗어난 데이터를 발견 할 수 있다.
또는 연도가 1970년 1950년 등 정상치에 많이 벗어난 데이터도 있을 수 있다.
- 조건문 CASE문으로 값의 범위를 지정하였다.
select customer_id, name, email, gender, age, case when age<15 then 15 #15살 미만은 15살로 when age>80 then 80 #80세 초과는 80세로 else age end "범위를 지정해준 age" # 나머지 정상데이터는 그대로 age를 조회한다. from customers
** 이상치가 무조건 나쁜 것은 아니니 잘 분석하여 쿼리를 짜자