15. SQL 조회한 데이터가 상식에서 벗어낫 데이터일 경우?

김요한·2024년 6월 26일

분석을 하다보면 상식적이지 않은 데이터가 나오거나 발견할 수 있다.


위와 같은 테이블을 보면 email이있고 고객id도 있는데 6살? 2살? 91살? 상식에서 벗어난 데이터를 발견 할 수 있다.
또는 연도가 1970년 1950년 등 정상치에 많이 벗어난 데이터도 있을 수 있다.

  • 조건문 CASE문으로 값의 범위를 지정하였다.
select customer_id, name, email, gender, age,
       case when age<15 then 15 #15살 미만은 15살로
            when age>80 then 80 #80세 초과는 80세로
            else age end "범위를 지정해준 age" # 나머지 정상데이터는 그대로 age를 조회한다.
from customers

** 이상치가 무조건 나쁜 것은 아니니 잘 분석하여 쿼리를 짜자

0개의 댓글