데이터를 다루다 보면
전화번호, 우편번호처럼 불필요한 문자(-, (, ), 공백 등)가 섞여 있는 경우가 많습니다.
눈으로 보기엔 같아 보여도, 이런 문자 하나 때문에 조인이 안 되거나 비교 결과가 달라질 때가 있습니다.
이럴 땐 REGEXP_REPLACE()로 한 줄이면 정리할 수 있습니다 👇🏻
SELECT REGEXP_REPLACE(phone, '[^0-9]', '') AS cleaned_phone
FROM users;
| phone | cleaned_phone |
|---|---|
| 010-1234-5678 | 01012345678 |
| (02) 987-6543 | 029876543 |
[^0-9] 는 숫자가 아닌 문자를 의미합니다.
즉, 모든 숫자 외의 문자를 찾아 빈 문자열로 바꿔줍니다.
문자열 정제는 복잡해 보이지만,
REGEXP_REPLACE() 한 줄로 깔끔하게 해결됩니다.
특히 조인 전 데이터 포맷 통일에 유용합니다.