REGEXP_SUBSTR 정리

TJK·2025년 8월 22일

SQLD 자격증 공부 기록

목록 보기

52/60

REGEXP_SUBSTR은 SQL에서 **정규표현식(Regular Expression)**을 사용하여 특정 패턴과 일치하는 부분 문자열을 추출하는 강력한 함수입니다. LIKE보다 훨씬 유연하고 복잡한 패턴을 검색할 수 있어 SQLD 시험에 자주 출제됩니다.

REGEXP_SUBSTR(문자열, 패턴, [시작위치], [발생순서], [옵션])

[ ]와 ^의 조합: ^abc (문자열이 abc로 시작)과 ^[abc] (첫 글자가 a, b, c 중 하나)의 차이를 정확히 구분해야 합니다.
발생순서 매개변수: SUBSTR과 유사하게 REGEXP_SUBSTR도 몇 번째로 일치하는 값을 반환할지 지정할 수 있습니다.
SUBSTR과의 차이: SUBSTR은 시작 위치와 길이를 기반으로 단순 추출하는 반면, REGEXP_SUBSTR은 패턴을 기반으로 추출한다는 차이가 있습니다.

1. 다음 쿼리의 실행 결과는?

SELECT REGEXP_SUBSTR('database administrator', 'a', 1, 3) FROM DUAL;

A. a
B. t
C. d
D. NULL

2. 다음 중 문자열이 숫자로 시작하는지를 검사하는 정규표현식은?
A. ^[0-9]
B. ^[0-9]$
C. [0-9]
D. [0-9]+

3. 다음 쿼리의 실행 결과는?

SELECT REGEXP_SUBSTR('my email is my_email@example.com.', '[a-z]+@[a-z]+', 1, 1) FROM DUAL;

A. example.com
B. my_email@example
C. my_email
D. my_email@example

문제 1 정답: A
- 해설: database administrator에서 a는 2번째, 4번째, 12번째에 나옵니다. REGEXP_SUBSTR은 첫 번째 매개변수가 문자열, 두 번째가 패턴, 네 번째가 발생순서입니다. 3번째 a를 찾으므로 결과는 a입니다.
문제 2 정답: A
- 해설: ^는 문자열의 시작, [0-9]는 숫자 클래스를 의미합니다. 따라서 ^[0-9]는 "문자열이 숫자로 시작"하는 패턴입니다.
문제 3 정답: D
- 해설: [a-z]+는 알파벳이 1회 이상 반복되는 패턴을 의미합니다. my_email은 _ 때문에 일치하지 않으므로, 첫 번째로 매칭되는 my_email@example가 반환됩니다. example.com은 @ 뒤에 .com이 있기 때문에 [a-z]+ 패턴에 일치하지 않습니다.

Hello world!