아래 내용은 GPT의 도움을 받아 정리한 내용입니다.
정규식 활용 예시
import re
numbers = re.sub(r"[^0-9]", "", "Phone: 123-456-7890")
print(numbers)
single_space = re.sub(r"\s+", " ", "Hello World! How are you?")
print(single_space)
clean_text = re.sub(r"[^a-zA-Z0-9]", "", "Hello! @World# 2024$")
print(clean_text)
주요 메타 문자
.findall()
| 기호 | 설명 | 패턴 | 테스트 문자열 | 결과 |
|---|
. | 아무 문자 (개행 제외) | H.llo | Hello Halo Hillo | ['Hello', 'Hillo'] |
\w | 단어 문자 [a-zA-Z0-9_] | \w+ | Hi 123_world | ['Hi', '123_world'] |
\W | 단어 문자가 아닌 것 | \W+ | Hi 123_world! | [' ', '!'] |
\d | 숫자 [0-9] | \d+ | Order 1234 | ['1234'] |
\D | 숫자가 아닌 것 | \D+ | Order 1234 | ['Order '] |
\s | 공백 문자 | \s+ | Hi there! | [' '] |
\S | 공백이 아닌 문자 | \S+ | Hi there! | ['Hi', 'there!'] |
* | 0회 이상 반복 | a*b | aaab | ['aaab'] |
+ | 1회 이상 반복 | a+b | aaab | ['aaab'] |
? | 0회 또는 1회 | ab? | a ab abb | ['a', 'ab'] |
{n} | 정확히 n회 반복 | a{3} | aa aaaa | ['aaa'] |
[abc] | a, b, 또는 c | [abc] | cat bat hat | ['c', 'a', 'b', 'a'] |
[^a-z] | 소문자가 아닌 것 | [^a-z] | a1B# | ['1', 'B', '#'] |