정규표현식은 문자열에서 특정 패턴을 검색하거나 치환하는데 사용되는 강력한 도구다. 파이썬의 re
모듈을 이용해 다양한 문자열 처리 작업을 할 수 있다.
정규표현식은 문자열에서 특정 패턴이나 문자의 시퀀스를 찾기 위해 사용되는 표현 방법이다. 복잡한 문자열 처리에 자주 사용되며, 여러 프로그래밍 언어에서 지원한다.
match
메서드는 문자열의 시작부터 패턴을 찾는다. 만약 시작부터 패턴이 일치하지 않으면 None
을 반환한다.
import re
pattern = r'Hello'
string = 'Hello, Python!'
match = re.match(pattern, string)
if match:
print("Match found:", match.group())
else:
print("No match")
search
메서드는 문자열 전체에서 첫 번째로 일치하는 패턴을 찾는다.
import re
pattern = r'Python'
string = 'Hello, Python!'
search = re.search(pattern, string)
if search:
print("Match found:", search.group())
else:
print("No match")
findall
메서드는 문자열 내에서 패턴과 일치하는 모든 부분을 찾는다.
import re
pattern = r'n'
string = 'Hello, Python!'
findall = re.findall(pattern, string)
print("All matches:", findall)
split
메서드는 패턴에 일치하는 부분에서 문자열을 분할한다.
import re
pattern = r'\s' # 공백 기준으로 분할
string = 'Hello, Python!'
split = re.split(pattern, string)
print("Split string:", split)
sub
메서드는 문자열에서 패턴과 일치하는 부분을 다른 문자열로 치환한다.
import re
pattern = r'Python'
replace_with = 'World'
string = 'Hello, Python!'
sub = re.sub(pattern, replace_with, string)
print("Substituted string:", sub)
정규표현식은 다양한 문자열 처리에 유용하게 사용되며, 복잡한 패턴을 간단한 표현으로 다룰 수 있다.