정규표현식
정규표현식이란?
- 정규 표현식 또는 정규식은 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어이다. 정규 표현식은 많은 텍스트 편집기와 프로그래밍 언어에서 문자열의 검색과 치환을 위해 지원하고 있으며, 특히 펄과 Tcl은 언어 자체에 강력한 정규 표현식을 구현하고 있다.
정규표현식에 자주 사용되는 문자들
- .(Dot) - 모든 문자 하나
- ^(Caret) - 문자열의 시작
- $ - 문자열의 끝
- [] - []괄호에 있는 문자 하나, 예를 들어 [akz]라면 a 또는 z
- [^] - []괄호에 있는 문자 이외의 문자 하나, 만일[^ab]라면 a와 b를 제외한 문자 하나
- * - 0번 이상 반복, {0,}와 동일
- + - 1번 이상 반복, {1,}와 동일
- ? - 0번 또는 1번 반복, {0, 1}과 동일
- {n} - n번 반복
- {m, n} - 최소 m번에서 최대 n번까지 반복
- | - 예를 들어 A|B라면, A 또는 B
- [a-z] - a에서 z까지 임의의 문자, 즉 영문 소문자 한 개
- ₩w - 영문, 숫자 또는 밑줄() 한 개,[0-9a-zA-Z]와 동일
- ₩d - 숫자 한 개, [0-9]와 동일