regex(정규식)
특정한 규칙을 가진 문자열의 집합을 표한하는데 사용하는 형식 언어이다. 주로 Programming Language / Text Editor 에서 문자열의 검색과 치환을 위한 용도로 사용되고 있다. 문자열 형식에 대한 조건문을 작성하는건 번거롭지만 정규식을 이용하면 매우 간단하게 표현할 수 있다.
하지만 단점으로는 공부하지 않으면 모른다는 것.. 아래 표를 보고 숙달하도록 하자.
Groups and Ranges
character | meaning |
---|
| | 또는 |
() | 그룹 |
[] | 문자셋, 괄호한에 어떤 문자든 |
[^] | 부정 문자셋, 괄호안의 어떤 것이 아님 |
(?:) | 찾지만 그룹으로 기억하지 않음 |
Quantifiers
character | meaning |
---|
? | zero or one |
* | zero or more |
+ | one or more |
{n} | n번 반복 |
{n,m} | 최소 n 번, 최대 m 번 |
Boundary-type
character | meaning |
---|
\b | 단어 경계 |
\B | 단어 경계 아님 |
^ | 문장의 시작 |
& | 문장의 끝 |
Character classes
character | meaning |
---|
\ | 특수문자 표시 |
. | 어떤글자(줄바꿈 문자 제외), 모든문자 |
\d | digit |
\D | not digit |
\w | word |
\W | not word |
\s | space |
\S | not space |