const str = `
010-1234-5678
thesecon@gmail.com
https://www.omdbapi.com/?apikey=7035c60c&s=frozen
The quick brown fox jumps over the lazy dog.
abbcccdddd
`
위와 같은 문자열 데이터를 정규식 표현으로 검색, 가공 할 수 있다.
정규표현식에는 두가지 표현 방식이 있다.
new RegExp('표현', '옵션')
new RegExp('[a-z]', 'gi')
/표현/옵션
/[a-z]/gi
메소드 | 문법 | 설명 |
---|---|---|
test | 정규식.test(문자열) | 일치 여부(Boolean) 반환 |
match | 문자열.match(정규식) | 일치하는 문자의 배열(Array) 반환 |
replace | 문자열.replace(정규식, 대체문자) | 일치하는 문자를 대체 |
플래그 | 설명 |
---|---|
g | 모든 문자 일치(global) |
i | 영어 대소문자를 구분 않고 일치(ignore case) |
m | 여러 줄 일치(multi line) 즉 ₩n을 기준으로 각각의 줄을 시작과 끝으로 보겠다는 의미. |
ex)
str.match(/\./gi)
// str에서 대소문자를 구분하지 않고 .을 찾는다.
str.match(/\.$/gi)
// str에서 대소문자를 구분하지 않고 .으로 끝나는 곳을 찾는다. 이때 str의 시작은 "가 열리는곳, 끝은 "가 닫히는곳 으로 각1군데씩 있다.
str.match(/\.$/gim)
//str에서 대소문자를 구분하지 않고 .으로 끝나는 곳을 찾는데 이때 ₩n을 기준으로 시작과 끝 pair라고 보고 확인한다.
패턴 | 설명 |
---|---|
^ab | 줄(Line) 시작에 있는 ab와 일치 |
ab$ | 줄(Line) 끝에 있는 ab와 일치 |
. | 임의의 한 문자와 일치 |
a|b | a 또는 b와 일치 |
https? | s가 없거나 https와 일치 |
{3} | 3개 연속 일치 |
{3,} | 3개 이상 연속 일치 |
{3,5} | 3개 이상 5개 이하(3~5개) 연속 일치 |
[abc] | a 또는 b 또는 c |
[a-z] | a부터 z 사이의 문자 구간에 일치(영어 소문자) |
[A-Z] | A부터 Z 사이의 문자 구간에 일치(영어 대문자) |
[0-9] | 0부터 9 사이의 문자 구간에 일치(숫자) |
[가-힣] | 가부터 힣 사이의 문자 구간에 일치(한글) |
\w | 63개 문자(Word, 대소영문52개 + 숫자10개 + _)에 일치 |
\b | 63개 문자에 일치하지 않는 문자 경계(Boundary) |
\d | 숫자(Digit)에 일치 |
\s | 공백(Space, Tab 등)에 일치 |
(?=) | 앞쪽 일치(Lookahead) |
(?<=) | 뒤쪽 일치(Lookbehind) |
str.match(/\w{2,3}/g)
// str에서 숫자나 알파벳중에 2이상 3이하가 연속으로 일치하는 것을 찾는다. 예) 010,the, sec, bro 등등
str.match(/\b\w{2,3}\b/g)
// str.match(/\w{2,3}/g)의 결과중 앞뒤가 숫자나 알파벳이 아닌것(경계)으로 시작되고 끝나는 것 예) 010, com, www 등 즉 문자가 연속되지 않고 앞 뒤에 - 나 공백, 특수문자 등이 있음.
https://heropy.blog/2018/10/28/regexp/
https://regexr.com/
https://regex101.com/
https://regexper.com/