정규표현식(RegExp)

하연·2021년 9월 8일
0

HTML/JavaScript

목록 보기
7/10

정규식, Regular Expression의 역할

  • 문자 검색(search)
  • 문자 대체(replace)
  • 문자 추출(extract)
const str = `
010-1234-5678
thesecon@gmail.com
https://www.omdbapi.com/?apikey=7035c60c&s=frozen
The quick brown fox jumps over the lazy dog.
abbcccdddd
`

위와 같은 문자열 데이터를 정규식 표현으로 검색, 가공 할 수 있다.

정규식 생성

정규표현식에는 두가지 표현 방식이 있다.

  1. 생성자
new RegExp('표현', '옵션')
new RegExp('[a-z]', 'gi')
  1. 리터럴
/표현/옵션
/[a-z]/gi

메소드

메소드문법설명
test정규식.test(문자열)일치 여부(Boolean) 반환
match문자열.match(정규식)일치하는 문자의 배열(Array) 반환
replace문자열.replace(정규식, 대체문자)일치하는 문자를 대체

플래그(옵션)

플래그설명
g모든 문자 일치(global)
i영어 대소문자를 구분 않고 일치(ignore case)
m여러 줄 일치(multi line) 즉 ₩n을 기준으로 각각의 줄을 시작과 끝으로 보겠다는 의미.

ex)

str.match(/\./gi)
// str에서 대소문자를 구분하지 않고 .을 찾는다.
str.match(/\.$/gi)
// str에서 대소문자를 구분하지 않고 .으로 끝나는 곳을 찾는다. 이때 str의 시작은 "가 열리는곳, 끝은 "가 닫히는곳 으로 각1군데씩 있다. 
str.match(/\.$/gim)
//str에서 대소문자를 구분하지 않고 .으로 끝나는 곳을 찾는데 이때 ₩n을 기준으로 시작과 끝 pair라고 보고 확인한다. 

패턴(표현)

패턴설명
^ab줄(Line) 시작에 있는 ab와 일치
ab$줄(Line) 끝에 있는 ab와 일치
.임의의 한 문자와 일치
a|ba 또는 b와 일치
https?s가 없거나 https와 일치
{3}3개 연속 일치
{3,}3개 이상 연속 일치
{3,5}3개 이상 5개 이하(3~5개) 연속 일치
[abc]a 또는 b 또는 c
[a-z]a부터 z 사이의 문자 구간에 일치(영어 소문자)
[A-Z]A부터 Z 사이의 문자 구간에 일치(영어 대문자)
[0-9]0부터 9 사이의 문자 구간에 일치(숫자)
[가-힣]가부터 힣 사이의 문자 구간에 일치(한글)
\w63개 문자(Word, 대소영문52개 + 숫자10개 + _)에 일치
\b63개 문자에 일치하지 않는 문자 경계(Boundary)
\d숫자(Digit)에 일치
\s공백(Space, Tab 등)에 일치
(?=)앞쪽 일치(Lookahead)
(?<=)뒤쪽 일치(Lookbehind)
str.match(/\w{2,3}/g)
// str에서 숫자나 알파벳중에 2이상 3이하가 연속으로 일치하는 것을 찾는다. 예) 010,the, sec, bro 등등
str.match(/\b\w{2,3}\b/g)
// str.match(/\w{2,3}/g)의 결과중 앞뒤가 숫자나 알파벳이 아닌것(경계)으로 시작되고 끝나는 것 예) 010, com, www 등 즉 문자가 연속되지 않고 앞 뒤에 - 나 공백, 특수문자 등이 있음.

https://heropy.blog/2018/10/28/regexp/

RegExr (테스트 사이트)

https://regexr.com/
https://regex101.com/
https://regexper.com/

0개의 댓글