RegExp

김동현·2021년 9월 9일
0

JavaScript

목록 보기
15/32
post-thumbnail

정규표현식이란?

정규 표현식이란 일정한 패턴을 가진 문자열 집합을 표현하기 위한 형식 언어입니다.

정규 표현식은 문자열을 대상으로 패턴 매칭 기능을 제공합니다. 패턴 매칭 기능이란 특정 패턴과 일치하는 문자열을 검색하거나 추출 또는 치환할 수 있는 기능을 말합니다.

정규 표현식의 생성

정규 표현식 객체(RegExp 객체)를 생성하기 위해서는 정규 표현식 리터럴 또는 RegExp 생성자 함수를 사용하여 생성합니다.

정규 표현식 리터럴은 다음과 같은 형태를 갖고 있습니다.

// pattern: regExp
// flag: i

const regExp = /regExp/i;

이처럼 정규 표현식 리터럴은 패턴과 플래그로 구성됩니다. 정규 표현식 리터럴을 사용하여 간단한 정규 표현식 객체를 생성해보겠습니다.

const target = 'Is this all there is?';
// 패턴: is
// 플래그: i
const regExp = /is/i;

// test 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 
//매칭 결과를 불리언 값으로 반환합니다.
regExp.test(target); // true

RegExp 생성자 함수를 사용하여 RegExp 객체를 생성할 수 있습니다.

/**
 *pattern: 정규 표현식의 패턴
 *flags: 정규 표현식의 플래그
 */
 
new Date(pattern[, flags]);
const target = 'Is this all there is?';
const regExp = new RegExp(/is/i);

regExp.test(target); // true

RegExp 메서드

정규 표현식을 사용하는 메서드는 RegExp.prototype.exec, RegExp.prototype.test, String.prototype.match, String.prototype.replace, String.prototype.search, String.prototype.split 메서드 등이 있습니다.

1. RegExp.prototype.exec

exec 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환합니다. 이때 매칭 결과가 없으면 null을 반환합니다.

const target = 'Is this all there is?';
const regExp = /is/;

regExp.exec(target); // ["is", index: 5, input: "Is this all there is?", groups: undefined]

exec 메서드는 문자열 내의 모든 패턴을 검색하는 g 플래그를 지정해도 첫 번째 매칭 결과만 반환하므로 주의해야 합니다.

2. RegExp.prototype.test

test 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환합니다.

const target = 'Is this all there is?';
const regExp = /is/;
regExp.test(target); // true;

3. String.prototype.match

match 메서드는 대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환합니다.

const target = 'Is this all there is?';
const regExp = /is/;
target.match(regExp); // ['Is', index: 5, input: 'Is this all there is?', groups: undefined]

RegExp.prototype.exec 메서드는 문자열 내의 모든 패턴을 검색하는 g 플래그를 지정해도 첫 번쨰 매칭 결과만 반환하지만, String.prototype.match 메서드는 g 플래그가 지정되면 모든 매칭 결과를 배열로 반환합니다.

const target = 'Is this all there is?';
const regExp = /is/g;
target.match(regExp); // ["is", "is"]

플래그

패턴과 함께 정규 표현식을 구성하는 플래그는 정규 표현식의 검색 방식을 설정하기 위해 사용한다.

플래그의미설명
iIgnore case대소문자를 구별하지 않고 패턴을 검색
gGlobal대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다.
mMulti line문자열의 행이 바뀌더라도 패턴 검색을 계속한다.

플래그는 옵션으로 선택적으로 사용할 수 있으며, 순서와 상관없이 하나 이상의 플래그를 동시에 지정할 수 있습니다.

패턴

정규 표현식의 패턴은 문자열의 일정한 규칙을 표현하기 위해 사용하며, 정규 표현식의 플래그는 정규 표현식의 검색 방식을 설정하기 위해 사용합니다.

패턴은 /로 열고 닫으며 문자열의 따옴표는 생략합니다. 따옴표를 포함하면 따옴표까지 패턴에 포함되어 검색됩니다.

어떤 문자열내에 패턴과 일치하는 문자열이 존재하는 경우 "정규 표현식과 매치한다"라고 표현합니다.

문자열 검색

정규 표현식의 패턴에 문자 또는 문자열을 지정하면 검색 대상 문자열에서 패턴으로 지정한 문자 또는 문자열을 검색합니다. 물론 정규 표현식을 생성하는 것만으로 수행되지 않습니다. 앞서 살펴본 RegExp 메서드를 사용하여 검색 대상 문자열과 정규 표현식의 매칭 결과를 구하면 검색이 수행됩니다.

검색 대상 문자열과 플래그를 생략한 정규 표현식의 매칭 결과를 구하면 대소문자를 구별하여 정규 표현식과 매치한 첫 번째 결과만 반환합니다.

const target = 'Is this all there is?";

// 'is' 문자열과 매치하는 패턴. 플래그가 생략되었으므로 대소문자를 구별합니다.
const regExp = /is/;

// target과 정규 표현식이 매치하는지 테스트한다.
regExp.test(target); // true

// target과 정규 표현식의 매칭 결과를 구한다.
target.match(regExp); // ["is", index: 5, input: "Is this all there is?", groups: undefined]

대소 문자를 구별하지 않고 검색하려면 i 플래그를 사용합니다.

const target = 'Is this all there is?';
const regExp = /is/i;
target.match(regExp); // ["Is", index: 0, input: "Is this all there is?", groups: undefined]

검색 대상 문자열 내에서 패턴과 매치하는 모든 문자열을 전역 검색하려면 플래그 g를 사용합니다.

const target = "Is this all there is?"
const regExp = /is/g;
target.match(regExp); // ["Is", "is", "is"]

임의의 문자열 검색

. 은 임의의 문자열 한 개를 의미합니다. 문자의 내용은 어떤 것이든 상관없습니다.

만약 .를 3개 연속해서 패턴을 사용했다면 문자의 내용과는 상관없이 3자리 문자열과 매치합니다.

const target = 'Is this all there is?';
const regExp = /.../g;
target.match(regExp); // ["Is ", "thi", "s a", "ll ", "the", "re ", "is?"]

반복 검색

{m, n}앞선 패턴이 최소 m번 최대 n번 반복되는 문자열을 의미합니다.

const target = 'A AA B BB Aa Bb AAA';
const regExp = /A{1,2}/g;
target.match(regExp); // ["A", "AA", "A", "AA", "A"]

{n}앞선 패턴을 n번 반복되는 문자열을 의미합니다. 즉, {n}{n,n}과 같다.

const target = 'A AA B BB Aa Bb AAA';
const regExp = /A{2}/g;
target.match(regExp); // ["AA", "AA"]

{n,}앞선 패턴을 최소 n번 이상 반복하는 문자열을 의미한다.

const target = 'A AA B BB Aa Bb AAA';
const regExp = /A{2,}/g;
target.match(regExp); // ["AA", "AAA"]

+앞선 패턴이 최소 한 번 이상 반복되는 문자열을 의미한다. 즉, +{1,}과 같다.

const target = 'A AA B BB Aa Bb AAA';
const regExp = /A+/g;
target.match(regExp); ["A", "AA", "A", "AAA"]

OR 검색

|는 or의 의미를 갖습니다. 예를 들어, /A|B/는 'A'또는 'B'를 의미합니다.

const target = 'A AA B Bb Aa Bb';
const regExp = /A|B/g;
target.match(regExp); // ["A", "A", "A", "B", "B", "A", "B"]

[] 안의 문자는 어떤 문자가와도 대응합니다. 범위를 지정하려면 []안에 -를 사용합니다.

const target = 'A AA BB ZZ Aa Bb';
const regExp = /[A-Z]+/g;
target.match(regExp); // ["A", "AA", "BB", "ZZ", "A", "B"]

\d는 숫자를 의미합니다, 즉, \d[0-9]와 같은 의미를 갖고있으며, \D\d와 반대로 동작한다. 즉, \D는 숫자가 아닌 문자를 의미한다.

const target = 'AA BB 12,345';
const regExp = /[\d,]/+g;
target.match(regExp); // ["12,345"];

\w는 알파벳, 숫자, 언더스코어를 의미합니다. \w[A-Za-z0-9_]와 같다. \W\w와 반대로 동작한다. 즉, \W는 알파벳, 숫자, 언더스코어가 아닌 문자를 의미합니다.

const target = 'Aa Bb 12,345 _$%&';
let regExp = /[\w,]+/g;
target.match(regExp); // ["Aa", "Bb", "12,345", "_"]

regExp = /[\W,]+/g;
target.match(regExp); // [" ", " ", ",", " ", "$%&"]

NOT 검색

[...] 내의 ^은 not의 의미를 갖는다. 예를 들어, [^0-9]는 숫자를 제외한 문자를 의미한다. 따라서 [0-9]와 같은 의미의 \d와 반대로 동작하는 \D[^0-9]와 같고, [A-Za-z0-9_]과 같은 의미의 \w와 반대로 동작하는 \W[^A-Za-z0-9_]와 같다.

const target = 'AA BB 12 Aa Bb';
const regExp = /[^0-9]+/g;
target.match(regExp); // ["AA BB ", " Aa Bb"]

시작 위치로 검색

[...] 밖의 ^는 문자열의 시작을 의미한다. 단, [...] 내의 ^는 not의 의미를 가지므로 주의해서 사용해야 한다.

const target = 'https://google.com';
const regExp = /^https/;
regExp.test(regExp); // true

마지막 위치로 검색

$는 문자열의 마지막을 의미합니다.

const target = 'https://google.com';
const regExp = /com$/;
regExp.test(target); // true;
profile
Frontend Dev

0개의 댓글