정규표현식 소개

Kim Jin Hyeok·2021년 2월 15일
0

정규표현식의 필요성

정규표현식(regular expressions, 정규식, regex)은 특정 문제를 해결할 수 있는 도구다.
다음과 같은 상황을 상상해 보자.

  • 대소문자를 구별하지 않고 car라는 텍스트를 찾는데, 단어 중간에 car가 들어간 경우는 제외할 경우(scar, carry 등)
  • DB에서 뽑흔 텍스트를 태그를 포함하여 웹페이지에 출력하려고 할 때
  • 회원가입과 같은 input 폼이 있는 웹페이지를 만들 때 형식이 맞게 작성되었는지 확인할 때
  • 소스코드에서 단어를 조건에 맞게 치환하려고 할 때
  • 특정 텍스트가 포함된 파일들을 걸러낼 때
  • csv 등의 데이터를 처리할 때
  • 파일의 특정 위치에서 원하는 텍스트를 찾을 때

물론 이와같은 문제들은 조건문과 문자열 조작을 통해 해결할 수 있지만 너무 복잡하고 수동으로 해야한다. 또는 정규표현식을 사용하여 해결할 수 있다.

정규표현식은 정확히 무엇인가?

위 문제 상황들을 살펴보면 두 가지 유형으로 나눌 수 있다. 원하는 정보가 어딨는지 찾거나(검색), 정보를 찾은 뒤 편집(치환)하는 것이다. 쉽게 말해 정규표현식은 텍스트를 찾고 조작하는 데 쓰는 문자열이다.

정규 표현식은 완전한 언어는 아니지만, 다른 언어나 제품에 포함된 작은 언어(mini language)일 때가 많다.

참고: Ben Forta, Learning Regular Expressions(2018)

0개의 댓글