정규표현식 사용해보기

개현·2022년 6월 8일

배경

어제 대량의 데이터를 차트로 그려내는 작업을 하며 테스트 더미 데이터를 출력하기 위해 데이터를 넣고 그려내려하는데 오류가 발생했다?
그래서 확인해보니 데이터로 들어갈 값의 양식에 문제가 있었다..

[01,12,23,04
04,02,01,05
44,12,07,06
12,24,87,07
29,80,52,18]

위와 같은 상황에 발생한 오류였다. 위 데이터를 잘 보면 끝에 "," 콤마가 붙어있지 않았다. 물론 이 정도로 작은 데이터면 직접 붙이겠지만 당시 데이터는 천개가 넘는 상황이었다.

정규표현식을 사용하여 Replace 해보기

천개가 넘는 데이터들을 직접 콤마를 붙여 바꾼다는건 너무 비효율적이지 않은가?
그래서 정규표현식을 사용해보기로 했다.

참고로 정규표현식을 이용한 Replace 작업은 notepad++에서 진행했다.

노트패드에서 Ctrl+F를 눌러 검색창을 띄운 후 바꾸기탭에서 정규 표현식 사용을 체크했다.

아래와 같이 입력 후

찾을 내용 - '[^,]\n
바꿀 내용 - ',\n

'[^,]\n 이게 무슨 의미냐면 작은 따옴표(') 오른쪽에 콤마가 없으며([^,]) 줄바꿈(\n)이 일어나는 위치를 찾으라는 의미다. 그리고 바꿀 내용은 별거 없다. ,를 찍고 줄바꿈을 하라는 의미다.

그리고 모두 바꾸기를 클릭하면!

[01,12,23,04,
04,02,01,05,
44,12,07,06,
12,24,87,07,
29,80,52,18]

위 처럼 아주 정상적으로 오른쪽 끝에 콤마가 추가되었다.

이번 경우엔 아주 간단한 상황이었지만 정규식을 잘 활용하면 많은 시간을 줄이고 효율적으로 작업이 가능하다. 이번 기회에 정규식에 대해 공부해서 포스팅해볼 생각이다.

profile
세계 최강의 개발자가 되기까지 도전!

0개의 댓글