[구글시트활용 SQL쿼리_대시보드제작]_3_ 구글시트에서 데이터클렌징(표준화)으로 가공하기 (정규표현식 REGEXEXTRACT 추출, REGEXREPLACE 대체)

Hyejin Beck·2024년 3월 2일
0

Excel & Sheet

목록 보기
21/22

정규표현식으로 원하는 텍스트만 추출해내어 가공(변형) 해보겠습니다.

데이터클렌징(표준화)필요성


데이터 파싱 Parsing 으로 구분될 수 있는 데이터 타입을 최대한 나누어서, 편안한 가공형태로 처리해줍니다.


정규표현식(REGULAR EXPRESSION)

특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어입니다.


=regexextract(텍스트,"추출텍스트")

~를 ~에서 추출하겠다.

영문

있으면 추출,없으면 공백

기준으로 앞/뒤 글자까지 가져오기

. 그리고 ..

\w 그리고 \w\w

.+ 그리고 .+

\w+ 그리고 \w+

. 그리고 \w+

$그리고 $

그리고(.+)

한글

[가-힣] 그리고 +

( 괄호안에 ) 추출

어떤걸 기준으로 삼아 추출할 것인지, 기준에 따라 여러 방법이 있습니다.

=regexreplace(텍스트,"기존텍스트","대체텍스트")

~를 ~로 대체하겠다.

profile
데이터기반 스토리텔링을 통해 인사이트를 얻습니다.

0개의 댓글

관련 채용 정보