[SK shiedlus Rookies 23]Python(6-4)_24.10.22: 정규식

박소민·2024년 11월 4일

Python

목록 보기
17/23

이스케이프 문자

  1. \일반 문자
    • 문자 클레스( [ .. ] )내에서 하나의 문자로 인식
    • [ \. ] == [ . ] 두표현 같은의미
           ↪️ 여기서 "\" 기호는 "구분용"
  2. \예약된 문자
<Ex.>
- 탭 : \t
  - 줄바꿈 : \n
  - 라인피드 : \r
  - 화이트스페이스 -> print() 출력하면 아무값도 없이 기능만작동
  1. 정규식용 예약된문자
 <Ex.>
  - \d <-> \D
  - \s <-> \S
  - \w <-> \W
  - \b

정규식용 예약문자

\d ⮂ \D

  • 숫자만 ⮂ 숫자를 제외한 모든 문자

\s ⮂ \S

  • 화이트 스페이스 ⮂ 화이트 스페이스 제외한 모든 문자

\w ⮂ \W

  • 숫자, 문자특수문자,화이트스페이스

\b

  • raw string : 화이트스페이하나의 문자로 보장받아서 표현할때
  • 문자열 표식
    • '' : 일반 형식
    • b'': 읽거나 쓰거나 통신
    • r''[raw string]

Ex.01 > '' 일반 문자열 표현
Ex.01-1 > print() 출력 ➕ 화이트 스페이스 보장 되기
: raw string표현 => 강제로 화이트스페이스 문자로 보장
Ex.02 > r'' + \b 문자열 \b : 순수 문자열 위치 찾기
(1) class
(2) 가나다


주요함수

🔻[[To. 정규식 일치 데이터의 존재여부]]

re.match()

  • 문자열 처음(시작)이 정규식에 매칭되는지 체크
  • 매칭결과(매칭되는 내용)를 반환

re.search()

  • 문자열 전체에서 정규식에 매칭되는지 체크
  • 매칭결과 반환

🔻[[ To. 데이터 대체 (추출 / 제거) ]]

💥re.sub()

  • 주요작업 : 클리닝(노이즈 제거, 전처리)

🔻[[To.정규식에 일치하는 데이터 찾기]]

re.findall()

  • 모두 추출 -> 통상 리스트
    Ex.01 > res 를 하나의 문자열로 구성: join() <-> split()

re.finditer()

  • 모두 추출 -> 통상 이터레이터

0개의 댓글