자연어 전처리

DONGJIN IM·2022년 4월 25일

AI 실전 활용 관련

목록 보기

7/7

대소문자 변환
- upper() : 대문자로 변환
- lower() : 소문자로 변환
- capitalize() : 문자열의 첫 문자를 대문자로 변환
- title() : 문자열에서 각 단어의 첫 문자를 대문자로 변환
편집 및 치환
- strip() : 좌우 공백 제거
- rstrip() : 오른쪽 공백 제거
- lstrip() : 왼쪽 공백 제거
- replace(a,b) : a를 b로 치환
분리, 결합
- split() : 공백으로 분리
- ''.join(s) : 리스트 s에 있는 요소를 String으로 결합
문자열 판별
- startswith('hi') : 문자열이 hi로 시작하는지 파악
- endswith('hi') : 문자열이 hi로 끝나는지 파악
검색
- count('hi') : 'hi'가 출현한 횟수 반환
- find('hi') : "처음" 'hi'가 출현한 위치 리턴. 없을 경우 -1 반환
- index('hi') : find()와 비슷하나 없을 경우 Exception 발생

개념부터 확실히!