210702 FUNDAMENTAL 5. 문자열 파일 다루기

시에나 Sienna·2021년 7월 2일
0

AIFFEL

목록 보기
4/66

1. 문자열

1) 문자 검색

  • .startswith() : 문자열 앞에서 검색
  • .endswith(): 문자열 뒤에서부터 검색

2) 공백 문자 처리(trimming)

  • ex) space, \t, \n(줄바꿈 = 라인피드 line feed)
  • \r : 개행 복귀 (carriage return), 커서를 맨 앞(원위치)으로 이동(retrun)시키는 것
  • 공백 문자 제거 : .strip(), lstrip(), rstrip()
    (⚠️ 띄어쓰기 제거라는 말은 아님)

3) isX 형태 메소드

  • 결과 값이 boolean값으로 return!
  • isupper(), islower(), isalpha(), isdecimal()
  • istitle() : 문자열 첫글자만 대문자로 되어 있으면 True, 아니면 False
  • isalnum() : 문자열이 모두 알파벳 문자와 숫자로만 되어 있으면 True, 아니면 False

4) join() vs split()

  • join() :
    • tuple, list, string 등 반복 가능한(iterable) 객체를 인자로 받는 메소드
    • 각각의 원소를 모아 하나의 문자열로 합쳐 줌

5) replace()

  • replace(s1, s2) : 문자열 내 문자열 s1을 s2로 바꿈

6)가변객체 vs 불변객체

7) 정규 표현식

  1. 사용법
    1) 찾고자 하는 문자열의 패턴을 정의
    2) 정의된 패턴과 매칭되는 경우를 찾아 다양하게 처리

정규식 구현 순서

> import re
> .compile() : 어떤 패턴을 컴파일 함.
  1. 메소드
  • ex) search(), match(), findall(), split()
  • sub() : 일치하는 패턴으로 대체
  • group() : 실제 결과에 해당하는 문자열 반환
  1. 패턴:특수문자, 메타문자
    특수문자, 메타문자

2. 파일과 디렉토리

1) 파일 관련 메소드

  • f = open(), with open() as f, f.read(), f.write(str), f.close()
  • f.readline() : 파일을 한 줄씩 읽기
  • f.readlines() : 파일 안이 모든 줄을 읽어 그 값을 리스트로 반환
  • f.writelines(str) : 파일에 인자를 한 줄씬 씀
  • f.seek(offset) : 새 파일의 위치를 찾음

2) 디렉토리

3) 모듈과 패키지

  • 모듈(module) : 파이썬으로 만든 코드가 들어간 파일
  • 패키지(package) : init.py가 포함된 폴더로 흔히 라이브러리라고 칭함
  • PIP(Package Installer for Python) : 패키지 관리자로 파이썬을 설치하면 기본으로 설치됨
  • PyPA(Python Packaging Authority) : 파이선 패키지를 관리하고 유지하는 그룹
  • PyPI(The Python Package Index) : 파이썬 패키지들의 저장소

모듈과 패키지

  • sys.path : 현재 폴더와 파이썬 모듈들이 저장되어 있는 위치를 리스트 형태로 반환
  • sys.path.append() : 자신이 만든 모듈의 경로를 append 함수를 이용해서 추가함으로써 추가한 디렉토리에 있는 파이썬 모듈을 불러와 사용할 수 있다.
  • os.chdir() : 디렉토리 위치 변경
  • os.getcwd() : 현재 자신의 디렉터리 위치를 반환
  • os.mkdir() : 디렉토리 생성
  • os.rmdir() : 디렉토리 삭제 (단, 디렉토리가 비어 있을 경우)
  • glob.glob() : 해당 경로 안의 디렉토리나 파일들을 리스트 형태로 반환
  • os.path.join() : 경로(path)를 병합하여 새 경로 생성
  • os.listdir() : 디렉토리 안의 파일 및 서브 디렉토리 리스트
  • os.path.exists() : 파일 혹은 디렉토리의 경로 존재 여부 확인
  • os.path.isfile() : 파일 경로의 존재 여부 확인
  • os.path.isdir() : 디렉토리 경로의 존재 여부 확인
  • os.path.getsize() : 파일의 크기 확인

4) 판다스(Pandas)로 csv 파일 읽기

판다스

  • .to_csv() : 판다스를 이용해 데이터를 csv 파일로 저장

파이썬 문자열에서 join을 잊어서 알고리즘 해석에 어려웠는데 오늘 내용 참고해서 다시 봐보자!!👍

0개의 댓글