[SK shiedlus Rookies 23]Python(5)_24.10.21

박소민·2024년 10월 30일

Python

목록 보기
11/23

파이썬으로 구현

추가 키워드


최종 요청 URL 생성


요청 처리

출력 결과

📚 참고


💥통신모듈 함수화

추가 덧붙이기

⭐⭐핵심


응답결과 피싱

  • 목적

    • To. 획득한 데이터를 DB(혹은 csv)에 적제(삽입) ➜ 데이터 추출/가공(전처리)
  • 형태

[
  {
    키:값, ....
  },
  {
    키:값, ....
  },
  ...
]


                ⤷ (* raw data: 정보로 처리되기 전, 미가공 상태의 자료 제공 형태)

                              🔽🔽🔽

Ex> 필요한 Data 파싱하기![]

                       🔽🔽🔽

노이즈 제거

  • 제거 방법

    • In 문자열 : replace() <- 용도: 대체처리
    • 정규식 : 복잡한 패턴을 찾아서 대체처리(여기서는 제거) 가능
  • 노이즈 예시

                         🔽🔽🔽

    정규식 대체

💥파싱모듈 함수화

DB에 입력하기위한 데이터 변환/처리

  • 위의 단계에서, clean_datapandas의 DataFrame(2차원)형태로 변환 시
    • 분석
    • 덤프 ➔ where. 데이터베이스, 엑셀, csv 등 파일 구조

Ex. data 프레임 생성

0개의 댓글