[크롤링] 6장 데이터 저장

채린·2023년 11월 10일
0

1. 미디어 파일

파일 참조를 저장

파일이 위치한 URL을 저장
장점: 빠름. 공간 아낌
단점: 핫링크의 위험성. 외부 파일은 변경 가능

파일 자체를 내려받기

urllib라이브러리: 파일콘텐츠도 가져올 수 있음

ex.로고 내려받아 스크립트 실행한 디렐터리에 logo.jpg저장 ex. scr속성의 파일 전부 내려받기

2. 데이터를 CSV로 저장

csv(cmma-seperated values) - 쉼표로 구분된 값

python의 csv라이브러리로 CSV파일 쉽게 수정, 생성 가능

html테이블 -> csv파일
get_text()fh 색깔, 링크, 정렬기능, 기타 html코드 제거

0개의 댓글