[N422] Web Scraping

쥬쥬스·2023년 3월 28일
0

section4

목록 보기
7/15

Web Scraping

  • 의미 : 웹에서 데이터를 수집
  • file : HTML, JS, CSS

HTML

hyper text markup languae
태그들로 이루어져있음
빌드 과정을 거치지 않음

Tag 종류

  • 쌍을 이루는게 기본적
    <div> </div> 블록을 나눌 때
    <span> </sapn> 부분적인 스타일링
    <p> </p> 문장을 적을 때
    <a> </a> 하이퍼링크

rf : https://yunbinni.tistory.com/63

CSS

cascading style sheets
바디의 색상 변경 등 웹페이지 꾸며주는 역할

CSS Selector

꾸며주려면 class, id, type과 같은 정보를 엮어서 디자인해준다

DOM

documnet object model
웹페이지 구조, 문서 구조 → dom 을 사용해서 확인

Web Scraping 기초

정적 스크래핑 vs 동적 스크래핑

requests 라이브러리

  • 파이썬을 가지고 html 문서를 받아오는 역할

BeautifulSoup 라이브러리

https://www.w3schools.com/html/default.asp
https://hleecaster.com/python-web-crawling-with-beautifulsoup/
https://hogni.tistory.com/46

RF : 스크래핑

🔨 회고

정리가 이걸로는 훨씬 부족하지만 일단 업로드. 개념을 정리하는게 아니라 진짜 실제로 해보고 코드로 정리하는게 더 의미가 있을 것 같다. 코드를 아직 다 이해하진 못해서 업로드는 미루게 됐지만 진짜 이쪽 분야는 배우면 배울 수록 뭐가 넘쳐난다. 이걸 다 알고 기억하는건 무리겠지만, 어느정도 이해하고 이걸 사용할 줄 알기는 해야되지 않겠나...? 정말이지 웃음이 나오는 양이지만 .. 꾸준히 한다면 할 수 있을거다. 라고 생각하는 중...... 흥미롭지만 깊게 갈수록 머리아픔. 과제 제출 점수가 적나라하게 보이니 자꾸만 또 비교하게 된다. 제일 나쁜걸 알면서도 나만 이해 못한 것 같다는 생각에 침체된다. 하하 ^^..... 내가 알고 모르는 것에 더 집중하자. 자꾸만 다른 곳에 시선 돌리지 말고

profile
느려도... 꾸준히.....🐌

0개의 댓글