SKN Family AI Bootcamp 24기 / 2주차 - Web Crawling

A.·2026년 1월 31일

SKN 24

목록 보기
10/15

2026.01.14

웹 크롤링 (Web Crawling)

SSR (Server-Side Rendering)렌더링 주체가 서버
CSR (Client Side Rendering) 렌더링 주체가 브라우저

Beautiful Soup 정적크롤러
: HTML 파일을 읽어서 데이터를 추출하기 좋게 가공해주는 '파싱(Parsing) 라이브러리'
: 텍스트 데이터만 처리
: 브라우저에서 버튼을 눌러야 나타나는 정보나, 스크롤을 내려야 로딩되는 자바스크립트(JS) 기반 데이터는 가져올 수 없습니다.

Selenium - 동적크롤러
: 자바스크립트로 화면이 계속 변하는 사이트(유튜브 댓글, 인스타그램 등)의 데이터를 수집가능
동적 웹페이지 수집 및 자동화

profile
코린이

0개의 댓글