# 스크래핑

5개의 포스트
post-thumbnail

[번역] 텍스트 밀도를 통한 DOM 기반 컨텐츠 추출

최대한 원문 그대로 번역하고자 했고 애매한 부분들은 다 번역기 돌렸지만 그럼에도 불구하고 제가 이해한대로 번역했기 때문에 의역에 의한 왜곡이 있을 수 있습니다. 오타, 오역 지적해주시면 감사하겠습니다. 🥰

2021년 2월 3일
·
0개의 댓글

[크롤링 기초] 개념 잡기

크롤링 : 여러 사이트들의 데이터를 규칙적인 주기로 대량으로 수집스크래핑 : 웹사이트에서 작은 범위의 명확한 타겟 데이터를 수집 (자동화를 위해 주기 설정하면 크롤링보다 적지만 내가 원하는 데이터를 주기적으로 수집 가능)브라우저를 통해서 HTML tag로 보여지는 언어

2020년 10월 23일
·
0개의 댓글
post-thumbnail

Puppeteer 웹 스크래핑

Puppeteer Puppeteer는 Node.js 의 라이브러리로, 크롬 혹은 크로미움을 Headless 브라우저( GUI 가 없는 웹 브라우저) 상태로 조작할 수 있게 도와주는 API를 제공해 준다.

2020년 8월 11일
·
0개의 댓글
post-thumbnail

인스타그램 이미지,해시태그 크롤링

인스타그램 계정을 검색하면 해당계정의 이미지와 해시태그만 크롤링 하는 사이트를 제작한다.우선 파이썬과 크롤링을 하기위해 beautifulsoup4 와 selenium을 사용하였고, 파이썬 데이터를 html파일에 던져주기 위해 django 웹프레임워크를 사용하였다. 파이

2020년 4월 14일
·
0개의 댓글
post-thumbnail

puppeteer 사용해보기

puppeteer(퍼펫티어) 설치방법 공유합니다. > 기본 예제인 example.js 를 실행해봅니다. (네이버에 접속한 후 스크린샷 남기기) > 온라인에서 라이브로 코딩하여 실행해볼 수 있습니다. https://try-puppeteer.appspot.com/ 테스트환경 Ubuntu 18.04 설치 👉 puppeteer 설치하기 실행 코드 생성 ...

2020년 2월 5일
·
0개의 댓글