# beautifulsoup

31개의 포스트
post-thumbnail

[부스트캠프 Ai] Week 1 Day 5

File/Exception/Log Handling Execption 예상 가능한 예외 발생 여부를 사전에 인지할 수 있는 예외 사용자의 잘못된 입력, 파일 호출 시 파일 없음 개발자가 반드시 명시적으로 정의 해야함 예상 불가능한 예외 인터프리터 과정에서 발생하는 예

2021년 1월 22일
·
0개의 댓글

Selenium과 BeautifulSoup을 이용한 논문데이터 크롤링 - 크롬 드라이버 문제

논문 데이터 정보를 수집해야하는 업무를 하게 되었다. 연구실 홈페이지 업데이트하면서 기존에 데이터화되어있지 않은 논문 데이터(html 하드코딩 되어있던)을 데이터화해야 하는데.. 간단하게 홈페이지에 올라가는 데이터 200개 정도라 귀찮지 않을 거라 생각해서 별로

2020년 12월 19일
·
0개의 댓글
post-thumbnail

Web Crawling

WEb 크롤링 자동으로 긁어오는것(주기적으로) 스크래핑 한 순간의 데이터를 그냥 가져오는거(한 순간) beautifulsoup - HTML로 부터 XML을 뽑아내기 위한 library 에서 id , class 를 selector로 사용하여, 변수로 사용할 수 있

2020년 11월 30일
·
0개의 댓글
post-thumbnail

[Python] Beautiful Soup을 이용한 네이버 영화 랭킹 및 학교 강의계획안 크롤링

여기에 나와있는 영화 랭킹 크롤링 해보기import requestsfrom bs4 import BeautifulSoupurl = 'https://movie.naver.com/movie/sdb/rank/rmovie.nhn'response= requests.get

2020년 11월 22일
·
0개의 댓글

면접 질문 크롤링

페이지네이션 고려한 크롤링

2020년 10월 28일
·
0개의 댓글
post-thumbnail

BeautifulSoup와 selenium 이용한 구글 검색화면 크롤링 실습

크롤링 정규수업을 복습하다가, 영 혼자 해결을 못해서 유튜브로 조금 더 학습을 해봤다. 기존에 주피터 노트북에서만 하던 걸 벗어나 VS Code에서 .py 파일로

2020년 10월 26일
·
0개의 댓글
post-thumbnail

[TIL] Crawling (Django) - 미완

Crawling 수많은 인터넷상의 데이터들을 수집하기 위한 작업. python을 활용해서 내가 원하는 정보를 쉽게 크롤링 할 수가 있다. 일반적으로 * beautifulsoup4 & selenium* 과 같은 라이브러리가 쓰인다. CSV 파일 엑셀과 비슷한 행렬 구조

2020년 10월 4일
·
0개의 댓글
post-thumbnail

[TIL] bs4 사용해보자

오 뷰티풀~

2020년 10월 3일
·
0개의 댓글

TIL#65 KakaoFriends Crawling

1차 프로젝트 - kakao crawling

2020년 9월 16일
·
0개의 댓글
post-thumbnail

TIL#55 PYTHON Web Crawling

WEB CRAWLING (웹 크롤링)

2020년 9월 5일
·
0개의 댓글

Django 환율 계산 페이지 -2

✨아주대학교 멋쟁이사자처럼 8기 1학기 3주차 수업용으로 제작한 내용입니다.저번주 수업에 이은 내용입니다! 이전에는 그냥 숫자를 입력했다면 이번에는 웹 페이지에서 해당 내용을 직접 가져와보죠.크롤링(crawling) : 웹 상의 페이지를 수집하는 작업파싱(Parsing

2020년 8월 18일
·
0개의 댓글
post-thumbnail

빌보드 차트로 연습하는 웹 크롤링

빌보드 차트로 웹크롤링에 대하여 알아보겠습니다.우선, 빌보드 차트를 한번 보시죠~짜쟌~ 이런식으로 구성되어있습니다.빌보드차트에서 순위, 곡, 아티스트 정보, 이미지를 BeutifulSoup/셀레니움을 이용하여 크롤링 해보겠습니다~!우선, 크롤링을 위한 새로운 가상환경을

2020년 8월 2일
·
0개의 댓글

BeautifulSoup 예외처리

어떤 웹 사이트를 크롤링하던지 에러를 만나지 않을 수가 없다. 이럴 때 당황하지 않고 어떻게 처리해야하는지 궁금해져서 책을 구매했다.. ㅋㅋㅋㅋ 🤣. 앞으로 파이썬으로 웹 크롤러 만들기(2판)과 함께 종종 웹 크롤링 포스팅을 해보려고 한다. 우리가 웹 크롤링을 할 때

2020년 7월 30일
·
0개의 댓글

스타벅스 페이지로 시작하는 웹 크롤링

위코드 11기 웹 크롤링의 두 번째 과제에 대해 발표를 준비하게된 겸해서 블로그에 정리까지 하기로 했다. 과제는 스타벅스 코리아 음료페이지에서 음료의 이름과 그 이미지 URL을 csv 파일에 담는 것이다. 그럼 시작해보자!웹 크롤링이란 웹 상에서 존재하는 컨텐츠를 수집

2020년 7월 28일
·
0개의 댓글

Web Crawling 연습

빌보드차트처음 해보기도 하지만, 잘 이해하지못해 3일내내 이 코드만 붇잡고있었다.먼저 크롤링하여 받을 값들을 저장하기위해 csv를 설정해주었다, .writerow를 사용하여 해당csv의 값들의 title을 정해주었다.그다음 Chromedriver를 사용할 준비를 한다.

2020년 6월 4일
·
0개의 댓글

네이버 뉴스 크롤링 - 특정 검색어에 대한 결과

https://search.naver.com/search.naver?where=news&sm=tab_jum&query=%EC%BD%94%EC%95%8C%EB%9D%BC특정 검색어에 대한 네이버에 등록된 모든 뉴스의 기사제목, 날짜, 언론사명, 기사링크를 csv

2020년 5월 30일
·
0개의 댓글

빌보드 차트 HOT 100 크롤링

https://www.billboard.com/charts/hot-100빌보드 차트 순위 100 사이트에서 순위, 곡, 아티스트 정보를 BeutifulSoup으로 크롤링하여 csv파일로 저장하기

2020년 5월 30일
·
0개의 댓글