
더 발전시킨 코드로 돌아왔다. 한줄씩 차근차근 살펴보자 먼저, 그 전 코드를 지우고 16번째 줄 인, anchors = post.find_all('a') 부터 추가했다. ⦁ 여기를 보면 사이트 코드가 나와 있는데, 여기있는 'a'태그들 중 highlight된 두번째

2023 - 02 - 07지난 프로젝트에서 좀 더 진전시켜보도록 한다.이 부분까지 했었는데, else부분에 추가로 넣을 것이다.for - in 문으로 jobs의 갯수만큼 loop를 돌린다.find_all을 이용해 li태그가 들어간 것만 고를건데,지금 보는 사진이 wew

"이 문자열은 단순한 텍스트가 아니라 html 구조에 맞게 작성되어있어. 그러니 너도 html 의 관점에서 이 문자열을 이해해줘" 라고 하는 것과 동일합니다 사이트는 html 형식으로 짜여져 있기 때문에 html형식의 코드를 해석

2023 - 02 - 02이번 강의 부터는 구직사이트의 html코드를 받아와서 원하는 키워드에 해당하는 구직 요건들을 받아오는 프로젝트를 배웠다.기초적인 구성을 위해 사이트에서 requests를 받아오는 코드를 만들었다.먼저 get이라는 function을 사용하기 위해

2023 - 01 - 30 1. if문 if 문의 기본적인 구조는 이런 식인데, 여기서 조건문은 Boolean이다. 따라서, if 문은 조건문이 참인 경우에만 실행된다. 만약 여기서 조건문이 true로 판명된다면, A코드를 실행할 것이고, 조건문이 false로 판

⦁ 23번째 줄까지 작성을 해 보았고, 24번째 줄 부터 새로운 내용을 추가했다. 지금까지는 결과를 출력해 봤을때 html의 태그들이 함께 나와 보기가 불편했다. 그 점을 해결하기 위해 각각의 요소들을 dictionary에 정리해 dictionary 자체를 출력하는 방

⦁ 이제 우리는 새로운 사이트를 탐험해 볼 것이다. 사이트의 이름은 indeed인데, 이 곳에서도 weworkremotely에서 했던 것과 마찬가지의 작업을 할 것이다. ⦁ None

먼저, 출력을 위해 results 라는 list를 만들어 둔다.이제 jobs로 for loop를 돌릴건데,저번에 학습했던, None을 이용해, mosaic-zone을 걸러준다.anchor에서 알아두고 가야할 것이 있다.여기서 보면 jobTitle class를 가진 h2

이제 프로젝트가 거의 막바지를 향해 가고 있다. 오늘 해 볼 것은 검색 결과의 페이지 수 만큼 정보를 받아들여와 저장해보는 것을 해 볼것이다. ⦁ 페이지 정보 우선적으로 알아둬야 할 것이 있다. 사이트에 가 보면 정보가 5페이지를 넘는 검색어일 경우, 5페이지 다

이제 여정의 마지막을 달리고 있다. 이번 포스팅은 드디어 스크래핑한 내용을 토대로 excel에 그대로 넣어보는 과정을 따라 갈 것이다. ⦁ 1~4줄 먼저 main에 있던 indeed 코드를 extractors폴더에 indeed파일을 만들어 넣어주었고, main함수