[Python] Python으로 웹 스크래퍼 만들기 (2.13 StackOverflow Finish)

Jeongyun Heo·2020년 12월 26일
0
post-thumbnail

노마드 코더 Python으로 웹 스크래퍼 만들기
https://nomadcoders.co/python-for-beginners

2.13 StackOverflow Finish

✍️  지원 링크 가져오기

지원 링크는 어떤 태그를 가져오면 되는지 확인하기 위해
StackOverflow 사이트에서 inspect 해보기

command나 ctrl키를 누른 채로 구직 정보 title을 클릭하면
입사 지원 링크가 새로운 창으로 열린다.

새로 열린 입사 지원 페이지 url을 본다.
뒤에 것을 지워도 되는지 확인한다.

뒤에 것을 지워도 똑같은 페이지로 이동됐다.

url에 있는 id를 가져오기 위해 페이지를 inspect 해본다.

data-jobid 라는 attribute에 있다.

job_id 라는 새로운 변수를 생성하고 data-jobid를 넣어준다.
job_id = html['data-jobid']

지원 링크를 반환해 준다.

지원 링크를 잘 가져왔는지 확인하기 위해 출력해본다.
print(job)

지원 링크 복붙해서 들어가니까 잘 들어가진다.

확인했으니 print(job) 다시 지워주기

모든 일자리를 반환해서 main.py에서 실행해 보기로 한다.

indeed에 주석 처리 해놨던 거 없애준다.

jos 라는 변수를 새로 만든다.

indeed에서 반환한 리스트와 StackOverflow에서 반환한 리스트를 합해준다.
jobs = so_jobs + indeed_jobs
리스트 사이에 + 기호는 2개의 리스트를 합치는 기능을 한다.

so.py에 가서 페이지를 출력하게 만든다.

{page+1}을 입력해서 1부터 88까지 나오게 한다.

indeed.py에 가서 아래와 같이 수정해준다.
지금보니까 indeed에서도 {page+1} 해줄 걸 그랬다. 0부터 19까지 나온다.

이제 실행해본다.

잘 되는 것 같다.

0개의 댓글