노마드 코더 Python으로 웹 스크래퍼 만들기
https://nomadcoders.co/python-for-beginners
지원 링크는 어떤 태그를 가져오면 되는지 확인하기 위해
StackOverflow 사이트에서 inspect 해보기
command나 ctrl키를 누른 채로 구직 정보 title을 클릭하면
입사 지원 링크가 새로운 창으로 열린다.
새로 열린 입사 지원 페이지 url을 본다.
뒤에 것을 지워도 되는지 확인한다.
뒤에 것을 지워도 똑같은 페이지로 이동됐다.
url에 있는 id를 가져오기 위해 페이지를 inspect 해본다.
data-jobid
라는 attribute에 있다.
job_id
라는 새로운 변수를 생성하고 data-jobid
를 넣어준다.
job_id = html['data-jobid']
지원 링크를 반환해 준다.
지원 링크를 잘 가져왔는지 확인하기 위해 출력해본다.
print(job)
지원 링크 복붙해서 들어가니까 잘 들어가진다.
확인했으니 print(job)
다시 지워주기
모든 일자리를 반환해서 main.py에서 실행해 보기로 한다.
indeed에 주석 처리 해놨던 거 없애준다.
jos
라는 변수를 새로 만든다.
indeed에서 반환한 리스트와 StackOverflow에서 반환한 리스트를 합해준다.
jobs = so_jobs + indeed_jobs
리스트 사이에 + 기호는 2개의 리스트를 합치는 기능을 한다.
so.py에 가서 페이지를 출력하게 만든다.
{page+1}
을 입력해서 1부터 88까지 나오게 한다.
indeed.py에 가서 아래와 같이 수정해준다.
지금보니까 indeed에서도 {page+1}
해줄 걸 그랬다. 0부터 19까지 나온다.
이제 실행해본다.
잘 되는 것 같다.