2022-여름인턴 근무일지-1

송하·2022년 7월 7일
0

2022-여름인턴

목록 보기
1/4
post-thumbnail

😫 2022년 7월 7일 목요일

어떻게 시작하게 됐냐면..
겨울방학에 두달간 인턴하면서 힘들었었고 학기중에도 6전공과 공대장 일을 병행하니 너무 힘들었었다.. 그래서 이번 방학은 인턴을 쉬어야겠다 생각했지만..! 아빠랑 밥먹으면서 아빠가 인턴 안하냐 길래 '아.. 한달이면 할텐데 두달이라ㅠ 이번엔 지원안하려고~' 했다가 아빠가 잡아준 인턴..

7/4일부터 7/29일까지 딱 4주만 일하기로했다.. (이것도 와서 보니까 1일~31일 근무여야하는데 아빠친구 딸이어서 봐주신거 같기도..) 저번 인턴때 회사랑은 완전히 다른 분위기고 부장님도, 팀장님도 왔으니 뭐라도 얻어가라고 하셨다. (나같은 말하는 감자에게도 일을 주셔서 너무 감사하다) 여러가지 작업들을 주셨는데 그 중 원래부터 해야겠다고 생각하던 크롤링을 하기로 했다.

그래서 바로 크롤링 공부를 시작했다. request 혹은 selenium을 이용하는 것인데.. selenium은 하면서 코드에러가 정말 많이 떠서 빡쳤다..^^ 그래서 부장님이 pytube와 request-html을 사용해서 유튜브 크롤링을 진행해보라고 알려주셨다. 그래서 공부하는 pytube...!

1. pytube 설치

먼저 pytube를 설치해보자. 나는 이걸 인턴하면서 처음들어봤는데.. 이걸 사용하려면 db가 잘 구축되어있어야 하는것도 같았다.. 완벽하게 이해하지 못했지만 아래서 부터 차근차근해야지

아래의 링크를 따라 들어가면 pytube 사용자 가이드가 나온다. 사용자 가이드를 따라서 설치를 진행했다.
👉 https://pytube.io/en/latest/

pip install pytube
curl -OL https://github.com/pytube/pytube/tarball/master

이 코드를 터미널에 입력하여 pytube를 설치하고 소스코드를 가지고 온다. 그 뒤에 아래의 코드를 이용해서 유튜브 동영상 제목을 가져오려는데...

ERROR: Unable to download webpage: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1123)> (caused by URLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1123)')))

이런식의 에러가 뜨더라 (내가 복사하진 못했고 아래의 링크를 참고했다) 그래서 아래의 링크를 통해 해결하려고 했다. 문제는 내 컴퓨터에 파이썬은 3.9버전이었고.. 어느순간 파이썬 폴더가 3.10으로 바뀌어있었다. 구글링을 1시간을 했지만 결국 3.9버전을 다운받아서 진행했다..

문제 해결 참고 👉 https://www.codeit.kr/community/threads/19775

그 뒤 아래 코드를 돌리니 드디어 제목이 나왔다.

from pytube import YouTube

yt = YouTube('https://www.youtube.com/watch?v=j0DVcYAOMtA')
yt.title

이렇게 썸네일도 가지고 올 수가 있다.

+) 17:17 열심히 하는데.. 계속 오류가 떠서 화가 나는 중이다.. 퇴근 원해...

profile
Master Student @ KU👩🏻‍🎓

0개의 댓글