Youtube API
데이터를 크롤링할지 직접 코드를 짜면서 시각화할 수 있을 정도로 데이터를 추출해 보기로 했다. git organization
을 통해 서로 앞으로 코드를 형상 관리 할 수 있는 환경을 만들었다.Trello
를 사용해 보기로 하였다. JIRA
와 달리 하나의 보드에서 깔끔하게 관리가 가능해 장기 프로젝트가 아닌 단기 프로젝트에 매우 유용하다고 생각했다. Trello
는 다음과 같이 구상했다.
Project Resources
: 각Label
의 의미와 리스트 사용 등 앞으로Trello
를 어떻게 사용해야 할지 가이드 라인의 개념으로 두었다.Upcoming
: 예정된 업무(카드)를 할당해 둔다.In Progress
: 예정된 일을 진행하기 시작했다면 카드의 위치를 이 리스트로 바꾸어 진행 중이라는 것을 공유되도록 하였다.Done
: 완료가 된 업무는 이곳에 종료하도록 한다.Trouble Shooting
: 특정 업무(카드) 진행 중 문제가 발생한다면 해당 문제에 대한 카드를 생성해 이곳에 두기로 하였다. 또한 해당 업무는 지금 진행 중인 업무이므로In Progress
의 상태로 유지하되help
라는Label
을 붙이도록 하였다.
📚 [유튜브 데이터 크롤링 및 시각화 프로젝트] 1. YOUTUBE API 사용 환경 설정
음악
이라는 카테고리를 정했고, 처음 음악
이라는 카테고리의 데이터를 추출 및 분석할 유튜버들을 정할 때는 나름의 기준을 두었다. 가수
라는 직업과는 별개로 두고 유튜버
중에서만 선출한다. 최대한 다양한 콘텐츠
의 음악 유튜버들로 분석한다.❗ YouTube API 분석을 위한
음악
카테고리의 유튜버 선정
때잉
: 곡 해석 및 추천 유튜버쏘플
: 팝송 해석 및 추천 유튜버때껄룩
: playlist 유튜버네고막을책임져도될까
: playlist 유튜버임팝TV
: C-pop 해석 및 추천 유튜버Mellowbeat Seeker
: 힙합, LoFi 추천 유튜버
1.
googleapiclient
와oauth2client
모듈 설치 오류
- 개인적으로 이 문제를 해결하느라 한 시간 반 이상은 걸렸던 것 같다.
- 문제는 이 두 모듈은
YouTube API
를 활용하기 위해 꼭 필요한 모듈인데 두 모듈을pip
명령어를 통해 설치해도 막상 프로젝트 파일에 들어가 호출하면ModuleNotFoundError: No module named ‘googleapiclient’
이라는 오류가 뜨는 것이었다.- 첫 번째로 이 문제가 발생한 원인은
googleapiclient
를 설치하기 위해서는pip install google-api-python-client
명령어를 사용해야 한다. 보통 우리는 모듈을 설치할 때pip module-name
을 사용한다. 예를 들어, 같이 설치해야 하는oauth2client
역시 마찬가지로pip oauth2client
명령어를 통해 설치하지만googleapiclient
는 그럴 경우 모듈을 찾지 못한다.- 그럼에도 불구하고 계속 같은 오류가 발생하였다. 결정적으로는 파이썬은
C 드라이브
에 있는데D 드라이브
에 프로젝트 파일을 생성하고 활용하고 싶어 명령창에서D 드라이브
에 맞춰 두고 설치하여 문제였다. 설치가 되는 과정에서는 아무런 문제가 없어 설치가 되었다 생각했는데 막상 파일에 들어가면 파이썬은C 드라이브
에 있기 때문에D
에 설치해 놓은 모듈을 찾지 못하는 것이다. 결국 cmd 창에서cd (파이썬의 실제 위치)
에 맞춰 둔 후 다시 모듈을 설치하고 실행하니 제대로 모듈이 읽히는 것을 확인할 수 있었다.- 사실 제일 간편한 방법은
jupyter lab
을 사용하는 것이었다.jupyter lab
을 통해 해당 명령어를 입력하면 호출에 오류가 나지 않았고 바로 사용 가능했다.%pip install google-api-python-client %pip install oauth2client