[유튜브 데이터 크롤링 및 시각화 프로젝트] 1. YOUTUBE API 사용 환경 설정

·2023년 5월 7일
0
post-thumbnail
post-custom-banner

📌 팀 프로젝트 주제: 카테고리별 유튜브의 파급력 (조회 수, 좋아요 수, 구독자 수) 데이터 크롤링 및 시각화

  • YouTube 데이터를 활용하기 위해서는 유튜브에서 제공하는 YouTube API를 사용하면 되는데 API를 사용하기 전 YouTube API 공식 문서를 참고하자.
  • 공식 문서에는 YouTube API가 제공하는 콘텐츠들을 알 수 있다. 당연히 유의미한 데이터들을 크롤링하고 시각화하기 위해서는 API를 가지고 와 분석하는 단계가 필요하지만 기본적으로 어떤 요소들이 있는지 파악하는 것 역시 중요하기 때문에 꼭 참고해야 하는 부분이라고 생각한다.

1. Google Cloud Platform에 API 및 서비스 사용 등록

  • 💻 Google Cloud Platform에 API 서비스를 등록해 주어야 API 키를 발급받을 수 있고 이 발급 받은 키를 사용해 유튜브 데이터에 접근할 수 있다.

  • 구글 클라우드 플랫폼 링크로 들어가면 API 및 서비스 창이 뜨게 되는데 이때 사용 설정된 API 및 서비스를 눌러 준다.

  • 프로젝트를 처음 만드는 거라면 새로운 프로젝트를 하나 생성해 주어야 한다.

  • 다음과 같이 프로젝트명을 입력 후 만들기를 누르면 사용 설정된 API 서비스가 활성화된다.

  • 그러면 현재 로그인 한 구글 계정에서 사용 중인 API와 서비스 목록이 뜨게 된다. 이때 + API 및 서비스 사용 설정을 눌러 YouTube API 서비스를 추가해 줄 것이다.

  • API 및 서비스 사용 설정을 누르게 되면 다음과 같이 다양한 API를 볼 수 있는 라이브러리와 검색창이 뜨게 된다. 우리는 YouTube API만 사용할 것이기 때문에 검색창에 다음과 같이 YouTube를 검색해 준다.

  • YouTube API들이 뜨게 되는데 이때 우리는 데이터 API를 필요로 하는 것임으로 YouTube Data API v3를 눌러 준다. 그러면 제품 세부 정보 페이지가 뜨게 되고 다음과 같이 버튼이 나오게 되는데 이때 파란색으로 된 사용 버튼을 누른다. 사용 버튼을 누르게 되면 다음과 같이 YouTube API가 사용 상태가 된다.

  • 사용 상태가 된 API 및 서비스 목록에서 YouTube Data API v3 API 서비스 사용량 및 요청 등 대시 보드를 볼 수 있게 된다.

  • YouTube Data API v3를 눌러서 들어갈 시 다음과 같이 그래프를 통해 응답 지연 시간, 트래픽, 오류를 볼 수도 있고 상단의 할당량 탭을 눌러 할당량을 체크할 수도 있다.

YouTube API는 사용할 수 있는 하루 할당량이 생각보다 많지 않아 계속 모니터링을 하며 관리해 주어야 하는데 이 이유는 무료로 사용할 수 있는 YouTube API의 할당량이 하루에 10000으로 한도 제한이 걸려 있기 때문이며 데이터를 크롤링하다 보면 느끼지만 이 할당량은 빨리 닳기 때문에 주의하여야 한다.

2. API 키 발급

  • 1 번의 과정을 모두 끝내면 창의 상단에 다음과 같이 사용자 인증 정보를 만들기라는 안내 문구와 버튼이 뜬다. 이 API 키가 있어야 우리는 코드를 통해 API 데이터들을 호출할 수 있으므로 발급받아 준다.
  • 사용자 데이터와 공개 데이터 중 하나를 선택하도록 되어 있는데 우리가 사용할 것은 공개 데이터이므로 공개 데이터를 선택한 후 다음으로 넘어가 준다.
  • 다음을 누르면 API 키가 발급되며 완료 버튼을 누르면 이 API 키를 사용할 수 있게 된다.

⚡ 만약 내 API 키를 잃어버렸다면?

  • 사용자 인증 정보에 들어가면 발급된 API 키를 다 확인할 수 있다.

3. 발급받은 키로 YOUTUBE API 호출

  • YouTube API를 사용하기 위해서는 googleapiclientoauth2client 두 모듈의 설치가 이루어져야 한다. (cmd 창이나 터미널에서 설치할 때는 %를 제외하고 일반 pip 명령어를 사용해야 한다. jupyter lab을 통해 작업할 때 %pip을 사용한다.)
%pip install google-api-python-client
%pip install oauth2client
  • 이후 모든 설치가 끝났다면 언제든 API를 불러올 수 있도록 코드를 통해 환경을 build 해 주자.
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError
from oauth2client.tools import argparser

API_KEY = '발급받은 API 키 입력'
YOUTUBE_API_SERVICE_NAME = 'youtube'
YOUTUBE_API_SERVICE_VERSION = 'v3'

youtube = build(YOUTUBE_API_SERVICE_NAME, YOUTUBE_API_SERVICE_VERSION, developerKey = API_KEY)
  • 이 설정을 통해 우리는 YouTube API에서 제공하는 데이터에 직접적으로 접근할 수 있다.
profile
송의 개발 LOG
post-custom-banner

0개의 댓글