[Intro2] Youtube Data Tools로 댓글 수집하기

💻·2021년 8월 1일
0

PE프로그램

목록 보기
2/3

1. Youtube 영상 id 추출

(1) 엑셀 파일에서 url데이터 읽어오기

from openpyxl import load_workbook
import re
import sys
 
 
def cleanText(readData):
    p = re.compile("[^0-9]")
    #print(p)
    #print("".join(p.findall(readData)))
    return "".join(p.findall(readData))
 
 
def Excel():
    wb = load_workbook('newslink_korean.xlsx')
 
    # 현재 Active Sheet 얻기
    ws = wb.active
    chk="0123456789"
    pre = ws.rows
    for r in ws.rows: # 엑셀에서 각 행과 열로 순회하기 위함
        ty = r[0].value # 첫째 열의 값 : 그룹
        data = r[1].value # 둘째 열의 값 : 주소
        newslink.append(data)
 
newslink = []
if __name__ == "__main__":
    Excel()
    
for i in newslink:
  print(i)

(2) url에서 영상 id 추출하기

id= []
newslink = list(newslink)
for e in newslink:
  if e != None:
    lst = e.split("=")
    id.append(lst[1])

for i in id:
  print(i)

(3) Youtube Data Tools로 댓글 데이터 수집하기

Youtube Data Tools
Tools - Video Info and Comments

  1. 'Video Info and Comments'툴에 영상 id를 입력하면 4개의 파일을 다운로드할 수 있다.
- a tabular file containing basic info and statistics about the video;
- a tabular file containing all retrievable comments, both top level and replies;
- a tabular file containing comment authors and their comment count;
- a network file (gdf format) that maps interactions between users in the comment section;
  1. '___comments.tab' 파일을 다운로드한 후, 확장자를 'txt'로 변경한다.
  2. 엑셀 프로그램에서 csv파일을 불러온다.
    • 인코딩 수정: UTF-8
    • 기호 구분 - tab

0개의 댓글