중간에 추가된 일
중간에 취소된 일
오늘은 크롤링과 API에 대해 배웠다.
일반적으로 분석가는 회사 내부의 데이터로 일을 하지만 내부데이터의 '검증력'을 더 해주기위해 크롤링과 API를 사용해 외부데이터를 가져온다. 주로
업계 트랜드
업데이트 및 이벤트에 대한 반응
외부 게임 반응
에 이용된다.
이 후 제약이 많은 크롤링보다 유튜브 API를 활용한 실습으로 이어졌다.
※크롤링에는 사이트명/robots.txt라는 주소를 입력하여 허용 유무를 확인하고 작업해야 하는데, 대다수 사이트가 이를 허용하지 않거나 수시로 내부 XPath와 HTML을 바꿔가며 함부로 크롤링을 못하게 하므로 꽤나 필요조건이 많은 데이터 수집방법이다.
😫스샷처럼 API에선 허용해도 크롤링은 막아둔 유튜브를 볼 수 있다.
원래 의도는 '이터널 리턴'에서 이동동선에 대한 추천표시를 하였을때에 대한 뒷받침 자료로서 '롤'에서 정글동선 패치가 이뤄진 2022년 11월 16일을 기점으로 앞으로 1달 뒤로 1달범위의 게시글을 분석하여 반응을 보려 했는데 정글동선패치에 대해 이야기하는 게시글이 단두개.. 그것도 댓글이 10개도안되는 작은 분량이다.
이유는 이때 같이 패치된 정글아이템 개편으로인해 게시판이 불타는 상황이라 정글동선 패치에 대해서는 관심이 없었고 기존에 정글하는 유저거나 정글한지 얼마안된 유저 또는 이제 시작하려는 유저가 추천하는 정글링 방법은 "유명 정글러 방송인" 에게 보고 배우는게 더욱 정석화되어서 그런것 같다.
따라서 이방법은 폐기하고 '롤'과 '이터널 리턴'의 튜토리얼과 AI대전 영상을 찍어 비교하여 초보자를 위해 개선이 왜필요한지에 대해 찍어볼까 한다.
이렇게 기본키와 외래키에 대해 구분을 하면서 데이터를 살펴보고 있었는데, MetaType v2는 우리가 주제로 하고있는 신규유저 유입에 대해 활용하긴 힘들어 보였고 롤의 OPGG같은 정보사이트를 만들때 유용한 데이터가 모여있는 '엔드 포인트' 였다.
좀 허무한 하루였다.. 작업했던게 모두 쓸수가 없는 작업이 되어버려서😥 내일은 User/Stats
User/Games
user/nickname
의 테이블을 분석하여 신규와 기존유저를 비교하여 자료를 만들어 볼까한다. 다만 90일의 플레이 기록밖에 제공하지 않아서 데이터수가 충분할지는 모르겠다.