250106 TIL

mj_data·2025년 1월 6일

TIL

목록 보기
32/32

최종 프로젝트

데이터

게임 쪽에는 open api가 많아서 다양하고 라이브한 정보도 담겨있는 데이터들이 많을 줄 알았는데, 생각보다 입맞에 맞는 데이터를 찾기는 쉽지 않았다. 대시보드를 만들게 된다면 매출 현황같은 대시보드도 만들고 싶어 매출 관련 데이터가 있기를 바랐는데, 역시 BM과 관련된 데이터들은 Kaggle의 생성된 데이터들이 아닌 이상 구할 수가 없는 것 같다.

API

최종 데이터를 선택하기 앞서 API를 먼저 체험해보고 싶어 PUBG의 API를 통해 데이터를 적재해봤다. 유저id로 접근하는 데이터와 매치id로 접근하는 데이터 중 매치id로 접근해보았다.

전체데이터를 가져오는 것은 불가능하여 따로 시간을 입력하고 입력된 시간을 끝으로 24시간 내의 매치id를 랜덤(?)으로 가져와주는 Samples를 사용했다. 여러번 사용해보니 500개 정도가 뽑힐 때도 있었고 900개 정도가 뽑힐 때도 있었다. 'Sample rates are independent for each platform and not uniform across any time interval.' 이라고 써있긴 했는데 꽤 오차가 큰 것 같다.

어쨌든 이렇게 Samples에서 뽑힌 매치id들을 하나씩 하나씩 matches에 넣어주면 된다. 또 matches 안에는 telemetry라고 로그데이터 id가 따로 있는데 url도 함께 적혀있어 json파일로 그대로 다운받을 수 있다.

0개의 댓글