Project_10. 스팀 게임 동시 접속자 분석

소고기는레어·2021년 3월 22일
2
post-thumbnail

2021. 03. 22 월요일

스팀 게임 동시 접속자 분석

  • 사용 데이터 : Popularity of games on Steam (By Michal Bogacz) - from kaggle

  • 분석 방향 : 게임별 동접자를 활용한 스팀 유저수 증가 추세와 동접자가 높은 인기 게임에 대한 분석

  • 분석 과정 :
    데이터 전처리(Big query) -> 분석 진행(Big query) -> 시각화(Data studio)

이번 글은 분석 진행까지만 작성하였으며 시각화 과정은 아래 게시글에 작성하였다.
Project_11. 스팀 동접자 대시보드


1. 데이터 전처리

1) Column 이해

  • gamename : 게임의 제목이다.
  • year : 해당 데이터의 연도 부분이다.
  • month : 해당 데이터의 월 부분이다.
  • avg : 해당 날짜의 평균 동시 접속자이다.
  • gain : 이전 월의 평균 동시 접속자 증감이다.
  • peak : 해당 날짜의 최대 동시 접속자이다.
  • avg_peak_perc : 최대값(평균 / 피크)에서 평균 비율 (%)

 

2) 데이터 정제

  • 가장 눈에 띄는 점은 날짜의 yearmonth가 별개의 Column으로 구분되어 있는 것이다.

    • 이 경우 날짜순으로 정렬하기 번거롭고 심지어 month의 경우는 숫자가 아닌 영어로 표기되어 있어 정렬시 알파벳 순으로 정렬이 된다.

    • month를 숫자로 변경 -> yearmonth 합치기 -> date로 변환하기 -> xxxx-xx 형식('%Y=%m') 으로 변환하기의 과정을 거쳤다.

      • 날짜로 변환하는 과정을 굳이 거친 이유는 월 앞에 0을 쉽게 붙이기 위함이다.

 

  • 기존의 yearmonth 또한 유지시켰는데, month의 경우 위와 같이 숫자로 모두 변경하였다.

 

  • Gain은 전월 대비 증감을 의미하는데, 해당 Row가 첫 월일 경우 'NA'로 표기되어 있다.

    • 분석 과정에서의 집계를 위해서는 Float64로 변환하여야 한다.

    • CASE를 활용하여 'NA'를 모두 NULL로 대체 후 FLOAT64로 변환하였다.

 

  • avg_peak_perc에는 연산 과정에서 잘못된 입력을 받았음을 나타내는 'NaN'이 포함되어 있었다.

    • 마찬가지로 CASE를 활용하여 NULL로 대체하였다.

      • NULLIF를 활용하려 했으나 데이터 타입이 INT여서 STR과의 비교가 불가능했다.

 

2. 분석

1) 중복 타이틀 확인

  • 분석을 진행하기에 앞서 동일한 타이틀명을 갖고 있는 게임이 있는지 확인을 해보았다.

  • 타이틀과 날짜별로 집계하여 한 날짜에 2번 이상 집계된 타이틀명이 있는지 확인하는 방법을 사용하였다.

SELECT
  COUNT(*),
  title,
  date
FROM
  `steamdata.project.num_of_p`
GROUP BY
  title,
  date
ORDER BY
  COUNT(*) DESC
;

  • 전부 한 번씩만 집계되어 타이틀명이 겹치는 게임은 존재하지 않는 것으로 확인되었다.

 

 

2) 기간 범위 확인

  • 테이블에 존재하는 가장 오래된 날짜와 가장 최근의 날짜를 확인해보았다.
SELECT
  MAX(date),
  MIN(date)
FROM
  `steamdata.project.num_of_p`
;
  • 가장 오래된 날짜는 2012-07,
    가장 최근의 날짜는 2021-02 이다.

  • 지금까지 다뤄본 데이터 중 가장 따끈따끈한 신상 데이터이다.

 

 

3) 고유 게임 수 확인(최대 동접자 순)

  • 총 몇가지의 게임이 테이블에 존재하는지 알아보았다.
SELECT
  title
FROM
  `steamdata.project.num_of_p`
GROUP BY
  title
ORDER BY
  MAX(peak) DESC
;

  • 1260개의 고유 게임이 테이블에 존재한다.

  • 본격적인 분석에 앞서 순위를 대략 파악해보기 위해 역대 최대 동접자가 높은 순으로 정렬하였는데,
    1위는 PUBG, 2위는 CS:GO, 3위는 DOTA 2로 나타났다.

  • 개인적으로 놀랐던 부분은 Cyberpunk 2077이 4위에 위치해 있다는 점이었는데, 평가가 워낙 안좋기는 했지만 그래도 많은 기대를 받았던 게임인 만큼 당연히 그럴수도 있겠다는 생각이 들었다.

    • 5위가 Terraria인 부분도 개인적으로 예상 밖이었다.

 

 

4) 연도별 스팀 평균 동접자

  • 스팀의 연도별 평균 동접자, 평균 최대 동접자를 구해보았다.
SELECT
  year,
  AVG(peak),
  AVG(avg)
FROM
  `steamdata.project.num_of_p`
GROUP BY
  year
ORDER BY
  year
;
  • 또한 13년도 ~ 20년도의 성장률, 연평균 성장률을 구해보았다.
WITH max AS
  (
  SELECT
    year,
    avg(avg) AS avg
  FROM
    `steamdata.project.num_of_p`
  GROUP BY
    year
  HAVING
    year = 2020
  ),
  min as
  (
  SELECT
    year,
    avg(avg) AS avg
  FROM
    `steamdata.project.num_of_p`
  GROUP BY
    year
  HAVING
    year = 2013
  )
SELECT
  (max.avg - min.avg) / min.avg * 100.0 as growth_rate,
  (POWER((max.avg / min.avg), (1.0/8.0)) - 1.0) * 100.0 as cagr
FROM
  max, min

  • 점차 증가하는 추세이다.
  • 19년도에 동접자가 하락한 것을 볼 수 있다.
    • 원인에 대해서는 추가적인 데이터를 활용하여 분석이 필요해보인다.
  • 13~20년도의 성장률은 54.1%, 연평균 성장률은 5.6%이다.
  • 또한 게임별 평균동접자의 표준편차는 26484.8로 편차가 크다는 것을 알 수 있다.

 

 

5) 월별 스팀 평균 동접자

SELECT
  date,
  AVG(peak),
  AVG(avg)
FROM
  `steamdata.project.num_of_p`
GROUP BY
  date
ORDER BY
  date
;

  • 차트의 모양을 보았을 때 일시적으로 동접자가 상승한 구간이 보인다.(초록색 하이라이트)

    • 2013-12
    • 2018-01
    • 2020-04
    • 2020-12
  • 표시된 부분 외에도 주로 연말과 연초에 비교적 높아지는 것을 볼 수 있고
    특이하게 20년은 4월에 큰 폭으로 동접자가 증가했다.

  • 이유에 대해서 다양하게 추측해보았다.

    • 스팀에서 매우 큰 폭으로 할인을 진행하는 블랙프라이데이(11월 말) ~ 새해 기간의 홀리데이 시즌이 해당되는 것을 볼 수 있다.

    • 만약 AAA급 게임의 출시 혹은 인기가 많은 게임의 영향으로 스팀 전체 동접자가 증가할 수 있다.

      • 홀리데이 시즌에 맞춰 출시하는 게임이 많다는 것도 근거가 될 수 있다.

      • 또한 차트에서 동접자가 대폭 상승한 것으로 보이는 2018-01은 PUBG의 전성기 때이다.

    • 2020년 2~4월 사이에 최고 동접자가 32.5% 증가하였다. 코로나19와 연관이 있다고 생각이 된다.

      • 코로나19의 확산이 늘어나며 집에 머무는 시간이 늘어났을 것이다.

      • 2020년 4월 당시 코로나19와 관련된 게임사의 수익 기부와 모금, 할인 등의 글을 찾아볼 수 있었다.

      • 다만 4월 이후 다시 감소한 이유에 대해서는 조금 더 생각해 볼 문제인 것 같다.

       

  • 해당 기간에 동접자에 영향을 미칠만한 눈에 띄는 게임의 출시가 있었는지 알아보았다.

WITH sub AS
  (
  SELECT
    title,
    peak,
    date,
    MIN(date) OVER(PARTITION BY title) AS release_date
  FROM
    `steamdata.project.num_of_p`
  ORDER BY
    title, date
  ),
min AS
  (
  SELECT
    DISTINCT main.title,
    main.date,
    main.peak
  FROM
    `steamdata.project.num_of_p` AS main
  INNER JOIN
    sub
  ON 
    main.title = sub.title 
    AND main.date = sub.release_date
  )
SELECT
  title,
  date AS release_date,
  peak AS release_peak
FROM
  min
WHERE
  min.date IN ('2013-05', '2013-06', '2013-07', '2013-10', '2013-11', '2013-12', '2014-04', '2014-05', '2014-06', '2015-10', '2015-11', '2015-12', '2017-11', '2017-12', '2018-01', '2018-12', '2020-02', '2020-03', '2020-04')
ORDER BY
  date DESC, min.peak DESC
;

2013년 12월에 Starbound 가 출시되었고 출시 당시 최대 동접자는 8만8천을 기록하였다.
2015년 11월에 Fallout 4 가 출시되었고 출시 당시 최대 동접자는 47만을 기록하였다.
2020년 3월에 Borderlands 3 가 출시되었고 출시 당시 최대 동접자는 9만을 기록하였다.

그 외에는 크게 눈에 띄는 게임 출시가 없었던 걸로 확인되었다.

 

 

6) 연중 동시접속자 순위(동접자 높은 기간)

  • 어느 기간에 동접자가 높은지 분석해보았다.
  • 연도는 2021, 2020, 2018 순으로 평균 동접자가 높았다.
  • 월은 1월, 12월, 2월 순으로 평균 동접자가 높았다.
    • 가장 낮은 달은 9월이다.
  • 날짜는 2018-01, 2020-04, 2017-12 순으로 평균 동접자가 높았다.

 

 

7) 게임별 동접자 분석

게임 시장에서 성공했다고 볼 수 있는 인기게임 3가지의 동접자를 분석해보았다.

  • Counter-Strike: Global Offensive (CS:GO)

    히든 패스 엔터테인먼트에서 개발하고 밸브에서 유통하는 게임으로 2012년에 유료 게임으로 출시하였으나 2018년 말에 사실상 부분 무료화로 전환하였다.

    CS:GO의 주요 키워드로는 부분 무료화, 서구권 인기, e-sports 등이 있다.

    CS:GO 의 월 평균 동접자를 히트맵으로 나타낸 것이다.

    2015년 이후로 큰 성장폭을 보이지 않다가 2018년 말 부분 무료 전환 이후부터 꾸준히 성장하고 있다.
    현재 70만명 대를 유지 중이며 앞으로 더 증가하지 않을까 조심스레 추측해본다.

    CS:GO 의 월 평균 & 최대 동접자를 콤보 차트로 나타낸 것이다.

    마찬가지로 2018년 말부터 조금씩 성장 중인 것을 볼 수 있으며
    5) 월별 평균 동접자 에서 확인한 2020년 4월의 유저수 상승을 여기서도 확인해 볼 수 있다.

 

 

  • PLAYERUNKNOWN'S BATTLEGROUNDS (PUBG)

    PUBG 는 국내 게임 개발사인 크래프톤에서 개발한 게임으로,

    스팀 얼리엑세스 초반에 전례없는 인기를 보여주었으며 17년 11월 카카오 서비스를 시작하였다.

    주요 키워드로는 초반 압도적 인기, 카카오 서비스 등이 있다.


    PUBG 의 월 평균 동접자를 히트맵으로 나타낸 것이다.

    출시 이듬해까지 급성장하며 월 평균 동접자 150만명이라는 기록을 세웠지만 하락하여 현재는 20만명대를 유지 중이다.


    PUBG 의 월 평균 & 최대 동접자를 콤보 차트로 나타낸 것이다.

    2018년 1월에 최대 동접자 300만명이라는 기록을 세웠다.

    이후 스팀 동접자가 하락하기 시작했고 현재는 20만명대 유지 중이다.

    동접자 하락의 원인으로는 국내 유저들의 카카오서버 이동, 초반 흥행으로 유입된 유저들의 이탈, 핵유저 & 최적화 문제로 이탈한 유저 등이 있다고 본다.

    소폭이지만 CS:GO 와 마찬가지로 2020년 4월에 최대 유저수가 잠시 상승한 것을 볼 수 있다.

     

     

  • Grand Theft Auto V (GTA V)

    GTA V 는 Rockstar Games 에서 개발한 게임으로 시리즈 대대로 기대를 한 몸에 받는 AAA급 타이틀이다.

    GTA 의 14번째 시리즈인 GTA V 는 2013년에 콘솔로 먼저 출시하였으며 1년 반 정도 뒤인 2015년 4월에 PC버전이 출시되었다.

    주요 키워드로는 콘솔 선발매, GTA online, 지속적인 콘텐츠 업데이트 등이 있다.


    GTA V 의 월 평균 동접자를 히트맵으로 나타낸 것이다.

    출시 당시의 월 평균 동접자가 가장 높았던 것으로 나타나며 그 이후로는 10만에 못미치는 동접자를 나타냈다.

    유저들은 콘솔 선발매 후 1년 반 사이에 게임의 콘텐츠를 많이 소모했을 것이고, 호기심 등의 이유로 PC판을 구매하더라도 콘솔에서 이미 즐긴 게임을 PC에서 다시 플레이할 필요성을 느끼지 못했을 수 있다.
    이는 출시 직후 동접자가 큰 폭으로 하락한 원인으로 예상된다.

    또한 앞선 게임들과 마찬가지로 2020년 4월 즈음에 유저수가 상승한 것을 볼 수 있다.


    GTA V 의 월 평균 & 최대 동접자를 콤보 차트로 나타낸 것이다.

    출시 직후 큰 폭으로 하락했다가 더딘 속도로 점점 상승하는 모양을 띄고 있다.

    평소에도 워낙 들쑥 날쑥한 차트인 탓에 2020년 4월의 유저수 증가가 눈에 띄게 도드라지지는 않지만, 그래도 출시 당시를 제외하면 20년 4월에 가장 높은 동접자를 보여주고 있다.

    또한 2020년 12월에 Cyberpunk 2077 의 출시와 동시에 엄청난 혹평을 받아서 GTA V 가 재조명 받아 유저수가 잠시 증가한 것을 볼 수 있다.

 

CS:GO, PUBG, GTA V 세가지는 모두 게임 시장에서 성공을 거두었다고 봐도 될만한 게임들이지만 각각 조금씩 다른 행보를 보이고 있다.

CS:GO 는 9년에 가까운 세월 동안 현재까지도 꾸준히 성장하고 있으며 부분 무료화를 통해 성장을 조금 더 가속시켰으나 핵유저의 유입이 많아졌다는 문제점이 있다.

PUBG 는 출시한지 얼마 지나지 않아서 동접자 300만이라는 역대급 기록을 세웠지만 라이트 유저가 빠지고 카카오 서비스를 시작하는 등의 이유로 스팀 유저수가 감소하였다. 현재도 아주 미세하게 하락 중인 것으로 보이지만 여전히 20만대 동접자를 유지하는 중이다.

GTA V 의 PC버전은 콘솔버전보다 1년 반 정도 늦게 출시된 만큼 출시 당시에 36만이라는 최대 동접자를 기록한 후에 급격하게 감소하였다. 하지만 높은 자유도와 지속적인 GTA Online의 컨텐츠 업데이트를 바탕으로 6년이 지난 지금까지도 미세하게 성장하는 중이다.

 


 

3. 분석 결과

누적 평균 동시접속자 230,000,000+

- 13~20년도 평균 동시접속자 54.1% 성장, 연평균 성장률 5.6%

 

홀리데이 시즌(12~2월) 동시접속자 증가

 

17년 8월 ~ 18년 1월 5개월 사이 최고동접자 50.4% 증가

  • PUBG의 영향이 큰 것으로 보임

  • 인기 혹은 기대작에 대한 지속적인 투자와 지원을 통해 스팀 유입을 증가시킬 수 있다.

     

20년 2월~4월 2개월 사이 최고동접자 32.5% 증가

  • 코로나19의 영향이 큰 것으로 보임

  • 코로나19와 관련하여 후원, 모금, 거리두기 장려를 위한 할인 등을 통해 유저수 증가와 긍정적인 이미지 부여를 기대할 수 있다.

     

18~19년도 최고동접자 18.9% 감소

  • 추가 데이터 확보 및 분석으로 원인 파악, 재발 방지대책 필요

     

대시보드 제작

profile
https://www.rarebeef.co.kr/

0개의 댓글