AI 부트캠프 16-20일차

DAYOUNG LEE·2021년 5월 31일
0

프로젝트 요구사항

Sprint 1 : EDA, Feature Engineering, Data Manipulation, Data Visualization
Sprint 2 : Hypothesis Test, CI, Bayesian
Sprint 3 : DR, PCA, Cluster

의 내용을 활용

디스코드 공유 자료, 코멘트

간단히 우리가 배운 것과 연관지어서 설명드리자면,

  • Segmentation : 클러스터링
  • Targeting : 여러 클러스터 중에서 내가 목표하는 타겟 정하기
  • Positioning : 해당 Cluster에서 어떠한 position을 가져갈 것인지 정하기

로 설명드릴 수가 있을 것 같습니다.

즉, 하나의 조건(장르/연도/지역 등)으로 클러스터링을 하면, 그 클러스터링된 하나의 집합이 다른 조건으로 나눈 클러스터와 교집합이 있는지(지역별로 유행하는 장르가 있는지, 혹은 연도(트렌드)별로 장르에 대한 선호가 있는지 등) 확인할 수 있구요,

만약에 이러한 교집합이 있다면 여러 개의 교집합(클러스터의 교집합, 세분화 된 segment) 중에서 자신이 원하는 타겟을 정하고, 그 타겟의 수요(니즈)에 맞게 positioning을 하면 되는 것이지요.

예로 들자면, 만약 최근 유럽은 FPS가 인기이고 미국은 격투게임이 인기일 때, 본인이 FPS에 관심이 있으면 유럽을 타겟으로, 격투게임에 관심이 있으면 미국을 타겟으로 하면 되는 것이지요.

이때 3D 철권처럼 고퀄의 게임을 제작하고 판매함으로써 수익을 창출하는데에 관심이 있으시면 차별화전략으로 positioning을, 반대로 졸라맨 격투처럼 질은 떨어지지만, 여기에 표시되는 광고 등으로 수익을 창출하고자 하면 저비용전략으로 positioning을 하면 되는 것이지요.
(물론 이 또한 이미 시장에서 니즈가 통계적으로 유추할 수 있으므로 실질적으로 소비자가 원하는 상품을 positioning하는 것은 targeting을 할 때 수동적으로 정해지는 것이지요. 가령 3D 철권과 졸라맨 격투의 매출/다운로드 수/플레이시간 등을 분석해보면 이미 target이 무엇을 원하는지 답은 나와있습니다.)

데이터를 분석한 후 구조화하고, 개인의 논리를 만들어 나가시는 데 조금이나마 도움이 되실까 싶어 불면증 해소에 도움이 될만한 긴 글 남겨드립니다~.~

개인적으로 우리가 모두 컴공을 전공한 것이 아니라, 다양한 domain에서 각자의 전공과 domain knowledge를 갖고 있기 때문에, 이를 공유하면서 우리가 배운 프로그램을 어떻게 각 분야에 적용할 수 있을지 논의해보는 것도 나중에 실무에서 많은 도움이 될 것 같다고 생각되어서 말씀드려보아요+_+ 맛점입니당!

1. 데이터 전처리

처리 순서

  1. [excel] 단위 M으로 맞추기
  • excel replace
    excel extract
    K = 0.001M
=IF(ISNUMBER(SEARCH("k",A1)),LEFT(A1,LEN(A1)-1)*IF(RIGHT(A1)="k",0.001,1),A1)
  1. [excel] N/A인 Year, Publisher 검색해서 채우기

  2. [excel] Year 처리
    0, 01, 02, ..., 21 --> +2000
    50, 51, ..., 99 --> +1900

=IF(A2<22, A2+2000, IF(A2<=99, A2+1900, A2))
  1. [excel] 공백값 채우기
=ISBLANK(A2)
# TRUE면 공백 있음 
  1. [excel] Unknown 채우기
    total sales가 0.1이상일 때

  2. [excel] 게임회사 이름 통일

게임회사 이름

  • Majesco Entertainment

  • Konami Digital Entertainment

  • Electronic Arts
    = EA
    EA Sports, EA Games, Electronic Arts, Electronic Arts Victor...
    -> Electronic Arts Victor는 Electronic Arts와 Victor Interactive 합작

  • Ubisoft
    -> Ubisoft, Ubisoft Annecy

  • Sony Computer Entertainment
    -> Sony Computer Entertainment, Sony Computer Entertainment America, Sony Computer Entertainment Europe

  • Game Mill
    -> Game Mill, Game Mills Entertainment

게임 장르

  • Use of blood and violence in the game is only adviced * Action games for 18+ age group players. (게임에서 피와 폭력을 사용하는 것은 18세 이상의 그룹 플레이어를 위한 액션 게임에서만 권장된다.)
    -> 2개 이상의 Genre인 경우 어떤 것을 선택?
    -> Action-Adventure인데 18+이면 Action으로 처리

* 이름, 플랫폼, 연도, 장르를 밀려쓴 데이터도 있음

데이터 전처리를 명확한 기준 없이, 마구잡이로 함

psp, ps2, wii 등... 종류에 따라서 release date 다름

-> 차이를 고려한 data도 있는데
고려 안하고 최초 release date로 통일한 경우도 있음

Jp, NA, EU... 나라별 release date가 다름

-> sales 기반으로 나라별 release date 다르게 설정한 것도 있고
그냥 최초 release date로 한 것도 있음

최대한 정확하게(첫번째 방법으로)

2. 발표자료 만들기

Heat-map 시각화
통계 지식은 거의 사용하지 못함

3. 발표 pdf

4. 발표 피드백

1

좋았던 점 : 인덱스를 사용한 것이 좋았는데, 좀 더 자세하게 설명해주고 넘어갔다면 플로우를 파악하기에 더욱 용이했을 것 같습니다. 다양한 그래프로 많은 분석을 해주셔서 이해하기 좋았습니다. 슬라이드 하나에 하나의 내용만이 담겨있었고, 그에 대해 자세하게 설명해주셔서 집중하여 듣기에도 좋았습니다.

아쉬운 점 : 비슷한 내용(각 플랫폼에 따른 장르 분석)이 주를 이루고 있는데, 이를 통해 어떻게 다음 분기에 게임 설계를 한 것인지에 대한 로직이 부족했습니다.

2

좋았던 점 : 발표 속도가 너무 느리지도, 빠르지도 않아서 좋았습니다. 발표 시작 전 데이터셋에 대하여 충분하게 기본 정보들을 짚고 넘어가서 발표를 듣는 사람 입장에서 데이터에 대한 정보들이나 신뢰성이 생길 것 같습니다.
다양한 시각화를 사용해서 상황에 맞게 잘 설명이 된 것 같고, 플랫폼과 연도별 인기 장르에 대하여서 연도를 세밀하게 나눠서 분석한 것도 좋았습니다!
플랫폼에 대해서 저도 잘 몰랐는데 따로 자료를 가져와서 발표에서 사용할 데이터에 있는 자료들만 어느 시기에, 어떤 플랫폼을 주로 사용했는지 설명하는 부분이 있어서 조금 더 플랫폼에 대한 내용들을 이해하기 수월했던 것 같습니다. :D

아쉬운 점 : 연도별 장르에 대하여 색깔로 표시되었던 그래프가 살짝 한눈에 정보를 파악하는게 쉽지는 않았습니다. 그래프에 대한 설명이 조금 더 들어갔으면 이해하는데 도움이 더 되었을 것 같습니다!

3

좋았던 점 : 목적을 위해 어떤 분석을 할 것인지 앞서 설명하고 시작하는 점이 좋았습니다.
해당 분야에 종사자가 아니라도 이해하고 넘어 갈 수 있는 부분이 많았습니다.bb

아쉬운 점 : 다소 알아보기 힘든 시각화 자료가 있었습니다. 추가적인 언어 설명이 없었다면 자료만으로는 이해하기 힘들었을 것 같습니다.

4

좋았던 점 : 리스트와 그래프를같이 보여주면서 퍼센티지를 병기한 부분들이 좋습니다. 각 나라별 장르 분석에 많은 공을 들여 만드신것 같아요. 이해하기도 좋았습니다.

게임 콘솔을 설명해주시는 부분이 너무 귀엽고 정보가 좋았습니다. :) 각 연대별 인기있던 콘솔을 보여주는 부분에서 시대의 콘솔을 확인 할 수 있어 좋았습니다.

아쉬운 점 : 너무 긴장하신것 같아서 아쉬웠어요, 다영님이 침을 삼키시는 부분에서 같이 침을 꼴딱꼴딱 삼키면서 보고있었습니다. :)
마지막 결론에서 자료가부족하지만 플랫폼을 PC로 설정하는것이 왜 좋은지 이해하기가 어려웠습니다.

5

좋았던 점 : 사진자료를 사용해 조금더 흥미롭게 볼 수 있었어요.
결론 도출을 두가지 방법을 제시해서 좋았어요
일본과 다른 나라의 출고량을 비교하는 방식을 사용해 더 흥미 있게 봤어요.

아쉬운 점 : 많이 긴장하신것 같은데 잘하셨다고 전 생각합니다. 다만 조금 아쉬운점이 있다면 년도별 내용이 상당히 구체적인데 주제가 다음 분기에 어떤게임을 내야할까 인 만큼 1980에서 2000년대까지는 전체적인 흐름만 설명하고 그 후의 데이테에 조금더 집중해서 설명했으면 하는 아쉬움이 살짝 남아요

6

좋았던 점 : 1. 발표 내용마다 정리를 확실히 짚어주셔서 파트별로 이해하기가 쉬웠습니다.
2. 이번 프로젝트 주제에 딱 알맞게 진행하신 것 같습니다.

아쉬운 점 : 1. 장표 페이지가 너무 빠르게 넘어기는 부분에서 집중을 흐트리는 느낌이 있었습니다.
2. 위와 비슷한 원인에서 결과 도출까지의 흐름을 파악하기엔 어려움이 있었습니다.

Section 내용 요약

0개의 댓글