분류 모델이 미니프로젝트 주제였는데, 게임 생존/이탈 예측을 위해서 더 살펴보면 좋을 것 같은 부분들이 있어서 추가했다. 10일 정도 안에 끝내야해서 결론이 나기보다는 이런 점도 고려해서 예측 모델에 적용시키면 좋을 것 같다~ 정도로 끝냈다.
어떤 캐릭터를 할 때 생존률이 높은가?
유저가 키우는 캐릭터에 대한 정보도 알 수 있어서 이것도 연관성이 있지 않을까 생각이 들었다. 리니지는 사실 이름만 알고 뭐하는 게임인지도 이번에 알게 된 거라서 각 캐릭터가 뭘 하는 건지는 잘 모르지만,,, 오버워치에서 탱커, 딜러, 힐러 같은 느낌으로 나뉜다고 생각하면 역시 딜러가 게임하기 제일 재미있는건지..? 분석 결과 기사와 전사가 제일 높은 생존율을 기록했다.
아니면 여러 캐릭터를 가진 유저도 많기 때문에, 기사와 전사가 가장 기본적인 캐릭터여서 개수가 많음에 따라 생존율이 높을수도..? (기사, 전사가 기본 캐릭터 아닐수도 있음. 일단 내 추측일 뿐)

시계열 분석을 안 배웠을 때였는데, 시간 순으로 생존율을 확인하고 싶어서 논문을 뒤지다가 발견한 Kaplan-Meier Fitter.
두 그룹의 시간의 흐름에 따른 생존률을 시각화할 수 있는 기법인데, 여러 그룹으로 나눠도 잘 나옴. 근데 그룹명 변수에 0이 들어있으면 그래프가 제대로 안 나온다. 하다가 군주 그룹만 생존률이 100프로로 나와서 뭐가 문제인지 끙끙대다가 8로 바꿔서 돌려보니까 제대로 나와서 허무했음...
몇 개의 캐릭터를 하는 사람이 생존률이 높은가?
1개 하는 사람이 이탈이 많을 것이라고 예상하고 돌려봤는데, 초반 이탈률은 맞았다. 근데 마지막 결과는 예상 밖에 2,3개 캐릭터를 가진 사람의 이탈률이 더 높았다. 흥미로움,,
초반 이탈률이 높은 이유는 뉴비가 적응하지 못하고 떠났기 때문인 것 같은데, 결과적으로 2,3개 그룹이 더 많이 사라진 이유는 뭘까? 1개를 진득하게 하는 사람이 2,3개 깔짝거리는 것보다 나은 걸까. 역시 버티는 사람이 이기는 건가,,,(아무 소리)
5개 이상인 그룹이 생존율이 가장 높은데, 이건 아마도 게임 고인물들이어서 게임을 떠날 생각이 없고 오래한만큼 캐릭터도 많이 만들었기 때문인 것 같다.

결제금액이 클수록 생존 확률이 높은가?
이건 결제금액을 평균내서 이상/이하 그룹 2가지로만 나눠서 살펴봤다. 역시 예상대로 돈을 더 많이 쓴 그룹의 생존율이 높았다. 이미 지른 돈이 아까워서라도 게임을 떠나기 힘들기 때문 아닐까.

혈맹원 수에 따라 생존률이 다를까?
게임 속에서 하는 사회생활이라고 생각되는 혈맹 활동. 내 혈맹에 속한 혈맹원이 많을수록 생존율이 높을지 궁금했다. 소속된 혈맹원의 정확한 수는 나와있지 않아서, 혈맹원 중 게임에 참여한 인원/전투에 참여한 인원으로 찾아봤다.
의외로 혈맹에 참여하지 않는 유저의 생존율이 높았다. 혈맹원들의 활동량과 개인의 생존율은 단순 비례 관계가 아니라는 사실을 알 수 있었다.
생각해보면, 내가 I인데 E인 사람들 10명과 함께하는 혈맹일수도 있고, I인 사람 2명이서 있는 혈맹일수도 있으니까,, 속한 혈맹의 활동량보다는 그룹 색깔이 유저와 잘 맞는지가 중요한 요소일 것 같다.

결론
유저 그룹 별로 생존율이 차이가 나는 만큼 실제 정확한 이탈 예측을 위해서는 고려해야 할 사항들이 훨씬 많을 것 같다. 일단 유저도 그룹별로 나눠서 분석해 보면 이탈 예측뿐 아니라, 뭐 때문에 이탈하는지, 이탈하지 않게 하려면 어떤 부분을 제공해 줘야 할지 인사이트가 더 나오지 않을까?