RPG Lv. 10 - 스키너의 상자

규라리 [김준호]·2022년 10월 2일
2

RPG

목록 보기
10/19
post-thumbnail

"Lv. 10이면 1차 전직은 해야지!"

하루 한 편 짤막하게 올리는 알피지(알아두면 피가 되고 살이 되는 게임지식)가 벌써 10번째 포스팅이다!
내가 정말 좋아하는 게임 "메이플스토리"에서는 Lv. 10에 1차 전직을 하면서 감격스러운 모험의 첫 발걸음을 내딛는다!

천리 길도 한 걸음!
Lv. 100이 되는 그 날까지 모두 함께 파이팅하자!


"찍찍, 밥 줘."

여기 귀여운 생쥐가 한 마리 있다.
벌허스 프레더릭 스키너(Burrhus Frederic Skinner)는 작고 귀여운 쥐를 상자 안에 가두었다. (저런! 불쌍해라!)
하지만 단순히 쥐를 괴롭히기 위한 목적은 아니었다. 스키너는 미리 정해 둔 보상 주기에 맞는 행동들을 할 때 보상으로 먹이를 주었다.

  • 쥐가 레버를 누르면 먹이를 준다.
  • 쥐가 레버를 X번 누를 때마다 먹이를 준다.
  • 쥐가 무작위 X번째 레버를 누를 때 먹이를 준다.
  • 쥐가 N분이 지난 후 레버를 누를 때 처음에만 먹이를 준다.
  • 쥐가 무작위 N분이 지난 후 처음 레버를 누를 때 처음으로 먹이를 준다.

스키너는 위처럼 각기 다른 다섯 가지 방법으로 쥐에게 먹이를 줘보았다.
실험을 진행한 결과, 쥐는 각 방법에 따라 다른 반응을 보인다는 것을 확인할 수 있었다!
초조해하는 쥐들도 있었고, 더 많은 먹이를 받기 위해 레버를 겁나게 누르는 쥐도 있었다. (오우, 먹을 줄 아는 놈인가?)
오히려 쥐들이 더 적게 레버를 누른 경우도 있었다.

만약 쥐가 레버를 더 많이 누르도록 하는 것이 목적이라면, "변동비율(Variable Ratio) 보상"이 가장 좋은 보상 방법이 된다.
변동비율 보상은 확률 변수를 바탕으로 레버를 몇 번 눌러야 먹이가 나오는지 정한다. 쥐들이 레버를 몇 번이나 눌러야 보상이 나오는 것인지 모르기 때문에 자주 레버를 누르는 행동 "강화(Reinforcement)"가 발생한다.

행동심리학의 거장 스키너는 이 실험을 통해서 "행동주의(Behaviorism) 이론"을 입증하고자 했고, 이는 행동심리학과 교육학을 넘어서서 현대 AI의 하위 개념인 "강화 학습(Reinforcement Learning)"으로 이어졌을 정도로 스키너의 상자는 엄청난 영향을 끼쳤다.
그리고 이는 게임에도 예외 없이 영향을 주었다!


플레이어들은 상자 안에 든 쥐?

게임 디자이너는 기본적으로 플레이어 행동을 예측해야 한다.
게임 디자이너들은 플레이어들이 게임과 상호작용하는 것도 스키너의 상자와 별반 다르지 않다고 생각했고, 더 많은 상호작용을 이끌어내기 위해 변동비율 계획에 기반하여 플레이어에게 보상을 주는 방법을 적용하기도 했다.
RPG에서 많이 볼 수 있는데, 다음의 예시를 함께 들여다보자.

플레이어가 슬라임을 처치했을 때 희귀하게 "물컹물컹한 신발"을 드랍한다.
하지만 플레이어들은 어떤 슬라임을 처치했을 때 "물컹신"을 얻을 수 있는지 알 수가 없다.
결국 더 많은 슬라임을 죽이다보면 언젠가 "물컹신"을 얻을 수 있다는 결론에 이르게 되고, 수 많은 슬라임을 도륙하기 시작한다!
플레이어가 희귀 아이템을 통해 슬라임을 잡으러 다니는 행동을 하도록 강화된 것이다.
(불쌍한 슬라임!)

사실 스키너의 상자를 응용하는 과정에서 많은 게임 디자이너들의 의견이 대립하고 있다.
"플레이어들이 과연 게임 디자이너들의 의도에 따라 조정 가능한 상자 안의 쥐가 맞는가?"에 대한 견해 차이가 있는 것이다.
만약 확실하게 플레이어들을 유도하는 것이 가능하다면, 애써 고생해서 게임을 설계하지 않아도 플레이어들이 원하는 보상을 제때 던져주기만 하면 알아서 신나게 플레이하지 않을까?
많은 게임들에서 이런 방식을 채택했고 실제로 힘들이지 않고 플레이어의 플레이를 유도할 수 있었지만, 플레이어가 느끼는 재미가 떨어질 수 있다는 위험이 있었다.

물론 스키너가 입증한 행동주의를 적절히 활용하면 몰입을 유도할 수 있는 묘수가 될 수도 있다.
플레이어가 목표를 달성했을 때 바로 보상을 주지 않고 "보상을 얻을 수 있는 기회"를 제공한다거나 임의의 시간에 따라 보상을 주는 대신 게임 시스템과 상호작용 했을 때 보상을 주는 것은 어떨까?
플레이어들은 "가시적이지만 동시에 잠재적인 보상"을 위해 행동하고, 그 과정에서 확정적인 보상이 아닌 게임 플레이로 유인되면서 보상이 플레이어를 더욱 게임에 몰입시킬 수 있는 수단으로 작용할 수 있다.
(내가 떠올려본 "가시적이면서 잠재적인 보상"은 플레이어들이 보상의 존재를 깨달았지만 얻을 수 있는 가능성만이 보이는 상태를 말한다.)


오늘은 스키너의 상자를 통해 플레이어들을 유도할 수 있는 보상을 제공하는 방식에 대해 함께 생각해보았다!
플레이어들도 결국엔 각기 다른 사람이기 때문에 그 어떤 자연 현상보다도 예측하기 힘들고, 행동을 정확히 예측하는 것은 불가능에 가깝다.
하지만 어느 정도의 행동 강화는 플레이어들에게 공통적으로 나타나는 현상이라는 점에서 우리가 활용할 가치가 있다고 생각한다!

혹시 모른다!
게임 디자이너 자신마저 끌리는 방식이 곧 게임 플레이어들이 끌리는 방식일수도!

그럼 오늘도 Level Up!

profile
상명대학교 게임학과 (2018 ~ )

0개의 댓글