궁금하니까 논문을 읽어봅시다.
Pattern of Dopamine Signaling During Aversive Events Predicts Active Avoidance Learning
Stelly et al., 2019
https://www.pnas.org/doi/10.1073/pnas.1904249116

이 논문은 도파민이라는 호르몬이 스트레스 상황에서 어떻게 작용하는지에 대한 내용을 다루고 있습니다. 도파민은 일반적으로 즐거운 상황에서 많이 분비되는 것으로 알려져 있습니다. 흥미로운 점은 예상된 즐거움보다는 예기치 않은 더 큰 보상을 받았을 때 도파민이 많이 분비된다는 것입니다. 이를 "보상 예측 오류 신호"라고 합니다.
이번 연구에서는 스트레스 상황에서 도파민이 어떻게 분비되는지에 대해 조사했습니다. 예를 들어 시험 준비, 잔소리, 진상 상대 등의 스트레스 상황에서 도파민이 어떻게 반응하는지가 궁금했던 것이죠.
연구는 마우스를 대상으로 진행되었습니다. 마우스들은 일정 시간마다 벌칙을 받게 되는데, 제때 버튼을 누르면 벌칙을 피할 수 있습니다. 구체적으로는 불빛과 소리로 신호가 나고, 몇 초 이내에 버튼을 누르면 벌칙을 피하는 방식입니다.
버튼 규칙을 잘 학습하는 마우스도 있고, 그렇지 못한 마우스도 있었습니다. 규칙을 잘 배운 마우스들은 도파민이 많이 분비되는 것을 확인할 수 있었습니다. 특히 마우스가 버튼을 눌러 벌칙을 피할 때 도파민이 많이 나왔습니다. 연구자들은 도파민이 보상을 받을 때처럼 안전함을 느낄 때에도 많이 나온다는 것을 발견했습니다.
처음 몇 번의 실험에서는 마우스가 버튼을 눌렀을 때 벌칙을 피할 수 있을지 긴가민가하다가 벌칙을 피할 때 안도하며 도파민이 많이 분비되었습니다. 그러나 점차 반복되면서 마우스는 버튼을 누르면 벌칙이 피할 수 있다는 것을 예측하게 되었고, 이에 따라 도파민 분비량도 점점 줄어들었습니다.
이를 통해 도파민이 안전함을 예측할 때 많이 분비되지만, 이미 예측된 안전함에서는 별로 분비되지 않는다는 것을 알 수 있습니다. 이는 보상과 유사한 원리입니다. 연구자들은 이를 "안전 예측 오류 신호"라고 명명했습니다.
또한 보상과 안전 사이에는 미묘한 차이가 있었습니다. 보상 실험에서는 보상이 오기 전에 예측할 때부터 도파민이 많이 분비되기 시작했지만, 안전 상황에서는 벌칙을 받을 때는 도파민 차이가 없고, 안전이 확실시 될 때 도파민이 많이 분비되었습니다. 이 차이가 흥미로웠습니다.
마우스마다 차이가 있는 것도 흥미로웠습니다. 벌칙 규칙을 잘 학습한 마우스들은 안전할 때 도파민이 많이 분비되었지만, 잘 학습하지 못한 마우스들은 도파민 분비 차이가 별로 없었습니다. 이는 마우스마다 도파민 분비에 차이가 나는 이유를 추가로 연구할 필요가 있다는 것을 시사합니다.
흥미로운 논문입니다.