심리적 네트워크 및 정확성 평가 논문 공부

mymelody·2021년 3월 31일

논문 'Estimating psychological networks and their accuracy: A tutorial paper' 을 읽고 정리한 내용입니다.
이해하기 위한 용도로 적은 것이므로 언제든 수정될 수 있습니다. 🙇‍♀️

개요

심리 네트워크의 사용은 다양한 연구 분야에서 인기를 얻고 있다.
일반적인 논문들에서는 이러한 심리 네트워크를 추정 및 해석하는 주제를 다루지만,
얼마나 정확한 네트워크가 추정되고 또 얼마나 안정적인지 확인하고자 하는 작업은 거의 수행되지 않는다.

논문에서는 심리 네트워크의 정확성과 안정성, 견고성을 평가하는 법을 제안하고,
해당 기능들을 사용할 수 있는 R package bootnet을 소개한다.

또한, 논문에서는 샘플링 변동을 통해 네트워크 정확도 문제를 해결하는 것을 목표로 한다.

추정된 네트워크의 정확도를 평가하기 위해서 논문에서는 부트스트랩 루틴 을 사용해
(1) Edge Weight들의 신뢰구간을 구하고
(2) 중심성 지수의 안정성을 조사하며
(3) 앞선 과정에서 도출된 값(Edge Weight / 중심성 지수)이 다른 값(Edge Weight / 중심성 지수)들과 차이가 있는지 알아보는 차이 검정을 실시하는 방법을 제안한다.

Bootstrap

~~Bootstrap이라는 단어를 보고 가장 먼저 프론트엔드 프레임워크인 Bootstrap만 떠올랐다.~~

통계학에서의 Bootstrap은 현재 내가 가진 데이터들 중
데이터를 무작위로 재추출함으로써 자료를 생성하고,
그로 부터 통계량을 구해내는 것을 뜻한다. 중복을 허용한다.

즉, 데이터들 중에서 n개를 복원추출하고 그들의 평균을 구한다.
이 과정을 수천번 반복하면 평균의 분포를 알 수 있게 되며
이를 통해 정확도가 높은 통계량들을 추론해낼 수 있다.

Bootstrap 기법은 신뢰성을 평가하는데 유용하게 쓰인다.

https://learningcarrot.wordpress.com/2015/11/12/부트스트랩에-대하여-bootstrapping/
https://learnshare.tistory.com/17
상단의 블로그를 참고했습니다.

네트워크 시뮬레이션

위 사진은 시뮬레이션 된 네트워크의 실제 구조와
중앙값 지수로 정량화 된 각 Node의 중요도를 나타내며,
해당 네트워크는 각 Edge의 절대 강도가 동일하다.

모든 Edge는 동등하며, 모든 중심성 추정치도 동등하다는 것을 뜻한다.

진짜 네트워크에서 n=500에 대한 데이터를 추출해 시뮬레이션 해보면,
8개의 Node와 500명의 사용자가 있는 데이터 세트를 얻을 수 있다.

Edge와 중심성 추정치는 더 이상 동등하지 않다.
B-C가 가장 강하며, B는 가장 높은 중심성을 가지고 있다고 결론 지을 것이다.
그러나 실제 모델에서는 모든 Edge와 중심성 추정치가 같다.

하지만 이는 실제 모델에서 데이터를 시뮬레이션 한 것이기 때문에,
우리는 사실 모든 Edge 및 중심성 추정치가 동등하다는 것을 알고 있다.

이처럼 진짜 네트워크와 시뮬레이션 한 네트워크의 결과가 다른 문제는,

(a) 참여자가 적거나
(b) Node가 많거나
(c) a, b 둘 다일 때

더 더욱 눈에 띄게 된다.

우리가 단면적 데이터를 사용해서 만들어낸 현재의 네트워크를 추정하기 위해서는
사실, 매우 많은 양의 매개변수가 필요하기 때문에 이런 문제가 나타나는 것이다.

그래서, 방법은?

Edge Weight에 대한 신뢰구간(CI) 추정

우리는 Edge Weight의 변동성을 평가하기 위해 신뢰구간을 추정할 수 있다.
신뢰구간을 구성하는 간단한 방법에는 부트스트랩 방법이 있다.

<부트스트랩으로 신뢰구간 구하기>

1. 앞서 말한 부트스트랩 방법대로 내 손에 있는 데이터들 중에서 n개를 복원추출한다.
2. 추출한 표본으로부터 알고 싶은 통계량(평균 등)을 구하는 과정을 R(>1000)번 반복한다.
3. x% 신뢰구간을 구하기 위해 R개의 결과 분포의 양쪽 끝에서 (100-x)/2% 만큼 잘라낸다.
4. 절단한 양 끝점들이 x% 부트스트랩 신뢰구간 양 끝점이 되는 것이다.

https://liujingjun.tistory.com/67
상단의 블로그를 참고했습니다.