이 논문을 리뷰하는 이유는 전반적인 framework이 심플하며 앞으로 진행할 프로젝트에 가볍지만 의미 있는 수준으로 적용할 수 있을 것 같아서임. 이 리뷰에서는 모든 내용을 커버하는 것이 아닌 개인적으로 관심있는 부분만 할 것임.
Chen, Lei, et al. "Inferring novel tumor suppressor genes with a protein-protein interaction network and network diffusion algorithms." Molecular Therapy-Methods & Clinical Development 10 (2018): 57-67.
특별한 내용이 없으므로 생략
LHD-method를 통해서 1차적으로 2,874개의 genes을 뽑아낸 다음 three tests (permutation test, association test, function test)를 통해 필터링하여 41개의 putative genes을 추려냈음
LHD-method와 유사한 방법으로 진행했으며, RWR-method를 통해 1차적으로 뽑아낸 5,889 genes에 three test를 적용하여 140개의 putative genes를 추려냈음
서로 다른 methods를 이용해서 알아낸 putative genes은 많이 겹치지 않음. method별 putative genes set과 각 method간의 교집합은 figure 2와 같음.
여기서는 사실 자기네들이 찾은 putative genes에 대한 evidence의 나열이라서 특별히 언급하지 않고 넘어가겠음
TSGene database(https://bioinfo.uth.edu/TSGene/)에 있는 716개의 human TSGs 중 PPI network에 등장하지 않는 85개를 제외한 631개의 human TSGs를 사용하였음
STRING(https://string-db.org/, version 10.0)을 사용하였음. STRING database는 19,247개의 Ensembl ID간의 4,274,001개의 interaction으로 이루어져 있으며 각 interaction은 150~999의 값을 가짐. 여기서 높은 score는 동시에 발생할 확률이 높다는 것을 의미함.
LHD가 무엇이고 어떻게 썼는지는 관심사가 아니라서 넘어감.
RWR이 무엇이고 어떻게 썼는지는 관심사가 아니라서 넘어감.
LHD나 RWR은 network의 structure에 영향을 많이 받기 때문에 LHD와 RWR로 찾은 putative genes는 생물학적으로 의미 없는 false positive일 수도 있음. 이를 보완하기 위해 3가지 screening test는 제안함. false-positve를 컨트롤하기 위한 permutation test와 중요한 genes을 추출하기 위한 association test와 function test를 통해 screening test를 진행함.
이 논문에서 개인적으로 참고할만한 내용