[논문 리뷰] Rethinking what pLDDT really tells us about protein flexibility

정우현·2025년 12월 14일

서울대

목록 보기
31/38

✅ “AlphaFold의 pLDDT를 단순히 ‘유연성(=flexibility) 지표’로 해석하면 위험하다”

✅ 핵심 주장

pLDDT는 ‘내재적 유연성’이 아니라, 모델이 예측한 구조에 대한 국소적 불확실성/신뢰도(confidence) 지표에 가까움

그래서 “pLDDT 낮음 → 유연/무질서일 가능성”은 어느 정도 말이 되지만,
“pLDDT 높음 → rigid(안 움직임)”은 성립하지 않는다고 강조


pLDDT의 명확한 한계: ‘시간 스케일(timescale)’을 담지 않음

즉 단백질이 ps–ns, μs–ms에서 어떻게 움직이는지 자체를 직접 표현하는 점수가 아님


왜 pLDDT가 “유연성”과 자주 헷갈리나?

실험/시뮬레이션에서 얻는 “변동성” 지표들(MD의 샘플링, NMR ensemble의 불확실성, X-ray B-factor 등)을 pLDDT와 비교할 때,
각 지표가 섞고 있는 현상이 근본적으로 다르다고 지적

(MD는 force field 기반 샘플링, NMR은 데이터 희소성에 따른 ensemble 불확실성, B-factor는 열적 운동 + 모델 불확실성 등)


관찰/예시: “기능적으로 움직이는 부위도 pLDDT가 높게 나올 수 있음”

리간드 결합/알로스테리처럼 기능적으로 여러 상태를 오가는 시스템에서도 AF2가 ‘단일 고신뢰 구조(pLDDT 높음)’를 주는 경향이 반복 관찰된다고 설명

pLDDT는 “유연성”이 아니라 “그 한 가지 구조 가설에 대한 모델의 확신”이라는 뜻


이유로 학습 데이터(PDB)가 상대적으로 ‘정적/대표 상태’에 편향되어 있고, 드물거나 저점유율(low-population) 상태는 잘 포함되지 않기 때문


그럼 대안은?

AF2에서 MSA를 조작(서브샘플링, 클러스터링, 컬럼 마스킹 등)해 ensemble을 뽑아보려는 시도들이 소개

이런 구조들에서 출발해 MD로 확장하면 기능적 ensemble 탐색에 도움이 될 수 있다고 언급

하지만 정량적으로 “열역학/동역학(thermodynamics/kinetics)까지 포함한 ensemble”을 평가하는 데는 여전히 충분한 샘플링이 된 MD가 가장 신뢰할 수 있는 물리 기반 도구


1) 둘이 공통으로 말하는 결론: “pLDDT = 유연성 점수”가 아니다

pLDDT는 유연성/동역학을 직접 측정하는 값이 아니라, 모델이 낸 구조 가설에 대한 ‘불확실성/신뢰도(confidence)’에 가까움

그래서 시간 스케일(빠른 흔들림 vs 느린 전이)을 담지 못한다는 게 핵심 한계

또한 “높은 pLDDT가 ‘rigid’를 의미하진 않는다”
기능적으로 여러 상태를 오가도 AF2가 고신뢰 단일 구조를 내는 경우가 흔하고, 이건 학습 데이터가 동적인/저점유율 상태를 잘 포함하지 않기 때문이라고 설명

ITsFlexible 논문: AF2 pLDDT가 단백질 무질서(disorder) 지표로 쓰인 적은 있지만, CDR 유연성 예측에는 “높게 예측적이지 않았다”고 실증적으로 결론

➡️ 즉, 코멘터리는 “원래 pLDDT는 유연성 자체가 아니라 confidence라서 그럴 수밖에 없다”를, ITsFlexible은 “실제로 CDR에서는 잘 안 맞는다”를 보여주는 조합.


2) “그럼 ensemble(여러 구조) 뽑으면 되지 않나?” → 그것도 CDR에는 한계

코멘터리도, ITsFlexible도 “AF2에서 MSA를 흔들어서 여러 구조를 뽑는 방법”을 언급

코멘터리: MSA subsampling/클러스터링/마스킹 등으로 ensemble을 뽑고, 거기서 MD를 돌리면 도움이 될 수는 있지만(실무적으로 자주 함), pLDDT 자체로 동역학을 정량화하는 건 한계
그리고 충분한 샘플링이 되면 MD가 여전히 가장 신뢰할 물리 기반 도구


ITsFlexible: MSA subsampling으로 만든 구조 다양성도(confidence 점수보단 낫지만) CDR 유연성을 “정확히 포착하지 못했다”고 결론

ITsFlexible에서 MSA subsampling은 실제로 max MSA depth/extra seq/recycle을 낮추고 여러 seed로 40개 모델을 뽑아 CDR loop RMSD 다양성을 쓰는 방식

➡️ 요지는: 일반 단백질에서는 ensemble trick이 어느 정도 먹힐 수 있어도, CDR은 “결합/환경/데이터 편향” 때문에 그걸로 유연성을 안정적으로 읽기 어렵다


3) ITsFlexible이 제시한 “CDR 유연성”의 더 직접적인 결정요인

“유연성은 단순히 루프 길이만이 아니다"

CDR의 유연성은 구조 맥락에서의 residue 배열(주변 환경/배치)이 핵심 요인이라고 보고(이전 MD 연구들과 일치)

그래서 pLDDT 같은 “불확실성 점수” 대신, 루프 + 주변 컨텍스트를 그래프로 넣는 GNN 분류기(ITsFlexible)로 rigid/flexible을 분류하는 접근

또한 ABB2의 예측오차(RMSPE) 같은 다른 confidence 계열도 결국 유연성보다 “학습 데이터에 그 항체가 얼마나 자주 있었는지”와 더 강하게 상관된다고 분석(=confidence의 본질적 한계)


4) 한 줄로 연결 정리

코멘터리: “pLDDT는 유연성이 아니라 모델 confidence라서, 특히 기능적 전이/다중 상태를 반영 못한다.”

ITsFlexible: “그래서 실제로 CDR 유연성에서는 pLDDT/ensemble diversity/기타 confidence 지표가 신뢰할 예측자가 아니었고, 구조 맥락을 보는 모델이 더 낫다.”

profile
In-silico Antibody Design & Engineering Lab Researcher, Seoul National University

0개의 댓글