[논문 리뷰] Drug-like antibodies with low immunogenicity in human panels designed with Latent-X2

정우현·2026년 1월 9일

서울대

목록 보기
33/38
post-thumbnail

✅ Abstract

처음부터 developable(개발 가능) 하고 non-immunogenic(비면역원성) 인 약물 분자를 직접 설계하는 계산 시스템이 목표
-> Latent-X2로 달성했다고 주장


Latent-X2

frontier generative model이며,
zero-shot으로(후속 최적화 없이) 강한 결합 친화도, drug-like 성질, 그리고 (de novo 생성 항체로는 처음으로) 사람 공여자 패널에서 낮은 면역원성을 확인


모델 특성

all-atom 모델이고,
입력 조건으로 (1) 타깃 구조, (2) epitope(핫스팟) 지정, (3) optional antibody framework를 받으며, 결합 복합체(bound complex)를 모델링하면서 서열과 구조를 jointly 생성


실험 결과(항체)

타깃별/모달리티별 4~24개 디자인만 테스트했는데, 18개 타깃 중 9개에서 VHH와 scFv 항체를 성공적으로 얻었고, target-level 성공률 50%, pM~nM 결합 친화도를 달성

개발가능성(developability): 생성 분자들이 승인된 항체 치료제와 같거나 더 좋은 developability 프로파일을 보였고, 평가 항목으로 발현 수율, 응집(aggregation) 성향, polyreactivity, 소수성, 열안정성을 포함하며 최적화/필터링/선택 없이도 그 특성이 나왔다고 강조

면역원성: AI 생성 항체에 대해 처음으로 면역원성을 평가했고, TNFL9 표적 de novo VHH가 T-cell proliferation 및 cytokine release assay에서 낮은 면역원성 + 강한 타깃 결합을 보였음


K-Ras(오랫동안 undruggable로 여겨진 타깃)에 대해 macrocyclic peptide binder를 만들었고, trillion-scale mRNA display 스크린과 경쟁 가능한 수준이라고 주장


✅ Introduction

1) 문제의식 / 이 논문이 달성했다고 주장하는 목표

약물 개발은 “리드 후보를 직접 설계해서 developability 허들을 넘고 면역반응도 유발하지 않게 하면서, 긴 최적화 과정을 피하는” 시스템을 오랫동안 추구해 왔고, 그게 이제 가능해졌다고 말함

Latent-X2는 pM~nM 결합, drug-like developability, 그리고 (AI 생성 항체로는 처음으로) 인간 공여자 패널에서 낮은 면역원성을 post-generation optimization 없이 보여준다고 서술


2) 왜 기존 접근이 어렵나(비용/실패 이유)

현재 접근은 개발 비용도 크고 임상 실패도 많다. 실패 이유는 “결합이 약해서”가 아니라, 결합만으로는 부족하고 임상 성공에는 developability + 낮은 면역원성이 동시에 필요하기 때문이라고 정리

이 결함을 “최적화”로 고치려 해도 종종 실패하거나, 어떤 성질을 올리면 다른 성질이 떨어지는 zero-sum trade-off가 생기며, 이게 프로그램당 큰 예산을 소모하고 중요한 타깃들을 어렵게 만듦


3) 관련 선행 AI 흐름 + Latent-X2의 위치

최근 AI로 zero-shot binder 생성이 가능함이 보였고, 동시에 AI 생성 항체가 developability threshold를 통과할 수 있음도 보고되었음


Latent-X1(미니바인더/매크로사이클) 성과를 기반으로,

Latent-X2는 AI 생성 항체 최초의 low-immunogenicity 데모 항체(VHH, scFv) + macrocyclic peptide + mini-binder를 단일 시스템에서 다루는 일반화

mini-binders/macrocycles에서 Latent-X1 대비 성공률 개선(benchmark)을 강조


4) Fig.1이 말하는 “입력 → 출력”과 기대 특성

Fig.1에서 멀티모달 프롬프트는 Target 구조(회색) + Epitope hotspot(노랑) + Optional framework로 구성되고, 출력은 타깃과 결합한 복합체 상태의 binder 서열+구조를 모달리티(VHH/scFv/macrocycle)에 걸쳐 생성

생성물이 목표로 하는 drug-like 프로파일:
Low polyreactivity / Low hydrophobicity / High yield / High monomericity / High thermal stability / Low ex-vivo immunogenicity


5) 작동 원리

모델은 타깃 구조·epitope·(옵션) 프레임워크 조건 하에 all-atom 구조와 서열을 함께 생성하고,
bound complex에서 비공유 결합(non-covalent) 상호작용을 직접 모델링해서
VHH, scFv, macrocyclic peptide까지 task-specific fine-tuning 없이 만듦


6) Introduction에서 제시하는 성과 요약

18개 타깃에서, 타깃×모달리티 조합마다 4~24개 항체 디자인만 실험해 50% target-level 성공률과 높은 친화도를 얻음

별도로, K-Ras(G12D)와 PHD2(종양/저산소 생물학 관련의 challenging 타깃)에서는 Latent-X2가 설계한 macrocyclic peptide 10개를 테스트했고, state-of-the-art mRNA display hit과 “맞먹거나/넘는” 결과

“Drug-like 성질이 모델에서 바로 emergent하게 나온다”는 주장으로, 높은 발현 수율, 유리한 생물물리 특성, 낮은 polyreactivity, 그리고 승인 치료제 벤치마크 수준의 developability를 강조

면역원성은 TNFL9 de novo VHH를 10명 공여자 패널에서 평가해, 강한 타깃 결합 + 낮은 ex vivo 면역원성을 확인


7) 저자들이 정리한 “main contributions” 5가지

인간 공여자 패널에서 낮은 면역원성이 입증된 최초의 de novo 설계 항체

18개 타깃에서 모달리티당 4~24개만 테스트하고도 50% target-level 성공인 zero-shot 설계

pM~nM 친화도 + 승인 치료제와 같거나 더 나은 developability

VHH, scFv, macrocyclic peptide, mini-binder를 아우르는 단일 아키텍처

trillion-scale mRNA display와 맞먹거나 더 좋은 macrocyclic peptide binder


✅ Result

Latent-X2가 항체(VHH/scFv)와 매크로사이클 펩타이드 모두에서, zero-shot으로 고친화도(high-affinity) binder를 만든다는 걸 실험으로 보임

각 modality×target 조합에서 4~24개 디자인만 실험해도, 구조적으로 다양한 타깃에서 성능을 확인했다고 강조

항체 쪽은 첫 생성(generation 1)부터 drug-like biophysical / expression / polyreactivity 프로파일을 보임

TNFL9 타깃에서는 대표 VHH들이 ex vivo T-cell proliferation & cytokine release에서 면역반응이 검출되지 않음

매크로사이클은 K-Ras(G12D), PHD2에서 기존 SOTA 실험 플랫폼(RaPID/mRNA display)과 경쟁적이며, 특히 PHD2에서 single-digit nM 친화도를 달성


✅ 2.1 High-affinity VHH & scFv + drug-like developability

설정/대상

일반화 성능을 보기 위해 18개 soluble protein target에 대해 VHH와 scFv 디자인을 생성했고, 이 패널은 생물학적 기능 다양성 / 물성(바이오피지컬) 난이도 / 치료적 관련성을 고려해 선정


바인더 성과(히트율/친화도 측정 방식)

18개 중 9개 타깃에서 validated binder를 얻었고, 타깃당/모달리티당 최대 24개만 한 번의 zero-shot 라운드로 테스트

잘 된 실험에서는 최대 25% 디자인이 confirmed binder가 됐음

친화도는 5-point BLI 또는 SPR로 측정했고, low-picomolar까지 나옴

각 타깃에서 “가장 강한” 바인더를 Fig.2a에 요약했고,

대표 구조/response curve는 Fig.2c에 제시

재현을 위해 각 타깃의 lab-validated sequence를 Table S1에 제공하며, 구조는 플랫폼에 로그인 없이 공개


Fig.2

Fig.2a: 타깃별 “최고” KD(빨강 scFv / 보라 VHH). *표시는 avidity 영향 가능성

Fig.2b: developability 프로파일을 치료제 벤치마크와 비교(회색 음영 = unfavorable)
오른쪽은 “몇 개 기준을 충족했는지” 분포

Fig.2c: 설계된 구조와 BLI/SPR response curve(여기 curve 위에 KD 라벨이 붙어 있음)


developability 평가(무슨 지표를 재고, 결과가 뭐였나)

모든 후보에 대해 expression yield / monomericity / hydrophobicity / thermostability / polyreactivity를 종합 측정

이 지표들이 제조가능성, 안정성, PK, 면역원성 리스크를 좌우함

바인더를 얻은 타깃들에서:

47%가 (치료제 항체로부터 설정한) 임계값을 4개 핵심 지표(모노머성/소수성/열안정성/폴리리액티비티) 모두에서 만족 또는 초과

80%가 4개 중 3개를 만족 또는 초과
→ “drug-like 성질이 zero-shot에서 바로 emergent”라고 결론

추가로, 임계값 설정에 쓴 컨트롤 말고도 승인/임상 단계 치료제에서 유래한 VHH/scFv 도메인 10개를 비교군으로 평가

이 비교 항체들은 원래 “단독 VHH/scFv로 발현되는 형태가 아니라서” Fc-VHH / Fc-scFv fusion으로 재구성해 측정

그 결과 Latent-X2 디자인의 분포가 동등하거나 일부는 더 좋았음


✅ 2.2 De novo antibodies with no detectable immunogenicity in human donor panels (TNFL9)

왜 이걸 보나(문제의식)

임상 단계에서 실패가 많은데, 큰 원인 중 하나가 immunogenicity(원치 않는 면역반응)이며, 항체 치료제에선 ADA(anti-drug antibody) 유발 → 효능 감소/클리어런스 증가/PK 변화/심각한 반응으로 이어질 수 있음


TNFL9에서의 디자인/선정/특성

Latent-X2가 “단순 hit”을 넘어 lead 후보로 갈 수 있는지 보기 위해 TNFL9를 대표 타깃으로 심층 실험 (염증/면역 신호 관련 면역조절 타깃이라는 맥락)

TNFL9에 대해 24개 디자인을 테스트했고, 5개 VHH binder를 식별, 그중 4개를 결합특이성/면역원성 분석에 사용

이 4개는 low-nanomolar 친화도로 확인되었고, developability는 4개 중 3개 기준 통과, 그중 2개는 4개 모두 통과


결합 특이성(알라닌 변이)

Fig.3a에서 설계 VHH(보라)-TNFL9(회색) 복합체와 epitope 상호작용(핑크)을 보여주고, F116 / W99 / D113 중 어느 하나라도 Ala로 바꾸면 결합이 사라짐


ex vivo 면역원성 평가(10명 공여자, T-cell + cytokine)

10명의 건강한 공여자 혈액에서 얻은 primary immune cells로 평가(“인간 세포 수준에서” 면역원성 리스크를 직접 측정한다는 논지)

T-cell proliferation: 48h와 120h에서 측정했고, 4개 VHH 모두 background 대비 증가가 없었음

비교 약물로 caplacizumab(승인된 VHH 기반 치료제)도 함께 두며, 이 역시 증가가 없었음


Cytokine release (120h): untreated와 ImmunoCult positive control을 함께 두고, 설계 VHH들과 caplacizumab에서 cytokine 상승이 검출되지 않았음

측정 cytokine 예시(도식/텍스트에 등장): IL-10, IL-6, IL-8, IL-16, IFN-γ, TNF-α

IL-8은 일부 조건에서 assay 상한을 넘는 경우가 있어 “above range”로 표기

농도는 1.11, 3.33, 10, 30 μg/mL로 증가시키며, 점 하나가 공여자 1명이고 조건당 2회 반복(평균 표시)이라고 명시


2.2 결론(저자 주장)

Latent-X2 VHH는 고친화도 결합 + developability(약물성) + 검출 가능한 면역반응 없음이 한 후보 안에서 같이 성립했고, hit discovery를 넘어 lead selection로 진행 가능

“de novo 설계 항체를 인간 세포 기반 면역원성 assay로 평가한 첫 보고”라고 주장하며, 측정 가능한 면역원성 신호가 없었음


✅ Method

Latent-X2는 all-atom 생성 모델로, binder의 서열(sequence)과 구조(structure)를 “동시에” 생성
(구조를 만든 뒤 다시 resequencing 하는 식의 후처리/정련 단계 없이 진행)


입력:

  • Target 구조(여러 체인 가능),
  • epitope를 정의하는 hotspot residues,
  • binder modality(항체/VHH/scFv, macrocycle, mini-binder 등)

항체 디자인의 경우 추가로

  • framework 구조,
  • 원하는 CDR 길이
    입력으로 넣어 VHH, scFv 같은 포맷을 지정할 수 있게 함

출력

  • 지정 epitope에 결합한 “전체 binder–target complex”(복합체) 형태

✅ In silico 필터링(viable design 선별)

실험에 올릴 후보를 고르기 위해 구조예측 모델 기반 in silico 필터를 적용

  • 항체 binder:
    구조예측 신뢰도 지표(confidence metrics) +
    Latent-X2가 만든 complex와 예측된 complex의 self-consistency를 DockQ로 비교하여 필터링

  • mini-binder/macrocycle:
    이전 Latent-X1 논문의 scoring 방식을 사용

항체의 in silico pass rate는 target/epitope/framework에 따라 크게 변동하며, 200개 타깃 랜덤 epitope 벤치마크에서 평균 pass rate는 ~1% 수준(일부는 20% 초과)

모델은 두 버전을 사용:

Latent-X2: 실험 검증용 디자인 생성

Latent-X2.1: in silico hit rate 분석용(플랫폼에 제공되는 버전)

✅ 3.1 VHH / scFv binder design

(1) Epitope(핫스팟) 정의

타깃 표면에서 hotspot residues(1~4개 interface residue)를 지정해서 epitope를 정의

hotspot 선택은 기존 검증 epitope(이전 연구) 또는 co-crystal/known interface 분석을 기반으로 함


(2) Framework 및 CDR 생성 전략

VHH와 scFv 모두 각각 5개의 framework를 사용(임상/선행연구에서 사용된 scaffold 기반)

scFv는 계산 단계에서는 Fv로 모델링한 뒤, 디자인 후 flexible peptide linker를 붙여 scFv를 구성

CDR은 전부 de novo 생성(VHH는 3개, scFv는 6개)이고, grafted/fixed region 없이 생성

CDRH3의 기여가 크기 때문에 CDRH3 길이를 native 대비 ±2까지 변형하고, 나머지 CDR 길이는 고정


(3) “Novelty” 확인(기존 서열 암기 방지)

SAbDab 대비 CDR edit distance(연결된 CDR 루프 기준)로 novelty 평가( scFv는 heavy/light 각각)

MMseqs2로 유사서열 검색 시, 가능한 모든 매치를 보려 E-value filtering을 끄고 prefilter/alignment를 통과한 것들을 보존한다는 설정

실험에 간 디자인은 SAbDab 기준 가장 가까운 것과 CDR edit distance ≥ 11, 대부분 20 초과

추가로 BLASTP(ClusteredNR, full sequence)에서도 최소 16 residues 이상 거리를 둔다고 보고


(4) 중복/유사 디자인 제거 + 간단한 sequence filter

CDR 서열을 80% identity로 MMseqs2 clustering 후 cluster당 1개 대표만 실험으로 진행
(많은 singleton cluster → 다양성 큼)

CDR 내부 cysteine, N-linked glycosylation motif를 포함하는 디자인은 제외


(5) 실험 검증 워크플로우(요약)

1차: single-point BLI로 스크리닝 → threshold 넘으면 hit

2차: 5-point BLI 또는 SPR로 정밀 측정 → 기준 충족한 경우만 최종 KD 보고

특이성 확인: TNFL9 VHH 4개에서 CDRH3 interface residue를 alanine scan하여 결합 소실 여부 확인


(6) Developability assay 패널(핵심 기준까지)

Aggregation: SEC-HPLC로 90% 이상 monomer면 통과

Polyreactivity: BVP ELISA를 therapeutic control로 정규화(bococizumab=1, panitumumab=0), score ≤ 1 통과

Hydrophobicity: HIC-HPLC retention time 정규화(lirilumab=1), 정규화 값 ≤ 1 통과

Thermostability: DSF의 첫 melting transition(Tm1) 사용, bococizumab의 Tm1(61°C)보다 크면 통과


✅ Discussion

Latent-X2를 all-atom generative model로 제시하며, 첫 세대(first generation)부터 drug-like 항체를 설계할 수 있다고 주장

또한 18개 타깃에서 50% target-level 성공률, 승인 치료제 수준의 developability, 인간 공여자 패널에서 낮은 면역원성을 보여 “임상 실패 주요 원인 중 하나인 면역원성”의 공백을 메움


1) 단일 아키텍처로 항체 + 매크로사이클을 함께 설계

Latent-X2는 task-specific fine-tuning 없이 하나의 아키텍처로 항체와 macrocyclic peptide를 모두 생성하며, 이는 모델이 원자 수준(atomistic level)에서 특정 결합 상호작용의 생화학을 학습했음을 시사한다고 해석

특히 매크로사이클 결과는 10개 디자인만으로도 “exhaustive library screen”을 능가했기 때문에, generative precision이 brute-force screening을 대체할 수 있음을 보여준다고 강조


2) 효율성의 의미: “히트 찾기”를 넘어 “리드에 가까운 후보”를 바로 만든다

효율성은 단순히 hit finding을 넘어서, 처음부터 favorable property를 갖는 분자를 생성함으로써 기존 시작점보다 임상 리드에 더 가까운 후보를 만든다고 주장

그리고 “결합은 통과했지만 developability/면역원성에서 실패하는 분자”는 최적화를 많이 해도 구제되지 않는 경우가 많다고 지적

이 논문이 사용한 스케일(타깃×모달리티당 4~24개 디자인) 정도면, 항체 설계가 개별 연구자 단위로도 접근 가능해지고, 개인맞춤 치료제나 빠른 팬데믹 대응 같은 응용이 더 현실화된다고 말함


3) “drug-like 특성의 emergent” 해석: 단순 루프 생성 이상의 원리를 배운 것

저자들은 명시적 최적화 없이 drug-like 성질이 나타난다는 점이 모델이 “loop generation”을 넘어선 원리를 학습했다는 신호라고 봄

좋은 scaffold만으로는 성공이 보장되지 않으며, 전통적 CDR grafting이 흔히 불안정화/응집/결합 소실을 유발한다고 언급

Latent-X2는 이런 실패 모드를 피하면서 low polyreactivity + low immunogenicity도 만들었다고 하고,
이는 (1) 구조적으로 맞는 CDR뿐 아니라 (2) promiscuous/immunogenic motif를 피하는 서열까지 생성하도록 학습했음을 시사한다고 해석


4) 한계와 다음 과제

모든 결과는 preclinical이며, 앞으로 동물실험과 임상시험이 남아 있음

면역원성 평가는 ex vivo 인간 공여자 패널로 수행했는데, 이는 잘 확립된 proxy이지만 in vivo를 대체하지는 못한다고 명시

향후 과제로는

면역원성 평가를 다른 타깃으로 확장,
agonism, T-cell engagement 같은 기능성 assay 탐색,
아직 실패한 타깃들에 대한 failure mode 이해를 제시

매크로사이클 쪽은 cell penetration과 oral bioavailability 최적화가 미래 방향이며, 이것이 항체 포맷으로는 접근하기 어려운 intracellular target을 열어줄 수 있다고 말함

또한 향후에는 full IgG 및 다른 항체 포맷으로 확장하겠다고 함


✅ Supplement

✅ A. Model usage

Latent-X2는 https://platform.latentlabs.com 에서 사용할 수 있고,
입력은 크게 Target specification(타깃 명세) + Binder specification(바인더 명세) 로 구성


1) Target specification (타깃 입력)

Target structure: 바인더를 설계할 타깃 단백질 구조/서열이 들어있는 mmCIF 파일
타깃은 여러 체인(multiple chains) 포함 가능

Hotspot residues: 타깃 표면에서 결합 hotspot(에피토프 핵심 잔기) 의 서열 위치를 지정
최소 1개 이상 제공 필수
실제로는 표면 접근 가능하고 공간적으로 가까운 소수의 hotspot만으로도 모델을 충분히 유도 가능

Target cropping: 컨텍스트 윈도우에 맞추기 위해 타깃 구조를 crop(잘라서) 넣는 것도 가능


2) Binder specification (바인더 입력)

설계 모달리티(매크로사이클/미니바인더/항체 등)에 따라 달라짐


  • Macrocycle / mini-binder: binder length(길이) 지정 필요

  • Antibody-based binder(VHH, scFv 등):

(1) Framework structure

항체 스캐폴드 구조/서열이 들어있는 mmCIF 파일
치료제 Fv/VHH 같은 기존 항체 기반 스캐폴드 사용 가능

(2) CDR lengths

프레임워크 사이의 각 CDR loop는 Latent-X2가 새로 설계하므로 사용자가 각 CDR 길이를 지정해야 함


3) 입력 표현 관련 주의사항

Context length = 512 residues
-> 입력/출력은 타깃+바인더를 합쳐서 총 512 잔기까지 처리

Structurally unresolved residues 처리
-> 타깃 구조에서 구조가 해석되지 않은 잔기(unresolved residues) 는 drop됨
즉, 그런 잔기의 아미노산 정보도 모델 입력에 포함되지 않음

Target backbone only
-> 타깃은 백본 원자(backbone atoms) 만 모델에 제공됨


✅ B. Computational design (계산 설계 세부)

1) 타깃 구조 준비

512 residue 컨텍스트 제한 때문에, 큰 타깃은 결합부에서 먼 잔기를 제거하여 crop함

2) 프레임워크(스캐폴드) 정의

프레임워크는 ANARCI + IMGT numbering 기준으로 주석화됨

3) 특이사항

3eak, 7ssc 구조에는 FW4 말단에 unresolved C-terminal serine 이 존재
→ wet-lab 재현을 위해 해당 serine을 설계 서열에 추가함

scFv는 계산 설계 단계에서는 Fv(heavy+light) 로 모델링하고, 설계 후에 heavy–light 방향으로 (G4S)4 linker 를 붙여 scFv를 구성함


B.1. Sequence novelty (서열 새로움 평가)

Latent-X2가 만든 항체가 “기존 항체를 단순 암기한 것인지” 검증하기 위한 절차


1) CDR 기반 novelty (SAbDab)

SAbDab의 각 VH/VL에 대해 CDR들을 concat 해서 DB 생성

Latent-X2 생성 서열을 MMseqs2로 검색

파라미터:
mmseqs search queryDB targetDB resultDB tmp -s 7.5 --num-iterations 3 -e inf --max-seqs 100000

각 매치에 대해 concat CDR의 Levenshtein edit distance 계산

novelty는 DB 엔트리 중 최소 edit distance 로 정의


2) Full-length 기반 novelty (ClusteredNR)

heavy/light 전체 서열을 BLASTP로 ClusteredNR에 검색

가장 가까운 hit에 대한 전체 서열 edit distance 분포 확인

profile
In-silico Antibody Design & Engineering Lab Researcher, Seoul National University

0개의 댓글