[생물정보학] Pseudotime Trajectory Analysis

굴러가는·2025년 8월 5일

Trajectory inference

  • Trajectory(궤적) inference or pseudotemporal ordering is a computational technique used in single-cell transcriptomics to determine the pattern of a dynamic process experienced by cells and then arrange cells based on their progression through the process.

시간 정보가 부재한 scRNA-seq 데이터를 바탕으로 어떻게 유전자 발현의 궤적을 추정할 수 있을까?



정의

scRNA-seq 기반의 Trajectory Inference (TI) 는 서로 다른 세포들이 마치 같은 세포가 상태 전이를 하는 것과 같이 궤적을 추론하는 방식이다.

scRNA-seq 데이터는 시간 정보가 부재한 정적인 데이터이지만, 같은 유전자 발현 궤적 위에 있는 세포들은 마치 시간의 흐름에 따라 변화하는 하나의 흐름과 같이 보이게 된다.
TI 는 이 점을 이용하여 특정 세포는 다른 세포보다 더 이른 상태에 있다는 상대적인 순서, 즉 pseudotime을 설정함으로써 분석을 하게 된다.




목적

각 세포는 유전자 발현량을 feature로 하는 high-dimensional vector data이며, TI의 목적은 이 세포들 사이의 유사성 및 이질성을 이용하여 상태 변화 경로를 추론하는 것이다.




개념 및 용어

TI 방법에서 Cell은 노드, Gene의 발현값은 그 노드를 정의하는 벡터로 사용된다.

개념설명
CellTI의 분석 단위이며, trajectory의 각 지점
gene세포 상태를 설명하는 고차원 특성으로 사용됨
Expression Matrix유전자 × 세포 행렬, 세포별 유전자의 발현값



Pseudotime & Trajectory

Pseudotime은 trajectory의 좌표값, 즉 Metric이다. Trajectory는 pseudotime 축을 따라 세포들이 배열된 경로(path) 혹은 구조를 의미한다. 해당 경로에는 세포의 분기 유형 및 유전자 발현에 따른 세포의 상태가 위치하게 된다.

* 전체 구조가 Trajectory를 의미, 각 세포가 위치한 지점이 pseudotime

* Root cells를 설정하고, Root cells로부터의 거리를 기반으로 다른 세포들의 위치를 정의한다. 더불어 해당 위치들을 pseudotime이라 정의하여 이에 따른 세포들의 분화 및 유전자 발현에 따른 세포 상태를 살펴보는 것이 Trajectory(궤적)을 추정하는 방식이다.





**참고자료**

Kelly Street, Davide Risso, Russel B. Fletcher, Diya Das, John Ngai, Nir Yosef, Elizabeth Purdom, Sandrine Dudoit - [Link]



profile
통계학, 추론통계, 기계학습

0개의 댓글