요약
생물 정보학이란 생물학과 정보학의 합성어로, 생물학적 문제를 전산학, 통계학, 수학적 관점에서 풀어내는 학문이다. 이 분야의 시발점은 DNA 및 단백질 서열을 밝히고 데이터 베이스를 구축하는 것이었다. 규모와 복잡성 탓에 전통적인 분석 방법으로는 다루기가 힘들다는 단점이 존재했다. 그러나 20세기 후반부터 염기서열 분석 기술의 발달로 이러한 데이터의 양이 급격히 증가했으며 초거대 프로젝트인 Human genome project 등 대규모 연구들이 진행되면서 정보의 해석 및 관리에는 전산학적 기법이 필수적이라는 것을 깨닫게 되었다. 단순히 데이터의 수집 및 저장이 목적이 아닌, 복잡한 생물학적 현상을 이해하고 예측하는 데 주요한 역할을 수행하기 시작했다. 결과적으로 유전자와 단백질의 상호작용, 질병 발생 메커니즘, 진화의 양상 등 많은 주제들이 연구 대상이 되었다. 최근 염기서열 분석 기술이 급격한 발전을 이루면서 유전체 외에도 다양한 분자 수준에서의 데이터 분석이 가능해졌으며, 이러한 데이터를 총체적이고 종합적으로 분석하는 다중 오믹스 분석(multi-omics analysis)도 매우 빠르게 발전하고 있는 추세이다.
생물정보학은 다양한 통계학 및 전산학 분야들을 활용해 생물학 데이터를 계산하거나 새로운 분석 알고리즘을 만드는 등 다양한 분석틀이 필요한 분야다. 단순히 도구의 제공을 넘어서, 이제는 다양한 생명 현상을 수학적, 통계적으로 분석해서 다양한 가설에 부합하는 바이오 마커를 발굴할 수 있게 만드는 분야라고 볼 수 있다.
주요 포인트 생물정보학의 탄생과 활용
핵심 개념 및 용어 정리
핵심 개념
생물정보학 정의 – 생물학 + 정보학 융합 학문
초기 목표 – DNA·단백질 서열 분석 및 데이터베이스 구축
기술 발전 – 염기서열 분석 기술 발달 → 데이터 급증
Human Genome Project – 대규모 연구로 전산학적 분석 필수
연구 범위 확장 – 유전자-단백질 상호작용, 질병 메커니즘, 진화 연구
다중 오믹스 분석 – 유전체·단백질체 등 종합적 데이터 해석
통계·전산학 활용 – 생명 현상 수학적 분석 및 바이오마커 발굴
용어 정리
다중 오믹스 분석 (Multi-Omics Analysis): 유전체학, 단백질체학, 대사체학(Metabolomics) 등 다양한 데이터 통합 분석. 생물학적 네트워크 및 시스템 수준에서 질병과 생명 현상을 연구.
전산 생물학 (Computational Biology): 생물학적 데이터를 분석하는 알고리즘 및 모델 개발. 기계 학습, 인공지능(AI) 등을 활용한 데이터 해석.
유전체학 (Genomics): 유전체(Genome, 생명체의 모든 유전정보)를 연구하는 학문. 전장유전체분석(WGS, Whole Genome Sequencing) 및 전사체 분석(Transcriptomics) 포함. Human Genome Project가 대표적.