오늘 포스팅으로는 최근에 관심을 갖기 시작한 생물정보학에 대해 다루어 보려고 한다. 데이터사이언스 분야에서는 도메인 지식을 충분히 잘 갖추는 것이 강점이 될 수 있는데, 바이오 분야의 데이터에 흥미가 가서 생물정보학 분야를 알아보게 되었다.
생물 정보학
생물정보학에 대한 기존 지식이 많이 없어서, 최근 기사를 찾아보게 되었다. 아래의 기사에 대해 간략히 소개하면서 생물정보학에 대해 알아보도록 하자.
기사의 내용을 요약하자면, 질병 연관 유전자 발굴에 AI가 활용되었다는 내용이다.
질병에 대한 유전자의 치료적 유전자 타깃 및 생체 지표 유전자 여부를 예측하고 결과에 대해 충분한 설명을 제공하는 AI 시스템이 개발되었다. 질병은 개인이 가진 여러 유전적 요소들의 복합적 상호작용으로 발생하는데, 하이퍼그래프 및 어텐션 메커니즘을 사용해 질병에 관여하는 여러 생물학적 요소들 사이 복합적 상호작용을 모델링하고, 어텐션 연산 결과 시각화를 통해 모델 예측 결과에 대한 설명도 제공한다.
도메인은 생소하지만 사용된 알고리즘은 흔히 들어왔던 내용이다. 이 시스템에 사용된 메커니즘에 대해 추가적으로 알아보았다.
생물학 분야에서 AI를 활용하면 단시간 내 특정 질병에 대한 치료적 유전자 후보군을 발굴하고, 이를 기반으로 질병 유발 유전자에 직접 작용해 질병의 근본 원인을 제거할 수 있을 것이다.
생물정보학자는 생명과 데이터사이언스 두 분야 모두 전문가 수준를 요구한다. 도메인 지식(생명과학)과 기술적 역량(데이터 사이언스)를 모두 갖추어야 한다. 컴퓨터 관련 학과에서 생물학을 추가적으로 공부하는 학생보다는 생물 관련 학과에서 데이터사이언스를 추가적으로 공부하는 학생이 더 많다. 데이터사이언스를 전공한 학생들이 생물정보학에 관심을 갖게 되는 경우도 있지만, 이들은 생물학적 배경지식이 부족한 경우가 많아 생물학적 데이터의 구조나 해석에 어려움을 겪는 경우가 잦다고 한다. 보통의 기업에서 석사 이상을 요구하기 때문에, 학부 졸업 후에 생물정보학 관련 석박사를 따는게 보통이고, 이후에 제약사/유전체분석/AI바이오기업에 취업한다. 생물정보학을 진로로 한다면, 부전공으로 생체의공학과나 유전생명공학과 수업을 듣는 것도 나쁘지 않을 것 같다.