《Mapping the genetic and phenotypic complexity of disease with AI/ML models》
연자: Olga Troyanskaya (Princeton university)
해당 발표에서는 AI와 생명과학이 만나는 지점에서, 앞으로 생명현상을 어떻게 바라보고 해석할 것인가에 대한 새로운 방향을 담았습니다. 건강과 질병을 이해하는 일은 더 이상 단일 유전자나 단순한 생물학적 경로만으로 설명되기 어렵습니다. 유전체, 세포, 조직, 환경, 시간이라는 복잡한 층위가 서로 얽혀 나타나는 현상이며, 이를 해석하려면 기존의 접근을 넘어서는 시도가 필요합니다. 발표에서는 이러한 생명체의 다층적 복잡성을 ’생물지형학(Biogeometrics)’이라는 새로운 개념으로 설명하고 있습니다.
이 개념은 생명체를 고정된 구조가 아니라, 공간적·시간적 조건에 따라 끊임없이 변화하는 체계로 봅니다. 단편적 관찰을 넘어서, 생명현상을 입체적으로 조망하고자 하는 시도입니다. 이를 위해 하나의 기술이나 방법론에만 의존하는 것이 아니라, 다양한 분석 기법을 상황에 따라 적절히 활용하는 유연한 전략이 강조되었습니다. 발표에서는 이를 ‘여러 개의 망치를 갖춘 접근'으로 설명하며, 문제의 성격에 맞는 도구를 선택해 적용하는 것이 무엇보다 중요하다고 설명합니다. (딥러닝이 모든 문제에서 능사가 아니라는 말이죠..)
이러한 방법론적 철학은 유전체 분석의 여러 예에서 나타납니다. 예를 들어, 유전체의 대부분을 차지하는 비코딩 영역은 과거에는 ‘의미 없는’ 유전 정보로 여겨졌지만, 실제로는 유전자 발현을 조절하는 핵심 역할을 하고 있습니다. 발표에서는 이 비코딩 영역을 정밀하게 해석하기 위해 딥러닝 기반의 예측 모델이 활용되었으며, 단순히 예측의 정확성을 넘어, 해당 변이가 언제, 어떤 세포에서, 어떤 조절 기능을 방해하는지를 설명할 수 있도록 구성된 것이 특징입니다. 이를 통해 자폐증과 같은 복합 질환에서도 그 원인을 더 깊이 있게 들여다볼 수 있는 가능성이 열리고 있습니다.
데이터 통합에 있어서도 동일한 철학이 적용됩니다. 단일한 데이터 유형에 머무르지 않고, 유전체뿐 아니라 전사체, 단백질체, 후성유전체 등 여러 생물학적 층위를 통합해 분석하는 시도는 생명현상을 보다 전체적으로 이해하려는 노력입니다. 발표에서는 이러한 다중 오믹스 통합 분석을 통해 세포 내 조절 회로를 복원하고, 복잡한 감염병의 진단이나 예후 예측에 실질적인 효과를 보인 사례도 소개되었습니다. 여기서 핵심은 기술적 성과 자체보다, 생물학적 시스템을 개별 요소가 아닌 유기적 네트워크로 해석하는 관점입니다.
자폐증 표현형 연구는 이러한 통합적 사고의 큰 성과입니다. 발표에서는 수천 명의 자폐 아동 데이터를 기반으로 수백 개에 달하는 표현형을 통합 분석하여, 임상에서 관찰되던 다양한 양상을 네 가지 주요 아형으로 새롭게 구조화하였습니다. 단지 분류에 그치지 않고, 각 아형이 어떤 유전적 경로와 관련되어 있는지, 그 유전적 효과가 태아기인지 출생 이후인지에 따라 시기적으로 어떻게 나타나는지를 함께 분석한 점이 인상적입니다. 이는 표현형 기반 접근과 유전체 기반 접근이 따로가 아닌, 함께 작동해야 한다는 점을 분명히 보여주는 사례입니다.
해당 발표에서는 이러한 연구들을 통해 제시되는 보다 큰 방향성을 분명히 하고 있습니다. 생명과학은 단일 유전자 중심의 분석을 넘어, 생명체를 다층적이고 동적인 시스템으로 해석해야 합니다. AI는 단순한 계산 도구가 아니라, 이러한 복잡성을 다룰 수 있는 통합적 사고의 수단이 되어야 하며, 연구자는 문제 해결을 중심으로 기술을 선택하고 조합하는 유연함을 갖추어야 합니다.
이번 발표는 단지 몇 가지 기술을 소개하는 데 그치지 않고, 생명과학이 어떤 방향으로 나아가야 할지를 철학적으로 짚어주는 자리였습니다. AI와 생명과학의 통합, 생물지형학적 사고, 문제 중심의 방법론 선택, 그리고 지식의 개방성은 향후 생명과학을 이끌 네 가지 핵심 축이 될 것으로 보입니다.