21년만에 다시 하자는 HGP 와 AI가 지배하는 생물정보학 세계 격주 목요일 오전 8시, 따끈따끈한 생물정보학 업계 소식이 당신을 찾아갑니다 |
|
|
안녕하세요, 생정해요 편집부의 파랑새입니다.
저는 지난 주 한국생물정보학회를 다녀왔는데요, 몇년 전까지만 하더라도 Single-Cell 이 무섭도록 업계를 장악했던 것 같은데, 그 새 요즘의 트렌드는 아무래도 AI로 넘어간 것 같습니다. 저는 생물학과를 나와 현재 BI를 6,7년쯤 하고 있는데요. 요즈음 학계와 업계가 바뀌는 걸 보면 예전의 그 고요하던 생물학이 맞나 싶은 생각이 듭니다.
너무나도 빠르게 바뀌는 요즘의 생물정보학 트렌드, 격주로 정리해서 보내드리는 "생정해요! 뉴스레터"는 오늘부터 시작됩니다. 눈에 들어오는 논문부터 업계 소식, 채용 정보까지 모아서 정리해드리니, 학계에, 업계에 계신 분 모두 읽을 가치가 있을 거에요.
그럼 오늘도 재밌게 읽어주세요.
- 24년 10월 31일 연구실에서, 파랑새 |
|
|
《Briefings in Bioinformatics (IF: 6.8)》
Multimodal contrastive learning for spatial gene expression prediction using histology images
발간날짜: 24/10/14
저자: Wenwen Min et al.
이 논문은 고비용의 Spatial Transcriptomics(ST) 기술을 대체하기 위해 저비용 H&E 병리 이미지를 활용하여 유전자 발현을 예측하는 새로운 접근을 제시하고 있습니다. 기존의 ST는 세포 위치와 유전자 발현을 동시 분석해 주지만, 높은 비용 때문에 대규모 적용이 어려웠습니다. 이번 연구에서는 일반적인 병리 진단에 쓰이는 H&E 이미지를 사용해 ST 데이터를 예측하는 mclSTExp 모델을 개발하여, 저렴한 비용으로 조직 내 유전자 발현의 공간적 패턴을 정밀히 예측하는 가능성을 보여주었습니다.
mclSTExp의 핵심은 Transformer와 Contrastive Learning을 결합해 이미지와 위치 정보를 통합하는 데 있습니다. 특히, 암과 면역 관련 유전자들의 공간적 패턴을 예측하는 데 있어 뛰어난 성능을 입증하며, ST의 대안적 접근법으로 큰 의미를 가집니다.
|
|
|
《Scientific Reports (IF: 3.8)》
StructmRNA: a BERT-based model with dual level and conditional masking for mRNA representation
발간날짜: 24/09/26
저자: Sepideh Nahali et al.
이 논문은 mRNA의 구조와 기능 예측을 위한 StructmRNA 모델을 소개하며, BERT를 기반으로 dual-level masking과 conditional masking 기법을 적용한 것이 특징입니다. 기존의 mRNA 예측 모델들은 구조 데이터가 부족할 때 성능이 저하되었는데, StructmRNA는 BERT의 양방향 문맥 이해 능력에 sequence와 structure를 결합해 효율적으로 대응합니다. dual-level masking은 mRNA의 서열과 구조를 통합해 각기 다른 요소를 학습하게 하며, conditional masking은 특정 뉴클레오타이드의 생물학적 중요성에 따라 마스킹 확률을 조정해 자연적 변이성을 모방했습니다.
StructmRNA는 RNA degradation prediction에서 특히 높은 예측력을 보여, 전통적 모델에 비해 RNA의 안정성을 효과적으로 예측할 수 있습니다. 이 모델은 또한 GAN을 활용해 합성 데이터를 추가하여 훈련 데이터의 다양성을 높이며, 바이러스 연구, 치료용 mRNA 설계, 진단 및 백신 개발 등에서 응용 가능성을 넓혔습니다.
|
|
|
《Plant Biotechnology Journal (IF: 13.26)》
Redefining the accumulated temperature index for accurate prediction of rice flowering time in diverse environments
발간날짜: 24/10/12
저자: Xingbing Xu et al.
이 논문은 쌀 개화 시기를 예측하기 위해 축적 온도 지수(ATI)를 새롭게 정의하는 방법을 제시합니다. 기존의 ATI는 누적 온도 데이터로 개화 시기를 추정하는 전통적인 방식이었지만, 연구진은 다양한 환경에서 422개의 쌀 교잡종을 분석하여 새로운 ATI 계산 방식을 고안하였습니다. 그 결과, 개화 직전 26일부터 파종 후 1일까지가 예측에 가장 효과적인 온도 누적 기간임을 밝혔습니다.
재정의된 ATI는 반응 규범 지수(RNI) 모델보다도 적은 데이터로 높은 예측 정확도를 보여 주며, 복잡한 계산이 필요하지 않아 실무에서 쉽게 적용할 수 있죠. 특히 새로운 ATI는 생물학적으로도 개화 시기의 전환기와 일치하여 신뢰성이 높습니다. 연구진은 이 모델을 실무에서 활용할 수 있도록 개화 예측 키트를 개발했으며, 쌀뿐 아니라 다양한 작물에도 적용 가능성이 크다고 주장합니다.
|
|
|
에이치이엠파마 상장 시작
IPO는 언제나 가장 핫 한 뉴스이죠, 마이크로바이옴 관련 기업 에이치이엠파마가 11월 5일 코스닥 상장합니다. 코로나 이후 IPO의 열기가 많이 줄었음에도 여전히 672:1 의 경쟁률을 보였어요. 더 많은 생물정보학 회사들의 성공을 응원합니다. |
|
|
JW중외, 템퍼스AI 와 오가노이드 항암 신약 개발
미국의 AI 정밀의료 기업인 템퍼스 AI와 한국의 중외제약이 신약 개발을 함께 진행한다고 29일 밝혔습니다. 중외의 여러 후보물질들을 템퍼스AI 의 데이터와 모델을 통해 빠르게 스크리닝을 하고자 하는 것 같은데요. 기존의 제약 공룡들만 가능했던 신약 개발 시장에 AI가 들어오며 새로운 바람이 불고 있습니다.
|
|
|
휴먼 게놈 프로젝트 2회차?
휴먼 게놈 프로젝트(HGP)는 2003년에 인간 유전체 지도를 완성하면서 유전체학의 새 시대를 열었습니다. 당시 이 프로젝트는 인류가 질병을 이해하고 치료하는 방식을 바꿀 가능성을 제시하며, 정밀의료와 맞춤형 공중보건의 개념을 본격적으로 등장시켰죠. 이로 인해 유전자 정보를 기반으로 한 건강 관리와 질병 예방이 가능해졌고, 인간의 생명을 연장하며 삶의 질을 높일 것이라는 기대감이 컸습니다. 그러나 시간이 지나면서 모든 사람들이 이러한 유전자 정보를 평등하게 누리는 데는 여러 가지 장애물이 있다는 사실이 드러났어요.
가장 큰 문제는 경제적 격차와 지역에 따른 접근성의 차이입니다. 고가의 유전체 정보 접근은 고소득 국가에 집중되고, 많은 중·저소득 국가들은 경제적 자원이 부족해 최신 유전체 기술을 활용하기 어렵게 되었죠. 또한 데이터 보호와 프라이버시 문제, 그리고 윤리적·사회적 책임 문제(ELSI) 역시 심각한 고민거리로 남아 있습니다. 이러한 문제는 전 세계 인류가 함께 해결해야 할 과제이자, 더 큰 혜택을 모두에게 제공하려면 반드시 넘어야 할 장벽들입니다.
이러한 배경에서 휴먼 게놈 프로젝트 II (HGP2)가 새롭게 제안됩니다. HGP2는 전 세계 인구의 1% 이상을 대상으로 유전체 데이터를 수집해 유전적 다양성을 보다 폭넓게 반영하려는 목표를 가지고 있습니다. 이를 통해 기존의 유전체 데이터가 특정 인종이나 경제권에 치우쳐 있던 문제를 극복하고, 모든 인류가 그 혜택을 공평하게 누리게 하려는 거죠. 하지만 HGP2 역시 해결해야 할 많은 과제를 안고 있어요. 각국의 재정적 지원과 협력을 통한 글로벌 네트워크 구축, 데이터 보안 및 분석에 대한 국제 표준화, 그리고 윤리적·법적 기준을 준수하는 것이 필수적입니다.
HGP2가 정말로 전 세계 모든 사람에게 평등한 유전체 혜택을 가져다주기 위해서는 경쟁이 아닌 협력이 필수적입니다. 하지만 현실은 업계의 가장 큰 축인 미국과 중국이 데이터 소유와 시퀀싱 기술에 대해 여전히 첨예하게 부딛히고 있죠. 또한 우리나라를 비롯한 선진국들은 이미 모두 자국민을 대상으로 표준 휴먼 게놈을 확보해두었습니다. 구독자님은 어떻게 생각하시나요? 21년이 지난 지금 HGP2를 다시금 하는게 의미가 있을까요? 해당 프로젝트를 통해 우리가 어떤 진실들을 밝혀낼 수 있을까요? 저에게 편하게 알려주세요!
해당 소식은 이 기고문에 기반하여 편집장이 직접 작성했습니다.
|
|
|
|