[이데일리 나은경 기자] 글루카곤 유사 펩타이드(GLP)-1 계열 신약 개발 전문기업 디앤디파마텍(347850)은 지난 7일(현지 시간) 미국 자회사 발테드 시퀀싱(Valted Seq)이 인공지능(AI)을 기반으로 한 단일세포 유전자 빅데이터 분석 플랫폼 SCADE(Single Cell AI Discovery Engine)을 공식 출시했다고 8일 밝혔다.
정밀의료와 신약 개발을 위한 AI 기반 단일 세포 유전자 분석을 수행하는 발테드 시퀀싱은 그간 존스홉킨스 의과대학에서 보유 중인 환자 뇌 조직에 대한 자체 분석을 통해 세계 최대 규모 수준인 수천만 개 이상의 단일세포 유전자 데이터베이스를 구축해 왔으며, 이번 SCADE 플랫폼 완성을 통해 단일세포 빅데이터를 더욱 효율적으로 활용할 수 있게 됐다. SCADE는 코딩이나 머신러닝 지식이 없어도 간단한 명령어만으로 복잡한 유전자 데이터를 기존의 AI 기반 기술보다 훨씬 빠르고 정확하게 분석할 수 있도록 설계됐다. 향후 정밀의료와 신약 개발 분야에서 큰 기여를 할 수 있을 것으로 기대된다.
단일세포 유전자 분석은 질병의 원인 규명, 신약 후보물질 발굴, 개인 맞춤형 치료 설계 등에 핵심적으로 활용될 수 있는 큰 잠재력을 지닌 분야이지만, 그만큼 요구되는 데이터의 양이 매우 방대하고 분석이 까다로운 것으로 알려져 있다. 특히 오픈AI, 딥시크, 클로드 및 제미나이 등 현재까지도 가장 널리 사용되는 범용 AI 모델들은 일반적인 언어 능력에는 강점이 있으나, 머신러닝에 필요한 고순도 빅데이터가 부재하고 이에 특화된 학습 모델이 제한적이어서 단일세포 데이터와 같이 비교적 복잡하고 전문적인 자료를 해석하는 데에는 한계를 보여왔다.
발테드 시퀀싱은 이러한 한계를 극복하기 위해 단일세포 유전체 분석에 특화된 새로운 GPU 기반의 AI 모델을 개발하고 이를 자체 구축한 수천만 개 규모의 고품질 단일세포 유전자 데이터베이스로 학습시킨 SCADE 플랫폼을 완성했다. SCADE는 지금까지 기술적으로 어려웠던 수천만 개의 단일세포 빅데이터를 획기적으로 빠른 시간 내 분석함으로써 질병의 원인 규명 및 새로운 신약 타겟 발굴에 활용이 가능하며, 또한 이를 통해 뇌 질환, 암, 면역질환 등 목표로 하는 질환에 특화된 정밀 분석 솔루션 개발도 가능하다.
또한 발테드 시퀀싱은 AI 모델 간 단일 세포 분석 기능을 체계적으로 비교 분석할 수 있는 표준화된 평가 모델을 고안해냈다. 이를 기반으로 진행된 비교 시험에서 기존의 다른 AI 분석 도구들은 평가 기준인 ‘분석 코드 실행 성공률’에서 최대 25%, ‘예상 결과와의 정확도’에서 최대 14%에 그친 반면, SCADE의 경우 ‘분석 코드 실행 성공률’ 96%, ‘예상 결과와의 정확도’ 36%라는 결과를 보임으로써 타 기술 대비 최소 2배 이상의 향상된 성능을 입증했다.
한편 SCADE는 고도화된 성능 뿐만 아니라 사용자 편의성도 갖춘 것으로 평가된다. 이 플랫폼 기술은 프로그래밍과 관련한 사전 지식 없이도 쉽게 사용할 수 있는 서비스 제공을 목표로 하고 있으며, 데이터 탐색과 분석, 보고서 자동 생성까지 한 번에 가능하도록 설계됐다. 이로써 단일세포 유전자 분석에 있어서의 기존 플랫폼이 지닌 한계를 뛰어넘어, 향후 제약 바이오 산업 내에서의 질병 관련 바이오마커 및 신약 후보 물질 발굴, 의료 기관의 환자 맞춤 치료 전략 수립 등에서 실질적인 기여가 가능할 것으로 보인다.
발테드 시퀀싱의 CEO 바르디아 네자미 박사는 “현장의 연구자들이 필요로 하는 것은 방대하고 복잡한 유전적 정보를 신속하고 간결하게 분석할 수 있는 도구이며, SCADE는 바로 그 기대를 충족시키고자 고안된 새로운 개념의 플랫폼 기술”이라며 “나아가 수십억 개의 단일세포 유전자 정보로 구성된 초격차 빅데이터 분석이 가능한 SCADE 개발을 위해 현재 글로벌 AI 회사와 협업을 논의 중”이라고 말했다.
정밀의료와 신약 개발을 위한 AI 기반 단일 세포 유전자 분석을 수행하는 발테드 시퀀싱은 그간 존스홉킨스 의과대학에서 보유 중인 환자 뇌 조직에 대한 자체 분석을 통해 세계 최대 규모 수준인 수천만 개 이상의 단일세포 유전자 데이터베이스를 구축해 왔으며, 이번 SCADE 플랫폼 완성을 통해 단일세포 빅데이터를 더욱 효율적으로 활용할 수 있게 됐다. SCADE는 코딩이나 머신러닝 지식이 없어도 간단한 명령어만으로 복잡한 유전자 데이터를 기존의 AI 기반 기술보다 훨씬 빠르고 정확하게 분석할 수 있도록 설계됐다. 향후 정밀의료와 신약 개발 분야에서 큰 기여를 할 수 있을 것으로 기대된다.
단일세포 유전자 분석은 질병의 원인 규명, 신약 후보물질 발굴, 개인 맞춤형 치료 설계 등에 핵심적으로 활용될 수 있는 큰 잠재력을 지닌 분야이지만, 그만큼 요구되는 데이터의 양이 매우 방대하고 분석이 까다로운 것으로 알려져 있다. 특히 오픈AI, 딥시크, 클로드 및 제미나이 등 현재까지도 가장 널리 사용되는 범용 AI 모델들은 일반적인 언어 능력에는 강점이 있으나, 머신러닝에 필요한 고순도 빅데이터가 부재하고 이에 특화된 학습 모델이 제한적이어서 단일세포 데이터와 같이 비교적 복잡하고 전문적인 자료를 해석하는 데에는 한계를 보여왔다.
발테드 시퀀싱은 이러한 한계를 극복하기 위해 단일세포 유전체 분석에 특화된 새로운 GPU 기반의 AI 모델을 개발하고 이를 자체 구축한 수천만 개 규모의 고품질 단일세포 유전자 데이터베이스로 학습시킨 SCADE 플랫폼을 완성했다. SCADE는 지금까지 기술적으로 어려웠던 수천만 개의 단일세포 빅데이터를 획기적으로 빠른 시간 내 분석함으로써 질병의 원인 규명 및 새로운 신약 타겟 발굴에 활용이 가능하며, 또한 이를 통해 뇌 질환, 암, 면역질환 등 목표로 하는 질환에 특화된 정밀 분석 솔루션 개발도 가능하다.
또한 발테드 시퀀싱은 AI 모델 간 단일 세포 분석 기능을 체계적으로 비교 분석할 수 있는 표준화된 평가 모델을 고안해냈다. 이를 기반으로 진행된 비교 시험에서 기존의 다른 AI 분석 도구들은 평가 기준인 ‘분석 코드 실행 성공률’에서 최대 25%, ‘예상 결과와의 정확도’에서 최대 14%에 그친 반면, SCADE의 경우 ‘분석 코드 실행 성공률’ 96%, ‘예상 결과와의 정확도’ 36%라는 결과를 보임으로써 타 기술 대비 최소 2배 이상의 향상된 성능을 입증했다.
한편 SCADE는 고도화된 성능 뿐만 아니라 사용자 편의성도 갖춘 것으로 평가된다. 이 플랫폼 기술은 프로그래밍과 관련한 사전 지식 없이도 쉽게 사용할 수 있는 서비스 제공을 목표로 하고 있으며, 데이터 탐색과 분석, 보고서 자동 생성까지 한 번에 가능하도록 설계됐다. 이로써 단일세포 유전자 분석에 있어서의 기존 플랫폼이 지닌 한계를 뛰어넘어, 향후 제약 바이오 산업 내에서의 질병 관련 바이오마커 및 신약 후보 물질 발굴, 의료 기관의 환자 맞춤 치료 전략 수립 등에서 실질적인 기여가 가능할 것으로 보인다.
발테드 시퀀싱의 CEO 바르디아 네자미 박사는 “현장의 연구자들이 필요로 하는 것은 방대하고 복잡한 유전적 정보를 신속하고 간결하게 분석할 수 있는 도구이며, SCADE는 바로 그 기대를 충족시키고자 고안된 새로운 개념의 플랫폼 기술”이라며 “나아가 수십억 개의 단일세포 유전자 정보로 구성된 초격차 빅데이터 분석이 가능한 SCADE 개발을 위해 현재 글로벌 AI 회사와 협업을 논의 중”이라고 말했다.
|
나은경 eeee@