유료기사는 인쇄용 화면을 제공하지 않습니다.

1000가지 이상 질환 예측하는 의료AI 모델 나왔다[AI헬스케어]

등록 2025-09-21 오전 8:00:00
  • kakao
  • facebook
  • twitter
  • link_url
    유럽 연합 연구진 기존 AI 한계 뛰어넘는 모델 개발

[이데일리 김승권 기자] 유럽 연구진이 개발한 인공지능(AI) 모델 ‘델파이-2M(Delphi-2M)’이 1000가지 이상 질병의 발생 가능성을 한 번에 예측할 수 있다고 17일(현지시간) 국제학술지 ‘네이처’에 발표됐다. 기존 질병 예측 AI가 한두 가지 질환에만 집중했던 한계를 뛰어넘어, 의료 AI 분야에 새로운 전환점을 제시한 것으로 평가받고 있다.

ChatGPT 기반 기술로 의료 패턴 학습

독일 암 연구센터(DKFZ), 유럽생물정보학연구소(EMBL), 덴마크 코펜하겐대학교 등의 공동연구팀이 개발한 델파이-2M은 OpenAI의 ‘GPT-2’ 언어 모델을 기반으로 구축됐다. 연구진은 “진단 순서를 학습하는 것이 텍스트에서 문법을 배우는 것과 유사하다”며 “의료 데이터의 패턴, 선행 진단, 진단의 조합과 순서를 학습한다”고 설명했다.

AI 모델에는 2006년부터 2020년까지 영국 바이오뱅크(UK Biobank)에 속한 40만 명의 익명화된 의료 데이터 80%가 학습 자료로 사용됐다. 영국 바이오뱅크는 영국 국민 약 50만 명의 과거 질병 진단 기록, 질병 발생 여부, 건강 상태, 유전체, 생활습관 데이터를 장기적으로 수집한 대규모 데이터베이스다.

성능 검증을 위해 연구팀은 영국 바이오뱅크 데이터의 나머지 20%와 덴마크 국가 질환 레지스트리의 193만 명 의료 데이터를 활용했다. 60세까지의 개인 의료 데이터를 입력하고 이후 20년간 1231가지 질병 발생 시점을 시뮬레이션한 결과, 진단 정확도(AUC)는 평균 0.76, 10년 후 질병 예측 정확도는 0.7에 달했다.

네이처 기사 갈무리 (사진=네이처 홈페이지)
델파이-2M의 예측 성능은 기존 단일 질병 예측 모델들과 비슷한 수준이면서도 1000가지 이상의 질병을 동시에 예측할 수 있다는 점에서 혁신적이다. 특히 심근경색, 제2형 당뇨병, 패혈증과 같이 명확한 진행 경로를 가진 질병에서 더 높은 정확도를 보였다.

델파이-2M의 또 다른 강점은 투명성이다. 연구팀은 ‘샤플리 가산 설명법(SHAP)’을 활용해 AI 판단의 근거를 분석했다. 예를 들어 췌장암 위험이 높다는 판단의 근거로 소화기 질환 이력이 췌장암 발생 위험을 19배 높인다는 의학적으로 타당한 결론을 도출했다. 또한 우울증·치매 등 정신 질환과 출산·임신 관련 질환이 그룹별로 함께 나타나는 패턴도 정확히 파악했다.

델파이-2M의 설명 가능성은 최근 의료 AI 분야의 주요 트렌드와 일맥상통한다. 지난 10일 ‘네이처 리뷰 바이오엔지니어링’에 발표된 이수인 워싱턴대 교수의 리뷰 논문에서도 의료 AI의 투명성이 강조됐다. 지난해 삼성호암상을 수상한 이 교수는 의료, 금융, 법률 등 설명 책임이 중요한 분야에서 AI 판단을 설명할 수 있는 기술을 연구하고 있다.

최근 연구들에서도 SHAP과 LIME(Local Interpretable Model-agnostic Explanations) 같은 설명 가능한 AI 기법이 다양한 의료 분야에 적용되고 있다. 알츠하이머병 조기 진단, 췌장암 예측, 심장질환 진단 등에서 SHAP을 통해 AI의 판단 근거를 명확히 제시하는 연구가 활발하다.

기존 의료 AI와 차별화 포인트는

기존 의료 AI 모델들은 대부분 단일 질병 예측에 집중해왔다. 심장병 위험 예측, 특정 암 진단, 감염병 탐지 등 개별 질환에 특화된 모델들이 주를 이뤘다. 의료진이 포괄적인 건강 평가를 위해서는 수십 개의 개별 모델을 각각 실행해야 하는 번거로움이 있었다.

델파이-2M은 이런 한계를 극복하고 다중 질병 예측이라는 새로운 패러다임을 제시했다. 스탠포드 연구에 따르면 ChatGPT-4와 같은 대형 언어 모델들이 단독으로는 92점의 높은 진단 성능을 보이지만, 의사들과의 협력에서는 아직 충분한 활용이 이뤄지지 않고 있다. 이는 의사-AI 협력 모델의 개선이 필요함을 시사한다.

연구팀은 “델파이-2M이 질병 위험이 높은 사람들을 식별하고 맞춤형 의료 서비스 계획을 지원하는 데 도움이 될 것”이라고 기대했다. 현재 심장마비나 뇌졸중 위험에 따라 콜레스테롤 저하제인 스타틴을 처방하는 것처럼, 델파이-2M도 고위험 환자를 식별해 조기 개입과 질병 예방을 가능하게 할 전망이다.

하지만 임상 적용까지는 추가 연구가 필요하다. 델파이-2M의 학습 데이터가 주로 40-60세 영국인에서 나왔기 때문에 아동·청소년 건강 사건이 과소 대표되고 특정 인종 집단이 충분히 반영되지 않은 한계가 있다. 연구팀은 다양한 인구집단과 국가에서 추가 검증을 계획하고 있으며, 몇 년 내 임상 사용이 가능할 것으로 예상한다고 밝혔다.