배경: 약물 개발에서의 주요 난관은, 사람과 모델 생물종 간의 생물학적 차이로 인해 전임상 독성 소견이 인간의 임상 결과로 잘 전이되지 않는다는 점이다. 이러한 간극은 높은 임상시험 중도탈락과 시판 후 약물의 회수(철회)로 이어진다. 기존 독성 예측 방법은 주로 화학적 특성에 의존하며, 이러한 종(또는 생물체) 간 차이를 대체로 간과한다. 방법: 우리는 전임상 모델(세포주와 마우스)과 인간 사이의 유전형-표현형 차이(GPD)를 통합하는 기계학습 프레임워크를 개발하여 인간 약물 독성 예측을 향상시키고자 했다. 약물에 대한 임상 위험 정보(예: 임상시험 또는 시판 후 감시)는 출판 보고서, 데이터 소스, 데이터베이스에서 편향 없이 확보했다. 표적 약물의 GPD는 세 가지 생물학적 맥락—유전자 필수성, 조직 발현 프로파일, 네트워크 연결성—에서 평가했다. 우리는 GPD 기반 모델을 최첨단 독성 예측자들과 벤치마킹하고, 독립 데이터셋을 이용한 성능 평가 및 연대기적 검증(chronological validation)을 통해 이를 검증했다. 결과: 434개의 위험 약물과 790개의 승인 약물로 구성된 데이터셋에서, GPD 특징은 중증 이상반응으로 인한 약물 실패와 유의하게 연관되었다. GPD와 화학적 특징을 통합한 랜덤 포레스트 모델은 예측 정확도가 향상됨을 보였는데(AUPRC = 0.63 대 baseline 0.35; AUROC = 0.75 대 baseline 0.50), 특히 임상 실패의 주요 원인인 신경독성과 심혈관 독성에서 두드러졌으며, 이는 이전에는 화학적 특성만으로는 간과되었던 부분이다. 우리의 모델은 최첨단 화학 구조 기반 모델을 능가했으며, 실제 세계 환경에서 향후 약물 회수를 예측할 수 있는 실용적 능력을 보여주었다. 해석: 유전형-표현형 관계의 차이를 통합하는 것은 약물 독성 예측을 위한 생물학적 기반의 전략을 제공한다. 본 프레임워크는 임상 개발 단계에서 고위험 약물을 조기에 식별할 수 있게 한다. 이러한 접근은 개발 비용을 절감하고 환자 안전을 개선하며 치료제 승인 성공률을 높이는 데 유망하다. 재정지원: 한국국가연구재단(2020R1A6A1A03047902, RS-2025-16070008), IITP(2019-0-01906, 인공지능 대학원 프로그램 및 IITP-2024-RS-2024-00441244, Global Data-X Leader HRD program, POSTECH).
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.