화합물과 단백질 간 상호작용을 예측하는 것은 새로운 약물을 발견하는 데 결정적으로 중요하다. 그러나 기존의 서열 기반 연구들은 원자 좌표 및 거리 행렬과 같은 화합물과 단백질의 3차원(3D) 정보까지 활용하여 결합 친화도를 예측하지 못하였다. 또한, 널리 사용되는 수많은 계산 기법들은 단백질 표현을 위해 아미노산 문자 서열에 의존해 왔다. 이러한 접근은 모델이 의미 있는 생화학적 특징을 포착하는 능력을 제한할 수 있으며, 그 결과 기저 단백질에 대한 보다 포괄적인 이해를 저해할 수 있다. 이에 본 연구에서는 이러한 한계를 극복하기 위해 전이 학습 기법과 다중 수준 해상도 특징을 통합하는 2단계 딥러닝 전략인 MulinforCPI를 제안한다. 우리의 접근법은 단백질과 화합물 모두로부터 3D 정보를 활용하고, 단백질의 원자 수준 특징에 대해 심층적인 이해를 획득한다. 아울러 본 연구는 제1원리 기반 방법과 데이터 기반 방법 간의 차이를 조명함으로써 화합물-단백질 상호작용 과제에 대한 새로운 연구 가능성을 제시한다. 제안한 방법을 평가하기 위해 Davis, Metz, KIBA, CASF-2016, DUD-E 및 BindingDB의 총 6개 데이터셋에 적용하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.