항암 펩타이드(ACP)는 건강한 세포에 대한 독성을 최소화하면서 암세포를 선택적으로 표적화할 수 있다는 점에서 강력한 치료제로 부상하고 있다. 그러나 암의 복잡한 분자적 기전을 바탕으로 하는 점 때문에 ACP의 정확한 전산 예측은 여전히 도전적이다. 본 연구에서는 ACP 예측을 향상시키기 위해 기계학습(ML)과 딥러닝(DL) 접근법을 결합한 혁신적 앙상블 프레임워크인 EnsemPred-ACP를 제안한다. 우리의 주요한 혁신은 ACP 식별에 필수적인 위치 특이적 패턴을 포착하기 위해 사전학습 단백질 임베딩을 보강하는 이진 프로파일 특성(binary profile features, BPF)을 도입한 것이다. 이 프레임워크는 이중 파이프라인 구조를 사용하였으며, ML 모델은 수작업으로 구성한 서열 특성과 임베딩을 처리한 반면, DL 모델은 BPF가 강화된 임베딩을 처리하였다. 독립 데이터셋으로 평가한 결과, EnsemPred-ACP는 정확도 0.863, 민감도 0.897, 특이도 0.830을 달성하였고, 이는 기존 방법들에 비해 특히 우수한 성능을 보였다. 또한 수신자조작특성곡선(ROC)의 곡선 아래 면적(AUROC) 0.93을 통해 강력한 일반화 성능을 나타냈다. 독립 데이터셋을 대상으로 수행한 절제(ablation) 연구에서는 BPF의 상당한 영향이 추가로 확인되었는데, ESM2 및 ProtT5 임베딩과 각각 결합할 때 예측 정확도가 2.5% 및 11.1% 향상되었다. 이러한 결과는 잠재적 치료 펩타이드를 정확히 식별하는 데 있어 통합 접근법의 효과를 입증하며, 펩타이드 기반 항암 치료제의 발전에 기여할 것으로 기대된다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.