동기: 에피토프 결합 T-세포 수용체(T-cell receptor, TCR)를 정확히 식별하는 것은 특정 표현형과의 연관성을 바탕으로 그 기저 생물학적 기전을 이해하는 데 중요할 뿐 아니라, 이에 따라 T-세포 매개 면역치료 치료법을 개발하는 데에도 중요하다. TCR에서 에피토프 인식에 CDR3 영역의 중요성은 잘 알려져 있으나, 특정 질병 또는 표현형과 연관된 상호작용을 프로파일링하는 방법은 상대적으로 덜 연구되어 있다. 우리는 표현형 특이적 TCR-에피토프 상호작용을 식별하기 위한 EpicPred를 개발하였다. EpicPred는 Open-set Recognition(OSR)을 사용하여 그럴듯하지 않은 TCR-에피토프 상호작용을 먼저 예측하고 제거함으로써 위양성을 줄인다. 이후, 다중 인스턴스 학습을 사용하여 암의 유형 또는 COVID-19 감염 환자의 중증도 수준에 특이적인 TCR-에피토프 상호작용을 확인하였다. 결과: 6개의 공개 TCR 데이터베이스에서 244,552개의 TCR 서열과 105개의 고유 에피토프를 사용하여 OSR 방법으로 에피토프 결합 TCR을 예측하고 에피토프 비결합 TCR을 걸러냈다. 예측된 상호작용을 2개의 암 및 4개의 COVID-19 TCR-seq 데이터셋(대용량 및 단일세포 수준 모두)에서 표현형 군을 추가로 예측하는 데 사용하였다. EpicPred는 표현형 예측에서 경쟁 방법들보다 우수했으며, 평균 AUROC 0.80 ± 0.07을 달성하였다. 제공 가능성 및 구현: EpicPred 소프트웨어는 https://github.com/jaeminjj/EpicPred 에서 이용할 수 있다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.