요약: 다유전자 위험 점수(Polygenic risk scores, PRSs)는 개별 표현형의 위험을 예측하는 데 필수적인 도구이지만, 비유럽계 조상 집단에서는 정확도가 종종 낮다. 전이학습을 통한 다유전자 위험 점수(Transfer Learning for Polygenic Risk Scores, TL-PRS)는 유럽 PRSs를 활용하여 대표성이 부족한 조상 집단에서의 예측을 개선함으로써 이러한 문제에 대응하지만, 개인정보에 민감한 개인 수준 데이터가 필요하고 계산 효율이 낮다는 한계가 있다. 따라서 본 연구에서는 TL-PRS의 확장으로서, 개인 수준 데이터의 필요성을 없애기 위해 의사검증(pseudovalidation)을 통합하고 추가적인 소프트웨어 최적화를 포함한 PTL-PRS(Pseudovalidated Transfer Learning for PRS)를 제안한다. 의사검증을 위해 PTL-PRS는 학습 및 검증을 위한 의사 요약 통계(pseudo-summary statistics)를 생성하고, pseudo-R 지표로 모델 성능을 평가한다. 계산 효율을 향상시키기 위해 PTL-PRS 소프트웨어는 C++로 최적화하고, 블록 단위 조기 종료(blockwise early stopping) 및 직접 유전자형 검색(direct genotype retrieval)을 포함하였다. 종합적으로 PTL-PRS는 예측 정확도와 소프트웨어의 사용성을 모두 향상시켜, 대표성이 부족한 집단이 보다 정확한 유전적 위험 예측을 달성하도록 돕는다. 이용 가능성 및 구현: PTL.PRS R 패키지는 GitHub에서 https://github.com/bokeumcho/PTL.PRS 로 공개되어 있다. 본 논문에서 사용한 요약 통계는 공개 영역에서 이용 가능하다: UK Biobank(https://pheweb.org/UKB-TOPMed), PGS Catalog(https://www.pgscatalog.org), GenOMICC(https://genomicc.org/data). 연락처: bokeum1810@snu.ac.kr
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.