기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 0
·2025
PTL-PRS: an R package for transfer learning of polygenic risk scores with pseudovalidation
Bokeum Cho, Seunggeun Lee
IF 5.4Bioinformatics
초록

요약: 다유전자 위험 점수(polygenic risk scores, PRS)는 개인의 표현형 위험을 예측하는 데 필수적인 도구이나, 비(非)유럽계 조상 집단에서는 정확도가 종종 낮다. 전이학습을 통한 PRS(Transfer Learning for Polygenic Risk Scores, TL-PRS)는 유럽 PRS를 활용하여 과소대표된 조상 집단에서의 예측을 개선함으로써 이러한 문제를 해결하지만, 개인정보에 민감한 개인 수준 데이터가 필요하며 계산 효율이 낮다. 따라서 본 연구에서는 TL-PRS의 확장인 PRS를 위한 의사(擬似)검증 전이학습(Pseudovalidated Transfer Learning for PRS, PTL-PRS)을 제안하며, 이는 의사검증을 통합하여 개인 수준 데이터의 필요성을 없애고 추가적인 소프트웨어 최적화를 포함한다. 의사검증을 위해 PTL-PRS는 학습 및 검증을 위한 의사 요약 통계(pseudo-summary statistics)를 생성하고, 의사 R2(pseudo-R2) 지표로 모델 성능을 평가한다. 계산 효율을 향상시키기 위해 PTL-PRS 소프트웨어는 C++, 블록 단위 조기 종료(blockwise early stopping), 그리고 직접 유전자형(genotype) 검색(direct genotype retrieval)으로 최적화하였다. 전반적으로 PTL-PRS는 TL-PRS의 예측 성능을 유지하면서 사용성을 향상시킨다. 이용 가능성 및 구현(AVAILABILITY AND IMPLEMENTATION): PTL.PRS R 패키지는 GitHub에서 공개되어 있으며, https://github.com/bokeumcho/PTL.PRS 에서 확인할 수 있다. 본 논문에서 사용한 요약 통계는 공개 도메인에 있으며, UK Biobank(https://pheweb.org/UKB-TOPMed), PGS Catalog(https://www.pgscatalog.org), COVID-19 Host Genetics Initiative(https://www.covid19hg.org), GenOMICC(https://genomicc.org/data) 가 해당된다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
BiobankR packagePolygenic risk scoreTransfer (computing)Software packageTransfer of learning
타입
article
IF / 인용수
5.4 / 0
게재 연도
2025

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.