기본 정보
연구 분야
프로젝트
논문
구성원
preprint|
인용수 0
·2023
Gene-specific machine learning for pathogenicity prediction of rare BRCA1 and BRCA2 missense variants
Moonjong Kang, Seon-Hwa Kim, Da-Bin Lee, Changbum Hong, Kyu‐Baek Hwang
Research Square
초록

기계 학습 기반 병원성 예측은 유전성 암과 관련된 BRCA1 및 BRCA2의 드문 미스센스 변이를 해석하는 데 도움이 된다. 최근 연구에 따르면 특정 유전자 또는 특정 질환과 관련된 유전자 집합의 변이를 사용해 학습한 분류기는, 학습 데이터 크기가 더 작음에도 불구하고 더 높은 특이성을 보이기 때문에 모든 변이를 사용해 학습한 분류기보다 성능이 우수한 것으로 나타났다. 본 연구에서는 “유전자 특이적” 기계 학습이 “질환 특이적” 기계 학습과 비교하여 갖는 장점을 추가로 규명하고자 하였다. 본 연구에서는 유전성 암과 관련된 28개 유전자의 1068개의 드문 미스센스 변이(gnomAD minor allele frequency (MAF) < 0.005)를 분석 대상으로 사용하였다. 널리 사용되는 기계 학습 분류기를 적용하였다: 규제 로지스틱 회귀, extreme gradient boosting, 랜덤 포레스트, 서포트 벡터 머신, 그리고 딥 뉴럴 네트워크이다. 특징으로는 다수 집단의 MAF, 기능 예측 및 보존 점수, 변이의 위치를 사용하였다. 질환 특이적 학습 데이터셋은 유전자 특이적 학습 데이터셋보다 7배 이상 더 컸으며, 유전자 특이적 학습 데이터셋을 포함하였다. 그러나 적절한 기계 학습 분류기를 사용한다면, 유전자 특이적 학습 변이만으로도 최적의 병원성 예측자를 산출하기에 충분함을 관찰하였다. 따라서 드문 BRCA1 및 BRCA2 미스센스 변이의 병원성 예측을 위한 효율적이고 효과적인 방법으로 유전자 특이적 기계 학습을 권고한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Missense mutationMachine learningMinor allele frequencyArtificial intelligenceSupport vector machinePathogenicityGeneRandom forestClassifier (UML)Gradient boosting
타입
preprint
IF / 인용수
- / 0
게재 연도
2023

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.