여러 바이오뱅크, 특히 UK Biobank(UKBB)는 대규모 시퀀싱 데이터를 생성하고 있다. 기존 방법인 SAIGE-GENE은 변이의 소수 대립유전자 빈도(minor allele frequency, MAF)가 ≤ 1%일 때는 성능이 우수하지만, MAF ≤ 0.1% 또는 0.01%로 변이를 제한한 경우 분산 성분 집합 기반 검정에서 분산(과대추정)이 관찰된다. 이에 본 연구에서는 대규모 자료에서 희귀 변이 검정을 용이하게 하기 위해, 1종 오류 제어와 계산 효율성을 크게 개선한 SAIGE-GENE+를 제안한다. 또한 여러 MAF 절단값과 기능적 주석을 통합하면 검정력이 향상되어 새로운 유전자-표현형 연관성을 규명할 수 있음을 추가로 보인다. 30개의 정량형 형질과 141개의 이분형 형질에 대해 UKBB 전장 엑솜 시퀀싱 데이터를 분석한 결과, SAIGE-GENE+는 551개의 유전자-표현형 연관성을 확인하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.