Statistical methods for rare-variant set-based association and meta-analysis
연구 내용
희귀 변이 집합 기반 연관성 검정에서 타입 I 오류를 안정화하고 대규모 바이오뱅크에서 계산 효율을 개선하는 연구
대규모 시퀀싱 데이터에서 희귀 변이의 집합 기반(세트 기반) 연관성 검정을 수행할 때 발생하는 분산 성분 추정 불안정과 타입 I 오류 과대화를 제어하는 방법론을 개발합니다. MAF 구간별 절차 개선, 기능 주석과의 결합을 통한 검정력 향상, 그리고 표현형이 불균형하거나 상관이 존재하는 상황에서의 혼합모형 기반 보정과 경험적 saddlepoint 근사를 적용합니다. 또한 여러 코호트의 요약통계를 활용해 영가설 분포를 정확히 추정하는 메타분석 프레임을 구성하여 대규모 PheWAS 및 저유병도 표현형 분석을 확장합니다.
관련 연구 성과
관련 논문
5편
관련 특허
0건
관련 프로젝트
2건
연구 흐름
초기에는 SAIGE-GENE+를 통해 희귀 변이 집합 기반 검정에서 타입 I 오류 제어 성능과 계산 효율을 동시에 개선하는 데 집중했습니다. 이후 범주형·서열형 표현형의 처리까지 확장하여 대규모 엑솜 데이터에서 안정적인 세트 기반 검정을 구현했습니다. 동시에 가족 질병력처럼 상관 구조가 복잡해지는 상황에서도 타입 I 오류를 통제하면서 검정력을 유지하는 혼합모형과 saddlepoint 근사 조합을 제안했습니다. 최근에는 코호트 간 요약통계를 결합하는 Meta-SAIGE-a로 null 분포 추정과 LD 행렬 재사용을 통해 효율적인 희귀 변이 메타분석으로 발전시키는 흐름을 보입니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
SAIGE-GENE+ improves the efficiency and accuracy of set-based rare variant association tests
Publisher Correction: SAIGE-GENE+ improves the efficiency and accuracy of set-based rare variant association tests
Scalable mixed model methods for set-based association studies on large-scale categorical data analysis and its application to exome-sequencing data in UK Biobank
Incorporating family disease history and controlling case–control imbalance for population-based genetic association studies
Scalable and accurate rare variant meta-analysis with Meta-SAIGE
관련 프로젝트
구분
제목
유전체 연관성 방법 연구 및 동아시아 바이오뱅크에의 적용
클라우드 환경을 이용한 대용량 유전체 데이터 시범분석 연구