Algorithmic methods for differential expression and dimensionality reduction in single-cell and spatial transcriptomics
연구 내용
클러스터링 의존성을 줄인 차등발현 유전자 발굴과 단일세포 정규화·차원축소의 통계적 일관성을 확보하여 단일세포·공간전사체 해석의 재현성을 높이는 연구
단일세포 전사체 및 공간전사체 데이터에서 클러스터링 결과에 좌우되는 마커 유전자 누락 문제를 줄이기 위해, 분포의 이중봉성 여부와 인접한 세포의 저차원 표현을 함께 고려하는 차등발현 탐지 알고리즘을 설계합니다. 또한 GLMM을 직접 적용하는 대신 오프셋을 포함한 pseudobulk로 단일세포 case-control의 추정과 표준오차 성질을 보존하면서 계산 효율과 수치 안정성을 높입니다. 나아가 배치 보정 관점을 반영한 PCA 설계를 통해 embedding 품질을 개선합니다. 이를 소프트웨어로 구현해 분석 결과를 재현 가능하게 제공합니다.
관련 연구 성과
관련 논문
3편
관련 특허
0건
관련 프로젝트
3건
연구 흐름
초기에는 단일세포 RNA-seq 분석 파이프라인에서 클러스터링이 후속 단계에 전파하는 한계를 확인하고, MarcoPolo와 같이 사전 클러스터 없이 분포·유전자 패턴·저차원 근접성을 결합해 차등발현 유전자를 선별하는 연구를 수행했습니다. 같은 시기 FastRNA 관점에서 배치 회계 모델을 기반으로 PCA를 정리하여 embedding의 해석 가능성을 높였습니다. 이후에는 단일세포 case-control에서 GLMM의 계산 부담을 줄이되 통계적 성질을 유지하는 offset-pseudobulk를 제안하며 방법론을 확장했습니다. 최근에는 공간전사체의 곡선 기반 표현과 SENNA 소프트웨어 개발로 적용 범위를 넓히고 있습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
MarcoPolo: a method to discover differentially expressed genes in single-cell RNA-seq data without depending on prior clustering
Pseudobulk with proper offsets has the same statistical properties as generalized linear mixed models in single-cell case-control studies
FastRNA: An efficient solution for PCA of single-cell RNA-sequencing data based on a batch-accounting count model
관련 프로젝트
구분
제목
전 세계 100만 연구자들이 활용할 Spline-AI 기반 공간전사체 분석 소프트웨어 SENNA 개발
단일세포전사체 데이터에서 핵심 차등발현 유전자를 발굴하는 MarcoPolo 알고리즘 개발
단일세포전사체 데이터에서 핵심 차등발현 유전자를 발굴하는 MarcoPolo 알고리즘 개발