기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 17
·2022
MarcoPolo: a method to discover differentially expressed genes in single-cell RNA-seq data without depending on prior clustering
Chanwoo Kim, Hanbin Lee, Juhee Jeong, Keehoon Jung, Buhm Han
IF 14.9Nucleic Acids Research
초록

단일세포 RNA-seq 데이터에 대한 표준 분석 파이프라인은 세포를 군집화(clustering)하는 것으로 시작되는 연속적 단계들로 구성된다. 이 파이프라인의 본질적인 한계는, 불완전한 군집화 결과가 이후 단계들에 되돌릴 수 없이 영향을 줄 수 있다는 점이다. 예를 들어, 전(前)원시선(anterior primitive streak) 및 중(中)원시선(mid primitive streak) 세포처럼, 이들이 전반적인(global) 구조를 상당 부분 공유하는 경우에는 군집화만으로 잘 구별되지 않는 세포 유형이 존재할 수 있다. 군집화를 기반으로 차등발현유전자(DEGs)를 단지 검색하는 경우, 이러한 유형을 구별하는 표지(marker) 유전자들은 놓칠 수 있다. 또한 군집화는 많은 매개변수에 의존하며, 종종 수동 결정에 의해 주관적으로 달라질 수 있다. 이러한 한계를 극복하기 위해, 우리는 선행 군집화에 의존하지 않고 정보성 DEGs를 식별하는 방법 MarcoPolo를 제안한다. MarcoPolo는 분포가 이봉(bimodal)인지, 다른 유전자들에서도 유사한 발현 패턴이 관찰되는지, 그리고 발현하는 세포들이 저차원 공간에서 인접해 있는지를 평가함으로써 유전자를 선별한다. FACS로 정제한 세포 라벨을 사용한 실제 데이터셋에서, MarcoPolo가 경쟁 방법들보다 표지 유전자를 더 잘 복원함을 보여준다. 특히 MarcoPolo는 표준 군집화로는 구별할 수 없는 세포 유형을 구별하는 핵심 유전자들을 찾아낸다. MarcoPolo는 분석 결과를 HTML 파일로 제공하는 편리한 소프트웨어 패키지 형태로 구축되어 있다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Cluster analysisBiologyPipeline (software)GeneComputational biologyRNA-SeqGeneticsComputer scienceGene expressionTranscriptome
타입
article
IF / 인용수
14.9 / 17
게재 연도
2022

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.