주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 2
·
2025T‐CLASS : An Online Tool for the Identification and Classification of Aging and Senescence Using Transcriptome Data
Seung‐Chul J. Lee, Seung‐Chul J. Lee, Gee‐Yoon Lee, Sieun S. Kim, Yunkyu Bae, Seokjin Ham, Jooyeon Sohn, Seong Kyu Han, Seung‐Jae Lee, Seung‐Jae Lee
IF 7.1 (2025)
Aging Cell
전사체(transcriptome) 분석은 노화 연구에서 점점 더 널리 활용되고 있다. 그러나 전사체 데이터로부터 노화 과정과 장수(longevity) 증진 요법을 좌우하는 핵심 분자적 변화들을 규명하는 일은 여전히 어렵다. 본 연구에서는 전사체 기반 시그니처 상태(Signature States)에 대한 적응 학습(Adaptive learning)으로 분류하는 Transcriptomic CLassification via Adaptive learning of Signature States (T-CLASS)를 제시한다. T-CLASS는 온라인 도구로서, 전사체 데이터로부터 수백 개 유전자로 구성된 유전자 세트(gene sets)를 식별하며, 이는 장수와 노화 패러다임을 최적으로 대표한다. 우리는 Caenorhabditis elegans에서의 장수 증진 요법, 배양 마우스 1차 세포 및 배양 인간 세포에서 서로 다른 방식으로 유도한 세포 노화(cellular senescence), 그리고 인간 근감소증(human sarcopenia)을 포함하는 다양한 데이터셋을 대상으로 T-CLASS의 효과를 체계적으로 평가하였다. 그 결과 T-CLASS는 기존의 사전 존재하는 기계/딥러닝 기반 유전자 선택 도구들과 비교하여 데이터셋 전반에서 견고하고 높은 분류 성능을 보였다. 이후 C. elegans에서의 장수 증진 요법에 분석을 집중한 결과, T-CLASS는 수명 연장(lifespan-extending) 소분자 10종이 유발한 전사체 변화를 성공적으로 분류했으며, 그중 rifampicin과 atracurium의 효과를 원리 입증(proof of principle)을 위해 실험적으로 검증하였다. 종합하면, T-CLASS는 노화에 영향을 미치는 유전적 및 약리학적 중재가 초래하는 생리적 변화를 규명하고 분류하는 데 효과적이고 실용적인 도구이다.
https://doi.org/10.1111/acel.70193
Transcriptome
Biology
Longevity
Senescence
Identification (biology)
Computational biology
Caenorhabditis elegans
Gene
Bioinformatics
Genetics
2
letter
|
인용수 20
·
2024OASIS portable: User-friendly offline suite for secure survival analysis
Seong Kyu Han, Hyunwoo C. Kwon, Jae‐Seong Yang, Sanguk Kim, Seung‐Jae Lee
IF 6.5 (2024)
Molecules and Cells
생존분석을 위한 온라인 애플리케이션(OASIS)과 그 업데이트 버전인 OASIS 2는 생물 및 의학 분야에서 생존분석에 널리 사용되어 왔다. 여기에서는 데이터의 온라인 서버 업로드 없이도 안전한 생존분석을 수행할 수 있도록, OASIS의 휴대용 버전(올인원 오프라인 패키지)을 제공한다. OASIS portable은 사용자 개인 컴퓨터에서 동작하는 OASIS 2 웹서버의 가상화되고 격리된 인스턴스를 제공하며, 인터넷 연결 및 보안 문제 없이도 사용자 친화적인 생존분석을 가능하게 한다.
https://doi.org/10.1016/j.mocell.2024.100011
Upload
Suite
Server
Computer science
The Internet
User Friendly
Web server
Operating system
World Wide Web
Online and offline
3
article
|
인용수 26
·
2023Mapping genomic regulation of kidney disease and traits through high-resolution and interpretable eQTLs
Seong Kyu Han, Michelle T. McNulty, Christopher J. Benway, Pei Wen, Anya Greenberg, Ana C. Onuchic-Whitford, Nephrotic Syndrome Study Network (NEPTUNE), Dongkeun Jang, Jason Flannick, Noël P. Burtt, Parker C. Wilson, Benjamin D. Humphreys, Xiaoquan Wen, Zhe Han, Dongwon Lee, Matthew G. Sampson
IF 14.7 (2023)
Nature Communications
발현 정량 형질좌위(expression quantitative trait locus, eQTL) 연구는 특정 유전자의 발현을 조절하는 유전체 변이를 밝혀내며, 전장유전체 연관 연구(genome-wide association studies, GWAS)를 통해 발견된 미세지도화된 좌위에 기여한다. 그 정확도를 극대화하기 위한 노력은 지속되고 있다. 사람 신장 생검에서 얻은 미세절제된 240개의 사구체(glomerular, GLOM) 및 311개의 세뇨관-간질(tubulointerstitial, TUBE) 시료를 사용하여, 신장 단일핵(open chromatin) 데이터와 전사 개시 지점(transcription start site) 거리 정보를 베이지안 통계적 미세지도화에서 “통합 사전분포(integrative prior)”로 반영함으로써, 발현(eGene)과 유의하게 연관된 변이를 적어도 하나 이상 포함하는 5371개의 GLOM 유전자 및 9787개의 TUBE 유전자를 발견하였다. 통합 사전분포의 사용은 (1) 신뢰도가 더 높은 상태에서 신뢰구간(credible sets)에 포함되는 변이 수의 감소, (2) 두 가지 신장 형질에 대한 GWAS에서 분할(partitioned) 유전율의 증가된 농축, (3) GWAS 좌위와 동시위치화(colocalized)된 변이 수의 증가, (4) 계산적으로 예측된 기능적 조절 변이의 농축으로 나타나는 더 높은 해상도의 eQTL을 제공하였다. 변이와 유전자의 일부는 시험관 내(in vitro) 실험 및 초파리 네프로사이트(nephrocyte) 모델을 이용하여 검증되었다. 보다 넓게는, 본 연구는 단일핵 open chromatin 데이터에 의해 정보가 제공되는 조직 특이적 eQTL 지도(tissue-specific eQTL maps)가 다양한 후속 분석을 위한 활용도를 향상시킨다는 점을 보여준다.
https://doi.org/10.1038/s41467-023-37691-7
Computational biology
Biology
Genomics
Genome-wide association study
Disease
Genetics
Kidney disease
Genome
Evolutionary biology
Medicine
4
article
|
인용수 10
·
2022Quality assessment and refinement of chromatin accessibility data using a sequence-based predictive model
Seong Kyu Han, Yoshiharu Muto, Parker C. Wilson, Benjamin D. Humphreys, Matthew G. Sampson, Aravinda Chakravarti, Dongwon Lee
IF 11.1 (2022)
Proceedings of the National Academy of Sciences
크로마틴 접근성 분석은 전사 조절과 연관된 유전자 조절 요소를 전 게놈 규모에서 식별하는 데 핵심적이다. 그러나 여러 생물학적 및 기술적 요인으로 인해 데이터의 품질은 매우 다양하다. 이러한 문제를 극복하기 위해 우리는 크로마틴 접근성 데이터를 평가하고 정제하기 위한 서열 기반 기계 학습 방법을 개발하였다. 우리의 프레임워크 gapped k-mer SVM quality check(gkmQC)는 훈련된 모델의 예측 정확도를 바탕으로 샘플에 대한 품질 지표를 제공한다. 우리는 ENCODE/Roadmap 프로젝트의 DNase-seq 샘플 886개를 대상으로 gkmQC가 낮은 재래적 품질 점수에도 불구하고(낮은 read depth에 기인) ‘고품질’(HQ) 샘플을 효과적으로 식별할 수 있음을 입증하였다. HQ 샘플에서 확인된 피크는 기능적 조절 요소에 더 정확히 정렬되며, 기능적 변이를 보유한 조절 요소에 대한 농축이 더 크고, 해당 조직으로부터 표현형의 유전 가능성을 더 잘 설명한다. 또한 gkmQC는 단일세포 크로마틴 접근성 데이터에서 특히 희귀한 세포 유형에 대해 추가 피크를 식별할 수 있도록 피크 콜링 역치(peak-calling threshold)를 최적화할 수 있다.
https://doi.org/10.1073/pnas.2212810119
Chromatin
ENCODE
ChIA-PET
Computational biology
Computer science
Data mining
Quality (philosophy)
Support vector machine
Sample (material)
Sequence (biology)
5
preprint
|
인용수 4
·
2022Quality assessment and refinement of chromatin accessibility data using a sequence-based predictive model
Seong Kyu Han, Yoshiharu Muto, Parker C. Wilson, Aravinda Chakravarti, Benjamin D. Humphreys, Matthew G. Sampson, Dongwon Lee
bioRxiv (Cold Spring Harbor Laboratory)
크로마틴 접근성 분석은 전사 조절과 연관된 유전자 조절 요소를 전유전체 수준에서 식별하는 데 있어 핵심적인 방법이다. 그러나 여러 생물학적 및 기술적 요인으로 인해 데이터의 품질이 매우 다양하게 나타난다. 이를 해결하기 위해, 우리는 DNA 서열 기반 기계학습 모델이 예측하는 열린 크로마틴 피크의 예측가능성을 활용하여 크로마틴 접근성 데이터를 평가하고 정련한다. 우리의 프레임워크인 g apped k - m er SVM q uality c heck (gkmQC)는 훈련된 모델의 예측 정확도에 기반하여 샘플의 품질 지표를 제공한다. ENCODE/Roadmap 프로젝트의 DNase-seq로부터 886개 샘플을 대상으로 gkmQC가 미미한 read depth로 인해 저성능을 보이는 고품질 샘플을 효과적으로 식별할 수 있음을 입증하였다. gkmQC가 고품질 샘플에서 식별한 피크는 기능적 조절 요소에 더 정확하게 정렬되며, 유전체전반 연관분석(GWAS)으로부터의 기능성 변이를 포함하는 조절 요소의 농축이 더 높고, 관련 조직에서의 표현형에 대한 유전성(heritability)을 더 잘 설명한다. 또한 gkmQC는 피크 콜링 역치(threshold)를 최적화하여 추가 피크를 식별할 수 있으며, 특히 단일세포 크로마틴 접근성 데이터뿐 아니라 벌크 데이터에서도 그러하다. 여기서는 이러한 분석을 위한 독립형 오픈소스 도구키트( https://github.com/Dongwon-Lee/gkmQC )를 제공하고, gkmQC를 사용해 개선된 조절 지도(regulatory maps)를 공유한다. 이러한 자원은 질병 관련 조절 유전 변이의 기능적 해석에 기여할 것이다.
https://doi.org/10.1101/2022.02.24.481844
Chromatin
ChIA-PET
Computational biology
Predictability
Computer science
ENCODE
Data mining
Genome
Quality (philosophy)
Biology