RnDCircle Logo
정인욱 연구실
경북대학교 컴퓨터학부 정인욱 교수
Multi-omics integration
Pathway activity scoring
Machine learning
기본 정보
연구 분야
프로젝트
논문
구성원

정인욱 연구실

경북대학교 컴퓨터학부 정인욱 교수

정인욱 연구실은 multi-omics 기반 전처리와 분석 방법을 설계하고, 시퀀싱·시계열 데이터에서 경로 활성과 조절 신호를 정량화하는 연구를 수행합니다. 특히 샘플 단위 pathway 분석을 위한 enrichment score 산정과 omics Contribution Rate 기반 해석 프레임을 구축하고, 이상치 제거와 잡음 완화로 다운스트림 분석의 안정성을 높입니다. 또한 COVID-19 환자에서 면역 반응 변화, SARS-CoV-2 변이 핫스팟, 전자건강기록을 활용한 중증도 예측 모델을 개발하여 임상 데이터 연계를 강화합니다. 나아가 장기 데이터 동기화와 정렬 문제를 알고리즘 관점에서 다루고, DNA 분석 가속을 위한 인-스토리지 컴퓨팅 및 양자 컴퓨팅 기반 연구를 병행합니다.

Multi-omics integrationPathway activity scoringMachine learningGene expression denoisingLongitudinal data alignment
대표 연구 분야
연구 영역 전체보기
멀티오믹스 기반 유전체 조절 분석 및 경로 활성화 점수화 연구 thumbnail
멀티오믹스 기반 유전체 조절 분석 및 경로 활성화 점수화 연구
Multi-omics and genomic regulation analysis with pathway activity scoring
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

28총합

5개년 연도별 피인용 수

157총합
주요 논문
5
논문 전체보기
1
article
|
인용수 1
·
2025
Identification of severity related mutation hotspots in SARS-CoV-2 using a density-based clustering approach
Sohyun Youn, Dabin Jeong, Hwijun Kwon, Eonyong Han, Sun Kim, Inuk Jung
IF 6.1 (2025)
BioData Mining
BACKGROUND: The immune response to SARS-CoV-2 varies greatly among individuals yielding highly varying severity levels among the patients. While there are various methods to spot severity associated biomarkers in COVID-19 patients, we investigated highly mutated regions, or mutation hotspots, within the SARS-CoV-2 genome that correlate with patient severity levels. SARS-CoV-2 mutation hotspots were searched in the GISAID database using a density based clustering algorithm, Mutclust, that searches for loci with high mutation density and diversity. RESULTS: Using Mutclust, 477 mutation hotspots were searched in the SARS-CoV-2 genome, of which 28 showed significant association with severity levels in a multi-omics COVID-19 cohort comprised of 387 infected patients. The patients were further stratified into moderate and severe patient groups based on the 28 severity related mutation hotspots that showed distinctive cytokine and gene expression levels in both cytokine profile and single-cell RNA-seq samples. The effect of the SARS-CoV-2 mutation hotspots on human genes was further investigated by network propagation analysis, where two mutation hotspots specific to the severe group showed association with NK cell activity. One of them showed to decrease the affinity between the viral epitope of the hotspot region and its binding HLA when compared to the non-mutated epitope. CONCLUSION: Genes related to the immunological function of NK cells, especially the NK cell receptor and co-activating receptor genes, were significantly dysregulated in the severe patient group in both cytokine and single-cell levels. Collectively, mutation hotspots associated with severity and their related NK cell associated gene expression regulation were identified.
https://doi.org/10.1186/s13040-025-00476-3
Identification (biology)
Cluster analysis
Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2)
Coronavirus disease 2019 (COVID-19)
Computer science
Mutation
Data mining
Geography
Artificial intelligence
Medicine
2
review
|
인용수 9
·
2025
A review on multi-omics integration for aiding study design of large scale TCGA cancer datasets
Eonyong Han, Hwijun Kwon, Inuk Jung
IF 3.7 (2025)
BMC Genomics
BACKGROUND: Rapid advancements in high-throughput sequencing technologies allow for detailed and accurate measurement of omics features within their biological context. The integration of different omics types creates heterogeneous datasets, presenting challenges in analysis due to variations in measurement units, sample numbers, and features. Currently, there is a lack of generalized guidelines for making decisions in multi-omics study design (MOSD), such as selecting an appropriate number of samples and features, type of preprocessing and integration for robust analysis results. We propose a suggestive guideline for MOSD, involving nine important factors: sample size, feature selection, preprocessing strategy, noise characterization, class balance, number of classes, cancer subtype combination, omics combination, and clinical features. RESULTS: To assess the effectiveness of our proposed MOSD guidelines, we designed and conducted seven benchmark tests using 10 clustering methods on various TCGA cancer datasets with an objective of clustering cancer subtypes. The results indicated robust performance in terms of cancer subtype discrimination when adhering to the following criteria: 26 or more samples per class, selecting less than 10% of omics features, maintaining a sample balance under a 3:1 ratio, and keeping the noise level below 30%. Feature selection was particularly important, improving clustering performance by 34%. CONCLUSION: These findings provide evidence-based recommendations for MOSD, enabling researchers to optimize analytical approaches and enhance the reliability of results across cancer datasets. The proposed MOSD framework offers a suggestive guideline addressing both computational and biological factors for multi-omics data integration.
https://doi.org/10.1186/s12864-025-11925-y
Omics
Preprocessor
Cluster analysis
Feature selection
Context (archaeology)
Computer science
Data mining
Benchmark (surveying)
Sample size determination
Machine learning
3
article
|
·
인용수 0
·
2025
SynchDP: A correlation based sequence alignment algorithm for synchronizing longitudinal clinical data
Seokhwan Seong, Seunghwan Bae, Jaeyeon Jang, Inuk Jung
IF 6.3 (2025)
Computers in Biology and Medicine
https://doi.org/10.1016/j.compbiomed.2025.110853
Synchronizing
Computer science
Sequence (biology)
Algorithm
Correlation
Data mining
Artificial intelligence
Mathematics
최신 정부 과제
27
과제 전체보기
1
2025년 3월-2027년 12월
|112,500,000
양자컴퓨팅 기반 유전체 DNA 정렬을 위한 양자 이득 연구
유전체 지도 염기서열을 완성하기 위한 정렬 과정은 방대한 연산량이 필요한 작업으로 이를 양자컴퓨팅 기술을 이용하여 해결하고자 하며 양자 이득 확보을 목표로 함.
양자 이득
양자 알고리즘
양자 회로
양자 컴퓨터
유전체 DNA 정렬
2
2024년 7월-2027년 4월
|375,000,000
유전체 DNA 염기서열 분석 가속화를 위한 페타스케일 인-스토리지 컴퓨팅 기초연구실
본 기초연구실은 유전체 DNA 염기서열 분석 알고리즘의 성능적 한계를 획기적으로 개선시키기 위해 페타스케일 인-스토리지 컴퓨팅(In-Storage Computing) 기반 DNA 염기서열 분석 가속화 시스템 개발을 최종 목표로 함.
인-스토리지 컴퓨팅
DNA 염기서열 분석
플래시 스토리지
페타스케일
프로세싱-인-메모리
3
2024년 4월-2025년 12월
|236,000,000
시계열 멀티오믹스 통합분석 및 인공지능 활용 연구
○ 시계열 정보를 활용한 멀티오믹스 데이터 통합 분석 파이프라인 고도화○ 정제된 멀티오믹스 데이터를 활용한 검색 가능한 데이터베이스 구축○ 시계열 정보를 활용한 멀티오믹스 데이터의 패턴과 중증도간의 연관성 분석○ 인공지능 기반의 시계열 패턴 분석을 통한 중증도 설명 모델 개발○ 데이터 탐색 및 분석이 가능한 웹 기반의 플랫폼 개발○ 연구결과 검증을 위한 추...
COVID-19
멀티오믹스
예후 예측
인공지능
플랫폼

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.