유방암의 정밀 진단 및 처방을 위한 바이오 빅데이터와 인공신경망 기반 유방암 조직의 전사체 구조의 특징 규명에 관한 연구
이러한 연구 목표 달성을 위한 세부 연구 주제는 다음과 같다.
(1) 본 연구자가 이전 연구재단 과제에서 개발한 de novo 전사체 어셈블러인 TraRECo를 이용하여 하이브리드 방식의 정밀한 동형 전사체 어셈블리 파이프라인을 개발하고 TCGA의 1100여개 유방암 샘플에 대해 전사체 어셈블리를 수행하여 동형 전사체 sequence DB를 구축한다. (PAM50 유전자 등 주요 타겟 유전자에 대해 어셈블리 수행)
(2) 인공신경망을 이용하여 유방암 주요 타겟 유전자에 대한 전사체 sequence 상의 구조적 변이와 특징을 추출하는 방법 연구. (비감독 학습 기반의 회귀 신경망을 이용한 sequence 클러스터링 방법 및 (콘볼루션) 신경망을 이용한 단백질 기능에 기여하는 부분 수열(partial sequence)의 탐색 연구.)
(3) 유방암의 4가지 분자유형(luminal A/B, HER2-enriched, Basal-like)과 3가지 호르몬 수용체의 상태로 정의되는 임상 유형들의 전사체 구조의 특징 탐색에 관한 연구와 분자유형(molecular subtype)과 임상유형 간 불일치가 발생하는 요인에 대한 연구 수행.
본 연구의 핵심은 인공신경망을 이용한 Sequence 클러스터링 및 분류 방안으로 전사체 어셈블리를 통해 획득된 Nucleotide sequence들을 클러스터링하고 전체 sequence 내에서 생물학적 기능에 직접적으로 관여하는(예를 들면 ER+, PR+ 상태에 관여하는) partial sequence의 검출을 위해 다양한 방식의 연구가 가능하며 본 세부 연구는 이를 위해 다음의 주제를 포함하여 진행한다.
A. Heuristic 접근법: nucleotide sequence의 정성적인 특징 (intron retention, alternative splicing/exon length 등 기존 동형 전사체와의 차이점을 정형화하거나 amino acid sequence로 번역하여 missense/nonsense 등의 판별을 통해 획득한 특징)들에 기초하여 분류하는 방법을 연구한다.
B. 회귀 신경망을 이용한 sequence 클러스터링: 회귀 신경망(RNN 혹은 LSTM)은 기본적으로 감독학습 하에 sequence를 분류하는데 적용 가능하며 본 연구에서는 분류 외에 비감독 학습 규칙을 적용하여 sequence를 클러스터링 하는 새로운 기법에 대해서 연구한다.
C. (콘볼루션) 신경망을 이용한 부분수열 탐색: 콘볼루션 신경망을 이용하여 2차원 이미지 내에서 특정 패턴을 검출하는 개념(Region proposal network, RPN)를 활용하면 1차원 sequence 내에서 생물학적으로 기능하는 partial sequence를 탐색하는데 사용할 수 있다. 즉, 1차원 콘볼루션에 기반한 Region proposal network를 구성하고 학습을 통해 전체 sequence 내에서 생물학적 기능(ER/PR/HER2 상태 등)에 기여하는 부분 수열을 탐색하는 기법을 연구한다.
특히, 두 번째와 세 번째 방식은 아직 시도된 바가 없는 새로운 방식으로 단백질의 생물학적 기능 여부 혹은 단백질 간 상호작용 여부를 예측하는데도 적용 가능할 것으로 판단된다.
유방암의 정밀 진단 및 처방을 위한 바이오 빅데이터와 인공신경망 기반 유방암 조직의 전사체 구조의 특징 규명에 관한 연구
이러한 연구 목표 달성을 위한 세부 연구 주제는 다음과 같다.
(1) 본 연구자가 이전 연구재단 과제에서 개발한 de novo 전사체 어셈블러인 TraRECo를 이용하여 하이브리드 방식의 정밀한 동형 전사체 어셈블리 파이프라인을 개발하고 TCGA의 1100여개 유방암 샘플에 대해 전사체 어셈블리를 수행하여 동형 전사체 sequence DB를 구축한다. (PAM50 유전자 등 주요 타겟 유전자에 대해 어셈블리 수행)
(2) 인공신경망을 이용하여 유방암 주요 타겟 유전자에 대한 전사체 sequence 상의 구조적 변이와 특징을 추출하는 방법 연구. (비감독 학습 기반의 회귀 신경망을 이용한 sequence 클러스터링 방법 및 (콘볼루션) 신경망을 이용한 단백질 기능에 기여하는 부분 수열(partial sequence)의 탐색 연구.)
(3) 유방암의 4가지 분자유형(luminal A/B, HER2-enriched, Basal-like)과 3가지 호르몬 수용체의 상태로 정의되는 임상 유형들의 전사체 구조의 특징 탐색에 관한 연구와 분자유형(molecular subtype)과 임상유형 간 불일치가 발생하는 요인에 대한 연구 수행.
본 연구의 핵심은 인공신경망을 이용한 Sequence 클러스터링 및 분류 방안으로 전사체 어셈블리를 통해 획득된 Nucleotide sequence들을 클러스터링하고 전체 sequence 내에서 생물학적 기능에 직접적으로 관여하는(예를 들면 ER+, PR+ 상태에 관여하는) partial sequence의 검출을 위해 다양한 방식의 연구가 가능하며 본 세부 연구는 이를 위해 다음의 주제를 포함하여 진행한다.
A. Heuristic 접근법: nucleotide sequence의 정성적인 특징 (intron retention, alternative splicing/exon length 등 기존 동형 전사체와의 차이점을 정형화하거나 amino acid sequence로 번역하여 missense/nonsense 등의 판별을 통해 획득한 특징)들에 기초하여 분류하는 방법을 연구한다.
B. 회귀 신경망을 이용한 sequence 클러스터링: 회귀 신경망(RNN 혹은 LSTM)은 기본적으로 감독학습 하에 sequence를 분류하는데 적용 가능하며 본 연구에서는 분류 외에 비감독 학습 규칙을 적용하여 sequence를 클러스터링 하는 새로운 기법에 대해서 연구한다.
C. (콘볼루션) 신경망을 이용한 부분수열 탐색: 콘볼루션 신경망을 이용하여 2차원 이미지 내에서 특정 패턴을 검출하는 개념(Region proposal network, RPN)를 활용하면 1차원 sequence 내에서 생물학적으로 기능하는 partial sequence를 탐색하는데 사용할 수 있다. 즉, 1차원 콘볼루션에 기반한 Region proposal network를 구성하고 학습을 통해 전체 sequence 내에서 생물학적 기능(ER/PR/HER2 상태 등)에 기여하는 부분 수열을 탐색하는 기법을 연구한다.
특히, 두 번째와 세 번째 방식은 아직 시도된 바가 없는 새로운 방식으로 단백질의 생물학적 기능 여부 혹은 단백질 간 상호작용 여부를 예측하는데도 적용 가능할 것으로 판단된다.
본 과제는 별도의 전력 변환 장치 없이 교류 전원에 직접 연결하여 사용할 수 있는 고효율 동기식 LED 조명 기구를 개발하는 연구임.
연구 목표는 효율 125 lm/W의 고효율 동기식 AC직결형 LED실내조명등기구 개발임. 이를 위해 AC직결형 드라이버 IC 및 전류제어스위치 IC 개발, 방열 및 균일성 개선 LED 모듈 설계, 디밍 기능 집적화 컨버터 제어 회로 개발을 포함함. 핵심 연구 내용은 고효율, 저잡음 특성 디밍 내장 AC직결형 등기구 설계 및 Driver-IC 효율 최적화와 방열 고려 LED모듈 설계 기술 개발임. 점등 스위치 On/Off 감지를 통한 디밍 제어 회로 및 펌웨어 구현, 슬림 구조와 방열 최적화 등기구 설계도 진행함. 유니버셜 입력 전압 동작 및 자동 전류 제어 가능한 AC직결형 핵심부품 IC 및 전류제어스위치 IC 개발, 관련 지적재산권 확보도 주요 내용임. 기대 효과는 기존 기술 단점을 보완한 고성능 AC직결형 드라이버 개발로 제어기 불필요 디밍 내장 고효율 LED 조명 제품 공급임. 생산성 및 고장률 개선으로 제품 신뢰성 향상을 도모하고, 국내외 시장 대응 제품 라인업 구축으로 수출 시장 공략에 기여할 것으로 전망됨.
본 과제는 RNA-Seq 데이터로부터 전사체 어셈블리의 성능을 높이기 위해, 그래프 기반 신뢰전파(Belief propagation)와 오류 보정 기법을 SW로 구현하는 연구임.
연구 목표는 정보통신이론 기반 신뢰전파 기반 참조기반·de novo 전사체 어셈블러를 개발하고 Simulated 데이터 및 실제 전사체 데이터 DB 성능을 검증하며 유전체/세포 변이·Differentially expressed gene·Co-expression 추적 핵심기술을 확보하는 데 있음. 핵심 연구내용은 joint detection and estimation을 위해 1차 커버리지 깊이에 확률모형 기반 신뢰전파 적용, 그래프 구성 단계 Consensus 행렬로 read 오류 보정, slicing 그래프를 인수그래프로 변환해 Edge flow 추정 기반 순차 검출 알고리즘 연구임. 기대효과는 전사체 어셈블리의 새로운 방법론 제시 및 관련 분야 국가 경쟁력 제고임.
본 과제는 RNA-Seq 데이터를 이용한 전사체 어셈블리(참조기반·de novo)를 정보통신의 결합 검출·추정 문제로 보고, 그래프 기반 신뢰전파(Belief propagation)로 조립 성능을 높이는 SW 연구임.
연구 목표는 신뢰전파 기반 참조기반 및 de novo 전사체 어셈블러 알고리즘을 SW로 구현하고, Simulated 데이터와 실제 전사체 데이터 DB에서 Trinity 등과 비교 성능 검증을 수행하는 것임. 핵심 연구 내용은 read 정렬 그래프와 1차 커버리지 깊이에 확률모형 신뢰전파를 적용해 joint detection and estimation을 강화함, 그래프 구성 단계에서 컨센서스(Consensus) 행렬로 read 오류를 보정함, 인수 그래프 기반 순차 검출로 복잡한 isoform을 분리해 minimum path cover set 폭증 문제를 완화함. 기대효과는 전사체 어셈블리의 새 방법론 확산과 유전체 변이·Differentially expressed gene·Co-expression 정밀 추적 역량 향상으로 국가 경쟁력 제고임.