Generative models for synthetic data and sequence generation
연구 내용
GAN을 이용해 고품질 합성 샘플과 시퀀스를 생성하고, 예측기·평가기 기반으로 원하는 성질을 갖도록 튜닝하는 연구
본 연구는 GAN 계열 생성형 모델을 이용해 실제 관측 데이터의 부족 문제를 보완하고, 생성 결과의 품질을 제어하는 절차를 구축합니다. 고양이 유전체 시퀀스 생성에서는 Illumina NGS 기반 전처리 후 WGAN-GP 구조를 사용하고, 예측기와 평가기를 함께 설계해 프로모터 포함 여부와 모티프 매칭 성능을 기준으로 합성 시퀀스를 튜닝합니다. 또한 풍력발전기 이상 진단에서는 WC-GAN으로 불균형을 완화하는 합성 결함 데이터를 생성하고, 생성-학습 통합으로 분류 성능을 개선합니다. 아울러 오류 학습 기반 방법은 오차 데이터를 통해 모델을 반복 정제하는 아이디어로 확장 가능합니다.
관련 연구 성과
관련 논문
2편
관련 특허
1건
관련 프로젝트
1건
연구 흐름
생성형 모델 적용은 2022년의 유전체 시퀀스 합성 연구에서 시작되었으며, WGAN-GP와 함께 예측기·평가기 기반 튜닝 절차를 확립했습니다. 이후 2025년에는 에너지 진단 문제로 이동하여, 결함 데이터의 불균형을 해결하기 위한 WC-GAN 기반 합성 데이터 생성과 학습 통합을 수행했습니다. 최근에는 2024년부터 초거대 AI 모델의 장기 기억 저장을 위한 벡터 DB 개발 과제를 통해 생성형 모델의 활용 파이프라인에서 검색·생성 연계를 강화하는 방향으로 연구 범위를 넓히고 있습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Generative Adversarial Networks for Creating Synthetic Nucleic Acid Sequences of Cat Genome
Leveraging generative adversarial networks for data augmentation to improve fault detection in wind turbines with imbalanced data
관련 특허
구분
제목
오류 학습 기반 예측 장치 및 방법
관련 프로젝트
구분
제목
초거대 AI 모델의 장기 기억 저장을 위한 벡터 DB 개발