변영철 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
읽는 시간 · 1분 11초

생성형 모델 기반 합성 데이터·시퀀스 생성 연구

Generative models for synthetic data and sequence generation

연구 내용

GAN을 이용해 고품질 합성 샘플과 시퀀스를 생성하고, 예측기·평가기 기반으로 원하는 성질을 갖도록 튜닝하는 연구

본 연구는 GAN 계열 생성형 모델을 이용해 실제 관측 데이터의 부족 문제를 보완하고, 생성 결과의 품질을 제어하는 절차를 구축합니다. 고양이 유전체 시퀀스 생성에서는 Illumina NGS 기반 전처리 후 WGAN-GP 구조를 사용하고, 예측기와 평가기를 함께 설계해 프로모터 포함 여부와 모티프 매칭 성능을 기준으로 합성 시퀀스를 튜닝합니다. 또한 풍력발전기 이상 진단에서는 WC-GAN으로 불균형을 완화하는 합성 결함 데이터를 생성하고, 생성-학습 통합으로 분류 성능을 개선합니다. 아울러 오류 학습 기반 방법은 오차 데이터를 통해 모델을 반복 정제하는 아이디어로 확장 가능합니다.

관련 연구 성과

관련 논문

2

관련 특허

1

관련 프로젝트

1

연구 흐름

생성형 모델 적용은 2022년의 유전체 시퀀스 합성 연구에서 시작되었으며, WGAN-GP와 함께 예측기·평가기 기반 튜닝 절차를 확립했습니다. 이후 2025년에는 에너지 진단 문제로 이동하여, 결함 데이터의 불균형을 해결하기 위한 WC-GAN 기반 합성 데이터 생성과 학습 통합을 수행했습니다. 최근에는 2024년부터 초거대 AI 모델의 장기 기억 저장을 위한 벡터 DB 개발 과제를 통해 생성형 모델의 활용 파이프라인에서 검색·생성 연계를 강화하는 방향으로 연구 범위를 넓히고 있습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

  • 유전체 시퀀스 합성 파이프라인
  • 모티프 기반 시퀀스 품질 제어
  • 불균형 결함 데이터 증강
  • 생성형 모델 기반 진단 학습
  • 예측기-평가기 튜닝 구조
  • 오류 기반 모델 정제 기법
  • RAG 연계형 생성 시스템
  • 합성 데이터로 인한 편향 점검
  • 생성 결과 검증용 평가 모듈
  • 생성형 AI 운영용 데이터 인프라

관련 논문

구분

제목

1

Generative Adversarial Networks for Creating Synthetic Nucleic Acid Sequences of Cat Genome

2

Leveraging generative adversarial networks for data augmentation to improve fault detection in wind turbines with imbalanced data

관련 특허

구분

제목

1

오류 학습 기반 예측 장치 및 방법

관련 프로젝트

구분

제목

1

초거대 AI 모델의 장기 기억 저장을 위한 벡터 DB 개발

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.