Transformer·퍼지 로직 기반 멀티태스크 비전 인식

Transformer and Fuzzy Logic based Multi-task Visual Perception

연구 내용

UAV 영상과 의료 영상에서 세그멘테이션·탐지를 통합하고 품질 저하를 보정하는 멀티태스크 비전 인식 연구

최재용 연구실은 영상 입력의 노이즈, 복잡 배경, 저대비 문제를 고려해 탐지와 세그멘테이션을 통합하는 모델링을 수행합니다. 농업에서는 UAV 영상에서 목화 개체를 검출하고 병해 손상 영역과 생육 단계를 동시에 추론하는 Cotton Multitask Learning 구조를 구성하여 상호 학습을 유도합니다. 의료에서는 CT, MRI, X-ray에서 fuzzy entropy와 histogram spread 기반 향상 파이프라인으로 입력 품질을 개선하고 이후 CCNN 또는 CNN으로 분할 및 분류 정확도를 끌어올립니다. 화재와 수목 건전성 분석에서는 색 기반 특징과 컨투어 또는 멀티모달 융합 구조를 사용해 엣지 배포 및 실시간 모니터링 적용 가능성을 함께 고려합니다.

관련 프로젝트

0건

연구 흐름

초기에는 CNN 기반 화재 탐지에서 컨투어 분석과 색 특성으로 특징을 보강하고, 복잡 시나리오의 라벨 데이터를 구축해 성능을 안정화하는 접근을 수행했습니다. 이후 2024년에는 분할과 단계 분류가 요구되는 정밀 농업 문제로 확장하여 UAV 멀티태스크 학습에서 Cross-Level Multi-Granular Encoder와 자기 증류 기반 attention 융합을 활용하는 방향으로 발전했습니다. 2025년에는 의료 영상의 잡음과 모호성을 줄이기 위한 fuzzy 기반 개선 파이프라인을 도입하여 세그멘테이션과 분류의 전체 흐름을 통합했습니다. 같은 시기에 수목 건강 평가에서는 경량 멀티모달 융합 구조를 설계해 실시간 모니터링 적용을 염두에 둔 연구를 수행했습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

정밀 농업 모니터링 플랫폼
병해 손상 영역 자동 세그멘테이션
생육 단계 진단 자동화
화재 탐지 및 초기 경보 시스템
의료 영상 기반 분할 보조 도구
판독용 품질 개선 전처리 파이프라인
엣지 기반 실시간 이상 징후 감지
스마트 시티 생태 서비스 모니터링
UAV 영상 지능형 분석 서비스
멀티태스크 학습 모델 재사용 체계