연구 영역
기본 정보
논문·특허
구성원
읽는 시간 · 1분

비전-언어 기반 제로/퓨샷 이상 탐지 및 분할

Vision-Language Zero-/Few-Shot Anomaly Classification and Segmentation

연구 내용

비전-언어 모델의 텍스트 정렬을 활용해 제로샷 및 소량 정상 샘플 조건에서 이상 분류와 분할을 수행하는 연구

산업 환경의 품질 검사에서 과제별 맞춤 모델 학습과 라벨 수집 비용을 줄이기 위해 비전-언어 모델의 일반성을 이상 탐지에 적용합니다. 텍스트 프롬프트를 상태 단어와 템플릿 조합으로 구성하는 앙상블을 사용하고, 윈도우/패치/이미지 수준의 특징을 효율적으로 추출해 텍스트 정렬을 기반으로 분류 및 분할 신호를 집계합니다. 또한 정상 이미지의 상보 정보를 소량 샷 확장에 도입해 이상 경계와 범위를 더 안정적으로 추정하는 접근을 수행합니다.

관련 연구 성과

관련 논문

2

관련 특허

0

관련 프로젝트

0

연구 흐름

초기 연구는 CLIP 계열 모델이 제공하는 제로샷 일반화가 이상 분류·분할에 그대로 적용되지 않는 이유를 분석하는 데 집중되었습니다. 이후 2023년에는 이상을 상태 표현과 프롬프트 설계로 분해하고, 윈도우/패치 특징을 텍스트 정렬에 맞춰 집계하는 WinCLIP 구조를 제안했습니다. 같은 해 제로샷 성능을 넘어서는 방향으로 정상 샘플을 활용한 few-normal-shot 확장인 WinCLIP+를 통해 적은 데이터로 성능을 끌어올리는 연구를 수행했습니다. 최근에는 동일한 사상 위에서 이상 분할의 신뢰성을 높이는 설계 요소를 재정리하는 흐름을 이어가고 있습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

  • 제로샷 품질 검사 분류
  • 이상 위치 기반 결함 분할
  • 라벨 최소화 공정 모니터링
  • 다품종 설비 비정형 결함 탐지
  • 현장 적응형 이상 검색
  • 텍스트 기반 결함 범주 확장
  • 비지도/약지도 전처리 파이프라인
  • 산업용 비전 자동화 에이전트
  • 설비별 커스텀 학습 비용 절감
  • 이상 탐지 성능 검증 체계 구축

관련 논문

구분

제목

1

WinCLIP: Zero-/Few-Shot Anomaly Classification and Segmentation

2

WinCLIP: Zero-/Few-Shot Anomaly Classification and Segmentation