문맥 강화 분할과 비전 상태공간 정규화, 학습 데이터 변환

Context-Aware Segmentation, Visual State-Space Regularization, and Training Data Conversion

연구 내용

PSPNet 계열에서 멀티스케일 문맥을 보존하는 의미 분할과 실시간 인스턴스 세그멘테이션 성능 비교, 비전 상태공간 모델의 패치 드롭 기반 정규화를 함께 다루는 연구

본 연구는 픽셀 단위 분류를 위한 문맥 통합과 계산 효율을 동시에 고려합니다. 인스턴스 세그멘테이션에서는 하드웨어를 고정한 조건에서 추론 시간 기반 성능 비교를 수행해 속도-정확도 트레이드오프를 체계적으로 분석합니다. 의미 분할에서는 PSPNet 기반 구조에서 피라미드 풀링의 멀티스케일 특징을 결합하되, 다운샘플된 특징의 정보를 보존하도록 조합 방식을 수정하여 복잡 영상에서 마스크 예측 정확도를 높입니다. 또한 Mamba 계열 비전 상태공간 모델에서 scanning 모듈의 패치 드롭을 통해 선택적 입력 사용을 구현하고 일반화 성능을 개선합니다. 더불어 화면 검출처럼 경계 노이즈를 처리하는 분할-후처리 연계를 제안하며, GO 게임 기록 이미지의 보드 기준점과 돌 정보를 추출해 지도학습용 학습 데이터로 변환하는 데이터 변환 절차를 다룹니다.

관련 프로젝트

0건

연구 흐름

초기에는 인스턴스 세그멘테이션 모델의 속도 측정이 하드웨어 조건에 따라 달라 비교가 어렵다는 점을 해결하기 위해, 고정 환경에서 추론 시간과 정확도를 함께 제시하는 평가 틀을 마련했습니다. 이후 의미 분할에서는 PSPNet의 문맥 집계를 멀티스케일 특징 보존 관점에서 재구성하여 분할 성능을 개선하는 연구로 확장했습니다. 동시에 비전 상태공간 모델에서는 패치 드롭 기반 정규화를 scanning 모듈에 적용해 선택적 탐색과 강건성을 높였습니다. 후속으로 화면 검출과 보드 게임 이미지 변환처럼 실제 데이터 준비 및 후처리 연계를 포함하는 응용으로 연구 범위를 넓혔습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

실시간 인스턴스 세그멘테이션
문맥 보존 의미 분할
PSPNet 기반 멀티스케일 학습
비전 Mamba 패치 정규화
선택적 입력 기반 강건성
화면(슬라이드) 영역 자동 추출
경계 노이즈 제거 후처리
이미지-라벨 자동 변환 파이프라인
지도학습 학습데이터 생성
컴퓨터 비전 분할 벤치마킹