Context-Aware Segmentation, Visual State-Space Regularization, and Training Data Conversion
연구 내용
PSPNet 계열에서 멀티스케일 문맥을 보존하는 의미 분할과 실시간 인스턴스 세그멘테이션 성능 비교, 비전 상태공간 모델의 패치 드롭 기반 정규화를 함께 다루는 연구
본 연구는 픽셀 단위 분류를 위한 문맥 통합과 계산 효율을 동시에 고려합니다. 인스턴스 세그멘테이션에서는 하드웨어를 고정한 조건에서 추론 시간 기반 성능 비교를 수행해 속도-정확도 트레이드오프를 체계적으로 분석합니다. 의미 분할에서는 PSPNet 기반 구조에서 피라미드 풀링의 멀티스케일 특징을 결합하되, 다운샘플된 특징의 정보를 보존하도록 조합 방식을 수정하여 복잡 영상에서 마스크 예측 정확도를 높입니다. 또한 Mamba 계열 비전 상태공간 모델에서 scanning 모듈의 패치 드롭을 통해 선택적 입력 사용을 구현하고 일반화 성능을 개선합니다. 더불어 화면 검출처럼 경계 노이즈를 처리하는 분할-후처리 연계를 제안하며, GO 게임 기록 이미지의 보드 기준점과 돌 정보를 추출해 지도학습용 학습 데이터로 변환하는 데이터 변환 절차를 다룹니다.
관련 연구 성과
관련 논문
5편
관련 특허
0건
관련 프로젝트
0건
연구 흐름
초기에는 인스턴스 세그멘테이션 모델의 속도 측정이 하드웨어 조건에 따라 달라 비교가 어렵다는 점을 해결하기 위해, 고정 환경에서 추론 시간과 정확도를 함께 제시하는 평가 틀을 마련했습니다. 이후 의미 분할에서는 PSPNet의 문맥 집계를 멀티스케일 특징 보존 관점에서 재구성하여 분할 성능을 개선하는 연구로 확장했습니다. 동시에 비전 상태공간 모델에서는 패치 드롭 기반 정규화를 scanning 모듈에 적용해 선택적 탐색과 강건성을 높였습니다. 후속으로 화면 검출과 보드 게임 이미지 변환처럼 실제 데이터 준비 및 후처리 연계를 포함하는 응용으로 연구 범위를 넓혔습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Benchmarking Deep Learning Models for Instance Segmentation
Local Context Aggregation for Semantic Segmentation: A Novel PSPNet Approach
Patch Regularization in Visual State Space Model
A screen of slide detection method using deep learning-based segmentation and Hough transform
A method for converting an image of a GO game record to training data