연구 영역
기본 정보
논문·특허
과제
구성원
Preprint|
인용수 0
·2025
WISE-FUSE: Efficient Whole Slide Image Encoding via Coarse-to-Fine Patch Selection with VLM and LLM Knowledge Fusion
Shin, Yonghan, SeungKyu Kim, Won‐Ki Jeong
ArXiv.org
초록

계산 병리학(computational pathology, CPath)에서 전장 슬라이드 이미지(whole slide images, WSIs)는 기가픽셀 규모로 인해 주요한 계산적 과제를 야기하며, 슬라이드당 고해상도 패치를 수만~수십만 개 수준으로 처리해야 하는 경우가 흔하다. 이로 인해 인코딩 비용이 감당하기 어려워지며, 전처리와 훈련 시간이 수일 또는 수주에 이르러 전 세계적으로 배치되는 환경에서 WSI 인코딩이 가장 큰 병목으로 작용한다. 본 연구에서는 병리학 분야의 비전-언어 모델과 대규모 언어 모델을 활용하여 진단적으로 관련 있는 영역만을 선택적으로 처리함으로써 이러한 과제를 해결하는 적응형 WSI 인코딩 프레임워크인 WISE-FUSE를 제안한다. WISE-FUSE는 먼저 지식 증류(knowledge distillation) 메커니즘을 통해 저해상도 패치와 클래스별 텍스트 설명 간의 유사도 점수를 계산하며, 이를 통해 세부적인 진단 특징을 보존한다. 이러한 유사도 점수를 기반으로 표적 과제에 대해 소수의 유익한 영역을 선택하여, 거친 수준에서 비관련 패치를 신속하게 제거한다. 이어서 대응되는 고해상도 패치를 선택적으로 인코딩하고 텍스트 임베딩과 융합하여 진단적 맥락을 강화한다. 광범위한 실험 결과, WISE-FUSE는 전장 슬라이드 인코딩 시간을 3배 이상 감소시키면서도 완전한 패치 처리와 비교했을 때 동등하거나 더 나은 수준의 진단 성능을 달성함을 보여주었으며, 이는 CPath를 위한 확장 가능하고 실용적인 해결책을 제공한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Encoding (memory)PreprocessorBottleneckScalabilitySimilarity (geometry)Selection (genetic algorithm)Pattern recognition (psychology)Image (mathematics)
타입
Preprint
IF / 인용수
- / 0
게재 연도
2025