연구 영역
기본 정보
논문·특허
과제
구성원
Article|
·
인용수 1
·2025
ViT-Slim: A Genetic Algorithm-based NAS Framework for Efficient Vision Transformer Design
Eunjoung Yoo, Jaehyeong Sim
초록

산업 응용에서 맞춤 데이터셋으로 미세 조정된 사전 학습 모델은 과도하게 크고 자원 집약적인 특성으로 인해, 목표 도메인의 특정 요구사항을 흔히 초과한다. 이러한 비효율을 해소하기 위해, 본 연구는 Vision Transformer(ViT) 아키텍처 최적화를 위한 유전 알고리즘 기반 신경망 아키텍처 탐색(Genetic Algorithm-based Neural Architecture Search, GA-NAS) 프레임워크인 ViT-Slim을 제안한다. ViT-Slim은 유전 알고리즘의 강점을 활용하여 설계 구성의 탐색과 최적화를 수행함으로써 모델 크기와 성능의 균형을 맞춘다. 또한 프레임워크는 유도 편향을 주입하기 위해 Dense Relative Localization(DrLoc)을 통합하여, 데이터가 제한된 상황에서도 맞춤 데이터셋을 효율적으로 처리하는 ViT의 능력을 향상시킨다. 맞춤 depth 데이터셋에 대한 실험적 검증 결과, ViT-Slim은 기준 ViT-Small과 비교하여 정확도 손실이 1% 미만인 상태에서 메모리 사용량을 최대 79.18%, 파라미터를 83.09%까지 감소시키며 유의미한 자원 효율성을 달성함을 확인하였다. 아울러 ViT-Slim이 생성한 아키텍처는 경량 CNN 모델에 비해 FLOPs 및 파라미터 사용 측면에서 더 우수한 효율성을 보였으며, 실제 산업 환경의 문제를 해결하기 위한 확장 가능하고 실용적인 해법으로서의 잠재력을 입증한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceTransformerGenetic algorithmArtificial intelligenceComputer visionMachine learningElectrical engineeringEngineeringVoltage
타입
Article
IF / 인용수
- / 1
게재 연도
2025