연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 0
·2026
Vision transformer-based approach for plant leaf disease classification with multi-patch selection
Amreen Batool, Yong-Woon Kim, Yung-Cheol Byun
IF 2.5 (2026) PeerJ Computer Science
초록

식물 병해는 전 세계 농업 생산성에 중대한 도전 과제를 제기하며, 그 영향을 완화하기 위해서는 조기이면서도 정확한 탐지가 필요하다. 본 연구는 특징 추출과 계산 효율성 사이의 균형을 달성하기 위해 새로운 다중 패치 선택(multi-patch selection) 방식을 활용하는 Vision Transformer(ViT) 기반 프레임워크를 도입하여 사과 잎 병해를 분류한다. 잎 이미지는 ViT 프레임워크와의 호환성을 확보하기 위해 전처리한 뒤, 크기가 서로 다른 패치(32 × 32, 16 × 16, 8 × 8)로 분할하여, 네 가지 범주인 Apple Scab(사과 딱지병), Black Rot(흑색무름병), Cedar Rust(시더녹병), Healthy Leaves(건강한 잎)를 분류하는 데 있어 국소 및 전역 특징을 모두 포착할 수 있도록 하였다. 제안된 Plant Leaf Disease Vision Transformer(PLD-ViT) 프레임워크는 16 × 16 패치 구성에서 97.76%의 검증 정확도, 95.34%의 정밀도, 95.11%의 재현율, 95.06%의 F1-score를 달성하여, ResNet-50(96.75% 검증 정확도, 95.11% 정밀도, 93.42% 재현율, 95.31% F1-score) 및 Swin Transformer(96.79% 검증 정확도, 95.76% 정밀도, 95.94% 재현율, 95.89% F1-score)보다 유의하게 우수한 분류 성능을 보이면서도 계산 효율성을 유지한다(각각 1.0× GFLOPs 대 3.8× 및 4.5×). 본 모델은 서로 다른 범주를 견고하게 분류하지만, Cedar Rust와 Healthy Leaves처럼 시각적으로 유사한 집단을 구별하는 데에는 어려움이 있다. 그럼에도 불구하고, 본 모델은 통제된 데이터셋에 의존한다는 점과 더 작은 패치 크기와 관련된 계산 요구량이라는 한계를 가진다. 본 ViT 기반 프레임워크는 정밀 농업을 위한 실용적이고 확장 가능한 해결책을 제공하며, 지속 가능한 영농을 지원하고 전 세계 식량 안보를 증진하는 접근 가능한 도구를 위한 기반을 마련한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Feature selectionFeature extractionScalabilityPlant diseaseModel selectionRandom forestComputational complexity theoryPrecision agriculture
타입
Article
IF / 인용수
2.5 / 0
게재 연도
2026