주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
인용수 0
·
2026LLM-DWA: a hybrid path planning framework combining large language models with the dynamic window approach
Jeonghee Seo, Eunsung Kim, Andrew Jaeyong Choi
IF 3.9 (2026)
Scientific Reports
본 연구는 Dynamic Window Approach(DWA) 알고리즘의 국소 최소값 문제를 다룬다. 선행 환경 지식을 통합하지 않는 기존의 DWA는 U자형 장애물이 있는 환경과 같은 복잡한 시나리오에서 목표 도달 성능이 저하되는 경우가 흔하며, 목표에 도달하더라도 계획 시간이 상대적으로 길 수 있다. 이러한 한계를 극복하기 위해, 우리는 Large Language Models(LLMs)를 통합한 개선된 DWA를 제안한다. LLM의 추론 능력을 활용하여 선행 환경 정보를 해석하고, 적절한 중간 경유지를 생성한다. 2D 격자 환경과 3D 시뮬레이션 플랫폼 모두에서의 실험 결과는 제안된 LLM 기반 하이브리드 방법이 기존 DWA에 비해 U자형 장애물 시나리오에서 더 높은 효율과 더 짧은 목표 도달 시간을 달성함을 보여준다. 이러한 결과는 복잡한 환경에서 내비게이션 성능을 향상시키기 위해 LLM의 추론 능력과 DWA를 결합하는 접근의 효과성을 강조한다. 동영상 시연은 https://youtu.be/Otn53HS4KC4 에서 제공된다.
https://doi.org/10.1038/s41598-026-39524-1
Obstacle
Window (computing)
Grid
Path (computing)
Motion planning
Maxima and minima
2
Article
|
인용수 0
·
2025Autonomous charging system via manipulator-UGV docking using zero-shot 6-DoF pose estimation
Minkyu Jung, Andrew Jaeyong Choi
IF 6.8 (2025)
Alexandria Engineering Journal
인간의 개입 없이 장기간 무인 지상차량(Unmanned Ground Vehicles, UGV)의 현장 운용을 보장하기 위해서는 자율 충전 기능이 필수적이다. 본 논문은 UGV가 경로 계획을 수행하고 충전 스테이션과 정렬하며, 외부 표식에 의존하지 않고 6-자유도(6-DoF) 매니퓰레이터를 이용해 충전 포트를 탐색하여 연결할 수 있도록 하는 완전 자율 충전 시스템을 제시한다. 본 시스템은 RGB-D 데이터에 대한 기하학적 추론과 비전-언어 탐지를 결합하여, 표식(fiducial marker)이나 작업 특화 재학습 없이도 완전한 6-DoF 자세를 추정함으로써 서로 다른 도킹 환경 전반에서 적응성을 향상시킨다. 구체적으로, 개방 어휘(open-vocabulary) 객체 검출기 YOLO-World를 RGB 이미지에 적용하여 도킹 포트를 식별하고, 심도 맵(depth map)에서 해당 3D 위치를 선택한다. 방향을 추정하기 위해, 주변 점군(point cloud)을 군집화하여 객체 형상을 추출하고, 그로부터 주(principal axis)를 계산함으로써 표식이나 작업 특화 재학습에 의존하지 않는, 완전히 일반화 가능한 표식-무도킹(marker-free) 파이프라인을 구현한다. 이렇게 얻은 6-DoF 자세는 역기구학(inverse kinematics)을 통해 실현 가능한 매니퓰레이터 구성(configuration)을 계산하는 데 사용된다. 제안된 파이프라인은 ROS 기반 프레임워크에 통합되어 수동 감독 없이도 비정형 야외 환경에서 정밀 도킹을 가능하게 한다. 실험 결과, 실제 환경 조건에서 시스템의 강건성과 정확성이 입증되었으며, 도킹 성공률 90%, 평균 총 작동 시간 34.4 s를 달성하였다.
• UGV와 매니퓰레이터 협력을 위한 제로샷(zero-shot) 도킹 프레임워크를 제안한다.
• 개방 어휘 객체 인식을 위한 YOLO-World를 통합한다.
• 융합된 비전과 기하 정보를 사용하여 실시간 6-DoF 자세 추정을 달성한다.
• 실제 로봇을 이용한 물리 실험에서 90% 이상의 도킹 성공률을 보인다.
• 모듈형 파이프라인은 다중 로봇 협업을 위한 확장 가능성을 제공한다.
https://doi.org/10.1016/j.aej.2025.12.015
Pose
Adaptability
Robustness (evolution)
RANSAC
Observability
Docking (animal)
3D pose estimation
Point cloud
Robot
RGB color model
3
Article
|
인용수 21
·
2025A Unified Transformer Model for Simultaneous Cotton Boll Detection, Pest Damage Segmentation, and Phenological Stage Classification from UAV Imagery
Sabina Umirzakova, Shakhnoza Muksimova, Аброр Бурибоев, Holida Primova, Andrew Jaeyong Choi
IF 4.8 (2025)
Drones
현재 목화 재배 산업과 관련된 문제, 즉 수량 추정, 해충 영향, 생육 단계 진단은 통합적이며 확장 가능한 모니터링 솔루션을 필요로 한다. 본 원고는 UAV 영상을 기반으로 한 변환기(transformer) 구동 멀티태스크 프레임워크인 Cotton Multitask Learning(CMTL)을 제시하며, 이를 통해 한 번에 세 가지 주요 농학 과제를 동시에 수행하도록 한다: 꼬투리(boll) 검출, 해충 피해 영역 분할, 그리고 생물계절학적(phenological) 단계 분류. CMTL은 별도의 파이프라인을 변경하는 것이 아니라, Cross-Level Multi-Granular Encoder(CLMGE)와 Multitask Self-Distilled Attention Fusion(MSDAF) 모듈을 통해 이들 목표를 결합하여 과제 간 상호 학습을 가능하게 하면서도 각 과제의 고유한 특징은 유지한다. 생물학적 지침에 기반한 Stage Consistency Loss는 네트워크의 일부로서, 실제로 발생하는 생육 단계 전이를 시스템이 수행할 수 있게 해준다. 우리는 CMTL을 삼중 출처의 UAV 데이터셋에서 실행했으며, 이는 공개 및 비공개 컬렉션에서 통합된 2,100장 이상의 라벨링된 이미지를 포함하고, 다양한 작물 단계와 조건을 대표한다. 모델은 모든 과제에서 최신(state-of-the-art) 기준 대비 우수성을 보였는데, 꼬투리 검출에서 mAP 0.913, 해충 분할에서 IoU 0.832, 생육 단계 분류에서 정확도 0.936을 달성했다. 또한 NVIDIA Jetson Xavier NX(중국 상하이에서 제조)와 같은 엣지 장치에서도 가장 빠른 성능 속도를 보여 배치에 이상적이다. 이러한 결과는 정밀 목화 농업에서 항공 작물 지능을 위한 단일하고 생산적인 도구로서 CMTL의 잠재력을 시사한다.
https://doi.org/10.3390/drones9080555
Computer science
Segmentation
Artificial intelligence
Phenology
Deep learning
PEST analysis
Machine learning
Real-time computing
Ecology
4
Article
|
인용수 1
·
2025Research on enhancing model performance by merging with Korean language models
Taewan Cho, Rina Kim, Andrew Jaeyong Choi
IF 8 (2025)
Engineering Applications of Artificial Intelligence
본 연구는 Drop and Rescale (DARE) 기법을 활용하여 Open LLM Leaderboard의 상위권 Large Language Models (LLMs)의 역량을 향상시키는 새롭고도 간단한 접근법을 제안한다. DARE는 미세조정된 모델로부터의 델타 파라미터 중복을 최소화함으로써 효율적인 모델 병합을 가능하게 한다. 우리는 DARE를 사용하여 성능이 우수한 다국어 LLM과 특화된 한국어 언어 모델을 통합한다. 병합된 모델은 추론 능력에 초점을 맞춰 6개의 벤치마크 과제와 다중 턴 질문 세트(MT-Bench)에서 평가된다. 그 결과, 한국어 언어 모델을 포함하는 경우 6개 벤치마크 과제 전반에서 평균 1.69%의 유의한 성능 향상이 관찰되었으며, 복잡한 추론 기술을 요구하는 Grade School Math 8K (GSM8K)에서는 특히 20% 이상 더 높은 성능을 보였다. 이는 한국어 언어의 내재적 복잡성과 풍부한 언어적 특징이 LLM의 추론 능력을 향상시키는 데 기여함을 시사한다. 또한 본 모델은 MT-Bench에서 더 우수한 성능을 나타내어 실제 환경의 추론 과제에서의 효과를 입증한다. 본 연구는 DARE가 특화된 언어 모델을 통합하는 효과적인 방법으로서의 잠재력을 강조하며, 기존 언어 모델을 고도화된 과제에 활용할 수 있음을 보여준다. 1 1 Code and models available at: https://huggingface.co/iRASC/Llama-Ko-8B .
https://doi.org/10.1016/j.engappai.2025.111686
Computer science
Language model
Natural language processing
Artificial intelligence
5
Article
|
인용수 6
·
20243D-printed shadow masks for micro-patterned electrodes
Chanwook Cha, Eun-Chae Jo, Yeongjun Kim, Andrew Jaeyong Choi, Koohee Han
IF 4.6 (2024)
RSC Advances
미세가공은 고정밀의 복잡한 전극 구조를 제작할 수 있게 함으로써 lab-on-chip 장치의 발전에 핵심적이다. 일반적으로 미세 패턴 전극을 제작하는 데 사용되는 전통적 포토리소그래피는 복잡하고 다단계의 공정을 필요로 하며, 그에 따라 비용과 시간이 많이 소요될 수 있다. 본 연구에서는 전극 제작을 위해 3D 프린팅 그림자 마스크(shadow mask)를 사용하는 방법을 제시하며, 이는 전통적 방법에 비해 더 단순하고 비용 효율적인 대안을 제공한다. 구체적으로, fused deposition modeling 3D 프린터를 활용함으로써 3D 프린팅 그림자 마스크가 미세 패턴 전극의 신속한 시제품 제작을 다양한 설계—단순한 선부터 복잡한 패턴에 이르기까지—에 걸쳐 간소화할 수 있음을 입증하였다. 3D 프린팅 그림자 마스크로 제작된 전극의 lab-on-chip 기능을 평가하기 위해, 전극에서 전기장 구동 방식의 미세입자 조립을 조사하였다. 전극의 미세 패턴 설계는 조립 패턴을 원격으로 유도하여, 명확히 정의된 다수의 사슬과 비등방성 구조가 형성되도록 하였다. 이러한 결과는 3D 프린팅 그림자 마스크가 제작 공정을 단순화할 뿐 아니라, 고급 lab-on-chip 응용에 요구되는 정밀도 또한 유지함을 시사한다. 제안된 방법은 복잡한 미세 패턴 전극의 보다 접근 가능하고 확장 가능한 제조를 위한 기반을 마련할 수 있을 것이다.
https://doi.org/10.1039/d4ra06298a
Shadow (psychology)
Shadow mask
3d printed
Electrode
Nanotechnology
Chip
Rapid prototyping
Materials science
Computer science
Optoelectronics