RnDCircle Logo
최재용 연구실
가천대학교 AI∙소프트웨어학부 최재용 교수
자율로보틱스
컴퓨터비전
6-DoF 포즈추정
연구 영역
기본 정보
논문·특허
과제
구성원

최재용 연구실

가천대학교 AI∙소프트웨어학부 최재용 교수

최재용 연구실은 AI·소프트웨어학부 기반의 자율 로보틱스와 컴퓨터 비전 인식, 멀티태스크 학습을 중심으로 연구를 수행합니다. UAV와 UGV 환경에서 비전 기반 객체 추적, 마커 없는 도킹, 단안 RGB 기반 6-DoF 포즈 추정과 같은 자율 제어 기술을 확보하고, Large Language Model을 경로 계획에 결합해 복잡 상황에서의 목표 도달 성능을 다룹니다. 또한 UAV 영상, 의료 영상, 도시 생태 환경에 대해 세그멘테이션·탐지·향상 전처리 파이프라인을 구축하여 실시간 처리 및 배포 가능성을 고려합니다. 더불어 DARE 기반 모델 병합과 3D 프린팅 섀도 마스크 기반 마이크로 전극 제작으로 응용 확장도 병행합니다.

자율로보틱스컴퓨터비전6-DoF 포즈추정UAV·UGV 자율제어멀티태스크 학습
대표 연구 분야
연구 영역 전체보기
비전 기반 자율 로보틱스와 6-DoF 포즈 추정 thumbnail
비전 기반 자율 로보틱스와 6-DoF 포즈 추정
Vision-based Autonomous Robotics and 6-DoF Pose Estimation
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

24총합

5개년 연도별 피인용 수

116총합
주요 논문
5
논문 전체보기
1
Article
|
인용수 0
·
2026
LLM-DWA: a hybrid path planning framework combining large language models with the dynamic window approach
Jeonghee Seo, Eunsung Kim, Andrew Jaeyong Choi
IF 3.9 (2026)
Scientific Reports
본 연구는 Dynamic Window Approach(DWA) 알고리즘의 국소 최소값 문제를 다룬다. 선행 환경 지식을 통합하지 않는 기존의 DWA는 U자형 장애물이 있는 환경과 같은 복잡한 시나리오에서 목표 도달 성능이 저하되는 경우가 흔하며, 목표에 도달하더라도 계획 시간이 상대적으로 길 수 있다. 이러한 한계를 극복하기 위해, 우리는 Large Language Models(LLMs)를 통합한 개선된 DWA를 제안한다. LLM의 추론 능력을 활용하여 선행 환경 정보를 해석하고, 적절한 중간 경유지를 생성한다. 2D 격자 환경과 3D 시뮬레이션 플랫폼 모두에서의 실험 결과는 제안된 LLM 기반 하이브리드 방법이 기존 DWA에 비해 U자형 장애물 시나리오에서 더 높은 효율과 더 짧은 목표 도달 시간을 달성함을 보여준다. 이러한 결과는 복잡한 환경에서 내비게이션 성능을 향상시키기 위해 LLM의 추론 능력과 DWA를 결합하는 접근의 효과성을 강조한다. 동영상 시연은 https://youtu.be/Otn53HS4KC4 에서 제공된다.
https://doi.org/10.1038/s41598-026-39524-1
Obstacle
Window (computing)
Grid
Path (computing)
Motion planning
Maxima and minima
2
Article
|
인용수 0
·
2025
Autonomous charging system via manipulator-UGV docking using zero-shot 6-DoF pose estimation
Minkyu Jung, Andrew Jaeyong Choi
IF 6.8 (2025)
Alexandria Engineering Journal
인간의 개입 없이 장기간 무인 지상차량(Unmanned Ground Vehicles, UGV)의 현장 운용을 보장하기 위해서는 자율 충전 기능이 필수적이다. 본 논문은 UGV가 경로 계획을 수행하고 충전 스테이션과 정렬하며, 외부 표식에 의존하지 않고 6-자유도(6-DoF) 매니퓰레이터를 이용해 충전 포트를 탐색하여 연결할 수 있도록 하는 완전 자율 충전 시스템을 제시한다. 본 시스템은 RGB-D 데이터에 대한 기하학적 추론과 비전-언어 탐지를 결합하여, 표식(fiducial marker)이나 작업 특화 재학습 없이도 완전한 6-DoF 자세를 추정함으로써 서로 다른 도킹 환경 전반에서 적응성을 향상시킨다. 구체적으로, 개방 어휘(open-vocabulary) 객체 검출기 YOLO-World를 RGB 이미지에 적용하여 도킹 포트를 식별하고, 심도 맵(depth map)에서 해당 3D 위치를 선택한다. 방향을 추정하기 위해, 주변 점군(point cloud)을 군집화하여 객체 형상을 추출하고, 그로부터 주(principal axis)를 계산함으로써 표식이나 작업 특화 재학습에 의존하지 않는, 완전히 일반화 가능한 표식-무도킹(marker-free) 파이프라인을 구현한다. 이렇게 얻은 6-DoF 자세는 역기구학(inverse kinematics)을 통해 실현 가능한 매니퓰레이터 구성(configuration)을 계산하는 데 사용된다. 제안된 파이프라인은 ROS 기반 프레임워크에 통합되어 수동 감독 없이도 비정형 야외 환경에서 정밀 도킹을 가능하게 한다. 실험 결과, 실제 환경 조건에서 시스템의 강건성과 정확성이 입증되었으며, 도킹 성공률 90%, 평균 총 작동 시간 34.4 s를 달성하였다. • UGV와 매니퓰레이터 협력을 위한 제로샷(zero-shot) 도킹 프레임워크를 제안한다. • 개방 어휘 객체 인식을 위한 YOLO-World를 통합한다. • 융합된 비전과 기하 정보를 사용하여 실시간 6-DoF 자세 추정을 달성한다. • 실제 로봇을 이용한 물리 실험에서 90% 이상의 도킹 성공률을 보인다. • 모듈형 파이프라인은 다중 로봇 협업을 위한 확장 가능성을 제공한다.
https://doi.org/10.1016/j.aej.2025.12.015
Pose
Adaptability
Robustness (evolution)
RANSAC
Observability
Docking (animal)
3D pose estimation
Point cloud
Robot
RGB color model
3
Article
|
인용수 21
·
2025
A Unified Transformer Model for Simultaneous Cotton Boll Detection, Pest Damage Segmentation, and Phenological Stage Classification from UAV Imagery
Sabina Umirzakova, Shakhnoza Muksimova, Аброр Бурибоев, Holida Primova, Andrew Jaeyong Choi
IF 4.8 (2025)
Drones
현재 목화 재배 산업과 관련된 문제, 즉 수량 추정, 해충 영향, 생육 단계 진단은 통합적이며 확장 가능한 모니터링 솔루션을 필요로 한다. 본 원고는 UAV 영상을 기반으로 한 변환기(transformer) 구동 멀티태스크 프레임워크인 Cotton Multitask Learning(CMTL)을 제시하며, 이를 통해 한 번에 세 가지 주요 농학 과제를 동시에 수행하도록 한다: 꼬투리(boll) 검출, 해충 피해 영역 분할, 그리고 생물계절학적(phenological) 단계 분류. CMTL은 별도의 파이프라인을 변경하는 것이 아니라, Cross-Level Multi-Granular Encoder(CLMGE)와 Multitask Self-Distilled Attention Fusion(MSDAF) 모듈을 통해 이들 목표를 결합하여 과제 간 상호 학습을 가능하게 하면서도 각 과제의 고유한 특징은 유지한다. 생물학적 지침에 기반한 Stage Consistency Loss는 네트워크의 일부로서, 실제로 발생하는 생육 단계 전이를 시스템이 수행할 수 있게 해준다. 우리는 CMTL을 삼중 출처의 UAV 데이터셋에서 실행했으며, 이는 공개 및 비공개 컬렉션에서 통합된 2,100장 이상의 라벨링된 이미지를 포함하고, 다양한 작물 단계와 조건을 대표한다. 모델은 모든 과제에서 최신(state-of-the-art) 기준 대비 우수성을 보였는데, 꼬투리 검출에서 mAP 0.913, 해충 분할에서 IoU 0.832, 생육 단계 분류에서 정확도 0.936을 달성했다. 또한 NVIDIA Jetson Xavier NX(중국 상하이에서 제조)와 같은 엣지 장치에서도 가장 빠른 성능 속도를 보여 배치에 이상적이다. 이러한 결과는 정밀 목화 농업에서 항공 작물 지능을 위한 단일하고 생산적인 도구로서 CMTL의 잠재력을 시사한다.
https://doi.org/10.3390/drones9080555
Computer science
Segmentation
Artificial intelligence
Phenology
Deep learning
PEST analysis
Machine learning
Real-time computing
Ecology
최신 정부 과제
1
과제 전체보기
1
2023년 4월-2025년 11월
|53,900,000
운동학습 모델을 적용한 맞춤형 일상재활 로봇을 위한 운동 평가 및 피드백 인공지능 시스템 개발
뇌병변 환자들을 위한 일상재활 로봇에 연계하는 인공지능 기반의 “자동 동작인식, 평가 및 피드백 시스템” (System for Automatic Motion Classification, Assessment, and Feedback; SAMCAF)을 개발하고, 이를 통해 사용 기반(use-dependent) 운동학습 모델에 의한 회복 예측과 피드백을 제공하는...
사용기반 운동학습모델
자동 동작인식
운동평가
개인화된 훈련