김용성 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
논문
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

12총합

5개년 연도별 피인용 수

174총합
전체 논문
27
1
article
|
·
인용수 0
·
2025
Development of a digital storytelling model utilizing Text-To-Vedio artificial intelligence and Merrill’s component display theory
Eunmo Sung, Seul Ki Han, Yongsung Kim
Korean Association for Educational Information and Media
생성형 인공지능(이하 AI) 기술인 ChatGPT가 등장하면서 전 세계의 사회·경제·문화 등에 강력하게 영향을 미치고 있으며, 이를 교육적으로 활용하려는 노력도 더욱 가속화되고 있다. 최근 TTV(Text-to-Video) AI 기술을 통해 텍스트만으로 고화질 동영상을 손쉽게 제작할 수 있게 되면서, 교수자와 학습자가 창의적이고 다양한 교수·학습 자료를 제작할 수 있는 교육적 가능성이 높아지고 있다. 동영상 기반 자료라는 특성상, Merrill의 내용요소제시이론(Component Display Theory)은 TTV AI 기반 교수·학습 모형 개발에 시사점을 제공하며, 디지털 스토리텔링 교수·학습모형의 적용 또한 가능하다. 이에 이본 연구에서는 TTV AI 기술 활용 Merrill의 내용요소제시이론 기반 디지털스토리텔링 교수·학습 모형을 개발하고자 하였으며, 개발방법론의 절차에 따라 연구가 이루어졌다. 특히, 교수·학습모형을 개발하고 모형의 타당성을 검증하기 위하여 내부 연구진 타당화(2회)와 외부 전문가 타당화(2회)가 체계적으로 이루어졌다. 그 결과, TTV AI 기술의 특성(동영상 생성 AI. 아바타 생성 AI. 동영상 편집 AI)과 활용 유형(유형1:교수자 개발, 유형2: 학습자 개발, 유형3: 교수자·학습자 개발)이 도출되었고, TTV AI 기술을 활용한 Merrill의 내용요소제시이론은 수행수준과 내용유형에 따른 자료제시유형이 디지털스토리텔링 교수·학습활동의 각 단계(수업준비-계획-실행-평가)에 적용되어 개발되었다. 개발된 모형을 4회에 걸친 타당화 결과, 내용타당도 지수가 적합 수준으로 확인되었고, 이를 교육현장에 활용하기 위한 시사점과 추후 연구를 위한 제언을 제시하였다.
https://doi.org/10.15833/kafeiam.31.3.847
Component (thermodynamics)
Storytelling
Artificial intelligence
Computer science
Digital storytelling
Computer graphics (images)
Multimedia
Art
Narrative
Literature
2
preprint
|
인용수 0
·
2024
Improving Geometry in Sparse-View 3DGS via Reprojection-based DoF Separation
Yongsung Kim, Minjun Park, Jooyoung Choi, Sungroh Yoon
arXiv (Cornell University)
최근의 학습 기반 멀티 뷰 스테레오(Multi-View Stereo) 모델들은 희소 뷰(sparse-view) 3D 재구성에서 최첨단 성능을 보였다. 그러나 이러한 모델들에 이어 정교화 단계로 3D 가우시안 스플래팅(3D Gaussian Splatting, 3DGS)을 직접 적용하는 데에는 어려움이 있다. 우리는 가우시안에서의 과도한 위치 자유도(DoFs)가 기하 왜곡을 유발하며, 구조적 충실도(structural fidelity) 대신 색상 패턴을 맞추는 데 비용이 발생한다고 가정한다. 이를 해결하기 위해, 불확실성 관점에서 위치 자유도를 구분하는 재투영(reprojection) 기반 DoF 분리(reprojection-based DoF separation) 방법을 제안한다. 이 방법은 이미지 평면에 평행한 DoFs와 광선에 정렬된 DoF를 구분한다. 각 DoF를 독립적으로 관리하기 위해, 재투영 과정을 도입하고 각 DoF에 맞춘 맞춤형 제약을 적용한다. 다양한 데이터셋에 걸친 실험을 통해, 가우시안의 위치 자유도를 분리하고 표적 제약을 적용하는 것이 기하적 인공물(artifacts)을 효과적으로 억제하며, 시각적으로도 기하학적으로도 그럴듯한 재구성 결과를 산출함을 확인한다.
http://arxiv.org/abs/2412.14568
Separation (statistics)
Geometry
Computer science
Artificial intelligence
Computer vision
Mathematics
Machine learning
3
article
|
인용수 11
·
2022
An Efficient Method for Underwater Video Summarization and Object Detection Using YoLoV3
Mubashir Javaid, Muazzam Maqsood, Farhan Aadil, Jibran Safdar, Yongsung Kim
IF 2 (2022)
Intelligent Automation & Soft Computing
현재 전 세계의 산업과 지역사회는 해양과 바다에 존재하는 자산과 자원을 구축하고 확장하며 탐색하는 데 관심을 두고 있다. 보다 구체적으로, 수중 환경에서의 분류(스톡) 분석, 고고학, 감시를 수행하기 위해 관련 정보를 수집하기 위한 목적으로 여러 대의 카메라를 수중에 설치하여 영상을 촬영한다. 그러나 한편으로 이러한 대용량 영상은 처리 시 관련 정보를 추출하는 데 많은 시간과 메모리가 필요하다. 따라서 영상 평가의 이러한 수작업 절차를 자동화하기 위해서는 정확하고 효율적인 자동화 시스템이 더 큰 필요성을 갖는다. 이러한 관점에서 본 연구는 수중 영상에서의 영상 요약과 객체 탐지 작업을 위한 완결된 프레임워크 해결방안을 제시하고자 한다. 우리는 먼저 핵심 프레임을 추출하기 위해 지각 운동 에너지(perceived motion energy, PME) 방법을 사용하였고, 이후 수중 영상에서의 객체 탐지를 수행하기 위해 객체 탐지 모델 접근 방식인 YoloV3를 적용하였다. 또한 제안된 접근법에서는 수중 이미지의 흐림(blurriness)과 저대비(low contrast) 문제를 고려하여 영상 향상(image enhancement) 방법을 적용하였다. 더 나아가 제안된 수중 영상 요약 및 객체 탐지 프레임워크는 공개되어 있는 기수(brackish) 데이터셋에서 평가되었다. 그 결과 제안된 프레임워크는 양호한 성능을 보이는 것으로 관찰되었으며, 궁극적으로는 수중 고고학, 스톡 평가, 감시 분야와 관련된 여러 해양 연구자 또는 과학자들의 업무를 지원하는 데 기여할 것으로 기대된다.
https://doi.org/10.32604/iasc.2023.028262
Automatic summarization
Computer science
Underwater
Object detection
Artificial intelligence
Perspective (graphical)
Computer vision
Object (grammar)
Field (mathematics)
Information retrieval
4
article
|
인용수 8
·
2022
Wind Driven Optimization-Based Medical Image Encryption for Blockchain-Enabled Internet of Things Environment
C. S. S. Anupama, Raed Alsini, N. Supriya, E. Laxmi Lydia, Seifedine Kadry, Sang-Soo Yeo, Yongsung Kim
IF 3.1 (2022)
Computers, materials & continua/Computers, materials & continua (Print)
사물인터넷(IoT)과 블록체인은 의료, 금융, 교통 등 다양한 응용 분야에서의 적용 가능성 때문에 상당한 관심을 받고 있다. 디지털 이미지와 관련 환자 정보가 공용 네트워크를 통해 전달되는 의료 분야에서, 의료 영상의 보안 및 개인정보 보호는 핵심적인 요소가 된다. 본 논문은 블록체인 연동 IoT 환경을 위한 의료 영상 암호화에 기반한 새로운 풍력 구동 최적화 알고리즘(WDOA-MIE) 기법을 제시한다. WDOA-MIE 모델은 데이터 수집, 영상 암호화, 최적 키 생성, 데이터 전송의 세 가지 주요 과정으로 구성된다. 초기에는 IoT 장치를 사용하여 환자로부터 의료 영상을 획득한다. 이어서, 획득한 이미지는 서명암호화(signcryption) 기법을 사용하여 암호화한다. 또한 서명암호화 기법의 성능을 향상시키기 위해 WDOA 알고리즘을 통해 최적 키 생성 절차를 적용한다. WDOA-MIE 알고리즘의 목표는 피크 신호 대 잡음비(PSNR)에 의존하는 적합도 함수를 도출하는 데 있다. 영상의 암호화가 성공적으로 완료되면, IoT 장치는 이를 블록체인에 안전하게 저장하기 위해 가장 가까운 서버로 전송한다. 제시된 방법의 성능은 벤치마크 의료 영상 데이터셋을 활용하여 분석하였다. 보안 및 성능 분석 결과, 본 기법은 최대 PSNR 60.7036 dB로 더 나은 보안을 제공함을 확인하였다.
https://doi.org/10.32604/cmc.2022.030267
Encryption
Computer science
Signcryption
Key (lock)
Benchmark (surveying)
Computer engineering
Data mining
Computer network
Computer security
Public-key cryptography
5
article
|
인용수 41
·
2022
Intrusion Detection Systems in Cloud Computing Paradigm: Analysis and Overview
Pooja Rana, Isha Batra, Arun Malik, Agbotiname Lucky Imoize, Yongsung Kim, Subhendu Kumar Pani, Nitin Goyal, Arun Kumar, Seungmin Rho
IF 2.3 (2022)
Complexity
클라우드 컴퓨팅 패러다임은 빠르게 성장하고 있으며, 사용자는 인터넷을 통해 사용량 기반(pay-per-use)으로 서비스를 제공받을 수 있어 모바일 애플리케이션의 개발, 배포 및 접근에 편리하다. 현재 클라우드는 개방적이고 분산된 특성으로 인해 보안이 필수적으로 고려되어야 한다. 방대한 양의 데이터는 해커들을 유혹하는 요인이 된다. 따라서 효과적인 IDS를 개발하는 것은 필수적인 과제이다. 본 논문은 공격 탐지를 위해 4가지 침입 탐지 시스템을 분석하였다. 시뮬레이션에는 NSL-KDD 및 UNSW-NB15라는 두 가지 표준 벤치마크 데이터셋을 사용하였다. 또한 본 연구는 민감한 사용자 데이터의 보안과 관련하여 급증하는 도전 과제를 조명하고, 확인된 문제를 해결하기 위한 유용한 권고사항을 제시한다. 마지막으로, 제안된 결과는 본 연구에서 조사한 데이터셋의 경우 지지벡터머신 분류기와의 하이브리드화(hybridization) 방법이 기존 기법들보다 성능이 우수함을 보여준다.
https://doi.org/10.1155/2022/3999039
Cloud computing
Computer science
Intrusion detection system
Paradigm shift
Data science
Intrusion prevention system
Distributed computing
Data mining
Operating system
6
preprint
|
인용수 0
·
2025
Disambiguation in Conversational Question Answering in the Era of LLMs and Agents: A Survey
Md Mehrab Tanjim, Yeonjun In, Xiang Chen, Victor S. Bursztyn, Ryan A. Rossi, Sungchul Kim, Guang-Jie Ren, Vaishnavi Muppala, Shun Jiang, Yongsung Kim, Chanyoung Park
ArXiv.org
자연어 처리(Natural Language Processing, NLP)에서 모호성은 인간 언어의 내재적 복잡성과 유연성으로 인해 여전히 근본적인 과제로 남아 있다. 대규모 언어 모델(Large Language Models, LLMs)의 등장과 함께, 이들이 확장된 역량과 응용을 바탕으로 모호성 해결의 중요성은 더욱 커졌다. 본 논문은 대화형 질의응답(Conversational Question Answering, CQA) 맥락에서 언어 기반 시스템, 특히 LLMs의 맥락에서 모호성의 정의, 형태, 그리고 함의를 탐구한다. 우리는 핵심 용어와 개념을 정의하고, LLMs가 가능하게 하는 다양한 명확화(disambiguation) 접근법을 분류하며, 각각의 장점과 단점을 비교 분석한다. 또한 모호성 탐지 및 해결 기법을 벤치마킹하기 위해 공개적으로 이용 가능한 데이터셋을 살펴보고, 그것들이 진행 중인 연구와 갖는 관련성을 강조한다. 마지막으로 특히 에이전트적(agentic) 환경에서의 열린 문제와 향후 연구 방향을 식별하고, 추가 탐구가 필요한 영역을 제안한다. LLMs와 관련된 모호성과 명확화에 관한 현재 연구를 포괄적으로 검토함으로써, 보다 견고하고 신뢰할 수 있는 LLM 기반 시스템의 개발에 기여하고자 한다.
http://arxiv.org/abs/2505.12543
Ambiguity
Question answering
Context (archaeology)
Relevance (law)
Categorization
Natural language
Flexibility (engineering)
Key (lock)
7
article
|
인용수 1
·
2025
Disambiguation in Conversational Question Answering in the Era of LLMs and Agents: A Survey
Mehrab Tanjim, Yeonjun In, Xiang Chen, Victor S. Bursztyn, Ryan A. Rossi, Sungchul Kim, Guang‐Jie Ren, Vaishnavi Muppala, Shun Jiang, Yongsung Kim, Chanyoung Park
Mehrab Tanjim, Yeonjun In, Xiang Chen, Victor Bursztyn, Ryan A. Rossi, Sungchul Kim, Guang-Jie Ren, Vaishnavi Muppala, Shun Jiang, Yongsung Kim, Chanyoung Park. 자연어처리 경험적 방법에 관한 2025년 학술대회 논문집. 2025.
https://doi.org/10.18653/v1/2025.emnlp-main.482
Question answering
Natural language
Natural (archaeology)
Empirical research
Questions and answers
8
article
|
인용수 40
·
2023
A Real-Time Data Monitoring Framework for Predictive Maintenance Based on the Internet of Things
Mudita Uppal, Deepali Gupta, Nitin Goyal, Agbotiname Lucky Imoize, Arun Kumar, Stephen Ojo, Subhendu Kumar Pani, Yongsung Kim, Jaeun Choi
IF 1.7 (2023)
Complexity
사물인터넷(Internet of Things, IoT)은 사물과 인간 간의 상호작용을 구축하기 위해 일상생활의 작업을 관리하는 플랫폼이다. 본 연구에서는 전기기기와 센서 데이터를 자동화 시스템을 이용해 인터넷으로 모니터링하는 스마트 오피스를 제시한다. 기존 사무실 자동화 시스템의 일부 한계로는 비우호적인 사용자 인터페이스, IoT 기술의 부재, 높은 비용, 또는 무선 전송 범위의 제한 등이 있다. 따라서 본 논문은 사용이 편리한 스마트폰 인터페이스를 갖춘 IoT 기반 사무실 자동화 시스템의 설계 및 제작을 제안한다. 또한 센서 노드의 예지 정비(predictive maintenance)를 위해 실시간 데이터 모니터링을 수행한다. 본 모델은 Arduino Mega 2560 Rev3 마이크로컨트롤러를 다양한 가전 및 센서에 연결하여 사용한다. 서로 다른 센서와 가전으로부터 수집된 데이터는 클라우드로 전송되며, 사용자는 자신의 위치와 무관하게 스마트폰에서 해당 데이터에 접근할 수 있다. 본 논문에서는 머신러닝 알고리즘 기반의 센서 고장 예측 모델을 제안하며, k-nearest neighbors 모델이 99.63%의 정확도, 99.59%의 F1-score, 99.67%의 재현율(recall)로 더 나은 성능을 달성하였다. k-nearest neighbors와 naive Bayes 두 모델의 성능은 정밀도(precision), 재현율(recall), F1-score, 정확도(accuracy)와 같은 다양한 성능 지표를 사용하여 평가하였다. 이 모델은 안전과 편의성을 제공하는 신뢰할 수 있고 연속적이며 안정적인 자동화 시스템으로, 자원을 절감하면서 스마트 오피스 직원의 업무 효율을 향상시킨다.
https://doi.org/10.1155/2023/9991029
Computer science
Automation
Naive Bayes classifier
Interface (matter)
The Internet
Real-time computing
Cloud computing
Embedded system
Arduino
Microcontroller
9
preprint
|
인용수 0
·
2023
ControlDreamer: Blending Geometry and Style in Text-to-3D
Yeongtak Oh, Jooyoung Choi, Yongsung Kim, Minjun Park, Chaehun Shin, Sungroh Yoon
arXiv (Cornell University)
최근의 텍스트-투-3D 생성 기술 발전은 3D 콘텐츠 제작의 자동화와 대중화를 크게 촉진해 왔다. 이러한 성과에 기반하여, 우리는 텍스트-투-3D 생성에서 기하 구조와 스타일을 혼합하는 현재 방법들의 한계를 해결하고자 한다. 우리는 신생 다중 시점 ControlNet을 제안하는데, 이는 엄선된 텍스트 말뭉치에서 생성한 데이터셋으로 학습된 깊이 인지(depth-aware) 다중 시점 확산 모델이다. 이후 다중 시점 ControlNet을 2단계 파이프라인인 ControlDreamer에 통합하여, 스타일화된 3D 모델을 텍스트의 지시에 따라 생성할 수 있도록 한다. 더불어 물체, 동물, 캐릭터를 포함하는 다양한 범주의 주제를 아우르는 3D 스타일 편집에 대한 포괄적 벤치마크를 제시하여, 다양한 3D 생성 연구를 더욱 촉진한다. 비교 분석 결과, 인간 평가 및 CLIP 점수 지표를 통해 확인된 바와 같이, 본 새로운 파이프라인은 기존 텍스트-투-3D 방법들보다 우수함을 보인다. 프로젝트 페이지: https://controldreamer.github.io
http://arxiv.org/abs/2312.01129
Stylized fact
Computer science
Pipeline (software)
Benchmark (surveying)
Range (aeronautics)
Automation
Pooling
Data science
Artificial intelligence
Cartography
10
article
|
인용수 18
·
2022
Tuberculosis Detection in Chest Radiographs Using Spotted Hyena Algorithm Optimized Deep and Handcrafted Features
Seifedine Kadry, Gautam Srivastava, V. Rajinikanth, Seungmin Rho, Yongsung Kim
Computational Intelligence and Neuroscience
인간에서의 폐 이상은 다양한 원인에 의해 지속적으로 증가하고 있으며, 조기 인지와 치료가 광범위하게 권고된다. 결핵(Tuberculosis, TB)은 폐 질환 중 하나이며, 발생률과 중증도가 높기 때문에 세계보건기구(World Health Organization, WHO)는 TB를 사망을 초래하는 주요 질환 상위 10대 질환에 포함시키고 있다. 임상 수준에서의 TB 탐지는 일반적으로 생의학 영상 기법을 사용하며, 흉부 X-선은 흔히 채택되는 영상 양식이다. 본 연구의 목적은 VGG-UNet을 기반으로 한 공동 분할 및 분류를 통해 X-선 영상에서 TB를 탐지하기 위한 자동화 절차를 개발하는 것이다. 제안된 기법의 다양한 단계는 (i) 영상 수집 및 리사이징, (ii) 심층 특징 채굴, (iii) 폐 영역의 분할, (iv) 국소 이진 패턴(local-binary-pattern, LBP) 생성 및 특징 추출, (v) 점박이 하이에나 알고리즘(spotted hyena algorithm, SHA)을 이용한 최적 특징 선택, (vi) 직렬 특징 연결, (vii) 분류 및 검증을 포함한다. 본 연구는 평가를 위해 3000장의 테스트 영상(건강군 1500장, TB 클래스 1500장)을 고려하였으며, 제안된 실험은 Matlab®을 사용하여 구현되었다. 본 연구는 사전 학습된 모델을 적용하여 X-선에서 TB를 탐지함으로써 정확도를 향상시켰고, 미세 트리 분류기를 통해 >99%의 분류 정확도를 달성하는 데 기여하였다.
https://doi.org/10.1155/2022/9263379
Artificial intelligence
Computer science
Pattern recognition (psychology)
Segmentation
Feature selection
Classifier (UML)
Feature extraction
Tuberculosis
Concatenation (mathematics)
Feature (linguistics)

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.