주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
·
인용수 1
·
2025Federated domain generalization with source knowledge preservation via discriminative ensembles
YongHoon Kang, Jee-Hyong Lee
IF 6.8 (2025)
Information Sciences
https://doi.org/10.1016/j.ins.2025.122804
Discriminative model
Generalization
Regularization (linguistics)
Benchmark (surveying)
Ensemble learning
Feature (linguistics)
Domain (mathematical analysis)
Adversarial system
Labeled data
2
Article
|
인용수 13
·
2023READSUM: Retrieval-Augmented Adaptive Transformer for Source Code Summarization
YunSeok Choi, CheolWon Na, Hyojun Kim, Jee-Hyong Lee
IF 3.4 (2023)
IEEE Access
코드 요약(Code summarization)은 소스 코드의 이해와 유지보수를 돕기 위해 소스 코드로부터 간단하면서도 유익한 요약을 자동으로 생성하는 과정이다. 본 논문에서는 소스 코드 SUMmarization을 위한 검색 보강(REtrieval-augmented) 적응형(ADaptive) 트랜스포머 모델인 READSUM을 제안하며, 이 모델은 추출적 접근과 생성적(추상적) 접근을 모두 결합한다. 제안된 모델은 입력 코드의 구조적 정보와 순차적 정보를 모두 고려하면서, 생성적 방식으로 코드 요약을 생성한다. 아울러 중요한 키워드의 출현 빈도를 높이기 위해 유사한 코드의 검색된 요약을 활용하는 추출적 접근도 함께 사용한다. 원래 코드와 검색된 유사 코드를 임베딩 계층 단계에서 효과적으로 결합하기 위해, 다중 헤드 자기어텐션(multi-head self-attention)을 통해 원래 코드와 검색된 코드의 증강 표현을 구한다. 또한 인코더 단계에서 표현에 대한 구조적 정보와 순차적 정보를 적응적으로 학습하는 자기어텐션 네트워크를 개발한다. 더 나아가 디코더 단계에서는 원래 코드와 검색된 요약 간의 관계를 포착하기 위한 퓨전(fusion) 네트워크를 설계한다. 이 퓨전 네트워크는 검색된 요약을 기반으로 요약 생성을 효과적으로 유도한다. 마지막으로 READSUM은 추출적 접근으로 중요한 키워드를 추출하고, 소스 코드의 구조적 정보와 순차적 정보를 모두 고려하는 생성적 접근을 통해 고품질 요약을 생성한다. 다양한 실험과 절제(ablation) 연구를 통해 READSUM의 우수성을 입증한다. 또한 생성된 요약의 품질을 평가하기 위해 인간 평가도 수행한다.
https://doi.org/10.1109/access.2023.3271992
Automatic summarization
Computer science
Transformer
Information retrieval
Electrical engineering
Voltage
Engineering
3
Article
|
·
인용수 17
·
2023Automatic Defect Classification Using Semi-Supervised Learning With Defect Localization
Yusung Kim, Jin-Seop Lee, Jee-Hyong Lee
IF 2.3 (2023)
IEEE Transactions on Semiconductor Manufacturing
자동 결함 분류(Automatic defect classification, ADC) 시스템은 반도체 제조 공정에서 필연적으로 발생하는 결함을 자동으로 분류한다. ADC는 반도체 칩 생산의 수율을 높이고 공정 중 사고를 예방하기 위한 결함 관리의 시작 단계이며, 결함 분류에는 많은 엔지니어의 인력이 필요하지만 ADC는 저비용으로 모든 결함을 분류하는 해답이 될 수 있다. ADC는 주사전자현미경(scanning electron microscopy, SEM)으로 촬영한 웨이퍼 표면의 결함 이미지를 활용한다. SEM 이미지는 결함의 웨이퍼 내 위치와 공정 단계에 따라 다양한 배경을 가질 수 있다. SEM 이미지의 수동 분류는 숙련된 엔지니어를 채용하는 데 따른 상당한 인건비를 필요로 한다. 최근의 ADC 연구에서 양호한 성능이 보고되었음에도 불구하고, 라벨이 없는 이미지의 부족과 다양한 배경은 실제 제조 공정에 ADC를 적용하기 어렵게 만든다. 이러한 문제를 해결하기 위해, 결함 위치지정(defect localization)을 포함한 자동 결함 분류를 본 연구에서 제안한다. 이를 위해 결함 위치지정을 활용하여 다양한 배경의 영향이 달라지는 효과를 감소시키도록, 분류 모델을 특히 설계한다. 결함 위치지정은 객체 탐지 모델을 사용하여 SEM 이미지에서 결함의 영역 정보를 제공한다. 우리는 라벨링 비용을 줄이기 위해 준지도 학습(semi-supervised learning)을 이용하여 분류 모델과 결함 탐지 모델을 설계하고자 하였다. 실험 결과, 감독학습 기반 모델과 비교하여 15개 초과 클래스에 대한 분류 성능이 12.56%(9.82%p) 향상됨을 나타냈다.
https://doi.org/10.1109/tsm.2023.3278036
Wafer
Artificial intelligence
Pattern recognition (psychology)
Computer science
Process (computing)
Contextual image classification
Semiconductor device fabrication
Machine learning
Computer vision
Engineering
4
Article
|
인용수 15
·
2022Deep Reinforcement Learning Approach for Material Scheduling Considering High-Dimensional Environment of Hybrid Flow-Shop Problem
Chang-Bae Gil, Jee-Hyong Lee
IF 2.7 (2022)
Applied Sciences
제조 현장에서는 제품을 효율적으로 생산하고 비용을 절감하기 위해 처리해야 하는 다양한 일정 수립 문제가 발생한다. 스마트 팩토리 기술의 발전에 따라 제조 현장의 많은 요소들이 무인화되고 더욱 복잡해졌다. 또한 하나의 생산 라인에서 여러 공정을 혼합하여 수행함에 따라, 자재의 효율적인 일정 수립에 대한 필요성이 대두되었다. 본 연구의 목적은 딥 강화학습을 사용하여 하이브리드 플로우숍 환경에서 다수 기계의 자재 일정 수립 문제를 해결하는 것이다. 기존 대부분의 연구는 실제 문제를 해결하는 데 중요했던 일부 조건을 무시해 왔다. 이러한 핵심 조건들은 일정을 더욱 복잡하고 풀기 어렵게 만든다. 그 결과 상태의 크기와 대규모 행동 공간이 확장되어, 다수의 기계가 있는 환경에서 학습이 어려워진다. 본 연구에서는 가공 시간 및 자재 이송과 같은 실용적 요인을 고려하는 강화학습 접근법을 개발하여 현실적인 제조 일정 수립 문제를 해결하였다. 아울러 고차원 환경 공간에서의 학습 문제를 해결하기 위해, 제조 현장에서 효율적인 학습을 위해 고차원 환경 공간을 단순화하는 방법을 확립하였다. 실험을 통해, 본 접근법이 다공정 라인에서의 자재 일정 수립을 최적으로 수행할 수 있음을 보였으며, 이는 현실적인 제조 지능에 기여한다.
https://doi.org/10.3390/app12189332
Computer science
Reinforcement learning
Flow shop scheduling
Scheduling (production processes)
Industrial engineering
Genetic algorithm scheduling
Job shop scheduling
Distributed computing
Schedule
Artificial intelligence
5
Article
|
인용수 22
·
2022Weighted Averaging Federated Learning Based on Example Forgetting Events in Label Imbalanced Non-IID
Mannsoo Hong, Seok–Kyu Kang, Jee-Hyong Lee
IF 2.7 (2022)
Applied Sciences
데이터 프라이버시를 중시하는 분산 학습 방법인 연합 학습(federated learning)은, 클라이언트로부터 로컬 지식을 집계하여 모델을 학습한다. 각 클라이언트는 자체 로컬 데이터셋을 수집하고 이를 활용하여 로컬 모델을 학습한다. 연결된 연합 학습 네트워크 내의 로컬 모델은 서버로 업로드된다. 서버에서는 로컬 모델들을 집계하여 전역 모델을 형성한다. 이 과정에서 어느 클라이언트에서도 로컬 데이터가 전송되거나 외부로 반출되지 않는다. 이러한 절차는 데이터 프라이버시를 보호할 수 있으나, 연합 학습은 중앙 집중식 학습보다 최악의 경우(example forgetting) 문제를 더 심각하게 나타낼 수 있다. 이 문제는 테스트 성능 저하로 나타난다. 본 연구에서는 연합 가중 평균(federated weighted averaging, FedWAvg)을 제안한다. FedWAvg는 각 클라이언트에서 잊혀지기 쉬운 예시(forgettable examples)를 식별하고, 가중치를 통해 로컬 모델의 균형을 재조정하는 데 그 정보를 활용한다. 잊혀지기 쉬운 예시가 더 많은 클라이언트를 더 높은 비중으로 가중함으로써, 해당 클라이언트가 더 잘 대표되며 전역 모델이 통상적으로 간과되던 클라이언트들로부터 더 많은 지식을 습득할 수 있다. FedWAvg는 예시 망각 문제를 완화하고 더 나은 성능을 달성한다. SVHN 및 CIFAR-10 데이터셋에 대한 우리의 실험은 제안 방법이 비-IID 설정에서 기존 연합 학습 알고리즘에 비해 향상된 성능을 보이며, 또한 예시 망각 문제를 완화할 수 있음을 보여준다.
https://doi.org/10.3390/app12125806
Forgetting
Computer science
Upload
Federated learning
Weighting
Process (computing)
Artificial intelligence
Machine learning
Data mining
World Wide Web