주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 1
·
2025Adaptive adversarial augmentation for molecular property prediction
Soyoung Cho, Sungchul Hong, Jong‐June Jeon
IF 7.5 (2025)
Expert Systems with Applications
본 논문은 분자 물성 예측 과제의 성능을 향상시키는 새로운 적대적 데이터 증강 기법을 제안한다. 제안된 방법인 Adversarial Augmentation to Influential Sample (AAIS)는 전통적인 증강 기법이 종종 효과적이지 않은 다중 과제(multitask) 시나리오에서 불균형 데이터가 포함된 분류 문제를 다룬다. 데이터 증강은 분포 강건 최적화(distributionally robust optimization)를 통해 수행되므로, 사용 가능한 데이터의 양과 과제 수에 대한 성능 의존도가 낮다. 특히, 영향함수(influence function)를 사용하여 모델 훈련에 유의미한 영향을 주는 데이터 지점을 식별하는 적응형 증강을 고안하였다. 우리는 이러한 데이터 지점이 의사결정 경계(decision boundary) 근처에 위치함을 발견했으며, 적응형 증강이 의사결정 경계를 국소적으로 평탄화하여 예측의 강건성을 유도한다. 제안 방법은 분자 구조 기반 물성 예측에 흔히 사용되는 벤치마크 데이터셋을 통해 평가하였다. 그 결과, 개발된 적응형 적대적 증강 접근법이 AUC에서 1%–15%, F1-score에서 1%–35% 범위로 모델 예측 성능을 효과적으로 향상시키는 것을 확인하였다. 또한 본 방법은 영향력 있는 그래프 특성을 증강함으로써 클래스 불균형 문제를 효과적으로 해결하고 그래프 수준(graph-level) 과제에서 성능을 향상시킨다. 이러한 결과는 AAIS가 특히 복잡하거나 불균형이 존재하는 분자 예측 과제에서 모델의 일반화 능력과 정확도를 향상시키기 위한 유연한 도구를 제공함을 시사한다. • 분자 물성 예측에서 데이터 증강을 튜닝하기 위한 프레임워크를 제안한다. • 새로운 단일 단계(one-step) 영향함수를 설계한다. • 단일 단계 영향함수는 모델 훈련 중 데이터를 평가하는 것을 가능하게 한다. • 본 방법은 Graph Neural Networks로 모델 성능을 향상시키는 데 대한 통찰을 제공한다.
https://doi.org/10.1016/j.eswa.2025.126512
Computer science
Property (philosophy)
Adversarial system
Artificial intelligence
Machine learning
2
article
|
·
인용수 1
·
2025Variational autoencoder for distributional learning via quantile function estimation
Seunghwan An, Sungchul Hong, Jong‐June Jeon
IF 6.3 (2025)
Neural Networks
https://doi.org/10.1016/j.neunet.2025.107956
Autoencoder
Quantile
Artificial intelligence
Estimation
Computer science
Function (biology)
Pattern recognition (psychology)
Artificial neural network
Mathematics
Machine learning
3
article
|
인용수 5
·
2025Improving SMOTE via fusing conditional VAE for data-adaptive noise filtering
Sungchul Hong, Seunghwan An, Jong‐June Jeon
IF 3.5 (2025)
Applied Intelligence
최근의 생성적 신경망 모델의 발전은 데이터 증강 방법의 개발을 확장해 왔다. 그러나 현대적 생성 모델에 기반한 증강 방법은, 기존 모델인 Synthetic Minority Oversampling Technique (SMOTE)에 비해 클래스 불균형 데이터에서 두드러진 개선을 달성하지 못한다. 본 연구는 불균형 분류를 위한 생성 모델의 문제를 조사하고, Variational Autoencoders (VAE s)를 사용하여 SMOTE 알고리즘을 향상시키는 프레임워크를 제안한다. 우리의 접근법은 VAE를 통해 저차원 잠재 공간에서 데이터 포인트의 밀도를 체계적으로 정량화하는 한편, 클래스 라벨 정보와 분류 난이도 정보를 동시에 통합한다. 그다음 증강을 저하시킬 가능성이 있는 데이터 포인트를 체계적으로 제외하고, 데이터 공간에서 인접 관측치를 직접 증강한다. 여러 불균형 데이터셋에 대한 경험적 연구는, 이러한 단순한 과정이 딥러닝 모델에 비해 기존 SMOTE 알고리즘을 혁신적으로 개선함을 보여준다. 따라서 소수의 데이터 포인트를 가진 불균형 분류 문제에서, 소수(minority) 데이터의 선택과 데이터 공간에서의 보간이 유익하다는 결론을 내린다.
https://doi.org/10.1007/s10489-025-06692-y
Computer science
Noise (video)
Artificial intelligence
Pattern recognition (psychology)
Data mining
4
article
|
인용수 7
·
2024Interpretable water level forecaster with spatiotemporal causal attention mechanisms
Sungchul Hong, Yunjin Choi, Jong‐June Jeon
IF 7.1 (2024)
International Journal of Forecasting
하천 수위의 정확한 예측은 교통 흐름을 효율적으로 관리하고 자연재해와 관련된 위험을 완화하는 데 필수적이다. 본 과제는 하천의 흐름에 영향을 미치는 복잡한 요인들로 인해 여러 가지 어려움이 존재한다. 최근 기계학습의 발전은 다수의 효과적인 예측 방법을 제시해 왔다. 그러나 이러한 방법들은 복잡한 구조로 인해 해석 가능성이 부족하며, 그 결과 신뢰성이 제한된다. 이러한 문제를 해결하기 위해 본 연구는 수위 예측에 중점을 둔, 해석 가능성을 정량화하는 딥러닝 모델을 제안한다. 이 모델은 입력 데이터에 내재된 일반적인 지식과 부합하는 정량적 해석 가능성 측정치를 생성하는 데 초점을 둔다. 이를 위해 마스킹을 의도적으로 도입한 목적의 트랜스포머 아키텍처와, 시공간적 인과성을 포착하는 다층 네트워크의 활용을 통해 가능하게 한다. 우리는 2016년부터 2021년까지 대한민국 서울에서 얻은 한강 데이터셋에 대해 비교 분석을 수행하였다. 그 결과, 본 접근법은 일반적인 지식과 일치하는 향상된 해석 가능성을 제공하며, 경쟁 방법을 능가함을 보여주었다. 또한 본 접근법은 분포 변화(distribution shift)에 대한 견고성도 향상시킨다.
https://doi.org/10.1016/j.ijforecast.2024.10.003
Econometrics
Computer science
Economics
5
article
|
인용수 4
·
2023Customization of latent space in semi-supervised Variational AutoEncoder
Seunghwan An, Jong‐June Jeon
IF 3.9 (2023)
Pattern Recognition Letters
우리는 Variational AutoEncoder(VAE)의 새로운 반지도 학습 방법을 제안하며, 이를 통해 EXplainable encoder Network(EXoN)를 사용하여 맞춤형 잠재 공간을 산출한다. 이러한 맞춤형화는 근접성(proximity)과 같은 수동 설계를 통해 보간(interpolation)과 구조적 제약을 구성하는 방식으로 이루어지며, 이는 잠재 공간의 해석가능성을 향상시킨다. 분류 성능을 개선하기 위해 SCI(Soft-label Consistency Interpolation)라는 새로운 반지도 분류 방법을 도입한다. 설명 가능한 잠재 공간을 구성하는 데에는 분류 손실과 Kullback–Leibler 발산의 결합이 핵심이다. 또한 생성된 샘플의 변동성은 능동 잠재 부분공간(active latent subspace)에 의해 결정되며, 이는 서로 구별되는 특징을 효과적으로 포착한다. 우리는 MNIST, SVHN 및 CIFAR-10 데이터셋을 사용하여 실험을 수행하였고, 그 결과 본 접근법이 해석 가능한 잠재 공간을 제공함과 동시에 잠재 공간 내 표현 패턴을 분석하는 데 필요한 노력을 유의미하게 감소시킨다는 것을 보여준다.
https://doi.org/10.1016/j.patrec.2023.11.018
Autoencoder
Computer science
Artificial intelligence
MNIST database
Interpolation (computer graphics)
Latent variable
Space (punctuation)
Representation (politics)
Subspace topology
Divergence (linguistics)