본 논문은 분자 물성 예측 과제의 성능을 향상시키는 새로운 적대적 데이터 증강 기법을 제안한다. 제안된 방법인 Adversarial Augmentation to Influential Sample (AAIS)는 전통적인 증강 기법이 종종 효과적이지 않은 다중 과제(multitask) 시나리오에서 불균형 데이터가 포함된 분류 문제를 다룬다. 데이터 증강은 분포 강건 최적화(distributionally robust optimization)를 통해 수행되므로, 사용 가능한 데이터의 양과 과제 수에 대한 성능 의존도가 낮다. 특히, 영향함수(influence function)를 사용하여 모델 훈련에 유의미한 영향을 주는 데이터 지점을 식별하는 적응형 증강을 고안하였다. 우리는 이러한 데이터 지점이 의사결정 경계(decision boundary) 근처에 위치함을 발견했으며, 적응형 증강이 의사결정 경계를 국소적으로 평탄화하여 예측의 강건성을 유도한다. 제안 방법은 분자 구조 기반 물성 예측에 흔히 사용되는 벤치마크 데이터셋을 통해 평가하였다. 그 결과, 개발된 적응형 적대적 증강 접근법이 AUC에서 1%–15%, F1-score에서 1%–35% 범위로 모델 예측 성능을 효과적으로 향상시키는 것을 확인하였다. 또한 본 방법은 영향력 있는 그래프 특성을 증강함으로써 클래스 불균형 문제를 효과적으로 해결하고 그래프 수준(graph-level) 과제에서 성능을 향상시킨다. 이러한 결과는 AAIS가 특히 복잡하거나 불균형이 존재하는 분자 예측 과제에서 모델의 일반화 능력과 정확도를 향상시키기 위한 유연한 도구를 제공함을 시사한다. • 분자 물성 예측에서 데이터 증강을 튜닝하기 위한 프레임워크를 제안한다. • 새로운 단일 단계(one-step) 영향함수를 설계한다. • 단일 단계 영향함수는 모델 훈련 중 데이터를 평가하는 것을 가능하게 한다. • 본 방법은 Graph Neural Networks로 모델 성능을 향상시키는 데 대한 통찰을 제공한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.