기존의 비지도 도메인 적응(UDA)은 소스 데이터 및/또는 소스 모델 파라미터에 접근이 필요하므로, 개인정보 보호, 보안, 지적 재산권 측면에서 실용적 적용이 제한된다. 최근의 블랙박스 UDA(BDA)는 단일 캡슐화된 소스 응용 프로그램 프로그래밍 인터페이스(API) 예측으로부터 의사 레이블을 정의함으로써 이러한 제약을 완화하여, 타깃 모델에 대한 자기학습이 가능해진다. 그럼에도 불구하고 기존 방법들은 다중 소스 설정을 고려하는 데 한계가 있는데, 이 설정에서는 여러 소스 도메인 API가 존재하여 의사 레이블을 생성할 수 있다. 본 연구에서는 다중 소스 BDA(MSBDA)를 위한 새로운 학습 프레임워크인 Label Space-Induced Pseudo Label Refinement(LPR)을 제안한다. 구체적으로 LPR은 소스 API의 예측만을 사용하여 타깃 도메인에 조건화된 상태에서 소스 도메인들 간의 관계를 학습하는 Pseudo label Refinery Network(PRN)를 포함한다. 타깃 모델은 PRN의 두 단계(dual phases)에 의해 적응된다. 첫째, 예측에 포함된 잡음 샘플로 인한 실패를 방지하고 초기 의사 레이블을 제공하기 위한 웜업(warm-up) 단계를 목표로 하며, 이어서 도메인 관계 탐색을 수행하는 레이블 정제(label refinement) 단계를 진행한다. LPR의 메커니즘에 대해 이론적 근거를 제공한다. 네 개의 벤치마크 데이터셋에 대한 실험 결과는, LPR을 사용하는 MSBDA가 서로 다른 DA 설정에서 최신 접근법들과 비교 가능한 성능을 달성함을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.