주요 논문
3
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Preprint
|
인용수 9
·
2024Proxy-based Item Representation for Attribute and Context-aware Recommendation
Jinseok Seol, Minseok Gang, Sang‐goo Lee, Jaehui Park
추천 시스템에서의 신경망 기반 접근은 대규모 항목 집합을 학습 가능한 벡터 임베딩 테이블로 표현함으로써 놀라운 성과를 보였다. 그러나 드문 항목은 충분한 학습 기회를 갖지 못해 의미 있는 표현을 학습하기 어려울 수 있다. 본 연구에서는 속성 및 맥락을 고려하는 설정에서 드문 항목의 충분히 학습되지 않은 임베딩이 추천 정확도를 저하시킨다는 점을 확인한다. 이러한 문제를 해결하기 위해, 각 항목을 학습 가능한 프록시 임베딩들의 가중 합으로 표현할 수 있게 하는 프록시 기반 항목 표현을 제안한다. 여기서 프록시의 가중치는 각 항목의 속성과 맥락에 의해 결정되며, 빈번한 항목의 경우 협업 신호를 보다 잘 반영하기 위해 편향 항(bias term)을 포함할 수 있다. 프록시 기반 방법은 항목 표현을 조합적으로(compositionally) 계산하여 각 표현이 잘 학습된 심플렉스(simplex) 내부에 위치하도록 보장하며, 따라서 품질이 담보된다. 또한 모든 항목에 걸쳐 프록시 임베딩을 공유함으로써, 드문 항목은 통일된 모델 구조 내에서 빈번한 항목의 학습 신호를 엔드투엔드 방식으로 차용할 수 있다. 제안하는 방법은 플러그앤플레이 방식의 모델로서, 어떤 신경망 기반 추천 모델이든 항목 인코딩 레이어를 대체할 수 있으며, 훨씬 더 적은 파라미터 사용으로도 일관되게 추천 성능을 향상시킨다. 실제 추천 벤치마크 데이터셋에서 수행한 실험 결과, 본 모델은 10%의 파라미터만 사용하면서도 추천 정확도 면에서 기존 최첨단 모델을 최대 17%까지 능가함을 보여주었다.
https://doi.org/10.1145/3616855.3635824
Computer science
Proxy (statistics)
Recommender system
Embedding
Collaborative filtering
Artificial neural network
Benchmark (surveying)
Artificial intelligence
Machine learning
Set (abstract data type)
2
Article
|
인용수 33
·
2022Retrieval-Augmented Response Generation for Knowledge-Grounded Conversation in the Wild
Yeonchan Ahn, Sang‐goo Lee, Junho Shim, Jaehui Park
IF 3.9 (2022)
IEEE Access
인터넷 사용자들은 흥미로운 사실이나 주제에 관한 대화를 나누면서 웹으로부터 다양한 지식을 함께 접하는 경우가 흔하다. 그러나 기존의 대부분 지식 기반 대화 모델은 대화의 주제와 관련하여 오직 단일 문서만을 고려한다. 최근 제안된 검색 증강(retrieval-augmented) 모델들은 다수의 문서에 기반하여 응답을 생성하지만, 주어진 주제를 무시하고 대화의 국소적 문맥(local context)만을 사용한다. 이를 위해 본 연구는 주제와 대화의 국소적 문맥 모두와 관련 있는 적절한 범위의 문서를 검색하여 이를 지식 기반 응답 생성에 활용하는 새로운 검색 증강 응답 생성 모델을 제안한다. 우리의 모델은 먼저 전체 대화에서 추출한 주제 단어(topic words)와 응답 이전의 토큰(tokens)을 모두 입력으로 받아 여러 표상(representations)을 산출한다. 그 다음 대화와 문서 인코더에서 각각 처음 N 토큰의 표상과 대화의 키워드 및 문서에서의 키워드 표상을 선택하고, 대화의 표상 그룹을 문서의 표상 그룹과 각각 비교한다. 학습을 위해서는 정답 지식(ground truth knowledge) 없이도 모델이 지식 기반 응답을 생성하도록 유도하는 새로운 데이터 가중치(data-weighting) 방식을 도입한다. 대규모 데이터셋을 사용한 자동 및 사람 평가 결과는, 제안한 모델이 기존 최신(state-of-the-art) 모델에 비해 보다 더 지식이 풍부하고 다양하며 관련성 높은 응답을 생성할 수 있음을 보여준다.
https://doi.org/10.1109/access.2022.3228964
Conversation
Computer science
Context (archaeology)
Security token
Information retrieval
Representation (politics)
Natural language processing
Artificial intelligence
The Internet
World Wide Web
3
Article
|
인용수 6
·
2020Exploiting Text Matching Techniques for Knowledge-Grounded Conversation
Yeonchan Ahn, Sang‐goo Lee, Jaehui Park
IF 3.367 (2020)
IEEE Access
지식 기반 대화 모델은 외부 지식에 근거하여 주어진 대화 맥락에 대해 유익한 응답을 생성하는 것을 목표로 한다. 유익하고 맥락에 부합하는 응답을 생성하기 위해서는 대화 맥락과 외부 지식을 균형 있게 결합(conjugate)하는 것이 중요하다. 그러나 기존 연구들은 외부 지식원에서 적절한 지식 문장을 찾는 문제를, 정확한 대화 행위(dialogue acts)를 갖는 적절한 문장을 생성하는 문제보다 상대적으로 덜 주목해 왔다. 본 논문에서는 두 가지 지식 선택 전략을 제안한다: 1) Reduce-Match 및 2) Match-Reduce. 그리고 각 전략에 기반한 여러 신경 지식 기반 대화 모델을 탐색한다. Reduce-Match 전략에 기반한 모델은 먼저 전체 대화 맥락을 중요 특징이 보존된 단일 벡터로 압축(distill)한 다음, 이 맥락 벡터를 지식 문장들의 표현과 비교하여 관련된 지식 문장을 예측한다. Match-Reduce 전략에 기반한 모델은 먼저 맥락의 각 발화를 지식 문장과 매칭(match)하여 세밀한 상호작용을 포착하고, 정보 손실을 최소화하면서 이를 집계하여 지식 문장을 예측한다. 실험 결과는 각 지식 선택 전략을 사용하는 대화 모델이 지식 선택 정확도뿐 아니라 응답 생성 성능에서도 경쟁 기준선(competitive baselines)보다 우수함을 보여준다. 또한 Match-Reduce를 기반으로 한 최우수 모델은 Wizard of Wikipedia 데이터셋을 대상으로 한 비교 실험에서 기준선들을 능가한다. 아울러 Reduce-Match를 기반으로 한 최우수 모델은 CMU Document Grounded Conversations 데이터셋에서 기준선들을 능가한다.
https://doi.org/10.1109/access.2020.3007893
Conversation
Computer science
Matching (statistics)
Natural language processing
Psychology
Communication