생명과학 분야의 인공지능 응용 중 하나인 지식 집약형 질의응답은, 이 분야에서 도메인 전문성이 특히 중요하다는 점에 주목하여, 사전학습된 언어 모델에 생의학 지식을 효율적으로 주입하는 방법을 제안하며, 궁극적으로 생의학 질의응답을 목표로 한다. 대규모 지식 그래프의 모든 의미를 전체 모델에 이전하는 것은 너무 많은 파라미터를 필요로 하여 계산 비용과 시간을 증가시킨다. 본 연구는 어댑터를 활용하여 사전학습된 언어 모델에 Unified Medical Language System 지식을 주입하는 효율적인 접근법을 조사하고, 지식 그래프에서 모든 의미를 사용할 필요가 있는지에 의문을 제기한다. 본 연구는 지식 그래프를 분할하고, 보다 효율적인 사전학습을 위해 일부를 폐기하거나 병합하는 전략에 초점을 둔다. 세 개의 생의학 질의응답 파인튜닝 데이터셋에 대한 결과에 따르면, 의미적으로 분할된 그룹에 대해 사전학습된 어댑터는 평가 지표, 필요한 파라미터 수, 시간 측면에서 더 효율적인 성능을 보였다. 또한 결과는 개념 수가 더 적은 그룹을 폐기하는 것이 소규모 데이터셋에 더 나은 방향이며, 이러한 그룹을 병합하는 것이 대규모 데이터셋에 더 적합하다는 점을 보여준다. 더 나아가 지표 결과는 약간의 개선을 나타내어, 어댑터 방법론이 그룹 구성 방식에 대해 비교적 둔감함을 시사한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.