거대 언어모델 기반 정보검색 및 질의 재작성
이 연구 주제는 거대 언어모델(LLM)을 활용해 사용자의 질의를 더 정확하고 풍부한 형태로 재구성함으로써 정보검색 성능을 높이는 데 초점을 둔다. 최근 검색 시스템은 단순 키워드 일치에서 벗어나 문맥과 의도를 이해하는 방향으로 발전하고 있으며, 연구실은 이러한 흐름 속에서 질의 재작성, 검색 보강, 검색-생성 결합 구조를 핵심 문제로 다루고 있다. 특히 사용자가 불완전하거나 모호한 질의를 입력했을 때도 검색 시스템이 필요한 정보를 안정적으로 찾아낼 수 있도록 하는 방법을 연구한다. 대표적으로 구조화된 질의 재작성 방법은 질의 개념 이해, 질의 유형 식별, 기대 정답 추출과 같은 단계를 통해 검색에 필요한 정보를 체계적으로 구성한다. 이는 기존의 LLM 내부 파라미터에만 의존하는 방식보다 덜 익숙한 도메인에서도 더 강건한 성능을 보일 수 있으며, 사실 오류를 줄이고 검색 적합도를 높이는 데 유리하다. 또한 검색증강생성(RAG) 환경에서 질의 자체를 개선함으로써 후속 생성 결과의 품질과 신뢰성을 함께 끌어올리는 방향으로 확장된다. 이 연구는 범용 웹 검색뿐 아니라 금융, 의료, 공공 데이터처럼 전문 지식과 정확성이 중요한 영역에서 특히 큰 가치를 가진다. 향후에는 외부 지식원과 연동되는 질의 계획 수립, 사용자 의도 추론, 멀티홉 검색, 실시간 지식 갱신을 포함한 차세대 검색 인터페이스로 발전할 가능성이 크다. 따라서 본 연구는 LLM 시대의 검색 시스템을 더욱 설명 가능하고 신뢰 가능하게 만드는 핵심 기반 기술로 볼 수 있다.
외부 메모리와 지식 증강 생성
이 연구 주제는 거대 언어모델이 내부 파라미터에 저장된 지식만으로는 한계가 있다는 문제의식에서 출발한다. 연구실은 모델 내부 지식과 외부 지식을 분리하여 관리하고, 필요할 때 외부 메모리를 동적으로 불러와 활용하는 플러그인형 지식 증강 구조를 연구하고 있다. 이는 모델이 최신 정보나 도메인 특화 지식을 보다 유연하게 반영하도록 하며, 정적인 언어모델이 갖는 지식 노후화 문제를 완화하는 데 중요하다. 핵심은 외부 메모리를 단순한 데이터 저장소가 아니라, 질의에 맞추어 선택적으로 연결되고 분리될 수 있는 모듈형 지식 자원으로 설계하는 데 있다. 이를 위해 연구실은 사용자의 질문을 분석하여 어떤 외부 지식을 호출해야 하는지 판단하고, 검색된 정보를 내부 추론 과정과 충돌 없이 통합하는 메커니즘을 다룬다. 특히 지식 충돌 방지, 정보 통합, 도메인별 메모리 구성, 검색 결과의 신뢰도 제어와 같은 문제가 중요한 연구 대상이 된다. 이러한 접근은 환각 현상 감소, 최신성 확보, 도메인 적응성 향상이라는 측면에서 매우 실용적이다. 금융, 의료, 법률처럼 정답의 근거와 최신 정보가 중요한 분야에서 외부 메모리 기반 LLM은 높은 활용 가능성을 보인다. 장기적으로는 개인화된 메모리, 기관별 지식 플러그인, 멀티모달 외부 지식 연계로 확장될 수 있으며, 연구실의 방향성은 신뢰 가능한 지식 활용형 AI를 구현하는 데 중요한 역할을 한다.
의료 문서 요약 및 평가를 위한 자연어처리
이 연구 주제는 의료 문서의 복잡한 내용을 자동으로 요약하고, 생성된 요약의 품질을 신뢰성 있게 평가하는 자연어처리 기술에 관한 것이다. 의료 텍스트는 전문 용어가 많고 사실 정확성이 매우 중요하기 때문에 일반적인 요약 모델이나 평가 지표를 그대로 적용하기 어렵다. 연구실은 이러한 특수성을 반영하여 의료 문서 환경에 적합한 요약 평가 방법과 표현 학습 방식을 개발하고 있다. 특히 참고 요약문이 없는 상황에서도 품질을 평가할 수 있는 reference-free 방식은 실제 의료 현장에서 매우 유용하다. 대조학습을 활용한 평가 모델은 의료 텍스트에 특화된 데이터 증강 기법을 통해 좋은 요약과 나쁜 요약을 구분하는 표현 공간을 학습하며, 자동 평가 결과가 인간 전문가 판단과 더 잘 일치하도록 설계된다. 이는 의료 요약 시스템의 성능 비교, 품질 관리, 실제 배포 전 검증 단계에서 중요한 역할을 한다. 이 연구는 단순히 평가 지표 하나를 제안하는 데 그치지 않고, 의료 AI의 신뢰성 확보라는 더 큰 목표와 연결된다. 향후에는 진료기록, 판독문, 임상 요약, 환자 안내문 등 다양한 의료 문서로 적용 범위가 확대될 수 있으며, 요약 생성 모델과 평가 모델을 함께 최적화하는 방향으로 발전할 수 있다. 연구실의 접근은 의료 자연어처리의 실용성과 안전성을 동시에 강화하는 데 기여한다.
의견 추출과 문맥 이해를 위한 자연어 이해
이 연구 주제는 텍스트 안에서 특정 대상에 대한 의견 표현을 정확히 찾아내는 세밀한 자연어 이해 기술을 다룬다. 대상 지향 의견 단어 추출은 문장에서 어떤 대상이 언급되었을 때 그 대상에 대응하는 감정이나 평가 표현을 식별하는 과제이며, 리뷰 분석, 고객 의견 수집, 여론 분석 등 다양한 응용 분야에서 중요하다. 연구실은 이러한 과제를 해결하기 위해 대상 정보와 주변 문맥의 관계를 동시에 모델링하는 접근을 발전시켜 왔다. 특히 인코더-디코더 구조, 관계 정보 활용, 게이트 메커니즘, 사전학습 언어모델 결합 등을 통해 단순한 단어 수준 매칭을 넘는 정교한 문맥 해석을 시도한다. 대상 자체의 의미뿐 아니라 인접 단어들 사이의 관계, 문장 구조, 국소 문맥이 의견 표현을 결정하는 핵심 요소이므로, 이를 동적으로 통합하는 모델 설계가 중요하다. 이러한 연구는 자연어 이해의 기본 문제인 의미 연결과 문맥 기반 추론 능력을 높이는 데 직접적으로 기여한다. 이 연구의 성과는 감성 분석 고도화, 고객 피드백 자동 분석, 상품 및 서비스 품질 모니터링, 소셜미디어 의견 탐지 등으로 확장될 수 있다. 또한 최근의 LLM 기반 시스템과 결합하면 설명 가능한 감성 추론, 세부 속성 단위 의견 분석, 다국어 의견 추출로도 발전 가능하다. 연구실은 자연어처리의 응용성과 모델링 정교함을 함께 추구하며, 실제 텍스트 데이터에서 유용한 의미를 구조적으로 추출하는 기술 기반을 구축하고 있다.