기본 정보
연구 분야
프로젝트
발행물
구성원
연구 영역
대표 연구 분야
연구실이 가장 잘하는 대표 연구 분야
1

자연언어처리와 언어이해 기술

강상우 연구실의 핵심 축은 자연언어처리 기반의 언어이해 기술 개발이다. 연구실은 문장, 문서, 대화와 같은 다양한 언어 데이터를 기계가 정확하게 해석하고 활용할 수 있도록 하는 모델링에 집중하며, 특히 실제 환경에서 발생하는 비정형 텍스트와 최신 이슈를 반영한 동적 언어 데이터를 다루는 데 강점을 보인다. 이는 전통적인 정제 데이터셋 중심 접근을 넘어, 현실 세계의 언어 변화와 도메인 다양성에 대응하는 실용적 자연언어처리 기술을 지향한다. 구체적으로 연구실은 개체명 인식, 단어 의미 중의성 해소, 기계독해와 같은 세부 과제를 지속적으로 수행해 왔다. 소셜 미디어 개체명 인식, contemporary written texts에 대한 적응형 NER, 대규모 단어 의미 분류, 약지도 데이터의 품질 향상을 통한 기계독해 성능 개선 연구는 이 연구실의 대표적인 성과들이다. 이러한 연구는 사전학습 언어모델, 임베딩, 시퀀스 라벨링, 문맥 기반 의미 추론, 데이터 검증 기법 등을 결합하여 언어이해 성능과 일반화 능력을 함께 높이는 방향으로 발전해 왔다. 이 연구는 한국어를 포함한 실제 서비스형 언어 AI 구축에 직접 연결된다는 점에서 의미가 크다. 정확한 개체명 인식은 검색, 질의응답, 정보추출, 디지털 비서의 기반이 되며, 의미 중의성 해소와 기계독해는 고도화된 언어 추론 시스템으로 확장될 수 있다. 연구실이 관련 경진대회와 논문에서 꾸준히 성과를 내고 있다는 점은 이 분야에서의 기술 축적과 응용 가능성을 보여주며, 향후 대규모 언어모델 기반 한국어 이해 시스템과 산업 현장 적용으로 이어질 가능성이 높다.

자연언어처리개체명인식기계독해의미중의성해소언어이해
2

약지도 학습과 지식기반 데이터 구축

이 연구실은 라벨이 부족하거나 품질이 불완전한 환경에서 고성능 인공지능을 구현하기 위한 약지도 학습과 데이터 증강 기술을 중요한 연구 주제로 다루고 있다. 자연언어처리 분야에서는 충분한 수작업 주석 데이터를 확보하는 비용이 매우 크기 때문에, 실제 환경에서는 원거리 지도학습, 약한 라벨링, 자동 코퍼스 구축과 같은 접근이 필수적이다. 연구실은 이러한 한계를 해결하기 위해 지식베이스, 위키피디아, 웹 데이터 등 외부 자원을 활용한 데이터 생성 및 보정 방법을 체계적으로 연구해 왔다. 대표적으로 소셜 미디어 개체명 인식을 위한 weakly labeled data augmentation, contemporary texts를 위한 distant supervision 기반 NER, 지식베이스를 활용한 개체명 인식 코퍼스 생성 특허 등은 연구실의 강한 데이터 중심 AI 역량을 보여준다. 또한 약지도 데이터의 노이즈를 줄이기 위한 데이터 검증, 문맥 적합성 판단, 신뢰도 향상 기법을 통해 단순히 데이터를 많이 확보하는 것에 그치지 않고 학습 효율과 모델 강건성을 함께 높이는 방향을 추구한다. 등록 특허들 역시 개체명 인식 모델 생성, 코퍼스 구축, 전이학습 기반 핵심자질 학습 등 데이터와 모델을 함께 최적화하는 연구 전략을 반영한다. 이러한 연구는 현실 문제 해결에 매우 직접적인 가치를 갖는다. 산업 현장에서는 빠르게 변화하는 용어, 신조어, 인물명, 기관명, 제품명 등을 즉시 반영해야 하므로 수작업 라벨링만으로는 대응이 어렵다. 연구실의 접근은 적은 비용으로 최신성을 반영한 학습 데이터를 생산하고, 이를 바탕으로 실제 서비스 수준의 언어 AI를 구현할 수 있게 한다. 향후 이 연구는 한국어 특화 언어자원 구축, 도메인 적응형 언어모델, 저자원 분야 자동 주석 시스템으로 더욱 확장될 수 있다.

약지도학습원거리지도학습데이터증강지식베이스코퍼스구축
3

설명가능한 멀티모달 대화형 인공지능

강상우 연구실은 텍스트 중심 자연언어처리를 넘어 시각, 음성, 언어를 통합적으로 이해하는 설명가능한 멀티모달 대화형 인공지능 시스템 개발에도 집중하고 있다. 관련 대형 프로젝트에서 연구실은 인간과 유사한 방식으로 소통할 수 있는 AI를 목표로, 다양한 입력 양식을 동시에 처리하고 그 결과를 자연어로 설명할 수 있는 대화 시스템을 연구하고 있다. 이는 단순한 응답 생성이 아니라, 어떤 정보에 근거하여 답변이 생성되었는지까지 제시하는 신뢰 가능한 AI를 지향한다. 이 분야의 연구는 멀티모달 멀티태스크 학습, 자연어 기반 설명 생성, 대화 맥락 추적, 응답 근거 제시 기술을 포함한다. AAAI 발표 성과인 interpretable multimodal dialogue system 연구는 이러한 방향성을 잘 보여주며, 언어모델과 멀티모달 표현학습, 설명가능한 인공지능 기법을 연결하는 융합 연구로 이해할 수 있다. 최근에는 거대언어모델과 mixture-of-experts, self-speculative decoding 같은 효율적 추론 기술과도 접점을 형성하고 있어, 고성능 대화형 AI의 실시간성과 해석 가능성을 동시에 확보하려는 시도가 이어지고 있다. 설명가능한 멀티모달 대화 기술은 교육, 상담, 의료 보조, 공공 서비스, 지능형 에이전트 등 다양한 영역에 적용될 수 있다. 특히 사용자가 AI의 판단 근거를 이해할 수 있어야 하는 환경에서는 성능 못지않게 설명성과 투명성이 중요하다. 연구실의 접근은 인간 중심 AI, 신뢰 가능한 AI, 복합지능 시스템이라는 최근 연구 흐름과 밀접하게 맞닿아 있으며, 향후 멀티모달 한국어 대화모델, 상호작용형 에이전트, 실제 서비스형 AI 플랫폼으로 확장될 가능성이 크다.

멀티모달대화형인공지능설명가능한AI복합지능언어모델