한양대학교 컴퓨터소프트웨어학부 김은솔 교수
김은솔 연구실은 Transformer 기반 시각 인지 모델과 지식 연계 추론을 중심으로 연구를 수행합니다. 멀티스케일 표현과 deformable attention을 이용해 사람-물체 상호작용 탐지, 비디오 장면 경계 인식, 효율적 VideoQA를 학습합니다. 또한 spatiotemporal 구조와 self-supervised pretext task를 통해 장기 비디오의 합성 의미 구조를 분해·해석하는 방법을 개발합니다. 아울러 ConceptNet 등 외부 지식에 그래프 변환기를 결합하고 멀티모달 대화에서 텍스트-시각 정렬을 강화합니다. 일부 연구에서는 유기 멤리스터 기반 뉴로모픽 시냅스 가소성으로 조합 최적화 하드웨어를 구현합니다.
5개년 연도별 논문 게재 수
5개년 연도별 피인용 수