RnDCircle Logo
강상우 연구실
가천대학교 AI∙소프트웨어학부
강상우 교수
기본 정보
연구 분야
프로젝트
발행물
구성원

강상우 연구실

가천대학교 AI∙소프트웨어학부 강상우 교수

강상우 연구실은 자연언어처리와 인공지능을 중심으로 개체명 인식, 기계독해, 단어 의미 중의성 해소, 약지도 학습, 지식기반 코퍼스 구축, 설명가능한 멀티모달 대화형 AI를 연구하며, 실제 환경의 비정형 언어 데이터와 저자원 문제를 해결하는 실용적 언어지능 기술 개발에 강점을 가진다.

대표 연구 분야
연구 영역 전체보기
자연언어처리와 언어이해 기술 thumbnail
자연언어처리와 언어이해 기술
주요 논문
5
논문 전체보기
1
article
|
gold
·
인용수 5
·
2025
A Hybrid Convolutional–Transformer Approach for Accurate Electroencephalography (EEG)-Based Parkinson’s Disease Detection
Chayut Bunterngchit, Laith H. Baniata, Hayder Albayati, Mohammad Baniata, Khalid Alharbi, Fanar Hamad Alshammari, Sangwoo Kang
IF 3.7
Bioengineering
Parkinson's disease (PD) is a progressive neurodegenerative disorder characterized by motor and cognitive impairments. Early detection is critical for effective intervention, but current diagnostic methods often lack accuracy and generalizability. Electroencephalography (EEG) offers a noninvasive means to monitor neural activity, revealing abnormal brain oscillations linked to PD pathology. However, deep learning models for EEG analysis frequently struggle to balance high accuracy with robust generalization across diverse patient populations. To overcome these challenges, this study proposes a convolutional transformer enhanced sequential model (CTESM), which integrates convolutional neural networks, transformer attention blocks, and long short-term memory layers to capture spatial, temporal, and sequential EEG features. Enhanced by biologically informed feature extraction techniques, including spectral power analysis, frequency band ratios, wavelet transforms, and statistical measures, the model was trained and evaluated on a publicly available EEG dataset comprising 31 participants (15 with PD and 16 healthy controls), recorded using 40 channels at a 500 Hz sampling rate. The CTESM achieved an exceptional classification accuracy of 99.7% and demonstrated strong generalization on independent test datasets. Rigorous evaluation across distinct training, validation, and testing phases confirmed the model's robustness, stability, and predictive precision. These results highlight the CTESM's potential for clinical deployment in early PD diagnosis, enabling timely therapeutic interventions and improved patient outcomes.
https://doi.org/10.3390/bioengineering12060583
Electroencephalography
Parkinson's disease
Computer science
Medicine
Disease
Neuroscience
Psychology
Internal medicine
2
article
|
인용수 17
·
2022
Weakly labeled data augmentation for social media named entity recognition
Juae Kim, Yejin Kim, Sangwoo Kang
IF 7.5
Expert Systems with Applications
https://doi.org/10.1016/j.eswa.2022.118217
Named-entity recognition
Computer science
Social media
Annotation
Task (project management)
Natural language processing
Labeled data
Artificial intelligence
Information retrieval
Entity linking
3
article
|
gold
·
인용수 4
·
2021
Adaptive Named Entity Recognition Using Distant Supervision for Contemporary Written Texts
Juae Kim, Yejin Kim, Sangwoo Kang, Jungyun Seo
IF 3.6
IEEE Access
Named entity recognition (NER) is the process of categorizing named entities in a given text that suffers from the lack of labeled corpora, which is a long-standing issue. Deep neural networks have been successfully applied to NER tasks. However, they require a large number of annotated data. Regardless of the number of data made available, annotation requires significant human effort, which is expensive and time-consuming. Moreover, collecting labeled data that reflect contemporary surrounding statuses requires exhaustive follow-up and incurs correspondingly higher costs. Current NERs typically focus on the supervised learning of hand-crafted data. The most well-known dataset for NER shared tasks, which was released at the 2003 Conference on Natural Language Learning, is used for basic training and evaluation. Although the data are qualified, the database has low coverage of timely material. In this paper, we illustrate methods for swiftly labeling up-to-date data via distant supervision. To tackle the difficulty of annotating contemporary written texts, we generate labeled data articles that reflect the latest issues. We evaluated the proposed methods with bidirectional long short-term memory conditional random-field architecture using static and contextualized embedding methods. Our proposed models perform higher than state-of-the-art methods with average F1-scores 3.09% better with weakly labeled Wikipedia data and 3.47% better with Cable News Network data. When using the NER model with Flair embedding, our method shows 1.50 and 3.26% higher F1-scores with weakly labeled Wikipedia and news data, respectively. Qualitatively, the proposed model also performs better when extracting contemporary keywords.
https://doi.org/10.1109/access.2021.3067315
Computer science
Named-entity recognition
Conditional random field
Annotation
Artificial intelligence
Natural language processing
Labeled data
Embedding
Deep learning
Machine learning
정부 과제
8
과제 전체보기
1
2022년 2월-2027년 2월
|96,747,000
설명가능한 멀티모달 대화형 인공지능 시스템
[데이터이관 글자수 검증으로 인한 추가 텍스트 입력][데이터이관 글자수 검증
복합지능
멀티모달 대화형 인공지능
인간과 소통하는 인공지능
멀티모달 멀티태스크 학습
설명가능한 인공지능
2
주관|
2022년 2월-2027년 2월
|96,747,000
설명가능한 멀티모달 대화형 인공지능 시스템
-자연어 중심의 대조학습 기반 시각, 청각 임베딩 고도화 연구 -시각, 청각, 텍스트를 결합한 멀티모달 대화형 시스템 구축 -멀티모달 멀티 태스크 학습 알고리즘을 통한 시스템 응답 생성 고도화 연구 -시스템 발화의 생성과정을 검증하는 자연어 설명문 생성 기반 멀티모달 XAI 연구 -적대적 공격 방법을 이용한 XAI 고도화
복합지능
멀티모달 대화형 인공지능
인간과 소통하는 인공지능
멀티모달 멀티태스크 학습
설명가능한 인공지능
적대
3
2022년 2월-2027년 2월
|87,073,000
설명가능한 멀티모달 대화형 인공지능 시스템
본 연구의 최종 목표는 설명가능한 멀티모달 대화형 인공지능 시스템 개발이며 인간과 매우 유사한 방식으로 대화가 가능한 AI 시스템이다. 제안 시스템은 크게 2개 파트로 구성된다. 첫 번째는 시스템이 시각, 청각, 언어 등 다중 형식의 정보들을 이해하여 인간과 유사한 수준으로 교감할 수 있는 멀티모달 대화형 시스템이며, 두 번째는 시스템 결과 검증을 통해 신...
복합지능
멀티모달 대화형 인공지능
인간과 소통하는 인공지능
멀티모달 멀티태스크 학습
설명가능한 인공지능
적대
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
등록2021레이블 기반의 핵심자질을 학습하기 위한 전이학습 방법, 컴퓨팅장치 및 컴퓨터-판독가능 매체1020210129037
등록2018기계학습 모델을 이용한 자연어 생성 시스템, 방법, 및 컴퓨터 판독가능매체1020180009775
등록2017개체명 인식시스템, 방법, 및 컴퓨터 판독가능매체1020170169062
전체 특허

레이블 기반의 핵심자질을 학습하기 위한 전이학습 방법, 컴퓨팅장치 및 컴퓨터-판독가능 매체

상태
등록
출원연도
2021
출원번호
1020210129037

기계학습 모델을 이용한 자연어 생성 시스템, 방법, 및 컴퓨터 판독가능매체

상태
등록
출원연도
2018
출원번호
1020180009775

개체명 인식시스템, 방법, 및 컴퓨터 판독가능매체

상태
등록
출원연도
2017
출원번호
1020170169062