연구 영역
기본 정보
논문·특허
과제
구성원
읽는 시간 · 1분 41초

다국어 임상 텍스트 이해·예후 예측과 의료 데이터 거버넌스 연구

Multilingual Clinical Text Understanding, Prognostic Prediction, and Medical Data Governance

연구 내용

다국어 임상 노트 이해와 예후 예측 모델을 구축하는 한편, 병원 단위 데이터 관리 현황과 개선 방향을 도출하는 연구

병원에서 생성되는 임상 텍스트를 분석하기 위해 다국어 맥락 이해와 용어 인식 성능을 함께 평가하고, 이를 예후 예측과 데이터 운영으로 연결합니다. 한국어·영어 혼합 임상 노트에서 다양한 BERT 변형의 문맥 이해 능력을 작업별로 비교해 적합 모델을 선정합니다. 또한 외래 진료 대화 기반 의료 용어의 음성인식 정확도를 검증하여 상위 파이프라인의 입력 품질을 관리합니다. 예측 영역에서는 대장암 MSI 및 당뇨 합병증 진행을 위한 머신러닝 모델을 학습해 임상 진행을 추정합니다. 병원 수준에서는 의료 기록 보존·파기, 인프라, 백업, 공유 및 2차 활용을 포함한 데이터 관리 이슈를 정리하여 운영 개선 방향을 도출합니다.

관련 연구 성과

관련 논문

5

관련 특허

0

관련 프로젝트

3

연구 흐름

초기에는 병원 단위 데이터 관리 현황과 규제·인프라 이슈를 분석해 임상 AI가 활용 가능한 데이터 운영 조건을 파악했습니다. 이후 임상 노트의 다국어 특성을 반영해 BERT 계열 모델의 문맥 이해 능력을 작업별로 비교하는 연구로 확장했습니다. 동시에 음성인식 기반 전사 품질을 측정해 의료 용어 인식 정확도와 오류 요인을 확인했습니다. 이후 확보된 텍스트 분석 역량을 예후 예측 과제로 연결하여 MSI 및 당뇨 합병증 진행 예측을 수행하고, 마지막으로 데이터 거버넌스와 2차 활용 관점을 포함해 실무 적용 조건을 정리하는 흐름으로 발전했습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

  • 다국어 임상 노트 분류
  • 질환 진행 예측 모델
  • 의료 용어 음성인식 정확도 평가
  • 임상 데이터 전처리 품질 관리
  • 병원 데이터 거버넌스 가이드
  • 임상 AI 검증을 위한 데이터 준비
  • 의무기록 2차 활용 설계
  • 환자 분류용 텍스트 임베딩
  • 종양 바이오마커 기반 예측
  • 임상 연구용 데이터 공유 지원

관련 논문

구분

제목

1

Multifaceted Natural Language Processing Task–Based Evaluation of Bidirectional Encoder Representations From Transformers Models for Bilingual (Korean and English) Clinical Notes: Algorithm Development and Validation

2

PAIP 2020: Microsatellite instability prediction in colorectal cancer

3

Accuracy of Cloud-Based Speech Recognition Open Application Programming Interface for Medical Terms of Korean

4

Prediction of complications in diabetes mellitus using machine learning models with transplanted topic model features

5

Current Status and Key Issues of Data Management in Tertiary Hospitals: A Case Study of Seoul National University Hospital

관련 프로젝트

구분

제목

1

맞춤형 헬스케어 혁신의과학 교육연구단

2

맞춤형 헬스케어 혁신의과학 교육연구단

3

맞춤형 헬스케어 혁신의과학 교육연구단