RnDCircle Logo
최진욱 연구실
서울대학교 의학과 최진욱 교수
의료정보학
임상 문서 생성
의료 자연어처리
연구 영역
기본 정보
논문·특허
과제
구성원

최진욱 연구실

서울대학교 의학과 최진욱 교수

최진욱 연구실은 의학과 분야에서 의료정보학 기반의 인공지능을 수행합니다. 임상 노트의 다국어 문맥 이해를 위해 BERT 계열 모델을 비교·평가하고, 진료 대화에서 의료 용어가 추출되는 과정에서 음성인식 정확도를 검증합니다. 또한 대장암 MSI 및 당뇨 합병증 진행처럼 임상 경과를 예측하는 머신러닝 모델을 연구합니다. 병원 단위로는 의료 데이터 관리 현황과 규제·인프라·공유 및 2차 활용 이슈를 분석하여 운영 개선 방향을 정리합니다.

의료정보학임상 문서 생성의료 자연어처리다국어 BERT의료 데이터 거버넌스
대표 연구 분야
연구 영역 전체보기
의료 문서 자동생성·요약을 위한 임상 LLM/NLP 적응 연구 thumbnail
의료 문서 자동생성·요약을 위한 임상 LLM/NLP 적응 연구
Adaptive Clinical LLM/NLP for Medical Document Generation and Summarization
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

30총합

5개년 연도별 피인용 수

650총합
주요 논문
5
논문 전체보기
1
Article
|
인용수 7
·
2024
Multifaceted Natural Language Processing Task–Based Evaluation of Bidirectional Encoder Representations From Transformers Models for Bilingual (Korean and English) Clinical Notes: Algorithm Development and Validation
K.-H. Kim, Seongkeun Park, Jeongwon Min, Sumin Park, Ju Yeon Kim, Jinsu Eun, Kyuha Jung, Yoobin Elyson Park, Esther Hehsun Kim, Eun Young Lee, Joonhwan Lee, Jinwook Choi
IF 3.8 (2024)
JMIR Medical Informatics
배경: 변환기(transformers)로부터의 양방향 인코더 표현(BERT) 모델은 환자 분류 및 질병 예측과 같은 임상 응용 분야에서 상당한 주목을 받아왔다. 그러나 현재의 연구들은 대체로 모델에 대한 충분한 맥락 이해 평가 없이 응용 개발 단계로 진행되는 경향이 있다. 또한 비영어권 국가의 의료 문서를 사용하여 BERT 모델을 비교한 연구는 제한적이다. 따라서 영어 임상 노트로 학습된 BERT 모델의 비영어권 맥락 적용 가능성은 아직 확인되지 않았다. 이러한 문헌상의 공백을 해결하기 위해, 본 연구는 비영어 임상 노트에 대해 가장 효과적인 BERT 모델을 파악하는 데 초점을 두었다. 목적: 본 연구에서는 한국어와 영어가 혼합된 임상 노트에 적용된 다양한 BERT 모델의 문맥 이해 능력을 평가하였다. 본 연구의 목적은 이러한 문서의 맥락을 이해하는 데 뛰어난 BERT 모델을 식별하는 것이었다. 방법: 한국의 한 3차 의료기관에서 164,460명의 환자 데이터를 사용하여 BERT-base, BERT for Biomedical Text Mining(BioBERT), Korean BERT(KoBERT), Multilingual BERT(M-BERT)를 사전학습(pretrain)하여 문맥 이해 능력을 향상시킨 다음 7개의 미세조정(fine-tuning) 과제에서 성능을 비교하였다. 결과: 모델 성능은 과제와 토큰 사용 방식에 따라 달라졌다. 첫째, BERT-base와 BioBERT는 문서 분류와 같은 분류(classification) 과제에서 ([CLS]) 토큰 임베딩을 사용하는 경우 뛰어난 성능을 보였다. BioBERT는 89.32의 최고 F1-score를 달성했다. 또한 BERT-base와 BioBERT는 사전에 제한된 한국어 토큰만 포함되어 있더라도 문서 패턴 인식에서 효과성을 보여주었다. 둘째, M-BERT는 독해(reading comprehension) 과제에서 우수한 성능을 보이며 93.77의 F1-score를 달성하였다. 더 적은 수의 단어를 알 수 없음(unknown, [UNK]) 토큰으로 대체할수록 더 나은 결과가 얻어졌다. 셋째, M-BERT는 지식 추론(knowledge inference) 과제에서 뛰어났다. 이 과제에서는 문서의 질병명들이 [MASK] 토큰으로 대체된 뒤, 63개의 후보 질병명으로부터 정답 질병명이 추론된다. M-BERT는 95.41의 최고 hit@10 점수를 달성했다. 결론: 본 연구는 다국어 임상 분야에서 다양한 BERT 모델의 효과성을 강조하였다. 본 결과는 임상 및 언어 기반 응용 분야에서 참고 자료로 활용될 수 있다.
https://doi.org/10.2196/52897
Computer science
Security token
Encoder
Transformer
Natural language processing
Artificial intelligence
Language model
Context (archaeology)
Machine learning
Engineering
2
Article
|
인용수 4
·
2023
Prediction of complications in diabetes mellitus using machine learning models with transplanted topic model features
Benedict Choonghyun Han, Jimi Kim, Jinwook Choi
IF 3.2 (2023)
Biomedical Engineering Letters
: 본 연구는 토픽 모델링에 기반한 머신러닝 프로젝트가 질병의 진행을 효과적으로 예측할 수 있음을 보여준다. 또한 두 데이터 세트의 토픽 구조 차원에 일치하는 방식으로 토픽 모델을 이식하는 독창적인 방법을 제시한다. 보충정보: 온라인 버전에는 10.1007/s13534-023-00322-7에서 제공되는 추가 자료가 포함되어 있다.
https://doi.org/10.1007/s13534-023-00322-7
Latent Dirichlet allocation
Machine learning
Topic model
Artificial intelligence
Diabetes mellitus
Computer science
Medicine
3
Article
|
·
인용수 25
·
2023
PAIP 2020: Microsatellite instability prediction in colorectal cancer
Kyung Mo Kim, Kyoungbun Lee, Sungduk Cho, Dong Un Kang, Seongkeun Park, Yunsook Kang, Hyun Jeong Kim, Gheeyoung Choe, Kyung Chul Moon, Kyu Sang Lee, Jeong Hwan Park, Choyeon Hong, Ramin Nateghi, Fattaneh Pourakpour, Xiyue Wang, Sen Yang, Seyed Alireza Fatemi Jahromi, Aliasghar Khani, Hwa-Rang Kim, Doo-Hyun Choi, Chang Hee Han, Jin Tae Kwak, Fan Zhang, Bing Han, David Joon Ho, Gyeong Hoon Kang, Se Young Chun, Won‐Ki Jeong, Peom Park, Jinwook Choi
IF 10.7 (2023)
Medical Image Analysis
https://doi.org/10.1016/j.media.2023.102886
Microsatellite instability
Colorectal cancer
Task (project management)
Stage (stratigraphy)
Cancer
Artificial intelligence
Medicine
Deep learning
Oncology
Computer science
최신 정부 과제
23
과제 전체보기
1
2021년 5월-2024년 5월
|39,000,000
Pointer-generator network과 로봇저널리즘 기술을 이용한 의료문서 자동 요약 시스템 개발
본 과제는 Pointer-Generator Network 기반의 딥러닝모델과 로봇저널리즘 기술을 사용하여 류마티스내과의 대량의 외래기록지를 자동요약해주는 시스템을 연구개발하는 것임
의료 문서 요약
자연어처리
로봇저널리즘
2
주관|
2021년 5월-2024년 5월
|200,000,000
Pointer-generator network과 로봇저널리즘 기술을 이용한 의료문서 자동 요약 시스템 개발
본 과제는 류마티스 내과의 대량 외래기록지를 자동요약하는 시스템을 개발하는 연구임. 의료진이 외래 소견서를 촉박하게 작성할 때 소견이 산만해지거나 치료경과 전달이 정확하지 못해지는 문제를 해결하고자 함. 연구 목표는 Pointer-Generator Network 기반 딥러닝과 로봇저널리즘을 결합해 사실성과 가독성을 갖춘 요약문을 생성하는 것임. 핵심 연구 내용은 BERT 기반 한글·영문 Content Selector로 의료 핵심 키워드를 추출한 뒤 원문 단어 복사로 요약문 생성함, 로봇저널리즘 검수로 문맥 생성과 가독성 오류를 개선함, 임상의 평가로 factual correctness가 보장되도록 키워드 누락 조사 수행함. 기대 효과는 EMR 연계로 소견서 작성 시간을 단축해 업무부담을 완화함과 동시에 한국어·영문 다국어 요약 기술 노하우 축적임.
의료 문서 요약
자연어처리
로봇저널리즘
3
주관|
2021년 5월-2024년 5월
|200,000,000
Pointer-generator network과 로봇저널리즘 기술을 이용한 의료문서 자동 요약 시스템 개발
본 과제는 류마티스내과 외래기록을 자동으로 줄여주는 소견서 요약 시스템을 개발하는 연구임. 외래에서 축적된 의무기록을 빠르게 정리하지 못하면 치료경과 전달과 소견서 작성이 산만해질 수 있음. 연구 목표는 Pointer-Generator Network 기반 딥러닝 모델과 로봇저널리즘을 결합해 factual correctness를 갖는 자연스러운 요약문 생성모델을 만드는 데 있음. 이를 위해 BERT 기반 한글·영문 Content Selector로 중요한 임상 키워드를 추출하고, 트랜스포머 기반 요약문 생성과 키워드 중심 문장 생성, 가독성 평가 및 검수 인터페이스를 통해 모델을 개선하는 연구를 수행함. 기대효과는 EMR과 연계한 빠른 소견서 작성으로 업무부담을 완화하고, 한국어·영문 혼합 의료문서 요약 기술을 고도화하는 데 있음
의료 문서 요약
자연어처리
로봇저널리즘
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2024질병 예후의 예측 모델의 학습 방법 및 이를 이용한 질병 예후의 예측 방법1020240076592
거절2022요속 그래프 기반 요속 패턴 분석 장치 및 방법1020220081018
등록2021전립선암 분석 장치 및 프로그램, 이의 동작 방법1020210192094
전체 특허

질병 예후의 예측 모델의 학습 방법 및 이를 이용한 질병 예후의 예측 방법

상태
공개
출원연도
2024
출원번호
1020240076592

요속 그래프 기반 요속 패턴 분석 장치 및 방법

상태
거절
출원연도
2022
출원번호
1020220081018

전립선암 분석 장치 및 프로그램, 이의 동작 방법

상태
등록
출원연도
2021
출원번호
1020210192094