Accuracy of Cloud-Based Speech Recognition Open Application Programming Interface for Medical Terms of Korean | 최진욱 교수 연구실 | 서울대학교 의학과

|최진욱 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 12

·2022

Accuracy of Cloud-Based Speech Recognition Open Application Programming Interface for Medical Terms of Korean

Seung Hwa Lee, Jungchan Park, Kwangmo Yang, Jeongwon Min, Jinwook Choi

IF 4.5 (2022) Journal of Korean Medical Science

초록

배경: 의료 용어에 대한 클라우드 기반 음성 인식(SR) 오픈 애플리케이션 프로그래밍 인터페이스(API)의 정확도에 관한 데이터는 제한적이다. 본 연구는 한국어에서 현재 사용 가능한 클라우드 기반 SR 오픈 API의 의료 용어 인식 정확도를 평가하고자 하였다. 방법: 한국의 대형 3차 의료기관 외래 진료에서 수집한 실제 의사–환자 간 대화 녹음 자료를 사용하여, 현재 사용 가능한 클라우드 기반 SR 오픈 API의 SR 정확도를 분석하였다. 원래 전사와 SR 전사를 각각에 대해 분석하여, 각 클라우드 기반 SR 오픈 API의 정확도 비율(즉, SR 전사에 포함된 의료 용어 수를 원래 전사에 포함된 의료 용어 수로 나눈 값)을 산출하였다. 결과: 총 112개의 의사–환자 대화 녹음이 세 가지 클라우드 기반 SR 오픈 API(Naver Corporation의 Naver Clova SR, Alphabet Inc.의 Google Speech-to-Text, Amazon의 Amazon Transcribe)로 변환되었으며, 각 전사를 비교하였다. Naver Clova SR(75.1%)은 다른 오픈 API에 비해 의료 용어 인식에서 가장 높은 정확도를 보였고( Google Speech-to-Text, 50.9%, P < 0.001; Amazon Transcribe, 57.9%, P < 0.001), Amazon Transcribe는 Google Speech-to-Text에 비해 더 높은 인식 정확도를 보였다(P < 0.001). 하위 분석에서 Naver Clova SR은 단어 품사 전 영역에서 가장 높은 정확도를 보였으나, 5자 초과 단어의 정확도는 통계적으로 유의한 차이가 없었다(Naver Clova SR, 52.6%; Google Speech-to-Text, 56.3%; Amazon Transcribe, 36.6%). 결론: 현재의 세 가지 클라우드 기반 SR 오픈 API 중 한국 기업이 제조한 Naver Clova SR이 Google Speech-to-Text 및 Amazon Transcribe에 비해 한국어 의료 용어 인식 정확도가 가장 높았다. 의료 용어 인식에는 제한이 존재하나, 각 SR 엔진의 강점을 결합함으로써 이 유망한 기술의 개선 여지가 상당히 크다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Cloud computingComputer scienceApplication programming interfaceSpeech recognitionInterface (matter)Operating system

타입

Article

IF / 인용수

4.5 / 12

원문

https://doi.org/10.3346/jkms.2022.37.e144

게재 연도

2022