배경: 의료 용어에 대한 클라우드 기반 음성 인식(SR) 오픈 애플리케이션 프로그래밍 인터페이스(API)의 정확도에 관한 데이터는 제한적이다. 본 연구는 한국어에서 현재 사용 가능한 클라우드 기반 SR 오픈 API의 의료 용어 인식 정확도를 평가하고자 하였다. 방법: 한국의 대형 3차 의료기관 외래 진료에서 수집한 실제 의사–환자 간 대화 녹음 자료를 사용하여, 현재 사용 가능한 클라우드 기반 SR 오픈 API의 SR 정확도를 분석하였다. 원래 전사와 SR 전사를 각각에 대해 분석하여, 각 클라우드 기반 SR 오픈 API의 정확도 비율(즉, SR 전사에 포함된 의료 용어 수를 원래 전사에 포함된 의료 용어 수로 나눈 값)을 산출하였다. 결과: 총 112개의 의사–환자 대화 녹음이 세 가지 클라우드 기반 SR 오픈 API(Naver Corporation의 Naver Clova SR, Alphabet Inc.의 Google Speech-to-Text, Amazon의 Amazon Transcribe)로 변환되었으며, 각 전사를 비교하였다. Naver Clova SR(75.1%)은 다른 오픈 API에 비해 의료 용어 인식에서 가장 높은 정확도를 보였고( Google Speech-to-Text, 50.9%, P < 0.001; Amazon Transcribe, 57.9%, P < 0.001), Amazon Transcribe는 Google Speech-to-Text에 비해 더 높은 인식 정확도를 보였다(P < 0.001). 하위 분석에서 Naver Clova SR은 단어 품사 전 영역에서 가장 높은 정확도를 보였으나, 5자 초과 단어의 정확도는 통계적으로 유의한 차이가 없었다(Naver Clova SR, 52.6%; Google Speech-to-Text, 56.3%; Amazon Transcribe, 36.6%). 결론: 현재의 세 가지 클라우드 기반 SR 오픈 API 중 한국 기업이 제조한 Naver Clova SR이 Google Speech-to-Text 및 Amazon Transcribe에 비해 한국어 의료 용어 인식 정확도가 가장 높았다. 의료 용어 인식에는 제한이 존재하나, 각 SR 엔진의 강점을 결합함으로써 이 유망한 기술의 개선 여지가 상당히 크다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.