최도진 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 5
·2023
Name Disambiguation Scheme Based on Heterogeneous Academic Sites
Dojin Choi, Jun-Hyeok Jang, Sangho Song, Hyeonbyeong Lee, Jongtae Lim, Kyoungsoo Bok, Jaesoo Yoo
IF 2.5 (2023) Applied Sciences
초록

학술 연구자들은 다양한 학술 사이트에서 논문, 특허, 연구 보고서와 같은 여러 형식으로 연구 성과를 발표한다. 특정 연구자의 저작을 검색할 때에는, 특히 동일한 이름을 가진 복수의 연구자가 존재하는 경우, 올바른 개인을 정확히 특정하기가 어려울 수 있다. 이러한 문제를 해결하기 위해 본 연구에서는 서로 다른 학술 사이트에 기반하여 동일 이름을 가진 연구자를 대상으로 하는 이름 식별(명칭 분리) 방식을 제안한다. 제안된 방식은 식별에 핵심적인 속성을 중심으로, 다양한 학술 사이트로부터 해당 연구 성과를 수집하고 통합한다. 이후 군집화 기법을 사용하여 동일 이름을 공유하는 개인들을 식별한다. 또한 본 연구에서는 제안된 규칙 기반 알고리즘 이름 식별 방법과 기존의 딥러닝 기반 식별 방법을 함께 구현한다. 이 접근법은 다중 분류기(multi-classifier) 방식으로 학술 사이트에 이용 가능한 메타데이터를 고려하여 가장 정확한 식별 방식을 선택할 수 있게 한다. 우리는 다양한 연구자들의 성과와 여러 학술 검색 사이트에 등록된 논문의 메타데이터를 고려하였다. 제안된 방식은 F1-measure 값 0.99의 매우 높은 성능을 보였다. 본 논문에서는 입력된 메타데이터에 따라 가장 적절한 식별 방식을 수행하는 다중 분류기(multi-classifier)를 제안한다. 제안된 다중 분류기는 F1-measure 값 0.67의 높은 성능을 보였다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceMetadataClassifier (UML)PublicationScheme (mathematics)Cluster analysisInformation retrievalData miningArtificial intelligenceWorld Wide Web
타입
article
IF / 인용수
2.5 / 5
게재 연도
2023

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.