Biomedical entity extraction and normalization for knowledge-base construction
연구 내용
생의학 문헌에서 질병·약물·화학 개체를 인식하고 고유 식별자로 정규화하여 검색과 지식그래프 구축을 지원하는 연구
생의학 자연어처리에서 개체 인식과 개체 정규화가 지식그래프와 정밀 검색의 전제가 됩니다. 본 연구는 멀티태스크 기반 Named-entity recognition과 신경망 기반 Named entity normalization을 결합해 추론 속도와 정확도를 동시에 개선합니다. 또한 제목·초록 중심 평가를 넘어 full-text에서 일반화와 태깅 일관성이 흔들리는 문제를 전이학습과 mention-wise 다수결 같은 후처리로 보완합니다. 신경망의 재현율과 사전 기반 모델의 정밀도를 하이브리드로 결합하는 차별성을 보유합니다.
관련 연구 성과
관련 논문
2편
관련 특허
0건
관련 프로젝트
0건
연구 흐름
초기 연구는 생의학 텍스트에서 개체 인식 성능을 높이기 위한 신경망 기반 NER 모델을 확장하고, 후속 NEN을 정교화하는 방향으로 진행되었습니다. 이후 개체의 분류와 정규화가 함께 동작하도록 멀티태스크 구조와 전용 NEN 모델을 도입하여 대규모 문헌에 적용 가능한 추론 체계를 확보했습니다. 최근에는 full-text에서 관측되는 미지 언급과 태깅 불일치 문제를 다루기 위해 학습 전략과 간단한 후처리 기법을 함께 적용하는 연구로 확장되고 있습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
BERN2: an advanced neural biomedical named entity recognition and normalization tool
Full-text chemical identification with improved generalizability and tagging consistency