■ 본 연구의 최종목표는 건설 작업안전분석 인공지능화를 위한 자연어처리 기반 지식그래프 (Knowledge Graph)를 개발하는 것이다. 이러한 최종 연구목표 달성을 위해 다음과 같은 세 개의 세부목표가 달성되어야 한다. 1) 건설작업안전분석에 요구되는 정보의 탁소노미(Taxonomy)를 구축하고, 이러한 정보를 담고 있는 텍스트데이터의 소스(source...
건설작업안전
작업안전분석
자연어처리
지식그래프
온톨로지
2
주관|
2022년 5월-2025년 2월
|67,480,000원
건설 작업안전분석 지능화를 위한 지식그래프 개발
■ Google BERT의 한국어분석 성능 향상을 위해, 2020년 한국전자통신연구원(ETRI)에서 한국어 전용언어모델 KorBERT를 개발하였다. KorBERT 는 기존 BERT 대비 4.5%의 정확도 향상을 보였다. KorBERT모델은 aiopen.etri.re.kr에서 배포중이다. 현재 KorBERT는 한국 산업계/학계의 주요 딥러닝 언어모델로 자리매김 하고 있다.
■ KorBERT는 일반 한국어 문서를 분석하는데 우수한 성능을 보이나, 특정한 도메인에 대해서는 가중치 학습을 통한 언어모델 고도화가 요구된다. 기존에 법률 및 특허 분야에 특화된 언어모델, 예를들어, KorPatBERT가 개발되었으며, 일반적인 KorBERT 모델 대비 우수한 성능을 보였다.
■ 이러한 배경에서, 본 연구의 연구흐름도 및 차년도별 연구범위는 아래와 같다.
● 1차년도에는 지능형 건설작업안전분석을 위해 요구되는 원시텍스트를 파악/수집/분류하고, 지도학습(Supervised Learning)에 사용될 작업안전분석 문제를 생성한다.
● 2차년도에는 범용 KorBERT 모델을 전이학습을 통해 Fine-tuning하는 방식으로 건설작업안전분석 전용 언어모델인 KCJS-BERT 모델을 생성하고 생성된 언어모델의 자연어처리 성능을 검증한다. 이 단계에서 KCJS-BERT 모델의 성능은 건설작업안전 관련 텍스트데이터를 처리하는데 기존 BERT모델 대비 정확도 향상의 정도를 통해 측정한다.
● 3차년도에는 KCJS-BERT를 기반으로 건설작업안전 분야 텍스트를 이용해 확장 가능한 지식그래프를 개발하고, 이 지식그래프를 바탕으로 자동으로 건설작업 안전절차서를 생성하는 방법을 개발한다. 이 단계의 연구결과물은 인공지능 기반으로 자동생성된 작업안전절차서 품질을 전문가 대비 성능으로 측정한다.