Data-driven prediction of ionic conductivity in solid-state electrolytes with machine learning and large language models | 김경호 교수 연구실 | 국립부경대학교 재료공학부

|김경호 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 0

·2026

Data-driven prediction of ionic conductivity in solid-state electrolytes with machine learning and large language models

Haewon Kim, Taekgi Lee, Seongeun Hong, Kyeong-Ho Kim, Yongchul G. Chung

IF 3.1 (2026) The Journal of Chemical Physics

초록

고체전해질(SSEs)은 향후 차세대 리튬이온전지에서 안전성과 안정성이 향상된다는 점에서 매력적이지만, 상온 이온전도도가 낮아 실용적 적용을 저해한다. 새로운 SSE의 실험적 합성과 평가는 시간이 많이 들고 자원 집약적이다. 기계학습은 SSE 발견을 가속하는 경로를 제공하지만, 조성만을 기반으로 한 모델은 이온 수송에 중요한 구조적 요인을 간과하며, 그래프 신경망은 구조가 표지된 전도도 데이터의 부족과 결정 구조(CIFs)에서 흔히 나타나는 결정학적 무질서의 존재로 인해 어려움을 겪는다. 여기서는 동일한 상온, 구조 표지 데이터셋(n = 499)에 대해 상호 보완적인 두 가지 예측기를 학습하였다. 화학량론적 기술자만을 사용하는 그래디언트 부스팅 트리 회귀 모델은 log(S/cm)에서 테스트 MAE 1.108을 달성하였고, 기하학적 기술자를 추가해도(결합 MAE = 1.172) 테스트 오차가 낮아지지 않았으나 Shapley Additive exPlanations를 통해 상보적인 구조 정보를 드러냈다. 그 결과, 화학량론적 기술자, 특히 산소 비율이 특성 중요도를 지배하는 것으로 나타났으며(상위 10개 특성 중 7개), 세 가지 기하학적 기술자(밀도, Lmax, Lmin)도 의미 있게 기여하였다. 동시에, CIF 메타데이터에서 도출한 간결한 텍스트 프롬프트(식에 선택적으로 대칭 및 무질서 태그를 포함)를 사용하여 대형 언어 모델(LLMs)을 미세 조정하였고, 원자 좌표의 원자료를 직접 사용하지 않았다. 주목할 만하게도 Mistral-7B는 절대 오차가 가장 낮았으며[log(S/cm)에서 MAE = 0.798], Qwen3-8B는 식 및 무질서 정보를 사용하여 최고의 전반적 순위 성능(SRCC = 0.849)을 보였고, CIF 파일로부터 수치 특성을 추출할 필요가 없었다. 이러한 결과는 전역 기하학적 기술자가 트리 기반 예측을 개선하고 해석 가능한 구조-특성 분석을 가능하게 하는 한편, LLM은 빠른 SSE 스크리닝을 위한 처리 전처리 부담이 적은 경쟁력 있는 대안임을 보여준다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Feature (linguistics)Tree (set theory)Ranking (information retrieval)Artificial neural networkSymmetry (geometry)ConductivityTest dataFeature extractionDifferentiable function

타입

Article

IF / 인용수

3.1 / 0

원문

https://doi.org/10.1063/5.0307954

게재 연도

2026