연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 2
·2025
Improving Vapor Pressure Prediction Through Integration of Multiple Molecular Representations: A Super Learner Approach
Ji Hyun Nam, Seul Lee, Seongil Jo, Jaeoh Kim, Jooyeon Lee, Jahyun Koo, Byounghwak Lee, Keunhong Jeong, Donghyeon Yu
IF 2.1 (2025) Journal of Chemometrics
초록

화학 공학, 환경 과학, 제약 개발에서 화합물의 휘발성과 안정성에 영향을 미치므로, 증기압의 정확한 예측은 필수적이다. 전통적 방법은 종종 복잡하고 새로 고안된 분자 구조에 대해 충분히 성능을 발휘하지 못한다. 본 연구는 예측 정확도를 향상시키기 위해 그래프 신경망(graph neural networks, GNN)과 CHEM-BERT 모델을 통합한 고도화된 기계 학습 접근법을 제시한다. 현재까지 최대 규모의 데이터셋을 활용하여 포괄적인 화학적 기술자(descriptors)와 핑거프린트를 도출하였다. 우리는 리지 회귀(ridge regression), 랜덤 포레스트(random forest), 서포트 벡터 회귀(support vector regression), 피드포워드 신경망(feed-forward neural networks) 등을 포함한 19개의 예측 모델을 평가하였으며, PaDEL과 Morgan 핑거프린트, 화학적 기술자, Chem-BERT 임베딩과 같은 다양한 특성을 사용하여 학습하였다. 방법론의 핵심은 19개의 다중 모델을 결합하여 정확도를 향상시키는 슈퍼 러너(super learner) 아키텍처이다. 슈퍼 러너는 개별 모델 및 선행 보고보다 우수한 성능을 보이며, 평균제곱근오차(root mean squared error, RMSE) 0.8200을 달성하였다. 이러한 성공적인 결과는 상세한 분자 정보를 포착하기 위해 GNN과 Chem-BERT를 통합하는 접근법의 효과를 보여주며, 증기압 예측을 위한 새로운 벤치마크를 제시한다. 본 연구는 고도화된 기계 학습 기법과 포괄적인 데이터셋의 가치를 강조하며, 연구자들에게 견고한 도구를 제공하고 화학적 물성 예측의 향후 발전을 위한 기반을 마련한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Vapor pressureComputer scienceChemistryOrganic chemistry
타입
Article
IF / 인용수
2.1 / 2
게재 연도
2025