Vapor Pressure Prediction with Molecular Representation Learning and Super Learner Ensemble
연구 내용
graph neural network와 Chem-BERT 기반 분자 표현을 통합하고, 다중 모델 슈퍼러너 앙상블로 증기압을 정밀 예측하는 연구
본 연구는 증기압 예측에서 복잡한 분자 구조를 반영하기 위해 다양한 분자 표현을 통합하는 접근을 사용합니다. graph neural network와 Chem-BERT 모델 임베딩을 함께 활용하고, PaDEL 및 Morgan fingerprint, 화학적 기술자(descriptors) 등을 조합해 입력 표현을 확장합니다. 이후 ridge regression, random forest, support vector regression, feed-forward neural network 등 서로 다른 19개 모델을 훈련한 뒤 super learner 구조로 앙상블 가중치를 학습하여 예측 오차를 줄입니다. 대규모 데이터셋 기반으로 모델 성능을 비교하고, 분자 정보 포착 능력을 평가함으로써 증기압 예측 성능 향상을 목표로 합니다.
관련 연구 성과
관련 논문
1편
관련 특허
0건
관련 프로젝트
0건
연구 흐름
초기에는 증기압 예측에서 기존 단일 표현 기반 모델이 새로운 분자 구조에 대해 충분히 대응하지 못하는 한계를 확인하고, 분자 표현을 확장하기 위한 구성 요소를 설계했습니다. 이후에는 그래프 기반 표현과 언어모델 임베딩(Chem-BERT)을 함께 사용해 분자 정보를 다면적으로 입력하는 체계를 구축했습니다. 그 다음에는 다양한 전통 모델과 신경망 모델을 포함한 여러 후보 모델을 동시에 학습하고, super learner 앙상블로 성능을 결합하는 전략으로 확장했습니다. 마지막으로 대규모 데이터셋에서 기존 방법 대비 향상 가능성을 실증 비교하는 방향으로 연구를 마무리했습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Improving Vapor Pressure Prediction Through Integration of Multiple Molecular Representations: A Super Learner Approach