자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법
METHOD FOR PREDICTING PHARMACOLOGICAL PROPERTIES OF NEW DRUG CANDIDATES USING NATURAL LANGUAGE PROCESSING MODEL
특허 요약
본 발명은 신약 후보물질의 약리학적 성질을 예측하는 방법에 관한 것이다. 본 발명은 방대한 데이터로 사전 학습된 자연어 처리 모델을 이용하여 화합물의 약리학적 성질에 대한 복합적인 패턴을 학습할 수 있고, 실험이나 시뮬레이션으로 파악하기 전에 화합물의 약리학적 성질을 예측할 수 있다. 이에 후보물질의 기초 약리학 성질의 적합 여부를 빠르게 판정할 수 있다. 또한, 본 발명은 개별적인 약리학 성질 시험 결과 뿐만 아니라, 후보물질의 복합적인 약리학적 성질을 다차원의 확률로 예측하여 보다 정밀하게 후보물질의 약리학적 성질 파악이 가능하다. 이에 후보물질에 대한 스크리닝 과정을 훨씬 빠르고 정확하게 진행할 수 있고, 효율적으로 신약 개발을 가속화할 수 있다.
청구항
번호청구항
9

청구항 1에 있어서,상기 (1) 단계는,상기 화합물 서열을 토큰화하여 상기 자연어 처리 복합 모델에 입력하고, 벡터를 출력하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

10

청구항 1에 있어서,상기 약리학 성질 확률은,각각 0 내지 1 사이의 실수값을 가지는 다차원의 벡터인 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

1

(1) 물성 데이터 및 화합물 서열을 자연어 처리 복합 모델에 입력하고, 하나 이상의 벡터를 출력하는 단계; 및(2) 상기 벡터를 인공 신경망 모델에 입력하고, 약리학 성질 확률을 출력하는 단계를 포함하고,상기 자연어 처리 복합 모델은,서로 다른 레이어 구조를 가지는 복수의 인공 신경망 모델인 제1모델 및 제2모델과, 상기 제1모델 및 상기 제2모델을 병렬로 구성하는 제3모델, 및 상기 제1모델 및 상기 제2모델을 직렬로 구성하는 제4모델을 포함하며,상기 (1) 단계는,상기 물성 데이터 및 상기 화합물 서열 중에서 선택되는 하나 이상의 조합을 상기 자연어 처리 복합 모델에 입력하고,상기 (1) 단계는,상기 물성 데이터를 상기 제1모델, 상기 제3모델, 및 상기 제4모델에, 상기 화합물 서열을 상기 제2모델, 상기 제3모델, 및 상기 제4모델에 입력하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

2

삭제

3

삭제

4

삭제

5

삭제

6

청구항 1에 있어서,상기 제1모델은,완전 연결 레이어와 임베딩 레이어를 포함하고,상기 제2모델은,사전 학습된 자연어 처리 모델을 포함하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

7

청구항 1에 있어서,상기 (2) 단계의 인공 신경망 모델은,상기 자연어 처리 복합 모델에서 출력하는 각각의 벡터에 가중치를 부여하여 보팅(Voting) 방식으로 합산하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

8

청구항 7에 있어서,상기 보팅은,가중된 소프트 보팅(Weighted soft voting)인 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

11

청구항 1에 있어서,상기 물성 데이터는,정수형, 실수형, 및 논리형을 포함하는 13개의 변수를 포함하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

12

청구항 1에 있어서,상기 (2) 단계는,상기 인공 신경망의 임의의 노드를 미리 정해진 확률로 드롭하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 방법.

13

명령어를 로드하는 메모리; 및상기 명령어를 실행하는 프로세서를 포함하고,상기 명령어는,상기 프로세서가 청구항 1, 청구항 6 내지 청구항 12 중 어느 한 청구항의 방법을 수행하도록 하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 신약 후보물질의 약리학적 성질 예측 장치.