| 번호 | 청구항 |
|---|---|
| 1 | (1) 약물 및 타겟 단백질의 각각의 서열을 사전 학습된 자연어 처리 모델에 입력하고, 출력 임베딩을 출력하는 단계;(2) 상기 자연어 처리 모델의 출력 임베딩 중 일부 토큰을 연결하여 벡터를 생성하는 단계; 및(3) 상기 벡터를 인공 신경망 모델에 입력하고, 약물-표적 상호작용 확률을 출력하는 단계를 포함하고,상기 인공 신경망 모델은,서로 다른 데이터셋을 통합하여 생성하는 통합 데이터셋의 통합 학습 데이터 및 통합 검증 데이터로 학습하며,상기 통합 데이터셋은,서로 다른 데이터셋의 학습 데이터를 각각 병합(Merge) 및 혼합(Shuffle)하여 생성하는 통합 학습 데이터;서로 다른 데이터셋의 검증 데이터를 각각 병합(Merge)하여 생성하는 통합 검증 데이터; 및서로 다른 데이터셋의 시험 데이터를 모두 포함하는 통합 시험 데이터를 포함하고,상기 (1) 단계는,(1-1) 약물의 화합물 서열 및 타겟 단백질의 아미노산 서열을 입력 받는 단계; 및(1-2) 상기 화합물 서열 및 상기 아미노산 서열을 토큰화하여 상기 화합물 서열의 토큰을 화합물 자연어 처리 모델에, 상기 아미노산 서열의 토큰을 단백질 자연어 처리 모델에 입력하고, 각각 하나 이상의 토큰을 포함하는 출력 임베딩을 출력하는 단계를 포함하며,상기 (2) 단계는,상기 각각의 출력 임베딩 중 서열에 대한 요약 정보를 가지는 각각의 첫 번째 토큰만을 연결하여 특징 벡터를 생성하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 약물-표적 상호작용 예측 방법. |
| 2 | 삭제 |
| 3 | 청구항 1에 있어서,상기 화합물 자연어 처리 모델 및 상기 단백질 자연어 처리 모델은 BERT 계열 모델인 것을 특징으로 하는, 자연어 처리 모델을 이용한 약물-표적 상호작용 예측 방법. |
| 4 | 삭제 |
| 5 | 삭제 |
| 6 | 삭제 |
| 7 | 삭제 |
| 8 | 청구항 1에 있어서,상기 (3) 단계는,(3-1) 벡터를 서로 다른 활성화 함수를 가지는 복수의 층을 포함하는 인공 신경망 모델에 입력하고, 출력 벡터를 출력하는 단계; 및(3-2) 상기 출력 벡터에 활성화 함수를 적용하여 0 내지 1 사이의 실수값을 출력하는 단계를 포함하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 약물-표적 상호작용 예측 방법. |
| 9 | 청구항 8에 있어서,상기 (3-1) 단계의 인공 신경망 모델은,다음의 수학식 1 내지 수학식 3이 연산되는 은닉층을 포함하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 약물-표적 상호작용 예측 방법.[수학식 1]v1 = ReLU(FCL1(v))[수학식 2]v2 = tanh(FCL2(v1))[수학식 3]vout = FCL3(v2)여기서, v, v1, v2, 및 vout은 벡터, FCL은 Fully Connected Layer(FCL) 연산, 그리고 ReLU 및 tanh는 활성화 함수임. |
| 10 | 청구항 8에 있어서,상기 (3-1) 단계는,상기 인공 신경망의 임의의 노드를 미리 정해진 확률로 드롭하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 약물-표적 상호작용 예측 방법. |
| 11 | 명령어를 로드하는 메모리; 및상기 명령어를 실행하는 프로세서를 포함하고,상기 명령어는,상기 프로세서가 청구항 1, 청구항 3, 청구항 8 내지 청구항 10 중 어느 한 청구항의 단계를 수행하도록 하는 것을 특징으로 하는, 자연어 처리 모델을 이용한 약물-표적 상호작용 예측 장치. |