인공지능을 이용하여 유전체 염기서열로 질환 진단 및 예측 방법, 그 시스템
METHOD FOR DIAGNOSING AND PREDICTING DISEASES WITH GENOME SEQUENCE USING ARTIFICIAL INTELLIGENCE, AND THE SYSTEM THEREOF
특허 요약
본 발명은 길이가 긴 유전체 정보를 언어 문장처럼 인식해 올바른 질병을 예측할 수 있는 인공지능을 이용하여 유전체 염기서열로 질환 진단 및 예측 방법 및 그 시스템에 관한 것으로서, 유전체 염기서열을 하나 이상의 작은 단위로 토큰화(tokenize)하는 단계, 상기 토큰화된 염기서열 각각에 위치 인코딩(positional encoding)하는 단계, 상기 위치 인코딩이 포함된 토큰화된 염기서열을 멀티 헤드 어텐션 인코더(Multi-Head Attention Encoder) 및 MLP(Multi-Layer Perception)의 인공신경망 모델을 통과시켜 질병을 예측하는 방법을 학습시키는 단계 및 상기 인공신경망 모델을 통해 질병의 종류 및 유무를 구별하여 질환을 예측하는 단계를 포함한다.
청구항
번호청구항
8

제7항에 있어서,상기 인코딩부는 상기 토큰화된 염기서열 각각에 상기 위치 인코딩을 결합하여 각각의 위치 정보를 식별할 수 있도록 하는, 질병 예측 시스템.

9

제7항에 있어서,상기 학습부는상기 위치 인코딩이 포함된 토큰화된 염기서열을 상기 멀티 헤드 어텐션 인코더에 통과시켜 셀프 어텐션(self-attention)을 학습시키고, 상기 멀티 헤드 어텐션 인코더의 출력을 상기 MLP에 통과시켜 질병을 예측하는 방법을 학습시키는, 질병 예측 시스템.

1

인공지능을 이용하여 유전체 염기서열로 질환을 예측하는 질병 예측 방법에 있어서, 유전체 염기서열을 하나 이상의 작은 단위로 토큰화(tokenize)하는 단계;상기 토큰화된 염기서열 각각에 위치 인코딩(positional encoding)하는 단계;상기 위치 인코딩이 포함된 토큰화된 염기서열을 멀티 헤드 어텐션 인코더(Multi-Head Attention Encoder) 및 MLP(Multi-Layer Perception)의 인공신경망 모델을 통과시켜 질병을 예측하는 방법을 학습시키는 단계; 및 상기 인공신경망 모델을 통해 질병의 종류 및 유무를 구별하여 질환을 예측하는 단계를 포함하되,상기 MLP는 상기 멀티 헤드 어텐션 인코더에서 출력된 결과물만을 바로 입력받으며, 상기 질환을 예측하는 단계는상기 MLP를 통과한 출력을 기반으로 상기 유전체 염기서열에서 예측하고자 하는 질병의 확률 벡터를 출력하여 질병의 종류 및 유무를 구별을 통해 질환을 예측하는 것을 특징으로 하는 질병 예측 방법.

2

제1항에 있어서,상기 위치 인코딩하는 단계는 상기 토큰화된 염기서열 각각에 상기 위치 인코딩을 결합하여 각각의 위치 정보를 식별할 수 있도록 하는, 질병 예측 방법.

3

제1항에 있어서,상기 학습시키는 단계는상기 위치 인코딩이 포함된 토큰화된 염기서열을 상기 멀티 헤드 어텐션 인코더에 통과시켜 셀프 어텐션(self-attention)을 학습시키는 단계; 및상기 멀티 헤드 어텐션 인코더의 출력을 상기 MLP에 통과시켜 질병을 예측하는 방법을 학습시키는 단계를 포함하는 질병 예측 방법.

4

제3항에 있어서,상기 셀프 어텐션을 학습시키는 단계는상기 위치 인코딩이 포함된 토큰화된 염기서열을 수신하여 상기 멀티 헤드 어텐션 인코더를 통해 게놈 서열(genome sequence)의 셀프 어텐션 정보(self-attention information)을 추출해내는 방법을 학습시키는 것을 특징으로 하는, 질병 예측 방법.

5

제4항에 있어서,상기 MLP에 통과시켜 질병을 예측하는 방법을 학습시키는 단계는상기 MLP를 통해 상기 멀티 헤드 어텐션 인코더가 출력한 상기 셀프 어텐션 정보로부터 질병을 예측하는 방법을 학습시키는 것을 특징으로 하는, 질병 예측 방법.

6

삭제

7

인공지능을 이용하여 유전체 염기서열로 질환을 예측하는 질병 예측 시스템에 있어서, 유전체 염기서열을 하나 이상의 작은 단위로 토큰화(tokenize)하는 토큰화부;상기 토큰화된 염기서열 각각에 위치 인코딩(positional encoding)하는 인코딩부;상기 위치 인코딩이 포함된 토큰화된 염기서열을 멀티 헤드 어텐션 인코더(Multi-Head Attention Encoder) 및 MLP(Multi-Layer Perception)의 인공신경망 모델을 통과시켜 질병을 예측하는 방법을 학습시키는 학습부; 및 상기 인공신경망 모델을 통해 질병의 종류 및 유무를 구별하여 질환을 예측하는 질환 예측부를 포함하되,상기 MLP는 상기 멀티 헤드 어텐션 인코더에서 출력된 결과물만을 바로 입력받으며, 상기 질환 예측부는상기 MLP를 통과한 출력을 기반으로 상기 유전체 염기서열에서 예측하고자 하는 질병의 확률 벡터를 출력하여 질병의 종류 및 유무를 구별을 통해 질환을 예측하는 것을 특징으로 하는 질병 예측 시스템.

10

제9항에 있어서,상기 학습부는상기 위치 인코딩이 포함된 토큰화된 염기서열을 수신하여 상기 멀티 헤드 어텐션 인코더를 통해 게놈 서열(genome sequence)의 셀프 어텐션 정보(self-attention information)을 추출해내는 방법을 학습시키는 것을 특징으로 하는, 질병 예측 시스템.

11

제10항에 있어서,상기 학습부는상기 MLP를 통해 상기 멀티 헤드 어텐션 인코더가 출력한 상기 셀프 어텐션 정보로부터 질병을 예측하는 방법을 학습시키는 것을 특징으로 하는, 질병 예측 시스템.

12

삭제