분자 문자열에서 특성화 토큰을 생성하는 방법 및 장치
METHOD AND APPARATUS FOR GENERAING FEATURIZATION TOKEN FROM MOLECULAR STRING
특허 요약
본 발명은 분자 문자열에서 특성화 토큰을 생성하는 방법 및 장치에 관한 것으로, 본 발명의 일면에 따른 분자 문자열에서 특성화 토큰을 생성하는 방법은 컴퓨팅 장치에 의해 수행되는 방법에 관한 것으로, 원자, 고리, 분기에 대해 기설정된 문자들이 대괄호로 구분된 문자열 데이터를 대괄호 단위로 분할하여 토큰들을 생성하는 단계, 각 토큰의 위치와 각 토큰에 포함된 문자에 따라 분기 또는 고리 여부를 나타내기 위한 심볼벡터와 크기를 포함하고 각 토큰의 위치에 따른 키와 쌍을 이루는 분기 고리 정보를 산출하는 단계, 각 토큰을 벡터화하는 단계, 각 토큰에서 다음 위치의 토큰의 위치를 키로 가지는 분기 고리 정보가 존재하는지에 따라 분기 고리 정보 또는 기설정된 초기값들 중 어느 하나로 구성된 추가 벡터를 토큰별로 산출하는 단계 및 벡터화된 토큰과 산출한 추가 벡터를 결합하여 특성화 토큰을 생성하는 단계를 포함한다.
청구항
번호청구항
1

컴퓨팅 장치에 의해 수행되는 방법에 관한 것으로,원자, 고리, 분기에 대해 기설정된 문자들이 대괄호로 구분된 문자열 데이터를 대괄호 단위로 분할하여 토큰들을 생성하는 단계;각 토큰의 위치와 각 토큰에 포함된 문자에 따라 분기 또는 고리 여부를 나타내기 위한 심볼벡터와 크기를 포함하고 각 토큰의 위치에 따른 키와 쌍을 이루는 분기 고리 정보를 산출하는 단계;각 토큰을 벡터화하는 단계;각 토큰에서 다음 위치의 토큰의 위치를 키로 가지는 분기 고리 정보가 존재하는지에 따라 상기 분기 고리 정보 또는 기설정된 초기값들 중 어느 하나로 구성된 추가 벡터를 토큰별로 산출하는 단계; 및벡터화된 토큰과 산출한 추가 벡터를 결합하여 특성화 토큰을 생성하는 단계;를 포함하는 분자 문자열에서 특성화 토큰을 생성하는 방법.

2

제1항에 있어서,상기 분기 고리 정보를 산출하는 단계는 대괄호 단위로 분할한 토큰들에서 최좌측부터 순서대로 각 토큰의 위치와 각 토큰에 포함된 문자를 획득하는 단계;상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되는지 판단하는 단계;상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되면 상기 토큰의 다음에 위치한 다음 순서의 토큰을 획득하여 상기 다음 순서의 토큰의 문자에 대해 기설정된 인덱스값에 따라 크기를 산출하는 단계; 및 상기 토큰의 위치에 따른 키와 쌍을 이루며 분기나 고리 중 어느 하나에 대해 기설정된 심볼벡터와 상기 크기를 포함하는 분기 고리 정보를 출력하는 단계;를 포함하는 것인 분자 문자열에서 특성화 토큰을 생성하는 방법.

3

제2항에 있어서,상기 각 토큰의 위치와 각 토큰에 포함된 문자를 획득하는 단계 이후와 상기 분기나 고리 중 어느 하나에 대응되는지 판단하는 단계 이전에 있어서,상기 토큰의 위치가 기설정된 건너뛸 위치 이내인지 판단하는 단계;를 더 포함하고,상기 토큰의 위치가 기설정된 건너뛸 위치 이내가 아니면 상기 분기나 고리 중 어느 하나에 대응되는지 판단하는 단계를 수행하고,상기 토큰의 위치가 기설정된 건너뛸 위치 이내이면 각 토큰의 위치와 각 토큰에 포함된 문자를 획득하는 단계로 돌아가며, 상기 크기를 산출하는 단계에서는상기 다음 순서의 토큰의 위치에 따라 건너뛸 위치를 업데이트 하는 것인 분자 문자열에서 특성화 토큰을 생성하는 방법.

4

제2항에 있어서,상기 크기를 산출하는 단계는 상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되면 상기 토큰에 포함된 문자에서 숫자를 추출하고, 상기 토큰을 기준으로 추출한 숫자만큼 다음 순서의 토큰을 획득하며, 획득한 각 토큰에 역순으로 자리수를 부여해 각 자리수에 대해 기설정된 값을 토큰의 문자에 대해 기설정된 인덱스값과 곱해 합산하여 특수인덱스값을 산출하며, 상기 특수인덱스값을 통해 크기를 산출하는 것인 분자 문자열에서 특성화 토큰을 생성하는 방법.

5

명령들을 저장하는 메모리; 및상기 메모리에 저장된 명령들을 수행하는 프로세서;를 포함하고,상기 프로세서는 상기 메모리에 저장된 명령들을 수행함에 따라,원자, 고리, 분기에 대해 기설정된 문자들이 대괄호로 구분된 문자열 데이터를 대괄호 단위로 분할하여 토큰들을 생성하고,각 토큰의 위치와 각 토큰에 포함된 문자에 따라 분기 또는 고리 여부를 나타내기 위한 심볼벡터와 크기를 포함하고 각 토큰의 위치에 따른 키와 쌍을 이루는 분기 고리 정보를 산출하며, 각 토큰을 벡터화하고,각 토큰에서 다음 위치의 토큰의 위치를 키로 가지는 분기 고리 정보가 존재하는지에 따라 상기 분기 고리 정보 또는 기설정된 초기값들 중 어느 하나로 구성된 추가 벡터를 토큰별로 산출하며,벡터화된 토큰과 산출한 추가 벡터를 토큰별로 결합하여 특성화 토큰을 생성하는 것인 분자 문자열에서 특성화 토큰을 생성하는 장치.

6

제5항에 있어서,상기 프로세서는 대괄호 단위로 분할한 토큰들에서 최좌측부터 순서대로 각 토큰의 위치와 각 토큰에 포함된 문자를 획득하고,상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되는지 판단하며,상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되면 상기 토큰의 다음에 위치한 다음 순서의 토큰을 획득하여 상기 다음 순서의 토큰의 문자에 대해 기설정된 인덱스값에 따라 크기를 산출하고,상기 토큰의 위치에 따른 키와 쌍을 이루며 분기나 고리 중 어느 하나에 대해 기설정된 심볼벡터와 상기 크기를 포함하는 분기 고리 정보를 출력하는 것인 분자 문자열에서 특성화 토큰을 생성하는 장치.

7

제6항에 있어서,상기 프로세서는 획득한 각 토큰의 위치가 기설정된 건너뛸 위치 이내인지 판단하고,상기 토큰의 위치가 기설정된 건너뛸 위치 이내가 아니면 상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되는지 판단하며,상기 토큰의 위치가 기설정된 건너뛸 위치 이내이면 다음 순서의 각 토큰의 위치와 각 토큰에 포함된 문자를 획득하여 획득한 각 토큰의 위치가 기설정된 건너뛸 위치 이내인지 판단하고, 상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되면 상기 다음 순서의 토큰의 위치에 따라 건너뛸 위치를 업데이트 하는 것인 분자 문자열에서 특성화 토큰을 생성하는 장치.

8

제6항에 있어서,상기 프로세서는 상기 토큰에 포함된 문자가 분기나 고리 중 어느 하나에 대응되면 상기 토큰에 포함된 문자에서 숫자를 추출하고, 상기 토큰을 기준으로 추출한 숫자만큼 다음 순서의 토큰을 획득하며, 획득한 각 토큰에 역순으로 자리수를 부여해 각 자리수에 대해 기설정된 값을 토큰의 문자에 대해 기설정된 인덱스값과 곱해 합산하여 특수인덱스값을 산출하며, 상기 특수인덱스값을 통해 크기를 산출하는 것인 분자 문자열에서 특성화 토큰을 생성하는 장치.