| 번호 | 청구항 |
|---|---|
| 1 | 입력 문장을 수신하는 단계;상기 입력 문장에 포함된 언레이블된 단어(unlabeled word)를 검출하는 단계;복수의 언레이블된 단어들에 대응하여 기 생성된 특징 벡터들을 저장하는 룩업 테이블(lookup table)로부터 상기 언레이블된 단어에 대응하는 특징 벡터를 검출함으로써 상기 언레이블된 단어를 임베딩(embedding)하는 단계; 및 상기 임베딩 결과에 따른 특징 벡터를 출력하는 단계를 포함하고, 상기 입력 문장의 적어도 일부를 기반으로 인터넷에서 웹 서치를 수행하여 상기 입력 문장에서 언레이블된 단어와 구별되는 처음 보는 단어를 검색하는 단계;상기 처음 보는 단어를 임베딩하기 위한특징 벡터를 미리 계산하는 단계; 및 상기 미리 계산된 특징 벡터를 상기 룩업 테이블에 저장하는 단계를 더 포함하며,학습에 사용될 상기 처음 보는 단어가 포함된 문장이 선택되면, 상기 선택된 문장의 적어도 일부를 기반으로 상기 웹 서치를 수행하여 상기 선택된 문장에 유사한 문장들을 포함하는 문장 목록을 생성하는 단계;미리 설정된 임계치를 이용하여 상기 문장 목록 중 상기 선택된 문장에 가장 유사한 문장을 선택 및 추출하는 단계; 및 상기 가장 유사한 문장을 뉴럴 네트워크 모델에 인가함으로써 상기 처음보는 단어를 벡터 표현으로 변환하는 단계를 더 포함하는, 단어 임베딩 방법. |
| 2 | 제1항에 있어서,상기 언레이블된 단어를 임베딩하는 단계는상기 언레이블된 단어에 대응하는 적어도 하나의 레이블된 단어를 검색하는 단계; 및상기 입력 문장에 포함된 레이블된 단어들과 상기 검색된 적어도 하나의 레이블된 단어에 기초하여, 상기 언레이블된 단어를 임베딩하는 단계를 포함하는, 단어 임베딩 방법. |
| 3 | ◈청구항 3은(는) 설정등록료 납부시 포기되었습니다.◈제2항에 있어서, 상기 적어도 하나의 레이블된 단어를 검색하는 단계는상기 웹 서치 또는 미리 저장된 사전 데이터베이스 중 적어도 하나를 이용하여 상기 적어도 하나의 레이블된 단어를 검색하는 단계를 포함하는, 단어 임베딩 방법. |
| 4 | ◈청구항 4은(는) 설정등록료 납부시 포기되었습니다.◈제1항에 있어서,상기 언레이블된 단어는상기 입력 문장의 레이블된 단어를 제외한 나머지 단어를 포함하는, 단어 임베딩 방법. |
| 5 | 제1항에 있어서,상기 언레이블된 단어를 검출하는 단계는상기 입력 문장에 포함된 복수의 단어들 각각에 대응하는 특징 벡터들을 획득하는 단계; 및해당 단어에 대응하여 특징 벡터를 획득할 수 없는 경우, 상기 해당 단어를 상기 언레이블된 단어로 검출하는 단계를 포함하는, 단어 임베딩 방법. |
| 6 | 제5항에 있어서,상기 특징 벡터들을 획득하는 단계는상기 해당 단어를 뉴럴 네트워크를 포함하는 제1 모델에 인가함으로써, 상기 해당 단어에 대응하는 미리 정해진 유형의 특징 벡터들을 획득하는 단계를 포함하는, 단어 임베딩 방법. |
| 7 | 제6항에 있어서,상기 처음 보는 단어의 특징 벡터를 미리 계산하는 단계는 상기 처음 보는 단어를 상기 제1 모델과 구별되는 제2 모델에 인가함으로써 임베딩하는 단계를 포함하는, 단어 임베딩 방법. |
| 8 | 제1항에 있어서,상기 처음 보는 단어의 특징 벡터를 미리 계산하는 단계는상기 입력 문장에 포함된 레이블된 단어들을 포함하는 유사 문장들을 검색하는 단계; 및상기 유사 문장들 중 최대 유사도를 가지는 최유사 문장을 이용하여 상기 처음 보는 단어를 임베딩하는 단계를 포함하는, 단어 임베딩 방법. |
| 9 | 제8항에 있어서,상기 처음 보는 단어를 임베딩하는 단계는상기 입력 문장에 포함된 레이블된 단어들을 포함하는 유사 문장들을 검색하는 단계; 상기 유사 문장들 중 설정된 임계치보다 큰 유사도를 가지는 적어도 하나의 유사 문장을 추출하는 단계; 및 상기 적어도 하나의 유사 문장을 제1 모델과 구별되는 제2 모델에 인가함으로써 상기 처음 보는 단어를 임베딩하는 단계를 포함하고, 상기 제2 모델은 상기 입력 문장의 문맥 또는 상기 입력 문장에 포함된 단어들 간의 관계 중 적어도 하나에 기초하여 상기 처음 보는 단어의 의미를 추정하는 뉴럴 네트워크를 포함하는, 단어 임베딩 방법. |
| 10 | 제9항에 있어서,상기 적어도 하나의 유사 문장을 추출하는 단계는상기 임계치보다 큰 유사도를 가지는 적어도 하나의 유사 문장을 유사도 순으로 추출하는 단계를 포함하는, 단어 임베딩 방법. |
| 11 | ◈청구항 11은(는) 설정등록료 납부시 포기되었습니다.◈제1항에 있어서,상기 언레이블된 단어를 임베딩하는 단계는상기 입력 문장의 문맥에 기초하여 상기 언레이블된 단어를 임베딩하는 단계를 포함하는, 단어 임베딩 방법. |
| 12 | ◈청구항 12은(는) 설정등록료 납부시 포기되었습니다.◈제1항에 있어서, 사용자의 음성을 인식하여 상기 입력 문장을 생성하는 단계;상기 특징 벡터에 기초하여, 상기 입력 문장에 대응하는 해석 정보(interpretation information)를 생성하는 단계를 더 포함하는, 단어 임베딩 방법. |
| 13 | 입력 문장을 수신하는 단계;상기 입력 문장에 포함된 처음 보는 단어(unseen word)에 해당하는 언레이블된 단어(unlabeled word)를 검출하는 단계;웹 서치(web search)를 기반으로 상기 입력 문장과 유사한 문장들을 검색하는 단계;상기 처음 보는 단어의 레이블링을 위한 뉴럴 네트워크 모델에 상기 입력 문장과 상기 유사한 문장들을 함께 인가하여 상기 처음 보는 단어와 문맥 상 유사한 의미를 갖는 벡터 표현을 검출함으로써 상기 언레이블된 단어를 임베딩(embedding)하는 단계; 및 상기 임베딩 결과에 따른 특징 벡터를 출력하는 단계를 포함하고,학습에 사용될 상기 처음 보는 단어가 포함된 문장이 선택되면, 상기 선택된 문장의 적어도 일부를 기반으로 상기 웹 서치를 수행하여 상기 선택된 문장에 유사한 문장들을 포함하는 문장 목록을 생성하는 단계;미리 설정된 임계치를 이용하여 상기 문장 목록 중 상기 선택된 문장에 가장 유사한 문장을 선택 및 추출하는 단계; 및 상기 가장 유사한 문장을 뉴럴 네트워크 모델에 인가함으로써 상기 처음보는 단어를 벡터 표현으로 변환하는 단계를 더 포함하는, 단어 임베딩 방법. |
| 14 | ◈청구항 14은(는) 설정등록료 납부시 포기되었습니다.◈하드웨어와 결합되어 제1항 내지 제13항 중에서 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터로 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램. |
| 15 | 입력 문장을 수신하는 송수신 인터페이스; 및 상기 입력 문장에 포함된 언레이블된 단어를 검출(detect)하고, 상기 입력 문장에 포함된 레이블된 단어들에 기초하여, 복수의 언레이블된 단어들에 대응하여 기 생성된 특징 벡터들을 저장하는 룩업 테이블(lookup table)로부터 상기 언레이블된 단어에 대응하는 특징 벡터를 검출함으로써 상기 언레이블된 단어를 임베딩(embedding)하는 프로세서를 포함하고, 상기 송수신 인터페이스는상기 임베딩 결과에 따른 특징 벡터를 출력하고, 상기 프로세서는상기 입력 문장의 적어도 일부를 기반으로 인터넷에서 웹 서치를 수행하여 상기 입력 문장에서 언레이블된 단어와 구별되는 처음 보는 단어를 검색하고, 상기 처음 보는 단어를 임베딩하기 위한 특징 벡터를 미리 계산하며, 상기 미리 계산한 특징 벡터를 상기 룩업 테이블에 저장하며, 학습에 사용될 상기 처음 보는 단어가 포함된 문장이 선택되면, 선택된 문장의 적어도 일부를 기반으로 상기 웹 서치를 수행하여 상기 선택된 문장에 유사한 문장들을 포함하는 문장 목록을 생성하고, 미리 설정된 임계치를 이용하여 상기 문장 목록 중 상기 선택된 문장에 가장 유사한 문장을 선택 및 추출하고, 상기 가장 유사한 문장을 뉴럴 네트워크 모델에 인가함으로써 상기 처음보는 단어를 벡터 표현으로 변환하는, 단어 임베딩 장치. |
| 16 | ◈청구항 16은(는) 설정등록료 납부시 포기되었습니다.◈제15항에 있어서,상기 프로세서는 상기 입력 문장에 포함된 복수의 단어들 각각에 대하여, 해당 단어에 대응하는 미리 정해진 유형의 특징 벡터를 획득하고, 상기 해당 단어에 대응하여 상기 미리 정해진 유형의 특징 벡터를 획득할 수 없는 경우, 상기 해당 단어를 상기 언레이블된 단어로 검출하는, 단어 임베딩 장치. |
| 17 | ◈청구항 17은(는) 설정등록료 납부시 포기되었습니다.◈제15항에 있어서,상기 언레이블된 단어는상기 입력 문장의 레이블된 단어를 제외한 나머지 단어를 포함하는, 단어 임베딩 장치. |
| 18 | ◈청구항 18은(는) 설정등록료 납부시 포기되었습니다.◈제15항에 있어서,상기 프로세서는 상기 입력 문장에 포함된 복수의 단어들 각각에 대응하는 특징 벡터들을 획득하고, 해당 단어에 대응하여 특징 벡터를 획득할 수 없는 경우, 해당 단어를 상기 언레이블된 단어로 검출하는, 단어 임베딩 장치. |
| 19 | ◈청구항 19은(는) 설정등록료 납부시 포기되었습니다.◈제15항에 있어서,상기 프로세서는상기 입력 문장에 포함된 레이블된 단어들을 포함하는 유사 문장들을 검색하고, 상기 유사 문장들 중 최대 유사도를 가지는 최유사 문장을 이용하여 상기 처음 보는 단어를 임베딩하는, 단어 임베딩 장치. |
| 20 | ◈청구항 20은(는) 설정등록료 납부시 포기되었습니다.◈제19항에 있어서,상기 프로세서는 상기 입력 문장에 포함된 레이블된 단어들을 포함하는 유사 문장들을 검색하고, 상기 유사 문장들 중 설정된 임계치보다 큰 유사도를 가지는 적어도 하나의 유사 문장을 추출하며, 상기 적어도 하나의 유사 문장을 제1 모델과 구별되는 제2 모델에 인가함으로써상기 처음 보는 단어를 임베딩하며, 상기 제2 모델은 상기 입력 문장의 문맥 또는 상기 입력 문장에 포함된 단어들 간의 관계 중 적어도 하나에 기초하여 상기 처음 보는 단어의 의미를 추정하는 뉴럴 네트워크를 포함하는, 단어 임베딩 장치. |