摘要 |
기계 번역을 위한 구 표 생성 방법이 개시된다. 제1 국어와 제2 국어 간의 구 표(Phrase Table)를 생성하는 방법은 제1 국어 및 제2 국어로 표현된 두 문장을 대응시킨 병렬 코퍼스(bilingual corpus)를 수집하는 단계, 수집된 병렬 코퍼스에 포함된 제1 국어의 제1 단어들 및 제2 국어의 제2 단어들 사이의 의미론적 관계(semantic relationship)를 캡쳐하는 DNN(Deep Neural Network) 기반의 기계 학습의 결과에 기초하여, 제1 단어들 및 제2 단어들에 대응하는 수치들을 생성하는 단계, 병렬 코퍼스로부터 제1 국어의 제1 구와 제2 국어의 제2 구를 대응시킨 구 엔트리를 추출하는 단계, 생성된 수치들을 이용하여 추출된 구 엔트리의 제1 구와 제2 구의 유사도(similarity)를 계산하는 단계 및 계산된 유사도를 기설정된 임계치와 비교한 결과에 기초하여, 구 엔트리를 포함하는 구 표를 생성하는 단계를 포함한다. |