摘要 |
<p>일 실시 형태에 따른 단어 분할 장치는, 접수부, 분할부, 문자 변환부, 산출부 및 출력부를 구비한다. 접수부는 원시 언어로 기술된 입력 문자열을 접수한다. 분할부는 입력 문자열을 1 이상의 단어 후보로 분할하는 처리를 복수의 분할 패턴을 사용해서 실행함으로써, 복수 종류의 단어 후보열을 취득한다. 문자 변환부는, 각 단어 후보열 내의 각 단어 후보를 번역 언어로 문자 변환한다. 산출부는 번역 언어의 코퍼스를 참조하여, 문자 변환된 각 단어 후보열의 타당성을 스코어로서 구한다. 출력부는 스코어에 기초해서 선택한 단어 후보열을 출력한다.</p> |