发明名称 |
辞典产生装置、辞典产生方法、辞典产生程式产品、及记忆该程式之电脑可读取记录媒体 |
摘要 |
本发明之辞典产生装置具备:模型产生部,其使用预先准备之语料库及单词群产生单词分割模型;解析部,其对所收集之文本之集合执行组入有单词分割模型之单词分割,并对各文本赋予界限资讯;选择部,其自藉由解析部赋予界限资讯之文本中选择所要登录于辞典之单词;及登录部,其将由选择部选择之单词登录于辞典。对语料库中所含之各文本赋予表示单词之界限之界限资讯。 |
申请公布号 |
TWI452475 |
申请公布日期 |
2014.09.11 |
申请号 |
TW101133547 |
申请日期 |
2012.09.13 |
申请人 |
乐天股份有限公司 日本 |
发明人 |
萩原正人 |
分类号 |
G06F17/28;G06F17/30 |
主分类号 |
G06F17/28 |
代理机构 |
|
代理人 |
陈长文 台北市松山区敦化北路201号7楼 |
主权项 |
一种辞典产生装置,其具备:模型产生部,其使用预先准备之语料库及单词群产生单词分割模型,且对上述语料库中所含之各文本赋予表示单词界限之界限资讯,且上述界限资讯包含表示文字间位置上不存在上述界限之第1资讯、表示文字间位置上存在上述界限之第2资讯、及表示文字间位置上概率性存在上述界限之第3资讯;解析部,其对所收集之文本之集合执行组入有上述单词分割模型之单词分割,并对各文本赋予上述界限资讯;选择部,其自藉由上述解析部赋予上述界限资讯之文本中选择所要登录于辞典之单词;及登录部,其将由上述选择部选择之单词登录于上述辞典。 |
地址 |
日本 |