发明名称 |
获得输入库的方法、装置及电子设备 |
摘要 |
本发明实施例提供了一种获得输入库的方法、装置及电子设备。该获得输入库的方法包括:获得专业词汇的关联词;计算所述关联词与语料库中语料的相似度;在所述语料库中抽取相似度大于或等于第一相似度阈值的语料,作为近似语料;根据近似语料训练获得所述专业词汇对应的专业词库和/或语言模型。该方法在用户输入专业词汇时可以基于该专业词库实现一次上屏,在输入专业长句时可以依据该语言模型进行长句输入,避免了分段上屏,节省了用户输入时间,提高了字符输入效率,也极大地改善了用户在输入专业词汇尤其是在撰写专业论文时的输入体验。 |
申请公布号 |
CN105608083A |
申请公布日期 |
2016.05.25 |
申请号 |
CN201410641573.2 |
申请日期 |
2014.11.13 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
李亚丽;闫冰;张扬 |
分类号 |
G06F17/30(2006.01)I;G06F3/023(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种获得输入库的方法,其特征在于,包括:获得专业词汇的关联词;计算所述关联词与语料库中语料的相似度;在所述语料库中抽取相似度大于或等于第一相似度阈值的语料,作为近似语料;根据近似语料训练获得所述专业词汇对应的专业词库和/或语言模型。 |
地址 |
100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |