发明名称 拼音文字词库构建方法和装置及输入方法和系统
摘要 本发明提供了一种拼音文字词库构建方法,其包括以下步骤:动态地获取用户输入的字符串;分析字符串,确定其中的拼音文字单词并记录;记录拼音文字单词出现的次数;以及如果出现的次数已达到阈值,则将拼音文字单词存储于词库中;分析拼音文字单词之间的关联关系并记录;记录关联关系出现的次数;以及如果关联关系出现的次数已达到阈值,则将单词之间的关联关系存储于词库中。本发明还提供了相应的拼音文字词库构建装置以及利用所构建的词库的拼音文字输入方法以及输入系统。利用本发明的拼音文字输入方法和系统,能提高输入速度。
申请公布号 CN104731766A 申请公布日期 2015.06.24
申请号 CN201310713785.2 申请日期 2013.12.20
申请人 淘宝(中国)软件有限公司 发明人 张岩
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I;G06F3/0482(2013.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京新知远方知识产权代理事务所(普通合伙) 11397 代理人 张艳
主权项 一种拼音文字词库构建方法,包括以下步骤:动态地获取用户输入的字符串;分析所述字符串,确定其中由分词符分隔的字符串片段,将其视为拼音文字单词并记录下来;记录其中词库中不存在的拼音文字单词出现的次数;以及如果所述拼音文字单词出现的次数已达到阈值,则将所述拼音文字单词存储于词库中;分析所述拼音文字单词之间的关联关系,即单词出现的前后关系,并将其前后关系记录下来;记录所述拼音文字单词之间的关联关系出现的次数;以及如果所述关联关系出现的次数已达到阈值,则将所述单词之间的关联关系存储于词库中。
地址 311100 浙江省杭州市余杭区五常街道荆丰村