发明名称 获取新词的方法和装置
摘要 本发明实施例公开了一种获取新词的方法和装置,属于计算机技术领域。所述方法包括:根据输入法词典获取专业领域的专业用户;从所述输入法词典获取所述专业用户使用的词,将所述获取的词作为所述专业领域的侯选词,所述输入法词典用于存储用户使用的词,所述用户包括专业用户和普通用户;根据所述专业用户和所述普通用户使用所述候选词的频率情况从所述候选词中获取侯选新词;将所述侯选新词与所述专业领域词典中的词进行比较,确定所述专业领域词典中不存在的侯选新词为新词。所述装置包括:第一获取模块、第二获取模块、第一确定模块和第二确定模块。本发明实施例获取专业领域的新词、提高算法效率,增加实用性。
申请公布号 CN101539940A 申请公布日期 2009.09.23
申请号 CN200910083143.2 申请日期 2009.05.04
申请人 清华大学;北京搜狗科技发展有限公司 发明人 郑亚斌;刘知远;孙茂松;茹立云;张扬
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三高永信知识产权代理有限责任公司 代理人 何文彬
主权项 1、一种获取新词的方法,其特征在于,所述方法包括:根据输入法词典和专业领域词典获取专业领域的专业用户;根据所述输入法词典获取所述专业用户使用的词,将所述获取的词作为所述专业领域的侯选词,所述输入法词典用于存储用户使用的词,所述用户包括专业用户和普通用户;根据所述专业用户和所述普通用户使用所述候选词的频率情况从所述候选词中获取侯选新词;将所述侯选新词与所述专业领域词典中的词进行比对,确定所述专业领域词典中不存在的侯选新词为新词。
地址 100084北京市海淀区清华园1号