发明名称 一种用于确定重点索引词的方法、装置和设备
摘要 本发明的目的是提供一种用于确定重点索引词的方法、装置和设备。其中,本发明中获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息;根据多个索引词的展现重要度信息及用户重要度信息,从多个索引词中确定至少一个重点索引词;其中,确定一个索引词的展现重要度信息的方法为获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息,接着根据所述排序位置信息,获得该索引词的展现重要度信息;确定一个索引词的用户重要度信息的方法为获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息,根据出现频度信息,确定该索引词的用户重要度信息。
申请公布号 CN103530789A 申请公布日期 2014.01.22
申请号 CN201210229104.0 申请日期 2012.07.03
申请人 百度在线网络技术(北京)有限公司 发明人 吴梓栋;宋铭;徐惠;余昌远;徐勇明
分类号 G06Q30/02(2012.01)I;G06F17/30(2006.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人 罗朋
主权项 一种用于确定重点索引词的方法,该方法包括以下步骤:a 获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息;b 根据所述多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,从所述多个索引词中确定至少一个重点索引词;其中,一个索引词的展现重要度信息通过以下步骤来确定:i1 获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息;i2 根据所述排序位置信息,获得该索引词的展现重要度信息;其中,一个索引词的用户重要度信息通过以下步骤来确定:x1获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;x2 根据所述出现频度信息,确定该索引词的用户重要度信息。
地址 100085 北京市海淀区上地十街10号百度大厦