发明名称 | 来自所提取的内容的内容创建 | ||
摘要 | 各示例描述了对于来自所提取的内容的至少一个概要的内容创建。接收到输入信息,该输入信息包括到登陆页的链接和关键词信息(302)。评估登陆页并且从登陆页中提取包括图像数据和文本数据中的至少一者的内容(304)。分析所提取的内容的特性(306)。所提取的内容基于所分析的特性以及至少两个排序算法的应用来被排序(308)。所应用的第一排序算法基于与登陆页的相关性来排序该内容,而所应用的第二排序算法基于与关键词信息的相关性来排序该内容。基于将过滤规则应用到经排序的内容来过滤经排序的内容以移除被确定为不具有吸引力的内容或内容部分(310)。从经过滤的且经排序的内容中创建至少一个概要(312)。 | ||
申请公布号 | CN106462588A | 申请公布日期 | 2017.02.22 |
申请号 | CN201580015033.6 | 申请日期 | 2015.01.14 |
申请人 | 微软技术许可有限责任公司 | 发明人 | Y·林;M·约丹;G·杨 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 上海专利商标事务所有限公司 31100 | 代理人 | 胡利鸣 |
主权项 | 一种计算机实现的方法(300),包括:接收(302)用于内容创建的输入信息,其中所述输入信息包括到登陆页的链接和关键词信息;评估(304)所述登陆页并且从所述登陆页中提取包括图像数据和文本数据中的至少一者的内容;分析(306)所提取的内容的特性;基于所述内容的所分析的特性以及至少两个排序算法的应用来排序(308)所提取的内容,其中所应用的第一排序算法基于与所述登陆页的相关性来排序所述所提取的内容,而所应用的第二排序算法基于与所述关键词信息的相关性来排序所提取的内容;基于将过滤规则应用到经排序的内容来过滤(310)经排序的内容以移除被确定为不具有吸引力的内容或内容部分;以及从经过滤的且经排序的内容中创建(312)至少一个概要。 | ||
地址 | 美国华盛顿州 |