发明名称 |
来自文档概述的问题概念的本体分类 |
摘要 |
本发明描述了一种来自文档概述的问题概念的本体分类。分析电子文档来标识断言,逆转这些断言来生成可由断言回答的问题。可以分析文档或电子文档语料库来标识文档的文本内的各实体以及各实体之间的关系。基于各实体以及各实体之间的关系来标识断言。每一断言表示关于实体的一个事实,并且一组断言表示文档或文档语料库的概述。逆转断言来生成可由这些断言回答的问题。还可以进一步分析这些问题来标识相关概念和话题并围绕这些概念和话题来对问题进行聚类。还可以生成便于在话题、概念、问题、断言、文档概述和文档之间遍历的组合图。 |
申请公布号 |
CN102163215B |
申请公布日期 |
2013.11.06 |
申请号 |
CN201110063258.2 |
申请日期 |
2011.03.07 |
申请人 |
微软公司 |
发明人 |
V·瓦德拉曼尼;A·斯里瓦斯塔瓦;T·纳杰姆;M·斯里坎斯;P·瓦达迪;A·C·萨瑞德兰 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
黄嵩泉 |
主权项 |
一种用于在搜索技术中围绕相关概念和话题聚类问题的方法,所述方法包括:标识(202)包括一个或多个文档的文档语料库;提取(406)所述一个或多个文档的文本内的实体;基于所述一个或多个文档的文本来提取(406)实体之间的关系;基于从所述一个或多个文档的文本中提取的实体和关系来标识(410)多个断言;以及逆转(412)所述多个断言来生成多个问题;标识与所述多个问题相关联的话题;围绕所述话题来对所述问题进行聚类;以及生成允许在所述话题、所述问题、所述断言以及所述一个或多个文档之间遍历的组合图。 |
地址 |
美国华盛顿州 |