发明名称 | 用基于图表的分级来分级文本中单词和概念的方法和系统 | ||
摘要 | 本发明是用于从文本语料库中识别感兴趣的单词,文本段或者概念的一种方法和系统。构建覆盖文本语料库的图表。图表包括节点和连接,其中节点表示单词或者概念,节点间的连接表示有方向的关系名称。随后对于图表中的每个节点计算一个得分。也可以对图表中较大的子图表部分计算得分(比如元组)。得分被用于识别图表中期望的子图表部分,那些子图表部分被称作图表片段。 | ||
申请公布号 | CN1691014A | 申请公布日期 | 2005.11.02 |
申请号 | CN200510053179.8 | 申请日期 | 2005.03.02 |
申请人 | 微软公司 | 发明人 | A·A·梅尼泽斯;L·H·范德文蒂;M·L·班科 |
分类号 | G06F17/30 | 主分类号 | G06F17/30 |
代理机构 | 上海专利商标事务所有限公司 | 代理人 | 钱慰民 |
主权项 | 1.一种识别由文本输入表示的感兴趣的特征的方法,其特征在于,它包括:构建一对应于所述文本输入的图表;对所述图表的子图表分量计分;基于所述得分识别感兴趣的图表片段;以及基于所识别的图表片段执行文本操纵。 | ||
地址 | 美国华盛顿州 |