发明名称 用基于图表的分级来分级文本中单词和概念的方法和系统
摘要 本发明是用于从文本语料库中识别感兴趣的单词,文本段或者概念的一种方法和系统。构建覆盖文本语料库的图表。图表包括节点和连接,其中节点表示单词或者概念,节点间的连接表示有方向的关系名称。随后对于图表中的每个节点计算一个得分。也可以对图表中较大的子图表部分计算得分(比如元组)。得分被用于识别图表中期望的子图表部分,那些子图表部分被称作图表片段。
申请公布号 CN1691014A 申请公布日期 2005.11.02
申请号 CN200510053179.8 申请日期 2005.03.02
申请人 微软公司 发明人 A·A·梅尼泽斯;L·H·范德文蒂;M·L·班科
分类号 G06F17/30 主分类号 G06F17/30
代理机构 上海专利商标事务所有限公司 代理人 钱慰民
主权项 1.一种识别由文本输入表示的感兴趣的特征的方法,其特征在于,它包括:构建一对应于所述文本输入的图表;对所述图表的子图表分量计分;基于所述得分识别感兴趣的图表片段;以及基于所识别的图表片段执行文本操纵。
地址 美国华盛顿州