发明名称 | 用于提及检测中的消歧的方法和系统 | ||
摘要 | 本公开内容涉及用于提及检测中的消歧的方法和系统。一个实施例公开了一种用于提及检测中的消歧的方法,包括:确定文本中的目标词形在文本中出现的至少一个位置;基于目标词形在每个位置处的词袋上下文,获取目标词形在文本中的总体词袋上下文,每个位置处的词袋上下文包含位置的预定邻域内的词;基于目标词形在每个位置处的资源上下文,获取目标词形在文本中的总体资源上下文,每个位置处的资源上下文包含位置的预定邻域内的其他词形所对应的资源;以及基于总体词袋上下文和总体资源上下文来确定目标词形与用于目标词形的候选资源之间的相似度。还描述了相应的系统。 | ||
申请公布号 | CN105630763A | 申请公布日期 | 2016.06.01 |
申请号 | CN201410601824.4 | 申请日期 | 2014.10.31 |
申请人 | 国际商业机器公司 | 发明人 | 祝慧佳;倪渊;许琼恺;曹锋;N·斯洛宁 |
分类号 | G06F17/27(2006.01)I | 主分类号 | G06F17/27(2006.01)I |
代理机构 | 北京市金杜律师事务所 11256 | 代理人 | 王茂华 |
主权项 | 一种用于提及检测中的消歧的方法,所述方法包括:确定文本中的目标词形在所述文本中出现的至少一个位置;基于所述目标词形在每个所述位置处的词袋上下文,获取所述目标词形在所述文本中的总体词袋上下文,每个所述位置处的所述词袋上下文包含所述位置的预定邻域内的词;基于所述目标词形在每个所述位置处的资源上下文,获取所述目标词形在所述文本中的总体资源上下文,每个所述位置处的所述资源上下文包含所述位置的预定邻域内的其他词形所对应的资源;以及基于所述总体词袋上下文和所述总体资源上下文来确定所述目标词形与用于所述目标词形的候选资源之间的相似度。 | ||
地址 | 美国纽约阿芒克 |