发明名称 |
一种人物踪迹的搜索方法及装置 |
摘要 |
本发明实施方式提供了一种人物踪迹的搜索方法及装置,该方法及装置属于网络通信领域,该方法包括:将存储的新闻数据中的每个独立的句子通过模式匹配提取每个独立句子中的时间信息;在独立句子中提取地点信息,在检测出该地点信息的前一个相邻的词存在于存储的趋向描述词集合时,则确定所述地点信息为有效的地点信息;在独立句子中提取人物信息,如提取的人物信息为唯一的人物,则将所述独立句子中的人物、时间、地点作为该人物的一条踪迹,并存储该人物踪迹。该方法及装置具有其效率较高,不会发生人为错误,当新闻数量特别大时,能获取人物踪迹的优点。 |
申请公布号 |
CN102053997A |
申请公布日期 |
2011.05.11 |
申请号 |
CN200910235898.X |
申请日期 |
2009.10.29 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
段孟成;李务斌;贾自艳;姜爱荣 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京凯特来知识产权代理有限公司 11260 |
代理人 |
郑立明;焦丽 |
主权项 |
一种人物踪迹的搜索方法,其特征在于,所述方法包括:将存储的新闻数据中的每个独立的句子通过模式匹配提取每个独立句子中的时间信息;在包含有时间信息的独立句子中提取地点信息,在检测出该地点信息的前一个相邻的词存在于存储的趋向描述词集合时,则确定所述地点信息为有效的地点信息;在包含有效地点信息的独立句子中提取人物信息,如提取的人物信息为唯一的人物,则将所述独立句子中的人物、时间、地点作为该人物的一条踪迹,并存储该人物踪迹。 |
地址 |
518028 广东省深圳市福田区赛格科技园2栋东403室 |