发明名称 |
进行文本处理的方法和系统 |
摘要 |
本发明总体上利用对现有的对象共指技术的扩展实现自动的、更全面的、准确的、有效的文本数据的分析和处理。具体而言,本发明提供了一种文本处理方法,包括:获取待处理的文本;从所述文本中提取主体词和与所述主体词对应的实体词;对所述主体词进行分组;根据分组后的主体词确定指向同一关注对象的实体词;以及对指向同一关注对象的实体词生成处理策略。本发明还提供了实现这种方法的系统。本发明可以用于挖掘有关某一实体的大量的评论数据,本发明还可以用于推荐文章中插入嵌入式广告的插入位置。 |
申请公布号 |
CN102262632B |
申请公布日期 |
2014.03.19 |
申请号 |
CN201010188623.8 |
申请日期 |
2010.05.28 |
申请人 |
国际商业机器公司 |
发明人 |
张小洵;蔡柯柯;马瑞;祝慧佳;苏中 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市中咨律师事务所 11247 |
代理人 |
于静;杨晓光 |
主权项 |
一种文本处理方法,包括:获取待处理的文本;从所述文本中提取主体词和与所述主体词对应的实体词,其中所述主体词为表示单个或者多个主体概念的词语,所述实体词为表示单个或者多个实体概念的词语;对所述主体词进行分组,以形成主体词分组;根据所述主体词分组确定指向同一关注对象的实体词;以及对指向同一关注对象的实体词生成处理策略。 |
地址 |
美国纽约 |