发明名称 进行文本处理的方法和系统
摘要 本发明总体上利用对现有的对象共指技术的扩展实现自动的、更全面的、准确的、有效的文本数据的分析和处理。具体而言,本发明提供了一种文本处理方法,包括:获取待处理的文本;从所述文本中提取主体词和与所述主体词对应的实体词;对所述主体词进行分组;根据分组后的主体词确定指向同一关注对象的实体词;以及对指向同一关注对象的实体词生成处理策略。本发明还提供了实现这种方法的系统。本发明可以用于挖掘有关某一实体的大量的评论数据,本发明还可以用于推荐文章中插入嵌入式广告的插入位置。
申请公布号 CN102262632B 申请公布日期 2014.03.19
申请号 CN201010188623.8 申请日期 2010.05.28
申请人 国际商业机器公司 发明人 张小洵;蔡柯柯;马瑞;祝慧佳;苏中
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 于静;杨晓光
主权项 一种文本处理方法,包括:获取待处理的文本;从所述文本中提取主体词和与所述主体词对应的实体词,其中所述主体词为表示单个或者多个主体概念的词语,所述实体词为表示单个或者多个实体概念的词语;对所述主体词进行分组,以形成主体词分组;根据所述主体词分组确定指向同一关注对象的实体词;以及对指向同一关注对象的实体词生成处理策略。
地址 美国纽约