发明名称 从评论性文本中提取评价性信息的方法和装置
摘要 一种提取评价性信息的方法和装置。该方法包括:预处理步骤,对所收集的评论性文本进行预处理,以便获得与评论性文本中包含的至少一个被评价对象相关的评论性成分以及至少一个被评价对象在评论性文本中的位置;第一提取步骤,对经过预处理的评论性文本进行初始匹配处理,以便提取得到包含至少一个评价向量的第一评价向量集合;第二提取步骤,通过扩展所述至少一个被评价对象的作用域来进行扩展的匹配处理,以便为所述第一评价向量集合中的、缺少被评价对象的至少一个评价向量获得相应的被评价对象,从而获得第二评价向量集合。根据本发明的方法可使得从评论性文本中提取有意义的评价性信息的覆盖率得到提高,且提升提取处理的准确性。
申请公布号 CN102163189A 申请公布日期 2011.08.24
申请号 CN201010120101.4 申请日期 2010.02.24
申请人 富士通株式会社 发明人 贾文杰;张姝;孟遥;于浩
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王萍;陈炜
主权项 一种提取与被评价对象有关的评价性信息的方法,所述方法包括步骤:预处理步骤,用于对所收集的评论性文本进行预处理,以便获得与所述评论性文本中包含的至少一个被评价对象相关的评论性成分以及所述至少一个被评价对象在所述评论性文本中的位置;第一提取步骤,用于对经过预处理的评论性文本进行初始匹配处理,以便提取得到包含至少一个评价向量的第一评价向量集合;和第二提取步骤,用于通过扩展所述至少一个被评价对象的作用域来进行扩展的匹配处理,以便为所述第一评价向量集合中的、缺少被评价对象的至少一个评价向量获得相应的被评价对象,从而获得第二评价向量集合,作为所述的与被评价对象有关的评价性信息。
地址 日本神奈川县