发明名称 文章标题及关联信息的自动抽取装置和抽取方法
摘要 本发明提供一种自动且高精度地抽取文章标题的标题抽取装置。文章标题抽取装置包括:从由文章输入部(30)输入的文本文章中抽取多个标题候选句的标题候选句抽取部(32);抽取所抽取出的多个标题候选句的各自的特征量的候选句标题判定用特征量抽取部(34);根据所抽取的特征量从多个标题候选句中判定标题的标题判定部(36);输出抽取结果的输出部(38)。特征量至少包含作为标题候选句与文章中的多个句子的相似度的函数值的相似度信息。
申请公布号 CN100444194C 申请公布日期 2008.12.17
申请号 CN200510116866.X 申请日期 2005.10.27
申请人 富士施乐株式会社 发明人 张正操;孙茂松;刘绍明
分类号 G06K9/20(2006.01) 主分类号 G06K9/20(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 李辉
主权项 1.一种文章标题抽取装置,其特征在于,包括:标题候选句抽取单元,其从文章中抽取多个标题候选句;特征量抽取单元,其从所述多个标题候选句中抽取用于判定所述多个标题候选句的各自的特征量;判定单元,其根据所抽取的特征量,从多个标题候选句中抽取标题;以及输出单元,其输出所抽取的标题,所述特征量至少包含相似度信息,该相似度信息是标题候选句和文章中的多个句子的相似度的函数值。
地址 日本东京