发明名称 特定类型信息文件的识别方法和装置
摘要 提供了一种文件识别装置和方法,用于对从因特网中收集的web页面或存储在其它存储装置中的文件群进行特定信息类型的识别,本发明的装置包括:文件分组部,其按照特定的观点对待识别的文件群进行文件类型分类;文件类型识别部,其根据所述特定信息类型所特有的特征识别文件的类型;以及文件类型识别修正部,其从全组文件识别精度的大局出发,对各个文件识别结果进行修正。本发明的装置和方法可以对各种类型的信息进行识别,并可以实现非常好的识别精度。
申请公布号 CN1702651A 申请公布日期 2005.11.30
申请号 CN200410038357.5 申请日期 2004.05.24
申请人 富士通株式会社 发明人 王主龙;于浩;西野文人
分类号 G06F17/30 主分类号 G06F17/30
代理机构 北京三友知识产权代理有限公司 代理人 李辉
主权项 1.一种文件识别装置,用于对从因特网中收集的web页面或存储在其它存储装置中的文件群进行特定信息类型的识别,该装置包括:文件分组部,其按照特定的观点对待识别的文件群进行文件类型分类;文件类型识别部,其根据所述特定信息类型所特有的特征识别文件的类型;以及文件类型识别修正部,其从全组文件识别精度的大局出发,对各个文件识别结果进行修正。
地址 日本神奈川县川崎市