发明名称 | 特定类型信息文件的识别方法和装置 | ||
摘要 | 提供了一种文件识别装置和方法,用于对从因特网中收集的web页面或存储在其它存储装置中的文件群进行特定信息类型的识别,本发明的装置包括:文件分组部,其按照特定的观点对待识别的文件群进行文件类型分类;文件类型识别部,其根据所述特定信息类型所特有的特征识别文件的类型;以及文件类型识别修正部,其从全组文件识别精度的大局出发,对各个文件识别结果进行修正。本发明的装置和方法可以对各种类型的信息进行识别,并可以实现非常好的识别精度。 | ||
申请公布号 | CN1702651A | 申请公布日期 | 2005.11.30 |
申请号 | CN200410038357.5 | 申请日期 | 2004.05.24 |
申请人 | 富士通株式会社 | 发明人 | 王主龙;于浩;西野文人 |
分类号 | G06F17/30 | 主分类号 | G06F17/30 |
代理机构 | 北京三友知识产权代理有限公司 | 代理人 | 李辉 |
主权项 | 1.一种文件识别装置,用于对从因特网中收集的web页面或存储在其它存储装置中的文件群进行特定信息类型的识别,该装置包括:文件分组部,其按照特定的观点对待识别的文件群进行文件类型分类;文件类型识别部,其根据所述特定信息类型所特有的特征识别文件的类型;以及文件类型识别修正部,其从全组文件识别精度的大局出发,对各个文件识别结果进行修正。 | ||
地址 | 日本神奈川县川崎市 |