一种文件信息的提取方法,申请号CN201310462931.9-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种文件信息的提取方法
摘要	本发明提供一种文件信息的提取方法，包括：依次以段落方式获取文件信息；查找所述段落内是否包括至少一个标识字符；如果查找到所述标识字符，则将所述段落作为信息块的起始段。通过对文件信息的所述至少一个标识符进行识别，能够快速而准确从文件信息中切割出需要的信息块。因为不需要对文件内容中的公式、表格和/或图片等信息进行识别，所以该方法还适用于包含公式等信息的文件，扩大了该方法的适用范围。本方法结合支持向量机和浅层句法分析，在进行初步识别之后，还可对错误结果进行修正，提高了识别的正确率。
申请公布号	CN103500216B	申请公布日期	2017.02.15
申请号	CN201310462931.9	申请日期	2013.09.30
申请人	北京林业大学	发明人	李冬梅;覃延;陈志泊
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	北京成创同维知识产权代理有限公司 11449	代理人	蔡纯;冯丽欣
主权项	一种文件信息的提取方法，其特征在于，该方法包括：依次以段落方式获取文件信息；查找所述段落内是否包括至少一个标识字符；如果查找到所述标识字符，则将所述段落作为信息块的起始段；在查找所述至少一个标识字符之前，先获取所述段落的特征值；以及根据所述至少一个标识符进行识别，从文件信息中切割出所述信息块，其中，所述查找所述段落内是否包括至少一个标识字符包括根据预设的第一规则和所述特征值的位置，查找所述段落内的至少一个标识字符，所述特征值为所述段落的题型信息。
地址	100083 北京市海淀区清华东路35号

您可能感兴趣的专利

DETACHABLE GRAB HANDLE

HOMOGENEOUS PREPARATIONS OF IL-31

Method and System for Controlling a Set of At Least Two Satellites, Designed to Provide a Service on a Geostationary Orbit, Rendering Said Service on a Non-Geostationary Orbit

METHOD AND SYSTEM FOR EXHAUST CLEANING

MAGNETIC SENSOR TRANSFORMER FOR DETERMINING STATE OF CHARGE FOR IRON PHOSPHATE LITHIUM ION BATTERIES

SYSTEMS, DEVICES AND METHODS FOR MICROFLUIDIC CULTURING, MANIPULATION AND ANALYSIS OF TISSUES AND CELLS

TRANSMITTING MODULE AND MULTI-FUNCTIONAL PRINTER USING THE SAME

GOLF BALL COMPOSITION AND GOLF BALL

RADAR WAVE SENSING APPARATUS AND METHOD

PROJECTION SYSTEM

METHOD AND ARRANGEMENT FOR REGISTERING COLORS FOR A PRINTING MACHINE

Pacemaker for Spasmodic Dysphonia

PORTABLE ELECTRONIC DEVICE WITH A CAMERA FUNCTION, AND IMAGE CAPTURING METHOD WITH AUTO EXPOSURE CONTROL

Systems and Methods for Scalable Data Processing Shut Down

METHOD OF RECONSTRUCTING A HOLOGRAPHIC IMAGE AND APPARATUS THEREFOR

DUAL MODE CHARGING DEVICE

AUTHENTICATING MESSAGES SENT BETWEEN A VEHICLE AND A CENTRAL FACILITY

MOUNT-TIME RECONCILIATION OF DATA AVAILABILITY