发明名称 数据提取的方法及装置
摘要 本发明公开了一种数据提取的方法及装置,涉及数据处理领域,为解决人工提取数据效率低下的问题而发明。本发明的方法包括:对数据进行预处理,获得位置在前的第一数据和位置在后的第二数据;计算第一数据和第二数据的相似度;若第一数据和第二数据的相似度满足预设的相似度阈值,则删除位置在后的第二数据;保留位置在前的第一数据,获得摘要信息。本发明适合应用在对大量的、不同格式的节日数据进行提取的过程中。
申请公布号 CN105045900A 申请公布日期 2015.11.11
申请号 CN201510474190.5 申请日期 2015.08.05
申请人 石河子大学 发明人 郑亮;陈根方
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京鼎佳达知识产权代理事务所(普通合伙) 11348 代理人 王伟锋;刘铁生
主权项 一种数据提取的方法,其特征在于,所述方法包括:对数据进行预处理,获得位置在前的第一数据和位置在后的第二数据;计算所述第一数据和所述第二数据的相似度;若所述第一数据和所述第二数据的相似度满足预设的相似度阈值,则删除位置在后的所述第二数据;保留位置在前的所述第一数据,获得摘要信息。
地址 832003 新疆维吾尔自治区石河子市北四路221号