发明名称 |
数据提取的方法及装置 |
摘要 |
本发明公开了一种数据提取的方法及装置,涉及数据处理领域,为解决人工提取数据效率低下的问题而发明。本发明的方法包括:对数据进行预处理,获得位置在前的第一数据和位置在后的第二数据;计算第一数据和第二数据的相似度;若第一数据和第二数据的相似度满足预设的相似度阈值,则删除位置在后的第二数据;保留位置在前的第一数据,获得摘要信息。本发明适合应用在对大量的、不同格式的节日数据进行提取的过程中。 |
申请公布号 |
CN105045900A |
申请公布日期 |
2015.11.11 |
申请号 |
CN201510474190.5 |
申请日期 |
2015.08.05 |
申请人 |
石河子大学 |
发明人 |
郑亮;陈根方 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鼎佳达知识产权代理事务所(普通合伙) 11348 |
代理人 |
王伟锋;刘铁生 |
主权项 |
一种数据提取的方法,其特征在于,所述方法包括:对数据进行预处理,获得位置在前的第一数据和位置在后的第二数据;计算所述第一数据和所述第二数据的相似度;若所述第一数据和所述第二数据的相似度满足预设的相似度阈值,则删除位置在后的所述第二数据;保留位置在前的所述第一数据,获得摘要信息。 |
地址 |
832003 新疆维吾尔自治区石河子市北四路221号 |