发明名称 |
一种数学公式检索方法与装置 |
摘要 |
本发明公开了一种数学公式检索方法与装置。本方法为:1)将不同来源的公式数据进行格式归一化,保存到一数据库中;2)根据符号优先级顺序、符号作用范围将归一化后的每一公式建立一公式树;3)对每一公式树,提取该公式树的原始子结构并创建原始子结构对应的泛化子结构;4)根据原始子结构和泛化子结构对该数据库创建倒排索引;5)对待查询公式建立公式树并进行原始子结构提取和泛化子结构创建,然后从该数据库中查找包含该待查询公式的原始子结构和泛化子结构的公式;6)根据查找到的公式与该待查询公示的相似度对查找到的公式进行排序,选取若干公式返回。本发明在准确率和DCG上有大幅提高。 |
申请公布号 |
CN106372073A |
申请公布日期 |
2017.02.01 |
申请号 |
CN201510430407.2 |
申请日期 |
2015.07.21 |
申请人 |
北京大学 |
发明人 |
高良才;王悦涵;汤帜 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06F17/22(2006.01)I;G06F17/21(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
司立彬 |
主权项 |
一种数学公式检索方法,其步骤为:1)将不同来源的公式数据进行格式归一化,保存到一数据库中;2)根据符号优先级顺序、符号作用范围将归一化后的每一公式建立一公式树;3)对每一公式树,提取该公式树的原始子结构并创建原始子结构对应的泛化子结构;其中,泛化子结构是用不同通配符分别代表原始子结构中变量和常量得到的子结构;4)根据原始子结构和泛化子结构对该数据库创建倒排索引;5)对待查询公式建立公式树并进行原始子结构提取和泛化子结构创建,然后从该数据库中查找包含该待查询公式的原始子结构和泛化子结构的公式;6)根据查找到的公式与该待查询公示的相似度对查找到的公式进行排序,选取若干公式返回。 |
地址 |
100871 北京市海淀区颐和园路5号 |