发明名称 |
一种从学术文献中提取语义相似且语法规范句子的方法 |
摘要 |
本发明公开了一种从学术文献中提取语义相似且语法规范句子的方法。该方法包括首先将拟访问的数据库限定为已发表的学术论文。根据使用者输入拟查询句子所属领域的关键词、文献作者所在国家、以及输入句子的主要成份与数据库中的句子进行相似度计算。根据所限定要素的权值提取相似度比较高的几个句子供使用者参考,从而获得恰当语义的句子和所获语句的文献源。本发明可供非英语母语英语论文作者等在写作科技文献时,快捷获取规范表达想法的参考句子。 |
申请公布号 |
CN105677634A |
申请公布日期 |
2016.06.15 |
申请号 |
CN201510421798.1 |
申请日期 |
2015.07.18 |
申请人 |
孙维国;李墨 |
发明人 |
孙维国;李墨 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
洛阳公信知识产权事务所(普通合伙) 41120 |
代理人 |
孙笑飞 |
主权项 |
一种从学术文献中提取语义相似且语法规范句子的方法,其特征在于,所述方法包括以下几个步骤:A. 将已建立的英语文献数据库中所有文献的关键词、第一作者或通讯作者所在国家提取出来,并与相应文献建立对应关系;B. 对所述英语文献数据库中所有文献的摘要和正文文本以句子为单位进行划分,提取句子的主要成份,并与原句建立对应关系;C. 用户输入所要匹配句子所属的学科、领域或者研究方向的一个或多个关键词;D. 用户输入所需匹配的英语句子,对该句子的主要成份进行提取,并与英语文献数据库中所有句子的主要成份按照词性相似度和语法相似度两个方面进行相似度计算;E. 将用户输入的关键词与文献关键词进行比较,并设定每篇文献的关键词权值,根据第一作者或通讯作者所在国家,设定每篇文献第一作者或通讯作者的英语熟练度权值;F. 综合考虑句子主要成份相似度、文献关键词权值、文献作者英语熟练度权值计算两个句子的最终相似度,按照最终相似度的高低进行排序,并反馈给用户相似度最高的一个或几个英文原句及其文献出处。 |
地址 |
471000 河南省洛阳市洛龙区英才路6号1幢2-602 |