发明名称 句子相似度计算方法及装置
摘要 本发明公开了一种句子相似度计算方法及装置,涉及自动批改技术领域,所述方法包括:获取各词语对应的向量;对待比较的两个句子进行句法分析,以获得所述两个句子中组成各成分的词语;计算所述两个句子中组成相应成分的词语对应向量之间的第一余弦距离;根据所述第一余弦距离确定所述两个句子之间的相似度。本发明通过对句子进行句法分析,从结构方面把握句子的语义,从而更加准确地计算句子之间的近似度,另外,采用了基于神经网络模型的词向量来表示词语,从而更加准确计算词语之间的近似程度,而且摆脱了近义词字典的限制。
申请公布号 CN105183714A 申请公布日期 2015.12.23
申请号 CN201510536882.8 申请日期 2015.08.27
申请人 北京时代焦点国际教育咨询有限责任公司 发明人 唐聪;宋文略;杨晓昊;许轶;肖迪
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 李相雨
主权项 一种句子相似度计算方法,其特征在于,所述方法包括:获取各词语对应的向量;对待比较的两个句子进行句法分析,以获得所述两个句子中组成各成分的词语;计算所述两个句子中组成相应成分的词语对应向量之间的第一余弦距离;根据所述第一余弦距离确定所述两个句子之间的相似度。
地址 100086 北京市海淀区中关村南大街2号数码大厦A座3015室