发明名称 |
基于词向量相似度的检索方法和系统 |
摘要 |
本发明涉及一种基于词向量相似度的检索方法和系统。所述方法包括:对检索库进行词向量训练,建立所述检索库对应的训练模型;接收输入的检索关键词,通过所述训练模型得到所述检索关键词的相关词,以及各相关词与所述检索关键词的相似度;用所述相关词对所述检索库进行检索匹配,并根据所述相似度分别统计所述检索库中各文件与所述相关词的匹配分值;根据所述匹配分值由高到低对所述检索库中的文件进行排序,根据排序结果输出检索结果。通过本发明,能够结合各检索库中的用词特点,增强对相关词的检索匹配能力,从而提高检索准确率和鲁棒性。 |
申请公布号 |
CN105631009A |
申请公布日期 |
2016.06.01 |
申请号 |
CN201511003865.4 |
申请日期 |
2015.12.25 |
申请人 |
广州视源电子科技股份有限公司 |
发明人 |
李贤 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州华进联合专利商标代理有限公司 44224 |
代理人 |
周清华 |
主权项 |
一种基于词向量相似度的检索方法,其特征在于,包括:对检索库进行词向量训练,建立所述检索库对应的训练模型;接收输入的检索关键词,通过所述训练模型得到所述检索关键词的相关词,以及各相关词与所述检索关键词的相似度;用所述相关词对所述检索库进行检索匹配,并根据所述相似度分别统计所述检索库中各文件与所述相关词的匹配分值;根据所述匹配分值由高到低对所述检索库中的文件进行排序,根据排序结果输出检索结果。 |
地址 |
510663 广东省广州市广州高新技术产业开发区科学城科珠路192号4楼 |