发明名称 确定语义匹配度的方法和装置
摘要 本发明提供一种确定语义匹配度的方法和装置,该方法包括:获取第一语句和第二语句;将第一语句和第二语句分别划分成x和y个语句片段;将第一语句的每一语句片段中的词向量与第二语句的每一语句片段中的词向量进行卷积运算,得到三维张量;将x行y列一维向量中的相邻向量进行综合和/或筛选,直到将三维张量合并成一维的目标向量;根据目标向量,确定第一语句和第二语句的语义匹配度。本发明实施例中,按照语序将待匹配的语句划分成以词向量为单位的语句片段,两个语句中的语句片段之间两两求卷积,得到三维张量,该三维张量包含各语句之间的语句片段的局部匹配信息,基于该三维张量得到的语义匹配结果更准确。
申请公布号 CN105701120A 申请公布日期 2016.06.22
申请号 CN201410709568.0 申请日期 2014.11.28
申请人 华为技术有限公司 发明人 吕正东;李航
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京龙双利达知识产权代理有限公司 11329 代理人 王君;肖鹂
主权项 一种确定语义匹配度的方法,其特征在于,包括:获取第一语句和第二语句,其中,所述第一语句和所述第二语句为待匹配的语句,所述第一语句包括a个词向量,所述第二语句包括b个词向量;以所述第一语句中的相邻的k个词向量为单位,将所述第一语句划分成x个语句片段,其中,所述x个语句片段中的第i语句片段包括所述第一语句中的第i个词向量至第i+k‑1个词向量,其中x=a‑k+1;以所述第二语句中的相邻的t个词向量为单位,将所述第二语句划分成y个语句片段,其中,所述y个语句片段中的第j语句片段包括所述第二语句中的第j个词向量至第j+t‑1个词向量,其中y=b‑t+1;将所述第一语句的每一语句片段中的词向量与所述第二语句的每一语句片段中的词向量进行卷积运算,得到三维张量,其中,所述三维张量包括x行y列一维向量,所述x行y列一维向量中的第i行第j列一维向量是所述第一语句的第i语句片段中的词向量和所述第二语句的第j语句片段中的词向量经过所述卷积运算后得到的结果;将所述x行y列一维向量中的相邻向量进行至少一次综合和/或至少一次筛选,不断缩减所述三维张量所包含的一维向量的个数,直到将所述三维张量合并成一维的目标向量;根据所述目标向量,确定所述第一语句和所述第二语句的语义匹配度。
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼