一种基于语音语义内容分析的防电信电话诈骗方法和系统,申请号CN201310094237.6-传众专利搜索

发明名称	一种基于语音语义内容分析的防电信电话诈骗方法和系统
摘要	本发明涉及一种基于语音语义内容分析的防电信电话诈骗方法和系统，通过提高通话中语音和语义识别的效率和准确率，并且使用中文语义判定技术判定并对陌生电话发送者是否为诈骗电话。具体而言，通过对双方通话过程中使用本发明提出的大词汇量、非特定人的连续语音识别(LVCSR)算法对语音进行解析，并且针对解析出来的关键字或者关键数字进行判定,利用算法构造策略引擎，使用算法在云服务端对通话方的语句意思进行解析并且归类，同时针对语音中的关键信息进行解析，同步匹配通话者所在银行的信息，判定是否为可疑电话诈骗。总体来讲，本方法，特别是能够有效地阻止电话诈骗的发生，特别是通过语音语义识别和判定的方式，加上云平台信息挖掘匹配方式保护用户安全，并且在语音识别速率，可疑电话检出率上也能满足正常的使用。
申请公布号	CN103179122A	申请公布日期	2013.06.26
申请号	CN201310094237.6	申请日期	2013.03.22
申请人	马博	发明人	马博
分类号	H04L29/06(2006.01)I;H04W12/12(2009.01)I;G06F17/30(2006.01)I	主分类号	H04L29/06(2006.01)I
代理机构		代理人
主权项	1.一种基于语音语义内容分析的防电信电话诈骗方法和系统，其特征在于包括以下步骤：a)利用声学与语法匹配方式匹配声波特征，把语音序列输入到库中；b)通过形式转换器转换成参数化的语音波形，对语音波形建立概率模型,根据语音样本库模型计算出模型期望；c)通过建立的概率模型建立样本模型；d)通过计算样本模型的隐马尔科夫过程得出的联合概率, 随后通过声学模型和语音语法匹配器进行参数匹配；e)建立声音样本库，对声音特征进行提取，使用梅尔域频率倒谱系数做倒谱分析；f)使用隐马尔科夫过程模型检测语音输入，通过大词汇量、非特定人的连续语音识别 (LVCSR)算法计算得出；g)通过最小化语音差错值计算对语音片段形成分类；h)使用区分函数对语音差错中的分类差错进行距离递减，对语音中分类检索区段进行直接检索分类，对马尔科夫过程中的值设置分类检索率；i)最小化语音差错的直接差分处理，使用高斯m的对数临近域状态s在时间向量t下计算卷积；j)通过对调整参数迭代递减，对进入预处理引擎的音阶段进行线性排序并且重组，然后使用线性参数<img file="357009DEST_PATH_IMAGE001.GIF" wi="16" he="62" />对出现的<img file="362700DEST_PATH_IMAGE002.GIF" wi="77" he="42" />的线性部分进行处理；k)对语音片段预处理，先对声音片段排序并且匹配，在对语语音语法处理的搜索结果做划分，找到语音核心域后对声音边界做边界切分；l)通过计算得出特征区域边界范围，可以对语音片段切割和检索并且进行语句连接；m)完成判定语音特征核区界后，通过参数化调整检查匹配选中的字符的方式减小音节匹配差错；n)通过语音段匹配和参数调整，得到两者的对应关系，并且使其组合成语音段词；o)把相似的词进行列举，并且通过搜索引擎匹配查找出能和上下文匹配的正确词组，并且组成句子；p)对形成的子句，通过关键字解析器找出敏感词；q)通过声学数据库对敏感词对应的句子做匹配检查；r)设<img file="409777DEST_PATH_IMAGE003.GIF" wi="37" he="42" />为两个已经识别出的邻接的词组，通过线性检索，找到敏感词的最大匹配域的数对，而最大相似域距离为<img file="797873DEST_PATH_IMAGE004.GIF" wi="61" he="42" />；s)通过数对建立关系，通过计算得到<img file="765543DEST_PATH_IMAGE004.GIF" wi="61" he="42" />的最小值；t)使用线性搜索找到两个相邻词对或者数对，并且找到最大值匹配值词组；u)在云处理阶段，通过词关系结构和句子结构，得出语义匹配结果；v)把匹配结果输出并和外部的信息系统匹配，通过对比，如果查出黑名单中有该通话发出者的账户信息或者违法记录信息，则反馈信息到其他外部系统，以便后期立案处理；w)对正在接收通话的用户在通话中产生告警音，结束通话后发送告警短信或信息。
地址	750001 宁夏回族自治区银川市唐徕回民小学