发明名称 一种基于语音识别的数据挖掘方法和系统
摘要 本发明公开了一种语音识别的数据挖掘方法和系统,方法包括:从语音文件数据库中提取语音文件,并通过语音识别操作对提取的语音文件进行语义分析,将该语音文件转换为文本数据;对转换的文本数据进行数据挖掘,得到最终的可用数据。通过本发明的方法和系统,实现了对语音信息的数据挖掘,并提高了语音渠道的客服数据统计的准确性。
申请公布号 CN102419975B 申请公布日期 2015.11.25
申请号 CN201010295597.9 申请日期 2010.09.27
申请人 深圳市腾讯计算机系统有限公司 发明人 刘致远
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京派特恩知识产权代理有限公司 11270 代理人 蒋雅洁;程立民
主权项 一种基于语音识别的数据挖掘方法,其特征在于,该方法包括:根据预设的查询条件遍历语音文件数据库,提取符合所述查询条件的语音文件,并通过语音识别操作对提取的语音文件进行语义分析,将所述语音文件转换为文本数据,并对转换的文本数据进行存储;预先设定数据挖掘的方向,并根据所述数据挖掘的方向预设分类集合;分别计算提取的每个语音文件所对应的文本数据与预设分类集合的相关度,并对所述相关度的计算结果进行统计,得到最终的可用数据。
地址 518057 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼