发明名称 使用频谱图相关的讲话者识别
摘要 声音频谱图转换单元22把从输入单元21输入的一个记录的讲话者的语音转换成一个被视为多级梯度图像的声音频谱图“A”,并把其存储在一个记录的讲话者信息存储单元23中。当把准备加以识别的一个讲话者的语音从输入单元21输入并由转换单元22把其转一个声音频谱图“B”时,检测单元26检测一部分图像,这一部分图像包括多个由放置单元25放置在记录的语音图像A中的样本,以及未知语音图像B上的每一个在其中可计算出最大相关系数的区域。然后,核对确定单元27把多个样本的相互间的位置关系与其中检测到最大相关系数的各区域的相互间的位置关系加以比较,以根据它们之间的差别程度确定记录的语音与未知语音之间的等同性。把所确定的等同性输出到一个显示单元28上。
申请公布号 CN1327575A 申请公布日期 2001.12.19
申请号 CN00802335.2 申请日期 2000.10.18
申请人 卡西欧计算机株式会社 发明人 佐藤胜彦;竹田恒治
分类号 G10L17/00 主分类号 G10L17/00
代理机构 永新专利商标代理有限公司 代理人 韩宏
主权项 1、一种语音核对装置,包括:数据转换装置,用于把进行比较的两个语音信号转换成指示所述两个语音信号的语音特征的两个二维数据;样本放置装置,用于把多个用于定义多个区域的样本放置在所述二维数据之一之上;相关区域检测装置,用于检测在所述二维数据中另一个之上的一些相关区域,这些区域相对于所述二维数据中另一个之上的多个区域具有最大的相关性,并对应于该多个样本;以及核对确定装置,用于比较所述二维数据之一之上的多个样本的相互位置关系与所述二维数据的另一个之上的由所述相关区域检测装置检测到的这些区域的相互位置关系,以确定两个语音信号之间的等同性。
地址 日本东京