主权项 |
1.一种声音识别装置,该声音识别装置具有:声音分析部,其将所输入的说话声音转换成特征量;识别词存储部,其存储有识别词的读音;转换规则存储部,其存储有读音与音素之间的转换规则或者读音与音素串之间的转换规则;音素串转换部,其根据存储在所述转换规则存储部内的转换规则,将存储在所述识别词存储部内的识别词的读音转换成音素串;音素模型存储部,其存储有对音素容易变成怎样的特征量进行建模而成的标准模式;词模型生成部,其根据由所述音素串转换部转换的音素串,提取存储在所述音素模型存储部内的标准模式,对提取出的标准模式进行连接,由此生成作为标准模式串的词模型;以及声音核对部,其计算由所述声音分析部转换的特征量与由所述词模型生成部生成的词模型之间的、各时刻的相似度,所述转换规则存储部还存储与所述转换规则中的至少1个转换规则的音素或音素串对应的第1阈值条件,所述声音核对部提取由所述词模型生成部生成的词模型中的这样的词模型:在所述各时刻的相似度中最小的相似度或者由所述各时刻的相似度获得的整体相似度满足第2阈值条件,且所述说话声音的发声区间中、对应于与所述第1阈值条件对应的音素或音素串的区间的各时刻的相似度满足该第1阈值条件,所述声音核对部将与提取出的词模型对应的识别词作为识别结果来输出。 |