发明名称 机器人装置、字符识别方法和装置
摘要 发音信息生成单元(150)生成从CCD摄像机(20)拍摄的图像的字符识别结果推导出的多个字符、从该字符推导出的多个假名读音以及与该假名读音对应的发音信息,将获得的多个读音与话筒(23)采集到的用户的发音进行匹配以从多个生成的候选中指定一个假名读音和发音信息(读音)。
申请公布号 CN1236422C 申请公布日期 2006.01.11
申请号 CN02802184.3 申请日期 2002.05.01
申请人 索尼公司 发明人 广江厚夫;南野活树;河本献太;佐部浩太郎;大桥武史
分类号 G10L15/00(2006.01);G06K9/00(2006.01) 主分类号 G10L15/00(2006.01)
代理机构 北京市柳沈律师事务所 代理人 王志森;黄小临
主权项 1、一种机器人装置,根据机器人装置的内部状态来自主行动,包括:语音识别存储部件,作为语音识别词典,存储有单词和其发音信息之间的对应关系;单词语音表达存储部件,作为单词读音属性表,存储有单词和其单词语音表达字母之间的对应关系;成像部件,用于拍摄物体;图像处理字符识别单元,用于根据所述成像部件拍摄的图像来提取字符;拾音部件,用于采集周围声音;语音识别部件,用于根据所述拾音部件拾取的声音来识别语音;读音信息生成部件,用于根据所述单词读音属性表,向所述图像处理字符识别单元提取出的字符赋予多个单词语音表达字母,并且用于对这样赋予的多个单词语音表达字母中的每个分别生成与读音对应的发音信息和语音波形;以及存储控制部件,用于将所述读音信息生成部件生成的语音波形与所述语音识别部件识别出的语音的语音波形进行比较,并且将最接近的发音信息新存储到所述语音识别词典中作为所述提取出的字符的发音信息。
地址 日本东京都