发明名称 英语辨识变异发音模型之建构方法
摘要
申请公布号 申请公布日期 2011.09.01
申请号 TW096147548 申请日期 2007.12.12
申请人 财团法人资讯工业策进会 发明人 林瑞堂;许进顺;翟慎由;吴宗宪;谢嘉欣;黄建霖;李桂铭
分类号 G10L15/28 主分类号 G10L15/28
代理机构 代理人 陈瑞田 高雄市凤山区建国路3段256之1号;康清敬 高雄市凤山区建国路3段256之1号
主权项 一种英语辨识变异发音模型之建构方法,系用于辨识带有不同于英语之一母语音调之英语发音,该建构方法至少包含下列步骤:提供复数个英语词句与对应每一该英语词句之至少一发声音标,并根据该英语词句之该发声音标以收集对应之复数个声音资讯,其中该等声音资讯系为不以英语为母语,但为同一地区、族群或*之民众所提供;将该母语与英语之音标对应至复数个国际标准音标以形成复数个发音模型,其中,系收集针对其一该国际标准音标之复数个音标发音,并将每一该音标发音转换成一对应之特征值,将该等特征值形成一数值群并计算该等特征值对应之一分群界限值,计算该数值群之一发音平均值,取得相同数值群中,与该发音平均值相隔最远数值距离之一第一特征值,计算相同数值群中,与该第一特征值相隔最远数值距离之一第二特征值,计算每一该特征值与第一特征值及第二特征值之间的数值距离,划分出接近该第一特征值之该等特征值及接近该第二特征值之该等特征值之二数值群,取得此二该等数值群之群内距离与群间距离,以计算出一分群标准,比对该分群标准是否高于该分群界限值,若是,计算该二数值群之每一数值群的发音平均值,以返回取得相同数值群中,与该发音平均值相隔最远数值距离之一第一特征值,计算相同数值群中,与该第一特征值相隔最远数值距离之一第二特征值之该步骤,若否,取得每一该发音模型所包含之该等数值群;利用该等发音模型转化每一该英语词句之该等声音资讯,并协同该英语词句之该发声音标以建构对应该英语词句之一变异发音网路,以侦测该英语词句是否存在变异发音路径;以及归纳该等变异发音路径以形成复数个变异发音规则。如申请专利范围第1项所述之英语辨识变异发音模型之建构方法,其中该发音模型之至少一数值群,其包含之该等特征值系对应该母语之音标。如申请专利范围第1项所述之英语辨识变异发音模型之建构方法,其中该发音模型之至少一数值群,其包含之该等特征值系对应英语之音标。如申请专利范围第1项所述之英语辨识变异发音模型之建构方法,其中该音标发音系利用傅利叶转换方程式转化为该特征值。如申请专利范围第1项所述之英语辨识变异发音模型之建构方法,其中该建构对应该英语词句之一变异发音网路步骤中,包含:设定该英语词句之该发声音标为基准;侦测该等发声音标之每一发声间距是否存在一插入变异发音;侦测每一该发声音标至次一该发声音标之间是否存在一删除变异发音;侦测每一该发声音标对应之替换变异发音;以及建构该变异发音网路。如申请专利范围第5项所述之英语辨识变异发音模型之建构方法,其中该侦测每一该发声音标对应之替换变异发音步骤系包含下列步骤:取得每一该发声音标于该国际标准音标之发音类型;以及将相同发音类型之至少一该国际标准音标作为该发声音标之该替换变异发音。如申请专利范围第5项所述之英语辨识变异发音模型之建构方法,其中该侦测每一该发声音标对应之替换变异发音步骤系包含下列步骤:收集该国际标准音标之发音;计算每一该国际标准音标之发音机率,以建立一音素模糊矩阵(phone confusion matrix);以该发声音标为基准,取出一发音机率范围之至少一该国际标准音标;以及设定该发音机率范围之该国际标准音标作为该发声音标之该替换变异发音。如申请专利范围第1项所述之英语辨识变异发音模型之建构方法,其更包含一分析该英语词句以根据其发声音标之变异而取得一推论规则步骤。如申请专利范围第8项所述之英语辨识变异发音模型之建构方法,其更包含:将该等发声音标对应至语言学之发音特征;分析该英语词句之该变异发音网路以取得该推论规则;以及判断具有相同发音特征之该等发声音标具有相同之该推论规则。一种英语辨识变异发音模型之建构之记录媒体,记录有电脑可读取之电脑程式码,系用于辨识带有不同于英语之一母语音调之英语发音,其中该变异发音模型之建构方法系包含下列步骤:提供复数个英语词句与对应每一该英语词句之至少一发声音标,并根据该英语词句之该发声音标以收集对应之复数个声音资讯,其中该等声音资讯系为不以英语为母语,但为同一地区、族群或*之民众所提供;将该母语与英语之音标对应至复数个国际标准音标以形成复数个发音模型,其中,系收集针对其一该国际标准音标之复数个音标发音,并将每一该音标发音转换成一对应之特征值,将该等特征值形成一数值群并计算该等特征值对应之一分群界限值,计算该数值群之一发音平均值,取得相同数值群中,与该发音平均值相隔最远数值距离之一第一特征值,计算相同数值群中,与该第一特征值相隔最远数值距离之一第二特征值,计算每一该特征值与第一特征值及第二特征值之间的数值距离,划分出接近该第一特征值之该等特征值及接近该第二特征值之该等特征值之二数值群,取得此二该等数值群之群内距离与群间距离,以计算出一分群标准,比对该分群标准是否高于该分群界限值,若是,计算该二数值群之每一数值群的发音平均值,以返回取得相同数值群中,与该发音平均值相隔最远数值距离之一第一特征值,计算相同数值群中,与该第一特征值相隔最远数值距离之一第二特征值之该步骤,若否,取得每一该发音模型所包含之该等数值群;利用该等发音模型转化每一该英语词句之该等声音资讯,并协同该英语词句之该发声音标以建构对应该英语词句之一变异发音网路,以侦测该英语词句是否存在变异发音路径;以及归纳该等变异发音路径以形成复数个变异发音规则。如申请专利范围第10项所述之记录媒体,其中该发音模型之至少一数值群,其包含之该等特征值系对应该母语之音标。如申请专利范围第10项所述之记录媒体,其中该发音模型之至少一数值群,其包含之该等特征值系对应英语之音标。如申请专利范围第10项所述之记录媒体,其中该音标发音系利用傅利叶转换方程式转化为该特征值。如申请专利范围第10项所述之记录媒体,其中该建构对应该英语词句之一变异发音网路步骤中,包含:设定该英语词句之该发声音标为基准;侦测该等发声音标之每一发声间距是否存在一插入变异发音;侦测每一该发声音标至次一该发声音标之间是否存在一删除变异发音;侦测每一该发声音标对应之替换变异发音;以及建构该变异发音网路。如申请专利范围第14项所述之记录媒体,其中该侦测每一该发声音标对应之替换变异发音步骤系包含下列步骤:取得每一该发声音标于该国际标准音标之发音类型;以及将相同发音类型之至少一该国际标准音标作为该发声音标之该替换变异发音。如申请专利范围第14项所述之记录媒体,其中该侦测每一该发声音标对应之替换变异发音步骤系包含下列步骤:收集该国际标准音标之发音;计算每一该国际标准音标之发音机率,以建立一音素模糊矩阵(phone confusion matrix);以该发声音标为基准,取出一发音机率范围之至少一该国际标准音标;以及设定该发音机率范围之该国际标准音标作为该发声音标之该替换变异发音。如申请专利范围第10项所述之记录媒体,其更包含一分析该英语词句以根据其发声音标之变异而取得一推论规则步骤。如申请专利范围第17项所述之记录媒体,其中该侦测每一该发声音标对应之替换变异发音步骤系包含下列步骤:将该等发声音标对应至语言学之发音特征;分析该英语词句之该变异发音网路以取得该推论规则;以及判断具有相同发音特征之该等发声音标具有相同之该推论规则。
地址 台北市大安区和平东路2段106号11楼