发明名称 利用语者识别的切割音视讯片段的方法
摘要 明系关于一种利用语者识别的切割音视讯片段的方法,透过此方法可依据语者音讯切割音讯片段,并将该音讯片段对应至音视讯讯号,产生音视讯片段。本发明之切割音视讯片段的方法,系以递增之未知语者来源音讯即时训练非特定语者模型,并利用语者识别之结果决定音视讯片段,其中更包含下列步骤:(1)即时训练非特定语者模型;(2)依据该语者模型决定来源音讯非特定语者片段;(3)依该来源音讯非特定语者片段更新该语者模型,其中更新该语者模型方式系为读取该来源音讯非特定语者片段之语者音讯讯号并训练为语者模型。
申请公布号 TWI518675 申请公布日期 2016.01.21
申请号 TW102129235 申请日期 2013.08.15
申请人 中华电信股份有限公司 发明人 王惇琳;刘继谥;林志荣
分类号 G10L15/04(2013.01);G10L15/06(2013.01);G10L17/00(2013.01) 主分类号 G10L15/04(2013.01)
代理机构 代理人 李保禄
主权项 一种切割音视讯片段的方法,系以递增之未知语者来源音讯即时训练非特定语者模型,并利用语者识别之结果决定音视讯片段,包含下列步骤:A.即时训练非特定语者模型;B.依据该语者模型利用语者识别决定来源音讯非特定语者片段;以及C.依该来源音讯非特定语者片段更新该语者模型,其中更新该语者模型方式系为读取该来源音讯非特定语者片段之语者音讯讯号并训练为语者模型。
地址 桃园市杨梅区电研路99号