发明名称 智慧型音讯处理器及其方法
摘要 一种智慧型音讯处理器,包括:一特征撷取单元接收一音讯讯号,并使用数个音讯描述子对音讯讯号撷取数个特征値;一资料预处理单元对数个特征値正规化,以作为智慧型音讯处理系统之分类资讯;以及一分类演算单元依分类资讯将音讯讯号分类成数种不同种类的音乐。
申请公布号 TWI297486 申请公布日期 2008.06.01
申请号 TW095136283 申请日期 2006.09.29
申请人 国立交通大学 发明人 白明宪;陈孟君
分类号 G10L11/00(2006.01) 主分类号 G10L11/00(2006.01)
代理机构 代理人 蔡朝安 新竹市光复路2段295号17楼之1
主权项 1.一种智慧型音讯处理器,包括: 一特征撷取单元,其系接收一音讯讯号,并使用数 个音讯描述子对该音讯讯号撷取数个特征値; 一资料预处理单元,正规化该些特征値以取得数个 分类资讯;及 一分类演算单元,其系依该分类资讯将该音讯讯号 分类成数种不同种类的音乐。 2.如请求项1所述之智慧型音讯处理器,更包括一独 立成份分析单元接收该音讯讯号、自该音讯讯号 分离出数个音乐成份,以及将该些音乐成份输入至 该特征撷取单元。 3.如请求项2所述之智慧型音讯处理器,其中该音讯 讯号为一第一声波与第二声波所混合之讯号。 4.如请求项3所述之智慧型音讯处理器,其中该第一 声波为一生物体发出的声音讯号。 5.如请求项4所述之智慧型音讯处理器,其中该第二 声波为一乐器之混合讯号。 6.如请求项4所述之智慧型音讯处理器,其中该第二 声波为一环境之杂讯。 7.如请求项1所述之智慧型音讯处理器,其中该音讯 讯号为一人的声波与乐器之音波所混合之讯号。 8.如请求项7所述之智慧型音讯处理器,其中该特征 撷取单元系在频率域、时域及统计値上撷取该音 讯讯号之特征値。 9.如请求项8所述之智慧型音讯处理器,其中该特征 撷取单元处理该频率域之特征时,利用之计算法包 括:线性预期编码、梅尔倒频谱系数、响度、音高 、自相关、音讯频谱重心、音讯频谱由重心决定 的程度、音讯频谱平坦程度、音讯频谱波封、谐 音频谱重心、谐音频谱偏差、谐音频谱重心决定 的程度或谐音频谱变异或上述之组合。 10.如请求项8所述之智慧型音讯处理器,其中该特 征撷取单元在处理该时域之特征时,利用之计算法 包括:对数出击时间、节拍重心或过零率或上述之 组合。 11.如请求项8所述之智慧型音讯处理系统,其中该 特征撷取单元在处理该统计上之特征时,利用之计 算法包括偏态及峰度。 12.如请求项1所述之智慧型音讯处理器,其中该分 类演算单元系依类神经网路、模糊类神经网路、 最近邻居法则及隐藏式马可夫模型分类该音讯讯 号。 13.一种音讯分类处理方法,包括: 一音讯分类器接收一第一音讯讯号,对该第一音讯 讯号撷取出一第一组音讯特征参数; 正规化该第一组音讯特征参数以取得数个分类项 目; 接收一第二音讯讯号,对该第二音讯讯号撷取出第 二组音讯特征参数; 正规化该第二组音讯特征参数以取得数个分类资 讯;及 使用人工智慧演算将该第二音讯讯号分类至该等 分类项目,并储存至资料库。 14.如请求项13所述之音讯分类处理方法,更包括以 独立成份分析该第二音讯讯号,并自该第二音讯讯 号中分离出数个音乐成份。 15.如请求项13所述之音讯分类处理方法,其中该第 一音讯讯号为一欲分类之测试讯号,可产生该音讯 分类器之分类项目。 16.如请求项13所述之音讯分类处理方法,其中该第 二音讯讯号为数个声波所混合之讯号。 17.如请求项13所述之音讯分类处理方法,其中对该 第一音讯讯号撷取出第一组音讯特征参数,系在频 率域、时域及统计上撷取该音讯讯号之特征。 18.如请求项13所述之音讯分类处理方法,其中对该 第二音讯讯号撷取出第二组音讯特征参数,系在频 率域、时域及统计上撷取该音讯讯号之特征。 19.如请求项13所述之音讯分类处理方法,其中分类 至该等分类项目系依类神经网路、模糊类神经网 路、最近邻居法则及隐藏式马可夫模型分类该输 入讯号。 图式简单说明: 第1图为根据本发明之一实施例之智慧型音讯处理 器之架构示意图。 第2图为根据本发明之一实施例之类神经网路架构 示意图。 第3图为根据本发明之一实施例之模糊类神经网路 架构示意图。 第4图为根据本发明之一实施例之最近邻居法则之 步骤示意图。 第5图为根据本发明之一实施例之隐藏式马可夫模 型之处理步骤示意图。
地址 新竹市大学路1001号