摘要 |
一种可辨识出环境中的语音(Speech)与非语音(Non–speech)之方法及系统,用以将一具有复数频道之混合声音源辨识成一语音讯号及其它非语音讯号,该方法包含下列步骤:(a)利用一盲讯号源分离(Blind Source Separation,BSS)单元将该混合声音源分离成复数声音讯号;(b)储存每一声音讯号之频谱;(c)根据所储存的过去频谱资讯及该盲讯号源分离单元所送来的目前频谱资讯,计算出每一声音讯号之频谱波动(Spectrum Fluctuation);及(d)将具有最大频谱波动之其中一声音讯号辨识成该语音讯号。 |