摘要 |
<p>Die Erfindung betrifft ein Spracherkennungsverfahren, bei dem eingehende Sprachsignale über eine Vorverarbeitungseinheit einer Spracherkennungseinheit zugeleitet werden und dort einem Spracherkennungsprozeß unterworfen werden, wobei mittels der Vorverarbeitungseinheit die eingehenden Sprachsignale einer Merkmalsextraktion, einer Segmentierung und einer Klassifizierung nach dem Energiegehalt unterzogen werden und wobei nur diejenigen Segmente weiterverarbeitet werden, deren Energiegehalt einen vorgegebenen oder adaptiv ermittelten Energie-Schwellenwert überschreitet. Um eine möglichst robuste Spracherkennung durchführen zu können und um den eigentlichen Spracherkenner zu entlasten, wird nach der Erfindung vorgeschlagen, daß diejenigen Segmente, deren Energiegehalt den vorgegebenen oder adaptiv ermittelten Energie-Schwellenwert überschreiten, anschließend daraufhin untersucht und klassifiziert werden, ob sie aus einem Sprachsignal oder einem Nicht-Sprachsignal abgeleitet sind, und daß nur die als aus einem Sprachsignal abgeleitet klassifizierten Segemente weiter verarbeitet werden. Dementsprechend wird für die Anordnung zum Durchführen des Verfahrens, die mit einer Merkmalsextraktionseinheit, einem dieser Einheit nachgeschalteten Energiedetektor, einer diesem Detektor nachgeschalteten Vektorquantisierungseinheit und einer dieser Einheit nachgeschalteten Klassifizierungseinheit ausgerüstet ist, vorgeschlagen, daß zwischen Energiedetektor und Vektorquantisierungseinheit ein Nichtwortdetektor geschaltet ist. <IMAGE></p> |