摘要 |
Beschrieben wird ein Verfahen zur Ermittlung eines Eigenraums zur Darstellung einer Mehrzahl von Trainingssprechern, bei dem zunächst sprecherabhängige Modell-Sets für die einzelnen Trainingssprecher unter Verwendung von Trainingssprachdaten der einzelnen Trainingssprecher gebildet werden, wobei die Modelle (SD) eines Modell-Sets jeweils durch mehrere Modellparameter beschrieben werden. Für jeden Sprecher wird dann ein kombiniertes Modell in einem hochdimensionalen Modellraum durch Verkettung der Modellparameter der Modelle der einzelnen Trainingssprecher zu jeweils einem zusammenhängenden Supervektor abgebildet. Anschließend wird eine Transformation unter Reduzierung der Dimension des Modellraums zur Gewinnung von Eigenraum-Basisvektoren (E¶e¶) durchgeführt. Um eine eindeutige Zuordnung der Modellparameter in den Supervektoren zu gewährleisten, wird dabei zunächst ein gemeinsames sprecherunabhängiges Modell-Set für die Trainingssprecher entwickelt und dieses Modell-Set an die einzelnen Trainingssprecher zur Entwicklung der sprecherabhängigen Modell-Sets adaptiert. Die Zuordnung der Modellparameter der Modelle (SI) des sprecherunabhängigen Modell-Sets zu den Modellparametern der Modelle (SD) der sprecherabhängigen Modell-Sets wird dabei erfasst und die Verkettung der Modellparameter der einzelnen Modell-Sets zu den Supervektoren erfolgt unter Berücksichtigung dieser Zuordnung.
|