摘要 |
Eine Melodieextraktion oder automatische Transkription kann deutlich stabiler und gegebenenfalls sogar unaufwendiger gestaltet werden, wenn die Annahme genügend Berücksichtigung findet, dass die Hauptmelodie derjenige Anteil eines Musikstückes ist, den der Mensch am lautesten und prägnantesten wahrnimmt. Dies aufgreifend wird bei der Ermittlung der Melodie des Audiosignals zunächst eine Melodielinie, die sich durch die Zeit-/Spektraldarstellung erstreckt, ermittelt, und zwar dadurch, dass jedem Zeitabschnitt bzw. Frame - in eindeutiger Weise - genau eine Spektralkomponente bzw. ein Frequenzbin der Zeit-/Spektraldarstellung zugewiesen wird, nämlich gemäß einem speziellen Ausführungsbeispiel diejenige, die zu dem Schallergebnis mit der maximalen Intensität an diesem Frame führt. |