摘要 |
Sposób poprawy jakości sygnału mowy w systemach rozpoznawania mowy i komunikacyjnych, który odebrany jest z odbiornika dźwięku (OD), polegający na rejestrowaniu twarzy użytkownika przez odbiornik wizyjny (K) i generowaniu sygnałów lokalizujących jego twarz oraz aktywność ust, charakteryzuje się tym, że w układzie detekcji twarzy (UT) implementuje się pierwszy algorytm (AL1) realizujący zadanie lokalizacji twarzy w sygnale wizyjnym (W1). W układzie detekcji ust (US) implementuje się drugi algorytm (AL2) realizujący wykrywanie aktywności ust w sygnale wizyjnym (W1) obrazującym obszar twarzy oraz implementuje się trzeci algorytm (AL3) realizujący pomiar aktywności ust w oparciu o estymatę kontur ust wokół wewnętrznych krawędzi górnej i dolnej wargi. Do odbiornika dźwięku (OD), korzystnie macierzy mikrofonów lub akustycznej sondy natężeniowej, podłącza się układ filtracji kierunkowej (UF), w którym implementuje się czwarty algorytm (AL4) realizujący filtrację przestrzenną. Sygnał zawierający informację o lokalizacji twarzy (Z1) przesyła się z układu detekcji twarzy (UT) do układu filtracji kierunkowej (UF), a sygnał zawierający informację o aktywności ust (Z2) przesyła się z układu detekcji ust (US) do modulatora amplitudowego (MA). Odebrany sygnał mowy (S1) z odbiornika dźwięku (OD) poddaje się filtracji przestrzennej w układzie filtracji kierunkowej (UF), a przefiltrowany sygnał mowy (S2) kieruje się do modulatora amplitudowego (MA), w którym ingeruje się w wartość amplitudy przesłanego przefiltrowanego sygnału mowy (S2), w ten sposób że fragmenty sygnału niezawierające mowy zeruje się, a jednocześnie wzmacnia się korzystnie przefiltrowany sygnał mowy (S2) rejestrowany w momentach czasu, w których przy pomocy trzeciego algorytmu (AL3) wykrywa się aktywności ust. Uzyskany zmodyfikowany sygnał mowy (SF), przekazuje się do układu rozpoznawania mowy (UM). Wynalazek obejmuje również układ do realizacji sposobu. |