摘要 |
입력장치(21)로부터 입력된 등록된 화자의 음성은 변환장치(22)에 의해 다단계 등급 이미지로서, 소리 스펙트로그램 "A" 로 변환되고, 이는 등록된 화자 정보 저장장치(23)에 저장된다. 식별되어질 화자의 음성이 입력장치(21)로부터 입력되어 변환장치(22)에 의해 소리 스펙트로그램 "B"로 변환되고, 검출장치(26)는 배치장치(25)에 의해 등록된 음성 이미지(A) 내에 위치한 복수의 템플릿을 포함하는 부분 이미지 및 최대 상관계수가 계산되는 대상 음성 이미지(B) 상의 각 영역을 검출한다. 그 다음, 등록된 화자와 대상 화자 사이의 식별하는 차이점의 정도를 판단하기 위해, 판단장치(27)는 복수 템플릿의 상호 위치관계를 최대 상관계수가 검출되어진 각 영역의 상호 위치관계와 비교한다. 판단된 식별은 표시장치(28)를 통해 출력된다. |