发明名称 ADAPTIVE AUDIO FRAME PROCESSING FOR KEYWORD DETECTION
摘要 모바일 디바이스에서 기능을 활성화시키기 위해 입력 사운드로부터 타겟 키워드를 검출하는 방법이 개시된다. 이 방법에서, 사운드 피처들은 입력 스트림으로부터 추출되고 특정 사운드 피처의 분산 및 평균 값을 포함하는 통계치가 생성된다 (340). 이 통계치에 기초하여, 방법은 현재 값과 이전 값 간의 차이가 크지 않은 경우 사운드 피처의 정규화를 적응적으로 스킵하고, 이것은 프로세스 로드를 낮추는 효과를 갖는다. 상세하게는, 제 1 복수의 사운드 피처들이 버퍼 (330) 에서 수신되고, 제 2 복수의 사운드 피처들이 버퍼 (330) 에서 수신된다. 버퍼에서 제 2 복수의 사운드 피처들 각각을 수신하는 동안, 제 1 수의 사운드 피처들이 버퍼로부터 프로세싱된다. 제 1 수의 사운드 피처들은 2 이상의 사운드 피처들을 포함한다. 또한, 방법은 프로세싱된 사운드 피처들 각각에 대한 키워드 스코어 (360) 를 결정하는 단계, 및 키워드 스코어들 중 적어도 하나가 임계 스코어보다 크면 입력 사운드를 타겟 키워드 (370) 로서 결정하는 단계를 포함한다.
申请公布号 KR20160005050(A) 申请公布日期 2016.01.13
申请号 KR20157033064 申请日期 2014.04.24
申请人 QUALCOMM INCORPORATED 发明人 LEE MINSUB;KIM TAESU;HWANG KYUWOONG;KIM SUNGWOONG;JIN MINHO
分类号 G10L15/32;G10L15/08;G10L15/183 主分类号 G10L15/32
代理机构 代理人
主权项
地址