摘要 |
<p>Sistema e método para busca fonética de dados. Um método de buscar foneticamente informações de mídia compreende receber uma pluralidade de consultas de busca de um ou mais sistemas de cliente e fornecer uma representação fonética de cada consulta de busca. Um ou mais trabalhos de busca são instanciados, cada trabalho de busca compreendendo uma pluralidade de tarefas, cada tarefa sendo organizada para sequencialmente ler um bloco de uma pasta de arquivo. A pasta de arquivo é armazenada em um sistema de arquivamento distribuído (dfs) no qual blocos sequenciais de dados compreendendo a pasta de arquivo são replicados para serem localmente disponíveis para um ou mais processadores de um cluster de processadores para executar as tarefas. Cada bloco armazena arquivos de índice correspondendo a uma pluralidade dos arquivos de mídia de fonte, cada arquivo de índice contendo um fluxo fonético correspondendo a informações de áudio para um dado arquivo de mídia de fonte. Cada tarefa contém representações fonéticas de consultas de busca pendentes para um bloco e sequencialmente busca o bloco para cada consulta de busca pendente. Responsivo ao casamento de uma consulta de busca com um local no fluxo fonético para um arquivo de índice, a localização e um identificador da midia de fonte são retornados para responder à consulta de busca.</p> |