发明名称 processo implementado por computador para a pesquisa em uma multiplicidade de conjuntos de dados, produto de programa de computador com código de programa, e, motor de pesquisa.
摘要 processo implementado por computador para a pesquisa em uma multiplicidade de conjuntos de dados, produto de programa de computador com código de programa, e, motor de pesquisa. a presente invenção se refere a um processo implementado por computador para a pesquisa numa multiplicidade (d) de conjuntos de dados (d), no qual é recebida uma consulta de pesquisa (q) com pelo menos um termo de pesquisa (q~ i~ ), no qual a partir de uma quantidade de referência (t) é determinada uma quandidade parcial (v) com termos (t~ j~), que são semelhantes ou idênticos ao termo de pesquisa (q~ i~), no qual para cada termo (t~ j~) da quantidade parcial (v) é determinada uma medida de similaridade (a~j~) para o termo de pesquisa (q~ i~), no qual é determinada a probabilidade (p~ j~) para a ocorrência do termo (t~ j~), no qual é aplicada uma distribuição ponderada (x~ j~) em função do termo (t~i~) aos termos (t~ k~) da quantidade parcial (v), sendo que os termos (t~ k~), que apresentam uma medida de similaridade mais elevada, são mais ponderados do que os termos (t~ k~) que apresentam uma medida de similaridade mais reduzida e que é determinada uma probabilidade modificada (p<39>~ j~, p" ~ j~) para o termo (t~ j~) a partir das probabilidades ponderadas dos termos (t~ k~) da quantidade parcial (v). além disso os conjuntos de dados (d~ i~) são avaliados quanto à respectiva relevância (r) para a consulta de pesquisa (q), sendo que é verificado, se os termos (t~ j~) da quantidade parcial (v) ocorrem no conjunto de dados (d~ 1~ ), e, quando um termo (t~ j~) da quantidade parcial (v) ocorre no conjunto de dados (d~ 1~), uma probabilidade modificada (p<39>~j ~, p"~ j~) mais reduzida do termo (t~j ~) conduz a um valor de relevância mais elevado do conjunto de dados (d~ 1~), sendo que é emitida pelo menos uma quantidade parcial de conjunto de dados em função do respectivo valor de relevância (r). além disso a presente invenção se refere a um motor de pesquisa para a realização do referido processo.
申请公布号 BR112013004243(A2) 申请公布日期 2016.07.26
申请号 BR20131104243 申请日期 2011.08.17
申请人 OMIKRON DATA QUALITY GMBH 发明人 CARSTEN HEINZ;EMIN KARAYEL;MATTHIAS KRINGS
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人
主权项
地址