发明名称 СПОСОБЫ И СИСТЕМЫ ДЛЯ РЕАЛИЗАЦИИ ПРИБЛИЖЕННОГО СРАВНЕНИЯ СТРОК В БАЗЕ ДАННЫХ
摘要 1. Компьютерный способ сравнения символьных строк, символьной строки кандидата с множеством записей символьных строк, сохраненных в базе данных, упомянутый способ включает: ! a) идентификацию набора ссылочных символьных строк в базе данных, ссылочные символьные строки идентифицируются с использованием оптимизированного поиска набора разнородных символьных строк; ! b) генерирование представления n-граммы одной из ссылочных символьных строк в наборе ссылочных символьных строк; ! c) генерирование представления n-граммы символьной строки кандидата; ! d) определение подобия между представлениями n-грамм; ! e) повторение шагов b) и d) для оставшихся ссылочных символьных строк в наборе идентифицированных ссылочных символьных строк; и ! f) индексацию символьной строки кандидата в базе данных, основанную на определении релевантности между представлением n-граммы символьной строки кандидата и ссылочными символьными строками в идентифицированном наборе. ! 2. Компьютерный способ по п.1, отличающийся тем, что определение подобия между представлениями n-граммы включает: ! вычисления двумерного вектора, содержащего частоту возникновения всех уникальных n-грамм в символьной строке кандидата и частоту возникновения всех уникальных n-грамм в ссылочной символьной строке; и ! вычисление метрики подобия для символьной строки кандидата, относительно ссылочной символьной строки, основанной на двумерном векторе. ! 3. Компьютерный способ по п.2, отличающийся тем, что вычисление метрики подобия для символьной строки кандидата включает использование вычисления структурированного языка запроса для сравнения содержания двумерного в�
申请公布号 RU2010125681(A) 申请公布日期 2011.12.27
申请号 RU20100125681 申请日期 2008.12.04
申请人 МАСТЕРКАРД ИНТЕРНЕШНЛ ИНКОРПОРЕЙТЕД (US) 发明人 МЕРЦ Кристофер Дж. (US);МАКГИАН Томас (US)
分类号 G06F7/00 主分类号 G06F7/00
代理机构 代理人
主权项
地址