发明名称 СИСТЕМА, СПОСОБ И ПОСТОЯННЫЙ МАШИНОЧИТАЕМЫЙ НОСИТЕЛЬ ДЛЯ ПРОВЕРКИ ВЕБ-СТРАНИЦ
摘要 1. Компьютерный способ проверки веб-страниц, способ содержит:получение двух или более эталонных веб-страниц, причем каждая веб-страница содержит множество элементов веб-страницы;анализ процессором элементов веб-страницы двух или более эталонных веб-страниц для идентификации сходства и взаимоотношений между элементами веб-страниц;создание процессором набора шаблонов проверки, идентифицирующих по меньшей мере множество элементов, общих для двух или более эталонных веб-страниц;создание процессором набора правил проверки, определяющих по меньшей мере логические взаимоотношения между элементами веб-страницы каждой эталонной веб-страницы; иподтверждение процессором соответствия проверяемой веб-страницы набору шаблонов проверки и набору правил проверки.2. Способ по п. 1, в котором анализ процессором элементов веб-страницы двух или более эталонных веб-страниц для идентификации сходства и взаимоотношений между элементами веб-страниц содержит:создание одного или нескольких регулярных выражений для одного или нескольких элементов веб-страниц; ииспользование регулярных выражений для идентификации сходных элементов в двух или более эталонных веб-страницах.3. Способ по п. 2, в котором регулярное выражение может содержать множество символов и операторов для определения набора одной или нескольких строк в виде выражения или шаблона.4. Способ по п. 3, в котором регулярное выражение может содержать самый длинный общий префикс, самый длинный общий суффикс и самую длинную общую подстроку текстового контента элемента веб-страницы.5. Способ по п. 2, в котором регулярное выражение выполнено с возможностью сравнивать выбранный процент
申请公布号 RU2015116942(A) 申请公布日期 2016.11.27
申请号 RU20150116942 申请日期 2015.05.06
申请人 ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЯНДЕКС" 发明人 Кацев Илья Владимирович;Поляков Владимир Александрович
分类号 G06F7/00 主分类号 G06F7/00
代理机构 代理人
主权项
地址