摘要 |
1. Система анализа документа, содержащая:один или более процессоров;один или более модулей памяти; икомпьютерные команды, хранящиеся в одном или более из одного или более модулей памяти, которые, будучи исполненными одним или более из одного или более процессоров, управляют системой анализа документа для обработки электронного документа, имеющего две или более страниц, путемопределения множества гипотез страницы для страницы для каждой из двух или более страниц,выбора для каждой из двух или более страниц гипотезы страницы для страницы из множества гипотез страницы, определенного для страницы на основе вычисленной совместимости гипотезы страницы и одной или более гипотез страницы, выбранных для одной или более соседних страниц, с объектами страницы, содержащимися на странице,использования гипотез страницы, выбранных для двух или более страниц, для выбора гипотезы документа для документа, исохранения обозначения выбранной гипотезы документа в одном из одного или более модулей памяти.2. Система анализа документа по п. 1, в которой определение множества гипотез страницы для страницы содержит одно из:выбора множества сохраненных гипотез страницы;выбора из множества сохраненных гипотез страницы подмножества сохраненных гипотез страницы, совместимых с одним или более фрагментами страницы; ианализа страницы для обнаружения объектов в пределах страницы и построения множества гипотез, совместимых с обнаруженными объектами.3. Система анализа документа по п. 1, в которой выбор гипотезы страницы для страницы на основе вычисленной совместимости гипотезы страницы и одной или более гипотез страницы, выбранных для одной или более сосед |