发明名称 СИСТЕМА АВТОМАТИЧЕСКОЙ ИДЕНТИФИКАЦИИ ЯЗЫКА ДЛЯ МНОГОЯЗЫЧНОГО ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ
摘要 В данном изобретении применяют словарный подход для идентификации языков в различных зонах многоязычного документа. На первом этапе образ документа сегментируют на различные зоны, области и словоформы, с использованием подходящих геометрических свойств. В каждой зоне словоформы сравнивают со словарями, сопоставляемыми различным языкам-кандидатам, и язык, который проявляет наивысший показатель доверительности, первоначально идентифицируют в качестве языка данной зоны. Затем каждую зону расщепляют на области. После этого производят идентификацию языка каждой области с использованием показателей доверительности для слов данной области. Для любого определения языка, имеющего низкое значение доверительности, ранее определенный язык зоны применяют с целью способствовать процессу идентификации.Международная заявка была опубликована вместе с отчетом о международном поиске.
申请公布号 EA200000321(A1) 申请公布日期 2000.10.30
申请号 EA20000000321 申请日期 1997.11.20
申请人 КАЕР КОРПОРЕЙШН 发明人 Пон Леонард К.;Канунго Тапас;Янг Дзун;Чой Кеннет Чан;Боксер Минди Р.
分类号 G06K9/68 主分类号 G06K9/68
代理机构 代理人
主权项
地址