发明名称 AUTOMATIC LANGUAGE IDENTIFICATION SYSTEM FOR MULTILINGUAL OPTICAL CHARACTER RECOGNITION
摘要 <p>Selon cette invention, on utilise une voie de recherche basée sur des dictionnaires pour identifier des langues dans différentes zones d'un document multilingue. A la première étape, une image du document est segmentée en différentes zones, régions et mots symboles par des propriétés géométriques appropriées. Dans chaque zone, les mots symboles sont comparés aux dictionnaires associés à différentes langues candidates, et la langue qui présente le facteur de certitude le plus élevé est d'abord identifiée comme la langue de la zone. Ensuite, chaque zone est également divisée en régions. La langue de chaque région est alors identifiée à l'aide des facteurs de certitude pour les mots de cette région. Pour toute détermination de langue ayant une valeur de certitude faible, la langue de la zone précédemment déterminée est utilisée pour faciliter le processus d'identification.</p>
申请公布号 WO1999014708(A1) 申请公布日期 1999.03.25
申请号 US1997018705 申请日期 1997.11.20
申请人 发明人
分类号 主分类号
代理机构 代理人
主权项
地址