发明名称 SYSTEME ET PROCEDE POUR LA GENERATION PRODUCTIVE DE MOTS COMPOSES DANS UNE TRADUCTION AUTOMATIQUE STATISTIQUE
摘要 <p>L'invention porte sur un procédé et un système pour prendre des décisions de fusion pour une traduction, qui sont appropriés lorsque la langue est une langue à composition. Le procédé comprend l'émission de décisions sur la fusion de paires de mots dans une chaîne de texte traduite avec un système de fusion. Le système de fusion peut comprendre un ensemble d'heuristiques stockées et/ou un modèle de fusion. Dans le cas d'heuristiques, celles-ci peuvent comprendre une heuristique selon laquelle deux mots consécutifs dans une chaîne sont pris en compte pour une fusion si le premier mot des deux mots consécutifs est reconnu comme un modificateur de composé et leur fréquence observée f des deux mots consécutifs en tant que mot composé fermé est supérieure à une fréquence observée f des deux mots consécutifs en tant que bigramme. Dans le cas d'un modèle de fusion, il peut être un modèle qui est entraîné sur des caractéristiques associées à des paires d'unités lexicales consécutives de chaînes de texte dans un ensemble d'apprentissage et à des décisions de fusion prédéterminées pour les paires. Une traduction en langue cible est produite, sur la base des décisions de fusion pour la chaîne de texte traduite.</p>
申请公布号 FR2982388(A1) 申请公布日期 2013.05.10
申请号 FR20120056842 申请日期 2012.07.16
申请人 XEROX CORPORATION 发明人 CANCEDDA NICOLA;STYMNE SARA
分类号 G06F17/28 主分类号 G06F17/28
代理机构 代理人
主权项
地址