摘要 |
<p>L'invention porte sur un procédé et un système pour prendre des décisions de fusion pour une traduction, qui sont appropriés lorsque la langue est une langue à composition. Le procédé comprend l'émission de décisions sur la fusion de paires de mots dans une chaîne de texte traduite avec un système de fusion. Le système de fusion peut comprendre un ensemble d'heuristiques stockées et/ou un modèle de fusion. Dans le cas d'heuristiques, celles-ci peuvent comprendre une heuristique selon laquelle deux mots consécutifs dans une chaîne sont pris en compte pour une fusion si le premier mot des deux mots consécutifs est reconnu comme un modificateur de composé et leur fréquence observée f des deux mots consécutifs en tant que mot composé fermé est supérieure à une fréquence observée f des deux mots consécutifs en tant que bigramme. Dans le cas d'un modèle de fusion, il peut être un modèle qui est entraîné sur des caractéristiques associées à des paires d'unités lexicales consécutives de chaînes de texte dans un ensemble d'apprentissage et à des décisions de fusion prédéterminées pour les paires. Une traduction en langue cible est produite, sur la base des décisions de fusion pour la chaîne de texte traduite.</p> |