发明名称 多语言中创造分类及训练资料
摘要 藉由一种方法来解决建立物件分类(taxonomies)系统以及归类(categorising)这类物件的问题,尤其是各种语言中可用文字表示的物件,该方法系利用自一第一语言所产生之训练文件,将它们翻译成目标语言(target language),然后从复数个训练文件中产生一组或多组特征,此特征代表在目标语言中一个或多个类别(categories)。该方法包含之步骤为:形成一第一项目清单,在此第一清单中每个项目代表一特定训练文件,此特定之训练文件系与一个或多个关系到一特定类别之元件有一关连;从第一清单中删除一个或多个满足至少一个删除准则(deletion criterion)的候选文件,以发展成一第二清单;将第二清单中的文件由原始语言翻译成目标语言;以及利用一个或多个特征选择准则,自第二清单之已翻译的文件中撷取(extracting))出一组或多组特征。
申请公布号 TW200519645 申请公布日期 2005.06.16
申请号 TW092133682 申请日期 2003.12.01
申请人 国际商业机器股份有限公司 发明人 斯帝芬C 盖兹;郑傅可欣
分类号 G06F17/28 主分类号 G06F17/28
代理机构 代理人 蔡玉玲
主权项
地址 美国