摘要 |
藉由一种方法来解决建立物件分类(taxonomies)系统以及归类(categorising)这类物件的问题,尤其是各种语言中可用文字表示的物件,该方法系利用自一第一语言所产生之训练文件,将它们翻译成目标语言(target language),然后从复数个训练文件中产生一组或多组特征,此特征代表在目标语言中一个或多个类别(categories)。该方法包含之步骤为:形成一第一项目清单,在此第一清单中每个项目代表一特定训练文件,此特定之训练文件系与一个或多个关系到一特定类别之元件有一关连;从第一清单中删除一个或多个满足至少一个删除准则(deletion criterion)的候选文件,以发展成一第二清单;将第二清单中的文件由原始语言翻译成目标语言;以及利用一个或多个特征选择准则,自第二清单之已翻译的文件中撷取(extracting))出一组或多组特征。 |