发明名称 | 文章关键词登录系统及方法 | ||
摘要 | 一种文章关键词登录系统,包括具有一符号库、一虚字词库与一关键词数据库的数据储存装置与一处理器。处理器将一文章与符号库进行对比,进而将文章中与符号库中所纪录相同的符号删除,并将文章中与虚字词库中所纪录相同的虚字删除,之后,计算文章中所有字词出现的次数,从而得到多个候选字词与其相应的出现次数,最后,依据一设定条件由候选字词中选择多个关键词,并将选取的关键词登录至关键词数据库。 | ||
申请公布号 | CN1211747C | 申请公布日期 | 2005.07.20 |
申请号 | CN02131859.X | 申请日期 | 2002.09.06 |
申请人 | 威盛电子股份有限公司 | 发明人 | 陈丁豪;赖文树 |
分类号 | G06F17/30;G06F17/20 | 主分类号 | G06F17/30 |
代理机构 | 北京市柳沈律师事务所 | 代理人 | 马莹;邵亚丽 |
主权项 | 1.一种文章关键词登录系统,包括:一数据储存装置,具有一符号库、一虚字词库与一关键词数据库;以及一处理器,将一文章与该符号库进行对比,进而将该文章中与该符号库中所纪录相同的符号删除,并将该文章与该虚字词库进行对比,进而将该文章中与该虚字词库中所纪录相同的虚字删除,之后,计算该文章中所有字词出现的次数,从而得到多个候选字词与其相应的出现次数,最后,依据一设定条件由所述候选字词中选择多个关键词,并将所述关键词登录至该关键词数据库,其特征在于,该数据储存装置还具有一同义词库,且该处理器还将该文章与该同义词库进行对比,进而将该文章中与该同义词库中所纪录相同的同义词删除,且纪录该文章中该同义词出现的次数,并将与该同义词同义的字词与该同义词出现的次数纪录于一同义词缓冲区,以及该处理器还将该同义词缓冲区中纪录的与同义词同义的字词及同义词出现的次数加入相应候选字词及其相应的出现次数。 | ||
地址 | 台湾省台北县新店市 |