发明名称 关联性文件连结管理系统、方法及记录媒体
摘要 一种关联性文件连结管理系统,其包括一文件接收模组、一关键字词类别资料库、一分类模组、一分类文件资料库、一文件检索模组、以及一输出模组。其中,文件接收模组系用以接收复数笔文件资料;关键字词类别资料库系记录有复数个关键字词,以及各关键字词所属之至少一类别;分类模组系依据这些关键字词之关联字词萃取权值以及这些类别来分析这些文件资料,以便产生复数笔分类文件资料;分类文件资料库系储存这些分类文件资料;文件检索模组系搜寻分类文件资料库以自这些分类文件资料检索出至少一特定文件资料;输出模组系输出所检索出之至少一特定文件资料。另外,本发明亦揭露一种关联性文件连结管理方法,以及记录让电脑实施关联性文件连结管理方法之程式的记录媒体。
申请公布号 TWI234720 申请公布日期 2005.06.21
申请号 TW093110776 申请日期 2004.04.16
申请人 威盛电子股份有限公司 发明人 范纲明;陈丁豪
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人 刘正格 台北市大同区重庆北路3段88号3楼之1
主权项 1.一种关联性文件连结管理系统,包含:一文件接收模组,其系用以接收复数笔文件资料;一关键字词类别资料库,其系记录有复数个关键字词,以及各该关键字词所属之至少一类别;一分类模组,其系依据任一该关键字词在该等文件资料之一关联字词萃取权値以及该等类别来分析该等文件资料,以产生复数笔分类文件资料,其中任一该分类文件资料皆至少包含相对应之一该文件资料以及一索引资料,而该索引资料系记录相对应该文件资料所属之类别;一分类文件资料库,其系储存该等分类文件资料;以及一文件检索模组,其系根据至少一搜寻条件,搜寻该分类文件资料库以检索出相对应之至少一该等文件资料。2.如申请专利范围第1项所述之系统,对任一该关键字词与某一该文件资料而言,该分类模组系藉由计算一关键字词出现权重与一收录频率权値的乘积,来获得该关键字词所对应之一关联字词萃取权値,其中该关键字词出现权重代表此一该关键字词在某一该文件资料的份量,而该收录频率权値代表该关键字词与该文件资料的相关度。3.如申请专利范围第2项所述之系统,该分类模组计算该关键字词之关键字词出现权重的方式,至少包含:根据该关键字词在该文件资料中的出现次数,该关键字词的出现次数越多,该关键字词的关键字词出现权重也越大;以及根据该关键字词在所有与该文件资料相关之多数关键字词中的顺位,该关键字词的顺位越高,该关键字词的关键字词出现权重也越大。4.如申请专利范围第2项所述之系统,该分类模组系根据下列方程式计算对应到该关键字词的收录频率权値:5.如申请专利范围第1项所述之系统,当某一该文件资料具有至少一该关键字词时,该分类模组系依照该些关键字词所对应之至少一类别,将此特定文件资料指定到该些分类。6.如申请专利范围第1项所述之系统,更包含:一关联性文件检索模组,其系分析所检索出之至少该等文件资料之一,以检索出与该文件资料相关联的至少一该文件资料,相关联的至少一该文件资料的来源至少包含:与被检索出之该等文件资料具有相同的至少一该关键字词,但每一个该相对应之关联字词萃取权値都小于可以成为被检索出之该等文件资料之一第一値但大于一第二値;与被检索出之该等文件资料具有相同的至少一该关键字词,但至少一个该相对应之关联字词萃取权値小于可以成为被检索出之该等文件资料之一第一値但大于一第二値;以及仅具有被检索出之该等文件资料相对应之至少一关键字词的一部份。7.如申请专利范围第1项所述之系统,更包含:一关联性关键字词检索模组,其系分析所检索出之至少该等文件资料之一,以检索出至少一关联性关键字词,该关联性关键字词的来源至少包含:与被检索出之该等文件资料相关,但相对应之关联字词萃取权値小于相对应搜寻条件之至少一关键字词之关联字词萃取权値的至少一该关键字词;以及与被检索出之该等文件资料相关,但相对应之关联字词萃取权値小于一预定値的至少一该关键字词。8.如申请专利范围第1项所述之系统,更包含一输出模组,该输出模组系至少:输出被检索出相对应之至少一该等分类文件资料;在输出某一该文件资料时,同时输出与该文件资料相关之至少一该关键字词;以及在输出某一该文件资料时,同时输出与该文件资料属于相同分类之至少一其它该文件资料。9.一种关联性文件连结管理方法,包含:接收复数笔文件资料;记录复数个关键字词,以及各该关键字词所属之至少一类别;依据任一该关键字词在该等文件资料之一关联字词萃取权値以及该等类别来分析该等文件资料,以产生复数笔分类文件资料,其中任一该分类文件资料皆至少包含相对应之一该文件资料以及一索引资料,而该索引资料系记录相对应该文件资料所属之类别;储存该等分类文件资料;以及系根据至少一搜寻条件,搜寻该等分类文件资料以检索出相对应之至少一该等文件资料。10.如申请专利范围第9项所述之方法,对任一该关键字词与某一该文件资料,系藉由计算一关键字词出现权重与一收录频率权値的乘积,来获得该关键字词所对应之一关联字词萃取权値,其中该关键字词出现权重代表此该关键字词在某该文件资料的份量,而该收录频率权値代表该关键字词与该文件资料的相关度。11.如申请专利范围第9项所述之方法,计算该关键字词之关键字词出现权重的方式,至少包含:根据该关键字词在该文件资料中的出现次数,在此出现次数越多,关键字词出现权重也越大;以及根据该关键字词在所有与该文件资料相关之多数关键字词中的顺位,在此顺位越高,关键字词出现权重也越大。12.如申请专利范围第9项所述之方法,系根据下列方程式计算对应到该关键字词的收录频率权値:13.如申请专利范围第9项所述之方法,当某该文件资料具有至少一该关键字词,系依照该些关键字词所对应之至少一类别,指定特定文件资料到该些分类。14.如申请专利范围第9项所述之方法,更包含分析所检索出之至少该等文件资料之一,以检索出与该文件资料相关联的至少一该文件资料,在此相关联的至少一该文件资料的来源至少包含:与被检索出之该等文件资料具有相同的至少一该关键字词,但每一个该相对应之关联字词萃取权値都小于可以成为被检索出之该等文件资料之一第一値但大于一第二値;与被检索出之该等文件资料具有相同的至少一该关键字词,但至少一个该相对应之关联字词萃取权値小于可以成为被检索出之该等文件资料之一第一値但大于一第二値;以及仅具有被检索出之该等文件资料相对应之至少一关键字词的一部份。15.如申请专利范围第9项所述之方法,更包含分析所检索出之至少一该等文件资料,以检索至少一关联性关键字词,该关联性关键字词的来源至少包含:与被检索出之该等文件资料相关,但相对应之关联字词萃取权値小于相对应搜寻条件之至少一关键字词之关联字词萃取权値的至少一该关键字词;以及与被检索出之该等文件资料相关,但相对应之关联字词萃取权値小于一预定値的至少一该关键字词。16.如申请专利范围第9项所述之方法,更包含:输出被检索出相对应之至少一该等分类文件资料;在输出某一该文件资料时,同时输出与该文件资料相关之至少一该关键字词;以及在输出某一该文件资料时,同时输出与该文件资料属于相同分类之至少一其它该文件资料。17.一种记录媒体,其系记录有电脑可读取之一关联性文件连结管理程式,该关联性文件连结管理程式包含:一文件接收程式码片段,其系用让电脑以接收复数笔文件资料;一关键字词类别资料库建立程式码片段,其系用以让电脑建立一关键字词类别资料库,其系记录有复数个关键字词,以及各该关键字词所属之至少一类别;一分类程式码片段,其系用以让电脑依据任一该关键字词在该等文件资料之一关联字词萃取权値以及该等类别来分析该等文件资料,以产生复数笔分类文件资料,其中任一该分类文件资料皆至少包含相对应之一该文件资料以及一索引资料,而该索引资料系记录相对应该文件资料所属之类别;一分类文件资料库建立程式码片段,其系用以让电脑建立一分类文件资料库,并储存该些分类文件资料;以及一文件检索程式码片段,其系用以让电脑根据至少一搜寻条件,搜寻该分类文件资料库以检索出相对应之至少一该等文件资料。18.如申请专利范围第17项所述之记录媒体,其中该分类程式码片段更包含:对任一该关键字词与某一该文件资料而言,藉由让电脑计算一关键字词出现权重与一收录频率权値的乘积,来获得该关键字词所对应之一关联字词萃取权値,其中该关键字词出现权重代表此一该关键字词在某一该文件资料的份量,而该收录频率权値代表该关键字词与该文件资料的相关度;让电脑根据某一该关键字词在某一该文件资料中的出现次数,来计算该关键字词之关键字词出现权重,在此出现次数越多,关键字词出现权重也越大;让电脑根据某一该关键字词在所有与某一该文件资料相关之多数关键字词中的顺位,来计算该关键字词之关键之关键字词出现权重,在此顺位越高,关键字词出现权重也越大;让电脑根据下列方程式计算对应到某一该关键字词的收录频率权値:当某一该文件资料具有至少一该关键字词时,让电脑依照该些关键字词所对应之至少一类别,将此特定文件资料指定到该些分类。19.如申请专利范围第17项所述之记录媒体,其中该关联性文件连结管理程式更包含:一关联性文件检索程式码片段,其系让电脑分析所检索出之至少该等文件资料之一,以检索出与该文件资料相关联的至少一该文件资料,相关联的至少一该文件资料的可能来源至少包含:与被检索出之该等文件资料具有相同的至少一该关键字词,但每一个该相对应之关联字词萃取权値都小于可以成为被检索出之该等文件资料之一第一値但大于一第二値;与被检索出之该等文件资料具有相同的至少一该关键字词,但至少一个该相对应之关联字词萃取权値小于可以成为被检索出之该等文件资料之一第一値但大于一第二値;以及仅具有被检索出之该等文件资料相对应之至少一关键字词的一部份。20.如申请专利范围第17项所述之记录媒体,其中该关联性文件连结管理程式更包含:一关联性关键字词检索程式码片段,其系分析所检索出之至少该等文件资料之一,以检索出至少一关联性关键字词,该关联性关键字词的可能来源至少包含:与被检索出之该等文件资料相关,但相对应之关联字词萃取权値小于相对应搜寻条件之至少一关键字词之关联字词萃取权値的至少一该关键字词;以及与被检索出之该等文件资料相关,但相对应之关联字词萃取权値小于一预定値的至少一该关键字词。图式简单说明:图1为习知的关联性文件管理方法的流程图;图2为本发明较佳实施例之关联性文件连结管理系统的示意图;以及图3为本发明较佳实施例之关联性文件连结管理方法的流程图。
地址 台北县新店市中正路535号8楼