发明名称 对文档管理系统中的文档集合进行分类的方法以及系统
摘要 本发明提供了一种对文档管理系统中的文档集合进行分类的方法,该方法包括:分析所述文档集合,从该文档集合中的每一文档内抽取特征值,并根据该特征值生成特征标签,每一所述特征标签对应所述文档集合中的一个或多个文档;选取所述文档集合的全集或非空子集;构建条件模型,该条件模型包括多个类别,每一所述类别关联一个或多个所述特征标签以及包括该一个或多个特征标签在所述全集或非空子集内对应的全部或部分文档;根据所述条件模型对所述全集或非空子集中包括的文档进行分类。相应地,本发明还提供了一种对文档管理系统中的文档集合进行分类的系统。实施本发明可以降低文档分类的时间复杂度以及实现对大量文档按照任意需求进行多维度分类管理。
申请公布号 CN102591920B 申请公布日期 2013.11.20
申请号 CN201110427970.6 申请日期 2011.12.19
申请人 刘松涛 发明人 刘松涛
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人 冯谱
主权项 一种对文档管理系统中的文档集合进行分类的方法,该方法包括:分析文档管理系统中的文档集合,从该文档集合中的每一文档内抽取特征值,并根据该特征值生成特征标签,每一所述特征标签对应所述文档集合中的一个或多个文档;选取所述文档集合的全集或非空子集;构建条件模型,该条件模型包括多个类别,每一所述类别关联一个或多个所述特征标签以及包括该一个或多个特征标签在所述全集或非空子集内对应的全部或部分文档;其中,每一所述类别关联一个或多个所述特征标签的方法包括下列步骤,生成可视化图形界面,该可视化图形界面中包括多个固定区域和多个可活动图形元素,每一固定区域对应一个所述类别,每一所述图形元素对应一个所述特征标签,接收用户针对所述图形元素的操作,根据该操作将所述图形元素移动至所述固定区域内,将每一所述固定区域对应的所述类别判定为与该固定区域内的一个或多个图形元素对应的所述特征标签相关联;调整每一所述类别包括的文档,令任意两个所述类别包括的文档针对所述全集或非空子集互斥;根据所述条件模型对所述全集或非空子集中包括的文档进行分类。
地址 100078 北京市丰台区芳古园一区17楼1门1105号