发明名称 包括自动分类规则的数据分类流水线
摘要 描述了通过可扩展的数据处理流水线(包括分类流水线)来处理数据项(例如,文件)以基于数据项的分类来促进对数据项进行管理的技术。发现模块定位要处理的数据项。独立分类流水线获取与每一个被发现的数据项相关联的元数据(属性),而一个或多个分类器基于元数据来分类数据项。独立的策略模块基于其分类将策略应用到每一个数据项。可以基于各种准则来调用多个分类器。预定义排序的分类器、权威性分类器和/或聚合机制处理任何分类冲突。可以提供不同类型的分类器,而每一个分类器都可以对应于自动分类规则;分类器可以直接改变属性(例如,设置分类)或将结果返回到用于改变属性的相对应的规则机制。
申请公布号 CN102414677B 申请公布日期 2016.04.13
申请号 CN201080018349.8 申请日期 2010.04.14
申请人 微软技术许可有限责任公司 发明人 P·A·奥尔泰安;C·劳;J·哈迪;N·本-茨维;R·卡拉赫
分类号 G06F17/00(2006.01)I;G06F7/24(2006.01)I 主分类号 G06F17/00(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 高见
主权项 在计算环境中,一种用于对数据项进行分类的系统,所述系统包括:一个或多个处理器;以及耦合至所述一个或多个处理器的存储器,所述存储器存储指令,所述指令在由所述一个或多个处理器执行时使得所述一个或多个处理器:提供分类流水线,其包括获取与数据项相关联的元数据以及与所述数据项相关联的现有分类元数据的组件,其中所述现有分类元数据包括所述数据项的当前分类值,并且其中所述数据项的所述当前分类值被存储在所述数据项中;提供多个分类器模块,其中所述多个分类器模块中的每个分类器模块具有相关联的分类规则,并且其中所述分类规则中的每一个在被调用时,使用与数据项相关联的元数据以及与数据项相关联的现有分类元数据来确定所述数据项的分类元数据,并且其中所述多个分类器模块是使用以下中的至少一者来进行调停的:聚合分类、权威性分类和高度分类;以及提供将所述分类元数据与所述数据项进行关联以便用于将策略应用到所述数据项的组件。
地址 美国华盛顿州