发明名称 |
人机交互学中的主动特征化 |
摘要 |
非常大的数据的集合可能难以搜索和/或分析。通过在有用的类别中自动分类查询和网页,以及利用这些分类得分作为相关性特征,可能显著提升相关性。完整的方法可能需要构建大量的分类器,对应于各种类型的信息、活动和产品。在大的数据集上提供分类器和概要器的创建。在数亿条目上练分类器和概要器可以通过添加可用的元数据来显露数据所固有的价值。一些方面包括主动标记探索、自动正则化和冷启动、通过条目数量和分类器数量缩放、主动特征化、以及分割和概要化。 |
申请公布号 |
CN105393265A |
申请公布日期 |
2016.03.09 |
申请号 |
CN201480039813.X |
申请日期 |
2014.07.08 |
申请人 |
微软技术许可有限责任公司 |
发明人 |
P·Y·西马德;D·M·奇克林;D·G·格朗吉耶;A·拉克希米拉坦;S·A·阿默诗 |
分类号 |
G06N99/00(2006.01)I |
主分类号 |
G06N99/00(2006.01)I |
代理机构 |
永新专利商标代理有限公司 72002 |
代理人 |
刘瑜;王英 |
主权项 |
一种用于机器学习的交互式特征选择的方法,包括:提供数据条目的第一集合,其中所述数据条目中的一个或多个数据条目先前已经被标记为特定类别的数据条目的示例;使用分类器来确定所述数据条目中的一个或多个数据条目的预测的标记;识别在先前标记与预测的标记之间具有差异的一个或多个数据条目;经由用户接口来呈现在所述先前标记与所述预测的标记之间具有所述差异的所述一个或多个数据条目的指示,其中所述用户接口包括特征选择接口,所述特征选择接口被配置为接收对一个或多个特征的用户选择,所述一个或多个特征能够用作输入特征来训练所述分类器;经由所述用户接口来接收对一个或多个特征的所述用户选择;以及利用一个或多个用户选定的特征作为输入特征来训练所述分类器。 |
地址 |
美国华盛顿州 |