发明名称 用于为统计应用处理训练数据的系统和方法
摘要 本发明公开了用于为统计分类应用处理训练数据的系统和方法。在一个实施例中,计算训练数据元素的置信度值,以标识训练数据元素属于所标识的类的概率。使用所计算的置信度值生成交互式散点图。散点图可视地指示散点图中的点的置信度值。因此,用户能够标识出潜在的被错误分类的训练数据元素。用户可以从散点图中选择训练数据元素,并适当地重新分类训练元素。一旦重新分类,则可重新计算置信度值并修正散点图。
申请公布号 CN1677381A 申请公布日期 2005.10.05
申请号 CN200510005132.4 申请日期 2005.01.28
申请人 安捷伦科技有限公司 发明人 李强
分类号 G06F15/18 主分类号 G06F15/18
代理机构 北京东方亿思知识产权代理有限责任公司 代理人 王怡
主权项 1.一种含有用于为统计分类应用处理训练数据的可执行指令的计算机可读介质,所述计算机可读介质包括:用于获取多个训练数据结构的代码,所述多个训练数据结构的每个包括与特征元素相对应的数据成员和标识多个类中的一个的数据成员;用于使用概率模型计算指示相应的训练数据结构属于其所标识的类的相应的概率以处理所述多个训练数据结构中的每个的代码,所述概率模型是所述特征元素的函数;以及用于使用所述多个训练数据结构生成散点图的代码,所述散点图可视地指示所述训练数据结构属于所标识的类的概率。
地址 美国加利福尼亚州