发明名称 |
用于预测建模的方法和系统 |
摘要 |
提供一种用于执行预测分析的方法(100),所述方法基于两条独立的信息,即,原始训练数据集合(D<sub>orig</sub>)和指示指标的“真实”分布(P<sub>true</sub>(<u>X</u>)),生成预测模型(P<sub>adj</sub>(Y|<u>X</u>))。所述方法(100)开始于根据包含指示指标(<u>x</u>)和相对应的标签(y)的元组(<u>x</u>,y)的原始训练集合(D<sub>orig</sub>)生成基本模型分布(P<sub>gen</sub>(Y|<u>X</u>))(步骤120)。使用指示指标的所述“真实”分布(P<sub>true</sub>(<u>X</u>)),生成反映所述“真实”分布(P<sub>true</sub>(<u>X</u>))的指示指标记录(<u>x</u>)的随机数据集合(D’)(步骤140)。随后,向所述随机数据集合(D’)应用所述基本模型(P<sub>gen</sub>(Y|<u>X</u>)),因而向所述随机数据集合(D’)中的每个指示指标记录(<u>x</u>)分配标签(y)或者标签的分布,并且生成调整的训练集合(D<sub>adj</sub>)(步骤150)。最后,基于所述调整的训练集合(D<sub>adj</sub>)训练调整的预测模型(P<sub>adj</sub>(Y|<u>X</u>))(步骤160)。 |
申请公布号 |
CN103262069B |
申请公布日期 |
2016.04.13 |
申请号 |
CN201180059660.1 |
申请日期 |
2011.11.03 |
申请人 |
国际商业机器公司 |
发明人 |
C·林根菲尔德;M·武斯特;P·彭佩 |
分类号 |
G06F17/18(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/18(2006.01)I |
代理机构 |
北京市金杜律师事务所 11256 |
代理人 |
酆迅;陈颖 |
主权项 |
一种用于执行预测分析的方法(100),包括‑接收基于原始训练集合D<sub>orig</sub>估计基本模型分布P<sub>gen</sub>(Y│<u>X</u>)的基本模型M<sub>gen</sub>,所述原始训练集合D<sub>orig</sub>包含指示指标<u>x</u>和相对应的标签y的元组(<u>x</u>,y);其中指示指标<u>x</u>描述影响因子,并且其中相对应的标签y描述预测;‑接收包括至少一个关于实际的假设的逼近指示指标的真实分布的分布P<sub>true</sub>(<u>X</u>);‑基于所述真实分布P<sub>true</sub>(<u>X</u>)生成指示指标<u>x</u>的随机数据集合D’;‑向所述随机数据集合D’应用所述基本模型分布P<sub>gen</sub>(Y│<u>X</u>),因而向所述随机数据集合D’中的每个指示指标<u>x</u>分配标签y或者标签的分布,并且生成调整的训练集合D<sub>adj</sub>;‑基于所述调整的训练集合D<sub>adj</sub>训练调整的预测模型P<sub>adj</sub>(Y│<u>X</u>),其中所述预测模型P<sub>adj</sub>(Y│<u>X</u>)代表基本模型分布P<sub>gen</sub>(Y│<u>X</u>)和真实分布P<sub>true</sub>(<u>X</u>)。 |
地址 |
美国纽约阿芒克 |