发明名称 |
数据流预测方法及装置 |
摘要 |
本发明涉及一种数据流预测方法及装置。数据流预测方法包括:根据样本数据更新集成模型索引,集成模型索引用于存储关键词与支持向量集合之间的映射关系,支持向量集合中的支持向量为所述集成模型中支持向量机SVM分类器的支持向量;对输入文本进行分词,得到该输入文本的关键词,输入文本为待测数据流;根据更新后的集成模型索引检索包含关键词的支持向量集合,以及该支持向量集合中的支持向量所在SVM分类器的信息;用检索到的支持向量集合中的所有支持向量对输入文本进行预测。本发明的数据流预测方法及装置,基于集成模型索引进行亚线性的在线预测,由于通过倒排表将支持向量按照关键字进行聚集,因而预测速度得到了明显的提升。 |
申请公布号 |
CN102710616B |
申请公布日期 |
2015.04.22 |
申请号 |
CN201210155437.3 |
申请日期 |
2012.05.18 |
申请人 |
中国科学院信息工程研究所 |
发明人 |
李军;张鹏;郭莉;刘萍;方滨兴 |
分类号 |
H04L29/06(2006.01)I;H04L12/26(2006.01)I |
主分类号 |
H04L29/06(2006.01)I |
代理机构 |
北京轻创知识产权代理有限公司 11212 |
代理人 |
杨立 |
主权项 |
一种数据流预测方法,其特征在于,包括:根据样本数据更新集成模型索引,所述集成模型索引用于存储关键词与支持向量集合之间的映射关系,所述支持向量集合中的支持向量为所述集成模型中支持向量机SVM分类器的支持向量,所述集成模型索引包含倒排表和分类器信息表,所述倒排表用于存储包含关键词的支持向量集合,所述支持向量用支持向量标识唯一表示,所述分类器信息表用于存储SVM集成模型包含的分类器信息;对输入文本进行分词,得到该输入文本的关键词,所述输入文本为待测数据流;根据更新后的集成模型索引检索包含所述关键词的支持向量集合,以及该支持向量集合中的支持向量所在SVM分类器的信息;检索方式为:通过支持向量标识定位到支持向量后,再移位获取分类器ID,通过分类器ID获取分类器信息表的入口地址;用检索到的支持向量集合中的所有支持向量对所述输入文本进行预测。 |
地址 |
100093 北京市海淀区闵庄路甲89号 |