发明名称 一种多媒体热点分析方法
摘要 一种信息管理的方法,特别是一种多媒体热点分析方法,通过运用基于蚁群文档聚类算法以及SOM(自组织映射)聚类算法将集到的媒体信息,按照相似度进行自动聚类,以达到多媒体热点分析的目的。本发明的优点在于:运用该方法可以将搜集到的媒体信息,按照相似度进行自动聚类,并将达到关注次数的媒体信息设定为热点。
申请公布号 CN104715024A 申请公布日期 2015.06.17
申请号 CN201510094167.3 申请日期 2015.03.03
申请人 湖北光谷天下传媒股份有限公司 发明人 蒋大可;何俊;莫燕峰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 武汉天力专利事务所 42208 代理人 冯卫平
主权项 一种多媒体热点分析方法,包括一个数据库,收集到的每个稿件都会附加一个消息头,根据该消息头将稿件进行分类,并以16进制的形式将稿件分门别类的存入该数据库中,其特征在于包括以下步骤:1.1.通过消息头,按不同类型随机从数据库中抽出文件,形成文本文档群;1.2.将16进制的文本文档群,随机分散到二维网络空间中,来对其实行并发扫描;1.3.每次并发扫描,都将计算每次扫描过的文档与其他的文档相似的程度,来判断是否纳入热点范围;1.4.如果其中的线程扫描文档为空时,会随机的去扫描其中一个与相邻的相似度较低的文档,如果其线程处于闲置状态时,并且其处理的文档与附近的线程的处理文档相似度较高,该线程会放下其处理的文档;1.5.通过循环操作步骤1.3、1.4,相似或者相关的文档,将通过不断的群体相似度被聚集在同一个区域,一次筛选完成;1.6.初始化连接权值w,学习率a,邻域半径Nbo,将需要扫描的文本文档设定一个范围,连接权值w代表每个线程;1.7.对所有范围内的文本取样;1.8.将文档分词,并构建向量空间模型,将文档表示成可计算的矩阵;1.9.将取样的文本文档进行分词区别分类,分别分入到构建的向量空间模型中;1.10.将每个向量空间模型中的文本文档,通过欧氏距离来比较,计算连接权向量与输入文档之间的距离,值最小的神经元便是获胜神经元;1.11.更新获胜神经元及其邻域内所有神经元的连接权值,而邻域外的神经元的连接权值保持不变;1.12.调整学习率a和邻域半径Nbo,为了保证算法的收敛,学习率的取值一般在0到1之间,且随着学习代数的增加而递减;邻域半径也随着学习代数的增加而递减,最后只有获胜结点在学习;1.13.重复步骤1.7~1.12,直至算法收敛或达到最大迭代次数为止,以得到热点数据;1.14.通过得出的热点数据,与其他媒体的版面进行对比,比较其重复度,重复度最高的便是最终的热点数据;1.15.通过得出的最终热点数据,将其排序,并分色显示,通过每个消息头中的不同ip数据,生成信息地图,将已经分好色的热点,显示在地图上,让用户清楚、明朗的了解到现今的热点。
地址 430077 湖北省武汉市东湖新技术开发区楚天文化创意产业大厦三楼