一种多媒体热点分析方法,申请号CN201510094167.3-传众专利搜索

发明名称	一种多媒体热点分析方法
摘要	一种信息管理的方法，特别是一种多媒体热点分析方法，通过运用基于蚁群文档聚类算法以及SOM（自组织映射）聚类算法将集到的媒体信息，按照相似度进行自动聚类，以达到多媒体热点分析的目的。本发明的优点在于:运用该方法可以将搜集到的媒体信息，按照相似度进行自动聚类，并将达到关注次数的媒体信息设定为热点。
申请公布号	CN104715024A	申请公布日期	2015.06.17
申请号	CN201510094167.3	申请日期	2015.03.03
申请人	湖北光谷天下传媒股份有限公司	发明人	蒋大可;何俊;莫燕峰
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	武汉天力专利事务所 42208	代理人	冯卫平
主权项	一种多媒体热点分析方法，包括一个数据库，收集到的每个稿件都会附加一个消息头，根据该消息头将稿件进行分类，并以16进制的形式将稿件分门别类的存入该数据库中，其特征在于包括以下步骤:1.1.通过消息头，按不同类型随机从数据库中抽出文件，形成文本文档群；1.2.将16进制的文本文档群，随机分散到二维网络空间中，来对其实行并发扫描；1.3.每次并发扫描，都将计算每次扫描过的文档与其他的文档相似的程度，来判断是否纳入热点范围；1.4.如果其中的线程扫描文档为空时，会随机的去扫描其中一个与相邻的相似度较低的文档，如果其线程处于闲置状态时，并且其处理的文档与附近的线程的处理文档相似度较高，该线程会放下其处理的文档；1.5.通过循环操作步骤1.3、1.4，相似或者相关的文档，将通过不断的群体相似度被聚集在同一个区域，一次筛选完成；1.6.初始化连接权值w，学习率a，邻域半径Nbo,将需要扫描的文本文档设定一个范围，连接权值w代表每个线程；1.7.对所有范围内的文本取样；1.8.将文档分词，并构建向量空间模型，将文档表示成可计算的矩阵；1.9.将取样的文本文档进行分词区别分类，分别分入到构建的向量空间模型中；1.10.将每个向量空间模型中的文本文档，通过欧氏距离来比较，计算连接权向量与输入文档之间的距离，值最小的神经元便是获胜神经元；1.11.更新获胜神经元及其邻域内所有神经元的连接权值，而邻域外的神经元的连接权值保持不变；1.12.调整学习率a和邻域半径Nbo，为了保证算法的收敛，学习率的取值一般在0到1之间，且随着学习代数的增加而递减;邻域半径也随着学习代数的增加而递减，最后只有获胜结点在学习；1.13.重复步骤1.7～1.12，直至算法收敛或达到最大迭代次数为止，以得到热点数据；1.14.通过得出的热点数据,与其他媒体的版面进行对比，比较其重复度，重复度最高的便是最终的热点数据；1.15.通过得出的最终热点数据，将其排序，并分色显示，通过每个消息头中的不同ip数据，生成信息地图，将已经分好色的热点，显示在地图上，让用户清楚、明朗的了解到现今的热点。
地址	430077 湖北省武汉市东湖新技术开发区楚天文化创意产业大厦三楼