发明名称 数据分群装置和方法
摘要 发明提供一种数据分群装置和方法,该数据分群装置包括:一新闻数据库,用以存储多个数据;一计算模块,根据上述数据间的一距离关系,用以建立一整体侧影样式表,再根据上述整体侧影样式表,取得一初步分群参考数目;一分群模块,根据上述初步分群参考数目利用一分群演算法将多个数据分为多个群集,再计算每一上述群集的一群内平均距离,以及一比较模块,用以比较上述群内平均距离是否小于一门槛值,其中若上述群内平均距离小于上述门槛值,则将对应上述群内平均距离的上述群集存入一事件数据库中。本发明可将杂乱的新闻进行分群,以得到不同新闻的简易信息聚合来源但却是相似新闻事件的群集,因而达到提升新闻事件分群准确性的结果。
申请公布号 CN103631809A 申请公布日期 2014.03.12
申请号 CN201210305587.8 申请日期 2012.08.24
申请人 宏碁股份有限公司 发明人 庄惟尧
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 隆天国际知识产权代理有限公司 72003 代理人 张龙哺;刘晓飞
主权项 一种数据分群装置,包括:一新闻数据库,用以存储多个数据;一计算模块,根据上述数据间的一距离关系,用以建立一整体侧影样式表,再根据上述整体侧影样式表,取得一初步分群参考数目;一分群模块,根据上述初步分群参考数目利用一分群演算法将多个数据分为多个群集,再计算每一上述群集的一群内平均距离,以及一比较模块,用以比较上述群内平均距离是否小于一门槛值,其中若上述群内平均距离小于上述门槛值,则将对应上述群内平均距离的上述群集存入一事件数据库中。
地址 中国台湾台北县