发明名称 |
一种标签云生成方法及装置 |
摘要 |
本申请提供一种标签云生成方法及装置,通过接收携带文本集信息的标签云生成请求,针对与文本集信息对应的文本集中的每篇文章中的各个标签,计算该标签在其所属文章中的权重值生成文章-标签矩阵,并通过对文章-标签矩阵进行奇异值分解,生成指示特征向量在文本集中的权重的第一矩阵及指示标签在特征向量中的权重的第二矩阵,进而利用第一矩阵、第二矩阵及预先设置的生成规则实现标签云的生成,本申请通过对文章-标签矩阵进行奇异值分解,进而利用分解后的矩阵生成标签云,避免了现有技术生成的标签云作为文章集合重点内容的索引时,每个标签元素所指示的语义范围过于宽泛、体现文章集合的重点内容不够精准的问题。 |
申请公布号 |
CN104281690A |
申请公布日期 |
2015.01.14 |
申请号 |
CN201410534723.X |
申请日期 |
2014.10.11 |
申请人 |
时之我代信息科技(上海)有限公司 |
发明人 |
强思维;李庭赟;王望 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
王宝筠 |
主权项 |
一种标签云生成方法,其特征在于,包括:接收标签云生成请求,其中携带文本集信息;针对与所述文本集信息对应的文本集中的每篇文章中的各个标签,计算该标签在其所属文章中的权重值;利用与所述文本集信息对应的各篇文章、每篇文章中的标签及所述标签的权重值,生成文章‑标签矩阵;对所述文章‑标签矩阵进行奇异值分解,生成指示特征向量在所述文本集中的权重的第一矩阵及指示标签在所述特征向量中的权重的第二矩阵;利用所述第一矩阵、第二矩阵及预先设置的生成规则,生成标签云。 |
地址 |
200002 上海市黄浦区延安东路222号外滩中心1830室 |