发明名称 一种文本集合相似性的可视化方法和装置
摘要 本发明公开了一种文本集合相似性的可视化方法及装置,属于文本信息处理和信息可视化领域;所述方法包括:对文本集合进行预处理;对文本集合的相似度进行计算;对文本集合的相似性进行可视化;所述装置包括:预处理模块、文本相似性计算模块和可视化模块。本发明通过建立文本集合相似度计算模型来对文本集合的相似性进行度量,并以图形化的方式显示相似性结果,达到使用户直观、快速地了解文本集合内容以及相似性信息的有益效果。
申请公布号 CN103077157A 申请公布日期 2013.05.01
申请号 CN201310022589.0 申请日期 2013.01.22
申请人 清华大学 发明人 唐家渝;孙茂松;刘知远
分类号 G06F17/21(2006.01)I 主分类号 G06F17/21(2006.01)I
代理机构 西安智大知识产权代理事务所 61215 代理人 贾玉健
主权项 一种文本集合相似性的可视化方法,其特征在于,所述方法包括: 对文本集合进行预处理,以得到文本集合的特征词及特征词的权重; 对文本集合的相似度进行计算; 对文本集合的相似性进行可视化。
地址 100084 北京市海淀区100084信箱82分箱清华大学专利办公室