发明名称 一种基于内容的计算移动应用相似性的方法
摘要 本发明涉及一种基于内容的计算移动应用相似性的方法。包括如下步骤:在获取大量移动应用信息后,进行移动应用信息的提取,包括应用名称、应用类型、应用描述和应用大小等;将应用描述信息进行分词;将分词完毕后的内容分为两份,一份整合后作为word2vec的模型的训练语料,另一份存成文档集的形式并进行TF-IDF的计算,然后将结果存入HBase数据仓库;进行app相似性查询及计算。实施本发明的一种基于内容的计算移动应用相似性的方法,具有以下有益效果:可以快速的响应app的相似性查询,基于内容的app特征及描述信息能够很好地代指app,准确率高,可提高app的搜索及推荐的准确率。
申请公布号 CN105677695A 申请公布日期 2016.06.15
申请号 CN201510776878.9 申请日期 2015.11.13
申请人 杭州圆橙科技有限公司 发明人 吴明晖;刘泽民;金苍宏;应晶
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人 张宇娟
主权项 一种基于内容的计算移动应用相似性的方法,其特征在于,包括如下步骤:S10.爬取大量app数据并进行数据的特征整理,将整理好的特征保存到数据库中,建立一个特征库以供查询;S20.根据待查询app的特征信息,在所述特征库中进行查询及计算,找出待查询app的相似app;所述待查询app的特征信息由用户提供或从所述特征库中查询得到。
地址 310016 浙江省杭州市上城区海潮路53号274室