发明名称 |
一种实体词挖掘方法、信息推荐方法及装置 |
摘要 |
本发明涉及数据挖掘领域,公开了一种实体词挖掘方法、信息推荐方法及装置,以解决现有技术中只能通过人工打标方式获得用户兴趣特征的技术问题。该方法包括:从特征词语料中获取出M个特征词,M为正整数;计算出所述M个特征词中每个特征词的稀缺度、每个特征词的各类间分布以及每个特征词的类内出现次数;基于所述稀缺度、所述各类间分布以及所述类内出现次数,将所述M个特征词中的N1个特征词确定为实体词,N1为正整数。达到了不需要通过人工打标方式就可以确定用户的兴趣特征的技术效果。 |
申请公布号 |
CN106294473A |
申请公布日期 |
2017.01.04 |
申请号 |
CN201510300415.5 |
申请日期 |
2015.06.03 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
商胜 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京华沛德权律师事务所 11302 |
代理人 |
马苗苗 |
主权项 |
一种实体词挖掘方法,其特征在于,包括:从特征词语料中获取出M个特征词,M为正整数;计算出所述M个特征词中每个特征词的稀缺度、每个特征词的各类间分布以及每个特征词的类内出现次数;基于所述稀缺度、所述各类间分布以及所述类内出现次数,将所述M个特征词中的N1个特征词确定为实体词,N1为正整数。 |
地址 |
100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |