发明名称 |
一种聚类的方法、装置和系统 |
摘要 |
本发明实施例公开了一种获取聚类信息的方法,包括:获取媒体文件部分正文内容;根据所述媒体文件的所述部分正文内容,计算所述媒体文件的聚类信息。还公开了一种获取聚类信息的装置和系统,利用本发明的实施例,能够根据关键词,搜索出没有描述信息的资源。 |
申请公布号 |
CN101246504B |
申请公布日期 |
2011.05.18 |
申请号 |
CN200810103097.3 |
申请日期 |
2008.03.31 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
王志刚;贾玉龙 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
蒋贤起;逯长明 |
主权项 |
一种获取聚类信息的方法,其特征在于,包括:获取媒体文件的二进制正文内容中预置位置处预置长度的部分二进制正文内容;通过以下方式获取所述媒体文件的二进制正文内容长度:计算所述媒体文件的描述信息的占用长度;计算所述媒体文件的占用长度;将所述媒体文件的占周长度减去所述描述信息的占用长度,将相减结果作为所述媒体文件的二进制正文内容长度;根据所述媒体文件的二进制正文内容长度以及所述部分二进制正文内容,计算所述媒体文件的聚类信息。 |
地址 |
100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |