主权项 |
一种微博数据管理系统,其特征在于包括:用户授权模块、数据抓取模块、社区结构挖掘模块、分组解析展现模块和反馈模块,其中:用户授权模块:采用Oauth协议进行授权,得到用户在微博上的用户名;数据抓取模块:根据用户在微博上的用户名,利用微博提供的API获取用户好友之间的相互关系数据以及用户资料信息的数据,具体是首先对用户的好友进行抓取;然后对每一个好友,抓取其与用户的共同好友信息,从而获得所有好友之间的相互关系,形成一个由好友关系组成的用户社交关系网络,最终获得的用户社交关系网络存储到数据库,并输出至社区结构挖掘模块供其调用;社区结构挖掘模块:对数据抓取模块获得的好友关系网络,依据社区检测技术,从好友之间的社交关系中,挖掘出其潜在的社区结构,作为用户好友分组的依据;所采用的社区检测技术由基本社区结构搜索和社区聚合两部分组成,经处理产生的用户好友分组输出至分组解析展现模块;分组解析展现模块:根据社区结构发现模块产生的用户好友分组,对其进行解析,根据用户好友分组的语义信息,将组别抽象为名人明星、朋友、同学、同事四大类,分组解析将社区结构挖掘模块产生的每一个用户好友分组,利用组内成员用户资料决定其分组的类别,作为分组解析结果,展现模块将社区结构挖掘模块和解析模块的结果展现给用户;反馈模块:对每一个用户好友分组,设置一个反馈,收集用户评价,使用 户对系统的效果做出打分评价,并收集用户反馈信息,将用户id、分组结果、用户反馈作为一条记录,存储至数据库,以便将来为系统改进、提高用户体验提供依据。 |