发明名称 基于微博的众包问答系统信息采集方法
摘要 本发明公开了一种基于微博的众包问答系统信息采集方法,该发明首先实现了与微博平台进行数据交互的数据采集和发布模块,通过该模块自动采集系统相关的所有问答数据和用户资料信息;对于采集到的问答数据进行后台分析处理,为用户提供更直观和专业的回答结果展示;另外,系统通过对用户资料信息和问答行为的具体分析,将各类新问题有效推送给可能回答的潜在用户,以对新问题进行高效、快速扩散;应用本发明的方法,可以通过微博平台实现问答系统更高效快速地获取答案。
申请公布号 CN103106267A 申请公布日期 2013.05.15
申请号 CN201310040557.3 申请日期 2013.02.02
申请人 浙江大学 发明人 胡天磊;伍赛;陈刚;周显锞;张冰冰;陈珂
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 周烽
主权项 一种基于微博的众包问答系统信息采集方法,其特征在于,包括如下步骤:步骤1:在微博平台上注册官方账号,在微博开放平台申请成为第三方网站开发账号,获取开发网站的App Key(应用码)和App Secret(应用密钥);步骤 2:通过微博开放平台提供的接口,开发数据采集和发布模块,向微博平台采集和发布数据,包括问答数据以及用户资料信息;步骤3:用户发起的任何问题只需要@到该官方账号,该问题原微博以及所有转发微博将通过数据采集和发布模块被系统采集收录;步骤4:对采集到的问答数据进行分析处理:该步骤可提取该问题的整体树状转发结构、提取相似答案、过滤纯转发答案,并对整个话题回答进行各类统计分析;步骤5:将步骤4提取的该问题的整体树状转发结构、提取相似答案和过滤纯转发答案,以及统计分析的结果,在前端界面为用户提供多元化的结果展示; 步骤6:利用全局采集到的用户问答记录和具体用户资料信息,分析每个用户在问答系统中的活跃程度、感兴趣领域以及擅长领域等信息;步骤 7:利用步骤6所得到的用户活跃程度、感兴趣和擅长领域等信息,系统自动将该新问题推送给可能感兴趣的潜在回答用户。
地址 310058 浙江省杭州市西湖区余杭塘路866号