发明名称 | 获取装置、获取方法、训练装置以及检测装置 | ||
摘要 | 本公开提供了获取装置、获取方法、训练装置以及检测装置。用于获得用户的属性信息的获取装置包括:第一信息获取单元,其基于用户的用户简档中的结构化信息获得用户的第一属性信息;以及第二信息获取单元,其基于用户发布的内容中的非结构化信息获得用户的第二属性信息,其中,第二信息获取单元被配置为在用户发布的内容中搜索与至少一个关键词相似的近似词,以获得用户的第二属性信息,其中,关键词是通过下述迭代过程获得的:在给定语料中搜索与预设触发词相似的近似词,作为新的触发词,再在给定语料中搜索与新的触发词相似的近似词,重复上述迭代过程,直到达到预设的迭代停止条件为止,并将所有得到的近似词连同预设触发词一起作为关键词。 | ||
申请公布号 | CN105989047A | 申请公布日期 | 2016.10.05 |
申请号 | CN201510060916.0 | 申请日期 | 2015.02.05 |
申请人 | 富士通株式会社 | 发明人 | 张姝;孟遥 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京集佳知识产权代理有限公司 11227 | 代理人 | 王萍;陈炜 |
主权项 | 一种用于获得用户的属性信息的获取装置,所述获取装置包括:第一信息获取单元,其基于用户的用户简档中的结构化信息获得所述用户的第一属性信息;以及第二信息获取单元,其基于所述用户发布的内容中的非结构化信息获得所述用户的第二属性信息,其中,所述第二信息获取单元被配置为在所述用户发布的内容中搜索与至少一个关键词相似的近似词,以获得所述用户的第二属性信息,其中,所述关键词是通过下述迭代过程获得的:在给定语料中搜索与预设触发词相似的近似词,作为新的触发词,再在给定语料中搜索与新的触发词相似的近似词,重复上述迭代过程,直到达到预设的迭代停止条件为止,并将所有得到的近似词连同预设触发词一起作为所述关键词。 | ||
地址 | 日本神奈川县 |