发明名称 一种基于互联网的岗位职业能力需求的自动获取方法
摘要 本发明公开了一种基于互联网的岗位职业能力需求的自动获取方法,通过自动化的方式从招聘网站上获取招聘信息,并保存在本地资料库中,针对某一具体岗位抽取招聘信息,利用自然语言处理技术和数据挖掘技术,自动提取该岗位的职业能力需求。本方法和传统的方法相比具有以下优点:1.本方法是一个自动化的过程,时间快,效率高,成本低;2.获取的数据样本大,数据及时更新,分析结果具有代表性。
申请公布号 CN105512864A 申请公布日期 2016.04.20
申请号 CN201610057492.7 申请日期 2016.01.28
申请人 丁沂 发明人 丁沂;冯耀;梅晓
分类号 G06Q10/10(2012.01)I;G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06Q10/10(2012.01)I
代理机构 武汉河山金堂专利事务所(普通合伙) 42212 代理人 胡清堂
主权项 一种基于互联网的岗位职业能力需求的自动获取方法,其特征在于:该方法包括以下步骤:步骤1,利用爬虫技术爬取招聘网站上的招聘信息,并将招聘信息保存在数据库中;步骤2,从数据库中检索某一类职位的职位名称和岗位要求数据,并在返回的结果中检索某一具体岗位的职位名称和岗位要求数据,将两次检索的结果分别保存在职位文本文件和具体岗位文本文件中;步骤3,利用分词系统提供的接口分别对步骤2中所述的职位文本文件和具体岗位文本文件进行分词,构建两个文本的单词向量空间;步骤4,扫描两个文本文件中每条招聘信息,结合各自的单词向量空间,分别统计这些单词在每条信息中出现的次数从而构建“招聘信息‑单词”频次矩阵;分别统计具体岗位文本和职位文本所对应矩阵中各单词出现概率;步骤5,根据步骤4中得到的单词概率筛选具体岗位文本中的单词并组合形成该岗位所要求的职业技能。
地址 430205 湖北省武汉市东湖新技术开发区光谷大道117号