发明名称 一种基于大数据的科技项目立项评估的方法
摘要 本发明提出了一种基于大数据的科技项目立项评估的方法,包括如下步骤:获取项目立项申请数据;对项目相关技术最新发展方向和热点处理后与立项申请数据比较得到第一结果;对国家政策扶持方向和地方产业发展方向信息处理后与立项申请数据比较得到第二结果;对主管部门实地产业考察反馈建议及综合实力信息处理后输出第三结果;对主管部门历年相似科技项目立项、历年已立项项目建设情况及成效处理后与立项申请数据比较得到第四结果;依据第一结果、第二结果、第三结果、第四结果及其权重得到立项申请评估及建议报告。实施本发明的基于大数据的科技项目立项评估的方法,具有以下有益效果:科技项目评估的质量和水平较高、评估结果更客观、更全面。
申请公布号 CN103455596B 申请公布日期 2016.11.02
申请号 CN201310393575.X 申请日期 2013.09.02
申请人 广东省科技基础条件平台中心 发明人 罗亮;卢智星;方少亮;徐迪威;蔡建新;林珠
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 代理人 黄冠华
主权项 一种基于大数据的科技项目立项评估的方法,其特征在于,包括如下步骤:A)获取科技项目立项申请数据;B)获取科技项目相关技术的最新发展方向和热点信息,并对其进行处理得到当前研究热点数据,将所述当前研究热点数据与科技项目立项申请数据的相应部分进行比较得到第一结果;C)获取国家政策扶持方向和地方政府产业发展方向信息,对其处理后得到扶持方向数据,将所述扶持方向数据与科技项目立项申请数据的相应部分进行比较得到第二结果;D)获取主管部门实地产业考察反馈建议信息和项目申请单位的综合实力信息,并进行处理后输出以数据形式体现的第三结果;E)获取主管部门历年相似科技项目立项情况、历年已立项项目建设情况及成效,并对其处理后得到一个向量空间集,将所述向量空间集与所述科技项目立项申请数据的相应部分进行比较得到第四结果;F)确定所述第一结果、第二结果、第三结果和第四结果的权重,并依据所述第一结果、第二结果、第三结果、第四结果及各自的权重得到科技项目立项申请的评估及立项建议报告;所述步骤A)进一步包括:A1)获取关于科技项目立项申请的第一文本;A2)对所述第一文本进行处理得到用于表示立项申请项目的第一向量空间;所述科技项目立项申请数据为所述第一向量空间;所述步骤B)进一步包括:B1)获取科技项目相关技术的最新发展方向和热点信息并形成一系列文本记录;B2)对每项文本记录依次进行中文分词、滤除停用词后提取文本特征;B3)对所述文本特征进行聚类,并提取表示当前研究热点的第一向量;B4)将所述第一向量与所述第一向量空间进行比较,得到用于表示科技项目立项申请与当前技术热点相关度的第一结果;所述步骤C)进一步包括:C1)获取关于国家政策扶持方向和地方政府产业发展方向的第二文本;C2)对所述第二文本依次进行中文分词、滤除停用词后得到第三文本;C3)通过对所述第三文本计算词频来获取当前扶持方向关键词;C4)对各关键词的权重进行平均分配并构建第二向量空间;C5)将所述第二向量空间与所述第一向量空间进行比较,得到表示所述科技项目立项申请与扶持方向吻合度的第二结果;所述步骤D)进一步包括:D1)获取关于科技资源调查系统中项目申请单位的综合实力信息、申请单位历年项目建设情况和主管部门实地产业考察反馈建议信息的一系列文本记录,并形成第四文本;所述综合实力信息包括人力、财力、物力和基地信息;D2)从所述第四文本中提取绩效信息;D3)依据所述绩效信息对所述申请单位进行信誉评分;D4)对所述信誉评分进行归一化处理得到数据型的第三结果;所述步骤E)进一步包括:E1)获取关于主管部门历年相似科技项目立项情况、历年已立项项目建设情况及成效的文档数据源C={C1,C2……Ci…};E2)从文档数据源C={C1,C2……Ci…}中读取一个文本Ci;E3)初始化所述文本Ci的词频词序原型向量Vi;E4)对所述文本Ci进行中文分词,并将所述文本Ci分词后得到的分词滤除停用词,得到第一分词向量空间Ti=(Ti1,Ti2,……,Tin);E5)计算所述第一分词向量空间Ti=(Ti1,Ti2,……,Tin)中向量元素Tij的词频,得到对应所述文本Ci中的词频权重Fij,得到第一词频加权向量空间Fi=(Fi1,Fi2,……,Fin);E6)对所述词频加权向量空间Fi进行降维,得到第二词频加权向量空间Fi’=(Fi1,Fi2,……,Fik)和第二分词向量空间Ti’=(Ti1,Ti2,……,Tik);E7)计算第二分词向量空间Ti’中的向量元素的词序,得到词序权重Sij(j=1,2,…,k),并得到词序加权向量空间Si=(Si1,Si2,……,Sik);E8)构建文本的词频词序向量Vi=(Ti’,Fi’,Si);E9)判断所述文档数据源C中的文本是否已读完,如是,执行步骤E10);否则,返回步骤E2)读取下一个文本;E10)生成对应于所述文档数据源C={C1,C2……Ci…}中文本的词频词序向量空间V={V1,V2……Vi};E11)将所述词频词序向量空间V={V1,V2……Vi}与所述第一向量空间进行比较,得到表示所述科技项目立项申请与历年项目之间相似度的第四结果。
地址 510033 广东省广州市连新路171号