发明名称 一种获取领域重要知识点的方法和系统
摘要 本发明提供一种获取领域重要知识点的方法,首先确定领域内的候选知识点,然后计算这些候选知识点的语义向量,根据每个知识点的语义向量计算得到语义相似度矩阵,根据该语义相似度矩阵来计算候选知识点中的重要知识点,这些知识点便是该领域内的重要知识点。当建设或检查领域百科全书时,可以根据这些重要知识点来建立词条,或者检查词条是否完善,将还没有收录的重要知识点增加在需要建设的词条中,通过这种方式来完成领域百科全书的词条的检查和建设。大大降低了人工的工作量,节约了时间成本和人工成本,且避免了人工检查的主观性和标准不统一带来的不准确性,大大提高了效率和准确度。
申请公布号 CN105468657A 申请公布日期 2016.04.06
申请号 CN201410497611.1 申请日期 2014.09.26
申请人 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 发明人 叶茂;徐剑波;汤帜;张杰;成洪甲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三聚阳光知识产权代理有限公司 11250 代理人 张建纲
主权项 一种获取领域重要知识点的方法,其特征在于,包括:对领域文本进行分词,得到分词结果;根据分词结果和常用词,确定候选知识点;确定每个候选知识点的语义向量;计算候选知识点之间的语义相似度,得到相似度矩阵;利用所述相似度矩阵进行迭代,确定每个候选知识点的重要度信息;根据所述重要度信息确定重要知识点。
地址 100871 北京市海淀区成府路298号方正大厦9层