发明名称 |
一种获取领域重要知识点的方法和系统 |
摘要 |
本发明提供一种获取领域重要知识点的方法,首先确定领域内的候选知识点,然后计算这些候选知识点的语义向量,根据每个知识点的语义向量计算得到语义相似度矩阵,根据该语义相似度矩阵来计算候选知识点中的重要知识点,这些知识点便是该领域内的重要知识点。当建设或检查领域百科全书时,可以根据这些重要知识点来建立词条,或者检查词条是否完善,将还没有收录的重要知识点增加在需要建设的词条中,通过这种方式来完成领域百科全书的词条的检查和建设。大大降低了人工的工作量,节约了时间成本和人工成本,且避免了人工检查的主观性和标准不统一带来的不准确性,大大提高了效率和准确度。 |
申请公布号 |
CN105468657A |
申请公布日期 |
2016.04.06 |
申请号 |
CN201410497611.1 |
申请日期 |
2014.09.26 |
申请人 |
北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
发明人 |
叶茂;徐剑波;汤帜;张杰;成洪甲 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京三聚阳光知识产权代理有限公司 11250 |
代理人 |
张建纲 |
主权项 |
一种获取领域重要知识点的方法,其特征在于,包括:对领域文本进行分词,得到分词结果;根据分词结果和常用词,确定候选知识点;确定每个候选知识点的语义向量;计算候选知识点之间的语义相似度,得到相似度矩阵;利用所述相似度矩阵进行迭代,确定每个候选知识点的重要度信息;根据所述重要度信息确定重要知识点。 |
地址 |
100871 北京市海淀区成府路298号方正大厦9层 |