发明名称 一种基于特征权重分析技术的文件检索方法
摘要 本发明涉及一种基于特征权重分析技术的文件检索方法,与现有技术相比解决了无法在特定领域进行有效检索的缺陷。本发明包括以下步骤:裁判文书的组织,将裁判文书按照案由分层分类组织;构造案件特征树,对于指定案由,筛选其公有特征和私有特征,并按特征间逻辑关系组织成树形结构;对案件特征树进行权重训练,采用决策树方法针对不同目标进行训练,计算出案件特征的综合权重;检索信息的获取,输入检索信息的过滤条件和查询条件,输入方式为条件选择、包含条件的文字或整篇裁判文书;计算案件相似矩阵;输出检索结果。本发明以行业特性为指导来精心构造的案件特征树为基础,通过语义分析和知识推理,大幅提高检索准确率和覆盖率。
申请公布号 CN105930470A 申请公布日期 2016.09.07
申请号 CN201610259097.7 申请日期 2016.04.25
申请人 安徽富驰信息技术有限公司 发明人 张静川;周宇;贾真
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 合肥天明专利事务所 34115 代理人 张祥骞;奚华保
主权项 一种基于特征权重分析技术的文件检索方法,其特征在于,包括以下步骤:11)裁判文书的组织,将裁判文书按照案由分层分类组织;12)构造案件特征树,对于指定案由,筛选其公有特征和私有特征,并按特征间逻辑关系组织成树形结构;13)对案件特征树进行权重训练,采用决策树方法针对不同目标进行训练,计算出案件特征的综合权重;14)检索信息的获取,输入检索信息的过滤条件和查询条件,输入方式为条件选择、包含条件的文字或整篇裁判文书;15)计算案件相似矩阵,根据检索信息的过滤条件从特征树集合中筛选有效特征树;根据检索信息的查询条件,利用权重树,采用加权曼哈顿距离方法计算有效特征树集合中两两相似度,组成相似矩阵,并对结果进行归一化处理;16)输出检索结果,从案件相似矩阵中获取相似案件,找到与查询条件最相似的n个案件或相似度大于s的案件,对此信息进行统计,并进行可视化展示。
地址 230088 安徽省合肥市高新区黄山路599号时代数码19楼