发明名称 |
一种古籍智能数字化文献库的建立方法 |
摘要 |
本发明提供一种古籍智能数字化文献库的建立方法,包括以下步骤:S1:应用自动分词技术,建立以词为单位的数字化古籍档案库;S2:应用计算智能技术,通过聚类方法对专有名词进行自动分类,所述计算智能技术包括进化算法、神经网络和模糊逻辑;S3:依次建立原始数据化文献库、关系索引文献库、逻辑学文献库三个层次的智能化数据库,在聚类方法中,当无法提前确定分类标准时,采用模糊逻辑和群体智能方法,摸索出合理的类别模板。建立基础知识库,包括人名、字、号等专有名词相关的数据库,从大量的数据样例中进行提取知识,利用模糊逻辑,决策树分类等数据挖掘方法来找出有用的人名、地名、事件等有用信息,以便实现全方位立体关系检索。 |
申请公布号 |
CN106503246A |
申请公布日期 |
2017.03.15 |
申请号 |
CN201610982510.2 |
申请日期 |
2016.11.09 |
申请人 |
天津赛因哲信息技术有限公司 |
发明人 |
杨存耿;谢术清;杨晓强 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种古籍智能数字化文献库的建立方法,其特征在于:包括以下步骤:S1:应用自动分词技术,建立以词为单位的数字化古籍档案库;S2:应用计算智能技术,通过聚类方法对专有名词进行自动分类;S3:依次建立原始数据化文献库、关系索引文献库、逻辑学习文献库三个层次的智能化数据库。 |
地址 |
300000 天津市滨海新区滨海高新区华苑产业区华天道3号综合楼A区516单元(入驻创新服务公司) |