发明名称 表格知识探勘系统及方法以及电脑可读取储存媒体
摘要 一种表格知识探勘系统及方法,包含一特征资料库、一储存格特征处理模组以及一储存格分类模组。特征资料库储存储存格量化特征之权重。储存格特征处理模组输入包含第一储存格之第一表格,计算相应于第一储存格与储存格量化特征之第一数值。储存格分类模组,将相应于储存格与储存格量化特征之第一数值输入类神经分类模型,用以设定第一储存格之类型为属性栏位或资料值。
申请公布号 TWI268435 申请公布日期 2006.12.11
申请号 TW092127138 申请日期 2003.10.01
申请人 财团法人资讯工业策进会 发明人 周世俊;张履平;廖嘉新;喻瀚宽
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 代理人 洪澄文 台北市大安区信义路4段279号3楼;颜锦顺 台北市大安区信义路4段279号3楼
主权项 1.一种表格知识探勘系统,包括:一储存装置,用以包含一特征资料库,上述特征资料库储存相应于一储存格量化特征之一权重,上述储存格量化特征用以表示储存格之量化变数;一储存格特征处理模组,耦接于上述储存装置,用以输入一第一表格,上述第一表格包含一第一储存格,计算相应于上述第一储存格与上述储存格量化特征之一第一数値;以及一储存格分类模组,耦接于上述储存格特征处理模组,将相应于上述储存格与上述储存格量化特征之上述第一数値输入一类神经分类模型,用以设定上述第一储存格之类型为一属性栏位以及一资料値中之一者,上述类神经分类模型包含相应于上述储存格量化特征之上述权重。2.如申请专利范围第1项所述之表格知识探勘系统,其中上储存装置中,更包含一知识库以及一训练文件,上述用以储存符合一结构化表达方式之领域知识,上述训练文件包含一第二表格,上述第二表格包含一第二储存格以及相应于上述第二储存格之类型,上述第二储存格之类型为上述属性栏位以及上述资料値中之一者。3.如申请专利范围第2项所述之表格知识探勘系统,其中上述结构化表达方式为扩展标记语言(XML)或符合本体库要求之标准规格。4.如申请专利范围第2项所述之表格知识探勘系统,其中上述储存格特征处理模组,输入上述第二表格,计算相应于上述第二储存格与上述储存格量化特征之一第二数値。5.如申请专利范围第4项所述之表格知识探勘系统,其中更包括一类神经训练模组,依据上述第二储存格之类型以及相应于上述第二储存格与上述储存格量化特征之上述第二数値,计算相应于上述储存格量化特征之上述权重,据以得到上述类神经分类模型。6.如申请专利范围第2项所述之表格知识探勘系统,其中更包括一储存格修正模组,耦接于上述储存格分类模组,依据上述第一储存格之类型进行资料値以及属性栏位合并,得到包含上述第一储存格之一资料値区域以及一属性栏位区域,将存在于上述资料値区域中之上述第一储存格之类型设定为上述资料値,将存在于上述属性栏位区域中之上述第一储存格之类型设定为上述属性栏位。7.如申请专利范围第2项或第6项所述之表格知识探勘系统,其中更包括一知识建构模组,依据上述第一表格中之上述第一储存格之类型设定,建构出符合上述结构化表达方式之领域知识,并且储存于上述知识库。8.如申请专利范围第2项或第5项所述之表格知识探勘系统,其中更包括一回馈模组,用以将上述第一表格储存成上述训练文件。9.一种表格知识探勘系统,包括:一储存装置,用以包含一训练文件以及一特征资料库,上述训练文件包含一第一表格,上述第一表格包含一第一储存格以及相应于上述第一储存格之类型,上述第一储存格之类型为一属性栏位以及一资料値中之一者;一储存格特征处理模组,耦接于上述储存装置,用以输入上述第一表格,计算相应于上述第一储存格与一储存格量化特征之一第一数値,上述储存格量化特征用以表示储存格之量化变数;以及一类神经训练模组,耦接于上述储存格特征处理模组,依据上述第一储存格之类型以及相应于上述第一储存格与上述储存格量化特征之上述第一数値,计算相应于上述储存格量化特征之一权重,据以得到包含相应于上述储存格量化特征之上述权重之一类神经分类模型,将相应于上述储存格量化特征之上述权重储存至上述特征资料库。10.一种表格知识探勘方法,被一具有一中央处理器之电子装置执行,其方法包括下列步骤:输入一第一表格,上述第一表格包含一第一储存格;计算相应于上述第一储存格与一储存格量化特征之一第一数値,上述储存格量化特征用以表示储存格之量化变数;以及将相应于上述储存格与上述储存格量化特征之上述第一数値输入一类神经分类模型,用以设定上述第一储存格之类型为一属性栏位以及一资料値中之一者,上述类神经分类模型包含相应于上述储存格量化特征之上述权重。11.如申请专利范围第10项所述之表格知识探勘方法,更包括下列步骤:输入一第二表格,上述第二表格包含一第二储存格以及相应于上述第二储存格之类型,上述第二储存格之类型为上述属性栏位以及上述资料値中之一者;计算相应于上述第二储存格与上述储存格量化特征之一第二数値;以及依据上述第二储存格之类型以及相应于上述第二储存格与上述储存格量化特征之上述第二数値,计算相应于上述储存格量化特征之上述权重,据以得到包含相应于上述储存格量化特征之上述权重之上述类神经分类模型。12.如申请专利范围第10项所述之表格知识探勘方法,更包括下列步骤:依据上述第一储存格之类型进行资料値以及属性栏位合并,得到包含上述第一储存格之一资料値区域以及一属性栏位区域;将存在于上述资料値区域中之上述第一储存格之类型设定为上述资料値;以及将存在于上述属性栏位区域中之上述第一储存格之类型设定为上述属性栏位。13.如申请专利范围第10项所述之表格知识探勘方法,更包括一步骤,依据上述第一表格中之上述第一储存格之类型设定,建构出符合一结构化表达方式之领域知识。14.如申请专利范围第12项所述之表格知识探勘方法,更包括一步骤,依据上述第一表格中之上述第一储存格之类型设定,建构出符合一结构化表达方式之领域知识。15.如申请专利范围第10项所述之表格知识探勘方法,更包括一步骤,将上述第一表格储存成相应于上述第二表格之训练表格。16.如申请专利范围第11项所述之表格知识探勘方法,更包括一步骤,将上述第一表格储存成相应于上述第二表格之训练表格。17.一种表格知识探勘方法,被一具有一中央处理器之电子装置执行,其方法包括下列步骤:输入一第一表格,上述第一表格包含一第一储存格以及相应于上述第一储存格之类型,上述第一储存格之类型为一属性栏位以及一资料値中之一者;计算相应于上述第一储存格与一储存格量化特征之一第一数値,上述储存格量化特征用以表示储存格之量化变数;以及依据上述第一储存格之类型以及相应于上述第一储存格与上述储存格量化特征之上述第一数値,计算相应于上述储存格量化特征之一权重,据以得到包含相应于上述储存格量化特征之上述权重之一类神经分类模型。18.一种电脑可读取储存媒体,用以储存一电脑程式,该电脑程式用以载入至一电脑系统中并且使得该电脑系统执行如申请专利范围第10至16项中任一者所述之方法。19.一种电脑可读取储存媒体,用以储存一电脑程式,该电脑程式用以载入至一电脑系统中并且使得该电脑系统执行如申请专利范围第17项所述之方法。图式简单说明:第1a图系表示习知技术之二维表格范例资料示意图;第1b图系表示习知技术之三维表格范例资料示意图;第1c图系表示习知技术之复合表格范例资料示意图;第2图系表示依据本发明实施例之表格知识探勘系统之系统方块图;第3图系表示依据本发明实施例之倒传递学习类神经网路架构之示意图;第4图系表示依据本发明实施例储存格类型之范例资料示意图;第5图系表示依据本发明实施例之表格知识探勘方法之方法流程图;第6图系表示依据本发明实施例之表格知识探勘方法之电脑可读取储存媒体示意图。
地址 台北市大安区和平东路2段106号11楼