发明名称 | 基于文本片断的计算机汉字知识库采集系统 | ||
摘要 | 本发明公开了一种基于文本片断的计算机汉字知识库采集系统,包括:文本片断数据库,保存文本片断记录,包括文本片断所在文本的位置以及文本片断在文本中的位置;讨论适配器,包括发送/接收单元,用于接收第三方系统的信息以及向第三方系统发送信息,以及格式转换单元,将讨论数据库中的内部格式与第三方系统的信息格式互相转换;讨论数据库,存储经过格式转换后的信息;知识数据库,用存储预先定义的连接词来定义文本片断之间的关系,以及该关系特有的属性。本发明把计算机汉字信息产生时附带的知识予以保存,大大节省了日后检索知识库所耗费的时间,能明显提高企事业单位对专业知识的使用,从而节省产品研发、客户服务和决策等的成本。 | ||
申请公布号 | CN101286148A | 申请公布日期 | 2008.10.15 |
申请号 | CN200710039412.6 | 申请日期 | 2007.04.12 |
申请人 | 上海思阔雅软件有限公司 | 发明人 | 朱胜 |
分类号 | G06F17/30(2006.01) | 主分类号 | G06F17/30(2006.01) |
代理机构 | 上海东创专利代理事务所 | 代理人 | 陈希 |
主权项 | 1、 一种基于文本片断的计算机汉字知识库采集系统,其特征在于,该系统包括:文本片断数据库,保存至少一个文本片断记录,所述文本片断记录包括文本片断所在文本的位置以及文本片断在文本中的位置;讨论适配器,包括一个发送/接收单元,用于接收第三方系统的信息以及向第三方系统发送信息,以及一个格式转换单元,将讨论数据库中的内部格式与第三方系统的信息格式互相转换;讨论数据库,存储经过格式转换单元转换格式后的信息;知识数据库,用存储预先定义的连接词来定义文本片断之间的关系,以及该关系特有的属性。 | ||
地址 | 201203上海市民生路1403号905室 |