发明名称 |
词典数据更新方法及系统、储存媒体及计算机程序产品 |
摘要 |
本发明提供一种词典数据更新方法,包括以下步骤:联机数据来源网址;开启数据来源网页并取得来源网页原始码;根据来源网页过滤规则过滤来源网页原始码的内容,以留存一组关键词及一组关键词释义网址;根据来源网页数据提取规则获取关键词及关键词释义网址;连向特定关键词对应的特定关键词释义网址,以开启释义网页并取得释义网页原始码;根据释义网页过滤规则过滤释义网页原始码的内容,以留存关键词释义数据;根据释义网页数据提取规则获取关键词释义数据;以及将特定关键词及对应的关键词释义数据储存至词典数据库。 |
申请公布号 |
CN102508847A |
申请公布日期 |
2012.06.20 |
申请号 |
CN201110289411.3 |
申请日期 |
2011.09.27 |
申请人 |
无敌科技(西安)有限公司 |
发明人 |
陈淮琰;席溪 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
西安智邦专利商标代理有限公司 61211 |
代理人 |
商宇科 |
主权项 |
一种词典数据更新方法,用来通过网络联机更新词典数据库的数据,其特征在于:该方法包含下列步骤:1)从数据来源网页取得来源网页原始码;2)根据来源网页过滤规则过滤来源网页原始码的内容,以留存关键词及关键词释义网址,其中关键词对应于关键词释义网址;3)根据来源网页数据提取规则获取关键词及关键词释义网址;4)根据关键词及关键词释义网址,从关键词释义网页取得释义网页原始码;5)根据释义网页过滤规则过滤释义网页原始码的内容,以留存关键词释义数据;6)利用处理器,根据释义网页数据提取规则获取关键词释义数据;7)根据关键词释义数据,更新词典数据库。 |
地址 |
710075 陕西省西安市高新开发区光德路2号楼2楼 |