发明名称 HS编码计算机自动查询系统
摘要 本发明属国际贸易中进出口商品管理技术领域,具体涉及一种基于检验检疫和报关的商品和HS编码的自动查询系统。本发明基于《商品名称及编码的协调制度》中英文手册、各国口岸部门的货物监管政策手册、报检和报关的历史数据,通过数据库和数据仓库技术建立知识库,保存商品名及其属性的关键词及其与HS编码的关联关系。在此基础上,对输入的进出口货物商品名进行分词、提取词素、确定关键词,利用计算机软件实现匹配算法,计算所输入商品名和知识库中HS编码的关系,得出对应的HS编码。在该计算机系统的界面上输入商品名称,即可得到对应的HS编码,进出口信息系统可以利用该系统自动确定货物的HS编码,确定监管条件,避免人为因素的影响。
申请公布号 CN101064018A 申请公布日期 2007.10.31
申请号 CN200610030678.X 申请日期 2006.08.31
申请人 中华人民共和国上海国际机场出入境检验检疫局;复旦大学 发明人 马占鑫;李银胜;朱伟祖;曾玉成;忻源荣
分类号 G06Q10/00(2006.01);G06Q50/00(2006.01);G06F17/30(2006.01) 主分类号 G06Q10/00(2006.01)
代理机构 上海正旦专利代理有限公司 代理人 陆飞;盛志范
主权项 1、一种HS编码自动查询系统,其特征在于包括知识库、查询算法和计算机三个部分,其中:知识库包括商品的HS编码库、虚词库和单位库;其中:商品的HS编码库保存HS编码、商品名称关键词和属性关键词,虚词库保存商品名称中可能出现的无意义虚词;单位库保存商品名称中可能出现的单位,支持那些重量和浓度、包装、长度、体积等对编码有影响的商品编码查询;查询算法分为语素提取、语义识别、置信率计算三个部分:(1)语素提取,其步骤为:①提取组合型语素,是依据一系列标志词,对知识库中的商品名进行遍历完成;②提取数量型语素,是在对商品名的遍历中,依据数字和之后的单位信息进行的;③提取其他语素,这一阶段过滤掉虚词库中的语素,把剩下的商品名中的信息作为普通文本型语素组织好提取出来;经过上面三个步骤,把商品名组织成和知识库中HS库语义信息相应的语素形式。这时的商品名字符串信息被转换成两个列表,分别按照TA和UNA类型存储起来,分别叫做商品名TA集合和商品名UNA集合;(2)语义识别,是根据HS库中的知识分析前一阶段得到的语素,得到支持该系列语素的HS知识要素,并把这些HS知识要素从HS库中取出,组织成一种可供计算置信率的形式;具体分为两个步骤:识别潜在KN和组织HS知识:①识别潜在KN,通过KN层遍历唯一找到一个Code层实体,基于此确定一个潜在的HS编码,这个过程的实现是通过在知识库中的HS库的KN层遍历,并通过字符串的模式匹配算法找出所有潜在的KN,再把这些KN组织成一个列表保存起来;②组织HS知识,根据前一步骤得到的潜在KN列表,在HS库中提取出相关的HS知识要素,组织成置信率计算的形式,这里的每一条相关HS知识都包括Code,KN,UNA列表,TA列表四个部分,它们最终被最添加到前一步骤的KN列表中;(3)置信率计算,把从商品名中提取出的语素和从HS库中查找出的相关HS知识要素组织起来,在此基础上计算根据各个潜在KN得到的潜在Code的置信率,根据可靠性模型计算潜在Code的置信率的公式为:<img file="A2006100306780002C1.GIF" wi="1515" he="189" />式中,j是潜在Code的编号,Cj表示该KNj对应Code的置信率,S是语素,C(S)表示语素S的置信率,n表示在潜在KN列表中KNj的TA集合有n个语素;最后是把上述过程得到的知识库和查询算法,使用计算机软件实现,并且安装在计算机系统上,通过Windows界面、Web界面或者Web服务接口为进出口企业和口岸监管部门提供HS编码查询服务;上述系统中,商品名的语素分成三个级别:KN:商品名中关键词级语素;Attribute:商品名中属性级语素,它又包括TA和NUA两种语素;TA:商品名中文字型属性级语素,以字母组合形式存在的Attribute语素;NUA:商品名中数字单位型属性级语素,Accessory:商品名中的虚词。
地址 201202上海市浦东机场启航路888号
您可能感兴趣的专利