发明名称 解决CNS-11643与UCS去回转码错误之方法
摘要 一种解决CNS-11643与UCS(Universal Multiple-Octet Coded Character Set)去回转码错误(Round-trip Conversion Error)之方法,其系定义了一种逸出序列(Escape Sequence)的格式,用来在 ISO10646 UCS/Unicode的字串中表示尚未收录于ISO 10646 UCS/Unicode标准中的CNS 11643字元;当字串中含有任何尚未收录于ISO 10646 UCS/Unicode标准的CNS 11643字元(Character)时,利用此种逸出序列,可以在ISO 10646 UCS/Unicode字串或是UCS/Unicode转换格式(UCS/Unicode Transformation Format,简称 UTF)字串中,保留原来的CNS 11643字码,使得CNS 11643与 ISO10646 UCS/Unicode(及其延伸的各种UTF格式)之间可以进行双向转码,而不会产生去回转码错误。
申请公布号 TWI276308 申请公布日期 2007.03.11
申请号 TW093104521 申请日期 2004.02.24
申请人 中华电信股份有限公司 发明人 王文正;谢东明
分类号 H03M5/00(2006.01) 主分类号 H03M5/00(2006.01)
代理机构 代理人 江舟峰 台北市中山区长安东路2段81号6楼
主权项 1.一种将CNS 11643转换成UCS之方法,其步骤如下: 步骤一:从户役政资讯系统取得中文字; 步骤二:以CNS 11643码表示,其应用系统需记得中文 字来源的代号; 步骤三:由CNS 11643码转码成ISO 10646/Unicode UCS-4码,对 于ISO 10646/Unicode UCS-4码缺码的CNS字元则以逸出序 列表示; 步骤四:由ISO 10646/Unicode UCS-4码转码成ISO 10646/ Unicode UTF-8码。 2.如申请专利范围第1项所述之一种将CNS-11643转换 成UCS之方法,其中该任何形式的ISO 10646/Unicode UCS码 及UTF转换码所形成的字串中,使用形式为#<S:P1P2-X1X 2Y1Y2>的逸出序列来表示CNS 11643中文码资讯。 3.一种将UCS转换成CNS 11643之方法,其步骤如下: 步骤一:将ISO 10646/Unicode UTF-8码转码成ISO 10646/ Unicode UCS-4码; 步骤二:由ISO 10646/Unicode UCS-4码转换成CNS 11643码,对 于逸出序列则直接取其CNS码,且记住其系统代号; 步骤三:CNS 11643码转换成中文字,应用系统需记得 中文字来源的系统代号; 步骤四:户役政资讯系统取得中文字。 4.如申请专利范围第3项所述之一种将UCS转换成CNS- 11643之方法,其中该任何形式的ISO 10646/Unicode UCS码 及UTF转换码所形成的字串中,使用形式为#<S:P1P2-X1X 2Y1Y2>的逸出序列来表示CNS 11643中文码资讯。 图式简单说明: 图一为本发明解决CNS-11643与UCS去回转码错误之方 法之应用于CNS-11643码至ISO 10646/Unicode UCS-4再至UTF-8 码的流程及实例;以及 图二为本发明解决CNS-11643与UCS去回转码错误之方 法之应用于UTF-8码至ISO 10646/Unicode再至UCS-4CNS11643 码的流程及实例。
地址 桃园县杨梅镇民族路5段551巷12号