发明名称 汉语语音码全拼和混拼汉语全息信息处理方法
摘要 本发明是一种汉语语音码全拼和混拼汉语全息信息处理方法,属于计算机汉字汉语信息处理技术领域。它用且仅用26个拉丁字母以词为单位对汉语信息进行全息处理,能够与ASCCII码100%兼容。本发明能广泛应用于汉语信息处理、图书出版、汉语教学、农村地区扫盲、对外汉语教学、汉语语音合成和识别、各种格式的计算机文件和网页汉语信息显示、信息搜索、汉语编程,具有汉语含义的各种用于登陆互联网站点的网络域名的标识、商标的标识等领域。本发明采用的汉语语音码可以直接用于表达汉语信息,特别是为不识或不惯汉字的人学、了解、掌握、表达汉语信息和汉语普通话提供了极大的便利。
申请公布号 CN102902660B 申请公布日期 2016.04.20
申请号 CN201110212394.3 申请日期 2011.07.26
申请人 青海汉拉信息科技股份有限公司 发明人 苗玉水
分类号 G06F17/22(2006.01)I;G06F3/023(2006.01)I 主分类号 G06F17/22(2006.01)I
代理机构 代理人
主权项 一种汉语语音码全拼和混拼汉语全息信息处理方法,该信息处理的方法是建立在使用世界通用的计算机或嵌入式计算机系统基础上的方法,该汉语全息信息处理方法所采用的汉语语音码有全拼和混拼两种拼写法,所述的混拼指的是连写的汉语语音的音节有的用汉语语音码全拼,有的用汉语语音码简拼,其特征主要包括以下步骤:<b>步骤</b><b>A</b><b>:</b>(一)汉语语音码简拼时所采用的汉语语音码的每一音节声、韵、调的编码方法采用以下的方法:注:括号内的符号均为汉语拼音符号,不带括号的字母为所采用的汉语每一音节声、韵、调的编码,将下列声、韵、调的对照编码表简称为码表(1).用于表示汉语信息的语音码的声母全部采用一个拉丁字母表示,包括采用如下的辅音拉丁字母表示声码的编码:b:(b)  p : (p)  m:(m)   f:(f)   d:(d)     t:(t)n:(n)  l:(l)    g:(g)   k:(k)   h:(h)  j: (zh),(j)      q:(ch),(q)     x:(sh),(x)   r:(r)z:(z)  c:(c)    s:(s)   y:(y)   w:(w)(2).用于表示汉语信息的语音码用26个字母中的一个拉丁字母来表示介母,包括用y来表示原来汉语拼音单韵母和介母中的(ü),其余单韵母和介母的编码采用与汉语拼音单韵母和介母相同的符号,包括采用如下介母的编码:i:(i)  u:(u)  y:(ü)(3).用于表示汉语信息的语音码除了部分带有介母的复合韵母外,其余的复合韵母的韵码在简拼时用一个拉丁字母来表示,包括用一个辅音字母表示,包括在汉语语音码简拼时采用如下的韵码的编码:a:(a)   o:(o)   e:(e)    i:(i)     u:(u)   y:(ü)z:(ao)  t:(ai)   c :(an)   s:(ou)   w:(ei)   n:(en)k:(ua)  l:(uo)  g:(ang)  d:(ong) b:(eng) q:(ing)p:(ng)er:(er)r:(i)  [ 只与(zh)、(ch)、(sh)相拼](4).用于表示汉语信息的语音码其调码用五个拉丁字母表示,包括采用如下四个拉丁字母和一个汉语不用的字母v表示调码的编码:a : (-)阴平  e:(/)阳平   v:(∨)上声   u:(/)去声   o:(不标)轻声<b>(二)</b>利用上述编码的汉语信息全息表示采用如下的方法:以单词为单位,这里将单个汉字看作单音节词,根据组成该单词的每个音节的《汉语拼音方案》中的拼音,在汉语语音码全拼时除了ü的表示采用一个拉丁字母包括y表示外,声母表示和介母表示以及韵母表示均与汉语拼音方案相同,与汉语拼音方案所不同的是调码采用一个拉丁字母表示,且该调码兼隔音节符号,即汉语语音码每一个音节依次按 “汉语拼音相同的声母+汉语拼音相同的介母+汉语拼音相同的韵母+调码兼隔音节符号”的顺序编码,在汉语语音码简拼时依次按“声码+介码+韵码+调码兼隔音节符号”的顺序编码,无论是全拼和简拼,同一个单词的多个音节不用空格隔开连写,单词与单词之间的编码用空格隔开,组成单词时,单词的每一个音节既可以全部用全拼或简拼音节组成,也可以将组成词的任意一个音节根据需要采用全拼或简拼混合搭配组成,也即在组成单词的多个音节中有的音节可以是简拼,有的音节可以是全拼,将汉语语音码全拼和混拼统称为汉语语音码或语音码;当汉语信息处于全拼或混拼语音码状态时,其标点符号的用法同英文的标点符号的用法相同;<b>步骤</b><b>B</b><b>:</b>根据需要汉字、汉语拼音、汉语语音码全拼、汉语语音码简拼及混拼相互之间可以通过汉字汉语拼音与汉语语音码双向转换模块实现双向转换;汉语语音码全拼、汉语语音码混拼均可以通过相应的模块或方法来进行语音识别、语音合成、汉语智能分词、机器翻译、信息搜索、各种计算机文件格式和网页信息表示及显示、与各种网络合法域名前后缀组成网络域名用于登陆相应网站、汉字汉语编程、商标与域名统一标识的信息处理;汉语语音码全拼、汉语语音码混拼组成的汉语全息信息可以用一切处理西文的软硬件资源来进行信息处理,包括能够用能够识别西文的书写笔书写输入、OCR西文光学扫描输入、标准西文键盘键入、西文字母语音识别输入;汉语语音码全拼或混拼或者单独或者与汉字、汉语拼音、外文、少数民族文字进行对照印刷、打印、储存、显示、通讯、信息传输。
地址 810008 青海省西宁市青海生物科技产业园区经四路26号孵化楼510室