发明名称 一种小键盘上西语输入中的歧义处理与人机交互方法
摘要 本发明涉及一种小键盘上西语输入中的歧义处理与人机交互方法,将字母按多对一的关系映射到数据键上,将单词按映射关系转化为数据串,从语料中统计出歧义单词与前面和/或后面单词的高频搭配的单词组合,并统计出歧义单词与前一个单词中两个特定字母的耦合搭配频率;处理器接受到数据串序列输入后,按从前到后、最长匹配、字母耦合、高频优先的原则将其转化为对应的单词序列作为首选候选;四个方向键被分别设定成数字输入状态、字典以外单词自定义状态、歧义单词挑选状态、歧义单词跳转状态的状态进入键;小键盘上没有对应字母的数据键与方向键一起构成复合扩展键组,通过这些复合扩展键组进入拷贝粘贴状态、表情符号、符号与特定短语操作状态。
申请公布号 CN100416471C 申请公布日期 2008.09.03
申请号 CN200510051349.9 申请日期 2005.03.08
申请人 张一昉;马贤亮;陈波 发明人 张一昉;马贤亮;陈波;柯文
分类号 G06F3/023(2006.01);H04M1/23(2006.01) 主分类号 G06F3/023(2006.01)
代理机构 中科专利商标代理有限责任公司 代理人 宋焰琴
主权项 1. 一种小键盘上西语输入中的歧义处理与人机交互方法,在这种小键盘上,特定语言字母表中的字母按多对一的关系被映射到数据键上,其特征在于,该方法包含有以下步骤:(a)将特定语言字典中的单词按字母映射关系转化为数据串,如果多个单词对应同一个数据串,则定义这样的单词为歧义单词;(b)针对(a)中的歧义单词,从语料中统计出包含该单词的连续三个单词的组合搭配频率,将其组合搭配频率高的定义为三单词组合,将该组合和其频率保存在存储器中;(c)针对(a)中的歧义单词,从语料中统计出该单词与前面一个单词的组合搭配频率,将其组合搭配频率高的定义为二单词组合,将该组合和其频率保存在存储器中;(d)针对(a)中的歧义单词,从语料中统计出该单词与后面一个单词的组合搭配频率,将其组合搭配频率高的定义为二单词组合,将该组合和其频率保存在存储器中;(e)处理器接受代表一个或多个目标单词的数据串序列输入,其中的数据串依次表示为U1、U2、U3、U4、U5、U6...Un,一个数据串可能对应着一个或多个特定语言字典中的单词,处理器依据存储器中的单词组合信息,按照如下流程从该数据串序列中查找出三单词组合和二单词组合并进行替换:(1)从i为1开始,如果UiUi+1Ui+2在存储器中对应着至少一个三单词组合,找出最高频的三单词组合并替换,且i变成i+3,再次从(1)开始下一个循环;否则(2)如果UiUi+1Ui+2中只有UiUi+1在存储器中对应着至少一个二单词组合,找出最高频的二单词组合并替换,且i变成i+2,再次从(1)开始下一个循环;否则(3)如果UiUi+1Ui+2中UiUi+1在存储器中不对应任何一个二单词组合,则将Ui定义为非组合数据串,且i变成i+1,再次从(1)开始下一个循环;(f)针对(e)中的数据串序列U1、U2、U3、U4、U5、U6...Un,经过(e)中单词组合查找替换,去除其中对应三单词组合和/或二单词组合的数据串后,则剩余的数据串全部为单个的非组合数据串,如果该数据串只对应着特定语言字典中的一个单词,则将该数据串替换为对应的单词;(g)针对(e)中的数据串序列U1、U2、U3、U4、U5、U6...Un,经过(e)(f)两步处理,则剩余的非组合数据串全部对应着歧义单词,按从前到后的方式,用多个歧义单词中的某个单词来替换该数据串;(h)处理器根据(e)(f)(g)三步的替换,将替换结果作为首选候选输出到显示设备上,待用户确认后完成输入;
地址 100089北京市海淀区北洼路4号华澳公寓2号楼9G