发明名称 汉语盲文到汉字的自动转换方法
摘要 本发明属于计算机文字处理技术领域,涉及汉语盲文到汉字的自动转换方法,将盲文书籍扫描后识别成为盲文文本,或用键盘输入盲文文本,将该盲文文本当作拼音流转换为汉字;所说的拼音与汉字转换的每一个环节,利用汉语盲文综合知识库,在带转移概率权重的拼音到汉字转换搜索图上采用viterbi搜索方法得到N个有序最佳结果,来实现由盲文到汉字的自动转换。使得系统整体转换正确率达到97%以上。
申请公布号 CN1119758C 申请公布日期 2003.08.27
申请号 CN01118674.7 申请日期 2001.06.08
申请人 清华大学 发明人 朱小燕;江铭虎;夏莹;马少平;姜哲;包塔;谭刚
分类号 G06F17/28;G09B21/00 主分类号 G06F17/28
代理机构 北京清亦华专利事务所 代理人 廖元秋
主权项 1、一种汉语盲文到汉字的自动转换方法,其特征在于,将盲文书籍扫描后识别成 为盲文文本,或用键盘输入盲文文本,将该盲文文本当作拼音流转换为汉字;具体包括 以下步骤: 1)读入未转换文本头部的全部连续非盲文点字符号; 2)当前的输入点字符号是否表示非汉字意义,若表示汉字,转步骤4);若表示非 汉字,在viterbi搜索图中搜索N-best路径并选择最好路径,得到转换结果,并将开始 读入的非盲文点字符号插入到对应位置; 3)记录本句的转换结果,记录表示非汉字意义的输入点字符号的转换结果,清空 viterbi搜索图,转入步骤5); 4)查找当前输入的点字符号能够匹配的所有汉字词候选,并在viterbi搜索图中构 造相应结点; 5)判断是否全部转换完毕,若是,输出转换后汉字结果;若不是,转步骤1)。 所说的拼音与汉字转换的每一个环节,利用汉语盲文综合知识库,在带转移概率权 重的拼音到汉字转换搜索图上采用viterbi搜索方法得到N个有序最佳结果,来实现由 盲文到汉字的自动转换;所说的汉语盲文综合知识库:包括电子字典、规则库和统计信 息库。
地址 100084北京市海淀区清华园
您可能感兴趣的专利