发明名称 快速字词识别方法
摘要 本发明提供一种快速字词识别的方法,尤其是用于西班牙衍生字的识别。本发明主要的特征在于提供一种快速识别衍生字,使得西班牙电子字典能在不增加记忆体负担的情况下储存所有西班牙词汇(根词和衍生字)的方法。所有从根词到衍生字的转换规则均被收录、分类并反转,以给出还原规则。这些还原规则经过排序和编码,收录于一个搜寻用的查询表格。本发明也提供一种适用于该查询表格的快速搜寻方法。
申请公布号 TW388826 申请公布日期 2000.05.01
申请号 TW087121364 申请日期 1998.12.21
申请人 英业达股份有限公司 发明人 何代水;纪金东
分类号 G06F17/27 主分类号 G06F17/27
代理机构 代理人 蔡坤财 台北巿松江路一四八号十二楼
主权项 1.一种衍生字识别的方法,该方法至少包含:建立词汇资料库;产生第一表格,该第一表格包含复数个衍生字后词缀,而该衍生字后词缀皆与数个代换的根词后词缀相关连;产生第二表格,该第二表格包含复数个衍生字中词缀,而该衍生字中词缀皆与数个代换的根词中词缀相关连;输入查询字词;从该查询字词中撷取与该第一表格相匹配,且具有最多字母之该衍生字后词缀;选取与该撷取之衍生字后词缀相关连的复数个代换后词缀;将该撷取之衍生字后词缀,置换成该复数个代换后词缀,以产生第一组字词;从该查询字词中,撷取与该第二表格相匹配,且具有最多字母之衍生字中词缀;选取与该撷取之衍生字中词缀相关连的数个代换中词缀;将该撷取之衍生字中词缀,置换成该复数个代换中词缀,以产生第二组字词;结合该第一组字词和该第二组字词,以产生一复数个候选字词并从中产生根词;及输出该根词。2.如申请专利范围第1项所述之方法,其中上述之词汇资料库至少包含西班牙根词。3.如申请专利范围第1项所述之方法,其中上述之第一表格依照该衍生字后词缀之字母顺序排序。4.如申请专利范围第3项所述之方法,其中上述之排序的衍生字后词缀更分成复数个群组,并依照该群组的分类加以编码。5.如申请专利范围第1项所述之方法,其中上述之第二表格依照该衍生字中词缀之字母顺序排序。6.如申请专利范围第5项所述之方法,其中上述之排序的衍生字中词缀更分成复数个群组,并依照该群组的分类加以编码。7.如申请专利范围第1项所述之方法,其中上述第一表格中之该衍生字后词缀字母顺序被反转,而且该衍生字后词缀撷取时,其字母顺序也被反转。8.如申请专利范围第1项所述之方法,其中该撷取之衍生字后词缀之获得,乃是在该第一表格中对所有衍生字后词缀进行查找之后,保留找到并具有最多字母者。9.如申请专利范围第1项所述之方法,其中该撷取之衍生字中词缀之获得,乃是在该第二表格中对所有衍生字中词缀进行查找之后,保留找到并具有最多字母者。10.一种衍生字识别的方法,该方法至少包含:建立词汇资料库;产生第一表格,该第一表格包含复数个衍生字后词缀,而该衍生字后词缀皆与数个代换的根词后词缀相关连;产生第二表格,该第二表格包含复数个衍生字中词缀,而该衍生字中词缀皆与数个代换的根词中词缀相关连;输入查询字词;从该查询字词中撷取与该第二表格匹配,且具有最多字母之衍生字中词缀;选取与该撷取之衍生字中词缀相关连的数个代换中词缀;将该撷取之衍生字中词缀,置换成该复数个代换中词缀,以产生第一组字词;从该查询字词中,撷取与该第一表格相匹配,且具有最多字母之衍生字后词缀;选取与该撷取之衍生字后词缀相关连的复数个代换后词缀;将该撷取之衍生字后词缀,置换成该复数个代换后词缀,以产生第二组字词;结合该第一组字词和该第二组字词,以产生一复数个候选字词并从其中产生根词;及输出该根词。11.如申请专利范围第10项所述之方法,其中上述之词汇资料库至少包含西班牙根词。12.如申请专利范围第10项所述之方法,其中上述之第一表格依照该衍生字后词缀之字母顺序排序。13.如申请专利范围第12项所述之方法,其中上述之排序的衍生字后词缀更分成复数个群组,并依照该群组的分类加以编码。14.如申请专利范围第10项所述之方法,其中上述之第二表格依照该衍生字中词缀之字母顺序排序。15.如申请专利范围第14项所述之方法,其中上述之排序的衍生字中词缀更分成复数个群组,并依照该群组的分类加以编码。16.如申请专利范围第1项所述之方法,其中上述第一表格中之该衍生字后词缀字母顺序被反转,而且该共有的衍生字后词缀撷取时,其字母顺序也被反转。17.如申请专利范围第1项所述之方法,其中该撷取之共有的衍生字后词缀之获得,乃是在该第一表格中对所有衍生字后词缀进行查找之后,保留找到并具有最多字母者。18.如申请专利范围第1项所述之方法,其中该撷取之衍生字中词缀之获得,乃是在该第二表格中对所有衍生字中词缀进行查找之后,保留找到并具有最多字母者。图式简单说明:第一图 为本发明中形成一个具有将西班牙衍生字还原成根词的规则查询表之程序图。第二图 为本发明中西班牙电子字典典型字词搜寻程序之流程图。第三图 为描述本发明中如何识别衍生字之子程式功能方块图。第四图A 为搜寻查询字词之后词缀还原规则的子程式流程图。第四图B 为搜寻查询字词之中词缀还原规则的子程式流程图。第四图C 为从候选字中确认可能之根词的子程式流程图。第五图A、第五图B、第五图C和第五图D为从本产品-牛津电子字典-中撷取之萤幕,显示以'quiero'为例从输入、搜寻到输出的过程。
地址 台北巿士林区后港街六十六号
您可能感兴趣的专利