发明名称 提升文法校正率的装置与方法
摘要 本发明系一种提升文法校正率之装置与方法,主要系藉建立一具有文法搭配模式之辞典、一句法分析规则库、一检查规则库和一正确语法模式库,以在使用者输入欲校正之句子后,对该句子进行词法分析,并透过该辞典查出句子中文法搭配错误处,显示予使用者,嗣再透过该句法分析规则库进行句法分析,并经由分类之该检查规则库,检查出其他可能之语法错误,且予以标记,再经由分类之该正确语法模式库对标记之错误进行验证,以检查和校正句子中未被发现之其他错误,最后,再将确认之错误、相关说明及修改建议显示予使用者,而使用者亦可选择查阅详细之相关语法解释及例句,俾藉由本发明有效地提高语法校正率、降低错判率及辅助使用者学语法知识。
申请公布号 TW358177 申请公布日期 1999.05.11
申请号 TW086117864 申请日期 1997.11.27
申请人 英业达股份有限公司 发明人 余加先
分类号 G06F17/28 主分类号 G06F17/28
代理机构 代理人 高玉骏 台北县永和巿民生路四十六巷三十二号十四楼
主权项 1.一种提升文法校正率之装置,该装置主要包含:一输入设备,系供使用者输入欲进行校正之句子;一唯读记忆体,系用以储存所需之控制程式;一随机存取记忆体,系用以储存与读取文字解释资料;一微处理器,系用以控制程式之执行,并整合文字解释资料;一词法分析装置,系用以对字词进行分析,并根据一辞典中之正确搭配模式对字词间之搭配关系进行检查,以找出搭配错误点,并提出修改建议和原因予使用者;一句法分析装置,系依据句法组合规则对整个句子进行分析,以找出各组成部份在句子中之句法功能和主从关系;一检查规则匹配装置,系依据检查规则查出句子中匹配错误之语法;一正确模式匹配装置,系依据正确模式对该检查规则匹配装置所查出之错误进行核对,并查出其他匹配错误之语法;一输出设备,系用以显示句子中之错误所在,并显示修改建议、替换选项及语法解择等予使用者;该微处理器系透过该唯读记忆体内之控制程式,对该辞典中预先建立之所有原始信息、语法规则、正确模式及语法解释等资料进行分析及整合,并在该等资料被重新分析整合后,将其储存在该存取记忆体中,以形成复数种相关之文字规则及资料,俾当使用者透过该输入设备输入一句子后,该微处理器将该句子送入该词法分析装置进行词法分析及辞典模式匹配,再经由输出设备显示该词法分析装置所查到之词法搭配错误及相关之语法解释,并在使用者透过输入设备予以确认、修改或跳过后,将该句子送入该句法分析装置,再将分析结果连同该句子送到该检查规则匹配装置,由该装置将自句子所查到之准错误、带有词法分析标记及句法分析标记之原句送到该正确模式匹配装置,再经正确模式匹配装置针对准错误进行核对,并对全句进行匹配,且在确定句子之语法错误后,透过输出设备将错误、正确替换项、相关之语法解释及例句等资料显示予使用者,最后,由使用者透过输入设备来确认、修改或略过,完成语法校正之工作。2.如申请专利范围第1项所述之一种提升文法校正率之装置,其中该辞典系针对所欲检查校正之语言之所有字词,予以录制,并以字词为序所建立之一资料库,该辞典包括字词、该字词所对应之ID号及所有其它信息等栏位,其中该其它信息包含封应于该字词之词性分类,语法标注、语义标注、搭配模式及启动条件。3.如申请专利范围第2项所述之一种提升文法校正率之装置,其中该辞典尚包含一文法解释库,该文法解释库系根据该辞典中之语法规律,归纳出所有语法之解释说明,并根据语法点及所搭配之词类予以分类,并以文法点为序,所建立之一资料库。4.如申请专利范围第2项所述之一种提升文法校正率之装置,其中该辞典尚包含一用法搭配解释库,该用法搭配解释库系根据该辞典中之语法规律,归纳出所有单字所对应之惯用语,并以用法词条为序,建立之一资料库。5.如申请专利范围第1项所述之一种提升文法校正率之装置,其中该词法分析装置系由该辞典及一词法分析程序所组成,俾藉由该装置以确定各字词在句中之词性、其与前后字词间之关系及句中字词搭配之错误,并调出改正建议和相关之语法解释予使用者参考。6.如申请专利范围第1项所述之一种提升文法校正率之装置,其中该句法分析装置系由一句法组合规则库与一句法分析程序所组成,俾藉由该装置以确定各字词在句中之作用及其与前后字词间之语法关系。7.如申请专利范围第6项所述之一种提升文法校正率之装置,其中该句法组合规则库系依据该辞典之句法规律,归纳其句法规则,并对该等规则进行有效之分类,以建立之一资料库。8.如申请专利范围第1项所述之一种提升文法校正率之装置,其中该检查规则匹配装置系由一检查规则库与一规则匹配程序所组成,俾藉由该装置标示出待校正之句子中较易实现查找之语法错误。9.如申请专利范围第8项所述之一种提升文法校正率之装置,其中该检查规则库系藉收集使用者常出现之语法错误,根据可实现程度之判断,建立其校正检查规则,并对该等规则整理分类,所建立之一资料库。10.如申请专利范围第1项所述之一种提升文法校正率之装置,其中该正确模式匹配装置系由一正确模式库与一正确模式匹配程序所组成,俾藉由该装置以核对该检查规则匹配装置所标示出之错误,并同时查出其他语法错误,并调出改正建议及相关之语法解释予使用者参考。11.如申请专利范围第10项所述之一种提升文法校正率之装置,其中该正确模式库系依据该辞典之语法规律,归纳出常用之句法模式和文法搭配模式,并该等模式进行分类,所建立之一资料库。12.如申请专利范围第2.9或11项所述之一种提升文法校正率的装置,其中该装置根据该辞典中之搭配模式、该检查规则库中之规则及该正确模式事中之模式,总结所能检查及校正之所有语法错误,建立一语法错误点库。13.如申请专利范围第12项所述之一种提升文法校正率的装置,其中该装置以该文法解释库及用法搭配解释库之ID号(位址号码)为序,藉由配合该语法错误点库之ID号(位址号码),建立一目标语法点与语法解释库。14.一种提升文法校正率之方法,该方法对使用者所选取之待校正句子进行语法分析时,其语法校正分析步骤如下:(1)读取使用者输入之句子(或文字串)后,启动一词法分析装置,进行词法分析;(2)针对词法分析之结果,根据一辞典中之相关搭配模式,对符合启动该搭配模式条件之字词进行搭配模式匹配;若搭配模式间发生冲突,则透过输出设备将错误及相关信息提供予使用者参考;(3)若与搭配模式符合,则证明没有搭配错误,随即启动一句法分析装置,进行句法分析;(4)针对词法分析及句法分析所得之结果,启动一检查规则匹配装置及一正确模式匹配装置,分别对该等文字串进行语法错误查找和核对;(5)针对检查规则匹配及正确模式匹配所得之结果,判断是否发现语法错误,若未发现语法错误,即结束语法校正之整体流程;若确认存在语法错误,则透过输出设备将错误、相关说明及修改建议显示予使用者参考,并由使用者选择是否接受修改建议、自行编辑、修改或跳过该错误;(6)结束该语法校正之整体流程。15.如申请专利范围第14项所述之一种提升文法校正率之方法,其中该辞典系针对所欲检查校正之语言之所有字词,予以录制,并以字词为序所建立之一资料库,该辞典包括字词、该字词所对应之ID号及所有其它信息等栏位,其中该其它信息包含对应于该字词之词性分类、语法标注、语义标注、搭配模式及启动条件。16.如申请专利范围第15项所述之一种提升文法校正率之方法,其中该辞典尚包含一文法解释库,该文法解释库系根据该辞典中之语法规律,归纳出所有语法之解释说明,并根据语法点及所搭配之词类予以分类,并以文法点为序,所建立之一资料库。17.如申请专利范围第15项所述之一种提升文法校正率之方法,其中该辞典尚包含一用法搭配解释库,该用法搭配解释库系根据该辞典中之语法规律,归纳出所有单字所对应之惯用语,并以用法词条为序,建立之一资料库。18.如申请专利范围第14项所述之一种提升文法校正率之方法,其中该词法分析装置系由该辞典及一词法分析程序所组成,俾藉由该装置以确定各字词在句中之词性、其与前后字词间之关系及句中字词搭配之错误,并调出改正建议和相关之语法解释予使用者参考。19.如申请专利范围第18项所述之一种提升文法校正率之方法,其中该词法分析程序包括下列步骤:(1)该词法分析装置先将所输入之该句子进行句子切分或文字串切分,再根据所切分之各字词,逐一自辞典中进行查找,若辞典中不能直接查找到该字词,即针对该字词进行消尾、拆分等其他相关处理,再判断是否完成所有字词之查找;若辞典中可查找到该等字词,则直接判断是否完成所有字词之查找,如此,反覆执行前述查找及判断动作,直到完成句子中所有字词之查找动作;(2)嗣,该词法分析装置再针对查找到之该等字词进行辞典模式匹配,若模式匹配成功,则记录该句子中具有词性、语法、形态、语义和搭配等词法信息之各字词,并将其送回语法校正之整体流程;否则,若模式匹配不成功,则确定此处为搭配错误,把错误、相关说明和修改建议透过输出设备同时显示给使用者,并由使用者决定修改与否;(3)若使用者进行相关修改,则回到步骤(1),并重覆前述步骤;若使用者跳过该错误提示,未进行修改,则返回语法校正之整体流程。20.如申请专利范围第14项所述之一种提升文法校正率之方法,其中该句法分析装置系由一句法组合规则库与一句法分析程序所组成,俾藉由该装置以确定各字词在句中之作用及其与前后字词间之语法关系。21.如申请专利范围第20项所述一种提升文法校正率之方法,其中该句法组合规则库系依据该辞典之句法规律,归纳其句法规则,并对该等规则进行有效之分类,以建立之一资料库。22.如申请专利范围第20项所述之一种提升文法校正率之方法,其中该句法分析程序包括下列步骤:该句法分析装置系根据一预处理规则库对具有词法信息之文字串进行预处理;随后,依序根据一片语规则库及句法组合规则库进行片语组合及句法组合处理;最后,再将具有词法信息和句法信息之该文字串送回语法校正之整体流程。23.如申请专利范围第14项所述之一种提升文法校正率之方法,其中该检查规则匹配装置系由一检查规则库与一规则匹配程序所组成,俾藉由该装置标示出待校正之句子中较易实现查找之语法错误。24.如申请专利范围第23项所述之一种提升文法校正率之方法,其中该检查规则库系藉收集使用者常出现之语法错误,根据可实现程度之判断,建立其校正检查规则,并对该等规则整理分类,所建立之一资料库。25.如申请专利范围第23项所述之一种提升文法校正率之方法,其中该规则匹配程序包括下列步骤:(1)该检查规则匹配装置在得到具有词法信息和句法信息之文字串后,将依据句法分析结果及可能匹配之规则类别,对该等文字串及该文字串中之段落进行类别归属之判断,若归属成功,则结束检查规则匹配之流程;若归属不成功,则进行检查规则匹配之判断;(2)若与检查规则不匹配,结束检查规则匹配之流程;若与检查规则匹配,则标记下错误点,并结束检查规则匹配之程序,返回语法校正之整体流程。26.如申请专利范围第14项所述之一种提升文法校正率之方法,其中该正确模式匹配装置系由一正确模式库与一正确模式匹配程序所组成,俾藉由该装置以核对该检查规则匹配装置所标示出之错误,并同时查出其他语法错误,并调出改正建议及相关之语法解释予使用者参考。27.如申请专利范围第26项所述之一种提升文法校正率之方法,其中该正确模式库系依据该辞典之语法规律,归纳出常用之句法模式和文法搭配模式,并该等模式进行分类,所建立之一资料库。28.如申请专利范围第26项所述之一种提升文法校正率之方法,其中该正确模式匹配程序包括下列步骤:(1)该正确模式匹配装置在得到经检查规则匹配处理之文字串后,对该等文字串判断是否标记有错误点,若该文字串未标记有错误点,则直接对整个文字串进行正确模式之类别归属判断;若确认标记有错误,则针对该错误进行相应之正确模式匹配;(2)如不匹配,则显示错误、相关说明及修改建议供使用者参考;如该标记错误点与正确模式匹配成功,则取消该错误标记,并对整个文字串进行正确模式之类别归属判断;(3)经类别归属判断,如找不到相对应之类别,则结束模式匹配过程;如找到相对应之类别,则与该类别之正确模式进行匹配判断;(4)若与正确模式发生冲突,则显示错误供使用者参考;否则,若未与正确模式冲突,则结束模式匹配过程,返回语法校正之整体流程。29.如申请专利范围第15.24或27项所述之一种提升文法校正率之方法,其中该方法根据该辞典中之搭配模式、该检查规则库中之规则及该正确模式库中之模式,总结所能检查及校正之所有语法错误,建立一语法错误点库。30.如申请专利范围第16项所述之一种提升文法校正率之方法,其中该方法以该文法解释库及用法搭配解释库之lD号(位址号码)为序,藉由配合该语法错误点库之ID号(位址号码),建立一目标语法点与语法解释库。31.如申请专利范围第17项所述之一种提升文法校正率之方法,其中该方法以该文法解释库及用法搭配解释库之ID号(位址号码)为序,藉由配合该语法错误点库之ID号(位址号码),建立一目标语法点与语法解释库。32.如申请专利范围第29项所述之一种提升文法校正率之方法,其中该方法以该文法解释库及用法搭配解释库之ID号(位址号码)为序,藉由配合该语法错误点库之ID号(位址号码),建立一目标语法点与语法解释库。33.如申请专利范围第14项所述之一种提升文法校正率之方法,其中针对该等文字串中所存在之错误信息,可透过输出设备逐一予以显示,并由使用者透过输入设备选择是否接受修改建议,若使用者选择对文字串进行修改,则返回词法分析阶段,重覆语法校正之;若使用者未修改,则显示下一个错误,并重覆前述,直到完成所有错误之显示及修改选择。图式简单说明:第一图为本发明之语法检查与校正装置之硬体架构之方块示意图;第二图为本发明之辞典之示意图;第三图为依据本发明形成之文法解释库之示意图;第四图为依据本发明形成之用法搭配解释库之示意图;第五图为依据本发明形成之句法组合规则库之示意图;第六图为依据本发明形成之检查规则库之示意图;第七图为依据本发明形成之正确语法模式库之示意图;第八图为依据本发明形成之语法错误点库之示意图;第九图为依据本发明形成之目标语法点与语法解释库之示意图;第十图为依据本发明之语法校正之整体流程图;第十一图为依据本发明透过辞典进行词法分析之流程图;第十二图为依据本发明透过句法组合规则进行句法分析之流程图;第十三图为依据本发明透过检查规则库进行检查规则匹配之流程图;第十四图为依据本发明透过正确语法模式库进行正确模式匹配之流程图;第十五图为依据本发明显示和修改错误之流程图;第十六图为传统语法校正之整体流程图。
地址 台北巿士林区后港街六十六号