发明名称 基于自动机的藏文拼写检查方法和装置
摘要 本发明公开了一种基于自动机的藏文拼写检查方法和装置,涉及自然语言处理领域。为解决现有技术由于适应面较狭窄,导致无法识别一些特殊结构的藏文字的问题而发明。本发明实施例提供的技术方案包括:S10、将待检查藏文文本以字为单位进行切分,得到至少一个藏文字;S20、将所述至少一个藏文字作为预设有限状态自动机群组的输入;S30、通过所述有限状态自动机群组判断所述待检查藏文文本是否拼写正确。
申请公布号 CN106095756A 申请公布日期 2016.11.09
申请号 CN201610409221.3 申请日期 2016.06.13
申请人 尼玛扎西 发明人 尼玛扎西
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 一种基于自动机的藏文拼写检查方法,其特征在于,包括:S10、将待检查藏文文本以字为单位进行切分,得到至少一个藏文字;S20、将所述至少一个藏文字作为预设有限状态自动机群组的输入;S30、通过所述有限状态自动机群组判断所述待检查藏文文本是否拼写正确;所述有限状态自动机群组包括37个有限状态自动机,其中任一有限状态自动机M<sub>i</sub>=(Σ<sub>i</sub>,Q<sub>i</sub>,δ<sub>i</sub>,q<sub>i</sub>,F<sub>i</sub>);所述Σ<sub>i</sub>为预设藏文拼写形式文法G<sub>i</sub>的终结符的有限集合;所述Q<sub>i</sub>为所述藏文拼写形式文法G<sub>i</sub>的非终结符的有限集合V<sub>i</sub>与所述F<sub>i</sub>的并集;所述δ<sub>i</sub>是根据Q<sub>i</sub>与Σ<sub>i</sub>之直积Q<sub>i</sub>×Σ<sub>i</sub>到Q<sub>i</sub>的映射获取的所述有限状态自动机M<sub>i</sub>的状态转移函数;所述q<sub>i</sub>为所述有限状态自动机M<sub>i</sub>的初始状态,所述q<sub>i</sub>∈Q<sub>i</sub>;所述F<sub>i</sub>为所述有限状态自动机M<sub>i</sub>的终止状态的有限集合,所述<img file="FDA0001015056590000011.GIF" wi="179" he="63" />所述i为正整数,所述i≤37。
地址 850000 西藏自治区拉萨市城关区江苏路36号