发明名称 电子设备及其自然语言分析方法
摘要 一种自然语言分析方法,用于包括存储有基础语料库和临时语料库的电子设备。所述方法包括如下步骤:接收用户输入并转换为电信号;将输入信号转换为文本信息;将文本信息进行分析;根据基础语料库和词汇切分结果和语句划分结果分析得到第一理解结果;根据上下文理解法判断第一理解结果是否为恰当的理解结果;当第一理解结果不是恰当的理解结果时,确定一或多个代指词汇,根据上下文确定其临时理解结果以及对文本信息的第二理解结果;及根据第二理解结果以及基础语料库和临时语料库确定用于回应用户的文本信息的一回复信息。本发明还提供了一种应用上述方法的电子设备。本发明提高了电子设备理解用户的自然语言的准确度。
申请公布号 CN103186523A 申请公布日期 2013.07.03
申请号 CN201110451460.2 申请日期 2011.12.30
申请人 富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司 发明人 熊雨凯;陆欣;翁世芳;刘慧丰;吕东生;张玉勇;朱健健;成响林;黄选峰;姜安林;周小山;李新华
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 代理人
主权项 一种自然语言分析方法,用于包括存储有基础语料库的电子设备,其特征在于,所述基础语料库记录了多个词汇以及每一词汇的使用频率,所述电子设备还存储有记录了至少一代指词汇及其临时理解结果的一一对应关系的临时语料库,所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述文本信息进行语句成分划分,得到多种语句划分结果;从所述基础语料库中获取切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,根据各种词汇切分结果以及语句划分结果综合分析并得到一第一理解结果;根据上下文理解法对用户的一预设时段内的文本信息进行分析,判断所述第一理解结果是否为一恰当的理解结果;当所述第一理解结果不是恰当的理解结果时,确定导致所述第一理解结果为不恰当的理解结果的一或多个代指词汇,并将所述一或多个代指词汇与存储在所述临时语料库中的词汇进行对比,判断临时语料库中是否记录了所述一或多个代指词汇;当所述临时语料库中未记录所述一或多个代指词汇时,根据上下文分析确定所述一或多个代指词汇的临时理解结果以及对所述文本信息的第二理解结果,并将所述一或多个代指词汇及其临时理解结果一一对应存储于临时语料库中;及根据所述第二理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。
地址 518109 广东省深圳市宝安区观澜街道大三社区富士康观澜科技园B区厂房4栋、6栋、7栋、13栋(I段)