发明名称 |
电子设备及其自然语言分析方法 |
摘要 |
一种自然语言分析方法,用于包括语料库的电子设备。该方法包括如下步骤:接收用户语音和/或文字输入并转换为电信号;将用户的信号转换为文本信息;将文本信息切分为包括多个词汇的多种词汇切分结果;从语料库中获取多种词汇切分结果中每一词汇的使用频率,计算每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照第一概率值排序,得到对语言分析结果的第一排序方式;根据句式构造规则将文本信息进行语句成分划分;计算出各种词汇切分结果的第二概率值,并得到语言分析结果的第二排序方式;及确定用于回应用户的文本信息的一回复信息。本发明还提供了一种应用上述方法的电子设备。本发明提高了电子设备理解用户的自然语言的准确度。 |
申请公布号 |
CN103186522A |
申请公布日期 |
2013.07.03 |
申请号 |
CN201110449948.1 |
申请日期 |
2011.12.29 |
申请人 |
富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司 |
发明人 |
熊雨凯;陆欣;翁世芳;刘慧丰;吕东生;张玉勇;朱健健;成响林;周小山;黄选峰;姜安林;李新华 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种自然语言分析方法,用于包括存储有语料库的电子设备,所述语料库记录了多个词汇以及每一词汇的使用频率,所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果;从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到一语言分析结果的第一排序方式;在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分;根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。 |
地址 |
518109 广东省深圳市宝安区观澜街道大三社区富士康观澜科技园B区厂房4栋、6栋、7栋、13栋(I段) |