发明名称 |
基于语意识别的自然语言处理方法、装置和系统 |
摘要 |
本发明实施方式公开了一种基于语意识别的自然语言处理方法、装置和系统。将篇章级的词语利用符号切分为字符串,并从切出的字符串中提取出语言线性结构和语块;分别对提取出的语言线性结构以及语块进行倒排,创建语言线性结构子索引以及语块子索引,并将语言线性结构子索引和语块子索引予以合并以形成整体索引;从用户的检索输入字符串中提取出语言线性结构和语块,并根据整体索引向用户反馈与从用户的检索输入中提取出的语言线性结构和语块相匹配的信息。应用本发明实施方式以后,运用了分析语言结构+关键词的技术手段,从语言的线性结构和关键词中精确地提炼出信息的真正意图,可以准确地向用户反馈所需要的信息。 |
申请公布号 |
CN102789464A |
申请公布日期 |
2012.11.21 |
申请号 |
CN201110131065.6 |
申请日期 |
2011.05.20 |
申请人 |
陈伯妤 |
发明人 |
不公告发明人 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于语意识别的自然语言处理方法,其特征在于,该方法包括:将篇章级的词语利用符号切分为字符串,并从切出的字符串中提取出语言线性结构和语块;分别对提取出的语言线性结构以及语块进行倒排;创建语言线性结构子索引以及语块子索引,并将语言线性结构子索引和语块子索引予以合并,以形成整体索引;从用户的检索输入字符串中提取出该输入字符串的语言线性结构和语块,并根据所述的整体索引向用户反馈与从用户的检索输入中提取出的语言线性结构和语块相匹配的信息。 |
地址 |
100027 北京市朝阳区工体北路8号三里屯SOHOC座1502 |