发明名称 |
用于对待处理的短文本信息进行扩展的方法、装置和设备 |
摘要 |
本发明提供一种用于对待处理的短文本信息进行扩展的方法、装置及计算机设备,其中,本发明获取所述待处理的短文本信息;通过所述短文本信息来获取与其相关的一个或多个相关扩展信息;并根据所述第一预定规则,并根据所述短文本信息,由所述一个或多个相关扩展信息来获得所述短文本信息的扩展特征词向量。与现有技术相比,本发明具有以下优点:1)本发明能够较好地对短文本信息进行扩展,通用性较强,并且便于维护,并获得针对性及可识别性较强的扩展特征信息;2)本发明不受限于短文本形式,并且不必先预存短文本特征匹配表,具有更广泛的应用场景。 |
申请公布号 |
CN102567290A |
申请公布日期 |
2012.07.11 |
申请号 |
CN201010623672.X |
申请日期 |
2010.12.30 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
冼健;陈宁昱;田浩 |
分类号 |
G06F17/21(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/21(2006.01)I |
代理机构 |
北京汉昊知识产权代理事务所(普通合伙) 11370 |
代理人 |
罗朋 |
主权项 |
一种计算机实现的用于对待处理的短文本信息进行扩展的方法,其中,该方法包括以下步骤:a获取所述待处理的短文本信息;b基于该短文本信息来获取与其相关的一个或多个相关扩展信息;c基于第一预定规则,并根据所述短文本信息,由所述一个或多个相关扩展信息来获得所述短文本信息的扩展特征词向量;其中,所述扩展特征词向量包括多个扩展特征信息,所述每个扩展特征信息与所述短文本信息不完全相同。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦 |