发明名称 |
一种识别数字语义的方法、检测短信类别的方法及装置 |
摘要 |
本发明公开了一种识别数字语义的方法、检测短信类别的方法及装置,该识别数字语义的方法包括:获得目标文本中的目标数字;以所述目标数字为基准,获得与所述目标数字之间距离小于等于设定阈值的至少两个分词及每个分词的词性;根据所述目标数字、所述至少两个分词及所述每个分词的词性生成目标输入数据序列;将所述目标输入数据序列输入条件随机场模型,获得与所述目标输入数据序列之间具有最大联合概率的目标状态数据序列;根据所述状态数据序列,获得表征目标数字语义的标签。通过上述技术方案,解决了现有技术中无法识别短信中数字语义的技术问题,达到了数字语义识别的有益技术效果。 |
申请公布号 |
CN105589846A |
申请公布日期 |
2016.05.18 |
申请号 |
CN201510971979.1 |
申请日期 |
2015.12.22 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
张金晶;李强;常富洋 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京华沛德权律师事务所 11302 |
代理人 |
房德权 |
主权项 |
一种识别数字语义的方法,其特征在于,包括:获得目标文本中的目标数字;以所述目标数字为基准,获得与所述目标数字之间距离小于等于设定阈值的至少两个分词及每个分词的词性;根据所述目标数字、所述至少两个分词及所述每个分词的词性生成目标输入数据序列;将所述目标输入数据序列输入条件随机场模型,获得与所述目标输入数据序列之间具有最大联合概率的目标状态数据序列;根据所述状态数据序列,获得表征目标数字语义的标签。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |