发明名称 |
用于文本或网络内容分析的大规模特征匹配的方法 |
摘要 |
本发明提供了一种用于文本或网络内容分析的大规模特征匹配的方法,包括步骤:S1.读入所有特征串,建立双哈希表;S2.在哈希表内建立有限状态机;S3.将哈希表内的有限状态机转化为双数组结构存储;S4.文本或网络内容匹配搜索。本发明的方法能够有效提升文本或网络内容分析的匹配速度,降低内存消耗。 |
申请公布号 |
CN103412858A |
申请公布日期 |
2013.11.27 |
申请号 |
CN201210228593.8 |
申请日期 |
2012.07.02 |
申请人 |
清华大学 |
发明人 |
薛一波;袁振龙 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
王莹 |
主权项 |
一种用于文本或网络内容分析的大规模特征匹配的方法,其特征在于,包括步骤:S1.读入所有特征串,建立双哈希表;S2.在哈希表内建立有限状态机;S3.将哈希表内的有限状态机转化为双数组结构存储;S4.文本或网络内容匹配搜索。 |
地址 |
100084 北京市海淀区清华园北京市100084-82信箱 |