发明名称 |
处理用于句法分析的特征模板的方法及装置 |
摘要 |
本发明提供一种处理用于句法分析的特征模板的方法及装置。所述方法包括:获取第一特征模板的集合,其中,所述第一特征模板的集合包含基本模板和组合模板,每个所述组合模板包含至少两个基本模板;从所述第一特征模板的集合提取至少一个基本模板;分别使用所述至少一个基本模板对训练语料进行解码,并且分别为每个所述基本模板统计从所述训练语料抽取的第一特征值的数量;从所述第一特征模板的集合删除仅抽取出单个第一特征值的所述基本模板以及组合模板中包含的所述基本模板。通过从特征模板的集合中删除不影响测试精度的特征模板,自动地进行特征模板的筛选,获得通用性好的特征模板的集合。 |
申请公布号 |
CN104391836A |
申请公布日期 |
2015.03.04 |
申请号 |
CN201410643330.2 |
申请日期 |
2014.11.07 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
吴文权;吴先超;刘占一 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京金律言科知识产权代理事务所(普通合伙) 11461 |
代理人 |
罗延红;杨艳云 |
主权项 |
一种处理用于句法分析的特征模板的方法,其特征在于,所述方法包括:获取第一特征模板的集合,其中,所述第一特征模板的集合包含基本模板和组合模板,每个所述组合模板包含至少两个基本模板;从所述第一特征模板的集合提取至少一个基本模板;分别使用所述至少一个基本模板对训练语料进行解码,并且分别为每个所述基本模板统计从所述训练语料抽取的第一特征值的数量;从所述第一特征模板的集合删除仅抽取出单个第一特征值的所述基本模板以及组合模板中包含的所述基本模板。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦三层 |