发明名称 |
一种自动生成问题的语义模板的方法和系统 |
摘要 |
本发明公开了一种自动生成问题的语义模板的方法和系统。方法包括:步骤一,识别自由文本形式的问题的基本结构;步骤二,从该基本结构中,选择需要进行泛化的词语;步骤三,在词语数据库中搜索被选择的词语的所有上位概念,将所述上位概念与一标签本体中的标签进行匹配,利用所述匹配成功的标签中的语义关键词为被选择词语进行语义标注。利用本发明可根据自由文本形式的问题得到对应的匹配程度高的语义模板,且该语义模板还可覆盖较多的结构相似及语义相关的问题,从而被众多用户提问时使用,结构化及语义化地积累问题和答案,为自动搜索问题和答案的过程提供较为准确且可适当扩展的搜索源。 |
申请公布号 |
CN101369265A |
申请公布日期 |
2009.02.18 |
申请号 |
CN200810056168.9 |
申请日期 |
2008.01.14 |
申请人 |
北京百问百答网络技术有限公司 |
发明人 |
刘文印 |
分类号 |
G06F17/27(2006.01) |
主分类号 |
G06F17/27(2006.01) |
代理机构 |
北京律诚同业知识产权代理有限公司 |
代理人 |
梁挥;祁建国 |
主权项 |
1.一种自动生成问题的语义模板的方法,其特征在于,包括:步骤一,识别自由文本形式的问题的基本结构;步骤二,从该基本结构中,选择需要进行泛化的词语;步骤三,在词语数据库中搜索被选择的词语的所有的上位概念,将所述上位概念与一标签本体中的标签进行匹配,利用所述匹配成功的标签中的语义关键词为被选择词语进行语义标注。 |
地址 |
100872北京市海淀区中关村大街59号文化大厦1207F室 |