发明名称 |
一种保持语义完整性的引文自动提取方法和装置 |
摘要 |
本发明提供了一种引文自动提取方法和装置。本发明能够以文本中作为阅读焦点的字符或字符串为中心自动提取上下文,所提取的引文长度处于预定的长度范围以内,并且保持所提取的引文具有语义完整性,这样能够从文本中抽取形成以被选择的字符或字符串作为阅读焦点并且长度合适、意思完整的一段语义场景,方便用户还原阅读焦点在上下文中的正确含义。 |
申请公布号 |
CN104050158A |
申请公布日期 |
2014.09.17 |
申请号 |
CN201410301560.0 |
申请日期 |
2014.06.27 |
申请人 |
吴涛军 |
发明人 |
吴涛军 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
江阴市永兴专利事务所(普通合伙) 32240 |
代理人 |
达晓玲;施光亚 |
主权项 |
一种引文自动提取方法,其特征在于,包括:焦点设定步骤,从文本中选择作为阅读焦点的字符或字符串;上下文提取步骤,通过以完整语义单元为单位进行的文本扩展和/或截取,提取以所述阅读焦点为中心的上下文,从而获得文本长度处于预定长度区间内的引文文本。 |
地址 |
200000 上海市长宁区延安西路900路 |