发明名称 | 关键字的自动提取装置和方法 | ||
摘要 | 本发明具备:第1提取单元(19),使用登录有用来表示子类型的字符串的第1关键字词典,从内容的标题字符串信息之中提取关键字;以及第2提取单元(19),从该内容的详细字符串信息之中,进行使用登录有人名的第2关键字词典的关键字的提取、以及利用字符种类分隔法的关键字的提取。由此,在CPU的处理能力和存储器容量都不太大的家电产品中,也能够从EPG信息一类的内容的标题字符串信息和详细字符串信息之中高效而精确地自动提取用户检索内容所需的关键字。 | ||
申请公布号 | CN100530174C | 申请公布日期 | 2009.08.19 |
申请号 | CN03822385.6 | 申请日期 | 2003.07.30 |
申请人 | 索尼株式会社 | 发明人 | 木付仁史;大沼显介;市冈秀俊 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京康信知识产权代理有限责任公司 | 代理人 | 余 刚;李丙林 |
主权项 | 1.一种关键字自动提取装置,其特征在于,具备:第1提取单元,使用登录有用来表示子类型的字符串的第1关键字词典,从内容的标题字符串信息之中提取关键字;以及第2提取单元,从上述内容的详细字符串信息之中,进行使用登录有人名的第2关键字词典的关键字的提取、以及利用字符种类分隔法的关键字的提取,其中,上述第1提取单元从包含有第1关键字词典中登录的字符串的标题字符串之中的、排除了登录在指定的排除字符串词典中的字符串之后的部分中,提取关键字;以及上述第1提取单元将包含有第1关键字词典中登录的字符串的标题字符串之中的、以平假名、片假名、汉字、数字、字母之外的特殊字符分隔的字符串作为关键字提取出来。 | ||
地址 | 日本东京都 |