发明名称 |
融合多模态信息的跨媒体人物新闻检索方法与系统 |
摘要 |
本发明属于多媒体信息检索与新闻检索技术领域,具体为一种融合多模态信息的跨媒体人物新闻检索方法与系统。本发明的检索方法包括:获取网络多模态新闻数据,提取新闻人物人名获得新闻文本特征,提取新闻人物人脸图像获得新闻图像特征;对罕见新闻人物进行网络信息补充;新闻人物人名-人脸对齐聚类学;实现人物人脸与人物人名检索。本发明的检索系统包括相应于检索方法各步骤的6个模块。本发明能够很好解决网络新闻人名-人脸对齐问题,并在此基础上解决人物新闻检索问题。这两个问题在多媒体信息检索与新闻检索领域具有重要意义,本发明具有广泛的应用价值。 |
申请公布号 |
CN103425757A |
申请公布日期 |
2013.12.04 |
申请号 |
CN201310330576.X |
申请日期 |
2013.07.31 |
申请人 |
复旦大学 |
发明人 |
张玥杰;赵昀;金城;薛向阳 |
分类号 |
G06F17/30(2006.01)I;G06K9/46(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海正旦专利代理有限公司 31200 |
代理人 |
陆飞;盛志范 |
主权项 |
一种融合多模态信息的跨媒体人物新闻检索方法,其特征在于具体步骤如下:(1)获取网络多模态新闻,在新闻媒体网络平台上,利用网络爬虫获取新闻文本及相关图像,为方法提供网络多模态新闻数据;(2)提取新闻文本特征,提取新闻文本中出现的新闻人物人名,然后通过对新闻文本的分析,对人物的重要程度进行评估,作为新闻的文本特征;(3)提取新闻图像特征,从每一篇新闻图像中提取新闻人物人脸图像,并且使用基于SIFT特征的人脸特征表示方法提取人脸图像特征,作为新闻图像特征;(4)补充网络信息,利用网络挖掘信息,对新闻中比较罕见的人物进行信息补充,以提升聚类算法的准确性;(5)新闻聚类学习,使用基于模糊C均值聚类的方法,对新闻人物人名‑人脸对齐,并进行聚类学习; (6)检索跨媒体人物新闻,得到聚类结果后,采用人名检索和通过人脸检索两种方式进行检索。 |
地址 |
200433 上海市杨浦区邯郸路220号 |