发明名称 生成映像的自然语言描述
摘要 用于生成输入映像的描述的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。方法之一包括获取输入映像;使用第一神经网络处理输入映像以生成输入映像的替代表示;以及使用第二神经网络处理输入映像的替代表示以生成描述输入映像的目标自然语言中的多个词的序列。
申请公布号 CN106462802A 申请公布日期 2017.02.22
申请号 CN201580032854.0 申请日期 2015.11.13
申请人 谷歌公司 发明人 萨米·本希奥;奥里奥尔·温亚尔斯;亚历山大·托什科夫·托舍夫;杜米特鲁·埃尔汉
分类号 G06N3/04(2006.01)I 主分类号 G06N3/04(2006.01)I
代理机构 中原信达知识产权代理有限责任公司 11219 代理人 李佳;穆德骏
主权项 一种由一个或多个计算机执行的方法,所述方法包括:获取输入映像;使用第一神经网络处理所述输入映像,以生成所述输入映像的替代表示;以及使用第二神经网络处理所述输入映像的所述替代表示,以生成描述所述输入映像的目标自然语言中的多个词的序列。
地址 美国加利福尼亚州