发明名称 字符串识别、翻译方法及设备
摘要 本发明公开了一种字符串识别、翻译方法及设备。该字符串识别方法包括以下步骤:拍摄同步的眼睛运动视频和眼前图像视频;对眼睛运动视频进行分析以获取原始眼动数据;生成修正眼动数据;合成显著图;找出显著图上各个高密度区域中的注意焦点;将所有注意焦点作为种子点、并采用种子填充算法对各个种子点进行填充,以获得注视焦点图像;将注视焦点图像和预设字符模板进行对比,找出和注视焦点图像的相似度最高的字符模板并生成识别字符串。本发明的字符串识别、翻译方法及设备,基于同步的眼睛运动视频和眼前图像视频,得出眼动数据并进行分析,能够自动对用户注视或正在查看的图像进行字符串的获取和识别,便利程度极高。
申请公布号 CN104239875A 申请公布日期 2014.12.24
申请号 CN201410522255.4 申请日期 2014.09.30
申请人 上海华勤通讯技术有限公司 发明人 李柯材
分类号 G06K9/00(2006.01)I;G06F17/28(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 上海弼兴律师事务所 31283 代理人 薛琦;王聪
主权项 一种字符串识别方法,其特征在于,包括以下步骤:S<sub>1</sub>、拍摄一预设时长的时间段内同步的眼睛运动视频和眼前图像视频,眼睛运动视频包括该时间段内各个时刻记录有眼睛的眼图像帧,眼前图像视频包括该时间段内各个时刻记录有位于眼睛前方的场景的景图像帧;S<sub>2</sub>、对眼睛运动视频进行分析以获取原始眼动数据,原始眼动数据包括原始注视数据和原始眼跳数据,原始注视数据和原始眼跳数据均包括基于相应眼图像帧的原始坐标;S<sub>3</sub>、将原始眼动数据中的原始坐标通过预设的坐标变换算法生成修正眼动数据,修正眼动数据包括修正注视数据和修正眼跳数据,修正注视数据和修正眼跳数据均包括基于相应景图像帧的修正坐标;S<sub>4</sub>、根据修正眼动数据及相应景图像帧获取注视焦点图像;S<sub>5</sub>、将注视焦点图像和预设的多个字符模板进行对比,找出和注视焦点图像的相似度最高或高于一相似度阈值的字符模板作为匹配字符模板,根据匹配字符模板生成识别字符串。
地址 201203 上海市浦东新区张江科苑路399号1号楼