发明名称 面向便携式计算设备的快速文本扫读方法
摘要 本发明公开了一种面向便携式计算设备的快速文本扫读方法,其实施步骤如下:1)图像预处理:通过面向便携式计算设备的摄像头捕获包含文本的图片,然后将捕获的图片依次通过旋转矫正、检测提取文本区域,得到以行为单位的文本区域数据集;2)文本识别及语音输出:调用OCR引擎对以行为单位的文本数据集进行文本识别;同时对OCR识别速度进行预估,根据预估结果调节TTS播报速率;在进行文本识别的同时,将识别出来的以行为单位的文字信息和所述TTS播报速率发给TTS引擎以声音的形式反馈给用户。本发明具有文字识别速度快、识别准确率高、语音输出智能、用户等待时间少、用户使用体验好的优点。
申请公布号 CN103077388A 申请公布日期 2013.05.01
申请号 CN201210593869.2 申请日期 2012.12.31
申请人 浙江大学 发明人 陈岭;闯跃龙;陈根才;卜佳俊;陈纯
分类号 G06K9/20(2006.01)I;G06K9/38(2006.01)I;G10L13/04(2013.01)I 主分类号 G06K9/20(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 33224 代理人 胡红娟
主权项 一种面向便携式计算设备的快速文本扫读方法,其特征在于其实施步骤如下:1)图像预处理:通过面向便携式计算设备的摄像头捕获包含文本的图片,然后将捕获的图片依次通过旋转矫正、检测提取文本区域,得到以行为单位的文本区域数据集;2)文本识别及语音输出:调用OCR引擎对以行为单位的文本区域数据集进行文本识别;同时对OCR识别速度进行预估,根据预估结果调节TTS播报速率;在进行文本识别的同时,将识别出来的以行为单位的文字信息和所述TTS播报速率发给TTS引擎以声音的形式反馈给用户。
地址 310027 浙江省杭州市西湖区浙大路38号