发明名称 | 一种识别签购单字符的方法和系统 | ||
摘要 | 本发明公开一种识别签购单字符的方法和系统。该方法包括为签购单的域生成候选字符串集合,候选字符串集合基于通过OCR识别得到的域的每一个字符位置的候选字符集合,计算候选字符串集合中的候选字符串的初始评估值,该初始评估值基于该候选字符串中的通过OCR识别得到的每一个字符位置的字符出现的概率和用于表征该候选字符串的在上下文出现的概率的上下文评估值,计算一个域的候选字符串与其它域的候选字符串同时出现的概率作为该一个域的候选字符串的组合概率并得到该候选字符串的最大组合概率,根据签购单的域的候选字符串的初始评估值和最大组合概率来确定该域要输出的字符串。 | ||
申请公布号 | CN104951779A | 申请公布日期 | 2015.09.30 |
申请号 | CN201410109121.X | 申请日期 | 2014.03.24 |
申请人 | 中国银联股份有限公司 | 发明人 | 冯亮;尹亚伟;费志军 |
分类号 | G06K9/20(2006.01)I | 主分类号 | G06K9/20(2006.01)I |
代理机构 | 中国专利代理(香港)有限公司 72001 | 代理人 | 郑冀之;汤春龙 |
主权项 | 一种识别签购单字符的方法,其特征在于,包括:为签购单的域生成候选字符串集合,候选字符串集合基于通过OCR识别得到的域的每一个字符位置的候选字符集合,计算候选字符串集合中的候选字符串的初始评估值,该初始评估值基于该候选字符串中的通过OCR识别得到的每一个字符位置的字符出现的概率和用于表征该候选字符串的在上下文出现的概率的上下文评估值,计算一个域的候选字符串与其它域的候选字符串同时出现的概率作为该一个域的候选字符串的组合概率并得到该候选字符串的最大组合概率,根据签购单的域的候选字符串的初始评估值和最大组合概率来确定该域要输出的字符串。 | ||
地址 | 200135 上海市浦东新区含笑路36号银联大厦 |