发明名称 信息处理装置以及信息处理方法
摘要 本发明提供一种信息处理装置以及信息处理方法。信息处理装置具备:单词列取得部,用于取得成为分析对象的单词列;部分列提取部,其使用由所述单词列取得部取得的单词列的各词间邻接的两个单词,从所述取得的单词列中提取出不包含另一方的单词而包含一方的单词的部分列、不包含一方的单词而包含另一方的单词的部分列、以及包含双方的单词的部分列;划分系数取得部,其针对由所述部分列提取部提取出的各个部分列,取得与将所述部分列划分为单词的各个划分模式相关的表示划分所述部分列的可靠性的程度的划分系数;概率系数获得部,其基于所述划分系数取得部取得的划分系数,求出表示单词列在所述词间划分的概率的系数;以及输出部,其基于所述概率系数获得部求出的系数,判别所述分析对象的单词列的划分,划分由所述单词列取得部取得的单词列来输出。
申请公布号 CN103246642B 申请公布日期 2016.12.28
申请号 CN201310048447.1 申请日期 2013.02.06
申请人 卡西欧计算机株式会社 发明人 井手博康
分类号 G06F17/28(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 北京银龙知识产权代理有限公司 11243 代理人 许静;郭凤麟
主权项 一种信息处理装置,其特征在于,具备:概率系数输出部,其存储划分概率系数列表,该划分概率系数列表针对各个部分列的每个划分模式存储了划分概率系数,该划分概率系数表示通过在教师数据中定义所述部分列的多个单词的划分方法的多个划分模式对部分列进行划分的概率,所述部分列由具有多个单词列的教师数据中出现的连续的单词构成;分隔书写部,通过分隔书写处理将从拍摄到的图像中提取出的字符串变换为成为分析对象的单词列;划分模式生成部,其生成单词列的多个划分模式,该多个划分模式用于定义在所述分隔书写部变换后的成为分析对象的单词列的各个词间进行划分还是不进行划分的划分方法;部分列提取部,其从通过所述分隔书写部变换后的所述单词列中提取由连续的多个单词构成的部分列;概率系数取得部,其针对由所述部分列提取部提取出的各个部分列,从所述划分概率系数列表取得与定义部分列的划分方法的各个划分模式对应的划分概率系数;词间概率系数计算部,其基于所述概率系数取得部取得的划分概率系数,求出在所述连续的多个单词的词间将所述成为分析对象的单词列通过由所述划分模式定义的划分方法进行划分的概率即概率系数;模式概率系数计算部,其根据所述词间概率系数计算部求出的概率系数计算由所述划分模式生成部生成的各个所述划分模式的概率系数;模式选择部,其选择所述模式概率系数计算部计算出的概率系数最大的划分模式,并且通过由选择出的划分模式定义的划分方法将所述分隔书写部变换后的单词列划分为部分列;变换部,将划分后的部分列变换为表示该部分列中包含的单词的含义的显示数据;以及显示部,显示由所述变换部变换后的显示数据。
地址 日本东京都