发明名称 语言识别装置,语言识别方法及记忆有语言识别程式的记录媒体
摘要 本发明之目的是用以识别文字码之语言及其文字码系。本发明之构成是对语言和文字码系之每一个组合设置出现机率表用来记载每一个文字之文字码之出现机率。将被输入之文字码列分成每一个文字(步骤21),参照出现机率表用以获得该文字码之出现机率(步骤23,25,27,29,31)。对语言和文字码系之每一个组合算出其出现机率之积(步骤24,26,28,30,32),根据所获得之积判断输入文字码列之语言和文字码系之组合。
申请公布号 TW421750 申请公布日期 2001.02.11
申请号 TW087103628 申请日期 1998.03.12
申请人 欧姆龙股份有限公司 发明人 向川信一;藤并稔弘;金冈秀信;多田智之
分类号 G06F17/27 主分类号 G06F17/27
代理机构 代理人 何金涂 台北巿大安区敦化南路二段七十七号八楼
主权项 1.一种语言识别装置,用来识别被编码之本文资料之语言和文字码系之组合,其具备有:记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于被施加之本文资料所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;和判别装置,根据所获得之评估资料,用来判别被施加之本文资料之语言和文字码系之组合。2.如申请专利范围第1项之语言识别装置,其中用以获得该评估资料之评估装置用来算出从出现机率表中读出之出现机率之积。3.一种多语言形态素解析系统,其具备有:记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于被施加之本文资料所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;判别装置,根据所获得之评估资料,用来判别被施加之本文资料之语言和文字码系之组合;多个形态素解析装置,其对多种语言设置;和控制装置,用来将被施加之本文资料供给到适于语言识别装置所识别之语言之形态素解析装置。4.一种多语言检索系统,其具备有:记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于被施加之关键字所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;判别装置,根据所获得之评估资料,用来判别被施加之关键字之语言和文字码系之组合;多个检索装置,其对多种语言设置,根据被输入之关键字用来输出与该关键字相关之资讯;和控制装置,用来将被施加之关键字供给到适于语言识别装置所识别语言之检索装置。5.一种多语言输出装置,其具备有:记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于被施加之本文资料所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;判别装置,根据所获得之评估资料,用来判别被施加之本文资料之语言和文字码系之组合;输出装置,用来输出本文资料所表示之本文;和输出形态控制装置,根据语言识别装置所识别之语言,用来控制输出装置之本文输出形态。6.如申请专利范围第5项之多语言输出装置,其中该输出装置为用以印刷本文之印刷机;和输出形态控制装置用来控制印刷机之印刷形态。7.如申请专利范围第5项之多语言输出装置,其中该输出装置为用以显示本文之显示装置;和该输出形态控制装置用来控制显示装置之显示形态。8.一种多语言翻译系统,其具备有:记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于被施加之本文资料所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;判别装置,根据所获得之评估资料,用来判别被施加之本文资料之语言和文字码系之组合;多个翻译装置,其对2种语言之多个组合设置,用来将一种语言翻译成另外一种语言和加以输出;和控制装置,用来将被施加之本文资料供给到适于语言识别装置所识别语言之翻译装置。9.如申请专利范围第8项之多语言翻译系统,其中更具备有声音合成装置,用来利用翻译所获得之另外一种语言变换成声音和加以输出。10.一种多语言文字处理机,其具备有本文资料记忆装置,用来记忆多种语言之本文资料;记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于记忆在本文资料记忆装置的本文资料及所输入的本文资料所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;判别装置,根据所获得之评估资料,用来判别记忆在本文资料记忆装置的本文资料及所输入的本文资料之语言和文字码系之组合;语言输入装置,其对每一种语言设置,用来将被输入之本文资料变换成适于该本文资料所表示之本文之语言体系语言之本文资料;和控制装置,根据语言识别装置之识别结果,用来控制将被输入之本文资料施加到适于其语言之语言输入装置。11.一种多语言声音合成系统,其具备有:记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于被施加之本文资料所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;判别装置,根据所获得之评估资料,用来判别被施加之本文资料之语言和文字码系之组合;多个声音合成装置,对多种语言设置,用来将被输入之本文资料所表示之本文变换成声音和加以输出;和控制装置,用来将被施加之本文资料供给到适于语言识别装置所识别语言之声音合成装置。12.一种多语言处理系统,其具备有:记忆装置,收纳有多个出现机率表用以记载语言和文字码系之每一个组合中之文字码之出现机率;评估装置,对于被施加之本文资料所包含之1个或多个文字码,从上述之多个出现机率表中分别读出出现机率,藉以获得语言和文字码系之每一个组合之评估资料;判别装置,根据所获得之评估资料,用来判别被施加之本文资料之语言和文字码系之组合;多个处理装置,其对多种语言设置;和控制装置,用来将被施加之本文资料供给到适于语言识别装置所识别语言之处理装置。13.一种语言识别方法,用来识别被编码之本文资料之语言和文字码系之组合;其包含之步骤有:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;和根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合。14.如申请专利范围第13项之语言识别方法,其中经由算出从出现机率表中读出之出现机率之积,用来获得评估资料。15.一种多语言形态素解析方法,其包含之步骤有:对于复数之语言设置多数之形态解析装置,对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和将被施加之本文资料供给到适于被识别语言之形态素解析装置。16.一种多种语言检索方法,其包含之步骤有:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之关键字所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之关键字之语言和文字码系之组合;和将被施加之关键字供给到适于被识别语言之检索装置。17.一种多语言输出方法,其包含之步骤有:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;识别被施加之本文资料之语言;和根据被识别之语言,控制用以输出本文资料所表示之本文输出装置之本文输出形态。18.如申请专利范围第17项之多语言输出方法,其中该输出装置是用以印刷本文之印刷机,用来控制印刷机之印刷形态。19.如申请专利范围第17项之多语言输出方法,其中该输出装置是用以显示本文之显示装置,用来控制显示装置之显示形态。20.一种多语言翻译方法,其包含之步骤有:对2种语言之多个组合设置多个翻译装置,用来将一种语言翻译成另外一种语言和加以输出;对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之关键字所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之关键字之语言和文字码系之组合;和将被施加之本文资料供给到适于被识别语言之翻译装置。21.如申请专利范围第20项之多语言翻译方法,其中将利用翻译所获得另外一种语言变换成声音和加以输出。22.一种多语言文字处理机之控制方法,其包含之步骤有:记忆多种语言之本文资料;对被输入之本文之每一种语言,设置语言输入装置,用来将被输入之本文资料变换成适于该本文资料所表示之本文之语言体系之语言;对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被记忆的本文资料及所输入之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被记忆的本文资料及所输入之本文资料之语言和文字码系之组合;识别被记忆之本文资料和被输入之本文资料之语言;和根据语言识别结果控制成将资料施加到适于其语言之语言输入装置。23.一种多语言声音合成方法,其包含之步骤有:对多种语言设置多声音合成装置,用来将被输入之本文资料所表示之本文变换成声音和加以输出;对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和将被施加之本文资料供给到适于被识别语言之声音合成装置。24.一种多语言处理方法,其包含之步骤有:对多种语言设置多个处理装置;对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和将被施加之该本文资料供给到适于被识别语言之处理装置。25.一种记录媒体,收纳有程式对于语言和文字码系之每一个组合,使用记载有该组合中之文字码之出现机率之出现机率表,用来识别被编码之本文资料之语言和文字码系之组合;其中利用程式控制电脑进行:对于被施加之本文资料所包含之1个或多个文字码,从该多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;和根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合。26.如申请专利范围第25项之记录媒体,其中更收纳有上述出现机率表。27.如申请专利范围第25项之记录媒体,其中该程式对语言和文字码系之每一个组合算出从出现机率表中读出之出现机率之积,根据所获得之积判别被施加之本文资料之语言和文字码系之组合。28.一种记录媒体,收纳有电脑可读取之程式,该程式用来控制对多种语言之多个形态素解析装置之本文资料之供给,其中以程式控制电脑进行:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和将被施加之本文资料供给到适于被识别语言之形态素解析装置。29.一种记录媒体,收纳有电脑可读取之程式,用来控制对多个检索装置之关键字之供给,该多个检索装置为多种语言而设,根据被输入之关键字用来输出与该关键字相关之资讯,其中以程式控制电脑进行:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之关键字所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之关键字之语言和文字码系之组合;和将被施加之关键字供给到适于被识别语言之检索装置。30.一种记录媒体,收纳有电脑可读取之程式,其中以程式控制电脑进行:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和根据被识别之语言,控制用以输出本文资料所表示之本文之输出装置之本文输出形态。31.如申请专利范围第30项之记录媒体,其中该输出装置是用以印刷本文之印刷机,用来控制印刷机之印刷形态。32.如申请专利范围第30项之记录媒体,其中该输出装置为用以显示本文之显示装置,用来控制显示装置之显示形态。33.一种记录媒体,收纳有电脑可读取之程式,用来变换对多个翻译装置之本文资料之输入,该多个翻译装置为2种语言之多个组合而设,用来将一种语言翻译成另外一种语言和加以输出,其中以程式控制电脑进行:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和将被施加之本文资料供给到适于被识别语言之翻译装置。34.如申请专利范围第33项之记录媒体,其中更具备有程式将利用翻译所获得之该另外一种语言变换成声音和加以输出。35.一种记录媒体,收纳有电脑可读取之程式,记忆有多种语言之本文资料,对于被输入之本文之每一种语言,设有语言输入装置用来将被输入之本文资料变换成适于该本文资料所表示之本文之语言体系之语言,在这种情况时将被输入之本文资料供给到其适合之语言输入装置,其中以程式控制电脑进行:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被记忆的本文资料及所输入之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被记忆的本文资料及所输别之本文资料之语言和文字码系之组合;和根据该识别结果将被输入之本文资料施加到其适合之语言之语言输入装置。36.一种记录媒体,收纳有电脑可读取之程式,用来变换对多个声音合成装置之本文资料之输入,该多个声音合成装置为多极语言而设,用来将被输入之本文资料所表示之本文变换成声音,其中以程式控制电脑进行:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和将被施加之本文资料供给到适于被识别语言之声音合成装置。37.一种记录媒体,收纳有电脑可读取之程式,用来变换对多种语言之多个处理装置之本文资料之输入,其以程式控制电脑进行:对于语言和文字码系之每一个组合,预先制作出现机率表用来记载该组合之文字码之出现之机率;对于被施加之本文资料所包含之1个或多个文字码,从多个出现机率表中分别读出其出现机率,藉以获得语言和文字码系之每一个组合之评估资料;根据所获得之评估资料,判别被施加之本文资料之语言和文字码系之组合;和将被施加之本文资料供给到适于被识别之语言之处理装置。38.如申请专利范围第1项之语言识别装置,其中未具备有:判别装置,根据所获得之评估资料,用来判别被施加之本文资料之语言和文字码系之组合。图式简单说明:第一图表示文字码之语言识别系统之外观。第二图表示文字码之语言识别系统之电构造之概要。第三图表示文字码之语言识别系统所使用之记录媒体之资料构造。第四图表示处理对象之输入资料,语言识别程式和出现机率资料之相互关系。第五图表示文字码之语言识别系统之处理步骤。第六图表示指定句子之文字码之出现机率与语言和文字码之对应关系。第七图是方块图,用来表示多语言形态素解析系统之电构造。第八图表示多语言形态素解析系统之处理步骤之概要。第九图是方块图,用来表示多语言检索系统之电构造之概要。第十图表示多语言检索系统之处理步骤之概要。第十一图是方块图,用来表示多语言输出系统之电构造之概要。第十二图表示多语言输出系统之处理步骤之概要。第十三图是方块图,用来表示多语言翻译系统之电构造之概要。第十四图表示多语言翻译系统之处理步骤之概要。第十五图是方块图,用来表示多语言字处理机之电构造之概要。第十六图是表示多语言字处理机之处理步骤之概要。第十七图是方块图,用来表示多语言声音合成系统之电构造之概要。第十八图表示多语言声音合成系统之处理步骤之概要。第十九图表示多语言声音合成系统之电构造之概要。
地址 日本