发明名称 本文资讯的处理和资讯的自动化理解
摘要 本发明揭示了一种以自动化方式理解一输入字串中传达的文字资讯之架构。将该输入字串分段,以便产生若干区段及(或)语意单位。针对该输入字串中之每一区段重复下列步骤,直到识别该输入字串中每一区段之一子集为止:a.在由若干语意单位及指标构成的一碎形阶层式知识资料库中识别一符合的语意单位,其中该符合的语意单位被视为与该输入字串的一区段相关,b.考虑该符合的语意单位之关联性,而决定该语意单位之适合性,c.在该碎形阶层式知识资料库内界定与该符合的语意单位相关的资讯之一子集。然后结合这些子集,而形成一合成语意网路。
申请公布号 TW428138 申请公布日期 2001.04.01
申请号 TW088103598 申请日期 1999.03.09
申请人 万国商业机器公司 发明人 吉德K.彼尼格;彼德波伦契尔;哲杰克伦克
分类号 G06F17/28 主分类号 G06F17/28
代理机构 代理人 陈长文 台北巿敦化北路二○一号七楼
主权项 1.一种对一输入字串中传达的文字资讯连同一包含于知识资料库中的资讯进行处理之方法,该知识资料库代表一种在各阶层中都类似的按照阶层配置的语意单位之网路,该方法包含下列步骤:a.将该输入字串分成若干区段;以及b.将该等区段与该知识资料库中之各语意单位结合,以便产生由在各阶层中都类似的按照阶层配置的各语意单位构成之一合成语意网路。2.如申请专利范围第1项之方法,其中系将该等区段中之至少一个区段视为与一语意单位相关,或类似于一语意单位,且其中该知识资料库中至少有n个语意单位,其中n≧2。3.如申请专利范围第2项之方法,其中一语意单位是一个包含一件或数件资讯之集合,该语意单位最好是包含一名称、及其他语意单位的若干指标。4.如申请专利范围第1项之方法,其中该步骤b包含下列步骤:i.在该知识资料库中识别一个符合的语意单位,并将该符合的语意单位视为与该输入字串之第j个区段相关,ii.考虑该语意单位之可能关联性,而决定该符合的语意单位之适合性,针对该输入字串的所有j=1,....,m区段,重复步骤i到ii,直到找到一个符合的语意单位为止。5.如申请专利范围第4项之方法,其中系执行将该等区段与该符合的语意单位结合,使该合成语意网路包含被视为与该输入字中中传达的文字资讯相关之各语意单位。6.如申请专利范围前述任一项之方法,其中系为了以自动化方式理解该输入字串中传达的文字资讯,而采用该合成语意网路。7.如申请专利范围第1项之方法,其中该知识资料库及合成语意网路包含诸如物件、关系;及属性等数种语意单位。8.如申请专利范围第1项之方法,其中该知识资料库及合成语意网路包含数种形式的指标。9.如申请专利范围第4项之方法,其中如果该知识资料库中有m个被视为与该输入字串的第j个语意单位相关之符合的语意单位,则执行m次的自步骤i到步骤ii,且其中只利用该等m个符合的语意单位中之一语意单位来产生该合成语意网路。10.如申请专利范围第4项之方法,其中如果一对应的分类机率指示各别语意单位已完全符合该知识资料库中之各语意单位,则将该等符合的语意单位相互结合,而形成该合成语意网路。11.如申请专利范围第4项之方法,其中该语意单位之可能关联性是其可能属性及/或可能关系及/或可能角色。12.如申请专利范围第4项之方法,其中系利用该输入字串中的一语意单位之属性及/或关系及/或角色来决定该知识资料库中之一符合的语意单位是否较佳,亦即诸如该符合的语意单位之适合性是否高于该知识资料库中任何其他符合的语意单位之适合性。13.如申请专利范围第4项之方法,其中如果配合一语意单位而使用大致被接受的属性及/或关系及/或规则,则添加一额外机率,以便增加该适合性。14.如申请专利范围第4项之方法,其中如果配合一语意单位而使用不寻常的属性及/或关系及/或规则,则减掉一无效机率,以便减少该适合性。15.如申请专利范围第1或4项之方法,其中该知识资料库中之每一语意单位都蒙受一可能性,该可能性是一固定的或可变的可能性。16.如申请专利范围第8项之方法,其中该知识资料库中两个语意单位间之一指标具有一个对应于该等两个语意单位间的某类语意距离之权値。17.如申请专利范围第1项之方法,其中该合成语意网路是一个在该知识资料库中被识别的一网路。18.如申请专利范围第1项之方法,其中系自该知识资料库提取该合成语意网路,而形成一个独立的新网路。19.如申请专利范围第2项之方法,其中该输入字串被转换成一个包含该等语意单位之输入网路。20.如申请专利范围第19项之方法,其中系转换该输入网路而得到该合成语意网路。21.如申请专利范围第8项之方法,其中某些该等指标描述各语意单位间之相互关系。22.如申请专利范围第16项之方法,其中该权値之倒数代表该指标连接的两个语意单位间之某一类语意距离。23.如申请专利范围第4项之方法,其中如果接收到一额外的输入字串,则重复步骤i到步骤ii,直到产生一个合成语意网路为止。24.如申请专利范围第1项之方法,其中系将一段输入文字转换成数个输入字串。25.如申请专利范围第1项之方法,其中系决定该输入字串的一初步主题,以便迅速识别该知识资料库内一初步子集的资讯。26.如申请专利范围第25项之方法,其中如果决定了一矛盾或改变,则不时或持续地修改该初步子集。27.如申请专利范围第1项之方法,包含下列步骤:根据自该输入字串提取的一般性意义,而执行一行动。28.如申请专利范围第1项之方法,其中如果决定该输入字串包含一问题,则提供一答案而执行一行动。29.如申请专利范围第1项之方法,其中该知识资料库包含语意单位及指标在不同的标度中之自行类似表示法。30.如申请专利范围第4项之方法,其中于执行步骤i到步骤ii时,使用自行类似演算法。31.如申请专利范围第1项之方法,其中该知识资料库反映了一环境之结构,而该环境最好是真实世界的一子集。32.如申请专利范围第8项之方法,其中该等指标中之至少一个指标是各语意单位间之一直接关联式连接。33.如申请专利范围第8项之方法,其中该等指标中之至少一个指标是一阶层指标、或一水平指标、或一相似性指标、或一功能性指标、或一属性指标、或一角色指标。34.如申请专利范围第1项之方法,其中系将文字转换成若干输入字串,然后一个字串接一个字串之方式处理该等输入字串。35.如申请专利范围第1项之方法,其中系将语音转换成若干输入字串,然后一个字中接一个字串之方式处理该等输入字串。36.如申请专利范围第35项之方法,其中系采用语音辨识软体将该语音转换成该等输入字串。37.如申请专利范围第19项之方法,其中系利用语法剖析及/或文法剖析,而产生该输入网路。38.一种建构碎形阶层式知识资料库之方法,包含下列步骤:记录各语意单位,藉由指标将该等语意单位连结到该碎形阶层式知识资料库之其他语意单位,将一权値指定给该指标。39.如申请专利范围第38项之方法,其中该指标是一阶层指标或一水平指标,且该阶层指标或水平指标是一相似性指标、或一功能性指标、或一属性指标、或一角色指标。40.如申请专利范围第38项之方法,其中有用来描述各语意单位间的关联性之各种指标。41.如申请专利范围第38项之方法,其中系将该等指标本身视为语意单位。42.如申请专利范围第38项之方法,其中指定给该指标之权値是固定的或可变的。43.如申请专利范围第38项之方法,其中最好是于将该碎形阶层式知识资料库用于以自动化方式理解一输入字串中传达的文字资讯时,将一固定的或可变的可能性指定给一语意单位。44.如申请专利范围第43项之方法,其中系将一固定的可变的临界値指定给该碎形阶层式知识资料库。45.如申请专利范围第44项之方法,其中该可行性及临界値系用于子集之决定。46.如申请专利范围第38项之方法,其中该一指标的权値之倒数代表该指标所连接的两个语意单位间之某一类语意距离。47.一种对一输入字串中传达的文字资讯连同一知识资料库中包含的资讯进行处理之装置,该知识资料库代表一种在各阶层中都类似的按照阶层配置的语意单位之网路,该装置包含:将该输入字串分成若干区段之装置,储存该等区段之记忆体,一语意处理器,用以将该等区段与该知识资料库中之各语意单位结合,以便产生由在各阶层中都类似的按照阶层配置的各语意单位构成之一合成语意网路,储存该合成语意网路之记忆体。48.如申请专利范围第47项之装置,其中系将该等区段中之至少一个区段视为与一语意单位相关,或与一语意单位相同,且其中至少有n个语意单位,其中n>2。49.如申请专利范围第48项之装置,其中该语意处理器包含:在该知识资料库中识别一符合的语意单位之装置,其中将该符合的语意单位视为与该输入字串之第j个区段相关,而找到该输入字串的所有j=1,....,m区段之一符合的语意单位,以及决定装置,用以考虑该语意单位之可能关联性,而决定该符合的语意单位之适合性。50.如申请专利范围第49项之装置,包含一语音处理单元,该语音处理单元最好是包含语音辨识模组,用以将语音转换成该输入字串。51.如申请专利范围第47项之装置,其中该装置被设计成以自动化方式理解该输入字串中传达的文字资讯。52.如申请专利范围第51项之装置,包含根据所理解的资讯而触发一反应之装置。53.如申请专利范围第47项之装置,包含一后置处理器,用以转换该合成语意网路,而产生一输出字串。54.如申请专利范围第47项之装置,其中系将该合成语意网路表示为由若干语意单位构成之一碎形阶层式知识资料库。55.如申请专利范围第48项之装置,包含:一语意处理器,用以处理该输入字串,而产生一个包含该等语意单位之输入网路。图式简单说明:第一图示出根据本发明的一碎形阶层式知识资料库之组成单元(语意单位及指标)。请注意,指标可以是一语意单位,在此种情形中,系在指标的上方绘出该语意单位。第二图A是根据本发明的一第一实施例之示意方块图。第二图B是根据本发明的一第二实施例之示意方块图。第二图C是根据本发明的一第三实施例之示意方块图。第三图A-第三图C示出根据本发明第一实施例而将一输入字串转换到一输入网路之方式。第四图示出根据本发明的一碎形阶层式知识资料库。第五图示出根据本发明的"plant1"之继承属性及关系。第六图示出根据本发明而在"plant1"周围之一区域网路。第七图示出根据本发明的"plant2"之继承属性及关系。第八图示出根据本发明而在"plant2"周围之一区域网路。第九图示出根据本发明的"meadow"之继承属性及关系。第十图示出根据本发明而在"meadow"周围之一区域网路。第十一图示出根据本发明的句子1之一合成语意网路。
地址 美国