发明名称 一种基于语义匹配驱动的自然语言知识获取方法
摘要 本发明公开了一种基于语义匹配驱动的自然语言知识获取方法,包括如下过程:(1)定义自然语言处理的语义模型;(2)定义词汇语义的表示方法;(3)定义词汇间的语义匹配关系;(4)定义语句处理方法;(5)将分析结果转化为知识点。该方法利用语义匹配信息,结合少量自然语言中常见的语法规则,根据语义匹配值,能够在多种符合语法的分析方案中,选择一种比较符合语义逻辑的分析方案作为最终的分析结果。通过该方法可以进行自然语言语句分析并获取其中所蕴含的知识。实验证明,该方法具有较好的可行性。
申请公布号 CN102945230B 申请公布日期 2015.03.25
申请号 CN201210396625.5 申请日期 2012.10.17
申请人 刘运通;郭磊;王爱民 发明人 刘运通;郭磊;王爱民
分类号 G06F17/28(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 北京同辉知识产权代理事务所(普通合伙) 11357 代理人 赵慧
主权项 基于语义匹配驱动的自然语言知识获取方法,主要包括如下过程:(1)定义自然语言处理的语义模型;主要为定义词汇间的语义匹配关系;定义词汇的语义修饰目标;定义语句的语义匹配值;(2)定义词汇语义的表示方法:(3)定义词汇间的语义匹配关系;主要为名词‑名词间的语义匹配关系;名词‑动词间的语义匹配关系;名词‑形容词的语义匹配关系;并列语义匹配关系;副词的语义匹配关系;量词的语义匹配关系;代词的语义匹配关系;以及语法匹配关系;(4)定义语句处理方法;这其中主要涉及语义结构的三个层次及其文法,包括获取最佳语法分析方案的思路;获取最佳的语法分析方案;简单子句的最佳语义匹配值;(5)将分析结果转化为知识点;其中步骤(1)按如下过程执行:(1a)定义1——定义词汇间的语义匹配关系:在词汇语义知识库中,任意两个实词W<sub>X</sub>和W<sub>Y</sub>之间具有内在语义联系,称为语义匹配关系;用函数match(W<sub>X</sub>,W<sub>Y</sub>)来表示其密切程度,函数的值就是语义匹配值;语义匹配关系与具体语句无关;假如W<sub>X</sub>与W<sub>Y</sub>之间没有语义匹配关系,则设置match(W<sub>X</sub>,W<sub>Y</sub>)=MAX,MAX是一个常数;(1b)定义2——定义词汇间的语义修饰目标:语句中的除去谓语中心词之外的任意实词W<sub>i</sub>均语义修饰于另外一个实词W<sub>Gi</sub>,称W<sub>Gi</sub>是W<sub>i</sub>语义修饰目标;(1c)定义3——定义语句的匹配值:在特定的语法分析方案A<sub>i</sub>的情况下,假设V为谓语中心词,S为V的施动者,O为V的承受者,Wi是语句中的一个实词且!(W<sub>i</sub>∈{S,V,O}),W<sub>Gi</sub>是W<sub>i</sub>的语义修饰目标,用函数match(W<sub>i</sub>,W<sub>Gi</sub>)表示其语义匹配值,那么,整个语句的语义匹配值Value<sub>Ai</sub>可以用公式(1)来表示:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>Vaule</mi><mi>Ai</mi></msub><mo>=</mo><msub><mi>K</mi><mi>SVO</mi></msub><mo>*</mo><mrow><mo>(</mo><mi>match</mi><mrow><mo>(</mo><mi>S</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow><mo>+</mo><mi>match</mi><mrow><mo>(</mo><mi>O</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>+</mo><msub><mi>K</mi><mi>W</mi></msub><mo>*</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>match</mi><mrow><mo>(</mo><msub><mi>W</mi><mi>i</mi></msub><mo>,</mo><msub><mi>W</mi><mi>Gi</mi></msub><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000021.GIF" wi="1504" he="117" /></maths>S和O的语义修饰目标是V,n是不包括S,V和O的实词的个数,K<sub>SVO</sub>和K<sub>Wi</sub>为权值系数,需要注意的是,值越小表示语义匹配程度越大;(1d)假设公理1——最佳语法分析公理:假设一个语句具有m种语法分析方案,最符合语义逻辑的语法分析方案A<sub>i</sub>满足条件:A<sub>i</sub>=argmin(Value<sub>Ai</sub>),即语义匹配值最小的语法分析方案是最佳语法分析方案;其中步骤(2)按如下过程执行:(2a)定义4——基本概念:在构建语义库前所设定的、无需进行语义定义的、并在语句分析和推理时由系统进行特别语义解释处理的有限符号集合,基本概念数量极少,用C<sub>WB</sub>={W<sub>B1</sub>,W<sub>B2</sub>…W<sub>Bk</sub>}表示,默认每个基本概念W<sub>Bi</sub>继承于根概念;(2b)定义5——格:表示动作类概念与其他事物之间相关情况的深层语义关系的特殊基本概念集合,用C<sub>VC</sub>={C<sub>1</sub>,C<sub>2</sub>…C<sub>m</sub>}表示;(2c)定义6——模态:表示动作类概念的执行状态的特殊基本概念集合,用C<sub>VM</sub>={M<sub>1</sub>,M<sub>2</sub>…M<sub>n</sub>}表示;(2d)定义7——基本的语义关系:在构建语义库前所设定的、不可改变的、并在语句分析时需要进行特别语义解释处理的语义关系,包括如下语义关系:R<sub>C</sub>(V,C,W)格语义关系:用以表示动作类概念V与概念W具有格为C的深层语义关系,其中C∈C<sub>VC</sub>;R<sub>M</sub>(V,M)模态语义关系:用以表示动作类概念V的执行状态为M,其中C∈C<sub>VM</sub>;R<sub>AP</sub>(W,P)属性语义关系:用以表示概念P是名词类概念W的一个属性的语义关系;R<sub>AS</sub>(W,S)状态语义关系:用以表示概念S是名词类概念W的一个状态的语义关系;R<sub>D</sub>(W)继承语义关系:概念的语义定义式中只能使用一次;R<sub>P</sub>(W<sub>1</sub>,W<sub>2</sub>)描述部分语义关系的有限集合:说明概念W<sub>2</sub>的语义是W<sub>1</sub>的语义的一部分;R<sub>W</sub>(W<sub>1</sub>,W<sub>2</sub>)描述整体关系的有限集合:说明概念W<sub>1</sub>语义包含W<sub>2</sub>;R<sub>VS</sub>(V,W)表示动作V的施动者是W的语义关系,R<sub>VO</sub>(V,W)表示动作V的承受者是W的语义关系;(2e)定义8——扩展语义关系:在构建语义库过程中所新定义的语义关系集合,数量不限;在语句分析时,所有的扩展语义关系具有统一的处理方法,不进行特殊的处理;用R<sub>R</sub>(W<sub>1</sub>,W<sub>2</sub>)表示,说明被定义的概念W是W<sub>1</sub>和W<sub>2</sub>之间的一种语义关系;在非定义式中,用R<sub>R</sub>(W,W<sub>1</sub>,W<sub>2</sub>)表示W<sub>1</sub>和W<sub>2</sub>之间存在名为W的扩展语义关系;(2f)基于基本描述逻辑,对其概念定义按规则1‑7进行限制和变换,成为本文的概念语义定义方法;规则1——概念定义规则:1)假如W<sub>B1</sub>,W<sub>B2</sub>是基本概念,R<sub>1</sub>,R<sub>2</sub>是语义关系,则新符号<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>W</mi><mo>=</mo><mo>&Not;</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>|</mo><mo>&Not;</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><mo>&Not;</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>|</mo><mo>&Not;</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>&cup;</mo><msub><mi>R</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>&cap;</mo></mrow>]]></math><img file="FDA0000654584220000041.GIF" wi="1623" he="94" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>R</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000043.GIF" wi="212" he="81" /></maths>是概念;2)假如W<sub>B1</sub>,W<sub>B2</sub>是概念,R<sub>1</sub>,R<sub>2</sub>是语义关系,则新符号<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>W</mi><mo>=</mo><mo>&Not;</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>|</mo><mo>&Not;</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><mo>&Not;</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>|</mo><mo>&Not;</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>&cup;</mo><msub><mi>R</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>R</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>&cap;</mo></mrow>]]></math><img file="FDA0000654584220000042.GIF" wi="1619" he="84" /></maths><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>R</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>W</mi><mrow><mi>B</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000044.GIF" wi="207" he="76" /></maths>是概念;在规则1中没有概念并、概念交、量词的使用规则,它们的处理方式见规则2‑3;规则2‑3是为了把概念的定义方式转化为一组语义关系,并且要求名词满足单继承的原则;规则2——概念并的处理规则:假如W<sub>1</sub>,W<sub>2</sub>是概念,W<sub>1</sub>,W<sub>2</sub>的最近共同祖先概念为W<sub>P</sub>,当新概念W具有W=W<sub>1</sub>∪W<sub>2</sub>的语义时,由于单继承规则,可将W定义为W=R<sub>D</sub>(W<sub>P</sub>)∩(R<sub>P</sub>(W<sub>P</sub>,W<sub>1</sub>)∪R<sub>P</sub>(W<sub>P</sub>,W<sub>2</sub>));规则3——概念交的处理规则:假如W<sub>1</sub>,W<sub>2</sub>是概念,当新概念W具有W=W<sub>1</sub>∩W<sub>2</sub>的语义时,由于单继承规则,可将W定义为W=R<sub>D</sub>(W<sub>1</sub>)∩R<sub>W</sub>(W<sub>1</sub>,W<sub>2</sub>)或W=R<sub>D</sub>(W<sub>2</sub>)∩R<sub>W</sub>(W<sub>2</sub>,W<sub>1</sub>)规则4——概念分类定义规则:自然语言中概念按性质被分类表示为名词、动词、形容词和副词;假设用Def(W)表示概念W的定义式,Num(R,W)为定义式中语义关系R的出现次数,每类词汇定义应满足如下规则:名词的单继承:满足条件<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mrow><mo>(</mo><msub><mi>R</mi><mi>D</mi></msub><mrow><mo>(</mo><msub><mi>W</mi><mi>P</mi></msub><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><mi>W</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><mi>Num</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>D</mi></msub><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000051.GIF" wi="922" he="83" /></maths>的概念W;动词:满足条件<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mrow><mo>(</mo><msub><mi>R</mi><mi>VS</mi></msub><mrow><mo>(</mo><msub><mi>W</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>&cup;</mo><msub><mi>R</mi><mi>VO</mi></msub><mrow><mo>(</mo><msub><mi>W</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><mi>W</mi><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><mi>Num</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>VS</mi></msub><mo>,</mo><msub><mi>W</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000052.GIF" wi="1273" he="83" /></maths><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><mo>&cap;</mo><mrow><mo>(</mo><mi>Num</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>VO</mi></msub><mo>,</mo><msub><mi>W</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000654584220000055.GIF" wi="564" he="88" /></maths>形容词:满足条件<img file="FDA0000654584220000053.GIF" wi="1028" he="86" /><maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><mrow><mo>(</mo><mi>Num</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>AP</mi></msub><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><mi>Num</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>AS</mi></msub><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000654584220000056.GIF" wi="992" he="83" /></maths>副词:满足条件<maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><mrow><mo>(</mo><msub><mi>R</mi><mi>M</mi></msub></mrow><mrow><mo>(</mo><msub><mi>W</mi><mn>1</mn></msub><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><mi>W</mi><mo>)</mo></mrow><mo>)</mo><mo>&cap;</mo><mrow><mo>(</mo><mi>Num</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>M</mi></msub><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000654584220000054.GIF" wi="1092" he="83" /></maths>规则5——量词的处理规则:量词没有得到特殊的对待,被作为”次数”格语义关系的一个值表示动作的次数,作为“数量”属性语义关系的值来表示名词的个数;规则6——实例设置规则:在定义概念W时,假如定义式中的概念W<sub>i</sub>出现m次,而这m次出现指代的n个语义{S<sub>1</sub>,S<sub>2</sub>…S<sub>n</sub>},则可用{W,W#1…W#n‑1},来区别W的n个语义,W#i在推理时可解释为实例;规则7——多义词处置规则:自然语言中有很多多义词,假如多义词W具有n个语义{S<sub>1</sub>,S<sub>2</sub>…S<sub>n</sub>},则针对每一个具体语义定义一个概念,共定义n个概念{W@1,W@2…W@n}来区别表示这n个不同语义;(2g)假设公理2:继承语义关系具有单向传递性,下层概念继承上层概念所具有语义关系;定理1.根据继承关系R<sub>D</sub>,所有名词构成一棵树;根据规则1‑7和定义4‑8,可以定义自然语言中词汇的语义;假设用一条有向线段来表示语义关系的话,根据定理1和词汇的定义和规则可知,词汇W的语义可以由名词树中的一组有向线段来表示;其中步骤(3)按如下过程执行:(3a)定义名词‑名词间的语义匹配关系:定义9——关联词汇集:名词定义式中所包含的所有词汇的集合,用C<sub>RW</sub>表示;在下文的分析中用∝为表示继承语义关系,W<sub>X</sub>∝W<sub>Y</sub>表示W<sub>X</sub>继承于W<sub>Y</sub>,并且规定W∝W;(1)基本语义匹配关系定义10——直接语义匹配关系:如果词汇W<sub>X</sub>、W<sub>Y</sub>满足下述条件,用符号W<sub>X</sub>/W<sub>Y</sub>表示:条件:假设W<sub>Y</sub>的关联词汇集是C<sub>WY</sub>,则<maths num="0011" id="cmaths0011"><math><![CDATA[<mrow><mo>&Exists;</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>&cap;</mo><mrow><mo>(</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>&Element;</mo><msub><mi>C</mi><mi>WY</mi></msub><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><msub><mi>W</mi><mi>X</mi></msub><mo>&Proportional;</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>)</mo></mrow><mo>.</mo></mrow>]]></math><img file="FDA0000654584220000071.GIF" wi="775" he="93" /></maths>当W<sub>X</sub>/W<sub>Y</sub>时,match(W<sub>X</sub>,W<sub>Y</sub>)=K<sub>T</sub>*d(W<sub>X</sub>,W<sub>Z</sub>);K<sub>T</sub>为匹配关系系数,根据所匹配的关系R的类型,设置为不同的常数,1≤K<sub>T</sub>≤3;定义11——继承语义匹配关系:如果词汇W<sub>X</sub>、W<sub>Y</sub>满足下述条件,用符号W<sub>X</sub>//W<sub>Y</sub>表示:条件:<maths num="0012" id="cmaths0012"><math><![CDATA[<mrow><mo>&Exists;</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>&cap;</mo><mrow><mo>(</mo><msub><mi>W</mi><mi>X</mi></msub><mo>&Proportional;</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><msub><mi>W</mi><mi>Y</mi></msub><mo>&Proportional;</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000072.GIF" wi="743" he="83" /></maths>当W<sub>X</sub>//W<sub>Y</sub>时,match(W<sub>X</sub>,W<sub>Y</sub>)=match(W<sub>X</sub>,W<sub>Z</sub>)+d(W<sub>Y</sub>,W<sub>Z</sub>);定义语义距离函数d(W<sub>X</sub>,W<sub>Y</sub>):表示具有继承关系的两个词汇W<sub>X</sub>,W<sub>Y</sub>之间的继承次数;(2)包含语义匹配关系定义12——显式语义包含关系:如果词汇W<sub>X</sub>、W<sub>Y</sub>满足下述条件,用符号W<sub>X</sub>⊙W<sub>Y</sub>表示;条件:存在概念W<sub>Z</sub>,满足条件<maths num="0013" id="cmaths0013"><math><![CDATA[<mrow><mo>&Exists;</mo><msub><mi>W</mi><mi>Z</mi></msub><mrow><mo>(</mo><msub><mi>R</mi><mi>W</mi></msub><mrow><mo>(</mo><msub><mi>W</mi><mi>Y</mi></msub><mo>,</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><msub><mi>W</mi><mi>Y</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><msub><mi>W</mi><mi>X</mi></msub><mo>&Proportional;</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000073.GIF" wi="1073" he="88" /></maths>当W<sub>X</sub>⊙W<sub>Y</sub>时,有match(W<sub>X</sub>,W<sub>Y</sub>)=K<sub>P</sub>*(d(W<sub>X</sub>,W<sub>Z</sub>),K<sub>P</sub>为包含匹配关系系数;定义13——隐含语义包含关系:如果词汇W<sub>X</sub>、W<sub>Y</sub>满足下述条件,用符号W<sub>X</sub>○W<sub>Y</sub>表示;条件:存在概念W<sub>Z</sub>,满足条件<maths num="0014" id="cmaths0014"><math><![CDATA[<mrow><mo>&Exists;</mo><msub><mi>W</mi><mi>Z</mi></msub><mrow><mo>(</mo><msub><mi>R</mi><mi>P</mi></msub><mrow><mo>(</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>,</mo><msub><mi>W</mi><mi>X</mi></msub><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><msub><mi>W</mi><mi>X</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><msub><mi>W</mi><mi>Z</mi></msub><mo>&Proportional;</mo><msub><mi>W</mi><mi>Y</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000654584220000081.GIF" wi="1088" he="83" /></maths>当W<sub>X</sub>оW<sub>Y</sub>时,match(W<sub>X</sub>,W<sub>Y</sub>)=K<sub>P</sub>*(d(W<sub>Z</sub>,W<sub>Y</sub>));定义14——包含语义匹配关系:如果词汇W<sub>X</sub>、W<sub>Y</sub>满足下述条件,用符号W<sub>X</sub>◎W<sub>Y</sub>表示:条件:<img file="FDA0000654584220000082.GIF" wi="1398" he="95" />当W<sub>X</sub>◎W<sub>Y</sub>时,match(W<sub>X</sub>,W<sub>Y</sub>)=min{match(W<sub>X</sub>,W<sub>Z</sub>)+match(W<sub>Z</sub>,W<sub>Y</sub>),match(W<sub>X</sub>,W<sub>Y</sub>)}定理3:当词汇WX、WY满足WX◎WY时,WY具有WX的语义关系;(3b)名词‑动词间的语义匹配关系名词‑动词的语义匹配关系可以分为两类:1)SVO语义匹配关系:名词可能作施动者或动作的承受者2)格语义匹配关系:名词与动词具有格语义匹配关系假设动词为V,V的定义中的施动名词为S<sub>0</sub>,受动名词为O<sub>0</sub>;由于在定义时已经将S<sub>0</sub>设置为可能实施V的最高层名词,O<sub>0</sub>设置为承受该动作的最高层名词,所以只有同S<sub>0</sub>或O<sub>0</sub>具有某种关系的名词S和名词O才有可能执行动作V,即构成SVO的语义匹配;SVO语义匹配有6种情况,其值可用Value<sub>SVO</sub>表示,计算公式如下:Value<sub>SVO</sub>=match(S,S<sub>0</sub>)+match(O,O<sub>0</sub>)定义15——常规SVO语义匹配关系:满足条件(S∝S<sub>0</sub>)∩(O∝O<sub>0</sub>);定义16——重载SVO语义匹配关系:满足条件:<maths num="0015" id="cmaths0015"><math><![CDATA[<mrow><mrow><mo>(</mo><mrow><mo>(</mo><msub><mrow><mi>S</mi><mo>&Proportional;</mo><mi>S</mi></mrow><mn>0</mn></msub><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><mo>&Exists;</mo><msub><mi>R</mi><mi>VO</mi></msub><mrow><mo>(</mo><msub><mi>R</mi><mi>VO</mi></msub><mrow><mo>(</mo><mi>V</mi><mo>,</mo><mi>M</mi><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><mi>S</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><mi>O</mi><mo>&Proportional;</mo><mi>W</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>&cup;</mo><mrow><mo>(</mo><mrow><mo>(</mo><mi>O</mi><mo>&Proportional;</mo><msub><mi>O</mi><mn>0</mn></msub></mrow></mrow><mo>)</mo></mrow><mo>&cap;</mo></mrow>]]></math><img file="FDA0000654584220000091.GIF" wi="1544" he="100" /></maths><maths num="0016" id="cmaths0016"><math><![CDATA[<mrow><mo>(</mo><mo>&Exists;</mo><msub><mi>R</mi><mi>VS</mi></msub><mrow><mo>(</mo><msub><mi>R</mi><mi>VS</mi></msub><mrow><mo>(</mo><mi>V</mi><mo>,</mo><mi>M</mi><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><mi>O</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><mi>S</mi><mo>&Proportional;</mo><mi>W</mi><mo>)</mo></mrow><mo>)</mo></mrow>]]></math><img file="FDA0000654584220000092.GIF" wi="950" he="83" /></maths>对于名词S和O以及动词V,当V的定义中不满足SVO匹配时,S、O的定义说明它们满足SVO匹配;定义17——包含SVO语义匹配关系:定义18——相似SVO语义匹配关系:定义19——比喻SVO语义匹配关系:在下述条件下,猜测语句中可能存在比喻:条件1:在整个语句中没有任何名词可以满足常规SVO语义匹配关系、重载SVO语义匹配关系、包含SVO语义匹配关系、相似SVO语义匹配关系;条件2:语句中存在名词S或O,满足!(S∝S<sub>0</sub>)∩(O∝O<sub>0</sub>),猜测将S比喻为S<sub>0</sub>;或条件3:语句中存在名词S或O,满足(S∝S<sub>0</sub>)∩!(O∝O<sub>0</sub>),猜测将O比喻为O<sub>0</sub>;对于比喻SVO语义匹配关系,Value<sub>SVO</sub>=K<sub>F</sub>*(match(S,W<sub>P</sub>)+match(O,W<sub>P</sub>))K<sub>F</sub>为权值系数,W<sub>P</sub>是S和S<sub>0</sub>的最近共同祖先;定义20——格语义匹配关系:对于名词W和动词V,满足<img file="FDA0000654584220000093.GIF" wi="244" he="65" /><img file="FDA0000654584220000101.GIF" wi="577" he="82" />match(W,V)=K<sub>C</sub>*d(W,W<sub>C</sub>),K<sub>C</sub>为权值系数;(3c)名词‑形容词的语义匹配关系对于形容词W<sub>VA</sub>和名词W<sub>N</sub>,满足<maths num="0017" id="cmaths0017"><math><![CDATA[<mrow><mo>&Exists;</mo><mi>W</mi><mrow><mo>(</mo><mrow><mo>(</mo><msub><mi>R</mi><mi>AS</mi></msub><mrow><mo>(</mo><mi>W</mi><mo>,</mo><msub><mi>W</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>&cup;</mo><msub><mi>R</mi><mi>AP</mi></msub><mrow><mo>(</mo><mi>W</mi><mo>,</mo><msub><mi>W</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>&Subset;</mo><mi>Def</mi><mrow><mo>(</mo><msub><mi>W</mi><mi>VA</mi></msub><mo>)</mo></mrow><mo>&cap;</mo><mrow><mo>(</mo><msub><mi>W</mi><mi>N</mi></msub><mo>&Proportional;</mo><mi>W</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000654584220000102.GIF" wi="1438" he="88" /></maths>match(W<sub>VA</sub>,W<sub>N</sub>)=K<sub>A</sub>*d(W<sub>N</sub>,W),K<sub>A</sub>=1,为权值系数;(3d)并列语义匹配关系并列语义匹配关系仅用于语句中并列结构的判断,以确定连词的辖域;定义21——语义相似:由于名词定义采用了单继承的方法,两个名词W<sub>X</sub>、W<sub>Y</sub>虽然在定义式中没有继承关系,但在语义上W<sub>X</sub>却可能是W<sub>Y</sub>的一种,相当于描述逻辑中的概念蕴含,用符号W<sub>X</sub>∽W<sub>Y</sub>表示;可对描述逻辑中的Tableau算法加以改进,以判断概念语义相似关系;定义22——名词并列语义匹配关系:对于两个名词W<sub>X</sub>,W<sub>Y</sub>可用match(W<sub>X</sub>,W<sub>Y</sub>)=K<sub>T</sub>*(d(W<sub>X</sub>,W<sub>E</sub>)+d(W<sub>Y</sub>,W<sub>E</sub>))计算出一个数值,作为启发信息,W<sub>E</sub>是W<sub>X</sub>、W<sub>Y</sub>的距离最近的共同祖先节点;当满足W<sub>X</sub>∽W<sub>Y</sub>时,语句中的W<sub>X</sub>与W<sub>Y</sub>可能是并列关系;定义23——动词并列语义匹配关系:对于两个动词V<sub>X</sub>,V<sub>Y</sub>可用match(W<sub>X</sub>,W<sub>Y</sub>)=K<sub>T</sub>*(d(S<sub>X0</sub>,S<sub>Y0</sub>)+d(O<sub>X0</sub>,O<sub>Y0</sub>))计算出—个数值,作为启发信息,{S<sub>X0</sub>,S<sub>Y0</sub>,O<sub>X0</sub>,O<sub>Y0</sub>}是W<sub>X</sub>,W<sub>Y</sub>定义中的施动者和受动者;(3e)其它类词汇间的语义匹配关系副词的语义匹配关系:假设副词可以语义匹配于动词、形容词和副词,规定match(W<sub>1</sub>,W<sub>2</sub>)=0;量词的语义匹配关系:词汇库应保存量词与名词的关联关系;假如量词W可以修饰名词W<sub>N</sub>,则规定match(W,W<sub>N</sub>)=0;否则match(W,W<sub>N</sub>)=MAX;代词的语义匹配关系:根据代词的指代关系,将代词替换成相应的名词进行处理;(3f)语法匹配关系在具体的语句中,某些类型的词汇互相修饰,但词汇本身之间并没有内在的语义关系,只是在本语句内可能有语义修饰关系的一种语法现象,即语法上的修饰关系,包括以下情况:(1)不常见的词类间修饰关系:动词‑动词之间;副词‑名词之间;形容词‑动词之间;这些都属于语法匹配关系,词汇本身之间没有内在的语义匹配关系,只是在语句中具有语法上的修饰关系而已;在语句分析过程中其语义匹配值可用match(W<sub>X</sub>,W<sub>Y</sub>)=MAX/K<sub>G</sub>计算,K<sub>G</sub>是类型权值,K<sub>G</sub><1.5;其中步骤(4)按如下过程执行:(4a)定义语义结构的三个层次及其文法要根据本文的语义模型进行语句分析,必须具有适合语义模型的语句抽象表示方法;任何语句都是由结构比较简单的语句经过迭代而形成的,短语被看成语句内的一个组成部分;为了满足语义模型的语义分析需要,根据语义结构的复杂程度和特点可以将语句的语义结构划分为三个层次:简单句、特殊简单句、复杂句;定义24——简单句:仅有一个动词或形容词作谓语的语句C<sub>S</sub>,可用文法G<sub>1</sub>来抽象描述;用格语法的思想设计文法G<sub>1</sub>,设计思路:假设V是谓语,S是V的施动者;O是V的承受者,A<sub>B</sub>是前置定语;A<sub>A</sub>是后置定语;P<sub>D</sub>是状语或补语,相当于格语法中的一组格;P<sub>C</sub>是一个的格内容;n是名词;N<sub>P</sub>为名词短语;文法G<sub>1</sub>中的规则数目不少于两个,其关键规则的设计思路如下:1)C<sub>S</sub>→P<sub>D</sub>A<sub>B</sub>SA<sub>A</sub>P<sub>D</sub>VP<sub>D</sub>A<sub>B</sub>OA<sub>A</sub>P<sub>D</sub>2)S→n|SA<sub>A</sub>A<sub>B</sub>S3)P<sub>D</sub>→P<sub>C</sub>|P<sub>D</sub>P<sub>C</sub>S、O、A<sub>B</sub>、A<sub>A</sub>、P<sub>C</sub>中的介词、连词、助词、数词、量词的使用规则可以很容易的写出来;简单句中的SVO总共具有6种不同顺序:SVO、SOV、VSO、OSV、VOS、OVS;SV、VS;简单句中有时会省略掉S或O,共有4种不同顺序:SV、VS、OV、VO;当不及物动词或形容词作谓语时,该形容词表示为V,具有2种不同顺序:SV、VS;总共具有10种顺序;文法的G1的具体表示方式如下:<img file="FDA0000654584220000121.GIF" wi="1801" he="758" /><img file="FDA0000654584220000131.GIF" wi="1800" he="1341" />定义25——特殊简单句:具有多个动词或形容词,但在语义上不包含从句的语句,可用文法G<sub>2</sub>来抽象描述;文法G<sub>2</sub>的设计思路:在保证不会产生从句的基础上,向文法G<sub>1</sub>中添加不多的规则即可生成文法G<sub>2</sub>,主要有以下2种情况:1)多个动词或形容词作谓语的情况2)动词或形容词作S、O、A<sub>B</sub>、A<sub>A</sub>、P<sub>C</sub>的情况文法G<sub>2</sub>的关键是动词短语V<sub>V</sub>前后不能直接跟名词短语N<sub>P</sub>,即不能出现N<sub>P</sub>+V<sub>V</sub>或V<sub>V</sub>+N<sub>P</sub>;文法的G2的具体表示方式如下:<img file="FDA0000654584220000132.GIF" wi="1723" he="488" /><img file="FDA0000654584220000141.GIF" wi="1722" he="1026" />定义26——复杂句:在文法G<sub>2</sub>中添加规则N<sub>P</sub>→C<sub>S</sub>,形成文法G<sub>3</sub>;因为规则N<sub>P</sub>→C<sub>S</sub>说明一个简单句或特殊简单句可以作一个复杂句中任意成分,实现了对简单句递归,因此文法G<sub>3</sub>可以描述复杂句;(4b)获取最佳语法分析方案的思路(1)词汇歧义消解方法假设W<sub>1</sub>W<sub>2</sub>...W<sub>k</sub>的词汇语义个数分别为n<sub>1</sub>,n<sub>2</sub>...n<sub>k</sub>,针对每个语义进行全排列,结果为{L<sub>1</sub>,L<sub>2</sub>...L<sub>M</sub>},则M=n<sub>1*</sub>n<sub>2*</sub>...<sub>*</sub>n<sub>k</sub>,假设其中一个的<img file="FDA0000654584220000142.GIF" wi="415" he="81" /><img file="FDA0000654584220000143.GIF" wi="79" he="75" />是W<sub>m</sub>的第n个词义,则L<sub>i</sub>是C<sub>S</sub>的一个无词汇歧义的词汇序列;在语法分析过程中穷举每个{L<sub>1</sub>,L<sub>2</sub>...L<sub>M</sub>}的分析结果,选择最佳的L<sub>i</sub>就可以消解词汇歧义;(2)分析思路根据公理1,获得所有的语法分析方案,针对每个语法分析方案A<sub>i</sub>,根据公式1计算出A<sub>i</sub>所对应的语义匹配值,并选择出最佳的语法分析方案;定义27——简单子句:语句中满足文法G<sub>1</sub>或G<sub>2</sub>的子串是简单子句;假设公理4——语义修饰目标公理:假设实词W的语义修饰目标是W<sub>Gi</sub>,则对于语句中的符合语义逻辑的简单子句C<sub>S</sub>,满足(W∈C<sub>S</sub>)→(W<sub>Gi</sub>∈C<sub>S</sub>);对于定语A<sub>B</sub>,满足(W∈A<sub>B</sub>)→(W<sub>Gi</sub>∈(A<sub>B</sub>∪S));对于状语或补语(P<sub>D</sub>),满足(W∈P<sub>D</sub>)→(W<sub>Gi</sub>∈(P<sub>D</sub>∪V));依据语义语义修饰目标的特点,所有的语法分析方案可分为2层:1)简单子句级语法分析方案;2)简单子句内部的语法分析方案;(4c)获取最佳的语法分析方案(1)可归结简单子句的判断条件针对语句C<sub>S</sub>,进行文法G<sub>1</sub>、G<sub>2</sub>、G<sub>3</sub>的CYK算法分析,满足表1中条件的子串s(i,j)是可归结的简单子句;表1 可归结简单子句的判断条件<img file="FDA0000654584220000151.GIF" wi="1867" he="1045" /><img file="FDA0000654584220000161.GIF" wi="1865" he="341" />(2)自底向上的简单子句归结法可用自底向上的简单子句归结法求取最佳的从句级语法分析方案,见算法4:算法1——简单子句归结法:1)针对语句C<sub>S</sub>,根据表1的判断条件,找出可归结简单子句所对应的子串集合{s<sub>1</sub>,s<sub>2</sub>...s<sub>m</sub>};2)针对每个子句s<sub>i</sub>,用算法2计算出简单子句s<sub>i</sub>的最佳语义匹配值,将s<sub>i</sub>归结为N<sub>P</sub>,设置N<sub>P</sub>的归结语义;3)令C<sub>S</sub>等于归结结果,将递归过程中的简单子句s<sub>i</sub>的最佳语义匹配值求和,进行步骤1‑3的递归;4)具有最佳全句语义匹配值所对应的简单子句s<sub>i</sub>的范围和归结顺序即为最佳的语法分析方案;计算简单子句的最佳语义匹配值是算法2;在算法中,在简单子句选择时采用了穷举法,可以求出理论上的最佳语法分析方案;但这种方法的计算量较大,不易实现;当可归子句数量过多时,可仅选择k个语义匹配程度较好的简单子句进行递归搜索,其中k<m,以求取次优语法分析方案;(3)归结语义在算法1中,将简单子句C<sub>S</sub>归结为N<sub>P</sub>后,N<sub>P</sub>没有语义,无法进行下一步的语义匹配计算,解决的方式如下:1)规定由归结而来N<sub>P</sub>可匹配于任何词汇W,语义匹配值为:match(N<sub>P</sub>,W)=MAX/K<sub>C</sub>,其中K<sub>C</sub>>12)假如N<sub>P</sub>作新的目标子句的S或O,则可将N<sub>P</sub>的语义设置为原C<sub>S</sub>中的S或O;(4d)获取简单子句的最佳语义匹配值要计算出简单子句的最佳语义匹配值,根据公理1和公理4,简单子句内部有多种语法分析方案,必须求出所有的语法分析方案,针对每种语法分析方案,其实词的语义修饰目标是确定的,就可根据公式1计算得到该语法分析方案下的语义匹配值,具有最小语义匹配值的语法分析方案就是所需的分析结果;简单子句内部的语法分析方案可分为3层:1)SVO组合层次;2)A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>层次;3)A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>内部的语法分析方案;可通过算法2选择出其中最佳的语法分析方案;算法2——简单子句的最佳语义匹配值:1)假如简单子句是特殊简单句,找到所有的将其归结为简单句的方法2)针对每种归结方法,将特殊简单句归结为简单句3)针对该简单句,找出所有可能的SVO组合方法4)针对每种SVO组合方法,将C<sub>S</sub>分段为{L<sub>1</sub>,L<sub>2</sub>..L<sub>n</sub>};如果S或O为短语,则进行算法35)每个分段L<sub>i</sub>内最多可包含A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>三部分内容,找出L<sub>i</sub>中的所有A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>划分方法6)针对每种A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>划分方法,通过语法和语义匹配分析相结合的手段,确定每个实词的语义修饰目标,使A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>的语义匹配值最小7)求取全句的语义匹配值,选择语义匹配值最小所对应的分析过程作为最佳的语法分析方案假设<img file="FDA0000654584220000181.GIF" wi="56" he="70" />是针对简单子句C<sub>S</sub>进行文法G<sub>1</sub>的CYK算法的运算结果,表示能生成子串s(i,j)的文法符号集;(1)SVO组合层次的语法分析方案在简单句中,假设名词W<sub>1</sub>和W<sub>2</sub>与动词V满足SVO匹配,则{W<sub>1</sub>,V,W<sub>2</sub>}是一个SVO组合,但S或O可能是一个短语,当句中存在{W<sub>1</sub>,V,W<sub>3</sub>}和{W<sub>2</sub>,V,W<sub>3</sub>}SVO匹配,且V,W<sub>3</sub>不在W<sub>1</sub>和W<sub>2</sub>中间,且W<sub>1</sub>和W<sub>2</sub>中间的子串s(m,n)满足:<img file="FDA0000654584220000182.GIF" wi="597" he="79" />时,在W<sub>1</sub>+s(m,n)+W<sub>3</sub>所组成的短语是S,同理可以获得更长的S或O;算法3——S或O分段:1)获得短语S或O,找出S中满足SVO匹配的所有名词,假设为{n<sub>1</sub>,n<sub>2</sub>..n<sub>m</sub>}2)根据{n<sub>1</sub>,n<sub>2</sub>..n<sub>m</sub>}将短语S分为m‑1段,根据规则S→n|SA<sub>A</sub>A<sub>B</sub>S可知每个不为空的分段可能包含A<sub>A</sub>A<sub>B</sub>(2)A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>层次的划分方法假设分段L<sub>i</sub>的子串为s(m,n),则满足<img file="FDA0000654584220000191.GIF" wi="748" he="95" />的p,q是符合语法的A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>划分方法,分段结果为:A<sub>A</sub>=s(m,p),P<sub>D</sub>=s(p,q)A<sub>B</sub>=s(q,n);(3)A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>内部的最佳语法分析方案定理2:A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>内部最佳语法分析方案是当A<sub>A</sub>、P<sub>D</sub>、A<sub>B</sub>内的每个实词都具有最佳语义修饰目标情况下所对应的语法分析方案;定义28——简单名词短语:不包含动词和形容词的名词短语就是简单名词短语;定理3:简单句的定语A<sub>A</sub>或A<sub>B</sub>的最佳语法分析方案等价于一个简单名词短语的最佳语法分析方案;证明:由于简单句仅包含一个动词或形容词作谓语V,因此A<sub>A</sub>、A<sub>B</sub>中不包含动词和形容词,根据公理4,A<sub>A</sub>、A<sub>B</sub>的语法分析方案等价于简单名词短语N<sub>P</sub>的语法分析方案,N<sub>P</sub>∈{(A<sub>B</sub>+S),(A<sub>A</sub>+S),(A<sub>B</sub>+O),(A<sub>A</sub>+O)};简单名词短语N<sub>P</sub>的不同语法分析方案仅受连词、介词、助词、量词的影响;语法分析的关键是选定连词、介词、助词、量词的辖域和它们的归结顺序;A、辖域的确定:在连词、介词、助词、量词中,假设w<sub>B</sub>为前置类型的,w<sub>M</sub>为前置类型的,则其辖域可归结为两种形式1)..N<sub>Bn</sub>..N<sub>B1</sub>...w<sub>M</sub>..N<sub>A1</sub>..N<sub>Am</sub>..;2)w<sub>B</sub>..N<sub>Bn</sub>..N<sub>B1</sub>...w<sub>M</sub>..N<sub>A1</sub>..N<sub>Am</sub>...;其中{N<sub>B1</sub>,N<sub>B2</sub>...N<sub>Bn</sub>}是辖域内前半部分的名词,{N<sub>A1</sub>,N<sub>A2</sub>...N<sub>Am</sub>}是辖域内后半部分的名词;根据汉语的后向语义修饰习惯,可在{N<sub>A1</sub>,N<sub>A2</sub>...N<sub>Am</sub>}中找出符合语法的与N<sub>B1</sub>具有最佳语义匹配值的名词N<sub>Aj</sub>作为辖域后界;形式1的辖域前界可用类似的方法确定;(2)归结顺序的确定:连词、介词、助词、量词及其辖域应可按某条文法规则归结,可用穷举法求出它们的最佳归结顺序;一般情况下,简单句语句进行了多次分段后,A<sub>A</sub>、A<sub>B</sub>中包含的{连词/介词/助词/量词}的数目n一般小于4,具有计算可行性;定义29‑名词序列:不存在连词、介词、助词、量词的简单名词短语是名词序列;当连词、介词、助词、量词都归结后,简单名词短语就被成为了一个名词序列,另外连词、介词、助词、量词辖域内部可能也存在一个或两个名词序列;在名词序列中仅仅名词影响语义修饰关系,根据汉语的后向语义修饰习惯,假设名词序列为L<sub>N</sub>=W<sub>1</sub>W<sub>2</sub>...W<sub>m</sub>;则通过语义确定L<sub>N</sub>中任意名词修饰目标具体方法如下:算法4——名词序列的最佳语义修饰目标:设置集合C<sub>W</sub>为空,对于L<sub>N</sub>中的每一个名词W<sub>i</sub>,假如match(W<sub>i</sub>,W<sub>m</sub>)<MAX,将W<sub>i</sub>添加进C<sub>W</sub>,作如下操作:1)假设C<sub>W</sub>的元素按先后的顺序为W<sub>1</sub>‑W<sub>2</sub>‑...‑W<sub>n</sub>,则做如下操作:将L<sub>N</sub>分成n+1段,设置它们的语义修饰目标为W<sub>m</sub>,并对每一段进行递归;2)当C<sub>W</sub>中只有一个名词时,进行步骤3)和步骤4);3)设置前向修饰关系:针对任意分段,假如存在W<sub>x</sub>W<sub>x+1</sub>...W<sub>y‑1</sub>W<sub>y</sub>,满足条件:①任意W<sub>x+1</sub>...W<sub>y</sub>之间的名词与W<sub>y</sub>后的名词的语义匹配值为MAX;②match(W<sub>y</sub>,W<sub>x</sub>)<MAX;则设置W<sub>y</sub>的语义修饰目标为W<sub>x</sub>;则设置W<sub>x+1</sub>...W<sub>y‑1</sub>之间的名词的修饰目标W<sub>y</sub>;4)假如L<sub>N</sub>中还有名词W<sub>y</sub>没有修饰目标,则设置其修饰目标为W<sub>y+1</sub>;P<sub>D</sub>的分析方法类似于A<sub>A</sub>、A<sub>B</sub>,关键是根据介词进行界限划分,将介词辖域内的内容也转化为一个简单名词短语;由于较为繁琐,这里不详细论述;(4)特殊简单句的处理方法归结所有的非谓语动词/形容词,将语句转化为简单句,选择最佳的归结方案;处理方法如下:1)对语句进行文法G2的CYK算法,找到所有可能做谓语的动词或形容词短语,可能具有多种方案;2)针对每一种方案,归结其余的动词或形容词,选取语义匹配值最小的分析方案;归结非谓语动词或形容词时也需要设置归结语义,其中步骤(5)按如下过程执行:根据具有最佳语义匹配值的语法分析结果,将简单句转化为一个知识点,将复杂句的每个简单子句转化为知识点,整个复杂句转化为一组知识点;将语句转化为以结构化数据形式存放的知识点后,对这些知识数据进行各种智能信息处理。
地址 455002 河南省安阳市安阳开发区弦歌大道东段安阳师范学院计算机与信息工程学院