摘要 |
本发明公开了一种基于似然比估计的英语双关语识别方法,包括:步骤1:通过软件读取需识别的英语句子;步骤2:提取步骤1中句子的双关词语和所有实词,分别记为h和w<sub>m</sub>,m=1,2,...,M,其中双关词语h包含的两层含义分别记为I<sub>1</sub>和I<sub>2</sub>;步骤3:统计各个实词w<sub>m</sub>,m=1,2,...,M与双关词语含义I<sub>i</sub>,i=1,2之间的关联程度,其值记为R(w<sub>m</sub>,I<sub>i</sub>),所述R(w<sub>m</sub>,I<sub>i</sub>)的值事先通过调查问卷的方式进行统计得出;步骤4:利用步骤3中获得的R(w<sub>m</sub>,I<sub>i</sub>),构造似然比λ(I);步骤5:根据λ(I)的计算结果判断句子是否存在双关含义,当λ(I)的值接近于0时,判定该句子有双关含义,否则判定改句子没有双关含义。本发明提出了一种能准确量化语句歧义性并识别双关语的概率计算方法,解决了传统方法无法准确定量分析双关含义的缺陷。 |
主权项 |
一种基于似然比估计的英语双关语识别方法,其特征在于,包括如下步骤:步骤1:通过软件读取需识别的英语句子;步骤2:提取步骤1中句子的双关词语和所有实词,分别记为h和w<sub>m</sub>,m=1,2,...,M,其中双关词语h包含的两层含义分别记为I<sub>1</sub>和I<sub>2</sub>;步骤3:统计各个实词w<sub>m</sub>,m=1,2,...,M与双关词语含义I<sub>i</sub>,i=1,2之间的关联程度,其值记为R(w<sub>m</sub>,I<sub>i</sub>);步骤4:利用步骤3中获得的R(w<sub>m</sub>,I<sub>i</sub>),构造似然比λ(I);步骤5:根据λ(I)的计算结果判断句子是否存在双关含义。 |