发明名称 |
一种自动识别同义术语的方法 |
摘要 |
本发明涉及一种自动识别同义术语的方法,其特征在于,包括以下步骤:提供一同义术语列表;判断待识别的两个术语是否为所述同义术语列表中所列出的同义术语;若不是则将所述两个术语分别进行原子词切分为对应的原子词串;判断所述两个术语对应的原子词串是否为所述同义术语列表中所列出的同义术语;若不是则判断所述两个术语对应的子串序列是否为所述同义术语列表中所列出的同义术语;若是则判定所述两个术语为同义术语;若不是则判定所述两个术语为非同义术语。本发明能够更高效地发现同义的术语,解决了同义现象层出不穷而人工无法及时发现的问题,从而简化语言学专家和领域专家的手工工作。 |
申请公布号 |
CN103218409A |
申请公布日期 |
2013.07.24 |
申请号 |
CN201310095526.8 |
申请日期 |
2013.03.25 |
申请人 |
福州大学 |
发明人 |
于娟 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
福州元创专利商标代理有限公司 35100 |
代理人 |
蔡学俊 |
主权项 |
一种自动识别同义术语的方法,其特征在于,包括以下步骤:S01:提供一同义术语列表;S02:判断待识别的两个术语是否为所述同义术语列表中所列出的同义术语;若是则进入步骤S06,若不是则进入步骤S03;S03:将所述两个术语分别进行原子词切分为对应的原子词串;S04:判断所述两个术语对应的原子词串是否为所述同义术语列表中所列出的同义术语;若是则进入步骤S06,若不是则进入步骤S05;S05:判断所述两个术语对应的子串序列是否为所述同义术语列表中所列出的同义术语;若是则进入步骤S06,若不是则进入步骤S07;S06:判定所述两个术语为同义术语;S07:判定所述两个术语为非同义术语。 |
地址 |
350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区 |