摘要 |
情報システム構築に関する提案書や仕様書等といった、特定の案件に関する文書群でのみ成り立つ同義語のある文書の曖昧さを改善するために、同義語抽出システムは、情報システム構築に関する提案書や仕様書等といった、特定の案件に関する文書群でのみ成り立つ同義語のある文書から、誤検出されやすい「単語+定型文」というパターンに用いられる単語組合せの類似度を下げ、特定の案件に関する文書群でのみ成り立つ同義語を高精度で抽出する。同義語抽出システムは、文書入力部と、単語分析部と、表記文脈類似度算出部と、概念データベースと、概念文脈類似度算出部と、同義語候補推定部と、同義語候補出力部と、を備える。 |