摘要 |
【課題】各話題に応じた言語モデルをコンパクトに構築して、音声認識システムの負荷を減らすことができ、リアルタイムでの音声認識を可能とする言語モデル適応装置を提供する。【解決手段】複数の話題を含むテキストデータを用いてN−gram言語モデルである一般言語モデルを構築する一般言語モデル構築部と、話題指定情報に基づいてテキストデータ内の文書を指定し、指定された文書の中に出現する各単語の話題別単語出現確率を計算する話題別単語出現確率計算部と、話題別単語出現確率と、一般言語モデルに格納される各単語の一般単語出現確率に基づいて、話題補正情報を各単語について生成する話題補正情報生成部と、一般言語モデルの各N−gram確率において、N番目の単語に対応する話題補正情報をを元のN−gram確率に乗算して計算した確率の集合を話題適応言語モデルとして出力する言語モデル補正部を含む。【選択図】図1 |