摘要 |
【課題】語彙数に対する文書数が不足する場合であっても、適切な類似度学を行う。【解決手段】トピックモデルによる分析手法を利用して、求人情報とレジュメ情報との間の類似度学を行う。特徴抽出部330は、求人票データベースDB310に登録されている求人情報及びレジュメデータベースDB320に登録されているレジュメ情報について、トピックモデルを用いて分析することにより、求人情報及びレジュメ情報を構成する文書から抽出した語彙(キーワード)をトピックごとにまとめる一方、類似度学部360は、トピック単位での類似度学を行う。【選択図】図2 |