摘要 |
【課題】より確実に画像から文字領域を抽出すること。【解決手段】一実施形態に係る画像処理装置は第1抽出部、第2抽出部、および特定部を備える。第1抽出部は、画像に対してストローク幅変換を実行することでSWT領域を該画像から抽出する。SWT領域は、エッジが連続しかつストローク幅が設定の範囲内である領域である。第2抽出部は、画像に対して画素値に基づくクラスタリングを実行することで単色領域を該画像から抽出する。単色領域は、画素値が設定の範囲内でありかつ連続して存在する複数の画素で構成される領域である。特定部は、単色領域の画素数に対する、SWT領域および単色領域の重複部分の画素数の割合が第1の基準値以上または該第1の基準値より大きい場合に、少なくとも該単色領域に基づいて、文字領域候補に含まれる画素群を特定する。【選択図】図3 |