考察:「画像・文字認識の構想」

by ご近所のきよきよ



 シンボル認識、文字認識(雫プロジェクト)、画像認識(若葉プロジェクト)と研究を進めてきて、そろそろイメージ認識を完成のレベルまで持っていく時期にきたと感じるこの頃です。自然言語処理とか知識ベースシステムの開発とかで、大分、技能が向上してきたと思うのです。技術の持ち駒はかなり厚くなってきている今が、イメージ認識に賭ける好機なのではないでしょうか。


 イメージ認識の手順は、次のようなものでしょう。

(1) 基本特徴を検出する。

(2) 基本特徴の組み合わせによって、認識結果を連想によって想定する。

(3) 想定によってイメージを更に詳細に解析する。

(4) もっともらしい認識記号によって認識結果を終了する。


 基本特徴は、次のものでしょう。

(1) 端点

(2) 分岐点

(3) わん曲点

(4) 孤立点

(5) 線分の向き(水平、垂直、ななめ)

(6) 線分の交差(分岐点の周りの状況)

(7) 線分の属性(曲率と長さ)

(8) 線分の分布

(9) 領域の分布


 イメージの解析は曖昧性の大きいプロセスです。仮定と結果の組み合わせを試行錯誤で実施します。弛緩法がキーとなる技術です。仮定して、その結果が良好ならば認識結果として選定していく。そんな過程になります。


 こうした解析情報を各ピクセル毎に持つと巨大なデータとなる。メモリ不足になるので、永続化していくことが必要である。知識ベースを2次元マップ機構に対応させる必要があるが、行列のアドレスをキーにする情報レコードを持てるようにするだけだから、RDBベースでは知識ベースの拡張は微々たるものになる。

 
 
 

おわり