考察：「画像認識は超並行処理で」

by ご近所のきよきよ

　パターン認識を考え始めて何年になるでしょうか。１９８５年ころシンボル認識に挑戦したことがありますから、もう２５年ですか。この６年間もパターン認識は考えていたのです。そんなですが、どうもなんか上手くいかない。超並列処理でやれたら良いなとは考えることはあったのですが、どうも踏ん切れない。今のパソコンはシングルＣＰＵが主流（２コアもある）ですから、それで動かすにはそれなりの制約が有るわけです。で、なんとしてもシングルＣＰＵで実現するアルゴリズムをと考えてきたわけです。

　しかし、この２００９年の２月末のこと、超並列を想定して画像認識を実現していく方法が最も素直な技術になるのではないかと悟るに至りました。つまり、人物、顔、犬、家、山などオブジェクト毎に解析スレッドを割り当てるのです。そうして、一つの認識対象を平行してオブジェクトスレッド群に一気に認識していく。結果は弛緩法で纏めていって、最も確信度の高いオブジェクトを入力画像と判断する。　この技術では、少しずつ認識対象オブジェクトを増やしていけるようにするのです。認識対象オブジェクトを解析するＣＰＵとデータを必要に応じて、画像認識システムに差し込めば画像認識システムはそのオブジェクトを認識できるようになる・・・というような技術を打ち立てればいいのではないか。将来は、ＣＰＵとメモリセットを多数プールしていて、学習によって認識オブジェクトデータを作っていけるようにする。それがパターン認識の完成形ではないかそう思うに至ったのです。

　画像認識の第一ステップは領域でその次に線分の認識が来るでしょう。線の間の関係属性として、次のものがあります。

交差
断点を超えての接続
対向
束（複数の線が纏まって１本の線のようになる）

　こうしたものは、線分群が構成するオブジェクトによって意味が決定されていくものでしょう。大局的な画像の認識と線分の属性という局所的な認識とが相互に調整しあうわけですから弛緩法を用いて解析していくことになります。

線分群の束としての認識と個別線分としての認識の相克
２つの線分の分離化と接続化との相克
公差線の分離と統一的認識との相克
対向線間を領域として認識する、しない。

　弛緩法はオブジェクト認識とオブジェクト間関係としての認識の両方で行われます。

　このように弛緩法は線分を基盤に行われるものですから、２線分の関係と線分グループの属性との両方を管理していくことで実現出来ます。線分にl1,l2・・・と名前をつけて、テーブルで解析途中経過の情報を管理していくといいでしょう。２線分間の関係は２線分の名前を持って２次元マップシステムで管理できますし、線分グループは線分選択テーブルとそれに解析結果を設定できるマップシステムを用意すれば管理ができます。

おわり