考察:「画像認識は超並行処理で」

by ご近所のきよきよ


 

 パターン認識を考え始めて何年になるでしょうか。1985年ころシンボル認識に挑戦したことがありますから、もう25年ですか。この6年間もパターン認識は考えていたのです。そんなですが、どうもなんか上手くいかない。超並列処理でやれたら良いなとは考えることはあったのですが、どうも踏ん切れない。今のパソコンはシングルCPUが主流(2コアもある)ですから、それで動かすにはそれなりの制約が有るわけです。で、なんとしてもシングルCPUで実現するアルゴリズムをと考えてきたわけです。


 しかし、この2009年の2月末のこと、超並列を想定して画像認識を実現していく方法が最も素直な技術になるのではないかと悟るに至りました。つまり、人物、顔、犬、家、山などオブジェクト毎に解析スレッドを割り当てるのです。そうして、一つの認識対象を平行してオブジェクトスレッド群に一気に認識していく。結果は弛緩法で纏めていって、最も確信度の高いオブジェクトを入力画像と判断する。  この技術では、少しずつ認識対象オブジェクトを増やしていけるようにするのです。認識対象オブジェクトを解析するCPUとデータを必要に応じて、画像認識システムに差し込めば画像認識システムはそのオブジェクトを認識できるようになる・・・というような技術を打ち立てればいいのではないか。将来は、CPUとメモリセットを多数プールしていて、学習によって認識オブジェクトデータを作っていけるようにする。それがパターン認識の完成形ではないかそう思うに至ったのです。


 画像認識の第一ステップは領域でその次に線分の認識が来るでしょう。線の間の関係属性として、次のものがあります。


 こうしたものは、線分群が構成するオブジェクトによって意味が決定されていくものでしょう。大局的な画像の認識と線分の属性という局所的な認識とが相互に調整しあうわけですから弛緩法を用いて解析していくことになります。

 弛緩法はオブジェクト認識とオブジェクト間関係としての認識の両方で行われます。


 このように弛緩法は線分を基盤に行われるものですから、2線分の関係と線分グループの属性との両方を管理していくことで実現出来ます。線分にl1,l2・・・と名前をつけて、テーブルで解析途中経過の情報を管理していくといいでしょう。2線分間の関係は2線分の名前を持って2次元マップシステムで管理できますし、線分グループは線分選択テーブルとそれに解析結果を設定できるマップシステムを用意すれば管理ができます。


 

おわり