考察:「画像認識における知識」

by ご近所のきよきよ


 

 画像認識は人物などの全画像が提示されるとは限らない。顔の一部などの部分画像からパターン認識して、全体の人物を推測してかねばならないことが普通です。重なりの解析とかも生きていく上に大切な能力です。そんな技術を可能にする知識ベースとはどんなものでしょうか。


 人物ならば、「人物」というモデルに画像特徴を文字列や数値列で持つことになります。沢山の画像特徴が構造を持って記述されているでしょう。パターンマッチングで入力となる画像の特徴と特徴の分布関係からこのモデルの特徴記述をマッチングすることになります。これは、入力の持っている雑音の程度によって、色々あるでしょう。だから、パターンマッチングはモデルの全知識とマッチングしていくことになりますが、さらに部分的なマッチングになります。部分的なマッチングから全体を連想するのはモデルの入れ子構造から解決できます。更に他のモデルとの競合解決があります。一致度がどちらのモデルが大きいかというようなことです。


 また、画像が重なったり、雑音の乗ったものに対応していくには、パターンマッチングにおいて、全体の大体のマッチングと特にこの部分がマッチ度が大きいというそんなマッチ度の分布を見ていけるようにしておかねばなりません。



 ここに述べた技術は、ASAMをもってすれば実現できます。パターンマッチングは正規表現で行えば良いのです。部分マッチングも正規表現はありえます。ただ、数値の一致度の評価には正規表現は文字列マッチングですから、拡張が必要です。ですが、正規表現のマッチングをASAMで行うという技術が必須なことは考えを深めていくと分かると思います。


 画像認識は画像の学習時に、特徴と特徴の配置として知識を構築してモデルとして保存し、パターン認識時にこのモデルの部分マッチングを評価していくという機序で実現できることが言えました。

 
 
 

おわり