考察:「形状分析の一手法」

by ご近所のきよきよ


 
 文章認識で「発火」機構のアルゴリズムを考えていましたら、ふとパターン認識の準備(形状分析)の方法を思いつきました。これも超並列処理になりますが。
 
【パターン認識技術のありかた】
(1)精密に一致しなくてはならない場合にはイメージでのテンプレートマッチングを行う。
(2)相対配置、相対占拠率が重要な場合(顔認識など)は、概略形を得て、パラメータとしてパターン特長を得ていく。
(3)記号的特長の場合は記号を特長づけるパターンを解析していくのみである。汽車だと、ボイラーがあって、石炭庫があって、車輪があることが記号的特長である。
 
 
【形状特長の獲得】
 パターンの評価は視点として、物が円のゆがんだものとみるか、多角形のゆがんだものとみるか、帯のゆがんだものと見るかです。その視点でパターン認識をしていくことになります。そのゆがみがどの程度の物かを評価して数値化したものがパターン認識で使うパターン定義データなわけです。
 
 形状パターンとは、次の五個の図形要素からなると思われます。
(1)基点
 イメージの各黒点です。
(2)円
 曲率を表します。円全体もですが、その断片も図形要素とします。
(3)線分
 直線です。
(4)角
 (3)で得た2線分の交差角度と大きさです。
(5)傾き
 基点一のおける円、線分、角の傾きです。
 
 これらの要素をフォーカスの視野の大きさでマッチングしていくのです。フォーカスの中心が基点にあります。そうして、視野を段々に大きくして、無数の半径の円、無数の角度と長さの線分、無数の角度の角とマッチングしていくのです。評価数値は一致の向き、一致度、一致の散布度です。
 そこで、パターンを表現するデータは点が(円:大きさ,半径,向き)(線分:大きさ,向き)(角:大きさ、角度、向き)の8自由度で、その上のメトリックが(一致度、散布度)の二次元となります。
 
 この解析で、評価データの分布が把握できるから、必要な情報をここから汲んでいけます。記号化にも持って行けます。
 
 ちょっと大変な計算になるシステムですが、粗い図形を持ってすれば、計算量は少なくなるでしょう。この方法のメリットは次の通りです。
(1)断線とか重線とかの雑音に強い。
(2)多値画像を二値画像に落とす処理が不要。
 
 

おわり