考察:「線の認識」

by ご近所のきよきよ


 
 前のコンテンツ「線の評価(曲率、特異点解析)」はまだまだ考えが足りないことが分かりました。強化学習の理論を用いて直線を認識するという着想は良いかも知れませんが、どうも着地に失敗しているような気がします。どうも考えが足りない。そこで、もう一度考え直して見ましょう。
 曖昧性を持った図形の輪郭線を解析するのでした。図形としては、次のものが考えられます。
(1)塗りつぶし領域
(2)テクスチャの境界(ドットパターンなどの境界)
(2)のテクスチャの境界は各点の近傍で作る三角形作図、塗りつぶしによって(1)の塗りつぶし領域の輪郭線を求める問題に帰着できます。
 
 輪郭線の形状には次のものがあります。
(1)髭の生えた輪郭
(2)ギザギザととがった形状を持つ輪郭
(3)ぼけとかドットパターンが付着した輪郭
(4)2重、3重・・・線となっている輪郭
(5)曲率を持った形状のなす輪郭
など。
 これらの曖昧性を越えて、基本となる線パターンを抽出するのは、ビームトラッキングという手法でしょう。ある大きさのスポットを線にあわせてスキャンして、もっともなめらかな曲線を求めていくことになります。
 でありますが、その前段の処理として、トラッキングする曲線パターンを抽出する作業をしていかねば成りません。輪郭線は基本的にでこぼこの曲線です。また輪郭線を越えて、図形の傾向として骨となる曲線を見いだすこともあります。次のような図です。

 
 この抽出曲線を求めるのは、線全体の大きさから適当な画素数を設定して、その画素数で各点にベクトルを作り、そのベクトルの中点を結べばよいのです。簡単な傾向分析ですね。分断点も近似パラメータとしての画素数の大きさをもって、その範囲の点は結ばれていると判断して解析していくことで得られます。
 特異点もこの解析に用いるベクトルのなす角度の変化率の大きなところとして同定していくことになります。
 
 こんどこそ、線認識のアルゴリズムは完璧になったでしょうか。大体において、曖昧性のある処理は単独機能、単独アルゴリズムでは解析は満足にできないのです。それぞれの手法はある視点からは最適ですが、視点を変えれば役に立たなくなります。いろいろなアルゴリズムを装備したプロセスが群れを成して画像を認識していく・・・そんなスキーマになります。
 解像度を上げたり、下げたりして、全体の傾向を発見したり、強化学習手法で線の傾向の強さを計ったり、この小論のアルゴリズムで線の傾向を把握したりと、目的に応じてプロセスを選択して解析を進めることになります。
 
 要は、様々なプリミティブプロセスを用意しておくこと。その組み合わせとかは学習によって習得していくこと。そんな技術が待たれるということです。
 
 

おわり