考察:「若葉設計書」

by 小山明雄



 画像認識は人工知能の最も基本的な機能です。これまで、日本語認識と思考空間をコーディングしてきて、そのコーディングも完成をみていませんが、いよいよ本丸とも目する画像認識に攻撃の本体を集中して行けるまでになりました。人工知能の大局的見通しがついたから、古くからの人工知能の課題である画像認識に心置きなく集中して行けるというものです。


 画像認識の機構としては、並行処理管理と知識ベースという中核フレームワークのもとに、さまざまな解析ツールをライブラリとして配置してことで成っていくことでしょう。ライブラリとしては、次の機能を考えています。

(1) フォーカス管理

  ・フォーカス領域を大局解析の結果に則り、画像全体に渡って走査します。また、フォーカス領域を順次拡大し、解像度を変えていくことで、画像要素(フォーカスが当たっている画像領域)の解析結果を多重的に評価していく。これらの結果は大局マップシステムに保管して行きます。


(2) 画像の大局解析

  ・端点、交点、分岐点を得ていきます。これも画像要素の解像度によって解釈が異なってくるでしょう。その様子を大局マップシステムに保管して行きます。

  ・塊の検出をします。線分とか点列とかが密になっている画像要素を大局マップシステムに提示していきます。

  ・直線のゆがみの評価データを得ていきます。直線が歪んでいる画像では、曲率がかなり大きなところでないと特徴画像要素になりません。この、曲線の変化点として画像要素を捉えるための基礎データとして、直線のゆがみ評価をしていきます。

  ・変化点の検出を行います。帯の太ったところとか細くなっているところは、オブジェクトとして塊として認識されるのが普通だから、画像要素として変化点は重要なデータとなります。


(3) 画像オブジェクトの検出

  ・フォーカスの大きさで、オブジェクトを捉えます。基本的に、端点、交点、分岐点、変化点を中心に詳細に形状を確認していく作業です。オブジェクトをボックス内の線分列、点列の集まりとして評価します。ボックスの一つの辺でオブジェクトの一方の端を捉え、もう一方の端を対向線となる辺で捉えるようにフォーカスを設定します。ボックスは移動と拡大縮小と回転、縦横比の変化でオブジェクトマップシステムに配置して行きます。

  ・画像コアとして島、半島、帯、ふくらみ、へこみを検出していきます。

  ・画像チャンクとしてコアの属性を様々に解析してマップにオントロジー記号で保存して行きます。



(4) パターンマッチング

  ・知識ベースの形状データ・・・属性の塊の配置・・・の対応を取る作業がパターンマッチングです。この辺は前からいろいろ議論してきました。


(5)画像の重ね合わせ分析

  ・パターンマッチングが部分的にしかマッチングが取れないとき、図形の重ねあわせがあると判断します。そうして、その重ね合わせの輪郭を推定して行きます。









おわり