考察:「ぽろぽろ思うこと」

by ご近所のきよきよ



 人工知能技術とは何か?基本的にどうゆうことを成す技術でしょうか?夏雲を見上げながら思い、郊外の畑道を歩いてきました。そのときに浮かんだのが次の図です。
 

 画像認識はイメージを中心としたパターン解析、パターンマッチング、連想、評価を行うシステムです。イメージをセンサーから得て、知識の中のイメージとマッチングして認識していくことになります。このマッチングですが、明らかにイメージのピクセル単位に行うわけではないことは分かるでしょう。基本的に解析があって、解析結果を知識表現(記号化表現)に落とし、その知識表現の一致度をもって認識結果と評価していくことになるでしょう。
 解析は目的があって初めて効率よく行えるものです。基本的な記号化であれば、汎用の特徴点抽出で実現できますが、物の形がなんであるかとか、表情はどうであるかなど、本当に必要な事項の情報を得るには、その目標をはっきり決めて、プロセスを選択して効率よく解析していかねば成りません。曖昧もあるでしょう。目標にどれだけそった情報かを評価しながら解析していくことになります。試行錯誤が必要になります。
 「食事を取る」イメージを入力したら、「食べる」という行為を連想し、そのモデルとなるイメージを取り出します。「食べる」には目的語となる「食べ物」がなくてはなりません。「おなかが空いて」いなくてはなりません。「テーブル」に座っているかとか、様々の情報と関連しているでしょう。それは連想です。その連想の内、どの情報を求めるべきか目標を与えられねばなりません。「何を食べる?」という問いに答えるのであれば、目的語となる物を検索することになります。センサーのイメージの中から「目標物」を検索することになります。それはテーブルの上にあるでしょう・・・などの情報を総動員して(連想による)、解析していくことになります。
 
 目標を与えられて、それに関連する解析をする。これはオンデマンド解析です。このオンデマンド解析をするというのは、並行処理を軽減するためのものです。パターンマッチングしたり、連想して得たデータで逐一解析していたのでは、フル命令CPUに代えて簡易命令CPUを使っていこうとする工夫を台無しにします。つまり、認識処理は大抵の場合、連想によりオントロジー意味記号を発火させることで完結し、必要に応じて解析処理を起動させることなのです。この辺の所は、知識処理、プランニング処理でしっかり設計していくべき所です。
 
 
 
 それと、身体性記憶です。考えたのは。身体性記憶とは、1つの大きなマップとプリミティブ記号セットがあって、その間の連想とからなったものではないでしょうか。マップが人間とか、言語とかのカテゴリーを記録するのです。マップの画素からプリミティブ記号セットを発火する連想を張る。この連想が記憶なわけです。人物のイメージをマップに記録すると、そのイメージを構成する各画素から人物プリミティブ記号にマップが貼られる。一つの画素は複数のオブジェクトのイメージの部分になるわけで、連想は複数記録されることになります。で、画素がどのプリミティブ記号に連想するかを、プリミティブ記号の番号に対応するビットで表現する。ビットの組み合わせで、画素がどのプリミティブ記号に連想しているかが分かる。通常であるとプリミティブ記号セットの数だけのビット長のレコードを連想のために用意しなくてはなりませんが、無駄が多いので、圧縮する。
 このアーキテクチャですと連想部分しかメモリ増加はいりません。メモリを決めても、それはシステムの外界認知の精度というレベルでの議論になり、簡単なものでも外界にてきようできます。そうして、マップ、意味記号セット、連想メモリ容量の規模によって、外界の認識の精度がスケーリングします。こんなのが身体性記憶機構なのでは無いでしょうか。

 

おわり