考察:「Neuronネットワーク2」

by 小山明雄



 思考、行動、学習システムを作ろうとしたとき、脳に学ぶことは多くあります。というか、段々だんだん、脳に近づいていくのを感じます。 行動の制御を投票法でスケジューリングするということで、Neuron/Synapse回路を模したオブジェクトを導入しました。基本的にセンサ値をアクチュエータ値に変換するテーブルと対象オントロジー(センサの種類とアクチュエータの種類)を選択するのに使います。

センサ:(inontology,invalue)

-->変換テーブル:(inontology,invalue)(outontology,outvalue)

-->アクチュエータ:(outontology,outvalue)


もちろん、この行動からさらに連想して別の無数の行動を選択していくのを想定しています。このところは、行動は大脳基底核のニューロンシステムで生成され、その中で使われるセンサ・アクチュエータ値変換テーブルは小脳に対応するでしょう(と、私は信じています)。大脳は、和葉や若葉で利用した知識要素(Nodeオブジェクト)のシステムになるように感じます。これらを総合して知識ベースになるのです。



思考や行動のトリガーは何でしょうか。反射系を考えると、センサの種類とセンサ値がトリガーになると基本的技術が見えてきます。その他に、知識処理(思考)の結果からの帰還回路によってトリガーもされるでしょう。このところを、もう少し展開して、人工知能の基盤技術としていきましょう。

センサーとアクチュエータに応じてプロセスを動かし、オントロジー記号とオントロジー値(センサ値)を生成します。そうして、知識ベースの対応するオントロジー記号オブジェクトを発火します。そうして、さらに上位のオントロジーオブジェクト(概念とかモデルとかと表現してます)を発火していきます。その中に、思考の要素となるモデルがあり、行動を制御するモデルがあるのです。朝の挨拶をするモデルとか、プログラムを作るといったモデルですね。それが発火すると「おはよう」と発音したくなるし、人工知能のプログラムをコーディングしていく行動が開始されます。もちろん、スケジューリングによって実際に開始されたり、抑圧されたりします。発火は重み付け投票であり、あるスレショールドが越えたものから、重要度と緊急度を評価して決定していくことになります。並行処理ができる作業は並行して作業していくでしょう。この辺のスケジューリングの手法も研究していく余地の大きい技術分野と思います。 ということで、発火しているモデルが何かということを管理しているオブジェクトが必要になります。ここでモデルの発火の共起関係も把握できますから、共起しているモデル群をまとめて一つのモデルを作る学習機構が働けます。単にまとめるというのでなくて、作りつけのモデルを雛型にして実際のモデルをつくっていくこともあるべきです。そういうことで、そんな雛型モデルをオントロジーとして持って、効率的なパターン発見とパターンの学習を実現していくのもよい技術です。


このように思考、行動、学習システムの基盤はオントロジーシステムということになります。オントロジーには包含関係という数学的な構造があることが分かります。人工知能では実際にこの包含関係のネットワーク(ツリー構造に似ている)を作って、オントロジーやモデル(概念)を管理していくことにして、下位の基本オントロジーがセンサーで発火して、それから上位のオントロジー、モデルを次々に発火していくという思考、行動の開始トリガーが実現できます。信濃プロジェクトでは、このネットワークをConnectionというオブジェクトで実現しています。



NeuronシステムもConnectionシステムも・・・また、センサからオントロジー記号を得ていくプロセス群も全てのエントリーをスキャンしながら処理を行っていきます。メモリになければRDBからロードします。次のNeuronの発火も、Connectionの発火も全件スキャンで行っていきます。この辺はパターンマッチングと同じです。人工知能は脳型の平行処理が必要なのです。このスキャンを野放図にやれないときにはフォーカス機構で、対象を絞り込んで行うようになるでしょう。



フォーカスは重要です。発火したオントロジーが全て共起の対象となるはずもありません。音楽に聞き入っているときは音にフォーカスされます。行動にフォーカスする時もあります。同じ視覚の中でも、自分に向かってくるものは最優先でフォーカスされます。次に、優先順位のあるのは自分から遠ざかっていくもので、その次が動くもの、その次が変化のないものです。全体をフォーカスにするときは、状況はなにかなと知識欲によって行なわれます。枠組の同定が認知の基盤です。枠組がフォーカスの基盤です。連続から停止へ、停止から連続へ・・・この辺が枠組みとして認識する手がかりです。そんなものが枠組みつくり行動のオントロジーなのでしょう。

意識下の思考、行動、学習はこのフォーカスによって制御していくことになるでしょう。



こうした思考、行動、学習システムの機構を明確にしておくことは、人工知能をロボットに埋め込む時に重要な前提となるでしょう。ロボットはどんどん進化していくでしょう。人工知能も進化するでしょう。とくに、知識ベースは重要な基幹製品になるでしょう。インテルインサイド戦略によるビジネス展開するとき、知識ベースは中核な製品です。他者にはまねできない大量なデータ・・・有用なデータが知識ベースで、これを対象ロボットが変わるときに、0から作り直しなぞできないでしょう。ロボットは作りなおし・・・一体一体が作りなおしのようなもの・・・・・・・。そこで、ロボットと人工知能のインターフェース(オントロジー)を明確にしていくことは喫急の課題なのです。



 そこで、意味理解のことについて考えてみます。

(例文1)映画館に行った。中ほどの席が取れた。しかし、その席の前に大きな帽子をかぶった人がいて、見ずらかった。

(問1)最前列のひとはスクリーンが良く見えましたか。

(問2)なぜ私はスクリーンが見えなかったのか。


この問題を解くには、映画館内の様子をイメージできなくてはなりません。文章で映画館を全て記述しつくすことは不可能だからです(フレーム問題)。スクリーンがあって、そこに向かって座席が何列も並んでいて、その中ほどに私が座ることをイメージする。そのあとに、大かいな帽子の人を配置する。私とスクリーンの間の視線を想定する。「見づらい」というのはスクリーンであり前の人ではないことを常識として推論する。


イメージはCGを利用して描画する必要はありません。枠組と、領域群と線群と点群によって表現すればいいのです。格(配置)と属性が重要になります。イメージが3次元マップのツリーにして管理します。マップは基本的の配置と大きさを管理し、オブジェクトを点で印とします。オブジェクトを更に詳細に記述するならば、オブジェクトを3次元マップに記述し、オブジェクトを点で記述しているマップにリンクします。

イメージは専用の解析ツール・・・視野の解析ツールを流用する・・・でオンデマンドで意味記号(オントロジー)を得ていきます。そうして、問に答えていくのです。




今まで記述してきたことを会話処理についてシミュレートしてみましょう。会話は問いかけに対する答えと命令に対する行動の発動からなります。自発的な発話も相手がどんな情報が必要かを推測し、それを問いかけとして想定して行動していくことです。

問いかけに対する行動制御を考えていきます。

(例文2)バスで東京に行きたい。どのバスに乗ると良いのか。そのバスはどこを通るのか。


この問いについて、question_sentenceというモデルを興します。このモデルに問いかけ文の意味解析結果を保存します。また、このモデルは目標設定Actionプロセスを起動する 能力を持っていて、行動プランニングプールに登録されます。それで、優先順位が高ければ、目標設定プロセスが起動します。目標設定プロセスではゴールの状態(東京行きのバス)と現在の状況(長野駅に居る)を割り出し、回答(どのバスに乗るか)までの行動パスを組み立てます。パスは、通常あらかじめ教示されていますが、欠落した工程があれば、そこは試行錯誤とか係員に聞くとか比喩による・・・(最も近しい知識モデルのスキーマを取ってくる)推論によって埋め尽くします。それには知識ベースをアクセスすることになりますが、例文2では「バス」「東京へ行く」、GPS情報とかバスの運行表などが連想でモデルとしてメインメモリにロードして推論していくことになります。

 それぞれのパスの要素を解くことにより、最終結果を得ます。それは又、モデルとして文章になっています。それを行動プランニングプールに登録します。




 このように、モデルという基本単位に知識や行動をまとめると思考とか行動、学習の実現が見通し良くなります。




おわり